两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于對應的深層信念網(wǎng)絡的跨模態(tài)檢索方法

文檔序號:6639480閱讀:335來源:國知局
一種基于對應的深層信念網(wǎng)絡的跨模態(tài)檢索方法
【專利摘要】本發(fā)明提出了一種基于對應的深層信念網(wǎng)絡的跨模態(tài)檢索方法,該方法包括:利用特征提取方法分別獲得檢索目標與檢索庫中每一個檢索成員的初級向量;檢索目標的初級向量分別與檢索庫中每一個檢索成員的初級向量,通過對應的深層信念網(wǎng)絡獲得檢索目標的高級向量和檢索庫中每一個檢索成員的高級向量;利用檢索目標的高級向量和檢索庫中每一個檢索成員的高級向量計算檢索目標與檢索庫中每一個檢索成員的距離;將檢索庫中與檢索目標距離最近的至少一個檢索成員確定為與檢索目標匹配的對象。
【專利說明】一種基于對應的深層信念網(wǎng)絡的跨模態(tài)檢索方法

【技術(shù)領域】
[0001] 本發(fā)明涉及多媒體檢索技術(shù),特別是一種基于對應的深層信念網(wǎng)絡的跨模態(tài)檢 索方法。

【背景技術(shù)】
[0002] 近些年互聯(lián)網(wǎng)的發(fā)展使得多模態(tài)的數(shù)據(jù)呈現(xiàn)爆炸式增長。例如,電子商務網(wǎng)站上 的產(chǎn)品通常包含主干文字、簡短的文本描述、以及相關的圖片;社交網(wǎng)站上分享的圖片通常 伴有標記的描述詞;一些在線新聞上包含的圖片和視頻信息比單純的文字報道更具有吸引 力,多模態(tài)數(shù)據(jù)的快速增長帶來了巨大的跨模態(tài)檢索需求。
[0003] 與傳統(tǒng)的單模態(tài)檢索不同,跨模態(tài)檢索更多關注不同模態(tài)間的關系。因此,跨模態(tài) 檢索問題包含兩個挑戰(zhàn)問題:一是來自不同模態(tài)的數(shù)據(jù)具有完全不同的統(tǒng)計特性,這使得 很難直接獲得不同模態(tài)數(shù)據(jù)的關聯(lián)關系;二是從不同模態(tài)數(shù)據(jù)中抽取的特征通常具有高維 的特性并且數(shù)據(jù)集的規(guī)模非常大,這使得高效的檢索不容易實現(xiàn)。


【發(fā)明內(nèi)容】

[0004] 有鑒于此,本發(fā)明提供了一種基于對應的深層信念網(wǎng)絡(Correspondence Deep Belief Network, Corr-DBN)的跨模態(tài)檢索方法,應用Corr-DBN解決跨模態(tài)數(shù)據(jù)的處理問 題,使得經(jīng)Corr-DBN處理后的跨模態(tài)數(shù)據(jù)能夠高效的進行距離計算,從而得到較優(yōu)的檢索 結(jié)果。本發(fā)明提出的技術(shù)方案是:
[0005] -種基于Corr-DBN的跨模態(tài)檢索方法,該方法包括:
[0006] 利用特征提取方法分別獲得檢索目標與檢索庫中每一個檢索成員的初級向量;
[0007] 所述檢索目標的初級向量分別與所述檢索庫中每一個檢索成員的初級向量,通過 對應的深層信念網(wǎng)絡Corr-DBN獲得所述檢索目標的高級表達向量和所述檢索庫中每一個 檢索成員的高級表達向量;
[0008] 利用所述檢索目標的1?級表達向量和所述檢索庫中每一個檢索成員的1?級表達 向量計算所述檢索目標與所述檢索庫中每一個檢索成員的距離;
[0009] 將所述檢索庫中與所述檢索目標距離最近的至少一個檢索成員確定為與所述檢 索目標匹配的對象。
[0010] 綜上所述,本發(fā)明技術(shù)方案提出了一種基于對應的深層信念網(wǎng)絡的跨模態(tài)檢 索方法,對于跨模態(tài)原始數(shù)據(jù)進行特征提取獲得的初級向量,通過對應的深層信念網(wǎng)絡 Corr-DBN的處理,得到跨模態(tài)數(shù)據(jù)在相同表示空間中的低維高級表達,進而對跨模態(tài)數(shù)據(jù) 的低維高級表達進行距離計算,根據(jù)距離確定檢索結(jié)果。

【專利附圖】

【附圖說明】
[0011] 圖1為本發(fā)明技術(shù)方案的流程圖;
[0012] 圖2為本發(fā)明Corr-DBN神經(jīng)網(wǎng)絡結(jié)構(gòu)圖;
[0013] 圖3為本發(fā)明雙受限波爾茲曼機的神經(jīng)網(wǎng)絡結(jié)構(gòu)圖;
[0014] 圖4為受限波爾茲曼機模型的結(jié)構(gòu)圖;
[0015] 圖5為對應的受限波爾茲曼機模型的結(jié)構(gòu)圖;
[0016] 圖6為根據(jù)目標函數(shù)Q確定O的方法流程圖;
[0017] 圖7為本發(fā)明實施例的流程圖。

【具體實施方式】
[0018] 為解決跨模態(tài)間的檢索問題,本發(fā)明提出一種基于對應的深層信念網(wǎng)絡Corr-DBN 的跨模態(tài)檢索方法,本發(fā)明技術(shù)方案的流程圖如圖1所示,包括以下步驟:
[0019] 步驟101 :利用特征提取方法分別獲得檢索目標與檢索庫中每一個檢索成員的初 級向量。
[0020] 本步驟中,為在檢索庫中檢索與檢索目標匹配的對象,首先需要對檢索目標和檢 索庫中每一檢索成員進行初級向量的獲取,而特征提取方法獲得的初級向量一般維數(shù)較 高,且不同模態(tài)的初級向量元素各異,一般不能直接用于檢索運算。
[0021] 步驟102 :檢索目標的初級向量分別與檢索庫中每一個檢索成員的初級向量,通 過對應的深層信念網(wǎng)絡Corr-DBN獲得檢索目標的高級向量和檢索庫中每一個檢索成員的 高級向量。
[0022] 本步驟中,將檢索目標的初級向量分別與檢索庫中每一個檢索成員的初級向量作 為一個組合,通過對應的深層信念網(wǎng)絡Corr-DBN獲得檢索目標的高級向量和檢索庫中每 一個檢索成員的高級向量。通過對應的深層信念網(wǎng)絡Corr-DBN得到的檢索目標的高級向 量和檢索庫中每一個檢索成員的1?級向量具有低維、空間兀素一致等特點,能夠1?效的直 接進行檢索運算。
[0023] 具體地,可以將檢索目標作為第一模態(tài),將任一個檢索成員作為第二模態(tài), Corr-DBN通過處理第一模態(tài)與第二模態(tài)的初級表達,最終輸出第一模態(tài)與第二模態(tài)的高級 表達。
[0024] 步驟103 :利用檢索目標的1?級表達和檢索庫中每一個檢索成員的1?級表達計算 檢索目標與檢索庫中任一檢索成員的距離。
[0025] 具體地,可以用歐氏距離表示檢索目標與檢索庫中每一個檢索成員的距離。
[0026] 步驟104 :將檢索庫中與檢索目標距離最近的至少一個檢索成員確定為與檢索目 標匹配的對象。
[0027] 本步驟中,將檢索庫中每個檢索成員與檢索目標的距離進行排序,選擇距離檢索 目標最近的至少一個檢索成員確定為與檢索目標匹配的對象。
[0028] 本發(fā)明提出了一種使用對應的深層信念網(wǎng)絡Corr-DBN進行跨模態(tài)檢索的方法, 圖2為本發(fā)明對應的深層信念網(wǎng)絡Corr-DBN神經(jīng)網(wǎng)絡結(jié)構(gòu)圖,如圖2所示,Corr-DBN 首先對兩種模態(tài)的初級向量使用至少一層雙受限波爾茲曼機(Restricted Boltzmann Machine,RBM)模型獲得該兩種模態(tài)的中級向量,在Corr-DBN模型的頂層通過Corr-RBM模 型對兩種模態(tài)的中級向量進行進一步處理,最終獲得兩種模態(tài)的高級表達。下面分別對雙 RBM模型、Corr-RBM模型以及Corr-DBN模型進行詳細介紹。
[0029] (一)雙 RBM 模型:
[0030] 圖3為雙RBM的神經(jīng)網(wǎng)絡結(jié)構(gòu)圖,如圖3所示,雙RBM模型包括第一模態(tài)RBM模型 和第二模態(tài)RBM模型,第一模態(tài)RBM模型和第二模態(tài)RBM模型為相互獨立的兩個單RBM模 型,第一模態(tài)RBM模型對第一模態(tài)向量進行處理,第二模態(tài)RBM模型對第二模態(tài)向量進行處 理,且第一模態(tài)RBM模型和第二模態(tài)RBM模型之間無連接。下面僅對第一模態(tài)RBM模型進 行介紹,第二模態(tài)RBM模型的結(jié)構(gòu)及參數(shù)設計與第一模態(tài)RBM結(jié)構(gòu)相同。
[0031] 圖4為第一模態(tài)RBM模型的神經(jīng)網(wǎng)絡結(jié)構(gòu)圖,如圖4所示,第一模態(tài)RBM模型的可 見層V包含m個神經(jīng)單元V 1?Vm,每個神經(jīng)單元Vi的偏置為h,可見層神經(jīng)單元之間沒有 連接;隱藏層H包含s個神經(jīng)單元I ll?hs,每個神經(jīng)單元Ilj的偏置為Cj,可見層神經(jīng)單元 之間沒有連接;可見層神經(jīng)單元V i與隱藏層神經(jīng)單元hj的連接權(quán)值為Wij。為了便于理解, 圖4中僅畫出了部分可見層神經(jīng)單元與隱藏層神經(jīng)單元的連接權(quán)值。
[0032] 單RBM具有無向圖的結(jié)構(gòu),具有Logistic激活函數(shù)δ (X) = l/(l+exp(-x)),則可 見層V和隱藏層H神經(jīng)單元的聯(lián)合概率分布為:
[0033] = -^cxp(-E(v,h))
[0034] 其中,Z為歸一化常數(shù),E(v,h)是由RBM的可見層神經(jīng)單元、隱藏層神經(jīng)單元的不 同配置定義的能量函數(shù),根據(jù)可見層神經(jīng)單元、隱藏層神經(jīng)單元的不同配置,E (v,h)有不同 的表示,即只要RBM的可見層神經(jīng)單元配置與隱藏層神經(jīng)單元配置確定,就有相應的能量 函數(shù),在此不作詳細介紹。
[0035] 雙RBM模型的參數(shù)包括:第一模態(tài)RBM的可見層神經(jīng)單元與隱藏層神經(jīng)單元之間 的連接權(quán)值參數(shù)集合、可見層神經(jīng)單元的偏置集合和隱藏層神經(jīng)單元的偏置集合,第二模 態(tài)RBM的可見層神經(jīng)單元與隱藏層神經(jīng)單元之間的連接權(quán)值參數(shù)集合、可見層神經(jīng)單元的 偏置集合和隱藏層神經(jīng)單元的偏置集合,上述參數(shù)可通過比照散度估計算法進行確定,t匕 照散度估記算法為現(xiàn)有技術(shù),在此不再詳細介紹。
[0036] (二)對應的受限波爾茲曼機Corr-RBM模型:
[0037] 圖5為本發(fā)明Corr-RBM模型的結(jié)構(gòu)圖,如圖5所示,Corr-RBM模型包含第一模態(tài) Corr-RBM和第二模態(tài)Corr-RBM,第一模態(tài)Corr-RBM與第二模態(tài)Corr-RBM包含有相同的可 見層神經(jīng)單元數(shù)目,第一模態(tài)Corr-RBM與第二模態(tài)Corr-RBM包含有相同的隱藏層神經(jīng)單 元數(shù)目,并且第一模態(tài)Corr-RBM與所述第二模態(tài)Corr-RBM的隱藏層之間具有相關性約束。
[0038] 假定Θ表示Corr-RBM模型的參數(shù)集合,即Θ = {W1,C1,B1,WT,CT,Β τ},其中,上標 I表示第一模態(tài),上標T表示第二模態(tài),具體地,W1為第一模態(tài)Corr-RBM的各可見層神經(jīng)單 元與隱藏層神經(jīng)單元之間的連接權(quán)值參數(shù)集合,C 1為第一模態(tài)Corr-RBM的可見層神經(jīng)單 元偏置參數(shù)集合,B1為第一模態(tài)Corr-RBM的隱藏層神經(jīng)單元偏置參數(shù)集合,W t為第二模態(tài) Corr-RBM的各可見層神經(jīng)單元與隱藏層神經(jīng)單元之間的連接權(quán)值參數(shù)集合,Ct為第二模態(tài) Corr-RBM的可見層神經(jīng)單元偏置參數(shù)集合,Bt為第二模態(tài)Corr-RBM的隱藏層神經(jīng)單元偏 置參數(shù)集合。
[0039] Corr-RBM模型的參數(shù)集合Θ通過下面的參數(shù)學習算法進行確定:
[0040] 根據(jù)下述原則定義目標函數(shù)T :C〇rr-RBM模型的參數(shù)集合Θ能夠最小化第一模 態(tài)與第二模態(tài)在共享表示空間上的距離,以及最小化第一模態(tài)和第二模態(tài)的負對數(shù)似然函 數(shù)。目標函數(shù)Q為Q = 1D+ct I1+β It,即Θ為令Q最小的參數(shù)集合。
[0041]其中,

【權(quán)利要求】
1. 一種基于對應的深層信念網(wǎng)絡的跨模態(tài)檢索方法,其特征在于,該方法包括: 利用特征提取方法分別獲得檢索目標與檢索庫中每一個檢索成員的初級向量; 所述檢索目標的初級向量分別與所述檢索庫中每一個檢索成員的初級向量,通過對應 的深層信念網(wǎng)絡獲得所述檢索目標的高級向量和所述檢索庫中每一個檢索成員的高級向 量; 利用所述檢索目標的高級向量和所述檢索庫中每一個檢索成員的高級向量計算所述 檢索目標與所述檢索庫中每一個檢索成員的距離; 將所述檢索庫中與所述檢索目標距離最近的至少一個檢索成員確定為與所述檢索目 標匹配的對象。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對應的深層信念網(wǎng)絡Corr-DBN的非 頂層為至少一層雙受限波爾茲曼機RBM結(jié)構(gòu),頂層為對應的受限波爾茲曼機Corr-RBM結(jié) 構(gòu),所述雙RBM包括相互獨立的第一模態(tài)RBM和第二模態(tài)RBM,所述Corr-RBM包括具有相關 性約束的第一模態(tài)Corr-RBM和第二模態(tài)Corr-RBM。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述第一模態(tài)Corr-RBM與所述第二模 態(tài)Corr-RBM包含有相同的可見層神經(jīng)單元數(shù)目,所述第一模態(tài)Corr-RBM與所述第二模 態(tài)Corr-RBM包含有相同的隱藏層神經(jīng)單元數(shù)目,所述第一模態(tài)Corr-RBM與所述第二模態(tài) Corr-RBM的隱藏層之間具有相關性約束。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法進一步包括: 所述Corr-RBM的配置參數(shù)0 = {W1,C1,B1,WT,CT,Βτ},其中,上標I表示第一模態(tài),上標T表示第二模態(tài),具體地,W1為第一模態(tài)Corr-RBM的各可見層神經(jīng)單元與隱藏層神經(jīng)單元 之間的連接權(quán)值參數(shù)集合,C1為第一模態(tài)Corr-RBM的可見層神經(jīng)單元偏置參數(shù)集合,B1為 第一模態(tài)Corr-RBM的隱藏層神經(jīng)單元偏置參數(shù)集合,Wt為第二模態(tài)Corr-RBM的各可見層 神經(jīng)單元與隱藏層神經(jīng)單元之間的連接權(quán)值參數(shù)集合,Ct為第二模態(tài)Corr-RBM的可見層神 經(jīng)單元偏置參數(shù)集合,Bt為第二模態(tài)Corr-RBM的隱藏層神經(jīng)單元偏置參數(shù)集合; 所述Corr-RBM的配置參數(shù)Θ為令目標函數(shù)Q=lD+ah+βIt最小的配置參數(shù),且
其中,a和β是常數(shù),且ae(〇, 1),βe(〇, 1) ;&( ·)是第一模態(tài)Corr-RBM可見 層到隱藏層的映射函數(shù),fT( ·)和第二模態(tài)Corr-RBM可見層到隱藏層的映射函數(shù);Pl( ·)為 第一模態(tài)Corr-RBM可見層和隱藏層神經(jīng)單元的聯(lián)合概率分布,ρτ(·)為第二模態(tài)Corr-RBM 可見層和隱藏層神經(jīng)單元的聯(lián)合概率分布;M·II為二范數(shù)映射。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)目標函數(shù)Q確定0的算法為: A、第一模態(tài)Corr-RBM的可見層神經(jīng)單元與隱藏層神經(jīng)單元之間的連接權(quán)值參數(shù)集 合 <、可見層神經(jīng)單元v/的偏置和隱藏層神經(jīng)單元的偏置c;用Θ1統(tǒng)一表示,根 據(jù)公式y(tǒng)+r.a.A#進行更新,其中τ為學習速率,且τe(〇,1);ae(〇,1); Δ# = ,Δ6/,Acj},并且,
其中,〈· >data為經(jīng)驗分布下的數(shù)學期望,〈· >Π(Λ1為模型分布下的數(shù)學期望; Β、第二模態(tài)Corr-RBM的可見層神經(jīng)單元與隱藏層神經(jīng)單元之間的連接權(quán)值參數(shù)集合 <、可見層神經(jīng)單元vf的偏置和隱藏層神經(jīng)單元f的偏置 < 用θτ統(tǒng)一表示,根據(jù)公式θτ -θτ+τ ·β·ΛΘ7進行更新,其中,βe(〇, 1) ;Δ6?Γ ={Δ4,ΔΖ^,Δ?^},并且,
C、枏據(jù)以下公式俥用梯度下降的方法審新L:
其中,δ'(·)=δ(·)(1-δ(·)),且δ(·)為Logistic激活函數(shù)δ(X) = 1/ (l+exp(-x)); 重復步驟A?C,直至該算法收斂。
【文檔編號】G06F17/30GK104462485SQ201410797791
【公開日】2015年3月25日 申請日期:2014年12月18日 優(yōu)先權(quán)日:2014年12月18日
【發(fā)明者】李睿凡, 蘆效峰, 魯鵬, 馮方向, 李蕾, 劉詠彬, 王小捷 申請人:北京郵電大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
满洲里市| 普兰店市| 曲水县| 罗甸县| 吉隆县| 台南县| 稷山县| 射阳县| 三门峡市| 衡水市| 公主岭市| 宣城市| 万山特区| 凤城市| 杭锦后旗| 抚顺县| 林芝县| 图木舒克市| 长沙县| 盘山县| 朝阳县| 九龙县| 平凉市| 和顺县| 迁安市| 维西| 湖州市| 梧州市| 昂仁县| 呼图壁县| 古蔺县| 兖州市| 黄陵县| 金华市| 磴口县| 岳阳市| 合阳县| 甘泉县| 武安市| 玉林市| 吉木乃县|