两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

相似圖片檢索方法及裝置與流程

文檔序號:11216451閱讀:371來源:國知局
相似圖片檢索方法及裝置與流程

本公開涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種相似圖片檢索方法及裝置。



背景技術(shù):

隨著通信技術(shù)的發(fā)展,手機的使用越來越廣泛,用戶可以使用手機撥打語音電話,通過手機安裝的即時通信軟件發(fā)送文字或圖片,還可以使用手機上網(wǎng)瀏覽圖片并進行保存。為了節(jié)約存儲空間,手機在存儲圖片時,通常會對當前待存儲圖片與手機圖片庫中包括的已存儲的圖片的相似度檢測,并提示用戶刪除相似度較高的圖片。



技術(shù)實現(xiàn)要素:

為克服相關(guān)技術(shù)中存在的問題,本公開實施例提供一種相似圖片檢索方法及裝置。所述技術(shù)方案如下:

根據(jù)本公開實施例的第一方面,提供一種相似圖片檢索方法,包括:

獲取目標圖片的多個顯著性區(qū)域;

提取所述多個顯著性區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)cnn特征;

根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量;

根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片。

本公開的實施例提供的技術(shù)方案可以包括以下有益效果:通過提取目標圖片的多個顯著性區(qū)域的cnn特征,并根據(jù)該多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量,減小了獲取目標圖片的特征向量的計算量,同時降低了同一物體在不同圖片中的位置變化對相似圖像識別的影響,提高了相似度檢測的精確度。

在一個實施例中,所述根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量包括:

通過局部特征聚合描述符vlad對每個所述顯著性區(qū)域的cnn特征進行編碼,獲取所述目標圖片的特征向量。

本公開的實施例提供的技術(shù)方案可以包括以下有益效果:通過vlad對多個顯著性區(qū)域的cnn特征進行編碼,獲取目標圖片的特征向量,提高了獲取目標圖片的特征向量的效率和精確度。

在一個實施例中,所述根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片包括:

獲取所述候選圖片組包括的多個候選圖片中每個候選圖片的特征向量;

獲取所述目標圖片的特征向量與每個候選圖片的特征向量的余弦距離;

獲取與所述目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與所述目標圖片匹配的相似圖片。

本公開的實施例提供的技術(shù)方案可以包括以下有益效果:通過目標圖片的特征向量與每個候選圖片的特征向量的余弦距離,獲取與目標圖片匹配的所述相似圖片,提高了不同圖片相似度檢測的精確度。

在一個實施例中,所述方法還包括:

獲取目標圖片的哈希值;

根據(jù)所述目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

本公開的實施例提供的技術(shù)方案可以包括以下有益效果:通過目標圖片的哈希值可以迅速從圖片庫包括的多個待檢圖片中獲取可能與目標圖片相似度高的多個待檢圖片座位多個候選圖片,減小了獲取目標圖片的相似圖片的計算量,進而提高了圖片相似度檢測的效率。

在一個實施例中,所述根據(jù)所述目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組包括:

獲取所述圖片庫包括的多個待檢圖片中每個待檢圖片的哈希值;

根據(jù)所述每個待檢圖片的哈希值,建立隨機森林;

根據(jù)所述目標圖片的哈希值和所述隨機森林,從所述圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

本公開的實施例提供的技術(shù)方案可以包括以下有益效果:通過圖片庫包括的多個待檢圖片的哈希值組成的隨機森林,從多個待檢圖片中獲取多個候選圖片,提高了獲取候選圖片的效率和精確度,進而提高了圖片相似度檢測的效率和精確度。

根據(jù)本公開實施例的第二方面,提供一種相似圖片檢索裝置,包括:

第一獲取模塊,用于獲取目標圖片的多個顯著性區(qū)域;

提取模塊,用于提取所述多個顯著性區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)cnn特征;

第二獲取模塊,用于根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量;

第三獲取模塊,用于根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片。

在一個實施例中,所述第二獲取模塊包括:

第一獲取子模塊,用于通過局部特征聚合描述符vlad對每個所述顯著性區(qū)域的cnn特征進行編碼,獲取所述目標圖片的特征向量。

在一個實施例中,所述第三獲取模塊包括:

第二獲取子模塊,用于獲取所述候選圖片組包括的多個候選圖片中每個候選圖片的特征向量;

第三獲取子模塊,用于獲取所述目標圖片的特征向量與每個候選圖片的特征向量的余弦距離;

第四獲取子模塊,用于獲取與所述目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與所述目標圖片匹配的相似圖片。

在一個實施例中,所述裝置還包括:

第四獲取模塊,用于獲取目標圖片的哈希值;

組成模塊,用于根據(jù)所述目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

在一個實施例中,所述組成模塊包括:

第五獲取子模塊,用于獲取所述圖片庫包括的多個待檢圖片中每個待檢圖片的哈希值;

建立子模塊,用于根據(jù)所述每個待檢圖片的哈希值,建立隨機森林;

組成子模塊,用于根據(jù)所述目標圖片的哈希值和所述隨機森林,從所述圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

根據(jù)本公開實施例的第三方面,提供一種相似圖片檢索裝置,包括:

處理器;

用于存儲處理器可執(zhí)行指令的存儲器;

其中,所述處理器被配置為:

獲取目標圖片的多個顯著性區(qū)域;

提取所述多個顯著性區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)cnn特征;

根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量;

根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片。

根據(jù)本公開實施例的第四方面,提供一種計算機可讀存儲介質(zhì),其上存儲有計算機指令,該指令被處理器執(zhí)行時實現(xiàn)第一方面任一實施例所述方法的步驟。

應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。

附圖說明

此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。

圖1a是根據(jù)一示例性實施例示出的相似圖片檢索方法的流程圖。

圖1b是根據(jù)一示例性實施例示出的相似圖片檢索方法的流程圖。

圖1c是根據(jù)一示例性實施例示出的相似圖片檢索方法的流程圖。

圖1d是根據(jù)一示例性實施例示出的相似圖片檢索方法的流程圖。

圖2是根據(jù)一示例性實施例示出的相似圖片檢索方法的流程圖。

圖3是根據(jù)一示例性實施例示出的相似圖片檢索方法的流程圖。

圖4a是根據(jù)一示例性實施例示出的相似圖片檢索裝置的結(jié)構(gòu)示意圖。

圖4b是根據(jù)一示例性實施例示出的相似圖片檢索裝置的結(jié)構(gòu)示意圖。

圖4c是根據(jù)一示例性實施例示出的相似圖片檢索裝置的結(jié)構(gòu)示意圖。

圖4d是根據(jù)一示例性實施例示出的相似圖片檢索裝置的結(jié)構(gòu)示意圖。

圖4e是根據(jù)一示例性實施例示出的相似圖片檢索裝置的結(jié)構(gòu)示意圖。

圖5是根據(jù)一示例性實施例示出的相似圖片檢索裝置的結(jié)構(gòu)框圖。

具體實施方式

這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。

本公開實施例提供的技術(shù)方案涉及終端或者服務器,所述終端可以為手機,平板電腦,個人電腦以及其他能夠存儲圖片的設(shè)備;所述服務器可以為云服務器,本公開實施例對此不做限定。相關(guān)技術(shù)中,終端或服務器在檢測目標圖片的相似圖片時,需要將目標圖片和圖片庫中的每張圖片包括的全部信息進行比對,因此圖片相似度檢測的計算量較大,效率較低,用戶體驗不佳。本公開的實施例提供的技術(shù)方案中,通過提取目標圖片的多個顯著性區(qū)域的cnn(convolutionalneuralnetwork,卷積神經(jīng)網(wǎng)絡(luò))特征,并根據(jù)該多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量,減小了獲取目標圖片的特征向量的計算量,同時降低了同一物體在不同圖片中的位置變化對相似圖像識別的影響,提高了相似度檢測的精確度。

圖1a是根據(jù)一示例性實施例示出的一種相似圖片檢索方法的流程圖,該方法用于終端或服務器。如圖1a所示,該相似圖片檢索方法包括以下步驟101至104:

在步驟101中,獲取目標圖片的多個顯著性區(qū)域。

示例的,本公開實施例以該相似圖片檢索方法應用于終端為例進行說明,在終端需要檢索目標圖片的相似圖片時,可以首先對目標圖片進行顯著性檢測,獲取目標圖片的多個顯著性區(qū)域,通常該目標圖片可以存在幾百個顯著性區(qū)域。具體的,終端可以采用selectivesearch(選擇性搜索)或者rpn(regionproposalnetwork,區(qū)域建議網(wǎng)絡(luò))對目標圖片進行顯著性檢測。

在步驟102中,提取多個顯著性區(qū)域的cnn特征。

初始化時,終端可以搭建cnn網(wǎng)絡(luò),并向該cnn網(wǎng)絡(luò)輸入多個特征已知的圖片,然后不斷調(diào)整該cnn網(wǎng)絡(luò)的各項參數(shù),使得通過該cnn網(wǎng)絡(luò)提取到的圖片的特征與該圖片的已知特征之間的差異小于預設(shè)標準。當通過該cnn網(wǎng)絡(luò)提取到的圖片的特征與圖片的已知特征之間的差異小于預設(shè)標準時,終端即可利用該cnn網(wǎng)絡(luò)提取目標圖片的多個顯著性區(qū)域中每個顯著性區(qū)域的特征。具體的,可以將每個顯著性區(qū)域作為一個單獨的圖片輸入該cnn網(wǎng)絡(luò),該cnn網(wǎng)絡(luò)輸出的即為顯著性區(qū)域的cnn特征。

在步驟103中,根據(jù)多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量。

示例的,終端可以通過vlad(vectoroflocallyaggregateddescriptors,局部特征聚合描述符)對每個顯著性區(qū)域的cnn特征進行編碼,獲取目標圖片的特征向量。通過vlad對多個顯著性區(qū)域的cnn特征進行特征編碼,獲取目標圖片的特征向量,提高了獲取目標圖片的特征向量的效率和精確度。

在步驟104中,根據(jù)目標圖片的特征向量,從目標圖片的候選圖片組包括的多個候選圖片中獲取與目標圖片匹配的相似圖片。

示例的,終端可以獲取本地保存的多張圖片作為候選圖片組成該目標圖片的候選圖片組。具體的,終端可以首先按照獲取目標圖片的特征向量的方法,獲取候選圖片組包括的多個候選圖片中每個候選圖片的特征向量,然后獲取特征向量與目標圖片的特征向量相似度較高的候選圖片作為與目標圖片匹配的相似圖片。例如,終端在獲取到每個候選圖片的特征向量之后,可以依次計算每個候選圖片的特征向量與目標圖片的特征向量之間的差異度,并確定該差異度小于或等于預設(shè)差異閾值的候選圖片作為與目標圖片匹配的相似圖片。具體的,假設(shè)目標圖片的特征向量是長度為64的向量,每個候選圖片的特征向量也是長度為64的向量,目標圖片的特征向量與第一候選圖片的特征向量的差異度為目標圖片的特征向量與第一候選圖片的特征向量不相同的元素的個數(shù)。

本公開的實施例提供的技術(shù)方案中,通過提取目標圖片的多個顯著性區(qū)域的cnn特征,并根據(jù)該多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量,減小了獲取目標圖片的特征向量的計算量,同時降低了同一物體在不同圖片中的位置變化對相似圖像識別的影響,提高了相似度檢測的精確度。

在一個實施例中,如圖1b所示,在步驟104中,根據(jù)目標圖片的特征向量,從目標圖片的候選圖片組包括的多個候選圖片中獲取與目標圖片匹配的相似圖片,可以通過步驟1041至步驟1043實現(xiàn):

在步驟1041中,獲取候選圖片組包括的多個候選圖片中每個候選圖片的特征向量。

在步驟1042中,獲取目標圖片的特征向量與每個候選圖片的特征向量的余弦距離。

在步驟1043中,獲取與目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與目標圖片匹配的相似圖片。

示例的,終端在獲取到每個候選圖片的特征向量之后,可以計算目標圖片的特征向量與每個候選圖片的特征向量的余弦距離,然后將該余弦距離小于預設(shè)閾值的候選圖片濾除,將該余弦距離大于或等于預設(shè)閾值的候選圖片作為與目標圖片匹配的相似圖片。

假設(shè)目標圖片的特征向量a是長度為64的向量,每個候選圖片的特征向量bi也是長度為64的向量,目標圖片的特征向量a與第一候選圖片的特征向量b1的余弦距離余弦距離能夠更精確的反映兩個向量之間的差異性,若目標圖片的特征向量a與第一候選圖片的特征向量b1的余弦距離c大于或等于預設(shè)閾值,說明目標圖片的特征向量a與第一候選圖片的特征向量b1的差異性較小,進而可以說明目標圖片與第一候選圖片差異性較小,因此終端可以將該第一候選圖片作為與目標圖片匹配的相似圖片。

本公開的實施例提供的技術(shù)方案中,通過目標圖片的特征向量與每個候選圖片的特征向量的余弦距離,獲取與目標圖片匹配的相似圖片,提高了不同圖片相似度檢測的精確度。

在一個實施例中,如圖1c所示,該方法還包括步驟105和步驟106:

在步驟105中,獲取目標圖片的哈希值。

在步驟106中,根據(jù)目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成目標圖片的候選圖片組。

示例的,終端在檢索目標圖片的相似圖片時,可以首先獲取本地存儲的多張圖片作為待檢圖片組成圖片庫,然后從該圖片庫中獲取與目標圖片匹配的相似圖片。

終端在獲取目標圖片的哈希值時,可以首先將目標圖片縮放到預設(shè)尺寸,然后將縮放后目標圖片轉(zhuǎn)為64級灰度圖片,并計算該64級灰度圖片中像素的灰度平均值,接著將每個像素的灰度與灰度平均值進行比較,若像素灰度大于或等于灰度平均值記為1,若像素灰度小于灰度平均值記為0,記錄比較結(jié)果并按照像素順序羅列,組成該目標圖片的哈希值。具體的,終端可以首先將目標圖片縮放到8*8,即縮放后的目標圖片共包括64個像素,通過縮放即可去除不同目標圖片的尺寸差異,然后將縮放后目標圖片轉(zhuǎn)為64級灰度圖片,即每個像素的灰度值范圍為[0,63],接著計算該64級灰度圖片中像素的灰度平均值,最后將每個像素的灰度與灰度平均值進行比較,若像素灰度大于或等于灰度平均值記為1,若像素灰度小于灰度平均值記為0,記錄比較結(jié)果并按照像素順序羅列,構(gòu)成了一個64位的二進制整數(shù),該64位的二進制整數(shù)即為該目標圖片的哈希值。

終端可以按照獲取目標圖片的哈希值的方法獲取圖片庫包括的多個待檢圖片中每個待檢圖片的哈希值,然后哈希值與目標圖片的哈希值相似度較高的候選圖片作為與目標圖片匹配的相似圖片。

上述實施例同樣適用于圖1b所示的技術(shù)方案。

本公開的實施例提供的技術(shù)方案中,通過目標圖片的哈希值可以迅速從圖片庫包括的多個待檢圖片中獲取可能與目標圖片相似度高的多個待檢圖片座位多個候選圖片,減小了獲取目標圖片的相似圖片的計算量,進而提高了圖片相似度檢測的效率。

在一個實施例中,如圖1d所示,在步驟106中,根據(jù)目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成目標圖片的候選圖片組,可以通過步驟1061至步驟1063實現(xiàn):

在步驟1061中,獲取圖片庫包括的多個待檢圖片中每個待檢圖片的哈希值。

在步驟1062中,根據(jù)每個待檢圖片的哈希值,建立隨機森林。

在步驟1063中,根據(jù)目標圖片的哈希值和隨機森林,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成目標圖片的候選圖片組。

示例的,終端可以根據(jù)每個待檢圖片的哈希值,建立k-d(dimension,維度)隨機森林。在獲取到目標圖片的哈希值之后,可以使用該k-d隨機森林索引對目標圖片的哈希值進行檢索,獲取哈希值與目標圖片的哈希值相似度較高的多個候選圖片組成目標圖片的候選圖片組。具體的,終端可以通過k-d隨機森林索引采用海明距離對目標圖片的哈希值進行檢索。

本公開的實施例提供的技術(shù)方案中,通過圖片庫包括的多個待檢圖片的哈希值組成的隨機森林,從多個待檢圖片中獲取多個候選圖片,提高了獲取候選圖片的效率和精確度,進而提高了圖片相似度檢測的效率和精確度。

下面通過幾個實施例詳細介紹實現(xiàn)過程。

圖2是根據(jù)一示例性實施例示出的一種相似圖片檢索方法的流程圖,執(zhí)行主體為終端,如圖2所示,包括以下步驟201至步驟211:

在步驟201中,終端獲取本地保存的多個圖片作為待檢圖片組成圖片庫。

在步驟202中,終端獲取多個待檢圖片中每個待檢圖片的哈希值。

在步驟203中,終端根據(jù)每個待檢圖片的哈希值,建立k-d隨機森林。

在步驟204中,終端獲取目標圖片的哈希值。

在步驟205中,終端根據(jù)目標圖片的哈希值和該k-d隨機森林,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成目標圖片的候選圖片組。

在步驟206中,終端獲取該目標圖片的多個顯著性區(qū)域。

在步驟207中,終端提取該多個顯著性區(qū)域中每個顯著性區(qū)域的cnn特征。

在步驟208中,終端根據(jù)該每個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量。

在步驟209中,終端獲取候選圖片組中每個候選圖片的特征向量。

在步驟210中,終端獲取目標圖片的特征向量與每個候選圖片的特征向量的余弦距離。

在步驟211中,終端獲取與目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與目標圖片匹配的相似圖片。

本公開的實施例提供一種相似圖片檢索方法,終端可以通過哈希值從多個待檢圖片中獲取候選圖片,進而通過提取目標圖片的多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量,然后根據(jù)目標圖片的特征向量和每個候選圖片的特征向量獲取與目標圖片匹配的相似圖片,減小了獲取目標圖片的特征向量的計算量,同時降低了同一物體在不同圖片中的位置變化對相似圖像識別的影響,提高了相似度檢測的精確度。

圖3是根據(jù)一示例性實施例示出的一種相似圖片檢索方法的流程圖,執(zhí)行主體為服務器,如圖3所示,包括以下步驟301至步驟311:

在步驟301中,服務器獲取存儲的或者互聯(lián)網(wǎng)上的多個圖片作為待檢圖片組成圖片庫。

在步驟302中,服務器獲取多個待檢圖片中每個待檢圖片的哈希值。

在步驟303中,服務器根據(jù)每個待檢圖片的哈希值,建立k-d隨機森林。

在步驟304中,服務器獲取目標圖片的哈希值。

在步驟305中,服務器根據(jù)目標圖片的哈希值和該k-d隨機森林,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成目標圖片的候選圖片組。

在步驟306中,服務器獲取該目標圖片的多個顯著性區(qū)域。

在步驟307中,服務器提取該多個顯著性區(qū)域中每個顯著性區(qū)域的cnn特征。

在步驟308中,服務器根據(jù)該每個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量。

在步驟309中,服務器獲取候選圖片組中每個候選圖片的特征向量。

在步驟310中,服務器獲取目標圖片的特征向量與每個候選圖片的特征向量的余弦距離。

在步驟311中,服務器獲取與目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與目標圖片匹配的相似圖片。

本公開的實施例提供一種相似圖片檢索方法,服務器可以通過哈希值從多個待檢圖片中獲取候選圖片,進而通過提取目標圖片的多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量,然后根據(jù)目標圖片的特征向量和每個候選圖片的特征向量獲取與目標圖片匹配的相似圖片,減小了獲取目標圖片的特征向量的計算量,同時降低了同一物體在不同圖片中的位置變化對相似圖像識別的影響,提高了相似度檢測的精確度。

下述為本公開裝置實施例,可以用于執(zhí)行本公開方法實施例。

圖4a是根據(jù)一示例性實施例示出的一種相似圖片檢索裝置40的結(jié)構(gòu)示意圖,該裝置40可以通過軟件、硬件或者兩者的結(jié)合實現(xiàn)成為電子設(shè)備的部分或者全部。如圖4a所示,該相似圖片檢索裝置40包括第一獲取模塊401,提取模塊402,第二獲取模塊403和第三獲取模塊404。

其中,第一獲取模塊401,用于獲取目標圖片的多個顯著性區(qū)域。

提取模塊402,用于提取所述多個顯著性區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)cnn特征。

第二獲取模塊403,用于根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量。

第三獲取模塊404,用于根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片。

在一個實施例中,如圖4b所示,所述第二獲取模塊403包括第一獲取子模塊4031。

所述第一獲取子模塊4031,用于通過局部特征聚合描述符vlad對每個所述顯著性區(qū)域的cnn特征進行編碼,獲取所述目標圖片的特征向量。

在一個實施例中,如圖4c所示,所述第三獲取模塊404包括第二獲取子模塊4041,第三獲取子模塊4042和第四獲取子模塊4043。

其中,第二獲取子模塊4041,用于獲取所述候選圖片組包括的多個候選圖片中每個候選圖片的特征向量。

第三獲取子模塊4042,用于獲取所述目標圖片的特征向量與每個候選圖片的特征向量的余弦距離。

第四獲取子模塊4043,用于獲取與所述目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與所述目標圖片匹配的相似圖片。

在一個實施例中,如圖4d所示,所述裝置40還包括第四獲取模塊405和組成模塊406。

其中,第四獲取模塊405,用于獲取目標圖片的哈希值。

組成模塊406,用于根據(jù)所述目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

上述實施例同樣適用于圖4b和圖4c所示的相似圖片檢索裝置40。

在一個實施例中,如圖4e所示,所述組成模塊406包括第五獲取子模塊4061,建立子模塊4062和組成子模塊4063。

其中,第五獲取子模塊4061,用于獲取所述圖片庫包括的多個待檢圖片中每個待檢圖片的哈希值。

建立子模塊4062,用于根據(jù)所述每個待檢圖片的哈希值,建立隨機森林。

組成子模塊4063,用于根據(jù)所述目標圖片的哈希值和所述隨機森林,從所述圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

本公開的實施例提供一種相似圖片檢索裝置,該裝置可以通過哈希值從多個待檢圖片中獲取候選圖片,進而通過提取目標圖片的多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量,然后根據(jù)目標圖片的特征向量和每個候選圖片的特征向量獲取與目標圖片匹配的相似圖片,減小了獲取目標圖片的特征向量的計算量,同時降低了同一物體在不同圖片中的位置變化對相似圖像識別的影響,提高了相似度檢測的精確度。

本公開實施例提供一種相似圖片檢索裝置,該相似圖片檢索裝置包括:

處理器;

用于存儲處理器可執(zhí)行指令的存儲器;

其中,處理器被配置為:

獲取目標圖片的多個顯著性區(qū)域;

提取所述多個顯著性區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)cnn特征;

根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量;

根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片。

在一個實施例中,上述處理器還可被配置為:通過局部特征聚合描述符vlad對每個所述顯著性區(qū)域的cnn特征進行編碼,獲取所述目標圖片的特征向量。

在一個實施例中,上述處理器還可被配置為:獲取所述候選圖片組包括的多個候選圖片中每個候選圖片的特征向量;獲取所述目標圖片的特征向量與每個候選圖片的特征向量的余弦距離;獲取與所述目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與所述目標圖片匹配的相似圖片。

在一個實施例中,上述處理器還可被配置為:獲取目標圖片的哈希值;根據(jù)所述目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

在一個實施例中,上述處理器還可被配置為:獲取所述圖片庫包括的多個待檢圖片中每個待檢圖片的哈希值;根據(jù)所述每個待檢圖片的哈希值,建立隨機森林;根據(jù)所述目標圖片的哈希值和所述隨機森林,從所述圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

本公開的實施例提供一種相似圖片檢索裝置,該裝置可以通過哈希值從多個待檢圖片中獲取候選圖片,進而通過提取目標圖片的多個顯著性區(qū)域的cnn特征,獲取目標圖片的特征向量,然后根據(jù)目標圖片的特征向量和每個候選圖片的特征向量獲取與目標圖片匹配的相似圖片,減小了獲取目標圖片的特征向量的計算量,同時降低了同一物體在不同圖片中的位置變化對相似圖像識別的影響,提高了相似度檢測的精確度。

關(guān)于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進行了詳細描述,此處將不做詳細闡述說明。

圖5是根據(jù)一示例性實施例示出的一種用于相似圖片檢索裝置50的結(jié)構(gòu)框圖,該裝置50適用于終端設(shè)備。例如,裝置50可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。

裝置50可以包括以下一個或多個組件:處理組件502,存儲器504,電源組件506,多媒體組件508,音頻組件510,輸入/輸出(i/o)的接口512,傳感器組件514,以及通信組件516。

處理組件502通??刂蒲b置50的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理組件502可以包括一個或多個處理器520來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件502可以包括一個或多個模塊,便于處理組件502和其他組件之間的交互。例如,處理組件502可以包括多媒體模塊,以方便多媒體組件508和處理組件502之間的交互。

存儲器504被配置為存儲各種類型的數(shù)據(jù)以支持在裝置50的操作。這些數(shù)據(jù)的示例包括用于在裝置50上操作的任何應用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器504可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(sram),電可擦除可編程只讀存儲器(eeprom),可擦除可編程只讀存儲器(eprom),可編程只讀存儲器(prom),只讀存儲器(rom),磁存儲器,快閃存儲器,磁盤或光盤。

電源組件506為裝置50的各種組件提供電力。電源組件506可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置50生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件508包括在所述裝置50和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件508包括一個前置攝像頭和/或后置攝像頭。當裝置50處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。

音頻組件510被配置為輸出和/或輸入音頻信號。例如,音頻組件510包括一個麥克風(mic),當裝置50處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器504或經(jīng)由通信組件516發(fā)送。在一些實施例中,音頻組件510還包括一個揚聲器,用于輸出音頻信號。

i/o接口512為處理組件502和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。

傳感器組件514包括一個或多個傳感器,用于為裝置50提供各個方面的狀態(tài)評估。例如,傳感器組件514可以檢測到裝置50的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置50的顯示器和小鍵盤,傳感器組件514還可以檢測裝置50或裝置50一個組件的位置改變,用戶與裝置50接觸的存在或不存在,裝置50方位或加速/減速和裝置50的溫度變化。傳感器組件514可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件514還可以包括光傳感器,如cmos或ccd圖像傳感器,用于在成像應用中使用。在一些實施例中,該傳感器組件514還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。

通信組件516被配置為便于裝置50和其他設(shè)備之間有線或無線方式的通信。裝置50可以接入基于通信標準的無線網(wǎng)絡(luò),如wifi,2g或3g,或它們的組合。在一個示例性實施例中,通信組件516經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信組件516還包括近場通信(nfc)模塊,以促進短程通信。例如,在nfc模塊可基于射頻識別(rfid)技術(shù),紅外數(shù)據(jù)協(xié)會(irda)技術(shù),超寬帶(uwb)技術(shù),藍牙(bt)技術(shù)和其他技術(shù)來實現(xiàn)。

在示例性實施例中,裝置50可以被一個或多個應用專用集成電路(asic)、數(shù)字信號處理器(dsp)、數(shù)字信號處理設(shè)備(dspd)、可編程邏輯器件(pld)、現(xiàn)場可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子組件實現(xiàn),用于執(zhí)行上述方法。

在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器504,上述指令可由裝置50的處理器520執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是rom、隨機存取存儲器(ram)、cd-rom、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。

本公開實施例提供一種非臨時性計算機可讀存儲介質(zhì),當所述存儲介質(zhì)中的指令由裝置50的處理器執(zhí)行時,使得裝置50能夠執(zhí)行上述相似圖片檢索方法,所述方法包括:

獲取目標圖片的多個顯著性區(qū)域;

提取所述多個顯著性區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)cnn特征;

根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量;

根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片。

在一個實施例中,所述根據(jù)所述多個顯著性區(qū)域的cnn特征,獲取所述目標圖片的特征向量包括:通過局部特征聚合描述符vlad對每個所述顯著性區(qū)域的cnn特征進行編碼,獲取所述目標圖片的特征向量。

在一個實施例中,所述根據(jù)所述目標圖片的特征向量,從所述目標圖片的候選圖片組包括的多個候選圖片中獲取與所述目標圖片匹配的相似圖片包括:獲取所述候選圖片組包括的多個候選圖片中每個候選圖片的特征向量;獲取所述目標圖片的特征向量與每個候選圖片的特征向量的余弦距離;獲取與所述目標圖片的特征向量的余弦距離大于或等于預設(shè)閾值的特征向量對應的候選圖片作為與所述目標圖片匹配的相似圖片。

在一個實施例中,所述方法還包括:獲取目標圖片的哈希值;根據(jù)所述目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

在一個實施例中,所述根據(jù)所述目標圖片的哈希值,從圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組包括:獲取所述圖片庫包括的多個待檢圖片中每個待檢圖片的哈希值;根據(jù)所述每個待檢圖片的哈希值,建立隨機森林;根據(jù)所述目標圖片的哈希值和所述隨機森林,從所述圖片庫包括的多個待檢圖片中獲取多個候選圖片組成所述目標圖片的所述候選圖片組。

本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的公開后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。

應當理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
河间市| 西乌珠穆沁旗| 金寨县| 宁陕县| 漳浦县| 邯郸县| 安多县| 综艺| 伊吾县| 枝江市| 广水市| 托里县| 怀柔区| 北京市| 家居| 山阴县| 肥西县| 隆尧县| 凌云县| 上杭县| 贵南县| 洛南县| 浪卡子县| 吐鲁番市| 库伦旗| 宿迁市| 营山县| 德惠市| 西贡区| 博白县| 酒泉市| 西青区| 邢台县| 含山县| 恩平市| 河曲县| 樟树市| 临邑县| 和田市| 莆田市| 桑植县|