一種快速高效的近似重復(fù)圖像匹配方法
【專利摘要】本發(fā)明公開了一種快速高效的近似重復(fù)圖像匹配方法。本方法為:1)提取訓(xùn)練圖像庫中每一圖像的ORB特征并對每一圖像的ORB特征進(jìn)行非線性映射,構(gòu)建該訓(xùn)練圖像庫的視覺詞匯表;2)根據(jù)已構(gòu)建的視覺詞匯表,利用局部約束線性編碼對訓(xùn)練圖像庫中每一圖像非線性映射的ORB特征進(jìn)行稀疏編碼;3)提取待匹配圖像的ORB特征并對其進(jìn)行非線性映射,然后根據(jù)所建視覺詞匯表對該待匹配圖像非線性映射的ORB特征進(jìn)行稀疏編碼;4)計算待匹配圖像的稀疏編碼與該訓(xùn)練圖像庫中圖像的稀疏編碼相似度,若相似度超過設(shè)定閾值,則匹配成功,否則匹配失敗。本發(fā)明降低了硬量化方法的重構(gòu)誤差,極大地提高了匹配的速度,可以用來實時匹配。
【專利說明】-種快速高效的近似重復(fù)圖像匹配方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及計算機(jī)視覺領(lǐng)域,特別設(shè)及一種近似圖像匹配(Near-Duplicate Image Match)方法。
【背景技術(shù)】
[0002] 隨著多媒體技術(shù)和現(xiàn)代信息處理技術(shù)的快速發(fā)展,特別是云計算、微信、微博等大 規(guī)模移動應(yīng)用的推廣,圖像/視頻數(shù)量正在呈爆炸式增長,該就不可避免的存在了大量的 近似重復(fù)圖像,給信息存儲和用戶檢索帶來非常的不便。因此近似重復(fù)圖像匹配吸引了一 些學(xué)者的興趣。通過近似重復(fù)圖像匹配的研究,一方面可W實現(xiàn)圖像版權(quán)保護(hù),其次在圖像 捜索引擎中,用于過濾掉檢索結(jié)果中的重復(fù)圖像,從而提高用戶的檢索質(zhì)量,另外,在基于 內(nèi)容的敏感信息監(jiān)控中,用于監(jiān)控敏感圖像的傳播,因此,近似重復(fù)圖像匹配有非常重要的 研究意義和應(yīng)用價值。
[0003] 通常近似重復(fù)圖像是由某幅源圖像通過某些變換得到的,一般可W產(chǎn)生近似重復(fù) 圖像的變換包括平移、縮放、旋轉(zhuǎn)、圖像色調(diào)的變化、添加網(wǎng)址或商標(biāo)、格式變化、分辨率變 化等等。近似重復(fù)圖像匹配最常用的框架有W下兩類:基于詞包模型炬ag of Words)的方 法和基于索引的方法。詞包模型的框架主要包括提取表示圖像視覺的局部特征,對局部特 征量化或編碼,然后通過編碼融合形成最終的直方圖向量來表示圖像,最后度量圖像直方 圖向量之間的相似性?;谒饕目蚣鼙容^流行的是將提取的圖像的特征通過哈希編碼處 理成一個緊湊的顯著的哈希串,該樣相近的特征點(diǎn)W很高的概率被處理成相似的哈希串, 在捜索的過程中,僅僅捜索那些相似的哈希串,從而降低了捜索的時間復(fù)雜度,但是最終的 檢測結(jié)果并不是很令人滿意,同時它還需要大量的存儲空間。因此,近年來,研究工作基本 上是采用詞包模型的框架來做近似重復(fù)圖像匹配。
[0004] 當(dāng)前非常流行的詞包模型框架不僅用在近似重復(fù)圖像匹配上,還用在圖像檢索、 圖像分類等其他應(yīng)用上。由于SIFT特征具有旋轉(zhuǎn)、尺度不變性等良好的特征,目前匹配方 法中廣泛使用SIFT局部特征,并配合歐式距離的聚類算法進(jìn)行圖像匹配,但是目前的方法 存在速度慢、噪聲大且準(zhǔn)確度較差等問題。另一方面,詞包模型的另外一個缺陷就是詞量化 的問題,一般的技術(shù)都采用硬量化的方式,從而導(dǎo)致了一個局部特征點(diǎn)只能映射到詞匯表 中的一個單詞上,相似的局部特征有可能映射為不同的單詞,因此造成了明顯的重構(gòu)誤差。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有的詞包模型技術(shù)中局部特征點(diǎn)提取速度慢、噪聲大、單詞硬量化、圖像匹 配速度慢等技術(shù)問題,本發(fā)明的目的是提供一種快速高效的近似重復(fù)圖像匹配方法。本發(fā) 明綜合分析了各項技術(shù)的特點(diǎn),首先提取圖像的ORB局部特征,并對ORB特征進(jìn)行非線性映 射,然后利用局部約束線性編碼對非線性映射后的局部特征進(jìn)行稀疏編碼,W及對得到的 稀疏編碼構(gòu)建倒排索引,通過該一系列綜合技術(shù)處理,使得方案在避免噪聲大的同時,能夠 提高匹配速度。
[0006] 本發(fā)明的技術(shù)方案為;
[0007] 一種快速高效的近似重復(fù)圖像匹配方法,其步驟為:
[000引 1)提取訓(xùn)練圖像庫中每一圖像的ORB特征并對每一圖像的ORB特征進(jìn)行非線性映 射,構(gòu)建該訓(xùn)練圖像庫的視覺詞匯表;
[0009] 2)根據(jù)已構(gòu)建的視覺詞匯表,利用局部約束線性編碼對訓(xùn)練圖像庫中每一圖像非 線性映射的ORB特征進(jìn)行稀疏編碼;
[0010] 3)提取待匹配圖像的ORB特征并對其進(jìn)行非線性映射,然后根據(jù)所建視覺詞匯表 對該待匹配圖像非線性映射的ORB特征進(jìn)行稀疏編碼;
[0011] 4)計算待匹配圖像的稀疏編碼與該訓(xùn)練圖像庫中圖像的稀疏編碼相似度,若相似 度超過設(shè)定闊值,則匹配成功,否則匹配失敗。
[0012] 進(jìn)一步的,所述構(gòu)建所述視覺詞匯表的方法為:
[0013] 21)對每一圖像的每一 ORB特征進(jìn)行非線性映射,即首先對ORB特征1范數(shù)歸一 化,然后對ORB特征向量的每一維進(jìn)行開平方根運(yùn)算;
[0014] 22)對訓(xùn)練圖像庫中所有圖像經(jīng)過非線性映射后的ORB特征利用聚類算法進(jìn)行聚 類,根據(jù)聚類結(jié)果構(gòu)建視覺詞匯表。
[0015] 進(jìn)一步的,所述聚類算法中根據(jù)非線性映射后的ORB特征之間的己氏距離進(jìn)行聚 類。
[0016] 進(jìn)一步的,利用公
【權(quán)利要求】
1. 一種快速高效的近似重復(fù)圖像匹配方法,其步驟為: 1) 提取訓(xùn)練圖像庫中每一圖像的ORB特征并對每一圖像的ORB特征進(jìn)行非線性映射, 構(gòu)建該訓(xùn)練圖像庫的視覺詞匯表; 2) 根據(jù)已構(gòu)建的視覺詞匯表,利用局部約束線性編碼對訓(xùn)練圖像庫中每一圖像非線性 映射的ORB特征進(jìn)行稀疏編碼; 3) 提取待匹配圖像的ORB特征并對其進(jìn)行非線性映射,然后根據(jù)所建視覺詞匯表對該 待匹配圖像非線性映射的ORB特征進(jìn)行稀疏編碼; 4) 計算待匹配圖像的稀疏編碼與該訓(xùn)練圖像庫中圖像的稀疏編碼相似度,若相似度超 過設(shè)定閾值,則匹配成功,否則匹配失敗。
2. 如權(quán)利要求1所述的方法,其特征在于,所述構(gòu)建所述視覺詞匯表的方法為: 21) 對每一圖像的每一ORB特征進(jìn)行非線性映射,即首先對ORB特征1范數(shù)歸一化,然 后對ORB特征向量的每一維進(jìn)行開平方根運(yùn)算; 22) 對訓(xùn)練圖像庫中所有圖像經(jīng)過非線性映射后的ORB特征利用聚類算法進(jìn)行聚類, 根據(jù)聚類結(jié)果構(gòu)建視覺詞匯表。
3. 如權(quán)利要求2所述的方法,其特征在于,所述聚類算法中根據(jù)非線性映射后的ORB特 征之間的巴氏距離進(jìn)行聚類。
4. 如權(quán)利要求2所述的方法,其特征在于
對ORB特征進(jìn)行所述非線 性映射;其中,ORB特征向量X的第i維分量,d為ORB特征向量的維數(shù)。
5. 如權(quán)利要求1所述的方法,其特征在于,利用下列公式對所述ORB特征進(jìn)行稀疏編
其中,條件I1Ci= 1保證了局部約束編碼的平移不變性, JT SJ-IrCi -I5Vi 表示元素都為1的向量的轉(zhuǎn)置,Y=Iiy1,y2, . . .,Yi, . . .,yN]表示N個維數(shù)為d的非線 性映射后的ORB特征,〇表示向量內(nèi)元素兩兩相乘,d為ORB特征的維數(shù),CiGRM是對非線 性映射后的第i個ORB特征yi局部約束線性編碼后的稀疏向量。
6. 如權(quán)利要求5所述的方法,其特征在于,采用最大值融合方法對圖像進(jìn)行編碼融合, 得到該圖像的稀疏編碼。
7. 如權(quán)利要求1-5任一所述的方法,其特征在于,根據(jù)圖像的稀疏編碼對該訓(xùn)練圖像 庫建立倒排索引,得到一倒排索引文件,步驟4)中利用該倒排索引文件,計算該待匹配圖 像與訓(xùn)練圖像庫中的所有圖像的相似度。
8. 如權(quán)利要求7所述的方法,其特征在于,所述倒排索引文件的結(jié)構(gòu)為:倒排索引的每 一條記錄表示一個單詞,對應(yīng)的值為所包含該視覺單詞的圖像ID列表以及對應(yīng)的TF-IDF 值。
9. 如權(quán)利要求8所述的方法,其特征在于,計算該視覺單詞對應(yīng)的TF-IDF值的方法為: TF為該視覺單詞的頻率,即在其所在圖像稀疏編碼中的非零元素,
|d|表示該訓(xùn)練圖像庫中圖像的總數(shù),IDiI表示的是包含視覺單詞i的圖像數(shù)目。
【文檔編號】G06K9/64GK104504406SQ201410733832
【公開日】2015年4月8日 申請日期:2014年12月4日 優(yōu)先權(quán)日:2014年12月4日
【發(fā)明者】李莉, 戴帥夫, 劉丙雙 申請人:長安通信科技有限責(zé)任公司