一種面向位置識(shí)別的圖像相似度檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種面向位置識(shí)別的圖像相似度檢測(cè)方法,屬于圖像識(shí)別技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 圖像相似度檢測(cè)是土相匹配、圖像檢索、模式識(shí)別中的核心環(huán)節(jié),在 SLAM(SimultaneousLocalizationsandMapping)應(yīng)用中,需要進(jìn)行閉合環(huán)路檢測(cè),就是 通過首尾圖像的相似度檢測(cè)判斷是否為同一場(chǎng)景來完成;零位,在機(jī)器人自主導(dǎo)航定位中, 當(dāng)機(jī)器人第二次來到某一環(huán)境中,機(jī)器人需要確定自己在環(huán)境中的位置,然而在室內(nèi)、高達(dá) 建筑物周圍、低下洞穴等一些特殊場(chǎng)景中定位設(shè)備無法使用時(shí),就需要使用機(jī)器人內(nèi)部傳 感確定位置,此時(shí)可以利用圖像相似度檢測(cè)的方法找出與機(jī)器人第一次到達(dá)該環(huán)境時(shí)的同 一場(chǎng)景進(jìn)行定位。
[0003] 計(jì)算兩幅圖像的相似度的關(guān)鍵是為圖像構(gòu)建一個(gè)可以描述圖像本質(zhì)特征的向量 或者矩陣??偟膩碚f,構(gòu)建像描述向量的方法可以分為兩類:一種方法是將圖像作為一個(gè) 整體進(jìn)行描述,例如圖像顏色直方圖,圖像聚合向量以及GIST。圖像直方圖可以看作是圖 像的全局特征,由于其易于竊詰獲取和理解,因此廣泛的應(yīng)用描述圖像。但是圖像直方圖并 未考慮像素之間的空間位置關(guān)系,不同的圖像可能有相似的直方圖。另外,用直方圖描述圖 像缺乏魯棒性,當(dāng)圖像的分辨率、環(huán)境光照發(fā)生變化、場(chǎng)景中部分物體消失或者新物體出現(xiàn) 時(shí),圖像直方圖也會(huì)發(fā)生明顯的變化。
[0004] 第二種方法是采用局部特征描述圖像,例如SIFT(ScaleInvariantFeature Transform),SURF(Speed_UpRobustFeature),描述圖像中若干包含特征點(diǎn)的圖像塊,進(jìn) 而達(dá)到描述圖像的目的。典型的方法是采用B〇W(bag-〇fwords)模型,將圖像的所有特征 點(diǎn)描述向量向詞匯表做投影,最終為圖像構(gòu)建一個(gè)反映圖像包含詞匯情況的描述向量。 BoW模型在圖像識(shí)別分類、目標(biāo)識(shí)別記憶基于圖像內(nèi)容的圖像檢索(CBIR(C〇ntent-baSed imageretrieval))任務(wù)中都取得了 很好的效果。FAB_MAP(FastAppearanceBased Mapping)是一項(xiàng)位置識(shí)別和地圖構(gòu)建的技術(shù),廣泛的應(yīng)用于閉合環(huán)路檢測(cè)問題,其中BoW 模型用于為測(cè)試視頻的每一幀構(gòu)建描述向量。首先提取測(cè)試視頻所有幀上的特征點(diǎn),計(jì)算 每一個(gè)特征點(diǎn)描述向量;采用K-means方法對(duì)提取的所有特征向量進(jìn)行聚類構(gòu)建詞匯表; 將每一幀上的特征點(diǎn)向詞匯表上做投影為每一幀構(gòu)建描述向量。這種采用BoW模型構(gòu)建圖 像幀描述向量的方法一般會(huì)消耗大量的時(shí)間和內(nèi)存,用于構(gòu)建詞匯表的特征數(shù)目有時(shí)會(huì)過 于龐大,使得采用K-means進(jìn)行聚類的過程難以完成。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種面向位置識(shí)別的圖像相似度檢測(cè)方法,以解決目前圖像 相似度檢測(cè)魯棒性低、計(jì)算量大的問題。
[0006] 本發(fā)明為解決上述技術(shù)問題提供了一種面向位置識(shí)別的圖像相似度檢測(cè)方法,該 檢測(cè)方法包括以下步驟:
[0007] 1)對(duì)待檢測(cè)的原始圖像進(jìn)行超像素分割,得到超像素塊;
[0008] 2)利用卷積神經(jīng)網(wǎng)絡(luò)模型生成待檢測(cè)原始圖像的特征圖,將每個(gè)超像素塊映射到 每層的特征圖上計(jì)算每個(gè)超像素塊的描述向量;
[0009] 3)將待檢測(cè)原始圖像進(jìn)行劃分成均勻的圖像塊,根據(jù)圖像塊包含的超像素塊計(jì)算 每個(gè)圖像塊描述向量;
[0010] 4)利用得到的每個(gè)圖像塊描述向量計(jì)算待檢測(cè)兩幅圖像中對(duì)應(yīng)圖像塊之間的相 似度,各對(duì)應(yīng)圖像塊相似度的均值即為圖像之間相似度。
[0011] 所述步驟2)每個(gè)超像素塊描述向量的計(jì)算過程如下:
[0012] A.將卷機(jī)神經(jīng)網(wǎng)絡(luò)模型作用于原始圖像生成若干中間層,選取Μ個(gè)輸出層中的所 有特征圖作為待檢測(cè)原始圖像的特征圖,并將其調(diào)整至原始圖像大?。?br>[0013] Β.計(jì)算原始圖像上每一個(gè)超像素塊在每一個(gè)底層卷積輸出層特征圖上對(duì)應(yīng)區(qū)域 中所有像素的信息熵,為每個(gè)超像素塊產(chǎn)生維數(shù)為底層卷積輸出層特征圖個(gè)數(shù)的描述向 量;
[0014] C.計(jì)算原始圖像上每一個(gè)超像素塊在每一個(gè)較高卷積輸出層特征圖上對(duì)應(yīng)區(qū)域 中所有像素的平均值,為每個(gè)超像素塊產(chǎn)生維數(shù)為較高卷積輸出層特征圖個(gè)數(shù)的描述向 量;
[0015] D.綜合步驟Β和C中得到的描述向量即為每個(gè)超像素塊描述向量。
[0016] 所述步驟Β中對(duì)應(yīng)區(qū)域中所有像素的信息熵Η為:
[0017]
[0018] Pi=η;/total
[0019] 其中Pi為每個(gè)bins發(fā)生的概率,bins為統(tǒng)計(jì)區(qū)域中像素最大值與最小值之間等 間隔劃分的像素區(qū)間,&為統(tǒng)計(jì)區(qū)域中落在每個(gè)bins中的像素個(gè)數(shù),tatal為區(qū)域像素總 數(shù)。
[0020] 所述步驟3)中每個(gè)圖像塊描述向量為:
[0021]
[0022] 其中num為圖像塊中包含的超像素塊數(shù)目,weight為第i塊超像素的權(quán)重, .v/'_c/<;wr,為第i塊超像素的描述向量。
[0023] 所述每個(gè)超像素塊的權(quán)重weight為:
[0024]
[0025] 其中sp_num為超像素塊在圖像塊區(qū)域中包含的像素個(gè)數(shù),total_num為圖像塊區(qū) 域中的像素總數(shù)。
[0026] 所述步驟4)中各圖像塊之間相似度pat_simi為:
[0027]
[0028] 其中為圖像塊1的歸一化的描述向量,為圖像塊2的歸一化 的描述向量。
[0029] 所述步驟1)是采用線性迭代聚類的方法進(jìn)行超像素分割。
[0030] 所述圖像塊像素度計(jì)算時(shí)可將圖像包含的圖像塊描述向量組成描述矩陣,用第一 幅圖像的描述矩陣與第二幅圖像描述矩陣的轉(zhuǎn)置點(diǎn)乘,得到相似矩陣S,其中S的第i行第 j列的元素S、,表述第一幅圖像上第i個(gè)圖像塊與第二幅圖像上第j個(gè)圖像塊之間的相似 度,S中每個(gè)對(duì)角線元素即為對(duì)應(yīng)圖像塊的相似度。
[0031] 本發(fā)明的有益效果是:本發(fā)明首先對(duì)圖像進(jìn)行超像素分割,結(jié)合CNN模型生成圖 像的特征圖,并計(jì)算每個(gè)超像素塊的描述向量;然后將待檢測(cè)圖像劃分成均勻的圖像塊,根 據(jù)圖像塊包含的超像素塊計(jì)算每個(gè)圖像塊描述向量,構(gòu)成圖像的描述矩陣;利用得到的每 個(gè)圖像塊描述向量計(jì)算待檢測(cè)兩幅圖像中對(duì)應(yīng)圖像塊之間的相似度,各對(duì)應(yīng)圖像塊相似度 的均值即為本發(fā)明所求的兩幅圖像之間相似度。本發(fā)明具有較高的魯棒性,且計(jì)算量小,易 實(shí)現(xiàn),即使同一場(chǎng)景內(nèi)容發(fā)生了變化,都能夠有效準(zhǔn)確的識(shí)別,同時(shí)還能夠及時(shí)準(zhǔn)確的從序 列影像中找到最相似圖像。
【附圖說明】
[0032]圖1是超像素塊描述向量的計(jì)算流程圖;
[0033] 圖2-a是實(shí)驗(yàn)例1中來自同一場(chǎng)景的1#圖像;
[0034] 圖2-b是實(shí)驗(yàn)例1中來自同一場(chǎng)景的2#圖像;
[0035] 圖2-c是實(shí)驗(yàn)例1中來自同一場(chǎng)景圖像對(duì)的相似矩陣示意圖;
[0036] 圖3-a是實(shí)驗(yàn)例1中來自不同場(chǎng)景的1#圖像;
[0037] 圖3-b是實(shí)驗(yàn)例1中來自不同場(chǎng)景的2#圖像;
[0038] 圖3-c是實(shí)驗(yàn)例1中來自不同場(chǎng)景圖像對(duì)的相似矩陣示意圖;
[0039] 圖4是實(shí)驗(yàn)例2中所選取的測(cè)試圖像;
[0040]圖5是實(shí)驗(yàn)例2利用本發(fā)明所找到的最相似的一幀圖像;
[0041] 圖6是實(shí)驗(yàn)例2中得到相似度曲線。
【具體實(shí)施方式】