一種用于描述圖像特征的多維方向梯度表示方法
【專利摘要】本發(fā)明提供一種用于描述圖像特征的多維方向梯度表示方法,包括:以圖像中每個像素點為中心分別定義A×A大小的矩陣,其中的A取3~30的奇數(shù);在定義的每個矩陣中針對中心像素點計算x和y兩個方向的梯度;對基于每個矩陣得到的梯度計算結(jié)果進行加權(quán)計算,得到每個矩陣針對其中心像素點的x方向梯度和y方向梯度;再在進一步定義的N×N的塊內(nèi),將0?180度的范圍分為相同角度的5?9個單位,采用線性插值統(tǒng)計每個單位內(nèi)的梯度權(quán)重;以圖像中的每個像素點為中心,做一個M×M的矩陣,在這個矩陣中找到梯度的最大值vmax和最小值vmin;重新計算梯度權(quán)重。本發(fā)明的方法利用方向梯度的塊區(qū)域算法,同時整合角度上的線性插值,能很好的描述物體特征,同時保證了計算速度。
【專利說明】
一種用于描述圖像特征的多維方向梯度表示方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于計算機圖像處理領(lǐng)域,用于精確描述圖像物體特征。
【背景技術(shù)】
[0002] 局部圖像特征描述是計算機視覺的一個基本研究問題,在尋找圖像中的對應(yīng)點以 及物體特征描述中有著重要的作用。它是許多方法的基礎(chǔ),因此也是目前視覺研究中的一 個熱點。同時它也有著廣泛的應(yīng)用,舉例來說,在利用多幅二維圖像進行三維重建、恢復(fù)場 景三維結(jié)構(gòu)的應(yīng)用中,其基本出發(fā)點是要有一個可靠的圖像對應(yīng)點集合,而自動地建立圖 像之間點與點之間的可靠對應(yīng)關(guān)系通常都依賴于一個優(yōu)秀的局部圖像特征描述子。又比 如,在物體識別中,目前非常流行以及切實可行的方法之一是基于局部特征的,由于特征的 局部性,使得物體識別可以處理遮擋、復(fù)雜背景等比較復(fù)雜的情況。
[0003] 局部圖像特征描述的核心問題是不變性(魯棒性)和可區(qū)分性。然而,特征描述子 的可區(qū)分性的強弱往往和其不變性是矛盾的,也就是說,一個具有眾多不變性的特征描述 子,它區(qū)分局部圖像內(nèi)容的能力就稍弱;而如果一個非常容易區(qū)分不同局部圖像內(nèi)容的特 征描述子,它的魯棒性往往比較低。而另一方面,如果我們通過統(tǒng)計局部圖像灰度直方圖來 進行特征描述,這種描述方式具有較強的不變性,對于局部圖像內(nèi)容發(fā)生旋轉(zhuǎn)變化等情況 比較魯棒,但是區(qū)分能力較弱,例如無法區(qū)分兩個灰度直方圖相同但內(nèi)容不同的局部圖像 塊。所以,一個優(yōu)秀的特征描述子不僅應(yīng)該具有很強不變性,還應(yīng)該具有很強的可區(qū)分性。
[0004] 在現(xiàn)有的諸多的局部圖像特征描述子中,SIFT(Scale Invariant Feature Transform)是其中應(yīng)用最廣的,它在1999年首次提出,至2004年得到完善。由于SIFT對尺 度、旋轉(zhuǎn)以及一定視角和光照變化等圖像變化都具有不變性,并且SIFT具有很強的可區(qū)分 性,自它提出以來,很快在物體識別、寬基線圖像匹配、三維重建、圖像檢索中得到了應(yīng)用, 局部圖像特征描述子在計算機視覺領(lǐng)域內(nèi)也得到了更加廣泛的關(guān)注,涌現(xiàn)了一大批各具特 色的局部圖像特征描述子。SURF(Speeded Up Robust Features)是對SIFT的改進版本,它 利用Haar小波來近似SIFT方法中的梯度操作,同時利用積分圖技術(shù)進行快速計算,SURF的 速度是SIFT的3-7倍,大部分情況下它和SIFT的性能相當,因此它在很多應(yīng)用中得到了應(yīng) 用,尤其是對運行時間要求高的場合。ASIFT(Affine SIFT)通過模擬所有成像視角下得到 的圖像進行特征匹配,可以很好地處理視角變化的情況,尤其是大視角變化下的圖像匹配。 MROGH(Multi_support Region Order-based Gradient Histogram)則是特征匯聚策略上 尋求創(chuàng)新,之前的局部圖像特征描述子,其特征匯聚策略都是基于鄰域內(nèi)點的幾何位置的, 而MR0GH基于點的灰度序進行特征匯聚。LBP(Local Binary Pattern,局部二值模式)是一 種用來描述圖像局部紋理特征的算子,首先由T.Ojala, M.PictikSinen和D.Harwood在1994 年提出,之后出現(xiàn)很多變種,如CLBP,LBPHF等等,用于圖像局部紋理特征提取。LBP已經(jīng)成功 應(yīng)用于人臉檢測,唇語識別,表情檢測,動態(tài)紋理等等領(lǐng)域,其具有旋轉(zhuǎn)不變性和灰度不變 性等顯著的優(yōu)點。
[0005] 最近幾年局部圖像特征描述子的發(fā)展趨勢是:快速、低存儲。這兩個趨勢使得局部 圖像特征描述子可以在快速實時、大規(guī)模應(yīng)用中發(fā)揮作用,而且有利于將許多應(yīng)用做到手 機上去進行開發(fā),實實在在的將計算機視覺技術(shù)應(yīng)用于我們周圍的世界中。上述現(xiàn)有技術(shù) 中使用SIFT和LBP等算子來描述圖像特征的方法在計算速度、資源消耗以及對特征描述的 貼合度上,都仍然存在不足和缺陷。為了進一步滿足快速和低存儲這兩個需求,有必要研發(fā) 一種新的圖像特征描述方法。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于:提供一種計算速度更快、資源消耗更低、特征描述貼合度更高 的圖像特征描述方法。
[0007] 本發(fā)明的上述目的通過以下技術(shù)方案實現(xiàn):
[0008] 提供一種用于描述圖像特征的多維方向梯度表示方法,包括:
[0009] 1)以圖像中每個像素點為中心分別定義AXA大小的矩陣,其中的A取3~30的奇 數(shù);
[0010] 2)在步驟1)定義的每個矩陣中針對中心像素點計算1和7兩個方向的梯度;
[0011] 3)對步驟2)基于每個矩陣得到的梯度計算結(jié)果進行加權(quán)計算,得到每個矩陣針對 其中心像素點的x方向梯度和y方向梯度,即圖像中每個像素點都對應(yīng)得到1個x方向的梯度 值和1個y方向的梯度值;
[0012] 4)定義一個NXN大小的塊,所述的N取正整數(shù);在定義的塊內(nèi),將0-180度的范圍分 為相同角度的5-9個單位,采用線性插值統(tǒng)計每個單位內(nèi)的梯度權(quán)重;
[0013] 5)以圖像中的每個像素點為中心,做一個M X M的矩陣,其中M為步驟4)所述的N取 值的整數(shù)倍,在這個矩陣中找到梯度的最大值vmax和最小值vmin;重新計算梯度權(quán)重,計算 方法為:(v -vmin)/(vmax-vmin) 〇
[0014]本發(fā)明的方法中,步驟1)所述的AXA矩陣,A優(yōu)選為5~15;更優(yōu)選5。
[0015] 本發(fā)明的方法中,步驟2)所述的在每個矩陣中針對中心像素點計算1和7兩個方向 的梯度,優(yōu)選的計算方法是:以中心像素點所在列為對稱軸計算每組對稱點之間的像素值 差;以中心像素點所在的行為對稱軸計算每組對稱點之間的像素值差。
[0016] 本發(fā)明的方法中,步驟3)所述的加權(quán)計算,優(yōu)選通過定義一個與步驟1)所述矩陣 相同大小的高斯核來完成所述的加權(quán)計算。
[0017] 本發(fā)明的方法中,步驟4)優(yōu)選的NX N大小的塊,N取8。
[0018]本發(fā)明的方法中,步驟4)優(yōu)選將所述的0-180度的范圍分為9個單位,每個單位20 度。
[0019] 本發(fā)明的方法中,步驟5)優(yōu)選的M XM的矩陣,M取32。
[0020] 本發(fā)明的方法利用方向梯度的塊區(qū)域算法,可以減少局部光照不均勻造成的梯度 差異化過大,提高梯度描述的適應(yīng)性,同時整合角度上的線性插值,能很好的描述物體特 征,同時保證了計算速度。
【具體實施方式】
[0021] 以下通過列舉實施例的方式對本發(fā)明的技術(shù)方案做進一步的說明。
[0022] 實施例1
[0023] -種用于描述圖像特征的多維方向梯度表示方法,包括以下步驟:
[0024] 1.方向梯度的計算
[0025] a)針對圖像中的每一個點,定一個5 X 5的矩陣,矩陣中每個點位置以英文字母標 記如下: abode f g h i j
[0026] k 1 m n 〇 p q r s t u V W :x y
[0027] b)在步驟a)定義的每個矩陣中都針對位置如m點的中心點按如下方法計算梯度: [0028]先計算x方向梯度:
[0029] gradxl=(a-e)*CXl+(b_d)*CX2//第1行
[0030] gradx2 = (f-j)*CX3+(g-i)*CX4//第 2 行 [0031 ] gradx3 = (k_o)*CX5+( l_n)*CX6//第 3 行
[0032] gradx4=(卩-1:)*〇父7+(9-8)*〇父8//第4行
[0033] gradx5 = (u-y)*CX9+(v_x)*CX10//第 5 行 [0034] 其中CX1~CX9為高斯系數(shù)
[0035]得到gradxl~grad5這5個x方向的梯度后,再對這5個值進行加權(quán)相加,得到m點的 x方向梯度。
[0036]同理,可得m點的y方向梯度。
[0037] 2.在圖像中定義一個8 X 8的塊,在這個塊內(nèi),對方向梯度做統(tǒng)計,按照0-180度,每 20度為一個單位,統(tǒng)計這個9個單位內(nèi)的權(quán)重。在統(tǒng)計時采用線性插值,如一個點的梯度為 23度,那么(23-20)/20 X梯度值得到值歸為20度至40度這個區(qū)間;
[0038] 3.以圖像中的每一個像素為中心,做一個32X32的矩陣,在這個矩陣中找到步驟1 計算得到的梯度的最大值vmax和最小值vmin。重新計算梯度權(quán)重為(v-vmin)/(vmax-vmin),以減少局部光照不均勻造成的梯度差異化過大,提高梯度描述的適應(yīng)性。
【主權(quán)項】
1. 一種用于描述圖像特征的多維方向梯度表示方法,包括: 1) 以圖像中每個像素點為中心分別定義A X A大小的矩陣,其中的A取3~30的奇數(shù); 2) 在步驟1)定義的每個矩陣中針對中心像素點計算1和7兩個方向的梯度; 3) 對步驟2)基于每個矩陣得到的梯度計算結(jié)果進行加權(quán)計算,得到每個矩陣針對其中 心像素點的X方向梯度和y方向梯度,即圖像中每個像素點都對應(yīng)得到1個X方向的梯度值和 1個y方向的梯度值; 4) 定義一個NXN大小的塊,所述的N取正整數(shù);在定義的塊內(nèi),將0-180度的范圍分為相 同角度的5-9個單位,采用線性插值統(tǒng)計每個單位內(nèi)的梯度權(quán)重; 5) 以圖像中的每個像素點為中心,做一個M X M的矩陣,其中M為步驟4)所述的N取值的 整數(shù)倍,在這個矩陣中找到梯度的最大值vmax和最小值vmin;重新計算梯度權(quán)重,計算方法 為:(v-vmin)/(vmax_vmin)〇2. 權(quán)利要求1所述的方法,其特征在于:步驟1)所述的AXA矩陣,A為5~15;優(yōu)選為5。3. 權(quán)利要求1所述的方法,其特征在于:步驟2)所述的在每個矩陣中針對中心像素點計 算X和y兩個方向的梯度,計算方法是:以中心像素點所在列為對稱軸計算每組對稱點之間 的像素值差;以中心像素點所在的行為對稱軸計算每組對稱點之間的像素值差。4. 權(quán)利要求1所述的方法,其特征在于:步驟3)所述的加權(quán)計算,是通過定義一個與步 驟1)所述矩陣相同大小的高斯核來完成所述的加權(quán)計算。5. 權(quán)利要求1所述的方法,其特征在于:步驟4)所述的N X N大小的塊,N取8。6. 權(quán)利要求1所述的方法,其特征在于:步驟4)是將所述的0-180度的范圍分為9個單 位,每個單位20度。7. 權(quán)利要求1所述的方法,其特征在于:步驟5)的M XM的矩陣,M取32。
【文檔編號】G06K9/46GK105913068SQ201610268754
【公開日】2016年8月31日
【申請日】2016年4月27日
【發(fā)明人】石柱國
【申請人】北京以薩技術(shù)股份有限公司