專利名稱:一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像目標(biāo)識別方法,特別是一種基于關(guān)鍵點的仿射不變 矩的目標(biāo)識別方法。
背景技術(shù):
在目標(biāo)識別、遙感圖像幾何校正、圖像檢索等許多智能圖像處理領(lǐng)域, 需要從多幅不同視點獲取的圖像中提取相同的特征量,并以此特征量作為后 續(xù)處理的基礎(chǔ)。由于大部分視點變化情況下獲取的圖像之間的關(guān)系可以用仿 射變換來近似,因此提取仿射不變特征成為了眾多技術(shù)領(lǐng)域的共性問題。
目前研究圖像仿射不變特征量已經(jīng)成為圖像目標(biāo)識別的核心問題之一, 學(xué)者們在計算機視覺研究中提出了許多圖像仿射不變特征的理論和提取方 法,應(yīng)用于圖像目標(biāo)識別上取得了不錯的效果。隨著研究不斷深入,更多新 的圖像仿射不變特征提取方法不斷被應(yīng)用于圖像目標(biāo)識別,例如基于邊界,
基于角點的局部仿射特征,以及分類器的使用,BP神經(jīng)網(wǎng)絡(luò)、貝葉斯分類 器等,都被廣泛應(yīng)用到目標(biāo)識別中。
但是,當(dāng)前的仿射不變矩仍然存在這一些不足,例如,針對目標(biāo)提取中 可能出現(xiàn)物體輪廓分割不完整和有噪點污染的情況下沒有很好的抗噪能力, 若具備很好的抗噪能力又會帶來計算量大和算法復(fù)雜的代價。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題克服現(xiàn)有技術(shù)的不足,提出的一種基于關(guān)鍵點 的仿射不變矩的目標(biāo)識別方法,能夠解決在目標(biāo)提取中可能出現(xiàn)物體輪廓分 割不完整和有噪點污染的情況下仍有很好的抗噪能力,并且減小的計算復(fù)雜 度和計算量,使目標(biāo)識別有更好的效果。
本發(fā)明的技術(shù)解決方案 一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方法
5包括以下步驟
(1) 圖像預(yù)處理對原始采集圖像進行處理,以減少噪聲等無效信息 對后續(xù)處理的影響,增強有用信息,提高圖像對比度;
(2) 主輪廓提取對目標(biāo)邊緣圖像進行主輪廓的提取,得到外輪廓的 邊緣圖像,過濾掉內(nèi)部的輪廓,和一些無用的輪廓分支;
(3) 關(guān)鍵幀提取以分割出來的目標(biāo)灰度圖像為基礎(chǔ),首先計算出目 標(biāo)的質(zhì)心,然后以質(zhì)心為擴展點向周圍引伸出多條射線,尋找每條射線方向 上的最近灰度極值點,將所有灰度極值點當(dāng)作關(guān)鍵點集合;
(4) 仿射不變特征提取提取出目標(biāo)主輪廓的仿射不變特征,并計算 多階的仿射不變矩向量;
(5) 目標(biāo)識別通過步驟(4)中提出的特征來識別目標(biāo),輸出識別結(jié)果。
其中,所述步驟l圖像預(yù)處理包括對輸入圖像進行灰度變換,平滑去噪 處理和灰度拉伸處理。
其中,所述步驟2主輪廓提取步驟如下
(1) 首先,自動獲取初始化輪廓,對圖像作筒單的閾值分割,得到目 標(biāo)區(qū)的外接矩形,每隔若干個像素取一點,作為初始輪廓;
(2) 計算動態(tài)輪廓的中心;
(3) 對所有輪廓控制點用如下公式進行計算,并移動它們到鄰域能量 最小位置
& = "(/)£intl(j.) +外〕U力+ ,(/)五,(力+ "(0五力,)
(4) 統(tǒng)計動態(tài)輪廓中控制點移動的數(shù)目,即能量最小位置不是原控制 點位置的點數(shù);
(5) 如果平均距離大于上次迭代的平均距離或過于小,則調(diào)整控制點間距;
(6) 計算各控制點曲率;
(7) 若控制點移動的數(shù)目小于閾值、總能量E出現(xiàn)周期性波動或者達 到最大迭代次數(shù),則結(jié)束;
(8) 重復(fù)上述(2) — (7)。
其中,所述步驟3關(guān)鍵幀提取按照步驟進行
(1) 選擇質(zhì)心作為第一關(guān)鍵點;
(2) 以質(zhì)心為擴展點向周圍引伸出多條射線,尋找每條射線方向上的 最近灰度極值點,將所有灰度極值點當(dāng)作關(guān)鍵點集合;
(3) 再將各點連接到閉合區(qū)域,得到關(guān)鍵點集合。
所述步驟4仿射不變矩特征提取是在步驟3提取出的關(guān)鍵點集合上按照 如下公式計算多階仿射不變矩
細(xì)g-£咖}
~^-= M0)
鄉(xiāng))
其中M(!')稱之為!'階仿射不變矩,2是關(guān)鍵點集合。
其中,所述步驟5目標(biāo)識別包括離線訓(xùn)練和在線識別兩個部分,其中離
線訓(xùn)練使用大量的訓(xùn)練樣本得到訓(xùn)練模型;在線識別是輸入的單個圖像,經(jīng) 過各種圖像處理方法后,進入各個模型識別,分別計算得到各個對應(yīng)匹配度, 匹配度最高的目標(biāo)模型即為識別結(jié)果。 本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點在于
(1)原始圖像因受環(huán)境因素干擾,甚至有時識別目標(biāo)區(qū)域的對比度較 小,光照不均勻,樹木的搖晃等因素都使得圖像質(zhì)量很難保證,本發(fā)明的優(yōu) 點在于運用圖像預(yù)處理技術(shù)灰度化,平滑去噪和灰度拉伸作為圖像的后處理,使得后續(xù)是別的準(zhǔn)確率提高。
(2) 傳統(tǒng)的主輪廓提取方法受圖像的質(zhì)量和背景影響較大,雖然定位
率比較高,但是無用的邊緣信息和空洞過多,本發(fā)明的優(yōu)點在于去除了其他 的無用輪廓信息給后面的識別帶來的影響,綜合利用目標(biāo)邊緣與顏色信息, 得到了更高的定位率和適應(yīng)性。
(3) 傳統(tǒng)的以仿射不變矩為特征的目標(biāo)識別,通常采用全局仿射不變 矩特征,全局特征可以較好地解決由于圖像存在仿射變換而導(dǎo)致的同 一 目標(biāo) 的一致性判決問題,但如果圖像發(fā)生遮障等局部信息變化,基于全圖信息的 特征也會隨之發(fā)生變化,對目標(biāo)識別,圖像匹配可能產(chǎn)生不良影響。本發(fā)明 采用基于關(guān)鍵點的局部仿射不變矩特征,較好地克服特征受到局部干擾的問 題,特別是當(dāng)目標(biāo)處于被遮擋或者所處背景有較大變化的情況下進行目標(biāo)識 別的有效工具。
(4) 整合圖像預(yù)處理、車輛主輪廓提取、車輛仿射不變特征提取,隱 爾可夫模型的識別等方法,實現(xiàn)了車輛自動識別系統(tǒng),該系統(tǒng)具備識別準(zhǔn)確 率高,識別速度快,且具有較強的光照適應(yīng)性。
(5) 本發(fā)明具有較高的實時性和處理速度,本發(fā)明算法簡潔、實用, 有較高的效率。
圖1為本發(fā)明的基于關(guān)鍵點仿射不變矩的目標(biāo)識別流程圖; 圖2為本發(fā)明的圖像預(yù)處理流程圖; 圖3為本發(fā)明的主廓提取流程圖; 圖4基于關(guān)鍵點的仿射不變矩提取流程圖 圖5為本發(fā)明的目標(biāo)識別流程圖; 圖6為兩種不同車輛矩值曲線圖;
具體實施例方式
下面結(jié)合車輛識別的過程對本算法提出的方法作進一步說明本發(fā)明一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方法,如圖l所示,其
具體包含如下步驟
第一步,圖像預(yù)處理,如圖2所示對原始采集圖像進行處理包括灰度 化,平滑去噪和灰度拉伸。
灰度化將采集到的車輛彩色圖像,通過如下公式進行灰度化處理。其 中R,G,B分別表示紅,綠,藍(lán)三基色。
Gra少=0.233i + 0.587G + 0.1145
平滑去噪本發(fā)明采用核大小為3*3的高斯平滑處理,通過采樣2維高 斯函數(shù)得到,可以有效地消除噪聲,提高目標(biāo)定位率。
灰度拉伸本發(fā)明采用線性灰度拉伸的辦法將灰度值擴充到0~255的范 圍,使得該范圍內(nèi)的像素,亮的越亮,暗的越暗,從而達到增強對比度的目 的。通過如下公式進行灰度拉伸處理。圖像中大部分像素的灰度級集中在 [",W范圍內(nèi),相對少數(shù)的像素的灰度級超過此范圍,并且可以忽略。
W 一附
7-x[/(x,力-a] + m (a《/0,;/)《6)
6 — a
'附 (/0,>0<a)
" (/0,力>6)
第二步,主輪廓提取,如圖3所示:本發(fā)明采用改進的Kass算法進行 輪廓提取,再采用Auto-Snake算法進行主輪廓提取,并引入反映全局灰度 統(tǒng)計結(jié)果的外加強制力。
整個主輪廓提耳又的過程為
1) 首先,自動獲取初始化輪廓,初始化參量",/ ,7,"對圖像作簡單的閾 值分割,得到目標(biāo)區(qū)的外接矩形,每隔4個像素取一點,作為初始輪廓
S = (Vl,v2,...v ),對所有控制點。
2) 計算動態(tài)輪廓的中心c《,尺),、=^ x, , _yc="_1l>,。
i i
3) 對所有輪廓控制點用如下公式進行計算,并移動它們到鄰域能量最小
9廓控制點的個數(shù),y表示輪廓點鄰域尺寸的大小。
A = "(0£intl +外')&。(力+())+一風(fēng)(力
4) 統(tǒng)計動態(tài)輪廓中控制點移動的數(shù)目,即能量最小位置不是原控制點 位置的點數(shù)。
5) 如果平均距離大于上次迭代的平均距離或過于小,則調(diào)整控制點間距。
6) 計算各控制點曲率,決定下一次迭代的〃值。
7) 若控制點移動的數(shù)目pstmoved小于閾值、總能量E出現(xiàn)周期性波動 或者達到最大迭代次數(shù),則結(jié)束。
8) 重復(fù)2-7。
第三步,關(guān)鍵點提取,如圖4所示關(guān)鍵點是圖像的一種重要局部特征, 保留了圖像中物體的重要特征信息的同時有效地減少了數(shù)據(jù)量,使得對圖像 處理時運算量大大減少,由于關(guān)鍵點集中了圖像上的很多重要的形狀信息, 具有旋轉(zhuǎn)不變性,因此關(guān)鍵點幾乎不受光照條件的影響。關(guān)鍵點一般包括圖 像中具有周圍灰度變化劇烈特征的點。
本發(fā)明的關(guān)鍵點的提取過程為
1 )以分割出來的物體灰度圖像為基礎(chǔ),首先計算出物體的質(zhì)心,通過 如下公式。其中/表示坐標(biāo)為(x,力的點的灰度值。
「x》"力,'一 s》",力
2)計算灰度極值點,計算灰度極值點的公式如下。其中t表示射線的 長度,Io是質(zhì)心的灰度值,d是一個較小的整數(shù)防止分母為零,由此得到構(gòu) 造仿射不變區(qū)域的方法以質(zhì)心為中心向各個方向作射線,在每條射線上沿 發(fā)散方向?qū)ふ疑鲜降淖罱叶葮O值點。3)再將UO點依次連接得到閉合區(qū)域。然后在對應(yīng)的仿射變換后的圖
像中,按照上述方法得到閉合區(qū)域,在經(jīng)過質(zhì)心的任意一條直線上/(o上都
有的兩個最近灰度極值點,這二個點的坐標(biāo)在圖像仿射變換前后幾何拓樸關(guān)
系不變,文中K。的集合就是要找的關(guān)鍵點的集合Q。
第四步,仿射不變特征提取通過關(guān)鍵點集合Q組成的封閉區(qū)域,通過 如下公式計算其仿射不變特征值,對于相同的目標(biāo)或者同類的目標(biāo),它們的
仿射不變特征值將維持在一個特定的范圍內(nèi)。下式中,^(0表示i階仿射不 變矩的特征值。
組—娜}=聰 五(0
第五步,目標(biāo)識別,如圖5所示本發(fā)明利用隱馬爾可夫模型來進行目 標(biāo)識別。采用嵌入式隱馬爾可夫模型提取目標(biāo)特征,取6個超狀態(tài)對目標(biāo)圖 像的由上到下劃分的不同位置,分別描述和代表目標(biāo)類型的宏觀特征,每個 超狀態(tài)內(nèi)嵌入的7個狀態(tài)分別描述車輛類型l-7階仿射不變矩,如圖6和表 l所示。表1為兩種不同車輛的1-7階矩值
矩值KlK2K3K4K5K6K7
車輛l (小轎車)1.5622.9571.8936.3792.79811.0564.466
車輛2 (中巴)1.2720.8032.4773.6014.卯33.0679.603
差值0.2卯02.1540.5842,7882.1057.9895.137
表1
在訓(xùn)練好若干車型的隱馬爾可夫模型(HMM),才能進行車型的識別。假 定車型庫中己有K個訓(xùn)練好的隱馬爾可夫模型,識別過程如下
1 )首先根據(jù)前面講述的提取出要識別的車輛的仿射不變特征向量。
ii2 )然后計算此車輛的觀察向量序列與車型數(shù)據(jù)庫中各個車型的隱馬爾
可夫才莫型相似的或然率p(cm;i),相似的或然率ixoi;i)可以通過前向-后向算 法或者Viterbi算法得出。
3)相似或然率反映了待識車型觀察向量序列與數(shù)據(jù)庫中的車型隱馬爾 可夫模型的相似程度,這就是說,如果p(o i A ), / e (1,2,.. 1)在1々),a: e (1,2,.. 1) 中值最大,那么/l,就是與待識人臉最接近的人臉隱馬爾可夫模型。至此,識 別結(jié)束。
本發(fā)明說明書中未作詳細(xì)描述的內(nèi)容屬于本領(lǐng)域?qū)I(yè)^支術(shù)人員公知的 現(xiàn)有技術(shù)。
盡管為說明目的公開了本發(fā)明的最佳實施例和附圖,但是本領(lǐng)域的技術(shù) 人員可以理解在不脫離本發(fā)明及所附的權(quán)利要求的精神和范圍內(nèi),各種替 換、變化和修改都是可能的。因此,本發(fā)明不應(yīng)局限于最佳實施例和附圖所 公開的內(nèi)容。
權(quán)利要求
1、一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方法,其特征在于包括以下步驟(1)圖像預(yù)處理對原始采集圖像進行處理,以減少噪聲等無效信息對后續(xù)處理的影響,增強有用信息,提高圖像對比度;(2)主輪廓提取對目標(biāo)邊緣圖像進行主輪廓的提取,得到外輪廓的邊緣圖像,過濾掉內(nèi)部的輪廓,和一些無用的輪廓分支;(3)關(guān)鍵幀提取以分割出來的目標(biāo)灰度圖像為基礎(chǔ),首先計算出目標(biāo)的質(zhì)心,然后以質(zhì)心為擴展點向周圍引伸出多條射線,尋找每條射線方向上的最近灰度極值點,將所有灰度極值點當(dāng)作關(guān)鍵點集合;(4)仿射不變特征提取提取出目標(biāo)主輪廓的仿射不變特征,并計算多階的仿射不變矩向量;(5)目標(biāo)識別通過步驟(4)中提出的特征來識別目標(biāo),輸出識別結(jié)果。
2、 根據(jù)權(quán)力要求1所述的一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方 法,其特征在于所述步驟(l)圖像預(yù)處理包括對輸入圖像進行灰度變換, 平滑去噪處理和灰度拉伸處理。
3、 根據(jù)權(quán)力要求1所述的一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方 法,其特征在于所述步驟(2)主輪廓提取步驟如下1) 首先,自動獲取初始化輪廓,對圖像作簡單的閾值分割,得到目標(biāo) 區(qū)的外接矩形,每隔若干個像素取一點,作為初始輪廓;2) 計算動態(tài)輪廓的中心;3) 對所有輪廓控制點用如下公式進行計算,并移動它們到鄰域能量最小位置A = "(Wmtl (力++ (力+ cr(',K (力4) 統(tǒng)計動態(tài)輪廓中控制點移動的數(shù)目,即能量最小位置不是原控制點 位置的點數(shù);5) 如果平均距離大于上次迭代的平均距離或過于小,則調(diào)整控制點間距;6) 計算各控制點曲率;7) 若控制點移動的數(shù)目小于閾值、總能量E出現(xiàn)周期性波動或者達到 最大迭代次數(shù),則結(jié)束;8) 重復(fù)上述2) —7)。
4、 根據(jù)權(quán)力要求1所述的一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方 法,其特征在于所述步驟(3)關(guān)鍵幀提取按照步驟進行1) 選擇質(zhì)心作為第一關(guān)鍵點;2) 以質(zhì)心為擴展點向周圍引伸出多條射線,尋找每條射線方向上的最 近灰度極值點,將所有灰度極值點當(dāng)作關(guān)鍵點集合;3) 再將各點連接到閉合區(qū)域,得到關(guān)鍵點集合。
5、 根據(jù)權(quán)力要求1所述的一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方 法,其特征在于所述步驟(4)仿射不變矩特征提取是在步驟(3)提取出 的關(guān)鍵點集合上按照如下公式計算多階仿射不變矩鄉(xiāng))其中M(,)稱之為/階仿射不變矩,e是關(guān)鍵點集合。
6、根據(jù)權(quán)力要求i所述的一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方法,其特征在于所述步驟(5)目標(biāo)識別包括離線訓(xùn)練和在線識別兩個部 分,其中離線訓(xùn)練使用大量的訓(xùn)練樣本得到訓(xùn)練模型;在線識別是輸入的單 個圖像,經(jīng)過各種圖像處理方法后,進入各個模型識別,分別計算得到各個 對應(yīng)匹配度,匹配度最高的目標(biāo)模型即為識別結(jié)果。
全文摘要
一種基于關(guān)鍵點的仿射不變矩的目標(biāo)識別方法,步驟如下(1)圖像預(yù)處理對原始采集圖像進行處理,減少噪聲等無效信息對后續(xù)處理的影響,增強有用信息,提高圖像對比度;(2)主輪廓提取對目標(biāo)邊緣圖像進行主輪廓的提取,得到外輪廓的邊緣圖像,過濾掉內(nèi)部的輪廓,和無用的輪廓分支;(3)關(guān)鍵幀提取以分割出來的目標(biāo)灰度圖像為基礎(chǔ),首先計算目標(biāo)的質(zhì)心,然后以質(zhì)心為擴展點向周圍引伸出多條射線,尋找每條射線方向上最近灰度極值點,將所有灰度極值點當(dāng)作關(guān)鍵點集合;(4)仿射不變特征提取提取出目標(biāo)主輪廓的仿射不變特征,計算多階仿射不變矩向量;(5)目標(biāo)識別通過步驟(4)中提出的特征來識別目標(biāo),輸出識別結(jié)果。
文檔編號G06K9/00GK101464948SQ20091007636
公開日2009年6月24日 申請日期2009年1月14日 優(yōu)先權(quán)日2009年1月14日
發(fā)明者龐心琪, 超 李, 璋 熊, 謝舒翼, 奇 魏 申請人:北京航空航天大學(xué)