本發(fā)明涉及人臉識別技術(shù),尤其是涉及一種基于關(guān)鍵點區(qū)域圖像的gabor-lbp人臉識別技術(shù)。
背景技術(shù):
在智能信息化時代,基于計算機的人臉識別應(yīng)用十分廣泛,如網(wǎng)上交易、自動考勤等。進(jìn)行人臉自動識別時,不同光照、不同面部表情、不同面部角度、人臉老化等因素仍然是人臉識別技術(shù)中的難點問題。這些不利因素往往同時存在,使得識別變得越發(fā)困難。
本文提出一種基于特征點區(qū)域的人臉識別技術(shù),該技術(shù)能有效克服上述不利因素?;谔卣鼽c的局部區(qū)域有兩個優(yōu)勢:(1)區(qū)分度比較好;(2)能有效抵抗人臉的變形、光照等不利因素的影響。另外,由于gabor小波和lbp(局部二進(jìn)制模式)是人臉識別中的兩種十分有效的特征提取技術(shù),因而本發(fā)明設(shè)計出基于關(guān)鍵點的gabor-lbp識別方法。sdm是一種有效的人臉特征點定位方法(xiong,xuehan,andfernandodelatorre."superviseddescentmethodanditsapplicationstofacealignment",cvpr,2013)。在訓(xùn)練好的模型上,sdm能定位出面部的49個關(guān)鍵點。
gabor濾波器能模擬人的感受野函數(shù),十分適合表達(dá)紋理圖像。二維gabor濾波器函數(shù)為:
lbp(localbinarypatterns,局部二進(jìn)制模式)是一種計算快速的紋理描述算子,它能有效的提取圖像局部的紋理信息。一個像素點的周圍若干區(qū)域稱為該像素點的局部區(qū)域,該點稱為中心點。該局部區(qū)域的所有像素與其中心像素的差值的二進(jìn)制編碼稱為“局部二進(jìn)制編碼”。用lbp(r,p)表示半徑為r、像素點個數(shù)為p的局部區(qū)域的二進(jìn)制模式,如lbp(2,8)。本發(fā)明采用lbp(2,8)來提取人臉的直方圖特征。
技術(shù)實現(xiàn)要素:
本發(fā)明的整體方案是:首先,對圖像進(jìn)行預(yù)處理,在預(yù)處理的圖像上定位若干特征點,并在這些特征點上提取出“局部小區(qū)域”;然后,將這些局部區(qū)域重新組合成一個新的圖像(稱為“關(guān)鍵區(qū)域圖像”),再用gabor小波將其分解為不同方向和不同尺度的特征圖像(稱為gabor子帶);緊接著,在每一個gabor子帶上,用lbp進(jìn)行提取特征,并計算出直方圖(本文稱為gabor-lbp特征);最后,用白化pca(wpca)對特征進(jìn)行壓縮并識別。
本發(fā)明的有效之處在于下面三方面:(1)gabor與lbp組合能有效提取人臉特征。gabor與lbp組合在文獻(xiàn)中已經(jīng)有報道,被稱為lgbphs方法。本發(fā)明在具體實現(xiàn)上采用了與lgbphs方法類似的操作。lgbphs方法對光照,簡單變性等有較好的魯棒性,但是對于極端光照變化,以及較大的面部變形(如夸張的表情、面部角度等導(dǎo)致)會明顯地影響lgbphs的識別效果;(2)“關(guān)鍵區(qū)域圖像”是基于局部區(qū)域的顯著圖像(也是本發(fā)明的創(chuàng)新之處)。文獻(xiàn)表明局部化的特征能有效抵抗光照、變形等不利因數(shù)。而且關(guān)鍵點區(qū)域是人臉中極具區(qū)分性的地方,比如不同人臉的“眼角”、“嘴角”等局部小區(qū)域有明顯的不同。(3)本發(fā)明將這些關(guān)鍵點局部區(qū)域重新組合為一張圖像(稱為“關(guān)鍵區(qū)域圖像”)以便更好地提取特征。為進(jìn)一步提升性能,我們將對“關(guān)鍵區(qū)域圖像”進(jìn)行分塊來提取gabor-lbp特征。
本發(fā)明方法描述如下:
步驟(1)人臉圖像預(yù)處理。
由于光照變化和圖像噪聲會影響識別準(zhǔn)確率,本發(fā)明用預(yù)處理去除光照影響和圖像噪聲。設(shè)輸入的人臉圖像為i,依次進(jìn)行下面兩方面的預(yù)處理,得到圖像ip1:
(1a)首先,用gamma矯正消除部分光照,gamma矯正是將像素的指數(shù)值替換本身的值,表示為:i=iλ,λ是矯正因子,這里取0.2。
(1b)其次,用直方圖規(guī)定化增強圖像。選取一副無光照和噪聲影響的正面圖像的直方圖作為參照,根據(jù)該參照人臉圖片將經(jīng)過gamma矯正后的圖像進(jìn)行規(guī)定化處理,進(jìn)一步去光照和噪聲影響,增強圖片效果。
步驟(2)建立“關(guān)鍵區(qū)域圖像”(ikey)
(2a)用sdm方法提取ip1圖像上的25個特征點。
(2b)對于25個點,以每個關(guān)鍵點為中心建立尺寸為m×m像素的局部矩形區(qū)域,這里m=22。
(2c)將25個局部區(qū)域組合成一個大小為5m×5m的圖像。當(dāng)m=22,則新圖像尺寸為110×110,稱這圖像為“關(guān)鍵區(qū)域圖像”,表示為ikey。
步驟(3)高斯差分算子(dog)濾波“關(guān)鍵區(qū)域圖像”ikey。
dog濾波的目的是進(jìn)一步消除圖像噪聲同時增強圖像邊緣,這步處理后的圖像表示為ip2。dog定義為:
步驟(4)用gabor將ip2分解為s尺度k方向分解,共產(chǎn)生s×k個子帶。這里s=4,k=6,即共產(chǎn)生24個子帶,這些子帶表示為
步驟(5)計算每一個gabor子帶的lbp直方圖。
(5a)將
(5b)對每個小塊區(qū)域的像素分別進(jìn)行l(wèi)bp算子的轉(zhuǎn)換,并計算該小塊區(qū)域的直方圖,然后將各個區(qū)域的直方圖串聯(lián)起來,構(gòu)建成一個全局性的直方圖。在這步得到的全局直方圖表示為hj,其中j=1,…,24。
步驟(6)用wpca特征變換。從步驟(5)得到的直方圖為人臉特征hj(j=1,…,24),這些直方圖特征維數(shù)較高,因此本發(fā)明用白化主成分分析(whitenedprincipalcomponentanalysis,wpca)降維。在這一步,通過wcpa變換,能得到維數(shù)更低、且更具有區(qū)分性能的人臉特征。根據(jù)人臉訓(xùn)練集的hj,得到基于pca正交特征投影矩陣u(u中每一列是特征值對應(yīng)的特征向量和特征向量對角矩陣
步驟(7)人臉識別。人臉識別主要是進(jìn)行兩個人臉特征向量直接的比較。本發(fā)明用余弦距離來度量兩張人臉圖像的相似程度。余弦值越小說明兩張人臉越不相似,當(dāng)接近1時說明兩張人臉來源于同一個人。假定
附圖說明
圖1是本發(fā)明中人臉特征提取和識別的流程圖。
圖2是建立“關(guān)鍵區(qū)域圖像”的示意圖。
具體實施方式
步驟(1)人臉圖像預(yù)處理。
由于光照變化和圖像噪聲會影響識別準(zhǔn)確率,本發(fā)明用預(yù)處理去除光照影響和圖像噪聲。設(shè)輸入的人臉圖像為i,依次進(jìn)行下面兩方面的預(yù)處理,得到圖像ip1:
(1a)首先,用gamma矯正消除部分光照,gamma矯正是將像素的指數(shù)值替換本身的值,表示為:i=iλ,λ是矯正因子,這里取0.2。
(1b)其次,用直方圖規(guī)定化增強圖像。選取一副無光照和噪聲影響的正面圖像的直方圖作為參照,根據(jù)該參照人臉圖片將經(jīng)過gamma矯正后的圖像進(jìn)行規(guī)定化處理,進(jìn)一步去光照和噪聲影響,增強圖片效果。
步驟(2)建立“關(guān)鍵區(qū)域圖像”(ikey)(參見圖2)
(2a)用sdm方法提取ip1圖像上的25個特征點。
(2b)對于25個點,以每個關(guān)鍵點為中心建立尺寸為m×m像素的局部矩形區(qū)域,這里m=22。
(2c)將25個局部區(qū)域組合成一個大小為5m×5m的圖像。當(dāng)m=22,則新圖像尺寸為110×110,稱這圖像為“關(guān)鍵區(qū)域圖像”,表示為ikey。
步驟(3)高斯差分算子(dog)濾波“關(guān)鍵區(qū)域圖像”ikey。
dog濾波的目的是進(jìn)一步消除圖像噪聲同時增強圖像邊緣,這步處理后的圖像表示為ip2。
步驟(4)用gabor將ip2分解為s尺度k方向分解,共產(chǎn)生s×k個子帶。這里s=4,k=6,即共產(chǎn)生24個子帶,這些子帶表示為
步驟(5)計算每一個gabor子帶的lbp直方圖。
(5a)將
(5b)對每個小塊區(qū)域的像素分別進(jìn)行l(wèi)bp算子的轉(zhuǎn)換,并計算該小塊區(qū)域的直方圖,然后將各個區(qū)域的直方圖串聯(lián)起來,構(gòu)建成一個全局性的直方圖。在這步得到的全局直方圖表示為hj,其中j=1,…,24。
步驟(6)用wpca特征變換。從步驟(5)得到的直方圖為人臉特征hj(j=1,…,24),這些直方圖特征維數(shù)較高,因此本發(fā)明用白化主成分分析(whitenedprincipalcomponentanalysis,wpca)降維。在這一步,通過wcpa變換,能得到維數(shù)更低、且更具有區(qū)分性能的人臉特征。根據(jù)人臉訓(xùn)練集的hj,得到基于pca正交特征投影矩陣u(u中每一列是特征值對應(yīng)的特征向量和特征向量對角矩陣
步驟(7)人臉識別。人臉識別主要是進(jìn)行兩個人臉特征向量直接的比較。本發(fā)明用余弦距離來度量兩張人臉圖像的相似程度。余弦值越小說明兩張人臉越不相似,當(dāng)接近1時說明兩張人臉來源于同一個人。假定