一種基于局部三值模式分層重構的人臉識別方法
【技術領域】
[0001] 本發(fā)明涉及一種基于局部三值模式分層重構的人臉識別方法,屬于圖像處理的技 術領域。
【背景技術】
[0002] 人臉識別作為近年來發(fā)展較為迅速的技術,各種新的研究理論層出不群,與此同 時,人臉識別在商業(yè)系統(tǒng)中也有成熟的應用,這是由于人臉識別作為一種生物特征識別技 術,具有實現(xiàn)成本低、隱蔽性強、復雜度低、可存儲等優(yōu)點,在門禁防盜系統(tǒng)、電子商務、刑偵 執(zhí)法等領域有較為深入的應用,隨著互聯(lián)網(wǎng)的不斷發(fā)展,人臉識別的應用前景也會越來越 廣泛。但絕大多數(shù)的識別算法都需要在特定的環(huán)境以及用戶進行配合的情況下完成,所以 不可控條件下的人臉識別逐步的受到學術界的重視。
[0003] 現(xiàn)有的識別技術研究種類較為復雜,從不同的角度出發(fā),對于識別技術的分類也 不盡相同。從特征提取的角度出發(fā),人臉識別的技術科分為如下幾類:
[0004] (1)基于幾何特征的人臉識別
[0005] 在人臉識別初期的發(fā)展中應用較廣,幾何特征一般是題取人臉的五官比如雙眼、 眉毛、下巴、嘴唇、鼻梁等,除此之外,也可取人臉上的一些明顯特征如傷疤、黑素細胞痣等 作為識別特征。基于幾何特征的方法復雜度不高,占用的空間也較小,但是在不可控條件如 光照、姿態(tài)發(fā)生變化下的識別效果不佳,以及幾何特征所攜帶的信息量不足,易被干擾等特 點。
[0006] (2)基于神經(jīng)網(wǎng)絡的人臉識別
[0007] 神經(jīng)網(wǎng)絡主要是將復雜度較高的函數(shù)映射通過數(shù)量較多的簡單函數(shù)映射互相連 接進而實現(xiàn),其實質是非線性且時間連續(xù)的自適應處理技術。其主要優(yōu)點是較強的學習處 理能力,能夠做到舉一反三,穩(wěn)健性較強且在處理過程中能夠實現(xiàn)自我創(chuàng)新?,F(xiàn)在基于神經(jīng) 網(wǎng)絡的技術理論越來越成為研究的熱點,取得的發(fā)展也較為迅速。神經(jīng)網(wǎng)絡適合處理一些 環(huán)境復雜、信息模糊不清、邏輯不十分明確、已知樣本損失畸變較為嚴重的難題,而不可控 條件下的人臉識別符合神經(jīng)網(wǎng)絡的處理方向。
[0008] (3)基于彈性圖匹配的人臉識別
[0009] 彈性圖匹配作為一種非靜態(tài)鏈接結構的算法,常用作人臉矩形稀疏表征,其主要 實現(xiàn)步驟為:首先取和輸入最接近的圖像,對圖中所以像素點完成最佳匹配,進而輸出已發(fā) 生改變的圖像,此時圖像的像素點逼近模型圖對應像素點的位置。其優(yōu)點是彈性圖匹配對 于人臉圖像的表情、年齡、形態(tài)等的變化具有一定的魯棒性。缺點也較為明確:因為需要處 理的數(shù)據(jù)量較大,所以其運行效率較低且占用空間較大,實時性較差。
【發(fā)明內容】
[0010] 針對現(xiàn)有技術的不足,本發(fā)明提供一種基于局部三值模式分層重構的人臉識別方 法。本發(fā)明的目的是為了提高人臉圖像在不可控條件下的識別可靠性,該方法對光照變化、 姿態(tài)變化下的人臉識別具有魯棒性。
[0011] 本發(fā)明的技術方案如下:
[0012] -種基于局部三值模式分層重構的人臉識別方法,包括以下步驟:
[0013] (1)將選取人臉庫分為訓練樣本以及測試樣本;
[0014] (2)對訓練樣本以及測試樣本做幾何裁剪以及光照預處理;
[0015] (3)將經(jīng)步驟(2)預處理后的樣本圖像引入灰度值,對所述樣本圖像進行二維坐 標標記,所述樣本圖像的灰度值和二維坐標組成三維信息量;
[0016] 將樣本圖像進行梯度分層:首先將樣本圖像的像素點以為3X3作為基本單元進 行劃分作為第一層像素層,自定義閾值為V,并將像素層的關鍵點像素灰度值c分別與邊界 的八個領域點灰度值b做對比:如果b大于c+v時,將對應領域點的值設置為1 ;如果b小 于c-v時,將對應領域點的值設置為-1 ;如果b介于c+v以及c-v之間,將對應領域點的值 設置為〇,將邊界領域的數(shù)值按自定義順序進行組合,即為所述關鍵點的特征描述;
[0017] 正負值編碼:若將樣本圖像的局部三值模式特征向量設為m,則子局部三值模式 正向量V+為向量m與同等位數(shù)的1做異或處理后的結果,子局部三值模式負向量V-是將 向量m與同等位數(shù)的-1做異或處理后的結果;
[0018] (4)取4X4的像素層作為單元層模塊,并將每個模塊里包含的特征向量按順序進 行組合形成單元層的特征描述:對該特征向量的梯度直方圖進行權重投影,梯度方向值小 于180時選幅值作為投影權重,反之將選幅值的平方根作為投影權重,并將樣本內所有特 征向量進行組合;
[0019] (5)將步驟(4)提取的特征向量投影到高維空間,求出該特征空間內的最佳投影 方向,即使得圖像矩陣類間散度與類內聚度的比值取到最大值,將空間內的圖像矩陣在求 出的最佳投影方向進行投影;
[0020] (6)提取測試樣本的特征向量,投影到步驟(5)求出的最佳投影方向,并求得測試 樣本以及訓練樣本之間余弦距離,并用"z-score"方法進行標準化后融合分類。
[0021] 根據(jù)本發(fā)明優(yōu)選的,所述步驟(2)中對圖像進行預處理的方法,包括:
[0022] 1)將訓練樣本和測試樣本幾何裁剪為像素為80X80的樣本;
[0023] 2)所述光照預處理包括伽馬校正、高斯差分濾波、對比度均衡化;所述伽
[0024] 馬校正包括將樣本矩陣對數(shù)變換后輸出樣本的結構信息,此時的輸出與
[0025] 光照成不相關,伽馬值取0. 3 ;
[0026] 對比度均衡化是將樣本的總體亮度以及對比度實現(xiàn)標準化,實現(xiàn)公式如下:
[0027]
[0028] 其中a= 0· 15,τ= 9。
[0029] 根據(jù)本發(fā)明優(yōu)選的,所述步驟(4)中樣本像素點水平以及垂直方向的梯度向量 為:
[0030] Px (x,y) =V(x+1,y)-v(χ-l,y)
[0031] Py (x,y) =V(x,y+1)-V(x,y-1)
[0032] 式中V(x,y)為樣本點(x,y)處的像素值,進一步得到像素點的梯度幅值以及方 向:
[0033]
[0034]dir(x,y) =arctan(Py (x,y) /Px (x,y))〇
[0035] 根據(jù)本發(fā)明優(yōu)選的,所述步驟(5)中高維特征空間內的最佳投影方向公式如下:
^ ?~1
[0036]
[0037]
[0038]
[0039] 式4
%特征空間的樣本均值,μ。為總體樣本均值,Ν為訓練樣本 數(shù);空間內的圖像矩陣X在F空間w方向的投影計算式為:
[0040]
[0041] 式中表示投影算子,為特征空間中樣本矩陣的線性組合。 Μ
[0042] 根據(jù)本發(fā)明優(yōu)選的,所述步驟(6)中余弦距離的計算公式為:
[0043]
[0044] 用"z-score"方法進行標準化:
[0045]
[0046] 式中μ,δ分別代表余弦距離s的均值以及標準差,最后采用最近鄰法分類。
[0047] 本發(fā)明的有益效果:
[0048] 本發(fā)明所述基于局部三值模式分層重構的人臉識別方法,結合了局部三值模式的 旋轉不變性以及特征重構對陰影、光照變化的魯棒性,對樣本圖像完成了分層自適應權重 的局部特征重構,最終輸出的特征具有高效性以及較強的抗干擾能力,在不可控條件下取 得了很好的識別效果。
【附圖說明】:
[0049] 圖1是0RL人臉庫原始圖像(上排)以及預處理后圖像(下排)的對比。
[0050] 圖2是樣本圖像分層結構示意圖。
[0051] 圖3是子局部模式正向量以及負向量生成流程。
[0052] 圖4是本發(fā)明所述人臉識別方法的具體流程圖。
【具體實施方式】:
[0053] 下面結合實施例和說明書附圖對本發(fā)明做詳細的說明,但不限于此。
[0054] 實施例1、
[0055] -種基于局部三值模式分層重構的人臉識別方法,包括以下步驟:
[0056] (1)將選取人臉庫分為訓練樣本以及測試樣本;
[0057] (2)對訓練樣本以及測試樣本做幾何裁剪以及光照預處理;
[0058] 所述步驟(2)中對圖像進行預處理的方法,包括:
[0059] 1)將訓練樣本和測試樣本