本發(fā)明涉及一種基于濾波器組的局部二值模式圖像描述方法,屬于圖像處理的技術(shù)領(lǐng)域。
背景技術(shù):
目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的一個重要研究課題,在智能視頻監(jiān)控、人機(jī)交互、視覺導(dǎo)航等許多領(lǐng)域有著廣泛的應(yīng)用。它處于整個視頻處理系統(tǒng)的最底層,是各種后續(xù)高級處理如目標(biāo)跟蹤、目標(biāo)分類、行為識別、場景理解等的基礎(chǔ)。目標(biāo)檢測是跟蹤系統(tǒng)的前段環(huán)節(jié),有效的檢測是保證后續(xù)的識別與跟蹤順利進(jìn)行的基礎(chǔ)和前提。
局部特征描述算子是作為目標(biāo)特征提取的重要組成部分,被越來越多的計算機(jī)視覺領(lǐng)域的學(xué)者們關(guān)注,其中局部二值模式(LBP)作為經(jīng)典的局部特征描述子尤為備受關(guān)注。LBP算子最初由Ojala等人引入并應(yīng)用于紋理特征描述,其具有簡單的原理、較低的計算復(fù)雜度、對諸如光照變化等因素影響造成的灰度變化的魯棒性等優(yōu)點(diǎn)。
近些年來眾多學(xué)者對LBP算子的改進(jìn)擴(kuò)展方法層出不窮,使得LBP特征的應(yīng)用領(lǐng)域也由最初的紋理分析進(jìn)一步擴(kuò)展到了人臉識別、性別識別、目標(biāo)檢測、目標(biāo)跟蹤、醫(yī)學(xué)圖像分析等等許多的應(yīng)用領(lǐng)域。
現(xiàn)有的LBP算子基本上都是面向原始圖像域像素進(jìn)行編碼,雖然已有大量的改進(jìn)工作,但是面對噪聲、光照等干擾時,還是很難保持特征提取的穩(wěn)定性。因此,存在局限。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的不足,提供一種基于濾波器組的局部二值模式圖像描述方法,解決以及減少表情、遮擋、光照等因素對人臉特征的影響,難保持特征提取的穩(wěn)定性的問題,以增強(qiáng)LBP描述子對圖像的表征能力。
本發(fā)明具體采用以下技術(shù)方案解決上述技術(shù)問題:
一種基于濾波器組的局部二值模式圖像描述方法,包括步驟:
步驟1、將輸入的人臉圖像進(jìn)行分塊獲得若干圖像塊,且相鄰圖像塊之間相互重疊;
步驟2、對所述每個圖像塊進(jìn)行基于濾波器組的卷積濾波處理,并分別對卷積濾波處理后的每個圖像塊進(jìn)行LBP編碼,獲得每個圖像塊的若干個FBLBP值;
步驟3、對每個圖像塊所得若干個FBLBP值進(jìn)行統(tǒng)計,獲得每種濾波器模式下的FBLBP直方圖特征,并按順序?qū)V波器組中所有濾波器模式下的FBLBP直方圖特征組合成該圖像塊的FBLBP直方圖特征;以及,依次提取每個圖像塊的FBLBP直方圖特征,并串聯(lián)起來構(gòu)成該人臉圖像的直方特征向量。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟1中相鄰圖像塊之間設(shè)置重疊率。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟2中濾波器組為棋盤格濾波器組。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟2中卷積濾波處理和LBP編碼,包括以下步驟:
將圖像塊中選取若干個局部子區(qū)域,利用濾波器組中的每種模式濾波器分別對局部子區(qū)域進(jìn)行卷積濾波;
利用LBP編碼方式對卷積濾波后的局部子區(qū)域進(jìn)行編碼,獲得每個局部子區(qū)域的FBLBP值;
利用所獲得局部子區(qū)域的FBLBP值代替該局部子區(qū)域,最終獲得圖像塊的若干個FBLBP值。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟2中對局部子區(qū)域進(jìn)行卷積濾波和LBP編碼,包括以下步驟:
步驟21、將所述局部子區(qū)域分割成一個若干個子塊窗口,其中每個子塊窗口包括若干個子塊;
步驟22、利用與所述窗口中的子塊相同大小的濾波器對窗口中的每個子塊進(jìn)行卷積濾波;
步驟23、利用LBP編碼方式對所得卷積濾波后的每個子塊進(jìn)行編碼,獲得每個子塊的FBLBP值;
步驟24、利用所獲得每個子塊的FBLBP值代替該子塊,最終獲得局部子區(qū)域的FBLBP值。
本發(fā)明采用上述技術(shù)方案,能產(chǎn)生如下技術(shù)效果:
本發(fā)明提供的基于濾波器組的局部二值模式圖像描述方法,將輸入的人臉圖像進(jìn)行分塊獲得若干圖像塊,使用濾波器組對圖像進(jìn)行卷積濾波處理,將局部圖像與濾波器組卷積獲得相應(yīng)的響應(yīng)代替像素來對圖像進(jìn)行編碼,并通過改變?yōu)V波器組的卷積核的大小來獲取圖像的多尺度信息。這種方法不僅包含了圖像的微觀結(jié)構(gòu)信息,而且還融合了宏觀特性,使LBP算子更具有魯棒性和抗干擾性。本發(fā)明方法可以準(zhǔn)確有效的實(shí)現(xiàn)人臉識別,在準(zhǔn)確性和可靠性上具有很大的優(yōu)勢。可以有效解決以及減少表情、遮擋、光照等因素對人臉特征的影響,難保持特征提取的穩(wěn)定性的問題,以增強(qiáng)LBP描述子對圖像的表征能力,所述方法可以應(yīng)用于人臉識別系統(tǒng)中,對人臉進(jìn)行準(zhǔn)確有效的識別。
附圖說明
圖1為本發(fā)明基于濾波器組的局部二值模式圖像描述方法的流程示意圖。
圖2為本發(fā)明中局部二值模式LBP描述方法的原理示意圖。
圖3為本發(fā)明中選取的局部子區(qū)域的原理示意圖。
圖4為本發(fā)明中9x9FBLBP編碼的原理示意圖。
圖5為本發(fā)明中特征提取的原理示意圖。
具體實(shí)施方式
下面結(jié)合說明書附圖對本發(fā)明的實(shí)施方式進(jìn)行描述。
如圖1所示,本發(fā)明設(shè)計了一種基于濾波器組的局部二值模式圖像描述方法,該方法具體包括以下步驟:
步驟1、將輸入的人臉圖像進(jìn)行分塊獲得若干圖像塊,且相鄰圖像塊之間相互重疊。把所有的人臉圖像歸一化為相同大小,根據(jù)實(shí)際需要,設(shè)定圖像塊的大小[BlockH,BlockW],然后將圖像劃分成多個不同的圖像塊ImgBlock1,ImgBlock2,ImgBlock3,...,ImgBlockN,且相鄰的兩個圖像塊之間相互重疊,優(yōu)選地,相鄰圖像塊之間設(shè)置有重疊率,所述重疊率為0.5。
步驟2、對所述每個圖像塊進(jìn)行基于濾波器組的卷積濾波處理,并分別對卷積濾波處理后的每個圖像塊進(jìn)行LBP編碼,獲得每個圖像塊的若干個FBLBP值,具體如下:
首先,濾波器組采用棋盤格濾波器組。棋盤格濾波器組是由一組具有不同尺度大小的卷積核的濾波器FB1,F(xiàn)B2,F(xiàn)B3,...,F(xiàn)BM組成的,即得到棋盤格濾波器組為{FBm},其中m=1,2,...,M?;谄灞P格濾波器組的LBP描述子是對LBP描述子的一種擴(kuò)展,它的基本思想是:將傳統(tǒng)LBP中的中心像素值與8鄰域像素值的比較擴(kuò)展為中心子圖像塊與濾波器卷積得到的響應(yīng)值與8-鄰域子圖像塊與濾波器的卷積響應(yīng)值的比較,得到一個FBLBP值,將得到的FBLBP值代替中心子圖像塊。FBLBP值的計算近似表達(dá)式可以通過公式(1)表示:
其中,conv 2(x)是卷積濾波函數(shù),ImBlockc為中心子圖像塊,ImBlocki(i=0,1,2,...,7)指的是周圍8-鄰域子圖像塊。
利用棋盤格濾波器組中的每種模式濾波器FBm(FB1,F(xiàn)B2,F(xiàn)B3,...,F(xiàn)BM)對已劃分的各個圖像ImgBlockn(ImgBlock1,ImgBlock2,ImgBlock3,...,ImgBlockN)分別進(jìn)行LBP編碼。
具體地,使用的濾波器組是一種棋盤格濾波器組,局部二值模式LBP是一種灰度圖像局部紋理描述子,其原理如圖2所示,它是在一個3x3的窗口內(nèi),根據(jù)中心像素點(diǎn)與8鄰域的像素值進(jìn)行比較,如圖中中心像素點(diǎn)值為90,左上角像素點(diǎn)值為95,95>90,因此將左上角像素點(diǎn)位置標(biāo)記為1,而中心點(diǎn)左側(cè)像素點(diǎn)值為80,80<90,故左側(cè)像素點(diǎn)位置標(biāo)記為0,圖中周圍8個像素點(diǎn)值與中心像素點(diǎn)值比較后,在對應(yīng)位置標(biāo)記0或1;然后根據(jù)一定的編碼方式進(jìn)行編碼,其按順時針,得到一個8位的二進(jìn)制序列,如圖2中的11000100二進(jìn)制序列;最后對此序列進(jìn)行二進(jìn)制編碼,得到一個無符號的值(0~255),該值即為中心像素點(diǎn)的FBLBP值。
然后按照上述原理,將圖像塊中選取NxN的局部子區(qū)域,將棋盤格濾波器組{FBm},其中m=1,2,...,M中的每種模式濾波器FBm分別對每個圖像塊ImgBlockn的局部子區(qū)域進(jìn)行卷積濾波,如圖3所示;再利用LBP編碼方式對卷積濾波后的局部子區(qū)域進(jìn)行編碼,獲得每個局部子區(qū)域的FBLBP值,如圖3中得到一個二進(jìn)制序列10100101組成的FBLBP值;利用所獲得局部子區(qū)域的FBLBP值代替該局部子區(qū)域,最終獲得圖像塊的若干個FBLBP值。
所述對局部子區(qū)域進(jìn)行卷積濾波和LBP編碼過程具體如下:
步驟21、將所述局部子區(qū)域分割成一個MxM的子塊窗口,其中相鄰窗口之間也是互相重疊的,且每個子塊窗口包括若干個子塊,如包括3x3個子塊。
步驟22、利用與所述窗口中的子塊相同大小的濾波器對窗口中的每個子塊進(jìn)行卷積濾波;
步驟23、利用LBP編碼方式對所得卷積濾波后的每個子塊進(jìn)行編碼,獲得每個子塊的FBLBP值;
步驟24、利用所獲得每個子塊的FBLBP值代替該子塊,最終獲得局部子區(qū)域的FBLBP值。
例如,如圖4所示,當(dāng)N=9,M=3時,對于圖像塊ImgBlockn中的一個9×9的局部子區(qū)域,將其分割為一個3×3的子塊窗口,窗口中每個子塊的大小為3×3,然后利用一個3×3大小的濾波器塊分別對子塊窗口中的每個子塊進(jìn)行卷積濾波,接著對濾波后的每個子塊計算FBLBP值,如對中心子塊進(jìn)行卷積濾波并通過積分圖計算得到FBLBP值;將計算得到FBLBP值分別代替每個子塊,最后得到一個3×3的FBLBP窗口,并利用LBP編碼方式對這FBLBP窗口進(jìn)行編碼,得到一個局部子區(qū)域的FBLBP值。如圖4中中心子塊的FBLBP值17與周圍8個子塊的FBLBP值比較,在對應(yīng)位置標(biāo)記0或1;然后根據(jù)一定的編碼方式進(jìn)行編碼(順時針),得到一個8位的二進(jìn)制序列,如圖4中的10011001二進(jìn)制序列,即為該一個局部子區(qū)域的FBLBP值。
步驟3、提取特征向量。具體包括步驟:
如圖5所示,對于每個圖像塊,對其所得若干個FBLBP值進(jìn)行統(tǒng)計,獲得每種濾波器模式下的FBLBP直方圖特征,即根據(jù)步驟2中單個濾波器的LBP模式下的FBLBP編碼值,通過統(tǒng)計每個圖像塊的FBLBP直方圖特征Fnm,然后按順序?qū)⒋?lián)棋盤格濾波器組中所有單個濾波器局部二值模式的直方圖特征組合便形成了該圖像塊的FBLBP直方圖特征{Fn1,F(xiàn)n2,F(xiàn)n3,...,FnM},最后按順序?qū)⑺械膱D像塊的FBLBP直方圖特征{Fn1,F(xiàn)n2,F(xiàn)n3,...,FnM}組合起來構(gòu)成該人臉圖像的FBLBP特征[{F11,F(xiàn)12,F(xiàn)13,...,F1M},{F21,F(xiàn)22,F(xiàn)23,...,F2M},...,{FN1,F(xiàn)N2,F(xiàn)N3,...,FNM}]。
最后,為了驗(yàn)證本方法可以對圖像進(jìn)行特征描述,對人臉進(jìn)行準(zhǔn)確有效的識別,特此列舉一試驗(yàn)例進(jìn)行驗(yàn)證說明,將方法用于人臉識別過程中,具體如下。
在三個標(biāo)準(zhǔn)人臉數(shù)據(jù)庫上對本發(fā)明提出的方法進(jìn)行測試,三個人臉庫分別是ORL人臉庫、AR人臉庫以及中科院的CAS-PEAL人臉庫。ORL人臉庫較為簡單,目前主流的人臉識別方法都能取得很高的識別精度。AR人臉庫是包含126個人,每人26幅,共大約3200幅人臉圖像。該庫中的人臉圖像經(jīng)過配準(zhǔn)處理,但是具有強(qiáng)烈的光照和表情變化,并部分圖像存在圍巾和墨鏡等明顯的遮擋物。CAS-PERL是由中科院建立的中國人臉數(shù)據(jù)庫。包括101人,每個人30幅,共3030幅人臉圖像。該數(shù)據(jù)庫中的人臉圖像未經(jīng)過嚴(yán)格配準(zhǔn),同樣存在明顯的光照和表情變化,但是其遮擋情況較AR庫要輕微。
在每次實(shí)驗(yàn)中,從人臉庫中隨機(jī)選取一定比例(10%~90%)的圖像作為訓(xùn)練樣本,余下的作為測試樣本,并通過SVM分類器實(shí)現(xiàn)人臉識別,根據(jù)交叉檢驗(yàn)原則得到最終的人臉識別精度。
在ORL人臉庫、AR人臉庫以及中科院的CAS-PEAL人臉庫,F(xiàn)BLBP人臉平均識別率分別達(dá)到了0.92、0.81和0.65以上,相比其他多種傳統(tǒng)局部模式描述子的平均人臉識別率更高。另外,又對AR人臉庫中的遮擋人臉進(jìn)行測試,F(xiàn)BLBP對遮擋人臉的平均率達(dá)到了0.626,遠(yuǎn)大約其他多種傳統(tǒng)局部模式描述子的平均人臉識別率。
綜上,本發(fā)明的方法不僅包含了圖像的微觀結(jié)構(gòu)信息,而且還融合了宏觀特性,使LBP算子更具有魯棒性和抗干擾性??梢詼?zhǔn)確有效的實(shí)現(xiàn)人臉識別,在準(zhǔn)確性和可靠性上具有很大的優(yōu)勢。
上面結(jié)合附圖對本發(fā)明的實(shí)施方式作了詳細(xì)說明,但是本發(fā)明并不限于上述實(shí)施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下做出各種變化。