基于自適應(yīng)閾值調(diào)整拒識(shí)子空間學(xué)習(xí)的人臉檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明設(shè)及計(jì)算機(jī)視覺(jué)、模式識(shí)別和機(jī)器學(xué)習(xí)等技術(shù)領(lǐng)域,特別是設(shè)及了一種基 于自適應(yīng)闊值調(diào)整拒識(shí)子空間學(xué)習(xí)的人臉檢測(cè)方法。
[000^ 背景
[0003] 人臉檢測(cè)的目的是在圖像或視頻中自動(dòng)判定人臉是否出現(xiàn)W及人臉出現(xiàn)的位置、 大小W及姿態(tài)等。人臉檢測(cè)是計(jì)算機(jī)視覺(jué)和人臉研究中一個(gè)非常重要的研究?jī)?nèi)容,其在智 能圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)、智能視頻監(jiān)控等眾多研究和應(yīng)用領(lǐng)域都有著重要的研究 意義和廣泛的應(yīng)用價(jià)值,人臉檢測(cè)技術(shù)也受到了眾多研究人員和公司部分的廣泛關(guān)注和發(fā) 展。雖然人臉檢測(cè)得到了很多的關(guān)注和研究,魯邦性的人臉檢測(cè)一直是一個(gè)非常艱巨和富 于挑戰(zhàn)性的課題,運(yùn)主要體現(xiàn)在W下幾個(gè)方面:現(xiàn)實(shí)中的人臉往往存在許多差異,如姿態(tài)的 變化(正面臉和側(cè)面臉等)、表情的變化(如嚴(yán)肅和大笑等)W及容貌上的差異(如亞洲人種 和歐洲人種的差異)等等;由于拍照條件和環(huán)境的變化引入的影響,如不同的光照條件(強(qiáng) 光照和弱光照)和人臉的遮擋(眼睛、口罩)等;實(shí)時(shí)性人臉檢測(cè),由于無(wú)法準(zhǔn)確的確定人臉 的位置和大小,人臉檢測(cè)算法通常采取滑動(dòng)窗口的方法進(jìn)行判斷,該方法需要掃描海量的 候選窗口,對(duì)實(shí)時(shí)性的人臉檢測(cè)帶來(lái)了很大的負(fù)擔(dān)。
[0004] 目前關(guān)于人臉檢測(cè)問(wèn)題人們提出過(guò)很多解決方案,運(yùn)其中基于學(xué)習(xí)的方法在人臉 檢測(cè)領(lǐng)域取得了很好的效果,特別是基于統(tǒng)計(jì)特征的方法。該類(lèi)方法旨在從大量訓(xùn)練數(shù)據(jù) 中挖掘出類(lèi)別本身的統(tǒng)計(jì)特性,并利用學(xué)習(xí)得到的統(tǒng)計(jì)特性對(duì)新樣本進(jìn)行分類(lèi),其中最具 代表性的人臉檢測(cè)模型是Viola Jones于2001年提出的級(jí)聯(lián)Boosting分類(lèi)器人臉檢測(cè)模 型,該人臉檢測(cè)模型主要有W下Ξ個(gè)特點(diǎn):利用積分圖像和Haar特征進(jìn)行快速的特征計(jì)算; 利用Boosting算法進(jìn)行特征選擇和弱分類(lèi)器學(xué)習(xí);利用級(jí)聯(lián)檢測(cè)器框架有效的拒絕大量非 人臉窗口。該框架在提高檢測(cè)精度的同時(shí)達(dá)到了實(shí)時(shí)性的檢測(cè)要求,也得到研究人員和公 司的廣泛發(fā)展和應(yīng)用。雖然級(jí)聯(lián)Boosting分類(lèi)器具有優(yōu)異的性能和快速的檢測(cè)速度,該類(lèi) 方法中每一層強(qiáng)分類(lèi)器僅是一個(gè)二值分類(lèi)器(人臉窗輸出為1、非人臉窗輸出為0),并將所 有的人臉窗口和錯(cuò)分的非人臉窗口都放到下一層去繼續(xù)訓(xùn)練,運(yùn)種策略限制了人臉檢測(cè)模 型的靈活性,人臉檢測(cè)模型訓(xùn)練起來(lái)也非常復(fù)雜和耗時(shí),最終得到的人臉檢測(cè)模型往往層 數(shù)很多。如何縮減人臉檢測(cè)模型的復(fù)雜度,提高人臉檢測(cè)模型的靈活性仍是一個(gè)亟待解決 的問(wèn)題。
【發(fā)明內(nèi)容】
[0005] 為了解決復(fù)雜度和靈活性的問(wèn)題,本發(fā)明提出一種基于自適應(yīng)闊值調(diào)整拒識(shí)子空 間學(xué)習(xí)的人臉檢測(cè)方法,有效地縮減了人臉檢測(cè)模型的復(fù)雜度,提高了人臉檢測(cè)模型的靈 活性。
[0006] 本發(fā)明提出的基于自適應(yīng)闊值調(diào)整拒識(shí)子空間學(xué)習(xí)的人臉檢測(cè)方法,包括如下步 驟:
[0007] 步驟S1,采集人臉和非人臉圖像,并將所有圖像進(jìn)行灰度處理,將圖像尺寸縮放至 統(tǒng)一像素大小A,構(gòu)成訓(xùn)練樣本集合;其中人臉圖像為正樣本、非人臉圖像為負(fù)樣本;
[000引步驟S2,利用步驟S1中的訓(xùn)練樣本集合,采用Boosting算法和互信息最大化準(zhǔn)則 訓(xùn)練人臉檢測(cè)模型中第k層的強(qiáng)分類(lèi)器;
[0009] 步驟S3,計(jì)算修正的互信息,利用修正的互信息最大化學(xué)習(xí)準(zhǔn)則自適應(yīng)的調(diào)整人 臉檢測(cè)模型中第k層強(qiáng)分類(lèi)器的最優(yōu)拒識(shí)闊值,得到帶拒識(shí)的強(qiáng)分類(lèi)器;
[0010] 步驟S4,利用步驟S3中已訓(xùn)練完成的前k層強(qiáng)分類(lèi)器,在訓(xùn)練集上篩選出拒識(shí)的樣 本作為第k+1層分類(lèi)器的訓(xùn)練樣本;
[0011] 步驟S5,重復(fù)步驟S2至S4直至滿(mǎn)足收斂性條件;
[0012] 步驟S6,給定待檢測(cè)的圖像,構(gòu)建圖像金字塔將待檢測(cè)圖像大小縮放至A,并在圖 像金字塔的每一層滑動(dòng)窗口采樣,利用訓(xùn)練得到的每一層帶拒識(shí)的強(qiáng)分類(lèi)器對(duì)每一個(gè)采樣 窗口進(jìn)行判定,并將判定為人臉的采樣窗口還原到待檢測(cè)的圖像上,通過(guò)對(duì)待檢測(cè)的圖像 上所有人臉窗口進(jìn)行聚類(lèi)得到最終的人臉檢測(cè)結(jié)果。
[0013] 優(yōu)選的,步驟S1中正樣本為不同光照、不同姿態(tài)情況下的人臉圖像;負(fù)樣本采集方 式為先采集一個(gè)負(fù)樣本子集進(jìn)行訓(xùn)練,對(duì)采用通過(guò)步驟S2至S5訓(xùn)練好的人臉檢測(cè)模型進(jìn)行 測(cè)試,將人臉檢測(cè)模型誤檢的負(fù)樣本對(duì)象進(jìn)行增量采集加入負(fù)樣本集中,通過(guò)N次反復(fù)訓(xùn)練 和測(cè)試得到最終的負(fù)樣本集合。
[0014] 優(yōu)選的,步驟S2中,人臉檢測(cè)模型中每層的強(qiáng)分類(lèi)器均由弱分類(lèi)器W構(gòu)成,利用 Boosting算法和互信息最大化準(zhǔn)則訓(xùn)練人臉檢測(cè)模型中第k層的強(qiáng)分類(lèi)器步驟如下:
[0015] 步驟S21,選取化ar特征,利用總體互信息最大化準(zhǔn)則進(jìn)行弱分類(lèi)器W的學(xué)習(xí),選取 互信息最大的闊值為當(dāng)前弱分類(lèi)器的闊值;
[0016] 步驟S22,利用S21所述方法計(jì)算得到每一個(gè)化ar特征對(duì)應(yīng)的弱分類(lèi)器及其對(duì)應(yīng)的 互信息值,選取互信息值最大的弱分類(lèi)器為當(dāng)前迭代輪的弱分類(lèi)器wt;
[0017] 步驟S23,根據(jù)樣本在弱分類(lèi)器wt下的輸出值設(shè)定樣本權(quán)重,樣本權(quán)重計(jì)算公式為
[001 引
[0019] 其中,似嗦示t-1輪迭代后樣本i的權(quán)重,L康示樣本i的真實(shí)類(lèi)別,ht(xi)為樣本i 的預(yù)測(cè)類(lèi)別,Zt為歸一化因子;
[0022] 步驟S24,重復(fù)步驟S21-S23直至滿(mǎn)足收斂性條件。
[0023] 優(yōu)選的,步驟S3中,計(jì)算修正的互信息,利用修正的互信息最大化學(xué)習(xí)準(zhǔn)則自適應(yīng) 的調(diào)整人臉檢測(cè)模型中第k層強(qiáng)分類(lèi)器的最優(yōu)拒識(shí)闊值的步驟如下:
[0024] 步驟S31,計(jì)算每個(gè)樣本在第k層強(qiáng)分類(lèi)器下的輸出值Fi,并設(shè)定強(qiáng)分類(lèi)器的正、負(fù) 樣本的初始拒識(shí)闊值化1、化2 ;
[0025]
[0026] 其中Τ為當(dāng)前強(qiáng)分類(lèi)器包含的弱分類(lèi)器總數(shù);
[0027] 步驟S32,利用非參數(shù)估算方法估計(jì)正、負(fù)樣本輸出值的條件概率密度;
[002引步驟S33,計(jì)算修正的互信息,求解修正的互信息關(guān)于參數(shù)化1,化2的一階導(dǎo)數(shù),利 用擬牛頓法迭代求解互信息最大化問(wèn)題,得到最優(yōu)的拒識(shí)闊值。
[0029]優(yōu)選的,步驟S32中采用的非參數(shù)估計(jì)方法為化rzen窗法,利用該方法估算正、負(fù) 樣本的條件概率密度= Z μ = +1)和口w(z) = = Z11 = -1),其估算公式如下
[0032] 其中為正樣本的條件概率密度,斯(Z)為負(fù)樣本的條件概率密度,G( ·,σ2) 表示高斯核函數(shù),σ表示窗寬。
[0033] 優(yōu)選的,所述的窗寬σ采用大拇指準(zhǔn)則進(jìn)行估算。
[0034] 優(yōu)選的,步驟S4中,篩選第k+1層的訓(xùn)練樣本時(shí),將初始正、負(fù)樣本集分別輸入已訓(xùn) 練好的前k層人臉檢測(cè)模型,將前k層人臉檢測(cè)模型均不能進(jìn)行確定的分類(lèi)的樣本作為第k+ 1層分類(lèi)器的訓(xùn)練樣本。
[0035] 優(yōu)選的,步驟S3中,計(jì)算修正的互信息的公式為
[0036]
[0037] 其中,為給定的一組拒識(shí)闊值,N為正、負(fù)樣本總數(shù),TP(t2)表示真實(shí)類(lèi)別和 預(yù)測(cè)類(lèi)別均為正樣本的樣本數(shù),F(xiàn)N(ti)表示真實(shí)類(lèi)別為正樣本,預(yù)測(cè)類(lèi)別為負(fù)樣本的樣本 數(shù);FP(t2)表示真實(shí)類(lèi)別為負(fù)樣本,預(yù)測(cè)類(lèi)別為正樣本的樣本數(shù);TN(ti)表示真實(shí)類(lèi)別和預(yù) 測(cè)類(lèi)別均為負(fù)樣本的樣本數(shù);P(+l)與P(-l)分別是正樣本和負(fù)樣本的先驗(yàn)概率。
[0038] 優(yōu)選的,所述的弱分類(lèi)器W為區(qū)域分割分類(lèi)器。
[0039] 優(yōu)選的,步驟5中的收斂條件為總體分類(lèi)器層數(shù)或已收集不到足夠的正、負(fù)樣本用 于訓(xùn)練。
[0040] 優(yōu)選的,步驟S5的具體步驟為:給定待檢測(cè)的圖像,首先利用下采樣構(gòu)建圖像金字 塔,直至將圖像縮放至A大小,并計(jì)