本發(fā)明總體上涉及圖像檢測(cè)。特別地,本發(fā)明涉及用于生成對(duì)象檢測(cè)分類器的方法和設(shè)備,并且進(jìn)一步涉及用于檢測(cè)圖像中的對(duì)象的方法和設(shè)備。
背景技術(shù):針對(duì)圖像的對(duì)象檢測(cè)(諸如人物檢測(cè))在視頻監(jiān)視、基于內(nèi)容的圖像/視頻檢索、視頻評(píng)注以及生活協(xié)助中具有非常重要的應(yīng)用。關(guān)于人物檢測(cè)技術(shù)存在海量的文獻(xiàn)。其中的大部分文獻(xiàn)關(guān)注于分類器的生成,分類器對(duì)于對(duì)象檢測(cè)是必要的且是關(guān)鍵的。一般來說,分類器通常與一類對(duì)象有關(guān),并且被用于檢測(cè)圖像中是否存在這類對(duì)象。成功的方法中的一個(gè)思路是以Viola和Jones在臉部檢測(cè)方面的開創(chuàng)性工作為基礎(chǔ)的[文獻(xiàn)1]。在文獻(xiàn)1中,Haar狀特征經(jīng)由積分圖像(integralimage)被計(jì)算而來,并且通過Adaboost方法來學(xué)習(xí)分類器的一種新穎的級(jí)聯(lián)結(jié)構(gòu)。Adaboost方法是本領(lǐng)域中公知的,并且提供了有效的學(xué)習(xí)過程以及對(duì)于一般化性能的強(qiáng)的約束[文獻(xiàn)6]。當(dāng)前,這樣的基于學(xué)習(xí)的方法當(dāng)前已成為主流;其中的關(guān)鍵問題是所使用的特征以及學(xué)習(xí)算法。在2005年,Dalal提出了用于人物檢測(cè)的歸一化的梯度方向直方圖(HistogramofOrientedGradients,HOG)描述符[文獻(xiàn)2],如圖1A所示,圖1A示出如文獻(xiàn)2中所描述的現(xiàn)有技術(shù)的梯度方向直方圖。每個(gè)檢測(cè)窗口被分成具有8×8像素的大小的單元,并且2×2單元的組被集合成一個(gè)塊,從而塊彼此重疊。每個(gè)單元由9區(qū)段HOG構(gòu)成,并且每個(gè)塊包含其所有的單元的鏈接串聯(lián)矢量。因此,每個(gè)塊由36 維特征矢量表示,該36維特征矢量被歸一化為L(zhǎng)2單位長(zhǎng)度。每個(gè)64×128個(gè)樣本的圖像由7×15個(gè)塊表示,每個(gè)檢測(cè)窗口給出總共3780個(gè)特征,這通常被表示為特征矢量f=[...,...,...]。這些特征然后被用于訓(xùn)練線性SVM分類器。文獻(xiàn)2中公開的方法的概述如圖1B所示。HOG特征實(shí)現(xiàn)了非常好的人物檢測(cè)的性能。在2006年,Zhu通過積分圖像以及集成的級(jí)級(jí)聯(lián)的結(jié)構(gòu)分類器來計(jì)算HOG特征以加速文獻(xiàn)2中所描述的方法[文獻(xiàn)3]。36維塊特征矢量被歸一化為L(zhǎng)1單元長(zhǎng)度,并然后用于構(gòu)建SVM弱分類器。文獻(xiàn)3中公開的方法大大提高了檢測(cè)速度,同時(shí)仍保持與文獻(xiàn)2中公開的方法類似的精確水平。但是,文獻(xiàn)2和3中所公開的兩個(gè)方法中,HOG的每個(gè)塊中的局部對(duì)比度歸一化步驟對(duì)于產(chǎn)生良好性能是關(guān)鍵的。但是,歸一化中的許多除法操作將大大增加計(jì)算量,對(duì)于嵌入式系統(tǒng)尤其如此。近年來,對(duì)于人物檢測(cè)問題,提出了一些比較特征,如關(guān)聯(lián)對(duì)比較特征(AssociatedPairingComparisonFeatures,APCF)[文獻(xiàn)4]以及聯(lián)合顆粒評(píng)分特征(JointRankingofGranulesFeatures,JROG)[文獻(xiàn)5]。在文獻(xiàn)4中,APCF以顆??臻g中顏色的簡(jiǎn)單配對(duì)比較(ParingComparisonofColor,PCC)和梯度方向的簡(jiǎn)單配對(duì)比較(ParingComparisonofGradients,PCG)為基礎(chǔ),并且若干PCC或PCG特征相關(guān)聯(lián)以形成APCF特征。然后APCF特征被用于構(gòu)建級(jí)聯(lián)結(jié)構(gòu)分類器,如圖1D所示,其中左部示出顏色的配對(duì)比較,而右側(cè)示出梯度的配對(duì)比較。由于顆粒空間中存在豐富的顆粒對(duì),因此與文獻(xiàn)3中所公開的方法相比,這種簡(jiǎn)單的APCF特征能實(shí)現(xiàn)更精確的檢測(cè)結(jié)果。檢測(cè)速度與文獻(xiàn)3中公開的方法類似。JROG是APCF特征的簡(jiǎn)化形式。在文獻(xiàn)5中,使用JROG特征來構(gòu)建整體檢測(cè)器和若干部分檢測(cè)器以保持高檢測(cè)精度,該檢測(cè)精度可由于JROG的簡(jiǎn)化而下降。最終,與文獻(xiàn)4中公開的方法相比,文獻(xiàn)5中公開的方法能實(shí)現(xiàn)相當(dāng)?shù)臋z測(cè)精度以及更高的效率。文獻(xiàn)4 和5中公開的這兩個(gè)方法在圖1E中被說明。上述組合的二進(jìn)制比較特征的一個(gè)優(yōu)點(diǎn)是形式簡(jiǎn)單。在計(jì)算期間不需要?dú)w一化步驟。另一個(gè)優(yōu)點(diǎn)是,與Haar狀特征相比,大量的顆粒能將更豐富的信息進(jìn)行編碼。但是,APCF和JROG方法中的比較是在顆粒強(qiáng)度或者顆粒梯度朝向之間進(jìn)行的,而不是在圖像塊內(nèi)的梯度統(tǒng)計(jì)值(例如,HOG形式)之間進(jìn)行的。從HOG的相對(duì)成功的性能,可看到圖像塊內(nèi)的梯度統(tǒng)計(jì)值對(duì)于人物檢測(cè)是非常很有辨別力的。同時(shí),由于顆粒通常是像素或者具有方形形狀,顆粒的寬度和高度相同,這限制了發(fā)現(xiàn)有用模式(Pattern)的能力。鑒于上文,仍需要一種能夠以更高的計(jì)算速度獲得更有辨別力的特征的方法和設(shè)備。此外,仍需要一種能夠高效且精確地檢測(cè)圖像中的對(duì)象的方法和設(shè)備。[引用的文獻(xiàn)]1.P.ViolaandM.Jones.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures.IEEECVPR,2001.2.N.DalalandB.Triggs.Histogramsoforientedgradientsforhumandetection.IEEECVPR,2005.3.Q.Zhu,S.Avidan,M.Yeh,K.Cheng.FastHumandetectionusingacascadeofhistogramsoforientedgradients.IEEECVPR,2006.4.G.Duan,C.Huang,H.Ai,andS.Lao.Boostingassociatedpairingcomparisonfeaturesforpedestriandetection.NinthIEEEInternationalWorkshoponVisualSurveillance,2009.5.C.Huang,R.Nevatia.Highperformanceobjectdetectionbycollaborativelearningofjointrankingofgranulesfeatures.IEEECVPR,2010.6.Y.Freund,R.E.Schapire.Adecision-theoreticqeneralizationofon-linelearningandanapplicationtoboosting. SecondEuropeanConferenceonComputationalLearningTheory,1995.
技術(shù)實(shí)現(xiàn)要素:本發(fā)明旨在解決上述問題。本發(fā)明的一個(gè)目標(biāo)是提供一種能夠以更高的計(jì)算速度獲得更有辨別力的特征的方法和設(shè)備。此外,本發(fā)明的另一個(gè)目標(biāo)是提供能夠高效且精確地獲得用于圖像檢測(cè)的對(duì)象檢測(cè)分類器的方法和設(shè)備。另外,本發(fā)明的還另一個(gè)目標(biāo)是提供能夠高效且精確地檢測(cè)圖像中的對(duì)象的方法和設(shè)備。根據(jù)本發(fā)明的一個(gè)方面,提供了一種生成圖像區(qū)域中的二單元結(jié)構(gòu)的二單元結(jié)構(gòu)特征描述符的方法,該二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,其中,該相鄰單元是在圍繞該中心單元并且與該中心單元相鄰的八個(gè)單元中的一個(gè),該方法包括:計(jì)算步驟,用于計(jì)算該中心單元和該相鄰單元中的梯度統(tǒng)計(jì)值;以及比較步驟,用于比較所計(jì)算的該中心單元和該相鄰單元中的梯度統(tǒng)計(jì)值,以便獲得用于描述該二單元結(jié)構(gòu)的特征的二單元結(jié)構(gòu)特征描述符,并且其中,該二單元結(jié)構(gòu)特征描述符是1比特的二進(jìn)制值。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于生成用于至少一個(gè)圖像區(qū)域的對(duì)象檢測(cè)分類器的方法,其中該至少一個(gè)圖像區(qū)域中的每個(gè)圖像區(qū)域包括至少一個(gè)二單元結(jié)構(gòu),并且每個(gè)二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,該相鄰單元是圍繞該中心單元并且與該中心單元相鄰的八個(gè)單元中的一個(gè),該方法包括:特征空間計(jì)算步驟,用于通過將上述的根據(jù)本發(fā)明的該一個(gè)方面的方法應(yīng)用于該至少一個(gè)圖像區(qū)域中的每一個(gè)圖像區(qū)域中包含的至少一個(gè)二單元結(jié)構(gòu)中的每一個(gè),來計(jì)算特征空間;以及生成步驟,用于基于所確定的特征空間確定生成對(duì)象檢測(cè)分類器。根據(jù)本發(fā)明的還另一個(gè)方面,提供了一種用于檢測(cè)圖像區(qū)域中的對(duì)象的方法,該方法包括:輸入步驟,用于輸入要被檢測(cè)的圖像區(qū)域;檢測(cè)步驟,用于通過應(yīng)用上述的根據(jù)本發(fā)明的該另一方面的方法所生 成的分類器檢測(cè)在該圖像區(qū)域中是否存在要被檢測(cè)的對(duì)象。根據(jù)本發(fā)明的還另一個(gè)方面,提供了一種生成圖像區(qū)域中的二單元結(jié)構(gòu)的二單元結(jié)構(gòu)特征描述符的設(shè)備,該二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,其中,該相鄰單元是在圍繞該中心單元并且與該中心單元相鄰的八個(gè)單元中的一個(gè),該設(shè)備包括:計(jì)算單元,被配置用于計(jì)算該中心單元和該相鄰單元中的梯度統(tǒng)計(jì)值;以及比較單元,被配置用于比較所計(jì)算的該中心單元和該相鄰單元中的梯度統(tǒng)計(jì)值,以便獲得用于描述該二單元結(jié)構(gòu)的特征的二單元結(jié)構(gòu)特征描述符,并且其中,該二單元結(jié)構(gòu)特征描述符是1比特的二進(jìn)制值。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于生成用于至少一個(gè)圖像區(qū)域的對(duì)象檢測(cè)分類器的設(shè)備,其中該至少一個(gè)圖像區(qū)域中的每個(gè)圖像區(qū)域包括至少一個(gè)二單元結(jié)構(gòu),并且每個(gè)二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,該相鄰單元是圍繞該中心單元并且與該中心單元相鄰的八個(gè)單元中的一個(gè),該設(shè)備包括:特征空間計(jì)算單元,被配置用于通過將上述的根據(jù)本發(fā)明的該一個(gè)方面的方法應(yīng)用于該至少一個(gè)圖像區(qū)域中的每一個(gè)圖像區(qū)域中包含的至少一個(gè)二單元結(jié)構(gòu)中的每一個(gè),來計(jì)算特征空間;以及生成單元,被配置用于基于所確定的特征空間確定生成對(duì)象檢測(cè)分類器。根據(jù)本發(fā)明的還另一個(gè)方面,提供了一種用于檢測(cè)圖像區(qū)域中的對(duì)象的設(shè)備,該設(shè)備包括:輸入單元,被配置用于輸入要被檢測(cè)的圖像區(qū)域;檢測(cè)單元,被配置用于通過應(yīng)用上述的根據(jù)本發(fā)明的該另一方面的方法所生成的分類器檢測(cè)在該圖像區(qū)域中是否存在要被檢測(cè)的對(duì)象。[有利效果]與現(xiàn)有技術(shù)相比,通過利用單元空間中的梯度統(tǒng)計(jì)值以及其中豐富的元素兩者,根據(jù)本發(fā)明的方法和設(shè)備以更高計(jì)算速度獲得具有最高辨別力的離散值特征。此外,基于這樣獲得的特征,根據(jù)本發(fā)明的方法和裝置在不降低效率的情況下更精確地獲得對(duì)象檢測(cè)分類器。此外,本發(fā)明可更精確和高效地進(jìn)行圖像的對(duì)象檢測(cè),諸如人物對(duì)象檢測(cè)。從參照附圖的示例性實(shí)施例的以下描述,本發(fā)明的其它特征將變得清晰。附圖說明并入說明書中并且構(gòu)成說明書的一部分的附圖示出了本發(fā)明的實(shí)施例,并且與描述一起用于解釋本發(fā)明的原理。在附圖中,相似的附圖標(biāo)記指示相似的項(xiàng)目。圖1A至1E示出現(xiàn)有技術(shù)中的一些方法。更具體而言,圖1A示出如文獻(xiàn)1中所描述的現(xiàn)有技術(shù)中的梯度方向直方圖,圖1B示出對(duì)比文件2中公開的方法的概略圖,圖1C示出文獻(xiàn)3中公開的方法的概略圖,圖1D示出現(xiàn)有技術(shù)中的顆??臻g中的顏色和梯度朝向的簡(jiǎn)單配對(duì)比較,其中左側(cè)部分示出顏色的配對(duì)比較,右側(cè)部分示出梯度的配對(duì)比較,并且圖1E示出文獻(xiàn)4和5中公開的方法的概略圖。圖2是用于實(shí)現(xiàn)本發(fā)明的設(shè)備的計(jì)算設(shè)備的布置的框圖。圖3A是示出根據(jù)本發(fā)明的第一實(shí)施例的方法的流程圖,并且圖3B示出若干二單元結(jié)構(gòu)。圖4是示出根據(jù)本發(fā)明的第一實(shí)施例的設(shè)備的框圖。圖5是示出訓(xùn)練過程的流程圖。圖6示出LUT弱分類器。圖7是示出根據(jù)本發(fā)明的第二實(shí)施例的方法的流程圖。圖8示出通過根據(jù)本發(fā)明的第二實(shí)施例的方法獲得的特征的示例。圖9是示出根據(jù)本發(fā)明的第二實(shí)施例的方法中的確定步驟中的過程的流程圖。圖10A示出若干示例性二單元結(jié)構(gòu),并且圖10B示出若干示例性三單元結(jié)構(gòu)。圖11示出根據(jù)本發(fā)明的第二實(shí)施例的設(shè)備的框圖。圖12是示出根據(jù)本發(fā)明的第三實(shí)施例的方法的流程圖。圖13是示出檢測(cè)步驟中的過程的流程圖。圖14是示出根據(jù)本發(fā)明的第三實(shí)施例的設(shè)備的框圖。具體實(shí)施方式下文將參照附圖詳細(xì)描述本發(fā)明的實(shí)施例。為了使描述更清楚,首先將解釋下文要使用的一些術(shù)語。圖像區(qū)域中的單元指的是圖像區(qū)域中的圖像塊,該圖像區(qū)域可包含多個(gè)圖像塊。一個(gè)單元可包含至少一個(gè)像素,并且當(dāng)包含多于一個(gè)的像素時(shí)可具有若干種形狀,諸如方形、矩形。單元的長(zhǎng)度和寬度以像素?cái)?shù)表示,并且可相同(例如,方形)或不同(例如,矩形)。圖2是示出用于實(shí)施根據(jù)本發(fā)明的對(duì)象檢測(cè)分類器生成設(shè)備以及圖像中的對(duì)象的檢測(cè)設(shè)備的計(jì)算設(shè)備的布置的框圖。為了簡(jiǎn)化起見,該設(shè)備被表示為置于單個(gè)計(jì)算設(shè)備中。但是,不管該設(shè)備被置于單個(gè)計(jì)算設(shè)備中還是被置于作為網(wǎng)絡(luò)系統(tǒng)的多個(gè)計(jì)算設(shè)備中,該系統(tǒng)都是有效的。如圖2所示,計(jì)算設(shè)備100用于生成對(duì)象檢測(cè)分類器的過程以及用于檢測(cè)圖像中的對(duì)象的過程。此外,計(jì)算設(shè)備100可執(zhí)行圖像檢測(cè)。計(jì)算設(shè)備100可包括CPU101、芯片組102、RAM103、存儲(chǔ)控制器104、顯示控制器105、硬盤驅(qū)動(dòng)器106、CD-ROM驅(qū)動(dòng)器107、以及顯示器108。計(jì)算設(shè)備100還可包括連接于CPU101和芯片組102之間的信號(hào)線111、連接于芯片組102和RAM103之間的信號(hào)線112、連接于芯片組102和各種外圍設(shè)備之間的外圍設(shè)備總線113、連接于存儲(chǔ)控制器104和硬盤驅(qū)動(dòng)器106之間的信號(hào)線114、連接于存儲(chǔ)控制器104和CD-ROM驅(qū)動(dòng)器107之間的信號(hào)線115、以及連接于顯示控制器105和顯示器108之間的信號(hào)線116??蛻粼O(shè)備120可直接或經(jīng)由網(wǎng)絡(luò)130連接到計(jì)算設(shè)備100??蛻粼O(shè)備120可向計(jì)算設(shè)備100發(fā)送生成對(duì)象檢測(cè)分類器的過程或者執(zhí)行檢測(cè)圖像中的對(duì)象的處理所需要的指令和/或參數(shù),并且計(jì)算設(shè)備100 可將信息返回給客戶設(shè)備120或者在顯示器108上顯示信息。本發(fā)明總體上涉及圖像檢測(cè),諸如圖像區(qū)域中的對(duì)象的檢測(cè),通常是基于學(xué)習(xí)的對(duì)象檢測(cè),并且訓(xùn)練和檢測(cè)是上述架構(gòu)中的兩個(gè)主要過程。通常,利用大的樣本集來生成分類器,該大的樣本集包括正樣本(具有對(duì)象)和負(fù)樣本(不具有對(duì)象)。訓(xùn)練是一次性過程。然后在檢測(cè)過程中,使用生成的分類器來確定測(cè)試圖像是否包含對(duì)象。在本發(fā)明的實(shí)現(xiàn)中,訓(xùn)練和檢測(cè)過程都基于相應(yīng)的圖像區(qū)域的特征(下文將被稱為L(zhǎng)ABHOG特征)的確定來執(zhí)行。LABHOG特征的確定利用了HOG的辨別力以及特征比較的簡(jiǎn)易性兩者,并且基于圖像區(qū)域中包含的單元進(jìn)行的。下文將描述本發(fā)明的實(shí)現(xiàn)中的各個(gè)過程。[第一實(shí)施例]下文,將參照?qǐng)D3A和3B描述根據(jù)本發(fā)明的第一實(shí)施例的用于確定圖像區(qū)域中的二單元結(jié)構(gòu)特征描述符的方法,其中圖3A示出根據(jù)本發(fā)明的第一實(shí)施例的方法的過程的流程圖,并且圖3B示出若干示例性的二單元模式。在本發(fā)明的實(shí)現(xiàn)中,作為L(zhǎng)ABHOG特征的確定的基本的和發(fā)明性的過程,確定圖像區(qū)域中的如下這樣的二單元結(jié)構(gòu)的二單元結(jié)構(gòu)描述符,該二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,其中,該相鄰單元是該圖像區(qū)域中的圍繞該中心單元且與該中心單元相鄰的八個(gè)單元中的一個(gè),如圖3B所示。應(yīng)注意,通常的情況下,兩個(gè)單元(即中心單元和相鄰單元)可具有相同的形狀和大小,即一個(gè)單元的長(zhǎng)度和高度可與另一個(gè)單元的長(zhǎng)度和高度相同??商鎿Q地,這兩個(gè)單元可具有相同的寬長(zhǎng)比。當(dāng)然,這兩個(gè)單元可具有不同的寬長(zhǎng)比,這有助于找到更有辨別力的特征。在根據(jù)本發(fā)明的第一實(shí)施例的方法的步驟S301(下文將被稱為計(jì)算步驟)中,分別計(jì)算中心單元和相鄰單元中的梯度統(tǒng)計(jì)值。在根據(jù)本發(fā)明的第一實(shí)施例的方法的步驟S302(下文將被稱為比 較步驟)中,比較在計(jì)算步驟中所計(jì)算的中心單元和相鄰單元中的梯度統(tǒng)計(jì)值,以便獲得用于描述該二單元結(jié)構(gòu)的特征的二單元結(jié)構(gòu)特征描述符。梯度統(tǒng)計(jì)值是單元中計(jì)算的梯度方向直方圖中的區(qū)段的值,并且比較結(jié)果是1比特的二進(jìn)制值。因此,二單元結(jié)構(gòu)描述符可由1比特的二進(jìn)制值表示。更具體而言,對(duì)于一個(gè)區(qū)段,二單元特征描述符將被如下地計(jì)算:其中,Binc[dir0]和Binn[dir1]分別指的是所計(jì)算的中心單元和相鄰單元的有用區(qū)段的梯度統(tǒng)計(jì)值,并且dir1和dir0分別指的是HOG的有用區(qū)段索引。應(yīng)注意,dir1和dir0通常用于指的是同一區(qū)段。實(shí)際上,由于HOG通常包含若干區(qū)段,因此兩個(gè)單元之間的比較可對(duì)于每個(gè)區(qū)段執(zhí)行,然后獲得若干1比特二進(jìn)制值,每個(gè)1比特二進(jìn)制值對(duì)應(yīng)于一個(gè)區(qū)段,并且每個(gè)1比特二進(jìn)制值均代表該二單元結(jié)構(gòu)的特征。因此,所有二單元結(jié)構(gòu)特征構(gòu)成該二單元結(jié)構(gòu)的二單元結(jié)構(gòu)特征空間。圖4示出根據(jù)本發(fā)明的第一實(shí)施例的用于生成圖像區(qū)域中的二單元結(jié)構(gòu)的二單元特征描述符的設(shè)備,該二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,其中,該相鄰單元是該圖像區(qū)域中的圍繞該中心單元且與該中心單元相鄰的八個(gè)單元中的一個(gè)。設(shè)備400可包括計(jì)算單元401,被配置用于分別計(jì)算中心單元和相鄰單元中的梯度統(tǒng)計(jì)值;以及比較單元402,被配置用于比較所計(jì)算的中心單元和相鄰單元中的梯度統(tǒng)計(jì)值,以便獲得用于描述二單元結(jié)構(gòu)的特征的二單元結(jié)構(gòu)特征描述符。[有利效果]由于根據(jù)本發(fā)明的第一實(shí)施例的方法利用了HOG的辨別力以及比較特征的簡(jiǎn)易性,而無需歸一化,因此計(jì)算速度被提高,所獲得的特征將是離散值,并且精度和辨別力將得到提高。在優(yōu)選實(shí)現(xiàn)中,在該方法的處理中不使用歸一化。但是,由于方法利用了HOG的辨別力以及比較特征的簡(jiǎn)易性兩者,因此即使添加了歸一化處理,該方法的效果也不會(huì)受到大的負(fù)面影響。[第二實(shí)施例]如上所述,分類器對(duì)于圖像對(duì)象檢測(cè)的性能是必要的且重要的,并且分類器的生成對(duì)于圖像對(duì)象檢測(cè)的性能也是關(guān)鍵的。分類器通常是利用大的樣本集訓(xùn)練生成的,該大的樣本集包括正樣本(對(duì)象樣本)和負(fù)樣本(無對(duì)象樣本),每個(gè)樣本可對(duì)應(yīng)于一個(gè)圖像區(qū)域或者圖像區(qū)域的一部分。因此,分類器還可被視為通過使用大的圖像區(qū)域集被訓(xùn)練。訓(xùn)練是一次性過程。存在許多訓(xùn)練生成分類器的技術(shù)以及多種分類器。一種常用的分類器是級(jí)聯(lián)結(jié)構(gòu)的分類器,級(jí)聯(lián)結(jié)構(gòu)分類器包括至少一個(gè)級(jí)(stage),并且每個(gè)級(jí)對(duì)應(yīng)于由一組弱分類器構(gòu)成的一個(gè)強(qiáng)分類器。應(yīng)注意,盡管在說明書的上下文中使用“圖像”和“圖像區(qū)域”兩者,除非另外說明,否則它們通??杀舜说韧?。下文將參照?qǐng)D5描述分類器的訓(xùn)練過程的概述,圖5示出級(jí)聯(lián)分類器的一個(gè)級(jí)的訓(xùn)練。在該訓(xùn)練過程中,通過Adaboost方法訓(xùn)練生成級(jí)聯(lián)結(jié)構(gòu)的分類器。Adaboost方法提供了有效的學(xué)習(xí)過程以及對(duì)于一般化性能的強(qiáng)約束。對(duì)于級(jí)聯(lián)分類器的每一級(jí),構(gòu)建由一組弱分類器構(gòu)成的強(qiáng)分類器。在強(qiáng)分類器的構(gòu)建期間,持續(xù)添加弱分類器,直到滿足預(yù)定的質(zhì)量度量。質(zhì)量度量是用檢測(cè)率和誤檢率(falsepositiverate)表示的。在步驟501中,在級(jí)聯(lián)分類器中添加一個(gè)新的級(jí)。在步驟502中,準(zhǔn)備用于訓(xùn)練新的級(jí)的正樣本和負(fù)樣本(例如,至少一個(gè)圖像區(qū)域,通常是多個(gè)圖像區(qū)域)。本領(lǐng)域公知的被稱為bootstrap的訓(xùn)練方案被用于負(fù)樣本收集。無對(duì)象的圖像的集合作為負(fù)樣本的源。在每一級(jí)的訓(xùn)練過程之后,在整個(gè)圖像集合上評(píng)價(jià)該級(jí)聯(lián)分類器,并且收集被認(rèn)為是誤檢的任何肯定預(yù)測(cè)(positivepredict) 以形成負(fù)訓(xùn)練集合以訓(xùn)練下一級(jí)的強(qiáng)分類器。應(yīng)注意,在該級(jí)的處理期間正樣本和負(fù)樣本通常不改變,并且該級(jí)中的正樣本和負(fù)樣本的數(shù)量通常與另一級(jí)中的正樣本和負(fù)樣本的數(shù)量不同。在步驟503中,基于訓(xùn)練圖像的特征空間訓(xùn)練生成弱分類器。一種常見類型的弱分類器是查找表(LUT)類型的弱分類器,LUT弱分類器是將特征空間劃分成多個(gè)區(qū)段并且對(duì)于每個(gè)區(qū)段輸出一恒定值的分段函數(shù),如圖6所示。橫坐標(biāo)f(x)代表特征空間中的區(qū)段,而縱坐標(biāo)h(x)代表實(shí)值置信度。在步驟504中,確定此級(jí)的閾值。更具體而言,設(shè)定初始值然后減小該初始值,直到滿足目標(biāo)檢測(cè)率dmin。然后,將最新的值設(shè)定為閾值T,并且評(píng)估在當(dāng)前級(jí)中在此閾值下的誤檢率f。在步驟505中,將所評(píng)估的誤檢率f與每一級(jí)的最大可接受的誤檢率相比較。如果f小于fmax,則當(dāng)前級(jí)的訓(xùn)練將完成,否則,將在此級(jí)中添加另一弱分類器,也就是說,步驟503到504中的過程被重復(fù)進(jìn)行,直到當(dāng)前級(jí)中的誤檢率f小于fmax。當(dāng)訓(xùn)練過程完成時(shí),獲得此級(jí)中的強(qiáng)分類器。在步驟506中,在當(dāng)前級(jí)的訓(xùn)練完成時(shí),將當(dāng)前級(jí)聯(lián)分類器的整體誤檢率F與目標(biāo)誤檢率Ftg進(jìn)行比較。如果F小于Ftg,整個(gè)訓(xùn)練過程結(jié)束,否則,將在級(jí)聯(lián)分類器中添加新的一級(jí)。然后重復(fù)進(jìn)行步驟502到505中的處理,直到F小于Ftg。最后,所有先前訓(xùn)練生成的各級(jí)的強(qiáng)分類器構(gòu)成了最終級(jí)聯(lián)分類器,并且在步驟507中,輸出該級(jí)聯(lián)分類器以供將來使用。在弱分類器的訓(xùn)練期間,來自至少一個(gè)訓(xùn)練圖像的特征空間用作訓(xùn)練的基礎(chǔ),因此該特征空間對(duì)于弱分類器以及最終的級(jí)聯(lián)分類器的性能是非常關(guān)鍵的。更具體而言,獲得特征空間的精度和效率對(duì)于弱分類器的訓(xùn)練生成的精度和效率而言是重要的。在本發(fā)明中,提供了一種根據(jù)本發(fā)明的第二實(shí)施例的用于訓(xùn)練生成弱分類器的方法,該方法利用了根據(jù)本發(fā)明的第一實(shí)施例的方法,從而準(zhǔn)確且高效地獲得特征空間。更具體而言,在本發(fā)明的實(shí)現(xiàn)中, 至少一個(gè)訓(xùn)練圖像中的每一個(gè)訓(xùn)練圖像被分成多個(gè)單元,從而獲得至少一個(gè)二單元結(jié)構(gòu)。然后,根據(jù)本發(fā)明的第一實(shí)施例的方法被應(yīng)用于每個(gè)二單元結(jié)構(gòu),從而獲得用于該至少一個(gè)訓(xùn)練圖像的二單元特征空間?;谠撎卣骺臻g,獲得對(duì)應(yīng)的對(duì)象檢測(cè)分類器(弱分類器),并且基于類似的過程,可獲得一級(jí)所需的至少一個(gè)弱分類器以便形成級(jí)聯(lián)分類器中的當(dāng)前級(jí)的強(qiáng)分類器,從而最終的具有至少一級(jí)的級(jí)聯(lián)分類器可由至少一級(jí)中的強(qiáng)分類器而獲得。下文,將參照?qǐng)D7描述根據(jù)本發(fā)明的第二實(shí)施例的分類器生成方法。圖7是示出對(duì)于用于訓(xùn)練的至少一個(gè)圖像區(qū)域生成對(duì)象檢測(cè)分類器的方法的流程圖,其中每個(gè)圖像區(qū)域包含至少一個(gè)二單元結(jié)構(gòu),并且每個(gè)二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,該相鄰單元是該圖像區(qū)域中的圍繞該中心單元的并且與該中心單元相鄰的八個(gè)單元之一。在該方法的步驟S701(下文將被稱為特征空間計(jì)算步驟)中,通過將根據(jù)本發(fā)明的第一實(shí)施例的方法應(yīng)用于該用于訓(xùn)練的至少一個(gè)圖像區(qū)域中所包含的至少一個(gè)二單元結(jié)構(gòu)中的每一個(gè)二單元結(jié)構(gòu),計(jì)算該至少一個(gè)圖像區(qū)域的特征空間。該特征空間包含從圖像區(qū)域中包含的至少一個(gè)二單元結(jié)構(gòu)獲得的多個(gè)二單元結(jié)構(gòu)特征描述符。該至少一個(gè)二單元結(jié)構(gòu)通常構(gòu)成二單元結(jié)構(gòu)空間,該二單元結(jié)構(gòu)空間是通過列舉如圖10A所示的所有二單元結(jié)構(gòu)而獲得的。如上所述,通過將中心單元與相鄰單元中的梯度統(tǒng)計(jì)值進(jìn)行比較而獲得二單元結(jié)構(gòu)特征描述符。每個(gè)單元中的梯度統(tǒng)計(jì)值是此單元中的梯度方向直方圖(HOG)的一個(gè)區(qū)段的值。此區(qū)段將在此被稱為有用的區(qū)段,對(duì)于二單元結(jié)構(gòu)定義向量[w,h,x0,y0,dir0,x1,y1,dir1]為其的屬性信息。這里,此向量中的w和h分別代表單元的寬度和高度。中心單元的信息由分別為左上像素的x坐標(biāo)、y坐標(biāo)和HOG的有用區(qū)段的x0,y0和dir0定義。相鄰單元的信息由x1、y1和dir1以相同方式定義。盡管在上述表示中,僅使用一個(gè)w和一個(gè)h來表示二單元結(jié)構(gòu)中的每個(gè)單元的寬度和高度,這意味著一個(gè)單元的寬度和高度與另一個(gè)單元的寬度和高度相同,但是這僅是示例,并且一個(gè)單元的寬度和高度可與另一個(gè)單元的寬度和高度不同。在步驟S702(下文將被稱為生成步驟)中,基于所計(jì)算的特征空間來生成對(duì)象檢測(cè)分類器。從特征空間生成對(duì)象檢測(cè)分類器的方式?jīng)]有被具體限定,并且可以是本領(lǐng)域中的任何常用方法。由于在根據(jù)第二實(shí)施例的方法的過程中,通過利用根據(jù)本發(fā)明的第一實(shí)施例的方法來獲得訓(xùn)練圖像的特征空間并且將該特征空間用于生成對(duì)象檢測(cè)分類器,因此根據(jù)本發(fā)明的第二實(shí)施例的方法可精確地且高效地獲得更加有辨別力的特征空間,由此不管從特征空間生成對(duì)象檢測(cè)分類器的方式如何,所獲得的分類器的性能提高。常規(guī)地,在從特征空間生成對(duì)象檢測(cè)分類器時(shí),對(duì)于整個(gè)獲得的特征空間(諸如Haar狀特征或HOG特征)使用窮舉搜索方法,以發(fā)現(xiàn)用于弱分類器的代表性特征結(jié)構(gòu),這可能具有高計(jì)算開銷并且緩慢。由于可能不同的單元位置、單元大小和單元結(jié)構(gòu),LABHOG特征空間的復(fù)雜性是組合性的。因此,用于Haar狀特征或HOG特征的常規(guī)的窮舉搜索方法不能有效地使用。因此,為了進(jìn)一步改進(jìn)由特征空間生成對(duì)象檢測(cè)分類器,根據(jù)本發(fā)明的第二實(shí)施例的方法優(yōu)選地在Adaboost算法的每一輪中,采用啟發(fā)式搜索過程以高效地選擇至少一個(gè)適當(dāng)?shù)慕Y(jié)構(gòu)以用于訓(xùn)練弱分類器,從而獲得弱對(duì)象檢測(cè)分類器。在第二實(shí)施例的實(shí)現(xiàn)中,生成步驟進(jìn)一步包括確定步驟,該確定步驟通過啟發(fā)式算法對(duì)于至少一個(gè)圖像區(qū)域基于所計(jì)算的該至少一個(gè)圖像區(qū)域的特征空間來確定至少一個(gè)特定單元結(jié)構(gòu)特征,其中每個(gè)特定單元結(jié)構(gòu)特征是N比特二進(jìn)制值,N對(duì)應(yīng)于構(gòu)成該特定單元結(jié)構(gòu)特征的二單元結(jié)構(gòu)特征描述符的數(shù)量,并且該N比特二進(jìn)制值中的每個(gè)比特的值對(duì)應(yīng)于該特定單元結(jié)構(gòu)特征中包含的N個(gè)二單元結(jié)構(gòu)特征描述符之一,其中N大于等于1。所確定的至少一個(gè)特定單元結(jié)構(gòu)特征被用于生成該對(duì)象檢測(cè)分類器。應(yīng)注意,根據(jù)本發(fā)明的第二實(shí)施例的 對(duì)象檢測(cè)分類器(弱分類器)可由一個(gè)或多個(gè)特定單元結(jié)構(gòu)特征構(gòu)成。特定單元結(jié)構(gòu)特征可對(duì)應(yīng)于特定單元結(jié)構(gòu),并且在此情況下,N可對(duì)應(yīng)于構(gòu)成該特定單元結(jié)構(gòu)的二單元結(jié)構(gòu)的數(shù)量,并且N比特二進(jìn)制值中的每一比特的值對(duì)應(yīng)于該特定單元結(jié)構(gòu)中包含的二單元結(jié)構(gòu)之一。應(yīng)注意,如上所述,圖像區(qū)域的特定單元結(jié)構(gòu)特征可通過直接組合該圖像區(qū)域的特征空間中包含的二單元結(jié)構(gòu)特征描述符而獲得,或者可通過首先組合該圖像區(qū)域中的二單元結(jié)構(gòu)以獲得特定單元結(jié)構(gòu)然后計(jì)算該特定單元結(jié)構(gòu)的特征來獲得。這兩者是等同的。在一個(gè)示例中,圖像區(qū)域的特定單元結(jié)構(gòu)可通過組合該圖像區(qū)域中的若干二單元結(jié)構(gòu)來獲得。在一個(gè)實(shí)例中,圖像區(qū)域的特定單元結(jié)構(gòu)可由兩個(gè)三單元結(jié)構(gòu)構(gòu)成,并且這兩個(gè)三單元結(jié)構(gòu)中的每一個(gè)可由具有同一中心單元的兩個(gè)二單元結(jié)構(gòu)構(gòu)成。這兩個(gè)三單元結(jié)構(gòu)的中心單元可以相同或者不同。在此情況下,特定單元結(jié)構(gòu)的特征將為4比特二進(jìn)制值。此外,三單元結(jié)構(gòu)中的各個(gè)單元的寬高比可相同,但是也可為不同的值以便有助于找到更有辨別力的模式。圖8中示出確定的圖像區(qū)域的特定三單元結(jié)構(gòu)的一個(gè)示例,并且所確定的特定單元結(jié)構(gòu)的生成可被總結(jié)如下。首先比較兩個(gè)三單元結(jié)構(gòu)中的每一個(gè)三單元結(jié)構(gòu)中的相鄰單元和中心單元之間的梯度統(tǒng)計(jì)值,然后將兩個(gè)三單元結(jié)構(gòu)的二進(jìn)制比較結(jié)果進(jìn)行組合以形成4比特LABHOG特征作為該特定單元結(jié)構(gòu)特征。應(yīng)注意,圖8僅是為了使本發(fā)明的概念清楚的簡(jiǎn)化示例,而不是意圖限制本發(fā)明的方法的具體實(shí)現(xiàn)。特定單元結(jié)構(gòu)可以為任何其他形式。下文,將參照?qǐng)D9詳細(xì)描述對(duì)于N=4的確定步驟的處理。在步驟S901(下文將被稱為二單元結(jié)構(gòu)特征選擇步驟)中,從所計(jì)算出的特征空間中選擇具有低訓(xùn)練誤差的第一數(shù)量的二單元結(jié)構(gòu)特征描述符。在步驟S902(下文將被稱為三單元結(jié)構(gòu)特征生成步驟)中,從所選擇的第一數(shù)量的二單元結(jié)構(gòu)特征描述符生成第二數(shù)量的三單元結(jié)構(gòu)特征。在步驟S903(下文將被稱為特定單元結(jié)構(gòu)特征確定步驟)中,基于第二數(shù)量的三單元結(jié)構(gòu)特征確定特定單元結(jié)構(gòu)特征。下文將詳細(xì)描述每個(gè)步驟中的處理。在二單元結(jié)構(gòu)特征選擇步驟(S901)的處理中,構(gòu)成特征空間的二單元結(jié)構(gòu)特征描述符依據(jù)特定誤差指標(biāo)被按升序分類,并且最上面的N1個(gè)(第一數(shù)量)特征被選擇作為具有低訓(xùn)練誤差的良好特征。由于如上所述,取決于HOG中的區(qū)段的數(shù)量,一個(gè)二單元結(jié)構(gòu)可對(duì)應(yīng)于若干特征,因此所選擇的第一數(shù)量的特征可對(duì)應(yīng)于若干二單元結(jié)構(gòu)。特定誤差指標(biāo)相對(duì)于特征空間被確定,并且其生成方式通常與要被生成的分類器的類型有關(guān)。在LUT分類器的情況下,誤差指標(biāo)是與LUT分類器對(duì)應(yīng)的計(jì)算的歸一化因子。下文將描述歸一化因子的計(jì)算。在本發(fā)明的實(shí)現(xiàn)中,LUT弱分類器布置是針對(duì)特征空間中的每個(gè)特征構(gòu)建的。2單元特征、3單元特征和LABHOG特征的特征空間被分別劃分為2區(qū)段、4區(qū)段和16區(qū)段。如果分別對(duì)于負(fù)樣本和正樣本當(dāng)前樣本為(x1,y1),...,(xm,ym),其中yi=-1,1,wt,i是樣本xi的權(quán)重,其中t指示當(dāng)前級(jí)中的弱分類器索引,并且LUT的區(qū)段數(shù)量為n,則構(gòu)建步驟可如下:對(duì)于每個(gè)區(qū)段,分別屬于此區(qū)段的正樣本和負(fù)樣本的權(quán)重的總和被如下計(jì)算。其中,l=±1,并且j=0,...,n區(qū)段j上的h(x)的輸出被設(shè)定為:其中,ε是小的正常數(shù)。然后,歸一化因子被計(jì)算為:因此,二單元結(jié)構(gòu)特征描述符根據(jù)歸一化因子Z按升序排序,并且前N1個(gè)特征被視為好的特征。在三單元結(jié)構(gòu)特征生成步驟(S902)的處理中,三單元結(jié)構(gòu)特征計(jì)算步驟可被執(zhí)行以從所選擇的第一數(shù)量的二單元結(jié)構(gòu)特征描述中計(jì)算得自二單元結(jié)構(gòu)特征描述符的三單元結(jié)構(gòu)特征,該二單元結(jié)構(gòu)特征描述符分別對(duì)應(yīng)于具有相同的中心單元以及不同的相鄰單元的彼此不同的兩個(gè)二單元結(jié)構(gòu),以便獲得多個(gè)三單元結(jié)構(gòu)特征,其中,多個(gè)三單元結(jié)構(gòu)特征中的每一個(gè)是一個(gè)2比特二進(jìn)制值,其中每個(gè)比特對(duì)應(yīng)于用于計(jì)算該三單元結(jié)構(gòu)特征的一個(gè)二單元結(jié)構(gòu)特征描述符。然后,從該多個(gè)三單元結(jié)構(gòu)特征中選擇具有低訓(xùn)練誤差的第二數(shù)量的二單元結(jié)構(gòu)特征。因?yàn)槿缟纤?,一個(gè)二單元結(jié)構(gòu)依賴于HOG中的區(qū)段的數(shù)量可對(duì)應(yīng)于若干個(gè)特征描述符,因此一個(gè)二單元結(jié)構(gòu)特征描述符對(duì)應(yīng)于一個(gè)二單元結(jié)構(gòu),并且兩個(gè)二單元結(jié)構(gòu)特征描述符的組合實(shí)際上可等同于兩個(gè)二單元結(jié)構(gòu)的組合,并且所生成的三單元結(jié)構(gòu)特征可對(duì)應(yīng)于一個(gè)三單元結(jié)構(gòu)。圖10B中示出一些典型的三單元結(jié)構(gòu)模式。因此,三單元結(jié)構(gòu)特征計(jì)算步驟可被理解為包含二單元結(jié)構(gòu)組合步驟以及三單元結(jié)構(gòu)特征組合步驟,其中二單元結(jié)構(gòu)組合步驟旨在從與第一數(shù)量的二單元結(jié)構(gòu)特征對(duì)應(yīng)的二單元結(jié)構(gòu)中,通過將基本二單元結(jié)構(gòu)與附加二單元結(jié)構(gòu)相組合來生成三單元結(jié)構(gòu),該附加二單元結(jié)構(gòu)由該基本二單元結(jié)構(gòu)的中心單元和附加的相鄰單元構(gòu)成,該附加的相鄰單元是該圖像區(qū)域中在該中心單元周圍并且與該中心單元相鄰的八個(gè)單元之一并且與該基本二單元結(jié)構(gòu)中的相鄰單元不同,并且該三單元結(jié)構(gòu)特征組合步驟對(duì)于每個(gè)組合的三單元結(jié)構(gòu),將該三單元結(jié)構(gòu)中所包含的基本二單元結(jié)構(gòu)的每個(gè)二單元結(jié)構(gòu)描述符與附加二單元結(jié) 構(gòu)的每個(gè)二單元結(jié)構(gòu)描述符相組合,其中多個(gè)三單元結(jié)構(gòu)特征中的每一個(gè)都為2比特二進(jìn)制值,每個(gè)比特對(duì)應(yīng)于組合的三單元結(jié)構(gòu)中包含的基本二單元結(jié)構(gòu)和附加二單元結(jié)構(gòu)之一的二單元結(jié)構(gòu)特征描述符。具體來說,通過組合具有相同中心單元和不同相鄰單元的兩個(gè)二單元結(jié)構(gòu)所獲得的三單元結(jié)構(gòu),這兩個(gè)二單元結(jié)構(gòu)中的一個(gè)用作基本二單元結(jié)構(gòu)而另一個(gè)用作附加二單元結(jié)構(gòu),并且這兩個(gè)二單元結(jié)構(gòu)通常彼此不同,并且該三單元結(jié)構(gòu)由向量[w,h,x0,y0,dir0,x1,y1,dir1,x2,y2,dir2]定義,其中的相似符號(hào)的含義與上述用于二單元結(jié)構(gòu)的符號(hào)的含義相似,其中附加二單元結(jié)構(gòu)中的相鄰單元的信息、即左上角像素的x坐標(biāo)、y坐標(biāo)以及HOG中的有用區(qū)段索引由x2、y2和dir2定義。盡管在上述表述中,僅使用一個(gè)w和一個(gè)h來代表三單元結(jié)構(gòu)中每個(gè)單元的寬度和高度,這意味著三單元結(jié)構(gòu)中的三個(gè)單元的寬度和高度都相同,但是這僅是一個(gè)示例,并且三個(gè)單元的寬度和高度可彼此不同。每個(gè)三單元特征均是通過組合該三單元結(jié)構(gòu)中包含的兩個(gè)二單元結(jié)構(gòu)的兩個(gè)1比特二進(jìn)制值來計(jì)算出的2比特二進(jìn)制值。計(jì)算的細(xì)節(jié)如下:Feature=bit2bit1其中,bit1和bit2分別代表兩個(gè)二單元結(jié)構(gòu)中的每一個(gè)的1比特二進(jìn)制值。所有三單元特征可構(gòu)成三單元特征空間。應(yīng)注意,構(gòu)成三單元結(jié)構(gòu)的兩個(gè)二單元特征通常可在同一圖像區(qū)域中,這意味著構(gòu)成三單元特征結(jié)構(gòu)的兩個(gè)不同的二單元特征結(jié)構(gòu)也可在同一圖像區(qū)域中。然后,全部三單元結(jié)構(gòu)特征根據(jù)錯(cuò)誤索引按升序排序,并且前N2個(gè)(第二數(shù)量)特征被選擇作為具有低訓(xùn)練誤差的好的特征。應(yīng)注意, 這里的索引除了是針對(duì)三單元特征空間被計(jì)算之外,其計(jì)算方式與用于選擇第一數(shù)量的二單元結(jié)構(gòu)特征描述符的索引的計(jì)算方式相似。例如,錯(cuò)誤索引可以是針對(duì)三單元特征空間計(jì)算的如上所述的歸一化因子Z。因此,三單元特征根據(jù)該歸一化因子Z按升序排序并且選擇前N2個(gè)特征作為好的特征。應(yīng)注意,這樣的對(duì)于三單元結(jié)構(gòu)特征計(jì)算步驟的解釋僅是旨在清楚地闡述三單元結(jié)構(gòu)特征計(jì)算步驟的一種實(shí)現(xiàn)方式,并且三單元結(jié)構(gòu)特征計(jì)算步驟并不因此受限。在特定單元結(jié)構(gòu)特征確定步驟(S903)的處理中,可執(zhí)行三單元結(jié)構(gòu)特征組合步驟以及選擇步驟,其中,三單元結(jié)構(gòu)特征組合步驟組合第二數(shù)量的三單元結(jié)構(gòu)特征中所包含的任意兩個(gè)三單元結(jié)構(gòu)特征以獲得多個(gè)組合單元結(jié)構(gòu)特征,其中,一個(gè)組合單元結(jié)構(gòu)特征是4比特二進(jìn)制值,每一比特對(duì)應(yīng)于相應(yīng)的兩個(gè)三單元結(jié)構(gòu)特征中的一個(gè)所包含的兩個(gè)二單元結(jié)構(gòu)特征描述符中的一個(gè),并且選擇步驟選擇該多個(gè)組合單元結(jié)構(gòu)特征中的具有最低訓(xùn)練誤差的組合單元結(jié)構(gòu)特征作為該特定單元結(jié)構(gòu)特征。組合的兩個(gè)三單元結(jié)構(gòu)特征可能對(duì)應(yīng)于不同的三單元結(jié)構(gòu)。當(dāng)然,它們也可對(duì)應(yīng)于同一三單元結(jié)構(gòu)。更具體而言,上述第二數(shù)量的好的三單元特征中的兩個(gè)被組合,然后每個(gè)LABHOG特征為如下計(jì)算的一個(gè)4比特值:Feature=bit4bit3bit2bit1其中,Bin1和Bin2分別指的是這兩個(gè)三單元特征。所有的LABHOG特征構(gòu)成LABHOG特征空間。然后,具有最低錯(cuò)誤索引的LABHOG特征被選擇,并且對(duì)應(yīng)的 分類器(例如LUT分類器)被選擇作為所獲得的弱分類器。類似的,依賴于HOG中的區(qū)段的數(shù)量,一個(gè)三單元結(jié)構(gòu)可對(duì)應(yīng)于若干三單元結(jié)構(gòu)特征,因此,兩個(gè)三單元結(jié)構(gòu)特征的組合實(shí)際上可等同于分別與這兩個(gè)三單元結(jié)構(gòu)特征對(duì)應(yīng)的兩個(gè)三單元結(jié)構(gòu)的組合,從而獲得與特定單元結(jié)構(gòu)特征對(duì)應(yīng)的特定單元結(jié)構(gòu)。應(yīng)注意,構(gòu)成特定單元特征的兩個(gè)三單元特征可通常在同一圖像區(qū)域中,這意味著構(gòu)成特定單元特征結(jié)構(gòu)的兩個(gè)不同的三單元特征結(jié)構(gòu)也可在同一圖像區(qū)域中。應(yīng)注意,這里的特定錯(cuò)誤索引除了相對(duì)于三單元特征空間被計(jì)算之外,可被以與用于選擇第一數(shù)量的二單元特征結(jié)構(gòu)描述符的索引的計(jì)算方式類似的方式計(jì)算。例如,錯(cuò)誤索引可以是LABHOG特征歸一化因子Z,該歸一化因子Z可針對(duì)LABHOG特征空間被如上所述地計(jì)算。因此,LABHOG特征空間根據(jù)歸一化因子按升序排序,并且具有最低歸一化因子的特征被選擇作為特定單元結(jié)構(gòu)特征。類似于前述二單元結(jié)構(gòu)和三單元結(jié)構(gòu)的屬性信息,所獲得的與特定單元結(jié)構(gòu)對(duì)應(yīng)的特定單元結(jié)構(gòu)特征也包括屬性信息,該屬性信息可以為向量形式或者其他形式,包括關(guān)于該特定單元結(jié)構(gòu)中所包含的二單元結(jié)構(gòu)的信息,并且關(guān)于二單元結(jié)構(gòu)的信息可以是包括該二單元結(jié)構(gòu)的三單元結(jié)構(gòu)的信息,該二單元結(jié)構(gòu)中所包含的單元的位置信息、以及該二單元結(jié)構(gòu)中包含的單元的計(jì)算梯度方向直方圖的區(qū)段的信息。應(yīng)注意,特定單元結(jié)構(gòu)中包含的單元可具有相同或不同的寬高比,并且用于組合的兩個(gè)三單元結(jié)構(gòu)可具有相同或不同的中心單元。因此,如果ht(x)是所學(xué)習(xí)的弱分類器,則正樣本和負(fù)樣本的權(quán)重被如下地更新:wt+1,i=wt,iexp(-yiht(xi))wt+1,i,wt,i分別是在更新之前和之后的樣本xi的權(quán)重。這樣的更新將使未被分類的樣本具有更大的權(quán)重,并且更新后的權(quán)重將被用于下一 級(jí)訓(xùn)練。盡管上文描述了級(jí)聯(lián)分類器的一級(jí)中所包含的弱分類器,并且該弱分類器是通過根據(jù)本發(fā)明的第二實(shí)施例的方法獲得的,但是這僅是示例性的,并且根據(jù)本發(fā)明的第二實(shí)施例的方法也可被應(yīng)用于生成其他類型的分類器。圖11是示出根據(jù)本發(fā)明的第二實(shí)施例的用于生成圖像區(qū)域的對(duì)象檢測(cè)分類器的設(shè)備的框圖,其中,該圖像區(qū)域包括至少一個(gè)二單元結(jié)構(gòu),并且每個(gè)二單元結(jié)構(gòu)由一中心單元和一相鄰單元構(gòu)成,并且該相鄰單元是該圖像區(qū)域中的圍繞該中心單元并且與該中心單元相鄰的八個(gè)單元之一。設(shè)備1100可包括特征空間計(jì)算單元1101,被配置用于通過將根據(jù)本發(fā)明的第一實(shí)施例的方法應(yīng)用于圖像區(qū)域中包含的至少一個(gè)二單元結(jié)構(gòu)中的每一個(gè)來計(jì)算該圖像區(qū)域的特征空間;以及生成單元1102,被配置用于基于所確定的特征空間來生成對(duì)象檢測(cè)分類器。優(yōu)選地,生成單元1102可包括確定單元11021,被配置用于使用啟發(fā)式算法基于所計(jì)算出的特征空間來確定圖像區(qū)域的特定單元結(jié)構(gòu)特征,其中該特定單元結(jié)構(gòu)特征對(duì)應(yīng)于從該至少一個(gè)二單元結(jié)構(gòu)獲得的特定單元結(jié)構(gòu),并且為N比特二進(jìn)制值,該N比特二進(jìn)制值中的每一個(gè)比特的值對(duì)應(yīng)于該特定單元結(jié)構(gòu)中包含的一個(gè)二單元結(jié)構(gòu)的二單元結(jié)構(gòu)特征描述符,其中由該特定單元結(jié)構(gòu)特征生成該對(duì)象檢測(cè)分類器,并且其中N大于等于1。優(yōu)選地,該確定單元11021可包括二單元結(jié)構(gòu)特征選擇單元110211,被配置用于從所計(jì)算的特征空間中選擇具有低訓(xùn)練誤差的第一數(shù)量的二單元結(jié)構(gòu)特征描述符;三單元結(jié)構(gòu)特征生成單元110212,被配置用于從所選擇的第一數(shù)量的二單元結(jié)構(gòu)特征描述符生成具有低訓(xùn)練誤差的第二數(shù)量的三單元結(jié)構(gòu)特征;以及特定單元結(jié)構(gòu)特征確定單元110213,被配置用于基于第二數(shù)量的三單元結(jié)構(gòu)特征來確定該特定單元結(jié)構(gòu)特征。優(yōu)選地,三單元結(jié)構(gòu)特征生成單元110212可進(jìn)一步包括單元 1102121,被配置用于從所選擇的第一數(shù)量的二單元結(jié)構(gòu)特征描述符中的分別與不同的兩個(gè)二單元結(jié)構(gòu)對(duì)應(yīng)的兩個(gè)二單元結(jié)構(gòu)特征描述符計(jì)算三單元結(jié)構(gòu)特征,以便獲得多個(gè)三單元結(jié)構(gòu)特征,該不同的兩個(gè)二單元結(jié)構(gòu)具有相同的中心單元和不同的相鄰單元,其中該多個(gè)三單元結(jié)構(gòu)特征中的每一個(gè)是2比特二進(jìn)制值,該2比特二進(jìn)制值中的每一個(gè)比特對(duì)應(yīng)于用于計(jì)算三單元結(jié)構(gòu)特征的二單元結(jié)構(gòu)特征描述符之一,并且其中,從該多個(gè)三單元結(jié)構(gòu)特征選擇具有低訓(xùn)練誤差的第二數(shù)量的三單元結(jié)構(gòu)特征。優(yōu)選地,特定單元結(jié)構(gòu)特征確定單元110213可進(jìn)一步包括三單元結(jié)構(gòu)特征組合單元1102131,被配置用于組合該第二數(shù)量的三單元結(jié)構(gòu)特征中所包含的不對(duì)應(yīng)于同一三單元結(jié)構(gòu)的任兩個(gè)三單元結(jié)構(gòu)特征,以獲得多個(gè)組合單元結(jié)構(gòu)特征,其中一個(gè)組合單元結(jié)構(gòu)特征是4比特二進(jìn)制值,該4比特二進(jìn)制值中的每一個(gè)比特是對(duì)應(yīng)的兩個(gè)三單元結(jié)構(gòu)特征之一中所包含的兩個(gè)二單元結(jié)構(gòu)特征描述符之一,以及選擇單元1102132,被配置用于從多個(gè)組合單元結(jié)構(gòu)特征中選擇具有最低訓(xùn)練誤差的組合單元結(jié)構(gòu)特征作為特定單元結(jié)構(gòu)特征。[有利效果]由于根據(jù)本發(fā)明的第二實(shí)施例的方法利用根據(jù)本發(fā)明的第一實(shí)施例的方法來確定二單元結(jié)構(gòu)的特征描述符,并由此獲得最終特定單元結(jié)構(gòu)特征,因此,根據(jù)本發(fā)明的第二實(shí)施例的方法實(shí)際利用了HOG的辨別力以及特征比較的簡(jiǎn)易性,計(jì)算速度以及所獲得的特征的辨別力將提高。此外,根據(jù)本發(fā)明的第二實(shí)施例的方法采用了啟發(fā)式搜索過程,而不是Haar狀特征或HOG特征常用的窮舉式搜索方法,從而高效地選擇用于分類器的訓(xùn)練的適當(dāng)特征。[第三實(shí)施例]如上所述,訓(xùn)練和檢測(cè)是圖像中對(duì)象檢測(cè)的兩個(gè)主要過程。在分類器已被訓(xùn)練生成的前提下,分類器將被用于檢測(cè)圖像中的對(duì)象。下文將描述用于輸入圖像的檢測(cè)過程的通常實(shí)現(xiàn)。輸入圖像被縮放以搜索不同大小的對(duì)象。然后,通過矩形滑動(dòng)窗口從左上到右下依次掃描一個(gè)縮放后的圖像,并且使用所訓(xùn)練生成的分類器來將每個(gè)滑動(dòng)窗口分類為含有對(duì)象或者沒有對(duì)象。分類通常逐級(jí)地進(jìn)行,從而檢測(cè)也逐級(jí)地執(zhí)行。當(dāng)在一級(jí)中滑動(dòng)窗口被分類為(檢測(cè)為)對(duì)象時(shí),分類將結(jié)束,否則,將在下一級(jí)中分類(檢測(cè))該滑動(dòng)窗口,直到該滑動(dòng)窗口被分類為對(duì)象。下文,將參照?qǐng)D12描述根據(jù)本發(fā)明的第三實(shí)施例的用于檢測(cè)圖像中的對(duì)象的方法。應(yīng)注意,這樣的方法通常對(duì)應(yīng)于針對(duì)一級(jí)的處理。在步驟S1201(下文將被稱為輸入步驟)中,輸入要被檢測(cè)的圖像區(qū)域。在步驟S1202(下文將被稱為檢測(cè)步驟)中,通過應(yīng)用由本發(fā)明的第二實(shí)施例的方法所生成的分類器來檢測(cè)在該圖像區(qū)域中是否存在要被檢測(cè)的對(duì)象。應(yīng)注意,這樣的檢測(cè)通?;谟芍辽僖粋€(gè)弱分類器構(gòu)成的一級(jí)中的強(qiáng)分類器執(zhí)行,并且該弱分類器可通過根據(jù)本發(fā)明的第二實(shí)施例的方法獲得。也就是說,術(shù)語“分類器”在下文有時(shí)指的是由一組弱分類器構(gòu)成的強(qiáng)分類器,并且下文的描述將基于這樣的基礎(chǔ)進(jìn)行?;诜诸惼鞯臋z測(cè)可被以本領(lǐng)域公知的任何方式實(shí)現(xiàn)。下文將參照?qǐng)D13詳細(xì)描述步驟S1202中的處理,并且該處理基于LUT分類器被描述。應(yīng)注意,下文的處理僅是示例,而不是限制性的。在步驟S1301(下文將被稱為特征獲得步驟)中,根據(jù)生成的分類器獲得要被檢測(cè)的圖像區(qū)域的特征。特別地,特征獲得步驟(S1301)的處理可參照該對(duì)象檢測(cè)分類器的屬性信息確定與對(duì)象檢測(cè)分類器對(duì)應(yīng)的要被檢測(cè)的圖像區(qū)域中的特定單元結(jié)構(gòu),并且獲得該特定單元結(jié)構(gòu)的特征作為該圖像區(qū)域的特征,其中該對(duì)象檢測(cè)分類器的屬性信息是關(guān)于與該對(duì)象檢測(cè)分類器對(duì)應(yīng)的單元結(jié)構(gòu)中所包含的二單元結(jié)構(gòu)的信息,關(guān)于二單元結(jié)構(gòu)的信息包括二單元結(jié)構(gòu)的組合信息、二單元結(jié)構(gòu)中包含的單元的位置信息、以及 二單元結(jié)構(gòu)中包含的單元的在其中計(jì)算梯度方向直方圖的區(qū)段的信息。一般來說,位置信息可包括單元的左上角像素的坐標(biāo)。更具體而言,根據(jù)分類器對(duì)應(yīng)的信息,確定與分類器的單元結(jié)構(gòu)以及其中的每個(gè)二單元結(jié)構(gòu)的信息對(duì)應(yīng)的要被檢測(cè)的圖像中的特定單元結(jié)構(gòu),該信息可包括二單元結(jié)構(gòu)的組合順序以及其位置和相關(guān)區(qū)段?;谶@樣的信息,在PC系統(tǒng)以及嵌入式系統(tǒng)中可經(jīng)由積分圖像迅速地計(jì)算要被檢測(cè)的圖像區(qū)域的特征。首先,將每個(gè)二單元結(jié)構(gòu)中包含的兩個(gè)單元之間的梯度統(tǒng)計(jì)值進(jìn)行比較以獲得二單元結(jié)構(gòu)特征,并且每個(gè)比較提供一個(gè)1比特值。其次,根據(jù)組合順序,將二單元結(jié)構(gòu)特征組合成三單元結(jié)構(gòu)特征,由此獲得特定單元結(jié)構(gòu)的特征作為要被檢測(cè)的圖像區(qū)域的特征,其是4比特LABHOG特征值。在步驟S1302(下文將被稱為比較步驟)中,根據(jù)分類器進(jìn)一步處理該特征,并且將由此獲得的值與分類器對(duì)應(yīng)的閾值相比較以檢測(cè)圖像區(qū)域中是否存在要被檢測(cè)的對(duì)象。更具體而言,根據(jù)每個(gè)弱分類器的LUT,可進(jìn)一步處理所計(jì)算出的LABHOG特征以獲得對(duì)應(yīng)的實(shí)值置信度作為弱分類器的對(duì)應(yīng)輸出。然后,將當(dāng)前級(jí)中的弱分類器的這些輸出進(jìn)行組合,然后形成該級(jí)的強(qiáng)分類器的輸出。應(yīng)注意,該處理可針對(duì)任何其他類型的分類器類似地實(shí)施,也就是說,對(duì)于任何其他類型的分類器,所計(jì)算的LABHOG特征可根據(jù)該分類器被進(jìn)一步處理以獲得與該類型的分類器對(duì)應(yīng)的值,然后將至少一個(gè)弱分類器中的每一個(gè)分類器對(duì)應(yīng)的值組合以獲得一級(jí)的輸出值。將該級(jí)中的強(qiáng)分類器的輸出值與在步驟S504中計(jì)算的該強(qiáng)分類器的閾值T進(jìn)行比較。如果該輸出小于該閾值T,則級(jí)聯(lián)分類器將該輸入的子窗口分類為無對(duì)象并且拒絕該輸入的子窗口,或者使該窗口進(jìn)入下一級(jí)。圖14是示出根據(jù)本發(fā)明的第三實(shí)施例的用于檢測(cè)圖像區(qū)域中的對(duì)象的設(shè)備的框圖。設(shè)備1400可包括輸入單元1401,被配置用于輸入要被檢測(cè)的圖像區(qū)域;以及檢測(cè)單元1402,被配置用于通過應(yīng)用由根據(jù)本發(fā)明的第二實(shí)施例的方法生成的分類器來檢測(cè)該圖像區(qū)域中是否存在要被檢測(cè)的對(duì)象。優(yōu)選地,該檢測(cè)單元1402可包括特征獲得單元14021,被配置用于根據(jù)生成的分類器獲得要被檢測(cè)的圖像區(qū)域的特征;以及比較單元1402,被配置用于比較根據(jù)該分類器處理該特征所獲得的值與對(duì)應(yīng)的閾值,以便檢測(cè)該圖像區(qū)域中是否存在要被檢測(cè)的對(duì)象。優(yōu)選地,該特征獲得單元14021可進(jìn)一步被配置為參照對(duì)象檢測(cè)分類器的屬性信息確定與該對(duì)象檢測(cè)分類器對(duì)應(yīng)的要被檢測(cè)的圖像區(qū)域中的特定單元結(jié)構(gòu),并且獲得該該特定單元結(jié)構(gòu)的信息作為該圖像區(qū)域的特征,該對(duì)象檢測(cè)分類器的屬性信息是與該對(duì)象檢測(cè)分類器對(duì)應(yīng)的單元結(jié)構(gòu)中包含的二單元結(jié)構(gòu)的信息,該二單元結(jié)構(gòu)的信息包含二單元結(jié)構(gòu)的組合信息,該二單元結(jié)構(gòu)中包含的單元的位置信息,以及該二單元結(jié)構(gòu)中包含的單元的在其中計(jì)算梯度方向直方圖的區(qū)段的信息。[有利效果]表1中總結(jié)了現(xiàn)有技術(shù)中的方法以及本發(fā)明的方法。這些方法的準(zhǔn)確度和效率基于它們的文章中報(bào)告的結(jié)果。表1方法比較表2中總結(jié)了前述特征。表2特征比較另外,可采用多種方式來實(shí)行本發(fā)明的方法和系統(tǒng)。例如,可通過軟件、硬件、固件或它們的任何組合來實(shí)行本發(fā)明的方法和系統(tǒng)。上文所述的該方法的步驟的順序僅是說明性的,并且除非另外具體說明,否則本發(fā)明的方法的步驟不限于上文具體描述的順序。此外,在一些實(shí)施例中,本發(fā)明還可具體化為記錄介質(zhì)中記錄的程序,包括用于實(shí)施根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因此,本發(fā)明還涵蓋了存儲(chǔ)用于實(shí)施根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已經(jīng)參考示例實(shí)施例描述了本發(fā)明,應(yīng)當(dāng)理解,本發(fā)明不限于公開的示例實(shí)施例。下面的權(quán)利要求的范圍將被給予最寬泛的解釋,以便包含所有這些修改以及等同結(jié)構(gòu)和功能。