一種基于Haar-like特征的司機(jī)面部特征快速檢測(cè)方法
【專利摘要】一種基于Haar-like特征的司機(jī)面部特征快速檢測(cè)方法,第一個(gè)階段是利用分類器對(duì)當(dāng)前圖像小塊進(jìn)行檢測(cè),并根據(jù)檢測(cè)的結(jié)果估計(jì)圖像小塊內(nèi)容與目標(biāo)的相似程度。第二個(gè)階段是根據(jù)本次的檢測(cè)結(jié)果,結(jié)合算法來對(duì)下一次檢測(cè)的結(jié)果進(jìn)行相似度估計(jì),并根據(jù)估計(jì)結(jié)果,調(diào)節(jié)搜索的步長(zhǎng)和分類器的檢測(cè)精度。第三個(gè)階段是結(jié)合司機(jī)駕駛的場(chǎng)景,根據(jù)已檢測(cè)到的包含目標(biāo)的區(qū)域的位置信息,估計(jì)目標(biāo)所在的準(zhǔn)確位置。本發(fā)明采用動(dòng)態(tài)調(diào)整分類器檢測(cè)精度的方式,在不降低準(zhǔn)確度的情況下,減少了分類器的重復(fù)調(diào)用次數(shù),縮短了檢測(cè)時(shí)間,提高了檢測(cè)效率。
【專利說明】—種基于Haar-1 ike特征的司機(jī)面部特征快速檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,屬于智能交通,模式識(shí)別領(lǐng)域、嵌入式系統(tǒng)。
【背景技術(shù)】
[0002]隨著我國經(jīng)濟(jì)的增長(zhǎng),我國居民機(jī)車保有量迅速增長(zhǎng)。在極大方便了人民出行的同時(shí),道路交通事故的發(fā)生率也在節(jié)節(jié)攀升,給人民的生命財(cái)產(chǎn)和國民經(jīng)濟(jì)造成了巨大的損失。從道路交通事故的成因來看,駕駛員是導(dǎo)致交通事故的主要因素,而行人是在交通事故中主要的受害群體。據(jù)統(tǒng)計(jì),2013我國因交通意外而死亡的行人人數(shù)約為27906人,占全部交通事故死亡人數(shù)的29.81% ;行人因交通事故而受傷的人數(shù)約為80239人,占全部交通事故受傷人數(shù)的21.32%。所以對(duì)司機(jī)駕駛狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè),在司機(jī)駕駛狀態(tài)不佳時(shí)進(jìn)行及時(shí)的提示,對(duì)預(yù)防事故和事故后處理都將產(chǎn)生積極的意義。
[0003]對(duì)司機(jī)進(jìn)行檢測(cè)主要采用司機(jī)面部特征提取方法,該方法主要是通過提取司機(jī)面部在視頻圖像中的像素灰度、梯度、紋理、顏色等信息中的一種或幾種,以區(qū)別于其他非行人物體。司機(jī)面部提取質(zhì)量的好壞將直接影響后續(xù)的檢測(cè)工作。目前,常用的方法有矢量特征、標(biāo)量特征和紋理邊緣特征等。
[0004]矢量特征:目前比較經(jīng)典的矢量特征主要有HOG (Histogram of OrientedGradient)特征、SIFT (Scale Invariant Feature Transform)特征、Shapelet 特征等。HOG特征由Dalal等學(xué)者于2005年首次提出,參見Dalai Navneet, Triggs Bill.Histograms of oriented gradients for human detection[C].Proceedings of IEEEComputer Society Conference on Computer Vision and Pattern Recognition, SanDiego, CA, United states, 2005,886-893。Dalai通過有效提取檢測(cè)目標(biāo)的邊緣梯度信息,將各邊緣梯度信息梯度方向直方圖的方式予以反映,并對(duì)各梯度方向的直方圖進(jìn)行綜合歸納與描述來提取目標(biāo)的邊緣共性特征,由于該特征將圖像分割成很小的單元格,并在其中進(jìn)行提取邊緣梯度、計(jì)算梯度直方圖等操作,使該特征具有較好的光照不變性、尺度不變性和抗擾動(dòng)能力,但由于算法特征維數(shù)較高影響了算法的實(shí)時(shí)性。SIFT特征是由Lowe于2004年首次提出的一種矢量特征提取算法,參見Lowe D M..Distinctive imagefeatures from scale-1nvariant keypoints[J].1nternational Journal of ComputerVision, 2004, 60(2):91_110。該特征具有比HOG特征性能更為優(yōu)越的魯棒性,對(duì)視頻圖像因外界光照、尺度、位移等產(chǎn)生的變化都具有良好的容忍性。然而該特征計(jì)算量復(fù)雜,維度較高,如何降低其維度,實(shí)現(xiàn)實(shí)時(shí)性較好的特征有效提取還是一個(gè)懸而未決的難題。Shapelet特征也是一種矢量梯度特征,該特征最早由Refregier提出,參見RefregierA.Shapelets:1.A method for image analysis[J].Monthly Notice of the RoyalAstronomical Society, 2003, 338(1):35_47。該特征也具有較強(qiáng)的排他性和判別能力,缺點(diǎn)同樣也是計(jì)算較為復(fù)雜,實(shí)時(shí)性有待提高。
[0005]除了矢量特征,還有學(xué)者嘗試使用紋理特征和邊緣梯度特征來進(jìn)行檢測(cè),參見 Yang Hee-Deok, Lee Seong-ffhan.Multiple pedestrian detection and trackingbased on weighted temporal texture features[C].Proceedings of InternationalConference on Pattern Recognition, British Machine Vis Assoc, Cambridge, ENGLAND,2004,248-251。
[0006]本發(fā)明選擇Haar-1ike系列特征,這是一種比較典型的標(biāo)量特征。Haar-1ike特征是由 Papageorgiou、Viola 等提出的,參見 Viola P., Jones M.Robust real-time facedetection[J].1nternational Journal of Computer Vision, 2004,52(2):137-154 ;Viola P,Jones MJ, Snow D.Detecting pedestrians using patterns of motion andappearance[J].1nternational Journal of Computer Vision,2005, 63(2):153-161Papageorgiou C, Poggio T.A trainable system for object detection [J].1nternationalJournal of Computer Vision, 2000,38 (I): 15-33。該特征由其外觀類似圖像處理中的Haar小波變換示意圖而得名。比起前面提到HOG特征、SIFT特征、Shapelet特征等矢量特征以及紋理特征,它具有計(jì)算速度快,實(shí)時(shí)性好,魯棒性較好的特點(diǎn)。
[0007]提取Haar-1 ike特征后,傳統(tǒng)方法是結(jié)合AdaBoost進(jìn)行分類器學(xué)習(xí)并將強(qiáng)分類器進(jìn)行級(jí)聯(lián),獲得一個(gè)性能較為理想的復(fù)雜分類器,然后利用復(fù)雜分類器對(duì)圖像進(jìn)行檢測(cè),進(jìn)而獲得目標(biāo)位置。這種方法在檢測(cè)過程中,采用的是靜態(tài)分類器精度進(jìn)行檢測(cè)。其不足之處在于:不能根據(jù)圖像內(nèi)容調(diào)整分類器檢測(cè)精度,即分類器始終從第一層開始調(diào)用。因而在檢測(cè)過程中進(jìn)行了大量的重復(fù)計(jì)算,效率較低。
【發(fā)明內(nèi)容】
[0008]本發(fā)明技術(shù)解決問題:克服現(xiàn)有技術(shù)的不足,提供一種基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,采用根據(jù)圖像與目標(biāo)的相似度,動(dòng)態(tài)調(diào)整分類器檢測(cè)精度的方式,在不降低準(zhǔn)確度的情況下,減少了分類器的重復(fù)調(diào)用次數(shù),縮短了檢測(cè)時(shí)間,提高了檢測(cè)效率。
[0009]本發(fā)明的技術(shù)方案分三個(gè)階段,第一個(gè)階段是利用分類器對(duì)當(dāng)前圖像小塊進(jìn)行檢測(cè),并根據(jù)檢測(cè)的結(jié)果估計(jì)圖像小塊內(nèi)容與目標(biāo)的相似程度。第二個(gè)階段是根據(jù)本次的檢測(cè)結(jié)果,結(jié)合算法來對(duì)下一次檢測(cè)的結(jié)果進(jìn)行相似度估計(jì),并根據(jù)估計(jì)結(jié)果,調(diào)節(jié)搜索的步長(zhǎng)和分類器的檢測(cè)精度。第三個(gè)階段是結(jié)合司機(jī)駕駛的場(chǎng)景,根據(jù)已檢測(cè)到的包含目標(biāo)的區(qū)域的位置信息,估計(jì)目標(biāo)所在的準(zhǔn)確位置。
[0010](I)圖像塊與目標(biāo)的相似度估計(jì)
[0011]檢測(cè)采用滑動(dòng)窗口的方式。即在感興趣區(qū)域內(nèi)設(shè)置一滑動(dòng)窗口,檢測(cè)時(shí),滑動(dòng)窗口在感興趣區(qū)域內(nèi)從左向右,從上到下進(jìn)行搜索。窗口位置每調(diào)整一次,將其中的圖像輸入分類器進(jìn)行判斷,若能通過分類器判斷,則認(rèn)為是候選目標(biāo)。根據(jù)分類器對(duì)窗口內(nèi)圖像塊的判定結(jié)果,估計(jì)圖像塊與目標(biāo)的相似度。
[0012](2)調(diào)整滑動(dòng)窗口的檢測(cè)位置和分類器精度
[0013]根據(jù)上一階段的估計(jì)結(jié)果,計(jì)算下一次檢測(cè)的滑動(dòng)窗口位置和分類器的精度。根據(jù)計(jì)算結(jié)果,滑動(dòng)窗口移動(dòng)到指定位置,同時(shí)調(diào)整分類器的檢測(cè)精度,對(duì)窗口內(nèi)的圖像塊進(jìn)行檢測(cè)。檢測(cè)完成后,再進(jìn)行上一階段的相似度估計(jì),如此反復(fù),直到滿足結(jié)束條件,則檢測(cè)結(jié)束。檢測(cè)結(jié)束后,需要根據(jù)檢測(cè)的結(jié)果,進(jìn)行目標(biāo)準(zhǔn)確位置的估計(jì)[0014](3)估計(jì)目標(biāo)準(zhǔn)確位置
[0015]在上一階段檢測(cè)結(jié)束后,進(jìn)行目標(biāo)準(zhǔn)確位置的估計(jì)。在檢測(cè)過程中,分類器對(duì)滑動(dòng)窗口中的圖像塊進(jìn)行檢測(cè),若圖像塊能夠通過分類器的檢測(cè),則將此圖像塊作為候選目標(biāo),并記錄位置。在檢測(cè)結(jié)束后,根據(jù)記錄的所有候選目標(biāo)的位置,估計(jì)出目標(biāo)的準(zhǔn)確位置,作為整個(gè)檢測(cè)算法的輸出。
[0016]如圖1所示,本發(fā)明具體實(shí)現(xiàn)如下:
[0017](I)從攝像頭讀取一幀視頻流圖像;
[0018](2)將讀取的視頻流圖像中的MJPEG格式圖像解碼為灰度圖;
[0019](3)根據(jù)上一幀的檢測(cè)結(jié)果,確定當(dāng)前幀檢測(cè)的感興趣區(qū)域;
[0020](4)計(jì)算檢測(cè)的感興趣區(qū)域的積分圖;[0021](5)根據(jù)積分圖計(jì)算感興趣區(qū)域的Haar-1ike特征;
[0022](6)設(shè)定檢測(cè)的起始點(diǎn),檢測(cè)采用滑動(dòng)窗口的方式,即在感興趣區(qū)域內(nèi)設(shè)置滑動(dòng)窗口,檢測(cè)時(shí),滑動(dòng)窗口在感興趣區(qū)域從左上角開始,從左向右,從上到下地滑動(dòng);
[0023](7)利用分類器對(duì)滑動(dòng)窗口內(nèi)的圖像塊進(jìn)行檢測(cè),在滑動(dòng)窗口檢測(cè)的過程中,滑動(dòng)窗口每移動(dòng)一次,就利用分類器對(duì)滑動(dòng)窗口內(nèi)的圖像塊進(jìn)行檢測(cè);
[0024](8)根據(jù)分類器檢測(cè)結(jié)果,估計(jì)滑動(dòng)窗口內(nèi)的圖像與目標(biāo)圖像的相似度;
[0025](9)根據(jù)上一步估計(jì)的相似度,計(jì)算下一次檢測(cè)滑動(dòng)窗口的移動(dòng)步長(zhǎng)和分類器的檢測(cè)精度;
[0026](10)估計(jì)目標(biāo)的準(zhǔn)確位置,采用分類器,對(duì)滑動(dòng)窗口內(nèi)的圖像塊進(jìn)行檢測(cè),若滑動(dòng)窗口內(nèi)的圖像塊通過分類器的檢測(cè),則認(rèn)為是候選目標(biāo),記錄圖像塊的位置;根據(jù)所有通過分類器的圖像塊的位置,融合得到目標(biāo)的位置;最后根據(jù)得到的目標(biāo)位置,估計(jì)出目標(biāo)的準(zhǔn)確位置;
[0027](11)輸出目標(biāo)位置,并進(jìn)行下一幀的檢測(cè)。
[0028]所述步驟(6)具體實(shí)現(xiàn)如下:
[0029](61)設(shè)第k幀時(shí),在圖像中設(shè)置感興趣區(qū)域Dk,感興趣區(qū)域?yàn)榫匦?,左上角的坐?biāo)為(xk,yk)寬度和高度分別為W、H ;再設(shè)置一個(gè)滑動(dòng)窗口 Wink,滑動(dòng)窗口為矩形,矩形左上角
坐標(biāo)為, Whi 其中η為在同一幀內(nèi)滑動(dòng)窗口的滑動(dòng)次數(shù),寬度和高度分別為Ww、Hw,且 O < Ww < W、0 < Hw < H ;
[0030](62)在開始檢測(cè)時(shí),滑動(dòng)窗口從矩形的左上角開始滑動(dòng),即:
[0031]二 Xit , 二少*
[0032]滑動(dòng)窗口滑動(dòng)的方式為從左到右、從上到下,在感興趣區(qū)域的第一行,即RDk = 1,窗口從左向右移動(dòng),步長(zhǎng)為”,當(dāng)移動(dòng)到本行行末時(shí),即當(dāng)WXni k A+,-1時(shí),本行搜索結(jié)束;窗口移動(dòng)到第二行,即第RDk = 2行,豎直方向移動(dòng)步長(zhǎng)為.,窗口左上角坐標(biāo)變?yōu)闅??^yk+ysn,;滑動(dòng)窗口在第二行仍然從左向右移動(dòng),直到到達(dá)行末,即當(dāng)窗口左上角坐標(biāo)變?yōu)?^ +W-Ww,Wynt =八時(shí),滑動(dòng)窗口再移動(dòng)到第三行右側(cè)進(jìn)行檢測(cè);如此反復(fù),直到滿足截止條件,則檢測(cè)結(jié)束。
[0033]所述步驟(7)分類器的組織形式為多層弱分類器串聯(lián)的形式,其組織形式如下:設(shè)整個(gè)分類器由N個(gè)弱分類器串聯(lián)而成;每一層均對(duì)滑動(dòng)窗口內(nèi)的圖像塊進(jìn)行判定,滑動(dòng)窗口內(nèi)的圖像塊只有通過前一級(jí)分類器,才能接受下一級(jí)的判定,有一級(jí)分類器做出否定判決,則判定圖像塊不是目標(biāo),不進(jìn)行下一級(jí)的判定;只有通過分類器所有層的判定,
圖像塊才能成為候選目標(biāo),圖像塊£^位置記為(Ca、,CVllj )?
[0034]所述步驟(8)根據(jù)分類器檢測(cè)結(jié)果,估計(jì)窗口內(nèi)的圖像與目標(biāo)圖像的相似度的具體過程如下:
[0035](I)在步驟(7)中,用分類器對(duì)圖像塊 <;進(jìn)行檢測(cè);根據(jù)圖像塊通過的分類器層數(shù),估計(jì)出圖像塊與目標(biāo)的相似度,即,與目標(biāo)越相似度越大,則通過的分類器層數(shù)越多;與目標(biāo)相似度越小,則通過分類器的層數(shù)越少;因此圖像塊<^通過的分類器最大層數(shù)Cnr O < Cni < N,能夠反映出圖像塊與目標(biāo)T的相似度;Cfit越大,表示《與T越相似
度越大越小,表亍d與T相似度越小,采用表示圖像塊<與目標(biāo)T的相似度;
[0036](2)根據(jù)步驟(7)中定義的分類器形式,利用步驟(1)中提出的相似度估計(jì),對(duì)圖像塊與目標(biāo)T的相似度進(jìn)行估計(jì);估計(jì)的結(jié)果為圖像塊尤4通過的分類器最大層數(shù)
1、表示了圖像塊畋與目標(biāo)T的相似度。
[0037]所述步驟(9)中的滑動(dòng)窗口步長(zhǎng)的計(jì)算,包括滑動(dòng)窗口水平移動(dòng)步長(zhǎng)和滑動(dòng)窗口垂直移動(dòng)步長(zhǎng),
[0038]其中滑動(dòng)窗口水平移動(dòng)步長(zhǎng)xsnk計(jì)算過程如下:
【權(quán)利要求】
1.一種基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,其特征在于實(shí)現(xiàn)步驟如下: (1)從攝像頭讀取一幀視頻流圖像; (2)將讀取的視頻流圖像中的MJPEG格式圖像解碼為灰度圖; (3)根據(jù)上一幀的檢測(cè)結(jié)果,確定當(dāng)前幀檢測(cè)的感興趣區(qū)域; (4)計(jì)算檢測(cè)的感興趣區(qū)域的積分圖; (5)根據(jù)積分圖計(jì)算感興趣區(qū)域的Haar-1ike特征; (6)設(shè)定檢測(cè)的起始點(diǎn),檢測(cè)采用滑動(dòng)窗口的方式,即在感興趣區(qū)域內(nèi)設(shè)置滑動(dòng)窗口,檢測(cè)時(shí),滑動(dòng)窗口在感興趣區(qū)域從左上角開始,從左向右,從上到下地滑動(dòng); (7)利用分類器對(duì)滑動(dòng)窗口內(nèi)的圖像塊進(jìn)行檢測(cè),在滑動(dòng)窗口檢測(cè)的過程中,滑動(dòng)窗口每移動(dòng)一次,就利用分類器對(duì)滑動(dòng)窗口內(nèi)的圖像塊進(jìn)行檢測(cè); (8)根據(jù)分類器檢測(cè)結(jié)果,估計(jì)滑動(dòng)窗口內(nèi)的圖像與目標(biāo)圖像的相似度; (9)根據(jù)上一步估計(jì)的相似度,計(jì)算下一次檢測(cè)滑動(dòng)窗口的移動(dòng)步長(zhǎng)和分類器的檢測(cè)精度; (10)估計(jì)目標(biāo)的準(zhǔn)確位置,采用分類器,對(duì)滑動(dòng)窗口內(nèi)的圖像塊進(jìn)行檢測(cè),若滑動(dòng)窗口內(nèi)的圖像塊通過分類器的檢測(cè),則認(rèn)為是候選目標(biāo),記錄圖像塊的位置;根據(jù)所有通過分類器的圖像塊的位置,融合得到目標(biāo)的位置;最后根據(jù)得到的目標(biāo)位置,估計(jì)出目標(biāo)的準(zhǔn)確位置; (11)輸出目標(biāo)位置,并進(jìn)行下一幀的檢測(cè)。
2.根據(jù)權(quán)利要求1所述的基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,其特征在于:所述步驟(6)具體實(shí)現(xiàn)如下: (61)設(shè)第k幀時(shí),在圖像中設(shè)置感興趣區(qū)域Dk,感興趣區(qū)域?yàn)榫匦危笊辖堑淖鴺?biāo)為(xk, yk),寬度和高度分別為W、H ;再設(shè)置一個(gè)滑動(dòng)窗口 Wink,滑動(dòng)窗口為矩形,矩形左上角坐標(biāo)為Ui ,),其中η為在同一幀內(nèi)滑動(dòng)窗口的滑動(dòng)次數(shù),寬度和高度分別為Ww、Hw,且 O < Ww < W、0 < Hw < H ; (62)在開始檢測(cè)時(shí),滑動(dòng)窗口從矩形的左上角開始滑動(dòng),即: U' =Λ、 HT = 滑動(dòng)窗口滑動(dòng)的方式為從左到右、從上到下,在感興趣區(qū)域的第一行,即RDk= 1,窗口從左向右移動(dòng),步長(zhǎng)為XSnt ;當(dāng)移動(dòng)到本行行末時(shí),即當(dāng)2 Xfr + IF 時(shí),本行搜索結(jié)束;窗口移動(dòng)到第二行,即第RDk = 2行,豎直方向移動(dòng)步長(zhǎng)為^ ,窗口左上角坐標(biāo)變?yōu)? =xk , =凡+>^;滑動(dòng)窗口在第二行仍然從左向右移動(dòng),直到到達(dá)行末,即當(dāng)窗口左上角坐標(biāo)變?yōu)?Ww,wy,h = Jit + IV時(shí),滑動(dòng)窗口再移動(dòng)到第三行右 側(cè)進(jìn)行檢測(cè);如此反復(fù),直到滿足截止條件,則檢測(cè)結(jié)束。
3.根據(jù)權(quán)利要求1所述的基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,其特征在于:所述步驟(7)分類器的組織形式為多層弱分類器串聯(lián)的形式,其組織形式如下:設(shè)整個(gè)分類器由N個(gè)弱分類器串聯(lián)而成;每一層均對(duì)滑動(dòng)窗口內(nèi)的圖像塊七^進(jìn)行判定,滑動(dòng)窗口內(nèi)的圖像塊只有通過前一級(jí)分類器,才能接受下一級(jí)的判定,有一級(jí)分類器做出否定判決,則判定圖像塊d f是目標(biāo),不進(jìn)行下一級(jí)的判定;只有通過分類器所有層的判定,圖像塊dnt才能成為候選目標(biāo),圖像塊dnt位置記為, cy,h )。
4.根據(jù)權(quán)利要求1所述的基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,其特征在于:所述步驟(8)根據(jù)分類器檢測(cè)結(jié)果,估計(jì)窗口內(nèi)的圖像與目標(biāo)圖像的相似度的具體過程如下: (1)在步驟(7)中,用分類器對(duì)圖像塊< 進(jìn)行檢測(cè);根據(jù)圖像塊W通過的分類器層數(shù),估計(jì)出圖像塊與目標(biāo)的相似度,即,與目標(biāo)越相似度越大,則通過的分類器層數(shù)越多;與目標(biāo)相似度越小,則通過分類器的層數(shù)越少;因此圖像塊通過的分類器最大層數(shù)?,;,O < Cnt < N,能夠反映出圖像塊與目標(biāo)T的相似度越大,表示&與T越相似度越大c越小,表示 < 與T相似度越小,采用ci(表示圖像塊< 與目標(biāo)T的相似度;(2)根據(jù)步驟(7)中定義的分類器形式,利用步驟(1)中提出的相似度估計(jì),對(duì)圖像塊 < 與目標(biāo)T的相似度進(jìn)行估計(jì);估計(jì)的結(jié)果為圖像塊 < 通過的分類器最大層數(shù)c Cnt表示了圖像塊4 λ與目標(biāo)T的相似度。
5.根據(jù)權(quán)利要求1所述的基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,其特征在于:所述步驟(9)中的滑動(dòng)窗口步長(zhǎng)的計(jì)算,包括滑動(dòng)窗口水平移動(dòng)步長(zhǎng)和滑動(dòng)窗口垂直移動(dòng)步長(zhǎng), 其中滑動(dòng)窗口水平移動(dòng)步長(zhǎng)計(jì)算過程如下:
6.根據(jù)權(quán)利要求1所述的基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,其特征在于:所述步驟(9)中的分類器檢測(cè)精度計(jì)算公式如下:
7.根據(jù)權(quán)利要求1所述的基于Haar-1ike特征的司機(jī)面部特征快速檢測(cè)方法,其特征在于:所述步驟(10)估計(jì)目標(biāo)準(zhǔn)確位置過程為: (I)確定檢測(cè)的截止條件 若圖像塊七,能夠通過分類器所有層的判定,則該圖像塊定義為候選目標(biāo),此時(shí)滑動(dòng)窗口的位置記錄為),其中m表不第m個(gè)候選目標(biāo); 每獲得m個(gè)候選目標(biāo),即在m = M、2M、3M……時(shí),就對(duì)檢測(cè)結(jié)果進(jìn)行一次融合,融合采用重疊面積加權(quán)的方式,融合規(guī)則如下: (II)記錄已檢測(cè)到的候選目標(biāo)的位置為「,CJli)、(cx2(—, CV2t)……{cxm_h— ,cym_lt), ,CVilh >吳it @牛示白勺@@為矩矛口胃S分別為Ww、Hw ;(12)計(jì)算各候選目標(biāo)兩兩間的重疊面積,記為Slli,表示候選目標(biāo)區(qū)域I和i的重疊面積,計(jì)算方法如下:
Wji = min(cx/;, cx“ ) + Wv: — max(cx/;, cxi;)
"/i/ = min(cy/; ,cy.) + Hw - max(cy/; ,cy.)
Slli = WlliXHlli 其中Au、Hlli分別為重疊區(qū)域的寬度和高度;重疊面積為Slli, i和I分別表示第i個(gè)和第I個(gè)候選目標(biāo),且i, I e {x 11 < X < m, X e N}, i古I ; (13)進(jìn)行結(jié)果融合,獲得目標(biāo)的位置,計(jì)算公式如下:
【文檔編號(hào)】G06K9/62GK103902990SQ201410163867
【公開日】2014年7月2日 申請(qǐng)日期:2014年4月22日 優(yōu)先權(quán)日:2014年4月22日
【發(fā)明者】凌強(qiáng), 李佳桐, 李峰 申請(qǐng)人:中國科學(xué)技術(shù)大學(xué)