一種多模型多閾值組合的行人檢測方法
【專利摘要】本發(fā)明公開了一種多模型多閾值組合的行人檢測方法,通過聯(lián)合兩種不同檢測手段,選擇不同檢測模型和檢測閾值,形成多個(gè)檢測子模塊,組成并聯(lián)檢測結(jié)構(gòu),同時(shí)檢測1個(gè)圖像,檢測結(jié)果形成一個(gè)合集,作為候選集;再按可信度的方法去除誤判和合并相同檢測。實(shí)現(xiàn)了平均檢測率提高約20%,達(dá)到85%以上,同時(shí)平均誤報(bào)率<10%;相較于單獨(dú)使用DPM或ICF進(jìn)行檢測,若檢測率達(dá)到85%,則平均誤報(bào)率>30%的檢測效率來說,實(shí)現(xiàn)了檢測效率上的極大的提升。
【專利說明】一種多模型多閾值組合的行人檢測方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及一種多模型多閾值組合的行人檢測方法。
【背景技術(shù)】
[0002] 目前,對于靜止圖像,比較好的行人檢測方法主要有2個(gè):
[0003] 可變形部件模型(DPM:DeformablePartModel)
[0004] ObjectDetectionwithDiscriminativelyTrainedPartBasedModels, P.Felzenszwalb,R.Girshick, 2010 ;
[0005] CascadeObjectDetectionwithDeformablePartModels,P.Felzenszwalb,R. Girshick, 2010。
[0006] 集成通道特征模型(ICF:IntegralChannelFeatures)
[0007] PedestrianDetection:AnEvaluationoftheStateoftheArt,Piotr Dollar,2012 ;
[0008] TheFastestPedestrianDetectorintheWest,PiotrDollar,2010;
[0009] IntegralChannelFeatures,PiotrDollar, 2009。
[0010] 這些方法,對于公開的典型的行人數(shù)據(jù)庫,往往能達(dá)到比較好的檢測效果,這可能 是因?yàn)橛?xùn)練時(shí)使用了這些行人數(shù)據(jù)庫中的樣本。但是,在實(shí)際圖像中,場景、景深、攝像機(jī)圖 像質(zhì)量、行人著裝、拍攝角度等情況很復(fù)雜,上述的2種方法不能適應(yīng)各種情況。
[0011] 考慮某一種檢測方法,若調(diào)整閾值,在提高檢測率的同時(shí),誤報(bào)率也會(huì)提高;若對 于各種場景都選擇正樣本,再進(jìn)行訓(xùn)練,則實(shí)際應(yīng)用過程比較復(fù)雜;同時(shí),測試中也發(fā)現(xiàn),若 盡可能多的包含各種情況的正負(fù)樣本,訓(xùn)練后的檢測效果不一定能適應(yīng)各種情況,也就是 說,仍然對于一些場景的檢測效果不理想。
【發(fā)明內(nèi)容】
[0012] 為了解決目前采用單種檢測方法不能有效準(zhǔn)確的對圖像中行人進(jìn)行檢測的技術(shù) 問題,本發(fā)明提供一種綜合多種檢測方法和手段以達(dá)到準(zhǔn)確的行人檢測的多模型多閾值組 合的行人檢測方法。
[0013] 為了實(shí)現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案是,
[0014] 一種多模型多閾值組合的行人檢測方法,包括以下步驟:
[0015] 步驟一:通過不同的訓(xùn)練模型和閾值,建立至少一個(gè)可變形部件模型DPM和至少 一個(gè)集成通道特征模型ICF來作為不同的檢測子模塊,并根據(jù)檢測子模塊的訓(xùn)練模型和閾 值來賦予各檢測子模塊不同的可信度;
[0016] 步驟二:將靜態(tài)圖像分別輸入至步驟一中建立的檢測子模塊中,分別得出各檢測 子模塊輸出的包括檢測方框的圖像作為初步檢測結(jié)果;
[0017] 步驟三:將可信度最高的檢測子模塊所輸出的初步檢測結(jié)果存入最終檢測結(jié)果 集;
[0018] 步驟四:按可信度降序依次檢測余下的除最低可信度外的檢測子模塊所輸出的 初步檢測結(jié)果,檢測方法為將當(dāng)前所檢測的本級可信度初步檢測結(jié)果內(nèi)的檢測方框與高一 級可信度的檢測方框進(jìn)行包含內(nèi)容的對比,若本級可信度的檢測方框與高一級可信度的檢 測方框有重疊部分,且兩個(gè)方框的重疊面積占高一級可信度的檢測方框的面積的比例超過 60%,則刪除本級可信度的檢測方框,否則保留,直至完成所有初步檢測結(jié)果的檢測;
[0019] 步驟五:取完成步驟四后所保留的全部檢測方框,和最低可信度的檢測子模塊的 檢測方框一起組成候選集;在候選集中選擇2個(gè)不同檢測方框,組成1個(gè)方框組,并在候選 集中遍歷全部方框來組成方框組,然后判斷每個(gè)方框組中的2個(gè)方框是否為重復(fù)方框,判 斷過程為:對于2個(gè)檢測方框,方框a和方框b,若方框b和方框a的重疊面積與方框b的 面積之比大于60 %,同時(shí)min(方框a面積,方框b面積)/max(方框a面積,方框b面 積)>70%,且方框a為ICF檢測子模塊輸出的檢測結(jié)果,則刪除方框a,否則保留方框a;
[0020] 步驟六:取完成步驟五后所保留的全部檢測方框,作為候選集,進(jìn)行誤判消除處 理;誤判指方框內(nèi)無行人或者兩個(gè)位置相近的方框包含同一個(gè)人。先檢查每個(gè)方框,判斷是 否為"無行人",若是則刪除此方框,再在候選集中選擇2個(gè)不同檢測方框,組成1個(gè)方框組, 并在候選集中遍歷全部方框來組成方框組,然后判斷每個(gè)方框組中的2個(gè)方框是否位置接 近,若接近則判斷是否"包含同一個(gè)人",若是則刪除對應(yīng)的檢測計(jì)分較小或者可信度等級 較低的方框,將保留下的檢測方框存入最終檢測結(jié)果集;
[0021] 步驟七:綜合所有最終檢測結(jié)果集中的檢測方框,輸出檢測結(jié)果。
[0022] 所述的的方法,所述的DPM檢測子模塊包括采用inria作為訓(xùn)練庫和V〇c2007作 為訓(xùn)練庫的檢測子模型,所述的ICF檢測子模塊包括采用inria、caltech、tud和eth作為 訓(xùn)練庫的檢測子模型。
[0023] 所述的的方法,所述的采用inria作為訓(xùn)練庫的DPM檢測子模塊的數(shù)量為三個(gè),分 別為采用高閾值、中閾值和低閾值的檢測子模型,所述的高閾值對應(yīng)低檢測率,所述的低閾 值對應(yīng)高檢測率。
[0024] 所述的的方法,所述的高、中、低閾值分別為:0. 8, -0. 3, -0. 9。
[0025] 所述的的方法,所述的ICF檢測子模塊采用inria、caltech、tud和eth行人數(shù)據(jù) 庫中高度>75pixels的行人對象作為正樣本進(jìn)行訓(xùn)練,正樣本的數(shù)量不少于20000個(gè),負(fù)樣 本采用除行人外的其他圖片進(jìn)行訓(xùn)練,負(fù)樣本的數(shù)量不少于100萬個(gè)。
[0026] 所述的方法,所述的ICF檢測子模塊在圖像處理完成后還進(jìn)行自適應(yīng)閾值檢測, 所述的自適應(yīng)閾值檢測過程包括以下步驟:
[0027] 步驟I:ICF檢測子模塊處理1張圖像后,得到的每個(gè)檢測結(jié)果關(guān)聯(lián)1個(gè)檢測計(jì)分, 選擇檢測計(jì)分大于預(yù)設(shè)的計(jì)分閾值的檢測結(jié)果;
[0028] 步驟2 :對于步驟1的結(jié)果,根據(jù)預(yù)設(shè)的接收比率按檢測計(jì)分降序保留檢測結(jié)果;
[0029] 步驟3 :若步驟2的結(jié)果中包含的檢測結(jié)果數(shù)目超過上限數(shù)目,則根據(jù)上限數(shù)目按 檢測計(jì)分降序保留檢測結(jié)果。
[0030] 所述的方法,自適應(yīng)閾值檢測中,步驟1中的計(jì)分閾值為15,步驟2中的接收比例 為50%,步驟3中的上限數(shù)目為6.
[0031] 所述的方法,步驟六中所述的誤判消除處理包含以下步驟:
[0032] 先判斷方框內(nèi)是否"無行人":以預(yù)設(shè)的canny檢測閾值和梯度圖閾值計(jì)算方框內(nèi) 圖像的canny邊緣和梯度圖,并計(jì)算出垂直方向的梯度圖,將canny邊緣圖和垂直梯度圖轉(zhuǎn) 換為二值圖像;然后掃描canny邊緣圖和垂直梯度圖的每一行,統(tǒng)計(jì)每一行中屬于邊緣或 梯度的點(diǎn),即前景點(diǎn)的數(shù)目,為〇表示這一行中沒有前景點(diǎn),這樣形成2個(gè)數(shù)組,數(shù)組的元素 的值為每一行中前景點(diǎn)的數(shù)目,元素的數(shù)目為以像素點(diǎn)數(shù)目計(jì)算的方框的高度,分別稱為 邊緣數(shù)組和梯度數(shù)組;再分別統(tǒng)計(jì)2個(gè)數(shù)組中的連續(xù)出現(xiàn)元素值為O的區(qū)間,并求出長度最 大的區(qū)間,計(jì)算此長度與總的元素?cái)?shù)目之比,將計(jì)算值稱為邊緣背景比率和梯度背景比率, 若梯度背景比率大于預(yù)設(shè)的梯度背景閾值,或者邊緣背景比率和梯度背景比率同時(shí)大于邊 緣梯度背景閾值,則認(rèn)為方框內(nèi)無行人;
[0033] 再判斷是否"兩個(gè)位置相近的方框包含同一個(gè)人":首先計(jì)算左上角的坐標(biāo)之差, 再計(jì)算面積比率,公式為:min(方框1面積,方框2面積)/max(方框1面積,方框2面 積),若坐標(biāo)之差小于預(yù)設(shè)的坐標(biāo)閾值,并且面積比率大于預(yù)設(shè)的面積閾值,則認(rèn)為位置接 近,否則認(rèn)為不是"兩個(gè)位置相近的方框包含同一個(gè)人";將2個(gè)位置接近的方框分都為上 下部分,上部分占總面積的約60%,作為ROI區(qū)域,分別計(jì)算2個(gè)方框的ROI區(qū)域的CEDD特 征,若2個(gè)CEDD特征的特征距離小于CEDD特征閾值,則認(rèn)為2個(gè)方框包含同一個(gè)人。
[0034] 所述的方法,所述的canny檢測閾值為0. 3?0. 4,所述的梯度圖閾值為0. 2? 〇. 3,所述的梯度背景閾值為50 % -60 %,所述的邊緣梯度背景閾值為40 % -50 %,所述的坐 標(biāo)閾值為4-6,所述的面積閾值為50% -70%,所述的CEDD特征閾值為1-3。
[0035] 本發(fā)明的技術(shù)效果在于,通過聯(lián)合兩種不同檢測手段,選擇不同檢測模型和檢測 閾值,形成多個(gè)檢測子模塊,組成并聯(lián)檢測結(jié)構(gòu),同時(shí)檢測1個(gè)圖像,檢測結(jié)果形成一個(gè)合 集,作為候選集;再按可信度的方法去除誤判和合并相同檢測。實(shí)現(xiàn)了平均檢測率提高約 20 %,達(dá)到85 %以上,同時(shí)平均誤報(bào)率〈10 %;相較于單獨(dú)使用DPM或ICF進(jìn)行檢測,若檢測 率達(dá)到85%,則平均誤報(bào)率>30%的檢測效率來說,實(shí)現(xiàn)了檢測效率上的極大的提升。
[0036] 下面結(jié)合附圖對本發(fā)明作進(jìn)一步說明。
【專利附圖】
【附圖說明】
[0037] 圖1為本發(fā)明的檢測方法原理圖;
[0038] 圖2為本發(fā)明的基于可信度的處理方法的流程示意圖;
[0039] 圖3為本發(fā)明不同可信度檢測方框重疊示意圖,其中圖a為當(dāng)前可信度檢測方框 包含上一等級檢測方框的全部,圖b為和上一等級的檢測方框的大部分相互重疊;
[0040] 圖4為本發(fā)明采用不同檢測子模塊的檢測結(jié)果示意圖,其中a是由inria訓(xùn)練的 高閾值DPM檢測子模塊的檢測結(jié)果,b是由inria訓(xùn)練的中閾值DPM檢測子模塊的檢測結(jié) 果,c是由inria訓(xùn)練的低閾值DPM檢測子模塊的檢測結(jié)果,d是由V〇c2007訓(xùn)練的DPM檢 測子模塊的檢測結(jié)果,e是ICF檢測子模塊的檢測結(jié)果;
[0041] 圖5為本發(fā)明對單幅圖片的最終檢測輸出結(jié)果;
[0042] 圖6為本發(fā)明對不同圖片進(jìn)行行人檢測所得出的結(jié)果;
[0043] 圖7為DPM檢測模塊的工作流程;
[0044] 圖8為ICF檢測模塊的工作流程;
[0045] 圖9為"誤判消除"的原理圖,其中圖9A為誤判方框圖,圖9B為垂直方向梯度圖, 圖9C為canny邊緣圖,圖9D為位置接近的檢測方框示意圖。
【具體實(shí)施方式】
[0046] 本實(shí)施例中提及的voc2007 來自:ThePASCALVisualObjectClasses Challenge2007,可參見:
[0047] http://pascallin.ecs.soton.ac.uk/challenges/V0C/voc2007/;
[0048] inria、caltech、tud和eth來自'RelatedDatasets"of"CaltechPedestrian DetectionBenchmark";可參見:
[0049] http://www.vision,caltech.edu/Image_Datasets/CaltechPedestrians/
[0050] 在本實(shí)施例中,"DPM檢測子模塊"的算法原理詳見以下論文:
[0051] ObjectDetectionwithDiscriminativelyTrainedPartBasedModels, P.Felzenszwalb,R.Girshick, 2010 ;
[0052] 算法程序詳見:http://www.cs.berkeley.edu/ ?rbg/latent/ ;本實(shí)施例中的 DPM檢測子模塊直接來自以上開源程序,未做修改。
[0053] 參見圖7,DPM的分類器采用基本SVM和struct-Latent-SVM相結(jié)合,采用一定大 小的滑動(dòng)窗口,以一定的步長在圖像上移動(dòng),然后計(jì)算滑動(dòng)窗口內(nèi)的圖像的特征向量,然后 計(jì)算此特征向量與權(quán)值(權(quán)值為訓(xùn)練的結(jié)果)的點(diǎn)積,得到一個(gè)標(biāo)量值,此標(biāo)量值即為"檢 測計(jì)分"。對于一般的單閾值檢測,閾值確定方法為:對于測試集,先確定期望的檢測率和誤 報(bào)率,再找出滿足檢測率和誤報(bào)率的score分界值作為閾值。
[0054] 在本實(shí)施例中,ICF檢測子模塊"的算法原理詳見以下論文:
[0055] TheFastestPedestrianDetectorintheWest,PiotrDollar,2010;
[0056] IntegralChannelFeatures,PiotrDollar, 2009 ;
[0057] 算法程序詳見:http://vision.ucsd.edu/ ?pdollar/toolbox/doc/ ;本實(shí)施例 中的"ICF檢測子模塊"直接來自以上開源程序,未對原來的算法過程進(jìn)行修改,只是在最后 增加了一個(gè)步驟。修改之處為:在原來程序得到檢測結(jié)果之后,增加了通過自適應(yīng)閾值來確 定"ICF檢測子模塊"最終的輸出結(jié)果。
[0058] 參見圖8,ICF與DPM的檢測過程類似,也是采用一定大小的滑動(dòng)窗口,以一定 的步長在圖像上移動(dòng),然后計(jì)算特征。ICF和DPM的特征計(jì)算和分類器都不同,ICF分 類器為adaboost,ICF的特征為集成通道特征,即為Iuv顏色值、梯度(gradient)和 HOG(Dalal-Triggs)的特征集合。adaboost的輸出為若干弱分類器輸出的加權(quán)和,每個(gè)弱 分類器為1個(gè)決策樹,每個(gè)決策樹的輸入為上述的特征集合中的幾個(gè)特征,并根據(jù)IF-THEN 規(guī)則得出分類結(jié)果(即:是行人或者不是行人,表示為+1和-1)。上述的"權(quán)值"、"幾個(gè)特 征"的選擇都由訓(xùn)練確定。上述的弱分類器的加權(quán)和即為檢測計(jì)分(score)。對于一般的 單閾值檢測,閾值確定方法為:對于測試集,先確定期望的檢測率和誤報(bào)率,再找出滿足檢 測率和誤報(bào)率的score分界值作為閾值。ICF算法中的梯度特征,可以選擇以下之一:梯度 (gradient)、HOG、FH0G,本方法選擇梯度,這樣本方法的特征集合為梯度和Iuv顏色值。從 此可見,本文的DPM檢測子模塊和ICF檢測子模塊都未使用HOG(Dalal-Triggs)。
[0059] 關(guān)于檢測計(jì)分(score)的說明:當(dāng)一個(gè)檢測子模塊處理一個(gè)圖像之后,結(jié)果為多 個(gè)行人檢測方框,其中每個(gè)檢測方框?qū)?yīng)1個(gè)檢測計(jì)分。行人檢測模塊是一個(gè)二類分類器; 將1張圖像處理之后,會(huì)有很多候選結(jié)果,對于每個(gè)結(jié)果,依據(jù)一定的特征和規(guī)則,可計(jì)算 得到1個(gè)計(jì)分(或稱為score)。分類過程可以理解為類似sign函數(shù)的處理過程,輸入為 計(jì)分,輸出為+1或-1,代表2個(gè)類。對于計(jì)分,若>0的程度越大,則分類為+1的可能性越 大;反之,若〈0的程度越大,則分類為-1的可能性越大。對于計(jì)分,若超過某個(gè)閾值,則認(rèn) 為分類為+1,即接受此檢測方框。
[0060] 關(guān)于HOG名稱的說明:在大部分論文中,HOG指Dalal-Triggsdetector中的計(jì)算 方法(Histogramsoforientedgradientsforhumandetection,Dalai,Triggs, 2005); 而DPM方法中的特征類似H0G,但是有區(qū)別,稱之為FHOG(F指論文作者P.Felzenszwalb,名 稱fhog來自http: //vision,ucsd.edu/ ^pdollar/toolbox/doc/中的函數(shù)fhog()) 〇
[0061] 關(guān)于SVM名稱的說明,在大部分論文中,SVM指基本SVM,詳見:"支持向量機(jī)理論及 工程應(yīng)用實(shí)例,白鵬張斌,西安電子科技大學(xué)出版社";而DPM使用的是struct-latent-SVM, 矛口基ISVM不--樣,詳見:http://www.Cs.Cornell,edu/ ?cnyu/latentssvm/和Jl$ 白勺 DPM模型原理相關(guān)論文。
[0062] 參見圖1,本實(shí)施例采用了inria和V〇c2007行人庫分別進(jìn)行訓(xùn)練,得到2個(gè)訓(xùn)練 模型,原因是:在測試發(fā)現(xiàn),將inria和V〇C2007合并訓(xùn)練得到1個(gè)模型,檢測效果并不是明 顯優(yōu)于inria和V〇C2007形成的2個(gè)模型。測試中發(fā)現(xiàn),inria訓(xùn)練模型的檢測和前景提 取的效果都好于v〇c2007訓(xùn)練模型,但是inria模型主要針對全身行人,而V〇c2007則包含 了全身和半身的行人,所以有些半身行人只能由VOC2〇〇7模型檢測得到。
[0063] 圖中,對于inria模型,選擇3種閾值,高閾值對應(yīng)低檢測率,形成3個(gè)檢測子模 塊,這是因?yàn)橛袝r(shí)低閾值的檢測結(jié)果不能包含高閾值的檢測結(jié)果,尤其當(dāng)有大量行人存在 時(shí)。對于低閾值的檢測結(jié)果,其數(shù)目大于高閾值的檢測結(jié)果,經(jīng)過非最大值(匪S)處理和檢 測方框合并之后,最終結(jié)果可能不是檢測計(jì)分最高的檢測結(jié)果,從而導(dǎo)致對于同一個(gè)行人 對象,低閾值的檢測結(jié)果的方框有時(shí)會(huì)大于高閾值的檢測結(jié)果,而且位置有時(shí)也不準(zhǔn)確;而 過大的檢測方框,將使前景提取的準(zhǔn)確性降低。因此,選擇多個(gè)閾值形成多個(gè)檢測子模塊; 希望對于某個(gè)行人,若被不同閾值的檢測模塊同時(shí)檢測到,則選擇高閾值檢測模塊的檢測 結(jié)果,提高檢測的準(zhǔn)確性;同時(shí)又利用低閾值檢測模塊的高檢測率的特點(diǎn)來提高總體檢測 率。
[0064] 對于檢測子模塊的可信度,依次標(biāo)記在圖1中,可信度5表示最可信,可信度1表 示誤判的可能性最大。排序的依據(jù)是:實(shí)際測試中發(fā)現(xiàn),基于inria模型庫的DPM的檢測和 前景提取的準(zhǔn)確率最高,基于v〇c2007模型庫的DPM檢測準(zhǔn)確率中等;而ICF的檢測誤報(bào)率 相對較高,并且不能直接利用檢測模型進(jìn)行前景提取,因此可信度最低。
[0065] 按上述的可信度,形成消除誤判和合并算法,這里沒有使用普通的NMS和檢測方 框合并處理算法,因?yàn)榻M合方法中的檢測子模塊的模型和分類器都不同,導(dǎo)致候選集中的 檢測計(jì)分沒有可比性,需要依據(jù)可信度來進(jìn)行處理,算法流程如下:
[0066] 保留可信度5的檢測結(jié)果,即可信度最高的結(jié)果,直接作為最終檢測結(jié)果;
[0067] 依次處理候選集中可信度4?2的檢測方框,這些都是DPM子模塊檢測的結(jié)果,對 于某個(gè)可信度的檢測方框,若其中包含上一等級可信度的檢測方框的全部或大部分,則認(rèn) 為此方框?yàn)橹貜?fù)檢測,予以刪除。如:若當(dāng)前處理候選集中可信度4的檢測方框,則上一等 級可信度為可信度5,若某個(gè)可信度4的方框包含了可信度5的方框的全部或大部分,則判 定此可信度4分類方框?yàn)橹貜?fù)檢測,將被刪除,參見圖3 ;
[0068] 這里對于可信度I(即ICF檢測模型)的檢測方框不做處理;
[0069] 此步驟處理之后,消除了一些誤判和重復(fù)檢測。
[0070] 然后再進(jìn)一步消除重復(fù)檢測,判據(jù)為:對于2個(gè)檢測方框,方框1和方框2,若方框 1包含了方框2的全部或者大部分,同時(shí)方框1和方框2的面積相差不是很大,并且不是"方 框1對應(yīng)DPM模型,方框2對應(yīng)ICF模型",則刪除方框1;這是考慮若DPM檢測方框包含ICF 檢測方框時(shí),DPM方框的可信度大,不予刪除;同時(shí)仍然保留ICF檢測方框。
[0071] 由于ICF往往產(chǎn)生較多的誤判,所以采取自適應(yīng)閾值,并限制總的檢測數(shù)目。
[0072] 上述的自適應(yīng)閾值的過程為,先選定1個(gè)檢測計(jì)分閾值和接收比率,對于某次檢 測結(jié)果,流程為:
[0073] 1、選擇檢測計(jì)分大于計(jì)分閾值的檢測結(jié)果;
[0074] 2、在上述的結(jié)果中按接收比率選擇檢測計(jì)分最大的檢測結(jié)果,若比率為0.5,檢測 結(jié)果為6個(gè),則選擇檢測計(jì)分最高的3個(gè)檢測結(jié)果;
[0075] 3、若上述的結(jié)果的數(shù)目超過上限數(shù)目,則按上限數(shù)目選擇檢測計(jì)分最高的檢測結(jié) 果,如上限數(shù)目為4,則檢測結(jié)果最多為4個(gè),這樣主要用于控制誤報(bào)率。
[0076] 在步驟六中采用的誤判消除處理,其中"無行人"的判斷方法為:考慮到行人輪廓 中包含較明顯的邊緣和垂直方向的梯度,即包含有行人的方框內(nèi)的軀干、腿和頭部都會(huì)產(chǎn) 生垂直梯度和canny邊緣,同時(shí)大部分的人體部件必然會(huì)產(chǎn)生明顯的垂直梯度和邊緣,反 之,若在檢測方框的較多區(qū)域內(nèi)沒有垂直梯度或邊緣,則認(rèn)為是誤判;故以一定閾值計(jì)算方 框內(nèi)圖像的canny邊緣和梯度圖,canny邊緣檢測的閾值指:當(dāng)2個(gè)相鄰像素點(diǎn)之間的像 素值之差大于閾值,則認(rèn)為存在變化,即存在邊緣,閾值越高,則邊緣點(diǎn)越少,閾值越低,則 邊緣點(diǎn)越多;對于包含行人的方框,總是存在明顯的邊緣,當(dāng)閾值較大時(shí),仍然存在較多邊 緣,而對于有些不包含行人的方框,邊緣不明顯,所以當(dāng)閾值較大時(shí),邊緣會(huì)很少,這樣能體 現(xiàn)出包含和不包含行人的區(qū)別,反之,如果將canny檢測閾值設(shè)置為較小的值,則對于包含 和不包含行人的情況,都會(huì)有很多邊緣,無法體現(xiàn)區(qū)別,canny檢測閾值的確定方法為:對 于訓(xùn)練和測試樣本,人工找出一些邊緣特征不明顯的誤判,再找出全部正確的檢測,選擇閾 值,使得對于正確檢測盡可能多的保留邊緣,同時(shí)使誤判盡可能少的保留邊緣,梯度圖的閾 值的確定和canny邊緣類似;然后根據(jù)梯度圖計(jì)算出垂直方向的梯度圖,即僅保留垂直方 向的梯度,再將canny邊緣圖和垂直梯度圖轉(zhuǎn)換為二值圖像,從圖9中可以看出垂直梯度和 邊緣的區(qū)別;然后掃描canny邊緣圖和垂直梯度圖的每一行,統(tǒng)計(jì)每一行中屬于邊緣或梯 度的點(diǎn)(即前景點(diǎn))的數(shù)目,為〇表示這一行中沒有前景點(diǎn),這樣形成2個(gè)數(shù)組,數(shù)組的元 素為每一行中前景點(diǎn)的數(shù)目,元素的數(shù)目為以像素點(diǎn)數(shù)目計(jì)算的方框的高度,分別稱為邊 緣數(shù)組和梯度數(shù)組;再分別統(tǒng)計(jì)2個(gè)數(shù)組中的連續(xù)出現(xiàn)元素值為0的區(qū)間,并求出長度最大 的區(qū)間,計(jì)算此長度與總的元素?cái)?shù)目之比,將計(jì)算值稱為邊緣背景比率和梯度背景比率,如 數(shù)組為[12, 3, 0, 0, 2, 0],則連續(xù)為0的區(qū)間有2個(gè),長度分別為2和1,數(shù)組元素?cái)?shù)目為6, 則背景比率為2/6,在圖9中也標(biāo)注了連續(xù)背景區(qū)間;然后形成2個(gè)判斷規(guī)則:(1)若梯度背 景比率大于某個(gè)較大閾值,如:60%,表示在較長一段區(qū)間內(nèi)沒有垂直方向的梯度(有可能 存在水平方向的梯度,即存在canny邊緣),這樣可以說明檢測方框內(nèi)實(shí)際上沒有行人,此 規(guī)則未考慮canny邊緣,所以需要較大的閾值;(2)邊緣背景比率和梯度背景比率同時(shí)大于 某個(gè)較小閾值,如40%,表示在較長的一段區(qū)間內(nèi)沒有垂直梯度和邊緣,則認(rèn)為方框內(nèi)無行 人。
[0077] 關(guān)于"兩個(gè)位置相近的方框包含同一個(gè)人",若完全由方框重疊方法判斷,則 重疊比率和坐標(biāo)差值的閾值的選擇比較困難,所以采用基于顏色特征的方法作為方 框重疊判斷方法的補(bǔ)充,方法為:計(jì)算左上角的坐標(biāo)之差,若定義方框1左上角坐標(biāo) 為(xll,yll),方框2的左上角的坐標(biāo)為(x21,y21),坐標(biāo)以像素點(diǎn)計(jì)算,計(jì)算公式為: min((xll-x21), (yll-y21));再計(jì)算面積比率,公式為:min(方框1面積,方框2面積)/ max(方框1面積,方框2面積),若坐標(biāo)之差小于某閾值,如5,并且面積比率大于某閾值, 如60%,則2個(gè)方框的左上角相接近而且面積相差不大,即認(rèn)為位置接近,否則認(rèn)為不是 "兩個(gè)位置相近的方框包含同一個(gè)人";然后將2個(gè)位置接近的方框分都為上下部分,上部分 占總面積的60%,作為ROI(RegionOfInterest)區(qū)域,此ROI區(qū)域?yàn)榫匦?,可見圖9中的 藍(lán)色斜線和綠色斜線區(qū)域,分別計(jì)算2個(gè)方框的ROI區(qū)域的CEDD特征,再計(jì)算2個(gè)特征之 間的特征距離,計(jì)算利用了Tanimoto公式,特征距離=M-M*Tij,這里M為特征距離的最大 值,取為100
【權(quán)利要求】
1. 一種多模型多閾值組合的行人檢測方法,其特征在于,包括以下步驟: 步驟一:通過不同的訓(xùn)練模型和閾值,建立至少一個(gè)可變形部件模型DPM和至少一個(gè) 集成通道特征模型ICF來作為不同的檢測子模塊,并根據(jù)檢測子模塊的訓(xùn)練模型和閾值來 賦予各檢測子模塊不同的可信度; 步驟二:將靜態(tài)圖像分別輸入至步驟一中建立的檢測子模塊中,分別得出各檢測子模 塊輸出的包括檢測方框的圖像作為初步檢測結(jié)果; 步驟三:將可信度最高的檢測子模塊所輸出的初步檢測結(jié)果存入最終檢測結(jié)果集; 步驟四:按可信度降序依次檢測余下的除最低可信度外的檢測子模塊所輸出的初步檢 測結(jié)果,檢測方法為將當(dāng)前所檢測的本級可信度初步檢測結(jié)果內(nèi)的檢測方框與高一級可信 度的檢測方框進(jìn)行包含內(nèi)容的對比,若本級可信度的檢測方框與高一級可信度的檢測方框 有重疊部分,且兩個(gè)方框的重疊面積占高一級可信度的檢測方框的面積的比例超過60%, 則刪除本級可信度的檢測方框,否則保留,直至完成所有初步檢測結(jié)果的檢測; 步驟五:取完成步驟四后所保留的全部檢測方框,和最低可信度的檢測子模塊的檢測 方框一起組成候選集;在候選集中選擇2個(gè)不同檢測方框,組成1個(gè)方框組,并在候選集中 遍歷全部方框來組成方框組,然后判斷每個(gè)方框組中的2個(gè)方框是否為重復(fù)方框,判斷過 程為:對于2個(gè)檢測方框,方框a和方框b,若方框b和方框a的重疊面積與方框b的面積之 比大于60 %,同時(shí)min (方框a面積,方框b面積)/max (方框a面積,方框b面積)>70 %, 且方框a為ICF檢測子模塊輸出的檢測結(jié)果,則刪除方框a,否則保留方框a ; 步驟六:取完成步驟五后所保留的全部檢測方框,作為候選集,進(jìn)行誤判消除處理;誤 判指方框內(nèi)無行人或者兩個(gè)位置相近的方框包含同一個(gè)人。先檢查每個(gè)方框,判斷是否為 "無行人",若是則刪除此方框,再在候選集中選擇2個(gè)不同檢測方框,組成1個(gè)方框組,并在 候選集中遍歷全部方框來組成方框組,然后判斷每個(gè)方框組中的2個(gè)方框是否位置接近, 若接近則判斷是否"包含同一個(gè)人",若是則刪除對應(yīng)的檢測計(jì)分較小或者可信度等級較低 的方框,將保留下的檢測方框存入最終檢測結(jié)果集; 步驟七:綜合所有最終檢測結(jié)果集中的檢測方框,輸出檢測結(jié)果。
2. 根據(jù)權(quán)利要求1所述的的方法,其特征在于,所述的DPM檢測子模塊包括采用inria 作為訓(xùn)練庫和v〇C2007作為訓(xùn)練庫的檢測子模型,所述的ICF檢測子模塊包括采用inria、 caltech、tud和eth作為訓(xùn)練庫的檢測子模型。
3. 根據(jù)權(quán)利要求2所述的的方法,其特征在于,所述的采用inria作為訓(xùn)練庫的DPM檢 測子模塊的數(shù)量為三個(gè),分別為采用高閾值、中閾值和低閾值的檢測子模型,所述的高閾值 對應(yīng)低檢測率,所述的低閾值對應(yīng)高檢測率。
4. 根據(jù)權(quán)利要求3所述的的方法,其特征在于,所述的高、中、低閾值分別為: 0? 8, _0. 3, _0. 9。
5. 根據(jù)權(quán)利要求2所述的的方法,其特征在于,所述的ICF檢測子模塊采用inria、 caltech、tud和eth行人數(shù)據(jù)庫中高度>75pixels的行人對象作為正樣本進(jìn)行訓(xùn)練,正樣 本的數(shù)量不少于20000個(gè),負(fù)樣本采用除行人外的其他圖片進(jìn)行訓(xùn)練,負(fù)樣本的數(shù)量不少 于100萬個(gè)。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的ICF檢測子模塊在圖像處理完成后 還進(jìn)行自適應(yīng)閾值檢測,所述的自適應(yīng)閾值檢測過程包括以下步驟: 步驟1 :ICF檢測子模塊處理1張圖像后,得到的每個(gè)檢測結(jié)果關(guān)聯(lián)1個(gè)檢測計(jì)分,選擇 檢測計(jì)分大于預(yù)設(shè)的計(jì)分閾值的檢測結(jié)果; 步驟2 :對于步驟1的結(jié)果,根據(jù)預(yù)設(shè)的接收比率按檢測計(jì)分降序保留檢測結(jié)果; 步驟3 :若步驟2的結(jié)果中包含的檢測結(jié)果數(shù)目超過上限數(shù)目,則根據(jù)上限數(shù)目按檢測 計(jì)分降序保留檢測結(jié)果。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,自適應(yīng)閾值檢測中,步驟1中的計(jì)分閾值 為15,步驟2中的接收比例為50%,步驟3中的上限數(shù)目為6.
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟六中所述的誤判消除處理包含以下 步驟: 先判斷方框內(nèi)是否"無行人":以預(yù)設(shè)的canny檢測閾值和梯度圖閾值計(jì)算方框內(nèi)圖像 的canny邊緣和梯度圖,并計(jì)算出垂直方向的梯度圖,將canny邊緣圖和垂直梯度圖轉(zhuǎn)換為 二值圖像;然后掃描canny邊緣圖和垂直梯度圖的每一行,統(tǒng)計(jì)每一行中屬于邊緣或梯度 的點(diǎn),即前景點(diǎn)的數(shù)目,為〇表示這一行中沒有前景點(diǎn),這樣形成2個(gè)數(shù)組,數(shù)組的元素的值 為每一行中前景點(diǎn)的數(shù)目,元素的數(shù)目為以像素點(diǎn)數(shù)目計(jì)算的方框的高度,分別稱為邊緣 數(shù)組和梯度數(shù)組;再分別統(tǒng)計(jì)2個(gè)數(shù)組中的連續(xù)出現(xiàn)元素值為0的區(qū)間,并求出長度最大的 區(qū)間,計(jì)算此長度與總的元素?cái)?shù)目之比,將計(jì)算值稱為邊緣背景比率和梯度背景比率,若梯 度背景比率大于預(yù)設(shè)的梯度背景閾值,或者邊緣背景比率和梯度背景比率同時(shí)大于邊緣梯 度背景閾值,則認(rèn)為方框內(nèi)無行人; 再判斷是否"兩個(gè)位置相近的方框包含同一個(gè)人":首先計(jì)算左上角的坐標(biāo)之差,再計(jì) 算面積比率,公式為:min (方框1面積,方框2面積)/max (方框1面積,方框2面積),若 坐標(biāo)之差小于預(yù)設(shè)的坐標(biāo)閾值,并且面積比率大于預(yù)設(shè)的面積閾值,則認(rèn)為位置接近,否則 認(rèn)為不是"兩個(gè)位置相近的方框包含同一個(gè)人";將2個(gè)位置接近的方框分都為上下部分, 上部分占總面積的約60%,作為ROI區(qū)域,分別計(jì)算2個(gè)方框的ROI區(qū)域的CEDD特征,若2 個(gè)CEDD特征的特征距離小于CEDD特征閾值,則認(rèn)為2個(gè)方框包含同一個(gè)人。
9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述的canny檢測閾值為0. 3?0. 4,所 述的梯度圖閾值為〇. 2?0. 3,所述的梯度背景閾值為50% -60%,所述的邊緣梯度背景閾 值為40% -50%,所述的坐標(biāo)閾值為4-6,所述的面積閾值為50% -70%,所述的CEDD特征 閾值為1-3。
【文檔編號(hào)】G06K9/66GK104484680SQ201410503998
【公開日】2015年4月1日 申請日期:2014年9月26日 優(yōu)先權(quán)日:2014年9月26日
【發(fā)明者】徐曉暉 申請人:徐曉暉