一種建立行人檢測模型的方法及裝置及行人檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像檢測領(lǐng)域,具體涉及一種建立行人檢測模型的方法及行人檢測方 法。
【背景技術(shù)】
[0002] 視覺圖像檢測就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是指通過機器 視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取行人轉(zhuǎn)換成圖像信號,傳送給 專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像智能識 別系統(tǒng)軟件等通過分析這些信號進行各種運算來抽取行人的特征,進而根據(jù)判別的結(jié)果來 控制現(xiàn)場的設(shè)備的系統(tǒng)。
[0003] 圖像檢測應(yīng)用的范圍很廣,例如在視頻監(jiān)控系統(tǒng)中對行人的識別。對行人進行準 確可靠的檢測是許多基于行人的計算機視覺和模式識別應(yīng)用中的重要環(huán)節(jié),例如視頻監(jiān) 控、輔助駕駛、自動機器人導(dǎo)航等等。得益于強有力的特征表示、魯棒的行人建模方法和有 效的檢測策略,當(dāng)前的行人檢測技術(shù)在無遮擋的數(shù)據(jù)集上取得了顯著的進步。然而,遮擋仍 然是取得理想檢測結(jié)果的一個主要阻礙因素。一方面,現(xiàn)有的主流技術(shù)都是以行人全部可 見或者只有輕微遮擋為前提,因此隨著行人遮擋程度的增加,他們的檢測性能會明顯下降, 主要原因在于較大遮擋程度下的樣本會缺失大量有用的行人特征信息,使得在無遮擋或輕 微遮擋行人樣本條件下訓(xùn)練的檢測器難以檢測較大遮擋程度的行人。另外由于有用信息 丟失和從遮擋區(qū)域提取出的噪聲信息會在訓(xùn)練過程中誤導(dǎo)檢測器,因此直接將較大遮擋程 度的行人樣本加入到已有無遮擋或輕微遮擋行人訓(xùn)練樣本中的方案也是無法奏效的。另 一方面,遮擋在實際應(yīng)用場景中卻是經(jīng)常發(fā)生的,比如在城市的街道或是人群聚集的地方。 因此,提供一種有能力進行遮擋處理的檢測方法對于取得更加魯棒的檢測結(jié)果有著重要意 義。
[0004] 現(xiàn)有的遮擋處理方法主要有兩類:第一類是基于身體各部件可見度預(yù)估的行人檢 測方法,第二類是基于特定遮擋分類器的行人檢測方法?;谏眢w各部件可見度預(yù)估的方 法通常采用可變形部件模型(DeformablePartModel,簡稱DPM)將行人建模為由不同身 體部件組成的整體,并在檢測前通過一定的方法對各個身體部件的可見度進行預(yù)估,判斷 哪些身體部件是可見的,哪些身體部件是被遮擋的,這樣就可以在檢測時盡量排除或減小 遮擋部件對結(jié)果的影響。Wu等人在文獻"DetectionofMultiple,PartiallyOccluded HumansinaSingleImagebyBayesianCombinationofEdgeletPartDetectors',中 提出了一種基于edgelet特征的部件檢測器,通過人體各個部件的相對深度順序來預(yù)估其 可見度。Leibe等人在文獻"PedestrianDetectioninCrowdedScenes" 中提出了一種 自頂向下的概率分割方法用來結(jié)合局部外觀特征和全局形狀信息以確定行人的遮擋程度。 Enzweiler等人在文南犬''Multi-cuePedestrianClassificationwithPartialOcclusion Handling"中提出了一種基于不同模塊組合的行人模型,每個模塊的可見度由其在深度特 征和運動特征中的遮擋邊界(不連續(xù)性)來確定??梢钥吹?,上述方法在進行可見度預(yù)估 時均需要使用額外的信息,例如運動信息、深度信息或是圖像分割結(jié)果,而在實際中這些信 息不總是能夠方便得到的。因此第二類基于特定遮擋分類器的方法被提出,Wojek等人在文 南犬"Monocular3DSceneUnderstandingwithExplicitOcclusionReasoning"中提出 訓(xùn)練一組特定分類器,每個分類器對應(yīng)一個不同的遮擋程度,在檢測時,如果行人的遮擋程 度已知(預(yù)先或通過預(yù)估),則使用對應(yīng)其遮擋程度的特定分類器來完成檢測;如果行人的 遮擋程度未知,則首先使用所有的特定遮擋分類器進行判斷,然后將這些結(jié)果直接融合起 來得到最終結(jié)果,但其缺點是訓(xùn)練眾多的分類器非常耗時。Mathias等人在文獻"Handling OcclusionswithFranken-Classifiers"中針對此問題進行了改進,提出了在分類器訓(xùn)練 過程中采用空間傾向性的特征選擇思想,即利用一個在無遮擋條件下訓(xùn)練的分類器作為起 始,重復(fù)利用訓(xùn)練時的操作來高效地建立一組特定遮擋條件下的分類器,將計算時間降低 了一個數(shù)量級。然而,上述這些方法的不足在于各個不同的特定遮擋分類器都是獨立進行 訓(xùn)練的,他們之間的關(guān)聯(lián)關(guān)系被忽略掉了,因此對于存在嚴重遮擋的行人的檢測精度較差。
【發(fā)明內(nèi)容】
[0005] 因此,本發(fā)明要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)中對于嚴重遮擋的行人的檢測 準確性差的缺陷,從而提供一種建立行人檢測模型的方法及行人檢測方法。
[0006] 為此,本發(fā)明提供一種建立行人檢測模型的方法,其特征在于,包括如下步驟:
[0007] 根據(jù)遮擋程度將訓(xùn)練樣本劃分成N類,其中N為大于等于2的整數(shù);
[0008] 根據(jù)所述訓(xùn)練樣本的種類構(gòu)建多任務(wù)基本決策樹,所述多任務(wù)基本決策樹為N層 二叉樹,所述N層二叉樹的每個節(jié)點包括一個基本決策樹;
[0009] 分別獲取所有訓(xùn)練樣本的權(quán)重;
[0010] 分別獲取所有訓(xùn)練樣本中的相應(yīng)的特征值;
[0011] 分別向所述多任務(wù)基本決策樹中的每個輸入節(jié)點輸入所述特征值,其中,同一層 輸入的特征值分別來自相同類別的訓(xùn)練樣本,不同層之間輸入的特征值分別來自不同類別 的訓(xùn)練樣本;
[0012] 所述每個輸入節(jié)點遍歷所有特征值;
[0013] 根據(jù)所有輸出節(jié)點的輸出和其對應(yīng)樣本的權(quán)重確定每種輸入下的分類誤差值;
[0014] 獲取分類誤差值最小的多任務(wù)基本決策樹作為最優(yōu)多任務(wù)基本決策樹。
[0015] 優(yōu)選地,還包括:根據(jù)最小的分類誤差值調(diào)整訓(xùn)練樣本的權(quán)重,重新確定最優(yōu)多 任務(wù)基本決策樹。
[0016] 優(yōu)選地,還包括
[0017] 獲取所有最優(yōu)多任務(wù)基本決策樹的權(quán)重;
[0018] 根據(jù)所有最優(yōu)多任務(wù)基本決策樹及其權(quán)重得到最終多任務(wù)決策樹。
[0019] 優(yōu)選地,所述遮擋程度包括遮擋部分所占的比例。
[0020] 優(yōu)選地,所述基本決策樹包括一個根節(jié)點和兩個預(yù)測節(jié)點,所述根節(jié)點為輸入節(jié) 點,所述預(yù)測節(jié)點為輸出節(jié)點。
[0021] 優(yōu)選地,所述根據(jù)所有輸出節(jié)點的輸出和其對應(yīng)樣本的權(quán)重確定每種輸入下的分 類誤差值的步驟包括:
[0022] 獲取每個輸出節(jié)點的輸出,對于每個節(jié)點,如果輸入的特征值大于該基本決策樹 的決策閾值,輸出為正例,否則輸出為負例;
[0023] 通過下述公式計算分類誤差值:
[0025] 其中,err〇ΛS,D》表不在一種輸入下的多任務(wù)基本決策樹的分類誤差,e表不分 類錯誤(即預(yù)測輸出與樣本標簽不相符)的訓(xùn)練樣本集合,S表示整個訓(xùn)練樣本集合,h表 示多任務(wù)基本決策樹,t表示當(dāng)前循環(huán)計數(shù),ees:ρΓθ(1(1ι\e)辛y(e)表示當(dāng)前樣本輸出 與標簽不相符時將其加入e集合,DXe)表不e集合中每個樣本的權(quán)重。
[0026] 優(yōu)選地,根據(jù)最小的分類誤差值調(diào)整訓(xùn)練樣本的權(quán)重,重新確定最優(yōu)多任務(wù)基本 決策樹的步驟包括:
[0027] 計算當(dāng)前的分類誤差et=err(ht,S,D》,并根據(jù)此誤差計算相應(yīng)的多任務(wù)基本
[0028] 根據(jù)所述權(quán)重對樣本空間e中的每個訓(xùn)練樣本更新其分布;
[0029]如果predOi%e) =y(e),表示當(dāng)前樣本預(yù)測輸出與樣本標簽相符,S卩樣本分類
[0030] 優(yōu)選地,根據(jù)所有最優(yōu)多任務(wù)基本決策樹及其權(quán)重得到最終多任務(wù)決策樹的步驟 包括:
[0031] 最終多任務(wù)決策樹通過如下公式獲得:
[0032]H(x) =Σ?=ια?:Μ(χ),其中H(X)表示最終多任務(wù)決策樹,X表示輸入待檢測樣 本,ht(x)表示每次循環(huán)中的最優(yōu)多任務(wù)基本決策樹,at表示每個最優(yōu)多任務(wù)基本決策樹 對應(yīng)的權(quán)重,T為預(yù)先設(shè)定的最大循環(huán)迭代次數(shù)。
[0033] 本發(fā)明還提供一種行人檢測方法,包括如下步驟:
[0034] 從待測樣本中提取特征值;
[0035] 將所述特征值輸入所述最優(yōu)多任務(wù)基本決策樹/最終多任務(wù)決策樹;
[0036] 將所述最優(yōu)多任務(wù)決策樹/最終多任務(wù)決策樹的輸出作為行人檢測的結(jié)果。
[0037] 本發(fā)明技術(shù)方案,具有如下優(yōu)點:
[0038] 1.本發(fā)明提供的建立行人檢測模型的方法,構(gòu)建了多任務(wù)基本決策樹,所述多任 務(wù)基本決策樹的層數(shù)與訓(xùn)練樣本的