本發(fā)明涉及視頻監(jiān)控技術(shù)領(lǐng)域,具體涉及一種駕駛員行為識別方法及終端。
背景技術(shù):
隨著交通運輸業(yè)的快速發(fā)展,人們的出行日益便捷,但與此同時,也伴隨著頻繁發(fā)隨著現(xiàn)代交通車輛的大幅度增加,道路事故不斷攀升。而發(fā)生的事故當(dāng)中絕大多數(shù)是由于駕駛員的不安全駕駛行為所導(dǎo)致的,如不系帶安全帶,開車打電話等。駕駛員如果能規(guī)范自己的駕駛行為可以大大降低事故的發(fā)生率以及事故的傷亡率,另外,汽車遮陽板遮擋住了駕駛員的臉部信息阻礙了交警和警察的正常執(zhí)勤,因此,對駕駛員屬性識別研究具有十分重大的意義。
對于駕駛員屬性識別傳統(tǒng)的方法包括特征提取和分類器判別這兩個步驟。特征提取主要有HAAR特征、HOG特征、LBP特征以及SHIFT等方法。這些方法都有這自己特定使用場景。而在現(xiàn)實的場景當(dāng)中,駕駛員打電話以及安全帶等特征有時候不是特別明顯,并且駕駛員的姿態(tài)也是千變?nèi)f化的,同時,識別還受到光照等自然環(huán)境的影響,現(xiàn)有的一些特征提取方法不能很好的處理這些問題。傳統(tǒng)的分類器包括SVM分類器以及Cascade級聯(lián)分類器等,在駕駛員屬性識別中,場景通常非常復(fù)雜和多變,存在很大的差異,傳統(tǒng)的分類器很難達到非常高的分類正確率,因此,在復(fù)雜環(huán)境下,識別準(zhǔn)確率較低。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供了一種駕駛員行為識別方法及終端,以期提高駕駛員行為識別的正確率。
本發(fā)明實施例第一方面提供了一種駕駛員行為識別方法,包括:
獲取待處理圖像;
利用目標(biāo)分類器對所述待處理圖像進行訓(xùn)練,得到所述待處理圖像中的駕駛員區(qū)域;
采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為。
可選地,所述指定神經(jīng)網(wǎng)絡(luò)模型包含N個行為屬性的層級結(jié)構(gòu),每一個屬性均包含三個卷積層,每一個卷積層都包括卷積操作、歸一化操作、線性修正激活函數(shù)和池化操作,所述N為正整數(shù)。
可選地,所述采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為,包括:
采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
分別將所述N個得分中每一得分與第一預(yù)設(shè)閾值進行比較,得到M個得分,所述M個得分均大于所述第一預(yù)設(shè)閾值,所述M為小于或等于所述N的整數(shù);
將所述M個得分中的最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,所述采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為,包括:
采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
確定出所述N個得分中的最高得分;
在所述最高得分大于第二預(yù)設(shè)閾值時,將所述最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,所述獲取待處理圖像之前,所述方法還包括:
獲取正樣本集和負樣本集;
采用HOG特征對所述正樣本集和所述負樣本集進行表征,得到多個特征向量;
利用所述多個特征向量構(gòu)造弱分類器;
利用級聯(lián)的Adaboost算法對所述弱分類器進行訓(xùn)練,得到所述目標(biāo)分類器。
本發(fā)明實施例第二方面提供了一種終端,包括:
第一獲取單元,用于獲取待處理圖像;
第一訓(xùn)練單元,用于利用目標(biāo)分類器對所述待處理圖像進行訓(xùn)練,得到所述待處理圖像中的駕駛員區(qū)域;
識別單元,用于采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為。
可選地,所述指定神經(jīng)網(wǎng)絡(luò)模型包含N個行為屬性的層級結(jié)構(gòu),每一個屬性均包含三個卷積層,每一個卷積層都包括卷積操作、歸一化操作、線性修正激活函數(shù)和池化操作,所述N為正整數(shù)。
可選地,所述識別單元包括:
第一識別模塊,用于采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
比較模塊,用于分別將所述N個得分中每一得分與第一預(yù)設(shè)閾值進行比較,得到M個得分,所述M個得分均大于所述第一預(yù)設(shè)閾值,所述M為小于或等于所述N的整數(shù);
第一確定模塊,用于將所述M個得分中的最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,所述識別單元包括:
第二識別模塊,用于采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
第二確定模塊,用于確定出所述N個得分中的最高得分;
所述第二確定單元,還具體用于:
在所述最高得分大于第二預(yù)設(shè)閾值時,將所述最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,所述終端還包括:
第二獲取單元,用于在所述第一獲取單元獲取待處理圖像之前,獲取正樣本集和負樣本集;
表征單元,用于采用HOG特征對所述正樣本集和所述負樣本集進行表征,得到多個特征向量;
構(gòu)造單元,用于利用所述多個特征向量構(gòu)造弱分類器;
第二訓(xùn)練單元,用于利用級聯(lián)的Adaboost算法對所述弱分類器進行訓(xùn)練,得到所述目標(biāo)分類器。
實施本發(fā)明實施例,具有如下有益效果:
通過本發(fā)明實施例,獲取待處理圖像,利用目標(biāo)分類器對待處理圖像進行訓(xùn)練,得到待處理圖像中的駕駛員區(qū)域,采用指定神經(jīng)網(wǎng)絡(luò)模型對駕駛員區(qū)域進行識別,得到目標(biāo)行為,如此,可提高駕駛員行為識別的正確率。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的一種駕駛員行為識別方法的第一實施例流程示意圖;
圖2是本發(fā)明實施例提供的一種駕駛員行為識別方法的第二實施例流程示意圖;
圖3a是本發(fā)明實施例提供的一種終端的第一實施例結(jié)構(gòu)示意圖;
圖3b是本發(fā)明實施例提供的圖3a所描述的終端的識別單元的結(jié)構(gòu)示意圖;
圖3c是本發(fā)明實施例提供的圖3a所描述的終端的識別單元的又一結(jié)構(gòu)示意圖;
圖3d是本發(fā)明實施例提供的圖3a所描述的終端的又一結(jié)構(gòu)示意圖;
圖4是本發(fā)明實施例提供的一種終端的第二實施例結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明的說明書和權(quán)利要求書及所述附圖中的術(shù)語“第一”、“第二”、“第三”和“第四”等是用于區(qū)別不同對象,而不是用于描述特定順序。此外,術(shù)語“包括”和“具有”以及它們?nèi)魏巫冃?,意圖在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
在本文中提及“實施例”意味著,結(jié)合實施例描述的特定特征、結(jié)構(gòu)或特性可以包含在本發(fā)明的至少一個實施例中。在說明書中的各個位置展示該短語并不一定均是指相同的實施例,也不是與其它實施例互斥的獨立的或備選的實施例。本領(lǐng)域技術(shù)人員顯式地和隱式地理解的是,本文所描述的實施例可以與其它實施例相結(jié)合。
本發(fā)明實施例所描述終端可以包括智能手機(如Android手機、iOS手機、Windows Phone手機等)、平板電腦、掌上電腦、筆記本電腦、移動互聯(lián)網(wǎng)設(shè)備(MID,Mobile Internet Devices)或穿戴式設(shè)備等,上述僅是舉例,而非窮舉,包含但不限于上述終端。
深度學(xué)習(xí)作為機器學(xué)習(xí)研究中的一個新領(lǐng)域,這兩年在圖像識別、語音識別以及自然語言處理方面取得了巨大的成功。深度學(xué)習(xí)是通過構(gòu)建多層神經(jīng)網(wǎng)絡(luò)模型來訓(xùn)練數(shù)據(jù),可以學(xué)習(xí)出有用的特征,通過對大量樣本學(xué)習(xí)可以得到很高的識別正確率。但是在同時需要識別多個屬性時,已有的深度學(xué)習(xí)方法往往是通過將各個屬性獨立出來,為每一個屬性訓(xùn)練一個模型,這無疑大大增加了復(fù)雜度。因此,如何將各個屬性聯(lián)系起來,通過設(shè)計一個模型即可對多個屬性進行識別成為當(dāng)下繼續(xù)解決的問題。
其中,駕駛員行為可包括但不僅限于:駕駛員有無打電話、駕駛員有沒有系安全帶、有沒遮陽板擋住駕駛員和駕駛員是否處于疲勞駕駛狀態(tài)等等
請參閱圖1,為本發(fā)明實施例提供的一種駕駛員行為識別方法的第一實施例流程示意圖。本實施例中所描述的駕駛員行為識別方法,包括以下步驟:
101、獲取待處理圖像。
待處理圖像可為包含用戶駕駛時候的圖像,或者,由交通攝像頭拍攝到的視頻中的一幀。
102、利用目標(biāo)分類器對所述待處理圖像進行訓(xùn)練,得到所述待處理圖像中的駕駛員區(qū)域。
可選地,輸入待處理圖像,利用Adaboost算法和HOG特征對駕駛員區(qū)域進行定位,可得到駕駛員區(qū)域。
103、采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為。
其中,上述指定神經(jīng)網(wǎng)絡(luò)模型可為多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)。
可選地,指定神經(jīng)網(wǎng)絡(luò)模型包含N個行為屬性的層級結(jié)構(gòu),每一個屬性均包含三個卷積層,每一個卷積層都包括卷積操作、歸一化操作、線性修正激活函數(shù)和池化操作,所述N為正整數(shù)。
具體地,本發(fā)明實施例中的指定神經(jīng)網(wǎng)絡(luò)模型可設(shè)計為神經(jīng)網(wǎng)絡(luò)三個屬性共享前兩層卷積層,用來學(xué)習(xí)通用的特征,接下來需要分別設(shè)計三個屬性的層級結(jié)構(gòu),每一個屬性接下來都有三個卷積層。每一個卷積層都包括卷積操作、歸一化(Batch Normalization,BN)操作、線性修正激活函數(shù)ReLU以及池化操作。每一個神經(jīng)元的輸入與前一層的局部感知域相連,并提取特征。輸出層的神經(jīng)元個數(shù)與目標(biāo)類別的數(shù)量保持一致。
其中,上述卷積過程的形式可為:
其中,式中:f(.)是激活函數(shù);是第l層的第j個神經(jīng)元向量;代表前一層的神經(jīng)元向量;k是卷積核;b是偏置
歸一化層的表示形式為:
式中,x(k)代表第k維的輸入。
上述池化操作的表示形式為:
式中:g(.)是池化層的激活函數(shù);pool(.)是池化函數(shù),α是權(quán)值,b是偏置。
在得到指定神經(jīng)網(wǎng)絡(luò)模型的過程中,可將訓(xùn)練樣本歸一化到相同的大小并分好類別然后進行訓(xùn)練。訓(xùn)練分兩個階段:前向傳播階段和誤差后向反饋階段。通過最小化損失函數(shù)來不斷調(diào)整網(wǎng)絡(luò)參數(shù)。如果達到預(yù)設(shè)的訓(xùn)練次數(shù),則保存此次訓(xùn)練所得到的指定神經(jīng)網(wǎng)絡(luò)模型。
其中,對于駕駛員區(qū)域,以三種駕駛員行為為例加以說明:識別駕駛員有無打電話、有沒有系安全帶以及有沒有遮陽板這三種狀態(tài)。設(shè)計一個多任務(wù)的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),三個屬性共享較低的兩層,較高的層別需要分別單獨設(shè)計。利用設(shè)計好的網(wǎng)絡(luò)進行訓(xùn)練,最終得到一個模型。在輸入待處理圖像之后,可利用Adaboost算法和HOG特征對駕駛員區(qū)域進行定位。利用指定神經(jīng)網(wǎng)絡(luò)模型可對輸入的待處理圖像的駕駛員區(qū)域進行識別。
可選地,上述步驟103中,采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為,可包括如下步驟:
31)、采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
32)、分別將所述N個得分中每一得分與第一預(yù)設(shè)閾值進行比較,得到M個得分,所述M個得分均大于所述第一預(yù)設(shè)閾值,所述M為小于或等于所述N的整數(shù);
33)、將所述M個得分中的最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
其中,上述第一預(yù)設(shè)閾值由系統(tǒng)默認(rèn),或者,用戶自行設(shè)置。在采用指定神經(jīng)網(wǎng)絡(luò)模型對駕駛員區(qū)域進行識別,可得到N個得分,N為大于1的整數(shù),分別將N個得分中每一得分與第一預(yù)設(shè)閾值進行比較,得到M個得分,該M個得分均大于第一預(yù)設(shè)閾值,M為小于或等于M的整數(shù),將M個得分中的最高得分對應(yīng)的行為屬性確定為目標(biāo)行為。在得到第一預(yù)設(shè)閾值時,可任務(wù)識別失敗。
可選地,上述步驟103中,采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為,可包括如下步驟:
34)、采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
35)、確定出所述N個得分中的最高得分;
36)、在所述最高得分大于第二預(yù)設(shè)閾值時,將所述最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
其中,上述第二預(yù)設(shè)閾值由系統(tǒng)默認(rèn),或者,用戶自行設(shè)置??刹捎弥付ㄉ窠?jīng)網(wǎng)絡(luò)模型對駕駛員區(qū)域進行識別,得到N個得分,確定出N個得分中的最高得分,在最高得分大于第二預(yù)設(shè)閾值時,將最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。在得到第二預(yù)設(shè)閾值時,可任務(wù)識別失敗。
可選地,上述步驟101之前,可包含如下步驟:
獲取正樣本集和負樣本集;
采用HOG特征對所述正樣本集和所述負樣本集進行表征,得到多個特征向量;
利用所述多個特征向量構(gòu)造弱分類器;
利用級聯(lián)的Adaboost算法對所述弱分類器進行訓(xùn)練,得到所述目標(biāo)分類器。
其中,上述正樣本集可為符合駕駛員行為的圖像,例如,駕駛員打電話、駕駛員沒系安全帶、有遮陽板擋住駕駛員和駕駛員處于疲勞駕駛狀態(tài),正樣本集中包含多個正樣本。負樣本集則為用戶想識別的駕駛員行為之外的圖像,負樣本集中包含多個負樣本。上述正樣本集和負樣本集的包含的樣本數(shù)量當(dāng)然越多,訓(xùn)練出來的模型越準(zhǔn)確,但是,正樣本和負樣本的數(shù)量越多,也會增加訓(xùn)練時候的計算成本。
具體地,人工選出大量駕駛員區(qū)域的圖片以及非駕駛員區(qū)域的圖片作為訓(xùn)練集的正負樣本,并將正樣本進行規(guī)格化到統(tǒng)一大小,使用HOG特征對正負樣本進行表征,形成特征向量,利用HOG特征形成的特征向量構(gòu)建弱分類器,利用級聯(lián)的Adaboost算法對弱分類器進行訓(xùn)練,得到級聯(lián)的駕駛員區(qū)域強分類器。
可以看出,通過本發(fā)明實施例,獲取待處理圖像,利用目標(biāo)分類器對待處理圖像進行訓(xùn)練,得到待處理圖像中的駕駛員區(qū)域,采用指定神經(jīng)網(wǎng)絡(luò)模型對駕駛員區(qū)域進行識別,得到目標(biāo)行為,如此,可提高駕駛員行為識別的正確率。
與上述一致地,請參閱圖2,為本發(fā)明實施例提供的一種駕駛員行為識別方法的第二實施例流程示意圖。本實施例中所描述的駕駛員行為識別方法,包括以下步驟:
201、獲取正樣本集和負樣本集。
其中,步驟201中的正樣本集可為符合駕駛員行為的圖像,例如,駕駛員打電話、駕駛員沒系安全帶、有遮陽板擋住駕駛員和駕駛員處于疲勞駕駛狀態(tài),正樣本集中包含多個正樣本。負樣本集則為用戶想識別的駕駛員行為之外的圖像,負樣本集中包含多個負樣本。上述正樣本集和負樣本集的包含的樣本數(shù)量當(dāng)然越多,訓(xùn)練出來的模型越準(zhǔn)確,但是,正樣本和負樣本的數(shù)量越多,也會增加訓(xùn)練時候的計算成本。
202、采用HOG特征對所述正樣本集和所述負樣本集進行表征,得到多個特征向量。
203、利用所述多個特征向量構(gòu)造弱分類器。
204、利用級聯(lián)的Adaboost算法對所述弱分類器進行訓(xùn)練,得到目標(biāo)分類器。
可選地,可采用HOG特征對正樣本集和所述負樣本集進行表征,得到多個特征向量,利用多個特征向量構(gòu)造弱分類器,并利用級聯(lián)的Adaboost算法對弱分類器進行訓(xùn)練,得到目標(biāo)分類器。
可選地,可人工選出大量駕駛員區(qū)域的圖片以及非駕駛員區(qū)域的圖片作為訓(xùn)練集的正負樣本,并將正樣本進行規(guī)格化到統(tǒng)一大小,使用HOG特征對正負樣本進行表征,形成特征向量,利用HOG特征形成的特征向量構(gòu)建弱分類器,利用級聯(lián)的Adaboost算法對弱分類器進行訓(xùn)練,得到級聯(lián)的駕駛員區(qū)域強分類器。
205、獲取待處理圖像。
206、利用所述目標(biāo)分類器對所述待處理圖像進行訓(xùn)練,得到所述待處理圖像中的駕駛員區(qū)域。
207、采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為。
上述步驟205-步驟207可參照圖1所描述的駕駛員行為識別方法的對應(yīng)步驟。
可以看出,通過本發(fā)明實施例,獲取正樣本集和負樣本集,采用HOG特征對正樣本集和所述負樣本集進行表征,得到多個特征向量,利用多個特征向量構(gòu)造弱分類器,利用級聯(lián)的Adaboost算法對弱分類器進行訓(xùn)練,得到目標(biāo)分類器,獲取待處理圖像,利用目標(biāo)分類器對待處理圖像進行訓(xùn)練,得到待處理圖像中的駕駛員區(qū)域,采用指定神經(jīng)網(wǎng)絡(luò)模型對駕駛員區(qū)域進行識別,得到目標(biāo)行為,如此,可提高駕駛員行為識別的正確率。
與上述一致地,以下為實施上述駕駛員行為識別方法的裝置,具體如下:
請參閱圖3a,為本發(fā)明實施例提供的一種終端的第一實施例結(jié)構(gòu)示意圖。本實施例中所描述的終端,包括:第一獲取單元301、第一訓(xùn)練單元302和識別單元303,具體如下:
第一獲取單元301,用于獲取待處理圖像;
第一訓(xùn)練單元302,用于利用目標(biāo)分類器對所述待處理圖像進行訓(xùn)練,得到所述待處理圖像中的駕駛員區(qū)域;
識別單元303,用于采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為。
可選地,所述指定神經(jīng)網(wǎng)絡(luò)模型包含N個行為屬性的層級結(jié)構(gòu),每一個屬性均包含三個卷積層,每一個卷積層都包括卷積操作、歸一化操作、線性修正激活函數(shù)和池化操作,所述N為正整數(shù)。
可選地,如圖3b,圖3b為圖3a所描述的終端的識別單元303的具體細化結(jié)構(gòu),所述識別單元303可包括:第一識別模塊3031、比較模塊3032和第一確定模塊3033,具體如下;
第一識別模塊3031,用于采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
比較模塊3032,用于分別將所述N個得分中每一得分與第一預(yù)設(shè)閾值進行比較,得到M個得分,所述M個得分均大于所述第一預(yù)設(shè)閾值,所述M為小于或等于所述N的整數(shù);
第一確定模塊3033,用于將所述M個得分中的最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,如圖3c,圖3c為圖3a所描述的終端的識別單元303的具體細化結(jié)構(gòu),所述識別單元303可包括:第二識別模塊3034和第二確定模塊3035,具體如下:
第二識別模塊3034,用于采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
第二確定模塊3035,用于確定出所述N個得分中的最高得分;
所述第二確定單元305,還具體用于:
在所述最高得分大于第二預(yù)設(shè)閾值時,將所述最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,如圖3d,圖3d為圖3a所描述的終端又一變型結(jié)構(gòu),其還包括:第二獲取單元304、表征單元305、構(gòu)造單元306和第二訓(xùn)練單元307,具體如下:
第二獲取單元304,用于在所述第一獲取單元獲取待處理圖像之前,獲取正樣本集和負樣本集;
表征單元305,用于采用HOG特征對所述正樣本集和所述負樣本集進行表征,得到多個特征向量;
構(gòu)造單元306,用于利用所述多個特征向量構(gòu)造弱分類器;
第二訓(xùn)練單元307,用于利用級聯(lián)的Adaboost算法對所述弱分類器進行訓(xùn)練,得到所述目標(biāo)分類器。
可以看出,通過本發(fā)明實施例所描述的終端,可獲取待處理圖像,利用目標(biāo)分類器對待處理圖像進行訓(xùn)練,得到待處理圖像中的駕駛員區(qū)域,采用指定神經(jīng)網(wǎng)絡(luò)模型對駕駛員區(qū)域進行識別,得到目標(biāo)行為,如此,可提高駕駛員行為識別的正確率。
與上述一致地,請參閱圖4,為本發(fā)明實施例提供的一種終端的第二實施例結(jié)構(gòu)示意圖。本實施例中所描述的終端,包括:至少一個輸入設(shè)備1000;至少一個輸出設(shè)備2000;至少一個處理器3000,例如CPU;和存儲器4000,上述輸入設(shè)備1000、輸出設(shè)備2000、處理器3000和存儲器4000通過總線5000連接。
其中,上述輸入設(shè)備1000具體可為觸控面板、物理按鍵或者鼠標(biāo)。
上述輸出設(shè)備2000具體可為顯示屏。
上述存儲器4000可以是高速RAM存儲器,也可為非易失存儲器(non-volatile memory),例如磁盤存儲器。上述存儲器4000用于存儲一組程序代碼,上述輸入設(shè)備1000、輸出設(shè)備2000和處理器3000用于調(diào)用存儲器4000中存儲的程序代碼,執(zhí)行如下操作:
上述處理器3000,用于:
獲取待處理圖像;
利用目標(biāo)分類器對所述待處理圖像進行訓(xùn)練,得到所述待處理圖像中的駕駛員區(qū)域;
采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為。
可選地,所述指定神經(jīng)網(wǎng)絡(luò)模型包含N個行為屬性的層級結(jié)構(gòu),每一個屬性均包含三個卷積層,每一個卷積層都包括卷積操作、歸一化操作、線性修正激活函數(shù)和池化操作,所述N為正整數(shù)。
可選地,上述處理器3000采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為,包括:
采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
分別將所述N個得分中每一得分與第一預(yù)設(shè)閾值進行比較,得到M個得分,所述M個得分均大于所述第一預(yù)設(shè)閾值,所述M為小于或等于所述N的整數(shù);
將所述M個得分中的最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,上述處理器3000采用指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到目標(biāo)行為,包括:
采用所述指定神經(jīng)網(wǎng)絡(luò)模型對所述駕駛員區(qū)域進行識別,得到所述N個得分;
確定出所述N個得分中的最高得分;
在所述最高得分大于第二預(yù)設(shè)閾值時,將所述最高得分對應(yīng)的行為屬性確定為所述目標(biāo)行為。
可選地,上述處理器3000獲取待處理圖像之前,還具體用于:
獲取正樣本集和負樣本集;
采用HOG特征對所述正樣本集和所述負樣本集進行表征,得到多個特征向量;
利用所述多個特征向量構(gòu)造弱分類器;
利用級聯(lián)的Adaboost算法對所述弱分類器進行訓(xùn)練,得到所述目標(biāo)分類器。
本發(fā)明實施例還提供一種計算機存儲介質(zhì),其中,該計算機存儲介質(zhì)可存儲有程序,該程序執(zhí)行時包括上述方法實施例中記載的任何一種駕駛員行為識別方法的部分或全部步驟。
盡管在此結(jié)合各實施例對本發(fā)明進行了描述,然而,在實施所要求保護的本發(fā)明過程中,本領(lǐng)域技術(shù)人員通過查看所述附圖、公開內(nèi)容、以及所附權(quán)利要求書,可理解并實現(xiàn)所述公開實施例的其他變化。在權(quán)利要求中,“包括”(comprising)一詞不排除其他組成部分或步驟,“一”或“一個”不排除多個的情況。單個處理器或其他單元可以實現(xiàn)權(quán)利要求中列舉的若干項功能。相互不同的從屬權(quán)利要求中記載了某些措施,但這并不表示這些措施不能組合起來產(chǎn)生良好的效果。
本領(lǐng)域技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、裝置(設(shè)備)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。計算機程序存儲/分布在合適的介質(zhì)中,與其它硬件一起提供或作為硬件的一部分,也可以采用其他分布形式,如通過Internet或其它有線或無線電信系統(tǒng)。
本發(fā)明是參照本發(fā)明實施例的方法、裝置(設(shè)備)和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管結(jié)合具體特征及其實施例對本發(fā)明進行了描述,顯而易見的,在不脫離本發(fā)明的精神和范圍的情況下,可對其進行各種修改和組合。相應(yīng)地,本說明書和附圖僅僅是所附權(quán)利要求所界定的本發(fā)明的示例性說明,且視為已覆蓋本發(fā)明范圍內(nèi)的任意和所有修改、變化、組合或等同物。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。