應(yīng)用于行人姿勢分類的3d人體模型的制作方法
【專利摘要】對行人姿勢分類模型進(jìn)行訓(xùn)練。接收行人的三維(3D)模型。接收指示如何生成行人的圖像的圖像參數(shù)的集合。基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維(2D)合成圖像。利用圖像參數(shù)的集合對生成的合成圖像進(jìn)行注釋。通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。
【專利說明】應(yīng)用于行人姿勢分類的3D人體模型
[0001]相關(guān)申請
[0002]本申請要求2012年12月21日遞交的第61/745,235號美國臨時申請的權(quán)益,其通過引用的方式全部并入于此。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明總體涉及對象分類的領(lǐng)域,并且更具體地涉及在對行人姿勢的分類中對合成數(shù)據(jù)的使用。
【背景技術(shù)】
[0004]配備有行人檢測系統(tǒng)的車輛(例如汽車)可以警告其司機附近有行人。然而,僅僅有行人檢測是不夠的。情勢的危險也應(yīng)當(dāng)被評估。只有當(dāng)存在事故的風(fēng)險時才應(yīng)當(dāng)被產(chǎn)生警告。否則,司機將被不必要地分散注意力。情勢的危險例如與行人是否可能走入車輛的路徑有關(guān)。
[0005]“對象分類”指自動對視頻圖像或靜態(tài)圖像中的對象進(jìn)行分類的操作。例如,分類系統(tǒng)可以確定靜態(tài)圖像中的人(例如行人)正在面向左、面向右、面向前還是面向后??梢岳缭谲囕v中使用行人姿勢分類以提高車輛的司機、行人、騎車者以及與車輛共享道路的任何其它人的安全性。
[0006]當(dāng)前的對象分類系統(tǒng)存在很多問題。一個問題是缺少用于訓(xùn)練對象分類模型的大規(guī)模的訓(xùn)練集。為機器學(xué)習(xí)算法提供包括正樣本(包括特定類別的對象的圖像)和負(fù)樣本(不包括該特定類別的對象的圖像,例如包括另一類別的對象的圖像)的訓(xùn)練集以產(chǎn)生對象分類模型。
[0007]此外,當(dāng)為特定類型的對象生成新的訓(xùn)練集時,每個圖像利用特定的信息片段被人工注釋。例如,圖像中存在的對象的分類和/或圖像中存在的對象的特定參數(shù)(例如圖像內(nèi)的對象的顏色和對象的位置)可以被添加到圖像中。機器學(xué)習(xí)算法利用那些注釋和圖像來生成用于對對象進(jìn)行分類的模型。注釋過程可能是乏味且耗時的。
【發(fā)明內(nèi)容】
[0008]以上及其它問題通過一種用于訓(xùn)練行人姿勢分類模型的方法、非瞬態(tài)計算機可讀存儲介質(zhì)和系統(tǒng)來解決。該方法的實施例包括接收行人的三維(3D)模型。該方法還包括接收指示如何生成行人的圖像的圖像參數(shù)的集合。該方法還包括基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維(2D)合成圖像。該方法還包括利用圖像參數(shù)的集合對所生成的合成圖像進(jìn)行注釋。該方法還包括通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。
[0009]該介質(zhì)的實施例存儲用于訓(xùn)練行人姿勢分類模型的可執(zhí)行指令。該指令接收行人的三維(3D)模型。該指令還接收指示如何生成行人的圖像的圖像參數(shù)的集合。該指令還基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維(2D)合成圖像。該指令還利用圖像參數(shù)的集合對所生成的合成圖像進(jìn)行注釋。該指令還通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。
[0010]該系統(tǒng)的實施例包括存儲可執(zhí)行指令的非瞬態(tài)計算機可讀存儲介質(zhì)。該指令接收行人的三維(3D)模型。該指令還接收指示如何生成行人的圖像的圖像參數(shù)的集合。該指令還基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維(2D)合成圖像。該指令還利用圖像參數(shù)的集合對所生成的合成圖像進(jìn)行注釋。該指令還通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。
[0011]說明書中所描述的特征和優(yōu)點并非無所不包的,并且具體而言,很多附加的特征和優(yōu)點對于本領(lǐng)域技術(shù)人員來說在考慮到附圖、說明書和權(quán)利要求的情況下是顯而易見的。此外,應(yīng)當(dāng)注意說明書中所使用的語言主要為了可讀性和指導(dǎo)性的目的而被選擇,并且可以不被選擇用來描述或者限定發(fā)明主題。
【專利附圖】
【附圖說明】
[0012]圖1是示出了根據(jù)實施例的行人姿勢分類系統(tǒng)的高級框圖。
[0013]圖2是示出了根據(jù)實施例的被用作圖1中所示的行人姿勢分類系統(tǒng)的計算機的示例的高級框圖。
[0014]圖3A是示出了根據(jù)實施例的圖1中所示的圖像生成模塊的詳細(xì)視圖的高級框圖。
[0015]圖3B是示出了根據(jù)實施例的圖1中所示的總體分類模塊的詳細(xì)視圖的高級框圖。
[0016]圖4A是示出了根據(jù)實施例的用于生成合成行人數(shù)據(jù)的方法的流程圖。
[0017]圖4B是示出了根據(jù)實施例的用于訓(xùn)練多個二元行人姿勢分類器以用于在圖3B中所示的總體分類模塊中使用的方法的流程圖。
[0018]圖4C是示出了根據(jù)實施例的用于對靜態(tài)圖像中的行人的姿勢進(jìn)行分類的方法的流程圖。
[0019]附圖為了圖示的目的而示出了實施例的各種實現(xiàn)方式。本領(lǐng)域技術(shù)人員根據(jù)以下的討論將很容易地意識到可以使用這里所示出的結(jié)構(gòu)和方法的替代實施例而不偏離這里所描述的實施例的原理。
【具體實施方式】
[0020]現(xiàn)在參考附圖描述實施例,其中相似的標(biāo)號指示相同或功能相似的元件。此外,在附圖中,每個標(biāo)號最左邊的數(shù)字對應(yīng)于其中該標(biāo)號第一次被使用的附圖。
[0021]圖1是示出了根據(jù)實施例的行人姿勢分類系統(tǒng)100的高級框圖。行人姿勢分類系統(tǒng)100可以包括圖像生成模塊105、訓(xùn)練模塊110和總體分類模塊120。在給出行人的靜態(tài)圖像的情況下,行人姿勢分類系統(tǒng)100可以對行人的姿勢進(jìn)行分類。在一個實施例中,姿勢被分類為“面向左”、“面向右”或者“面向前或面向后”。行人姿勢分類系統(tǒng)100可以被用在車輛中以對在車輛外面的附近的行人的姿勢進(jìn)行分類。然后,姿勢分類可以被用于確定行人是否可能走入車輛的路徑中。
[0022]對行人姿勢的了解可以被用在例如車輛事故避免系統(tǒng)中以提高車輛內(nèi)部人員的安全性以及與車輛共享道路的行人的安全性。司機在駕駛車輛時可能需要注意出現(xiàn)在他們周圍的多個對象和事件。例如,司機可能需要注意交通標(biāo)志(例如交通信號燈、速度標(biāo)志和警告標(biāo)志)、車輛參數(shù)(例如車輛速度、引擎速度、油溫和油量)、共享道路的車輛、試圖穿過街道的行人等。有時,行人可能被忽視并且可能被卷入事故中。
[0023]如果檢測到有行人存在(該行人可能走入車輛的路徑中),則可以警示司機有行人存在。例如,考慮位于車輛右邊的行人。如果該行人正面向左,則該行人更有可能走入車輛的路徑中。如果該行人正面向右,則該行人較不可能走入車輛的路徑中。
[0024]圖像生成模塊105接收背景圖像和行人的三維(3D)虛擬模型作為輸入,生成行人的二維(2D)圖像,對生成的2D圖像進(jìn)行注釋,并且輸出經(jīng)注釋的2D圖像(“合成行人數(shù)據(jù)”)。圖像生成模塊105還可以接收參數(shù)的集合以在生成行人的2D圖像時使用(未被示出)。
[0025]訓(xùn)練模塊110接收由圖像生成模塊105生成的經(jīng)注釋的2D圖像(合成行人數(shù)據(jù))作為輸入。然后,訓(xùn)練模塊110利用合成行人數(shù)據(jù)來訓(xùn)練用于對圖像中的行人的姿勢進(jìn)行分類的行人姿勢分類器并且輸出經(jīng)訓(xùn)練的行人姿勢分類器。下面參考圖3A進(jìn)一步描述合成行人數(shù)據(jù)。
[0026]總體分類模塊120接收行人的靜態(tài)圖像以及經(jīng)訓(xùn)練模塊110訓(xùn)練的行人姿勢分類器,確定行人的姿勢的分類,并且輸出該分類。在一些實施例中,靜態(tài)圖像由安裝在車輛上的相機捕獲。例如,靜態(tài)圖像可以利用具有1/1.8英寸的傳感器的電荷耦合器件(CCD)相機來捕獲。為了提高相機的快門速度并且降低圖像模糊,也可以使用具有更大的傳感器的相機。在一些實施例中,通過從視頻中提取幀來得到靜態(tài)圖像。行人姿勢分類可以是三元結(jié)果(例如面向左、面向右或者面向前或面向后)。
[0027]圖2是示出了根據(jù)實施例的被用作圖1中所示的行人姿勢分類系統(tǒng)100的計算機200的示例的高級框圖。所圖示的是被耦合至芯片組204的至少一個處理器202。芯片組204包括存儲器控制器集線器250和輸入/輸出(I/O)控制器集線器255。存儲器206和圖形適配器213被耦合至存儲器控制器集線器250,并且顯示設(shè)備218被耦合至圖形適配器213。存儲設(shè)備208、鍵盤210、定點設(shè)備214和網(wǎng)絡(luò)適配器216被耦合至I/O控制器集線器255。計算機200的其它實施例具有不同的體系結(jié)構(gòu)。例如,在一些實施例中存儲器206被直接耦合至處理器202。
[0028]存儲設(shè)備208包括一個或多個非瞬態(tài)計算機可讀存儲介質(zhì),例如硬盤、致密盤只讀存儲器(⑶-ROM)、DVD或者固態(tài)存儲器設(shè)備。存儲器206保存由處理器202使用的指令和數(shù)據(jù)。定點設(shè)備214與鍵盤210結(jié)合使用以將數(shù)據(jù)輸入到計算機系統(tǒng)200中。圖形適配器213將圖像及其它信息顯示在顯示設(shè)備218上。在一些實施例中,顯示設(shè)備218包括用于接收用戶輸入和選擇的觸摸屏能力。網(wǎng)絡(luò)適配器216將計算機系統(tǒng)200耦合至通信網(wǎng)絡(luò)或其它計算機系統(tǒng)(未示出)。
[0029]計算機200的一些實施例具有與圖2中所示的那些組件不同的組件和/或除了圖2中所示的那些組件以外的其它組件。例如,計算機200可以是嵌入式系統(tǒng)并且缺少圖形適配器213、顯示設(shè)備218、鍵盤210、定點設(shè)備214及其它組件。
[0030]計算機200適于執(zhí)行用于提供這里所描述的功能的計算機程序模塊。如這里所使用的,術(shù)語“模塊”指被用于提供所指定的功能的計算機程序指令和/或其它邏輯。因而,模塊可以用硬件、固件和/或軟件來實現(xiàn)。在一個實施例中,由可執(zhí)行計算機程序指令構(gòu)成的程序模塊被存儲在存儲設(shè)備208上,被載入到存儲器206中并且由處理器202執(zhí)行。
[0031]圖3A是示出了根據(jù)實施例的圖1中所示的圖像生成模塊105的詳細(xì)視圖的高級框圖。圖像生成模塊105包括行人渲染模塊301、背景并入模塊303、圖像后處理模塊305和圖像注釋模塊307。
[0032]行人渲染模塊301接收行人的三維(3D)虛擬模型和參數(shù)的集合作為輸入,基于接收的參數(shù)渲染行人的二維(2D)圖像,并且輸出經(jīng)渲染的2D圖像。參數(shù)的集合例如可以包括行人的性別(例如男或女)、行人的身高、行人的體型(瘦型體質(zhì)、胖型體質(zhì)或者運動型體質(zhì))、行人的發(fā)色(黑色、棕色、金色等)、行人的衣著(襯衫、褲子、鞋等)、行人所用的附件(帽子、背包、傘等)和/或行人的姿勢分類(面向左、面向右或者面向前或面向后)。
[0033]此外,行人渲染模塊301還可以接收照明參數(shù)(例如照明源方位角、照明源高度(elevation)、照明源強度和環(huán)境光能量)、相機參數(shù)(例如相機方位角、相機高度和相機旋轉(zhuǎn)),以及渲染參數(shù)(圖像尺寸、邊界尺寸等)。
[0034]背景并入模塊303接收由行人渲染模塊301生成的2D行人圖像以及2D背景圖像作為輸入,將行人圖像與背景圖像組合并且輸出組合的2D圖像。在一些實施例中,背景圖像選自背景圖像庫。背景并入模塊303還可以接收對行人圖像應(yīng)當(dāng)被放在背景圖像內(nèi)何處做出指示的位置作為參數(shù),并且將行人圖像放在接收的位置處。例如,背景并入模塊303可以接收對將行人圖像放在背景圖像內(nèi)何處做出指示的坐標(biāo)點作為參數(shù)?;蛘?,背景并入模塊303可以接收對行人圖像應(yīng)當(dāng)被放在其中的方框進(jìn)行限定的兩個點作為參數(shù)。
[0035]圖像后處理模塊305接收具有背景并入模塊303所生成的背景的行人的2D圖像,編輯接收的圖像以使得其可以被訓(xùn)練模塊110使用,并且輸出經(jīng)編輯的圖像。例如,圖像后處理模塊305可以使圖像平滑、對圖像進(jìn)行下采樣、對圖像進(jìn)行剪裁等。
[0036]圖像注釋模塊307接收圖像后處理模塊305所輸出的圖像作為輸入,利用接收的圖像的地面實況對接收的圖像進(jìn)行注釋,并且輸出經(jīng)注釋的圖像。在一些實施例中,地面實況指示行人的姿勢分類(例如面向左、面向右或者面向前或面向后)。在其它實施例中,地面實況還包括被用來渲染圖像的其它參數(shù)。地面實況還可以包括行人在圖像中的位置。例如,圖像注釋模塊307可以利用對行人在圖像中的位置做出指示的坐標(biāo)點(或者對方框進(jìn)行限定的兩個點)對圖像進(jìn)行注釋。
[0037]圖3B是示出了根據(jù)實施例的圖1中所示的總體分類模塊120的詳細(xì)視圖的高級框圖??傮w分類模塊120包括方向梯度直方圖(HOG)提取模塊311、多個二元分類模塊313和裁決模塊315。
[0038]方向梯度直方圖(HOG)提取模塊311接收靜態(tài)圖像,從接收的靜態(tài)圖像中提取HOG特征并且輸出提取的特征。如這里所使用的,方向梯度直方圖(HOG)是為了對象分類的目的而在計算機視覺和圖像處理中使用的特征描述符。HOG特征指示在圖像的局部化部分中出現(xiàn)梯度定向(gradient orientation)的次數(shù)。
[0039]HOG提取模塊311通過將接收的圖像分成多個單元來提取HOG特征。例如,HOG提取模塊311可以利用具有8X8像素的單元尺寸來計算HOG特征。對于每個單元,HOG提取模塊311對單元的像素計算一維(ID )梯度方向直方圖。在一些實施例中,HOG提取模塊311通過以下方式針對整個接收的圖像中的亮度變化對圖像進(jìn)行標(biāo)準(zhǔn)化:將圖像分成區(qū)塊,計算區(qū)塊的本地直方圖能量并且基于計算出的本地直方圖能量對區(qū)塊內(nèi)的單元進(jìn)行標(biāo)準(zhǔn)化。例如,HOG提取模塊311可以利用具有2X2個單元的區(qū)塊尺寸來計算本地直方圖能量。
[0040]在一個實施例中,HOG提取模塊311從具有預(yù)定義尺寸的圖像中提取HOG特征。例如,HOG提取模塊311可以從32 X 64像素的圖像中提取HOG特征。如果接收的圖像的尺寸更大或更小,則HOG提取模塊對圖像進(jìn)行縮小或放大,直到圖像尺寸等于預(yù)定義的圖像尺寸為止。
[0041]二元分類模塊313接收來自圖像的HOG特征的集合作為輸入,利用分類器(例如支持向量機或“SVM”)和HOG特征來確定出現(xiàn)在圖像中的行人的姿勢是否屬于特定類別,并且輸出二元結(jié)果(例如是/否)和置信度值(confidence value)。在一些實施例中,二元分類模塊313使用線性分類器,例如線性SVM。在其它實施例中,二元分類模塊313使用非線性分類器,例如徑向基函數(shù)(RBF)SVM。二元分類模塊313所輸出的置信度值指示二元結(jié)果正確的概率。
[0042]如這里所使用的,線性分類器基于對象的特性或特征的線性組合(或函數(shù))來識別對象(例如靜態(tài)圖像)是否屬于特定類別(例如行人面向左、行人面向右、行人面向前或面向后)。在一個實施例中,線性分類器的輸出由以下等式給出:
[0043]y = f ( ω.x)
[0044]其中y是線性分類模塊的輸出,ω是由訓(xùn)練模塊110確定的權(quán)重向量,并且χ是包含被分類的對象的特征的值的特征向量。
[0045]如這里所使用的,非線性分類器基于對象的特征的非線性組合(或函數(shù))來識別對象(例如圖像)是否屬于特定類別(例如行人面向左、行人面向右、行人面向前或面向后)。
[0046]二元分類模塊313中的每一個模塊可以針對一個姿勢對行人靜態(tài)圖像分類。例如,二元分類模塊313Α可以對行人圖像進(jìn)行分類以確定圖像是否包含面向左的行人,二元分類模塊313Β可以對行人圖像進(jìn)行分類以確定圖像是否包含面向右的行人,并且二元分類模塊313C可以對行人圖像進(jìn)行分類以確定圖像是否包含面向前或面向后的行人。在一些實施例中,二元分類模塊313Α基于行人靜態(tài)圖像包含面向左的行人的概率生成分?jǐn)?shù)(例如置信度值),二元分類模塊313Β基于行人靜態(tài)圖像包含面向右的行人的概率生成分?jǐn)?shù)(置信度值),并且二元分類模塊313C基于行人靜態(tài)圖像包含面向前或面向后的行人的概率生成分?jǐn)?shù)(置信度值)。
[0047]裁決模塊315接收從二元分類模塊313中的每個模塊接收輸出并且確定靜態(tài)圖像中的行人的姿勢分類。在一個實施例中,裁決模塊確定姿勢分類為:
[0048]pmax = HiaxiPi
【權(quán)利要求】
1.一種用于訓(xùn)練行人姿勢分類模型的方法,包括: 接收行人的三維(3D)模型; 接收指示如何生成行人的圖像的圖像參數(shù)的集合; 基于接收的所述三維模型和接收的所述圖像參數(shù)的集合來生成二維(2D)合成圖像; 利用所述圖像參數(shù)的集合對生成的所述合成圖像進(jìn)行注釋;以及 通過經(jīng)注釋的所述合成圖像訓(xùn)練多個行人姿勢分類器。
2.根據(jù)權(quán)利要求1所述的方法,其中所述圖像參數(shù)的集合包括姿勢分類,并且其中訓(xùn)練所述多個行人姿勢分類器包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為第一姿勢分類,通過作為正樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述多個行人姿勢分類器當(dāng)中的第一行人姿勢分類器。
3.根據(jù)權(quán)利要求2所述的方法,其中訓(xùn)練所述多個行人姿勢分類器還包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為所述第一姿勢分類,通過作為負(fù)樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述多個行人姿勢分類器當(dāng)中的第二行人姿勢分類器。
4.根據(jù)權(quán)利要求3所述的方法,其中訓(xùn)練所述多個行人姿勢分類器還包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為第二姿勢分類,通過作為負(fù)樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述第一行人姿勢分類器,并且通過作為正樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述第二行人姿勢分類器。
5.根據(jù)權(quán)利要求1所述的方法,其中生成所述二維合成圖像包括: 根據(jù)接收的所述三維模型渲染行人的二維圖像;以及 為經(jīng)渲染的所述二維圖像添加背景。
6.根據(jù)權(quán)利要求1所述的方法,其中所述行人姿勢分類器是二元行人姿勢分類器。
7.根據(jù)權(quán)利要求1所述的方法,其中所述行人姿勢分類器包括非線性支持向量機(SVM)0
8.根據(jù)權(quán)利要求1所述的方法,其中所述行人姿勢分類器基于方向梯度直方圖(HOG)圖像特征執(zhí)行分類。
9.一種被配置為存儲用于訓(xùn)練行人姿勢分類模型的指令的非瞬態(tài)計算機可讀存儲介質(zhì),所述指令在由處理器執(zhí)行時使得所述處理器: 接收行人的三維(3D)模型; 接收指示如何生成行人的圖像的圖像參數(shù)的集合; 基于接收的所述三維模型和接收的所述圖像參數(shù)的集合來生成二維(2D)合成圖像; 利用所述圖像參數(shù)的集合對生成的所述合成圖像進(jìn)行注釋;以及 通過經(jīng)注釋的所述合成圖像訓(xùn)練多個行人姿勢分類器。
10.根據(jù)權(quán)利要求9所述的非瞬態(tài)計算機可讀存儲介質(zhì),其中所述圖像參數(shù)的集合包括姿勢分類,并且其中訓(xùn)練所述多個行人姿勢分類器包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為第一姿勢分類,通過作為正樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述多個行人姿勢分類器當(dāng)中的第一行人姿勢分類器。
11.根據(jù)權(quán)利要求10所述的非瞬態(tài)計算機可讀存儲介質(zhì),其中訓(xùn)練所述多個行人姿勢分類器還包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為所述第一姿勢分類,通過作為負(fù)樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述多個行人姿勢分類器當(dāng)中的第二行人姿勢分類器。
12.根據(jù)權(quán)利要求11所述的非瞬態(tài)計算機可讀存儲介質(zhì),其中訓(xùn)練所述多個行人姿勢分類器還包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為第二姿勢分類,通過作為負(fù)樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述第一行人姿勢分類器,并且通過作為正樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述第二行人姿勢分類器。
13.根據(jù)權(quán)利要求9所述的非瞬態(tài)計算機可讀存儲介質(zhì),其中生成所述二維合成圖像包括: 根據(jù)接收的所述三維模型渲染行人的二維圖像;以及 為經(jīng)渲染的所述二維圖像添加背景。
14.根據(jù)權(quán)利要求9所述的非瞬態(tài)計算機可讀存儲介質(zhì),其中所述行人姿勢分類器是二元行人姿勢分類器。
15.根據(jù)權(quán)利要求9所述的非瞬態(tài)計算機可讀存儲介質(zhì),其中所述行人姿勢分類器包括非線性支持向量機(SVM)。
16.根據(jù)權(quán)利要求9所述的非瞬態(tài)計算機可讀存儲介質(zhì),其中所述行人姿勢分類器基于方向梯度直方圖(HOG)圖像特征執(zhí)行分類。
17.一種用于訓(xùn)練行人姿勢分類模型的系統(tǒng),包括: 處理器;以及` 存儲指令的非瞬態(tài)計算機可讀存儲介質(zhì),所述指令在由所述處理器執(zhí)行時使得所述處理器: 接收行人的三維(3D)模型; 接收指示如何生成行人的圖像的圖像參數(shù)的集合; 基于接收的所述三維模型和接收的所述圖像參數(shù)的集合來生成二維(2D)合成圖像; 利用所述圖像參數(shù)的集合對生成的所述合成圖像進(jìn)行注釋;以及 通過經(jīng)注釋的所述合成圖像訓(xùn)練多個行人姿勢分類器。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所述圖像參數(shù)的集合包括姿勢分類,并且其中訓(xùn)練所述多個行人姿勢分類器包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為第一姿勢分類,通過作為正樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述多個行人姿勢分類器當(dāng)中的第一行人姿勢分類器。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其中訓(xùn)練所述多個行人姿勢分類器還包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為所述第一姿勢分類,通過作為負(fù)樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述多個行人姿勢分類器當(dāng)中的第二行人姿勢分類器。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其中訓(xùn)練所述多個行人姿勢分類器還包括: 響應(yīng)于所述圖像參數(shù)的所述姿勢分類為第二姿勢分類,通過作為負(fù)樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述第一行人姿勢分類器,并且通過作為正樣本的經(jīng)注釋的所述合成圖像來訓(xùn)練所述第二行人姿勢分類器。
【文檔編號】G06K9/46GK103886315SQ201310714502
【公開日】2014年6月25日 申請日期:2013年12月20日 優(yōu)先權(quán)日:2012年12月21日
【發(fā)明者】B·海斯勒 申請人:本田技研工業(yè)株式會社