两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

目標(biāo)檢測和分類方法和裝置的制作方法

文檔序號:6332703閱讀:173來源:國知局
專利名稱:目標(biāo)檢測和分類方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)視覺與圖像處理領(lǐng)域,更具體地涉及一種目標(biāo)檢測和分類方法和裝置。
背景技術(shù)
運(yùn)用機(jī)器學(xué)習(xí)方法對圖像或其它待檢測數(shù)據(jù)進(jìn)行目標(biāo)數(shù)據(jù)的檢測和分類顯得越來越重要。尤其是對圖像中的物體檢測和分類已成為其中一個(gè)重要分支。在現(xiàn)有技術(shù)中,通常的做法是首先檢測圖像中哪些區(qū)域包含目標(biāo)數(shù)據(jù),然后再對這些目標(biāo)數(shù)據(jù)進(jìn)行類別判斷。這樣,在分類時(shí)就需要執(zhí)行對準(zhǔn)操作,從而大大增加了目標(biāo)檢測和分類的計(jì)算量,并且在對準(zhǔn)操作不準(zhǔn)確的情況下會嚴(yán)重降低目標(biāo)檢測和分類的準(zhǔn)確度。

發(fā)明內(nèi)容
在下文中給出了關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。但是,應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖用來確定本發(fā)明的關(guān)鍵性部分或重要部分,也不是意圖用來限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出關(guān)于本發(fā)明的某些概念,以此作為稍后給出的更詳細(xì)描述的前序。鑒于現(xiàn)有技術(shù)的上述情形,本發(fā)明的目的是提供一種目標(biāo)檢測和分類方法,其能夠有效地降低目標(biāo)檢測和分類的計(jì)算量以及提高目標(biāo)檢測和分類的準(zhǔn)確度。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種目標(biāo)檢測和分類方法,包括輸入待處理的圖像;對所述圖像進(jìn)行窗口掃描,以針對每個(gè)類別,對每個(gè)窗口進(jìn)行是否存在此類別的目標(biāo)的目標(biāo)存在性判別,然后對判別為正的窗口進(jìn)行該窗口是屬于此類別還是其它類別的目標(biāo)類別判別,以得到該窗口關(guān)于該類別的目標(biāo)分類置信度;針對所有類別, 對所有正輸出窗口進(jìn)行空間鄰域合并,以得到一個(gè)或多個(gè)合并區(qū)域及其目標(biāo)檢測置信度; 針對每個(gè)合并區(qū)域,判斷合并區(qū)域的目標(biāo)檢測置信度是否高于預(yù)定閾值;如果合并區(qū)域的目標(biāo)檢測置信度高于預(yù)定閾值,則針對每個(gè)類別,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度;以及將合并的目標(biāo)分類置信度最高的類別確定為合并區(qū)域的類別。根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種目標(biāo)檢測和分類裝置,其包括輸入單元,用于輸入待處理的圖像;窗口掃描單元,用于對所述圖像進(jìn)行窗口掃描,以針對每個(gè)類別,對每個(gè)窗口進(jìn)行是否存在此類別的目標(biāo)的目標(biāo)存在性判別,然后對判別為正的窗口進(jìn)行該窗口是屬于此類別還是其它類別的目標(biāo)類別判別,以得到該窗口關(guān)于該類別的目標(biāo)分類置信度;空間鄰域合并單元,用于針對所有類別,對所有正輸出窗口進(jìn)行空間鄰域合并, 以得到一個(gè)或多個(gè)合并區(qū)域及其目標(biāo)檢測置信度;判斷單元,用于針對每個(gè)合并區(qū)域,判斷合并區(qū)域的目標(biāo)檢測置信度是否高于預(yù)定閾值;合并置信度計(jì)算單元,用于如果合并區(qū)域的目標(biāo)檢測置信度高于預(yù)定閾值,則針對每個(gè)類別,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度;以及類別確定單元,用于將合并的目標(biāo)分類置信度最高的類別確定為合并區(qū)域的類別。根據(jù)本發(fā)明的另一個(gè)方面,還提供了用于實(shí)現(xiàn)上述目標(biāo)檢測和分類方法的計(jì)算機(jī)
程序產(chǎn)品。根據(jù)本發(fā)明的另一個(gè)方面,還提供了計(jì)算機(jī)可讀介質(zhì),其上記錄有用于實(shí)現(xiàn)上述目標(biāo)檢測和分類方法的計(jì)算機(jī)程序代碼。與現(xiàn)有技術(shù)相比,根據(jù)本發(fā)明的上述技術(shù)方案,由于避免了目標(biāo)分類所需的對準(zhǔn)操作,因此能夠有效地降低目標(biāo)檢測和分類的計(jì)算量以及提高目標(biāo)檢測和分類的準(zhǔn)確度。


本發(fā)明可以通過參考下文中結(jié)合附圖所給出的詳細(xì)描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說明一起包含在本說明書中并形成說明書的一部分,用來進(jìn)一步舉例說明本發(fā)明的優(yōu)選實(shí)施例和解釋本發(fā)明的原理和優(yōu)點(diǎn)。在附圖中圖1示出了根據(jù)本發(fā)明實(shí)施例的目標(biāo)檢測和分類方法的總體流程圖;圖2示出了圖1所示的空間鄰域合并步驟中的空間鄰域合并處理的示例圖;圖3示出了根據(jù)本發(fā)明實(shí)施例的目標(biāo)檢測和分類裝置的結(jié)構(gòu)框圖;以及圖4示出了其中實(shí)現(xiàn)本發(fā)明的計(jì)算機(jī)的示例性結(jié)構(gòu)框圖。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,附圖中的元件僅僅是為了簡單和清楚起見而示出的, 而且不一定是按比例繪制的。例如,附圖中某些元件的尺寸可能相對于其它元件放大了,以便有助于提高對本發(fā)明實(shí)施例的理解。
具體實(shí)施例方式在下文中將結(jié)合附圖對本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡明起見, 在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其它細(xì)節(jié)。首先將參考附圖詳細(xì)描述根據(jù)本發(fā)明實(shí)施例的目標(biāo)檢測和分類方法。圖1示出了根據(jù)本發(fā)明實(shí)施例的目標(biāo)檢測和分類方法的總體流程圖。如圖1所示, 根據(jù)本發(fā)明實(shí)施例的目標(biāo)檢測和分類方法包括輸入步驟S110、窗口掃描步驟S120、空間鄰域合并步驟S130、判斷步驟S140、合并置信度計(jì)算步驟S150以及類別確定步驟S160。首先,在輸入步驟SllO中,輸入待處理的圖像。這里,待處理的圖像可以是任意給定的圖像或從視頻中截取的圖像。接下來,在窗口掃描步驟S120中,對所述圖像進(jìn)行窗口掃描,以針對每個(gè)類別,對每個(gè)窗口進(jìn)行是否存在此類別的目標(biāo)的目標(biāo)存在性判別,然后對判別為正的窗口進(jìn)行該窗口是屬于此類別還是其它類別的目標(biāo)類別判別,以得到該窗口關(guān)于該類別的目標(biāo)分類置信度。例如,在汽車檢測和分類的應(yīng)用場景下,假定預(yù)定類別為轎車、巴士和卡車這三類,則針對每個(gè)類別,首先判別每個(gè)窗口是否包含此類汽車的圖像(例如,對于轎車類別, 進(jìn)行轎車/背景的目標(biāo)存在性判別),然后對判別出包含此類汽車圖像的窗口進(jìn)行目標(biāo)類別判別(例如,對于轎車類別,進(jìn)行轎車類別/非轎車類別的類別判斷)。應(yīng)當(dāng)理解,本發(fā)明的實(shí)施例并不限于對圖像和/或視頻中的汽車進(jìn)行檢測和分類,還可以對圖像和/或視頻中的其它物體(如多角度的人臉)進(jìn)行檢測和分類。此外,應(yīng)當(dāng)理解,這里執(zhí)行的目標(biāo)存在性判別和目標(biāo)類別判別處理可以采用現(xiàn)有技術(shù)中的任何檢測和分類技術(shù)來實(shí)現(xiàn),例如Boosting分類、級聯(lián)分類等等。此外,在窗口掃描步驟S120中,可以利用預(yù)定的窗口和步長對圖像進(jìn)行窗口掃描。在一個(gè)示例中,所述窗口可以是矩形窗口,其尺寸可以根據(jù)實(shí)際需要而定。所述步長也可以根據(jù)實(shí)際需要而定,例如,該步長可以是一個(gè)或多個(gè)像素,還可以與當(dāng)前窗口的尺寸成比例關(guān)系。所述掃描的順序和方式也是任意的,可以是從左到右、從上到下的,還可以是從右到左、從下到上的。本發(fā)明對此不作任何限制。此外,優(yōu)選地,由于檢測對象尺度的不確定性,在窗口掃描步驟S120中,可以對所述圖像進(jìn)行多尺度的窗口掃描。多尺度的窗口掃描可以采用模式Wir^canModel (即選擇固定尺寸的窗口掃描圖像,掃描結(jié)束后,按一定比例縮小或放大圖像的尺寸,使用固定尺寸的窗口重新掃描圖像),也可以采用模式Wir^canModd,(即保持圖像的尺寸不變,選擇第一次掃描時(shí)窗口的尺寸,當(dāng)掃描結(jié)束后,按一定比例縮小或放大窗口的尺寸,重新遍歷原圖像)。例如,本申請人于2009年4月1日遞交的題為“多類目標(biāo)的檢測裝置及檢測方法”的中國專利申請20091013^68.0就記載了多尺度掃描的技術(shù),該申請的全文通過這里的引用合并于此。此外,優(yōu)選地,在窗口掃描步驟S120中,在對判別為正的窗口進(jìn)行目標(biāo)類別判別中不拒絕樣本,也就是說,在該窗口被判別為不屬于當(dāng)前類別的情況下,不否定前面的檢測結(jié)果,這樣可以不讓目標(biāo)類別判別結(jié)果影響前面的檢測結(jié)果,從而保證目標(biāo)檢測的準(zhǔn)確性。接下來,在空間鄰域合并步驟S130,針對所有類別,對所有正輸出窗口進(jìn)行空間鄰域合并,以得到一個(gè)或多個(gè)合并區(qū)域及其目標(biāo)檢測置信度。也就是說,對于上述窗口掃描步驟S120中的每個(gè)窗口,只要在某一個(gè)類別的目標(biāo)檢測處理中被判別為正,就參與空間鄰域合并處理。具體地說,在掃描過程中,由于各種原因(例如檢測目標(biāo)的尺寸大于窗口,或者窗口掃描的步長小于檢測目標(biāo)的尺寸,或者僅僅因?yàn)闄z測目標(biāo)本身的位置恰好跨越窗口邊界),可能導(dǎo)致檢測目標(biāo)跨越多個(gè)窗口,從而使得多個(gè)窗口對檢測目標(biāo)有正面響應(yīng)(即正輸出)。為此,可以把具有正面響應(yīng)的相鄰窗口進(jìn)行合并,從而得到合并區(qū)域的位置及其目標(biāo)檢測置信度。在此,上述空間鄰域合并處理可以通過現(xiàn)有技術(shù)中的聚類處理來完成,例如, k-means聚類算法等。應(yīng)當(dāng)理解,在此所述的空間鄰域合并處理的方法僅僅是示例性的,并非意欲將本申請限制于此。在本申請的范圍內(nèi),本領(lǐng)域的普通技術(shù)人員可以利用各種其他適當(dāng)?shù)姆椒▉磉M(jìn)行空間鄰域合并。
圖2示出了空間鄰域合并步驟S130中的空間鄰域合并處理的示例圖,其中右圖中的粗框表示上述的合并區(qū)域?;氐綀D1,接下來,在判斷步驟S140中,針對每個(gè)合并區(qū)域,判斷合并區(qū)域的目標(biāo)檢測置信度是否高于預(yù)定閾值;接下來,在合并置信度計(jì)算步驟S150中,如果合并區(qū)域的目標(biāo)檢測置信度高于預(yù)定閾值,則針對每個(gè)類別,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度。在合并置信度計(jì)算步驟S150中,計(jì)算合并的目標(biāo)分類置信度可以用多種方式進(jìn)行。例如,計(jì)算各正輸出窗口的目標(biāo)分類置信度之和或平均值;或者將各目標(biāo)分類置信度歸一化,并對歸一化后的目標(biāo)分類置信度求和或求平均值;等等。應(yīng)當(dāng)理解,在此所述的計(jì)算合并的目標(biāo)分類置信度的方法僅僅是示例性的,并非意欲將本申請限制于此。在本申請的范圍內(nèi),本領(lǐng)域的普通技術(shù)人員可以利用各種其他適當(dāng)?shù)挠?jì)算方法(例如構(gòu)造直方圖等) 來計(jì)算合并的目標(biāo)分類置信度。最后,在類別確定步驟S160中,將合并的目標(biāo)分類置信度最大的類別確定為合并區(qū)域的類別。上面結(jié)合附圖詳細(xì)描述了本發(fā)明實(shí)施例的目標(biāo)檢測和分類方法。下面將結(jié)合附圖描述根據(jù)本發(fā)明實(shí)施例的目標(biāo)檢測和分類裝置。圖3示出了根據(jù)本發(fā)明實(shí)施例的目標(biāo)檢測和分類裝置300的結(jié)構(gòu)框圖,其中,為了簡明起見僅僅示出了與本發(fā)明密切相關(guān)的部分。在目標(biāo)檢測和分類裝置300中,能夠執(zhí)行以上參考圖1所描述的目標(biāo)檢測和分類方法。如圖3所示,目標(biāo)檢測和分類裝置300可以包括輸入單元310、窗口掃描單元320、 空間鄰域合并單元330、判斷單元340、合并置信度計(jì)算單元350以及類別確定單元360。其中,輸入單元310可以用于輸入待處理的圖像;窗口掃描單元320可以用于對所述圖像進(jìn)行窗口掃描,以針對每個(gè)類別,對每個(gè)窗口進(jìn)行是否存在此類別的目標(biāo)的目標(biāo)存在性判別,然后對判別為正的窗口進(jìn)行該窗口是屬于此類別還是其它類別的目標(biāo)類別判別,以得到該窗口關(guān)于該類別的目標(biāo)分類置信度;空間鄰域合并單元330可以用于針對所有類別,對所有正輸出窗口進(jìn)行空間鄰域合并,以得到一個(gè)或多個(gè)合并區(qū)域及其目標(biāo)檢測置信度;判斷單元340可以用于針對每個(gè)合并區(qū)域,判斷合并區(qū)域的目標(biāo)檢測置信度是否高于預(yù)定閾值;合并置信度計(jì)算單元350可以用于如果合并區(qū)域的目標(biāo)檢測置信度高于預(yù)定閾值,則針對每個(gè)類別,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度;以及,類別確定單元360可以用于將合并的目標(biāo)分類置信度最高的類別確定為合并區(qū)域的類別。通過閱讀前面給出的相應(yīng)處理的描述,目標(biāo)檢測和分類裝置300的各個(gè)組成單元的功能如何實(shí)現(xiàn)就變得很清楚了,所以在此就不再贅述了。在此需要說明的是,圖3所示的目標(biāo)檢測和分類裝置300及其組成單元的結(jié)構(gòu)僅僅是示例性的,本領(lǐng)域技術(shù)人員可以根據(jù)需要對圖3所示的結(jié)構(gòu)框圖進(jìn)行修改。以上結(jié)合具體實(shí)施例描述了本發(fā)明的基本原理,但是,需要指出的是,對本領(lǐng)域的普通技術(shù)人員而言,能夠理解本發(fā)明的方法和裝置的全部或者任何步驟或者部件,可以在任何計(jì)算裝置(包括處理器、存儲介質(zhì)等)或者計(jì)算裝置的網(wǎng)絡(luò)中,以硬件、固件、軟件或者它們的組合加以實(shí)現(xiàn),這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說明的情況下運(yùn)用他們的基本編程技能就能實(shí)現(xiàn)的。因此,本發(fā)明的目的還可以通過在任何計(jì)算裝置上運(yùn)行一個(gè)程序或者一組程序來實(shí)現(xiàn)。所述計(jì)算裝置可以是公知的通用裝置。因此,本發(fā)明的目的也可以僅僅通過提供包含實(shí)現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來實(shí)現(xiàn)。也就是說,這樣的程序產(chǎn)品也構(gòu)成本發(fā)明,并且存儲有這樣的程序產(chǎn)品的存儲介質(zhì)也構(gòu)成本發(fā)明。顯然,所述存儲介質(zhì)可以是任何公知的存儲介質(zhì)或者將來所開發(fā)出來的任何存儲介質(zhì)。在通過軟件和/或固件實(shí)現(xiàn)本發(fā)明的實(shí)施例的情況下,從存儲介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī),例如圖4所示的通用計(jì)算機(jī)400安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等等。在圖4中,中央處理模塊(CPU)401根據(jù)只讀存儲器(ROM)402中存儲的程序或從存儲部分408加載到隨機(jī)存取存儲器(RAM) 403的程序執(zhí)行各種處理。在RAM 403中,也根據(jù)需要存儲當(dāng)CPU 401執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 40UROM 402和RAM 403經(jīng)由總線404彼此連接。輸入/輸出接口 405也連接到總線404。下述部件連接到輸入/輸出接口 405 輸入部分406,包括鍵盤、鼠標(biāo)等等;輸出部分407,包括顯示器,比如陰極射線管(CRT)、液晶顯示器(IXD)等等,和揚(yáng)聲器等等;存儲部分408,包括硬盤等等;和通信部分409,包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等等。通信部分409經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器410也連接到輸入/輸出接口 405。可拆卸介質(zhì)411比如磁盤、 光盤、磁光盤、半導(dǎo)體存儲器等等根據(jù)需要被安裝在驅(qū)動器410上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲部分408中。在通過軟件實(shí)現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲介質(zhì)比如可拆卸介質(zhì)411安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲介質(zhì)不局限于圖4所示的其中存儲有程序、與裝置相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)411??刹鹦督橘|(zhì)411的例子包含磁盤(包含軟盤(注冊商標(biāo)))、光盤(包含光盤只讀存儲器(⑶-ROM)和數(shù)字通用盤 (DVD))、磁光盤(包含迷你盤(MD)(注冊商標(biāo)))和半導(dǎo)體存儲器?;蛘?,存儲介質(zhì)可以是 ROM 402、存儲部分408中包含的硬盤等等,其中存有程序,并且與包含它們的裝置一起被分發(fā)給用戶。還需要指出的是,在本發(fā)明的裝置和方法中,顯然,各部件或各步驟是可以分解和 /或重新組合的。這些分解和/或重新組合應(yīng)視為本發(fā)明的等效方案。并且,執(zhí)行上述系列處理的步驟可以自然地按照說明的順序按時(shí)間順序執(zhí)行,但是并不需要一定按照時(shí)間順序執(zhí)行。某些步驟可以并行或彼此獨(dú)立地執(zhí)行。雖然已經(jīng)詳細(xì)說明了本發(fā)明及其優(yōu)點(diǎn),但是應(yīng)當(dāng)理解在不脫離由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進(jìn)行各種改變、替代和變換。而且,本申請的術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素, 或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,
由語句“包括一個(gè)......”限定的要素,并不排除在包括所述要素的過程、方法、物品或者裝
置中還存在另外的相同要素。
權(quán)利要求
1.一種目標(biāo)檢測和分類方法,包括 輸入待處理的圖像;對所述圖像進(jìn)行窗口掃描,以針對每個(gè)類別,對每個(gè)窗口進(jìn)行是否存在此類別的目標(biāo)的目標(biāo)存在性判別,然后對判別為正的窗口進(jìn)行該窗口是屬于此類別還是其它類別的目標(biāo)類別判別,以得到該窗口關(guān)于該類別的目標(biāo)分類置信度;針對所有類別,對所有正輸出窗口進(jìn)行空間鄰域合并,以得到一個(gè)或多個(gè)合并區(qū)域及其目標(biāo)檢測置信度;針對每個(gè)合并區(qū)域,判斷合并區(qū)域的目標(biāo)檢測置信度是否高于預(yù)定閾值; 如果合并區(qū)域的目標(biāo)檢測置信度高于預(yù)定閾值,則針對每個(gè)類別,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度;以及將合并的目標(biāo)分類置信度最高的類別確定為合并區(qū)域的類別。
2.如權(quán)利要求1所述的目標(biāo)檢測和分類方法,其中對所述圖像進(jìn)行窗口掃描包括對所述圖像進(jìn)行多尺度的窗口掃描。
3.如權(quán)利要求1所述的目標(biāo)檢測和分類方法,其中對所有正輸出窗口進(jìn)行空間鄰域合并通過聚類處理來完成。
4.如權(quán)利要求1所述的目標(biāo)檢測和分類方法,其中在對判別為正的窗口進(jìn)行目標(biāo)類別判別中,在該窗口被判別為不屬于當(dāng)前類別的情況下,不否定前面的檢測結(jié)果。
5.如權(quán)利要求1所述的目標(biāo)檢測和分類方法,其中對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度包括計(jì)算合并區(qū)域內(nèi)的各正輸出窗口的目標(biāo)分類置信度之和或平均值。
6.如權(quán)利要求1所述的目標(biāo)檢測和分類方法,其中對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度包括對合并區(qū)域內(nèi)的各正輸出窗口的目標(biāo)分類置信度進(jìn)行歸一化;以及對歸一化后的目標(biāo)分類置信度求和或求平均值作為合并的目標(biāo)分類置信度。
7.如權(quán)利要求1所述的目標(biāo)檢測和分類方法,其中對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度包括按照合并區(qū)域內(nèi)的各正輸出窗口關(guān)于每個(gè)類別的目標(biāo)分類置信度,構(gòu)造直方圖。
8.一種目標(biāo)檢測和分類裝置,包括 輸入單元,用于輸入待處理的圖像;窗口掃描單元,用于對所述圖像進(jìn)行窗口掃描,以針對每個(gè)類別,對每個(gè)窗口進(jìn)行是否存在此類別的目標(biāo)的目標(biāo)存在性判別,然后對判別為正的窗口進(jìn)行該窗口是屬于此類別還是其它類別的目標(biāo)類別判別,以得到該窗口關(guān)于該類別的目標(biāo)分類置信度;空間鄰域合并單元,用于針對所有類別,對所有正輸出窗口進(jìn)行空間鄰域合并,以得到一個(gè)或多個(gè)合并區(qū)域及其目標(biāo)檢測置信度;判斷單元,用于針對每個(gè)合并區(qū)域,判斷合并區(qū)域的目標(biāo)檢測置信度是否高于預(yù)定閾值;合并置信度計(jì)算單元,用于如果合并區(qū)域的目標(biāo)檢測置信度高于預(yù)定閾值,則針對每個(gè)類別,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度;以及類別確定單元,用于將合并的目標(biāo)分類置信度最高的類別確定為合并區(qū)域的類別。
9.如權(quán)利要求8所述的目標(biāo)檢測和分類裝置,其中所述窗口掃描單元對所述圖像進(jìn)行多尺度的窗口掃描。
10.如權(quán)利要求8所述的目標(biāo)檢測和分類裝置,其中所述空間鄰域合并單元通過聚類處理來對所有正輸出窗口進(jìn)行空間鄰域合并。
11.如權(quán)利要求8所述的目標(biāo)檢測和分類裝置,其中所述窗口掃描單元在對判別為正的窗口進(jìn)行目標(biāo)類別判別中,在該窗口被判別為不屬于當(dāng)前類別的情況下,不否定前面的檢測結(jié)果。
12.如權(quán)利要求8所述的目標(biāo)檢測和分類裝置,其中合并置信度計(jì)算單元通過計(jì)算合并區(qū)域內(nèi)的各正輸出窗口的目標(biāo)分類置信度之和或平均值,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度。
13.如權(quán)利要求8所述的目標(biāo)檢測和分類裝置,其中合并置信度計(jì)算單元通過以下處理來對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度對合并區(qū)域內(nèi)的各正輸出窗口的目標(biāo)分類置信度進(jìn)行歸一化;以及對歸一化后的目標(biāo)分類置信度求和或求平均值作為合并的目標(biāo)分類置信度。
14.如權(quán)利要求8所述的目標(biāo)檢測和分類裝置,其中合并置信度計(jì)算單元通過按照合并區(qū)域內(nèi)的各正輸出窗口關(guān)于每個(gè)類別的目標(biāo)分類置信度構(gòu)造直方圖,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度。
全文摘要
本發(fā)明公開了一種目標(biāo)檢測和分類方法和裝置,其中該方法包括輸入圖像;對圖像進(jìn)行窗口掃描,以針對每個(gè)類別,對每個(gè)窗口進(jìn)行目標(biāo)存在性判別,然后對判別為正的窗口進(jìn)行目標(biāo)類別判別,以得到該窗口關(guān)于該類別的目標(biāo)分類置信度;針對所有類別,對所有正輸出窗口進(jìn)行空間鄰域合并,以得到合并區(qū)域及其目標(biāo)檢測置信度;針對每個(gè)合并區(qū)域,判斷合并區(qū)域的目標(biāo)檢測置信度是否高于預(yù)定閾值;如果高于預(yù)定閾值,則針對每個(gè)類別,對合并區(qū)域內(nèi)的所有正輸出窗口計(jì)算合并的目標(biāo)分類置信度;以及將合并的目標(biāo)分類置信度最高的類別確定為合并區(qū)域的類別。根據(jù)本發(fā)明的上述技術(shù)方案,能夠有效地降低目標(biāo)檢測和分類的計(jì)算量以及提高目標(biāo)檢測和分類的準(zhǔn)確度。
文檔編號G06K9/62GK102411716SQ20101029249
公開日2012年4月11日 申請日期2010年9月21日 優(yōu)先權(quán)日2010年9月21日
發(fā)明者吳偉國, 梅樹起 申請人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
萨迦县| 石城县| 巴青县| 曲松县| 乳山市| 平原县| 青河县| 忻州市| 安徽省| 韩城市| 金寨县| 潮安县| 黄陵县| 秦皇岛市| 上犹县| 恩施市| 永善县| 莱西市| 房产| 施甸县| 军事| 许昌市| 崇信县| 岢岚县| 通辽市| 牙克石市| 瓦房店市| 孙吴县| 邢台市| 获嘉县| 图木舒克市| 大名县| 广昌县| 邢台县| 巨鹿县| 天全县| 隆昌县| 安平县| 伊宁县| 日照市| 白玉县|