專利名稱:二維圖像中的物體識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于模式識別領(lǐng)域和計(jì)算機(jī)視覺領(lǐng)域,具體涉及二維圖像中的物體識別方法,特別涉及一種基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法。
背景技術(shù):
近些年來,研究者們致力于尋找一種不變的物體表達(dá)。大量生理學(xué)研究表明,魯棒的物體結(jié)構(gòu)可以對物體表達(dá)的不變性起到重要的作用。同時(shí),研究者們還發(fā)現(xiàn),物體表達(dá)的不變性也可以通過視覺機(jī)制來得到驗(yàn)證。因此,可以想象,魯棒的物體結(jié)構(gòu)和視覺機(jī)制間存在著S切的聯(lián)系。此外,心理學(xué)實(shí)驗(yàn)表明,魯棒的物體結(jié)構(gòu)可以通過物體的組成部件來描述,而這種部件由兩種屬性組成物體的表觀特征和物體的空間配置。已有許多基于特征和空間的方法來描述這兩種屬性。其中,基于表觀特征的方法主要集中在描述物體的表觀特征,例如流行的視覺詞典方法和經(jīng)典圖像分塊策略的組合;而基于空間的方法主要集中在描述物體的空間配置,例如廣為使用的物體部件模型。而在最近幾年,為了提高這兩類方法的效果,研究者們考慮從置信度上下文和弱監(jiān)督學(xué)習(xí)的角度嘗試將兩種方法進(jìn)行融合,并且也取得了一些效果。但是,現(xiàn)有的基于空間的方法不能很好地描述可信的物體空間配置,而現(xiàn)有的基于特征的方法不能很好地構(gòu)造具有區(qū)分能力的物體表觀特征。因此,已有的融合方法存在局限性。
發(fā)明內(nèi)容
(一 )要解決的技術(shù)問題本發(fā)明所述解決的技術(shù)問題是提出一種基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,克服現(xiàn)有的識別方法不能識別復(fù)雜圖像的問。( 二 )技術(shù)方案為解決上述技術(shù)問題,本發(fā)明提出一種基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,包括如下步驟步驟A、建立訓(xùn)練圖像數(shù)據(jù)庫,該訓(xùn)練圖像數(shù)據(jù)庫中包括多個(gè)訓(xùn)練圖像,根據(jù)目標(biāo)物體在訓(xùn)練圖像中的信息建立每個(gè)訓(xùn)練圖像的標(biāo)記信息,所述標(biāo)記信息包括目標(biāo)物體的存在與否信息以及目標(biāo)物體的位置信息;步驟B、對所述訓(xùn)練圖像數(shù)據(jù)庫中的每個(gè)訓(xùn)練圖像進(jìn)行處理,得到該訓(xùn)練圖像中的目標(biāo)物體的魯棒空間配置和與魯棒空間配置相關(guān)的魯棒表觀特征,并根據(jù)該魯棒表觀特征和每個(gè)訓(xùn)練圖像的標(biāo)記信息訓(xùn)練一個(gè)分類模型,所述的魯棒空間配置指的是目標(biāo)物體的各部件在圖像中的位置分布,魯棒表觀特征指的是目標(biāo)物體各部件相應(yīng)的特征描述;步驟C、對待識別圖像進(jìn)行與步驟B中處理訓(xùn)練圖像相同的處理,得到該待識別圖像的魯棒空間配置和與魯棒空間配置相關(guān)的魯棒表觀特征,并根據(jù)該魯棒表觀特征,采用步驟B得到的經(jīng)訓(xùn)練的分類模型進(jìn)行識別,從而識別該待識別圖像中的目標(biāo)物體的類型。(三)有益效果本發(fā)明的方法對于目標(biāo)圖像復(fù)雜的情況,物體的結(jié)構(gòu)仍然可以被魯棒地獲取,從而進(jìn)行物體的魯棒識別。在智能視覺監(jiān)控系統(tǒng)中,本發(fā)明可用于識別監(jiān)控系統(tǒng)場景中目標(biāo)的類別和位置,使得監(jiān)控系統(tǒng)能很好的識別目標(biāo)物體當(dāng)前的行為。
圖1為本發(fā)明的基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法的流程圖;圖2為本發(fā)明的基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法的具體步驟的流程框圖;圖3是特征表達(dá)和空間配置反饋的示例圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對本發(fā)明作進(jìn)一步的詳細(xì)說明。研究表明,現(xiàn)有的基于特征和空間的方法可能來源于視覺機(jī)制中的特征和空間通路,因此這兩種方法與這兩個(gè)通路有著密切的聯(lián)系。并且,生理學(xué)實(shí)驗(yàn)成功地表明,通過考慮特征和空間兩個(gè)通路的反饋?zhàn)饔?,物體可以被魯棒的識別。因此,本發(fā)明利用視覺機(jī)制中的特征表達(dá)和空間配置的反饋來獲取魯棒的物體結(jié)構(gòu),以此達(dá)到更好的物體識別效果。圖1為本發(fā)明的基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法的流程圖。如圖1所示,本發(fā)明方法用于識別二維圖像中的目標(biāo)物體,其包括以下步驟步驟A、建立訓(xùn)練圖像數(shù)據(jù)庫,該訓(xùn)練圖像數(shù)據(jù)庫中包括多個(gè)訓(xùn)練圖像,根據(jù)目標(biāo)物體在訓(xùn)練圖像中的信息建立每個(gè)訓(xùn)練圖像的標(biāo)記信息,所述標(biāo)記信息包括目標(biāo)物體的存在與否信息以及目標(biāo)物體的位置信息。存在目標(biāo)物體的訓(xùn)練圖像為正樣本圖像,不存在目標(biāo)物體的訓(xùn)練圖像為負(fù)樣本圖像。該步驟對正樣本圖像中的目標(biāo)物體的位置進(jìn)行標(biāo)記。步驟B、對所述訓(xùn)練圖像數(shù)據(jù)庫中的每個(gè)訓(xùn)練圖像進(jìn)行處理,得到該訓(xùn)練圖像中的目標(biāo)物體的魯棒空間配置和與魯棒空間配置相關(guān)的魯棒表觀特征,并根據(jù)該魯棒表觀特征和每個(gè)訓(xùn)練圖像的標(biāo)記信息訓(xùn)練一個(gè)分類模型。步驟C、對待識別圖像進(jìn)行與步驟B中處理訓(xùn)練圖像相同的處理,得到該待識別圖像的魯棒空間配置和與魯棒空間配置相關(guān)的魯棒表觀特征,并根據(jù)該魯棒表觀特征,采用步驟B得到的經(jīng)訓(xùn)練的分類模型進(jìn)行識別,從而識別該待識別圖像中的目標(biāo)物體的類型。圖2是本發(fā)明的基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法的具體步驟的流程框圖,下面參照圖2來具體描述所述各個(gè)步驟。步驟A、建立訓(xùn)練圖像數(shù)據(jù)庫,該訓(xùn)練圖像數(shù)據(jù)庫中包括多個(gè)訓(xùn)練圖像,根據(jù)目標(biāo)物體在訓(xùn)練圖像中的信息建立每個(gè)訓(xùn)練圖像的標(biāo)記信息,所述標(biāo)記信息包括目標(biāo)物體的存在與否信息以及目標(biāo)物體的位置信息。舉例來說,采集車輛監(jiān)控場景下的圖片來建立訓(xùn)練圖像數(shù)據(jù)庫,使每張圖像的大小為500X300像素,其中500是圖像的寬,300是圖像的高。對于訓(xùn)練圖像,將每張圖像中是否有車進(jìn)行類別和位置標(biāo)記,含有車的標(biāo)記為正樣本圖像,并標(biāo)記車輛在圖像中的位置;而沒有車的訓(xùn)練圖像標(biāo)記為負(fù)樣本,除此不進(jìn)行任何其他的標(biāo)記。步驟B、對所述訓(xùn)練圖像數(shù)據(jù)庫中的每個(gè)訓(xùn)練圖像進(jìn)行處理,得到該訓(xùn)練圖像中的目標(biāo)物體的魯棒空間配置和與魯棒空間配置相關(guān)的魯棒表觀特征,并根據(jù)該魯棒表觀特征和每個(gè)訓(xùn)練圖像的標(biāo)記信息訓(xùn)練一個(gè)分類模型。其中所述的魯棒空間配置指的是目標(biāo)物體的各部件在圖像中的位置分布,魯棒表觀特征指的是目標(biāo)物體各部件相應(yīng)的特征描述。步驟B包括如下分步驟步驟B0、訓(xùn)練過程初始化建立一個(gè)初始分類模型,對訓(xùn)練圖像數(shù)據(jù)庫中的每張訓(xùn)練圖像進(jìn)行局部采樣,并提取局部采樣塊的SIFT特征,對SIFT特征點(diǎn)聚類,并根據(jù)聚類的SIFT特征點(diǎn)建立每張訓(xùn)練圖像的初始表觀特征和初始空間配置,以及根據(jù)該初始表觀特征訓(xùn)練該初始分類模型。在一種具體實(shí)施方式
中,分類模型為SVM分類器。首先,對每張訓(xùn)練圖像局部采樣并在得到的局部采樣塊上提取尺度不變特征變換(Scale Invariant Feature Transform, SIFT)特征,得到每張訓(xùn)練圖像的SIFT特征集合
權(quán)利要求
1.一種基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,其特征在于,包括如下步驟步驟A、建立訓(xùn)練圖像數(shù)據(jù)庫,該訓(xùn)練圖像數(shù)據(jù)庫中包括多個(gè)訓(xùn)練圖像,根據(jù)目標(biāo)物體在訓(xùn)練圖像中的信息建立每個(gè)訓(xùn)練圖像的標(biāo)記信息,所述標(biāo)記信息包括目標(biāo)物體的存在與否信息以及目標(biāo)物體的位置信息;步驟B、對所述訓(xùn)練圖像數(shù)據(jù)庫中的每個(gè)訓(xùn)練圖像進(jìn)行處理,得到該訓(xùn)練圖像中的目標(biāo)物體的魯棒空間配置和與魯棒空間配置相關(guān)的魯棒表觀特征,并根據(jù)該魯棒表觀特征和每個(gè)訓(xùn)練圖像的標(biāo)記信息訓(xùn)練一個(gè)分類模型,所述的魯棒空間配置指的是目標(biāo)物體的各部件在圖像中的位置分布,魯棒表觀特征指的是目標(biāo)物體各部件相應(yīng)的特征描述;步驟C、對待識別圖像進(jìn)行與步驟B中處理訓(xùn)練圖像相同的處理,得到該待識別圖像的魯棒空間配置和與魯棒空間配置相關(guān)的魯棒表觀特征,并根據(jù)該魯棒表觀特征,采用步驟B 得到的經(jīng)訓(xùn)練的分類模型進(jìn)行識別,從而識別該待識別圖像中的目標(biāo)物體的類型。
2.如權(quán)利要求1所述的視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,其特征在于,所述步驟B包括步驟B0、建立一個(gè)初始分類模型,對訓(xùn)練圖像數(shù)據(jù)庫中的每張訓(xùn)練圖像進(jìn)行局部采樣, 并提取局部采樣塊的SIFT特征,對SIFT特征點(diǎn)聚類,并根據(jù)聚類的SIFT特征點(diǎn)建立每張訓(xùn)練圖像的初始表觀特征和初始空間配置,以及根據(jù)該初始表觀特征訓(xùn)練該初始分類模型;步驟B1:根據(jù)訓(xùn)練圖像中的目標(biāo)物體的初始預(yù)測類別,獲得每張訓(xùn)練圖像的初始表觀特征中的顯著項(xiàng);步驟B2、根據(jù)每張訓(xùn)練圖像的初始表觀特征重構(gòu)該訓(xùn)練圖像的局部SIFT特征的索引和局部SIFT特征,并根據(jù)步驟BI得到的該圖像的初始表觀特征的顯著項(xiàng),在所述局部SIFT 特征的索引和該局部SIFT特征中確定顯著的局部SIFT特征的索引和顯著的局部SIFT特征;步驟B3、對于每張訓(xùn)練圖像,利用所述顯著的局部SIFT特征構(gòu)造空間配置的顯著性表達(dá);步驟B4、將每張訓(xùn)練圖像的空間配置的顯著性表達(dá)送入分類模型進(jìn)行訓(xùn)練;步驟B5、對每張訓(xùn)練圖像下的各空間配置進(jìn)行置信度的重置,找到最優(yōu)的物體位置; 步驟B6、對于每張訓(xùn)練圖像,根據(jù)所述最優(yōu)物體位置獲得其魯棒空間配置;步驟B7、對于每張訓(xùn)練圖像,得到所述魯棒空間配置的各部分空間配置中包含的顯著的局部SIFT特征;步驟B8、對于每張訓(xùn)練圖像,根據(jù)其魯棒空間配置的每個(gè)部分的空間配置構(gòu)建魯棒表觀特征,將該魯棒表觀特征與該圖像的全局上下文信息拼接后得到最終魯棒表觀特征; 步驟B9、將每張訓(xùn)練圖像的所述最終魯棒表觀特征送入分類模型進(jìn)行訓(xùn)練;步驟B10、對以上表觀特征進(jìn)行訓(xùn)練后,得到更為準(zhǔn)確的物體類別。
3.如權(quán)利要求2所述的視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,其特征在于,所述步驟C包括步驟Cl、根據(jù)待識別圖像中的目標(biāo)物體的預(yù)測類別,獲得每張訓(xùn)練圖像的初始表觀特征中的顯著項(xiàng);步驟C2、根據(jù)每張待識別圖像的初始表觀特征重構(gòu)該待識別圖像的局部SIFT特征的索引和局部SIFT特征,并根據(jù)步驟Cl得到的該圖像的初始表觀特征的顯著項(xiàng),在所述局部SIFT特征的索引和該局部SIFT特征中確定顯著的局部SIFT特征的索引和顯著的局部 SIFT特征;步驟C3、對于每張待識別圖像,利用所述顯著的局部SIFT特征構(gòu)造空間配置的顯著性表達(dá);步驟C4、利用步驟B4中得到的分類模型,對步驟C3中的空間配置的顯著性表達(dá)進(jìn)行物體位置的預(yù)測;步驟C5、對每張待識別圖像下的各空間配置進(jìn)行置信度的重置,找到最優(yōu)的物體位置;對以上顯著性表達(dá)進(jìn)行訓(xùn)練后,對每個(gè)訓(xùn)練樣本的每種空間配置進(jìn)行置信度的重新預(yù)測,得到更為精確的物體位置;步驟C6、對于每張待識別圖像,根據(jù)所述最優(yōu)物體位置獲得其魯棒空間配置;步驟C7、對于每張待識別圖像,得到所述魯棒空間配置的各部分空間配置中包含的顯著的局部SIFT特征;步驟CS、對于每張待識別圖像,根據(jù)其魯棒空間配置的每個(gè)部分的空間配置構(gòu)建魯棒表觀特征,將該魯棒表觀特征與該圖像的全局上下文信息拼接后得到最終魯棒表觀特征; 步驟C9、利用步驟B9中得到的分類模型,將步驟CS中的物體的魯棒的表觀特征進(jìn)行結(jié)果預(yù)測;步驟C10、根據(jù)步驟BlO的方法,對以上的物體的魯棒的表觀特征進(jìn)行預(yù)測后,得到更為準(zhǔn)確的物體類別。
4.如權(quán)利要求1-3中任一項(xiàng)所述的視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,其特征在于,所述分類模型為SVM分類模型。
5.如權(quán)利要求4中任一項(xiàng)所述的視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法, 其特征在于,所述步驟BO包括首先,對每張訓(xùn)練圖像局部采樣并在得到的局部采樣塊上提取SIFT特征,得到每張訓(xùn)練圖像的SIFT特征集合F = + # !,其中f L表示在D維空間中的L個(gè)SIFT特征,D和L分別為SIFT特征的維數(shù)和SIFT特征的個(gè)數(shù);接著,利用K均值聚類將每張訓(xùn)練圖像的SIFT特征點(diǎn)聚類成為M個(gè)中心V = [V11V2,..., VviΛ/ ;然后,利用視覺詞典模型和部件模型分別構(gòu)建物體的初始的表觀特征和空間配置,分別定義如下ζ (O) = [ζ (P0), ζ (P1), . . . , ζ (ρΝ) ](I)P(O) = [p0, P1,,· ·,ρΝ](2)其中O為訓(xùn)練圖像中的目標(biāo)物體,ρ(0)為該目標(biāo)物體O的空間配置,Z(O)為該目標(biāo)物體O的表觀特征,Ptl Pn為目標(biāo)物體的各部分空間配置,Ztl ζΝ為目標(biāo)物體的各部分的表觀特征,N為目標(biāo)物體具體的各個(gè)部分的總數(shù);目標(biāo)物體的結(jié)構(gòu)Ω可以表達(dá)為表觀特征和空間配置的組合Ω = [P (O), ζ (O) ] = [ρ0, ζ (P0),P1, ζ (P1), · · · , ρΝ, ζ (ρΝ) ](3)在公式(I)和公式(2)中,基于整幅圖像的表觀特征ζ (O)和目標(biāo)物體的每一空間配置分別定義如下z(°)
6.如權(quán)利要求5所述的視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,其特征在于,所述步驟BI中獲得顯著項(xiàng)的方法如下
7.如權(quán)利要求6所述的視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,其特征在于,所述步驟B2包括根據(jù)公式(4),得到重構(gòu)的局部SIFT特征的索引Ik和局部SIFT特征本身匕分別如下
8.如權(quán)利要求7所述的視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,其特征在于,所述步驟CO包括對每張待識別圖像局部采樣并在得到的局部采樣塊上提取SIFT特征,得到每張待識別圖像的SIFT特征集合
全文摘要
本發(fā)明公開一種基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法的物體識別方法,包括訓(xùn)練和識別兩個(gè)過程,包括步驟對已經(jīng)標(biāo)好類別和位置的圖像中的目標(biāo)物體進(jìn)行視覺機(jī)制的信息反饋,并訓(xùn)練得到反饋模型;對待識別圖像中的物體進(jìn)行物體類別和物體位置的初步預(yù)測,利用訓(xùn)練得到的反饋模型,魯棒地學(xué)習(xí)目標(biāo)物體的結(jié)構(gòu)信息。由于魯棒的物體結(jié)構(gòu)和視覺機(jī)制對物體識別具有不變性,因此本發(fā)明采用基于視覺機(jī)制的魯棒物體結(jié)構(gòu)學(xué)習(xí)方法來提高物體識別的精度,并且本發(fā)明準(zhǔn)確識別場景中目標(biāo)的類別和位置,能廣泛應(yīng)用于安全檢驗(yàn),網(wǎng)絡(luò)搜索和數(shù)字娛樂等。
文檔編號G06K9/66GK103020658SQ20121059305
公開日2013年4月3日 申請日期2012年12月31日 優(yōu)先權(quán)日2012年12月31日
發(fā)明者黃凱奇, 譚鐵牛, 王沖 申請人:中國科學(xué)院自動化研究所