專利名稱:基于自適應(yīng)空間信息有向圖的圖像分類方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識(shí)別,特別涉及基于BoF(bag-of-features)模型的圖像分類背景技術(shù)
目前,傳統(tǒng)分類算法缺乏有效地表達(dá)圖像空間信息的能力。這也是計(jì)算機(jī)視覺(jué)系統(tǒng)與人眼視覺(jué)系統(tǒng)相比在識(shí)別精度上仍存在著巨大差距的重要原因之一。常用的圖像空間建模方法往往只是對(duì)圖像硬分塊,而忽視了各分塊之間的相互聯(lián)系以及不同視覺(jué)單詞的空間分布的差異性,例如,金字塔空間匹配算法。
因此,鑒于對(duì)圖像空間統(tǒng)一硬分塊的方法存在著各種局限性,我們提出了一種基于有向圖的自適應(yīng)的方法來(lái)處理圖像中的全局空間信息。發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)存在的問(wèn)題,本發(fā)明的目的是提供一種基于自適應(yīng)空間信息有向圖的圖像分類方法,
一種基于自適應(yīng)空間信息有向圖的圖像分類方法,包括步驟
a.從所有圖像中提取局部特征;
b.根據(jù)每個(gè)局部特征對(duì)應(yīng)的視覺(jué)單詞,從測(cè)試圖像中隨機(jī)抽取局部特征分組;
c.利用聚類算法對(duì)各組局部特征的空間坐標(biāo)聚類,以聚類中心為定點(diǎn)并連接各相鄰頂點(diǎn)得到空間信息的有向d.根據(jù)局部特征的空間位置,對(duì)所有圖像進(jìn)行類聚操作,將聚集結(jié)果串聯(lián)得到圖像的最終表達(dá)。
本發(fā)明能夠自適應(yīng)地考慮不同視覺(jué)單詞在空間分布上的差異性,從而能夠更好地對(duì)全局空間信息進(jìn)行建模,因而,能夠有效地提升圖像分類精度。
圖I是基于空間信息有向圖的圖像分類方法流程圖。
圖2是傳統(tǒng)的基于金字塔空間匹配的圖像表達(dá)(左)與基于空間信息有向圖的圖像表達(dá)(右)的對(duì)比圖。
具體實(shí)施方式
以下結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明技術(shù)方案中所涉及的各個(gè)細(xì)節(jié)問(wèn)題。應(yīng)當(dāng)指出的是,所描述的實(shí)施例僅旨在便于理解,對(duì)本發(fā)明不起任何限定作用。
基于自適應(yīng)的空間信息有向圖,本發(fā)明實(shí)現(xiàn)了一個(gè)圖像分類系統(tǒng)。本系統(tǒng)包括提取局部特征,訓(xùn)練視覺(jué)詞典,表達(dá)圖像,訓(xùn)練分類器以及執(zhí)行圖像分類五個(gè)部分。
如圖I所示,首先,在提取每個(gè)局部特征的同時(shí),記錄其空間坐標(biāo)。由于圖像的長(zhǎng)度和寬度各不相同,需要將這些坐標(biāo)歸一化到區(qū)間
之內(nèi)。
其次,根據(jù)每個(gè)局部特征所對(duì)應(yīng)的視覺(jué)單詞(即按照歐式距離計(jì)算最近的視覺(jué)單詞),將從測(cè)試圖像中隨機(jī)提取局部特征分組。
第三,利用聚類算法(如k近鄰聚類算法、混合高斯模型聚類算法等),對(duì)各組局部特征的空間坐標(biāo)聚類,以聚類中心為頂點(diǎn)并連接各相鄰頂點(diǎn)得到空間信息有向圖。如圖 2左所示,對(duì)圖像進(jìn)行2X2的分塊,在每個(gè)分塊中分別提取一個(gè)BoF表達(dá),串聯(lián)起來(lái)從而形成多層金字塔中第一層的表達(dá)。相對(duì)應(yīng)的,如圖2右所示,基于自適應(yīng)空間信息有向圖的圖像分類方法需要針對(duì)每一個(gè)視覺(jué)單詞(Cl cn)建立一個(gè)特有的有向圖。有向圖的每一個(gè)頂點(diǎn)與每一個(gè)分塊相對(duì)應(yīng),此外,相鄰頂點(diǎn)之間的有向邊表達(dá)了各分塊之間的聯(lián)系。因此在本方法中,我們考慮了不同視覺(jué)單詞空間分布的特異性,圖像表達(dá)中不僅包括了頂點(diǎn)上的表達(dá)(即分塊中的表達(dá)),還有邊上的表達(dá)。
第四,對(duì)于所有圖像,根據(jù)局部特征的空間位置,進(jìn)行聚集操作(或多次聚集操作)并將聚集結(jié)果串聯(lián)從而得到圖像的最終表達(dá)
權(quán)利要求
1.一種基于自適應(yīng)空間信息有向圖的圖像分類方法,包括步驟 a.從所有圖像中提取局部特征; b.根據(jù)每個(gè)局部特征對(duì)應(yīng)的視覺(jué)單詞,從測(cè)試圖像中隨機(jī)抽取局部特征分組; c.利用聚類算法對(duì)各組局部特征的空間坐標(biāo)聚類,以聚類中心為定點(diǎn)并連接各相鄰頂點(diǎn)得到空間信息的有向圖; d.根據(jù)局部特征的空間位置,對(duì)所有圖像進(jìn)行類聚操作,將聚集結(jié)果串聯(lián)得到圖像的最終表達(dá)。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于所述提取局部特征包括記錄局部特征的空間坐標(biāo),將所述空間坐標(biāo)歸一化。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于所述有向圖包括 每一個(gè)頂點(diǎn)與每一個(gè)分塊相對(duì)應(yīng); 相鄰頂點(diǎn)之間的有向邊表達(dá)了各分塊之間的關(guān)系。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于所述聚集包括多次聚集。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于以硬投票的方式將得到的各局部特征分配給視覺(jué)詞典中的各個(gè)視覺(jué)單詞,得到多組局部特征。
6.根據(jù)權(quán)利要求I所述的方法,其特征在于在視覺(jué)詞典上以硬投票的方式對(duì)每張圖像的局部特征分別進(jìn)行編碼。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于以軟投票的方式進(jìn)行聚集操作。
8.根據(jù)權(quán)利要求I所述的方法,其特征在于對(duì)局部特征的空間坐標(biāo)進(jìn)行非監(jiān)督學(xué)習(xí)得到包含視覺(jué)單詞空間分布信息的有向圖。
9.根據(jù)權(quán)利要求I所述的方法,其特征在于對(duì)不同的視覺(jué)單詞,自適應(yīng)地學(xué)習(xí)不同的空間信息有向圖。
10.根據(jù)權(quán)利要求I所述的方法,其特征在于根據(jù)局部特征的空間位置以及空間信息有向圖,以軟投票的方式對(duì)局部特征進(jìn)行多次聚集操作。
11.根據(jù)權(quán)利要求I所述的方法,其特征在于所述步驟d采用硬投票編碼方法、軟投票編碼方法、稀疏編碼法、Super-vector編碼法或Fisher編碼法以及最大值聚集或加權(quán)求和聚集。
全文摘要
一種基于自適應(yīng)空間信息有向圖的圖像分類方法,包括步驟從所有圖像中提取局部特征;根據(jù)每個(gè)局部特征對(duì)應(yīng)的視覺(jué)單詞,從測(cè)試圖像中隨機(jī)抽取局部特征分組;利用聚類算法對(duì)各組局部特征的空間坐標(biāo)聚類,以聚類中心為定點(diǎn)并連接各相鄰頂點(diǎn)得到空間信息的有向圖;根據(jù)局部特征的空間位置,對(duì)所有圖像進(jìn)行類聚操作,將聚集結(jié)果串聯(lián)得到圖像的最終表達(dá)。本發(fā)明能夠自適應(yīng)地考慮不同視覺(jué)單詞在空間分布上的差異性,從而能夠更好地對(duì)全局空間信息進(jìn)行建模,因而,能夠有效地提升圖像分類精度。
文檔編號(hào)G06K9/62GK102930295SQ20121040997
公開日2013年2月13日 申請(qǐng)日期2012年10月24日 優(yōu)先權(quán)日2012年10月24日
發(fā)明者譚鐵牛, 王亮, 黃永禎, 吳子豐 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所