圖像分類方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種圖像分類方法,包括如下步驟:對要分類的圖像進(jìn)行多尺度分割;對多尺度分割后的圖像進(jìn)行顯著圖提取;對顯著圖提取后的圖像進(jìn)行直方圖挖掘;對直方圖挖掘后的圖像進(jìn)行歸一化;采用支持向量機(jī)對上述歸一化的圖像進(jìn)行分類。本發(fā)明還涉及一種圖像分類系統(tǒng)。本發(fā)明能夠提高圖像的分類性能,減少計(jì)算時間,增加圖像的區(qū)分能力。
【專利說明】圖像分類方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像分類方法及系統(tǒng)。
【背景技術(shù)】
[0002]圖像分類即是,根據(jù)各自在圖像信息中所反映的不同特征,把不同類別的目標(biāo)區(qū)分開來的圖像處理方法。它利用計(jì)算機(jī)對圖像進(jìn)行定量分析,把圖像或圖像中的每個像元或區(qū)域劃歸為若干個類別中的某一種,以代替人的視覺判讀。
[0003]在最近的十年中,圖像分類是計(jì)算機(jī)視覺領(lǐng)域的一個研究熱點(diǎn)。B0W(字典袋)技術(shù)已被證明是最有效的圖像分類的方法之一。
[0004]然而,在BOW方法中,空間的上下文信息,如字共生和成對的信息被忽略,產(chǎn)生的視覺單詞仍然不夠說明問題,限制了圖像的整體分類性能。此外,基于局部特征是相互獨(dú)立的假設(shè),如樸素貝葉斯,并不是總能成立。
【發(fā)明內(nèi)容】
[0005]有鑒于此,有必要提供一種圖像分類方法及系統(tǒng)。
[0006]本發(fā)明提供一種圖像分類方法,該方法包括如下步驟:a.對要分類的圖像進(jìn)行多尺度分割;b.對多尺度分割后的圖像進(jìn)行顯著圖提?。籧.對顯著圖提取后的圖像進(jìn)行直方圖挖掘;d.對直方圖挖掘后的圖像進(jìn)行歸一化;e.采用支持向量機(jī)對上述歸一化的圖像進(jìn)行分類。
[0007]其中,所述的多尺度分割包括將所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表不。
[0008]所述的步驟b采用基于圖形的視覺顯著性的自下而上的顯著性模型提取圖像的顯著圖。
[0009]所述的步驟c中直方圖挖掘基于:R(m) = d(m) X v (m),其中,d (m) (O < d (m < )和l)v(m)分別是差異性分?jǐn)?shù)和代表性分?jǐn)?shù)。
[0010]所述步驟d中的歸一化包括:平方根歸一化、LI歸一化、類內(nèi)和類間I1歸一化、I2歸一化、類內(nèi)和類間I2歸一化。
[0011]本發(fā)明還提供一種圖像分類系統(tǒng),包括相互電性連接的分割模塊、提取模塊、挖掘模塊、歸一化模塊及分類模塊。其中,所述分割模塊用于對要分類的圖像進(jìn)行多尺度分割;所述提取模塊用于對多尺度分割后的圖像進(jìn)行顯著圖提??;所述挖掘模塊用于對顯著圖提取后的圖像進(jìn)行直方圖挖掘;所述歸一化模塊用于對直方圖挖掘后的圖像進(jìn)行歸一化;所述分類模塊用于采用支持向量機(jī)對上述歸一化的圖像進(jìn)行分類。
[0012]其中,所述的多尺度分割包括將所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表不。
[0013]所述的提取模塊采用基于圖形的視覺顯著性的自下而上的顯著性模型提取圖像的顯著圖。[0014]所述的直方圖挖掘基于:R(m)= d(m) X v (m),其中,d(m) (O ( d(m) ( I)和 v(m)分別是差異性分?jǐn)?shù)和代表性分?jǐn)?shù)。
[0015]所述的歸一化包括:平方根歸一化、LI歸一化、類內(nèi)和類間I1歸一化、I2歸一化、類內(nèi)和類間I2歸一化。
[0016]本發(fā)明圖像分類方法及系統(tǒng),利用顯著區(qū)域定位、直方圖挖掘、圖像評分、差異性學(xué)習(xí)等進(jìn)行圖像分類。主要貢獻(xiàn)如下:首先,結(jié)合直方圖挖掘的多尺度空間進(jìn)行金字塔的圖像表示,基于邊緣的密集描述符提高分類性能和減少計(jì)算時間;其次,顯著圖提取構(gòu)建BoP模型,增加區(qū)分判斷能力;第三,從視覺顯著性獲得的圖像得分被集成到SVM分類器的分離超平面,所述圖像得分被視為潛在的信息,以提高區(qū)分能力;最后,提出了考慮類間和類內(nèi)變化,也考慮直方圖的統(tǒng)計(jì)信息的直方圖歸一化方法。
【專利附圖】
【附圖說明】
[0017]圖1為本發(fā)明圖像分類方法的流程圖;
[0018]圖2為本發(fā)明較佳實(shí)施例圖像多尺度分割示意圖;
[0019]圖3為本發(fā) 明較佳實(shí)施例圖像、顯著圖、顯著圖的灰度形式示意圖;
[0020]圖4為本發(fā)明較佳實(shí)施例事件數(shù)據(jù)集的直方圖PDF示意圖;
[0021]圖5為本發(fā)明較佳實(shí)施例足球數(shù)據(jù)集的直方圖PDF示意圖;
[0022]圖6為本發(fā)明圖像分類系統(tǒng)的硬件架構(gòu)圖。
【具體實(shí)施方式】
[0023]下面結(jié)合附圖及具體實(shí)施例對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0024]參閱圖1所示,是本發(fā)明圖像分類方法較佳實(shí)施例的作業(yè)流程圖。
[0025]步驟S401,對要分類的圖像進(jìn)行多尺度分割。具體而言,將每個所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表示。圖2示出了多尺度分割后的圖像空間金字塔。圖2中1X1(原始圖像)、2X2、4X4的區(qū)域(總共21個區(qū)域)均由SPM技術(shù)生成。本實(shí)施例中,所述圖像的縱橫比保持SPM的多尺度技術(shù)。從多尺度分割和密集采樣中得到特征矢量,一般是高維數(shù),通過主成分分析(PCA)和線性判別分析(LDA)進(jìn)行降維運(yùn)算,從而產(chǎn)生良好的結(jié)果,且不顯著損失。
[0026]步驟S402,對多尺度分割后的圖像進(jìn)行顯著圖提取。視覺顯著性或點(diǎn)分布通常用于獲得通用的顯著性和強(qiáng)調(diào)不同的局部區(qū)域,如輪廓、邊緣和顏色。本實(shí)施例中,采用基于圖形的視覺顯著性(GBVS)的自下而上的顯著性模型來提取圖像的顯著圖。圖3顯示了圖像、顯著圖、顯著圖的灰度形式,由此看出有意義鑒別的區(qū)域,可以可靠地從顯著圖中獲得。
[0027]每個視覺詞之間碼字的共同出現(xiàn)結(jié)合在特征向量也融合進(jìn)BoP(bag of phrase)直方圖中,η個局部描述符s = {sj, t = 1,...,η的每個碼字V由原始的BoW方法生成,顯著性驅(qū)動的方法由下式獲得:
η
[0028]S=Xa IiV-Sji2
? 二I
[0029]其中,加權(quán)系數(shù)Pt在位置(x,y)定義為:A=exp(-丨丨'〈丨丨2), σ是加權(quán)參數(shù)。
La[0030]假設(shè)Si。代表1-th圖像在c-th類的顯著性,hic代表1-th圖像在c-th類的近似歸一化的BoP直方圖。該圖像由連接在一起的特征直方圖和顯著特征圖可以表示為:
[0031 ] X — [..slchlc...sichic...sNMhNW],
[0032]對于圖像評分的權(quán)重,圖像中心的計(jì)算通過選擇其中各個細(xì)胞的最小化各個距離:
【權(quán)利要求】
1.一種圖像分類方法,其特征在于,該方法包括如下步驟: a.對要分類的圖像進(jìn)行多尺度分割; b.對多尺度分割后的圖像進(jìn)行顯著圖提??; c.對顯著圖提取后的圖像進(jìn)行直方圖挖掘; d.對直方圖挖掘后的圖像進(jìn)行歸一化; e.采用支持向量機(jī)對上述歸一化的圖像進(jìn)行分類。
2.如權(quán)利要求1所述的方法,其特征在于,所述的多尺度分割包括將所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表示。
3.如權(quán)利要求1或2所述的方法,其特征在于,所述的步驟b采用基于圖形的視覺顯著性的自下而上的顯著性模型提取圖像的顯著圖。
4.如權(quán)利要求3所述的方法,其特征在于,所述的步驟c中直方圖挖掘基于:
R (m) = d (m) X v (m), 其中,I1(Km) (O ^d(m) ^ I)和v(m)分別是差異性分?jǐn)?shù)和代表性分?jǐn)?shù)。
5.如權(quán)利要求1所述的方法,其特征在于,所述步驟d中的歸一化包括:平方根歸一化、LI歸一化、類內(nèi)和類間歸一化、I2歸一化、類內(nèi)和類間I2歸一化。
6.一種圖像分類系統(tǒng),其特征在于,該系統(tǒng)包括相互電性連接的分割模塊、提取模塊、挖掘模塊、歸一化模塊及分類模塊,其中: 所述分割模塊用于對要分類的圖像進(jìn)行多尺度分割; 所述提取模塊用于對多尺度分割后的圖像進(jìn)行顯著圖提?。? 所述挖掘模塊用于對顯著圖提取后的圖像進(jìn)行直方圖挖掘; 所述歸一化模塊用于對直方圖挖掘后的圖像進(jìn)行歸一化; 所述分類模塊用于采用支持向量機(jī)對上述歸一化的圖像進(jìn)行分類。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述的多尺度分割包括將所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表示。
8.如權(quán)利要求6或7所述的系統(tǒng),其特征在于,所述的提取模塊采用基于圖形的視覺顯著性的自下而上的顯著性模型提取圖像的顯著圖。
9.如權(quán)利要求 8所述的系統(tǒng),其特征在于,所述的直方圖挖掘基于:
R (m) = d (m) X v (m), 其中,d(m) (O ^d(m) ^ I)和v(m)分別是差異性分?jǐn)?shù)和代表性分?jǐn)?shù)。
10.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述的歸一化包括:平方根歸一化、LI歸一化、類內(nèi)和類間I1歸一化、I2歸一化、類內(nèi)和類間I2歸一化。
【文檔編號】G06K9/62GK103942570SQ201410177159
【公開日】2014年7月23日 申請日期:2014年4月29日 優(yōu)先權(quán)日:2014年4月29日
【發(fā)明者】雷柏英, 陳思平, 汪天富, 倪東 申請人:深圳大學(xué)