構(gòu)建裝置和方法、圖像分類裝置和方法以及電子設(shè)備的制作方法
【專利摘要】本發(fā)明提供了構(gòu)建裝置和方法、圖像分類裝置和方法以及電子設(shè)備,以克服傳統(tǒng)的圖像分類技術(shù)由于未考慮圖像的圖像級(jí)特征和區(qū)域級(jí)特征之間的聯(lián)系而導(dǎo)致分類結(jié)果不準(zhǔn)確的問(wèn)題。上述構(gòu)建裝置包括:將訓(xùn)練圖像分割為多個(gè)區(qū)域的訓(xùn)練圖像分割單元;提取訓(xùn)練圖像的圖像級(jí)特征和區(qū)域的區(qū)域級(jí)特征的第一提取單元;及構(gòu)建包括圖像級(jí)支持向量機(jī)分類器和區(qū)域級(jí)支持向量機(jī)分類器的圖像分類器的構(gòu)建單元,其在訓(xùn)練過(guò)程中考慮了第一約束:針對(duì)訓(xùn)練圖像集全集或子集中的每個(gè)訓(xùn)練圖像,令區(qū)域級(jí)支持向量機(jī)分類器對(duì)該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié)果中的最大值和圖像級(jí)支持向量機(jī)分類器對(duì)該訓(xùn)練圖像的分類結(jié)果盡量接近。本發(fā)明的上述技術(shù)能夠應(yīng)用于圖像處理領(lǐng)域。
【專利說(shuō)明】構(gòu)建裝置和方法、圖像分類裝置和方法以及電子設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理領(lǐng)域,尤其涉及構(gòu)建裝置和方法、圖像分類裝置和方法以及 電子設(shè)備。
【背景技術(shù)】
[0002] 隨著數(shù)字圖像數(shù)目的急劇增長(zhǎng),需要研究開(kāi)發(fā)有效的自動(dòng)圖像分類技術(shù)。一般而 言,為了對(duì)待測(cè)圖像進(jìn)行分類,先要基于給定的訓(xùn)練圖像(包括正例和負(fù)例圖像)構(gòu)建有效 的分類器,然后根據(jù)分類器的輸出確定待測(cè)圖像所屬的類別。圖像分類技術(shù)可以應(yīng)用于人 們生活的很多方面,比如個(gè)人照片管理、圖像圖書(shū)館、在線購(gòu)物等等。
[0003] -般而言,描述圖像的特征可以分為圖像級(jí)特征和區(qū)域級(jí)特征。圖像級(jí)特征表現(xiàn) 的是圖像的整體特性,而在圖像分割的基礎(chǔ)上抽取的區(qū)域級(jí)特征更加關(guān)注圖像的局部特 性。為了綜合考慮兩方面的信息,傳統(tǒng)的方法通常首先分別基于兩種特征獨(dú)立地構(gòu)建兩個(gè) 基本分類器,然后將兩個(gè)基本分類器的輸出進(jìn)行組合。可以看到,傳統(tǒng)的方法在構(gòu)建基本 分類器的過(guò)程中,對(duì)兩種特征分別進(jìn)行處理。也就是說(shuō),當(dāng)基于圖像級(jí)特征構(gòu)建分類器的時(shí) 候,沒(méi)有利用基于區(qū)域級(jí)特征構(gòu)建的分類器提供的任何信息;同樣的,當(dāng)基于區(qū)域級(jí)特征構(gòu) 建分類器的時(shí)候,也沒(méi)有利用基于圖像級(jí)特征構(gòu)建的分類器提供的任何信息。實(shí)際上,兩種 特征從不同角度對(duì)同一圖像進(jìn)行描述,往往可以互相提供更多的信息。顯然,傳統(tǒng)的圖像分 類方法由于在構(gòu)建基本分類器的過(guò)程中沒(méi)有利用上述有用的信息,從而影響了最終的分類 性能。
【發(fā)明內(nèi)容】
[0004] 在下文中給出了關(guān)于本發(fā)明的簡(jiǎn)要概述,以便提供關(guān)于本發(fā)明的某些方面的基本 理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的 關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概 念,以此作為稍后論述的更詳細(xì)描述的前序。
[0005] 鑒于此,本發(fā)明提供了構(gòu)建裝置和方法、圖像分類裝置和方法以及電子設(shè)備,以至 少解決傳統(tǒng)的圖像分類技術(shù)由于沒(méi)有考慮圖像的圖像級(jí)特征和區(qū)域級(jí)特征之間的聯(lián)系而 導(dǎo)致分類結(jié)果不準(zhǔn)確的問(wèn)題。
[0006] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種圖像分類器的構(gòu)建裝置,該構(gòu)建裝置包括:訓(xùn) 練圖像分割單元,其被配置用于將訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像分割為多個(gè)區(qū)域;第一提 取單元,其被配置用于提取訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的圖像級(jí)特征,以及提取每個(gè)訓(xùn)練 圖像的多個(gè)區(qū)域中的每一個(gè)的區(qū)域級(jí)特征;以及構(gòu)建單元,其被配置用于基于訓(xùn)練圖像集 中每個(gè)訓(xùn)練圖像的圖像級(jí)特征和每個(gè)訓(xùn)練圖像中的多個(gè)區(qū)域的區(qū)域級(jí)特征對(duì)圖像級(jí)支持 向量機(jī)分類器和區(qū)域級(jí)支持向量機(jī)分類器進(jìn)行訓(xùn)練,以構(gòu)建包括圖像級(jí)支持向量機(jī)分類器 和區(qū)域級(jí)支持向量機(jī)分類器的圖像分類器;其中,構(gòu)建單元在進(jìn)行訓(xùn)練的過(guò)程中考慮了如 下的第一約束:針對(duì)訓(xùn)練圖像集的全集或子集中的每個(gè)訓(xùn)練圖像,令區(qū)域級(jí)支持向量機(jī)分 類器對(duì)該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié)果中的最大值和圖像級(jí)支持向量機(jī)分類器對(duì)該訓(xùn) 練圖像的分類結(jié)果盡量接近。
[0007] 根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種圖像分類裝置,該圖像分類裝置包括:待 測(cè)圖像分割單元,其被配置用于將待測(cè)圖像分割為多個(gè)區(qū)域;第二提取單元,其被配置用于 提取待測(cè)圖像的圖像級(jí)特征和待測(cè)圖像的多個(gè)區(qū)域中的每一個(gè)的區(qū)域級(jí)特征;分類單元, 其被配置用于基于待測(cè)圖像的圖像級(jí)特征獲得圖像級(jí)支持向量機(jī)分類器對(duì)待測(cè)圖像的分 類結(jié)果,以及基于待測(cè)圖像的多個(gè)區(qū)域的區(qū)域級(jí)特征獲得區(qū)域級(jí)支持向量機(jī)分類器對(duì)待測(cè) 圖像中多個(gè)區(qū)域中的每一個(gè)的分類結(jié)果;以及結(jié)果確定單元,其被配置用于根據(jù)區(qū)域級(jí)支 持向量機(jī)分類器對(duì)待測(cè)圖像中多個(gè)區(qū)域的分類結(jié)果中的最大值和圖像級(jí)支持向量機(jī)分類 器對(duì)待測(cè)圖像的分類結(jié)果,確定待測(cè)圖像的最終分類結(jié)果;其中,圖像級(jí)支持向量機(jī)分類器 和區(qū)域級(jí)支持向量機(jī)分類器通過(guò)如上所述的構(gòu)建裝置構(gòu)建而得。
[0008] 根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種圖像分類器的構(gòu)建方法,該構(gòu)建方法包 括:將訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像分割為多個(gè)區(qū)域;提取訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的 圖像級(jí)特征,以及提取每個(gè)訓(xùn)練圖像的多個(gè)區(qū)域中的每一個(gè)的區(qū)域級(jí)特征;以及基于訓(xùn)練 圖像集中每個(gè)訓(xùn)練圖像的圖像級(jí)特征和每個(gè)訓(xùn)練圖像中的多個(gè)區(qū)域的區(qū)域級(jí)特征對(duì)圖像 級(jí)支持向量機(jī)分類器和區(qū)域級(jí)支持向量機(jī)分類器進(jìn)行訓(xùn)練,以構(gòu)建包括圖像級(jí)支持向量機(jī) 分類器和區(qū)域級(jí)支持向量機(jī)分類器的圖像分類器;其中,在訓(xùn)練的過(guò)程中考慮了如下的第 一約束:針對(duì)訓(xùn)練圖像集的全集或子集中的每個(gè)訓(xùn)練圖像,令區(qū)域級(jí)支持向量機(jī)分類器對(duì) 該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié)果中的最大值和圖像級(jí)支持向量機(jī)分類器對(duì)該訓(xùn)練圖像 的分類結(jié)果盡量接近。
[0009] 根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種圖像分類方法,該圖像分類方法包括:將 待測(cè)圖像分割為多個(gè)區(qū)域;提取待測(cè)圖像的圖像級(jí)特征和待測(cè)圖像的多個(gè)區(qū)域中的每一個(gè) 的區(qū)域級(jí)特征;基于待測(cè)圖像的圖像級(jí)特征獲得圖像級(jí)支持向量機(jī)分類器對(duì)待測(cè)圖像的分 類結(jié)果,以及基于待測(cè)圖像的多個(gè)區(qū)域的區(qū)域級(jí)特征獲得區(qū)域級(jí)支持向量機(jī)分類器對(duì)待測(cè) 圖像中多個(gè)區(qū)域中的每一個(gè)的分類結(jié)果;以及根據(jù)區(qū)域級(jí)支持向量機(jī)分類器對(duì)待測(cè)圖像中 多個(gè)區(qū)域的分類結(jié)果中的最大值和圖像級(jí)支持向量機(jī)分類器對(duì)待測(cè)圖像的分類結(jié)果,確定 待測(cè)圖像的最終分類結(jié)果;其中,圖像級(jí)支持向量機(jī)分類器和區(qū)域級(jí)支持向量機(jī)分類器通 過(guò)如上所述的構(gòu)建方法構(gòu)建而得。
[0010] 根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種電子設(shè)備,該電子設(shè)備包括如上所述的 構(gòu)建裝置或如上所述的圖像分類裝置。
[0011] 根據(jù)本發(fā)明的又一個(gè)方面,還提供了一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn) 品,上述程序產(chǎn)品在執(zhí)行時(shí)能夠使上述機(jī)器執(zhí)行如上所述的構(gòu)建方法或如上所述的圖像分 類方法。
[0012] 此外,根據(jù)本發(fā)明的其他方面,還提供了 一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有如 上所述的程序產(chǎn)品。
[0013] 上述根據(jù)本發(fā)明實(shí)施例的構(gòu)建裝置、圖像分類裝置、構(gòu)建方法、圖像分類方法以及 電子設(shè)備,其在構(gòu)建圖像分類器的過(guò)程中或者在利用上述圖像分類器進(jìn)行分類的過(guò)程中, 由于考慮了圖像的圖像級(jí)特征和區(qū)域級(jí)特征之間的聯(lián)系,能夠有效地克服傳統(tǒng)方法的不 足,使得利用該構(gòu)建裝置所構(gòu)建的圖像分類器進(jìn)行圖像分類的結(jié)果較為準(zhǔn)確、精度較高。
[0014] 通過(guò)以下結(jié)合附圖對(duì)本發(fā)明的最佳實(shí)施例的詳細(xì)說(shuō)明,本發(fā)明的這些以及其他優(yōu) 點(diǎn)將更加明顯。
【專利附圖】
【附圖說(shuō)明】
[0015] 本發(fā)明可以通過(guò)參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所 有附圖中使用了相同或相似的附圖標(biāo)記來(lái)表示相同或者相似的部件。所述附圖連同下面的 詳細(xì)說(shuō)明一起包含在本說(shuō)明書(shū)中并且形成本說(shuō)明書(shū)的一部分,而且用來(lái)進(jìn)一步舉例說(shuō)明本 發(fā)明的優(yōu)選實(shí)施例和解釋本發(fā)明的原理和優(yōu)點(diǎn)。在附圖中:
[0016] 圖IA是示意性地示出根據(jù)本發(fā)明的實(shí)施例的構(gòu)建裝置的一種示例結(jié)構(gòu)的框圖;
[0017] 圖IB是示出傳統(tǒng)的標(biāo)準(zhǔn)SVM分類器的原理的示意圖;
[0018] 圖IC是示出根據(jù)本發(fā)明的實(shí)施例的圖像級(jí)SVM分類器的原理的示意圖;
[0019] 圖ID是示出根據(jù)本發(fā)明的實(shí)施例的區(qū)域級(jí)SVM分類器的原理的示意圖;
[0020] 圖2是示意性地示出根據(jù)本發(fā)明的實(shí)施例的圖像分類裝置的一種示例結(jié)構(gòu)的框 圖;
[0021] 圖3是示意性地示出根據(jù)本發(fā)明的實(shí)施例的構(gòu)建方法的一種示例性處理的流程 圖;
[0022] 圖4是示意性地示出如圖3所示的步驟S340的一種可能的示例性處理的流程圖;
[0023] 圖5是示意性地示出根據(jù)本發(fā)明的實(shí)施例的圖像分類方法的一種示例性處理的 流程圖;以及
[0024] 圖6是示出了可用來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施例的構(gòu)建裝置和構(gòu)建方法、或者根據(jù) 本發(fā)明的實(shí)施例的圖像分類裝置和圖像分類方法的一種可能的信息處理設(shè)備的硬件配置 的結(jié)構(gòu)簡(jiǎn)圖。
[0025] 本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,附圖中的元件僅僅是為了簡(jiǎn)單和清楚起見(jiàn)而示出的, 而且不一定是按比例繪制的。例如,附圖中某些元件的尺寸可能相對(duì)于其他元件放大了,以 便有助于提高對(duì)本發(fā)明實(shí)施例的理解。
【具體實(shí)施方式】
[0026] 在下文中將結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡(jiǎn)明起見(jiàn), 在說(shuō)明書(shū)中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開(kāi)發(fā)任何這種實(shí)際實(shí)施 例的過(guò)程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開(kāi)發(fā)人員的具體目標(biāo),例如,符 合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有 所改變。此外,還應(yīng)該了解,雖然開(kāi)發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開(kāi) 內(nèi)容的本領(lǐng)域技術(shù)人員來(lái)說(shuō),這種開(kāi)發(fā)工作僅僅是例行的任務(wù)。
[0027] 在此,還需要說(shuō)明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中 僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明 關(guān)系不大的其他細(xì)節(jié)。
[0028] 本發(fā)明的實(shí)施例提供了一種圖像分類器的構(gòu)建裝置,該構(gòu)建裝置包括:訓(xùn)練圖像 分割單元,其被配置用于將訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像分割為多個(gè)區(qū)域;第一提取單元, 其被配置用于提取訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的圖像級(jí)特征,以及提取每個(gè)訓(xùn)練圖像的多 個(gè)區(qū)域中的每一個(gè)的區(qū)域級(jí)特征;以及構(gòu)建單元,其被配置用于基于訓(xùn)練圖像集中每個(gè)訓(xùn) 練圖像的圖像級(jí)特征和每個(gè)訓(xùn)練圖像中的多個(gè)區(qū)域的區(qū)域級(jí)特征對(duì)圖像級(jí)SVM (support vector machine,支持向量機(jī))分類器和區(qū)域級(jí)SVM分類器進(jìn)行訓(xùn)練,以構(gòu)建包括圖像級(jí)SVM 分類器和區(qū)域級(jí)SVM分類器的圖像分類器;其中,構(gòu)建單元在進(jìn)行訓(xùn)練的過(guò)程中考慮了如 下的第一約束:針對(duì)訓(xùn)練圖像集的全集或子集中的每個(gè)訓(xùn)練圖像,令區(qū)域級(jí)SVM分類器對(duì) 該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié)果中的最大值和圖像級(jí)SVM分類器對(duì)該訓(xùn)練圖像的分類 結(jié)果盡量接近。
[0029] 下面結(jié)合圖IA來(lái)詳細(xì)描述根據(jù)本發(fā)明的實(shí)施例的圖像分類器的構(gòu)建裝置的一個(gè) 示例。
[0030] 如圖IA所示,根據(jù)本發(fā)明的實(shí)施例的構(gòu)建裝置100包括訓(xùn)練圖像分割單元110、第 一提取單元120以及構(gòu)建單元130。
[0031] 訓(xùn)練圖像分割單元110用于將訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像分割為多個(gè)區(qū)域。
[0032] 其中,訓(xùn)練圖像集中的各個(gè)訓(xùn)練圖像是帶類別標(biāo)簽的圖像。也就是說(shuō),訓(xùn)練圖像集 中可以包括正例圖像和負(fù)例圖像,其中,正例圖像是類別標(biāo)簽的值為正數(shù)的訓(xùn)練圖像,而負(fù) 例圖像則是類別標(biāo)簽的值為負(fù)數(shù)的訓(xùn)練圖像。
[0033] 在一個(gè)例子中,假設(shè)訓(xùn)練圖像集為U1, I2,…,IJ,其中N為訓(xùn)練圖像集中所包括 的訓(xùn)練圖像總數(shù),每個(gè)訓(xùn)練圖像Ii (i = 1,2, "·,Ν)對(duì)應(yīng)的類別標(biāo)簽為yi,其中,N為正整數(shù)。 訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像Ii的類別標(biāo)簽Y i可以為1或者-1,即yie {-1,1}。也就是 說(shuō),當(dāng)訓(xùn)練圖像Ii的類別標(biāo)簽Yi = 1時(shí),表示該訓(xùn)練圖像Ii是正例圖像;而當(dāng)訓(xùn)練圖像Ii 的類別標(biāo)簽Yi = -1時(shí),表示該訓(xùn)練圖像Ii是負(fù)例圖像。
[0034] 其中,對(duì)于訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像,訓(xùn)練圖像分割單元110將該訓(xùn)練圖像 分割為多個(gè)區(qū)域,并且每個(gè)訓(xùn)練圖像經(jīng)過(guò)圖像分割后所得到的區(qū)域數(shù)量可以是相同的,也 可以是不同的。在一個(gè)例子中,對(duì)于訓(xùn)練圖像集U 1,12,…,IJ中的每個(gè)訓(xùn)練圖像Ii,訓(xùn)練圖 像分割單元110可以分別將每個(gè)訓(xùn)練圖像I i都分割為Ctl個(gè)區(qū)域,其中,Ctl為正整數(shù),分割的 具體處理過(guò)程可以通過(guò)本領(lǐng)域公知常識(shí)和/或結(jié)合公開(kāi)資料來(lái)獲得,這里不再贅述。此外, 在另一個(gè)例子中,訓(xùn)練圖像分割單元110也可以根據(jù)一些現(xiàn)有的圖像分割技術(shù)將每個(gè)訓(xùn)練 圖像I i進(jìn)行分割,但各個(gè)訓(xùn)練圖像I1, I2,…,In所被分割成的區(qū)域數(shù)量并不全部相同。
[0035] 這樣,通過(guò)訓(xùn)練圖像分割單元110的分割處理,可以得到訓(xùn)練圖像集中的每個(gè)訓(xùn) 練圖像的多個(gè)區(qū)域。然后,第一提取單元120提取訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的圖像級(jí)特 征,以及提取每個(gè)訓(xùn)練圖像的多個(gè)區(qū)域中的每一個(gè)區(qū)域的區(qū)域級(jí)特征。
[0036] 其中,圖像級(jí)特征例如可以是顏色特征、紋理特征等視覺(jué)特征的任一種特征(或任 幾種特征組合),而區(qū)域級(jí)特征也可以是顏色特征、紋理特征等視覺(jué)特征的任一種特征(或 任幾種特征組合)。
[0037] 在一個(gè)例子中,假設(shè)各個(gè)訓(xùn)練圖像I1, I2,…,In所被分割成的區(qū)域數(shù)量可以不全部 相同,并設(shè)所有訓(xùn)練圖像I1, I2,…,In所包括的所有區(qū)域的總數(shù)量為M,且M為正整數(shù),這M 個(gè)區(qū)域組成的集合可以表示成(R1, R2,…,RmK為了描述訓(xùn)練圖像Ii與其多個(gè)區(qū)域之間的 關(guān)系,可以采用Rj e Ii表示Rj是Ii中的區(qū)域。
[0038] 例如,假設(shè)所有訓(xùn)練圖像I1, I2,…,。所包括的所有區(qū)域的總數(shù)量為100 (即 M=100),這100個(gè)區(qū)域所組成的集合可以表示成(R1, R2,…,RltlJ。其中,假設(shè)集合(R1, R2,… ,RltlJ中的R1, R2,…,Rltl屬于訓(xùn)練圖像I1, R11, R12,…,R17屬于訓(xùn)練圖像12,……,以及 R93, R94, ···,'〇屬于訓(xùn)練圖像In。于是,對(duì)于訓(xùn)練圖像I1來(lái)說(shuō),Rje I1包括R1, R2,…,Riq共 10個(gè)區(qū)域;對(duì)于訓(xùn)練圖像I2來(lái)說(shuō),R j e I2包括R11, R12,…,R17共7個(gè)區(qū)域;……;以及對(duì)于 訓(xùn)練圖像In來(lái)說(shuō),R j e In包括R93, R94,…,Riqq共8個(gè)區(qū)域。
[0039] 對(duì)于各個(gè)訓(xùn)練圖像I1,12,…,In,令抽取出的圖像級(jí)特征表示為{<,4,一,*;^,其 中,<是表示訓(xùn)練圖像I i的圖像級(jí)特征的特征向量。
[0040] 對(duì)于各個(gè)訓(xùn)練圖像I1, I2,…,In中的每個(gè)訓(xùn)練圖像Ii (i = 1,2,…,Ν),令xf表示 訓(xùn)練圖像Ii的區(qū)域& e Ii的區(qū)域級(jí)特征的特征向量。因此,對(duì)于訓(xùn)練圖像Ii來(lái)說(shuō),其區(qū)域 級(jí)特征可以用特征向量集合e ^來(lái)表示。
[0041] 這樣,通過(guò)第一提取單元120的處理,可以得到訓(xùn)練圖像集中每個(gè)訓(xùn)練圖像的圖 像級(jí)特征和每個(gè)訓(xùn)練圖像的多個(gè)區(qū)域的區(qū)域級(jí)特征。然后,構(gòu)建單元130基于上述訓(xùn)練圖 像集中每個(gè)訓(xùn)練圖像的圖像級(jí)特征和每個(gè)訓(xùn)練圖像中的多個(gè)區(qū)域的區(qū)域級(jí)特征來(lái)對(duì)圖像 級(jí)SVM分類器和區(qū)域級(jí)SVM分類器進(jìn)行訓(xùn)練,以構(gòu)建包括上述圖像級(jí)SVM分類器和上述區(qū) 域級(jí)SVM分類器的圖像分類器。
[0042] 其中,構(gòu)建單元130在對(duì)圖像級(jí)SVM分類器和區(qū)域級(jí)SVM分類器進(jìn)行訓(xùn)練的過(guò)程 中,考慮了如下的第一約束:針對(duì)訓(xùn)練圖像集的全集或子集中的每個(gè)訓(xùn)練圖像,令區(qū)域級(jí) SVM分類器對(duì)該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié)果中的最大值和圖像級(jí)SVM分類器對(duì)該訓(xùn)練 圖像的分類結(jié)果盡量接近。
[0043] 需要注意的是,在下文中,"區(qū)域級(jí)SVM分類器對(duì)該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié) 果中的最大值"也稱作"區(qū)域級(jí)SVM分類器對(duì)該訓(xùn)練圖像的分類結(jié)果"。
[0044] 為清楚起見(jiàn),下面結(jié)合圖IB來(lái)介紹標(biāo)準(zhǔn)SVM分類器的相關(guān)概念。圖IB示意性地 示出了傳統(tǒng)的標(biāo)準(zhǔn)SVM分類器的原理圖。如圖IB所示,圖中的方形樣本和圓形樣本可以是 待區(qū)分的兩個(gè)類別(例如,方形樣本和圓形樣本中的一種可以是上文所述的正例圖像,而另 一種是負(fù)例圖像),H為表示SVM分類器的超平面,可以用分類函數(shù)f(x) = w · x+b表示上 述SVM分類器,并可以用w *x+b = 0來(lái)表示上述超平面Η。其中,w和b為待求解的SVM參 數(shù),而X則為待分類的樣本(訓(xùn)練樣本或下文中所說(shuō)的待測(cè)樣本)的特征向量。w和X之間 的"· "表示w和X這兩個(gè)向量的內(nèi)積。以圖IB中的圓形樣本P1為例,P1到超平面H的函 數(shù)間隔如圖IB中的I 1所示(即P1在圖中縱向上到H的距離),而P1到超平面H的幾何間隔 如圖IB中的Cl 1所示(即P1到H的最短距離,相當(dāng)于P1到P1在H上的投影之間的距離)。這 樣,在數(shù)學(xué)上,可以用λ =>,,(wi + Z〇.表示X對(duì)應(yīng)的待分類的樣本到超平面H的函數(shù)間隔, 以及可以用表示X對(duì)應(yīng)的待分類的樣本到超平面H的幾何間 隔。
【權(quán)利要求】
1. 一種圖像分類器的構(gòu)建裝置,包括: 訓(xùn)練圖像分割單元,其被配置用于將訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像分割為多個(gè)區(qū)域; 第一提取單元,其被配置用于提取所述訓(xùn)練圖像集中每個(gè)所述訓(xùn)練圖像的圖像級(jí)特 征,以及提取每個(gè)所述訓(xùn)練圖像的所述多個(gè)區(qū)域中的每一個(gè)的區(qū)域級(jí)特征;以及 構(gòu)建單元,其被配置用于基于所述訓(xùn)練圖像集中每個(gè)所述訓(xùn)練圖像的圖像級(jí)特征和每 個(gè)所述訓(xùn)練圖像中的所述多個(gè)區(qū)域的區(qū)域級(jí)特征對(duì)圖像級(jí)支持向量機(jī)分類器和區(qū)域級(jí)支 持向量機(jī)分類器進(jìn)行訓(xùn)練,以構(gòu)建包括所述圖像級(jí)支持向量機(jī)分類器和所述區(qū)域級(jí)支持向 量機(jī)分類器的圖像分類器;其中,所述構(gòu)建單元在進(jìn)行所述訓(xùn)練的過(guò)程中考慮了如下的第 一約束:針對(duì)所述訓(xùn)練圖像集的全集或子集中的每個(gè)訓(xùn)練圖像,令所述區(qū)域級(jí)支持向量機(jī) 分類器對(duì)該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié)果中的最大值和所述圖像級(jí)支持向量機(jī)分類器 對(duì)該訓(xùn)練圖像的分類結(jié)果盡量接近。
2. 根據(jù)權(quán)利要求1所述的構(gòu)建裝置,其中,所述第一約束包括: 針對(duì)所述訓(xùn)練圖像集的全集或子集中的每個(gè)訓(xùn)練圖像,令該訓(xùn)練圖像到表示所述圖像 級(jí)支持向量機(jī)分類器的第一超平面的函數(shù)間隔與該訓(xùn)練圖像到表示所述區(qū)域級(jí)支持向量 機(jī)分類器的第二超平面的函數(shù)間隔盡量接近,其中,該訓(xùn)練圖像到所述第二超平面的函數(shù) 間隔是所述區(qū)域級(jí)支持向量機(jī)分類器對(duì)該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié)果中的最大值所 對(duì)應(yīng)的區(qū)域到所述第二超平面的函數(shù)間隔。
3. 根據(jù)權(quán)利要求2所述的構(gòu)建裝置,其中,所述子集不包括所述訓(xùn)練圖像集中的離群 樣本,所述離群樣本是滿足以下條件的訓(xùn)練圖像: 其到所述第一超平面的函數(shù)間隔小于第一預(yù)定閾值,和/或 其到所述第二超平面的函數(shù)間隔小于第二預(yù)定閾值; 其中,所述第一預(yù)定閾值和所述第二預(yù)定閾值均為正數(shù)。
4. 根據(jù)權(quán)利要求3所述的構(gòu)建裝置,其中,所述構(gòu)建單元被配置用于: 在考慮所述第一約束和第二約束的情況下構(gòu)建以所述圖像級(jí)支持向量機(jī)分類器和所 述區(qū)域級(jí)支持向量機(jī)分類器的支持向量機(jī)參數(shù)為未知量的代價(jià)函數(shù);以及 通過(guò)求解所述代價(jià)函數(shù)的最優(yōu)問(wèn)題來(lái)獲得所述圖像級(jí)支持向量機(jī)分類器和所述區(qū)域 級(jí)支持向量機(jī)分類器的支持向量機(jī)參數(shù)的最優(yōu)值; 其中,所述第二約束包括: 使得到所述第一超平面的函數(shù)間隔為所述第一預(yù)定閾值的訓(xùn)練圖像到所述第一超平 面的幾何間隔盡量大,以及 使得到所述第二超平面的函數(shù)間隔為所述第二預(yù)定閾值的訓(xùn)練圖像到所述第二超平 面的幾何間隔盡量大。
5. 根據(jù)權(quán)利要求4所述的構(gòu)建裝置,其中,所述構(gòu)建單元被配置用于在所述訓(xùn)練的過(guò) 程中還考慮如下的第三約束: 針對(duì)所述圖像級(jí)支持向量機(jī)分類器,使得所述訓(xùn)練圖像集中的、到所述第一超平面的 函數(shù)間隔小于所述第一預(yù)定閾值的訓(xùn)練圖像所對(duì)應(yīng)的第一松弛變量的加權(quán)和盡量??;以及 針對(duì)所述區(qū)域級(jí)支持向量機(jī)分類器,使得所述訓(xùn)練圖像集中的、到所述第二超平面的 函數(shù)間隔小于所述第二預(yù)定閾值的訓(xùn)練圖像所對(duì)應(yīng)的第二松弛變量的加權(quán)和盡量小。
6. -種圖像分類裝置,包括: 待測(cè)圖像分割單元,其被配置用于將待測(cè)圖像分割為多個(gè)區(qū)域; 第二提取單元,其被配置用于提取所述待測(cè)圖像的圖像級(jí)特征和所述待測(cè)圖像的所述 多個(gè)區(qū)域中的每一個(gè)的區(qū)域級(jí)特征; 分類單元,其被配置用于基于所述待測(cè)圖像的圖像級(jí)特征獲得圖像級(jí)支持向量機(jī)分類 器對(duì)所述待測(cè)圖像的分類結(jié)果,以及基于所述待測(cè)圖像的多個(gè)區(qū)域的區(qū)域級(jí)特征獲得區(qū)域 級(jí)支持向量機(jī)分類器對(duì)所述待測(cè)圖像中所述多個(gè)區(qū)域中的每一個(gè)的分類結(jié)果;以及 結(jié)果確定單元,其被配置用于根據(jù)所述區(qū)域級(jí)支持向量機(jī)分類器對(duì)所述待測(cè)圖像中所 述多個(gè)區(qū)域的分類結(jié)果中的最大值和所述圖像級(jí)支持向量機(jī)分類器對(duì)所述待測(cè)圖像的分 類結(jié)果,確定所述待測(cè)圖像的最終分類結(jié)果; 其中,所述圖像級(jí)支持向量機(jī)分類器和所述區(qū)域級(jí)支持向量機(jī)分類器通過(guò)如權(quán)利要求 1-5中任一項(xiàng)所述的構(gòu)建裝置構(gòu)建而得。
7. 根據(jù)權(quán)利要求6所述的圖像分類裝置,其中,所述結(jié)果確定單元將所述區(qū)域級(jí)支持 向量機(jī)分類器對(duì)所述待測(cè)圖像中所述多個(gè)區(qū)域的分類結(jié)果中的最大值和所述圖像級(jí)支持 向量機(jī)分類器對(duì)所述待測(cè)圖像的分類結(jié)果的加權(quán)和確定為所述待測(cè)圖像的最終分類結(jié)果。
8. -種圖像分類器的構(gòu)建方法,包括: 將訓(xùn)練圖像集中的每個(gè)訓(xùn)練圖像分割為多個(gè)區(qū)域; 提取所述訓(xùn)練圖像集中每個(gè)所述訓(xùn)練圖像的圖像級(jí)特征,以及提取每個(gè)所述訓(xùn)練圖像 的所述多個(gè)區(qū)域中的每一個(gè)的區(qū)域級(jí)特征;以及 基于所述訓(xùn)練圖像集中每個(gè)所述訓(xùn)練圖像的圖像級(jí)特征和每個(gè)所述訓(xùn)練圖像中的所 述多個(gè)區(qū)域的區(qū)域級(jí)特征對(duì)圖像級(jí)支持向量機(jī)分類器和區(qū)域級(jí)支持向量機(jī)分類器進(jìn)行訓(xùn) 練,以構(gòu)建包括所述圖像級(jí)支持向量機(jī)分類器和所述區(qū)域級(jí)支持向量機(jī)分類器的圖像分類 器;其中,在所述訓(xùn)練的過(guò)程中考慮了如下的第一約束:針對(duì)所述訓(xùn)練圖像集的全集或子 集中的每個(gè)訓(xùn)練圖像,令所述區(qū)域級(jí)支持向量機(jī)分類器對(duì)該訓(xùn)練圖像的多個(gè)區(qū)域的分類結(jié) 果中的最大值和所述圖像級(jí)支持向量機(jī)分類器對(duì)該訓(xùn)練圖像的分類結(jié)果盡量接近。
9. 一種圖像分類方法,包括: 將待測(cè)圖像分割為多個(gè)區(qū)域; 提取所述待測(cè)圖像的圖像級(jí)特征和所述待測(cè)圖像的所述多個(gè)區(qū)域中的每一個(gè)的區(qū)域 級(jí)特征; 基于所述待測(cè)圖像的圖像級(jí)特征獲得圖像級(jí)支持向量機(jī)分類器對(duì)所述待測(cè)圖像的分 類結(jié)果,以及基于所述待測(cè)圖像的多個(gè)區(qū)域的區(qū)域級(jí)特征獲得區(qū)域級(jí)支持向量機(jī)分類器對(duì) 所述待測(cè)圖像中所述多個(gè)區(qū)域中的每一個(gè)的分類結(jié)果;以及 根據(jù)所述區(qū)域級(jí)支持向量機(jī)分類器對(duì)所述待測(cè)圖像中所述多個(gè)區(qū)域的分類結(jié)果中的 最大值和所述圖像級(jí)支持向量機(jī)分類器對(duì)所述待測(cè)圖像的分類結(jié)果,確定所述待測(cè)圖像的 最終分類結(jié)果; 其中,所述圖像級(jí)支持向量機(jī)分類器和所述區(qū)域級(jí)支持向量機(jī)分類器通過(guò)如權(quán)利要求 8所述的構(gòu)建方法構(gòu)建而得。
10. -種電子設(shè)備,包括如權(quán)利要求1-5中任一項(xiàng)所述的構(gòu)建裝置或如權(quán)利要求6或7 所述的圖像分類裝置。
【文檔編號(hào)】G06K9/66GK104239906SQ201310253005
【公開(kāi)日】2014年12月24日 申請(qǐng)日期:2013年6月24日 優(yōu)先權(quán)日:2013年6月24日
【發(fā)明者】李斐, 劉汝杰 申請(qǐng)人:富士通株式會(huì)社