一種基于核主成分分析網(wǎng)絡的圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)字圖像領(lǐng)域,具體涉及一種基于核主成分分析網(wǎng)絡的圖像分類方 法。
【背景技術(shù)】
[0002] 對圖像進行分類之前,通常需要對圖像矩陣進行降維。常用的降維方法主要有兩 種:1、主成分分析法;2、核主成分分析法。前者主要是針對線性可分的數(shù)據(jù),而后者則可以 處理線性不可分的數(shù)據(jù)。兩者的分類正確率都不是很高。
[0003] 1、主成分分析法
[0004] 主成分分析法是最常用的線性降維方法,其目標是通過線性映射將高維的數(shù)據(jù)映 射到低維的空間中進行表達,并期望在所投影的維度上數(shù)據(jù)的方差最大,從而使用較少的 數(shù)據(jù)維度保留住較多的原始數(shù)據(jù)的特點。
[0005] 其具體算法如下:
[0006] 假設(shè)輸入111個11維的樣本父" =1,2,...,111,其中/6『,2' = 1,2,-?,將每個樣本 中的n維數(shù)據(jù)排成列向量,則輸入樣本表示為:
[0007] Xj= [x i;1 xi;2 . . . xi;n]T, i = 1, 2, . . . , m (1)
[0008] 首先對樣本中每個維度的數(shù)據(jù)中心化:
[0009] 每個樣本減去平均值X使得樣本的每個維度均值都為〇,:
【主權(quán)項】
1. 一種基于核主成分分析網(wǎng)絡的圖像分類方法,其特征在于,包括以下步驟: 步驟1:建立核主成分分析網(wǎng)絡第一層: 步驟1. 1 :輸入圖像數(shù)據(jù)庫中的&幅訓練圖像,并對其進行預處理,分別得到N屬訓練 圖像中每一幅圖像的局部特征矩陣Ii,i= 1,2,...,N1;其中圖像數(shù)據(jù)庫包含N幅大小為 mXn已經(jīng)人工分類并作標記的圖像,&<N; 步驟1. 2 :求局部特征矩陣I,的協(xié)方差矩陣均值〇 ,選擇任意一個核函數(shù),將協(xié)方差矩 陣均值亡映射到高維空間的核子空間當中,得到核子空間當中的協(xié)方差矩陣K,并對K去均 值得到K,通過對K進行奇異值分解,得到K的主成分,從而獲得第一層核主成分分析網(wǎng)絡 的濾波器V(1);分別將I1與V(1)卷積,得到第一層核主成分分析網(wǎng)絡的訓練輸出圖像; 步驟2:建立核主成分分析網(wǎng)絡第二層: 將核主成分分析網(wǎng)絡的第一層訓練輸出圖像替代步驟1. 1的K幅訓練圖像,重復步驟 1. 1至步驟1. 2的過程,得到第二層核主成分分析網(wǎng)絡的濾波器V(2)以及第二層核主成分分 析網(wǎng)絡的訓練輸出圖像; 步驟3:建立核主成分分析網(wǎng)絡的輸出層: 步驟3. 1:將第二層核主成分分析網(wǎng)絡的訓練輸出圖像中的每幅圖像二值化,并對二 值化后的圖像分塊以統(tǒng)計直方圖,得到隊幅訓練圖像中每幅圖像的主特征向量fTm),i= 1,2, ? ? ?,Nu 步驟3. 2:將每幅圖像的主特征向量串聯(lián)起來,得到所有訓練圖像的主特征矩陣 p (train)^ 步驟4:訓練分類器: 將Ftoain)以及每幅圖像對應的標記輸入到分類器當中,訓練分類器,獲得能夠?qū)D像 進行分類的分類器。
2. 根據(jù)權(quán)利要求1所述的基于核主成分分析網(wǎng)絡的圖像分類方法,其特征在于,所述 步驟1. 1對&幅訓練圖像的預處理具體為: 在N幅大小為mXn的圖像數(shù)據(jù)庫中隨機選取&幅作為訓練圖像數(shù)據(jù)庫;用一個大小 Sk:Xk2的滑塊遍歷訓練圖像數(shù)據(jù)庫中的每幅訓練圖像X,er^,i= 1,2,…,&的每一 個像素,其中置為實數(shù)集,匕和k2均為奇數(shù),并且0〈km,0〈kn,每一幅圖像總共有mn 個像素;對于每一個像素將滑塊范圍內(nèi)的hk2個像素值保存成一個列向量,得到mn個長度 為hk2的列向量,記為:
對式(1)中的列向量去均值得到:
將去均值后的向量組合,從而得到每幅訓練圖像\的局部特征矩陣Ii:
3. 根據(jù)權(quán)利要求2所述的基于核主成分分析網(wǎng)絡的圖像分類方法,其特征在于,所述 步驟1.2具體包括以下步驟: (a)分別求局部特征矩陣丨=L2,…,&的協(xié)方差矩陣:
⑷ 對得到的&個協(xié)方差矩陣進行平均,得到:
(b) 選擇線性核函數(shù)、多項式核函數(shù)、高斯核函數(shù)、指數(shù)核函數(shù)、拉普拉斯核函數(shù)、 雙曲正切核函數(shù)、有理二次核函數(shù)、逆多元二次核函數(shù)、圓核函數(shù)中的任意一個核函 數(shù)將亡eK%x咕映射到高維空間中的核子空間,得到大小為kAXkA的協(xié)方差矩陣 Ke腹,并對矩陣k進行去均值得到:
其中2郵為一個的矩陣,每一個元素都是lAkA); (c) 對K進行奇異值分解,找出K的1^個主成分,并將K的1^個主成分作為第一層核 主成分分析網(wǎng)絡的濾波器V(1):
式(7)中,vf為泛的第j個主成分,U為第一層核主成分分析網(wǎng)絡中濾波器的個數(shù),0 <kxk2; 將局部特征矩陣Ii,i= 1,2,. . .,&分別與vf,.j= 1,2,. . .,1^進行卷積,得到第一層 核主成分分析網(wǎng)絡的訓練輸出圖像:
4. 根據(jù)權(quán)利要求1所述的基于核主成分分析網(wǎng)絡的圖像分類方法,其特征在于,所述 步驟2具體包括以下步驟: 將第一層核主成分分析網(wǎng)絡的訓練輸出圖像替代步驟1. 1中&幅訓練圖像,重復 步驟1. 1至步驟1. 2過程,得到核主成分分析網(wǎng)絡的第二層濾波器:
式(9)中,<2)為第二層核主成分分析網(wǎng)絡的第h個濾波器,L2S第二層核主成分分析 網(wǎng)絡的濾波器個數(shù),〇 <L2<kik2; 以及得到UL2幅第二層核主成分分析網(wǎng)絡的訓練輸出圖像:
5. 根據(jù)權(quán)利要求4所述的基于核主成分分析網(wǎng)絡的圖像分類方法,其特征在于,所述 步驟3.1具體包括以下步驟: (a) 將第二層核主成分分析網(wǎng)絡的訓練輸出圖像I丨:er-"中的每幅圖像進行二值化 操作,得到二值化后的圖像,二值化操作具體為:中的元素如果大于0,則將該 元素置為1 ;如果小于或者等于〇,則將該元素置為〇 ;二值化后的圖像表示為:
將式(11)中的圖像進行重新分組,每。幅圖像分為一組,得到NA個圖像組,每個圖像 組包括L2幅圖像,對每個圖像組中的L2張進行加權(quán)求和得到一幅加權(quán)圖像,從而獲得N山: 個圖像組的加權(quán)圖像
式(12)對應著NA張像素值介于[0,212-1]的圖像; (b) 將弩)?'i= 1,2,…,N1;j= 1,2,…,L沖的每幅加權(quán)圖像分成B塊,0〈B〈mn;分 別統(tǒng)計各個塊的直方圖并將這B個塊的直方圖連接成一個向量:
由式(13)得到&幅訓練圖像中每幅圖像的主特征向量
6. 根據(jù)權(quán)利要求5所述的基于核主成分分析網(wǎng)絡的圖像分類方法,其特征在于,所述 步驟3. 2具體包括以下步驟: 按照原始輸入的訓練圖像的標記,K幅訓練圖像中每幅圖像的主特征向量串聯(lián)起來, 得到所有訓練圖像的主特征矩陣:
7. 根據(jù)權(quán)利要求6所述的基于核主成分分析網(wǎng)絡的圖像分類方法,其特征在于,所述 步驟4具體包括以下步驟: 將Ftoain)以及每幅訓練圖像對應的原始標記輸入到分類器中,訓練出分類需要的參 數(shù),獲得能夠?qū)D像進行分類的分類器。
【專利摘要】本發(fā)明公開一種基于核主成分分析網(wǎng)絡的圖像分類方法,包括以下步驟:(1)輸入并預處理訓練圖像,得到訓練圖像的局部特征矩陣,(2)建立一個兩層的核主成分分析網(wǎng)絡,獲得訓練圖像的主特征向量,(3)并用獲得的主特征向量訓練分類器;為了驗證分類的正確性,建立測試核主成分分析網(wǎng)絡對測試圖像進行測試。發(fā)明通過構(gòu)造一個兩層的核主成分分析網(wǎng)絡,能夠獲得圖像的非線性特征,使得圖像特征的描述更精確,分類也更為準確,對于圖像分類問題有著更高的正確率。
【IPC分類】G06K9-62
【公開號】CN104573729
【申請?zhí)枴緾N201510037296
【發(fā)明人】吳丹, 伍家松, 姜龍玉, 楊淳沨, 達臻, 舒華忠
【申請人】東南大學
【公開日】2015年4月29日
【申請日】2015年1月23日