两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于流形稀疏編碼的圖像聚類的方法

文檔序號:6334549閱讀:1350來源:國知局
專利名稱:基于流形稀疏編碼的圖像聚類的方法
技術(shù)領(lǐng)域
本發(fā)明涉及機器學(xué)習(xí)中的圖像稀疏編碼技術(shù)領(lǐng)域,特別是涉及一種基于流形稀疏 編碼的圖像聚類方法。
背景技術(shù)
圖像聚類一直是機器學(xué)習(xí)領(lǐng)域內(nèi)的經(jīng)典問題,所謂圖像聚類就是在給出的圖像集 合中,根據(jù)圖像的內(nèi)容,在無先驗知識的條件下,將圖像分成有意義的簇。對于圖像聚類,最 常用的特征屬性是顏色、紋理和形狀等,此外比較常用的特征是采用圖像的尺度不變特征 變換(SIFT )特征。然而很多時候這類特征都是維度較高同時又是比較稠密的表達,這往往 會影響圖像的聚類性能。

發(fā)明內(nèi)容
為克服現(xiàn)有技術(shù)的采用SIFT特征進行圖像聚類,由于特征的維度高且對圖像進 行稠密表達,造成聚在同一類的圖像之間的相似度低,聚類性能不理想的缺點,本發(fā)明提供 了一種能提高聚類性能的基于流形稀疏編碼的圖像聚類的方法?;诹餍蜗∈杈幋a的圖像聚類的方法,包括以下步驟
1)、獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣 X , 1 = [ +、__^^、],其中,巧是第i張圖像的原始特征;獲取每張圖像中的SIFT特 征,〒ism^mFiif, SIFTU ;其中忍為組成圖像I的第η個SIFT特征;
2)、構(gòu)造一個數(shù)據(jù)字典B,5= [、A,…A],其中敘為向量維度與原始數(shù)據(jù)維度相同的 基向量,利用數(shù)據(jù)矩陣X,學(xué)習(xí)數(shù)據(jù)字典B和圖像的流形稀疏編碼S,Si = [S1Jf1SfA]
;其中,巧為采用流形稀疏編碼表示的第i張圖像特征;
3)、使用K-means聚類方法,采用歐式距離計算各個圖像之間的距離,預(yù)設(shè)圖像之間的 距離閾值,將圖像之間距離小于預(yù)設(shè)的距離閾值的圖像聚為一類,使得圖像最終按類別進 行顯不。進一步,步驟1)中,提取圖像的SIFT特征的方法包括以下步驟
(1.1)獲取一張目標(biāo)圖像,進行尺度空間極值檢測,即利用不同尺度的高斯差分方程同 目標(biāo)圖像進行卷積,求取尺度空間極值;
(1. 2)精確定位特征點的位置,即通過擬合三維二次函數(shù)以精確確定各特征點的位置 和尺度(達到亞像素精度),同時去除低對比度的關(guān)鍵點和不穩(wěn)定的邊緣相應(yīng)點、以增強匹 配穩(wěn)定性、提高抗噪聲能力;
(1. 3)確定特征點的主方向,即利用關(guān)鍵點領(lǐng)域像素的梯度方向分布特征為每個關(guān)鍵 點指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性; (1. 4)生成特征描述符,包括以下步驟
4(1. 4. 1)將坐標(biāo)軸旋轉(zhuǎn)為特征點的方向,以保證旋轉(zhuǎn)不變性;
(1. 4. 2)以特征點為中心取16X 16像素大小的窗口,但是特征點所在的行和列不?。?(1.4.3)在每個4X4的圖像小塊上計算8個方向的梯度方向直方圖,繪制每個梯度方 向的累加值,形成一個種子點,每個特征點由4X4共16個種子點組成,每個種子點有8個 方向向量信息,可產(chǎn)生4X4X8共128個數(shù)據(jù),形成128維的SIFT特征向量,該SIFT特征 向量為特征描述符。進一步,步驟2)中,利用數(shù)據(jù)矩陣X,通過求解目標(biāo)函數(shù) mm +OfTr(SLSr) +Si I1 ,來學(xué)習(xí)數(shù)據(jù)字典B和圖像的流形稀疏編碼S,其方法 包括以下步驟
(2. 1)初始化數(shù)據(jù)字典B,對數(shù)據(jù)字典B隨機賦值,算法將從i=l開始通過步驟(2. 2)及 (2. 3)逐個求解圖像的流形稀疏編碼A以及更新后的數(shù)據(jù)字典B,直到i=m,迭代終止;
(2. 2)將數(shù)據(jù)字典B作為已知信息,基于猜測圖像的流形稀疏編碼的符號,將原始目
標(biāo)函數(shù)中的項hi中的絕對值運算去除,從而使得原始含有絕對值的不可導(dǎo)的問題轉(zhuǎn)換為
一個簡單的二次規(guī)劃問題進行解決;
(2. 3)將步驟(2. 2)得出的圖像的流形稀疏編碼S作為已知信息,通過使用拉格朗日對 偶法求解數(shù)據(jù)字典B,然后再次執(zhí)行步驟(2. 2)來求解下一個流形稀疏編碼。稀疏編碼是一種獲取圖像稀疏表達的方法,最早應(yīng)用于模擬哺乳動物視覺系統(tǒng)主 視皮層Vl區(qū)簡單細(xì)胞感受的人工神經(jīng)網(wǎng)絡(luò)的編碼方式,后來被廣泛應(yīng)用圖像處理領(lǐng)域,例 如圖像去噪,圖像分類等問題。稀疏編碼所獲得的稀疏表達會使得圖像特征簡單化,更有利 用圖像聚類。流形學(xué)習(xí)是機器學(xué)習(xí)近些年的一個熱門研究課題。假設(shè)數(shù)據(jù)是均勻采樣于一個高 維歐氏空間中的低維流形,流形學(xué)習(xí)就是從高維采樣數(shù)據(jù)中恢復(fù)低維流形結(jié)構(gòu),即找到高 維空間中的低維流形,并求出相應(yīng)的嵌入映射,以實現(xiàn)數(shù)據(jù)的降維。它是從觀測到的現(xiàn)象中 去尋找事物的本質(zhì),找到產(chǎn)生數(shù)據(jù)的內(nèi)在規(guī)律。本發(fā)明將稀疏編碼技術(shù)應(yīng)用于圖像聚類領(lǐng)域,同時在傳統(tǒng)的稀疏編碼方法上綜合 考慮了數(shù)據(jù)的流形結(jié)構(gòu)特征,使得學(xué)習(xí)出來的稀疏編碼符合數(shù)據(jù)內(nèi)在的結(jié)構(gòu)特征,利用這 種既稀疏又體現(xiàn)數(shù)據(jù)內(nèi)在結(jié)構(gòu)的數(shù)據(jù)表達會使得圖像聚類效果更好。本發(fā)明具有能提高圖像聚類性能的優(yōu)點。


圖1是本發(fā)明的流程圖。圖2是步驟1的流程圖。
具體實施例方式參照附圖,進一步說明本發(fā)明
基于流形稀疏編碼的圖像聚類的方法,包括以下步驟
51)、獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣Jf,Z= Ui,巧J ,其中,A是第i張圖像的原始特征;獲取每張圖像中的SIFT特征, a = [SWTii,SiFTi2,…,Smin];其中SIFTin為組成圖像A的第η個SIFT特征;
2)、構(gòu)造一個數(shù)據(jù)字典Bj=隊知…為],其中為向量維度與原始數(shù)據(jù)維度相同的 基向量,利用數(shù)據(jù)矩陣X,學(xué)習(xí)數(shù)據(jù)字典B和圖像的流形稀疏編碼S,S = [sw",Si,···,、]
;其中 力采用流形稀疏編碼表示的第i張圖像特征;
3)、使叫K-means聚類方法,采用歐式距離計算各個圖像之間的距離,預(yù)設(shè)圖像之間的 距離閾值,將圖像之間距離小于預(yù)設(shè)的距離閾值的圖像聚為一類,使得圖像最終按類別進 行顯不。進一步,步驟1)中,提取圖像的SIFT特征的方法包括以下步驟
(1.1)獲取一張目標(biāo)圖像,進行尺度空間極值檢測,即利用不同尺度的高斯差分方程同 目標(biāo)圖像進行卷積,求取尺度空間極值;
(1. 2)精確定位特征點的位置,即通過擬合三維二次函數(shù)以精確確定各特征點的位置 和尺度(達到亞像素精度),同時去除低對比度的關(guān)鍵點和不穩(wěn)定的邊緣相應(yīng)點、以增強匹 配穩(wěn)定性、提高抗噪聲能力;
(1. 3)確定特征點的主方向,即利用關(guān)鍵點領(lǐng)域像素的梯度方向分布特征為每個關(guān)鍵 點指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性; (1. 4)生成特征描述符,包括以下步驟 (1. 4. 1)將坐標(biāo)軸旋轉(zhuǎn)為特征點的方向,以保證旋轉(zhuǎn)不變性;
(1. 4. 2)以特征點為中心取16X 16像素大小的窗口,但是特征點所在的行和列不??; (1.4.3)在每個4X4的圖像小塊上計算8個方向的梯度方向直方圖,繪制每個梯度方 向的累加值,形成一個種子點,每個特征點由4X4共16個種子點組成,每個種子點有8個 方向向量信息,可產(chǎn)生4X4X8共128個數(shù)據(jù),形成128維的SIFT特征向量,該SIFT特征 向量為特征描述符。進一步,步驟2)中,利用數(shù)據(jù)矩陣X,通過求解目標(biāo)函數(shù)
M
mm+miSL^) +P^si I1 ,來學(xué)習(xí)數(shù)據(jù)字典B和圖像的流形稀疏編碼S,其方法
包括以下步驟
(2. 1)初始化數(shù)據(jù)字典B,對數(shù)據(jù)字典B隨機賦值,算法將從i=l開始通過步驟(2. 2)及 (2. 3)逐個求解圖像的流形稀疏編碼巧以及更新后的數(shù)據(jù)字典B,直到i=m,迭代終止;
(2. 2)將數(shù)據(jù)字典B作為已知信息,基于猜測圖像的流形稀疏編碼的符號,將原始目
標(biāo)函數(shù)中的項hi中的絕對值運算去除,從而使得原始含有絕對值的不可導(dǎo)的問題轉(zhuǎn)換為
一個簡單的二次規(guī)劃問題進行解決;
(2. 3)將步驟(2. 2)得出的圖像的流形稀疏編碼S作為已知信息,通過使用拉格朗日對 偶法求解數(shù)據(jù)字典B,然后再次執(zhí)行步驟(2. 2)來求解下一個流形稀疏編碼。
稀疏編碼是一種獲取圖像稀疏表達的方法,最早應(yīng)用于模擬哺乳動物視覺系統(tǒng)主 視皮層Vl區(qū)簡單細(xì)胞感受的人工神經(jīng)網(wǎng)絡(luò)的編碼方式,后來被廣泛應(yīng)用圖像處理領(lǐng)域,例 如圖像去噪,圖像分類等問題。稀疏編碼所獲得的稀疏表達會使得圖像特征簡單化,更有利 用圖像聚類。流形學(xué)習(xí)是機器學(xué)習(xí)近些年的一個熱門研究課題。假設(shè)數(shù)據(jù)是均勻采樣于一個高 維歐氏空間中的低維流形,流形學(xué)習(xí)就是從高維采樣數(shù)據(jù)中恢復(fù)低維流形結(jié)構(gòu),即找到高 維空間中的低維流形,并求出相應(yīng)的嵌入映射,以實現(xiàn)數(shù)據(jù)的降維。它是從觀測到的現(xiàn)象中 去尋找事物的本質(zhì),找到產(chǎn)生數(shù)據(jù)的內(nèi)在規(guī)律。獲取圖像的流形稀疏編碼S時,利用數(shù)據(jù)矩陣X,通過求解目標(biāo)函數(shù)(1 ),學(xué)習(xí)數(shù)據(jù) 字典B= [b1;. . . , bk]以及新的圖像數(shù)據(jù)表達S=[Sl,...,sm],其中S是圖像的稀疏表達。其 中學(xué)習(xí)數(shù)據(jù)字典B和學(xué)習(xí)稀疏圖像數(shù)據(jù)表達S是一個迭代學(xué)習(xí)的過程,每次迭代過程包括 固定B,學(xué)習(xí)S;然后固定S,更新B。在學(xué)習(xí)稀疏圖像表達的過程中考慮了數(shù)據(jù)本身的流形 結(jié)構(gòu),即在原始數(shù)據(jù)空間相似的兩張圖像Xi和\,學(xué)習(xí)出來的稀疏表達Si和~也相似,通 過目標(biāo)函數(shù)(1)中的THSLSt)來保證數(shù)據(jù)本身流形結(jié)構(gòu)得以保持。固定B學(xué)習(xí)S,我們采 用的方法是基于猜測圖像新的表達S的符號,來使得將原來含有絕對值的不可導(dǎo)的問題轉(zhuǎn) 換為一個簡單的二次規(guī)劃問題進行解決。而固定S學(xué)習(xí)B,則是一個最小二乘問題,通過使 用拉格朗日對偶法進行求解即可。本發(fā)明將稀疏編碼技術(shù)應(yīng)用于圖像聚類領(lǐng)域,同時在傳統(tǒng)的稀疏編碼方法上綜合 考慮了數(shù)據(jù)的流形結(jié)構(gòu)特征,使得學(xué)習(xí)出來的稀疏編碼符合數(shù)據(jù)內(nèi)在的結(jié)構(gòu)特征,利用這 種既稀疏又體現(xiàn)數(shù)據(jù)內(nèi)在結(jié)構(gòu)的數(shù)據(jù)表達會使得圖像聚類效果更好。本說明書實施例所述的內(nèi)容僅僅是對發(fā)明構(gòu)思的實現(xiàn)形式的列舉,本發(fā)明的保護 范圍不應(yīng)當(dāng)被視為僅限于實施例所陳述的具體形式,本發(fā)明的保護范圍也及于本領(lǐng)域技術(shù) 人員根據(jù)本發(fā)明構(gòu)思所能夠想到的等同技術(shù)手段。
權(quán)利要求
基于流形稀疏編碼的圖像聚類的方法,包括以下步驟1)、獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣,,其中,是第i張圖像的原始特征;獲取每張圖像中的SIFT特征,;其中為組成圖像的第n個SIFT特征;2)、構(gòu)造一個數(shù)據(jù)字典B,,其中為向量維度與原始數(shù)據(jù)維度相同的基向量,利用數(shù)據(jù)矩陣X,學(xué)習(xí)數(shù)據(jù)字典B和圖像的流形稀疏編碼S,;其中,為采用流形稀疏編碼表示的第i張圖像特征;3)、使用K means聚類方法,采用歐式距離計算各個圖像之間的距離,預(yù)設(shè)圖像之間的距離閾值,將圖像之間距離小于預(yù)設(shè)的距離閾值的圖像聚為一類,使得圖像最終按類別進行顯示。2010105220372100001dest_path_image001.jpg,930538dest_path_image002.jpg,2010105220372100001dest_path_image003.jpg,723045dest_path_image004.jpg,2010105220372100001dest_path_image005.jpg,876684dest_path_image003.jpg,84942dest_path_image006.jpg,2010105220372100001dest_path_image007.jpg,273216dest_path_image008.jpg,2010105220372100001dest_path_image009.jpg
2.如權(quán)利要求1所述的基于流形稀疏編碼的圖像聚類的方法,其特征在于步驟1)中, 提取圖像的SIFT特征的方法包括以下步驟(1. 1)獲取一張目標(biāo)圖像,進行尺度空間極值檢測,即利用不同尺度的高斯差分方程同 目標(biāo)圖像進行卷積,求取尺度空間極值;(1. 2)精確定位特征點的位置,即通過擬合三維二次函數(shù)以精確確定各特征點的位置 和尺度(達到亞像素精度),同時去除低對比度的關(guān)鍵點和不穩(wěn)定的邊緣相應(yīng)點、以增強匹 配穩(wěn)定性、提高抗噪聲能力;(1. 3)確定特征點的主方向,即利用關(guān)鍵點領(lǐng)域像素的梯度方向分布特征為每個關(guān)鍵 點指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性; (1. 4)生成特征描述符,包括以下步驟 (1. 4. 1)將坐標(biāo)軸旋轉(zhuǎn)為特征點的方向,以保證旋轉(zhuǎn)不變性;(1. 4. 2)以特征點為中心取16X 16像素大小的窗口,但是特征點所在的行和列不取; (1.4.3)在每個4X4的圖像小塊上計算8個方向的梯度方向直方圖,繪制每個梯度方 向的累加值,形成一個種子點,每個特征點由4X4共16個種子點組成,每個種子點有8個 方向向量信息,可產(chǎn)生4X4X8共128個數(shù)據(jù),形成128維的SIFT特征向量,該SIFT特征 向量為特征描述符。
3.如權(quán)利要求2所述的基于流形稀疏編碼的圖像聚類的方法,其特征在于步驟2)中,利用數(shù)據(jù)矩陣X,通過求解目標(biāo)函數(shù)
全文摘要
基于流形稀疏編碼的圖像聚類的方法,包括獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣,獲取每張圖像中的SIFT特征;構(gòu)造一個數(shù)據(jù)字典B,利用數(shù)據(jù)矩陣X,學(xué)習(xí)數(shù)據(jù)字典B和圖像的流形稀疏編碼S;使用K-means聚類方法,采用歐式距離計算各個圖像之間的距離,預(yù)設(shè)圖像之間的距離閾值,將圖像之間距離小于預(yù)設(shè)的距離閾值的圖像聚為一類,使得圖像最終按類別進行顯示。本發(fā)明具有能提高圖像聚類性能的優(yōu)點。
文檔編號G06F17/30GK101986295SQ20101052203
公開日2011年3月16日 申請日期2010年10月28日 優(yōu)先權(quán)日2010年10月28日
發(fā)明者卜佳俊, 吳昊, 王燦, 鄭淼, 陳純 申請人:浙江大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
肥城市| 陆川县| 阿拉尔市| 九台市| 定兴县| 荆州市| 绥阳县| 明水县| 赤水市| 平江县| 延吉市| 府谷县| 西林县| 卓尼县| 浪卡子县| 曲沃县| 济阳县| 苍山县| 莫力| 寿宁县| 麦盖提县| 北碚区| 沙湾县| 马关县| 山丹县| 锦屏县| 石河子市| 万安县| 瓮安县| 成安县| 来凤县| 内黄县| 杭锦后旗| 平谷区| 广宗县| 河西区| 聊城市| 昌吉市| 汽车| 天长市| 红安县|