两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于emd特征提取和稀疏表示的細胞分類方法

文檔序號:10725671閱讀:492來源:國知局
一種基于emd特征提取和稀疏表示的細胞分類方法
【專利摘要】一種基于EMD特征提取和稀疏表示的細胞分類方法,本方法采用了一種基于EMD的細胞特征提取方法。首先利用正交子空間投影OSP方法對醫(yī)學高光譜圖像進行波段選擇,降低維數(shù),減少數(shù)據(jù)冗余。然后用二維EMD方法對降維后的數(shù)據(jù)進行特征提取,將數(shù)據(jù)分解為一系列頻率由高到低排列的IMF分量。采用基于稀疏表示的分類器SRC對數(shù)據(jù)進行分類,通過比較殘差來對樣本分類,計算得到的殘差越小,則將該樣本歸為到這一類中。基于EMD特征提取和稀疏表示的細胞分類方法中,EMD表現(xiàn)出來很好的時頻特性,在高光譜數(shù)據(jù)特征提取上具有明顯的潛力和優(yōu)勢。同時利用基于稀疏表示的分類器SRC,更大大的保證了分類的精度。
【專利說明】
一種基于EMD特征提取和稀疏表示的細胞分類方法
技術領域
[0001] 本發(fā)明涉及一種基于EMD(經(jīng)驗模式分解)的細胞特征提取方法,并采用稀疏表示 的分類方法對其進行分類識別,屬于醫(yī)學高光譜分類識別領域。
【背景技術】
[0002] 傳統(tǒng)的醫(yī)學檢測方法是一系列的化學分析法,對組織切片進行染色,實驗過程復 雜,周期長,速度慢,強度大,誤差大,測量的可重復性差,通過人眼觀察實現(xiàn)癌細胞識別,受 實驗者的主觀影響很大,容易造成誤診。隨著成像技術的發(fā)展,醫(yī)學診斷也越來越依賴于成 像技術。成像形式包括核磁共振成像(MRI),計算機斷層掃描成像(CT),超聲波掃描術,核成 像技術等等。近年來,基于光學成像技術及模式識別的全自動、智能化組織切片中細胞分析 和診斷研究引起不少學者的重視。高光譜成像技術的快速發(fā)展也使其迅速成為醫(yī)學成像的 一員?;诟吖庾V成像技術以及模式識別的發(fā)展,逐漸走入人們的視線,為實時醫(yī)療成像進 行快速診斷提供了可能。相較傳統(tǒng)的醫(yī)療診斷方法,能夠擺脫繁瑣的前期數(shù)據(jù)的處理,包括 對細胞染色,對獲得的樣本進行離心操作獲取分離其他成分等等操作,從而擺脫實驗者的 主觀因素快速準確的對病情進行判斷。近年來,高光譜成像技術與生物醫(yī)學顯微鏡結合而 成的高光譜顯微技術成為最受人們關注的一種醫(yī)學成像技術。它可近距離對生物醫(yī)學切片 進行成像,并同時獲得觀測對象的圖像維信息和光譜維信息。傳統(tǒng)的醫(yī)學治療都是通過醫(yī) 生用肉眼觀察醫(yī)學影像上的病變區(qū)域形態(tài),而每天都會產(chǎn)生很多醫(yī)學影像,既耗費時間而 且精確度不高。
[0003] 相比傳統(tǒng)的纖維成像方式,高光譜成像技術可提供更豐富的信息進行病理分析, 輔助醫(yī)學研究人員從更加全面的角度對組織器官和細胞切片進行研究分析。本發(fā)明公開了 一種快速識別匹配病變細胞的方法,通過對醫(yī)學圖像的特征提取來壓縮信息,從而對血細 胞進行分類找出病變細胞。移動醫(yī)療的快速發(fā)展要求能快速精確地進行血液檢查,從而能 有效實現(xiàn)疾病的早期發(fā)現(xiàn)和病因判斷。本發(fā)明完成一套自動進行血細胞識別的方法,利用 不同血細胞的透射和吸收光譜特性對其進行自動分類識別,能有效提高細胞識別速度和精 度,并能迅速發(fā)現(xiàn)異常細胞,將能為臨床的精確輔助診斷和快速病源發(fā)現(xiàn)提供良好的技術 支持。
[0004] 高光譜圖像一個主要特點是波段數(shù)多,波段間具有很強的相關性,所以各波段圖 像所提供的信息常常有重疊。為了消除冗余信息、減少數(shù)據(jù)量和計算時間,需要對高光譜圖 像進行特征提取。EMD能將信號分解成有限個本征模函數(shù)aMF)和一個殘差信號。EMD表現(xiàn)出 來很好的時頻特性,在高光譜數(shù)據(jù)特征提取上具有明顯的潛力和優(yōu)勢。

【發(fā)明內容】

[0005] 本發(fā)明的目的在于是通過學習相關技術基礎,完成一套醫(yī)學顯微圖像的人體血細 胞快速識別系統(tǒng)。移動醫(yī)療的快速發(fā)展要求能快速精確地進行血液檢查,從而能有效實現(xiàn) 疾病的早期發(fā)現(xiàn)和病因判斷。要求完成一套自動進行血細胞識別的方法,利用不同血細胞 的透射和吸收光譜特性對其進行自動分類識別,能有效提高細胞識別速度和精度,并能迅 速發(fā)現(xiàn)異常細胞,將能為臨床的精確輔助診斷和快速病源發(fā)現(xiàn)提供良好的技術支持。
[0006] 高光譜成像在生物醫(yī)學可視化方面是一種新技術,與生物醫(yī)學顯微鏡相結合而產(chǎn) 生的高光譜顯微技術在國際上已經(jīng)被成功的應用于醫(yī)學領域。高光譜可以對被攝物體在紫 外、可見光、近紅外、甚至中紅外波段等寬譜段范圍進行成像,光譜分辨率能達到納米級。細 胞的病變會引起細胞組分如蛋白質、核酸、糖和水分等在含量、構型等方面的變化,由此引 起光譜曲線在波形、峰強、波長等方面的改變。
[0007] 醫(yī)院每天要產(chǎn)生上千萬甚至更多的醫(yī)學影像,而高光譜圖像存在著很大的空間相 關性,產(chǎn)生很多冗余信息。為了節(jié)省運算時間和提高計算精度,因此先對醫(yī)學血細胞高光譜 圖像進行波段選擇來減少數(shù)據(jù)量,降維后再對其進行EMD特征提取,然后用稀疏表示的方法 對血細胞進行分類。
[0008] 本發(fā)明采用的技術方案為一種基于EMD特征提取和稀疏表示的細胞分類方法,該 方法的實現(xiàn)過程如下:
[0009] S1對醫(yī)學血細胞的高光譜數(shù)據(jù)用0SP(正交子空間投影)進行波段選擇。從血細胞 圖像所有波段中選擇起主要作用的波段子集,剔除部分高冗余的波段。不僅能大大降低醫(yī) 學血細胞圖像的數(shù)據(jù)維數(shù),而且能比較完整地保留有用的信息,提高分類精度。
[0010] S2采用EMD分解的方法提取血細胞高光譜圖像特征。EMD能夠自適應地從高頻到低 頻提取信號的本質特征,EMD對血細胞的高光譜圖像進行分解,通過多次的篩分過程,一方 面消除信號中的騎波,另一方面平滑高低不平的振幅,得到一系列的從高頻到低頻的IMF, 然后從IMF中提取合適的特征,進行分類。
[0011] S3利用SRC分類器進行分類。SRC用訓練樣本稀疏線性地表示測試樣本,并根據(jù)類 別線性重構誤差最小化分類。
[0012] 本發(fā)明的流程圖如圖1所示,實施步驟如下:
[0013] 步驟1、血細胞的高光譜數(shù)據(jù)量大,但是各波段間往往具有相關性,這造成數(shù)據(jù)的 冗余,也就是常說的維數(shù)災難。為了提高運算精度和節(jié)省運算時間先對數(shù)據(jù)用0SP方法對血 細胞數(shù)據(jù)進行波段選擇。波段選擇的原則是:信息含量多、相關性小、光譜差異大、可分性好 的波段就是應該選擇的最佳波段。
[0014] 具體算法如下:定義也和出是血細胞光譜數(shù)據(jù)Φ中的兩個波段,每個波段有N個像 素點。用也和出來估算第三個波段B。為了找到一個波段使它和也和出最不相似,一個關于也 和出的正交子空間P被構造為:
[0015] P = I-Z(ZTZ)_1ZT
[0016] 式中,I是一個Ν階單位矩陣,Ζ是一個ΝΧ2矩陣,Ζ的第一列包含m的所有像素,Ζ的 第二列包含B2的所有像素。
[0017]計算出yQ = PTy,y包含B的所有像素,刊是出和出的正交子空間中的B的分量。產(chǎn)生最 大正交分量I |y〇| I的波段被認為是與出和出最不像似的波段,被選為B3。
[0018]步驟2、利用EMD方法進行特征描述,提取血細胞的特征。
[0019] EMD經(jīng)驗模式分解將復雜的信號分解為適宜于Hilbert變換的MF函數(shù)分量,由于 本征模函數(shù)IMF的本質是信號在不同頻率范圍內原信號的本質特征,原信號噪聲的集合表 示為殘差形式,所以提取信號的本質特征通過保留每個IMF分量和丟棄殘余量來實現(xiàn),IMF 必須滿足下列基本條件:
[0020] 1)整個信號長度上的極大值點數(shù)、極小值點數(shù)與過零點的數(shù)目相等或相差為1。
[0021] 2)在任意時刻,由包絡線定義的極大值和極小值的平均值為0。
[0022]第一個條件很明顯,它和傳統(tǒng)的窄帶的穩(wěn)定高斯過程的要求一樣;第二個條件是 必要的,以此保證瞬時頻率不會出現(xiàn)不期望的波動而誘導不對稱的波形。EMD分解實質是對 一個時間序列信號進行平穩(wěn)化的處理過程,它將信號分解為一系列頻率由高到低排列的 IMF分量和一個余量之和,IMF的獲得是一個不斷循環(huán)迭代的過程,最后篩選出滿足條件的 IMF。該過程不斷的從大尺度信號中剔除均值包絡線,直到滿足停止條件,篩選結束。對一個 信號S(t)進行EMD分解的具體步驟如下:
[0023] (1)外部初始化,令血細胞圖像為
[0024] r〇(m,n) = f (m,n), j = 1
[0025] (2)提取第j個IMF函數(shù):
[0026] a)內部初始化
[0027] hj,o(m,n) =rj-i(m,n) ,k = l;
[0028] b)利用形態(tài)學算法或8鄰域像素,找出中的局部極大值和局部極小值點 集;
[0029] c)使用合適的二維曲面插值方法,分別對極大值點和極小值點進行包絡擬合,插 值計算出hj,k-i(m,n)的上包絡面Umax,k-i(m,n)和下包絡面Umin,k-i(m,n);
[0030] d)確定上下包絡的均值:
[0031] meank-1 (m,η) = [ Umax, k-1 (m,n) +Umin,k-1 (m,η) ] /2;
[0032] e)從圖像中減去均值,得到:
[0033] hj,k(m,n) =hj,k-i(m,n)_meank-i(m,n)
[0034] f)計算終止條件,若滿足頂F條件則有
[0035] cj(m,n) =hj,k(m,n)
[0036] 否則令k = k+l,轉到步驟b
[0037] (3)求殘余量
[0038] rj(m,n) = rj-i(m,n)-cj(m,n)
[0039] 若^中仍有不少于兩個的極值點或者分解所得的頂F數(shù)目未達到要求,則將^看做 新的數(shù)據(jù),并繼續(xù)從步驟2進行分解,j = j+1
[0040] (4)最后得到的二維EMD分解的結果是:
[0041 ] cj (m, η) + r^(m, β)
[0042] 二維EMD中頂F篩選停止的SD計算公式如下:
[0044] 二維EMD的標準偏差SD的閾值η的經(jīng)驗值通常設在〇. 1-0.3之間。
[0045] 步驟3、將血細胞光譜數(shù)據(jù)貼好標簽后,選取部分數(shù)據(jù)作為訓練數(shù)據(jù),所有數(shù)據(jù)作 為測試數(shù)據(jù),利用SRC分類器對細胞進行分類。SRC的算法如下:
[0046] SRC算法可用較少的數(shù)據(jù)捕獲感興趣目標的重要信息,即在樣本數(shù)充足的情況下, 每一類訓練樣本數(shù)據(jù)張成一個完備子空間,當該類樣本中其他數(shù)據(jù)輸入時,由該完備空間 的數(shù)據(jù)線性表示出來。SRC對數(shù)據(jù)缺損不敏感,當所求系數(shù)足夠稀疏時,特征空間的選取變 得不再重要;這些優(yōu)勢使得SRC成為一種非常優(yōu)秀的分類算法。
[0047] 其主要思想是:對給定的訓練樣本集的每個字典原子進行歸一化。其次求解最小 li-范數(shù)問題:ai = argamin| |α| Ιι,其中α滿足y = Aa或| |y-Aa| h彡ε,ε>〇是一個可選誤差。 然后對測試樣本計算每一類的殘差
[0048] r/(y) =11 y - Αδ^α^ \\{
[0049] i = l,2,3,……,c,c為對象類;式中Si(ai)s為特征函數(shù),該特征函數(shù)的元素選擇與 〇1中第:1類相關的系數(shù)。最后對7進行分類:1(7)=3坪^1^11;1^(7),這里1(7)表示估計7的類別 標簽。
[0051 ]與現(xiàn)有技術相比,本發(fā)明具有如下優(yōu)點:
[0052] 1)高光譜顯微成像能同時進行區(qū)域成像和光譜成像,為組織切片細胞識別提供了 一種新的技術方法;
[0053] 2)利用不同細胞的透射和吸收光譜特性對其進行自動分類識別,快速發(fā)現(xiàn)異常細 胞,提尚癌癥確診的準確性與特異性;
[0054] 3)基于高光譜顯微圖像進行自動化高精度的細胞識別,將能為臨床的精確輔助診 斷和快速病源發(fā)現(xiàn)提供良好的技術支持,對提高人口健康水平及人民生活質量具有重要意 義。
[0055] 4)不同于傳統(tǒng)的特征提取方法,EMD能將信號分解成有限個本征模函數(shù)aMF)和一 個殘差信號。EMD表現(xiàn)出來很好的時頻特性,在血細胞高光譜數(shù)據(jù)特征提取上具有明顯的潛 力和優(yōu)勢。本發(fā)明的具體創(chuàng)新點在于將EMD特征提取方法應用在醫(yī)學高光譜圖像上,利用不 同血細胞的透射和吸收光譜特性對其進行自動分類識別,能有效提高細胞識別速度和精 度,并能迅速發(fā)現(xiàn)異常細胞。同時利用基于稀疏表示的分類器SRC,更大大的保證了分類的 精度。
【附圖說明】
[0056] 圖1為本發(fā)明具體流程圖
【具體實施方式】
[0057] 本發(fā)明的基于EMD特征提取和稀疏表示進行細胞分類方法的基本流程如圖1所示, 具體包括以下步驟:
[0058] 1)首先將血細胞數(shù)據(jù)進行歸一化處理,然后存儲數(shù)據(jù)和相應的標簽。
[0059] 2)由于血細胞光譜波段數(shù)眾多,而且各波段間存在空間相關性,如果全部波段都 利用會產(chǎn)生冗余信息,加大計算上的時間開銷。為了減少EMD特征提取的數(shù)據(jù)量并且提高運 算時間,先對血細胞數(shù)據(jù)進行波段選擇。實驗中選擇的血細胞數(shù)據(jù)大小為462X451X33。所 以從33個波段中選擇5個波段,分別是第25、33、20、30和32波段。選擇出來的波段具有信息 含量多、相關性小、光譜差異大、可分性好等優(yōu)點。
[0060] 3)對這5個波段的血細胞數(shù)據(jù)進行EMD特征提取。找出圖像數(shù)據(jù)中的局部極大值點 和局部極小值點。每一個波段的血細胞數(shù)據(jù)都是一個二維圖像信號,設它的中心像素灰度 值為f(i,j),其鄰域中任一像素灰度值為f(m,η),采用8鄰域點與中心像素灰度值比較的方 法,灰度值比相鄰8像素點都高或低的點數(shù)就是圖像的極大或極小值點。如果f(i,j)>f(m, η)都成立,并且m辛i,n辛j,則(i,j)位置處像素點為一個局部極大值點;如果f (i,j)〈f (m, n)都成立,并且m辛i,n辛j,則(i,j)位置處像素點為一個局部極小值點;如果f (i,j)>f (m, n)對于某些鄰域位置點成立,而汽1,」)〈以111,11)對于另一些鄰域位置點成立,則(1,」)位置 處像素點既不是極大值點也不是極小值點;此方法找到的二維血細胞圖像極值點更為精 確。再對得到的極大值和極小值點集做三次樣條插值進行包絡擬合,得到上下包絡。確定上 下包絡均值,從原圖像中減去均值,根據(jù)MF條件判斷是否符合條件,得到的第一個頂F分量 代表原始血細胞數(shù)據(jù)序列中最高頻的組成部分。將原始血細胞數(shù)據(jù)序列f(x,y)減去第一個 分量ci(x,y),得到一個去掉高頻組成成分的差值數(shù)據(jù)序列ri(x,y)。對rj(x,y)進行上述平 穩(wěn)化處理過程得到第二個MF分量 C2(x,y),如此重復下去直至最后一個差值序列不可再被 分解或達到了要求的MF個數(shù)。本發(fā)明中終止條件中的參數(shù)τι選擇為0.1。醫(yī)學血細胞高光譜 數(shù)據(jù)經(jīng)過二維EMD分解得到5個頂F函數(shù)。將EMD分解后的數(shù)據(jù)存儲起來。
[0061] 4)經(jīng)過波段選擇后留下5個波段,每個波段分解5個MF函數(shù)。對這25維數(shù)據(jù)用SRC 分類器進行分類。生成一個1-N個整數(shù)隨機分布的隨機序列,將所有樣本隨機排列,取前100 個樣本作為訓練樣本,并且將所有樣本都作為測試樣本。計算當訓練樣本X足夠稀疏時,求 解& = argmin || X IU;重構測試樣本fi: = Αδ?^);根據(jù)y與務之間的最小逼近殘差來對樣本 進行歸類,并計算分類精確度。λ分別選取16-6、1 6-5、16-4、16-3、16-2、16-1和1。然后分別 計算出各參數(shù)下分類的精度,選出具有最高精度的參數(shù)。
[0062] 本發(fā)明能夠準確的將細胞進行分類。
【主權項】
1. 一種基于EMD特征提取和稀疏表示的細胞分類方法,SI對醫(yī)學血細胞的高光譜數(shù)據(jù) 用OSP進行波段選擇;從血細胞圖像所有波段中選擇起主要作用的波段子集,剔除部分高冗 余的波段;不僅能大大降低醫(yī)學血細胞圖像的數(shù)據(jù)維數(shù),而且能比較完整地保留有用的信 息,提高分類精度; S2采用EMD分解的方法提取血細胞高光譜圖像特征;EMD能夠自適應地從高頻到低頻提 取信號的本質特征,EMD對血細胞的高光譜圖像進行分解,通過多次的篩分過程,一方面消 除信號中的騎波,另一方面平滑高低不平的振幅,得到一系列的從高頻到低頻的IMF,然后 從IMF中提取合適的特征,進行分類; S3利用SRC分類器進行分類;SRC用訓練樣本稀疏線性地表示測試樣本,并根據(jù)類別線 性重構誤差最小化分類; 其特征在于:該方法的實施步驟如下, 步驟1、血細胞的高光譜數(shù)據(jù)量大,但是各波段間往往具有相關性,運造成數(shù)據(jù)的冗余, 也就是常說的維數(shù)災難;為了提高運算精度和節(jié)省運算時間先對數(shù)據(jù)用OSP方法對血細胞 數(shù)據(jù)進行波段選擇;波段選擇的原則是:信息含量多、相關性小、光譜差異大、可分性好的波 段就是應該選擇的最佳波段; 具體算法如下:定義Bi和B2是血細胞光譜數(shù)據(jù)Φ中的兩個波段,每個波段有N個像素點; 用Bi和B2來估算第Ξ個波段B;為了找到一個波段使它和Bi和B2最不相似,一個關于Bi和B2的 正交子空間P被構造為: P=I-Z(Z^)"V 式中,I是一個N階單位矩陣,Z是一個NX 2矩陣,Z的第一列包含Bi的所有像素,Z的第二 列包含B2的所有像素; 計算出y〇 = pTy,y包含B的所有像素,yo是Bi和B2的正交子空間中的B的分量;產(chǎn)生最大正 交分量llyoll的波段被認為是與Bi和化最不像似的波段,被選為B3; 步驟2、利用EMD方法進行特征描述,提取血細胞的特征; EMD經(jīng)驗模式分解將復雜的信號分解為適宜于化化ert變換的IMF函數(shù)分量,由于本征 模函數(shù)IMF的本質是信號在不同頻率范圍內原信號的本質特征,原信號噪聲的集合表示為 殘差形式,所W提取信號的本質特征通過保留每個IMF分量和丟棄殘余量來實現(xiàn),IMF必須 滿足下列基本條件: 1) 整個信號長度上的極大值點數(shù)、極小值點數(shù)與過零點的數(shù)目相等或相差為1; 2) 在任意時刻,由包絡線定義的極大值和極小值的平均值為0; 第一個條件很明顯,它和傳統(tǒng)的窄帶的穩(wěn)定高斯過程的要求一樣;第二個條件是必要 的,W此保證瞬時頻率不會出現(xiàn)不期望的波動而誘導不對稱的波形;EMD分解實質是對一個 時間序列信號進行平穩(wěn)化的處理過程,它將信號分解為一系列頻率由高到低排列的IMF分 量和一個余量之和,IMF的獲得是一個不斷循環(huán)迭代的過程,最后篩選出滿足條件的IMF;該 過程不斷的從大尺度信號中剔除均值包絡線,直到滿足停止條件,篩選結束;對一個信號S (t)進行EMD分解的具體步驟如下: (1) 外部初始化,令血細胞圖像為 r〇(m,n)=f(m,n),j = l (2) 提取第j個IMF函數(shù): a) 內部初始化 hj,〇(m,n)=rj-i(m,n) ,k=l; b) 利用形態(tài)學算法或8鄰域像素,找出h川-i(m,n)中的局部極大值和局部極小值點集; C)使用合適的二維曲面插值方法,分別對極大值點和極小值點進行包絡擬合,插值計 算出hj,k-i(m,η)的上包絡面Umax,k-i(m,η)和下包絡面Umin,k-i(m,η); d) 確定上下包絡的均值: meank-i (m, η) = [Umax, k-i (m, η) +Umin, k-i (m, η) ] /2; e) 從圖像中減去均值,得到: hj,k(m,n)=hj,k-i(m,n)-meank-i(m,n) f) 計算終止條件,若滿足IMF條件則有 cj(m,n)=hj,k(m,n) 否則令k = k+l,轉到步驟b (3) 求殘余量 rj(m,n)=rj-i(m,n)-cj(m,n) 若η中仍有不少于兩個的極值點或者分解所得的IMF數(shù)目未達到要求, 則將η看做新的數(shù)據(jù),并繼續(xù)從步驟2進行分解,j = j+1 (4) 最后得到的二維EMD分解的結果是:二維EMD中IMF篩選停止的S的十算公式如下:二維EMD的標準偏差SD的闊值η的經(jīng)驗值通常設在0.1-0.3之間; 步驟3、將血細胞光譜數(shù)據(jù)貼好標簽后,選取部分數(shù)據(jù)作為訓練數(shù)據(jù),所有數(shù)據(jù)作為測 試數(shù)據(jù),利用SRC分類器對細胞進行分類;SRC的算法如下: SRC算法可用較少的數(shù)據(jù)捕獲感興趣目標的重要信息,即在樣本數(shù)充足的情況下,每一 類訓練樣本數(shù)據(jù)張成一個完備子空間,當該類樣本中其他數(shù)據(jù)輸入時,由該完備空間的數(shù) 據(jù)線性表示出來;SRC對數(shù)據(jù)缺損不敏感,當所求系數(shù)足夠稀疏時,特征空間的選取變得不 再重要;運些優(yōu)勢使得SRC成為一種非常優(yōu)秀的分類算法; 其主要思想是:對給定的訓練樣本集的每個字典原子進行歸一化;其次求解最小h-范 數(shù)問題:ai = argamin| |α| li,其中曰滿足y = Aa或I |y-Aa| |2《ε,ε>〇是一個可選誤差;然后 對測試樣本計算每一類的殘差 ?7(y) =11 y--45,(a〇 W'i i = l,2,3,……,c,c為對象類;式中Si(αι)s為特征函數(shù),該特征函數(shù)的元素選擇與αι中 第i類相關的系數(shù);最后對y進行分類:I(y)=argimin;Ti(y),運里I(y)表示估計y的類別標 簽;2.根據(jù)權利要求1所述的一種基于EMD特征提取和稀疏表示的細胞分類方法,其特征在 于: 本方法具體包括W下步驟, 1) 首先將血細胞數(shù)據(jù)進行歸一化處理,然后存儲數(shù)據(jù)和相應的標簽; 2) 由于血細胞光譜波段數(shù)眾多,而且各波段間存在空間相關性,如果全部波段都利用 會產(chǎn)生冗余信息,加大計算上的時間開銷;為了減少EMD特征提取的數(shù)據(jù)量并且提高運算時 間,先對血細胞數(shù)據(jù)進行波段選擇;實驗中選擇的血細胞數(shù)據(jù)大小為462 X 451 X 33;所W從 33個波段中選擇5個波段,分別是第25、33、20、30和32波段; 3) 對運5個波段的血細胞數(shù)據(jù)進行EMD特征提取;找出圖像數(shù)據(jù)中的局部極大值點和局 部極小值點;每一個波段的血細胞數(shù)據(jù)都是一個二維圖像信號,設它的中屯、像素灰度值為f (i J),其鄰域中任一像素灰度值為f(m,n),采用8鄰域點與中屯、像素灰度值比較的方法,灰 度值比相鄰8像素點都高或低的點數(shù)就是圖像的極大或極小值點;如果f(i,j) 乂 (m,n)都成 立,并且m聲i,n聲j,則(i,j)位置處像素點為一個局部極大值點;如果f(i,j)<f(m,n)都成 立,并且m聲i,n聲j,則(i,j)位置處像素點為一個局部極小值點;如果f(i,j) 乂 (m,n)對于 某些鄰域位置點成立,而f(i,j)<f(m,n)對于另一些鄰域位置點成立,則(i,j)位置處像素 點既不是極大值點也不是極小值點;此方法找到的二維血細胞圖像極值點更為精確;再對 得到的極大值和極小值點集做Ξ次樣條插值進行包絡擬合,得到上下包絡;確定上下包絡 均值,從原圖像中減去均值,根據(jù)IMF條件判斷是否符合條件,得到的第一個IMF分量代表原 始血細胞數(shù)據(jù)序列中最高頻的組成部分;將原始血細胞數(shù)據(jù)序列f(x,y)減去第一個分量C1 ^,7),得到一個去掉高頻組成成分的差值數(shù)據(jù)序列^^,7);對^^,7)進行上述平穩(wěn)化處 理過程得到第二個IMF分量C2(x,y),如此重復下去直至最后一個差值序列不可再被分解或 達到了要求的IMF個數(shù);本發(fā)明中終止條件中的參數(shù)η選擇為0.1;醫(yī)學血細胞高光譜數(shù)據(jù)經(jīng) 過二維EMD分解得到5個IMF函數(shù);將EMD分解后的數(shù)據(jù)存儲起來; 4) 經(jīng)過波段選擇后留下5個波段,每個波段分解5個IMF函數(shù);對運25維數(shù)據(jù)用SRC分類 器進行分類;生成一個1-N個整數(shù)隨機分布的隨機序列,將所有樣本隨機排列,取前100個樣 本作為訓練樣本,并且將所有樣本都作為測試樣本;計算當訓練樣本X足夠稀疏時,求解 每二argmin II X 111謹構測試樣本扔=ASi巧1);根據(jù)y與薪之間的最小逼近殘差來對樣本進 行歸類,并計算分類精確度;λ分別選取16-6、16-5、16-4、16-3、16-2、1日-1和1;然后分別計 算出各參數(shù)下分類的精度,選出具有最高精度的參數(shù)。
【文檔編號】G06K9/46GK106096571SQ201610461512
【公開日】2016年11月9日
【申請日】2016年6月22日
【發(fā)明人】李偉, 張秋實
【申請人】北京化工大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
公主岭市| 新干县| 张家口市| 屯留县| 通榆县| 来宾市| 滦平县| 如皋市| 湟中县| 烟台市| 顺义区| 高密市| 思南县| 苏州市| 山西省| 彭水| 沅陵县| 西盟| 栖霞市| 永州市| 鸡东县| 武平县| 大同县| 牡丹江市| 临澧县| 榕江县| 兰州市| 台山市| 永登县| 东城区| 富蕴县| 永顺县| 龙门县| 剑阁县| 灯塔市| 延吉市| 建湖县| 潢川县| 甘德县| 丽江市| 芒康县|