一種細胞有絲分裂檢測方法
【專利摘要】本發(fā)明公開了一種細胞有絲分裂檢測方法,包括以下步驟:圖像矩陣向量化;新矩陣的構(gòu)造;矩陣低秩分解;稀疏矩陣的每一列構(gòu)造新矩陣;矩陣求和;低秩分解過程迭代;矩陣與操作。本發(fā)明所公開的細胞有絲分裂檢測方法,將有絲分裂細胞看作低秩表示中的稀疏部分,非有絲分裂部分看作低秩部分,和已有的基于模式識別的檢測方法相比,不需要進行大量的預訓練,能夠非??焖俚牡玫綑z測結(jié)果,并且在相同的實驗條件下,能夠獲得更高的F-measure和Recall值。
【專利說明】—種細胞有絲分裂檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明公開了一種細胞有絲分裂檢測方法,涉及圖像信息處理【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]據(jù)國家癌癥中心和衛(wèi)生部疾病預防控制局公布的2009年乳腺癌發(fā)病數(shù)據(jù)顯示:全國腫瘤登記地區(qū)乳腺癌發(fā)病率位居女性惡性腫瘤的第I位,中國女性乳腺癌發(fā)病率在逐漸上升,目前已從五年前0.017%增加到去年0.052%,上升超過三倍。另據(jù)《2012中國腫瘤年報》顯示,目前我國腫瘤的發(fā)病率為285.91/10萬,平均每天每分鐘有6人被診斷為惡性腫瘤,乳腺癌在全國惡性腫瘤發(fā)病率中排名第6位,其發(fā)病率呈逐年上升的趨勢,并且發(fā)病年齡有年輕化的趨勢。乳腺癌已成為當前社會的重大公共衛(wèi)生問題。自20世紀90年代全球乳腺癌死亡率呈現(xiàn)出下降趨勢;究其原因,一是乳腺癌篩查工作的開展,使早期病例的比例增加;二是乳腺癌綜合治療的開展,提高了療效。乳腺癌已成為療效最佳的實體腫瘤之
O
[0003]圖1是病理醫(yī)生診斷乳腺癌的流程圖。在乳腺癌的診斷過程中,病理醫(yī)生首先從乳腺病變區(qū)域中提取組織樣本,提取的樣本被制作成組織切片。切片通常由H&E(Hematoxylin&Eosin)進行著色。H&E著色是病理學家廣泛使用的方法,距今已有一百多年的歷史,著色的目的是顯示細胞的成份,H著色使得細胞核呈現(xiàn)藍色,而E著色使得細胞質(zhì)和結(jié)締組織呈現(xiàn)粉紅色。隨后病理學家運用高倍顯微鏡來分析這些活組織切片并根據(jù)諾丁漢評分系統(tǒng)(Nottingham grading system)對乳腺癌進行病理分級。
[0004]諾丁漢評分系統(tǒng)是由世界衛(wèi)生組織推薦的乳腺癌國際評分系統(tǒng)。該系統(tǒng)綜合評價了 H&E著色切片的三種形態(tài)學特征:腺小管的構(gòu)成、細胞核的多形性以及有絲分裂的個數(shù)。病理醫(yī)生根據(jù)以上提到的三種形態(tài)學特征的良性和惡性程度給出1-3分的打分,最后三個分值的總和(在1-9分范圍內(nèi))便是該患者的諾丁漢評分系統(tǒng)的分值。醫(yī)生最后根據(jù)該分值的高低確定相應的治療方案。因此病理醫(yī)生對三種形態(tài)學特征的準確打分非常重要。
[0005]現(xiàn)有的基于數(shù)字病理切片計算機輔助自動分析方法主要集中在細胞核的檢測,也有部分腺小管的檢測結(jié)果。對乳腺癌評級而言,有絲分裂細胞的個數(shù)是一個重要的指標。因為它對腫瘤的擴散和侵略性進行了評估。在臨床實驗中,病理學家對H&E著色的切片在顯微鏡放大的情況下人工的計算有絲分裂的個數(shù),通常放大40倍。在40倍視角下的可見區(qū)域被稱為高能量區(qū)域(high power field, HPF)。當前的病理診斷都是基于病理學家的個人經(jīng)驗,對于同一個切片,不同的病理學家由于經(jīng)驗的差別等因素對病理圖像的人工分析具有差異性,即使是同一個病理學家在不同的時間段受疲勞程度以及心情好壞等的影響也會產(chǎn)生不同的診斷結(jié)果。針對這種情況,迫切需要一種基于圖像分析的自動化分析工具(如圖1中的虛線矩形框)來對數(shù)字病理學切片進行量化評估。這種量化的描述不僅能幫助臨床診斷(比如減少不同的觀察者或者同一個觀察者在不同時間段之間的診斷差異性),而且能夠幫助病理學家理解使用某種具體診斷方法的潛在原因。此外,還能幫助研究人員理解疾病產(chǎn)生的生物學機理。[0006]有絲分裂細胞的檢測是一個非常具有挑戰(zhàn)性的課題。一方面,對于研究者來說缺乏足夠多可利用的數(shù)據(jù);另一方面,有絲分裂細胞本身比較小并且形狀和紋理變化很大,因此很容易跟其他物體、甚至是切片獲取過程中引入的噪聲混淆。有絲分裂的四個主要階段為有絲分裂前期、中期、后期和末期。在不同的階段,細胞核的形狀變化非常大。在大多數(shù)階段,有絲分裂的細胞核和非有絲分裂的細胞核非常相似,或者是類似于其它深藍色的點,沒有經(jīng)過專業(yè)訓練的人很難區(qū)分它們。另一個復雜的問題是,在有絲分裂的末期,細胞核會分裂成兩個深藍色的斑點,即一個有絲分裂會有兩個不同的細胞核,但它們還不是完整意義上的單個細胞。一個有絲分裂的末期被認為是一個單一的有絲分裂,不能認為是兩個有絲分裂。
[0007]目前,只有少量關(guān)于有絲分裂自動檢測的工作。Belien等人考慮在福爾根(Feulgen)反應著色的乳腺癌區(qū)域計算有絲分裂的次數(shù)。Schlachter等人對突光反應(fluorescence)著色的結(jié)腸直腸癌進行有絲裂檢測。Roullier等人提出對免疫組化著色的乳腺癌切片進行有絲分裂細胞檢測,這種著色方法能夠突出具體的有絲分裂細胞,方便了檢測。最近,不少學者嘗試用模式識別的方法來對H&E著色的切片進行處理,以區(qū)分有絲分裂細胞和非有絲分裂細胞。Irshad等人利用形態(tài)學特征和紋理特征對每一個候選目標構(gòu)造一個143維的特征集,然后用決策樹分類器來對每一個目標進行分類;Tek等人結(jié)合常用的形狀特征和顏色特征來描述目標,然后用級聯(lián)的Adaboost對目標自動分類;這些方法對特征的選擇非常敏感。針對這種情況,Malon等人提出利用卷積神經(jīng)網(wǎng)絡(luò)的方法來自動獲取有效的特征表示,并將這些特征和手動設(shè)計的細胞核特征結(jié)合起來,卷積神經(jīng)網(wǎng)絡(luò)的使用從某種程度上來說減少了手動篩選樣本的敏感性。以上基于模式識別的方法第一步通常需要將組織病理圖像中的有絲分裂細胞和非有絲分裂細胞分割出來,然后再對每個分割塊進行特征提取。然而一個合適的分割定義非常難而且費時;另一方面,要訓練一個泛化能力較強的分類器,需要大量的訓練樣本,這對本來就稀少的數(shù)據(jù)來說具有很大的挑戰(zhàn)性。
【發(fā)明內(nèi)容】
[0008]本發(fā)明所要解決的技術(shù)問題是:針對現(xiàn)有技術(shù)的缺陷,提供一種細胞有絲分裂檢測方法,該方法不需要進行復雜的特征提取,不需要先對圖像進行分割,也不需要進行大量的預訓練,只需要簡單的灰度特征,使用起來非??焖俜奖恪?br>
[0009]本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案:
[0010]一種細胞有絲分裂檢測方法,具體包括以下步驟:
[0011]步驟1、用多光譜顯微鏡對有絲分裂中的細胞進行不同波段的掃描,并用不同的聚焦平面來數(shù)字化掃描得到的圖片,形成圖片矩陣;將掃描得到每幅圖片所對應的圖片矩陣分別用一個列向量來表示,該列向量的長度與原圖片矩陣大小相同;
[0012]步驟2、用步驟I產(chǎn)生的列向量構(gòu)造第一類矩陣,所述第一類矩陣的每一列分別按順序?qū)襟EI中產(chǎn)生的每一個列向量;
[0013]步驟3、對步驟2得到的第一類矩陣進行低秩分解,分解成大小相同的低秩矩陣和稀疏矩陣;
[0014]步驟4、將步驟3得到的稀疏矩陣的每一個列向量都分別轉(zhuǎn)化成相應的第二類矩陣;[0015]步驟5、對步驟4中得到的所有第二類矩陣求和,得到第三類矩陣;
[0016]步驟6、循環(huán)執(zhí)行步驟I至步驟5直到完成所有波段的數(shù)據(jù)處理,得到復數(shù)個大小相同的第三類矩陣;
[0017]步驟7、對步驟6中得到的復數(shù)個第三類矩陣進行與計算,得到最終的檢測結(jié)果,其中的非零部分即為有絲分裂部分。
[0018]作為本發(fā)明的進一步優(yōu)選方案,步驟I中將圖片矩陣轉(zhuǎn)化成列向量時,像素點的個數(shù)保持不變,大小為MXN的圖片應轉(zhuǎn)化成長度為MXN的列向量,其中M、N分別為自然數(shù)。
[0019]作為本發(fā)明的進一步優(yōu)選方案,步驟3中對矩陣進行低秩分解,所得到的低秩矩陣和稀疏矩陣其大小均與低秩分解前的原第一類矩陣的大小一致。
[0020]作為本發(fā)明的進一步優(yōu)選方案,步驟3中所述低秩分解的具體計算方法如下:
[0021]D = [I1,..., In] e Rmxn表示n個連續(xù)的細胞有絲分裂病理圖像,其中j ∈ n,Ij ∈ Rm表示第j幅圖像,每幅圖像由包含m個像素的列向量組成;矩陣D分解成低秩矩陣B e RmxIP低秩表示中的異常值S e {O, 1}mXn兩部分,B為背景圖像,代表非有絲分裂部分,S為前景圖像,代表有絲分裂細胞;
[0022]
【權(quán)利要求】
1.一種細胞有絲分裂檢測方法,其特征在于,具體包括以下步驟: 步驟1、用多光譜顯微鏡對有絲分裂中的細胞進行不同波段的掃描,并用不同的聚焦平面來數(shù)字化掃描得到的圖片,形成圖片矩陣;將掃描得到每幅圖片所對應的圖片矩陣分別用一個列向量來表示,該列向量的長度與原圖片矩陣大小相同; 步驟2、用步驟1產(chǎn)生的列向量構(gòu)造第一類矩陣,所述第一類矩陣的每一列分別按順序?qū)襟E1中產(chǎn)生的每一個列向量; 步驟3、對步驟2得到的第一類矩陣進行低秩分解,分解成大小相同的低秩矩陣和稀疏矩陣; 步驟4、將步驟3得到的稀疏矩陣的每一個列向量都分別轉(zhuǎn)化成相應的第二類矩陣; 步驟5、對步驟4中得到的所有第二類矩陣求和,得到第三類矩陣; 步驟6、循環(huán)執(zhí)行步驟I至步驟5直到完成所有波段的數(shù)據(jù)處理,得到復數(shù)個大小相同的第三類矩陣; 步驟7、對步驟6中得到的復數(shù)個第三類矩陣進行與計算,得到最終的檢測結(jié)果,其中的非零部分即為有絲分裂部分。
2.如權(quán)利要求1所述一種細胞有絲分裂檢測方法,其特征在于:步驟I中將圖片矩陣轉(zhuǎn)化成列向量時,像素點的個數(shù)保持不變,大小為MX N的圖片應轉(zhuǎn)化成長度為MX N的列向量,其中M、N分別為自然數(shù)。
3.如權(quán)利要求1所述一種細胞有絲分裂檢測方法,其特征在于:步驟3中對矩陣進行低秩分解,所得到的低秩矩陣和稀疏矩陣其大小均與低秩分解前的原第一類矩陣的大小一致。
4.如權(quán)利要求1所述一種細胞有絲分裂檢測方法,其特征在于:步驟3中所述低秩分解的具體計算方法如下: D = [I1,..., In] e Rmxn表示η個連續(xù)的細胞有絲分裂病理圖像,其中j e n, Ij e Rm表示第j幅圖像,每幅圖像由包含m個像素的列向量組成;矩陣D分解成低秩矩陣B e Rmxn和低秩表示中的異常值S e {O, l}mXn兩部分,B為背景圖像,代表非有絲分裂部分,S為前景圖像,代表有絲分裂細胞;
【文檔編號】G06K9/64GK103903015SQ201410105108
【公開日】2014年7月2日 申請日期:2014年3月20日 優(yōu)先權(quán)日:2014年3月20日
【發(fā)明者】徐軍, 劉雅 申請人:南京信息工程大學