本發(fā)明涉及一種色譜分析技術(shù),特別涉及一種從凝膠電泳條帶圖像中獲取DNA色譜的方法。
背景技術(shù):
平板凝膠電泳由于其在DNA片段的分離上有著較好效果,因此一直是色譜分析領(lǐng)域的一個重要手段。目前大多數(shù)的平板凝膠電泳均要人為地進行定性分析,當DNA片段數(shù)量較多時,這種識別方法的效率會降低。
對于傳統(tǒng)的平板凝膠電泳,由于其采集圖像時是處于暗室中,且使用的相機成像質(zhì)量也較高,所以采集到的圖像噪聲小,清晰度高,但是這樣的裝置成本較高,不利于其推廣使用;對于新型的平板凝膠電泳來說,利用手機來取代相機拍攝已經(jīng)成為一種趨勢,然而手機相機像素低,焦距短,成像電路較為簡單,導(dǎo)致圖片成像質(zhì)量不高且存在較大噪聲。
常規(guī)的圖像處理算法在處理噪聲時,會人為地添加一個閾值來進行濾波,這種方法在成像裝置固定的情況下較為實用,然而在用手機拍照時,由于有較多的隨機性因素,其圖像的噪聲分布往往會有較大差別,此時若仍然使用人工設(shè)定法來確定閾值,其濾波效果往往并不理想。
技術(shù)實現(xiàn)要素:
本發(fā)明是針對凝膠電泳定性分析存在的問題,提出了一種從凝膠電泳條帶圖像中獲取DNA色譜的方法,該方法利用數(shù)字圖像處理算法,可自行計算灰度圖像的最佳閾值,實現(xiàn)凝膠條帶的自動檢測。能取代人工對實驗結(jié)果的定性分析,并且能適應(yīng)高噪聲圖像(手機圖像),以實現(xiàn)較快較好的色譜分析。
本發(fā)明的技術(shù)方案為:一種從凝膠電泳條帶圖像中獲取DNA色譜的方法,具體包括如下步驟:
1)用手機或相機采集凝膠電泳圖像,采集的數(shù)字圖像送入圖像處理算法中;
2)利用加權(quán)法將采集的真彩圖轉(zhuǎn)換為灰度圖像;
3)使用迭代法求灰度圖像的最佳閾值TN;
4)利用步驟3)所得最佳閾值TN對步驟2)的灰度圖像進行一次濾波,增強圖像對比度;
5)平行于凝膠條帶的方向上提取步驟4)處理后灰度圖像的梯度信息,作為特征;
6)利用步驟5)所得灰度圖像的梯度信息對步驟4)一次濾波后的灰度圖像進行圖像分割,即對圖像進行二次濾波;
7)顯示結(jié)果:對步驟6)二次濾波后圖像,于平行凝膠電泳條帶方向上,分別將各像素點的灰度級進行累加,并將累加后的數(shù)據(jù)進行平滑濾波處理,最終以曲線圖形式作出“凝膠電泳DNA色譜圖”;在“凝膠電泳DNA色譜圖”上利用角點檢測算法獲取各個峰值點的位置,用最小二乘法擬合出“DNA片段大小—遷移位置”關(guān)系圖。
所述步驟3)迭代法具體步驟:設(shè)置一個初始閾值T0,T0為灰度圖像的最大灰度級與最小灰度級的平均值,然后遍歷整幅灰度圖像,利用T0將圖像的灰度級劃分為大于T0和小于T0的兩組數(shù)據(jù),記作數(shù)據(jù)集A0和B0,再求出數(shù)據(jù)集A0和B0的平均值,記為MA0,MB0, 將MA0,MB0的平均值(MA0+MB0)/2作為閾值T1;同理,利用T1將圖像的灰度級劃分為大于T1和小于T1的兩組數(shù)據(jù),記作數(shù)據(jù)集A1和B1,再求出數(shù)據(jù)集A1和B1的平均值,記為MA1,MB1,將MA1,MB1的平均值(MA1+MB1)/2作為閾值T2,以此類推,計算出T3,T4,……,TN,當滿足條件|TN-T(N-1)|<0.1時,即可求出最佳閾值TN。
所述步驟4)利用步驟3)所得最佳閾值TN對步驟2)的灰度圖像進行一次濾波,即設(shè)步驟2)的灰度圖像數(shù)據(jù)為G,其最大灰度級為M,則增強后的灰度圖像數(shù)據(jù)為nG=255*(G-TN)/(M-TN),使其灰度分布從[TN,M]重新分布到[0,255]區(qū)間。
所述步驟5)平行于凝膠條帶的方向上提取步驟4)處理后灰度圖像的梯度信息,具體步驟:將平行于凝膠電泳條帶方向上的數(shù)據(jù)進行提取,并對數(shù)據(jù)進行一次求導(dǎo),即后一個像素點的灰度級減去前一個像素點的灰度級,依次類推,最終獲得平行于條帶方向上的像素梯度信息,取絕對值后記錄至數(shù)據(jù)集D中,設(shè)步驟2)所得的灰度圖像的分辨率為m*n,則數(shù)據(jù)集D的分辨率為m*(n-1)。
所述步驟6)圖像分割具體步驟為:先找出數(shù)據(jù)集D中的最大值記為Dmax,利用公式:D1=D/Dmax將數(shù)據(jù)集D作歸一化處理;從步驟2)所得的灰度圖像中取m*(n-1)個像素點的數(shù)據(jù),記為G1,然后依次遍歷數(shù)據(jù)集G1與數(shù)據(jù)集D中的數(shù)據(jù),并將二者作點乘算,得到分割后的圖像數(shù)據(jù)Ge。
本發(fā)明的有益效果在于:本發(fā)明從凝膠電泳條帶圖像中獲取DNA色譜的方法,整個圖像處理過程自動完成,用計算機來代替人工操作,并大大縮短了分析時間與工作量,使其最終結(jié)果更為直觀,準確。適用于傳統(tǒng)的凝膠電泳成像系統(tǒng),可將其實驗結(jié)果自動進行數(shù)據(jù)化處理;另外,對于新型的凝膠電泳成像裝置(如手機拍照)的缺點,如其像素低,焦距短,成像質(zhì)量不高等,本發(fā)明方法也表現(xiàn)出較好的處理能力。
附圖說明
圖1為本發(fā)明凝膠電泳條帶中獲取DNA色譜的方法流程圖;
圖2為本發(fā)明方法處理實例的各階段效果圖;
圖3為本發(fā)明方法處理具體實例 “凝膠電泳DNA色譜圖”;
圖4為本發(fā)明方法處理具體實例“DNA片段大小—遷移位置關(guān)系圖”。
具體實施方式
本發(fā)明方法的能夠自動計算灰度圖像的最佳閾值并且能夠準確提取圖像增強后的像素梯度信息。通過不斷地迭代計算使得相鄰閾值之差收斂并趨向于0,通過提取灰度圖像的像素梯度作為特征信息,最后通過識別信息作 “凝膠電泳DNA色譜圖”以及“DNA片段大小—遷移位置關(guān)系圖”。
如圖1所示凝膠電泳條帶中獲取DNA色譜的方法流程圖,本方法的流程分為7個步驟。其中,步驟2,3,4,5,6構(gòu)成了本發(fā)明關(guān)鍵的圖像特征自動識別的過程。下面對7個步驟分別加以簡要說明:
1、凝膠電泳圖像的采集:實驗人員主要利用手機進行拍照,并將采集到的數(shù)字圖像送入圖像處理算法中。
2、 真彩圖轉(zhuǎn)灰度圖:加權(quán)法轉(zhuǎn)換,分別為真彩圖的紅色分量R,綠色分量G,以及藍色分量B設(shè)置加權(quán)系數(shù)分別為a,b,c,利用加權(quán)法將真彩圖轉(zhuǎn)換為灰度圖像,其中a,b,c的取值范圍為[0,1]且滿足a+b+c=1,然后進行圖像處理。
3、迭代法求閾值:迭代法是基于逼近的思想,不斷地調(diào)整閾值的大小直至相鄰兩個閾值近乎相等,自動計算圖像的最佳閾值。
設(shè)置一個初始閾值T0,T0為灰度圖像的最大灰度級與最小灰度級的平均值,然后遍歷整幅灰度圖像,利用T0將圖像的灰度級劃分為大于T0和小于T0的兩組數(shù)據(jù),記作數(shù)據(jù)集A0和B0,再求出數(shù)據(jù)集A0和B0的平均值,記為MA0,MB0, 將MA0,MB0的平均值(MA0+MB0)/2作為閾值T1;同理,利用T1將圖像的灰度級劃分為大于T1和小于T1的兩組數(shù)據(jù),記作數(shù)據(jù)集A1和B1,再求出數(shù)據(jù)集A1和B1的平均值,記為MA1,MB1,將MA1,MB1的平均值(MA1+MB1)/2作為閾值T2,以此類推,計算出T3,T4,……,TN,當滿足條件|TN-T(N-1)|<0.1時,即可求出最佳閾值TN。
4、濾波后對比度增強:自動對圖像灰度值進行調(diào)整,增強圖像對比度。
確定閾值后,利用閾值TN對圖像進行一次濾波, 對濾波后圖像的對比度進行增強,設(shè)原灰度圖像數(shù)據(jù)為G,其最大灰度級為M,則增強后的灰度圖像數(shù)據(jù)為nG=255*(G-TN)/(M-TN),使其灰度分布從[TN,M]重新分布到[0,255]區(qū)間。
5、特征提?。鹤鳛槟z電泳圖像條帶識別的關(guān)鍵,提取其像素梯度,作為特征點,找出灰度變化顯著的區(qū)域。
將平行于凝膠電泳條帶方向上的數(shù)據(jù)進行提取,并對數(shù)據(jù)進行一次求導(dǎo),即后一個像素點的灰度級減去前一個像素點的灰度級,依次類推,最終獲得平行于條帶方向上的像素梯度信息,取絕對值后記錄至數(shù)據(jù)集D中,設(shè)步驟2所得的灰度圖像的分辨率為m*n,則數(shù)據(jù)集D的分辨率為m*(n-1)。
6、圖像分割:即對圖像進行二次濾波,可在一次濾波的基礎(chǔ)上有效的過濾掉剩余噪聲,從而獲得凝膠條帶的有效信息。
先找出數(shù)據(jù)集D中的最大值記為Dmax,利用公式:D1=D/Dmax將數(shù)據(jù)集D作歸一化處理;從步驟2所得的灰度圖像中取m*(n-1)個像素點的數(shù)據(jù),記為G1,然后依次遍歷數(shù)據(jù)集G1與數(shù)據(jù)集D中的數(shù)據(jù),并將二者作點乘算,得到分割后的圖像數(shù)據(jù)Ge。
7、顯示結(jié)果:圖像分割完畢后,于平行凝膠電泳條帶方向上,分別將各像素點的灰度級進行累加,并將累加后的數(shù)據(jù)進行平滑濾波處理,最終以曲線圖形式作出“凝膠電泳DNA色譜圖”;在“凝膠電泳DNA色譜圖”上利用角點檢測算法獲取各個峰值點的位置,用最小二乘法擬合出“DNA片段大小—遷移位置”關(guān)系圖。
對得到的圖像數(shù)據(jù)Ge進行遍歷,于平行凝膠電泳條帶方向上,分別將各像素點的灰度級進行疊加,得到一組1行n列的數(shù)據(jù)S,再對S進行平滑濾波,即以某個點為中心,取其相鄰3個點的平均值為來代替該點的取值,最終根據(jù)新數(shù)據(jù)以曲線圖形式作“凝膠電泳DNA色譜圖”,并在“凝膠電泳DNA色譜圖”上利用角點檢測算法獲取各個峰值點的位置,用最小二乘法擬合出“DNA片段大小—遷移位置關(guān)系圖”。
實例:在對50bp的DNA ladder的瓊脂糖凝膠電泳上使用了本發(fā)明。Ladder的片段大小分別為50bp,100bp,150bp,250bp,300bp,350bp,400bp,450bp,500bp,600bp,700bp,800bp,900bp,1500bp,圖像處理結(jié)果如圖2各階段效果圖。
(1)圖像采集:用手機采集已經(jīng)分離好的凝膠電泳圖像,手機相機為300萬像素。
(2)真彩圖轉(zhuǎn)為灰度圖:根據(jù)加權(quán)法,使各分量在轉(zhuǎn)換后的灰度圖中占比為R:0.1;G:0.75;B:0.15,其中R,G,B分別為紅色,綠色及藍色分量。
(3)求灰度圖像最佳閾值:利用迭代法對50bp的DNA ladder的瓊脂糖凝膠電泳圖像進行計算,自動獲取其最佳閾值。
(4)對比度增強:一次濾波后,由于原灰度圖像的直方圖分布變窄,為了方便特征提取,對圖像作對比度增強處理。
(5)特征提?。?0bp的DNA ladder在電泳過程中條帶沒有變形且條帶間的距離也較大,在于條帶間有較強的熒光背景,所以適合提取相關(guān)信息。
(6)圖像分割:二次濾波后,可將條帶間的熒光背景噪聲濾除。
(7)顯示結(jié)果:將步驟(6)中的圖像信息作進一步處理,并作出“凝膠電泳DNA色譜圖”及“DNA片段大小—遷移位置關(guān)系圖”并將二者關(guān)系用曲線進行擬合。
凝膠電泳DNA色譜圖見附圖3。從圖中可以看到,各個DNA片段的表現(xiàn)形式均為一個峰值信號,相對于原圖像來說,該方法獲得的圖像更為直觀;不難發(fā)現(xiàn),當DNA片段小于500bp時,其片段大小與遷移距離是呈線性關(guān)系,其線性擬合的結(jié)果見附圖4。圖中y=kx+d表示DNA片段長度與遷移距離(像素坐標)的擬合直線,其中y表示DNA片段長度,x表示遷移距離(像素坐標),k表示直線的斜率,d表示直線在y軸上的截距,R為y與x的相關(guān)系數(shù)。