两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于偏最小二乘法的生物特征標(biāo)記物提取方法及系統(tǒng)與流程

文檔序號(hào):11276271閱讀:542來(lái)源:國(guó)知局
一種基于偏最小二乘法的生物特征標(biāo)記物提取方法及系統(tǒng)與流程

本發(fā)明涉及生物信息技術(shù)領(lǐng)域,尤其是一種基于偏最小二乘法的生物特征標(biāo)記物提取方法及系統(tǒng)。



背景技術(shù):

生物標(biāo)志物(biomarker)是指可以標(biāo)記系統(tǒng)、器官、組織、細(xì)胞及亞細(xì)胞結(jié)構(gòu)或功能的、已經(jīng)改變或可能發(fā)生改變的生化指標(biāo),具有非常廣泛的用途。

偏最小二乘法(pls)是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它把模型式的方法和認(rèn)識(shí)性的方法有機(jī)地結(jié)合起來(lái),在一個(gè)算法下,可以同時(shí)實(shí)現(xiàn)回歸建模(多元線(xiàn)性回歸)、數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)化(主成分分析)以及兩組變量之間的相關(guān)性分析(典型相關(guān)分析)。

偏最小二乘法在經(jīng)濟(jì)學(xué)、機(jī)械控制技術(shù)、藥物設(shè)計(jì)及計(jì)量化學(xué)等方面有所應(yīng)用,但是在生物醫(yī)學(xué)上偏最小二乘法涉及相對(duì)較少。目前尚未見(jiàn)到將偏最小二乘法應(yīng)用來(lái)進(jìn)行生物特征標(biāo)記物提取的報(bào)道?,F(xiàn)有的生物標(biāo)志物提取方法基于高昂的設(shè)備成本以及復(fù)雜的操作流程,對(duì)于類(lèi)型復(fù)雜且數(shù)量繁多的生物特征標(biāo)記物,標(biāo)志物的提取速度慢而且精確度低。



技術(shù)實(shí)現(xiàn)要素:

為解決上述技術(shù)問(wèn)題,本發(fā)明的目的在于:提供一種操作簡(jiǎn)單、成本低、快速而且精確度高的,基于偏最小二乘法的生物特征標(biāo)記物提取方法。

本發(fā)明的另一個(gè)目的在于:提供一種操作簡(jiǎn)單、成本低、快速而且精確度高的,基于偏最小二乘法的生物特征標(biāo)記物提取系統(tǒng)。

本發(fā)明所采取的技術(shù)方案是:

一種基于偏最小二乘法的生物特征標(biāo)記物提取方法,包括以下步驟:

對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù);

采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取。

進(jìn)一步,所述對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù)這一步驟,具體為:

計(jì)算待提取樣本的質(zhì)核比并分析待提取樣本的類(lèi)別,獲得待提取樣本的質(zhì)譜數(shù)據(jù)。

進(jìn)一步,所述采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取這一步驟,包括以下步驟:

獲取待提取樣本的質(zhì)核比和類(lèi)別,將待提取樣本的質(zhì)核比設(shè)為自變量,將待提取樣本的類(lèi)別設(shè)為因變量;

對(duì)自變量和因變量進(jìn)行標(biāo)準(zhǔn)化處理;

獲取標(biāo)準(zhǔn)化處理后的自變量和因變量,根據(jù)偏最小二乘法,提取待提取樣本的特征數(shù)據(jù)。

進(jìn)一步,所述獲取標(biāo)準(zhǔn)化后的自變量和因變量,根據(jù)偏最小二乘法,提取待提取樣本的特征數(shù)據(jù)這一步驟,包括以下步驟:

根據(jù)標(biāo)準(zhǔn)化處理后的自變量和因變量,進(jìn)行主成分提?。?/p>

判斷主成分提取得到的主成分是否滿(mǎn)足設(shè)定精度要求,若是,則結(jié)束主成分提取操作并執(zhí)行下一步驟的操作;反之,則返回根據(jù)標(biāo)準(zhǔn)化后的自變量和因變量,進(jìn)行主成分提取這一步驟,直至提取到的主成分滿(mǎn)足設(shè)定精度要求;

根據(jù)滿(mǎn)足設(shè)定精度要求的主成分,對(duì)待提取樣本進(jìn)行特征提取。

進(jìn)一步,所述根據(jù)滿(mǎn)足設(shè)定精度要求的主成分,對(duì)待提取樣本進(jìn)行特征提取這一步驟,包括以下步驟:

獲取滿(mǎn)足設(shè)定精度要求的主成分,計(jì)算待提取樣本的負(fù)荷向量;

根據(jù)待提取樣本的負(fù)荷向量,計(jì)算待提取樣本的載荷矩陣;

根據(jù)待提取樣本的載荷矩陣,進(jìn)行待提取樣本特征標(biāo)志物的提取。

進(jìn)一步,所述滿(mǎn)足設(shè)定精度要求的主成分與因變量的相關(guān)度最大。

本發(fā)明采取的另一個(gè)技術(shù)方案是:

一種基于偏最小二乘法的生物特征標(biāo)記物提取系統(tǒng),包括:

質(zhì)譜分析子系統(tǒng),用于對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù);

特征提取子系統(tǒng),用于采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取。

進(jìn)一步,所述特征提取子系統(tǒng),包括:

獲取模塊,用于獲取待提取樣本的質(zhì)核比和類(lèi)別,將待提取樣本的質(zhì)核比設(shè)為自變量,將待提取樣本的類(lèi)別設(shè)為因變量;

標(biāo)準(zhǔn)化處理模塊,用于對(duì)自變量和因變量進(jìn)行標(biāo)準(zhǔn)化處理;

特征提取模塊,用于獲取標(biāo)準(zhǔn)化處理后的自變量和因變量,采用偏最小二乘法,提取待提取樣本的特征數(shù)據(jù)。

進(jìn)一步,所述特征提取模塊,包括:

主成分提取單元,用于根據(jù)標(biāo)準(zhǔn)化處理后的自變量和因變量,進(jìn)行主成分提取;

回歸處理單元,用于判斷主成分提取得到的主成分是否滿(mǎn)足設(shè)定精度要求,若是,則結(jié)束主成分提取操作并執(zhí)行下一步驟的操作;反之,則返回根據(jù)標(biāo)準(zhǔn)化后的自變量和因變量,進(jìn)行主成分提取這一步驟,直至提取到的主成分滿(mǎn)足設(shè)定精度要求;

特征提取單元,用于根據(jù)滿(mǎn)足設(shè)定精度要求的主成分,對(duì)待提取樣本進(jìn)行特征提取。

進(jìn)一步,所述特征提取單元,包括:

負(fù)荷向量計(jì)算子單元,用于獲取滿(mǎn)足設(shè)定精度要求的主成分,計(jì)算待提取樣本的負(fù)荷向量;

載荷矩陣計(jì)算子單元,用于根據(jù)待提取樣本的負(fù)荷向量,計(jì)算待提取樣本的載荷矩陣;

特征提取子單元,用于根據(jù)待提取樣本的載荷矩陣,進(jìn)行待提取樣本特征標(biāo)志物的提取。

本發(fā)明的方法的有益效果是:方法包括對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù)以及采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取的步驟,采用了偏最小二乘法對(duì)生物特征標(biāo)記物進(jìn)行提取,解決了現(xiàn)有生物特征標(biāo)記物提取方法因?yàn)轭?lèi)型復(fù)雜且數(shù)量繁多而無(wú)法進(jìn)行精確快速提取的問(wèn)題,操作簡(jiǎn)單,成本低,速度快而且精確度高。

本發(fā)明的系統(tǒng)的有益效果是:系統(tǒng)包括用于對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù)的質(zhì)譜分析子系統(tǒng)以及用于采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取的特征提取子系統(tǒng),通過(guò)在特征提取子系統(tǒng)中采用偏最小二乘法對(duì)生物特征標(biāo)記物進(jìn)行提取,解決了現(xiàn)有生物特征標(biāo)記物提取方法因?yàn)轭?lèi)型復(fù)雜且數(shù)量繁多而無(wú)法進(jìn)行精確快速提取的問(wèn)題,操作簡(jiǎn)單,成本低,速度快而且精確度高。

附圖說(shuō)明

下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。

圖1為本發(fā)明一種基于偏最小二乘法對(duì)生物特征標(biāo)記物提取方法的步驟流程圖;

圖2為本發(fā)明的偏最小二乘法算法模型的肺癌與健康生物數(shù)據(jù)樣本的分類(lèi)效果圖;

圖3為本發(fā)明的偏最小二乘法算法模型第一主成分pls1的載荷圖;

圖4為本發(fā)明的偏最小二乘法算法模型第二主成分pls2的載荷圖;

圖5為本發(fā)明的偏最小二乘法算法模型第三主成分pls3的載荷圖;

圖6為本發(fā)明一種基于偏最小二乘法對(duì)生物特征標(biāo)記物提取系統(tǒng)的功能框圖。

具體實(shí)施方式

參照?qǐng)D1,一種基于偏最小二乘法的生物特征標(biāo)記物提取方法,包括以下步驟:

對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù);

采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù)這一步驟,具體為:

計(jì)算待提取樣本的質(zhì)核比并分析待提取樣本的類(lèi)別,獲得待提取樣本的質(zhì)譜數(shù)據(jù)。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取這一步驟,包括以下步驟:

獲取待提取樣本的質(zhì)核比和類(lèi)別,將待提取樣本的質(zhì)核比設(shè)為自變量,將待提取樣本的類(lèi)別設(shè)為因變量;

對(duì)自變量和因變量進(jìn)行標(biāo)準(zhǔn)化處理;

獲取標(biāo)準(zhǔn)化處理后的自變量和因變量,采用偏最小二乘法,提取待提取樣本的特征數(shù)據(jù)。

參照?qǐng)D2,以肺癌與健康樣本數(shù)據(jù)為例,通過(guò)本發(fā)明的偏最小二乘法將兩者進(jìn)行分類(lèi),肺癌與健康樣本數(shù)據(jù)的生物特征得到明顯區(qū)分。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述獲取標(biāo)準(zhǔn)化后的自變量和因變量,采用偏最小二乘法,提取待提取樣本的特征數(shù)據(jù)這一步驟,包括以下步驟:

根據(jù)標(biāo)準(zhǔn)化處理后的自變量和因變量,進(jìn)行主成分提?。?/p>

判斷主成分提取得到的主成分是否滿(mǎn)足設(shè)定精度要求,若是,則結(jié)束主成分提取操作并執(zhí)行下一步驟的操作;反之,則返回根據(jù)標(biāo)準(zhǔn)化后的自變量和因變量,進(jìn)行主成分提取這一步驟,直至提取到的主成分滿(mǎn)足設(shè)定精度要求;

根據(jù)滿(mǎn)足設(shè)定精度要求的主成分,對(duì)待提取樣本進(jìn)行特征提取。

其中,提取滿(mǎn)足設(shè)定精度要求主成分的具體計(jì)算過(guò)程為:

設(shè)自變量的標(biāo)準(zhǔn)矩陣為e0,設(shè)因變量的標(biāo)準(zhǔn)矩陣為f0;

根據(jù)e0和f0計(jì)算權(quán)值向量,并將計(jì)算結(jié)果進(jìn)行歸一化得到權(quán)值向量w1,所述權(quán)值向量計(jì)算公式為:w1t=f0te0/(f0tf0),歸一公式為:w1=w1/‖w1‖,其中‖w1‖為w1的模值;

根據(jù)權(quán)值向量w1計(jì)算得分向量t1,所述得分向量計(jì)算公式為:t1=e0w1;

根據(jù)得分向量t1計(jì)算負(fù)荷向量p1,所述負(fù)荷向量計(jì)算公式為:p1t=t1te0/(t1tt1);

根據(jù)負(fù)荷向量p1提取生物樣本數(shù)據(jù)的第一主成分。

其中,記t=[t1,tn]為得分矩陣(即樣本的主成分矩陣);p=[p1,pn]為載荷矩陣;w=[w1,wn]為系數(shù)矩陣,則第一主成分的計(jì)算公式為:t1=e0w(ptw)-1。

其他主成分的計(jì)算方法與上述第一主成分的計(jì)算方法相同。

以肺癌樣本數(shù)據(jù)為例,根據(jù)本發(fā)明的偏最小二乘法計(jì)算出的第一個(gè)主成分如圖3所示,可以看出,第一主成分即質(zhì)核比為783、799、809以及827的肺癌生物標(biāo)記物。

以肺癌樣本數(shù)據(jù)為例,根據(jù)本發(fā)明的偏最小二乘法的回歸方法計(jì)算出的第二個(gè)主成分如圖4所示,可以看出,第二主成分即質(zhì)核比為302、346、362、319、256以及437的肺癌生物標(biāo)記物。

以肺癌樣本數(shù)據(jù)為例,根據(jù)本發(fā)明的偏最小二乘法的回歸方法計(jì)算出的第三個(gè)主成分如圖5所示,可以看出,第三主成分即質(zhì)核比為320、340、302、175以及384的肺癌生物標(biāo)記物。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述根據(jù)滿(mǎn)足設(shè)定精度要求的主成分,對(duì)待提取樣本進(jìn)行特征提取這一步驟,包括以下步驟:

獲取滿(mǎn)足設(shè)定精度要求的主成分,計(jì)算待提取樣本的負(fù)荷向量;

根據(jù)待提取樣本的負(fù)荷向量,計(jì)算待提取樣本的載荷矩陣;

根據(jù)待提取樣本的載荷矩陣,進(jìn)行待提取樣本特征標(biāo)志物的提取。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述滿(mǎn)足設(shè)定精度要求的主成分與因變量的相關(guān)度最大。

其中,滿(mǎn)足設(shè)定精度要求的主成分與因變量的相關(guān)度最大是指,滿(mǎn)足設(shè)定精度要求的主成分t1與因變量f0的相關(guān)系數(shù)算子r(t1,f0)取值最大,即:r(t1,f0)→max。

此外,主成分還存儲(chǔ)了自變量和因變量之間的最大差異信息。而自變量和因變量之間的最大差異信息通過(guò)主成分t1的最大方差var(t1)來(lái)進(jìn)行表征,即:var(t1)→max。

參照?qǐng)D6,一種基于偏最小二乘法的生物特征標(biāo)記物提取系統(tǒng),包括:

質(zhì)譜分析子系統(tǒng),用于對(duì)待提取樣本進(jìn)行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù);

特征提取子系統(tǒng),用于采用偏最小二乘法對(duì)待提取樣本進(jìn)行建模及特征提取。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述特征提取子系統(tǒng),包括:

獲取模塊,用于獲取待提取樣本的質(zhì)核比和類(lèi)別,將待提取樣本的質(zhì)核比設(shè)為自變量,將待提取樣本的類(lèi)別設(shè)為因變量;

標(biāo)準(zhǔn)化處理模塊,用于對(duì)自變量和因變量進(jìn)行標(biāo)準(zhǔn)化處理;

特征提取模塊,用于獲取標(biāo)準(zhǔn)化處理后的自變量和因變量,采用偏最小二乘法,提取待提取樣本的特征數(shù)據(jù)。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述特征提取模塊,包括:

主成分提取單元,用于根據(jù)標(biāo)準(zhǔn)化處理后的自變量和因變量,進(jìn)行主成分提?。?/p>

回歸處理單元,用于判斷主成分提取得到的主成分是否滿(mǎn)足設(shè)定精度要求,若是,則結(jié)束主成分提取操作并執(zhí)行下一步驟的操作;反之,則返回根據(jù)標(biāo)準(zhǔn)化后的自變量和因變量,進(jìn)行主成分提取這一步驟,直至提取到的主成分滿(mǎn)足設(shè)定精度要求;

特征提取單元,用于根據(jù)滿(mǎn)足設(shè)定精度要求的主成分,對(duì)待提取樣本進(jìn)行特征提取。

進(jìn)一步作為優(yōu)選的實(shí)施方式,所述特征提取單元,包括:

負(fù)荷向量計(jì)算子單元,用于獲取滿(mǎn)足設(shè)定精度要求的主成分,計(jì)算待提取樣本的負(fù)荷向量;

載荷矩陣計(jì)算子單元,用于根據(jù)待提取樣本的負(fù)荷向量,計(jì)算待提取樣本的載荷矩陣;

特征提取子單元,用于根據(jù)待提取樣本的載荷矩陣,進(jìn)行待提取樣本特征標(biāo)志物的提取。

以上是對(duì)本發(fā)明的較佳實(shí)施進(jìn)行了具體說(shuō)明,但本發(fā)明并不限于所述實(shí)施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做作出種種的等同變形或替換,這些等同的變形或替換均包含在本申請(qǐng)權(quán)利要求所限定的范圍內(nèi)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
桓仁| 石柱| 电白县| 东平县| 红河县| 盐津县| 长汀县| 彭州市| 合阳县| 广德县| 长武县| 若尔盖县| 饶河县| 天门市| 湘乡市| 贺兰县| 中方县| 芮城县| 闽清县| 托克逊县| 视频| 无棣县| 昌吉市| 福清市| 延长县| 潮州市| 安达市| 砚山县| 安徽省| 宜川县| 泊头市| 年辖:市辖区| 九台市| 武乡县| 和平县| 雷山县| 建德市| 确山县| 子长县| 石狮市| 永登县|