本發(fā)明涉及生物技術(shù)領(lǐng)域,尤其涉及一種利用脂質(zhì)生物標(biāo)志物預(yù)測甲狀腺癌的方法,能夠準(zhǔn)確預(yù)測甲狀腺癌。
背景技術(shù):
甲狀腺癌是常見的內(nèi)分泌惡性腫瘤,傳統(tǒng)上分為甲狀腺分化性癌、甲狀腺未分化癌和甲狀腺髓樣癌,分化性癌又分為乳頭狀癌和濾泡型腺癌,甲狀腺未分化癌比較少見且預(yù)后極差,甲狀腺髓樣癌來源于甲狀腺濾泡旁細(xì)胞(c細(xì)胞),屬于神經(jīng)內(nèi)分泌腫瘤中的一種,在多發(fā)性2型內(nèi)分泌瘤中約25%的患者伴有甲狀腺髓樣癌。近年來,我國甲狀腺癌高發(fā),已成為增長速度最快的惡性腫瘤,發(fā)病率10年增長了近5倍。甲狀腺癌尤其好發(fā)于中青年女性,女性和男性比例為3:1,已成近20年來我國癌癥譜中女性惡性腫瘤上升速度最快的腫瘤。如今在一、二線城市的女性群體中,該病發(fā)病率基本位列三甲,有的甚至已躍居榜首。
目前,確診甲狀腺癌的主要手段主要是甲狀腺細(xì)胞穿刺、術(shù)中病理冰凍及術(shù)后石蠟病理切片,甲狀腺細(xì)胞穿刺雖然能達(dá)到確診的意義,但由于陽性率低而限制了它在臨床上的推廣,所以臨床實(shí)際確診甲狀腺癌的方法主要還是依靠術(shù)中冰凍或術(shù)后石蠟切片。除此之外,在甲狀腺癌血清學(xué)方面,雖然對甲狀腺癌腫瘤標(biāo)志物的研究進(jìn)展的很快,但至今還沒有一種在臨床上得到一致的認(rèn)可,說明對甲狀腺癌腫瘤標(biāo)志物的研究仍然處于初步階段,值得進(jìn)一步發(fā)展。
研究表明,脂質(zhì)代謝與組織病變有非常直接的聯(lián)系,也包括甲狀腺機(jī)能紊亂。目前,通過核磁共振,maldi/ms或者gc/ms,已經(jīng)發(fā)現(xiàn)少許與甲狀腺癌相關(guān)的脂質(zhì)。其中,對脂肪酸的研究表明,良性甲狀腺瘤的患者c14:0,c16:1n7,c18:1n9,c20:1n9,c18:3n3顯著降低,c16:0,c20:3n6,c20:4n6,c22:6n3顯著升高;惡性腫瘤患者表現(xiàn)出c14:0,c16:0,c18:3n3升高,而c20:3n6降低的趨勢。另外,也有研究利用數(shù)學(xué)模型結(jié)合脂質(zhì)組學(xué),開始尋找腫瘤標(biāo)志物。他們利用pls-da模型,發(fā)現(xiàn)了長醇,膽固醇,膽堿以及27種脂肪酸,在甲狀腺癌良性和惡性人群中,體現(xiàn)明顯的差異。
但是,目前為止,還沒有出現(xiàn)能夠利用這些標(biāo)志物準(zhǔn)確預(yù)測甲狀腺癌的預(yù)測模型,尤其是針對中國人群的甲狀腺癌預(yù)測模型。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的一個目的是解決至少上述問題,并提供至少后面將說明的優(yōu)點(diǎn)。
本發(fā)明還有一個目的是提供一種利用脂質(zhì)生物標(biāo)志物預(yù)測甲狀腺癌的方法,能夠快捷、準(zhǔn)確、高效地預(yù)測甲狀腺癌。
本發(fā)明還有一個目的是提供一種針對中國人群的利用脂質(zhì)生物標(biāo)志物預(yù)測甲狀腺癌的方法。
本發(fā)明還有一個目的是提供一組針對中國人群的與甲狀腺癌密切相關(guān)的化合物。
為了實(shí)現(xiàn)根據(jù)本發(fā)明的這些目的和其它優(yōu)點(diǎn),提供了以下技術(shù)方案:
一種利用脂質(zhì)生物標(biāo)志物預(yù)測甲狀腺癌的方法,其中,主要包括以下步驟:
步驟1、篩選出正常人組群和甲狀腺癌組群之間的差異性化合物r1-r9,分別為:
r1:pg(17:0/14:1);
r2:ps(o-20:0/18:1);
r3:pc(16:0/18:2);
r4:bacteriohopane-,32,33,34-triol-35-cyclitolguanine;
r5:pc(16:0/20:4);
r6:tg(16:0/16:1/20:2);
r7:pc(16:0/18:1);
r8:ps(o-18:0/17:0);
r9:ps(p-18:0/22:2);
步驟2、利用邏輯回歸模型3進(jìn)行計(jì)算,得到tc值,所述邏輯回歸模型3的計(jì)算公式為:
tc=1.8002-2.2815*r1-2.3474*r4+2.8573*r9;
步驟3、根據(jù)所得tc值進(jìn)行判斷,tc=0為否;tc=1為是。
優(yōu)選的是,步驟1中利用opls-da模型對差異性化合物進(jìn)行篩選,然后將vip>1的排名前9位變量的數(shù)據(jù)提取出來即得r1-r9。
優(yōu)選的是,步驟1中篩選的具體方法為:
步驟1.1將樣品進(jìn)行超高效液相色譜和質(zhì)譜分析,得到脂質(zhì)組學(xué)數(shù)據(jù),將正常人組群和甲狀腺癌組群分別計(jì)為ck及jc;
步驟1.2對脂質(zhì)組學(xué)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化操作,利用opls-da模型對ck及jc進(jìn)行s-plot分布得到s形曲線,并進(jìn)行強(qiáng)制分組,計(jì)算影響ck及jc分組的變量重要性,即得vip值;
步驟1.3按照vip值大于5的標(biāo)準(zhǔn)得到15個化合物,并將該15個化合物作為與甲狀腺癌相關(guān)度最高的差異性化合物;
步驟1.4將所得15個化合物按照vip值大小從高到低排列,取前9位,即得步驟1中所述差異性化合物ri-r9。
優(yōu)選的是,步驟2中tc值或者用邏輯回歸模型2進(jìn)行計(jì)算,所述邏輯回歸模型2的計(jì)算公式為:
tc=1.6361-12.5962*r+0.4081*r2-0.962*r3-1.7675*r4+0.7317*r5-7.3848*r6+15.9658*r7+0.494*r8+2.5964*r9。
優(yōu)選的是,步驟2中tc值或者用邏輯回歸模型1進(jìn)行計(jì)算,所述邏輯回歸模型1的計(jì)算公式為:
tc=1.6054-13.4331*r1-2.4503*r4+0.9397*r5+9.5919*r7+3.3108*r9。
本發(fā)明至少包括以下有益效果:
本發(fā)明通過篩選,首次發(fā)現(xiàn)與甲狀腺癌相關(guān)的一組化合物,即與甲狀腺癌相關(guān)的脂質(zhì)生物標(biāo)志物,并通過構(gòu)建邏輯回歸模型,得到根據(jù)這些脂質(zhì)標(biāo)志物預(yù)測甲狀腺癌的方法,快捷方便,準(zhǔn)確度高。通過aic值初步判斷,并進(jìn)行roc曲線繪制,auc值達(dá)到0.872。
本發(fā)明的其它優(yōu)點(diǎn)、目標(biāo)和特征將部分通過下面的說明體現(xiàn),部分還將通過對本發(fā)明的研究和實(shí)踐而為本領(lǐng)域的技術(shù)人員所理解。
附圖說明
圖1為本發(fā)明中所述的opls-da模型的s-plot分布圖;
圖2為本發(fā)明中利用opls-da模型對ck和jc進(jìn)行強(qiáng)制分組的結(jié)果;
圖3為本發(fā)明中用來考察篩選出的化合物的火山圖;
圖4為本發(fā)明中roc曲線圖。
具體實(shí)施方式
下面結(jié)合附圖對本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實(shí)施。
應(yīng)當(dāng)理解,本文所使用的諸如“具有”、“包含”以及“包括”術(shù)語并不配出一個或多個其它元件或其組合的存在或添加。
一種利用脂質(zhì)生物標(biāo)志物預(yù)測甲狀腺癌的方法,其中,主要包括以下步驟:
步驟1、篩選出正常人組群和甲狀腺癌組群之間的差異性化合物r1-r9,分別為:
r1:pg(17:0/14:1);
r2:ps(o-20:0/18:1);
r3:pc(16:0/18:2);
r4:bacteriohopane-,32,33,34-triol-35-cyclitolguanine;
r5:pc(16:0/20:4);
r6:tg(16:0/16:1/20:2);
r7:pc(16:0/18:1);
r8:ps(o-18:0/17:0);
r9:ps(p-18:0/22:2)。
步驟2、利用邏輯回歸模型1進(jìn)行計(jì)算,得到tc值,所述邏輯回歸模型3的計(jì)算公式為:
tc=1.8002-2.2815*r1-2.3474*r4+2.8573*r9;
經(jīng)過roc曲線繪制,模型3的auc值為0.872,準(zhǔn)確度高達(dá)87.2%。
步驟3、根據(jù)所得tc值進(jìn)行判斷,tc=0為否;tc=1為是。r1-r9均為檢測樣品中該脂質(zhì)的含量值。
步驟1中利用opls-da模型對差異性化合物進(jìn)行篩選,然后將vip>1的排名前9位變量的數(shù)據(jù)提取出來即得r1-r9。
步驟1中篩選的具體方法為:
步驟1.1將樣品進(jìn)行超高效液相色譜和質(zhì)譜分析,得到脂質(zhì)組學(xué)數(shù)據(jù),將正常人組群和甲狀腺癌組群分別計(jì)為ck及jc。
步驟1.2對脂質(zhì)組學(xué)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化操作,利用opls-da模型對ck及jc進(jìn)行s-plot分布得到s形曲線,并進(jìn)行強(qiáng)制分組,計(jì)算影響ck及jc分組的變量重要性,即得vip值。
步驟1.3按照vip值大于5的標(biāo)準(zhǔn)得到15個化合物,并將該15個化合物作為與甲狀腺癌相關(guān)度最高的差異性化合物。
步驟1.4將所得15個化合物按照vip值大小從高到低排列,取前9位,即得步驟1中所述差異性化合物r1-r9。
步驟2中tc值或者用邏輯回歸模型2進(jìn)行計(jì)算,所述邏輯回歸模型2的計(jì)算公式為:tc=1.6361-12.5962*r+0.4081*r2-0.962*r3-1.7675*r4+0.7317*r5-7.3848*r6+15.9658*r7+0.494*r8+2.5964*r9。
經(jīng)過roc曲線繪制,模型2的auc值為0.864,準(zhǔn)確度為86.4%。
步驟2中tc值或者用邏輯回歸模型1進(jìn)行計(jì)算,所述邏輯回歸模型1的計(jì)算公式為:
tc=1.6054-13.4331*r1-2.4503*r4+0.9397*r5+9.5919*r7+3.3108*r9。
經(jīng)過roc曲線繪制,模型1的auc值為0.866,準(zhǔn)確度為86.6%。
實(shí)施例1
材料和方法
1.實(shí)驗(yàn)對象(均選自中國人):16位正常人,64位甲狀腺癌患者,抽取靜脈血5ml。準(zhǔn)確量取100μl的血液,加入0.9ml的提取液(100%異丙醇),轉(zhuǎn)入2ml離心管(必須是進(jìn)口離心管,塑料不易溶于有機(jī)溶劑中;axygen品牌)中,漩渦振蕩10s以上,超聲10min,然后在-20度冰箱中冷凍1小時,取出后在室溫下漩渦振蕩,用冷凍離心機(jī)10000rpm離心10min,然后去上清液1ml并過0.22μm的有機(jī)相濾膜到玻璃進(jìn)樣品種,保存在冰箱中待測。
2.主要儀器
2.1.1冷凍離心機(jī):型號d3024r,scilogex公司,美國
2.1.2漩渦振蕩器:型號mx-s,scilogex公司,美國
2.1.3高分辨質(zhì)譜儀:esi-qtof/ms;型號:xevog2-sq-tof;廠家:waters
2.1.4超高效液相色譜:uplc;型號:acquityuplci-class系統(tǒng);廠家:waters
2.1.4數(shù)據(jù)采集軟件:masslynx4.1;廠家:waters
2.1.5分析鑒定軟件:progenesisqi;廠家:waters
2.1.6作圖軟件:ezinfo;hemi;simca-p
3.主要試劑
甲醇、乙腈、甲酸、甲酸銨、亮氨酸腦啡肽、甲酸鈉。廠家均為fisher。
4.實(shí)驗(yàn)設(shè)置
以提取液(100%異丙醇)作為空白對照(blank)樣品;從每個樣品的進(jìn)樣品種取出100μl混合到新的進(jìn)樣品種作為質(zhì)控(qc)樣品;正式樣品按照每組樣品間隔進(jìn)樣,例如先是blank1,然后是qc1,然后是w1,然后是w2這個順序,然后再進(jìn)行下一輪進(jìn)樣。
液相方法
色譜柱:acquityuplccshc18column,
柱溫:55度
流速:0.4ml/min
流動相:a:acn/h2o(60%/40%),含有10mm甲酸銨和0.1%甲酸
b:ipa/acn(90%/10%),含有10mm甲酸銨和0.1%甲酸
(注:acn為乙腈,ipa為異丙醇)
進(jìn)樣體積:0.2μl
洗脫程序:
質(zhì)譜方法
數(shù)據(jù)采集方式:mse;分子量掃描范圍:50-1500m/z;分辨率模式(輪廓圖)。
正負(fù)離子模式各采集一次。
離子源:電噴霧電離源(esi)
毛細(xì)管電壓:3kv
錐孔電壓為:25v
碰撞能:15-60v
源溫度:120度
脫溶劑溫度:500度
錐孔氣體速度:50l/h
脫溶劑氣體速度:500l/h
掃描時間:0.2s
使用亮氨酸腦啡肽(m/z556.2771,正離子;554.2615,負(fù)離子)進(jìn)行實(shí)時校正。使用甲酸鈉進(jìn)行校正。
脂質(zhì)組學(xué)數(shù)據(jù)分析
progenesisqi軟件(waters,massachusetts,usa)用于結(jié)果分析,抽提非靶向脂質(zhì)分子的特征峰,進(jìn)行比對和篩選。同時,用qc(quantifyingcontrol)和blank(空白)來篩選背景數(shù)據(jù)。最終的數(shù)據(jù),導(dǎo)入ezinfo3.0,并進(jìn)行principalcomponentanalysis(pca)分析,orthogonalsignalcorrectionpartialleastsquarediscriminationanalysis(opls-da)建模,variableimportanceinprojection(vip)的計(jì)算,同時得到火山圖(coefficientsvs.vipspots),如圖3所示。其中,邏輯回歸模型以及roc曲線(如圖4)通過r語言進(jìn)行建設(shè)和繪制。
結(jié)果描述
正常人群與甲狀腺癌人群脂質(zhì)差異物質(zhì)的鑒定。
我們首先建立opls-da模型,對正常人(ck)和甲狀腺癌(jc)組群進(jìn)行分類,并研究造成他們出現(xiàn)差異的原因。我們看到在opls-da模型中,利用相關(guān)性(correlation)和協(xié)方差(covarience)的p值作出的s-plot形成了非常好的s形曲線,如圖1所示。利用opls-da將兩組數(shù)據(jù)進(jìn)行強(qiáng)制分組,結(jié)果如圖2所示。計(jì)算影響ck和jc分組的變量重要性,即vip(variableimportanceinprojection)值。一共篩選到308個化合物,他們的vip值大于1;我們挑選vip>5,貢獻(xiàn)率大的15個化合物,如表1所示。
表1.變量重要性投影
我們通過vip>1篩選出來的化合物在s-plot上用紅色方框標(biāo)出,發(fā)現(xiàn)他們均勻的分布在兩側(cè)。同時,我們利用火山圖,來考察篩選出的化合物的分布,如圖3所示,發(fā)現(xiàn)篩選出來的化合物都分布在火山圖的外圍。這些結(jié)果都說明,借由opls-da模型,我們成功篩選出造成ck和jc差異的化合物。
建立邏輯回歸模型以及roc曲線。我們對脂質(zhì)組學(xué)的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化操作(rproject:scale)。然后將vip>1的排名前9位變量的數(shù)據(jù)提取出來,建立邏輯回歸模型和roc曲線。
公式中,tc:是否患有腫瘤,0為否,1為是
r1:pg(17:0/14:1)
r2:ps(o-20:0/18:1)
r3:pc(16:0/18:2)
r4:bacteriohopane-,32,33,34-triol-35-cyclitolguanine
r5:pc(16:0/20:4)
r6:tg(16:0/16:1/20:2)
r7:pc(16:0/18:1)
r8:ps(o-18:0/17:0)
r9:ps(p-18:0/22:2)
模型3:tc=1.8002-2.2815*r1-2.3474*r4+2.8573*r9
aic:57.484
signif.codes:‘***’0.001;‘**’0.01;‘*’0.05;‘.’0.1;
模型2:
tc=1.6361-12.5962*r+0.4081*r2-0.962*r3-1.7675*r4+0.7317*r5-7.3848*r6+15.9658*r7+0.494*r8+2.5964*r9
aic:65.973
signif.codes:‘***’0.001;‘**’0.01;‘*’0.05;‘.’0.1;
模型1:
tc=1.6054-13.4331*r1-2.4503*r4+0.9397*r5+9.5919*r7+3.3108*r9
aic:58.782
signif.codes:‘***’0.001;‘**’0.01;‘*’0.05;‘.’0.1;
針對以上三個邏輯回歸模型,進(jìn)行roc曲線繪制,如圖4所示,模型1為m1,auc值達(dá)到0.866;模型2為m2,auc值為0.864;模型3為m3,auc值達(dá)到0.872。我們發(fā)現(xiàn)模型3最靠近左上角定點(diǎn),同時auc值最高,最終,確定模型3為基于脂質(zhì)指標(biāo)來預(yù)測糖尿病血脂異常較好的預(yù)測模型。也可以根據(jù)所測樣品數(shù)據(jù)情況,選擇模型1或者模型2進(jìn)行計(jì)算預(yù)測,或者優(yōu)先選擇模型3進(jìn)行計(jì)算,同時使用1和2模型進(jìn)行輔助驗(yàn)證,協(xié)同分析預(yù)測。
盡管本發(fā)明的實(shí)施方案已公開如上,但其并不僅僅限于說明書和實(shí)施方式中所列運(yùn)用,它完全可以被適用于各種適合本發(fā)明的領(lǐng)域,對于熟悉本領(lǐng)域的人員而言,可容易地實(shí)現(xiàn)另外的修改,因此在不背離權(quán)利要求及等同范圍所限定的一般概念下,本發(fā)明并不限于特定的細(xì)節(jié)和這里示出與描述的圖例。