本發(fā)明涉及生物醫(yī)藥,特別是一種基于蛋白組學(xué)檢測血清標(biāo)本建立輔助評估糖尿病腎病腎臟損傷進(jìn)展的分子模型及其構(gòu)建方法與應(yīng)用。
背景技術(shù):
1、糖尿病腎?。╠iabetic?nephropathy,dn)是糖尿病最常見和最嚴(yán)重的微血管并發(fā)癥之一,在我國已經(jīng)成為導(dǎo)致慢性腎臟病的首要病因。由于dn發(fā)病機(jī)制復(fù)雜,缺乏特異干預(yù)靶點(diǎn),治療手段極為有限,致使慢性腎臟病發(fā)生率不斷攀升。
2、臨床蛋白質(zhì)組學(xué)是一門將蛋白質(zhì)組學(xué)技術(shù)應(yīng)用于臨床診斷、治療、預(yù)后和病因研究的學(xué)科。通過將蛋白質(zhì)組學(xué)技術(shù)與臨床流行病學(xué)、醫(yī)學(xué)統(tǒng)計(jì)學(xué)、生物信息學(xué)、人工智能和分子生物學(xué)等技術(shù)相結(jié)合,探究與疾病相關(guān)的蛋白分子效用與機(jī)制,以達(dá)到預(yù)防疾病發(fā)生、提高診療水平、加速疾病好轉(zhuǎn)和促進(jìn)人體健康的目的。
3、蛋白質(zhì)組學(xué)診斷研究為疾病診斷提供依據(jù);基于蛋白質(zhì)組學(xué)技術(shù)與研究策略,在蛋白質(zhì)表達(dá)水平層面,發(fā)現(xiàn)新的疾病診斷標(biāo)志物,或者優(yōu)化疾病現(xiàn)有的診斷體系;通過循證醫(yī)學(xué)和臨床流行病學(xué)的研究思維邏輯,將蛋白質(zhì)組學(xué)技術(shù)與各種實(shí)驗(yàn)、影像等醫(yī)學(xué)診斷技術(shù)相結(jié)合,進(jìn)行患病與否的診斷和不同疾病之間的鑒別,并與“金標(biāo)準(zhǔn)”進(jìn)行比較,從而評價(jià)診斷性試驗(yàn)的真實(shí)性、可靠性和實(shí)用性,因此,發(fā)明一種基于蛋白組學(xué)檢測糖尿病腎病患者血清標(biāo)本評估疾病進(jìn)展的診斷分子模型勢在必行。
技術(shù)實(shí)現(xiàn)思路
1、針對上述情況,為解決現(xiàn)有技術(shù)之缺陷,本發(fā)明之目的就是提供一種基于蛋白組學(xué)檢測血清標(biāo)本建立輔助評估糖尿病腎病腎臟損傷進(jìn)展的分子模型及其構(gòu)建方法與應(yīng)用,可以發(fā)現(xiàn)新的疾病診斷標(biāo)志物,優(yōu)化疾病現(xiàn)有的診斷體系;通過循證醫(yī)學(xué)和臨床流行病學(xué)的研究思維邏輯,將蛋白質(zhì)組學(xué)技術(shù)與各種實(shí)驗(yàn)、影像等醫(yī)學(xué)診斷技術(shù)相結(jié)合,進(jìn)行患病與否的診斷和不同疾病之間的鑒別。
2、本發(fā)明解決的技術(shù)方案是,該分子模型由蛋白質(zhì)p23396?+?p0cg47?+?q9nyq8?+p63241組合構(gòu)成。
3、該分子模型的構(gòu)建方法包括以下步驟:
4、1)制備富集蛋白的納米磁珠樣品
5、取糖尿病血清樣品,用上樣緩沖液稀釋后,與納米磁珠懸液混合均勻,37℃孵育1小時(shí),使用上樣緩沖液清洗納米磁珠2遍,再用不含chaps的上樣緩沖液清洗納米磁珠1遍,磁力架上吸附納米磁珠,棄去上清,得富集蛋白的納米磁珠樣品;
6、2)制備肽段樣品
7、向步驟1)制備的富集蛋白的納米磁珠樣品中加入裂解液,60?℃孵育?30?min進(jìn)行還原烷基化反應(yīng),加入等體積ddh2o,將sdc濃度稀釋至0.5%以下,加入胰蛋白酶,37℃孵育振蕩過夜進(jìn)行酶切,第二天加入?tfa?終止酶切,取上清進(jìn)行sdb-rps脫鹽柱脫鹽,真空抽干后-20℃凍存,得肽段樣品,備用;
8、3)對肽段樣品進(jìn)行質(zhì)譜檢測
9、使用ultimate?3000?rslcnano納升液相串聯(lián)timstof?pro質(zhì)譜儀對樣品進(jìn)行質(zhì)譜檢測,將步驟2)制備的肽段樣品通過自動進(jìn)樣器進(jìn)樣,結(jié)合至c18捕集柱,隨后進(jìn)入分析柱中進(jìn)行分離,利用流動相a和流動相b建立分析梯度,質(zhì)譜以diapasef模式進(jìn)行數(shù)據(jù)采集;根據(jù)質(zhì)荷比-離子淌度的分布規(guī)律,利用timscontrol軟件進(jìn)行diapasef采集窗口的設(shè)置,碰撞能量根據(jù)離子淌度設(shè)置為從1/k0=1.6?vs/cm^2的59?ev線性增加到1/k0=0.6?vs/cm^2的20?ev,得dia原始數(shù)據(jù);
10、4)分析dia原始數(shù)據(jù);
11、將步驟3)得到的dia原始數(shù)據(jù)使用dia-nn(1.8.1)軟件的library-free?mode進(jìn)行分析,檢索使用的數(shù)據(jù)庫是從uniprot下載的human蛋白序列數(shù)據(jù)庫(20220209),檢索參數(shù)采用默認(rèn)設(shè)置,蛋白質(zhì)定量信息使用maxlfq算法進(jìn)行歸一化處理,得蛋白質(zhì)組學(xué)數(shù)據(jù);
12、5)對蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行差異蛋白分析和功能富集分析
13、對步驟4)得到的蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行處理,首先,去除污染蛋白,并進(jìn)行對數(shù)轉(zhuǎn)化,之后,用代表質(zhì)譜儀檢測限周圍正態(tài)分布的值來估算缺失值,對于符合正態(tài)分布的連續(xù)性變量,使用均值和標(biāo)準(zhǔn)差描述,對于不符合正態(tài)分布的連續(xù)型變量,使用四分位數(shù)進(jìn)行描述,分類變量使用百分?jǐn)?shù)進(jìn)行描述,對于兩組數(shù)據(jù)間的檢驗(yàn),符合正態(tài)分布的使用t檢驗(yàn),不符合正態(tài)分布數(shù)據(jù)的使用秩和檢驗(yàn),對于生物標(biāo)志物的篩選,選取差異倍數(shù)(fc)及統(tǒng)計(jì)學(xué)檢驗(yàn)(p≤0.05)作為初篩依據(jù),使用lasso回歸以及機(jī)器學(xué)習(xí)方法極限梯度提升法(xgboost)進(jìn)行進(jìn)一步的生物標(biāo)志物的篩選,最終篩選出蛋白標(biāo)志物;
14、5)利用最終篩選出的蛋白標(biāo)志物進(jìn)行診斷模型的構(gòu)建
15、將蛋白標(biāo)志物利用wpcna(weighted?protein?co-expression?networkanalysis,加權(quán)蛋白共表達(dá)網(wǎng)絡(luò)分析)進(jìn)行篩選,將聚類后生成的不同模塊與分組進(jìn)行關(guān)聯(lián)分析,找到與分組最相關(guān)的模塊,將該模塊中的全部蛋白進(jìn)行注釋富集分析,再將該模塊中的全部蛋白質(zhì)進(jìn)一步通過隨機(jī)森林重要性排序篩選前20個(gè),通過隨機(jī)組合的方式構(gòu)建多個(gè)有序logistic回歸模型去預(yù)測分組變量,五折交叉驗(yàn)證后找到平均auc最大的預(yù)測模型作為最優(yōu)預(yù)測模型。
16、所述的步驟1)中,上樣緩沖液組成為:10mm?tris-cl,1mm?edta,150mm?kcl,0.05%chaps;不含chaps的上樣緩沖液組成為:10mm?tris-cl,1mm?edta,150mm?kcl。
17、所述的步驟2)中,裂解液組成為:1%sdc/100?mm?tris-hcl,ph=8.5/10?mm?tcep/40?mm?caa。
18、所述的步驟3)中,捕集柱參數(shù)為:75?μm*2?cm,?3?μm?particle?size,?100??pore?size,?thermo,分析柱參數(shù)為:75?μm*25?cm,?1.6?μm?particle?size,?100???poresize,?ionopticks,流動相a為0.1%?formic?acid,流動相b為0.1%?formic?acid?in?acn,分析的流速設(shè)置為300?nl/min。
19、所述的步驟3)中,capillary電壓設(shè)置為1400?v,ms1和ms2譜圖的掃描范圍設(shè)置為100-1700?m/z,離子淌度范圍設(shè)置為0.6-1.6?vs/cm2,accumulation?time和ramp?time設(shè)置為100?ms。
20、所述的步驟4)中,檢索參數(shù)為:啟用precursor?ion?generation選項(xiàng)進(jìn)行理論譜圖庫的預(yù)測;使用trypsin/p,最多允許2個(gè)漏切位點(diǎn);carbamidomethyl?(c)修飾設(shè)為固定修飾;oxidaton?(m)?和acetylation?(protein?n-terminal)設(shè)為可變修飾;ms1和ms2質(zhì)量容差設(shè)定為15?ppm;啟用mbr;啟用heuristic?protein?inference;fdr設(shè)置為1%。
21、所述的步驟5)中,對蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行處理具體為:計(jì)算實(shí)際定量值的平均值和標(biāo)準(zhǔn)差,創(chuàng)建一個(gè)新的數(shù)據(jù)集,其均值為原始均值減去?1.8個(gè)原始標(biāo)準(zhǔn)差,其標(biāo)準(zhǔn)差為0.25個(gè)原始標(biāo)準(zhǔn)差,使用新的數(shù)據(jù)集進(jìn)行缺失值填充,最后,去除兩組缺失比例均超過?50%的蛋白質(zhì),剩余的蛋白質(zhì)被選擇用于后續(xù)分析。
22、本發(fā)明所述的基于蛋白組學(xué)檢測血清標(biāo)本建立的輔助評估糖尿病腎病腎臟損傷的分子模型在制備輔助評估糖尿病腎病腎臟損傷試劑盒中的應(yīng)用。
23、本發(fā)明通過高通量質(zhì)譜手段檢測樣品中的蛋白組成,比較糖尿病腎病患病組與非患病組在蛋白質(zhì)組學(xué)層面的不同,篩選出用于疾病進(jìn)展輔助評估模型構(gòu)建的生物標(biāo)志物,并結(jié)合重要臨床變量,進(jìn)行臨床疾病進(jìn)展輔助評估分子模型構(gòu)建,并對模型進(jìn)行評價(jià),結(jié)果表明了基于蛋白組學(xué)檢測糖尿病腎病患者血清標(biāo)本可建立疾病進(jìn)展輔助評估分子模型,為糖尿病腎病的疾病進(jìn)展輔助評估提供了新方案。