本發(fā)明涉及生物,具體而言,涉及一種自然殺傷細胞標志物的篩選方法及其應用。
背景技術:
1、哺乳動物的血液系統(tǒng)包含超過10種不同的成熟細胞類型,它們都由同一種始祖細胞類型—造血干細胞(hematopoietic?stem?cell,hsc)分化而來。成熟的血液細胞類型可以大致分為兩類:(1)髓系細胞,主要包括巨核細胞、成紅細胞、肥大細胞、嗜酸/堿/中性粒細胞、單核細胞、樹突狀細胞和巨噬細胞;(2)淋巴系細胞,主要包括b細胞、t細胞和自然殺傷細胞。
2、自然殺傷細胞(natural?killer?cell,nk?cell)是免疫系統(tǒng)的天然關鍵參與者,在腫瘤或病毒感染激活前會自動殺死細胞。自然殺傷細胞的細胞質(zhì)中含有豐富的小顆粒,其中含有特殊的蛋白質(zhì),如蛋白酶和稱為顆粒酶的蛋白酶。它在被殺傷細胞附近釋放,并通過靶細胞細胞膜上的孔粒酶及相關分子的形成在靶細胞內(nèi)傳播,導致靶細胞的破壞。因此,自然殺傷細胞是非抗原特異性靶向病毒感染細胞和腫瘤細胞的關鍵先天效應細胞。
3、鑒于自然殺傷細胞在機體免疫尤其是抗腫瘤免疫方面的重要作用,其受到科學和臨床研究的廣泛關注。但開展相關研究的首要前提在于如何鑒定/富集自然殺傷細胞。傳統(tǒng)生物實驗的篩選方法,主要是利用自然殺傷細胞高表達cd56細胞表面標記蛋白的特性,通過流式分選或磁珠分選將自然殺傷細胞從一群細胞中分離出來。但這種方法耗時耗力,精度上也存在一定限度。2017年nvigen?inc的“復合物用于捕獲樣本中的稀有細胞”專利(專利號:wo2017035419-a1),通過設計可操作地連接到聚乙二醇(peg)化合物的珠子和連接到珠子的分析物捕獲組分,分析物捕獲組分能夠特異性地結合到稀有細胞的表面標記,從而捕獲包括自然殺傷細胞在內(nèi)的罕見免疫細胞或循環(huán)細胞,用以指示疾病的存在。該專利基于設計珠子、分析物捕獲組分的復合物,鑒別包括自然殺傷細胞在內(nèi)的稀有細胞,主要用于疾病預測。該技術需要設計珠子和相應分析物捕獲組分,成本較高且技術難度較大。捕獲到細胞后需要對混合細胞群進行二次區(qū)分,且主要目的是指示疾病狀態(tài),不能很好地適用于自然殺傷細胞類型鑒定。2013年授權的專利“通過幾種細胞表面標志物鑒別癌癥患者外周血樣的樹突狀殺傷細胞”,利用自然殺傷細胞、樹突狀細胞和人類白細胞抗原中選擇的幾種細胞表面標志物,來鑒定和篩選從癌癥患者獲得的用于開發(fā)癌癥細胞免疫療法的人類外周血樣品中的自然殺傷細胞與樹突狀細胞。該技術通過4個逐步篩選的步驟,最終分離得到表型為hla-g-cd14-cd19-cd3-cd56+hla-dr+的樹突狀細胞、自然殺傷細胞的細胞混樣。該技術通過細胞表面標志物逐步鑒定富集自然殺傷細胞和樹突狀細胞混樣,篩選流程比較繁瑣。且通過評估細胞表面標志物表達高低的鑒別方法存在一定的主觀性,特異性和精確性也有些不足。
4、此外,在相關單細胞轉(zhuǎn)錄組研究中,研究者也需要借助數(shù)據(jù)庫中已發(fā)表的分子標志物來鑒定自然殺傷細胞類群。但這些分子標志物本身也大多來自不同實驗室的獨立實驗,數(shù)目眾多、來源不清晰且適用性有待考證??傊?,這些基于先驗知識的鑒定方法比較費時費力,且存在一定的鑒定不準的情況。因此,如何利用更加科學、高效的方法來系統(tǒng)性篩選新的特異性強的自然殺傷細胞分子標志物是目前需要解決的問題。
5、隨著測序成本的下降,公共數(shù)據(jù)庫中出現(xiàn)了大量外周血轉(zhuǎn)錄組數(shù)據(jù)集。這些前所未有的大規(guī)模數(shù)據(jù)集為多細胞類型間的基因表達差異比較以更加精確篩選自然殺傷細胞分子標志物提供了數(shù)據(jù)基礎。與此同時,應用機器學習的新分類方法,讓計算機從數(shù)據(jù)中自主學習知識,能夠避免人為主觀因素的影響,使得新分子標志物的篩選開發(fā)能以一種更加科學、準確的方式進行。因此,基于大數(shù)據(jù)集通過機器學習方法開發(fā)新的更精確鑒別自然殺傷細胞的分子標志物兼具需求性與可行性。
技術實現(xiàn)思路
1、本發(fā)明旨在提供一種自然殺傷細胞標志物的篩選方法及其應用,以解決現(xiàn)有技術中自然殺傷細胞標志物的篩選方法復雜的技術問題。
2、為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種標志物在鑒定、富集或分選自然殺傷細胞中的應用,標志物包括基因標志物和/或蛋白標志物,基因標志物為sh2d1b基因,蛋白標志物為sh2d1b基因表達的蛋白產(chǎn)物。
3、進一步地,當應用為鑒定自然殺傷細胞時,應用包括檢測基因標志物的表達量,優(yōu)選地,檢測基因標志物的表達量為檢測基因標志物的mrna表達量或蛋白表達量;更優(yōu)選地,通過高通量測序檢測基因標志物的mrna表達量;可選地,應用為在單細胞轉(zhuǎn)錄組研究中對自然殺傷細胞的鑒定。
4、進一步地,對來源于生物樣品中的自然殺傷細胞進行鑒定、富集或分選,其中,生物樣品選自以下一種或多種:外周血、骨髓、臍帶血、肝或淋巴結。
5、根據(jù)本發(fā)明的另一個方面,提供了一種標志物在制備鑒定、富集或分選自然殺傷細胞的相關產(chǎn)品中的應用,標志物包括基因標志物和/或蛋白標志物,基因標志物為sh2d1b基因,蛋白標志物為sh2d1b基因表達的蛋白產(chǎn)物。
6、進一步地,當應用為制備鑒定自然殺傷細胞的相關產(chǎn)品時,相關產(chǎn)品包括采用檢測試劑檢測基因標志物的表達量,
7、優(yōu)選地,檢測試劑為檢測基因標志物的mrna表達量或蛋白表達量的檢測試劑;
8、更優(yōu)選地,檢測基因標志物的mrna表達量的檢測試劑為探針和/或引物,進一步優(yōu)選為將基因標志物的mrna制備成高通量測序文庫的相關試劑。
9、進一步地,對來源于生物樣品中的自然殺傷細胞進行鑒定、富集或分選,其中,生物樣品選自以下一種或多種:外周血、骨髓、臍帶血、肝或淋巴結;
10、優(yōu)選地,相關產(chǎn)品包括試劑盒。
11、根據(jù)本發(fā)明的再一個方面,提供了一種鑒定自然殺傷細胞的試劑盒。該試劑盒包括檢測試劑,檢測試劑為用于檢測基因標志物和/或蛋白標志物表達量的檢測試劑,基因標志物為sh2d1b基因,蛋白標志物為sh2d1b基因表達的蛋白產(chǎn)物。
12、進一步地,檢測試劑為檢測基因標志物的mrna表達量或蛋白表達量的檢測試劑;優(yōu)選地,檢測基因標志物的mrna表達量的檢測試劑為探針和/或引物,進一步優(yōu)選為將基因標志物的mrna制備成高通量測序文庫的相關試劑。
13、根據(jù)本發(fā)明的又一個方面,提供了一種自然殺傷細胞標志物的篩選方法。該篩選方法包括以下步驟:s1,計算外周血中終末端分化血液細胞在正常生理條件下的基因表達譜,通過比較得到自然殺傷細胞與其他血液細胞的基因表達譜的差異特征,篩選出候選分子標志物;s2,將候選分子標志物結合機器學習算法構建自然殺傷細胞鑒別基因模型,篩選出自然殺傷細胞的標志物。
14、進一步地,其他血液細胞包括b淋巴細胞、t淋巴細胞、樹突狀細胞、成紅細胞、單核細胞和嗜中性粒細胞;優(yōu)選的,機器學習算法為邏輯回歸模型。
15、進一步地,s1中的原始數(shù)據(jù)為外周血中終末端分化血液細胞的rna-seq數(shù)據(jù);
16、優(yōu)選的,s1中計算外周血中終末端分化血液細胞在正常生理條件下的基因表達譜包括對血液細胞基因表達譜定量;
17、更優(yōu)選的,基因表達譜定量包括將原始的血液細胞rna-seq測序數(shù)據(jù)進行質(zhì)控,包括剪切接頭,去除低質(zhì)量讀長,質(zhì)控后的序列比對到人基因組,并過濾掉比對率小于閾值的樣本,使用tpm方法進行定量;
18、優(yōu)選的,s1中通過比較得到自然殺傷細胞與其他血液細胞的基因表達譜的差異特征包括對自然殺傷細胞與其他血液細胞進行兩兩之間的差異表達分析,相同細胞類型同一基因的表達量取均值;對于自然殺傷細胞,有相較于其他血液細胞均上調(diào)差異基因列表,通過取交集獲得自然殺傷細胞類型特異的上調(diào)差異基因,優(yōu)選去除cellmarker數(shù)據(jù)庫已報道的標志基因后,作為自然殺傷細胞的候選分子標志物。
19、進一步地,s2包括:將單個候選分子標志物作為輸入,利用機器學習分類模型分別構建模型對數(shù)據(jù)樣本進行自然殺傷細胞鑒定;預測分數(shù)由模型自動評估,通過受試者工作特征曲線下面積auc值評估模型鑒定效果;若auc值大于閾值,則判斷候選分子標志物作為用于鑒定、富集或分選自然殺傷細胞的標志物。
20、進一步地s2還包括:標志物鑒定效果的比較驗證;比較驗證包括:
21、選取對照基因集,利用機器學習分類模型構建模型對數(shù)據(jù)樣本進行自然殺傷細胞鑒定;預測分數(shù)由模型自動評估,通過受試者工作特征曲線下面積auc值評估模型鑒定效果;通過比較對照基因集與標志物的auc值,驗證標志物的鑒定效果。
22、根據(jù)本發(fā)明的再一方面,提供了一種自然殺傷細胞標志物的鑒定方法,包括以下步驟:選取對照基因集,利用機器學習分類模型構建模型對數(shù)據(jù)樣本進行自然殺傷細胞鑒定;預測分數(shù)由模型自動評估,通過受試者工作特征曲線下面積auc值評估模型鑒定效果;通過比較對照基因集與標志物的auc值,驗證標志物的鑒定效果。
23、根據(jù)本發(fā)明的又一方面,提供了一種計算機可讀存儲介質(zhì),存儲介質(zhì)包括存儲的程序,其中,在程序運行時控制存儲介質(zhì)所在設備執(zhí)行本發(fā)明的上述自然殺傷細胞標志物的篩選方法或本發(fā)明的上述自然殺傷細胞標志物的鑒定方法。
24、根據(jù)本發(fā)明的再一方面,提供了一種處理器,處理器用于運行程序,其中,程序運行時執(zhí)行本發(fā)明的上述自然殺傷細胞標志物的篩選方法或本發(fā)明的上述自然殺傷細胞標志物的鑒定方法。
25、應用本發(fā)明的技術方案,基于大量公共外周血轉(zhuǎn)錄組數(shù)據(jù)集,利用機器學習方法篩選開發(fā)新的自然殺傷細胞分子標志物。篩選得到的自然殺傷細胞新的分子標志物sh2d1b,預測模型auc值為0.92,鑒定效果接近甚至優(yōu)于現(xiàn)有數(shù)據(jù)庫分子標志物。因此,新標志物sh2d1b可用于研發(fā)相關自然殺傷細胞檢測產(chǎn)品/輔助自然殺傷細胞鑒定研究。此外,構建的機器學習模型也可用于鑒定數(shù)據(jù)樣本中的自然殺傷細胞。