两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于PacbioRSII測序平臺的HLA分型方法

文檔序號:9391982閱讀:751來源:國知局
一種基于Pacbio RS II測序平臺的HLA分型方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及基因測序技術(shù)領(lǐng)域,特別涉及HLA基因測序分型方法,具體涉及一種 基于第三代測序儀PacBioRSII的測序產(chǎn)生的HLA-A、HLA-B、HLA-C全長基因進(jìn)行分型的方 法,主要用來超高分辨地對HLA基因進(jìn)行型別劃分。
【背景技術(shù)】
[0002] 人類白細(xì)胞抗原(Humanleukocyteantigen,HLA)系統(tǒng)是人類主要組織相容性 復(fù)合體(Majorhistocompatibilitycomplex,MHC)的別稱,是人體內(nèi)與免疫最相關(guān)的一 段基因組區(qū)域。它位于人類6號染色體短臂,由一系列緊密連鎖的基因座構(gòu)成。HLA基因 在人類基因組中基因多態(tài)性最高,個(gè)體之間的HLA型別差異度非常大。HLA基因具有識別 自體與非體,調(diào)節(jié)免疫應(yīng)答等作用。在醫(yī)學(xué)上,匹配上正確而又高精度的HLA型別對骨髓 移植、器官移植是否成功起著決定性的作用,并且研究發(fā)現(xiàn)許多疾?。ɡ纾簭?qiáng)直性脊椎炎 (AnkylosingSpondylitis,AS))都與HLA基因的某些型別相關(guān)。有研究發(fā)現(xiàn)在人類交往 中,HLA在異性吸引以及成功繁殖后代也起作用。
[0003] 目前的HLA分型方法主要有HLA血清型分型、細(xì)胞學(xué)分型,但是分辨率很低,且實(shí) 驗(yàn)操作繁瑣。后來發(fā)展PCR分型方法,主要有單鏈構(gòu)象多態(tài)性、限制性片段長度多態(tài)性、序 列特異性引物、序列特異性寡核苷酸探針,雖然分辨率有所提高,但是同樣操作麻煩,成本 高。最近發(fā)展起來的基于第二代測序技術(shù)的PCR-SBT精度提高到高分辨率,價(jià)格也有所降 低。然而第二代測序技術(shù)也存在問題,主要是無法把HLA基因全部測通,還是局限在2、3、4 號外顯子,內(nèi)含子以及UTR區(qū)域的序列無法得到信息。
[0004]HLA型別不斷增長,已經(jīng)達(dá)到12, 242個(gè)aMGT/HLA數(shù)據(jù)庫),而測序手段仍然局限 于2、3、4號外顯子,精度不高,而且很多情況下等位基因無法分開。因此我們利用新的三代 測序技術(shù)進(jìn)行全長測序(1-7號外顯子以及內(nèi)含子,UTR區(qū)域),并且用我們開發(fā)的程序進(jìn)行 超高分辨率的HLA分型。

【發(fā)明內(nèi)容】

[0005] 針對現(xiàn)有HLA測序分型技術(shù)存在的不足,本發(fā)明的目的在于利用新的三代測序技 術(shù)進(jìn)行全長測序,包括1-7號外顯子以及內(nèi)含子、UTR區(qū)域,并且開發(fā)分型程序進(jìn)行超高分 辨率的HLA分型。
[0006] 本發(fā)明的技術(shù)方案如下:
[0007] 一種基于PacbioRSII測序平臺的HLA分型方法,包括以下步驟:
[0008] 1)采集樣本提取DNA,然后進(jìn)行PCR擴(kuò)增,其中PCR擴(kuò)增所用引物是針對需要分 型的HLA基因的5'UTR和3'UTR區(qū)域設(shè)計(jì)的,且每對引物的5'端都加有用于區(qū)分樣本的 Barcode(條形碼)序列;
[0009] 2)將步驟1)得到的PCR產(chǎn)物混合建10k文庫,然后進(jìn)行PacBioRSII測序;
[0010] 3)對測序得到的原始數(shù)據(jù)進(jìn)行校正,得到高質(zhì)量的CCSreads,并根據(jù)barcode序 列和引物信息把不同樣本的不同HLA基因的reads序列分開;
[0011] 4)采用軟件程序進(jìn)行HLA分型,包括:
[0012] 4-1)根據(jù)等位基因上的特異性位點(diǎn)將各樣本的各HLA基因的reads序列分成兩份 文件,一份為等位基因1,另一份為等位基因2 ;
[0013] 4-2)對各等位基因的文件分別截取20~40條reads進(jìn)行序列組裝;
[0014] 4-3)校正組裝結(jié)果;
[0015] 4-4)將校正后的組裝結(jié)果與對應(yīng)基因的基因組(genomics)參考序列進(jìn)行比對, 并根據(jù)基因組參考序列的CDS位置信息將組裝結(jié)果的所有CDS序列抓取出來,按照順序連 成一條⑶S序列;
[0016] 4-5)將步驟4-4)得到的等位基因的⑶S序列跟頂GTHLA型別數(shù)據(jù)庫比對,如果 100 %的序列一樣則將該型別號賦予該等位基因。
[0017] 上述步驟2)進(jìn)行PacBioRSII測序,從相對于之前的測序方法,可以非常準(zhǔn)確的 把整個(gè)序列測通,為精準(zhǔn)分型奠定了基礎(chǔ)。如圖1所示,(a)是之前的測序方法得到的結(jié)果, 由于測得的序列信息較短,對于等位基因1我們無法確定序列1和3同屬一條序列,還是序 列1和4同屬一條序列,等位基因2也面臨同樣的問題;而PacBioRSII測序可以非常準(zhǔn) 確地把整個(gè)序列測通,如圖1中(b)所示,可以確定兩端序列的位置關(guān)系,為實(shí)現(xiàn)更為精確 的分型奠定了基礎(chǔ)。
[0018] 優(yōu)選的,上述步驟3)對測序得到的原始數(shù)據(jù)用SmrtanalysisV2. 3軟件進(jìn)行校 正,得到高質(zhì)量的CCSreads,然后根據(jù)barcode和引物信息分選基因,分選原則是read的 頭部或者尾部有100%匹配的barcode和引物信息,這樣就得到了不同樣本的不同HLA基因 的reads序列信息。
[0019] 優(yōu)選的,上述步驟4-1)具體過程是把CCSreads通過bwa軟件與對應(yīng)基因的參 考序列進(jìn)行比對,產(chǎn)生sam格式的比對結(jié)果;之后通過samtools的phase命令,分成兩份 fastq的結(jié)果文件。其中比對根據(jù)的特異性位點(diǎn)通常是SNP位點(diǎn)。
[0020] 優(yōu)選的,上述步驟4-2)采用Mira組裝軟件進(jìn)行組裝。
[0021] 優(yōu)選的,上述步驟4-3)主要是針對polyC和polyG等特定的motif對組裝結(jié)果進(jìn) 行校正,因?yàn)檫@些motif非常容易組裝成錯(cuò)誤的序列。
[0022] 優(yōu)選的,上述步驟4-4)通過Lastz軟件將組裝的結(jié)果與對應(yīng)基因的基因組參考序 列進(jìn)行比對。
[0023] 上述步驟4-5)由于選取的是⑶S序列進(jìn)行分型,所以優(yōu)選的,型別號統(tǒng)一只保留 六位的型別精確度。
[0024] 相比于現(xiàn)有的HLA分型方法,本發(fā)明的HLA分型方法具有超高的分辨率,對臨床移 植組織配型、群體遺傳學(xué)、人類學(xué)和進(jìn)化學(xué)等應(yīng)用和基礎(chǔ)研究工作具有重要價(jià)值。
【附圖說明】
[0025] 圖1顯示了PacBioRSII測序與之前測序方法的差別,其中(a)是之前測序方法 得到的結(jié)果,(b)是PacBioRSII測序結(jié)果,圖中連續(xù)的點(diǎn)代表測得的序列,其中的大寫英 文字母代表特異性位點(diǎn)的堿基。
[0026] 圖2是本發(fā)明實(shí)施例不同類型的CCSreads的分布圖。
【具體實(shí)施方式】
[0027] 以下通過實(shí)施例對本發(fā)明的方案進(jìn)行詳細(xì)說明。本領(lǐng)域的技術(shù)人員應(yīng)該明白,下 面的實(shí)施例子僅用于解釋說明本發(fā)明,而不是限定本發(fā)明的范圍。
[0028] 實(shí)施例1 :82個(gè)樣本的DNA提取、測序以及HLA分型
[0029] 本實(shí)施例針對口腔黏膜細(xì)胞樣本提取DNA,擴(kuò)增HLA-A、HLA-B、HLA-C的DNA片段, 然后混樣,用PacBioRSII測序儀器測序,最后進(jìn)行HLA分型。
[0030] 1?樣本的采集:通過一次性采樣拭子(注冊產(chǎn)品編號為YZB/粵A0278-2012,深圳 市麥瑞科林科技有限公司)收集保存口腔黏膜細(xì)胞,保存液為2mL。
[0031] 2.DNA的提?。翰捎肣iagen公司的Blood&CellCultureDNAKit試劑盒進(jìn)行提 取,提取后的液體體積為80yL左右,提取一次DNA的產(chǎn)物大概可以做20次左右的PCR。
[0032] 3.PCR擴(kuò)增:在HLA-A、HLA-B、HLA-C三個(gè)基因的5'UTR和3'UTR區(qū)域設(shè)計(jì)引物, 并在引物的5'端加上barcode序列。Barcode序列是為了區(qū)分樣本,每個(gè)樣本針對HLA-A、 HLA-B、HLA-C基因加的barcode-樣,但是引物序列不一樣。例如,第3號和第4號樣本的 barcode和引物序列的信息見表1。其中引物ID中A、B、C分別代表HLA-A、HLA-B、HLA-C 基因;ID后面的數(shù)字表示樣本代號,即barcode編號;F表示5'UTR端的引物,R代表3'UTR 端的引物。
[0033]表1
[0034]
[0035]PCR擴(kuò)增采用的酶為TaKaRa的PrimcSTAR滬GXLDNAPolymerase。組分體系: 5XPrimeSTARGXLBuffer(5mMMg2+)4yl,2.5mMdNTP1.6yl,正向引物和反向引物各 1111,基因組0嫩50即,總體積20^1。溫度體系:94 1€2111111,98°(:108,651€208,30個(gè)循 環(huán)后 68°C或 72°C5min。
[0036] 取HLA-A、B、C三者PCR產(chǎn)物均合格的樣本用Qubit定量,共246個(gè)產(chǎn)物,每個(gè)取 50ng等質(zhì)量混合,然后進(jìn)行磁珠純化和濃度測定。
[0037] 4.建庫測序:82個(gè)樣本的HLA-A、HLA-B
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
合江县| 安远县| 松江区| 东明县| 通化县| 临洮县| 湖北省| 滨州市| 上虞市| 周宁县| 平阴县| 莱州市| 衢州市| 翼城县| 壶关县| 西吉县| 遵义市| 太湖县| 清水河县| 化隆| 谷城县| 新绛县| 金堂县| 吉林市| 宁强县| 厦门市| 裕民县| 东乡县| 泽库县| 汉寿县| 武邑县| 罗江县| 永川市| 屯门区| 辽源市| 霍州市| 上犹县| 嵊泗县| 屯留县| 鄯善县| 金山区|