一種雙酶切簡化基因組二代測序文庫構(gòu)建方法及配套試劑盒的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于生物技術(shù)領(lǐng)域,具體設(shè)及一種基于雙酶切的簡化基因組二代測序文庫 構(gòu)建方法及用于二代測序文庫構(gòu)建的配套試劑盒。
【背景技術(shù)】
[0002] 限制性酶切位點相關(guān)DNA(Res1:;riction-site Associated DNA,RAD)測序技術(shù),即 RAD-seq技術(shù)是在二代測序基礎(chǔ)上發(fā)展起來的一項基于全基因組酶切位點的簡化基因組測 序技術(shù)(Baird N.J.,et al,2008)。該技術(shù)利用一種限制性內(nèi)切酶對基因組進(jìn)行單酶切,結(jié) 合物理方法將其打斷產(chǎn)生一定大小的DNA片段并構(gòu)建測序文庫,從而可W實現(xiàn)對酶切位點 附近的序列進(jìn)行高通量測序。由于RAD標(biāo)記是全基因組范圍的特異性酶切位點附近的DNA片 段,故它可W代表整個基因組的序列特征,因此通過RAD-seq能夠在大多數(shù)物種種內(nèi)獲得成 千上萬的單核巧酸多態(tài)性(Single nucleotide polymor地ism,SNP)標(biāo)記及親緣關(guān)系較近 物種種間的SNP標(biāo)記。該技術(shù)不受模式生物和野生物種的限制,可W通過一次測序就可W獲 得數(shù)萬甚至數(shù)十萬的SNP標(biāo)記,大大降低了基因組標(biāo)記的開發(fā)成本。目前,RAD-seq技術(shù)已成 功應(yīng)用于大麥、玉米、茄子、竹子、棘魚、果蛹及甲蟲等多種動植物的SNP標(biāo)記開發(fā)、高密度遺 傳圖譜的構(gòu)建、數(shù)量性狀基因定位、居群遺傳學(xué)W及系統(tǒng)發(fā)育生物學(xué)等研究領(lǐng)域。但一方面 該技術(shù)流程比較復(fù)雜,如要利用Covaris超聲破碎儀等比較貴重的儀器,因而它需要受過專 業(yè)培訓(xùn)的技術(shù)骨干人員才能掌握;另一方面該技術(shù)流程實施過程中用物理方法隨機(jī)打斷會 損失大量的DNA,從而導(dǎo)致最后上機(jī)測序產(chǎn)出的片度(Tag)數(shù)目不可控制。所W國內(nèi)外多個 實驗室對傳統(tǒng)的RAD-seq方法進(jìn)行了改進(jìn)并衍生出多種簡化基因組測序方法。目前,在RAD-seq 技術(shù)上發(fā)展起來的簡化基因 組測序技術(shù)主要有分型測序 (Genotyping by sequencing, GBSKElshire et al.,2011)技術(shù),雙酶切RAD(Dout)Ie digest RAD,ddRAD)(F*eterson et al.,2012)測序技術(shù)W及IIB型限制性內(nèi)切酶的RAD(IIB digest RAD,2b-RAD)(Wang et al. ,2012)測序技術(shù)等。運些技術(shù)都對RAD復(fù)雜的技術(shù)流程做了相應(yīng)的改善,比如GBS技術(shù)的 出發(fā)點是簡化建庫流程,從而使文庫構(gòu)建實施起來更加容易,但低覆蓋度測序易造成分型 錯誤;2b-RAD測序技術(shù)從選酶的角度較好地控制了不同個體測序片段的一致性,但序列長 度太短限制了可發(fā)現(xiàn)的SNP數(shù)目;而ddRAD測序技術(shù)一方面從選酶的角度控制測序片段的產(chǎn) 出,另一方面也簡化了建庫流程。ddRAD-seq技術(shù)與RAD-seq技術(shù)的區(qū)別在于,ddRAD-seq通 過一個稀有酶與一個常見酶相結(jié)合對基因組DNA進(jìn)行雙酶切,免去隨機(jī)打斷的過程,使酶切 片段具有方向性,便于進(jìn)行目的片段的篩選。在第二端的酶切位點后通過PCR擴(kuò)增引入 Index,從而使更多的樣品能夠混在一起進(jìn)行測序。因此,ddRAD-seq技術(shù)是一種非常有前景 的簡化基因組測序技術(shù)。
[0003] ddRAD測序文庫構(gòu)建的實驗流程如下:
[0004] 1、提取目標(biāo)物種的全基因組DNA; 2、使用兩種限制性內(nèi)切酶EcoRI和MspI (分別為 一種稀有堿基酶和一種常見堿基酶)對目標(biāo)基因組進(jìn)行酶切,將目標(biāo)基因組切成長短不一 的具有粘性末端的DNA片段;3、使用Ampure XP磁珠純化上述酶切產(chǎn)生的DNA片段并定量;4、 將人工合成的Oligo Pl接頭正義鏈和反義鏈及Oligo P2接頭正義鏈和反義鏈分別退火,審U 成雙鏈的Pl接頭和P2接頭。在酶切后的基因組DNA片段兩端分別連接Pl接頭和P2接頭;其 中,Pl接頭為帶有EcoRI酶切位點的粘性末端序列,且Pl接頭上還具有高通量測序所需的其 他序列,比如條形碼(barcode)序列W及readl測序引物序列;P2接頭為帶有MspI酶切位點 的粘性末端序列,且P2接頭含有index測序引物序列W及read2測序引物序列。5、將來自不 同樣品的上述連接片段按預(yù)先設(shè)定的體積比進(jìn)行混合;6、對上述混合物使用Ampure XP磁 珠純化,移除未連接接頭及緩沖液成分;7、使用DNA片段自動回收儀器Pippin-Prep選擇一 定范圍長度的片段并回收,回收產(chǎn)物構(gòu)成一個DNA混池;8、對上述加過接頭的DNA混池進(jìn)行 PCR擴(kuò)增W富集所選的片段并連上和二代測序儀匹配的P5接頭序列和P7接頭序列。9、對上 述P C R產(chǎn)物使用A m P U r e X P磁珠純化,移除P C R引物等成分;1 0、使用 AgilentsiOOBioanalyzer進(jìn)行片段分布檢查和定量;11、使用qPCR再次定量并上機(jī)測序。
[0005] ddRAD雖然在建庫流程上相比RAD做了一定程度的簡化,但仍然包括11步,因此實 驗耗時較長。同時ddRAD通過一個稀有酶與一個常見酶相結(jié)合對基因組DNA進(jìn)行雙酶切,運 種組合方式是基于酶切產(chǎn)生片段數(shù)目的考慮,但它限制了酶的選擇。另外,實驗流程使用了 磁珠純化DNAW及DNA片段自動回收儀器選擇片段,磁珠純化時需要使用的磁力架及DNA片 段自動回收儀Pippin-Pr邱都是較為貴重的試驗耗材和儀器,普通的分子實驗室難W配置。 此外,合成Pl接頭和P2接頭的寡核巧酸單鏈因需要使用高效液相色譜法化PLC)純化及末端 憐酸化,僅合成Pl接頭和P2接頭的花費就會造成普通的實驗室難W承受。進(jìn)一步ddRAD技術(shù) 流程提供的48種barcode序列長度完全一致,運會造成酶切位點位置堿基嚴(yán)重不平衡,從而 導(dǎo)致該位置測序質(zhì)量下降,無法根據(jù)質(zhì)量值判斷文庫酶切是否完全W及是否出現(xiàn)了星號活 性。大量的時間消耗和相對高的建庫費用嚴(yán)重制約了 ddRAD的廣泛應(yīng)用。因此,仍需要對現(xiàn) 有的ddRAD簡化基因組測序文庫構(gòu)建方法進(jìn)行改進(jìn),W克服現(xiàn)有方法選酶范圍有限、使用儀 器復(fù)雜、流程繁瑣、成本高昂W及酶切位點處堿基測序質(zhì)量低的缺陷,改善測序效率并使文 庫構(gòu)建能在人數(shù)為5-10人資金并不充裕的中小型實驗室得W順利實施,而不需要依賴于大 型的區(qū)域儀器中屯、或測序中屯、。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的主要目的在于提供一種雙酶切簡化基因組(Modified ddRAD,MiddRAD) 二代測序文庫構(gòu)建方法及配套試劑盒,W擴(kuò)大簡化基因組選酶范圍,減少對貴重儀器的依 賴,簡化建庫流程,節(jié)約成本,改善測序效率,使之更容易的被科研人員掌握并能在僅具有 常規(guī)儀器的普通分子實驗室中實現(xiàn)。與ddRAD-seq方法相比,MiddRAD-seq方法主要從W下 幾個方面做了改進(jìn)和優(yōu)化:
[0007] (I)MiddRAD-Seq方法使用兩種常見的限制性內(nèi)切酶進(jìn)行酶切組合,擺脫了必須依 靠一個稀有酶與一個常見酶相結(jié)合對基因組DNA進(jìn)行雙酶切的限制,擴(kuò)大了選酶的范圍;
[0008] (2)該方法將復(fù)雜的磁珠純化優(yōu)化為為簡單的柱式純化,從而擺脫了對磁力架的 依賴,將利用DNA片段自動回收儀選擇片段優(yōu)化為利用普通低烙點瓊脂糖凝膠切膠回收選 擇片段,從而擺脫了對貴重儀器Pippin-Pr邱的依賴,將使用Agilent2100 Bioanalyzer進(jìn) 行片段分布檢查優(yōu)化為使用普通低烙點瓊脂糖凝膠電泳檢查,從而擺脫了對精密儀器 Agilent2100 Bioanalyzer的依賴;
[0009] (3)該方法同時減少了純化酶切產(chǎn)物、連接前定量及混樣后純化連接產(chǎn)物的步驟, 簡化了建庫流程;
[0010] (4)該方法將Al接頭(原流程為Pl接頭)由37堿基簡化為25堿基(barcode按5堿基 計算),大大降低了接頭合成成本;
[0011 ] (5)該方法設(shè)計出一套新的barcode-adapter體系,含有20對長短不一的barcode, 可W整數(shù)倍(20*n)疊加使用,而不是原流程提供的48種等長的barcode,運不但增加了 barcode使用的靈活性,同時也提高了接頭位置堿基測序的質(zhì)量值,對于判斷文庫酶切是否 完全W及是否出現(xiàn)了星號活性提供了有力的保障。
[0012] 由于整個文庫構(gòu)建流程中間步驟盡可能地減少純化步驟,酶切片段隨機(jī)丟失也大 大減少,該高度簡化的文庫制備流程允許僅使用l(K)ng DNA即可完成文庫構(gòu)建。
[0013] 本發(fā)明的上述目的是通過W下技術(shù)方案加 W實現(xiàn)的:
[0014] -種雙酶切簡化基因組二代測序文庫構(gòu)建方法,該方法包括下述步驟:
[001引第1步、基因組DNA的提取:利用改良CTAB法提取基因組DNA,基因組DNA經(jīng)過瓊脂糖 凝膠電泳完整度檢測及微量分光光度計純度檢測,且稀釋成40~60ngAU;
[0016]第2步、基因組DNA的酶切:利用兩種常見限制性內(nèi)切酶對基因組DNA進(jìn)行酶切消 化,得到限制性酶切片段;
[0017]第3步、使用T4DNA連接酶對限制性片段連接上DNA條形碼接頭Al接頭和A2接頭,得 到形如"Al接頭-DNA插入片段-A2接頭"的序列對;
[0018] 第4步、將來自不同個體的"Al接頭-DNA-A2接頭"的序列對按預(yù)先設(shè)定的任意體積 比進(jìn)行混合;
[0019] 第5步、將混合物經(jīng)瓊脂糖凝膠電泳回收得到目標(biāo)DNA片段;
[0020] 第6步、W回收的DNA片段作為模板進(jìn)行PCR擴(kuò)增W富集目標(biāo)DNA片段;
[0021] 第7步、對PCR產(chǎn)物進(jìn)行純化;
[0022] 第8步、擴(kuò)增后的產(chǎn)物使用低烙點瓊脂糖凝膠電泳進(jìn)行片段分布檢查和文庫評價;
[0023] 第9步、使用如bit2.0定量并使用二代測序平臺上機(jī)測序。
[0024] 根據(jù)所述的方法,其中第2步所述的兩種限制性內(nèi)切酶為4-5堿基常見限制性內(nèi)切 酶,且不含稀有堿基限制性內(nèi)切酶。
[0025] 根據(jù)所述的方法,其中第3步所述的Al接頭由正鏈和負(fù)鏈組成:
[00%]正鏈:5 ' TACACGACGCTCTTCCGATCTXXXXX3 ',
[0027]負(fù)鏈:5 'GWCYYYYYAGATCGGAAGAGCGTCGTGTA3 '。
[002引其中:正鏈中的XXXXX代表DNA條形碼序列,負(fù)鏈中YYYYY代表與DNA條形碼互補(bǔ)序 列,W代表堿基A或T,所述的DNA條形碼由20個4-9堿基序列組成:AACAA、CCACC、TTGTT、 GGTGA、AACAGT、CCATGA、ATTGCC、TGGCTA、GAACATC、CCTAGCC、TTCGCAA、AGGTTCC、GAACATTA、 CCTAGAAT、TTCGCCTA、AGGATTCT、GAATAACAT、CCTCCTAGA、TTCTTCGCA、AGGAGGCTT。
[0029] 根據(jù)所述的方法,其中第3步所述的A2接頭由正鏈和負(fù)鏈組成:
[0030] 正鏈:5 ' CGATAGATCGGAAGAGCCTCTTAGC3 ',
[0031] 負(fù)鏈:5 'GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAT3 '。
[0032] 根據(jù)所述的方法,其中第6步所述的PCR擴(kuò)增中所采用的引物對由引物序列1.1和 引物序列2.1組成,其中:
[0033] 引物序列1.1為:
[0034] 5 ' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCC3 ',
[0035] 引物序列2.1為:
[0036] 5 ' CAAGCAGAAGACGGCATACGAGATNNNNNGTGACTGGAGTTCAGACGTGTGC3 ',
[0037] 其中:引物序列2.1中的NNNr^N代表index序列,用于區(qū)分不同的個體;index包括4 個序列:TTCAGT、GGAGTA、AAGCAC、CCTTCA。
[0038] 根據(jù)所述的方法,其中第7步所述的純化方法為過柱純化。
[0039] 根據(jù)所述的方法,其中第9步所述的二代測序平臺為Illumina Hiseq2000、 化3692500、化3694000或化369。
[0040] 本發(fā)明的一種雙酶切簡化基因組二代測序文庫構(gòu)建方法,更具體地是包括下述步 驟:
[0041 ] 第1步、基因組DNA提?。?br>[0042] 采用改良CTAB法分別提取兩種竹子的幼嫩葉