本申請要求2015年8月13日提交的美國臨時專利申請?zhí)?2/204,943的權(quán)益,所述專利申請全部以引用方式并入本文。
本發(fā)明的背景
DNA測序的策略可分組成多個類別。(Shendure,J.等人,“Advanced sequencing technologies:methods and goals,”Nat.Rev.Genet.,5(5):335-44,2004)。其包括(i)微電泳方法、(ii)通過雜交來測序、(iii)單一分子的實時觀察,和(iv)環(huán)狀陣列測序。可獲得的市售產(chǎn)品包括454測序(用于454Genome Sequencers,Roche Applied Science;Basel中)、Solexa技術(shù)(用于Illumina(San Diego)Genome Analyzer中)、SOLiD平臺(Applied Biosystems;Foster City,CA,USA)、Polonator(Dover/Harvard)和HeliScope Single Molecule Sequencer技術(shù)(Helicos;Cambridge,MA,USA)。
這些測序技術(shù)的一個共性是從生物樣品產(chǎn)生文庫。文庫制備通過DNA樣品的隨機片段化,隨后體外連接共同接頭序列來完成。此外,這些方法的共同點是從文庫中的任何給定單一片段化DNA分子產(chǎn)生的PCR擴增子最終在空間上聚集至平面基底上的單一位置(例如,原位聚合酶克隆、橋PCR),或微米尺度珠粒的表面(例如,乳液PCR)。
新的測序方法,通常被稱為下一代測序(NGS)技術(shù),可經(jīng)由測序技術(shù)來提供關(guān)于生物樣品的快速、廉價和精確基因組信息。舉例來說,高通量NGS(HT-NGS)方法可允許科學家以更大速度、較低成本并且以可接受的錯誤率來獲得所需測序信息。NGS的一個預先步驟是以適合于NGS技術(shù)的方式來制備生物樣品的核酸文庫,例如,具有條形碼的短序列文庫。因此,出于測序目的,需要發(fā)現(xiàn)構(gòu)建條形碼文庫的新方法。
發(fā)明概述
本公開提供構(gòu)建條形碼核酸文庫的方法和系統(tǒng)。舉例來說,本公開總體上提供制備條形碼測序文庫的方法和系統(tǒng)。這類文庫可適用于使用NGS的方法。如本文描述所產(chǎn)生的測序文庫依賴于芯片上的Y-接頭、消失和出現(xiàn)限制位點、酶的混合物和PCR循環(huán)。
本公開的方面提供從核酸構(gòu)建文庫的方法,方法包含:將核酸的至少一個拷貝安置于連接有多個接頭的表面上;將溶液施加至表面,溶液包含:能夠?qū)⒑怂嵯啥鄠€核酸片段的第一限制酶;能夠?qū)⒁粋€核酸片段的末端與一個接頭連接的連接酶;和能夠消化多個接頭之中的自身連接接頭的第二限制酶;并且形成第一文庫,第一文庫包含多個連接核酸片段,所述核酸片段具有一個接頭連接至其每個末端。
在本文提供方面的一些實施方案中,將核酸的至少一個拷貝安置于表面上的步驟包含將核酸的至少一個拷貝在表面上延伸。在本文提供方面的一些實施方案中,表面包含丙烯酰胺凝膠。在本文提供方面的一些實施方案中,表面是固體支撐物。在本文提供方面的一些實施方案中,每個Y形接頭是部分雙鏈Y形寡核苷酸接頭,所述接頭包含第一可連接末端,和包含兩個非互補鏈的第二未配對末端,其中非互補鏈的長度是至少約8個核苷酸。在本文提供方面的一些實施方案中,多個接頭包含多個第一接頭和多個第二接頭,其中第一接頭和第二接頭不同。在本文提供方面的一些實施方案中,第一限制酶的濃度高于溶液中的連接酶的濃度。在本文提供方面的一些實施方案中,第一限制酶的濃度是連接酶濃度的至少兩倍。在本文提供方面的一些實施方案中,連接核酸片段不超過600個堿基對長度。在本文提供方面的一些實施方案中,連接核酸片段不超過400個堿基對長度。
在本文提供方面的一些實施方案中,自身連接接頭在自身連接之后包含第二限制酶的限制位點。在本文提供方面的一些實施方案中,第一限制酶是II型限制性核酸內(nèi)切酶。在本文提供方面的一些實施方案中,第一限制酶識別4個堿基對限制位點、5個堿基對限制位點或6個堿基對限制位點。在本文提供方面的一些實施方案中,第一限制酶識別4個堿基對限制位點。在本文提供方面的一些實施方案中,第一限制酶是MspA1I限制性核酸內(nèi)切酶、PsiI限制性核酸內(nèi)切酶或Alu1限制性核酸內(nèi)切酶。在本文提供方面的一些實施方案中,第一限制酶是Alu1限制性核酸內(nèi)切酶。在本文提供方面的一些實施方案中,連接酶是T4連接酶。在本文提供方面的一些實施方案中,第二限制酶識別至少8個堿基對長度的限制位點。在本文提供方面的一些實施方案中,與第二限制酶相比,第一限制酶識別限制位點的較短序列。在本文提供方面的一些實施方案中,第二限制酶是Pme1限制性核酸內(nèi)切酶。在本文提供方面的一些實施方案中,方法進一步包含擴增第一文庫,從而產(chǎn)生擴增連接核酸片段的第二文庫。在本文提供方面的一些實施方案中,接頭包括充當分子條形碼的序列節(jié)段。在本文提供方面的一些實施方案中,每個接頭具有識別接頭在表面上的位置的獨特分子條形碼,并且其中分子條形碼作為連接核酸片段的一部分包含在內(nèi)。在本文提供方面的一些實施方案中,接頭包含由第二限制酶的限制位點的一半組成的可連接末端。在本文提供方面的一些實施方案中,連接核酸片段不包括第一限制酶或第二限制酶的限制位點。
本公開的另一個方面提供從核酸來構(gòu)建文庫的系統(tǒng),系統(tǒng)包含:連接有多個接頭的表面;能夠?qū)⒑怂嵯啥鄠€核酸片段的第一限制酶;能夠?qū)⒁粋€核酸片段的末端與一個接頭連接的連接酶;和能夠消化多個接頭之中的自身連接接頭的第二限制酶。
在本文提供方面的一些實施方案中,多個接頭是Y形接頭。在本文提供方面的一些實施方案中,第一限制酶的濃度大于連接酶的濃度。在本文提供方面的一些實施方案中,第一限制酶是II型限制性核酸內(nèi)切酶。在本文提供方面的一些實施方案中,第一限制酶識別4個堿基對限制位點、5個堿基對限制位點或6個堿基對限制位點。在本文提供方面的一些實施方案中,第一限制酶識別4個堿基對限制位點。在本文提供方面的一些實施方案中,與第二限制酶相比,第一限制酶識別限制位點的較短序列。在本文提供方面的一些實施方案中,第一限制酶是MspA1I限制性核酸內(nèi)切酶、PsiI限制性核酸內(nèi)切酶或Alu1限制性核酸內(nèi)切酶。在本文提供方面的一些實施方案中,連接酶是T4連接酶。在本文提供方面的一些實施方案中,第二限制酶是Pme1限制性核酸內(nèi)切酶。在本文提供方面的一些實施方案中,接頭包括充當分子條形碼的序列節(jié)段。在本文提供方面的一些實施方案中,每個接頭具有識別接頭在表面上的位置的獨特分子條形碼。在本文提供方面的一些實施方案中,接頭包含由第二限制酶的限制位點的一半組成的可連接末端。
本公開的其他方面和優(yōu)勢從以下詳細說明變得容易為本領(lǐng)域技術(shù)人員顯而易知,其中僅示出并描述本公開的例示性實施方案。如認識到,本公開能夠執(zhí)行其他和不同實施方案,并且其多個細節(jié)能夠在各種明顯方面加以修改,而都不背離本公開。因此,附圖和說明書在本質(zhì)上視為例示性,并且不是限制性的。
以引用方式并入
本說明書中提到的所有公布、專利和專利申請以引用的方式并入本文,引用程度如同已明確且個別地指示將各個別公布、專利和專利申請以引用的方式并入本文一般。
附圖簡述
本發(fā)明的特征和優(yōu)勢的更好理解參考闡明利用本發(fā)明原則的例示性實施方案的以下詳細說明和附圖來獲得,在附圖中:
圖1示出根據(jù)本公開的使用消失和出現(xiàn)限制位點連接的基因組文庫構(gòu)建的初始設置的示意圖。
圖2描繪在根據(jù)本公開的使用消失和出現(xiàn)限制位點連接的基因組文庫構(gòu)建期間的限制酶的作用的示意圖。
圖3示出在根據(jù)本公開的使用消失和出現(xiàn)限制位點連接的基因組文庫構(gòu)建期間的連接酶的作用的示意圖。
圖4展現(xiàn)在根據(jù)本公開的使用消失和出現(xiàn)限制位點連接的基因組文庫構(gòu)建期間的可能連接產(chǎn)物的示意圖。
圖5顯示在根據(jù)本公開的使用消失和出現(xiàn)限制位點連接的基因組文庫構(gòu)建期間的另一個可能連接產(chǎn)物的示意圖。
圖6示出在根據(jù)本公開的使用消失和出現(xiàn)限制位點連接的基因組文庫構(gòu)建期間的仍然另一個可能連接產(chǎn)物的示意圖。
圖7描繪根據(jù)本公開的具有用于Y-接頭的單鏈骨架的芯片的示例性初始設置的示意圖。
圖8示出根據(jù)本公開的Y-接頭引物雜交至圖7中的骨架上的示意圖。
圖9展現(xiàn)根據(jù)本公開的經(jīng)由骨架來延伸圖8中的Y-接頭引物的示意圖。
圖10顯示根據(jù)本公開的基因組DNA在Y-接頭芯片上延伸的示意圖。
圖11示出根據(jù)本公開的消化并連接于Y-接頭芯片上的基因組DNA的示意圖。
圖12描繪根據(jù)本公開的使用具有圖11中的消化并連接DNA的Illumina接頭1和2的PCR產(chǎn)物的示意圖。
圖13示出根據(jù)本公開的Y-接頭芯片上的具有特定序列的Y-接頭骨架(SEQ ID NO:3)。
圖14展現(xiàn)根據(jù)本公開的具有特定序列的Y-接頭引物(SEQ ID NO:4)雜交至圖13中的骨架(SEQ ID NO:3)。
圖15顯示根據(jù)本公開的經(jīng)由骨架(SEQ ID NO:3)延伸的圖14中的Y-接頭引物(SEQ ID NO:5)。
圖16示出根據(jù)本公開的圖15中的完整Y-接頭的剖析。骨架公開為SEQ ID NO:3并且引物公開為SEQ ID NO:5。
圖17描繪根據(jù)本公開的基因組DNA消化和與Y-接頭連接之后的兩個示例性PCR產(chǎn)物。
圖18示出根據(jù)本公開的芯片上的圖案化陣列的特征。
圖19展現(xiàn)根據(jù)本公開的在Y-接頭芯片上延伸的基因組DNA。
圖20顯示從根據(jù)本公開的方法得到的PCR產(chǎn)物的凝膠圖片。
圖21示出使用根據(jù)本公開的方法構(gòu)建的文庫中的基因組DNA的片段大小的分布。
圖22描繪圖21中的文庫的片段大小的計算、理論分布。
發(fā)明詳述
雖然本文已經(jīng)示出并描述本發(fā)明的各種實施方案,但是本領(lǐng)域技術(shù)人員顯而易知這些實施方案僅作為舉例來提供。許多改變、變化和取代可由本領(lǐng)域技術(shù)人員想到而不背離本發(fā)明。應了解可使用本文描述的本發(fā)明的實施方案的各種替代方案。
核苷酸序列信息是科學家和研究人員通過臨床手段或通過物質(zhì)手段來提高人類生活的基礎(chǔ),例如提高作物產(chǎn)量、研制更好的燃油、制造更好的疫苗、研制更有效的藥品、預防疾病或防止危險病原體的爆發(fā)。(參見Ansorge,W.,“Next-generation DNA sequencing techniques,”New Biotech.,25(4):195-203,2009)。許多并行DNA測序平臺已經(jīng)變得可用,并大大降低了DNA測序的成本。通過使基因組、轉(zhuǎn)錄組和相互作用組的綜合分析達到一個新的水平,NGS可以加快生物和生物醫(yī)學研究。(參見Shendure,J.和Ji,H.,“Next-generation DNA sequencing,”Nature Biotech.,26:1135-45,2008)。NGS的一個挑戰(zhàn)是開發(fā)產(chǎn)生測序文庫,例如,條形碼文庫的穩(wěn)健方案。
用于通常使用的NGS測序平臺諸如Illumina Genome Analyzer、Roche(454)Genome Sequencer、Life Technologies SOLiD平臺和‘實時’測序儀例如Pacific Biosciences的輸入材料需要從生物樣品得到的DNA片段的文庫。DNA片段由平臺特異性接頭來側(cè)接。構(gòu)建這類文庫的標準方法完全在體外并且通常包括將樣品DNA片段化(機械或酶促)、末端修磨、連接接頭序列、選擇片段大小和通過PCR來擴增。
在很多實驗努力后,申請人已經(jīng)發(fā)現(xiàn)用于制備測序文庫的新方法和系統(tǒng)。如本文描述所產(chǎn)生的測序文庫使用芯片上的Y-接頭、消失和出現(xiàn)限制位點、酶的混合物和多個PCR循環(huán)。在一些實施方案中,用分子條形碼來標記的測序文庫適合于在NGS反應中使用。
I.定義
所有術(shù)語旨在以它們由本領(lǐng)域技術(shù)人員所理解的方式來理解。除非另有定義,否則本文中使用的所有技術(shù)和科學術(shù)語具有與發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常理解的含義相同的含義。下列定義補充本領(lǐng)域中的定義,并且針對本公開內(nèi)容,并且不應歸功于任何相關(guān)或不相關(guān)的案例,例如,任何共同擁有的專利或申請。雖然與本文中所述的那些方法和材料相似或相等的任何方法和材料可用于實踐或測試本發(fā)明,但是本文描述優(yōu)選材料和方法。因此,本文使用的術(shù)語僅用于描述具體實施方案目的,并且不意欲具有限制性。
除非上下文另外明確規(guī)定,否則如本說明書和所附權(quán)利要求書中所用的,單數(shù)形式“一個/種(a)”、“一個/種(an)”以及“所述(the)”包括復數(shù)個指代物。因此,例如,提到“分子”包括多個這類分子等。
如本文使用的術(shù)語“片段”總體上是指特定區(qū)域的原始DNA序列或RNA序列的部分。
如本文使用,術(shù)語“核酸序列”或“核苷酸序列”是指具有給定核苷酸序列的核酸分子,可能需要知道所述核苷酸序列的存在或量。核苷酸序列可包含核糖核酸(RNA)或DNA,或從RNA或DNA得到的序列。核苷酸序列的實例是對應于天然或合成RNA或DNA包括基因組DNA和信使RNA的序列。序列的長度可為可擴增至核酸擴增產(chǎn)物或擴增子的任何長度,例如多達約20、50、100、200、300、400、500、600、700、800、1,000、1,200、1,500、2,000、5,000、10,000或超過10,000個核苷酸長度。
如本文使用,術(shù)語“模板”是指個別多核苷酸分子,可從所述多核苷酸分子通過核酸聚合酶來合成另一個核酸,包括互補核酸鏈。另外,模板可為能夠充當由核酸聚合酶催化的模板依賴性核酸聚合的模板的多核苷酸的一個或兩個鏈。使用此術(shù)語不應理解為將本公開的范圍限制于實際上在后續(xù)酶催化聚合反應中用作模板的多核苷酸。此外,模板可含有出于本領(lǐng)域普通技術(shù)人員已知的各種原因與所需擴增產(chǎn)物不互補的序列。
如本文使用,術(shù)語“PCR”或“聚合酶鏈反應”是指使用例如熱循環(huán)來使核酸變性、延伸并粘接的核酸酶促復制的熟知技術(shù)。
當兩個多核苷酸例如在相關(guān)測定條件下締合形成穩(wěn)定雙鏈體時,其“雜交”。核酸歸因于各種良好表征的物理-化學力,諸如氫鍵合、溶劑排除、堿基堆積等而雜交。核酸雜交的廣泛指導發(fā)現(xiàn)于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,第I部分第2章,“Overview of principles of hybridization and the strategy of nucleic acid probe assays”(Elsevier,New York)中。
如本文使用的術(shù)語“大約”或“幾乎”總體上是指定量的+/-15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%以內(nèi)。
如本文使用的術(shù)語“互補”是指例如在相關(guān)測定條件下與其“補體”形成穩(wěn)定雙鏈體的多核苷酸。典型地,彼此互補的兩個多核苷酸序列具有少于約20%堿基、少于約10%堿基、優(yōu)選地少于約5%堿基的錯配并且更優(yōu)選地沒有錯配。
如本文使用的“多核苷酸序列”或“核苷酸序列”或“核酸序列”是指核苷酸的聚合物(寡核苷酸、DNA、核酸等)或表示核苷酸聚合物的字符串,取決于上下文。從任何規(guī)定多核苷酸序列,可確定給定核酸或互補多核苷酸序列(例如,互補核酸)。
如本文在與限制酶相關(guān)時使用的術(shù)語“消化”是指DNA的受控分解,其使用具有已知識別和/或裂解位點的限制性內(nèi)切酶來實現(xiàn)。限制性內(nèi)切酶是執(zhí)行以下功能的酶:裂解DNA的糖-磷酸鹽骨架,通常僅幾個堿基鏈段的雙鏈DNA的兩個鏈。已經(jīng)分離到幾千種不同限制性內(nèi)切酶,其共同地展現(xiàn)幾百種不同序列特異性。
如本文在與限制酶相關(guān)時使用,“限制位點”或“限制識別位點”或“識別位點”是DNA分子上的含有特定(例如,4至8個堿基對長度)核苷酸序列的位置,所述核苷酸序列由限制酶識別來消化或切割。
如本文使用的“連接”是指在兩個或更多個核酸,例如寡核苷酸和/或多核苷酸的末端之間形成共價鍵或鍵合。鍵或鍵合的性質(zhì)可廣泛不同并且連接可酶促或化學執(zhí)行。如本文使用,連接通常酶促執(zhí)行以形成一個寡核苷酸的末端核苷酸的5′磷酸鹽與另一個寡核苷酸的3′羥基之間的磷酸二酯鍵。各種模板驅(qū)動連接反應描述于以下參考文獻中,所述參考文獻以引用方式并入:Xu和Kool,Nucleic Acids Research,27:875-881,1999;Higgins等人,Methods in Enzymology,68:50-71,1979;Engler等人,The Enzymes,15:3-29,1982。
如本文使用的術(shù)語“DNA聚合酶”是指將DNA分子從其核苷酸結(jié)構(gòu)單元來加以合成的細胞或病毒酶。
如本文使用的術(shù)語“陣列”,在描述裝置、系統(tǒng)、傳感器、樣品腔室等時,是指微觀結(jié)構(gòu)的一維或二維集合。陣列可為任何形狀。舉例來說,陣列可為以線來布置的一系列微觀結(jié)構(gòu),諸如正方形陣列。陣列可以正方形或矩形網(wǎng)格來布置。可存在通過間隔來與陣列的其他區(qū)段分開的陣列區(qū)段。陣列可具有其他形狀。舉例來說,陣列可為以一系列同心圓形、一系列同心正方形、一系列同心三角形、一系列曲線等來布置的一系列微觀結(jié)構(gòu)。陣列區(qū)段之間或任何陣列中的微觀結(jié)構(gòu)之間的間隔可為有規(guī)則的或可在特定區(qū)段之間或在特定對的微觀結(jié)構(gòu)之間不同。本發(fā)明的微觀結(jié)構(gòu)陣列可包含具有零維、一維或二維形狀的微觀結(jié)構(gòu)。具有二維形狀的微觀結(jié)構(gòu)可具有形狀諸如正方形、矩形、圓形、平行四邊形、五邊形、六邊形、不規(guī)則形狀等。
II.方法和系統(tǒng)
本公開提供方法、裝置和系統(tǒng)以使得能夠構(gòu)建條形碼核酸文庫。本公開的方法、裝置和系統(tǒng)可包含部件,其包括但不限于:
1.芯片,其包含用于連接Y-接頭的固體或半固體基底?;卓砂ㄒ换蚨鄠€由相同或不同材料制成的層,諸如金屬、玻璃、半導體、合成或天然材料和有機或無機材料??捎糜谛纬苫椎牟牧系姆窍拗茖嵗砂úA?、石英、硅、硅基材料(例如氮化硅或二氧化硅)、金屬、塑料、聚合物材料(例如熱固性、彈性體、熱塑性、聚苯乙烯、尼龍、聚多巴胺(PDA)、聚氯乙烯(PVC)、聚(二甲基硅氧烷)(PDMS)、聚偏二氟乙烯等)、紙、水凝膠或其組合?;卓刹捎酶鞣N形狀,1維、2維或3維,諸如薄片、球體、立方體、長方體、錐體、圓柱體、棱柱、角錐體、管、板、圓盤、棒或任何規(guī)則或不規(guī)則形狀。另外,芯片可包括數(shù)百萬個微米尺度特征,其中的每一個可進一步連接至Y-接頭。
基底可進一步包含表面。基底的表面可為平坦表面、彎曲表面或具有凸起和/或凹陷區(qū)域的表面,所述區(qū)域可有利于實施本公開的方法。表面上的凸起/凹陷區(qū)域可為連續(xù)、半連續(xù)或不連續(xù)。在一些情況下,基底的表面可具有交替凸起和凹陷區(qū)域(例如,孔,所述孔可保持溶劑,即適合于執(zhí)行本公開方法的試劑)。在一些情況下,基底的表面劃分成許多獨立區(qū)段并且每個個別區(qū)段包含多個不同位置,其中的每一個可保持聚合物分子,諸如多聚核酸。
基底的表面可進行修飾以促進或有助于產(chǎn)生或合成這類聚合物。舉例來說,如果使用光刻技術(shù),基底表面可用對光不穩(wěn)的保護基團來修飾。一旦表面經(jīng)由光刻掩模來照明,則反應性羥基可在照明區(qū)域中產(chǎn)生并且聚合物分子的單體或亞單位可連接至其上。通過連續(xù)地添加單體或亞單位至預先存在的鏈,聚合物分子得以合成。在一個實例中,將在5′羥基處用對光不穩(wěn)的基團來保護的3′活化脫氧核苷提供至表面以使得偶合在已經(jīng)曝露于光的位點處發(fā)生。脫氧核苷的5’-末端的保護防止后續(xù)不必要的(光)化學反應。選擇性光去保護和偶合循環(huán)可重復直到獲得所需探針組為止。此過程的變化可使用通過光刻技術(shù)來選擇性圖案化的聚合物半導體光阻劑,而非使用對光不穩(wěn)的5′保護基團。在一些情況下,在添加每個單體或亞單位時,使用光活化保護性基團。這類光活化保護性基團本身對于光敏感并且可在曝露于光時活化。
2.Y-接頭,其為具有兩個DNA鏈的接頭,所述鏈的一部分不彼此互補,從而形成單鏈DNA臂的叉。Y-接頭的非互補臂可含有不同元件諸如標識符、測序接頭、引物結(jié)合位點等。在Y-形狀的頂端,Y的一個臂不同于Y的另一個臂。Y-形狀的底端是雙鏈(即含有互補鏈)。如本文使用,Y-接頭和Y形接頭為相同的。
接頭附接至DNA片段的實現(xiàn)方法如下:將Y-接頭連接至DNA片段的一個或兩個5′-或3′-末端,然后任選地執(zhí)行初始引物延伸反應,其中形成與固定寡核苷酸互補的延伸產(chǎn)物。此步驟任選地包含將接頭-片段-構(gòu)建體倍增的擴增步驟。有分叉的或Y-接頭可通過DNA連接酶來連接至DNA片段的兩個末端。僅Y-接頭的雙鏈底端能夠連接至片段DNA。
在本發(fā)明中使用時,Y-接頭DNA連接至雙鏈DNA片段的兩個末端,其中接頭DNA的一個鏈連接至DNA片段的一個5′-末端并且其另一個鏈連接至DNA片段的相應3′末端,并且這在DNA片段的兩側(cè)發(fā)生。Y-接頭的序列可通過考慮各種因素來確定,所述因素包括但不限于用于DNA片段文庫的DNA測序技術(shù)或系統(tǒng)的類型;和在構(gòu)建DNA片段文庫之后或期間的用于PCR過程的引物。
3.酶混合物,其包含將DNA分子消化成片段的第一限制酶;將DNA片段連接至Y-接頭的雙鏈末端的連接酶;和切割自身連接Y-接頭的第二限制酶。第一限制酶與第二限制酶的不同之處在于與后者相比,前者識別限制位點的較短序列。此外,在基因組DNA和Y-接頭存在下,在酶混合物中一起使用時,與第二限制酶相比,第一限制酶可更經(jīng)常切割基因組DNA;并且與第一限制酶相比,第二限制酶可更經(jīng)常切割自身連接Y-接頭。這可例如通過設計Y-接頭以使得在自身連接時,連接接合處形成第二限制酶的限制位點來實現(xiàn)。
一旦限制性核酸內(nèi)切酶遇到其在DNA分子上的特定識別序列,則它結(jié)合至DNA分子并且在雙螺旋的兩個糖-磷酸鹽骨架的一個或兩個中進行切割。此切割/這些切割的位置通過限制性核酸內(nèi)切酶的特性來確定。一旦DNA分子在至少一個位置處裂解,則它斷裂成片段。限制性內(nèi)切酶對稱地切割DNA骨架并且留下鈍端或在不彼此直接相對的位置中裂解DNA骨架,從而產(chǎn)生單鏈末端(粘性末端)。在任何情況下并且除了潛在粘性末端以外,由限制性核酸內(nèi)切酶建立的DNA片段是雙鏈。
在一個實施方案中,必須注意確保第一限制酶的相同限制位點應在連接DNA片段之后再次出現(xiàn)。在另一個實施方案中,類似地應注意關(guān)于接頭的自身連接和其消化,因為接頭在自身連接時提供用于第二限制酶的限制位點;自身連接接頭在由第二限制酶消化之后再次改變回到原始接頭。
在一個實施方案中,與第二限制酶相比,第一限制酶識別較短限制位點。在另一個實施方案中,第一限制酶識別4個堿基對(bp)的限制位點。在一個實施方案中,第一限制酶識別5bp或6bp的限制位點。限制位點的長度的選擇取決于插入DNA片段的所需大小,因為II類限制酶切割DNA基底的頻率主要隨著酶敏感的限制位點的長度而變化。用于限制酶的更長限制位點導致在DNA鏈中的任何點處具有供酶消化的位點的較低可能性。理論上,識別4bp限制位點的酶將在消化之后產(chǎn)生DNA片段的256bp平均大小。識別5bp或6bp限制位點的酶可產(chǎn)生平均大于256bp,即分別平均1,016bp和4,064bp的DNA片段。在一個實施方案中,第一限制酶在消化之后在DNA基底上留下鈍端。在另一個實施方案中,第二限制酶可識別8bp或更長限制位點。理論上,識別8bp限制位點的酶將在消化之后產(chǎn)生DNA片段的65,536平均大小。在另一個實施方案中,第二限制酶在消化之后在DNA基底上留下鈍端。
在通過第一或第二限制酶消化之后的粘性末端需要在消化之后DNA產(chǎn)物的特殊處理。舉例來說,使用特殊連接酶來形成DNA序列的兩個粘性末端之間的共價鍵,不論它是來自DNA片段或接頭。
在一個實施方案中,接頭的設計使得在將接頭與DNA片段連接之后,連接產(chǎn)物,即,接頭-DNA片段,不提供用于第一限制酶的限制位點。在另一個實施方案中,連接產(chǎn)物,即,接頭-DNA片段,不提供用于第二限制酶的限制位點。在仍然另一個實施方案中,自身連接接頭提供用于第二限制酶的限制位點。
在一個實施方案中,第一限制酶是MspA1I限制酶。在另一個實施方案中,第一限制酶是PsiI限制酶。在酶混合物的一個實施方案中,第一限制酶是Alu1,其為4bp切割限制酶并且可將基因組DNA切割成例如約256bp長度的片段。它識別5’-AG^CT-3’位點并且在37℃下在補充有10mM ATP的Cutsmart緩沖液中最佳切割。在一個實施方案中,連接酶是T4DNA連接酶,可催化粘著末端或鈍端化配置中的相鄰核苷酸的5′-磷酸鹽與3′-羥基之間的DNA兩個鏈的共價鍵形成。在一個實施方案中,第一限制酶的濃度高于連接酶的濃度。在另一個實施方案中,第一限制酶的濃度是連接酶的濃度約1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、3.0、5.0或10.0倍。在仍然另一個實施方案中,第一限制酶的濃度是連接酶的濃度至少1.2、1.3、1.4、1.5、2、3、4、5、6、7、8、9、10、20或30倍。在一個實施方案中,連接酶的濃度高于第二限制酶的濃度。在另一個實施方案中,連接酶的濃度是第二限制酶的濃度約1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2.0倍。在仍然另一個實施方案中,連接酶的濃度是第二限制酶的濃度至少2、3、4、5、6、7、8、9、10、20或30倍。在一個實施方案中,第一限制酶:連接酶:第二限制酶的酶比率是3:2:1。
在一個實施方案中,第二限制酶識別8bp限制位點。在另一個實施方案中,第二限制酶識別至少8bp長度的限制位點。在一個實施方案中,第二限制酶是Pme1,其識別5’-GTTT^AAAC-3’位點。Pme1對于甲基化敏感。另外,在含有5’-GTTTAAAC-3’序列的替代可用識別位點存在下,Pme1以小得多的頻率來切割基因組DNA。因此,如果Y-接頭的雙鏈末端分別在每個鏈上含有3’-TTTG和5’-AAAC,那么不同Y-接頭之間的自身連接產(chǎn)物可形成由Pme1識別的限制位點,并且自身連接的Y-接頭可由Pme1切割。因為基因組DNA含有用于Pme1的8-bp限制位點的頻率較低,所以Pme1極少切割基因組DNA。即使基因組DNA由Pme1切割,酶混合物的連接酶可修復切割或?qū)⑺肈NA片段與Y-接頭連接。
雖然上述實例描述包括Alu1限制酶、T4DNA連接酶和Pme1限制酶的酶混合物的一個實施方案;但是酶混合物的其他組合是可能的。
在一個實施方案中,包含DNA片段的基因組DNA文庫使用本文公開方法的Y-接頭消失和出現(xiàn)限制位點來形成。所述方法包含至少三個步驟:
1)將基因組DNA延伸于Y-接頭芯片上;
2)將延伸基因組DNA在Y-接頭芯片上與酶混合物一起培育;并且
3)進行多個PCR循環(huán)。
現(xiàn)在參看附圖,并且具體參考圖1,描繪使用消失和出現(xiàn)限制位點連接的基因組文庫構(gòu)建的示例性設置,其中可利用本公開的各種實施方案。在芯片100的表面上存在多個接頭102、104和106,其能夠與DNA片段連接。在接頭102、104和106頂部存在延伸形式的DNA108,其可為接頭修飾芯片100表面上的延伸基因組DNA。
基因組DNA可通過各種手段來延伸,包括但不限于使用交流電(AC)電場(Kaji,N.,“Molecular stretching of long DNAin agarose gel using alternating current electric fields,”Biophys.J.,82(1Pt 1):335-44,2002)、使用雙曲線收縮微通道中的電場梯度(Randall,G.C..等人,“Methods to electrophoretically stretch DNA:microconstractions,gels,and hybrid gel-microconstraction devices,”Lab.Chip,6(4):516-25,2006)、使用光學鑷均勻流(Smith,S.B.等人,“Overstretching B-DNA:the elastic response of individual double-stranded and single-stranded DNA molecules,”Science,271:795-9,1996)、使用均勻流(Perkins,T.T.等人,“Stretching of a single tethered polymer in a uniform flow,”Science,268:83-7,1995)、使用均勻電場(Ferree,S.等人,“Electrokinetic stretching of tethered DNA,”Biophys.J.,85(4):2539-46,2003)、使用聲學力光譜學(AFS)(Sitters,G.等人,“Acoustic force spectroscopy,”Nat.Methods,12(1):47-50,2015)、強制DNA進入納米通道(Tegenfeldt,J.O.等人,“The dynamics of genomic-length DNA molecules in 100-nm channels,”Proc.Natl.Acad.Sci.U.S.A.,101(30):10979-83,2004)、多個流的流體動力學聚焦(Wong,P.K.等人,“Deformation of DNA molecules by hydrodynamic focusing,”J.Fluid.Mech.,497:55-65,2003)和表面上的動態(tài)梳理(Dimalanta,E.T.等人,“A microfluidic system for large DNA molecule arrays,”Anal.Chem.,76(18):5293-301,2004)。
現(xiàn)在轉(zhuǎn)向圖2,示出第一限制酶110的作用。第一限制酶110可在由第一限制酶110識別的限制位點處將延伸DNA108切割成DNA片段108A和108B。
在切割DNA108之后,如圖3中示出,連接酶112可將兩個DNA片段108A和108B重新連接回到DNA108,如圖1中示出,或可經(jīng)由共價鍵114將一個DNA片段例如108B與接頭例如接頭102連接,以給出如圖4中示出的連接產(chǎn)物。
根據(jù)本公開的酶混合物系統(tǒng)的一個優(yōu)勢是它驅(qū)動基因組DNA內(nèi)和接頭之間的消失和出現(xiàn)限制位點。這些消失和出現(xiàn)限制位點進而驅(qū)動在片段的兩個末端上具有附接接頭的基因組片段的形成。
在一方面,酶混合物系統(tǒng)在基因組DNA內(nèi)產(chǎn)生消失和出現(xiàn)限制位點。首先,因為基因組DNA較長,使用存在可用于由第一限制酶110消化的許多限制位點。通過選擇限制位點的長度,可控制所得DNA片段的平均長度,如以上論述。當切割基因組DNA時,限制位點大量地消失。其次,如果DNA片段通過連接酶來連接,那么相同限制位點得以重建并且保持完整。因此,此再現(xiàn)限制位點可仍然通過第一限制酶來切割。第三,隨著時間的推移,所產(chǎn)生的DNA片段連接至接頭。這類連接永久地破壞用于第一限制酶的限制位點并且使得在形成連接接頭-DNA片段時,用于第一限制酶的限制位點永久地消失。這由接頭序列的設計導致以使得新產(chǎn)生接頭-DNA片段序列不提供用于第一限制酶或第二限制酶的出現(xiàn)限制位點。
在另一方面,酶混合物系統(tǒng)在接頭之間產(chǎn)生消失和出現(xiàn)限制位點。具體來說,連接酶可連接兩個接頭并且使得其無法用于與DNA片段的所需連接。然而,歸因于接頭的設計,自身連接接頭提供用于第二限制酶的出現(xiàn)限制位點,按照設計,所述第二限制酶與第一限制酶相比識別更長限制位點。因此,自身連接接頭中的出現(xiàn)更長限制位點可由第二限制酶來切割,從而導致這些更長限制位點的消失。另外,一旦接頭連接至DNA片段,此接頭永遠停止可用于與另一個接頭的自身連接,并且因此在形成連接接頭-DNA片段時,用于第二限制酶的可用更長限制位點永久地消失。
總體上,依賴于在接頭和基因組DNA和其片段上或其之間的消失和出現(xiàn)限制位點,酶混合物將整個系統(tǒng)的平衡朝向形成基因組片段來轉(zhuǎn)變,所述基因組片段在片段的兩個末端上具有所附接的接頭。
圖2-4示出的消化和連接過程可重復多次以給出在兩個末端處由接頭連接的DNA片段,例如,圖5中的連接至接頭102和106的DNA片段108C,其中DNA片段108C形成與接頭102的共價鍵114和與接頭106的共價鍵116。其他DNA片段108A和108D可經(jīng)歷圖2-5示出的類似過程并且提供其他接頭連接DNA片段以構(gòu)建DNA文庫,例如,基因組DNA文庫。
圖6是展示在連接酶112存在下的另一個可能性的示意圖,所述連接酶可連接兩個接頭以在兩個接頭102和104之間形成共價鍵118。第二限制酶120可切割兩個接頭102和104之間的共價鍵118以使得兩個再生接頭102和104變得可用于與其他DNA片段連接。上述過程的最終結(jié)果是產(chǎn)生DNA片段文庫,其中每個片段在兩個末端上與接頭鍵結(jié)。
本公開的系統(tǒng)和方法的更詳細實例在圖7-12中示出?,F(xiàn)在參看圖7,DNA文庫的構(gòu)建開始于單鏈Y-接頭骨架202、204和206經(jīng)由其3’末端來共價連接至芯片200。從3’末端開始的Y-接頭骨架202的序列是流槽2’210、條形碼212和序列引物2’220。從3’末端開始的Y-接頭骨架204的序列是流槽2’210、條形碼214和序列引物2’220。從3’末端開始的Y-接頭骨架206的序列是流槽2’210、條形碼216和序列引物2’220。
如圖8描繪,Y-接頭引物230可雜交至Y-接頭骨架202、204和2006的流槽2’210。從5’末端起始的Y-接頭引物230的序列是Y-主干232和流槽2’互補片段234,其中流槽2’互補片段234與Y-接頭骨架202、204和206的流槽2’210的互補區(qū)段雜交。
如圖9展示,雜交Y-接頭引物230可在每個結(jié)合Y-接頭骨架的條形碼區(qū)域和序列引物區(qū)域上延伸。具體來說,雜交于Y-接頭骨架202上的Y-接頭引物230從其3’末端以與212互補的條形碼242和與220互補的序列引物2250來延伸以給出完整Y-接頭Y-鏈252。雜交于Y-接頭骨架204上的Y-接頭引物230從其3’末端以與214互補的條形碼244和與220互補的序列引物2250來延伸以給出完整Y-接頭Y-鏈254。雜交于Y-接頭骨架206上的Y-接頭引物230從其3’末端以與216互補的條形碼246和與220互補的序列引物2250來延伸以給出完整Y-接頭Y-鏈256。在此階段,芯片200修飾與多個Y-接頭由組成Y-接頭骨架和Y-接頭Y-鏈:202/252鏈,204/254鏈,和206/256鏈。
然后將基因組DNA 260安置并延伸于Y-接頭202/252、204/254和206/256的表面上,如圖10中示出。在酶混合物存在下并且借助于根據(jù)本公開的用于連接的消失和出現(xiàn)限制位點,基因組DNA 260可由第一限制酶消化以產(chǎn)生多個片段,其中的一個可由基因組DNA片段鏈260A和260B組成,如圖11描繪。借助于連接酶和第二限制酶,基因組DNA片段鏈260A可在其3’末端上連接至Y-接頭骨架202并且在其5’末端上連接至Y-接頭Y-主干256。同樣地,基因組DNA片段鏈260B可在其3’末端上連接至Y-接頭骨架206并且在其5’末端上連接至Y-接頭Y-主干252。
現(xiàn)在轉(zhuǎn)向圖12并且關(guān)注基因組DNA片段鏈260A,可在此階段添加用于NGS測序的其他接頭,例如,Illumina接頭1和2,并且PCR反應可使用由此獲得的DNA片段來進行以產(chǎn)生PCR產(chǎn)物270。從3’末端起始的PCR產(chǎn)物270的序列是Illumina接頭1 272、流槽2’210、條形碼212、序列引物2’220、基因組DNA片段260A、序列引物2 250、條形碼246、Y-接頭引物230(其由流槽2’互補片段234和Y-主干232組成)和Illumina接頭2 274。如由PCR產(chǎn)物270展示,基因組DNA片段260A現(xiàn)在具有兩個不同條形碼的不對稱末端序列。基因組DNA片段260A的這類組成可給出起始基因組DNA 260的位置信息。
本公開的系統(tǒng)和方法的另一個詳細實例,尤其Y-接頭的設計,在圖13-17中示出?,F(xiàn)在轉(zhuǎn)向圖13,構(gòu)建DNA文庫開始于單鏈Y-接頭骨架402經(jīng)由Y-接頭骨架402的3’末端來共價連接至芯片400。
參看圖14,Y-接頭引物404可雜交至Y-接頭骨架402。從5’末端起始的Y-接頭引物404的序列是SEQ C 408和SEQ A’406,其中SEQ A’406與Y-接頭骨架402的互補區(qū)段雜交。
如圖15展示,雜交Y-接頭引物404可在Y-接頭骨架402上延伸以給出Y接頭Y-鏈410。具體來說,雜交于Y-接頭骨架402上的Y-接頭引物404從其3’末端以序列412來延伸。在此階段,芯片400與多個Y-接頭修飾,包括Y-接頭460,其由Y-接頭骨架402和Y-接頭Y-鏈410組成。
圖16示出所獲得的Y-接頭460的完整剖析。Y-接頭460由兩個鏈:Y-接頭骨架402和Y-接頭Y-鏈410組成。從5’末端起始的Y-接頭骨架402的序列包含用于Pme1的限制位點的一半422、條形碼終止信號424、條形碼序列426(其中V表示A、C或G中的任何一個,并且N表示A、T、C和G中的任何一個)、SEQ A428和SEQ B 430。從3’末端起始的Y-接頭Y-鏈410的序列包含用于Pme1的限制位點另一半434、條形碼終止信號436、條形碼序列438、SEQ A’440和SEQ C 442。如以上論述,序列5’-GTTTAAAC-3’是用于Pme1限制酶的限制位點。因此,如果兩個Y-接頭460自身連接,連接產(chǎn)物在接合處含有序列5’-GTTTAAAC-3’,從而成為供Pme1限制酶切割的基底。
以下是兩個PCR引物,其被設計來與Y-接頭460末端上的不同5’和3’序列介接并且引入Illumina流槽序列(以非粗體示出的FC1和FC2):
AATGATACGGCGACCACCGAGATCTACACATGATGATGCTGATC AGCGT-3’(SEQ ID NO:1)
CAAGCAGAAGACGGCATACGAGATGAAGTACTGTGGCGTGG-3’(SEQ ID NO:2)
在根據(jù)本公開來消化基因組DNA并且將基因組DNA片段連接至Y-接頭之后,來自圖16的使用以上公開PCR引物來由此獲得的基因組DNA片段的PCR可在至少兩個PCR循環(huán)之后給出圖17所示產(chǎn)物?;蚪MDNA片段文庫的這些PCR產(chǎn)物可進一步通過測序過程,例如,Illumina測序過程來處理。
參看圖18,根據(jù)本公開的芯片可具有數(shù)百萬個條形碼特征的圖案化陣列,如圖18中示出。這些條形碼特征可在芯片上具有可識別位置并且其條形碼(嵌入于相應Y-接頭中)可被設計來反映其可識別位置。在這些條形碼連接至基因組DNA片段之后,每個片段可攜帶關(guān)于DNA片段的末端位于芯片上的可識別位置的信息。因為基因組DNA延伸于Y-接頭陣列上,與不同基因組DNA片段相關(guān)聯(lián)的可識別位置信息可提供基因組DNA片段與基因組DNA定向之間的相對距離有關(guān)的信息。因此,本公開的系統(tǒng)和方法可識別基因組DNA的位置和向量。
III.實施例
1.芯片容量設置
將Y-接頭負載凝膠安置于具有cis溶液中的0.5μg人基因組DNA的平行銅板之間。將50mV電壓電位施加至平行銅板2分鐘。
圖19描繪使用上述芯片容量設置來延伸的DNA的圖片。解開的DNA明顯地延伸于表面上。
2.使用消失和出現(xiàn)限制位點的消化和連接
在將基因組DNA容量施加至凝膠之后,酶混合物包含Alu1限制酶、T4DNA連接酶和Pme1限制酶,并且將緩沖液施加至以上獲得的凝膠。作為比較,還進行Pme1限制酶從以上酶混合物省去的對照實驗。延伸基因組DNA用Alu1來消化并且使用T4DNA連接酶來連接DNA片段直至Y-接頭負載凝膠形成文庫。在此酶處理之后,將凝膠刮落至PCR管中以便進行初步分析。
圖20顯示在使用消失和出現(xiàn)限制位點來消化和連接之后所獲得的PCR產(chǎn)物的瓊脂糖凝膠電泳圖片。泳道1對應于在不添加Pme1限制酶的情況下,在從Y-接頭/DNA容量凝膠的5個PCR循環(huán)之后從DNA片段文庫獲得的PCR產(chǎn)物。泳道1中接近于底部的亮點對應于自身連接Y-接頭。泳道2對應于在自身連接Y-接頭的低鹽Pme1消化存在下,隨后20個PCR循環(huán),從DNA片段文庫獲得的PCR產(chǎn)物。與泳道1比較,對應于自身連接Y-接頭的亮點在泳道2中消失。這一觀察結(jié)果暗示添加Pme1限制酶有助于消化自身連接Y-接頭并且使得Y-接頭可用于DNA片段捕獲。另外,泳道1和2的比較示出DNA片段相比于自身連接Y-接頭的相對量增加,如與泳道1相比,在泳道2中的自身連接Y-接頭點上方擴散的條帶的強度增加所證明。泳道3對應于在與泳道2中所獲得的文庫相似的DNA片段文庫的大小選擇和凈化之后的PCR產(chǎn)物。選定大小是200bp至600bp。文庫濃度是6nM并且準備在MiSeq機器上測序。如果按照設計,自身連接Y-接頭約100bp長度,文庫構(gòu)建之后的下游大小選擇步驟可通過將選擇大小設定為高于預定數(shù)目,例如,150bp、200bp或250bp來移除仍然保留在粗文庫中的連接Y-接頭。
圖21展示使用Alu1消化和測序所獲得的文庫中的DNA片段大小的分布。圖22描繪在圖21中使用的相同基因組DNA在根據(jù)New England BioLabs,Inc.來Alu1消化之后的片段大小的理論分布。圖21和22的比較示出理論預測與所獲得的實驗結(jié)果完全匹配。
雖然本文已經(jīng)示出并描述本發(fā)明的優(yōu)選實施方案,但是本領(lǐng)域技術(shù)人員顯而易知這些實施方案僅作為舉例來提供。許多變異、變化和取代現(xiàn)在將由本領(lǐng)域技術(shù)人員想到而不背離本發(fā)明。應了解本文描述的本發(fā)明的實施方案的各種替代方案可用于實施本發(fā)明。規(guī)定以下權(quán)利要求定義本發(fā)明范圍并且這些權(quán)利要求和其均等物范圍內(nèi)的方法和結(jié)構(gòu)由此得以覆蓋。
3.在芯片上使用Y接頭和消失限制位點來延伸并組裝基因組文庫的實驗細節(jié)
具有寡核苷酸402的條形碼芯片陣列如圖13中所示來合成。接頭寡核苷酸404在5μM濃度下懸浮于補充有25mM MgCl2的10x SSC緩沖液中。
五十微升寡核苷酸404溶液沉積于芯片陣列上,安置于加濕腔室中以防止蒸發(fā),并且在50℃下培育5小時。
將加濕腔室從培育器移除并且允許冷卻至室溫。然后芯片陣列用4x SSC沖洗兩次,然后用2x SSC沖洗兩次,然后用0.5x SSC沖洗兩次。每個沖洗緩沖液預冷卻至4℃。最后,芯片陣列浸泡于1mL的1x Thermopol緩沖液中以使雜交寡核苷酸402和404平衡并且將其制備以便通過BST聚合酶來延伸。
1X Thermopol緩沖液、20mM dNTP和10單位BST聚合酶大片段(所有試劑購自New England Biolabs)的50μl溶液沉積至雜交芯片陣列上并且允許在加濕腔室中、在50℃下培育3小時。
現(xiàn)在將具有雙鏈DNA的延伸的雙鏈芯片陣列在冰冷MES緩沖液(50mM,pH 5.5)中洗滌4次并且將人基因組DNA制備以便延伸至陣列上。
人基因組DNA購自Promega并且在MES緩沖液(50mM,pH 5.5)中稀釋至50pg/μl的最終濃度。隨后,將1.25mL的基因組DNA溶液轉(zhuǎn)移至延伸小池。將芯片陣列夾持在延伸機上并且浸沒于小池中的基因組DNA溶液中歷時1小時。
正好在收回陣列之前,使用連接至電壓源的兩個銅板作為平行板電容器,垂直于芯片陣列的平面來施加電場。電場的計算強度是22,500牛頓/庫侖。一旦電場接通,陣列以67μm/sec的速率從小池中的基因組DNA溶液中收回。
然后允許陣列在冰冷Cutsmart緩沖液中培育以移除來自延伸的任何殘留MES緩沖液。
120μL酶混合物制備如下:84μl H2O、12μL Cutsmart緩沖液、12μL ATP(最終濃度10mM)、6μL(60單位)Alu1限制酶、4μL(40單位)T4DNA連接酶、2μL(20單位)Pme1限制酶,得到Alu1:T4:Pme1的最終比率為3:2:1。
酶混合物(120μL)安置于其上具有延伸DNA的雜交并延伸陣列上并且允許在37℃下培育2小時。這是允許消失和出現(xiàn)限制位點形成文庫的反應。
現(xiàn)在連接至芯片陣列的文庫在冰冷Cutsmart緩沖液中沖洗3次。
將芯片陣列安置于PCR管中或替代地,可建立玻片PCR反應。在5個循環(huán)的PCR之后,(使用引物與Y接頭的兩個不同末端接合并且在末端包括Illumina流槽序列,如以上在圖16描述之后所展示),快速Pme1消化在37℃下在低鹽(0.5x Cutsmart緩沖液)中進行30分鐘以消化在與基因組DNA的以前連接/消化反應期間未切割的任何自身連接Y接頭。圖20中的泳道1和泳道2展示在來自相同文庫的Pme1消化前后所獲得的凝膠圖片。
最后,將文庫清理并且通過使用珠?;蚰z萃取試劑盒來進行大小選擇。舉例來說,來自Qiagen的凝膠萃取試劑盒用于進行大小選擇并且從文庫中選擇的片段在200-750bp范圍內(nèi)。在所有上述步驟之后的文庫可在5-12nM濃度范圍內(nèi)。圖20的泳道3中的凝膠展示6nM濃度的文庫,其可繼續(xù)在Illumina MiSEQ上進行測序。然后制備文庫以便遵循制造商的方案用于Illumina機器。