專(zhuān)利名稱(chēng):分子內(nèi)核酸重排的組合物和方法
分子內(nèi)核酸重排的組合物和方法
背景技術(shù):
我們已經(jīng)描述了標(biāo)記片段化基因組群體內(nèi)各成員,然后將它們混合在一起產(chǎn)生能作為混合物進(jìn)行加工和最終測(cè)序的‘群體文庫(kù)’的方法。群體標(biāo)簽使得分析軟件能夠?qū)⑿蛄凶x數(shù)解析到歸為該群體中特定基因組的文件內(nèi)??傮w方法的一個(gè)限制源于已有DNA測(cè)序技術(shù)的局限。具體說(shuō),如果基因組的感興趣區(qū)域中的片段比具體技術(shù)的可測(cè)序長(zhǎng)度長(zhǎng),則無(wú)法完全分析這類(lèi)片段(因?yàn)闇y(cè)序從片段的一端向內(nèi)進(jìn)行)。而且,任何片段化依賴(lài)性測(cè)序技術(shù)的缺點(diǎn)是可能無(wú)法將特定基因組區(qū)域的一部分中的序列改變與同一基因組(例如同一染色體)的其它部分的序列改變相關(guān)聯(lián),因?yàn)樾蛄懈淖兾挥诓煌紊稀?參見(jiàn)圖5和其說(shuō)明)。本發(fā)明消除了現(xiàn)有測(cè)序技術(shù)造成的限制,并可用于多種其它核酸分析。
發(fā)明內(nèi)容
本發(fā)明的諸多方面涉及相對(duì)于多核苷酸結(jié)構(gòu)域?qū)⒃摱嗪塑账嶂械母信d趣區(qū)域從第一位置移動(dòng)到第二位置的方法,也稱(chēng)為“反射法”(或反射方法、反射序列法、反射反應(yīng)等)。在某些實(shí)施方式中,所述反射法導(dǎo)致感興趣區(qū)域移動(dòng)到與該多核苷酸內(nèi)特定結(jié)構(gòu)域元件(如引物位點(diǎn)和/或MID)功能性相鄰。還提供可用于實(shí)施本文所述反射法的組合物、試劑盒和系統(tǒng)。附圖簡(jiǎn)要說(shuō)明結(jié)合附圖,通過(guò)以下詳述更好地理解本發(fā)明。需要強(qiáng)調(diào),按照慣例,附圖的各個(gè)特征不成比例。事實(shí)上,各種特征的尺寸被任意放大或者縮小以清楚顯示。附圖包括以下圖 1-13
圖1 圖A的示意圖說(shuō)明用反射序列將第一結(jié)構(gòu)域從核酸分子中的一個(gè)位點(diǎn)移動(dòng)到另一個(gè)位點(diǎn)。圖B的示意圖說(shuō)明可用于本文所述反射方法的諸多方面的引物對(duì)(An^n引物)的相對(duì)位置。圖2顯示采用結(jié)合對(duì)(生物素/鏈霉親和素)分離感興趣的單鏈多核苷酸的示范性實(shí)施方式。圖3的示意圖說(shuō)明將引物位點(diǎn)和MID移動(dòng)到感興趣核酸中的具體位置的示范性實(shí)施方式。圖4顯示的示意圖說(shuō)明反射法用于產(chǎn)生富含具有感興趣區(qū)域的片段(例如,從隨機(jī)片段化和不對(duì)稱(chēng)標(biāo)記的多核苷酸群體富集)的樣品的示范性用途。圖5顯示鑒定樣品中同源核酸(例如,衍生自二倍體細(xì)胞的染色體對(duì)或病毒基因組/轉(zhuǎn)錄物的同一區(qū)域)的核酸多態(tài)性的方法比較。上方示意圖顯示樣品中的兩種核酸分子(1和2)在多態(tài)性位點(diǎn)A、B和C處有不同多態(tài)性分配(A1、B1、C1和C2)。利用片段化進(jìn)行的標(biāo)準(zhǔn)測(cè)序方法(左側(cè))可鑒定這些核酸中的多態(tài)性,但不保留連接信息。利用本文所述的反射方法鑒定多態(tài)性(右側(cè))能保留連接信息。圖6 圖A示意顯示反射法中核酸物質(zhì)的預(yù)計(jì)結(jié)構(gòu)和大??;圖B是聚丙烯酰胺凝膠,顯示實(shí)施例1所述反射法產(chǎn)生的核酸物質(zhì)。圖7 圖A示意顯示反射法所用的核酸和競(jìng)爭(zhēng)劑的結(jié)構(gòu);圖B是聚丙烯酰胺凝膠, 顯示實(shí)施例1所述反射法產(chǎn)生的核酸物質(zhì)。圖8顯示反射法流程圖(左圖),其中T7外切核酸酶步驟是任選的。右側(cè)凝膠顯示沒(méi)有T7外切核酸酶步驟(泳道1)或有T7外切核酸酶步驟(泳道2、時(shí)反射法所得的產(chǎn)物。圖9顯示示范性反射法流程,右側(cè)指出何時(shí)純化反應(yīng)產(chǎn)物(例如,采用Agencourt 珠去除引物寡核苷酸)。圖10顯示原料(左圖)和采用反射法而不使用T7外切核酸酶步驟獲得的產(chǎn)物 (右圖)(如實(shí)施例II所述)。原料中的反射位點(diǎn)是通常存在于所加工的多核苷酸中的序列(也稱(chēng)為“非人工”反射位點(diǎn))。此圖顯示,755堿基對(duì)原料核酸被加工成預(yù)計(jì)的461堿基對(duì)產(chǎn)物,從而確認(rèn)“非人工”反射位點(diǎn)能有效地將銜接子結(jié)構(gòu)域以序列特異性方式從感興趣多核苷酸中的一個(gè)位置轉(zhuǎn)移到另一個(gè)位置。圖11顯示實(shí)驗(yàn)示意圖和結(jié)果,該實(shí)驗(yàn)在單一較大初始模板(“親本”片段)上進(jìn)行反射法以產(chǎn)生各自具有不同感興趣區(qū)域的五種不同產(chǎn)物(“子代”產(chǎn)物)(即產(chǎn)生的各子代產(chǎn)物具有區(qū)域1、2、3、4或5)。圖12顯示實(shí)驗(yàn)示意圖和結(jié)果,該實(shí)驗(yàn)用于確定反射法(正如所需)期間的分子內(nèi)重排相對(duì)分子間重排(MID交換)的普遍性。圖13顯示制備反射法所用材料和進(jìn)行反射法的示范性流程圖。定義除非另外定義,本文中使用的所有技術(shù)和科學(xué)術(shù)語(yǔ)具有本發(fā)明所屬領(lǐng)域普通技術(shù)人員通常所理解的同樣含義。但為了清楚和易于理解,仍然定義了某些要素。本文所用的核酸化學(xué)、生物化學(xué)、遺傳學(xué)和分子生物學(xué)的術(shù)語(yǔ)和符號(hào)遵循本領(lǐng)域的標(biāo)準(zhǔn)論述和文本中的術(shù)語(yǔ)和符合,例如Kornberg和Baker,DNA Replication (《DNA 復(fù)制》),第二版(W. H.弗里曼出版社(W. H. Freeman),紐約,1992) ;Lehninger, Biochemistry (《生物化學(xué)》),第二版(沃斯出版社(Worth Publishers),紐約,1975); Strachan和Read,Human Molecular Genetics (《人類(lèi)分子遺傳學(xué)》),第二版(WL出版社 (Wiley-Liss), M 1999) ;Eckstein 1 , Oligonucleotides andanalogs :A Practical Approach (《寡核苷酸和類(lèi)似物實(shí)踐方法》)(牛津大學(xué)出版社(Oxford University Press),紐約,1991) ;Gait 編,Oligonucleotide Synthesis :A Practical Approach (《寡核苷酸合成實(shí)踐方法》)(IRL出版社,牛津,1984);等?!皵U(kuò)增子”指多核苷酸擴(kuò)增反應(yīng)產(chǎn)物。即,它是從一個(gè)或多個(gè)引發(fā)序列復(fù)制的, 通常是雙鏈的多核苷酸群體。所述一個(gè)或多個(gè)引發(fā)序列可以是相同序列的一個(gè)或多個(gè)拷貝,或者可以是不同序列的混合物。擴(kuò)增子可通過(guò)各種擴(kuò)增反應(yīng)產(chǎn)生,所述反應(yīng)的產(chǎn)物是一種或多種核酸的多個(gè)復(fù)制體。通常,產(chǎn)生擴(kuò)增子的擴(kuò)增反應(yīng)是“模板驅(qū)動(dòng)的”,因?yàn)榉磻?yīng)物(核苷酸或寡核苷酸)的堿基配對(duì)要求模板多核苷酸中存在產(chǎn)生反應(yīng)產(chǎn)物所需的互補(bǔ)物。一方面,模板驅(qū)動(dòng)的反應(yīng)是用核酸聚合酶進(jìn)行引物延伸或者用核酸連接酶進(jìn)行寡核苷酸連接。這類(lèi)反應(yīng)包括但不限于聚合酶鏈反應(yīng)(PCR)、線型聚合酶反應(yīng)、基于核酸序列的擴(kuò)增(NASBA)、滾環(huán)擴(kuò)增等,參見(jiàn)通過(guò)引用全文納入本文的下述文獻(xiàn)=Mullis頁(yè)
等,美國(guó)專(zhuān)利 4,683,195 ;4,965,188 ;4,683,202 ;4,800,159 (PCR) ;Gelfand 等,美國(guó)專(zhuān)利 5,210, 015(用 “TAQMAN ” 探針進(jìn)行實(shí)時(shí) PCR) ;Wittwer 等,美國(guó)專(zhuān)利 6,174,670 ;Kacian 等,美國(guó)專(zhuān)利5,399,491( “NASBA,,) ;Lizardi,美國(guó)專(zhuān)利5,854,033 ;Aono等,日本專(zhuān)利公開(kāi)JP 4-262799(滾環(huán)擴(kuò)增);等。一方面,本發(fā)明擴(kuò)增子通過(guò)PCR產(chǎn)生。如果有能夠隨著擴(kuò)增反應(yīng)進(jìn)行測(cè)定反應(yīng)產(chǎn)物的檢測(cè)化學(xué),那么擴(kuò)增反應(yīng)可以是“實(shí)時(shí)”擴(kuò)增,例如下述的“實(shí)時(shí) PCR”,或如 Leone 等,Nucleic Acids Research,26 :2150-2155 (1998)等文獻(xiàn)所述的“實(shí)時(shí)NASBA”。本文所用術(shù)語(yǔ)“擴(kuò)增”指進(jìn)行擴(kuò)增反應(yīng)?!胺磻?yīng)混合物”指含有進(jìn)行反應(yīng)所需的所有反應(yīng)物的溶液,其可包括但不限于,在反應(yīng)期間將PH維持在所選水平的緩沖劑、鹽、輔因子、清除劑等。術(shù)語(yǔ)“評(píng)估”包括任何測(cè)量形式,并包括確定某要素存在與否。術(shù)語(yǔ)“測(cè)定”、“測(cè)量”、“評(píng)價(jià)”、“評(píng)估”、“測(cè)試”可互換使用,包括定性和定量測(cè)定。評(píng)估可以是相對(duì)的或絕對(duì)的?!霸u(píng)估...的存在”包括確定存在物質(zhì)的量和/或確定該物質(zhì)是否存在。本文所用術(shù)語(yǔ) “測(cè)定”、“測(cè)量”和“評(píng)估”和“測(cè)試”可互換使用,包括定性和定量測(cè)定?!安粚?duì)稱(chēng)標(biāo)記的”多核苷酸的左側(cè)和右側(cè)銜接子結(jié)構(gòu)域不同。這一方法總地稱(chēng)為不對(duì)稱(chēng)地連接銜接子或不對(duì)稱(chēng)地標(biāo)記多核苷酸,如多核苷酸片段??赏ㄟ^(guò)任何方便的方式產(chǎn)生具有不對(duì)稱(chēng)銜接子末端的多核苷酸。示范性不對(duì)稱(chēng)銜接子可參見(jiàn)美國(guó)專(zhuān)利5,712,126 和 6,372,434 ;美國(guó)專(zhuān)利公開(kāi) 2007/01286 和 2007/0172839 ;和PCT 公開(kāi)W0/2009/032167 ; 所有文獻(xiàn)通過(guò)引用全文納入本文。在某些實(shí)施方式中,所用的不對(duì)稱(chēng)銜接子可參見(jiàn)2009年 4月四日提交的美國(guó)專(zhuān)利申請(qǐng)序列號(hào)12/432,080,通過(guò)引用全文納入本文。例如,本發(fā)明使用者可使用不對(duì)稱(chēng)銜接子來(lái)標(biāo)記多核苷酸。“不對(duì)稱(chēng)銜接子”是連接于雙鏈核酸片段的兩端時(shí),導(dǎo)致產(chǎn)生側(cè)接感興趣基因組插入物的序列不同的引物延伸或擴(kuò)增產(chǎn)物的銜接子。連接通常后接后續(xù)加工步驟,以便產(chǎn)生不相同的末端銜接子序列。例如,復(fù)制不對(duì)稱(chēng)銜接子連接片段產(chǎn)生在末端銜接子序列之間至少有一個(gè)核酸序列差異或核苷酸/核苷修飾的多核苷酸產(chǎn)物。將銜接子不對(duì)稱(chēng)地連接于多核苷酸(如多核苷酸片段) 產(chǎn)生的多核苷酸在一端具有的一個(gè)或多個(gè)銜接子序列(例如,一個(gè)或多個(gè)區(qū)域或結(jié)構(gòu)域, 如引物位點(diǎn))不存在于另一端或與另一端的銜接子序列相比具有不同核酸序列。需要注意,稱(chēng)為“不對(duì)稱(chēng)銜接子”的銜接子不一定是自身結(jié)構(gòu)不對(duì)稱(chēng),也不是僅通過(guò)將不對(duì)稱(chēng)銜接子連接于多核苷酸片段的行動(dòng)立即使其不對(duì)稱(chēng)。而是說(shuō),各末端具有相同不對(duì)稱(chēng)銜接子的連有不對(duì)稱(chēng)銜接子的多核苷酸產(chǎn)生的復(fù)制產(chǎn)物(或分離的單鏈多核苷酸)相對(duì)于另一端的銜接子序列是不對(duì)稱(chēng)的(例如,至少一輪擴(kuò)增/引物延伸后)。任何方便的不對(duì)稱(chēng)銜接子或不對(duì)稱(chēng)連接銜接子的方法均可用于實(shí)施本發(fā)明。示范性不對(duì)稱(chēng)銜接子可參見(jiàn)美國(guó)專(zhuān)利5,712,126和6,372,434 ;美國(guó)專(zhuān)利公開(kāi)2007/0128624 和2007/017^39 ;和PCT公開(kāi)W0/2009/032167 ;所有文獻(xiàn)通過(guò)引用全文納入本文。在某些實(shí)施方式中,所用的不對(duì)稱(chēng)銜接子可參見(jiàn)2009年4月四日提交的美國(guó)專(zhuān)利申請(qǐng)序列號(hào) 12/432,080,通過(guò)引用全文納入本文?!盎パa(bǔ)”或“基本上互補(bǔ)”指在核苷酸或核酸之間,例如在雙鏈DNA分子的兩條鏈之間或在寡核苷酸引物和單鏈核酸上的引物位點(diǎn)之間雜交或堿基配對(duì)或形成雙鏈體?;パa(bǔ)核苷酸通常是A和T (或A和U),或C和G。參考合適核苷酸插入或缺失進(jìn)行最優(yōu)比對(duì)和比較時(shí),一條鏈的核苷酸與另一條鏈的核苷酸的至少約80 %,通常至少約90 %至95 %,更優(yōu)選約98至100%配對(duì)時(shí),稱(chēng)這兩個(gè)單鏈RNA或DNA分子基本上互補(bǔ)。或者,RNA或DNA鏈在所選雜交條件下與其互補(bǔ)物雜交時(shí),存在基本互補(bǔ)性。通常,在至少14至25個(gè)核苷酸的臂上至少約65%互補(bǔ),優(yōu)選至少約75%,更優(yōu)選至少約90%互補(bǔ)時(shí),出現(xiàn)選擇性雜交。參見(jiàn) M. Kanehisa Nucleic Acids Res. 12 :203 (1984),通過(guò)引用納入本文?!半p鏈體”指完全或部分互補(bǔ)的至少兩個(gè)寡核苷酸和/或多核苷酸在所有或大部分核苷酸上發(fā)生沃森克里克型堿基配對(duì),以形成穩(wěn)定復(fù)合物。術(shù)語(yǔ)“退火”和“雜交”可互換使用,指形成穩(wěn)定雙鏈體。提到雙鏈體時(shí),“完美匹配”指構(gòu)成雙鏈體的多聚核苷酸鏈或寡核苷酸鏈相互形成雙鏈結(jié)構(gòu),以使每條鏈中的每個(gè)核苷酸與另一條鏈的核苷酸發(fā)生沃森克里克堿基配對(duì)。穩(wěn)定的雙鏈體可包括雙鏈體的兩條鏈之間形成沃森克里克堿基配對(duì)和/或非沃森克里克堿基配對(duì)(其中堿基配對(duì)指形成氫鍵)。在某些實(shí)施方式中,非沃森克里克堿基配對(duì)包括核苷類(lèi)似物,如脫氧次黃苷、2,6-二氨基嘌呤、PNA、LNA等。在某些實(shí)施方式中, 非沃森克里克堿基配對(duì)包括“擺動(dòng)堿基(wobble base)”,如脫氧次黃苷、8-氧代-dA、8_氧代-dG等,其中“擺動(dòng)堿基”所指核酸堿基可與互補(bǔ)核酸鏈中的第一種核苷酸堿基發(fā)生堿基配對(duì),但用作核酸合成的模板鏈時(shí)導(dǎo)致將第二種不同核苷酸堿基摻入合成鏈(下文進(jìn)一步詳述擺動(dòng)堿基)。兩個(gè)寡核苷酸或多核苷酸間雙鏈體中的"錯(cuò)配"指雙鏈體中一對(duì)核苷酸不能發(fā)生沃森克里克結(jié)合。提到基因組或靶多核苷酸時(shí),“遺傳基因座”、“基因座”或"感興趣基因座"指基因組或靶多核苷酸的毗連亞區(qū)或區(qū)段。本文所用的遺傳基因座、基因座或感興趣基因座可指核苷酸、基因或基因的一部分在基因組,包括線粒體DNA或其它非染色體DNA(如細(xì)菌質(zhì)粒)中的位置,或者可以指基因組序列的任何毗連部分,無(wú)論它是否在基因內(nèi)或與基因相關(guān)聯(lián)。遺傳基因座、基因座或感興趣基因座可能是一個(gè)核苷酸至長(zhǎng)度是幾百個(gè)或幾千個(gè)核苷酸或更長(zhǎng)的區(qū)段。通常,感興趣基因座具有相關(guān)聯(lián)的參比序列(參見(jiàn)下文中有關(guān)“參比序列”的說(shuō)明)。“試劑盒”指用于提供實(shí)施本發(fā)明方法所用材料或試劑的任何供給系統(tǒng)。在反應(yīng)實(shí)驗(yàn)的情況下,這種供給系統(tǒng)包括能夠儲(chǔ)存、運(yùn)輸或從一個(gè)位置向另一個(gè)位置提供反應(yīng)試劑(例如,合適容器中的探針、酶等)和/或支持材料(例如,緩沖液、進(jìn)行實(shí)驗(yàn)的書(shū)面說(shuō)明等)的供給系統(tǒng)。例如,試劑盒包括含有相關(guān)反應(yīng)試劑和/或支持材料的一種或多種容器 (如盒)。可將這些內(nèi)容物一起或單獨(dú)地提供給預(yù)期接受者。例如,第一容器可含有用于實(shí)驗(yàn)的酶,而第二容器含有探針?!斑B接"指在兩個(gè)或多個(gè)核酸,如寡核苷酸和/或多核苷酸的末端之間,以模板驅(qū)動(dòng)反應(yīng)形成共價(jià)鍵或連接。這種鍵或連接的性質(zhì)可能迥然不同,該連接可通過(guò)酶促或化學(xué)方法進(jìn)行。本文所用的連接通常用酶促方法實(shí)現(xiàn),在一個(gè)寡核苷酸的末端核苷酸的5’碳與另一個(gè)寡核苷酸的3’碳之間形成磷酸二酯鍵。下述文獻(xiàn)中描述了各種模板驅(qū)動(dòng)的連接反應(yīng),通過(guò)引用全文納入本文=Whiteley等,美國(guó)專(zhuān)利4,883,750 ;Letsinger等,美國(guó)專(zhuān)利 5, 476, 930 ;Fung 等,美國(guó)專(zhuān)利 5,593,826 ;Kool,美國(guó)專(zhuān)利 5,426,180 ;Landegren 等,美國(guó)專(zhuān)利 5,871,921 ;Xu 和 Kool,Nucleic Acids Research, 27 :875-881(1999) ;Higgins 等, Methods in Enzymology, 68 :50-71(1979) ;Engler 等,The Enzymes,15 :3-29(1982);禾口 Namsaraev,美國(guó)專(zhuān)利
發(fā)明者A·斯拉特, R·奧斯本, S·布倫那, 吉米卡瓦 申請(qǐng)人:群體遺傳學(xué)科技有限公司