專利名稱:對(duì)聚合物分子進(jìn)行測(cè)序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及生物聚合物分子的測(cè)序方法。該方法尤其適用于多核苷酸測(cè)序。
背景技術(shù):
用于表征分子或其生物學(xué)反應(yīng)的技術(shù)改進(jìn)在一定程度上推動(dòng)了分子研究的進(jìn)展。特別是,對(duì)核酸DNA和RNA的研究就受益于序列分析和雜交反應(yīng)研究方面的技術(shù)發(fā)展。
通常用于大規(guī)模DNA測(cè)序的主要方法是鏈終止法。該方法最初由Sanger和Coulson(Sanger et al.,Proc.Natl.Acad.Sci.USA,1977;745463-5467)所開發(fā),該方法有賴于四種核苷酸的雙脫氧衍生物的使用,所述雙脫氧衍生物在聚合酶反應(yīng)中被摻入到新生多核苷酸鏈中。一旦摻入,雙脫氧衍生物就會(huì)終止聚合酶反應(yīng),然后,產(chǎn)物通過凝膠電泳分離,并對(duì)其進(jìn)行分析以揭示具體雙脫氧衍生物摻入鏈中的位置。
盡管所述方法被廣泛使用并且可獲得可靠的結(jié)果,但是人們也認(rèn)識(shí)到該方法速度慢、勞動(dòng)強(qiáng)度大且費(fèi)用昂貴。
US-A-5302509公開了一種對(duì)固定在固體支持物上的多核苷酸進(jìn)行測(cè)序的方法。所述方法有賴于在DNA聚合酶的存在下,將具有不同熒光標(biāo)記的3’-封閉堿基A、G、C和T摻入至所固定的多核苷酸。聚合酶可摻入與靶多核苷酸互補(bǔ)的堿基,但是卻被3’-封閉基團(tuán)阻止進(jìn)一步加入。然后測(cè)定所摻入堿基的標(biāo)記,并通過化學(xué)斷裂除去封閉基團(tuán),使得發(fā)生進(jìn)一步聚合。但是,這種需要去除封閉基團(tuán)的過程耗費(fèi)時(shí)間,并且必須高效進(jìn)行。
WO-A-00/39333描述了一種通過將靶多核苷酸序列轉(zhuǎn)換成第二種多核苷酸來對(duì)多核苷酸進(jìn)行測(cè)序的方法,所述第二種多核苷酸其中含有確定的序列和位置信息。靶標(biāo)的序列信息在第二種多核苷酸中被所謂“放大”,從而使得可更容易地區(qū)分靶分子中的單個(gè)堿基。這可通過使用具有預(yù)定核酸序列的“放大標(biāo)簽”來實(shí)現(xiàn)。靶分子上的每種堿基即腺嘌呤、胞嘧啶、鳥嘌呤和胸腺嘧啶用各自的放大標(biāo)簽表示,由此將原始靶序列轉(zhuǎn)換為放大的序列。接下來再利用常規(guī)技術(shù)測(cè)定放大標(biāo)簽的序列,并由此確定靶多核苷酸的具體序列。
雖然所述方法有用,但是長聚合物的測(cè)序還是存在問題,并且需要對(duì)大量聚合物片段測(cè)序,然后還需要進(jìn)行很多序列重建。人們一直希望,特別是在對(duì)聚合物進(jìn)行從頭測(cè)序時(shí),提高可讀長度和簡(jiǎn)化所需的重建。
發(fā)明內(nèi)容
本發(fā)明基于這樣一種發(fā)現(xiàn)靶聚合物可以通過把位置和序列信息編碼進(jìn)靶聚合物連續(xù)降解產(chǎn)生的片段而進(jìn)行測(cè)序。所述片段可被用于靶聚合物的序列重建。
根據(jù)本發(fā)明的第一方面,對(duì)靶聚合物分子進(jìn)行測(cè)序的方法包括如下步驟(i)用一種可對(duì)靶聚合物的至少一端進(jìn)行連續(xù)降解的試劑處理靶聚合物;(ii)將不同降解聚合物的降解端的至少一部分轉(zhuǎn)換為可讀信號(hào)序列,并且用表示相對(duì)降解順序的標(biāo)簽來標(biāo)記每種所述的降解聚合物;(iii)測(cè)定可讀信號(hào)序列的序列;并且(iv)利用步驟(iii)中得到的序列數(shù)據(jù)和對(duì)每個(gè)有關(guān)標(biāo)簽的鑒定來確定靶聚合物的序列。
具體實(shí)施例方式
本發(fā)明用于測(cè)定靶聚合物分子的序列。該方法特別適用于從頭測(cè)序。
本發(fā)明方法有以下幾個(gè)基本步驟首先,連續(xù)降解靶聚合物。然后用兩種標(biāo)記來標(biāo)記每個(gè)片段。第一種標(biāo)記被稱為“可讀信號(hào)序列”,它包含片段的序列信息,第二種標(biāo)記指的是“位置標(biāo)簽”,此標(biāo)記的加入用于顯示片段由于降解反應(yīng)而被移出時(shí)的位置。所有的片段都被“可讀信號(hào)序列”和“位置標(biāo)簽”標(biāo)記上之后,檢測(cè)這些標(biāo)記,可得到每個(gè)片段的序列信息及其在靶多核苷酸上的位置。然后,通過比對(duì)每個(gè)被測(cè)序片段的種類和順序,可將所述信息用于確定靶聚合物序列。
優(yōu)選地,降解反應(yīng)之后,將樣品移出并且放入各自獨(dú)立的隔室中用于分析。因此每個(gè)樣品含有靶聚合物的不同長度的片段,也因此在降解端具有不同于其它片段的序列。
該方法可提供靶聚合物的序列信息。本文所使用的術(shù)語“聚合物”指的是任何含有連接的單體單元的分子。優(yōu)選地,所述聚合物是生物聚合物,特別是多核苷酸或者多肽。術(shù)語“多核苷酸”為本技術(shù)領(lǐng)域所熟知,用于指一系列連接的核酸堿基,例如DNA或RNA。包括PNA(肽核酸)、LNA(鎖核酸)和2-O-methRNA在內(nèi)的核酸模擬物也在本發(fā)明范圍內(nèi)。靶多核苷酸可以是單鏈也可以是雙鏈。
本文所使用的術(shù)語“堿基”指的是每個(gè)核酸單體,A、T(U)、G或者C。這些縮寫表示核苷酸堿基腺嘌呤、胸腺嘧啶(尿嘧啶)、鳥嘌呤和胞嘧啶。當(dāng)多核苷酸為RNA時(shí)以尿嘧啶替代胸腺嘧啶,或者用dUTP將尿嘧啶引入DNA中,這也是本技術(shù)領(lǐng)域所熟知的。
術(shù)語“多肽”也為本技術(shù)領(lǐng)域熟知,用于指一系列連接的氨基酸分子。該術(shù)語意在包括短肽序列和長蛋白質(zhì)序列。
本發(fā)明的方法包括對(duì)靶聚合物的連續(xù)降解以產(chǎn)生不同長度的片段。降解可以發(fā)生在靶聚合物的一端,也可以在兩端進(jìn)行。連續(xù)降解靶聚合物的方法是本技術(shù)領(lǐng)域所熟知的,例如酶法消化。本領(lǐng)域技術(shù)人員應(yīng)理解的是,核酸酶適用于降解多核苷酸而蛋白酶和肽酶適用于降解多肽。在優(yōu)選的實(shí)施方案中,在適于酶活性的條件下,使用外切核酸酶或者外切蛋白酶(exoprotease);所述酶分別從多核苷酸和多肽上連續(xù)移去末端單體單元。適合酶活性的條件對(duì)于本領(lǐng)域技術(shù)人員來說是顯而易見的。
在連續(xù)的降解反應(yīng)過程中,降解靶聚合物樣品優(yōu)選的以特定的時(shí)間間隔從反應(yīng)混合物中移出,并被放入各自獨(dú)立的隔室中。因此每個(gè)獨(dú)立的隔室中就含有不同長度的片段;從降解反應(yīng)中較早移出的片段將長于從降解反應(yīng)中較晚移出的片段。也可在降解反應(yīng)開始之前就將樣品移出,因此這樣的第一個(gè)樣品含有全長的靶聚合物。在降解反應(yīng)的過程中可任意次地移出樣品,優(yōu)選以預(yù)定的時(shí)間間隔移出,這樣設(shè)計(jì)可用來優(yōu)化產(chǎn)生的片段數(shù)目。本文所使用的術(shù)語“樣品片段”指的是降解過程中移出的片段。
從反應(yīng)混合物中移出樣品后,必需終止降解反應(yīng)。適用于終止酶反應(yīng)的方法對(duì)于本領(lǐng)域技術(shù)人員來說是顯而易見的。已知改變溫度和pH值以及加入抑制劑都可以使酶失活。優(yōu)選地,用于終止降解的技術(shù)不會(huì)破壞樣品片段或者對(duì)樣品片段有不良影響。如果用外切核酸酶將樣品片段化,可用本領(lǐng)域已知的技術(shù)使外切核酸酶失活。例如,先加入含有Tris堿和EDTA的緩沖液,再加熱到70℃,從而使外切核酸酶III失活。Erase-a-Base技術(shù)(Promega公司)中使用了該技術(shù),其中將1μl S1核酸酶終止緩沖液(0.3M Tris堿,0.05M EDTA)加入到2.5μl反應(yīng)體積中,然后在70℃加熱10分鐘(參見Promega Erase-a-Base系統(tǒng)技術(shù)手冊(cè)#006,可從www.promega.com和Henikoff,Nucleic Acids Res.1990 May 25;18(10)2961-2966獲得)。
另一個(gè)用于終止降解反應(yīng)的技術(shù)是從樣品中移去降解酶。適用于從混合物中特定地移出一種酶的技術(shù)為本領(lǐng)域所熟知,例如使用親和層析,其中將該酶的結(jié)合配偶體固定化,而酶則在接觸固定化的親和配偶體時(shí)從樣品中被移去?;蛘咴诮到夥磻?yīng)之前,可將每個(gè)靶聚合物固定在固相支持物上;優(yōu)選地,靶聚合物被固定在珠子上,所述珠子使得整分試樣可在進(jìn)行降解反應(yīng)時(shí)被移去。降解反應(yīng)過程中被移出的每個(gè)珠子樣品都含有固定其上的樣品片段。之后,可以通過洗滌這些有樣品的珠子而去除酶,這應(yīng)為一個(gè)本領(lǐng)域技術(shù)人員所理解。在該實(shí)施方案中,需要確保連接有聚合物的珠子在降解反應(yīng)過程中保持為均一混合物以確保降解一致??梢酝ㄟ^簡(jiǎn)單的搖動(dòng)或攪拌珠子來實(shí)現(xiàn)這一點(diǎn)。
將生物聚合物固定在例如珠子等支持物上的方法為本領(lǐng)域所熟知,例如通過利用生物素-抗生物素蛋白的相互作用、光刻法技術(shù)和有賴于將各個(gè)聚合物“放置”在支持物的確定位置上的技術(shù)可以將多核苷酸固定。
固定化可以通過特定的共價(jià)或者非共價(jià)相互作用來實(shí)現(xiàn)。所述相互作用應(yīng)足以保持在移去不想要的反應(yīng)組分的洗滌步驟中聚合物都結(jié)合在支持物上。固定化優(yōu)選地僅發(fā)生在一端,例如多核苷酸的5’端或者3’端,以便聚合物僅有一端與支持物連接。但是,聚合物可在其全長的任何位置上與支持物連接,這種連接所起的作用就是將多核苷酸限制在支持物上。
本領(lǐng)域技術(shù)人員應(yīng)知曉將聚合物固定在支持物質(zhì)上的合適方法。本領(lǐng)域技術(shù)人員應(yīng)理解,可對(duì)支持物進(jìn)行適當(dāng)?shù)陌灰岳诠潭ɑ?。用于連接多核苷酸的適當(dāng)?shù)陌环椒òōh(huán)氧包被(例如3-縮水甘油基丙氧基三甲氧基硅烷(3-glycidyloxypropyltrimethoxysilane)),超級(jí)醛(superaldehyde)包被,巰基硅烷和異硫氰酸鹽?;蛘呤褂靡恍┙宦?lián)基團(tuán),包括PAMAM樹狀結(jié)構(gòu)(Benters et al.,Chem Biochem.,2001;2686-694)和Zhao等人描述的固定化交聯(lián)劑(Zhao et al.,Nucleic AcidsResearch,2001;29(4)955-959)。
在另一個(gè)實(shí)施方案中,降解反應(yīng)不會(huì)被立即終止。而是在樣品片段從降解反應(yīng)中被移出后將可讀信號(hào)序列立即與其連接。
至少每個(gè)樣品片段的一部分被轉(zhuǎn)換成可讀信號(hào)序列。在單個(gè)堿基和完整樣品片段之間的任何部分都可以被轉(zhuǎn)換。優(yōu)選地,每個(gè)樣品片段的至少三個(gè)單體單元被轉(zhuǎn)換,更優(yōu)選地,在3到100個(gè)單體之間,例如20個(gè)單體單元。如果靶聚合物僅從一端降解,至少每個(gè)樣品片段的相應(yīng)末端被轉(zhuǎn)換為可讀信號(hào)序列。例如,如果從靶多核苷酸的3’末端開始降解,樣品片段中的至少三個(gè)3’堿基被轉(zhuǎn)換成為可讀信號(hào)序列。如果靶序列兩端都被降解,則每個(gè)片段的任何一端或者兩端就可被轉(zhuǎn)換。在優(yōu)選的實(shí)施方案中,每個(gè)樣品片段的完整的序列被轉(zhuǎn)換成為可讀信號(hào)序列。更優(yōu)選的是所有樣品片段的可讀信號(hào)序列的組合代表了靶多核苷酸的完整序列。
本文中所使用的術(shù)語“可讀信號(hào)序列”指的是包含標(biāo)記或連接標(biāo)記的方式的序列,所述標(biāo)記可使在隨后的讀出步驟中至少一部分序列被鑒定。任何標(biāo)記都可以使用;使用標(biāo)記對(duì)生物聚合物進(jìn)行測(cè)序的方法為本技術(shù)領(lǐng)域所熟知。例如,多肽可以通過加入一種試劑來轉(zhuǎn)換成為可讀信號(hào)序列,所述試劑可與N末端氨基酸殘基相互作用并可使末端殘基在隨后的讀出步驟中被鑒定。常用的試劑包括丹磺酰氯和異硫氰酸苯酯(PITC)。PITC被用于多肽測(cè)序的“Edman降解法”中,該方法為本技術(shù)領(lǐng)域中所熟知。多核苷酸可以通過任何適當(dāng)?shù)募夹g(shù)被轉(zhuǎn)換成可讀信號(hào)序列??梢允褂枚嗪塑账釡y(cè)序的鏈終止(“Sanger”)法,其中樣品片段可被轉(zhuǎn)換含有雙脫氧核苷三磷酸的可讀信號(hào)序列。
本領(lǐng)域技術(shù)人員應(yīng)理解,為了獲得樣品片段中一系列單體單元的序列需要進(jìn)行多次測(cè)序循環(huán)。這也是在本發(fā)明范圍之內(nèi)的。
在優(yōu)選的實(shí)施方案中,可讀信號(hào)序列是多核苷酸,所述多核苷酸含有至少兩個(gè)代表樣品片段中單個(gè)單體單元的堿基。樣品片段的序列信息在可讀信號(hào)序列中被所謂“放大”,使得可以更容易地區(qū)分靶分子上的各堿基。這些先前被描述為“被放大的(或者放大的)標(biāo)簽”序列的優(yōu)選可讀信號(hào)序列,在本申請(qǐng)中被稱為“被放大的可讀信號(hào)序列”。WO-A-00/39333和WO04/94663中給出了這些序列的實(shí)例,這些文獻(xiàn)均通過引用方式納入本說明書。正如在現(xiàn)有技術(shù)中已知的,任何生物聚合物都可被轉(zhuǎn)換成為被放大的可讀信號(hào)序列。WO-A-00/39333描述了多核苷酸向被放大的可讀信號(hào)序列的轉(zhuǎn)換。WO04/94663中描述了蛋白質(zhì)和肽向多核苷酸的放大的可讀信號(hào)序列的轉(zhuǎn)換,該文獻(xiàn)通過引用方式納入本說明書。
每個(gè)放大的可讀信號(hào)序列優(yōu)選包含兩個(gè)或者更多的核苷酸堿基,優(yōu)選包含2至50個(gè)核苷酸堿基,更優(yōu)選2至20個(gè)堿基,最優(yōu)選4至10個(gè)堿基,例如6個(gè)堿基。在優(yōu)選的實(shí)施方案中,每個(gè)被放大的可讀信號(hào)序列中有三個(gè)不同的堿基。例如,一個(gè)堿基與讀出步驟中引入的被標(biāo)記的核苷酸互補(bǔ),一個(gè)堿基作為“間隔物”在摻入的標(biāo)記之間提供間隔,還有一個(gè)堿基作為一個(gè)終止信號(hào)。
正如在共同未決申請(qǐng)PCT/GB04/01665中公開的,被放大的可讀信號(hào)序列中可包括二元代碼。在所述“二元”實(shí)施方案中,每個(gè)被放大的可讀信號(hào)序列包括兩個(gè)不同序列的單元,所述單元代表了樣品片段上的所有四個(gè)堿基。這兩個(gè)單元作為一個(gè)二元系統(tǒng),其中一個(gè)單元表示“0”另外一個(gè)表示“1”。樣品片段上的每個(gè)堿基可用被放大的可讀信號(hào)序列中的這兩個(gè)單元的組合來表征。例如,腺嘌呤可用“0”+“0”表示,胞嘧啶可用“0”+“1”表示,鳥嘌呤可用“1”+“0”表示,胸腺嘧啶可用“1”+“1”表示。需對(duì)這些單元之間進(jìn)行區(qū)分,所以可在每個(gè)單元中摻入“終止”信號(hào)。根據(jù)樣品片段上的堿基是在奇數(shù)位置還是偶數(shù)位置,還可以優(yōu)選使用不同單元表示“1”和“0”。
下面給出示例奇數(shù)模版序列“0”TTTTTTA(CCC)“1”TTTTTTG(CCC)偶數(shù)模板序列“0”CCCCCCA(TTT)“1”CCCCCCG(TTT)在這個(gè)實(shí)例中,劃線的堿基是在聚合酶反應(yīng)中標(biāo)記核苷酸的靶標(biāo),括號(hào)中的堿基用作終止信號(hào),而剩余的堿基提供標(biāo)記間的間隔。
優(yōu)選地,將樣品片段中的多個(gè)單體單元轉(zhuǎn)換成為放大的可讀信號(hào)序列。每個(gè)被放大的可讀信號(hào)序列保持連續(xù)地與靶聚合物相連,由此形成含有一系列被放大的可讀信號(hào)序列單元的單個(gè)多核苷酸分子,所述單個(gè)多核苷酸分子編碼靶聚合物序列。
在讀出步驟中能夠區(qū)分不同的被放大的可讀信號(hào)序列,例如包括在聚合反應(yīng)中,或互補(bǔ)寡核苷酸雜交時(shí),或在常規(guī)測(cè)序反應(yīng)中摻入具有可檢測(cè)標(biāo)記的核苷酸。以上實(shí)例中,可采用摻入具有可檢測(cè)標(biāo)記的核苷酸。聚合酶反應(yīng)過程中引入的核苷酸混合物在奇數(shù)位置(1、3、5等)由FluorX-dUTP,F(xiàn)luor Y-dCTP和dATP(混合物中不含dGTP)組成。對(duì)于“0”,不存在Fluor Y的互補(bǔ)堿基,對(duì)于1”,不存在Fluor X的互補(bǔ)堿基。因此在聚合酶反應(yīng)過程中,如果存在單元“0”就可以通過監(jiān)測(cè)Fluor X來檢測(cè),而若存在“1”,則可以通過監(jiān)測(cè)Fluor Y來檢測(cè)。
在所有的偶數(shù)位置(2,4,6等)核苷酸混合物包括相同的兩種熒光標(biāo)記的核苷酸,但使用dGTP而不是dATP,而且用一個(gè)或者多個(gè)T堿基定義終止信號(hào)。
在“識(shí)讀”了每個(gè)被放大的可讀信號(hào)序列以后,就可以引入缺失的互補(bǔ)核苷酸(例如dGTP或者dATP)使之在終止序列摻入,從而重新啟動(dòng)此過程。未摻入的核苷酸在下次讀出步驟前被洗掉。
通過本領(lǐng)域中已知的方法,每個(gè)樣品片段都可以被轉(zhuǎn)換成為被放大的可讀信號(hào)序列(或其系列)??梢圆杉{WO-A-00/39333中公開的轉(zhuǎn)換方法,所述方法使用了限制酶。例如,如果樣品片段是多核苷酸,可以將樣品片段連接進(jìn)載體,所述載體在插入位點(diǎn)附近帶有一個(gè)IIS類限制性位點(diǎn),或者將樣品片段改造為使之含有這樣的位點(diǎn)。然后用適當(dāng)?shù)腎IS類限制酶切割該限制性位點(diǎn),從而在樣品片段上產(chǎn)生一個(gè)突出端。
然后可使用含有一個(gè)或者多個(gè)被放大的可讀信號(hào)序列單元的適當(dāng)?shù)慕宇^結(jié)合到突出端的一個(gè)或者多個(gè)堿基上。一旦接頭的突出端和被切割的載體雜交上,這些分子就可被連接起來。這種連接只有在整個(gè)突出端完全互補(bǔ)才可以實(shí)現(xiàn)。之后,用平端連接將接頭的另一端連接到載體上。通過適當(dāng)?shù)卦O(shè)置其他II類限制性位點(diǎn)(或者其他合適的限制性酶位點(diǎn))——所述位點(diǎn)可以與前面使用的酶相同或者不同——可實(shí)現(xiàn)切割,從而使得可在第一個(gè)接頭指向的序列下游的靶序列上形成一個(gè)突出端。利用這個(gè)方法,鄰近的或者重疊的序列可以被連續(xù)轉(zhuǎn)換成帶有確定序列單元的序列。
在可讀信號(hào)序列轉(zhuǎn)換之后而在讀出步驟之前,每個(gè)獨(dú)立的隔室中的樣品片段任選可被固定在固相支持物上以例如形成陣列。正如前文所述,將生物聚合物固定在支持物上的方法為本領(lǐng)域所熟知??梢酝ㄟ^將多核苷酸隨機(jī)分配在微珠、納米顆粒和平坦表面上來進(jìn)行固定化。適宜的支持物是本領(lǐng)域已知的,包括玻璃片、陶瓷和硅表面以及塑料物質(zhì)。支持物通常是一個(gè)平的(平面的)表面。
樣品片段可以被固定在支持物上形成陣列,而該陣列可以在固相支持物上排列成隨機(jī)或者有序的模式。優(yōu)選地,所用陣列是樣品片段包含在不同的光學(xué)可辨區(qū)的單分子陣列,例如WO-A-00/06770中公開的多核苷酸陣列,其內(nèi)容通過引用的方式納入本說明書。
優(yōu)選地,每個(gè)樣品片段含有可讀信號(hào)序列,所述可讀信號(hào)序列可以互補(bǔ)于至少一個(gè)其他的樣品片段的可讀信號(hào)序列。更優(yōu)選地,這種互補(bǔ)是介于多個(gè)可讀信號(hào)序列間的,其中所述可讀信號(hào)序列表示樣品片段上多個(gè)單體單元,例如在2至20個(gè)堿基之間的互補(bǔ),如多核苷酸中的3、4或者5個(gè)堿基的互補(bǔ)。這就確保了分散的樣品片段中的可讀信號(hào)序列信息間有所重疊,使得靶序列可以基于這些冗余的重復(fù)區(qū)而被重建,這一點(diǎn)應(yīng)為本領(lǐng)域技術(shù)人員所理解。不同樣品片段上可讀信號(hào)序列間的互補(bǔ)性越強(qiáng),序列重建就越簡(jiǎn)單。
除了每個(gè)樣品片段中的至少一部分用可讀信號(hào)序列標(biāo)記之外,每個(gè)片段還用表示片段從降解反應(yīng)中被移出時(shí)間的“位置標(biāo)簽”來標(biāo)記。在優(yōu)選的實(shí)施方案中,每個(gè)樣品片段用不同的位置標(biāo)簽進(jìn)行標(biāo)記,從而確定它從降解反應(yīng)中被移出的時(shí)間。任何適于標(biāo)記生物聚合物的標(biāo)簽都可以使用。在優(yōu)選的實(shí)施方案中,位置標(biāo)簽是熒光團(tuán)。適宜的熒光團(tuán)為本技術(shù)領(lǐng)域所熟知,例如Alexa染料(Molecular Probes)BODIPY染料(Molecular Probes)花青染料(Amersham Biosciences Ltd.)四甲基羅丹明(Perkin Elmer,Molecular Probes,Roche Diagnostics)香豆素(Perkin Elmer)得克薩斯紅(Molecular Probes)熒光素(Perkin Elmer,Molecular Probes,Roche Diagnostics)對(duì)于本領(lǐng)域中技術(shù)人員而言,很顯然在讀出步驟中可以使用任意熒光檢測(cè)技術(shù)來檢測(cè)熒光團(tuán)。熒光團(tuán)檢測(cè)技術(shù)的實(shí)例概括如下。
在另一個(gè)優(yōu)選實(shí)施方案中,位置標(biāo)簽是具有預(yù)先確定序列的“放大標(biāo)簽”。為避免疑義,如上文和WO-A-00/39333中所描述的,一個(gè)放大標(biāo)簽含有兩個(gè)或者更多的堿基。優(yōu)選地,位置標(biāo)簽為包含預(yù)定系列的放大標(biāo)簽的多核苷酸。當(dāng)將放大標(biāo)簽用作位置標(biāo)簽時(shí),它并不表示樣品片段的序列;它是一個(gè)在讀出步驟中可被識(shí)別的預(yù)定序列。通過使用多核苷酸形式的可讀信號(hào)序列和位置標(biāo)簽,其中所述多核苷酸含有具有兩個(gè)或多個(gè)堿基的不同單元——即“放大標(biāo)簽”,從而使讀出步驟得到了簡(jiǎn)化,因?yàn)榭勺x信號(hào)序列和位置標(biāo)簽都可以用相同的技術(shù)讀出。任何能將放大標(biāo)簽連接在樣品片段上的方法都可以使用。優(yōu)選地,使用WO-A-00/39333(和本說明中所總結(jié)的內(nèi)容)中公開的基于限制酶/連接的技術(shù)。
位置標(biāo)簽可以直接連接在樣品片段上,或者連接在可讀信號(hào)序列上。在優(yōu)選的實(shí)施方案中,當(dāng)可讀信號(hào)序列和位置標(biāo)簽都是包含具有兩個(gè)或更多堿基的不同單元的放大標(biāo)簽時(shí),位置標(biāo)簽和可讀信號(hào)序列是連續(xù)的,形成含有兩種標(biāo)記的多核苷酸單鏈?;蛘撸恢脴?biāo)簽和可讀信號(hào)序列連接到樣品片段的相反的兩端。
每個(gè)樣品片段的至少一部分被編碼樣品片段序列的可讀信號(hào)序列和表明在降解反應(yīng)中的位置的位置標(biāo)簽標(biāo)記后,就可在讀出步驟中檢測(cè)出每個(gè)片段所含有的數(shù)據(jù),從而確定每個(gè)片段的序列及其在靶分子中的位置。然后,可將這些被測(cè)序的片段重新排列從而給出靶聚合物的序列。當(dāng)標(biāo)簽和可讀信號(hào)序列都是被放大的標(biāo)簽序列的時(shí)候,可采用任何適宜的技術(shù)進(jìn)行讀出步驟,例如采用WO-A-00/39333和PCT/GB04/01665所描述的和在本說明中所總結(jié)的技術(shù)。如上所述,優(yōu)選的檢測(cè)技術(shù)利用了選定的、具有可檢測(cè)標(biāo)記的核苷酸或者利用摻入了可用于后續(xù)間接標(biāo)記的基團(tuán)的核苷酸,采用聚合酶反應(yīng)以摻入與可讀信號(hào)序列的堿基互補(bǔ)的堿基,并監(jiān)測(cè)任何摻入情況。
為了進(jìn)行基于聚合酶反應(yīng)的讀出步驟,通常需先將引物序列與被放大的可讀信號(hào)序列多核苷酸退火,引物序列可被聚合酶識(shí)別并作為互補(bǔ)鏈繼續(xù)延伸的起始位點(diǎn)。引物序列可以作為相對(duì)于所述多核苷酸的獨(dú)立組分加入,所述多核苷酸含有可以使引物退火的互補(bǔ)序列。聚合酶反應(yīng)優(yōu)選地在允許互補(bǔ)核苷酸一次一個(gè)單元地受控?fù)饺氲臈l件下進(jìn)行。這使得可通過檢測(cè)摻入的標(biāo)記對(duì)每個(gè)被放大的信號(hào)序列單元進(jìn)行歸類。如上所述,因?yàn)槊總€(gè)單元優(yōu)選地含有一個(gè)“終止”序列,所以可以通過僅提供那些摻入到第一單元所需的核苷酸來控制摻入。因?yàn)槊總€(gè)單元都可通過特異的標(biāo)記被識(shí)別,所以可以在每個(gè)循環(huán)中將兩個(gè)不同的單元(0和1)區(qū)分開。這使得可以檢測(cè)出任何摻入的標(biāo)記,并且能夠鑒定出待測(cè)單元并確定其位置。
當(dāng)可讀信號(hào)序列和位置標(biāo)簽都是被放大的標(biāo)簽序列時(shí),讀出方法可按照以下方式進(jìn)行(i)在可以發(fā)生聚合反應(yīng)的條件下,使含有確定單元的可讀信號(hào)序列與核苷酸dATP、dTTP、dGTP和dCTP中的至少一種相接觸,其中所述的至少一種核苷酸包含特異性針對(duì)該核苷酸的可檢測(cè)標(biāo)記;(ii)移出所有未摻入的核苷酸并檢測(cè)所有摻入情況;(iii)從所有摻入的核苷酸上移去標(biāo)記;并且(iv)重復(fù)步驟ii)到iv),由此鑒定出不同的單元,并由此確定靶多核苷酸的序列。
每個(gè)循環(huán)的步驟(i)中所要求的不同核苷酸的數(shù)量根據(jù)對(duì)放大信號(hào)序列單元的設(shè)計(jì)而定。如果每個(gè)單元僅含有一種堿基類型,則只需要一種核苷酸(具有可檢測(cè)標(biāo)記)。但是,如果使用了兩種堿基(一種作為具有可檢測(cè)標(biāo)記的核苷酸的靶標(biāo),另一種提供不同靶堿基間的間隙)就需要兩種核苷酸(一種結(jié)合到靶堿基上,另一種將堿基“填入”靶堿基間)。
用一個(gè)堿基作為終止信號(hào)的方法使得檢測(cè)步驟可以在聚合酶反應(yīng)不需要用封閉核苷酸阻止不受控制的摻入的條件下進(jìn)行。當(dāng)聚合酶混合物中沒有“終止”堿基的互補(bǔ)堿基時(shí),終止信號(hào)是有效的。因此,可在對(duì)每個(gè)單元表征后進(jìn)行“填入”步驟,在該步驟中使用之前缺失的核苷酸,從而使得可與終止堿基互補(bǔ),這就為下一個(gè)單元的表征提供了可能。這一步是在檢測(cè)步驟之后進(jìn)行的。一個(gè)單元的“終止”堿基和下一個(gè)單元的第一個(gè)堿基不應(yīng)是同一種類型。這可以確保“填入”步驟不會(huì)進(jìn)行到下一個(gè)單元。然后“填入”過程中所用的未摻入的核苷酸可被移出,隨后就可以表征下一個(gè)單元。
對(duì)聚合酶和可檢測(cè)標(biāo)記的選擇對(duì)于技術(shù)人員而言是顯而易見的。以下內(nèi)容僅用作指導(dǎo)a)Klenow和Klenow(exo-)可以有效地?fù)饺胨募谆_丹明-4-dUTP和羅丹明-110-dCTP(Amersham Pharmacia Biotech)(Brakmannand Nieckchen,2001,Brakmann and Lbermann,2000)。
b)Vent、Taq和Tgo DNA聚合酶可以有效地?fù)饺氲馗咝?dioxigenin)和熒光團(tuán),如AMCA、四甲基羅丹明、熒光素和Cy5而沒有至少最高達(dá)幾個(gè)的位置的間隔(Augustin et al.,(提供參考?)2001)。
c)T4 DNA聚合酶可有效填入熒光團(tuán)標(biāo)記的核苷酸。
優(yōu)選的聚合酶是Klenow大片段(exo-)和T4 DNA聚合酶。
進(jìn)行聚合酶反應(yīng)所必需的其它條件,包括溫度、pH、緩沖液組成等等,對(duì)于本領(lǐng)域技術(shù)人員而言是顯而易見的。聚合反應(yīng)步驟可能進(jìn)行一段時(shí)間,這段時(shí)間足以使堿基摻入至第一單元。然后移去非摻入核苷酸,例如通過洗滌陣列,然后進(jìn)行對(duì)摻入標(biāo)記的檢測(cè)。
另一種讀出方式是使短的具有可檢測(cè)標(biāo)記的寡核苷酸與被放大的可讀信號(hào)序列和/或位置標(biāo)簽上的單元進(jìn)行雜交,并檢測(cè)任何雜交結(jié)果。短的寡核苷酸具有與可讀信號(hào)序列中特定單元互補(bǔ)的序列。例如,如果使用二元系統(tǒng),而且樣品片段中的每個(gè)單體通過被放大的可讀信號(hào)序列單元(一個(gè)表示“0”另一個(gè)表示“1”)的不同組合來定義,則本發(fā)明將需要一個(gè)特異性針對(duì)單元“1”的寡核苷酸。在所述實(shí)施方案中,寡核苷酸的選擇性雜交可以通過將每個(gè)單元設(shè)計(jì)成相對(duì)于其他單元的不同寡核苷酸序列來實(shí)現(xiàn)。這確保了雜交反應(yīng)僅在有特定單元存在時(shí)發(fā)生,而對(duì)雜交結(jié)果的檢測(cè)可鑒定出樣品片段的特征。
在優(yōu)選的實(shí)施方案中,標(biāo)記為熒光部分。如上所述,可以使用的熒光團(tuán)的許多實(shí)例是現(xiàn)有技術(shù)是已知的??梢允褂贸R?guī)的方法將適宜的熒光團(tuán)連接到核苷酸上。具有適當(dāng)標(biāo)記的核苷酸也可以通過商業(yè)途徑獲得。標(biāo)記通過可以在檢測(cè)步驟后被去除的方式被連接。這可以通過常規(guī)方法完成,包括I.攻擊信號(hào)本身d)漂白i)光漂白ii)化學(xué)漂白a)熒光淬滅i)通過針對(duì)熒光而產(chǎn)生的抗體(例如抗熒光素抗體,抗Oregon綠抗體)ii)通過FRET(在信號(hào)附近摻入可被用于淬滅信號(hào)的淬滅劑,例如Taqman方法)b)信號(hào)切割i)化學(xué)切割(例如還原堿基和信號(hào)間的二硫鍵)ii)光切割(例如引入硝基芐基或者叔丁基酮基)
iii)酶法(例如α-胰凝乳蛋白酶消化肽連頭)II.攜帶信號(hào)的核苷酸b)核酸外切去除i)3’-5’核酸外切降解填入的核苷酸(例如外切核酸酶III或者在缺少某一特定核苷酸時(shí)激活DNA聚合酶的3’-5’核酸外切活性)c)限制酶消化ii)消化攜帶信號(hào)的雙鏈DNA(例如可以被摻入到終止信號(hào)的ApaI、Dral、SmaI位點(diǎn))另一種使用可以去除的標(biāo)記的方法是利用在生物化學(xué)過程中可被再激活的失活標(biāo)記。
優(yōu)選的方法是通過光切割或者化學(xué)切割的方法。
當(dāng)標(biāo)記為熒光團(tuán)時(shí),摻入產(chǎn)生的熒光信號(hào)可以用光學(xué)方法測(cè)量,例如通過共聚焦顯微鏡。或者,靈敏的2-D檢測(cè)器,例如電荷耦合檢測(cè)器(CCD),可用于顯示產(chǎn)生的各個(gè)信號(hào)。
常規(guī)的光學(xué)檢測(cè)裝置如下顯微鏡落射熒光(Epi-fluorescene)物鏡 油浸(100×,1.3NA)光源 激光或燈濾光片帶通反射鏡分色鏡和二向色楔形鏡(dichroic wedge)檢測(cè)器光電倍增管(PMT)或者CCD相機(jī)也可使用不同的裝置,包括A.全內(nèi)反射熒光顯微鏡(TIRFM)光源 一種或者多種激光背景控制 無需針孔檢測(cè)器CCD相機(jī)(視頻和數(shù)字成像系統(tǒng))B.共聚焦激光掃描顯微鏡(CLSM)光源 一種或者多種激光背景降低 一種或者多種針孔孔徑檢測(cè)器a)單一針孔用于不同熒光波長的光電倍增管
(PMT)檢測(cè)器[最終圖像由計(jì)算機(jī)隨時(shí)間逐點(diǎn)形成]。
b)數(shù)千針孔(旋轉(zhuǎn)的尼普科夫圓盤(Nipkow disk))CCD相機(jī)檢測(cè)圖像[最終圖像由相機(jī)直接記錄]。
C.雙光子(TPLSM)和多光子激光掃描顯微鏡光源一個(gè)或者多個(gè)激光背景控制無需針孔檢測(cè)器 CCD相機(jī)(視頻和數(shù)字成像系統(tǒng))優(yōu)選的方法是TIRFM和共聚焦顯微鏡。
應(yīng)理解的是,雖然本說明書中提供了適用于被放大的可讀信號(hào)序列的技術(shù)的具體實(shí)例,但是放大的可讀信號(hào)序列和“放大的標(biāo)簽”的位置標(biāo)簽可以用任何適當(dāng)?shù)淖x出平臺(tái)識(shí)讀。
當(dāng)可讀信號(hào)序列不是放大的可讀信號(hào)序列,例如它是PITC標(biāo)記的多肽或者ddNTP標(biāo)記的多核苷酸時(shí),可以使用任何適當(dāng)?shù)淖x出步驟。如本領(lǐng)域所熟知的,色譜和電泳是常用的讀出步驟。
對(duì)于本領(lǐng)域技術(shù)人員而言很顯然,一旦知道了每個(gè)片段的序列,根據(jù)可以表明每個(gè)片段在靶分子中順序的位置標(biāo)簽,即可重建靶聚合物分子的序列。每個(gè)可讀信號(hào)序列的重疊區(qū)也有助于序列重建。這可利用常規(guī)的軟件程序來完成。本文引用的每份出版物的內(nèi)容均通過引用的方式納入本說明書。
權(quán)利要求
1.一種對(duì)靶聚合物分子進(jìn)行測(cè)序的方法,包括如下步驟(i)用一種可對(duì)靶聚合物的至少一端進(jìn)行連續(xù)降解的試劑處理靶聚合物;(ii)將不同降解聚合物的降解端的至少一部分轉(zhuǎn)換成可讀信號(hào)序列,并將每種所述降解聚合物用表示相對(duì)降解順序的標(biāo)簽進(jìn)行標(biāo)記;(iii)測(cè)定可讀信號(hào)序列的序列;并且(iv)利用步驟iii)中獲得的序列數(shù)據(jù)和對(duì)每個(gè)相關(guān)標(biāo)簽的識(shí)別確定靶聚合物的序列。
2.根據(jù)權(quán)利要求1的方法,其中降解聚合物樣品在降解反應(yīng)過程中的預(yù)定時(shí)間點(diǎn)被移出并置于獨(dú)立隔室中用于分析。
3.根據(jù)權(quán)利要求1或者權(quán)利要求2的方法,其中每個(gè)可讀信號(hào)序列含有一個(gè)與至少一個(gè)其它降解聚合物的可讀信號(hào)序列互補(bǔ)的區(qū)域。
4.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中所有降解聚合物的所述可讀信號(hào)序列的組合表示所述靶聚合物的序列。
5.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中所述靶聚合物為多核苷酸。
6.根據(jù)權(quán)利要求5的方法,其中所述多核苷酸為DNA。
7.根據(jù)權(quán)利要求1至4任一項(xiàng)的方法,其中所述靶聚合物為多肽。
8.根據(jù)權(quán)利要求1至6任一項(xiàng)的方法,其中所述試劑為外切核酸酶。
9.根據(jù)權(quán)利要求7的方法,其中所述試劑為蛋白酶。
10.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中所述可讀信號(hào)序列是或者包括放大標(biāo)簽。
11.根據(jù)前述任一項(xiàng)權(quán)利要求的方法,其中所述標(biāo)簽是或者包括具有預(yù)定序列的放大標(biāo)簽。
12.根據(jù)權(quán)利要求1至10任一項(xiàng)的方法,其中所述標(biāo)簽是熒光團(tuán)。
全文摘要
一種對(duì)靶聚合物分子進(jìn)行測(cè)序的方法,包括如下步驟(i)用一種可對(duì)靶聚合物的至少一端進(jìn)行連續(xù)降解的試劑處理靶聚合物;(ii)將不同降解聚合物的降解端的至少一部分轉(zhuǎn)換成可讀信號(hào)序列,并將每種所述降解聚合物用表示相對(duì)降解順序的標(biāo)簽進(jìn)行標(biāo)記;(iii)測(cè)定可讀信號(hào)序列的序列;并且(iv)利用步驟(iii)中獲得的序列數(shù)據(jù)和對(duì)每個(gè)相關(guān)標(biāo)簽的鑒定來測(cè)定靶聚合物的序列。
文檔編號(hào)C12Q1/68GK101076604SQ200580042466
公開日2007年11月21日 申請(qǐng)日期2005年10月12日 優(yōu)先權(quán)日2004年10月13日
發(fā)明者P·萊克索 申請(qǐng)人:靈維泰公司