核苷酸序列的概率導(dǎo)向分離(pins)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種分離包含已知核巧酸序列元件(即,編碼保守活性位點或結(jié)構(gòu)域 的序列)的復(fù)雜核巧酸片段的方法,即,該方法可適用于高通量篩選含有已知序列元件的 DNA片段。
【背景技術(shù)】 陽00引一般介紹
[0003] 分子診斷和其它WDNA為基礎(chǔ)的方法在諸如Discovery、R&D、和診斷的各個分支 等部口已經(jīng)獲得了越來越多的關(guān)注。但是,不論檢測或篩選所分析的是何種祀,所有的W DNA為基礎(chǔ)的方法均面臨著同樣的挑戰(zhàn),即相對于背景DNA生成足夠量的可用的祀。
[0004] 通過提高低豐度的祀DNA的存在,在W復(fù)雜的混合DNA樣本中不期望的背景DNA 為代價下,能夠使用傳統(tǒng)的分子方法,諸如克隆文庫構(gòu)建、天然產(chǎn)物的發(fā)現(xiàn)、PCR診斷、雜交、 測序、宏基因組學(xué)、W及各種其他分子方法。
[0005]W下描述了當(dāng)前使用的方法W及低豐度、混合DNA樣本的挑戰(zhàn)。
[0006] PCR診斷
[0007] 近年來,已廣泛地開發(fā)了用于臨床微生物中傳染病的常規(guī)診斷的PCR檢測。PCR適 用于直接在臨床樣本中細(xì)菌的快速檢測,允許相關(guān)疾病的早期、靈敏和特異性的實驗室確 認(rèn)[1]。另外,其允許抗生素抗性基因或基因突變的存在的快速評估。組合病原體檢測、它 們的耐抗生素性的機制、它們的毒力因子W及臨床樣品中的細(xì)菌負(fù)荷的方法能在運些感染 患者的護(hù)理中帶來深刻變化。因此,當(dāng)前正在開發(fā)復(fù)雜的多重PCR檢測W開拓分子診斷的 領(lǐng)域。
[0008] 但是,從混合樣品基于PCR的診斷經(jīng)常與挑戰(zhàn)相聯(lián)系,因為PCR產(chǎn)物的存在可W源 自混合復(fù)雜樣品中多于一種DNA的源。特定的抗生素基因的存在結(jié)合特定的細(xì)菌菌株的存 在并不一定意味著抗性細(xì)菌菌株存在于原始樣品中。其僅表明,在樣品中同時存在抗性基 因和細(xì)菌菌株,它們不一定源自相同的細(xì)胞。已經(jīng)建議了防止運種問題的方法,其中通過特 異性引物祀向抗生素抗性基因的整合位點,也稱為祀向特異性細(xì)菌菌株。但是,由此需要知 道準(zhǔn)確的整合位點并且運限制了運種方法的使用。
[0009] DNA測序
[0010] DNA序列的知識在基礎(chǔ)生物學(xué)研究和在諸如診斷、生物技術(shù)、法醫(yī)生物學(xué)W及生物 系統(tǒng)學(xué)等許多應(yīng)用領(lǐng)域已成為不可缺少的。使用現(xiàn)代DNA測序技術(shù)獲得的快速測序和成本 降低一直有助于DNA序列的測序,并且全世界測序的DNA總量迅速增加。
[0011] 雖然純樣品的測序是現(xiàn)在的標(biāo)準(zhǔn)程序,但DNA的混合樣品的測序仍然具有挑戰(zhàn) 性、其昂貴且費時。當(dāng)祀片段W較低的頻率存在于混合核巧酸樣品中時,例如在棉簽、糞便 或血液樣品中,首先必須做出克隆或片段文庫,然后對所述完整的文庫進(jìn)行測序,或者做出 更小的PCR片段并且對其進(jìn)行測序。完整文庫的測序昂貴且耗時,而PCR片段的測序僅在 所述序列在非常大的程度上是已知的條件下才是可能的并且會返回相對短的片段,運種相 對短的片段不能被分配到同一分子或生物體。如果僅知道祀序列的一部分,那么PCR將是 不可能的并且需要宏基因組測序。
[0012] 因此,需要一種用于提高核巧酸分子的混合樣品中的稀有核巧酸分子的頻率的方 法,W便降低測序混合樣品的成本和時間。
[0013] 宏基因組學(xué)
[0014] 宏基因組學(xué)是指一般的測序方法,其中將DNA的復(fù)雜混合物區(qū)分為小的片斷 (化actions)并且單獨地測序。該系統(tǒng)不依賴于培養(yǎng)性并因此同時適用于可W及不可W在 實驗室培養(yǎng)的樣品。
[0015] 雖然宏基因組學(xué)在某些情況下可W被應(yīng)用到所描述的復(fù)雜樣品,但是經(jīng)常的情況 是,研究人員更偏好基因組的或基因組混合物的特定子集,而非基因組的一個樣品或混合 樣品的整個序列巧]。因此,仍然強烈需要靈活的祀向方法,其匹配各種技術(shù)和研究的個性 化要求。雖然此種技術(shù)確實存在,但是它們經(jīng)?;陔s交試驗,并且W具有廣泛的序列知識 為前提條件或者具有低的靈敏度。
[0016] 因此,如果宏基因組學(xué)旨在用于分析稀少的/低豐度的DNA片段或祀,則存在對復(fù) 雜混合物中預(yù)定義的子片斷的特異性富集的強烈需求。
[0017] 發(fā)現(xiàn)
[0018] 不同的行業(yè)有不同的動機,W探索處于未發(fā)掘的微生物多樣性中的廣麥的資源。 當(dāng)前,白色(工業(yè))生物技術(shù)似乎在可持續(xù)發(fā)展的現(xiàn)代社會的建立中發(fā)揮了核屯、作用。一種 普遍接受的假設(shè)是,只有天然微生物生物多樣性的一個小的細(xì)分可用于篩選。在1990年, Torsvijketal. [3]估計,充其量只有1%的±壤樣品的天然存在的微生物多樣性可W在 實驗室條件下培養(yǎng)。因此,在尚未知的天然產(chǎn)物的發(fā)現(xiàn)中W及在使得能夠進(jìn)入存在于天然 和環(huán)境樣品的未知的大多數(shù)DNA的生物技術(shù)中存在巨大的潛力。遺憾的是,如果要獲取那 些W其它方式無法獲得的信息,則需要大量的測序。
[0019] 編碼工業(yè)相關(guān)蛋白質(zhì)或酶的DNA片段的祀向富集將大大減少所需的測序量。
【發(fā)明內(nèi)容】
[0020] 本發(fā)明提供了用于從混合的多核巧酸樣品富集和/或分離祀DNA分子的體外方 法,其包含步驟:
[0021] a)提供含有所述祀DNA分子的混合核巧酸樣品,其中所述祀DNA分子包含一個或 多個至少10個核巧酸的獨特連續(xù)序列(uniqueconsecutivesequence),
[0022] b)連續(xù)稀釋所述混合多核巧酸樣品直至在稀釋的樣品中檢測所述祀DNA分子的 概率低于0. 75,優(yōu)選低于0. 50或甚至更優(yōu)選地低于0. 25,和
[0023] C)復(fù)制足夠數(shù)量的稀釋的樣品直至在至少一個所述復(fù)制稀釋樣品中檢測所述祀 DNA分子的概率為至少0. 75,優(yōu)選0. 80~0. 95 ;
[0024] d)擴(kuò)增所述復(fù)制稀釋樣品中的DNAW提高每個樣品中的DNA豐度;
[0025]e)檢測所述祀DNA分子在步驟(d)中擴(kuò)增的所述復(fù)制稀釋樣品中的存在或不存 在,其中所述祀DNA分子在所述復(fù)制稀釋樣品中的頻率與步驟(a)中的混合多核巧酸樣品 相比被提局;
[00%]f)連續(xù)稀釋含有所述DNA分子的至少一個復(fù)制稀釋樣品直至在稀釋的樣品中檢 測所述祀DM分子的概率低于0.75,并且重復(fù)步驟(c)至(e)或(f)至少一次。
【附圖說明】
[0027]圖 1 :
[0028] 本圖示出了來自初始混合物的九個陰性PCR反應(yīng)的2%瓊脂糖凝膠??虺鰠^(qū)域指 示在凝膠中將存在陽性PCR產(chǎn)物??蛲獠康腜CR產(chǎn)物為非特異性產(chǎn)物且在本上下文中被忽 略。
[0029]圖 2 :
[0030] 本圖示出了在第一輪PINS之后的十個PCR樣品的2%瓊脂糖凝膠。五個樣品(A、 B、C、D&I)含有預(yù)期大小的PCR產(chǎn)物,而剩余的五個樣品則不含有。在凝膠中用箭頭標(biāo)識了 正確的產(chǎn)物大小(左側(cè))。其它位置的PCR產(chǎn)物(未用箭頭標(biāo)識的)為非特異性產(chǎn)物且在 本上下文中被忽略。
[0031]圖3: 陽0巧本圖示出了在樣品#10再擴(kuò)增后的十個PCR樣品的2%瓊脂糖凝膠。六個樣品(A、 C、E、F、I&J)含有預(yù)期大小的PCR產(chǎn)物,而剩余的四個樣品則不含有。在凝膠中用箭頭標(biāo)識 了正確的產(chǎn)物大?。ㄗ髠?cè))。其它位置的PCR產(chǎn)物(未用箭頭標(biāo)識的)為非特異性產(chǎn)物且 在本上下文中被忽略。
[0033]圖 4 :
[0034] 本圖示出了在PCR之前使用沈-1稀釋的第二輪PINS后的十個PCR樣品的2%瓊 脂糖凝膠。五個樣品(C、D、E、G&I)含有預(yù)期大小的PCR產(chǎn)物,而剩余的四個樣品則不含有。 在凝膠中用箭頭標(biāo)識了正確的產(chǎn)物大?。ㄗ髠?cè))。其它位置的PCR產(chǎn)物(未用箭頭標(biāo)識的) 為非特異性產(chǎn)物且在本上下文中被忽略。
[0035]圖 5 :
[0036] 本圖示出了使用下列參數(shù)的兩輪PINS的示意圖:
[0037]A:初始樣品-具有 0. 028ng/y1。 陽03引 B:10Phi樣品,由A創(chuàng)建,使用3. 5y1 "A"作為模板。
[0039] C: 一個樣品,(S個中)全部3個PCR產(chǎn)物為陽性。 W40]D:通過使用3. 5y1樣品#10在50的總反應(yīng)體積中再擴(kuò)增的樣品"C"。
[0041] E:10Phi樣品,在每個反應(yīng)中使用1. 0y1作為模板由"D"創(chuàng)建。
[0042]F&G :兩個樣品,其中(S個中)全部3個PCR產(chǎn)物均為陽性。 W43] H:合并樣品"F,,& "G,,。
[0044] I:增益,計算為從初始濃度到第一輪PINS后的結(jié)果。
[0045]J:增益,使用在相同稀釋度下的直接比較,從第一輪PINS計算至第二輪PINS。
[0046] K:增益,使用在不同稀釋度下的比較,從第一輪PINS計算至第二輪PINS。
[0047]L :增益,從初始樣品計算至完成(祀/ng)。
[0048]圖 6:
[0049] 本圖示出了從包含祀HPV18-DNA分子的初始混合多核巧酸樣品產(chǎn)生的十個陰性 PCR反應(yīng)的2%瓊脂糖凝膠。框出區(qū)域指示了在凝膠中將會存在陽性PCR產(chǎn)物??蛲獠康?PCR產(chǎn)物為非特異性產(chǎn)物且在本上下文中被忽略。 陽化0] 圖7 :
[0051] 本圖示出了設(shè)計用于檢測祀HPV18-DNA分子的存在的S個PCR的產(chǎn)物的2%瓊脂 糖凝膠。泳道#1為陽性對照PCR反應(yīng);泳道#2為PINS(MDA-介導(dǎo)的)富集的含有2. 5祀 拷貝/y1的混合核巧酸樣品的PCR產(chǎn)物;且泳道#3為陰性PCR對照。箭頭指示了~66化P 的DNA分子在瓊脂糖凝膠中的相對遷移率。
[0052]圖 8 :
[0053] 本圖示出了通過再擴(kuò)增圖7中所示的祀HPV18-DNA分子獲得的PCR產(chǎn)物的2%瓊 脂糖凝膠。箭頭指示了~66化P的DNA分子在瓊脂糖凝膠中的相對遷移率。
[0054] 圖 9 : 陽化日]PINS富集的祀HPV18-DNA分子的檢索序列與HPV18序列(HPU89349)的比對,顯示 所述序列完美一致,零錯配。
[0056] 圖 10 :
[0057] 檢索到的編碼內(nèi)切葡聚糖酶(endoglucanase)的微生物基因的序列的引物和局 部比對。
[0058]圖 11 :
[0059] 本圖示出了通過PINS富集的編碼內(nèi)切葡聚糖酶的基因的核巧酸序列。用于RGW 的限制性位點(MboI、EcoRI和化ndlll)被插入到框中。-35&-10示出了推定的啟動子位 點的位置且SD為核糖體結(jié)合位點(ShineDalgarno)位置。EndoGlu-Fw&EndoGlu-Re為在 PINS過程中使用的引物。0RF指示了開放閱讀框的位置。
【具體實施方式】 W60] 本發(fā)明設(shè)及一種體外方法,其中含有目標(biāo)DNA片段(所關(guān)注的DNA片段,DNA 化agmentofinterest)的祀核巧酸序列的頻率被逐步增加,其通過多輪1)在多個復(fù)制品 (復(fù)制體,replicate)中稀釋含有目標(biāo)DNA片段的樣品(分離)、2)隨機擴(kuò)增復(fù)制品中的 DNA(濃縮)、3)在至少一個稀釋并擴(kuò)增的復(fù)制品中檢測目標(biāo)DNA片段(選擇)并且重復(fù)步 驟1)~3)直到通過標(biāo)準(zhǔn)的測序技術(shù)能夠?qū)δ繕?biāo)DNA片段進(jìn)行測序。
[0061] 本發(fā)明基于的原則是:如果存在于混合樣品中的所選定的目標(biāo)DNA片段所處于的 稀釋度下尋找它的概率較小,那么所述目標(biāo)DNA片段在該稀釋度下的頻率比在混合樣品中 的高,并且其頻率可W進(jìn)一步通過多輪選擇(如上所述)來增加,直到其可W通過標(biāo)準(zhǔn)方法 諸如Sanger測序或焦憐酸測序或類