本發(fā)明涉及DNA熒光標記以及多基因座基因小片段檢測技術領域,具體涉及一種DNA片段的化學連接技術和通過毛細管電泳的熒光光譜采集和分析技術。
背景技術:
隨著人類基因組計劃的完成,人類對自身遺傳信息的了解和掌握有了前所未有的進步。DNA檢測技術得到了迅猛發(fā)展,DNA檢測效率不斷提高。DNA檢測技術在個體識別、遇難者身份識別、親子鑒定、血緣鑒定、刑事案件偵破、食品與種子安全、疾病診斷,精準醫(yī)療等方面發(fā)揮著十分重要的作用。
每個人的DNA都不同,因此理論上講,通過全基因測序可以確定每個人的獨特身份。但是人體的DNA包含近30億個堿基,而且不同人之間99.5%以上的DNA序列是相同的,因此,通過全基因測序確定個人身份的做法會耗時耗力,而且完全沒有必要,只需要對人類在存在差別的基因座上進行檢測甄別即可。目前商業(yè)上的做法是通過多基因座下的STR片段檢測來建立每個人的DNA數(shù)據庫,用于鑒定個人身份。
身份鑒定技術通常又稱為基因掃描技術,其原理如下:正常人體有23對染色體,共46條染色體。每一條染色體由兩條雙鏈DNA組成,每一條雙鏈DNA是由兩條堿基互補的單鏈DNA構成。每一條單鏈DNA上有很多的編碼區(qū)(即基因區(qū))和非編碼區(qū),它們以線形交替形式排列在DNA鏈上。這些非編碼區(qū)通常是一段以某短堿基序列(一般在2到6個堿基)作多次重復出現(xiàn)的DNA片段,簡稱短序列串聯(lián)重復單元(Short Tandem Repeats,STR)。大量的研究發(fā)現(xiàn),每個非編碼區(qū)內的STR呈現(xiàn)多態(tài)性,即不同的生物個體在同一個非編碼區(qū)內的STR重復數(shù)目可能不同,而且不同的非編碼區(qū)內STR重復單元的堿基序列和重復數(shù)目也是完全獨立的,彼此不關聯(lián)。因此,這些非編碼區(qū)內的DNA序列是用來區(qū)分不同生物個體(包括人類本身)的絕佳對象。例如,如果一個基因座下存在10種多態(tài)性(即10個不同的重復數(shù)目),那么選取10個基因座,理論上存在1010=100億種多態(tài)性。因此通過檢測多個非編碼區(qū)內的STR片段,就可區(qū)分每個人的獨特身份。目前英國采用11個基因座,美國采用13個基因座,而中國采用18-22個基因座。但是,在很多情況下,這么多的基因座數(shù)目還不足以確定一個人的身份或特點,就需要增加更多的基因座來進行更準確可靠的身份鑒定。
多基因座的STR多態(tài)性可通過精心設計特定的雙向引物(其中正向引物用某個特定的染料標記),經PCR技術實現(xiàn)對DNA模板鏈上包含重復單元的非編碼區(qū)短序列進行復制和擴增,再利用毛細管電泳和熒光檢測技術確定各片段的重復單元數(shù)目和基因座歸屬,即基因分型。
目前市場上通常使用五色熒光染料來實現(xiàn)基因掃描,不同試劑盒所檢測的DNA片段長度范圍略有變化,大致在80-350bp之間。其中,一種熒光染料標記一組長度不同的片段,用作內標(即確定DNA長度的標尺),其余四種染料分別用來標記多個基因座。當用四色染料標記18個基因座時,顯然多個基因座必須共用同一種染料來標記。基因座歸屬是根據顏色和片段長度兩個參數(shù)來確定的。因此,為了能夠確定同一種染料標記下的不同片段基因座的歸屬,這些片段長度必須預先精心設計,讓不同基因座下的STR片段在80-350bp之間各占據一個特定的區(qū)間,彼此長度范圍不能出現(xiàn)重疊。在實際工作中,很多檢材采用通用試劑盒檢測分析還不能作出準確判斷時,就需要設計具有更多基因座數(shù)目的試劑盒,通過擴大DNA片段長度的檢測范圍以容納更多的STR片段或增加更多熒光染料實現(xiàn)對增加的基因座進行標記。在一些情況下,例如刑事犯罪中生物樣品高度降解時,樣品的DNA模板鏈發(fā)生斷裂,其相應的完整基因座STR片段就難以通過PCR技術復制,因而不僅造成相關基因座的信息丟失,而且因復制失敗只能產生較小的片段,這些片段與其他小片段區(qū)發(fā)生重疊,嚴重干擾檢測結果。因此,通過擴大DNA片段長度的檢測范圍以容納更多的STR片段的策略受到極大的限制,市場上多采用增加熒光染料來標記更多基因座的方法。目前商業(yè)上使用的五色染料體系難以在80-350bp的狹窄區(qū)間之內實現(xiàn)對更多基因座的熒光標記并且序列長度不交叉排布。
顯而易見,這種五色體系的應用有較大的局限性。其具體表現(xiàn)在:(1)基因座數(shù)目不夠多。在多樣品混合的情況下,采用較少的基因座數(shù)目作基因掃描時不一定能夠準確檢出混合樣品中各組分對應的單個身份。尤其是當樣品發(fā)生降解時,一些基因座的STR片段因不能被PCR技術擴增出來而無效,那么可以用作鑒定身份的有效基因座STR數(shù)目大大下降,從而無法作出準確的身份鑒定;(2)因一種染料已用于標記內標,僅有的四種熒光染料不足以用來標記更多基因座。在樣品高度降解的情況下,由于DNA模板斷裂不完整,通過PCR技術難以復制和擴增較大的片段。因此在高度降解的生物樣品上,廣泛采用小衛(wèi)星或微衛(wèi)星片段的分析法,即對每個基因座的STR片段盡量選最短的序列,以降低因模板母鏈降解而不能通過PCR擴增所需的各個基因座STR片段的風險;但是,在一個有限的DNA片段長度范圍內,單一染料標記的基因座數(shù)目將受到極大限制。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種多基因座STR分析方法,本發(fā)明方法針對五色熒光染料在多基因座STR檢測時的局限性,不僅可以擴展單個熒光染料可標記的基因座STR片段數(shù),而且能夠解決多色(5色以上)染料在標記STR片段時因較嚴重的熒光光譜交叉問題而導致儀器檢測時難以確定各個染料標記的片段基因座歸屬。
本發(fā)明的基本原理如下:每一個基因座中多次重復的STR長度是具有高度多態(tài)性的,是現(xiàn)代身份鑒定的基礎。僅僅包含多次重復的STR單元本身是很小的。為了讓毛細管電泳能夠同時分析多個STR片段,這些片段必須在堿基數(shù)目,即片段長度上有差別,才能被區(qū)分。因此在選擇多個基因座的STR長度時,有意在STR重復單元之外多選一些堿基,造成各基因座的STR片段之間不至于發(fā)生堿基數(shù)相同。在一些情況下,例如高度降解的生物樣品中,通過PCR技術復制長的DNA片段非常困難,盡量縮小基因座的STR片段,即采用微衛(wèi)星片段,是實現(xiàn)樣品成功被檢測的關鍵。本發(fā)明通過預先合成一段與被檢樣品的序列無關、長度特定的單鏈DNA片段,然后通過特殊高效的化學連接方法實現(xiàn)與眾多小STR片段選擇性地對接,讓可能重疊的片段發(fā)生空間移位從而可被電泳分離。特別指出的是,由于連接所用的長度特定的單鏈DNA片段與被測樣品沒有任何關聯(lián),因此盡管樣品母鏈因降解發(fā)生斷裂,但是通過本發(fā)明的方法仍可以制備片段長度不同且包含各基因座的特征STR片段。
本發(fā)明在不改變目前市場上常用DNA片段長度檢測范圍的前提下,可以讓每一種染料分別標記比原來試劑盒多一倍的基因座STR片段,設計時新增的被標記基因座被編成一組,讓組內的各基因座STR片段互相不重疊,而不用考慮與原來同色標記基因座片段長度是否重疊的問題。對新增的基因座,在染料和引物之間需要引入一個帶有三個官能團的腳手架小分子,其中的兩個官能團與DNA主鏈構成基本骨架,用于引物和染料之間的連接,第三個則用于與一段外來的長度特定的單鏈DNA片段進行化學連接。
當經過PCR擴增和提純后,新增的一組片段即可與預先合成的長度特定的DNA片段發(fā)生化學反應連接在一起,連接后的DNA片段長度將會增大,而未經腳手架分子修飾的普通方法標記的一組因不能發(fā)生化學連接反應,其片段長度不會發(fā)生改變。因此,用新方法標記的新增基因座就可與原普通方法標記的一組基因座在電泳中完全分離,從而實現(xiàn)基因分型。
在多色熒光(多于5色)染料標記多基因座STR片段的情況下,由于染料之間的熒光光譜交叉問題,當片段長度相似時,光譜彼此嚴重干擾,難以準確分辨各自所標記的染料,因而基因分型會變得很困難。本專利的方法是將光譜相互交叉的染料標記片段通過上述類似的方法實現(xiàn)彼此移位,在空間上不相互重疊,從而實現(xiàn)光譜交叉最小化,以利于熒光檢測和基因分型。
為達到上述目的,本發(fā)明采用如下的技術方案:
一種多基因座STR分析方法,該方法包括在使用被熒光染料標記的引物對多基因座STR片段進行PCR復制和擴增之后能夠將一個長度特定的單鏈DNA片段有選擇地連接到擴增后的某些DNA片段產物上。
優(yōu)選地,所述被熒光染料標記的引物為雙向引物中的正向引物或反向引物,且在被熒光染料標記之前,在部分所述正向引物或部分所述反向引物上引入一個腳手架分子。
優(yōu)選地,所述腳手架分子包括一個基本骨架和一個位于所述基本骨架上能發(fā)生化學連接的官能團。
優(yōu)選地,所述熒光染料、腳手架分子與所述正向引物或所述熒光染料、腳手架分子與所述反向引物兩兩之間可以設有間隔分子;在同一個多基因座STR片段內,所述間隔分子的結構可以相同或不同,所述間隔分子的結構包括線性結構或分叉結構。
優(yōu)選地,所述官能團是馬來酰亞胺、鹵代乙?;?、氨基、巰基、疊氮基、炔基、肼基、胺氧基、醛基或酮基中的至少一種。
優(yōu)選地,所述氨基還包括通過化學轉換反應由氨基進一步轉換生成的巰基;所述化學轉換反應包括與Traut試劑或與N-乙?;?DL-高半胱氨酸硫代內酯試劑發(fā)生的化學反應。
優(yōu)選地,所述馬來酰亞胺具有如式(6)或式(7)所示的結構,
式(7)中R為直鏈烷基;
所述醛基或酮基具有如式(14)所示的結構,
式(14)中,R1=H或直鏈烷基,R2為直鏈烷基或烷氧基。
優(yōu)選地,所述基本骨架包括具有式(1)或(2)所示的結構,
式(1)和(2)中,n=1,2,3,4,R為所述骨架上的官能團;
或具有式(3)所示的結構,
式(3)中,n=1,2,3,R為所述骨架上的官能團;
或具有式(4)所示的結構,
式(4)中,n=1,2;
或具有式(5)所示的結構,
優(yōu)選地,所述單鏈DNA片段是通過化學合成帶特定官能團的引物和生物合成PCR復制擴增獲得的一段長度特定的片段,其序列通常與被測樣品無關,其長度和序列可依據檢測要求做調整和變化。
本發(fā)明的有益效果如下:
(1)本方法能夠將單個熒光染料可標記的STR片段數(shù)目擴大一倍甚至更多;
(2)解決了多色(5色以上)染料標記STR片段時因有較嚴重的熒光交叉問題而導致儀器檢測時難以確定各個染料標記的片段歸屬(即基因分型)問題。
本發(fā)明方法將各染料的光譜交叉對檢測的影響降低到最小。因此,本發(fā)明對未來的STR檢測中需要增加更多基因座提供了一個獨特而有效的解決方案,可望成為今后的DNA檢測診斷技術中一個強大的技術平臺。
附圖說明
圖1為本發(fā)明的設計思路示意圖;
圖2a為化學合成熒光染料標記的引物和利用PCR技術合成STR片段;
圖2b為利用移位方法實現(xiàn)染料能夠標記更多片段的原理示意圖;
圖2c為染料熒光光譜交叉示意圖;
圖3為四色熒光交叉的染料標記相同長度的DNA引物的設計策略示意圖;
圖4為本發(fā)明方法的應用示意圖;
圖5為本發(fā)明方法的應用示意圖;
圖6為間隔分子與染料,腳手架分子,引物的連接情況示意圖。
具體實施方式
為了更清楚地說明本發(fā)明,下面結合優(yōu)選實施例對本發(fā)明做進一步的說明。本領域技術人員應當理解,下面所具體描述的內容是說明性的而非限制性的,不應以此限制本發(fā)明的保護范圍。
本發(fā)明針對基于五色熒光標記多基因座STR檢測體系的局限性,獨創(chuàng)性地提出利用化學連接法將一個特定長度的DNA片段有選擇地連接到不同熒光標記的STR片段上,從而達到兩個目的:(1)單個熒光染料能夠標記的STR片段數(shù)可以擴展一倍甚至更多倍;(2)當多色染料(多于5色)用來標記更多STR片段時,會因染料間較嚴重的熒光光譜交叉問題而在被檢測時難以確定各個特定的染料,從而不能確定所標記片段的基因座歸屬(即基因分型);本方法通過化學連接實現(xiàn)序列長度在識別空間排布上移位,從而將光譜交叉的染料標記片段錯位,不再同時被檢測,因而可以準確確定片段標記所用的染料。
本發(fā)明利用化學連接方法改變被檢片段的原有長度,達到被檢片段在識別空間上有序地錯位和擴大片段長度檢測范圍,從而不僅能夠擴展單個熒光染料可標記的基因座STR片段數(shù),而且能夠解決多色染料(5色以上)在標記STR片段時因較嚴重的熒光光譜交叉問題而導致儀器檢測時難以確定各個染料標記的片段基因座歸屬(基因分型)問題。
本發(fā)明的設計思路如圖1所示。
本發(fā)明方法包括兩個部分,分別針對兩種不同的用途:
1.拓展單個熒光染料能夠標記的STR片段數(shù)目。
圖2中示意了拓展單個熒光染料標記STR片段數(shù)目的方法,如圖2a所示,首先,單獨通過化學合成和生物合成PCR技術復制擴增獲得一長度特定(例如,220bp)的單鏈DNA片段,這些合成的單鏈DNA片段上帶有用于化學連接的官能團;然后,在設計引物時,對熒光標記的正向引物作一個化學結構上略有變化的設計,讓一些基因座下的引物保持正常的染料標記結構,而另一些基因座下的引物在染料標記之前先引入一個帶有可用于化學連接的腳手架分子;引入的每個腳手架分子上至少含有三個可發(fā)生化學反應的官能團三個官能團中的一個官能團與引物連接,一個官能團與染料連接,還有一個官能團與單鏈DNA片段連接,這樣即可使引物的5’端帶上一個可與腳手架分子發(fā)生化學連接的單鏈DNA片段;這個單鏈DNA片段的長度可依據不同的檢測要求作調整和變化;如圖2b和2c所示,在對STR片段進行PCR復制或擴增之后,把預先合成的長度特定的單鏈DNA片段加入到PCR純化產物的溶液中,被連接有腳手架分子的引物擴增的STR片段則與預先合成的長度特定的單鏈DNA片段通過腳手架分子和單鏈DNA片段上的各自的官能團發(fā)生化學連接反應,反應時間一般為15-20分鐘,反應完畢后溶液體系即可產生兩種不同長度的片段,一種是沒有發(fā)生化學連接反應的原PCR片段(片段1),其長度沒有變化;另一種是已經發(fā)生化學連接反應導致長度增長的新片段(片段2),將含片段1和片段2的混合溶液的樣品可通過正常的儀器分析進行檢測,原本長度相同的片段因為一個長度增長,在電泳時發(fā)生檢測時間上的分離而被準確檢測到。
利用本方法,每一種染料能夠標記的基因座數(shù)可增加約一倍,從而可將目前各種STR檢測中的有限基因座數(shù)擴展約一倍;例如,目前身份鑒定中使用的21個位點就可擴展到40個位點以上。
本發(fā)明方法中用到的引入腳手架分子的染料標記的引物在結構上可以在染料、腳手架分子,引物三者之間設有間隔分子,在同一個片段上,間隔分子可以是相同的,也可以是不同的,所用到的間隔分子可以是線性的,也可以是分叉的,例如線性結構為NH2-(CH2)n-COOH(n=1,2,3,4,….16),間隔分子與染料,腳手架分子,引物的連接情況如圖6所示。
單獨通過化學和生物合成PCR技術合成一段長度特定且在5’端帶一個可與腳手架分子的官能團發(fā)生化學連接的單鏈DNA片段的序列和長度的設計策略:
上述的單鏈DNA片段序列可以使用任意的DNA序列,但是選擇序列時須遵循以下原則:
(1)序列有足夠的穩(wěn)定性,包括難以形成發(fā)夾結構,及避開酶切位點等;
(2)易于合成;
單鏈DNA片段的長度主要是根據傳統(tǒng)的檢測序列長度范圍而定,一般而言,這個片段的序列長度達到或恰好超過傳統(tǒng)的檢測范圍即可,例如,當傳統(tǒng)的檢測序列長度范圍為80-350bp時,設計的片段長度即可使用該范圍的跨度,即270bp(350-80=270)。
引入的腳手架分子是帶有化學反應官能團的分子,通常是由一個基本骨架和可用于化學連接的基團組成。
骨架可包括如下三種:
a.以D-,或L-,或DL-賴氨酸或其他類似側鏈為氨基的氨基酸為骨架的腳手架分子,骨架結構如式(1)或(2)所示:
其中,式(1)和(2)中n=1,2,3,4,R為用于與單鏈DNA片段連接的官能團,骨架上的氨基可以被包括在R官能團之內;
b.以D-,或L-,或DL-冬氨酸,谷氨酸或其他類似的側鏈為羧基的氨基酸為骨架的腳手架分子,骨架結構如式(3)所示:
其中,式(3)中,n=1,2,3,R為用于與單鏈DNA片段連接的官能團,骨架上羧基可以被包括在R官能團之內;
c.以D-,或L-,或DL-半胱氨酸或其他類似的側鏈為巰基的氨基酸為骨架的腳手架分子,骨架結構如式(4)所示:
其中,式(4)中,n=1,2;
d.以核苷酸單元為基本骨架,在其堿基上引入其他化學官能團的腳手架分子,骨架結構如式(5)所示:
骨架上用于化學連接的基團具有式(6-14)所示的結構:
式(6)和(7)為馬來酰亞胺,式(7)中R為直鏈烷基;
式(8)為碘代乙酰基;
式(9)為巰基;
當連接的基團為氨基時,包括可以通過化學轉換反應,如與Traut試劑反應,與N-乙?;?DL-高半胱氨酸硫代內酯反應轉換成巰基的氨基;
式(10)為疊氮基;
式(11)為炔基;
式(12)為肼基,式(13)為胺氧基
式(14)中,R1=H或直鏈烷基,R2為直鏈烷基或烷氧基;
單鏈DNA片段上的官能團可以為具有式(6)至(14)所示的結構。
實施例1
在DNATyper 15 Plus身份鑒定試劑盒中,用染料FAM標記12個基因座(Amelogenin*2,D5S818*2,D21S11*2,D7S820*2,CSF1P0*2,D3S1358*2),在染料FAM和引物DNA片段之間加入一個連接著具有式(8)所示結構官能團的腳手架分子;當PCR完成后,將預先合成好的長度特定(300bp)的一段單鏈DNA片段加入到通過PCR擴增純化后得到的混合溶液中,20分鐘后化學連接反應完成;所得的溶液進行毛細管電泳和熒光檢測;新增的基因座盡管所用標記的染料相同,但是標記的片段尺寸不同,在識別空間排布上發(fā)生了一定距離的位移,與原來檢測的尺寸范圍完全不重疊,因此這些新增的基因座可以被檢測和分辨,從而實現(xiàn)基因分型。
2.以四色染料為例,解決標記STR片段的多色染料較嚴重的熒光光譜交叉問題。
如圖3,4,5所示,在引物設計中,將熒光光譜交叉嚴重的染料(D1,D2,D3,D4,如圖3所示)先劃分成兩組(D1和D3為一組,D2和D4為另一組,讓每組的染料熒光光譜的交叉盡可能小),對其中一組的染料在標記引物時采用常規(guī)標記方法,而另一組采用拓展單個熒光染料標記STR片段數(shù)目的方法,即在染料和DNA引物片段之間先引入一個腳手架分子;在對STR片段進行PCR擴增后,將預先合成好的長度特定的單鏈DNA片段加入到該PCR純化產物的混合溶液中,被連接有腳手架分子的引物擴增的STR片段則與預先合成的長度特定的單鏈DNA片段通過腳手架分子和單鏈DNA片段上的各自的官能團發(fā)生化學連接反應,待化學連接反應結束后,該混合溶液中包含保持長度不變的片段1和片段3,還有長度已經增長的片段2和片段4(如圖4所示);通過儀器對混合溶液進行檢測分析時,由于部分STR片段連接了一個長度特定的單鏈DNA片段,容,導致電泳時停留時間滯后,因此避免了被發(fā)生光譜交叉的染料標記的片段同時被檢測到的情況,從而避免了多種染料間較嚴重的熒光交叉問題。
圖3中顯示了四條被染料標記的引物,圖中D1,D2,D3,D4為染料,D1和D3標記的引物結構相同,D2和D4標記的引物在染料和引物之間加入一個腳手架分子。圖4表示圖3中的4個引物用于STR片段經PCR擴增后再和長度特定的單鏈DNA片段進行化學連接,只有染料D2和D4標記的片段2和片段4才可以發(fā)生片段連接,長度增長,而染料D1和D3標記的片段1和片段3因不能發(fā)生化學連接,長度不變。
圖5表示四個片段在電泳時發(fā)生分離,其中染料D1和D3標記的片段1和片段3因長度相同,電泳移動速度相同處于一組,而染料D2和D4標記的片段2和片段4在空間排布上發(fā)生位移,與染料D1和D3標記的片段1和的片段3分離處于另一組,這樣D1和D2、D2和D3、D3和D4彼此間熒光光譜因片段1,片段2,片段3,片段4不同不再在同時被檢測到,從而避免熒光光譜交叉干擾。
實施例2
在八色熒光染料標記40個基因座的身份鑒定中,八色染料可以為FAM,HEX,TMR,ROX,Cy5,Cy5.5,Cy7,Cy7.5;由于熒光光譜交叉的原因,可將八色染料分為兩組,A組為FAM,TMR,Cy5,Cy7;B組為HEX,ROX,Cy5.5,Cy7.5;對于A組標記的引物,采用常規(guī)的標記方法;而對于B組染料標記的引物則采用拓展單個熒光染料標記STR片段數(shù)目的方法,即在染料和DNA引物片段之間先引入一個腳手架分子;在對STR片段進行PCR擴增后,將預先合成好的長度特定的單鏈DNA片段加入到該PCR純化產物的混合溶液中,被連接有腳手架分子的引物擴增的STR片段則與預先合成的長度特定的單鏈DNA片段通過腳手架分子和單鏈DNA片段上的各自的官能團發(fā)生化學連接反應,20分鐘后化學連接反應完成。所得的溶液進行毛細管電泳和熒光檢測,由于容易產生熒光光譜交叉的染料標記DNA片段均與一個特定長度的DNA片段發(fā)生化學連接從而導致片段增長,與原來有光譜交叉的片段在空間排布上有位移,不再同時被檢測,因而各個片段均可較容易被檢測和分辨,達到基因分型的目的。
最后應說明的是:以上各實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的范圍。