專利名稱::在兩個(gè)功能性亞結(jié)構(gòu)域中具有突變的laglidadg歸巢核酸內(nèi)切酶變體及其用途的制作方法在兩個(gè)功能性亞結(jié)構(gòu)域中具有突變的LAGLIDADG歸巢核酸內(nèi)切酶變體及其用途本發(fā)明涉及用于改造出在兩個(gè)功能性亞結(jié)構(gòu)域中具有突變的LAGLIDADG歸巢核酸內(nèi)切酶變體的方法,其中每個(gè)亞結(jié)構(gòu)域與經(jīng)修飾的DNA靶標(biāo)半位點(diǎn)的不同部分結(jié)合,所述LAGLIDADG歸巢核酸內(nèi)切酶變體能夠切割包含與每個(gè)亞結(jié)構(gòu)域結(jié)合的核苷酸的嵌合DNA靼序列。本發(fā)明還涉及可通過(guò)所述方法獲得的LAGLIDADG歸巢核酸內(nèi)切酶變體,編碼所述變體的載體,經(jīng)所述載體修飾的細(xì)胞、動(dòng)物或植物,以及所述I-Od核酸內(nèi)切酶變體和衍生產(chǎn)物用于遺傳工程、基因組治療和抗病毒治療的用途。大范圍核酸酶的定義是具有大的(>14bp)切割位點(diǎn)的序列特異性核酸內(nèi)切酶,其可以在活細(xì)胞中特定基因座引起DNA雙鏈斷裂(double-strandbreak,DSB)(Thierry和Dujon,NucleicAcidsRes.,1992,20,5625-5631)。大范圍核酸酶已用于在培A細(xì)胞和植物中在其耙序列附近引發(fā)同源重組(Rouet等,MoLCell.Biol.,1994,14,8096-106;Choulika等,Mol.Cell.Biol"1995,15,1968-73;Donoho等,Mol.Cell.Biol,1998,18,4070-8;Elliott等,Mol.Cell.Biol"1998,18,93-101;Sargent等,Mol.Cell.Biol"1997,17,267-77;Puchta等,Proc.Natl.Acad.Sci.USA,1996,93,5055-60;Chiurazzi等,PlantCell,1996,8,2057-2066),這使得大范圍核酸酶誘導(dǎo)的重組成為基因組工程有效且有力的方法。長(zhǎng)久以來(lái),應(yīng)用大范圍核酸酶誘導(dǎo)的重組受到天然大范圍核酸酶組成成員的限制,當(dāng)前技術(shù)的主要限制是需要在目的基因座中預(yù)先引入大范圍核酸酶切割位點(diǎn)。因此,制備具有特定的底物特異性的人工大范圍核酸酶正在深入研究中。這樣的蛋白質(zhì)可用于切割天然染色體序列,并為基因組工程的廣泛應(yīng)用開(kāi)劈了新的前景。例如,大范圍核酸酶可用于誘導(dǎo)糾正與單基因遺傳病相關(guān)的突變,(Hacein-Bey國(guó)Abina等,Science,2003,302,415-419)。最近,可以將Cys2-His2型鋅指蛋白(ZFP)的鋅指DNA結(jié)合結(jié)構(gòu)域與FMI核酸內(nèi)切酶的催化結(jié)構(gòu)域融合,從而誘導(dǎo)多種細(xì)胞類型中的重組,包括人淋巴樣細(xì)胞(Smith等,NucleicAcidsRes,1999,27,674-81;Pabo等,Annu.Rev.Biochem,2001,70,313-40;Porteus和Baltimore,Science,2003,300,763;Urnov等,Nature,2005,435,646-651;Bibikova等,Science,2003,300,764)。ZFP的結(jié)合特異性相對(duì)易于操作,現(xiàn)在可得到能結(jié)合許多(^a)皿(gZa)皿(^a)皿序列的多種新人工ZFP(Pabo等,前文引用;Segal和Barbas,Curr.Opin.Biotechnol.,2001,12,632-7;Isalan等,NatBiotechnol.,2001,19,656-60)。然而,基因組工程應(yīng)用的一個(gè)主要問(wèn)題是保留非常窄的特異性,而目前尚不清楚ZFP是否滿足治療性應(yīng)用的非常嚴(yán)格的要求。另外,這些融合蛋白已在細(xì)胞中表現(xiàn)出高毒性(Porteus和Baltimore,前文引用;Bibikova等,Genetics,2002,161,1169-1175),這可能是由于特異性水平低所致。在自然界中,大范圍核酸酶基本上以歸巢核酸內(nèi)切酶(homingendonuclease,HE)為代表,所述歸巢核酸內(nèi)切酶是由可移動(dòng)遺傳元件編碼的核酸內(nèi)切酶家族,其功能是在稱作"歸巢,,的過(guò)程中起始DNA雙鏈斷裂(DSB欣導(dǎo)的重組事件(Chevalier和Stoddard,NucleicAcidsRes"2001,29,3757-74;Kostriken等,Cell;1983,35,167-74;Jacquier和Dujon,Cell,1985,41,383-94)。已在細(xì)菌、真核生物和古細(xì)菌+鑒定出幾百種HE(Chevalier和Stoddard,前文引用);然而在所選基因中發(fā)現(xiàn)HE切割位點(diǎn)的概率卻極低。由于HE的生物學(xué)功能以及就效率和特異性而言出色的切割性質(zhì),HE提供了衍生出用于基因組工程的新核酸內(nèi)切酶的理想平臺(tái)。過(guò)去十年已經(jīng)積累了表征四個(gè)HE家族中最大的LAGLIDADG家族的數(shù)據(jù)(Chevalier和Stoddard,前文引用)。LAGLIDADG是指在整個(gè)家族中事實(shí)上保守的唯一序列,并發(fā)現(xiàn)其在蛋白質(zhì)中以一個(gè)或(更經(jīng)常)兩個(gè)拷貝存在。具有單個(gè)基序的蛋白質(zhì)(如I-Oel)形成同源二聚體并切割回文或假回文DNA序列,而較大的雙基序蛋白質(zhì)(如是單體,并切割非回文耙標(biāo)。已將七種不同的LAGLIDADG蛋白結(jié)晶,它們的核心結(jié)構(gòu)表現(xiàn)出非常明顯的保守性,這與其在一級(jí)序列水平缺少相似性相反(Jurica等,Mol.Cell.,1998,2,469-76;Chevalier等,Nat.Struct.Biol"2001,8,312-6;Chevalier等J.Mol.Biol"2003,329,253-69;Moure等,J.Mol.Biol,2003,334,685-95;Moure等,Nat.Struct.Biol"2002,9,764-70;Ichiyanagi等,J.Mol.Biol.,2000,300,889-卯1;Duan等,Cell,1997,89,555-64;Bolduc等,GenesDev.,2003,17,2875-88;Silva等,J.Mol.Biol"1999,286,1123-36)。在此核心結(jié)構(gòu)中,由兩個(gè)單體或者由兩個(gè)LAGLIDAG蛋白的兩個(gè)結(jié)構(gòu)域中的兩個(gè)特征性a即a即a折疊(也叫做LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域)彼此相對(duì)奏具有雙重對(duì)稱性(two-foldsymmetry)。DNA結(jié)合依賴于每個(gè)結(jié)構(gòu)域中的4條I3鏈,該|3鏈折疊成反向平行|3片層,并于DNA螺旋大溝上形成鞍部(saddle)(圖1A)。對(duì)與其天然靶標(biāo)結(jié)合的I-OeI結(jié)構(gòu)的分析表明在每個(gè)單體中,8個(gè)瓶基(Y33、Q38、N30、K28、Q26、Q44、R68和R70)與±3、4、5、6、7、9和10位的7個(gè)>5^建立直接相互作用(Jurica等,1998,前文引用;圖2)。另外,某些殘基與若干4建立了水介導(dǎo)的接觸;例如S40、K28和N30與8和-8位的4^對(duì)(Chevalier等,2003,前文引用)。催化核心位于中央,由兩個(gè)對(duì)稱的單體/結(jié)構(gòu)域構(gòu)成。除了此核心結(jié)構(gòu),可存在其它結(jié)構(gòu)域例如,PU"I(—種內(nèi)含肽)具有蛋白質(zhì)剪接結(jié)構(gòu)域以及另外的DNA結(jié)合結(jié)構(gòu)域(Moure等,2002,前文引用;Grindl等,NucleicAcidsRes"1998,26,1857-62)。用于從歸巢核酸內(nèi)切酶產(chǎn)生新核酸內(nèi)切酶的兩種方法正在研究中-蛋白質(zhì)變體通過(guò)誘變和篩選/選擇來(lái)改變DNA結(jié)合蛋白的底物特異性常被證明是困難的(Lanio等,ProteinEng.,2000,13,275-281;Voziyanov等,J.Mol.Biol.,2003,326,65-76;Santoro等,P.N.A.S.,2002,99,4185-41卯;Buchholz和Stewart,Nat.Biotechnol.,2001,19,1047-1052),更具體地,長(zhǎng)久以來(lái)認(rèn)為改造HE的DNA結(jié)合結(jié)構(gòu)域是一項(xiàng)難以完成的任務(wù)(Ashworth等,Nature2006,441,656-659;Gimble等,J.Mol.BioL,2003,334,993-1008;Arnould等,J.Mol.Biol"2006,355,443-458;Doyon等,J.Am.Chem.Soc.,2006,128,2477-2484;Steuer等,前文引用;Seligman等,NucleicAcidsRes"2002,30,3870-3879)。對(duì)I-Oel/DNA晶體結(jié)構(gòu)的分析表明,9個(gè)氨基酸與歸巢位點(diǎn)直接接觸(Chevalier等,2003;Jurica等,前文引用),其隨機(jī)化導(dǎo)致出現(xiàn)209種組合,該數(shù)目超出任何當(dāng)前的篩選能力。為此,幾個(gè)實(shí)驗(yàn)室已依靠半推理性方法(semi-rationalapproach)(Chica等,Curr.Opin.Biotechnol.,2005,16,378-384)來(lái)限制待處理的突變體文庫(kù)的多樣性根據(jù)結(jié)構(gòu)數(shù)據(jù)選擇少數(shù)相關(guān)殘基。盡管如此,這仍不足以獲得切割所選序列的重新設(shè)計(jì)的核酸內(nèi)切酶-Seligman和同事使用推理方法(rationalapproach)來(lái)替換a即a即a折疊中特定的單個(gè)殘基(Sussman等,J.Mol.Biol"2004,342,31-41;Seligman等,NucleicAcidsRes"2002,前文引用;Seligman等,Genetics,1997,147,1653-64);只有極少數(shù)I-Od變體(Y33C、Y33H、Y33R、Y33L、Y33S、Y33T、S32K、S32R)并且^M^士10位被修飾的乾標(biāo)中;i見(jiàn)察到顯著切割。-以類似的方式,Gimble等(前文引用)對(duì)PI-S"I的另外的DNA結(jié)合結(jié)構(gòu)域進(jìn)行修飾;他們獲得了結(jié)合特異性改變但特異性未改變的蛋白質(zhì)變體,并且大多數(shù)變體保持對(duì)野生型耙序列的大部分親合力。-雜合或嵌合的單鏈蛋白質(zhì)新的大范圍核酸酶可以通過(guò)交換LAGLIDADG歸巢核酸內(nèi)切酶不同單體的核心結(jié)構(gòu)域而獲得(Epinat等,NucleicAcidsRes.,2003,31,2952-62;Chevalier等,Mol.Cell.,2002,10,895-卯5;Steuer等,Chembiochem"2004,5,206-13;國(guó)際PCT申請(qǐng)WO03/078619和WO2004/031346)。這些單鏈嵌合的大范圍核酸酶能夠切割雜合靼標(biāo)(對(duì)應(yīng)于兩個(gè)半個(gè)親本DNA靼序列的融合物),其中來(lái)自不同的大范圍核酸酶的兩個(gè)LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域通過(guò)間隔區(qū)連接。構(gòu)建嵌合和單鏈的人工HE已表明,組合法可用于獲得切割新(非回文)耙序列的新的大范圍核酸酶不同的單體或核心結(jié)構(gòu)域可融合在單一蛋白質(zhì)中以實(shí)現(xiàn)新的特異性。這些結(jié)果意味著I-Od二聚體的兩個(gè)DNA結(jié)合結(jié)構(gòu)域獨(dú)立地起作用;每個(gè)DNA結(jié)合結(jié)構(gòu)域結(jié)合DNA耙位點(diǎn)中不同的一本(圖1A)。新的大范圍核酸酶集合的生成以及通過(guò)組裝兩個(gè)不同的單體/核心結(jié)構(gòu)域?qū)ζ溥M(jìn)行組合的能力大大提高了可作為乾標(biāo)的DNA序列的數(shù)目,M不能覆蓋所有潛在的序列。為了達(dá)到更高的序列數(shù),能鑒定可被組合的較小的獨(dú)立亞結(jié)構(gòu)域是非常有價(jià)值的(圖IB)。然而,與單體之間相比,在單個(gè)單體或結(jié)構(gòu)域內(nèi)部應(yīng)用組合法要困難得多,這是因?yàn)榻Y(jié)合界面的結(jié)構(gòu)非常緊湊并且兩個(gè)不同的PP發(fā)夾(其負(fù)責(zé)基本上所有威基特異性的相互作用)不構(gòu)成單獨(dú)的亞結(jié)構(gòu)域,而是單個(gè)折疊的一部分。例如,在I-OeI的DNA結(jié)合區(qū)內(nèi)部,gtc核苷酸三聯(lián)體與第一個(gè)發(fā)夾的一個(gè)殘基(Q44)以及第二個(gè)發(fā)夾的兩個(gè)殘基(R68和R70)結(jié)合(參見(jiàn)Chevalier等,2003的圖1B,前文引用)。另外,一系列突變的累加影響最終可能破壞正確的折疊。盡管其在結(jié)構(gòu)水平上缺乏明顯的模塊性,但發(fā)明人已鑒定出可分離的功能性亞結(jié)構(gòu)域,其能夠結(jié)合歸巢核酸內(nèi)切酶半位點(diǎn)的不同部分(圖2)。通過(guò)組裝來(lái)自不同單體或同一單體內(nèi)核心結(jié)構(gòu)域中的兩個(gè)亞結(jié)構(gòu)域,發(fā)明人已^tit出了功能性歸巢核酸內(nèi)切酶(同源二聚的)變體,其能夠切割回文的嵌合靼標(biāo)(圖3a)。另外,較大組合的方法通過(guò)組裝4個(gè)不同的亞結(jié)構(gòu)域(圖3a)從而形成新的異源二聚分子,其能夠切割非回文的嵌合耙標(biāo)??梢詫?duì)所述不同的亞結(jié)構(gòu)域分別進(jìn)行修飾以改造出新的切割特異性,并且一種大范圍核酸酶(同源二聚體、異源二聚體、單鏈嵌合分子)中不同亞結(jié)構(gòu)域的組合大大增加了可被大范圍核酸酶所切割的DNA耙標(biāo)的數(shù)目。因此,鑒定少數(shù)新的切割酶的每個(gè)亞結(jié)構(gòu)域使得可以設(shè)計(jì)大量具有新特異性的新核酸內(nèi)切酶。使用該方法將4組突變組裝為具有完全^it的特異性的異源二聚歸巢核酸內(nèi)切酶,以切割模式靶標(biāo)(COMB1)或來(lái)自人類RAG1基因的序列。這是第一次完全重新設(shè)計(jì)歸巢核酸內(nèi)切酶以切割天然存在的序列。另外,在先前的研究中,經(jīng)^Lit的蛋白質(zhì)的靶標(biāo)與初始的野生型底物相比每個(gè)位點(diǎn)有1至6個(gè)>5^對(duì)不同,而22bp的COMB1和RAG1序列與切割位點(diǎn)(C1221)分別有9bp和16bp不同。這種新的組合法可用于任何歸巢核酸內(nèi)切酶(具有兩個(gè)結(jié)構(gòu)域的單體或者同源二聚體),其大大增加了可作為靶標(biāo)的DNA序列的數(shù)目,這導(dǎo)致生成能切割來(lái)自許多目的基因的序列的專用大范圍核酸酶。衍生物集合的產(chǎn)生以及對(duì)它們進(jìn)行分子內(nèi)和分子間組合的能力使得可得到的22-mer把標(biāo)的數(shù)目增加到至少1.57x107((64x62)2)。另外,對(duì)于基因組工程應(yīng)用,HE家族的主狄勢(shì)是其精確的特異性,在治療應(yīng)用中該特征變得十分重要。因此,本方法提供了產(chǎn)生切割所選序列的新核酸內(nèi)切酶的一般方法。潛在的應(yīng)用包括特異性切割病毒基因組或者通過(guò)雙鏈斷裂誘導(dǎo)的重組修正遺傳缺陷,這二者均可用于治療。本發(fā)明涉及通過(guò)突變核心結(jié)構(gòu)域的兩個(gè)功能性亞結(jié)構(gòu)域來(lái)改造親本LAGLIDADG歸巢核酸內(nèi)切酶得到LAGLIDADG歸巢核酸內(nèi)切酶變體的方法,其至少包括以下步驟(a)構(gòu)建第一變體,其在所述核心結(jié)構(gòu)域的第一功能性亞結(jié)構(gòu)域中具有突變,所述第一功能性亞結(jié)構(gòu)域與所述親本LAGLIDADG歸巢核酸內(nèi)切酶切割位點(diǎn)的一半的第一部分相互作用,所述構(gòu)建通過(guò)以下步驟實(shí)現(xiàn)(ai)用不同的^^酸替換笫一亞結(jié)構(gòu)域的至少一個(gè)JL^酸,所述第一亞結(jié)構(gòu)域?qū)?yīng)位于中26至40位的亞結(jié)構(gòu)域,(a2)通過(guò)用不同的核苷酸替換所述半位點(diǎn)第一部分的至少一個(gè)核苷酸,從而選擇和/或篩選步驟(ai)的第一變體,其能夠切割來(lái)源于所述親本LAGLIDADG歸巢核酸內(nèi)切酶半位點(diǎn)的第一DNA乾序列,(b)構(gòu)建第二變體,其在所述核心結(jié)構(gòu)域的第二功能性亞結(jié)構(gòu)域中具有突變,所述第二功能性亞結(jié)構(gòu)域與所述親本LAGLIDADG歸巢核酸內(nèi)切酶半位點(diǎn)的第二部分相互作用,所述構(gòu)建通過(guò)以下步驟實(shí)現(xiàn)(bj用不同的^J^酸替換第二亞結(jié)構(gòu)域的至少一個(gè)氨基酸,所述第二亞結(jié)構(gòu)域?qū)?yīng)位于中44至77位的亞結(jié)構(gòu)域,(b2)通過(guò)用不同的核苷酸替換所述半位點(diǎn)第二部分的至少一個(gè)核苷酸,從而選擇和/或篩選步驟(bj的第二變體,其能夠切割來(lái)源于所述親本LAGLIDADG歸巢核酸內(nèi)切酶半位點(diǎn)的第二DNA乾序列,(c)構(gòu)建第三變體,其在所述親本LAGLIDADG歸巢核酸內(nèi)切酶的所述第一和第二功能性亞結(jié)構(gòu)域中具有突變,所述構(gòu)建通過(guò)以下步驟實(shí)現(xiàn)(cj將步驟(aj和步驟(bj的兩個(gè)變體的突變組合在一個(gè)變體中,以及(c2)選擇和/或篩選能切割嵌合DNA耙序列的步驟(Cl)的變體,所述嵌合DNA耙序列包含所述第一變體DNA靶標(biāo)半位點(diǎn)的第一部分和所述第二變體DNA靼標(biāo)半位點(diǎn)的第二部分。定義-在本文中,多肽序列中的氨基酸殘基根據(jù)單字母代碼指定,其中,例如,Q表示Gln或谷氨酰胺殘基,R表示Arg或精氨酸殘基,D表示Asp或天冬氨酸殘基。-核苷酸以如下方式表示單字母代碼用于指代核苷的堿基a是腺嘌呤,t是胸腺嘧啶,c是胞嘧啶,g是鳥(niǎo)嘌呤。對(duì)于簡(jiǎn)并核苷酸而言,r4戈表g或a(嘌呤核香酸),k表g或t,s表g或c,w表a或t,m^f戈表a或c,y4義表t或c(嘧咬核苷酸),d4戈表g、a或t,v>R表g、a或c,b代表g、t或c,h代表a、t或c,以及n代表g、a、t或c。-"親本LAGLIDADG歸巢核酸內(nèi)切酶"意指野生型LAGLIDADG歸巢核酸內(nèi)切酶或其功能性變體。該親本LAGLIDADG歸巢核酸內(nèi)切酶可以是單體、在一個(gè)功能性核酸內(nèi)切酶中包含相結(jié)合的兩個(gè)LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域的二聚體(同源二聚體或異源二聚體),所述功能性核酸內(nèi)切酶能夠切割22~24bp的雙鏈DNA靶標(biāo)。-"LAGLIDADG歸巢核酸內(nèi)切酶變體"或"變體"意指通過(guò)用不同的M酸替換LAGLIDADG歸巢核酸內(nèi)切酶序列的至少一個(gè)Jl&酸而獲得的蛋白質(zhì)。-"功能性變體"意指能夠切割DNA靶標(biāo)的LAGLIDADG歸巢核酸內(nèi)切酶變體,所述DNA靶標(biāo)優(yōu)選為不被野生型LAGLIDADG歸巢核酸內(nèi)切酶所切割的新DNA靶標(biāo)。例如,這些變體在其與DNA耙序列接觸或者與所述DNA耙標(biāo)直接或間接相互作用的位置具有氨基酸變化。-"具有新的特異性的歸巢核酸內(nèi)切酶變體"意指具有不同于親本歸巢核酸內(nèi)切酶的切割靶標(biāo)模式的變體。術(shù)語(yǔ)"新特異性"、"經(jīng)修飾的特異性"、"新切割特異性"、"新底物特異性"是指所述變體針對(duì)DNA耙序列核苷酸的特異性,它們是等同的并且不加區(qū)別地使用。—"I-OgI"意指具有序列SWISSPROTP05725或pdb登錄號(hào)lg9y的野生型I-Oel。-"結(jié)構(gòu)域"或"核心結(jié)構(gòu)域"意指"LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域",其為L(zhǎng)AGLIDADG家族歸巢核酸內(nèi)切酶的特征性a^P2a2P3P4Ct3折疊,對(duì)應(yīng)于約一百個(gè)氨基酸泉基的序列。該結(jié)構(gòu)域包含折疊成反向平行P片層的4個(gè)P鏈(pi、卩2、卩3、P4),所述P片層與DNA靶標(biāo)的一半相互作用。該結(jié)構(gòu)域能夠與跟DNA靶標(biāo)的另一半相互作用的另一LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域相關(guān)聯(lián),以形成能夠切割所述DNA耙標(biāo)的功能性核酸內(nèi)切酶。例如,在所述二聚體核酸內(nèi)切酶(163個(gè)M酸)的情形中,所述LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域?qū)?yīng)于6至94位殘基。在單體歸巢核酸內(nèi)切酶的情形中,在核酸內(nèi)切酶序列中存在兩個(gè)這樣的結(jié)構(gòu)域;例如在I-Dmo1(194個(gè)氨基酸)中,第一結(jié)構(gòu)域(7至99位殘基)和第二結(jié)構(gòu)域(104至194位殘基)被短的連接子(linker)(100至103位殘基)所分隔。-"亞結(jié)構(gòu)域"意指LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域中與歸巢核酸內(nèi)切酶DNA靶標(biāo)半位點(diǎn)的獨(dú)特部分相互作用的區(qū)域。兩個(gè)不同的亞結(jié)構(gòu)域獨(dú)立地起作用,并且在一個(gè)亞結(jié)構(gòu)域中的突變不改變另一亞結(jié)構(gòu)域的結(jié)合和切割特性。因此,兩個(gè)亞結(jié)構(gòu)域各自結(jié)合歸巢核酸內(nèi)切酶DNA靶標(biāo)半位點(diǎn)的不同部分。—"B-發(fā)夾"意指LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域的反向平行P片層的兩個(gè)連續(xù)的P鏈(P^2或者P3P4),其通過(guò)環(huán)或者轉(zhuǎn)角相連。-"DNA乾標(biāo)"、"DNA乾序列"、"乾序列"、"耙位點(diǎn)"、"耙標(biāo)"、"位點(diǎn)"、"識(shí)別位點(diǎn)"、"識(shí)別序列"、"歸巢識(shí)別位點(diǎn)"、"歸巢位點(diǎn)"、"切割位點(diǎn)"意指2224bp的雙鏈回文、部分回文(假回文)或者非回文多核普酸序列,其被LAGLIDADG歸巢核酸內(nèi)切酶識(shí)別并切割。這些術(shù)語(yǔ)均指獨(dú)特的DNA位置,優(yōu)選基因組位置,在該位置所述核酸內(nèi)切酶將"i秀導(dǎo)雙鏈斷裂(切割)。通過(guò)雙鏈多核苷酸的一務(wù)漣的5'至3,序列來(lái)定義所述DNA靶標(biāo)。例如,圖2所示的,皮野生型切割的回文DNA耙序列定義為以下序列-"DNA靼標(biāo)半位點(diǎn)"、"半切割位點(diǎn)"或"半位點(diǎn)"意指DNA靶標(biāo)中結(jié)合每個(gè)LAGLIDADG歸巢核酸內(nèi)切酶核心結(jié)構(gòu)域的部分。-"嵌合DNA耙標(biāo)"、"組合DNA耙標(biāo)"或"雜合DNA耙標(biāo)"指DNA靶標(biāo),其中所述靶標(biāo)的至少一半包含與至少兩個(gè)獨(dú)立的亞結(jié)構(gòu)域結(jié)合的核苷酸組合。-"載體"意指能夠運(yùn)送與其相連的另一核酸的核酸分子。-"同源的"意指序列與另一序列具有足以使序列之間發(fā)生同源重組的同一性,更具體地具有至少95%同一性,優(yōu)選97%同一性以及更優(yōu)選99%。_"同一性"是指兩個(gè)核酸分子或多肽之間的序列同一性。可通過(guò)比較每個(gè)序列中的位置來(lái)確定同一性,所述序列可為了比較的目的而進(jìn)行比對(duì)。當(dāng)被比M列中的位置由相同的g所占據(jù)時(shí),則所述分子在該位置是一致的。核酸或M酸序列之間的相似性或同一性程度是在核酸序列共有位置上一致或匹配的核普酸數(shù)目的函數(shù)。多種比對(duì)算法和/或程序可用于計(jì)算兩個(gè)序列之間的同一性,包括作為GCG序列分析軟件包(UniversityofWisconsin,Madison,Wis.)之一部分的FASTA或BLAST,其可4吏用例如默認(rèn)設(shè)置。-"個(gè)體"包括哺乳動(dòng)物以及其它脊推動(dòng)物(例如,鳥(niǎo)類、魚類和爬行類)。本文使用的術(shù)語(yǔ)"哺乳動(dòng)物"是指任何哺乳喂養(yǎng)其幼仔的胎生(真獸亞綱(eutharian)或有胎盤哺乳類)或者卵生(后獸亞綱(metatharian)或無(wú)胎盤哺乳類)脊推動(dòng)物,包括單孔目動(dòng)物、有袋動(dòng)物類和胎盤動(dòng)物。哺乳動(dòng)物種類的實(shí)例包括人類及其它靈長(zhǎng)類(例如,猴子、黑猩猩)、嚙齒動(dòng)物(例如,大鼠、小鼠、豚鼠)和反芻動(dòng)物(例如,牛、豬、馬)?!?遺傳病"是指部分或完全、直接或間接地由于一個(gè)或幾個(gè)基因中的異常所致的任何疾病。所述異??梢允峭蛔?、插入或缺失。所述突變可以是點(diǎn)突變。所述異??捎绊懺摶虻木幋a序列或其調(diào)節(jié)序列。該異??捎绊懟蚪M序列的結(jié)構(gòu)或者所編碼mRNA的結(jié)構(gòu)或穩(wěn)定性。所述遺傳病可以是隱性的或顯性的。這些遺傳病可以是但不限于嚢性纖維化、亨廷頓舞蹈癥、家族性高膽固醇血癥(LDL受體缺陷)、肝母細(xì)胞瘤、威爾遜病、先天性肝卟啉癥、肝代謝遺傳性疾病、萊-尼綜合征、鐮狀細(xì)胞貧血、地中海貧血、著色性干皮病、范科尼貧血、視網(wǎng)膜色素變性、毛細(xì)血管擴(kuò)張性共濟(jì)失調(diào)、布盧姆綜合征、視網(wǎng)膜母細(xì)胞瘤、杜興氏肌營(yíng)養(yǎng)不良癥以及泰國(guó)薩病。根據(jù)本發(fā)明的方法,每個(gè)替換均位于與DNA靶標(biāo)半位點(diǎn)相互作用的M酸M位置。LAGLIDADG歸巢核酸內(nèi)切酶與DNA相互作用的殘基是本領(lǐng)域公知的。被突變的殘基可以與DNA主鏈或核苷酸g直接地或通過(guò)水分子相互作用。根據(jù)所述方法的一個(gè)有利的實(shí)施方案,用選自A、C、D、E、G、H、K、N、P、Q、R、S、T、L、V、W和Y氨基酸替換步驟a丄)或)中的氛基酸。根據(jù)所述方法的另一有利的實(shí)施方案,步驟aj中被替換的M酸位于中28至40位。根據(jù)所述方法的另一有利的實(shí)施方案,步驟b》中被替換的M酸位于中44至70位。根據(jù)本發(fā)明的方法,DNA耙標(biāo)半位點(diǎn)的每個(gè)部分包含至少兩個(gè)連續(xù)的核苷酸,優(yōu)選三個(gè)連續(xù)的核普酸,并且所述第一和第二部分被至少一個(gè)核苷酸(優(yōu)選至少兩個(gè)核普酸)所分隔。根據(jù)所述方法的另一有利的實(shí)施方案,所述半位點(diǎn)的第一和第二部分分別位于所述半位點(diǎn)的外四分之一和內(nèi)四分之一。根據(jù)本發(fā)明的方法,所述親本DNA把標(biāo)可以是回文、非回文或假回文的。根據(jù)本發(fā)明,所述亞結(jié)構(gòu)域的位置通過(guò)參考的結(jié)構(gòu)(pdb登錄號(hào)lg9y)來(lái)定義。由于已知I-Od中亞結(jié)構(gòu)域的位置,本領(lǐng)域的技術(shù)人員可使用公知的蛋白質(zhì)結(jié)構(gòu)分析軟件(如Pymol)容易地推導(dǎo)出另一種LAGLIDADG歸巢核酸內(nèi)切酶中相應(yīng)的位置。例如,對(duì)于I-Afsol,兩個(gè)功能性亞結(jié)構(gòu)域分別位于30至43位以及47至75位。根據(jù)本發(fā)明的方法,將步驟aj或bj中的氨基酸突變引入野生型LAGLIDADG歸巢核酸內(nèi)切酶或其功能性變體中。所述親本LAGLIDADG歸巢核酸內(nèi)切酶可選自I-M,I-C械I-Oel,I-CwI,PHI,PI-加,PI-MwI,I-C喊I-S我I-敘III,H07PI-CM,PI-CM,PI-顛,PI勘!,PI-Z)M,PI-"mI,PI德vI,PI-嶽I:PI匪単I,PI-學(xué),PI-Mg。I,PI-MwI,P歸"I,PI-MeI,Pl-油wl,PI-雄I,PI-她加I,PI掘I,PI-她I,PI墨胞eI,PI母wI,PI-,I,PI-腸I,pi爭(zhēng)i,pi匈i,pi扁iM,pi母i,pi-腺,pi-t喊pi-:r賦h-m,pi-:t抓i-她oi,和l-j"fl;優(yōu)選I-OrI,Ucel,I畫C7i"I,KD附d,I-Cs柳I,PUcel,PI-PfuI,PI國(guó)77,1,PI陽(yáng)Af似I,I-M^I,I畫Jml和I國(guó)O"I;更優(yōu)選I國(guó)OrI,I-Msol,1-5^1,I"w,l,I畫Z)附oI,PI-5VeI,和PI-尸/wI;更優(yōu)選I-OeI。功能性變體包含不影響該蛋白質(zhì)結(jié)構(gòu)的突變。例如,所述親本歸巢核酸內(nèi)切酶可以是包含選自以下一個(gè)或多個(gè)突變的I-Od變體24位的異亮氨酸突變?yōu)槔i氨酸(I24V),70位的精氨酸突變?yōu)榻z氨酸(R70S),以及75位的天冬氨酸突變?yōu)椴粠щ姾傻陌被?,?yōu)選天冬酰胺(D75N)或纈氨酸(D75V)。步驟aj或lh)可包括引入另外的突變,特別的,在接觸DNA靼序列或者直接或間接地與DNA靶標(biāo)相互作用的其它位置引入??赏ㄟ^(guò)如國(guó)際PCT申請(qǐng)WO2004/067736所述產(chǎn)生變體文庫(kù)來(lái)進(jìn)行該步驟??筛鶕?jù)公知的重疊PCR技術(shù),通過(guò)擴(kuò)增包含兩個(gè)亞結(jié)構(gòu)域之每一個(gè)的重疊片段來(lái)對(duì)步驟cj中的突變進(jìn)行組合??赏ㄟ^(guò)使用體外或體內(nèi)切割測(cè)定來(lái)進(jìn)行步驟a2)、b2)或cj中的選擇和/或篩選,如國(guó)際PCT申請(qǐng)WO2004/067736所述。才艮據(jù)所述方法的另一有利的實(shí)施方案,步驟aj、b2)和/或C2)在某^Ht下體內(nèi)進(jìn)行,在此條件下,所述變體產(chǎn)生的突變DNA耙序列中的雙鏈斷裂,通過(guò)所述DNA雙鏈斷裂的重組介導(dǎo)修復(fù)而導(dǎo)致正選擇標(biāo)記或報(bào)告基因的活化,或者負(fù)選擇標(biāo)記或報(bào)告基因失活。例如,本發(fā)明變體的切割活性可在酵母或哺乳動(dòng)物細(xì)胞中使用報(bào)告載體通過(guò)正向重復(fù)重組測(cè)定進(jìn)行測(cè)量,如PCT申請(qǐng)WO2004/067736所述。所述報(bào)告載體包含報(bào)告基因的兩個(gè)截短的無(wú)功能拷貝(正向重復(fù))以及在間插序列(interveningsequence)內(nèi)的嵌合DNA乾序列,將它們克隆至酵母或哺乳動(dòng)物表達(dá)載體中。所述嵌合DNA耙序列由每個(gè)初始變體半位點(diǎn)的不同部分組合而成。所述變體的表達(dá)產(chǎn)生能夠切割所述嵌合DNA靶序列的功能性核酸內(nèi)切酶。這樣的切割誘導(dǎo)同向重復(fù)之間的同源重組,得到功能性才艮告基因,其表達(dá)可通過(guò)適當(dāng)?shù)臏y(cè)定進(jìn)行監(jiān)測(cè)。才艮據(jù)所述方法的另一有利的實(shí)施方案,它包括表達(dá)步驟cj中獲得的一個(gè)變體的另外步驟dj,從而允許形成同源二聚體。所述同源二聚體能夠切割回文的或假回文的嵌合耙序列,該耙序列包含兩個(gè)不同的部分,每個(gè)部分來(lái)自兩個(gè)初始的變體半位點(diǎn)之一(圖3a)。根據(jù)所述方法的另一有利的實(shí)施方案,它包括另外的步驟d、),其共表達(dá)步驟c2)中獲得的一個(gè)變體和野生型LAGLIDADG歸巢核酸內(nèi)切酶或其功能性變體,從而允許形成異源二聚體。優(yōu)選地,共表達(dá)步驟C2)中獲得的兩個(gè)不同的變體。所述異源二聚體能夠切割非回文的嵌合乾序列,該靼序列包含4個(gè)不同的部分(A、B、C,、D,;圖3a),每個(gè)部分來(lái)自4個(gè)初始變體的半位點(diǎn)(兩個(gè)不同單體中的每一個(gè)對(duì)應(yīng)兩個(gè)初始變體;圖3a)之一0例如,宿主細(xì)胞可被一種或兩種編碼所述變體的重組表達(dá)載體修飾。然后,在允許所述變體表達(dá)的條件下培養(yǎng)所述細(xì)胞,然后從細(xì)胞培養(yǎng)物中回收形成的同源二聚體/異源二聚體。根據(jù)本發(fā)明的方法,可通過(guò)將步驟C2)中獲得的一個(gè)變體與歸巢核酸內(nèi)切酶結(jié)構(gòu)域/單體融合來(lái)構(gòu)建單鏈嵌合核酸內(nèi)切酶。所述結(jié)構(gòu)域/單體可以來(lái)自野生型歸巢核酸內(nèi)切酶或其功能性變體。構(gòu)建來(lái)源于歸巢核酸內(nèi)切酶的單鏈嵌合分子的方法在本領(lǐng)域是公知的(Epinat等,NucleicAcidsRes"2003,31,2952-62;Chevalier等,Mol.Cell"2002,10,895國(guó)卯5;Steuer等,Chembiochem"2004,5,206-13;國(guó)際PCT申請(qǐng)WO03/078619和WO2004/031346)??梢允褂眠@些方法的任一種來(lái)構(gòu)建來(lái)源于本發(fā)明所定義變體的單鏈嵌合核酸內(nèi)切酶。本發(fā)明的主題還包括可通過(guò)上述方法獲得的LAGLIDADG歸巢核酸內(nèi)切酶變體。在所述變體的一個(gè)優(yōu)選實(shí)施方案中,它是具有至少兩個(gè)替換的變體,其中每個(gè)替換分別位于的26至40位以及44至77位的兩個(gè)亞結(jié)構(gòu)域的一個(gè)之中。在一個(gè)更優(yōu)選的實(shí)施方案中,在位于I-Crel的44至77位的亞結(jié)構(gòu)域中的所述替換在44、68、70、75和/或77位。在另一更優(yōu)選的實(shí)施方案中,在位于的26至40位的功能性亞結(jié)構(gòu)域中的所述替換在I-Oel的26、28、30、32、33、38和/或40位。在所述變體的另一更優(yōu)選的實(shí)施方案中,它至少具有一個(gè)在的28至40位中的第一替換和一個(gè)在I-Oel的44至70位中的第二替換。優(yōu)選地,所述變體在44、68和70位具有選自以下的氨基酸殘基A44/A68/A70.A44/A6&/G70,A44/A6濯0,A德68/K70,A44/A68扁,A44羅/Q70,A44/A68/R70,A44/A68/S70:A44麟/T70,A44/D68/H70,A44/D68/K70,A44/D6衡0,A44/G68/H70,A44/G68/K70,A44/G6,0,A44扁/P70,A44/G68/R70,A44/H68/A70,A44服8/G70,A44/H68/H70,A44/H68/k70,A44/H68/N70,A44/H68/Q70,A44/H68/R70,A44/H68/S70,A44/H68/T70,A44/K68/A70,A44麵/G70,A44/K68/H70,A44/K68/K70,A44/K68/N70,A44鏡/Q70,A4復(fù)68/R70,A44/K68/S70,A44/K68/T70,A44/N68/A70,A4頓68婦,A44/N68/G70,A44/N68/H70,A44/N68/K70,A4傷瞎0,A4傷8/Q70,A4麵68/R70,A44細(xì)/S70,A44/N68/T70,A44/Q68/A70,A44/Q68/D70,A44/Q68/G70,A44/Q68/H70'A44/Q68/N70,A44/Q6譜0,A44/Q68/S70,A4德8/A70,A4娜8/D70'A44/R68/E70,A44/畫G70,A44鐘/H70,A44/R68/K70,A4德8/L70,A44/R6,0,A44腦/R70,A44雄/S70,A44/R68/T70,A44/S纖70,A44/S68/G70,A44/S68/K70,A44/S68/N70,A德68/Q70,A44/S隱70,A4傷8/S70,A4德脂0,A44/T68/A70,A44/T68/G70,八44腦/H70,A44/T68/K70,A4機(jī)瞎0,A44/T68/Q70,A44/T68/R70,A44/窗S70,A44/T68/T70,D44/D68/H70,D44應(yīng)/S70,D44雌/線D44雄/K70,D44/R6,70,D44/R68/Q70,D44/R68/R70,D44/R68/S70,D44/R68/T70,E44/H68/H70,E44/R68/A70,E44/R68/H70,E44/R68/N70,E44雌/S70,E4娜8/T70,E44/S證70,G44/H68/K70,G44/Q鐘70,G44鐘/Q70,G44/R68/R70,G44/T68/D70,G術(shù)蕭70,G44/T纖70,H44歸/S70,訓(xùn)A匿70,H44/R68/A70,H44/R6g/D70,脇/R68/E70,H44滅/G70,H44/R68/N70,H4楊諮0,H44腳/S70,H44/R68/T70,H44/S68/G70,H44/S68/S70,H44/S68/T70,H44腦/S70,H44/T68/T70,K44/A68/A70,K44/A68/D70,K44滅/E70,K44/A68/G70,K44/A68/H70,K44/A6隨0,K44/A68/Q70,K44滅/S70,K44/A68/T70,K44/D68/A70,K44纖/T70,K44/E68/G70,K44/E68/N70,K44/E68/S70,K44/G68/A70,K44/G6固0,K44/G6,0,K44/G68/S70,K44/G68/T70,K44/H68/D70,K44/H68/E70,K44/H6歸0,K44服8/N70,K44/H68/S70,K144服8/T70,K44/K68/A70,K44/K68細(xì),K44/K68/H70,K44/K68/T70,K44/N68/A70,K44/N68/D70,K44/N68/E70,K44/N68/G70,K44/N68/H70,BC44馬8/N70,JC4頓68/Q70,K44/N68/S70,K44馬8/T70,K44/P確70,JC44/Q68/A70,K44/Q6蘭0,K44/Q麵70,K44/Q68/S70,K44/Q68/T70,K44/R68/A70,K44/R68/D70,K44/R6菌0,.K44/R68/G70,K44/R68/H70,K44/R68/N70,K44/R68/Q70,K44/R68/S70,K44顧/T70,K44/S68/A70,K44脇/D70,KA4/S麵70,K44/S68/N70,K4婦8/S70,K44/S68/T70,K44脂/A70,IC44/T6,0,K44/T68/E70,K44/"8/G70,K44/T68/H70,K44/T68顧,K44脂/Q70,K44膽/S70,K44/T68/T70,N44/A68/H70,N44/A68/R70,N44/H6婦0,N44鵬8/R70,N44/K68/G70,N44/K68/H70,N44/K68/R70,N44/K68/S70,N4頓68/R70,N44/P飾70,麗/Q68/H70,N44/Q68織,麗/R6膨0,N44/R68/D70,N44/R纖70,N44/R68/G70,N44/R68/H70,M44/R68/K70,N44/R68/N70,N44/R68/R70,N44/R68/S70,N44/R蒙70,N44/S68/G70,N44/S68/H70,N44/S68/K70'N44/S6譜0,N44腿/H70,N44/T68/K70'順/T68/Q70,N44腦/R70,N44/TWS70,P44/N68/D70,P44/T68/T70,Q44麵/A70,Q44/A68織,Q4崔諮0,Q44/G68/K70,Q44/G68/R70,Q44/K68/G70,Q44/N68/A70,Q44/N68/H70,Q44/N68/S70,Q44扁/P70,Q44/Q6歸0,Q4概8/A70,Q4福8/D70,Q44/R68/E70,Q4婦8/G70,Q44/R68/H70,Q44/R6,0,Q44歸/Q70,Q44/R感70,Q44/S68/H70,Q44/S68/R70,Q4楊8/S70,Q44/T68/A70,Q44脂/G70,Q44/T讓70,Q44/T68/R70,R44/A68/G70,R44/A68/T70,R44/G68/T70,R44/H鎖70,R44服8/T70,R44/N68/T70,R4幅8/A70,R44/R6薩0,R44鍵/E70,R44/R68/G70,麵R6謂0,R44/R68/Q70,R44/R68/S70,諸/R68/T70,R4概8/G70,R44/S6謝70,R44服/S70,R4德8/T70,S44/D68織,S44/H6諮0,S44麵/G70,S44/R68/N70'S44/R68卵,S44/R68/S70,T44/A68/K70,T44/A68/R70,T44/H68/R70,T44/K68/R70,丁44扁8/P70,T44/N68/R70,T44/Q68/K70,T44/Q68/R70,T4德8歸,T44/R6薩0,T44/R68/E70,T44/R68/G70,T44/R6瞎0,T44/R68/K70,T44/R6薩0,T44/JR6即0,T44/R離70,T44/R腦70,T44/R68/T70,雨S68/K70,T4楊8/R70,T44腦/K70,和T44/T68/R70。優(yōu)選地,所述變體在28、30、33、38和40位分別具有選自以下的氨基酸QNYKR,RKKRQ,QNRRJl,QNYKK,QNTQK,QNRRK,KNTQR,SNRSR,NNYQR,KNTRQ,KNSRE,QNNQK,SNYRK,KNSRD,KNRER,KNSRS,RNRDR,ANSQR,QNYRK^QNKRT,RNAYQ,KNRQE,NNSRK,NNSRR,QNYQKQOTQR,SNRQKQNRQK,SNYQK,TNRQR,QNTQR,KNRTQ,KNRTR,QNEDH,R1^WA,QNYTR,RNTRA,HNYDS,QNYRA,QNYAR,SNQAA,QNYEK,TNNQR,QNYRS,KNRQR,QNRAR,QNNQR,RNRER,KNRAR,KNTAA,KNRKA,KNAKS,KNRNA,TNESD,KNNQD,RNRYQ,KNYQN,KNRSS,KNRYA,ANNRK,KNRAT,KNRNQ,TNTQR,KNRQY,QNSRK,RNYQS,QMRQR,KNRAQ,KNRQA,KNTAS,KAHRS,KHHRS,KDNHS,KESRS,KHTPS,KGHYS,KARQS,KSRGS,KSHHS,KNHRS,KXORES,KDGHS,KRHGS,KANQS,KDHKS,KXHRS,KQ1S1QS,KQTQS,KGRQS,KRPGS,KRGNS,KNAQS,KNHNS,KHHAS,KRGSS,KSRQS'KTDHS,KHHQS,KADHS,KS鵬,KNRAS,KSHQS,KDAHS,KNHES,KDRTS,KDRSS,KAHQS,KRGTS,KNHSS,KQHQS,KNHGS,KNNQS,KNDQS,KDRGS,KNHAS,KHMAS,KSSHS,KGVAS,KSVQS,KDVHS,RDVQS,KGVQS,KGVTS,KGVHS,KGVRS,KGVGS,RAVGS,RDVRS,RNVQS和NTVDS。在另一更優(yōu)選的實(shí)施方案中,所述變體切割包含下式序列的嵌合DNA把標(biāo)c-un—i。n.9n-8m.7y-6rL5a4n^k-2y-ir+im+2n+3n+4n+5r+6k+7iU8iU9n+i。g+i1(I),其中n是a、t、c或g,m是a或c,y是c或t,k是g或t,r是a或g(SEQIDNO:2),當(dāng)n_10n_9n_8是aaa以及n.5n.4n.3是gtc時(shí),貝'Jn+8n+9ii+10不是ttt并且11+311+411+5不是gac,當(dāng)n+8ii+9n+K)是ttt以及11+311+411+5是gac時(shí),貝l]n_10n.9ii_8不是aaa并且n.5iun_3不是gtc。根據(jù)本發(fā)明,所述嵌合的DNA靶標(biāo)可以是回文的、假回文的或非回文的。優(yōu)選地,-11至-8位和+8至+11位的核苷酸序列和/或-5至-3位和/或+3至+5位的核苷酸序列是回文的。更優(yōu)選地,對(duì)于切割iu是t或n+4是a的嵌合DNA靶標(biāo)而言,所述變體在44位是谷氨酰胺(Q)。更優(yōu)選地,對(duì)于切割iu是a或n+4是t的嵌合DNA靶標(biāo)而言,所述變體在44位是丙氨酸(A)或天冬酰胺;這類變體的實(shí)例是包含A44、R68、S70或A44、R68、S70、N75的I-Od變體。更優(yōu)選地,對(duì)于切割iu是c或者n+4是g的嵌合DNA靶標(biāo)而言,所述變體在44位是賴氨酸(K);這類變體的實(shí)例是包含K44、R68、E70或者K44、R68、E70、N75的變體。更優(yōu)選地,對(duì)于切割n—9是g或者n+9是c的嵌合DNA靶標(biāo)而言,所述變體在38位是精氨酸(R)或賴氨酸(K)。這類變體的實(shí)例是在28、30、33、38和40位分別具有以下氨基酸殘基的I-Oel變體Q28/N30/Y33/K3謝0,R28/N30/K33/R38/Q40,K2,0/T33/R38/Q40,K28/N30/S33/R38/D40,Q28/N30/K33/R38/T40,E2認(rèn)30/R33/R38/K40,Q2,0/Y33/R38/S40,A28/N30/N33/R38織,K28/H30/H33/R38/S40,Q28/N30/R33簡(jiǎn)/R40,K28/N30/S33/R3,0,K2畫0/S33織/S40,N2謝30/S33/R38/K40,R28細(xì)/T33/R38/A40,K28細(xì)/R33/K38/A40,Q2固30/S33/R38/K40,K28/E30/S33/R38/S40,Q28/N30/Y33/K38/K40,S28/N30/Y33/R38/K40,Q28/N30/Y33/R38/K40,N28/N30/S33/R38/R40,Q2,0/Y33/R38/A40,R28屈0/A33/K38/S40,K28/A30/H33簡(jiǎn)/S40,K28/N30/H33/R38/S40,K28/D30/H33/K38/S40,K28/K30/H33/R38/S40,K28/S30/H33/R38/S40和K28/G30/V33/R38/S40。更優(yōu)選地,所述DNA靶標(biāo)在-IO至-8位包M自以下的核苷酸三聯(lián)體aac,aag,aat,acc,acg,act,aga,agc,agg,agt,ata^atg,cag,cga,cgg,ctg,gac,gag,gat,gaa,gcc,gga,ggc,ggg,ggt,gta,gtg,gtt,tac,tag,tat,taa,tcc,tga,tgc,tgg,tgt或ttg,和/或包含是所述-10至-8位核苷酸三聯(lián)體反向互補(bǔ)序列的+8至+10位核苷酸三聯(lián)體。在所述變體的另一優(yōu)選的實(shí)施方案中,它是具有至少兩個(gè)替換的27換分別位于的30至43位和47至75位的兩個(gè)亞結(jié)構(gòu)域的一個(gè)之中。另外,可i秀變親本LAGLIDADG歸巢核酸內(nèi)切酶整個(gè)序列上特別是在所述序列的C端一半的其它殘基。例如,替換I-OeIC端一半(80至163位)的如下位置^i優(yōu)選的I-Oel的80、82、85、86、87、94、96、100、103、114、115、117、125、129、131、132、147、151、153、154、155、157、159和160位。本發(fā)明的變體可包含插入親本LAGLIDADG歸巢核酸內(nèi)切酶序列的NH2端和/或COOH端的一個(gè)或多個(gè)殘基。例如,將甲硫氨酸殘基引入NH2端,將標(biāo)簽(表位或多組氨酸序列)引入NH2末端和/或COOH末端;所述標(biāo)簽用于檢測(cè)和/或純化所述多肽。本發(fā)明的變體可以是在一個(gè)多肽中包含兩個(gè)LAGLIDADG歸巢核酸內(nèi)切酶結(jié)構(gòu)域的單體或單鏈嵌合核酸內(nèi)切酶,或者是在兩個(gè)獨(dú)立的多肽中包含兩個(gè)這樣結(jié)構(gòu)域的同源二聚體或異源二聚體。根據(jù)本發(fā)明,可以對(duì)一個(gè)或兩個(gè)單體/結(jié)構(gòu)域中如上定義的兩個(gè)亞結(jié)構(gòu)域進(jìn)行誘變。一個(gè)單體/結(jié)構(gòu)域可以來(lái)自親本LAGLIDADG歸巢核酸內(nèi)切酶或其功能性變體。根據(jù)本發(fā)明的另一優(yōu)選實(shí)施方案,所述變體是單體、單鏈嵌合分子或者異源二聚體,其中兩個(gè)LAGLIDADG歸巢核酸內(nèi)切酶結(jié)構(gòu)域都在至少兩個(gè)獨(dú)立的亞結(jié)構(gòu)域中包含突變,如上所定義的,一個(gè)結(jié)構(gòu)域中的突變不同于另一結(jié)構(gòu)域中的突變。酸片段;所述多核苷酸可編碼單體的一個(gè)結(jié)構(gòu)域、同源二聚體或異源二聚體的一個(gè)單體或者單體或單鏈分子的兩個(gè)結(jié)構(gòu)域,如上所定義的。本發(fā)明的主題還包括包含至少一個(gè)編碼如上所定義變體的多核苷酸片段的重組載體。所述載體可包含編碼異源二聚變體的單體,或者單體變體的兩個(gè)結(jié)構(gòu)域,或者單鏈分子的多核普酸片段?;蛘?,所述載體可包含兩個(gè)不同的多核苷酸片段,每個(gè)片段編碼異源二聚變體的一個(gè)單體。一種優(yōu)選的載體類型是附加體,即能夠在染色體外進(jìn)行復(fù)制的核酸。優(yōu)選的載體是能夠自主復(fù)制和/或表達(dá)與其相連的核酸的載體。在本文中,將能夠指導(dǎo)與其可操作連接的基因表達(dá)的載體稱為"表達(dá)載體"。根據(jù)本發(fā)明的載體包括但不局限于YAC(酵母人工染色體)、BAC(細(xì)菌人工染色體)、桿狀病毒載體、噬菌體、噬菌粒、粘粒、病毒載體、質(zhì)粒、RNA載體或者線性或環(huán)狀的DNA或RNA分子,其可由染色體的、非染色體的、半合成的或者合成的DNA組成。通常,用于重組DNA技術(shù)的表達(dá)載體常常是"質(zhì)粒"形式,其通常指其載體形式不與染色體結(jié)合的環(huán)狀雙鏈DNA環(huán)。大量的合適載體對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō)是已知的。病毒載體包括逆轉(zhuǎn)錄病毒、腺病毒、細(xì)小病毒(例如船目關(guān)病毒)、冠狀病毒、負(fù)鏈RNA病毒如正祐病毒(例如流感病毒)、彈狀病毒(例如狂犬病毒和皰瘆性口腔炎病毒)、副黎病毒(例如麻滲病毒和仙臺(tái)病毒)、正鏈RNA病毒如小RNA病毒和甲病毒,以及雙鏈DNA病毒包括腺病毒、皰瘆病毒(例如1型和2型單純皰滲病毒、EB病毒、巨細(xì)胞病毒),以及痘病毒(例如痘苗病毒、禽痘病毒和金絲雀痘病毒)。其它病毒包括例如諾沃克病毒、披膜病毒、黃病毒、呼腸孤病毒、乳多空病毒、嗜肝DNA病毒和肝炎病毒。載體可包含選擇標(biāo)記,例如用于真核細(xì)胞培養(yǎng)的新霉素磷酸轉(zhuǎn)移酶、組氨醇脫氫酶、二氫葉酸還原酶、潮霉素磷酸轉(zhuǎn)移酶、單純皰滲病毒胸普激酶、腺苷脫氨酶、谷氨酰胺合成酶以及次黃噪呤-鳥(niǎo)嘌呤轉(zhuǎn)磷酸核糖基酶;用于釀酒酵母(XcweWs/fle)的TRP1;用于;U^桿菌(五.co//)的四環(huán)素、利福平或氨千青霉素抗性。優(yōu)選地,所述載體是表達(dá)載體,其中編碼本發(fā)明所述變體的序列置于適當(dāng)?shù)霓D(zhuǎn)錄和翻譯控制元件的控制下,從而允許產(chǎn)生或合成所述變體。因此,所述多核苷酸包含在表達(dá)盒內(nèi)。更具體地,所述載體包含復(fù)制起點(diǎn)、與所述編碼的多核苷酸可操作地連接的啟動(dòng)子、核糖體結(jié)合位點(diǎn)、RNA剪接位點(diǎn)(當(dāng)使用基因組DNA時(shí))、多腺苷化位點(diǎn)以及轉(zhuǎn)錄終止位點(diǎn)。它還可包含增強(qiáng)子。啟動(dòng)子的選擇將取決于表達(dá)該多肽的細(xì)胞。優(yōu)選地,當(dāng)所述變體為異源二聚體時(shí),編碼每個(gè)單體的兩個(gè)多核苷酸包含在一個(gè)載體中,該載體能夠驅(qū)動(dòng)兩個(gè)多核普酸同時(shí)表達(dá)。根據(jù)所述載體的另一有利的實(shí)施方案,它包含耙向構(gòu)建體,所述乾向構(gòu)建體包含與上述嵌合DNA乾序列附近的區(qū)域具有同源性的序列。更優(yōu)選地,所述靼向DNA構(gòu)建體包含a)與上述嵌合DNA耙序列附近的區(qū)域具有同源性的序列,以及b)其側(cè)翼為a)中序列的待引4列。本發(fā)明還涉及被上述多核苷酸或載體(優(yōu)選為表達(dá)載體)所修飾的原核或真核宿主細(xì)胞。本發(fā)明還涉及非人轉(zhuǎn)基因動(dòng)物或轉(zhuǎn)基因植物,其特征在于其所有或者部分細(xì)胞被上述多核苷酸或載體所修飾。如本文所使用的,細(xì)胞是指原核細(xì)胞(如細(xì)菌細(xì)胞)或真核細(xì)胞(如動(dòng)物、植物或酵母細(xì)胞)。編碼本發(fā)明中所定義變體的多核苷酸序列可以利用本領(lǐng)域技術(shù)人員已知的任何方法進(jìn)行制備。例如,使用特異性引物利用聚合酶鏈?zhǔn)椒磻?yīng)從cDNA模板擴(kuò)增所述多核普酸序列。優(yōu)選地,選擇有利于所述蛋白質(zhì)在預(yù)期表達(dá)系統(tǒng)中表達(dá)的所述cDNA的密碼子??衫霉闹亟MDNA和遺傳工程技術(shù)獲得包含所述多核苷酸的重組載體以及將其引入宿主細(xì)胞。通it^達(dá)上述多肽得到本發(fā)明的變體;優(yōu)選地,在適合所述多肽表達(dá)或共表達(dá)的條件下,在被一種或兩種表達(dá)載體修飾的宿主細(xì)胞中表達(dá)或者共表達(dá)所述多肽,并從宿主細(xì)胞培養(yǎng)物中回收所述變體。本發(fā)明的主題還包括以下各項(xiàng)以非治療性目的用于分子生物學(xué)、體內(nèi)或體外遺傳工程以及體內(nèi)或體外基因組工程的用途如前定義的變體、一種或兩種多核苷酸(優(yōu)選包含在表達(dá)載體中)、細(xì)胞、轉(zhuǎn)基因植物、非人類轉(zhuǎn)基因哺乳動(dòng)物。非治療性目的包括例如(i)在包裝細(xì)胞系中特定基因座的基因靶向,用于生產(chǎn)蛋白質(zhì),(ii)在農(nóng)作物中特定基因座的基因靶向,用于品種改良和代謝工程,(iii)靶向重組,用于除去經(jīng)遺傳修飾的農(nóng)作物中的標(biāo)記物,(iv)耙向重組,用于除去經(jīng)遺傳修飾的微生物菌林(例如用于生產(chǎn)抗生素的菌林)中的標(biāo)記物。根據(jù)所述用途的一個(gè)有利的實(shí)施方案,它用于在包含嵌合DNA乾序列的目的位點(diǎn)誘導(dǎo)雙鏈斷裂,從而誘導(dǎo)DNA重組事件、DNA丟失或細(xì)胞死亡。根據(jù)本發(fā)明,所述雙鏈斷裂用于修復(fù)特定的序列、修飾特定的序列、恢復(fù)突變基因位置處的功能基因、削弱或激活目的內(nèi)源基因、將突變引入目的位點(diǎn)、引入外源基因或其部分、失活或檢測(cè)內(nèi)源基因或其部分、使染色體臂易位或者使DNA不被修復(fù)并被降解。根據(jù)所述用途另一有利的實(shí)施方案,所述變體、多核苷酸、載體、細(xì)胞、轉(zhuǎn)基因植物或者非人轉(zhuǎn)基因哺乳動(dòng)物與如前定義的靶標(biāo)DNA構(gòu)建體相關(guān)聯(lián)。本發(fā)明的主題還包括遺傳工程方法,其特征在于它包括以下步驟通過(guò)將包含如上文所述嵌合DNA靶標(biāo)的載體與如前定義的變體接觸而在所述載體上目的位點(diǎn)斷裂雙鏈核酸,從而誘導(dǎo)與另一載體的同源重組,所述另一載體與所述變體的切割位點(diǎn)附近序列具有同源性。本發(fā)明的主題還包括基因組工程方法,其特征在于它包括以下步驟1)通過(guò)將靶標(biāo)與所述變體接觸使基因座發(fā)生雙鏈斷裂,該基因座包含如前定義的變體的至少一個(gè)嵌合DNA靶標(biāo);2)在適于與靶向DNA構(gòu)建體發(fā)生同源重組的^Hf下維持所述斷裂的基因座,所述乾向DNA構(gòu)建體包含待引入所述基因座的序列,所述序列的側(cè)翼是與靶標(biāo)具有同源性的序列。本發(fā)明的主題還包括基因組工程方法,其特征在于它包括以下步驟l)通過(guò)將所述切割位點(diǎn)與所述變體接觸,從而佳羞因座發(fā)生雙鏈斷裂,該基因座包含如前定義的變體的至少一個(gè)嵌合DNA靶標(biāo);2)在適于與染色體DNA構(gòu)建體發(fā)生同源重組的條件下維持所述斷裂的基因座,所述染色體DNA構(gòu)建體與該切割位點(diǎn)附近區(qū)域具有同源性。本發(fā)明的主題還包括組合物,其特征在于包含至少如前定義的一種變體、一種或兩種多核普酸(優(yōu)選包含在表達(dá)載體中)。在所述組合物的優(yōu)選實(shí)施方案中,它包含靼向DNA構(gòu)建體,其包含修復(fù)目的位點(diǎn)的序列,所述序列的側(cè)翼是與靶標(biāo)基因座具有同源性的序列。本發(fā)明的主題還包括至少如前定義的一種變體、一種或兩種多核苷酸(優(yōu)選包含在表達(dá)載體中)用于制備在有此需要的個(gè)體中預(yù)防、改善或治療遺傳病的藥劑上的用途,所述藥劑以任意方式施用給所述個(gè)體。本發(fā)明的主題還包括用于在有此需要的個(gè)體中預(yù)防、改善或治療遺傳病的方法,所述方法至少包括以任意方式向所述個(gè)體施用上ma合物的步驟。本發(fā)明的主題還包括至少如前定義的一種變體、一種或兩種多核苷酸(優(yōu)選包含在表達(dá)載體中)用于制備藥劑的用途,所述藥劑用于在有此需要的個(gè)體中預(yù)防、改善或治療由帶有DNA中介物(intermediate)的傳染原引起的疾病,所述藥劑以任意方式施用給所述個(gè)體。本發(fā)明的主題還包括用于在有此需要的個(gè)體中預(yù)防、改善或治療由帶有DNA中介物的傳染原引起的疾病的方法,所述方法至少包括以任意方式向所述個(gè)體施用上述組合物的步驟。本發(fā)明的主題還包括至少如前定義的一種變體、一種或兩種多核普酸(優(yōu)選包含在表達(dá)載體中)于體外在生物來(lái)源的產(chǎn)品或者在用于生物學(xué)用途的產(chǎn)品中,用于抑制帶有DNA中介物的傳染原增殖、使其失活或消除的用途,或者用于對(duì)物體消毒的用途。本發(fā)明的主題還包括用于消除產(chǎn)品或物質(zhì)中帶有DNA中介物的傳染原污染的方法,所述方法至少包括將生物來(lái)源的產(chǎn)品、意在用于生物學(xué)用途的產(chǎn)品或物體與上述組合物接觸一段時(shí)間的步驟,所述時(shí)間足以抑制所述傳染原增殖、失活或消除傳染原。在一個(gè)具體的實(shí)施方案中,所述傳染原是病毒。例如所述病毒是腺病毒(Adll、Ad21)、皰滲病毒(HSV、VZV、EBV、CMV、皰滲病毒6、7或8)、嗜肝DNA病毒(HBV)、乳多空病毒(HPV)、痘病毒或者逆轉(zhuǎn)錄病毒(HTLV、HIV)。本發(fā)明的主題還包括至少一種如前定義的歸巢核酸內(nèi)切酶變體作為用于制備其它大范圍核酸酶的平臺(tái)的用途。例如,為了產(chǎn)生新的第三代歸巢核酸內(nèi)切酶,可以對(duì)所述變體進(jìn)行第三輪誘變以及選擇/篩選。才艮據(jù)所述用途的另一有利的實(shí)施方案,所述歸巢核酸內(nèi)切酶變體與如前定義的靶向DNA構(gòu)建體相關(guān)聯(lián)。根據(jù)本發(fā)明,所述歸巢核酸內(nèi)切酶變體的用途以及使用所述歸巢核碼所述變體或單鏈嵌合核酸內(nèi)切酶的多核普酸、裁體、細(xì)胞、轉(zhuǎn)基因植物或非人轉(zhuǎn)基因哺乳動(dòng)物,如前定義。除了前述特征,本發(fā)明還包括從以下說(shuō)明以及附圖中得出的其它特征,所述以下說(shuō)明指說(shuō)明了本發(fā)明的大范圍核酸酶變體及其用途的實(shí)施例以及附圖,其中-圖1舉例說(shuō)明本發(fā)明的原理。A:與其靶標(biāo)結(jié)合的的結(jié)構(gòu)。實(shí)驗(yàn)數(shù)據(jù)顯示,可以在DNA結(jié)合結(jié)構(gòu)域中鑒定出兩個(gè)獨(dú)立的亞結(jié)構(gòu)域(方框);核心結(jié)構(gòu)域的每個(gè)亞結(jié)構(gòu)域結(jié)合DNA靶標(biāo)不同的一半。B.欲鑒定更小的獨(dú)立亞結(jié)構(gòu)域(方框),每個(gè)亞結(jié)構(gòu)域結(jié)合DNA乾標(biāo)的一半的特定部分。然而,尚無(wú)有利于該個(gè)JL的結(jié)構(gòu)數(shù)據(jù)或?qū)嶒?yàn)數(shù)據(jù)。-圖2顯示與其DNA靶標(biāo)的堿基特異性相互作用圖鐠,其根據(jù)Chevalier和Stoddard,NucleicAcidsRes.,2001,29,3757-74;Chevalier等J.Mol.Biol.,2003,329,253-69。本發(fā)明人已鑒定出新的衍生自I-Od的核酸內(nèi)切酶,其能夠結(jié)合在-10至-8位和8至10位或者-5至-3位和3至5位區(qū)域被修飾的DNA靶標(biāo)。這些DNA區(qū)域示于灰色框中。-圖3舉例說(shuō)明產(chǎn)生重新設(shè)計(jì)的歸巢核酸內(nèi)切酶的策略。a.常規(guī)方案。產(chǎn)生大的具有局部特異性改變的I-OeI衍生物集合。然后,使用組合法將這些突變體組裝為同源二聚蛋白質(zhì),然后形成異源二聚體,得到具有完全重新設(shè)計(jì)的特異性的大范圍核酸酶。b.產(chǎn)生切割COMBl把標(biāo)(SEQIDNO:53)的組合突變體工作流程。兩個(gè)回文耙標(biāo)(COMB2(SEQIDNO:39)和COMB3(SEQIDNO:46))來(lái)源于COMB1耙標(biāo),設(shè)計(jì)同源二聚組合突變體以切割這兩個(gè)靶標(biāo)。然后,將陽(yáng)性產(chǎn)物共表達(dá)以切割COMB1耙標(biāo)。c.RAG1系列的乾標(biāo)。兩個(gè)回文乾標(biāo)(RAG1.2(SEQIDNO:55)和RAG1.3(SEQIDNO:56))來(lái)源于RAG1.1(SEQIDNO:54)。然后,可應(yīng)用類似于針對(duì)COMB系列靶標(biāo)時(shí)所描述的工作流程。-圖4舉例說(shuō)明篩選變體。(a)酵母篩選測(cè)定的原理。將用Z五f72基因標(biāo)記的表達(dá)待測(cè)定大范圍核酸酶的菌林(MEGA)與用TTil基因標(biāo)記的包含報(bào)告質(zhì)粒的菌林#^,所述才艮告質(zhì)粒含有所選的乾標(biāo)。所述乾標(biāo)的側(cè)翼為重疊的截短的LacZ基因(LAC和ACZ)。在二倍體(Z^t/2、7^7>7)中,大范圍核酸酶對(duì)所述靼標(biāo)位點(diǎn)的切割誘導(dǎo)兩個(gè)LacZ重復(fù)之間的同源重組,得到功能性p-半乳糖苷酶基因,其可以通過(guò)X-gal染色進(jìn)行監(jiān)測(cè)。(b)實(shí)驗(yàn)圖解。使用PCR構(gòu)建I-OrI變體的文庫(kù),將其克隆至復(fù)制型酵母表達(dá)載體中并轉(zhuǎn)化至釀酒酵母菌林FYC2-6A(Af』r,^;7Z\63,/w2Z\7,A/WZ^卯)中。在基于LacZ的酵母報(bào)告載體中克隆了64個(gè)回文耙標(biāo),將得到的克隆轉(zhuǎn)化至FYBL2-7B菌林(M4ra,wni3ZU5J,/e"2Z7,)中。使用機(jī)器人輔助在濾膜上劃網(wǎng)格進(jìn)行表達(dá)大范圍核酸酶變體的單克隆與包含報(bào)告質(zhì)粒的單克隆之間的掩^。在初次高通量篩選后,利用PCR擴(kuò)增陽(yáng)性克隆的ORF并測(cè)序。在2100個(gè)陽(yáng)性克隆中鑒定出衍生自I-OelN75平臺(tái)蛋白的410種在44、68和70位不同的變體,并在低密度下進(jìn)行檢測(cè)以建立完整的模式,確認(rèn)了350個(gè)克隆。同樣,將294種突變體重克隆至酵母載體中,并在第二次篩選中進(jìn)行檢測(cè),結(jié)果確認(rèn)了那些獲得的未重克隆的變體。然后,在類似的基于CHO的測(cè)定中檢測(cè)所選克隆的切割活性,并最終在體外測(cè)定。-圖5舉例說(shuō)明一系列變體的切割模式。用三個(gè)字母表示突變體,其對(duì)應(yīng)于44、68和70位的^J^。針對(duì)來(lái)自被I-OeI所切割的C1221回文靶標(biāo)的64個(gè)靶標(biāo)(替換了土3至5位的核苷酸)以及一系列對(duì)照靶標(biāo),檢測(cè)每種突變體。靶標(biāo)圖在右上圖中標(biāo)明。在酵母(左)和哺乳動(dòng)物細(xì)胞(右)中I-Od蛋白和8種衍生物的切割模式。對(duì)于酵母而言,顯示最初的原始數(shù)據(jù)(濾膜)。對(duì)于CHO細(xì)胞而言,顯示定量的原始數(shù)據(jù)(ONPG測(cè)量),高于0.25的值加方框,高于0.5的值用中灰色高亮顯示,高于l的值用深灰色。LacZ:陽(yáng)性對(duì)照。0:無(wú)乾標(biāo)。Ul、U2和U3:三個(gè)不同的未切割對(duì)照。-圖6表示統(tǒng)計(jì)學(xué)分析。(a)被切割的靶標(biāo)被變體切割的靶標(biāo)用灰色表示。切割每個(gè)靶標(biāo)的蛋白質(zhì)數(shù)顯示于下方,灰色著色程度與這些切割蛋白在酵母中獲得的平均信號(hào)強(qiáng)度成正比。(b)對(duì)7個(gè)聚類中的3個(gè)進(jìn)行分析。對(duì)于每個(gè)突變體聚類(聚類1、3和7),計(jì)算每個(gè)靶標(biāo)的累計(jì)強(qiáng)度,柱狀圖(左側(cè)柱圖)以降序顯示經(jīng)歸一化的強(qiáng)度。對(duì)于每個(gè)聚類而言,在每個(gè)位置(44、68和70位)上每種類型M酸數(shù)目在右欄中顯示為帶編碼柱狀圖。Jl^酸顏色代碼的圖例位于圖底部。(c)酵母中突變體和耙標(biāo)數(shù)據(jù)的層級(jí)聚類。使用Euclidean距離和Ward's法(Ward,J.H.,Americanstatist.Assoc.,1963,58,236-244)用層級(jí)聚類分析將突變體和靶標(biāo)進(jìn)行聚類。使用R軟件包的hclust進(jìn)行聚類分析。將突變體和靶標(biāo)的樹(shù)狀圖重新排序以優(yōu)化聚類的位置,并根據(jù)推導(dǎo)出的聚類將突變體樹(shù)狀圖在高度為8處切斷。QRR突變體和GTC靶標(biāo)用箭頭標(biāo)注。A^L良映了信號(hào)的強(qiáng)度。-圖7舉例說(shuō)明雜合或嵌合位點(diǎn)的實(shí)例gtt(SEQIDNO:3)和cct(SEQIDNO:4)是兩個(gè)來(lái)源于I-Oel位點(diǎn)的回文位點(diǎn)。gtt/cct雜合位點(diǎn)(SEQIDNO:5)顯示頂部鏈上-5、-4、-3位的gtt序列以及底部鏈上5、4、3位的cct序列。-圖8舉例說(shuō)明異源二聚變體的切割活性。用KTG和QAN變體共同轉(zhuǎn)化酵母。耙標(biāo)組成顯示于頂部圖中具有單個(gè)gtt、cct或gcc半位點(diǎn)的靶標(biāo)用粗體顯示;具有兩個(gè)這樣的半位點(diǎn)的靶標(biāo)用粗體并用灰色高亮顯示,該靶標(biāo)預(yù)期會(huì)被同源和/或異源二聚體切割;0:無(wú)靶標(biāo)。結(jié)果顯示于下方的三個(gè)圖中。僅對(duì)于分別被KTG和QAN所切割的gtc/cct和gtt/gtc觀察到出乎意料的微弱信號(hào)。-圖9表示對(duì)異源二聚變體的切割活性的定量分析。(a)將所選突變體共同轉(zhuǎn)化進(jìn)酵母。為清楚起見(jiàn),只顯示了相關(guān)的雜合靶標(biāo)的結(jié)果。aac/acc靼標(biāo)總作為無(wú)關(guān)靶標(biāo)的實(shí)例顯示。對(duì)于KTGxAGR雜交,回文的tac和tct耙標(biāo)(盡管未顯示)分別被AGR和KTG所切割。RRN突變體切割cat靶標(biāo)的效率非常低,并且不能在酵母中進(jìn)行定量。(b)在CHO細(xì)胞中瞬時(shí)共轉(zhuǎn)染。對(duì)于(a)和(b)而言,黑色柱僅第一個(gè)突變體的信號(hào);灰色柱僅第二個(gè)突變體的信號(hào);條玟柱通過(guò)共表達(dá)或共轉(zhuǎn)染得到的信號(hào)。-圖10表示I-CVelN75平臺(tái)蛋白的序列以及用于構(gòu)建Ulib4和Ulib5文庫(kù)的簡(jiǎn)并引物的序列。A.所述平臺(tái)(SEQIDNO:6)是包括D75N密碼子替換和3,端的3個(gè)另外的密碼子(AAD)的I-OdORF。B.引物(SEQIDNO:7、8、9)。-圖11舉例說(shuō)明切割每個(gè)靶標(biāo)的突變體的模式和數(shù)目的實(shí)例。A.才莫式實(shí)例。在酵母中針對(duì)一系列64個(gè)回文靶標(biāo)(如圖11B中所排列的)檢測(cè)每種新核酸內(nèi)切酶的切割模式,所述回文靼標(biāo)在士8、±9和±10位不同于圖2中所示的序列。每個(gè)耙序列根據(jù)-10、-9、-8位核苷酸三聯(lián)體(10NNN)命名。例如,GGG對(duì)應(yīng)于tcgggacgtcg^gacgtcccga乾標(biāo)(SEQIDNO:17;圖14B)。針對(duì)所述64個(gè)靼標(biāo)檢測(cè)大范圍核酸酶4次。被I-Oel(D75)、I-CVdN75或IO種衍生變體所切割的耙標(biāo)顯示為黑色或灰色的點(diǎn)。B.切割每個(gè)耙標(biāo)的突變體的數(shù)目,以及切割的平均強(qiáng)度。每個(gè)序列以-10、-9、-8位核苷酸三聯(lián)體(10NNN)命名。切割每個(gè)耙標(biāo)的蛋白質(zhì)的數(shù)目顯示如下,灰色著色程度與酵母中的這些切割蛋白獲得的平均信號(hào)強(qiáng)度成正比。國(guó)圖12表示I-Od在28、30、33、38和/或40位的變體的切割模式。對(duì)于篩選后獲得的141種變體之每一種(其用28、30、33、38、40、70和75位的戎基定義),在酵母中用所述64個(gè)靶標(biāo)(來(lái)源于被切割的C1221回文靶標(biāo),其替換了位置士8至10的核普酸)來(lái)監(jiān)測(cè)切割。耙標(biāo)用3個(gè)字母表示,對(duì)應(yīng)于-10、-9和-8位的核苷酸。例如GGG對(duì)應(yīng)于tcgggacgtcgtaegacgtcccga耙標(biāo)(SEQIDNO:17)。數(shù)值(方框中)對(duì)應(yīng)于切割強(qiáng)度,其在對(duì)濾膜掃描后使用合適的軟件進(jìn)行評(píng)估,而(0)表明無(wú)切割。-圖13表示在結(jié)合其靶標(biāo)的同源二聚體上,突變?cè)诘鞍踪|(zhì)和DNA乾標(biāo)中的定位。兩組突變(44、68和70位殘基;30、33和38位殘基)在左側(cè)單體上顯示為黑色。所述兩組突變?cè)诳臻g上是明顯區(qū)分開(kāi)的。然而,尚無(wú)結(jié)構(gòu)證據(jù)表明其為獨(dú)立的亞結(jié)構(gòu)域。DNA耙標(biāo)位點(diǎn)中的相關(guān)區(qū)域(-5至-3位區(qū)域;-10至-8位區(qū)域)在一個(gè)半位點(diǎn)上顯示為灰色。-圖14:衍生物的靶標(biāo)定義(A和B)和切割模式(C和D)。所有的耙標(biāo)均來(lái)源于被野生型所切割的回文乾標(biāo)C1221,顯示于A和B的頂部。A.通it^t士5至士3位置(在灰色框中)的誘變衍生出第一系列64個(gè)靶標(biāo)。若千實(shí)例顯示如下。顯示了與I-Od44、68、70位殘基的相互作用。B.通it^"士10至±8位置(在灰色框中)的誘變衍生出第二系列64個(gè)耙標(biāo)。若干實(shí)例顯示如下。位置±8、±9和±10不與44、68和70位殘基接觸。C.圖14D中耙標(biāo)的組成。對(duì)于左圖,表格中的3個(gè)字母表明±3、±4和±5位的堿基(例如,GGG指tcaaaac能ggtaccccgttttga(SEQIDNO:10))。對(duì)于右圖,3個(gè)字母表明土8、±9和±10位的>^(例如,GGG指tcgggacgtcgtacgacgtcccga(SEQIDNO:17))。D.模式。用兩組64個(gè)靼標(biāo)(左側(cè)±5至±3位,右側(cè)土IO到至±8位)測(cè)定10種切割C1221乾標(biāo)的變體(包括I-CrelN75(QRR))的模式。靼標(biāo)如圖14C中的排列。在兩組中均存在C1221靶標(biāo)(正方形中)。用3個(gè)字母表示突變體,其對(duì)應(yīng)于44、68和70位的殘基(實(shí)例QRR為Q44、R68、R70),并且它們?nèi)慷季哂辛硗獾腄75N突變。-圖15表示,在結(jié)合其靶標(biāo)的同源二聚體上,突變?cè)诘鞍踪|(zhì)和DNA耙標(biāo)中的定位。兩組突變(44、68和70位殘基;28、30、33、38和40位戎基)在左側(cè)單體上顯示為黑色。兩組突變?cè)诳臻g上是明顯區(qū)分開(kāi)的。然而,尚無(wú)結(jié)構(gòu)證據(jù)表明其為獨(dú)立的亞結(jié)構(gòu)域。DNA靶標(biāo)位點(diǎn)中的相關(guān)區(qū)域(-5至-3位區(qū)域;-10至-8位區(qū)域)在一個(gè)半位點(diǎn)上顯示為灰色。-圖16舉例說(shuō)明組合44、68、70位和28、30、33、38、40位的突變,以切割嵌合靶標(biāo)COMB2(tctggacgacgtacgtcgtcctga:SEQIDNO:39)。上圖以下各圖的突變體特征圖。如文中所述,突變體組合用8個(gè)字母代碼命名,其根據(jù)28、30、33、38、40、44、68和70位的殘基,親本對(duì)照用5個(gè)字母和3個(gè)字母代碼命名,其根據(jù)28、30、33、38和40位或者44、68和70位的殘基。在酵母中針對(duì)COMB2以及10TGC和5GAC(兩個(gè)親本乾標(biāo))篩選突變體。-圖17舉例"說(shuō)明組合44、68、70位和28、30、33、38、40位的突變,以切割嵌合的tcaacaccctgtacagggtgttga耙標(biāo)(SEQIDNO:49)。a.針對(duì)嵌合靼標(biāo),測(cè)定在44、68和70位中或者在28、30、33、38和40位中具有突變的蛋白質(zhì)。在44、68和70位具有突變的蛋白質(zhì)用3個(gè)字母代碼命名,表明44、68和70位的氨基酸殘基(實(shí)例AAK指A44、A68、K70)。在28、30、33、38和40位具有突變的蛋白質(zhì)用5個(gè)字母代碼命名,表明28、30、33、38和40位的氨基酸殘基(實(shí)例KNRQQ指K28、N30、R33、Q38、Q40)。B.針對(duì)嵌合DNA耙標(biāo)測(cè)定嵌合蛋白質(zhì)。蛋白質(zhì)用28、30、33、38、40位的突變來(lái)定義,其在圖的左側(cè)標(biāo)出,用44、68和70位的突變來(lái)定義,其通過(guò)圖上的3字母代碼表示。并圏出切割嵌合DNA靶標(biāo)的嵌合蛋白質(zhì)。-圖18舉例說(shuō)明組合44、68、70位和28、30、33、38、40位的突變,以切割嵌合的tc幼cac紅敏aca幼gtgttga靶標(biāo)(SEQIDNO:52)。A.針對(duì)嵌合靶標(biāo)測(cè)定在44、68和70位或在28、30、33、38和40位具有突變的蛋白質(zhì)。在44、68和70位具有突變的蛋白質(zhì)用3個(gè)字母代碼命名,表明44、68和70位的氨基酸殘基(實(shí)例AAR指A44、A68、R70)。在28、30、33、38和40位具有突變的蛋白質(zhì)用5字母代碼命名,表明28、30、33、38和40位的氨基酸殘基(實(shí)例KNRQE指K28、N30、R33、Q38、E40)。B.針對(duì)嵌合DNA靶標(biāo)測(cè)定嵌合蛋白質(zhì)。蛋白質(zhì)用28、30、33、38、40位的突變來(lái)定義,在圖的左側(cè)標(biāo)出,并用44、68和70位的突變定義,其通過(guò)圖上的3字母代碼表示?!獔D19舉例說(shuō)明在生物化學(xué)和生物物理學(xué)上表征組合突變體。a.體外切割的原始數(shù)據(jù)的實(shí)例。測(cè)定不同濃度的蛋白質(zhì)。泳道1至15:蛋白質(zhì)濃度(nM)為250、189.4、126.3、84.2、63.2、42.1、21.1、15.8、10.5、7.4、4.2、2.1、1.0、0.5和0。b.組合突變體切割COMB2。c.組合突變體切割COMB3。d.利用CD測(cè)量相同蛋白質(zhì)的熱變性。粗體線對(duì)應(yīng)于I-OeIN75,中點(diǎn)變性溫度為65。C。其它蛋白質(zhì)KNHQS/KEG(中點(diǎn)變性溫度65.3。C)、KNHQS/KAS(64.9。C)、KEG(63.1。C)、KNHQS(62.2°C)、NNSRQ(61.2。C)、KAS(61.2。C)、KAS(61.2'C)、ARR(57.3。C)、ASR(57.1。C)、NNSRK/ARR(55.8。C)、NNSRK/ASR(55.8。C)。關(guān)于蛋白質(zhì)的命名參見(jiàn)圖16。-圖20舉例說(shuō)明重新設(shè)計(jì)的異源二聚體切割非回文靶標(biāo)。a.異源二聚體切割COMB1(右下圖)。親本同源二聚體對(duì)COMB2和COMB3回文靼標(biāo)的切割在上圖和左圖中表示。對(duì)于組合突變體,與圖16和文中的命名法相同。b.異源二聚體切割RAGl.l耙標(biāo)。如文中所述,組合突變體根據(jù)10個(gè)殘基而非8個(gè)殘基命名,對(duì)應(yīng)于28、30、33、38、40、44、68、70、75和77位。實(shí)施例1:篩選新的功能性核酸內(nèi)切酶:改造出針對(duì)士3至±5位核苷酸(5NNN)具有新特異性的I-Orl變體用于生產(chǎn)大范圍核酸酶變體的方法以及在哺乳動(dòng)物或酵母細(xì)胞中基于切割i秀導(dǎo)重組的測(cè)定在國(guó)際PCT申請(qǐng)WO2004/067736和Epinat等,NucleicAcidsRes.,2003,31,2952-2962中已描述。該方法和測(cè)定用于篩選特異性改變的變體。這些測(cè)定均獲得功能性LacZ報(bào)告基因,該報(bào)告基因可以通過(guò)標(biāo)準(zhǔn)方法進(jìn)行監(jiān)測(cè)(圖4a)。A)材料和方法a)構(gòu)建突變體文庫(kù)如前所述(Epinat等,N.A.R.,2003,31,2952-2962),合成I-Oel平臺(tái)蛋白的開(kāi)放讀碼框。I-O^I平臺(tái)蛋白包括野生型I-CVel、I-OelD75N(I國(guó)OeIN75),I誦OeIR70S、D75N(I-OrlS70N75),I國(guó)OrII24V、R70S、D75N(I-OrlV24S70N75)以及I國(guó)OelI24V、R70S(I-OrlV24S70)。組合文庫(kù)通過(guò)替換不同的殘基組合來(lái)源于I-CVd平臺(tái)蛋白,所述殘基可能參與與一個(gè)DNA靶標(biāo)半位點(diǎn)的±3至5位堿基的相互作用(Q44、R68、R70、D75和I77)。通過(guò)使用在每處所選位置具有獨(dú)特簡(jiǎn)并密碼子的筒并引物進(jìn)行PCR來(lái)產(chǎn)生大范圍核酸酶文庫(kù)的多樣性。例如,通過(guò)用aac替換75位密碼子引入D75N突變。然后,使用來(lái)自Sigma的在44、68和70位含有密碼子VVK(18個(gè)密碼子,氨基酸ADEGHKNPQRST)的引物對(duì)I-OrlN75cDNA模板PCR。用特異性的限制性酶消化PCR終產(chǎn)物,并將其克隆回pCLS0542上用同樣的限制性酶消化的的ORF中。在該基于2n的帶有丄五t/2基因標(biāo)記的復(fù)制型載體中,I-Oel變體處于半乳糖誘導(dǎo)型啟動(dòng)子的控制之下(Epinat等,前文引用)。在;U^桿菌中進(jìn)行電穿孔后,獲得7xl(^個(gè)克隆,其表示12倍于DNA水平的理論多樣性(183=5832)。b)構(gòu)建靶標(biāo)克隆C1221的24bp回文序列(:tcaaaacgtcgtacgacgttttga,SEQIDNO:1)是近乎回文的天然I-Od靶標(biāo)(tcaaaacgtogtgag織gtttgg,SEQIDNO:24)的半位點(diǎn)的重復(fù)。C1221在酵母和哺乳動(dòng)物細(xì)胞中體外和離體都如天然靶標(biāo)一樣被高效切割。按照如下從C1221產(chǎn)生64個(gè)回文靼標(biāo)從Sigma定購(gòu)64對(duì)寡核脊酸(ggcatacaagtttcaaaacnnngtacrmng加gacaatcgtctgtca(SEQIDNO:25)及其反向互補(bǔ)序列),退火并以同樣的取向克隆至pGEM-TEasy(PROMEGA)中。然后,切出400bp的/VwII片段,并克隆至前述妹母載體pFL39-ADH-LACURAZ中,該載體也叫pCLS0042,也克隆至哺乳動(dòng)物載體pcDNA3.1-LACURAZ-AURA中,兩種載體均在前有所描述(Epinat等,2003,前文引用),得到64種酵母報(bào)告載體(靶標(biāo)載體)?;蛘撸褂肎ateway方案(INVITROGEN)將通過(guò)PCR擴(kuò)增單鏈寡聚核苷酸產(chǎn)生的雙鏈把標(biāo)DNA克隆至酵母和哺乳動(dòng)物才艮告載體中。C)酵母菌林將大范圍核酸酶表達(dá)變體文庫(kù)轉(zhuǎn)化入/e"2突變體單倍體酵母菌林FYC2-6A:alpha、trplA63、leu2Al、his3A200。對(duì)于轉(zhuǎn)4匕而言,可以使用源自(Gietz和Woods,MethodsEnzymol.,2002,350,87-96)的經(jīng)典的化學(xué)/熱激方案,通常每嗎DNA產(chǎn)生106個(gè)獨(dú)立轉(zhuǎn)化子。將單獨(dú)的轉(zhuǎn)化子(Leu+)克隆分別挑入96孔微量培養(yǎng)板。使用菌落糸沐工具(QpixII,GENETIX)挑出13824個(gè)菌落,并培養(yǎng)在144個(gè)微量滴定板中。使用同樣的方案將所述64個(gè)靶標(biāo)質(zhì)粒轉(zhuǎn)化入單倍體酵母菌林FYBL2-7B:a、ura3A851、trplA63、leu2Al、lys2A202,得到64個(gè)測(cè)試菌林。d)酵母中表達(dá)大范圍核酸酶克隆的接合和篩選將表達(dá)大范圍核酸酶的克隆與64個(gè)靶標(biāo)菌林的每一林進(jìn)行接合,并使用圖4所示的篩選測(cè)定檢測(cè)二倍體的j3-半乳糖普酶活性。將變體克隆以及酵母報(bào)告菌抹保存在甘油(20%)中,并復(fù)制(replicate)到新的微量培養(yǎng)板中。使用菌落網(wǎng)格(QpixII,GENETIX)進(jìn)行^。將突變體在覆蓋有尼龍濾膜的YPD培養(yǎng)板上劃格,其使用高網(wǎng)格密度(大約20個(gè)點(diǎn)/cm2)。在同樣的濾膜上進(jìn)行第二次劃格過(guò)程,以點(diǎn)樣第二層,其是由64或75個(gè)不同的針對(duì)每個(gè)變體的帶有報(bào)告基因的酵母菌株組成的。將膜放在固體瓊脂YPD豐富培養(yǎng)基上,并在30'C孵育過(guò)夜,使之發(fā)生接合。然后,將濾膜轉(zhuǎn)移至缺乏亮氨酸和色氨酸并以半乳糖(2%)作為碳源(并含有G418用于共表達(dá)實(shí)驗(yàn))的合成培養(yǎng)基,在37'C孵育5天,以選擇攜帶表達(dá)和靶標(biāo)載體的二倍體。5天后,將濾膜放在固體瓊脂糖培養(yǎng)基上,該培養(yǎng)基帶有在0.5M磷酸鈉緩沖液(pH7.0)、0.1%SDS、6%二曱基甲酰胺(dimethylformamide,DMF)、7mMP-巰基乙醇、1%瓊脂糖中的0.02%X-Gal,并在37。C孵育,以監(jiān)測(cè)卩-半乳糖苷酶活性。在孵育2天后通過(guò)掃描鑒定陽(yáng)性克隆。使用適當(dāng)?shù)能浖?duì)所述克隆的P-半乳糖苷酶活性進(jìn)行定量。分離出針對(duì)至少一個(gè)靶標(biāo)表現(xiàn)出活性的克隆(初次篩選)。然后將點(diǎn)樣密度降低為4個(gè)點(diǎn)/cm2,針對(duì)64個(gè)報(bào)告菌林一式四份地檢測(cè)每個(gè)陽(yáng)性克隆,從而得到完整的模式(二次篩選)。e)測(cè)序使用以下來(lái)自PROLIGO的引物對(duì),通過(guò)對(duì)酵母菌落進(jìn)行PCR,擴(kuò)增在酵母中初次和/或二次篩選中所鑒定的陽(yáng)性克隆的開(kāi)放讀碼框(ORF):ggggacaagtttgtacaaaaaagcaggcttcgaaggagatagaaccatggccaataccaaatataacaaagagttcc(IDNO.26)和ggggaccactttgtacaagaaagctgggmagtcggccgccgggga碟tttcttcttctcgc(SEQIDNO:27)。簡(jiǎn)言之,杏沐酵母菌落并重懸于IOOpiLGlu液體培養(yǎng)基中,并培養(yǎng)過(guò)夜。離心之后,將酵母沉淀重懸于IOpl無(wú)菌水中并用于PCR反應(yīng)(終體積50pl,含有l(wèi),5iul各種特異性的引物(lOOpmol/fil))。PCR^H^為1個(gè)循環(huán)的94。C變性10分鐘,35個(gè)循環(huán)的94。C變性30s、55。C退火1min、72'C延伸1.5min,以及最終延伸5min。然后對(duì)得到的PCR產(chǎn)物進(jìn)行測(cè)序。f)初步篩選結(jié)果的再克隆^使用Gateway方案(Invitrogen),將在初次篩選期間鑒定的陽(yáng)性克隆的開(kāi)it讀碼框(ORF)再次克隆。如e)所述,通it^酵母菌落的PCR擴(kuò)增ORF。然后將PCR產(chǎn)物克隆入(i)酵母gateway表達(dá)載體,其帶有半乳糖誘導(dǎo)型啟動(dòng)子、作為選擇標(biāo)記的I五C/2或KanR和2p復(fù)制起點(diǎn),以及(ii)來(lái)自NOVAGEN的pET24d(+)栽體。通過(guò)測(cè)序(MILLEGEN)IHt得到的克隆。B)結(jié)果是切割22bp假回文靶標(biāo)的二聚體歸巢核酸內(nèi)切酶。對(duì)與其天然乾標(biāo)結(jié)合的的結(jié)構(gòu)分析已顯示,8個(gè)殘基與7個(gè)g建立了直接相互作用(Jurica等,1998,前文引用)。殘基Q44、R68、R70接觸3至5位(以及-3至-5位,圖2)的3個(gè)連續(xù)g對(duì)。使用完全蛋白質(zhì)文庫(kù)與靼標(biāo)文庫(kù)方法,局部地改造DNA結(jié)合界面的該部分。在第一文庫(kù)中,在平臺(tái)中引入D75N突變,從而降低文庫(kù)中由堿性殘基R68和R70的替換引起的可能的能量限制,這些堿性殘基滿足I-Od結(jié)構(gòu)中深埋的D75作為氫受體的潛能。然后,對(duì)44、68和70位進(jìn)行隨機(jī)化。在第二文庫(kù)中,i-Oel平臺(tái)的R70突變?yōu)镾并且124突變?yōu)閂(V24、S70),這些突變不影響該蛋白的結(jié)構(gòu)。然后,對(duì)44、68、75和77位進(jìn)行隨機(jī)化。產(chǎn)生64個(gè)回文靼標(biāo),其是I-OrI所切割的回文靶標(biāo)的士3、±4和±5位的替換而得到的(Chevalier等,2003,前文引用),如圖13A所述。使用機(jī)器人輔助的接合方案從我們的文庫(kù)中篩選大量的大范圍核酸酶。通常的篩選策略描述于圖4b中。下文詳述具有44、68和70位改變的N75突變體文庫(kù)的結(jié)果。將13,824個(gè)表達(dá)大范圍核酸酶的克隆(約2.3倍于理論多樣性)以高密度(20個(gè)點(diǎn)/cm2)點(diǎn)樣于尼龍濾膜上,其針對(duì)64種靶標(biāo)菌林的每一種(884,608個(gè)點(diǎn))進(jìn)行各個(gè)測(cè)試。分離出至少針對(duì)一個(gè)靶標(biāo)表現(xiàn)出活性的2100個(gè)克隆(圖4b),通過(guò)PCR擴(kuò)增編碼大范圍核酸酶的ORF并測(cè)序。鑒定了410個(gè)不同的序列,選擇相似數(shù)目的相應(yīng)克隆用于進(jìn)一步的分析。將點(diǎn)樣密度降低為4個(gè)點(diǎn)/cm2,針對(duì)64個(gè)報(bào)告菌林一式四份地檢測(cè)每個(gè)克隆,從而得到完整的模式(如圖5)。350個(gè)陽(yáng)性克隆可被確認(rèn)。然后,為了避免菌林包含超過(guò)一個(gè)克隆的可能性,利用PCR對(duì)突變體ORF進(jìn)行擴(kuò)增,并再克隆入酵母載體中。將得到的質(zhì)粒分別轉(zhuǎn)化回酵母中。獲得294個(gè)這樣的克隆,并在低密度(4個(gè)點(diǎn)/cm2)下進(jìn)行檢測(cè)。觀察到與初次篩選的差異主要由弱信號(hào)所致,28個(gè)弱的切割酶作為陰性克隆。只有一個(gè)陽(yáng)性克隆表現(xiàn)出不同于初次篩選模式中所觀察到的模式。350個(gè)被確認(rèn)的克隆表現(xiàn)出各異的模式。這些新的模式中某些與野生型平臺(tái)蛋白具有一定相似性,而其它許多模式則是完全不同的。圖5中顯示了多個(gè)實(shí)例。歸巢核酸內(nèi)切酶通??梢越邮芩鼈凎靶蛄兄械囊欢ㄍ膊⑿裕谝粋€(gè)被發(fā)現(xiàn)的是初始I-Od蛋白自身切割酵母中7個(gè)不同的靶標(biāo)。許多突變體也遵循該規(guī)則,所切割的序列數(shù)目為1~21,平均為5.0個(gè)切割序列(標(biāo)準(zhǔn)差=3.6)。令人感興趣的是,在50種突變體(14%)中,特異性發(fā)生改變使得它們僅切割一個(gè)靶標(biāo)。37種(11%)切割兩個(gè)靶標(biāo),61種(17%)切割3個(gè)耙標(biāo),以及58種(17%)切割4個(gè)耙標(biāo)。對(duì)于5個(gè)耙標(biāo)以及以上的,百分比低于10%??偟膩?lái)說(shuō),38個(gè)耙標(biāo)被突變體切割(圖6a)。值得注意的是,幾乎未觀察到士3位置為A的靶標(biāo)被切割,并且從未,見(jiàn)察到士5、±4、士3位置為TGN(tgn)和CGN(cgn)的靶標(biāo)被切割。實(shí)施例2:對(duì)44、68和/或70位的變體進(jìn)行的層級(jí)聚類定義7個(gè)I-Od變體家族。使用R軟件包的hclust以及來(lái)自初始的低密度篩選得到的定量數(shù)據(jù)進(jìn)行聚類分析。使用Euclidean距離和Ward方法的標(biāo)準(zhǔn)層級(jí)聚類分析法(Ward,J.H.,AmericanStat.Assoc.,1963,58,236-244)對(duì)變體和靶標(biāo)均進(jìn)行聚類分析。重新排序突變體和靶標(biāo)的聚類圖從而優(yōu)化聚類的位置,在高度為8處切斷突變體聚類圖以定義聚類。B)結(jié)果然后,使用層級(jí)聚類分析來(lái)確定是否可以在眾多且多樣的變體切割模式中定義家族。因?yàn)槌醮魏偷诙魏Y得到一致的結(jié)果,所以使用來(lái)自第一輪酵母低密度篩選的定量數(shù)據(jù)進(jìn)行分析,以滿足較大的樣品規(guī)模。使用Euclidean距離和Ward方法的標(biāo)準(zhǔn)層級(jí)聚類分析法(Ward,J.H.,先前引用過(guò))對(duì)變體和靶標(biāo)均進(jìn)行聚類分析,并定義了7個(gè)聚類(圖6c)。顯示了對(duì)其中3個(gè)的詳細(xì)分析(圖6b),結(jié)果總結(jié)于表I中。表I:聚類分析<table>tableseeoriginaldocumentpage44</column></row><table>H艮據(jù)切割指數(shù)的頻率,如圖6b所述2顯示在每個(gè)位置上在該聚類超過(guò)1/3的蛋白質(zhì)中存在的殘基對(duì)于每個(gè)聚類而言,可以基于信號(hào)的頻率和強(qiáng)度來(lái)鑒定一組優(yōu)選的乾標(biāo)(圖6b)。每個(gè)聚類的三個(gè)優(yōu)選耙標(biāo)以及它們的切割頻率標(biāo)于表I中。這些頻率的總和是該聚類之特異性的量度。例如,在聚類1中,三個(gè)優(yōu)選靶標(biāo)(gtt/c/g),占所觀察切割的78.1%,其中g(shù)tt單獨(dú)占46.2%,顯示出非常窄的特異性。實(shí)際上,該聚類包括幾種主要切割gtt的蛋白質(zhì),如QAN(圖5)。相反地,在聚類2中三個(gè)優(yōu)選靶標(biāo)僅占所有觀察信號(hào)的36.6%。與在該聚類中觀察到的相對(duì)較廣且多樣的模式一致,QRR切割5個(gè)靶標(biāo)(圖5),而其它聚類成員的活性不限于這5個(gè)靶標(biāo)。對(duì)每個(gè)聚類中所存在殘基進(jìn)行分析顯示出對(duì)44位的強(qiáng)烈偏好在聚類l和2中Q以絕對(duì)優(yōu)勢(shì)存在,而A和N在聚類3和4中更常出現(xiàn),在聚類6和7中K更常出現(xiàn)。同時(shí),這些偏好性與士4位DNA的強(qiáng)烈的堿基偏好有關(guān),在聚類1和2中大多為t:a堿基對(duì),在聚類3、4和5中為a:t,在聚類6和7中為c:g(參見(jiàn)表I)。與其靶標(biāo)結(jié)合的的結(jié)構(gòu)顯示出Q44殘基與底部鏈的-4位(以及頂部鏈+4位,參見(jiàn)圖2)相互作用。這些結(jié)果提示,在我們的突變體中該相互作用在很大程度上是保守的,并且顯示出"密碼(code)",即Q44會(huì)與腺嘌呤建立接觸,A44(或較少出現(xiàn)的N44)與胸腺嘧咬接觸,以及K44與鳥(niǎo)嘌呤接觸。這樣的相關(guān)性在68位和70位沒(méi)有觀察到。實(shí)施例3:可以將變體組裝成功能性異源二聚體以切割新的DNA靶序列A)材料和方法將75個(gè)雜合靶序列按照如下進(jìn)行克隆設(shè)計(jì)寡核苷酸使之含有每個(gè)突變體回文序列的兩個(gè)不同的半位點(diǎn)(PROLIGO)。使用Gateway方案(INVITROGEN),將利用PCR擴(kuò)增單鏈寡核苷酸獲得的雙鏈靶DNA克隆到酵母和哺乳動(dòng)物報(bào)告載體中。將酵母報(bào)告載體轉(zhuǎn)化到釀酒酵母菌林FYBL2-7B(M^4ra、wm3Z^5J、、、)中。B)結(jié)果變體是能夠切割回文位點(diǎn)的同源二聚體。為了檢測(cè)可切割靶標(biāo)列表是否可以通過(guò)產(chǎn)生可切割雜合切割位點(diǎn)(如圖7所述)的異源二聚體而得以擴(kuò)展,選擇具有不同模式的變體子集并將其克隆到兩個(gè)以Z^C/2或A^V基因?yàn)闃?biāo)記的不同的酵母載體中。然后,將具有44、68和/或70位突變并且75位為N的突變體的組合與一組回文和非回文的嵌合DNA靶標(biāo)共表達(dá)在酵母中。圖8中出示了一個(gè)例子將K44、T68、G70、N75(KTG)和Q44、A68、N70、N75(QAN)突變體共表達(dá),導(dǎo)致兩個(gè)嵌合靶標(biāo)gtt/gcc和gtt/cct的切割,所述嵌合靶標(biāo)不被任一單獨(dú)突變體所切割?;匚男蛄術(shù)tt、cct和gcc靼標(biāo)(以及KTG和QAN的其它靶標(biāo))也被切割,這可能是由于同源二聚體的形成所致,但是無(wú)關(guān)的靶標(biāo)不被切割。另外,gtt、cct或gcc半位點(diǎn)不足以發(fā)生切割,因?yàn)檫@些乾標(biāo)是完全抗性的(參見(jiàn)圖8中g(shù)gg/gcc、gat/gcc、gcc/tac,以及許多其它的)。對(duì)于KTG和QAN同源二聚體分別僅在gtc/cct和gtt/gtc中觀察到意外的切割,但是信號(hào)非常弱。因此,有效的切割需要兩個(gè)突變體單體的協(xié)同結(jié)合。這些結(jié)果表明異源二聚體的良好特異性水平??傊苍诮湍钢袡z測(cè)了14個(gè)不同蛋白質(zhì)的共112種組合,37.5%的組合(42/112)顯示出對(duì)其預(yù)期的嵌合耙標(biāo)的陽(yáng)性信號(hào)。在圖9a中顯示了6個(gè)實(shí)例的定量數(shù)據(jù),對(duì)于同樣的6種組合,在CHO細(xì)胞的瞬時(shí)共轉(zhuǎn)染實(shí)驗(yàn)中確認(rèn)了相關(guān)靶標(biāo)的結(jié)果(圖9b)。作為一般規(guī)則,當(dāng)異源二聚體的兩個(gè)表達(dá)蛋白之一給出像同源二聚體那樣的強(qiáng)信號(hào)時(shí),則總能得到功能性異源二聚體。例如,兩種低活性突變體DRN和RRN,與強(qiáng)的切割蛋白如KTG或QRR形成功能性異源二聚體(圖9a和9b),而將同樣弱的突變體共表達(dá)則不能檢測(cè)到嵌合靶標(biāo)的切割。實(shí)施例4:對(duì)核苷酸±8至±10(10NNN)具有新特異性的功能性核酸內(nèi)切酵根據(jù)描述于實(shí)施例1中的實(shí)驗(yàn)步驟得到變體。A)材料和方法a)構(gòu)建突變體文庫(kù)如前所述(Epinat等,N.A.R.,2003,31,2952-2962),合成I-Oelwt(I醒OeID75)、D75N(I畫OrIN75)和I國(guó)OeIS70N75開(kāi)放讀碼框。組合文庫(kù)通過(guò)替換不同的殘基組合來(lái)源于N75、D75和S70N75平臺(tái)蛋白,所述殘基可能參與與一個(gè)DNA靶標(biāo)半位點(diǎn)的±8至10位威基的相互作用(Q26、K28、N30、S32、Y33、Q38和S40)。通過(guò)使用在每處所選位置具有獨(dú)特簡(jiǎn)并密碼子的筒并引物進(jìn)行PCR來(lái)產(chǎn)生大范圍核酸酶文庫(kù)的多樣性。用aac替換密碼子75引入D75N突變。然后,將N30、Y33和Q38位(Ulib4文庫(kù))或者K28、N30和Q38位(Ulib5文庫(kù))的3個(gè)密碼子用簡(jiǎn)并密碼子VVK(18個(gè)密碼子,編碼12個(gè)不同的氨基酸A、D、E、G、H、K、N、P、Q、R、S、T)進(jìn)行替換。結(jié)果,這些蛋白質(zhì)文庫(kù)的最大(理論上)多樣性為123或1728。然而,對(duì)于核酸而言,多樣性為183或5832。在從BIOMETHODES定購(gòu)的Lib4中,首先用絲氨酸替換N75平臺(tái)蛋白70位的精氨酸(R70S)。然后,將28、33、38和40位進(jìn)行隨機(jī)化。用10種^J^酸(A、D、E、K、N、Q、R、S、T、Y)之一替換原有氨基酸(K28、Y33、Q38和S40)。對(duì)于蛋白質(zhì)而言,得到的文庫(kù)的理論復(fù)雜性為10000。另外,僅隨機(jī)改變N75或D75平臺(tái)蛋白中兩個(gè)位置來(lái)構(gòu)建復(fù)雜性為225(152)的小文庫(kù),其中使用NVK簡(jiǎn)并密碼子(24個(gè)密碼子,^J^酸ACDEGHKNPQRSTWY)。通過(guò)PCR獲得攜帶所期望的突變組合的片段,其中使用一對(duì)編碼10、12或15種不同的氨基酸的簡(jiǎn)并引物,并以I-OeIN75(圖10A)、I-OelD75或S70N75開(kāi)放讀碼框(ORT)為模板。例如,圖10B舉例說(shuō)明分別用于產(chǎn)生Ulib4和Ulib5文庫(kù)的兩對(duì)引物(Ulib456for和Ulib4rev;Ulib456for和Ulib5rev)。將相應(yīng)PCR產(chǎn)物克隆回酵母復(fù)制型表達(dá)栽體pCLS0542(Epinat等,前文引用)中的I-OelN75、D75或S70N75ORF中,該載體攜帶丄^X^營(yíng)養(yǎng)缺陷型標(biāo)記基因。在該基于的復(fù)制型載體中,變體受到半乳糖誘導(dǎo)型啟動(dòng)子的控制。b)構(gòu)建靶標(biāo)克隆使用64對(duì)寡聚核苷酸(:ggcatacaagtttcnrmacgtcgtacgacgtniuigacaatcgtctgtca(SEQIDNO:28)及其反向互補(bǔ)序列),如實(shí)施例1所述構(gòu)建來(lái)源于C1221的64個(gè)回文靶標(biāo)。c)測(cè)序使用以下引物,利用對(duì)酵母菌落的PCR擴(kuò)增在酵母中初次和/或第二次篩選期間鑒定的陽(yáng)性克隆的開(kāi)放讀碼框(ORF),:PCR-GallO-F(gcaactttagtgctgacacatacagg'SEQIDNO:29)和PCR-GallO-R(acaaccttgattgcagacttgacqSEQIDNO:30)。d)結(jié)構(gòu)分析使用Pymol實(shí)現(xiàn)對(duì)蛋白質(zhì)結(jié)構(gòu)的所有分析。I-Od的結(jié)構(gòu)對(duì)應(yīng)于pdb登錄號(hào)lg9y。本文中殘基的編號(hào)總是參照這些結(jié)構(gòu),僅在同源二聚體I-Oel蛋白的第二個(gè)結(jié)構(gòu)域中的殘基除外,其中殘基根據(jù)第一結(jié)構(gòu)域進(jìn)行編號(hào)。B)結(jié)果I-Oel是切割22bp假回文靶標(biāo)的二聚體歸巢核酸內(nèi)切酶。對(duì)與其天然耙標(biāo)結(jié)合的I-Oel的結(jié)構(gòu)分析已顯示,在每個(gè)單體中8個(gè)殘基與7個(gè)堿基建立直接的相互作用(Jurica等,1998,前文引用)。根據(jù)這些結(jié)構(gòu)數(shù)據(jù),在±8至10位的核普酸堿基與的氨基酸N30、Y33、Q38建立直接接觸并與I-Oel氨基酸K28和S40建立間接接觸(圖2)。因此,在30、33和38位突變的新蛋白質(zhì)可表現(xiàn)出對(duì)于64個(gè)靶標(biāo)的新的切割模式,所述靶標(biāo)由所切割的回文靶標(biāo)的±8、±9和±10位發(fā)生替換而得到(10NNN靶標(biāo))。另外,突變可以改變參與與DNA堿基直揍接觸的殘基的數(shù)目和位置。更具體地,除了30、33、38位以外,在折疊蛋白質(zhì)上定位非常鄰近的位置可參與與相同4^&對(duì)的相互作用。使用完全蛋白質(zhì)文庫(kù)與靶標(biāo)文庫(kù)方法以局部地^DNA結(jié)合界面的該部分。5個(gè)M酸位置的隨機(jī)改變將導(dǎo)致理論多樣性為205=3.2xl06。另外,分別隨機(jī)化2、3或4個(gè)^l^產(chǎn)生具有較低多樣性的文庫(kù),得到的多樣性為225(152)、1728(123)或者IO,OOO(104)。這一策略使對(duì)這些文庫(kù)的每一個(gè)的針對(duì)64個(gè)回文的10NNNDNA靼標(biāo)的廣泛篩選得以實(shí)現(xiàn),其中使用先前描述的基于酵母的測(cè)定(Epinat等,2003,前文引用,以及國(guó)際PCT申請(qǐng)WO2004/067736),其原理描述于圖4中。首先,將平臺(tái)的D75突變?yōu)镹。D75N突變不影響該蛋白的結(jié)構(gòu),然而降低it^達(dá)實(shí)驗(yàn)中的毒性。然后,構(gòu)建Ulib4文庫(kù)隨機(jī)改變?nèi)只?0、33和38,并用12種氨基酸(A、D、E、G、H、K、N、P、Q、R、S、T)之一替換原有^J^酸(N30、Y33和Q38)。對(duì)于蛋白質(zhì)而言,得到的文庫(kù)的復(fù)雜性為1728(對(duì)于核酸而言為5832)。然后,構(gòu)建兩個(gè)其它的文庫(kù)Ulib5和Lib4。在Ulib5中,隨機(jī)改變殘基28、30和38,并用12種氨基酸(ADEGHKNPQRST)之一替換原有氨基酸(K28、N30和Q38)。對(duì)蛋白質(zhì)而言,得到的文庫(kù)的復(fù)雜性為1728(對(duì)核酸而言為5832)。在Lib4中,首先用絲氨酸替換70位的精氨酸。然后,隨機(jī)改變28、33、38和40位,并用10種氨基酸(A、D、E、K、N、Q、R、S、T、Y)之一替換原有^J^酸(K28、Y33、Q38和S40)。對(duì)蛋白質(zhì)而言,得到的文庫(kù)的復(fù)雜性為10000。在初次篩選實(shí)驗(yàn)中,將來(lái)自Ulib4的20000個(gè)克隆、來(lái)自Ulib5的10000個(gè)克隆以及來(lái)自Lib4的20000個(gè)克隆與64個(gè)雜交菌林的每一種進(jìn)行接合,測(cè)試二倍體的P-半乳糖苷酶活性。在第二次篩選中,針對(duì)所述64個(gè)靶標(biāo)一式四份i^測(cè)所有表現(xiàn)出對(duì)64個(gè)靶標(biāo)之至少一個(gè)具有切割活性的克隆,并建立每個(gè)切割模式,如圖11所示。然后,利用PCR擴(kuò)增來(lái)自每個(gè)菌林的大范圍核酸酶ORF并測(cè)序。在對(duì)整個(gè)編碼區(qū)域中對(duì)陽(yáng)性克隆進(jìn)行第二次篩選和測(cè)序之后,分離出總共1484個(gè)針對(duì)至少一個(gè)靶標(biāo)表現(xiàn)出切割活性的獨(dú)特突變體??梢杂^察到不同的模式。圖12舉例說(shuō)明被141種變體所切割的37個(gè)新靶標(biāo),包括不被所切割的34個(gè)乾標(biāo)和被所切割的3個(gè)靶標(biāo)(aag、aat和aac)。模式的12個(gè)實(shí)例,包括I-OelN75和I-OelD75,顯示于圖IIA。這些新的模式中的某些與野生型平臺(tái)具有一定相似性,而許多其它的模式則完全不同。歸巢核酸內(nèi)切酶通??梢越邮芷浒行蛄兄幸欢ǖ暮?jiǎn)并性,和N75蛋白質(zhì)本身分別切割一系列16個(gè)和3個(gè)靶標(biāo)。發(fā)現(xiàn)許多新核酸內(nèi)切酶具有切割筒并性,平均每個(gè)突變體具有9.9個(gè)切割耙標(biāo)(標(biāo)準(zhǔn)差11)。但是,在鑒定的1484個(gè)突變體中,發(fā)現(xiàn)219個(gè)(15%)僅切割一個(gè)DNA靶標(biāo),179個(gè)(12%)切割兩個(gè)乾標(biāo),169個(gè)(11%)和120個(gè)(8%)分別能切割3個(gè)和4個(gè)靶標(biāo)。因此,不管它們的優(yōu)選耙標(biāo),4艮多衍生物表現(xiàn)出與N75突變體(切割3個(gè)10NNN乾序列)或者(切割16個(gè)10NNN靼序列)相似(或比其更高)的特異性程度。同時(shí),分離出的針對(duì)10NNN序列的特異性改變的大部分突變體不再切割圖2所述的初始C1221靼序列(分別為61%和59%)??傊?,如此大數(shù)量的突變體使得在士IO、±9和±8位不同的所有64個(gè)可能的DNA序列成為靶標(biāo)(圖IIB)。然而,切割每個(gè)靶標(biāo)的突變體數(shù)目有很大不同(圖IIB),這些數(shù)目的范圍從3至936,平均為228.5(標(biāo)準(zhǔn)差201.5)。經(jīng)?!芬?jiàn)察到士8為鳥(niǎo)嘌呤或士9為腺噤呤的靶標(biāo),皮切割,而±10或士8為胞嘧啶與切割酶少有關(guān)。另外,所有靶標(biāo)的切割效率不都相同。因?yàn)榭蓪?duì)同一靼標(biāo)觀察到信號(hào)的顯著變化,其取決于突變體(例如,比較圖11B中野生型10AAA乾標(biāo)的切割效率),如先前報(bào)道測(cè)量每個(gè)靶標(biāo)的平均切割效率(Arnould等,J.Mol.Biol.,2006,355,443-458)。這些平均效率表示為圖llB的t變。對(duì)結(jié)果的分析表明,該平均效率和切割酶的數(shù)目之間有明顯的相關(guān)性,最常被切割的乾標(biāo)也是最有效率的切割(例如,比較圖11B中的IOTCN、10CTN和10CCN乾標(biāo)與IOGAN、10AAN和10TAN)。因此,獲得數(shù)百種新的變體,包括具有新的底物特異性的突變體;這些變體可以保持高水平的活性,并且新蛋白質(zhì)的特異性甚至可以比野生型蛋白對(duì)其靶標(biāo)的特異性更窄。實(shí)施例5:28、30、33、38和40位的I-CVeI變體與其耙標(biāo)間相互作用的統(tǒng)計(jì)學(xué)分析A)材料和方法如前所述,層級(jí)聚類用于建立特定蛋白質(zhì)殘基和靶標(biāo)堿基之間的可能的聯(lián)系(Arnould等,J.Mol.Biol.,2006,355,443-458)。使用R軟件包的hclust,對(duì)第二次篩選的定量數(shù)據(jù)進(jìn)行聚類分析。使用Euclidean距離和Ward's法的標(biāo)準(zhǔn)層級(jí)聚類分析(Ward,J.H.,AmericanStatist.Assoc.,1963,58,236-244)對(duì)變體進(jìn)行聚類分析。在高度為17時(shí)切斷突變體聚類圖以定義聚類。對(duì)于分析而言,將聚類內(nèi)靶標(biāo)的累計(jì)切割強(qiáng)度計(jì)算為所有聚類的突變體對(duì)該靶標(biāo)的切割強(qiáng)度的總和,對(duì)所有聚類的突變體對(duì)所有乾標(biāo)的切割強(qiáng)度的總和進(jìn)行歸一化。B)結(jié)果鑒定出IO個(gè)不同的突變體聚類(表II)。表n:聚類分析<table>tableseeoriginaldocumentpage51</column></row><table>靼標(biāo)和堿基頻率對(duì)應(yīng)于累計(jì)的切割強(qiáng)度,如材料和方法中所述。2顯示在每個(gè)位置上在該聚類超過(guò)15%的氨基酸中存在的殘基。對(duì)在每個(gè)聚類中發(fā)現(xiàn)的殘基進(jìn)行的分析顯示出對(duì)所有隨機(jī)化位置的強(qiáng)烈偏好。本研究中使用的所有文庫(kù)均沒(méi)有殘基發(fā)生突變,在I-Od平臺(tái)蛋白中存在的殘基預(yù)期是過(guò)度出現(xiàn)的(overrepresented)。實(shí)際上,在所有IO個(gè)聚類中,K28、N30和S40是最常出現(xiàn)的殘基,然而不能得出DNA/蛋白質(zhì)相互作用的確切結(jié)論。然而,Y33僅在聚類7、8和10中是最常出現(xiàn)的殘基,而在另外7個(gè)聚類中觀察到其它殘基的頻繁出現(xiàn),如H、R、G、T、C、P或S。野生型Q38殘基大量出現(xiàn)在除一個(gè)聚類之外的所有聚類中,R和K在聚類4中更常見(jiàn)。同時(shí),在殘基33和38的性質(zhì)與對(duì)粑標(biāo)±10和±9位底物選#^之間觀察到強(qiáng)相關(guān)性。Y33的普遍性與腺嘌呤的高出現(xiàn)率(在聚類7和10中分別為74.9%和64.3%)有關(guān),并且在聚類4、5和8中也觀察到這種相關(guān)性(盡管程度較低)。H33或R33與鳥(niǎo)噤呤(在聚類1、4和5中分別為63.0%、56.3%和58.5%)有關(guān),T33、C33或S33與胸腺嘧啶(在聚類3和9中分別為45.6%和56.3%)有關(guān)。G33在聚類2中相對(duì)常見(jiàn),該聚類在士IO位具有最平均的^l^分布。這些結(jié)果與Seligman和同事的觀察(NucleicAcidsRes.,2002,30,3870-3879)相一致,他們之前顯示,Y33R或Y33H突變改變了I-Oel對(duì)鳥(niǎo)嘌呤的特異性以及Y33C、Y33T、Y33S(以及Y33L)改變了對(duì)±10位胸腺嘧啶的特異性。另外,R38和K38與聚類4中鳥(niǎo)嘌呤的特別高的出現(xiàn)率有關(guān),而在所有其它的聚類中,野生型Q38殘基以及把標(biāo)士9位的腺嘌呤是過(guò)度出現(xiàn)的。與其耙標(biāo)結(jié)合的的結(jié)構(gòu)(Chevalier等,2003,前文引用;Jurica等,1998,前文引用)已顯示,Y33和Q38接觸-10和-9位的兩個(gè)腺嘌呤(圖2),所述結(jié)果提示這些相互作用可能在許多突變體中存在。對(duì)于殘基44和士4位,類似的結(jié)果已在先前描述過(guò)(Arnould等,前文引用)。然而,比較33/±10、38/±9和44/±4組合得到的結(jié)果,顯示給定的>5^可以與不同的M酸^J^目關(guān)聯(lián),其取決于位置。對(duì)于鳥(niǎo)噪呤而言,發(fā)現(xiàn)的殘基大多數(shù)是33位的R和H、38位的R或K以及44位的K。對(duì)于腺噤呤而言是33位的Y以及38和44位的Q,對(duì)于胸腺嘧啶而言是33位的S、C或T以及44位的A。在所述三種情形中,未觀察到關(guān)于胞嘧啶的明確模式。因此,不存在通用的"編碼",而是存在一系列對(duì)接觸每個(gè)g的解決方案,最佳方式取決于更一般的環(huán)境,非常類似于所觀察到的鋅指蛋白質(zhì)(Pabo等,前文引用)。實(shí)施例6:兩個(gè)功能性亞結(jié)構(gòu)域在與DNA結(jié)合方面可獨(dú)立作用。該實(shí)施例顯示靶標(biāo)可被分為兩部分,分別與不同的亞結(jié)構(gòu)域結(jié)合,并獨(dú)立起作用。在DNA靶標(biāo)中,±5、±4和±3位結(jié)合殘基44、68和70(圖2)。如實(shí)施例1所述獲得的幾種變體(在44、68、70和75位突變)表現(xiàn)出對(duì)C1221(被野生型切割的回文靶標(biāo)(Chevalier,等,2003))的可檢測(cè)的活性,但是以各種效率切割其它靼標(biāo)。在結(jié)合位點(diǎn)的外部,±9和±8位接觸殘基30、33和38(圖2)。圖13顯示,兩組殘基在蛋白的不同部分中。不存在與gA8的直接相互作用。如15至±3位和±10至±8位結(jié)合兩個(gè)不同的獨(dú)立的功能性亞結(jié)構(gòu)域,^tit一個(gè)亞結(jié)構(gòu)域不應(yīng)影響其它結(jié)構(gòu)域的結(jié)合特性。為了確定士5至±3位和±9至±8位是否結(jié)合兩個(gè)不同的獨(dú)立的功能性亞結(jié)構(gòu)域,測(cè)定±5至±3區(qū)域特異性發(fā)生了改變的突變體(但仍然結(jié)合C1221)在±10至±8區(qū)域的切割性質(zhì)。A)材料和方法a)結(jié)構(gòu)分析使用Pymol實(shí)現(xiàn)所有的蛋白質(zhì)結(jié)構(gòu)分析。I-Oel的結(jié)構(gòu)對(duì)應(yīng)于pdb登錄號(hào)lg9y。本文中的殘基編號(hào)總是參照這些結(jié)構(gòu),除了在同源二聚體蛋白的第二個(gè)結(jié)構(gòu)域中的殘基之外,其殘1^艮據(jù)第一個(gè)結(jié)構(gòu)域進(jìn)行編號(hào)。b)表達(dá)I-OgI變體的酵母菌株如實(shí)施例1所述通過(guò)突變44、68、70和75位,并篩選能切割C1221衍生靶標(biāo)的克隆來(lái)得到突變體。將表達(dá)突變體的質(zhì)粒轉(zhuǎn)化至釀酒酵母菌林FYC2-6A(M4r《一A"縮A,)中。53C)構(gòu)建靶標(biāo)克隆如實(shí)施例1所述,使用64對(duì)寡聚核苷酸(:ggcatacaagtttcaaaacnungtacnnngttttggcaatcgt卿ca(SEQID冊(cè):31)及其反向互補(bǔ)序歹iJ)構(gòu)建64個(gè)源自C1221的±5至±3位中發(fā)生突變的回文耙標(biāo)。d)酵母中表達(dá)大范圍核酸酶克隆的接合以及篩選如實(shí)施例1所述進(jìn)行接合,使用低網(wǎng)格密度(約4個(gè)點(diǎn)/cm2)。B)結(jié)果通過(guò)誘變±10至±8位的堿基,構(gòu)建源自C1221的對(duì)應(yīng)于所有可能的回文乾標(biāo)的64個(gè)乾標(biāo),如圖14B所示。建立I-OeIN75切割模式,顯示對(duì)aaa和aat靶標(biāo)的強(qiáng)信號(hào),以及對(duì)aag靶標(biāo)的較弱信號(hào)。如圖14C所示,具有明顯不同的士5至±3位切割模式的蛋白質(zhì)(如QAR、QNR、TRR、NRR、ERR和DRR)卻具有相似的土IO至±8位模式。在±10至±8位的aaa序歹'J對(duì)應(yīng)于C1221乾標(biāo),并且必然被所有切割C1221的變體切割。aat也在大多數(shù)突變體中(卯%)被切割,而aag常觀察不到切割,這可能因?yàn)槿跚懈蠲钢械男盘?hào)低于檢測(cè)水平。其它耙標(biāo)均沒(méi)有被切割。這些結(jié)果表明士5至±3位以HO至±8位區(qū)域結(jié)合兩個(gè)不同的、在很大程度上是獨(dú)立的結(jié)合單位。實(shí)施例7:兩組突變可以分子內(nèi)組合以獲得新的可預(yù)測(cè)的靶標(biāo)特異性,如組合的乾標(biāo)COMB2所示A)產(chǎn)生在10NNN和5NNN位同時(shí)發(fā)生改變的能夠切割組合耙標(biāo)的組合突變體的一般策略此實(shí)施例的目的是確定是否可能對(duì)DNA-結(jié)合界面中的可分離功能性亞結(jié)構(gòu)域進(jìn)行組合,從而切割新的DNA耙標(biāo)。鑒定I-Od編碼序列中的不同突變組,其提高了對(duì)這兩組突變體進(jìn)行分子內(nèi)組合以產(chǎn)生能夠切割在10NNN和5NNN位同時(shí)發(fā)生改變的乾序列的組合突變體的可能性,所述突變改變了對(duì)C1221粑序列的兩個(gè)不同區(qū)域(10NNN(-10至-8位和+8至+10位±8至10位或±10至8位;實(shí)施4)和5NNN(國(guó)5至畫3位和+3至+5位±3至5位或±5至3位;實(shí)施眾'J1)的切割特異性(圖3a)。一側(cè)的28、30、33、38和40位,以及另一側(cè)的44、68和70位,處于同一個(gè)DNA結(jié)合折疊上,沒(méi)有結(jié)構(gòu)證據(jù)表明它們獨(dú)立地起作用。然而,兩組突變明顯地位于該折疊的兩個(gè)空間上不同的區(qū)域(圖13和15),所述區(qū)域位于DNA靶標(biāo)不同區(qū)域附近。另外,一系列突變的累積影響可最終破壞折疊。為了枱:驗(yàn)它們是否為兩個(gè)獨(dú)立的功能性亞基的一部分,對(duì)來(lái)自這兩個(gè)系列的突變體的突變進(jìn)行組合,測(cè)定所得變體切割所述的組合耙序列的能力(圖3b)。因此,設(shè)計(jì)了模型非回文耙序列,其為4個(gè)被切割的5NNN和10NNN耙標(biāo)的拼接物。該粑標(biāo)COMB1在±3、±4、±5、±8、±9和±10位不同于C1221共有序列(圖3b)。另外,設(shè)計(jì)了兩個(gè)衍生的乾序列,其代表回文形式中的左半邊(COMB2)和右半邊(COMB3)(圖3b)。為了產(chǎn)生能夠耙向所述回文耙標(biāo)的適當(dāng)?shù)腎-Oel組合突變體,選擇有效切割每個(gè)回文序列的10NNN和5NNN部分的突變體(表III(本實(shí)施例)以;5L^IV(實(shí)施例8)),并通過(guò)在酵母中體內(nèi)克隆將它們的特征性突變并入相同的編碼序列中(圖3b)。全部正文和附圖中,針對(duì)COMB序列的組合突變體用8字母代碼命名,其才艮據(jù)28、30、33、38、40、44、68和70位殘基(例如,NNSRK/AAR表示2咖SahmSMIU0KMA^A0R"N:)。親本對(duì)照用5字母或3字母代碼命名,其才艮據(jù)28、30、33、38和40位殘基(NNSRK表示I-Crel28N30N33S38R4。K70S75N;)或者44、68和70位戎基(AAR表示44AQ68A70R75N;)。在這些實(shí)施例中描述的所有的靼序列均為22bp或24bp回文序列。因此,僅通過(guò)前11或12個(gè)核苷酸和其后的僅用于指明這一點(diǎn)的后綴一P對(duì)它們進(jìn)行描述(例如,被蛋白切割的靶^5,tcaaaacgtcgtacgacgttttga3,(SEQIDNO:l)稱作tcaaaacgtcgt—P:)。基本上,如實(shí)施例1和4所述分別獲得單體中4個(gè)系列的突變。在第一步中,引入I-Oel平臺(tái)的D75N突變,從而降低文庫(kù)中由堿性殘基R68和R70的替換引起的可能的能量限制,所述堿性殘基滿足了I-CVeI結(jié)構(gòu)中深埋的D75作為氫受體的潛能。在該實(shí)施例中,通過(guò)誘變28、30、33位或者28、33、38和40位獲得能夠切割COMB2的IONNN部分(:totggacgtcgt—Ptarget(SEQIDNO:37))的突變體(表III),通過(guò)謙變44、68和70位獲得能夠切割COMB2的5NNN部分(tCaaaaCgaCgt_P(SEQIDNO:38))的突變體(表III)。在實(shí)施例8中,通過(guò)i秀變28、30、33位或者28、33、38和40位獲得能切割COMB3的10NNN部分(:tcgataCgtcgt_P(SEQIDNO:44))的突變體(表IV),通過(guò)誘變44、68和70位獲得能切割COMB3的5NNN部分(:tcaaaaccctgt—P(SEQIDNO:45))的突變體(表IV)。然后,對(duì)于每個(gè)組合乾標(biāo)(COMB2或COMB3),將切割10NNN耙標(biāo)的突變體的28、30、33、38和40位的突變與切割5NNN乾標(biāo)的突變體的44、68和70位的突變進(jìn)行組合,并且測(cè)定所得組合突變體切割適當(dāng)靶序列COMB2(:tctggacgacgt—P(SEQIDNO:39):;本實(shí)施例)或者COMB3(:teaaaaccctgt—P(SEQ]DNO:45):;實(shí)施例8)的能力。B)材料和方法a)構(gòu)建組合突變體為了產(chǎn)生包含源自不同文庫(kù)的突變(28、30、33、38、40位和44、68、70位或者44、68、70、75、77位氨基酸)的I-OeI編碼序列,分別進(jìn)行擴(kuò)增編碼序列的5,端(1-43位氨基酸)或3,端(39-167位)的重疊PCR反應(yīng)(圖10)。對(duì)于5,和3,端,均使用載體(pCLS0542)特異性的引物(Gall0F5,-gcaactttagtgctgacacatacagg-3,(SEQIDNO:40)或Gall0R5,_acaaccttgattggagacttgaco3,(SEQIDNO:41)),以及I畫OeI編石馬序歹1(39-43位氨基酸)特異性的引物(assF5'-ctaxxxttgaccttt-3,(SEQIDNO:42)或assR5'-aaaggtcaaxx加g-3'(SEQIDNO:43))進(jìn)行pCR擴(kuò)增,其中xxx編碼針對(duì)40位殘基。所得PCR產(chǎn)物彼此之間包含15bp的同源性,與基于2p的復(fù)制型載體pCLS0542(帶有丄五t/2基因?yàn)闃?biāo)記)和pCLS1107(含有"f那霉素抗性基因)具有約100-200bp的同源性。因此,為了通過(guò)體內(nèi)同源重組產(chǎn)生同時(shí)包含兩組突變的完整的編碼序列,使用約25ng兩種重疊PCR片段之每一種以及25ng用TVcoI和£嘆1消化使之線性化的pCLS0542載體DNA或者25ng用DraIII和A^MIV消化使之線性化的pCLS1107載體DNA使用高效LiAc轉(zhuǎn)化方案轉(zhuǎn)化釀酒酵母菌林FYC2-6A(A^r《&/^Z\63,/e"2ZU脂/\,)(Gietz和Woods,Me仇odsEnzymol"2002,350,87-96)。分別產(chǎn)生組合的突變體。將PCR反應(yīng)以等摩爾量合并并與線性化質(zhì)粒一起轉(zhuǎn)化入酵母。在缺乏亮氨酸的合成培養(yǎng)基上(pCLS0542)或者含有G418的豐富培養(yǎng)基上(pCLS1107)選擇轉(zhuǎn)化子。b)構(gòu)建乾標(biāo)克隆如實(shí)施例1所述克隆靶標(biāo)。c)酵母中表達(dá)歸巢核酸內(nèi)切酶克隆的M和篩選如實(shí)施例1所述進(jìn)行表達(dá)歸巢核酸內(nèi)切酶的克隆接合并在酵母中進(jìn)行篩選,使用高網(wǎng)格密度(約20個(gè)點(diǎn)/cm2)。C)結(jié)果如實(shí)施例1和4中所述鑒定切割tctggacgtcgt—P(SEQIDNO:")和tcaaaacgacgt一P(SEQIDNO:38)的突變體。在30、33、38、40和70位發(fā)生突變的能夠切割序列tctggacgtogUP(SEQmNO:3、表IH)的3種變體與在44、68和70位發(fā)生突變的能夠切割序列tcaaaacgacgt—P(SEQIDNO:SS;表In)的31種不同的變體進(jìn)行組合。兩組蛋白質(zhì)均在70位具有突變。然而,兩個(gè)可分離的功能性亞結(jié)構(gòu)域的^^沈暗示該位置對(duì)于±10至±8的特異性幾乎沒(méi)有影響。因此,在組合蛋白質(zhì)中,僅使用來(lái)自第一組蛋白質(zhì)的30、33、38和40位殘基,70位殘基選自第二組蛋白質(zhì)。在酵母中測(cè)定得到的93種突變體的切割,包括用組合靶序列COMB2(:tctggacgacgt—P:SEQIDNO:39:)進(jìn)行LacZ測(cè)定。32種組合突變體能夠切割該靶標(biāo)(表III和圖16)。組合耙序列的切割是組合突變體特異性的,因?yàn)槊糠N親本突變體均不能切割該組合的序列(圖16)。另夕卜,雖然親本突變體對(duì)5NNN和10NNN把序列表現(xiàn)出有效切割,然而除了一種以外的所有其它組合突變體未表現(xiàn)出對(duì)于這些序列(圖16)或者對(duì)于原始C1221序列的顯著活性。唯一的例外是NNSRR/ARS,發(fā)現(xiàn)其微弱地切割5GAC耙標(biāo)(圖16)。這些結(jié)M明,組合28、30、33、38、40和44、68、70位的突變可產(chǎn)生具有預(yù)期特異性的功能性核酸內(nèi)切酶,約占被測(cè)試組合的30%。本研究鑒定出作為兩個(gè)可分離DNA結(jié)合亞結(jié)構(gòu)域一部分的一側(cè)的28-40位殘基和另一側(cè)的44-70位殘基(圖15)。表III:針對(duì)COMB2靶標(biāo)檢測(cè)組合突變體*<table>tableseeoriginaldocumentpage58</column></row><table>通過(guò)組裝I-OrfN75平臺(tái)中28、30、33、38、40、44、68和70位的突變得到組合突變體。切割COMB2的組合突變體標(biāo)為+。1切割所選5GAC把標(biāo)的I-CVeIN75變體中鑒定的突變2切割所選10TGG靶標(biāo)的I-OelS70N75變體中鑒定的突變實(shí)施例8:兩組突變可以分子內(nèi)組合以獲得新的可預(yù)測(cè)的靶標(biāo)特異性,如組合乾標(biāo)COMB3所示A)材料和方法實(shí)驗(yàn)方案如實(shí)施例7所述。B)結(jié)果將28、33、38、40和70位發(fā)生突變并能夠切割序列tcgatacgtcgt—P(SEQIDNO:H表IV)的7種變體與44、68和70位發(fā)生突變并能夠切割序列tca自cc鄉(xiāng)-P(SEQIDN^S,表IV)的30種不同的變體進(jìn)行組合。兩組蛋白質(zhì)在70位均具有突變。然而,兩個(gè)可分離功能性亞結(jié)構(gòu)域的假說(shuō)暗示該位置對(duì)于±10至±8位的特異性幾乎沒(méi)有影響。因此,在組合蛋白質(zhì)中,僅使用來(lái)自第一組蛋白質(zhì)的30、33、38和40位殘基,70位殘基選自第二組蛋白質(zhì)。在酵母中測(cè)定得到的210種突變體的切割,所述測(cè)定包括用組合靼序列COMB3(:tcgataccctgt—P(SEQ1DNO:46):)進(jìn)行LacZ測(cè)定。77種組合突變體能夠切割該靶標(biāo)(表IV)。組合乾序列的切割是組合突變體特異性的,因?yàn)槊糠N親本突變體均不能切割該組合序列。另外,雖然親本突變體對(duì)5NNN和10NNN耙序列表現(xiàn)出有效切割,但是所有組合突變體;^現(xiàn)出對(duì)于這些序列或者對(duì)于原始的C1221序列的顯著活性。這些結(jié)果表明,在28、30、33、38、40位和44、68、70位的組合突變可產(chǎn)生具有預(yù)期特異性的功能性核酸內(nèi)切酶,約占被測(cè)試組合的30%。4^研究鑒定了作為兩個(gè)可分離DNA結(jié)合亞結(jié)構(gòu)域一部分的一側(cè)的28-40位殘基以及另一側(cè)的44-70位殘基(圖15)。表IV:針對(duì)COMB3耙標(biāo)檢測(cè)組合突變體<table>tableseeoriginaldocumentpage60</column></row><table>*通過(guò)組裝I-OelN75平臺(tái)中28、30、33、38、40、44、68和70位的突變得到組合突變體。切割COMB3的組合突變體標(biāo)為+。1切割所選5CCT靶標(biāo)的I-OrlN75變體中鑒定的突變2切割所選10GAT靶標(biāo)的S70N75變體中鑒定的突變3切割所選10GAT靶標(biāo)的N75變體中鑒定的突變實(shí)施例9:兩組突變可以分子內(nèi)組合以獲得新的可預(yù)測(cè)的靶標(biāo)特異性,如組合乾標(biāo)SEQIDNO:49所示本實(shí)施例的目的是確定是否有可能鑒定并組合DNA結(jié)合界面中的可分離功能性亞結(jié)構(gòu)域,從而切割新的DNA耙標(biāo)。本實(shí)施例描述的所有的靼序列均是24bp回文序列。因此,僅通過(guò)前12個(gè)核苷酸和其后僅用于指明這一點(diǎn)的后綴一P對(duì)它們進(jìn)行描述(例如,被蛋白切割的乾才示5,tcaaaacgtcgtacgacgttttga3,(SEQIDN0:1);,將,皮稱作tcaaaacgtcgt_P:)。如實(shí)施例1和4所述獲得單體中的兩組突變。在第一步中,在平臺(tái)中引入D75N突變,從而降低文庫(kù)中由堿性殘基R68和R70的替換引起的可能的能量限制,所逸喊性殘基滿足了I-Oel結(jié)構(gòu)中深埋的D75作為氫受體的潛能。然后,通過(guò)誘變28、30、33位或者28、33、38和40位獲得能夠切割tc祖cacgt^-P(SBQ!DNO^)靶標(biāo)的突變體(表V),并通過(guò)誘變44、68和70位獲得能切割tcaaaaccctgt—P(SEQIDNO:的突變體(表V)。一側(cè)的28、30、33、38和40位和另一側(cè)的44、68和70位位于同一個(gè)DNA結(jié)合折疊上,沒(méi)有結(jié)構(gòu)證據(jù)表明它們應(yīng)該獨(dú)立地作用。然而,兩組突變明顯處于該折疊的兩個(gè)空間上不同的區(qū)域(圖15),所述折疊位于DNA靶標(biāo)不同區(qū)域的周圍。為了檢測(cè)它們是否是兩個(gè)獨(dú)立的功能性亞基的一部分,我們將來(lái)自這兩組突變體的突變進(jìn)行組合,檢測(cè)它們是否可以切割加acaccctgt—P(S£QIDNO:49)嵌合靶標(biāo)。A)材料和方法實(shí)驗(yàn)步驟描述于實(shí)施例7。B)結(jié)果將28、30、33、38、40和70位具有突變并能夠切割序列teaacacgtcgt—P(SEQIDNO:化表V)的5種變體與44、68和70位具有突變并能夠切割序列加旭咖鄉(xiāng)-P(SEQIDNO雄表V)的34種不同的變體進(jìn)行組合。兩組蛋白質(zhì)在70位均具有突變。然而,兩個(gè)可分離功能性亞結(jié)構(gòu)域的假說(shuō)暗示該位置對(duì)于士10至±8的特異性幾乎沒(méi)有影響。因此,在組合蛋白質(zhì)中,僅使用來(lái)自第一組蛋白質(zhì)的30、33、38和40位殘基,70位殘基選自第二組蛋白質(zhì)。在酵母中測(cè)定得到的170種突變體的切割,包括用組合的乾序列tcaaeaccctgt一P(SEQIDNO:49)進(jìn)行LacZ測(cè)定。37種組合突變體能夠切割所述靼標(biāo)(圖17B),而僅有一個(gè)非組合突變體(I-O^IK44、R68、D70、N75)能夠切割組合序列(圖17A)。本研究鑒定了一側(cè)的28-40位殘基和另一側(cè)的44-70位殘基是兩個(gè)可分離DNA結(jié)合亞結(jié)構(gòu)域的一部分(圖15)。表V:^研究中4吏用的變體<table>tableseeoriginaldocumentpage63</column></row><table>°I-OeI和N75作為參照。僅當(dāng)^i^酸殘基不同于I-Oel時(shí)給予標(biāo)明。實(shí)施例10:兩組突變可以分子內(nèi)組合以獲得新的可預(yù)測(cè)的靶標(biāo)特異性,如組合耙標(biāo)SEQIDNO:52所示本實(shí)施例的目的是確定是否有可能鑒定出I-OdDNA結(jié)合界面中的可分離功能性亞結(jié)構(gòu)域并對(duì)其進(jìn)行組合,從而切割新的DNA靶標(biāo)。本實(shí)施例描述的所有的耙序列均是24bp回文序列。因此,僅通過(guò)前12個(gè)核苷酸和其后僅用于指明這一點(diǎn)的后綴_對(duì)它們進(jìn)行描述(例如,被I-Oel蛋白切割的乾才示5,tcaaaacgtcgtacgacgttttga3,(SEQIDNO:l);將被稱作tcaaaacgtcgt—P:)。如實(shí)施例l和4所述獲得I-Oel單體中的兩組突變。在第一步中,在平臺(tái)中引入D75N突變,從而降低文庫(kù)中由堿性殘基R68和R70的替換引起的可能的能量限制,所述堿性殘基滿足I-Orl結(jié)構(gòu)中深埋的D75作為氫受體的潛能。然后,通過(guò)誘變28、30、33位或者28、33、38和40位獲得能夠切割tc咖acgtcgt—Ptarget(SEQIDNO:S0)靶標(biāo)的突變體(表VI),并通過(guò)誘變44、68和70位獲得能切割tcaaaactttgt—P(SEQIDNO:51)的突變體(表VI)。一側(cè)的28、30、33、38和40位和另一側(cè)的44、68和70位在同一個(gè)DNA結(jié)合折疊上,沒(méi)有結(jié)構(gòu)證據(jù)表明它們應(yīng)該獨(dú)立地作用。然而,兩組突變明顯地在該折疊的兩個(gè)空間上不同的區(qū)域(圖15),所述4斤疊位于DNA靶標(biāo)不同區(qū)域的周圍。為了檢測(cè)它們是否是兩個(gè)獨(dú)立的功能性亞基的一部分,我們將來(lái)自這兩組突變體的突變進(jìn)行組合,檢測(cè)它們是否可以切割tcaacactttgt一P嵌合乾標(biāo)(SEQIDNO:52)。A)材料和方法實(shí)驗(yàn)步驟描述于實(shí)施例7。B)結(jié)果將28、30、33、40和70位具有突變并能夠切割序列teaacacgtcgt—P(SEQIDNO:,的5種變體與44、68和70位具有突變并能夠切割序列teaaaactttgt—P(SEQIDNOW)的29種不同的變體進(jìn)行組合。兩組蛋白質(zhì)在70位均具有突變。然而,兩個(gè)可分離功能性亞結(jié)構(gòu)域的個(gè)JL暗示該位置對(duì)于±10至±8位的特異性幾乎沒(méi)有影響。因此,在組合蛋白質(zhì)中,僅使用來(lái)自第一組蛋白質(zhì)的30、33、38和40位殘基,70位殘基選自第二組蛋白質(zhì)。在酵母中測(cè)定得到的145種突變體的切割,包括用組合靶序列toaacacmgt—P(SEQEDNO^)進(jìn)行LacZ測(cè)定。鑒定出23種活性的組合突變體。然而,對(duì)于它們所有來(lái)說(shuō),一個(gè)親本的突變體也切割所述靼標(biāo)。盡管如此,這表明在兩組突變之間存在很大的自由度。能夠切割所述靼標(biāo)的組合突變體能像非組合突變體那樣切割組合序列(圖18A和B)。表VI:本研究中使用的變體<table>tableseeoriginaldocumentpage66</column></row><table>實(shí)施例11:同源二聚組合突變體的生物化學(xué)和生物物理學(xué)分析A)材料和方法如先前所報(bào)道的(Arnould等,前文引用),表達(dá)、純化新的I-Orl變體并分析其體外切割。使用0.2cm路徑長(zhǎng)度的石英杯在JascoJ-810旋光分光計(jì)上進(jìn)4亍圓二色性(circulardichroism,CD)測(cè)量。以l0C/min的速率提高溫度以誘導(dǎo)平衡態(tài)去折疊(equilibriumunfolding)(使用可編程的Peltier熱電設(shè)備)。在20的蛋白質(zhì)濃度下,通過(guò)用25mM磷酸鉀緩沖液(pH7.5)透析來(lái)制備樣品。B)結(jié)果對(duì)切割COMB2或COMB3的4種組合突變體及其相應(yīng)親本突變體進(jìn)行體外分析,以比較它們的相對(duì)切割效率。如圖19a-c中可觀察到的,對(duì)組合回文乾序列(COMB2或COMB3)的切割是組合突變體特異性的,因?yàn)閮蓚€(gè)親本突變體不能切割這些序列。另外,盡管親本突變體顯示出對(duì)5NNN和10NNN耙序列的有效切割,但是4種組合突變體中只有一種(NNSRK/ARR)表現(xiàn)出對(duì)這些耙標(biāo)的微弱活性,其它則完全無(wú)活性。因此,來(lái)自酵母測(cè)定的結(jié)果在體外得到驗(yàn)證。重要地,突變體之間活性水平的差異也與酵母中觀察到的差異相一致,并且這種一致性進(jìn)一步由4種另外的切割COMB3的突變體的體外研究所證實(shí)。因此,酵母中觀察到的信號(hào)的不同并非由于表達(dá)水平差異所致,而是事實(shí)上反映了結(jié)合和/或切割性質(zhì)的差異。最后,使用遠(yuǎn)紫外CD(圖19d)、^-NMR和分析型^il離心分析這組組合突變體的結(jié)構(gòu)和穩(wěn)定性。所有的突變體均為二聚體,并且它們的二級(jí)和三級(jí)結(jié)構(gòu)以及熱變性曲線(圖19d)與原始的I-OdN75蛋白相似,表明所述改造未導(dǎo)致這些蛋白的結(jié)構(gòu)、折疊或穩(wěn)定性發(fā)生顯著改變。因此,經(jīng)突變的兩組殘基,一側(cè)的K28、N30、Y33、Q38和S40,另一側(cè)的Q44、R68和R70,定義了兩個(gè)相對(duì)獨(dú)立的DNA結(jié)合亞結(jié)構(gòu)域。實(shí)施例12:組合突變體的共表達(dá)導(dǎo)致嵌合耙位點(diǎn)的切割A(yù))材料和方法實(shí)驗(yàn)步驟描述于實(shí)施例3。B)結(jié)果為了確定組合突變體是否可以作為異源二聚體有效地發(fā)揮作用,將能夠切割回文位點(diǎn)COMB2和COMB3的一個(gè)突變體亞群在酵母中共表達(dá),并測(cè)定其切割嵌合位點(diǎn)COMBl的能力,所述COMBl對(duì)應(yīng)于原始靶標(biāo)的兩個(gè)半位點(diǎn)的融合(圖20a)。如圖20a中可觀察到的,所有被測(cè)異源二聚體的共表達(dá)均導(dǎo)致嵌合序列COMB1的切割。該活性似乎是異源二聚體特異性的,因?yàn)槊糠N單獨(dú)表達(dá)的突變體未表現(xiàn)出對(duì)嵌合耙位點(diǎn)(圖20a)的可檢測(cè)活性。通常,與對(duì)COMB2和/或COMB3表現(xiàn)出弱活性的兩種突變體的共表W目比,表現(xiàn)出強(qiáng)活性的兩種突變體的共表達(dá)將導(dǎo)致對(duì)嵌合位點(diǎn)更高水平的活性(例如,比較圖20a中的KNHQS/KEGxNNSRK/ARR和QNRQR/KEGxNNSRK/ASR)。當(dāng)在我們的條件下將KNHQS/KAS和NNSRK/ARR純化蛋白與COMB1靶標(biāo)一起孵育時(shí),在體外也檢測(cè)到COMB1耙標(biāo)的切割,而僅孵育一種蛋白質(zhì)不產(chǎn)生任何可檢測(cè)的切割活性。然而,切割效率非常低,其可能由于體外異源二聚體形成緩慢所致。實(shí)際上,Silva等可表明,來(lái)自的經(jīng)改造的衍生物必須在大腸桿菌中共表達(dá)以形成活性異源二聚體(NucleicAcidsRes"2004,32,3156-3168),還不清楚I-Oel同源二聚體是否可以容易地交換亞基。實(shí)際上,不能排除低水平的切割可由替代途徑所引起,如隨后的兩個(gè)同源二聚體在溶液中的切割,目前我們正在研究這個(gè)課題??傊?,這些結(jié)果表明組合法可以產(chǎn)生能夠有效切割嵌合耙位點(diǎn)的人工HE,所述嵌合乾位點(diǎn)在10NNN和5NNN位發(fā)生改變。衍生物集合的產(chǎn)生目前允許切割所有64個(gè)10NNN靼標(biāo)和64個(gè)5NNN耙標(biāo)中的62個(gè)(我們的^L表的數(shù)據(jù))。它們進(jìn)行分子內(nèi)以及分子間組合的能力將可得到的22-mer的數(shù)目提高至至少1.57x107((64x62)2)。實(shí)施例13:重新設(shè)計(jì)的歸巢核酸內(nèi)切酶切割RAG1基因中的天然靼序列。A)材料和方法實(shí)驗(yàn)步驟如實(shí)施例3和7所述,只是針對(duì)RAG靶標(biāo)的組合突變體以文庫(kù)形式產(chǎn)生除外,這與針對(duì)COMB靶標(biāo)(實(shí)施例7)的組合突變體單獨(dú)產(chǎn)生不同。B)結(jié)果為了分析組合法對(duì)于設(shè)計(jì)針對(duì)天然靶標(biāo)位點(diǎn)的HE的有效性,分析在位點(diǎn)。已表明RAG1與RAG2形成復(fù)合物,所述復(fù)合物負(fù)責(zé)起始V(D)J重組,免疫球蛋白和T淋巴細(xì)胞受體成熟過(guò)程中的必需步驟(Oettinger等,Science,1990,248,1517-1523;Schatz等,Cell,1989,59,1035-1048)。攜帶WG7突變的患者由于缺乏T和B淋巴細(xì)胞表現(xiàn)出嚴(yán)重聯(lián)合免疫缺陷(severecombinedimmunedeficiency,SCID)??梢酝ㄟ^(guò)移植來(lái)自家族內(nèi)供體的同種異體造血干細(xì)胞來(lái)治療SCID,最近某些類型的SCID已成為基因治療試驗(yàn)的對(duì)象(Fischer等,Immunol.Rev.,2005,203,98-109)。對(duì)RAG1的基因座的分析顯示了存在位于RAG1的編碼外顯子上游llbp的潛在的靶標(biāo)位點(diǎn),稱為RAGl.l(圖3c)。與COMB序列不同,RAGl.l位點(diǎn)與C1221位點(diǎn)的不同不僅在10NNN和5NNN位,而且在11N(llt取代了11c)和7NN(7ct取代了7ac)位。I-OelD75N容許這些變化,推測(cè)組合突變體也容許這些位置的變化。對(duì)于5NNN區(qū)域來(lái)說(shuō),使用的突變體來(lái)自先前^L道的44、68、70位突變的文庫(kù)(Arnould等,前文引用),以及44、68、75和77位突變的另一文庫(kù),在70位具有絲氨酸殘基。由于另外的殘基被突變,因此組合突變糾艮據(jù)10個(gè)戎基而非8個(gè)^進(jìn)行命名,最后的兩個(gè)字母對(duì)應(yīng)于75和77位的殘基(例如,KNTAK/NYSYN代表I-Oel28K30N33T38A40K44N68Y70S75Y77N:)'與分別產(chǎn)生用于COMB靶標(biāo)的突變體不同,用于RAG靶標(biāo)的突變體以文庫(kù)形式產(chǎn)生。對(duì)于RAG1.2耙序列來(lái)說(shuō),產(chǎn)生推定復(fù)雜度為1300個(gè)突變體的文庫(kù)。篩選2256個(gè)克隆得到64個(gè)陽(yáng)性克隆(2.8%),在測(cè)序之后,其對(duì)應(yīng)于49種不同的核酸內(nèi)切酶。對(duì)于RAG1,3來(lái)說(shuō),篩選了2280個(gè)克隆,并鑒定出88個(gè)陽(yáng)性克隆(3.8%),其對(duì)應(yīng)于59種不同的核酸內(nèi)切酶。在兩種情形中,組合突變體均不能切割5NNN和10NNN耙序列以及原始的C1221。與分別產(chǎn)生和測(cè)試的COMB突變體不同,RAG突變體以文庫(kù)形式產(chǎn)生。然而,在這些文庫(kù)中沒(méi)有檢測(cè)到明顯的偏好,這些頻率應(yīng)該代表了功能性陽(yáng)性產(chǎn)物的真實(shí)頻率。與用COMB靶標(biāo)篩選相比,此低成功率可能是由在75和77位的另外的突變所致,或者來(lái)自這些靶標(biāo)中±6、±7和±11位的另外的變化。然后,如同對(duì)于COMBl的,將一組能夠切割回文靶標(biāo)的突變體在酵母中共表達(dá)以檢測(cè)RAG1.1靶標(biāo)的切割。圖20b顯示,共表達(dá)導(dǎo)致天然靶標(biāo)的切割。RAG1.1靶標(biāo)切割是由共表達(dá)形成的異源二聚體所致,因?yàn)檫@些突變體在單獨(dú)表達(dá)時(shí)均不能切割RAG1.1(圖20b)。這是第一次完全重新設(shè)計(jì)歸巢核酸內(nèi)切酶以切割天然存在的序列。這些組合突變體的制得產(chǎn)生了大量的可能性,因?yàn)樗侨鎊LAGLIDADG蛋白的DNA結(jié)合界面的關(guān)鍵步驟。權(quán)利要求1.通過(guò)突變核心結(jié)構(gòu)域的兩個(gè)功能性亞結(jié)構(gòu)域,改造親本LAGLIDADG歸巢核酸內(nèi)切酶得到LAGLIDADG歸巢核酸內(nèi)切酶變體的方法,其至少包括以下步驟(a)構(gòu)建第一變體,其在所述核心結(jié)構(gòu)域的第一功能性亞結(jié)構(gòu)域中具有突變,所述第一功能性亞結(jié)構(gòu)域與所述親本LAGLIDADG歸巢核酸內(nèi)切酶切割位點(diǎn)的一半的第一部分相互作用,所述構(gòu)建通過(guò)以下步驟實(shí)現(xiàn)(a1)用不同的氨基酸替換第一亞結(jié)構(gòu)域的至少一個(gè)氨基酸,所述第一亞結(jié)構(gòu)域?qū)?yīng)位于I-CreI中26至40位的亞結(jié)構(gòu)域,(a2)通過(guò)用不同的核苷酸替換所述半位點(diǎn)第一部分的至少一個(gè)核苷酸來(lái)選擇和/或篩選步驟(a1)的第一變體,其能夠切割來(lái)源于所述親本LAGLIDADG歸巢核酸內(nèi)切酶半位點(diǎn)的第一DNA靶序列,(b)構(gòu)建第二變體,其在所述核心結(jié)構(gòu)域的第二功能性亞結(jié)構(gòu)域中具有突變,所述第二功能性亞結(jié)構(gòu)域與所述親本LAGLIDADG歸巢核酸內(nèi)切酶半位點(diǎn)的第二部分相互作用,所述構(gòu)建通過(guò)以下步驟實(shí)現(xiàn)(b1)用不同的氨基酸替換第二亞結(jié)構(gòu)域的至少一個(gè)氨基酸,所述第二亞結(jié)構(gòu)域?qū)?yīng)位于I-CreI中44至77位的亞結(jié)構(gòu)域,(b2)通過(guò)用不同的核苷酸替換所述半位點(diǎn)第二部分的至少一個(gè)核苷酸來(lái)選擇和/或篩選步驟(b1)的第二變體,其能夠切割來(lái)源于所述親本LAGLIDADG歸巢核酸內(nèi)切酶半位點(diǎn)的第二DNA靶序列,(c)構(gòu)建第三變體,其在所述親本LAGLIDADG歸巢核酸內(nèi)切酶的所述第一和第二功能性亞結(jié)構(gòu)域中具有突變,所述構(gòu)建通過(guò)以下步驟實(shí)現(xiàn)(c1)將步驟(a1)和步驟(b1)的兩個(gè)變體的突變組合在一個(gè)變體中,以及(c2)選擇和/或篩選能切割嵌合DNA靶序列的步驟(c1)的變體,所述嵌合DNA靶序列包含所述第一變體DNA靶標(biāo)半位點(diǎn)的第一部分和所述第二變體DNA靶標(biāo)半位點(diǎn)的第二部分。2.根據(jù)權(quán)利要求1的方法,其中所述親本LAGLIDADG歸巢核酸內(nèi)切酶選自I-Oel,I-5V^I,I畫D附oI,PM"I和PI畫尸/"I。3.根據(jù)權(quán)利要求1或2的方法,其中用選自A、C、D、E、G、H、K、N、P、Q、R、S、T、L、V、W和Y的絲酸替換步驟ai)或)中的氣基酸。4.根據(jù)權(quán)利要求1至3中任一項(xiàng)的方法,其中步驟a2)、b2)和/或C2)在某條件下體內(nèi)進(jìn)行,在此條件下,所述變體產(chǎn)生的突變DNA靼序列中的雙鏈斷裂,通過(guò)所述DNA雙鏈斷裂的重組介導(dǎo)修復(fù)而導(dǎo)致正選擇標(biāo)記或報(bào)告基因的活化,或者負(fù)選擇標(biāo)記或報(bào)告基因的失活。5.根據(jù)權(quán)利要求1至4中任一項(xiàng)的方法,其包括表達(dá)步驟C2)獲得的一個(gè)變體的另外步驟dj,從而允許形成同源二聚體。6.根據(jù)權(quán)利要求1至4中任一項(xiàng)的方法,其包括共表達(dá)步驟C2)獲得的兩個(gè)不同變體的另外步驟d,J,從而允許形成異源二聚體。7.可根據(jù)權(quán)利要求1至6中任一項(xiàng)的方法得到的LAGLIDADG歸巢核酸內(nèi)切酶變體。8.根據(jù)權(quán)利要求7的變體,其為在44、68、70、75和/或77位具有至少一個(gè)第一替換以及在26、28、30、32、33、38和/或40位具有至少一個(gè)第二替換的i-Oel變體。9.根據(jù)權(quán)利要求8的變體,其在44、68和70位具有選自以下的M酸殘基A44/A68/A70,A44/A68/G70,A44/A6鵬0,A44/A68/K70,A44/A68/N70,A44/A68/Q70,A44/A68/R70,A44/A68/S70,A44/A68/T70,A44/D68/H70,A44/D68/K70,A44/D68/R70,A44/G68/H70,A44/G68/K70,A44/G68/N70,A44/G68/P70,A44/G68/R70,A44/H68/A70,A4碼8/G70,A44/H6薩0,A44/H68/K170,A44/H6認(rèn)70,A4頓68/Q70,A44服8/R70,A44/H68/S70,A4德8/T70,A44/K68/A70,A44/K68/G70,A44/K68/H70,A44/K68/K70,A44/K6歸0,A44/K68/Q70,A44/K6面0,A4德8/S70,A44/K68/T70,A4稿8/A0,A44/N68/E70,A44/N68/G70,A44麵8/H70,A44/N68/K70,A44/N68/N70,A44麵/Q70,A44/N68/R70,A44/N68/S70,A44/N68/T70,A44/Q68/A70,A44/Q68/D70,A44/Q68/G70,A44/Q68/H70,A44/Q68/N70,A44/Q68/R70,A44/Q68/S70,A44/R6薦0,A44歸/D70,A44/R諫70,A44細(xì)/G70,A44/R68/H70,A44/R6面0,A44/R68/L70,A44/R68/N70,A44麵/R70,A44/R68/S70,A44/R68/T70,A44/S68/A70,A44/S68/G70,A44/S68/K70,A4橋瞎0,A44/S68/Q70,A44膽/R70,A44編/S70,A44/S68/T70,A44脂/A70,A44/T68/G70,A44謂/H70,A44/T68/K70,A4輕謝70,A44/T68/Q70,A44/T68/R70,A44/T68/S70,A44/T68/T70,D44/D68/H70,D4頓68/S70,D44/R68/A70,D44雄/K70,D44/R68/N70,D44/R68/Q70,D44鍵/R70,D44/R68/S70,D44雄/T70,E44/H68/H70,E44/R68/A70,E44/R68/H70,E44/R6薩0,E44雄/S70,E44/R68/T70,E44/S68/T70,G44/H68/K70,G44/Q6蘭0,G44/R闊70,G44/R6窗0,G44/T68/D70,G44脂/P70,G44腦/線H44/A纖70,H44/A68/T70,H4德8/A70,H44廳/D70,H44/R68/E70,H44雄/G70,H44/R68/N70,H44廳/R70,簡(jiǎn)/R68/S70,H44/R68/丁70,H44/S68/G70,H44纖/S70,H4德8/T70,H44/T6認(rèn)0,H44/T68/T70,K44/A68/A70,K44/A6,0,K44/A68/E70,K44/A68/G70,K44/A6薩0,K44/A68/N70,K44/A68/Q70,K44/A68/S70,K44/A68/T70,K44/D68/A70,K44線8/T70,K44/JE68/G70,K44鏡/N70,K4幅8/S70,K44/G68/A70,K44/G68/G70,K44/G6,70,K44/G68/S70,K44/G68/T70,K44/H68歸,K44服8/E70,K44服8/G70,K4德8/N70,K44服8/S70,K44服8/T70,K44/K68/A70,K44/K68/D70,K44/K68/H70,K44/K68/T70,K44/N68/A70,K44/N68/D70,K44/N68/E70,K44畫/G70,K44/N68/H70,K44/N6,70,K4頓闊70,K44/N68/S70,K44觸/T70,K4橋8/H70,K44/Q6薦0,K44/Q68/D70,K44/Q68織,K44/Q68/S70,K44/Q68/T70,K44/R68/線K44雌/D70,K44/R68/E70,K44/R68/G70,K44/R68/H70,K44/R68/N70,K44細(xì)/Q70,K44/R68/S70,K44歸/T70,K44/S68/A70,K44/S68/D70,K4楊8/H70,K44/S68/N70,K4德8/S70,<table>tableseeoriginaldocumentpage0</column></row><table>T44/R68/S70,T44/R68/T70,T44/S68/K70,T44/S68/R70,T44/T68/K70和T44/T68/R70。10.根據(jù)權(quán)利要求8或9的變體,其在28、30、33、38和40位分別具有選自以下的氨基酸QNYKR,RNKRQ,QNRRR,QNYKK,QKTQK,QNRKK,KNTQR,SNRSR,NNYQR,KNTRQ,KNSRE,QNNQK,SNYRK,KNSRD,KNRER,KNSRS,RNRDR,扁QR,QNYRK,QNKKT,RNAYQ,KNRQE,NNSRK,麗SRR,QNYQK,QNYQKSNRQR,QNRQK,BNRJRK,KNNQA,SNYQK,TNRQR,QNTQR,KNRTQ,KNRTR,QNEDH,RNYNA,QNYTR,RNTRA,HNYDS,QNYRA,QNYAR,SNQAA,QNYEK,TNNQR,QNYRS,KNRQR,QNRAR,QNNQR,RNRER,KNRA&KNTAA,KNRKA,RNAKS,KNRNA,TNESD,KNNQD,KNRYQ,KNYQN,KNRSS,KNRYA,ANNRK,KNRAT,KNRNQ,TNTQR,KNRQY,QNSRK,RNYQS,QNRQR,KNRAQ,ANRQR,KNRQQ,KNRQA,KN丁AS,KAHRS,KHHRS,KDNHS,KESRS,KHTPS,KGHYS,KARQS,KSRGS,KSHHS,KNHRS,KRRES,KDGHS,KRHGS,KANQS,KDHKS,KKHRS,KQNQS,KQTQS,KGRQS,KRPGS,KRGNS,KNAQS,KNHNS,KHHAS,KRGSS,KSRQS,KTDHS,KHHQS,KA腦'KSHRS,KNRAS,KSHQS,KDAHS,KNHES,KDRTS,KDRSS,KAHQS,KRGTS,KNHSS,KQHQS,KNHGS,KNNQS,KNDQS,KDRGS,KNHAS,KHMAS,KSSHS,KGVAS,KSVQS,KDVHS,RDVQS,KGVQS,KGVTS,KGVHS'KGVRS,KGVGS,RAVGS,RDVRS,RNVQS和NTVDS。11.根據(jù)權(quán)利要求8至10中任一項(xiàng)的變體,其還包含75位天冬氨酸變?yōu)椴粠щ姾砂被岬耐蛔儭?2.根據(jù)權(quán)利要求ll的變體,其中所述不帶電荷氨基酸為天冬酰胺或翔氨酸。13.根據(jù)權(quán)利要求8至12中任一項(xiàng)的變體,其切割包含下式序列的嵌合DNA乾才示c-iin-ion-9n-8m.7y-6rL5rMiL3k-2y-ir+im+2n+3n+4n+5rwk+7n+8n+9iiHog+1!(I),其中n是a、t、c或g,m是a或c,y是c或t,k是g或t,r是a或g(SEQIDNO:2),糾是當(dāng)n.10n_9n_8是aaa且n-5n-4n-3是gtc時(shí),則不是ttt并且n+3ii+4ri+5不是gac,以及當(dāng)n+8n+9n+10是ttt且11+311+411+5是gac時(shí),貝'Jn.10iL9n_8不是aaa并且n_5n-4n-3不是gtc。14.根據(jù)權(quán)利要求13的變體,其在44位是谷氨酰胺(Q),以切割n_4是t或者n+4是a的嵌合DNA靶標(biāo)。15.根據(jù)權(quán)利要求13的變體,其在44位是丙氨酸(A)或天冬酰胺,以切割n.4是a或者n+4是t的嵌合DNA乾標(biāo)。16.根據(jù)權(quán)利要求13的變體,其在44位是賴氨酸(K),以切割iu是c或者n+4是g的嵌合DNA靶標(biāo)。17.根據(jù)權(quán)利要求13的變體,其在38位是精氨酸(R)或賴氨酸(K),以切割n力是g或者11+9是c的嵌合DNA靶標(biāo)。18.根據(jù)權(quán)利要求13至17中任一項(xiàng)的變體,其中所述嵌合DNA靶標(biāo)包合逸自以下的-10至-8位核苷酸三聯(lián)體aac,aag,aat,acc,acg,act,aga,agc,agg,agt,ata,atg,cag,cga,cgg,ctg,gac,gag,gat,gaa,gcc,gga,ggc,ggg,ggt,gta,gtg,gtt>tac,tag,tat,taa,tcc'tga,tgc,tgg,tgt或ttg,和/或包含是所述_10至_8位核普酸三聯(lián)體的反向互補(bǔ)序列的+8至+10位核苷酸三聯(lián)體。19.根據(jù)權(quán)利要求7的變體,其為具有至少兩個(gè)替換的I-M仰I變體,其中每個(gè)替換分別位于I-3f仰I的30至43位和47至75位的兩個(gè)亞結(jié)構(gòu)域之一中。20.根據(jù)權(quán)利要求7至19中任一項(xiàng)的變體,其為同源二聚體。21.根據(jù)權(quán)利要求7至19中任一項(xiàng)的變體,其為包含兩個(gè)不同變體的異源二聚體。22.—種單鏈嵌合核酸內(nèi)切酶,其包含來(lái)自權(quán)利要求7至19任一項(xiàng)中所定義變體的單體與來(lái)自LAGLIDADG歸巢核酸內(nèi)切酶或其功能性變體的單體或結(jié)構(gòu)域的融合。23.多核苷酸片段,其編碼權(quán)利要求7至21中任一項(xiàng)的變體或者來(lái)源于權(quán)利要求21所述變體的單鏈嵌合核酸內(nèi)切酶。24.多核苷酸片段,其編碼權(quán)利要求7至21中任一項(xiàng)的變體的核心結(jié)構(gòu)域。25.重組載體,其包含至少一個(gè)根據(jù)權(quán)利要求23或24的多核苷酸片段。26.根據(jù)權(quán)利要求25的重組載體,其包含多核苷酸片段,所述多核普酸片段編碼權(quán)利要求20所定義同源二聚體的單體或者權(quán)利要求21或22所定義單體或單鏈核酸內(nèi)切酶的兩個(gè)結(jié)構(gòu)域。27.根據(jù)權(quán)利要求26的重組載體,其包含兩個(gè)不同的多核苷酸片段,其中每個(gè)片段編碼權(quán)利要求21中所定義的異源二聚體的一個(gè)單體。28.根據(jù)權(quán)利要求25至27中任一項(xiàng)的重組載體,其包含靶向構(gòu)建體,所述靶向構(gòu)建體包含與權(quán)利要求l、12-17之中任一項(xiàng)所定義的嵌合DNA靶序列附近的區(qū)域具有同源性的序列。29.根據(jù)權(quán)利要求26的重組載體,其中所述靶向構(gòu)建體包含a)與權(quán)利要求1、13-18之中任一項(xiàng)所定義的嵌合DNA耙序列附近的區(qū)域具有同源性的序列,以及b)其側(cè)翼為a)中序列的待引Ajf列。30.宿主細(xì)胞,其包含一種或兩種權(quán)利要求23至27中任一項(xiàng)所定義的多核苷酸片段或者根據(jù)權(quán)利要求25至29中任一項(xiàng)的載體。31.非人轉(zhuǎn)基因動(dòng)物,其包含一種或兩種權(quán)利要求23至27中任一項(xiàng)所定義的多核苷酸片段。32.轉(zhuǎn)基因植物,其包含一種或兩種權(quán)利要求23至27中任一項(xiàng)所定義的多核苷酸片段。33.以下至少一項(xiàng)在分子生物學(xué)、體內(nèi)或體外遺傳工程以及體內(nèi)或體外基因組工程上的用途根據(jù)權(quán)利要求7至21中任一項(xiàng)的變體、根據(jù)權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶、一種或兩種權(quán)利要求23至27中任一項(xiàng)所定義的多核苷酸片段、根據(jù)權(quán)利要求25至29中任一項(xiàng)的載體、根據(jù)權(quán)利要求30的宿主細(xì)胞、根據(jù)權(quán)利要求32的轉(zhuǎn)基因植物、根據(jù)權(quán)利要求31的非人轉(zhuǎn)基因哺乳動(dòng)物。34.根據(jù)權(quán)利要求33的用途,其用于在包含被所述變體切割的嵌合DNA乾序列的目的位點(diǎn)誘導(dǎo)雙鏈核酸斷裂,從而誘導(dǎo)DNA重組事件、DNA丟失或細(xì)胞死亡。35.根據(jù)權(quán)利要求33或34的用途,其中所述雙鏈核酸斷裂用于修復(fù)特定的序列、修飾特定的序列、恢復(fù)被突變基因所替換的功能基因、削弱或激活目的內(nèi)源基因、將突變引入目的位點(diǎn)、引入外源基因或其部分、失活或檢測(cè)內(nèi)源基因或其部分、使染色體臂易位或者使DNA不被修復(fù)并被降解。36.根據(jù)權(quán)利要求33至35中任一項(xiàng)的用途,其中所述變體、多核苷酸、載體、細(xì)胞、轉(zhuǎn)基因植物或者非人轉(zhuǎn)基因哺乳動(dòng)物與權(quán)利要求28或29中所定義的靼向DNA構(gòu)建體相關(guān)聯(lián)。37.—種遺傳工程方法,其包括以下步驟通過(guò)將包含權(quán)利要求1、13-18之中任一項(xiàng)所定義嵌合DNA靶標(biāo)的載體與權(quán)利要求7至21中任一項(xiàng)所定義的變體或者根據(jù)權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶相接觸而在所述載體上的目的位點(diǎn)斷裂雙鏈核酸,從而誘導(dǎo)與另一載體的同源重組,所述另一載體與所述異源二聚大范圍核酸酶的切割位點(diǎn)附近的序列具有同源性。38.—種基因組工程方法,其包括以下步驟l)通過(guò)將權(quán)利要求l、13-18之中任一項(xiàng)所定義的嵌合DNA耙標(biāo)與根據(jù)權(quán)利要求7至21中任一項(xiàng)的變體或者根據(jù)權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶接觸,從而使包含所述嵌合DNA耙標(biāo)的基因座發(fā)生雙鏈斷裂;2)在適于與耙向DNA構(gòu)建體發(fā)生同源重組的M下維持所述斷裂的基因座,所述靶向DNA構(gòu)建體包含待引入所逸基因座的序列,所述序列的側(cè)翼是與所述乾標(biāo)基因座具有同源性的序列。39.—種基因組工程方法,其包括以下步驟l)通過(guò)將權(quán)利要求l、13-18之中任一項(xiàng)所定義的至少一種嵌合DNA耙標(biāo)與權(quán)利要求7至21中任一項(xiàng)所定義的變體或者根據(jù)權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶接觸,從而使包含所述嵌合DNA靶標(biāo)的基因座發(fā)生雙鏈斷裂;2)在適于與染色體DNA發(fā)生同源重組的條件下維持所述斷裂的基因座,所述染色體DNA與所述靼標(biāo)基因座附近的區(qū)域具有同源性。40.組合物,其至少包含一種根據(jù)權(quán)利要求7至21中任一項(xiàng)的變體、一種根據(jù)權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶、一種或兩種權(quán)利要求23至27中任一項(xiàng)所定義的多核苷酸片段、或者根據(jù)權(quán)利要求25至29中任一項(xiàng)的載體。41.根據(jù)權(quán)利要求40的組合物,其還包含耙向DNA構(gòu)建體,所述耙向DNA構(gòu)建體包舍修復(fù)目的位點(diǎn)的序列,所述序列的側(cè)翼是與所述耙標(biāo)基因座具有同源性的序列。42.下列項(xiàng)用于制備在有此需要的個(gè)體中預(yù)防、改善或治療遺傳病的藥劑的用途至少一種根據(jù)權(quán)利要求7至21中任一項(xiàng)的變體、一種根據(jù)權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶、一種或兩種權(quán)利要求23至27中任一項(xiàng)所定義的多核苷酸片段、根據(jù)權(quán)利要求25至29任一項(xiàng)的載體,所述藥劑以任意方式施用給所述個(gè)體。43.下列項(xiàng)用于制備藥劑的用途,所述藥劑在有此需要的個(gè)體中預(yù)防、改善或治療由帶有DNA中介物的傳染原引起的疾病至少一種權(quán)利要求7至21任一項(xiàng)的變體、一種權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶、一種或兩種權(quán)利要求23至27任一項(xiàng)所定義的多核苷酸片段、權(quán)利要求25至29中任一項(xiàng)的載體,所述藥劑以任意方式施用給所述個(gè)體。44.下列項(xiàng)于體外在生物來(lái)源的產(chǎn)品或用于生物學(xué)用途的產(chǎn)品中用于抑制帶有DNA中介物的傳染原增殖、4吏其失活或消除的用途,或者用于對(duì)物體消毒的用途至少一種權(quán)利要求7至21中任一項(xiàng)的變體、一種根據(jù)權(quán)利要求22的單鏈嵌合核酸內(nèi)切酶、一種或兩種權(quán)利要求23至27中任一項(xiàng)所定義的多核苷酸片段、根據(jù)權(quán)利要求25至29中任一項(xiàng)的載體。45.根據(jù)權(quán)利要求43或44的用途,其中所述傳染原是病毒。全文摘要LAGLIDADG歸巢核酸內(nèi)切酶變體,其在兩個(gè)單獨(dú)的亞結(jié)構(gòu)域中具有突變,其中每個(gè)亞結(jié)構(gòu)域與經(jīng)修飾的DNA靶標(biāo)半位點(diǎn)的不同部分結(jié)合,所述LAGLIDADG歸巢核酸內(nèi)切酶變體能夠切割包含與每個(gè)亞結(jié)構(gòu)域結(jié)合的核苷酸的嵌合DNA靶序列。所述異源二聚大范圍核酸酶及其衍生產(chǎn)物用于遺傳工程、基因組治療和抗病毒治療的用途。文檔編號(hào)C12N15/10GK101310015SQ200680039566公開(kāi)日2008年11月19日申請(qǐng)日期2006年10月3日優(yōu)先權(quán)日2005年10月25日發(fā)明者弗雷德里克·帕克申請(qǐng)人:賽萊克蒂斯公司