專(zhuān)利名稱:優(yōu)化的內(nèi)切核酸酶及其用途的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及優(yōu)化的內(nèi)切核酸酶,以及使用優(yōu)化的內(nèi)切核酸酶對(duì)多核苷酸進(jìn)行靶向整合、靶向缺失或靶向突變的方法。
背景技術(shù):
基因組改造(genome engineering)是概括用于在基因組內(nèi)插入、缺失、取代或操縱特定遺傳序列的不同技術(shù)的通用術(shù)語(yǔ),其具有大量的治療應(yīng)用和生物技術(shù)應(yīng)用。所有基因組改造技術(shù)或多或少都使用重組酶、整合酶或內(nèi)切核酸酶,用于在預(yù)定位點(diǎn)制造DNA雙鏈斷裂,以促進(jìn)同源重組。盡管已利用了大量的方法來(lái)制造DNA雙鏈斷裂,開(kāi)發(fā)在基因組中于高度特異性位點(diǎn)制造DNA雙鏈斷裂的有效方法仍是基因療法、農(nóng)業(yè)技術(shù)和合成生物學(xué)中的主要目標(biāo)。 實(shí)現(xiàn)該目標(biāo)的ー種手段是使用對(duì)下述序列具有特異性的核酸酶,所述序列足夠大到僅存在于基因組內(nèi)的單個(gè)位點(diǎn)。識(shí)別此類(lèi)大約15至30個(gè)核苷酸的大DNA序列的核酸酶因此被稱為“大范圍核酸酶”或“歸巢(homing)內(nèi)切核酸酶”,并常與寄生性(parasitic)或自私的(selfish)DNA元件相關(guān)聯(lián),所述元件例如常發(fā)現(xiàn)于植物和真菌基因組中的組I自剪接內(nèi)含子和內(nèi)含肽。大范圍核酸酶通常被分組為四個(gè)家族LAGLIDADG家族、GIY-YIG家族、His-Cys盒家族和HNH家族。這些家族的特征在于影響催化活性和它們的DNA識(shí)別序列的序列的結(jié)構(gòu)基序。來(lái)自LAGLIDADG家族的天然大范圍核酸酶已被用于在昆蟲(chóng)和哺乳動(dòng)物細(xì)胞培養(yǎng)物以及很多生物(例如植物、酵母或小鼠)中有效促進(jìn)位點(diǎn)特異性基因組修飾,但是該手段已局限于對(duì)DNA識(shí)別序列保守的同源基因的修飾或已向其中引入了識(shí)別序列的預(yù)改造(preengineered)基因組的修飾。為避免此類(lèi)局限以及為促進(jìn)DNA雙鏈斷裂激發(fā)的基因修飾的系統(tǒng)性(systematic)執(zhí)行,已經(jīng)制造了新的核酸酶類(lèi)型。ー種新核酸酶類(lèi)型由人工組合的非特異性核酸酶和高度特異性DNA結(jié)合結(jié)構(gòu)域構(gòu)成。已使用FokI限制性酶的非特異性核酸酶結(jié)構(gòu)域和經(jīng)改造的鋅指DNA結(jié)合結(jié)構(gòu)域之間的嵌合融合體,在多種生物中展現(xiàn)了該策略的有效性(例如W003/089452)。該手段的一種變化是使用作為DNA結(jié)合結(jié)構(gòu)域的大范圍核酸酶的失活變體與非特異性核酸酶(例如FokI)融合的,例如 Lippow 等人,“Creation of a type IIS restriction endonucleasewith a long recognition sequence”,Nucleic Acid Research(2009), Vol. 37,No. 9,3061至3073頁(yè)所公開(kāi)的。一種備選手段是對(duì)天然大范圍核酸酶進(jìn)行遺傳改造,以定制其與基因組中存在的位點(diǎn)結(jié)合的DNA結(jié)合區(qū)域,由此制造具有新特異性的經(jīng)改造的大范圍核酸酶(例如W007093918、W02008/093249、W009114321)。但是,已針對(duì)DNA切割特異性改造過(guò)的很多大范圍核酸酶相對(duì)于其所來(lái)源的天然存在的大范圍核酸酶而言具有減少的切割活性(US2010/0071083)。大多數(shù)的大范圍核酸酶還作用于與其最優(yōu)結(jié)合位點(diǎn)相似的序列上,這可能導(dǎo)致非意圖性的或者甚至有害的脫靶作用。已采取了若干手段,以增強(qiáng)大范圍核酸酶誘導(dǎo)的同源重組的效率,例如通過(guò)將核酸酶與大鼠糖皮質(zhì)激素受體的配體結(jié)合結(jié)構(gòu)域融合,以通過(guò)添加地塞米松或相似化合物促進(jìn)或者甚至誘導(dǎo)該經(jīng)修飾的核酸酶運(yùn)送至細(xì)胞核以及由此運(yùn)送至其靶向位點(diǎn)(W02007/135022)。盡管如此,本領(lǐng)域仍需要開(kāi)發(fā)具有對(duì)同源重組有高誘導(dǎo)效率和/或針對(duì)其結(jié)合位點(diǎn)有高特異性的大范圍核酸酶,由此限制脫靶作用的風(fēng)險(xiǎn)。發(fā)明簡(jiǎn)述本發(fā)明提供了 LAGLIDADG內(nèi)切核酸酶家族的優(yōu)化版本的內(nèi)切核酸酶。特別是包括與SEQ ID N0:l、15、16、17或19所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列的優(yōu)化的內(nèi)切核酸酶。在本發(fā)明的一個(gè)實(shí)施方案中,優(yōu)化的內(nèi)切核酸酶是野生型或經(jīng)改造版本的I-SceI,如SEQ ID NO : I所述,或其一種在氨基酸水平具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 序列同一,注的同源物,具有一種或多種選自以下的突變a)I-Scel_l,I-Scel-2,I-Scel-3,I-Scel-4,I-Scel-5, I-Scel-6, I-Scel-7, I-Scel-8 和 I-Scel-9 ;b)S229K, S229A, S229P, S229G,S229E, S229Q, S229D, S229N, S229C, S229Y, S229T, M203K, M203H, M203R, Q77K, Q77H, Q77R, E130K, E130H, E130R, Y199K, Y199H 和 Y199R ;c)在其氨基酸序列的起始甲硫氨酸之后的甲硫氨酸、纈氨酸、甘氨酸、蘇氨酸、絲氨酸、丙氨酸、半胱氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、異亮氨酸或組氨酸;或d)選自上述a)和b)、a)和c)、b)和c)或a)、b)和c)的一個(gè)或多個(gè)突變的組
ム
ロ ο在一個(gè)實(shí)施方案中,優(yōu)化的內(nèi)切核酸酶包括SEQ ID NO :2、3或5所描述的氨基酸序列。在本發(fā)明的另ー個(gè)實(shí)施方案中,優(yōu)化的內(nèi)切核酸酶是經(jīng)改造的內(nèi)切核酸酶版本,其包含與SEQ ID NO: I、15、16、17或19所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列。在另ー個(gè)實(shí)施方案中,本發(fā)明提供了與SEQ ID NO :I所描述的多肽具有至少80%的氨基酸序列同一性的內(nèi)切核酸酶,或與SEQ ID NO :1所描述的多肽具有至少80%的氨基酸序列同一性的經(jīng)改造的內(nèi)切核酸酶版本,其中通過(guò)刪除或突變氨基酸序列TISSETFLK的任一個(gè)氨基酸,去除了氨基酸序列TISSETFLK。本發(fā)明的另ー個(gè)優(yōu)選的實(shí)施方案是權(quán)利要求I至4的任一項(xiàng)所述的優(yōu)化的內(nèi)切核酸酶,其包含與SEQ ID NO :1或2所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列,且包含SE9 ID NO :I的絲氨酸Nr229的突變。在本發(fā)明的另ー個(gè)實(shí)施方案中,優(yōu)化的內(nèi)切核酸酶與至少ー個(gè)鋅指結(jié)構(gòu)域,或與源自轉(zhuǎn)錄激活物-樣(TAL)效應(yīng)子的至少ー個(gè)重復(fù)單元,或與至少ー個(gè)鋅指結(jié)構(gòu)域和源自轉(zhuǎn)錄激活物-樣(TAL)效應(yīng)子的至少ー個(gè)重復(fù)單元融合。優(yōu)選的,優(yōu)化的內(nèi)切核酸酶包括SecIII或SecIV分泌信號(hào)。本發(fā)明還提供了包含多核苷酸序列的經(jīng)分離的多核苷酸,所述多核苷酸序列編碼優(yōu)化的內(nèi)切核酸酶。優(yōu)選地,這ー多核苷酸是經(jīng)密碼子優(yōu)化的,或具有低含量的DNA不穩(wěn)定性基序(motives),或具有低含量的密碼子重復(fù),或具有低含量的隱蔽剪接位點(diǎn),或具有低含量的備選起始密碼子,具有低含量的限制性位點(diǎn),或具有低含量的RNA ニ級(jí)結(jié)構(gòu),或具有上述這些特征的任何組合。本發(fā)明的另ー實(shí)施方式是表達(dá)盒,所述表達(dá)盒包含與啟動(dòng)子和終止子序列功能性組合的、如上文所述的經(jīng)分離的多核苷酸。本發(fā)明的其他實(shí)施方案是下述載體、宿主細(xì)胞或非人生物,它們包含編碼優(yōu)化的內(nèi)切核酸酶的多核苷酸,或編碼優(yōu)化的內(nèi)切核酸酶的經(jīng)分離的多核苷酸,或含有編碼優(yōu)化的內(nèi)切核酸酶的多核苷酸的表達(dá)盒,以及包含上述內(nèi)切核酸酶、多核苷酸和表達(dá)盒的組合的載體、宿主細(xì)胞或非人生物。優(yōu)選地,非人生物是植物。本發(fā)明提供了使用本文所述的內(nèi)切核酸酶誘導(dǎo)同源重組或末端連接事件的方法。優(yōu)選地,在用于序列切除的靶向整合的方法中。優(yōu)選地,被切除的序列是標(biāo)記基因。本發(fā)明進(jìn)ー步提供了用于同源重組多核苷酸的方法,包括下列步驟a)提供用于同源重組的感受態(tài)細(xì)胞,b)提供下述多核苷酸,所述多核苷酸包含側(cè)翼有序列A和序列B的經(jīng)優(yōu)化的內(nèi)切核酸酶的DNA識(shí)別位點(diǎn),c)提供包含序列A’和B’的多核苷酸,所述序列A’和B’足夠長(zhǎng)并且與序列A和序列B足夠同源,從而允許在所述細(xì)胞中同源重組,以及d)提供本文所述的優(yōu)化的內(nèi)切核酸酶或本文所述的表達(dá)盒,e)在所述細(xì)胞中組合b)、c)和d),以及f)檢測(cè)b)和c)的重組多核苷酸,或選擇出包含b)和c)的重組多核苷酸的細(xì)胞,或使包含b)和c)的重組多核苷酸的細(xì)胞生長(zhǎng)。優(yōu)選地,用于多核苷酸同源重組的方法導(dǎo)致同源重組,其中,步驟a)的感受態(tài)細(xì)胞中包含的多核苷酸序列從步驟f)的生長(zhǎng)細(xì)胞的基因組中缺失。 本發(fā)明的另一方法是用于靶向突變的方法,所述方法包括下述步驟a)提供包含下述多核苷酸的細(xì)胞,所述多核苷酸包含優(yōu)化的內(nèi)切核酸酶的DNA識(shí)別位點(diǎn),b)提供能切割步驟a)的所述DNA識(shí)別位點(diǎn)的、如權(quán)利要求I至7中任意一項(xiàng)所述的經(jīng)優(yōu)化的內(nèi)切核酸酶或權(quán)利要求10所述的表達(dá)盒,c)在所述細(xì)胞中組合a)和b),以及d)檢測(cè)經(jīng)突變的多核苷酸,或針對(duì)包含經(jīng)突變的多核苷酸的細(xì)胞加以選擇并且生長(zhǎng)所述細(xì)胞。在本發(fā)明的另ー優(yōu)選的實(shí)施方式中,上文所述的方法包括下述步驟,其中優(yōu)化的內(nèi)切核酸酶和DNA識(shí)別位點(diǎn)組合于至少ー種細(xì)胞中,這通過(guò)生物的雜交、通過(guò)轉(zhuǎn)化或通過(guò)經(jīng)由融合至經(jīng)優(yōu)化內(nèi)切核酸酶的SecIII或SecIV肽介導(dǎo)的運(yùn)送來(lái)實(shí)現(xiàn)。附圖
簡(jiǎn)述圖I顯示了同源重組頻率的比較,這是通過(guò)在三種不同的I-SceI變體誘導(dǎo)重組后,β-葡糖醛酸糖苷酶活性的重建藍(lán)色幼苗)來(lái)測(cè)量的。每個(gè)I-SceI變體都在5株攜帶了測(cè)試構(gòu)建體的不同植物株系中測(cè)試。對(duì)于每個(gè)組合,分析96株幼苗的Τ2代的β-葡糖醛酸糖苷酶活性(“ I-SceI ”,具有SEQ ID NO :1所述的氨基酸序列;"I-SceI c-term mod”具有SEQ ID NO 3所述的氨基酸序列;“NLS I-SceI c-term mod”具有SEQ ID NO :5所述的氨基酸序列),還參見(jiàn)實(shí)施例10b。圖2描述了不同的I-SceI同源物的序列比對(duì),其中I是SEQ ID N0:l,2是SEQ IDNO: 15,3 是 SEQ ID NO: 16,4 是 SEQ ID NO : 17,5 是 SEQID NO: 18。發(fā)明詳述本發(fā)明提供了優(yōu)化的內(nèi)切核酸酶,其可以用作備選的誘導(dǎo)DNA雙鏈斷裂的酶。本發(fā)明還提供了使用這些優(yōu)化的內(nèi)切核酸酶的方法。優(yōu)化的內(nèi)切核酸酶是I-Sce-I(SEQ ID NO 1所述)的變體,以及I-Sce-I的同源物,所述同源物在氨基酸水平具有至少55 %、58 %、60 %、70 %、80 %、85 %、90 %、92 %、93%、94%、95%、96%、97%、98%或99%序列同一性。優(yōu)化的I-SceI版本也被稱為優(yōu)化的I-SceI。I-SceI內(nèi)切核酸酶的同源物可克隆自其它生物,或可通過(guò)對(duì)LAGLIDADG內(nèi)切核酸酶加以突變來(lái)制造,例如通過(guò)替代、添加或缺失給定的LAGLIDADG內(nèi)切核酸酶的氨基酸序列中的氨基酸來(lái)進(jìn)行。例如,可向LAGLIDADG內(nèi)切核酸酶的氨基酸序列添加核定位信號(hào)和/或改變其序列的一個(gè)或多個(gè)氨基酸和/或缺失其序列的部分,例如,其N(xiāo)-末端的部分或C-末端的部分。表I =I-SceI的示例性同源物(可克隆自其它生物)描述在表I中;
·
Oui-Prot登生物SEQID 與I-SeeI的I基酸序列同
錄號(hào)NO;一性
A7LCPI釀酒酵母(& eerevM )IWO
Q36760釀酒酵母1598
063264二孢接合酵母 U. blsporm)1672
Q34839耐熱克魯維酵母([i/wmcuto/mww》1771
Q34807加拿大畢赤酵母(P. canadensis)18S8可用于本發(fā)明的LAGLIDADG內(nèi)切核酸酶可在藻類(lèi)、真菌、酵母、原生動(dòng)物、葉綠體、線粒體、細(xì)菌和古細(xì)菌的基因組中發(fā)現(xiàn)。LAGLIDADG內(nèi)切核酸酶包含至少一個(gè)保守的LAGLIDADG基序。LAGLIDADG基序的名稱基于出現(xiàn)于所有LAGLIDADG內(nèi)切核酸酶中的特征性氨基酸序列。術(shù)語(yǔ)LAGLIDADG是該氨基酸序列根據(jù)STANDARD ST. 25( S卩,PCIPI執(zhí)行協(xié)調(diào)委員會(huì)(PCIPI Executive Coordination Committee)針對(duì)專(zhuān)利申請(qǐng)中呈現(xiàn)的核苷酸和氨基酸序列表所采用的標(biāo)準(zhǔn))中所述的單字母編碼的首字母縮寫(xiě)。但是,LAGLIDADG基序并非在所有LAGLIDADG內(nèi)切核酸酶中完全保守(見(jiàn)例如 Chevalier 等人(2001), Nucleic Acids Res. 29(18) :3757 至 3774,或 Dalgaard 等人(1997),Nucleic Acids Res. 25(22) :4626 至 4638),從而一些 LAGLIDADG 內(nèi)切核酸酶在它們的LAGLIDADG基序中包含一個(gè)或數(shù)個(gè)氨基酸改變。包含僅一個(gè)LAGLIDADG基序的LAGLIDADG內(nèi)切核酸酶通常作為同源或異源二聚體發(fā)揮作用。包含兩個(gè)LAGLIDADG基序的LAGLIDADG內(nèi)切核酸酶作為單體發(fā)揮作用,并且通常包含偽二聚體結(jié)構(gòu)。LAGLIDADG內(nèi)切核酸酶可分離自表I中作為例子提到的生物的多核苷酸,或通過(guò)本領(lǐng)域已知的技術(shù)從頭合成,例如使用本領(lǐng)域技術(shù)人員已知的公眾數(shù)據(jù)庫(kù)中可獲得的序列信息來(lái)進(jìn)行,所述數(shù)據(jù)庫(kù)例如 Genbank (Benson (2010)), Nucleic Acids Res 38 :D46_51 或Swissprot(Boeckmann(2003), Nucleic Acids Res 31 :365-70)。可在針對(duì)蛋白質(zhì)家族的PFAM-數(shù)據(jù)庫(kù)中發(fā)現(xiàn)LAGLIDADG內(nèi)切核酸酶的集合。PFAM-數(shù)據(jù)庫(kù)檢錄號(hào)PR)0961描述了 LAGLIDADG I蛋白質(zhì)家族,其包含約800條蛋白序列。PFAM-數(shù)據(jù)庫(kù)檢錄號(hào)PF03161描述了 LAGLIDADG 2蛋白質(zhì)家族的成員,其包含約150條蛋白序列??稍贗nterPro數(shù)據(jù)庫(kù)中找到LAGLIDADG內(nèi)切核酸酶的一個(gè)備選集合,例如,InterPro檢錄號(hào) IPR004860。產(chǎn)生LAGLIDADG內(nèi)切核酸酶的同源物的另一種方法是突變LAGLIDADG內(nèi)切核酸酶的氨基酸序列,從而修飾它的DNA結(jié)合親和力、它的二聚體形成親和力或改變它的DNA識(shí)別序列。LAGLIDADG內(nèi)切核酸酶的蛋白質(zhì)結(jié)構(gòu)確定以及同源物的序列比對(duì)允許涉及下述可以改變的氨基酸的理性的選擇,所述氨基酸的改變影響它的DNA結(jié)合親和力、它的酶活性或改變它的DNA識(shí)別序列。在本文中使用時(shí),術(shù)語(yǔ)“DNA結(jié)合親和性”表示大范圍核酸酶或LAGLIDADG內(nèi)切核酸酶與參照DNA分子(例如DNA識(shí)別序列或任意序列)非共價(jià)聯(lián)結(jié)的趨勢(shì)。結(jié)合親和性是通過(guò)解離常數(shù)Kd (例如,I-SceI針對(duì)WT DNA識(shí)別序列的Kd為大約O. InM)測(cè)量的。在本文中使用時(shí),如果相對(duì)于參照大范圍核酸酶或LAGLIDADG內(nèi)切核酸酶而言,重組大范圍核酸酶針對(duì)參照DNA識(shí)別序列的Kd增加或減少統(tǒng)計(jì)上顯著(P < O. 05)的量,那么大范圍核酸酶則具有“變動(dòng)的”結(jié)合親和性。在本文中使用時(shí),術(shù)語(yǔ)“酶活性”指大范圍核酸酶(例如LAGLIDADG內(nèi)切核酸酶)切割特定DNA識(shí)別序列的速率。此類(lèi)活性是可測(cè)量的酶促反應(yīng),所述反應(yīng)涉及對(duì)雙鏈DNA的磷酸二酯鍵的水解。作用于特定DNA底物上的大范圍磷酸酶的活性受大范圍核酸酶對(duì)該 特定DNA底物的親和性(affinity)或親合力(avidity)的影響,這又進(jìn)而受與DNA的序列特異性相互作用和非序列特異性相互作用的影響。可通過(guò)缺失核酸酶氨基酸序列中的50、40、30、20、10、9、8、7、6、5、4、3、2或I個(gè)氨
基酸對(duì)核酸酶進(jìn)行優(yōu)化,而不破壞其內(nèi)切核酸酶活性。例如,當(dāng)LAGLIDADG內(nèi)切核酸酶的氨基酸序列中的部分被缺失的情況下,保留上文所述的LAGLIDADG內(nèi)切核酸酶基序則是重要的。優(yōu)選地,缺失PEST序列或其它失穩(wěn)(destabilizing)基序,例如KEN-框、D-框和A-框。還可通過(guò)引入單個(gè)氨基酸改變,例如向PEST序列中引入帶正電荷的氨基酸(精氨酸、組氨酸和賴氨酸),來(lái)破壞這些基序。經(jīng)過(guò)突變而修飾了它的DNA結(jié)合親和性或改變了它的DNA識(shí)別位點(diǎn)的LAGLIDADG內(nèi)切核酸酶被稱為經(jīng)改造的內(nèi)切核酸酶。可以像其他LAGLIDADG內(nèi)切核酸酶一樣,改造I-Sce I及其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的I-Sce I同源物,從而改變它的DNA結(jié)合親和力、它的酶活性或改變它的DNA識(shí)別序列。經(jīng)過(guò)改造的I-SceI和I-Sce I同源物版本在氨基酸水平上具有至少55 %、58 %、60 %、70 %、80 %、85 %、90 %、92 %、93 %、94%、95%、96%、97%、98%或 99% 的序列同一性因此,在本發(fā)明的一個(gè)實(shí)施方案中,優(yōu)化的內(nèi)切核酸酶是經(jīng)改造的版本的I-Sce I及其在氨基酸水平上具有至少 55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95 %、96%、97 %、98 %或99%的序列同一性的同源物,并且相比其未改造的形式(意指天然存在的各個(gè)LAGLIDADG內(nèi)切核酸酶)時(shí),具有改變的DNA結(jié)合親和力、改變的酶活性或改變的DNA識(shí)別序列。在本發(fā)明的另一個(gè)實(shí)施方案中,優(yōu)化的內(nèi)切核酸酶是SEQ ID NO :1所述的I-SecI或如它們天然存在的其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的變體。只要不包含其他突變,則這樣的同源物也將被認(rèn)為是天然存在的同源物,其中所述同源物不是天然存在的,但具有A36G,L40M, L40V, I41S,I41N, L43A,H91A和I123L中的至少一個(gè)突變,所述突變對(duì)I-SceI的DNA結(jié)合親和力幾乎沒(méi)有影響,或者將改變的它的DNA識(shí)別序列,而相比SEQ ID NO : I所述的I-SecI或在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的各個(gè)同源物(如其天然存在的),所述其他突變改變了其DNA結(jié)合親和力、酶活性或其DNA識(shí)別序列。具有增加的或減少的DNA結(jié)合親和性的I-SceI的經(jīng)改造的版本例如被公開(kāi)于W007/047859和W009/076292中,兩者通過(guò)引用包括到本文中。如果沒(méi)有另外的明確指明,所有突變體都將按照各內(nèi)切核酸酶的野生型氨基酸序列的氨基酸編號(hào)來(lái)命名,例如,I-SceI的突變體L19將在如SEQ ID NO :1所示的野生型I-SceI氨基酸序列第19位處具有對(duì)亮氨酸的氨基酸替換。I-SceI的L19H突變體將以組氨酸替代野生型I-SceI氨基酸序列第19位的氨基酸亮氨酸。例如,I-SceI的DNA結(jié)合親和性可通過(guò)對(duì)應(yīng)于選自下組的取代的至少一種修飾而增加,所述組由(a)用 H、N、Q、S、T、K 或 R對(duì) D201、L19、L80、L92、Y151、Y188、I191、Y199 或 Y222的取代;或(b)用 K 或 R對(duì) N15、N17、S81、H84、N94、N120、T156、N157、S159、N163、Q165、S166、N194或S202的取代構(gòu)成。I-SceI的DNA結(jié)合親和性可通過(guò)對(duì)應(yīng)于選自下組的取代的至少一種突變而減少,所述組由(a)用 H、N、Q、S、T、D 或 E 對(duì) K20、K23、K63、K122、K148、K153、K190、K193、K195 或Κ223的取代;或(b)用 D 或 E 對(duì) L19、L80、L92、Y151、Y188、1191、Y199、Y222、N15、N17、S81、H84、N94、N120、T156、N157、S159、N163、Q165、S166、N194 或 S202 的取代構(gòu)成。具有改變的DNA識(shí)別序列的I-SceI、I-CreI、I-MsoI和I-CeuI的經(jīng)改造版本被公開(kāi)于例如 W007/047859 和 W009/076292 中。例如,I-SceI的一個(gè)重要DNA識(shí)別位點(diǎn)具有下述序列正義5’-TTACCCTGTTA T C C C T A G-3’堿基位置I 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18反義3' -AATGGGACAA T A G G G A T C-5/I-SceI的下述突變將使第4位對(duì)C的優(yōu)先性改變至A :K50。I-SceI的下述突變將保持第4位對(duì)C的優(yōu)先性K50、CE57。I-SceI的下述突變將使第4位對(duì)C的優(yōu)先性改變至G :E50、R57、Κ57。I-SceI的下述突變將使第4位對(duì)C的優(yōu)先性改變至T :Κ57、Μ57、Q50。I-SceI的下述突變將使第5位對(duì)C的優(yōu)先性改變至A :K48、Q102。I-SceI的下述突變將保持第5位對(duì)C的優(yōu)先性R48、K48、E102、E59。I-SceI的下述突變將使第5位對(duì)C的優(yōu)先性改變至G :E48、K102、R102。I-SceI的下述突變將使第5位對(duì)C的優(yōu)先性改變至T :Q48、C102、L102、V102。I-SceI的下述突變將使第6位對(duì)C的優(yōu)先性改變至A :K59。I-SceI的下述突變將保持第6位對(duì)C的優(yōu)先性R59、K59。 I-SceI的下述突變將使第6位對(duì)C的優(yōu)先性改變至G :K84、Ε59。
I-SceI的下述突變將使第6位對(duì)C的優(yōu)先性改變至T :Q59、Y46。I-SceI的下述突變將使第7位對(duì)T的優(yōu)先性改變至A :C46、L46、V46。I-SceI的下述突變將使第7位對(duì)T的優(yōu)先性改變至C :R46、K46、E86。I-SceI的下述突變將使第7位對(duì)T的優(yōu)先性改變至G :K86、R86、Ε46。I-SceI的下述突變將保持第7位對(duì)T的優(yōu)先性K68、C86、L86、Q46 *。I-SceI的下述突變將使第8位對(duì)G的優(yōu)先性改變至A :K61、S61、V61、Α61、L61。I-SceI的下述突變將使第8位對(duì)G的優(yōu)先性改變至C :E88、R61、Η61。I-SceI的下述突變將保持第8位對(duì)G的優(yōu)先性E61、R88、Κ88。I-SceI的下述突變將使第8位對(duì)G的優(yōu)先性改變至T :K88、Q61、Η61。I-SceI的下述突變將使第9位對(duì)T的優(yōu)先性改變至A :T98、C98、V98、L9B。I-SceI的下述突變將使第9位對(duì)T的優(yōu)先性改變至C :R98、K98。I-SceI的下述突變將使第9位對(duì)T的優(yōu)先性改變至G :E98、D98。I-SceI的下述突變將保持第9位對(duì)T的優(yōu)先性Q98。I-SceI的下述突變將使第10位對(duì)T的優(yōu)先性改變至A :V96、C96、A96。I-SceI的下述突變將使第10位對(duì)T的優(yōu)先性改變至C :K96、R96。I-SceI的下述突變將使第10位對(duì)T的優(yōu)先性改變至G :D96、E96。I-SceI的下述突變將保持第10位對(duì)T的優(yōu)先性Q96。I-SceI的下述突變將保持第11位對(duì)A的優(yōu)先性C90、L90。I-SceI的下述突變將使第11位對(duì)A的優(yōu)先性改變至C :K90、R90。I-SceI的下述突變將使第11位對(duì)A的優(yōu)先性改變至G :Ε90。I-SceI的下述突變將使第11位對(duì)A的優(yōu)先性改變至T :Q90。I-SceI的下述突變將使第12位對(duì)T的優(yōu)先性改變至A :Q193。I-SceI的下述突變將使第12位對(duì)T的優(yōu)先性改變至C :E165、E193、D193。I-SceI的下述突變將使第12位對(duì)T的優(yōu)先性改變至G :K165、R165。I-SceI的下述突變將保持第12位對(duì)T的優(yōu)先性C165、L165、C193、V193、A193、T193、S193。I-SceI的下述突變將使第13位對(duì)C的優(yōu)先性改變至A :C193、L193。I-SceI的下述突變將保持第13位對(duì)C的優(yōu)先性K193、R193、D192。I-SceI的下述突變將使第13位對(duì)C的優(yōu)先性改變至G :E193、D193、Κ163、R192。I-SceI的下述突變將使第13位對(duì)C的優(yōu)先性改變至T :Q193、C163、L163。I-SceI的下述突變將使第14位對(duì)C的優(yōu)先性改變至A :L192、C192。I-SceI的下述突變將保持第14位對(duì)C的優(yōu)先性E161、R192、K192。I-SceI的下述突變將使第14位對(duì)C的優(yōu)先性改變至G :K147、Κ161、R161、R197、D192、E192。I-SceI的下述突變將使第14位對(duì)C的優(yōu)先性改變至T :K161、Q192。I-SceI的下述突變將保持第15位對(duì)C的優(yōu)先性Ε151。I-SceI的下述突變將使第15位對(duì)C的優(yōu)先性改變至G :Κ151。I-SceI的下述突變將使第15位對(duì)C的優(yōu)先性改變至T :C151、L151、Κ151。I-SceI的下述突變將保持第17位對(duì)A的優(yōu)先性N152、S152、C150、L150、V150、T150。I-SceI的下述突變將使第17位對(duì)A的優(yōu)先性改變至C :Κ152、Κ150。I-SceI的下述突變將使第17位對(duì)A的優(yōu)先性改變至G :N152、S152、D152、D150、Ε150。I-SceI的下述突變將使第17位對(duì)A的優(yōu)先性改變至T :Q152、Q150。I-SceI的下述突變將使第18位對(duì)G的優(yōu)先性改變至A :K155、C155。I-SceI的下述突變將使第18位對(duì)G的優(yōu)先性改變R155、K155。I-SceI的下述突變將保持第18位對(duì)G的優(yōu)先性E155。I-SceI的下述突變將使第18位對(duì)G的優(yōu)先性改變至T :H155、Y155。 若干突變的組合可增強(qiáng)效果。一個(gè)例子是三重突變體W149G、D150C和N152K,其將使I-SceI在第17位對(duì)A的優(yōu)先性改變至G。為保持酶活性,應(yīng)當(dāng)避免I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的同源物的下述突變I38S、I38N、G39D、G39R、L40Q、L42R、D44E、D44G、D44H、D44S, A45E, A45D,Y46D、I47R、I47N、D144E、D145E、D145N 和 G146E??山M合改變了 I-SceI或其在氨基酸水平上具有至少55 %、58 %、60 %、70 %、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物的酶活性、DNA結(jié)合親和性、DNA識(shí)別序列的突變,以制造經(jīng)改造的內(nèi)切核酸酶,例如基于I-SceI的經(jīng)改造的內(nèi)切核酸酶、并且較之SEQ ID NO :1所描述的I-SceI具有變動(dòng)的DNA結(jié)合親和性和/或改變的DNA識(shí)別序列。除了理性的改造I-SecI外,還可以利用分子進(jìn)化改變I-SceI或其在氨基酸水平上具有至少 55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的酶活性、DNA結(jié)合親和性、DNA識(shí)別序列??衫绮捎肈NA改組方案來(lái)調(diào)節(jié)編碼候選內(nèi)切核酸酶的多核苷酸。DNA改組是遞歸性重組和突變的方法,其通過(guò)對(duì)相關(guān)基因的庫(kù)進(jìn)行隨機(jī)片段化、接著通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)樣的方法重新組裝片段來(lái)進(jìn)行。見(jiàn)例如,Stemmer(1994)Proc Natl Acad SciUSA 91:10747-10751;Stemmer(1994)Nature 370 :389-391 和 US5, 605,793、US 5,837,458、US 5,830,721和 US5,811,238。還可基于對(duì)給定內(nèi)切核酸酶晶體結(jié)構(gòu)的進(jìn)一步了解,使用理性設(shè)計(jì),來(lái)制造經(jīng)改造的內(nèi)切核酸酶,見(jiàn)例如,F(xiàn)aj ardo-Sanchez 等人,“Computer design of obligateheterodimer meganucleases allows efficient cutting of custom DNA sequences,,,Nucleic Acids Research,2008,第 36 卷,第 7 期,2163-2173。經(jīng)改造的內(nèi)切核酸酶以及它們各自的DNA識(shí)別位點(diǎn)的大量例子是本領(lǐng)域已知的,并被公開(kāi)于例如 WO 2005/105989、WO 2007/034262、W02007/047859、WO 2007/093918、WO2008/093249、WO 2008/102198、WO 2008/152524、WO 2009/001159、WO 2009/059195、WO2009/076292,WO 2009/114321 或 WO 2009/134714,WO 10/001189 中,上述文獻(xiàn)均通過(guò)引用
并入本文。為了制造優(yōu)化的核酸酶的突變和改變可以與用于制造經(jīng)改造的內(nèi)切核酸酶的突變組合,例如I-SceI的同源物可以是本文所述的優(yōu)化的核酸酶,但也可以包括用于改變它的DNA結(jié)合親和性和/或改變它的DNA識(shí)別序列的突變。
通過(guò)調(diào)整多核苷酸序列使其適合生物的密碼子使用,或者通過(guò)從編碼內(nèi)切核酸酶的多核苷酸序列中刪除備選的起始密碼子或者通過(guò)刪除隱蔽的多聚腺苷酸化信號(hào),可以改善I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的氨基酸序列,以及編碼I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的多核苷酸,其中所述生物中意圖表達(dá)I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的同源物的。用于制造優(yōu)化的核酸酶的突變:可以通過(guò)改變各個(gè)LAGLIDADG內(nèi)切核酸酶的氨基酸序列,優(yōu)化已優(yōu)化過(guò)的核酸酶,如優(yōu)化版本的I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性的同源物,來(lái)增強(qiáng)蛋白穩(wěn)定性。因此,較之未經(jīng)優(yōu)化的核酸酶的氨基酸序列而言,經(jīng)優(yōu)化的核酸酶不包含下 述,或具有降低的數(shù)量的下述a) PEST-序列b) KEN-框c)A_ 框,d)D-框,或e)根據(jù)N-末端規(guī)則包含用于穩(wěn)定性的經(jīng)優(yōu)化的N-端末端,f)包含甘氨酸(glycin)作為N-端第二個(gè)氨基酸,或g)a)、b)、c)、d)、e)和 f)的任何組合。PEST序列是約12個(gè)氨基酸的序列,其包含至少一個(gè)脯氨酸、一個(gè)谷氨酸(glutamate)或天冬氨酸(aspartate),以及至少一個(gè)絲氨酸或蘇氨酸。PEST序列例如被描述于 Rechsteiner M, Rogers Sff. “PEST Sequences and regulation byproteolySis. ” TrendS Biochem. Sci. 1996 ;21(7),267 至 271 頁(yè)中。KEN-框的氨基酸共有序列是KENXXX(N/D)。A-框的氨基酸共有序列是AQRXLXXSXXXQRVL。
D-框的氨基酸共有序列是RXXL。對(duì)核酸酶進(jìn)行穩(wěn)定以對(duì)抗降解的另一途徑是根據(jù)N-末端規(guī)則優(yōu)化各內(nèi)切核酸酶的N-端的氨基酸序列。針對(duì)在真核生物中的表達(dá)優(yōu)化過(guò)的核酸酶在其氨基酸序列的起始甲硫氨酸之后包含甲硫氨酸、纈氨酸、甘氨酸、蘇氨酸、絲氨酸、丙氨酸或半胱氨酸。針對(duì)在原核生物中的表達(dá)優(yōu)化過(guò)的核酸酶在其氨基酸序列的起始甲硫氨酸之后包含甲硫氨酸、纈氨酸、甘氨酸、蘇氨酸、絲氨酸、丙氨酸、半胱氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、異亮氨酸或組氨酸??赏ㄟ^(guò)缺失核酸酶氨基酸序列中的50、40、30、20、10、9、8、7、6、5、4、3、2或I個(gè)氨
基酸對(duì)核酸酶進(jìn)行優(yōu)化,而不破壞其內(nèi)切核酸酶活性。例如,當(dāng)LAGLIDADG內(nèi)切核酸酶的氨基酸序列中的部分被缺失的情況下,保留上文所述的LAGLIDADG內(nèi)切核酸酶基序則是重要的。用于優(yōu)化核酸酶的另一途徑是向核酸酶的氨基酸序列添加核定位信號(hào)。例如,SEQID NO :4所描述的核定位信號(hào)。經(jīng)優(yōu)化的核酸酶可包含上文所述的方法和特征的組合,例如,它們可包含核定位信號(hào),包含甘氨酸作為第二個(gè)N-端氨基酸,或者包含C-端的缺失,或這些特征的組合。具有上文所述的方法和特征的組合的經(jīng)優(yōu)化的核酸酶的例子是例如SEQ ID NOs :2、3和5所描述的。經(jīng)優(yōu)化的核酸酶不包含下述序列所示的氨基酸序列HVCLLYDQWVLSPPH, LAYWFMDDGGK, KTIPNNLVENYLTPMSLAYffFMDDGGK,KPIIY-IDSMSYLIFYNLIK, KLPNTISSETFLK,或 TISSETFLK,或者其不包含下述序列所示的氨基酸序列HVCLLYDQWVLSPPH, LAYWFMDDGGK, KPIIYIDSMSYLIFYNLIK, KLPNTISSETFLK 或TIS-SETFLK, 或者其不包含下述序列所示的氨基酸序列HVCLLYDQWVLSPPH, LAYWFMDDGGK, KLPNTISSETFLK 或 TISSETFLK,或者其不包含下述序列所示的氨基酸序列LAYWFMDDGGK, KLPNTISSETFLK 或 TISSETFLK,或者其不包含下述序列所示的氨基酸序列KLPNTISSETFLK或TISSETFLK。在一種實(shí)施方式中,經(jīng)優(yōu)化的核酸酶是I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99%的序列同一性的同源物,其中,位于野生型I-SceI或其下述同源物的C-端的氨基酸序列TISSETFLK被缺失或突變,所述同源物在氨基酸水平上具有至少55 %、58 %、60 %、70 %、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性且在 C-端具有氨基酸序列TISSETFLK??赏ㄟ^(guò)缺失或突變野生型I-SceI或下述其同源物的C-端的至少1、2、3、4、5、6、7、8或9個(gè)氨基酸,來(lái)缺失或突變氨基酸序列TISSETFLK,所述其同源物在氨基酸水平上具有至少 55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或99%的序列同一性且在C-端具有氨基酸序列TISSETFLK。表2 :針對(duì)野生型I-SceI中TISSETFLK氨基酸序列的缺失的不同例子
權(quán)利要求
1.優(yōu)化的內(nèi)切核酸酶,其包含與SEQID N0:l、15、16、17或19所描述的多肽具有至少80 %的氨基酸序列同一性的氨基酸序列。
2.權(quán)利要求I所述的優(yōu)化的內(nèi)切核酸酶,其包含SEQID NO :2、3或5所描述的氨基酸序列。
3.權(quán)利要求I所述的優(yōu)化的內(nèi)切核酸酶,其是經(jīng)改造的內(nèi)切核酸酶。
4.權(quán)利要求1、2或3所述的優(yōu)化的內(nèi)切核酸酶,其包含與SEQID NO :1或2所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列,且不包含氨基酸序列TISSETFLK。
5.權(quán)利要求I至4的任一項(xiàng)所述的優(yōu)化的內(nèi)切核酸酶,其包含與SEQID NO :1或2所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列,且包含SEQ ID ΝΟ:1的絲氨酸Nr229的突變。
6.權(quán)利要求I至5的任一項(xiàng)所述的優(yōu)化的內(nèi)切核酸酶,其與至少ー個(gè)鋅指結(jié)構(gòu)域,或至少ー個(gè)源自轉(zhuǎn)錄激活物-樣(TAL)效應(yīng)子的重復(fù)單元,或至少ー個(gè)鋅指結(jié)構(gòu)域和至少ー個(gè)源自轉(zhuǎn)錄激活物-樣(TAL)效應(yīng)子的重復(fù)單元融合。
7.權(quán)利要求I至6的任一項(xiàng)所述的優(yōu)化的內(nèi)切核酸酶,其還包含SecIII或SecIV分泌信號(hào)。
8.包含多核苷酸序列的經(jīng)分離的多核苷酸,所述多核苷酸序列編碼權(quán)利要求I至7中任意一項(xiàng)所述的優(yōu)化的內(nèi)切核酸酶。
9.權(quán)利要求8所述的包含核苷酸序列的經(jīng)分離的多核苷酸,其中經(jīng)分離的多核苷酸的序列 a.是經(jīng)密碼子優(yōu)化的, b.具有低含量的RNA不穩(wěn)定性基序, c.具有低含量的密碼子重復(fù), d.具有低含量的隱蔽剪接位點(diǎn), e.具有低含量的備選起始密碼子, f.具有低含量的限制性位點(diǎn), g.具有低含量的RNAニ級(jí)結(jié)構(gòu), h.具有a)、b)、c)、d)、e)、f)或g)的任何組合。
10.表達(dá)盒,所述表達(dá)盒包含與啟動(dòng)子和終止子序列功能性組合的、權(quán)利要求8或9所述的經(jīng)分離的多核苷酸。
11.載體、宿主細(xì)胞或非人生物,其包含 a.編碼權(quán)利要求I至7中任一所述的優(yōu)化的內(nèi)切核酸酶的多核苷酸,或 b.權(quán)利要求8或9所述的經(jīng)分離的多核苷酸,或 c.權(quán)利要求10所述的表達(dá)盒,或 d.a)、b)和c)的任何組合。
12.權(quán)利要求11所述的非人生物,其中所述非人生物是植物。
13.用于多核苷酸同源重組的方法,其包括 a.提供用于同源重組的感受態(tài)細(xì)胞, b.提供下述多核苷酸,所述多核苷酸包含側(cè)翼為序列A和序列B的經(jīng)優(yōu)化的內(nèi)切核酸酶的DNA識(shí)別位點(diǎn),C.提供包含序列A’和B’的多核苷酸,所述序列A’和B’足夠長(zhǎng)并且與序列A和序列B足夠同源,從而允許在所述細(xì)胞中同源重組,以及 d.提供如權(quán)利要求I至7中任意一項(xiàng)所述的優(yōu)化的內(nèi)切核酸酶或如權(quán)利要求10所述的表達(dá)盒, e.在所述細(xì)胞中組合b)、c)和d),以及 f.檢測(cè)b)和c)的重組多核苷酸,或選擇出或生長(zhǎng)包含b)和c)的重組多核苷酸的細(xì)胞。
14.如權(quán)利要求13所述的用于多核苷酸同源重組的方法,其中,同源重組之后,步驟a)的所述感受態(tài)細(xì)胞中包含的多核苷酸序列從步驟f)的生長(zhǎng)細(xì)胞的基因組中缺失。
15.用于多核苷酸的靶向突變的方法,其包括 a.提供包含含有如權(quán)利要求I至7中任意一項(xiàng)所述的經(jīng)優(yōu)化的內(nèi)切核酸酶的DNA識(shí)別位點(diǎn)的多核苷酸的細(xì)胞, b.提供能切割步驟a)的所述DNA識(shí)別位點(diǎn)的、如權(quán)利要求I至7中任意ー項(xiàng)所述的經(jīng)優(yōu)化的內(nèi)切核酸酶或權(quán)利要求10所述的表達(dá)盒, c.在所述細(xì)胞中組合a)和b),以及 d.檢測(cè)經(jīng)突變的多核苷酸,或選擇出或生長(zhǎng)包含經(jīng)突變的多核苷酸的細(xì)胞。
16.如權(quán)利要求12至14中任意一項(xiàng)所述的用于同源重組或靶向突變的方法,其中所述經(jīng)優(yōu)化的內(nèi)切核酸酶和DNA識(shí)別位點(diǎn)通過(guò)生物的雜交、通過(guò)轉(zhuǎn)化或通過(guò)經(jīng)由融合至經(jīng)優(yōu)化的內(nèi)切核酸酶的SecIII或SecIV肽介導(dǎo)的運(yùn)送,組合于至少ー個(gè)細(xì)胞中。
全文摘要
提供了優(yōu)化的內(nèi)切核酸酶,以及使用優(yōu)化的內(nèi)切核酸酶靶向整合、靶向缺失或靶向突變多核苷酸的方法。
文檔編號(hào)C12N15/63GK102725412SQ201080062324
公開(kāi)日2012年10月10日 申請(qǐng)日期2010年11月25日 優(yōu)先權(quán)日2009年11月27日
發(fā)明者A·赫魯貝克, C·比斯根 申請(qǐng)人:巴斯夫植物科學(xué)有限公司