專利名稱:用于提高種子中選定的氨基酸含量的方法或構(gòu)建體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及植物生物技術(shù)。具體地講,本發(fā)明涉及用于提高植物物種或植物組織或器官,包括細(xì)胞壁,細(xì)胞膜,油體,特別是種子中選定的氨基酸含量的方法和構(gòu)建體。所述較高的含量是通過提供編碼載體蛋白的重組核苷酸序列構(gòu)建體獲得的,所述載體蛋白在它的3′-末端具有多氨基酸延伸部分。披露了通過所述方法獲得的組合物,以及所述氨基酸富集的組合物和用一種或多種所述構(gòu)建體轉(zhuǎn)化過的植物,植物細(xì)胞和細(xì)胞系的用途。
背景技術(shù):
人類和牲畜的飲食中需要八種必需氨基酸。主要以單一谷物或豆類物種為基礎(chǔ)的食物會導(dǎo)致氨基酸的缺乏,這是因?yàn)榉N子蛋白的營養(yǎng)限制,它對人類和動物的飲食需求具有負(fù)面影響。例如,谷物種子中的蛋白缺乏賴氨酸和色氨酸,而豆類種子包括缺少含硫氨基酸,即甲硫氨酸和半胱氨酸的蛋白。將種子蛋白用于牲畜飼料必須使所述食物具有預(yù)定的氨基酸組成,以便改善動物的健康,有效生長和肉類和乳的良好質(zhì)量。因此,改良現(xiàn)有的植物蛋白資源是有利的,特別是,改良必需氨基酸的組成,以便更好地適應(yīng)選定的動物的要求。
業(yè)已作出了努力,以便使植物氨基酸的組成滿足人類和動物的飲食要求,不過,只取得了有限的成功。不過,營養(yǎng)出色的植物突變體和它們的組織的使用受到了負(fù)面多效性作用的損害。這些問題包括較差的種子發(fā)芽,緩慢的干燥速度,較低的產(chǎn)量,較高的微生物和昆蟲易感性,和不良的研磨特征。
遺傳工程提供了改變植物和植物組織中的必需或任何氨基酸組成的替代方法。為了提高甲硫氨酸或賴氨酸含量,業(yè)已對生物合成途徑進(jìn)行了操作,或高-甲硫氨酸/賴氨酸業(yè)已在轉(zhuǎn)基因種子中表達(dá)(WO96/38574;WO 96/01905;WO 95/31554;WO 95/15392;WO 93/19190;EP 485 970,WO99/40209)。原則上講,業(yè)已采用了三種方法1)改變內(nèi)源蛋白的氨基酸序列;2)將來自其他植物物種的天然存在的蛋白用于異源表達(dá);和3)表達(dá)含有高水平甲硫氨酸/賴氨酸的合成基因。
使用來自其他植物的高-甲硫氨酸/賴氨酸蛋白的方法業(yè)已披露在US 5,633,436,US 5,580,782和WO94/16078中。為了提高重要豆科糧食作物的營養(yǎng)價(jià)值,將決定富硫的向日葵種子白蛋白的種子特異性表達(dá)的嵌合基因穩(wěn)定地轉(zhuǎn)入狹葉羽扇豆(Lupinus angustifoliusL.)中。在包括轉(zhuǎn)入DNA的單一串聯(lián)插入片段的品系中,向日葵種子白蛋白占可提取種子蛋白的5%。與非轉(zhuǎn)基因的親本系相比,所述轉(zhuǎn)基因種子包括更少的硫酸鹽和更多的總的氨基酸硫;與它相關(guān)的是甲硫氨酸含量提高了94%,而半胱氨酸含量降低了12%。種子的其他氨基酸或總氮或總硫含量不存在統(tǒng)計(jì)學(xué)上的顯著改變。
第一和第二種方法(上述)的組合業(yè)已披露于US 5,850,016中。為了提高馬鈴薯塊莖的甲硫氨酸含量,對編碼巴西堅(jiān)果2S白蛋白的cDNA克隆進(jìn)行誘變,以便通過2-7個(gè)額外的甲硫氨酸殘基提高它的甲硫氨酸含量,并且轉(zhuǎn)入馬鈴薯植物。無論是否突變,葉片中的蛋白含量是低的,占總蛋白含量<0.01%-0.2%。
合成蛋白的使用業(yè)已披露于FR 2,744,134,US 5,559,223和WO 92/14822中。為了提高種子中賴氨酸和甲硫氨酸含量,根據(jù)α-螺旋-螺旋結(jié)構(gòu)設(shè)計(jì)了含有31%賴氨酸和20%甲硫氨酸的合成蛋白(CP3-5)。通過菜豆蛋白或β-conglycinin啟動子驅(qū)動,適當(dāng)含量的合成蛋白積累在從轉(zhuǎn)基因煙草植物中收獲的種子中。在WO 99/15004中,披露了用于改變植物儲存器官中的組成的嵌合構(gòu)建體。編碼富硫蛋白的基因具有C-末端KDEL延伸部分,它能夠使所述構(gòu)建體定向進(jìn)入內(nèi)質(zhì)網(wǎng)和高爾基體。
上述方法具有某些缺陷,當(dāng)對于宿主植物來說沒有功能性作用的大量外源蛋白表達(dá)時(shí),可能導(dǎo)致很多與種子的生理學(xué)異常相關(guān)的繼發(fā)性問題,正如在通過傳統(tǒng)育種方法產(chǎn)生的等同類型的突變體中所觀察到的。
本發(fā)明的首要目的是提供一種方法,包括重組核苷酸序列構(gòu)建體,使得能夠選擇用于有效轉(zhuǎn)化任何具有定向表達(dá)的需要的植物物種的構(gòu)建體,所述定向表達(dá)使得能夠積累富集了一種或多種選定的氨基酸的穩(wěn)定蛋白,使所述蛋白存在于任何選定的植物組織中。在使用所述構(gòu)建體時(shí),可以避免表達(dá)大量的對宿主植物來說沒有功能性作用的外源蛋白的有害作用。本發(fā)明的第二個(gè)目的是提供包括與相容性配方輔助添加劑組合的穩(wěn)定的氨基酸富集的蛋白的組合物,所述蛋白業(yè)已積累在選定的植物組織中。提出所述組合物適合作為來自選定的植物的用于人類的直接的食物來源以及飼料,特別是動物飼料,和作為食品補(bǔ)充物。
發(fā)明概述本發(fā)明涉及通過一種方法改善植物蛋白的質(zhì)量,它通過富含形成所述植物蛋白的氨基酸序列的蛋白的定向表達(dá)或積累提高了一種或多種選定的氨基酸含量。該方法包括用至少一種重組核苷酸序列構(gòu)建體轉(zhuǎn)化植物的步驟。所述構(gòu)建體包括組織或器官特異性調(diào)控序列,它能在形態(tài)發(fā)生的選定的階段驅(qū)動轉(zhuǎn)錄。所述調(diào)控序列可操作地連接在嵌合核苷酸序列上。用于轉(zhuǎn)化植物,特別是作物的所述嵌合核苷酸序列包括兩個(gè)關(guān)鍵因子-編碼與天然載體蛋白相比具有完整的功能特性的載體蛋白的核苷酸序列,和包括編碼具有四-八十個(gè)氨基酸殘基,并且包括構(gòu)成所述功能上完整的載體蛋白的一種或多種選定的氨基酸的組合的氨基酸序列的密碼子的核苷酸序列。編碼載體蛋白的核苷酸序列選自編碼植物特異性蛋白的核苷酸序列,所述植物特異性蛋白使得所述氨基酸富集的蛋白能夠在植物的選定的組織或器官中定向表達(dá)或積累。
編碼載體蛋白的核苷酸序列缺少終止密碼子,并且在它的3′-末端與編碼一種或多種氨基酸殘基的選定的組合的選定數(shù)量的密碼子的核苷酸序列框內(nèi)融合。所述構(gòu)建體使得氨基酸富集的具有多氨基酸延伸部分的載體蛋白能夠在選定的植物組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)或積累。
上述所謂的轉(zhuǎn)化構(gòu)建體,是通過選擇使得能夠進(jìn)行多氨基酸延伸部分的穩(wěn)定的蛋白翻譯和穩(wěn)定的定向表達(dá)或積累的構(gòu)建體獲得的。所述選擇是通過體外翻譯系統(tǒng)(IVT)和/或瞬時(shí)表達(dá)系統(tǒng)完成的,并且隨后用其他可應(yīng)用的方法驗(yàn)證。
所述IVT系統(tǒng)主要被用于確定最佳數(shù)量的密碼子,它能夠在框內(nèi)與編碼載體蛋白的核苷酸序列框內(nèi)融合的,而不破壞氨基酸富集的必需的載體蛋白的翻譯效力。
所述瞬時(shí)表達(dá)系統(tǒng)包括與編碼報(bào)道蛋白的核苷酸序列框內(nèi)融合的上述構(gòu)建體。將該瞬時(shí)表達(dá)構(gòu)建體導(dǎo)入植物細(xì)胞,優(yōu)選采用微粒子轟擊方法。然后,選擇提供所述報(bào)道基因在所述植物細(xì)胞中穩(wěn)定的定向表達(dá)的構(gòu)建體,并且去除來自所選構(gòu)建體的編碼所述報(bào)道蛋白的核苷酸序列。將所述構(gòu)建體用于生產(chǎn)目的,通過用缺少上述報(bào)道基因的構(gòu)建體轉(zhuǎn)化植物,優(yōu)選使用農(nóng)桿菌屬介導(dǎo)的轉(zhuǎn)化系統(tǒng)。
所述方法能夠生產(chǎn)氨基酸富集的蛋白,即具有多氨基酸延伸部分的載體蛋白,包括四-八十個(gè)氨基酸殘基的選定的組合。所述氨基酸有利地是組氨酸,半胱氨酸,甲硫氨酸,甘氨酸,賴氨酸,色氨酸,丙氨酸,纈氨酸,亮氨酸,異亮氨酸,脯氨酸,苯丙氨酸,酪氨酸,絲氨酸,蘇氨酸,精氨酸,天冬氨酸,谷氨酸,天冬酰胺,谷氨酰胺或它們的任意組合。
使得能夠在植物組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)或積累的載體蛋白可以從在植物的細(xì)胞內(nèi)交通途徑起作用的蛋白中選擇。所述載體蛋白優(yōu)選是細(xì)胞壁蛋白或植物病毒蛋白。例如,有用的載體蛋白是油質(zhì)蛋白,caleosin,steroleosin,cruciferin,napin或植物病毒運(yùn)動蛋白。
所述調(diào)控序列有利地是在胚胎發(fā)生期間表達(dá)的啟動子。有用的調(diào)控序列包括啟動子,如napin(NAP),35S,嵌合雜合體(HYB),19S,胭脂氨酸,菜豆蛋白,steroleosin,caleosin,cruciferin,苜?;ㄈ~病毒(AMV),熱激,白蛋白2S或油質(zhì)蛋白啟動子。
所述報(bào)道蛋白有利地是可檢測的蛋白。熒光蛋白,如綠色熒光蛋白(GFP),紅色熒光蛋白,β-葡糖醛酸酶,obelin或熒光素酶是特別優(yōu)選的。
本發(fā)明的方法特別適用于生產(chǎn)在包括細(xì)胞壁碎片在內(nèi)的植物材料中含有氨基酸富集的具有多氨基酸延伸部分的載體蛋白的組合物,其中,通過該方法獲得的植物材料中的選定的氨基酸含量與相應(yīng)的未修飾過的野生型植物中的氨基酸含量相比至少為2∶1。所述組合物可用于生產(chǎn)油渣餅的氨基酸富集的飼料,油渣餅是通過從植物中回收油之后獲得的。
本發(fā)明還披露了用瞬時(shí)表達(dá)構(gòu)建體或轉(zhuǎn)化構(gòu)建體轉(zhuǎn)化過的植物,植物細(xì)胞和植物細(xì)胞系。
本發(fā)明的特有特征如權(quán)利要求書所限定。
附圖的簡要說明
圖1表示十八種表達(dá)質(zhì)粒,其中pRT表示在質(zhì)粒載體pRT100中包括花椰菜花葉病毒的35S啟動子的構(gòu)建體(Tpfer等,Nucleic AcidRes.15(14)5890,1987)。所述十八種質(zhì)粒是使用兩種載體蛋白,即油質(zhì)蛋白(OLE)或煙草花葉病毒運(yùn)動蛋白(MP)中的任意一個(gè)的基因構(gòu)建的,三個(gè)轉(zhuǎn)錄啟動子中的一個(gè)用箭頭表示(NAP=napin啟動子,35S=花椰菜花葉病毒35S啟動子,HYB=雜合啟動子,即來自CaMV 35S啟動子的增強(qiáng)子區(qū),它與啟動子融合)以及內(nèi)部組氨酸(His)或半胱氨酸-甲硫氨酸(Cys-Met)密碼子富集的核苷酸序列區(qū)(″盒″;有關(guān)盒的細(xì)節(jié)參見圖3)具有用灰色框表示的各種長度(2x包括兩個(gè)盒,4x包括四個(gè)盒,6x包括六個(gè)盒)。綠色熒光蛋白(GFP)編碼區(qū)與富含His或Cys-Met密碼子的序列框內(nèi)融合。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖2表示四種表達(dá)質(zhì)粒,它們是根據(jù)瞬時(shí)表達(dá)測定數(shù)據(jù)選擇的,用于穩(wěn)定轉(zhuǎn)化到蕓薹植物中。NAP=napin啟動子,HYB=雜合啟動子,即來自CaMV 35S啟動子的增強(qiáng)子區(qū),它與napin啟動子融合,OLE=油質(zhì)蛋白,MP=煙草花葉病毒30K運(yùn)動蛋白基因,GFP=綠色熒光蛋白基因,4x=四個(gè)氨基酸富集的核苷酸序列區(qū)(盒)。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖3表示組氨酸密碼子富集的序列的核苷酸序列(A),半胱氨酸-甲硫氨酸密碼子富集的序列的核苷酸序列(B),甘氨酸密碼子富集的序列的核苷酸序列(C)和賴氨酸密碼子富集的序列的核苷酸序列(D)。在核苷酸序列下面示出了蛋白翻譯序列。K,賴氨酸;H,組氨酸;R,精氨酸;V,纈氨酸;G,甘氨酸;L,亮氨酸;C,胱氨酸;S,絲氨酸;M,甲硫氨酸。星號表示轉(zhuǎn)錄終止密碼子。用于克隆的限制位點(diǎn)用粗體表示,并且表示在所述序列上面。
圖4表示具有與TMV 30KMP基因融合的不同長度的組氨酸或半胱氨酸-甲硫氨酸密碼子富集的DNA序列的融合體的質(zhì)粒的構(gòu)建方法(空心框″MP″)。pGEM-7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)被用于構(gòu)建組氨酸密碼子富集的核苷酸序列。克隆pGEM-His-24包括編碼含有14個(gè)His殘基的19個(gè)氨基酸長的肽的DNA片段(圖3A)。該DNA片段的旁側(cè)是XhoI和BamHI位點(diǎn),并且還包括SalI限制位點(diǎn),被設(shè)計(jì)用于隨后的克隆步驟(圖3A)。組氨酸或半胱氨酸-甲硫氨酸密碼子富集的DNA序列通過不同長度的灰色框表示。pGEM-His-24被用作用于將組氨酸富集的DNA序列與TMV 30K MP基因融合的例子(實(shí)施例11)??梢詫⑾嗤臉?gòu)建方法用于執(zhí)行半胱氨酸-甲硫氨酸密碼子富集的DNA序列與TMV 30K MP基因的融合(實(shí)施例12)。在附圖中示出了若干限制位點(diǎn)的位置。
圖5A表示表達(dá)質(zhì)粒pNAP和pHYB的構(gòu)建,其中RT表示所述構(gòu)建體包括來自質(zhì)粒載體pRT100的花椰菜花葉病毒的35S啟動子(CaMV35S啟動子)(Tpfer等,Nucleic Acid Res.15(14)5890,1987)。所述表達(dá)質(zhì)粒包括napin啟動子(NAP)或嵌合啟動子(HYB),它由與花椰菜花葉病毒(CaMV)35S啟動子的增強(qiáng)子區(qū)偶聯(lián)的完整的napin啟動子組成(例16)。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖5B表示將綠色熒光蛋白(GFP)基因克隆到基于35S CaMV和napin啟動子的質(zhì)粒中,其中RT表示所述構(gòu)建體包括來自質(zhì)粒載體pRT100的花椰菜花葉病毒的35S啟動子(CaMV 35S啟動子)(Tpfer等,Nucleic Acid Res.15(14)5890,1987)。所述表達(dá)質(zhì)粒包括napin啟動子(NAP)或嵌合啟動子(HYB),它由與花椰菜花葉病毒(CaMV)35S啟動子的增強(qiáng)子區(qū)偶聯(lián)的完整的napin啟動子組成(實(shí)施例16)。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖6表示使用35S CaMV(a)和HYB(b)啟動子在構(gòu)建體pRT-OLE-4x-GFP和pHYB-OLE-4x-GFP中分別獲得的相對GFP表達(dá)(參見圖1),所述表達(dá)是在將構(gòu)建體粒子轟擊進(jìn)Nicotiana benthamiana的表皮細(xì)胞中之后測定的(實(shí)施例8)。
圖7表示植物表達(dá)載體的構(gòu)建,所述表達(dá)載體由受35S CaMV啟動子控制的、與GFP編碼區(qū)融合的TMV 30K MP基因(MP),即,具有不同長度的His-或Cys-Met富集的序列盒(灰色框)組成。RT表示所述構(gòu)建體包括來自質(zhì)粒載體pRT101的花椰菜花葉病毒的35S啟動子(CaMV 35S啟動子)(Tpfer等,Nucleic Acid Res.15(14)5890,1987)。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖8表示植物表達(dá)載體的構(gòu)建,所述表達(dá)載體由受napin(NAP)啟動子控制的、與GFP編碼區(qū)融合的TMV 30K MP基因(MP),即,具有不同長度的His-或Cys-Met富集的序列盒(灰色框)組成。RT表示所述構(gòu)建體包括來自質(zhì)粒載體pRT100的花椰菜花葉病毒的35S啟動子(CaMV 35S啟動子)(Tpfer等,Nucleic Acid Res.15(14)5890,1987)。pGEM-30K包括來自pGEM-7Z(+)質(zhì)粒中的TMV的30K運(yùn)動蛋白基因(Promega Corporation USA)(實(shí)施例7)。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖9表示植物表達(dá)載體的構(gòu)建,所述表達(dá)載體由受雜合(HYB)啟動子控制的、與GFP編碼區(qū)融合的TMV 30K MP基因(MP),即,具有不同長度的His-或Cys-Met富集的序列盒(灰色框)組成。RT表示所述構(gòu)建體包括來自質(zhì)粒載體pRT100的花椰菜花葉病毒的35S啟動子(CaMV 35S啟動子)(Tpfer等,Nucleic Acid Res.15(14)5890,1987)。pGEM-30K包括來自pGEM-7Z(+)質(zhì)粒中的TMV的30K運(yùn)動蛋白基因(Promega Corporation USA)(實(shí)施例7)。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖10表示植物表達(dá)載體(pRT)的構(gòu)建,所述表達(dá)載體由受35S CaMV啟動子控制的、與GFP編碼區(qū)融合的油質(zhì)蛋白基因(OLE),即,具有不同長度的His-或Cys-Met富集的序列盒(灰色框)組成。RT表示所述構(gòu)建體包括來自質(zhì)粒載體pRT100的花椰菜花葉病毒的35S啟動子(CaMV 35S啟動子)(Tpfer等,Nucleic Acid Res.15(14)5890,1987)。有關(guān)pOLE4/11的細(xì)節(jié),參見實(shí)施例6。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖11表示植物表達(dá)載體的構(gòu)建,所述表達(dá)載體由受napin(NAP)啟動子控制的、與GFP編碼區(qū)融合的油質(zhì)蛋白基因(OLE),即,具有不同長度的His-或Cys-Met富集的序列盒(灰色框)組成。有關(guān)pOLE4/11的細(xì)節(jié),參見實(shí)施例6。箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖12表示植物表達(dá)載體的構(gòu)建,所述表達(dá)載體由受雜合(HYB)啟動子控制的、與GFP編碼區(qū)融合的油質(zhì)蛋白基因(OLE),即,具有不同長度的His-或Cys-Met富集的序列盒(灰色框)組成。有關(guān)pOLE4/11的細(xì)節(jié),參見實(shí)施例6.箭頭表示啟動子,而標(biāo)有“t”的小框表示轉(zhuǎn)錄終止序列。在附圖中示出了若干限制位點(diǎn)的位置。
圖13表示表達(dá)pNAP-MP-4xHis-GFP(參見圖2)的蕓薹植物的Western印跡。泳道1,2和3相當(dāng)于三個(gè)獨(dú)立的pNAP-MP-4xHis-GFP轉(zhuǎn)化體(分別為品系5.1A7,5.1A11和5.1A18)。分子量標(biāo)記(在右側(cè)的斑點(diǎn))為50kDa(上斑點(diǎn))和40kDa(下斑點(diǎn))。將His抗體用作探針。
圖14表示表達(dá)pHYB-OLE-4xHis-GFP(參見圖2)的蕓薹植物的Western印跡。泳道1,2,3,5,6和7相當(dāng)于六個(gè)獨(dú)立的pHYB-OLE-4xHis-GFP轉(zhuǎn)化體(分別為品系17.1237,17.1238,17.1240,17.20c8,17.20c11和17.20c20);泳道4相當(dāng)于野生型(未轉(zhuǎn)化過的)對照植物,分子量標(biāo)記(泳道8,在右側(cè)的斑點(diǎn))為50kDa(上斑點(diǎn))和40kDa(下斑點(diǎn))。將His抗體用作探針。
圖15表示表達(dá)pNAP-OLE-4xHis-GFP(參見圖2)的蕓薹植物的Western印跡。泳道2,3,5,6,7和8相當(dāng)于六個(gè)獨(dú)立的pNAP-OLE-4xHis-GFP轉(zhuǎn)化體;泳道4相當(dāng)于野生型(未轉(zhuǎn)化過的)的對照植物。分子量標(biāo)記(泳道1和9)為50kDa(上斑點(diǎn))和40kDa(下斑點(diǎn))。將His抗體用作探針。
發(fā)明的詳細(xì)說明定義用于本發(fā)明的術(shù)語具有它們在植物生物技術(shù),蛋白質(zhì)化學(xué)和飼料配制領(lǐng)域常用的含義。不過,本發(fā)明中的某些術(shù)語是以更廣義或某種程度上不同的方式使用的。因此,在下面對某些術(shù)語作更詳細(xì)的定義。
″重組核苷酸序列構(gòu)建體″或簡稱為″構(gòu)建體″表示DNA構(gòu)建體,瞬時(shí)表達(dá)盒或載體或轉(zhuǎn)化盒或載體。所述構(gòu)建體可以包括線性或環(huán)狀末端連接在一起的核苷酸序列,它任選地插入質(zhì)粒中。為了制備有效的,穩(wěn)定的轉(zhuǎn)化構(gòu)建體,設(shè)計(jì)了表達(dá)報(bào)道蛋白的瞬時(shí)或中間構(gòu)建體,并且鑒定和選擇穩(wěn)定的性能良好的瞬時(shí)或中間構(gòu)建體,以便提供有效的,穩(wěn)定的轉(zhuǎn)化構(gòu)建體用于生產(chǎn)目的。隨后從所述選擇的,有效的構(gòu)建體中除去報(bào)道序列,以便提供用于轉(zhuǎn)化選定的植物物種的轉(zhuǎn)化構(gòu)建體,它被最終用于生產(chǎn)目的。在本發(fā)明中,所述轉(zhuǎn)化構(gòu)建體包括調(diào)控序列和編碼載體蛋白的核苷酸序列,它與編碼選定的氨基酸殘基的密碼子框內(nèi)融合。所述瞬時(shí)構(gòu)建體還包括編碼可檢測報(bào)道蛋白的核苷酸序列。在所述瞬時(shí)或中間構(gòu)建體上,包括至少一個(gè)核苷酸序列盒,不過,優(yōu)選更多,例如,二-六個(gè)盒。每一個(gè)盒包括至少兩個(gè),優(yōu)選五個(gè)或更多個(gè)編碼選定的氨基酸殘基的密碼子。包括最多達(dá)十個(gè)或十五個(gè)選定的氨基酸密碼子的盒可以融合在編碼所述載體和所述報(bào)道蛋白的核苷酸序列之間。應(yīng)當(dāng)指出的是,將編碼所述報(bào)道蛋白的核苷酸序列從構(gòu)建體上除去,業(yè)已發(fā)現(xiàn)它們是穩(wěn)定的和有效的,即,它們?nèi)缢A(yù)期的表現(xiàn)出定向表達(dá)。這些缺少報(bào)道基因的插入的構(gòu)建體被用作轉(zhuǎn)化構(gòu)建體。通常,在穩(wěn)定構(gòu)建體中的氨基酸密碼子的數(shù)量為四-八十個(gè)。
″核苷酸序列的盒″或″核苷酸序列盒″包括一組密碼子,它編碼多氨基酸序列,即所謂的″氨基酸盒″。在本發(fā)明中,盒表示包括連續(xù)的核苷酸序列的插入片段,它具有至少兩個(gè),優(yōu)選四個(gè)和任何數(shù)量的,最多達(dá)大約八十個(gè)密碼子或三聯(lián)體。在設(shè)計(jì)不同的構(gòu)建體并且用于檢查它們的性能,特別是它們在翻譯中的性能時(shí)所述盒是特別方便的。不過,所述盒不是本發(fā)明的先決條件。最終目標(biāo)是提供編碼具有多氨基酸延伸部分,不過仍然具有與相應(yīng)的天然載體蛋白相同的功能上完整的特性的載體蛋白的構(gòu)建體。所述最佳數(shù)量的密碼子優(yōu)選是能提供穩(wěn)定的具有多氨基酸延伸部分,并因此富集了選定的氨基酸殘基的載體蛋白的密碼子。通常,能夠作為延伸部分穩(wěn)定連接的氨基酸殘基的數(shù)量為四個(gè)-大約八十個(gè)氨基酸殘基或它們之間的任意數(shù)量。術(shù)語″氨基酸盒″還被用于編碼多氨基酸序列鏈的核苷酸序列或密碼子,它可以包括大量的一種或多種選定的氨基酸,并且所述鏈?zhǔn)桥c所述載體蛋白穩(wěn)定地連接的。可以與載體蛋白連接的氨基酸殘基的數(shù)量可以通過將包括不同數(shù)量的氨基酸密碼子的核苷酸序列盒隨機(jī)插入所述構(gòu)建體,并且通過在無細(xì)胞翻譯系統(tǒng)中篩選以驗(yàn)證正確的密碼子翻譯而測定。
″穩(wěn)定構(gòu)建體″的選擇通常是用″無細(xì)胞翻譯系統(tǒng)″進(jìn)行的,它表示體外翻譯(IVT)系統(tǒng),其中,在沒有細(xì)胞的情況下重建了正常的細(xì)胞反應(yīng),包括,例如,可以使用例如兔網(wǎng)狀細(xì)胞或小麥胚芽的裂解物由mRNA合成蛋白的IVT系統(tǒng)。特別優(yōu)選的系統(tǒng)是可以獲得的小麥胚芽無細(xì)胞翻譯系統(tǒng),例如(TNTT7/SP6偶聯(lián)的小麥胚芽提取系統(tǒng)L5030,Promega corporation)。
″定向表達(dá)或積累″表示氨基酸富集的蛋白是在特殊的,選定的植物組織或器官中表達(dá)的,或者被轉(zhuǎn)運(yùn)到所述選定的組織或器官中。這一目的可以通過選擇載體蛋白實(shí)現(xiàn),該蛋白參與了″細(xì)胞內(nèi)交通途徑″。所述途徑是膜成分-特異性交通途徑,細(xì)胞器特異性交通途徑等。所述植物中的細(xì)胞內(nèi)交通途徑將表達(dá)的蛋白轉(zhuǎn)運(yùn)到選定的器官和組織中,并因此使得表達(dá)的產(chǎn)物能夠積累在,例如,種子的細(xì)胞壁或細(xì)胞膜中。當(dāng)氨基酸富集的載體蛋白在轉(zhuǎn)基因蕓薹物種的種子中的表達(dá)被定向于種子細(xì)胞的細(xì)胞壁時(shí),它能夠?qū)被岣患牡鞍坠潭ㄔ趯⒂驼コ鲋髿埩舻挠驮炛?。所述油渣餅具有改善了的特性,即較高的氨基酸含量,它是用于飼料行業(yè)的組合物的有用成分。所述氨基酸富集的蛋白能夠以類似的方式在萵苣的葉肉組織中表達(dá),并且直接用作人類營養(yǎng)來源。
″選定的氨基酸″可以是任何氨基酸,不過,優(yōu)選的氨基酸是人類或牲畜需要的八種必需氨基酸中的一種或多種。選定的氨基酸可以是,例如,組氨酸,半胱氨酸,甲硫氨酸,甘氨酸,色氨酸,賴氨酸,丙氨酸,纈氨酸,亮氨酸,異亮氨酸,脯氨酸,苯丙氨酸,酪氨酸,絲氨酸,蘇氨酸,精氨酸,天冬氨酸,谷氨酸,天冬酰胺或谷氨酰胺。任何氨基酸富集的蛋白都可以通過本發(fā)明的方法制備,特別是以組氨酸富集的蛋白的制備為例。所述氨基酸富集的蛋白是通過提供包括編碼載體蛋白的核苷酸序列的構(gòu)建體獲得的,所述載體蛋白含有具有最佳數(shù)量的一個(gè)或多個(gè)密碼子盒的延伸部分,所述密碼子盒編碼需要的氨基酸,例如,His,Met-Cys,His-Met-Cys等。在本發(fā)明的優(yōu)選的中間或瞬時(shí)構(gòu)建體上,所述氨基酸密碼子融合(位于或放置)在編碼所述載體和所述報(bào)道蛋白的核苷酸序列之間,其融合方式使得額外的氨基酸殘基不會通過抑制它參與分泌性細(xì)胞內(nèi)交通途徑而破壞所述載體蛋白的正常生物學(xué)功能。
本發(fā)明的″載體蛋白″表示一種蛋白,它可以通過多氨基酸序列或肽穩(wěn)定地延伸。編碼功能上完整的載體蛋白的核苷酸序列是與包括一個(gè)或多個(gè)選定的編碼氨基酸殘基的密碼子的核苷酸盒框內(nèi)融合的。與相應(yīng)的天然未修飾過的蛋白相比,編碼需要的氨基酸殘基的插入密碼子不會干擾所述載體蛋白的正常生物學(xué)功能。編碼用于本發(fā)明的載體蛋白的核苷酸序列選自植物特異性蛋白。所述植物特異性蛋白利用分泌性細(xì)胞內(nèi)交通途徑,它使得所述氨基酸富集的蛋白能夠積累在細(xì)胞壁或細(xì)胞膜中。特別有用的是選定的植物組織或器官,包括種子,葉片,根和塊莖等的油體膜,細(xì)胞質(zhì)膜,液泡膜,質(zhì)體膜。在本發(fā)明中,載體蛋白來自編碼三種主要種子蛋白的基因。所述基因是用于使用種子蛋白,特別是來自十字花科的種子蛋白進(jìn)行遺傳工程化的有用的模型蛋白。另外,類似的遺傳工程化可應(yīng)用于任何其他植物物種。被用于本發(fā)明的所述三種典型的蛋白是種子蛋白cruciferin(500個(gè)氨基酸殘基),napin(165個(gè)氨基酸)和油質(zhì)蛋白(165個(gè)氨基酸),不過,其他蛋白,如caleosin和steroleosin也可以使用。上述所有蛋白存在于蕓薹的天然種子中,并且組氨酸含量較低。Cruciferin在每500個(gè)氨基酸中只包括9個(gè)His殘基。Napin在每165個(gè)氨基酸中只包括2個(gè)His殘基,而油質(zhì)蛋白根本不包含His。Cruciferin,油質(zhì)蛋白,napin,caleosin和steroleosin可應(yīng)用在用于飼料用途的種子中。
在本發(fā)明中,油質(zhì)蛋白(OLE)業(yè)已被用作模型載體蛋白,不過其他載體蛋白也能夠以類似方式使用。例如,上面所提到的兩種相關(guān)的蛋白caleosin和steroleosin被暗示為潛在有用的,因?yàn)樗鼈冊诜N子的油體和細(xì)胞壁中的積累方式相似。例如,油質(zhì)蛋白在以下文獻(xiàn)中進(jìn)行了綜述(i)Murphy 1996.TIBTECH 14.206-213;(ii)Methodsin Mol.Biol.vol.44Agrobacterium protocol.Eds.K.M.A.Gartland和(iii)M.R.Daey,Humamana Press Inc.Totowa,NJ;和Brassica OilseedsProduction and Utilization.Eds D.S.Kimber和D.I.McGregor.Cab International.1995。油質(zhì)蛋白被證實(shí)是有用的載體蛋白,因?yàn)樗鞘杷缘鞍祝哂休^小的尺寸,并且是環(huán)繞蕓薹種子的儲存油體的膜的成分。
在將來自選定的植物的核苷酸序列轉(zhuǎn)移到另一種選定的植物中時(shí),存在轉(zhuǎn)錄后基因沉默的潛在危險(xiǎn),特別是當(dāng)所述植物是密切相關(guān)或高度同源時(shí)更是如此。通過使用具有盡可能小的同源性的編碼載體蛋白的核苷酸序列,可以避免由于轉(zhuǎn)基因和內(nèi)源基因之間的核苷酸序列同源性造成在轉(zhuǎn)基因植物中誘導(dǎo)轉(zhuǎn)錄后基因沉默的危險(xiǎn)。例如,在本發(fā)明中,來自擬南芥,而不是來自蕓薹的載體蛋白(由Ole基因編碼)被成功地用于避免在轉(zhuǎn)化蕓薹時(shí)出現(xiàn)的問題。使用編碼運(yùn)動蛋白(MP)的基因的優(yōu)點(diǎn)是,該基因與蕓薹的內(nèi)源基因沒有序列同源性。
本發(fā)明的″載體蛋白″包括異構(gòu)體,即在某些氨基酸殘基上具有微小修飾的氨基酸序列。所述載體蛋白可以是天然載體蛋白的縮短形式。編碼″載體蛋白″的核苷酸序列還可以在某種程度上改變。例如,它們可以是截短的。唯一的前提是,編碼載體蛋白的基因具有完整的功能特性或基本上與天然載體蛋白相同的生物學(xué)功能,這意味著在選定的植物組織或器官中的定向表達(dá)。
″完整的功能特性″表示所述載體蛋白的表達(dá)可以定向到植物的選定的組織或器官或區(qū)室中。換句話說,具有多氨基酸延伸部分的載體蛋白必須在植物的選定的組織,器官或區(qū)室中積累。
″調(diào)控序列″表示核苷酸序列,它能通過下調(diào)或上調(diào)轉(zhuǎn)錄和表達(dá)而調(diào)控結(jié)構(gòu)核苷酸序列的轉(zhuǎn)錄和表達(dá)。調(diào)控序列包括啟動子,增強(qiáng)子,信號序列,終止子等。優(yōu)選的啟動子是相對短的器官或組織特異性轉(zhuǎn)錄啟動子,能夠在在形態(tài)發(fā)生的不同階段,特別是在胚胎發(fā)生期間驅(qū)動所述所述嵌合核苷酸序列的轉(zhuǎn)錄。其他潛在有用的啟動子是來自苜?;ㄈ~病毒(AMV)或花椰菜花葉病毒(CaMV)19S的植物病毒衍生的啟動子,以及可以通過環(huán)境作用(例如加熱)或在選定的的非生物(例如水楊酸反應(yīng))或生物(病原體)脅迫條件下調(diào)控的啟動子。
本發(fā)明優(yōu)選的和典型的″轉(zhuǎn)錄啟動子″是napin(NAP)啟動子,特別是來自擬南芥的啟動子,35S CaMV啟動子或嵌合″雜合″(HYB)啟動子,它包括與CaMV 35S啟動子的增強(qiáng)子序列偶聯(lián)的完整的napin啟動子。當(dāng)然,啟動子可以包括任何其他操縱調(diào)控序列,特別是使得能夠在選定的組織中積累氨基酸富集的蛋白的啟動子。優(yōu)選的組織是種子的油體和細(xì)胞壁。
控制napin(NAP)基因表達(dá)的napin啟動子是在胚胎發(fā)生期間調(diào)控的,并且在開花之后啟動。業(yè)已報(bào)道了來自擬南芥的NAP啟動子的核苷酸序列(Rask等1998.J.Plant.Physiol.152,595-599)。本發(fā)明的napin(NAP)啟動子的重要優(yōu)點(diǎn)是,與長度為2.1kb的Ole基因相比,它是相當(dāng)短的(152bp)。
業(yè)已證實(shí)花椰菜花葉病毒的35S啟動子(CaMV)在蕓薹細(xì)胞中有活性(Harpster等,1988.Mol.Gen.Genet.212,182-190)。所述35S啟動子在胚胎中也有活性,并且通過檢測開花之前成熟葉片中氨基酸富集的重組蛋白(OLE或MP)的產(chǎn)物,有利于檢測轉(zhuǎn)基因蕓薹植物。
″報(bào)道序列″或″編碼報(bào)道蛋白的核苷酸序列″表示用于設(shè)計(jì)中間或瞬時(shí)構(gòu)建體的核苷酸序列,它使得能夠選擇這樣的構(gòu)建體,該構(gòu)建體使得具有完整的生物學(xué)功能的穩(wěn)定的氨基酸富集的蛋白能夠在植物的選定的組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)或積累。在這種情況下,編碼所述報(bào)道蛋白的核苷酸序列使得能夠方便,準(zhǔn)確而又明確地鑒定合適的構(gòu)建體。所述報(bào)道序列使得能夠證實(shí)所述啟動子被活化的組織或器官,以及所述啟動子有活性的條件。在本發(fā)明的優(yōu)選實(shí)施方案中,所述報(bào)道蛋白是肉眼可見的或可檢測的蛋白,優(yōu)選熒光蛋白。優(yōu)選綠色熒光蛋白,β-葡糖醛酸酶,obelin或熒光素酶。具有所述報(bào)道序列的構(gòu)建體是中間或瞬時(shí)構(gòu)建體,因?yàn)橐坏┳C實(shí)了所述載體蛋白包括適當(dāng)表達(dá)的選定的多氨基酸序列延伸部分,就可以將所述報(bào)道序列除去。除去了所述報(bào)道基因,因?yàn)樗鼈兛赡懿淮嬖谟趯?shí)際的轉(zhuǎn)化構(gòu)建體中,所述構(gòu)建體被用于生產(chǎn)飼料或食品。
在本發(fā)明中,將兩種不同的系統(tǒng)用于加快有用的,穩(wěn)定的構(gòu)建體的選擇。將無細(xì)胞體外翻譯(IVT)系統(tǒng)和瞬時(shí)表達(dá)系統(tǒng)和瞬時(shí)表達(dá)系統(tǒng)用于選擇合適的轉(zhuǎn)化構(gòu)建體,它允許不干擾載體蛋白和氨基酸盒的表達(dá)。所述無細(xì)胞體外翻譯(IVT)系統(tǒng)使得能夠鑒定并因此選擇可以不出現(xiàn)任何問題而正確翻譯的最佳數(shù)量的密碼子。
將瞬時(shí)表達(dá)測定用于確保蛋白表達(dá),并且表達(dá)的蛋白與天然未修飾過的蛋白相比具有完整的生物學(xué)功能,并且是在植物的靶定組織或器官中表達(dá)和積累的。這一目的是通過對所述報(bào)道蛋白的肉眼觀察實(shí)現(xiàn)的。共焦激光掃描顯微技術(shù)是特別有用的,因?yàn)樗试S對表達(dá)與編碼所述報(bào)道蛋白的核苷酸序列框內(nèi)融合的氨基酸富集的蛋白的轉(zhuǎn)基因植物進(jìn)行早期檢測??梢詫⒒诳贵w的測定方法(例如,酶聯(lián)免疫吸附測定)和直接氨基酸分析用作檢測表達(dá)與編碼所述報(bào)道蛋白的核苷酸序列框內(nèi)融合的氨基酸富集的蛋白的轉(zhuǎn)基因植物的替代系統(tǒng)。
發(fā)明的一般說明本發(fā)明的主要目的是詳細(xì)說明提供用于提高植物細(xì)胞組織,如油體和細(xì)胞壁,特別是十字花科的種子中選定的氨基酸含量的措施的方法。通過本發(fā)明的方法,在轉(zhuǎn)基因蕓薹植物的胚胎發(fā)生期間成功地表達(dá)了穩(wěn)定的氨基酸富集的蛋白,并且表達(dá)的氨基酸富集的蛋白積累在種子中。通過本發(fā)明的方法和構(gòu)建體,種子細(xì)胞中的重組氨基酸富集的蛋白緊密結(jié)合在細(xì)胞膜或細(xì)胞壁(CW)上,并因此可以保留在種子殘留物中,在將油榨出之后錨定在油渣餅上。這使得能夠用隨后的回收方法回收油,并且具有改善了的特性,即增加的氨基酸殘余物,即油渣餅的使用提供了用于動物飼料制備的氨基酸富集的組合物的有用成分。當(dāng)在牛飼料中存在額外氨基酸,例如,組氨酸,并且與本發(fā)明的正常的天然蛋白結(jié)合時(shí),它起著天然氨基酸來源的作用,并且可以在牛代謝中正常利用。因此,氨基酸富集的,例如,組氨酸富集的蛋白是牛飼料中的有用成分,它起著牛奶生產(chǎn)的促進(jìn)劑的作用。其他有用氨基酸的富集,例如,在可食用萵苣葉片中的富集,使得可以將所述氨基酸富集的蛋白用作直接的人類食物來源,而不需要進(jìn)一步的加工。
位于選定的所需氨基酸-密碼子富集的序列下游的編碼報(bào)道蛋白的核苷酸序列,例如肉眼可檢測的綠色熒光蛋白(GFP),允許方便地檢測基因表達(dá)和表達(dá)蛋白在轉(zhuǎn)基因植物中的細(xì)胞內(nèi)定位。來自各種報(bào)道融合構(gòu)建體的報(bào)道蛋白的表達(dá)以GFP為例,并且在圖1示出,如圖6所示,它示出了選定的報(bào)道融合構(gòu)建體在單細(xì)胞,例如煙草表皮細(xì)胞中的瞬時(shí)表達(dá)。
因此,本發(fā)明涉及用于生產(chǎn)轉(zhuǎn)化過的植物,植物細(xì)胞,或細(xì)胞系的方法,它們能夠表達(dá)高水平的氨基酸富集的具有穩(wěn)定的多氨基酸延伸部分的載體蛋白,它們具體位于選定的植物組織或植物器官或植物細(xì)胞區(qū)室,包括種子膜性油體或細(xì)胞壁中。
本發(fā)明的方法包括用能夠在植物的靶定組織或器官中表達(dá)具有多氨基酸序列或延伸部分的載體蛋白的構(gòu)建體轉(zhuǎn)化植物或植物細(xì)胞。所述用于穩(wěn)定轉(zhuǎn)化的構(gòu)建體包括調(diào)控序列,包括器官-和/或組織特異性轉(zhuǎn)錄啟動子,它能夠在形態(tài)發(fā)生的不同階段,特別是在胚胎發(fā)生期間驅(qū)動編碼載體蛋白的感興趣的基因轉(zhuǎn)錄。所述調(diào)控序列可操作地與以下部分連接(a)編碼載體蛋白,沒有終止密碼子的核苷酸序列;和(b)包括至少一個(gè)盒的核苷酸序列,所述盒包括編碼需要的氨基酸殘基的至少兩個(gè)密碼子,是與編碼載體蛋白的核苷酸序列框內(nèi)融合的。
可以制備有或沒有報(bào)道基因的各種構(gòu)建體??梢酝ㄟ^利用體外翻譯(IVT)系統(tǒng)分析編碼氨基酸的受包括選定的啟動子在內(nèi)的調(diào)控序列控制的構(gòu)建體,所述系統(tǒng)允許觀察具有不同氨基酸盒的質(zhì)粒的穩(wěn)定性。報(bào)道構(gòu)建體還可以使用瞬時(shí)測定方法分析。
包括編碼在3’-末端具有氨基酸盒的載體蛋白的核苷酸序列的穩(wěn)定的構(gòu)建體是使用IVT-系統(tǒng)選擇的,這是通過為構(gòu)建體提供隨機(jī)選擇數(shù)量的氨基酸密碼子,例如至少兩個(gè)氨基酸密碼子,作為至少一個(gè)盒,不過優(yōu)選多個(gè),例如兩個(gè),四個(gè),六個(gè)或八個(gè)盒插入,并且分析獲得的結(jié)果而進(jìn)行的。例如,如果所述盒包括14個(gè)氨基酸密碼子(14x),這會得到在編碼功能上完整的載體蛋白(Ole或MP)下游具有28(2x),56(4x)和112(8x)個(gè)氨基酸密碼子的氨基酸富集的載體蛋白。初步試驗(yàn)表明8x(112個(gè)氨基酸)是不穩(wěn)定的,能產(chǎn)生缺失變體(微型質(zhì)粒)。另外,6x(84aa)個(gè)克隆的某一些不穩(wěn)定。因此,為了進(jìn)一步研究,將克隆2x,4x和6x與3′-近端報(bào)道基因,如具有3′-終止序列的GFP基因融合。采用完全相同的方式可以確定任何氨基酸密碼子的優(yōu)化數(shù)量,這是通過將不同數(shù)量的氨基酸密碼子插入包括編碼載體蛋白的核苷酸序列的構(gòu)建體,并且選擇提供穩(wěn)定結(jié)果的構(gòu)建體而進(jìn)行的。
對若干植物品系進(jìn)行的Western印跡分析(表1)證實(shí)了針對所有類型的載體蛋白,氨基酸,或報(bào)道蛋白,例如組氨酸序列,MP,油質(zhì)蛋白或GFP(圖13-15)產(chǎn)生的抗體可用于檢測具有已知分子量(MWs)的蛋白。油質(zhì)蛋白,MP,GFP和4X His-盒(在每一個(gè)盒中具有14個(gè)His密碼子)的推測的MWs分別為18.5,30,30,和2.5kDa。融合蛋白的合適的分子量可以作為組合的每一種融合成分的分子量的總和的值計(jì)算。在通過SDS-PAGE凝膠電泳和Western印跡分析時(shí)證實(shí)了所述融合蛋白的大小與預(yù)期的分子量相同。通過Western印跡分析研究了轉(zhuǎn)基因編碼的蛋白產(chǎn)物(油質(zhì)蛋白-His和MP-His)的穩(wěn)定性。在轉(zhuǎn)化之后對(自交)植物后代(第三代)進(jìn)行的分析明確表明了在后續(xù)世代中,轉(zhuǎn)基因表達(dá)是穩(wěn)定的。另外對檢查的轉(zhuǎn)化過的植物的Western印跡分析進(jìn)一步發(fā)現(xiàn),無論植物世代如何,蛋白產(chǎn)物的大小保持不變。以上分析還證實(shí)了,融合蛋白產(chǎn)物的含量在植物世代之間是相對穩(wěn)定的,它是獲得的相對其他植物蛋白的穩(wěn)定表達(dá)水平的指標(biāo)。
可以分別使用抗載體蛋白,報(bào)道蛋白或氨基酸的抗體分析轉(zhuǎn)化過的植物,任意一個(gè)都可用于獲得理想的結(jié)果??梢灾苯臃治瞿承┓N子的選定的氨基酸含量。一般,發(fā)生了一系列事件,其中,分析了前一組試驗(yàn),并且僅選擇了對以后的研究有作用和合適的構(gòu)建體,用于隨后的步驟。因此,在用于生產(chǎn)目的的最終植物轉(zhuǎn)化之前,通過常規(guī)方法本身分析并且檢查了很多方面,以便獲得需要的結(jié)果。具有所需特性的構(gòu)建體,包括穩(wěn)定轉(zhuǎn)化能表達(dá)穩(wěn)定的氨基酸富集的蛋白的植物,可以通過本文所披露的方法獲得。
所述報(bào)道蛋白使得能夠在無細(xì)胞體外翻譯(IVT)系統(tǒng)中方便而且準(zhǔn)確選擇一種構(gòu)建體,該構(gòu)建體提供了穩(wěn)定的氨基酸富集的載體蛋白的可靠表達(dá),該蛋白具有與瞬時(shí)表達(dá)系統(tǒng)組合的可檢測的報(bào)道蛋白。所述瞬時(shí)表達(dá)系統(tǒng)使得能夠驗(yàn)證所述載體蛋白的生物學(xué)功能沒有受到破壞。對于油質(zhì)蛋白來說,完整的生物學(xué)功能意味著所述報(bào)道蛋白是在種子的油體中表達(dá)的,特別是在種子細(xì)胞的細(xì)胞膜和細(xì)胞壁中表達(dá)。
選擇通過所述報(bào)道蛋白觀察到的具有載體蛋白的正常生物學(xué)功能的構(gòu)建體,并且除去編碼所述報(bào)道蛋白的核苷酸序列。因此,編碼載體蛋白的核苷酸序列和編碼需要的氨基酸的密碼子是框內(nèi)融合的。
選擇令人滿意的構(gòu)建體,并且轉(zhuǎn)入農(nóng)桿菌屬,并且通過合適的常規(guī)方法選擇陽性(含有構(gòu)建體)的克隆,例如,通過斑點(diǎn)印跡分析,Southern印跡雜交,并且用于轉(zhuǎn)化植物,優(yōu)選作物,特別是十字花科作物。所述轉(zhuǎn)化過的作物能表達(dá)穩(wěn)定的氨基酸富集的蛋白,并且將所述蛋白積累在靶定的或選定的植物組織中。
包括轉(zhuǎn)錄啟動子在內(nèi)的調(diào)控序列是從包括組織或器官特異性轉(zhuǎn)錄啟動子的調(diào)控序列中選擇的,它使得能夠在葉片,種子或其他需要的或選定的植物器官中進(jìn)行mRNA的定向合成,以便提供氨基酸富集的蛋白在所述器官中的定向積累。為了能夠選擇令人滿意的構(gòu)建體,將編碼選定的所需氨基酸殘基的氨基酸密碼子富集的序列放置在載體蛋白基因和編碼可檢測的報(bào)道基因的核苷酸序列之間的盒內(nèi),所述報(bào)道基因優(yōu)選熒光報(bào)道蛋白,例如,綠色熒光蛋白(GFP),β-葡糖醛酸酶或熒光素酶。
本發(fā)明的優(yōu)選作物屬于十字花科,其中,氨基酸富集的,特別是組氨酸富集的蛋白,根據(jù)它們在表達(dá)之后錨定并且定位在油體膜上的能力,提供了定向積累。根據(jù)相同的原理,可以獲得使得能夠在任何其他需要的植物物種和它們的組織中積累任何其他氨基酸富集的蛋白的構(gòu)建體。
上述目的是通過用包括編碼載體蛋白的核苷酸的構(gòu)建體轉(zhuǎn)化植物實(shí)現(xiàn)的,所述蛋白選自能夠在選定的分泌性細(xì)胞內(nèi)交通途徑中起作用的較小的植物蛋白,它能夠積累在選定的,靶定向的植物器官中,例如葉膜,種子膜,葉片或種子細(xì)胞的細(xì)胞壁。例如,在本發(fā)明中的例子是兩種不同的載體蛋白,油質(zhì)蛋白和TMV MP蛋白,包括與所述天然載體蛋白框內(nèi)融合,隨后積累在所述轉(zhuǎn)基因植物的選定的目標(biāo)組織中的多氨基酸尾。編碼所述載體蛋白的特別優(yōu)選的核苷酸序列是能夠在葉片或種子膜中積累的油質(zhì)蛋白和運(yùn)動蛋白,如TMV MP,在通過合適的啟動子驅(qū)動轉(zhuǎn)錄時(shí),它可以積累在葉片或種子細(xì)胞的細(xì)胞壁中。編碼所述載體蛋白的核苷酸序列優(yōu)選是從植物物種中獲得的,該蛋白對于轉(zhuǎn)化過的植物宿主來說不是內(nèi)源的。
編碼一種或多種氨基酸的核苷酸序列通常是作為一個(gè)或多個(gè)盒提供的,它們具有選定的氨基酸密碼子,所述密碼子編碼形成所述載體蛋白的選定的肽。包括編碼氨基酸殘基的核苷酸序列的盒優(yōu)選是這樣定位的,它不會破壞所述載體蛋白的正常生物學(xué)功能,即,所述載體蛋白的3′-末端。如果氨基酸密碼子位于所述載體蛋白的N-末端或中間的某處的話,所述氨基酸富集的蛋白不能夠根據(jù)需要積累在目標(biāo)器官中。編碼所述報(bào)道蛋白的核苷酸序列與富集了選定的氨基酸密碼子,但缺少終止密碼子的延長的核苷酸序列融合在相同的翻譯框內(nèi)。氨基酸密碼子的最佳數(shù)量大約為10-80個(gè),并且是通過在無細(xì)胞翻譯系統(tǒng)中檢查正確的蛋白翻譯確定的。
因此,在本發(fā)明的優(yōu)選的典型實(shí)施方案中,編碼載體蛋白的核苷酸序列位于核苷酸序列的5′-近端,而報(bào)道核苷酸序列位于3′-末端。在本發(fā)明中感興趣的優(yōu)選載體蛋白或核苷酸序列是OLE或TMV 30KMP。
用于本發(fā)明實(shí)施例中的OLE是相當(dāng)于編碼種子蛋白油質(zhì)蛋白(Ole)的擬南芥的染色體基因,油質(zhì)蛋白是十字花科成員的油體膜的成分。TMV 30K MP是來自煙草花葉病毒U1(TMVU1)基因組RNA的核苷酸序列。該基因編碼非結(jié)構(gòu)性疏水30K蛋白,它負(fù)責(zé)病毒基因組在受感染的植物中通過胞間連絲(PD)在細(xì)胞之間運(yùn)動(運(yùn)動蛋白,MP)。30KMP定向于并且積累在細(xì)胞壁中和PD中,并且是在MP基因的轉(zhuǎn)基因植物中表達(dá)的。
氨基酸密碼子的最佳數(shù)量是通過將包含編碼具有不同大小的延伸部分的載體蛋白的核苷酸序列的構(gòu)建體隨機(jī)轉(zhuǎn)化入植物并且選擇與天然未修飾過的蛋白相比能表達(dá)具有未受干擾的生物學(xué)功能的蛋白的轉(zhuǎn)基因植物確定的,所述構(gòu)建體包括不同數(shù)量的氨基酸密碼子,所述方法通過瞬時(shí)表達(dá)測定進(jìn)行評估。功能構(gòu)建體和成功的轉(zhuǎn)化可以通過表達(dá)的蛋白,特別是所述報(bào)道蛋白在轉(zhuǎn)基因植物中的表達(dá)和細(xì)胞內(nèi)定位方便地驗(yàn)證。
在本發(fā)明中,使用了遺傳工程方法,所述方法允許快速鑒定和選擇具有最佳密碼子含量的嵌合構(gòu)建體,使得氨基酸富集的蛋白能夠在目標(biāo)植物組織中穩(wěn)定地積累。
在本發(fā)明中,用于在轉(zhuǎn)基因植物生產(chǎn)氨基酸富集的蛋白的方法涉及制備上述一種或多種構(gòu)建體。優(yōu)選的選擇方法包括在無細(xì)胞翻譯系統(tǒng)中,由諸如(Ole-多氨基酸-GFP或TMV MP-多氨基酸-GFP)的構(gòu)建體表達(dá)熒光重組氨基酸富集的載體蛋白。用于本發(fā)明的無細(xì)胞翻譯系統(tǒng)是這樣一種方法,它能夠明確地鑒定正確的構(gòu)建體和重組氨基酸富集的蛋白的表達(dá)。除了常規(guī)檢測方法之外,通過GFP,或其他報(bào)道蛋白提供的熒光檢測可以使用種子和/或葉片的共焦激光掃描顯微技術(shù)進(jìn)行。共焦激光掃描顯微技術(shù)的應(yīng)用,提供了對表達(dá)與所述報(bào)道蛋白框內(nèi)融合的氨基酸富集的蛋白的早期檢測和篩選的便捷工具。
使用報(bào)道核苷酸序列插入片段的原因是,該蛋白可以用作標(biāo)記,用于證實(shí)所述構(gòu)建體和氨基酸富集的載體蛋白,例如來自重組序列的油質(zhì)蛋白-多氨基酸-GFP或TMV MP-多氨基酸-GFP的表達(dá)是正確的。熒光,特別是GFP-熒光可以通過共焦激光掃描顯微技術(shù)監(jiān)測,它允許檢測Ole-多氨基酸和MP-多氨基酸的體內(nèi)表達(dá),以及測定它們的表達(dá)水平。
植物表達(dá)載體包括編碼載體蛋白的核苷酸序列,如與各種長度并且攜帶報(bào)道基因,例如,位于3′-末端的GFP基因的多氨基酸編碼序列融合的Ole和TMV MP。為了構(gòu)建所述植物表達(dá)載體,所述構(gòu)建體與各種長度的富集了需要的氨基酸密碼子的序列融合,例如對于組氨酸來說,包括密碼子CAC和CAU,對于半胱氨酸和甲硫氨酸來說,包括密碼子TGT,TGC和ATG,對于甘氨酸來說,包括密碼子GGA,GGT,GGC,和GGG,而對于賴氨酸來說,包括密碼子AAA和AAG。所述構(gòu)建體缺少終止密碼子。合適的構(gòu)建體可以通過提供具有隨機(jī)選擇數(shù)量的氨基酸密碼子進(jìn)行選擇,例如,至少兩個(gè)氨基酸密碼子,將它作為至少一個(gè)盒插入,不過優(yōu)選多個(gè),例如兩個(gè),四個(gè),六個(gè),八個(gè)盒,并且分析所獲得的結(jié)果。例如,如果所述盒包括14個(gè)組氨酸密碼子(14x),它會產(chǎn)生位于編碼載體蛋白的基因(Ole或MP)下游的具有28(2x),56(4x)和112(8x)His-密碼子的氨基酸富集的載體蛋白。初步測試表明,8x(112個(gè)氨基酸)是不穩(wěn)定的,能產(chǎn)生缺失變體(微型質(zhì)粒)。另外,6x(84aa)個(gè)克隆中的某些是不穩(wěn)定的。因此,為了進(jìn)一步研究,將克隆2x,4x和6x與具有3′-終止序列的3′-近端GFP基因融合。采用完全相同的方法,可以測定任何氨基酸密碼子的最優(yōu)數(shù)量,這是通過將各種數(shù)量的氨基酸密碼子插入包括編碼載體蛋白的核苷酸序列的構(gòu)建體,并且選擇提供穩(wěn)定結(jié)果的構(gòu)建體。
構(gòu)建體,如圖1所示的構(gòu)建體包括調(diào)控序列,特別是啟動子,如napin啟動子NAP,35S CaMV啟動子或雜合HYB啟動子,它們可操作地連接在載體蛋白,特別是Ole和/或TMV MP上。所有構(gòu)建體都包括編碼報(bào)道蛋白的核苷酸序列,特別優(yōu)選的是綠色熒光蛋白(GFP),作為選擇的標(biāo)記。GFP基因與氨基酸尾框內(nèi)融合,所述氨基酸尾具有不同的長度,包括一個(gè)或多個(gè)盒,這些盒包括編碼需要的氨基酸的至少兩個(gè)氨基酸密碼子。具體地講,使用多個(gè)盒(2x,4x,6x)。將所述報(bào)道蛋白在瞬時(shí)表達(dá)測定中的熒光用于初步實(shí)驗(yàn),用來鑒定和篩選最佳的功能性構(gòu)建體。所述瞬時(shí)表達(dá)測定包括作物胚胎的微粒子轟擊,例如涉及蕓薹胚胎和Nicotiana benthamiana葉片的粒子轟擊的實(shí)驗(yàn),并且如表1所示。所述實(shí)驗(yàn)證實(shí)了NAP啟動子在胚胎中是有活性的,而HYB啟動子在胚胎和葉片表皮細(xì)胞中都是有效的。以上數(shù)據(jù)構(gòu)成了選擇四種(在十八種可利用的構(gòu)建體中,圖1)用于隨后的轉(zhuǎn)化研究的數(shù)據(jù)(圖2)。
優(yōu)選的轉(zhuǎn)化系統(tǒng)是農(nóng)桿菌屬介導(dǎo)的轉(zhuǎn)化。將上文所披露的每一種基因構(gòu)建體轉(zhuǎn)入根癌農(nóng)桿菌;通過Southern印跡雜交選擇轉(zhuǎn)化的克隆,然后將農(nóng)桿菌屬的每一種轉(zhuǎn)化的菌株用于轉(zhuǎn)化油菜籽春油菜(蕓薹)。表達(dá)氨基酸富集的載體蛋白(Ole-多氨基酸或MP-多氨基酸)的轉(zhuǎn)基因植物的后續(xù)選擇是通過以下步驟進(jìn)行的(a)PCR,使用對含有選定的氨基酸密碼子的Ole和TMV MP基因特異的引物(b)用抗油質(zhì)蛋白和30K TMV MP的抗體進(jìn)行Western印跡分析(c)檢測葉片,花,胚胎中的GFP熒光。
使用上述實(shí)驗(yàn)方法,當(dāng)業(yè)已發(fā)現(xiàn)了表達(dá)具有未受干擾的功能的蛋白克隆時(shí),可以將報(bào)道核苷酸序列從相應(yīng)的構(gòu)建體中除去,并且用所述功能驗(yàn)證過的構(gòu)建體轉(zhuǎn)化實(shí)際作物。
本發(fā)明的目的是提供在植物材料中包括具有穩(wěn)定的氨基酸盒的氨基酸富集的載體蛋白的組合物,特別是錨定在細(xì)胞壁上和在從油用植物中回收油之后獲得的油渣餅中的那些。在本發(fā)明的實(shí)施方案中,可以驗(yàn)證種子蛋白中穩(wěn)定的氨基酸富集。
本發(fā)明的原理可以通過多種已知的重組DNA技術(shù)實(shí)現(xiàn),這些技術(shù)是當(dāng)今可以獲得的。因此,本發(fā)明的以下概述披露了優(yōu)選實(shí)施方案。
在下面的實(shí)施例中將對本發(fā)明作更詳細(xì)的說明。氨基酸富集的蛋白的生產(chǎn)以組氨酸,甲硫氨酸,半胱氨酸,甘氨酸和賴氨酸為例,不過,本發(fā)明所披露的原理可應(yīng)用于任何其他需要的氨基酸,這是通過插入包含用于任何選定的目的選定數(shù)量的所需氨基酸密碼子的盒而實(shí)現(xiàn)的。
實(shí)施例1染色體DNA分離和PCR
按以下方法分離染色體DNA。用研缽在液氮中將300μg的擬南芥葉片組織勻漿成細(xì)粉。然后添加3ml的100mM Tris-HCl;pH 8.0,500mM NaCl,50mM EDTA,在添加600μl的10%SDS和500μl的20%聚乙烯吡咯烷酮(平均分子量為360,000)之后進(jìn)一步研磨。將混合物轉(zhuǎn)移到聚丙烯試管中,并且在65℃下孵育10分鐘。然后將450μl的冰冷的乙酸鉀添加到該溶液中,并且通過顛倒試管輕柔搖晃所述混合物,在冰上孵育30分鐘,并且在4℃下8000rpm的速度離心10分鐘。用苯酚/氯仿(1∶1)提取上清液,并且用異丙醇使DNA沉淀。用70%乙醇洗滌沉淀的DNA,并且風(fēng)干,然后溶解到10mMTris-HCl;pH 8.0中。所述PCR反應(yīng)混合物在25μl的反應(yīng)體積中包括1xPCR緩沖液(10x緩沖液500mM KCl,100mM Tris-HCl;pH 9.0,25℃和Triton X-100),1.5mM MgCl2,1μl的Taq聚合酶(5U/μl),0.2mM的每一種dNTP,0.4μM的引物和3μg的擬南芥基因組DNA。通過在95℃下加熱3分鐘使模板變性,并且用iCyclerTM(Bio-Rad)熱循環(huán)儀進(jìn)行30輪PCR,在95℃下變性1分鐘,引物在65℃下退火1.5分鐘,在72℃下進(jìn)行引物延伸2分鐘,在30輪之后在72℃下進(jìn)行最終的延伸步驟10分鐘。具有預(yù)期大小(776bp)的PCR產(chǎn)物是在對最終的PCR反應(yīng)混合物進(jìn)行電泳之后從1%瓊脂糖凝膠中分離的,用凝膠切片試劑盒(Qiagen)純化,然后用1個(gè)單位的T4 DNA聚合酶在補(bǔ)充了100mM dNTP的1X T4 DNA聚合酶反應(yīng)緩沖液(50mM NaCl,10mM Tris-HCl;pH 7.9,10mM MgCl2,1mM二硫蘇糖醇)中在14℃下處理15分鐘,然后克隆。
實(shí)施例2組氨酸密碼子富集的DNA序列的合成和克隆為了構(gòu)建組氨酸密碼子富集的DNA片段,使用了三種化學(xué)合成的ssDNA片段H-P-1(SEQ ID NO1)5′-GCGCCTCGAGTTCACCATCACCATCACCATCACGGGCACCATCAC,H-P-2(SEQ ID NO2)5′-CATCACCATCACCATGG和H-M(SEQ ID NO3)5′-CCGGATCCTAAAGTCGACCATGGTGATGGTGATGGTGATGGTGCC。
為了獲得具有His密碼子富集的序列的dsDNA片段,讓寡核苷酸H-M和H-P-2在1X AMV逆轉(zhuǎn)錄酶(RT)反應(yīng)緩沖液(50mM Tris-HCl;pH8.3,50mM KCl,10mM MgCl2,0.5mM亞精胺,10mM DTT)中,在室溫下退火30分鐘,并且鏈延伸反應(yīng)是在存在1X AMV RT緩沖液,1mMdNTPs和1單位的AMV RT的條件下在37℃下進(jìn)行45分鐘。通過瓊脂糖凝膠電泳從未退火的寡核苷酸中分離反應(yīng)產(chǎn)物,純化,并且在1X DNA聚合酶I大(Klenow)片段緩沖液(50mM Tris-HCl;pH 7.2,10mM MgSO4,0.1mM DTT)中在室溫下與寡核苷酸H-P-1退火30分鐘。鏈延伸反應(yīng)是使用5單位的Klenow聚合酶在存在25mM每一種dNTPs的條件下,在1X Klenow緩沖液中在37℃下進(jìn)行30分鐘。將預(yù)期大小(79bp)的dsDNA片段從瓊脂糖凝膠上切除(在適當(dāng)?shù)碾娪痉蛛x之后),純化,用XhoI和BamHI消化,并且克隆到以類似方法消化的克隆載體pGEM-7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)中。在限制性分析和測序之后,選擇克隆pGEM-His-24進(jìn)行進(jìn)一步操作。該克隆包括的DNA片段有可能編碼包括14個(gè)His殘基的19個(gè)氨基酸長的肽圖3a)。該DNA片段的序列的旁側(cè)是XhoI和BamHI位點(diǎn),并且還包括被設(shè)計(jì)用于隨后的克隆步驟的SalI限制位點(diǎn)(圖3a)。
實(shí)施例3半胱氨酸和甲硫氨酸密碼子富集的DNA序列合成和克隆為了構(gòu)建半胱氨酸和甲硫氨酸密碼子富集的DNA片段,使用了兩種化學(xué)合成的ssDNA片段C-M-P-1(SEQ ID NO4)5′CACCTCGAGTATGTTGTTGCATGTGCATGTGCTGTTGCATGTCGACAAAC 3′和C-M-P-2(SEQ ID NO5)5′GTTTGTCGACATGCAACAGCACATGCACATGCAACAACATACTCGAGGTG 3′為了獲得具有Cys/Met密碼子富集的序列的dsDNA片段,讓寡核苷酸C-M-P-1和C-M-P-2在1X DNA聚合酶I大(Klenow)片段緩沖液(50mM Tris-HCl;pH 7.2,10mM MgSO4,0.1mM DTT)中在室溫下退火30分鐘。將預(yù)期大小(50bp)的dsDNA片段從瓊脂糖凝膠上切除(在適當(dāng)?shù)碾娪痉蛛x之后),純化,用XhoI和BamHI消化,并且克隆到以類似方法消化的克隆載體pGEM-7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)中。在限制性分析和測序之后,選擇克隆pGEM-Cys/Met-10作進(jìn)一步的操作。該克隆包括的DNA片段可能編碼包括10個(gè)Cys/Met-氨基酸殘基的16個(gè)氨基酸長的肽(圖3b)。該DNA片段的序列的旁側(cè)是XhoI和BamHI位點(diǎn),并且還包括被設(shè)計(jì)用于隨后的克隆步驟的SalI限制位點(diǎn)(圖3b)。
實(shí)施例4甘氨酸密碼子富集的DNA序列的合成和克隆為了構(gòu)建甘氨酸密碼子富集的DNA片段,使用了兩種化學(xué)合成的ssDNA片段GL-P-1(SEQ ID NO6)5′-GCGCCTCGAGTTGGTGGAGGTGGAGGCGGTGGAGGTGGCGTCGACAAATGGATCCCC-3′和GL-P-2(SEQ ID NO7)5′-GGGGATCCATTTGTAGACGCCACCTCCTCCACCGCCTCCACCTCCACCAACTCGAGGCGC-3′為了獲得具有甘氨酸密碼子富集的序列的dsDNA片段,讓寡核苷酸GL-P-1和GL-P-2在1X DNA聚合酶I大(Klenow)片段緩沖液(50mMTris-HCl;pH 7.2,10mM MgSO4,0.1mM DTT)中在室溫下退火30分鐘。將預(yù)期大小(60bp)的dsDNA片段從瓊脂糖凝膠上切除(在適當(dāng)?shù)碾娪痉蛛x之后),純化,用XhoI和BamHI消化,并且克隆到以類似方法消化的克隆載體pGEM-7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)中。在限制性分析和測序之后,選擇克隆pGEM-Gly-9作進(jìn)一步操作。該克隆所包括的DNA片段有可能編碼包括9個(gè)Gly-氨基酸殘基的19個(gè)氨基酸長的肽(圖3c)。該DNA片段的序列的旁側(cè)是XhoI和BamHI位點(diǎn),并且還包括被設(shè)計(jì)用于隨后的克隆步驟的SaI限制位點(diǎn)(圖3c)。
實(shí)施例5賴氨酸密碼子富集的DNA序列的合成和構(gòu)建為了構(gòu)建賴氨酸密碼子富集的DNA片段,使用了兩種化學(xué)合成的ssDNA片段L-P-1(SEQ ID NO8)5′-GCGCCTCGAGTTAAAAAGAAAAAGAAAAAGAAAAAGAAAAAGAAAAAGGTCGACAAATGGATCCCC-3′和L-P-2(SEQ ID NO9)5′-GGGGATCCATTTGTCGACCTTTTTCTTTTTCTTTTTCTTTTTCTTTTTCTTTTTAA CTCGAGGCGC-3′為了獲得具有賴氨酸密碼子富集的序列的dsDNA片段,讓寡核苷酸L-P-1和L-P-2在1X DNA聚合酶I大(Klenow)片段緩沖液(50mMTris-HCl;pH 7.2,10mM MgSO4,0.1mM DTT)中在室溫下退火30分鐘。將預(yù)期大小(66bp)的dsDNA片段從瓊脂糖凝膠上切除(在適當(dāng)?shù)碾娪痉蛛x之后),純化,用XhoI和BamHI消化,并且克隆到以類似方法消化的克隆載體pGEM-7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)中。在限制性分析和測序之后,選擇克隆pGEM-Lys-12作進(jìn)一步操作。該克隆所包括的DNA片段有可能編碼包括12賴氨酸氨基酸殘基的22個(gè)氨基酸長的肽(圖3d)。該DNA片段的序列的旁側(cè)是XhoI和BamHI位點(diǎn),并且還包括被設(shè)計(jì)用于隨后的克隆步驟的SaI限制位點(diǎn)(圖3d)。
實(shí)施例6通過PCR從擬南芥染色體DNA中分離油質(zhì)蛋白(ole)基因以及隨后進(jìn)行克隆為了克隆來自擬南芥染色體DNA的油質(zhì)蛋白基因,化學(xué)合成了兩種寡核苷酸引物OLE-P(SEQ ID NO10)5′-AAAACCATGGCGGATACAGCTAGAGGAACCCATC和OLE-M(SEQ ID NO11)5′-GGGGCCATGGGAGTAGTGTGCTGGCCACCACGAGTAC.
將OLE-P和OLE-M用作來自擬南芥的基因組DNA的PCR的引物(實(shí)施例1)。所獲得的PCR片段是平端的,并且克隆到pGEM-3Zf(+)(PromegaCorporation,USA;產(chǎn)品目錄號P2271)的SmaI位點(diǎn)上。
通過限制性分析和測序驗(yàn)證重組克隆。為了進(jìn)行隨后的研究,選擇克隆pOLE4H。與公開的油質(zhì)蛋白序列(X62353)相比,克隆pOLE4H的序列包括位于基因內(nèi)含子上的一個(gè)核苷酸取代(所編碼的氨基酸序列沒有變化),即與公開序列(X62353)相比在pOLE4H序列的513號位置上的G→A取代。
化學(xué)合成了OLE-3′XhoI(SEQ ID NO12)5′-GCGCCTCGAGAAGTAGTGTGCTGGCCACCAC,并且用作PCR引物,擴(kuò)增來自質(zhì)粒pOLE4H的油質(zhì)蛋白編碼區(qū);將所述PCR產(chǎn)物克隆到pGEM7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)的XhoI位點(diǎn)上。在用該引物克隆pOLE4H序列之后,通過測序驗(yàn)證所得到的克隆的序列,以便確保保留了所有油質(zhì)蛋白基因的編碼特性。根據(jù)這一分析,選擇克隆pOLE4/11。pOLE4/11包括缺少終止密碼子的野生型油質(zhì)蛋白基因,其旁側(cè)是適合后續(xù)克隆步驟的NcoI和XhoI限制位點(diǎn)。
實(shí)施例7使用RT-PCR從煙草花葉病毒(TMV 30K MP)基因組RNA中分離30K運(yùn)動蛋白基因以及隨后進(jìn)行克隆為了克隆來自TMV基因組RNA的30K基因,化學(xué)合成了兩種特異性寡核苷酸引物寡核苷酸引物N30K(SEQ ID NO13)5′-GCGGAATTCCCATGGCTCTAGTTGTTAAAGG)和寡核苷酸引物C30K(SEQ ID NO14)5′-AGACCTCGAGGAAACGAATCCGATTCGGCGAC;所述引物分別包括EcoRI限制位點(diǎn)和XhoI限制位點(diǎn)。第一條cDNA鏈?zhǔn)怯蒚MV基因組RNA合成的,使用了20nM的C30K引物,1mM dNTPs和1單位的AMV,在1X AMV逆轉(zhuǎn)錄酶(RT)反應(yīng)緩沖液(50mM Tris-HCl;8.3,50mMKCl,10mM MgCl2,0.5mM亞精胺,10mM DTT)中在37℃下進(jìn)行45分鐘。此后將5μl的反應(yīng)混合物放在1xPCR緩沖液(10x緩沖液500mM KCl,100mM Tris-HCl;pH 9.0,25℃和Triton X-100)中進(jìn)行PCR反應(yīng),所述緩沖液具有1.5mM MgCl2,21μl的Taq聚合酶(5U/μl),0.2mM每一種dNTP,濃度為0.4μM的引物,反應(yīng)體積為25μl。通過在95℃下加熱3分鐘使模板變性,并且用iCycler(Bio-Rad)熱循環(huán)儀進(jìn)行28輪PCR,在95℃下變性1分鐘,引物在68℃下退火1.5分鐘,在72℃進(jìn)行引物延伸2分鐘,在30輪之后進(jìn)行的最終的延伸步驟是在72℃下進(jìn)行10分鐘。通過EcoRI和XhoI裂解所得到的DNA產(chǎn)物,并且克隆到EcoRI-XhoI-消化的pGEM-7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)中。然后對重組克隆進(jìn)行限制性分析和測序,選擇質(zhì)粒pGEM-30K作進(jìn)一步研究。在該質(zhì)粒中,TMV 30K MP基因的終止密碼子被XhoI位點(diǎn)所取代,以便隨后與His,Cys/Met,Gly和Lys密碼子富集的序列融合(實(shí)施例2-5;圖3a-d)。
實(shí)施例8微粒子轟擊微粒子(顆粒)轟擊是使用高壓的基于氦氣的裝置PDS-1000(Bio-Rad)通過盤破裂方法進(jìn)行的,正如Morozov等所披露的(1997)。通過在70%乙醇中對60mg的鎢進(jìn)行渦旋攪拌3-5分鐘制備鎢顆粒,然后在工作臺上孵育15分鐘。通過短時(shí)間離心對混合物進(jìn)行沉淀,并且去掉上清液。將無菌水添加到顆粒上,并且渦旋攪拌1分鐘。讓顆粒沉降1分鐘,并且離心2秒鐘。去掉上清液。重復(fù)這一過程三次。添加無菌50%的甘油,使顆粒濃度達(dá)到60mg/ml。對每一次粒子轟擊來說,將DNA沉淀在具有氯化鈣和乙醇的鎢顆粒上(M-20,1.3μ)。將5-10μg的質(zhì)粒DNA,50μl的CaCl2(2.5M)和20μl的亞精胺(0.1M)混合,并且渦旋攪拌2-3分鐘,使它沉降,并且離心2秒鐘。去掉上清液,并且將140μl的70%乙醇添加到沉淀的表面,去掉所述乙醇,并且添加100%乙醇,并且去掉乙醇,而不干擾沉淀,并且重復(fù)。將6μl的懸浮液用吸液管轉(zhuǎn)移到大型載體上,并且用于轟擊。將Nicotiana benthamiana的分離的葉片(15-30mm大)放置在塑料Petri培養(yǎng)皿的中央,并且在固體支持物上轟擊,靶標(biāo)距離為7cm。轟擊是使用1350kPa的氦氣脈沖在真空室中進(jìn)行的。在粒子轟擊24小時(shí)之后分析接種的葉片。使用共焦激光掃描顯像系統(tǒng)MRC-1024(Bio-Rad)監(jiān)測GFP熒光。
實(shí)施例9構(gòu)建超量表達(dá)油質(zhì)蛋白C-末端親水性末端的大腸桿菌菌株用于隨后的兔免疫并且獲得油質(zhì)蛋白-特異性抗體大部分油質(zhì)蛋白N-末端區(qū)是疏水性的,而由油質(zhì)蛋白基因的第二個(gè)外顯子編碼的油質(zhì)蛋白C-末端部分的氨基酸序列是親水性序列,它適合在大腸桿菌中表達(dá),并且用作免疫抗原。因此,選擇C-末端油質(zhì)蛋白區(qū)(aa 120-173)用于這一目的。通過PCR反應(yīng)擴(kuò)增油質(zhì)蛋白基因的第二個(gè)外顯子,使用質(zhì)粒pOLE4/11(實(shí)施例6)作模板和寡核苷酸引物OLE-EX-B(SEQ ID NO15)(5′-TGTGGGATCCTACGCAACGGGAGAGCACCCA)和OLE-3′XhoI(SEQ ID NO12)(5′-GCGCCTCGAGAAGTAGTGTGCTGGCCACCAC)分別包括BamHI限制位點(diǎn)和XhoI限制位點(diǎn)。所得到的PCR產(chǎn)物用BamHl和XhoI消化,并且克隆到XhoI-和BamHI-消化的pGEM-7Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2251)中。在對所得到的克隆進(jìn)行限制性分析和測序之后,選擇克隆pGEM-OLE2EX用于隨后的克隆步驟。為了獲得表達(dá)構(gòu)建體,通過用BamHI和XhoI消化將油質(zhì)蛋白第二外顯子的區(qū)從pGEM-OLE2EX上去掉,并且克隆到(BamHI和SalI消化的)表達(dá)載體pQE30(QIAGEN)中。在所得到的pQE-OLE2EX中,油質(zhì)蛋白基因的3′-末端部分與包括6xHis標(biāo)記的前導(dǎo)序列翻譯融合,這使得它能夠親和純化表達(dá)的產(chǎn)物。將質(zhì)粒pQE-OLE2EX轉(zhuǎn)入大腸桿菌菌株M15[pREP4](QIAGEN)。重組蛋白表達(dá)的誘導(dǎo)是在Luria培養(yǎng)液中通過添加最終濃度為1mM的IPTG,然后在旋轉(zhuǎn)搖床上在37℃下以220rpm的速度培養(yǎng)2-4小時(shí)而進(jìn)行的。從誘導(dǎo)過的和未誘導(dǎo)過的對照培養(yǎng)物中收集大腸桿菌細(xì)胞,并且通過SDS-PAGE分析重組蛋白的表達(dá)。對于SDS-PAGE來說,制備了12.5%的丙烯酰胺凝膠。凝膠在100V/500mA的條件下電泳451h,并且隨后在CBB(0.05%考馬斯亮藍(lán),50%甲醇,7%冰醋酸)中染色,并且在7%甲醇/5%乙酸中脫染色。在誘導(dǎo)培養(yǎng)物中,出現(xiàn)的主要的帶在未誘導(dǎo)過的培養(yǎng)物中缺乏。該帶的遷移率相當(dāng)于油質(zhì)蛋白基因的His-標(biāo)記的C-末端部分的預(yù)期的遷移率(8.3kDa)。
實(shí)施例10體外翻譯系統(tǒng)無細(xì)胞體外翻譯(IVT)系統(tǒng)使得能夠選擇/鑒定可正確翻譯的最佳數(shù)量的密碼子。該IVT系統(tǒng)由小麥胚芽提取物組成,該提取物包括在存在低濃度的雙鏈RNA(dsRNA)或氧化硫醇的條件下翻譯外源RNA所必需的所有成分(例如,70S或80S核糖體,tRNAs,氨?;?tRNA合成酶,起始,延伸和終止因子)。所述提取物還包括必需氨基酸,能源(ATP,GTP),能量再生系統(tǒng)(磷酸肌酸和肌酸磷酸激酶)和其他必需的輔因子(Mg2+,K+等)。
選擇具有2,4和6個(gè)His密碼子富集的序列重復(fù)的克隆用于IVT分析。質(zhì)粒pMP-1x,pMP-2x,pMP-4x,和pMP-6x包括與具有不同重復(fù)長度的His-編碼序列融合的30K MP基因,它受T7啟動子的控制。用BamHI將質(zhì)粒線性化,并且用作使用T7 RNA聚合酶的IVT模板。在小麥胚芽無細(xì)胞系統(tǒng)(TNTTT7/SP6偶聯(lián)的小麥胚芽提取系統(tǒng)L5030,Promega corporation)中翻譯等量的所得到的轉(zhuǎn)錄物。結(jié)果一致地觀察到了相當(dāng)于具有一個(gè),兩個(gè)和四個(gè)重復(fù)的His富集的序列(MP-1x,MP-2x,和MP-4x)的克隆的轉(zhuǎn)錄物,產(chǎn)生了預(yù)期分子量的產(chǎn)物,而有可能編碼具有6個(gè)重復(fù)的His-富集序列(MP-6x)的蛋白的轉(zhuǎn)錄物是以低效率翻譯的,并且導(dǎo)致了低分子量的污染的產(chǎn)物。這種用于克隆篩選/鑒定的方法在實(shí)施例11-14中說明。
實(shí)施例11組氨酸密碼子富集的DNA序列與TMV 30K MP基因的融合,并且使用體外翻譯系統(tǒng)檢測His密碼子富集的基因的正確翻譯His密碼子富集的序列和TMV 30K MP基因之間的融合是通過適當(dāng)克隆包括編碼14個(gè)His殘基(=一個(gè)盒)(圖3a)的序列的pGEM-His-24(實(shí)施例2),和包括缺少天然終止密碼子的TMV 30KMP基因的質(zhì)粒pGEM-30K(實(shí)施例7)的組合獲得的。為了獲得與MP基因融合的具有不同長度的His密碼子-富集的序列,采用了逐步克隆方法(圖4)。在第一個(gè)步驟中,用EcoRI和XhoI將30K MP基因從pGEM-30K上切除,并且用XhoI和BamHI將來自pGEM-His-24的His密碼子富集的序列切除。將這兩種DNA片段連接到用EcoRI和BamHI(圖4)消化過的pGEM-3Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2271)上。所得到的克隆被命名為pMP-1x,它具有來自pGEM-His-24的與TMV 30K MP基因融合的一個(gè)組氨酸-編碼序列單位(盒)。
為了增加MP融合體上His-編碼″尾″的長度進(jìn)行的額外的逐步克隆步驟是以pMP-1x質(zhì)粒為基礎(chǔ)的。所述克隆使用了限制位點(diǎn)XhoI和SalI,這些位點(diǎn)業(yè)已被設(shè)計(jì)在pGEM-His-24的His密碼子富集的序列上,以便位于所編碼的多肽的讀框上。綜合用XhoI和SalI消化能產(chǎn)生相同的粘端這一事實(shí),這保存了在下面所披露的其他克隆步驟中所得到的添加-放大的含有His序列的讀框。為了獲得具有來自pGEM-His-24,pMP-2x的兩個(gè)組氨酸-編碼序列單位的質(zhì)粒,將來自pMP-1x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-1x上,導(dǎo)致了組氨酸-編碼序列單位的加倍。因此,所得到的pMP-2x包括位于MP C-末端″尾″上的24個(gè)組氨酸殘基。然后,為了獲得pMP-4x,將來自pMP-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-2x上;為了獲得pMP-6x,將來自pMP-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-2x上;以及為了獲得pMP-8x,將來自pMP-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-4x上。具體地講,重復(fù)類似的克隆,以便獲得在MP C-末端″尾″(圖4)上具有56,84和112個(gè)組氨酸殘基(4x,6x和8x盒)的質(zhì)粒。
在C-末端″尾″具有112個(gè)His密碼子的克隆(pMP-8x系列)是不穩(wěn)定的,并且在液體培養(yǎng)基中生長時(shí)產(chǎn)生缺失變體(微型質(zhì)粒)。在液體培養(yǎng)基中反復(fù)生長時(shí)的較低的穩(wěn)定性還出現(xiàn)在具有84個(gè)組氨酸的某些克隆(pMP-6x系列)中。因此,對于其他實(shí)驗(yàn)來說,只選擇了具有2,4和6個(gè)重復(fù)的His密碼子富集的序列克隆,pMP-2x,pMP-4x,和pMP-6x(圖4)。
在質(zhì)粒pMP-1x,pMP-2x,pMP-4x,和pMP-6x上,與不同長度的His-編碼序列融合的30K MP基因受T7啟動子的控制。用BamHI將所述質(zhì)粒線性化,然后用T7 RNA聚合酶體外轉(zhuǎn)錄。在小麥胚芽無細(xì)胞系統(tǒng)(TNTT7/SP6偶聯(lián)的小麥胚芽提取系統(tǒng)L5030 Promegacorporation,參見實(shí)施例10)中翻譯等量的所得到的轉(zhuǎn)錄物。發(fā)現(xiàn)具有一個(gè),兩個(gè)和四個(gè)重復(fù)的His富集的序列(trMP-1x,trMP-2x,和trMP-4x)的克隆的轉(zhuǎn)錄物產(chǎn)生了分子量逐漸增加的預(yù)期的產(chǎn)物,而有可能編碼具有6個(gè)重復(fù)的His富集的序列(trMP-6x)的蛋白的轉(zhuǎn)錄物翻譯效率低下,并且產(chǎn)生了低分子量的污染的產(chǎn)物。該實(shí)驗(yàn)證實(shí)了植物核糖體翻譯超過56個(gè)殘基的His密碼子富集的序列時(shí)出現(xiàn)了錯誤,例如,His密碼子可能表示“饑餓”密碼子,此時(shí),核糖體終止和堵塞。根據(jù)該實(shí)驗(yàn)僅選擇了具有2和4個(gè)重復(fù)的克隆用于進(jìn)一步的體內(nèi)研究。
實(shí)施例12半胱氨酸/甲硫氨酸密碼子富集的DNA序列與TMV 30K MP基因的融合和利用體外翻譯系統(tǒng)檢驗(yàn)Cys/Met密碼子富集的基因的正確翻譯Cys/Met密碼子富集的序列和TMV 30K MP基因的融合,是通過適當(dāng)克隆包括編碼10個(gè)Cys/Met殘基(=一個(gè)盒)(圖3b)的序列的pGEM-Cys/Met-10(實(shí)施例3),和包括缺少天然終止密碼子的TMV 30KMP基因的質(zhì)粒pGEM-30K的組合獲得的(實(shí)施例7),如實(shí)施例10所述。為了獲得具有不同長度的與MP基因融合的Cys/Met密碼子富集的序列,進(jìn)行了逐步克隆過程(圖4)。在第一個(gè)步驟中,用EcoRI和XhoI將30K MP基因從pGEM-30K上切除,并且用XhoI和BamHI將Cys/Met-密碼子富集的序列從pGEM-Cys/Met-10上切除。將這兩個(gè)DNA片段連接在用EcoRI和BamHI(圖4)消化過的pGEM-3Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2271)上。所得到的克隆被命名為pMP-Cys/Met-1x,它具有來自pGEM-Cys/Met-10的與TMV30K MP基因融合的一個(gè)半胱氨酸/甲硫氨酸-編碼序列單位(盒)。
為了獲得具有來自pGEM-Cys/Met-10,pMP-Cys/Met-2x的兩個(gè)半胱氨酸/甲硫氨酸-編碼序列單位的質(zhì)粒,將來自pMP-Cys/Met-1x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Cys/Met-1x上,導(dǎo)致了半胱氨酸/甲硫氨酸-編碼序列單位的加倍。因此,所得到的pMP-Cys/Met-2x質(zhì)粒在MP C-末端″尾″包括20個(gè)半胱氨酸/甲硫氨酸殘基。然后,為了獲得pMP-Cys/Met-4x,將來自pMP-Cys/Met-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Cys/Met-2x上;為了獲得pMP-Cys/Met-6x,將來自pMP-Cys/Met-4x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化過的pMP-Cys/Met-2x上;以及為了獲得pMP-Cys/Met-8x,將來自pMP-Cys/Met-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Cys/Met-4x上。
在質(zhì)粒pMP-Cys/Met-1x,pMP-Cys/Met-2x,pMP-CYs/Met-4x,和pMP-Cys/Met-6x上,與不同長度的Cys/Met-編碼序列融合的30K MP基因受T7啟動子的控制。用BamHI將質(zhì)粒線性化,并且用T7 RNA聚合酶進(jìn)行體外轉(zhuǎn)錄。在小麥胚芽無細(xì)胞系統(tǒng)(TNTT7/SP6結(jié)合的小麥胚芽提取系統(tǒng)L5030 Promega corporation)中對等量的所得到的轉(zhuǎn)錄物進(jìn)行翻譯。發(fā)現(xiàn)具有Cys/Met富集的序列的一個(gè),兩個(gè)和四個(gè)盒(MP-Cys/Met-1x,MP-Cys/Met-2x,和MP-Cys/Met-4x)的克隆的轉(zhuǎn)錄物產(chǎn)生了分子量逐漸增加的預(yù)期的產(chǎn)物。正如在實(shí)施例11中所披露的,多氨基酸序列長度的增加,導(dǎo)致了轉(zhuǎn)錄物穩(wěn)定性的降低。對于其他實(shí)驗(yàn)來說,僅選擇了具有Cys/Met密碼子富集的序列的2,4和6個(gè)盒(MP-Cys/Met-2x,MP-Cys/Met-4x和MP-Cys/Met-6x)的克隆。
實(shí)施例13甘氨酸密碼子富集的DNA序列與TMV 30K MP基因的融合以及使用體外翻譯系統(tǒng)檢測Gly密碼子富集的基因的正確翻譯甘氨酸密碼子富集的序列和TMV 30K MP基因之間的融合是通過適當(dāng)克隆包括編碼9個(gè)Gly殘基(=一個(gè)盒)(圖3c)的序列的pGEM-Gly-9(實(shí)施例4),和包括缺少天然終止密碼子的TMV 30K MP基因的質(zhì)粒pGEM-30K的組合獲得的,如實(shí)施例10所披露的。為了獲得與MP基因融合的具有不同長度的甘氨酸密碼子富集的序列,按實(shí)施例11和實(shí)施例12所述,并且如圖4所示進(jìn)行了逐步克隆方法。
所得到的第一個(gè)克隆被命名為pMP-Gly-1x,它具有來自pGEM-Gly-9的與TMV 30K MP基因融合的一個(gè)甘氨酸-編碼序列單位(盒)。然后,按實(shí)施例11和12所述方法對該盒進(jìn)行“加倍”,以便產(chǎn)生克隆pMP-Gly-2x,pMP-Gly-4x,pMP-Gly-6x,和pMP-Gly-8x。為了獲得來自pGEM-Gly-9,pMP-Gly-2x的兩個(gè)甘氨酸-編碼序列單位的質(zhì)粒,將來自pMP-Gly-1x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化過的pMP-Gly-1x上,導(dǎo)致了甘氨酸-編碼序列單位的加倍。然后,為了獲得pMP-Gly-4x,將來自pMP-Gly-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Gly-2x上;為了獲得pMP-Gly-6x,將來自pMP-Gly-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Gly-2x上;以及為了獲得pMP-Gly-8x,將來自pMP-Gly-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Gly-4x上。用BamHI將質(zhì)粒線性化,并且用T7 RNA聚合酶進(jìn)行體外轉(zhuǎn)錄,并且在小麥胚芽無細(xì)胞系統(tǒng)(TNTT7/SP6偶聯(lián)的小麥胚芽提取系統(tǒng)L5030 Promega corporation,參見實(shí)施例10)中翻譯。正如實(shí)施例11所披露的,多氨基酸序列長度的增加,導(dǎo)致了轉(zhuǎn)錄物穩(wěn)定性的降低。對于其他實(shí)驗(yàn)來說,僅選擇了具有甘氨酸密碼子富集的序列的2和4個(gè)盒(MP-Gly-2x,和MP-Gly-4x)的克隆。
實(shí)施例14賴氨酸密碼子富集的DNA序列與TMV 30K MP基因的融合以及利用體外翻譯系統(tǒng)檢查Lys密碼子富集的基因的正確翻譯賴氨酸密碼子富集的序列和TMV 30K MP基因之間的融合是通過適當(dāng)克隆包括編碼12個(gè)Lys殘基(=一個(gè)盒)(圖3d)的序列的pGEM-Lys-12(實(shí)施例5),和包括缺少天然終止密碼子的TMV 30K MP基因的質(zhì)粒pGEM-30K的組合獲得的,如實(shí)施例11-13所述。為了獲得與MP基因融合的具有不同長度的賴氨酸密碼子富集的序列,按實(shí)施例11,12和13所述以及如圖4所示進(jìn)行逐步克隆方法。
所得到的第一種克隆被命名為pMP-Lys-1x,它具有來自pGEM-Lys-12的與TMV 30K MP基因融合的一個(gè)賴氨酸-編碼序列單位(盒)。然后,該盒按實(shí)施例11,12和13所述進(jìn)行“加倍”;為了產(chǎn)生克隆pMP-Lys-2x,pMP-Lys-4x,pMP-Lys-6x,和pMP-Lys-8x,將來自pMP-Lys-4x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化過的pMP-Lys-4x上。為了獲得具有來自pGEM-Lys-12,pMP-Lys-2x的兩個(gè)賴氨酸-編碼序列單位的質(zhì)粒,將來自pMP-Lys-1x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化過的pMP-Lys-1x上,導(dǎo)致了賴氨酸-編碼序列單位的加倍。然后,為了獲得pMP-Lys-4x,將來自pMP-Lys-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Lys-2x上;為了獲得pMP-Lys-6x,將來自pMP-Lys-4x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化過的pMP-Lys-2x上;以及為了獲得pMP-Lys-8x,將來自pMP-Lys-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化過的pMP-Lys-4x上。用BamHI將質(zhì)粒線性化,并且用T7RNA聚合酶進(jìn)行體外轉(zhuǎn)錄,并且在小麥胚芽無細(xì)胞系統(tǒng)(TNTT7/SP6偶聯(lián)的小麥胚芽提取系統(tǒng)L5030 Promega corporation,參見實(shí)施例10)中翻譯。如實(shí)施例10-12所述,多氨基酸序列長度的增加,導(dǎo)致了轉(zhuǎn)錄物穩(wěn)定性的降低。對于其他實(shí)驗(yàn)來說,僅選擇了具有賴氨酸密碼子富集的序列的2和4個(gè)盒(MP-Lys-2x,和MP-Lys-4x)的克隆。
實(shí)施例15通過PCR從擬南芥染色體DNA中分離napin啟動子并且隨后克隆為了克隆來自擬南芥染色體DNA的napin啟動子,化學(xué)合成了兩種寡核苷酸引物NAP-P(SEQ ID NO16)5′-TCTTACTCGAGTGAAACCAAATTAAC和NAP-M(SEQ ID NO17)5′-CTTGTTAGCCATGGTTTGCTATTTGTG。
為了方便隨后的克隆,引物序列包括XhoI和NcoI限制位點(diǎn)。擬南芥染色體DNA是按照在分離(實(shí)施例1)和克隆油質(zhì)蛋白基因(實(shí)施例6)部分所披露的方法分離的。PCR反應(yīng)是按照上文對油質(zhì)蛋白基因(實(shí)施例6)所述方法進(jìn)行的,所不同的是,MgCl2在反應(yīng)混合物中的濃度為1.5mM。在電泳之后,將預(yù)期大小(369bp)的PCR產(chǎn)物從1%瓊脂糖凝膠中分離出來。純化所述PCR產(chǎn)物,并且用T4 DNA聚合酶在存在dNTP的條件下,在14℃下按實(shí)施例1所述方法處理,并且克隆到SmaI-消化過的pGEM-3Zf(+)(Promega Corporation,USA;產(chǎn)品目錄號P2271)上。在測序之后,選擇克隆pGEM-NAP4和pGEM-NAP9作后續(xù)研究。
實(shí)施例16構(gòu)建包括napin啟動子(NAP)或嵌合啟動子(HYB)的表達(dá)質(zhì)粒,它包括花椰菜花葉病毒35S啟動子的完整的napin啟動子和增強(qiáng)子區(qū)使用質(zhì)粒pRT100構(gòu)建包括napin啟動子的植物表達(dá)載體(Tpfer等,Nucleic Acid Res.15(14)5890,1987)。將一組植物表達(dá)載體用于轉(zhuǎn)錄和翻譯融合。Nucleic Acids Res.15(14)5890,1987)。在圖7中示出了制備具有2x-Gly的MP和GFP的融合體(即MP-Gly-2x-GFP)的基本方法。該方法利用了XhoI/SalI限制位點(diǎn),它們具有不同的裂解位點(diǎn),但是具有類似的產(chǎn)生4個(gè)堿基的DNA末端。將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除,并且將兩種DNA片段連接到pRT101上(Tpfer等,Nucleic Acids Res.15(14)5890,1987)。用EcoRI和BamHI消化以便得到構(gòu)建體pRT-MP-2x-GFP。pRT100包括花椰菜花葉病毒的35S啟動子(CaMV 35S啟動子)。為了構(gòu)建pNAP(其中去掉了完整的CaMV 35S啟動子序列,并且用napin啟動子的序列取代),用Hind II和NcoI將napin啟動子區(qū)從質(zhì)粒pGEM-NAP4上切除(實(shí)施例15),并且連接到用Hind II和NcoI消化過的pRT100上(圖5)。為了構(gòu)建其中用napin啟動子序列取代了35S啟動子的啟動子區(qū)的pHYB(所述35S啟動子保留了位于插入的napin啟動子序列上游的35S增強(qiáng)子),用XhoI消化pGEM-NAP9(實(shí)施例15),用Klenow酶形成平端,并且用NcoI消化。所得到的片段連接到用EcoRV和NcoI消化過的pRT100上。
實(shí)施例17將His富集的油質(zhì)蛋白和TMV 30K MP基因克隆到包括CaMV 35S,napin,和嵌合啟動子的表達(dá)質(zhì)粒上。
在圖7-12中披露了詳細(xì)的構(gòu)建細(xì)節(jié)。
首先,獲得一組構(gòu)建體,其中,表示融合蛋白的基因包括TMV MP,His富集的序列,和GFP,它們受35S CaMV啟動子的控制(圖7)。選擇具有三種不同長度的His富集的序列(即具有兩個(gè),四個(gè),和六個(gè)重復(fù)的His-編碼序列單位的序列,實(shí)施例11)。用EcoRI和SalI將與兩個(gè)His-編碼單位融合的MP基因從pMP-2x上切除(圖4),將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除,并且將這兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上,以便得到構(gòu)建體pRT-MP-2x-GFP。類似地,為了獲得pRT-MP-4x-GFP,用EcoRI和SalI將與四個(gè)His-編碼單位融合的MP基因從pMP-4x上切除(圖4),將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除(有關(guān)細(xì)節(jié)參見圖7),并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101。為了獲得pRT-MP-6x-GFP,用EcoRI和SalI將與六個(gè)His-編碼單位融合的MP基因從pMP-6x上切除(圖4),將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除,并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上(圖7)。
為了獲得受napin啟動子控制的相同的構(gòu)建體(取代CaMV 35S啟動子),進(jìn)行了以下克隆步驟。將TMV 30K MP基因的N-末端部分作為NcoI-Hind III-片段從pGEM-30K上切除;用HindIII和XbaI將包括與兩個(gè)His-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-2x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上,以便得到pNAP-MP-2x-GFP。通過類似方法,為了獲得pNAP-MP-4x-GFP,將TMV 30K MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將包括與四個(gè)His-編碼單位融合的MP基因的其余部分和GFP基因從pRT-MP-6x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上。最后,為了構(gòu)建pNAP-MP-6x-GFP,將TMV 30K MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將包括與六個(gè)His-編碼單位融合的MP基因的其余部分和GFP基因從pRT-MP-6x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上(圖8)。
用類似克隆,以便獲得其中的MP-His-GFP融合基因受雜合啟動子控制的構(gòu)建體。將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除;用HindIII和XbaI將包括與兩個(gè)His-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-2x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pHYB上,以便得到pHYB-MP-2x-GFP。為了獲得pHYB-MP-4x-GFP,將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將包括與四個(gè)His-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-6x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pHYB(圖8)上。為了構(gòu)建pHYB-MP-6x-GFP,將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將包括與六個(gè)His-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-6x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pHYB上。根據(jù)來自pOLE4/11的油質(zhì)蛋白基因,構(gòu)建了三組表達(dá)載體,它們具有CaMV35S,napin,或雜合啟動子,每一組包括三種不同長度的His-編碼區(qū)(圖9)。
為了構(gòu)建基于CaMV 35S啟動子的表達(dá)載體,進(jìn)行了以下克隆方法。將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)His-編碼序列單位從pHYB-MP-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上,得到了構(gòu)建體pRT-OLE-2x-GFP。為了獲得pRT-OLE-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)His-編碼序列單位的片段從pHYB-MP-4x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上。為了獲得pRT-OLE-6x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的六個(gè)His-編碼序列單位的片段從pHYB-MP-6x-GFP上切除,然后將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上(圖10)。
將類似的克隆方法應(yīng)用于構(gòu)建基于napin啟動子的表達(dá)載體。將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)His-編碼序列單位從pHYB-MP-2x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pNAP上,得到了構(gòu)建體pNAP-OLE-2x-GFP。為了獲得pNAP-OLE-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)His-編碼序列單位從pHYB-MP-4x-GFP質(zhì)粒上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pNAP上。為了獲得pNAP-OLE-6x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的六個(gè)His-編碼序列單位從pHYB-MP-6x-GFP質(zhì)粒上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pNAP上(圖11)。
用類似方法構(gòu)建了基于雜合啟動子的表達(dá)載體系列。將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)His-編碼序列單位從pHYB-MP-2x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上,得到了構(gòu)建體pHYB-OLE-2x-GFP。為了獲得pHYB-OLE-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)His-編碼序列單位從pHYB-MP-4x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上。為了獲得pHYB-OLE-6x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的六個(gè)His-編碼序列單位從pHYB-MP-6x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上(圖12)。
實(shí)施例18將Cys/Met富集的油質(zhì)蛋白和TMV 30K MP基因克隆到包括CaM35S,napin,和嵌合啟動子的表達(dá)質(zhì)粒上。
選擇三種不同長度的Cys/Met富集的序列(具有兩個(gè),四個(gè)和六個(gè)重復(fù)的Cys/Met-編碼序列單位,實(shí)施例12)。用EcoRI和SalI將與兩個(gè)Cys/Met-編碼單位融合的MP基因從pMP-Cys/Met-2x上切除,將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除,并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上,以便得到構(gòu)建體pRT-MP-Cys/Met-2x-GFP。用EcoRI和SalI將與四個(gè)Cys/Met-編碼單位融合的MP基因從pMP-Cys/Met-4x上切除,將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除,并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上,以便得到構(gòu)建體pRT-MP-Cys/Met-4x-GFP(圖7)。
為了獲得受napin啟動子控制的等同的構(gòu)建體(取代CaMV 35S啟動子),執(zhí)行以下克隆步驟。將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除;用HindIII和XbaI將包括與兩個(gè)Cys/Met-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Cys/Met-2x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上,以便得到pNAP-MP-Cys/Met-2x-GFP。為了獲得pNAP-MP-Cys/Met-4x-GFP,通過類似方法將TMV 30KMP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用Hind III和XbaI將包括與四個(gè)Cys/Met-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Cys/Met-2x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上。最后,為了構(gòu)建pNAP-MP-Cys/Met-6x-GFP,將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將包括與六個(gè)Cys/Met-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Cys/Met-6x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上(圖8)。
為了獲得其中的MP-Cys/Met-GFP融合基因受雜合啟動子(HYB)控制的構(gòu)建體,采用了類似的克隆方法。將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,用HindIII和XbaI將包括與兩個(gè)Cys/Met-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Cys/Met-2x-GFP上切除,并且將兩種片段連接到用Ncol和BamHI消化過的pHYB上,以便得到pHYB-MP-Cys/Met-2x-GFP。為了獲得pHYB-MP-Cys/Met-4x-GFP,將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,用HindlI和XbaI將包括與四個(gè)Cys/Met-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Cys/Met-4x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pHYB上。為了構(gòu)建pHYB-MP-Cys/Met-6x-GFP,將TMV MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,用HindIII和XbaI將包括與六個(gè)Cys/Met-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Cys/Met-4x-GFP上切除,并且將兩種片段連接到用Ncol和BamHI消化過的pHYB上。根據(jù)來自pOLE4/11的油質(zhì)蛋白基因,構(gòu)建了三組表達(dá)載體,它們具有CaMV 35S,napin,或雜合啟動子,每一組包括兩種不同長度的Gly-編碼區(qū),如實(shí)施例16所述(圖9)。
為了構(gòu)建基于CaMV 35S啟動子的表達(dá)載體,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Cys/Met-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上,得到了構(gòu)建體pRT-OLE-Cys/Met-2x-GFP。為了獲得pRT-OLE-Cys/Met-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Gly-4x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上。為了獲得pRT-OLE-Cys/Met-6x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的六個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Cys/Met-6x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上(圖10)。
類似地,為了構(gòu)建基于napin啟動子的表達(dá)載體,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Cys/Met-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pNAP上,得到了構(gòu)建體pNAP-OLE-Cys/Met-2x-GFP。為了獲得pNAP-OLE-Cys/Met-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Cys/Met-4x-GFP質(zhì)粒上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pNAP上。為了獲得pNAP-OLE-Cys/Met-6x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的六個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Cys/Met-6x-GFP質(zhì)粒上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pNAP上(圖11)。
基于雜合啟動子的表達(dá)載體是以類似方式構(gòu)建的。將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,并且用XhoI和BamHI將包括與GFP基因融合的兩個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Gly-2x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上,得到了構(gòu)建體pHYB-OLE-Cys/Met-2x-GFP。為了獲得pHYB-OLE-Cys/Met-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Gly-4x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上。為了獲得pHYB-OLE-Cys/Met-6x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Cys/Met-編碼單位的片段從pHYB-MP-Gly-6x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上(圖12)。
實(shí)施例19將甘氨酸富集的TMV 30K MP和油質(zhì)蛋白基因克隆到包括CaMV35S,napin,和嵌合啟動子的表達(dá)質(zhì)粒上選擇具有兩種不同長度的甘氨酸富集的序列(具有兩個(gè)和四個(gè)重復(fù)的Gly-編碼序列單位)(實(shí)施例13)。用EcoRI和SalI將與兩個(gè)Gly-編碼單位融合的MP基因從pMP-Gly-2x上切除,將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除(有關(guān)細(xì)節(jié)參見圖7),并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上,以便得到構(gòu)建體pRT-MP-Gly-2x-GFP。用EcoRI和SalI將與四個(gè)Gly-編碼單位融合的MP基因從pMP-Gly-4x上切除,將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除,并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上,以便獲得pRT-MP-Gly-4x-GFP(圖7)。
為了獲得為了獲得受napin啟動子控制的等同構(gòu)建體(取代CaMV35S啟動子),將TMV MP基因的NcoI-HindIII-片段從pGEM-30K上切除(所述片段包括與兩個(gè)Gly-編碼單位融合的MP基因融合的其余部分),并且用HindIII和XbaI將GFP基因從pRT-MP-Gly-2x-GF上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上,以便得到pNAP-MP-Gly-2x-GFP。為了獲得pNAP-MP-Gly-4x-GFP,將TMV30K MP基因的N-末端部分作為EcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將包括與四個(gè)Gly-編碼單位融合的MP基因的其余部分和GFP基因的片段從pNAP-MP-Gly-2x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上(圖8)。
為了獲得雜合啟動子構(gòu)建體(HYB),將TMV MP基因的N末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將GFP基因從pRT-MP-Gly-2x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP上,以便得到pHYB-MP-Gly-2x-GFP。為了獲得pHYB-MP-Gly-4x-GFP,將TMV 30K MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用HindIII和XbaI將包括與四個(gè)Gly-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Gly-2x-GFP上切除,并且將兩種片段連接到用Ncol和BamHI消化過的pHYB上(圖9)。
根據(jù)來自pOLE4/11的油質(zhì)蛋白基因,構(gòu)建了三組表達(dá)載體,它們具有CaMV 35S,napin,或雜合啟動子,每一組包括兩種不同長度的Gly-編碼區(qū),如實(shí)施例16所述。為了構(gòu)建基于CaMV 35S啟動子的表達(dá)載體,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)Gly-編碼序列單位的區(qū)域從pHYB-MP-Gly-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上,得到了構(gòu)建體pRT-OLE-Gly-2x-GFP。為了獲得pRT-OLE-Gly-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XlzoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Gly-編碼序列單位的區(qū)域從pHYB-MP-Gly-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上(圖10)。
類似地,對于基于napin啟動子的表達(dá)載體來說,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)Gly-編碼序列單位的區(qū)域從pHYB-MP-Gly-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pNAP上,得到了構(gòu)建體pNAP-OLE-Gly-2x-GFP。為了獲得pNAP-OLE-Gly-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Gly-編碼序列單位的區(qū)域從pHYB-MP-Gly-4x-GFP質(zhì)粒上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pNAP上(圖11)。
基于雜合啟動子類型的表達(dá)載體是用類似方式構(gòu)建的。將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,并且用XhoI和BamHI將包括與GFP基因融合的兩個(gè)Gly-編碼序列單位的區(qū)域從pHYB-MP-Gly-2x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上,得到了構(gòu)建體pHYB-OLE-Gly-2x-GFP。為了獲得pHYB-OLE-Gly-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Gly-編碼序列單位的區(qū)域從pHYB-MP-Gly-4x-GFP上切除,并且將兩種DNA片段連接到用Ncol和BamHI消化過的pHYB上(圖12)。
實(shí)施例20將賴氨酸富集的TMV 30K MP和油質(zhì)蛋白基因克隆到包括CaMV35S,napin,和嵌合啟動子的表達(dá)質(zhì)粒上。
選擇具有兩種不同長度的賴氨酸富集的序列(具有兩個(gè)和四個(gè)重復(fù)的Lys-編碼序列單位)(實(shí)施例14)。用EcoRI和SalI將與兩個(gè)Lys-編碼單位融合的MP基因從pMP-Lys-2x上切除,將GFP基因作為XhoI-BamHI-片段從pRT-GFP上切除,并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上,得到了構(gòu)建體pRT-MP-Lys-2x-GFP。用EcoRI和SalI將與四個(gè)Lys-編碼單位融合的MP基因從pMP-Lys-4x上切除,將GFP基因從作為XhoI-BamHI-片段pRT-GFP上切除,并且將兩種DNA片段連接到用EcoRI和BamHI消化過的pRT101上,以便獲得pRT-MP-Lys-4x-GFP,如在實(shí)施例17-19及在圖7中所披露的。
為了獲得受napin和雜合(HYB)啟動子控制的構(gòu)建體(取代CaMV35S啟動子),將TMV MP基因的NcoI-HindIII-片段從pGEM-30K上切除(包括與兩個(gè)Lys-編碼單位融合的MP基因的其余部分的片段),并且用HindIII和XbaI將GFP基因從pRT-MP-Lys-2x-GFP上切除,并且將兩種片段連接到用NcoI和BamHI消化過的pNAP或pHYB上,以便分別得到pNAP-MP-Lys-2x-GFP和pHYB-MP-Lys-2x-GFP。為了獲得pNAP-MP-Lys-4x-GFP和pHYB-MP-Lys-4x-GFP,將TMV 30K MP基因的N-末端部分作為NcoI-HindIII-片段從pGEM-30K上切除,并且用Hind III和XbaI將包括與四個(gè)Lys-編碼單位融合的MP基因的其余部分和GFP基因的片段從pRT-MP-Lys-2x-GFP上切除,并且將兩種片段連接到分別用NcoI和BamHI-消化過的pNAP和pHYB上(如圖8和9)。
根據(jù)來自pOLE4/11的油質(zhì)蛋白基因,構(gòu)建了三組表達(dá)載體,它們具有CaMV 35S,napin,或雜合啟動子,每一組包括具有兩種不同長度的Lys-編碼區(qū),如實(shí)施例19所述。為了構(gòu)建基于CaMV 35S,napin或HYB啟動子的表達(dá)載體,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的兩個(gè)Lys-編碼序列單位的片段從pHYB-MP-Lys-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上,得到了構(gòu)建體pRT-OLE-Lys-2x-GFP,pNAP-OLE-Lys-2x-GFP和pHYB-OLE-Lys-2x-GFP。為了獲得pRT-OLE-Lys-4x-GFP,pNAP-OLE-Lys-4x-GFP,和pHYB-OLE-Lys-4x-GFP,將油質(zhì)蛋白基因作為NcoI-XhoI-片段從pOLE4/11上切除,用XhoI和BamHI將包括與GFP基因融合的四個(gè)Lys-編碼序列單位的片段從pHYB-MP-Lys-2x-GFP上切除,并且將兩種DNA片段連接到用NcoI和BamHI消化過的pRT100上。
實(shí)施例21瞬時(shí)表達(dá)系統(tǒng)將瞬時(shí)表達(dá)測定用于確保蛋白表達(dá),并且所表達(dá)的蛋白與天然未修飾過的蛋白相比具有完整的生物學(xué)功能,并且積累在目標(biāo)器官中,這一目的是通過肉眼觀察所述報(bào)道蛋白實(shí)現(xiàn)的。共焦激光掃描顯微技術(shù)是特別有用的,因?yàn)樗軌蛟缙跈z測能表達(dá)與編碼所述報(bào)道蛋白的核苷酸序列框內(nèi)融合的氨基酸富集的蛋白的轉(zhuǎn)基因植物?;诳贵w的測定方法(例如,酶聯(lián)免疫吸附測定)和直接氨基酸分析可用作替代系統(tǒng),用于檢測能表達(dá)與編碼所述報(bào)道蛋白的核苷酸序列框內(nèi)融合的氨基酸富集的蛋白的轉(zhuǎn)基因植物。
實(shí)施例22利用GFP基因在通過粒子轟擊轉(zhuǎn)化的植物細(xì)胞中的瞬時(shí)表達(dá)檢測napin和嵌合啟動子的活性為了分析由pNAP中的napin啟動子提供的相對轉(zhuǎn)錄水平,將pHYB上的雜合啟動子,和pRT1009上的CaMV 35S啟動子,所述報(bào)道蛋白的編碼區(qū)GFP克隆到所述質(zhì)粒上。為了構(gòu)建包括GFP的克隆,使用了用于紅色遷移GFP突變體(S65T)的基因。將GFP編碼區(qū)作為NcoI-BamHI-片段克隆到用類似方法消化過的pRT100,pNAP和pHYB中。
用pHYB-GFP(包括受雜合啟動子控制的GFP編碼區(qū))進(jìn)行粒子轟擊(實(shí)施例8)瞬時(shí)轉(zhuǎn)化的Nicotiana benthamiana表皮細(xì)胞能明確表達(dá)GFP。觀察到的GFP表達(dá)水平與對照pRT-GFP相當(dāng),對照中GFP表達(dá)受CaMV 35S啟動子的控制。以上實(shí)驗(yàn)表明,pHYB-GFP表達(dá)盒在活植物細(xì)胞中具有完整的功能(圖6表示pRT-OLE-4x-GFP和pHYB-OLE-4x-GFP)。pNAP-GFP在種子胚胎的早期階段表達(dá),并且所述胚胎業(yè)已檢測出能發(fā)出熒光。
實(shí)施例23將表達(dá)盒克隆到二元載體上,并且將相應(yīng)的二元載體轉(zhuǎn)化入農(nóng)桿菌屬在農(nóng)桿菌屬轉(zhuǎn)化之前,將受來自pRT-衍生物的CaMV 35S,napin和嵌合啟動子控制的包括GFP-標(biāo)記的組氨酸,半胱氨酸/甲硫氨酸,甘氨酸和賴氨酸-富集的油質(zhì)蛋白(ole)和TMV MP基因的基因盒克隆到所述植物轉(zhuǎn)化二元載體pBin19的T-DNA-所在的HindIII位點(diǎn)上。
具有超強(qiáng)毒力的,減毒的腫瘤誘導(dǎo)質(zhì)粒pTi Bo542的根癌農(nóng)桿菌AGLI(Lazo等,1991.Biotechnology 3,963-967)通過進(jìn)行過某些改進(jìn)的Holsters方法進(jìn)行凍-溶轉(zhuǎn)化(Holsters等,1978.Mol.Gen.Genet.163,181-187)。在26℃下將農(nóng)桿菌屬在補(bǔ)充了0.5gl-1MgSO4的LB-瓊脂平板上培養(yǎng)兩天,然后在補(bǔ)充了50μg/ml利福平的液體2XYT培養(yǎng)基上培養(yǎng)到指數(shù)中期,然后用150mM NaCl洗滌,并且在轉(zhuǎn)化之前以大約1010cfu ml-1重新懸浮在20mM CaCl2中。在添加甘油至15%的最終濃度之后,將細(xì)胞懸浮液的等份樣品放在液氮中冷凍。在向細(xì)胞中添加5μg的DNA之后對所述細(xì)胞進(jìn)行解凍,并且在冰上孵育15分鐘,然后在37℃下熱激5分鐘。用新鮮的2X YT培養(yǎng)基稀釋細(xì)胞,并且在28℃下進(jìn)行劇烈通氣培養(yǎng)2小時(shí),然后轉(zhuǎn)移到含有50gμg ml-1利福平和100μgml-1卡那霉素的1%瓊脂平板上。通過PCR分析重組構(gòu)建體的存在或缺乏,從而篩選卡那霉素抗性菌落。
實(shí)施例24農(nóng)桿菌屬介導(dǎo)的蕓薹轉(zhuǎn)化蕓薹植物的轉(zhuǎn)化基本上是按照公開方法進(jìn)行的(Moloney等,植物細(xì)胞報(bào)道8,238-272,1989)。在22℃下在具有培養(yǎng)基I(MurashigeMinimal Organics(MMO),具有3%蔗糖,4mg/1 BAP,0.7%Phytoagar)的1%瓊脂上將子葉與合適的農(nóng)桿菌屬細(xì)胞懸浮液一起培養(yǎng)2-3天。用蒸餾水洗滌子葉三次,然后轉(zhuǎn)移到裝有培養(yǎng)基II(MMO,具有4mg/LBAP,3%蔗糖,300mg/l羧噻吩青霉素(DUCHEFA)和0.7%Phytoagar)的petri培養(yǎng)皿上。再過7-10天之后,將外植體轉(zhuǎn)移到培養(yǎng)基III中(MMO,具有4mg/L BAP,3%蔗糖,300mg/l羧噻吩青霉素,25mg/l卡那霉素和0.7%Phytoagar)。再培養(yǎng)2-3周之后,將具有綠色愈傷組織或未成熟的綠色枝條的外植體轉(zhuǎn)移到新的培養(yǎng)基中。為了形成枝條,將愈傷組織和未成熟的綠色枝條轉(zhuǎn)移到培養(yǎng)基IV(MMO,具有3%蔗糖,300mg/l羧噻吩青霉素,25mg/l卡那霉素和0.7%Phytoagar)。將完全形成的枝條轉(zhuǎn)移到培養(yǎng)基V中(MMO,具有0.2mg/lIBA,3%蔗糖,300mg/l羧噻吩青霉素和0.7%Phytoagar)用于生根。一旦形成了完善的根系統(tǒng),將具有根的枝條從瓊脂上取出,轉(zhuǎn)移到潮濕的盆栽土壤中,并且在22℃下,用16小時(shí)光照/8小時(shí)黑暗的光周期生長,光照強(qiáng)度為12.1μmolm-2s-1。
實(shí)施例25在蕓薹中避免基因沉默在使用來自蕓薹的Ole編碼核苷酸序列時(shí),存在轉(zhuǎn)錄后基因沉默的危險(xiǎn)。在用Ole基因轉(zhuǎn)化蕓薹時(shí)在轉(zhuǎn)基因植物中由于轉(zhuǎn)基因和內(nèi)源基因之間的核苷酸序列同源性導(dǎo)致了誘導(dǎo)轉(zhuǎn)錄后基因沉默的危險(xiǎn),在本發(fā)明中通過使用來自擬南芥而不是來自蕓薹的Ole基因得到了成功地避免。一個(gè)基因與另一個(gè)基因的長度和同源性程度影響基因的沉默。如果導(dǎo)入的基因與內(nèi)源基因具有100%的序列同源性的話,基因沉默是可能的。根據(jù)哪一種蕓薹油質(zhì)蛋白與擬南芥油質(zhì)蛋白相比(目前存在于NCBI數(shù)據(jù)庫中),在DNA水平上的序列同源性在大約74%-87%范圍內(nèi)。因此,在DNA水平上擁有的同源性程度是明顯不同的,假定所產(chǎn)生的轉(zhuǎn)基因植物似乎不會發(fā)生基因沉默。篩選了穩(wěn)定表達(dá)了4xHis-盒的第三代植物(根據(jù)抗體檢測和斑點(diǎn)印跡)。
實(shí)施例26具有各種長度的組氨酸,半胱氨酸/甲硫氨酸,甘氨酸和賴氨酸的構(gòu)建體在煙草表皮細(xì)胞中的表達(dá)工程化多氨基酸序列的長度被認(rèn)為對于His,Cys/Met,Gly和Lys-構(gòu)建體的表達(dá)來說是關(guān)鍵的,這是由于兩種原因,包括在細(xì)胞生產(chǎn)能力方面的穩(wěn)定性和遺傳限制。
長的多氨基酸序列,例如8xHis-系列中的序列在體外翻譯系統(tǒng)(TNTT7/SP6偶聯(lián)的小麥胚芽提取系統(tǒng)L5030,Promegacorporation)中是不穩(wěn)定的,而6xHis-系列局限于大腸桿菌在液體培養(yǎng)基中的生長,正如實(shí)施例11所披露的。所述細(xì)胞產(chǎn)生大量多氨基酸序列而又不對其他蛋白及其合成產(chǎn)生影響的固有限制對于所述表達(dá)來說同樣是重要的。
因此,在植物中檢驗(yàn)了所有CaMV 35S啟動子-驅(qū)動的構(gòu)建體,以便檢查所述大多氨基酸序列在植物細(xì)胞中的限制。盡管存在所述推測的限制,所有構(gòu)建體(如在實(shí)施例11-14所制備的)是在煙草表皮細(xì)胞中表達(dá)的。不過,與較短的多氨基酸序列相比,包括較長多氨基酸序列的構(gòu)建體表達(dá)水平較低,因此,選擇具有四個(gè)His,Cys/Met,Gly和Lys-盒的構(gòu)建體用于穩(wěn)定轉(zhuǎn)化實(shí)驗(yàn)。
對若干植物品系進(jìn)行的Western印跡分析(表1)表明,抗組氨酸序列,MP,油質(zhì)蛋白或GFP(圖13-15)的抗體可用于檢測具有已知分子量(MWs)的蛋白。油質(zhì)蛋白,MP,GFP和4X His-盒(在每一個(gè)盒中具有14個(gè)His密碼子)分子量分別為18.5,30,30,和2.5kDa。融合蛋白的合適的MWs可以根據(jù)上述值以組合的每一種融合成分的MWs的總和形式計(jì)算。通過SDS-PAGE凝膠電泳和通過Western印跡分析檢查,證實(shí)了所述融合蛋白的大小與它們的預(yù)測的分子量相同。通過Western印跡分析研究了轉(zhuǎn)基因編碼蛋白產(chǎn)物(油質(zhì)蛋白-His和MP-His)的穩(wěn)定性。在轉(zhuǎn)化之后進(jìn)行的(自交)植物世代(第三代)分析(表1)明確表明了轉(zhuǎn)基因表達(dá)在連續(xù)世代中是穩(wěn)定的。另外,檢查了所述轉(zhuǎn)化過的植物的Western印跡分析,進(jìn)一步揭示了蛋白產(chǎn)物的大小無論植物世代如何均保持穩(wěn)定。以上分析還證實(shí)了融合蛋白產(chǎn)物的量在植物世代之間是相對穩(wěn)定的,表明了相對其他植物蛋白的可獲得的穩(wěn)定表達(dá)水平。
實(shí)施例27油質(zhì)蛋白-組氨酸和MP-組氨酸融合蛋白的植物內(nèi)生產(chǎn)分析了四個(gè)系列的轉(zhuǎn)基因蕓薹品系(代碼5,8,14和17)。以上系列包括以下構(gòu)建體5-系列pNAP-MP-4x-His-GFP;8-系列pHYB-MP-4x-His-GFP;14-系列pNAP-OLE-4x-His-GFP;17-系列pHYB-0LE-4x-His-GFP。
對若干植物品系進(jìn)行的Western印跡分析(Sambrook等,Molecular cloningA laboratory manual,2nd edn.,Cold SpringHarbor,NY 1989)(表1)表明了抗體(抗His序列,MP,油質(zhì)蛋白或GFP)(圖13-15)可用于檢測具有已知分子量(MWs)的蛋白。MP,油質(zhì)蛋白和GFP抗體來自Atabekov′s實(shí)驗(yàn)室。Poly-His抗體是商業(yè)化的(Pierce,Rocford US)。油質(zhì)蛋白,MP,GFP和4X His-盒(每一個(gè)盒具有14個(gè)His密碼子)的預(yù)測的MWs分別為18.5,30,30,和2.5kDa。融合蛋白的合適的MWs可以根據(jù)所述值以組合的每一種融合成分的MWs的總和形式計(jì)算,即OLE-4xHis-GFP的MW為62.5。
在通過SDS-PAGE凝膠電泳和通過Western印跡分析檢查時(shí),證實(shí)了融合蛋白OLE-4XHis-GFP和MP-4xHis-GFP的大小與推測的分子量相同。通過Western印跡分析研究了轉(zhuǎn)基因編碼蛋白產(chǎn)物(油質(zhì)蛋白-His和MP-His)的穩(wěn)定性。在轉(zhuǎn)化之后對(自交)植物世代(第三代)進(jìn)行的分析明確表明了轉(zhuǎn)基因表達(dá)在后續(xù)世代中是穩(wěn)定的。另外,對轉(zhuǎn)化過的植物的Western印跡分析檢查進(jìn)一步揭示了所述蛋白產(chǎn)物的大小保持穩(wěn)定,而與植物世代無關(guān)。以上分析還表明了融合蛋白產(chǎn)物的量在植物世代之間是穩(wěn)定的,表明了相對其他植物蛋白而言獲得了穩(wěn)定的表達(dá)水平。
在使用His,MP和OLE抗體時(shí),MP或OLE,和GFP可以在合適的植物品系中檢測到。這表明了所述表達(dá)是穩(wěn)定的,并且如果載體存在并且表達(dá),His序列不可能是“被退化掉的”。
表1.轉(zhuǎn)基因蕓薹植物品系對針對由合適的轉(zhuǎn)基因編碼的蛋白產(chǎn)物產(chǎn)生的特異性抗體的反應(yīng)。針對所述蛋白的C-末端部分制備的多克隆OLE和針對細(xì)菌產(chǎn)生的MP產(chǎn)生的poly-MP是在Atabekov′s實(shí)驗(yàn)室制備的???His可以從Pierce,Rocford US.購買。
ND=未檢測,+=弱反應(yīng),++=良好反應(yīng) +++=強(qiáng)反應(yīng)。
5和14系列的轉(zhuǎn)基因植物品系包含NAP啟動子,而8和17系列的轉(zhuǎn)基因植物品系包含YB啟動子。
實(shí)施例28能表達(dá)四種組氨酸盒的轉(zhuǎn)基因蕓薹植物品系的種子的氨基酸分析用于氨基酸分析的種子的重復(fù)樣品是從能表達(dá)四種組氨酸盒的轉(zhuǎn)基因蕓薹品系(T2)中獲得的(品系5和8具有MP作為載體,品系14和17具有OLE作為載體;參見圖3和實(shí)施例27)。對從種子中獲得的總蛋白樣品進(jìn)行氨基酸分析(表2)。所述分析是在Animal Nutrition Sectionin Agricultural Research Centre,Jokioinen,F(xiàn)inland,按照European Commission Directive 98/64/EC(1998)進(jìn)行的。
表2.用于氨基酸分析的種子。
WT=野生型與野生型植物相比,轉(zhuǎn)基因蕓薹植物品系14.12A10包括多出30%的組氨酸(表3)。增加的組氨酸含量不會以犧牲其他氨基酸為代價(jià)積累,而是改變了總蛋白的量。
表3.組氨酸在轉(zhuǎn)基因蕓薹種子中的相對提高
WT=野生型在另一種分析中,使用了四種轉(zhuǎn)基因品系(8.23,8.6A1,14.121)和17.20C20和一種野生型品系(稱之為WT)。這些品系相當(dāng)于用8-系列,或14-系列或17-系列組氨酸盒轉(zhuǎn)化過的植物(參見實(shí)施例27)。在表4中組氨酸的含量是以克(組氨酸)/Kg(總蛋白)形式表示的。
表4.蕓薹種子中的組氨酸含量。
WT=野生型在排除了其他氨基酸含量增加時(shí),組氨酸的增加在3-9%之間。
序列表<110>Boreal Plant Breeding Ltd<120>用于提高種子中選定的氨基酸含量的方法或構(gòu)建體<130>A2436PC<140>
<141>
<150>FI 20030315<151>2003-02-28<160>17<170>PatentIn Ver.2.1<210>1<211>45<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>H-P-1<400>1gcgcctcgag ttcaccatca ccatcaccat cacgggcacc atcac 45<210>2<211>17<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>H-P-2<400>2catcaccatc accatgg 17
<210>3<211>45<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>H-M<400>3ccggatccta aagtcgacca tggtgatggt gatggtgatg gtgcc 45<210>4<211>50<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>C-M-P-1<400>4cacctcgagt atgttgttgc atgtgcatgt gctgttgcat gtcgacaaac 50<210>5<211>50<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>C-M-P-2<400>5gtttgtcgac atgcaacagc acatgcacat gcaacaacat actcgaggtg 50<210>6<211>57
<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>GL-P-1<400>6gcgcctcgag ttggtggagg tggaggcggt ggaggtggcg tcgacaaatg gatcccc 57<210>7<211>60<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>GL-P-2<400>7ggggatccat ttgtagacgc cacctcctcc accgcctcca cctccaccaa ctcgaggcgc 60<210>8<211>66<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>L-P-1<400>8gcgcctcgag ttaaaaagaa aaagaaaaag aaaaagaaaa agaaaaaggt cgacaaatgg 60atcccc 66<210>9<211>66<212>DNA<213>人工序列
<220>
<223>人工序列說明合成的<220>
<223>L-P-2<400>9ggggatccat ttgtcgacct ttttcttttt ctttttcttt ttctttttct ttttaactcg 60aggcgc 66<210>10<211>34<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>OLE-P<400>10aaaaccatgg cggatacagc tagaggaacc catc 34<210>11<211>37<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>OLE-M<400>11ggggccatgg gagtagtgtg ctggccacca cgagtac 37<210>12<211>31<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>OLE-3′XhoI<400>12gcgcctcgag aagtagtgtg ctggccacca c 31<210>13<211>31<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>N30K<400>13gcggaattcc catggctcta gttgttaaag g 31<210>14<211>32<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>C30K<400>14agacctcgag gaaacgaatc cgattcggcg ac32<210>15<211>31<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>OLE-EX-B<400>15tgtgggatcc tacgcaacgg gagagcaccc a31<210>16<211>27<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>NAP-P<400>16cttgttagcc atggtttgct atttgtg 27<210>17<211>26<212>DNA<213>人工序列<220>
<223>人工序列說明合成的<220>
<223>NAP-M<400>17tcttactcga gtgaaaccaa attaac 2權(quán)利要求
1.一種提高在植物的選定的組織或器官中的一種或多種選定的氨基酸含量的方法,包括用至少一種重組核苷酸序列構(gòu)建體轉(zhuǎn)化植物,所述構(gòu)建體包括在形態(tài)發(fā)生的選定的階段驅(qū)動轉(zhuǎn)錄的組織或器官特異性調(diào)控序列,所述構(gòu)建體可操作地連接在嵌合核苷酸序列上,該嵌合核苷酸序列包括(i)編碼載體蛋白的核苷酸序列,所述載體蛋白包括植物特異性蛋白,該蛋白使得氨基酸富集的蛋白能夠在植物的選定的組織或器官中定向表達(dá);所述核苷酸序列缺少終止密碼子,并且是與以下部分框內(nèi)融合的(ii)包括選定的最佳數(shù)量的密碼子的至少一個(gè)核苷酸序列,它所編碼的氨基酸序列包括一個(gè)或多個(gè)氨基酸殘基的選定的組合,其中,所述最佳數(shù)量的密碼子是通過確定允許穩(wěn)定翻譯的數(shù)量確定的;所述重組核苷酸序列構(gòu)建體使得選定的氨基酸富集的具有穩(wěn)定的多氨基酸延伸部分的載體蛋白在植物的選定的組織或器官中能夠進(jìn)行穩(wěn)定的定向表達(dá)。
2.如權(quán)利要求1的方法,其中,所述允許多氨基酸延伸部分穩(wěn)定翻譯的具有最佳數(shù)量的密碼子的構(gòu)建體是使用無細(xì)胞體外翻譯(IVT)系統(tǒng)選擇的。
3.如權(quán)利要求1的方法,其中,所述在植物的選定的組織或器官中的定向表達(dá)是通過具有穩(wěn)定的多氨基酸延伸部分,并且與相應(yīng)的未修飾過的載體蛋白相比具有完整的生物學(xué)功能的載體蛋白實(shí)現(xiàn)的。
4.如權(quán)利要求1的方法,其中,所述使得具有多氨基酸延伸部分的載體蛋白能夠進(jìn)行穩(wěn)定的定向表達(dá)的構(gòu)建體是通過瞬時(shí)表達(dá)測定選擇,包括編碼報(bào)道蛋白的核苷酸序列,它是與權(quán)利要求1所述的構(gòu)建體框內(nèi)融合的。
5.如權(quán)利要求1的方法,其中,所述使得具有多氨基酸延伸部分的載體蛋白能夠進(jìn)行穩(wěn)定的定向表達(dá)的構(gòu)建體是通過檢測報(bào)道蛋白在植物細(xì)胞中的表達(dá)而選擇的。
6.如權(quán)利要求1的方法,其中,所述使得具有多氨基酸延伸部分的載體蛋白能夠在植物的選定的組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)的構(gòu)建體是通過包括以下步驟的方法獲得的(a)使權(quán)利要求1的重組核苷酸序列構(gòu)建體與編碼報(bào)道蛋白的核苷酸序列框內(nèi)融合;(b)在無細(xì)胞翻譯(IVT)系統(tǒng)中選擇使得多氨基酸延伸部分能夠穩(wěn)定翻譯的具有最佳數(shù)量的密碼子的構(gòu)建體;(c)將在步驟(b)中獲得的所述構(gòu)建體導(dǎo)入植物細(xì)胞;(d)通過瞬時(shí)表達(dá)測定選擇能夠使得具有多氨基酸延伸部分的載體蛋白進(jìn)行穩(wěn)定的定向表達(dá)的構(gòu)建體,這是通過檢測所述報(bào)道蛋白在植物細(xì)胞中的表達(dá)而進(jìn)行的;(e)從在步驟(d)中選擇的構(gòu)建體上除去編碼報(bào)道基因的核苷酸序列,以便獲得缺少編碼所述報(bào)道蛋白的核苷酸序列的構(gòu)建體;(f)用在步驟(e)中獲得的所述構(gòu)建體轉(zhuǎn)化植物。
7.如權(quán)利要求6的方法,其中,所述在步驟(b)中獲得的并且包括編碼報(bào)道蛋白的核苷酸序列的構(gòu)建體是通過微粒子轟擊導(dǎo)入植物細(xì)胞的。
8.如權(quán)利要求6的方法,其中,選擇提供所述報(bào)道蛋白的穩(wěn)定的定向表達(dá)的構(gòu)建體,并且在除去編碼所述報(bào)道蛋白的核苷酸序列之后,通過農(nóng)桿菌屬介導(dǎo)的轉(zhuǎn)化導(dǎo)入植物。
9.如權(quán)利要求1的方法,其中,編碼多氨基酸延伸部分的密碼子包括組氨酸,半胱氨酸,甲硫氨酸,甘氨酸,賴氨酸,色氨酸,丙氨酸,纈氨酸,亮氨酸,異亮氨酸,脯氨酸,苯丙氨酸,酪氨酸,絲氨酸,蘇氨酸,精氨酸,天冬氨酸,谷氨酸,天冬酰胺,谷氨酰胺編碼密碼子或它們的任意組合。
10.如權(quán)利要求1的方法,其中,所述編碼選定的多氨基酸延伸部分的密碼子的數(shù)量為4-80個(gè)。
11.如權(quán)利要求1的方法,其中,所述植物的選定的組織或器官是種子。
12.如權(quán)利要求1的方法,其中,所述植物的選定的組織或器官是細(xì)胞壁或細(xì)胞膜。
13.如權(quán)利要求1的方法,其中,所述植物的選定的組織或器官是油體。
14.如權(quán)利要求1的方法,其中,所述使得能夠在植物組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)的植物特異性載體蛋白是在植物的細(xì)胞內(nèi)交通途徑中起作用的蛋白。
15.如權(quán)利要求14的方法,其中,所述載體蛋白是細(xì)胞壁蛋白或植物病毒蛋白。
16.如權(quán)利要求15的方法,其中,所述載體蛋白包括油質(zhì)蛋白,caleosin,steroleosin,cruciferin,napin或植物病毒運(yùn)動蛋白。
17.如權(quán)利要求16的方法,其中,所述載體蛋白是煙草花葉病毒(TMV MP)的運(yùn)動蛋白。
18.如權(quán)利要求1的方法,其中,所述調(diào)控序列是在胚胎發(fā)生期間表達(dá)的啟動子。
19.如權(quán)利要求1的方法,其中,所述調(diào)控序列包括napin(NAP),花椰菜花葉病毒35S(35S),嵌合雜合體(HYB),19S,胭脂氨酸,菜豆蛋白,steroleosin,caleosin,cruciferin,苜?;ㄈ~病毒(AMV),熱激,白蛋白2S或油質(zhì)蛋白啟動子。
20.如權(quán)利要求19的方法,其中,所述napin(NAP)啟動子是擬南芥的napin(NAP)啟動子。
21.如權(quán)利要求19的方法,其中,所述雜合(HYB)啟動子是嵌合啟動子,它包括CaMV 35S啟動子的增強(qiáng)子序列和完整的napin(NAP)啟動子。
22.如權(quán)利要求1的方法,其中,具有多氨基酸延伸部分的載體蛋白的穩(wěn)定的定向表達(dá)是通過使用在napin(NAP)啟動子的控制下表達(dá)的運(yùn)動蛋白提供的。
23.如權(quán)利要求6的方法,其中,所述報(bào)道蛋白是編碼可檢測的蛋白的核苷酸序列。
24.如權(quán)利要求6的方法,其中,所述報(bào)道蛋白是熒光蛋白。
25.如權(quán)利要求6的方法,其中,所述報(bào)道蛋白是綠色熒光蛋白((GFP),紅色熒光蛋白,β-葡糖醛酸酶,obelin或熒光素酶。
26.一種用于提高在植物的選定的組織或器官中的一種或多種選定的氨基酸含量的重組核苷酸序列構(gòu)建體,其中,所述使得具有多氨基酸延伸部分的氨基酸富集的蛋白能夠在植物的選定的組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)的構(gòu)建體包括可操作地連接在嵌合核苷酸序列上的組織或器官特異性調(diào)控序列,它能在形態(tài)發(fā)生的選定的階段驅(qū)動轉(zhuǎn)錄,所述嵌合核苷酸序列包括(a)編碼載體蛋白的核苷酸序列,所述載體蛋白包括使得能夠在植物的選定的組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)的植物特異性蛋白;所述核苷酸序列缺少終止密碼子并且是與以下部分框內(nèi)融合的(ii)包括允許穩(wěn)定翻譯所述多氨基酸延伸部分的選定的最佳數(shù)量的密碼子,并且編碼包括一個(gè)或多個(gè)氨基酸殘基的選定的組合的氨基酸序列的至少一個(gè)核苷酸序列。
27.如權(quán)利要求26的構(gòu)建體,其中,所述使得能夠在植物的選定的組織或器官中進(jìn)行穩(wěn)定的定向表達(dá)的構(gòu)建體包括編碼具有多氨基酸延伸部分,并且與相應(yīng)的未修飾過的載體蛋白相比具有完整的生物學(xué)功能的載體蛋白的核苷酸序列。
28.如權(quán)利要求26的構(gòu)建體,其中,所述使得能夠選擇允許具有多氨基酸延伸部分的載體蛋白定向表達(dá)的構(gòu)建體的構(gòu)建體包括了與權(quán)利要求26的嵌合核苷酸序列框內(nèi)融合的編碼報(bào)道蛋白的核苷酸序列。
29.如權(quán)利要求26的構(gòu)建體,其中,所述使得能夠在植物組織或器官中進(jìn)行穩(wěn)定的定向積累的植物特異性載體蛋白包括在分泌性細(xì)胞內(nèi)交通途徑中發(fā)揮作用的蛋白。
30.如權(quán)利要求26的構(gòu)建體,其中,所述載體蛋白是植物細(xì)胞壁蛋白或植物病毒蛋白。
31.如權(quán)利要求26的構(gòu)建體,其中,所述載體蛋白是油質(zhì)蛋白,caleosin,steroleosin,cruciferin,napin或植物病毒運(yùn)動蛋白。
32.如權(quán)利要求26的構(gòu)建體,其中,所述載體蛋白是煙草花葉病毒(TMVMP)的運(yùn)動蛋白。
33.如權(quán)利要求26的構(gòu)建體,其中,所述密碼子包括組氨酸,半胱氨酸,甲硫氨酸,甘氨酸,賴氨酸,色氨酸,丙氨酸,纈氨酸,亮氨酸,異亮氨酸,脯氨酸,苯丙氨酸,酪氨酸,絲氨酸,蘇氨酸,精氨酸,天冬氨酸,谷氨酸,天冬酰胺,谷氨酰胺編碼密碼子或它們的任意組合。
34.如權(quán)利要求26的構(gòu)建體,其中,所述最佳數(shù)量的密碼子為4-80個(gè)。
35.如權(quán)利要求26的構(gòu)建體,其中,所述調(diào)控序列是在胚胎發(fā)生期間表達(dá)的啟動子。
36.如權(quán)利要求26的構(gòu)建體,其中,所述調(diào)控序列包括napin(NAP),花椰菜花葉病毒(CMV 35S),嵌合雜合體(HYB),19S,胭脂氨酸,菜豆蛋白,steroleosin,caleosin,cruciferin,苜?;ㄈ~病毒(AMV),熱激,白蛋白2S或油質(zhì)蛋白啟動子。
37.如權(quán)利要求26的構(gòu)建體,其中,所述啟動子是擬南芥的napin(NAP)啟動子。
38.如權(quán)利要求36的構(gòu)建體,其中,所述嵌合雜合體(HYB)啟動子包括CaMV 35S啟動子的增強(qiáng)子序列和完整的napin(NAP)啟動子。
39.如權(quán)利要求28的構(gòu)建體,其中,所述報(bào)道蛋白是可檢測的蛋白。
40.如權(quán)利要求28的構(gòu)建體,其中,所述報(bào)道蛋白是熒光蛋白。
41.如權(quán)利要求28的構(gòu)建體,其中,所述報(bào)道蛋白是綠色熒光蛋白(GFP),紅色熒光蛋白,β-葡糖醛酸酶,obelin或熒光素酶。
42.如權(quán)利要求28的構(gòu)建體,其中,所述構(gòu)建體包括編碼具有組氨酸富集的延伸部分的載體蛋白和綠色熒光蛋白(GFP)的核酸序列。
43.如權(quán)利要求1的方法,用于生產(chǎn)在植物材料中包括氨基酸富集的具有多氨基酸延伸部分的載體蛋白的組合物,其中,在通過所述方法獲得的植物材料中氨基酸的含量與相應(yīng)的未修飾過的野生型植物中的氨基酸含量相比至少為2∶1。
44.如權(quán)利要求43的方法,用于生產(chǎn)油渣餅的氨基酸富集的飼料,所述油渣餅是在從植物中回收油之后獲得的。
45.如權(quán)利要求26的構(gòu)建體,用于生產(chǎn)在植物材料中包括氨基酸富集的具有多氨基酸延伸部分的載體蛋白的組合物,其中,在通過所述方法獲得的植物材料中氨基酸的含量與相應(yīng)的未修飾過的野生型植物中的氨基酸含量相比至少為2∶1。
46.用權(quán)利要求26的構(gòu)建體轉(zhuǎn)化過的植物。
47.用權(quán)利要求28的構(gòu)建體轉(zhuǎn)化過的植物。
48.用權(quán)利要求26的構(gòu)建體轉(zhuǎn)化過的植物細(xì)胞。
49.用權(quán)利要求28的構(gòu)建體轉(zhuǎn)化過的植物細(xì)胞。
50.用權(quán)利要求26的構(gòu)建體轉(zhuǎn)化過的植物細(xì)胞系。
51.用權(quán)利要求28的構(gòu)建體轉(zhuǎn)化過的植物細(xì)胞系。
52.通過權(quán)利要求1的方法獲得的組合物,該組合物在植物材料中包括具有多氨基酸延伸部分的氨基酸富集的載體蛋白,在該組合物中,在通過所述方法獲得的植物材料中氨基酸的含量與相應(yīng)的未修飾過的野生型植物中的氨基酸含量相比至少為2∶1。
全文摘要
本發(fā)明提供了用于提高選定的氨基酸含量的構(gòu)建體和方法,這是通過富含氨基酸序列的蛋白的定向表達(dá)或積累,使所述蛋白積累在植物物種或植物組織或器官中。所述提高了的含量是通過用編碼載體蛋白的重組核苷酸序列構(gòu)建體穩(wěn)定轉(zhuǎn)化植物獲得的,在所述構(gòu)建體的3′-末端具有多氨基酸延伸部分,并且可操作地連接在組織或器官特異性調(diào)控序列上。在植物組織,特別是種子的膜狀油體和細(xì)胞壁中的提高的氨基酸含量,提供了可用作動物飼料的組分。
文檔編號C12N15/82GK1780914SQ200480011135
公開日2006年5月31日 申請日期2004年2月27日 優(yōu)先權(quán)日2003年2月28日
發(fā)明者T·瓦爾羅斯, J·阿塔貝科夫, Y·多羅克霍夫, P·蘇西, M·梅克萊, T·科爾佩拉 申請人:波里爾植物培育有限公司