專利名稱::來自浮萍科的表達(dá)控制元件的制作方法來自浮萍科的表達(dá)控制元件發(fā)明領(lǐng)域本發(fā)明涉及用于增強(qiáng)基因在植物中的表達(dá)的組合物和方法。
背景技術(shù):
:浮萍是單子葉浮萍科(Lemnaceae)唯一的成員。5個(gè)屬和38個(gè)物種都是小的、自由浮動(dòng)的淡水植物,它的地理分布范圍遍及全球(Landolt(1986)BiosystematicInvestigationontheFamilyofDuckweeds:TheFamilyofLemnaceae—AMonographStudy(GeobatanischenInstitutETH,StiftungRubel,Zurich))。盡管已知浮萍為在形態(tài)學(xué)上最簡化的植物,但大多數(shù)浮萍種具有大很多的植物所具有的所有組織和器官,包括根、莖、花、種子和葉。已經(jīng)對(duì)浮萍物種進(jìn)行了廣泛的研究并且存在大量文獻(xiàn)對(duì)它們的生態(tài)學(xué)、系統(tǒng)學(xué)、生活周期、代謝、疾病和蟲害易感性、它們的生殖生物學(xué)、遺傳結(jié)構(gòu)和細(xì)胞生物學(xué)進(jìn)行了詳細(xì)的描述(Hillman(1961)Bot.Review27:221;Landolt(1986)BiosystematicInvestigationontheFamilyofDuckweeds:TheFamilyofLemnaceae—AMonographStudy(GeobatanischenInstitutETH,StiftungRubel,Zurich))。浮萍的生長習(xí)性對(duì)于微生物培養(yǎng)方法來說是理想的。該植物通過新葉的營養(yǎng)性出芽,以類似于酵母的無性繁殖的宏觀方式迅速增殖。這種增殖通過分生細(xì)胞的營養(yǎng)性出芽完成。分生組織區(qū)很小并且發(fā)現(xiàn)是在葉狀體的腹側(cè)表面上。分生細(xì)胞位于兩個(gè)嚢中,葉的中脈的每一側(cè)上各有一個(gè)。該小的中脈區(qū)也是根起源和莖產(chǎn)生的位點(diǎn),其將每一葉與其母葉連接。分生組織的嚢通過組織瓣保護(hù)。葉從這些嚢交替地出芽。倍增時(shí)間因種而不同并且短至20-24個(gè)小時(shí)(Landolt(1957)Ber.Schweiz.Bot.Ges.67:271;Chang等,(1977)Bull.Inst.Chem.Acad.Sin.24:19;Datko和Mudd(1970)PlantPhysiol.65:16;Venkataraman等,(1970)ZPflanzenphysiol.62:316)。浮萍的集約培養(yǎng)導(dǎo)致每單位時(shí)間最高速率的生物量積累(Landolt和Kandeler(1987)TheFamilyofLemnaceae—AMonographicStudyVol.2:Phytochemistry,Physiology,Application,Bibliography(VeroffentlichungendesGeobotanischenInstitutesETH,StiftungRubel,Zurich)),干物質(zhì)積累量的范圍是鮮重的6-15%(Tillberg等,(1979)Physiol.Plant.46:5;Landolt(1957)Ber.Schweiz.Bot.Ges.67:271;Stomp,數(shù)據(jù)未公開)。據(jù)報(bào)道,在不同條件下生長的許多浮萍物種的蛋白質(zhì)含量的范圍是干重的15-45%(Chang等,(1977)Bull.Inst.Chem.Acad.Sin.24:19;Chang和Chui(1978)Z.Pflanzenphysiol.89:91,.Porath等,(1979)AquaticBotany7:272、Appenroth等,(1982)Biochem.Physiol.Pflanz.177:251)。利用這些值,在浮萍中每升培養(yǎng)基的蛋白質(zhì)生產(chǎn)水平在與酵母基因表達(dá)系統(tǒng)相同的數(shù)量級(jí)上。浮萍植物或浮萍結(jié)節(jié)培養(yǎng)物(noduleculture)可以用含有所關(guān)注的核苷酸序列的表達(dá)盒,通過多種方法的任意一種進(jìn)行有效地轉(zhuǎn)化,所述方法包括農(nóng)桿菌介導(dǎo)的基因轉(zhuǎn)移、基因槍轟擊(ballisticbombardment)或電穿孔。穩(wěn)定的浮萍轉(zhuǎn)化體可以通過這樣分離用所關(guān)注的核苷酸序列和賦予對(duì)選擇試劑抗性的基因兩者轉(zhuǎn)化浮萍細(xì)胞,之后在含有該選擇試劑的培養(yǎng)基中培養(yǎng)轉(zhuǎn)化的細(xì)胞。參見Stomp等的美國專利No.6,040,498。浮萍基因表達(dá)系統(tǒng)提供了應(yīng)該可用于許多研究和商業(yè)應(yīng)用的關(guān)鍵技術(shù)??偟膩碚f,對(duì)于植物分子生物學(xué)研究,可以以酵母的實(shí)驗(yàn)室便利性進(jìn)行操作的分化植物系統(tǒng)提供了在其中分析分離的基因的發(fā)育和生理學(xué)作用的非??焖俚南到y(tǒng)。對(duì)于有價(jià)值的多肽的商業(yè)生產(chǎn),基于浮萍的系統(tǒng)具有許多優(yōu)于現(xiàn)存的微生物培養(yǎng)系統(tǒng)或細(xì)胞培養(yǎng)系統(tǒng)的優(yōu)點(diǎn)。植物顯示了類似于哺乳動(dòng)物細(xì)胞的翻譯后加工,克服了一個(gè)與生物學(xué)上活性哺乳動(dòng)物多肽在微生物細(xì)胞中生產(chǎn)相關(guān)的主要問題,并且已經(jīng)通過其它研究顯示,植物系統(tǒng)具有在微生物系統(tǒng)中常常缺乏的組裝多亞基蛋白質(zhì)的能力(Hiatt(1990)Nature334:469)。增大浮萍生物量至商業(yè)化生產(chǎn)重組蛋白質(zhì)所需的水平比類似增大哺乳動(dòng)物細(xì)胞更快且成本更劃算,并且與其它提出的植物生產(chǎn)系統(tǒng)(例如大豆和煙草)不同,浮萍可以在完全裝滿和可控的生物量生產(chǎn)容器中生長,使得將該系統(tǒng)整合進(jìn)現(xiàn)存的蛋白質(zhì)生產(chǎn)工業(yè)基礎(chǔ)結(jié)構(gòu)更容易。因此,仍然需要用于在浮萍中表達(dá)所關(guān)注的蛋白質(zhì)的最優(yōu)化的組合物和方法。發(fā)明簡述提供了用于在植物中調(diào)節(jié)基因表達(dá)的組合物和方法。組合物包含新的表達(dá)控制元件(如啟動(dòng)子和內(nèi)含子)的核苷酸序列,該表達(dá)控制元件分離自浮萍科的泛素、置換型(r)-組蛋白和幾丁質(zhì)酶基因。本發(fā)明的表達(dá)控制元件在植物中起始有效連接的異源核苷酸序列的轉(zhuǎn)錄。更具體來講,本發(fā)明組合物包含在SEQIDN0:1-3、N0:13和N0:14中示出的表達(dá)控制元件及其變體和片段。組合物還包含這些浮萍科表達(dá)控制元件內(nèi)的新的內(nèi)含子序列,尤其是在SEQIDNO:7-9中示出的內(nèi)含子序列及其變體和片段。這些內(nèi)含子序列可以有效連接至所關(guān)注的啟動(dòng)子以增強(qiáng)有效連接的異源核苷酸序列在植物中的表達(dá)。還提供了在SEQIDNO:16中示出的新的浮萍科幾丁質(zhì)酶信號(hào)肽及其變體和片段,該信號(hào)肽由SEQIDNO:15中示出的序列編碼。該信號(hào)肽編碼序列可以有效連接至所關(guān)注的多肽的編碼序列以引導(dǎo)編碼的多肽的細(xì)胞外分泌。本發(fā)明提供了表達(dá)構(gòu)建體(如表達(dá)盒和載體),其包含有效連接至所關(guān)注的異源核苷酸序列的本發(fā)明的表達(dá)控制元件和/或內(nèi)含子和/或信號(hào)肽-編碼序列。還提供了具有本發(fā)明的表達(dá)構(gòu)建體的穩(wěn)定轉(zhuǎn)化的植物、4直物細(xì)胞和結(jié)節(jié)。本發(fā)明的組合物可用于引導(dǎo)所關(guān)注的核苷酸序列在植物或植物細(xì)胞或結(jié)節(jié)中表達(dá)的方法。本發(fā)明的方法包括將表達(dá)構(gòu)建體引入植物或植物細(xì)胞或結(jié)節(jié)中,該表達(dá)構(gòu)建體具有有效連接至所關(guān)注的核苷酸序列的浮萍科泛素、r-組蛋白或幾丁質(zhì)酶表達(dá)控制元件(例如,如在SEQIDNO:1-3、NO:13和NO:14中示出的)或其變體或片段。本發(fā)明的方法還包含將表達(dá)構(gòu)建體引入植物或植物細(xì)胞或結(jié)節(jié)中,該表達(dá)構(gòu)建體包含分離自膨脹浮萍(Lemnagibba)核酮糖-1,5-二磷酸羧化酶小亞基基因(RbcS;例如,如SEQIDNO:10-12中示出的)的表達(dá)控制元件。在其它實(shí)施方案中,本發(fā)明的方法包括將表達(dá)構(gòu)建體引入植物或植物細(xì)胞或結(jié)節(jié)中,該表達(dá)構(gòu)建體具有有效連接至所關(guān)注的多肽的編碼序列的浮萍科幾丁質(zhì)酶信號(hào)肽-編碼序列(例如,如在SEQIDNO:15中示出的)或其變體或片段。在一些實(shí)施方案中,本發(fā)明的方法涉及由所關(guān)注的核苷酸序列編碼的多肽在植物表達(dá)系統(tǒng)(如,浮萍表達(dá)系統(tǒng))中的產(chǎn)生。本發(fā)明的植物表達(dá)系統(tǒng)經(jīng)優(yōu)化而產(chǎn)生了高水平的所關(guān)注的多肽序列。因而,本發(fā)明包括用于在植物中表達(dá)所關(guān)注的核苷酸序列的方法,該植物用表達(dá)所關(guān)注的核苷酸序列的表達(dá)構(gòu)建體轉(zhuǎn)化,其中這些核苷酸序列經(jīng)過修飾而增強(qiáng)了它們?cè)谥参镏械谋磉_(dá)。本發(fā)明的這些和其它方面在下面給出的"發(fā)明詳述"中得到了更詳細(xì)的7>開。發(fā)明詳述本發(fā)明提供了涉及新的植物表達(dá)控制元件的核酸的組合物和方法,該植物表達(dá)控制元件調(diào)節(jié)異源核苷酸序列在植物中的轉(zhuǎn)錄。具體而言,本發(fā)明的組合物包含分離自浮萍科的泛素、r-組蛋白和幾丁質(zhì)酶基因的表達(dá)控制元件,包括在SEQIDNO:1-3、NO:13和NO:14中示出的表達(dá)控制元件及其變體和片段,如本文在下面所定義的。在這些表達(dá)控制元件內(nèi)的各個(gè)啟動(dòng)子序列(SEQIDN0:4-6、N0:13和NO:14)和內(nèi)含子序列(SEQIDNO:7-9)也可用于調(diào)節(jié)植物中的轉(zhuǎn)錄。本發(fā)明還提供了新的浮萍(L.minor)幾丁質(zhì)酶信號(hào)肽(SEQIDNO:16)和對(duì)應(yīng)的編碼序列(SEQIDNO:15),及其變體和片段。如本文所用的,"核酸"包括單鏈或雙鏈形式的脫氧核糖核酸或核糖核酸聚合物,并且除非另作限制,否則涵蓋已知的具有天然核苷酸的基本特性的類似物(如肽核酸),因?yàn)樗鼈円灶愃朴谔烊淮嬖诘暮塑账岬姆绞脚c單鏈核酸雜交。本發(fā)明涵蓋了分離的或基本純化的核酸組合物。"分離的"或"純化的"核酸分子大體上或基本上不含這樣的組分,所述的組分如在它們天然存在的環(huán)境中所發(fā)現(xiàn)的,通常伴隨所述核酸分子或蛋白質(zhì)或者與其相互作用。因而,"分離的"或"純化的,,核酸分子在通過重組技術(shù)生成時(shí)基本上無其它細(xì)胞物質(zhì)或培養(yǎng)基,或者在化學(xué)合成時(shí)基本上無化學(xué)前體或其它的化學(xué)試劑。優(yōu)選地,"分離的"核酸不含在該核酸源自的生物體的基因組DNA中,天然位于該核酸旁側(cè)的序列(即,位于核酸的5'末端和3'末端的序列)(優(yōu)選為蛋白質(zhì)編碼序列)。例如,在多個(gè)實(shí)施方案中,分離的核酸分子可含有少于約5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在該核酸源自的細(xì)胞的基因組DM中天然位于該核酸分子旁側(cè)的核苷酸序列。本發(fā)明的組合物包含分離的核酸分子,該核酸分子包含SEQIDNO:1-3、NO:13和NO:14中示出的表達(dá)控制元件的核苷酸序列及其變體和片段,如本文在下面所描述的。"表達(dá)控制元件"意指DNA的調(diào)控區(qū),其通常包含能夠引導(dǎo)RNA聚合酶11在特定編碼序列的合適轉(zhuǎn)錄起始位點(diǎn)起始RNA合成的TATA盒。表達(dá)控制元件可另外包含通常位于TATA盒的上游或5'端的其它識(shí)別序列,其影響(如增強(qiáng))轉(zhuǎn)錄起始速率。此外,表達(dá)控制元件可另外包含通常位于TATA盒的下游或3'端的序列,其影響(如增強(qiáng))轉(zhuǎn)錄起始速率。應(yīng)當(dāng)認(rèn)識(shí)到,一旦已經(jīng)確定了本文所公開的表達(dá)控制元件區(qū)域的核苷酸序列,則分離和確定本文所確定的具體表達(dá)控制元件區(qū)域上游的5'非翻譯區(qū)(UTR)中的其它調(diào)控元件是在現(xiàn)有技術(shù)的范圍內(nèi)。因而,(例如)本文所公開的表達(dá)控制元件區(qū)域還可包含另外的調(diào)控元件,例如負(fù)責(zé)編碼序列的組織表達(dá)和時(shí)間表達(dá)的那些調(diào)控元件、增強(qiáng)子等。具體參見澳大利亞專利No.AU-A-77751/94和美國專利No.5,466,785及No.5,635,618(將這兩者均以引用方式并入本文)。本發(fā)明的表達(dá)控制元件分離自浮萍科數(shù)個(gè)成員的泛素、r-組蛋白和幾丁質(zhì)酶基因,并因而稱為"浮萍科表達(dá)控制元件"。SEQIDNO:1示出了全長的浮萍Ue咖a邁/加r)泛素表達(dá)控制元件,其包括啟動(dòng)子加5'UTR(核苷酸1-1625)和內(nèi)含子(核苷酸1626-2160)兩者。SEQIDNO:2示出了全長的紫萍(Spirodellapolyrrhiza)泛素表達(dá)控制元件,其包括啟動(dòng)子加5'UTR(核普酸l-1041)和內(nèi)含子(核普酸1042-2021)兩者。SEQIDNO:3示出了全長的稀脈萍(Lemnaaequinoctialis)泛素表達(dá)控制元件,其包括啟動(dòng)子加5'UTR(核苷酸l-964)和內(nèi)含子(核苷酸965-2068)。SEQIDNO:4示出了浮萍泛素表達(dá)控制元件的啟動(dòng)子加5'UTR部分。SEQIDNO:5示出了紫萍泛素表達(dá)控制元件的啟動(dòng)子加5'UTR部分。SEQIDNO:6示出了稀脈萍泛素表達(dá)控制元件的啟動(dòng)子加5'UTR部分。SEQIDNO:7示出了浮萍泛素表達(dá)控制元件的內(nèi)含子部分。SEQIDNO:8示出了紫萍泛素表達(dá)控制元件的內(nèi)含子部分。SEQIDNO:9示出了稀脈萍泛素表達(dá)控制元件的內(nèi)含子部分。SEQIDNO:13示出了全長的浮萍r-組蛋白表達(dá)控制元件,其包括啟動(dòng)子加5'UTR。SEQIDNO:14示出了全長的浮萍幾丁質(zhì)酶表達(dá)控制元件,其包括啟動(dòng)子加5'UTR。SEQIDNO:15示出了浮萍幾丁質(zhì)酶的信號(hào)肽-編碼序列。SEQIDNO:16示出了浮萍幾丁質(zhì)酶的信號(hào)肽。應(yīng)當(dāng)認(rèn)識(shí)到,在SEQIDNO:4-6、NO:13和NO:14中示出的單獨(dú)的啟動(dòng)子加5'UTR序列,及其生物學(xué)上的活性變體和片段可用于調(diào)節(jié)有效連接的所關(guān)注的核苷酸序列在植物中的轉(zhuǎn)錄。類似地,在SEQIDNO:7-9中示出的一個(gè)或多個(gè)內(nèi)含子序列及其生物學(xué)上的活性片段或變體可有效地連接至所關(guān)注的啟動(dòng)子(包括在SEQIDNO:4、5、6、13或14中示出的啟動(dòng)子),以便增強(qiáng)有效連接至該啟動(dòng)子的核苷酸序列的表達(dá)。所公開的表達(dá)控制元件、信號(hào)肽-編碼序列以及編碼的信號(hào)肽的片段和變體也由本發(fā)明所涵蓋。本文中表達(dá)控制元件的"片段"意指全長表達(dá)控制元件的一部分,例如在SEQIDNO:1-3、NO:13和NO:14中示出的任意一個(gè)表達(dá)控制元件的一部分。表達(dá)控制元件的片段保留了生物學(xué)活性并因而包括能起始或增強(qiáng)有效連接的核苷酸序列的表達(dá)的片段。因而,(例如)短于本文所公開的全長表達(dá)控制元件的片段可用來驅(qū)動(dòng)連接的所關(guān)注的核苷酸序列(例如編碼異源蛋白質(zhì)的核苷酸序列)的表達(dá)。表達(dá)控制元件的這種片段的具體的非限制性實(shí)例包括(i)在SEQIDN0M-9任意之一中示出的核苷酸序列(如上文中所述的);(ii)浮萍泛素表達(dá)控制元件(SEQIDNO:l)的5'截短形式,例如SEQIDNO:1的核苷酸1288-2160(截短的LmUbq的啟動(dòng)子No.1,如下文所述的Egs22構(gòu)建體中存在的)和SEQIDNO:1的核普酸1132-2160(截短的LmUbq的啟動(dòng)子No.2,如下文所述的Egs23構(gòu)建體中存在的);(iii)浮萍r-組蛋白表達(dá)控制元件(SEQIDNO:13)的5'截短形式,例如SEQIDNO:13的核普酸461-1808(LmHIS(461-1808),如下文所述的Egsl9構(gòu)建體中存在的)和SEQIDNO:13的核苷酸805-1808(LmHIS(805-1808),如下文所述的Egs20構(gòu)建體中存在的);以及(iv)浮萍幾丁質(zhì)酶表達(dá)控制元件(SEQIDN0:14)的5'截短形式,例如SEQIDNO:14的核苷酸51-1338(LmCHT(51-1338),如下文所述的Egs24和Egs25構(gòu)建體中存在的)。如本文所用的,對(duì)于指定的核苷酸序列,"全長序列"表示具有天然序列的全部核酸序列。"天然序列"意指內(nèi)源序列,即在生物體基因組中發(fā)現(xiàn)的非工程序列。因而,浮萍科表達(dá)控制元件的片段可用作表達(dá)控制元件的生物學(xué)上的活性部分。表達(dá)控制元件的生物學(xué)上的活性部分可以通過這樣制備分離本發(fā)明的表達(dá)控制元件之一的一部分并評(píng)估該表達(dá)控制元件的該部分的活性(如起始或增強(qiáng)轉(zhuǎn)錄的能力)。作為表達(dá)控制元件的片段的核酸分子包含至少15、20、25、30、35、40、45、50、75、100、325、350、375、400、425、450、500、550、600、650、700、800、900、1200、1500、1800或2000個(gè)連續(xù)的核苷酸,或直至本文所公開的全長表達(dá)控制元件中存在的核苷酸數(shù)(即,對(duì)于SEQIDNO:1為2160個(gè)核苷酸,對(duì)于SEQIDNO:2為2021個(gè)核苷酸,對(duì)于SEQIDNO:3為2068個(gè)核苷酸,對(duì)于SEQIDNO:13為1808個(gè)核苷酸,而對(duì)于SEQIDNO:14為1338個(gè)核香酸)。這樣的片段的核苷酸將通常包含特定表達(dá)控制元件的TATA識(shí)別序列。這樣的片段可以通過利用限制性內(nèi)切酶切割本文所公開的天然存在的表達(dá)控制元件獲得;可以通過合成表達(dá)控制元件DNA序列的天然存在的序列的核苷酸序列獲得;或者可以通過利用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)技術(shù)獲得。具體參見Mullis等,(1987)MethodsEnzymol.155:335-350,以及Erlich等,(1989)PCRTechnology(StocktonPress,NewYork)。這些表達(dá)控制元件片段的變體(例如通過定點(diǎn)誘變產(chǎn)生的那些變體)也包含在本發(fā)明的組合物中。本文中信號(hào)肽編碼序列和編碼的信號(hào)肽的"片段"旨在表示編碼序列的一部分或由其編碼的信號(hào)肽的一部分。對(duì)于編碼序列,核苷酸序列的片段可編碼保留了天然多肽(在該情況下,為天然的浮萍幾丁質(zhì)酶信號(hào)肽)的生物學(xué)活性的多肽片段。因而,浮萍幾丁質(zhì)酶信號(hào)肽的功能性片段可引導(dǎo)所關(guān)注的成熟蛋白質(zhì)通過植物細(xì)胞的分泌途徑移出。核苷酸編碼序列的片段的范圍是至少約20個(gè)核苷酸、約25個(gè)核苷酸、約50個(gè)核苷酸、約75個(gè)核苷酸,并且直至編碼浮萍幾丁質(zhì)酶信號(hào)肽的整個(gè)核苷酸序列(即,直至SEQIDNO:15的84個(gè)核苷酸)。"變體,,意指與本文所公開的表達(dá)控制元件(如SEQIDNO:1-3、NO:13和NO:14)或其片段(如在SEQIDNO:4-9中示出的序列),或與信號(hào)肽-編碼序列(如SEQIDNO:15)或信號(hào)肽(如SEQIDN0:16)或其片段具有基本相似性的序列。對(duì)于核苷酸序列,天然存在的變體(例如上述這些)可以用熟知的分子生物學(xué)技術(shù),例如用如下文概述的PCR和雜交技術(shù)鑒定。核苷酸序列變體還包括通過合成衍生的核苷酸序列,例如那些如通過利用定點(diǎn)誘變產(chǎn)生的序列。一般而言,本發(fā)明的具體核苷酸序列的變體(包括SEQIDNO:1-9和13-15任意一個(gè)的變體)應(yīng)該與該核苷酸序列具有至少40%、50%、60%、65%、70%,通常至少75%、80%、85°/。,優(yōu)選約90%、91°/。、92%、93°/。、94%至95°/。、96°/。、97%,并且更優(yōu)選98%、99%或更大的序列同一性,序列同一性通過下文所描述的序列比對(duì)程序采用默認(rèn)參數(shù)測(cè)定。生物學(xué)上的活性變體也由本發(fā)明所涵蓋。生物學(xué)上的活性變體包括(例如)具有一個(gè)或多個(gè)核苷酸取代、缺失或插入的本發(fā)明的天然表達(dá)控制元件或天然信號(hào)肽-編碼序列。如本文所用的,兩個(gè)核酸序列或兩個(gè)多肽序列的"序列同一性"或"同一性"涉及在這兩個(gè)序列中當(dāng)在特定比較窗口上以最大的對(duì)應(yīng)性比對(duì)時(shí)其中相同的殘基。"比較窗口"意指連續(xù)且確定的多核苷酸/多肽序列的片段,其中比較窗口中的多核苷酸/多肽序列與用于這兩個(gè)序列的最佳比對(duì)的參考序列(其不包含添加或缺失)比較可包含添加或缺失(即空位)。通常,比較窗口的長度為至少20個(gè)連續(xù)的核苷酸/氨基酸,并且可任選為30、40、50、100個(gè)核苷酸/氨基酸或更長。用于比較的序列的比對(duì)方法是本領(lǐng)域熟知的。因而,任意兩個(gè)序列之間的百分比序列同一性的測(cè)定可用數(shù)學(xué)算法完成。這種數(shù)學(xué)算法的非限制性實(shí)例是Myers和Miller的算法((1988)"BIOS4:11-17);Smith等的局部比對(duì)算法((1981)Adv.Appl.Math.2:482)、Needleman和Wunsch的全局比對(duì)算法((1970)J.Mol.Biol.48:443-453);Pearson和Lipman的搜索-局部比對(duì)法(search-for-localalignmentmethod)((1988)Proc.Natl.Acad.Sci.85:2444-2448);Karlin和Altschul的算法((1990)Proc.Natl.Acad.Sci.USA87:2264),其在Karlin和Altschul(1993)Proc.Natl.Acad.SciUSA90:5873-5877中得到改進(jìn)。這些數(shù)學(xué)算法的計(jì)算機(jī)實(shí)現(xiàn)可用于進(jìn)行序列比較以測(cè)定序列同一性。這些實(shí)現(xiàn)包括但不限于PC/Gene程序中的CLUSTAL(可從Intelligenetics,MountainView,California獲得);ALIGN程序(2.0版)和GCGsconsinGenetics軟件包(10版)中的GAP、BESTFIT、BLAST、FASTA和TFASTA(可從Accelrys公司,9685ScrantonRoad,SanDiego,California,USA獲得)。用這些程序進(jìn)行比對(duì)可采用默認(rèn)參數(shù)進(jìn)行。CLUSTAL程序由Higgins等,(1988)Gene73:237-244(1988);Higgins等,(1989)CABIOS5:151-153;Corpet等,(1988)NucleicAcidsRes.16:10881-90;Huang等,(1992)CABIOS8:155-65;以及Pearson等,(1994)Meth.Mol.Biol.24:307-331進(jìn)行了充分的描述。ALIGN程序是基于Myers和Miller的算法(1988)CABIOS4:11-17。當(dāng)比較氨基酸序列時(shí),用ALIGN程序可釆用下列參數(shù):PAM120殘基權(quán)重表、空位長度罰分-12以及空位罰分=4。Altschul等的BLAST程序((1990)J.Mol.Biol.215:403)是基于Karlin和Altschul的算法((1990)Proc.Natl.Acad.Sci.USA87:2264)。BLAST核苷酸搜索可用BLASTN程序(得分-lOO,字串長度=12)進(jìn)行,以獲得與本發(fā)明的核苷酸序列同源的核苷酸序列。BLAST蛋白質(zhì)搜索可用BLASTX程序(得分-50,字串長度-3)進(jìn)行,以獲得與本發(fā)明的蛋白質(zhì)或多肽同源的氨基酸序列。對(duì)于為了比較目的而獲得帶空位的比對(duì),可以如在Altschul等,(1997)NucleicAcidsRes.25:3389中所描述的利用GappedBLAST(在BLAST2.0中)。可選擇地,PSI-BLAST(在BLAST2.0中)可用于進(jìn)行檢測(cè)分子之間的親緣關(guān)系的迭代搜索。參見Altschul等,(1997)NucleicAcidsRes.25:3389。當(dāng)使用BLAST、GappedBLAST、PSI-BLAST時(shí),可以采用各自程序的默認(rèn)參數(shù)(如,對(duì)于核苷酸序列用BLASTN而對(duì)于蛋白質(zhì)用BLASTX)。GAP采用了Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453),用以得到兩個(gè)完整序列的匹配數(shù)最大而空位數(shù)最小的比對(duì)。GAP考慮所有可能的比對(duì)和空位位置并且產(chǎn)生具有最大數(shù)量的匹配堿基和最少空位的比對(duì)。它允許提供匹配的堿基單位中的空位產(chǎn)生罰分和空位延伸罰分。GAP必須考慮它插入的每個(gè)空位的匹配的空位產(chǎn)生罰分?jǐn)?shù)。如果選擇大于0的空位延伸罰分,對(duì)于插入的每個(gè)空位,GAP必須另外算上空位的長度與空位延伸罰分的積。GCGWisconsinGenetics軟件包版本10中的默認(rèn)的用于蛋白質(zhì)序列的空位產(chǎn)生罰分值和空位延伸罰分值分別為8和2。對(duì)于核苷酸序列,默認(rèn)的空位產(chǎn)生罰分是50,而默認(rèn)的空位延伸罰分為3??瘴划a(chǎn)生罰分和空位延伸罰分可以表示為選自0至200的整數(shù)。因而,(例如)空位產(chǎn)生罰分和空位延伸罰分可以是O、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更大。GAP代表了多種最佳比對(duì)方法的其中一種。這類最佳比對(duì)方法可能有許多,但是其它成員不具有更好的性質(zhì)。GAP顯示了用于比對(duì)的四個(gè)準(zhǔn)則質(zhì)量、比率、同一性和相似性。質(zhì)量指為了比對(duì)序列而最大化了的尺度。比率指質(zhì)量除以短片段中的堿基數(shù)。百分比同一性指實(shí)際匹配符號(hào)的百分比。百分比相似性指相似符號(hào)的百分比。在空位對(duì)面的符號(hào)忽略不計(jì)。當(dāng)一對(duì)符號(hào)的打分矩陣值大于或等于0.50(相似性閥值)時(shí),相似性被打分。在GCGWisconsinGenetics軟件包版本10中使用的打分矩陣是BLOSUM62(參見HenikoffandHenikoff(1992)Proc.Natl.Acad.Sci.USA89:10915)。比對(duì)也可以通過目測(cè)手動(dòng)進(jìn)行。兩個(gè)核酸分子是密切相關(guān)的的替代指示是這兩個(gè)分子可以在嚴(yán)格條件下互相雜交。嚴(yán)格條件是序列依賴性的并且在不同的環(huán)境參數(shù)下不同。通常,在確定的離子強(qiáng)度和pH下,選擇嚴(yán)格條件為比特定序列的熱解鏈溫度(Tm)約低5-20。C。L是50%的靶序列雜交至完全匹配的探針時(shí)的溫度(在確定的離子強(qiáng)度和pH下)。核酸雜交的條件和嚴(yán)格性的計(jì)算可以在(例如)Sambrook等,(2001)MolecularCloning:ALaboratoryManual(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)和Tijssen(1993)HybridizationWithNucleicAcidProbes,PartI:TheoryandNucleicAcidPreparation(LaboratoryTechniquesinBiochemistryandMolecularBiology,ElsevierScienceLtd.,NY,NY)中找到。對(duì)于本發(fā)明而言,"嚴(yán)格條件"包括如果雜交分子和靶序列之間存在低于25%的錯(cuò)配雜交在其下才會(huì)發(fā)生的條件。"嚴(yán)格條件"可分成具體的嚴(yán)格水平以便更精確的定義。因而,如本文所用的,"適度嚴(yán)格性"條件指具有多于25%序列錯(cuò)配的分子不會(huì)在其下雜交的那些條件;"中度嚴(yán)格性,,條件指具有多于15%錯(cuò)配的分子不會(huì)在其下雜交的那些條件;而"高嚴(yán)格性"條件指具有多于10%錯(cuò)配的序列不會(huì)在其下雜交的那些條件。"非常高的嚴(yán)格性"條件指具有多于6%錯(cuò)配的序列不會(huì)在其下雜交的那些條件,可用多種本領(lǐng)域技術(shù)人員所熟知的技術(shù)測(cè)定,所述的技術(shù)包括(例如)RNA印跡分析、遭受轉(zhuǎn)錄融合的報(bào)告子活性測(cè)量等。參見(例如)Sambrook等(2001)MolecularCloning:ALaboratoryManual(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)??蛇x擇地,表達(dá)控制元件的測(cè)定可以基于對(duì)在表達(dá)控制元件或其片段或變體的控制下產(chǎn)生的報(bào)告基因(例如P-葡萄糖醛酸酶(GUS)、綠色焚光蛋白(GFP)等)的水平來測(cè)量。參見,例如,美國專利No.6,072,050,將其以引用方式并入本文。浮萍幾丁質(zhì)酶信號(hào)肽或其片段或變體的活性同樣可以用多種本領(lǐng)域技術(shù)人員所熟知的技術(shù)測(cè)定,包括檢測(cè)幾丁質(zhì)酶信號(hào)肽或其片段或變體引導(dǎo)所關(guān)注多肽的細(xì)胞外分泌的能力的那些技術(shù)。用于誘變和核苷酸序列變更的方法是本領(lǐng)域所熟知的。參見,例如Kunkel(1985)Proc.Nat1.Acad.Scl.USA82:488-492、Kunkel等,(1987)MethodsinEnzymol.154:367-382;美國專利No.4,873,192(將其以引用方式并入本文);Walker和Gaastra,eds.(1983)TechniquesinMolecularBiology(MacMillanPublishingCompany,NY)以及其中所引用的參考文獻(xiàn)。本發(fā)明的浮萍科表達(dá)控制元件及其變體或片段在組裝于核苷酸構(gòu)建體內(nèi)使得該表達(dá)控制元件有效連接至所關(guān)注的核苷酸序列時(shí),使得能在植物或植物細(xì)胞或結(jié)節(jié)(如,(例如)來自紫萍屬、蕪萍(/^//773)屬、/To/i7e//a屬、Za/^/〃a屬或浮萍ae范/za)列。二有效連i:意指所關(guān)注;核苷酸序列的轉(zhuǎn)錄或翻譯是表達(dá)控制元件的影響下。以這種方式,本發(fā)明表達(dá)控制元件的核苷酸序列與用于在植物或植物細(xì)胞或結(jié)節(jié)中表達(dá)的所關(guān)注的核苷酸序列(通常為異源核苷酸序列)一起在表達(dá)盒或載體中提供。"異源核苷酸序列"意指不是天然與表達(dá)控制元件有效連接的序列。雖然該核苷酸序列對(duì)所述表達(dá)控制元件來說是異源的,但對(duì)植物宿主來說它可以是同源的、或天然的、或異源的、或外來的。應(yīng)當(dāng)認(rèn)識(shí)到,本發(fā)明的表達(dá)控制元件或其變體或片段可用于驅(qū)動(dòng)各自天然編碼序列的表達(dá)。這種構(gòu)建體可改變天然的多肽在植物或植物細(xì)胞中的表達(dá)水平。因而,可以改變植物或植物細(xì)胞的表型。如本文所用的,"載體"指用于將核苷酸構(gòu)建體(例如表達(dá)盒)引入宿主細(xì)胞中的DM分子例如質(zhì)粒、粘?;蚴删w。克隆載體通常含有一個(gè)或少量的限制性核酸內(nèi)切酶識(shí)別位點(diǎn)以及如本文在下面所描述的標(biāo)記基因,在該識(shí)別位點(diǎn)外源DM序列可以以可測(cè)定的方式插入而不會(huì)喪失載體的基本生物學(xué)功能,該標(biāo)記基因適合用于鑒定和選擇用克隆載體轉(zhuǎn)化的細(xì)胞。如本文所用的,術(shù)語"植物"包括整林植物、植物器官(如,葉、莖、根等)、種子、植物細(xì)胞和植物的后代。轉(zhuǎn)基因植物的部分在本發(fā)明的范圍內(nèi)應(yīng)該理解為包括(例如)植物細(xì)胞、原生質(zhì)體、組織、愈傷組織、胚以及花、胚珠、莖、果實(shí)、葉、根、根尖等,其源自預(yù)先用本發(fā)明的DM分子轉(zhuǎn)化的轉(zhuǎn)基因植物或它們的后代并因而由至少一部分轉(zhuǎn)基因細(xì)胞組成。如本文所用,術(shù)語"植物細(xì)胞"包括而不限于種子、胚、分生組織區(qū)、愈傷組織、葉、根、芽、配子體、孢子體、花粉和小孢子的細(xì)胞。可用于本發(fā)明方法的植物類型大致與可用于轉(zhuǎn)化技術(shù)的高等植物的類型一樣廣泛,包括單子葉植物和雙子葉植物兩者。這樣的植物包括(例如)浮萍。術(shù)語"浮萍,,指浮萍科的成員。該科通常分成如下5個(gè)屬和38個(gè)浮萍種浮萍屬(稀脈萍、L.disperma、L.ecuadoriensis、膨脹浮萍、L.japonica、浮萍、L.miniscula、L.obscura、稀脈浮萍(L.perpusilla)、Ltenera、品藻(Ltrisulca)、L.turionifera、L.valdiviana);紫萍屬(Spirodela)(S.intermedia,紫萍(S.polyrrhiza)、S.punctata);蕪萍屬(WolffU)(Wa.angusta、蕪萍(Wa.arrhiza)、Wa.australina、Wa.borealis、Wa.brasiliensis、Wa.columMana、Wa.elongata、微萍(Wa.globosa)、Wa.microscopica、Wa.neglecta);Wolfiella屬(W1.caudata、Wl.denticulata、Wl.gladiata、Wl.hyalina、Wl.lingulata、Wl.repunda、Wl.rotunda和Wl.neotropica)和Landoltia屬(L.punctata)。浮萍科的任何其它屬或種(如果它們存在的話)也是本發(fā)明的方面。浮萍屬物種可以用Landolt(1986)BiosystematicInvestigationontheFamilyofDuckweeds:ThefamilyofLemnaceae—AMonographStudy(GeobatanischenInstitutETH,StiftungRubel,Zurich)所描述的分類學(xué)方法進(jìn)行分類。如本文所用的,術(shù)語"浮萍結(jié)節(jié)"指包含的浮萍細(xì)胞中至少約50%、55%、60°/。、65%、70%、75%、80%、85%、90%、95%或100%的細(xì)胞是分化細(xì)胞的浮萍組織。如本文所用的,"分化細(xì)胞"是具有至少一種表型特征(如截然不同的細(xì)胞形態(tài)學(xué)或標(biāo)記核酸或蛋白質(zhì)的表達(dá))的細(xì)胞,該表型特征可將該細(xì)胞與未分化細(xì)胞或存在于其它組織類型中的細(xì)胞區(qū)分開來。本文所述的浮萍結(jié)節(jié)培養(yǎng)物的分化細(xì)胞形成了在它們鄰近的細(xì)胞壁處與結(jié)節(jié)融合的互連細(xì)胞的平整光滑表面,其中結(jié)節(jié)已經(jīng)開始構(gòu)成散布于整個(gè)組織的葉原基。結(jié)節(jié)培養(yǎng)物的組織的表面具有通過胞間連絲(Plasmadesmata)相互連接的表皮細(xì)胞。在一些實(shí)施方案中,提供了包含有效連接至所關(guān)注的核苷酸序列的浮萍科表達(dá)控制元件或其變體或片段的表達(dá)盒或載體,用于在植物或植物細(xì)胞或結(jié)節(jié)中表達(dá)由所關(guān)注的核苷酸序列編碼的多肽。有效連接的所關(guān)注的核苷酸序列可以是其在植物或植物細(xì)胞或結(jié)節(jié)中的表達(dá)是期望的任何序列。所關(guān)注的核苷酸序列將通常是如本文中定義的異源核苷酸序列。示例性的所關(guān)注的異源核苷酸序列包括(但不限于)編碼例如下列哺乳動(dòng)物多肽的序列胰島素、生長激素、ot-干擾素、P-干擾素、P-葡糖腦苷脂酶、p-葡萄糖醛酸酶、視網(wǎng)膜母細(xì)胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細(xì)胞生成素、粒細(xì)胞巨噬細(xì)胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細(xì)胞因子、受體、人疫苗、動(dòng)物疫苗、肽和血清白蛋白。術(shù)語"多肽"、"肽"和"蛋白質(zhì),,在本文中可交換地使用來指氨基酸殘基的聚合物。該術(shù)語適用于其中一個(gè)或多個(gè)氨基酸殘基是對(duì)應(yīng)的天然存在的氨基酸的人造化學(xué)類似物的氨基酸聚合物,以及適用于天然存在的氨基酸聚合物。如本文所用的,術(shù)語"編碼"或"編碼的"在用于具體核酸時(shí)表示該核酸包含必需的信息來引導(dǎo)核苷酸序列翻譯成特定蛋白質(zhì)。編碼蛋白質(zhì)的信息通過利用密碼子確定。編碼蛋白質(zhì)的核酸可以包含非翻譯序列(如內(nèi)含子)于核酸的翻譯區(qū)中或者可以缺少這種插入的非翻譯序列(例如,如在cDNA中)。在一個(gè)具體的非限制性實(shí)例中,轉(zhuǎn)化的浮萍通過用表達(dá)盒轉(zhuǎn)化獲得,該表達(dá)盒包含有效連接至所關(guān)注的異源核苷酸序列的浮萍科泛素表達(dá)控制元件(例如,如在SEQIDN0:l-3中示出的)、它的片段(例如,如在SEQIDNO:4-9中示出的)、浮萍科r-組蛋白表達(dá)控制元件(例如,如在SEQIDNO:13中示出的)、浮萍科幾丁質(zhì)酶表達(dá)控制元件(例如,如在SEQIDNO:14中示出的),或這些序列的變體。轉(zhuǎn)化的浮萍還可以通過用含有有效連接至所關(guān)注的異源核苷酸序列的下列元件的表達(dá)盒轉(zhuǎn)化獲得膨脹浮萍RbcS表達(dá)控制元件(例如,如在SEQIDNO:10-12中示出的;參見GenBank登記號(hào)S4S165(SSU13;核苷酸694-757)、S45166(SSU5A;核苷酸698-755)和S45167(SSU5B;核苷酸690-751)),或其變體或片段。與沒有該元件的表達(dá)比較,在SEQIDNO:10-12中示出的表達(dá)控制元件有利地增強(qiáng)了有效連接的異源核苷酸序列在轉(zhuǎn)化的浮萍中的表達(dá)。本發(fā)明的表達(dá)盒提供有多個(gè)限制性酶切位點(diǎn),其用于插入將在表達(dá)控制元件的轉(zhuǎn)錄調(diào)節(jié)下的編碼所關(guān)注的蛋白質(zhì)的核苷酸序列。表達(dá)盒可以編碼單個(gè)所關(guān)注的基因??蛇x擇地,表達(dá)盒可編碼兩個(gè)或多個(gè)所關(guān)注的基因。本文所述的表達(dá)盒在5'-3'的轉(zhuǎn)錄方向上包括在植物中起作用的轉(zhuǎn)錄和翻譯起始區(qū)(如本發(fā)明的表達(dá)控制元件或其生物學(xué)上的活性變體或片段)、所關(guān)注的核苷酸序列以及轉(zhuǎn)錄和翻譯終止區(qū)。本領(lǐng)域已知的任何合適的終止序列都可以根據(jù)本發(fā)明使用。終止區(qū)可以是天然與轉(zhuǎn)錄起始區(qū)一起的,可以是天然與所關(guān)注的核苷酸序列一起的,或者可以源自另外的來源。實(shí)用的終止區(qū)可從根癌農(nóng)桿菌的Ti-質(zhì)粒獲得,例如章魚堿合成酶和胭脂堿合成酶終止區(qū)。還可以參見Guerineau等,(1991)Mol.Gen.Genet.262:141;Proudfoot(1991)Cell64:671;Sanfacon等,(1991)GenesDev.5:141;Mogen等,(1990)PlantCell2:1261;Munroe等,(1990)Gene91:151;Ballas等,(1989)NucleicAcidsRes.17:7891以及Joshi等(1987)NucleicAcidsRes.15:9627。另外的示例性終止序列是豌豆RubP羧化酶小亞基終止序列、花椰菜花葉病毒35S終止序列,以及來自許多植物物種的泛素終止子。其它合適的終止序列對(duì)本領(lǐng)域技術(shù)人員來說將是顯而易見的。通常,表達(dá)盒將包含用于選擇轉(zhuǎn)化的細(xì)胞或組織的選擇標(biāo)記基因。選擇標(biāo)記基因包括編碼抗生素抗性的基因,例如編碼新霉素磷酸轉(zhuǎn)移酶II(NEO)、新霉素磷酸轉(zhuǎn)移酶III和潮霉素磷酸轉(zhuǎn)移酶(HPT)的那些基因,以及賦予除草化合物抗性的基因。除草劑抗性基因通常編碼對(duì)除草劑不敏感的經(jīng)修飾的靶蛋白質(zhì)或者編碼在除草劑可作用之前將其在植物中的降解或去毒的酶。參見,DeBlock等,(l987)EMBOJ.6:2513;DeBlock等,(1989)PlantPhysiol.91:691、Fromm等,(1990)BioTechnology8:833;Gordon-Kamm等,(1990)PlantCell2:603和Frisch等,(1995)PlantMol.Biol.27:405-9。例如,草甘膦除草劑抗性或碘酰脲類除草劑抗性已經(jīng)用編碼突變的靶標(biāo)酶5-烯醇丙酮酰莽草酸-3-砩酸合成酶(EPSPS)和乙酰乳酸合成酶(ALS)的基因獲得。對(duì)草銨膦、溴草腈(boromoxynil)和2,4-二氯苯氧乙酸(2,4-D)的抗性已經(jīng)通過用編碼使相應(yīng)的除草劑去毒的膦絲菌素乙酰轉(zhuǎn)移酶、腈水解酶或2,4-二氯苯氧乙酸單氧化酶的細(xì)菌基因獲得。對(duì)于本發(fā)明而言,選擇標(biāo)記基因包括(但不限于)編碼新霉素磷酸轉(zhuǎn)移酶II(Fraley等,(1986)CRCCriticalReviewsin植物Science4:l)的基因;編碼新霉素磷酸轉(zhuǎn)移酶III(Frisch等,(1995)植物Mol.Biol.27:405-9)的基因;編碼氰酰胺水合酶(Maier-Greiner等,(1991)Proc.Natl.Acad.Sci.USA88:4250)的基因;編碼天冬氨酸激酶、二氫吡啶二羧酸合成酶(Perl等,(1993)BioTechnology11:715)的基因;bar基因(Toki等,(1992)PlantPhysiol.100:1503;Meagher等,(1996)CropSci.36:1367);編碼色氨酸脫羧酶(Goddijn等,(1993)PlantMol.Biol.22:907)的基因;編碼新霉素磷酸轉(zhuǎn)移酶(NE0;Southern等,(1982)J.Mol.Appl.Gen.1:327)的基因;編碼潮霉素磷酸轉(zhuǎn)移酶(HPT或HYG;Shimizu等,(1986)Mol.Cell.Biol.6:1074)的基因;編碼二氬葉酸還原酶(DHFR;Kwok等,(1986)Proc.Natl.Acad.Sci.USA83:4552)的基因;編碼膦絲菌素乙酰轉(zhuǎn)移酶(DeBlock等,(1987)EMBOJ.6:2513)的基因;編碼2,2-二氯丙酸脫囟素酶(Buchanan-Wollatron等,(1989)J.Cell.Biochem.13D:330)基因;編碼乙酰羥酸合成酶(Anderson等的美國專利No.4,761,373、Haughn等,(1988)Mol.Gen.Genet.221:266)的基因;編碼5-烯醇丙酮酰莽草酸-磷酸合成酶(aroA;Comai等,(1985)Nature317:741)基因;編碼囟代芳基腈水解酶(haloarylnitrilase)(Stalker等的W087/04181)的基因;編碼乙酰輔酶A羧化酶(Parker等,(1990)PlantPhysiol.92:1220)的基因;編碼二氫蝶酸合成酶(sull;Guerineau等,(1990)PlantMol.Biol.15:127)和32kDa光系統(tǒng)II多肽(psbA;Hirschberg等,(1983)Science222:1346(1983)的基因。還包括編碼下列抗性的基因慶大霉素抗性(例如aacCl,髓lleben等,(1989)Mol.Gen.Genet.217:202-208)、氯霉素抗性(Herrera-Estrella等,(1983)EMBOJ.2:987)、曱氨蝶呤抗性(Herrera-Estrella等,(1983)Nature303:209;Meijer等,(1991)PlantMol.Biol.16:807)、潮霉素抗性(Waldron等,(1985)PlantMol.Biol.5:103;Zhijian等,(1995)PlantScience108:219;Meijer等,(1991)PlantMol.Bio.16:807)、鏈霉素抗性(Jones等,(1987)Mol.Gen.Genet.210:86)、大觀霉素抗性(Bretagne-Sagnard等,(1996)TransgenicRes.5:131)、博來霉素抗性(Hille等,(1986)PlantMol.Biol.7:171)、磺胺藥物抗性(Guerineau等,(1990)PlantMol.Bio.15:127)、溴草腈抗性(Stalker等,(1988)Science242:419)、2,4-D(Streber等,(1989)BioTechnology7:811)、膦絲菌素抗性(DeBlock等,(1987)EMB0J.6:2513)、大觀霉素抗性(Bretagne-Sagnard和Chupeau,TransgenicResearch5:131)。Bar基因賦予了對(duì)草銨膦類殺蟲劑例如膦絲菌素(PPT)或雙丙氨膦等等的抗性??捎糜诒磉_(dá)構(gòu)建體的其它選擇標(biāo)記包括(但不限于)還負(fù)責(zé)雙丙氨膦抗性和膦絲菌素抗性的PAT基因、負(fù)責(zé)咪唑啉酮抗性的ALS基因、負(fù)責(zé)潮霉素抗性的HPH或HYG基因、負(fù)責(zé)草甘膦抗性的EPSP合成酶基因、負(fù)責(zé)Hc-毒素抗性的Hml基因,以及其它常規(guī)使用的且本領(lǐng)域技術(shù)人員已知的選擇劑。參見Yarranton(1992)Curr.Opin.Biotech.3:506、Chistopherson等,(1992)Proc.Natl.Acad.Sci.USA89:6314、Yao等,(1992)Cell71:63、Reznikoff(1992)Mol.Microbiol.6:2419、Barkley等,(1980)TheOperon177-220、Hu等,(1987)Cell48:555、Brown等,(1987)Cell49:603、Figge等,(1988)Cell52:713、Deuschle等,(1989)Proc.Natl.Acad.Sci.USA86:5400、Fuerst等,(1989)Proc.Natl.Acad.Sci.USA86:2549、Deuschle等,(1990)Science248:480、Labow等,(1990)Mol.Cell.Biol.10:3343、Zambretti等,(1992)Proc.Nati.Acad.Sci.USA89:3952、Baim等,(1991)Proc.Natl.Acad.Sci.USA88:5072、Wyborski等,(1991)Nuc.AcidsRes.19:4647、Hille訓(xùn)d-Wissman(1989)TopicsinMol.AndStruc.Biol.10:143、Degenkolb等,(1991)Antimicrob.AgentsChemother.35:1591、Kleinschnidt等,(1988)Biochemistry27:1094、Gatz等,(1992)PlantJ.2:397、Gossen等,(1992)Proc.Natl.Acad.Sci.USA89:5547、Oliva等,(1992)Antimicrob.AgentsChemother.36:913、Hlavka等,(1985)HandbookofExperimentalPharmacology78和Gill等,(1988)Nature334:721。將這些公開以引用方式并入本文。上面列出的選擇標(biāo)記基因不意味著作為限制。任何致命性或非致命性的選擇標(biāo)記基因都可用于本發(fā)明。在一些實(shí)施方案中,本發(fā)明提供了對(duì)所關(guān)注的表達(dá)的核苷酸序列的修飾以便增強(qiáng)它在所關(guān)注的植物中的表達(dá)。用于合成具有植物優(yōu)選的密碼子的核苷酸序列的方法是本領(lǐng)域中可獲得的。參見,例如,美國專利No.5,380,831和No.5,436,391(它們兩者以引用方式并入本文)、Periak等,(1991)Proc.Natl.Acad.Sci.USA15:3324、Iannacome等,(1997)PlantMol.Biol.34:485和Murray等,(1989)NucleicAcids.Res.17:477。例如,如果所關(guān)注的植物是浮萍,則一種這樣的修飾是用浮萍-優(yōu)選的密碼子合成所關(guān)注的核苷酸序列。優(yōu)選的密碼子可以從浮萍中表達(dá)的蛋白質(zhì)中最高頻率的密碼子確定。因而,浮萍中具體密碼子的使用頻率可以通過分析一組浮萍編碼序列中的密碼子使用情況來測(cè)定。許多浮萍編碼序列是本領(lǐng)域技術(shù)人員已知的;參見(例如)GenBank數(shù)據(jù)庫中所包括的序列,其可以通過位于馬里蘭州的貝塞斯達(dá)(Bethesda,Maryland)的美國國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation)(美國國家醫(yī)學(xué)圖書館(NationalLibraryofNedicine)的一部分)的網(wǎng)站評(píng)估。基于包含于最新GenBanl^版本中的序列,示出了密碼子使用頻率的表可以在日本千葉的網(wǎng)站KazusaDNAResearchInstitute上找到。該數(shù)據(jù)庫在Nakamura等,(2000)NucleicAcidsRes.28:292中有描述。應(yīng)當(dāng)認(rèn)識(shí)到,可以將對(duì)于在浮萍和其它單子葉植物或雙子葉植物中表達(dá)來說已經(jīng)最優(yōu)化的基因用于本發(fā)明的方法。參見,例如EP0359472、EP0385962、W091/16432、Periak等,(1991)Proc.Natl.Acad.Sci.USA88:3324、Iannacome等,(1997)PlantMol.Biol.34:485、Murray等,(1989)NucleicAcidsRes.17:477等。還應(yīng)當(dāng)認(rèn)識(shí)到,基因序列的全部或任何部分可以是優(yōu)化的或合成的。換而言之,也可以使用完全優(yōu)化的或部分優(yōu)化的序列。例如,40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的密碼子可以是植物優(yōu)選的密碼子(例如浮萍優(yōu)選的密碼子)。因而,在一些實(shí)施方案中,編碼所關(guān)注的多肽的核苷酸序列包含50-100%之間的浮萍優(yōu)選的密碼子或70-100%之間的浮萍優(yōu)選的密碼子。在一個(gè)實(shí)施方案中,90%和96%之間的密碼子是浮萍優(yōu)選的密碼子。所關(guān)注的核苷酸序列的編碼序列可以包含在浮萍中使用頻率為至少17%的密碼子。膨脹浮萍中的密碼子使用情況(表1)和浮萍中的密碼子使用情況(表2)在下面示出。在一些實(shí)施方案中,表1或表2用于選擇浮萍優(yōu)選的密碼子。表l:來自GenBanl^第139版*的膨脹浮萍密碼子使用情況氨基酸密碼子數(shù)量/1000分?jǐn)?shù)GlyGGG57.0028.890.35GlyGGA8.004.050.05GlyGGT3.001.520.02GlyGGC93.0047.140.58GluGAG123.0062.340.95GluGAA6.003.040.05AspGAT6.003.040.08AspGAC72.0036.490.92ValGTG62.0031.420.47ValGTA0.000.000.00ValGTT18.009.120.14ValGTC51.0025.850.39AlaGCG44.0022.300.21AlaGCA14.007.100.07AlaGCT14.007.100.07AlaGCC139.0070.450.66ArgAGG16.008.110.15ArgAGA11.005.580.10SerAGT1.000.510.01SerAGC44.0022.300.31LysAAG116.0058.791.00LysAAA0.000.000.00AsnAAT2.001.010.03AsnAAC70.0035.480.97MetATG67.0033.961.00lieATA4.002.030.06lieATT0.000.000.00lieATC63.0031.930.94ThrACG19.009.630.25ThrACA1.000.510.01ThrACT6.003.040.08ThrACC50.0025.340.66TrpTGG45.0022.811.00EndTGA4.002.030.36CysTGT0.000.000.00CysTGC34.0017.231.00EndTAG0.000.000.00EndTAA7.003.550.64TyrTAT4.002.030.05TyrTAC76.0038.520.95LeuTTG5.002.530,04LeuTTA0.000.000.00PheTTT4.002.030.04PheTTC92.0046.630.96SerTCG34.0017.230.24SerTCA2.001.010.01SerTCT1.000.510.01SerTCC59.0029.900.42ArgCGG23.0011.660.22ArgCGA3.001.520.03ArgCGT2.001.010.02ArgCGC50.0025.340.48GinCAG59.0029.900.86GinCAA10.005.070.14HisCAT5.002.530.26HisCAC14.007.100.74LeuCTG43.0021.790.35LeuCTA2.001.010.02LeuCTT1.000.510.01LeuCTC71.0035.990.58ProCCG44.0022.300.31ProCCA6.003.040.04ProCCT13.006.590.09ProCCC80.0040.550.56表2:得自GenBank⑧第139版*的浮萍的密碼子使用情況氨基酸密碼子數(shù)量/1000分?jǐn)?shù)GlyGGG8.0017.390.22GlyGGA11,0023.910.31GlyGGT1.002.170.03GlyGGC16.0034.780.44GluGAG25.0054.350.78GluGAA7.0015.220.22AspGAT8.0017.390.33AspGAC16.0034.780.67ValGTG21,0045.650.53ValGTA3.006.520.07ValGTT6.0013.040.15ValGTC10.0021.740.25AlaGCG13.0028.260.32AlaGCA8.0017.390.20AlaGCT6.0013.040.15AlaGCC14.0030.430.34ArgAGG9.0019.570.24ArgAGA11.0023.910.30SerAGT2.004.350.05SerAGC11.0023.910.26LysAAG13.0028.260.68LysAAA6.0013.040.32AshAAT0.000.000.00AshAAC12.0026.091.00MetATG9.0019.571.00lieATA1.002.170.08lieATT2.004.350.15lieATC10.0021.740.77ThrACG5.0010.870.28ThrACA2.004.350.11ThrACT2.004.350.11ThrACC9.0019.570.50TrpTGG8.0017.391.00EndTGA1.002.171.00CysTGT1.002.170.12CysTGC7.0015.220.88EndTAG0.000.000.00EndTAA0.000.000.00TyrTAT1.002.170.12TyrTAC7.0015.220.88LeuTTG3.006.520.08LeuTTA1.002.170.03PheTTT6.0013.040.25PheTTC18.0039.130.75SerTCG11.0023.910.26SerTCA4.008.700.09SerTCT6.0013.040.14SerTCC9.0019.570.21ArgCGG4.008.700.11ArgCGA4.008.700.11ArgCGT0.000.000.00ArgCGC9.0019.570.24GinCAG11.0023.910.73GinCAA4.008.700.27HisCAT0.000.000.00HisCAC6.0013.041.00LeuCTG9.0019.570.24EeuCTA4.008.700.11LeuCTT4.008.700.11LeuCTC17.0036.960.45ProCCG8.0017.390.29ProCCA7.0015.220.25ProCCT5.0010.870.18ProCCC8.0017.390.29還可以對(duì)所關(guān)注的核苷酸序列進(jìn)行其它修飾來優(yōu)化其在植物中的表達(dá)。這些修飾包括(但不限于)刪除編碼假多腺苷酸化信號(hào)、外顯子-內(nèi)含子剪接位點(diǎn)信號(hào)的序列、類似轉(zhuǎn)座子的重復(fù),以及其它像這樣詳細(xì)表征了的可能對(duì)基因表達(dá)有害的序列??梢詫⑿蛄械腉-C含量調(diào)節(jié)至所給定細(xì)胞宿主的平均水平,這通過參考在宿主細(xì)胞中表達(dá)的已知基因來計(jì)算。如果可能,可以修飾序列來避免預(yù)測(cè)的mRNA發(fā)卡二級(jí)結(jié)構(gòu)。動(dòng)物和植物中翻譯起始密碼子的最佳翻譯起始區(qū)核苷酸序列之間存在已知的差異,并且這些翻譯起始區(qū)核苷酸序列的組成可以影響翻譯起始的效率。參見,例如Lukaszewicz等,(2000)PlantScience154:89-98和Joshi等,(1997)PlantMol.Biol.35:993-1001。在本發(fā)明的一些實(shí)施方案中,可以修飾所關(guān)注的核苷酸序列的翻譯起始密碼子的翻譯起始區(qū)核苷酸序列來增強(qiáng)在浮萍中的表達(dá)。在一個(gè)實(shí)施方案中,修飾核苷酸序列使得所關(guān)注的核苷酸序列的翻譯起始密碼子正上游的三個(gè)核苷酸為"ACC"。在另一個(gè)實(shí)施方案中,這些核苷酸是"ACA"。除了本文所述的用于起始或增強(qiáng)異源核苷酸序列在植物中的表達(dá)的表達(dá)控制元件,所關(guān)注的核苷酸序列的表達(dá)還可以通過任選使用多種調(diào)控元件來增強(qiáng)。如本文所用的"調(diào)控元件"指通常在結(jié)構(gòu)基因的編碼序列上游(5')的核苷酸序列(DM或RNA),包括轉(zhuǎn)錄控制序列例如前導(dǎo)序列、啟動(dòng)子、翻譯和轉(zhuǎn)錄增強(qiáng)子或抑制子,以及mRNA穩(wěn)定性和不穩(wěn)定性決定子(determinant)。存在于內(nèi)含子中的序列也可以調(diào)節(jié)所關(guān)注的編碼區(qū)的表達(dá)。調(diào)控元件也可以存在于3'端至轉(zhuǎn)錄起始位點(diǎn)之間,或存在于轉(zhuǎn)錄區(qū)內(nèi)。可以將多種調(diào)控元件有效地連接至其它的調(diào)控元件。如本文所用的"前導(dǎo)序列"指位于mRNA的5'端處的核酸的部分,其從5'CAP位點(diǎn)延伸到AUG蛋白質(zhì)翻譯起始密碼子。前導(dǎo)序列在翻譯起始和基因表達(dá)調(diào)控中很重要。例如,一個(gè)或多個(gè)前導(dǎo)序列可以另外組合使用來增強(qiáng)靶標(biāo)核苷酸序列的表達(dá)。翻譯前導(dǎo)序列是本領(lǐng)域已知的并且包括(但不限于)小RNA病毒前導(dǎo)序列,如EMCV前導(dǎo)序列(腦心肌炎病毒^非編碼區(qū);Elroy-Stein等,(1989)Proc.Natl.Acad.SciUSA86:6126)、馬鈴薯Y病毒前導(dǎo)序列,如TEV前導(dǎo)序列(煙草蝕刻病毒;Gallie等,(1995)Gene165:233)、人免疫球蛋白重鏈結(jié)合蛋白(BiP;Macajak和Sarnow(1991)Nature353:90)、來自苜蓿花葉病毒外殼蛋白的mRNA的非翻譯前導(dǎo)序列(AMVRNA4;Jobling和Gehrke(1987)Nature325:622)、煙草花葉病毒前導(dǎo)序列(TMV;GalHe(1989)MolecularBiologyofRNA,23:56)、馬鈴薯蝕刻病毒前導(dǎo)序列(Tomashevskaya等,(1993)J.Gen.Virol.74:2717—2724)、Fed-1非翻譯區(qū)(Dickey(1992)EMB0J.11:2311-2317)、RbcS5'非翻譯區(qū)(Silverthorne等,(1990)J.Plant.Mol.Biol.15:49-58)和玉米褪綠斑駁病毒前導(dǎo)序列(MCMV;Lommel等,(1991)Virology81:382)。還可以參見Delia-Cioppa等,(1987)PlantPhysiology84:965。包含植物內(nèi)含子序列的前導(dǎo)序列也已經(jīng)顯示增強(qiáng)植物中的翻譯效率,所述植物內(nèi)含子序列包括來自玉米脫氫酶1基因、蓖麻過氧化氬酶基因或擬南芥色氨酸途徑基因PAT1的內(nèi)含子序列(Callis等,(1987)GenesDev.1:1183-1200、Mascarenhas等,(1990)PlantMol.Biol.15:913-920)。如本文在上面所述的浮萍科泛素內(nèi)含子(即,如在SEQIDNO:7-9中示出的)可以與不同于它們相應(yīng)的泛素啟動(dòng)子的啟動(dòng)子一起使用,以便增強(qiáng)有效連接的所關(guān)注的核苷酸序列的表達(dá)。與泛素內(nèi)含子一起使用的啟動(dòng)子可以是任何適用于所關(guān)注的植物的啟動(dòng)子,包括分別在SEQIDNO:13和NO:14中/>開的新的浮萍科r-組蛋白啟動(dòng)子和幾丁質(zhì)酶啟動(dòng)子。其它合適的啟動(dòng)子可以從多種來源獲得,例如從植物或植物DNA病毒獲得??捎玫膯?dòng)子包括分離自花椰菜花葉病毒組的那些,例如花椰菜花葉病毒19S和35S(CaMV19S和C藩35S)的轉(zhuǎn)錄啟動(dòng)子。其它可用的啟動(dòng)子包括如Kat等,(1987)Science236:1299-1302描述的增強(qiáng)的CaMV35S啟動(dòng)子(eCaMV35S)和核酮糖1,5-二磷酸羧化酶加氧酶(RUBISCO)的小亞基啟動(dòng)子。其它合適的啟動(dòng)子的實(shí)例是水稻肌動(dòng)蛋白啟動(dòng)子、親環(huán)素(cyclophilin)啟動(dòng)子、ADH1啟動(dòng)子(Callis等,(1987)GeneDev.1:1183-1200)、I類patatin啟動(dòng)子(Bevan等,(1986)Nucl.AcidsRes.14:4675-4638)、ADP葡萄糖焦磷酸化酶啟動(dòng)子、p-伴大豆球蛋白啟動(dòng)子(Tiemey等,(1987)Planta172:356-363)、E8啟動(dòng)子(Deibnan等,(1988)EmboJ.7:3315-3320)、2AII啟動(dòng)子(Pear等,(1989)PlantMol.Biol.13:639-651)和酸性幾丁質(zhì)酶啟動(dòng)子(Samac等,(1990)PlantPhysiol.93:907-914)。應(yīng)當(dāng)認(rèn)識(shí)到,上述任何增強(qiáng)表達(dá)的核苷酸序列修飾都可用于本發(fā)明,包括任意的單一修飾或修飾的任何可能的組合。在一些實(shí)施方案中,將本發(fā)明的組合物和方法用于植物表達(dá)系統(tǒng)(例如浮萍表達(dá)系統(tǒng)),并且所關(guān)注的異源核苷酸序列是分泌性蛋白。分泌性蛋白通常從包含"信號(hào)肽"的前體多肽轉(zhuǎn)變而來,該信號(hào)肽與內(nèi)質(zhì)網(wǎng)(ER)膜上的受體蛋白相互作用而引導(dǎo)生長的多肽鏈轉(zhuǎn)位跨過膜并進(jìn)入內(nèi)質(zhì)網(wǎng)中以從細(xì)胞分泌。這種信號(hào)肽通常從前體多肽切除以產(chǎn)生不含信號(hào)肽的"成熟"多肽。以這種方式,生物學(xué)上的活性多肽得以在植物(例如浮萍)中從表達(dá)構(gòu)建體表達(dá),該表達(dá)構(gòu)建體具有有效連接至所關(guān)注的核苷酸序列的本發(fā)明表達(dá)控制元件或其生物學(xué)上的活性變體或片段,所關(guān)注的核苷酸序列還與編碼引導(dǎo)多肽分泌進(jìn)培養(yǎng)基中的信號(hào)肽的核苷酸序列有效連接。"生物學(xué)上的活性多肽,,指具有執(zhí)行一種或多種生物學(xué)功能的能力或具有在生物學(xué)背景中通常歸因于該多肽的一組活性的多肽。靶向蛋白質(zhì)轉(zhuǎn)移至內(nèi)質(zhì)網(wǎng)(以便向細(xì)胞外分泌)的植物信號(hào)肽是本領(lǐng)域已知的。參見例如,美國專利No.6,020,169,將其以引用方式并入本文。在一個(gè)實(shí)施方案中,信號(hào)肽是在SEQIDNO:16中示出的新的浮萍幾丁質(zhì)酶信號(hào)肽,或其變體或片段,并且表達(dá)構(gòu)建體包含有效連接至所關(guān)注的核苷酸序列的編碼該信號(hào)肽的核苷酸序列。在一些實(shí)施方案中,該信號(hào)肽編碼序列是在SEQIDNO:U中示出的序列。應(yīng)當(dāng)認(rèn)識(shí)到,本發(fā)明的浮萍幾丁質(zhì)酶信號(hào)肽,或其變體或片段可用于引導(dǎo)任何所關(guān)注的編碼的多肽的細(xì)胞外分泌。以這種方式,可以將SEQIDNO:15的信號(hào)肽編碼序列或其變體或片段整合進(jìn)任何表達(dá)構(gòu)建體中,使得它能在正確的閱讀框架中有效地連接至所關(guān)注的啟動(dòng)子和所關(guān)注的編碼多肽的核苷酸序列。可以將這種表達(dá)構(gòu)建體引入植物泌??蛇x擇地,可將哺乳動(dòng)物信號(hào)肽用于靶向在遺傳工程化植物(例如浮萍)中表達(dá)的重組多肽以便分泌。已經(jīng)證實(shí)植物細(xì)胞識(shí)別靶向內(nèi)質(zhì)網(wǎng)的哺乳動(dòng)物信號(hào)肽,而且這些信號(hào)肽不僅可以引導(dǎo)多肽通過質(zhì)膜分泌而且還可以引導(dǎo)多肽通過植物細(xì)胞壁分泌。參見,例如美國專利No.5,202,422和No.5,639,947,將它們兩者以引用方式并入本文。分泌的多肽可以通過本領(lǐng)域已知的常規(guī)手段從培養(yǎng)基收獲并且可以通過色鐠、電泳、透析、溶劑-溶劑萃取等純化。本發(fā)明的方法涉及將表達(dá)構(gòu)建體引入植物或植物細(xì)胞或結(jié)節(jié)中。"引入"旨在表示以使構(gòu)建體得以進(jìn)入植物細(xì)胞內(nèi)的方式將表達(dá)構(gòu)建體給予植物。本發(fā)明的方法不依賴于將表達(dá)構(gòu)建體引入植物中的具體方法,僅僅是為了使表達(dá)構(gòu)建體獲得進(jìn)入至少一個(gè)植物細(xì)胞的內(nèi)部。用于將表達(dá)構(gòu)建體引入植物中的方法是本領(lǐng)域已知的,包括(但不限于)穩(wěn)定轉(zhuǎn)化方法、瞬時(shí)轉(zhuǎn)化方法以及病毒介導(dǎo)的方法。"穩(wěn)定轉(zhuǎn)化"意指引入植物中的核苷酸序列整合進(jìn)植物的基因組中,并能夠遺傳給它的后代。"瞬時(shí)轉(zhuǎn)化"意指引入植物中的核苷酸序列(如,包含于表達(dá)構(gòu)建體中的核苷酸序列)沒有整合進(jìn)植物的基因組中。本發(fā)明的核苷酸序列可以通過將植物或植物細(xì)胞或結(jié)節(jié)與病毒或病毒核酸接觸而被引入植物或植物細(xì)胞或結(jié)節(jié)中。一般而言,這種方法涉及將本發(fā)明的核苷酸序列整合進(jìn)病毒DNA或RNA分子中。用于將核苷酸序列引入植物或植物細(xì)胞或結(jié)節(jié)中并在其中表達(dá)編碼的蛋白質(zhì)的方法(涉及病毒DNA或RM分子)是本領(lǐng)域已知的。參見例如美國專利No.5,889,191、No.5,889,190、No.5,866,785、No.5,589,367和No.5,316,931,將這幾個(gè)專利以引用方式并入本文。轉(zhuǎn)化方法以及用于將核苷酸序列引入植物中的方法可以不同,這取決于作為轉(zhuǎn)化目標(biāo)的植物或植物細(xì)胞或結(jié)節(jié)的類型,即單子葉植物或雙子葉植物。將核苷酸序列引入植物或植物細(xì)胞或結(jié)節(jié)中的合適方法包括顯微注射(Crossway等,(1986)Biotechniques4:320-334)、電穿孑L(Riggs等,(1986)Proc.Natl.Acad.Sci.USA83:5602-5606)、農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化(美國專利No.5,563,055和No.5,981,840,這兩個(gè)專利以引用方式并入本文)、直接基因轉(zhuǎn)移(Paszkowski等,(1984)EMBOJ.3:2717-2722),以及基因槍粒子加速(ballisticparticleacceleration)(參見例如美國專利No.4,945,050、No.5,879,918、No.5,886,244和5,932,782(將每個(gè)專利以引用方式并入本文),以及Tomes等,(1995)"DirectDNATransferintoIntactPlantCellsviaMicroprojectileBombardment,"inPlantCell,Tissue,andOrganCulture:FundamentalMethods,ed.GamborgandPhi11ips(Springer-Verlag,Berlin)、McCabe等,(1988)Biotechnology6:923-926)。根據(jù)常規(guī)的方法,可使已轉(zhuǎn)化的細(xì)胞成長為植林。參見,例如McCormick爭,(1986)戶/a/^Ce"We,"5:81-84。在一些實(shí)施方案中,穩(wěn)定轉(zhuǎn)化的浮萍植物或浮萍植物細(xì)胞或結(jié)節(jié)表達(dá)了由于費(fèi)用或邏輯限制或這兩種原因而不能通過現(xiàn)有基因表達(dá)系統(tǒng)進(jìn)行有效商業(yè)化生產(chǎn)的生物學(xué)上的活性多肽。例如,一些蛋白質(zhì)不能在哺乳動(dòng)物系統(tǒng)中表達(dá),因?yàn)樵摰鞍踪|(zhì)干擾細(xì)胞生存力、細(xì)胞增殖、細(xì)胞分化,或哺乳動(dòng)物細(xì)胞中的蛋白質(zhì)組裝。這樣的蛋白質(zhì)包括(但不限于)視網(wǎng)膜母細(xì)胞瘤蛋白、p53、制管張素和瘦素。本發(fā)明可有利地用于產(chǎn)生哺乳動(dòng)物調(diào)節(jié)蛋白;考慮到高等植物和哺乳動(dòng)物之間的大的進(jìn)化距離,這些蛋白質(zhì)干擾浮萍中的調(diào)節(jié)過程是不可能的。轉(zhuǎn)基因浮萍還可用于產(chǎn)生大量的蛋白質(zhì)例如血清白蛋白(特別是人血清白蛋白)、血紅蛋白和膠原,這挑戰(zhàn)了現(xiàn)存的表達(dá)系統(tǒng)的生產(chǎn)能力。另外,可以工程化高等植物系統(tǒng)來比哺乳動(dòng)物系統(tǒng)更容易地產(chǎn)生生物學(xué)上的活性多聚體蛋白質(zhì)(如,單克隆抗體、血紅蛋白、P450氧化酶和膠原等)。用于在浮萍中產(chǎn)生生物學(xué)上的活性多聚體蛋白質(zhì)的一個(gè)示例性方法利用了含有編碼所有多肽亞基的基因的表達(dá)構(gòu)建體。參見,例如During等,(1990)PlantMol.Biol.15:281和vanEngelen等,(1994)PlantMol.Biol.26:1701。然后將該構(gòu)建體用任何已知的轉(zhuǎn)化方法(例如基因槍轟擊或農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化)引入浮萍細(xì)胞中。該方法產(chǎn)生了克隆細(xì)胞系,該細(xì)胞系表達(dá)組裝該多聚體蛋白質(zhì)所需的所有多肽。對(duì)該方法的改變形式是制備單基因構(gòu)建體,將這些構(gòu)建體的DNA混合在一起,然后用基因槍轟擊或農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化將該DNA混合物遞送進(jìn)植物細(xì)胞中。作為另外的變型,一些或所有構(gòu)建體可以編碼多聚體蛋白質(zhì)的多于一個(gè)的亞基(即,以便待雜交的浮萍克隆比多聚體蛋白質(zhì)中的亞基數(shù)少)??蛇x擇地,每個(gè)浮萍克隆表達(dá)多聚體蛋白質(zhì)的至少一個(gè)亞基,并且將分泌每個(gè)亞基的浮萍克隆一起培養(yǎng)并且多聚體蛋白質(zhì)在培養(yǎng)基中從多個(gè)分泌的亞基組裝。在一些情況下,可能期望在轉(zhuǎn)化的浮萍植物或浮萍結(jié)節(jié)中產(chǎn)生少于多聚體蛋白質(zhì)的全部的亞基,或者甚至產(chǎn)生單個(gè)蛋白質(zhì)亞基,例如用于工業(yè)或化工工藝或者為了診斷、治療或疫苗接種目的。下面的實(shí)施例是以舉例說明的目的而不是以限定的方式提供。實(shí)驗(yàn)實(shí)施例1:表達(dá)栽體在下面描述的實(shí)施例中使用的表達(dá)載體包括Egs05、Egs07、Egsll、Egs22、Egs23、Egs46、Egs50、Egs51、Egsl9、Egs20、Egs24、Egs25、IFN53和IFN54。Egs05和Egs07是含有有效連接至大腸桿菌p-葡萄糖趁酸酶(GUS)的編碼序列的控制啟動(dòng)子的未經(jīng)修飾的表達(dá)載體,它們各自具有不同的選擇標(biāo)記基因。Egsll包含有效連接至GUS編碼序列的全長的浮萍泛素表達(dá)控制元件(SEQIDNO:1),具有選擇標(biāo)記基因。Egs22和Egs23是類似的構(gòu)建體,但使用了截短形式的浮萍泛素表達(dá)控制元件。在Egs22中,SEQIDNO:1的核苷酸l288-2160驅(qū)動(dòng)有效連接的GUS編碼序列的表達(dá)。在Egs23中,SEQIDNO:l的核苷酸1132-2160驅(qū)動(dòng)該GUS編碼序列的表達(dá)。Egs46類似于Egsll,但包含不同的選擇標(biāo)記基因。Egs50包含有效連接至GUS編碼序列的全長的紫萍泛素表達(dá)控制元件(SEQIDNO:2),具有選擇標(biāo)記基因。類似地,Egs51包含有效連接至GUS編碼序列的全長的稀脈萍泛素表達(dá)控制元件(SEQIDNO:3),具有選擇標(biāo)記基因。Egsl9包含有效連接至GUS編碼序列的浮萍r-組蛋白表達(dá)控制元件(SEQIDNO:13)的核苷酸461-1808,具有選擇標(biāo)記基因。在Egs20中,SEQIDNO:13的核苷酸805-1808驅(qū)動(dòng)GUS編碼序列的表達(dá)。Egs24包含有效連接至GUS編碼序列的浮萍幾丁質(zhì)酶表達(dá)控制元件(SEQIDNO:14)的核苷酸51-1338,具有選擇標(biāo)記基因。Egs25包制元件(SEQIDNO:14)的核苦酸51-1338,具有選擇標(biāo)記基因。IFN53和IFN54表達(dá)載體每個(gè)均含有有效連接至密碼子優(yōu)化的干擾素oc-卩b基因的AmasPmas超強(qiáng)啟動(dòng)子、膨脹浮萍RbcSSSU5B表達(dá)控制元件(SEQIDNO:12)以及玉米ADH1內(nèi)含子,并且或者具有密碼子優(yōu)化的ot淀粉酶信號(hào)序列(IFN53)或者具有浮萍幾丁質(zhì)酶信號(hào)序列(SEQIDNO:15;IFN54)。實(shí)施例2:浮萍的轉(zhuǎn)化采用農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化方法,將浮萍葉或浮萍結(jié)節(jié)培養(yǎng)物(在這些實(shí)例中源自浮萍林8627)用上述表達(dá)構(gòu)建體轉(zhuǎn)化。在這些實(shí)例中,4尋才艮癌農(nóng)桿菌(J^ro6a"er/i/邁"邁e尸ac/e/7s)抹C58Z707,—種去-丈擊的廣宿主范圍的C58林(Hepburn等,(1985)J.Gen.Microbiol.131:2961-2969)用于轉(zhuǎn)化。將上述表達(dá)構(gòu)建體通過電穿孔或通過利用具有誘動(dòng)質(zhì)粒(Mobilizingplasmid)pRK2013的大腸桿菌匪294的三親雜交方法誘動(dòng)轉(zhuǎn)移進(jìn)根癌農(nóng)桿菌中(Hoekema等,(1983)Nature303:179-180、Ditta等,(1980)Pro"Natl.Acad.Sci.USA77:7347-7350)。將含有上述表達(dá)構(gòu)建體的C58Z707林在含500mg/L鏈霉素、50mg/L大觀霉素和50mg/L硫酸卡那霉素的AB基本培養(yǎng)基上(Chilton等,(1974)Proc.Nat.Acad.Sci.USA71:3672-3676)或者YEB或LB培養(yǎng)基(1g/L酵母提取物、5g/L牛肉提取物、5g/L蛋白胨、5g/L蔗糖、0.5g/LMgS04)中劃線接種并讓其在28C下生長過夜。如下制備用于轉(zhuǎn)化的浮萍結(jié)節(jié)培養(yǎng)物。將浮萍葉分離,用無菌解剖刀將根切除,并將葉腹側(cè)朝下放置在pH5.6的MS培養(yǎng)基(MurashigeandSkoogmedium)(產(chǎn)品目錄號(hào)M-5519;SigmaChemical公司,St.Louis,MO)上,該培養(yǎng)基補(bǔ)充有5yM2,4-二氯苯氧乙酸、0.5jliM1-苯基-3(1,2,3-噻二唑-5-基)脲噻二唑苯基脲(SigmaP6186)、3%蔗糖、0.4DifcoBacto-瓊月旨(FisherScientific)和0.15%GelrUe(Sigma)。讓葉生長5-6周。此時(shí),出現(xiàn)了結(jié)節(jié)(小的淡黃色細(xì)胞群),通常出現(xiàn)在腹側(cè)中心部分。將該結(jié)節(jié)組織與母葉分離并培養(yǎng)于補(bǔ)充有3%蔗糖、0.4%DifcoBacto-瓊脂、0.15%Gelrite、l|aM2,4-二氯苯氧乙酸和2jaM節(jié)腺嘌呤的MS培養(yǎng)基中。如下轉(zhuǎn)化浮萍結(jié)節(jié)培養(yǎng)物。讓合適的根癌農(nóng)桿菌抹在具有50mg/L卡那霉素和100pM乙酰丁香酮的馬玲薯右旋醣瓊脂或YEB或LB瓊脂上生長,并讓其再懸浮于補(bǔ)充有0.6M甘露醇和100jiM乙酰丁香酮的MS培養(yǎng)基中。將結(jié)節(jié)培養(yǎng)物組織通過浸沒在再懸浮的細(xì)菌溶液中1-2分鐘接種,吸千除去過量的液體,并將其涂布于由MS培養(yǎng)基組成的共培養(yǎng)培養(yǎng)基上,該MS培養(yǎng)基補(bǔ)充有經(jīng)優(yōu)化用于促進(jìn)結(jié)節(jié)生長的植物生長素和細(xì)胞分裂素以及100nM的乙酰丁香酮。參見,Yamamoto等,(2001)InVitroCellDev.Biol.Plant37:349-353。為了選擇,將結(jié)節(jié)培養(yǎng)物組織轉(zhuǎn)移至再生培養(yǎng)基(補(bǔ)充有1%蔗沖唐、0.4%DifcoBacto-瓊脂、0.15%Gelrite、500mg/L頭孢噢將和6mg/L遺傳霉素的0.5XSchenkandHildebrandt培養(yǎng)基),并在持續(xù)光照(20-40jjM/m2(秒)下培養(yǎng)大約6-8周。將結(jié)節(jié)組織每7天轉(zhuǎn)移至新鮮的培養(yǎng)基中。當(dāng)結(jié)節(jié)組織顯示在選擇試劑上健壯生長時(shí),選擇完成。實(shí)施例3:大腸桿菌GUS在浮萍中的瞬時(shí)表達(dá)在用Egs05、Egs07、Egsll、Egs22、Egs23、Egs46、Egs50、Egs51、Egsl9、Egs20、Egs24和Egs25構(gòu)建體轉(zhuǎn)化的浮萍結(jié)節(jié)培養(yǎng)物中評(píng)估GUS的瞬時(shí)表達(dá)。所有構(gòu)建體都能夠驅(qū)動(dòng)強(qiáng)的GUS表達(dá),這通過"小時(shí)染色測(cè)定(表3)。另外,在用Egs07、Egs46、Egs50和Egs51構(gòu)建體轉(zhuǎn)化的浮萍結(jié)節(jié)培養(yǎng)物上進(jìn)行GUS酶測(cè)定法。36個(gè)Egs07轉(zhuǎn)基因系的平均值是1.345%的GUS,29個(gè)Egs46轉(zhuǎn)基因系的平均值是2.32(T/。的GUS,4個(gè)Egs50轉(zhuǎn)基因系的平均值是4.008%的GUS,并且8個(gè)Egs51轉(zhuǎn)基因系的平均值是6.682%的GUS。表3:愈傷組織中的GUS瞬時(shí)表達(dá)<table>tableseeoriginaldocumentpage42</column></row><table>24小時(shí)染色;按1至4評(píng)定等級(jí)。實(shí)施例4:千擾素在浮萍中的表達(dá)用IFN53和IFN54構(gòu)建體制備數(shù)百個(gè)轉(zhuǎn)基因浮萍品系,隨后通過ELISA根據(jù)千擾素表達(dá)對(duì)它們進(jìn)行篩選。觀察到這兩種構(gòu)建體具有相似水平的干擾素表達(dá)。IFN53:最高表達(dá)者為1735.66ng/ml;平均表達(dá)為362.04ng/ml。IFN54:最高表達(dá)者為1173.81ng/ml;平均表達(dá)為347.40ng/ml。領(lǐng)域的技術(shù)人員的水平。所有出版物和專利申請(qǐng)均以相同程度以引用方式并入本文,就如同每一出版物或?qū)@暾?qǐng)被明確且單獨(dú)地表明將其以引用的方式并入本文一樣。盡管為了理解的清楚,已經(jīng)通過說明和實(shí)施例的方式相當(dāng)詳細(xì)地描述了上述發(fā)明,但是顯然可以實(shí)踐某些改變和修飾而不脫離附帶的權(quán)利要求的范圍。權(quán)利要求1.一種分離的核酸分子,包含選自下面的核苷酸序列a)包含在SEQIDNO1、2、3、4、5、6、13或14中示出的序列的核苷酸序列;b)包含在SEQIDN01、2、3、4、5、6、13或14中示出的序列的至少50個(gè)連續(xù)核苷酸的核苷酸序列,其中所述核苷酸序列起始在植物細(xì)胞中的轉(zhuǎn)錄;c)包含在SEQIDNO1、2、3、4、5、6、13或14中示出的序列的功能性片段的核苷酸序列,其中所述片段起始在植物細(xì)胞中的轉(zhuǎn)錄;d)包含與在SEQIDNO1、2、3、4、5、6、13或14中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列起始在植物細(xì)胞中的轉(zhuǎn)錄;和e)在嚴(yán)格條件下與a)的核苷酸序列的互補(bǔ)序列雜交的核苷酸序列,其中所述核苷酸序列起始在植物細(xì)胞中的轉(zhuǎn)錄。2.—種表達(dá)構(gòu)建體,包含根據(jù)權(quán)利要求1所述的核酸分子。3.根據(jù)權(quán)利要求2所述的表達(dá)構(gòu)建體,.還包含有效連接的所關(guān)注的異源核苷酸序列。4.根據(jù)權(quán)利要求3所述的表達(dá)構(gòu)建體,還包含有效連接的信號(hào)肽的編碼序列,所述信號(hào)肽引導(dǎo)由所述所關(guān)注的異源核苷酸序列編碼的多肽分泌進(jìn)培養(yǎng)基中。5.根據(jù)權(quán)利要求4所述的表達(dá)構(gòu)建體,其中所述信號(hào)肽包含選自下面的氨基酸序列a)SEQIDNO:16中示出的序列;b)與SEQIDNO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導(dǎo)所述多肽分泌進(jìn)培養(yǎng)基中;和c)SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導(dǎo)所述多肽分泌進(jìn)培養(yǎng)基中。6.根據(jù)權(quán)利要求5所述的表達(dá)構(gòu)建體,其中所述信號(hào)肽的所述編碼序列包含選自下面的核苷酸序列a)SEQIDNO:15中示出的序列;b)與SEQIDNO:15中示出的序列具有至少90°/的序列同一性的序列;和c)SEQIDNO:15中示出的序列的片段;7.根據(jù)權(quán)利要求3至6中任意一項(xiàng)所述的表達(dá)構(gòu)建體,其中所述所關(guān)注的異源核苷酸序列編碼哺乳動(dòng)物多肽。8.根據(jù)權(quán)利要求7所述的表達(dá)構(gòu)建體,其中所述哺乳動(dòng)物多肽選自胰島素、生長激素、ot-干擾素、p-干擾素、p-葡糖腦苷脂酶、葡萄糖醛酸酶、視網(wǎng)膜母細(xì)胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細(xì)胞生成素、粒細(xì)胞巨噬細(xì)胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細(xì)胞因子、受體、人疫苗、動(dòng)物疫苗、肽、血清白蛋白及其組合。9.一種轉(zhuǎn)化的植物或植物細(xì)胞或結(jié)節(jié),含有根據(jù)權(quán)利要求2所述的表達(dá)構(gòu)建體。10.根據(jù)權(quán)利要求9所述的轉(zhuǎn)化的植物或植物細(xì)胞或結(jié)節(jié),其中所述植物或植物細(xì)胞或結(jié)節(jié)是單子葉植物。11.根據(jù)權(quán)利要求10所述的轉(zhuǎn)化的植物或植物細(xì)胞或結(jié)節(jié),其中所述單子葉植物來自選自下列屬的屬紫萍(Spirodela)屬、蕪萍(Wolffia)屬、Wolfiella屬、Landoltia屬和浮萍Lemna屬。12.根據(jù)權(quán)利要求所述10的轉(zhuǎn)化的植物或植物細(xì)胞或結(jié)節(jié),其中所述單子葉植物是選自下面物種的成員浮萍"e邁"a邁/"or)、丄e邁"a/z7/7z/scw/a、稀脈萍Ue/zmaae,./70"/a//51)和膨脹浮萍。13.根據(jù)權(quán)利要求9所述的轉(zhuǎn)化的植物或植物細(xì)胞或結(jié)節(jié),其中所述植物或植物細(xì)胞或結(jié)節(jié)是雙子葉植物。14.一種分離的核酸分子,包含選自下面的核苷酸序列a)包含在SEQIDNO:7、8或9中示出的序列的核苷酸序列;和b)包含在SEQIDNO:7、8或9中示出的序列的功能性片段的核苷酸序列,其中所述片段增強(qiáng)在植物細(xì)胞中的轉(zhuǎn)錄;15.—種表達(dá)構(gòu)建體,包含根據(jù)權(quán)利要求14所述的核酸分子。16.根據(jù)權(quán)利要求l5所述的表達(dá)構(gòu)建體,還包含有效連接的所關(guān)注的啟動(dòng)子。17.根據(jù)權(quán)利要求16所述的表達(dá)構(gòu)建體,其中所述的所關(guān)注的啟動(dòng)子選自含有在SEQIDNO:4、SEQIDNO:5、SEQIDNO:6、SEQIDNO:13和SEQIDNO:14中示出的序列的核苷酸序列。18.—種分離的核酸分子,包含選自下面的核苷酸序列a)包含在SEQIDNO:15中示出的序列的核苷酸序列;b)包含在SEQIDNO:15中示出的序列的至少25個(gè)連續(xù)核苷酸的核苷酸序列,其中所述核苷酸序列編碼信號(hào)肽;c)包含在SEQIDNO:15中示出的序列的功能性片段的核普酸序列,其中所述核苷酸序列編碼信號(hào)肽;和d)包含與在SEQIDNO:15中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列編碼信號(hào)肽。19.一種表達(dá)構(gòu)建體,包含有效連接至所關(guān)注的異源核苷酸序列的根據(jù)權(quán)利要求18所述的核酸分子。20.根據(jù)權(quán)利要求19所述的表達(dá)構(gòu)建體,還包含有效連接的所關(guān)注的啟動(dòng)子。21.根據(jù)權(quán)利要求20所述的表達(dá)構(gòu)建體,其中所述的所關(guān)注的啟動(dòng)子選自含有在SEQIDNO:4、SEQIDNO:5、SEQIDNO:6、SEQIDNO:13和SEQIDNO:14中示出的序列的核苷酸序列。22.根據(jù)權(quán)利要求19至21中任意一項(xiàng)所述的表達(dá)構(gòu)建體,其中所述的所關(guān)注的異源核苷酸序列編碼哺乳動(dòng)物多肽。23.根據(jù)權(quán)利要求22所述的表達(dá)構(gòu)建體,其中所述哺乳動(dòng)物多肽選自胰島素、生長激素、a-干擾素、P-干擾素、p-葡糖腦苷脂酶、P-葡萄糖醛酸酶、視網(wǎng)膜母細(xì)胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細(xì)胞生成素、粒細(xì)胞巨噬細(xì)胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細(xì)胞因子、受體、人疫苗、動(dòng)物疫苗、肽、血清白蛋白及其組合。24.—種用于在植物或植物細(xì)胞或結(jié)節(jié)中表達(dá)核苷酸序列的方法,所述方法包括將表達(dá)構(gòu)建體引入所述植物或植物細(xì)胞或結(jié)節(jié)中,所述表達(dá)構(gòu)建體包含有效連接至所關(guān)注的異源核苷酸序列的表達(dá)控制元件,其中所述表達(dá)控制元件包含選自下面的核苷酸序列a)包含在SEQIDNO:1、2、3、13或14中示出的序列的核苷酸序列;b)包含在SEQIDNO:1、2、3、13或14中示出的序列的至少50個(gè)連續(xù)核苷酸的核苷酸序列,其中所述核苷酸序列起始在植物細(xì)胞中的轉(zhuǎn)錄;c)包含在SEQIDNO:1、2、3、13或14中示出的序列的功能性片段的核苷酸序列,其中所述片段起始在植物細(xì)胞中的轉(zhuǎn)錄;d)包含與在SEQIDNO:1、2、3、13或14中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所迷核苷酸序列起始在植物細(xì)胞中的轉(zhuǎn)錄;和e)在嚴(yán)格條件下與a)的核苷酸序列的互補(bǔ)序列雜交的核苷酸序列,其中所述核苷酸序列起始在植物細(xì)胞中的轉(zhuǎn)錄。25.根據(jù)權(quán)利要求24所述的方法,其中所述植物或植物細(xì)胞或結(jié)節(jié)是單子葉植物。26.根據(jù)權(quán)利要求25所述的方法,其中所述單子葉植物來自選自下列屬的屬紫萍屬、蕪萍屬、/^//7^"屬、h/^o/〃a屬和浮萍屬。27.根據(jù)權(quán)利要求25所述的方法,其中所述單子葉植物是選自下面物種的成員浮萍、Ze/zwa邁/z7/"iz/a、稀脈萍和膨脹浮萍。28.根據(jù)權(quán)利要求24所述的方法,其中所述植物或植物細(xì)胞或結(jié)節(jié)是雙子葉植物。29.根據(jù)權(quán)利要求24所述的方法,其中所述表達(dá)構(gòu)建體還包含有效連接的信號(hào)肽的編碼序列,所述信號(hào)肽引導(dǎo)由所述所關(guān)注的異源核苷酸序列編碼的多肽分泌進(jìn)培養(yǎng)基中。30.根據(jù)權(quán)利要求29所述的方法,其中所述信號(hào)肽包含選自下面的氨基酸序列a)在SEQIDNO:16中示出的序列;b)與在SEQIDNO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導(dǎo)所述多肽分泌進(jìn)培養(yǎng)基中;和c)在SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導(dǎo)所述多肽分泌進(jìn)培養(yǎng)基中。31.根據(jù)權(quán)利要求30所迷的方法,其中所述的所述信號(hào)肽的編碼序列包含選自下面的核苷酸序列a)在SEQIDNO:15中示出的序列;b)與在SEQIDNO:15中示出的序列具有至少90%的序列同一性的序列;和c)在SEQIDNO:15中示出的序列的片段。32.根據(jù)權(quán)利要求24至31中任意一項(xiàng)所述的方法,其中所述的所關(guān)注的異源核普酸序列編碼哺乳動(dòng)物多肽。33.根據(jù)權(quán)利要求32所述的方法,其中所述哺乳動(dòng)物多肽選自胰島素、生長激素、a-干擾素、p-干擾素、p-葡糖腦苷脂酶、p-葡萄糖醛酸酶、視網(wǎng)膜母細(xì)胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細(xì)胞生成素、粒細(xì)胞巨噬細(xì)胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細(xì)胞因子、受體、人疫苗、動(dòng)物疫苗、肽、血清白蛋白及其組合。34.根據(jù)權(quán)利要求27所述的方法,其中所述所關(guān)注的異源核苷酸序列在所述所關(guān)注的異源核苷酸序列的編碼序列中包含浮萍優(yōu)選的密碼子。35.根據(jù)權(quán)利要求34所述的方法,其中所述所關(guān)注的異源核苷酸序列包含在70-100%之間的浮萍優(yōu)選的密碼子。36.—種用于在植物或植物細(xì)胞或結(jié)節(jié)中表達(dá)核苷酸序列的方法,所述方法包括將表達(dá)構(gòu)建體引入所述植物或植物細(xì)胞或結(jié)節(jié)中,所述表達(dá)構(gòu)建體包含有效連接至所關(guān)注的異源核苷酸序列的表達(dá)控制元件,其中所述表達(dá)控制元件包含選自下面的核苷酸序列a)包含在SEQIDN0:10、11或12中示出的序列的核苷酸序列;b)包含與在SEQIDNO:10、11或12中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列增強(qiáng)在植物細(xì)胞中的基因表達(dá);和c)在嚴(yán)格條件下與a)的核苷酸序列的互補(bǔ)序列雜交的核普酸序列,其中所述核苷酸序列增強(qiáng)在植物細(xì)胞中的基因表達(dá)。37.根據(jù)權(quán)利要求36所述的方法,其中所述植物或植物細(xì)胞或結(jié)節(jié)是單子葉植物。38.根據(jù)權(quán)利要求37所述的方法,其中所述單子葉植物來自選自下列屬的屬紫萍屬、蕪萍屬、^7/7e77a屬、Za/^o/〃a屬和浮萍屬。39.根據(jù)權(quán)利要求37所述的方法,其中所迷單子葉植物是選自下面物種的成員浮萍、Ze/MS邁/"/"i;/a、稀脈萍和膨脹浮萍。40.根據(jù)權(quán)利要求36所述的方法,其中所述植物或植物細(xì)胞或結(jié)節(jié)是雙子葉植物。41.根據(jù)權(quán)利要求.36所述的方法,其中所述表達(dá)構(gòu)建體還包含有效連接的信號(hào)肽的編碼序列,所述信號(hào)肽引導(dǎo)由所述所關(guān)注的異源核苷酸序列編碼的多肽分泌進(jìn)培養(yǎng)基中。42.根據(jù)權(quán)利要求41所述的方法,其中所述信號(hào)肽包含選自下面的氨基酸序列a)在SEQIDNO:16中示出的序列;b)與在SEQIDN0:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導(dǎo)所述多肽分泌進(jìn)培養(yǎng)基中;和c)在SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導(dǎo)所述多肽分泌進(jìn)培養(yǎng)基中。43.根據(jù)權(quán)利要求42所述的方法,其中所述的所述信號(hào)肽的編碼序列包含選自下面的核苷酸序列a)在SEQIDNO:15中示出的序列;b)與在SEQIDNO:15中示出的序列具有至少90%的序列同一性的序列;和c)在SEQIDN0:15中示出的序列的片段;44.根據(jù)權(quán)利要求36至43中任意一項(xiàng)所述的方法,其中所述的所關(guān)注的異源核苷酸序列編碼哺乳動(dòng)物多肽。45.根據(jù)權(quán)利要求44所述的方法,其中所述哺乳動(dòng)物多肽選自胰島素、生長激素、a-干擾素、P-干擾素、葡糖腦苷脂酶、P-葡萄糖醛酸酶、視網(wǎng)膜母細(xì)胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細(xì)胞生成素、粒細(xì)胞巨噬細(xì)胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細(xì)胞因子、受體、人疫苗、動(dòng)物疫苗、肽、血清白蛋白及其組合。46.根據(jù)權(quán)利要求39所述的方法,其中所述所關(guān)注的異源核苷酸序列在所述所關(guān)注的異源核苷酸序列的編碼序列中包含浮萍優(yōu)選的密碼子。47.根據(jù)權(quán)利要求46所述的方法,其中所述所關(guān)注的異源核苷酸序列包含在70-100%之間的浮萍優(yōu)選的密碼子。48.—種用于在植物或植物細(xì)胞或結(jié)節(jié)中表達(dá)和分泌異源多肽的方法,所述方法包括將表達(dá)構(gòu)建體引入植物或植物細(xì)胞或結(jié)節(jié)中,所述表達(dá)構(gòu)建體包含有效連接至核苷酸序列的表達(dá)控制元件,所述核苷酸序胞外分泌的信^肽的編碼序一列,其中所述信號(hào)多肽選自:;'、'a)在SEQIDNO:16中示出的序列;b)與在SEQIDNO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導(dǎo)所述多肽的細(xì)胞外分泌;和c)在SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導(dǎo)所述多肽的細(xì)胞外分泌。49.根據(jù)權(quán)利要求48所述的方法,其中所述的所述信號(hào)肽的編碼序列包含選自下面的核苷酸序列a)在SEQIDNO:15中示出的序列;b)與在SEQIDNO:15中示出的序列具有至少90%的序列同一性的序列;和c)在SEQIDNO:15中示出的序列的片段。50.根據(jù)權(quán)利要求48或49中任意一項(xiàng)所述的方法,其中所迷所關(guān)注的異源核苷酸序列編碼哺乳動(dòng)物多肽。51.根據(jù)權(quán)利要求50所述的方法,其中所述哺乳動(dòng)物多肽選自胰島素、生長激素、a-干擾素、p-干擾素、P-葡糖腦苷脂酶、P-葡萄糖醛酸酶、視網(wǎng)膜母細(xì)胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細(xì)胞生成素、粒細(xì)胞巨噬細(xì)胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細(xì)胞因子、受體、人疫苗、動(dòng)物疫苗、肽、血清白蛋白及其組合。52.根據(jù)權(quán)利要求48至51中任意一項(xiàng)所述的方法,其中所述表達(dá)控制元件選自含有在SEQIDN0:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:13和SEQIDNO:14中示出的序列的核普酸序列。全文摘要本發(fā)明提供了用于調(diào)節(jié)所關(guān)注的核苷酸序列在植物中的表達(dá)的組合物和方法。所述組合物包括新的核酸分子及其變體和片段,如分離自浮萍科(Lemnaceae)的泛素、r-組蛋白和幾丁質(zhì)酶(chinatase)基因的表達(dá)控制元件。另外提供了利用本文所公開的表達(dá)控制元件在植物中表達(dá)所關(guān)注的核苷酸序列的方法。還提供了新的浮萍科信號(hào)肽編碼序列和由其編碼的信號(hào)肽。在本發(fā)明的表達(dá)構(gòu)建體設(shè)計(jì)用于表達(dá)所關(guān)注的多肽之處,可以將該新的信號(hào)肽-編碼序列包含于本發(fā)明的表達(dá)構(gòu)建體中,以提供編碼的所關(guān)注的多肽的細(xì)胞外分泌。文檔編號(hào)A01H5/00GK101395177SQ200780007583公開日2009年3月25日申請(qǐng)日期2007年1月17日優(yōu)先權(quán)日2006年1月17日發(fā)明者C·G·皮勒,K·M·寇克斯,L·F·迪凱申請(qǐng)人:比洛克西治療公司