專利名稱:開裂基因和調(diào)節(jié)開裂作用的方法
背景技術(shù):
本發(fā)明涉及擬南芥(Aarabidopsis thaliana)中的一種突變,其防止成熟果實(shí)開裂(種莢散開)。分離的基因鑒別為SGT10166,其編碼一種發(fā)現(xiàn)與堿性螺旋—環(huán)—螺旋類轉(zhuǎn)錄因子相似的蛋白質(zhì)。此基因的表達(dá)模式和突變植物的表型顯示了其在長角果開裂中的作用。
本文所用的例證本發(fā)明背景或關(guān)于具體應(yīng)用所提供的附加細(xì)節(jié)分別見于所附參考文獻(xiàn)表。
果實(shí)是一種特異性植物器官,其與種子的成熟和擴(kuò)散有關(guān)。種子的擴(kuò)散是通過開裂過程發(fā)生的,例如種莢打開,從中脫出種子。開裂在農(nóng)作物如Brassica sp.中具有農(nóng)學(xué)重要性,其在收獲期間導(dǎo)致明顯的種子損失。
Arabidopsis的果實(shí)已知是長角果,其是由受精的雌蕊群發(fā)育而成的。雌蕊群由頂端柱頭,花柱和基部子房組成。子房由兩個(gè)心皮組成,形成一個(gè)稱為隔膜的融合組織。心皮壁已知是瓣,其與胎座框相連。胎座框是隔膜的外緣(Sessions,1999)。在受精后,雌蕊群趨于形成一個(gè)延長的長角果。種子的擴(kuò)散是在開裂過程發(fā)生的,在此過程中長角果打開脫落種子。Arabidopsis中的開裂要求開裂區(qū)沿著胎座框一瓣結(jié)合處發(fā)育,使瓣與胎座框分離,脫出種子(Gu等,1998)。
因此,需要研究參與通過開裂過程而進(jìn)行的種子擴(kuò)散的基因,由此防止農(nóng)作物開裂以在收獲期間使種子的損失減少到最小程度。
還需要鑒別參與開裂的植物基因,以產(chǎn)生啟動(dòng)子和/或增強(qiáng)子和/或內(nèi)含子序列,以用于制備轉(zhuǎn)基因植物,或干擾轉(zhuǎn)基因植物中的正常開裂以產(chǎn)生不裂植物。
發(fā)明概述本發(fā)明涉及一種參與開裂的基因,該基因的防止開裂的突變,及抑制這種基因產(chǎn)物活性的構(gòu)建體。本發(fā)明還涉及防止由于開裂過程(種莢脫粒)引起種子擴(kuò)散,導(dǎo)致在收獲農(nóng)作物期間種子明顯損失。根據(jù)本發(fā)明,我們?cè)跀M南芥中鑒別了一種基因,其參與開裂,而其突變可以防止成熟果實(shí)(長角果)開裂。此基因編碼一種蛋白質(zhì),發(fā)現(xiàn)這種蛋白質(zhì)與堿性螺旋-環(huán)-螺旋類的轉(zhuǎn)錄因子相似。
一方面,本發(fā)明涉及鑒別和定性擬南芥中的SGT10166基因。
第二方面,本發(fā)明涉及擬南芥和其它植物中防止成熟果實(shí)開裂的突變。
第三方面,本發(fā)明提供了包含SGT10166核酸的至少一部分的構(gòu)建體,以改變成熟果實(shí)的開裂。這種構(gòu)建體一般包含一個(gè)異源啟動(dòng)子,即一個(gè)與SGT10166基因非天然相關(guān)的,可操縱地連于SGT10166核酸的啟動(dòng)子。針對(duì)啟動(dòng)子,SGT10166可以是有義或反義方向的。本發(fā)明還提供了含有所述構(gòu)建體的載體,以用于轉(zhuǎn)化植物細(xì)胞。根據(jù)本發(fā)明可以轉(zhuǎn)化任何植物細(xì)胞。優(yōu)選的植物細(xì)胞是產(chǎn)生果實(shí)例如長角果的植物細(xì)胞,其產(chǎn)自能育的雌蕊群,在種莢中產(chǎn)生種子。
第五方面,本發(fā)明提供了產(chǎn)生具有改變的開裂作用的植物的方法。這種方法包括以下步驟用包含至少一部分SGT10166核酸的載體轉(zhuǎn)化植物細(xì)胞,從一或多個(gè)轉(zhuǎn)化的植物細(xì)胞中再生植物,并選擇出現(xiàn)開裂作用改變的至少一種植物。
第六方面,本發(fā)明提供了Arabidopsis SGT10166基因的一種啟動(dòng)子,增強(qiáng)子和/或內(nèi)含子。
第七方面,本發(fā)明提供了包含SGT10166基因的啟動(dòng)子和/或增強(qiáng)子和/或內(nèi)含子,和一種異源基因的基因構(gòu)建體。還提供了含有這些構(gòu)建體的載體。本發(fā)明還提供了具有至少一種含有這些構(gòu)建體的細(xì)胞的植物。
附圖簡述
圖1示出野生型雌蕊群的結(jié)構(gòu)。Sg-柱頭;St-花柱;O-子房;R-胎座框;V-瓣。
圖2示出在依次逐漸成熟的發(fā)育的長角果中(從左至右),SGT10166的GUS表達(dá)模式。
圖3示出SGT10166的不裂表型,其中(a)是成熟的野生型長角果,(b)是成熟的SGT10166長角果。
圖4(a)示出SGT10166的cDNA序列(SEQ ID NO1)和推導(dǎo)的氨基酸序列(SEQ ID NO2)。圖4(b)示出SGT10166與一些植物myc蛋白(SEQ ID NO3-6)的序列對(duì)比。
圖5示出在Ds插入位點(diǎn)兩側(cè)的基因組序列和足跡分析。(1)在DsG插入之前的野生型ALC基因座的區(qū)域(SEQ ID NO8)。(2)在DsG插入之后ALC基因座的序列變化。黑體的核苷酸表示在插入Ds期間加入的堿基(SEQ ID NO9和10)。(3)和(4)示出在切除Ds之后觀測(cè)到的9個(gè)堿基對(duì)和10個(gè)堿基對(duì)足跡(黑體)(SEQ ID NO11和12)。序列簡述SEQ ID NO1是SGT10166的cDNA的核苷酸序列。
SEQ ID NO2是SGT10166多肽的氨基酸序列。
SEQ ID NO3是SGT10166的基因組DNA的核苷酸序列。
SEQ ID NO4是rd22BPI多肽的氨基酸序列。
SEQ ID NO5是PG1多肽的氨基酸序列。
SEQ ID NO6是Lc多肽的氨基酸序列。
SEQ ID NO7是B-Peru多肽的氨基酸序列。
SEQ ID NO8是DsG插入之前的野生型ALC基因座區(qū)域。
SEQ ID NO9是Ds插入之后的ALC基因座區(qū)域。
SEQ ID NO10是Ds插入序列之后的ALC基因座區(qū)域。
SEQ ID NO11是在切除Ds之后回復(fù)體的ALC基因座區(qū)域。
SEQ ID NO12是在切除Ds之后的ALC基因座(alc10)區(qū)域。
SEQ ID NO13是從SEQ ID NO1中缺失的DNA片段,其編碼一個(gè)堿性肽結(jié)構(gòu)域,并由一個(gè)編碼SEQ ID NO14的酸性結(jié)構(gòu)域的序列置換。
SEQ ID NO15是顯性陰性DNA構(gòu)建體,是通過缺失SGT10166堿性結(jié)構(gòu)域編碼部分(SEQ ID NO13),和插入SEQ ID NO14而產(chǎn)生的。
SEQ ID NO16是由SEQ ID NO14編碼的蛋白質(zhì)。
發(fā)明詳述本發(fā)明涉及一種參與開裂的基因,及這種基因的防止成熟果實(shí)開裂(種莢脫粒)的突變。SGT10166基因編碼一種類似于堿性螺旋—環(huán)—螺旋類轉(zhuǎn)錄因子。這種基因的表達(dá)模式和突變植物的表型表明其在使長角果開裂中的作用。
根據(jù)本發(fā)明,提供了一種參與開裂的基因。這種基因是通過鑒別含有防止開裂的突變的Arabidopsis品系而揭示的。更特別地,這種分離的基因編碼一種蛋白質(zhì),這種蛋白質(zhì)與堿性螺旋—環(huán)—螺旋類轉(zhuǎn)錄因子類似。這種蛋白質(zhì)產(chǎn)物在雌蕊群中發(fā)現(xiàn),如實(shí)施例2的充分論述。編碼野生型基因的cDNA是基于突變基因揭示的,詳見實(shí)施例3所述。這一Arabidopsis基因可以用于篩選具有種莢的植物的基因組DNA,以鑒別同源基因,這提供了另外的核酸以用于抑制開裂。根據(jù)本發(fā)明鑒別的基因稱為SGT10166基因。
通常稱為種莢脫粒的開裂過程,是農(nóng)作物如油料種子油菜(Brassica napus)的農(nóng)學(xué)重要過程,這使種子損失導(dǎo)致產(chǎn)量減少。在不利的條件下這種損失可以高達(dá)50%(Coupe等,1994)。突變品系的SGT10166表現(xiàn)為不裂表型,從而長角果不打開,而且蛋白質(zhì)類似bHLH家族的蛋白質(zhì)。因此,SGT10166基因及同源基因可用于產(chǎn)生具有不裂表型的植物。不裂表型可以使用反義或顯性陰性方法達(dá)到。就反義方法而言(Gray等,1992),必需首先從所需的農(nóng)作物中通過與SGT10166基因的DNA同源性克隆相應(yīng)的基因。顯性陰性調(diào)節(jié)物可以通過缺失或突變蛋白質(zhì)的DNA結(jié)合結(jié)構(gòu)域而產(chǎn)生(Krylov等,1997)。通過螯合bHLH蛋白以形成失活的蛋白質(zhì)二聚體,這種HLH蛋白可以作為顯性陰性調(diào)節(jié)物。在這種方法中,可以直接使用這一Arabidopsis基因。
在轉(zhuǎn)基因植物中干擾基因功能的方法包括導(dǎo)入一個(gè)合成基因,以有義或反義抑制靶基因(Taylor和Jorgensen,1992)。這種抑制方法要求靶基因和抑制基因?qū)嵸|(zhì)上相似,核苷酸相同性要高于80%(Mol等,1994)。
如本文的進(jìn)一步詳述,SGT10166基因可以用于防止植物成熟果實(shí)的正常開裂。簡而言之,為此使用SGT10166基因的兩種方法是反義或有義抑制,以降低內(nèi)源SGT10166基因的表達(dá)水平。第三種方法是使用SGT10166的調(diào)節(jié)序列指導(dǎo)致死基因產(chǎn)物在果實(shí)組織中的特異性表達(dá)(遺傳消融)。定義本發(fā)明關(guān)于SGT10166引用了以下術(shù)語。
“改變的開裂作用”或“修飾的開裂表型”是指與親代植物相比,對(duì)植物長角果組織的結(jié)構(gòu)的物理修飾,從中可以獲得表型經(jīng)修飾的植物。肉眼可見的變化可以包括大小,形狀,果實(shí)器官的數(shù)目或位置等方面的變化。精微的變化可包括產(chǎn)生果實(shí)結(jié)構(gòu)的細(xì)胞類型或形狀變化。這樣修飾的果實(shí)表型在全部植物可以是一致的,而且典型發(fā)生在當(dāng)植物中的每種細(xì)胞均含有用包含至少一部分SGT10166核酸的載體轉(zhuǎn)化的細(xì)胞時(shí)。這種植物有時(shí)稱為轉(zhuǎn)基因植物。在特定植物中產(chǎn)生的表型依賴于設(shè)計(jì)用于產(chǎn)生其的載體。因此,載體可以設(shè)計(jì)為轉(zhuǎn)錄一種編碼至少一部分SGT10166蛋白的核酸。在這種情況中,這樣產(chǎn)生的SGT10166蛋白能基于細(xì)胞內(nèi)存在該蛋白質(zhì)而授與特殊表型。或者,可以構(gòu)建載體,這樣轉(zhuǎn)錄導(dǎo)致一種能與內(nèi)源SGT10166或同源基因的RNA轉(zhuǎn)錄物雜交的轉(zhuǎn)錄物形成。這種方法利用本領(lǐng)域熟知的反義方法,并調(diào)制內(nèi)源SGT10166基因的表型作用。對(duì)內(nèi)源SGT10166基因的這種調(diào)制,也可以通過使用SGT10166基因的有義鏈以有義抑制內(nèi)源SGT10166等位基因以及導(dǎo)入載體中的SGT10166基因而獲得?;谌鏟CT出版物WO90/12084所述在Petunia hybrida中觀測(cè)到的有義抑制,產(chǎn)生含有這種表型的植物也包括在本發(fā)明中。載體可以包含調(diào)節(jié)編碼干擾細(xì)胞生長的蛋白質(zhì)的基因轉(zhuǎn)錄的SGT10166啟動(dòng)子。在這種情況中,展示的改變的開裂作用可以是嚴(yán)重的萎縮或喪失果實(shí)結(jié)構(gòu)。
“多核苷酸擴(kuò)增”利用如聚合酶鏈反應(yīng)(PCR),連接擴(kuò)增(或連接酶鏈反應(yīng),LCR)及基于使用Q-β復(fù)制酶的擴(kuò)增方法。也可以使用鏈置換擴(kuò)增(SDA),嗜熱SDA,和基于核酸序列的擴(kuò)增(3SR或NASBA)。這些方法是本領(lǐng)域熟知的,并廣泛用于本領(lǐng)域當(dāng)中。見例如美國專利4683195和4683202,及Innis等(1990)(針對(duì)PCR);Wu和Wallace(1989)(針對(duì)LCR);美國專利5270184和5455166及Walker等(1992)(針對(duì)SDA);Spargo等(1996)(針對(duì)嗜熱SDA)及美國專利5409818,F(xiàn)ahy等(1991)和Compton(1991)(針對(duì)3SR和NASBA)所述。進(jìn)行PCR的試劑和硬件是可商購的。用于擴(kuò)增來自SGT10166區(qū)域的序列的引物,優(yōu)選互補(bǔ)于并特異性雜交該SGT10166區(qū)域或在靶區(qū)域兩側(cè)的區(qū)域中的序列。通過擴(kuò)增產(chǎn)生的SGT10166序列可以直接進(jìn)行測(cè)序?;蛘?,但非必需地,擴(kuò)增的序列可以在序列分析之前克隆。對(duì)酶促擴(kuò)增的基因組節(jié)段進(jìn)行直接克隆和序列分析的方法見Scharf等(1986)所述。
“分析物多核苷酸”和“分析物鏈”是指懷疑含有靶序列的單鏈或雙鏈的多核苷酸,其可以存在于各種類型的樣品中,包括生物學(xué)樣品中。
“結(jié)合配偶體”是指能高度特異性結(jié)合配體分子的分子,例如互補(bǔ)的多核苷酸鏈或酶及其抑制劑。通常地,特異性結(jié)合配偶體必需以足夠的親和性結(jié)合,以在分離的條件下固定分析物拷貝/互補(bǔ)鏈雙鏈體(在多核苷酸雜交的情況中)。在互補(bǔ)多核苷酸結(jié)合配偶體的情況中,此配偶體一般長度為至少大約15個(gè)堿基,并可以是至少40個(gè)堿基。本領(lǐng)域技術(shù)人員充分意識(shí)到也可以使用長度為少于15個(gè)堿基(例如8個(gè)堿基),15-40個(gè)堿基,及40個(gè)堿基以上的配偶體。多核苷酸可以由DNA,RNA或合成的核苷酸類似物組成。其它的結(jié)合配偶體可以使用例如所述雙雜交酵母篩選分析鑒別。
“生物學(xué)樣品”是指來自植物的懷疑含有分析物多核苷酸或多肽的組織或體液樣品,包括但非限于例如花粉,胚珠,細(xì)胞,器官,組織和體外細(xì)胞培養(yǎng)成分樣品。
“編碼”如果在其天然狀態(tài)或當(dāng)通過本領(lǐng)域熟知的方法操作時(shí),多核苷酸可以被轉(zhuǎn)錄和/或翻譯以產(chǎn)生多肽或其片段的mRNA時(shí),則稱此多核苷酸“編碼”多肽。反義鏈?zhǔn)沁@種核酸的互補(bǔ)序列,而且可以從中推導(dǎo)編碼序列。
“分離的”或“實(shí)質(zhì)上純化的”一種“分離的”或“實(shí)質(zhì)上純化的”核酸(例如RNA,DNA或混合的聚合物),是一種從自然伴隨天然植物序列或蛋白的其它細(xì)胞成分中實(shí)質(zhì)上分離出的核酸,例如從核糖體,聚合酶,其它一些植物基因組序列和蛋白中分離出。這個(gè)術(shù)語包含一種核酸序列或蛋白質(zhì),其已經(jīng)從其天然發(fā)生的環(huán)境中分離,并包括重組的或克隆的DNA分離物和化學(xué)合成的類似物或通過異源系統(tǒng)生物合成的類似物。
“SGT10166等位基因”是指SGT10166基因座的正常等位基因,以及分離自植物或根據(jù)本發(fā)明產(chǎn)生的發(fā)生變化的SGT10166等位基因。
“SGT10166基因座”,“SGT10166基因”,“SGT10166核酸”或“SGT10166多核苷酸”均指多核苷酸,所有這些均在SGT10166區(qū)域中,可以在正常組織中表達(dá)及參與開裂。SGT10166基因座包括編碼序列,間插序列和控制轉(zhuǎn)錄和/或翻譯的調(diào)節(jié)元件(例如啟動(dòng)子和增強(qiáng)子)。SGT10166基因座包括DNA序列的所有等位基因變體。
這些術(shù)語當(dāng)用于核酸時(shí),是指編碼植物SGT10166多肽,其片段,同源物或變體的核酸,所述變體包括例如蛋白質(zhì)融合體或缺失體。本發(fā)明的核酸將具有這樣的序列,其衍生自或者實(shí)質(zhì)上類似于天然的編碼SGT10166的基因,或與天然的編碼SGT10166的基因或其一部分具有較大同源性。術(shù)語SGT10166核酸有時(shí)統(tǒng)指SGT10166基因的有義和反義鏈。
SGT10166基因或核酸包括SGT10166基因的正常等位基因,包括對(duì)SGT10166多肽的氨基酸序列沒有作用的沉默等位基因,以及使SGT10166多肽的氨基酸序列發(fā)生變化但不影響其功能的等位基因。這些術(shù)語還包括具有負(fù)面影響SGT10166多肽功能的一或多個(gè)突變的等位基因。突變可以是SGT10166核酸序列中的變化,其使SGT10166多肽的氨基酸序列產(chǎn)生缺失變化,導(dǎo)致SGT10166功能的部分或完全喪失,或可以是核酸序列中的變化,導(dǎo)致喪失有效的SGT10166表達(dá)或產(chǎn)生異常形式的SGT10166多肽。
SGT10166核酸可以是如SEQ ID NO1所示,或可以是上述等位基因,或變體或衍生物,所述變體或衍生物通過所示序列的一或多個(gè)核苷酸的添加,插入,缺失和取代中的一或多種變化而與所示序列不同。核苷酸序列的變化可以導(dǎo)致或不導(dǎo)致在蛋白質(zhì)水平氨基酸變化,如通過遺傳密碼所測(cè)定的。
因此,本發(fā)明的核酸可以包括一種序列,其不同于SEQ ID NO1所示序列,但也編碼具有與SEQ ID NO2所示相同氨基酸序列的多肽。即本發(fā)明的核酸包括由于遺傳密碼簡并并產(chǎn)生的序列。另一方面,編碼的多肽可以包含一種氨基酸序列,其有一或多個(gè)氨基酸殘基與SEQ ID NO2所示氨基酸序列不同。本發(fā)明還提供了一種編碼多肽的核酸,所述多肽是SEQ ID NO2所示氨基酸序列的氨基酸序列變體,衍生物或等位物。
SGT10166基因也指(a)任何DNA序列,其(i)在高嚴(yán)格雜交條件下(Ausubel等,1992)與編碼SEQ ID NO2所示氨基酸序列的DNA序列的互補(bǔ)序列雜交,和(ii)編碼一種與SGT10166功能相等的基因產(chǎn)物,或(b)任何DNA序列,其(i)在較低嚴(yán)格雜交條件下如中等嚴(yán)格條件下(Ausubel等,1992)與編碼SEQ ID NO2所示氨基酸序列的DNA序列的互補(bǔ)序列雜交,和(ii)編碼一種與SGT10166功能相等的基因產(chǎn)物。本發(fā)明還包括與所述序列互補(bǔ)的核酸分子。
本領(lǐng)域技術(shù)人員易于意識(shí)到本發(fā)明的多核苷酸組合物包括有義鏈和反義鏈的RNA,cDNA,基因組DNA,合成形式,和混合的聚合物,并可以是化學(xué)或生物學(xué)修飾的,或可以含有非天然的或衍生的核苷酸堿基。這種修飾例如包括標(biāo)記,甲基化,用類似物取代一或多個(gè)天然發(fā)生的核苷酸,核苷酸內(nèi)修飾如非荷電的鍵(例如甲基膦酸酯,磷酸三酯,亞磷酰胺,氨基甲酸酯等),荷電鍵(例如硫代磷酸酯,二硫代磷酸酯等),懸垂組分(例如多肽),嵌入劑(例如吖啶,補(bǔ)骨酯素等),鰲合劑,烷化劑,和修飾的鍵(例如α端基異構(gòu)核酸等)。還包括模擬多肽的通過氫鍵和其它化學(xué)相互作用結(jié)合指定序列的能力的合成分子。本領(lǐng)域已知這種分子,包括例如在分子骨架中用肽鍵取代磷酸鍵的那些分子。
本發(fā)明提供了包含所有或部分SGT10166區(qū)域的重組的核酸。此重組的構(gòu)建體能在宿主細(xì)胞中自動(dòng)復(fù)制?;蛘?,此重組構(gòu)建體可以整合入宿主細(xì)胞的染色體DNA中。這種重組的多核苷酸包含一種基因組的,cDNA的,半合成的,或合成的多核苷酸,通過其起源或操作,其1)與在天然狀態(tài)相關(guān)的所有或部分多核苷酸不相關(guān);2)與除了天然連接的多核苷酸之外的多核苷酸連接;或3)在天然狀態(tài)不發(fā)生。當(dāng)本發(fā)明的核酸包括RNA時(shí),對(duì)所示序列的引述應(yīng)被理解為引述RNA等價(jià)物,用U取代T。
因此,本發(fā)明提供了包含其它非天然發(fā)生的序列的重組核酸。盡管可以應(yīng)用野生型序列,但也可以對(duì)其進(jìn)行改變,例如通過缺失,取代或插入進(jìn)行改變??梢院Y選各種類型的cDNA或基因組文庫,作為本發(fā)明核酸的天然原料,或者這種核酸可以通過擴(kuò)增基因組DNA或其它天然原料中的序列而提供,例如通過PCR擴(kuò)增。cDNA文庫的選擇通常是富含所需蛋白質(zhì)的mRNA的組織原料。噬菌體文庫通常是優(yōu)選的,但也可以使用其它類型的文庫。將文庫的克隆涂布于平板上,移至底物中以進(jìn)行篩選,變性并探查所需序列的存在與否。
本發(fā)明中使用的DNA序列通常包含至少5個(gè)密碼子(15個(gè)核苷酸),更通常地包含大約7-15個(gè)密碼子,最優(yōu)選地包含大約35個(gè)密碼子。也可以存在一或多個(gè)內(nèi)含子。這個(gè)核苷酸數(shù)目通常是成功的探針?biāo)璧淖疃涕L度,所述探針特異性雜交編碼SGT10166的序列。在本文中,少如8個(gè)核苷酸的寡聚物,更通常地8-17個(gè)核苷酸的寡聚物,可以用作探針,尤其在使用芯片方法時(shí)。
關(guān)于核酸操作方法通常見于例如Sambrook等(1989)或Ausubel等(1992)所述。用于這種方法中的試劑如限制酶等,是本領(lǐng)域熟知的,并可商購自如New England BioLabs,Boehringer Mannheim,Amersham,Promega,U.S.Biochemicals,New England和一些其它來源。用于產(chǎn)生本發(fā)明融合蛋白的重組核酸序列可以衍生自天然或合成序列。一些天然基因序列可使用適當(dāng)探針得自各種cDNA或得自基因組文庫。見GeneBank,國立健康研究所。
本文所用的SGT10166基因座或區(qū)域或等位基因的“一部分”是指具有最低至少大約8個(gè)核苷酸,或優(yōu)選大約15個(gè)核苷酸,或更優(yōu)選至少大約25個(gè)核苷酸,并可以具有最低至少大約40個(gè)核苷酸。這一定義包括8-40個(gè)核苷酸以及40個(gè)以上核苷酸范圍內(nèi)的所有規(guī)格。因此,這一定義包括8,12,15,20,25,40,60,80,100,200,300,400,500個(gè)核苷酸的核酸,或具有這些數(shù)值范圍內(nèi)任何數(shù)目核苷酸的核酸(例如9,10,11,16,23,30,38,50,72,121等個(gè)核苷酸),或具有500個(gè)以上核苷酸的核酸。本發(fā)明包括所有新的核酸,其具有至少8個(gè)衍生自SEQ ID NO1,其互補(bǔ)序列或功能等價(jià)物核酸序列的核苷酸。本發(fā)明不包括現(xiàn)有技術(shù)領(lǐng)域存在的核酸。即本發(fā)明包括具有至少8個(gè)衍生自SEQ ID NO1的核苷酸的所有核酸,條件是不包括現(xiàn)有技術(shù)領(lǐng)域存在的分離的核酸。
“SGT10166蛋白”或“SGT10166多肽”是指由SGT10166基因座或其變體或片段編碼的一種蛋白質(zhì)或多肽。術(shù)語“多肽”是指一種氨基酸聚合物及其等價(jià)物,不是指特殊長度的產(chǎn)物;因此,肽,寡肽和蛋白質(zhì)均包括在多肽所限定的范圍內(nèi)。這個(gè)術(shù)語也不是指或排除修飾的多肽,例如經(jīng)過糖基化,乙?;姿峄刃揎?。包括在限定范圍內(nèi)的是例如含有一或多個(gè)氨基酸類似物的多肽(包括例如非天然的氨基酸等),具有取代鍵的多肽以及本領(lǐng)域已知的其它修飾,包括天然和非天然發(fā)生的。通常地,這種多肽至少大約50%與天然的SGT10166序列同源,優(yōu)選具有大約90%以上,更優(yōu)選大約95%以上同源性。還包括由在高或低嚴(yán)格雜交條件下與編碼SGT10166的核酸雜交的DNA編碼的蛋白質(zhì),及密切相關(guān)的多肽或通過SGT10166蛋白的抗血清獲得的蛋白質(zhì)。
SGT10166多肽可以是如SEQ ID NO2所示,其可以是分離的和/或純化形式,沒有或?qū)嵸|(zhì)上沒有天然與之伴隨的物質(zhì)。如果多肽是通過在原核細(xì)胞中表達(dá)產(chǎn)生的或合成產(chǎn)生的,多肽可以不進(jìn)行翻譯后加工,如糖基化。或者,本發(fā)明還涉及是SGT10166多肽的序列變體,等位物或衍生物的多肽。這種多肽通過添加,取代,缺失或插入一或多個(gè)氨基酸,可以具有不同于SEQ ID NO2所示的氨基酸序列。在一個(gè)實(shí)施方案中,這些變體多肽的功能與SGT10166相似,這樣可以將它們用于恢復(fù)能育性,或用于置換同源基因。在另一個(gè)實(shí)施方案中,這些變體肽不保留SGT10166功能,這樣可以將它們用作顯性陰性突變體。
取代變體典型地在蛋白質(zhì)內(nèi)的一或多個(gè)位點(diǎn)將一個(gè)氨基酸用另一個(gè)氨基酸置換,并可以設(shè)計(jì)為調(diào)節(jié)多肽的一或多種性質(zhì),如抗蛋白酶解的穩(wěn)定性,但不喪失其它功能或性質(zhì)。氨基酸取代可以基于包含的殘基的極性,電荷,溶解性,親水性,疏水性,和/或兩親性進(jìn)行。優(yōu)選的取代是保守取代,即將一個(gè)氨基酸用相似形狀和電荷的氨基酸置換。保守取代是本領(lǐng)域所熟知的,并典型地包括下述組內(nèi)的取代甘氨酸,丙氨酸;纈氨酸,異亮氨酸,亮氨酸;天冬氨酸,谷氨酸;天冬酰胺,谷氨酰胺;絲氨酸,蘇氨酸;賴氨酸,精氨酸;及酪氨酸,苯丙氨酸。
蛋白質(zhì)結(jié)構(gòu)中的一些氨基酸可以用其它氨基酸取代,而不喪失與結(jié)構(gòu)的相互結(jié)合能力,所述結(jié)構(gòu)例如抗體的抗原結(jié)合區(qū)或底物分子上的結(jié)合位點(diǎn),或與SGT10166多肽相互作用的蛋白質(zhì)上的結(jié)合位點(diǎn)。由于蛋白質(zhì)的相互作用能力和性質(zhì)確定蛋白質(zhì)的生物功能活性,所以一些氨基酸取代可以在蛋白質(zhì)序列及其DNA編碼序列中進(jìn)行,而且仍然獲得具有相似性質(zhì)的蛋白質(zhì)。在進(jìn)行這種變化中,可以考慮氨基酸的親水指數(shù)。本領(lǐng)域已知疏水性氨基酸指數(shù)在授與蛋白質(zhì)的相互作用生物功能中的重要性(Kyte和Doolittle,1982)?;蛘?,類似的氨基酸取代可以基于親水性而有效進(jìn)行。本領(lǐng)域已知親水性在授與蛋白質(zhì)相互作用生物功能方面的重要性(美國專利4554101)。疏水指數(shù)或親水性在設(shè)計(jì)多肽中的應(yīng)用見于美國專利5691198的進(jìn)一步論述。
用于同源性比較的多肽序列的長度一般為至少大約16個(gè)氨基酸,通常為大約20個(gè)殘基,更通常為大約24個(gè)殘基,典型地至少大約28個(gè)殘基,優(yōu)選大約35個(gè)以上殘基。
“可操縱地連接”是指一種并列關(guān)系,其中所述成分以其固有方式起作用。例如,啟動(dòng)子影響編碼序列的轉(zhuǎn)錄或表達(dá),則稱啟動(dòng)子可操縱地連于編碼序列。
“探針”SGT10166等位基因的探針可以衍生自SGT10166區(qū)域,其cDNA,功能等價(jià)物序列或其互補(bǔ)序列的序列。探針可以是任何適當(dāng)長度的,其跨越SGT10166區(qū)域的全部或部分,并與此區(qū)域特異性雜交。如果靶序列含有與探針相同的序列,探針可以是短的,例如在大約8-30個(gè)堿基對(duì)范圍內(nèi),這樣雜交體在嚴(yán)格雜交條件下相對(duì)穩(wěn)定。如果預(yù)期與探針有一些錯(cuò)配,即如果懷疑探針是否與變體區(qū)域雜交,可以應(yīng)用較長的探針,其與靶序列以必需的特異性雜交。
探針包括一種附著于標(biāo)記或報(bào)道分子的分離的多核苷酸,并可通過標(biāo)準(zhǔn)方法用于分離具有序列相似性的其它多核苷酸序列。關(guān)于制備和標(biāo)記探針的方法見例如Sambrook等(1989)或Ausubel等(1992)所述。其它相似的多核苷酸可以使用同源的多核苷酸選擇?;蛘?,編碼這些或相似多肽的多核苷酸可以是合成的,或通過使用遺傳密碼的豐余性選擇的??梢赃M(jìn)行各種密碼子取代,例如通過沉默改變(從而產(chǎn)生各種限制位點(diǎn))或使特定系統(tǒng)的表達(dá)最佳化??梢赃M(jìn)行突變以修飾多肽的性質(zhì),或許可以改變多肽的降解或轉(zhuǎn)換率。
包含本發(fā)明的合成寡核苷酸或其它多核苷酸的探針,可以衍生自天然發(fā)生的或重組的單鏈或雙鏈多核苷酸,或可以是化學(xué)合成的。探針還可以通過切口平移,Klenow補(bǔ)平反應(yīng)或本領(lǐng)域已知的其它方法而標(biāo)記。
優(yōu)選作為探針的是多核苷酸序列的一部分,所述序列具有來自編碼SGT10166的多核苷酸序列的至少大約8個(gè)核苷酸,通常至少大約15個(gè)核苷酸,及少于大約9kb,通常少于大約1.0kb。這一定義因此包括8個(gè)核苷酸至9000個(gè)核苷酸大小的探針。因此,這一定義包括具有8,12,15,20,25,40,60,80,100,200,300,400或500個(gè)核苷酸的探針,或具有在這些數(shù)值范圍內(nèi)任何數(shù)目核苷酸(例如9,10,11,16,23,30,38,50,72,121等個(gè)核苷酸)的探針,或具有500個(gè)以上核苷酸的探針。探針還可以用于測(cè)定編碼SGT10166的mRNA是否存在于細(xì)胞或組織中。本發(fā)明包括所有新探針,所述探針具有衍生自SEQ ID NO1或SEQ ID NO3,其互補(bǔ)序列或功能等價(jià)物核酸序列的至少8個(gè)核苷酸。本發(fā)明不包括現(xiàn)有技術(shù)領(lǐng)域中存在的探針。即本發(fā)明包括具有至少8個(gè)衍生自SEQ IDNO1的核苷酸的所有探針,條件是不包括現(xiàn)有技術(shù)領(lǐng)域存在的探針。
類似考慮及核苷酸長度也適用于用于擴(kuò)增所有或部分SGT10166基因的引物。因此,對(duì)引物所作的限定包括8,12,15,20,25,40,60,80,100,200,300,400,500個(gè)核苷酸的引物,或具有這些數(shù)值范圍內(nèi)任何數(shù)目核苷酸的引物(例如9,10,11,16,23,30,38,50,72,121等個(gè)核苷酸),或具有500個(gè)以上,或500-9000之間任何數(shù)目的核苷酸的引物。引物還可以用于確定編碼SGT10166的mRNA是否存在于細(xì)胞或組織中。本發(fā)明包括所有具有衍生自SGT10166基因座的至少8個(gè)核苷酸的新引物,用于擴(kuò)增SGT10166基因,其互補(bǔ)序列或功能等價(jià)物核酸序列。本發(fā)明不包括現(xiàn)有技術(shù)領(lǐng)域存在的引物。即本發(fā)明包括具有至少8個(gè)核苷酸的所有引物,條件是不包括現(xiàn)有技術(shù)領(lǐng)域存在的引物。
“蛋白質(zhì)純化”是指從其它生物學(xué)材料中分離SGT10166多肽的各種方法,如從用編碼SGT10166的重組核酸轉(zhuǎn)化的細(xì)胞中分離,這些方法是本領(lǐng)域所熟知的。例如,這種多肽可以采用通過常規(guī)方法對(duì)抗SGT10166而制備的抗體通過免疫親和層析純化。本領(lǐng)域熟知各種純化蛋白質(zhì)的方法,而且包括Deutscher(1990)和Scopes(1982)所述的那些方法。
術(shù)語“分離的”,“實(shí)質(zhì)上純化的”和“實(shí)質(zhì)上均質(zhì)的”是闡述一種蛋白質(zhì)或多肽,其已經(jīng)從在天然狀態(tài)中與之伴隨的成分中分離出。當(dāng)樣品的至少大約60%-75%呈現(xiàn)單一的多肽序列時(shí),稱此單體蛋白質(zhì)是實(shí)質(zhì)上純化的。實(shí)質(zhì)上純化的蛋白質(zhì)典型地包含大約60-90%w/w純化的蛋白質(zhì)樣品,通常大約95%,優(yōu)選是大約99%以上純化的。蛋白質(zhì)的純度或均質(zhì)性可以用本領(lǐng)域熟知的許多方式表示,如對(duì)蛋白質(zhì)樣品進(jìn)行聚丙烯酰胺凝膠電泳,隨后基于將凝膠染色觀測(cè)單一的多肽條帶。針對(duì)一些特定目的,通過使用HPLC或本領(lǐng)域熟知的用于純化的其它方法可提供較高的分辨率。
當(dāng)將SGT10166蛋白從在天然狀態(tài)中與之伴隨的天然沾染物中分離出時(shí),SGT10166蛋白實(shí)質(zhì)上沒有天然伴隨的成分。因此,化學(xué)合成的或在不同于其天然起源的細(xì)胞的細(xì)胞系統(tǒng)中合成的多肽,實(shí)質(zhì)上沒有天然伴隨的成分。使用本領(lǐng)域熟知的蛋白質(zhì)純化方法分離,也可以使蛋白質(zhì)實(shí)質(zhì)上沒有天然伴隨的成分。
如本文所用,即使是在同源的細(xì)胞中表達(dá)的,作為一種分離的和操作的遺傳序列的表達(dá)產(chǎn)物而產(chǎn)生的多肽,是一種“分離的多肽”。合成產(chǎn)生的形式或異源細(xì)胞表達(dá)的分子本來就是分離的分子。
“重組的核酸”是指一種核酸,其不是天然發(fā)生的,或其是通過人工組合兩種另外分離的序列節(jié)段而產(chǎn)生的。這種人工組合通常通過化學(xué)合成方法,或通過人工操作分離的核酸節(jié)段而完成,例如通過遺傳過程技術(shù)進(jìn)行。這種方法通常是將所需功能的核酸節(jié)段結(jié)合在一起,以產(chǎn)生所需的功能組合。或者,是將一個(gè)密碼子用一個(gè)相同編碼的豐余密碼子,或一個(gè)保守的氨基酸置換,同時(shí)典型地導(dǎo)入或除去一個(gè)序列識(shí)別位點(diǎn)。
“調(diào)節(jié)序列”是指通常距離基因座的100kb編碼區(qū)之內(nèi)的那些序列,但它們也可以是更遠(yuǎn)離編碼區(qū)的序列,或者它們可以位于基因的內(nèi)含子內(nèi),影響基因的表達(dá)(包括基因的轉(zhuǎn)錄,和翻譯,剪接,穩(wěn)定性或類似信使RNA的功能)。
“實(shí)質(zhì)上的同源性,相似性或相同性”如果當(dāng)與其它的核酸(或其互補(bǔ)鏈)進(jìn)行最佳排列時(shí)(具有適當(dāng)?shù)暮塑账岵迦牖蛉笔?,核苷酸序列中有至少60%的核苷酸堿基,通常至少大約70%,更通常大約80%,優(yōu)選至少大約90%,更優(yōu)選大約95-98%的核苷酸堿基是相同的,則稱一種核酸或其片段與另一種核酸“實(shí)質(zhì)上同源”(或“實(shí)質(zhì)上相似”)。
相同性意味著兩個(gè)多肽或兩個(gè)多核苷酸序列之間的相關(guān)程度,這是通過這兩個(gè)序列匹配的相同性測(cè)定的。相同性可以容易地計(jì)算的。有許多測(cè)定兩個(gè)多核苷酸或多肽序列之間相同性的方法,術(shù)語“相同性”是本領(lǐng)域技術(shù)人員熟知的(計(jì)算分子生物學(xué),Lesk AM編輯,牛津大學(xué)出版社,紐約,1988;BiocomputingInformatics andGenome Projects,Smith DW編輯,學(xué)術(shù)出版社,紐約,1993;ComputerAnalysis of Sequence Data,Part I,Griffin AM和Griffin HG編輯,Humana出版社,新澤西,1994;分子生物學(xué)中序列分析,Heinje G,學(xué)術(shù)出版社,1987;序列分析引物,Gribskov M和Devereux J編輯,M Stockton出版社,紐約,1991)。通常用于測(cè)定兩個(gè)序列之間相同性的方法包括但非限于Guide to Huge Computers,Martin J.Bishop.編輯,學(xué)術(shù)出版社,San Diego,1994,和Carillo和Lipman(1988)所述。測(cè)定相同性的優(yōu)選方法是設(shè)計(jì)為在測(cè)試的兩個(gè)序列之間提供最大程度的對(duì)比。這種方法編成了計(jì)算機(jī)程序。測(cè)定兩個(gè)序列之間相同性的優(yōu)選計(jì)算機(jī)程序包括但非限于GCG程序包(Devereux等(1984),BLASTP,BLASTN,F(xiàn)ASTA(Altschul等(1990);Altschul等(1997))。
或者,當(dāng)一種核酸或其片段在選擇的雜交條件下與另一種核酸(或其互補(bǔ)鏈),鏈或其互補(bǔ)序列雜交時(shí),存在實(shí)質(zhì)上的同源性(或相似性或相同性)。當(dāng)發(fā)生實(shí)質(zhì)上比缺失全部特異性更具選擇性的雜交時(shí),存在雜交選擇性。典型地,當(dāng)大約14核苷酸的一段序列上有至少大約55%同源性,優(yōu)選至少大約65%,更優(yōu)選大約75%,最優(yōu)選大約90%同源性時(shí),選擇性雜交發(fā)生。見Kanehisa(1984)所述。進(jìn)行同源對(duì)比的序列長度可以是更長的一段序列,而且在一些實(shí)施方案中通常是至少大約9個(gè)核苷酸,經(jīng)常是至少大約20個(gè)核苷酸,更通常是至少大約24個(gè)核苷酸,典型地是至少大約28個(gè)核苷酸,更特別地是至少大約32個(gè)核苷酸,優(yōu)選是至少大約36個(gè)或更多個(gè)核苷酸。
除了堿基組成,互補(bǔ)鏈的長度,和雜交核酸之間的核苷酸堿基錯(cuò)配數(shù)目之外,核酸雜交將受這樣的條件影響,如鹽濃度,溫度,或有機(jī)溶劑,這些將易于為本領(lǐng)域技術(shù)人員所意識(shí)到。嚴(yán)格的溫度條件一般包括30℃以上,典型地37℃以上,優(yōu)選45℃以上。嚴(yán)格鹽濃度一般為1000mM以下,典型地為500mM以下,優(yōu)選200mM以下。然而,參數(shù)的組合比測(cè)定任何單一參數(shù)更重要。嚴(yán)格條件依賴于核酸的長度和核酸的堿基組成,并可以通過本領(lǐng)域熟知的方法測(cè)定。見例如Wetmur和Davidson(1968)。
探針序列在一定條件下也可以特異性雜交雙螺旋DNA,形成三螺旋的DNA或其它更高狀態(tài)的DNA復(fù)合物。本領(lǐng)域熟知這種探針的制備和適當(dāng)?shù)碾s交條件。
術(shù)語“實(shí)質(zhì)上的同源性”或“實(shí)質(zhì)上的相同性”,當(dāng)指多肽時(shí),是表示所述多肽或蛋白質(zhì)與完整的天然發(fā)生的蛋白質(zhì)或其一部分呈現(xiàn)至少大約30%相同性,通常為至少大約70%相同性,更通常為至少大約80%相同性,優(yōu)選至少大約90%相同性,更優(yōu)選至少大約95相同性。
就多肽而言,同源性是使用序列分析軟件測(cè)定的。見例如遺傳學(xué)計(jì)算機(jī)小組的序列分析軟件包,Wisconsin大學(xué)生物技術(shù)中心,大學(xué)道910號(hào),Madison,Wisconsin 53705,以及上述關(guān)于核酸同源性的軟件。蛋白質(zhì)分析軟件使用測(cè)定由各種取代,缺失及其它修飾指定的同源性對(duì)比相似序列。保守取代典型包括以下各組內(nèi)的取代甘氨酸,丙氨酸;纈氨酸,異亮氨酸,亮氨酸;天冬氨酸,谷氨酸;天冬酰胺,谷氨酰胺;絲氨酸,蘇氨酸;賴氨酸,精氨酸;苯丙氨酸,酪氨酸。
“實(shí)質(zhì)上相似的功能”是指與野生型SGT10166核酸或野生型SGT10166多肽相比,一種修飾的核酸或修飾的蛋白質(zhì)的功能。修飾的多肽實(shí)質(zhì)上同源于野生型SGT10166多肽,并具有實(shí)質(zhì)上相同的功能。修飾的多肽可以具有變化的氨基酸序列和/或可以含有修飾的氨基酸。除了功能相似之外,修飾的多肽可以具有其它有益的性質(zhì),如半衰期較長。修飾的多肽的功能(活性)相似性可以是實(shí)質(zhì)上與野生型SGT10166多肽的活性相同。或者,修飾的多肽的功能(活性)相似性可以是高于野生型SGT10166多肽活性。修飾的多肽是用常規(guī)方法合成的,或是由修飾的核酸編碼及用常規(guī)方法產(chǎn)生的。修飾的核酸是通過常規(guī)方法制備的。功能與野生型SGT10166基因功能實(shí)質(zhì)上相似的核酸產(chǎn)生上述修飾的蛋白質(zhì)。
多肽的“片段”,“一部分”,或“節(jié)段”是一段氨基酸殘基序列,具有至少大約5-7個(gè)連續(xù)氨基酸,通常至少大約7-9個(gè)連續(xù)氨基酸,典型地具有至少大約9-13個(gè)連續(xù)氨基酸,最優(yōu)選地具有至少大約20-30或更多個(gè)連續(xù)氨基酸。
本發(fā)明的多肽如果是可溶的,可以偶聯(lián)于固相支持物,例如硝基纖維素,尼龍,層析柱包裝物(例如瓊脂糖珠),磁珠,玻璃棉,塑料,金屬,高分子凝膠,細(xì)胞或其它底物。這種支持物可以采取例如珠,孔,dipsticks或膜形式。
“靶區(qū)域”是指進(jìn)行擴(kuò)增和/或檢測(cè)的核酸的區(qū)域。術(shù)語“靶序列”是指一種序列,從中探針,引物或反義物在所需條件下將形成一種穩(wěn)定的雜合體。
除非特別說明,本發(fā)明應(yīng)用的是常規(guī)的化學(xué),分子生物學(xué),微生物學(xué),重組DNA和遺傳學(xué)方法。見例如Maniatis等(1982);Sambrook等(1989);Ausubel等(1992);Glover(1985);Anand(1992);Guthrie和Fink(1991);Weissbach和Weissbach(1986)Zaitlin等(1985)和Gelvin等(1990)。使用方法制備重組或化學(xué)合成的核酸;載體,轉(zhuǎn)化,宿主細(xì)胞通過在適當(dāng)?shù)乃拗骷?xì)胞中復(fù)制可以產(chǎn)生大量的本發(fā)明的多核苷酸??梢詫⒕幋a所需片段的天然或合成的多核苷酸片段摻入重組多核苷酸構(gòu)建體中,通常是DNA構(gòu)建體,所述構(gòu)建體能摻入原核或真核細(xì)胞中并在其中復(fù)制。通常此多核苷酸構(gòu)建體適于在單細(xì)胞宿主中復(fù)制,如酵母或細(xì)菌,但也可以導(dǎo)入(在基因組內(nèi)整合或不整合)培養(yǎng)的哺乳動(dòng)物或植物或其它真核細(xì)胞系中。通過本發(fā)明方法產(chǎn)生的核酸的純化方法見例如Sambrook等(1989)或Ausubel等(1992)所述。
本發(fā)明的多核苷酸也可以是通過化學(xué)合成產(chǎn)生的,例如通過Beaucage和Caruthers(1981)所述的亞磷酰胺方法,或Matteucci和Caruthers(1981)所述的三酯方法,也可以在商購的自動(dòng)寡核苷酸合成儀上進(jìn)行。雙鏈的片段可以得自化學(xué)合成的單鏈產(chǎn)物,通過合成其互補(bǔ)鏈并在適當(dāng)條件下將此鏈一起退火獲得,或通過使用DNA聚合酶用適當(dāng)?shù)囊镄蛄刑砑踊パa(bǔ)鏈獲得。
所制備的導(dǎo)入原核或真核宿主的多核苷酸構(gòu)建體,可以包含一個(gè)由宿主識(shí)別的復(fù)制系統(tǒng),包括編碼所需多肽的多核苷酸片段,并優(yōu)選還包括可操縱地連于多肽編碼節(jié)段的轉(zhuǎn)錄和翻譯起始調(diào)節(jié)序列。表達(dá)載體可以包括例如復(fù)制或自動(dòng)復(fù)制序列(ARS)的起點(diǎn),和表達(dá)控制序列,啟動(dòng)子,增強(qiáng)子和必需的加工信息位點(diǎn),如核糖體結(jié)合位點(diǎn),RNA剪接位點(diǎn),聚腺苷酸化位點(diǎn),轉(zhuǎn)錄終止序列,和mRNA穩(wěn)定序列。這種載體可以通過本領(lǐng)域熟知的標(biāo)準(zhǔn)重組方法制備,并例如Sambrook等(1989)或Ausubel等(1992)所述。
選擇適當(dāng)?shù)膯?dòng)子和其它必需載體序列以在宿主中起作用,而且如果合適可以包括那些與SGT10166基因天然伴隨的??墒褂玫募?xì)胞系和表達(dá)載體組合例如Sambrook等(1989)或Ausubel等(1992)所述;也見于例如Metzger等(1988)所述。本領(lǐng)域已知許多有效的載體,并可以得自如Stratagene,New England Biolabs,PromegaBiotech等公司。啟動(dòng)子如trp,lac和噬菌體啟動(dòng)子,tRNA啟動(dòng)子和糖酵解酶啟動(dòng)子可以用于原核宿主。有效的酵母啟動(dòng)子包括金屬硫蛋白,3-磷酸甘油酸激酶,或其它糖酵解酶如烯醇化酶或甘油醛-3-磷酸脫氫酶,參與麥芽糖和半乳糖利用的酶等的啟動(dòng)子區(qū)域。適用于酵母表達(dá)中的載體和啟動(dòng)子另外見于Hitzeman等,EP73675A。適當(dāng)?shù)姆翘烊坏牟溉閯?dòng)物啟動(dòng)子可包括SV40的早期和晚期啟動(dòng)子(Fiers等,1978)或衍生自Molony鼠白血病病毒,小鼠腫瘤病毒,禽肉瘤病毒,腺病毒II,牛乳頭瘤病毒或多瘤病毒的啟動(dòng)子。昆蟲啟動(dòng)子可以衍生自桿狀病毒。另外,所述構(gòu)建體可以與可擴(kuò)增的基因(例如DHFR)結(jié)合,以便可以產(chǎn)生基因的多個(gè)拷貝。關(guān)于適當(dāng)?shù)脑鰪?qiáng)子和其它表達(dá)控制序列,也見于增強(qiáng)子和真核基因表達(dá),冷泉港實(shí)驗(yàn)室出版社,冷泉港,紐約(1983)所述。也見于例如美國專利NO.5691198;5735500;5747469;和5436146所述。植物控制序列見例如美國專利No.5106739;5322938;5710267;5268526和5290294所述。
這種表達(dá)載體可以自動(dòng)復(fù)制,也可以通過本領(lǐng)域熟知的方法插入宿主細(xì)胞的基因組中而復(fù)制。
表達(dá)和克隆載體可以含有一個(gè)選擇標(biāo)記,一個(gè)編碼用載體轉(zhuǎn)化的宿主細(xì)胞存活或生長所必需的蛋白質(zhì)的基因。這個(gè)基因的存在保證了只是表達(dá)插入序列的那些宿主細(xì)胞生長。典型的選擇基因編碼蛋白質(zhì),其(a)授與對(duì)抗生素或其它毒性物質(zhì)的抗性,例如氨芐青霉素,新霉素,氨甲喋呤等,(b)互補(bǔ)營養(yǎng)缺陷型缺陷,或(c)供給從復(fù)合培養(yǎng)基中不能獲得的關(guān)鍵營養(yǎng)素,例如編碼Bacilli的D-丙氨酸消旋酶的基因。根據(jù)宿主細(xì)胞選擇正確的選擇標(biāo)記,而且本領(lǐng)域熟知不同宿主的適當(dāng)標(biāo)記。
含有相應(yīng)核酸的載體可以在體外轉(zhuǎn)錄,所得RNA可以通過熟知方法導(dǎo)入宿主細(xì)胞中,例如通過注射(見Kubo等,1988),或可以通過本領(lǐng)域熟知的方法將載體直接導(dǎo)入宿主細(xì)胞中,這根據(jù)細(xì)胞宿主的類型加以變化,所述方法包括電穿孔;用氯化鈣,氯化銣,磷酸鈣,DEAE-葡聚糖或其它物質(zhì)轉(zhuǎn)染,微粒轟擊;脂染;感染(載體是感染因子,如病毒基因組);及其它方法。一般見于Sambrook等,(1989)和Ausubel等(1992)所述。將多核苷酸通過上述本領(lǐng)域熟知方法導(dǎo)入宿主細(xì)胞參見“轉(zhuǎn)化”章節(jié)。其中已經(jīng)導(dǎo)入上述核酸的細(xì)胞也包括這些細(xì)胞的子代。
大量的本發(fā)明核酸和多肽,可以在與原核或真核宿主細(xì)胞中相容的載體或其它表達(dá)運(yùn)載體中,通過表達(dá)SGT10166核酸或其一部分而制備。最常用的原核宿主是大腸桿菌,也可以使用其它原核生物如枯草芽胞桿菌,或假單胞菌。
哺乳動(dòng)物或其它真核宿主細(xì)胞如酵母,絲狀真菌,植物,昆蟲,或兩棲類或禽類等,也可以用于產(chǎn)生本發(fā)明的蛋白質(zhì)。在培養(yǎng)物中增殖哺乳動(dòng)物細(xì)胞是熟知的。見Jakoby和Pastan編輯(1979)。常使用的哺乳動(dòng)物細(xì)胞系例如是VERO和HeLa細(xì)胞,中國倉鼠卵巢(CHO)細(xì)胞,和WI38,BHK和COS細(xì)胞系,本領(lǐng)域技術(shù)人員意識(shí)到其它細(xì)胞系也可以是適當(dāng)?shù)?,例如提供較高的表達(dá),所需的糖基化模式或其它特征。常使用的昆蟲細(xì)胞系例如是SF9。
通過使用依賴于載體構(gòu)建模式的標(biāo)記選擇克隆。所述標(biāo)記可以是在相同或不同DNA分子上,優(yōu)選在相同DNA分子上。在原核宿主中,轉(zhuǎn)化體例如可以通過對(duì)氨芐青霉素,四環(huán)素或其它抗生素的抗性加以選擇?;跍囟让舾行援a(chǎn)生特殊產(chǎn)物也可以作為適當(dāng)標(biāo)記。
用本發(fā)明的多核苷酸轉(zhuǎn)化的原核或真核細(xì)胞,不僅對(duì)產(chǎn)生本發(fā)明的核酸和多肽有用,而且對(duì)例如研究SGT10166多肽的特性也有用。
基于所揭示的SGT10166基因序列的探針和引物,用于在其它物種中鑒別與SGT10166同源的基因序列和蛋白質(zhì)。這些基因序列和蛋白質(zhì)用于進(jìn)行診斷/預(yù)測(cè),如推測(cè)轉(zhuǎn)基因植物中生殖表型,及用于對(duì)從中將它們分離出的物種的遺傳工程方法中。使用方法控制生殖開裂用于轉(zhuǎn)化植物細(xì)胞的載體包含SGT10166核酸或其同源核酸或其一部分,其能雜交與Arabidopsis的SGT10166基因同源的內(nèi)源性基因。為進(jìn)行闡述,本發(fā)明針對(duì)SGT10166基因和SGT10166蛋白進(jìn)行闡述。應(yīng)理解的是這種闡述也包括同源基因和蛋白。因此,這種核酸包括編碼所有或部分蛋白質(zhì)的SGT10166或同源基因的正鏈,及反義鏈。在任一種情況下,SGT10166或同源核酸或其轉(zhuǎn)錄物能與限定的內(nèi)源基因或其轉(zhuǎn)錄物雜交。發(fā)生這種雜交的條件包括在植物細(xì)胞內(nèi)發(fā)現(xiàn)的生理學(xué)或相等條件,包括在核及胞質(zhì)中發(fā)現(xiàn)的條件,以及技術(shù)人員測(cè)定兩個(gè)核酸之間序列同源性所用的標(biāo)準(zhǔn)體外條件。這種體外條件范圍是從中等(大約5×SSC,在52℃)至高度(大約0.1×SSC,在65℃)嚴(yán)格條件。
SGT10166或其同源基因用于構(gòu)建有義或反義載體以轉(zhuǎn)化植物細(xì)胞。通過使用二元載體可以便于構(gòu)建這種載體,所述二元載體在植物和常規(guī)克隆宿主如原核生物中均能操作和選擇。因此,這種二元載體可以包括卡那霉素或除草劑抗性基因以在植物細(xì)胞中進(jìn)行選擇,及放線菌素抗性基因以在細(xì)菌宿主中進(jìn)行選擇。這種載體當(dāng)然還含有一個(gè)適于所用原核宿主的復(fù)制起點(diǎn),及優(yōu)選至少一個(gè)獨(dú)特的限制位點(diǎn)或含有獨(dú)特限制位點(diǎn)的多接頭,以便于構(gòu)建載體。
在一個(gè)實(shí)施方案中,一個(gè)組成型啟動(dòng)子用于驅(qū)動(dòng)SGT10166核酸在受體植物的至少一部分生殖組織內(nèi)表達(dá)。特別優(yōu)選的啟動(dòng)子是花椰菜花葉病毒35S轉(zhuǎn)錄啟動(dòng)子(Guilley等,1982;Odell等,1985;和Saunders等,1987)。然而,也可以使用其它組成型啟動(dòng)子,如α-1和β-1微管蛋白啟動(dòng)子(Silflow等,1987)和組蛋白啟動(dòng)子(Chaubet等,1987)。也可以使用組織特異性啟動(dòng)子。例如,SGT10166基因的“內(nèi)源性”啟動(dòng)子可以用于驅(qū)動(dòng)反義或顯性陰性轉(zhuǎn)基因在野生型基因表達(dá)的區(qū)域中表達(dá)。
在本發(fā)明的另一個(gè)實(shí)施方案中,構(gòu)建用于轉(zhuǎn)化植物細(xì)胞以產(chǎn)生開裂表型改變的植物的載體,以定向于將SGT10166或同源核酸插入植物細(xì)胞的內(nèi)源性啟動(dòng)子中??捎糜诙ㄏ蛴趯GT10166或同源核酸整合入內(nèi)源性啟動(dòng)子中的一類載體,包含一個(gè)類似于Monsour等(1988)所述的陽性—陰性選擇載體,Monsour等闡述了將內(nèi)源性DNA定向于哺乳動(dòng)物ES細(xì)胞中預(yù)定的內(nèi)源性基因座。利用在植物細(xì)胞中陽性和陰性選擇標(biāo)記的功能的相似構(gòu)建體,基于鑒別內(nèi)源性植物啟動(dòng)子和其周圍的序列可易于設(shè)計(jì)(Kempin等,1997)。當(dāng)使用這種方法時(shí),優(yōu)選使用置換型載體使回復(fù)為野生型表型的可能性最小。
這樣設(shè)計(jì)本發(fā)明的載體,使包含于載體中的啟動(dòng)子序列或植物細(xì)胞基因組中定向的啟動(dòng)子序列可操縱地連于編碼SGT10166或同源基因的核酸。當(dāng)SGT10166基因或同源基因的正鏈用于表達(dá)所有或部分SGT10166蛋白時(shí),術(shù)語“可操縱地連接”是指啟動(dòng)子序列是相對(duì)于無性核酸編碼序列而定位的,這樣RNA聚合酶能啟動(dòng)SGT10166核酸序列從啟動(dòng)子序列中轉(zhuǎn)錄。在這種實(shí)施方案中,還優(yōu)選的是提供適當(dāng)?shù)暮颂求w結(jié)合位點(diǎn),轉(zhuǎn)錄起始和終止序列,翻譯起始和終止序列及聚腺苷酸化序列,以產(chǎn)生功能性RNA轉(zhuǎn)錄物,其可以翻譯為SGT10166蛋白。當(dāng)使用反義方向的SGT10166核酸時(shí),要求啟動(dòng)子是可操縱地連接的,以轉(zhuǎn)錄SGT10166反義鏈。因此,在這種實(shí)施方案中,只需要轉(zhuǎn)錄起始和終止序列以提供一種能雜交來自內(nèi)源性SGT10166基因的mRNA或其它RNA轉(zhuǎn)錄物的RNA轉(zhuǎn)錄物。除了啟動(dòng)子之外,其它表達(dá)調(diào)節(jié)序列如增強(qiáng)子,可以加入載體中以便于SGT10166核酸在體內(nèi)表達(dá)。
一旦構(gòu)建了載體,可根據(jù)植物分子生物學(xué)領(lǐng)域已知的任何各種轉(zhuǎn)化方法對(duì)植物進(jìn)行轉(zhuǎn)化。這些方法通常見于Wu和Grossman(1987)等所述。如本文所使用的,術(shù)語“轉(zhuǎn)化”是指通過導(dǎo)入核酸序列改變植物細(xì)胞的基因型。轉(zhuǎn)化植物細(xì)胞的特殊方法包括使用微量移液器直接將核酸微注射入植物細(xì)胞中?;蛘?,使用聚乙二醇將核酸移至植物細(xì)胞中(Paszkowski等,1984)。其它轉(zhuǎn)化方法包括原生質(zhì)體的電穿孔(Fromm等,1985);用植物特異性病毒感染,例如花椰菜花葉病毒(Hohn等,1982),或使用來自植物特異性細(xì)菌如根瘤農(nóng)桿菌的轉(zhuǎn)化序列,例如基于根瘤農(nóng)桿菌感染將Ti質(zhì)粒導(dǎo)入植物細(xì)胞中(Horsch等,1984;Fraley等,1983)?;蛘?,可以將包含于基質(zhì)內(nèi)的核酸或位于小珠或顆粒表面的核酸,通過高速彈道穿透導(dǎo)入植物細(xì)胞中,從而轉(zhuǎn)化植物細(xì)胞(Klein等,1987)。用彈道導(dǎo)入的核酸可以是一種嵌合的寡核苷酸,設(shè)計(jì)為將少量突變的堿基定向于內(nèi)源性SGT10166基因或同源基因的一個(gè)選擇的節(jié)段(Beetham等,1999)。少量的突變堿基也可以使用同源重組方法導(dǎo)入內(nèi)源性SGT10166基因的一個(gè)選擇的節(jié)段中(Kempin等,1997)。
在將載體導(dǎo)入植物細(xì)胞之后,在再生植物之前進(jìn)行選擇成功的轉(zhuǎn)化。這種選擇轉(zhuǎn)化不是必需的,但通過降低野生型背景便于選擇具有所需表型的再生植物。這種選擇一般是基于可以摻入轉(zhuǎn)化載體中的抗生素抗性和/或除草劑抗性基因。
實(shí)際上,所有植物均可以從培養(yǎng)的細(xì)胞或組織中再生。如本文使用的,術(shù)語“再生”是指從一個(gè)植物細(xì)胞,一組植物細(xì)胞或植物的一部分中生長一個(gè)完整植物。本領(lǐng)域技術(shù)人員熟知再生植物的方法。例如,從培養(yǎng)的原生質(zhì)體中再生如Evans等(1983);和H.Binding(1985)所述。當(dāng)轉(zhuǎn)化是器官部分時(shí),可以從植物愈傷組織,外植體,器官或部分中再生。這種再生方法也為本領(lǐng)域技術(shù)人員熟知。見例如Wu和Grossman(1987);Weissbach和Weissbach(1986);和Klee等(1987)所述。
一旦已經(jīng)再生了植物,基于開裂表型的變化選擇一或多個(gè)植物。這5種選擇可以是目測(cè)果實(shí)結(jié)構(gòu)中總形態(tài)學(xué)變化,例如種莢不再打開,通過觀測(cè)花序變化或通過觀測(cè)顯微鏡下果實(shí)結(jié)構(gòu)變化,例如通過電子顯微鏡觀測(cè)等。
在那些顯性表型是基于用含有SGT10166核酸的載體轉(zhuǎn)化授與的時(shí)候,開裂作用的改變可能導(dǎo)致不育的植物。在這種情況中,可以通過插枝或組織培養(yǎng)技術(shù)產(chǎn)生多個(gè)相同植物而將植物無性繁殖。或者,當(dāng)需要時(shí),開裂作用的改變可以被消融,如本文的進(jìn)一步闡述。
當(dāng)轉(zhuǎn)化的植物是以隱性表型為特征時(shí),例如當(dāng)使用反義構(gòu)建體時(shí),所述反義構(gòu)建體不足以授與所需表型或授與不產(chǎn)生呈現(xiàn)不裂植物的中間表型,這種轉(zhuǎn)化的植物可以內(nèi)交至純合以獲得所需的表型。然后可以將這種植物無性繁殖或如本文進(jìn)一步所述當(dāng)需要時(shí),開裂作用改變可以被消融。
使用SGT10166核酸的反義或共抑制機(jī)制可以導(dǎo)致開裂作用改變。具有這種修飾的開裂表型的植物可以用作模型系統(tǒng)以進(jìn)一步研究植物中果實(shí)組織的形成和分化。使用方法植物轉(zhuǎn)化的調(diào)節(jié)序列本發(fā)明的另一方面提供了一種DNA分子,其包含可操縱地連于一或多個(gè)基因或反義DNA的SGT10166基因的調(diào)節(jié)序列。已經(jīng)克隆并測(cè)定了Arabidopsis的全部基因組序列。基于所揭示的SGT10166的基因組序列,啟動(dòng)子和/或增強(qiáng)子和/或終止序列可易于通過檢測(cè)基因庫中的基因組序列而確定。調(diào)節(jié)序列可以是SGT10166啟動(dòng)子,內(nèi)含子序列或終止序列。SGT10166啟動(dòng)子起自SEQ ID NO3中外顯子1的起始處,并向上游延伸大約2kb序列。在內(nèi)含子1中至少發(fā)現(xiàn)1個(gè)調(diào)節(jié)序列?;蚧蚍戳xDNA為轉(zhuǎn)化的植物提供了一種農(nóng)學(xué)有用的性狀或選擇標(biāo)記。在一個(gè)實(shí)施方案中,DNA分子包括SGT10166啟動(dòng)子和影響基因表達(dá)的一個(gè)另外的核苷酸序列。影響異源基因調(diào)節(jié)的核苷酸序列例如包括增強(qiáng)子或活化區(qū),如衍生自CaMV35S,冠癭氨基酸合酶基因或其它植物基因(美國專利No.5106739;5322938;5710267;5268526;5290294)。在另一個(gè)實(shí)施方案中,一個(gè)啟動(dòng)子如CaMV 35S啟動(dòng)子與調(diào)節(jié)序列如SGT10166的內(nèi)含子序列或終止序列一起使用。在第三個(gè)實(shí)施方案中,將SGT10166的內(nèi)含子插入用于轉(zhuǎn)化植物的DNA分子中,作為一種在存在轉(zhuǎn)化細(xì)菌的情況下易于選擇或鑒別轉(zhuǎn)化的組織的方式。在第四個(gè)實(shí)施方案中,DNA分子是表達(dá)載體的一部分。在第五個(gè)實(shí)施方案中,DNA分子是轉(zhuǎn)化載體的一部分。
本發(fā)明的另一方面提供了轉(zhuǎn)化的植物細(xì)胞和組織,轉(zhuǎn)化的植物和轉(zhuǎn)化的植物的種子?;蚧蚍戳xDNA的表達(dá)是由SGT10166調(diào)節(jié)序列和另外的調(diào)節(jié)序列調(diào)節(jié)的,如果存在另外的調(diào)節(jié)序列。
通過本發(fā)明的方法,農(nóng)學(xué)基因和選擇標(biāo)記基因可以可操縱地連于SGT10166調(diào)節(jié)序列,并在轉(zhuǎn)化的植物中表達(dá)。更特別地,可以對(duì)植物進(jìn)行遺傳工程化以表達(dá)各種農(nóng)學(xué)相應(yīng)的表型。這種基因包括但非限于本文所述的那些基因。1.授與對(duì)害蟲或疾病抗性或耐受性的基因(A)植物疾病抗性基因植物防御性通常是通過植物中疾病抗性(R)基因的產(chǎn)物與病原體中相應(yīng)的無毒(Avr)基因的產(chǎn)物之間的特異性相互作用激活的。對(duì)各種植物可以用克隆的抗性基因轉(zhuǎn)化,以對(duì)特異性病原株有抗性的植物進(jìn)行遺傳工程化。這種基因例如包括對(duì)Cladosporium fulvum有抗性的番茄Cf-9基因(Jones等,1994),番茄Pto基因,其編碼一種蛋白質(zhì)激酶,對(duì)Pseudomonas syringaepv.tomato有抗性(Martin等,1993),和對(duì)Pseudomonas syringae有抗性的Arabidopsis RSSP2基因(Mindrinos等,1994)。
(B)一種Bacillus thuringiensis蛋白,其衍生物或模仿其合成的多肽,如Btδ—外毒素基因的核苷酸序列(Geiser等,1986)。另外,編碼δ—外毒素基因的DNA分子可以購自美國典型培養(yǎng)物保藏中心(Rockville,MD),ATCC保藏號(hào)為40098,67136,31995和31998。
(C)一種凝集素,如一些Clivia miniata甘露糖結(jié)合凝集素基因序列(Van Damme等,1994)。
(D)一種維生素結(jié)合蛋白,如親和素和親和素同源物,用作抗害蟲的殺幼蟲劑。見美國專利No.5659026。
(E)一種酶抑制劑,例如蛋白酶抑制劑或淀粉酶抑制劑。這種基因例如包括水稻半胱氨酸蛋白酶抑制劑(Abe等,1987),煙草蛋白酶抑制劑I(Huub等,1993),和α—淀粉酶抑制劑(Sumitani等,1993)。
(F)一種昆蟲特異性肽或神經(jīng)肽,在其表達(dá)的基礎(chǔ)上可破壞所感染害蟲的生理學(xué)特點(diǎn)。這種基因例如包括昆蟲利尿激素受體(Reagan,1994),在Diploptera puntata中鑒別的allostatin(Pratt,1989),昆蟲特異性癱瘓的神經(jīng)毒素(美國專利No.5266361)。
(G)一種在自然界中由蛇,黃蜂等產(chǎn)生的昆蟲特異性毒液,如蝎昆蟲毒素肽(Pang,1992)。
(H)一種與單萜,倍半萜,類固醇,氧肟酸,phenylpropanoid衍生物或具有殺蟲作用的其它非蛋白分子的過度積聚相關(guān)的酶。
(I)一種參與修飾包括翻譯后修飾生物活性分子的酶;例如糖基化酶,蛋白酶,脂解酶,核酸酶,環(huán)化酶,轉(zhuǎn)氨酶,酯酶,水解酶,磷酸酶,激酶,磷酸化酶,聚合酶,彈性蛋白酶,殼多糖酶和葡聚糖酶,無論是天然的還是合成的。這種基因例如包括馬蹄蓮基因(PCT出版物WO93/02197),殼多糖酶編碼序列(其可以得自例如ATCC,保藏號(hào)3999637和67152),煙草鉤蟲(hookworm)殼多糖酶(Kramer等,1993)和歐芹ubi-2多遍在蛋白基因(Kawalleck等,1993)。
(J)一種刺激信號(hào)轉(zhuǎn)導(dǎo)的分子。這種分子例如包括綠豆鈣調(diào)蛋白cDNA克隆的核苷酸序列(Botella等,1994),玉米鈣調(diào)蛋白cDNA克隆的核苷酸序列(Griess等,1994)。
(K)一種疏水性瞬間肽。見美國專利No.5659026和5607914,后者揭示了授與疾病抗性的合成的抗微生物肽。
(L)一種膜通透酶,一種通道形成因子或通道封阻因子,如殺菌肽-β-裂解肽類似物(Jaynes等,1993),其使轉(zhuǎn)基因煙草植物對(duì)Psedomonas solanacearum有抗性。
(M)一種病毒蛋白或衍生自其中的多肽復(fù)合物。例如,在轉(zhuǎn)化的植物細(xì)胞中積聚病毒外被蛋白提供了對(duì)病毒感染和/或疾病的抗性,所述疾病是感染外被蛋白衍生自其中的病毒以及相關(guān)的病毒而產(chǎn)生的。轉(zhuǎn)化的植物已經(jīng)授與了外被蛋白介導(dǎo)的對(duì)苜?;ㄈ~病毒,黃瓜花葉病毒,煙草線條病毒,馬鈴薯病毒X,馬鈴薯病毒Y,煙草蝕刻病毒,煙草脆裂病毒和煙草花葉病毒的抗性。見例如Beachy等(1990)所述。
(N)一種昆蟲特異性抗體或衍生自其中的免疫毒素。因此,定向于昆蟲內(nèi)臟臨界代謝功能的抗體,滅活一種受影響的酶,殺死昆蟲。例如,Taylor等(1994)揭示了通過產(chǎn)生單鏈的抗體片段在轉(zhuǎn)基因煙草中的酶促滅活。
(O)一種病毒特異性抗體。見例如Tavladoraki等(1993),其揭示了表達(dá)重組抗體基因的轉(zhuǎn)基因植物可以免于病毒侵襲。
(P)一種在自然界中由病原體或寄生蟲產(chǎn)生的發(fā)育抑制性蛋白。因此,真菌endo-α-1,4-D多聚半乳糖醛酸酶,通過溶解植物細(xì)胞壁homo-α-1,4-D半乳糖醛酸酶,促進(jìn)真菌定居和植物營養(yǎng)素釋放(Lamb等,1992)。編碼大豆內(nèi)多聚半乳糖醛酸酶抑制蛋白的基因的克隆和特征由Toubart等(1992)闡述。
(Q)一種在自然界中由植物產(chǎn)生的發(fā)育抑制性蛋白,如大麥核糖體滅活基因,對(duì)真菌性疾病的抗性提高(Longemann等,1992)。2.授與對(duì)除草劑抗性或耐受性的基因(A)一種抑制生長點(diǎn)或分生組織的除草劑,如imidazalinone或磺脲。這類基因編碼突變體ALS(Lee等,1988)和AHAS酶(Miki等,1990)。
(B)草甘膦(由突變體EPSP合酶和aroA基因授與抗性)和其它膦酸化合物如glufosinate(PAT和bar基因),及pyridinoxy或苯氧丙酸和cyclohexones(ACCase抑制劑編碼基因)。見例如美國專利No.4940835所述,其揭示了EPSP合酶形式的核苷酸序列,其可以授與草甘膦抗性。編碼突變體aroA基因的DNA分子可以得自ATCC,保藏號(hào)為39256,此突變體基因的核苷酸序列由美國專利No.4769061揭示。歐洲專利申請(qǐng)No.0333033和美國專利No.4975374揭示了谷氨酰胺合酶基因的核苷酸序列,其授與對(duì)除草劑的抗性如L-膦絲菌素的抗性。膦絲菌素乙酰轉(zhuǎn)移酶基因的核苷酸序列是由歐洲專利申請(qǐng)No.0242246提供的。De Greef等(1989)闡述了表達(dá)嵌合的bar基因的轉(zhuǎn)基因植物,所述基因編碼膦絲菌素乙酰轉(zhuǎn)移酶活性。授與對(duì)苯氧基丙酸和cyclohexones抗性的基因,例如sethoxydim和haloxyfop,是由Marshall等(1992)所闡述的Acc1-S1,Acc1-S2和Acc1-S3基因。
(C)一種抑制光合作用的除草劑,如三嗪(psbA和GST基因)和氰苯(腈水解酶基因)。Przibilla等(1991)闡述了使用編碼突變體psbA基因的質(zhì)粒轉(zhuǎn)化衣滴蟲。腈水解酶的核苷酸序列是由美國專利4810648揭示的,含有這些基因的DNA分子可得自ATCC,保藏號(hào)53435,67441和67442。編碼GST(谷胱甘肽S-轉(zhuǎn)移酶)的DNA的克隆和表達(dá)由Hayes等(1992)揭示。3.授與對(duì)環(huán)境應(yīng)激有抗性或耐受性的基因(A)寒冷,冰凍或霜凍。這包括編碼防冰凍的蛋白質(zhì)的基因,和編碼合成防冷凍溶質(zhì)的酶的基因。這種基因例如是ArabidopsisCOR15a(Artus等,1996)和菠菜CAP160(Kaye等,1998)。這類基因還包括控制其它耐寒基因活性的調(diào)節(jié)基因(PCT國際出版物WO98/09521)。
(B)干旱或水應(yīng)激。Kasuga等(1999)報(bào)道了在轉(zhuǎn)基因植物中怎樣應(yīng)激可誘導(dǎo)的DREB1A的表達(dá),以提高其對(duì)干旱的耐受性。Pilon-Smits等(1998)報(bào)道了在轉(zhuǎn)基因煙草中表達(dá)合成海藻糖的細(xì)菌基因,產(chǎn)生對(duì)水應(yīng)激的耐受性。
(C)鹽度或鹽應(yīng)激。編碼在高鹽情況下最小吸收鈉鹽或使植物在液泡中隔絕鈉鹽的蛋白質(zhì)的基因,可以使植物耐受土壤中高水平的鹽分。由Rubio等(1999)所述的小麥HKT1鉀轉(zhuǎn)運(yùn)蛋白是前者的一個(gè)實(shí)例。Apse等(1999)闡述了Arabidopsis Na+/H+反向轉(zhuǎn)運(yùn)蛋白怎樣以后一方式起作用。
(D)金屬。防金屬如鋁和鎘的毒性作用可以通過轉(zhuǎn)基因表達(dá)一種基因而達(dá)到,所述基因阻止金屬的吸收,或編碼結(jié)合金屬離子的鰲合劑,以免于金屬離子的毒性作用。這種基因例如是ArabidopsisALR104和ALR108(Larsen等,1998)及編碼參與植物鰲合肽合成的酶的基因(Schafer等,1998)。4.授與或提供附加值性狀的基因(A)修飾脂肪酸代謝,例如通過用反義基因或硬脂酰-ACP脫飽和酶轉(zhuǎn)化玉米或蕓苔,以提高植物的硬脂酸含量(Knutzon等,1992)。
(B)降低肌醇六磷酸含量(1)導(dǎo)入肌醇六磷酸酶編碼基因可以增強(qiáng)肌醇六磷酸的破壞,在轉(zhuǎn)化的植物增加更多游離的磷酸鹽,如Aspergillus niger肌醇六磷酸酶基因(Van Hartingsveldt等,1993)。
(2)導(dǎo)入一種基因以降低肌醇六磷酸含量。例如在玉米中,這可以通過將一種DNA克隆然后再導(dǎo)入而達(dá)到,所述DNA與應(yīng)答特征在于低水平植酸的玉米突變體的一個(gè)等位基因相關(guān)聯(lián)(Raboy等,1990)。
(C)修飾碳水化合物組分,例如通過用編碼改變淀粉分支模式的酶的基因轉(zhuǎn)化植物。這種酶例如包括Streptococcus mucus果糖轉(zhuǎn)移酶基因(Shiroza等,1988),Bacillus subtilis果聚糖蔗糖酶基因(Steinmetz等,1985),Bacillus licheniformis α-淀粉酶(Pen等,1992),番茄轉(zhuǎn)化酶(Elliot等,1993),大麥淀粉酶基因(Sφgaard等,1993),和玉米胚乳淀粉分支酶II(Fisher等,1993)。
(D)修飾木質(zhì)素含量。木質(zhì)素的數(shù)量或組分可以通過提高或降低phenylpropanoid木質(zhì)素前體的生物合成酶的表達(dá)而改變,如苯丙烯鹽醇脫氫酶(CAD),4-香豆酸(coumarate)CoA連接酶(4CL),和O-甲基轉(zhuǎn)移酶(OMT)。參與木質(zhì)素形成的這些和其它基因見于美國專利5850020所述。5.選擇標(biāo)記基因(A)可獲得各種選擇標(biāo)記基因以用于轉(zhuǎn)化植物,包括但非限于新霉素磷酸轉(zhuǎn)移酶II,潮霉素磷酸轉(zhuǎn)移酶,EPSP合酶和二氫葉酸合酶。見Miki等(1993)所述。
合成適用于本發(fā)明的基因可以通過互利引發(fā)長的寡核苷酸而進(jìn)行。見例如Ausubel等(1990)和Wosnick等(1987)所述。另外,目前使用聚合酶鏈反應(yīng)可以合成長度為6kb或更長的基因。見Adang等(1993)和Bambot等(1993)所述。另外,通過常規(guī)的自動(dòng)方法可以便利地合成基因。
實(shí)施例本發(fā)明參考以下實(shí)施例得以進(jìn)一步闡述,但以下實(shí)施例無任何限制本發(fā)明之意。實(shí)施例中使用的是本領(lǐng)域熟知的標(biāo)準(zhǔn)方法或其它特別闡述的方法。實(shí)施例1分離和突變表型使用轉(zhuǎn)座子介導(dǎo)的基因阱誘變方法,我們分離了一種阻斷長角果開裂過程的突變(Sundaresan等,1995)。
SGT10166突變分離自使用基因阱Ds轉(zhuǎn)座因子產(chǎn)生的獨(dú)立插入品系。雙因子轉(zhuǎn)座子系統(tǒng)利用一個(gè)玉米Ac-Ds轉(zhuǎn)座子和報(bào)道基因GUS(Sundaresan等,1995)。在基因阱插入品系SGT10166中,SGT10166突變體是在基因阱品系的F3子代中鑒別的,其中長角果呈現(xiàn)不裂表型(圖2)。從胎座框中不能分離出瓣,而且只有在手工打開果實(shí)時(shí)才能收獲種子。除了不裂表型,植物的其它方面是正常的。實(shí)施例2GUS表達(dá)模式插入Ds基因阱元件使GUS報(bào)道基因表達(dá),這樣可以通過對(duì)GUS活性進(jìn)行組織化學(xué)染色分析基因的內(nèi)源性表達(dá)模式(見Sundaresan等,1995)。在雌蕊柱頂部的幼芽中開始GUS表達(dá)。稍后,隨著發(fā)育,表達(dá)延伸至柱頭毛中和雌蕊的末梢部分。在成熟的花中,在全部雌蕊株中表達(dá)。在受精后,在長角果中,表達(dá)限于瓣胎座框分界處,比在瓣的遠(yuǎn)端和近端部分更強(qiáng)(圖3)。實(shí)施例3基因分析為了解產(chǎn)生不裂表型的缺陷的性質(zhì),對(duì)基因進(jìn)行進(jìn)一步定性。通過Tail PCR擴(kuò)增在Ds因子側(cè)翼的基因組DNA的片段(Parinov等,1999)。對(duì)擬南芥基因組數(shù)據(jù)庫進(jìn)行的研究表明側(cè)翼序列與來自染色體5的基因組序列相同,所述序列包含于BAC克隆內(nèi),登記號(hào)為AB020742。設(shè)計(jì)基因特異性引物以擴(kuò)增來自擬南芥花cDNA文庫的cDNA序列的一部分(cDNA克隆分離自從生態(tài)型Landsbergerecta中制備的擬南芥花cDNA文庫。此cDNA文庫得自O(shè)hio State大學(xué)的Arabidopsis Stock中心ABRC,而且已經(jīng)使用Stratagene Uni-ZAP XR載體系統(tǒng)構(gòu)建(Weigel等,1992)。根據(jù)生產(chǎn)者的指導(dǎo)篩選此文庫)。然后將PCR片段用作探針以篩選相同的文庫。由這種篩選分離的cDNA的長度為931bp,并推測(cè)其編碼一個(gè)210個(gè)氨基酸的蛋白質(zhì)。對(duì)此cDNA序列進(jìn)行的分析表明在SGT10166和屬于堿性螺旋環(huán)螺旋(bHLH)類轉(zhuǎn)錄因子的蛋白質(zhì)之間有明顯的相似性。bHLH家族蛋白質(zhì)的成員在動(dòng)物,植物和真菌中的轉(zhuǎn)錄調(diào)節(jié)中起重要作用。這些蛋白質(zhì)通常與HLH區(qū)域作為二聚體參與同源/異源二聚體化過程,而且堿性結(jié)構(gòu)域結(jié)合DNA。在植物中,已經(jīng)鑒別了許多bHLH結(jié)構(gòu)域蛋白而且具有不同的功能(Murre等,1989)。例如,bHLH蛋白在玉米中調(diào)節(jié)花青素的生物合成(B-Peru和R/Lc基因)(Radicella等,1991;Ludwig等,1989),應(yīng)答Arabidopsis中脫落酸和脫水(rd22 BPI)(Abe等,1997),及Phaseolus(PG1)中種子貯存蛋白的表達(dá)(Kawagoe和Murai,1996)。
SGT10166的具有外顯子和內(nèi)含子的基因組序列示于SEQ IDNO3。SEQ ID NO3的序列示于表1。
表1SGT10166基因的外顯子和內(nèi)含子
實(shí)施例4回復(fù)分析為證實(shí)在SGT10166中所觀測(cè)到的表型是由插入Ds元件引起的,進(jìn)行回復(fù)分析(Yang等,1999)。對(duì)Ds插入位點(diǎn)進(jìn)行的DNA序列分析表明插入Ds未產(chǎn)生一個(gè)典型的8bp靶位點(diǎn)重復(fù)。在Ds插入位點(diǎn)所存在的堿基對(duì)變化示于圖5。圖5所示野生型ALC序列(SEQID NO8)相當(dāng)于SEQ ID NO1的第331-352位堿基。標(biāo)記位點(diǎn)示于SEQ ID NO9和10,其由插入序列間隔。將Ds通過與攜帶Ac轉(zhuǎn)座酶基因的植物雜交而再遷移(Sundfaresan等,1995),并用回復(fù)的野生型部分觀測(cè)8個(gè)突變的植物,回復(fù)的野生型即具有開裂的長角果。種植來自這些回復(fù)體長角果的種子,對(duì)制備的DNA和期望得自Ds切除的序列變化進(jìn)行分析。所有測(cè)序的回復(fù)體基因均含有一個(gè)切除的Ds因子,這由沒有Ds序列而顯示出來的,和在相同位點(diǎn)的一個(gè)9bp足跡。此足跡回復(fù)讀框并在原始蛋白質(zhì)上添加了3個(gè)額外的氨基酸(圖5,SEQ ID NO11的黑體的9個(gè)堿基示出回復(fù)體)。這個(gè)結(jié)果證實(shí)突變是由在SGT10166基因座插入Ds所引起的。例外還分離了不回復(fù)讀框的具有10bp足跡的一個(gè)穩(wěn)定的等位基因,并稱之為alc10(圖5;SEQ ID NO12)。這種alc10植物是所期望的不裂的。實(shí)施例5互補(bǔ)研究為證實(shí)SGT10166的分離的cDNA序列足以提供開裂作用,我們通過農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化方法(Clough和Bent,1998),將推定的在CaMV 35S啟動(dòng)子控制下的SGT10166的全長cDNA克隆導(dǎo)入突變的植物中。獲得15個(gè)獨(dú)立的轉(zhuǎn)化體,在2個(gè)突變植物中完整回復(fù)了開裂作用。這些結(jié)果示出分離的序列是果實(shí)開裂所必需的而且是足夠的。實(shí)施例6顯性陰性研究由于SGT10166基因編碼一種myc-相關(guān)的bHLH結(jié)構(gòu)域蛋白,因此可以產(chǎn)生對(duì)抗其的顯性陰性調(diào)節(jié)物,以改變開裂過程。我們通過缺失SGT10166基因的堿性結(jié)構(gòu)域,并用酸性序列置換,產(chǎn)生了這樣一種顯性陰性構(gòu)建體(Krylov等,1997)。這種蛋白質(zhì)應(yīng)作為顯性陰性調(diào)節(jié)物,通過螯合內(nèi)源性SGT10166 bHLH蛋白以形成失活的二聚體。這個(gè)構(gòu)建體是通過缺失SEQ ID NO1的第290-340位堿基而產(chǎn)生的(示作SEQ ID NO13),并用SEQ ID NO14置換以產(chǎn)生編碼SEQ ID NO16的SEQ ID NO15。將此構(gòu)建體通過農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化方法(Clough和Bent,1998)轉(zhuǎn)化入野生型Arabidopsis植物中。在所得35個(gè)獨(dú)立的轉(zhuǎn)化體中的2個(gè)轉(zhuǎn)化體中,我們能將開裂作用延遲接近2周。這個(gè)結(jié)果也可以解釋為共抑制機(jī)制的結(jié)果而不是所述顯性陰性的作用。但是無論如何,我們確定SGT10166基因可以用于轉(zhuǎn)基因植物中以延遲開裂。類似地,應(yīng)該也可以使用反義方法通過降低這個(gè)基因的活性而遺傳工程化不裂或開裂延遲的植物(Gray等,1992)。
本發(fā)明通過參考優(yōu)選的實(shí)施方案已經(jīng)加以詳細(xì)論述,應(yīng)意識(shí)到所揭示的內(nèi)容只是舉例說明了本發(fā)明而無限制之意,本領(lǐng)域技術(shù)人員在本發(fā)明的精神和所附權(quán)利要求的范圍內(nèi),可對(duì)本發(fā)明加以修改。
參考文獻(xiàn)列表Abe等人(1987).生物化學(xué)雜志26216793.
Abe,H.et al.,(1997),植物細(xì)胞91859.
Adang等人(1993).植物分子生物學(xué)211131.
Anand,R.(1992).復(fù)雜基因組的分析技術(shù)(學(xué)術(shù)出版社).
Altschul,S.F.等人(1990).分子生物學(xué)雜志215403.
Altschul,S.F.等人(1997).核酸研究253389-3402.
Apse,MP等人(1999).科學(xué)2851256-1258.
Ausubel,F(xiàn).M.等人(1992).分子生物學(xué)當(dāng)前方案(John Wiley &Sons,New York,NY).
Bambot等人(1993).PCR方法和應(yīng)用2266.
Beachy等人(1990).Ann.Rev.Phytopathol.28451.
Beaucage,SL and Caruthers,MH(1981).Tetra.Letts.221859-1862.
Beetham PR.(1999).美國科學(xué)院院刊968774-8778.
生物計(jì)算信息學(xué)和基因組計(jì)劃,Smith,D.W.編輯,學(xué)術(shù)出版社,NY(1993).
Bloksberg,LN等人(1998).US專利號(hào)5,850,020.
Botellaetal.(1994).植物分子生物學(xué)24757.
Carillo,H.and Lipman,D.(1988).SIAM J.Applied Math.481073.
Chaubet等人(1987).發(fā)育遺傳學(xué)8461-473.
Compton,J(1991).自然35091-92.
計(jì)算分子生物學(xué),Lesk,A.M.,編輯,Oxford Univ.Press,NY(1988).
序列數(shù)據(jù)的計(jì)算機(jī)分析,第I部分,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,NJ(1994).
Coupe,S.A.et al.,(1994).植物分子生物學(xué)24223.
DeGreef等人(1989).Bio/Technology 761.
Deutscher,M(1990).酶學(xué)方法18283-89(學(xué)術(shù)出版社,SanDiego,CA).
Elliot等人(1993).植物分子生物學(xué)21515.
增強(qiáng)子及真核基因表達(dá),冷泉港實(shí)驗(yàn)室,Cold Spring Harbor,NY(1983).
Evans等人(1983).原生質(zhì)體分離和培養(yǎng),植物細(xì)胞培養(yǎng)手冊(cè)1124-176(MacMillan Publishing Co.,NY).
Fahy,E等人(1991).PCR方法及應(yīng)用125-33.
Fiers,Wet al.(1978).自然273113-120.
Fisher等人(1993).植物生理學(xué)1021045.
Fraley等人(1983).美國科學(xué)院院刊804803.
Fromm等人(1985).美國科學(xué)院院刊825824.
Geiser等人(1986).基因48109.
Gelvin,S.等人(eds)(1990).植物分子生物學(xué)手冊(cè),Kluwer學(xué)術(shù)出版社,Dordrecht,NetherlandsGlover,D(1985).DNA克隆,I和II(Oxford Press).
Gray,J.et al.,(1992).植物分子生物學(xué)19(1)69-87Griess EA等人(1994).植物生理學(xué)1041467-1468.
Gu Q等人(1998),發(fā)育1251509.
巨型計(jì)算機(jī)指南,Martin J.Bishop,ed.,學(xué)術(shù)出版社,San Diego,CA(1994).
Guilley等人(1982).細(xì)胞30763-773(1982).
Guthrie,G and Fink,GR(1991).酵母遺傳學(xué)和分子生物學(xué)指南(學(xué)術(shù)出版社).
Hayes等人(1992).Biochem.J.285173.
Hohn等人(1982).植物腫瘤的分子生物學(xué)(學(xué)術(shù)出版社,NY),pp.549-560.
Horsch等人(1984).科學(xué)233496-498.
Huub等人(1993).植物分子生物學(xué)21985.
Innis,MA等人(1990).PCR方案方法和應(yīng)用指南(學(xué)術(shù)出版社,San Diego,CA).
Jakoby,WB and Pastan,IH(eds.)(1979).細(xì)胞培養(yǎng).酶學(xué)方法Vol.58(學(xué)術(shù)出版社,Harcourt Brace Jovanovich(NY)).
Jaynes等人(1993).植物科學(xué)8943.
Jones等人(1994).科學(xué)266789.
Kanehisa,M(1984).核酸研究12203-213.
Kasuga M.等人(1999).自然生物技術(shù).17287-291.
Kawagoe,y and Murai,N.(1996),植物科學(xué)11647Kawalleck等人(1993).植物分子生物學(xué)21673.
Kaye,C等人(1998).植物生理學(xué)1161367-1377.
Kempin,SA等人(1997).自然389802-803.
Klee等人(1987).Ann.Review of Plant Physiology 38467-486.
Klein等人(1987).自然32770-73.
Knultzon等人(1992).美國科學(xué)院院刊892624.
Kramer等人(1993).Insect Molec.Biol.23691.
Krylov D等人(1997)美國科學(xué)院院刊9412274-12279.
Kubo,T等人(1988).FEBS Lett.241119.
Kyte,J and Doolittle,RF(1982).J Mol.Biol.157105-132.
Lamb等人(1992).Bio/Technology 101436.
Larsen,PB等人(1998).植物生理學(xué)1179-18.
Longemann等人(1992).Bio/Technology 103305.
Ludwig,S.et al.,(1989).美國科學(xué)院院刊867092-7096.
Maniatis,T等人(1982).分子克隆實(shí)驗(yàn)手冊(cè)(冷泉港實(shí)驗(yàn)室,ColdSpring Harbor,NY).
Marshall等人(1992).Theor.Appl.Genet.83435.
Martin等人(1993).科學(xué)2621432.
Matteucci,MD and Caruthers,MH(1981).J.Am.Chem.Soc.1033185.
Metzger,D等人(1988).自然33431-36.
Miki等人(1990).Theor.Appl.Genet.80449.
Miki等人(1993).″將外源DNA導(dǎo)入植物的程序,″,見植物分子生物學(xué)和生物工程方法,Glick等人(eds.),CRC Press,pp.67-88.
Mindrinos等人(1994).細(xì)胞781089.
Mol,J.M.N.等人(1994).基因表達(dá)的轉(zhuǎn)錄后抑制有義和反義基因.InJ.Paszkowski(Ed.).植物中的同源重組和基因沉默.KluwerAcademic Publishers.Dordrecht,Netherlands.pp.309-334.
Monsour等人(1988).自然336348-352.
Murre,C.et al.,(1989).細(xì)胞56777-783.
Odell等人(1985).自然313810-812.
Pang等人(1992).基因116165.
Parinov,S.et al.,(1999).植物細(xì)胞112263-2270.
Pen等人(1992).Bio/Technology 10292.
Pilon-Smits EAH等人(1998).植物生理學(xué)雜志152525-532.
Przibilla等人(1991).植物細(xì)胞3169.
Radicella,J.P.等人(1991).植物分子生物學(xué)17127.
Raboy等人(1990).Maydica 35383.
Regan(1994).生物化學(xué)雜志2699.
Sambrook,J.等人(1989).分子克隆實(shí)驗(yàn)手冊(cè),2nd Ed.(冷泉港實(shí)驗(yàn)室,Cold Spring Harbor,NY).
Schafer,HE等人(1998).植物分子生物學(xué)3787-97.
Scharf,SJ等人(1986).科學(xué)2331076-1078.
Scopes,R(1982).蛋白質(zhì)純化原理和實(shí)踐,(Springer-Verlag,NY).
分子生物學(xué)中的序列分析,von Heinje,G.,學(xué)術(shù)出版社(1987).
序列分析引物,Gribskov,M.and Devereux,J.,eds.,M StocktonPress,NY(1991)威斯康星大學(xué)生物工程中心遺傳學(xué)計(jì)算機(jī)小組序列分析軟件包,Madison,WI.
Sessions,A.,(1999).植物科學(xué)趨勢(shì),Vol.4.
Shiroza等人(1988).J.Bacteriol.1708l0.
Si1flow等人(1987).發(fā)育遺傳學(xué)8435-460.
Sgaard等人(1993).生物化學(xué)雜志26822480.
Spargo,CA等人(1996).Mol.Cell.Probes 10247-256.
Steinmetz等人(1985).Mol.Gen.Genet.200220.
Sumitani等人(1993).Biosci.Biotech.Biochem.571243.
Sundaresan,V.et aL,(1995).基因Dev.91797.
Tavladoraki等人(1993).自然266469.
Taylor,L.P.and Jorgensen,R.A.(1992).J.Hered.8311-17.
Taylor等人(1994).Abstract #497,Seventh Int′l.Symposium onMolecular Plant Microbe Interactions.
Toubart等人(1992).植物雜志2367.
Van Damme等人(1994).植物分子生物學(xué)24825.
Van Hartingsveldt等人(1993).基因12787.
Walker,GT等人(1992).核酸研究201691-1696.
Weissbach,A.and Weissbach,H.(eds)1986.酶學(xué)方法,Volume118,學(xué)術(shù)出版社,Orlando,F(xiàn)L.
Wetmur,JG and Davidson,N(1968).分子生物學(xué)雜志31349-370.
Weigel D.等人(1992)細(xì)胞69843-859Wosnick等人(1987).基因60115-127.
Wu,DY and Wallace,RB(1989).Genomics 4560-569.
Wu and Grossman(1987).酶學(xué)方法Vol.153,″Recombinant DNAPart D″.學(xué)術(shù)出版社,NY.
Yang WC等人(1999)基因和發(fā)育132108-2117Zaitlin,M.等人(eds)(1985).植物科學(xué)生物工程,學(xué)術(shù)出版社,Orlando,F(xiàn)L.
專利和專利申請(qǐng)Hitzeman et al.,EP 73,675A.
歐洲專利申請(qǐng)0 242 246歐洲專利申請(qǐng)0 333 033PCT公開WO90/12084PCT公開WO93/02197PCT公開WO98/09521U.S.專利號(hào)4,554,101.
U.S.專利號(hào)4,683,195.
U.S.專利號(hào)4,683,202.
U.S.專利號(hào)4,769,061U.S.專利號(hào)4,810,648U.S.專利號(hào)4,940,835U.S.專利號(hào)4,975,374U.S.專利號(hào)5,106,739.
U.S.專利號(hào)5,266,361.
U.S.專利號(hào)5,268,526.
U.S.專利號(hào)5,270,184.
U.S.專利號(hào) 5,290,294.
U.S.專利號(hào).5,322,938.
U.S.專利號(hào) 5,409,818.
U.S.專利號(hào) 5,436,146.
U.S.專利號(hào) 5,455,166.
U.S.專利號(hào) 5,607,914U.S.專利號(hào) 5,633,441.
U.S.專利號(hào) 5,659,026U.S.專利號(hào) 5,691,198.
U.S.專利號(hào) 5,710,267.
U.S.專利號(hào) 5,735,500.
U.S.專利號(hào) 5,747,469U.S.專利號(hào) 5,850,020
序列表SEQUENCE LISTING<110>分子農(nóng)業(yè)生物學(xué)院<120>開裂基因和調(diào)節(jié)開裂作用的方法<130>GM/MC/R33-102<140>PCT/SG01/00017<141>2001-02-01<150>PCT/SG00/00022<151>2000-02-11<160>16<170>PatentIn version 3.0<210>1<211>931<212>DNA<213>Arabidopsis thaliana<220><221>CDS<222>(23)..(652)<400>1agagagagag agagagagag ag atg ggt gat tct gac gtc ggt gat cgt ctt52Met Gly Asp Ser Asp Val Gly Asp Arg Leu1 5 10ccc cct cca tct tct tcc gac gaa ctc tcg agc ttt ctc cga cag att100Pro Pro Pro Ser Ser Ser Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile15 20 25ctt tcc cgt act cct aca gct caa cct tct tca cca ccg aag agt act148Leu Ser Arg Thr Pro Thr Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr30 35 40aat gtt tcc tcc gct gag acc ttc ttc cct tcc gtt tcc ggc gga gct196Asn Val Ser Ser Ala Glu Thr Phe Phe Pro Ser Val Ser Gly Gly Ala45 50 55gtt tct tcc gtc ggt tat gga gtc tct gaa act ggc caa gac aaa tat244Val Ser Ser Val Gly Tyr Gly Val Ser Glu Thr Gly Gln Asp Lys Tyr60 65 70gct ttc gaa cac aag aga agt gga gct aaa cag aga aat tcg ttg aag292Ala Phe Glu His Lys Arg Ser Gly Ala Lys Gln Arg Asn Ser Leu Lys75 80 85 90aga aac att gat gct caa ttc cac aac ttg tct gaa aag aag agg agg340Arg Asn Ile Asp Ala Gln Phe His Asn Leu Ser Glu Lys Lys Arg Arg95 100 105agc aag atc aac gag aaa atg aaa gct ttg cag aaa ctc att ccc aat388Ser Lys Ile Asn Glu Lys Met Lys Ala Leu Gln Lys Leu Ile Pro Asn110 115 120tcc aac aag act gat aaa gcc tca atg ctt gat gaa gct ata gaa tat436Ser Asn Lys Thr Asp Lys Ala Ser Met Leu Asp Glu Ala Ile Glu Tyr125 130 135ctg aag cag ctt caa ctt caa gtc cag act tta gcc gtt atg aat ggt484Leu Lys Gln Leu Gln Leu Gln Val Gln Thr Leu Ala Val Met Asn Gly140 145 150tta ggc tta aac cct atg cga tta cca cag gtt cca cct cca act cat532Leu Gly Leu Asn Pro Met Arg Leu Pro Gln Val Pro Pro Pro Thr His155 160 165 170aca agg atc aat gag acc tta gag caa gac ctg aac cta gag act ctt580Thr Arg Ile Asn Glu Thr Leu Glu Gln Asp Leu Asn Leu Glu Thr Leu175 180 185ctc gct gct cct cac tcg ctg gaa cca gct aaa aca agt caa gga atg628Leu Ala Ala Pro His Ser Leu Glu Pro Ala Lys Thr Ser Gln Gly Met190 195 200tgc ttt tcc aca gcc act ctg ctt tgaagataac attcagacaa tgatgatgat 682Cys Phe Ser Thr Ala Thr Leu Leu205 210cggaattcct ctagtacctg ccagacagga gtgaacaatg ttttgagttt tagcattggc 742cagatttcta tgttcagtta tagttatgct aataagcttt aggagtgaac aaaatctgag 802tagtttgatt ataatgatgt ctgaagcaga ttatatataa aagactaatt tacttacata 862tgagatgatt attacaacta tcaaatgact atgtctgtga gttgcatcca aaaaaaaaaa 922aaaaaaaaa 931<210> 2<211>210<212>PRT<213>Arabidopsis thaliana<400>2Met Gly Asp Ser Asp Val Gly Asp Arg Leu Pro Pro Pro Ser Ser Ser1 5 10 15Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile Leu Ser Arg Thr Pro Thr20 25 30Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr Asn Val Ser Ser Ala Glu35 40 45Thr Phe Phe Pro Ser Val Ser Gly Gly Ala Val Ser Ser Val Gly Tyr50 55 60Gly Val Ser Glu Thr Gly Gln Asp Lys Tyr Ala Phe Glu His Lys Arg65 70 75 80Ser Gly Ala Lys Gln Arg Asn Ser Leu Lys Arg Asn Ile Asp Ala Gln85 90 95Phe His Asn Leu Ser Glu Lys Lys Arg Arg Ser Lys Ile Asn Glu Lys100 105 110Met Lys Ala Leu Gln Lys Leu Ile Pro Asn Ser Asn Lys Thr Asp Lys115 120 125Ala Ser Met Leu Asp Glu Ala Ile Glu Tyr Leu Lys Gln Leu Gln Leu130 135 140Gln Val Gln Thr Leu Ala Val Met Asn Gly Leu Gly Leu Asn Pro Met145 150 155 160Arg Leu Pro Gln Val Pro Pro Pro Thr His Thr Arg Ile Asn Glu Thr165 170 175Leu Glu Gln Asp Leu Asn Leu Glu Thr Leu Leu Ala Ala Pro His Ser180 185 190Leu Glu Pro Ala Lys Thr Ser Gln Gly Met Cys Phe Ser Thr Ala Thr195 200 205Leu Leu210<210>3<211>2640<212>DNA<213>Arabidopsis thaliana<220><221>外顯子<222>(1007)..(1243)<223>外顯子1不包括翻譯起點(diǎn)之前的序列.<220><221>內(nèi)含子<222>(1244)..(1355)<223>內(nèi)含子1.<220><221>外顯子<222>(1356)..(1427)<223>外顯子2.<220><221>內(nèi)含子<222>(1428)..(1517)<223>內(nèi)含子2.<220><221>外顯子<222>(1518)..(1583)<223>外顯子3.<220><221>內(nèi)含子<222>(1584)..(1661)<223>內(nèi)含子3.<220><221>外顯子<222>(1662)..(1727)<223>外顯子4.<220><221>內(nèi)含子<222>(1728)..(1821)<223>內(nèi)含子4.<220><221>外顯子<222>(1822)..(2013)<223>外顯子5通過終止密碼子.外顯子5繼續(xù)超過該密碼子.<400>3aattacaaaa tatttagaca ataattcata aacatatcat aaataagatc acattcataa 60aataaatgag tttttttaga ggacgggttg gcgggacggg tttggcagga cgttacttaa 120taacaattgt aaactataca ataaaaatat tttatagata gatacaattt acaaactttt 180atatatatta atttaaaaaa taaattgttt tcgcggtata ccgcgggtta aaatctagtt 240attcttattt ttgctatgaa ccataattat tttaattact atattatata tatttccctt 300tggatgcatt aaaaaaaggc taatgatcaa ggacatgtta tcgtctttgt attgaccatt 360ataatatctg aattttattt tgtgttaaat aatctctcga ataaataatc tttcgaaatg 420catgcagttt tattcacact ttatctgtgg acaacaacaa caacaaaaaa gaaggaaaaa 480atagattttt gtaatttgtc aaaaatggtg aaactgttgc gagaccttac ttttcaagta 540attgtccatt ttcatgttta gtcataataa taattaaata gtctatcaat gctctatctt 600atcaatactc ttattttttc aaccgtttca tttactgatt ttcataattt catcccctcc 660tctcaattta acttatcaca ttgaaaaaaa caataaaaat gtatgttttt tatttacttg 720gtggtccaaa aatgcttttt tccttttttt tattaggtaa aaaatataat attattaaat 780aaaattgcta caaaaggaaa ctgttcacac acagagtgat gtgagacacc agattctgtc 840tatagggatt cgacacgcca ctcgcctctt ttagaacctc cacgcgcttc tctgaagaac 900gtgatctcac gcgtcctacc tcccccgcct ataagcttta ctacgaaaaa gccacagtga 960taatttttac acacagagta gagcagagag agagagagag agagag atg ggt gat1015Met Gly Asp1tct gac gtc ggt gat cgt ctt ccc cct cca tct tct tcc gac gaa ctc 1063Ser Asp Val Gly Asp Arg Leu Pro Pro Pro Ser Ser Ser Asp Glu Leu5 10 15tcg agc ttt ctc cga cag att ctt tcc cgt act cct aca gct caa cct 1111Ser Ser Phe Leu Arg Gln Ile Leu Ser Arg Thr Pro Thr Ala Gln Pro20 25 30 35tct tca cca ccg aag agt act aat gtt tcc tcc gct gag acc ttc ttc 1159Ser Ser Pro Pro Lys Ser Thr Asn Val Ser Ser Ala Glu Thr Phe Phe40 45 50cct tcc gtt tcc ggc gga gct gtt tct tcc gtc ggt tat gga gtc tct 1207Pro Ser Val Ser Gly Gly Ala Val Ser Ser Val Gly Tyr Gly Val Ser55 60 65gaa act ggc caa gac aaa tat gct ttc gaa cac aag gtataaactt1253Glu Thr Gly Gln Asp Lys Tyr Ala Phe Glu His Lys70 75aactattctt agctgcagag atgcttcact tggctttcct tgtaaaagaa aacaaaaacc 1313aaaattagtc tcttttcttt ttggaatggc taaacactaa ag aga agt gga gct1367Arg Ser Gly Ala80aaa cag aga aat tcg ttg aag aga aac att gat gct caa ttc cac aac 1415Lys Gln Arg Asn Ser Leu Lys Arg Asn Ile Asp Ala Gln Phe His Asn85 90 95ttg tct gaa aag gttttctctt ttatcttcct tttaagattc ttaatttaga 1467Leu Ser Glu Lys100aagaagaaga accttgagat tgtagttgat tagaatctga gtgttagcag aag agg1523Lys Arg105agg agc aag atc aac gag aaa atg aaa gct ttg cag aaa ctc att ccc 1571Arg Ser Lys Ile Asn Glu Lys Met Lys Ala Leu Gln Lys Leu Ile Pro110 115 120aat tcc aac aag gttaatcaat ctttgttcga atcagagata gtgagaaaca 1623Asn Ser Asn Lys125ttgttctgat tgatccgtta tcttttgttt gtttatag act gat aaa gcc tca atg 1679Thr Asp Lys Ala Ser Met130ctt gat gaa gct ata gaa tat ctg aag cag ctt caa ctt caa gtc cag 1727Leu Asp Glu Ala Ile Glu Tyr Leu Lys Gln Leu Gln Leu Gln Val Gln135 140 145gtttttttcc tacttactat gattatatac gttcaaagtc tgatttgtaa attacatcac 1787tcagatcatt aacttgattt actgcatgat gcag act tta gcc gtt atg aat ggt 1842Thr Leu Ala Val Met Asn Gly150tta ggc tta aac cct atg cga tta cca cag gtt cca cct cca act cat 1890Leu Gly Leu Asn Pro Met Arg Leu Pro Gln Val Pro Pro Pro Thr His155 160 165 170aca agg atc aat gag acc tta gag caa gac ctg aac cta gag act ctt 1938Thr Arg Ile Asn Glu Thr Leu Glu Gln Asp Leu Asn Leu Glu Thr Leu
175 180 185ctc gct gct cct cac tcg ctg gaa cca gct aaa aca agt caa gga atg 1986Leu Ala Ala Pro His Ser Leu Glu Pro Ala Lys Thr Ser Gln Gly Met190 195 200tgc ttt tcc aca gcc act ctg ctt tga agataacatt cagacaatga 2033Cys Phe Ser Thr Ala Thr Leu Leu205 210tgatgatcgg aattcctcta gtacctgcca gacaggagtg aacaatgttt tgagttttag 2093cattggccag atttctatgt tcagttatag ttatgctaat aagctttagg agtgaacaaa 2153atctgagtag tttgattata atgatgtctg aagcagatta tatataaaag actaatttac 2213ttacatatga gatgattatt acaactatca aatgactatg tctgtgagtt gcatccatcc 2273ataagcacac cggtctctac tacttcgagt gattgctgct gctgacttaa ccgcaggtct 2333tatcttcgtc attgctttct ctacttgaat tctcacgcca acatccatct gttatttcaa 2393atggtaccga taactttagg gatatagaca agacaaattg atattaataa tataacaagg 2453ttgtaaagta gaaacctttt ctaaagagca ttgtgtgtct aagatgtggc agaagtatga 2513cagttgcttg tacaagtctg cttcagtgta ctgtaaagtc aagagttagt ctgtgaagca 2573atagagagat aggagttata aggttgatga tggtatatac ctttcgtaag agggttccgt 2633tacagtt 2640<210>4<211>623<212>PRT<213>Arabidopsis thaliana<400>4Met Thr Asp Tyr Arg Leu Gln Pro Thr Met Asn Leu Trp Thr Thr Asp1 5 10 15Asp Asn Ala Ser Met Met Glu Ala Phe Met Ser Ser Ser Asp Ile Ser20 25 30Thr Leu Trp Pro Pro Ala Ser Thr Thr Thr Thr Thr Ala Thr Thr Glu35 40 45Thr Thr Pro Thr Pro Ala Met Glu Ile Pro Ala Gln Ala Gly Phe Asn50 55 60Gln Glu Thr Leu Gln Gln Arg Leu Gln Ala Leu Ile Glu Gly Thr His65 70 75 80Glu Gly Trp Thr Tyr Ala Ile Phe Trp Gln Pro Ser Tyr Asp Phe Ser85 90 95Gly Ala Ser Val Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu100 105 110Asp Lys Ala Asn Pro Arg Arg Arg Ser Ser Ser Pro Pro Phe Ser Thr115 120 125Pro Ala Asp Gln Glu Tyr Arg Lys Lys Val Leu Arg Glu Leu Asn Ser130 135 140Leu Ile Ser Gly Gly Val Ala Pro Ser Asp Asp Ala Val Asp Glu Glu145 150 155 160Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe165 170 175Ala Cys Gly Ala Gly Leu Ala Gly Lys Ala Phe Ala Thr Gly Asn Ala180 185 190Val Trp Val Ser Gly Ser Asp Gln Leu Ser Gly Ser Gly Cys Glu Arg195 200 205Ala Lys Gln Gly Gly Val Phe Gly Met His Thr Ile Ala Cys Ile Pro210 215 220Ser Ala Asn Gly Val Val Glu Val Gly Ser Thr Glu Pro Ile Arg Gln225 230 235 240Ser Ser Asp Leu Ile Asn Lys Val Arg Ile Leu Phe Asn Phe Asp Gly245 250 255Gly Asp Gly Asp Leu Ser Gly Leu Asn Trp Asn Leu Asp Pro Asp Gln260 265 270Gly Glu Asn Asp Pro Ser Met Trp Ile Asn Asp Pro Ile Gly Thr Pro275 280 285Gly Ser Asn Glu Pro Gly Asn Gly Ala Pro Ser Ser Ser Ser Gln Leu290 295 300Phe Ser Lys Ser Ile Gln Phe Glu Asn Gly Ser Ser Ser Thr Ile Thr305 310 315 320Glu Asn Pro Asn Leu Asp Pro Thr Pro Ser Pro Val His Ser Gln Thr325 330 335Gln Asn Pro Lys Phe Asn Asn Thr Phe Ser Arg Glu Leu Asn Phe Ser340 345 350Asp Val Lys Phe Tyr Phe Ser Glu Pro Arg Ser Gly Glu Ile Leu Asn355 360 365Phe Gly Asp Glu Gly Lys Arg Ser Ser Gly Asn Pro Asp Pro Ser Ser370 375 380Tyr Ser Gly Gln Thr Gln Phe Glu Asn Lys Arg Lys Arg Ser Met Val385 390 395 400Leu Asn Glu Asp Lys Val Leu Ser Phe Gly Asp Lys Thr Ala Gly Glu405 410 415Ser Asp His Ser Asp Leu Glu Ala Ser Val Val Lys Glu Val Ala Val420 425 430Glu Lys Arg Pro Lys Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu435 440 445Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu
450 455 460Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys465 470 475 480Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ala Tyr Ile Asn Glu485 490 495Leu Lys Ser Lys Val Val Lys Thr Glu Ser Glu Lys Leu Gln Ile Lys500 505 510Asn Gln Leu Glu Glu Val Lys Leu Glu Leu Ala Gly Arg Lys Ala Ser515 520 525Pro Ser Gly Gly Asp Met Ser Ser Ser Cys Ser Ser Ile Lys Pro Val530 535 540Gly Met Glu Ile Glu Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg545 550 555 560Val Glu Ser Ser Lys Arg Asn His Pro Ala Ala Arg Leu Met Ser Ala565 570 575Leu Met Asp Leu Glu Leu Glu Val Asn His Ala Ser Met Ser Val Val580 585 590Asn Asp Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly Phe Arg Ile595 600 605Tyr Thr Gln Asp Gln Leu Arg Ala Ser Leu Ile Ser Lys Ile Gly610 615 620<210>5<211>642<212>PRT<213>Phaseolus vulgaris<400>5Met Thr Glu Tyr Arg Ser Pro Pro Thr Met Asn Leu Trp Thr Asp Asp1 5 10 15Asn Ala Ser Val Met Glu Ala Phe Met Ser Ser Ser Asp Phe Ser Ser20 25 30Leu Trp Leu Pro Thr Pro Gln Ser Ala Ala Ser Thr Thr Thr Pro Gly35 40 45Ala Asp Thr Ala Arg Ala Leu Pro Pro Pro Pro Pro Ser Gln Ser Gln50 55 60Ser Leu Phe Asn Gln Glu Thr Leu Gln Gln Arg Leu Gln Thr Leu Ile65 70 75 80Glu Gly Ala Glu Glu Ser Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser85 90 95Tyr Asp Tyr Ser Ser Ser Thr Ser Leu Leu Gly Trp Gly Asp Gly Tyr100 105 110Tyr Lys Gly Glu Glu Asp Lys Gly Lys Gly Lys Ala Pro Lys Glu Met115 120 125Ser Ser Ala Glu Gln Asp His Arg Lys Lys Val Leu Arg Glu Leu Asn130 135 140Ser Leu Ile Ser Gly Pro Phe Arg Ser Ala Asp Asp Val Asp Glu Glu145 150 155 160Val Ser Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe165 170 175Leu Ser Gly Ser Gly Leu Pro Gly Gln Ala Phe Leu Asn Ser Ser Pro180 185 190Val Trp Val Ala Gly Ala Asp Arg Leu Ser Asp Ser Thr Ser Glu Arg195 200 205Ala Arg Gln Gly Gln Val Phe Gly Val Gln Thr Leu Val Cys Ile Pro210 215 220Ser Ala Asn Gly Val Val Glu Leu Ala Ser Thr Glu Val Ile Phe Gln225 230 235 240Asn Ser Asp Leu Met Lys Lys Val Arg Asp Leu Phe Asn Phe Asn Asn245 250 255Pro Asp Ala Gly Phe Trp Pro Leu Asn Gln Gly Glu Asn Asp Pro Ser260 265 270Ser Leu Trp Leu Asn Pro Ser Ser Ser Ile Glu Ile Lys Asp Thr Ser275 280 285Asn Ala Val Ala Leu Val Ser Ala Asn Ala Ser Leu Ser Lys Thr Met290 295 300Pro Phe Glu Thr Pro Gly Ser Ser Thr Leu Thr Glu Thr Pro Ser Ala305 310 315 320Ala Ala Ala Ala His Val Pro Asn Pro Lys Asn Gln Gly Phe Phe Pro325 330 335Arg Glu Leu Asn Phe Ser Asn Ser Leu Lys Pro Glu Ser Gly Glu Ile340 345 350Leu Ser Phe Gly Glu Ser Lys Lys Ser Ser Tyr Asn Gly Ser Tyr Phe355 360 365Pro Gly Val Ala Ala Glu Glu Thr Asn Lys Lys Arg Arg Ser Pro Ala370 375 380Ser Arg Ser Ser Ile Asp Asp Gly Met Leu Ser Phe Thr Ser Gly Val385 390 395 400Ile Ile Pre Ala Ser Asn Ile Lys Ser Gly Ala Val Ala Gly Gly Gly405 410 415Ala Ser Gly Gly Asp Ser Glu Asn Ser Asp Leu Glu Ala Ser Val Val420 425 430Lys Glu Ala Asp Ser Arg Val Val Glu Pro Glu Lys Arg Pro Arg Lys435 440 445Arg Gly Arg Lys Pro Gly Asn Gly Arg Glu Glu Pro Leu Asn His Val450 455 460Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala465 470 475 480Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu485 490 495Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser Lys Leu Ser500 505 510Glu Leu Glu Ser Glu Lys Gly Glu Leu Glu Lys Gln Leu Glu Leu Val515 520 525Lys Lys Glu Leu Glu Leu Ala Thr Lys Ser Pro Ser Pro Pro Pro Gly530 535 540Pro Pro Pro Ser Asn Lys Glu Ala Lys Glu Thr Thr Ser Lys Leu Ile545 550 555 560Asp Leu Glu Leu Glu Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg565 570 575Ile Gln Cys Ser Lys Lys Asn His Pro Ala Ala Arg Leu Met Ala Ala580 585 590Leu Lys Glu Leu Asp Leu Asp Val Asn His Ala Ser Val Ser Val Val595 600 605Asn Asp Leu Met Ile Gln Gln Ala Thr Val Asn Met Gly Asn Arg Phe610 615 620Tyr Thr Gln Glu Gln Leu Arg Ser Ala Arg Ser Ser Lys Ile Gly Asn625 630 635 640Ala Leu<210>6<211>610<212>PRT<213>Zea mays<400>6Met Ala Leu Ser Ala Ser Arg Val Gln Gln Ala Glu Glu Leu Leu Gln1 5 10 15Arg Pro Ala Glu Arg Gln Leu Met Arg Ser Gln Leu Ala Ala Ala Ala20 25 30Arg Ser Ile Asn Trp Ser Tyr Ala Leu Phe Trp Ser Ile Ser Asp Thr35 40 45Gln Pro Gly Val Leu Thr Trp Thr Asp Gly Phe Tyr Asn Gly Glu Val50 55 60Lys Thr Arg Lys Ile Ser Asn Ser Val Glu Leu Thr Ser Asp Gln Leu65 70 75 80Val Met Gln Arg Ser Asp Gln Leu Arg Glu Leu Tyr Glu Ala Leu Leu
85 90 95Ser Gly Glu Gly Asp Arg Arg Ala Ala Pro Ala Arg Pro Ala Gly Ser100 105 110Leu Ser Pro Glu Asp Leu Gly Asp Thr Glu Trp Tyr Tyr Val Val Ser115 120 125Met Thr Tyr Ala Phe Arg Pro Gly Gln Gly Leu Pro Gly Arg Ser Phe130 135 140Ala Ser Asp Glu His Val Trp Leu Cys Asn Ala His Leu Ala Gly Ser145 150 155 160Lys Ala Phe Pro Arg Ala Leu Leu Ala Lys Ser Ala Ser Ile Gln Ser165 170 175Ile Leu Cys Ile Pro Val Met Gly Gly Val Leu Glu Leu Gly Thr Thr180 185 190Asp Thr Val Pro Glu Ala Pro Asp Leu Val Ser Arg Ala Thr Ala Ala195 200 205Phe Trp Glu Pro Gln Cys Pro Ser Ser Ser Pro Ser Gly Arg Ala Asn210 215 220Glu Thr Gly Glu Ala Ala Ala Asp Asp Gly Thr Phe Ala Phe Glu Glu225 230 235 240Leu Asp His Asn Asn Gly Met Asp Asp Ile Glu Ala Met Thr Ala Ala245 250 255Gly Gly His Gly Gln Glu Glu Glu Leu Arg Leu Arg Glu Ala Glu Ala260 265 270Leu Ser Asp Asp Ala Ser Leu Glu His Ile Thr Lys Glu Ile Glu Glu275 280 285Phe Tyr Ser Leu Cys Asp Glu Met Asp Leu Gln Ala Leu Pro Leu Pro290 295 300Leu Glu Asp Gly Trp Thr Val Asp Ala Ser Asn Phe Glu Val Pro Cys305 310 315 320Ser Ser Pro Gln Pro Ala Pro Pro Pro Val Asp Arg Ala Thr Ala Asn325 330 335Val Ala Ala Asp Ala Ser Arg Ala Pro Val Tyr Gly Ser Arg Ala Thr340 345 350Ser Phe Met Ala Trp Thr Arg Ser Ser Gln Gln Ser Ser Cys Ser Asp355 360 365Asp Ala Ala Pro Ala Ala Val Val Pro Ala Ile Glu Glu Pro Gln Arg370 375 380Leu Leu Lys Lys Val Val Ala Gly Gly Gly Ala Trp Glu Ser Cys Gly385 390 395 400Gly Ala Thr Gly Ala Ala Gln Glu Met Ser Gly Thr Gly Thr Lys Asn405 410 415His Val Met Ser Glu Arg Lys Arg Arg Glu Lys Leu Asn Glu Met Phe420 425 430Leu Val Leu Lys Ser Leu Leu Pro Ser Ile His Arg Val Asn Lys Ala435 440 445Ser Ile Leu Ala Glu Thr Ile Ala Tyr Leu Lys Glu Leu Gln Arg Arg450 455 460Val Gln Glu Leu Glu Ser Ser Arg Glu Pro Ala Ser Arg Pro Ser Glu465 470 475 480Thr Thr Thr Arg Leu Ile Thr Arg Pro Ser Arg Gly Asn Asn Glu Ser485 490 495Val Arg Lys Glu Val Cys Ala Gly Ser Lys Arg Lys Ser Pro Glu Leu500 505 510Gly Arg Asp Asp Val Glu Arg Pro Pro Val Leu Thr Met Asp Ala Gly515 520 525Thr Ser Asn Val Thr Val Thr Val Ser Asp Lys Asp Val Leu Leu Glu530 535 540Val Gln Cys Arg Trp Glu Glu Leu Leu Met Thr Arg Val Phe Asp Ala545 550 555 560Ile Lys Ser Leu His Leu Asp Val Leu Ser Val Gln Ala Ser Ala Pro565 570 575Asp Gly Phe Met Gly Leu Lys Ile Arg Ala Gln Phe Ala Gly Ser Gly580 585 590Ala Val Val Pro Trp Met Ile Ser Glu Ala Leu Arg Lys Ala Ile Gly595 600 605Lys Arg610<210>7<211>562<212>PRT<213>Zea mays<400>7Met Ala Leu Ser Ala Ser Pro Ala Gln Glu Glu Leu Leu Gln Pro Ala1 5 10 15Gly Arg Pro Leu Arg Lys Gln Leu Ala Ala Ala Ala Arg Ser Ile Asn20 25 30Trp Ser Tyr Ala Leu Phe Trp Ser Ile Ser Ser Thr Gln Arg Pro Arg35 40 45Val Leu Thr Trp Thr Asp Gly Phe Tyr Asn Gly Glu Val Lys Thr Arg50 55 60Lys Ile Ser His Ser Val Glu Leu Thr Ala Asp Gln Leu Leu Met Gln65 70 75 80Arg Ser Glu Gln Leu Arg Glu Leu Tyr Glu Ala Leu Arg Ser Gly Glu85 90 95Cys Asp Arg Arg Gly Ala Arg Pro Val Gly Ser Leu Ser Pro Glu Asp100 105 110Leu Gly Asp Thr Glu Trp Tyr Tyr Val Ile Cys Met Thr Tyr Ala Phe115 120 125Leu Pro Gly Gln Gly Leu Pro Gly Arg Ser Ser Ala Ser Asn Glu His130 135 140Val Trp Leu Cys Asn Ala His Leu Ala Gly Ser Lys Asp Phe Pro Arg145 150 155 160Ala Leu Leu Ala Lys Ser Ala Ser Ile Gln Thr Ile Val Cys Ile Pro165 170 175Leu Met Gly Gly Val Leu Glu Leu Gly Thr Thr Asp Lys Val Pro Glu180 185 190Asp Pro Asp Leu Val Ser Arg Ala Thr Val Ala Phe Trp Glu Pro Gln195 200 205Cys Pro Thr Tyr Ser Lys Glu Pro Ser Ser Asn Pro Ser Ala Tyr Glu210 215 220Thr Gly Glu Ala Ala Tyr Ile Val Val Leu Glu Asp Leu Asp His Asn225 230 235 240Ala Met Asp Met Glu Thr Val Thr Ala Ala Ala Gly Arg His Gly Thr245 250 255Gly Gln Glu Leu Gly Glu Val Glu Ser Pro Ser Asn Ala Ser Leu Glu260 265 270His Ile Thr Lys Gly Ile Asp Glu Phe Tyr Ser Leu Cys Glu Glu Met275 280 285Asp Val Gln Pro Leu Glu Asp Ala Trp Ile Met Asp Gly Ser Asn Phe290 295 300Glu Val Pro Ser Ser Ala Leu Pro Val Asp Gly Ser Ser Ala Pro Ala305 310 315 320Asp Gly Ser Arg Ala Thr Ser Phe Val Val Trp Thr Arg Ser Ser His325 330 335Ser Cys Ser Gly Glu Ala Ala Val Pro Val Ile Glu Glu Pro Gln Lys340 345 350Leu Leu Lys Lys Ala Leu Ala Gly Gly Gly Ala Trp Ala Asn Thr Asn355 360 365Cys Gly Gly Gly Gly Thr Thr Val Thr Ala Gln Glu Asn Gly Ala Lys370 375 380Asn His Val Met Ser Glu Arg Lys Arg Arg Glu Lys Leu Asn Glu Met385 390 395 400Phe Leu Val Leu Lys Ser Leu Val Pro Ser Ile His Lys Val Asp Lys405 410 415Ala Ser Ile Leu Ala Glu Thr Ile Ala Tyr Leu Lys Glu Leu Gln Arg420 425 430Arg Val Gln Glu Leu Glu Ser Arg Arg Gln Gly Gly Ser Gly Cys Val
435 440 445Ser Lys Lys Val Cys Val Gly Ser Asn Ser Lys Arg Lys Ser Pro Glu450 455 460Phe Ala Gly Gly Ala Lys Glu His Pro Trp Val Leu Pro Met Asp Gly465 470 475 480Thr Ser Asn Val Thr Val Thr Val Ser Asp Thr Asn Val Leu Leu Glu485 490 495Val Gln Cys Arg Trp Glu Lys Leu Leu Met Thr Arg Val Phe Asp Ala500 505 510Ile Lys Ser Leu His Leu Asp Ala Leu Ser Val Gln Ala Ser Ala Pro515 520 525Asp Gly Phe Met Arg Leu Lys Ile Gly Ala Gln Phe Ala Gly Ser Gly530 535 540Ala Val Val Pro Gly Met Ile Ser Gln Ser Leu Arg Lys Ala Ile Gly545 550 555 560Lys Arg<210>8<211>22<212>DNA<213>Arabidopsis thaliana<400>8gaagaggagg agcaagatca ac22<210>9<211>14<212>DNA<213>Arabidopsis thaliana<400>9gaagaggagg acct 14<210>10<211>17<212>DNA<213>Arabidopsis thaliana<400>10agaggagcaa gatcaac 17<210>11<211>31<212>DNA<213>Arabidopsis thaliana<400>11gaagaggagg accttaagga gcaagatcaa c 31<210>12<211>32<212>DNA<213>Arabidopsis thaliana<400>12gaggaggagg acctctgagg agcaagatca ac 32<210>13<211>51<212>DNA<213>Arabidopsis thaliana<400>13aagagaaaca ttgatgctca attccacaac ttgtctgaaa agaagaggag g51<210>14<211>24<212>DNA<213>Arabidopsis thaliana<400>14gaagaggaag acgatgaaga ggat 24<210>15<211>904<212>DNA<213>Arabidopsis thaliana<220><221>CDS<222>(23)..(625)<400>15agagagagag agagagagag ag atg ggt gat tct gac gtc ggt gat cgt ctt52Met Gly Asp Ser Asp Val Gly Asp Arg Leu1 5 10ccc cct cca tct tct tcc gac gaa ctc tcg agc ttt ctc cga cag att100Pro Pro Pro Ser Ser Ser Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile15 20 25ctt tcc cgt act cct aca gct caa cct tct tca cca ccg aag agt act148Leu Ser Arg Thr Pro Thr Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr30 35 40aat gtt tcc tcc gct gag acc ttc ttc cct tcc gtt tcc ggc gga gct196Asn Val Ser Ser Ala Glu Thr Phe Phe Pro Ser Val Ser Gly Gly Ala45 50 55gtt tct tcc gtc ggt tat gga gtc tct gaa act ggc caa gac aaa tat244Val Ser Ser Val Gly Tyr Gly Val Ser Glu Thr Gly Gln Asp Lys Tyr60 65 70gct ttc gaa cac aag aga agt gga gct aaa cag aga aat tcg ttg gaa292Ala Phe Glu His Lys Arg Ser Gly Ala Lys Gln Arg Asn Ser Leu Glu75 80 85 90gag gaa gac gat gaa gag gat agc aag atc aac gag aaa atg aaa gct340Glu Glu Asp Asp Glu Glu Asp Ser Lys Ile Asn Glu Lys Met Lys Ala95 100 105ttg cag aaa ctc att ccc aat tcc aac aag act gat aaa gcc tca atg388Leu Gln Lys Leu Ile Pro Asn Ser Asn Lys Thr Asp Lys Ala Ser Met110 115 120ctt gat gaa gct ata gaa tat ctg aag cag ctt caa ctt caa gtc cag436Leu Asp Glu Ala Ile Glu Tyr Leu Lys Gln Leu Gln Leu Gln Val Gln125 130 135act tta gcc gtt atg aat ggt tta ggc tta aac cct atg cga tta cca484Thr Leu Ala Val Met Asn Gly Leu Gly Leu Asn Pro Met Arg Leu Pro140 145 150cag gtt cca cct cca act cat aca agg atc aat gag acc tta gag caa532Gln Val Pro Pro Pro Thr His Thr Arg Ile Asn Glu Thr Leu Glu Gln155 160 165 170gac ctg aac cta gag act ctt ctc gct gct cct cac tcg ctg gaa cca580Asp Leu Asn Leu Glu Thr Leu Leu Ala Ala Pro His Ser Leu Glu Pro175 180 185gct aaa aca agt caa gga atg tgc ttt tcc aca gcc act ctg ctt625Ala Lys Thr Ser Gln Gly Met Cys Phe Ser Thr Ala Thr Leu Leu190 195 200tgaagataac attcagacaa tgatgatgat cggaattcct ctagtacctg ccagacagga 685gtgaacaatg ttttgagttt tagcattggc cagatttcta tgttcagtta tagttatgct 745aataagcttt aggagtgaac aaaatctgag tagtttgatt ataatgatgt ctgaagcaga 805ttatatataa aagactaatt tacttacata tgagatgatt attacaacta tcaaatgact 865atgtctgtga gttgcatcca aaaaaaaaaa aaaaaaaaa 904<210>16<211>201<212>PRT<213>Arabidopsis thaliana<400>16Met Gly Asp Ser Asp Val Gly Asp Arg Leu Pro Pro Pro Ser Ser Ser1 5 10 15Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile Leu Ser Arg Thr Pro Thr20 25 30Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr Asn Val Ser Ser Ala Glu35 40 45Thr Phe Phe Pro Ser Val Ser Gly Gly Ala Val Ser Ser Val Gly Tyr50 55 60Gly Val Ser Glu Thr Gly Gln Asp Lys Tyr Ala Phe Glu His Lys Arg65 70 75 80Ser Gly Ala Lys Gln Arg Asn Ser Leu Glu Glu Glu Asp Asp Glu Glu85 90 95Asp Ser Lys Ile Asn Glu Lys Met Lys Ala Leu Gln Lys Leu Ile Pro100 105 110Asn Ser Asn Lys Thr Asp Lys Ala Ser Met Leu Asp Glu Ala Ile Glu115 120 125Tyr Leu Lys Gln Leu Gln Leu Gln Val Gln Thr Leu Ala Val Met Asn130 135 140Gly Leu Gly Leu Asn Pro Met Arg Leu Pro Gln Val Pro Pro Pro Thr145 150 155 160His Thr Arg Ile Asn Glu Thr Leu Glu Gln Asp Leu Asn Leu Glu Thr165 170 175Leu Leu Ala Ala Pro His Ser Leu Glu Pro Ala Lys Thr Ser Gln Gly
180 185 190Met Cys Phe Ser Thr Ala Thr Leu Leu195 200
權(quán)利要求
1.一種包含一種核酸或其互補(bǔ)序列的分離的DNA,所述核酸包含一個(gè)核苷酸序列,所述核苷酸序列編碼(a)包含SEQ ID NO2所示氨基酸序列的SGT10166;或(b)包含與SEQ ID NO2所示氨基酸序列具有至少90%相同性的氨基酸序列的蛋白質(zhì)。
2.權(quán)利要求1的分離的DNA,其中所述核酸包含(a)SEQ ID NO1所示核苷酸序列或其互補(bǔ)序列,或(b)包含SEQ ID NO1所示23-654位核苷酸的核苷酸序列或其互補(bǔ)序列。
3.權(quán)利要求1或2的分離的DNA,其中所述核酸包含一個(gè)核苷酸序列,所述核苷酸序列與以下序列具有至少90%相同性(a)SEQID NO1所示核苷酸序列或其互補(bǔ)序列,或(b)包含SEQ ID NO1所示序列的23-654位核苷酸的核苷酸序列或其互補(bǔ)序列。
4.一種分離的DNA,其包含一種核酸或其互補(bǔ)序列,所述核酸包含一種編碼與包含SEQ ID NO2所示氨基酸序列的野生型SGT10166蛋白相比突變的SGT10166蛋白的核苷酸序列,其中所述突變的SGT10166蛋白產(chǎn)生不裂表型。
5.一種包含一種核酸的分離的DNA,所述核酸包含SGT10166調(diào)節(jié)序列。
6.權(quán)利要求5的分離的DNA,其中所述核酸包含SGT10166內(nèi)含子。
7.權(quán)利要求5或6的分離的DNA,其中所述核酸包含一種包含SEQ ID NO3的260-371位核苷酸的核苷酸序列或其互補(bǔ)序列或其提供果實(shí)組織特異性的片段。
8.權(quán)利要求5-7任一項(xiàng)的分離的DNA,其中所述核酸包含一個(gè)SGT10166啟動(dòng)子。
9.權(quán)利要求5-8任一項(xiàng)的分離的DNA,其中所述核酸包含一個(gè)SGT10166終止序列。
10.一種DNA分子,其包含第一種核酸,所述核酸包含一異源啟動(dòng)子以及與該啟動(dòng)子可操縱地連接的前述任一項(xiàng)權(quán)利要求所述的分離的DNA或其能改變植物成熟果實(shí)的開裂的片段。
11.權(quán)利要求10的DNA分子,其中所述開裂是通過反義機(jī)制改變的。
12.權(quán)利要求10或11的DNA分子,其中所述開裂是通過有義抑制機(jī)制改變的。
13.一種包含權(quán)利要求1-9任一項(xiàng)的分離的DNA的載體。
14.一種轉(zhuǎn)化的植物細(xì)胞,其包含權(quán)利要求1-9任一項(xiàng)的分離的DNA或其能改變植物成熟果實(shí)的開裂的片段。
15.一種轉(zhuǎn)化的植物,其包含權(quán)利要求1-9任一項(xiàng)的分離的DNA或其能改變植物成熟果實(shí)的開裂的片段。
16.一種轉(zhuǎn)化的植物,其包含權(quán)利要求10-12任一項(xiàng)的分離的DNA或其能改變植物成熟果實(shí)的開裂的片段。
17.權(quán)利要求15或16的轉(zhuǎn)化的植物,其是一種產(chǎn)生種莢的植物。
18.權(quán)利要求15,16或17的轉(zhuǎn)化的植物,還包含一種核酸,所述核酸包含一個(gè)誘導(dǎo)型啟動(dòng)子,以及與該啟動(dòng)子可操縱地相連的第三種核苷酸序列,所述核苷酸序列編碼一種滅活致死基因或其產(chǎn)物的工具。
19.一種分離的多肽,包含SEQ ID NO2所示氨基酸序列。
20.一種產(chǎn)生不裂轉(zhuǎn)基因植物的方法,包含用權(quán)利要求10-12任一項(xiàng)的DNA分子轉(zhuǎn)化植物細(xì)胞,選擇含有所述DNA分子的轉(zhuǎn)化的植物細(xì)胞,并從轉(zhuǎn)化的植物細(xì)胞再生所述不裂轉(zhuǎn)基因植物。
21.一種DNA分子,其包含第一種核酸,所述核酸包含可操縱地連于第二種異源核酸的權(quán)利要求1-9任一項(xiàng)的分離的DNA。
22.權(quán)利要求21的DNA分子,其中所述第二種核酸是反義DNA。
23.權(quán)利要求22或23的DNA分子,其中所述第二種核酸能授與植物以選定的農(nóng)學(xué)性狀。
24.一種包含權(quán)利要求10-12和21-23任一項(xiàng)的DNA分子的載體。
25.一種轉(zhuǎn)化的植物細(xì)胞,其含有權(quán)利要求1-9任一項(xiàng)的分離的DNA。
26.一種轉(zhuǎn)化的植物細(xì)胞,其含有權(quán)利要求10-12和21-23任一項(xiàng)的DNA分子。
27.一種轉(zhuǎn)化的植物,其包含權(quán)利要求1-9任一項(xiàng)的分離的DNA。
28.一種轉(zhuǎn)化的植物,其包含權(quán)利要求10-12和21-23任一項(xiàng)的DNA分子。
全文摘要
本發(fā)明涉及防止種子通過開裂過程(種莢散開)而擴(kuò)散從而導(dǎo)致收獲作物時(shí)種子大量損失的方法。我們已鑒別和鑒定了擬南芥(Arabidopsis thaliana)中的SGT10166基因以及防止成熟果實(shí)的開裂的該基因的突變。發(fā)現(xiàn)所述基因編碼的蛋白質(zhì)與堿性螺旋-環(huán)-螺旋類轉(zhuǎn)錄因子類似。該基因的表達(dá)模式和突變植物的表型揭示其在使長角果開裂中的可能作用。
文檔編號(hào)C07K14/415GK1401002SQ01804857
公開日2003年3月5日 申請(qǐng)日期2001年2月1日 優(yōu)先權(quán)日2000年2月11日
發(fā)明者文卡特?!O達(dá)雷桑, 薩羅賈姆·拉亞尼 申請(qǐng)人:分子農(nóng)業(yè)生物學(xué)院