專利名稱::人工植物微染色體的制作方法人工植物微染色體發(fā)明領域本發(fā)明涉及植物生物工程領域,具體地講,涉及人工微染色體以及在植物中制備這類微染色體的方法。
背景技術:
:目前在染色體工程上的進展使得改變植物基因組成為可能,因此可改變其表型。當轉(zhuǎn)基因整合到植物基因組時,通常是以隨機方式,而且拷貝數(shù)無法預知。因此,研究工作直接針對更好地控制轉(zhuǎn)基因整合。如果有這樣的需要,研究人員想知道答案是否在于使用人工微染色體。它們是由順式作用(cis-acting)DNA序列元件構(gòu)建的人工制備的線狀或環(huán)狀DNA分子,所述序列元件可提供所構(gòu)建微染色體的復制和分配。據(jù)信,人工染色體的產(chǎn)生將會減少或消除與隨機基因組整合到天然植物染色體相關的問題,例如因轉(zhuǎn)基因與宿主植物基因組材料結(jié)合而造成的連鎖拖曳(linkagedmg)。人工染色體也可提供比標準轉(zhuǎn)化載體多10-100倍的基因的遞送方法,并提供大染色體區(qū)段,用于互補和/或基于圖譜的克隆。對于人工染色體復制、穩(wěn)定性和維持/遺傳,已經(jīng)鑒定出3種組分(i)作為復制起點的自主復制序列;(ii)起到穩(wěn)定和維持線狀染色體末端作用的端粒,(iii)作為動粒裝配位點的著絲粒,用于有絲分裂和減數(shù)分裂中染色體的適當分離。來自單細胞生物(例如酵母)的分離著絲粒在高等真核生物中不起作用。美國專利5,270,201(1993年12月14日授予Richards等人)描述4了基于端粒和任選著絲粒的植物人工染色體。美國專利7,119,250(2006年10月10日授予Luo等人)描述了植物著絲粒的組成。美國專利7,132,240(2006年11月7日授予Richards等人)描述了從任何生物的著絲粒中有效分離曱基化著絲粒DNA的可行方法。美國專利入193,U8(2007年3月20日授予Copenhaver等人)描述了用植物著絲粒的核酸序列來產(chǎn)生或增加作物收益的方法。2007年3月15日公布的公布號為WO2007/030510的PCT申請描述了用自主微染色體轉(zhuǎn)化植物的制備方法。發(fā)明概述本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其包含(a)至少2個反向CentC串聯(lián)重復序列陣列,其中第1陣列包含至少50個拷貝的CentC,第2陣列包含至少50個拷貝的CentC;和(b)至少一個拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于第1陣列和第2陣列之間。在第2個實施方案中,本發(fā)明的人工植物微染色體包含選自CentA、CRM1和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。在第3個實施方案中,本發(fā)明的人工植物微染色體還包含至少一個功能性端粒。在第4個實施方案中,人工植物微染色體所包含的功能性著絲粒與著絲粒蛋白C(CENPC)特異性結(jié)合。在第5個實施方案中,玉米植物(complant)可包含任何本發(fā)明的人工微染色體。在第6個實施方案中,本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其中著絲粒與著絲粒蛋白C(CENPC)特異性結(jié)合。在第7個實施方案中,本發(fā)明涉及分離的多核苷酸,其包含(a)至少2個反向CentC串聯(lián)重復序列陣列,其中第1陣列包含至少105個拷貝的CentC,第2陣列包含至少10個拷貝的CentC;和(b)至少一個拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于第1陣列和第2陣列之間。在第8個實施方案中,本發(fā)明的分離多核苦酸包含選自CentA、CRM1和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。在第9個實施方案中,本發(fā)明涉及分離的多核苷酸,其包含(a)至少一個CentC串聯(lián)重復序列陣列,該陣列包含至少10個拷貝的CentC;和(b)至少一個拷貝的選自CentA、CRM1和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。在第IO個實施方案中,本發(fā)明涉及分離的多核苷酸,其包含(a)至少一個CentC串聯(lián)重復序列陣列,該陣列包含至少IO個拷貝的CentC;和(b)CentA、CRM1和CRM2各自至少一個拷貝。在第11個實施方案中,本發(fā)明涉及重組構(gòu)建體以及包含這類重組構(gòu)建體的轉(zhuǎn)基因玉米植物,所述構(gòu)建體包含本發(fā)明的分離多核苷酸。在第12個實施方案中,本發(fā)明涉及包含具有功能性著絲粒的人工植物微染色體的轉(zhuǎn)基因玉米植物的制備方法,所述方法包括(a)使至少一個玉米植物細胞與包含本發(fā)明重組構(gòu)建體的混合物接觸;(b)鑒定來自步驟(a)并包含具有功能性著絲粒的人工植物微染色體的至少一個玉米植物細月包;和(c)使來自步驟(b)的玉米植物細胞再生出能育的玉米植物,其中所述玉米植物包含具有功能性著絲粒的人工植物微染色體。所述混合物還可包含編碼用于刺激細胞生長的多肽的多核苷酸,其中該多肽選自wuschel、babyboom、RepA或Lecl。附圖簡述本專利或申請文件包括至少一幅彩色附圖。如有需要并支付必要費用后,專利辦公室將會提供帶彩圖的本專利或?qū)@暾埞颊f明書副本。根據(jù)作為本申請組成部分的以下詳述和附圖及序列表,可以更全面地理解本發(fā)明。圖1.來自Hi-II轉(zhuǎn)化CMC3庫1事件#14的玉米胚胎發(fā)生愈傷組織(embryogeniccalli)的有絲分裂染色體鋪片(spread)的熒光原位雜交(FISH)。愈傷組織源自用Tn5-3改型(retrofit)的線性化BAC克隆庫1轉(zhuǎn)化的未成熟胚。前中期(左)和中期(右)核都顯示出20條天然染色體和1條微染色體(箭頭和插圖)。這兩種微染色體對CentC(綠色一顏色;白色一灰度)著絲粒特異性重復序列和對轉(zhuǎn)化構(gòu)建體具有特異性的獨特標記探針23715(紅色一顏色;白色一灰度)都呈陽性,其中CentC和23715基本上共同定位(colocalize)于微染色體(插圖)。圖2.來自Hi-II轉(zhuǎn)化CMC3庫1事件#14的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫1轉(zhuǎn)化的未成熟胚。圖A顯示中期核,顯示出20條天然染色體和2條微染色體(方框)。這兩種微染色體對CentC(綠色一顏色;白色一灰度)著絲粒特異性重復序列和對轉(zhuǎn)化構(gòu)建體具有特異性的獨特標記探針23715(紅色一顏色;白色一灰度)都呈陽性。圖B-D是該方框的更高放大倍數(shù)圖,顯示出微染色體(箭頭),其中B-僅DAPI;C-DAPI+23715撰:夸卜(紅色一顏色;白色一灰度);和D-DAPI+CentC探針(綠色一顏色;白色一灰度)。圖3.來自Hi-II轉(zhuǎn)化CMC3庫1事件#14的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的免疫熒光。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫1轉(zhuǎn)化的未成熟胚。圖A顯示中期核,顯示出20條天然染色體和1條4敖染色體(箭頭)。天然染色體和微染色體的所有著絲粒對著絲粒蛋白C(即CENPC,一種著絲粒/動粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B-C是微染色體的更高放大倍數(shù)圖,其中B畫僅DAPI;和C-DAPI+CENPC(紅色一顏色;白色一7灰度)。CENPC的形態(tài)和免疫學定位表明,微染色體由各自具有功能性著絲粒的兩條姊妹染色單體組成。圖4.圖A-來自Hi-II轉(zhuǎn)化CMC3庫1事件#14的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的免疫萸光。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫1轉(zhuǎn)化的未成熟胚。在分裂后期觀察到天然染色體和微染色體(方框)的姊妹染色單體分離。天然染色體和微染色體的所有著絲粒對著絲粒蛋白C(即CENPC,—種著絲粒/動粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B是A中方框的更高放大倍數(shù)圖,顯示出微染色體姊妹染色單體的分離(雙箭頭),表明微染色體同正常染色體一樣,在有絲分裂中可以分離。圖5.來自Hi-II轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。顯示了四-非整倍體(tetra-aneuploid)(39條染色體,缺乏1個拷貝的染色體6)中期核,顯示出天然染色體和1條微染色體(箭頭)。微染色體對CentC(綠色一顏色;白色一灰度)著絲粒特異性重復序列和對轉(zhuǎn)化構(gòu)建體具有特異性的獨特標記探針23715(紅色一顏色;白色一灰度)都呈陽性。圖B-D是方框區(qū)的更高放大倍數(shù)圖,顯示出微染色體(箭頭)和天然染色體,其中A-僅DAPI;B誦DAPI+CentC探針(綠色一顏色;白色一灰度);和D-DAPI+23715探針(紅色一顏色;白色一灰度)。如微染色體的FISH染色所示,CentC重復序列的兩極定位表明它是由兩條姊妹染色單體組成,這與天然染色體中所觀察的一樣。圖6.來自Hi-II轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。圖A-四-非整倍體(39條染色體,缺乏l個拷貝的染色體6)中期核,顯示出天然染色體和2條^f鼓染色體(箭頭)。微染色體對CentC(綠色一顏色;白色一灰度)著絲粒特異性重復序列和對轉(zhuǎn)化構(gòu)建體具有特異性的獨特標記探針23715(紅色一顏色;白色一灰度)都呈陽性。圖B是2條微染色體的更高放大倍數(shù)圖,顯示出CentC重復序列和獨特標記23715的豐度的變化。圖7.來自Hi-II轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。圖A-四-非整倍體(39條染色體,缺乏1個拷貝的染色體6)核,顯示出在早后期天然染色體和2條樣t染色體(方框)的姊妹染色單體的分離。2條微染色體的姊妹染色單體對CentC(綠色一顏色;白色一灰度)著絲粒特異性重復序列和對轉(zhuǎn)化構(gòu)建體具有特異性的獨特標記探針23715(紅色一顏色;白色一灰度)都呈陽性。圖B-C是2條微染色體(雙箭頭)的更高放大倍數(shù)圖,顯示出B-DAPI+CentC探針(綠色一顏色;白色一灰度);和C-DAPI+23715探針(紅色一顏色;白色一灰度)。在后期,微染色體姊妹染色單體的分離表明,功能性著絲粒的存在允許在有絲分裂期間進行分離。圖8.來自Hi-II轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的免疫熒光。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。圖A表明四-非整倍體(39條染色體,缺乏1個拷貝的染色體6)中期核,顯示出39條天然染色體和2條微染色體(箭頭)。天然染色體和微染色體的所有著絲粒對著絲粒蛋白C(即CENPC,—種著絲粒/動粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B-C是微染色體的更高放大倍數(shù)圖。CENPC免疫學定位模式(每條微染色體2次聚焦)表明,微染色體由兩條姊妹染色單體組成,而且各自具有能形成動粒復合物的功能性著絲粒。圖9.來自Hi-II玉米轉(zhuǎn)化事件的再生植物根尖的有絲分裂染色體鋪片的FISH。植物源自用Tn5-3改型的線性化bacm.pkl28.j21轉(zhuǎn)化的未成熟胚。圖A顯示非整倍體中期核,顯示出19條天然染色體和1條微染色體(箭頭)。微染色體對CentC(綠色一顏色;白色一灰度)著絲粒特異性重復序列和對轉(zhuǎn)化構(gòu)建體具有特異性的獨特標記揮:針23715(紅色一顏色;白色一灰度)呈陽性。圖B-D是^f敫染色體的更高放大倍數(shù)圖,其中B-僅DAPI;C誦DAPI+CentC探針(綠色一顏色;白色一灰度);和D-DAPI+23715探針(紅色一顏色;白色一灰度)。圖10.來自Hi-II玉米轉(zhuǎn)化事件的再生植物根尖的有絲分裂染色體鋪片的免疫熒光。;f直物源自用Tn5-3改型的線性化bacm.pkl28.j21轉(zhuǎn)化的未成熟胚。圖A顯示非整倍體中期核,顯示出19條天然染色體和1條微染色體(箭頭)。天然染色體和微染色體的所有著絲粒對著絲粒蛋白C(即CENPC,一種著絲粒/動粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B-C是微染色體的更高放大倍數(shù)圖,其中B畫僅DAPI;和C畫DAPI+CENPC。CENPC免疫學定位模式(每條微染色體2次聚焦)表明,微染色體由兩條姊妹染色單體組成,而且各自具有能形成動粒復合物的功能性著絲粒。圖11.經(jīng)纖維-FISH顯示的玉米著絲粒精細結(jié)構(gòu)。4個著絲粒重復序列CentC(綠色一顏色;白色一灰度)以及CentA、CRM1和CRM2的總和(紅色一顏色;灰色一灰度)用于含單條玉米染色體的燕麥-玉米附加系(additionline)的伸展DNA纖維的多色FISH。這顯示了長達百萬石咸基的雜交延伸,這對每條染色體都是唯一的。圖12.玉米著絲粒模型。著絲粒的組成用玉米著絲粒重復序列名稱來表示。CentC的連續(xù)陣列可由成百上千個重復元件組成。其它玉米著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座元件(例如CentA、CRM1和/或CRM2)可整合到CentC陣列中,在彼此之間和/或在著絲粒區(qū)中。除了著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子以外,其它反轉(zhuǎn)錄轉(zhuǎn)座子可整合在陣列中,整合到元件(例如CentA、CentC、CRM1和CRM2)中和/或整合而形成中斷CentC串聯(lián)重復序列陣列的插入序列。該圖表示玉米CentC元件(箭頭)的一個組成模型,構(gòu)成2組頭尾串聯(lián)的重復序列??砂l(fā)現(xiàn)相反方向的CentC陣列,形成著絲粒DNA的大區(qū)段。減數(shù)分裂后期染色體的纖維-FISH和FISH以及克隆著絲粒DNA區(qū)段的斑點雜交分析表明,具有高密度的所有4個著絲粒重復序列(CentC、CRMl、CentA和CRM2)的區(qū)域都參與了動粒的形成。10圖13.BAC克隆的改型和體外轉(zhuǎn)化到線狀人工微染色體中。BAC克隆DNA用定制的轉(zhuǎn)座子Tn5-3改型,所述轉(zhuǎn)座子Tn5-3包含氨節(jié)青霉素抗性基因(APT),復制起點(ori),選擇標記(MO-PAT)和可見標記(DS-RED2)標記(處于泛蛋白啟動子(UBI1ZMPRO)之下),被卡那霉素抗性gen(KANr)基因分開的處于反向的端粒序列(TEL),以及歸巢限制酶I-尸/o1、I-CewI和PKSbeI的位點。ME位于轉(zhuǎn)座子嵌合末端。用歸巢限制酶I-CewI消化BAC構(gòu)建體,將環(huán)狀BAC轉(zhuǎn)化為鄰接端粒序列的線狀DNA分子。圖14.對于來自CMC3庫1事件#14的愈傷組織中期核,探測著絲粒和端粒元件。用熒光標記探針,對著絲粒特異性CentC重復序列(綠色一顏色;白色一灰度)和端粒特異性telo-31重復序列(紅色一顏色;白色一灰度)進行FISH分析。標明這些探針的定位,用于天然染色體,CentC用星號0)標明,telo-31用雙箭頭標明。圖B-E顯示微染色體的更高放大倍數(shù)圖。圖B-DAPI+CentC+telo31(綠色/紅色一顏色;白色一灰度);C隱僅DAPI;D國DAPI+CentC探針(綠色一顏色;白色一灰度);和E-DAPI+23715探針(紅色一顏色;白色一灰度)。tdo-31雜交模式表明,微染色體(箭頭)具有與天然染色體類似的功能性端粒。圖15.對于來自CMC3亞庫1.3事件#27的愈傷組織中期核,探測著絲粒和端粒元件。用熒光標記探針,對著絲粒特異性CentC重復序列(綠色一顏色;白色一灰度)和端粒特異性telo-31重復序列(紅色一顏色;白色一灰度)進行FISH分析。標明這些探針的定位,用于天然染色體,CentC用星號("標明,telo-31用雙箭頭標明。圖B-E顯示微染色體的更高放大倍數(shù)圖。圖B-DAPI+CentC+telo-31(綠色/紅色一顏色;白色一灰度);C-僅DAPI;D-DAPI+CentC探針(綠色一顏色;白色一灰度);和E-DAPI+23715探針(紅色一顏色;白色一灰度)。tdo-31雜交模式表明,微染色體(箭頭)具有與天然染色體類似的功能性端粒。發(fā)明詳述本文所提出的各參考文獻的公開內(nèi)容通過引用全部結(jié)合到本文中。除非另有說明,否則本文和所附權利要求書所用的術語前未加數(shù)詞修飾時包括其復數(shù)形式。因此,例如"植物"包括多種(個)這樣的植物,"細胞,,包括一種(個)或多種(個)細胞以及本領域技術人員已知的等價物,等等。就本說明書而言,使用了大量術語和縮略語。提供以下定義。"可讀框"縮寫為ORF。"美國典型培養(yǎng)物保藏中心(AmericanTypeCultureCollection)"縮寫為ATCC。本文所用的術語"人工植物微染色體(artificialplantminichromosome)"是指包含著絲粒和端粒的任何人工產(chǎn)生的染色體,其具有與天然染色體類似的性質(zhì),例如在有絲分裂和減數(shù)分裂期間可復制和分離并因而在細胞分裂期間是自主的并可傳遞。術語人工微染色體、微染色體和人工染色體在本文中可互換使用。術語"功能性著絲粒"是指真核細胞的染色體紡錘體附著區(qū),其功能與天然染色體的著絲粒類似。它是染色體的最凝聚和縊縮區(qū),在有絲分裂期間紡錘絲與它連接在一起。在典型的動植物細胞有絲分裂期間,每條染色體縱向分裂成2個姊妹染色體,最終分離并進入有絲分裂紡錘體的兩極。在有絲分裂一開始,當姊妹染色體分裂但仍成對時,每條染色體沿其長度附著在紡錘體特定位點。該位點稱為著絲?;蚣忓N體附著區(qū)。著絲粒由高度重復DNA組成,也就是說DNA序列在基因組中存在許多拷貝。術語"陣列,,是指元件的有序排列。術語"串聯(lián)重復序列"是指呈相同方向的相同堿基序列的多個拷貝。因此,它們是例如沿染色體方向多次重復的串聯(lián)核苷酸序列的拷12貝。任何串聯(lián)重復序列陣列可包括單個元件的多個拷貝,或者可具有至少一個散布在陣列內(nèi)或陣列元件內(nèi)的其它元件。術語"相反方向"是指相同序列的兩個或更多拷貝呈相反形式。術語"反轉(zhuǎn)錄轉(zhuǎn)座元件"和"反轉(zhuǎn)錄轉(zhuǎn)座子"在本文中可互換使用,是指可轉(zhuǎn)移到DNA新位置上的遺傳元件,即可通過先制備本身的RNA拷貝,再用逆轉(zhuǎn)錄酶制備該RNA的DNA拷貝,然后將該DNA拷貝插入革巴DNA。反轉(zhuǎn)錄轉(zhuǎn)座子是可在基因組中擴增自己的遺傳元件,是在許多真核生物DNA中廣泛存在的組分。它們是轉(zhuǎn)座子的一個亞類。它們在植物中特別豐富,常常是植物細胞核DNA的主要成分。術語"功能性端粒"是指在真核細胞染色體末端發(fā)現(xiàn)的結(jié)構(gòu)。端粒的功能是通過保護染色體末端,以免重組、與其它染色體融合或被核酸酶降解。它們允許細胞區(qū)分隨機DNA斷裂與染色體末端。它們在確定正常細胞分裂次數(shù)方面也起到重要作用。端粒是線狀染色體末端的高度重復DNA區(qū),其功能是作為可任意使用的緩沖物質(zhì)(disposablebuffer)。每當線狀真核染色體在晚S期復制時,DNA聚合酶復合物不能一路復制到染色體末端;如果沒有端粒,這將會很快導致維持細胞活性所需的重要遺傳信息的丟失。本文所用的"核酸"是指多核苷酸,包括脫氧核糖核苷酸或核糖核苷酸堿基的單鏈或雙鏈多聚體。核酸也可包括片段和修飾核苷酸。因此,術語"多核苷酸,,、"核酸序列,,、"核苷酸序列"或"核酸片段,,是可互換使用的,是指單鏈或雙鏈RNA或DNA的多聚體,任選包含合成、非天然或改變的核苷酸堿基。核苷酸(通常呈5'-單磷酸形式)用如下單字母命名"A"代表腺苷或脫氧腺苷(分別對于RNA或DNA),"C"代表胞苷或脫氧胞苷。"G"代表鳥苷或脫氧鳥苷。"U"代表尿苷,"T,,代表脫氧胸苷,"R"代表嘌呤(A或G),"Y"代表嘧啶(C或T),"K,,代表G或T,"H"代表A或C或T,"I"代表肌普,"N"代表任何核苷酸。術語"在功能上等同的亞片段,,和"功能等同的亞片段"在本文13中可互換使用。.這些術語是指分離的核酸片段的一部分或亞序列,其中保留了改變基因表達或產(chǎn)生某種表型的能力,無論所述片段或亞片段是否編碼活性酶。例如,片段或亞片段可用于設計嵌合基因,以在轉(zhuǎn)化植物中產(chǎn)生所需表型??稍O計嵌合基因,用于通過連接核酸片段或其亞片段而進行抑制,無論它是否編碼活性酶、相對于植物啟動子序列而言呈有義或反義方向。術語"保守區(qū)"或"基序"是指在進化相關蛋白質(zhì)的比對序列的特定位置上保守的一組氨基酸。盡管在其它位置的氨基酸可在同源蛋白質(zhì)之間變化,但是在特定位置上高度保守的氨基酸表明是蛋白質(zhì)結(jié)構(gòu)、穩(wěn)定性或活性必不可少的氨基酸。因為它們通過蛋白質(zhì)同源物家族比對序列的高度保守而鑒定,所以它們可用作標識物或"標記(signature)",以確定具有新測定序列的蛋白質(zhì)是否屬于先前已鑒定的蛋白質(zhì)家族。術語"同源性"、"同源"、"基本相似"、"基本相同"和"基本對應"在本文中可互換4吏用。它們是指這樣的核酸片段其中一個或多個核苷酸堿基的改變不影響核酸片段介導基因表達或產(chǎn)生某種表型的能力。這些術語也指本發(fā)明核酸片段的修飾(例如缺失或插入一個或多個核苷酸),而與未修飾的原始片段相比,基本上不改變所得核酸片段的功能特性。這些術語還指具有或沒有修飾、缺失、插入或取代的氨基酸序列、多肽或肽片段,與未修飾的原始序列相比,所述修飾、缺失、插入或取代基本上不改變功能特性。因此,本領域技術人員可以理解,本發(fā)明包括的不止是具體的示例性序列。此外,技術人員知道,本發(fā)明所包括的基本相似的核^列也可按照它們與本文舉例的序列雜交(在中等嚴格性條件下,例如0.5XSSC、0.1%SDS,6CTC)的能力,或與本文所公開的核苷酸序列的任何部分和本文所公開的任何核酸序列的功能等同物雜交的能力來定義。嚴格性條件可調(diào)節(jié)到從篩選中度類似片段(例如遠緣相關生物體的同源序列),到篩選高度類似片段(例如能復制密切相關生物的功能性酶的基因)。雜交后洗滌確定嚴格性條件。術語"選擇性雜交"包括這樣的雜交在嚴格性雜交條件下,核酸序列與特定核酸靶序列雜交,檢測到其雜交程度比其與非把核列雜交程度高(例如超過背景至少2倍),因而可基本上排除非耙核酸。選擇性雜交序列通常彼此具有約至少80%序列同一性,或90。/。序列同一性,至多100%序列同一性并包括100%序列同一性(即完全互補)。術語"嚴格性條件"或"嚴格性雜交條件"包括探針將會與其耙序列選擇性雜交的條件。嚴格性條件是序列依賴性的,在不同情況下將會不同。對于控制雜交和/或洗滌條件的嚴格性而言,可鑒定出與探針100°/?;パa的把序列(同源探測)。或者,嚴格性條件可調(diào)節(jié)到允許序列中的某些錯配,使得可檢測較低程度的相似性(異源探測)。通常,探針長度小于約1000個核苷酸,任選小于500個核苷酸。通常,嚴格性條件如下其中鹽濃度小于約1.5MNa離子,通常約0.01-1.0MNa離子濃度(或其它鹽),pH7.0-8.3,而溫度至少約3(TC(對于短探針,例如10-50個核苦酸)和至少約60。C(對于長揮:針,例如大于50個核苷酸)。通過添加去穩(wěn)定劑(destabilizingagent)例如甲酰胺,也可得到嚴格性條件。示例性的低嚴格性條件包括在緩沖液(30-35%甲酰胺、1MNaCl、1。/。SDS(十二烷基硫酸鈉))中在3rC雜交,并在1X-2XSSC(20XSSC=3.0MNaCl/0.3M檸檬酸三鈉)中在50-55。C洗滌。示例性的中等嚴格性條件包括在40-45%曱酰胺、1MNaCl、1%SDS中在37。C雜交,并在0.5X-1XSSC中在55-60。C洗滌。示例性的高嚴格性條件包括在50%曱酰胺、1MNaCl、1%SDS中在37。C雜交,并在0.1XSSC中在60-65。C洗滌。特異性通常因雜交后洗滌而異,關鍵因素是最終洗滌液的離子強度和溫度。對于DNA-DNA雜合體,Tm可按Meinkoth等((1984)AnalBiochem138:267-284)的等式來求出Tm=81.5°C+16.6(logM)+0.41(%GC)-0.61(。/。曱酰胺)-;500/L;其中M是單價陽離子的體積摩爾濃度,。/。GC是鳥苷酸和胞苷酸在DNA中所占的百分率,%甲酰胺是雜交溶液中曱酰胺的百分率,而L是按堿基對計雜合體的長度。Tm是50%互補靶序列與完全匹配的探針雜交的溫度(在指定離子強度和pH下)。每錯配1%,Tm降低約rC;因此,Tm、雜交和/或洗滌條件可調(diào)整到與所需同一性的序列雜交。例如,如果尋找具有^90。/。同一性的序列,則Tm可下降l(TC。通常,在指定離子強度和pH下,對于特定序列及其互補序列而言,選擇嚴格性條件比熱解鏈溫度(Tm)低約5°C。然而,高嚴格性條件可使用在比熱解鏈溫度(Tm)低1'C、2。C、3。C或4。C的溫度下進行雜交和/或洗滌;中等嚴格性條件可使用在比熱解鏈溫度(Tm)低6°C、7°C、8°C、9。C或10。C的溫度下進行雜交和/或洗滌;低嚴格性條件可使用比熱解鏈溫度(Tm)低irC、12°C、13°C、14°C、15。C或2(TC的溫度下進行雜交和/或洗滌。用該等式、雜交和洗滌液組成以及所需要的Tm,本領域普通技術人員將會知道雜交和/或洗滌液嚴格性的變化如上所述是固有的。如果所需錯配程度導致L低于45°C(水溶液)或32。C(甲酰胺溶液),最好提高SSC濃度,使得可以使用更高溫度。有關核酸雜交的更詳細指南可參見Tijssen,丄W0rato7rec/2m',sB/oc/zem/s吵朋^M/ecw/ar場Zn血油'o"w她Wwc/e/c爿cWiV06a,第I部分,第2章,"OverviewofprinciplesofHybridizationandthestrategyofNucleicAcidProbeassays",Elsevier,NewYork(1993);禾口Cw/rewf尸ratoco/sMo/ecw/w5z'o/ogy,第2章,A聰bel等主編,GreenePublishingandWiley-Interscience,NewYork(1995)。雜交和/或洗滌條件可用至少IO分鐘、30分鐘、60分鐘、90分鐘、120分鐘或240分鐘。對于核酸或多肽序列而言,術語"序列同一性"或"同一性"是指兩個序列中的核酸堿基或氨基酸殘基當在特定比較窗口比對最大對應性時是相同的。術語"%序列同一性"是指通過在一個比較窗口比較兩個優(yōu)化比對序列所求出的值,其中對于兩個序列優(yōu)化比對而言,當與參考序列(其不包括插入或缺失)比較時,在比較窗口中多核香酸或多肽序列部分可包括插入或缺失(即空位)。百分率是這樣求出的通過測定兩條序列中存在的相同核酸堿基或氨基酸殘基的位置數(shù)而得到匹配位置數(shù),再用匹配位置數(shù)除以比較窗口的總位置數(shù),并將結(jié)果乘以100,就得到°/。序列同一性。%序列同一性的有用實例包括但不限于50%、55°/。、60%、65%、70%、75%、80%、85%、90%、或95%、或50%-100°/。之間的任何整數(shù)百分數(shù)。這些同一性可用本文所述的任何程序來測定。用設計用于測定同源序列的各種比較方法,可進行序列比對和%同一性或相似性計算,這些方法包括但不限于LASERGENE生物信息學計算套餐的MegAlignTM程序(DNASTARInc.,Madison,WI)。就本申請的內(nèi)容而言,可以理解,當用序列分析軟件進行分析時,分析結(jié)果可根據(jù)所用程序的"默認值",除非另有說明。本文所用的"默認值"是指軟件在首次初始化時原本帶有的任何一組數(shù)值或參數(shù)。術語"C1德1V比對方法"相當于標記為ClustalV的比對方法(描述于Higgins和Sharp(1989)CABIOS5:151國153;Higgins等(1992)ComputApplBiosci8:189-191)并可參見LASERGENE生物信息學計算套餐的MegAlignTM程序(DNASTARInc.,Madison,WI)。對于多重比對,默認值相當于空位罰分=10,空位長度罰分=10。采用Clustal方法,對于成對比對和蛋白質(zhì)序列的。/。同一性計算的默認參數(shù)為KTUPLE=1,空位罰分=3,WINDOW=5和DIAGONALSSAVED=5。對于核酸,這些參數(shù)為KTUPLE=2,空位罰分=5,WINDOW-4和DIAGONALSSAVED=4。當用ClustalV程序比對序列后,可通過查看同一程序中的"序列距離"表而得到"%同一性"。術語"ClustalW比對方法"相當于標記為ClustalW的比對方法(描迷于Higgins和Sharp(1989)CABIOS5:151-153;Higgins等(1992)ComputApplBiosci8:189-191)并可參見LASERGENE生物信息學計算套餐的MegAlignTM第6.1版程序(DNASTARInc.,Madison,WI)。多重比對的默認參數(shù)是空位罰分=10,空位長度罰分=0.2,延遲發(fā),歹寸(%)=30,DNA轉(zhuǎn)換權重-0.5,蛋白質(zhì)權重矩陣-GonnetSeries,DNA權重矩陣-IUB。當用ClustalW17程序比對序列后,可通過查看同一程序中的"序列距離,,表而得到"%同一性"。術語"BLASTN比對方法"是由國立生物技術信息中心(NationalCenterforBiotechnologyInformation,NCBI)提供的算法,用于用默認參數(shù)比較核苷酸序列。本領域技術人員都知道,多個水平的序列同一性可用于從其它物種中鑒別出多肽,其中這樣的多肽具有相同或相似功能或活性。%同一性的有用實例包括但不限于50%、55°/。、60%、65°/。、70°/。、75%、80%、85%、90%、或95%或50%-100%的任何整數(shù)百分率。的確,50%-100%的任何整數(shù)的氨基酸同一性可用于描述本發(fā)明,例如51%、52%、53%、54%、55%、56%63%、64%、65%、66%、67%74%、75%、76%、77%、78%85%、860/0、87%、88%、89%96%、97%、98%或99%。術語"基因"是指表達特定蛋白質(zhì)的核酸片段,其包含編碼序列之前(5'非編碼序列)和之后(3'非編碼序列)的調(diào)節(jié)序列。"天然基因"是指在自然界發(fā)現(xiàn)的帶有其自身調(diào)節(jié)序列的基因。"嵌合基因"是指并非天然基因的任何基因,其包含在自然界中不在一起的調(diào)節(jié)序列和編碼序列。因此,嵌合基因可包含來自不同來源的調(diào)節(jié)序列和編碼序列,或來自同一來源、但與自然界中所排列方式不同的調(diào)節(jié)序列和編碼序列。"外源,,基因是指在宿主生物中并非正常存在的、而是通過基因轉(zhuǎn)移而導入宿主生物的基因。外源基因可包含插入到非天然生物體或嵌合基因中的天然基因。"轉(zhuǎn)基因"是通過轉(zhuǎn)化方法導入基因組的基因。術語"基因組"當用于植物細胞時,不僅包括細胞核內(nèi)染色體DNA,而且還包括細胞的亞細胞組分(例如線粒體或質(zhì)體)內(nèi)的細胞器DNA。"密碼子優(yōu)化基因"或"密碼子優(yōu)選基因"是指經(jīng)設計其密碼子57%、58%、59%、68%、69%、70o/o、79%、800/0、81%、90%、91%、92%、60o/o、61%、62%、71%、72%、73%、82%、83%、84%、93%、94%、95%、使用頻率模擬宿主細胞的優(yōu)選密碼子使用頻率的基因。"等位基因"是占據(jù)染色體上特定位置的基因的若干替代形式之一。當在染色體上特定位置存在的所有等位基因都相同時,則植物在該基因座上就是純合的。如果在染色體上特定位置存在的等位基因不同,則植物在該基因座上就是雜合的。術語"編碼序列"是指編碼特定氨基酸序列的多核苷酸序列。"調(diào)節(jié)序列"是指位于編碼序列上游(5'非編碼序列)、中間或下游(3'非編碼序列)并可影響轉(zhuǎn)錄、RNA加工或穩(wěn)定性、或所連接編碼序列的翻譯的核苦酸序列。調(diào)節(jié)序列可包括但不限于啟動子、翻譯前導序列、內(nèi)含子、聚腺苷酸化識別序列、RNA加工位點、效應物結(jié)合位點和莖-環(huán)結(jié)構(gòu)(stem-oopstructure)。術語"啟動子"是指能控制編碼序列或功能性RNA的表達的DNA序列。啟動子序列由近側(cè)和遠側(cè)上游元件組成,后者常稱為增強子。因此,"增強子"是能刺激啟動子活性的DNA序列,它可以是啟動子的天然元件或者是插入其中以增強啟動子水平或組織特異性的異源元件。啟動子可全部來自天然基因,或者是由來自在自然界發(fā)現(xiàn)的不同啟動子的不同元件組成,或者甚至包含合成DNA區(qū)段。本領域技術人員知道,不同啟動子可指導不同組織或細胞類型或不同發(fā)育時期的基因表達、或響應不同環(huán)境條件的基因表達。本領域技術人員還知道,因為在大多數(shù)情況下并未完全界定調(diào)節(jié)序列的準確邊界,所以某些變異的DNA片段可具有相同的啟動子活性。在大多數(shù)細胞種類中、在大多數(shù)時間都能使基因得以表達的啟動子通常稱為"組成型啟動子"。不斷發(fā)現(xiàn)用于植物細胞的不同類型的新啟動子;大量實例可參見Okamuro和Goldberg(1989)BiochemistryofPlants15:1-82。術語"翻譯前導序列,,是指位于基因的啟動子序列與編碼序列之間的多核苷酸序列。翻譯前導序列存在于翻譯起始序列的完全加工的mRNA上游。翻譯前導序列可影響初級轉(zhuǎn)錄物成為mRNA的加工、mRNA穩(wěn)定性或翻譯效率。翻譯前導序列的實例已有描述(Tumer和Foster(1995)MolBiotechnol3:225-236)。術語"3'非編碼序列"、"轉(zhuǎn)錄終止子,,或"終止序列,,是指位于編碼序列下游的DNA序列,包括聚腺苷酸化識別序列和編碼調(diào)節(jié)信號的其它序列,所述信號能夠影響mRNA加工或基因表達。聚腺香酸化信號通常表征為影響聚腺苷酸鏈添加到mRNA前體的3'端。不同3'非編碼序列的使用實例可參見Ingelbrecht等(1989)PlantCell1:671-680。術語"RNA轉(zhuǎn)錄物"是指由RNA聚合酶催化DNA序列轉(zhuǎn)錄而產(chǎn)生的產(chǎn)物。當RNA轉(zhuǎn)錄物是DNA序列的完全互補拷貝時,它就稱為初級轉(zhuǎn)錄物。當初級轉(zhuǎn)錄物經(jīng)轉(zhuǎn)錄后加工而得到RNA序列時,該RNA轉(zhuǎn)錄物則稱為成熟RNA。"信使RNA"或"mRNA"是指不含內(nèi)含子并可由細胞翻譯為蛋白質(zhì)的RNA。"cDNA"是指采用逆轉(zhuǎn)錄酶由mRNA模板合成并與之互補的DNA。cDNA可以是單鏈或使用DNA聚合酶I克列諾(Klenow)片段而轉(zhuǎn)化為雙鏈形式。"有義"RNA是指包含mRNA并可在細胞內(nèi)或體外翻譯為蛋白質(zhì)的RNA轉(zhuǎn)錄物。"反義RNA"是指與靶初級轉(zhuǎn)錄物或mRNA的全部或部分互補的RNA轉(zhuǎn)錄物,其可阻斷耙基因的表達(美國專利5,107,065)。反義RNA可以與特定基因轉(zhuǎn)錄物的任何部分(即5'非編碼序列、3'非編碼序列、內(nèi)含子或編碼序列)互補。"功能性RNA"是指不能翻譯、但能影響細胞加工的反義RNA、核酶RNA或其它RNA。對于mRNA轉(zhuǎn)錄物而言,術語"互補"和"反向互補"在本文中可互換使用,用于限定反義信使RNA。術語"有效連接"是指單一核酸片段上核酸序列的連接使得一個序列的功能由其它序列調(diào)節(jié)。例如,當啟動子能夠調(diào)節(jié)編碼序列的表達(即編碼序列處于啟動子的轉(zhuǎn)錄控制之下),則該啟動子與編碼序列的連接就是有效連接。編碼序列可以有義或反義方向與調(diào)節(jié)序列有效連接。在另一實例中,本發(fā)明的互補RNA區(qū)可直接或間接地有效連接到把mRNA的5'、或靶mRNA的3'、或連接在靶mRNA內(nèi),或第20一互補區(qū)為靶mRNA的5',而其互補序列為靶mRNA的3'。本文所用的標準重組DNA和分子克隆技術是本領域眾所周知的,詳見Sambrook等,MolecularCloning:ALaboratoryManual;ColdSpringHarborLaboratory:ColdSpringHarbor,NY(1989)。轉(zhuǎn)化方法是本領域技術人員眾所周知的,在下文進行描述。"PCR"或"聚合酶鏈式反應"是特定DNA區(qū)段的合成技術,由一系列重復的變性、退火和延伸循環(huán)組成。通常,雙鏈DNA經(jīng)熱變性,與耙區(qū)段的3'邊界互補的兩個引物在低溫下退火,然后在中溫下延伸。一組這樣的3個連續(xù)步驟稱為一次"循環(huán)"。術語"重組,,是指兩個不同的分離的序列區(qū)段的人工組合,例如通過化學合成或通過遺傳工程技術操作分離的核酸區(qū)段。術語"質(zhì)粒"、"載體"和"盒"是指額外的染色體元件,其通常攜帶并非細胞重要代謝組成部分的基因,通常呈環(huán)狀雙鏈DNA片段形式。這樣的元件可以是自主復制序列、基因組整合序列、噬菌體或核苷酸序列、線狀或環(huán)狀、單鏈或雙鏈DNA或RNA,來自任何來源,其中許多核苷酸序列連接或重組成獨特構(gòu)建體,這樣的構(gòu)建體可將啟動子片段和選定基因產(chǎn)物的DNA序列以及合適的3'非翻譯序列引入細胞中。"轉(zhuǎn)化盒,,是指含有外源基因以及除外源基因以外的能促進特定宿主細胞轉(zhuǎn)化的元件的特定載體。"表達盒"是指含有外源基因以及除外源基因以外的能允許該基因在外源宿主中表達的元件的特定栽體。術語"重組構(gòu)建體"、"表達構(gòu)建體"、"嵌合構(gòu)建體"、"構(gòu)建體,,和"重組DNA構(gòu)建體,,在本文中可互換使用。重組構(gòu)建體包含核酸片段的人工組合,例如在自然界并不在一起的調(diào)節(jié)序列和編碼序列。例如,嵌合構(gòu)建體可包含來自不同來源的調(diào)節(jié)序列和編碼序列,或來自同一來源、但排列方式與自然界不同的調(diào)節(jié)序列和編碼序列。這樣的構(gòu)建體可單獨使用或與載體聯(lián)用。如果使用載體,則載體的選擇取決于轉(zhuǎn)化宿主細胞所用的方法,這是本領域技術人員眾所周知21的。例如,可使用質(zhì)粒載體。技術人員非常清楚,遺傳元件必須存在于載體中,以便成功地轉(zhuǎn)化、選擇和擴增含有任何本發(fā)明分離核酸片段的宿主細胞。技術人員也將會知道,不同的獨立轉(zhuǎn)化事件可導致不同水平和模式的表達(Jones等(1985)EMBOJ4:2411-2418;DeAlmeida等(1989)Mo1GenGenet218:78-86),因此必須篩選多個事件,以便獲得表現(xiàn)出所需表達水平和模式的品系。可通過DNA的DNA印跡分析、mRNA表達的RNA印跡分析、蛋白質(zhì)表達的免疫印跡分析或表型分析等方法來完成這樣的篩選。本文所用的術語"表達"是指產(chǎn)生功能性終產(chǎn)物(例如前體或成熟形式的mRNA或蛋白質(zhì))。術語"導入"是指將核酸(例如表達構(gòu)建體)或蛋白質(zhì)導入細胞中。導入包括將核酸導入真核細胞或原核細胞中并結(jié)合到細胞基因組中,還包括將核酸或蛋白質(zhì)瞬時提供給細胞。導入包括穩(wěn)定或瞬時轉(zhuǎn)化方法,以及有性雜交。因此,就將核酸片段(例如重組DNA構(gòu)建體/表達構(gòu)建體)插入到細胞中而言,"導入"是指"轉(zhuǎn)染"或"轉(zhuǎn)化"或"轉(zhuǎn)導"并包括將核酸片段導入真核細胞或原核細胞中,在其中核酸片段可結(jié)合到細胞基因組(例如染色體、質(zhì)粒、質(zhì)體或線粒體的DNA)上,轉(zhuǎn)變成為自主復制子或瞬時表達(例如轉(zhuǎn)染mRNA)。術語"成熟,,蛋白質(zhì)是指經(jīng)翻譯后加工的多肽(即已除去初級翻譯產(chǎn)物中存在的任何前肽(prepeptide)或肽原(propeptide)的多肽)。"前體,,蛋白是指mRNA翻譯的初級產(chǎn)物(即仍然含有前肽和肽原)。前肽和肽原可能是但不限于胞內(nèi)定位信號。術語"穩(wěn)定的轉(zhuǎn)化,,是指核酸片段轉(zhuǎn)移到宿主生物基因組(包括核基因組和細胞器基因組)中而產(chǎn)生遺傳穩(wěn)定的遺傳。相反,"瞬時轉(zhuǎn)化,,是指核酸片段轉(zhuǎn)移到宿主生物的細胞核或含DNA的細胞器中而導致非整合或非穩(wěn)定遺傳的基因表達。含轉(zhuǎn)化核酸片段的宿主生物稱為"轉(zhuǎn)基因"生物。術語"轉(zhuǎn)基因"是指基因組內(nèi)含有異源多核苷酸的植物或細胞。優(yōu)選異源多核苷酸是穩(wěn)定整合到基因組中,使多核苷酸可連續(xù)傳代。異源多核苷酸可單獨整合到基因組上或作為表達構(gòu)建體的組成部分而整合。本文所用的轉(zhuǎn)基因包括其基因型已因異源核酸的存在而改變的任何細胞、細胞系、愈傷組織、組織、植物部分或植物,其包括起先這樣改變的轉(zhuǎn)基因以及由起先的轉(zhuǎn)基因經(jīng)有性雜交或無性繁殖而產(chǎn)生的那些。本文所用的術語"轉(zhuǎn)基因"不包括由常規(guī)植物育種方法或天然發(fā)生事件導致基因組(染色體或染色體外)的改變,例如隨機交叉受精、非重組病毒感染、非重組細菌轉(zhuǎn)化、非重組轉(zhuǎn)座或自發(fā)突變。術語"植物"是指整林植物、植物器官、植物組織、種子、植物細胞、種子及其后代。植物細胞包括但不限于來自種子、懸浮培養(yǎng)物、胚、分生組織區(qū)、愈傷組織、葉、根、芽、配子體、孢子體、花粉和小孢子的細胞。植物部分包括分化和未分化組織,包括但不限于以下根、莖、芽、葉、花粉、種子、腫瘤組織以及各種細胞和培養(yǎng)物形式(例如單細胞、原生質(zhì)體、胚和愈傷組織)。植物組織可以在植物或植物器官、組織或細胞培養(yǎng)物中。術語"植物器官"是指組成形態(tài)和功能獨特的植物部分的植物組織或一組組織。術語"基因組,,是指以下(l)在生物體、或病毒或細胞器的每個細胞中都存在的遺傳材料的完全互補序列(基因和非編碼序列);和/或(2)作為來自一個親本的(單倍體)單位而遺傳的一整套染色體。"后代"包括植物的任何后續(xù)世代。本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其包含(a)至少2個反向的CentC串聯(lián)重復序列陣列,其中第1陣列包含至少50個拷貝的CentC,第2陣列包含至少50個拷貝的CentC;和(b)至少一.個拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于笫1陣列和第2陣列之間。優(yōu)選反轉(zhuǎn)錄轉(zhuǎn)座元件選自CentA、CRM1和CRM2。人工染色體包含具有CentC串聯(lián)重復序列陣列的功能性著絲粒。每個CentC重復序列陣列可包含至少30、40、50、60、70、80、90、100、120、140、150、160、180、200、220、240、250、260、280、300、320、340、360、380、400、450或500個拷貝的CentC。此夕卜,23每個CentC串聯(lián)重復序列陣列中可間插另一序列元件,包括但不限于反轉(zhuǎn)錄轉(zhuǎn)座子(其插入到CentC拷貝之間或CentC元件內(nèi)或反轉(zhuǎn)錄轉(zhuǎn)座子內(nèi)),或陣列中的任何其它序列元件。反轉(zhuǎn)錄轉(zhuǎn)座子包括但不限于CentA、CRM1和C脂2。在大多數(shù)真核生物中,著絲粒作為染色體中動粒形成和紡錘體附著的位點,嵌入異染色質(zhì)中。釀酒酵母CS.cerev/w'ae)染色體缺乏隨體序列,而具有精確定位的小著絲粒,它限定紡錘體連接125bpDNA(Blackburn和Szostak(1984)AnnRevBiochem53:163-194)。然而,來自其它真菌譜系的著絲粒包含與動植物中發(fā)現(xiàn)的更類似的重復序列陣列(Fishel等(1988)MolCellBiol8:754-763)。在高等真核生物中,細胞學研究和生物化學研究顯示出串聯(lián)重復的隨體DNA、著絲粒區(qū)和特定著絲粒相關蛋白之間的物理連接(Henikoff等(2001)Science293:1098-1102;Yu和Dawe(2000)JCellBiol151:131-142)。盡管缺乏通用序列基序,但大多數(shù)著絲粒隨體重復序列在不同生物體間都具有明顯類似的單元長度,例如基本隨體單元為171bp(靈長類)、186bp(魚金頭鯛(iS;an^m/rata))和155bp(昆蟲C/n'ra"omws/^//Wvz'tofws)(Henikoff等(2001)Science293:1098-1102)。植物著絲粒具有類似單元長度重復序列,例如,156bp重復序列(玉米)(Ananiev等(1998)ProcNatlAcadSciUSA95:13073-13078)、168bp重復序列(水稻)(Dong等(1998)ProcNatlAcadSciUSA95:8135-8140)和180bp重復序歹'J(擬南芥(JraWob/wX))(Copenhaver(2003)ChromosomeRes11:255-262)。在擬南芥中,著絲粒通常含有2.8-4Mb串聯(lián)重復的178bp隨體序列段(Hall等(2004)CurrOpinPlantBiol7:108-114)。在玉米中,完整功能的額外B染色體著絲粒含有約500kb串聯(lián)重復序列,其中部分缺失減少了傳遞(Alfenito和Birchler(1993)Genetics135:589-597)。含有額外B染色體的玉米染色體鋪片與來自位于A染色體著絲粒區(qū)的不同重復元件(包括CentC、CRM和CentA)的探針雜交。這些重復元件(主要存在于A染色體著絲粒附近)與不同于B染色體著絲粒的許多位點雜交(Lamb等(2005)Chromosoma113:337-349)。至少兩個實例違背了著絲粒隨體DNA基礎上的著絲粒形成的基本原則。首先,外來著絲粒(aliencentromere)在體細胞雜合體或燕麥-玉米漸滲系中的明確正常功能(Ananiev等(1998)ProcNatlAcadSciUSA95:13073-13078)表明保留了著絲粒功能和相應蛋白質(zhì)復合物。支持含無關著絲粒隨體DNA的外來著絲粒功能的所有著絲粒蛋白明顯都由宿主提供(Jin等(2004)PlantCell16:571-81)。第二,新著絲粒是最近描述于人和果蠅(Dmyo/^z7a)的基于非重復DNA的一類新型著絲粒(Williams(1998)NatGenet18:30-37;Choo(1997)AmJHumGenet61:1225-1233)。新著絲粒在正常染色體經(jīng)多次染色體重排的衍生物中存在,新著絲粒在明顯的常染色質(zhì)DNA區(qū)形成,缺乏通常與著絲粒功能相關重復序列。具有新著絲粒的染色體具有不同的有絲分裂或減數(shù)分裂穩(wěn)定性。著絲粒的特性和功能尚未完全清楚,還需要更多分析。迄今為止,大多數(shù)人工染色體都具有基于天然著絲粒隨體DNA的功能性著絲粒。knob重復序列,例如180bp和350bp(TRI)可用作新著絲粒的組分。已經(jīng)知道某些knob在減數(shù)分裂玉米染色體中可獲得著絲粒功能,這些新著絲粒僅包含180bp和350bp的串聯(lián)重復序列。對人和低等生物的新著絲粒進行研究,解決了先前未知的著絲粒DNA動態(tài)特性的現(xiàn)象(Choo等(1997)AmJHumGenet.61:1225-33)。在該現(xiàn)象的核心中,著絲粒功能看來并不是特定DNA序列的需要;而響應合適的外來影響的大量序列看來才提供該功能。對著絲粒序列的深入表征來自對酵母的研究,例如釀酒酵母(S.ce^v^Ze)和粟酒裂殖酵母(S.;om6e),已經(jīng)定義了功能性酵母著絲粒元件和組構(gòu)。例如在釀酒酵母著絲粒中,3個必需區(qū)域(CDEI、CDEII和CDEIII)的結(jié)構(gòu)和功能總共才125bp,即占每條染色體的0.006-0.06%(Carbon等(1990)NewBiologist2:10-19;Bloom(1993)Cell73:621-624)。粟酒裂殖酵母著絲粒介于40-100kb之間,由重復元件組成,占每條染色體的1-3%(Baum等(1994)MolCellBiol5:747-761)。后續(xù)研究表明,不到1/3的天然粟酒裂殖酵母著絲粒對著絲粒功能而言是足夠的(Baum等(1994)MolCellBiol5:747-761)。在粟酒裂殖酵母中,已經(jīng)知道反向重復序列區(qū)是著絲粒功能必不可少的,但是無論是中部核心(centralcore)還是反向重復序列的一條臂都不能賦予功能。側(cè)接中部核心的重復序列部分的缺失對有絲分裂分離功能或微染色體分離成為單倍體后代的減數(shù)分裂都沒有影響,但在減數(shù)分裂I期間能顯著破壞著絲粒介導的對同源姊妹染色單體配對的維持。在粟酒裂殖酵母3條不同染色體之間有明顯變異性,不同粟酒裂殖酵母菌抹之間的任何特定染色體的著絲粒都具有明顯變異性。然而,基礎DNA結(jié)構(gòu)基序(即反向重復序列)是粟酒裂殖酵母著絲粒的通用參數(shù)(Clarke等(1993)ColdSpringHarbSympQuantBiol58:687-695)。高等真核生物著絲粒很少有表征。雖然已鑒定出與高等真核生物著絲粒區(qū)雜交的DNA片段,但是對這些序列的結(jié)構(gòu)、組織和/或功能的了解甚少。然而,水稻卻是個例外,因其具有不同的著絲粒大小。雖然某些水稻染色體具有的著絲粒與其它物種大小類似(>1Mb),^f旦一些染色體的著絲粒卻驚人地小,可以被采用標準技術構(gòu)建的BAC毗連群(contig)完全覆蓋。水稻著絲粒4和8的完全測序表明,染色體區(qū)段內(nèi)存在認為是著絲粒的著絲粒串聯(lián)重復序列的反向區(qū)組(invertedblock),類似于酵母中觀察到的反向重復序列結(jié)構(gòu)(Zhang等(2004)NuclAcidsRes32:2023-2030;Wu等(2004)PlantCell16:967-976)。就許多情況而言,著絲粒重復序列的探針與著絲粒位置具有細胞學和遺傳學關系,許多這樣的序列以串聯(lián)重復隨體元件和M重復序列形式存在,其陣列長度范圍為300-5000kb(Willard(19%)TrendsGenet6:410-416)。原位雜交已經(jīng)顯示出每個人類著絲粒中都存在alphoid隨體171bp重復序歹'J(Tyler-Smith等(1993)CurrBiol390-397)。26尚未確定這些重復序列是否組成功能性著絲粒,但看來需要其它基因組DNA賦予DNA遺傳性。用alphoid隨體轉(zhuǎn)染細胞系,得到新染色體,但這些新染色體也含有宿主DNA,其可影響著絲?;钚?Haaf等(1992)Cell70:681-696;Willard(1997)NatGenetl5:345-354)。此外,新染色體可顯示出其全長alphoidDNA鋪片僅具有一個著絲粒縊痕,這表明alphoidDNA區(qū)組可能不足以賦予著絲粒功能。植物著絲粒的遺傳表征采用染色體片段的分離分析,包括分析攜帶遺傳標記的端著絲粒片段的三體品系(例如Koornneef(1983)Genetica62:33-40)。已經(jīng)鑒定出與著絲粒遺傳連鎖(Richards等(1991))或物理連接(Alfenito等(1993)Genetics135:589-597;Maluszynska等(1991)PlantJ1:159-166)的植物著絲粒重復元件,但是涉及著絲粒功能的這些序列的重要性尚未充分表征其功能。在擬南芥(^raW^p^中進行的細胞學研究,已經(jīng)找出著絲粒結(jié)構(gòu)與重復序列之間的關系。用非特異性熒光DNA結(jié)合劑(例如4',6-二脒基-2-苯基吲哚(DAPI))染色,可觀察到中期染色體的著絲粒染色質(zhì)區(qū)。針對180bppALI重復序列的熒光原位雜交(FISH)探針與所有5條擬南芥(Jra6Wo/w'力染色體著絲粒附近的DAPI標記共同定位(Maluszynska等(l991)PlantJ1:159-166;Martinez-Zapater等(1986)MolGenGenet204:417-423)。提出了pALI的功能性作用,但新近研究沒有#r測到擬南芥(^raWdo/^力密切相關物種的著絲粒附近的該序列(Maluszynska等(1993)AnnBotany71:479-484)。據(jù)信,所檢測的一個物種小擬南芥(A;w脂7a)是擬南芥04.Aa/z'awa)與另一密切相關物種雜交而來的雙二倍體(Maluszynska等(1991)PlantJ1:159-166;Price等(1995)載于^ra6z'cfo/w^,Somerville和Meyerowitz(主編)ColdSpringHarborPress,NY)。另一重復序列(pAtl2)遺傳作圖到1號染色體著絲粒5cM和5號染色體中心區(qū)之內(nèi)(Richards等(1991)NuclAcidsRes19:3351-3357),但它在著絲粒功能上的作用仍然不清楚。植物著絲粒區(qū)主要由著絲粒特異性重復序列、著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子和主要分散在植物基因組中的少量其它重復元件組成。例如著絲粒重復序列(例如CentO和CRR)已知來自水稻。已經(jīng)描述了玉米的4個著絲粒重復元件CentA、CentC、CRM1和CRM2(SEQIDNO:1-4)。在玉米中,第一個發(fā)現(xiàn)的串聯(lián)重復著絲粒特異性元件是CentC(Ananiev等(1998)ProcNatlAcadSciUSA95:13073-13078)。CentC形成多個不同長度的串聯(lián)陣列,其中一些串聯(lián)陣列包含多達l千個拷貝的CentC重復序列。CentC串聯(lián)重復序列與著絲粒核小體中的CENH3蛋白相互作用。根據(jù)玉米著絲粒特異性元件CentA的結(jié)構(gòu)和性質(zhì),看來它是反轉(zhuǎn)錄轉(zhuǎn)座子(Ananiev等(1998)ProcNatlAcadSciUSA95:13073-13078;GenBankAF078917)。玉米的另一高度保守的著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子CRM2于2003年發(fā)現(xiàn)(Nagaki等(2003)Genetics163:759-770;GenBankAY129008)。通過公開的兩個玉米著絲粒BAC克隆DNA序列(Nagaki等(200"Genetics1M:"9-"0)和有產(chǎn)權的玉米基因組DNA序列(Ananiev(2005)未公開)的比較分析,鑒定出第4個著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子CRM1(SEQIDNO:3)。在密切相關物種的著絲粒重復元件中^r測到某些同源性,所述物種例如高粱和甘蔗(Miller等(1998)Genetics150:1615-1623;Nagaki等(1998)ChromosomeRes6:295誦302;Zwick等(2000)AmJBot87:1757-1764);以及玉米和水稻(Ananiev等(1998)ProcNatlAcadSciUSA95:13073-13078);Cheng等(2002)PlantCell14:1691-1704)。另外,植物著絲粒含有冗余反轉(zhuǎn)錄轉(zhuǎn)座子(CR),在谷物中,許多CR元件屬于高度保守的Ty3/gypsy元件種系發(fā)生進化枝(Miller等(1998)TheorApplGenet96:832-839;Presting等(1998)PlantJ16:721-728;Langdon等(2000)Genetics156:313-325)。DNA同源性足夠高,4吏得來自高粱或短柄草(5rac/^/o&wm矽/va"cwm)的CR才笨針可鑒定大多數(shù)或所有農(nóng)業(yè)上重要谷物的著絲粒,這些谷物例如水稻、玉米、小麥、高粱、大麥和黑麥(Aragon-Alcaide等(1996)Chromosoma28105:261-268;Jiang等(1996)ProcNatlAcadSciUSA93:14210-14213;Miller等(1998)TheorApplGenet96:832-839)。反轉(zhuǎn)錄轉(zhuǎn)座子(也稱為進化枝I轉(zhuǎn)座元件)由2個亞型(長末端重復序列(LTR)和非LTR反轉(zhuǎn)錄轉(zhuǎn)座子)組成。長末端重復序列亞型具有直接LTR,其大小范圍為100bp至5kb。根據(jù)LTR反轉(zhuǎn)錄轉(zhuǎn)座子的序列相似性程度和所編碼基因產(chǎn)物的順序,將其進一步分為Tyl-copia樣組(尸jgwc/oWn'(iae)和Ty3-gypsy樣組(AfetoWnWae)。反轉(zhuǎn)錄轉(zhuǎn)座子的Tyl-copia組和Ty3-gypsy組通常在大基因組植物中具有高拷貝數(shù)(每個單倍體核中高達幾百萬拷貝)。Tyl-copia反轉(zhuǎn)錄轉(zhuǎn)座子在包括單細胞藻類到苔蘚植物、棵子植物和被子植物在內(nèi)的物種中含量豐富。Ty3-gypsy反轉(zhuǎn)錄轉(zhuǎn)座子的分布也很廣泛,包括棵子植物和被子植物。LTR反轉(zhuǎn)錄轉(zhuǎn)座子占人類基因組的約8%。非LTR反轉(zhuǎn)錄轉(zhuǎn)座子由兩個亞型(長散在核元件(LINE)和短散在核元件(SINE))組成。它們在植物中A具有高拷貝數(shù)(高達250,000)。有關植物轉(zhuǎn)座子(包括反轉(zhuǎn)錄轉(zhuǎn)座子)的綜述可參見Feschotte等(2002)NatRevGenet3:329-341。有關植物反轉(zhuǎn)錄轉(zhuǎn)座子的綜述可參見Kumar和Bennetzen(1999)AnnRevGenet33:479-532。根據(jù)用于系統(tǒng)發(fā)育和分類學研究的逆轉(zhuǎn)錄元件統(tǒng)一分類,可以鑒別著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子。完整的反轉(zhuǎn)錄元件和逆轉(zhuǎn)錄病毒包含編碼單種蛋白或多蛋白的兩個或更多個可讀框(ORF)。元件中基因的順序不同,根據(jù)逆轉(zhuǎn)錄酶(RT)、RNA酶H15(RH)、整合酶(INT)和天冬氨酸蛋白酶(PR)基因和保守半胱氨酸-組氨酸(CH)鋅指樣結(jié)構(gòu)域中的氨基酸比對和關鍵保守殘基或結(jié)構(gòu)域來分類。反轉(zhuǎn)錄元件也包含側(cè)接反轉(zhuǎn)錄元件內(nèi)部區(qū)的長末端重復(LTR)序列。反轉(zhuǎn)錄轉(zhuǎn)座子的每個家族都具有不同的非交叉雜交LTR,家族內(nèi)的組分在其LTR序列中可不同(0-50%)。在轉(zhuǎn)座過程中,兩個LTR在插入時間通常相同,但隨時間變化,替代可引起序列趨異。已知許多反轉(zhuǎn)錄元件,包括著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子(參見例如SanMiguel等(1998)NatGenet20:43-45;Turcotte等(2001)PlantJ25:169-179;Feng等(2002)Nature420:316;Nagaki等(2004)NatGenet36:138;Nagaki等(2003)Genetics163:750-770:Wu等(2004)PlantCell16:967-976;Hansen和Haslop-Harrison(2004)AdvBotRes41:165-193)。就相對大小和重復序列組成而言,不同玉米染色體著絲粒之間存在明顯差異。在玉米不同染色體中,CentC簇可小至約100kb或大于約2000kb,但是常見范圍為約200kb至約300kb。假設更小的大小范圍,可能在單個BAC克隆中發(fā)現(xiàn)玉米著絲粒區(qū)的完整中心部分。所觀察到的結(jié)構(gòu)多態(tài)性表明,玉米著絲粒由多個功能性區(qū)組(block)組成,每個區(qū)組都可支持著絲粒功能。在不同玉米染色體中觀察到受到CentC著絲粒串聯(lián)重復序列的長度和/或拷貝數(shù)限制的著絲粒大小上的顯著(至少IO倍)差異。在不同的近交系的同源染色體著絲粒之間也具有明顯差異。另一方面,本發(fā)明的人工植物微染色體可包含至少一個功能性端粒。端粒是線狀真核染色體末端的核蛋白封端(cap),是維持染色體末端必不可少的。端粒DNA是通過端粒末端轉(zhuǎn)移酶、具有逆轉(zhuǎn)錄酶活性的核糖核蛋白而合成的(McKnight等(2002)PlantMolBiol48:331-337)。端粒末端轉(zhuǎn)移酶通過在其RNA亞基內(nèi)拷貝短模板序列,而將端粒DNA加到染色體3'端。大多數(shù)生物的端粒由高度保守的不對稱短重復序列組成。已知許多端粒重復序列,包括CCCCAA(C4A2,四膜蟲屬(wewa)和草履蟲屬CParamec/wm));C4A4(尖毛蟲屬(Cbc聲n'c/^)和游仆蟲屬CEw;/ote力);C3TA(錐蟲屬(7Vy/a"cwoma)、利什曼原蟲屬(Z^/s/z附""/a)和纟戎;包菌屬CP/z;Ayarw附》;Ci.3A(酵母屬OSacc/zaro附少cey》;。1_8丁(網(wǎng)柄菌屬(/)&/^0>^£//"附));和C3TA3(擬南芥屬04ra6Wo;w/"、人類、小鼠、新小桿線蟲屬(Caem^aZ^/他))。在各生物的天然染色體中觀察到的重復序列數(shù)差異很大,例如某些纖毛蟲具有約50個重復序30列,而在擬南芥中觀察到小于350個重復序列,在酵母屬中觀察到重復序列共約300-500bp。植物的端粒長度(通常范圍為約2-75kb)受到遺傳因素和發(fā)育因子的控制。已經(jīng)從擬南芥中分離出端粒區(qū),顯示串聯(lián)重復序列的大小不同(Richards和Ausubel(1988)Cell53:127-136)。在玉米近親交配系中,端粒長度有25倍差異,范圍為小于2kb(WF9系)至約40kb(CM37系)(Burr等(1"2)PlantCell4:953-960)。越靠近著絲粒,經(jīng)常發(fā)現(xiàn)正則端粒重復序列與植物基因組的其它重復元件混合。相比之下,果蠅屬(Dmso;/H7a)在其染色體末端使用轉(zhuǎn)座子。在每條染色體末端都發(fā)現(xiàn)多拷貝的轉(zhuǎn)座子(HeT-A和TART元件)。通過新轉(zhuǎn)座子重復序列轉(zhuǎn)座到末端,可以逆轉(zhuǎn)端粒的逐漸縮短。與端粒末端轉(zhuǎn)移酶對端粒的維持類似,果蠅的轉(zhuǎn)座模型采用這樣的機制使用RNA轉(zhuǎn)座媒介,通過逆轉(zhuǎn)錄酶將其轉(zhuǎn)化到末端DNA上。DNA復制是這樣的過程通過該過程,細胞在細胞分裂前制造其遺傳信息的一個完整拷貝。在大腸桿菌(五.co//)、哺乳動物病毒和釀酒酵母(S.cwev/Wae)中,DNA復制的起始受到反式作用起始蛋白的控制,反式作用起始蛋白又與順式作用DNA復制基因序列相互作用。對于釀酒酵母,復制基因包含100-200bp并包括DNA合成開始的主要復制起始位點。這些復制基因含有保守llbp自主復制序歹'KARS),其結(jié)合起始識別復合物(ORC)產(chǎn)生前復制復合物(prereplicationcomplex)的核酸形成(Gilbert(2001)Science294:96-100)。在高等真核生物中,DNA復制可在成百上千個染色體位點上同時開始。限定的起點序列是不需要的,存在許多潛在復制起點,由接近間隔的起始位點的廣泛區(qū)域組成,其中的有些可能會頻繁使用。然而,已知若干特定真核細胞的復制起點,例如18S-26SrDNA的復制起點,其位于非轉(zhuǎn)錄間隔區(qū)內(nèi)(Ivessa和Zakian(2002)GenesDev16:2459-2464)。該區(qū)能促進轉(zhuǎn)基因構(gòu)建體的擴增(Hemann等(1994)DNACellBiol13:437-445)。另一特定起點是在中國倉鼠卵巢(CHO)細胞的二氫葉酸還原酶(DHFR)基因下游區(qū)內(nèi)發(fā)現(xiàn)的(Altman和Fanning(2001)MolCellBiol21:1098-1110)。在含有chorion基因的果蠅染色體區(qū)段中也發(fā)現(xiàn)了優(yōu)選的復制起始位點(Levine和Spradling(1985)Chromosoma92:136-142)。動植物細胞的復制機器很可能可復制任何類型的漸滲DNA,包括整合構(gòu)建體、附加體、完整染色體或其片段(Gilbert(2001)Science294:96-100)。人工微染色體是由順式作用DNA序列元件構(gòu)建的線狀或環(huán)狀DNA分子,所述元件負責適當復制并將染色體分配給子細胞。順式作用元件包括..復制起點(ori),DNA復制的起始位點(也稱為自主復制序歹'J(ARS));著絲粒,動粒裝配位點,用于在有絲分裂和減數(shù)分裂中適當分離復制的染色體;和端粒,特化DNA重復序列結(jié)構(gòu),其可使線狀染色體末端穩(wěn)定并促進染色體末端的完全復制。產(chǎn)生真核微染色體的若干策略是可行的,包括但不限于通過真核細胞中的內(nèi)源細胞染色體維持機器,自組分元件體內(nèi)自我裝配微染色體,自原核細胞中的組分元件裝配真核微染色體,以及自組分元件體外裝配真核微染色體。人工微染色體首先是在釀酒酵母中構(gòu)建的(Murray等(1986)MolCellBiol6:3166-3172;Blackburn和Szostak(1984)AnnRevBiochem53:163-194)。通過常規(guī)重組DNA技術,裝配環(huán)狀質(zhì)粒,其包含酵母125bp著絲粒、復制起點、選擇標記和回文排列的兩個延伸端粒DNA,然后通過原生質(zhì)球轉(zhuǎn)化引入酵母,在其中成為簡單線狀分子。洽著絲粒、復制起點和兩個端粒且長度為50kb的線狀構(gòu)建體,在有絲分裂時復制并分離,準確度為~99%,并在分裂培養(yǎng)物中維持至少20代。YAC的世代顯示出在其它真核生物例如動植物中裝配人工染色體的潛力。在YAC上進行的實驗表明,需要3個順式作用DNA序列以構(gòu)建人工染色體端粒、復制起點和著絲粒。可通過兩種不同方法產(chǎn)生動物人工染色體自克隆DNA區(qū)段,32從頭合成染色體;或通過天然染色體的斷裂和重排(Brown等(2000)TrendsBiotechnol18:402-403;Cooke(2001)CloningStemCells3:243-249;Lipps等(20030基因304:23-33)。從頭合成方法(即裝配或自下而上(bottom-up)方法)通過組合必需的克隆組分產(chǎn)生人工染色體。用人類alphoidDNA、端粒、人類基因組DNA和選擇標記的混合物共轉(zhuǎn)染HT1080細胞,導致形成微染色體(Harrington等(1997)NatGenet15:345-355)。微染色體的表征表明,它們都具有復雜的細胞遺傳結(jié)構(gòu),并且在沒有任何選擇時能穩(wěn)定維持。結(jié)論是,可通過復合物重排,自輸入DNA從頭合成微染色體及其著絲粒。此后,其它研究小組也使用HT1080細胞以引入含人alphoidDNA和在YAC、PAC或BAC中克隆的端粒的線狀或環(huán)狀DNA構(gòu)建體(Compton等(1999)NucleicAcidsRes27:1762-1765;Grimes等(2001)EMBORep2:910-914)。觀察到不同頻率的微染色體,顯示出不同的有絲分裂穩(wěn)定性。所產(chǎn)生的所有微染色體都明顯大于原始構(gòu)建體,變動范圍為5-10Mb。因此,可自克隆DNA(作為從頭裝配的主鏈)開始產(chǎn)生完整功能的哺乳動物染色體。保留著絲粒和端粒區(qū)的天然染色體的斷裂和重排是產(chǎn)生微染色體的另一策略。小染色體片段可通過脈沖場凝膠電泳進行分離,用所需基因改型,再重新導入宿主細胞中。在輻射后,在癌細胞和其它細胞類型中觀察到斷裂的微染色體,但是,片段太大則無法分離,而且無法控制基因組成。一個控制降低染色體大小的方法是根據(jù)端粒相關的染色體斷裂93:7125-7130;Shen等(1997)HumMolGenet6:1375-1382)。該方法涉及特定人類宿主染色體連續(xù)斷裂成較小的微染色體,使用打靶載體,其包含末端端粒區(qū)段、選擇標記和有時包含靶染色體的同源區(qū)。所得"工程微染色體"保留自主并能正常分離。已經(jīng)產(chǎn)生小至0.5Mb的微染色體,其含有alphoidDNA,作為人、倉鼠-人體細胞雜合系或雞細胞的功能性著絲粒序列。目前,人類人工染色體用于產(chǎn)生轉(zhuǎn)染色體-克隆的牛,其能產(chǎn)生人免疫球蛋白。在同源重組的雞DT40細胞中,由Cre/loxP介導的染色體易位和端粒定向的染色體截短而構(gòu)建人類微染色體(HAC)載體,通過微細胞介導的染色體轉(zhuǎn)移(MMCT),將該載體導入牛的原代胎兒成纖維細胞。將來自具有HAC的胎兒成纖維細胞的分離核轉(zhuǎn)移到去核的成熟卵母細胞中,產(chǎn)生克隆牛(Kuroiwa等(2002)NatBiotechnol20:889-894)。根據(jù)誘導哺乳動物細胞內(nèi)在的大規(guī)模擴增機制,已經(jīng)開發(fā)出在體內(nèi)產(chǎn)生人工染色體的方法。將著絲粒隨體DNA和非轉(zhuǎn)錄的rDNA間隔區(qū)定向整合到特定染色體上,導致著絲粒區(qū)的大規(guī)模擴增。這些擴增的染色體不穩(wěn)定,經(jīng)歷明顯重排,產(chǎn)生優(yōu)先由隨體DNA組成的穩(wěn)定微染色體(Kereso等(1996)ChromosomeRes4:226-239;Hadlaczky(2001)CurrOpinMolTher3:125-132)。開發(fā)出含多個序列特異性重組接受位點的人工染色體(ACE平臺)。在打耙載體中提供目標序列,用入(lambda)整合酶催化ACE平臺和打耙載體間的重組。在植物中也觀察到類似過程。觀察到植物天然染色體的自發(fā)斷裂。在擬南芥(Murata等(2006)Chromosoma,2006年4月11日在線公布)和玉米(Brock和Pryor(1996)Chromosoma104:575-584;Kato等(2005)CytogenetGenomeRes109:156-165)中發(fā)現(xiàn)了微染色體。在某些情況下,電離輻射可誘導微染色體(Riera-Lizarazu等(2000)Genetics156:327-339)。已經(jīng)構(gòu)建了水稻著絲粒5的物理圖譜,可用于產(chǎn)生水稻人工染色體(Nonomura和Kumta(2001)Chromosoma110:284-291)。提出構(gòu)建人工染色體的類似方法,用于平旬甜菜(Seto/racwm6e"力(Gindullis等(2001)Genome44:846-855)。在植物轉(zhuǎn)化事件中可發(fā)現(xiàn)轉(zhuǎn)基因構(gòu)建體多聯(lián)體化、連接和重排。用標準構(gòu)建體的通用植物轉(zhuǎn)化可產(chǎn)生復雜的重排、多聯(lián)體化和構(gòu)建體擴增(Svitashev和Somers(2001)Genome44:691-697;Svitashev等(2002)PlantJ32:443-445)。用多個質(zhì)粒共轉(zhuǎn)化植物,可產(chǎn)生含不同轉(zhuǎn)基因組合的轉(zhuǎn)基因基因座(Wu等(2002)TransgeneRes11:533-541)。類似于在動物細胞中進行的研究,在植物細胞中可通過各組分的自發(fā)多聯(lián)體化和連接,從頭裝配人工微染色體(參見圖1-10和14-15)。本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其中著絲粒與著絲粒蛋白C特異性結(jié)合。動粒將著絲粒DNA與紡錘絲連接在一起。在著絲粒附近特異性結(jié)合的人類自身抗體可促進著絲粒相關蛋白的克隆(CENP,Rattner(1991)Bioassays13:51-56)。這些蛋白質(zhì)中的至少一種屬于微管動力蛋白的驅(qū)動蛋白超家族(Yen(1991)EMBOJ10:1245-1254)。通過遺傳和生化研究已經(jīng)鑒定出酵母著絲粒結(jié)合蛋白(Bloom(1993)Cell73:621-624;Lechner等(1991)Cell64:717-725)。CENH3是取代著絲粒中的組蛋白H3的高度保守蛋白,認為它能募集染色體運動所需的其它蛋白質(zhì)。CENH3在整個細胞周期中都存在,并與減數(shù)分裂細胞中的動粒著絲粒蛋白C(CENPC)共同定位??墒褂弥z粒相關蛋白的特異性抗體,以證實DNA構(gòu)建體和/或微染色體中的著絲粒裝配。CENP(例如CENH3和/或CENPC)免疫定位在微染色體著絲粒上,表明形成包含著絲粒DNA元件和相關結(jié)合蛋白的功能性著絲粒。制備針對玉米著絲粒組蛋白H3(CENH3,17kD)的抗血清,并在天然玉米染色體上進行了測試(Zhong等(2002)PlantCell14:2825-2836)。染色質(zhì)免疫沉淀表明,CentC和CRM2與CENH3特異性相互作用。約38%和33%CentC和CRM2在染色質(zhì)免疫沉淀測定中沉淀下來,證明大部分CENH3與CentC共同定位。Dawe等((1999)PlantCell11:1227-1238)分離出哺乳動物CENPC的玉米同源物,其顯示出是玉米動粒的組分。使用來自氨基端結(jié)構(gòu)域的20個氨基酸的保守肽,產(chǎn)生對玉米CENPC具有特異性的抗血清,其經(jīng)直接標記并用于證明CENPC特異性定位到玉米天然和人工微染色體的著絲粒上(參35見例如圖3、4、8和10)。著絲粒重復元件CentA、CentC、CRM1和CRM2包括與SEQIDNO:1-4中的CentA、CentC、CRM1和CRM2的玉米序列基本相同的序列。基本相同的序列包括彼此高度同源的序列,例如具有顯著%序列同一性和/或在嚴格性條件下與CentA、CentC、CRMl或CRM2(SEQIDNO:l-4)或其互補序列選擇性雜交。在嚴格性雜交條件下選擇性雜交的序列包括這樣的序列其與耙序列雜交比背景至少高2倍并可基本上排除非靶核酸。選擇性雜交序列通常與輩巴序列具有約至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。可使用本領域已知的任何合適雜交條件和緩沖液,其實例在本文中有描述。序列同一性可用于比較兩個多核苷酸或多肽序列的一級結(jié)構(gòu)。序列同一性測定兩個序列中的相同殘基,當比對最大對應性時??捎糜嬎銠C執(zhí)行的算法來分析序列關系。兩個或更多個多核苷酸、或者兩個或更多個多肽之間的序列關系測定如下通過測定序列的最佳比對,給比對中的匹配和空位打分,得到%序列同一性和%序列相似性。根據(jù)比較各自所編碼的多肽,也可描述多核苷酸的關系。已知許多用于序列比較和分析的程序和算法。除非另有說明,否則本文提供的序列同一性/相似性值是指用GAP第10版(GCG,Accelrys,SanDiego,CA)并用以下參凄t得到的值對于核苷酸序列的%同一性和%相似性,用空位權重(GAPWeight)為50和長度權重(LengthWeight)為3,nwsgapdna.cmp打分矩陣;對于氨基酸序列的°/。同一性和%相似性,用空位權重(GAPWeight)為8和長度權重(LengthWeight)為2,BLOSUM62打分矩陣(Henikoff和Henikoff(1992)ProcNatlAcadSciUSA89:10915-10919)。GAP使用Needleman和Wunsch((1970)JMolBiol48:443-453)的算法,得到兩個完整序列最大匹配數(shù)和最小空位數(shù)的比對?;鞠嗤ň哂兄辽?0%、85%、90%、91%、92%、93%、94°/。、95%、96%、97%、98%、99%或更高序列同一性的序列,其中序列有望保留天然功能,才艮據(jù)總體%序列同一性、序列相似性、一級36序列的總體比對、保守殘基區(qū)組的存在、保守元件和/或結(jié)構(gòu)域的存在、保守功能性結(jié)構(gòu)域的存在、結(jié)合區(qū)的存在、催化殘基的存在、預測的二級和/或三級結(jié)構(gòu)、已知三維結(jié)構(gòu)的可利用性和本領域^t術人員采用的其它標準,來鑒定和預測任何特定序列的功能性同源序列。與天然多核苷酸相比,多核普酸變異體包括在5'端、3'端、和/或內(nèi)部位點(包括內(nèi)含子或外顯子)中的至少一個具有至少一個缺失、添加和/或取代的多核苷酸。多核苷酸變異體包括天然存在的變異體以及人工衍生的多核苷酸,例如,用定點誘變產(chǎn)生的那些。保守變異體包括這樣的序列與天然多核苷酸相比,所述序列保留其功能,編碼相同的多肽,或編碼具有基本類似的同一性、功能和/或活性的多肽變異體。用聚合酶鏈式反應(PCR)和/或雜交技術等已知技術可鑒定變異體。通常,特定多核苷酸的變異體與特定多核苷酸具有至少約40°/。、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97。/。、98%、99%或更高的序列同一性。也可采用標準比對程序和參數(shù),通過比較所編碼多肽間的°/。序列同一性,評價多核苷酸變異體。當通過比較各自所編碼的兩個多肽共享的%序列同一性時,這兩個所編碼的多肽的°/。序列同一性通常為至少約40%、45%、50。/。、55%、60%、65%、70%、750/。、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性。與天然多肽相比,蛋白變異體包括在N-末端、C-末端和/或內(nèi)部位點中的至少一個具有至少一個缺失、添加和/或取代的蛋白質(zhì)。蛋白變異體具有蛋白質(zhì)所需生物活性。變異體包括天然存在的多肽,以及通過人工操作的那些。經(jīng)序列比對程序測定,蛋白質(zhì)的生物活性變異體通常與天然蛋白的氨基酸序列具有至少約40。/。、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性。蛋白質(zhì)的生物活性變異體與所述蛋白質(zhì)的差異可能僅在1-15個氨基酸殘基上。保守取代通常是指一個氨基酸被另一個具有相似特性的氨基酸交換。例如Dayhoff等(1978)爿f/oso//Vofe/"5fe《wewce5Vn/"we(NatlBiomedResFound,Washington,D.C.)的模型提供了不希望影響蛋白質(zhì)生物活性的氨基酸取代的指南。多核苷酸和蛋白質(zhì)變異體包含來自誘變和/或重組方法(例如誘變和/或DNA改組)的序列。誘變和改變核香酸序列的方法是已知的(參見例如Kunkel(1985)ProcNatlAcadSciUSA82:488-492;Kunkel等(1987)MethodsEnzymol154:367-382;美國專利4,873,192;Walker和Gaastra編著(1983)TechniquesinMolecularBiology(MacMillanPubl.Co.,NY)及其中引用的參考文獻)。例如,可操作一個或多個不同的重組酶編碼序列,產(chǎn)生和選擇具有所需特性的新的重組酶蛋白。通常,從相關序列群體中產(chǎn)生重組多核苷酸文庫,并且可在體外或體內(nèi)同源重組(參見例如Stemmer(1994)ProcNatlAcadSciUSA91:10747-10751;Stemmer(1994)Nature370:389-391;Crameri等(1997)NatBiotechnol15:436-438;Moore等(1997)JMolBiol272:336-347;Zhang等(1997)ProcNatlAcadSciUSA94:4504-4509;Crameri等(1998)Nature391:288-291;和美國專利5,605,793和5,837,458)。通常,編碼多肽的多核普酸的修飾不應改變讀框,或產(chǎn)生和/或改變DNA或mRNA的二級結(jié)構(gòu)。參見EP專利申請公布號75,444。重疊寡核苷酸(縮寫為overgo)是長度跨越約40bp的引物對,通常由在3'端具有8bp重疊區(qū)的2個24bp寡核苷酸組成。該特征允許重疊寡核苷酸引物對彼此引導,并通過克列諾(Klenow)填補法,用標i己苦酸合成其互4卜鏈(McPherson(1999)Ge"owe^"a/j^s.-爿Z^60rato7M朋wa/,第4巻,第207-213頁,Birren等主編,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)??伞嚼粲酶鞣N才示"i己才玄苷酸,包括但不限于放射性標記的核苷酸或熒光標記的核苷酸。這用于產(chǎn)生探針,用于不同的雜交方法,包括但不限于菌落雜交、斑點印跡、DNA印跡和原位雜交,例如FISH。對于文庫雜交而言,與常規(guī)探針相比,重疊寡核苷酸探針的主要優(yōu)勢在于可選擇用于設計重疊寡38核苷酸的序列,因此可避免常規(guī)DNA片段探針中存在的重復序列;因此,可減少大基因組DNA文庫篩選中經(jīng)常會出現(xiàn)的交叉雜交問題。因為有該優(yōu)勢,所以重疊寡核苷酸雜交結(jié)合探針庫策略(Cai等(1998)Genomics54:387-397;Chang等(2001)Genetics159:1231-1242;Tao等(2001)Genetics158:1711-1724;Romanov等(2003)CytogenetGenomeRes101:277-281)已經(jīng)成為用于高通量BAC文庫篩選的方法,用于克隆鑒定和物理基因作圖。在某些實例中,與DNA構(gòu)建體一起或在該構(gòu)建體內(nèi)提供可增強或刺激細胞生長的基因或所編碼的多肽。增強或刺激細胞生長的基因包括這樣的基因其參與轉(zhuǎn)錄調(diào)節(jié)、同源異型基因調(diào)節(jié)、干細胞維持和增殖、細胞分裂和/或細胞分化,例如WUS同源序列(Mayer等(1998)Cell95:805-815;WOOl/0023575;US2004/0166563);aintegumenta(ANT)(Klucher等(1996)PlantCell8:137-153;Elliott等(1996)PlantCell8:155-168;GenBank檢索號U40256、U41339、Z47554);clavata(例如CLV1、CVL2、CLV3)(WO03/093450;Clark等(1997)Cell89:575-585;Jeong等(1999)PlantCell11:1925-1934;Fletcher等(1999)Science283:1911-1914);Clavata和EmbryoSurroundregion基因(例如CLE)(Sharma等(2003)PlantMolBiol51:415-425;Hobe等(2003)DevGenesEvol213:371-381;Cock和McCormick(2001)PlantPhysiol126:939-942;Casamitjana-Martinez等(2003)CurrBiol13:1435-1441);babyboom(例如BNM3、BBM、ODPl、ODP2)(WO0(V75530;Boutileir等(2002)PlantCell14:1737-1749);Zwille(Lynn等(1999)Dev126:469-481);leafycotyledon(例如Lecl、Lec2)(Lotan等(1998)Cell93:1195-1205;WOOO/28058;Stone等(2001)ProcNatlAcadSciUSA98:11806-11811;美國專利6,492,577);ShootMeristem-less(STM)(Long等(1996)Nature379:66-69);ultrapetala(ULT)(Fletcher(2001)Dev128:1323-1333);促分裂原激活蛋白激酶(MAPK)(Jonak等(2002)CurrOpinPlantBiol5:415);激酶相關蛋白磷酸酶(KAPP)(Williams等(1997)ProcNatlAcadSciUSA94:10467-10472;Trotochaud等(1999)PlantCell11:393-406);ROPGTPase(Wu等(2001)PlantCell13:2841-2856;Trotochaud等(1999)PlantCell11:393-406);fasciata(例如FAS1、FAS2)(Kaya等(2001)Cell104:131-142);細胞周期基因(美國專利6,518,487;W099/61619;WO02/074909)、Shepherd(SHD)(Ishiguro等(2002)EMBOJ.21:898-908);Poltergeist(Yu等(2000)Dev127:1661-1670;Yu等(2003)CurrBiol13:179-188);Pickle(PKL)(Ogas等(1999)ProcNatlAcadSciUSA96:13839-13844);knox基因(例如KN1、KNAT1)(Jackson等(1994)Dev120:405-413;Lincoln等(1994)PlantCell6:1859-1876;Venglat等(2002)ProcNatlAcadSciUSA99:4730-4735);受并奇獨立性胚乳(fertilizationindependentendosperm(FIE)(Ohad等(1999)PlantCell11:407-415)等等。多核苷酸組合包括多拷貝的任何一個目標多核苷酸,而且組合可具有上調(diào)和下調(diào)所組合多核苷酸表達的任何組合。組合可以在或不在一個用于轉(zhuǎn)化宿主細胞的構(gòu)建體上組合,因此可相繼或同時提供。宿主細胞可以是野生型或突變型的細胞,以正常或非整倍體狀態(tài)。位點特異性重組酶系統(tǒng)可以與任何微染色體系統(tǒng)一起使用。在植物細胞中建立了DNA構(gòu)建體或微染色體之后,能催化正向和反向反應的整合酶和重組酶都可用于引入修飾??蛇M行不同分子內(nèi)的修飾,例如給定序列的缺失或倒位。此外,可進行分子間的插入和交換,包括用含有相容的位點特異性重組位點的內(nèi)源染色體來易位。也可使用重組酶系統(tǒng),在微染色體內(nèi)建立靶位點(泊靠位點),用于隨后通過任何方法(包括雜交或直接遞送)進行目標多核苷酸的位點特異性整合??墒褂脕碜灾亟M系統(tǒng)的元件,例如重組酶和重組位點,例如在DNA構(gòu)建體內(nèi)、輩巴位點和/或轉(zhuǎn)移盒中。靶位點包括整合到基因組的多核苷酸,所述多核苷酸包含有效連接至少一個重組位點的啟動子。轉(zhuǎn)移盒包括有效連接目標多核苷酸和/或編碼選擇標記的多核苷酸的至少一個第一重組位點,其中第一重組位點是用靶位點中的重組位點重組產(chǎn)生的。中耙種子或植物已將DNA構(gòu)建體穩(wěn)定結(jié)合在其基因組中,所述構(gòu)建體是通過使用重組系統(tǒng)而產(chǎn)生和/或操作的??梢葬娪脤е虏煌?、改變和/或切除事件而產(chǎn)生所迷的DNA構(gòu)建體的位點特異性重組方法,得到中靶種子。參見例如W099/25821、W099/25854、WO99/25840、W099/25855、W099/25853、WO99/23202、W099/55851、WO01/07572、WO02/08409和WO03/08045。重組酶是在其相容重組位點間催化位點特異性重組的多肽,包括天然存在的重組酶序列、變異體和/或保留活性的片段。重組位點是由重組酶特異性識別的核苷酸序列,包括天然存在的重組位點序列、變異體和/或保留活性的片段。有關位點特異性重組酶的綜述可參見Sauer(1994)CurrOpBiotech5:521-527;Sadowski(1993)FASEB7:760-767;Groth和Calos(2004)JMolBiol335:667-678;和Smith和Thorpe(2002)MolMicrobiol44:299-307。任何重組系統(tǒng)或系統(tǒng)組合都可采用,包括但不限于重組酶和來自整合酶和/或解離酶家族的重組位點、生物活性變異體和其片段、和/或任何其它天然存在的或重組產(chǎn)生的酶或其變異體(其催化特定重組位點間的保守位點特異性重組)、和天然存在的或修飾的重組位點或其變異體(其由重組酶特異性識別而產(chǎn)生重組事件)。所用的重組位點可以是相應位點或不相似位點。相應重組位點、或一組相應重組位點是具有相同核苷酸序列的位點。在合適重組酶存在下,一組相應重組位點將會與彼此有效重組。不相似重組位點具有不同序列,彼此間含有至少一個核苷酸差異。一組不相似重組位點中的重組位點可以4皮此重組或不重組。一組不相似位點中的每個重組位點都具有生物活性,可以與相同位點重組。在合適重組酶的存在下,致重組位點能彼此重組。致重組位點包括這樣的位點其中在切除測定中,在標準條件下,與野生性對照相比,致重組位點之間重組的相對切除效率在檢出限之上,通常高出2%、5%、10%、20°/。、50%、100%或更高。在合適重組酶存在下,非致重組位點彼此不重組,或位點之41間的重組無法4企出。非致重組的重組位點包括這樣的位點在切除測定中,在標準條件下,與野生性對照相比,其彼此重組的頻率低于檢出限,通常低于2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075、0.005%、0.001%。任何合適的非致重組的重組位點都可利用,包括FRT位點或其活性變異體、lox位點或其活性變異體、att位點或其活性變異體、其任何組合、或非致重組的重組位點的任何其它組合。一組致重組的重組位點中的同向重復的重組位點以同一方向排列,這些位點之間的重組導致間插DNA序列的切除。一組致重組的重組位點中的反向重組位點以相反方向排列,這些位點之間的重組導致間插DNA序列的倒位。重組酶的整合酶家族成員超過IOO個,包括例如FLP、Cre、Dre、Int和R。對于整合酶家族的其它成員,參見例如Esposito等(1997)NucleicAcidsRes25:3605-3614;Nunes-Duby等(1998)NucleicAcidsRes26:391-406;Abremski等(1992)ProteinEng5:87-91;Groth和Calos(2004)JMolBiol335:667-678;和Smith和Thorpe(2002)MolMicrobiol44:299-307。其它重組系統(tǒng)包括例如鏈霉菌噬菌體phiC31(Kuhstoss等(1991)JMolBiol20:897畫卯8);噬菌體入(Landy(1989)AnnRevBiochem58:913-949和Landy(1993)CurrOpGenetDev3:699畫707);希氏硫化葉菌(5W/o/o6mW/Z^ae)的SSV1位點特異性重組系統(tǒng)(Maskhelishvili等(1993)MolGenGenet237:334-342);和基于逆轉(zhuǎn)錄病毒整合酶的整合系統(tǒng)(Tanaka等(1998)Gene17:67-76)。在某些實例中,重組酶是不需要輔因子或超螺旋底物的酶。這樣的重組酶包括Cre、FLP、phiC31Int、突變?nèi)隝nt、R、SSV1、Dre或其活性變異體或其片段。FLP重組酶催化兩個FRT位點間的位點特異性反應,并在DNA復制期間參與擴增釀酒酵母2(i質(zhì)粒的拷貝數(shù)。FLP蛋白已克隆并表達。參見例如Cox(1993)ProcNatlAcadSciUSA80:4223-4227。所用的FLP重組酶可來自酵母屬。在某些實例中,采用由植物優(yōu)選密碼子編碼的重組酶合成的多核苷酸。由包含玉米優(yōu)選密碼子的核苷酸序列42編碼的催化位點特異性重組事件的FLP酶(FLPm)是已知的(美國專利5,929,301)。額外的功能性變異體和FLP片段是已知的。參見例如Buchholz等(1998)NatBiotechnol16:617-618,Hartung等(1998)JBiolChem273:22884-22891,Saxena等(1997)BiochimBiophysActa1340:187-204,Hartley等(1980)Nature286:860-864,Shaikh和Sadowski(2000)JMolBiol302:27-48,Voziya謂等(2002)NucleicAcidsRes30:1656-1663和Voziyanov等(2003)JMolBiol326:65-76。噬菌體PI重組酶Cre催化兩個lox位點之間的位點特異性重組。參見例如Guo等(1997)Nature389:40-46;Abremski等(1984)JBiolChem259:1509-1514;Chen等(1996)SomatCellMolGenet22:477-488;Shaikh等(1977)JBiolChem272:5695-5702;和Buchholz等(1998)NatBiotechnol16:617-618。Cre多核苷酸序列也可使用植物優(yōu)選密碼子來合成,例如moCre(參見例如WO99/25840),其它變異體是已知的,參見例如Vergunst等(2000)Science290:979-982,Santoro和Schulz(2002)ProcNatlAcadSciUSA99:4185-4190,Shaikh和Sadowski(2000)JMolBiol302:27-48,Rufer和Sauer(2002)NucleicAcidsRes30:2764-2771,Wierzbicki等(1987)MolBiol195:785-794,Petyuk等(2004)JBiolChem279:37040-37048,Hartung和Kisters-Wolke(1998)JBiolChem273:22884-22891,Koresawa等(2000)JBiochem(Tokyo)127:367-372,美國專利6,890,726和Buchholz和Stewart(2001)NatBiotechnol19:1047-1052。在PI相關噬菌體中已經(jīng)鑒定出Cre同源序歹ij,從噬菌體D6中分離的重組酶稱為Dre,它是與Cre密切相關的酪氨酸重組酶,但它識別不同32bprox位點(Sauer和McDermott(2004)NucleicAcidsRes32:1-10)。phiC31整合酶和變異體是已知的(Kushtoss等(腿)JMolBiol222:897-908,WO03/066867,WO05/017170,US2005/0003540和Sclimenti等(2001)NucleicAddsRes29:5044-5051。?i整合酶和輔因子(Hoess等(1980)ProcNatlAcadSciUSA77:2482-2486,Blattner等(1997)Science277:1453-1474)及其變異體是已知的,包括輔因子-獨立型Int變異體(Miller等(1980)Cell20:721-729,Lange-Gustafson和Nash(1984)JBiolChem259:12724-12732,Christ等(1998)JMolBiol288:825-836和Lorbach等(2000)JMolBiol296:1175-1181)、att位點識別變異體(Dorgai等(1995)JMolBiol252:178-188,Yagu等(1995)JMolBiol252:163-167和Dorgai等(1998)JMolBiol277:1059-1070)、以及玉米密碼子優(yōu)化的Int、變異體和輔因子序列(W003/08045)。其它整合酶和變異體是已知的,例如HK022整合酶(Kolot等(1999)MolBiolRep26:207-213)和變異體,例如att位點識別變異體(Dorgai等(1995)JMolBiol252:178-188,Yagu等(簡)JMolBiol252:163-167和Dorgai等(1998)JMolBiol277:1059-1070)。野生型重組位點、突變型或者野生型和/或突變型位點的^f壬^r組合都可使用。這樣的重組位點包括例如野生型的lox、FRT和att位點,以及突變型的lox、FRT和att位點。突變型lox位點的重組活性分析可參見Lee等(1998)Gene216:55-65。其它重組位點和變異體是已知的,參見例如Hoess等(1982)ProcNatlAcadSciUSA79:3398-3402;Hoess等(1986)NucleicAcidsRes14:2287-2300;Thomson等(2003)Genesis36:162-167;Schlake和Bode(1994)Biochemistry33:12746-12751;Siebler和Bode(1997)Biochemistry36:1740-1747;Huang等(1991)NucleicAcidsRes19:443-448;Sadowski(1995)載于ProgressinNucleicAcidResearchandMolecularBiology笫51巻,第53-91頁;Cox(1989)載于MobileDNA,Berg和Howe(主編)AmericanSocietyofMicrobiology,WashingtonD.C.,第116-670頁;Dixon等(1995)MolMicrobiol18:449-458;Umlauf和Cox(1988)EMBOJ7:1845-1852;Buchholz等(1996)NucleicAcidsRes24:3118-3119;Kilby等(1993)TrendsGenet9:413-421;Rossant和Geagy(1995)NatMed1:592-594;Bayley等(1992)PlantMolBiol18:353-361;Odell等(1990)MolGenGenet223:369-378;Dale和Ow(1991)ProcNatlAcadSciUSA4488:10558-10562;Qui等(1994)ProcNatlAcadSciUSA91:1706-1710;Stuurman等(1996)PlantMolBiol32:901-913;Dale等(1990)Gene91:79-85;Albert等(1995)PlantJ7:649-659,美國專利6,465,254,WO01/23545,W099/55851和WO01/11058。在某些實例中,可使用多組不相似和相應重組位點,例如來自不同重組系統(tǒng)的位點。因此,任何合適的重組位點或重組位點組都可使用,包括FRT位點、FRT位點的生物活性變異體、lox位點、lox位點的生物活性變異體、att位點、att位點的生物活性變異體、其任何組合或重組位點的任何其它組合。FRT位點的實例包括例如最小野生型FRT位點(FRTl)和各種突變型FRT位點,包括但不限于FRT5、FRT6和FRT7(參見美國專利6,187,994)。額外的變異FRT位點是已知的,(參見例如WO01/23545和美國公布說明書2007/0015195,通過引用結(jié)合到本文中)??墒褂玫钠渌亟M位點包括att位點,例如以下文獻中公開的那些Landy(1989)AnnRevBiochem58:913-949,Landy(1993)CurrOpGenetDev3:699-707,美國專利5,888,732,WO01/07572和Thygarajan等(2001)MolCellBiol21:3926-3934。所用的位點特異性重組酶取決于把位點和轉(zhuǎn)移盒中的重組位點。如果使用FRT位點,則提供FLP重組酶,當使用lox位點時,則提供Cre重組酶,當使用Xatt位點時,則提供AJnt,當使用phiC31att位點時,則提供phiC31Int。如果所用的重組位點包括來自不同系統(tǒng)的位點,例如FRT和lox位點,可提供這兩種重組酶活性,無論是作為獨立的實體還是嵌合重組酶,例如FLP/Cre(參見例如WO99/25840)。提供標記,用于鑒定和/或選擇表達標記的細胞、植物和/或種子。標記包括例如篩選標記、可見標記和/或選擇標記。選擇標記是任何這樣的標記當以足夠量表達時,賦予對選擇試劑的抗性。例如可使用可見標記鑒定含有導入DNA構(gòu)建體的轉(zhuǎn)化細胞。在一個實例中,可見標記是熒光蛋白。這樣的熒光蛋白包括但不限于黃色熒光蛋白(YFP)、綠色熒光蛋白(GFP)、藍色熒光蛋白(CFP)和紅色熒光蛋白(RFP)。在再一個實例中,可見標記是由具有玉米優(yōu)選密碼子的多核苷酸所編碼的。在又一個實例中,可見標記包括GFPm、AmCyan、ZsYellow或DsRed。參見Wenck等(2003)PlantCellR印.22:244-251。選擇標記及其相應選擇試劑包括但不限于除草劑抗性基因和除草劑;抗生素抗性基因和抗生素;和其它化學抗性基因及其相應的化子ta刑。5w閨多"3"^vra丞叫巴35"1旦^1、r隊丁守/r每^^砰暇^^夕畔丄丄(npti丄)(其賦予對卡那霉素、巴龍霉素、新霉素和G418的抗性)和潮霉素磷酸轉(zhuǎn)移酶(hph)(其賦予對潮霉素B的抗性)。另見Bowen(1993)MarkersforPlantGeneTransfer,TransgenicPlants,第1巻,EngineeringandUtilization;Everett等(1987)Bio/Technology5:1201-1204;Bidney等(1992)PlantMolBiol18:301-313;和WO97/05829。若干類群也可賦予除草劑抗性,包括氨基酸合成抑制劑、光合作用抑制劑、脂質(zhì)抑制劑、生長調(diào)節(jié)劑、細胞膜破壞劑、色素抑制劑、幼苗生長抑制劑,包括但不限于咪唑啉酮、磺酰脲、三唑并嘧啶、草甘膦、烯禾啶、噁唑禾草靈、草銨膦、草丁膦、均三氮苯類、溴苯腈等。參見例如Holt(1993)AnnRevPlantPhysiolPlantMolBiol44:203-229;和Miki等(2004)JBiotechnol107:193-232。選擇標記包括賦予除草劑抗性的序列,包括但不限于bar基因,其編碼賦予草銨膦抗性的膦絲菌素乙酰轉(zhuǎn)移酶(PAT)(Thompson等(1987)EMBOJ6:2519-2523);草甘膦氧化還原酶(GOX)、草甘膦N-乙酰轉(zhuǎn)移酶(GAT)和5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSPS),其賦予對草甘膦的抗性(Barry等(1992)載于BiosynthesisandMolecularRegulation,.ofAminoAcidsinPlants,B.K.Singh等(主編)第139-145頁;Kishore等(1992)WeedTech6:626-634;Castle(2004)Science304:1151-1154;Zhou等(1995)PlantCellRep15:159-163;WO97/04103;WO02/36782;和WO03/092360)。其它選擇標記包括二氫葉酸還原酶(DHFR),其賦予對曱氨蝶呤的抗性(參見例如Dhir等(1994)ImprovementsofCerealQualitybyGeneticEngineering,R.J.Henry(主編),PlenumPress,NewYork;和Hauptmann等(1988)PlantPhysiol86:602-606)。乙酰羥酸合酶(AHAS或ALS)突變序列導致對咪峻啉酮類(imidiazolinones)和/或磺酰脲類(例如咪草煙和/或氯磺隆)的抗性(參見例如Zu等(2000)NatBiotechnol18:555-558;美國專利6,444,875和6,660,910;Sathasivan等(1991)PlantPhysiol97:1044-1050;Ott等(1996)JMolBiol263:359-368;和Fang等(1992)PlantMoiBioi18:i185-1187)。另外,化學物質(zhì)抗性基因還包括賦予4-曱基色氨酸(4-mT)抗性的色氨酸脫羧酶(Goodijn等(1993)PlantMolBiol22:907-912);和賦予溴苯腈抗性的溴苯腈腈水解酶。選擇標記可包括氨腈水合酶(Cah),參見例如Greiner等(1991)ProcNatlAcadSciUSA88:4260-4264;和Weeks等(2000)CropSci40:1749-1754。氨腈水合酶將氨腈轉(zhuǎn)化為脲,因而賦予氨腈抗性。氨腈的任何形式或衍生物都可用作選擇試劑,包括但不限于氰氨基鈣(Perlka⑧(SKW,TrotbergGermany)和氰胺(Dormex⑧(SKW))。另見美國專利6,096,947和6,268,547。氨腈水合酶的多核苷酸和/或多肽的變異體將會保留氨腈水合酶活性。氨腈水合酶的生物活性變異體將會保留將氨腈轉(zhuǎn)化為脲的能力。這類活性的測定方法包括測定表達氨腈水合酶的植物對氨腈的抗性。額外的測定包括氨腈水合酶比色測定(參見例如Weeks等(2000)CropSci40:1749-H54;和美國專利6,268,547)。本發(fā)明也涉及分離的多核苷酸,其包含(a)至少2個反向CentC串聯(lián)重復序列陣列,其中第1陣列包含至少10個拷貝的CentC,第2陣列包含至少10個拷貝的CentC;和(b)至少一個拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于第1陣列和第2陣列之間。合適的反轉(zhuǎn)錄轉(zhuǎn)座元件討論同上。本發(fā)明范圍之內(nèi)還包括分離的多核苷酸,其包含(a)至少一個CentC串聯(lián)重復序列陣列,該陣列包含至少10個拷貝的CentC;和,(b)至少一個拷貝的選自CentA、CRM1和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。再一方面,本發(fā)明涉及分離的多核苷酸,其包含(a)至少一個CentC串聯(lián)重復序列陣列,該陣列包含至少10個拷貝的CentC;和,(b)CentA、CRM1和CRM2各自至少一個拷貝。分離的多核苷酸包含至少一個CentC串聯(lián)重復序列陣列。每個CentC重復序列陣列可包含至少5、10、15、20、25、30、40、50、60、70、80、90、100、120、140、150、160、180、200、220、240、250、260、280或300個拷貝的CentC。此外,每個CentC串聯(lián)重復序列陣列中可間插另一序列元件,包括但不限于反轉(zhuǎn)錄轉(zhuǎn)座子(其插入到CentC拷貝之間或CentC元件內(nèi)或反轉(zhuǎn)錄轉(zhuǎn)座子內(nèi)),或陣列中的任何其它序列元件。反轉(zhuǎn)錄轉(zhuǎn)座子包括但不限于CentA、CRM1和CRM2。多核苦酸包括任何核酸分子,并且包含天然存在的、合成的和/或修飾的核糖核苷酸、脫氧核糖核苦酸以及核糖核苷酸和脫氧核糖核香酸的組合。多核苷酸包括所有序列形式,包括但不限于單鏈、雙鏈、線狀、環(huán)狀、分枝、發(fā)夾、莖-環(huán)結(jié)構(gòu)等。本發(fā)明范圍之內(nèi)還包括重組構(gòu)建體,其包含本發(fā)明的任何分離的多核苷酸。重組DNA構(gòu)建體包含多核苷酸,當存在于植物基因組中時,所述多核苷酸是對植物基因組的該染色體位置而言是異源的或外源的。在制備DNA構(gòu)建體中,可操作不同片段,以提供合適方向和/或合適讀框的序列。連接基或接頭可用于連接各片段??墒褂闷渌僮饕蕴峁┓奖愕南拗莆稽c、除去冗余DNA或除去限制位點。例如,可使用體外誘變、引物修復、限制、退火、重新取代、轉(zhuǎn)換、倒位或重組系統(tǒng)。目標多核苷酸是指DNA構(gòu)建體中包含的用于任何目的的任何核酸分子,包括但不限于非翻譯區(qū)、調(diào)節(jié)區(qū)、轉(zhuǎn)錄起始區(qū)、翻譯起始區(qū)、內(nèi)含子、外顯子、編碼RNA的多核苷酸、選擇標記、篩選標記、表型標記、編碼重組酶的多核苷酸、重組位點、靶位點、轉(zhuǎn)移盒、限制位點、識別位點、絕緣子、增強子、間隔/填充序列、復制起點、端粒序列、操縱基因等,都可在DNA構(gòu)建體中提供。構(gòu)建體可包含與合適序列有效連接的5'和3'調(diào)節(jié)序列。DNA構(gòu)建體可包含在植物中有功48能的、以5'至3'方向轉(zhuǎn)錄的至少一個以下區(qū)域轉(zhuǎn)錄和翻譯的起始區(qū)、多核苷酸、和轉(zhuǎn)錄和翻譯的終止區(qū)。或者,DNA構(gòu)建體可缺乏至少一個5'和/或3'調(diào)節(jié)元件。例如,可設計DNA構(gòu)建體,使得一旦導入細胞且存在合適的重組酶時,在把位點的重組事件將5'和/或3'調(diào)節(jié)區(qū)與DNA構(gòu)建體的合適序列有效連接。根據(jù)所用的多核苦酸元件、重組位點、轉(zhuǎn)移盒和/或耙位點,可按多種方式使用調(diào)節(jié)元件。在某些實例中,間插序列可存在于有效連接元件之間而不破壞功能性連接。例如,啟動子和目標多核苷酸之間的有效連接允許啟動子啟動和介導目標多核苷酸的轉(zhuǎn)錄。在某些實例中,翻譯起始位點與重組位點有效連接。在某些實例中,重組位點位于內(nèi)含子中。盒可另外含有至少一個要導入植物的額外序列?;蛘?,可分別提供額外序列??山oDNA構(gòu)建體提供多個限制位點或重組位點,用于操作不同組分和元件。DNA構(gòu)建體可另外含有選擇標記基因。轉(zhuǎn)錄起始區(qū)對植物宿主或目標多核苷酸而言可以是天然的、類似的、外源或異源的,并且可以是天然序列、修飾序列或合成序列。大量啟動子可用于表達編碼序列。有關用于植物的各種啟動子的綜述可參見Potenza等(20(M)InVitroCellDevBiolPlant40:1-22。在某些實例中,表達選擇標記的啟動子在種子中具有活性。在種子中具有活性的啟動子包括組成型啟動子,例如,Rsyn7啟動子的核心啟動子和以下文獻中公開的其它組成型啟動子W099/43838和美國專利6,072,050;核心CaMV35S啟動子(Odell等(1985)Nature313:810-812);MVV(紫茉莉花葉病毒)啟動子(Dey和Maiti(1999)PlantMolBiol40:771-782);水稻肌動蛋白(McElroy等(1990)PlantCell2:163陽171);泛蛋白(Christensen等(1989)PlantMolBiol.12:619-632和Christensen等(1992)PlantMolBiol18:675-689);pE固(Last等(1991)TheorApplGenet81:581-588);MAS(Velten等(1984)EMBOJ3:2723-2730);ALS啟動子(美國專利495,659,026)等。其它組成型啟動子包括以下文獻中公開的那些例如美國專利5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611。啟動子可以是組織優(yōu)選的啟動子,以便在特定植物組織中增強表達。在某些實例中,種子優(yōu)選的啟動子用于表達選擇標記。種子優(yōu)選萌發(fā)啟動子(其在種子萌發(fā)中具有活性)。參見Thompson等(1989)BioEssays10:108。種子優(yōu)選的啟動子包括但不限于Ciml(細胞分裂素誘導的信息);cZ19Bl(玉米19kDa玉米醇溶蛋白);milps(肌醇-l-磷酸合酶)(參見WO00/11177和美國專利6,225,529)、豆類(3-菜豆蛋白、油菜籽蛋白、P-伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)、玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、糯質(zhì)蛋白(waxy)、超甜蛋白1(shrunken1)、超甜蛋白2(shrunken2)、球蛋白1、endl和end2啟動子(WO00/12733)等。中的表達。啟動子可以是化學物質(zhì)誘導型啟動子(其中利用化學物質(zhì)誘導基因表達)或化學物質(zhì)阻遏型啟動子(其中利用化學物質(zhì)阻遏基因表達)?;瘜W物質(zhì)誘導型啟動子包括但不限于玉米In2-2啟動子(由苯磺酰胺除草劑類安全劑(safener)活化);玉米GST啟動子(由疏水親電化合物(例如某些芽前除草劑)活化);和煙草PR-la啟動子(由水楊酸活化)。其它化學物質(zhì)調(diào)節(jié)的目標啟動子包括甾體響應型啟動子(參見例如糖皮質(zhì)激素誘導型啟動子,參見Schena等(1991)ProcNatlAcadSciUSA88:10421-10425和McNellis等(1998)PlantJ14:247-257)以及四環(huán)素誘導型和四環(huán)素阻遏型啟動子(參見例如Gatz等(1991)MolGenGenet227:229-237和美國專利5,814,618和5,789,156)。DNA構(gòu)建體可包含表達單元。表達單元可具有包括但不限于以下的元件內(nèi)含子、增強子、前導序列、絕緣子、間隔序列、RNA編碼區(qū)、標記基因、重組位點、終止區(qū)、重組酶的編碼序列、增強子、50接頭、識別位點等。另外,DNA構(gòu)建體可包含轉(zhuǎn)移盒、靶位點或其任何部分或組合。可以各種方式修飾DNA構(gòu)建體,包括但不限于位點特異性重組/整合方法或基于轉(zhuǎn)座子的轉(zhuǎn)座,以使DNA構(gòu)建體中具有各種變化。可以修飾多核苷酸序列,用于在植物中表達。參見例如Campbell和Gowri(1990)PlantPhysiol92:1-11。合成植物優(yōu)選基因的方法包括例如美國專利5,380,831、5,436,391和Murray等(1989)NucleicAcidsRes17:477-498。已知額外的序列修飾在細胞宿主內(nèi)能增強基因表達。這些修飾包括消除編碼假聚腺苷酸化信號的序列、外顯子-內(nèi)含子剪接位點信號、轉(zhuǎn)座子樣重復序列和對基因表達有害的其它已充分表征的序列。序列的G-C含量可調(diào)節(jié)到給定宿主的平均水平,該水平是通過參考該宿主中表達的內(nèi)源基因而求出的。也可修飾序列以避免二級mRNA結(jié)構(gòu)。DNA盒中可另外含有5'前導序列,其可起到增強翻譯的作用。翻譯前導序列包括例如pimaizeavirus前導序列例如EMCV前導序列(Elroy-Stein等(1989)ProcNatlAcadSciUSA86:6126-6130);馬鈴薯Y病毒(Potyvirus)前導序列例如TEV前導序列(Gallie等(1"5)Gene165:233-238)、MDMV前導序列(Kong等(1988)ArchVirol143:1791-1799)和人免疫球蛋白重鏈結(jié)合蛋白(BiP)(Macejak等(1991)Nature353:9094);苜?;ㄈ~病毒外殼蛋白mRNA的非翻譯前導序列(AMVRNA4)(Jobling等(1987)Nature325:622-625);煙草花葉病毒前導序歹iJ(TMV)(Gallie等(1989)載于MolecularBiologyofRNA,ed.Cech(Liss,NewYork),第237-256頁);和玉米褪綠斑駁病毒前導序列(MCMV)(Lommel等(1991)Virology81:382-385)。另見Della-Cioppa等(1987)PlantPhysiol84:965-968。已知能增強翻譯的其它方法或序列也可采用,例如內(nèi)含子等。目標序列包括例如鋅指、激酶、熱激蛋白、轉(zhuǎn)錄因子、DNA修復、農(nóng)藝學性狀、抗蟲性、抗病性、除草劑抗性、不育性、油、蛋白質(zhì)、淀粉、可消化性、果仁大小、成熟度、營養(yǎng)組成、含量或代謝等??瓜x基因可編碼對害蟲的抗性,例如才艮蟲(線蟲)、地老虎、歐洲玉米螟等。這樣的基因包括例如蘇云金芽孢桿菌(5.Awn'"g/era&)毒蛋白基因(美國專利5,366,892;5,747,450;5,736,514;5,723,756;5,593,881;Geiser等(1986)Gene48:109)等??共⌒誀畎ń舛净?,例如針對伏馬毒素(fiimonosin)的基因(美國專利5,792,931);減毒(avr)和抗病(R)基因(Jones等(1994)Science266:789;Martin等(1993)Science262:1432;Mindrinos等(1994)Cell78:1089)等。除草劑抗性性狀包括編碼除草劑抗性的基因,包括磺酰脲型除草劑(例如ALS的S4和/或Hra突變)、抑制谷氨酰胺合酶作用的除草劑,例如草丁膦或草銨膦(basta)(例如bar基因)、EPSPS(美國專利6,867,293;5,188,642;和5,627,061)、GOX(Zhou等(1995)PlantCellRep15:159-163)和GAT(美國專利6,395,485)。也可使用抗生素抗性基因,例如編碼抗生素卡那霉素和慶大霉素抗性的nptll基因。也可使用不育基因,例如作為去雄的替代方法,包括雄性組織優(yōu)選的基因和具有雄性不育表型的基因例如QM(例如美國專利5,583,210)、激酶和編碼對雌雄配子體發(fā)育具有毒性的化合物的基因。需要降低特定基因的活性、沉默和/或抑制。用于基因沉默的許多技術是已知的,包括但不限于反義技術(參見例如Sheehy等(1988)ProcNatlAcadSciUSA85:8805-8809;和美國專利5,107,065;5,453,566;和5,759,829);共抑制(例如Taylor(1997)PlantCell9:1245;Jorgensen(1990)TrendsBiotech8:340-344;Flavell(1994)ProcNatlAcadSciUSA91:34卯-3496;Finnegan等(1994)Bio/Technology12:883-888;和Neuhuber等(1994)MolGenGenet244:230-241);RNA干擾(Napoli等(1990)PlantCell2:279國289;美國專利5,034,323;Sharp(1999)GenesDev13:139-141;Zamore等(2000)Cell101:25-33;Javier(2003)Nature425:257-263;和Montgomery等(1998)ProcNatlAcadSciUSA95:15502-15507)、病毒誘導的基因沉默(Burton等(2000)PlantCell12:691-705;和Baulcombe(1999)CurrOpPlantBio2:109-113);輩巴向RNA特異性核酶(Haseloff等(1988)Nature334:585-591);發(fā)夾結(jié)構(gòu)(Smith等(2000)Nature407:319-320;WO99/53050;WO02/00904;和WO98/53083);核酶(Steinecke等(l992)EMBOJ11:1525;美國專利4,987,071;和Perriman等(1993)AntisenseResDev3:253);寡核苷酸介導的定向修飾(例如WO03/076574;和W099/25853);Zn指靶向分子(例如WOO1/52620;WO03/048345;和WO00/42219);和其它方法或上述方法的組合。終止區(qū)可以是天然的,轉(zhuǎn)錄起始區(qū)可天然帶有有效連接的目標DNA序列,或可來自另一來源。方便的終止區(qū)可得自根癌土壤桿菌(^graZ^c/er/ww/w附e々c/e"力Ti匿質(zhì)粒,例如章魚名威合酶和月因月旨;威合酶的終止區(qū)。另見Guerineau等(1991)MolGenGenet262:141-144;Proudfoot(1991)Cell64:671-674;Sanfacon等(1991)GenesDev5:141-149;Mogen等(1990)PlantCell2:1261畫1272;Munroe等(1990)Gene91:151-158;Ballas等(1989)NucleicAcidsRes17:7891-7903;和Joshi等(1987)NucleicAcidsRes15:9627-9639。再一方面,本發(fā)明涉及包含具有功能性著絲粒的人工植物微染色體的轉(zhuǎn)基因玉米植物的制備方法,所述方法包括(a)使至少一個玉米植物細胞與包含本發(fā)明重組構(gòu)建體的混合物接觸;(b)鑒定來自步驟(a)并包含具有功能性著絲粒的人工植物微染色體的至少一個玉米植物細胞;和(c)使來自步驟(b)的玉米植物細胞再生出能育的玉米植物,其中所述玉米植物包含具有功能性著絲粒的人工植物微染色體?;旌衔镞€可包含編碼用于刺激細胞生長的多肽的多核苷酸。刺激細胞生長的多肽的實例包括但不限于wuschel、babyboom、RepA或Lecl將序列導入植物的任何方法都可使用,只要多核苷酸或多肽能夠進入至少一個細胞內(nèi)部。將序列導入植物的方法是已知的,包括但不限于穩(wěn)定轉(zhuǎn)化、瞬時轉(zhuǎn)化、病毒介導的方法和有性育種。穩(wěn)定結(jié)合是指導入的多核苷酸整合到基因組中并由后代遺傳下去。瞬時轉(zhuǎn)化是指導入的序列沒有整合到基因組中,使得/人宿主遺傳給后代。所用的植物和種子可具有穩(wěn)定結(jié)合在其基因組上的DNA構(gòu)建體。任何方案都可使用,以導入DNA構(gòu)建體、任何組分的位點特異性重組系統(tǒng)、多肽或任何其它目標多核苷酸。提供包含將任何多肽和/或多核苦酸與任何其它所述組分結(jié)合在一起的任何方法。任何方法都可采用,以將靶位點、轉(zhuǎn)移盒和合適的重組酶結(jié)合在一起,所述方法包括例如穩(wěn)定轉(zhuǎn)化、瞬時遞送和有性雜交(參見例如W099/25884)。在某些實例中,可提供多肽或mRNA形式的重組酶??刹捎靡幌盗蟹桨?,以將不同組分結(jié)合在一起。例如,可通過各種方法將這些組分中的至少一種提供給細胞,所述方法包括瞬時和穩(wěn)定的轉(zhuǎn)化方法;將重組酶DNA、mRNA或蛋白質(zhì)直接共同引入細胞;使用可表達重組酶的生物(例如株或品系);或讓攜帶靶位點的細胞或生物生長/培養(yǎng),與表達活性重組酶蛋白的生物雜交,然后在后代選擇事件。當轉(zhuǎn)移盒主要在耙位點整合時,得到簡單的整合模式。能夠在生物體內(nèi)調(diào)節(jié)表達的任何啟動子,包括組成型、誘導型、發(fā)育型、時間和/或空間調(diào)節(jié)型啟動子等,都可使用。轉(zhuǎn)化方案以及將多肽或多核苷酸序列引入植物的方案因轉(zhuǎn)化所靶向的植物或植物細胞種類不同而異。將多肽或多核苷酸引入植物細胞的合適方法包括顯微注射(Crossway等(1986)Biotechniques4:320-334,美國專利6,300,543;和美國申請11/427,947和11/427,371,所有這些文獻都通過引用結(jié)合到本文中)、電穿孔(Riggs等(1986)ProcNatlAcadSciUSA83:5602-5606)、土壤桿菌介導的轉(zhuǎn)化(美國專利5,563,055;和5,981,840)、直接基因轉(zhuǎn)移(Paszkowski等(1984)EMBOJ3:2717-2722)和生物射彈粒子加速(ballisticparticleacceleration)(美國專利4,945,050;5,879,918;5,886,244;和5,932,782;Tomes等(1995)載于PlantCell,Tissue,andOrganCulture:FundamentalMethods,Gamborg和Phillips主編(Springer-Verlag,Berlin);McCabe等(1988)轉(zhuǎn)化(W000/28058)。另見Weissinger等(1988)AnnRevGenet22:421-477;Sanford等(1987)ParticulateScienceandTechnology5:27-37(洋蔥);Christou等(1988)PlantPhysiol87:671-674(大豆);Finer和McMullen(1991)InVitroCellDevBiol27P:175-182(大豆);Singh等(1998)TheorApplGenet96:319-324(大豆);Datta等(1990)Biotechnology8:736-740(水稻);Klein等(1988)ProcNatlAcadSciUSA85:4305-4309(玉米);Klein等(1988)Biotechnology6:559-563(玉米);美國專利5,240,855;5,322,783;和5,324,646;Klein等(1988)PlantPhysiol91:440-444(玉米);Fromm等(1990)Biotechnology8:833-839(玉米);Hooykaas-VanSlogteren等(1984)Nature311:763-764;美國專利5,736,369(谷物類);Bytebier等(1987)ProcNatlAcadSciUSA84:5345-5349(百合科(Liliaceae));DeWet等(1985)載于TheExperimentalManipulationofOvuleTissues,Chapman等主編(Longman,NewYork),第197-209頁(花粉);Ka印pler等(1990)PlantCellRep9:415-418;和Kaeppler等(1992)TheorApplGenet84:560-566(頸須(whisker)介導的轉(zhuǎn)化);D'Halluin等(1992)PlantCell4:1495-1505(電穿孔);Li等(l993)PlantCellRep12:250-255;Christou和Ford(1995)AnnBot75:407-413(水稻);Osjoda等(1996)NatBiotechnol14:745-750(玉米,通過根癌土壤桿菌);和載于^/v朋ce"'"CW/w/araw/Mo/ectz/w說o/ogyo/iVa""第5巻,第8章,第189-253頁,Vasil主編,KluwerAcadPubl(Dordrecht,TheNetherlands)1999。不同化合物可與任何直接遞送方法一起用于將任何多核苷酸、多肽或其組合(任選包含其它組分)導入植物細胞中。例如,在陽離子型脂質(zhì)溶液、脂質(zhì)體溶液、陽離子型聚合物、DNA結(jié)合蛋白、陽離子蛋白、陽離子肽、陽離子聚氨基酸或其組合的存在下,可通過使DNA構(gòu)建體與微彈結(jié)合而制備用于基因槍(particlegun)方法的微彈。在某些實例中,在以下物質(zhì)存在下,通過使DNA構(gòu)建體與微彈相結(jié)合,制備用于基因槍方法的微彈Tfk-lO、Tfk-20、Tfk-50、脂轉(zhuǎn)染試劑55(Lipofectin)、脂轉(zhuǎn)染胺試劑(Lipofectamine)、細胞轉(zhuǎn)染試劑(Cellfectin)、Effectene、細胞轉(zhuǎn)染試劑GSV(CytofectinGSV)、PerfectLipids、DOTAP、DMRIE-C、FuGENE-6、Superfect、Polyfect、聚乙烯亞胺、脫乙酰殼多糖、魚精蛋白Cl、DNA結(jié)合蛋白、組蛋白Hl、組蛋白CENH3、聚-L-賴氨酸、DMSA等。可通過用病毒或病毒核酸與植物接觸,將多核苷酸導入植物中。通常,這樣的方法包括將所需多核苷酸結(jié)合在病毒DNA或RNA分子中。序列開始可合成在病毒多蛋白中,然后在體內(nèi)或體外加工產(chǎn)生所需蛋白質(zhì)。有用的啟動子包括病毒RNA聚合酶轉(zhuǎn)錄所用的啟動子。將多核苷酸(包括病毒DNA或RNA分子)引入植物并表達所編碼的蛋白質(zhì)的方法是已知的,參見例如美國專利5,889,191;5,889,190;5,866,785;5,589,367;5,316,931;和Porta等(1996)MolBiotech5:209-221。使用各種瞬時方法,可將不同組分(包括來自位點特異性重組系統(tǒng)的那些)提供給植物。這樣的瞬時轉(zhuǎn)化方法包括但不限于向植物中直接引入重組酶或其活性片段或其變異體、引入重組酶mRNA或使用非整合方法、或引入低水平的DNA。這樣的方法包括例如顯微注射、粒子轟擊、病毒載體系統(tǒng)和/或多核苷酸沉淀,其中轉(zhuǎn)錄是自結(jié)合粒子的DNA發(fā)生的,而基本不自粒子中釋放或不整合到基因組中,這樣的方法通常使用包被聚乙烯亞胺(polyethylimine)的粒子(參見例如Crossway等(1986)MolGenGenet202:179-185;Nomura等(1986)PlantSci44:53-58;Hepler等(1994)ProcNatlAcadSciUSA91:2176-2180;和Hush等(1994)JCellSci107:775-784)。采用標準方案和介質(zhì),可將轉(zhuǎn)化細胞再生為植物,參見例如McCormick等(1986)PlantCellRep5:81-84。然后可培養(yǎng)這些植物并自花授粉、回交和/或遠交,鑒定具有所需性狀的所得后代。培養(yǎng)兩代或更多代,以保證性質(zhì)能穩(wěn)定維持并遺傳,然后收獲種子。按照該方法,提供具有所述DNA構(gòu)建體穩(wěn)定地結(jié)合在基因組的轉(zhuǎn)化/轉(zhuǎn)基因種子。56具有穩(wěn)定結(jié)合的DNA構(gòu)建體的植物和/或種子可進一步表征其表達、位點特異性整合潛力、農(nóng)業(yè)經(jīng)濟學和拷貝數(shù)(參見例如美國專利6,187,994)??墒褂媚繕酥亟M位點、重組酶、選擇標記和核苷酸序列的片段和變異體,除非另有說明,否則是指所述變異體或片段保留了至少某些原始組成的活性/功能。就多核苦酸編碼蛋白質(zhì)而言,多核苷酸片段可編碼保留全長蛋白生物活性的蛋白片段。多核苷酸片段的范圍為至少約20個核苷酸、約50個核苦酸、約IOO個核苷酸和至多全長多核苷酸。編碼蛋白質(zhì)生物活性部分的多核苷酸片段通常編碼至少15、25、30、50、100、150、200、250、300、325、350、375、400、420或450個連續(xù)氨基酸,或該范圍內(nèi)的任何整數(shù),至多并包括全長蛋白質(zhì)所含的氨基酸總數(shù)。可通過分離編碼目標多肽部分的一個多核苷酸部分而制備多肽的生物活性片段,然后表達蛋白質(zhì)片段并評價其活性?;蛘?,可通過選擇性化學裂解或蛋白酶裂解全長多肽而制備多肽的生物活性片段,再測定其活性。例如,編碼重組酶多肽片段的多核苦酸可包括這樣的核苷酸序列其包含至少16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、l,OOO、I,IOO、1,200、1,300或1,400個核苷酸,或該范圍內(nèi)的任何整數(shù),至多并包括全長多核苷酸的核苷酸總數(shù)。另外,在合適的重組酶存在下,在經(jīng)歷重組事件后,重組位點片段保留重組位點的生物活性。重組位點片段的范圍為至少約5、10、15、20、25、30、35、40個核苷酸,至多達全長重組位點。例如全長FRT、lox、attB和attP位點是已知的,其范圍為約50個核苷酸至約250個核苷酸,而完全活性的最小值是已知的,范圍為約20、25、30、35、40、45和50個核苷酸。重組位點和重組酶生物活性的測定是已知的(參見例如Senecoll等(1988)JMolBiol201:406-421;Voziyanov等(2002)NucleicAcidsRes30:7;美國專利6,187,994;WO01/00158;Albert等(1995)PlantJ577:649國659;Hartang等(1998)JBiolChem273:22884-22891;Saxena等(1997)BiochimBiophyActa1340:187-204;和Hartley等(1980)Nature280-860-864)。重組酶活性測定通常測定酶對含重組位點的DNA底物的總體活性。例如,為了測定FLP的活性,可檢測含兩個反向FRT位點的環(huán)狀質(zhì)粒中的DNA序列倒位,因為限制酶位點的位置發(fā)生改變(參見例如Vetter等(1983)ProcNatlAcadSciUSA80:7284)?;蛘?,可以測定從線狀分子切除的DNA或由酶誘導的分子間重組頻率(參見例如Babineau等(1985)JBiolChem260:12313;Meyer-Leon等(1987)NucleicAcidsRes15:6469;和Gronostajski等(1985)JBiolChem260:12328)。也可測定重組酶活性,即通過切除致重纟且FRT位點側(cè)4妄的序列,以激活可測定的標記基因。實施例以下實施例進一步界定了本發(fā)明,其中份和百分比以重量計,溫度以攝氏度計,除非另有說明。應當理解,當這些實施例表示本發(fā)明的優(yōu)選實施方案時,它們僅用于說明性目的。根據(jù)以上討論和這些實施例,本領域技術人員可以確定本發(fā)明的基本特征,而且在不偏離其精神和范圍下,可對本發(fā)明作出不同的改動和修飾,以適用于不同用途和條件。因此,根據(jù)上述描述,對本發(fā)明進行除本文所示和所述之外的各種修飾,將會是本領域技術人員顯而易見的。這樣的修飾也落入所附權利要求書的范圍之內(nèi)??s略語的含義如下"sec"表示秒,"min"表示分鐘,"h"表示小時,"d"表示天,表示微升,"mL"表示毫升,"L"表示升,'VM,,表示微摩爾濃度,"mM"表示毫摩爾濃度,"M"表示摩爾濃度,"mmol"表示毫摩爾,'Vmole"表示微摩爾,"g"表示克,"jug"表示微克,"ng"表示納克,"U"表示單位,"bp"表示堿基對,"kB"表示千堿基對。實施例1.玉米著絲粒的鑒定和分離為了評價單個著絲粒的大小、組成和結(jié)構(gòu)組織,單獨和/或在合劑中使用對CentC、CentA、CRM1和/或CRM2具有特異性的標記探針,用于對玉米減數(shù)分裂4且線期、中期、后期I的染色體進行熒光原位雜交(FISH)和對延伸DNA分子進行焚光原位雜交(纖維-FISH)。這4個探針也用于篩選基因組玉米BAC文庫。A.原位雜交玉米中期染色體的多色FISH表明,這4個著絲粒重復序列是著絲粒特異性的并共同定位于體細胞所有染色體的著絲粒區(qū)。FISH分析表明,反轉(zhuǎn)錄轉(zhuǎn)座子CRM1、CRM2和CentA占據(jù)在玉米著絲粒中大致相同的區(qū)域。在不同玉米染色體的著絲粒之間,重復序列的組成和重復序列區(qū)相對大小有顯著差異。FISH結(jié)果表明,CentA探針具有最微弱的雜交信號;CRM1探針表現(xiàn)出梯度樣雜交模式,在中期染色體最初縊痕周圍具有最強信號,在著絲粒區(qū)外圍信號逐漸減弱;而CRM2探針表現(xiàn)出最清楚而致密的雜交信號。CentC重復序列的FISH信號強度高度依賴于CentC拷貝數(shù),這在不同玉米染色體著絲粒之間是不同的。在某些著絲粒中,CentC緊密簇集,表現(xiàn)出與其它著絲粒重復序列的輕微重疊,在其它染色體中,CentC重復序列分布顯示出與所有其它重復序列更多的重疊。具有所有4個著絲粒重復序列的花粉母細胞減數(shù)分裂后期I染色體的FISH表明,這一時期的著絲粒區(qū)高度延伸,完整著絲粒區(qū)中僅有小區(qū)段實際上與動粒連接。所有4個重復序列共同定位于微管連接區(qū)段,這表明天然功能性著絲粒區(qū)包含所有4個著絲粒重復序列。延伸DNA分子的纖維-FISH用于以更高分辨率進一步表征著絲粒重復序列的分布和排列。燕麥與玉米雜交產(chǎn)生的F1胚保留一條或多條玉米染色體(參見例如Riera-Lizarazu等(1996)TheorApplGenet93:123-135;Ananiev等59(1997)ProcNatlAcadSciUSA94:3524-3529)。這些品系提供了研究一條玉米染色體、而沒有其它9條玉米染色體的復雜背景的方法。大量燕麥-玉米附加系可得自明尼蘇達大學(UniversityofMinnesota,St.Paul,MN,USA)的RonPhillips,包'括,豐、文所用的Seneca60、A188和B73燕麥-玉米附加系。燕麥-玉米染色體附加系的DNA用于分析一條玉米染色體的著絲粒區(qū)。燕麥-玉米染色體附加系的多色纖維-FISH顯示每條染色體獨特的長達百萬堿基的著絲粒重復序列雜交延伸(圖11)。在染色體1、7和8中,所有4個重復序列分散在整個著絲粒區(qū)中。在其它染色體中,CentC呈現(xiàn)出比較短的延伸(約300kb),其側(cè)接其它3個著絲粒重復序列的"松散"陣列。經(jīng)FISH觀察,不同玉米染色體之間著絲粒區(qū)的總長度有很大差異。在該重復序列的豐度方面,CentC表現(xiàn)出一條染色體的著絲粒之間的顯著多態(tài)性,在任何給定基因型中觀察到的差異高達10倍。在中期和粗線期染色體中,染色體7具有最大的CentC串聯(lián)重復序列區(qū)組。同樣,具有玉米染色體7的燕麥-玉米附加系具有最長延伸的DNA纖維,其與CentC探針雜交。相反,在中期染色體中,玉米染色體4的著絲粒卻具有最小段的CentC重復序列區(qū)組,而最小的CentC在燕麥-玉米染色體4附加系、尤其是在玉米系B73染色體4中。當通過纖維-FISH分析時,著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子CentA、CRM1和CRM2顯示出斑點樣模式,在陽性雜交信號之間具有大的缺口。當這3個反轉(zhuǎn)錄轉(zhuǎn)座子的探針混合在一起并用作一個混合探針時,它們顯示出^t在CentC重復序列區(qū)組中的更連續(xù)的標記DNA纖維。連續(xù)標記著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子的側(cè)翼顯示出沿DNA分子的斑點樣模式,表明其它類型的DNA序列散布在著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子中,包括非著絲粒特異性元件。著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子在具有小的CentC重復序列區(qū)組的染色體(例如染色體4)著絲粒中可形成至多1Mb的+^散陣列。玉米雜種Zapalotechico具有額夕卜的(supernumary)B-染色體。Zapalotechico的減數(shù)分裂染色體的FISH表明,玉米B-染色體功能性著絲粒含有所有4個著絲粒重復序列,與在所有A-染色體中觀察到的一樣。然而,在B-染色體長臂的若干非著絲粒位點中也發(fā)現(xiàn)了CentC重復序列簇集。這些位點顯然不含其它著絲粒重復序列。古么全厶姿i知涵i+厶憑逃洛/f太AAUTCU4frr^^在T7TCUAA々士里杰EI日負責在玉米染色體上形成動粒的功能性天然著絲粒區(qū)段通常包含CentC串聯(lián)重復序列陣列以及其它3個著絲粒重復序列CRM1、CRM2和CentA(圖12)。B.BAC文庫BAC載體允許克隆大片段的基因組DNA,其大小至多達約300kb,其在細菌宿主(典型的是大腸桿菌)中可維持。已經(jīng)從動植物中產(chǎn)生了各種各樣的BAC文庫并成為公眾可得的,參見例如以下信息ClemsonUniversityGenomeInstitute(CUGI;參見以下網(wǎng)3占genome.clemson,edu)和Children'sHospitalOaklandResearchInstitiute(CHORI;參見以下網(wǎng)站chori.org)。使用多種酶,用分別代表Dent和Lancaster雜種群的兩種不同玉米基因型(B73和Mol7)進行文庫構(gòu)建,篩選大于13X覆蓋面的玉米基因組BAC文庫中的玉米著絲粒序列。i.玉米Mol7基因組BAC文庫自pBAC108L(Shizuya等(1992)ProcNatlAcadSciUSA89:8794畫8797)開發(fā)出plndigoBac536(Shizuya,未發(fā)表)和pBeloBAC11(Kim等(1996)Genomics34:213-218)BAC克隆載體。pBAC108L是基于小F因子的質(zhì)粒。F因子編碼調(diào)節(jié)其自身在細胞中的復制和拷貝數(shù)的基因。載體pBeloBACll是通過引入LacZ基因而產(chǎn)生,以便通過藍色或無色(白色)表型而鑒定重組克隆。pBeloBAC11具有3個獨特的克隆位點萬amffl、S//zI和/^"dn,這些位點側(cè)接T7和SP6啟動子。稀有切點酶(rare-cutter)限制位點A^I、£"gl、Zw"I、5Vw"I、Bg/I和S/I可用于切除來自pBeloBACll的插入序列。在載體plndigoBac536中,5coRI位點在氯霉素(CMK)基因中被修飾,使得克隆位點中的五coRI位點可用于文庫構(gòu)建。pBeloBACll載體和plndigoBac536載體具有2個選擇標記(LaeZ和C1V[R)用于轉(zhuǎn)化體的選擇?;旧习凑誎im等((1996)Genomics34:213-218)所述,在與加州理工學院(CaliforniaInstituteofTechnology)的Shizuya實驗室的合同之下,自玉米Mo17公用近交系,在pBeloBACll或plndigoBac536中構(gòu)建了有產(chǎn)權的玉米基因組BAC文庫。簡而言之,Mol7基因組DNA用//z'w^in或&oRJ限制酶部分消化。在瓊脂糖凝膠中對DNA片段進行大小分級分離后,克隆在pBeloBACl1///"cMI位點或plndigoBac536五coRI位點中。平均插入序列大小為約150kb。完整Mo17基因組BAC文庫由433個384孔板或總共166,272個BAC克隆組成。包括214板的文庫的一半含有具有歷>2^111插入序列的BAC克隆,而包括219板的文庫的另一半則含有具有五coRI插入序列的BAC克隆。BAC克隆維持在大腸桿菌DH10B(BRLLifeTechnologies)中。ii.玉米B73基因組BAC文庫得到兩個公用玉米B73基因組BAC文庫。文庫ZMMBBb可得自ClemsonUniversityGenomeInstitute(CUGI,UniversityofGeorgia,Athens,GA,USA)。ZMMBBbBAC文庫在CUGI產(chǎn)生,即通過將///wdll部分消化的玉米B73基因組DNA克隆到包含氯霉素(CMR)抗性基因的plndigoBac536載體中。ZMMBBbBAC文庫包含總共247,680個BAC克隆,平均插入序列大小為約137kb,代表14X基因組的覆蓋度。第二個B73BAC文庫CHORI-201(ZMMBBc)是由Children'sHospitalOaklandResearchInstitiute(CHORI)的PieterdeJong實'驗室的制備的,該文庫可得自CHORI的BACPACResourceCenter。為了構(gòu)建該文庫,從玉米B73核中分離出基因組DNA。用經(jīng)五coRI和EcoRI曱基化酶的組合部分消化的DNA構(gòu)建了文庫的第一區(qū)段,用她ol62部分消化的DNA構(gòu)建了第二區(qū)段。將經(jīng)大小選擇的DNA克隆到pTARBAC2.1載體(區(qū)段1,板l-288)的五coRI位點之間,并克隆到pTARBAC1.3載體(區(qū)段2,板289-576)的5amffl位點之間。用連接產(chǎn)物轉(zhuǎn)化大腸桿菌DH10B電感受態(tài)細胞(BRLLifeTechnologies)。將每個載體中用于各文庫區(qū)段的BAC克隆排列到288個384孔微量滴定板中。區(qū)段1包含106,637個單個BAC克隆,平均插入序列大小為163kb,代表6.9X基因組覆蓋度。區(qū)段2包含105,579個單個BAC克隆,平均插入序列大小為167kb,代表7.0X基因組覆蓋度??俍MMBBc文庫包含212,216個單個BAC克隆,平均插入序列大小為165kb,代表13.9X基因組覆蓋度。C.BAC文庫篩選用4個針對著絲粒序列CentA、CentC、CRM1和CRM2的單獨探針篩選玉米B73和Mo17BAC文庫。探針經(jīng)設計成為40bp長的OVERGO寡核苷酸,并且對每個著絲粒元件而言都是獨特的。通過使用合適標記,這些探針可用于菌落、和斑點雜交以及FISH和纖維隱FISH。i.重疊寡核苷酸探針重疊寡核苷酸探針通常設計為具有8bp互補重疊區(qū)的兩個短寡核苷酸。短寡核苷酸通常范圍為23-28bp,其中24bp是最常用的。退火后,寡核苷酸形成二聚體,其中16bp單鏈DNA位于兩側(cè)。標記部分雙鏈探針,即在標記核苷酸存在下,通過用克列諾(Klenow)酶的聚合活性填補凹進的3'端。最終重疊寡核苷酸探針包含標記雙鏈40bp探針。表l列出引物和探針,用于產(chǎn)生、篩選和表征BAC克隆、DNA構(gòu)建體和玉米微染色體事件。表l<table>tableseeoriginaldocumentpage64</column></row><table><table>tableseeoriginaldocumentpage65</column></row><table>7874808subtelo-TR430-OvG8rTAGGTTTCCATAAAATCGTGTGCT7965650180knobOvG21-60fTGTCGAAAATAGCCATGMCGACC8065651180knobOvG21-60rCGGTATTATTGGAAATGGTCGTTC8165652180knobOvG71-"0fCCTACGGATTTTTGACCAAGAAAT8265653180knobOvG71-110rATTTCTAGTGGAGACCATTTCTTG8365654180knobOvG141-爾ATGTGGGGTGAGGTGTATGAGCCT8465655180knobOvG141-術ATGAGCCTCTGGTCGATGATCAAT85656565SrDNAOvG1-40fGGATGCGATCATACCAGCACTAAA86656575SrDNAOvG1-40rTGATGGGATCCGGTGCTITAGTGC87656585SrDNAOvG61-簡CTTGGGCGAGAGTAGTACTAGGAT88656595SrDNAOvG61-100rTCCCAGGAGGTCACCCATCCTAGT89656605SrDNAOvG161-200fACCATAGTAAAAATGGGTGACCGT90656615SrDNAOvG161-200rTAATTTMCACGAGMCGGTCAC91656625SrDNAOvG261-230fCCGTGGGCGAGCCGAGCACGGAGG92656635SrDNAOvG261隱230rTCCTC丌ATGCCCACACCTCCGTG9365664350knobOvG31-70fCTCAAATGACGTTTCTATGATA丌9465665350knobOvG31-70rTGAATACAATGCCCTCMTATCAT9565666350knobOvG121-160fCTAGGTTTCCTATAATCCCCTCTA9665667350knobOvG121-160rCTAGGTATGCC7TGAATAGAGGG9765668350knobOvG161-200fATGTTGTTTATGTCCACTCAAGTA9865669350knobOvG161-200rATGGTGTACGGTGTTTTACTTGAG9965670350knobOvG261-300fGTGAGATCTGTCCAAACATAGGTT10065671350knobOvG261-300rGGTGCCTTACMCCGTAACCTATG101b010.m7fis31GCAAACTTTATGTGATCCCTTCCTCGCTGAACGAGATGAG102b108.h15fis47GGGACGGCAAGTCACGGTAAGACCAGTCCAACCGAATGAT103Cen3n.pk0001.g"CCAAACTTGCTGAGATTACTGGGCMTCTGTTCGCTCGCA10410302223715-3101-3200fCCAGGTAG丌TGAAACAGTATTCT10510302323715-3501-360WATAAAGGAAAAGGGCAAACCAAAC10610302423715-1401-1500fGATGCCCACATTATAGTGATTAGC10710302523715"2901-3000fCCACATATAGCTGCTGCATATGCC10810302623715-3701-3800fCGGATCTAACACAAACATGAACAG10910302723715-1-100fCGATGAATTTTCTCGGGTGTTCTC11010302823715-101-200fCCTGCAGCCCTAATAATTCAGAAG"110302923715"301-400fCACAGTCGATGAATCCAGAAAAGC11210303023715陽901-1000fGCGTGCAATCCATCTTGTTCAATC"310303123715-3201-3300fCAACCACACCACATCATCACAACC114103032237t5"3601-3700fACTGGCAAGTTAGCAATCAGAACG"510303323715"4901-5000fCATGMCGTGTCTTCAACTAGAGG"610303423715-42014300fGACGGCGTTTMCAGGCTGGCA丌11710303523715-201-300fCCAAGCTC丌CAGCAATATCACGG66<table>tableseeoriginaldocumentpage67</column></row><table><table>tableseeoriginaldocumentpage68</column></row><table>ii.BAC文庫篩選結(jié)果菌落雜交篩選鑒定了約8000個BAC克隆庫,其可與4個著絲粒特異性探針中的至少一個雜交。根據(jù)雜交特性,將8000個BAC克隆分為4組(表2)。表2組別總量含有CentA的所有BAC842含有CentC的所有BAC2479含有CRM2的所有BAC2968含有CRMl的所有BAC6012根據(jù)著絲粒重復序列組成,根據(jù)與每個特定BAC克隆雜交的探針組合,可將BAC克隆進一步分為15組(表3)。表3組別BAC數(shù)量含有CentA和CentC和CRMl和CRM2的BAC247含有CentA和CentC和CRM2的BAC;不含CRMl6含有CentA和CentC和CRMl的BAC;不含CRM245含有CentA和CRMl和CRM2的BAC;不含CentC116含有CentC和CRMl和CRM2的BAC;不含CentA730含有CentA和CentC的BAC;不含CRMl不含CRM24含有CentA和CRMl的BAC;不含CentC不含CRM2131含有CentA和CRM2的BAC;不含CentC不含CRMl27含有CentC和CRM2的BAC;不含CentA不含CRMl97含有CentC和CRMl的BAC;不含CentA不含CRM2829含有CRMl和CRM2的BAC;不含CentA不含CentC749含有CentC的BAC;不含CentA不含CRMl不含CRM2521含有CRM2的BAC;不含CentA不含CentC不含CRMl966含有CRMl的BAC;不含CentA不含CentC不含CRM23165含有CentA的BAC;不含CentC不含CRMl不含CRM226669BAC克隆還可根據(jù)與每個特定探針雜交的BAC克隆的總和來分類(表4)。表4<table>tableseeoriginaldocumentpage70</column></row><table>一組247個BAC克隆含有所有4個著絲粒重復序列。它們包含0.15%的玉米基因組,或者它們在每個著絲粒中的DNA區(qū)段上平均存在約300kb。該組BAC克隆鑒定為核心組(coreset),可先用于實驗以構(gòu)建玉米微染色體。從核心組中所有247個BAC中純化DNA,用Xmwl或消化,轉(zhuǎn)印并與4個著絲粒重復序列的每一個雜交。DNA斑點雜交證實,該核心組的克隆含有所有4個著絲粒重復序列。BAC表現(xiàn)出限制片段組成和雜交模式的普遍差異,并且可根據(jù)限制片段相似性,進一步分為87組。87組(表5)中每組取一個代表,產(chǎn)生核心組DNA構(gòu)建體和/或BAC核心組構(gòu)建體庫,用于轉(zhuǎn)化和孩史染色體裝配。表5<table>tableseeoriginaldocumentpage71</column></row><table>D.反向CentC重復序列陣列的鑒定在來自玉米系Mo17和B73的BAC文庫中搜索反向CentC串聯(lián)陣列。對Mo17BAC-末端序列數(shù)據(jù)庫進行BLAST搜索,顯示出591個含CentC重復序列的BAC末端。這其中僅有45個BAC克隆在兩端含有CentC重復序列,而44個BAC具有相同方向的CentC重復序列,僅一個BAC具有相反方向的CentC重復序列(bacm.pkl28.j21)。通過DNA印跡雜交分析發(fā)現(xiàn)了第二個具有相反方向的CentC重復序列的BAC克隆bacm.pk008.d20。該克隆的DNA印跡分析表明雜交模式與bacm.pkl28.j21中所觀察到的非常相近。對公用的B73BAC-末端序列數(shù)據(jù)庫進行BLAST搜索,顯示出136個含有CentC重復序列的BAC末端。這其中僅有5個BAC克隆在兩端含有CentC重復序列,而4個BAC具有相同方向的CentC重復序列,僅一個BAC具有相反方向的CentC重復序列(ZMMBBb0243L15)。bacm.pkl28.j21和bacm.pk008.d20的DNA用限制酶水解,將CentC重復序列切割成單體或二聚體的短片段。分離出10kbZw"I片段,亞克隆并測序。序列分析表明,CRM1元件(SEQIDNO:191)位于兩個反向CentC重復序列之間。E.玉米染色體4的著絲粒BAC克隆的分離玉米染色體4含有最短的CentC重復序列陣列。經(jīng)纖維-FISH評價,這些陣列以約300kb的單一延伸DNA的形式存在。該區(qū)段可含有核心功能性著絲粒DNA序列,并且可潛在地由2-4個重疊BAC克隆表示??赏ㄟ^發(fā)現(xiàn)位于染色體4著絲粒區(qū)的獨特DNA序列,而鑒定染色體4特異性著絲粒BAC克隆。分析玉米Mo17基因組BAC文庫(包含10,965個BAC末端序列),以鑒定在文庫中只出現(xiàn)一次的獨特BAC末端序列。鑒定和選擇了81個獨特BAC末端序列,用于進一步表征。針對81個獨特BAC末端序列的每一個都設計出一對PCR引物,用于作圖到燕麥-玉米染色體72附加系圖上,而且每個獨特序列都分配到單條玉米染色體。來自Mo17的bacm.pkl08.hl5BAC末端序列(170kb)作圖到染色體4。該BAC經(jīng)過測序,發(fā)現(xiàn)6個獨特序列以及所有4個著絲粒重復序列CentA、CentC、CRM1和CRM2。使用PCR,該BAC分配到含若干BAC的毗連群,其也與CentC雜交。經(jīng)測序證實,該毗連群的多兩個BAC克隆bacm.pk010.m7(170kb)和bacm.pkl84.c21(150kb)與bacm.pkl08.W5部分重疊并共享某些獨特標記。在這3個BAC克隆中鑒定出3個獨特DNA序列,而且通過對燕麥-玉米附加系DNA進行PCR,證實其染色體4的定位。開發(fā)出相應的重疊寡核苦酸探針(表1中的SEQIDNO:102-104)并用于篩選B73公用BAC文庫。根據(jù)與所有3個染色體4特異性探針雜交,選擇來自B73BAC文庫的7個BAC克隆。這些BAC克隆的DNA用義m"I消化,轉(zhuǎn)移到膜上并與所有4個著絲粒重復序列纟笨針雜交。所選B73BAC克隆中有4個含有CentC、CRM1和CRM2著絲粒重復元件bacb.0424.d20(150kb);bacb.0155.h15(175kb);bacc.0048.g5(170kb);和bacc.0237.m8(125kb)。另有3個B73BAC克隆只含CRM1著絲粒重復元件和CRM2著絲粒重復元件bacc.0143.i9(205kb);bacc.0237.j16(175kb);和bacc.0270.cl(180kb)。對bacb.0155.h15BAC克隆進行測序證實,它含有與染色體4特異性Mo17BAC克隆bacm.pk010.m7和bacm.pkl08.hl5顯著同源的區(qū)域。代表來自Mo17和B73近交系的染色體4的著絲粒區(qū)的2組BAC克隆用于產(chǎn)生DNA構(gòu)建體,用于微染色體裝配。F.染色體著絲粒DNA片段的分離和純化基本上所有玉米基因組DNA都有大量曱基化,而且這樣的曱基化模式可能在玉米著絲粒的裝配、功能和/或維持方面起作用。維持曱基化和/或其它天然基因組特性(例如元件的大小、組構(gòu)和其它天然核苷酸修飾)的分離玉米基因組DNA,可用于產(chǎn)生DNA構(gòu)建體,用于玉米微染色體裝配。i.限制酶的選擇玉米著絲粒重復序列的序列分析鑒定出了大量限制酶(6個切點酶),這些酶在任何著絲粒重復序列CentA、CentC、CRM1或CRM2內(nèi)都沒有識別位點(表6)。這些限制酶應當將大量基因組DNA消化成小DNA片段,其大多數(shù)的大小為約1-20kb,而預期著絲粒DNA明顯更長。可使用這些限制酶中的至少一種,部分或完全消化玉米高分子量(HMW)基因組DNA,分離玉米染色體著絲粒區(qū)。在瓊脂糖凝膠塊中埋置的玉米核脈沖場凝膠電泳(PFGE)后,可純化含有約50kb至約1000kb大片段的已消化的HMW基因組DNA部分。ii.HMW玉米基因組DNA的制備和表征基本上按照Liu和Whittier((1994)NucleicAcidsRes22:2168-2169)所述,通過用表6的各種限制酶消化和PFGE分級分離,自瓊脂糖凝膠塊中埋置的DNA,制備來自Mo17的HMW玉米基因組DNA。選擇5種限制酶&;TI、爿afll、C/r9I、Mz'I、Mwl用于初步分析。從中選出B5pTI用于所有的進一步制備。用標記CentC著絲粒探針進行斑點雜交表明,限制酶產(chǎn)生一系列基因組著絲粒DNA片段,范圍為約50kb至約600kb,它們與其余基因組DNA分離良好。用3種其它著絲粒探針(CentA、CRMl和CRM2)與同樣的DNA片段雜交證實,含有所有4個著絲粒重復序列的這些長DNA片段基本上不含萬^TI限制位點。雜交條帶表示單個著絲粒DNA片段,其可分離出來并用于產(chǎn)生DNA構(gòu)建體,用于微染色體裝配。74表6酶Rec位點酶Rec位點AGGCCTCCGCGGAa川GACGTC;Pac25lCCCGGG/AccBSICCGCTC;Pae14klCCGCGG扁CTTAAGCCGCGG腳lCCCGGG〗PaeAICCGCGG/A鄰MIAGGCCTPaeBICCCGGG8函lACGCGTPaeQICCGCGGCTTAAGPeelAGGCCT8pwB51CGTACGP/723IICGTACG8s/WICGTACGIPme55lAGGCCT8spTICTTAAG;CGTACGSsrBIGAGCGG:PspAICCCGGG8sf31NICCGCTC;PSjoALICCCGGGSs扮81CTTAAGPspLICGTACGSsfD1021CCGCTC;SacllCCGCGGSs〖PZ7401CTTAAG;SariAGGCCTS(/t/BICGTACG;Sc/ZICCGCGGCfr421CCGCGG;SerPT14blCCGCGGC柳CCCGGG;SexBICCGCGGC鋼CCCGGG;SexCICCGCGGCsclCCGCGG量S/K303ICCGCGGEae461CCGCGG:SgrBICCGCGGEaeAICCCGGGjSmalCCCGGGEc/RICCCGGG;;Sp/lCGTACGEco1471AGGCCT;SpwlCCGCGGEco29klCCGCGG;;Sr"30DIAGGCCTEsp41CTTAAG;SseBIAGGCCTGa/ICCGCGG;Ssp5230lGACGTCGceGLICCGCGG;;Ss川CCGCGGGcelCCGCGG;AGGCCTGofZIAGGCCT;AGGCCT3781CCGCGGCGTACG/<splCCGCGG師a4641CTTAAGMaeK811CGTACG;,1CCCGGG函CCGCTCiXmaCICCCGGG廳lACGCGT;CCCGGGMspCICTTAAGZralGACGTCWgoAIIICCGCGG實施例2.端粒序列的鑒定和分離含有端粒重復序列的任何功能性端粒區(qū),無論是天然的、克隆的75還是合成的,都可用于制備DNA構(gòu)建體。若干端粒重復序列是已知的,包括來自以下的那些四膜蟲屬(r^ra/^we"a)、草履蟲屬(尸arawec/MW)、尖毛蟲屬(Qx^n'c/k3)、游4卜蟲屬(五w/^ofes)、網(wǎng)柄菌屬(Z)z'c&oWe"wm)、酵母屬(Sacc/2an9m;/ce力、#斤小斥干纟戔蟲屬(G3fe"oWzaZ^/to)、4偉蟲屬(7)7/7awasom(3)、矛H十曼原蟲屬(丄e^/wam'a)、纟成:^包菌屬CP/j^flnm2)、4以南芥屬04n3^Wc;psz's)、人和'J、鼠。端粒重復序列示例性的生物CCCCAA(C4A2)CCCCAAAA(C4AOCCCTA(C3TA)CCCTAAA(C3TA3)四膜蟲屬(refr(3/^we"a)、草履蟲屬(戶arame"'ww)尖毛蟲屬(Ocyfr/c/wr)、游仆蟲屬(五wp/ofes)錐蟲屬(ro^pa"oso/wa)、利什曼原蟲屬(丄ds/wwm'a)、絨泡菌屬(尸—arww)酵母屬CSacc/wrowy;cas)網(wǎng)柄菌屬(Z)z'cOwfe"MW)擬南芥屬04raWcfcp5的、人、小鼠、新小桿線蟲屬(Cae"or/ia&(^泡)A.合成端粒序列端粒序列的高度保守的重復特性允許化學合成和/或PCR擴增長端粒區(qū),適用于載體構(gòu)建。可產(chǎn)生側(cè)接」微染色體末端的長端粒重復序列#殳,例如(CCCTAAA)n??赏ㄟ^幾輪PCR擴增,用引物對SEQIDNO:5和6,通過兩個互補端粒寡核苷酸及其產(chǎn)物共同引發(fā),可制備長延伸的串聯(lián)端粒重復序列。用低濃度引物(<O.lpM)的PCR反應可制備約100-10000bp的DNA區(qū)段。可通過磷酸化寡核苷酸的連接,產(chǎn)生任選的合成端粒重復序列??寺《肆NA區(qū)段并用于制備DNA構(gòu)建體。B.亞端粒序列的鑒定和分離i.含端粒重復序列的BAC克隆具有含端粒重復序列的亞端粒區(qū)的BAC克隆可用于穩(wěn)定^t染色體構(gòu)建體的染色體末端。先前已鑒定許多序列是亞端粒重復序列(Burr76等(1992)JPlantCell4:953-60)。Genbank序列數(shù)據(jù)庫對于端粒和亞端粒序列是關鍵詞搜索。對所選序列進行比對并鑒定共同的重復元件(Telo266,SEQIDNO:189)。采用SEQIDNO:189,可設計若干寡核苦酸并用作探針,以篩選Mo17BAC文庫?;厥沾罅緽AC,選擇一個(bacm.pkl07.gl),進行標記,然后與粗線期染色體雜交。在玉米染色體的20個亞端粒中發(fā)現(xiàn)了6個成簇的BAC克隆序列。將bacm.pkl07.glBAC插入序列亞克隆并測序。序列分析顯示出共同的重復元件(TR430,SEQIDNO:190),其可用于設計重疊寡核苷酸4笨針(表l)。通過對玉米Mol7和B73粗線期染色體進行FISH,證實了這些重復序列的亞端粒定位。用同樣的探針,通過菌落雜交篩選玉米Mol7基因組BAC文庫。證實約有71個含玉米亞端粒重復序列區(qū)組的BAC克隆具有TR430亞端粒重復序列(表7)。表7<table>tableseeoriginaldocumentpage77</column></row><table>用D戶I進行限制性指紋圖譜分析,并用TR430探針(CCCTAAA)n探針進行斑點雜交,并針對knob180bp重復序列探針表明,至少有3類亞端粒BAC克隆。第一類是大于10-20kb的長TR430相關重復序列段。第二類BAC克隆具有TR430相關重復序列,其在單元內(nèi)具有限制位點,其中單元大小可以為800bp或900bp。某些BAC克隆同時含有這2種重復序列。第三類BAC克隆具有約500bp的TR430bp相關單元。這些BAC克隆中的一些也具有端粒(CCCTAAA)n相關重復序列。knobl80bp重復序列也存在于37個亞端粒BAC克隆中,表明knob180bp重復序列可以是某些亞端粒區(qū)的組成部分。每一類都用代表性BAC克隆進行進一步分析、改型實驗和轉(zhuǎn)基因?qū)嶒瀊acm.pk038.g6;bacm2.pk063.g24;bacm.pk071.cl2;bacm.pkll2.bl8;bacm,pkl42.bl5;bacm.pkl73.e9。具有亞端粒片段的BAC插入序列可用于DNA構(gòu)建體,用于微染色體的體外裝配或在植物細胞內(nèi)裝配。ii.天然染色體端粒DNA片段的分離通過用限制酶消化的玉米基因組DNA的大小分級分離,從玉米基因組DNA中純化保留至少一種天然基因組特征(例如曱基化模式)的染色體端粒片段,其具有4bp或更小的短識別位點。天然玉米端粒序列在每個端粒中包含成百上千個CCCTAAA串聯(lián)重復序列,這種短端粒串聯(lián)重復序列沒有任何已知限制酶的識別位點。任何能識別2-4bp序列的短切點限制酶都可使用,只要它們對正則端粒串聯(lián)重復序列(CCCTAAA)n沒有特異性。短切點酶將大部分基因組DNA消化成小片段,其可與更大的端粒DNA分開。用兩種或更多種短切點限制酶的組合可消除未被第一種酶裂解的其它非端粒DNA片段。已知的限制酶在正則串聯(lián)端粒重復序列中都沒有識別位點。來自Mo17的玉米基因組DNA用5"m/3A限制酶消化,通過印跡雜交測定,大多數(shù)玉米基因組DNA變?yōu)榉浅P〉钠?小于lkb),而大多數(shù)端粒DNA片段卻大于約15kb。每個單倍體基因組的S""3A端78粒DNA區(qū)段的總長度為約400kb,或占總玉米單倍體基因組的0.02%。約lmg總玉米基因組DNA得到約200ng端粒DNA片段(在未消化的殘留部分中)??梢詮哪z純化基因組端粒DNA部分,用于產(chǎn)生DNA構(gòu)建體,用于微染色體裝配。實施例3.復制起點DNA構(gòu)建體用攜帶復制起點的DNA區(qū)段改型,以使轉(zhuǎn)基因植物細胞核中的構(gòu)建體和/或微染色體能適當復制。在植物細胞中起作用的任何復制起點都可使用??捎玫膹椭破瘘c是已知的,包括植物復制起點和病毒復制起點。任選如果非植物宿主細胞中保留構(gòu)建體的話,構(gòu)建體中至少包含一個合適復制起點,例如細菌和/或酵母菌的復制起點。A.18-26SrDNA的非轉(zhuǎn)錄間隔序列已充分了解的真核復制起點是18-26SrDNA非轉(zhuǎn)錄間隔序列(Ivessa和Zakian(2002)GenesDev16:2459-2464),其在植物中具有功能(Hernandez等(1993)EMBOJ12:1475-85)??蓮囊韵赂鞣N不同植物中分離18-26SrDNANTSDNA序列,例如玉米(Ze"way力、小麥(7Wf/cwmaes"vwm)、燕、麥(/4ve"asa"va)、大麥(^oniewmvw/gare)、#以南芥(^raZHWo;^Aa"a"")和/或大豆(G7少c/"ewox)。將這些序列以單拷貝或多個^t拷貝形式克隆到構(gòu)建體中。真核細胞染色體通常具有多個復制起點,因此含有多個復制起點的DNA構(gòu)建體是有用的。除非另有說明,否則玉米18-26SrDNANTS序列用于DNA構(gòu)建體(Toloczyki和Feix(1986)NucleicAcidsRes14:4969-86)。B.小麥矮縮病毒(Wheatdwarfvirus,WDV)起始子蛋白(Rep)小麥矮縮病毒(WDV)起始子蛋白(Rep)及其同源復制起點可用于產(chǎn)生DNA構(gòu)建體,用于微染色體裝配。小麥矮縮病毒(WDV)起始子蛋白(Rep)及其同源復制起點可用于支持微染色體構(gòu)建體在玉米細胞79中復制。DNA構(gòu)建體中可提供WDV復制起點(順式),而起始子Rep蛋白和細胞周期刺激RepA蛋白所需基因可通過共同轉(zhuǎn)化由獨立質(zhì)粒構(gòu)建體(反式)提供(Sanz-Burgos和Gutierrez(1998)Virology243:119-129)。實施例4.刺激生長的多核香酸和多肽可在S1入包含玉米著絲粒序列和/或亞端粒片段的DNA構(gòu)建體之前、期間或之后,提供多核苦酸和/或多肽,所述多核苦酸和/或多肽通過促進細胞分裂、進入S期、刺激細胞分裂和/或在培養(yǎng)基中生長或改進轉(zhuǎn)化而增強細胞生長。采用任何合適的遞送方法,任何這樣的組成或其組合都可使用,包括多核苷酸、多肽和/或其它因子。A.復制相關蛋白A可提供小麥矮縮病毒(WDV)復制蛋白A以增強細胞生長和/或轉(zhuǎn)基因事件的恢復。保留復制活性的RepA和不支持病毒復制的修飾RepA都可使用。例如,可將攜帶nos啟動子::RepA的質(zhì)粒與DNA構(gòu)建體共同遞送到植物細胞中。預期最初3天RepA的瞬時表達足以刺激細胞分裂并增強事件的恢復(參見例如WO00/50614,通過引用結(jié)合到本文中)。B.細胞周期蛋白參與細胞周期調(diào)節(jié)的細胞周期蛋白可增強細胞生長和轉(zhuǎn)基因事件的恢復。例如,玉米細胞周期蛋白D可刺激培養(yǎng)基中細胞分裂和愈傷組織生長并改進玉米轉(zhuǎn)化。E2F的異位表達誘導擬南芥細胞增殖,通過Dpa的共同表達可增強該效應(deVeylder等(2002)EMBOJ21:1360-1368)。已從植物中分離到許多細胞周期同源物,包括細胞周期蛋白D、細胞周期蛋白E、weel、Rb、Rbr3、E2F/DP等(美國專利6,518,487;W099/61619;WO00/37645;WO02/074909;Xie等(1996)EMBOJ15:4卯0-4908;所有這些文獻都通過引用結(jié)合到本文中),并可導入載體中,遞送到植物細胞內(nèi)。C.Wuschel觸發(fā)特定發(fā)育途徑的基因也可用于增強細胞生長。例如wox家族成員(例如wuschel(WUS))看來在表達WUS的細胞和相鄰細胞中都能刺激細胞分裂??墒褂煤芯幋aWUS多肽的多核苷酸的構(gòu)建體,通過與DNA構(gòu)建體共同轉(zhuǎn)化而刺激細胞分裂。已知擬南芥和玉米等植物中有若干植物WUS同源物(例如Mayer等(1998)Cell95:805-815;WO01/0023575;和US2004/0166563,所有這些文獻通過引用結(jié)合到本文中),并且可用于增強轉(zhuǎn)化細胞的生長。例如,構(gòu)建了包含玉米WUS基因的構(gòu)建體PHP21139ubipro::ubi5'UTR::ubiintron::WUS::pinIID.胚珠發(fā)育蛋白2其它目標基因包括轉(zhuǎn)錄因子AP2/ERF家族的相關成員,其優(yōu)先在發(fā)育中的胚和種子中表達,包括在玉米胚胎形成早期表達的胚珠發(fā)育蛋白2(ZmODP2)。當異位表達時,ODP2可刺激包括非胚胎組織在內(nèi)的各種組織的細胞生長,這可促進轉(zhuǎn)基因事件的恢復。該基因家族包括babyboom(BBM、BNM3、ODP2),其已知能誘導植物的異位體細胞胚(ectopicsomaticembryos)(Boutilier等(2002)PlantCell14:1737-1749)。BBM/ODP2同源物是已知的,包括玉米同源物(WOOO/75530,通過引用結(jié)合到本文中)并且可遞送到植物細胞中,以增強細胞生長。例如,構(gòu)建了含玉米ODP2基因的構(gòu)建體PHP21875ubipro::ubi5'UTR::ubiintron::ODP2::pin11E.Knotted-1同源框基因(包括knox基因家族成員,例如KN1、KNAT1和STM)在植物分生組織的起始和/或維持中起作用(Jackson等(1994)Dev120:405-413;Lincoln等(1994)PlantCell6:1859-1876;Venglat等(2002)81ProcNatlAcadSciUSA99:4730-4735)。在植物中,許多knox家族成員是已知的,包括玉米同源物(Vollbrecht和Hake(1991)Nature350:241-243;Kerstetter等(1994)PlantCell6:1877-1887;Serikawa等(1996)PlantMolBiol32:673-683)并可用于構(gòu)建載體,遞送到植物細胞中。F.LeclLeafycotyledon基因(例如Lec1和Lec2)參與植物胚胎發(fā)育和轉(zhuǎn)錄活性的調(diào)節(jié)(Meinke等(1994)PlantCell6:1049-1064;Lotan等(1998)Cell93:1195-1205;WO00/28058;Stone等(2001)ProcNatlAcadSciUSA98:11806-11811;美國專利6,492,577,通過引用結(jié)合到本文中)。許多同源物是已知的,其可用于構(gòu)建載體,用于遞送到植物細胞中。G.生長刺激多核苷酸組合可在引入包含玉米著絲粒序列和/或亞端粒片段的DNA構(gòu)建體之前、期間或之后,提供多核苷酸和/或多肽的組合,所述組合通過促進細胞分裂、進入S期、刺激細胞分裂和/或在培養(yǎng)基中生長或改進轉(zhuǎn)化而增強細胞生長。例如編碼玉米ODP2(PHP21875)和玉米WUS(PHI21139)的多核苷酸可與包含玉米著絲粒和/或亞端粒區(qū)的DNA構(gòu)建體一起用于轉(zhuǎn)化實驗。通常,如實施例6D所述,通過BARK表型和熒光標記蛋白(DsRed)表達測定,在未成熟玉米胚粒子轟擊共同轉(zhuǎn)化中的ODP2和/或WUS顯示轉(zhuǎn)基因事件的頻率明顯增加。當在轉(zhuǎn)化混合物中提供時,觀察到平均1008次事件/4800個原始胚(21%)。沒有PHP21139或PHP21875,觀察到8次事件/706個原始胚(1%)。對轉(zhuǎn)基因事件進行進一步分析表明,ODP2和/或WUS共同轟擊的構(gòu)建體不整合到基因組或裝配微染色體中。實施例5.載體的構(gòu)建參見例如以下文獻,采用標準分子生物學方案,用任何標準轉(zhuǎn)化方案構(gòu)建環(huán)狀或線狀載體,用于遞送到植物細胞中Sambrook等(1989)Mo/ecw/arC7om'"gv爿丄o6ora/。^7她做a/,第2版,ColdSpringHarborLaboratory第1-3巻。使用標準技術,通過組合分離的染色體元件,任選與其它目標多核苷酸一起,構(gòu)建轉(zhuǎn)化^t物細^^的載體。載體包括經(jīng)設計能維持在常用宿主系統(tǒng)(例如大腸桿菌、土壤桿菌或酵母菌以及植物細胞)中的那些。通常,構(gòu)建體還包含在植物細胞中起作用的選擇標記和/或篩選標記,從而有助于維持、鑒定和/或選擇包含微染色體構(gòu)建體的植物細胞。此外,構(gòu)建體通常包含可克隆額外目標多核苷酸的若干獨特限制位點。構(gòu)建體也可包括位點特異性重組位點,用于重組克隆,和/或用于隨后打靶和/或修飾微染色體。下文描述來自含有著絲粒序列的玉米BAC克隆的DNA構(gòu)建體,用于直接遞送或土壤桿菌介導的植物轉(zhuǎn)化??稍贐AC克隆構(gòu)建體上和/或以反式在單獨DNA構(gòu)建體中提供不同組分。A.標記各種標記可用于鑒定包含所導入DNA構(gòu)建體的轉(zhuǎn)化細胞??梢姌擞洶晒獾鞍祝鏏mCyan、ZsYellow或DsRed(ClonTechLaboratories,Inc.,MountainView,CA,USA)。選擇才示記包才舌PAT、BAR、GAT等。構(gòu)建了用于遞送給植物細胞的含紅色熒光蛋白(DsRed2)和PAT選擇標記的表達盒PHP23715,其包含以下有效連接的組分ubipro::ubi5'UTR::ubiint薩:DsRed2::moPAT::pin11構(gòu)建了用于遞送給植物細胞的含藍色熒光蛋白(AmCyan)的DNA構(gòu)建體PHP23714,其包含以下有效連接的組分ubipro::ubi5'UTR::ubiintron::AmCyanl::moPAT::pinIIB.土^農(nóng)桿菌載體用以下文獻所述的雜交系統(tǒng),制備土i裏桿菌雙元質(zhì)粒Komari等((1996)PlantJ10:165-174)。將pSBll衍生物構(gòu)建成媒介T-DNA構(gòu)83建體,其在T-DNA邊界序列之間含有所需構(gòu)型。質(zhì)粒pSB11得自JapanTobaccoInc.(Tokyo,Japan)。自pSB21構(gòu)建pSB11,自起始栽體構(gòu)建pSB21,描述于Komari等((1996)PlanU10:165-174)。T-DNA質(zhì)粒通過同源重組整合到超級雙元質(zhì)粒pSBl的描述可參見EP672752Al。質(zhì)粒pSBl也得自JapanTobaccoInc.。在LBA4404中制備共合體后,這些質(zhì)粒用于土壤桿菌介導的轉(zhuǎn)化。按照以下文獻所述方案,產(chǎn)生攜帶pSBl的土壤桿菌LBA4404菌抹的電感受態(tài)細胞Lin(1995)載于MethodsinMolecularBiology,Nickoloff,J.A.主編(HumanaPress,Totowa,NJ)。制備細胞和DNA用于電穿孔,即通過將1jal質(zhì)粒DNA(100ng)與20|al感受態(tài)細胞在LifeTechnologies(現(xiàn)為WhatmanBiometra)的0.15cm間距電才及杯(WhatmanBiometra#11608-03l)中混合。在Cell-Pomtor電穿孔儀中進行電穿孔,用脈沖控制單元(WhatmanBiometra#11604-014),設定在330|nF,增壓器(WhatmanBiometra弁11612-017)設定在4kW。系統(tǒng)遞送約1.8kV給土壤桿菌細胞。通過限制分析共合體質(zhì)粒證實成功重組,然后分離并轉(zhuǎn)化給大腸桿菌DH5a細胞,用于擴增。C.線狀DNA構(gòu)建體通過連接進行體外裝配通過制備處于泛蛋白啟動子(ubi)之下的組分DNA片段,例如玉米著絲粒序列、選擇標記(DsRed2和AmCyan)、真核復制起點(ori)、端粒序列(TEL)和賦予雙丙氨膦(PAT)抗性的基因,產(chǎn)生線狀DNA構(gòu)建體微染色體載體。在一個實例中,從包含側(cè)接CRM1著絲粒重復序列元件的反向CentC重復序列串聯(lián)陣列的著絲粒BAC克隆bacm.pkl28.j21,制備線狀微染色體載體。通過用7Vort消化和瓊脂糖凝膠純化,自bacm.pkl28.j21產(chǎn)生DNA片段。將包含著絲粒區(qū)的純化片段與特異性限制消化片段結(jié)合,后者包含選擇標記和復制起點ubipro::ubi5'UTR::ubiintron::DsRed::moPAT-18S-26SrDNANTS(iVo/IAS/^I)和第二選擇標記盒ubipro::ubi5,UTR::ubi84intron::AmCyan::moPAT(JVoflASmaI)以及來自其構(gòu)建體的端粒序列或Smd/A:;wl)。制備DNA片段,使得各片段包含獨特識別位點,用于在連接期間進行獨特線狀結(jié)構(gòu)的體外裝配。所裝配的線性化載體包含丁EL-0/d)-ubipro::ubi5,UTR:ubiintron::AmCyan::moPAT-(;A/ori)-bacm.pkl28.j21-(iVort)-ori-ubipro::ubi5'UTR::ubiintron::DsRed::moPAT-(腸l)-TELD.DNA構(gòu)建體-環(huán)狀改型BAC克隆載體任何著絲粒和/或亞端粒BAC克隆或染色體片段克隆都可用額外組分改型,用于植物轉(zhuǎn)化。EPICENTREEZ::TNpMODTM-2MCS轉(zhuǎn)座子構(gòu)建載體系統(tǒng)(EpiCentreMadison,WI,USA)用于將目標多核苷酸改型為現(xiàn)有的BAC克隆。pMOD-2是基于pUC的質(zhì)粒,其具有colEl復制起點和介于EZ-Tn5轉(zhuǎn)座酶識別的極度活躍的19bp鑲嵌末端(ME)之間多克隆位點(MCS)。Tn5-2轉(zhuǎn)座子隨機整合到各靶DNA上,因此各轉(zhuǎn)座反應產(chǎn)生小的構(gòu)建體文庫,其具有不同整合位點。單個改型克隆或克隆組的DNA制備物可用于轉(zhuǎn)化植物細胞。i.著絲粒BAC根據(jù)限制酶消化和DNA印跡雜交模式,選擇2個代表性僅含CentC的BAC(bacm.pk018.113和bacm2.pkl74.o21)。這些BAC克隆用EPICENTREEZ::TNpMODTM-2MCS構(gòu)建系統(tǒng)改型,產(chǎn)生環(huán)狀DNA構(gòu)建體,用于植物轉(zhuǎn)化和微染色體裝配MCS用于插入DNA片段,其包含選擇標記ubipro::ubi5'UTR::ubiintron::DsRed::moPAT,其含有或不含玉米18-26SrDNANTSori,以產(chǎn)生第一形式的定制轉(zhuǎn)座子構(gòu)建體Tn5-ls??寺∧繕薉NA序列后,通過尸WAI限制酶消化產(chǎn)生轉(zhuǎn)座子。一旦整合后,BAC構(gòu)建體通過用轉(zhuǎn)座子探針進行菌落雜交,選擇轉(zhuǎn)化大腸桿菌陽性克隆,并從85所選陽性克隆中分離DNA。ii.亞端粒BAC從亞端粒BAC庫中選出6個代表性BAC克隆:bacm.pk038.g06、bacm2.pk063.g24、bacm.pk071.c12、bacmpkll2駕、bacm.pkl42.b15和bacm.pkl73.e09。構(gòu)建了包含18-26SrDNANTSori-ubipro::ubi5'UTR::ubiintron::DsRed::moPAT、Kanf基因和3種不同歸巢限制酶(I-尸;oI、I-Cewl和Pl-5bel)的位點的新定制的Tn5-2轉(zhuǎn)座子構(gòu)建體,用于改型亞端粒BAC克隆。改型的BAC構(gòu)建體轉(zhuǎn)化大腸桿菌,在卡那霉素和氯霉素上進行選擇,從所選陽性克隆中分離DNA。E.DNA構(gòu)建體-線性化改型的BAC克隆產(chǎn)生了額外定制的Tn5-3轉(zhuǎn)座子構(gòu)建體。這些Tn5-3載體包含18-26SrDNANTSori-ubipro::ubi5'UTR::ubiintron::DsRed::moPAT。構(gòu)建體也包含Kanf基因,其側(cè)接兩個反向DNA區(qū)段(各自由兩個歸巢限制酶I-CewI和PI-SceI的識別位點組成)和包含端粒重復序列陣列的端粒序列??寺∧繕薉NA序列后,通過尸WAI限制酶消化產(chǎn)生轉(zhuǎn)座子。一旦整合后,BAC構(gòu)建體轉(zhuǎn)化大腸桿菌,在卡那霉素和氯霉素上進行選擇,從所選陽性克隆中分離DNA。重組改型的BACDNA用歸巢限制酶(I-CewI或PI-SceI)進行體外消化,將環(huán)狀DNA轉(zhuǎn)變成線狀DNA構(gòu)建體,其側(cè)接以正確方向排列的端粒序列,并除去包含Kan'的片段(圖13)。3類著絲粒BAC克隆用該Tn5-3載體改型1.具有反向著絲粒CentC重復序列區(qū)組并側(cè)接CRM1著絲粒元件bacm.pkl28.j21的著絲粒BAC克隆,沒有CentA或CRM2序列;2.屬于含所有4個著絲粒特異性重復序列CentA、CentC、CRM1和CRM2的著絲粒BAC克隆核心組的著絲粒BAC克隆(表8);和,3.玉米染色體4的著絲粒BAC克隆(表9)。各BAC克隆的DNA樣品在瓊脂糖凝膠中分離,切下含線狀改型BAC構(gòu)建體的條帶。從瓊脂糖上電洗脫出DNA,用于生物射彈轉(zhuǎn)化(biolistictransformation)Hi-II未成熟胚8-11DAP(授粉后的幾天)。任選這些構(gòu)建體可用于DNA的顯微注射,或轉(zhuǎn)化成載體,用于土壤桿菌介導的轉(zhuǎn)化。表8<table>tableseeoriginaldocumentpage87</column></row><table>F.DNA構(gòu)建體-改型多BAC組合載體屬于含所有4個著絲粒特異性重復序列CentA、CentC、CRM1和CRM2的著絲粒BAC克隆核心組的著絲粒BAC克隆(表8),也用Tn5-2載體改型。Tn5-2構(gòu)建體包含ori-ubipro::ubi5'UTR::ubiintron::DsRed2::moPAT、Kan""基因和3種歸巢限制酶(I-PpoI、I-Cewl和PI-SceI)的位點。用歸巢限制酶I-CewI和PI-SceI切割改型的BAC,通過脈沖場凝膠電泳(PFGE),在以下標準條件下進行分離1%瓊脂糖、IXTAE,起始脈沖5秒、最終脈沖10秒,總運行時間12小時,在12'C。純化大片段,將其連接而形成長達1Mb的多聚體DNA構(gòu)建體。實施例6:植物的轉(zhuǎn)化任何合適的植物轉(zhuǎn)化方法都可采用。同樣,可轉(zhuǎn)化、培養(yǎng)和/或再生成為植物的任何植物細胞和/或組織都可使用。這些植物細胞和組織、以及培養(yǎng)基和條件、合適轉(zhuǎn)化方法和再生培養(yǎng)基和條件都是眾所周知的。A.細胞類型評價各種玉米細胞類型作為微染色體的產(chǎn)生和構(gòu)建體的遞送靶標的潛力,包括BMS(BlackMexicanSweet)懸浮細胞、分生組織細胞、合子、未成熟胚中的盾片細胞、培養(yǎng)的體細胞胚中的細胞、中央細胞和早期胚乳細胞。可通過將給定基因型與RWS系或其它誘導系雜交,采用可行的方法來產(chǎn)生單倍體胚。單倍體未成熟胚是4敫染色體遞送的良好耙標,無論是在授粉后10-12天(10-12DAP)遞送到盾片細胞還是遞送到胚芽鞘期(coleoptilarstage)胚的暴露頂端分生組織("7-8DAP)??梢詫ξ⑷旧w引入二倍體或單倍體環(huán)境的行為進行重要的比較,此夕卜,如果微染色體引入后,再進行化學誘導的染色體加倍(例如秋水仙素或氧化亞氮),這些加倍的單倍體胚可快速再生而產(chǎn)生含微染色體的近交系。所有上述二倍體和單倍體細胞類型都可轉(zhuǎn)化為懸浮培養(yǎng)物和/或原生質(zhì)體或已建立的懸浮培養(yǎng)物,例如BMS是合適的,可用于轉(zhuǎn)化。DNA構(gòu)建體遞送后,懸浮細胞和/或原生質(zhì)體可為顯微鏡監(jiān)測提供便利和光學清晰度。將構(gòu)建體遞送給植物原生質(zhì)體培養(yǎng)物的任何合適方法都可使用,包括標準電穿孔和PEG介導的直接遞送方法,參見1"列々口載于^dvawcesCe〃w/arAfo/ecw/ar0/尸/ctw&,第5巻,第8章,第189-253頁,Vasil主編,KluwerAcadPubl(Dordrecht,TheNetherlands)1999。B.玉米的顯孩史注射任何適于植物細胞、組織和/或胚的顯微注射的方法都可使用。此外,任何組合物或各組合物的組合/混合物都可注射,包括多核苷酸、多肽、輔因子、化學物質(zhì)、輔助劑等。直接遞送到合子,提供產(chǎn)生轉(zhuǎn)基因植物的機會,而無需組織培養(yǎng)和再生的中間步驟。例如,可基本按照美國專利6,300,543所述,進行玉米的顯微注射。簡而言之,對未成熟玉米胚珠切片,得到包含胚嚢的珠心片(nucellarslab),這是顯微注射轉(zhuǎn)化組合物的靶標。顯微注射之后,將胚嚢放在合適培養(yǎng)基中培養(yǎng),進行增殖和植物再生。C.土壤桿菌介導的轉(zhuǎn)化基本上按照Zhao(W098/32326)所述,進行土壤桿菌介導的玉米轉(zhuǎn)化。簡而言之,從玉米胚珠分離未成熟胚,使胚接觸含T-DNA的土壤桿菌懸液,其中細菌能夠?qū)NA構(gòu)建體轉(zhuǎn)移到至少一個未成熟胚的至少一個細胞中。任選,靶組織可與包含T-DNA、包含不同DNA構(gòu)建體和/或目標多核香酸的多個土it泉桿菌系共同轉(zhuǎn)化。步驟l:感染步驟。將未成熟胚浸泡在土壤桿菌懸液中,用于開始接種。步驟2:共同培養(yǎng)步驟。將胚與土壤桿菌共同培養(yǎng)一段時間。步驟3:靜置步驟。在共同培養(yǎng)后任選進行靜置步驟。將未成熟胚培養(yǎng)在含抗生素、但不含選擇劑的固體培養(yǎng)基中,用于消除土壤桿菌并用于感染細胞的靜置期。步驟4:選擇步驟。將接種的胚培養(yǎng)在含選擇劑的培養(yǎng)基中,讓生長的轉(zhuǎn)化愈傷組織得以恢復。將未成熟胚培養(yǎng)在含選擇劑的固體培養(yǎng)基中,導致轉(zhuǎn)化細胞的選擇性生長。步驟5:再生步驟。將生長在選擇性培養(yǎng)基中的愈傷組織培養(yǎng)在固體培養(yǎng)基上,再生成植物。D.玉米的粒子轟擊未成熟玉米胚用環(huán)狀或線狀DNA構(gòu)建體轟擊,所述構(gòu)建體包含分離的玉米著絲粒序列和任選亞端粒區(qū)、復制起點、重組泊靠位點(dockingsite)、多肽和/或賦予對除草劑雙丙氨膦抗性的標記(例如選擇標記基因例如PAT)(Wohlleben等(1988)Gene70:25-37)、或另一合適的選擇標記或篩選標記(例如RFP和/或CFP)。構(gòu)建體也可包含其它標記基因,或者可與包含標記的額外多核苷酸構(gòu)建體共同轉(zhuǎn)化?;旧先缦滤龅剡M行轉(zhuǎn)化。來自8-11DAP的未成熟玉米穗在30%漂白粉溶液和0.5%Micro去污劑溶液中表面消毒20分鐘,用無菌水清洗兩次。切下未成熟胚,將胚軸側(cè)面向下;^置(胚子葉側(cè)朝上),每板50個胚,在560L培養(yǎng)基中在26。C避光培養(yǎng)1-3天。轉(zhuǎn)化之前,將未成熟胚移至560Y培養(yǎng)基過4小時,然后在2.5cm靶區(qū)內(nèi)排列,準備進行轟擊。如下所述,用水溶性陽離子型脂質(zhì)TfeTM-50(產(chǎn)品目錄號E1811,Promega,Madison,WI,USA)將DNA沉淀到0.6(平均直徑)金珠上在水上用1fxg玉米著絲粒DNA構(gòu)建體(10nl)制備DNA溶液;任選其它構(gòu)建體用于共同轟擊,例如50ng(0.5pi)PHP21875(BBM)和50ng(0.5pi)PHP21139(WUS);混合DNA溶液。向預混的DNA中加入20nl制備的金顆粒(15mg/ml)的水溶液;10piTfk-50的水溶液;小心混合。在制備大載體(macrocarrier)期間,可將該溶液貯存于冰上,通常約10分鐘。沉淀的金顆粒在微量離心機中以10,000rpm離心1分鐘,除去上清液。用100ml100%EtOH小心清洗沉淀,別讓沉淀90重懸浮起來,再小心除去EtOH清洗液。加入20pl100。/。EtOH并用短時超聲處理,小心重懸浮顆粒,將10w點樣到各大載體中心并讓其干燥約2分鐘,然后進行轟擊。對玉米靶胚的樣品板每板轟擊2次,每次轟擊使用約0.5嗎DNA,用Bio國RadPDS-1000/He儀器(Bio-RadLaboratories,Hercules,CA),破裂壓力450PSI,真空壓力27-28英寸Hg,粒子飛行距離8.5cm轟擊后,將胚移至560P固體培養(yǎng)基,于26。C避光維持4-6天,然后移至含3mg/L雙丙氨膦的560R選擇培養(yǎng)基,每2周進行一次傳代培養(yǎng)。約10周選擇后,將選出的愈傷組織抗性克隆移至288J培養(yǎng)基,以啟動植物的再生。體細胞胚成熟后(2-4周),將發(fā)育良好的體細胞胚移至272V培養(yǎng)基進行萌發(fā)并移入有光照的培養(yǎng)室。約7-10天后,將發(fā)育的小植抹移栽到小管中的272V無激素培養(yǎng)基培養(yǎng)7-10天,直到小植林長勢良好。再將植林移栽到鋪有盆栽土的平板襯墊(insertsinflats)(相當于2.5"花盆)中,放在培養(yǎng)室內(nèi)生長l周,然后再放在溫室內(nèi)生長l-2周,接著移至傳統(tǒng)600花盆(1.6加侖)中并讓其生長至成熟。E.大豆的粒子轟擊基本上采用以下文獻所述方法,通過粒子轟擊,將多核苷酸、多核苷酸混合物和任選多肽導入大豆胚胎發(fā)生懸浮培養(yǎng)基中Parrott等(1989)PlantCellRep7:615-617。對該方法進行了修改,如下所述。從未成熟豆莢中取出種子,選擇長度小于4mm的子葉。種子在0.5。/。v/v漂白粉溶液中消毒15分鐘,再用無菌蒸餾水清洗。通過先切去含胚軸的種子部分,切開未成熟的子葉。再用解剖刀片的鈍端小心推擠種子遠端,從種皮中取出子葉。將子葉放入裝有SB1起始培養(yǎng)基的培養(yǎng)m中(平側(cè)向上)。將培養(yǎng)亞在26。C在光照下保溫(16hr天;75-80pE)。培養(yǎng)4周后,將子葉移至新鮮SB1培養(yǎng)基。再過2周后,切開表現(xiàn)出增殖區(qū)的球形期體細胞胚并移至FNLite液體培養(yǎng)基中91(Samoylov等(1998)InVitroCellDevBiolPlant34:8-13)。將約10-12個體細胞胚小簇放入裝有35mlSB172培養(yǎng)基的250ml燒瓶中。將大豆胚胎發(fā)生懸浮培養(yǎng)物維持在35mL液體培養(yǎng)基中,在旋轉(zhuǎn)搖床上,150rpm,26"C并有熒光燈(20pE),按照16:8小時的白/晝時間表。培養(yǎng)物每隔一周傳代培養(yǎng)一次,即將約35mg組織接種到35mL液體培養(yǎng)基中。再用粒子槍轟擊,轉(zhuǎn)化大豆胚胎發(fā)生懸浮培養(yǎng)物(Klein等(1987)Nature327:70;美國專利4,945,050)。BioRadBiolisticaPDS1000/HE儀器可用于這些轉(zhuǎn)化。選擇標記基因可用于促進大豆轉(zhuǎn)化,例如可使用表達盒,其含有花椰菜花葉病毒35S啟動子(Odell等(1985)Nature313:810-812)、質(zhì)粒pJR225的潮霉素磷酸轉(zhuǎn)移酶基因(來自大腸桿菌;Gritz等(1983)Gene25:179-188)和根癌土壤桿菌Ti質(zhì)粒的T-DNA的胭脂堿合酶基因的3'區(qū)。向50jxL60mg/mL1金顆粒懸液中加入(按順序)5jxLDNA(11ig/pL)、20pi亞精胺(O.lM)和50|nLCaCl2(2.5M)。將顆粒制備物攪拌3分鐘,在微量離心機中離心10秒鐘,取出上清液。DNA包被的顆粒在40070%乙醇中洗滌1次,再重懸于40[iL無水乙醇。DNA/顆粒懸液用超聲處理3次,每次1秒鐘。再將5nLDNA包被的金顆粒加載到每個大載體盤。將約300-400mg2周齡的懸浮培養(yǎng)物放在空的60x15mm培養(yǎng)亞中,用移液管從組織中吸出殘留液體。膜破裂壓力設定在1100psi,將小室抽真空至28英寸汞。將組織放在距離保留屏(retainingscreen)約8cm遠,轟擊3次。轟擊后,將組織分成兩半,方丈入2個單獨的瓶中,每瓶裝有35mlFNLke培養(yǎng)基。轟擊后5-7天,液體培養(yǎng)基用新鮮培養(yǎng)基更換。轟擊后11天,培養(yǎng)基用含50mg/mL潮霉素的新鮮培養(yǎng)基更換。該選擇性培養(yǎng)基每周更換。轟擊后7-8周,觀察到從未轉(zhuǎn)化的壞死的胚胎發(fā)生簇中長出綠色轉(zhuǎn)化組織。取出分離的綠色組織并接種到單個瓶中,以再生出新92的無性繁殖的轉(zhuǎn)化胚胎發(fā)生懸浮培養(yǎng)物。每個新系都當作獨立轉(zhuǎn)化事件來處理。再將這些懸浮液傳代培養(yǎng)并維持未成熟胚蔟,或者通過單個胚的成熟和萌發(fā),使組織再生成為完整植林。對于再生,事件與液體培養(yǎng)基無關,成熟過程開始于固體培養(yǎng)基。從液體SB196中取出胚胎發(fā)生簇,點樣在無菌濾紙上,放在固體瓊脂培養(yǎng)基SB166上過l-2周。破碎組織塊或用勺子小心擠壓。將直徑約4-5mm的約10-20個組織塊在培養(yǎng)基SB103或SB148中傳代培養(yǎng)3周,產(chǎn)生胚。在冷的白色熒光燈泡和Agro燈泡(40瓦)下以光強度為90-120pE/m2s的16:8小時的光周期,在26。C將胚培養(yǎng)4-6周。成熟4-6周后,將單個胚放入用纖維帶密封的大(60x25mm)無菌培養(yǎng)皿中或放入塑料盒(沒有纖維帶)過4-7天,使其干燥。將干燥的胚放入裝有固體SB71-4培養(yǎng)基的通風圓培養(yǎng)容器(RCV)中或在100x25mm培養(yǎng)皿中,在冷的白色熒光燈泡和Agro燈泡(40瓦)下以光強度為卯-120^E/m2s的16:8小時的光周期,在26°C萌發(fā)以產(chǎn)生小植林。將小植抹栽到淺盤(cellpacktray)中并放在培養(yǎng)箱中過約2周,條件為16小時光周期,26。C/24。C白/晝溫度,然后移栽到土:t裏中以產(chǎn)生種子。F.植物細胞培養(yǎng)基培養(yǎng)基560L含有4.0g/LN6^出鹽(SigmaC-1416)、1.0ml/LEriksson氏維生素混合物(1000XSigma1511)、0.5mg/L硫胺素HC1、20g/L蔗糖、1.0mg/L2,4-D和2.88g/LL-脯氨酸(用去離子H20定容,然存用KOH調(diào)節(jié)至pH5.8);2.0g/L脫乙酰吉蘭糖月交(Gelrite⑧)(用*離子H20定容后再添加);和8.5mg/L硝酸銀(培養(yǎng)基滅菌并冷卻至室溫后再添加)。培養(yǎng)基560P含有4.0g/LN6基礎鹽(SigmaC-1416)、1.0ml/LEriksson氏維生素混合物(1000XSigma1511)、0.5mg/L硫胺素HC1、30g/L蔗糖、2.0mg/L2,4-D和0.69g/LL-脯氨酸(用去離子H20定容,然后用KOH調(diào)節(jié)至pH5.8);3.0g/L脫乙酰吉蘭糖膠(0611"^@)(用去93離子H20定容后再添加);和0.85mg/L硝酸銀(培養(yǎng)基滅菌并冷卻至室溫后再添加)。培養(yǎng)基560Y含有4.0g/LN6基礎鹽(SigmaC-1416)、1.0ml/LEriksson氏維生素混合物(1000XSigma1511)、0.5mg/L硫胺素HCl,120g/L蔗糖、1.0mg/L2,4-D和2.88g/LL-脯氨酸(用去離子H20定容,然后用KOH調(diào)節(jié)至pH5.8);2.0g/L脫乙酰吉蘭糖膠(0611^@)(用去離子H20定容后再添加);和8.5mg/L硝酸銀(培養(yǎng)基滅菌并冷卻至室溫后再添加)。培養(yǎng)基560R含有4.0g/LN6基礎鹽(SigmaC-1416)、1.0ml/LEriksson氏維生素混合物(1000XSigma1511)、0.5mg/L硫胺素HC1、30.0g/L蔗糖和2.0mg/L2,4-D(用去離子H20定容,然后用KOH調(diào)節(jié)至pH5.8);3.0g/L脫乙酰吉蘭糖膠(Gelrite)(用去離子H20定容后再添加);和0.85mg/L硝酸銀和3.0mg/L雙丙氨膦(培養(yǎng)基滅菌并冷卻至室溫后再添加)。培養(yǎng)基288J含有4.3g/LMS鹽(Gibco11117-074)、5.0ml/LMS維生素貯液(0.100g/L煙酸、0.02g/L硫胺素HCl、0.10g/L吡哆醇HC1和0.40g/L甘氨酸,用去離子H20定容)(Mumshige和Skoog(1962)PhysiolPlant15:473)、100mg/L肌醇、0.5mg/L玉米素、60g/L蔗糖和1.0ml/L0.1mM脫落酸(用去離子H20定容,然后調(diào)節(jié)至pH5.6);3.0g/L脫乙酰吉蘭糖膠(Gelrite)(用去離子H2O定容后再添加);和1.0mg/L卩引哚乙酸和3.0mg/L雙丙氨膦(培養(yǎng)基滅菌和冷卻至60。C后再添加)。培養(yǎng)基272V含有4.3g/LMS鹽(Gibco11117-074)、5.0ml/LMS維生素貯液(0.100g/L煙酸、0.02g/L硫胺素HCl、0.10g/L吡哆醇HCl和0.40g/L甘氨酸,用去離子H20定容)、0.1g/L肌醇和40.0g/L蔗糖(用去離子H20定容,然后調(diào)節(jié)至pH5.6);和6g/L細菌培養(yǎng)用瓊脂(bacto-agar)(用去離子H20定容后再添加),滅菌并冷卻至60°C。培養(yǎng)基SB1含有MS鹽(Gibco/BRL-產(chǎn)品目錄號11117-066,1pk/L)、B5維生素貯液lml/L、20mg/L2,4-D、31.5g/L蔗糖、8g/LTC瓊脂,pH5.8。B5維生素1000X貯液含有10g肌醇、100mg煙酸、100mg吡哆醇HC1、lg^f危胺素、去離子H20加至100ml,分成等分試樣并貯存于-2(TC。G./人愈傷組織和葉組織分離DNA可篩選存在轉(zhuǎn)基因的推定的轉(zhuǎn)化事件??捎弥参锖朔蛛x、裂解和HMW純化、或使用修改的CTAB(十六烷基三乙基溴化銨,SigmaH5882)方法,從愈傷組織、葉或其它組織中提取基因組DNA,所述方法參見Stacey和Isaac(1994載于MethodsinMolecularBiology第28巻,第9-15頁,P.G.Isaac主編,HumanaPress,Totowa,NJ)。在液氮中將約100-200mg冷凍組織磨成粉末并在1mlCTAB提取緩沖液(2%CTAB,0.02MEDTA,0.1MTrisHClpH8,1.4MNaCl,25mMDTT)中在65。C勻漿30分鐘。讓勻漿樣品冷卻至室溫達15分鐘,然后用約lml24:1(體積比)氯仿:辛醇提取單一蛋白質(zhì)。樣品在13,000rpm離心7分鐘,用廣口移液管頭收集上清液上層。通過在冰上的95%乙醇中保溫l小時,從上清液中沉淀DNA。DNA絲纏繞在玻璃鉤上,在含0.2M乙酸鈉的75%乙醇中洗滌10分鐘,風干5分鐘,然后重懸于TE緩沖液。向樣品中加入5piRNA酶A,并在37。C保溫1小時。為了定量測定基因組DNA,用0.8%瓊脂糖凝膠的lxTBE緩沖液,進行凝膠電泳。1微升的各樣品分級分離為200、400、600和800ng入未切割DNA標記。實施例7.轉(zhuǎn)化結(jié)果基本上按照實施例6D所述,通過粒子轟擊,轉(zhuǎn)化在8-11DAP的未成熟Hi-II玉米胚。用ODP2、WUS和/或ODP2+WUS載體,以及改型BACDNA構(gòu)建體,共同轉(zhuǎn)化胚。在轟擊后2周,轉(zhuǎn)化細胞增殖形成具有多個體細胞胚的胚胎發(fā)生愈傷組織。這些體細胞胚中的某些表達作為可穩(wěn)定遺傳標記的熒光DsRed2標記基因。切割單個體細胞胚并作為獨立轉(zhuǎn)基因事件而在雙丙氨膦選擇培養(yǎng)基上增殖。自每個事件,建立無性繁殖的愈傷組織培養(yǎng)物。用FISH進行各轉(zhuǎn)化事件的初次篩選。按照實施例8所述,單個體細胞胚用于制備染色體鋪片,用于FISH。用針對mo-PAT/DsRed2標記(PHP23715)和CentC串聯(lián)著絲粒重復序列的單獨FISH4笨針,以分別檢測轉(zhuǎn)基因標記和著絲粒DNA序列遺傳性,表征每個事件。初次篩選后,將所選目標轉(zhuǎn)化事件移至再生培養(yǎng)基中,產(chǎn)生小植抹,最終移至土壤,以恢復植物。生長期后,通過FISH分析根尖壓片,第2次篩選所選植物,以再次證實遺傳性。A.BAC庫的共同轉(zhuǎn)化實驗用DNA構(gòu)建體庫共同轉(zhuǎn)化胚。這些庫可包括來自含玉米著絲粒重復序列的BAC克隆的DNA構(gòu)建體的組合,來自含端粒和/或亞端粒DNA區(qū)段的BAC克隆的DNA構(gòu)建體、可見標記質(zhì)粒PHP23715和編碼生長增強蛋白即胚珠發(fā)育蛋白-2即ODP-2(PHP^8乃)的多核苷酸和Wushel(PHP21139)質(zhì)粒。來自著絲粒BAC克隆的DNA構(gòu)建體包含這樣的BAC克隆其僅有CentC、僅有CRM2,僅有CentC和CRM2,以及具有所有4個著絲粒重復序列CentA、CentC、CRM1和C腹2的核心BAC。通過FISH分析用含著絲粒DNA的BAC庫轉(zhuǎn)化的80個愈傷組織表明,除了正常著絲粒位點之外,新CentC簇有42個細胞遺傳學可檢測事件。在某些實例中,玉米著絲粒元件用于轉(zhuǎn)化插入天然染色體,導致雙著絲粒結(jié)構(gòu)。這些著絲粒DNA序列的插入序列在大小(重復序列數(shù)量)、每條染色體中的插入數(shù)量(在一條染色體中至多可檢出3個)和具有插入的染色體數(shù)量(至多4條染色體具有至少一個插入序列)上不同,所有插入序列與RFP標記質(zhì)粒探針共同定位。這表明外源DNA片段可裝配成大區(qū)組并可整合到玉米染色體中。B.用體外連接著絲粒BAC克隆、端粒序列和標記序列而裝配的線狀微染色體原型DNA構(gòu)建體進行轉(zhuǎn)化按照實施例1D所述,鑒定具有反向CentC串聯(lián)重復序列的Mol7BAC克隆(bacm.pkl28.j21)。通過PCR擴增端粒寡核苷酸而產(chǎn)生端粒序列并在質(zhì)粒載體中克隆。通過與選擇標記(moPAT、AmCyanl、DsRed2)、18-26SrRNANTS復制起點(ori)和端粒序歹'j(TEL)進行體外裝配,從這個BAC克隆產(chǎn)生線狀DNA構(gòu)建體。每個DNA片段都具有識別位點,一旦連接后,就允許裝配成獨特結(jié)構(gòu)。裝配的線性化構(gòu)建體包含TEL-OSpdO-ubipro::ubi5*UTR::ubiintron::AmCyan::moPAT-(A^i;)-bacm.pk.l28J21-(淑I)-ori-ubipro::ubi5'UTR::ubiintron::DsRed::moPAT-CSmal)-TEL通過生物射彈轉(zhuǎn)化,將含有裝配構(gòu)建體以及連接副產(chǎn)物的全部連接混合物遞送到未成熟Hi-II胚中。根據(jù)熒光標記和選擇標記的選擇(PAT),超過200個事件增殖為單個愈傷組織克隆?;厥樟?組克隆僅顯示紅色焚光標記(72個),僅顯示藍色熒光標記(83個)或兩種都顯示(137個)的那些。選擇同時表達這兩種標記的事件,用于進一步通過FISH進行分析。除了簡單整合事件,在同一染色體或不同染色體中觀察到各種多重整合事件。在2個事件中,我們觀察到染色體重排。著絲粒重復序列CentC的額外插入位點與標記4笨針PHP23715共同定位,表明可能形成雙著絲粒染色體。對后期分裂細胞進行分析表明,染色體橋與具有2個功能性著絲粒的雙著絲粒染色體的存在是一致的,因為外源著絲粒CentCDNA序列的整合。雙著絲粒染色體的形成、后期染色體橋的出現(xiàn)和染色體斷裂的誘導顯示出著絲粒功能。這些結(jié)果表明,染色體元件在植物細胞中可自我裝配成多拷貝區(qū)組,與染色質(zhì)蛋白結(jié)合,而且在某些情況下還可獲得著絲粒功能。97一個事件表明,重排染色體6在核仁組織區(qū)(NOR)附近具有2個著絲粒DNA構(gòu)建體插入位點,以及一個額外^f敬染色體樣結(jié)構(gòu),其具有一個大著絲粒區(qū)和一個額外的著絲粒DNA構(gòu)建體的小插入位點。該事件的細胞學顯示出由于形成雙著絲粒染色體而引起的染色體斷裂。C.用線性化改型的BAC克隆庫進行轉(zhuǎn)化基本上按照實施例5E所述,用轉(zhuǎn)座酶系統(tǒng)(EPICENTREEZ::TNTMpMODTM-2MCS轉(zhuǎn)座子構(gòu)建載體系統(tǒng)(EpiCentre,Madison,WI,USA)),若干BAC克隆用Tn5-3定制轉(zhuǎn)座子改型。將它們線性化并用于生物射彈轉(zhuǎn)化玉米Hi-II未成熟胚1.將具有反向著絲粒CentC重復序列區(qū)組的改型bacm.pkl28.j21克隆的7個不同變異體(代表不同轉(zhuǎn)座酶產(chǎn)生的插入序列插入到同一BAC克隆中)混合;2.結(jié)合84個改型著絲粒核心組BAC克隆,產(chǎn)生4個庫,各自具有21個單獨變異體(表8)。這4個庫的每一個單獨用于生物射彈轉(zhuǎn)化;3.將來自染色體4的改型著絲粒BAC克隆分為2個庫,其含有來自B73的3個BAC克隆和來自Mo17的3個BAC克隆(表9);和,4.將表8的庫1分為5個或6個改型著絲粒核心組BAC克隆的4個亞庫(表10)。每個亞庫都單獨用于生物射彈轉(zhuǎn)化。表IO亞庫1.1亞庫1.2亞庫1.3亞庫1.4bacm.pk007.a2bacm.pk133.b10bacm.pk"9.a23bacm.pk075.舊b3cm.pk036.e13bacm.pk077.k5bacm2.pk174.e4bacm.pk0066.j14bacm.pk178.c10bacm2.pk179.b18b3cm2.pk"6.g16bacm2.pk099.m24bacm2.pk179.e1bacm.pk0133.b"bacm2.pk023,e24bacm2.pk093.h"bacm2.pk064.e15bacm2.pk066.m12bacm.pk135.舊bacm2.pk083.a2bacm.pk076.m398對于以上各實施例,用0DP2、WUS和/或ODP2+WUS表達載體和改型BAC庫共同轉(zhuǎn)化Hi-II未成熟胚。當來自BAC克隆的線性化改型構(gòu)建體用于轉(zhuǎn)化時,發(fā)現(xiàn)若干不同類型的轉(zhuǎn)化事件。例如,當來自含有反向著絲粒CentC重復序列區(qū)組(bacm.pkl28.j21)的BAC、或BAC克隆核心組的改型庫或亞庫的構(gòu)建體用于轉(zhuǎn)化時1.單整合到宿主染色體的常染色質(zhì)區(qū);2.多整合到宿主染色體的常染色質(zhì)區(qū);3.單整合到宿主染色體著絲粒區(qū);4.多整合到宿主染色體著絲粒區(qū);5.導致染色體斷裂的整合,例如染色體臂減少或某些染色體區(qū)重復的玉米染色體的新的不常見變異體,例如具有2個NOR、或形成雙著絲粒染色體的染色體6;6.—旦整合,就局部擴增標記和著絲粒構(gòu)建體;7.在某些細胞中,標記和著絲粒構(gòu)建體擴增到染色體外染色質(zhì)區(qū)段;8.產(chǎn)生具有類似于天然染色體的功能性著絲粒的新;微染色體,例如在有絲分裂中自主分離。這些觀察結(jié)果表明,改型著絲粒BAC克隆bacm.pkl28.j21和改型BAC克隆庫核心組能夠誘導不同的細胞遺傳學效應,例如雙著絲粒染色體的形成、染色體的斷裂、轉(zhuǎn)基因構(gòu)建體的局部擴增和染色體外元件(即微染色體)的形成。如下所述,單一BAC或著絲粒特異性BAC庫用Tn5-3構(gòu)建體改型,隨后將其線性化而形成線狀轉(zhuǎn)化構(gòu)建體,從而導致成功微染色體事件1)著絲粒特異性BAC庫1核心組(表8)或庫1的亞庫(表10);2)著絲粒特異性BAC庫3核心組(表8);3)單個BAC克隆bacm.pkl28.j21,其具有反向CentC重復序列;99和,4)3個B73染色體4著絲粒特異性BAC克隆(表9)。在通過用線性化Tn5-3改型核心組BAC庫1進行生物射彈轉(zhuǎn)化而產(chǎn)生的事件中,發(fā)現(xiàn)第一玉米微染色體事件(CMC3庫1事件#14)(表8)。在選擇性培養(yǎng)基上,活躍生長的胚胎發(fā)生愈傷組織表達DsRed2可見標記。對中期進行FISH分析表明0、1、2或3個額外微染色體具有不同形式和大小(圖1-4)。在該事件中,所研究的80個核中有60個具有1、2或3條微染色體以及20條天然染色體的正?;パa序列。在中期進行測定,這些人工染色體的大小范圍為約20%至約50%平均天然玉米染色體。在前中期進行的初步測定表明微染色體的大小相對不變,而天然染色體則變長約4-5倍,因此在該時期所測定的微染色體是平均天然玉米前中期染色體長度的約5°/。至約15%。通過FISH測定,微染色體主要由著絲粒重復序列和Tn5-3組分組成。也觀察到具有更復雜組織的環(huán)狀染色體的形成的若干實例。這些新形成的微染色體在有絲分裂期間明顯能夠復制和分離(圖4),但是分離不完美,觀察到某些不分離,導致細胞中微染色體數(shù)量上的變化。在選擇下,CMC3庫1事件#14愈傷組織保持活躍生長達至少10個月,在不同時間點取樣,并通過FISH分析證實,經(jīng)過多輪有絲分裂細胞分裂,穩(wěn)定維持了微染色體。也通過FISH分析了該事件即CMC3庫1事件#14,用于分析端粒的存在,使用Telo-31重疊寡核苷酸探針(SEQIDNO:192和193)使用愈傷組織中期核。在每一微染色體上都觀察到2-4個telo-31陽性轉(zhuǎn)化灶(focus),其中所觀察的2個轉(zhuǎn)化灶代表在該分辨率下無法區(qū)分的4個單獨轉(zhuǎn)化灶。在每個樣品中,在微染色體上telo-31信號強度通常比天然染色體上觀察到的信號更微弱。從該事件再生植物,用FISH分析其根尖,以確定微染色體通過在溫室環(huán)境中連續(xù)有絲分裂是否仍可遺傳。從該轉(zhuǎn)化事件再生的19抹植物中有5林顯示存在微染色體。4抹植物具有高發(fā)生率的核,其具有l(wèi)條微染色體加上20條天然染色體的正?;パa序列。第5林植物的大多數(shù)核都具有1、2或3條^f敖染色體和20條天然染色體的正常互補序列。上述所有^f敖染色體主要包含著絲粒重復序列和Tn5-3組分。然后,將改型核心組BAC庫1進一步分為具有5-6個改型核心組BAC克隆的4個亞庫(表10)。FISH分析表明亞庫1.1和1.3產(chǎn)生的胚性愈傷組織中存在微染色體。從亞庫1.1產(chǎn)生2個微染色體事件笫一事件具有20條染色體的正常互補序列以及1條微染色體,該染色體不以可4企測水平與PHP23715標記或CentC雜交;第二事件顯示出24-28條染色體,3拷貝的染色體6和1條微染色體。根據(jù)FISH觀察,該微染色體對CentC呈陽性,但對PHP23715探針卻不呈陽性。通過天然染色體整合和斷裂、和/或由非整倍體產(chǎn)生或來自非整倍體的條件,產(chǎn)生該事件。亞庫1.3產(chǎn)生5個事件。這5個事件中有3個看來是從頭形成微染色體,并且具有20條染色體的正?;パa序列以及1條微染色體,而且通過FISH分析中期的最初愈傷組織事件,微染色體對PHP23715標記和CentC呈陽性。用Telo-31重疊寡核苷酸4笨針(SEQIDNOS:192和193)并用愈傷組織中期核,通過FISH進一步分析這些事件之一即CMC3亞庫1.3事件#27,分析端粒的存在。該事件具有非常小的微染色體,每條微染色體上具有兩個強烈CentC轉(zhuǎn)化灶和2個telo-31轉(zhuǎn)化灶。所觀察的2個telo-31轉(zhuǎn)化灶可代表4個單獨的轉(zhuǎn)化灶,其在該分辨率下無法區(qū)分。該事件具有比前述事件中觀察到的更小的微染色體。當在中期測定時,微染色體長度為約0.5-1微米,其為其它獨立事件中微染色體大小的約三分之一至約二分之一。在微染色體上,telo-31的FISH信號通常比天然染色體上的更微弱。在選擇下,CMC3亞庫1.3事件#27的愈傷組織保持活躍生長達至少10個月,在不同時間點取樣,并通過FISH分析證實,經(jīng)過多輪有絲分裂細胞分裂,穩(wěn)定維持了微染色體。兩個其它亞庫1.3事件具有19條正常染色體加上一條微染色體,可能是整合和染色體斷裂的結(jié)果。采用FISH分析,兩個微染色體中的一個僅對CentC呈陽性,第二個同時對PHP23715標記和CentC呈陽性。使用FISH對愈傷組織中期101核進行分析,所有亞庫事件看來基本上類似于所產(chǎn)生的其它微染色體事件的相應樣品,如圖1、2、5、6和9所示。從Hi-II未成熟胚用線性化改型核心組BAC克隆庫3的生物射彈轉(zhuǎn)化事件,觀察到另一個微染色體事件(圖5-8)(表8)。所得胚胎發(fā)生愈傷組織在雙丙氨膦選擇培養(yǎng)基上呈陽性,并且表達DsRed焚光標記蛋白。FISH分析表明,該事件是四-非整倍體(tetra-aneuploid),其中僅觀察到39條染色體,因為一條染色體6缺失。在該事件中,每個核都具有0、1或2條微染色體。如庫1的第一微染色體事件所述,該事件的微染色體主要包括著絲粒重復序列和Tn5-3組分。在后期,微染色體的姊妹染色單體可以分離(圖7),表明存在功能性著絲粒。以上結(jié)果表明,微染色體可自主復制并通過連續(xù)有絲分裂顯示出穩(wěn)定性。從Hi-II未成熟胚用線性化、Tn5-3改型BAC克隆bacm.pkl28.j21的生物射彈轉(zhuǎn)化事件,觀察到另一個微染色體事件(圖9-10)。此外,這個第三事件的胚胎發(fā)生愈傷組織在雙丙氨膦選擇培養(yǎng)基上呈陽性,并且表達DsRed熒光蛋白。從該事件再生植物,通過FISH進行根尖篩選。每個核具有0或1條微染色體。在具有微染色體的核中,僅觀察到20條天然染色體中的19條。對中期鋪片進行FISH分析表明,單個微染色體主要包括著絲粒重復序列和Tn5-3組分。從Hi-II未成熟胚用線性化、Tn5-3改型的3個B73染色體4著絲粒特異性BAC克隆的生物射彈轉(zhuǎn)化事件,觀察到另一個微染色體事件bCMC4事件#73(表9)。所得到的胚胎發(fā)生愈傷組織事件在雙丙氨膦選擇培養(yǎng)基上呈陽性,并且表達DsRed熒光標記蛋白。FISH分析表明,該事件是非整倍體,其中僅觀察到19條染色體和1或2條微染色體。類似于上述微染色體,該事件的微染色體主要包括著絲粒重復序列和Tn5-3組分。對所有微染色體事件的觀察表明,新形成的微染色體主要來自一級線狀DNA構(gòu)建體的串聯(lián)或/和擴增,所述構(gòu)建體遞送給植物細胞以從頭產(chǎn)生微染色體。用免疫熒光,用針對著絲粒/動粒特異性蛋白即著絲粒蛋白C(CENPC)產(chǎn)生的熒光標記抗體,進一步分析了3個微染色體事件。核鋪片的免疫染色表明,CENPC與天然染色體著絲粒區(qū)特異性結(jié)合。另外,在所研究的所有3個微染色體事件中,CENPC定位于所有微染色體的明確位置上(圖3、4、8和10)。聯(lián)合FISH和免疫定位表明,CentC重復序列和DsRed2標記探針定位與微染色體上的CENPC重疊。正如在天然染色體中所觀察到的,在中期,微染色體具有CENPC的兩個獨特轉(zhuǎn)化灶(圖3、8和10),在后期,微染色體的姊妹染色單體分離,每條姊妹染色單體具有單個CENPC轉(zhuǎn)化灶(圖4)。以上結(jié)果表明,微染色體可募集必需蛋白質(zhì),例如CENPC,用于動粒形成,因此天然染色體在有絲分裂和減數(shù)分裂期間,在復制和分離到子細胞中自主起作用。產(chǎn)生了幾千個雙丙氨膦抗性、DsRed陽性玉米轉(zhuǎn)基因事件,至少幾百個已經(jīng)進行細胞學表征。事件顯示整合到宿主染色體的頻率很高,約60。/。的事件顯示出經(jīng)FISH可檢出的整合??梢姌擞浐瓦x擇標記在約39%的事件中同時存在,《旦FISH分析不可檢出。迄今為止,大部分重組構(gòu)建體組合產(chǎn)生同時含有標記和CentC重復序列的微染色體,僅在約1%事件中可由FISH檢出(4個事件,圖1-10)。例外的是亞庫1.3,其在所分析的約12%事件(34個中有4個)中產(chǎn)生同時含標記和CentC重復序列的微染色體。D.人工微染色體的大小測定通過測定所裝配的微染色體和染色體6的大小,進一步表征具有自主玉米微染色體的3個事件,其可由18-26SrDNAFISH探針容易地鑒定。所有測定都在中期核上進^f亍,這給出最一致的測定。其它時期少有界定,染色體大小高度變化,例如,在前中期進行的初步測定表明,相對于中期測定而言,微染色體的大小相對不變,而天然染色體則變長約4-5倍,因此在該時期所測定的微染色體是平均天然玉米前中期染色體長度的約5%至約15%。因此,在中期測定的微染色體可能比天然染色體更長,如果在不同時期測定的話。用LeicaDMRXA熒光顯微鏡測量染色體,用PhotometriesCoolSnapCCD相機捕獲圖<象,用Metamorph⑧圖l象分片斤豐欠4牛(MolecularDevices,Sunnyvale,CA,USA)進行圖像測定。所有測定都以微米計。天然染色體6(n-29):平均值=4.62①和2.38(w)范圍=3,16-5.78(l)和2.06-2.70(w)微染色體(11=37):平均值=1.29(l)和1.67(w)范圍=0.75誦3.07(l)和1.12-3.17(w)玉米微染色體的長度平均占染色體6的約28%,但范圍為中期染色體6總長度的約13-97%。所觀察到的玉米微染色體的大小也可以Mb來估計。例如,玉米基因組包含約2500Mb總DNA,其染色體大小范圍為約150-350Mb,染色體6為約200Mb(Seneca60)。實施例8:方法基本上按照以下文獻所述,從未成熟玉米穗或綠葉中分離DNA:Ananiev等(1997)ProcNatlAcadSciUSA94:3524-3529。用Nucleobond質(zhì)粒試劑盒(BDBiosciencesClontech,California),4安照制造商的推薦,分離BAC克隆DNA?;旧习凑找韵挛墨I所述,在瓊脂糖凝膠塊中制備高分子量DNA:Liu和WhittierNucleicAcidsRes(1994)22:2168-2169。如以下文獻所述,使用標準技術進行DNA限制性消化、凝膠電泳、DNA印跡和濾膜雜交Sambrook等(1989)Mo/ecw/arC7om'"g.'爿Z^6orato7"W"awMa/,第2版,ColdSpringHarborLaboratory104第l-3巻。以上參考文獻全部通過引用結(jié)合到本文中。A.重疊寡核苷酸探針標記,用于菌落和DNA印跡雜交各探針的混合重疊寡核苷酸(各寡核苷酸5pmol)與以下組分混合2jul10x克列諾(Klenow)緩沖液、1pl克列諾酶(5U/^d)、1pilmMdGTP、lpillmMdTTP、[cr32P]dCTP和[or32P]dATP匿各5用無菌水加至終體積為20|il。將反應混合物在14。C保溫2小時。求出結(jié)合率,認為大于等于50%是可接受的。B.膜制備和雜交用在Mol7五coRI和7/^^111BAC文庫間均勻分布的432個384孔板,制備膜。使用允許將96板與384孔點樣到一個MilliporeImobilonN+尼龍膜(Bedford,MA)上的4x4網(wǎng)格模式。帶網(wǎng)格的96板包括90個BAC克隆板和6個質(zhì)??寺“?,用作網(wǎng)格標記。加網(wǎng)4各后,將膜小心放在含17pg/mL氯霉素的LB(Luria-Bertani)瓊脂平板上的細菌一側(cè),蓋好平板,翻轉(zhuǎn),在37。C培養(yǎng)過夜。菌落生長后,從平板上取下膜,各自在1.5MNaCl和0.5MNaOH中變性5分鐘,然后在1.5MNaCl、1MTris-HCl中中和2次,每次5分鐘。將膜干燥,用蛋白酶K(100ml1mg/mL;Sigma,StLouis,MO)在37。C處理50分鐘。將每片膜浸泡在裝入塑料盒的6xSSC、0.5。/。SDS溶液中。濾膜在56°C,在6xSSC、0.5%SDS中預雜交并持續(xù)攪拌至少20分鐘?;旌系闹丿B寡核苷酸纟笨針在IO(TC變性5分鐘,加入到已經(jīng)用于預雜交的雜交液中。在56。C雜交12-16小時。在56。C,在2xSSC和0.1°/。SDS(洗滌1)、1.5xSSC和0,1%SDS(洗滌2)、和O.lxSSC和0.1%SDS(洗滌3)中依次將膜各自洗滌1小時。用塑料包裹膜并暴露給X射線膠片達3小時至過夜。雜交后,在100ml0.1xSSC和0.1Q/。SDS中剝離濾膜,在90。C過10分鐘并貯存于-20。C。膜可^f吏用多次。C.細力包學方法,任何合適的細胞學方法和組合物,包括許多標準細胞學方法、制備等是本領域已知的,可用于檢查植物組織。i.玉米愈傷組織的核的制備1.用于制備核制劑的愈傷組織先用氧化亞氮(150psi)充氣3小時,然后立即固定。氧化亞氮使核在中期停滯,這允許改進染色體鋪片,用于FISH分析。2.在50%乙酸中固定愈傷組織樣品至少1小時。組織可無限期地貯存在50%乙酸中,在-20。C。3.從愈傷組織中分離體細胞胚,放在50plPIM緩沖液(50mMCaCl2、10mM乙酸鈉,pH5.8)的小培養(yǎng)皿中。4.將體細胞胚切成0.5mm小塊。5.在1小時內(nèi),在PIM緩沖液中將組織洗滌3-5次,除去固定劑。緩慢吸打幾次,洗滌,更換新鮮PIM緩沖液。6.小心除去PIM緩沖液。加入50pi酶消化液(2°/。w/v纖維素酶(產(chǎn)品目錄號CEL,WorthingtonBiochemicalCorp.(Lakewood,NJ,USA))、0.2%w/v果月交酶(產(chǎn)品目錄號PASE,WorthingtonBiochemicalCorp,(Lakewood,NJ,USA》;0.5%w/v牛血清白蛋白)7.在保濕室中,在室溫下避光處消化組織達1-2小時。當組織開始軟化時,非常輕地吸打和/或用探針擠壓,以破碎較大的塊狀物并釋;改出細月包。8.小心除去酶消化液,并更換為約50plPIM緩沖液。9.將游離細胞/核移至微量離心管中。加入更多PIM緩沖液以維持消化組織并輕輕吸打,以釋放出細胞,將這些細胞移至微量離心管,視需要可重復。10.沉淀細胞在微量離心機中在500rpm離心3分鐘,去掉上清液。加入新鮮PIM緩沖液并輕輕地重懸浮細胞。再將該洗滌步驟重復多3次。10611.除去PIM緩沖液和并更換為50%乙酸。輕輕地重懸浮細胞。在500rpm離心IO分鐘,去掉上清液,加入50%乙酸。重復。12.在-20。C,將分離核貯存于50%乙酸中。50%乙酸的終體積應當是核沉淀體積的2倍。13.將5(il重懸浮核移至載玻片上,蓋上18mn^蓋玻片。14.在70。C加熱板上加熱載玻片15秒。15.將載玻片從熱源移開,輕輕壓下蓋玻片以擠壓核。16.讓載玻片很快冷卻,然后將載玻片浸在液氮中達10-15秒。17.從液氮中取出載玻片,用你的呼吸使蓋玻片回暖。18.用剃須刀片邊緣迅速去掉蓋玻片。19.將載玻片放入100%EtOH中,更換2次,每次2分鐘。20.讓載玻片風干。在-20。C貯存載玻片直至需要。ii.FISH,然后進行核的直接免疫定位a.重疊寡核苷酸探針制備,用于FISH重疊寡核苷酸^:針描述于表1。1.將10pi100pM重疊寡核苷酸混合物(每種重疊寡核苷酸濃度相等)加入到5pl去離子水中。2.在95。C加熱l分鐘,然后轉(zhuǎn)移到冰中。3.加入到以上混合物中國2)Lil10XDNA聚合酶緩沖液(100mMTris-HCl,pH7.5,100mMMgCl2、7.5mMDTT)-0.5pldUTP熒光團a)dUTP-Cy3(Amersham)b)dUTP-FITC(Roche)c)dUTP-德克薩斯紅(TexasRed)(MolecularProbe)-2|_ildNTP(200^iMA-、G畫、CTP;40,TTP)-0.5jil克列i若(Klenow)4.在37。C保溫20分鐘。5.用Quigen核苷酸提取試劑盒清洗探針。在50ml50%曱酰胺的試劑盒洗脫緩沖液中洗脫。b.熒光原位雜交(FISH)基本上按照如下所述,在玻片上進行玉米核的FISH:1.在1%v/v低聚曱醛的磷酸緩沖鹽溶液(PBS)(pH7.2)中固定載玻片10分鐘。2.洗滌2X5分鐘,在PBS中4.洗滌2分鐘,在蒸餾7K/去離子水中5.風干載玻片。6.在80°C,在滴定的熒光4果針的50。/。曱酰胺(終濃度為50mMMgCl2)中雜交2分鐘。7.在37。C保濕室中,雜交30分鐘至過夜。8.洗滌5分鐘,在2XSSC中9.洗滌5分鐘,在0.2XSSC中10.風干載玻片11.加含有DAPI的Vectashield(產(chǎn)品目錄號H-1200,VectorLaboratories,Burlingame,CA,USA)和蓋玻片(5ml浸片介質(zhì)/22mm蓋玻片)12.在顯微鏡下檢查,視需要,用合適的濾光片組合和/或浸油。c.免疫定位FISH探針定位檢查和表征后,這些相同樣品可處理并用于免疫定位,用直接標記的抗體探針?;旧先缦滤觯M行熒光標記的多克隆兔抗CENPC抗體免疫定位1.去掉蓋玻片2.洗滌5分鐘,在70%v/vEtOH中,以除去浸片介質(zhì)和浸油3.洗滌3X5分鐘,在PBS中4.在37。C的保濕室中,在5%v/v正常兔血清(JacksonImmunoresearch,WestGrove,PA,USA)的PBS-BT(PBS中含有3%w/vBSA、0.02。/c)w/v疊氮化鈉、0.5Q/。v/v曲通X-100)中封閉1小時5.在PBS中清洗6.在37。C的保濕室中,與1。抗體的5。/。v/v正常兔血清的PBS-BT一起保溫過夜。使用1:200稀釋度的兔抗CENPC-Cy3(或-FITC),終濃度2.5pg/mL標i己抗體。7.在1小時內(nèi)在PBS中洗滌3X8.風干載玻片9.加含有DAPI的Vectashield(產(chǎn)品目錄號H-1200,VectorLaboratories,Burlingame,CA,USA)和蓋玻片(5ml浸片介質(zhì)/22mm蓋玻片)10.用指甲油密封蓋玻片11.在顯微鏡下檢查,視需要,用合適的濾光片和/或浸油。d.CEOTC抗體的產(chǎn)生和標記按照Dawe等(1999PlantCell11:1227-1238)所述,分離哺乳動物CENPC的玉米同源物,顯示出是玉米動粒的組分。合成氨基端區(qū)的20個氨基酸的保守肽,用于在兔子中制備多克隆抗體(Openbiosystems,Huntsville,AL,USA)。所得抗體直接用Fluorolink-AbCy3標記試劑盒(GEHealthcare,UK)或熒光素蛋白標記試劑盒(RocheDiagnosticsCorp.,Indianapolis,IN,USA)的熒光團標記。iii.纖維-FISH按照以下文獻所述,在細胞學載玻片上制備延伸DNA纖維Jackson等(1998)Genome41:566-572。按照制造商的推薦,纖維-FISH的探針用生物素-11-dUTP(Roche,Germany)或DIG-dUTP(Roche,Germany)標i己,用Nik翁3譯標"i己^式劑盒(Roche,Germany)。沉淀后,探針重溶于TE緩沖液并貯存在-2(TC。對于纖維-FISH,將探針與DNA纖維的混合物(含有50%(v/v)曱酰胺、10%(v/v)SDS和2xSSC,終體積為10pL)雜交。給載玻片蓋上蓋玻片,用橡膠膠水密封,在80。C保溫2分鐘,使探針和靶DNA變性,然后再在37。C保溫。按照以下文獻所述,進行雜交后的洗滌和信號4企測Zhong等(1996)PlantMolBiolRep14:232-242。生物素標記的揮:針用以下蛋白質(zhì)進行檢測熒光素-抗生物素蛋白DN(VectorLaboratories,Burlingame,CA,USA)、生物素化抗抗生物素蛋白D(VectorLaboratories,Burlingame,CA,USA)和萸光素-抗生物素蛋白DN(VectorLaboratories,Burlingame,CA,USA)。DIG-標記的探針用小鼠抗DIG單克隆抗體(JacksonJacksonImmunoResearch,WestGrove,PA,USA)和Cy3綴合的綿羊抗小鼠抗體(JacksonImmunoResearch,WestGrove,PA,USA)4企測。然后將載玻片放在Vectashield浸片介質(zhì)(VectorLaboratories,Burlingame,CA,USA)中。用LeicaDMRXA熒光顯樣L鏡4企查制備物,用PhotometriesCoolSnapCCD相機捕獲圖像。用Metamorplf圖像分析軟件(MolecularDevices,Sunnyvale,CA,USA)進行圖像捕獲。來自各系的3-5個制備物上進行纖維-FISH。權利要求1.一種包含功能性著絲粒的人工植物微染色體,所述著絲粒包含(a)至少2個反向CentC串聯(lián)重復序列陣列,其中第1陣列包含至少50個拷貝的CentC,第2陣列包含至少50個拷貝的CentC;和(b)至少一個拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中所述反轉(zhuǎn)錄轉(zhuǎn)座元件位于第1陣列和第2陣列之間。2.權利要求1的人工植物微染色體,其中所述反轉(zhuǎn)錄轉(zhuǎn)座元件選自CentA、C脂l和C腹2。3.權利要求1的人工植物微染色體,其中所述微染色體還包含至少一個功能性端粒。4.權利要求1-3中任一項的人工植物微染色體,其中所述功能性著絲粒特異性結(jié)合著絲粒蛋白C(CENPC)。5.—種包含權利要求1-3中任一項的人工微染色體的玉米植物。6.—種包含權利要求4的人工微染色體的玉米植物。7.—種包含功能性著絲粒的人工植物微染色體,其中所述著絲粒特異性結(jié)合著絲粒蛋白C(CENPC)。8.—種包含權利要求7的人工微染色體的玉米植物。9.一種分離的多核苷酸,所述多核苷酸包含(a)至少2個反向CentC串聯(lián)重復序列陣列,其中第1陣列包含至少IO個拷貝的CentC,第2陣列包含至少10個拷貝的CentC;和(b)至少一個拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中所述反轉(zhuǎn)錄轉(zhuǎn)座元件位于第1陣列和第2陣列之間。10.權利要求9的分離的多核苷酸,其中所述反轉(zhuǎn)錄轉(zhuǎn)座元件選自CentA、C謹l和CRM2。11.一種分離的多核苷酸,所述多核苷酸包含(a)至少一個CentC串聯(lián)重復序列陣列,所述陣列包含至少10個拷貝的CentC;和(b)至少一個拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,選自CentA、CRM1和CRM2。12.—種分離的多核苷酸,所述多核苷酸包含(a)至少一個CentC串聯(lián)重復序列陣列,所述陣列包含至少10個拷貝的CentC;和(b)CentA、CRM1和CRM2各自至少一個拷貝。13.—種重組構(gòu)建體,所述構(gòu)建體包含權利要求9-12中任一項的分離的多核苷酸。14.權利要求13的重組構(gòu)建體,所述構(gòu)建體還包含具有至少30個拷貝的端粒重復序列陣列的DNA片段。15.—種轉(zhuǎn)基因玉米植物,所述植物包含權利要求13的重組構(gòu)建體。16.—種轉(zhuǎn)基因玉米植物,所述植物包含權利要求14的重組構(gòu)建體。17.—種用于制備包含具有功能妙著絲粒的人工植物措i染色體的轉(zhuǎn)基因玉米植物的方法,所述方法包括(a)使至少一個玉米植物細胞與包含權利要求14的重組構(gòu)建體的混合物接觸;(b)鑒定來自步驟(a)并包含具有功能性著絲粒的人工植物微染色體的至少一個玉米植物細胞;和(c)使來自步驟(b)的玉米植物細胞再生出能育的玉米植物,其中所述玉米植物包含具有功能性著絲粒的人工植物微染色體。18.權利要求17的方法,其中所述混合物還包含刺激細胞生長的多肽。19.權利要求18的方法,其中所述多肽選自wuschel、babyboom、RepA或Lecl。全文摘要描述了包含能特異性結(jié)合著絲粒蛋白C(CENPC)的功能性著絲粒的人工植物微染色體以及所述微染色體的制備方法。文檔編號C12N15/82GK101490267SQ200780026763公開日2009年7月22日申請日期2007年5月17日優(yōu)先權日2006年5月17日發(fā)明者E·阿納尼伊夫,M·A·錢伯林,S·斯維塔舍,W·J·戈頓坎姆,吳成倉申請人:先鋒高級育種國際公司