專利名稱:Nrps-pks基因簇及其操縱和應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼用于合成聚酮化合物巨內(nèi)酰胺(macrolactam)BE-14106的生物合 成機(jī)構(gòu)的基因簇的克隆和測序,所述生物合成機(jī)構(gòu)基因簇包含非核糖體肽合成酶(NRPS) 腺苷酰化結(jié)構(gòu)域和模塊型聚酮化合物生物合成酶或酶復(fù)合物(PKS ;聚酮化合物合酶或酶 復(fù)合物)。因此所述生物合成機(jī)構(gòu)包含雜合NRPS-PKS酶系統(tǒng)。所以本發(fā)明涉及編碼用 于合成巨內(nèi)酰胺BE-14106的生物合成機(jī)構(gòu)的新型基因和核酸分子,包括涉及BE-14106 生物合成的模塊型NRPS-聚酮化合物生物合成酶或酶系統(tǒng),并且所述生物合成機(jī)構(gòu)包含 模塊型NRPS-聚酮化合物合酶酶系統(tǒng)或其復(fù)合物(以及其組分)。本發(fā)明還涉及這些基 因、核酸分子、機(jī)構(gòu)、酶和酶系統(tǒng)或其復(fù)合物在促進(jìn)BE-14106生物合成中的應(yīng)用以及在 BE-14106衍生物合成和新型巨內(nèi)酰胺結(jié)構(gòu)合成中的應(yīng)用。
背景技術(shù):
聚酮化合物或聚酮化合物類結(jié)構(gòu)或聚酮化合物相關(guān)結(jié)構(gòu)是由細(xì)菌、真菌、植物 和動(dòng)物合成的天然產(chǎn)物,或形成了上述天然產(chǎn)物的基礎(chǔ),其中許多具有作為藥物或作為 農(nóng)業(yè)產(chǎn)品或獸醫(yī)產(chǎn)品的應(yīng)用潛力,例如作為抗生素、抗真菌劑、細(xì)胞生長抑制劑、抗膽 甾醇血癥藥、抗寄生物劑、抗球蟲劑、動(dòng)物生長促進(jìn)劑和天然殺蟲劑。革蘭氏陽性細(xì)菌鏈霉菌(Streptomyces)是聚酮化合物和聚酮化合物類分子的主要 生產(chǎn)者,并且這些生物體中聚酮化合物生物合成的遺傳學(xué)和生物化學(xué)已得到較好的表征 (McDanielR等;ChemRev.2005Feb ; 105(2) 543-58.)。其它生產(chǎn)者包括其它放線菌。已知有多種不同聚酮化合物類(或聚酮化合物相 關(guān))分子,其中巨內(nèi)酰胺代表一類。OgasawaraY.等于ChemBiol.2004Jan ; 11(1) 79-98 和 Udwary 等于 Proc Natl Acad Sci USA 2007Jun 19 ; 104(25) 10376-81 已經(jīng)分別報(bào)道 了用于合成巨內(nèi)酰胺文森他汀(vicenistatin)和薩利內(nèi)酰胺(salinilactam)的生物合成基因簇。BE_14106(另一名稱為GT-32A)是具有如
圖1所示化學(xué)結(jié)構(gòu)的巨內(nèi)酰胺抗生 素。其已經(jīng)從類球形鏈霉菌(Streptomyces spheroide)菌株中得到分離,并且表明其具 有針對白血病細(xì)胞系的細(xì)胞毒性作用,以及針對許多所測試生物體的抗微生物活性, 針對H-ras轉(zhuǎn)化BALB3T3細(xì)胞系的抗增殖活性和針對混合淋巴細(xì)胞反應(yīng)的抑制活性 (JP4001179, Kojiri 等 1992Journal of Antibiotics, 868-74 ; Takahashi 等 1997,Journal of Antibioticsl86-8)。還已經(jīng)從未指明的鏈霉菌屬(Streptomyces)物種分離出8-脫氧類似 物(GT-32B),并且顯示其與BE-14106共有多種活性(Takahashi等,出處同上)。巨內(nèi)酰胺化合物如BE-14106可以如下形成用激活的氨基酸激活和啟動(dòng)PKS系 統(tǒng),以與脂肪酸生物合成類似的方式通過使用聚酮化合物合酶(PKS)重復(fù)縮合簡單的羧 酸使氨基酸殘基(氨?;?延伸。因此,與“起始單元”是羧酸殘基的簡單聚酮化合物 鏈的情況不同,在這種情況下,PKS的起始單元是由氨基酸和?;満铣傻陌滨;虚g 體。PKS可以組織成以循環(huán)方式再利用結(jié)構(gòu)域的迭代(iterative)PKS,或組織成含有一串分開模塊(separate module)(或重復(fù)單元)并且不再利用結(jié)構(gòu)域的模塊型(I型)PKS。每 一模塊負(fù)責(zé)聚酮化合物鏈合成中的一個(gè)縮合循環(huán),并且含有各種酶結(jié)構(gòu)域。在BE-14106 的情況下,嚴(yán)格而言,“聚酮化合物”鏈?zhǔn)请s合氨基酸-聚酮化合物鏈,或氨?;?, 但是本文稱之為“聚酮化合物鏈”。因此,除了通過酮酰合酶(KS)結(jié)構(gòu)域催化而 將下一個(gè)羧酸縮合到生長中的聚酮化合物鏈的結(jié)構(gòu)域之外,I型PKS的模塊可以含有具有 β-酮還原酶(KR)活性、脫水酶(DH)活性或烯?;€原酶(ER)活性的結(jié)構(gòu)域,其確 定導(dǎo)入的延伸單元的還原狀態(tài)。存在于每一模塊中的酰基轉(zhuǎn)移酶(AT)和?;d體蛋白 (ACP)結(jié)構(gòu)域分別負(fù)責(zé)延伸單元的選擇和PKS上生長中的聚酮化合物鏈的保持。一旦完 成合成,通過硫酯酶(TE)的作用使聚酮化合物鏈從PKS釋放,所述硫酯酶還可能涉及 最終產(chǎn)物的環(huán)化。因此,I型PKS表示聚酮化合物生物合成的裝配線,其可以通過改變 模塊的數(shù)量、其對羧酸的特異性,或通過失活或插入活性減少的結(jié)構(gòu)域來操縱(Weissman 禾口 Leadlay,Nat.Rev.Microbiol.2005Dec ; 3(12) 925-36.)。聚酮化合物部分合成并環(huán)化 形成大環(huán)內(nèi)酯(macrolactone)(或巨內(nèi)酰胺)環(huán)后,可以經(jīng)由羥基化、糖基化、甲基化和/ 或?;瘜ζ湫揎?。這些修飾對于某些聚酮化合物類產(chǎn)物的生物活性可能是重要的。在 導(dǎo)致本發(fā)明的工作中,編碼BE-14106NRPS-PKS酶系統(tǒng)(BE-14016 “基因簇”)的基因 已被克隆和測序,并且已經(jīng) 確定BE-14106NRPS-PKS酶系統(tǒng)含有幾個(gè)I型PKS,其中各 PKS以模塊方式組織,并且由重復(fù)單元(模塊)組成,下文將對此進(jìn)行更詳細(xì)的描述。鏈霉菌(Streptomyces)中聚酮化合物生物合成的基因通常以簇的形式組織,已經(jīng) 鑒定出許多這種簇,負(fù)責(zé)各種天然產(chǎn)物的合成。已經(jīng)描述了鏈霉菌(Streptomyces)的幾 種大環(huán)內(nèi)酯抗生素基因簇的分子克隆和完成的DNA測序,包括除蟲霉素(avermectin)、 苦霄素(pikromycin)禾口雷中白霄素(rapamycin) (Ikeda H., Omura S. (2002) .Biosynthesis, Regulation, and Genetics of Macrolide Production.在 Macrolide Antibiotics Chemistry, Biology and Practice,第二版(由 S.Omura 編),第 286—326 頁,Academic Press, New York.) 如上所述,還已經(jīng)報(bào)道了某些巨內(nèi)酰胺抗生素的生物系統(tǒng)的基因簇。如上指出以及如下所述,本發(fā)明基于用于迄今為止不可得到的BE-14106的生物 合成的新型基因簇的鑒定、克隆和測序??寺』虻姆治鲞M(jìn)一步闡明BE-14106的生物 合成途徑。因此,現(xiàn)在提出BE-14106合成的正常過程通過合成起始單元(C17-C25)而 啟動(dòng),此處?;糠謴?個(gè)丙酸酯和2個(gè)乙酸酯單元合成。NRPS腺苷?;Y(jié)構(gòu)域激活甘 氨酸分子,并將激活的甘氨酸加載到肽基載體蛋白上,從而繼續(xù)起始單元的合成。甘氨 酸的氧化脫氨基釋放銨,其對C-17羰基進(jìn)行親核攻擊從而形成C-17亞氨基,該C-17亞 氨基隨后被還原成氨基。氨?;湉碾幕d體蛋白的釋放導(dǎo)致羧酸的形成,該羧酸隨后 被腺苷?;⑴c輔酶A(CoA)連接。所得的激活的氨?;?CoA通過酰基轉(zhuǎn)移酶將轉(zhuǎn)移 至IjPKS的ACP結(jié)構(gòu)域,并通過以下更詳細(xì)描述的PKS系統(tǒng)中的酶的順續(xù)作用而延伸和修 飾。各模塊中的酮酰合酶(KS)酶結(jié)構(gòu)域催化由?;D(zhuǎn)移酶(AT)模塊確定的合適的 羧酸(例如乙酸酯或丙酸酯)的縮合。具有β _酮還原酶(KR)或脫水酶(DH)活性的 酶結(jié)構(gòu)域確定導(dǎo)入的延伸單元的還原狀態(tài)。BE-14106的C20-C25烴側(cè)鏈由起始單元的部分組成,并由巨內(nèi)酰胺環(huán)的環(huán)化產(chǎn)
生。最后,巨內(nèi)酰胺環(huán)的進(jìn)一步修飾經(jīng)由羥基化發(fā)生。BE-14106生物合成基因簇還編碼或包括各種調(diào)節(jié)元件和用于轉(zhuǎn)運(yùn)所合成分子的蛋白質(zhì)。由于諸如BE-14106等化合物的化學(xué)合成是高度復(fù)雜的,在實(shí)踐中需要使用生物 合成途徑,因此需要從合適的宿主分離或純化所述化合物。如本領(lǐng)域已經(jīng)意識(shí)到的,這 為操縱PKS基因簇的基因從而改變生物合成,并由此導(dǎo)致新型聚酮化合物或聚酮類化合 物或經(jīng)修飾的聚酮化合物或聚酮類化合物的合成提供了機(jī)會(huì)。雖然已經(jīng)描述了修飾許多 PKS基因簇可導(dǎo)致各種新型化合物的合成,但仍然需要并期望增加可獲得化合物(特別是 抗生素)的清單,和/或改進(jìn)現(xiàn)有藥物的性質(zhì)(例如,功效,毒性,水溶性等)。本發(fā)明 針對這些目標(biāo),并基于BE-14106生物合成基因簇的克隆和DNA測序。這首次提供了這 些抗生素生物合成基因的序列,以及為修飾BE-14106的表達(dá)水平或性質(zhì)和/或生產(chǎn)生物 體,或?yàn)楂@得新型的潛在有用的化合物提供了遺傳操縱工具。就此而言,雖然已知抗生 素BE-14106,在鏈霉菌(Streptomyces)中合成的多種聚酮化合物類分子和相應(yīng)地多種生物合成基因簇的背景下,鑒定和克隆正確的BE-14106基因簇不是簡單的事情,需要序列 分析和探針設(shè)計(jì)或選擇方面的可觀努力和獨(dú)創(chuàng)性。
發(fā)明內(nèi)容
本發(fā)明人已經(jīng)從之前未知的來源,細(xì)菌分離株MP28-13,分離和純化了 BE-14106,據(jù)認(rèn)為細(xì)菌分離株MP28-13為鏈霉菌屬(Streptomyces)的新菌株(于2008 年1月25日保藏于德國微生物菌種保藏中心(Deutsche Sammlung von Mikroorganismem und Zellkulturen GmbH (DSMZ)),保藏號(hào)DSM21069),該菌株分離自挪威的特隆赫姆峽 灣(Trandheim fjord)中的淺水區(qū)沉淀物。該新型微生物的分離使得本發(fā)明人能夠克隆和 測序完整的BE-14106生物合成基因簇。該簇含有22個(gè)基因,這些基因編碼推定參與 BE-14106分子的生物合成的蛋白質(zhì)(參見表1)。為了進(jìn)行該克隆,使用特別設(shè)計(jì)的寡核苷酸引物來擴(kuò)增來自分離株MP28-13的 KS結(jié)構(gòu)域編碼區(qū),所述引物代表編碼酮基合酶(ketosynthase) (KS)結(jié)構(gòu)域的部分的序 列。一旦獲得并表征所擴(kuò)增的序列,基于復(fù)雜深入的生物信息學(xué)分析,選擇所述序列中 的一個(gè)作為探針。使用該探針來篩選為MP28-13構(gòu)建的基因組文庫。分析以此方式鑒 定的粘粒,并對其測序以提供完整的生物合成簇。如圖2A和2B所示,已經(jīng)對所述序列 進(jìn)行注釋,并且說明了 BE-14106生物合成的兩部分途徑。起始氨?;鶈卧纳锖铣赏?徑的第一部分示于圖2A,第二部分,即氨?;湹难由?、導(dǎo)致巨內(nèi)酰胺環(huán)形成的所述鏈 的環(huán)化和PKS后修飾,示于圖2B。因此,提出了 BE-14106生物合成基因簇編碼第一酶 系統(tǒng)或復(fù)合物,所述第一酶系統(tǒng)或復(fù)合物包含PKS和其它用于合成氨酰基鏈的酶或蛋白 質(zhì);以及用于所述氨?;溠由斓牧硗獾腜KS酶系統(tǒng)或酶復(fù)合物,以及用于所述分子的 PKS后修飾的酶、用于調(diào)節(jié)所述途徑的蛋白質(zhì),和抗性/外排蛋白(efflux protein)?;趯λ鲂蛄械牧私?,開發(fā)了鏈霉菌屬(Streptomyces)物種MP28-13的遺傳 操縱的方法。以此方式可以表明,所述新型序列確實(shí)負(fù)責(zé)BE-14106生物合成。另外,對已經(jīng)鑒定出的新型生物合成基因簇內(nèi)的功能性DNA序列的操縱,可以 導(dǎo)致合成功能或性質(zhì)改變(例如改進(jìn))的新型分子結(jié)構(gòu),例如BE-14106衍生物或類似 物,以下將進(jìn)行更詳細(xì)的描述。這樣,可以操縱BE-14106基因簇,以不僅獲得有益的 新BE-14106衍生物或類似物,還可以改進(jìn)和促進(jìn)生物合成生產(chǎn)方法(例如改進(jìn)產(chǎn)率,或生產(chǎn)條件,或擴(kuò)展可利用的宿主細(xì)胞的范圍),或更優(yōu)選提供具有新活性和/或性質(zhì)的新 型化合物。BE-14106生物合成基因簇的完整編碼序列(即,編碼BE-14106生物合成基因 簇的完整核苷酸序列)示于SEQ ID No.l。已經(jīng)顯示其含有許多基因或ORF,所述基因 或ORF編碼負(fù)責(zé)BE-14106生物合成所需的活性的各種蛋白質(zhì)和多肽。 所述生物合成基因簇含有據(jù)認(rèn)為編碼正常BE-14106生物合成所需的所有蛋白質(zhì) 和多肽的基因和ORF。然而,不是所有的編碼蛋白質(zhì)和多肽都在生物合成中起作用,因 此可能不是所有所述簇的編碼蛋白質(zhì)或多肽都是BE-14106生物合成所必需的。各種基因 和ORF可以編碼催化一種以上生化反應(yīng)的酶,或編碼不具有催化活性但是參予諸如調(diào)節(jié) BE-14106合成過程、或BE-14106轉(zhuǎn)運(yùn)過程等其它過程的蛋白質(zhì)。所述酶中的幾種是聚酮化合物合酶(PKS),并且雖然尚未確定,但是許多所述 PKS可能物理相連以形成酶復(fù)合物。本文將這樣的一組或一套酶稱為聚酮化合物生物合 成酶系統(tǒng)或聚酮化合物生物合成酶復(fù)合物或PKS酶系統(tǒng)或PKS酶復(fù)合物,雖然不需要所 述系統(tǒng)/復(fù)合物中的所有酶/蛋白質(zhì)都是實(shí)際的聚酮化合物合酶,即具有聚酮化合物合 酶活性;它們可以在BE-14106合成中具有其它活性或功能作用。例如,非核糖體肽合 成酶(NRPS)的離散腺苷?;Y(jié)構(gòu)域(BecL)連同由所述簇編碼的一些其它輔助蛋白(例 如,BecJ、BecS> BecU),通過激活一個(gè)氨基酸(推定為甘氨酸)而參與用于生物合成 BE-14106的起始單元的合成,以及將其加載到幾個(gè)BE-14106PKS模塊中的一個(gè)上以進(jìn) 一步延伸。其它蛋白質(zhì),例如BecO,執(zhí)行C-8處巨內(nèi)酰胺的羥基化。包含所述NRPS 結(jié)構(gòu)域和PKS酶的一組酶或一套酶可以稱為雜合NRPS-PKS酶系統(tǒng)或酶復(fù)合物。由基 因簇編碼的蛋白質(zhì)和多肽的組作為一個(gè)整體總稱為用于BE-14106生物合成的生物合成機(jī) 構(gòu)。因此在一方面,本發(fā)明提供一種核酸分子,所述核酸分子包含(a) SEQ ID No.l所示的核苷酸序列;或(b)與SEQ ID No.l互補(bǔ)的核苷酸序列;或(c)與SEQ ID No.l簡并的核苷酸序列;或(d)與SEQ ID No.l具有至少85%序列同一性(優(yōu)選具有至少87%、90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98 % 或 99 %序列同一性)的核苷酸序 列;或(e) (a) (d)中任一個(gè)的一部分,其中所述部分優(yōu)選包含與BE-14106生物合成 基因或開放閱讀框(ORF)對應(yīng)的序列,或與上述序列互補(bǔ)或與上述序列簡并。更具體而言,所述核酸分子編碼一種以上多肽(或包含編碼一種以上多肽的核 苷酸序列),或包含一種以上在合成聚酮化合物或巨內(nèi)酰胺分子(特別是合成BE-1406或 其衍生物,或BE-1406相關(guān)分子)中具有功能活性的遺傳元件,或者其是所述核酸分子 的互補(bǔ)物。這些功能活性可以是酶活性,例如涉及聚酮化合物或巨內(nèi)酰胺分子合成或轉(zhuǎn) 運(yùn)或轉(zhuǎn)移(其可以是聚酮化合物鏈或巨內(nèi)酰胺環(huán)合成,或有助于其的任何步驟,或巨內(nèi) 酰胺環(huán)或聚酮化合物鏈修飾等)的活性,和/或其可以是調(diào)節(jié)活性,例如調(diào)節(jié)涉及合成的 基因(例如轉(zhuǎn)錄調(diào)節(jié)子)或蛋白質(zhì)的表達(dá),或調(diào)節(jié)合成過程,和/或其可以是“轉(zhuǎn)運(yùn)體活 性”。因此,通常所包括的是涉及聚酮化合物或巨內(nèi)酰胺部分轉(zhuǎn)移或轉(zhuǎn)運(yùn)(例如將使所合成的分子轉(zhuǎn)運(yùn)或排出細(xì)胞內(nèi)部或外部)的轉(zhuǎn)運(yùn)蛋白。盡管根據(jù)本發(fā)明優(yōu)選編碼所期望產(chǎn)物的核苷酸序列,但還包括的是包含諸如啟 動(dòng)子、啟動(dòng)子_操縱子區(qū)域、增強(qiáng)子、其它調(diào)節(jié)序列等功能性遺傳元件的核苷酸序列。 因此,本發(fā)明的核酸分子不必包含全部PKS基因簇,而是可以包含基因簇的一部分,例 如編碼具有特定功能的多肽或調(diào)節(jié)序列的部分。其可以包含一種以上基因,和/或調(diào)節(jié) 序列,和/或一種以上模塊,或酶結(jié)構(gòu)域,或非編碼功能性遺傳元件或編碼功能性遺傳 元件(例如,控制基因表達(dá)、轉(zhuǎn)錄、翻譯等的元件)。通常而言,本發(fā)明的核酸分子會(huì)包 含許多不同的可導(dǎo)致聚酮化合物類分子或巨內(nèi)酰胺分子(例如BE-14106衍生物或經(jīng)修飾 的BE-14106分子)合成的基因和/或調(diào)節(jié)序列。下面進(jìn)一步定義“BE-14106生物合成基因或ORF”,但在以上章節(jié)(e)的情況 下簡單而言是指編碼在BE-14106或BE-14106衍生物或類似物或BE-14106相關(guān)分子的 生物合成過程中起作用的蛋白質(zhì)或多肽的基因或OEF。如上所述,其可以是涉及起始氨 基酸的激活、激活的氨基酸/氨酰基鏈到PKS酶的轉(zhuǎn)移、聚酮化合物鏈或其修飾物的產(chǎn) 生的酶,或調(diào)節(jié)所需的蛋白質(zhì)、或在其生物合成的任何階段轉(zhuǎn)運(yùn)或轉(zhuǎn)移分子所需的蛋白 質(zhì)。本發(fā)明的核酸分子可以是分離的核酸分子(換言之,與在自然中發(fā)現(xiàn)時(shí)通常與 其在一起的成分分離或分開),或其可以是重組核酸分子或合成核酸分子。如本文其它本分所討論的,BE-14106生物合成基因簇是較大的核酸分子,含有 編碼生物合成BE-14106分子或BE-14106衍生物或類似物或BE-14106相關(guān)分子所需的蛋 白質(zhì)或肽的各種遺傳元件或不同基因或ORF。各BE-14106生物合成基因或ORF編碼在 BE-14106分子或BE-14106衍生物或類似物或BE-14106相關(guān)分子的生物合成中具有功能 或據(jù)認(rèn)為具有所述功能的單獨(dú)的多肽鏈(作為選擇還可描述為蛋白質(zhì))。已經(jīng)鑒定出22個(gè) 所述基因或ORF (參見表1)。如圖2A和2B所示,這些中的14個(gè)在生物合成BE-14106 中起直接作用。如下面進(jìn)一步所解釋的,據(jù)認(rèn)為或提出某些其它基因或ORF在BE-14106 生物合成中起作用。因此例如,據(jù)認(rèn)為becH和M編碼調(diào)節(jié)子,據(jù)認(rèn)為BecL涉及甘氨酸 激活,據(jù)認(rèn)為BecU介導(dǎo)BecC和PCP BecS的ACP之間的蛋白質(zhì)相互作用,據(jù)認(rèn)為BecN 涉及排出和/或抗性,據(jù)認(rèn)為BecP輔助巨內(nèi)酰胺環(huán)的環(huán)化,并且據(jù)認(rèn)為BecQ涉及起始 氨?;湉腂ecC-BecU-BecS復(fù)合物的釋放。某些所述蛋白質(zhì)具有酶活性,并因而可以被定義為酶。各種這些酶可以描述為 聚酮化合物合酶(PKS)。所述酶包含一個(gè)或多于一個(gè)模塊,并且各模塊可以含有1 6個(gè),優(yōu)選2個(gè)、3個(gè)、4個(gè)或5個(gè)酶結(jié)構(gòu)域,各結(jié)構(gòu)域承擔(dān)生物合成BE-14106分子或 BE-14106衍生物或類似物或BE-14106相關(guān)分子中的不同活性。因此,在這些PKS中, 多個(gè)活性位點(diǎn)可以存在于一個(gè)多肽或酶中。
例如,酶BecB是PKS,并且具有3個(gè)模塊;模塊1 (圖2B中的“加載模塊”) 具有單一活性位點(diǎn)或結(jié)構(gòu)域(ACP),模塊2和3的每一個(gè)(圖2B中的模塊1和模塊2)具 有五個(gè)具有KS、AT、DH、KR和ACP活性的活性位點(diǎn)或結(jié)構(gòu)域。由所述基因簇編碼的 其它PKS為BecA、BecC> BecD> BecG、BecF禾Π BecE。所述PKS可以含有許多結(jié)構(gòu) 域,每個(gè)結(jié)構(gòu)域擁有延伸和/或改變聚酮化合物結(jié)構(gòu)的催化活性。所述聚酮化合物沿所 述蛋白質(zhì)行進(jìn),從而在生長中的聚酮化合物鏈上依次實(shí)施不同的活性。如上討論,由所述基因簇編碼的各種PKS可以相連,從而形成生物合成酶復(fù)合物。本發(fā)明的核酸分子編碼一些,或更優(yōu)選全部的參與BE-14106分子或BE-14106 衍生物或類似物或BE-14106相關(guān)分子的生物合成的多肽或蛋白質(zhì)(或者本發(fā)明的核酸分 子包含編碼所述多肽或蛋白質(zhì)的核苷酸序列)。例如,所述核酸分子可以含有22種基因 或ORF中的每一個(gè),因此編碼表1中所示的參與BE-14106分子的生物合成的蛋白質(zhì)中的 每一個(gè),或者其可以包含核苷酸序列SEQ ID No.l的部分,例如編碼由BE-14106生物合 成基因簇內(nèi)的單一基因或ORF編碼的單一蛋白質(zhì)或多肽的序列。所涵蓋的有包含例如至 少 11、12、13、14、15、16、17、18、19、20、21,或至多 2、3、4、5、6、7、8、9、 10、11 (例如 1 21、2 20、3 19、4 18、5 17、6 16、7 15、8 14、 9 13、10 12)種基因或ORF的部分。優(yōu)選本發(fā)明的核酸分子編碼所有表1所示的參 與BE-1410 6分子生物合成的蛋白質(zhì)。作為選擇,其可以包含除了 becR和ORF6中的任 一種或多種之外的所有表1中所示的ORF/基因。由于表1列出了所有已經(jīng)被表征的基 因或0RF,可以將表1中所示的編碼所有參與BE-14106分子生物合成的蛋白質(zhì)的核酸分 子定義為包含BE-14106生物合成基因簇的序列。因此,本發(fā)明的核酸分子編碼一種或多種參與BE-14106或BE-14106衍生物或 類似物或BE-14106相關(guān)分子的生物合成的多肽,或在BE-14106或BE-14106衍生物或 類似物或BE-14106相關(guān)分子的合成中具有功能活性的多肽。作為選擇,所述核酸分子 可以編碼一種或多種其功能等效變體或功能等效物。如上所限定,本發(fā)明的核酸分子可 以包含SEQ ID Nal的功能等效變體,并且所述變體包括部分、簡并序列或由與SEQ ID No.l的序列同一性百分比限定的同源物。所述功能等效變體編碼具有如上所述功能活性 的蛋白質(zhì)/多肽。所述功能活性可以是酶活性,例如涉及聚酮化合物部分或巨內(nèi)酰胺分 子的合成或轉(zhuǎn)運(yùn)或轉(zhuǎn)移(這可以是鏈或環(huán)合成或有助于其的任何步驟,或者生物合成的 任何階段的修飾等,例如 BecA、BecU、BecB> BecJ> BecK、BecS> BecO> BecD> BecG、BecF> BecE、BecT> BecQ> BecP> BecC> Becl、BecL)的活性;和 / 或其可以 是調(diào)節(jié)活性,例如調(diào)節(jié)參與合成的基因或蛋白質(zhì)的表達(dá),或調(diào)節(jié)合成過程,例如BecH, BecM ;和/或其可以是“轉(zhuǎn)運(yùn)體活性”或抗性,例如BecN。因此,通常包括的是涉及 將所合成分子轉(zhuǎn)移入/轉(zhuǎn)移出、轉(zhuǎn)運(yùn)入/轉(zhuǎn)運(yùn)出或排入/排出所述細(xì)胞的轉(zhuǎn)運(yùn)蛋白。還 涵蓋的是編碼一個(gè)或多個(gè)模塊或酶結(jié)構(gòu)域的序列。這些分子的長度可以是至少200個(gè)堿基,更優(yōu)選至少300、500、600、700、 800、 900、 1000、 1500、 2000、 3000、 5000、 10000、 15000、 20000、 30000 或 50000 個(gè) 堿基。因此代表性的片段長度可以包括長度為IOObp 18000bp,例如IOObp 3000bp、 200bp 2500bp、 2000bp 8000bp、 3000bp 5000bp、 4000bp 17000bp、 7000bp 12000bp或8000bp IlOOObp的片段。如上所述,在SEQ ID NO 1內(nèi)已經(jīng)鑒定出許多 基因和ORF,包含所述基因或ORF的部分或片段代表SEQ ID NO: 1的優(yōu)選“部分”或 片段。將這些在下表1中列出表 1名稱|SEQIDNO: llSEQIDNO l|所編碼蛋白質(zhì)的推定功能ISEQIDNO
_中的起始位置中的終止位置_(核酸/蛋白質(zhì))
^^458 —3313 —LuxR-型轉(zhuǎn)錄調(diào)節(jié)子 2/3 “ becA 3664 20412 I型PKS,加載+模塊1+模塊2 +不E ___完整的模塊3__
bed 21832 20744 C 甘氨酸氧化酶/FAD-依賴性氧化還 ___^__
^C 23913—21829 C—I 型 PKS,不完整的模塊 3
becU 2450S23945 C阿維鏈霉菌(S. avermitilis) SAV_606 10/11
___的同源物,推定的NRPS輔助j白__
becB 350SS24505 CI 型 PKS,模塊 1、2 和 3 12/13
3675235154 C-推定的酰基輔酶A合酶/連接酶 14/15
becK 3694737918?;D(zhuǎn)移酶 16/17
^"3817037934 C—肽基/?;d體蛋白 18/19
38288—39805—NRPS,腺苷酰化結(jié)構(gòu)域
^gcM4038439788 C -型轉(zhuǎn)錄調(diào)節(jié)子 22/23
4048642060型外排泵 24/25
6ecO 4338842153 C^"o 單加氧酶 26/27
b^D 5355343435 CI 型 PKS,模塊 4 &5 ~ 28/29
5450253561 CL-氨基酸酰胺酶/脯氨酸亞氨基肽酶30/31
b^G 60565~54605 C_I 型 PKS,模塊 9+ TE 結(jié)構(gòu)域 32/33 “
^gcF 7070660573 CI 型 PKS,模塊 7 和 8 34/35
becE156A970754 CI 型 PKS,模塊 6 36/37
becT 7624175954 CSimX2-樣蛋白,丙?;?Coa 羧化酶 38/39
___的推定亞基__
becQ 7656377336硫酯酶,II 型 40/41
7748978202PlsC-型磷脂/甘油酰基轉(zhuǎn)移酶 42/43
^Φ [79912[78302 C|三肽基氨基肽酶,分泌的 +44/45在上表中,“C”表示所述蛋白質(zhì)由互補(bǔ)鏈編碼。因此以上列出的序列代表ΒΕ-14106生物合成基因或ORF。換言之,發(fā)現(xiàn)所 述基因/ORF位于ΒΕ-14106生物合成基因簇內(nèi),并且編碼在鏈霉菌(Streptomyces)的 ΒΕ-14106生物合成中起作用或提出在鏈霉菌(Streptomyces)的ΒΕ-14106生物合成中起作 用的蛋白質(zhì)或多肽。術(shù)語“ΒΕ-14106生物合成基因”或“ΒΕ-14106生物合成ORF” 還包括編碼與上述蛋白質(zhì)具有相同活性或功能(例如如本文其他部分所討論的,具有相 同的高水平的序列同一性)的蛋白質(zhì)的基因和ORF。作為選擇可以將它們描述為“功能 等效變體”或“功能等效物”。通常術(shù)語“基因”包括編碼蛋白質(zhì)的ORF,以及諸如啟動(dòng)子等任何調(diào)節(jié)序列一 起,而術(shù)語“ORF”僅指負(fù)責(zé)編碼蛋白質(zhì)的基因的部分。本文涉及的“功能等效變體”或“功能等效物”保留與它們相關(guān)(或衍生它們) 的實(shí)體的至少一種功能,例如編碼具有基本上相同性質(zhì)的蛋白質(zhì),或展示基本上相同的 調(diào)節(jié)或其 它功能性質(zhì)或活性的蛋白質(zhì)??梢允褂帽绢I(lǐng)域已知的標(biāo)準(zhǔn)技術(shù)測試所述性質(zhì)或 活性。
盡管根據(jù)本發(fā)明優(yōu)選編碼所期望產(chǎn)物的核苷酸序列,但還包括的是包含諸如啟 動(dòng)子、啟動(dòng)子_操縱子區(qū)域、增強(qiáng)子、其它調(diào)節(jié)序列等功能性遺傳元件的核苷酸序列。 因此,本發(fā)明的核酸分子不必包含整個(gè)基因簇,而是可以包含其一部分,例如編碼具有 特定功能的多肽的部分或調(diào)節(jié)序列。其優(yōu)選包含一種以上的基因和/或調(diào)節(jié)序列。還涵 蓋的是通常小于其并編碼一個(gè)以上模塊、或酶結(jié)構(gòu)域的序列,或非編碼功能遺傳元件或 編碼功能遺傳元件(例如控制基因表達(dá)、轉(zhuǎn)錄、翻譯等的元件)的序列。因此,本發(fā)明擴(kuò)展到這樣的核酸分子該核酸分子包含選白SEQ IDNO : 2、 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42 和 44的核苷酸序列(如表1所示,通過參考SEQ IDNo. 1的核苷酸起始和終止位置而確定) 或與上述核苷酸序列互補(bǔ)或與其簡并的核苷酸序列。 還提供的是這樣的核酸分子該核酸分子包含展示與SEQ ID NO: 2、4、6、 8、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42 和 44 中 任一種具有至少 80% (優(yōu)選至少 85%、87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或99% )序列同一性的核苷酸序列或與上述核苷酸序列互補(bǔ)或與其簡 并的核苷酸序列。本發(fā)明還涉及這樣的核酸分子該核酸分子包含編碼一種以上選自SEQID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、
41、43或45的氨基酸序列的核苷酸序列或與上述核苷酸序列互補(bǔ)或與其簡并的核苷酸序 列。還提供的是這樣的核酸分子該核酸分子包含編碼一種以上展示與SEQ ID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、 41、43和45中任一種具有至少80% (優(yōu)選至少85%、87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或99% )序列同一性的氨基酸序列的核苷酸序列或與上 述核苷酸序列互補(bǔ)或與其簡并的核苷酸序列。在每一情況下,所述核酸分子優(yōu)選是如本文定義的BE-14106生物合成基因或 ORF??梢酝ㄟ^任何常規(guī)方法評價(jià)核苷酸或氨基酸序列同一性。然而,為了確定 序列之間的序列同一性的程度,可使用進(jìn)行序列多重比對的計(jì)算機(jī)程序,例如Clustal W (Thompson, J.D 等.,1994, “ CLUSTAL W Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice “ .Nucleic Acids Res 22 4673-4680)。為此目的還可使用對 序列對進(jìn)行比較和比對的程序,例如ALIGN (E.Myers和W.Miller,1988, “ Optical Alignments in Linear Space",CABIOS 4 11-17)、FASTA(W.R.Pearson 和 D.J.Lipman, 1988, ‘‘ Improved tools for biological sequence analysis ",PNAS 85 2444-2448, 禾口 W.R.Pearson, 1990, " Rapid and sensitive sequence comparison with FASTP and FASTA “ Methods in Enzymology 183 63-98)禾口 空位 BLAST(Altschul,S.F.,等, 1997, “ Gapped BLAST and PSI-BLAST a new generation of protein database search programs “ .Nucleic Acids Res.25 3389-3402)。 另外,位于歐洲生物信息學(xué)研究所 (European Bioinformatics institute)的Dali服務(wù)器提供蛋白質(zhì)序列的基于結(jié)構(gòu)的比對(Holm, 1993,J.of Mol.Biology, 233 123-38 ; Holm, 1995,Trends in Biochemical Sciences, 20: 478-480 ; Holm, 1998,Nucleic Acid Research, 26: 316-9)。例如,可以使用來自威斯康星大學(xué)的Genetics Computer Group (GCG) Version 10 軟件包的BestFit程序確定核苷酸序列同一性。該程序使用Smith和Waterman的局部 同源性算法,使用以下默認(rèn)值空位形成罰分=50,空位延伸罰分=3,平均匹配= 10,000,平均錯(cuò)配=-9.000。本發(fā)明的核苷酸序列可以展示與SEQ ID NO 1具有至少85%、87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或 99%序列同一性,并且所述序列 優(yōu)選編碼一些或所有參與BE-14106分子生物合成的蛋白質(zhì),或與編碼一些或所有參與 BE-14106分子生物合成的蛋白質(zhì)的序列互補(bǔ)。滿足本文定義的%序列同一性標(biāo)準(zhǔn)的核苷 酸序列可以認(rèn)為是“基本上同一的”序列。本發(fā)明的另一方面提供由本文定義的本發(fā)明的核酸分子編碼的多肽。如上討論,SEQ ID NO: 1編碼幾種蛋白質(zhì)或多肽,因此本發(fā)明的這一方面提供 一種多肽,所述多肽包含(a) SEQ ID Nos.3, 5、7、9、11、13、15、17、19、21、23、25、27、29、31、
33、35、37、39、41、43或45的任何一種或多種所示的氨基酸序列的全部或部分;或(b)與 SEQIDNos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、
31、33、35、37、39、41、43或45的任何一種或多種具有至少80%序列同一性的氨基酸 序列的全部或部分。具體而言,所述氨基酸序列可以展示與SEQ ID Nos.3、5、7、9、11、13、15、 17、19、21、23、25、27、29、31、33、35、37、39、41、43 或 45 的任何一種的多肽具 有至少 80%、85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 或99%同一性。作為選擇,所述氨基酸序列可以展示與SEQ ID Nos.3、5、7、9、11、 13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43 或 45 的任何一 種的多肽具有至少 80%、85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或99%相似性。滿足本文%序列同一性或相似性標(biāo)準(zhǔn)的氨基酸(多肽)序列被認(rèn)為是“基本上同 _■”。本發(fā)明的多肽可以是分離的多肽、純化的多肽或合成的多肽。本文使用術(shù)語 “多肽”來包括兩個(gè)以上氨基酸的任何氨基酸序列,即包括短肽或長度較長的肽(即,多
肽或蛋白質(zhì))。上面提到用于確定氨基酸序列同一性的程序,例如可以使用來自威斯康星大學(xué) 的Genetics Computer Group (GCG) Version 10軟件包的BestFit程序確定氨基酸序列同一性 或相似性。該程序使用Smith和Waterman的局部同源性算法,使用以下默認(rèn)值空位形 成罰分-8,空位延伸罰分=2,平均匹配=2.912,平均錯(cuò)配=-2.003。SEQ ID Nos.3、 5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43 或 45的任何一種的氨基酸序列(或如上定義“基本上同一的”序列)的“部分”可以包含 至少20個(gè)相鄰的氨基酸,優(yōu)選至少30、40、50、70、100、150、200、300、400、500、1,000、2,000、5,000或10,000個(gè)相鄰的氨基酸。所述多肽,以及優(yōu)選其部分,根據(jù)上述定義具有功能活性,例如在BE-14106或
BE-14106衍生物或其經(jīng)修飾版本的生物合成中具有酶活性,或具有調(diào)節(jié)或轉(zhuǎn)送功能活
性。因此所述部分可以對應(yīng)或包含如上討論的活性位點(diǎn)或結(jié)構(gòu)域或模塊。已經(jīng)表征了本發(fā)明的核苷酸序列和多肽序列,并且已經(jīng)鑒定出其內(nèi)的各種功能
區(qū)域。所述功能區(qū)域形成本發(fā)明的不同方面。因此本文定義的“部分”優(yōu)選對應(yīng)于至
少一個(gè)模塊或酶結(jié)構(gòu)域或非編碼功能遺傳元件或編碼功能遺傳元件。下表2顯示用編碼
PKS酶的SEQ ID No.l中鑒定出的ORF的翻譯產(chǎn)物鑒定出的功能區(qū)域。^t 2BE-14106PKS蛋白中的結(jié)構(gòu)域界限BecA(SEO ID No.5)分子BecA,5582aas蛋白
權(quán)利要求
1.一種核酸分子,所述核酸分子包含(a)SEQ ID No.l所示的核苷酸序列;或(b)與SEQID No.l互補(bǔ)的核苷酸序列;或(C)與SEQIDNal簡并的核苷酸序列;或(d)與SEQID No.l具有至少85%序列同一性(優(yōu)選具有至少87%、90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或99%序列同一性)的核苷酸序列;或(e)(a) (d)中任一個(gè)的一部分,其中所述核酸分子編碼一種或多種多肽,或與編碼一種或多種多肽的核酸分子互 補(bǔ),或包含在聚酮化合物類分子或巨內(nèi)酰胺分子的合成中具有功能活性的一種或多種遺 傳元件,或與包含在聚酮化合物類分子或巨內(nèi)酰胺分子的合成中具有功能活性的一種或 多種遺傳元件的核酸分子互補(bǔ)。
2.如權(quán)利要求1所述的核酸分子,其中所述分子編碼用于聚酮化合物類分子或巨內(nèi)酰 胺分子合成的NRPS-PKS生物合成系統(tǒng)。
3.如權(quán)利要求1或2所述的核酸分子,其中所述分子包含SEQIDNos 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42 或 44 中的任 一個(gè)所示的核苷酸序列,或與其互補(bǔ)的核苷酸序列或與其簡并的核苷酸序列或與其具有 至少85%序列同一性的核苷酸序列。
4.如權(quán)利要求1或2所述的核酸分子,其中所述分子包含的核苷酸序列編碼選自SEQ ID No 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、41、43或45中的一種或多種氨基酸序列,或與所述氨基酸序列具有至少80% (優(yōu)選 至少 85%、97%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或 99%) 序列同一性的氨基酸序列。
5.由權(quán)利要求1 4中任一項(xiàng)所限定的核酸分子編碼的多肽。
6.如權(quán)利要求5所述的多肽,其中所述多肽包含(a)SEQ ID Nos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或45中的任何一個(gè)或多個(gè)所示的氨基酸序列的全部或部分;(b)與SEQIDNos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、 33、35、37、39、41、43或45中的任何一個(gè)或多個(gè)具有至少80%序列同一性,優(yōu)選至少 80%序列同一'性、85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或99%同一性的氨基酸序列的全部或部分。
7.權(quán)利要求1 6中任一項(xiàng)所限定的核酸分子在制備經(jīng)修飾BE-14106生物合成基因 簇中的用途,所述經(jīng)修飾BE-14106生物合成基因簇用以制備經(jīng)修飾的BE-14106分子。
8.制備編碼經(jīng)修飾BE-14106NRPS-PKS系統(tǒng)的核酸分子的方法,所述方法包括對編 碼所述BE-14106NRPS-PKS系統(tǒng)的權(quán)利要求1 4中任一項(xiàng)所述的核酸分子進(jìn)行修飾。
9.如權(quán)利要求8所述的方法,其中通過對編碼一種或多種由所述核酸分子編碼的活性 或蛋白質(zhì)的序列進(jìn)行導(dǎo)入、突變、缺失、替換或失活,從而對所述核酸分子進(jìn)行修飾。
10.如權(quán)利要求8或9所述的方法,其中對選自以下核苷酸序列的一種或多種核苷酸 序列進(jìn)行修飾SEQ ID Nos 2、4、6、8、10、12、14、16、18、20、22、24、26、28、 30、32、34、36、38、40、42或44中任一所示的核苷酸序列,或與其互補(bǔ)的核苷酸序列,或與其簡并的核苷酸序列,或與其具有至少85%序列同一性的核苷酸序列。
11.如權(quán)利要求8 10中任一項(xiàng)所述的方法,其中以以下方式中的一種或多種對所述 核酸分子進(jìn)行修飾(i)修飾PKS編碼序列以修飾加載模塊的結(jié)構(gòu)域,從而改變起始單元的性質(zhì);(ii)修飾PKS編碼序列以改變模塊的數(shù)量,優(yōu)選減少模塊的數(shù)量;(iii)修飾PKS編碼序列以修飾AT結(jié)構(gòu)域,從而改變其對延伸單元的特異性;(iv)修飾PKS編碼序列以改變脫水酶(DH)或酮還原酶(KR)結(jié)構(gòu)域的活性,優(yōu)選使 DH或KR結(jié)構(gòu)域失活或缺失;(ν)修飾羥化酶編碼序列(becO ; SEQ ID No.26)以使所述羥化酶失活或改變其特異性;(vi)使PKS編碼序列缺失或修飾PKS編碼序列以使所編碼的PKS酶失活;(vii)導(dǎo)入編碼糖基化酶的核苷酸序列。
12.如權(quán)利要求11所述的方法,其中所述核苷酸分子的修飾包括以下一種或多種(i)使表3中所示的DH結(jié)構(gòu)域編碼核苷酸序列缺失或失活;(ii)使表4中所示的KR結(jié)構(gòu)域編碼核苷酸序列缺失或失活;(iii)使becA(SEQIDNo.5)或其模塊缺失或失活;(iv)使編碼表2中所示的核苷酸位置所定義的模塊BecB、BecD,BecE, BecF或 BecG的一種或多種核苷酸序列缺失或失活;(ν)使 becO (SEQ ID No.26)缺失或失活。
13.如權(quán)利要求8 12中任一項(xiàng)所述的方法,其中所述核酸分子內(nèi)源性存在于產(chǎn)生 BE-14106或其衍生物的微生物中,并且所述方法在所述微生物中進(jìn)行。
14.如權(quán)利要求13所述的方法,其中所述微生物是2008年1月25日以保藏號(hào) DSM21069保藏在DSMZ的鏈霉菌(Streptomyces sp),或其產(chǎn)生BE-14106或其衍生物的 突變菌株或經(jīng)修飾菌株。
15.制備經(jīng)修飾BE-14016NRPS-PKS系統(tǒng)的方法,所述方法包括在微生物中表達(dá)根 據(jù)權(quán)利要求8 14中任一項(xiàng)獲得的經(jīng)修飾核酸分子。
16.制備聚酮化合物類分子或巨內(nèi)酰胺分子的方法,所述方法包括在微生物中表達(dá)根 據(jù)權(quán)利要求8 14中任一項(xiàng)獲得的經(jīng)修飾核酸分子。
17.如權(quán)利要求16所述的方法,所述方法還包括回收所述聚酮化合物類分子或巨內(nèi)酰 胺分子。
18.—種微生物,所述微生物含有根據(jù)權(quán)利要求8 14中任一項(xiàng)獲得的經(jīng)修飾核酸分子。
19.一種以保藏號(hào)DSM21069保藏在DSMZ的鏈霉菌屬(Streptomyces)菌株或其突變 菌株或經(jīng)修飾菌株,所述菌株或其突變菌株或經(jīng)修飾菌株產(chǎn)生BE-14106或其衍生物。
20.通過權(quán)利要求16所述方法產(chǎn)生或能夠獲得的BE-14106類似物,但不包括 BE-14106的8-脫氧類似物。
21.—種BE-14106類似物,所述BE-14106類似物包含選自下組的任何一個(gè)或多個(gè)的 修飾,所述組包括3_、5_、7_、11-、13-、15-、17-或 23-羥基 BE-14106,3_、5_、 7_,9_、11-、13-、15-、17-或23-氧代BE-14106或其組合;或包含8-脫氧基團(tuán)與選自在3、5、7、11、13、15、17或23位導(dǎo)入羥基或氧基或在9位導(dǎo)入氧基的一種或多種 修飾 的組合的類似物。
全文摘要
本發(fā)明提供一種核酸分子,所述核酸分子包含(a)SEQ ID No.1所示的核苷酸序列;或(b)與SEQ ID No.1互補(bǔ)的核苷酸序列;或(c)與SEQID No.1簡并的核苷酸序列;或(d)與SEQ ID No.1具有至少85%序列同一性(優(yōu)選具有至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性)的核苷酸序列;或(e)(a)~(d)中任一個(gè)的一部分,其中所述核酸分子編碼一種或多種多肽,或與編碼一種或多種多肽的核酸分子互補(bǔ),或包含在聚酮化合物類分子或巨內(nèi)酰胺分子的合成中具有活性的一種或多種遺傳元件,或與包含在聚酮化合物類分子或巨內(nèi)酰胺分子的合成中具有活性的一種或多種遺傳元件的核酸分子互補(bǔ)。特別是,本發(fā)明涉及編碼用于合成聚酮化合物巨內(nèi)酰胺BE-14106的生物合成機(jī)構(gòu)的本發(fā)明核酸分子的修飾,包括在微生物中表達(dá)經(jīng)修飾的核酸分子。在某些方面所述修飾包括對編碼一種或多種由所述核酸分子編碼的活性或蛋白質(zhì)的序列進(jìn)行導(dǎo)入、突變、缺失、替換或失活。本發(fā)明的其它方面包括含有經(jīng)修飾和未經(jīng)修飾核酸的微生物,以及從所述微生物回收所述聚酮化合物類分子或巨內(nèi)酰胺分子。
文檔編號(hào)C07G11/00GK102015756SQ200980113971
公開日2011年4月13日 申請日期2009年3月20日 優(yōu)先權(quán)日2008年3月20日
發(fā)明者佩爾·布魯海姆, 克里斯廷·弗勒格斯塔·德格涅斯, 吉爾·科林貝爾, 埃斯彭·夫加爾威克, 漢恩內(nèi)·約爾根森, 特龍德·厄爾靈·埃林森, 謝爾蓋·佐特切夫, 阿瓦爾·斯列塔 申請人:辛文特公司