專利名稱:用于改良宿主細(xì)胞內(nèi)蛋白質(zhì)生產(chǎn)的信號(hào)序列和共表達(dá)的分子伴侶的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供了改良蛋白質(zhì)生產(chǎn)的方法和組合物。在一些實(shí)施方案中,本文提供的 方法涉及與蛋白質(zhì)有效連接的信號(hào)序列的用途。在一些實(shí)施方案中,與蛋白質(zhì)有效連接的 信號(hào)序列在宿主細(xì)胞中與至少一種分子伴侶組合表達(dá)。在一些實(shí)施方案中,蛋白質(zhì)在絲狀 真菌細(xì)胞中表達(dá)。在其他實(shí)施方案中,本發(fā)明的方法涉及蛋白質(zhì)與酶的催化結(jié)構(gòu)域的融合, 所述酶例如葡糖淀粉酶或CBHl。一些實(shí)施方案提供了信號(hào)序列、一個(gè)或多個(gè)分子伴侶、陪伴 蛋白和/或折疊酶的組合,和/或蛋白質(zhì)與催化蛋白質(zhì)或結(jié)構(gòu)域的融合。
背景技術(shù):
宿主細(xì)胞例如酵母、絲狀真菌和細(xì)菌已長(zhǎng)期用于表達(dá)盒分泌外源蛋白質(zhì)。通常,這 些外源或蛋白質(zhì)在酵母、絲狀真菌和細(xì)菌中的生產(chǎn),涉及表達(dá)蛋白質(zhì)以及從宿主細(xì)胞或生 長(zhǎng)細(xì)胞的培養(yǎng)基中部分或完全純化蛋白質(zhì)。盡管一些蛋白質(zhì)需要從宿主細(xì)胞的胞內(nèi)環(huán)境中 純化,如果蛋白質(zhì)從細(xì)胞分泌到培養(yǎng)基中,則可以極大的簡(jiǎn)化純化。胞外蛋白質(zhì)分泌是復(fù)雜的,也是多種細(xì)胞表達(dá)系統(tǒng)中蛋白質(zhì)生產(chǎn)的重要方面。與 蛋白質(zhì)分泌相關(guān)的一個(gè)因素是正確的蛋白質(zhì)折疊。在體外稀釋濃度下,許多蛋白質(zhì)可以可 逆的解折疊和再折疊,因?yàn)橹付ňo密折疊結(jié)構(gòu)所需要的全部信息都存在于蛋白質(zhì)的氨基酸 序列中。然而,體內(nèi)的蛋白質(zhì)折疊發(fā)生在濃縮的大量蛋白質(zhì)的環(huán)境下,其中分子內(nèi)的折疊過(guò) 程與分子間的聚集反應(yīng)相互競(jìng)爭(zhēng)。這些復(fù)雜因素在真核表達(dá)系統(tǒng)中比在原核系統(tǒng)中更顯著.真核分泌通路的第一步是新生多肽以伸展的形式跨內(nèi)質(zhì)網(wǎng)(ER)膜的易位。多肽 的正確折疊和裝配通過(guò)分泌通路發(fā)生在ER中。然而,在多種情況下,雖然蛋白質(zhì)大量過(guò)表 達(dá),但卻分泌不佳。實(shí)際上,在多種情況下,應(yīng)該有利于此類表達(dá)的分泌信號(hào)沒(méi)有表現(xiàn)出實(shí) 現(xiàn)所述功能。與其他蛋白質(zhì)的相互作用使所需蛋白質(zhì)的表達(dá)更加復(fù)雜化。當(dāng)在一個(gè)物種、屬 或科中嘗試表達(dá)從另一物種、屬或科的生物中獲得的蛋白質(zhì)時(shí),上述因素甚至更加重要。例 如,擔(dān)子菌(Basidiomycete)蛋白質(zhì)(例如,漆酶)通常在子囊菌(Ascomycete)宿主(例 如,木霉屬(Trichoderma))中表達(dá)低下。實(shí)際上,盡管在真菌表達(dá)系統(tǒng)領(lǐng)域開展了大量工 作,但仍然需要改良所需蛋白質(zhì)的胞外表達(dá)。發(fā)明概述發(fā)明提供了改良蛋白質(zhì)生產(chǎn)的方法和組合物。方法涉及使用與所需蛋白質(zhì)有效連 接的信號(hào)序列,所述蛋白質(zhì)在宿主細(xì)胞中與至少一種分子伴侶組合表達(dá)。在一些實(shí)施方案 中,在絲狀真菌細(xì)胞中表達(dá)蛋白質(zhì)。在其他實(shí)施方案中,本發(fā)明的方法涉及所需蛋白質(zhì)與宿 主蛋白質(zhì),例如葡糖淀粉酶或CBHl催化結(jié)構(gòu)域的融合。在一些實(shí)施方案中,本發(fā)明提供了增加絲狀真菌宿主(例如,子囊菌)中的蛋白質(zhì) 生產(chǎn)的方法和組合物,通過(guò)組合分泌信號(hào)的應(yīng)用和分子伴侶蛋白的表達(dá),所述分子伴侶蛋 白是從與蛋白質(zhì)相同的生物體中獲得的。在一些實(shí)施方案中,蛋白質(zhì)是非子囊菌蛋白質(zhì),其 與來(lái)自子囊菌宿主蛋白質(zhì)的分泌信號(hào)融合。在其他一些實(shí)施方案中,至少一種分子伴侶蛋白可用于增加與子囊菌蛋白質(zhì)的催化結(jié)構(gòu)域融合的蛋白質(zhì)的表達(dá)。一些實(shí)施方案提供了用于在子囊菌宿主細(xì)胞中生產(chǎn)至少一種蛋白質(zhì)的方法,通過(guò) 向宿主細(xì)胞引入多核苷酸,所述多核苷酸包括與來(lái)自和宿主相同的門、屬和/或物種的信 號(hào)序列有效連接的所需蛋白質(zhì);共表達(dá)來(lái)自與蛋白質(zhì)相同的門、屬和/或物種的分子伴侶; 在適合蛋白質(zhì)表達(dá)和生產(chǎn)的培養(yǎng)條件下培養(yǎng)宿主細(xì)胞;并生產(chǎn)蛋白質(zhì)。方法任選的包括回 收所產(chǎn)生的蛋白質(zhì)。一些實(shí)施方案包括將蛋白質(zhì)與來(lái)自子囊菌的酶的催化結(jié)構(gòu)域融合。其 它實(shí)施方案包括將蛋白質(zhì)與來(lái)自子囊菌的全長(zhǎng)的酶融合。在一些實(shí)施方案中,子囊菌宿主 細(xì)胞是木霉屬。在一些實(shí)施方案中,分子伴侶是下列中的至少一種BIP1、ER01、PDI1、TIG1、 PRPl、PPIl、PPI2、PRP3、PRP4、鈣聯(lián)接蛋白和 LHSl。蛋白質(zhì)的選擇不限于,并可以包括來(lái)自任何屬、物種和/或科的任何下列蛋白質(zhì) 漆酶、葡糖淀粉酶、α淀粉酶、顆粒淀粉水解酶、纖維素酶、脂肪酶、木聚糖酶、角質(zhì)酶、半纖 維素酶、蛋白酶、氧化酶、漆酶及其組合。一些實(shí)施方案包括來(lái)自NSP24或CBHl基因的信號(hào) 序列。在一些實(shí)施方案中,分子伴侶基因是bipl。方法的實(shí)施方案還可以包括子囊菌啟動(dòng) 子。在一些實(shí)施方案中,宿主細(xì)胞和信號(hào)序列來(lái)自相同的子囊菌宿主。在一些實(shí)施方案中, 啟動(dòng)子是來(lái)自木霉屬的CBHl啟動(dòng)子。在一些實(shí)施方案中,蛋白質(zhì)是擔(dān)子菌蛋白質(zhì)。在一些 實(shí)施方案中,宿主細(xì)胞是子囊菌宿主細(xì)胞。在一些實(shí)施方案中,宿主細(xì)胞是擔(dān)子菌宿主細(xì)胞 且蛋白質(zhì)是子囊菌蛋白質(zhì)。其它一些實(shí)施方案提供了用于在子囊菌宿主細(xì)胞中生產(chǎn)至少一種蛋白質(zhì)的方法, 通過(guò)向子囊菌宿主細(xì)胞引入多核苷酸,所述多核苷酸包括與來(lái)自子囊菌的酶的催化結(jié)構(gòu)域 融合的所需蛋白質(zhì),其中所需蛋白質(zhì)是擔(dān)子菌蛋白質(zhì);共表達(dá)子囊菌的分子伴侶;在適合 蛋白質(zhì)表達(dá)和生產(chǎn)的培養(yǎng)條件下培養(yǎng)子囊菌宿主細(xì)胞;并生產(chǎn)蛋白質(zhì)。在一些實(shí)施方案中, 回收所產(chǎn)生的蛋白質(zhì)。在一些實(shí)施方案中,蛋白質(zhì)與子囊菌信號(hào)序列有效的連接。
附圖簡(jiǎn)介
圖1顯示了木霉屬表達(dá)質(zhì)粒pTrex4-漆酶D opt的示意圖。多核苷酸序列顯示為 SEQ ID NO 1。圖2顯示了木霉屬表達(dá)質(zhì)粒pTreX2g-Bipl的示意圖。多核苷酸序列顯示為SEQ ID NO :2。圖3顯示了木霉屬表達(dá)質(zhì)粒pTrex2g-Pdil的示意圖。多核苷酸序列顯示為SEQ ID NO :3。圖4顯示了在木霉屬表達(dá)質(zhì)粒pTreX2g-Erol中使用的Erol序列的示意圖。多核 苷酸序列顯示為SEQ ID NO :4ο圖5顯示了木霉屬表達(dá)質(zhì)粒pTrGA-漆酶D opt的示意圖。多核苷酸序列顯示為 SEQ ID NO :5。圖6顯示了木霉屬表達(dá)質(zhì)粒PKB408的示意圖。多核苷酸序列顯示為SEQ ID NO 6。圖7顯示了木霉屬表達(dá)質(zhì)粒PKB410的示意圖。多核苷酸序列顯示為SEQ ID NO 7。圖8-1至8-4顯示了里氏木霉NSP24可讀框(ORF)SEQ ID NO :8。信號(hào)肽是前20個(gè)氨基酸(SEQ ID NO 9)。圖9-1至9-2顯示了里氏木霉CBHl ORF (SEQ ID N0:10)。信號(hào)肽開始于堿基對(duì) 210,結(jié)束于堿基對(duì)260 (SEQ ID NO :11)。催化核心開始于堿基對(duì)261至堿基對(duì)1698 (SEQ ID NO: 12),包括內(nèi)含子1(從堿基對(duì)671至737)和內(nèi)含子2 (從堿基對(duì)1435至1497)。接 頭序列始于堿基對(duì)1699,止于堿基對(duì)1770 (SEQ ID N0:13)。CBHl蛋白質(zhì)序列顯示為SEQID NO :14。圖10示例了漆酶產(chǎn)量的改善,通過(guò)融合單色下皮黑孔菌(c. unicolor)漆酶的編 碼基因和全長(zhǎng)木霉屬葡糖淀粉酶。菌株#8-2是CBHl漆酶融合體。菌株1066-9、1066-13 和1066-15是TrGA漆酶融合體。圖11示例了在搖瓶中漆酶產(chǎn)量的改善,通過(guò)融合單色下皮黑孔菌(C. unicolor) 漆酶的編碼基因和CBHl或NSP24信號(hào)序列。Y軸以單位/ml顯示了漆酶活性。X軸顯示了 菌株(僅CBH融合體,或具有信號(hào)序列)。圖12示例了在發(fā)酵罐中漆酶產(chǎn)量的改善,通過(guò)融合單色下皮黑孔菌漆酶的編碼 基因和CBHl或NSP24信號(hào)序列。Y軸以單位/ml顯示了漆酶活性。X軸以小時(shí)顯示了發(fā)酵 時(shí)間。圖13示例了由CBHl信號(hào)序列加BIPl分子伴侶表達(dá),所提供的漆酶產(chǎn)量的改善。 Y軸以單位/ml顯示了漆酶活性。X軸以小時(shí)顯示了發(fā)酵時(shí)間。圖14示例了通過(guò)在搖瓶中共表達(dá)分子伴侶和單色下皮黑孔菌,在3、4和5天對(duì)漆 酶產(chǎn)量的改善。Y軸以單位/ml顯示了漆酶活性。X軸顯示了菌株(KB410-13,或與bip共 表達(dá))。圖15示例了漆酶產(chǎn)量的改善,通過(guò)融合單色下皮黑孔菌漆酶的編碼基因和CBHl 信號(hào)序列、催化結(jié)構(gòu)域和接頭,以及與Bipl、pdil或erol分子伴侶共表達(dá)。Y軸以單位/ml 顯示了漆酶活性。X軸顯示了菌株。發(fā)明詳述除非另外指出,本發(fā)明的實(shí)踐涉及在分子生物學(xué)、蛋白質(zhì)工程、重組DNA技術(shù)、微 生物學(xué)、細(xì)胞生物學(xué)、細(xì)胞培養(yǎng)、轉(zhuǎn)基因生物學(xué)、免疫學(xué)和蛋白質(zhì)純化中普遍使用的常規(guī)技 術(shù),屬于本領(lǐng)域技術(shù)人員掌握的范圍。此類技術(shù)是本領(lǐng)域技術(shù)人員已知的,在多種文本和參 考文獻(xiàn)中都有描述。本文上下文中提及的所有專利、專利申請(qǐng)、文章和出版物,都通過(guò)引用 清楚地整合到本文中。^X術(shù)語(yǔ)“子囊菌”指一類屬于子囊菌門(Ascomycota)的真菌。該門的成員的特征是 存在子囊(即,含有子囊孢子的特化的囊樣細(xì)胞)。術(shù)語(yǔ)“擔(dān)子菌”指一類屬于擔(dān)子菌門的真菌。該門的成員的特征是產(chǎn)生擔(dān)孢子 (即,位于特化的棒狀末端細(xì)胞外部區(qū)域的有性孢子,所述特化細(xì)胞稱為擔(dān)子)?!暗鞍酌浮币庵妇哂性诘鞍踪|(zhì)骨架的一個(gè)或多個(gè)不同位置,催化肽鍵切割的能力的 蛋白質(zhì)或多肽的蛋白質(zhì)或多肽結(jié)構(gòu)域(例如,E.C.3.4)??梢詮奈⑸?例如,真菌或細(xì) 菌)、植物和/或動(dòng)物中獲得蛋白酶。“酸性蛋白酶”指具有在酸性條件下水解蛋白質(zhì)的能力的蛋白酶。如本文中使用的,術(shù)語(yǔ)“分子伴侶”或“分子伴侶蛋白”通過(guò)保護(hù)未折疊區(qū)域免受周圍蛋白質(zhì)(干擾),而有利于蛋白質(zhì)折疊,但不增加蛋白質(zhì)折疊的速率。這可以包括幫助分 泌蛋白在內(nèi)質(zhì)網(wǎng)(ER)中折疊和糖基化的蛋白質(zhì)及其同源物。分子伴侶可以定位在ER中。 示例性分子伴侶包括Bip (GRP78)、GRP94和酵母Lhslp,以及通過(guò)與未折疊狀態(tài)下暴露的疏 水區(qū)域結(jié)合,防止不理想的相互作用,而幫助分泌蛋白折疊的蛋白質(zhì)。分子伴侶還包括涉及 蛋白質(zhì)跨ER膜易位的蛋白質(zhì)。如本文中使用的,“陪伴蛋白”是利用ATP,幫助蛋白質(zhì)折疊為天然狀態(tài)(活性狀 態(tài))的 蛋白質(zhì)。通常,蛋白質(zhì)亞基裝配在一起形成大環(huán)裝配體(assemby)。例如,陪伴蛋白 發(fā)揮作用是通過(guò)在中央腔中與非天然蛋白質(zhì)結(jié)合,然后基于結(jié)合ATP,釋放底物蛋白質(zhì)到目 前包封的腔,而有效折疊?!罢郫B酶蛋白質(zhì)”意指催化蛋白質(zhì)折疊中的步驟,而增加蛋白質(zhì)折疊速率的蛋白 質(zhì)。例如,它們可以幫助形成二硫鍵,以及幫助與脯氨酸殘基相鄰的肽鏈形成正確的構(gòu)象。 示例性的折疊酶包括蛋白質(zhì)二硫鍵異構(gòu)酶(Pdi)及其同源物,和脯氨酰-肽基順?lè)串悩?gòu)酶 及其同源物。如本文中使用的,“NSP24家族蛋白酶,,意指在其天然的或野生型類型具有蛋白酶 活性的酶,并屬于NSP24蛋白酶的家族。NSP24蛋白酶是酸性蛋白酶,例如酸性真菌蛋白 酶。NSP24蛋白酶具有與SEQ ID NO 8的氨基酸序列及其生物學(xué)活性片段,至少85%、至少 90%、至少93%、至少95%、至少96%、至少97%、至少98%和至少99%的序列同一性。如本文中使用的,術(shù)語(yǔ)“所需的蛋白質(zhì)”意指目標(biāo)蛋白質(zhì)。在本申請(qǐng)中,所需的蛋白 質(zhì)和目標(biāo)蛋白質(zhì)是可互換的使用的。在一些實(shí)施方案中,所需的蛋白質(zhì)是可商購(gòu)的重要工 業(yè)蛋白。術(shù)語(yǔ)意在涵蓋由天然存在的基因、突變基因和/或合成的基因編碼的蛋白質(zhì)。所 需的蛋白質(zhì)可以是宿主細(xì)胞天然的蛋白質(zhì),或者對(duì)宿主細(xì)胞非天然的(異源的)蛋白質(zhì)。如本文中使用的,“衍生物”意指源自前體或親本蛋白質(zhì)(例如,天然蛋白質(zhì))的蛋 白質(zhì),通過(guò)在C-和/或N-末端添加一個(gè)或多個(gè)氨基酸,在氨基酸序列的一個(gè)或多個(gè)不同位 點(diǎn)取代一個(gè)或多個(gè)氨基酸,在蛋白質(zhì)的一端或兩端或者在氨基酸序列的一個(gè)或多個(gè)位點(diǎn)缺 失一個(gè)或多個(gè)氨基酸,或者在氨基酸序列的一個(gè)或多個(gè)位點(diǎn)插入一個(gè)或多個(gè)氨基酸。術(shù)語(yǔ)“重組”指不天然存在于宿主細(xì)胞中的多核苷酸或多肽。重組分子可以包括 以不天然存在的方式相互連接的兩條或多條天然存在的序列。 術(shù)語(yǔ)“肽”、“蛋白質(zhì)”和“多肽”在本文中可互換的使用的。如本文中使用的,“百分比(% )序列同一性”在涉及氨基酸或核苷酸序列時(shí),定義 為在比對(duì)序列并且如果需要,為了獲得最大百分比序列同一性而引入空位后,候選序列中 與目標(biāo)序列(例如,NSP24信號(hào)肽序列)中的氨基酸殘基或核苷酸相同的氨基酸殘基或核 苷酸的百分比,且不考慮任何保守性取代作為序列同一性的一部分。如本文中使用的,術(shù)語(yǔ)“α淀粉酶(例如,E.C.3.2. 1. 1類)”指催化α_1,4_糖 苷鍵水解的酶。這類酶也被描述為影響含有1,4_α連接的D-葡萄糖單位的多糖中的1, 4_ α-D-糖苷鍵外切或內(nèi)切水解的酶。用于描述這類酶的另一個(gè)術(shù)語(yǔ)是“糖原酶”。示例性 的酶包括α -1,4-葡聚糖4-葡聚糖水化酶葡聚糖水解酶。如本文中使用的,術(shù)語(yǔ)“葡糖淀粉酶”指淀粉葡糖苷酶類的酶(例如,EC. 3. 2. 1. 3、 葡糖淀粉酶、1,4-a -D-葡聚糖葡糖水解酶)。這些是外切作用的酶,從直鏈淀粉和支鏈淀 粉分子的非還原端釋放葡糖基殘基。酶還水解α-1,6_和α-1,3-鍵,盡管以遠(yuǎn)低于水解α-1,4-鍵的速率。
術(shù)語(yǔ)“啟動(dòng)子”意指涉及結(jié)合RNA聚合酶,起始基因轉(zhuǎn)錄的調(diào)控序列。如本文中使用的,“異源啟動(dòng)子”指這樣的啟動(dòng)子,其與基因或純化的核酸處于相 關(guān)聯(lián),但與所述基因或純化的核酸不是天然相關(guān)的。如本文中使用的,多肽的“純化制品,,和“基本純的制品,,意指已經(jīng)與其天然存在 的細(xì)胞、其它蛋白質(zhì)、脂類或核酸分離的多肽。如本文中使用的,“同源”指兩個(gè)或多個(gè)多肽分子之間,或兩個(gè)或多個(gè)核酸分子之 間的序列相似性。當(dāng)比較的序列位置被相同的堿基或氨基酸單體亞基占據(jù)(例如,如果兩 條DNA分子中每一條的位置都被腺嘌呤占據(jù)),則分子在該位置是同源的。兩條序列之間的 百分比同源性是兩條序列共享的匹配或同源位置數(shù)除以位置數(shù)再乘以100的函數(shù)。例如, 如果兩條序列中的10個(gè)位置有6個(gè)是匹配或同源的,則兩條序列是60%同源。作為示例, DNA序列ATTGCC和TATGGC享有50%同源性。通常,當(dāng)兩條序列被比對(duì)以給出最大同源性時(shí) 進(jìn)行比較。在本文中,術(shù)語(yǔ)“ %同源性”與術(shù)語(yǔ)“ %同一性”可互換的使用的,指當(dāng)使用序列 比對(duì)程序進(jìn)行比對(duì)時(shí),在核酸序列或氨基酸序列之間的核酸或氨基酸序列同一性的水平。如本文中使用的,術(shù)語(yǔ)“載體”指設(shè)計(jì)用于將核酸引入一種或多種細(xì)胞類型中的多 核苷酸序列。載體包括克隆載體、表達(dá)載體、穿梭載體、質(zhì)粒、噬菌體顆粒、盒等。如本文中使用的,“表達(dá)載體”意指包括與合適的控制序列有效連接的DNA序列的 DNA構(gòu)建體,所述控制序列能夠影響DNA在合適宿主中的表達(dá)。術(shù)語(yǔ)“表達(dá)”意指基于基因的核酸序列生產(chǎn)多肽的過(guò)程。術(shù)語(yǔ)“共表達(dá)”意指在一個(gè)細(xì)胞內(nèi)表達(dá)至少2個(gè)不同的基因。其可以是外源基因 或內(nèi)源基因。其可以整合到相同或不同質(zhì)?;驈南嗤虿煌馁|(zhì)粒中表達(dá),并且可以從相 同或不同的啟動(dòng)子表達(dá)。如本文中使用的,“有效的連接的”意指調(diào)控區(qū)(例如,啟動(dòng)子、終止子、分泌信號(hào)或 增強(qiáng)子區(qū))與結(jié)構(gòu)基因是關(guān)聯(lián)的或連接的,并控制所述基因的表達(dá)。如果信號(hào)序列通過(guò)宿 主細(xì)胞的分泌系統(tǒng)指導(dǎo)蛋白質(zhì),則它與蛋白質(zhì)是有效連接的。如本文中使用的,“微生物”指細(xì)菌、真菌、病毒、原生動(dòng)物和其他微生物或微觀生 物體。術(shù)語(yǔ)“絲狀真菌”指本領(lǐng)域已知的真菌亞門(Eumycotina)的所有絲狀形態(tài)。這 類真菌的特征是營(yíng)養(yǎng)菌絲體,其具有細(xì)胞壁,所述細(xì)胞壁含有殼多糖、纖維素和其他復(fù)雜多 糖。本發(fā)明的絲狀真菌在形態(tài)學(xué)、生理學(xué)和遺傳學(xué)上與酵母不同。絲狀真菌通過(guò)菌絲延長(zhǎng) 進(jìn)行營(yíng)養(yǎng)生長(zhǎng),碳代謝是專性好氧的。如本文中使用的,術(shù)語(yǔ)“木霉屬(Trichoderma) ”和“木霉屬物種(Trichoderma sp.) ”指以前或現(xiàn)在分類為木霉屬的任何真菌屬。如本文中使用的,術(shù)語(yǔ)“培養(yǎng)”指在合適條件下,在液體、半固體或固體培養(yǎng)基中生 長(zhǎng)微生物細(xì)胞群體。在一些實(shí)施方案中,如本領(lǐng)域已知的,在容器或反應(yīng)器中進(jìn)行培養(yǎng)。在 一些實(shí)施方案中,培養(yǎng)導(dǎo)致淀粉底物(例如,包含顆粒淀粉的底物)發(fā)酵生物轉(zhuǎn)化為終產(chǎn) 物?!鞍l(fā)酵”指微生物對(duì)有機(jī)物質(zhì)的酶促和厭氧降解,產(chǎn)生更簡(jiǎn)單的有機(jī)化合物。發(fā)酵 通常在厭氧條件下發(fā)生,但該術(shù)語(yǔ)并非意在唯一限制為嚴(yán)格的厭氧條件,因?yàn)樵谘鯕獯嬖诘臈l件下也可以發(fā)生發(fā)酵。在將核酸序列插入到細(xì)胞內(nèi)的語(yǔ)境中,術(shù)語(yǔ)“引入”意指“轉(zhuǎn)染”、“轉(zhuǎn)化”或“轉(zhuǎn) 導(dǎo)”,包括指核酸序列向真核或原核細(xì)胞內(nèi)的摻入,其中,核酸序列或者摻入到細(xì)胞基因組 內(nèi)(例如,染色體、質(zhì)粒、質(zhì)體或線粒體DNA),轉(zhuǎn)變成自主復(fù)制子,或者瞬時(shí)的表達(dá)(例如,轉(zhuǎn) 染的mRNA)。如本文中使用的,術(shù)語(yǔ)“轉(zhuǎn)化的”、“穩(wěn)定轉(zhuǎn)化的”和“轉(zhuǎn)基因”用于指細(xì)胞時(shí),意指 細(xì)胞具有非天然的核酸序列,所述序列被整合到其基因組中,或者作為附加型質(zhì)粒在多代 中維持。 如本文中使用的,術(shù)語(yǔ)“異源的”用于指編碼所需蛋白質(zhì)的多肽或多核苷酸時(shí),意 指多肽或多核苷酸不是天然存在于宿主細(xì)胞內(nèi)的。術(shù)語(yǔ)“同源的”或“內(nèi)源的”在涉及編碼所需蛋白質(zhì)的多肽或多核苷酸時(shí),指多肽 或多核苷酸是天然存在于宿主細(xì)胞內(nèi)的,或由宿主細(xì)胞天然表達(dá)的。術(shù)語(yǔ)“過(guò)表達(dá)”意指在宿主細(xì)胞中以大于野生型宿主細(xì)胞所產(chǎn)生的水平表達(dá)多肽 的過(guò)程。在一些實(shí)施方案中,將至少一種多核苷酸引入宿主細(xì)胞。在其他一些實(shí)施方案中, 術(shù)語(yǔ)指同源多肽以這樣的濃度表達(dá),所述濃度大于野生型細(xì)胞表達(dá)的相同的同源多肽的表 達(dá)。如本文中使用的,發(fā)明的一個(gè)方面的特征是“基本純的”核酸,所述核酸包括編碼 與蛋白質(zhì)有效連接的NSP24信號(hào)肽或CBHl信號(hào)肽的核苷酸序列,和/或此類核酸的等價(jià) 體。在這些實(shí)施方案中,核酸分離自其它核酸和/或細(xì)胞成分。術(shù)語(yǔ)“等價(jià)體”指編碼功能性等價(jià)的多肽的核苷酸序列。等價(jià)的核苷酸序列涵蓋 了由于一個(gè)或多個(gè)核苷酸取代、添加和/或缺失而不同的序列,例如等位變體。例如,在一 些實(shí)施方案中,由于遺傳密碼的簡(jiǎn)并性,等價(jià)的核苷酸序列包括這樣的序列,所述序列不同 于核苷酸序列SEQ ID NO :8,但導(dǎo)致產(chǎn)生與SEQ ID NO :8編碼的多肽序列功能性等價(jià)的多 肽。本發(fā)明提供了生產(chǎn)所需蛋白質(zhì)的方法。方法包括步驟(a)將第一核酸序列引入 宿主細(xì)胞,所述第一核酸序列包括與所需的蛋白質(zhì)序列有效連接的信號(hào)序列;(b)表達(dá)第 一核酸序列;(c)共表達(dá)編碼分子伴侶或折疊酶的第二核酸序列,所述分子伴侶或折疊酶 選自 bipl、erol、pdil、tigl、prpl、ppil、ppi2、prp3、prp4、鈣聯(lián)接蛋白和 Ihsl ;和(d)收 集從宿主細(xì)胞分泌的所需蛋白質(zhì)。在一個(gè)實(shí)施方案中,第一核酸序列還包括在信號(hào)序列和所需的蛋白質(zhì)序列之間的 酶序列。例如,酶序列獲得自葡糖淀粉酶或CBHl酶。在一個(gè)實(shí)施方案中,酶序列是全長(zhǎng)的 酶序列,所述酶序列包括催化結(jié)構(gòu)域、接頭和結(jié)合結(jié)構(gòu)域。在另一個(gè)實(shí)施方案中,酶序列包 括催化結(jié)構(gòu)域序列,其通過(guò)接頭與所需的蛋白質(zhì)序列相連。在一些實(shí)施方案中,酶是在其天 然宿主中高表達(dá)和/或分泌的宿主蛋白質(zhì)。第一核酸序列還包括在信號(hào)序列上游的啟動(dòng)子。在一個(gè)實(shí)施方案中,啟動(dòng)子是宿 主細(xì)胞天然的,且與所需的蛋白質(zhì)序列不是天然相關(guān)的。第二核酸序列與啟動(dòng)子有效的連接。在一個(gè)實(shí)施方案中,啟動(dòng)子是宿主細(xì)胞天然 的,且與第二核酸序列不是天然相關(guān)的。增加的蛋白質(zhì)表達(dá)
本發(fā)明提供了用于在宿主細(xì)胞中生產(chǎn)所需蛋白質(zhì)的方法。通過(guò)包括分泌信號(hào)(例 如,NSP24信號(hào)肽或CBHl信號(hào)肽),并結(jié)合分子伴侶、陪伴蛋白和/或折疊酶蛋白的共表達(dá), 增加蛋白質(zhì)產(chǎn)量。在一些實(shí)施方案中,分泌信號(hào)來(lái)自子囊菌宿主蛋白質(zhì)。在一些實(shí)施方案 中,所需的蛋白質(zhì)與酶的催化結(jié)構(gòu)域融合。本發(fā)明提供了顯著的優(yōu)點(diǎn),特別是考慮到這樣的事實(shí),即,在子囊菌宿主中難以生 產(chǎn)大量來(lái)自其它真菌家族的蛋白質(zhì)。實(shí)際上,本領(lǐng)域技術(shù)人員已知,在真菌或細(xì)菌宿主中通 常難以生產(chǎn)任何異源的真菌蛋白質(zhì)。本發(fā)明提供了適合在合適的真菌或細(xì)菌宿主中,生產(chǎn) 任何合適蛋白質(zhì)的方法和組合物。在一些實(shí)施方案中,真菌宿主是子囊菌,蛋白質(zhì)是擔(dān)子菌 蛋白質(zhì),而在其它實(shí)施方案中,真菌宿主是擔(dān)子菌,而蛋白質(zhì)是子囊菌蛋白質(zhì)。在一些實(shí)施方案中,本發(fā)明提供了用于在宿主中增加蛋白質(zhì)表達(dá)和/或分泌的方 法,利用宿主信號(hào)肽與來(lái)自和蛋白質(zhì)來(lái)源的相同生物體的一種或多種伴侶分子或折疊酶的 共表達(dá)組合。因此,在一些實(shí)施方案中,利用擔(dān)子菌宿主信號(hào)肽和子囊菌分子伴侶,在擔(dān)子 菌宿主中表達(dá)異源的子囊菌蛋白質(zhì)。在一些備選的實(shí)施方案中,利用子囊菌信號(hào)肽和子囊 菌或擔(dān)子菌分子伴侶,在子囊菌宿主中表達(dá)異源的擔(dān)子菌蛋白質(zhì)。在一些實(shí)施方案中,子囊 菌宿主是木霉屬的成員。在一些實(shí)施方案中,木霉是里氏木霉,包括里氏木霉的多個(gè)菌株。 在一些備選的實(shí)施方案中,擔(dān)子菌是下皮黑孔屬(Cerrena)的成員,包括但不限于單色下 皮黑孔菌。在本發(fā)明的一些實(shí)施方案中,通過(guò)將蛋白質(zhì)與宿主酶融合,并與來(lái)自與所需蛋白 質(zhì)相同生物體的一種或多種分子伴侶外源共表達(dá)組合,來(lái)增加所需蛋白質(zhì)的表達(dá)和/或分 泌。通過(guò)同一質(zhì)粒,或通過(guò)不同的質(zhì)粒來(lái)實(shí)現(xiàn)共表達(dá)。在其他實(shí)施方案中,通過(guò)將蛋白質(zhì)與宿主酶的催化結(jié)構(gòu)域連接,并組合將蛋白質(zhì) 與宿主信號(hào)序列有效的連接,以及一種或多種分子伴侶、陪伴蛋白和/或折疊酶的外源共 表達(dá),來(lái)增加所需蛋白質(zhì)的表達(dá)和/或分泌,所述分子伴侶、陪伴蛋白和/或折疊酶優(yōu)選的 來(lái)自與蛋白質(zhì)相同的生物體??梢哉J(rèn)為,本文提供的多個(gè)實(shí)施方案中論及的元件可以以任何合適的組合使用。 因此,并非意在將實(shí)施方案限于本文提供的特定描述,因?yàn)楦鲗?shí)施方案的方面可以彼此組 合使用。信號(hào)肽本發(fā)明中使用的特定信號(hào)肽不是關(guān)鍵的,只要信號(hào)肽在宿主中是有效的。當(dāng)與蛋 白質(zhì)有效連接的信號(hào)肽增加了宿主細(xì)胞內(nèi)的蛋白質(zhì)分泌時(shí),就提供了 “有效的信號(hào)肽”。在 一些實(shí)施方案中,信號(hào)肽是從強(qiáng)分泌的蛋白質(zhì)中獲得的,和/或是強(qiáng)信號(hào)肽?!皬?qiáng)信號(hào)肽”導(dǎo) 致天然蛋白質(zhì)被其天然宿主強(qiáng)分泌。在一些實(shí)施方案中,信號(hào)肽獲得自與宿主細(xì)胞相同門 的生物體。實(shí)際上,在一些實(shí)施方案中,這是有利的。在一些實(shí)施方案中,信號(hào)肽和宿主細(xì)胞 來(lái)自相同的屬,而在其它一些實(shí)施方案中,信號(hào)肽和宿主細(xì)胞來(lái)自(相同的)物種。例如,在 一些實(shí)施方案中,宿主細(xì)胞是子囊菌宿主細(xì)胞,信號(hào)肽獲得自子囊菌。在一些實(shí)施方案中, 宿主細(xì)胞是木霉屬,信號(hào)肽來(lái)自木霉屬。在一些實(shí)施方案中,宿主細(xì)胞是里氏木霉,信號(hào)肽 來(lái)自里氏木霉。在一些實(shí)施方案中,信號(hào)肽是強(qiáng)信號(hào)肽。在一些可選的實(shí)施方案中,宿主細(xì) 胞是擔(dān)子菌宿主細(xì)胞,信號(hào)肽獲得自擔(dān)子菌??捎糜诒景l(fā)明的信號(hào)肽的一些實(shí)例包括但不 限于CBHl和NSP24信號(hào)肽。信號(hào)肽可以在例如子囊菌門的門的其它成員中發(fā)揮作用,但在一些實(shí)施方案中,當(dāng)信號(hào)肽在獲得它的屬中使用時(shí),具有最優(yōu)的用途(即,提供強(qiáng)分泌)。如本文中使用的,“強(qiáng)分泌蛋白”是形成從細(xì)胞中分泌顯著量的總蛋白的任何蛋白 質(zhì)。從細(xì)胞中分泌的總蛋白也稱為“胞外蛋白”。例如,強(qiáng)分泌的蛋白質(zhì)包括至少約2%的 胞外蛋白,至少約3 %,至少約4 %,至少約5 %,至少約6 %,至少約7 %,至少約8 %,至少約 9%,至少約10%,至少約15%,至少約20%,至少約30%,至少約40%,至少約50%,至少 約60 %,至少約70 %,至少約75 %,至少約80 %,至少約85 %,至少約90 %,至少約95 %,或 至少約99%。在一些實(shí)施方案中,強(qiáng)分泌蛋白包括在培養(yǎng)上清液中至少約5%的胞外蛋白 質(zhì)。CBHI信號(hào)肽、接頭和催化結(jié)構(gòu)域里氏木霉產(chǎn)生一些纖維素酶,包括纖維 二糖水解酶I (CBHI),其折疊成由延伸的 接頭區(qū)分隔的兩個(gè)分離的結(jié)構(gòu)域(即,催化和結(jié)合結(jié)構(gòu)域)。外源多肽已經(jīng)作為具有CBHI 的催化結(jié)構(gòu)域和接頭區(qū)的融合體在里氏木霉中分泌(參見(jiàn)例如,Nyyss0nen等人,Bio/ Technol. 11 :591_595 [1993])。長(zhǎng)枝木霉(T. Iongibrachiatem)也生產(chǎn) CBHI,可用于融合體 以及分離信號(hào)肽和/或接頭。接頭可用于連接酶的催化結(jié)構(gòu)域和所需多肽。任何合適的接 頭都可用于本發(fā)明,只要它在獨(dú)立折疊的結(jié)構(gòu)域之間形成延伸的、半剛性的間隔區(qū)。在一些 蛋白質(zhì)中發(fā)現(xiàn)了此類接頭區(qū)域,特別是在水解酶中(例如,細(xì)菌和真菌纖維素酶和半纖維 素酶;參見(jiàn)例如,Libby 等人,ProteinEngineering,Design and Selection (1994)第 7 卷, 1109-1114)。如圖9所示,對(duì)于CBHI (SEQ ID NO 10),信號(hào)序列始于堿基對(duì)210,止于堿基對(duì) 260 (SEQ ID NO 11)。催化核心始于堿基對(duì)261至堿基對(duì)1698 (SEQ ID N0:12),包括內(nèi)含子 1 (從堿基對(duì)671至737)和內(nèi)含子2 (從堿基對(duì)1435至1497)。接頭序列始于堿基對(duì)1699, 止于堿基對(duì)1770(SEQID N0:13)。纖維素結(jié)合結(jié)構(gòu)域始于堿基對(duì)1771至堿基對(duì)1878???以通過(guò)expasy組織網(wǎng)址發(fā)現(xiàn)關(guān)于CBHI的序列和結(jié)構(gòu)域信息,命名為imiprot/P62694。已 經(jīng)在多個(gè)其他木霉屬物種和其他絲狀真菌中鑒別了 CBHI同源物,合適時(shí)可用于本發(fā)明。NSP24信號(hào)肽和多核苷酸NSP24基因是從里氏木霉中分離并測(cè)序的(參見(jiàn)例如,美國(guó)專利號(hào)7,429,476,其 通過(guò)引用全文整合到本文中)。該基因測(cè)序鑒別了編碼407個(gè)氨基酸可讀框(SEQ ID NO 8)的序列,如圖8所示。鑒別SEQ ID NO 8的前20個(gè)氨基酸(MQTFGAFLVSFLAASGLAAA ;SEQ ID NO 9)是信號(hào)肽。已經(jīng)在多個(gè)其他木霉屬物種和其他絲狀真菌中鑒別了 NSP24同源物, 合適時(shí)可用于本發(fā)明。在一些實(shí)施方案中,NSP24信號(hào)序列用于子囊菌生物體。在一些實(shí) 施方案中,序列用于木霉屬物種,在一些甚至更特別的實(shí)施方案中,用于里氏木霉。因此,本發(fā)明提供了可用于分泌蛋白質(zhì)的NSP24家族蛋白酶信號(hào)肽。在一些實(shí)施 方案中,NSP24信號(hào)肽命名為“NSP24天冬氨酸蛋白酶信號(hào)肽”。發(fā)明的多核苷酸本發(fā)明提供了多種多核苷酸,包括但不限于編碼所需蛋白質(zhì)、信號(hào)肽、催化結(jié)構(gòu) 域、接頭、分子伴侶、陪伴蛋白和折疊酶的多核苷酸。在一些實(shí)施方案中,多核苷酸包括至少 兩種上述分子。在其他實(shí)施方案中,本發(fā)明的多核苷酸包括至少三種上述分子。在一些實(shí)施方案中,多核苷酸編碼蛋白質(zhì),所述蛋白質(zhì)包括至少一個(gè)氨基酸取代, 例如使用L-氨基酸的“保守氨基酸取代”,其中,一個(gè)氨基酸被另一種生物學(xué)相似的氨基酸取代了。保守氨基酸取代是保留了被取代的氨基酸的一般電荷、疏水性/親水性,和/或空 間體積(steric bulk)的取代。保守取代的實(shí)例是下列組之間的取代Gly/Ala、Val/Ile/ Leu、Lys/Arg、Asn/Gln、Glu/Asp、Ser/Cys/Thr,和 Phe/Trp/Tyr。在一些實(shí)施方案中,“衍生 蛋白質(zhì)”可用于本發(fā)明。在一些這類實(shí)施方案中,衍生蛋白質(zhì)與“親本”蛋白質(zhì)序列相比,低 至約1至約10個(gè)氨基酸殘基不同,例如約6至約10個(gè),少至約5個(gè),少至約4個(gè),約3個(gè), 約2個(gè),或甚至1個(gè)氨基酸殘基不同。表1提供了本領(lǐng)域認(rèn)知的示例性保守氨基酸取代。在 其他實(shí)施方案中,取代涉及一個(gè)或多個(gè)非保守氨基酸取代、缺失或插入,其不消除信號(hào)肽活 性。 表1 保守氨基酸替換 在一些實(shí)施方案中,發(fā)明的多核苷酸是天然序列。在一些實(shí)施方案中,天然序列分 離自自然界,而在其它實(shí)施方案中,它們是通過(guò)重組或合成方式生產(chǎn)的。術(shù)語(yǔ)“天然序列”特 別涵蓋了天然存在的截短的或分泌的形態(tài)(例如,生物活性片段),以及天然序列的天然存 在的變體形態(tài)。由于遺傳密碼的簡(jiǎn)并性,特定氨基酸可以使用一個(gè)以上的密碼子來(lái)編碼。因此,在 一些實(shí)施方案中,不同的DNA序列用于編碼任意多肽,例如信號(hào)肽、蛋白質(zhì)、催化結(jié)構(gòu)域和/或分子伴侶。實(shí)際上,本發(fā)明意在涵蓋編碼相同多肽的不同多核苷酸序列。當(dāng)在合適的溫度和溶液離子強(qiáng)度條件下,單鏈形態(tài)的核酸可以與其它核酸退火 時(shí),則核酸與另一核酸序列是可雜交的。在低、中、高和非常高嚴(yán)格條件下用于雜交的雜交 和洗滌條件是本領(lǐng)域熟知的。通常,雜交涉及核苷酸探針和同源DNA序列,其通過(guò)互補(bǔ)多核 苷酸的廣泛的堿基配對(duì),形成穩(wěn)定的雙鏈雜交體。在一些實(shí)施方案中,在2X氯化鈉/檸檬酸 鈉(SSC),0· 5% SDS中,在約60°C (中等嚴(yán)格)、65°C (中等/高嚴(yán)格)、70°C (高嚴(yán)格)和 約75°C (非常高嚴(yán)格)下,洗滌具有探針和同源序列的濾膜(參見(jiàn)例如,Current Protocols in Molecular Biology, John Wiley &Sons,New York, 1989,6. 3. 1-6. 3. 6,通過(guò)引用整合到 本文中)。本發(fā)明涵蓋了等位變體、天然突變體、誘導(dǎo)突變體,由這樣的DNA編碼的蛋白質(zhì), 所述DNA在高或低嚴(yán)格條件下與編碼漆酶、NSP24信號(hào)序列、CBHI信號(hào)序列、催化結(jié)構(gòu)域、分 子伴侶、陪伴蛋白和折疊酶的核酸雜交。本發(fā)明的核酸和多肽包括由于公開序列的測(cè)序錯(cuò) 誤而與本文公開的序列不同的序列。"DNA序列的同源性”是通過(guò)兩條DNA序列之間相同的程度來(lái)確定的。通常使用計(jì) 算機(jī)程序來(lái)確定多肽序列和/或核苷酸序列的同源性或“百分比同一性”。實(shí)施序列比對(duì) 和確定序列同一性的方法是本領(lǐng)域技術(shù)人員熟知的,不需要過(guò)多實(shí)驗(yàn)就可以實(shí)施,并且可 以確定的獲得同一性值的計(jì)算。本領(lǐng)域技術(shù)人員可獲得且已知多種算法,用于比對(duì)序列和 確定序列同一性。使用這些算法的計(jì)算機(jī)程序也是本領(lǐng)域可獲得且已知的,包括但不限于 ALIGN 或 Megalign (DNASTAR)軟件,或 WU-BLAST-2、GAP、BESTFIT、BLAST、FASTA, TFASTA 禾口 CLUSTAL。本領(lǐng)域技術(shù)人員已知如何確定用于測(cè)量比對(duì)的合適參數(shù),包括在比較的序列全長(zhǎng) 獲得最大比對(duì)所需的算法??梢岳贸绦虼_定的缺省參數(shù)來(lái)確定序列同一性。在一些實(shí) 施方案中,通過(guò)MSPRCH程序(Oxford Molecular)執(zhí)行的Smith-Waterman同源性檢索算法 (Smith Waterman, Meth. Mol. Biol. ,70 173-187 [1997))來(lái)確定序列同一性,所述 MSPRCH 程序使用具有下列檢索參數(shù)的仿射空位檢索空位開發(fā)罰分為12,空位延伸罰分為1??梢?使用 Genetics Computer Group, Inc. (Madison,WI)的 GCG 序列分析軟件包的 GAP 程序進(jìn) 行成對(duì)的氨基酸比較,運(yùn)用bloSum62氨基酸取代矩陣,具有空位權(quán)重12和長(zhǎng)度權(quán)重2。關(guān) 于兩條氨基酸序列的最優(yōu)比對(duì),變體氨基酸序列的連續(xù)區(qū)段相對(duì)于參照氨基酸序列,可以 具有額外的氨基酸殘基或缺失的氨基酸殘基。用于與參照氨基酸序列比較的連續(xù)區(qū)段可以 包括至少約20個(gè)連續(xù)的氨基酸殘基,可以是約30個(gè)、約40個(gè)、約50個(gè)或更多個(gè)氨基酸殘 基。在一些實(shí)施方案中,通過(guò)設(shè)定空位罰分對(duì)與在衍生氨基酸序列中包括空位相關(guān)的增加 的序列同一性進(jìn)行校正。在一些實(shí)施方案中,本發(fā)明涵蓋的蛋白質(zhì)、信號(hào)肽、酶催化結(jié)構(gòu)域、分子伴侶、 陪伴蛋白和/或折疊酶是源自細(xì)菌或真菌,例如絲狀真菌。示例性絲狀真菌包括曲霉 屬物種(Aspergillus spp.)和木霉屬物種(Trichodermaspp.)。一種示例性的木霉屬 物種是里氏木霉。然而,在一些實(shí)施方案中,本發(fā)明提供的信號(hào)肽和/或編碼信號(hào)肽的 DNA是源自真菌的另一屬或物種,包括但不限于犁頭霉屬物種(Absidia spp);支頂孢 屬物禾中(Acremoniumspp);蘑燕屬物禾中(Agaricus spp) ; Anaeromyces spp;曲霉屬物禾中 (Aspergillus spp),包括但不限于棘孢曲霉(A. aculeatus)、泡盛曲霉(A. awamori)、黃
(A. flavus)(A. foetidus) > A. fumaricus>(A. fumigatus)、豐勾H ffi (A. nidulans)、黑曲霄(A. niger)、米曲霄(A. oryzae)、土曲霄(A. terreus)禾口雜色曲霄 (A. versicolor) ;Aeurobasidium spp ;下皮黑孑L屬物禾中(Cerrena spp) ;Cephalosporum spp ;頭孢屬物種(Cephalosporium);毛殼屬物種(Chaetomium spp);鬼傘屬物種 (Coprinus spp) ;Dactyllum spp ;指孢霉屬物種(Dactylium spp);鐮孢屬物種(Fusarium spp),包括 F. conglomerans、多隔鍵刀菌(F. decemcellulare)、爪卩圭鍵抱(F. javanicum)、 亞麻鐮孢(F. Iini)、尖鐮孢(F. oxysporum)和腐皮鐮孢(F. solani);粘帚霉屬物種 (Gliocladiumspp);腐質(zhì)霉屬物種(Humicola spp),包括特異腐質(zhì)霉(H. insolens)和 H. lanuginosa ;毛霉屬物種(Mucor spp);脈孢菌屬物種(Neurosporaspp),包括粗糙脈孢 菌(N. crassa)禾口好食脈抱霉(N. sitophila) ;Neocallimastix spp ;Orpinomyces spp ;青 β屬物禾中(Penicillium spp) ;Phanerochaete ;身寸脈菌屬物禾中(Phlebia spp) ;Piromyces spp ;根霉屬物種(Rhizopus spp);裂褶菌屬物種(Schizophyllum spp);葡萄穗霉屬物種 (Stachybotrys spp);栓菌屬物種(Trametes spp);木霉屬物種(Trichoderma spp),包 括里氏木霉(T.reesei)、(長(zhǎng)枝)里氏木霉(T. reesei (Iongibrachiatum))和綠色木霉 (T. viride);禾口接霄屬物種(Zygorhynchus spp)。
催化結(jié)構(gòu)域融合體將所需蛋白質(zhì)與酶融合通常能增加所需蛋白質(zhì)的表達(dá)和/或分泌。通常,在構(gòu)建 體中,酶序列位于所需蛋白質(zhì)序列的上游。例如,酶是從葡糖淀粉酶或從CBHl酶中獲得的。 在一個(gè)實(shí)施方案中,酶序列是全長(zhǎng)的酶序列,包括催化結(jié)構(gòu)域、接頭和結(jié)合結(jié)構(gòu)域。在另一 個(gè)實(shí)施方案中,酶序列包括催化結(jié)構(gòu)域序列,其通過(guò)接頭或部分接頭與所需蛋白質(zhì)序列連 接。在一些實(shí)施方案中,酶是在其天然宿主中高表達(dá)和/或分泌的宿主蛋白質(zhì)。例如,當(dāng)宿 主細(xì)胞是木霉屬宿主細(xì)胞時(shí),酶是來(lái)自木霉屬蛋白質(zhì)。然而,可以理解,多種絲狀真菌蛋白 可用于與蛋白質(zhì)融合,并可成功用于其它的絲狀真菌宿主。分子伴侶、陪伴蛋白和折疊酶可用于本發(fā)明包括的方法和多核苷酸中的特定分子伴侶、陪伴蛋白和折疊酶不是 關(guān)鍵的。此外,當(dāng)本文中描述分子伴侶、陪伴蛋白和折疊酶的用途時(shí),它們?cè)诜椒ㄖ惺强苫?換使用的。例如,當(dāng)描述方法使用分子伴侶時(shí),應(yīng)理解為折疊酶和/或陪伴蛋白也可以取代 所述分子伴侶或與其累加的使用。適合本發(fā)明的分子伴侶、陪伴蛋白和/或折疊酶是在宿 主細(xì)胞中有活性的,并且發(fā)揮了增加所需蛋白質(zhì)表達(dá)的作用的那些。在一些實(shí)施方案中,分子伴侶、陪伴蛋白和/或折疊酶來(lái)自與蛋白質(zhì)相同門的生 物體,也可以來(lái)自相同的屬,還可以來(lái)自相同的屬和物種。在一些實(shí)施方案中,分子伴侶、陪 伴蛋白和/或折疊酶來(lái)自擔(dān)子菌,蛋白質(zhì)是擔(dān)子菌蛋白質(zhì)。在一些實(shí)施方案中,分子伴侶、 陪伴蛋白和/或折疊酶是組合使用的。在一些實(shí)施方案中,可以使用具有與全長(zhǎng)分子伴侶、 陪伴蛋白和/或折疊酶基本相同功能的分子伴侶、陪伴蛋白和/或折疊酶的片段。示例性的 分子伴侶、陪伴蛋白和/或折疊酶包括在美國(guó)專利申請(qǐng)60/919,332和W02008/115596中公 開的,其通過(guò)引用全文整合到本文中。示例性的分子伴侶、陪伴蛋白和/或折疊酶包括但不 限于BIP1、CLXl、EROl、LHSl、PRP3、PRP4、PRPl、TIGl、PDI1、PPI1、PPI2、SCJl、ERV2、EDEM 和 SILl。表2提供了多種可用于本發(fā)明的分子伴侶、陪伴蛋白和/或折疊酶的序列。表2:分泌增強(qiáng)蛋白質(zhì)的示例性核酸和多肽序列 分子生物學(xué)一啟動(dòng)子和表達(dá)載體本發(fā)明利用了重組遺傳性領(lǐng)域的常規(guī)技術(shù),是本領(lǐng)域技術(shù)人員熟知的。在一些實(shí) 施方案中,本發(fā)明提供了包括基因啟動(dòng)子序列(例如,來(lái)自絲狀真菌)的異源基因,其通常 在轉(zhuǎn)化宿主細(xì)胞(例如,里氏木霉細(xì)胞)用于復(fù)制和/或表達(dá)前,克隆到中間載體中。這類 中間載體通常是原核載體(例如,質(zhì)?;虼┧筝d體)。通常,以任何合適的啟動(dòng)子實(shí)現(xiàn)所需蛋白質(zhì)的表達(dá)。在一個(gè)實(shí)施方案中,對(duì)宿主非 天然的啟動(dòng)子與編碼所需蛋白質(zhì)的多核苷酸有效的連接,所述蛋白質(zhì)對(duì)宿主是天然或非天 然的。在另一個(gè)實(shí)施方案中,對(duì)宿主天然的啟動(dòng)子與編碼所需蛋白質(zhì)的多核苷酸有效的連 接,所述蛋白質(zhì)對(duì)宿主是天然或非天然的。在一些實(shí)施方案中,以異源啟動(dòng)子表達(dá)所需蛋白 質(zhì),所述異源啟動(dòng)子與所需蛋白質(zhì)基因不是天然相關(guān)聯(lián)的。而在其他一些實(shí)施方案中,以組 成型或誘導(dǎo)性啟動(dòng)子表達(dá)所需蛋白質(zhì)。在一些實(shí)施方案中,在具有纖維素酶啟動(dòng)子(例如, cbhl啟動(dòng)子)的木霉屬表達(dá)系統(tǒng)中表達(dá)所需蛋白質(zhì)。如本文中使用的,術(shù)語(yǔ)“啟動(dòng)子”指發(fā)揮指導(dǎo)下游基因轉(zhuǎn)錄的功能的核酸序列。啟 動(dòng)子可以包括靠近轉(zhuǎn)錄起始位點(diǎn)附近的必需核酸序列,例如,在II型聚合酶啟動(dòng)子的情況下的TATA元件。啟動(dòng)子以及其它的轉(zhuǎn)錄和翻譯調(diào)控核酸序列,統(tǒng)稱為“調(diào)控序列”,控制基 因的表達(dá)。通常,調(diào)控序列包括但不限于啟動(dòng)子序列、核糖體結(jié)合位點(diǎn)、轉(zhuǎn)錄起始和終止序 列、翻譯起始和終止序列,以及增強(qiáng)子或激活子序列。調(diào)控序列通常適合宿主并被其識(shí)別, 所述宿主中表達(dá)下游基因。在一些實(shí)施方案中,使用的啟動(dòng)子來(lái)自與宿主細(xì)胞相同的門,在 其他實(shí)施方案中,啟動(dòng)子來(lái)自與宿主細(xì)胞相同的屬,在一些實(shí)施方案中,來(lái)自與宿主細(xì)胞相 同的屬和種?!敖M成型啟動(dòng)子”是在大部分環(huán)境和發(fā)育條件下有活性的啟動(dòng)子?!翱烧T導(dǎo)的”或 “可 抑制的啟動(dòng)子”是在環(huán)境或發(fā)育調(diào)控下有活性的啟動(dòng)子。在一些實(shí)施方案中,由于環(huán)境 因素的改變,啟動(dòng)子是可誘導(dǎo)的或可抑制的,如本領(lǐng)域已知的,所述因素包括但不限于碳、 氮或其他營(yíng)養(yǎng)的可利用性、溫度、PH、滲透性、重金屬的存在、抑制劑濃度、壓力,或前述的組 合。在其他一些實(shí)施方案中,啟動(dòng)子是可以被代謝因素誘導(dǎo)或抑制的,如本領(lǐng)域已知的,例 如一些碳源的水平、一些能量源的水平、一些分解代謝產(chǎn)物的水平,或前述的組合。合適的啟動(dòng)子的非限制性實(shí)例包括cbhl、cbh2、egll、egl2、egl3、egl4、egl5、xynl 和xyn2,產(chǎn)黃青霉(P. chrysogenum)的可抑制的酸性磷酸酶基因(phoA)啟動(dòng)子(參見(jiàn), Graessle 等人,Appl. Environ. Microbiol. ,63 :753_756 [1997]),葡萄糖抑制性 PCKl 啟動(dòng) 子(參見(jiàn),Leuker等人,Gene 192 :235_240 [1997]),麥芽糖誘導(dǎo)性、葡萄糖抑制性MRPl啟 動(dòng)子(參見(jiàn),Munro 等人,Mol. Microbiol.,391414-1426 [2001]),甲硫氨酸抑制性 MET3 啟 動(dòng)子(參見(jiàn),Liu 等人,Eukary. Cell 5 :638_649[2006]),pKi 啟動(dòng)子和 cpcl 啟動(dòng)子。在本發(fā)明的一些實(shí)施方案中,報(bào)告基因構(gòu)建體的啟動(dòng)子是溫度敏感型啟動(dòng)子。在 一些實(shí)施方案中,升高的溫度抑制溫度敏感型啟動(dòng)子的活性。在一些實(shí)施方案中,啟動(dòng)子是 分解代謝產(chǎn)物抑制性啟動(dòng)子。在一些實(shí)施方案中,滲透性的改變抑制啟動(dòng)子。在一些實(shí)施 方案中,啟動(dòng)子可以被培養(yǎng)基中存在的多糖、二糖或單糖水平誘導(dǎo)或抑制。可用于本發(fā)明的誘導(dǎo)型啟動(dòng)子的實(shí)例是里氏木霉的cbhl啟動(dòng)子,其核苷酸序列 以登錄號(hào)D86235儲(chǔ)存在GenBank中。其它示例性啟動(dòng)子包括在編碼纖維素酶的基因調(diào)控 中涉及的啟動(dòng)子,包括但不限于cbh2、egll、egl2、egl3、egl5、xynl和xyn2。在本發(fā)明的一些實(shí)施方案中,為了獲得克隆基因的高水平表達(dá),異源基因有利的 位于與天然存在的基因中距啟動(dòng)子大概相同距離的位置。然而,如本領(lǐng)域已知的,在不喪失 啟動(dòng)子功能的條件下,該距離可以進(jìn)行適應(yīng)的一些改變。在一些實(shí)施方案中,通過(guò)替換、取代、添加或消除一個(gè)或多個(gè)核苷酸所修飾的天然 啟動(dòng)子可用于本發(fā)明,只要所述修飾不改變啟動(dòng)子的功能。實(shí)際上,本發(fā)明意在涵蓋,但并 不限于啟動(dòng)子的此類改變。表達(dá)載體/構(gòu)建體通常含有轉(zhuǎn)錄單位或表達(dá)盒,所述轉(zhuǎn)錄單位或表達(dá)盒含有異源 序列表達(dá)所需的所有額外的元件。因此,典型的表達(dá)盒含有與異源核酸序列有效連接的啟 動(dòng)子,和轉(zhuǎn)錄物有效多聚腺苷酸化所需的信號(hào),核糖體結(jié)合位點(diǎn),以及翻譯終止。盒內(nèi)的其 它元件可以包括增強(qiáng)子,以及如果使用基因組DNA作為結(jié)構(gòu)基因,可以包括具有功能性剪 接供體和受體位點(diǎn)的內(nèi)含子、分泌前導(dǎo)肽、前導(dǎo)序列、接頭和切割位點(diǎn)。本發(fā)明的實(shí)踐不受遺傳構(gòu)建體中啟動(dòng)子的選擇限制。如上文指出的,示例性的啟 動(dòng)子是里氏木霉的cbhl、cbh2、egll、egl2、egl3、egl5、xlnl和xln2啟動(dòng)子??捎糜诒?發(fā)明的其它啟動(dòng)子包括來(lái)自泡盛曲霉和黑曲霉的葡糖淀粉酶基因(glaA)的那些(參見(jiàn),Nunberg等人,Mo 1. Cell Biol.,4 =2306-2315[1984])和來(lái)自構(gòu)巢曲霉乙酰胺酶的啟動(dòng)子。 用于枯草芽孢桿菌(Bacillus subtilis)載體的示例性啟動(dòng)子是AprE啟動(dòng)子;用于大腸桿 菌的示例性啟動(dòng)子是Lac啟動(dòng)子,在釀酒酵母(Saccharomyces cerevisiae)中使用的示例 性啟動(dòng)子是PGK1,在黑曲霉中使用的示例性啟動(dòng)子是glaA,且用于里氏木霉的示例性啟動(dòng) 子是cbhl。然而,本發(fā)明并非意在限于這些特定的細(xì)胞或這些特定的啟動(dòng)子,其它細(xì)胞和啟 動(dòng)子也可以用多個(gè)實(shí)施方案中。在一些實(shí)施方案中,除啟動(dòng)子序列外,表達(dá)盒還含有位于結(jié)構(gòu)基因下游的轉(zhuǎn)錄終 止區(qū),以提供有效的終止。在一些實(shí)施方案中,終止區(qū)是從和啟動(dòng)子序列相同的基因中獲得 的,而在其他實(shí)施方案中,其獲得自不同的基因。雖然任何合適的功能性真菌終止子都可用于本發(fā)明,一些示例性的終止子包 括但不限于來(lái)自以下基因的終止子構(gòu)巢曲霉trpC基因(參見(jiàn),Yelton等人,Proc. Natl. Acad. Sci. USA 81 1470-1474(1984) ;Mullaney 等人,(Molecular Genetics and Genomics [MGG] 199 :37-45 (1985)),泡盛曲霉或黑曲霉的葡糖淀粉酶基因(參見(jiàn),Nunberg 等人,Mol. Cell Biol.,4 :2306-2315(1984) ;Boel 等人,EMBO J.,3 1581-1585 (1984)),米 曲霉的TAKA淀粉酶基因,米黑毛霉(Mucor miehei)的羧基蛋白酶基因(歐洲專利
發(fā)明者王華明, 鮑鍇 申請(qǐng)人:丹尼斯科美國(guó)公司