蛋白酶變體的制作方法
【專利說(shuō)明】
[0001] 本發(fā)明是基于申請(qǐng)日為2010年12月10日,申請(qǐng)?zhí)枮?201080063729. 3"(國(guó)際申 請(qǐng)?zhí)枮镻CT/US2010/059814),發(fā)明名稱為"脂肪酶變體"的專利申請(qǐng)的分案申請(qǐng)。
[0002] 設(shè)及序列表
[0003] 本申請(qǐng)包含計(jì)算機(jī)可讀形式的序列表。所述計(jì)算機(jī)可讀形式通過(guò)提述并入本文。
技術(shù)領(lǐng)域
[0004] 本發(fā)明設(shè)及與來(lái)源于澄橘嗜熱子囊菌(Thermoascusaurantiacus)的蛋白酶具有 至少75%同一性的蛋白酶,其氨基酸序列作為SEQIDNO: 2的氨基酸1至177示于所附序 列表,并與該蛋白酶相比包含至少一個(gè)修飾(即,為其變體)。本發(fā)明還設(shè)及編碼該些蛋白 酶的DNA,包含該些多核巧酸的核酸構(gòu)建體、載體和宿主細(xì)胞,W及其產(chǎn)生方法,及其用途, 例如,用于產(chǎn)生發(fā)酵產(chǎn)物,例如己醇。
[000引發(fā)明背景
[0006] 蛋白酶為公知的酶,將其應(yīng)用于發(fā)酵產(chǎn)物的產(chǎn)生中的優(yōu)點(diǎn)也是公知的。已從多種 來(lái)源包括多種真菌和細(xì)菌菌株分離了蛋白酶。
[0007] 本發(fā)明的目標(biāo)是提供其他具有蛋白酶活性的多膚(蛋白酶變體)和編碼所述多膚 的多核巧酸。本發(fā)明的目標(biāo)還在于提供與其來(lái)源的親本蛋白酶相比具有改善性質(zhì)的蛋白 酶。本發(fā)明的蛋白酶變體與野生型親本蛋白酶相比呈現(xiàn)改善的熱穩(wěn)定性。
[0008]W0 2003/048353公開(kāi)了澄橘嗜熱子囊菌CGMCCNo. 0670的野生型蛋白酶。
【發(fā)明內(nèi)容】
[0009] 在第一個(gè)方面,本發(fā)明設(shè)及產(chǎn)生具有蛋白酶活性并且當(dāng)與野生型親本蛋白酶相比 時(shí)具有改善的熱穩(wěn)定性的蛋白酶變體的方法,所述方法包括培養(yǎng)細(xì)胞,該細(xì)胞導(dǎo)入了包含 下述可操作地連接的元件的表達(dá)載體:
[0010] (a)轉(zhuǎn)錄啟動(dòng)子,
[0011] 化)多核巧酸分子,其編碼蛋白酶變體,所述變體與SEQIDNO: 2的氨基酸1至177 中所示的蛋白酶具有至少75%同一性,并與SEQIDN0:2的氨基酸1至177相比在選自下 述的至少一個(gè)位置包含至少一個(gè)修飾;27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、 53、54、73、88、104、114、115、116、126、152、157、158 和 173,
[0012] 該多核巧酸分子通過(guò)將至少一個(gè)突變導(dǎo)入編碼蛋白酶的DNA分子而制備,和 [001引 (C)轉(zhuǎn)錄終止子,
[0014] 由此,所述細(xì)胞表達(dá)由所述多核巧酸分子編碼的蛋白酶變體;和回收所述蛋白酶 變體。
[00巧]在第二個(gè)方面,本發(fā)明設(shè)及蛋白酶,其與SEQIDNO:2的氨基酸1至177具有至少 75%同一性,且與SEQIDNO: 2的氨基酸1至177相比在至少一個(gè)選自下述的位置包含至少 一個(gè)修飾;27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、53、54、73、88、104、114、115、 116、126、152、157、158、和173。
[0016] 本發(fā)明還設(shè)及編碼該些蛋白酶的核酸序列,包含所述核酸序列的核酸構(gòu)建體,包 含所述核酸構(gòu)建體的表達(dá)載體,包含所述表達(dá)載體和/或所述核酸構(gòu)建體的宿主細(xì)胞。
[0017] 本發(fā)明還設(shè)及所述蛋白酶的用途,例如用于淀粉液化、糖化和/或發(fā)酵工藝。
[001引發(fā)明詳述
[0019] 本發(fā)明設(shè)及親本蛋白酶的分離的變體,其在至少一個(gè)對(duì)應(yīng)于SEQIDNO: 2的成熟 多膚的位置 27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、53、54、73、88、104、114、115、 116、126、152、157、158和173的位置包含修飾。具體而言,本發(fā)明的變體具有改善的熱穩(wěn)定 性。
[0020] 蛋白酶活性;術(shù)語(yǔ)"蛋白酶活性"意指EC. 3. 4.-的多膚。在一個(gè)優(yōu)選實(shí)施方案 中,其為屬于EC3. 4. 24金屬內(nèi)膚酶的多膚。蛋白酶活性可根據(jù)實(shí)施例1中所述的步驟確 定,例如使用偶氮-酪蛋白(azo-casein)測(cè)定法或使用protazyme化的內(nèi)蛋白酶測(cè)定法。
[0021] 互聯(lián)網(wǎng)上的ENZYME站點(diǎn)(ht1:p://www.expasy.ch/enzyme/)是關(guān)于酶命 名的信息的檔案庫(kù)。其主要基于Nomencla1:ureCommitteeoftheInternational UnionofBiochemistirandMolecularBiology(lUB-MB)的推薦,并描述了 已提供 了EC巧nzymeCommission)編號(hào)的所有類型的已表征的酶炬airochA.HieENZYME dat油ase, 2000,NucleicAcidsRes28:304-305)。亦參見(jiàn)來(lái)自NC-IUBMB, 1992 的化zyme Nomenclature手冊(cè)。
[002引變體;術(shù)語(yǔ)"變體"意指具有蛋白酶活性的多膚,其與SEQIDN0:2的1至177所 示的氨基酸序列相比包含至少一個(gè)修飾,即取代、插入和/或缺失。在本文的上下文中,"至 少一個(gè)"(例如修飾)意指一個(gè)或多個(gè),例如1、2、3、4、5、6、7、8、9或10個(gè)修飾;或12、14、 15、16、18、20、22、24、25、28或30個(gè)修飾;依此類推,直至最大數(shù)量為44個(gè)修飾。然而,本 發(fā)明的蛋白酶變體仍應(yīng)與SEQIDNO: 2的氨基酸1至177至少75%相同。在另一個(gè)實(shí)施方 案中,所述變體與SEQIDN0:2的氨基酸1至177具有至少76%、77%、78%、79%、80%、 81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91 %、92%、93%、94%、95%、 96%、97%、98%或至少99%同一性。仍舊在進(jìn)一步的具體實(shí)施方案中,同一性程度為與SEQ IDN0:2 的成熟多膚至少98. 0%、98. 2%、98. 4%、98. 6%、98. 8%、99. 0%、99. 1%、99. 2%、 99. 3%,或至少99. 4%,但小于100%的序列同一性。
[0023] 突變體:術(shù)語(yǔ)"突變體"意指編碼變體的多核巧酸。
[0024] 野生型酶;術(shù)語(yǔ)"野生型"蛋白酶意指由天然出現(xiàn)的微生物如見(jiàn)于自然界的細(xì)菌、 酵母或絲狀真菌表達(dá)的蛋白酶。
[0025] 親本或親本蛋白酶;術(shù)語(yǔ)"親本"或"親本蛋白酶"意指蛋白酶,對(duì)其進(jìn)行了改變W 產(chǎn)生本發(fā)明的酶變體。所述親本可為天然出現(xiàn)的(野生型)多膚或其變體。
[0026] 親本變體;術(shù)語(yǔ)親本變體意指制備變體蛋白酶的起點(diǎn)自身與野生型蛋白酶相比為 變體。
[0027] 分離的變體;術(shù)語(yǔ)"分離的變體"意指經(jīng)人力修飾的變體。在一個(gè)方面,所述變體 為至少1 %純,例如至少5 %純,至少10%純,至少20%純,至少40 %純,至少60 %純,至少 80%純和至少90%純,如通過(guò)505斗46日所確定。
[0028] 基本上純的變體;術(shù)語(yǔ)"基本上純的變體"意指制備物,其含有按重量計(jì)最多 10%,最多8%,最多6%,最多5%,最多4%,最多3%,最多2%,最多1 %和最多0. 5%的與 其天然或重組相聯(lián)系的其他多膚。優(yōu)選地,所述變體按制備物中存在的總多膚物質(zhì)的重量 計(jì)為至少92%純,例如至少94%純,至少95%純,至少96%純,至少97%純,至少98%純, 至少99%純,至少99. 5%純,和至少100%純。本發(fā)明的變體優(yōu)選為基本上純的形式。該可 例如通過(guò)藉由公知的重組方法或藉由經(jīng)典的純化方法制備多膚來(lái)實(shí)現(xiàn)。
[002引成熟多膚;術(shù)語(yǔ)"成熟多膚"意指在翻譯和任何翻譯后修飾(如N端加工,C-端截 短,糖基化,磯酸化等)之后W其最終形式存在的多膚。在一個(gè)方面,所述成熟多膚是SEQ IDN0:2的氨基酸1至177。信號(hào)膚部分可通過(guò)本領(lǐng)域中已知的程序(Si即alP(Nielsen 等,1997,ProteinElngineering10:1-6))來(lái)預(yù)測(cè)。SEQIDN0:2 的氨基酸 1 至 177 是預(yù)期 的成熟部分。一般而言,酶成熟部分的第一個(gè)氨基酸可通過(guò)純化酶的N端測(cè)序來(lái)確定。成 熟多膚的N端通過(guò)N端測(cè)序來(lái)確證。由此,信號(hào)膚部分和成熟部分之間的任何差異必然是 由于前膚的存在。
[0030] 成熟多膚編碼序列;術(shù)語(yǔ)"成熟多膚編碼序列"意指編碼具有蛋白酶活性的成熟 多膚的多核巧酸。在一個(gè)方面,基于預(yù)測(cè)SEQIDNO: 1的核巧酸535至1065編碼信號(hào)膚的 Si即alP(Nielsen等,1997,ProteinElngineering10:1-6),所述成熟多膚編碼序列是SEQ IDNO: 1的核巧酸535至1065。
[0031] 序列同一性;兩個(gè)氨基酸序列或兩個(gè)核巧酸序列之間的相關(guān)性由參數(shù)"序列同 一性"描述。就本發(fā)明而言,兩個(gè)氨基酸序列之間的序列同一性程度使用如EMBOSS包 (EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,等,2000,Trends Genet. 16:276-277)的Needle程序(優(yōu)選版本3. 0. 0或更新版本)中執(zhí)行的 Needleman-Wunsch算法(Needleman和Wunsch, 1970,J.Mol.Biol. 48:443-453)來(lái)確定。 使用的可選參數(shù)為缺口開(kāi)放罰分為10,缺口延伸罰分為0. 5,和邸L0SUM62炬L0SUM62的 EMBOSS版本)取代矩陣。使用標(biāo)最長(zhǎng)同一'f生(longestidentity)"(使用-nobrief選 項(xiàng)獲得)的Needle輸出作為百分比同一性,并如下所示計(jì)算:
[0032](相同殘基X100)/(比對(duì)長(zhǎng)度-比對(duì)中缺口總數(shù))
[0033] 就本發(fā)明而言,兩個(gè)脫氧核糖核巧酸序列之間的序列同一性程度使用如EMBOSS 包(EMBOSS:HieEluropeanMole州larBiologyOpenSoftwareSuite,I?ice等,2000,見(jiàn) 上文)的Needle程序(優(yōu)選版本3. 0. 0或更新版本)中執(zhí)行的Needleman-Wunsch算法 (Needleman和Wunsch,1970,見(jiàn)上文)來(lái)確定。使用的可選參數(shù)為缺口開(kāi)放罰分為10,缺 口延伸罰分為0.5,和邸NA即化(NCBINUC4. 4的EMBOSS版本)取代矩陣。使用標(biāo)最長(zhǎng) 同一'I"生(longestidentity)"(使用-nobrief選項(xiàng)獲得)的Needle輸出作為百分比同一 性,并如下所示計(jì)算:
[0034](相同脫氧核糖核巧酸X100)/(比對(duì)長(zhǎng)度-比對(duì)中缺口總數(shù))
[0035] 分離的多核巧酸;術(shù)語(yǔ)"分離的多核巧酸"意指經(jīng)人力修飾的多核巧酸。在一個(gè) 方面,所述分離的多核巧酸為至少1 %純,例如至少5 %純,至少10 %純,至少20 %純,至少 40%純,至少60%純,至少80 %純,至少90%純和至少95 %純,如通過(guò)瓊脂糖電泳所確定。 所述多核巧酸可為基因組、cDNA、RNA、半合成和合成來(lái)源,或其任意組合。
[0036] 基本上純的多核巧酸;術(shù)語(yǔ)"基本上純的多核巧酸"意指不含其他外源或不需要的 核巧酸,并處于適用于遺傳工程多膚產(chǎn)生系統(tǒng)內(nèi)的形式的多核巧酸制備物。因此,基本上純 的多核巧酸含有按重量計(jì)最多10 %,最多8%,最多6%,最多5 %,最多4%,最多3 %,最多 2 %,最多1 %和最多0. 5 %的與其天然或重組相聯(lián)系的其他多核巧酸物質(zhì)。然而,基本上純 的多核巧酸可包含天然出現(xiàn)的5' -和3' -未翻譯區(qū),如啟動(dòng)子和終止子。優(yōu)選所述基本上 純的多核巧酸按重量計(jì)為至少90%純,例如至少92%純,至少94%純,至少95%純,至少 96%純,至少97%純,至少98%純,至少99%純,和至少99. 5%純。本發(fā)明的多核巧酸優(yōu)選 為基本上純的形式。
[0037] 編碼序列;術(shù)語(yǔ)"編碼序列"意指多核巧酸,其直接指定其多膚產(chǎn)物的氨基酸序列。 編碼序列的邊界一般通過(guò)開(kāi)讀框確定,其通常WATG起始密碼子或其他起始密碼子如GTG 和TTG開(kāi)始,并W終止密碼子如TAA、TAG和TGA結(jié)束。所述編碼序列可為DNA、cDNA、合成 或重組的多核巧酸。
[0038] 核酸構(gòu)建體;術(shù)語(yǔ)"核酸構(gòu)建體"意指單鏈或雙鏈的核酸分子,其從天然出現(xiàn)的基 因分離,或經(jīng)修飾W否則不會(huì)在自然界存在的方式含有核酸區(qū)段,或?yàn)楹铣傻?。?dāng)核酸構(gòu)建 體含有表達(dá)本發(fā)明的編碼序列所需的調(diào)控序列時(shí),術(shù)語(yǔ)核酸構(gòu)建體與術(shù)語(yǔ)"表達(dá)盒"同義。
[0039] 調(diào)控序列;術(shù)語(yǔ)"調(diào)控序列"意指供表達(dá)編碼本發(fā)明的變體所需的所有成分。每個(gè) 調(diào)控序列對(duì)于編碼變體的多核巧酸或?qū)τ诒舜丝蔀樘烊换蛲庠吹摹4祟愓{(diào)控序列包括但不 限于先導(dǎo)序列、聚腺巧酸化序列、前膚序列、啟動(dòng)子、信號(hào)膚序列和轉(zhuǎn)錄終止子。最低限度, 調(diào)控序列包括啟動(dòng)子,W及轉(zhuǎn)錄和翻譯終止信號(hào)。調(diào)控序列可與接頭一同提供,W供導(dǎo)入 特定限制性位點(diǎn)的目的,所述位點(diǎn)便于所述調(diào)控序列與編碼變體的多核巧酸的編碼區(qū)的連 接。
[0040] 可操作地連接;術(shù)語(yǔ)"可操縱地連接"意指該樣的構(gòu)型,其中調(diào)控序列置于相對(duì)于 多核巧酸的編碼序列的合適位置,從而使得調(diào)控序列指導(dǎo)編碼序列的表達(dá)。
[0041] 表達(dá);術(shù)語(yǔ)"表達(dá)"包括變體產(chǎn)生所設(shè)及的任何步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修 飾、翻譯、翻譯后修飾和分泌。
[0042] 表達(dá)載體;術(shù)語(yǔ)"表達(dá)載體"意指直鏈或環(huán)狀的DNA分子,其包含編碼變體的多核 巧酸,并可操作地連接于提供其表達(dá)的其他核巧酸。
[0043] 宿主細(xì)胞;術(shù)語(yǔ)"宿主細(xì)胞"意指任何細(xì)胞類型,其易受包含本發(fā)明的多核巧酸的 核酸構(gòu)建體或表達(dá)載體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等。術(shù)語(yǔ)"宿主細(xì)胞"涵蓋親本細(xì)胞的任何后代, 其由于復(fù)制過(guò)程發(fā)生的突變與親本細(xì)胞不完全相同。
[0044]改善的性質(zhì);術(shù)語(yǔ)"改善的性質(zhì)"意指與變體相關(guān)、與親本相比改善的特征。此類 改善的性質(zhì)包括但不限于熱活性、熱穩(wěn)定性、抑活性、抑穩(wěn)定性、底物/輔因子特異性、改善 的表面性質(zhì)、產(chǎn)物特異性、在經(jīng)預(yù)處理的生物質(zhì)存在下增加的穩(wěn)定性或可溶性、在儲(chǔ)藏條件 下改善的穩(wěn)定性、和化學(xué)穩(wěn)定性。
[0045]改善的熱穩(wěn)定性;術(shù)語(yǔ)"改善的熱穩(wěn)定性"意指在升高的溫度,在緩沖液中或在如 那些在產(chǎn)物儲(chǔ)藏/運(yùn)輸過(guò)程中存在或類似于在變體的工業(yè)使用過(guò)程中存在的那些的條件 下溫育一段時(shí)間之后,相對(duì)于親本顯示保留蛋白酶活性的變體。本發(fā)明的變體蛋白酶是否 相對(duì)于親本蛋白酶具有改善的熱穩(wěn)定性可如實(shí)施例1中所述確定。本發(fā)明的變體蛋白酶可 與親本蛋白酶相比具有改善的熱穩(wěn)定性,其中改善的熱穩(wěn)定性作為增加的相對(duì)活性確定。 本發(fā)明的變體蛋白酶可與親本蛋白酶相比具有改善的熱穩(wěn)定性,其中改善的熱穩(wěn)定性作為 增加的剩余活性確定。
[0046] 在一個(gè)方面,當(dāng)使用實(shí)施例中用于確定剩余活性的測(cè)定法(偶氮酪蛋白)相比較 時(shí),具有蛋白酶活性的變體的熱穩(wěn)定性比親本更加熱穩(wěn)定至少1. 05倍,例如至少1. 1倍,至 少1. 5倍,至少1. 8倍,至少2倍,至少5倍,至少10倍,至少15倍,至少20倍和至少25倍。
[0047] 修飾,如取代、缺失、插入
[0048] 蛋白酶變體可相對(duì)于模板(即親本或參照蛋白酶,或比較性氨基酸序列,如SEQID N0:2的氨基酸1至177)包含多種類型的修飾:一個(gè)氨基酸可由另一個(gè)氨基酸取代;一個(gè)氨 基酸可缺失;一個(gè)氨基酸可插入兩個(gè)殘基之間,W及任何數(shù)量的此類修飾的任意組合。
[0049] 取代或延伸而未指明取代為何或用何延伸指插入任何天然的或非天然的氨基酸, 但在模板中占據(jù)該位置的氨基酸除外。
[0050]取代意指將占據(jù)某位置的氨基酸用不同的氨基酸替代;缺失意指去除占據(jù)某位置 的氨基酸;而插入意指緊鄰占據(jù)某位置的氨基酸添加1-3個(gè)氨基酸。在本文的上下文中,術(shù) 語(yǔ)"插入"旨在同樣涵蓋N和/或C端延伸。
[0051] 就本發(fā)明而言,使用包含于SEQIDN0:2中的成熟多膚來(lái)確定變體蛋白酶中的 相應(yīng)氨基酸殘基。將變體蛋白酶的氨基酸序列與SEQIDN0:2中公開(kāi)的成熟多膚進(jìn)行比 對(duì),并且基于該比對(duì),使用如執(zhí)行于EMBOSS包(EMB0SS:Ilie化ropeanMolecularBiology OpenSoftwareSuite,I?ice等,2000,TrendsGenet. 16:276-277)的Needle程序(優(yōu)選版 本 3. 0. 0