專利名稱:耐高溫二氫乳清酸合酶基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及遺傳工程領(lǐng)域,具體地,涉及一種耐高溫二氫乳清酸合酶基因及其編碼的多肽及制備該多肽的方法。
背景技術(shù):
二氫乳清酸合酶(Dihydropteroate synthase)是葉酸生物合成中起重要作用的一種酶。其作用是催化2-氨基-4羥基6-羥甲基7,8-二氫蝶啶二磷酸鹽和4-氨基安息香酸鹽生成二磷酸和二氫乳清酸。
二氫乳清酸合酶是在葉酸生物合成中起重要作用的一種酶。雖然,更高的真核細胞不能重新合成葉酸,因此不能產(chǎn)生DHPS(二氫乳清酸合酶)。DHPS像4-氨基安息香酸鹽羥化酶,它作用在產(chǎn)生混合物和媒介聯(lián)系于神經(jīng)變性混亂的路徑。葉酸缺乏已經(jīng)被用在研究道氏綜合癥和獲得性免疫缺陷綜合癥產(chǎn)生的神經(jīng)變性的混亂。
現(xiàn)在非常緊迫要研制新的抗瘧疾藥,因為使人類致死的瘧疾已經(jīng)對普通的抗瘧疾藥如周效磺胺產(chǎn)生抗性。通過研究,已經(jīng)發(fā)現(xiàn)其抗藥性的產(chǎn)生和二氫乳清酸合酶,二氫乳清酸合酶的編碼基因有關(guān)。并且,被磺胺類藥物和2氫葉酸還原霉(DHFR)抑制劑體現(xiàn)。用分子,遺傳和生化方法已經(jīng)揭示了抵抗磺胺類藥物是通過DHPS(二氫乳清酸合酶)傳遞。
周效磺胺抑制二氫乳清酸合酶,這是一種在瘧疾的寄生蟲(malaria parasite)中出現(xiàn),但是,它不在人中出現(xiàn)。研究闡明了寄生蟲躲避兩種抗瘧藥的致死作用的躲避機理,即通過抗葉酸來中斷DNA的合成,以對藥物產(chǎn)生抗性。
該酶能應(yīng)用于新型的抗瘧疾藥的研發(fā),葉酸的人工合成,道氏綜合癥和獲得性免疫缺陷綜合癥產(chǎn)生的神經(jīng)變性的混亂的研究和治療。因此在醫(yī)藥業(yè)方面有廣闊的應(yīng)用前景。
本發(fā)明涉及的騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細菌(eubacteria),最適生長溫度為75攝氏度,厭氧生長,革蘭氏染色反應(yīng)呈陽性。它是由中國科學(xué)院微生物所首先發(fā)現(xiàn)并進行了分類學(xué)上的分析。菌種保存在中國微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國特有的一個物種,其體內(nèi)所具有的耐高溫二氫乳清酸合酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫二氫乳清酸合酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫二氫乳清酸合酶活性多肽。
本發(fā)明的另一目是還提供了含有編碼耐高溫二氫乳清酸合酶的DNA的重組載體、含有前述重組載體的宿主細胞,以及生產(chǎn)該蛋白的方法。
本發(fā)明一方面提供了一種編碼具有耐高溫二氫乳清酸合酶活性的多肽的核苷酸序列。該核苷酸序列能編碼具有序列表SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與二氫乳清酸合酶相關(guān)。核苷酸序列具有序列表SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯義。
本發(fā)明另一方面提供了一種耐高溫二氫乳清酸合酶活性的多肽。該多肽具有序列表SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
本發(fā)明提供制備耐高溫二氫乳清酸合酶的方法,它包括以下步驟1)分離出核苷酸序列如序列表SEQ ID NO.1所示的編碼耐高溫二氫乳清酸合酶的基因;2)構(gòu)建含有如步驟1)所述的基因的核苷酸序列的表達載體;3)將步驟2)中表達載體轉(zhuǎn)入宿主細胞,形成能生產(chǎn)耐高溫二氫乳清酸合酶的重組細胞;4)培養(yǎng)步驟3)中的重組細胞;5)分離、純化得到耐高溫二氫乳清酸合酶。
本發(fā)明涉及嗜熱厭氧菌的二氫乳清酸合酶基因的分離及表達。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫二氫乳清酸合酶基因。運用該基因生產(chǎn)耐高溫二氫乳清酸合酶的轉(zhuǎn)基因微生物或動植物,并回收獲得該基因編碼的酶。另外,本發(fā)明還提供了具有耐高溫二氫乳清酸合酶活性的多肽的氨基酸序列及功能等同體。同時,本發(fā)明還提供了制備,分離,純化具有耐高溫二氫乳清酸合酶活性的多肽的方法。
圖1是測序文庫構(gòu)建步驟流程圖;
圖2是測序與數(shù)據(jù)分析流程圖。
具體實施例方式
本發(fā)明提供了分離的,編碼耐高溫二氫乳清酸合酶活性的多肽的核苷酸分子,該核苷酸分子是通過對騰沖嗜熱厭氧菌全基因組測序與分析而獲得的,具有序列表SEQ.ID NO.1所示的核苷酸序列。它編碼了具有耐高溫二氫乳清酸合酶活性的有270個氨基酸的多肽,該多肽的推測分子量為29815道爾頓。
本發(fā)明還涉及一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細胞。同時,本發(fā)明包括構(gòu)建該重組載體和宿主細胞的方法,以及利用重組工程技術(shù)生產(chǎn)二氫乳清酸合酶的方法。
本發(fā)明進一步地提供了一種分離的耐高溫二氫乳清酸合酶或多肽,其特征在于具有序列表SEQ.ID NO.2所示的氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫二氫乳清酸合酶基因”指編碼具有耐高溫二氫乳清酸合酶活性的多肽的核苷酸序列,如序列表SEQ.ID NO.1的核苷酸序列及其簡并序列。該簡并序列是指該序列中有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡并性,所以與SEQ IDNO.1核苷酸序列同源性低至約70%的簡并序列也能編碼出序列表SEQ ID NO.2所述的氨基酸序列。該術(shù)語還包括能在中度嚴(yán)謹條件下,更佳地在高度嚴(yán)謹條件下與序列表SEQ ID NO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與序列表SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析,PAGE或HPLC法測量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫二氫乳清酸合酶”指具有耐高溫二氫乳清酸合酶活性的序列表SEQ ID NO.2序列的多肽。該術(shù)語還包括序列表SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫二氫乳清酸合酶相同的功能。這些變異體包括(但不限于)若干個氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個或數(shù)個氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個或數(shù)個氨基酸通常也不會改變蛋白質(zhì)的功能。該術(shù)語還包括耐高溫二氫乳清酸合酶的活性片段和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市場上銷售的各種質(zhì)粒、粘粒、噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫二氫乳清酸合酶時,可以將耐高溫二氫乳清酸合酶基因序列可操作地連于表達調(diào)控序列,從而形成耐高溫二氫乳清酸合酶表達載體。該表達載體含有復(fù)制起始點和表達調(diào)控序列,啟動子,增強子和必要的加工信息位點。表達載體還必須含有可供選擇的標(biāo)記基因,如a)提供對抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補營養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒有的必需營養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說明書注明的。這些表達載體可以用本領(lǐng)域技術(shù)人員所公知的重組DNA技術(shù)制備,如可參考Sambrook等人的做法(1989),或Ausubel等人的做法(1992)。
重組表達載體可以用本領(lǐng)域熟知的方法引入宿主細胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細胞的過程稱為“轉(zhuǎn)化”。通過培養(yǎng)宿主細胞,誘導(dǎo)所需蛋白的表達,并通過本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語“宿主細胞”包括原核細胞和真核細胞。常用的原核細胞如大腸桿菌,枯草桿菌等。常用的真核細胞如酵母細胞,或各種動植物細胞。本發(fā)明的耐高溫二氫乳清酸合酶基因全長序列或其片段通常可以用PCR(聚合酶鏈?zhǔn)椒磻?yīng))擴增法,重組法,或人工合成的方法獲得。對于PCR擴增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來設(shè)計引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。實施例1構(gòu)建測序文庫測序文庫的構(gòu)建采用全基因組霰彈法(shotgun)進行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細菌,提取總DNA。為了保證測序文庫構(gòu)建的隨機性,最大程度地避免產(chǎn)生斷裂熱點的問題,采用多種方法、不同條件的建庫原則。先采用物理剪切方法(包括超聲波法及用Hydroshear Machine進行剪切),其次根據(jù)該菌基因組特征選用AluI進行隨機部分酶切。物理剪切時采用不同強度處理樣品,酶切時通過設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進行連接,連接產(chǎn)物通過電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機測序的文庫。同時,為了便于以后重疊群(contig)的搭接還構(gòu)建了長插入片段(10kb左右)的測序文庫(將基因組DNA以Sau3AI隨機部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進行連接、構(gòu)建文庫)。該文庫經(jīng)兩個末端的測序在構(gòu)建完成圖(finishing)的過程中可以得到重疊群(contig)之間的關(guān)系,并可以解決較大的洞(gap)對補洞造成的困難。建庫流程如(見圖1)。
Phred進行Basecalling的算法原理,是根據(jù)軌跡中各個峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時對這個堿基給出可信度信息,即堿基的測序質(zhì)量。
在大規(guī)模測序中,測序質(zhì)量的監(jiān)控是十分重要的,它直接影響對測序的決策,包括文庫的構(gòu)建,覆蓋率的大小。同時對測序?qū)嶒炛锌赡艹霈F(xiàn)的失誤能及時反饋。2)序列拼接所謂序列拼接,就是把全基因組霰彈法(又稱鳥槍法)隨機測序得到的樣品序列組裝成連續(xù)的重疊群(contig),主要利用它們之間的重疊序列作參考。考慮到測序中存在載體的影響,需要先對樣品序列進行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(WatermanMS,1990)。這是一種動態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進行拼接。在拼接時,堿基的測序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測序質(zhì)量計算得到。3)基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對基因組進行注釋,包括進行開放閱讀框架(Open Reading Frame,ORF)的預(yù)測,基因功能的預(yù)測,以及特殊RNA片段的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測基因編碼序列,然后所有預(yù)測的開讀框和非編碼區(qū)(intergenic region)都用BLAST軟件(Altschul,S.F.et al. 1997)與NCBI(美國國家生物技術(shù)信息中心)的無冗余蛋白數(shù)據(jù)庫(non-redundant proteindatabase)比較來發(fā)現(xiàn)可能漏掉的基因。在判斷一個基因的起始點時,將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點,可能的信號肽序列和啟動子序列等。如果在一個開放閱讀框內(nèi)出現(xiàn)多個啟動子時,一般采用第一個啟動子作為基因的起始點。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個基因的下游區(qū)的太遠處,則可能暗示一個小基因的丟失或測序錯誤人為地縮短了該基因,可作為進一步分析的參考。在確定移框突變和點突變時,主要根據(jù)與數(shù)據(jù)庫中的蛋白質(zhì)的相似性來判斷。如果出現(xiàn)一個蛋白質(zhì)對應(yīng)于兩個彼此相鄰的編碼序列的情況,則被認為是一個無活性基因(假基因seudogenes),因為這說明這兩個編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進而使基因失去活性。所有分析結(jié)果再用Artemis sequence viewer軟件(Rutherford,K.et al.2000)進行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長度小于150堿基對并且在已有數(shù)據(jù)庫中沒有同源性和其中沒有明顯的啟動子或終止區(qū)域的開放閱讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片段(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進行比對分析,結(jié)果再用InterPro數(shù)據(jù)庫(Apweiler,R.et al.2001)進行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫的查詢結(jié)果來確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來確認膜蛋白、ABC轉(zhuǎn)運蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號肽區(qū)域。4)補洞在完成基因組的工作框架圖之后,就要進行更加困難的補洞工作,即完成整個基因組100%的測序,得到一個環(huán)形基因組。主要工作就是把前面得到的contig連接起來。這是一項十分具體而又繁雜的工作。主要方法包括A.利用測序中的正反向測序樣品信息在測序過程中,我們有意對某些樣品進行了雙向測序,即同時測序某個插入片段的兩端,再將所得序列與其他序列一起進行拼接。由于這一對序列在基因組上的關(guān)系一定,它們之間的距離大致已知,根據(jù)這一信息,一可以確認某段contig是否可靠,二是當(dāng)這一對序列分別位于不同的contig上時,可以確定這兩個contig的方向關(guān)系和位置關(guān)系,為進一步設(shè)計實驗提供參考。
B.長插入片段及裝備型載體粘粒(Cosmid)末端測序基于同樣的原理,我們可以構(gòu)建不同長度的插入片段文庫,只對其兩端測序,然后拼接,分析其具體位置。這些文庫包括長度為9-12Kb的長插入片段庫和20-40Kb左右的Cosmid文庫。具體分析方法同上所述。
C. PCR和末端延伸(Walking)實驗根據(jù)上述步驟A和B所提供的contig的方向和位置關(guān)系,進一步的生物化學(xué)實驗就可以進行了。如設(shè)計一對引物進行PCR擴增,或以某一contig末端序列合成引物進行末端延伸(Walking)來補洞等。實施例4二氫乳清酸合酶的制備和提純根據(jù)實施例中基因注釋得到的二氫乳清酸合酶基因全長編碼序列(SEQ IDNO.1),設(shè)計出能擴增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點,以便構(gòu)建表達載體。以實施例1中獲得的測序文庫的質(zhì)粒DNA為模板,經(jīng)PCR擴增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達載體的工程菌DH5α-pGEX-2T-FolP。
挑取單菌落的工程菌DH5α-pGEX-2T-FolP于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時,至OD600達0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時。取培養(yǎng)時間不同的1ml菌液離心,在細菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時間增加而增加的菌株即為表達所需蛋白的工程菌。
按上述方法誘導(dǎo)表達所需蛋白的工程菌后,將細菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進行SDS-PAGE SEQ ID NO.1電泳,檢測純化效果。在29815道爾頓處的蛋白質(zhì)條帶即為二氫乳清酸合酶。<110>杭州華大基因研發(fā)中心<120>耐高溫二氫乳清酸合酶基因及其編碼的多肽和制備方法<140><141><160>2<170>PatentIn Version 3.1<210>1<211>813<212>DNA<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<220><221>gene<222>(1)…(813)<223>n=a或g或c或t<400>1atgattttaa agtgcaggga taagacttta gagattggca aaaggaccta cataatgggt 60attttgaaca tgactcctga ttccttttca gacggaggca aatacaatac tttggaaaaa 120gggattgaaa gagctttgca gatgattgaa gagggagcag atataataga tgtaggagga 180gagtctacaa ggcccggata cactcctgtc gatgaagagg aagaaattag aagggttata 240cctgtaatcg aaaggctttc taaaatttca gatgtgataa tttctgtgga tactatgaag 300gcgaatgtag ctttaagggc gctggaggca ggagcccata tagtaaatga tgtgtggggg 360cttcagagag accccaagat ggcagaagta gttgccaaat ataaagcagg ggttgtcatg 420atgcacaaca gcaatgtggc tgagtacggc gatgtagtaa aatctatcat agaatttttg 480aaaaagagca tagaaattgc tgagaaagct ggaattgaaa gaaaccagat gatagttgac 540cctggcatag gctttggaaa gactttagag cataatttgg aagtcatgaa tcgcctggag 600gaattaaaag ttctgggact tcctgtcctt ttgggtactt ccagaaaatc tatgataggc 660aaagtcttaa acgtagatgt agaggataga ttggagggga cagcggcgac tgtagctgtg 720ggaatagtaa aaggagtgga tataataaga gtccacgatg taaaagagat gtcaagagta 780gctaaaatga ctgatgcgat ggtgagaaga tga 813<210>2<211>270<212>PRT<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<400>2Met Ile Leu Lys Cys Arg Asp Lys Thr Leu Glu Ile Gly Lys Arg Thr1 5 10 15Tyr Ile Met Gly Ile Leu Asn Met Thr Pro Asp Ser Phe Ser Asp Gly20 25 30Gly Lys Tyr Asn Thr Leu Glu Lys Gly Ile Glu Arg Ala Leu Gln Met35 40 45Ile Glu Glu Gly Ala Asp Ile Ile Asp Val Gly Gly Glu Ser Thr Arg50 55 60Pro Gly Tyr Thr Pro Val Asp Glu Glu Glu Glu Ile Arg Arg Val Ile65 70 75 80Pro Val Ile Glu Arg Leu Ser Lys Ile Ser Asp Val Ile Ile Ser Val85 90 95Asp Thr Met Lys Ala Asn Val Ala Leu Arg Ala Leu Glu Ala Gly Ala100 105 110His Ile Val Asn Asp Val Trp Gly Leu Gln Arg Asp Pro Lys Met Ala115 120 125Glu Val Val Ala Lys Tyr Lys Ala Gly Val Val Met Met His Asn Ser130 135 140Asn Val Ala Glu Tyr Gly Asp Val Val Lys Ser Ile Ile Glu Phe Leu145 150 155 160Lys Lys Ser Ile Glu Ile Ala Glu Lys Ala Gly Ile Glu Arg Asn Gln165 170 175Met Ile Val Asp Pro Gly Ile Gly Phe Gly Lys Thr Leu Glu His Asn180 185 190Leu Glu Val Met Asn Arg Leu Glu Glu Leu Lys Val Leu Gly Leu Pro195 200 205Val Leu Leu Gly Thr Ser Arg Lys Ser Met Ile Gly Lys Val Leu Asn
210 215 220Val Asp Val Glu Asp Arg Leu Glu Gly Thr Ala Ala Thr Val Ala Val225 230 235 240Gly Ile Val Lys Gly Val Asp Ile Ile Arg Val His Asp Val Lys Glu245 250 255Met Ser Arg Val Ala Lys Met Thr Asp Ala Met Val Arg Arg260 265 270
權(quán)利要求
1.一種分離的DNA分子,其特征在于是編碼具有耐高溫二氫乳清酸合酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或該多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫二氫乳清酸合酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯義。
4.一種分離出的多肽,其特征在于它具有耐高溫二氫乳清酸合酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細胞或真核細胞。
8.一種制備耐高溫二氫乳清酸合酶的方法,其特征在于該方法包括如下步驟1)分離出核苷酸序列如SEQ ID NO.1所示的編碼耐高溫二氫乳清酸合酶的基因2)構(gòu)建含有如步驟1)所述的基因的核苷酸序列的表達載體;3)將步驟2)中表達載體轉(zhuǎn)入宿主細胞,形成能生產(chǎn)耐高溫二氫乳清酸合酶的重組細胞;4)培養(yǎng)步驟3)中的重組細胞;5)分離、純化得到耐高溫二氫乳清酸合酶。
全文摘要
本發(fā)明公開了一種耐高溫二氫乳清酸合酶基因及其編碼的多肽和制備方法。它涉及編碼具有耐高溫二氫乳清酸合酶活性或其功能等同變異體的分離的DNA及利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫二氫乳清酸合酶活性的多肽或其功能等同變異體。本發(fā)明以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫二氫乳清酸合酶基因。本發(fā)明涉及利用該基因生產(chǎn)耐高溫二氫乳清酸合酶的轉(zhuǎn)基因微生物或轉(zhuǎn)基因動植物,并回收獲得該基因編碼的酶。另外,本發(fā)明還提供了具有耐高溫二氫乳清酸合酶活性的多肽的氨基酸序列及功能等同體。同時,本發(fā)明還提供了制備、分離、純化具有耐高溫二氫乳清酸合酶活性的多肽的方法。
文檔編號C12N15/54GK1379100SQ0211073
公開日2002年11月13日 申請日期2002年2月1日 優(yōu)先權(quán)日2002年2月1日
發(fā)明者董偉, 楊煥明, 盧小羽, 胡松年, 張小英 申請人:杭州華大基因研發(fā)中心