專利名稱:在宿主細(xì)胞中表達(dá)克隆的改進(jìn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及高度適合用于下述方法的啟動(dòng)子,所述方法通過表達(dá)克隆鑒定編碼目的蛋白質(zhì)的DNA序列。
背景技術(shù):
已知數(shù)量遞增的基于表達(dá)克隆的篩選方法。這類方法先前被成功地用于在例如Bacillus(比較US 4,469,791、WO2005/38024)和E.coli(例如WO 95/18219和WO 95/34662)中鑒定原核基因產(chǎn)物。WO2005/38024描述篩選分泌蛋白質(zhì)的重組Bacillus細(xì)胞的方法。然而,該方法缺乏高通量自動(dòng)化檢測(cè)技術(shù)。酵母也被用作用于表達(dá)克隆真核基因的宿主細(xì)胞。Strasser等(Eur.J.Biochem.(1989)184699-706)報(bào)導(dǎo)了通過在酵母Saccharomyces cerevisiae中表達(dá)克隆真菌基因組DNA來鑒定真菌α-淀粉酶。類似地,WO 93/11249報(bào)導(dǎo)了通過在S.cerevisiae中表達(dá)克隆真菌cDNA來鑒定真菌纖維素酶。最近,描述了在絲狀真菌中的表達(dá)克隆(WO99/32617)。
在所有這些方法中,在可分離分泌具有目的特性蛋白質(zhì)的轉(zhuǎn)化體之前,不得不篩選大量轉(zhuǎn)化體。因此存在對(duì)下述表達(dá)克隆方法的需要,所述方法可最優(yōu)化檢測(cè)編碼被分泌蛋白質(zhì)的DNA序列的機(jī)會(huì)。
附圖簡(jiǎn)述
圖1.描述了pPhtrA-gfp-amyE。該分泌報(bào)告子載體包含與GFP可操作連接的B.subtilis htrA啟動(dòng)子。該載體對(duì)pPhtrB-gfp-amyE是有代表性的。
圖2.用于分泌-脅迫的B.subtilis報(bào)告子菌株的結(jié)構(gòu)。htr啟動(dòng)子與GFP基因融合,最終產(chǎn)生質(zhì)粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE。產(chǎn)生的質(zhì)粒通過相應(yīng)htr基因座中的單交換重組整合進(jìn)Bacillus宿主細(xì)胞染色體中,得到VT210A和VT210B細(xì)胞。Cmr代表氯霉素抗性基因。
圖3.描述了pUBnpr-2,其包含來自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登錄號(hào)K 02497) 圖4.描述了pUBBAG,其包含來自Bacillus amyloliquefaciens的β-葡聚糖酶基因bag(Genbank登錄號(hào)M 15674)。
圖5.描述了使用熒光激活細(xì)胞分選術(shù)(Fluorescence Activated CellSorting)對(duì)用質(zhì)粒pUB110(空對(duì)照載體)或質(zhì)粒pKTH10(編碼Bacillusamyloliquefaciens的α-淀粉酶基因amyQ)轉(zhuǎn)化的Bacillus subtilis VT210A細(xì)胞的分析。y軸描述所觀察到的事件數(shù)量,x軸描述相對(duì)熒光。在圖A中,描述了對(duì)用空載體pUB110轉(zhuǎn)化的Bacillus subtilis VT210A細(xì)胞的分析。在圖B中,描述了對(duì)用amyQ載體pKTH10轉(zhuǎn)化的Bacillus subtilisVT210A細(xì)胞的分析。在圖C中,描述了對(duì)用1∶20比例的pUB110和pKTH10轉(zhuǎn)化的Bacillus subtilis VT210A細(xì)胞混合種群的分析。在圖D中,描述了對(duì)用pUB110和pKTH10二者轉(zhuǎn)化的Bacillus subtilis VT210A細(xì)胞混合種群的細(xì)胞分選;細(xì)胞分選限制由垂直虛線指示。顯示高于所述限制的細(xì)胞被分選出來。
圖6.描述了對(duì)用質(zhì)粒pUB110(空對(duì)照載體)或質(zhì)粒pKTH10(編碼Bacillus amyloliquefaciens的α-淀粉酶基因amyQ)轉(zhuǎn)化的Bacillus subtilisVT210A細(xì)胞混合種群的分析。分析通過熒光激活細(xì)胞掃描(FluorescenceActivated Cell Scanning)進(jìn)行。y軸描述所觀察到的事件數(shù)量,x軸描述相對(duì)熒光。
圖7.描述了用于在A.niger中表達(dá)綠色熒光蛋白(GFP,Chalfie,M et al.,Science(1994)263(5148)802-805)的pGBFINGFP-2載體。所述FIN載體的主鏈特征先前描述于WO 99/32617中。
圖8.描述了用于在A.niger中表達(dá)植酸酶(PHY)(與WO99/32617中所述FytA相同的植酸酶基因PHY)的pGBFIN-32載體。
圖9.描述了其中大部分植酸酶基因和整個(gè)葡萄糖淀粉酶啟動(dòng)子被去除的pGBFIN-40載體,該載體用作構(gòu)建A.niger WT載體菌株的孔對(duì)照載體。
圖10.描述了為確認(rèn)分泌誘導(dǎo)的啟動(dòng)子身份而進(jìn)行的Northern印跡分析。
圖11.描述了用于在A.niger中基因表達(dá)的載體。該載體在構(gòu)建分泌誘導(dǎo)的A.niger報(bào)告子構(gòu)建體中用作主鏈。
圖12.描述了pGBFINGFPBLE-1克隆載體。該分泌誘導(dǎo)型報(bào)告子構(gòu)建體包含與本發(fā)明分泌誘導(dǎo)型啟動(dòng)子1可操作連接的GFP-BLE報(bào)告子融合基因。該構(gòu)建體對(duì)于pGBFINGFPBLE-2、pGBFINGFPBLE-3、pGBFINGFPBLE-4和pGBFINGFPBLE-5是代表性的。
圖13.描述了pGBTOPSEL-1,該載體用作構(gòu)建最終分泌誘導(dǎo)型報(bào)告子質(zhì)粒的主鏈。所述載體的主鏈特征先前描述于WO 99/32617。
圖14.描述了最終分泌報(bào)告子構(gòu)建體pGBTOPGFPBLE-1。該分泌誘導(dǎo)的報(bào)告子載體包含與本發(fā)明分泌誘導(dǎo)型啟動(dòng)子1可操作連接的GFP-BLE報(bào)告子構(gòu)建體。該載體對(duì)pGBTOPGFPBLE-2、pGBTOPGFPBLE-3、pGBTOPGFPBLE-4和pGBTOPGFPBLE-5是代表性的。
圖15.描述了含有下述報(bào)告子構(gòu)建體的A.niger共轉(zhuǎn)化體腐草霉素抗性的差異,所述報(bào)告子構(gòu)建體帶有與編碼細(xì)胞內(nèi)蛋白質(zhì)(由黑點(diǎn)表示)或細(xì)胞外蛋白質(zhì)(由黑方塊表示)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動(dòng)子P4。
圖16.描述了含有下述報(bào)告子構(gòu)建體的A.niger共轉(zhuǎn)化體腐草霉素抗性的差異,所述報(bào)告子構(gòu)建體帶有與編碼細(xì)胞內(nèi)蛋白質(zhì)(由黑點(diǎn)表示)或細(xì)胞外蛋白質(zhì)(由黑方塊表示)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動(dòng)子P5。
圖17.描述了E-PAGETM凝膠,其中各圖代表包含下述報(bào)告子構(gòu)建體的經(jīng)共轉(zhuǎn)化的A.niger克隆,所述報(bào)告子構(gòu)建體帶有與編碼細(xì)胞外蛋白質(zhì)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動(dòng)子P1。M代表E-PAGE
預(yù)染標(biāo)準(zhǔn)(Invitrogen,U.K.)。
圖18.描述了E-PAGETM凝膠,其中各圖代表包含下述報(bào)告子構(gòu)建體的經(jīng)共轉(zhuǎn)化的A.niger克隆,所述報(bào)告子構(gòu)建體帶有與編碼細(xì)胞外蛋白質(zhì)的文庫構(gòu)建體結(jié)合的分泌誘導(dǎo)型啟動(dòng)子P3。M代表E-PAGE
預(yù)染標(biāo)準(zhǔn)(Invitrogen,U.K.)。
發(fā)明內(nèi)容
啟動(dòng)子DNA序列 根據(jù)本發(fā)明的第一方面,提供了啟動(dòng)子DNA序列,例如 (a)以下列表所示的DNA序列SEQ ID NO1、SEQ ID NO2、SEQID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24, (b)能夠與(a)的DNA序列雜交的DNA序列, (c)與(a)的DNA序列至少50%同源的DNA序列, (d)(a)到(c)的DNA序列中任何一種的變體,或 (e)(a)到(d)的DNA序列中任何一種的亞序列。
根據(jù)一種優(yōu)選的實(shí)施方案,本發(fā)明的啟動(dòng)子序列為這樣的一種啟動(dòng)子DNA序列,例如 (a)以下列表所示的一種DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24, (b)能夠與(a)的DNA序列雜交的DNA序列, (c)與(a)的DNA序列至少50%同源的一個(gè)DNA序列, (d)(a)到(c)的DNA序列中任何一種的一個(gè)變體,或 (e)(a)到(d)的DNA序列中任何一種的一個(gè)亞序列。
在本申請(qǐng)上下文中,啟動(dòng)子DNA序列為下述DNA序列,當(dāng)該啟動(dòng)子DNA序列與該編碼序列可操作連接時(shí),所述DNA序列能夠控制編碼序列的表達(dá)。術(shù)語“可操作連接”在本文定義為一種構(gòu)型,其中啟動(dòng)子DNA序列適當(dāng)?shù)刂糜谂c編碼序列相關(guān)的位置,使得所述啟動(dòng)子DNA序列指導(dǎo)由所述編碼序列編碼的多肽的產(chǎn)生。
術(shù)語“編碼序列”在本文定義為被轉(zhuǎn)錄為下述mRNA的核酸序列,所述mRNA置于適當(dāng)調(diào)控序列調(diào)控之下時(shí)被翻譯為多肽。編碼序列的邊界通常由ATG起始密碼子(其通常為mRNA5’末端開放讀碼框的起點(diǎn))和轉(zhuǎn)錄終止序列(在mRNA 3’末端開放讀碼框的緊下游)確定。編碼序列可包括但不僅限于基因組DNA、cDNA、半合成的、合成的和重組的核酸序列。優(yōu)選地,啟動(dòng)子DNA序列被定義為位于其連接的編碼序列上游的DNA序列,并定義為能夠調(diào)控該編碼序列的表達(dá)。
更具體地,術(shù)語“啟動(dòng)子”在本文定義為下述DNA序列,所述DNA序列結(jié)合RNA聚合酶,并指導(dǎo)聚合酶到達(dá)編碼多肽的編碼序列正確的下游轉(zhuǎn)錄起始位點(diǎn)以起始轉(zhuǎn)錄。RNA聚合酶能有效催化與編碼區(qū)適當(dāng)DNA鏈互補(bǔ)的信使RNA的裝配。術(shù)語“啟動(dòng)子”還應(yīng)被理解為包括用于轉(zhuǎn)錄為mRNA后翻譯的5’非編碼區(qū)(啟動(dòng)子和翻譯起點(diǎn)之間)、順式作用轉(zhuǎn)錄調(diào)控元件如增強(qiáng)子,和其它能夠與轉(zhuǎn)錄因子相互作用的核苷酸序列。
在一種優(yōu)選的實(shí)施方案中,本發(fā)明的啟動(dòng)子DNA序列為來自以下的DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ IDNO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。
根據(jù)另一優(yōu)選的實(shí)施方案,本發(fā)明的啟動(dòng)子DNA序列為能夠與以下列表所示的DNA序列雜交并仍保持啟動(dòng)子活性的DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23或SEQ ID NO24。
啟動(dòng)子活性優(yōu)選通過測(cè)量作為編碼序列表達(dá)結(jié)果產(chǎn)生的蛋白質(zhì)濃度來確定,所述編碼序列與啟動(dòng)子可操作連接?;蛘邌?dòng)子活性通過測(cè)量由編碼序列編碼的蛋白質(zhì)的酶活性確定,所述編碼序列與啟動(dòng)子可操作連接。根據(jù)優(yōu)選的實(shí)施方案,啟動(dòng)子活性(及其強(qiáng)度)通過測(cè)量lacZ報(bào)告子基因表達(dá)來確定(In Luo,Gene 163(1995)127-131或Perkins and Youngman(1986)Proc Natl Acad Sci USA 83140;或Vagner et al.(1998)Microbiology1443097中)。根據(jù)另一優(yōu)選的實(shí)施方案,通過使用綠色熒光蛋白作為編碼序列確定啟動(dòng)子活性(In Microbiology.1999 Mar;145(Pt 3)729-34.Santerre Henriksen AL,Even S,Muller C,Punt PJ,van den Hondel CA,NielsenJ.Study)。在細(xì)菌細(xì)胞中,GFP和其它熒光蛋白已廣泛用于表達(dá)和(動(dòng)態(tài))蛋白質(zhì)定位研究(在Southward and Surette(2002)MoI.Microbiol.451191中綜述)。另外,可通過測(cè)量在啟動(dòng)子調(diào)控下產(chǎn)生的轉(zhuǎn)錄物mRNA水平確定啟動(dòng)子活性??衫缤ㄟ^Northern印跡、GeneChipsTM(Affymetrix)或斑點(diǎn)陣列技術(shù)或定量(實(shí)時(shí))PCR測(cè)量mRNA水平(J.Sambrook,E.F.Fritsch,and T.Maniatis,2001,Molecular Cloning,A Laboratory Manual,3dedition,Cold Spring Harbor,N.Y.)。最優(yōu)選地,通過使用Northern印跡的mRNA分析確定啟動(dòng)子活性。
優(yōu)選地,本發(fā)明的(經(jīng)分離的)啟動(dòng)子DNA序列在非常低嚴(yán)格度條件下,更優(yōu)選低嚴(yán)格度條件下,更優(yōu)選中嚴(yán)格度條件下,更優(yōu)選中-高嚴(yán)格度條件下,甚至更優(yōu)選高嚴(yán)格度條件下和最優(yōu)選非常高嚴(yán)格度條件下與下述核酸探針雜交,所述核酸探針在相同條件下與 (i)SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ IDNO22、SEQ ID NO23或SEQ ID NO24,或 (ii)(i)的亞序列,或 (iii)(i)、(ii)的互補(bǔ)鏈雜交。
術(shù)語互補(bǔ)鏈為本領(lǐng)域技術(shù)人員已知,并描述于(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,N.Y.)。SEQ ID NO1、SEQ ID NO2、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的亞序列可在20個(gè)核苷酸和編碼區(qū)上游SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24的相應(yīng)全序列(SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的相應(yīng)編碼區(qū)分別在SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29中給出)之間的范圍。
SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQID NO22、SEQ ID NO23或SEQ ID NO24的核酸序列及其亞序列(如前一段中所定義)可用于設(shè)計(jì)核酸探針,以從不同屬或種的菌株中根據(jù)本領(lǐng)域公知方法鑒定和克隆DNA啟動(dòng)子。具體地,這類探針可用于與目的屬或種的基因組或cDNA根據(jù)標(biāo)準(zhǔn)Southern印跡方法雜交,從而從其中鑒定和分離相應(yīng)的基因。這類探針可顯著短于整個(gè)序列,但是應(yīng)有至少15個(gè),優(yōu)選至少25個(gè)和更優(yōu)選至少35個(gè)核苷酸長(zhǎng)。另外,這類探針可用于通過PCR擴(kuò)增DNA啟動(dòng)子。也可使用更長(zhǎng)的探針??墒褂肈NA、RNA和肽核酸(PNA)探針。典型地,標(biāo)記探針用于檢測(cè)相應(yīng)基因(例如用@32P、@33P、@3H、@35S、生物素或抗生物素蛋白或熒光標(biāo)記物)。本發(fā)明包括這類探針。
因此從這類其它生物中制備的基因組DNA或cDNA可用于篩選下述DNA,所述DNA與上文所述探針雜交并編碼多肽。來自這類其它生物的基因組DNA或其它DNA可通過瓊脂糖或聚丙烯酰胺凝膠電泳或其它分離技術(shù)分離。來自文庫或經(jīng)分離的DNA的DNA可轉(zhuǎn)移至并固定在硝酸纖維素或其它合適的載體材料上。為了鑒定與SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24或其亞序列同源的克隆或DNA序列,載體材料可用于Southern印跡。就本發(fā)明的目的而言,雜交是指DNA序列在非常低到非常高嚴(yán)格度條件下與下述經(jīng)標(biāo)記的核酸探針雜交,所述探針對(duì)應(yīng)于SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ IDNO23或SEQ ID NO24中所示DNA序列,對(duì)應(yīng)于所述DNA序列的互補(bǔ)鏈,或?qū)?yīng)于所述DNA序列的亞序列。在這些條件下與核酸探針雜交的分子使用例如X射線膠片檢測(cè)。也可使用其它雜交技術(shù),例如使用用于檢測(cè)的熒光和玻片和/或DNA微陣列作為支持。DNA微陣列雜交檢測(cè)的一個(gè)實(shí)例在FEMS Yeast Res.2003 Dec;4(3)259-69(Daran-Lapujade P,Daran JM,Kotter P,Petit T,Piper MD,Pronk JT.″Comparative genotyping of theSaccharomyces cerevisiae laboratory strains S288C and CEN.PK1 13-7D usingoligonucleotide microarrays″)中給出。另外,PNA微陣列用于雜交的用途描述于Nucleic Acids Res.2003 Oct 1;31(19)e119(Brandt O,F(xiàn)eldner J,Stephan A,Schroder M,Schnolzer M,Arlinghaus HF,Hoheisel JD,Jacob A.PNA microarrays for hybridisation of unlabelled DNA samples.)。
在一種優(yōu)選的實(shí)施方案中,核酸或DNA探針為SEQ ID NO1、SEQID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的DNA序列。在另一實(shí)施方案中,核酸探針為具有SEQID NO1的核苷酸100到150的DNA序列或具有SEQ ID NO2的核苷酸170到220的DNA序列。
在另一優(yōu)選的實(shí)施方案中,核酸探針為具有以下的DNA序列 -SEQ ID NO20的核苷酸996到2797、SEQ ID NO21的核苷酸996到3561、SEQ ID NO22的核苷酸997到3536、SEQ ID NO23的核苷酸1034到3175或SEQ ID NO24的核苷酸1080到4054,更優(yōu)選 -SEQ ID NO20的核苷酸1496到2497、SEQ ID NO21的核苷酸1496到3261、SEQ ID NO22的核苷酸1497到3236、SEQ ID NO23的核苷酸1534到2875或SEQ ID NO24的核苷酸1580到3754,甚至更優(yōu)選 -SEQ ID NO20的核苷酸1896到2197、SEQ ID NO21的核苷酸1896到2861、SEQ ID NO22的核苷酸1897到2936、SEQ ID NO23的核苷酸1934到2575或SEQ ID NO24的核苷酸1980到3454,和最優(yōu)選 -SEQ ID NO20的核苷酸1996到2100、SEQ ID NO21的核苷酸1996到2300、SEQ ID NO22的核苷酸1997到2400、SEQ ID NO23的核苷酸2034到2100或SEQ ID NO24的核苷酸2080到2800。
根據(jù)另一優(yōu)選的實(shí)施方案,探針為位于編碼序列上游的SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的DNA序列的一部分。SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的相應(yīng)的編碼區(qū)分別在SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29中給出。
對(duì)于至少100個(gè)核苷酸長(zhǎng)度的長(zhǎng)探針而言,非常低到非常高嚴(yán)格度條件被定義為依照標(biāo)準(zhǔn)Southern印跡程序,在42℃下5倍SSPE、0.3%SDS、200毫克/ml經(jīng)剪切且變性的鮭精DNA和甲酰胺中預(yù)雜交和雜交,所述甲酰胺對(duì)于非常低和低嚴(yán)格度而言為25%,對(duì)于中和中-高嚴(yán)格度而言為35%或?qū)τ诟吆头浅8邍?yán)格度而言為50%。對(duì)于至少100個(gè)核苷酸長(zhǎng)度的長(zhǎng)探針而言,最后用2倍SSC、0.2%SDS,在至少45℃(非常低嚴(yán)格度),更優(yōu)選至少50℃(低嚴(yán)格度),更優(yōu)選至少55℃(中嚴(yán)格度),更優(yōu)選至少60℃(中-高嚴(yán)格度),進(jìn)一步更優(yōu)選至少65℃(高嚴(yán)格度)和最優(yōu)選至少70℃(非常高嚴(yán)格度)下對(duì)載體材料洗滌三次,每次15分鐘。
對(duì)于約15個(gè)核苷酸到約70個(gè)核苷酸長(zhǎng)度的短探針而言,嚴(yán)格度條件定義為在比使用Bolton and McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA 481390)算法計(jì)算的Tm低5℃到10℃下,在0.9M NaCl、0.09 M Tris-HCl pH 7.6、6 mM EDTA、0.5%NP-40、1倍Denhardfs溶液、1mM焦磷酸鈉、1mM磷酸二氫鈉、0.1mM ATP和0.2mg/ml酵母RNA中依照標(biāo)準(zhǔn)Southern印跡程序預(yù)雜交、雜交和雜交后洗滌。對(duì)于約15個(gè)核苷酸到約70個(gè)核苷酸長(zhǎng)度的短探針而言,在6倍SCC加上0.1%SDS中15分鐘對(duì)載體材料洗滌一次,并使用6倍SSC在低于所計(jì)算的Tm 5℃到10℃下洗滌兩次,每次15分鐘。
根據(jù)另一優(yōu)選的實(shí)施方案,首先用來自SEQ ID NO 1、SEQ IDNO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的本發(fā)明的啟動(dòng)子DNA序列克隆與其可操作連接的天然基因、編碼序列或其部分。這可從SEQ ID NO 1、SEQ ID NO2、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24或先前定義的其亞序列開始來完成,其中使用該序列作為探針。將所述探針與給定宿主的cDNA或基因組文庫雜交,所述宿主為Bacillus、Aspergillus niger或本申請(qǐng)文本中定義的任何其它宿主。一旦天然基因或其部分被克隆,可隨后使用其自身作為探針,通過本文所述雜交實(shí)驗(yàn)克隆來自其它真菌的它的同源基因。在本發(fā)明上下文中,同源基因是指與天然基因至少50%同源的基因。優(yōu)選地,同源基因與天然基因至少55%同源,更優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,進(jìn)一步更優(yōu)選至少75%,優(yōu)選至少約80%,更優(yōu)選約90%,進(jìn)一步更優(yōu)選約95%和最優(yōu)選約97%。
同源基因編碼序列上游的序列為本發(fā)明包含的啟動(dòng)子?;蛘撸赏ㄟ^使用SEQ ID NO 25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29或如前定義的其亞序列,用例如如本文所述的比對(duì)或BLAST算法搜索基因組數(shù)據(jù)庫來鑒定與本發(fā)明啟動(dòng)子可操作連接的天然基因、編碼序列或其部分的序列。隨后可使用該經(jīng)鑒定的序列來鑒定本申請(qǐng)中定義的任何其它真菌宿主中的直向同源基因或同源基因。經(jīng)鑒定的直向同源基因或同源基因編碼序列上游的序列為本發(fā)明所包括的啟動(dòng)子。
根據(jù)另一優(yōu)選的實(shí)施方案,本發(fā)明的啟動(dòng)子DNA序列為來自SEQ IDNO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24并仍然具有較前定義的啟動(dòng)子活性的(經(jīng)分離的)DNA序列。
根據(jù)另一優(yōu)選的實(shí)施方案,本發(fā)明的啟動(dòng)子DNA序列為分別來自SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ IDNO22、SEQ ID NO23或SEQ ID NO24的(經(jīng)分離的)DNA序列,其與位于各自編碼區(qū)(SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQID NO28或SEQ ID NO29)上游的各自相應(yīng)的DNA序列SEQ IDNO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的至少部分至少50%同源。優(yōu)選地,所述DNA序列與位于各自相應(yīng)編碼區(qū)上游的SEQ ID NO 15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的至少部分至少55%同源,更優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,進(jìn)一步更優(yōu)選至少75%,優(yōu)選約80%,更優(yōu)選約90%,進(jìn)一步更優(yōu)選約95%,最優(yōu)選約97%同源。
就本發(fā)明目的而言,優(yōu)選通過Wilbur-Lipman方法(Wilbur andLipman,1983,Proceedings of the National Academy of Science USA 80726-730)使用LASERGENE.TM.MEGALIGN.TM.軟件(DNASTAR,Inc.,Madison,Wis.)用同一性表格和以下多重比對(duì)參數(shù)確定兩個(gè)核酸序列之間的同源性程度缺口懲罰為10和缺口長(zhǎng)度懲罰為10。配對(duì)比對(duì)參數(shù)為Ktuple=3、缺口懲罰=3和窗口=20。
根據(jù)另一優(yōu)選的實(shí)施方案,本發(fā)明的啟動(dòng)子DNA序列來自下述(經(jīng)分離的)DNA序列,所述分離的DNA序列為位于各自相應(yīng)編碼區(qū)上游的SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ IDNO17、SEQ ID NO18或SEQ ID NO19或SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ IDNO19的部分的變體。術(shù)語“變體啟動(dòng)子”在本文被定義為具有下述核苷酸序列的啟動(dòng)子,所述核苷酸序列包含母體啟動(dòng)子的一個(gè)或多個(gè)核苷酸的取代、缺失和/或插入,其中所述變體啟動(dòng)子具有大于或小于相應(yīng)母體啟動(dòng)子的啟動(dòng)子活性。術(shù)語“變體啟動(dòng)子”還應(yīng)包括天然變體和使用本領(lǐng)域公知方法(例如經(jīng)典誘變、定向誘變和DNA改組(shuffling))體外產(chǎn)生的變體。變體啟動(dòng)子可具有一個(gè)或多個(gè)突變。各突變?yōu)楹塑账岬莫?dú)立取代、缺失和/或插入。向啟動(dòng)子中引入核苷酸取代、缺失和/或核苷酸可使用任何本領(lǐng)域已知方法(例如經(jīng)典誘變、定向誘變或DNA改組)完成。特別有用的為下述方法,所述方法利用帶有目的插入的超螺旋的雙鏈DNA載體和含有所需突變的兩個(gè)合成引物。各自與載體相反鏈互補(bǔ)的寡核苷酸引物通過Pfu DNA聚合酶的手段在溫度循環(huán)中延伸。摻入引物后,產(chǎn)生含有交錯(cuò)切口的經(jīng)突變的質(zhì)粒。溫度循環(huán)之后,用Dpn1處理產(chǎn)物以消化親代DNA模板并選擇含有突變的經(jīng)合成的DNA,所述Dpn1對(duì)經(jīng)甲基化的和經(jīng)半甲基化的DNA特異。也可使用本領(lǐng)域已知的其它方法。其它方法的實(shí)例為QuickChangeTM定點(diǎn)誘變?cè)噭┖?Stratagene Cloning Systems,La JoIIa,CA)、改變的位點(diǎn)
II體外誘變體系(The Altered
in vitroMutagenesis Systems)(Promega Corporation)或通過使用如Gene.1989 Apr15;77(1)51-9.(Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis by overlap extension using the polymerase chain reaction″)所述PCR或使用如Molecular BiologyCurrent Innovations and Future Trends.(Eds.A.M.Griffin and H.G.Griffin.ISBN 1-898486-01-8 1995 HorizonScientific Press,PO Box 1,Wymondham,Norfolk,U.K.)所述PCR的重疊延伸。根據(jù)優(yōu)選的實(shí)施方案,變體啟動(dòng)子為與最初來自SEQ ID NO1、SEQID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的啟動(dòng)子序列相比,具有至少一個(gè)經(jīng)修飾的調(diào)節(jié)位點(diǎn)的啟動(dòng)子。這類調(diào)節(jié)位點(diǎn)可以整體被去除或如上文所解釋被特異突變。從而調(diào)節(jié)這類啟動(dòng)子變體使得例如其不再被葡萄糖誘導(dǎo)。這類啟動(dòng)子變體和如何獲得它們的技術(shù)的實(shí)例描述于EP 673 429B或WO 94/04673。
啟動(dòng)子變體可以是等位變體。等位變體是指占據(jù)相同染色體位點(diǎn)的基因的兩種或更多可選擇的形式中的任何。等位變體通過突變天然發(fā)生,并可由種群中的多態(tài)性引起??赏ㄟ^包含步驟(a)和(b)的以下方法獲得變體啟動(dòng)子(a)在非常低、低、中、中-高、高或非常高嚴(yán)格度條件下將DNA與 (i)SEQ ID NO 1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19,或 (ii)(i)的亞序列,或 (iii)(i)、(ii)的互補(bǔ)鏈雜交,和 (b)從所述DNA序列中分離變體啟動(dòng)子。嚴(yán)格度和洗滌條件如本文定義。
本發(fā)明的啟動(dòng)子可以是下述啟動(dòng)子,所述啟動(dòng)子的序列可用接頭提供,所述接頭用于引入特異限制性位點(diǎn)的目的,所述限制性位點(diǎn)便于連接啟動(dòng)子序列和編碼多肽的核酸序列編碼區(qū)。
在另一優(yōu)選的實(shí)施方案中,啟動(dòng)子DNA序列來自SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ IDNO18或SEQ ID NO19的亞序列。在本文上下文中亞序列優(yōu)選被定義為位于先前定義的各相應(yīng)編碼序列上游的SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ IDNO19的部分。
亞序列優(yōu)選含有至少約50個(gè)核苷酸,或優(yōu)選至少約100個(gè)核苷酸,更優(yōu)選至少約200個(gè)核苷酸,甚至更優(yōu)選至少約230個(gè)核苷酸,甚至更優(yōu)選至少約250個(gè)核苷酸和最優(yōu)選至少約290個(gè)核苷酸。
根據(jù)另一優(yōu)選的實(shí)施方案,亞序列與前述句子定義的亞序列區(qū)別在于一個(gè)或多個(gè)來自5’和/或3’端的核苷酸被缺失,所述DNA序列仍具有早先定義的啟動(dòng)子活性。
在另一優(yōu)選的實(shí)施方案中,啟動(dòng)子亞序列為來自翻譯起點(diǎn)和/或來自轉(zhuǎn)錄起點(diǎn)的“經(jīng)修剪的(trimmed)”亞序列。修剪啟動(dòng)子并對(duì)其功能性分析的實(shí)例描述于Gene.1994 Aug 5;145(2)179-87the effect of multiple copiesof the upstream region on expression of the Aspergillus niger glucoamylase-encoding gene.Verdoes JC,Punt PJ,Stouthamer AH,van den Hondel CA). 本文所提供的序列信息不應(yīng)狹義地解釋為要求包括錯(cuò)誤鑒定的堿基。本文所公開的特異序列可被容易地使用,并最終進(jìn)行進(jìn)一步的序列分析從而鑒定測(cè)序錯(cuò)誤,以從絲狀真菌(特別是Aspergillus niger)中分離最初的DNA序列。
除非另有說明,所有通過測(cè)序本文DNA分子確定的核苷酸序列都是使用自動(dòng)DNA測(cè)序儀確定的。因此,如本領(lǐng)域已知,對(duì)于通過該自動(dòng)途徑確定的任何DNA序列而言,本文確定的任何核苷酸序列可能含有一些錯(cuò)誤。通過自動(dòng)化確定的核苷酸序列通常與經(jīng)測(cè)序DNA分子的實(shí)際核苷酸序列至少約90%相同,更典型地至少約95%相同到至少約99.9%相同??赏ㄟ^其它手段更為精確地確定實(shí)際序列,包括本領(lǐng)域公知的手工DNA測(cè)序方法。
本領(lǐng)域技術(shù)人員能夠鑒定這類被錯(cuò)誤鑒定的堿基,并知道如何改正這類錯(cuò)誤。
功能性核酸等同物可典型地含有不改變其涉及的生物學(xué)功能的突變。術(shù)語“功能性等同物”還包括A.niger DNA序列的直向同源物。A.nigerDNA序列的直向同源物為能夠從其它菌株或物種中分離,并具有類似或相同生物學(xué)活性的DNA序列。
還可通過使用“序列比較算法”確定同源(類似或同一)序列??衫缤ㄟ^Smith & Waterman,Adv.Appl.Math.2482(1981)的局部同源性算法、通過Needleman & Wunsch,J.MoI.Biol.48443(1970)的同源性比對(duì)算法、通過Pearson & Lipman,Proc.Nat′l Acad.Sci.USA 852444(1988)的搜索相似性算法、通過這些算法的計(jì)算機(jī)實(shí)現(xiàn)(GAP,BESTFIT,F(xiàn)ASTA,andTFASTA in the Wisconsin Genetics Software Package,Genetics ComputerGroup,575 Science Dr.,Madison,Wl)或通過目測(cè)進(jìn)行用于查詢序列的最佳比對(duì)。適用于確定序列相似性的算法的實(shí)例為BLAST算法,其描述于Altschul,et al.,J.MoI.Biol.215403-410(1990)?;蛘?,其它程序可用于本文較早描述的序列比對(duì)。用于進(jìn)行BLAST分析的軟件通過National Centerfor Biotechnology Information(http://www.ncbi.nlm.nih.gov/)可公開獲得。該算法涉及首先通過鑒定查詢序列中W長(zhǎng)度的短字詞鑒定高分序列對(duì)(HSP),所述短字在與數(shù)據(jù)庫序列中相同長(zhǎng)度的字相比時(shí),匹配或滿足一些正值閾分值T。這些最初的相鄰字擊中(word hits)被用作為尋找含有它們的更長(zhǎng)HSP的起點(diǎn)。字擊中在兩個(gè)方向上沿兩條被比較序列中的各條延伸,直至積累的比對(duì)評(píng)分可以提高。當(dāng)累積的比對(duì)評(píng)分從達(dá)到的最大值減少數(shù)量X時(shí);累積的比對(duì)評(píng)分降為零或低于零時(shí);或到達(dá)任一序列末端時(shí),字擊中的延伸停止。BLAST算法參數(shù)W、T和X確定比對(duì)的敏感性和速度。BLAST程序使用11的字長(zhǎng)(W)、50的BLOSUM62評(píng)分矩陣(參閱Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 8910915(1989))比對(duì)(B)、10的期望值(E)、M=5、N=-4和雙鏈比較作為默認(rèn)值。然后BLAST算法進(jìn)行兩條序列間相似性的統(tǒng)計(jì)分析(參閱例如Karlin &Altschul,Proc.Nat′l.Acad.Sci.USA 905873-5787(1993))。由BLAST算法提供的一種相似性測(cè)量為最小和概率(P(N)),其提供了對(duì)兩個(gè)核苷酸或氨基酸序列間偶然發(fā)生匹配的可能性的指示。例如,如果在測(cè)試氨基酸序列與蛋白質(zhì)(如蛋白酶)氨基酸序列的比較中最小和可能性為小于約0.1,更優(yōu)選小于約0.01和最優(yōu)選小于約0.001時(shí),認(rèn)為氨基酸序列與蛋白質(zhì)(如蛋白酶)相似。
優(yōu)選地,變體啟動(dòng)子的相似性為與具有SEQ ID NO1、SEQ IDNO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的DNA序列之一至少40%同源。更優(yōu)選地,相似性為與具有SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ IDNO17、SEQ ID NO18或SEQ ID NO19的DNA序列至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,更優(yōu)選至少90%和更優(yōu)選至少95%或至少98%同源。
除天然存在的啟動(dòng)子序列等位變體外,技術(shù)人員知道可通過突變將改變引入來自SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ IDNO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的啟動(dòng)子序列中,而本質(zhì)上不改變其啟動(dòng)子功能。
本發(fā)明的啟動(dòng)子序列可得自任何屬的微生物。就本發(fā)明的目的而言,在本文中與給定來源結(jié)合使用術(shù)語“得自”應(yīng)指多肽由所述來源制造或由來插入了自所述來源的基因的細(xì)胞制造。優(yōu)選微生物為原核生物。優(yōu)選的原核生物為Bacillus和E.coli。優(yōu)選的Bacilli為Bacillus subtilis、Bacillusamyloliquefaciens、Bacillus licheniformis、Bacillus alcalophilus、Bacillusclausii、Bacillus brevis、Bacillus circulans、Bacillus firmus、Bacilluspumilis、Bacillus stearothermophilus、Bacillus megaterium、Bacilluslentus或Bacillus thuringiensis。
或者,啟動(dòng)子序列得自真核生物,優(yōu)選真菌來源,并更優(yōu)選來自酵母菌株,如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia菌株;或更優(yōu)選地,來自絲狀真菌菌株,如Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium或Trichoderma菌株。
在優(yōu)選的實(shí)施方案中,啟動(dòng)子序列得自Saccharomycescarlsbergensis、Saccharomyces cerevisiae、Saccharomyces diastaticus、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomycesnorbensis、Saccharomyces oviformis、Saccharomyces bayanus、Saccharomyces bayanus,var.uvarum或Saccharomyces pastorianus菌株。
在另一優(yōu)選的實(shí)施方案中,啟動(dòng)子序列得自Aspergillus aculeatus、Aspergillus awamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、A.niger優(yōu)選A.niger CBS 513.88、A.sojae、Aspergillus oryzae(A.oryzae)、Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicilliumpurpurogenum、Trichoderma harzianum、Trichoderma koningii、Trichoderma longibrachiatum、Trichoderma reesei或Trichoderma viride菌株。
在另一優(yōu)選的實(shí)施方案中,啟動(dòng)子序列得自Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusariumgraminearum、Fusarium graminum、Fusarium heterosporum Fusariumnegundi、Fusarium oxysporum、Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum菌株。
應(yīng)當(dāng)理解對(duì)于上述物種而言,本發(fā)明包括完美和不完美的狀態(tài),和其它分類學(xué)等價(jià)物(例如無性型),而無論其被已知的物種名如何。本領(lǐng)域技術(shù)人員會(huì)容易地識(shí)別合適等價(jià)物的性質(zhì)。公眾可以在大量培養(yǎng)物收集中容易地得到這些物種的菌株,所述培養(yǎng)物收集如美國(guó)模式培養(yǎng)物保藏單位(ATCC)、Deutsche Sammlung von Mikroorganismen und ZellkulturenGmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和AgriculturalResearch Service Patent Culture Collection,Northern Regional Research Center(NRRL)。
此外,可使用上述探針從其它來源中鑒定或獲得根據(jù)本發(fā)明的啟動(dòng)子序列,所述其它來源包括從自然(例如土壤、堆肥、水等)中分離的微生物。用于從天然生境中分離微生物的技術(shù)為本領(lǐng)域公知。然后可類似地篩選另一微生物的基因組DNA文庫得到核酸序列。一旦用探針檢測(cè)到了編碼啟動(dòng)子的核酸序列,則可通過使用本領(lǐng)域常規(guī)技術(shù)人員已知地技術(shù)分離或克隆該序列(參閱例如Sambrook et al.,1989,上文)。
在本發(fā)明中,啟動(dòng)子DNA序列還可以是雜交啟動(dòng)子,其包含一個(gè)或多個(gè)本發(fā)明啟動(dòng)子的部分;本發(fā)明啟動(dòng)子的部分和另一已知啟動(dòng)子的部分(如一個(gè)啟動(dòng)子的前導(dǎo)序列和來自另一啟動(dòng)子的轉(zhuǎn)錄起始位點(diǎn));或本發(fā)明一個(gè)或多個(gè)啟動(dòng)子的部分和一個(gè)或多個(gè)其它啟動(dòng)子的部分。其它啟動(dòng)子可以是在所選的宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何啟動(dòng)子序列,包括變體的、截短的和雜交啟動(dòng)子,并可得自編碼與所述宿主細(xì)胞同源或異源的細(xì)胞外或細(xì)胞內(nèi)多肽的基因。其它啟動(dòng)子序列對(duì)于編碼多肽的核酸序列來說可以是同源或異源的,并可對(duì)細(xì)胞來說是同源或異源的。
作為一種優(yōu)選的實(shí)施方案,經(jīng)鑒定的啟動(dòng)子的重要調(diào)節(jié)亞序列可與其它“基本”啟動(dòng)子融合以增強(qiáng)它們的啟動(dòng)子活性(例如描述于MolMicrobiol.1994May;12(3)479-90.Regulation of the xylanase-encoding xlnAgene of Aspergillus tubigensis.de Graaff LH,van den Broeck HC,van OoijenAJ,Visser J.) 適用于用本發(fā)明啟動(dòng)子構(gòu)建雜交啟動(dòng)子的其它啟動(dòng)子的其它實(shí)例包括得自下述基因的啟動(dòng)子A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸穩(wěn)定α-淀粉酶、A.niger或Aspergillus awamori葡萄糖淀粉酶(glaA)、A.niger gpdA、A.niger葡萄糖氧化酶goxC、Rhizomucor miehei脂酶、A.oryzae堿性蛋白酶、A.oryzae磷酸丙糖異構(gòu)酶、A.nidulans乙酰胺酶和Fusarium oxysporum胰蛋白酶樣蛋白酶(WO 96/00787)以及NA2-tpi啟動(dòng)子(來自A.niger中性α-淀粉酶基因的啟動(dòng)子和A.oryzae磷酸丙糖異構(gòu)酶的雜種)、Saccharomycescerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae半乳糖激酶(GAL1)、Saccharomyces cerevisiae醇脫氫酶/甘油醛-3-磷酸鹽脫氫酶(ADH2/GAP)和Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶,及其突變體、截短的啟動(dòng)子和雜交啟動(dòng)子。適用于酵母宿主細(xì)胞的其它啟動(dòng)子由Romanos et al.,1992,Yeast 8423-488描述。其它用于細(xì)菌細(xì)胞的有用啟動(dòng)子為以下基因的啟動(dòng)子B.subtilis堿性蛋白酶(apr)、B.subtilis中性蛋白酶(npr)、B.amyloliquefaciens α-淀粉酶(amyQ)、B.amyloliquefaciens堿性蛋白酶(apr)和B.amyloliquefaciens中性蛋白酶(npr)。
在本發(fā)明中,啟動(dòng)子DNA序列還可以是“串聯(lián)啟動(dòng)子”?!按?lián)啟動(dòng)子”在本文中被定義為兩個(gè)或更多啟動(dòng)子序列,其各與編碼序列可操作連接并介導(dǎo)編碼序列到mRNA的轉(zhuǎn)錄。
串聯(lián)啟動(dòng)子包含兩個(gè)或更多本發(fā)明的啟動(dòng)子,或者一個(gè)或多個(gè)本發(fā)明的啟動(dòng)子和一個(gè)或多個(gè)其它已知啟動(dòng)子,如上舉例適用于構(gòu)建雜交啟動(dòng)子的那些。串聯(lián)啟動(dòng)子的兩個(gè)或更多啟動(dòng)子序列可同時(shí)啟動(dòng)核酸序列的轉(zhuǎn)錄?;蛘叽?lián)啟動(dòng)子的一個(gè)或多個(gè)啟動(dòng)子序列可在細(xì)胞生長(zhǎng)的不同階段、或在真菌宿主的情況下時(shí)在菌絲體形態(tài)學(xué)上不同的部分、或在成孢子的細(xì)菌(如bacilli)中孢子發(fā)育中不同的細(xì)胞區(qū)室內(nèi)啟動(dòng)核酸序列的轉(zhuǎn)錄。
在本發(fā)明中,啟動(dòng)子可編碼序列和/或?qū)λ拗骷?xì)胞可以是外源的。本發(fā)明的變體、雜交或串聯(lián)啟動(dòng)子應(yīng)被理解為對(duì)編碼多肽的DNA序列外源,即使野生型的啟動(dòng)子對(duì)編碼序列或?qū)λ拗骷?xì)胞是內(nèi)源的。
本發(fā)明的變體、雜交或串聯(lián)啟動(dòng)子具有為來自SEQ ID NO1、SEQ IDNO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24和早先定義的任何啟動(dòng)子的至少約20%,優(yōu)選至少約40%,更優(yōu)選至少約60%,更優(yōu)選至少約80%,更優(yōu)選至少約90%,更優(yōu)選至少約100%,進(jìn)一步更優(yōu)選至少約200%,最優(yōu)選至少約300%,和進(jìn)一步最優(yōu)選至少約400%的啟動(dòng)子活性。啟動(dòng)子活性優(yōu)選如先前所述來確定。最優(yōu)選啟動(dòng)子活性使用Norhtern印跡通過mRNA分析確定。
DNA構(gòu)建體 根據(jù)第二個(gè)方面,本發(fā)明提供下述DNA構(gòu)建體,所述構(gòu)建體包含與賦予可選擇性狀的報(bào)告基因可操作連接的如上部分所述的本發(fā)明啟動(dòng)子DNA序列。報(bào)告基因可以是對(duì)合適宿主賦予可選擇性狀的任何基因。優(yōu)選報(bào)告基因?yàn)檫x擇性標(biāo)記基因。
“DNA構(gòu)建體”在本文中被定義為單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或其經(jīng)修飾而含有以天然不存在的方式組合和并置的核酸片段。
當(dāng)DNA構(gòu)建體含有編碼序列和編碼序列表達(dá)所需的全部調(diào)控序列時(shí),術(shù)語“DNA構(gòu)建體”與術(shù)語“表達(dá)盒”同義。在本申請(qǐng)上下文中,術(shù)語“DNA構(gòu)建體”與術(shù)語“經(jīng)分離的DNA構(gòu)建體”可互換使用,其中兩個(gè)術(shù)語理解為同義。
DNA構(gòu)建體可包含選擇性標(biāo)記基因,其允許容易選擇經(jīng)轉(zhuǎn)化的宿主細(xì)胞。DNA構(gòu)建體包含兩個(gè)選擇性標(biāo)記基因時(shí),技術(shù)人員會(huì)理解這兩個(gè)選擇性標(biāo)記基因不相同與本發(fā)明啟動(dòng)子連接的第一個(gè)選擇性標(biāo)記基因用于本發(fā)明的篩選方法中,DNA構(gòu)建體中存在的第二個(gè)選擇性標(biāo)記基因允許經(jīng)轉(zhuǎn)化的宿主細(xì)胞的標(biāo)準(zhǔn)選擇。
報(bào)告基因與本發(fā)明的啟動(dòng)子DNA序列可操作連接,從而在給定的宿主細(xì)胞中所述報(bào)告基因能夠在啟動(dòng)子DNA序列調(diào)控下表達(dá)。由報(bào)告子基因編碼的多肽對(duì)宿主細(xì)胞和/或?qū)?dòng)子DNA序列可以是同源或異源的。
在本文上下文中“一個(gè)”是指“至少一個(gè)”。因此DNA構(gòu)建體包含至少一個(gè)報(bào)告基因。宿主可與至少兩個(gè)DNA構(gòu)建體共轉(zhuǎn)化,其中一個(gè)包含選擇性標(biāo)記而另一個(gè)包含與報(bào)告基因連接的本發(fā)明啟動(dòng)子?;蛘吒鶕?jù)更優(yōu)選的實(shí)施方案,DNA構(gòu)建體中包含的報(bào)告基因?yàn)榘辽僖徊糠忠粋€(gè)報(bào)告基因和至少一部分第二個(gè)報(bào)告基因的雜交報(bào)告基因,其中第一個(gè)和第二個(gè)報(bào)告基因的編碼序列按讀碼框彼此配對(duì),且其中所述雜交報(bào)告基因與本發(fā)明啟動(dòng)子可操作連接。第一個(gè)和/或第二個(gè)報(bào)告基因可以是賦予合適宿主可選擇性狀的任何基因。用于真菌的優(yōu)選雜交報(bào)告基因包括Streptoalloteichus hindustanis(Drocourt et al.,NAR,1990)的GFP基因和腐草霉素抗性基因(BLE)。
選擇性標(biāo)記或可選擇標(biāo)記為下述基因,所述基因的產(chǎn)生提供抗微生物劑或病毒抗性、對(duì)重金屬的抗性、對(duì)營(yíng)養(yǎng)缺陷型的原養(yǎng)型等。用于原核宿主細(xì)胞的合適可選擇標(biāo)記包括但不僅限于卡那霉素、新霉素、紅霉素和其它MLS型標(biāo)記物(大環(huán)內(nèi)酯-林肯酰胺-蜜柑霉素B)、氯霉素、氨芐西林、四環(huán)素、鏈霉素和壯觀霉素。用于酵母的合適標(biāo)記物為ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在絲狀真菌宿主細(xì)胞中使用的可選擇標(biāo)記物包括但不僅限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲基轉(zhuǎn)移酶)、bar(膦絲菌素乙酰轉(zhuǎn)移酶)、hygB(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸鹽還原酶)、pyrG(乳清苷-5′-磷酸脫羧酶)、sC(硫酸腺嘌呤基轉(zhuǎn)移酶)、trpC(鄰氨基苯甲酸合酶)及其等效物。也可使用提供針對(duì)例如腐草霉素、潮霉素B或G418抗性的標(biāo)記。優(yōu)選用于Aspergillus細(xì)胞的為A.nidulans或A.oryzae的amdS和pyrG基因和Streptomyces hygroscopicus的bar基因。amdS標(biāo)記基因優(yōu)選應(yīng)用EP 635574B或WO 97/06261中所述技術(shù)使用。優(yōu)選的選擇性標(biāo)記基因?yàn)榕cA.nidulans gpdA啟動(dòng)子融合的A.nidulans amdS編碼序列(EP635 574B)。也可使用來自其它絲狀真菌的amdS基因(WO 97/06261)。
根據(jù)另一優(yōu)選的實(shí)施方案,報(bào)告基因編碼用于如上所述的原核、酵母和/或絲狀真菌細(xì)胞的可選擇標(biāo)記物?;蛘邎?bào)告基因編碼如下的報(bào)告子蛋白β-半乳糖苷酶、β-葡萄糖苷酸酶、水母發(fā)光蛋白、綠色熒光蛋白(GFP)及其變體(紅色、氰基、黃色熒光蛋白)、螢光素酶、lux、血紅素、β-內(nèi)酰胺酶或堿性磷酸酶。更優(yōu)選地,報(bào)告基因?yàn)榛虬幋a熒光報(bào)告子蛋白的基因,所述熒光報(bào)告子蛋白例如但不僅限于GFP、YFP和CFP(分別為綠色、黃色和氰基熒光蛋白質(zhì))。轉(zhuǎn)化體將顯示熒光并可使用光電管分選技術(shù)(FACS,熒光活化的細(xì)胞分選)從非表達(dá)克隆中分離。該方法的一個(gè)重要優(yōu)點(diǎn)為不需要將轉(zhuǎn)化混合物涂布平板(其顯著的提高了篩選方法的通量),并且陽性克隆可直接排列為MTP形式用于進(jìn)一步的自動(dòng)化處理?;蛘邎?bào)告基因編碼(跨)膜蛋白或細(xì)胞壁蛋白,抗體可出現(xiàn)在其上??墒褂么偶?xì)胞分選技術(shù)(
,Magnetic cell sorting,www.miltenyibiotec.com)從非表達(dá)轉(zhuǎn)化體中分離顯示所述膜蛋白的轉(zhuǎn)化體。
調(diào)控元件 DNA構(gòu)建體除啟動(dòng)子DNA序列外可進(jìn)一步包含一種或多種調(diào)控序列,其在宿主細(xì)胞中在與調(diào)控序列相容的條件下指導(dǎo)報(bào)告基因的表達(dá)。表達(dá)應(yīng)被理解為包括多肽產(chǎn)生中涉及的任何步驟,其包括但不僅限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。一個(gè)或多個(gè)調(diào)控序列對(duì)編碼序列或宿主來說可以是內(nèi)源的。或者可以用一個(gè)或多個(gè)對(duì)核酸序列外源的調(diào)控序列代替一個(gè)或多個(gè)調(diào)控序列,用于改善編碼序列在宿主細(xì)胞中的表達(dá)。
術(shù)語“調(diào)控序列”在本文中被定義為包括編碼序列(如報(bào)告基因)表達(dá)必需或有利的所有組件,包括本發(fā)明的啟動(dòng)子。各調(diào)控序列對(duì)編碼多肽的編碼序列來說可以是內(nèi)源的或外源的。這類調(diào)控序列包括但不僅限于前導(dǎo)序列、最佳翻譯起始序列(如Kozak,1991,J.Biol.Chem.26619867-19870中所述)、多腺苷酸化序列、前肽序列、信號(hào)肽序列、上游激活序列、本發(fā)明的啟動(dòng)子(包括其的變體、片段和雜交和串聯(lián)啟動(dòng)子)和轉(zhuǎn)錄終止子。調(diào)控序列最少包括轉(zhuǎn)錄和翻譯終止信號(hào)和本發(fā)明啟動(dòng)子(部分)。調(diào)控序列可以與用于引入特異限制性位點(diǎn)目的的接頭一起提供,所述限制性位點(diǎn)便于連接調(diào)控序列與編碼多肽的編碼序列(如報(bào)告基因)的編碼區(qū)。
調(diào)控序列可以是合適的轉(zhuǎn)錄終止子序列,即被宿主細(xì)胞識(shí)別終止轉(zhuǎn)錄的序列。終止子序列與編碼多肽的編碼序列3’末端可操作連接。任何在所選宿主細(xì)胞中有功能的終止子可用于本發(fā)明。
技術(shù)人員會(huì)理解序列的5’端和3’端根據(jù)各編碼序列定義。對(duì)于給定的終止子序列和給定的編碼序列而言,技術(shù)人員會(huì)知道如何將它們可操作連接在一起。
用于絲狀真菌宿主細(xì)胞的優(yōu)選終止子得自A.oryzae TAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans鄰氨基苯甲酸合酶、A.niger α-葡萄糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶樣蛋白酶基因。
用于酵母宿主細(xì)胞的優(yōu)選終止子得自以下基因Saccharomycescerevisiae烯醇化酶、Saccharomyces cerevisiae細(xì)胞色素C(CYC1)和Saccharomyces cerevisiae甘油醛-3-磷酸鹽脫氫酶。用于酵母宿主細(xì)胞的其它有用終止子由Romanos et al,1992,上文描述。調(diào)控序列還可為合適的前導(dǎo)序列,即mRNA的非翻譯區(qū),其對(duì)宿主細(xì)胞翻譯是重要的。前導(dǎo)序列與編碼多肽的核酸序列5’末端可操作地連接。在所選宿主細(xì)胞中有功能的任何前導(dǎo)序列可用于本發(fā)明。
用于絲狀真菌宿主細(xì)胞的優(yōu)選前導(dǎo)序列得自A.oryzae TAKA淀粉酶、A.nidulans磷酸丙糖異構(gòu)酶和A.niger葡萄糖淀粉酶基因。
用于酵母宿主細(xì)胞的合適前導(dǎo)序列來自Saccharomyces cerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶、Saccharomyces cerevisiaeα-因子和Saccharomyces cerevisiae醇脫氫酶和甘油醛-3-磷酸酯脫氫酶(ADH2/GAP)基因。
調(diào)控序列還可以是聚腺苷酸化序列,所述序列與核酸序列3’末端可操作連接。用于絲狀真菌宿主細(xì)胞的優(yōu)選的聚腺苷酸化序列得自A.oryzaeTAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans鄰氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶樣蛋白酶和A.nidulans α-葡萄糖苷酶。
用于酵母宿主細(xì)胞的有用聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 155983-5990描述。
還可期望添加調(diào)節(jié)序列,其允許多肽表達(dá)的調(diào)節(jié)與宿主細(xì)胞的生長(zhǎng)相關(guān)。調(diào)節(jié)體系的實(shí)例為響應(yīng)化學(xué)或物理刺激(包括調(diào)節(jié)化合物的存在)引起基因的表達(dá)被打開或關(guān)閉的那些。原核體系中的調(diào)節(jié)體系包括E.coli的lac和trp操縱子體系,和B.subtilis的spac、xyl、sacB和citM體系(在Meima et al.(2004)Expression Systems in Bacillus.In″Protein ExpressionTechnologies.Current status and future trends″(F.Baneyx,ed.),HorizonBioscience,Wymondham,Norfolk,UK,pp.199-252中綜述)。在桿菌中中適用于調(diào)控表達(dá)的其它啟動(dòng)子為在營(yíng)養(yǎng)饑餓條件下被誘導(dǎo)的啟動(dòng)子,如分別位于磷酸鹽和氮調(diào)控下的Pho調(diào)節(jié)子和TnrA/GlnR體系。在酵母中可使用ADH2體系或GAL1體系。在絲狀真菌中,可使用如US 5,503,991中所述的TAKA α-淀粉酶啟動(dòng)子、A.niger葡萄糖淀粉酶啟動(dòng)子、A.oryzae葡萄糖淀粉酶啟動(dòng)子、A.tubingensis木聚糖內(nèi)切酶(xlnA)啟動(dòng)子、A.niger硝酸鹽還原酶(niaD)啟動(dòng)子、Trichoderma reesei纖維二糖水解酶啟動(dòng)子和A.nidulans醇和醛脫氫酶(分別為alcA和aldA)作為調(diào)節(jié)序列。調(diào)節(jié)序列的其它實(shí)例為允許基因擴(kuò)增的調(diào)節(jié)序列。在真核體系中,這些調(diào)節(jié)序列包括二氫葉酸還原酶基因(其在存在甲氨喋呤時(shí)被擴(kuò)增)和金屬硫蛋白基因(其在有重金屬時(shí)被擴(kuò)增)。在這些情況下,編碼多肽的核酸序列應(yīng)與調(diào)節(jié)序列可操作地連接。
本發(fā)明啟動(dòng)子DNA序列中的內(nèi)源調(diào)節(jié)序列可以被去除,例如去除creA結(jié)合位點(diǎn)(如早先在EP 673 429B中所述的碳分解代謝物阻遏)、改變pacC和areA(用于pH和氮調(diào)節(jié))。在B.subtilis中,碳代謝物阻遏(CCR)涉及CcpA蛋白質(zhì)與cre元件的結(jié)合。cre元件與木糖誘導(dǎo)型的xyl啟動(dòng)子組合用于開發(fā)表達(dá)體系,所述表達(dá)體系允許雙重調(diào)控目的基因(Bhavsar et al.(2001)Appl Environ Microbiol67403)。
優(yōu)選地,DNA構(gòu)建體包含本發(fā)明的啟動(dòng)子DNA序列、與所述啟動(dòng)子DNA序列可操作連接的編碼序列和翻譯調(diào)控序列,如 -選自以下序列列表的依照5’到3’方向的一種翻譯終止序列TAAG、TAGA和TAAA,優(yōu)選TAAA,和/或 -選自以下序列列表的依照5’到3’方向的一種翻譯起始編碼序列GCTACCCCC;GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC;和GCTTCCTTC,優(yōu)選GCT TCC TTC和/或 -選自以下序列列表的一種轉(zhuǎn)錄起始序列5′-mwChkyCAAA-3′、5′-mwChkyCACA-3′或5′-mwChkyCAAG-3′,其中采用針對(duì)核苷酸的不確定編碼m(A/C);w(A/T);y(C/T);k(G/T);h(A/C/T),優(yōu)選5′-CACCGTCAAA-3′或5′-CGCAGTCAAG-3′。
在本發(fā)明上下文中,術(shù)語“翻譯起始編碼序列”被定義為DNA編碼序列開放讀碼框的起始子或起始密碼子緊鄰上游的九個(gè)核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。
在本發(fā)明上下文中,術(shù)語“翻譯終止序列”被定義為從開放讀碼框或核苷酸編碼序列3’端翻譯終止密碼子開始的,并依照5’到3’方向的三個(gè)或四個(gè)核苷酸。
在本發(fā)明上下文中,術(shù)語“翻譯起始序列”被定義為編碼多肽的DNA序列開放讀碼框起始子或起始密碼子緊鄰下游的十個(gè)核苷酸。起始子或起始密碼子編碼甲硫氨酸這種氨基酸。起始密碼子典型為ATG,但是也可以是任何功能性起始密碼子,如GTG。本領(lǐng)域公知在RNA中尿嘧啶U代替脫氧核苷酸胸腺嘧啶T。
用于原核生物的優(yōu)選調(diào)控序列已在EP 284 126A中描述。
本發(fā)明還涉及重組表達(dá)載體,其包含與報(bào)告基因可操作連接的本發(fā)明啟動(dòng)子和轉(zhuǎn)錄和翻譯起始和終止信號(hào)。上述多種報(bào)告基因和調(diào)控序列可以結(jié)合在一起,產(chǎn)生下述重組表達(dá)載體,所述重組表達(dá)載體可包括一個(gè)或多個(gè)便利的限制性位點(diǎn),所述限制性位點(diǎn)允許在這類位點(diǎn)處插入或取代啟動(dòng)子和/或報(bào)告基因?;蛘呖赏ㄟ^例如Gene.1989 Apr 15;77(1)51-9.Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis byoverlap extension using the polymerase chain reaction″中所述的使用PCR的序列重疊延伸(SOE-PCR),或通過使用GatewayTM克隆體系(Invitrogen)克隆完成編碼序列和啟動(dòng)子的融合。
重組表達(dá)載體可以是能夠轉(zhuǎn)化宿主細(xì)胞的任何載體。對(duì)載體的選擇典型地會(huì)取決于載體與其被引入的宿主細(xì)胞間的相容性。載體可以是線性或閉環(huán)質(zhì)粒。載體可以是整合的或自主復(fù)制的載體。
載體可以是自主復(fù)制載體(即作為染色體外實(shí)體存在時(shí)其復(fù)制不依賴于染色體復(fù)制)例如質(zhì)粒、染色體外因子、微型染色體或人工染色體。自主復(fù)制載體可包含確保自主復(fù)制的任何手段。載體可以是引入宿主細(xì)胞時(shí)被整合進(jìn)基因組,并與其被整合進(jìn)的染色體一起復(fù)制的載體。另外,可以使用包含要引入宿主細(xì)胞基因組中全部DNA或轉(zhuǎn)座子的單個(gè)載體或質(zhì)?;騼蓚€(gè)或更多的載體或質(zhì)粒,或轉(zhuǎn)座子。自主維持克隆載體的一個(gè)實(shí)例為包含AMA1-序列的克隆載體。AMA1為從A.nidulans分離的6.0kb基因組DNA片段,其能夠在Aspergillus中自主維持(參閱例如Aleksenko andClutterbuck(1997),F(xiàn)ungal Genet.Biol.21373-397)。適用于在革蘭氏陽性細(xì)菌如B.subtilis和B.amyloliquefaciens中表達(dá)的自主復(fù)制載體的實(shí)例為葡萄球菌載體pUB110(McKenzie et al.(1986)Plasmid 1593)和內(nèi)源B.subtilis質(zhì)粒pTA1015、pTA1040和pTA1060和來自它們的載體(例如pHB201;Bron et al.(1998)J Biotechnol 643)。
本發(fā)明的載體優(yōu)選含有下述元件,所述元件允許載體穩(wěn)定整合進(jìn)宿主細(xì)胞基因組或允許載體在細(xì)胞中獨(dú)立于基因組自主復(fù)制。
就整合進(jìn)宿主細(xì)胞基因組而言,載體可依賴于啟動(dòng)子序列和/或報(bào)告基因序列或載體的任何其它元件,用于通過同源重組或非同源重組將載體穩(wěn)定整合進(jìn)基因組。或者載體可含有用于指導(dǎo)通過同源重組整合進(jìn)宿主細(xì)胞基因組的額外的核酸序列。所述額外的核酸序列使得載體能夠在染色體中精確的靶位點(diǎn)整合進(jìn)宿主細(xì)胞基因組。為了提高精確位點(diǎn)整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,例如20到50個(gè),優(yōu)選55到95個(gè),優(yōu)選100到1,500個(gè)堿基對(duì),優(yōu)選400到1,500個(gè)堿基對(duì),更優(yōu)選800到1,500個(gè)堿基對(duì)并最優(yōu)選至少2kb,所述核酸與宿主細(xì)胞基因組中預(yù)先確定的靶基因座的DNA序列同源。整合元件可以是與宿主細(xì)胞基因組中靶序列同源的任何序列。另外,整合元件可以是非編碼或編碼核酸序列。為了促進(jìn)靶向的整合,克隆載體優(yōu)選在轉(zhuǎn)化宿主細(xì)胞之前線性化。線性化優(yōu)選以下述方式進(jìn)行克隆載體的至少一端(但是優(yōu)選兩端)側(cè)翼為與靶位點(diǎn)同源的序列。
優(yōu)選地,表達(dá)載體中與靶位點(diǎn)同源的整合元件來自高度表達(dá)的基因座,即它們來自能夠在真菌宿主細(xì)胞中高水平表達(dá)的基因。能夠有高表達(dá)水平的基因(即高表達(dá)的基因)在本文中定義為下述基因,所述基因的mRNA可占據(jù)總細(xì)胞mRNA的至少0.5%(w/w)(例如在經(jīng)誘導(dǎo)的條件下),或者,所述基因的基因產(chǎn)物可占據(jù)總細(xì)胞蛋白質(zhì)的至少1%(w/w),或在經(jīng)分泌的基因產(chǎn)物情況下,所述基因的基因產(chǎn)物可分泌至至少0.1g/l的水平(如EP 357127B1中所述)。大量?jī)?yōu)選的高表達(dá)真菌基因以實(shí)例的方式給出淀粉酶、葡萄糖淀粉酶、醇脫氫酶、木聚糖酶、磷酸甘油醛脫氫酶或來自Aspergilli或Trichoderma的纖維二糖水解酶基因。用于這些目的的最優(yōu)選的高表達(dá)基因?yàn)槠咸烟堑矸勖富?,?yōu)選A.niger葡萄糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、SEQ IDNO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29基因座,優(yōu)選SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ IDNO28和SEQ ID NO29的A.niger基因座或Trichoderma reesei纖維二糖水解酶基因。
或者,載體可以通過非同源重組整合進(jìn)宿主細(xì)胞基因組。
或者,和/或與上述實(shí)施方案組合,可在本發(fā)明步驟(e)中針對(duì)制造(優(yōu)選分泌)目的蛋白質(zhì)對(duì)細(xì)胞進(jìn)行生產(chǎn)(篩選)后,從宿主細(xì)胞中缺失下述DNA構(gòu)建體,所述DNA構(gòu)建體包含與本發(fā)明啟動(dòng)子可操作連接的報(bào)告基因。步驟(e)稍后描述。這使得宿主細(xì)胞能夠直接用于制造目的蛋白質(zhì),而所述宿主細(xì)胞不包含報(bào)告基因和/或可選擇標(biāo)記基因。為了能夠缺失本發(fā)明的DNA構(gòu)建體,DNA構(gòu)建體優(yōu)選包含報(bào)告基因和DNA重復(fù)之間的雙向可選擇標(biāo)記。DNA重復(fù)允許通過內(nèi)染色體同源重組缺失DNA構(gòu)建體。該方法與EP 0635574所述的″MARKER-GENE FREE″方法類似。
對(duì)自主復(fù)制而言,載體可以還包含允許載體在所述宿主細(xì)胞中自主復(fù)制的復(fù)制起點(diǎn)。用于酵母宿主細(xì)胞的復(fù)制起點(diǎn)實(shí)例為2微米復(fù)制起點(diǎn)、ARS1、ARS4、ARS1和CEN3的組合,和ARS4和CEN6的組合。復(fù)制起點(diǎn)可以是具有下述突變的復(fù)制起點(diǎn),所述突變使宿主細(xì)胞中復(fù)制起點(diǎn)的功能對(duì)于溫度敏感(參閱例如Ehrlich,1978,Proceedings of the NationalAcademy of Sciences USA 751433)。
可將多于一個(gè)拷貝的本發(fā)明DNA構(gòu)建體插入宿主細(xì)胞中。這可通過優(yōu)選將數(shù)拷貝DNA序列整合進(jìn)其基因組中,更優(yōu)選通過將DNA序列的整合靶向高表達(dá)基因座(優(yōu)選葡萄糖淀粉酶基因座或SEQ ID NO25、SEQID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29的基因座)中完成?;蛘哌@可通過在核酸序列中包含可擴(kuò)增的可選擇標(biāo)記基因,使細(xì)胞含有經(jīng)擴(kuò)增的拷貝的可選擇標(biāo)記基因,并從而可通過例如在存在適當(dāng)可選擇劑時(shí)培養(yǎng)細(xì)胞用于選擇額外拷貝的核酸序列。為了進(jìn)一步提高要過表達(dá)的DNA序列的拷貝數(shù),可使用如WO98/46772中所述的基因轉(zhuǎn)換技術(shù)。
用于連接上述元件以構(gòu)建本發(fā)明重組表達(dá)載體的方法為本領(lǐng)域技術(shù)人員公知(參閱例如Sambrook et al.,1989,上文)。
宿主細(xì)胞 本發(fā)明還涉及用上一部分定義的DNA構(gòu)建體轉(zhuǎn)化的重組宿主細(xì)胞,所述DNA構(gòu)建體包含與報(bào)告基因可操作連接的本發(fā)明的啟動(dòng)子DNA序列。優(yōu)選地,經(jīng)轉(zhuǎn)化的宿主細(xì)胞還包含包含下述DNA序列的額外的DNA構(gòu)建體,所述DNA序列包含來自下述生物DNA文庫的編碼序列,所述生物可能能夠制造一種或多種具有目的特性的蛋白質(zhì)。
這類細(xì)胞可有利地用于下一部分中描述的表達(dá)克隆方法中。包含與報(bào)告基因可操作連接的本發(fā)明啟動(dòng)子DNA序列的表達(dá)載體被引入宿主細(xì)胞。再用包含下述DNA序列的DNA構(gòu)建體或表達(dá)載體轉(zhuǎn)化宿主細(xì)胞,所述DNA序列包含來自DNA文庫的編碼序列。如先前所述,DNA構(gòu)建體或表達(dá)載體均作為染色體整合體或作為自我復(fù)制染色體外載體。宿主細(xì)胞的選擇在很大程度上取決于其中制造了DNA文庫的生物和/或取決于所使用的啟動(dòng)子DNA序列的來源。
宿主細(xì)胞可以是任何微生物。優(yōu)選地,宿主細(xì)胞與制備DNA文庫的宿主細(xì)胞相同,和/或與如說明書中早先定義的本發(fā)明啟動(dòng)子來源的宿主細(xì)胞為相同生物。根據(jù)一種優(yōu)選的實(shí)施方案,宿主細(xì)胞為原核生物或真核生物。根據(jù)一種更優(yōu)選的實(shí)施方案,適用于本發(fā)明方法的宿主細(xì)胞為原核生物,更優(yōu)選地,在啟動(dòng)子部分定義為啟動(dòng)子來源的原核生物。更優(yōu)選地,原核宿主細(xì)胞為Bacillus宿主細(xì)胞,優(yōu)選地,Bacillus Subtilis、Bacilluslicheniformis和/或Bacillus amyloliquefaciens種。
根據(jù)另一更優(yōu)選的實(shí)施方案,適用于本發(fā)明方法的宿主細(xì)胞為真菌。
宿主細(xì)胞可以是野生型絲狀真菌宿主細(xì)胞或變體、突變體或經(jīng)遺傳修飾的絲狀真菌宿主細(xì)胞。在本發(fā)明優(yōu)選的實(shí)施方案中,宿主細(xì)胞為蛋白酶缺陷或蛋白酶負(fù)型菌株。這可以是稱為“alp”的堿性蛋白酶基因被缺失的蛋白酶缺陷菌株Aspergillus oryzae JaL 125(描述于WO 97/35956或EP429490)或公開于WO 96/14404中的A.niger三肽基氨基肽酶(TRAP)缺陷菌株。另外,根據(jù)本發(fā)明也考慮WO 01/68864中描述的轉(zhuǎn)錄激活子(prtT)產(chǎn)生減少的宿主細(xì)胞。另一特別考慮的宿主菌株為Aspergillus oryzaeBECh2,其中出現(xiàn)在親本菌株IF04177中的三個(gè)TAKA淀粉酶基因被滅活。另外,兩個(gè)蛋白酶(堿性蛋白酶和中性金屬蛋白酶11)通過基因破壞被破壞。通過突變破壞了形成代謝產(chǎn)物環(huán)并偶氮酸和曲酸的能力。BECh2描述于WO 00/39322并來自JaL228(描述于WO 98/12300),所述JaL228也是US 5,766,912中公開為A1560的IF04177的突變體。
任選地,絲狀真菌宿主細(xì)胞與野生型細(xì)胞相比包含提高的解折疊蛋白應(yīng)答(UPR)以增強(qiáng)目的多肽的生產(chǎn)能力。UPR可通過US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2和/或WO2005/123763中描述的技術(shù)提高。更具體地,HAC1和/或IRE1和/或PTC2的蛋白質(zhì)水平被調(diào)節(jié),和/或SEC61蛋白質(zhì)被設(shè)計(jì)從而獲得具有提高的UPR的宿主細(xì)胞。
或者,或與提高的UPR一起,宿主細(xì)胞可通常被遺傳修飾以獲得下述表型,所述表型與野生型細(xì)胞相比顯示更低的蛋白酶表達(dá)和/或蛋白酶分泌,從而增強(qiáng)目的多肽的制造能力。這類表型可通過缺失和/或修飾和/或滅活蛋白酶表達(dá)的轉(zhuǎn)錄調(diào)節(jié)子獲得。這類轉(zhuǎn)錄調(diào)節(jié)子為例如prtT。通過調(diào)節(jié)prtT降低蛋白酶的表達(dá)可通過US2004/0191864A1和EP2005/055145中所述技術(shù)進(jìn)行。
或者,或與提高的UPR和/或顯示更低蛋白酶表達(dá)和/或蛋白酶分泌的表型一起,宿主細(xì)胞顯示草酸鹽缺陷表型,從而增強(qiáng)目的多肽的制造量。草酸鹽缺陷表型可通過WO2004/070022A2和WO2000/50576中描述的技術(shù)獲得。
或者,或與提高的UPR和/或顯示更低蛋白酶表達(dá)和/或蛋白酶分泌和/或草酸鹽缺陷的表型一起,宿主細(xì)胞顯示與野生型細(xì)胞相比表型差異的組合,從而提高目的多肽的制造量。這些差異可包括,但不僅限于降低的葡萄糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B、α-1、6轉(zhuǎn)葡萄糖基酶、蛋白酶和草酸水解酶的表達(dá)。所述由宿主細(xì)胞顯示的表型差異可根據(jù)US2004/0191864A1中所述技術(shù)通過遺傳修飾獲得。
或者,或與上述表型組合,核酸構(gòu)建體通過同源重組靶向整合進(jìn)入宿主細(xì)胞基因組(即整合進(jìn)預(yù)先確定的靶位點(diǎn))的效率優(yōu)選通過宿主細(xì)胞的增強(qiáng)的同源重組能力提高。細(xì)胞的這類表型優(yōu)選涉及WO2005/095624中描述的缺陷hdfA或hdfB基因。WO2005/095624公開了獲得具有提高的靶向整合能力的絲狀真菌細(xì)胞的優(yōu)選方法。
更優(yōu)選地,本發(fā)明的宿主細(xì)胞選自以下列表Bacillus、酵母和絲狀真菌,優(yōu)選Aspergillus、Penicillium或Trichoderma種。進(jìn)一步更優(yōu)選Aspergillus宿主細(xì)胞為Aspergillus niger或Aspergillus sojae或Aspergillusoryzae種。
本發(fā)明還涉及重組的宿主細(xì)胞,所述宿主細(xì)胞包含多于一個(gè)本發(fā)明的啟動(dòng)子DNA序列,各啟動(dòng)子與一個(gè)報(bào)告基因可操作連接。這類宿主細(xì)胞可有利地用于下一部分種所述的表達(dá)克隆方法中??赏ㄟ^多種方法轉(zhuǎn)化細(xì)菌細(xì)胞,包括化學(xué)誘導(dǎo)的感受態(tài)(例如CaCl2)或電穿孔(Sambrook et al.(1989)″Molecular Cloninga laboratory manual″,Cold Spring HarborLaboratories,Cold Spring Harbor,New York)、原生質(zhì)體轉(zhuǎn)化(Chang andCohen(1979)Mol Gen Genet 168111)以及,在一些Bacillus種的情況下為天然感受態(tài)(Spizizen(1958)Proc Natl Acad Sci USA 441072)??赏ㄟ^下述方法轉(zhuǎn)化真菌細(xì)胞,所述方法涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和以本身已知的方式再生細(xì)胞壁。用于轉(zhuǎn)化Aspergillus宿主細(xì)胞的合適方法描述于EP 238 023和Yelton et al.,1984,Proceedings of the National Academyof Sciences USA 811470-1474。使用Agrobacterium tumefaciens轉(zhuǎn)化Aspergillus和其它絲狀真菌宿主細(xì)胞的合適方法描述于例如Nat Biotechnol.1998 Sep;16(9)839-42.Erratum inNat Biotechnol 1998 Nov;16(11)1074.Agrobacterium tumefaciens-mediated transformation of filamentous fungi,deGroot MJ,Bundock P,Hooykaas PJ,Beijersbergen AG.Unilever ResearchLaboratory Vlaardingen,The Netherlands。用于轉(zhuǎn)化Fusarium種的合適方法描述于Malardier et al.,1989,Gene 78147-156和WO 96/00787??墒褂肂ecker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide toYeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;lto et al.,1983,Journal ofBacteriology 153163;和Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 751920中描述的方法轉(zhuǎn)化酵母。原核生物的轉(zhuǎn)化可如EP 284 126A中所述進(jìn)行。
表達(dá)克隆方法 根據(jù)另一方面,本發(fā)明提供用于在宿主細(xì)胞中分離包含下述DNA序列的DNA序列的方法,所述DNA序列編碼目的蛋白質(zhì),所述方法包含步驟 (a)制備第一DNA構(gòu)建體,其包含與賦予可選擇性狀的報(bào)告基因可操作連接的啟動(dòng)子DNA序列;當(dāng)所述DNA構(gòu)建體存在于宿主細(xì)胞中和當(dāng)宿主細(xì)胞產(chǎn)生目的蛋白質(zhì)(優(yōu)選地,被分泌的目的蛋白質(zhì))時(shí),所述啟動(dòng)子DNA序列被誘導(dǎo); (b)制備第二DNA構(gòu)建體,其包含包含下述DNA序列的DNA序列,所述DNA序列編碼來自下述生物DNA文庫的目的蛋白質(zhì),所述生物被懷疑能夠制造一種或多種目的蛋白質(zhì); (c)用(a)和(b)中制備的兩種DNA構(gòu)建體轉(zhuǎn)化宿主細(xì)胞; (d)在有助于制造DNA文庫中存在的目的蛋白質(zhì)的條件下,培養(yǎng)(c)中獲得的所有經(jīng)轉(zhuǎn)化的宿主細(xì)胞;和 (e)通過分析在(d)中制造的蛋白質(zhì),篩選制造目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細(xì)胞。
步驟(a) 制備第一DNA構(gòu)建體,其包含與賦予可選擇性狀的報(bào)告基因可操作連接的啟動(dòng)子DNA序列;當(dāng)所述DNA構(gòu)建體存在于宿主細(xì)胞中和當(dāng)宿主細(xì)胞產(chǎn)生目的蛋白質(zhì)(優(yōu)選地,被分泌的目的蛋白質(zhì))時(shí),所述啟動(dòng)子DNA序列被誘導(dǎo)。
第一DNA構(gòu)建體中存在的啟動(dòng)子為當(dāng)宿主細(xì)胞產(chǎn)生目的蛋白質(zhì)(優(yōu)選被分泌當(dāng)目的蛋白質(zhì))時(shí)被誘導(dǎo)的啟動(dòng)子。
在本發(fā)明中,術(shù)語“被誘導(dǎo)的”定義為在相同培養(yǎng)條件下,與相應(yīng)對(duì)照宿主細(xì)胞不(過量)產(chǎn)生目的蛋白質(zhì)時(shí)的啟動(dòng)子活性相比,當(dāng)宿主細(xì)胞(過量)產(chǎn)生(優(yōu)選分泌)目的蛋白質(zhì)時(shí),本發(fā)明啟動(dòng)子的啟動(dòng)子活性提高。優(yōu)選地,當(dāng)宿主細(xì)胞中(過量)產(chǎn)生(優(yōu)選分泌)目的蛋白質(zhì)時(shí),與相同培養(yǎng)條件下其中不(過量)產(chǎn)生目的蛋白質(zhì)的相應(yīng)對(duì)照宿主細(xì)胞相比,啟動(dòng)子活性提高至少約1.5倍,更優(yōu)選至少約兩倍,更優(yōu)選至少約三倍,更優(yōu)選至少約四倍,更優(yōu)選至少約五倍,進(jìn)一步更優(yōu)選至少約六倍,進(jìn)一步更優(yōu)選至少約八倍,進(jìn)一步更優(yōu)選至少約十倍,進(jìn)一步更優(yōu)選至少約二十倍,進(jìn)一步更優(yōu)選至少約50倍,以及最優(yōu)選至少約100倍。更優(yōu)選地,啟動(dòng)子活性提高是無限的,即當(dāng)不(過量)產(chǎn)生目的蛋白質(zhì)時(shí),未檢測(cè)到啟動(dòng)子活性或啟動(dòng)子是無活性的,而當(dāng)(過量)產(chǎn)生目的蛋白質(zhì)時(shí),啟動(dòng)子被誘導(dǎo)。優(yōu)選如前所述確定啟動(dòng)子活性。最優(yōu)選使用Northern印跡通過mRNA分析確定啟動(dòng)子活性。
可通過將制造目的蛋白質(zhì)的細(xì)胞的基因表達(dá)譜與不制造所述蛋白質(zhì)的對(duì)照菌株的基因表達(dá)譜比較,鑒定這類啟動(dòng)子。優(yōu)選地,這類表達(dá)譜使用確立的DNA微陣列分析比較?;蛘呖墒褂眉夹g(shù)人員已知的其它方法(如Northern印跡或定量PCR分析)比較表達(dá)譜。比較表達(dá)譜的最優(yōu)選的方法如下進(jìn)行首先通過DNA微陣列分析比較表達(dá)譜,然后通過Northern印跡隨后確證微陣列結(jié)果。根據(jù)優(yōu)選的實(shí)施方案,啟動(dòng)子為啟動(dòng)子部分描述的本發(fā)明的啟動(dòng)子DNA序列。
根據(jù)另一優(yōu)選的實(shí)施方案,當(dāng)宿主細(xì)胞為Bacillus細(xì)胞時(shí),啟動(dòng)子來自下列基因組DNA序列htrA(SEQ ID NO1)或htrB(SEQ ID NO2)。優(yōu)選啟動(dòng)子DNA序列來自位于起始密碼子上游的這些基因組DNA序列之一的非編碼部分,或?yàn)槲挥谏嫌蔚乃龌蚪M序列的部分。更優(yōu)選所使用的啟動(dòng)子為SEQ ID NO1或SEQ ID NO2的DNA序列。
根據(jù)另一優(yōu)選的實(shí)施方案,當(dāng)宿主細(xì)胞為絲狀真菌細(xì)胞時(shí),啟動(dòng)子來自下列基因組DNA序列SEQ ID NO20、SEQ NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。優(yōu)選地,啟動(dòng)子DNA序列來自位于起始密碼子上游的這些基因組DNA序列之一的非編碼部分,或?yàn)槲挥谏嫌蔚乃龌蚪M序列的部分。更優(yōu)選地,所使用的啟動(dòng)子為SEQ IDNO15、SEQ NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的DNA序列或其衍生物。
步驟(a)中制備的第一DNA構(gòu)建體已經(jīng)在相應(yīng)的“DNA構(gòu)建體”部分中描述,優(yōu)選地,其包含如“DNA構(gòu)建體”部分所述賦予可選擇性狀的報(bào)告基因。
步驟(b) 步驟(b)中制備的DNA構(gòu)建體包含包含下述DNA序列的DNA序列,所述DNA序列編碼來自下述生物DNA文庫的目的蛋白質(zhì),所述生物被懷疑能夠制造一種或多種目的蛋白質(zhì);可能制造一種或多種目的蛋白質(zhì)的生物為原核生物或真核生物。優(yōu)選的原核生物和真核生物的實(shí)例早先已在說明書中與本發(fā)明啟動(dòng)子的來源一起定義。根據(jù)另一優(yōu)選的實(shí)施方案,該生物為Bacillus,更優(yōu)選地,在啟動(dòng)子部分定義的Bacillus物種。根據(jù)另一優(yōu)選的實(shí)施方案,該生物為真核生物,更優(yōu)選為真菌,其中最優(yōu)選絲狀真菌。
在步驟(b)中制備的DNA構(gòu)建體,優(yōu)選包含如“DNA構(gòu)建體”和“調(diào)控元件”部分中定義的調(diào)節(jié)序列。
在根據(jù)本發(fā)明的方法中,來自可能制造一種或多種目的蛋白質(zhì)的DNA片段文庫可以是基因組文庫或cDNA文庫。然而,在真核供體的情況下,優(yōu)選使用cDNA文庫以避免真菌宿主生物中啟動(dòng)子或剪接信號(hào)識(shí)別的問題。優(yōu)選從分離自來源生物的mRNA中制備cDNA文庫,所述來源生物在有助于目的蛋白質(zhì)表達(dá)的條件下生長(zhǎng)。
如果存在在宿主細(xì)胞表達(dá)蛋白質(zhì)后可用于檢測(cè)所述蛋白質(zhì)的測(cè)定法,那么根據(jù)本發(fā)明的方法可應(yīng)用于分離編碼任何目的蛋白質(zhì)或多肽的DNA序列。
步驟(c) 要用兩種DNA構(gòu)建體轉(zhuǎn)化的宿主細(xì)胞的身份已描述于“宿主細(xì)胞”部分中。轉(zhuǎn)化方法已在相同部分中描述。根據(jù)一個(gè)實(shí)施方案,用(a)和(b)中制備的構(gòu)建體同時(shí)轉(zhuǎn)化宿主細(xì)胞。或者,并根據(jù)另一實(shí)施方案,先用步驟(a)制備的DNA構(gòu)建體轉(zhuǎn)化宿主細(xì)胞,然后用用步驟(b)制備的DNA構(gòu)建體轉(zhuǎn)化宿主細(xì)胞。
根據(jù)優(yōu)選的實(shí)施方案,宿主細(xì)胞為原核生物,優(yōu)選Bacillus細(xì)胞,更優(yōu)選為Bacillus subtilis,進(jìn)一步更優(yōu)選為htrA基因缺陷的Bacillus subtilis(其中htrA基因的至少部分編碼區(qū)被缺失和/或取代和/或其中htrA基因的編碼區(qū)仍然存在于所述Bacillus細(xì)胞的基因組中),最優(yōu)選使用Bacillussubtilis BV2003(Hyyrylainen et al.(2001)MoI Microbiol 411159)。
或者,或與先前優(yōu)選的實(shí)施方案結(jié)合,宿主細(xì)胞為Bacillus細(xì)胞,且報(bào)告基因編碼如DNA構(gòu)建體部分定義的熒光報(bào)告蛋白,最優(yōu)選GFP。
或者,或與先前優(yōu)選的實(shí)施方案結(jié)合,當(dāng)宿主細(xì)胞為Bacillus細(xì)胞時(shí),啟動(dòng)子來自以下列表所述基因組DNA序列htrA(SEQ ID NO1)或htrB(SEQ ID NO2)。優(yōu)選地,啟動(dòng)子DNA序列來自位于起始密碼子上游的這兩個(gè)基因組DNA序列之一的非編碼部分,或?yàn)槲挥谏嫌蔚乃鲂蛄械牟糠?。更?yōu)選地,所使用的啟動(dòng)子為來自SEQ ID NO1或SEQ ID NO2的啟動(dòng)子。根據(jù)最優(yōu)選的實(shí)施方案,所使用的啟動(dòng)子和所使用的報(bào)告基因?yàn)榕cSEQ ID NO1可操作連接的GFP,或與SEQ ID NO2可操作連接的GFP。
根據(jù)另一優(yōu)選的實(shí)施方案,所述生物為真核生物,更優(yōu)選真菌,其中最優(yōu)選絲狀真菌。優(yōu)選絲狀真菌為Aspergillus、Penicillium或Trichoderma種。進(jìn)一步更優(yōu)選Aspergillus宿主細(xì)胞為Aspergillus niger或Aspergillussojae或Aspergillus oryzae種。最優(yōu)選的宿主細(xì)胞為A.niger,優(yōu)選CBS513.88或其衍生物。
或者,或與先前優(yōu)選的實(shí)施方案結(jié)合,宿主細(xì)胞為絲狀真菌細(xì)胞,報(bào)告基因編碼如DNA構(gòu)建體部分所定義的熒光報(bào)告蛋白,最優(yōu)選GFP。或者報(bào)告基因編碼可選擇標(biāo)記。更優(yōu)選地,報(bào)告基因?yàn)闊晒獾鞍缀涂蛇x擇標(biāo)記物的雜交報(bào)告基因。最優(yōu)選雜交報(bào)告基因包含GFP和Streptoalloteichushindustanis的腐草霉素抗性基因(BLE)(Drocourt etal.,NAR,1990)。
或者,或與先前優(yōu)選的實(shí)施方案結(jié)合,當(dāng)宿主細(xì)胞為絲狀真菌細(xì)胞時(shí),啟動(dòng)子來自以下列表中存在的基因組DNA序列SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。優(yōu)選啟動(dòng)子序列來自位于起始密碼子上游的所列基因組DNA序列之一的非編碼部分,或?yàn)槲挥谏嫌蔚牟糠炙鲂蛄?。更?yōu)選地,所使用的啟動(dòng)子為實(shí)施例3到7中所使用的啟動(dòng)子之一,并來自SEQ ID NO20、SEQ IDNO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。根據(jù)最優(yōu)選的實(shí)施方案,所使用的啟動(dòng)子和所用的雜交報(bào)告基因?yàn)榕c啟動(dòng)子SEQ ID NO15可操作連接的GFP-BLE(SEQ ID NO61)、與啟動(dòng)子SEQ ID NO16可操作連接的GFP-BLE、與SEQ ID NO17可操作連接的GFP-BLE、與啟動(dòng)子SEQ ID NO18可操作連接的GFP-BLE或與啟動(dòng)子SEQ ID NO19可操作連接的GFP-BLE。
步驟(d) 用兩種DNA構(gòu)建體轉(zhuǎn)化宿主細(xì)胞后,在有助于制造DNA文庫中存在的目的蛋白質(zhì)的條件下,培養(yǎng)所有獲得的經(jīng)轉(zhuǎn)化的宿主細(xì)胞。根據(jù)檢測(cè)目的蛋白質(zhì)所需的測(cè)試法,將經(jīng)轉(zhuǎn)化的克隆傳代并儲(chǔ)存為固體培養(yǎng)基(例如瓊脂平板)上或液體培養(yǎng)基中的菌落,由此在微孔滴定板的孔中培養(yǎng)、儲(chǔ)存和/或測(cè)試個(gè)體文庫克隆。
技術(shù)人員會(huì)理解通常對(duì)本領(lǐng)域已知克隆方法的適應(yīng)可同樣應(yīng)用于本發(fā)明的方法中。所述適應(yīng)包括但不僅限于例如篩選文庫克隆池、篩選相同文庫得到大量不同的目的蛋白質(zhì),以及再篩選、再分離和再克隆陽性克隆以確保更精確的結(jié)果。
技術(shù)人員可獲得多種方法用于從篩選方法中鑒定為經(jīng)轉(zhuǎn)化的宿主細(xì)胞中分離編碼目的蛋白質(zhì)的DNA序列,和用于隨后分析所分離的DNA序列。
步驟(e) 在步驟(d)之后,通過分析制造的蛋白質(zhì)篩選經(jīng)轉(zhuǎn)化的宿主細(xì)胞用于制造目的蛋白質(zhì),優(yōu)選地,分泌目的蛋白質(zhì)。在步驟(e)中,通過監(jiān)測(cè)由第一DNA構(gòu)建體中存在的啟動(dòng)子DNA序列誘導(dǎo)的依賴于制造(優(yōu)選依賴于分泌)的報(bào)告子表達(dá),篩選制造(優(yōu)選分泌)目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細(xì)胞。
根據(jù)優(yōu)選的實(shí)施方案,當(dāng)宿主細(xì)胞為Bacillus細(xì)胞時(shí),優(yōu)選使用基于熒光的細(xì)胞分析測(cè)定法(例如熒光激活的細(xì)胞掃描、熒光激活的細(xì)胞分選(FACS)或熒光分析)進(jìn)行篩選,以鑒定制造(優(yōu)選分泌)目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細(xì)胞,所述篩選通過監(jiān)測(cè)由第一DNA構(gòu)建體中存在的啟動(dòng)子DNA序列誘導(dǎo)的依賴于制造(優(yōu)選地,依賴于分泌)的報(bào)告子表達(dá)。更優(yōu)選宿主細(xì)胞為包含第一DNA構(gòu)建體的Bacillus細(xì)胞,所述DNA構(gòu)建體包含如SEQ ID NO1或其衍生物或SEQ ID NO2或其衍生物的啟動(dòng)子,所述DNA構(gòu)建體還包含編碼熒光報(bào)告子的報(bào)告基因,并且篩選使用基于熒光的細(xì)胞分析測(cè)定法進(jìn)行。進(jìn)一步更優(yōu)選地,宿主細(xì)胞為Bacillus且第一DNA構(gòu)建體包含 -與GFP可操作連接的啟動(dòng)子DNA序列SEQ ID NO1或其衍生物,或 -與GFP可操作連接的啟動(dòng)子DNA序列SEQ ID NO2或其衍生物 且篩選使用FACS進(jìn)行?;蛘?,或與先前的實(shí)施方案結(jié)合,篩選可使用例如比色測(cè)定法或使用選擇性培養(yǎng)條件進(jìn)行。技術(shù)人員會(huì)理解,根據(jù)所使用的報(bào)告基因,選擇性培養(yǎng)條件是但不僅限于殺生物劑的使用、抗生素的使用、至少一種營(yíng)養(yǎng)、原養(yǎng)型。
根據(jù)另一優(yōu)選的實(shí)施方案,當(dāng)宿主細(xì)胞為絲狀真菌細(xì)胞時(shí),優(yōu)選通過在選擇性培養(yǎng)條件下進(jìn)行篩選,以鑒定制造(優(yōu)選分泌)目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細(xì)胞,所述篩選通過監(jiān)測(cè)由本發(fā)明第一DNA構(gòu)建體中存在的啟動(dòng)子DNA序列誘導(dǎo)的依賴于制造(優(yōu)選依賴于分泌)的報(bào)告子表達(dá)。技術(shù)人員會(huì)理解基于所使用的報(bào)告基因,可相應(yīng)選擇選擇性培養(yǎng)條件。選擇性培養(yǎng)條件的實(shí)例是但不僅限于使用殺生物劑、使用抗生素、至少一種營(yíng)養(yǎng)、原養(yǎng)型。或者,或與先前實(shí)施方案結(jié)合,篩選可使用比色、熒光的(如FACS)或基于酶活性的測(cè)定法進(jìn)行。根據(jù)更優(yōu)選的實(shí)施方案,宿主細(xì)胞為包含本發(fā)明第一DNA構(gòu)建體的絲狀真菌細(xì)胞,且篩選使用選擇性培養(yǎng)條件進(jìn)行。更優(yōu)選地,宿主細(xì)胞為包含本發(fā)明第一DNA構(gòu)建體的絲狀真菌細(xì)胞時(shí),所述DNA構(gòu)建體包含選自下列的啟動(dòng)子SEQ IDNO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA構(gòu)建體還包含編碼可選擇標(biāo)記的報(bào)告基因,且篩選使用選擇性培養(yǎng)條件進(jìn)行。進(jìn)一步更優(yōu)選地,宿主細(xì)胞為包含本發(fā)明第一DNA構(gòu)建體的絲狀真菌細(xì)胞,所述DNA構(gòu)建體包含選自下列的啟動(dòng)子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ IDNO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA構(gòu)建體還包含雜交報(bào)告基因如SEQ ID NO61,且篩選使用選擇性培養(yǎng)條件進(jìn)行。
根據(jù)另一更優(yōu)選的實(shí)施方案,宿主細(xì)胞為包含本發(fā)明第一DNA構(gòu)建體的A.niger細(xì)胞,且篩選使用選擇性培養(yǎng)條件進(jìn)行。更優(yōu)選地,宿主細(xì)胞為包含本發(fā)明第一DNA構(gòu)建體的A.niger細(xì)胞,所述DNA構(gòu)建體包含選自下列的啟動(dòng)子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ IDNO19或其衍生物,所述DNA構(gòu)建體還包含編碼可選擇標(biāo)記的報(bào)告子基因,且篩選使用選擇性培養(yǎng)條件進(jìn)行。進(jìn)一步更優(yōu)選地,宿主細(xì)胞為包含本發(fā)明第一DNA構(gòu)建體的A.niger細(xì)胞,所述DNA構(gòu)建體包含選自下列的啟動(dòng)子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA構(gòu)建體還包含雜交報(bào)告基因如SEQ ID NO61,且篩選使用選擇性培養(yǎng)條件進(jìn)行。進(jìn)一步更優(yōu)選地,宿主細(xì)胞為A.niger細(xì)胞且第一DNA構(gòu)建體包含 -與啟動(dòng)子SEQ ID NO15可操作連接的雜交報(bào)告基因GFP-BLE(SEQID NO61),或 -與啟動(dòng)子SEQ ID NO16或其衍生物可操作連接的GFP-BLE,或 -與啟動(dòng)子SEQ ID NO17或其衍生物可操作連接的GFP-BLE,或 -與啟動(dòng)子SEQ ID NO18或其衍生物可操作連接的GFP-BLE,或 -與啟動(dòng)子SEQ ID NO19或其衍生物可操作連接的GFP-BLE,且篩選使用包含抗生素(優(yōu)選腐草霉素)作為選擇劑的選擇性培養(yǎng)條件進(jìn)行。
通過如上所述本發(fā)明的篩選方法分離的DNA序列用于制造目的蛋白質(zhì)或改善目的蛋白質(zhì)的制造,所述目的蛋白質(zhì)由DNA序列編碼。有利地,在上述篩選方法中分離的經(jīng)轉(zhuǎn)化的宿主細(xì)胞直接用于制造目的蛋白質(zhì)的方法中,所述方法通過在有助于制造(優(yōu)選分泌)目的蛋白質(zhì)的條件下培養(yǎng)經(jīng)轉(zhuǎn)化的宿主細(xì)胞并可選地回收蛋白質(zhì)。
根據(jù)一種優(yōu)選的實(shí)施方案,宿主細(xì)胞能夠直接用于制造目的蛋白質(zhì),所述宿主細(xì)胞不包含報(bào)告基因和/或可選擇標(biāo)記基因。因此,在細(xì)胞已被篩選用于制造(優(yōu)選分泌)目的蛋白質(zhì)后,從宿主細(xì)胞中缺失包含與本發(fā)明啟動(dòng)子可操作連接的報(bào)告基因的DNA構(gòu)建體。為了能夠缺失本發(fā)明的DNA構(gòu)建體,所述DNA構(gòu)建體優(yōu)選在DNA重復(fù)之間包含報(bào)告基因和雙向可選擇標(biāo)記基因。DNA重復(fù)允許通過內(nèi)染色體同源重組缺失DNA構(gòu)建體。該方法與EP 0 635 574B1所述的″MARKER-GENE FREE″方法類似。
在本發(fā)明篩選方法中分離的最初經(jīng)轉(zhuǎn)化的宿主細(xì)胞通常會(huì)具有足夠用于篩選目的,但是可為經(jīng)濟(jì)制造目的顯著改善的表達(dá)水平。為此,將DNA序列插入表達(dá)載體中,其隨后用于轉(zhuǎn)化合適的宿主細(xì)胞。在該表達(dá)載體中,DNA序列與適當(dāng)?shù)谋磉_(dá)信號(hào)(如啟動(dòng)子、可選的信號(hào)序列和終止子)可操作連接,如“DNA構(gòu)建體”和“調(diào)控元件”部分中所定義,所述表達(dá)信號(hào)能夠指導(dǎo)蛋白質(zhì)在宿主生物中的表達(dá)。用于制造蛋白質(zhì)的合適宿主細(xì)胞可以是原核或真核細(xì)胞,優(yōu)選真細(xì)菌、酵母或絲狀真菌。優(yōu)選的細(xì)菌宿主細(xì)胞選自如啟動(dòng)子部分定義的Bacillus屬。根據(jù)另一優(yōu)選的實(shí)施方案,宿主細(xì)胞為已在“宿主細(xì)胞”部分中定義的酵母或絲狀真菌。優(yōu)選的酵母宿主細(xì)胞選自Saccharomyces、Kluyveromyces、Yarrowia、Pichia和Hansenula屬。優(yōu)選的絲狀真菌宿主細(xì)胞選自在上文列為用于篩選方法的優(yōu)選宿主細(xì)胞的相同屬。更優(yōu)選地,絲狀真菌為Aspergillus、Penicillium或Trichoderma種。進(jìn)一步更優(yōu)選地,Aspergillus宿主細(xì)胞為Aspergillusniger或Aspergillus sojae或Aspergillus oryzae種。最優(yōu)選的宿主細(xì)胞為A.niger,優(yōu)選CBS513.88或其衍生物。
通過技術(shù)人員可獲得的多種流程中的任何流程,用表達(dá)載體轉(zhuǎn)化合適的宿主細(xì)胞。然后將經(jīng)轉(zhuǎn)化的宿主細(xì)胞用于下述方法,所述方法通過在有助于表達(dá)編碼蛋白質(zhì)的DNA序列的條件下培養(yǎng)經(jīng)轉(zhuǎn)化的宿主細(xì)胞來制造目的蛋白質(zhì),并可選地回收蛋白質(zhì)。
優(yōu)選目的蛋白質(zhì)為酶。
因此,本發(fā)明涉及本發(fā)明啟動(dòng)子在表達(dá)克隆方法中的用途。
本發(fā)明還涉及本發(fā)明啟動(dòng)子的其它用途。優(yōu)選地,本發(fā)明啟動(dòng)子可DNA構(gòu)建體或表達(dá)載體(均在前一部分中定義)中與任何編碼序列可操作連接。這類DNA構(gòu)建體或表達(dá)載體可被引入在“宿主細(xì)胞”部分中定義的任何宿主細(xì)胞中,并用于表達(dá)給定的有價(jià)值化合物。這類有價(jià)值化合物的實(shí)例為,但不僅限于代謝物或多肽。優(yōu)選地,與本發(fā)明啟動(dòng)子可操作連接的編碼序列編碼有價(jià)值的化合物?;蛘撸⒏鶕?jù)本發(fā)明另一優(yōu)選的實(shí)施方案,與本發(fā)明啟動(dòng)子可操作連接的編碼序列涉及有價(jià)值化合物的制造。
或者,并根據(jù)本發(fā)明啟動(dòng)子另一優(yōu)選的用途,本發(fā)明的啟動(dòng)子被整合進(jìn)滅活或取代構(gòu)建體中,轉(zhuǎn)化進(jìn)給定宿主細(xì)胞中,并用于滅活或取代靶基因。
本發(fā)明由以下實(shí)施例進(jìn)一步說明。
實(shí)施例 材料和方法 一般程序 標(biāo)準(zhǔn)分子克隆技術(shù),如DNA分離、凝膠電泳、核酸的限制性酶修飾、Northern分析、E.coli轉(zhuǎn)化等,如Sambrook et al.(2001)″MolecularCloninga laboratory manual,3d edition″,Cold Spring Harbor Laboratories,Cold Spring Harbor,New York and lnnis et al.(1990)″PCR protocols,a guideto methods and applications″Academic Press,San Diego所述進(jìn)行。合成的寡脫氧核苷酸得自Invitrogen(Breda,The Netherlands)。室溫為20℃±2℃。
Aspergillus niger轉(zhuǎn)化 A.niger轉(zhuǎn)化根據(jù)Tilburn,J.et al.(1983)Gene 26,205-221和Kelly,J.&Hynes,M.(1985)EMBO J.,4,475-479所述方法進(jìn)行,其中采用以下改變 使孢子發(fā)芽并在置于300rpm搖床中的搖瓶中Aspergillus最小培養(yǎng)基(100ml)中在30℃下培養(yǎng)16小時(shí)。每升Aspergillus最小培養(yǎng)基含有6gNaNO3、0.52g KCl、1.52g KH2PO4、1.12ml 4M KOH、0.52gMgSO4.7H2O、10g葡萄糖、1g酪蛋白氨基酸、22mg ZnSO4.7H2O、11mg H3BO3、5mg FeSO4.7H2O、1.7mg CoCl2.6H2O、1.6mg CuSO4.5H2O、5mg MnCl2.2H2O、1.5mg Na2MoO4.2H2O、50mg EDTA、2mg核黃素、2mg硫胺-HCl、2mg煙酰胺、1mg吡哆醇-HCL、0.2mg panthotenic acid、4g生物素、10ml青霉素(5000IU/ml)鏈霉素(5000UG/ml)溶液(Gibco)。
-用Novozym 234TM(Novo Industries)代替解螺旋酶用于制備原生質(zhì)體; -形成原生質(zhì)體后(60-90分鐘),加入KC緩沖液(0.8M KCl、9.5mM檸檬酸,pH 6.2)至45ml的終體積,在浮桶式轉(zhuǎn)頭離心機(jī)中在4℃下3000rpm將原生質(zhì)體懸浮液離心10分鐘。原生質(zhì)體重懸于20ml KC緩沖液中并隨后加入25ml STC緩沖液(1.2M山梨糖、10mM Tris-HCI pH7.5,50mM CaCl2)。在浮桶式轉(zhuǎn)頭離心機(jī)中在4℃下3000rpm將原生質(zhì)體懸浮液離心10分鐘,在STC緩沖液中洗滌并在STC緩沖液中重懸為10E8原生質(zhì)體/ml的濃度; -向200微升原生質(zhì)體懸浮液中加入溶解在10微升TE緩沖液(10mMTris-HCI pH 7.5,0.1mM EDTA)和100微升PEG溶液(20%PEG 4000(Merck),0.8M山梨醇,10mM Tris-HCl pH 7.5,50mM CaCl2)中的DNA片段; -在室溫下將DNA-原生質(zhì)體懸浮液孵育10分鐘后,緩慢加入1.5mlPEG溶液(60%PEG 4000(Merck),10mM Tris-HCl pH 7.5,50mM CaCl2)并重復(fù)混勻管。在室溫下孵育20分鐘后,用5ml 1.2M山梨醇稀釋懸浮液,顛倒混勻并在室溫下4000rpm離心10分鐘。將原生質(zhì)體柔和地重懸于1ml 1.2M山梨醇中并涂布在固體選擇性培養(yǎng)基上,所述培養(yǎng)基由不含核黃素、硫胺-HCl、煙酰胺、吡哆醇、panthotenic acid、生物素、酪蛋白氨基酸和葡萄糖的Aspergillus最小培養(yǎng)基組成。對(duì)乙酰胺選擇而言,培養(yǎng)基含有10mM乙酰胺作為唯一氮源和1M蔗糖作為滲壓劑和C源。或者將原生質(zhì)體涂布于添加有1-50微克/ml腐草霉素和1M蔗糖作為滲壓劑的PDA(馬鈴薯葡萄糖瓊脂,Oxoid)上。使用20%瓊脂(瓊脂No.1,OxoidL1 1)固化再生平板。在30℃下孵育6-10天后,將轉(zhuǎn)化體的分生孢子轉(zhuǎn)移至由含2%葡萄糖和1.5%瓊脂糖(Invitrogen)的Aspergillus選擇性培養(yǎng)基(在乙酰胺選擇的情況下含有乙酰胺作為唯一氮源,或在腐草霉素選擇情況下為添加了1-50微克/ml腐草霉素的PDA)上,并在30℃下孵育5-10天。分離單個(gè)轉(zhuǎn)化體,并重復(fù)一次該選擇性純化步驟,藉此儲(chǔ)存經(jīng)純化的轉(zhuǎn)化體。
Aspergillus niger微量滴定板發(fā)酵和取樣 為了獲得A.niger的孢子,將菌絲體轉(zhuǎn)移至根據(jù)供應(yīng)商說明制備的填充有150微升固體PDA培養(yǎng)基(馬鈴薯葡萄糖瓊脂,Oxoid)的微量滴定板上。在30℃(靜止)生長(zhǎng)3-7天后形成孢子。然后向各孔中添加100微升液體發(fā)酵培養(yǎng)基(70g/l葡萄糖.H2O、25g/l蛋白胨(來自酪蛋白)、12.5g/l酵母提取物(Difco)、2g/l K2SO4、1g/l KH2PO4、0.5g/lMgSO4.7H2O、0.03g/l ZnCL2、0.02g/l CaCL2、9mg/l MnSO4-H2O、3mg/lFeSO4.7H2O,用4N H2SO4調(diào)至pH 5.6)。上下吸打液體培養(yǎng)基20次以分離培養(yǎng)基中的孢子。將接種過的發(fā)酵培養(yǎng)基轉(zhuǎn)移至另一微量滴定板并在34℃、550rpm和80%濕度下在軌道微量滴定板搖床(Infors HT)上孵育6天。在第6天收集上清液并用于檢測(cè)所分泌的蛋白質(zhì)。
質(zhì)譜法分析 將上清液通過離心力在Ultracel濾板(Millipore,Billerica,MA,USA)上超濾。超濾根據(jù)制造商提供的流程進(jìn)行。向經(jīng)超濾的上清液中添加10微升200mM的碳酸氫銨,pH7.8(Riedel-de Haen AG,Seelze,Germany)和1微升250微克每ml的胰蛋白酶(Worthington,Lakewood,NJ,USA)。將上清液在37℃消化3小時(shí)。經(jīng)消化的上清液以1∶1的比例與10毫克每ml的經(jīng)再結(jié)晶的α-氰-4-羥基苯丙烯酸(?CHCA)(Laser Bio Labs,Sophia-AntipolisCedex,F(xiàn)rance)溶液混合;從這些混合物中將1微升點(diǎn)在MALDI靶標(biāo)上。在vMALDI LTQ質(zhì)譜儀(Thermo electron,Orlando,F(xiàn)L,USA)上用MALDIMS和MALDI MS/MS分析被點(diǎn)的樣品。
所獲得的MS/MS譜被轉(zhuǎn)化為肽序列,與在預(yù)先推定的FASTA蛋白質(zhì)數(shù)據(jù)庫中可獲得的蛋白質(zhì)序列比較,以鑒定個(gè)體酶。
RNA分離 收集在培養(yǎng)皿中20ml液體選擇性再生培養(yǎng)基(6g/l NaNO3,0.52g/lKCl,1.52g/l KH2PO4,0.25g/l KOH,0.52g/l MgSO4.7H2O,22mg/lZnSO4.7H2O,11mg/l H3BO3,5mg/l FeSO4.7H2O,1.7mg/l CoCl2.6H2O,1.6mg/l CuSO4.5H2O,5mg/l MnCl2.2H2O,1.5mg/l Na2MoO4.2H2O,50mg/lEDTA,341g/l蔗糖,10ml青霉素(5000lU/ml)鏈霉素(5000UG/ml)溶液(Gibco))上形成的Aspergillus niger菌絲體,用軟化水洗滌并在紙巾之間擠壓去除多余的水。立刻將菌絲體在液氮中冷凍,并用研缽和研杵研磨成精細(xì)的粉末。將產(chǎn)生的粉末轉(zhuǎn)移至無菌的50ml管中并稱量,藉此對(duì)酶1-1.2g被研磨的菌絲體加入10ml TRIzol試劑(Invitrogen)(每管最多25ml)。立刻通過充分混合(渦旋1分鐘)增溶菌絲體粉末,然后室溫孵育5分鐘并隨機(jī)攪拌。添加0.2(最初TRIzol)體積的氯仿(從而對(duì)每10ml最初使用的TRIzol添加2ml氯仿),渦旋并在室溫下放置10分鐘。然后將混合物在4℃,6000g離心30分鐘。將上部水相轉(zhuǎn)移至新管中并通過添加0.5(最初TRIzol)體積的100%異丙醇(從而每10ml最初使用的TRIzol添加5ml異丙醇)沉淀總RNA。在室溫下沉淀10分鐘后,通過在6000g離心30分鐘回收RNA。去除上清液后,將RNA沉淀塊用一倍(原始TRIzol)體積的70%乙醇洗滌。去除乙醇后,將RNA沉淀塊晾干。干燥的RNA沉淀塊溶于3ml GTS(100mM Tris-Cl,pH 7.5,4M硫氰酸胍,0.5%十二烷基肌氨酸鈉)緩沖液。根據(jù)供應(yīng)商手冊(cè)使用Rneasy Maxi試劑盒(Qiagen)額外純化RNA。使用10微升RNA溶液確定核酸的量和濃度。
Aspergillus niger菌株 A.niger WT-1該A.niger菌株為包含編碼葡萄糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶的基因缺失的CBS513.88。A.niger WT-1使用如EP 0635574B1所述的″MARKER-GENE FREE″途徑構(gòu)建。該專利中廣泛描述了如何缺失CBS 513.88基因組中的glaA特異DNA序列。第一個(gè)步驟得到了MARKER-GENE FREE?glaA重組A.niger CBS 513.88菌株,其最終完全不具有任何外源DNA序列。然后通過EP 0 635 574B1中所述方法從A.niger WT-1基因組中缺失編碼真菌淀粉酶和酸性淀粉酶的基因。
如圖7到9和11到14所描繪的用于克隆目的構(gòu)建體的載體含有先前在WO 99/32617中描述的主鏈特征。
A.niger WT-GFP該A.niger菌株通過用圖7所描述的表達(dá)載體pGBFINGFP-2轉(zhuǎn)化A.niger WT-1獲得,所述載體含有由葡萄糖淀粉酶啟動(dòng)子驅(qū)動(dòng)的編碼公知綠色熒光蛋白(GFP)的基因(Chalfie,M et al.,Science(1994)263(5148)802-805)。在選擇性培養(yǎng)基上純化后,基于PCR分析選擇單拷貝整合體。
A.niger WT-PHY該A.niger菌株通過用圖8所描述的表達(dá)載體pGBFIN-32轉(zhuǎn)化A.niger WT-1獲得,所述載體包含由葡萄糖淀粉酶啟動(dòng)子驅(qū)動(dòng)的植酸酶基因PHY(與先前在WO 99/32617中描述的FytA相同)。在選擇性培養(yǎng)基上純化后,基于PCR分析選擇單拷貝整合體。
A.niger WT-PHY-2該A.niger菌株通過用圖8所描述的表達(dá)載體pGBFIN-32轉(zhuǎn)化A.niger WT-1獲得,所述載體包含由葡萄糖淀粉酶啟動(dòng)子驅(qū)動(dòng)的植酸酶基因PHY(與先前在WO 99/32617中描述的FytA相同)。在選擇性培養(yǎng)基上純化后,基于PCR分析選擇單拷貝整合體。
A.niger WT-載體該A.niger菌株通過用圖9所描述的空對(duì)照載體pGBFIN-40轉(zhuǎn)化A.niger WT-1菌株獲得??諏?duì)照載體pGBFIN-40通過Xhol消化圖8中所描述的pGBFIN-32并將最大片段重新連接,從而去除葡萄糖淀粉酶啟動(dòng)子和植酸酶基因PHY的5’部分構(gòu)建。通過PCR分析選擇單拷貝整合體。
實(shí)施例1構(gòu)建Bacillus報(bào)告質(zhì)粒和報(bào)告菌株 1.1構(gòu)建報(bào)告質(zhì)粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE 首先,如下構(gòu)建報(bào)告質(zhì)粒pPhtrA-gfp-amyE。使用pSG1151(P.J.Lewisand A.L.Marston,1999;GFP vectors for controlled expression and duallabelling of protein fusions in Bacillus subtilis,Gene 227,101.)作為模板DNA,用以下引物RN-lacZ-rv(SEQ ID NO3),GTGAGCGGATAACAATTTCACACAGG;和 gfp-terminator-rv,(SEQ IDNO4)GTGGCTCAGCTTTTTTAAGGAAGGGAGGCTCTCACCTCCCTTCCCTTTATTTGTAGAGC TCATCCATGCC,通過PCR擴(kuò)增編碼最佳化版本GFP——gfpmut-1的基因(P.Cormack,R.H.Valdivia,and S.Falkow,1996;FACS-optimized mutants of the green fluorescent protein(GFP),Gene 173,33.),其中所述引物分別得到gfpmut-1上游和下游的KpnI和Bpu1101I位點(diǎn)(黑體)。使用KpnI和Bpu1101I位點(diǎn)將913bp PCR產(chǎn)物連接在下述pDL中,得到pGFP-amyE,所述pDL包含用于位點(diǎn)特異重組的amyE基因座的同源側(cè)翼區(qū)(G.Yuan and S.L.Wong,1995;Regulation of groEexpression in Bacillus subtilisthe involvement of the sigma A-like promoterand the roles of the inverted repeat sequence(CIRCE),J.Bacteriol.177,5427)。使用B.subtilis 168(Bacillus Genetic Stock Center ID1 A1)的染色體DNA作為模板DNA,通過PCR擴(kuò)增htrA的啟動(dòng)子(PhtrA)(SEQ ID NO1)。所使用的引物為分別引入KpnI和HindIII位點(diǎn)(黑體)的PhtrA-fw,(SEQ ID NO5)CGTGAGGTACCGGCTTCTGTTTCTGCC;和Phtr-rv,(SEQ ID NO6)CATCACGAAGCTTATCCATCATGTTCACTCCG。用Kpn1和Hind3消化后,將531bp PCR產(chǎn)物連接進(jìn)pGFP-amyE中g(shù)fp基因上游,得到報(bào)告質(zhì)粒pPhtrA-gfp-amyE。該質(zhì)粒的圖譜描繪于圖1中。質(zhì)粒pPhtrB-gfp-AmyE以如上所述類似的方法構(gòu)建。用于擴(kuò)增htrB啟動(dòng)子(PhtrB)(SEQ ID NO 2)的引物為PhtrB-fw(SEQ ID NO 7)GACCGGTACCTCAGGATCTTTCGCC和PhtrA-rv(SEQ ID NO 8)GGCCATCAAGCTTATAATCCATGTTCTTACACTCC。
1.2構(gòu)建Bacillus報(bào)告菌株VT210A和VT210B 將得到的質(zhì)粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE引入DaprE、DnprE雙突變體B.subtilis DB104中(F.Kawamura and R.H.Doi,1984;Construction of a Bacillus subtilis double mutant deficient in extra cellularalkaline and neutral proteases,J.Bacteriol.160,442)。通過對(duì)染色體DNA的PCR檢查氯霉素抗性轉(zhuǎn)化體通過amyE基因座上雙交換的位點(diǎn)特異性整合。為了降低HtrA對(duì)PhtrA的負(fù)反饋調(diào)節(jié)(D.Noone,A.Howell,R.Collery,and K.M.Devine,2001;YkdA and YvtA,HtrA-like serine proteases in Bacillussubtilis,engage in negative auto regulation and reciprocal cross-regulation ofykdA and yvtA gene expression,J.Bacteriol.183,654),用B.subtilisBV2003的染色體DNA轉(zhuǎn)化新菌株,所述B.subtilis BV2003具有通過pMutin2整合被破壞的htrA基因(H.L.Hyyrylainen,A.Bolhuis,E.Darmon,L.Muukkonen,P.Koski,M.Vitikainen,M.Sarvas,Z.Pragai,S.Bron,J.M.van Dij1,and V.P.Kontinen,2001;A novel two-component regulatory system in Bacillussubtilis for the survival of severe secretion stress,Mol.Microbiol.41,1159)。選擇紅霉素抗性的轉(zhuǎn)化體并通過對(duì)染色體DNA的PCR檢查htrA破壞。獲得的菌株命名為VT200A和VT200B。
為了提高VT200A菌株的轉(zhuǎn)化效率,設(shè)計(jì)了BsuMR破壞構(gòu)建體。BsuMR體系通過由三個(gè)基因ydiR、ydiS和ydiA組成的操縱子形成,其中各基因?qū)suMR功能是必須的(P.J.Lewis and A.L.Marston,1999;GFPvectors for controlled expression and dual labeling of protein fusions in Bacillussubtilis,Gene 227,101)。使用以下引物和B.subtilis染色體DNA作為模板擴(kuò)增756bp的ydiR區(qū)——側(cè)翼區(qū)1(flr1)flrBsul F,(SEQ ID NO 9)GAAAGATTGTTTCAGAAGCC;和flrBsuR,(SEQ ID NO10)ACAGCGTTGGGATCCAAGCCCTTCCATTTTGGACATTTGG。使用pDG1726(A.M.Guerout-Fleury,K.Shazand,N.Frandsen,and P.Stragier,1995;Antibiotic-resistance cassettes for Bacillus subtilis,Gene 167,335)作為模板DNA和以下引物擴(kuò)增壯觀霉素抗性標(biāo)記specBsu-F,(SEQ ID NO11)GGGCTTGGATCCCAACGCTGTCGACGTTGTAAAACGACGG;和specBsu-R,(SEQ ID NO12)CGCATAGCTTTCCGGTCGCCGCAGCTATGACCATGATTACGC。1319bp PCR產(chǎn)物和flrBsu1片段用于第二輪PCR,其中由引物flrBsu1-R和specBsu-F(黑體)引入的其同源末端重組后,兩個(gè)片段作為一個(gè)模板作用。使用引物flrBsu1-F和specBsu-R獲得2075bp PCR片段flr1-specr,其被亞克隆進(jìn)pCR-XL-TOPO(Invitrogen)中得到pCT-XL-TOPO-flr1-spec。覆蓋ydiS(編碼DNA內(nèi)切核酸酶)的3’末端和相鄰ydjA(未知功能)大部分的739bp區(qū)域——側(cè)翼區(qū)2,使用引物flrBsu2-F,(SEQ ID NO 13)GATGATTCGTCTTTTTGTAGTG;和引物flrBsu2-R,(SEQ ID NO 14)CGATCAACATATGTGTTCACG和B.subtilis的染色體DNA作為模板擴(kuò)增。將PCR產(chǎn)物克隆進(jìn)pCR-XL-TOPO中得到pCR-XL-TOPO-flr2。利用pCR-XL-TOPO載體的多克隆位點(diǎn),使用XhoI和NsiI將flr1-specr從pCR-XL-TOPO-flr1上限制性酶切下并連接進(jìn)用XhoI和Pstl(與NsiI匹配)消化的pCR-XL-TOPO-flr2中。這引起構(gòu)建體pTOPO-flr1-specr-flr2的刪除,其被引入菌株VT200A。通過對(duì)染色體DNA的PCR檢查壯觀霉素抗性轉(zhuǎn)化體的ydiS缺失。獲得的最終報(bào)告菌株稱為VT210A和VT210B并用于進(jìn)一步的實(shí)驗(yàn),構(gòu)建這些菌株的一般性概括描繪于圖2中。
1.3構(gòu)建表達(dá)載體pUBnpr2和pUBBAG 質(zhì)粒pUB110的構(gòu)建及其序列之前已被描述過(McKenzie T.,HoshinoT.,and Sueoka,N.1986.The nucleotide sequence of pUB110;some salientfeatures in relation to replication and its regulation.Plasmid 1593-103)。將Bacillus amyloliquefaciens a-淀粉酶基因amyQ(Genbank登錄號(hào)J 01542)克隆進(jìn)pUB110,得到如先前所述的質(zhì)粒pKTH10(Palva,I.1982.Molecularcloning of the alpha-amylase gene of Bacillus amyloliquefaciens and itsexpression in B.subtilis.Gene 1981-87)。
將均來自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登錄號(hào)K 02497)和β-葡聚糖酶基因bag(Genbank登錄號(hào)M15674)克隆進(jìn)載體pUB110的過程實(shí)質(zhì)上根據(jù)用于克隆amyQ的方法進(jìn)行,得到如圖3和圖4所描繪的質(zhì)粒pUBnpr2和pUBBAG。
1.4將表達(dá)構(gòu)建體pKTHIO、pUBnpr2和pUBBAG轉(zhuǎn)化進(jìn)Bacillus報(bào)告菌株VT210A中 Bacillus subtilis菌株VT210A的轉(zhuǎn)化實(shí)際上如先前所述利用該生物的天然感受態(tài)進(jìn)行(Anagnostopoulos,C.and Spizizen,J.1961.Requirements fortransformation in Bacillus subtilis.J.Bacteriology 81741-746)。DNA孵育后,將細(xì)胞涂布于2 x TY瓊脂上,其含有0.1%淀粉和作為轉(zhuǎn)化選擇劑的抗生素卡那霉素(20μg/ml)。將板在37℃孵育過夜。當(dāng)轉(zhuǎn)化涉及質(zhì)粒pKTH10時(shí),用魯戈溶液(lugol solution)覆蓋菌落以檢測(cè)分泌淀粉酶的細(xì)胞。
實(shí)施例2通過熒光激活的細(xì)胞測(cè)定法分析分泌脅迫的細(xì)胞 2.1通過熒光激活的細(xì)胞分選選擇分泌脅迫的細(xì)胞 以1∶20的比例使用質(zhì)粒pUB110(空對(duì)照載體)和pKTH10(編碼Bacillus amyloliquefaciens a-淀粉酶基因amyQ)共轉(zhuǎn)化Bacillus subtilis菌株VT210A。將一部分細(xì)胞涂布于選擇性TY瓊脂平板上,向另一部分中添加含卡那霉素的2 x TY培養(yǎng)基,并將細(xì)胞孵育過夜。同樣用與共轉(zhuǎn)化相同的操作轉(zhuǎn)化分離的質(zhì)粒。第二天,在FACS型流式細(xì)胞儀(Mo-FIo ofDakocytomation)上由熟練操作者GFP熒光分析培養(yǎng)物。使用80mWatt和488nm的藍(lán)色激光。典型的FACS實(shí)驗(yàn)包含對(duì)20.000個(gè)事件(細(xì)胞)的分析。首先單獨(dú)分析(圖5A和5B)和作為混合(圖5C)分析VT210A,pUB110(無分泌脅迫)和VT210A,pKTH10(由于過量生產(chǎn)α-淀粉酶AmyQ的分泌脅迫)細(xì)胞的熒光信號(hào)。在這些結(jié)果的基礎(chǔ)上手動(dòng)設(shè)置細(xì)胞分界限(圖5D中的虛線),使得顯示高于細(xì)胞分選界限的GFP熒光的細(xì)胞被分選。將共轉(zhuǎn)化培養(yǎng)物應(yīng)用于流式細(xì)胞儀并在管中收集被分選的細(xì)胞。為了驗(yàn)證經(jīng)分選的熒光群體已經(jīng)富集了分泌α-淀粉酶的細(xì)胞,將被收集的細(xì)胞的不同稀釋液涂布在含淀粉的選擇性瓊脂上。對(duì)未經(jīng)FACS分選的最初的過夜輸入培養(yǎng)物進(jìn)行相同處理。培養(yǎng)后用魯戈溶液覆蓋菌落,使α-淀粉酶活性引起的鹵素形成顯影。圖表1所示,約90%的經(jīng)分選的細(xì)胞的確分泌α-淀粉酶,而輸入培養(yǎng)物中僅0.5%-0.7%的細(xì)胞分泌α-淀粉酶。該結(jié)果清除地說明了有力的本發(fā)明選擇工具,其通過使用正常細(xì)胞和分泌脅迫細(xì)胞之間的熒光信號(hào)辨別來分離分泌蛋白質(zhì)的細(xì)胞。
表1流式細(xì)胞術(shù)后富集形成amy+菌落的單位。
2.2通過熒光細(xì)胞掃描選擇分泌脅迫的細(xì)胞 將質(zhì)粒pUB110(空對(duì)照載體)和pKTH10(編碼Bacillusamyloliquefaciens a-淀粉酶基因amyQ)單獨(dú)地轉(zhuǎn)化進(jìn)Bacillus subtilis菌株VT210B中。將一部分細(xì)胞涂布于選擇性TY瓊脂平板上,向另一部分中添加含卡那霉素的2 x TY培養(yǎng)基,并將細(xì)胞孵育過夜。在流式細(xì)胞儀(Coulter Epics XL-MCL,Beckman Coulter)上由熟練操作者分析培養(yǎng)物。典型的實(shí)驗(yàn)包含20.000事件(細(xì)胞)的分析。使用FITC濾器并將光電倍增管電壓設(shè)為700和800伏特之間檢測(cè)熒光信號(hào)。正常細(xì)胞和受到分泌脅迫的細(xì)胞間的熒光信號(hào)差異描繪于圖6中。
2.3使用熒光計(jì)選擇分泌脅迫的VT21OA細(xì)胞 經(jīng)轉(zhuǎn)化的報(bào)告菌株細(xì)胞在存在卡那霉素的2 x TY培養(yǎng)基中孵育并在37℃過夜培養(yǎng)。用于轉(zhuǎn)化質(zhì)粒pUB110、pKTH10、pUBnpr2和pUBBAG的DNA數(shù)量相等。生長(zhǎng)至穩(wěn)定期后,將四種轉(zhuǎn)化的培養(yǎng)細(xì)胞以96孔微量滴定板的形式等體積分為8份??自跓晒庥?jì)中分析熒光(MolecularDevices,type Spectra MAX Gemini)。刺激在490nm,發(fā)射在510nm和截?cái)嘣?95nm。表2說明通過清晰顯著(P two-tail<0.05)的熒光信號(hào)差異而將非脅迫的細(xì)胞(pUB110)從脅迫的細(xì)胞(pKTH10、pUBnpr2和pUBBAG)中區(qū)別出來。
表2.假定不等方差的t檢驗(yàn)。給定空宿主細(xì)胞(pUB110)對(duì)分泌脅迫(pKTH10、pUBnpr2、pUBBAG)細(xì)胞的P值。
比值表達(dá)了脅迫細(xì)胞的平均熒光值(n=8)對(duì)空宿主細(xì)胞的平均熒光值(n=8)。
實(shí)施例3基因組廣泛表達(dá)分析A.niger以鑒定分泌誘導(dǎo)的啟動(dòng)子 進(jìn)行基因組廣泛表達(dá)分析以鑒定在A.niger WT-PHY中高度表達(dá),并在A.niger WT-GFP,A.niger WT-載體和A.niger WT-1中不顯示或顯示較低表達(dá)的啟動(dòng)子序列。為了模擬將來的應(yīng)用實(shí)驗(yàn),獲得A.niger WT-1,A.niger WT-GFP,A.niger WT-PHY和A.niger WT-vector菌株的原生質(zhì)體。在A.niger WT-GFP,A.niger WT-PHY and A.niger WT-載體情況下將20ml數(shù)量補(bǔ)充有50mg/l phleomycin(Invitrogen)的液體選擇性再生培養(yǎng)基在培養(yǎng)皿中與100微升10E7/ml原生質(zhì)體孵育。在30℃(靜止)生長(zhǎng)3天的周期后,在液體培養(yǎng)基表面形成菌絲體小片,將其用于總RNA分離。在Affymetrix A.niger GeneChipsTM上的cDNA合成、cDNA標(biāo)記和雜交根據(jù)供應(yīng)商流程進(jìn)行。隨后的表達(dá)分析得到5個(gè)下述基因,所述基因在A.niger WT-PHY菌株中的表達(dá)水平為在A.niger WT-1,A.niger WT-GFP和A.niger WT-載體中基底表達(dá)水平的至少8.5倍。為了確認(rèn)所述發(fā)現(xiàn),進(jìn)行Northern印跡分析。
實(shí)施例4Northern分析 為了確認(rèn)Affymetrix A.niger GeneChipsTM實(shí)驗(yàn)的結(jié)果,進(jìn)行Northern印跡分析。為此從A.niger菌株WT-1、WT-GFP、WT-FYT和WT-載體中分離總RNA。將RNA變性,在1%瓊脂糖凝膠上通過凝膠電泳分離,并根據(jù)制造商說明通過毛細(xì)管印跡轉(zhuǎn)移至尼龍膜(Hybond-N+,AmershamBiosciences)上。在GS Gene LinkerTM(BioRad,C3 setting,150mJoule)上將RNA紫外交聯(lián)在尼龍膜上。用于產(chǎn)生32P-標(biāo)記的DNA探針的DNA使用A.niger WT-1的基因組DNA作為模板并使用表3所列引物(SEQ ID NO′s 50到59)通過PCR分離。根據(jù)供應(yīng)商說明(RadPrime DNA Labeling System,Invitrogen)將Northern印跡與隨機(jī)引物32P-標(biāo)記的DNA探針雜交,所述探針代表了分泌誘導(dǎo)的基因(SEQ ID NO′s 20到24)。Northern分析到結(jié)果顯示在圖10中。Northern印跡的雜交模式證實(shí)了通過表達(dá)分析AffymetrixA.niger GeneChipsTM數(shù)據(jù)獲得的數(shù)據(jù);分泌誘導(dǎo)的基因在A.niger菌株WT-1、WT-GFP、WT-載體中低表達(dá)并在A.niger WT-PHY中高表達(dá)。
表3用于分離用于經(jīng)32P-標(biāo)記探針的DNA的引物。
實(shí)施例5克隆GFP-BLE分泌誘導(dǎo)的報(bào)告構(gòu)建體 通過PCR構(gòu)建GFP(綠色熒光蛋白(Chalfie,M et al.,Science(1994)263(5148)802-805)和腐草霉素結(jié)合蛋白(BLE,存在于先前在WO99/32617中描述的pGBFIN-14中)的融合。使用SEQ ID NO62和SEQ ID NO63的引物組通過PCR擴(kuò)增GFP片段。使用引物組SEQ ID NO64和SEQ IDNO65和pGBFIN-14作為模板通過PCR擴(kuò)增BLE片段。獲得的重疊PCR片段用于使用引物SEQ ID NO62和SEQ ID NO65的融合PCR中,得到PCR融合產(chǎn)物GFP-BLE(SEQ ID NO61)。用限制性酶PacI和AscI消化GFP-BLE融合物并與經(jīng)PacI、AscI線性化的克隆載體pGBFIN-2(描述于WO99/32617和EP98/08577)連接,從而將GFP-BLE融合物置于葡萄糖淀粉酶啟動(dòng)子的調(diào)控下,得到的載體pGBFINBLE-2描繪于圖11中。
使用來自A.niger WT-1的基因組DNA作為模板和表4所示引物通過PCR分離分泌誘導(dǎo)的基因的啟動(dòng)子序列。
表4用于擴(kuò)增相應(yīng)啟動(dòng)子的引物概述 用限制性酶XhoI和PacI消化得到的PCR片段(SEQ ID NO′s35到39),并連接進(jìn)用XhoI、PacI線性化的圖11所描述的克隆載體pGBFINBLE-2中,從而去除PgpdA-amdS并用各自的分泌誘導(dǎo)啟動(dòng)子Pind代替葡萄糖淀粉酶啟動(dòng)子,得到pGBFINGFPBLE-1到5。pGBFINGFPBLE-1描繪于圖12中,并代表pGBFINGFPBLE-2到5。通過XhoI和FseI消化pGBFINGFPBLE-1并隨后與XhoI、FseI線性化的圖13所描繪的A.niger表達(dá)載體pGBTOPSEL-1連接來分離各誘導(dǎo)型啟動(dòng)子與GFP-BLE的融合構(gòu)建體。得到的分泌報(bào)告構(gòu)建體pGBTOPGFPBLE-1到5含有位于各分泌誘導(dǎo)型啟動(dòng)子P1、P2、P3、P4、P5調(diào)控下的GFP-BLE融合物。在圖14中,pGBTOPGFPBLE-1作為pGBTOPGFPBLE-1到5的代表被描繪。在實(shí)施例6和7中使用這些載體轉(zhuǎn)化A.niger WT-1。
實(shí)施例6過表達(dá)細(xì)胞外蛋白質(zhì)賦予表達(dá)GFP-BLE報(bào)告構(gòu)建體的A.niger腐草霉素抗性 根據(jù)材料和方法中描述的步驟進(jìn)行分泌報(bào)告構(gòu)建體pGBTOPGFPBLE-1到5到A.niger WT-PHY-2中的轉(zhuǎn)化,所述A.niger WT-PHY-2過表達(dá)經(jīng)分泌的蛋白質(zhì)植酸酶。在補(bǔ)充有多種數(shù)量腐草霉素(0、5、10、15、20、25、30、35、40、45、50微克每毫升)作為選擇劑的選擇性再生平板上選擇轉(zhuǎn)化體。所有5個(gè)報(bào)告構(gòu)建體能夠在含腐草霉素的平板上正選擇,而負(fù)對(duì)照WT-PHY-2野生型不能在含腐草霉素的任何平板上生長(zhǎng)。分泌報(bào)告構(gòu)建體pGBTOPGFPBLE-1到5能夠在分別有50、35、50、35、25微克每毫升腐草霉素上成長(zhǎng)。從而說明這些構(gòu)建體的分泌誘導(dǎo)型啟動(dòng)子是有功能的,并且轉(zhuǎn)化后在腐草霉素上的正選擇是可能的。
實(shí)施例7cDNA文庫和GFP-BLE報(bào)告構(gòu)建體共轉(zhuǎn)化后選擇表達(dá)細(xì)胞外蛋白質(zhì)的A.niger克隆 使用分泌報(bào)告構(gòu)建體pGBTOPGFPBLE-1到5與經(jīng)定義的A.nigercDNA文庫組合共轉(zhuǎn)化Aspergillus niger WT-1,所述cDNA文庫編碼50個(gè)細(xì)胞外蛋白質(zhì)和50個(gè)細(xì)胞內(nèi)蛋白質(zhì)。通過菌落PCR確認(rèn)共轉(zhuǎn)化事件。含分泌報(bào)告構(gòu)建體與表達(dá)文庫構(gòu)建體組合的共轉(zhuǎn)化體的孢子在補(bǔ)充有不同數(shù)量腐草霉素(0、5、25、50、100、175微克每毫升)的選擇性平板上生長(zhǎng)。證明了含有分泌報(bào)告構(gòu)建體與編碼細(xì)胞外蛋白質(zhì)的文庫構(gòu)建體組合的共轉(zhuǎn)化體與含有分泌報(bào)告構(gòu)建體與編碼細(xì)胞內(nèi)蛋白質(zhì)的文庫構(gòu)建體組合的轉(zhuǎn)化體相比,腐草霉素抗性的平均提高。代表分泌敏感性啟動(dòng)子P4和P5的這些結(jié)果的圖片在圖15和圖16中顯示。這些結(jié)果說明達(dá)到了至少多至20倍的腐草霉素抗性提高。
證明了下述共轉(zhuǎn)化體制造的細(xì)胞外蛋白質(zhì)的多樣性,所述共轉(zhuǎn)化體含有包含啟動(dòng)子P1或P3的分泌報(bào)告構(gòu)建體與編碼細(xì)胞外蛋白質(zhì)的文庫構(gòu)建體的組合。共轉(zhuǎn)化體在微量滴定板上個(gè)體生長(zhǎng),并在第6天將這些培養(yǎng)物的上清液通過E-PAGETM High-Throughput Pre-Cast Gel System(Invitrogen)和質(zhì)譜法(MALDI MS/MS)進(jìn)行蛋白質(zhì)分析。
E-PAGETM 96,6%Gels(Invitrogen)含有用于蛋白質(zhì)分離的微量滴定板格式的96個(gè)樣品區(qū)和8個(gè)標(biāo)記物區(qū)。根據(jù)供應(yīng)商手冊(cè)將上清液和標(biāo)記物(E-PAGETM
預(yù)染標(biāo)準(zhǔn)(Invitrogen))上樣在凝膠上。將凝膠電泳后,根據(jù)供應(yīng)商手冊(cè)將SimplyBlueTM Safestain(Invitrogen)用于染色。E-PAGETM凝膠的掃描圖通過Invitrogen提供的E-editor程序編輯,所述程序?qū)⒌鞍踪|(zhì)樣品排列為微量滴定板格式。由具有分泌敏感啟動(dòng)子P1和P3的共轉(zhuǎn)化體制造的細(xì)胞外蛋白質(zhì)展示在圖17和18中,并在表5中概述。這些結(jié)果說明,至多70%的經(jīng)分析的腐草霉素抗性菌落分泌通過E-PAGE可檢測(cè)數(shù)量的蛋白質(zhì)。根據(jù)凝膠上觀察到的蛋白質(zhì)片段的大小,評(píng)估用給定文庫轉(zhuǎn)化的菌落的多樣性。這些結(jié)果說明根據(jù)E-PAGE分析可觀察到至多35%的多樣性。
質(zhì)譜結(jié)果描繪于表5中。至多58%的被分析為腐草霉素抗性的菌落分泌通過質(zhì)譜可檢測(cè)數(shù)量的蛋白質(zhì)。根據(jù)所檢測(cè)的肽序列的同一性評(píng)估多樣性。這些結(jié)果說明使用質(zhì)譜可觀察到至多100%的多樣性。
表5E-PAGE和質(zhì)譜結(jié)果概述。用于分析的測(cè)定法在第一列中描述;第二列鑒定了分泌敏感的啟動(dòng)子-報(bào)告子構(gòu)建體;第三列描述了由測(cè)量法分析的轉(zhuǎn)化體的數(shù)量;第四列和第五列說明了對(duì)蛋白質(zhì)分泌評(píng)分為正的菌落數(shù)量和各自的陽性百分比;第六列和第七列說明了分泌不同蛋白質(zhì)的菌落數(shù)量和各自的多樣性百分比。
與被保藏的微生物相關(guān)的說明
(PCT Rule 13bis)
序列表
<110>帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司
<120>在宿主細(xì)胞中表達(dá)克隆的改進(jìn)方法
<130>24403WO
<160>65
<170>XML to WIPO ST.25Converter-http://www.biomax.de/
<210>1
<211>168
<212>DNA
<213>Bacillus subtilis
<400>1
CGACTCAGTC CTTTCATATA CAATATGAAG TGTACCGTTT TCCGCACTTT TTCACAATTT60
CCCATAATCT TTTCATTTTT ATCCCACAGT TTTTGTTTAT GATAAACTCA AGTCATAAAC120
CTATCAATAT AAATAGACAT GTGAAAATAG AGAAACGGAG TGAACATG 168
<210>2
<211>277
<212>DNA
<213>Bacillus subtilis
<400>2
GGCTCTTCAC ATCCTTTCAA CGTCATTATA AACTAGTTTT AACATACGGC AGGCAATTTT60
CATAATTTCA CATATTCTTT TCATTTTTAT CCCACAATGT TTGTTTATGA TATGGTTAAG120
GGAAGAAAGG AAGAGAAAAA GAGCGAGGAA GATGTAGGAT GATCAAACAT ATTCTATTTT180
GGTGCTTTGC TTTTCTCCTC ATTATTGGGA CAATTGAACT TGTACATGCG ATGAATATGT240
AACGATAAAT GAATAACCGT TAAAGGAGTG TAAGAAC 277
<210>3
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>3
GTGAGCGGAT AACAATTTCA CACAGG26
<210>4
<211>70
<212>DNA
<213>人工序列
<220>
<223>引物
<400>4
GTGGCTCAGC TTTTTTAAGG AAGGGAGGCT CTCACCTCCC TTCCCTTTAT TTGTAGAGCT60
CATCCATGCC 70
<210>5
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物
<400>5
CGTGAGGTAC CGGCTTCTGT TTCTGCC 27
<210>6
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>6
CATCACGAAG CTTATCCATC ATGTTCACTC CG32
<210>7
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>7
GACCGGTACC TCAGGATCTT TCGCC25
<210>8
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>8
GGCCATCAAG CTTATAATCC ATGTTCTTAC ACTCC 35
<210>9
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>9
GAAAGATTGT TTCAGAAGC 20
<210>10
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>10
ACAGCGTTGG GATCCAAGCC CTTCCATTTT GGACATTTGG 40
<210>11
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>11
GGGCTTGGAT CCCAACGCTG TCGACGTTGT AAAACGACGG 40
<210>12
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>12
CGCATAGCTT TCCGGTCGCC GCAGCTATGA CCATGATTAC GC42
<210>13
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>13
GATGATTCGT CTTTTTGTAG TG 22
<210>14
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>14
CGATCAACAT ATGTGTTCAC G21
<210>15
<211>1050
<212>DNA
<213>Aspergillus niger
<400>15
ATAATGTAGG CGACAAAGTA GCCGGGCATG CGACCGGAGG ACTCGGTCAG AGGCACGAAT60
ATGAGAGGCC AGAACGCCGC ACCCATGTTC CAAGATGTTG TGGCCCAGTA AAGGTTAGGA120
AATGGGGTGT TTTGAACGTG GAATCGTTCT TCCATCCAGT TGTTGCCGGA GCCGTAGGAA180
CCGGCCGGGA TACCAGTGAG GATGGAACTA TACCTATTAG CACTGCCATC TTCGAGAACA240
AGGCTAAGAC ATACATGAAA CAAACGGTGA CCGTGAGAAG CCATTTATAA GAGGTGCTCC300
AATTGAACCT GAATATGTTA AAACTAGTAT ACTAGCAACT GCATGCTTGA CGTACGGATT360
GTCCGGGTCA TCCTTGCCGT TCCAGGTATG GATCTCAAGG TCCTCCCTGT CACGCAGATC420
ATTGTGGCTG ACTACCCCGA CATGGGGGTC CCGGCGAAAG AACGACCGCA CCCTGCAACG480
TCACTTAGTG GCTGTCTGAC AGGGATTGAT TGGCAATGAT TGGCAGACTA ACCGTCCCAG540
AAACGAATCA TCGAACTCAT TGGTGTGCAC TGTGCTAGCG CGGCGCAGCG ACGGGCGTGG600
CTCCTCGGCA GGGGTGGACA TGACTTTCTC TGTGTAGATT CCTTGCAAGG TATCTGCTTG660
ACAGATGCAG AGATGATGTT GAGTAAAATA GGGTGCAGAG ACCCTGCAGA ACCTGCATCG720
GCCGGCGGCG ACATGTCGTC ATGACCGACC CGGGCCGAGC GGAATTAATG AAACTCGGAA780
CAGCCAGGGG AATCCGACGC TTTGAGTGGC CAATCCATGT CTATCCACAT CTGCATTGAA840
GTGGATGAAA GGTGGAGGAG GGCTGGTTGC CAAATTCTGT TAGGGCTTGG AATGTAAGCA900
ACCGGTTTCG GTCATGACAT CATCACAGCG ATGACTTCAT CACTCTCGGA CGAGCATATA960
TAGTTGTGCC TGTCGTCGTA TCTCAACAAA CATCAACAAC AACAACAATC ATCTACTGCA1020
TTTACCAAAC TCATCTCTAC CTCAATCAAC 1050
<210>16
<211>1032
<212>DNA
<213>Aspergillus niger
<400>16
TTCTCACAAG CAAATCCGAG AAACGCAATT GACCATATGT CCTTAGTATG AGGGCTAGCA60
GGAATACTTG TTTGTCGATG CATACCGACT AATAAAAATG GTTCTTCTTT TTCGCGCAGG120
GATTTGGTTT TTCATTTTTC ATTTTTCATA TTTTATGTTA TTTTATTTTA TTTTTTTGTT180
TTATTTTATT TTATTTTTTT TTTTTAAATA AGACTGGGTG TTTTCGTCTC CCACCCCTGC240
TGAGGAACTG TTTGATATAC AGAAGCCTGA GATACTTGAG ATTATGTGAC AAAGAAATTG300
TAAACCTGAA TGTGACTAAG GCAGAAGAGA GCAGGTGAGG CCACACAATA CTGTACACCC360
ACTTCCGATC GTCATCGAAA TGAGCGTTGT GGGTACTGGA ACGACAAACC ATAGATCGGA420
TCTGCATCCG AATAGGCTTT ACTTTGTACA TTGGTAGGAG TTTGAATGTT TGAAGATCCG480
GCAGATGATC ACCTGCTGCA GGGAATAATT TGAAACCTGT CCGTCTGCTT TGACCCAATT540
GACGAGGTAC GTGATTTGAT GCTACCCAAG CAGTATGAAT GCGACGGAGG TGGCTATCCT600
TACCTTGTCA TATGCAACTC ATAACGGGTA GTCCCCATGG AGCCACGGCT ATTTATTTCT660
AAGGGCCAAC AGTGAAAGAT TGTGAGATCG TATACCTCCT GGGTATGACG CAACCAGGGT720
GAGCACTGGC ATTGCTCCAA TCCATATGGT GGAGGTATGT CTCCGAGACC ATGACGCATG780
TAGACCCTGA CCTGTCCCTG ATCCAGGGAT CTGGTTTGTC ACTTGGCGTA TTTTAATTAA840
CTGCGGGTCA GGGTCTTGCC GTCCAGACCC AATGGATGAA TTGCCTGCGT GGCCCTGCAG900
TTCCAGCGAT CGGCACGGCA CGGCTATGAC GTCGGTGGGT GTTCCGTTTG ATATTTAACC960
ATAGAAGACA GCCTTGTTAT GCTGGTTCCT GCCGCAAAAT AAAGGTCTAT CCTTACCACG1020
TTAAGTGTCA AA1032
<210>17
<211>1035
<212>DNA
<213>Aspergillus niger
<400>17
TGGTGCCTGT GAACGAGGTC ACCACTGATA AATTGTCTGG ATCCGTAACG TCTGTATCAG60
TGGATGGTAC TGAAAAGTTC CAAAGATTGA GGGCAGCATA TGTAGCACAT GGTGGTAGCT120
CTAAGTGGTT CGAAACTTCG ATGAATGGGC GTGATATACA GGGGGGTAGC ACCTGTATAG180
TTGATGTCAG CGAAGGCACG GGCCATGCAG TGATAGACAA GAAAAGAGGG ATTGAATAAA240
AGACTCGATT CTGAAGGGGA GTAATACATC TTTCGGCTTC TCACCACCCC AGATGTAGGC300
GTGTGTAAGG TAAGCAAGCA CAACATATGC TCTCCGCCAC TCAGGTTCCC CCTTCAACTT360
CTTCGTAGAG AGTATACCCA GGTCATCGAC AGACCTCCTG ATAGTACCAG ACTGAATCAG420
GCCAGGCAAG TCCTGAGCGA TTTCCTCCCA CGGGGAATAG TAAGGGTCTT CCAATCTCCG480
TACGGGAGGA ACTTCCGGGA GGAACCCGTT CTGGAGGGAG ACACCGTACG CAACAAGTGA540
AATGTCTTGT GTATAAAGCA TGATAATATA TGCACTTCAG TAGACAACTT GATATTCAAG600
CCTCCTTGAA ATGATCCTCA TGCAGGTAAG AGTAGATCCA AGTGTTTATA TTGTATTCCC660
AAGGAGGGAC GGAAGAAAAC CGGATCCAGA GGGCTCGAGA TAGGGCCACC TGCATGAGCA720
AAGACGGGTC ATTTCCCGTT TCACAACGAC CATTCTCAGG CAGAAAGGCA GTGGATTAGC780
GGAAAACTTA GCAACCATCC GGATTTCTGG AGTGGATGCT TTGTTATCTC ACTTCCGGCA840
ACACGGATGG TGAGGCGGAA GCGGAACGGT ATCCGGATCC GGAGGGAGGG ACAAACCGAA900
GTGCCTTGTG TCACACGCCG GTCCATATAT AAATGTTAAT TGGTGACGGT CAGCGGATTG960
TTTCTGGTGT TCATCCATTT TTTCTTGATA TCCTGGACCC AGTTATTGCA CTTTAATTAC1020
TATCCAAAAT CCACA 1035
<210>18
<211>1071
<212>DNA
<213>Aspergillus niger
<400>18
GTCCACACTC TAATTGGGAT GAGCATTGCC TTTCAGGAAC TTGACTTTTT GTGGTTGCAT60
CTTTTGTTGC CTTACCCACG CAGGCTTCGT TTATGAGATA GCGATTTCAG GCCTCAAATT120
GCTGTCATCA CTTCCGGCCC CAAACTCGTG GGCGGTGCCC GCCCATCGCT GGCAAGAAGC180
ACAGACTAAC GCCTTACTTC GCCTAGTTGC ACACGATGCA TCAAGACTTC CTCCTATTTC240
ACAACGACCA GCTCCTTGCC ATTTGTTGTT TCGAATGCCC CCTTCCCCGT GCCTTGCATT300
TCTAATTCCC ATCTATACCC TTTTGCGCTC TCACGCCCGC CTGACTATCA ATTTTTCTGC360
CAGCATAACC CTGCGTGCAG AGCGGTTGAC AGCAGGCTTG CTAAGAGTCT TCGTCTAGAA420
GAACTGTCTG GGTGGATTCC TTTTCGGATT AACTTTTGCT ATTTTAAAAG CTGATTGCAC480
TACGGAGTAC ACCCGCAATC TGATTCTCAC TGATACTCCA ATTAAAGGCC ACTAATTGCT540
GACATTTGTA ACATATTTGC GTTTGCTTTC CGGTTGAAAT TGGCGGCTTT GTGCTTTCGA600
TCGCTAGCAG TCTCTGTGCA TGTACAACTG ATCGGCTATT CAGTCCTATT CGGAAGCGGC660
ACTGAGAGGC GGAGACAAGC CACAGATACG ACGAGTCTGA TTTTGAGACG GGCGCATCCA720
ACGAAAGCCT GCGATTGCAA TTGAAGATCT CAATTGGGGG ACTGACAACC TAATACCTAA780
ACATATCGAG GATTAGGCGC CAACACGAGC ATGGGAAGCT TTGGTGCATG CGACGGCTGA840
TCCATTTCTA ACAACCGTTT TGCGCGCGCG TCCGAGGTAA GGCTCCCGAT CCCTTGGCGC900
TTTGCATGTT TCACTCCGAT GCATCTACTG TTTATATGAG TGCGGTGGGC AAGCTGTGCC960
CACCGACTGA GCATTCTCAA CCGGCCCAAT GCTGTGGGAT CGATCCTCCC CTCCAAAGTT1020
GTCGCTCGGT TACACTTGAT CGGAGCTTGT TCTGTTATAC ACCAAACCAT C 1071
<210>19
<211>1116
<212>DNA
<213>Aspergillus niger
<400>19
GCCTTTGGAG AATGTAATAT CCCTTGATCA CCCCAGACTC ACATCCAGAT TCTGACTGAC60
CTCGTGCATA GCCATATTTA ACTTGGTCCC TGATGATCAA AACAGTACAT GGAACTGGGG120
CCGAACATTT CCCTAGCCAA AGGAGCATCA GGGATTCAAC GTGATCAGTA CAGCCTTGTA180
GCTCGCTGAA ACTGCCCTGG AGCCAAGCCA AAGCCTAGAC AGCAAGGTGC ATGGGCGAGC240
TTTGCGAGGA TTTAGTTGTT ATTTAGTATG CCAAGATTAA GCCACGCAGA ATGGCTTATG300
GCCATAGTAG CAACAACGGC CACGGAACGT TCTTCCATGT GGTATGGGGA AAGCCGCCGG360
ATATTTGGGG AGGGCGTGAT TGTTCCGGTG GCTATCTTTC CGGTGGAGAT AACGGCGGTG420
GACCATCAAA ACTCCTCAGC CCGGATTGCT CGGACTCCGC ATCGTCAAGT ATCGGTTTCA480
TGACAGCCAT TCGACTACTT AGAAGACACA AATAGCTATC CAACTTACCC GGACCTTTGA540
TAATAATTTT CAGCAGATCT GTCGATCTCA GAGACAATAA TGCCACCGTT CTGTGTGGAA600
GGCACTGCGC CGTGGTTTAA CAATAATAAA ACTCCAAATT GCCCAAAAGC TAGAGCGAAG660
GAAAGTCGAG AAGCCCAGTC TAGACTGGCG GGCTGATCGT CCGGTTCACA ACCTGATTGA720
CAAATCATCT GTGACCCTCG ATGTTCCGCG GCGTTGAGCG GGTGAGAATG TGGATCCTAG780
TGGGGAAGAC CCAATTGCCG CCGGAAAAGG TGAGCTTGTG CTGCACATGT CCGGTGGCTC840
AATTCAGGGC CATGCCAGGA CATTGCTCTT CAAAGGGATG CGATTGCTAT TCCCTATTTA900
CTTCTTTAAC CCGCTGACGG GCCTGTCTGG ACCGAGAATT CTTGGTCAAG TTTCAGTGGA960
GCGATCCAGG AAAGAACATC CGATATGGAC AGTTGCCCTC GATCTCAGGT CTGTAGTCGT1020
GTGACACAGA GGCCTCTACT CGCTTGCCTT GCATGTCGGA GCTCAAAGGT GCGATGTGAA1080
TTAACACGAG GAGCGACTGT CTGTCGCAGA TGCAAC 1116
<210>20
<211>3191
<212>DNA
<213>Aspergillus niger
<400>20
GGAGTTACGT CCCAGAGATG CTGCGGACAA TGCCGATGCG GCATACTTCT CATACGCATC60
CGTCAAGTAA TTCACAACAG CCATGTAGAT ACTGTAGATG CCAATACCGG TAGCCCCGAT120
GCCGAGGGTC GGGACAATCC AAGGCACAGA AGGAAAACTG GCCCAACCAT ACCAGAACAG180
CCCGCCTGCG AACAGCAAGC TGCCAATGAT ACTAGTATAC AGACGGGCCT CCGGGATGGG240
TTTCCCGGGC TTCTCTTTGT TGCGTTTCGC CGACCGCAAA TACAGCATAT CCTGAAGAGG300
ATTGACGAGA GTACCGATTA GAGCACCCAC GGAGATGGCC AATTGAATGC ACCCAGTTTG360
CAAAGTATTC ATGCCGTAGT TGGTGGAGAA GGTCTGAACG ACACTGCTGA AGAAGAGATA420
CAGGATACCC CAGGCGAAAG AGATCCAGAG GGTGAAGAAG GCAACGACGG GCTCGGTGAG480
GAGCATTCGT GTGGGCCGTT CGAAGGAGAT CTGCATCAGA CGCCAGACGC TGGTGTTGTC540
TAGCTCGGCT TCGGCGTAGA TGGGGCGCTG CTTTTCTTTG CGGAGCTTCT TGGCCCGACG600
GGTGAGGATC ACGTCCGCGC GGGTTTCGTA CAGGATGAAC CAGAAGATGG GTAGGAGCCC660
TGTTAGATAG ATAATTTGGA TGTAGAAGAT CCAGCGCCAC GGGGCGGTTT TGTGGATGGC720
TACGATGGCG GATCCGATGA ATGGGCCCAG GGCAATTCCA ACCACACTGG TAAAACCGAA780
GAGCGACATA GGGAGACTCC TCGCTTTGTC ACCATACCAG ACATCACTGA TGCTACCGCC840
GACGATGTTG ATCGATACGG AGGACGCACC ACCACCGAAG AAACGCGTCA CTACGAGAGT900
AGCGTAGTTT TGGGCGAAGG CGGAGGGGAA TAGCGAGATG ATGAGAATAA TGTAGGCGAC960
AAAGTAGCCG GGCATGCGAC CGGAGGACTC GGTCAGAGGC ACGAATATGA GAGGCCAGAA1020
CGCCGCACCC ATGTTCCAAG ATGTTGTGGC CCAGTAAAGG TTAGGAAATG GGGTGTTTTG1080
AACGTGGAAT CGTTCTTCCA TCCAGTTGTT GCCGGAGCCG TAGGAACCGG CCGGGATACC1140
AGTGAGGATG GAACTATACC TATTAGCACT GCCATCTTCG AGAACAAGGC TAAGACATAC1200
ATGAAACAAA CGGTGACCGT GAGAAGCCAT TTATAAGAGG TGCTCCAATT GAACCTGAAT1260
ATGTTAAAAC TAGTATACTA GCAACTGCAT GCTTGACGTA CGGATTGTCC GGGTCATCCT1320
TGCCGTTCCA GGTATGGATC TCAAGGTCCT CCCTGTCACG CAGATCATTG TGGCTGACTA1380
CCCCGACATG GGGGTCCCGG CGAAAGAACG ACCGCACCCT GCAACGTCAC TTAGTGGCTG1440
TCTGACAGGG ATTGATTGGC AATGATTGGC AGACTAACCG TCCCAGAAAC GAATCATCGA1500
ACTCATTGGT GTGCACTGTG CTAGCGCGGC GCAGCGACGG GCGTGGCTCC TCGGCAGGGG1560
TGGACATGAC TTTCTCTGTG TAGATTCCTT GCAAGGTATC TGCTTGACAG ATGCAGAGAT1620
GATGTTGAGT AAAATAGGGT GCAGAGACCC TGCAGAACCT GCATCGGCCG GCGGCGACAT1680
GTCGTCATGA CCGACCCGGG CCGAGCGGAA TTAATGAAAC TCGGAACAGC CAGGGGAATC1740
CGACGCTTTG AGTGGCCAAT CCATGTCTAT CCACATCTGC ATTGAAGTGG ATGAAAGGTG1800
GAGGAGGGCT GGTTGCCAAA TTCTGTTAGG GCTTGGAATG TAAGCAACCG GTTTCGGTCA1860
TGACATCATC ACAGCGATGA CTTCATCACT CTCGGACGAG CATATATAGT TGTGCCTGTC1920
GTCGTATCTC AACAAACATC AACAACAACA ACAATCATCT ACTGCATTTA CCAAACTCAT1980
CTCTACCTCA ATCAACATGC CTATCTCCAT TCCCTCCGCC TCCAGCGTCC ACGACCTCTT2040
CAGCCTGAAG GGCAAGGTCG TCGTTATCAC CGGCGCTTCC GGCCCTCGCG GCATGGGCAT2100
TGAAGCCGCG CGTGGCTGCG CCGAAATGGG CGCCAACATC GCCCTCACCT ACTCCTCTCG2160
TCCTCAGGGT GGTGAGAAGA ACGCCGAAGA ACTTCGCAAC ACCTACGGCG TCAAGGCCAA2220
GGCCTACCAG TGCAACGTGG GCGACTGGAA CAGCGTCAAG AAGCTCGTGG ACGACGTGCT2280
GGCCGAGTTT GGCCAGATTG ACGCCTTCAT TGCCAACGCT GGCAAGACAG CCAGCAGTGG2340
TATCCTGGAT GGTTCCGTTG AGGACTGGGA AGAGGTCATC CAGACAGACC TGACGGGTAC2400
CTTCCACTGC GCCAAGGCGG TGGGCCCGCA CTTCAAGCAG CGCGGAACGG GCAGCTTCAT2460
CATCACCTCC AGCATGTCGG GTCACATTGC CAACTTCCCG CAGGAGCAGA CGTCGTACAA2520
CGTTGCCAAG GCAGGCTGCA TCCATATGGC CCGGTCATTG GCCAACGAGT GGAGGGACTT2580
TGCCCGCGTG AACAGCATCT CCCCGGGTTA CATCGACACG GGGCTGTCGG ACTTTGTGGA2640
TAAGAAGACT CAGGATCTGT GGATGTCGAT GATCCCCATG GGACGCAACG GTGATGCCAA2700
GGAGCTGAAG GGTGCATATG TCTATCTCGC CAGTGATGCC AGCACATACA CGACGGGTGC2760
CGATTTGGTC ATTGACGGAG GATACACCGT GCGGTAAATT ATCATCCGCG GTCGGATAGA2820
AAATAATGTT TATGACATGT ATGTAATGAA TATGAATGTT CAACAATAGT CTTCAATTCT2880
TCACTTGCTA GTATCCTGAG TATCTTGTCG TATAGCTCAA CAACCTGGCA TGGCCGGGCG2940
CGCAGTGTAG CTCTCCCAAG TCTATGGATA CAACTTGCGT CAGTGTGGAT CTTTGGCTCA3000
GATTCGGAGG GGCAGTGGGG TAAACAAGAA CACGCAGCCA CTCTCGGCTT TGCGGATCCC3060
CACGGAACGC CAGTCAACCC TGAAGATTCA GTCCGGGCCT GGGCTCGGAC TGATTTGGTG3120
AGGGGATTCT GCATCCGTCC AAACCTTATC ATCGTTGGTG AGACGGACTC CGGACAGCCA3180
GGAGCCTTAT T 3191
<210>21
<211>4031
<212>DNA
<213>Aspergillus niger
<400>21
GGGGTCAAAG GACACAATGT CGAAATAGCG AGATTGCTGT GCATCATCGG GGCTGTCTAC60
AGTCCGCTGG ATTTCTTTCC CTCGGTTAAG TATTTCCTGC ACGCCGGACC CGCCAGGGCC120
ACCTGTATTC CTAGTAAGCG ACCGTGGTGG GGTGACAGAA TGGTGGCGGT GGTGGCATTG180
CTGCCTATAC CTGGGTTCAC GATTATGGAG CCACCGTAAC GCTCGTCGGC AGGATCTACC240
TGTGCAGGCA GTTTTATGAC GGCCAGGGCA GCCGTTTTAT TTTCAATGGC ACTAGCTGAC300
CAGTCTAGGG GAACTTCGAG ACGTGCACAT AGATAGTCCT GGTAGCAGGG GATGAAATTT360
AGTGCTGAGC CTGGCGCAGT CTGGTAGGAG CGGGTTAGAC TGTGAGAAAT TATAATAGGG420
CGGATGAGAT CAGTACGCTA CTCCAGGAGA AGTCCCCGGC TTGCACCGCA GACGGCATCA480
TGGGTTGGTG TCGCAGGGAG GAGGGTGAGT TGAGTAAGAG AGAATTAATG AAAAGGATGG540
AGTAGCCGAC CATATAAGTA CTGGATGAAG TGAGCGAGTT AGCGTCAGCC ACGACGGGCT600
GACATGCATG ATCGGGGCAC CGCCGGCAAC CGATACAGCC TCAGCTCGAC GGGAAAACGT660
GGTTACCTGG ACTTAGAAGA TGATAATACA ATGAAAAGAT AGCGTAGATT GCCATAAATA720
CGCCACAATC TATTTATTAG GCAACAATCA AGTAAGAGCA GATTTGGCGA CTCATAGTAG780
TCCCCATGGA GGGGCGCGAT GGTTTTCTTC GCCGAAATAA TCGCTTAATG CCTCTAACGA840
AGATCTCAGA ACCTCCAAAC TGTAGTATTC TTCTCACAAG CAAATCCGAG AAACGCAATT900
GACCATATGT CCTTAGTATG AGGGCTAGCA GGAATACTTG TTTGTCGATG CATACCGACT960
AATAAAAATG GTTCTTCTTT TTCGCGCAGG GATTTGGTTT TTCATTTTTC ATTTTTCATA1020
TTTTATGTTA TTTTATTTTA TTTTTTTGTT TTATTTTATT TTATTTTTTT TTTTTAAATA1080
AGACTGGGTG TTTTCGTCTC CCACCCCTGC TGAGGAACTG TTTGATATAC AGAAGCCTGA 1140
GATACTTGAG ATTATGTGAC AAAGAAATTG TAAACCTGAA TGTGACTAAG GCAGAAGAGA1200
GCAGGTGAGG CCACACAATA CTGTACACCC ACTTCCGATC GTCATCGAAA TGAGCGTTGT1260
GGGTACTGGA ACGACAAACC ATAGATCGGA TCTGCATCCG AATAGGCTTT ACTTTGTACA1320
TTGGTAGGAG TTTGAATGTT TGAAGATCCG GCAGATGATC ACCTGCTGCA GGGAATAATT1380
TGAAACCTGT CCGTCTGCTT TGACCCAATT GACGAGGTAC GTGATTTGAT GCTACCCAAG1440
CAGTATGAAT GCGACGGAGG TGGCTATCCT TACCTTGTCA TATGCAACTC ATAACGGGTA1500
GTCCCCATGG AGCCACGGCT ATTTATTTCT AAGGGCCAAC AGTGAAAGAT TGTGAGATCG1560
TATACCTCCT GGGTATGACG CAACCAGGGT GAGCACTGGC ATTGCTCCAA TCCATATGGT1620
GGAGGTATGT CTCCGAGACC ATGACGCATG TAGACCCTGA CCTGTCCCTG ATCCAGGGAT1680
CTGGTTTGTC ACTTGGCGTA TTTTAATTAA CTGCGGGTCA GGGTCTTGCC GTCCAGACCC1740
AATGGATGAA TTGCCTGCGT GGCCCTGCAG TTCCAGCGAT CGGCACGGCA CGGCTATGAC1800
GTCGGTGGGT GTTCCGTTTG ATATTTAACC ATAGAAGACA GCCTTGTTAT GCTGGTTCCT1860
GCCGCAAAAT AAAGGTCTAT CCTTACCACG TTAAGTGTCA AAATGAGTGG GGTAAGCTTT1920
GCCCGTCAGG CCTTACTCCA GGCTGCTCTT CTTTCGATTG TCTCCGCAAT CCCGGCGCCC1980
ACGGCCTTCG TCAACAATGT CGCTCCGCCC GAGCCCATCA TCACCCCTTC GCCGGTTCAA2040
CATCGACCTT CTCGAGTCGC TGGTCGAAAC ATTCTGAGTG ACGTCGATTC TGATATTAAC2100
AGCATCCTTT CTGGCCTTGG ATCCGACCTA CCCTCCTGGG TCGCATCGGG TGTGCCCAAC2160
TACTTCCAGG GTTTCCCTAC TGGGGATGCA GTGGTGAGCT CCTTGGGCTT GAACAGCGCT2220
GAGTTGGCAG CCTTGCCCAC CAATGTCTTG AATATCGACC CATATGCCAA CTGGACTAGC2280
TCTGGCTGGA ACGTTCGCTT CCACGGAAAC GTCTACAAGC AGCCCAACAC CTCCATCTCC2340
GACCTCAATG ATTTGGCTGA TGTTTTCCTC GGCAATACAA GCATCTCCGA CCTTTCCGAA2400
TCCGAGCAGA AACAGGCTCG GAATTTAACA GCGGAAATAT TAGTGGTCCA GCAAGCTCAC2460
GTCGCCGTAA ACACAATCCA CCTGGAGCCT GCACCGAGTC AGGGATCCAG CGGACAGTCA2520
GGCGGCGGTG GATCCTCTAA TACCACTGGC GGCACCCAAG ACCTCACTCT GCCCTACAAC2580
ACTACAGTTG AAGGCGATTT TGACACTTTC GTACCGATTA GCAGCAATGG CTTGACGGCA2640
GGTAATGAAA CTTCGGCGAT ACAACGGCTT AACGTCCATG TGGAGGGCGC GACAATAGGA2700
AACAGTACTG CCTATCTCGT ACCTCCGACC GGGCTCACTG TCGTTTCGGA CATCGATGAT2760
ATCCTACGCG TCACCAAAAT CTATGAACCA GAGCAAGGTT TACTCAACTC ATTTGCGCGC2820
CCCTTCAGGC CGTGGGAGAA TATGCCGGAC ATCTATCGCA ACTGGTCGAT CAGTCTCCCC2880
AACCTGCACT TTCACTACCT AGTAAGTCTG CTAGATGTCC CTGATTGCAT TGTTGCTGCA2940
TACTCACCAC TACACTACAG ACGACGACCC CCGAACAAGT CACCAGGAAC TACATGCAAT3000
TCATCTACGA CAACTACCCC GGTGGATCTT TCGACACCCG TCCCCTCAAC TTTAGCGACG3060
TTTCCGCCAC CTTGTCGATC CGGAAATTCC TCCTGCAAAA GGTCTTCGAG ACCTTTCCGC3120
AGCGCAAGTT CATCCTCATC GCCGACACCA GCAACAGCGA CGTCATGCGT GACTATCCTG3180
AAATGGCGAC CGACTTCCCT GGTCAAGTGC AATGTATTTT TCTCCGGAAC ACCAGCGCCA3240
CCGACTCAGG GGACAAATTC CCATACGATA CCTCTGGGTT TAAGAAGCTC AATCAGTCAA3300
ACTACATGTT CTTCTTGCAT CCCGATGACT TGACGAATCT AGACATCGCG AATGGCCAGT3360
GTTACAACAC ATCCATTCCG CAGAATTTAA CGTTTAGTTA TCAGGGTTTG CCATTGGGGC3420
TGGGTGATGA ACCCACAGCT GTCAATGGGT CTGCCAATCA TACTGCTGAG TCGGCGGCCG3480
GTTTGTCGGT AAAGGGTGGG ACTGATATGC AGGGTTTGAT CTTTCTGTTC ACCCTGGTTA3540
CGGCCTATTC CATTTTCTTG TAAATATCAG TTACGATGTA TGAGAGATAA CGACTTTGAT3600
ATACTCACGG CTCAATTTAC GTTCCAAAAC CGAATACAGC GGATATCTAT GCTCGATGCA3660
AGGACTACCA CTATGTTACA CTACTAAGGG TTTATCTACT ATGGGAAATA TTAGTGCTTG3720
GTTTGTTACA GCTCACTCGA GCTTGCGTTA CTAACCACTT TTATCGGTCC ATGGATCCAC3780
CGCCCAACGC AGTTATCCCA GGAGGTGGCC GCAATGGCCA GTCAAGTCAA TTAAATCTCC3840
TCTGCTAGGA ATTGCATGGG TTTTGACAGA CAGAACTCGG GGAAAGTATC GATATTCAAT3900
GATCTGACGG TGGCTCCGAA ATTCGCTAGG CTAGCCCTTC ATCACTAGTA ATATTAGTTG3960
TCCAACTTTC GCGCTTTACA CTTTCCATAG CAAACCCCCA ATTCCCAGCC AAATCCTCAT4020
ATCCTCTAGG A 4031
<210>22
<211>3771
<212>DNA
<213>Aspergillus niger
<400>22
GCTTCTATGG TATCAAGGGT CGCGTAGCCA AAAGTTTAAC TGCATCGCTG CGGTATTAGT60
CGGTGTAGCT GGCTGCAGCT TTCGTTGTGT CCCTGGTCTG TTTAAGAAAC GGTATCAGAT120
CTGTCCCGCC CGTCCCCCTG ACACCGGCAT TGAGTTTCTC ATGAGAATTG TCCACTATTG180
TCGACGTTGT TGTGGCTAGG TTTGTTCTCG AAGATACTTG GTTTGGCGGC GGAGTCCTTG240
CAGCCATGAT GATGTATCGA GTCACCATCC GCACATGCTT ATCGCGAAAT CCCCCAAGTG300
ACATAACCGC CATGTTATAT GCATCCCTCA AAGCAGATCC GGGCTTGTGA CTTAATACAT360
AGGATCTCAC ATTAGACGTG CGGAGCATCA TTTCCAAGAA GCGTCGGTGA GGGCCTGGCA420
TGTAGTTTCG CATGTTCTTG AATATACAGT CAGTATCGAC ATTGCTTTGT CTGGATAACT480
CCTCGAAGAT CAGTCCTTAC CTGCATAAAA CCAGTCATGA CTTGAGGATT CGACTTGCCG540
TGAGGCTTGG TCTCCCCAGT GGCCGAATGT TCCACACCCA AGAAAATGTC GAAGGCTTGG600
ATCAGAGAAC TTTGAGCATT GCTACCACCA CTGTATTGAT GCCATTCGCC TCGTCCTTCC660
CCAACATCAT AGAATACGCC GTTTGGCAGC CCGGCCGATG CCATGTTCTT GCTGCCGGCT720
AGGTATGGAC GTAATTGATG GTAAAAGACG GGCGGCGCAC ACTTTTCATA CATGCGTTCC780
AAGAGGTCAC CGAGTTCCTT GAGACCATAA TTGAGCTGCT CCAGACGAGA AATAACACGC840
TGGCTATCAT CAACATTAGC TGCATGCATA GCATCCAGCA TTAGCTCGAT GAGCTGTGCT900
CCCTTGGCCT CGATAGCGAC GGAGAGGACG AAAAACCATT CTTCGTCTTT GGTGCCTGTG960
AACGAGGTCA CCACTGATAA ATTGTCTGGA TCCGTAACGT CTGTATCAGT GGATGGTACT1020
GAAAAGTTCC AAAGATTGAG GGCAGCATAT GTAGCACATG GTGGTAGCTC TAAGTGGTTC1080
GAAACTTCGA TGAATGGGCG TGATATACAG GGGGGTAGCA CCTGTATAGT TGATGTCAGC1140
GAAGGCACGG GCCATGCAGT GATAGACAAG AAAAGAGGGA TTGAATAAAA GACTCGATTC1200
TGAAGGGGAG TAATACATCT TTCGGCTTCT CACCACCCCA GATGTAGGCG TGTGTAAGGT1260
AAGCAAGCAC AACATATGCT CTCCGCCACT CAGGTTCCCC CTTCAACTTC TTCGTAGAGA1320
GTATACCCAG GTCATCGACA GACCTCCTGA TAGTACCAGA CTGAATCAGG CCAGGCAAGT1380
CCTGAGCGAT TTCCTCCCAC GGGGAATAGT AAGGGTCTTC CAATCTCCGT ACGGGAGGAA1440
CTTCCGGGAG GAACCCGTTC TGGAGGGAGA CACCGTACGC AACAAGTGAA ATGTCTTGTG1500
TATAAAGCAT GATAATATAT GCACTTCAGT AGACAACTTG ATATTCAAGC CTCCTTGAAA1560
TGATCCTCAT GCAGGTAAGA GTAGATCCAA GTGTTTATAT TGTATTCCCA AGGAGGGACG1620
GAAGAAAACC GGATCCAGAG GGCTCGAGAT AGGGCCACCT GCATGAGCAA AGACGGGTCA1680
TTTCCCGTTT CACAACGACC ATTCTCAGGC AGAAAGGCAG TGGATTAGCG GAAAACTTAG1740
CAACCATCCG GATTTCTGGA GTGGATGCTT TGTTATCTCA CTTCCGGCAA CACGGATGGT1800
GAGGCGGAAG CGGAACGGTA TCCGGATCCG GAGGGAGGGA CAAACCGAAG TGCCTTGTGT1860
CACACGCCGG TCCATATATA AATGTTAATT GGTGACGGTC AGCGGATTGT TTCTGGTGTT1920
CATCCATTTT TTCTTGATAT CCTGGACCCA GTTATTGCAC TTTAATTACT ATCCAAAATC1980
CACAATGTCG AAGTCGAATG GCGTCAGCCT GGCATTCCCC GCCGAAGCAG CGACAAAGGA2040
ATATGCAGCA TCTCTAGACT CTTCTGATAG ACTTGCTGCA TTTCGGGAGA AGTTCATCGT2100
CCCATCGAAA GCAAATATTG CTTCCAAAAA GCTAGCAAAG CCTGGTGGGT TCCATCCTGG2160
CAACTGTAGA CCTCGTCACT AATGTCACAG GCCTTTCGCC CGAGTCATGC ATTTACTTCT2220
GCGGTAACTC ACTTGGCATT CAACCCAAGG CCACAGCAAA GTACTTAGAA GCACAGTTGG2280
ACACTTGGTC ATCTATTGGA GTTGGCGGCC ACTTCACTGA TCTTGAGGGC TCACCCTTGA2340
AGCAATGGCA GCTGCTCTCA GAGCAAGCAG CTGATTCAAT GAGCAAGATT GTGGGAGCAA2400
AGCCAGAAGA AGTCGCAGCG ATGGGAACAC TTACAACGAA CCTTCATCTT CTGCTGGCTA2460
GTTTCTATAA ACCGACTCAA ACAAAGCACA AGATCTTGAT GGATTGGAAG GCTTTCCCAA2520
GTGATCACGT AAGTTCGAAA GAAGCTGCCT TCTGCTATCA CGGCACTGAC GATTATATAG2580
TACGCTATCG AATCTCATAT TGCCTGGCAT GACCTGGATC CTAAGGAGTC TATGGTGCTC2640
ATCGGTCCAG ATGAAGGCGA ATACGAGATA TCCACCCAGA AGATTTTCTC TTATATCGAC2700
AAGCATGCTG ATGAGGCTGC TATGATTCTT CTTCCTGGTA TTCAATATTA TACTGGGCAA2760
CTGTTCGATA TCCAGAAAAT TACAAAATAT GCCCATTCGC GCAACATGGT TGTTGGCTGG2820
GATCTGGCCC ATGCGTTCGC TAATGTTGAG CTAAAGCTGC ATGATTGGAA CGTTGATTTT2880
GCAGCATGGT GCACATATAA GTACGGAAAC GCCGGTCCTG GAGCAATGGG GGGGCTTTTC2940
GTGCATGAAC AACACGGAGA GGTCGATTAC AGCGCGGGAG AAGATGCACC CAAATTCCGC3000
CATCGTCTGA CCGGGTGGTA TGGTGGCGAT CGATCGGTAA GATTCAAGAT GGACAACAGT3060
ATGTGTGCAC TTGGCTATAG AACAATTTTG TGGGCTAGTA AGCTGATACG ATTGATAACC3120
AGAGTTCAAA CCTATTCCTG GGGCAGGAGG ATTTCAGATA TCAAATCCTT CGGCCATCGA3180
CCTTGCGTGT CTTTGTGCCG CTTTATCGGT GTTTGATGAG ACGTCAATGG CAGATCTTCG3240
CAGAAAATCA TTGAAGCTAA CAGCATACCT TGAGTTCCTT TTGCTCAGGG ATTATGAAGA3300
AGAATCTAGG CCATTCAGCA TTATCACGCC CAAGGACCCC GAGGCGAGAG GCGCACAACT3360
GAGTCTATTG CTCAAGCCTG GTCTATTACA GAATGTTGCA CAGAAGTTGC AAGAAGCAGG3420
AATAGTCTGC GATAAACGGG AGCCGGGTGT TGTGCGTGTC GCTCCGGTTC CTTTGTACAA3480
CAGCTTCAGC GAGGTTTGGA CATTTGTGAA GATCTTCAAG GATGCACTGC AGCAGTGATG3540
GGTCTCACTA GATCATTTGG TCAGGACTGA GACCAGATTT GTCAAGTTCG CTCCGATGAA3600
TGATTTTTTA GATAGATACC AAATTATTTG ATTCTTAGAT TTGTTGAAGC TCTCACTGCG3660
ACATGGTCCA CAGCCACTGT GCAAAAGCAA ATAACTGAAG TAGGAACTCT ATGATAGACC3720
CGTACTGTTG AGGTTATAGA TTTCCAAAGC CGTTCCTTGG ATCACCACTT C 3771
<210>23
<211>3562
<212>DNA
<213>Aspergillus niger
<400>23
CCTGTGCTTG TGGTATGACA GAGCCACTGA TATCATCTCC TCTCATCTCC AGTTGTAATC60
GGAATTGATC GAGGGGGCCA ATCTTCCACA CAGCCCCATG GAAGACGCAC AGATGCTTTC120
GATGCCACGC TGGCAGACGG CCGCCAACTG TCATCGTCCA GTGCTGCCGC CATTCCCATG180
CAAAAGCCAA CGCTAAGAAG CGCGCGGGCG CCGAGTTTCC ACGCTTGCAG CTTAGTTCAG240
CGACCCAGCT CAGTGGCGGC TCGCTCATGC ATAGAAAGAT GGGTTTGGAC CCGCGCTGGG300
CCTTTCATCT GCAACACTGC TCGCAGACCA TGTGTGACTT TTGGCTGCAA AAAAAAAGAG360
GCTGGCGACA GCTGATCCAC TGTGCTATTC CTATCTCATC CTCCCCGGCT GGATCGAAAG420
CTGCACGGCA GGGGAAATCA ACAGTTGGGC TCTGACACGT ATCGAGCTAA CTGATGCGCT480
GTCCTTCCGC CTAATGCCTA CTAAGTCTTA GGGACGGGAC CATCATCCAA CATGCCACCT540
TGTCCTTCGT AATTCCTTTT TGATCTCGGT GATGGTGGCC ACCCAGGAAA TGACGTTCCT600
CACCTTGGCT GCAATTGGTG CCCGATGTCT CATCTCCGCT CAGAACGGCG GCGAGGGCAG660
AATAAAAATT GACGGGCACA GCAGGAACTA ATCAAACATA CCGGCGGTCT TCTAAATGAT720
CGTATCTCCC GGAATACTCC CTCTTTCTAC AGAAGCGGGG ATCCATTCGC CCTATATGTA780
TAGTGGAGCT TTGCCGCACT GATTCGCACG GCATTATACC TCCGCACTGC CGTGCCTTCA840
TCCACTTGAT TGTGGCCAGG GAAATATCAA CGGGGCAGAT AACTTGCCCT TGCATCATTA900
TTGCTCCGCA CATTCATTCA TTATCGCTCT GATCCCACAT CCTCACGCAG CTGCGACCGG960
AGTGTCCACA CTCTAATTGG GATGAGCATT GCCTTTCAGG AACTTGACTT TTTGTGGTTG1020
CATCTTTTGT TGCCTTACCC ACGCAGGCTT CGTTTATGAG ATAGCGATTT CAGGCCTCAA1080
ATTGCTGTCA TCACTTCCGG CCCCAAACTC GTGGGCGGTG CCCGCCCATC GCTGGCAAGA1140
AGCACAGACT AACGCCTTAC TTCGCCTAGT TGCACACGAT GCATCAAGAC TTCCTCCTAT1200
TTCACAACGA CCAGCTCCTT GCCATTTGTT GTTTCGAATG CCCCCTTCCC CGTGCCTTGC1260
ATTTCTAATT CCCATCTATA CCCTTTTGCG CTCTCACGCC CGCCTGACTA TCAATTTTTC1320
TGCCAGCATA ACCCTGCGTG CAGAGCGGTT GACAGCAGGC TTGCTAAGAG TCTTCGTCTA1380
GAAGAACTGT CTGGGTGGAT TCCTTTTCGG ATTAACTTTT GCTATTTTAA AAGCTGATTG1440
CACTACGGAG TACACCCGCA ATCTGATTCT CACTGATACT CCAATTAAAG GCCACTAATT1500
GCTGACATTT GTAACATATT TGCGTTTGCT TTCCGGTTGA AATTGGCGGC TTTGTGCTTT1560
CGATCGCTAG CAGTCTCTGT GCATGTACAA CTGATCGGCT ATTCAGTCCT ATTCGGAAGC1620
GGCACTGAGA GGCGGAGACA AGCCACAGAT ACGACGAGTC TGATTTTGAG ACGGGCGCAT1680
CCAACGAAAG CCTGCGATTG CAATTGAAGA TCTCAATTGG GGGACTGACA ACCTAATACC1740
TAAACATATC GAGGATTAGG CGCCAACACG AGCATGGGAA GCTTTGGTGC ATGCGACGGC1800
TGATCCATTT CTAACAACCG TTTTGCGCGC GCGTCCGAGG TAAGGCTCCC GATCCCTTGG1860
CGCTTTGCAT GTTTCACTCC GATGCATCTA CTGTTTATAT GAGTGCGGTG GGCAAGCTGT1920
GCCCACCGAC TGAGCATTCT CAACCGGCCC AATGCTGTGG GATCGATCCT CCCCTCCAAA1980
GTTGTCGCTC GGTTACACTT GATCGGAGCT TGTTCTGTTA TACACCAAAC CATCATGGAT2040
GTGACTAATT TGGCTGTCGA TTGTCCCGTT ATAGAGACCG GTTCCCTTGC TTTGTGGATG2100
GCTTCCTCCG AAGTGGACCA GAAGGCCTTG GGCAACTTTG CGGCCATAAC GGGCCTCGAG2160
AACCCGTTCC TGTCCGCGAT GCTGTACAAG ATTCTGGGGT TGTCTGTTAT GTTATCGAAG2220
AAACTCCTCC GTGCACGACG ATTGCGGCGC CTAGACCCCA CCCGAGAGAC TAAATCGCTT2280
CATCTTTATT ACCATATCAT CTGGCTTTCG CGTGAGGGTC TTCTGATATT AGAGGAGTTC2340
GTCCTGCCAC TGGTTGAGGG ATTTATGGAA CTCAAAATTT TAGCTTACAA GCTGCGCGCC2400
TCCTTTTACC ATATATTCGT CCTATTTCAG AACCAGCCTG CTGTCCACTC GCCGGGTATC2460
GTTAGTCTGC CGAGTAGTAC ACCTTTATCC AACGGCGTGA CAGAAGCGGA GTCACCATCC2520
AAGGATTCCA ATTTGAGATT TTCATTTCAG CTGAAGCCCG ACACGATAAC GGTTTCCGGG2580
AAGCCCAGTT CCGCCTCGGA TAGTGCGCCA CGAGGCAAGG TTACGCAGGC ACCCCCGGGC2640
TTTGCGCCGG TTCAACCGCC CAAGTCGAAC TCGGCGTTTC TCCTCCCTGC TCTCGATTAT2700
ACCCCTACAG CTACCGCATG CTTCAATCAT GCCGCCCTCT TGGCAGATCA ATTCCTCCCG2760
GGGTCGCACC CGCTCCGTCT GTCCATCAAG CTTGAATTTG CCGCCTACCT CTACGATTGC2820
CTACATGACG CTCATGCCTG TCGACGGTTG GCCAAGCAAG CCATTGCCGA TGTGTACAAT2880
GCGCAAGAGG GCATGGACGA CGAGAGCTTC GAGGATGCAG CTGAGATTGT GGGTATTTTG2940
GGCAAGATGG TGAAGCGGGG AAGGAACACA AGCAGTGCTG GAAATAGCAC CACGGCTGTG3000
AAAACGCCCC AGGAGGAGCG AAGTGAGGGC AGTCGAACAC CATCCTCTCA GACAACGTTG3060
AAAAGGCCGG CGCGAGTGCC GAAAAGCACC TCCTCACCGG CGCGCGCGAC CAAGCCGACG3120
ACTAGCGAGG GGATGTCCCC CGCTGTGCCC GACCCCACCA TGATGAATCC CATATGATGC3180
CTTTCCCTAC GACCTGTATA TGCTTCTTCT TGGAACTATG GAGTCGCGCA TGAGCGCTTG3240
GCCTGTGACT TCTACTTGAC TTGCACCTGT CTGTATCATC TCGGTAACGG AGTTGCGGCG3300
ATAGACTGGA ATTGGGCATC AGCTTGCGGG GAGCTGTGGA ATGAGCGATT AAGCGCGACA3360
AAAACTTGAG GTGGAAGGGA CAGACCAGCC AATTTGTGAT GGTGACTGTA GATAGATAGA3420
TGTGTGCAAT ACAAAGTATG TTGTTGATGT CATGCACCCC ACTTGTGTAT GCTTGTCTGG3480
ACAATGGACC TACACTTAGT CGCAACAACT GTATGTCTCA AGCCAATGGC CATGGGGCAG3540
GATGGATCGA TGGATCTCTT GT 3562
<210>24
<211>4361
<212>DNA
<213>Aspergillus niger
<400>24
CGACGGACTA ACGTCGCGCG CCCCATTTCA CGTCTTGAAG ACAGATGTGT ATGCGATTGC60
TCGCGAAATT CTCATCCGAT TCCGTCGGCT TGACCTGACA TCTGGAATAG ACGAACAGGA120
CTTGGAAGCT ATCATTCGTA TTACCGAAGA GTCCAACGTA CTTCTCACTG ACTGGTGGAA180
GTCCGTCCCG AAACTGTATG ACTTCGATTA CTGGAAAGCA GACGGTCGAT GGGAAATGAT240
TGAAGGCCAG CTGCAAAGGC TTCCCTCCGA AGCAAGGCAA CAGGTGGAGA CAATATATCT300
ACAGGCTGCT GTTCTCCAGT TGACGTACGA CGGCATGGTC ATCCAAGCAA ATAGACCACT360
GTTGGAGCGA AGAATCAACA GGCTAACATC TTCGCGGGCG ATCGTGGATG CGATGCATAG420
GGCGCTTGAC CGAGCCACTG CTGCTGCTCT CCGCATATCC CGTGTTCCAG TTCACAAGCT480
GAAAAATCAT TTTGCTATAG CAGTCGTATC GATGCAAGAG TTCACTGCTG GTGTGATTCT540
CTGTATACCT CCCACGGTGA AGCCTTTAAC GGCCACCGCT CATGAGGCGA AGGACGGGGT600
GGTAAGAATA ATACGCGCCA GTCGAAGTCT CAAGAGCCAC GATCGAATAG CAAGGCAAAC660
TGAACAACTT CTGACGGAAC TACTCAAAGT TACCACCCAA CGCGAGATAA CGCACGCCTT720
GGCCGATAAT CTCGACACCA ATTTCCCCTC CGATACGCGG CTAACAGGCT CCGTTGTTGC780
CGGCGCCTCA AGTGACTCCT TGGGTGCAGG ACGCTCCAGG CCAGTTCCCG GATCCGCAGC840
GCAGGCAGTT GTAGATCCTA TCCAAGGAGC CTGGGACTCA GAATTCAATG CCCTCCCTGC900
CGTAACGGGA CCTTATGATT TCCTCCCTGC TCAAGCCTTT CAACAGCTGG ACGATACATT960
TGGTGCCTTT GGAGAATGTA ATATCCCTTG ATCACCCCAG ACTCACATCC AGATTCTGAC1020
TGACCTCGTG CATAGCCATA TTTAACTTGG TCCCTGATGA TCAAAACAGT ACATGGAACT1080
GGGGCCGAAC ATTTCCCTAG CCAAAGGAGC ATCAGGGATT CAACGTGATC AGTACAGCCT1140
TGTAGCTCGC TGAAACTGCC CTGGAGCCAA GCCAAAGCCT AGACAGCAAG GTGCATGGGC1200
GAGCTTTGCG AGGATTTAGT TGTTATTTAG TATGCCAAGA TTAAGCCACG CAGAATGGCT1260
TATGGCCATA GTAGCAACAA CGGCCACGGA ACGTTCTTCC ATGTGGTATG GGGAAAGCCG1320
CCGGATATTT GGGGAGGGCG TGATTGTTCC GGTGGCTATC TTTCCGGTGG AGATAACGGC1380
GGTGGACCAT CAAAACTCCT CAGCCCGGAT TGCTCGGACT CCGCATCGTC AAGTATCGGT1440
TTCATGACAG CCATTCGACT ACTTAGAAGA CACAAATAGC TATCCAACTT ACCCGGACCT1500
TTGATAATAA TTTTCAGCAG ATCTGTCGAT CTCAGAGACA ATAATGCCAC CGTTCTGTGT1560
GGAAGGCACT GCGCCGTGGT TTAACAATAA TAAAACTCCA AATTGCCCAA AAGCTAGAGC1620
GAAGGAAAGT CGAGAAGCCC AGTCTAGACT GGCGGGCTGA TCGTCCGGTT CACAACCTGA1680
TTGACAAATC ATCTGTGACC CTCGATGTTC CGCGGCGTTG AGCGGGTGAG AATGTGGATC1740
CTAGTGGGGA AGACCCAATT GCCGCCGGAA AAGGTGAGCT TGTGCTGCAC ATGTCCGGTG1800
GCTCAATTCA GGGCCATGCC AGGACATTGC TCTTCAAAGG GATGCGATTG CTATTCCCTA1860
TTTACTTCTT TAACCCGCTG ACGGGCCTGT CTGGACCGAG AATTCTTGGT CAAGTTTCAG1920
TGGAGCGATC CAGGAAAGAA CATCCGATAT GGACAGTTGC CCTCGATCTC AGGTCTGTAG1980
TCGTGTGACA CAGAGGCCTC TACTCGCTTG CCTTGCATGT CGGAGCTCAA AGGTGCGATG2040
TGAATTAACA CGAGGAGCGA CTGTCTGTCG CAGATGCAAC ATGAGAAATT TGGAGTGTGT2100
CTACACAAAA TCACGAAGGT ATCCCTCGTC TATCTTTCCG TGTGTATTAT TAGCCGAGAG2160
TCACGCAATG CTCTTTGTAT ACAATGAAAT AATGTTGGAG CTAGAGAATG ATTTCTGATA2220
GTTATATGTT ACAGGACACT CAGGAGGTCG TCAACTAGTC CGAACACGGC GTCCTCTCCT2280
GACACTAATG CCTCATCTTC GCCATGCTCG GACTCTAGTG GGACCCATGC TGGCATTTCC2340
ATTCCCCACT CAGATAGTCC CGCCAGTGTG GACGAATGTG GGAACAACGG CCTTTTCGAC2400
GGGGGTAGGT AATATGTCAT GCTTACCTGC GACACTCACT CACCATTCTT CTAGAATCTC2460
TAACTCAATT ATTGGTCTCT GGGAGCAAAG CCATATCAGG CCAACCACAT ATCGCCATTA2520
AGCCACATGT TCTGTCTACC TATCCCCTTG ACAACCTCCT CTCAGACATT GAGGGACTCC2580
TCGAGCAGCC AGTCTCTCAT TTGGCTCAAA GCAAGGAAGA TCTAACAAAA CCGGACCGGA2640
TGTTTCGAAC TCGCCTTCCA GCGGTCTCAG GTGAGGACAA TGAGTATCTG CTAAGGAAAG2700
GAGCTCTGCT GCTCTTGCCA CCAGCCTTGC GCAACGAACT ATTGGCGGCA TATGTCAACT2760
ACGTCCATCC GCTATTACCG ATTCTTGATC TTGGAGACTT TCTCTCACAA ATCATTGTTG2820
GAGATGATGC TCAATTCAAG TCACCACTAT TATACCAAGC TGTCATGTTC GCGGGCAGTA2880
TTTTTGCTCA GCGAGACGGC ACAGACGAAC CTGAACAGCT AACGAGGGCT TTATTTGAAC2940
GTACAAAGGT TAGTAATGGT TACAATTAGA CATATCTTAG ATATACTGAG CGATTTCCAG3000
GTTCTATACG AGTTTGAATC CGAATCATGT GCCTACACTC AAATTCAAGC TCTCTTATTG3060
ATGACTCTCT GGCATGGAGA TATGTCACGC CACAAAGGCC CGTCTTACTG GCTTGACGTC3120
GCCTTCTCCA CTGCGGAAAG AATTGGCCTA CTCCATGATG AAGACTGGCC ATGCGATAGC3180
CGTTCCTTCC GATCCGCTAT GTGGTGTTGC CTTTACGTAC GTGATCGAAC AATCTCGCTT3240
GGGTCTCGTC GGCCTCCACG GATGCCAGTC AACAAATATC CGGACTCAAT TCTCCATCTT3300
ATGAGCGACG CACCTCGGGA ATATGACGAA ATAATTCTTG AGAGTCTAGG TAGCGCTTCT3360
CTGATGCTTA CAAGCACTTA CCAAGAACAA TCGACCATGC TCTTCAAGGA ACTTGTCAAA3420
CTCTCCTACT GCGTCGGGGC AATCTTAGAT TATCTATACG AAGGGGCCTG GGTCCGAATA3480
CCAACACGTC GCAGCAGCTT TTATTCACTC GCCCCTAAAT GCAGCATCTC GCCATCCATC3540
AGACCAAGCT GTGAGAAACT ACTTTACTCT TGGATTCAAT TCCTCCCTCT CAACGCAGTC3600
TACCATCCGC CACAGTTGCC CGCCGATGCG GAAGGGGAGT CAGCCGAAAC AGTCTTCCTT3660
GTCCACAAAG CCTTCCTTTA CTTGCTGTAC CTAGCCTCCA TGGCAGTCAT ATACCGCACA3720
GGCACTCATA GCCAACAAAC CAGCACGGCA ACTCCGAACA TGGAAGGTCT ACGGGCATCG3780
ACGTCACAAA TAAAAAAGGT CCTTGCGGAG CTGCAGGGCA TGGGACTGCT TCAGTTCCTT3840
CCAGGGGCAT CAGTCACTAT CCTGATGTTC GCTGTGGAGG CTAGTCTGTT GGATCTCCAG3900
GGCTCGGATA CCATGGTCCG AAGGCAGGCT ATGTCAAATC TATATGCCTG TGAGGAGGCT3960
GCGTTACACT TGATGCAGGC TTATCCTACG GCTGAGATGG CGGTATTGAA GACTAGGACA4020
GCCCGTGCAA ACCTTCTTGG GTTGGTTGAG ACATGAAGAC CAATCATGGA AGCTCTGCTT4080
CCATCAAAGC ATTGTGTCTT TGCTTAATGA ATGAATGGAT TATGAGCGTT TCGCAACCTT4140
CTTTAATGCA GCTACATAAT AGAGCATAAA CAGAGGCCCG GAAATATATA ATTTGGCTAA4200
GAACCCGGTT GCAAGCAGGC AAGTCACGAG GTGCAGAACA TACCATCAAG TTTATAGATT4260
ATTGTAGGGG ATATCCTCAA CAATATCTTA CTTCCACCAT TACGTACTGA AGATCGAGGT4320
TATCGGGGAC CATGCTGTCG TGTCAATAGG TACGACTCGT T4361
<210>25
<211>801
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(801)
<400>5
atg cct atc tcc att ccc tcc gcc tcc agc gtc cac gac ctc ttc agc48
Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
1 5 10 15
ctg aag ggc aag gtc gtc gtt atc acc ggc gct tcc ggc cct cgc ggc96
Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
20 25 30
atg ggc att gaa gcc gcg cgt ggc tgc gcc gaa atg ggc gcc aac atc144
Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
35 40 45
gcc ctc acc tac tcc tct cgt cct cag ggt ggt gag aag aac gcc gaa192
Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
50 55 60
gaa ctt cgc aac acc tac ggc gtc aag gcc aag gcc tac cag tgc aac240
Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
65 70 75 80
gtg ggc gac tgg aac agc gtc aag aag ctc gtg gac gac gtg ctg gcc288
Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
85 90 95
gag ttt ggc cag att gac gcc ttc att gcc aac gct ggc aag aca gcc336
Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
100 105 110
agc agt ggt atc ctg gat ggt tcc gtt gag gac tgg gaa gag gtc atc384
Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
115 120 125
cag aca gac ctg acg ggt acc ttc cac tgc gcc aag gcg gtg ggc ccg432
Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
130 135 140
cac ttc aag cag cgc gga acg ggc agc ttc atc atc acc tcc agc atg480
His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
145 150 155 160
tcg ggt cac att gcc aac ttc ccg cag gag cag acg tcg tac aac gtt528
Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
165 170 175
gcc aag gca ggc tgc atc cat atg gcc cgg tca ttg gcc aac gag tgg576
Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
180 185 190
agg gac ttt gcc cgc gtg aac agc atc tcc ccg ggt tac atc gac acg624
Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
195 200 205
ggg ctg tcg gac ttt gtg gat aag aag act cag gat ctg tgg atg tcg672
Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
210 215 220
atg atc ccc atg gga cgc aac ggt gat gcc aag gag ctg aag ggt gca720
Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
225 230 235 240
tat gtc tat ctc gcc agt gat gcc agc aca tac acg acg ggt gcc gat768
Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
245 250 255
ttg gtc att gac gga gga tac acc gtg cgg taa801
Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
260 265
<210>26
<211>1602
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1602)
<400>26
atg agt ggg gta agc ttt gcc cgt cag gcc tta ctc cag gct gct ctt48
Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
1 5 10 15
ctt tcg att gtc tcc gca atc ccg gcg ccc acg gcc ttc gtc aac aat96
Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
20 25 30
gtc gct ccg ccc gag ccc atc atc acc cct tcg ccg gtt caa cat cga144
Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
35 40 45
cct tct cga gtc gct ggt cga aac att ctg agt gac gtc gat tct gat192
Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
50 55 60
att aac agc atc ctt tct ggc ctt gga tcc gac cta ccc tcc tgg gtc240
Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
65 70 75 80
gca tcg ggt gtg ccc aac tac ttc cag ggt ttc cct act ggg gat gca288
Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
85 90 95
gtg gtg agc tcc ttg ggc ttg aac agc gct gag ttg gca gcc ttg ccc336
Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
100 105 110
acc aat gtc ttg aat atc gac cca tat gcc aac tgg act agc tct ggc384
Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
115 120 125
tgg aac gtt cgc ttc cac gga aac gtc tac aag cag ccc aac acc tcc432
Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
130 135 140
atc tcc gac ctc aat gat ttg gct gat gtt ttc ctc ggc aat aca agc480
Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
145 150 155 160
atc tcc gac ctt tcc gaa tcc gag cag aaa cag gct cgg aat tta aca528
Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
165 170 175
gcg gaa ata tta gtg gtc cag caa gct cac gtc gcc gta aac aca atc576
Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
180 185 190
cac ctg gag cct gca ccg agt cag gga tcc agc gga cag tca ggc ggc624
His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
195 200 205
ggt gga tcc tct aat acc act ggc ggc acc caa gac ctc act ctg ccc672
Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
210 215 220
tac aac act aca gtt gaa ggc gat ttt gac act ttc gta ccg att agc720
Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
225 230 235 240
agc aat ggc ttg acg gca ggt aat gaa act tcg gcg ata caa cgg ctt768
Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
245 250 255
aac gtc cat gtg gag ggc gcg aca ata gga aac agt act gcc tat ctc816
Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
260 265 270
gta cct ccg acc ggg ctc act gtc gtt tcg gac atc gat gat atc cta864
Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
275 280 285
cgc gtc acc aaa atc tat gaa cca gag caa ggt tta ctc aac tca ttt912
Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
290 295 300
gcg cgc ccc ttc agg ccg tgg gag aat atg ccg gac atc tat cgc aac960
Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
305 310 315 320
tgg tcg atc agt ctc ccc aac ctg cac ttt cac tac cta acg acg acc1008
Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
325 330 335
ccc gaa caa gtc acc agg aac tac atg caa ttc atc tac gac aac tac1056
Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
340 345 350
ccc ggt gga tct ttc gac acc cgt ccc ctc aac ttt agc gac gtt tcc1104
Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
355 360 365
gcc acc ttg tcg atc cgg aaa ttc ctc ctg caa aag gtc ttc gag acc1152
Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
370 375 380
ttt ccg cag cgc aag ttc atc ctc atc gcc gac acc agc aac agc gac1200
Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
385 390 395 400
gtc atg cgt gac tat cct gaa atg gcg acc gac ttc cct ggt caa gtg1248
Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
405 410 415
caa tgt att ttt ctc cgg aac acc agc gcc acc gac tca ggg gac aaa1296
Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
420 425 430
ttc cca tac gat acc tct ggg ttt aag aag ctc aat cag tca aac tac1344
Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
435 440 445
atg ttc ttc ttg cat ccc gat gac ttg acg aat cta gac atc gcg aat1392
Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
450 455 460
ggc cag tgt tac aac aca tcc att ccg cag aat tta acg ttt agt tat1440
GLy Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
465 470 475 480
cag ggt ttg cca ttg ggg ctg ggt gat gaa ccc aca gct gtc aat ggg1488
Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
485 490 495
tct gcc aat cat act gct gag tcg gcg gcc ggt ttg tcg gta aag ggt1536
Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
500 505 510
ggg act gat atg cag ggt ttg atc ttt ctg ttc acc ctg gtt acg gcc 1584
Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
515 520 525
tat tcc att ttc ttg taa 1602
Tyr Ser Ile Phe Leu
530
<210>27
<211>1392
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1392)
<400>27
atg tcg aag tcg aat ggc gtc agc ctg gca ttc ccc gcc gaa gca gcg48
Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
1 5 10 15
aca aag gaa tat gca gca tct cta gac tct tct gat aga ctt gct gca96
Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
20 25 30
ttt cgg gag aag ttc atc gtc cca tcg aaa gca aat att gct tcc aaa144
Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
35 40 45
aag cta gca aag cct ggc ctt tcg ccc gag tca tgc att tac ttc tgc192
Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
50 55 60
ggt aac tca ctt ggc att caa ccc aag gcc aca gca aag tac tta gaa240
Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
65 70 75 80
gca cag ttg gac act tgg tca tct att gga gtt ggc ggc cac ttc act288
Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
85 90 95
gat ctt gag ggc tca ccc ttg aag caa tgg cag ctg ctc tca gag caa336
Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
100 105 110
gca gct gat tca atg agc aag att gtg gga gca aag cca gaa gaa gtc384
Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
115 120 125
gca gcg atg gga aca ctt aca acg aac ctt cat ctt ctg ctg gct agt432
Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
130 135 140
ttc tat aaa ccg act caa aca aag cac aag atc ttg atg gat tgg aag480
Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
145 150 155 160
gct ttc cca agt gat cac tac gct atc gaa tct cat att gcc tgg cat528
Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
165 170 175
gac ctg gat cct aag gag tct atg gtg ctc atc ggt cca gat gaa ggc576
Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
180 185 190
gaa tac gag ata tcc acc cag aag att ttc tct tat atc gac aag cat624
Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
195 200 205
gct gat gag gct gct atg att ctt ctt cct ggt att caa tat tat act672
Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
210 215 220
ggg caa ctg ttc gat atc cag aaa att aca aaa tat gcc cat tcg cgc720
Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
225 230 235 240
aac atg gtt gtt ggc tgg gat ctg gcc cat gcg ttc gct aat gtt gag768
Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
245 250 255
cta aag ctg cat gat tgg aac gtt gat ttt gca gca tgg tgc aca tat816
Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
260 265 270
aag tac gga aac gcc ggt cct gga gca atg ggg ggg ctt ttc gtg cat864
Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
275 280 285
gaa caa cac gga gag gtc gat tac agc gcg gga gaa gat gca ccc aaa912
Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
290 295 300
ttc cgc cat cgt ctg acc ggg tgg tat ggt ggc gat cga tcg gta aga960
Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
305 310 315 320
ttc aag atg gac aac aag ttc aaa cct att cct ggg gca gga gga ttt1008
Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
325 330 335
cag ata tca aat cct tcg gcc atc gac ctt gcg tgt ctt tgt gcc gct1056
Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
340 345 350
tta tcg gtg ttt gat gag acg tca atg gca gat ctt cgc aga aaa tca1104
Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
355 360 365
ttg aag cta aca gca tac ctt gag ttc ctt ttg ctc agg gat tat gaa1152
Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
370 375 380
gaa gaa tct agg cca ttc agc att atc acg ccc aag gac ccc gag gcg1200
Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
385 390 395 400
aga ggc gca caa ctg agt cta ttg ctc aag cct ggt cta tta cag aat1248
Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
405 410 415
gtt gca cag aag ttg caa gaa gca gga ata gtc tgc gat aaa cgg gag1296
Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
420 425 430
ccg ggt gtt gtg cgt gtc gct ccg gtt cct ttg tac aac agc ttc agc1344
Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
435 440 445
gag gtt tgg aca ttt gtg aag atc ttc aag gat gca ctg cag cag tga1392
Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
450 455 460
<210>28
<211>1143
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1143)
<400>28
atg gat gtg act aat ttg gct gtc gat tgt ccc gtt ata gag acc ggt48
Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
1 5 10 15
tcc ctt gct ttg tgg atg gct tcc tcc gaa gtg gac cag aag gcc ttg96
Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
20 25 30
ggc aac ttt gcg gcc ata acg ggc ctc gag aac ccg ttc ctg tcc gcg144
Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
35 40 45
atg ctg tac aag att ctg ggg ttg tct gtt atg tta tcg aag aaa ctc192
Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
50 55 60
ctc cgt gca cga cga ttg cgg cgc cta gac ccc acc cga gag act aaa240
Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
65 70 75 80
tcg ctt cat ctt tat tac cat atc atc tgg ctt tcg cgt gag ggt ctt288
Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
85 90 95
ctg ata tta gag gag ttc gtc ctg cca ctg gtt gag gga ttt atg gaa336
Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
100 105 110
ctc aaa att tta gct tac aag ctg cgc gcc tcc ttt tac cat ata ttc384
Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
115 120 125
gtc cta ttt cag aac cag cct gct gtc cac tcg ccg ggt atc gtt agt432
Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
130 135 140
ctg ccg agt agt aca cct tta tcc aac ggc gtg aca gaa gcg gag tca480
Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
145 150 155 160
cca tcc aag gat tcc aat ttg aga ttt tca ttt cag ctg aag ccc gac528
Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
165 170 175
acg ata acg gtt tcc ggg aag ccc agt tcc gcc tcg gat agt gcg cca576
Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
180 185 190
cga ggc aag gtt acg cag gca ccc ccg ggc ttt gcg ccg gtt caa ccg624
Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
195 200 205
ccc aag tcg aac tcg gcg ttt ctc ctc cct gct ctc gat tat acc cct672
Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
210 215 220
aca gct acc gca tgc ttc aat cat gcc gcc ctc ttg gca gat caa ttc720
Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
225 230 235 240
ctc ccg ggg tcg cac ccg ctc cgt ctg tcc atc aag ctt gaa ttt gcc768
Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
245 250 255
gcc tac ctc tac gat tgc cta cat gac gct cat gcc tgt cga cgg ttg816
Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
260 265 270
gcc aag caa gcc att gcc gat gtg tac aat gcg caa gag ggc atg gac864
Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
275 280 285
gac gag agc ttc gag gat gca gct gag att gtg ggt att ttg ggc aag912
Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
290 295 300
atg gtg aag cgg gga agg aac aca agc agt gct gga aat agc acc acg960
Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
305 310 315 320
gct gtg aaa acg ccc cag gag gag cga agt gag ggc agt cga aca cca1008
Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
325 330 335
tcc tct cag aca acg ttg aaa agg ccg gcg cga gtg ccg aaa agc acc1056
Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
340 345 350
tcc tca ccg gcg cgc gcg acc aag ccg acg act agc gag ggg atg tcc1104
Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
355 360 365
ccc gct gtg ccc gac ccc acc atg atg aat ccc ata tga1143
Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
370 375 380
<210>29
<211>1779
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1779)
<400>29
atg aga aat ttg gag tgt gtc tac aca aaa tca cga agg tat ccc tcg48
Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
1 5 10 15
tct atc ttt ccg aca ctc agg agg tcg tca act agt ccg aac acg gcg96
Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
20 25 30
tcc tct cct gac act aat gcc tca tct tcg cca tgc tcg gac tct agt144
Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
35 40 45
ggg acc cat gct ggc att tcc att ccc cac tca gat agt ccc gcc agt192
Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
50 55 60
gtg gac gaa tgt ggg aac aac ggc ctt ttc gac ggg gaa tct cta act240
Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
65 70 75 80
caa tta ttg gtc tct ggg agc aaa gcc ata tca ggc caa cca cat atc288
Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
85 90 95
gcc att aag cca cat gtt ctg tct acc tat ccc ctt gac aac ctc ctc336
Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
100 105 110
tca gac att gag gga ctc ctc gag cag cca gtc tct cat ttg gct caa384
Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
115 120 125
agc aag gaa gat cta aca aaa ccg gac cgg atg ttt cga act cgc ctt432
Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
130 135 140
cca gcg gtc tca ggt gag gac aat gag tat ctg cta agg aaa gga gct480
Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
145 150 155 160
ctg ctg ctc ttg cca cca gcc ttg cgc aac gaa cta ttg gcg gca tat528
Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
165 170 175
gtc aac tac gtc cat ccg cta tta ccg att ctt gat ctt gga gac ttt576
Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
180 185 190
ctc tca caa atc att gtt gga gat gat gct caa ttc aag tca cca cta624
Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
195 200 205
tta tac caa gct gtc atg ttc gcg ggc agt att ttt gct cag cga gac672
Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
210 215 220
ggc aca gac gaa cct gaa cag cta acg agg gct tta ttt gaa cgt aca720
Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
225 230 235 240
aag gtt cta tac gag ttt gaa tcc gaa tca tgt gcc tac act caa att768
Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
245 250 255
caa gct ctc tta ttg atg act ctc tgg cat gga gat atg tca cgc cac816
Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
260 265 270
aaa ggc ccg tct tac tgg ctt gac gtc gcc ttc tcc act gcg gaa aga864
Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
275 280 285
att ggc cta ctc cat gat gaa gac tgg cca tgc gat agc cgt tcc ttc912
Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
290 295 300
cga tcc gct atg tgg tgt tgc ctt tac gta cgt gat cga aca atc tcg960
Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
305 310 315 320
ctt ggg tct cgt cgg cct cca cgg atg cca gtc aac aaa tat ccg gac1008
Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
325 330 335
tca att ctc cat ctt atg agc gac gca cct cgg gaa tat gac gaa ata1056
Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
340 345 350
att ctt gag agt cta ggt agc gct tct ctg atg ctt aca agc act tac1104
Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
355 360 365
caa gaa caa tcg acc atg ctc ttc aag gaa ctt gtc aaa ctc tcc tac1152
Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
370 375 380
tgc gtc ggg gca atc tta gat tat cta tac gaa ggg gcc tgg gtc cga1200
Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
385 390 395 400
ata cca aca cgt cgc agc agc ttt tat tca ctc gcc cct aaa tgc agc1248
Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
405 410 415
atc tcg cca tcc atc aga cca agc tgt gag aaa cta ctt tac tct tgg1296
Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
420 425 430
att caa ttc ctc cct ctc aac gca gtc tac cat ccg cca cag ttg ccc1344
Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
435 440 445
gcc gat gcg gaa ggg gag tca gcc gaa aca gtc ttc ctt gtc cac aaa1392
Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
450 455 460
gcc ttc ctt tac ttg ctg tac cta gcc tcc atg gca gtc ata tac cgc1440
Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
465 470 475 480
aca ggc act cat agc caa caa acc agc acg gca act ccg aac atg gaa1488
Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
485 490 495
ggt cta cgg gca tcg acg tca caa ata aaa aag gtc ctt gcg gag ctg1536
Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
500 505 510
cag ggc atg gga ctg ctt cag ttc ctt cca ggg gca tca gtc act atc1584
Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
515 520 525
ctg atg ttc gct gtg gag gct agt ctg ttg gat ctc cag ggc tcg gat1632
Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
530 535 540
acc atg gtc cga agg cag gct atg tca aat cta tat gcc tgt gag gag1680
Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
545 550 555 560
gct gcg tta cac ttg atg cag gct tat cct acg gct gag atg gcg gta1728
Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
565 570 575
ttg aag act agg aca gcc cgt gca aac ctt ctt ggg ttg gtt gag aca1776
Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
580 585 590
tga1779
<210>30
<211>266
<212>PRT
<213>Aspergillus niger
<400>30
Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
1 5 10 15
Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
20 25 30
Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
35 40 45
Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
50 55 60
Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
65 70 75 80
Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
85 90 95
Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
100 105 110
Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
115 120 125
Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
130 135 140
His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
145 150 155 160
Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
165 170 175
Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
180 185 190
Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
195 200 205
Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
210 215 220
Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
225 230 235 240
Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
245 250 255
Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
260 265
<210>31
<211>533
<212>PRT
<213>Aspergillus niger
<400>31
Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
1 5 10 15
Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
20 25 30
Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
35 40 45
Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
50 55 60
Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
65 70 75 80
Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
85 90 95
Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
100 105 110
Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
115 120 125
Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
130 135 140
Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
145 150 155 160
Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
165 170 175
Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
180 185 190
His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
195 200 205
Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
210 215 220
Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
225 230 235 240
Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
245 250 255
Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
260 265 270
Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
275 280 285
Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
290 295 300
Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
305 310 315 320
Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
325 330 335
Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
340 345 350
Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
355 360 365
Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
370 375 380
Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
385 390 395 400
Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
405 410 415
Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
420 425 430
Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
435 440 445
Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
450 455 460
Gly Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
465 470 475 480
Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
485 490 495
Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
500 505 510
Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
515 520 525
Tyr Ser Ile Phe Leu
530
<210>32
<211>463
<212>PRT
<213>Aspergillus niger
<400>32
Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
1 5 10 15
Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
20 25 30
Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
35 40 45
Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
50 55 60
Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
65 70 75 80
Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
85 90 95
Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
100 105 110
Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
115 120 125
Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
130 135 140
Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
145 150 155 160
Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
165 170 175
Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
180 185 190
Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
195 200 205
Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
210 215 220
Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
225 230 235 240
Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
245 250 255
Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
260 265 270
Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
275 280 285
Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
290 295 300
Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
305 310 315 320
Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
325 330 335
Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
340 345 350
Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
355 360 365
Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
370 375 380
Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
385 390 395 400
Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
405 410 415
Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
420 425 430
Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
435 440 445
Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
450 455 460
<210>33
<211>380
<212>PRT
<213>Aspergillus niger
<400>33
Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
1 5 10 15
Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
20 25 30
Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
35 40 45
Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
50 55 60
Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
65 70 75 80
Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
85 90 95
Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
100 105 110
Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
115 120 125
Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
130 135 140
Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
145 150 155 160
Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
165 170 175
Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
180 185 190
Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
195 200 205
Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
210 215 220
Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
225 230 235 240
Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
245 250 255
Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
260 265 270
Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
275 280 285
Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
290 295 300
Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
305 310 315 320
Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
325 330 335
Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
340 345 350
Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
355 360 365
Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
370 375 380
<210>34
<211>592
<212>PRT
<213>Aspergillus niger
<400>34
Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
1 5 10 15
Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
20 25 30
Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
35 40 45
Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
50 55 60
Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
65 70 75 80
Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
85 90 95
Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
100 105 110
Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
115 120 125
Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
130 135 140
Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
145 150 155 160
Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
165 170 175
Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
180 185 190
Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
195 200 205
Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
210 215 220
Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
225 230 235 240
Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
245 250 255
Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
260 265 270
Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
275 280 285
Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
290 295 300
Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
305 310 315 320
Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
325 330 335
Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
340 345 350
Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
355 360 365
Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
370 375 380
Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
385 390 395 400
Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
405 410 415
Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
420 425 430
Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
435 440 445
Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
450 455 460
Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
465 470 475 480
Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
485 490 495
Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
500 505 510
Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
515 520 525
Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
530 535 540
Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
545 550 555 560
Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
565 570 575
Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
580 585 590
<210>35
<211>1076
<212>DNA
<213>人工序列
<220>
<221>引物結(jié)合
<222>(1)..(35)
<220>
<221>啟動(dòng)子
<222>(13)..(1062)
<220>
<221>引物結(jié)合
<222>(1037)..(1076)
<400>35
ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCCGGGCA TGCGACCGGA GGACTCGGTC60
AGAGGCACGA ATATGAGAGG CCAGAACGCC GCACCCATGT TCCAAGATGT TGTGGCCCAG120
TAAAGGTTAG GAAATGGGGT GTTTTGAACG TGGAATCGTT CTTCCATCCA GTTGTTGCCG180
GAGCCGTAGG AACCGGCCGG GATACCAGTG AGGATGGAAC TATACCTATT AGCACTGCCA240
TCTTCGAGAA CAAGGCTAAG ACATACATGA AACAAACGGT GACCGTGAGA AGCCATTTAT300
AAGAGGTGCT CCAATTGAAC CTGAATATGT TAAAACTAGT ATACTAGCAA CTGCATGCTT360
GACGTACGGA TTGTCCGGGT CATCCTTGCC GTTCCAGGTA TGGATCTCAA GGTCCTCCCT420
GTCACGCAGA TCATTGTGGC TGACTACCCC GACATGGGGG TCCCGGCGAA AGAACGACCG480
CACCCTGCAA CGTCACTTAG TGGCTGTCTG ACAGGGATTG ATTGGCAATG ATTGGCAGAC540
TAACCGTCCC AGAAACGAAT CATCGAACTC ATTGGTGTGC ACTGTGCTAG CGCGGCGCAG600
CGACGGGCGT GGCTCCTCGG CAGGGGTGGA CATGACTTTC TCTGTGTAGA TTCCTTGCAA660
GGTATCTGCT TGACAGATGC AGAGATGATG TTGAGTAAAA TAGGGTGCAG AGACCCTGCA720
GAACCTGCAT CGGCCGGCGG CGACATGTCG TCATGACCGA CCCGGGCCGA GCGGAATTAA780
TGAAACTCGG AACAGCCAGG GGAATCCGAC GCTTTGAGTG GCCAATCCAT GTCTATCCAC840
ATCTGCATTG AAGTGGATGA AAGGTGGAGG AGGGCTGGTT GCCAAATTCT GTTAGGGCTT900
GGAATGTAAG CAACCGGTTT CGGTCATGAC ATCATCACAG CGATGACTTC ATCACTCTCG960
GACGAGCATA TATAGTTGTG CCTGTCGTCG TATCTCAACA AACATCAACA ACAACAACAA1020
TCATCTACTG CATTTACCAA ACTCATCTCT ACCTCAATCA ACTTAATTAA TGAAGT1076
<210>36
<211>1057
<212>DNA
<213>人工序列
<220>
<221>引物結(jié)合
<222>(1)..(33)
<220>
<221>啟動(dòng)子
<222>(13)..(1043)
<220>
<221>引物結(jié)合
<222>(1022)..(1057)
<400>36
ACTTCACTCG AGTTCTCACA AGCAAATCCG AGAAACGCAA TTGACCATAT GTCCTTAGTA60
TGAGGGCTAG CAGGAATACT TGTTTGTCGA TGCATACCGA CTAATAAAAA TGGTTCTTCT120
TTTTCGCGCA GGGATTTGGT TTTTCATTTT TCATTTTTCA TATTTTATGT TATTTTATTT180
TATTTTTTTG TTTTATTTTA TTTTATTTTT TTTTTTTAAA TAAGACTGGG TGTTTTCGTC240
TCCCACCCCT GCTGAGGAAC TGTTTGATAT ACAGAAGCCT GAGATACTTG AGATTATGTG300
ACAAAGAAAT TGTAAACCTG AATGTGACTA AGGCAGAAGA GAGCAGGTGA GGCCACACAA360
TACTGTACAC CCACTTCCGA TCGTCATCGA AATGAGCGTT GTGGGTACTG GAACGACAAA420
CCATAGATCG GATCTGCATC CGAATAGGCT TTACTTTGTA CATTGGTAGG AGTTTGAATG480
TTTGAAGATC CGGCAGATGA TCACCTGCTG CAGGGAATAA TTTGAAACCT GTCCGTCTGC540
TTTGACCCAA TTGACGAGGT ACGTGATTTG ATGCTACCCA AGCAGTATGA ATGCGACGGA600
GGTGGCTATC CTTACCTTGT CATATGCAAC TCATAACGGG TAGTCCCCAT GGAGCCACGG660
CTATTTATTT CTAAGGGCCA ACAGTGAAAG ATTGTGAGAT CGTATACCTC CTGGGTATGA720
CGCAACCAGG GTGAGCACTG GCATTGCTCC AATCCATATG GTGGAGGTAT GTCTCCGAGA780
CCATGACGCA TGTAGACCCT GACCTGTCCC TGATCCAGGG ATCTGGTTTG TCACTTGGCG840
TATTTTAATT AACTGCGGGT CAGGGTCTTG CCGTCCAGAC CCAATGGATG AATTGCCTGC900
GTGGCCCTGC AGTTCCAGCG ATCGGCACGG CACGGCTATG ACGTCGGTGG GTGTTCCGTT960
TGATATTTAA CCATAGAAGA CAGCCTTGTT ATGCTGGTTC CTGCCGCAAA ATAAAGGTCT1020
ATCCTTACCA CGTTAAGTGT CAAATTAATT AAGAAGT 1057
<210>37
<211>1061
<212>DNA
<213>人工序列
<220>
<221>引物結(jié)合
<222>(1)..(33)
<220>
<221>啟動(dòng)子
<222>(13)..(1047)
<220>
<221>引物結(jié)合
<222>(1023)..(1061)
<400>37
ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCACCACTGA TAAATTGTCT GGATCCGTAA60
CGTCTGTATC AGTGGATGGT ACTGAAAAGT TCCAAAGATT GAGGGCAGCA TATGTAGCAC120
ATGGTGGTAG CTCTAAGTGG TTCGAAACTT CGATGAATGG GCGTGATATA CAGGGGGGTA180
GCACCTGTAT AGTTGATGTC AGCGAAGGCA CGGGCCATGC AGTGATAGAC AAGAAAAGAG240
GGATTGAATA AAAGACTCGA TTCTGAAGGG GAGTAATACA TCTTTCGGCT TCTCACCACC300
CCAGATGTAG GCGTGTGTAA GGTAAGCAAG CACAACATAT GCTCTCCGCC ACTCAGGTTC360
CCCCTTCAAC TTCTTCGTAG AGAGTATACC CAGGTCATCG ACAGACCTCC TGATAGTACC420
AGACTGAATC AGGCCAGGCA AGTCCTGAGC GATTTCCTCC CACGGGGAAT AGTAAGGGTC480
TTCCAATCTC CGTACGGGAG GAACTTCCGG GAGGAACCCG TTCTGGAGGG AGACACCGTA540
CGCAACAAGT GAAATGTCTT GTGTATAAAG CATGATAATA TATGCACTTC AGTAGACAAC600
TTGATATTCA AGCCTCCTTG AAATGATCCT CATGCAGGTA AGAGTAGATC CAAGTGTTTA660
TATTGTATTC CCAAGGAGGG ACGGAAGAAA ACCGGATCCA GAGGGCTCGA GATAGGGCCA720
CCTGCATGAG CAAAGACGGG TCATTTCCCG TTTCACAACG ACCATTCTCA GGCAGAAAGG780
CAGTGGATTA GCGGAAAACT TAGCAACCAT CCGGATTTCT GGAGTGGATG CTTTGTTATC840
TCACTTCCGG CAACACGGAT GGTGAGGCGG AAGCGGAACG GTATCCGGAT CCGGAGGGAG900
GGACAAACCG AAGTGCCTTG TGTCACACGC CGGTCCATAT ATAAATGTTA ATTGGTGACG960
GTCAGCGGAT TGTTTCTGGT GTTCATCCAT TTTTTCTTGA TATCCTGGAC CCAGTTATTG1020
CACTTTAATT ACTATCCAAA ATCCACATTA ATTAATGAAG T1061
<210>38
<211>1097
<212>DNA
<213>人工序列
<220>
<221>引物結(jié)合
<222>(1)..(34)
<220>
<221>啟動(dòng)子
<222>(13)..(1083)
<220>
<221>引物結(jié)合
<222>(1060)..(1097)
<400>38
ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGAGCATTG CCTTTCAGGA ACTTGACTTT60
TTGTGGTTGC ATCTTTTGTT GCCTTACCCA CGCAGGCTTC GTTTATGAGA TAGCGATTTC120
AGGCCTCAAA TTGCTGTCAT CACTTCCGGC CCCAAACTCG TGGGCGGTGC CCGCCCATCG180
CTGGCAAGAA GCACAGACTA ACGCCTTACT TCGCCTAGTT GCACACGATG CATCAAGACT240
TCCTCCTATT TCACAACGAC CAGCTCCTTG CCATTTGTTG TTTCGAATGC CCCCTTCCCC300
GTGCCTTGCA TTTCTAATTC CCATCTATAC CCTTTTGCGC TCTCACGCCC GCCTGACTAT360
CAATTTTTCT GCCAGCATAA CCCTGCGTGC AGAGCGGTTG ACAGCAGGCT TGCTAAGAGT420
CTTCGTCTAG AAGAACTGTC TGGGTGGATT CCTTTTCGGA TTAACTTTTG CTATTTTAAA480
AGCTGATTGC ACTACGGAGT ACACCCGCAA TCTGATTCTC ACTGATACTC CAATTAAAGG540
CCACTAATTG CTGACATTTG TAACATATTT GCGTTTGCTT TCCGGTTGAA ATTGGCGGCT600
TTGTGCTTTC GATCGCTAGC AGTCTCTGTG CATGTACAAC TGATCGGCTA TTCAGTCCTA660
TTCGGAAGCG GCACTGAGAG GCGGAGACAA GCCACAGATA CGACGAGTCT GATTTTGAGA720
CGGGCGCATC CAACGAAAGC CTGCGATTGC AATTGAAGAT CTCAATTGGG GGACTGACAA780
CCTAATACCT AAACATATCG AGGATTAGGC GCCAACACGA GCATGGGAAG CTTTGGTGCA840
TGCGACGGCT GATCCATTTC TAACAACCGT TTTGCGCGCG CGTCCGAGGT AAGGCTCCCG900
ATCCCTTGGC GCTTTGCATG TTTCACTCCG ATGCATCTAC TGTTTATATG AGTGCGGTGG960
GCAAGCTGTG CCCACCGACT GAGCATTCTC AACCGGCCCA ATGCTGTGGG ATCGATCCTC1020
CCCTCCAAAG TTGTCGCTCG GTTACACTTG ATCGGAGCTT GTTCTGTTAT ACACCAAACC1080
ATCTTAATTA ATAGGAT 1097
<210>39
<211>1142
<212>DNA
<213>人工序列
<220>
<221>引物結(jié)合
<222>(1)..(35)
<220>
<221>啟動(dòng)子
<222>(13)..(1128)
<220>
<221>引物結(jié)合
<222>(1118)..(1142)
<400>39
ATCCTACTCG AGGCCTTTGG AGAATGTAAT ATCCCTTGAT CACCCCAGAC TCACATCCAG60
ATTCTGACTG ACCTCGTGCA TAGCCATATT TAACTTGGTC CCTGATGATC AAAACAGTAC120
ATGGAACTGG GGCCGAACAT TTCCCTAGCC AAAGGAGCAT CAGGGATTCA ACGTGATCAG180
TACAGCCTTG TAGCTCGCTG AAACTGCCCT GGAGCCAAGC CAAAGCCTAG ACAGCAAGGT240
GCATGGGCGA GCTTTGCGAG GATTTAGTTG TTATTTAGTA TGCCAAGATT AAGCCACGCA300
GAATGGCTTA TGGCCATAGT AGCAACAACG GCCACGGAAC GTTCTTCCAT GTGGTATGGG360
GAAAGCCGCC GGATATTTGG GGAGGGCGTG ATTGTTCCGG TGGCTATCTT TCCGGTGGAG420
ATAACGGCGG TGGACCATCA AAACTCCTCA GCCCGGATTG CTCGGACTCC GCATCGTCAA480
GTATCGGTTTC ATGACAGCC ATTCGACTAC TTAGAAGACA CAAATAGCTA TCCAACTTAC540
CCGGACCTTTG ATAATAATT TTCAGCAGAT CTGTCGATCT CAGAGACAAT AATGCCACCG600
TTCTGTGTGGA AGGCACTGC GCCGTGGTTT AACAATAATA AAACTCCAAA TTGCCCAAAA660
GCTAGAGCGAA GGAAAGTCG AGAAGCCCAG TCTAGACTGG CGGGCTGATC GTCCGGTTCA720
CAACCTGATTG ACAAATCAT CTGTGACCCT CGATGTTCCG CGGCGTTGAG CGGGTGAGAA780
TGTGGATCCTA GTGGGGAAG ACCCAATTGC CGCCGGAAAA GGTGAGCTTG TGCTGCACAT840
GTCCGGTGGCT CAATTCAGG GCCATGCCAG GACATTGCTC TTCAAAGGGA TGCGATTGCT900
ATTCCCTATTT ACTTCTTTA ACCCGCTGAC GGGCCTGTCT GGACCGAGAA TTCTTGGTCA960
AGTTTCAGTGG AGCGATCCA GGAAAGAACA TCCGATATGG ACAGTTGCCC TCGATCTCAG1020
GTCTGTAGTCG TGTGACACA GAGGCCTCTA CTCGCTTGCC TTGCATGTCG GAGCTCAAAG1080
GTGCGATGTGA ATTAACACG AGGAGCGACT GTCTGTCGCA GATGCAACTT AATTAATAGG1140
AT 1142
<210>40
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
ACTTCATTAA TTAAGTTGAT TGAGGTAGAG ATGAGTTTG39
<210>41
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>4I
ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCC 35
<210>42
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
ACTTCATTAA TTAATTTGAC ACTTAACGTG GTAAGG 36
<210>43
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>43
ACTTCACTCG AGTTCTCACA AGCAAATCCG AGA33
<210>44
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>44
ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCA33
<210>45
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>45
ACTTCATTAA TTAATGTGGA TTTTGGATAG TAATTAAAG39
<210>46
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>46
ATCCTATTAA TTAAGATGGT TTGGTGTATA ACAGAACA 38
<210>47
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>47
ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGA34
<210>48
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>48
ATCCTATTAA TTAAGTTGCA TCTGCGACAG ACAGT 35
<210>49
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
ACTTCACTCG AGGCCTTTGG AGAATGTAAT ATCCC35
<210>50
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
CAACACCTAC GGCGTCAAGG 20
<210>51
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
TAACCCGGGG AGATGCTGTT20
<210>52
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
CGATCCGGAA ATTCCTCCTG 20
<210>53
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
GCCGCCGACT CAGCAGTAT 19
<210>54
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
GTGCATGAAC AACACGGAGA 20
<210>55
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
ACTCAGTTGT GCGCCTCTCG20
<210>56
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
GTCGAACTCG GCGTTTCTCC20
<210>57
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>57
CCGGTGAGGA GGTGCTTTTC20
<210>58
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>58
AGCATCTCGC CATCCATCAG20
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>59
GCCTTCGGAC CATGGTATCC20
<210>60
<400>60
000
<210>61
<211>1226
<212>DNA
<213>人工序列
<220>
<221>基因
<222>(23)..(739)
<223>GFP
<220>
<221>基因
<222>(740)..(1212)
<223>BLE
<400>61
GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGCGAG GAGCTGTTCA CCGGGGTGGT60
GCCCATCCTG GTCGAGCTGG ACGGCGACGT AAACGGCCAC AAGTTCAGCG TGTCCGGCGA120
GGGCGAGGGC GATGCCACCT ACGGCAAGCT GACCCTGAAG TTCATCTGCA CCACCGGCAA180
GCTGCCCGTG CCCTGGCCCA CCCTCGTGAC CACCCTGACC TACGGCGTGC AGTGCTTCAG240
CCGCTACCCC GACCACATGA AGCAGCACGA CTTCTTCAAG TCCGCCATGC CCGAAGGCTA300
CGTCCAGGAG CGCACCATCT TCTTCAAGGA CGACGGCAAC TACAAGACCC GCGCCGAGGT360
GAAGTTCGAG GGCGACACCC TGGTGAACCG CATCGAGCTG AAGGGCATCG ACTTCAAGGA420
GGACGGCAAC ATCCTGGGGC ACAAGCTGGA GTACAACTAC AACAGCCACA ACGTCTATAT480
CATGGCCGAC AAGCAGAAGA ACGGCATCAA GGTGAACTTC AAGATCCGCC ACAACATCGA540
GGACGGCAGC GTGCAGCTCG CCGACCACTA CCAGCAGAAC ACCCCCATCG GCGACGGCCC600
CGTGCTGCTG CCCGACAACC ACTACCTGAG CACCCAGTCC GCCCTGAGCA AAGACCCCAA660
CGAGAAGCGC GATCACATGG TCCTGCTGGA GTTCGTGACC GCCGCCGGGA TCACTCTCGG720
CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGCCGTT CCGGTGCTCA CCGCGCGCGA780
CGTCGCCGGA GCGGTCGAGT TCTGGACCGA CCGGCTCGGG TTCTCCCGGG ACTTCGTGGA840
GGACGACTTC GCCGGTGTGG TCCGGGACGA CGTGACCCTG TTCATCAGCG CGGTCCAGGA900
CCAGGTGGTG CCGGACAACA CCCTGGCCTG GGTGTGGGTG CGCGGCCTGG ACGAGCTGTA960
CGCCGAGTGG TCGGAGGTCG TGTCCACGAA CTTCCGGGAC GCCTCCGGGC CGGCCATGAC1020
CGAGATCGGC GAGCAGCCGT GGGGGCGGGA GTTCGCCCTG CGCGACCCGG CCGGCAACTG1080
CGTGCACTTC GTGGCCGAGG AGCAGGACTA AAGGCGCGCC TGAAGT 1226
<210>62
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>62
GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGC37
<210>63
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>63
GCACTGGTCA ACTTGGCCTT GTACAGCTCG TCCATG36
<210>64
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>64
CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGC36
<210>65
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>65
ACTTCAGGCG CGCCTTTAGT CCTGCTCCTC GGCCA3權(quán)利要求
1.啟動(dòng)子DNA序列,例如
(a)以下列表所示的DNA序列SEQ ID NO1、SEQ ID NO2、SEQID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24,
(b)能夠與(a)的DNA序列雜交的DNA序列,
(c)與(a)的DNA序列至少50%同源的DNA序列,
(d)(a)到(c)中任何DNA序列的變體,或
(e)(a)到(d)中任何DNA序列的亞序列。
2.DNA構(gòu)建體,其包含與報(bào)告基因可操作連接的如權(quán)利要求1所述的啟動(dòng)子DNA,所述報(bào)告基因賦予可選擇性狀,優(yōu)選地,選擇性標(biāo)記基因。
3.包含如權(quán)利要求2所述的DNA構(gòu)建體的表達(dá)載體,其中所述DNA構(gòu)建體包含下述DNA片段,所述DNA片段與宿主細(xì)胞基因組中預(yù)先確定的靶基因座DNA序列同源,優(yōu)選所述預(yù)先確定的靶基因座包含高表達(dá)的基因。
4.包含如權(quán)利要求2所述的DNA構(gòu)建體的表達(dá)載體,其中所述DNA構(gòu)建體能夠在宿主細(xì)胞中自主維持,優(yōu)選地,所述DNA構(gòu)建體包含AMA1序列。
5.宿主細(xì)胞,其包含如權(quán)利要求2所述DNA構(gòu)建體,或包含如權(quán)利要求3或4所述的表達(dá)載體。
6.如權(quán)利要求5所述的宿主細(xì)胞,其還包含包含下述DNA序列的DNA構(gòu)建體,所述DNA序列包含來自下述DNA文庫的編碼序列,所述DNA文庫來自被懷疑能夠產(chǎn)生一種或多種目的蛋白質(zhì)的生物。
7.如權(quán)利要求5或6所述的宿主細(xì)胞,其中所述宿主細(xì)胞為原核生物或真核生物。
8.如權(quán)利要求7所述的宿主細(xì)胞,其中所述宿主細(xì)胞選自以下列表Bacillus、酵母或絲狀真菌,優(yōu)選地,Aspergillus、Penicillium或Trichoderma種。
9.如權(quán)利要求8所述的宿主細(xì)胞,其中Aspergillus為Aspergillus niger或Aspergillus sojae或Aspergillus oryzae種。
10.用于分離下述DNA序列的方法,所述DNA序列包含在宿主細(xì)胞中編碼目的蛋白質(zhì)的DNA序列,所述方法包含如下步驟
(a)制備第一DNA構(gòu)建體,其包含與賦予可選擇性狀的報(bào)告基因可操作連接的啟動(dòng)子DNA序列;當(dāng)所述DNA構(gòu)建體存在于宿主細(xì)胞中和當(dāng)所述宿主細(xì)胞產(chǎn)生目的蛋白質(zhì),優(yōu)選被分泌的目的蛋白質(zhì)時(shí),所述啟動(dòng)子DNA序列被誘導(dǎo);
(b)制備第二DNA構(gòu)建體,其包含包含下述DNA序列的DNA序列,所述DNA序列編碼來自下述生物DNA文庫的目的蛋白質(zhì),所述生物被懷疑能夠制造一種或多種目的蛋白質(zhì);
(c)用(a)和(b)中制備的兩種DNA構(gòu)建體轉(zhuǎn)化宿主細(xì)胞;
(d)在有助于產(chǎn)生所述DNA文庫中存在的目的蛋白質(zhì)的條件下,培養(yǎng)(c)中獲得的所有經(jīng)轉(zhuǎn)化的宿主細(xì)胞;和
(e)通過分析在(d)中產(chǎn)生的蛋白質(zhì),篩選產(chǎn)生目的蛋白質(zhì)的經(jīng)轉(zhuǎn)化的宿主細(xì)胞。
11.如權(quán)利要求10所述的方法,其中首先用步驟(a)中制備的DNA構(gòu)建體轉(zhuǎn)化所述宿主細(xì)胞,然后用步驟(b)中制備的DNA構(gòu)建體轉(zhuǎn)化所述宿主細(xì)胞。
12.如權(quán)利要求10或11所述的方法,其中步驟(a)中使用的所述啟動(dòng)子為權(quán)利要求1的啟動(dòng)子。
13.如權(quán)利要求10到12任一項(xiàng)所述的方法,其中所述被懷疑能夠產(chǎn)生目的蛋白質(zhì)的生物為真核生物或原核生物。
14.如權(quán)利要求10到13任一項(xiàng)所述的方法,其中所述目的蛋白質(zhì)為酶。
全文摘要
帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司B.V.24403WO,在宿主細(xì)胞中表達(dá)克隆的改進(jìn)方法,本發(fā)明涉及高度適用于經(jīng)改進(jìn)的表達(dá)克隆方法中的啟動(dòng)子DNA序列和利用該啟動(dòng)子的經(jīng)改進(jìn)的表達(dá)克隆方法,所述經(jīng)改進(jìn)的表達(dá)克隆方法用于分離下述DNA序列,所述DNA序列包含在宿主細(xì)胞中編碼目的蛋白質(zhì)的DNA序列。所述經(jīng)分離的DNA序列適用于制造目的蛋白質(zhì)的方法。
文檔編號(hào)C12N15/09GK101163790SQ200680008683
公開日2008年4月16日 申請(qǐng)日期2006年3月20日 優(yōu)先權(quán)日2005年3月18日
發(fā)明者羅埃爾弗·伯恩哈德·梅瑪, 蒂鮑特·喬斯·維恩策爾, 科尼利斯·瑪麗亞·雅各布斯·沙吉, 約翰尼斯·翰德里克·德溫德, 奧斯卡·保羅·柯伊伯斯, 魯特格爾·簡(jiǎn)·洛爾延范, 馬若蘭·科納拉·迪克, 布倫達(dá)·沃恩克 申請(qǐng)人:帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司