两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

哺乳動物的特洛德樣基因和蛋白質的制作方法

文檔序號:454326閱讀:285來源:國知局
專利名稱:哺乳動物的特洛德樣基因和蛋白質的制作方法
相關申請交叉文獻本申請要求了1998年12月11日提交的美國臨時申請No.60/111,873和1998年4月3日提交的美國臨時申請No.60/080,550的優(yōu)先權。各申請均全部納入本文作參考。
關于聯(lián)邦政府贊助的研究或開發(fā)的聲明有待決定。
背景技術
本發(fā)明涉及骨形態(tài)生成蛋白領域,更具體地涉及BMP-1/Tld家族中的基因和蛋白質。
哺乳動物如小鼠和人骨骼的形成受到一系列骨形態(tài)生成蛋白(BMP)的控制。在參與成骨的7種已知BMP中,6種(稱為BPM-2到BMP-7)屬于TGF-β超家族。第7種BMP(稱為BMP-1)并不象TGF-β,而看來衍生自不同的基因家族。BMP-1基因家族成員通常含有下列結構域蝦紅素樣金屬蛋白酶結構域,一個或多個在其它蛋白中被認為與Ca++結合的EGF樣基序,以及多個CUB結構域。CUB結構域是介導補體成分Clr/Cls中蛋白之間相互作用的一種基序,也已明確它存在于各種參與發(fā)育過程的蛋白中。Wozney,J.M.等在Science 242:1528-1534(1988)中描述了BMP-1的核苷酸序列。
其它非哺乳類動物中發(fā)現(xiàn)的蛋白質中也具有哺乳動物BMP-1結構域的結構。這些蛋白質包括果蠅屬特洛德(tolloid)(Tld)(Shimell,M.J.,Cell 67:469-481(1991))、特洛德樣果蠅屬基因產物(Tlr-1或tolkin)(Nguyen,T.,Dev.Biol.166:569-586(1994)和Finelli,A.L.,等,Genetics 141:271-281(1995))、海膽B(tài)MP-1同系物(suBMP-1)(Hwang,S.-P.,等,Development 120:559-568(1994))、兩種相關的海膽發(fā)育基因產物SpAN和BP10(Reynolds,S.D.,等,Development 114:769-786(1992)和Lepage,T.,等,Development 114:147-164(1992))、爪蟾屬(Xenopus) BMP-1(xBMP-1)(Maeno,M.等,Gene 134:257-261(1993)、爪蟾屬特洛德(Lin.J.等人,Develop.Growth Differ.39:43-51(1997))、稱為索洛德(xolloid)的特洛德樣爪蟾屬基因產物(Piccolo,S.等人,Cell91:407-416(1997))、分離自斑馬魚的稱為斑馬魚特洛德的該家族相關成員(Bladder,P.等人,Science 278:1937-1940(1997))、哺乳動物特洛德(mTld)(Takahara,K.等,J.Biol.Chem.269:32572-32578(1994))和哺乳動物特洛德樣基因(mTll-1)(Takahara,K.等人,Genomics 34:157-165(1996))。編碼這些蛋白質的基因的一些核酸序列是已知的。哺乳動物BMP1基因既編碼BMP-1蛋白,又編碼mTld蛋白,盡管靠的是兩個不同的可變剪接的mRNA分子。本段中提到的論文均納入本文作參考。
發(fā)明概述本發(fā)明概括地描述了一種新的哺乳動物特洛德樣基因產物(mTll-2)及其關聯(lián)的聚核苷酸基因mTLL-2,該基因與mTld以及其它所有已知的與BMP-1有關的基因產物及其關聯(lián)的聚核苷酸(包括mTll(現(xiàn)在稱為mTll-1))不同。本文的SEQ ID NO:1和SEQ ID NO:3分別報道了該基因的人和小鼠版本。其各自編碼的氨基酸序列分別顯示在SEQ ID NO:2和SEQ ID NO:4中。
本發(fā)明的一個目的是提供參與脊椎動物中胞外基質沉積(如成骨)的基因和基因產物。
本發(fā)明的另一個目的是為合理地開發(fā)出抑制特洛德樣基因活性治療纖維變性、結疤、瘢痕瘤、手術粘連等的藥物提供靶分子。
本發(fā)明還有一個目的是提供一種重組DNA構建物、以及該構建物所編碼的、用來加速傷口和骨折愈合的蛋白質。
本發(fā)明還有一個目的是提供對人染色體10的10q24區(qū)域以及小鼠染色體19的遠端作圖譜的標記。
本發(fā)明還有一個目的是提供作為探測哺乳動物細胞中非BMP-1骨形態(tài)生成蛋白基因的探針的核苷酸序列。
本發(fā)明的其它目的、特征和優(yōu)點在參照附圖進行下列詳細敘述時將會更為清晰。
附圖簡述

圖1A-1C(合稱“圖1”)比較了本發(fā)明公開的mTll-2人基因(htll-2)和鼠基因(mtll-2)的推導氨基酸序列與人mTld(人特洛德)以及人mTll-1(htll)基因的推導氨基酸序列。序列對比用PileUp程序(Genetics Computer Group,Madison,Wisconsin)進行,GAP加權值為12,長度加權值為4。蛋白質結構域的近似終點如臨時申請60/080,550中所示,該申請納入本文作參考。
發(fā)明詳述哺乳動物特洛德樣2(mTll-2)是以骨形態(tài)發(fā)生蛋白-1(BMP-1)為原型的蝦紅素樣蛋白酶超家族中在基因水平上有所不同的成員。該蛋白酶超家族還包括哺乳動物特洛德(mTld)和哺乳動物特洛德樣-1(mTll-1;以前稱為mTll),該超家族在發(fā)育和穩(wěn)態(tài)過程中在傷口愈合中、以及諸如纖維變性等病理過程中起關鍵的控制作用。編碼mTll-2的基因具有與BMP-1家族其它成員不同的空間上和時間上的表達分布圖,經對發(fā)育者、成年人和小鼠組織的RNA進行Northern和Master印跡(Clontech)確證,它在成年人和正發(fā)育的心臟軟組織中表達的水平最高。本文列舉的mTll-2基因特別可與BMP-1基因家族其它成員區(qū)別之處在于編碼序列的3′端(編碼mTll-2蛋白質的羧基端17個氨基酸)以及編碼蛋白質前區(qū)(proregion)的部分。同樣,其蛋白質也能與該家族中的其它蛋白質區(qū)分開來。
本發(fā)明者已經確定,與BMP-1、mTld和mTll-1不同,mTll-2并不是前膠原C-蛋白酶,并且不切割chordin。mTll-2將前賴氨酰氧化酶切割成成熟的活性形式的作用較弱。該蛋白質還可能切割參與基質沉淀、發(fā)育、體內平衡、傷口愈合和疾病的其它底物。同樣,mTll-2蛋白最優(yōu)切割的底物子集(subset)也與BMP-1、mTld以及mTll-1最優(yōu)切割的底物子集不同,盡管這些蛋白的底物特異性有部分重疊。mTll-2是抗纖維變性藥的潛在靶標,它可能會促進各種組織的愈合,并且還可用來研究發(fā)育和疾病過程和鑒定其功能性抑制劑。mTll-2的抑制可能會抑制纖維變性、過度結疤、或正常愈合或發(fā)育的其它紊亂。重組mTll-2(或其關聯(lián)的核酸)可用于評價發(fā)育、疾病過程和治療性干預的系統(tǒng)。
mTll-2蛋白可通過激活生長因子和形態(tài)發(fā)生素起作用。因此,如果外源性加入(或如果將其同源核酸加入細胞內,例如在基因治療中),它可能加速愈合。
編碼mTll-2的多核苷酸(例如基因組DNA、信使RNA和對應于信使RNA的cDNA)可用對應于以前報道的蝦紅素金屬蛋白酶催化域保守區(qū)的引物,在合適的擴增條件下,從含有哺乳動物多核苷酸的模板文庫擴增獲得。下列的簡并寡核苷酸引物(用標準IUPAC命名法顯示)適合獲得mTll-2基因的一部分,本發(fā)明者認為它們是較佳的引物1(正向)5′-CARGC MATGM GNCAC TGGGAG-3′(SEQ ID NO:5)引物2(正向)5′-CARGC MATGMGN CACTG GGAA-3′(SEQ ID NO:6)引物3(反向)5′GAADG TGTTVC KNGCRT ARTGC-3′(SEQ ID NO: 7)含有哺乳動物多核苷酸的合適的模板文庫宜為性交后7天的小鼠胚胎或人胎盤的未擴增cDNA的合并物。此合并物中的cDNA宜用RT-PCR擴增的RNA來制備。合適的人和小鼠胎盤和胚胎cDNA合并物購自Clontech。模板cDNA的來源并不關鍵,只要該cDNA合并物包括至少一個能如所述那樣擴增的模板序列即可。其它合適的模板包括,但不局限于,器官特異性的或其它類型的cDNA合并物或文庫或基因組DNA或文庫。
合適的擴增條件在下文實施例中有所描述,但是本領域技術人員能確定與本文報告的那些有所不同的可接受的條件。一旦獲得了最初的PCR產物,就可用它來進行平板篩選cDNA或基因組文庫。
可能需要分開建立編碼mTll-2的cDNA序列的5′或3′端,例如采用只選擇性擴增5′或3′端cDNA序列的方法,例如3′簡并PCR或cDNA末端的迅速擴增方法(“RACE”),該方法在Frohman,M.A.″迅速擴增互補DNA末端來產生全長互補DNA加熱RACE法″,Methods in Enzymology(Wu,R.編),218卷,340-362頁,Academic Press,New York(1991),該文全部納入本文作參考。
市售的5′和3′RACE擴增系統(tǒng)購自Clontech。適合5′和3′RACE的引物可從上述用簡并引物進行最初PCR時獲得的擴增cDNA序列,或通過篩選cDNA或基因組DNA文庫獲得的cDNA克隆序列推導出來。在較佳的實施方案中,根據平板篩選分離出的1.6kb cDNA 5′端設計的嵌套PCR的引物如下引物4 5′-TGTGGTGTCT GGGCTGCTCT CAGATGC-3′(SEQ ID NO:8)引物5 5′-ACTGTCTGCT TGGTCCAGTC TCTGG-3′(SEQ ID NO:9)對于3′-簡并PCR,合適的嵌套引物對應于平板篩選分離的cDNA 3′端序列,合適的簡并引物對應于在BMP-1/特洛德樣蛋白CUB結構域5中發(fā)現(xiàn)的保守序列。合適的引物包括引物6 5′-TACCTGGAAG TCCGGGATGG CCCCACG-3′(SEQ ID NO:10)引物7 5′-GAGGATGTGA AATCGAGCTC CAACAGAC-3′(SEQ ID NO:11)引物8-11(簡并引物)5′-RAANCCYTTYTTNNNDATNGTRTCRTC-3′(SEQ ID NO:12)對于3′RACE,對應于用3′-簡并PCR擴增的cDNA片段3′端序列的合適的嵌套PCR引物是引物12 5′-CAACAACTAC CCGAGCGAGG CCCC-3′(SEQ ID NO:13)引物13 5′-GAAGCCTACG ACGGCTACGA CAGCTC-3′(SEQ ID NO:14)
本領域技術人員可將分開克隆的序列連接在一起,正如本發(fā)明者所做的那樣,從人獲得完整的全長cDNA,如SEQ ID NO:1所示。SEQ ID NO:1所示的是側接了5′和3′非翻譯序列的一個開放讀框。該開放讀框編碼了稱為mTll-2的哺乳動物特洛德樣蛋白。該人mTll-2基因的基因圖譜位于人染色體10q24。
SEQ ID NO:3顯示了從小鼠源獲得的第二種mTll-2基因。SEQ ID NO:4中報道了該小鼠mTll-基因編碼的對應蛋白。該鼠版本基因與人mTll-2基因對應之處在于兩者均具有相似的核酸和氨基酸序列。還不知道鼠mTll-2基因在鼠染色體基因圖譜中在何位置。
如果DNA制品中已經除去了90%以上任何有DNA的宿主細胞的細胞物質,則認為任何來源的含有mTll-2基因序列的DNA分子制品是基本上純的。例如,細胞物質可利用市售純化試劑盒(如購自Qiagen(Chatsworth,CA)的試劑盒)從核酸制品中除去。較佳的是,核酸制品中超過10%的核酸分子含有全部或部分mTll-2基因。更佳的是,超過50%,甚至還要佳的是超過90%的核酸分子含有mTll-2基因全部或部分序列。
鑒于與其它特洛德樣蛋白質的相似性,預計本發(fā)明公開的mTll-2基因所編碼的產物將在發(fā)育以及體內平衡過程(如傷口愈合)中起關鍵作用。該蛋白參與胞外基質前體成熟為大分子結構(例如通過激活前賴氨酰氧化酶)。該蛋白還可能在體內和體外激活生長因子中起一定作用,當將有效量的蛋白質給予組織時,它可能會促進發(fā)育和體內平衡過程。另一方面,如果mTll-2蛋白質功能被抑制,這些過程本身可能被抑制,通過輸送有效量的抑制劑就可有利地利用該特性來防止纖維變性和過度結疤或其它傷口愈合的異常情況。通過測試某劑量范圍的該蛋白質對所選的認為在生物化學或生理學上類似于人的脊椎動物或模型動物的作用,就容易確定待輸送給靶部位以激活發(fā)育和體內平衡特性的該蛋白質的有效量。例如,就皮膚或心臟傷口愈合或發(fā)育而言,豬皮膚或心臟是人皮膚和心臟的合適模型。大鼠或家兔心臟也是可以接受的系統(tǒng)。
同樣,也可確定mTll-2蛋白抑制劑的有效量。有效量是指在給予后能比未治療動物有效減少纖維變性、結疤或瘢痕瘤發(fā)生的用量,其中根據臨床或獸醫(yī)所接受的標準來評估上述病癥。這種測試宜在通常被視為與人皮膚、心臟或其它受累組織有關的模型系統(tǒng)中進行。
由于該蛋白質在動物組織中的含量通常非常少,因此BMP系統(tǒng)蛋白質的工作能力受到阻遏。一種以前未知的基因,mTll-2,可以克隆入含有(在合適哺乳動物或昆蟲宿主細胞內)有效的轉錄啟動子的合適表達載體中,繼而導入合適的(哺乳動物或昆蟲)宿主細胞并在其中表達,并以天然構型純化,所有這些均采用常規(guī)方法??蓪DNA插入可整合的(例如pCDNA3.1型)或游離型(例如pCEP4型)載體中,并在合適培養(yǎng)的哺乳動物細胞(如分別為293人胚腎細胞或2930EBNA細胞)中表達。pCDNA3.1和pCEP4載體(以及有關載體)購自Invitrogen。載體序列和載體的限制性圖譜均從Invitrogen獲得。cDNA還可插入桿狀病毒載體(如BacPAK 6,購自Clontech)。
這樣表達的蛋白質可保留在宿主細胞內,或可以分泌到胞外生長培養(yǎng)基中(如果構建物有合適的信號序列的話)。該蛋白質可用常規(guī)的方法從細胞或生長培養(yǎng)基中純化獲得。重組蛋白(及其同源mRNA)可用于功能試驗和高產量篩選抑制劑。重組蛋白和蛋白質的諸部分可從本文公開序列的亞克隆產生,并可作X-線晶體圖進行合理的藥物設計??稍O計出對mTll-2蛋白有特異性的抗體。
合適的轉錄啟動子包括如在pCDNA3.1或pCEP載體中發(fā)現(xiàn)的巨細胞病毒立即早期啟動子,或是在載體pFASTBacl(該載體可購自Gibco-BRL)上發(fā)現(xiàn)的桿狀病毒極遲啟動子。另一個合適的啟動子是桿狀病毒立即早期啟動子,如在pAcPIE1載體(Novagen,Madison,WI)上發(fā)現(xiàn)的啟動子。任何其它有利的表達元件如增強子、終止子等本領域已知的元件可包括在合適的表達載體中。
合適的宿主可以是昆蟲組織培育細胞,如細胞系Sf21、Sf9、High Five(Invitrogen,sar Diego,CA)、或哺乳動物293或293-EBNA細胞。
也可將含有小于全部編碼序列的該基因的合適部分克隆入合適的載體中,以形成基因重組構建物。應當理解,根據本發(fā)明制得的構建物不必含有整個mTll-2基因座或編碼區(qū),但應含有能編碼所需功能的一個或多個部分,或含有該基因其它有用性能(如與所需基因組序列互補)的部分。本領域普通技術人員可以理解,mTll-2蛋白質(以及編碼mTll-2蛋白質的相應的遺傳物質)在大小和序列上的某些變化不會干擾其功能。在構建含有全部或部分mTll-2基因的基因構建物時,這些經修飾的形式可用已知的有利方法進行工程化,并表達在其編碼的蛋白質中。
只要蛋白質保留了已知與該蛋白有關的所需功能,認為這些改變、修飾、添加和缺失均在本發(fā)明的范圍內。如果蛋白質在進行這種切割的標準試驗中保留了切斷(前賴氨酰氧化酶的)能力,則該蛋白質是感受態(tài)蛋白。本領域技術人員對這些試驗應伴有的必要的對照是熟悉的?;蛘?,可能希望蛋白質由于這種變化而喪失某些功能,預計這類情況也包括在本發(fā)明的范圍內。
這樣制得的該蛋白質基本純的制品被確定為一種制品,其中mTll-2蛋白質的特征性活性(例如對前賴氨酰氧化酶的較弱的切割作用)應不受制品中存在的其它蛋白質或分子的影響。根據該蛋白質將投入的用途,mTll-2蛋白質在基本純的蛋白質制品中的量至少應為10%,至少50%為佳,至少75%為更佳,至少95%為最佳。通過用親和標記物對該蛋白質作標記,并使制品通過對標記物有親和性的柱,可增加此蛋白質制品中感興趣的蛋白質。也可采用一種加工標記物,這樣,就可從加有粗品的柱中洗脫獲得適當加工形式(缺少切割前區(qū))的該蛋白質。
當將鼠mTll-2蛋白質序列與其它特洛德樣基因進行比較時,其與兩個哺乳動物蛋白質(mTld和mTll)任一的前區(qū)或兩個果蠅屬蛋白質(Tld或Tlr-1)任一的前區(qū)沒有廣泛的同源性。圖1將本發(fā)明公開的人和鼠mTll-2基因與人mTld以及人mTll-1基因作了氨基酸序列對比。序列對比用PileUp程序(Genetics Computer Group,Madison,Wisconsin)進行,GAP權值為12,長度權值為4。圖1還顯示了所示編碼序列編碼的蛋白質各結構域的大致邊界。圖1所示的氨基酸序列,從上到下,分別是人mTll-2、小鼠mTll-2、mTld和mTll-1。
mTll-2 mRNA轉錄物看來并非是可變剪接的,因為只檢測到一個轉錄物,因為在每一種動物中進行cDNA文庫篩選和PCR擴增時只分離出一種mTll-2 cDNA。
在胎盤和心臟觀察到有相當強的mTll-2 mRNA表達。
具體預計的是,通過用經選擇包含所述小鼠基因的mTll-2特異性部分的探針探測適當動物細胞的cDNA文庫,或用與上述相似或不同的簡并引物進行PCR擴增,可以自其它動物種類分離出mTll-2基因的等價物。通過比較小鼠mTll-2編碼區(qū)核酸序列與BMP-1/mTld以及mTll-1的序列并選出在此二基因內均沒有等價物的mTll-2基因部分,可獲得小鼠mTll-2基因的mTll-2特異性部分。作為有效的探針,所選序列不應含有會與眾多基因組位點相互雜交的重復序列。探針長度應至少約200個堿基。已經認識到,BMP-l家族基因在編碼蛋白質前區(qū)和C端17個氨基酸的區(qū)域中最為可變,并且預計可以從mTll-2基因的那些區(qū)域分離出合適的探針。這樣的探針片段可用切口翻譯、末端標記或本領域已知的其它合適技術來轉變成探針。還應理解,可用分子生物學家熟知的技術來體外合成所需的片段(或實際上是整個基因)。本領域技術人員能設計出對應于mTll-2所獨有的區(qū)域或BMP-1/mTll-1/mTll-2蛋白家族成員中保守的區(qū)域的簡并引物。
由于mTll-2中的缺陷可能導致人基因異常,因此如下文實施例所述已確定了人TLL-2基因的染色體位置(10q24)。該位置靠近與人遺傳性疾病肌萎縮性痙攣性下身輕癱有關的基因圖位置。在用Trask,B.,Methods Cell Biol.35:1-35(1992)的方法伸展的人細胞分裂中期染色體上進行熒光原位雜交(FISH),并通過放射雜交篩選,對TLL基因獨立作圖譜。
通過選擇預計側接mTll-2基因(或該基因任何部分)的特異性引物,應當也可能用PCR來擴增對應于mTll-2區(qū)的基因組部分。該基因的兩個mTll-2特異性部分可作為合適的引物。在該基因編碼部分之外選擇引物可能是無效的,因為非編碼部分降低的選擇性壓力會導致小鼠和人以及其它動物之間在這些區(qū)域中出現(xiàn)更大的趨異。特別應注意的是,應對人和模型動物(如小鼠)BMP家族的基因進行特別搜尋,以探知它們與人畸形的關系(參見例如"The Chicken With a Duck′s Feet:It′s All in theBiochemical Signal,"The New York Times,National Edition,p.B6(1996年5月21日))。
也可特別預計到,可在宿主細胞中表達(或從宿主細胞中分泌)mTll-2基因編碼的大量蛋白質,純化成基本純的制品,并用于隨后的功能試驗。在這樣的一個功能試驗中,將描述表達蛋白質的功能特征。預計該蛋白質的功能將包括金屬蛋白酶活性、前賴氨酰氧化酶加工活性,以及激活TGF-β樣蛋白的活性,鑒于其總體結構在結構域水平上與已知的蛋白質相似,因此這些預計是合理的。
在另一個試驗中,該蛋白質可用來篩選對其有抑制活性的推定試劑。如果mTll-2能拯救BMP-1敲除小鼠,則它對于修飾或消除BMP-1蛋白功能以類似方式改變mTll-2蛋白功能的任何治療系統(tǒng)是重要的。因此,任何一組這樣的試劑都必需以mTll-2蛋白質進行篩選。在這樣的試驗中,所有支持mTll功能的試驗成分可在合適的鹽和pH條件下一同加入,并與一組推定的蛋白質功能抑制劑合用。采用已建立的蛋白質功能試驗(在納入本文其它處作為參考的文獻中有所描述),將可以確定受測制劑是否能抑制蛋白質活性,從而使其成為以治療量抑制纖維變性、減少結疤和減少瘢痕瘤的候選制劑。采用BMP-1基因家族的相關蛋白質的這種篩選努力正在進行。
現(xiàn)在也可用本發(fā)明所公開的蛋白質或其片段來進行合理的藥物設計。在設計時,對該蛋白質或片段進行X-射線晶體圖作分析,以確定它們的活性位點和可與推定治療劑相互作用的位點。
目前表明,BMP-1編碼的蛋白質可切割前膠原的C端附近。人們早就認為產生這種膠原所必需的C端-蛋白酶活性存在于一種預測的蛋白質中。因此,利用C端蛋白酶活性作為膠原相關疾病的治療劑具有很高的商業(yè)價值。特別期望的是,mTll-2編碼的蛋白質部分可用來產生另一種C端蛋白酶,兩者均通過將基因導入重組載體中來體外生產治療性蛋白,并在遺傳疾病治療中直接給藥。人的基因特別適用于這些用途。
在考慮下列非限制性實施例后將能更好地理解本發(fā)明。
實施例來自人胎盤cDNA的人mTll-2用簡并引物作PCR擴增。用對應于在BMP-1/特洛德樣蝦紅素金屬蛋白酶催化功能域中的一對保守區(qū)域的簡并引物,從人胎盤Marathon-Ready cDNA文庫(Clontech)擴增得到mTll-2基因的一部分(見Bond.J.S.和R.J.Benynon,Protein Science 4:1247-1261在1249頁(1995),納入本文作參考)。為了確定簡并引物的合適序列,對人(Wozney等人,1988)、小鼠(Fukagawa等人,1994)和爪蟾屬(Ma no等人,1993)BMP-1、果蠅屬特洛德相關-1(Nguyen等人,1994)和小鼠(Takahara等人,1996)和人mTll-1的對應核苷酸序列作人工序列對比。一對5′(正向)寡核苷酸引物,為引物1:5′-CARGC MATGMGNCAC TGGGAG-3′(SEQ ID NO:5)和引物2:5′-CARGC MATGMGN CACTGGGAA-3′(SEQ ID NO:6),它對應于編碼較多氨基端氨基酸保守殘基AMRHWE的序列。兩個正向引物的不同僅僅在于最3′端的堿基對應于E的密碼子的搖擺位置。3′(反向)寡核苷酸引物為引物3:5′GAADG TGTTVC KNGCRT ARTGC-3′(SEQ ID NO:7),它對應于編碼較多羧基端氨基酸保守的殘基HYARNTF的序列。
PCR這樣進行:95℃變性5分鐘,然后是30輪的95℃45秒、50℃45秒、72℃2分鐘,最后72℃延伸10分鐘,采用0.5ng人胎盤cDNA作為模板。
從2%瓊脂糖凝膠上切下電泳觀察到的異源的375bp PCR產物,然后連接入市售的pCR2.1載體(Invitrogen)中,該載體的核酸序列已公布。連接反應用ApaⅠ來限制,該酶在BMP-1/mTld序列中切割,以降低BMP-1/mTld克隆的本底。克隆的序列分析揭示用引物2和引物3組合獲得了約375bp的PCR產物。用引物1和引物3組合沒有獲得mTll-2或其它新的(例如非BMP-1/mTld或mTll-1)產物。通過對兩條鏈測序,確認本文報告的人mTll-2序列。
cDNA文庫篩選。用32p-dCTP(Amersham)通過隨機引導對375bp的人mTll-2PCR片段作放射性標記(Feinberg,A.P.,和Vogelstein,B.(1983),“將DNA限制性內切核酸酶片段放射性標記成高比活的技術”,Anal.Biochem.132:6-13,該文全部納入本文作參考),并用其來篩選gtll人胎盤cDNA文庫(Clontech)的噬斑。雜交在65℃下進行18小時,用2×SSC、0.1%SDS室溫洗滌30分鐘;用2×SSC、0.1%SDS 65℃洗滌30分鐘;并用0.1×SSC、0.1%SDS 65℃洗滌30分鐘。
噬斑純化得到一個強雜交陽性克隆,切下約1.6kb的插入物(大致對應于BMP-1家族基因常見的前區(qū)、催化結構域、CUB1和CUB2結構域),亞克隆到pBluescript ⅡKS+的EcoRⅠ位點內,通過如Lee S.-T.,等人,″編碼人前α2(Ⅰ)膠原的全長cDNA的構建及其在前α2(Ⅰ)-缺陷型W8大鼠細胞中的表達″,J.Biol.Chem.263;13414-13418(1988)(該文全部納入本文作參考)中所描述的雙脫氧鏈終止法,從雙鏈模板獲得序列。
用T3和T7引物對亞克隆的兩末端進行測序,通過引入缺失或采用與插入序列互補的引物使亞克隆的內部部分得以測序。平板篩選的進一步嘗試未能產生編碼新的mTll-2序列的其它陽性克隆。
用RACE-PCR和采用簡并引物的PCR來完成人mTll-2 cDNA序列的5′和3′端。為了獲得1.6kb片段(如上所述獲得)和mTll-2 cDNA 5′端序列之間的所有序列,用Marathon cDNA擴增試劑盒按照生產商(Clontech)說明書,對0.5ng人胎盤Marathon-Ready cDNA模板進行5′RACE PCR擴增。對應于1.6kb片段5′端附近序列的嵌套引物是引物4:5′-TGTGGTGTCT GGGCTGCTCT CAGATGC-3′(SEQ ID NO:8)和引物5:5′-ACTGTCTGCT TGGTCCAGTC TCTGG-3′(SEQ ID NO:9)。嵌套PCR反應中的其余引物對應于Clontech合成并包括在市售的Marathon cDNA擴增試劑盒(它可用來進行嵌套PCR過程)中的RACE-PCR銜接子部分。
進行嵌套PCR,PCR的第一回合為95℃5分鐘,然后是40輪的95℃45秒、60℃45秒、72℃2分鐘,最后72℃延伸10分鐘。嵌套PCR的第二回合在相同條件下進行,只是進行35輪而不是40輪。將PCR產物克隆到Invitrogen pCR2.1載體中進行序列分析。
獲得了前區(qū)和所有信號肽的編碼部分并含有約360bp 5′非翻譯序列的約900bp的mTll-2 5′RACE-cDNA克隆。
最初,3′RACE PCR沒有提供人mTll-2基因的附加的3′序列。因此,采用中間PCR擴增步驟,該步驟采用了對應于1.6kb cDNA 3′端序列的兩個嵌套引物(引物6:5′-TACCTGGAAG TCCGGGATGG CCCCACG-3′(SEQ ID NO:10))和引物7(5′-GAGGATGTGA AATCGAGCTC CAACAGAC-3′(SEQ ID NO:11)),以及對應于人和小鼠mTld以及mTll-1蛋白的CUB結構域5中保守的氨基酸序列的四個交替簡并寡核苷酸引物。簡并反向引物8-11都具有序列5′-RAANCCYTTYT TNNNDATNGT-3′,但是各引物中的6個附加的3′端堿基不同。反向引物8-11的末端序列為引物8,5′-GTCGTC-3′;引物9,5′-ATCATC-3′;引物10,5′-GTCATC-3′;和引物11,5′-ATCGTC-3′。這四個簡并引物在SEQ ID NO:12中列成單個簡并引物,其中引物8、9、10和11中的變化反映在6個最3′端堿基的簡并性上。
用人胎盤Marathon-Ready cDNA作為模板(0.5ng)。第一回合PCR這樣進行,95℃5分鐘,然后40輪的95℃45秒、60℃45秒、72℃4分鐘,最后72℃延伸10分鐘。PCR的第二個嵌套回合在相同條件下進行,只是采用35輪而不是40輪。
從0.8%瓊脂糖凝膠上切下約1.3kb的特異性產物,克隆到pCR2.1中進行序列分析。1.3kb片段編碼了人mTll-2的所有EGF1、CUB3、EGF2和CUB4結構域和大部分CUB5結構域,并且是用簡并反向引物10(而不是引物8、9或11)與嵌套正向引物6或7組合獲得的。
為了獲得其余的人mTll-2 cDNA序列,用對應于1.3kb片段3′端附近序列的兩個嵌套引物(引物12:5′-CAACAACTAC CCGAGCGAGG CCCC-3′(SEQ ID NO:13)和引物13:5′-GAAGCCTACG ACGGCTACGA CAGCTC-3′(SEQ ID NO:14)),以人胎盤Marathon-Ready cDNA作為模板(0.5ng),用Marathon cDNA擴增試劑盒根據生產商說明書(Clontech)來進行3′RACE PCR。嵌套PCR如下進行PCR的第一回合為95℃分鐘,然后是40輪的95℃45秒、60℃45秒、72℃4分鐘,最后72℃延伸10分鐘。PCR的第二嵌套回合在相同條件下進行,只是采用35輪而不是40輪。從0.8%瓊脂糖凝膠上切下約1.7kb的特異性產物(編碼部分CUB5結構域并含有1.6kb的3′非翻譯區(qū),包括聚A尾部),并克隆到pCR2.1中進行序列分析。
鼠mTll-2用獲得最初人375bp片段的相同簡并引物和PCR條件(見上文),從小鼠cDNA獲得約375bp的異源產物。在這種情況下,所用的模板為0.5ng的性交后7天(dpc)小鼠胚胎Marathon-Ready cDNA(Clontech)。對375bp PCR產物作電泳并從2%瓊脂糖凝膠上切下,連接到pCR2.1中,連接反應用ApaⅠ限制,以降低BMP-1/mTld克隆的本底。與人序列相反,375bp mTll-2 PCR產物是用引物1與引物3組合獲得的,但用引物2和引物3組合沒有獲得mTll-2或其它新的產物。
用375bp片段篩選鼠7dpc和17dpc cDNA文庫,沒有產生任何陽性mTll-2克隆。為了獲得375bp片段和鼠mTll-2 cDNA 5′端序列之間的所有序列,用MarathoncDNA擴增試劑盒按照生產商(Clontech)說明書,用簡并反向引物3(如上)和對應于375bp片段3′端附近序列的嵌套引物(引物14,5′-GCTTTCCTCATCTGTCCTCTCTACG-3′(SEQ ID NO:15)),以0.5ng 7dpc小鼠胎盤Marathon-Ready cDNA為模板,進行5′RACE PCR。嵌套PCR如下進行PCR的第一回合為94℃30秒,然后是5輪的94℃5秒、72℃4分鐘;5輪的94℃5秒,70℃4分鐘;30輪的94℃5秒,68℃4分鐘,最后72℃延伸10分鐘。PCR的第二個嵌套回合如下進行94℃30秒,然后是5輪的94℃5秒,72℃4分鐘;5輪94℃5秒,70℃4分鐘;25輪94℃5秒,68℃4分鐘,最后72℃延伸10分鐘。
將PCR產物克隆到Invitrogen pCR2.1載體中進行序列分析。獲得約900bp的mTll-2PCR產物,它編碼部分蛋白酶結構域、所有的信號肽和前區(qū),并含有約200bp的5′非翻譯序列。
為了獲得375bp片段和小鼠mTll-2 cDNA序列3′端之間的序列,用簡并正向引物1(上述)和對應于375bp片段5′端附近序列的嵌套引物(引物15,CCTGTGTGACCTTCGTAGAGAGG-3′(SEQ ID NO:16))進行3′RACE PCR。PCR條件與用于小鼠mTll-2序列5′RACE的條件(上述)相同。將PCR產物克隆到pCR2.1中作序列分析。獲得約1200bp的mTll-2 PCR產物,它編碼部分蛋白酶結構域、所有的結構域CUBl、CUB2、EGF1、CUB3、EGF2并終止于CUB3結構域內。用從1200bp片段獲得的序列信息所設計出的寡核苷酸引物對編碼序列的其余部分作PCR擴增。已經確定小鼠mTll-2基因的全長編碼區(qū),其位于bp191和3229之間或SEQ IDNO:3。
染色體排布。用輻射雜交圖譜(Walter等人,1994)作TLL2圖譜,該方法包括對從Research Genetics獲得的4組輻射雜交物作聚合酶鏈反應(PCR)分析。正向引物5′-TGGGAGCTGAGCAATGCTAACTGC-3′(SEQ ID NO:17)和反向引物5′-GAAGGTGTTCCGGGCGTAGTGCAT-3′(SEQ ID NO:18)分別對應于TLL2內含子6和外顯子7中的序列,用人基因組DNA模板得到1.4kb PCR產物,但用對照中國倉鼠基因組DNA模板沒有得到產物。PCR用100ng模板DNA和10皮摩爾各引物進行,熱循環(huán)程序為95℃5分鐘,然后是30輪的95℃45秒、65℃45秒、72℃3分鐘,最后72℃延伸10分鐘。
在0.8%瓊脂糖凝膠上對PCR產物作電泳,用溴乙錠顯色,將得分提交給Whitehead Institute/MIT Center for Genome Research的WICGR給圖服務機構。TLL2在GeneBridge 4 Panel輻射雜交物上清晰地圖示位置位于染色體10q,距離標記D10S571 8.66cR,Lod評分為15。另外,Trask(1991)的方法伸展的在雄性中期染色體上進行熒光原位雜交(FISH),圖示出TLL2在染色體10上的位置。將含有TLL2外顯子的10kb BamHⅠ基因組片段亞克隆到pBluescript Ⅱ KS+中,并用洋地黃毒苷-11-dUTP(Boehringer Mannheim)通過隨機引導作標記。獲得可圖象并如Takahara等人1994所述作分析。僅發(fā)現(xiàn)這兩個染色體上的雙熒光信號在測定的75%中期伸展體(15/20)中的10q24處,在其它染色體上沒能將TLL2定位于該區(qū)域(未顯示)。
組織切片作原位雜交將組織切片固定在玻片上進行原位雜交。小鼠組織將如Lyons等人,″發(fā)育骨骼肌中肌球蛋白基因的表達″,J.Cell Biol.111:1465-1476(1990)中所述那樣固定和包埋。簡言之,將組織固定在含4%多聚甲醛的磷酸緩沖鹽溶液中,脫水,并用石蠟浸潤。將5-7微米厚的系列切片固定在明膠化的玻片上。每個玻片固定1-3個切片,用二甲苯脫去石蠟,并重新水化。用蛋白酶K消化切片,后固定,用三乙醇胺/乙酸酐處理、洗滌并脫水。
原位雜交和洗滌程序使切片在52℃50%去離子甲酰胺、0.3M NaCl、20mM Tris-HCl、pH7.4、5mMEDTA、10mM NaPO4、10%硫酸葡聚糖、1×Denhardt′s溶液、50μg/ml酵母總RNA、25μmol/ml硫代ATP(Boehringer-Mannheim)和50-75,000cpm/μl35S標記的cRNA探針中雜交過夜。使組織在65℃的50%甲酰胺、2×SSC、10mM二硫蘇糖醇中嚴格清洗;在磷酸鹽緩沖鹽水中漂清;并用20μg/ml RNase A 37℃處理30分鐘。隨后在37℃2×SSC和0.1×SSC中37℃清洗15分鐘后,使載玻片脫水,將其浸在Kodak NTB-2核示蹤乳液中,并在4℃、有干燥劑的不透光箱子中曝光一周。照片在Kodak D-19中顯影。用Zeiss Axiophot顯微鏡的亮視野和暗視野鏡片分析載玻片。
mTll-2基因的亞克隆和表達BMP-1、mTld、mTll-1和mTll-2的成熟活性形式的氨基酸序列是相似的。只是每種蛋白質的C端沒有同源性。C端序列的這種獨特性已被用來生產一系列能區(qū)別這些蛋白質形式的多克隆抗體。在小鼠mTll-2的情況下,使對應于mTll-2最后的17個氨基酸的合成的肽與蛋白質載體鑰孔血蘭素連接,懸浮在鹽水中,與等體積弗氏佐劑混合乳化,注入兩只兔子每只背部皮下3-4處。在加強免疫后12周和16周,放血取血清。這些抗體有商業(yè)用途,可用于試驗顯示細胞、組織和哺乳動物生物體(包括但不局限于模型動物體系如嚙齒類動物和靈長類動物和人)中mTll-2蛋白質的產生和定位。
應注意,獨特的序列存在于蛋白酶、這些蛋白質的CUB和前區(qū)內,并能用來檢測和區(qū)分該家族的各成員。參見Lee,S.J.Biol.Chem.272:19059-19066(1997)。
由于對骨形態(tài)生成蛋白的了解進展迅速,因此區(qū)別各組分的能力不僅在研究方面重要,而且在監(jiān)測BMP體系疾病患者的BMP系統(tǒng)組分的水平和分布上也很重要。這些疾病包括,例如,小鼠和人體的纖維變性疾病或心臟病。此外,由于TLL2基因的缺陷,還可能會有遺傳性發(fā)育異常。采用本文所述的抗體和核酸探針就可確定mTll-2在這些遺傳異常中起的作用。顯然,mTll-2蛋白質在生物發(fā)育中是非常重要的,因為它在胎盤和發(fā)育的心臟中表達。
序列表<110>Greenspan,Daniel S.
Scott,Ian C.
Thomas,Christina L.<120>哺乳動物的特洛德樣基因和蛋白質<130>960296.96111<140><141><150>60/111873<151>1998-12-11<150>60/080550<151>1998-04-03<160>18<170>PatentIn Ver.2.0<210>1<211>5021<212>DNA<213>人<220><221>CDS<222>(365)..(3412)<400>1cgcccattgg ctcctcagcc aagcacgtac accaaatgtc tgaacctgcg gttcctctcg 60tactgagcag gattaccatg gcaacaacac atcatcagta gggtaaaact aacctgtctc 120acgacggtct aaacccaggc agcctcggcc gccgggcaag tagctccgag cggctgcttc 180ccggttgcct cgaagaagac agggggcgcc gcgctccgct tgctccgcgc ctgagccatg 240cccagcagcc ctgtgtaacc accgagtccc ggccggagcc gaccgaccca gtgtgcgccg 300tctttcggcc gagctgagct ttcgtgcacg caactccctc tgccccagcc ggccccgcgc 360cacc atg ccc cgg gcg act gca ctt ggg gcc ctg gtg tca ctg ctg ctg 409Met Pro Arg Ala Thr Ala Leu Gly Ala Leu Val Ser Leu Leu Leu1 5 10 15ctg ctg ccg ctg cct cgc ggc gcc ggg gga ctc ggg gag cgc ccg gac 457Leu Leu Pro Leu Pro Arg Gly Ala Gly Gly Leu Gly Glu Arg Pro Asp
20 25 30gcc acc gca gac tac tca gag ctg gac ggc gag gag ggc acg gag cag 505Ala Thr Ala Asp Tyr Ser Glu Leu Asp Gly Glu Glu Gly Thr Glu Gln35 40 45cag ctg gag cat tac cac gac cct tgc aaa gcc gct gtc ttt tgg gga 553Gln Leu Glu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly50 55 60gac att gcc tta gat gaa gat gac ttg aag ctg ttt cac att gac aaa 601Asp Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys65 70 75gcc aga gac tgg acc aag cag aca gtg ggg gca aca gga cac agc aca 649Ala Arg Asp Trp Thr Lys Gln Thr Val Gly Ala Thr Gly His Ser Thr80 85 90 95ggt ggg ctt gaa gag cag gca tct gag agc agc cca gac acc aca gcc 697Gly Gly Leu Glu Glu Gln Ala Ser Glu Ser Ser Pro Asp Thr Thr Ala100 105 110atg gac act ggc acc aag gaa gct gga aag gat ggc cgg gag aat acc 745Met Asp Thr Gly Thr Lys Glu Ala Gly Lys Asp Gly Arg Glu Asn Thr115 120 125aca ctc ctg cac agc cct ggg acc ttg cat gcc gca gcc aag acc ttc 793Thr Leu Leu His Ser Pro Gly Thr Leu His Ala Ala Ala Lys Thr Phe130 135 140tct ccc cgg gtc cga aga gcc aca acc tca agg aca gag agg ata tgg 841Ser Pro Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp145 150 155cct gga gga gtc atc ccc tac gtc att gga ggg aac ttc act ggg agc 889Pro Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser160 165 170 175cag agg gcc att ttt aag cag gcc atg aga cac tgg gag aag cac acc 937Gln Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr180 185 190tgt gtg acc ttc ata gaa agg acg gat gag gaa agc ttt att gta ttc 985Cys Val Thr Phe Ile Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe195 200 205agt tac aga acc tgt ggc tgt tgc tcc tat gtt ggg cgc cga gga gga 1033Ser Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly210 215 220ggc cca cag gcc ata tcc att ggg aag aac tgt gac aag ttt ggc att 1081Gly Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile
225 230 235gtg gct cac gag ctg ggc cat gtg gtt ggg ttt tgg cat gaa cac acc 1129Val Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr240 245 250 255cgg cca gac aga gac caa cat gtc acc atc atc agg gaa aac atc cag 1177Arg Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln260 265 270cca ggt cag gag tat aat ttc tta aaa atg gaa gct ggg gaa gtg agc 1225Pro Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser275 280 285tct ctg gga gag aca tac gac ttt gac agc atc atg cac tac gcc cgg 1273Ser Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg290 295 300aac acc ttc tca aga gga gtt ttc tta gac acc atc ctt ccc cgt caa 1321Asn Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Gln305 310 315gat gac aat ggc gtc agg cca acc att ggc cag cgc gtg cgg ctc agt 1369Asp Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser320 325 330 335cag gga gac ata gct caa gcc cgg aag ctg tac aaa tgc cca gcg tgt 1417Gln Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys340 345 350ggg gag acc ctg cag gac aca acg gga aac ttt tct gca cct ggt ttc 1465Gly Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe355 360 365cca aat ggg tac cca tct tac tcc cac tgc gtc tgg agg atc tcg gtc 1513Pro Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val370 375 380acc cca ggg gaa aag atc gta tta aac ttc aca tcc atg gat ttg ttt 1561Thr Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Ser Met Asp Leu Phe385 390 395aaa agc cga ctg tgc tgg tat gat tac gtg gag gtc cgg gat ggt tac 1609Lys Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Tyr400 405 410 415tgg aga aaa gcc ccc ctt ttg ggc agg ttt tgt ggc gat aag atc ccg 1657Trp Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro420 425 430gag ccc ctc gtc tcc acg gac agc cgg ctc tgg gtg gag ttc cgc agc 1705Glu Pro Leu Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser
435 440 445agc agc aac atc ttg ggc aag ggc ttc ttt gca gcg tac gaa gct acc 1753Ser Ser Asn Ile Leu Gly Lys Gly Phe Phe Ala Ala Tyr Glu Ala Thr450 455 460tgc ggg gga gac atg aac aaa gat gcc ggt cag att caa tct ccc aac 1801Cys Gly Gly Asp Met Asn Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn465 470 475tat ccg gat gac tac aga cct tcc aag gaa tgt gtc tgg agg att acg 1849Tyr Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr480 485 490 495gtt tcg gag ggg ttt cac gtg gga ctt acc ttc caa gct ttt gag att 1897Val Ser Glu Gly Phe His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile500 505 510gaa agg cac gac agc tgt gca tat gac tac ctg gaa gtc cgg gat ggc 1945Glu Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly515 520 525ccc acg gaa gag agt gcc ctg atc ggc cac ttt tgt ggc tat gag aag 1993Pro Thr Glu Glu Ser Ala Leu Ile Gly His Phe Cys Gly Tyr Glu Lys530 535 540ccg gag gat gtg aaa tcg agc tcc aac aga ctg tgg atg aag ttt gtg 2041Pro Glu Asp Val Lys Ser Ser Ser Asn Arg Leu Trp Met Lys Phe Val545 550 555tcc gat ggc tct atc aat aaa gcg ggc ttt gca gcc aat ttt ttc aag 2089Ser Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys560 565 570 575gag gtg gat gag tgt tcc tgg cca get cac ggc ggg tgc gaa cat cgc 2137Glu Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu His Arg580 585 590tgt gtg aac acg ctg ggc agc tac sag tgt gcc tgt gac cct ggc tac 2185Cys Val Asn Thr Leu Gly Ser Tyr Lys Cys Ala Cys Asp Pro Gly Tyr595 600 605gag ctg gcc gcc gat aag aag atg tgt gaa gtg gcc tgt ggc ggt ttc 2233Glu Leu Ala Ala Asp Lys Lys Met Cys Glu Val Ala Cys Gly Gly Phe610 615 620att acc aag ctg aat gga acc atc acc agc cct ggg tgg ccg aag gag 2281Ile Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu625 630 635tat ccc aca aac aaa aac tgt gtc tgg cag gtg gtg gcc ccc gct cag 2329Tyr Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Ala Gln640 645 650 655tac cgg atc tcc ctt cag ttt gaa gtg ttt gaa ctg gaa ggc aat gac 2377Tyr Arg Ile Ser Leu Gln Phe Glu Val Phe Glu Leu Glu Gly Asn Asp660 665 670gtc tgt aag tac gac ttt gta gag gtg cgc agc ggc ctg tcc ccc gac 2425Val Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp675 680 685gcc aag ctg cac ggc agg ttc tgc ggc tct gag acg ccg gaa gtc atc 2473Ala Lys Leu His Gly Arg Phe Cys Gly Ser Glu Thr Pro Glu Val Ile690 695 700acc tcg cag agc aac aac atg cgc gtg gag ttc aag tcc gac aac acc 2521Thr Ser Gln Ser Asn Asn Mer Arg Val Glu Phe Lys Ser Asp Asn Thr705 710 715gtc tcc aag cgc ggc ttc agg gcc cac ttc ttc tca gat aag gac gag 2569Val Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu720 725 730 735tgt gcc aag gac aac ggc ggg tgt cag cat gag tgc gtc aac acc ttc 2617Cys Ala Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Phe740 745 750ggg agc tac ctg tgc agg tgc aga aac ggc tac tgg ctc cac gag aat 2665Gly Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Trp Leu His Glu Asn755 760 765ggg cat gac tgc aaa gag gct ggc tgt gca cac aag atc agc agt gtg 2713Gly His Asp Cys Lys Glu Ala Gly Cys Ala His Lys Ile Ser Ser Val770 775 780gag ggg acc ctg gcg agc ccc aac tgg cct gac aaa tac ccc agc cgg 2761Glu Gly Thr Leu Ala Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg785 790 795agg gag tgt acc tgg aac atc tct tcg act gca ggc cac aga gtg aaa 2809Arg Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys800 805 810 815ctc acc ttt aat gag ttt gag atc gag cag cac cag gaa tgt gcc tat 2857Leu Thr Phe Asn Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr820 825 830gac cac ctg gaa atg tat gac ggg ccg gac agc ctg gcc ccc att ctg 2905Asp His Leu Glu Met Tyr Asp Gly Pro Asp Ser Leu Ala Pro Ile Leu835 840 845ggc cgt ttc tgc ggc agc aag aaa cca gac ccc acg gtg gct tcc ggc 2953Gly Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Thr Val Ala Ser Gly
850 855 860agc agt atg ttt ctc agg ttt tat tcg gat gcc tca gtg cag agg aaa 3001Ser Ser Met Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys865 870 875ggc ttc cag gca gtg cac agc aca gag tgc ggg ggc agg ctg aag gct 3049Gly Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala880 885 890 895gaa gtg cag acc aaa gag ctc tat tcc cac gcc cag ttt ggg gac aac 3097Glu Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn900 905 910aac tac ccg agc gag gcc cgc tgt gac tgg gtg atc gtg gca gag gac 3145Asn Tyr Pro Ser Glu Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp915 920 925ggc tac ggc gtg gag ctg aca ttc cgg acc ttt gag gtt gag gag gag 3193Gly Tyr Gly Val Glu Leu Thr Phe Arg Thr Phe Glu Val Glu Glu Glu930 935 940gcc gac tgc ggc tac gac tac atg gaa gcc tac gac ggc tac gac agc 3241Ala Asp Cys Gly Tyr Asp Tyr Met Glu Ala Tyr Asp Gly Tyr Asp Ser945 950 955tca gcg ccc agg ctc ggc cgc ttc tgt ggc tct ggg cca tta gaa gaa 3289Ser Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu960 965 970 975atc tac tct gca ggt gat tcc ctg atg att cga ttc cgc aca gat gac 3337Ile Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe Arg Thr Asp Asp980 985 990acc atc aac aag aaa ggc ttt cat gcc cga tac acc agc acc aag ttc 3385Thr Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe99510001005cag gat gcc ctg cac atg aag aaa tag tgctgatgtt cttgaaagac 3432Gln Asp Ala Leu His Met Lys Lys10101015agaaactgag aatttttttg ttttgttttg tttttaacaa caatagcacc ttgaaaatct 3492gccctaaaac agtgtacagt atttttctca aacaaaaact cagaatccag ccttagaggt 3552atatatttga atgaaagtct tgtaagtttg gccaacaagg tggagaaaaa aatgttcttt 3612tgcttctgtc tgcaatgttg tcattcatga actgttaaag tgttaaagat taggattgga 3672gtcactgacc attccggcta tgcttcttca taccattctc cttgttgtcc cttgctccta 3732tgtggcaaaa ggtcagcctt ggggttggcc gttcctctaa tctggacttg cttgcaaagg 3792tgccaggctg tcttctgtcc atgttgggca taagggatga aaacttggcc gagactaatg 3852tgtggcccac agctttggct ggaatcattt tctttctctc tgccagggac atgtcaacca 3912agaaacctga aaatatggat ggatgtcagg actaaaaaaa ggcatcacag tgagcagtga 3972gcacagaggg agtttcgagt ataagaatca ttgtcatgaa gttaggagac cacaaagcca 4032tttctcagag tcattcactc tccttgtccc tttggtttcc ccccttcctt aattgcagtg 4092ggggctaagg tatccattat gaatacagca gaacatttgc tggcgagagt cctgtctgct 4152gagaagacaa tattgtggct cgtcctgata ttttttcatt cattgacttt gagaagactc 4212cacctgtgct tggaattcca tgggcttcaa agaacatttc ttcttttagc tttggaggca 4272cttgccgtgg cacacctgga ctccttgaca tccaattcaa actgcatttg caaaatgtgc 4332aaagacctct tatgagggac caattcaggt cccttatggg gtgaacactg ttgaagactg 4392gttaattata agttatgtaa gaatcatcgc cttgtggaac aagtcaatca gtgactagct 4452tcctgtagcc aatcaggtta aagagggcgt tggtaatttt gttctgattt aactagtatt 4512caatcaccaa cttgcaaaca gaattcataa cacttggcac ttgttctaga gaagtgtaga 4572ggatgatgtt aacataattt tagcacttca aggtataatt taaacagtga ggtagttttg 4632aatggcattt cattaaggca tctatgggca ttatgagcta aaagctgtgg tatgttagct 4692ttaaaagagt atttatgttg gaataatttt taaataatgt ttacataact gtaagtcctg 4752tttggttgtt gttggacgca gggcggcaca tgagtgtttt tggttagagc caagatagct 4812cccatgcacc ggaattcctt tgggatgaat cagcatcatt ttaaacaaag tatatgtaaa 4872aggtgaaagg ttatattttt tacagatcag aatgtggcac cagaggactg tgtctcatta 4932aagtgattgc tgggagcaaa aactagaatg atacaaagaa aggtcagaga aatgcatggg 4992aatatttttt ctttaaaaaa aaaaaaaaa 5021<210>2<211>1015<212>蛋白質<213>人<400>2Met Pro Arg Ala Thr Ala Leu Gly Ala Leu Val Ser Leu Leu Leu Leu1 5 10 15Leu Pro Leu Pro Arg Gly Ala Gly Gly Leu Gly Glu Arg Pro Asp Ala20 25 30Thr Ala Asp Tyr Ser Glu Leu Asp Gly Glu Glu Gly Thr Glu Gln Gln35 40 45Leu Glu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp50 55 60Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys Ala65 70 75 80Arg Asp Trp Thr Lys Gln Thr Val Gly Ala Thr Gly His Ser Thr Gly85 90 95Gly Leu Glu Glu Gln Ala Ser Glu Ser Ser Pro Asp Thr Thr Ala Met100 105 110Asp Thr Gly Thr Lys Glu Ala Gly Lys Asp Gly Arg Glu Asn Thr Thr115 120 125Leu Leu His Ser Pro Gly Thr Leu His Ala Ala Ala Lys Thr Phe Ser130 135 140Pro Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro145 150 155 160Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln165 170 175Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys180 185 190Val Thr Phe Ile Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser195 200 205Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly210 215 220Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val225 230 235 240Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg245 250 255Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro260 265 270Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser275 280 285Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn290 295 300Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Gln Asp305 310 315 320Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln325 330 335Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly340 345 350Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro355 360 365Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr370 375 380Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Ser Met Asp Leu Phe Lys385 390 395 400Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Tyr Trp405 410 415Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu420 425 430Pro Leu Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser435 440 445Ser Asn Ile Leu Gly Lys Gly Phe Phe Ala Ala Tyr Glu Ala Thr Cys450 455 460Gly Gly Asp Met Asn Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr465 470 475 480Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val485 490 495Ser Glu Gly Phe His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile Glu500 505 510Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Pro515 520 525Thr Glu Glu Ser Ala Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro530 535 540Glu Asp Val Lys Ser Ser Ser Asn Arg Leu Trp Met Lys Phe Val Ser545 550 555 560Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu565 570 575Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu His Arg Cys580 585 590Val Asn Thr Leu Gly Ser Tyr Lys Cys Ala Cys Asp Pro Gly Tyr Glu595 600 605Leu Ala Ala Asp Lys Lys Met Cys Glu Val Ala Cys Gly Gly Phe Ile610 615 620Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr625 630 635 640Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Ala Gln Tyr645 650 655Arg Ile Ser Leu Gln Phe Glu Val Phe Glu Leu Glu Gly Asn Asp Val660 665 670Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala675 680 685Lys Leu His Gly Arg Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr690 695 700Ser Gln Ser Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val705 710 715 720Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys725 730 735Ala Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Phe Gly740 745 750Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Trp Leu His Glu Asn Gly755 760 765His Asp Cys Lys Glu Ala Gly Cys Ala His Lys Ile Ser Ser Val Glu770 775 780Gly Thr Leu Ala Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Arg785 790 795 800Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Leu805 810 815Thr Phe Asn Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp820 825 830His Leu Glu Met Tyr Asp Gly Pro Asp Ser Leu Ala Pro Ile Leu Gly
835 840 845Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Thr Val Ala Ser Gly Ser850 855 860Ser Met Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly865 870 875 880Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu885 890 895Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn900 905 910Tyr Pro Ser Glu Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly915 920 925Tyr Gly Val Glu Leu Thr Phe Arg Thr Phe Glu Val Glu Glu Glu Ala930 935 940Asp Cys Gly Tyr Asp Tyr Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser945 950 955 960Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile965 970 975Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe Arg Thr Asp Asp Thr980 985 990Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln99510001005Asp Ala Leu His Met Lys Lys10101015<210>3<211>4661<212>DNA<213>小鼠<220><221>CDS<222>(191)..(3229)<400>3agtcgtgttt agcagcggct tcccgggtgt ccaggccgga cgagaacgcc ttactgggct 60tgcttggtac cctaccggtg cctggcagcc aagcagcagc caccacaacc gaccctgtac 120gtggtgtctc tctggatccg agctttctgt gcaggttaag tccctcgggc cccgccgacc 180ccttgccact atg ccc ctt gcg acc act ctt ggc acc ctg gtg cta ctg 229Met Pro Leu Ala Thr Thr Leu Gly Thr Leu Val Leu Leu1 5 10ttg ctg cta ccg ctg ccc cgc ggt gct gaa gtg act ggg gac cat tcg 277Leu Leu Leu Pro Leu Pro Arg Gly Ala Glu Val Thr Gly Asp His Ser15 20 25aat gtc gcc ttg gac tac gga gcc ttg gaa ggc gag gag ggc acg gag 325Asn Val Ala Leu Asp Tyr Gly Ala Leu Glu Gly Glu Glu Gly Thr Glu30 35 40 45cag cag ctg cat tac cac gac ccc tgc aaa gct gct gtc ttc tgg gga 373Gln Gln Leu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly50 55 60gat att gct ctg gat gaa gat gat ctc aag tta ttt cac atc gac aag 421Asp Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys65 70 75gct gag gac tgg acc aag cca tcc att gac aaa cca gga cat gac act 469Ala Glu Asp Trp Thr Lys Pro Ser Ile Asp Lys Pro Gly His Asp Thr80 85 90gga ggc ctt gag gag aca tct gca agg tgg cca aac gat aca gcc tct 517Gly Gly Leu Glu Glu Thr Ser Ala Arg Trp Pro Asn Asp Thr Ala Ser95 100 105aac gcc agc atc cag gca cca aga aag gat ggc aag gat gcc acc aca 565Asn Ala Ser Ile Gln Ala Pro Arg Lys Asp Gly Lys Asp Ala Thr Thr110 115 120 125ttt ctg cct aac cct ggg acc tca aac acc acc gct aag acc ttc tct 613Phe Leu Pro Asn Pro Gly Thr Ser Asn Thr Thr Ala Lys Thr Phe Ser130 135 140gct cga gtt cga aga gct aca acc tca agg aca gag cgg att tgg cct 661Ala Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro145 150 155gga ggg gtc att cct tat gtc att gga gga aac ttt act ggt acc cag 709Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Thr Gln160 165 170agg gcc att ttc aaa cag gcc atg agg cac tgg gag aag cac acc tgt 757Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys175 180 185gtg acc ttc gta gag agg aca gat gag gaa agc ttc att gta ttc agt 805Val Thr Phe Val Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser190 195 200 205tac agg acc tgt ggt tgt tgt tcc tac gtg gga cgc cga gga ggt ggc 853Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly210 215 220ccg cag gcc ata tcc atc ggg aaa aac tgt gac aag ttc ggc att gtg 901Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val225 230 235gct cac gag ctg ggc cat gtg gtt ggg ttc tgg cat gaa cac act cgg 949Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg240 245 250cca gac cga gac caa cat gtc acc atc atc aga gaa aac atc cag cca 997Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro255 260 265ggt cag gag tat aat ttc tta aaa atg gaa gcc ggc gag gtg agc tct 1045Gly Gln Glu Tyr Ash Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser270 275 280 285ctg gga gag acc tac gac ttc gac agc atc atg cac tat gcc cgg aac 1093Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn290 295 300acc ttc tca aga gga gtt ttc tta gac acc atc ctc ccc cgt cga gac 1141Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Arg Asp305 310 315gac aat ggc gtc agg cca acc att ggc caa cgc gtg cgg crc agt cag 1189Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln320 325 330gga gat ata gct caa gcc agg aag ctg tac aaa tgc cca gca tgt ggg 1237Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly335 340 345gag aca cta cag gac acg aca gga aac ttt tcg gca cct ggt ttc cca 1285Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro350 355 360 365aat ggc tac ccc tcc tat tcc cac tgc gtc tgg agg atc tcc gtc acc 1333Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr370 375 380cca ggg gaa aag atc atc cta aat ttc acc tcc atg gat ttg ttt aag 1381Pro Gly Glu Lys Ile Ile Leu Asn Phe Thr Ser Met Asp Leu Phe Lys385 390 395agc cgc ctg tgc tgg tac gat tac gtg gag atc cgg gat ggt tac tgg 1429Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Ile Arg Asp Gly Tyr Trp400 405 410aga aag gcc ccc ctg ttg ggg agg ttc tgt ggc gat aag ata cct gag 1477Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu415 420 425tcc ctt gtc tcc tcg gac agc cgg ctc tgg gtg gaa ttc cgt agc agc 1525Ser Leu Val Ser Ser Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser430 435 440 445agc agc agc ctg ggc aaa ggc ttc ttt gct gta tat gaa gcc atg tgt 1573Ser Ser Ser Leu Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Met Cys450 455 460ggg gga gac ata acc aaa gat gca ggc cag att cag tct ccc aac tac 1621Gly Gly Asp Ile Thr Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr465 470 475cct gac gac tac aga cct tcc aag gaa tgt gtg tgg agg atc aca gtg 1669Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val480 485 490ccc gac ggg ttc cat gtg gga ctt acc ttc cag tcc ttc gag atc gaa 1717Pro Asp Gly Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu495 500 505agg cat gac agt tgt gca tat gac tat ctg gaa atc cga gac ggt ccc 1765Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Ile Arg Asp Gly Pro510 515 520 525aca gag gac agc acc ctg att ggc cac ttc tgt ggc tac gag aag ccg 1813Thr Glu Asp Ser Thr Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro530 535 540gag gcc gtg aaa tcc agc gct aac cga ctg tgg gtg aag ttt gtg tcc 1861Glu Ala Val Lys Ser Ser Ala Asn Arg Leu Trp Val Lys Phe Val Ser545 550 555gac ggc tcc atc aat aaa gcg ggc ttt gca gcc aat ttc ttc aag gag 1909Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu560 565 570gtg gat gag tgc tcc tgg cca gac cat ggt gga tgt gag cag cgc tgt 1957Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu Gln Arg Cys575 580 585gta aac aca ctc ggc agc tac acg tgt gcc tgt gac cct ggc tac gaa 2005Val Asn Thr Leu Gly Ser Tyr Thr Cys Ala Cys Asp Pro Gly Tyr Glu590 595 600 605ctg gct gcc gac aag aag aca tgt gaa gtg gcc tgt ggt ggc ttc att 2053Leu Ala Ala Asp Lys Lys Thr Cys Glu Val Ala Cys Gly Gly Phe Ile610 615 620acc aag cta aac ggc acc atc acc agc cct gga tgg ccg aag gag tat 2101Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr625 630 635ccc acc aac aag aac tgt gtc tgg cag gtg gtg gct ccc gtg cag tac 2149Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Val Gln Tyr640 645 650cgc atc tca ctg cag ttc gaa gcc ttt gag ctg gaa ggc aat gac gtc 2197Arg Ile Ser Leu Gln Phe Glu Ala Phe Glu Leu Glu Gly Asn Asp Val655 660 665tgt aag tat gac ttc gta gag gtg cgc agt ggc ctg tcc cca gat gcc 2245Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala670 675 680 685aag ctt cac ggc aaa ttc tgt ggc tcc gag acc ccg gag gtc atc aca 2293Lys Leu His Gly Lys Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr690 695 700tcg cag agc aac aac atg cga gtg gaa ttc aag tct gac aac acc gtc 2341Ser Gln Ser Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val705 710 715tcc aag cga ggc ttc agg gct cac ttc ttc tca gac aaa gac gag tgt 2389Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys720 725 730gcc aaa gac aat ggc ggc tgc cag cag gag tgt gtc aac acg ttc ggg 2437Ala Lys Asp Asn Gly Gly Cys Gln Gln Glu Cys Val Asn Thr Phe Gly735 740 745agt tac ctg tgc aga tgc agg aac ggg tac cga ctg cat gag aac gga 2485Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Arg Leu His Glu Asn Gly750 755 760 765cac gac tgc aaa gag gct ggc tgc gcc tac aag atc agc agt gca gag 2533His Asp Cys Lys Glu Ala Gly Cys Ala Tyr Lys Ile Ser Ser Ala Glu770 775 780ggg acc ctg atg agt cct aac tgg cca gac aaa tac ccc agc cgg aag 2581Gly Thr Leu Met Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys785 790 795gaa tgt acc tgg aac att tca tca acc gca ggc cac agg gtg aaa att 2629Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Ile800 805 810aca ttc agt gag ttc gag att gag cag cac cag gaa tgt gcc tat gac 2677Thr Phe Ser Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp815 820 825cac ctg gaa ctg tac gat ggg aca gac agc ttg gcc ccc arc ctt ggc 2725His Leu Glu Leu Tyr Asp Gly Thr Asp Ser Leu Ala Pro Ile Leu Gly830 835 840 845cgc ttc tgc ggc agc aag aag ccg gat ccc gtg gtg gcg aca ggc agc 2773Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Val Val Ala Thr Gly Ser850 855 860agc cta ttc ctc agg ttt tac tcg gac gcc tca gtg cag cgg aaa ggc 2821Ser Leu Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly865 870 875ttc cag gct gtg cac agc aca gag tgt ggg ggc agg ctg aag gct gaa 2869Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu880 885 890gta cag acc aaa gag ctc tat tcc cat gcc cag ttt ggg gac aac aac 2917Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn895 900 905tac ccg agc cag gcc cgc tgt gac tgg gtg ata gtg gca gaa gac ggt 2965Tyr Pro Ser Gln Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly910 915 920 925tat ggc gtg gag ctg ata ttc cgg acc ttt gaa gtt gag gag gaa gct 3013Tyr Gly Val Glu Leu Ile Phe Arg Thr Phe Glu Val Glu Glu Glu Ala930 935 940gac tgt ggc tac gac ttc atg gag gct tat gat ggg tac gac agc tcg 3061Asp Cys Gly Tyr Asp Phe Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser945 950 955gca ccc agg ctc ggc cgc ttc tgt ggc tca ggg cca tta gag gaa atc 3109Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile960 965 970tac tcc gcc gga gac tcg cta atg atc cgc ttc cac acg gac gac acc 3157Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe His Thr Asp Asp Thr975 980 985atc aac aag aaa ggc ttt cac gcc cgg tac act agc acc aag ttc caa 3205Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln990 99510001005gac gcc ttg cac atg agg aag tag cgcctcagtt ctggaaaggc agagagactg 3259Asp Ala Leu His Met Arg Lys1010agggtgtttt aaacacttgc gagtgagcag cctcccatgt acagtgtttt ttctccacaa 3319caaaaaccca aactatgttc ttgaaactct atatctgggt gacagtacat gcctttggcc 3379aacgggagga gagagagggg ccgttggttc tggctgtggc gttatcagtc gcagcttctg 3439gaggaggtca aagtttgatg ttagcgacca aacaggatga cttcttcaca tttgtctcta 3499agctttgctc ctgtggctcc gaaggccagc ctggggcaaa aggacagctt agggcaaaag 3559actgcctctc tctcaactct ggcccggctt ccatagatgg catgagccca gtgtgctggt 3619gacttggctg ccctctgact actgggcatg gaggattata gattggcagc ggcttcgctg 3679atactcgcag gtgtggctga acgcttctgt gcagttctac cagagtcaag ccaatcaaga 3739aaccggagac cgtggacacg agagttaagg tggcatccca gggcacaggg agggggctca 3799acctgggaac cacataatgg cgctggaaga ccttgagcat cttcctctgg ccctgcttgt 3859ccttgtcacc tctggggagc ccctgtcatc agtctccatt cagaaaggag aacccacggt 3919cactcctagc agaacattcg ctggcgagca cccccaggtt gctgagagga cgcctagctt 3979cacccaatat ttctcctctg ctcagaggct tagaagatga tgtcacctgc gctggggttc 4039ccagatgtca cctgggctgg ggttcccatg ggcttccagg aacctcccag ctgaaggcac 4099ctgctctggc gaacctcagc cgctggacag ccagttcaaa cagcatctgc gagacgtgtc 4159aagtcatctc aggaccaatc cacgtctcac tgggagaaaa ctagtaattc cacattatct 4219aagagccacc gtctctggaa caaggtggtc tgtggtacga ctcatgtaac cagacaggtt 4279agagtgcgtg gacggctttg ctgggattaa ccgggaccca gccgccctct tgcactcaga 4339attctcagca cccctgcact tgctctagcg gcgtgttaag ggtgatgttt acataatttt 4399agcacctcaa ggtataatcg aaatagtgag gtagttttga atggcatttc gttaaggcat 4459ctctgggcat tatgagctta aaagctgtgg tacgttagct ttctaagagc atttatgttg 4519gaatactttt aaaataatgt ttacattaac taactgcaag tcctgttggt tgggttggtg 4579gcaaacgcag ggcggcggca caggagactg ttgctgttag agatggcgta gctcccaagc 4639accagaatcc ctatgtgatc ta 4661<210>4<211>1012<212>蛋白質<213>小鼠<400>4Met Pro Leu Ala Thr Thr Leu Gly Thr Leu Val Leu Leu Leu Leu Leu1 5 10 15Pro Leu Pro Arg Gly Ala Glu Val Thr Gly Asp His Ser Asn Val Ala20 25 30Leu Asp Tyr Gly Ala Leu Glu Gly Glu Glu Gly Thr Glu Gln Gln Leu35 40 45His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala50 55 60Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys Ala Glu Asp65 70 75 80Trp Thr Lys Pro Ser Ile Asp Lys Pro Gly His Asp Thr Gly Gly Leu85 90 95Glu Glu Thr Ser Ala Arg Trp Pro Asn Asp Thr Ala Ser Asn Ala Ser100 105 110Ile Gln Ala Pro Arg Lys Asp Gly Lys Asp Ala Thr Thr Phe Leu Pro115 120 125Asn Pro Gly Thr Ser Asn Thr Thr Ala Lys Thr Phe Ser Ala Arg Val130 135 140Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly Val145 150 155 160Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Thr Gln Arg Ala Ile165 170 175Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr Phe180 185 190Val Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser Tyr Arg Thr195 200 205Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly Pro Gln Ala210 215 220Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Ala His Glu225 230 235 240Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg Pro Asp Arg245 250 255Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln Glu260 265 270Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser Leu Gly Glu275 280 285Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe Ser290 295 300Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Arg Asp Asp Asn Gly305 310 315 320Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln Gly Asp Ile325 330 335Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly Glu Thr Leu340 345 350Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro Asn Gly Tyr355 360 365Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr Pro Gly Glu370 375 380Lys Ile Ile Leu Asn Phe Thr Ser Met Asp Leu Phe Lys Ser Arg Leu385 390 395 400Cys Trp Tyr Asp Tyr Val Glu Ile Arg Asp Gly Tyr Trp Arg Lys Ala405 410 415Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu Ser Leu Val420 425 430Ser Ser Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser Ser Ser Ser435 440 445Leu Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Met Cys Gly Gly Asp450 455 460Ile Thr Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp Asp465 470 475 480Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val Pro Asp Gly485 490 495Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His Asp500 505 510Ser Cys Ala Tyr Asp Tyr Leu Glu Ile Arg Asp Gly Pro Thr Glu Asp515 520 525Ser Thr Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro Glu Ala Val530 535 540Lys Ser Ser Ala Asn Arg Leu Trp Val Lys Phe Val Ser Asp Gly Ser545 550 555 560Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Val Asp Glu565 570 575Cys Ser Trp Pro Asp His Gly Gly Cys Glu Gln Arg Cys Val Asn Thr580 585 590Leu Gly Ser Tyr Thr Cys Ala Cys Asp Pro Gly Tyr Glu Leu Ala Ala595 600 605Asp Lys Lys Thr Cys Glu Val Ala Cys Gly Gly Phe Ile Thr Lys Leu610 615 620Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr Pro Thr Asn625 630 635 640Lys Asn Cys Val Trp Gln Val Val Ala Pro Val Gln Tyr Arg Ile Ser645 650 655Leu Gln Phe Glu Ala Phe Glu Leu Glu Gly Asn Asp Val Cys Lys Tyr660 665 670Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala Lys Leu His675 680 685Gly Lys Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr Ser Gln Ser690 695 700Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val Ser Lys Arg705 710 715 720Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ala Lys Asp725 730 735Asn Gly Gly Cys Gln Gln Glu Cys Val Asn Thr Phe Gly Ser Tyr Leu740 745 750Cys Arg Cys Arg Asn Gly Tyr Arg Leu His Glu Asn Gly His Asp Cys755 760 765Lys Glu Ala Gly Cys Ala Tyr Lys Ile Ser Ser Ala Glu Gly Thr Leu770 775 780Met Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys Thr785 790 795 800Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Ile Thr Phe Ser805 810 815Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu Glu820 825 830Leu Tyr Asp Gly Thr Asp Ser Leu Ala Pro Ile Leu Gly Arg Phe Cys
835 840 845Gly Ser Lys Lys Pro Asp Pro Val Val Ala Thr Gly Ser Ser Leu Phe850 855 860Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln Ala865 870 875 880Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Val Gln Thr885 890 895Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro Ser900 905 910Gln Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly Tyr Gly Val915 920 925Glu Leu Ile Phe Arg Thr Phe Glu Val Glu Glu Glu Ala Asp Cys Gly930 935 940Tyr Asp Phe Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser Ala Pro Arg945 950 955 960Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile Tyr Ser Ala965 970 975Gly Asp Ser Leu Met Ile Arg Phe His Thr Asp Asp Thr Ile Asn Lys980 985 990Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln Asp Ala Leu99510001005His Met Arg Lys1010<210>5<211>20<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物1<400>5cargcmatgm gnactgggag20<210>6<211>21<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物2<400>6cargcmatgm gncactggga a 21<210>7<211>22<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物3<400>7gaadgtgttv ckngcrtart gc 22<210>8<211>27<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物4<400>8tgtggtgtct gggctgctct cagatgc 27<210>9<211>25<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物5<400>9actgtctgct tggtccagtc tctgg 25<210>10<211>27<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物6<400>10tacctggaag tccgggatgg ccccacg 27<210>11<211>28<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物7<400>11gaggatgtga aatcgagctc caacagac28<210>12<211>27<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物8-11<400>12raanccytty ttnnndatng trtcrtc 27<210>13<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物12<400>13caacaactac ccgagcgagg cccc24<210>14<211>26<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物12<400>14gaagcctacg acggctacga cagctc 26<210>15<211>25<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物14<400>15gctttcctca tctgtcctct ctacg 25<210>16<211>23<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物15<400>16cctgtgtgac cttcgtagag agg 23<210>17<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物16<400>17tgggagctga gcaatgctaa ctgc24<210>18<211>24<212>DNA<213>人工序列<220><223>人工序列的描述寡核苷酸引物17<400>18gaaggtgttc cgggcgtagt gcat 2權利要求
1.一種分離的多核苷酸,它包含能在聚合酶鏈反應中擴增的核苷酸序列,該聚合酶鏈反應使用含有SEQ ID NO:7所示序列的第一簡并擴增引物和含有選自SEQ IDNO:5和SEQ ID NO:6所示序列的第二簡并擴增引物,其中多核苷酸不被ApaⅠ切割。
2.根據權利要求1所述的多核苷酸,其中多核苷酸可從人獲得。
3.根據權利要求2所述的多核苷酸,它包含SEQ ID NO:1的核苷酸365至3409的序列。
4.根據權利要求3所述的多核苷酸,它包含SEQ ID NO:1的序列。
5.根據權利要求1所述的多核苷酸,其中多核苷酸可從小鼠獲得。
6.根據權利要求5所述的多核苷酸,它包含SEQ ID NO:3的核苷酸191至3229的序列。
7.根據權利要求4所述的多核苷酸,它包含SEQ ID NO:3的序列。
8.一種基因構建物,它包含轉錄啟動子以及與轉錄啟動子操作性相連的多核苷酸,該多核苷酸包含能在聚合酶鏈反應中擴增的核苷酸序列,該聚合酶鏈反應使用含有SEQ ID NO:7所示序列的第一簡并擴增引物和含有選自SEQ ID NO:5和SEQ IDNO:6所示序列的第二簡并擴增引物,其中多核苷酸不被ApaⅠ切割。
9.根據權利要求8所述的基因構建物,其中多核苷酸可從人獲得。
10.根據權利要求9所述的基因構建物,它包含SEQ ID NO:1的核苷酸365至3409的序列。
11.根據權利要求10所述的基因構建物,它包含SEQ ID NO:1的序列。
12.根據權利要求8所述的基因構建物,其中多核苷酸可從小鼠獲得。
13.根據權利要求12所述的基因構建物,它包含SEQ ID NO:3的核苷酸191至3229的序列。
14.根據權利要求12所述的基因構建物,它包含SEQ ID NO:3的序列。
15.一種多肽,它含有選自SEQ ID NO:2和SEQ ID NO:4的序列。
16.一種選擇調節(jié)mTll-2蛋白活性的試劑的方法,該方法包括下列步驟在支持mTll-2蛋白功能、有和沒有一種或多種推定的活性調節(jié)劑的條件下,評價mTll-2蛋白的活性;和從一種或多種推定的調節(jié)劑中選出與沒有試劑時的該蛋白質活性相比能調節(jié)該蛋白質活性的試劑。
全文摘要
本發(fā)明提供了編碼與人或小鼠BMP-1/mTld不同且與人或小鼠mTll-1不同的特洛德樣蛋自的哺乳動物基因。該基因在結構上與BMP-1家族成員的基因相似,但是在基因圖譜中位于不同的位置,并編碼了具有不同活性的不同蛋白。該基因編碼的蛋白質可用來篩選抑制BMP-1家族基因活性以防止結疤、纖維變性等疾病的治療劑。
文檔編號C12N1/21GK1302332SQ9980654
公開日2001年7月4日 申請日期1999年4月2日 優(yōu)先權日1998年4月3日
發(fā)明者D·S·格林斯潘, I·C·斯科特, C·L·托馬斯 申請人:威斯康星校友研究基金會
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
东安县| 舒兰市| 宁陵县| 横山县| 南丹县| 沁水县| 东至县| 繁昌县| 江北区| 陆良县| 玉树县| 汤原县| 弋阳县| 安陆市| 陆河县| 方城县| 潜江市| 安岳县| 嘉鱼县| 大港区| 昌邑市| 沭阳县| 遂宁市| 怀化市| 望江县| 宁强县| 芜湖县| 山东| 青海省| 万盛区| 屯门区| 苍梧县| 凤山县| 定日县| 洪湖市| 辉南县| 湄潭县| 岑溪市| 江口县| 噶尔县| 友谊县|