專利名稱::與人g蛋白偶聯(lián)的孤兒受體的制作方法
技術(shù)領(lǐng)域:
:本專利申請文件中所公開的發(fā)明涉及跨膜受體,進(jìn)一步地講,涉及與人G蛋白偶聯(lián)的內(nèi)源孤兒受體(GPCR)。
背景技術(shù):
:盡管在人體內(nèi)有很多種類的受體,但到目前為止最豐富和最與治療有關(guān)的是G蛋白偶聯(lián)受體(GPCR)。據(jù)估計,在人類基因組內(nèi)有大約100,000個基因,它們中的大約2%即2,000個基因被估計用來編碼GPCR。包括GPCR在內(nèi),其內(nèi)源配體已被認(rèn)識的受體被稱為"已知"受體,內(nèi)源配體尚不知曉的受體被稱為"孤兒"受體。GPCR代表著藥物產(chǎn)品開發(fā)的一個重要領(lǐng)域60%的處方藥物開發(fā)自100個已知GPCR中的大約20個。這種區(qū)別并不僅是語義上的,尤其是對GPCR來說。因此,孤兒GPCR對于制藥工業(yè)來說就象金子對于19世紀(jì)晚期的加利福尼亞州一樣,是一個驅(qū)動成長、擴(kuò)張、提高和發(fā)展的機(jī)會。GPCR都具有一個相同的基元(motif)。所有這些受體具有七個由22到24個疏水氨基酸組成的序列,它們組成七個a螺旋,每個ct螺旋都跨過膜(每個跨度都以數(shù)字表示,例如,跨膜-l(TM-l)、跨膜-2(TM-2)等)。跨膜螺旋通過氨基酸鏈連接,在細(xì)胞膜的外部即"細(xì)胞外"一邊的氨基酸鏈分別在跨膜-2和跨膜-3、跨膜-4和跨膜-5、跨膜-6和跨膜-7之間(這些分別被稱為"細(xì)胞外"區(qū)1、2禾P3(EC-1、EC-2和EC-3))。在細(xì)胞膜內(nèi)部即"細(xì)胞內(nèi)"一邊,跨膜螺旋也通過氨基酸鏈進(jìn)行連接,這些氨基酸鏈分別在跨膜-1和跨膜-2、跨膜-3和跨膜-4、跨膜-5和跨膜-6之間(這些分別被稱為"細(xì)胞內(nèi)"區(qū)l、2和3(IC-1、IC-2和IC-3))。受體的"羧基"("C")端是在細(xì)胞內(nèi)的區(qū)域,受體的"氨基"("N")端在細(xì)胞外的區(qū)域。一般來說,當(dāng)內(nèi)源配體與受體結(jié)合時(經(jīng)常被稱為受體的"活化"),細(xì)胞內(nèi)區(qū)域的構(gòu)象發(fā)生變化,以容許細(xì)胞內(nèi)區(qū)域和細(xì)胞內(nèi)"G-蛋白"進(jìn)行偶聯(lián)。據(jù)報道,GPCR對于G蛋白而言是"混雜的",也就是說,可與不只一個G蛋白相互作用。參見,Kenakin,T.,43,生活科學(xué)(LifeSciences)1095(1988)。盡管存在其他G蛋白,但當(dāng)前已被識別的G蛋白是Gq、Gs、Gi和Go。內(nèi)源配體活化的GPCR與G-蛋白的偶聯(lián)引發(fā)一個信號級聯(lián)過程(被稱為"信號傳導(dǎo)")。在通常情形下,信號傳導(dǎo)最終導(dǎo)致細(xì)胞活化或細(xì)胞抑制。據(jù)認(rèn)為,受體的IC-3環(huán)與羧基端都和G蛋白相互作用。在生理條件下,GPCR存在于細(xì)胞膜上,并在"非活化"狀態(tài)和"活化"狀態(tài)這兩種不同構(gòu)象之間保持平衡。在非活性狀態(tài)下的受體不能與細(xì)胞內(nèi)信號傳導(dǎo)途徑相偶聯(lián)以產(chǎn)生生物學(xué)反應(yīng)。受體構(gòu)象向活性狀態(tài)的轉(zhuǎn)變就使它與傳導(dǎo)途徑相偶聯(lián)(通過G-蛋白)并產(chǎn)生生物學(xué)反應(yīng)??赏ㄟ^內(nèi)源配體或化合物如藥物將受體穩(wěn)定在其活性狀態(tài)。發(fā)明概述這里公開的是人與G蛋白偶聯(lián)的內(nèi)源孤兒受體。附圖的簡要描述圖1A和1B提供的是本文提供的某些斑點(diǎn)印跡的參照"格柵"(分別參見圖2A和2B)。圖2A和2B再現(xiàn)的是從hCHN3和hCHN8得到的某些斑點(diǎn)印跡分析的結(jié)果(分別參見圖1A和1B)。圖3再現(xiàn)的是hRUP3的RT-PCR分析結(jié)果。圖4再現(xiàn)的是hRUP4的RT-PCR分析結(jié)果。圖5再現(xiàn)的是hRUP6的RT-PCR分析結(jié)果。詳細(xì)描述本科學(xué)文獻(xiàn)涉及受體并采用一些術(shù)語來描述對受體具有不同作用的配體。為了清楚和前后一致,在本發(fā)明文獻(xiàn)中將由始至終使用下列定義。在這些定義與這些詞語的其他定義沖突時,選擇下列定義在此應(yīng)用的氨基酸縮寫列于下表:丙氨酸ALAA精氨酸ARGR天冬酰胺ASNN天冬氨酸ASPD半胱氨酸CYSC谷氨酸GLUE谷氨酰胺GLNQ甘氨酸GLYG組氨酸HISH異亮氨酸ILEI亮氨酸LEU賴氨酸LYSK蛋氨酸METM苯丙氨酸PHEF脯氨酸PROP絲氨酸SERS蘇氨酸THRT色氨酸TRPW酪氨酸TYRY纈氨酸VALV6組合物是指至少包含一種成分的物質(zhì)。內(nèi)源意味著由物種的基因組天然產(chǎn)生的物質(zhì)。關(guān)于內(nèi)源的受體,意味著由哺乳動物(例如但不限于人)或病毒天然產(chǎn)生的物質(zhì),這些只作為例證但卻不是限制。與之相對比,術(shù)語"非內(nèi)源"在本文中意味著不是由哺乳動物(例如但不限于人)或病毒天然產(chǎn)生的。宿主細(xì)胞意味著能在其中插入質(zhì)粒和/或載體的細(xì)胞。在原核宿主細(xì)胞情形下,當(dāng)宿主細(xì)胞復(fù)制時質(zhì)粒典型地以自主分子方式復(fù)制(在一般情況下,質(zhì)粒在復(fù)制后被分離出來以被引入真核宿主細(xì)胞中);在真核宿主細(xì)胞情形下,質(zhì)粒被整合進(jìn)宿主細(xì)胞的細(xì)胞DNA中,因而,當(dāng)真核細(xì)胞復(fù)制時,質(zhì)粒復(fù)制。為在此公開的本發(fā)明的目的,宿主細(xì)胞優(yōu)選是真核細(xì)胞,更優(yōu)選是哺乳動物細(xì)胞,最優(yōu)選地是從293、293T和COS-7細(xì)胞中選擇出來的細(xì)胞。配體意味著對內(nèi)源的天然產(chǎn)生的受體特異的內(nèi)源的天然產(chǎn)生的分子。非孤兒受體是指天然存在的內(nèi)源分子,對天然存在的內(nèi)源配體表現(xiàn)出特異性,配體與受體的結(jié)合使胞內(nèi)信號途經(jīng)得以活化。孤兒受體意味著這樣的內(nèi)源受體,其特異的內(nèi)源配體尚未被識別或尚未知。質(zhì)粒意味著載體和cDNA的結(jié)合體。一般,為cDNA復(fù)制和/或表達(dá)蛋白質(zhì)的目的將質(zhì)粒引進(jìn)宿主細(xì)胞。針對cDNA的載體意味著能夠?qū)⒅辽僖粋€cDNA摻入其中且導(dǎo)入到宿主細(xì)胞中的環(huán)形DNA。下面部分的順序安排是為了表達(dá)效果,而不能被解釋為對下面的公開或權(quán)利要求的限制。人GPCR的確認(rèn)人類基因組計劃的實(shí)施導(dǎo)致位于人類基因組內(nèi)有關(guān)核酸序列的大量信息的識別,經(jīng)過這種努力,事實(shí)上,我們無需了解或認(rèn)識任何特定的基因組序列是否包含翻譯人類蛋白的可讀框信息,即可獲得遺傳序列信息,幾種識別人類基因組中核酸序列的方法都是本領(lǐng)域普通技術(shù)人員所熟悉的,比如(但不限定),此處公開的大量人類GPCR,即是通過回顧GenBankTM數(shù)據(jù)庫而發(fā)現(xiàn)的,并通過應(yīng)用先前已測序的GPCR核酸序列,檢索BLAST的EST數(shù)據(jù)庫,發(fā)現(xiàn)了其他的GPCR。下面的表A,列出了幾個與GPCR各自的同源受體一道被我們發(fā)現(xiàn)的內(nèi)源GPCR。公開的人類孤兒GPCR入藏登記表A可讀框(堿基對)與指明的GPCR同源性比率參考同源GPCR(編號)hARE-3AL0333791,260bphARE-4AO0060871,119bphARE-5AC0062551,104bp52.3%LPA-RU9264236%P2Y5AF00054632%OryziasMpesD43633hGP肪hARE-lhARE-2hPPRlhG2AAA775870AI090920AA3595MH67224AA7547Q21,128bp999bp1,122bp1,053bp1,113bp43%KIAA00153%GPR2739%EBI131%GPR4D13626L31581L36148hRUP3AL0354231,005bp30%果蠅2133653hRUP4AD076581,296bp32%pNPGPRNP—00487628%斑馬魚YaAAC41276和29%斑馬魚Yb,AAB94616hRUP5AC005柳1,413bp25%DEZQ9978823%FMLPRP21462hRUP6AC0058711,245bp48%GPR66NP—006047hRUP7AC0079221,173bp43%H3RAF140538hCHN3ENI365811,113bp53%GPR27hCHN4AA8045311,077bp32%凝血酶4503637hCHN6ES121346701,503bp36%edg-lNPJKU391hCHN8EST7644551,029bp47%D13626KIAA0001hCHN9EST15415361,077bp41%LTB4RNM—000752hCHN10EST1365839l,055bp35%P2YNM—002563受體同源性對于進(jìn)一步了解受體在人體中的作用是有用的。另外,這種同源性可以用來洞察可能是本文公開的孤兒GPCR的天然激活劑的可能的內(nèi)源配體。B.受體篩選因?yàn)槭荏w的傳統(tǒng)研究一直是基于這樣的前置假定(基于歷史),即內(nèi)源配體必須首先被識別,然后才能發(fā)現(xiàn)可以作用于受體的拮抗劑和其他分子,所以,在過去的幾年中,用于進(jìn)行內(nèi)源配體識別(該識別主要是為了提供進(jìn)行受體結(jié)合測定(該測定需要受體的內(nèi)源配體)的各種方法)的技術(shù)越來越容易找到。甚至在拮抗劑被首先發(fā)現(xiàn)的情況下,搜索的目光也立即延伸到査找內(nèi)源配體上去。即使在發(fā)現(xiàn)組成型活化受體之后,這種思維模式也一直在受體研究中持續(xù)。在此之前沒有被認(rèn)識到的是,是受體的活性狀態(tài)對發(fā)現(xiàn)受體的激活劑、部分激活劑和反激活劑是最有用的。對于那些因?yàn)槭荏w的過度活化和不夠活化而導(dǎo)致的疾病來說,希望得到的治療藥物是能分別用來減少受體的活性狀態(tài)或增強(qiáng)受體活性的化合物,而并不需要是對抗內(nèi)源配體的拮抗劑。這是因?yàn)?,一個降低或增強(qiáng)活化態(tài)受體活性的化合物并不需要結(jié)合在和內(nèi)源配體一樣的位點(diǎn)上。因而,正如本發(fā)明的一個方法所說的那樣,對治療性化合物的任何搜索可通過篩選針對配體非依賴性活性態(tài)的化合物而開始。如在本領(lǐng)域已知的情形,GPCR即使是在沒有該受體的內(nèi)源配體與之結(jié)合的情況下,在其內(nèi)源狀態(tài)GPCR也可能是"活化的"。這種天然活化的受體可被直接識別(即,不需要受體的內(nèi)源配體存在)、特別是反激活劑的直接識別所篩選。另外,該受體也可通過例如受體的突變以建立該受體的非內(nèi)源形式來進(jìn)行活化,所述非內(nèi)源形式在沒有受體的內(nèi)源配體存在下也處于活性狀態(tài)。對應(yīng)于此處公開的人孤兒GPCR的內(nèi)源或非內(nèi)源組成型活化形式的候選化合物進(jìn)行篩選,可直接識別在細(xì)胞表面受體上起作用的候選化合物,而不需要使用受體的內(nèi)源配體。通過確定此處公開的人GPCR的內(nèi)源形式在體內(nèi)表達(dá)或過表達(dá)的區(qū)域,有可能確定與受體表達(dá)或過表達(dá)關(guān)聯(lián)的相關(guān)疾病/紊亂,這種方法在本專利申請文件中得以公開。制造可以證明此處公開的人孤兒GPCR組成型活化的突變的技術(shù),是基于與脯氨酸殘基的距離,據(jù)估計此殘基位于GPCR的TM6內(nèi)部,通常在TM6/IC3交界處附近(該脯氨酸殘基看起來非常保守)。通過使距該殘基16個氨基酸殘基處的氨基酸殘基(估計位于受體的IC3區(qū))發(fā)生突變,最好是突變?yōu)橘嚢彼幔梢垣@得這種活化。其他氨基酸在此位置上的突變可用來達(dá)到此目的。C.疾病/紊亂識別和/或選擇優(yōu)選人孤兒GPCR的DNA序列被用來制作探針,用于進(jìn)行(a)針對組織mRNA的斑點(diǎn)印跡和(b)組織樣品中所述受體表達(dá)的RT-PCR識別。在組織或疾病組織中受體的存在,或者與正常組織相比在疾病組織中受體的濃度提高,可被優(yōu)選地用來識別治療方法(包括但不限于)與那種疾病的關(guān)聯(lián)。用這種方法也可很好地把受體定位于器官的區(qū)域。基于受體被定位于其中的特定組織的已知功能,受體假想的功能性角色可被推導(dǎo)出來。D.候選化合物的篩選1.一般GPCR的篩選測定技術(shù)當(dāng)一種G蛋白受體變?yōu)榻M成型活化(即,在沒有內(nèi)源配體與之結(jié)合的情況下活化)時,它與G蛋白(例如,Gq、Gs、Gi、Go)偶聯(lián)并刺激GTP與G蛋白結(jié)合。接著,借助受體在正常情況下失活,G蛋白作為GTP酶慢慢地把GTP水解為GDP,然而,組成型活化的受體繼續(xù)把GDP轉(zhuǎn)化為GTP。GTP非可水解的類似物["S]GTPYS,可被用來監(jiān)測與表達(dá)組成型活化受體的膜的結(jié)合。據(jù)報道,[35S]GTPYS可被用來監(jiān)測在配體存在或不存在的情形下G蛋白與膜的偶聯(lián)。在本領(lǐng)域中著名和可行的其他例證中有此種監(jiān)測的一個例證,它由Traynor和Nahorski在1995年所報道。本測定系統(tǒng)的一個優(yōu)選的應(yīng)用是為了初步篩選候選化合物,因?yàn)楸鞠到y(tǒng)對所有G蛋白-偶聯(lián)受體一般可行,而不考慮與受體的細(xì)胞內(nèi)結(jié)構(gòu)域相互作用的那一種特別的G蛋白。2.特定的GPCR篩選測定技術(shù)一旦應(yīng)用"一般"G蛋白偶聯(lián)的受體測定方法(即篩選是激活劑、部分激活劑或反激活劑的化合物的方法)識別出候選化合物,優(yōu)選進(jìn)一步篩選以確認(rèn)作用在受體位點(diǎn)的化合物。例如,應(yīng)用"一般"測定方法識別的化合物可以不與受體結(jié)合,但也可以僅僅從細(xì)胞內(nèi)結(jié)構(gòu)域與G蛋白"解偶聯(lián)"。a.Gs禾口GiGs刺激腺苷酸環(huán)化酶。另一方面,Gi(和Go)抑制該酶。腺苷酸環(huán)化酶催化ATP向cAMP的轉(zhuǎn)化;因此,與Gs蛋白偶聯(lián)的組成型活化的GPCR與升高的細(xì)胞內(nèi)cAMP水平相關(guān)聯(lián)。在另一方面,與Gi(或Go)蛋白偶聯(lián)的組成型活化的GPCR與降低的細(xì)胞內(nèi)cAMP水平相關(guān)聯(lián)。一般情況參見"突觸傳導(dǎo)的非直接機(jī)制(IndirectMechanismsofSynapticTransmission)",第8章,從神經(jīng)到大腦(FromNeuronToBrain)(第三版),Nichols,J.G.等編,SinauerAssociates,Inc.(1992)。因此,檢測cAMP的方法可被用來確定一個競爭性的化合物是否是受體的反激活劑(即這樣的一個化合物將能降低cAMP的水平)等。本領(lǐng)域已知的測定cAMP的不同方法可以被利用;最優(yōu)選的方法依賴于在基于ELISA的方法中應(yīng)用抗-cAMP的抗體??杀粦?yīng)用的另一類測定方法是一種全細(xì)胞第二信使報告基因系統(tǒng)測定法?;蛏系膯幼域?qū)動由一個特別的基因所編碼的蛋白質(zhì)的表達(dá)。環(huán)AMP通過以下步驟促進(jìn)基因的表達(dá),即它響應(yīng)促進(jìn)cAMP的DNA結(jié)合蛋白或轉(zhuǎn)錄因子(CREB)的結(jié)合,轉(zhuǎn)錄因子接著在被稱為cAMP效應(yīng)元件的特別位點(diǎn)與啟動子結(jié)合并驅(qū)動基因表達(dá)。報告基因系統(tǒng)可被構(gòu)建為具有一個啟動子,該啟動子在報告基因的前面含有多個cAMP效應(yīng)元件,例如(3-半乳糖苷酶或熒光素酶。因而,一個被組成型活化的連接Gs的受體引起cAMP的積累,cAMP接著激活報告蛋白質(zhì)的基因和表達(dá)。(3-半乳糖苷酶或熒光素酶等報告蛋白質(zhì)可用標(biāo)準(zhǔn)生化方法檢測到(Chen等,1995)。b.Go和GqGo和Gq與磷脂酶C的活化相聯(lián)系,磷脂酶隨后水解磷酸酯PIP2,并釋放兩種細(xì)胞內(nèi)信使二酰甘油(DAG)和肌醇-1,4,5-三磷酸(IP3)。積累增加的IP3與Gq-和Go-關(guān)聯(lián)的受體相關(guān)聯(lián)。一般情況參見"突觸傳導(dǎo)的非直接機(jī)帝!j(IndirectMechanismsofSynapticTransmission)",第8章,從神經(jīng)到大腦(FromNeuronToBrain)(第三版),Nichols,J.G.等編,SinauerAssociates,Inc.(1992)。測定IP3積累的方法可被用來確定一個候選化合物是否是例如針對Gq-或Go-關(guān)聯(lián)受體等的反激活劑(即如此的化合物能降低IP3的水平)。Gq關(guān)聯(lián)受體也可用API報告基因測定方法來檢測,因?yàn)镚q依賴的磷脂酶C引起含有API元件的基因活化;因而,活化的Gq關(guān)聯(lián)受體將導(dǎo)致如此基因的表達(dá)增高,而其反激活劑將導(dǎo)致如此表達(dá)的降低,激活劑將導(dǎo)致如此表達(dá)的升高。進(jìn)行如此測定的商業(yè)可得的方法是可得的。3.GPCR融合蛋白內(nèi)源組成型活化的孤兒GPCR或非內(nèi)源組成型活化的孤兒GPCR,用于篩選候選化合物,直接識別反激活劑、激活劑和部分激活劑,提出了一個獨(dú)特的篩選難題,確切地說,在沒有內(nèi)源配體結(jié)合的情況下,受體仍有活性。因此,使用能加強(qiáng)由該活化的受體獲得的信號的方法是經(jīng)常有用的。優(yōu)選的辦法就是使用GPCR融合蛋白。一般來講,應(yīng)用上述分析技術(shù)(還有其它的技術(shù))一旦確定GPCR是或已被組成型活化的,就可能確定與內(nèi)源GPCR偶聯(lián)的優(yōu)勢G蛋白,G蛋白與GPCR的偶聯(lián)提供了可被估計的信號途徑。因?yàn)樽詈檬鞘褂貌溉閯游锉磉_(dá)系統(tǒng)進(jìn)行篩選,就希望在這個系統(tǒng)中有內(nèi)源G蛋白存在,確切來說,該組成型活化的孤兒GPCR在這個系統(tǒng)中持續(xù)產(chǎn)生信號。從這點(diǎn)上,優(yōu)選使信號得到加強(qiáng),從而在(例如)受體的反激活劑存在時,很可能更方便地區(qū)分與反激活劑接觸的不同受體,特別是在篩選的整個過程中。GPCR融合蛋白的作用是增加G蛋白與非內(nèi)源GPCR偶聯(lián)的效應(yīng),GPCR融合蛋白優(yōu)選用于篩選非內(nèi)源組成型活化的GPCR,因?yàn)檫@種方法增強(qiáng)對這樣的篩選技術(shù)非常有用的信號,雖然該GPCR融合蛋白也可(而且優(yōu)選)與內(nèi)源組成型活化的GPCR—起使用。重要的是有助于產(chǎn)生很大的"信噪"比,這種大信噪比對篩選此處公開的候選化合物是特別優(yōu)選的。用于GPCR融合蛋白表達(dá)的構(gòu)建體的構(gòu)建技術(shù)是本領(lǐng)域普通技術(shù)人員所熟悉,商業(yè)可獲得的表達(dá)載體和系統(tǒng)為實(shí)驗(yàn)者提供了各種可以滿足特殊需要的方法,這種GPCR融合蛋白構(gòu)建體重要的衡量標(biāo)準(zhǔn),就是內(nèi)源GPCR序列與G蛋白序列都符合讀框(最好是,內(nèi)源GPCR的序列位于G蛋白序列上游),以及必須去除或替代GPCR的"終止"密碼子,從而隨著GPCR的表達(dá),G蛋白也能表達(dá)。GPCR可以直接連到G蛋白上,或在兩者之間存在間隔殘基(最好不超過12個,雖然本領(lǐng)域的普通技術(shù)人員可以很方便得知這一數(shù)字)。我們喜歡使用間隔子(其于方便),表達(dá)中不被有效利用的限制位點(diǎn)組成了間隔子。在制造GPCR融合蛋白構(gòu)建體之前,優(yōu)選首先確認(rèn)與GPCR偶聯(lián)的G蛋白,因?yàn)橹挥泻苌俚腉蛋白已被識別,所以優(yōu)選包含G蛋白序列(如通用G蛋白構(gòu)建體)的構(gòu)建體可在其中插入內(nèi)源GPCR序列,這樣可有效地大規(guī)模篩選大量具有不同序列的內(nèi)源GPCR。E.其他應(yīng)用盡管本文公開的人孤兒GPCR的一個優(yōu)選的應(yīng)用是為了直接識別作為反激活劑、激活劑或部分激活劑(優(yōu)選地作為藥物使用)的候選化合物,人GPCR的這些形式也可被用于研究之用。例如,帶有GPCR的體外或體內(nèi)系統(tǒng)可被用來闡釋和理解這些受體在正常和患病的人體狀況中的作用,也可理解當(dāng)它應(yīng)用于理解信號級聯(lián)反應(yīng)時組成型活化的角色。這些人孤兒GPCR的價值在于它們作為研究工具的用途被強(qiáng)化了,即使在其內(nèi)源配體被識別之前,由于其能夠確定這些受體在人體內(nèi)的位置,該GPCR可被用來理解這些受體在人體中的作用。此處所公開的受體的其他應(yīng)用對于本領(lǐng)域的技術(shù)人員將是明顯的,特別是當(dāng)他們閱讀了本申請文件之后。實(shí)施例下面提供的實(shí)施例,目的是要闡明而不是限制本發(fā)明。特異的核酸序列和氨基酸序列在此公開時,本領(lǐng)域的普通技術(shù)人員能夠?qū)@些序列進(jìn)行較小的修飾,并且得到與下面報告的相同或基本相似的結(jié)果。除非下文另外指明,對于所公開的人內(nèi)源孤兒GPCR的所有核酸序列均進(jìn)行了測序并得到了證實(shí)。對于受體的等同物,本領(lǐng)域的普通技術(shù)人員可以容易地想到的是可對所公開序列進(jìn)行保守取代以獲得功能上等同的受體。實(shí)施例1內(nèi)源人GPCR1.人GPCR的識別在瀏覽GenBank數(shù)據(jù)庫信息的基礎(chǔ)上,識別了一些己公開的內(nèi)源人GPCR。在檢索數(shù)據(jù)庫的同時,下列cDNA克隆也得以識別,列表如下。<table>tableseeoriginaldocumentpage15</column></row><table>用下列EST克隆作為詢問序列,對EST數(shù)據(jù)庫(dbest)進(jìn)行BLASTTM檢索,識別出其他已公開的人內(nèi)源GPCR。然后將下列已確認(rèn)的EST克隆用作探針篩選人的基因組文庫。己公開的人詢問EST克隆/可讀框核酸序列氨基酸序列孤兒GPCR(序列)入藏登記號(堿基對)SEQJDM)SEQ.ID.NOhGPCR27鼠AA7758701,125bp1516GPCR27hARE-lTDAG1689643999bp1718AI090920hARE-2GPCR27685301,122bp1920AA359504hPPRl牛2386671,053bp2122PPR1H67224hG2A鼠參見實(shí)施例l,113bp232411794262(a)hCHN3N.A.EST365811,113bp2526(全長)hCHN4TDAG11849341,077bp2728AA804531hC麗6N.A.EST21346701,503bp2930(全長)hC麗8KIAA0001EST7644551,029bp3132hCHN91365839EST15415361,077bp3334hCHN10鼠EST人13658391,005bp35361365839hRUP4N.A.AI3076581,296bp3738N.A.="不適用"2全長克隆a.hG2A(Seq.Id.No.23&24)利用鼠EST克隆1179426獲取包含幾乎所有三氨基酸hG2A編碼序列的人基因組克隆,該編碼序列通過5'RACETM獲得,PCR模板為Clontech,sHumanSpleenMarathon-ReadycDNA。已被公開的人G2A用PCR擴(kuò)增,第一和第二輪PCR使用G2AcDNA特異引物,其為SEQ.ID.NO.:39和SEQ.ID.NO.:40如下5'-CTGTGTACAGCAGTTCGCAGAGTG-3'(SEQ.ID.NO.:39,第一輪PCR)5'-GAGTGCCAGGCAGAGCAGGTAGAC-3'(SEaiD.NO.:40,第二輪PCR)用AdvantageGCPolymerase試劑盒進(jìn)行PCR(Clontech:按商家說明進(jìn)行操作),94°C30秒;94°C5秒,72°C4分鐘,5個循環(huán);94°C5秒,70°C4分鐘,30個循環(huán)。將大約1.3kbPCR片段從瓊脂糖凝膠中純化出來,經(jīng)HindIII和Xbal酶切,克隆到表達(dá)載體pRC/CMV2(Invitrogen)中。被克隆的插入片段用T7Sequenase試劑盒(USBAmersham;按商家說明進(jìn)行操作)進(jìn)行測序,并將所得序列與已存在的序列進(jìn)行比較。人G2A的表達(dá)通過用P"標(biāo)記片段與RNA點(diǎn)印跡雜交進(jìn)行測定(clontech;按商家說明進(jìn)行操作)。b.hCHN9(Seq.Id.No.33&34)EST克隆1541536的測序表明,hCHN9為cDNA克隆的一部分,只有起始密碼子,即,沒有終止密碼子。用hCHN9檢索數(shù)據(jù)庫進(jìn)行比較發(fā)現(xiàn),hCHN9的3'端序列與白細(xì)胞三烯B4受體cDNA5'端非翻譯區(qū)100%同源,該cDNA帶有一個與hCHN9編碼序列符合讀框的終止密碼子。為了確定LTB4RcDNA5'端非翻譯區(qū)是否是hCHN9的3'端序列,進(jìn)行了PCR擴(kuò)增,所用引物是以在hCHN9中發(fā)現(xiàn)的起始密碼子的5'端側(cè)翼序列和在LTB4R5'端非翻譯區(qū)中發(fā)現(xiàn)的終止密碼子的3'端側(cè)翼序列為基礎(chǔ)。所用的5'端引物序列如下5'-CCCGAATTCCTGCTTGCTCCCAGCTTGGCCC-3'(SEQ.ID.NO.:41,有義)5'-TGTGGATCCTGCTGTCAAAGGTCCCATTCCGG-3'(SEQ.ID.NO.:42,反義)以胸腺cDNA為模板,并用商家提供的緩沖液系統(tǒng)及rTth聚合酶(PerkinElmer)進(jìn)行PCR,每種引物0.25pM,4種核苷酸每種0.2mM。循環(huán)條件為94°Cl分鐘,65°Cl分鐘,72°C1分10秒,30個循環(huán),由PCR獲得了與預(yù)計大小一致的l.lkb片段,將該P(yáng)CR片段亞克隆到pCMV中(參見下文)并測序(參見SEQ.ID.NO.:33)。c.hRUP4(Seq.Id.No.37&38)以人腦cDNA(clontech)為模板,經(jīng)RT-PCR克隆了全長hRUP4。5'-TCACAATGCTAGGTGTGGTC-3'(SEQ.ID.NO.:43,有義)5'-TGCATAGACAATGGGATTACAG-3'(SEQ.ID.NO.:44,反義)使用TaqplasPrecision聚合酶(Stmtagene:按商家說明)進(jìn)行PCR,經(jīng)以下循環(huán)94°C2分鐘;94°C30秒;55°C30秒;72°C45秒;72°C10分鐘。循環(huán)2到循環(huán)4重復(fù)30次。PCR產(chǎn)物在1%瓊脂糖凝膠上分離,提取500bpPCR片段,并克隆到pCRII-TOPO載體(Invitrogen)中,用T7Sequerase試劑盒(Amsham)和SP6/T7引物(Stratagene)進(jìn)行測序。序列分析表明,該P(yáng)CR片段確實(shí)是AI307658的另一種剪接形式,帶有一個與其他GPCR相似的連續(xù)的可讀框,該P(yáng)CR片段的全序列如下丁GCCTCTTATGGTGATGCTTATTCTGTACGTAAAATTGGTTATGAACTTTGGATAAAGAAAAGAAAGAAACGAGCTGTCATTATGATGGTGACAGTGGTGGCTCTCTTTGCTGTGTGCTGGGCACCAATCAAGATGATTTTTGCTATCGTGCAAATTATTGGATTTTCCAACTCCATCTGTAATCCCATTGTCTATGCA-3'(SEQ.ID.NO.:45)以上面的序列為基礎(chǔ),制備兩個有義寡核苷酸引物5'-CTGCTTAGAAGAGTGGACCAG-3'(SEQ.ID.NO.:46,寡聚核苷酸引物1)5'-CTGTGCACCAGAAGATCTACAC-3'(SEQ.ID.NO.:47,寡聚核苷酸引物2)兩個反義寡核苷酸引物5'-CAAGGATGAAGGTGGTGTAGA-3'(SEQ.ID.NO.:48,寡聚核苷酸引物3)5'-GTGTAGATCTTCTGGTGCACAGG-3'(SEQ.ID.NO.:49,寡聚核苷酸引物4)用于3'端和5'端RACEPCR,以人腦Marathon-ReadycDNA(clontech,Cat#7400-1)為模板,按商家說明進(jìn)行。經(jīng)RACEPCR產(chǎn)生的DNA片段克隆到pCRII-TOPC)TM載體(Invitrogen)中,用SP6/T7弓|物(Stratagene)和一些中間引物測序,3'端RACE產(chǎn)物帶有一個poly(A)尾巴和一個結(jié)束于TAA終止密碼子的完整的可讀框,5'端RACE產(chǎn)物包含不完整的5'端,即,起始密碼子ATG沒有出現(xiàn)?;谛碌?'端序列,寡聚核苷酸引物3和下列引物5'-GCAATGCAGGTCATAGTGAGC-3'(SEQ.ID.NO.:50,寡聚核苷酸引物5)用于第二輪的5'端RACEPCR,對PCR產(chǎn)物象上面一樣進(jìn)行分析。第三輪的5'端RACEPCR用反義引物進(jìn)行5'-TGGAGCATGGTGACGGGAATGCAGAAG-3'(SEQ.ID.NO.:51,寡聚核苷酸引物6)5'-GTGATGAGCAGGTCACTGAGCGCCAAG-3'(SEQ.ID.NO.:52,寡聚核苷酸引物7)5'端RACEPCR產(chǎn)物序列顯示存在起始密碼子ATG,再下一輪的5'RACEPCR沒有產(chǎn)生更多的5'序列,通過利用有義引物5'-GCAATGCAGGCGCTTAACATTAC-3'(SEQ.ID.NO.:53,寡聚核苷酸引物8)和寡聚核苷酸引物4為引物進(jìn)行的RT-PCR,以及由人腦和心cDNA模板(Clontech、Cat#7404-1)產(chǎn)生的650bpPCR產(chǎn)物的序列分析,證實(shí)了上述完整的5'端序列。通過利用寡聚核苷酸引物2和下列反義引物的RT-PCR:5'-TTGGGTTACAATCTGAAGGGCA3'(SEQ.ID.NO.:54,寡聚核苷酸引物9)以及由人腦和心cDNA模板(Clontech,Cat#7404-1)產(chǎn)生的670bpPCR產(chǎn)物的序列分析,證實(shí)了上述完整的3'端序列。d.hRUP5(Seq.Id.No.9&10)以人的外周白細(xì)胞cDNA(Clontech)為模板,通過RT-PCR克隆了全長的hRUP5,所用引物為在ATG起始密碼子上游的有義引物(SEQ.ID.NO.:55),以及包含TCA為終止密碼子的反義引物(SEQ.ID.NO.:56),其序列如下5'-ACTCCGTGTCCAGCAGGACTCTG-3'(SEQ.ID.NO.:55)5'陽TGCGTGTTCCTGGACCCTCACGTG-3'(SEQ.ID.NO.:56)AdvantagecDNA聚合酶(Clontech)用于50|al反應(yīng),經(jīng)下列循環(huán)進(jìn)行擴(kuò)增,其中第二步到第四步重復(fù)30次94°C30秒;94°C15秒;69°C40秒;72°C3分鐘;72°C6分鐘。分離得到1.4kbPCR片段,并克隆到pCRII-TOPO載體(Invitrogen),用T7DNAS^uenase試劑盒(Amsham)進(jìn)行全序列測定,參見SEQ.ID.NO.:9。e.hRUP6(Seq,Id.No.11&12)用下列引物及人的胸腺M(fèi)arathon-ReadycDNA(Clontech)為模板,通過RT-PCR克隆了全長hRUP6。5'-CAGGCCTTGGATTTTAATGTCAGGGATGG-3'(SEQ.ID.NO.:57)5'-GGAGAGTCAGCTCTGAAAGAATTCAGG-3'(SEQ.ID.NO.:58)AdvantagecDNA聚合酶(Clontech,按商家說明)用于50)^1反應(yīng),經(jīng)下列循環(huán)進(jìn)行擴(kuò)增94°C30秒;94°C5秒;66°C40秒;72°C2.5秒和72°C7分鐘,循環(huán)2到循環(huán)4重復(fù)30次。分離得到1.3kbPCR片段,并克隆到pCRII-TOPO載體(Invitrogen),用ABIBigDyeTerminator試劑盒(P.E.Biosystem)進(jìn)行全序列測定(參見,SEQ.ID.NO.:l1)。f.hRUP7(Seq.Id.No.13&14)用下列引物及人的外周白細(xì)胞cDNA(Clontech)為模板,通過RT-PCR克隆了全長PUP7,5'-TGATGTGATGCCAGATACTAATAGCAC-3'(SEQ.ID.NO.:59,有義)5'墨CCTGATTCATTTAGGTGAGATTGAGAC-3'(SEQ.ID.NO.:60,20反義)AdvantagecDNA聚合酶(Clontech)用于反應(yīng),經(jīng)下列循環(huán)進(jìn)行擴(kuò)增,其中第二步到第四步重復(fù)30次94°C2分鐘;94"C15秒;60°C20秒;72°C2分鐘;72°CIO分鐘。分離得到1.25kbPCR片段,并克隆到pCRn-TOPOTM載體(Invitrogen),用ABIBigDyeTerminator試劑盒(P.E.Biosystem)進(jìn)行全序列測定。(參見,SEQ.ID.NO.:13)g.hARE-5(Seq.Id.No.5&6)采用hARE-5特異的引物5'-CAGCGCAGGGTGAAGCCTGAGAGC-3'SEQ.ID.NO.:69(有義,位于起始密碼子ATG的5'端)和5'-GGCACCTGCTGTGACCTGTGCAGG-3'SEQ.ID.NO.:70(反義,位于終止密碼子TGA的3'端)并用人基因組DNA為模板,通過PCR來克隆全長hARE-5。按照下列循環(huán)采用T叫PlusPrecisionTMDNA聚合酶(Stratagene)來擴(kuò)增,其中第2步至第4步重復(fù)35次96°C2分鐘;96°C20秒;58°C30秒;72°C2分鐘;72°C10分鐘。分離到預(yù)計大小的1.1KbPCR片段并克隆到pCRII-TOPO載體(Invitrogen),用T7DNASquenase試劑盒(Amsham)進(jìn)行全序列測定(SEQ.ID.NO.:5)。h.hARE-4(Seq.Id.No.3&4)釆用hARE-4特異的引物5'-CTGGTGTGCTCCATGGCATCCC-3'SEQ.ID.NO.:67(有義,位于起始密碼子ATG的5'端)和5'陽GTAAGCCTCCCAGAACGAGAGG-3'SEQ.ID.NO.:68(反義,位于終止密碼子TGA的3'端)并用人基因組DNA為模板,通過PCR來克隆全長hARE-4。采用TaqDNA聚合酶(Stratagene)禾t!5。/oDMSO,按照下列循環(huán)來擴(kuò)增,其中第2步至第3步重復(fù)35次94'C3分鐘;94。C30秒;59°C2分鐘;72°C10分鐘。分離到預(yù)計大小的1.12KbPCR片段并克隆到pCRII-TOPOTM載體(Invitrogen),用T7DNASquenase試劑盒(Amsham)進(jìn)行全序列測定(SEQ.ID.NO.:3)。i.hARE-3(Seq.Id.No.1&2)采用hARE-3特異的引物5'-gatcaagcttCCATCCTACTGAAACCATGGTC-3'SEQ.ID.NO.:65(有義,小寫字母核苷酸代表HindIII突出端,ATG為起始密碼子)和5'-gatcagatctCAGTTCCAATATTCACACCACCGTC陽3'SEQ.ID.NO.:66(反義,小寫字母核苷酸代表XbaI突出端,TCA為終止密碼子)并用人基因組DNA為模板,通過PCR來克隆全長hARE-3。采用TaqPhisPrecisionDNA聚合酶(Stratagene),按照下列循環(huán)來擴(kuò)增,其中第2步至第4步重復(fù)35次94°C3分鐘;94°C1分鐘;55°C1分鐘;72°C2分鐘;72°C10分鐘。分離到預(yù)計大小的1.3KbPCR片段并用HindIII和XbaI消化,克隆到pRC/CMV載體(Invitrogen)的HindIII和XbaI位點(diǎn),用T7DNASequenase試劑盒(Amsham)進(jìn)行全序列測定(SEQ.ID.NO.:l)。j.hRUP3(Seq.Id.No.7&8)采用hRUP3特異的引物5'-GTCCTGCCACTTCGAGACATGG-3'SEQ.ID.NO.:71(有義,ATG為起始密碼子)和5'-GAAACTTCTCTGCCCTTACCGTC-3'SEQ.ID.NO.:72(反義,位于終止密碼子TAA的3'端)并用人基因組DNA為模板,通過PCR來克隆全長hRUP3。采用TaqPlusPrecisionDNA聚合酶(Stratagene),按照下列循環(huán)來擴(kuò)增,其中第2步至第4步重復(fù)35次94°C3分鐘;94°Cl分鐘;58°Cl分鐘;72°C2分鐘;72°CIO分鐘。分離到預(yù)計大小的1.0KbPCR片段并克隆到pCRII-TOPO載體(Invitrogen),用T7DNASequenase試劑盒(Amsham)進(jìn)行全序列測定(SEQ.ID.NO.:7)。實(shí)施例2受體表達(dá)盡管在本領(lǐng)域中有多種細(xì)胞可用于蛋白質(zhì)的表達(dá),但最優(yōu)選應(yīng)用的是哺乳動物細(xì)胞。據(jù)預(yù)測,其基本原因是實(shí)用性,即例如表達(dá)GPCR的酵母細(xì)胞的應(yīng)用,有可能把一種非哺乳動物細(xì)胞引入到程序中,此細(xì)胞可能不(其實(shí),對于酵母來說,是不)包括偶聯(lián)受體、遺傳機(jī)制和分泌途徑,而這些是經(jīng)過進(jìn)化用于哺乳動物系統(tǒng)的。因此,在非哺乳動物細(xì)胞中得到的結(jié)果,盡管是可能有用的,但并不如從哺乳動物細(xì)胞中得到的結(jié)果優(yōu)選。在哺乳動物細(xì)胞中,COS-7、293和293T細(xì)胞是特別優(yōu)選的,盡管應(yīng)用的特定哺乳動物細(xì)胞可按技術(shù)人員的特別需要而被判定。用于表達(dá)所公開的GPCR的一般步驟如下。第一天,將1X1(^個293T細(xì)胞接種到150mm的培養(yǎng)板上。第二天,準(zhǔn)備兩支試管(比例是每板用于一支試管)通過混合20嗎DNA(例如pCMV載體、帶有受體cDNA的pCMV載體,等)在1.2ml無血清的DMEM(IrvineScientific,Irvine,CA)來制備試管A;通過混合120fillipofectamine(GibcoBRL)在1.2ml無血清DMEM中制備試管B。把試管A和B互傾混合(幾次),然后在室溫下溫育30-45分鐘。組合物被稱為"轉(zhuǎn)染組合物"。植出的293T細(xì)胞用1XPBS洗滌,然后加入10ml無血清的DMEM。把2.4ml轉(zhuǎn)染組合物加入到細(xì)胞中去,然后在37°C/5%C02下溫育4小時。接著通過抽吸移去轉(zhuǎn)染組合物,然后加入25ml的DMEM/10。/。胎牛血清。接著細(xì)胞在37。C/5。/。C02溫育。72小時后收獲細(xì)胞并用來進(jìn)行分析。實(shí)施例3所公開的人GPCR的組織分布可用幾中方法來測定本文所公開的GPCR的組織分布。1.斑點(diǎn)印跡分析應(yīng)用商業(yè)可得的人組織斑點(diǎn)印跡系統(tǒng),探査內(nèi)源孤兒GPCR以確定這些受體所存在的區(qū)域。實(shí)施例1的GPCR的cDNA片段(放射標(biāo)記的)被(或可被)用作探針按照制造商的指令,應(yīng)用Prhne-It117"隨機(jī)引物標(biāo)記試劑盒(Stratagene,#300385),用完全受體cDNA(從載體中切下)產(chǎn)生(或可產(chǎn)生)放射標(biāo)記的探針。把人RNAMasterBlot(Clontech,存7770-l)與內(nèi)源人GPCR放射標(biāo)記的探針雜交,并按照制造商的指令在嚴(yán)謹(jǐn)條件下洗滌。印跡曝光于KodakBioMaxTM放射自顯影底片,在-8(TC過夜。幾種受體的結(jié)果在表B和表C中列出(參見圖1A和1B,其中分別列出了各種組織和其位置)。用hCHN3和hCHN8得到的結(jié)果顯示在圖2A和2B所示的典型斑點(diǎn)印跡中。表B孤兒GPCRhGPCR27hARE-lhPPRlhRUP3hCHN3hCHN9hCHN10組織分布(在斑點(diǎn)印跡中相對于其它組織的最高水平)胎腦、殼、腦下垂體、尾狀核脾、外周血白細(xì)胞、胎脾腦下垂體、心、唾液腺、小腸、睪丸胰腺胎腦、殼、枕皮質(zhì)胰腺、小腸、肝腎、甲狀腺表C孤兒GPCR組織分布(在斑點(diǎn)印跡中相對于其它組織的最高水平)hARE-3左小腦、右小腦、睪丸、AccumbenshGPCR3尸體collusum、尾狀核、肝、心、心臟室間隔膜hARE-2左小腦、右小腦、黑質(zhì)hCHN8左小腦、右小腦、腎、月市2.RT-PCRa.hRUP3為證實(shí)hRUP3mRNA的組織分布,采用hRUP3特異的引物和作為模板的人多組織cDNA板(MTC,Clontech)進(jìn)行RT-PCR。采用T叫DNA聚合酶(Stratagene)并按照下列循環(huán)在40微升反應(yīng)液中來進(jìn)行該P(yáng)CR反應(yīng)94°C2分鐘;94°C15秒;55°C30秒;72°C1分鐘;72°C10分鐘。所用引物如下5'-GACAGGTACCTTGCCATCAAG-3'(SEQ.ID.NO.:61;有義)5'-CTGCACAATGCCAGTGATAAGG-3'(SEQ.ID.NO.:62;反義)。將20微升反應(yīng)液上樣到1%瓊脂糖凝膠中,結(jié)果如圖3所示。正如圖3中的數(shù)據(jù)所支持的那樣,在所使用的cDNA板的16個組織(腦、結(jié)腸、心、腎、肺、卵巢、胰腺、胎盤、前列腺、骨、小腸、脾、睪丸、胸腺白細(xì)胞和肝)中,只有胰腺顯示了一條hRUP3帶。hRUP3的蛋白質(zhì)序列與其它GPCR的進(jìn)一步的對比分析表明hRUP3與具有小分子內(nèi)源配體的GPCR有關(guān),由此可以做出這樣的預(yù)測hRUP3的內(nèi)源配體是小分子。b.hRUP4采用作為引物的hRUP4的寡聚核苷酸引物8和4和作為模板的人多組織cDNA板(MTC,Clontech)進(jìn)行RT-PCR。采用T叫DNA聚合酶(Stratagene)并按照下列循環(huán)在40微升反應(yīng)液中來進(jìn)行擴(kuò)增94"C30秒;94°C10秒;55°C30秒;72°C2分鐘;72°C5分鐘,其中循環(huán)2到循環(huán)4重量復(fù)30次。將20微升反應(yīng)液上樣到1%瓊脂糖凝膠中來分析該RT-PCR的產(chǎn)物,發(fā)現(xiàn)hRUP4mRNA在許多人組織中表達(dá),但在心和腎中表達(dá)最強(qiáng)。(參見圖4)。為證實(shí)這些PCR片段的真實(shí)性,使用從hRUP4的5'末端產(chǎn)生的300bp片段做探針,進(jìn)行Souther印跡分析。該探針用32p-dCTP采用Prime-ItII隨機(jī)引物標(biāo)記試劑盒(Stratagore)進(jìn)行標(biāo)記,并用ProbeQuantG-50微型柱(Amershan)進(jìn)行純化。進(jìn)行12小時的預(yù)雜交,然后在42'C雜交過夜。最后,在65"C用O.lxSSC對印跡進(jìn)行洗滌。該Southern印跡沒有證實(shí)hRUP4的PCR片段。c.hRUP5采用hRUP5的下列特異的引物和作為模板的人多組織cDNA板(MTC,Clontech)進(jìn)行RT-PCR:5'-CTGACTTCTTGTTCCTGGCAGCAGCGG-3'(SEQ.ID.NO.:63;有義)5'誦AGACCAGCCAGGGCACGCTGAAGAGTG國3'(SEQ.ID.NO.:64;反義)。采用TaqDNA聚合酶(Stratagene)并按照下列循環(huán)在40微升反應(yīng)液中來進(jìn)行擴(kuò)增94°C30秒;94°C10秒;62°Cl分30秒;72°C5分鐘;其中第2步至第3步重復(fù)30次。將20微升反應(yīng)液上樣到1.5%瓊脂糖凝膠中來分析該RT-PCR的產(chǎn)物,發(fā)現(xiàn)hRUP5mRNA僅在外周血白細(xì)胞中表達(dá)(數(shù)據(jù)未顯示)。d.hRUP6采用RT-PCR來證實(shí)hRUP6的表達(dá)并確定hRUP6的組織分布。基于AC005871和GPR66片斷的對齊排比,采用具有下列序列的寡聚核苷酸和作為模板的人多組織cDNA板(MTC,Clontech):5'誦CCAACACCAGCATCCATGGCATCAAG-3'(SEQ.ID.NO.:73;有義)5'-GGAGAGTCAGCTCTGAAAGAATTCAGG-3'(SEQ.ID.NO.:74;反義)。采用TaqPlusPrecisionDNA聚合酶(Stratagene,按照廠商的指令)并按照下列循環(huán)在40微升反應(yīng)液中來進(jìn)行PCR:94°C30秒;94°C5秒;66°C40秒;72°C2分30秒;和72°C7分鐘。其中第2至第4循環(huán)重復(fù)30次。將20微升反應(yīng)液上樣到1.2%瓊脂糖凝膠中來分析該RT-PCR的產(chǎn)物,代表hRUP6的特異760bpDNA片段主要在胸腺中表達(dá),而在心、腎、肺、前列腺、小腸和睪丸中僅少量表達(dá)。(參見圖5)。本專利申請文件中提到的每個專利、申請及印刷出版物以其全文引入本申請作參考。本領(lǐng)域的普通技術(shù)人員將認(rèn)識到在不背離本發(fā)明精神和實(shí)質(zhì)的前提下,可以對本發(fā)明的優(yōu)選實(shí)施方案做許多許多改變和修改。這些修改和變化均在本發(fā)明的范圍之內(nèi)。雖然本領(lǐng)域的普通技術(shù)人員可以得到許多不同的載體為內(nèi)源和非內(nèi)源GPCR的目的使用,但最好是用pCMV載體。按照國際承認(rèn)用于專利程序的微生物保存布達(dá)佩斯條約,該載體于1998年10月13日保存在美國典型培養(yǎng)物保藏中心(AmericanTypeCultureCollection)(ATCC)(UniversityBlvd,Manassas,VA20110-2209USA7)。其DNA經(jīng)ATCC測定并得到確認(rèn),ATCC為pCMV給出了下列保藏號ATCC#203351。序列表(1)一般資料U)申請人:陳若平;鄧杭;廖王蓁;林伊玲(ii)發(fā)明名稱與人G蛋白偶聯(lián)的孤兒受體(iii)序列數(shù)74(iv)通訊地址(A)收信人阿瑞那制藥公司(B〉NancyRidge大道6166號(C)城市圣地亞哥(D)州加利福尼亞州(E)國家美國(F)由卩編92121(v)計算機(jī)可讀形式(A)介質(zhì)類型軟盤(B)計算機(jī)IBM個人兼容機(jī)(C)操作系統(tǒng)PC-DOS/MS-DOS(D〉軟件PatentlnRelease#1.0,#1.30版(vi)本申請資料(A)申請?zhí)?B)申請日(C)分類號(Viii)代理人信息(A)姓名Burgoon,RichardP.(B)登記號34787(ix)電訊信息(A)電話(858)453-7200(B)電傳(858)453-7210(2)SEQIDNO:1的資料(i)序列特征(A)長度1260個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:l的序歹lj描述ATGGTCTTCTCGGCAGTGTTGACTGCGTTCCATACCGGGACATCCAACACAACATTTGTC60GTGTATGAAAACACCTACATGAATATTACACTCCCTCCACCATTCCAGCATCCTGACCTC120AGTCCATTGCTTAGATATAGTTTTGAAACCATGGCTCCCACTGGTTTGAGTTCCTTCACC180GTGAATAGTACAGCTGTGCCCACAACACCAGCAGCATTTAAGAGCCTAAACTTGCCTCTT240CAGATCACCCTTTCTGCTATAATGATATTCATTCTGTTTGTGTCTTTTCTTGGGAACTTG300GTTGTTTGCCTCATGGTTTACCAAAAAGCTGCCATGAGGTCTGCAATTAACATCCTCCTT360GCCAGCCTAGCTTTTGCAGACATGTTGCTTGCAGTGCTGAACATGCCCTTTGCCCTGGTA420ACTATTCTTACTACCCGATGGATTTTTGGGAAATTCTTCTGTAGGGTATCTGCTATGTTT480TTCTGGTTATTTGTGATAGAAGGAGTAGCCATCCTGCTCATCATTAGCATAGATAGGTTC540CTTATTATAGTCCAGAGGCAGGATAAGCTAAACCCATATAGAGCTAAGGTTCTGATTGCA600GTTTCTTGGGCAACTTCCTTTTGTGTAGCTTTTCCTTTAGCCGTAGGAAACCCCGACCTG660CAGATACCTTCCCGAGCTCCCCAGTGTGTGTTTGGGTACACAACCAATCCAGGCTACCAG720GCTTATGTGATTTTGATTTCTCTCATTTCTTTCTTCATACCCTTCCTGGTAATACTGTAC780TCATTTATGGGCATACTCAACACCCTTCGGCACAATGCCTTGAGGATCCATAGCTACCCT840GAAGGTATATGCCTCAGCCAGGCCAGCAAACTGGGTCTCATGAGTCTGCAGAGACCTTTC900CAGATGAGCATTGACATGGGCTTTAMACACGTGCCTTCACCACTATTTTGATTCTCTTT960GCTGTCTTCATTGTCTGCTGGGCCCCATTCACCACTTACAGCCTTGTGGCMCATTCAGT1020AAGCACTTTTACTATCAGCACAACTTTTTTGAGATTAGCACCTGGCTACTGTGGCTCTGC1080TACCTCAAGTCTGCATTGAATCCGCTGATCTACTACTGGAGGATTAAGAAATTCCATGAT1140GCTTGCCTGGACATGATGCCTAAGTCCTTCAAGTTTTTGCCGCAGCTCCCTGGTCACACA1200AAGCGACGGATACGTCCTAGTGCTGTCTATGTGTGTGGGGAACATCGGACGGTGGTGTGA1260(3)SEQIDNO:2的資料(i)序列特征(A)長度419個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:2的序列描述MetValPheSerAlaValLeuThrAlaPheHisThrGlyThrSerAsn151015ThrThrPheValValTyrGluAsnThrTyrMetAsnlieThrLeuPro202530ProProPheGinHisProAspLeuSerProLeuLeuArgTyrSerPhe354045GluThrMetAlaProThrGlyLeuSerSerLeuThrValAsnSerThr505560AlaValProThrThrProAlaAlaPheLysSerLeuAsnLeuProLeu65707580GinlieThrLeuSerAlalieMetliePhelieLeuPheValSerPhe859095LeuGlyAsnLeuValValCysLeuMetValTyrGinLysAlaAlaMet100105110ArgSerAlalieAsnlieLeuLeuAlaSerLeuAlaPheAlaAspMet115120125LeuLeuAlaValLeuAsnMetProPheAlaLeuValThrlieLeuThr130135140ThrArgTrpliePheGlyLysPhePheCysArgValSerAlaMetPhe145150155160PheTrpLeuPheVallieGluGlyValAlalieLeuLeulielieSer165170175lieAspArgPheLeulielieValGinArgGinAspLysLeuAsnPro180185190TyrArgAlaLysValLeulieAlaValSerTrpAlaThrSerPheCys195200205ValAlaPheProLeuAlaValGlyAsnProAspLeuGinlieProSer210215220ArgAlaProGinCysValPheGlyTyrThrThrAsnProGlyTyrGin225230235240AlaTyrVallieLeulieSerLeulieSerPhePhelieProPheLeu245250255VallieLeuTyrSerPheMetGlylieLeuAsnThrLeuArgHisAsn260265270AlaLeuArglieHisSerTyrProGluGlylieCysLeuSerGinAla275280285SerLysLeuGlyLeuMetSerLeuGinArgProPheGinMetSerlie2恥295300AspMetGlyPheLysThrArgAlaPheThrThrlieLeulieLeuPhe305310315320AlaValPhelieValCysTrpAlaProPheThrThrTyrSerLeuVal325330335AlaThrPheSerLysHisPheTyrTyrGinHisAsnPhePheGlulie340345350SerThrTrpLeuLeuTrpLeuCysTyrLeuLysSerAlaLeuAsnPro355360365LeulieTyrTyrTrpArglieLysLysPheHisAspAlaCysLeuAsp370375380MetMetProLysSerPheLysPheLeuProGinLeuProGlyHisThr385390395400LysArgArglieArgProSerAlaValTyrValCysGlyGluHisArg405410415ThrValVal(4)SEQIDNO:3的資料(i)序列特征(A)長度1119個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:ATGTTAGCCAACAGCTCCTCACCCACCGCCGCGCTAGCCCATGTGTAACCTACTACGCACTTCCAGATGAGCCGCCATCGCTCTGCCTGGAGGCCCTCGCGACGAGCTGTCTGCTGCCCCCCCGACGCCAGTCATCTTCCCGGAGCAAGCGTGATGGTGCGCCGAGGGCTGCCACCAACGGCCACCAGGCTCTTCCTTCATGCACTTGGTTCTGGGTCTTTGGCGGCCAGTGCACCACTGACATGTACGGTGCACCCGCTGCGTGTGGGCGTTGCCGCTAGGAAAGGCAGTGGCGGCGGTCGCAGAGCCATGCTGTGCTTTGGTGGCGGCTGCTGGCCGGTCCGCAACACGGACGCGGGCCGGATGCCGCCACAGTGTCC3的序列描AACCAACAGTGGTCTACAGCCCTGCGCGCGCGACCTGCTCGCCCTTCCCCCAGCTGCATCGCGACTGCGCGCTCATCCTGCCGGGACCTCGCTGCTGCCCGGTCTACTCGGCGGCGGCGGCGTGCCCTACCAGCGTGCCTCGCCAACTGCCCTGCGCGGCGGCGCTCGCGCAGTCAGGGGCCAGGATTCC述TCTGTTCTCCTTGGTGCTGGCTGCGCGTGCTTCACCCTCTGACCTCCTGTTTCCTGATGCCACCTGCGGCGTGTTTGCCGGAGGTGCGCCCTCGTGCTGCTCGGGCCGAGAAGACCGTGCAACAGCACGCGCCCGCGATCGTGCTGGACCCTGGGCACTCCAATCCGAAACTGCTCCGACGCCCTCTGACGTGTCCTGACTGCCGGGCTACTCGGTGGTCGCTGCCCGTGCCAGACGACTCATCAACGTGGCCCCGCGTTGCCCGCCGCTATGCTTCGATGGCCGAGGCTCTTCTGGACGCCTCCTGCTTGGCGGTCTAGCGTGCGCGGCGCTGGTGTACGCACCGGGCGGTCCGCCGTCCTCCGACTCCTACCGACCTCCCCCTCAACGAGCGTGTACTCGTCTCTCCGGGCGCCATCGGACCGCTACGGCGCGGCTGCCGCGTGCACGAGCTTCAGCGCTGGGCTTCGCTGGCGCGCGGCTMCCTCCGGGCTGCTGGGTGCTGATGCTACTTTAGCCAGGACCTCGCACCACCGACCCACTCTCTG60120180240300360420480540600660720780840900960102010801119(5)SEQIDNO:4的資料(i)序列特征(A)長度372個氨基酸31(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(x;L)SEQIDN0:4的序列描述:MetLeuAlaAsnSer15SerSerThrAsnSerSerValLeuProCysPro1015AspTyrArgProThrHisArgLeuHisLeuValValTyrSerLeuVal202530LeuAlaAlaGlyLeuProLeuAsnAlaLeuAlaLeuTrpValPheLeu354045ArgAlaLeuArgValHisSerValValSerValTyrMetCysAsnLeu505560AlaAlaSerAspLeuLeuPheThrLeuSerLeuProValArgLeuSer65707580TyrTyrAlaLeuHisHisTrpProPheProAspLeuLeuCysGinThr859095ThrGlyAlaliePheGinMetAsnMetTyrGlySerCysliePheLeu100105110MetLeulieAsnValAspArgTyrAlaAlalieValHisProLeuArg115120125LeuArgHisLeuArgArgProArgValAlaArgLeuLeuCysLeuGly130135140ValTrpAlaLeulieLeuValPheAlaValProAlaAlaArgValHis145150155160ArgProSerArgCysArgTyrArgAspLeuGluValArgLeuCysPhe165170175GluSerPheSerAspGluLeuTrpLysGlyArgLeuLeuProLeuVal180185190LeuLeuAlaGluAlaLeuGlyPheLeuLeuProLeuAlaAlaValVal195200205TyrSerSerGlyArgValPheTrpThrLeuAlaArgProAspAlaThr210215220GinSerGinArgArgArgLysThrValArgLeuLeuLeuAlaAsnLeu225230235240ValliePheLeuLeuCysPheValProTyrAsnSerThrLeuAlaVal245250255TyrGlyLeuLeuArgSerLysLeuValAlaAlaSerValProAlaArg260265270AspArgValArgGlyValLeuMetValMetValLeuLeuAlaGlyAla275280285AsnCysValLeuAspProLeuValTyrTyrPheSerAlaGluGlyPhe290295300ArgAsnThrLeuArgGlyLeuGlyThrProHisArgAlaArgThrSer305310315320AlaThrAsnGlyThrArgAlaAlaLeuAlaGinSerGluArgSerAla325330335ValThrThrAspAlaThrArgProAspAlaMaSerGinGlyUuLeu340345350ArgProSerAspSerHisSerLeuSerSerPheThrGinCysProGin355360365AspSerAlaLeu370(6)SEQIDNO:5的資料(i)序列特征(A)長度1107個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:5的序列描述ATGGCCAACTCCACAGGGCTGAACGCCTCAGMGTCGCAGGCAGCTGTCGCGCACGCCGGGCGGCCGCCTGTGCGCCTGGGCCTGCACGCC丁GCGGCCAGGGACTGCTGGCGCTGCTCGGTTCGCGCTGCCGCGCTGCCCGATAGCCGCCTGGAGGTGGGGACTGCGCGACCATCATGCCGCCCCGCGCCTCGGGGTGGCGCTCGCGGCCGCGCGCTCTCTCCTGGCTGGCCGCCCTCCTTGAGGCCCCCTTTCCATCTTGGCACTGCTGCGCGCTCTACGCTGGGCCTGATGCCGCGCCCGCACTTGGCGCCGCCTGTGCCTGCTCGGCGGGCCTCGGGGCTGCTCGGCACGGCCGGCGGCCGCCGCTCGGCAACGGCGCTGGCGCACCCTGGCCGCACGCTCGCTTCCCTGGCACGCTCTCGTGCTCACCGCCGCCCGCCCTTCCGGCGCCTACGGCGCGCGGGTCCCCGGCCTCGCCGCTCGTTGGGCGCTGCTGGTTGTGCGTCGTCGCCGCCCGGTCTCCGCCGCACCGCCTCATCCGCCGTGTGCACCGCCCCCCGCTCTGGGCGCATCTTCGTGACTCCGCTCTGCCCGGGGGGTTGATCCTG60CGTGGTGCTG120GGACCTGCTG180GCTGGGCCGC240TCTGCTGCCG300CGTGCACCCG360GGCCGCGGCG420TGCTCCTGCT480CCTGCTGGCC540GGTGGCGCGT600GGACTCTCTG660CAAGGCGGCC72033CTGGCCCCAGCGCTGGCCGTGGGCCAATTTTGCCTGGCGCCCGCAGCGCGGGCCGCGGMTCGGCCTTCGCGGCTCACCCCTTCCTGTACCTGGGCCGCCTCTCTCGCCGTGCACTGCCTTGGCACCCGCGGGCACTCTTGCAATGCCTCCCTTCTGAGGCTCCAGMCAGACCCCCGAGGGGCCACCTGAGAGTTCTCTCTCCTGAGCAGCCTGCTGGCTGCCTTATGGCTGCGCG780GCCGAAGCGGCTGTCACCTGGGTCGCCTAC840GGGCTGCTGCAGCGCCCCGTGCGCTTGGCA900GGACCTGTGCGGGCCTGCACTCCGCMGCC960CAGAGACCCCCAGAGGGCCCTGCCGTAGGC1020TTGGCAGGAGGGCGGAGCCCCGCATACCAG10801107(7)SEQIDNO:6的資料(i)序列特征(A)長度368個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:6的序列描述MetAlaAsnSerThrGlyLeuAsnAlaSerGluValAlaGlySerLeu151015GlyLeulieLeuAlaAlaValValGluValGlyAlaLeuLeuGlyAsn202530GlyAlaLeuLeuValValValLeuArgThrProGlyLeuArgAspAla354045LeuTyrLeuAlaHisLeuCysValValAspLeuLeuAlaAlaAlaSer505560lieMetProLeuGlyLeuLeuAlaAlaProProProGlyLeuGlyArg65707580ValArgLeuGlyProAlaProCysArgAlaAlaArgPheLeuSerAla859095AlaLeuLeuProAlaCysThrLeuGlyValAlaAlaLeuGlyLeuAla100105110ArgTyrArgLeulieValHisProLeuArgProGlySerArgProPro115120125ProValLeuValLeuThrAlaValTrpAlaAlaAlaGlyLeuLeuGly130135140AlaLeuSerLeuLeuGlyProProProAlaProProProAlaProAla145150155160ArgCysSerValLeuAlaGlyGlyLeuGlyProPheArgProLeuTrp165170175AlaLeuLeuAlaPheAlaLeuProAlaLeuLeuLeuLeuGlyAlaTyr180185190GlyGlyliePheValValAlaArgArgAlaAlaLeuArgProProArg195200205ProAlaArgGlySerArgLeuArgSerAspSerLeuAspSerArgLeu210215220SerlieLeuProProLeuArgProArgLeuProGlyGlyLysAlaAla225230235240LeuAlaProAlaLeuAlaValGlyGinPheAlaAlaCysTrpLeuPro245250255TyrGlyCysAlaCysLeuAlaProAlaAlaArgAlaAlaGluAlaGlu260265270AlaAlaValThrTrpValAlaTyrSerAlaPheAlaAlaHisProPhe275280285LeuTyrGlyLeuLeuGinArgProValArgLeuAlaLeuGlyArgLeu290295300SerArgArgAlaLeuProGlyProValArgAlaCysThrProGinAla305310315320TrpHisProArgAlaLeuLeuGinCysLeuGinArgProProGluGly325330335ProAlaValGlyProSerGluAlaProGluGinThrProGluLeuAla340345350GlyGlyArgSerProAlaTyrGinGlyProProGiuSerSerLeuSer355360365(8)SEQIDNO:7的資料(i)序列特征(A)長度1008個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:7的序歹lJ描述ATGGAATCATCTTTCTCATTTGGAGTGATCACTAACACACTAGTGGCTCTGGCTGTGCTGCTCTGCTTCACCTTGAATCTGGCTGTGGCTCTACTCACAGACCAGCTCTCCAGCCCTTCTCGGATGGCATTTGTCACTTCCTCCGCAGCTTTTGACAGGTACCTTGCCATCAAGCAGCCCGTGGCCGGGGCCTGCATTGCCGGGCTGTGGCTCGGAATCCCCATGTTCCAGCAGACTGCCTTTCACCCTCACTTCGTGCTGACCCTCTCCTTTGTCTTCTTCTACTGCGACATGCTCAAGAAGATGGAACATGCAGGAGCCATGGCTGGATTCAAAGCTCTCCGTACTGTGTCTGTTCTCTTCCTTATCACTGGCATTGTGCAGGTGGCCGAACGGTACCTGTGGCTGCTCGGCGTGGGCTATTGGCAGAAGGAGGTGCGACTGCAGCTCCTCACCTCATTCCTCCTCTTTCTCTCGGCCAGTTCCTGTCACATCGTCACTATCTCCAGCCTTGCTGTCCTGGCCTCCCTCATCATTGCT60CTGTTGATCCACA織ATGATGGTGTCAGT120GACACCTTGATTGGTGTGGCCATCTCTGGC180CGGCCCACACAGAAGACCCTGTGCAGCCTG240GCCTCTGTCCTCACGGTCATGCTGATCACC300TTCCGCTACTTGAAGATCATGAGTGGGTTC360TTAGTGTCTTACCTCATTGGCTTCCTCCCA420TACAAAGGGCAGTGCAGCTTCTTTGCTGTA480TGCGTTGGCTTCTTCCCAGCCATGCTCCTC540ATTGCCTCCATGCACAGCCAGCAGATTCGA600GGTTATCGATCCCCACGGACTCCCAGCGAC660ATTGGGAGCTTTGCTCTATCCTGGACCCCC720TGCCAGGAGTGTCACCTCTACCTAGTGCTG780AACTCCCTGCTCAACCCACTCATCTATGCC840TACCACATGGCCCTAGGAGTGAAGAAGGTG900AGGAATTGTGGCCCAGAGAGGCCCAGGGAA960TCAGAGTTTGATGGCTAA1008(9)SEQIDNO:8的資料(i)序列特征(A)長度335個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(i幻分子類型蛋白質(zhì)(XJJSEQIDNO:8的序歹lj描述MetGluSerSerPheSerPheGlyVallieLeuAlaValLeuAlaSer151015LeulielieAlaThrAsnThrLeuValAlaValAlaValLeuLeuLeu202530lieHisLysAsnAspGlyValSerLeuCysPheThrLeuAsnLeuAla354045ValAlaAspThrLeulieGlyValAlalieSerGlyLeuLeuThrAsp505560Glr\LeuSerSerProSerArgProThrGinLysThrLeuCysSerLeu65707580ArgMetAlaPheValThrSerSerAlaAlaAlaSerValLeuThrVal859095MetLeulieThrPheAspArgTyrLeuAlalieLysGinProPheArg100105110TyrLeuLyslieMetSerGlyPheValAlaGlyAlaCyslieAlaGly115120125LeuTrpLeuValSerTyrLeulieGlyPheLeuProLeuGlyliePro130135140MetPheGinGinThrAlaTyrLysGlyGinCysSerPhePheAlaVal145150155160PheHisProHisPheValUuThrLeuSerCysValGlyPhePhePro165170175AlaMetLeuLeuPheValPhePheTyrCysAspMetLeuLyslieAla180185190SerMetHisSerGinGinlieArgLysMetGluHisAlaGlyAlaMet195200205AlaGlyGlyTyrArgSerProArgThrProSerAspPheLysAlaLeu210215220ArgThrValSerValLeulieGlySerPheAlaLeuSerTrpThrPro225230235240PheLeulieThrGlylieValGinValAlaCysGinGluCysHisLeu245250255TyrLeuValLeuGluArgTyrLeuTrpLeuLeuGlyValGlyAsnSer260265270LeuLeuAsnProLeulieTyrAlaTyrTrpGinLysGluValArgLeu275280285GinLeuTyrHisMetAlaLeuGlyValLysLysValLeuThrSerPhe290295300LeuLeuPheLeuSerAlaArgAsnCysGlyProGluArgProArgGlu305310315320SerSerCysHislieValThrlieSerSerSerGluPheAspGly325330335(10)SEQIDNO:9的資料(i)序列特征(A)長度1413個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)xi)SEQIDNO:9的序列描述ATGGACACTACCATGGMGCTGACCTGGGTGCCACTGGCCACAGGCCCCGCACAGAGCTT60GATGATGAGGACTCCTACCCCCAAGGTGGCTGGGACACGGTCTTCCTGGTGGCCCTGCTG120CTCCTTGGGCTGCCAGCCAATGGGTTGATGGCGTGGCTGGCCGGCTCCCAGGCCCGGCAT180GGAGCTGGCACGCGTCTGGCGCTGCTCCTGCTCAGCCTGGCCCTCTCTGACTTCTTGTTC240CTGGCAGCAGCGGCCTTCCAGATCCTAGAGATCCGGCATGGGGGACACTGGCCGCTGGGG300ACAGCTGCCTGCCGCTTCTACTACTTCCTATGGGGCGTGTCCTACTCCTCCGGCCTCTTC360CTGCTGGCCGCCCTCAGCCTCGACCGCTGCCTGCTGGCGCTGTGCCCACACTGGTACCCT420GGGCACCGCCCAGTCCGCCTGCCCCTCTGGGTCTGCGCCGGTGTCTGGGTGCTGGCCACA480CTCTTCAGCGTGCCCTGGCTGGTCTTCCCCGAGGCTGCCGTCTGGTGGTACGACCTCGTC540ATCTGCCTGGACTTCTGGGACAGCGAGGAGCTGTCGCTGAGGATGCTGGAGGTCCTGGGG600GGCTTCCTGCCTTTCCTCCTGCTGCTCGTCTGCCACGTGCTCACCCAGGCCACAGCCTGT660CGCACCTGCCACCGCCAACAGCAGCCCGCAGCCTGCCGGGGCTTCGCCCGTGTGGCCAGG720ACCATTCTGTCAGCCTATGTGGTCCTGAGGCTGCCCTACCAGCTGGCCCAGCTGCTCTAC780CTGGCCTTCCTGTGGGACGTCTACTCTGGCTACCTGCTCTGGGAGGCCCTGGTCTACTCC840GACTACCTGATCCTACTCAACAGCTGCCTCAGCCCCTTCCTCTGCCTCATGGCCAGTGCC900GACCTCCGGACCCTGCTGCGCTCCGTGCTCTCGTCCTTCGCGGCAGCTCTCTGCGAGGAG960CGGCCGGGCAGCTTCACGCCCACTGAGCCACAGACCCAGCTAGATTCTGAGGGTCCAACT1020CTGCCAGAGCCGATGGCAGAGGCCCAGTCACAGATGGATCCTGTGGCCCAGCCTCAGGTG1080AACCCCACACTCCAGCCACGATCGGATCCCACAGCTCAGCCACAGCTGAACCCTACGGCC1140CAGCCACAGTCGGATCCCACAGCCCAGCCACAGCTGAACCTCATGGCCCAGCCACAGTCA1200GATTCTGTGGCCCAGCCACAGGCAGACACTAACGTCCAGACCCCTGCACCTGCTGCCAGT1260TCTGTGCCCAGTCCCTGTGATGAAGCTTCCCCAACCCCATCCTCGCATCCTACCCCAGGG1320GCCCTTGAGGACCCAGCCACACCTCCTGCCTCTGAAGGAGAAAGCCCCAGCAGCACCCCG1380CCAGAGGCGGCCCCGGGCGCAGGCCCCACGTGA1413(11)SEQIDNO:10的資料U)序列特征(A)長度468個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:10的序歹U描述HisArgPro15GlyTrpAsp30AlaAsnGlyAlaGlyThrMetA印ThrThrMetGluAlaAspLeuGlyAlaThrGly1510ArgThrGluLeuAspAspGluAspSerTyrProGinGly2025ThrValPheLeuValAlaLeuLeuLeuLeuGlyLeuPro354045LeuMetAlaTrpLeuAlaGlySerGinAlaArgHisGly50556038ArgLeuAlaLeuLeuLeuLeuSerLeuAlaLeuSerAspPheLeuPhe65707580LeuAlaAlaAlaAlaPheGinlieLeuGlulieArgHisGlyGlyHis859095TrpProLeuGlyThrAlaAlaCysArgPheTyrTyrPheLeuTrpGly100105110ValSerTyrSerSerGlyLeuPheLeuLeuAlaAlaLeuSerLeuAsp115120125ArgCysLeuLeuAlaLeuCysProHisTrpTyrProGlyHisArgPro130135140ValArgLeuProLeuTrpValCysAlaGlyValTrpValLeuAlaThr145150155160LeuPheSerValProTrpLeuValPheProGluAlaAlaValTrpTrp165170175TyrAspLeuVallieCysLeuAspPheTrpAspSerGluGluLeuSer180185190LeuArgMetLeuGluValLeuGlyGlyPheLeuProPheLeuLeuLeu195200205LeuValCysHisValLeuThrGinAlaThrArgThrCysHisArgGin210215220GinGinProAlaAlaCysArgGlyPheAlaArgValAlaArgThrlie225230235240LeuSerAlaTyrValValLeuArgLeuProTyrGinLeuAlaGinLeu245250255LeuTyrLeuAlaPheLeuTrpAspValTyrSerGlyTyrLeuLeuTrp260265270GluAlaLeuValTyrSerAspTyrLeulieLeuLeuAsnSerCysLeu275280285SerProPheLeuCysLeuMetAlaSerAlaAspLeuArgThrLeuLeu290295300ArgSerValLeuSerSerPheAlaAlaAlaLeuCysGluGluArgPro305310315320GlySerPheThrProThrGluProGinThrGinLeuAspSerGluGly32533033539ProThrLeuProGluProMetAlaGluAlaGinSerGinMetAspPro340345350ValAlaGinProGinValAsnProThrLeuGinProArgSerAspPro355360365ThrAlaGinProGinLeuAsnProThrAlaGinProGinSerAspPro370375380ThrAlaGinProGinLeuAsnLeuMetAlaGinProGinSerAspSer385390395400ValAlaGinProGinAlaAspThrAsnValGinThrProAlaProAla405410415AlaSerSerValProSerProCysAspGluAlaSerProThrProSer420425430SerHisProThrProGlyAlaLeuGluAspProAlaThrProProAla435440445SerGluGlyGluSerProSerSerThrProProGluAlaAlaProGly450455460AlaGlyProThr465:12)SEQIDNO:(i)序列特征(A)長度11的資料(B)(C)(D)類型鏈型拓?fù)鋵W(xué)12487核酸單鏈:線形-堿基對(ii)分子類型DNA(基因組的)(xi)SEQIDNO:ATGTCAGGGATGGAAAAACT11的序列描述TCAGAATGCTTCCTGGATCTCCATTCCAGACGCAGCCACTATTGGCAATGAACTACTACCCTGGAGGTCTTTCAAGACGGAGCGTGGAGCCGCCGGGCCCAACACCAGCATCGGCCACCTTCCTTCCTATAACACCTGAATCTTCCTCCCTCCTGGTGTGTCTTCAGCCTATGAGATGTGCCCTCTTTGAGCTACGTGGCTCAGGATCCTTCCATGGCATGTACGGTCATTCTACCTCCTCAGCACCGAGCGTGTCTGTGCCTGGTGATTGGCGGTCTCTGCGCAACTACGACCGTGTGCCATCCTACACCGGCATCGTCCAAGTTCCACCAAGCCCATGCCCCATGACTGAGTATCTGGGTGTATGTGCCTGCAGCACCGACCTCCTGGCCTTTCTTGTTTCGCCTCCACCGTTCCGCGTGGGGCTTCTTACTTCCCCATGGATCTACAGTCATCAGTGACCAGCAGAACCTTCCTCTGCAATTTTTGTAGGCTATCMTCCTGCTCCTTCGGGCCCGTTCCTCAGCATCCAAACTGCACCGTGCTCTTATGGGTCCCTATTTCATCATTCCTCTACTAACTAGAAGAT60CGGACCTCGG120GGTGGGGGTC180GACGCCCACC240TGGAATGCCC300GGGCTGCTAC360CACCACCGTC420GAGCACCCGG480CTCCCTGCCC540GGTCCCAGGT600CCAGGTCACC660CCTCATGGCA720CTCAGACTAAAGAMGACAAATCTCTTGAGGCAGATGAAGGGAATGCMATATTCAAAGA780CCCTGCAGAAAATCAGTCAACAAGATGCTGTTTGTCTTGGTCTTAGTGTTTGCTATCTGT840TGGGCCCCGTTCCACATTGACCGACTCTTCTTCAGCTTTGTGGAGGAGTGGAGTGAATCC900CTGGCTGCTGTGTTCAACCTCGTCCATGTGGTGTCAGGTGTCTTCTTCTACCTGAGCTCA960GCTGTCAACCCCATTATCTATAACCTACTGTCTCGCCGCTTCCAGGCAGCATTCCAGAAT1020GTGATCTCTTCTTTCCACAAACAGTGGCACTCCCAGCATGACCCACAGTTGCCACCTGCC1080CAGCGGAACATCTTCCTGACAGAATGCCACTTTGTGGAGCTGACCGAAGATATAGGTCCC1140CAATTCCCATGTCAGTCATCCATGCACAACTCTC虹TCCCAACAGCCCTCTCTAGTGAA1200CAGATGTCAAGAACAAACTATCAAAGCTTCCACTTTAACAAAACCTGA1248(13)SEQIDNO:12的資料(丄)序列特征(A)長度415個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQ工DN0:12的序歹U描述MetSerGlyMetGluLysLeuGinAsnAlaSerTrplie1510TyrGin15GinLysLeuGluAspProPheGinLysHisLeuAsnSerThrGluGluTyr202530LeuAlaPheLeuCysGlyProArgArgSerHisPhePheLeuProVal354045SerValValTyrValProliePheValValGlyVallieGlyAsnVal505560LeuValCysLeuVallieLeuGinHisGinAlaMetLysThrProThr65707580AsnTyrTyrLeuPheSerLeuAlaValSerAspLeuLeuValLeuLeu859095LeuGlyMetProLeuGluValTyrGluMetTrpArgAsnTyrProPhe100105110LeuPheGlyProValGlyCysTyrPheLysThrAlaLeuPheGluThr115120125ValCysPheAlaSerlieLeuSerlieThrThrValSerValGluArg130135140TyrValAlalieLeuHisProPheArgAlaLysLeuGinSerThrArg145150155160ArgArgAlaLeuArglieLeuGlylieValTrpGlyPheSerValLeu165170175PheSerLeuProAsnThrSerlieHisGlylieLysPheHisTyrPhe180185190ProAsnGlySerLeuValProGlySerAlaThrCysThrVallieLys195200205ProMetTrplieTyrAsnPhelielieGinValThrSerPheLeuPhe210215220TyrLeuLeuProMetThrVallieSerValLeuTyrTyrLeuMetAla225230235240LeuArgLeuLysLysAspLysSerLeuGluAlaAspGluGlyAsnAla245250255AsnlieGinArgProCysArgLysSerValAsnLysMetLeuPheVal260265270LeuValLeuValPheAlalieCysTrpAlaProPheHislieAspArg275280285LeuPhePheSerPheValGluGluTrpSerGluSerLeuAlaAlaVal290295300PheAsnLeuValHisValValSerGlyValPhePheTyrLeuSerSer305310315320AlaValAsnProlielieTyrAsnLeuLeuSerArgArgPheGinAla325330335AlaPheGinAsnVallieSerSerPheHisLysGinTrpHisSerGin340345350HisAspProGinLeuProProAlaGinArgAsnliePheLeuThrGlu355360365CysHisPheValGluLeuThrGluAsplieGlyProGinPheProCys370375380GinSerSerMetHisAsnSerHisLeuProThrAlaLeuSerSerGlu385390395400GinMetSerArgThrAsnTyrGinSerPheHisPheAsnLysThr405410415(14)SEQ工DNO:13的資料(i)序列特征(A)長度1173個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:13的序列描述ATGCCAGATACTAATAGCACAATCAATTTATCACTAAGCACTCGTGTTACTTTAGCATTT60TTTATGTCCTTAGTAGCTTTTGCTATAATGCTAGGAAATGCTTTGGTCATTTTAGCTTTT120GTGGTGGACAAAAACCTTAGACATCGAAGTAGTTATTTTTTTCTTAACTTGGCCATCTCT180GACTTCTTTGTGGGTGTGATCTCCATTCCTTTGTACATCCCTCACACGCTGTTCGAATGG240GATTTTGGAAAGGAAATCTGTGTATTTTGGCTCACTACTGACTATCTGTTATGTACAGCA300TCTGTATATAACATTGTCCTCATCAGCTATGATCGATACCTGTCAGTCTCAAATGCTGTG360TCTTATAGAACTCAACATACTGGGGTCTTGAAGATTGTTACTCTGATGGTGGCCGTTTGG420GTGCTGGCCTTCTTAGTGMTGGGCCAATGATTCTAGTTTCAGAGTCTTGGAAGGATGAA480GGTAGTGMTGTGAACCTGGATTTTTTTCGGAATGGTACATCCTTGCCATCACATCATTC540TTGGAATTCGTGATCCCAGTCATCTTAGTCGCTTATTTCAACATGAATATTTATTGGAGC600CTGTGGAAGCGTGATCATCTCAGTAGGTGCCAAAGCCATCCTGGACTGACTGCTGTCTCT660TCCAACATCTGTGGACACTCATTCAGAGGTAGACTATCTTCAAGGAGATCTCTTTCTGCA720TCGACAGAAGTTCCTGCATCCTTTCATTCAGAGAGACAGAGGAGAAAGAGTAGTCTCATG780TTTTCCTCAAGAACCAAGATGAATAGCAATACAATTGCTTCCAAAATGGGTTCCTTCTCC840CAATCAGATTCTGTAGCTCTTCACCMAGGGAACATGTTGAACTGCTTAGAGCCAGGAGA900TTAGCCAAGTCACTGGCCATTCTCTTAGGGGTTTTTGCTGTTTGCTGGGCTCCATATTCT960CTGTTCACAATTGTCCTTTCATTTTATTCCTCAGCAACAGGTCCTAAATCAGTTTGGTAT1020AGAATTGCATTTTGGCTTCAGTGGTTCAATTCCTTTGTCAATCCTCTTTTGTATCCATTG1080TGTCACAAGCGCTTTCAAAAGGCTTTCTTGAAAATATTTTGTATAAAAAAGCAACCTCTA1140CCATCACAACACAGTCGGTCAGTATCTTCTTAA1173(15)SEQIDN〇14的資料(i)序列特征(A)長度330個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:14的序歹(J描述MetProAspThrAsnSerThrlieAsnLeuSerLeuSerThrArgVal151015ThrLeuAlaPhePheMetSerLeuValAlaPheAlalieMetLeuGly202530AsnAlaLeuVallieLeuAlaPheValValAspLysAsnLeuArgHis354045ArgSerSerTyrPhePheLeuAsnLeuAlalieSer'AspPhePheVal505560GlyVallieSerlieProLeuTyrlieProHisThrLeuPheGluTrp65707580AspPheGlyLysGlulieCysValPheTrpLeuThrThrAspTyrLeu859095LeuCysThrAlaSerValTyrAsnlieValLeulieSerTyrAspArg100105110TyrLeuSerValSerAsnAlaValSerTyrArgThrGinHisThrGly115120125ValLeuLyslieValThrLeuMetValAlaValTrpValLeuAlaPhe130135140LeuValAsnGlyProMetlieLeuValSerGluSerTrpLysAspGlu145150155160GlySerGluCysGluProGlyPhePheSerGluTrpTyrlieLeuAla165170175lieThrSerPheLeuGluPheVa].lieProVallieLeuValAlaTyr180185190PheAsnMetAsnlieTyrTrpSerLeuTrpLysArgAspHisLeuSer195200205ArgCysGinSerHisProGlyLeuThrAlaValSerSerAsnlieCys210215220GlyHisSerPheArgGlyArgLeuSerSerArgArgSerLeuSerAla225230235240SerThrGluValProAlaSerPheHisSerGluArgGinArgArgLys245250255SerSerLeuMetPheSerSerArgThrLysMetAsnSerAsnThrlie260265270AlaSerLysMetGlySerPheSerGinSerAspSerValAlaLeuHis275280285GinArgGluHisValGluLeuLeuArgAlaArgArgLeuAlaLysSer290295300LeuAlalieLeuLeuGlyValPheAlaValCysTrpAlaProTyrSer305310315320LeuPheThrlieValLeuSerPheTyrSerSerAlaThrGlyProLys325330335SerValTrpTyrArglieAlaPheTrpLeuGinTrpPheAsnSerPhe340345350ValAsnProLeuLeuTyrProLeuCysHisLysArgPheGinLysAla355360365PheLeuLysliePheCyslieLysLysGinProLeuProSerGinHis370375380SerArgSerValSerSer385390(16)SEQIDNO:15的資料(i)序列特征(A)長度1128個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQ工DNO:ATGGCGAACGCGAGCGAGCC15的序列描述GGGTGGCAGCGGCGGCGGCGAAGCTGGCCACTGCTGATCGTGCCTGGCCGCGTGCGGCGGCTGGCCGCGCTACCTGGCCAGCCATGCTGGGACGGCGGTGCCCGGCGCGCTACCTCCGCCCCCGCCGTCAAACTCGACGGGCAGGGCCGGAGGCTGTGCAGTCGTGGCCAACGGCCTCCGTTCAACAGGGACCACCCAGGCGCTCAGCCTTGCGGGAGCGACGGGCTGCGCCGCGGCGGGTCTTCTGCTTTCGCGCACCATGTGCGCCGCGCGACGACGATGGGCTTCCTTGCTCTTCTTGCCACGACTGCGGGCTTCGGGCCGCGGCGCAGATGTTCTAGCTACCTGCGTGTGGCTGACAGCTGAGGGACGACCCATCCGCTGCTGTGCCAGCCTGCACCGCGCTCGCCGGCGCCGCCGCCACGCCGCCCCGCTTCTATCTGGGCGCTGGGACGCGCCGGCTGCTGCTGCATCCACGACG虹TTCCACCCGCGGGCCCGCGCCGCCTCCGCCGTCACGGGTCCTGGTGCTTCGCGCAGCTGCTTCAGGCTGCGACCTGGTGAGCCTAGCGCGCCCCGTTGCCTCCCGGGGCGCGCTGGTTCCTGCTGCGCAGAGCGCCGCGCTGGCCGTGCGCCCTGGGCCGTGGTGGCGCCGCAAGAGGCCCGGGCGACGCCGCCCGCTCGTGCTGGCTGCTCTTCCCGGCCCGGCGGCCGGCATCAGCCCAGTTCCAAAGGCATTGAGGCGGCCGCCGGGCAACGTACTACCTGCTCCGTCATGCTGCTGCAAGCTTGGGCGTGGGTGGCCGGCTGCGGCCTTCCCAGCAGCGGCCTGGGCGCCACTGCGGCCCGCCCACCGGCCACGCTTGTCGGAAGAATTCAATGCTCCTCTGCCGTCCCCCAACCCCGTCGTCCTGCTGCCAGTTTATGACCTGGGCCTCGCTGTTCGCGGCTCGACCTGGGCGGCGCGGGCTCGCCTTCCGTCACCCGCGCCGTGCGCCGCCAGTGCTGCGACGGCGCCGCACCTCGTCGCGCCTGGTGGGCGGCCGCCCATCCGGCCCGACGGAGAAGGGGGCCCTACGGCCTACCTGGTGCTTCCTCGAGCCCCCGG60120180240300360420480540600660720780840900960102010801128(17)SEQIDNO:16的資料(i)序列特征45(A)長度375個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:16的序歹ll描述MetAlaAsnAlaSerGluProGlyGlySerGlyGlyGlyGluAlaAla151015AlaLeuGlyLeuLysLeuAlaThrLeuSerLeuLeuLeuCysValSer202530LeuAlaGlyAsnValLeuPheAlaLeuLeulieValArgGluArgSer354045LeuHisArgAlaProTyrTyrLeuLeuLeuAspLeuCysLeuAlaAsp505560GlyLeuArgAlaLeuAlaCysLeuProAlaValMetLeuAlaAlaArg65707580ArgAlaAlaAlaAlaAlaGlyAlaProProGlyAlaLeuGlyCysLys859095LeuLeuAlaPheLeuAlaAlaLeuPheCysPheHisAlaAlaPheLeu100105110LeuLeuGlyValGlyValThrArgTyrLeuAlalieAlaHisHisArg115120125PheTyrAlaGluArgLeuAlaGlyTrpProCysAlaAlaMetLeuVal130135140CysAlaAlaTrpAlaLeuAlaLeuAlaAlaAlaPheProProValLeu145150155160AspGlyGlyGlyAspAspGluAspAlaProCysAlaLeuGluGinArg165170175ProAspGlyAlaProGlyAlaLeuGlyPheLeuLeuLeuLeuAlaVal180185190ValValGlyAlaThrHisLeuValTyrLeuArgLeuLeuPhePhelie195200205HisAspArgArgLysMetArgProAlaArgLeuValProAlaValSer210215220HisAspTrpThrPheHisGlyProGlyAlaThrGlyGinAlaAlaAla225230235240AsnTrpThrAlaGlyPheGlyArgGlyProThrProProAlaLeuVal245250255GlylieArgProAlaGlyProGlyArgGlyAlaArgArgLeuLeuVal260265270LeuGluGluPheLysThrGluLysArgLeuCysLysMetPheTyrAla275280285ValThrLeuLeuPheLeuLeuLeuTrpGlyProTyrValValAlaSer290295300TyrLeuArgValLeuValArgProGlyAlaValProGinAlaTyrLeu305310315320ThrAlaSerValTrpLeuThrPheAlaGinAlaGlylieAsnProVal325330335ValCysPheLeuPheAsnArgGluLeuArgAspCysPheArgAlaGin340345350PheProCysCysGinSerProArgThrThrGinAlaThrHisProCys355360365AspLeuLysGlylieGlyLeu370375(18)SEQIDNO:17的資料(i)序列特征(A)長度1002個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(x:L)SEQIDNO:17的序列描述ATGAACACCACAGTGATGCAAGGCTTCAACAGATCTGAGCGGTGCCCCAGAGACACTCGG60ATAGTACAGCTGGTATTCCCAGCCCTCTACACAGTGGTTTTCTTGACCGGCATCCTGCTG120AATACTTTGGCTCTGTGGGTGTTTGTTCACATCCCCAGCTCCTCCACCTTCATCATCTAC180CTCAAAAACACTTTGGTGGCCGACTTGATAATGACACTCATGCTTCCTTTCAAMTCCTC240TCTGACTCACACCTGGCACCCTGGCAGCTCAGAGCTTTTGTGTGTCGTTTTTCTTCGGTG300ATATTTTATGAGACCATGTATGTGGGCATCGTGCTGTTAGGGCTCATAGCCTTTGACAGA360TTCCTCAAGATCATCAGACCTTTGAGAMTATTTTTCTAAAAAAACCTGTTTTTGCAAAA420ACGGTCTCAATCTTCATCTGGTTCTTTTTGTTCTTCATCTCCCTGCCAAATACGATCTTG480AGCAACAAGGAAGCAACACCATCGTCTGTGAAAAAGTGTGCTTCCTTAAAGGGGCCTCTG540GGGCTGAAATGGCATCMATGGTAAATAACATCCTMTGCTTGTGTTTTATGTGGTTATTTCCAAAAGTAAGGACAGAAAAAACAACAMGCTGTCTTCTTTGTGTGTTTTGCTCCATTTCMACCMCAATAAGACTGACTGTAGACTGACTCTCTTTTTGGCAGCAACTAACATTTGTAAAAAATTCACAGMAAGCTACCATGTATGGAAAATCATAGCAGTCAGACAGACAACATA說明書第46/81頁ATATGCCAGTTTATTTTCTGGACTGTTTTT600GCAMMAAGTATATGATTCTTATAGAAAG660AAGCTGGMGGCAAAGTATTTGTTGTCGTG720CATTTTGCCAGAGTTCCATATACTCACAGT780CAAAATCAACTGTTTATTGCTAAAGAAACA840ATGGATCCCTTAATATACATATTCTTATGT900CAAGGGAGAAAGACCACAGCATCAAGCCAA960ACCTTAGGCTGA1002(19)SEQIDNO:18的資料(i)序列特征(A)長度333個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:18的序歹U描述MetAsnThrThrValMetGinGlyPheAsnArgSerGluArgCysPro151015ArgAspThrArglieValGinLeuValPheProAlaLeuTyrThrVal202530ValPheLeuThrGlylieLeuLeuAsnThrLeuAlaLeuTrpValPhe354045ValHislieProSerSerSerThrPhelielieTyrLeuLysAsnThr505560LeuValAlaAspLeulieMetThrLeuMetLeuProPheLyslieLeu65707580SerAspSerHisLeuAlaProTrpGinLeuArgAlaPheValCysArg859095PheSerSerValliePheTyrGluThrMetTyrValGlylieValLeu100105110LeuGlyLeulieAlaPheAspArgPheLeuLyslielieArgProLeu115120125ArgAsnliePheLeuLysLysProValPheAlaLysThrValSerlie130135140PhelieTrpPhePheLeuPhePhelieSerLeuProAsnThrlieLeu14515015516048SerAsnLysGluAlaThrProSerSerValLysLysCysAlaSerLeu165170175LysGlyProLeuGlyLeuLysTrpHisGinMetValAsnAsnlieCys180185190GinPheliePheTrpThrValPhelieLeuMetLeuValPheTyrVal195200205VallieAlaLysLysValTyrAspSerTyrArgLysSerLysSerLys210215220AspArgLysAsnAsnLysLysLeuGluGlyLysValPheValValVal225230235240AlaValPhePheValCysPheAlaProPheHisPheAlaArgValPro245250255TyrThrHisSerGinThrAsnAsnLysThrAspCysArgLeuGinAsn260265270GinLeuPhelieAlaLysGluThrThrLeuPheLeuAlaAlaThrAsn275280285lieCysMetAspProLeulieTyrliePheLeuCysLysLysPheThr290295300GluLysLeuProCysMetGinGlyArgLysThrThrAlaSerSerGin305310315320GluAsnHisSerSerGinThrAspAsnlieThrLeuGly325330(20)SEQ工DNO:19的資料(i)序列特征(A)長度1122個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:19的序歹lj描述ATGGCCAACACTACCGGAGAGCCTGAGGAGGTGAGCGGCGCTCTGTCCCCACCGTCCGCA60TCAGCTTATGTGAAGCTGGTACTGCTGGGACTGATTATGTGCGTGAGCCTGGCGGGTAAC120GCCATCTTGTCCCTGCTGGTGCTCAAGGAGCGTGCCCTGCACMGGCTCCTTACTACTTC180CTGCTGGACCTGTGCCTGGCCGATGGCATACGCTCTGCCGTCTGCTTCCCCTTTGTGCTG240GCTTCTGTGCGCCACGGCTCTTCATGGACCTTCAGTGCACTCAGCTGCAAGATTGTGGCC300TTTATGGCCGTGCTCTTTTGCTTCCATGCGGCCTTCATGCTGTTCTGCATCAGCGTCACC360CGCTACATGGCCATCGCCCACCACCGCTTCGCGGCTGTCATCTGCATGGCCTGGACCCTGGACGTGGGCACCTACAAGTTTATTCGGGAGTTCAAGGCCAATGACACGCTGGGCTTCATGCATGCTGTCTACGGCAAGCTGCTCCTCTTCCAGATGGTGCCAGCCATCAGCCAGAACTGGGCTGCTGCCAACTGGATCGCCGGCTTTGGCATCCGGCAGAATGGGCATGCAGCCAGCCGGGAAAAGCAGCTGGGCCGCATGTTCTACGCGCCCTACATCGTGGCCTGCTACTGGCGAGTGTACCTGGCCACTGCTGTTTGGATGAGCTTCTTCCTGCTCAACAAGGACCTCAAGAAGTGCGGAGGTGCCCCGGCTCCCAGAGAACCCTAC說明書第48/81頁TACGCCAAGCGCATGACACTCTGGACATGC420TCTGTGGCCATGGCCTTCCCACCTGTCTTT480GAGGACCAGTGCATCTTTGAGCATCGCTAC540CTTATGTTGGCTGTGCTCATGGCAGCTACC600GAGTATCGTCACCGCMGATGAAGCCAGTG660ACATTCCATGGTCCCGGGGCCACCGGCCAG720CGTGGGCCCATGCCACCAACCCTGCTGGGT780CGGCTACTGGGCATGGACGAGGTCAAGGGT840ATCACACTGCTCTTTCTGCTCCTCTGGTCA900TTTGTGAAAGCCTGTGCTGTGCCCCACCGC960GCCCAGGCTGCCGTCMCCCAATTGTCTGC1020CTGACCACTCACGCCCCCTGCTGGGGCACA1080TGTGTCATGTGA1122(21)SEQIDNO:20的資料(i)序列特征(A)長度373個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型DNA(基因組)(xi)SEQIDNO:20的序歹U描述MetAlaAsnThrThrGlyGluProGluGluValSerGlyAlaLeuSer151015ProProSerAlaSerAlaTyrValLysLeuValLeuLeuGlyLeulie202530MetCysValSerLeuAlaGlyAsnAlalieLeuSerLeuLeuValLeu354045LysGluArgAlaLeuHisLysAlaProTyrTyrPheLeuLeuAspLeu505560CysLeuAlaAspGlylieArgSerAlaValCysPheProPheValLeu65707580AlaSerValArgHisGlySerSerTrpThrPheSerAlaLeuSerCys859095LyslieValAlaPheMetAlaValLeuPheCysPheHisAlaAlaPhe100105110MetLeuPheCyslieSerValThrArgTyrMetAlalieAlaHisHis115120125說明書第49/81頁ArgPheTyrAlaLysArgMetThrLeuTrpThrCysAlaAlaVallie130135140CysMetAlaTrpThrLeuSerValAlaMetAlaPheProProValPhe145150155160A印ValGlyThrTyrLysPhelieArgGluGluAspGinCysliePhe165170175GluHisArgTyrPheLysAlaAsnAspThrLeuGlyPheMetLeuMet180185190LeuAlaValLeuMetAlaAlaThrHisAlaValTyrGlyLysLeuLeu195200205LeuPheGluTyrArgHisArgLysMetLysProValGinMetValPro210215220AlalieSerGinAsnTrpThrPheHisGlyProGlyAlaThrGlyGin225230235240AlaAlaAlaAsnTrplieAlaGlyPheGlyArgGlyProMetProPro245250255ThrLeuLeuGlylieArgGinAsnGlyHisAlaAlaSerArgArgLeu260265270LeuGlyMetAspGluValLysGlyGluLysGinLeuGlyArgMetPhe275280285TyrAlalieThrLeuLeuPheLeuLeuLeuTrpSerProTyrlieVal290295300AlaCysTyrTrpArgValPheValLysAlaCysAlaValProHisArg305310315320TyrLeuAlaThrAlaValTrpMetSerPheAlaGinAlaAlaValAsn325330335ProlieValCysPheLeuLeuAsnLysAspLeuLysLysCysLeuThr340345350ThrHisAlaProCysTrpGlyThrGlyGlyAlaProAlaProArgGlu355360365ProTyrCysValMet370(22)SEQIDNO:21的資料(i)序列特征51(A)長度1053個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:21的序歹lJ描述ATGGCTTTGGAACAGAACCAGTCAACAGATTATTATTATGAGGAMATGAMTGAATGGC60ACTTATGACTACAGTCAATATGAATTGATCTGTATCAAAGAAGATGTCAGAGAATTTGCA120AAAGTTTTCCTCCCTGTATTCCTCACAATAGCTTTCGTCATTGGACTTGCAGGCAATTCC180ATGGTAGTGGCAATTTATGCCTATTACAAGAAACAGAGAACCAAMCAGATGTGTACATC240CTGAATTTGGCTGTAGCAGATTTACTCCTTCTATTCACTCTGCCTTTTTGGGCTGTTAAT300GCAGTTCATGGGTGGGTTTTAGGGAMATAATGTGCAAAATAACTTCAGCCTTGTACACA360CTAAACTTTGTCTCTGGAATGCAGTTTCTGGCTTGCATCAGCATAGACAGATATGTGGCA420GTAACTAATGTCCCCAGCCAATCAGGAGTGGGAMACCATGCTGGATCATCTGTTTCTGT480GTCTGGATGGCTGCCATCTTGCTGAGCATACCCCAGCTGGTTTTTTATACAGTAMTGAC540AATGCTAGGTGCATTCCCATTTTCCCCCGCTACCTAGGAACATCAATGAAAGCATTGATT600CAAATGCTAGAGATCTGCATTGGATTTGTAGTACCCTTTCTTATTATGGGGGTGTGCTAC660TTTATCACGGCAAGGACACTCATGMGATGCCAAACATTAMATATCTCGACCCCTAAAA720GTTCTGCTCACAGTCGTTATAGTTTTCATTGTCACTCAACTGCCTTATMCATTGTCAAG780TTCTGCCGAGCCATAGACATCATCTACTCCCTGATCACCAGCTGCAACATGAGCMACGC840ATGGACATCGCCATCCAAGTCACAGAAAGCATTGCACTCTTTCACAGCTGCCTCAACCCA900ATCCTTTATGTTTTTATGGGAGCATCTTTCAAAAACTACGTTATGAAAGTGGCCAAGAAA960TATGGGTCCTGGAGAAGACAGAGACAAAGTGTGGAGGAGTTTCCTTTTGATTCTGAGGGT1020CCTACAGAGCCAACCAGTACTTTTAGCATTTAA1053(23)SEQIDN〇:22的資料(i)序列特征(A)長度350個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué):不相關(guān)(ii)分子類型:蛋白質(zhì)(xi)SEQIDNO:22的序列描述MetAlaLeuGluGinAsnGinSerThrAspTyrTyrTyrGluGlu151015AsnGluMetAsnGlyThrTyrAspTyrSerGinTyrGluLeulieCyslie202530LysGluAspValArgGluPheAlaLysValPheLeuProValPheLeu354045ThrlieAlaPheVallieGlyLeuAlaGlyAsnSerMetValValAla505560lieTyrAlaTyrTyrLysLysGinArgThrLysThrAspValTyrlie65707580LeuAsnLeuAlaValAlaAspLeuLeuLeuLeuPheThrLeuProPhe859095TrpAlaValAsnAlaValHisGlyTrpValLeuGlyLyslieMetCys100105110LyslieThrSerAlaLeuTyrThrLeuAsnPheValSerGlyMetGin115120125PheLeuAlaCyslieSerlieAspArgTyrValAlaValThrAsnVal130135140ProSerGinSerGlyVslGlyLysProCysTrplielieCysPheCys145150155160ValTrpMetAlaAlalieLeuLeuSerlieProGinLeuValPheTyr165170175ThrValAsnAspAsnAlaArgCyslieProliePheProArgTyrLeu180185190GlyThrSerMetLysAlaLeulieGinMetLeuGlulieCyslieGly195200205PheValValProPheLeulieMetGlyValCysTyrPhelieThrAla210215220ArgThrLeuMetLysMetProAsnlieLyslieSerArgProLeuLys225230235240ValLeuLeuThrValVallieValPhelieValThrGinLeuProTyr245250255AsnlieValLysPheCysArgAlalieAsplielieTyrSerLeulie260265270ThrSerCysAsnMetSerLysArgMetAsplieAlalieGinValThr275280285GluSerlieAlaLeuPheHisSerCysLeuAsnProlieLeuTyrVal290295300PheMetGlyAlaSerPheLysAsnTyrValMetLysValAlaLysLys305310315320TyrGlySerTrpArgArgGinArgGinSerValGluGluPheProPhe325330335AspSerGluGlyProThrGluProThrSerThr340345PheSerlie350(24)SEQIDNO:23的資料(i)序列特征(A)長度1116個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDN〇23的序列描述ATGCCAGGMACGCCACCCCAGTGACCACCACTGCCCCGTGGGCCTCCCTGGGCCTCTCC60GCCAAGACCTGCAACAACGTGTCCTTCGAAGAGAGCAGGATAGTCCTGGTCGTGGTGTAC120AGCGCGGTGTGCACGCTGGGGGTGCCGGCCAACTGCCTGACTGCGTGGCTGGCGCTGCTG180CAGGTACTGCAGGGCAACGTGCTGGCCGTCTACCTGCTCTGCCTGGCACTCTGCGAACTG240CTGTACACAGGCACGCTGCCACTCTGGGTCATCTATATCCGCAACCAGCACCGCTGGACC300CTAGGCCTGCTGGCCTCGAAGGTGACCGCCTACATCTTCTTCTGCAACATCTACGTCAGC360ATCCTCTTCCTGTGCTGCATCTCCTGCGACCGCTTCGTGGCCGTGGTGTACGCGCTGGAG420AGTCGGGGCCGCCGCCGCCGGAGGACCGCCATCCTCATCTCCGCCTGCATCTTCATCCTC480GTCGGGATCGTTCACTACCCGGTGTTCCAGACGGAAGACAAGGAGACCTGCTTTGACATG540CTGCAGATGGACAGCAGGATTGCCGGGTACTACTACGCCAGGTTCACCGTTGGCTTTGCC600ATCCCTCTCTCCATCATCGCCTTCACCAACCACCGGATTTTCAGGAGCATCAAGCAGAGC660ATGGGCTTAAGCGCTGCCCAGAAGGCCAAGGTGAAGCACTCGGCCATCGCGGTGGTTGTC720ATCTTCCTAGTCTGCTTCGCCCCGTACCACCTGGTTCTCCTCGTCAAAGCCGCTGCCTTT780TCCTACTACAGAGGAGACAGGAACGCCATGTGCGGCTTGGAGGAAAGGCTGTACACAGCC840TCTGTGGTGTTTCTGTGCCTGTCCACGGTGMCGGCGTGGCTGACCCCATTATCTACGTG900CTGGCCACGGACCATTCCCGCCAAGAAGTGTCCAGAATCCATAAGGGGTGGAAAGAGTGG960TCCATGAAGACAGACGTCACCAGGCTCACCCACAGCAGGGACACCGAGGAGCTGCAGTCG1020CCCGTGGCCCTTGCAGACCACTACACCTTCTCCAGGCCCGTGCACCCACCAGGGTCACCA1080TGCCCTGCAAAGAGGCTGATTGAGGAGTCCTGCTGA,1116(25)SEQIDNO:24的資料(i)序列特征(A)長度371個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(Xi)SEQIDNO:24的序歹'J描述MetProGlyAsnAlaThrProValThrThrThrAlaProTrpAlaSer151015LeuGlyLeuSerAlaLysThrCysAsnAsnValSerPheGluGluSer202530ArglieValLeuValValValTyrSerAlaValCysThrLeuGlyVal354045ProAlaAsnCysLeuThrAlaTrpLeuAlaLeuLeuGinValLeuGin505560GlyAsnValLeuAlaValTyrLeuLeuCysLeuAlaLeuCysGluLeu65707580LeuTyrThrGlyThrLeuProLeuTrpVallieTyrlieArgAsnGin859095HisArgTrpThrLeuGlyLeuLeuAlaSerLysValThrAlaTyrlie100105110PhePheCysAsnlieTyrValSerlieLeuPheLeuCysCyslieSer115120125CysAspArgPheValAlaValValTyrAlaLeuGluSerArgGlyArg130135140ArgArgArgArgThrAlalieLeulieSerAlaCysliePhelieLeu145150155160ValGlylieValHisTyrProValPheGinThrGluAspLysGluThr165170175CysPheAspMetLeuGinMetAspSerArglieAlaGlyTyrTyrTyr180185190AlaArgPheThrValGlyPheAlalieProLeuSerlielieAlaPhe195200205ThrAsnHisArgliePheArgSerlieLysGinSerMetGlyLeuSer210215220AlaAlaGinLysAlaLysValLysHisSerAlalieAlaValValVal225230235240liePheLeuValCysPheAlaProTyrHisLeuValLeuLeuValLys245250255AlaAlaAlaPheSerTyrTyrArgGlyAspArgAsnAlaMetCysGly260265270LeuGluGluArgLeuTyrThrAlaSerValValPheLeuCysLeuSer27528028555ThrValAsnGlyValAlaAspProlielieTyrValLeuAlaThrAsp290295300HisSerArgGinGluValSerArglieHisLysGlyTrpLysGluTrp305310315320SerMetLysThrAspValThrArgLeuThrHisSerArgAspThrGlu325330335GluLeuGinSerProValAlaLeuAlaAspHisTyrThrPheSerArg340345350ProValHisProProGlySerProCysProAlaLysArgLeulieGlu355360365GluSerCys370(26)SEQIDNO:25的資料(i)序列特征(A)長度1113個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:ATGGCGAACTATAGCCATGC25的序列描述AGCTGACAACATTTTGCAAATTTCTGAAACATCTCCATTTGATCTTTGCTGTCAAAAATGGGGGTTTTGTTTAGCTATCGGTGATCTGTAGGCACTTACTGCTAATGATTGTCTACCTCAGTAGCAGCAGGCCMTTGGCCAAAATGCAAAAAAGAATCATACCTGGTGGCTAACAGCTGTTCTCAAACAAGGTTACCAATGACTTCCTTTGCTAGTGAAGTTCAGATATGCTCTACCTGCCTGTTTCCACCCATCACCGTGGTGTGGACCATTCATTAGCCTTAGGATTAGCTGATATTTCAGCCAGAATAGCAGGATTACACCACAGGGCAGAATGTTCCTGTTATTGCTGTCTGGATGGGAGCTGAGGGGAACCTTAGGGTTTCATAAGATAAGACCCCTCAGATCTGACTTATGGGCACTGCTTTCCTTCTATACATCTGTCTGTGGGAGGAAGATTATGCTGCTTTTTCGTCCACCTGGACTTTTTGGAAGGGGTCAGAAGAAGGCTATATMTGGAGAGTTTTTGAGTTTTGCCGCGCTGTTTCCTGTGTTATAATAGGAGTCATTGCATAGAGGCAATTTGTTACTCTGACTTATGCTCTTCTAAGAGGCTGAGCCATGGCATCAATGCACCTCTTGCTCTCAGATCGAAGAACATGGTCCTGCCCACACCACCTATTGGTCTACTTTTCTGTGCAAGAGGGCCAAGCAGGAAAGCACAACCCTGAATCTCTCGCCGCGTGGTGGGCACCTTACTATCCCATTTGTGCAMGTGATGCATCAGTGTCCTTTTGGACTTCCCCCGGTTCCAACACCGTCCTCCTAGCAAATGAAGCCG紅CAGTGGCCACCTTGCTTAGACGAGTTTTCTAACCTTCTGTAGTACCTCAATCCTTTTTCTTTACTGTCTAACAGCCCAACCTCCTGCTTCCTGTTGGTTCAACTCTTGCCTTTCTGCACCAGATACGTGTCTGGCTTTTAGACGTGCTCCTTCAGGCACACAGCTTAGTCCAGTTTCCAGGCAGCTGGGCATCAGGCA嵐TGGAGGTGGGGCCCCAGGGGGATTTTGTCTGCATTCAGAAAATCC60120180240300360420480540600660720780840900卿102010801113(27)SEQIDNO:26的資料(i)序列特征(A)長度370個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:26的序歹l」描述MetAlaAsnTyrSerHisAlaAlaAspAsnlieLeuGinAsnLeuSer151015ProLeuThrAlaPheLeuLysLeuThrSerLeuGlyPhelielieGly202530ValSerValValGlyAsnLeuLeulieSerlieLeuLeuValLysAsp354045LysThrLeuHisArgAlaProTyrTyrPheLeuLeuAspLeuCysCys505560SerAsplieLeuArgSerAlalieCysPheProPheValPheAsnSer65707580ValLysAsnGlySerThrTrpThrTyrGlyThrLeuThrCysLysVal859095lieAlaPheLeuGlyValLeuSerCysPheHisThrAlaPheMetLeu100105110PheCyslieSerValThrArgTyrLeuAlalieAlaHisHisArgPhe115120125TyrThrLysArgLeuThrPheTrpThrCysLeuAlaVallieCysMet130135140ValTrpThrLeuSerValAlaMetAlaPheProProValLeuAspVal145150155160GlyThrTyrSerPhelieArgGluGluA印GinCysThrPheGinHis165170175ArgSerPheArgAlaAsnAspSerLeuGlyPheMetLeuLeuLeuAla180185190LeulieLeuLeuAlaThrGinLeuValTyrLeuLysLeuliePhePhe195200205ValHisAspArgArgLysMetLysProValGinPheValAlaAlaVal210215220SerGinAsnTrpThrPheHisGlyProGlyAlaSerGlyGinAlaAla225230235240AlaAsnTrpLeuAlaGlyPheGlyArgGlyProThrProProThrLeu245250255LeuGlylieArgGinAsnAlaAsnThrThrGlyArgArgArgLeuLeu260265270ValLeuAspGluPheLysMetGluLysArglieSerArgMetPheTyr275280285lieMetThrPheLeuPheLeuThrLeuTrpGlyProTyrLeuValAla290295300CysTyrTrpArgValPheAlaArgGlyProValValProGlyGlyPhe305310315320LeuThrAlaAlaValTrpMetSerPheAlaGinAlaGlylieAsnPro325330335PheValCysliePheSerAsnArgGluLeuArgArgCysPheSerThr340345350ThrLeuTyrCysArgLysSerArgLeuProArgGluProTyrCys355360365Vallie370(28)SEQIDNO:27的資料(i)序列特征(A)長度1080個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:27的序歹lj描述ATGCAGGTCCCGAACAGCACCGGCCCGGACMCGCGACGCTGCAGATGCTGCGGAACCCG60GCGATCGCGGTGGCCCTGCCCGTGGTGTACTCGCTGGTGGCGGCGGTCAGCATCCCGGGC120AACCTCTTCTCTCTGTGGGTGCTGTGCCGGCGCATGGGGCCCAGATCCCCGTCGGTCATC180TTCATGATCAACCTGAGCGTCACGGACCTGATGCTGGCCAGCGTGTTGCCTTTCCAAATC240TACTACCATTGCAACCGCCACCACTGGGTATTCGGGGTGCTGCTTTGCAACGTGGTGACC300GTGGCCTTTTACGCAMCATGTATTCCAGCATCCTCACCATGACCTGTATCAGCGTGGAG360CGCTTCCTGGGGGTCCTGTACCCGCTCAGCTCCAAGCGCTGGCGCCGCCGTCGTTACGCG420GTGGCCGCGTGTGCAGGGACCTGGCTGCTGCTCCTGACCGCCCTGTGCCCGCTGGCGCGC480ACCGATCTCACCTACCCGGTGCACGCCCTGGGCATCATCACCTGCTTCGACGTCCTCAAG540TGGACGATGCTCCCCAGCGTGGCCATGTGGGCCGTGTTCCTCTTCACCATCTTCATCCTG600CTGTTCCTCATCCCGTTCGTGATCACCGTGGCTTGTTACACGGCCACCATCCTCAAGCTG660TTGCGCACGGAGGAGGCGCACGGCCGGGAGCAGCGGAGGCGCGCGGTGGGCCTGGCCGCG720GTGGTCTTGCTGGCCTTTGTCACCTGCTTCGCCCCCAACAACTTCGTGCTCCTGGCGCAC780ATCGTGAGCCGCCTGTTCTACGGCAAGAGCTACTACCACGTGTACAAGCTCACGCTGTGT840CTCAGCTGCCTCAACAACTGTCTGGACCCGTTTGTTTATTACTTTGCGTCCCGGGAATTC900CAOCTGCGCCTGCGGGAATATTTCGGCTGCCGCCGGGTCCCCAGAGACACCCTGGACACG960CGCCGCGAGAGCCTCTTCTCCGCCAGGACCACGTCCGTGCGCTCCGAGGCCGGTGCGCAC1020CCTGAAGGGATGGAGGGAGCCACCAGGCCCGGCCTCCAGAGGCAGGAGAGTGTGTTCTGA1080(29)SEQIDNO:28的資料(i)序列特征(A)長度3SS個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:28的序歹U描述MetGinValProAsnSerThrGlyProAspAsnAlaThrLeuGinMet151015LeuArgAsnProAlalieAlaValAlaLeuProValValTyrSerLeu202530ValAlaAlaValSerlieProGlyAsnLeuPheSerLeuTrpValLeu354045CysArgArgMetGlyProArgSerProSerValliePheMetlieAsn505560LeuSerValThrAspLeuMetLeuAlaSerValLeuProPheGinlie65707580TyrTyrHisCysAsnArgHisHisTrpValPheGlyValLeuLeuCys859095AsnValValThrValAlaPheTyrAlaAsnMetTyrSerSerlieLeu100105110ThrMetThrCyslieSerValGluArgPheLeuGlyValLeuTyrPro115120125LeuSerSerLysArgTrpArgArgArgArgTyrAlaValAlaAlaCys130135140AlaGlyThrTrpLeuLeuLeuLeuThrAlaLeuCysProLeuAlaArg145150155160ThrAspLeuThrTyrProValHisAlaLeuGlylielieThrCysPhe165170175AspValLeuLysTrpThrMetLeuProSerValAlaMetTrpAlaVal180185190PheLeuPheThrliePhelieLeuLeuPhelieProPheVallie195200205ThrValAlaCysTyrThrAlaThrlieLeuLysLeuLeuArgThrGlu210215220GluAlaHisGlyArgGluGinArgArgArgAlaValGlyLeuAlaAla225230235240ValValLeuLeuAlaPheValThrCysPheAlaProAsnAsnPheVal245250255LeuLeuAlaHislieValSerArgLeuPheTyrGlyLysSerTyrTyr260265270HisValTyrLysLeuThrLeuCysLeuSerCysLeuAsnAsnCysLeu275280285AspProPheValTyrTyrPheAlaSerArgGluPheGinLeuArgLeu290295300ArgGluTyrLeuGlyCysArgArgValProArgAspThrLeuAspThr305310315320ArgArgGluSerLeuPheSerAlaArgThrThrSerValArgSerGlu325330335AlaGlyAlaHisProGluGlyMetGluGlyAlaThrArgProGlyLeu340345350GinArgGinGluSerValPhe355(30)SEQIDNO:29的資料(i)序列特征(A)長度1503個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形60(ii)分子類型:(xi)SEQIDNO:ATGGAGCGTCCCTGGGAGGADNA(基因組的)29的序列描述CCAGTCGCCGGCTGAGTGCCCGCTGGCCCGTCGGTTCAAGCGGCCCATGGTACAACTACAGACGCCGTGGTTGGTGCTCGACGTTGTCGGCTCACGCTGACTCACTGCGTCGCAGGGGGCTGGGGCGTGTCTGGACGCTTCTCGCCTTCGGTACGCGCCACGGGCGCGTCGCCTTTGTGGGCGCGCACCTTCACTTCTGACGCCTGGTCTGCGAGCGCGGAGCTTCAGCGACAGGCAGCCTGACCGGGGCGCGCGGGACCCAACCCCCTCGCCGCAGCGCGACAGTCGGGGCTCCGGCAAGCTTGTGCCTGGCGACGCCACCCATCTGCTGGCAACTGTCCCCCCGTGCTGAGCCGCGCCCGTCGCTGCTCCTGCTCCACTGTTGGGCATCCTACGCGCGGCGGCAAGCCGCGCATGTTGGGGGTCCTGTACTACCCCATCATGCTGCGGACGCTGAGGCTTCGCTCGGAGCGCCGGTGCACCCAGCCCAGGCCCGGAGGGGGCAGCTGAGGGCTCCGGTGCCGCGGCGAGTGGCACAGGCTGGGGGAGGGGGCAACTGCTGGCGACCGCCGGTGCCAGCTCCAGCCCCGCCCCCGGAGCGGCTGCGGGTGGCGCACGACCAGGGCGCAGACCGCTGCGGCCGGCGCCGGTGAGCGAGGTCATCCGCGGTGCGAGCTACCAGCCGGGTGCCGGGGTGTGCGCCTTCATCGTGCTAGAGAATCTGCGCTTCCACGCTCCCATGTTCCTGCTCCTAGGCGCCGCCTACGCCGCCAACATCCTACTCGCGCTCTGGTTCGCACGGGAGGGAGGCGTCCTCCTGGCCATCGCGCTGGAGCGCAGCCTCTCCAGTCGGGGGCGCACGCTGGCGATGGCCGGGCTCCTGCCAGCGCTGGGCTGGAATTGCTTGCCGCTCTACGCCMGGCCTACGTGCTGGCCGCGATCTGTGCACTCTACGCGCGCATCCTGCCGGCACGGCCCGGGACTGCGGGGACCTCTCTGGCCTTGCTGCGCACGCTCAGCGTCCCCCTCTTCCTGCTGCTGTTGCTCGACGTCCTGCAGGCCGATCCCTTCCTGGGACTGGCCTACACGCTCACCAACCGCGACCTGCGCCACCACTCCTGCGGCAGAGACCCGAGTGGCTCCGGGGGCCTGCGCCGCTGCCTGCCCCCGGGCTCATCGCCCCAGCGCGACGGGCTGGACACCACAGCCGCCCGGACTCTGGTATCAGAACCCTCGCCTGTG60GCAGCCATGG120CCCTTTGCGT180GTCCGCTCAC240TTGGGGCGCG300CGTCCTGCAT360CCTGCGCGCC420AGCCGTGTTG■GGGCAGCCTC540GTCGGGGCCG600CTTCGTGGCA660CACCATGGCG720AGCCGCGGCC780CCTGGGTCGC840CTTCTGCGTG900CTACTGCCAG960CACCTCGACC1020GGTGCTCCTG1080GGCGTGCCCG1140CATGGCCAAC1200CGCGCTCCTG1260CCAGCAGTCG1320CCTTGATGGG1380CAGCGGCTCC1440GGCTGCAGAC15001503(31)SEQIDNO:30的資料(i)序列特征(A)長度500個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQ工DNO:30的序歹lJ描述MetGluArgProTrpGluAspSerProGlyProGluGlyAlaAlaGlu151015GlySerProValProValAlaAlaGlyAlaArgSerGlyAlaAlaAla202530SerGlyThrGlyTrpGinProTrpAlaGluCysProGlyProLysGly354045ArgGlyGinLeuLeuAlaThrAlaGlyProLeuArgArgTrpProAla505560ProSerProAlaSerSerSerProAlaProGlyAlaAlaSerAlaHis65707580SerValGinGlySerAlaThrAlaGlyGlyAlaArgProGlyArgArg859095ProTrpGlyAlaArgProMetGluSerGlyLeuLeuArgProAlaPro100105110ValSerGluVallieValLeuHisTyrAsnTyrThrGlyLysLeuArg115120125GlyAlaSerTyrGinProGlyAlaGlyLeuArgAlaAspAlaValVal130135140CysLeuAlaValCysAlaPhelieValLeuGluAsnLeuAlaValLeu145150155160LeuValLeuGlyArgHisProArgPheHisAlaProMetPheLeuLeu165170175LeuGlySerLeuThrLeuSerAspLeuLeuAlaGlyAlaAlaTyrAla180185190AlaAsnlieLeuLeuSerGlyProLeuThrLeuLysLeuSerProAla195200205LeuTrpPheAlaArgGluGlyGlyValPheValAlaLeuThrAlaSer210215220ValLeuSerLeuLeuAlalieAlaLeuGluArgSerLeuThrMetAla225230235240ArgArgGlyProAlaProValSerSerArgGlyArgThrLeuAlaMet245250255AlaAlaAlaAlaTrpGlyValSerLeuLeuLeuGlyLeuLeuProAla260265270LeuGlyTrpAsnCysLeuGlyArgLeuAspAlaCysSerThrValLeu275280285ProLeuTyrAlaLysAlaTyrValLeuPheCysValLeuAlaPheVal290295300GlylieLeuAlaAlalieCysAlaLeuTyrAlaArglieTyrCysGin305310315320ValArgAlaAsnAlaArgArgLeuProAlaArgProGlyThrAlaGly325330335ThrThrSerThrArgAlaArgArgLysProArgSerLeuAlaLeuLeu340345350ArgThrLeuSerValValLeuLeuAlaPheValAlaCysTrpGlyPro355360365LeuPheLeuLeuLeuLeuLeuAspValAlaCysProAlaArgThrCys370375380ProValLeuLeuGinAlaAspProPheLeuGlyLeuAlaMetAlaAsn385390395400SerLeuLeuAsnProlielieTyrThrLeuThrAsnArgAspLeuArg405410415HisAlaLeuLeuArgLeuValCysCysGlyArgHisSerCysGlyArg420425430AspProSerGlySerGinGinSerAlaSerAlaAlaGluAlaSerGly435柳445GlyLeuArgArgCysLeuProProGlyLeuAspGlySerPheSerGly450455460SerGluArgSerSerProGinArgAspGlyLeuAspThrSerGlySer465470475480ThrGlySerProGlyAlaProThrAlaAlaArgThrLeuValSerGlu485490495ProAlaAlaAsp500(32)SEQIDNO:31的資料(i)序列特征(A)長度1029個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:31的序歹lJ描述ATGCAAGCCGTCGACAATCTCACCTCTGCGCCTGGGAACACCAGTCTGTGCACCAGAGAC60TACAAAATCACCCAGGTCCTCTTCCCACTGCTCTACACTGTCCTGTTTTTTGTTGGACTT120ATCACAAATGGCCTGGCGATGAGGATTTTCTTTCAAATCCGGAGTAAATCAMCTTTATT180ATTTTTCTTAAGAACACAGTCATTTCTGATATTCTTAGTGATGCCAAACTGGGAACAGGATCCGTCATATTTTATTTCACAATGTATATCGATCGCTACCAGAAGACCACCAGGCCATTTGCTAAGATTCTCTCTGTTGTCATCTGGGCAATTCTGACCAACAGGCAGCCGAGAGACAAGGAGTTCGGTCTAGTCTGGCATGAAATAGTAAATTTCTTAATTGTTATTGTATGTTATACAGTMGAACGAGGGGTGTAGGTAMGTCCCCATCATTGCTGTATTCTTTATTTGTTTTGTTCTGAGCCAAACCCGGGATGTCTTTGACTGCGAGAGCACTCTGTGGTTAACTTCCTTAAATCTTTGCAAGTCCTTCAGAAATTCCTTGATATCTCTGTCCCAGGACAATAGGAAAAAAGAACCAATGTAACTTCTCATGATTCTGACTTTTCCATTCMA240CCACTGAGAACTTTTGTGTGTCAAGTTACC300AGTATTTCATTCCTGGGACTGATAACTATC360MAACATCCAACCCCAAAAATCTCTTGGGG420TTCATGTTCTTACTCTCTTTGCCTAACATG480AATGTGMGAAATGCTCTTTCCTTAAATCA540AATTACATCTGTCAAGTCATTTTCTGGATT600CTCATTACAAAAGAACTGTACCGGTCATAC660AGGAAMAGGTGMCGTCMAGTTTTCATT720CCTTTCCATTTTGCCCGAATTCCTTACACC780ACTGCTGAAAATACTCTGTTCTATGTGAAA840GCATGCCTGGATCCGTTCATCTATTTTTTC900AGTATGCTGAAGTGCCCCAATTCTGCAACA960CAGGATGGTGGTGACCCAAATGAAGAGACT10201029(33)SEQIDNO:32的資料(i)序列特征(A)長度342個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQ工DNO:32的序歹[l描述MetGinAlaValAspAsnLeuThrSerAlaProGlyAsnThrSerLeu151015CysThrArgAspTyrLyslieThrGinValLeuPheProLeuLeuTyr202530ThrValLeuPhePheValGlyLeulieThrAsnGlyLeuAlaMetArg354045liePhePheGinlieArgSerLysSerAsnPhelieliePheLeuLys505560AsnThrVallieSerAspLeuLeuMetlieLeuThrPheProPheLys65707580lieLeuSerAspAlaLysLeuGlyThrGlyProLeuArgThrPheVal859095CysGinValThrSerValliePheTyrPheThrMetTyrlieSerlie100105110SerPheLeuGlyLeulieThrlieAspArgTyrGinLysThrThrArg115120125ProPheLysThrSerAsnProLysAsnLeuLeuGlyAlaLyslieLeu130135140SerValVallieTrpAlaPheMetPheLeuLeuSerLeuProAsnMet145150155160lieLeuThrAsnArgGinProArgAspLysAsnValLysLysCysSer165170175PheLeuLysSerGluPheGlyLeuValTrpHisGlulieValAsnTyr180185190lieCysGinValliePheTrplieAsnPheLeulieVallieValCys195200205TyrThrLeulieThrLysGluLeuTyrArgSerTyrValArgThrArg210215220GlyValGlyLysValProArgLysLysValAsnValLysValPhelie225230235240lielieAlaValPhePhelieCysPheValProPheHisPheAlaArg245250255lieProTyrThrLeuSerGinThrArgAspValPheAspCysThrAla260265270GluAsnThrLeuPheTyrValLysGluSerThrLeuTrpLeuThrSer275280285LeuAsnAlaCysLeuAspProPhelieTyrPhePheLeuCysLysSer290295300PheArgAsnSerLeulieSerMetLeuLysCysProAsnSerAlaThr305310315320SerLeuSerGinAspAsnArgLysLysGluGinAspGlyGlyAspPro325330335AsnGluGluThrProMet34034)SEQIDNO:33的資料(i)序列特征(A〉長度1077個堿基對(B)類型核酸(C〉鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi),SEQIDNO:33的序列描述ATGTCGGTCTGCTACCGTCCCCCAGGGAACGAGACACTGCTGAGCTGGAAGACTTCGCGG60GCCACAGGCACAGCCTTCCTGCTGCTGGCGGCGCTGCTGGGGCTGCCTGGCAACGGCTTC咖GTGGTGTGGAGCTTGGCGGGCTGGCGGCCTGCACGGGGGCGACCGCTGGCGGCCACGCTT180GTGCTGCACCTGGCGCTGGCCGACGGCGCGGTGCTGCTGCTCACGCCGCTCTTTGTGGCC240TTCCTGACCCGGCAGGCCTGGCCGCTGGGCCAGGCGGGCTGCAAGGCGGTGTACTACGTG300TGCGCGCTCAGCATGTACGCCAGCGTGCTGCTCACCGGCCTGCTCAGCCTGCAGCGCTGC360CTCGCAGTCACCCGCCCCTTCCTGGCGCCTCGGCTGCGCAGCCCGGCCCTGGCCCGCCGC420CTGCTGCTGGCGGTCTGGCTGGCCGCCCTGTTGCTCGCCGTCCCGGCCGCCGTCTACCGC480CACCTGTGGAGGGACCGCGTATGCCAGCTGTGCCACCCGTCGCCGGTCCACGCCGCCGCC540CACCTGAGCCTGGAGACTCTGACCGCTTTCGTGCTTCCTTTCGGGCTGATGCTCGGCTGC600TACAGCGTGACGCTGGCACGGCTGCGGGGCGCCCGCTGGGGCTCCGGGCGGCACGGGGCG660CGGGTGGGCCGGCTGGTGAGCGCCATCGTGCTTGCCTTCGGCTTGCTCTGGGCCCCCTAC720CACGCAGTCAACCTTCTGCAGGCGGTCGCAGCGCTGGCTCCACCGGAAGGGGCCTTGGCG780AAGCTGGGCGGAGCCGGCCAGGCGGCGCGAGCGGGAACTACGGCCTTGGCCTTCTTCAGT840TCTAGCGTCAACCCGGTGCTCTACGTCTTCACCGCTGGAGATCTGCTGCCCCGGGCAGGT900CCCCGTTTCCTCACGCGGCTCTTCGAAGGCTCTGGGGAGGCCCGAGGGGGCGGCCGCTCT960AGGGAAGGGACCATGGAGCTCCGAACTACCCCTCAGCTGAAAGTGGTGGGGCAGGGCCGC1020GGCAATGGAGACCCGGGGGGTGGGATGGAGAAGGACGCTCCGGAATGGGACCTTTGA1077(35)SEQIDNO:34的資料(i)序列特征(A)長度358個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:34的序歹U描述MetSerValCysTyrArgProProGlyAsn1510LysThrSerArgAlaThrGlyThrAlaPhe2025LeuGlyLeuProGlyAsnGlyPheValVal3540ArgProAlaArgGlyArgProLeuAlaAla5055AlaLeuAlaAspGlyAlaValLeuLeuCeu6570PheLeuThrArgGinAlaTrpProLeuGly8590GluThrLeuLeuSerTrp15LeuLeuLeuAlaAlaLeu30TrpSerLeuAlaGlyTrp45ThrLeuValLeuHisLeu60ThrProLeuPheValAla7580GinAlaGlyCysLysAla95ValTyrTyrValCysAlaLeuSerMetTyrAlaSerValLeuLeuThr100105110GlyLeuLeuSerLeuGinArgCysLeuAlaValThrArgProPheLeu115120125AlaProArgLeuArgSerProAlaLeuAlaArgArgLeuLeuLeuAla130135140ValTrpLeuAlaAlaLeuLeuLeuAlaValProAlaAlaValTyrArg145150155160HisLeuTrpArgAspArgValCysGinLeuCysHisProSerProVal165170175HisAlaAlaAlaHisLeuSerLeuGluThrLeuThrAlaPheValLeu180185190ProPheGlyLeuMetLeuGlyCysTyrSerValThrLeuAlaArgLeu195200205ArgGlyAlaArgTrpGlySerGlyArgHisGlyAlaArgValGlyArg210215220LeuValSerAlalieValLeuAlaPheGlyLeuLeuTrpAlaProTyr225230235240HisAlaValAsnLeuLeuGinAlaValAlaAlaLeuAlaProProGlu245250255GlyAlaLeuAlaLysLeuGlyGlyAlaGlyGinAlaAlaArgAlaGly260265270ThrThrAlaLeuAlaPhePheSerSerSerValAsnProValLeuTyr275280285ValPheThrAlaGlyAspLeuLeuProArgAlaGlyProArgPheLeu290295300ThrArgLeuPheGluGlySerGlyGluAlaArgGlyGlyGlyArgSer305310315320ArgGluGlyThrMetGluLeuArgThrThrProGinLeuLysValVal325330335GlyGinGlyArgGlyAsnGlyA印ProGlyGlyGlyMetGluLysAsp340345350GlyProGluTrpAspLeu35567(3S)SEQIDNO:35的資料(i)序列特征(A)長度1005個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:35的序列描述:ATGCTGGGGACTGGAAAAGTAATACCATTGTATCTCTTTAAGGAGTTATGGTGCTTCATGTACTTGATMTTAATCTCCTATAAATCCTGCCCAACTACATTTGTGATGTGTTGCTACTGTTCTCTGTGCGGGAGTTGGACGGCCTTTGGCACTTCAGGGAGCAGATGGGTCATGGCATGACTACCTTTCTTGTTTACGGACCTCTCTGTCCAATGGAAACCAACCTCTATTAAGTATCCTGGCCATTTGTTATAACTGAACCTCATTTAGTTTCTTTTACTCTGCCCCTTTTTTACACCAGCAGTATCACCTTTCTGAAACATGCTGATCTCATGAACTGAATGCAACTCATTTTTTATCTACATCTTCCTCTGACTTACTGGATATATTACCAGCATTTTTCCGAGAAGGTTTTAGTACAATGGCACCCAGCATGTGTTTACAAGATTTGAAMGCCTCTATCACGTCGTGCACTCAGCAGTGTCATCGAATCAACTGCCTACTTTCATGCAAAAACTGGGATTGAGTTCTCTGAAGAGCTTTTCTGTGGAGACGTGCCTCTTTCTCACACCTTCTGCACCTTAGAGTACCTGTAATGCTAACACTGTGCTCTCTTCCCTCAACTTGGATGCGGAATGGTCGTCATCAAACCCTGTCTAGACACAACTTTCAGAGAAAGGCTGGCAGCTCGTTGTGGGACTGGAACAGGCACCCTCCCTCTGCATMGCTTTTATCAGA嵐GAAAGATACTACCCATATTTTGCAAGTGGGGTTCCTTAAAGCAGAGTCATCATGGCTGAGGATCGCACTCCTTTTATCTATTTTCTTCAAATCCCTAGTGAAGAGGCTGCCAGTCCTTGGACAGTAATATTCATGCTGATACAACCGATATCATAGATCGAGTTTGCTATTACTTCCCCTTTTCTGGAGACTATTCCTCTTGAATAGGCAGAGTGGTAATCTTCACGCCTGCATTGTGACATTTGGGAGATTACATCCTTT601201802403003604204805406006607207808409009601005(37)SEQ工DNO:36的資料(i)序列特征(A)長度334個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii〉分子類型蛋白質(zhì)(xi)SEQIDNO:36的序列描述GlylieMetAlaTrpAsnAlaThrCysMetLeu1510LysAsnTrpLeuAla15AlaGluAlaAlaLeuGluLysTyrTyrLeuSerliePheTyrGlylie202530GluPheValValGlyValLeuGlyAsnThrlieValValTyrGlyTyr354045liePheSerLeuLysAsnTrpAsnSerSerAsnlieTyrLeuPheAsn505560LeuSerValSerAspLeuAlaPheLeuCysThrLeuProMetLeulie65707580ArgSerTyrAlaAsnGlyAsnTrplieTyrGlyAspValLeuCyslie859095SerAsnArgTyrValLeuHisAlaAsnLeuTyrThrSerlieLeuPhe100105110LeuThrPhelieSerlieAspArgTyrLeulielieLysTyrProPhe115120125ArgGluHisLeuLeuGinLysLysGluPheAlalieLeulieSerLeu130135140AlalieTrpValLeuValThrLeuGluLeuLeuProlieLeuProLeu145150155160lieAsnProVallieThrAspAsnGlyThrThrCysAsnAspPheAla165170175SerSerGlyAspProAsnTyrAsnLeulieTyrSerMetCysLeuThr180185190LeuLeuGlyPheLeulieProLeuPheValMetCysPhePheTyrTyr195200205LyslieAlaLeuPheLeuLysGinArgAsnArgGinValAlaThrAla210215220LeuProLeuGluLysProLeuAsnLeuVallieMetAlaValVallie225230235240PheSerValLeuPheThrProTyrHisValMetArgAsnValArglie245250255AlaSerArgLeuGlySerTrpLysGinTyrGinCysThrGinValVal260265270lieAsnSerPheTyrlieValThrArgProLeuAlaPheLeuAsnSer275280285VallieAsnProValPheTyrPheLeuLeuGlyAspHisPheArgAsp290295300MetLeuMetAsnGinLeuArgHisAsnPheLysSerLeuThrSerPhe305310315320SerArgTrpAlaHisGluLeuLeuLeuSerPheArgGluLys325330(38)SEQIDNO(i)序列特征(A)長度(B)類型(C)鏈型(D)拓?fù)鋵W(xué)37的資料1296個堿基對核酸單鏈:線形(ii)分子類型DNA(基因組的)ATGCAGGCGCACGCGGGAGCCCGGGACGCGTTTGGCMTGMCATCTTTAGTCACCATGCGTGCCATTTGGTGGAAAGGCAGGGCTTTCATGGCACGTGCTGCTTAGAAGATCCTCTTCCCTTTGGATAAATGTCCAMACTCTTTGCTGTTTGAAAAGGGGATTTTCCAAAAAATGTTTAGGCATGGAAAATCCAGTGGTGTGAACAGACTGGCTGAGASEQIDNO:TTAACATTACAGTTCATCGCCCAAGCTGGCCTCTGGTGTTTCTGCTCCTTTCCAGAACATTCCAGTCTACACCAGGGACTCAATGCTAGGMCAACTTGAAGTGGACCAGTCCTGCCTCTAGAAAAGAGTTAGCCAGGAATGTGCTGGGCAATATGATGAACTCCATCTGTGTCTGCAGTATTCAGGAATAGGAAACCAACAGAGG歸AATTCTCCTTT37的序列描述CCCGGAGCAGTTCTCTCGGCTCTGTACCGGCCTCGTGCTCCTACGTGGTGGGCGCTCAGTTTCCGACAACCGCTGTTGTGTGTGCATCCTTGTGGTCTGGGATCAAATATCCCTGTGCACTATGGTGATGTGGGGATGGTGAAGAAACGAACCATTCCATTGTCACAATCTAATCCCATTTTGTTATTGCTACMTGATGAGGAGAAGCAG磁AAGCTCAGACAGTGGGCTGCGACCGCACCGGCGTGCACCCGCAGCAGACCTGCTCATGGCTGGGGGACAGAAATGCTTTAAMTGACTGGTGGCAGGACTTCCTATCAGAAGATCTCTTATTCTGTTCAGTGCTTCGCTGTCATTAGTTGTCCATAAAGATGATTTGTCTATGCATATAGTMATACGGAAGAAAGTTCAGTGATGMACGACATCCATTAATGCTGCGGGATCGTCTACACTCATCTTCGCAGGCCATGCGTCACCTTCTTGTGCTTTCATTCACTATGACAGTGGCAATATCATCGTAGGATGAAAAGGAACACCACCTTACAGTAAAATGAACTATTCATGATGGTGACTGATGATTGATTGCTATCGTTTATGAATGAAAACCTTCTCCAAAGTTTTCGCAACATTGATTGCTCTCTTCCACAACCTGCCCAGAGCTGCCTGGCGCTCCACCGTCACCCTGCATTCCCTTGCAAGATGCTGCATTGCTCACCAACCGAATCACCCATGACACATCTGCCATCCTTGTCTGGTTATGAATGGAAAAGAAAGTGGTGGCTATACAGTAATGCAAATTATTAAACTTCAAATCCAGCACAACCTCAGAGAGAGTCAAATTGTAGGTCTGAA60120180240300360420480540600660720780840900960102010801140120012601296(39)SEQIDNO:38的資料(i)序列特征(A)長度431個氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)鋵W(xué)不相關(guān)(ii)分子類型蛋白質(zhì)(xi)SEQIDNO:38的序列描述70MetGinAlaLeuAsnlieThrProGluGinPheSerArgLeuLeuArg151015AspHisAsnLeuThrArgGluGinPhelieAlaLeuTyrArgLeuArg202530ProLeuValTyrThrProGluLeuProGlyArgAlaLysLeuAlaLeu354045ValLeuThrGlyValLeuliePheAlaLeuAlaLeuPheGlyAsnAla505560LeuValPheTyrValValThrArgSerLysAlaMetArgThrValThr65707580AsnliePhelieCysSerLeuAlaLeuSerAspLeuLeulieThrPhe859095PheCyslieProValThrMetLeuGinAsnlieSerAspAsnTrpLeu100105110GlyGlyAlaPhelieCysLysMetValProPheValGinSerThrAla115120125ValValThrGluMetLeuThrMetThrCyslieAlaValGluArgHis130135140GinGlyLeuValHisProPheLysMetLysTrpGinTyrThrAsnArg145150155160ArgAlaPheThrMetLeuGlyValValTrpLeuValAlaVallieVal165170175GlySerProMetTrpHisValGinGinLeuGlulieLysTyrAspPhe180185190LeuTyrGluLysGluHislieCysCysLeuGluGluTrpThrSerPro195200205ValHisGinLyslieTyrThrThrPhelieLeuVallieLeuPheLeu210215220LeuProLeuMetValMetLeulieLeuTyrSerLyslieGlyTyrGlu225230235240LeuTrplieLysLysArgValGlyAspGlySerValLeuArgThrlie245250255HisGlyLysGluMetSerLyslieAlaArgLysLysLysArgAlaVal260265270lieMetMetValThrValValAlaLeuPheAlaValCysTrpAlaPro275280285PheHisValValHisMetMetlieGluTyrSerAsnPheGluLysGlu290295300TyrAspAspValThrlieLysMetliePheAlalieValGinlielie305310315320GlyPheSerAsnSerlieCysAsnProlieValTyrAlaPheMetAsn325330335GluAsnPheLysLysAsnValLeuSerAlaValCysTyrCyslieVal340345350AsnLysThrPheSerProAlaGinArgHisGlyAsnSerGlylieThr355360365MetMetArgLysLysAlaLysPheSerLeuArgGluAsnProValGlu370375380GluThrLysGlyGluAlaPheSerAspGlyAsnlieGluValLysLeu385390395400CysGluGinThrGluGluLysLysLysLeuLysArgHisLeuAlaLeu405410415PheArgSerGluLeuAlaGluAsnSerProLeuAspSerGlyHis420425430(40)SEQIDNO:39的資料(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:39的序歹!j描述CTGTGTACAGCAGTTCGCAGAGTG24(41)SEQIDNO:40的資料(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:40的序歹lJ描述GAGTGCCAGGCAGAGCAGGTAGAC(42)SEQIDNO:41的資料(i)序列特征(A)長度31個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:41的序歹lJ描述CCCGAATTCCTGCTTGCTCCCAGCTTGGCCC(43)SEQIDNO:42的資料(i)序列特征(A)長度32個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQ工DNO:42的序歹U描述TGTGGATCCTGCTGTCAAAGGTCCCATTCCGG(44)SEQIDNO:43的資料(i)序列特征(A)長度20個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:43的序歹U描述TCACAATGCTAGGTGTGGTC20(45)SEQIDNO:44的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(Xi)SEQIDNO:44的序歹lj描述TGCATAGACAATGGGATTACAG22(46)SEQ工DNO:45的資料(i)序列特征(A)長度511個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi)SEQIDNO:45的序歹U描述TCACAATGCTAGGTGTGGTCTGGCTGGTGGCAGTCATCGTAGGATCACCCATGTGGCACG60TGCAACAACTTGAGATCAAATATGACTTCCTATATGAAAAGGAACACATCTGCTGCTTAG120AAGAGTGGACCAGCCCTGTGCACCAGAAGATCTACACCACCTTCATCCTTGTCATCCTCT180TCCTCCTGCCTCTTATGGTGATGCTTATTCTGTACGTAAAATTGGTTATGAACTTTGGAT240AAAGAAAAGAGTTGGGGATGGTTCAGTGCTTCGAACTATTCATGGAAAAGAAATGTCCAA300AATAGCCAGGAAGAAGAAACGAGCTGTCATTATGATGGTGACAGTGGTGGCTCTCTTTGC360TGTGTGCTGGGCACCATTCCATGTTGTCCATATGATGATTGAATACAGTAATTTTGAAAA420GGAATATGATGATGTCACAATCAAGATGATTTTTGCTATCGTGCAAATTATTGGATTTTC480CAACTCCATCTGTAATCCCATTGTCTATGCA511(47〉SEQIDNO:46的資料(i)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:46的序列描述CTCCTTAGAAGAGTGGACCAG(48)SEQIDNO:47的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:47的序歹U描述CTGTGCACCAGAAGATCTACAC(49)SEQ工DNO:48的資料U)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:48的序歹lJ描述CAAGGATGAAGGTGGTGTAGA(50)SEQIDNO:49的資料(i)序列特征(A)長度23個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:49的序歹U描述GTGTAGATCTTCTGGTGCACAGG23(51)SEQIDNO:50的資料(i)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(xi〉SEQ工DNO:50的序歹!j描述GCAATGCAGGTCATAGTGAGC21(52)SEQIDNO:51的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iii)推定的是(iv)反義是(xi)SEQIDNO:51的序列描述TGGAGCATGGTGACGGGAATGCAGAAG27(53)SEQIDNO:52的資料U)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:52的序列描述GTGATGAGCAGGTCACTGAGCGCCAAG27(54)SEQIDNO:53的資料(i)序列特征(A)長度23個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:53的序列描述GCAATGCAGGCGCTTAACATTAC23(55)SEQIDNO:54的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:54的序歹U描述TTGGGTTACAATCTGAAGGGCA22(56)SEQIDNO:55的資料(i)序列特征(A)長度23個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:55的序歹lJ描述ACTCCGTGTCCAGCAGGACTCTG23(57)SEQ工DNO:56的資料(i)序列特征(A)長度24個堿基對(B)類型核酸(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是<xi)SEQIDNO:56的序列描述TGCGTGTTCCTGGACCCTCACGTG(58)SEQIDNO:57的資料(i)序列特征(A)長度29個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:57的序歹'J描述CAGGCCTTGGATTTTAATGTCAGGGATGG(59)SEQIDNO:58的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi〉SEQIDNO:58的序列描述GGAGAGTCAGCTCTGAAAGAATTCAGG(60)SEQIDNO:59的資料.(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(Xi)SEQIDNO:59的序列描述TGATGTGATGCCAGATACTAATAGCAC(61)SEQIDNO:60的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D〉拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:60的序列描述CCTGATTCATTTAGGTGAGATTGAGAC(62)SEQIDNO:61的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(Xi)SEQIDNO:61的序歹lJ描述GACAGGTACCTTGCCATCAAG(63)SEQIDNO:62的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:62的序歹U描述CTGCACAATGCCAGTGATAAGG(64)SEQIDNO:63的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(Xi)SEQIDNO:63的序歹ll描述CTGACTTCTTGTTCCTGGCAGCAGCGG(65)SEQIDNO:64的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:64的序列描述AGACCAGCCAGGGCACGCTGAAGAGTG(66)SEQIDNO:65的資料(i)序列特征(A)長度32個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:65的序列描述GATCMGCTTCCATCCTACTGAAACCATGGTC(67)SEQIDNO:66的資料(i)序列特征(A)長度35個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:66的序歹lj描述GATCAGATCTCAGTTCCAATATTCACACCACCGTC(68)SEQIDNO:67的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(i幻分子類型DNA(基因組的)(iv)反義否(xi)SEQ工DNO:67的序歹(J描述CTGGTGTGCTCCATGGCATCCC(69)SEQ工DNO:68的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:68的序歹U描述GTAAGCCTCCCAGAACGAGAGG(70)SEQIDNO:69的資料(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:69的序歹U描述CAGCGCAGGGTGAAGCCTGAGAGC(71)SEQIDNO:70的資料(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義是(xi)SEQIDNO:70的序歹!j描述GGCACCTGCTGTGACCTGTGCAGG(72)SEQIDNO:71的資料(i)序列特征(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:71的序歹ll描述GTCCTGCCACTTCGAGACATGG(73)SEQIDNO:72的資料(i)序列特征(A)長度23個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組)(iv)反義是(xi)SEQIDNO:72的序歹!j描述GAAACTTCTCTGCCCTTACCGTC(74)SEQIDNO:73的資料(i)序列特征(A)長度2S個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組的)(iv)反義否(xi)SEQIDNO:73的序列描述CCAACACCAGCATCCATGGCATCAAG2326(75)SEQIDNO:74的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓?fù)鋵W(xué)線形(ii)分子類型DNA(基因組)(iv)反義是(xi)SEQIDNO:74的序列描述GGAGAGTCAGCTCTGAAAGAATTCAGG278權(quán)利要求1.編碼人G蛋白偶聯(lián)受體的cDNA,其包含SEQ.ID.NO.7。2.由SEQ.ID.NO.:7所示的cDNA編碼的人G蛋白偶聯(lián)受體,其包含SEQ.ID.NO.:8。3.含有載體和SEQ.ID.NO.:7所示的cDNA的質(zhì)粒。4.含有權(quán)利要求3所述的質(zhì)粒的宿主細(xì)胞。全文摘要本申請是“與人G蛋白偶聯(lián)的孤兒受體”。本專利申請文件所公開的發(fā)明涉及跨膜受體;具體地講,涉及與人內(nèi)源G蛋白偶聯(lián)的孤兒受體。本發(fā)明公開了編碼人G蛋白偶聯(lián)受體的cDNA,及其表達(dá)質(zhì)粒和細(xì)胞。文檔編號C07K14/705GK101597608SQ200910133518公開日2009年12月9日申請日期1999年10月13日優(yōu)先權(quán)日1998年11月20日發(fā)明者陳若平申請人:阿瑞那制藥公司