專(zhuān)利名稱(chēng):魚(yú)類(lèi)肌肉生長(zhǎng)抑素mstn基因克隆及其基因打靶載體構(gòu)建的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物技術(shù)領(lǐng)域中的魚(yú)類(lèi)基因工程技術(shù),是一種能在魚(yú)類(lèi)遺傳改良中應(yīng)用的魚(yú)類(lèi)肌肉生長(zhǎng)抑制基因及其基因打靶載體。
背景技術(shù):
肌肉生長(zhǎng)抑素基因(myostatin,MSTN)是1997年發(fā)現(xiàn)的轉(zhuǎn)錄生長(zhǎng)因子(TGF-β)家族的一個(gè)成員(McPherron,等,1997,美國(guó)Johns Hopkins大學(xué)),對(duì)骨骼肌的發(fā)育和生長(zhǎng)具有負(fù)調(diào)控作用,該基因缺失會(huì)導(dǎo)致骨骼肌增生(McPherron,等,1997;Grobet等,2003,比利時(shí)Liège大學(xué))。在小鼠上研究發(fā)現(xiàn),通過(guò)基因敲除使MSTN基因C端生物活性區(qū)缺失的小鼠骨骼肌比普通野生小鼠增加了2-3倍。隨后,McPherron等(1997)發(fā)現(xiàn)雙肌牛中該基因發(fā)生突變,導(dǎo)致雙肌牛肌肉產(chǎn)量比普通牛增加了30%。由于MSTN基因?qū)∪馍L(zhǎng)具有負(fù)調(diào)控作用,因此受到廣泛關(guān)注,大量的哺乳動(dòng)物特別是家畜的MSTN基因已被克隆出來(lái),MSTN基因的功能及應(yīng)用研究也在大量進(jìn)行,目前,MSTN基因相關(guān)研究已成為分子生物學(xué)領(lǐng)域的研究熱點(diǎn)。
在魚(yú)類(lèi),到目前為止,僅有少數(shù)幾種魚(yú)類(lèi)的MSTN基因被克隆,包括溝鯰(Kocabas等,2002,美國(guó)奧本大學(xué));金鯛(Maccatrozzo等,2001,意大利Padova大學(xué));羅非魚(yú)(Rodgers等,2001,美國(guó)JohnsHopkins大學(xué))和虹鱒(Rescan等,2001法國(guó)魚(yú)類(lèi)生理實(shí)驗(yàn)室)。研究表明,魚(yú)類(lèi)MSTN基因的結(jié)構(gòu)和哺乳動(dòng)物MSTN結(jié)構(gòu)相似,都是由3個(gè)外顯子和2個(gè)內(nèi)含子所組成,外顯子和內(nèi)含子的邊界處通過(guò)嚴(yán)格的AT-GC連接,C末端是該基因的功能區(qū),具有高度的保守性,在此蛋白生物活性區(qū)域有一個(gè)4個(gè)氨基酸組成的RXXR的蛋白水解酶加工位點(diǎn),MSTN基因成熟區(qū)通過(guò)其中9個(gè)保守的半胱氨基酸形成二硫鍵,C末端的“半胱氨酸”結(jié)構(gòu)在所有TGF-β超家族中是保守的,對(duì)于MSTN基因的功能活性具有重要作用。體外表達(dá)分析顯示魚(yú)類(lèi)的MSTN基因表達(dá)不同于哺乳類(lèi)MSTN基因。目前在斑馬魚(yú)上通過(guò)反義核酸技術(shù)MSTN1轉(zhuǎn)錄本表明,敲除的胚胎發(fā)育明顯加快,通過(guò)表型觀察發(fā)現(xiàn)MSTN1敲除的斑馬魚(yú)身體尺寸增加,受精后20小時(shí)的敲除MSTN1胚胎在尺寸上和對(duì)照組受精后30小時(shí)的胚胎大小相似。通過(guò)雙鏈RNA干涉技術(shù)沉默MSTN轉(zhuǎn)錄本,表型觀察發(fā)現(xiàn),沉默MSTN基因的斑馬魚(yú)成體肌肉含量增加了39%-45%,導(dǎo)致了過(guò)度生長(zhǎng)。盡管反義核酸技術(shù)和雙鏈RNA干涉技術(shù)都證實(shí)了MSTN基因的功能,但反義核酸技術(shù)和雙鏈RNA干涉技術(shù)都無(wú)法產(chǎn)生穩(wěn)定突變的魚(yú)類(lèi)品系,如果通過(guò)基因打靶技術(shù)將某種魚(yú)類(lèi)的MSTN基因定點(diǎn)突變,產(chǎn)生穩(wěn)定遺傳的敲除MSTN的轉(zhuǎn)基因魚(yú),將會(huì)提高魚(yú)的肌肉產(chǎn)量和品質(zhì)。但有關(guān)魚(yú)類(lèi)MSTN基因同源重組載體構(gòu)建及其定點(diǎn)突變方面,目前國(guó)內(nèi)外未見(jiàn)報(bào)道。
發(fā)明內(nèi)容
本發(fā)明的目的是為了克隆魚(yú)類(lèi)MSTN基因組基因、弄清魚(yú)類(lèi)MSTN基因的結(jié)構(gòu)以及構(gòu)建魚(yú)類(lèi)MSTN基因打靶載體,為魚(yú)類(lèi)MSTN基因的功能分析及通過(guò)基因打靶途徑提高魚(yú)的肌肉含量和品質(zhì)提供基因材料和技術(shù)方法。本發(fā)明其技術(shù)內(nèi)容如下一、花鱸生長(zhǎng)抑素(MSTN)基因的克隆包括1、基因組DNA序列的獲得,2、蛋白氨基酸序列推測(cè)和分析,3、基因組結(jié)構(gòu)的分析;二、MSTN基因打靶載體的構(gòu)建包括1、同源長(zhǎng)片段和短片段的擴(kuò)增和連接,2、正選擇標(biāo)記基因neo片段的連接,3、負(fù)選擇標(biāo)記基因SVTK-tk基因的連接。
一、魚(yú)類(lèi)生長(zhǎng)抑素(MSTN)全長(zhǎng)基因的克隆魚(yú)類(lèi)生長(zhǎng)抑素(MSTN)基因的克隆包括基因組DNA序列的獲得、蛋白氨基酸序列的推測(cè)和分析、基因組結(jié)構(gòu)的分析。
1.基因組DNA序列的獲得用DNAStar軟件對(duì)GenBank中其它幾種魚(yú)類(lèi)的cDNA序列和DNA序列比對(duì),根據(jù)其保守性很高的區(qū)域設(shè)計(jì)了三對(duì)簡(jiǎn)并引物,擴(kuò)增并獲得了整個(gè)MSTN基因組編碼區(qū)序列,再通過(guò)已獲得的花鱸MSTN序列,設(shè)計(jì)特異引物,通過(guò)基因組步移技術(shù)擴(kuò)增出花鱸MSTN基因的5’和3’非編碼序列,得到了全長(zhǎng)的基因組序列。
2.蛋白氨基酸序列的推測(cè)和分析根據(jù)外顯子和內(nèi)含子交界處的特征GT…AG,分析基因各外顯子和內(nèi)含子位置,用EditSeq軟件分析ORF閱讀框和推測(cè)蛋白質(zhì)序列,用BioEdit軟件對(duì)蛋白質(zhì)序列進(jìn)行比對(duì)分析。將推測(cè)的蛋白質(zhì)序列與美國(guó)GENBANK序列數(shù)據(jù)庫(kù)中其他物種的MSTN蛋白序列進(jìn)行比對(duì),用BLASTX程序算出同源性。
3、基因組結(jié)構(gòu)的分析將基因組DNA序列和蛋白序列與美國(guó)GENBANK序列數(shù)據(jù)庫(kù)中已存的DNA序列進(jìn)行比對(duì),結(jié)構(gòu)分析表明該基因組DNA全長(zhǎng)4873bp,包括三個(gè)外顯子(分別為378bp、366bp、381bp),二個(gè)內(nèi)含子(454bp、758bp)及1170bp的5’非翻譯區(qū),1366bp的3’非翻譯區(qū)。在5’非翻譯區(qū)上發(fā)現(xiàn)了一個(gè)TATA框和7個(gè)肌肉特異性的E框。
二、MSTN基因打靶載體的構(gòu)建MSTN基因打靶載體的構(gòu)建采用正-負(fù)選擇策略設(shè)計(jì)同源重組打靶載體。包括長(zhǎng)片段和短片段的擴(kuò)增、長(zhǎng)片段和短片段的連接;正選擇基因neo的連接;負(fù)選擇基因tk基因的連接。最終成功的構(gòu)建了花鱸MSTN同源重組基因打靶載體。
1.同源長(zhǎng)片段和短片段的擴(kuò)增和連接根據(jù)測(cè)定出的花鱸MSTN全長(zhǎng)基因組的序列,設(shè)計(jì)一對(duì)含有適當(dāng)酶切位點(diǎn)(XbaI和BamHI)的特異引物,擴(kuò)增得到一個(gè)3.2KB的長(zhǎng)片段;再設(shè)計(jì)一對(duì)含有酶切位點(diǎn)(BamHI和SalI)的特異引物,擴(kuò)增得到一個(gè)1.5KB的短片段。這兩個(gè)片段用相應(yīng)的酶切,純化后,依次連接到相應(yīng)酶切的pBSII+KS載體上,經(jīng)篩選、酶切鑒定獲得重組載體p+MSTN3.2+MSTN1.5,進(jìn)一步經(jīng)測(cè)序證實(shí)為正確連接。
2.正選擇標(biāo)記基因neo片段的連接應(yīng)用SVTK-neo基因表達(dá)盒作為正選擇基因引入打靶載體,即將neo基因通過(guò)BamHI酶切,連接插入到長(zhǎng)片段和短片段之間,經(jīng)篩選、酶切鑒定獲得p+MSTN3.2+MSTN1.5+neo的重組載體。
3.負(fù)選擇標(biāo)記基因SVTK-tk基因的連接應(yīng)用SVTK-tk基因表達(dá)盒作為負(fù)選擇基因引入打靶載體,即將tk基因通過(guò)XbaI酶切,連接插入到長(zhǎng)片段的側(cè)翼,經(jīng)篩選、酶切鑒定獲得p+MSTN3.2+MSTN1.5+neo+tk的重組載體,如圖2所示。
本發(fā)明與已有技術(shù)對(duì)比其特點(diǎn)是本發(fā)明克隆了魚(yú)類(lèi)MSTN全長(zhǎng)基因,包括5‘端調(diào)控序列和3’端序列;弄清了該基因的全部序列及結(jié)構(gòu)特征,并首次構(gòu)建了魚(yú)類(lèi)MSTN基因打靶載體。可以用于魚(yú)類(lèi)基因打靶實(shí)驗(yàn)。本發(fā)明的技術(shù)方法可在其它魚(yú)類(lèi)上進(jìn)行應(yīng)用。
圖1花鱸MSTN基因和推導(dǎo)的氨基酸序列其中5’和3’非翻譯區(qū)以及內(nèi)含子序列用小寫(xiě)字母表示;外顯子和推定的氨基酸用大寫(xiě)字母表示,氨基酸位于相應(yīng)的密碼子下面,下劃線部分為微衛(wèi)星重復(fù)序列,TATA框和肌肉特異性E-框用黑體加下劃線表示。
圖2花鱸MSTN基因打靶載體
具體實(shí)施例方式下面以花鱸MSTN基因的克隆和基因打靶載體構(gòu)建為例,結(jié)合附圖,對(duì)本發(fā)明的技術(shù)內(nèi)容進(jìn)行詳細(xì)說(shuō)明。
本發(fā)明其技術(shù)內(nèi)容如下一、花鱸生長(zhǎng)抑素(MSTN)基因的克隆基因組DNA序列的擴(kuò)增、蛋白氨基酸序列的推測(cè)及比對(duì)、基因組結(jié)構(gòu)的分析。二、MSTN基因打靶載體的構(gòu)建包括MSTN基因的結(jié)構(gòu)分析、同源長(zhǎng)片段和短片段的克隆和連接;正選擇標(biāo)記基因neo片段的連接;負(fù)選擇標(biāo)記基因tk基因的連接。
一、花鱸生長(zhǎng)抑素(MSTN)基因的克隆1.DNA序列的擴(kuò)增和克隆用設(shè)計(jì)的三對(duì)引物(SP-MSTN15’-AATCCAAACCCAGTCCAGTCGC-3’,5’-ATCAGGCGGGAGATTTGCAGGA-3’;SP-MSTN25’-CTGCAAATCTCCCGCCTGATGCC-3’,5’-TCTTGCCGTAGATGATCTGCTC-3;SP-MSTN 35’-TGAAGACTTTGGCTGGGACTGGAT-3’,5’-CTTGAGGATTCCTGGTTTCACT-3’)特異擴(kuò)增出了花鱸MSTN基因的3個(gè)擴(kuò)增片段,回收純化后,連接測(cè)序,通過(guò)3個(gè)片段的重疊部分,將3個(gè)片段拼接起來(lái),獲得了整個(gè)編碼區(qū)的序列,再根據(jù)已測(cè)序的序列,設(shè)計(jì)了一對(duì)特異性的引物AP15’-CGCCTCTTGGTCGCTCAAAACTACTG-3’和AP25’-CCACATCCTTGTTGTCATCTCCCAGCACG-3’,通過(guò)基因組步移技術(shù)擴(kuò)出5’非翻譯區(qū),另一對(duì)特異性的引物S15’-TGGACCGTTGTGGATGCTCTTGAGTTG-3’和S25’-CAGAACACGGTGCAATAGAACCAGAGTAG-3’擴(kuò)出了3’非翻譯區(qū),獲得了一個(gè)全長(zhǎng)為4873bp的花鱸基因組序列(圖1),具有完整的編碼閱讀框,起始密碼子和終止密碼子。
2.蛋白氨基酸序列的推測(cè)及比對(duì)根據(jù)已經(jīng)擴(kuò)增的基因組序列,設(shè)計(jì)一對(duì)引物SPMSTN-5’5’-GCATCTGTCTCAGATTGTGCTGTATC-3’和SPMSTN-3’5’-TCAAGAGCATCCACAACGGTCCAC-3’,擴(kuò)增并測(cè)序了花鱸整個(gè)編碼的cDNA序列,推測(cè)出MSTN編碼的蛋白氨基酸序列,同時(shí)也證實(shí)了以上克隆的基因組序列的正確性。將cDNA和基因組DNA的序列與美國(guó)GENBANK序列數(shù)據(jù)庫(kù)中已存的DNA序列進(jìn)行比對(duì),用BLASTN和BLASTX程序計(jì)算我們獲得的cDNA克隆片段與GENBANK序列數(shù)據(jù)庫(kù)中已存的DNA序列的同源性。通過(guò)分析蛋白氨基酸序列,在C末端發(fā)現(xiàn)了9個(gè)保守的半胱氨基酸殘基和一個(gè)RVRR(與RXXR相匹配)的蛋白酶解加工位點(diǎn)。這9個(gè)保守的半胱氨基酸殘基提供二硫鍵形成位點(diǎn),對(duì)于MSTN蛋白活性功能的形成具有重要的作用。
3.DNA序列分析通過(guò)外顯子和內(nèi)含子交界處的特征GT…AG,以及GenBank中其他物種MSTN基因序列的特征,分析花鱸MSTN基因,結(jié)構(gòu)分析表明該基因組DNA全長(zhǎng)4873bp,包括三個(gè)外顯子(分別為378bp、366bp、381bp),二個(gè)內(nèi)含子(454bp、758bp)及1170bp的5’非翻譯區(qū),1366bp的3’非翻譯區(qū)。在5’非翻譯區(qū)上發(fā)現(xiàn)了一個(gè)TATA框和7個(gè)肌肉特異性的E框。
二、MSTN基因打靶載體的構(gòu)建1、同源長(zhǎng)片段和短片段的克隆和連接設(shè)計(jì)了二對(duì)引物,MSTN-N15`-ATCGGATCCATCATTGGCGGTTCATCAGTCCCT和MSTN-C15`-ATC GGTGGGTGTGCGGGTACTTCTG擴(kuò)增了一個(gè)3.2KB的長(zhǎng)片段,并在5’端引入BamHI酶切位點(diǎn),在3’末端引入XbaI酶切位點(diǎn)和一段終止序列。基因打靶載體引物設(shè)計(jì)另一對(duì)引物MSTN-N25`-ATCGTCGACGTCTCCCATCAACATGCTCTAC和MSTN-C25`-ATC CTCCTAATGGAAACAATGGCAT-3’擴(kuò)增了一個(gè)1.5KB的長(zhǎng)片段,在其5’端引入SalI酶切位點(diǎn),在3’末端引入BamHI酶切位點(diǎn)和一段終止序列(引入的酶切位點(diǎn)用單橫線表示,終止序列用雙橫線表示)。克隆獲得了預(yù)期大小的長(zhǎng)片段和短片段,通過(guò)相應(yīng)的酶切長(zhǎng)片段和短片段以及pBSII+KS,將長(zhǎng)片段和短片段依次連接到載體上,形成了p+MSTN3.2+MSTN1.5質(zhì)粒載體,并測(cè)序證實(shí)了MSTN長(zhǎng)片段和短片段為正確的連接。
2、正選擇標(biāo)記基因neo片段的連接應(yīng)用SVTK-neo基因表達(dá)盒作為正選擇基因引入打靶載體,即用BamHI酶切正選擇基因NEO基因以及已構(gòu)建p+MSTN3.2+MSTN1.5質(zhì)粒載體,將neo基因連接到p+MSTN3.2+MSTN1.5質(zhì)粒載體上,形成了p+MSTN3.2+MSTN1.5+neo的質(zhì)粒載體,經(jīng)酶切鑒定為正確插入的載體,體外擴(kuò)增,提取質(zhì)粒。
3、負(fù)選擇標(biāo)記基因SVTK-TK基因的連接應(yīng)用SVTK-tk基因表達(dá)盒作為負(fù)選擇基因引入打靶載體,即用XbaI酶切負(fù)選擇基因tk基因以及已構(gòu)建p+MSTN3.2+MSTN1.5+neo質(zhì)粒載體,將tk基因連接到p+MSTN3.2+MSTN1.5+neo的質(zhì)粒載體上,最終形成了完整的MSTN正-負(fù)選擇同源重組基因打靶載體p+MSTN3.2+MSTN1.5+neo+tk的質(zhì)粒,經(jīng)酶切鑒定為正確插入的載體,體外擴(kuò)增,提取質(zhì)粒。經(jīng)純化并用適合的酶將質(zhì)粒線性化后即可用于基因打靶實(shí)驗(yàn)。
序列表<110>中國(guó)水產(chǎn)科學(xué)院黃海水產(chǎn)研究所<120>魚(yú)類(lèi)肌肉生長(zhǎng)抑素(MSTN)基因<130>PatentIn version 3.1<160>1<170>PatentIn version 3.1<210>1<211>4873<212>DNA<213>sea perch<221>5′UTR<222>(1)..(1170)<221>exon 1<222>(1171)..(1548)<221>Intron 1<222>(1549)..(2002)<221>exon 2<222>(2003)..(2368)<221>Intron 2<222>(2369)..(3126)<221>exon 3<222>(3127)..(3507)<221>3′UTR<222>(3508)..(4873)<400>1gattactata gggcacgcgt ggtcgacggc ccgggctggt ctgtttgtcc agatgtctgt 60ctgtctggcc tttgatcatt ggcggttcat cagtccctgt gtgggctgct gtcaccggtg120ttttcagact gccacgcgtg gacgtcacac gtgggggagg taaaataaaa aaaaataaaa180ataaacgggc tctgtaaaat gatccaactt gtcaggttca gggtcactaa catgactctt240ggctgactgg aaagtgtttg atttttccca gtcttcagat cgtcaggtcg ccatgtcgcc300gctgtgctgc aggtgatggc ctccctgacg agagtgatgt cagcttacca cacgatggca360ctgtcttctc atgtgctaca accagatttg accagcaagg atttggacaa gtcctggaat420aaggactttt ctttattttt gctgtttttt gaataataat tatttccagt tttgactgat480cagcttctca gaggggaacc tggtctgacg ggacgacacc tccagaagga cttgacttca540ctgaataaaa ctgtaactct tagggttttt ttccctcaag gattaaatgt atttccacaa600
ccatgcagac acagttgcat ccatgtacct gtcaccacag acagttcatg tttggtgggc 660tgcctgcagt ctcattttaa agtgtattct ttattcacag cacaaagtat acatgacacc 720gcctatctat agcttttatt tcctaatacg caggataaat gctacattgt ttggttttaa 780taagttgcta taaattgaag cccatcagac tgttccatag gacagacagt ctggtctgcg 840cctctgcgct cattgcgcga tcactgtaag aaaagtgaat ttctccatct gtggacacgc 900tcagcacatg ctcacagcct ctaccccttt atggtttgac aacgagaaaa agttttcatg 960tcagtcggtt aaaattcatt gttccctgtc cagccaatca tagtttttga cgacacaaaa1020gaggctaaag ttggagtata aaaaggtgtg cgctaataaa gtatgatgcc tatcagtgtg1080ggacattaat ccaaacccag ttcagccgcg cacaggtcca gcacacacca agggatcttt1140tttcaaacca aacttcacac cttagagaca atg cgt ctg tct cag att gtg ctg 1194Met Arg Leu Ser Gln Ile Val Leu1 5tat ctg agc ttg ctg att gct ttg ggt cca gta gtt ttg agc gac caa 1242Tyr Leu Ser Leu Leu Ile Ala Leu Gly Pro Val Val Leu Ser Asp Gln10 15 20gag gcg cac cag cag ccg tcc gcc tcc agc ccc gtg gac acg gag cag 1290Glu Ala His Gln Gln Pro Ser Ala Ser Ser pro Val Asp Thr Glu Gln25 30 35 40tgc gcc acc tgc gag gtc cgg cag cag atc aaa acc atg cga tta aac 1338Cys Ala Thr Cys Glu Val Arg Gln Gln Ile Lys Thr Met Arg Leu Asn45 50 55gcg atc aaa tct cag att ctg agc aaa ctg cgg atg aaa gaa gct ccc 1386Ala Ile Lys Ser Gln Ile Leu Ser Lys Leu Arg Met Lys Glu Ala Pro60 65 70aat atc agc cga gat atc gtg aag cag ctc ctg ccc aag gcg ccg ccg 1434Asn Ile Ser Arg Asp Ile Val Lys Gln Leu Leu Pro Lys Ala Pro Pro75 80 85ctg cag cag ctt ctc gac cag tac gac gtg ctg gga gat gac aac aag 1482Leu Gln Gln Leu Leu Asp Gln Tyr Asp Val Leu Gly Asp Asp Asn Lys90 95 100gat gtg gtc atg gag gag gac gac gag cac gcc atc acg gag aca ata 1530Asp Val Val Met Glu Glu Asp Asp Glu His Ala Ile Thr Glu Thr Ile105 110 115 120atg atg atg gcc act gaa gtaagttttt atttcgcttt gttttctgga1578Met Met Met Ala Thr Glu125cgacgaaaag gaagcgctca gacgtctcca aactaggctt ttacgcacgg ggcagagcgc1638acgagagggg agggaggtgg gggggggcgc tttattttga caacatgtag ctttaccagc1698tcttgatatt ggaaatgtag atataccaac atcaccaaca tgtatacggt gtatgtgtgg1758gtcggtgcat ttcggcagat cagcgcgcct ggtgattacg cgcacggttt gtaaggtttt1818ctaaacgtta ttagcccact tccagagatc aaatgtcgtg tcagggatgt ttaatgacac1878cagtttattt cggtctgtaa atttcaatcg cacatggtca gtatacggag aacatagaga1938accttctctc tctctctctc tctctccctc tctctctctc cctctctctc tctctccagc1998cgag tcc gtc gtc cag qtg gat ggg gaa cca agc tgc tgc ttc ttc tcg 2047
Ser Val Val Gln Val Asp Gly Glu Pro Ser Cys Cys Phe Phe Ser130 135 140ttc act caa aag ttc cag gcc agt cgc ata gtc cgg gct cag ctc tgg 2095Phe Thr Gln Lys Phe Gln Ala Ser Arg Ile Val Arg Ala Gln Leu Trp145 150 155gtg cat ctg cgc ccg tcg gag gag gcg acc acg gtg ttc ctg caa atc 2143Val His Leu Arg Pro Ser Glu Glu Ala Thr Thr Val Phe Leu Gln Ile160 165 170tcc cgc ctg atg ccg gtc aca gac ggg agc ggg cac ata cgc atc cgc 2191Ser Arg Leu Met Pro Val Thr Asp Gly Ser Gly His Ile Arg Ile Arg175 180 185tcc ctg aag atc gac gtg aat gcc ggg gtc agc tct tgg caa agt ata 2239Ser Leu Lys Ile Asp Val Asn Ala Gly Val Ser Ser Trp Gln Ser Ile190 195 200 205gac gtc aag caa gtg ttg act gtg tgg ctg cgg cag ccg gag acc aac 2287Asp Val Lys Gln Val Leu Thr Val Trp Leu Arg Gln Pro Glu Thr Asn210 215 220tgg ggc atc gag att aac gcc ttc gat tcg agg gga aat gac ttg gcc 2335Trp Gly Ile Glu Ile Asn Ala Phe Asp Ser Arg Gly Asn Asp Leu Ala225 230 235gtg acc tcc gcg gag cca gga gag gaa gga ctg gtgagctgaa cctttatttt 2388Val Thr Ser Ala Glu Pro Gly Glu Glu Gly Leu240 245acattaaacc gaaaccttgt ggtcttaggg ttagttcatt atccgggact cctgtcctaa 2448tcaatatgac tgtaagtata agatgattat aagaactgga ccatcctgta agaaacaaaa 2508aatattttca cacccccagt gtctaattag gtttaaaaca gtattttgga ttatctgctg 2568tactgtactg gagccttcca gaggttttag tgtgcagaga ggctttgcag agtcagcagg 2628tggttaaaca ttcctgcaat caagatttaa gacttttgaa agcgattaat caacacagac 2688tccatgtagg cgcacacctg catttggagc aatgcccagt ctacaataac cccaaatcaa 2748actgcttgat tacataaaag ttcacctgcc ccacattcct taaagtattc tgtgtgactg 2808tgcaaatcag agtaattgcc tgcacacaca cacatacaca cacactgcta ctatcaatga 2868caagcactta tcatgcggct caaatactgg cactgggctc tgaggcaatt agaataccta 2928gatggctgtg gttaaccaac cgtcagatga ttcaatttct gtaaaactca aagtttcata 2988atattatcgt gccatgtttg aaaaccagct gccacaaggt cgagggcacc ggagatgtaa 3048accgaatgct gtcatccgcc tcctttttgc aaaaccagct atttctccaa agtgttcaca 3108cgctgtttgt cattgcag caa gcg ttc atg gag gtg aag gtc tcg gag ggc 3159Gln Ala Phe Met Glu Val Lys Val Ser Glu Gly250 255ccc aag cgt gcc agg aga gac tcg ggc ctg gac tgt gac gag aac tct 3207Pro Lys Arg Ala Arg Arg Asp Ser Gly Leu Asp Cys Asp Glu Asn Ser260 265 270 275cca gag tcc cgg tgc tgc cgc tat ccg ctc act gtg gac ttt gaa act 3255Pro Glu Ser Arg Cys Cys Arg Tyr Pro Leu Thr Val Asp Phe Glu Thr280 285 290ttg gct ggg act gga tta ttg ccc caa agc ggc tac aag gcc aac tat 3303Leu Ala Gly Thr Gly Leu Leu Pro Gln Ser Gly Tyr Lys Ala Asn Tyr295 300 305
tgc tcc ggg gag tgt gag tac atg cac ttg cag aag tac ccg cac acc 3351Cys Ser Gly Glu Cys Glu Tyr Met His Leu Gln Lys Tyr Pro His Thr310 315 320cac ctg gtg aac aag gcc aac ccc aga ggg acc gcg ggc ccc tgc tgt 3399His Leu Val Asn Lys Ala Asn Pro Arg Gly Thr Ala Gly Pro Cys Cys325 330 335acc cct acc aag atg tct ccc atc aac atg ctc tac ttt aac cga aaa 3447Thr Pro Thr Lys Met Ser Pro Ile Asn Met Leu Tyr Phe Asn Arg Lys340 345 350 355gag cag atc atc tac ggc aag atc ccc tcc atg gtg gtg gac cgt tgt 3495Glu Gln Ile Ile Tyr Gly Lys Ile Pro Ser Met Val Val Asp Arg Cys360 365 370gga tgc tct tga gtt gggtcgg agaccctggc gagggagagg ggaggacgga3547Gly Cys Serggggctgcgg cccagtccgg cctccaactt cagacttttt gacacaacca atccaccagt 3607tccagtgctt tcctgcagaa cacggtgcaa tagaaccaga gtagaggcca caaacagccc 3667gaccttcccg cagggcagcg ctttcacaac cggcatagca cttttttttt tctctcctcc 3727agtgaaatct tagccaaaga ggcttgaagt cagatggatg caggaacaca catacacaca 3787catgctggac cttggagtga atgtagacag aaattatcaa agttatccaa aaactttctt 3847tctccttttg tctcggtgtt ctgtgctctg tccatttata caaacatgcc gacagattat 3907actcgtacgc catctactcc actccactcc attcgtagcc aacatacaag ctattacact 3967ttctgctaag ctatatgttt gtgataatca tttttcaaga tatgttttca gagtgaaacc 4027aggaatcctc atggactttt tgaaagggct tggaaaaaca cagctggaga ctctttggag 4087tgatacatca cactggtgga acatgcgtta gtacacataa atttcatagg aggcgatgag 4147gagatgaaat ctggctgcac ggggaacccc ttagtcaccg ccacttcact actgcaattt 4207ataaaaccca gctgaaattt gcaacattaa ttcatttgga aaatctgaca cacgtcgtta 4267tctttcctgt atcagatcaa actttaagtg ctaatttgtg gggttttttt attaacaatt 4327ctgagagcgt gggagtaaaa tcctacatgc aggtggtgac gtggtagtcg atcactccgg 4387agatcccatg gaggcacaaa tgttccgcca gggcgaagta ccactttagg tcttgacagg 4447tctccatgta ctacatgcca tacattcacg caacaacata cccaaactga ggagcacttc 4507gtgcttggtc ataatctcca ctatccaaca aaaacagcct gacctgcccg atacacttga 4567attattctga ttgtaaattc acattactgg acagaaggac ttgaactgaa ggcacaatga 4627atgcagccta caaatgaaaa atgtgtttaa gacagaggaa actggattgt cgaggtgaat 4687gaatgttgag atcatgctta aactctgtct tacaaacaac acagtttgca ctatggcaca 4747ccaatagaaa gaattggttg ctacaaaagt tgtaaaaact gattttgata tgtttgctaa 4807tttgtattgt atacatatgc cattgtttcc attaggagtt gcctttctaa accactgttg 4867gtaata 487權(quán)利要求
1.一種魚(yú)類(lèi)肌肉生長(zhǎng)抑素MSTN基因的克隆,其特征在于它的克隆方法,包括1、基因組DNA序列的獲得,2、蛋白氨基酸序列推測(cè)和分析,3、基因組結(jié)構(gòu)的分析;1)、基因組DNA序列的獲得用DNAStar軟件對(duì)GenBank中其它幾種魚(yú)類(lèi)的cDNA序列和DNA序列比對(duì),根據(jù)其保守性很高的區(qū)域設(shè)計(jì)了三對(duì)簡(jiǎn)并引物,擴(kuò)增并獲得了花鱸整個(gè)MSTN基因組編碼區(qū)序列,再通過(guò)已獲得的花鱸MSTN序列,設(shè)計(jì)特異引物,通過(guò)基因組步移技術(shù)擴(kuò)增出花鱸MSTN基因的5’和3’非編碼序列,得到了全長(zhǎng)的基因組序列;2)、蛋白氨基酸序列的推測(cè)和分析根據(jù)外顯子和內(nèi)含子交界處的特征GT...AG,分析基因各外顯子和內(nèi)含子位置,用Ed it Seq軟件分析ORF閱讀框和推測(cè)蛋白質(zhì)序列,用BioEdit軟件對(duì)蛋白質(zhì)序列進(jìn)行比對(duì)分析;將推測(cè)的蛋白質(zhì)序列與美國(guó)GENBANK序列數(shù)據(jù)庫(kù)中其他物種的MSTN蛋白序列進(jìn)行比對(duì),用BLASTX程序算出同源性;3)、基因組結(jié)構(gòu)的分析將基因組DNA序列和蛋白序列與美國(guó)GENBANK序列數(shù)據(jù)庫(kù)中已存的DNA序列進(jìn)行比對(duì),結(jié)構(gòu)分析表明該基因組DNA全長(zhǎng)4873bp,包括長(zhǎng)度分別為378bp、366bp、381bp的三個(gè)外顯子,長(zhǎng)度分別為454bp和758bp的二個(gè)內(nèi)含子及1170bp的5’非翻譯區(qū)和1366bp的3’非翻譯區(qū);在5’非翻譯區(qū)上發(fā)現(xiàn)了一個(gè)TATA框和7個(gè)肌肉特異性的E框。
2.根據(jù)權(quán)利要求1所述的魚(yú)類(lèi)肌肉生長(zhǎng)抑素MSTN基因的克隆,其特征在于所述的魚(yú)類(lèi)花鱸DNA全長(zhǎng)基因組序列為gattactatagggcacgcgtggtcgacggcccgggctggtctgtttgtccagatgtctgtctgtctggcctttgatcattggcggttcatcagtccctgt100E-boxgtgggctgctgtcaccggtgttttcagactgccacgcgtggacgtcacacgtgggggaggtaaaataaaaaaaaataaaaataaacgggctctgtaaaat200E-boxgatccaacttgtcaggttcagggtcactaacatgactcttggctgactggaaagtgtttgatttttcccagtcttcagatcgtcaggtcgccatgtcgcc 300gctgtgctgcaggtgatggcctccctgacgagagtgatgtcagcttaccacacgatggcactgtcttctcatgtgctacaaccagatttgaccagcaagg 400E-box E-boxatttggacaagtcctggaataaggacttttctttatttttgctgttttttgaataataattatttccagttttgactgatcagcttctcagaggggaacc 500tggtctgacgggacgacacctccagaaggacttgacttcactgaataaaactgtaactcttagggtttttttccctcaaggattaaatgtatttccacaa 600ccatgcagacacagttgcatccatgtacctgtcaccacagacagttcatgtttggtgggctgcctgcagtctcattttaaagtgtattctttattcacag700E-boxcacaaagtatacatgacaccgcctatctatagcttttatttcctaatacgcaggataaatgctacattgtttggttttaataagttgctataaattgaag 800cccatcagactgttccataggacagacagtctggtctgcgcctctgcgctcattgcgcgatcactgtaagaaaagtgaatttctccatctgtggacacgc900E-boxtcagcacatgctcacagcctctacccctttatggtttgacaacgagaaaaagttttcatgtcagtcggttaaaattcattgttccctgtccagccaatca1000E-boxtagtttttgacgacacaaaagaggctaaagttggagtataaaaaggtgtgcgctaataaagtatgatgcctatcagtgtgggacattaatccaaacccag1100TATA boxttcagccgcgcacaggtccagcacacaccaagggatcttttttcaaaccaaacttcacaccttagagacaATGCATCTGTCTCAGATTGTGCTGTATCTG 1200M H L S Q I V L Y L 10AGCTTGCTGATTGCTTTGGGTCCAGTAGTTTTGAGCGACCAAGAGGCGCACCAGCAGCCGTCCGCCTCCAGCCCCGTGGACACGGAGCAGTGCGCCACCT 1300S L L I A L G P V V L S D Q E A H Q Q P S A S S P V D T E Q C A T43GCGAGGTCCGGCAGCAGATCAAAACCATGCGATTAAACGCGATCAAATCTCAGATTCTGAGCAAACTGCGGATGAAAGAAGCTCCCAATATCAGCCGAGA 1400C E V R Q Q I K T M R L N A I K S Q I L S K L R M K E A P N I S R D 77TATCGTGAAGCAGCTCCTGCCCAAGGCGCCGCCGCTGCAGCAGCTTCTCGACCAGTACGACGTGCTGGGAGATGACAACAAGGATGTGGTCATGGAGGAG 1500I V K Q L L P K A P P L Q Q L L D Q Y D V L G D D N K D V V M E E 110GACGACGAGCACGCCATCACGGAGACAATAATGATGATGGCCACTGAAgtaagtttttatttcgctttgttttctggacgacgaaaaggaagcgctcaga 1600D D E H A I T E T I M M M A T E 126cgtctccaaactaggcttttacgcacggggcagagcgcacgagaggggagggaggtgggggggggcgctttattttgacaacatgtagctttaccagctc 1700ttgatattggaaatgtagatataccaacatcaccaacatgtatacggtgtatgtgtgggtcggtgcatttcggcagatcagcgcgcctggtgaLtacgcg 1800cacggtttgtaaggttttctaaacgttattagcccacttccagagatcaaatgtcgtgtcagggatgtttaatgacaccagtttatttcggtctgtaaat 1900ttcaatcgcacatggtcagtatacggagaacatagagaaccttctctctctctctctctctctccctctctctctctccctctctctctctctccagccg2000agTCCGTCGTCCAGGTGGATGGGGAACCAAGCTGCTGCTTCTTCTCGTTCACTCAAAAGTTCCAGGCCAGTCGCATAGTCCGGGCTCAGCTCTGGGTGCA 2100S V V Q V D G E P S C C F F S F T Q K F Q A S R I V R A Q L W V H 159TCTGCGCCCGTCGGAGGAGGCGACCACGGTGTTCCTGCAAATCTCCCGCCTGATGCCGGTCACAGACGGGAGCGGGCACATACGCATCCGCTCCCTGAAG 2200L R P S E E A T T V F L Q I S R L M P V T D G S G H I R I R S L K 192ATCGACGTGAATGCCGGGGTCAGCTCTTGGCAAAGTATAGACGTCAAGCAAGTGTTGACTGTGTGGCTGCGGCAGCCGGAGACCAACTGGGGCATCGAGA 2300I D V N A G V S S W Q S I D V K Q V L T V W L R Q P E T N W G I E225TTAACGCCTTCGATTCGAGGGGAAATGACTTGGCCGTGACCTCCGCGGAGCCAGGAGAGGAAGGACTGgtgagctgaacctttattttacattaaaccga 2400I N A F D S R G N D L A V T S A E P G E E G L 248aaccttgtggtcttagggttagttcattatccgggactcctgtcctaatcaatatgactgtaagtataagatgattataagaactggaccatcctgtaag 2500aaacaaaaaatattttcacacccccagtgtctaattaggtttaaaacagtattttggattatctgctgtactgtactggagccttccagaggttttagtg 2600tgcagagaggctttgcagagtcagcaggtggttaaacattcctgcaatcaagatttaagacttttgaaagcgattaatcaacacagactccatgtaggcg 2700cacacctgcatttggagcaatgcccagtctacaataaccccaaatcaaactgcttgattacataaaagttcacctgccccacattccttaaagtattctg 2800tgtgactgtgcaaatcagagtaattgcctgcacacacacacatacacacacactgctactatcaatgacaagcacttatcatgcggctcaaatatggtta2900ctggcactgggctctgaggcaattagaatacctagatggctgaccaaccgtcagatgattcaatttctgtaaaactcaaagtttcataatattatcgtgc 3000catgtttgaaaaccagctgccacaaggtcgagggcaccggagatgtaaaccgaatgctgtcatccgcctcctttttgcaaaaccagctatttctccaaag 3100tgttcacacgctgtttgtcattgcagCAAGCGTTCATGGAGGTGAAGGTCTCGGAGGGCCCCAAGCGTGCCAGGAGAGACTCGGGCCTGGACTGTGACGA 3200Q A F M E V K V S E G P K R A R R D S G L D C D E 273GAACTCTCCAGAGTCCCGGTGCTGCCGCTATCCGCTCACTGTGGACTTTGAAACTTTGGCTGGGACTGGATTATTGCCCCAAAGCGGCTACAAGGCCAAC 3300N S P E S R C C R Y P L T V D F E T L A G T G L L P Q S G Y K A N 306TATTGCTCCGGGGAGTGTGAGTACATGCACTTGCAGAAGTACCCGCACACCCACCTGGTGAACAAGGCCAACCCCAGAGGGACCGCGGGCCCCTGCTGTA 3400Y C S G E C E Y M H L Q K Y P H T H L V N K A N P R G T A G P C C339CCCCTACCAAGATGTCTCCCATCAACATGCTCTACTTTAACCGAAAAGAGCAGATCATCTACGGCAAGATCCCCTCCATGGTGGTGGACCGTTGTGGATG 3500T P T K M S P I N M L Y F N R K E Q I I Y G K I P S M V V D R C G C 373CTCTTGAgttgggtcggagaccctggcgagggagaggggaggacggaggggctgcggcccagtccggcctccaacttcagactttttgacacaaccaatc 3600S ★ 374caccagttccagtgctttcctgcagaacacggtgcaatagaaccagagtagaggccacaaacagcccgaccttcccgcagggcagcgctttcacaaccgg 3700catagcacttttttttttctctcctccagtgaaatcttagccaaagaggcttgaagtcagatggatgcaggaacacacatacacacacatgctggacctt3800ggagtgaatgtagacagaaattatcaaagttatccaaaaactttctttctccttttgtctcggtgttctgtgctctgtccatttatacaaacatgccgac 3900agattatactcgtacgccatctactccactccactccattcgtagccaacatacaagctattacactttctgctaagctatatgtttgtgataatcattt 4000ttcaagatatgttttcagagtgaaaccaggaatcctcatggactttttgaaagggcttggaaaaacacagctggagactctttggagtgatacatcacac 4100tggtggaacatgcgttagtacacataaatttcataggaggcgatgaggagatgaaatctggctgcacggggaaccccttagtcaccgccacttcactact 4200gcaatttataaaacccagctgaaatttgcaacattaattcatttggaaaatctgacacacgtcgttatctttcctgtatcagatcaaactttaagtgcta 4300atttgtggggtttttttattaacaattctgagagcgtgggagtaaaatcctacatgcaggtggtgacgtggtagtcgatcactccggagatcccatggag 4400gcacaaatgttccgccagggcgaagtaccactttaggtcttgacaggtctccatgtactacatgccatacattcacgcaacaacatacccaaactgagga 4500gcacttcgtgcttggtcataatctccactatccaacaaaaacagcctgacctgcccgatacacttgaattattctgattgtaaattcacattactggaca 4600gaaggacttgaactgaaggcacaatgaatgcagcctacaaatgaaaaatgtgtttaagacagaggaaactggattgtcgaggtgaatgaatgttgagatc 4700atgcttaaactctgtcttacaaacaacacagtttgcactatggcacaccaatagaaagaattggttgctacaaaagttgtaaaaactgattttgatatgt 4800ttgctaatttgtattgtatacatatgccattgtttccattaggagttgcctttctaaaccactgttggtaata 4873。
3.一種魚(yú)類(lèi)肌肉生長(zhǎng)抑素MSTN基因打靶載體的構(gòu)建,其特征在于它的方法,包括1、同源長(zhǎng)片段和短片段的擴(kuò)增和連接,2、正選擇標(biāo)記基因neo片段的連接,3、負(fù)選擇標(biāo)記基因SVTK-tk基因的連接;1)、同源長(zhǎng)片段和短片段的擴(kuò)增和連接根據(jù)測(cè)定出的花鱸MSTN全長(zhǎng)基因組的序列,設(shè)計(jì)一對(duì)含有適當(dāng)酶切位點(diǎn)(XbaI和BamHI)的特異引物,擴(kuò)增得到一個(gè)3.2KB的長(zhǎng)片段;再設(shè)計(jì)一對(duì)含有酶切位點(diǎn)(BamHI和SalI)的特異引物,擴(kuò)增得到一個(gè)1.5KB的短片段。這兩個(gè)片段用相應(yīng)的酶切,純化后,依次連接到相應(yīng)酶切的pBSII+KS載體上,經(jīng)篩選、酶切鑒定獲得重組載體p+MSTN3.2+MSTN1.5,進(jìn)一步經(jīng)測(cè)序證實(shí)為正確連接;2)、正選擇標(biāo)記基因neo片段的連接應(yīng)用SVTK-neo基因表達(dá)盒作為正選擇基因引入打靶載體,即將neo基因通過(guò)BamHI酶切,連接插入到長(zhǎng)片段和短片段之間,經(jīng)篩選、酶切鑒定獲得p+MSTN3.2+MSTN1.5+neo的重組載體;3)、負(fù)選擇標(biāo)記基因SVTK-tk基因的連接應(yīng)用SVTK-tk基因表達(dá)盒作為負(fù)選擇基因引入打靶載體,即將tk基因通過(guò)XbaI酶切,連接插入到長(zhǎng)片段的側(cè)翼,經(jīng)篩選、酶切鑒定獲得p+MSTN3.2+MSTN1.5+neo+tk的重組載體。
全文摘要
一種魚(yú)類(lèi)肌肉生長(zhǎng)抑素MSTN基因及其基因打靶載體,它的方法是分離克隆了花鱸MSTN基因,其全長(zhǎng)為4873bp,包括3個(gè)外顯子,2個(gè)內(nèi)含子,5’調(diào)控序列和非翻譯區(qū)以及3’非翻譯區(qū)。根據(jù)測(cè)定出的花鱸MSTN基因序列,設(shè)計(jì)引物,擴(kuò)增得到該基因的一個(gè)3.2KB的長(zhǎng)片段和一個(gè)1.5KB的短片段,將這兩個(gè)片段依次連接到pBSII
文檔編號(hào)C12Q1/68GK1831136SQ200510104768
公開(kāi)日2006年9月13日 申請(qǐng)日期2005年12月30日 優(yōu)先權(quán)日2005年12月30日
發(fā)明者陳松林, 葉寒青, 沙珍霞 申請(qǐng)人:中國(guó)水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所