本發(fā)明涉及生物科學領(lǐng)域,具體涉及一種簡便、高效且通用的植物葉綠體基因組測序方法。
背景技術(shù):
葉綠體是綠色植物細胞內(nèi)所特有的細胞器,是細胞進行光合作用的場所,是一切能量的最初來源。葉綠體擁有自身的DNA和遺傳體系,與生物進化與及細胞起源有很密切關(guān)系,葉綠體基因組是分子進化、系統(tǒng)發(fā)育和分子標記領(lǐng)域的重要研究對象,而獲得目的生物的葉綠體基因組全序列,則成為該領(lǐng)域研究人員的首要目標。傳統(tǒng)的植物葉綠體基因組測序通常采用通用引物長鏈PCR或是葉綠體基因組文庫的葉綠體基因組測序策略,一般都要求大量新鮮材料、提取較高純度的葉綠體DNA,操作步驟多,流程復雜,周期長,而且分離高純度的葉綠體DNA需要根據(jù)不同植物物種的特性優(yōu)化體系,難度較大,通用性差,往往成為葉綠體基因組測序的限制因素。
技術(shù)實現(xiàn)要素:
為解決上述問題,本發(fā)明提供了一種簡便、高效且通用的植物葉綠體基因組測序方法。
為實現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案為:
一種簡便、高效且通用的植物葉綠體基因組測序方法,包括如下步驟:
S1、直接分離、純化植物葉片的基因組DNA
為保證基因組DNA有足夠的葉綠體DNA,將植株在強光下曝光2天后,選擇較深綠色的葉片100mg,利用常規(guī)微量DNA提取方法(如CTAB)提取葉片的基因組DNA(不用預(yù)先分離葉綠體,再提取葉綠體DNA等繁瑣的實驗步驟),保存于低溫備用;
S2、基因組DNA的高通量文庫構(gòu)建及測序
取上述提取的基因組DNA 5ug,采用超聲波進行物理隨機打斷或者dsDNA水解酶進行酶切,然后用MinEITte PCR回收試劑盒(Qiagen,德國)回收片段化的葉綠體DNA,再將片段化的DNA末端補齊,并加上測序接頭,用MinElute PCR回收試劑盒回收加上接頭的DNA,電泳并利用膠回收試劑盒(Tiangen,China)回收200-500bp的片段,PCR擴增回收片段構(gòu)建測序文庫;測序文庫構(gòu)建和測序反應(yīng)采用IIITmina公司的標準程序(IIIumina,USA),測序平臺為IIIumina Hiseq4000,文庫大小為300bp,測序策略為PE150(測序平臺和策略可隨意調(diào)整,適用于任意高通量測序平臺);
S3、測序數(shù)據(jù)的預(yù)處理
測序后采用IIIumina HCS 1.1軟件進行測序圖像的轉(zhuǎn)換及質(zhì)量值計算,將圖像信息轉(zhuǎn)變?yōu)樾蛄行畔?,然后去除載體序列、低質(zhì)量序列獲得可用于候選分析的測序數(shù)據(jù);然后從NCBI下載其所收錄的所有植物葉綠體基因組序列(ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plastid)作為參考序列,將獲得的測序數(shù)據(jù)利用botwie軟件進行基因組映射,具體命令為bowtie2--al-conc alconc--un-conc unconc--un unpaired--al aligned-x all_plant_chloroplast_sequence-1 clean_data_P1-2 clean_data_P2-sout.sam,將能比對上參考基因組的左右兩端序列分別放入到mapped_reads_p1和mapped_reads_p2文件中,用于候選的葉綠體基因組組裝(數(shù)據(jù)分析標準化);
S4、葉綠體基因組的組裝和拼接
對上述步驟得到mapped reads數(shù)據(jù)集,利用soapdenovo軟件對得到的reads進行從頭拼裝得到序列contigs,然后利用Pair-end關(guān)系對contigs進行連接,再用gapcloser進行補洞,得到scaffold序列,然后再用所有mapped reads映射(mapping)所有scaffold,再一次填補空缺(gap)位置;同時,選擇與目標物種近緣關(guān)系最近的已測序的葉綠體為參考,利用MAQ軟件將mapped reads對參考基因組進行映射(mapping),得到一條一致序列(Consensus sequence)。然后利用blat工具將拼接得到的scaffold序列按照參考基因組進行排序,空缺區(qū)域用consensus序列對應(yīng)位置填補,得到葉綠體基因組的草圖;最后,再用所有mapped reads映射(mapping)草圖,補可能的空缺位置,最終得到葉綠體基因組精細圖;(采用高通量測序可以十分經(jīng)濟的方式獲得超高深度覆蓋度的測序結(jié)果,拼接操作十分簡單而且準確度高)。
S5、葉綠體基因組的驗證和評估
首先,將組裝獲得的葉綠體基因組與多個近緣或者同一科的不同葉綠體基因組進行多序列比對,鑒定基因組的變異熱點區(qū)域,判斷可能出現(xiàn)拼接錯誤的位置;然后,根據(jù)拼接得到的葉綠體基因組,隨機選擇4-5處序列設(shè)計引物,重點針對可能出現(xiàn)錯誤的位置,PCR擴增后sanger測序,然后利用ClustalW軟件將測序結(jié)果與拼接的葉綠體基因組序列進行比對,根據(jù)比對結(jié)果驗證拼接的準確性和可靠性;
S6、葉綠體基因組的利用
利用在線分析軟件DOGMA
(http://phylocluster.biosci.Ttexas.edu/dogma/)進行葉綠體的注釋;利用MAUVE軟件分析葉綠體基因組的結(jié)構(gòu)差異,利用采用mVISTA工具對分析不同葉綠體全基因組的序列差異并尋找潛在的候選分子進化分析的位點;采用MEGA和PAML進行系統(tǒng)進化和分子選擇分析。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
提供了簡便、快速、高效、經(jīng)濟且通用的植物葉綠體基因組測序方法,為大規(guī)模開展植物葉綠體基因組測序奠定了基礎(chǔ),將極大地加速植物葉綠體的相關(guān)研究工作;不用分離、純化葉綠體DNA而直接采用普通方法提取的基因組DNA作為模板,大大提高了方法的效率和通用性;不用復雜的PCR產(chǎn)物測序及克隆片段的拼接組裝,直接利用高覆蓋度測序后得到的reads從頭拼裝,大大改善了組裝效果,減少了試驗步驟,簡化了試驗流程,簡便、快捷、準確且高效。
附圖說明
圖1為本發(fā)明實施例的流程圖。
圖2為本發(fā)明實施例中紫莖澤蘭基因組DNA的分離純化圖;
圖中:1,2為紫莖澤蘭基因組DNA;M為分子量標準。
具體實施方式
為了使本發(fā)明的目的及優(yōu)點更加清楚明白,以下結(jié)合實施例對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
如圖1所示,本發(fā)明實施例提供了一種簡便、高效且通用的植物葉綠體基因組測序方法,包括如下步驟:
S1、直接分離、純化植物葉片的基因組DNA
為保證基因組DNA有足夠的葉綠體DNA,將植株在強光下曝光2天后,選擇較深綠色的葉片100mg,利用常規(guī)微量DNA提取方法(如CTAB)提取葉片的基因組DNA,保存于低溫備用;
S2、基因組DNA的高通量文庫構(gòu)建及測序
取上述提取的基因組DNA 5ug,采用超聲波進行物理隨機打斷或者dsDNA水解酶進行酶切,然后用MinEITte PCR回收試劑盒(Qiagen,德國)回收片段化的葉綠體DNA,再將片段化的DNA末端補齊,并加上測序接頭,用MinElute PCR回收試劑盒回收加上接頭的DNA,電泳并利用膠回收試劑盒(Tiangen,China)回收200-500bp的片段,PCR擴增回收片段構(gòu)建測序文庫;測序文庫構(gòu)建和測序反應(yīng)采用IIITmina公司的標準程序(IIIumina,USA),測序平臺為IIIumina Hiseq4000,文庫大小為300bp,測序策略為PE150;
S3、測序數(shù)據(jù)的預(yù)處理
測序后采用IIIumina HCS 1.1軟件進行測序圖像的轉(zhuǎn)換及質(zhì)量值計算,將圖像信息轉(zhuǎn)變?yōu)樾蛄行畔ⅲ缓笕コd體序列、低質(zhì)量序列獲得可用于候選分析的測序數(shù)據(jù);然后從NCBI下載其所收錄的所有植物葉綠體基因組序列(ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plastid)作為參考序列,將獲得的測序數(shù)據(jù)利用botwie軟件進行基因組映射,具體命令為bowtie2--al-conc alconc--un-conc unconc--un unpaired--al aligned-x all_plant_chloroplast_sequence-1 clean_data_P1-2 clean_data_P2-sout.sam,將能比對上參考基因組的左右兩端序列分別放入到mapped_reads_p1和mapped_reads_p2文件中,用于候選的葉綠體基因組組裝;
S4、葉綠體基因組的組裝和拼接
對上述步驟得到mapped reads數(shù)據(jù)集,利用soapdenovo軟件對得到的reads進行從頭拼裝得到序列contigs,然后利用Pair-end關(guān)系對contigs進行連接,再用gapcloser進行補洞,得到scaffold序列,然后再用所有mapped reads映射(mapping)所有scaffold,再一次填補空缺(gap)位置;同時,選擇與目標物種近緣關(guān)系最近的已測序的葉綠體為參考,利用MAQ軟件將mapped reads對參考基因組進行映射(mapping),得到一條一致序列(Consensus sequence)。然后利用blat工具將拼接得到的scaffold序列按照參考基因組進行排序,空缺區(qū)域用consensus序列對應(yīng)位置填補,得到葉綠體基因組的草圖;最后,再用所有mapped reads映射(mapping)草圖,補可能的空缺位置,最終得到葉綠體基因組精細圖;
S5、葉綠體基因組的驗證和評估
首先,將組裝獲得的葉綠體基因組與多個近緣或者同一科的不同葉綠體基因組進行多序列比對,鑒定基因組的變異熱點區(qū)域,判斷可能出現(xiàn)拼接錯誤的位置;然后,根據(jù)拼接得到的葉綠體基因組,隨機選擇4-5處序列設(shè)計引物,重點針對可能出現(xiàn)錯誤的位置,PCR擴增后sanger測序,然后利用ClustalW軟件將測序結(jié)果與拼接的葉綠體基因組序列進行比對,根據(jù)比對結(jié)果驗證拼接的準確性和可靠性;
S6、葉綠體基因組的利用
利用在線分析軟件DOGMA
(http://phylocluster.biosci.Ttexas.edu/dogma/)進行葉綠體的注釋;利用MAUVE軟件分析葉綠體基因組的結(jié)構(gòu)差異,利用采用mVISTA工具對分析不同葉綠體全基因組的序列差異并尋找潛在的候選分子進化分析的位點;采用MEGA和PAML進行系統(tǒng)進化和分子選擇分析。
實施例
紫莖澤蘭葉綠體基因組的測序
紫莖澤蘭基因組大小約為1.6g,我們以強光下曝光2-3天的紫莖澤蘭深綠色的葉片提取基因組DNA,然后去提取的DNA 5ug構(gòu)建Solexa測序文庫,然后采用Hiseq2000測序平臺,PE100進行測序,測序數(shù)據(jù)10G;然后從NCBI下載其所收錄的所有植物葉綠體基因組序列(ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plastid)作為參考序列,然后將高通量測序獲得的數(shù)據(jù),利用botwie軟件進行映射(mapping),將能夠mapping上的reads放入一個新的文件中,最終得到mapped reads數(shù)據(jù)集,P1和P2共計約800Mb的數(shù)據(jù),然后利用soapdenovo軟件對得到的reads進行從頭拼裝得到序列contigs,共得到3條scaffold和13條contigs,最長的序列長度達到了80853bp;同時,以紫莖澤蘭的菊科近緣種向日葵葉綠體基因組(NC007977)為參考,利用MAQ軟件進行比對,得到長度為151104bp的consensus序列;將上述得到的scaffold和contigs,利用blat工具將其與參考基因組進行對比,并根據(jù)參考基因組的對比位置將拼接片段排序,最終獲得的獲得目標葉綠體的草圖;再用原始測序數(shù)據(jù)對葉綠體草圖進行Mapping,進一步補平空缺片段,得到基因組完成圖,長度為150698bp;最后,據(jù)拼接得到的葉綠體基因組,隨機選擇4處序列設(shè)計引物,然后PCR擴增后測序,然后將上述測序結(jié)果與拼接的葉綠體基因組草圖序列進行比對,發(fā)現(xiàn)測序結(jié)果與組裝結(jié)果完全一致,表明了拼裝的準確性和可靠性。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。