两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

染色體跨度的單體型圖及其構(gòu)建方法_5

文檔序號(hào):9327188閱讀:來源:國知局
測序數(shù)據(jù)的比對(duì)分析的 方法對(duì)上述擬南芥的測序數(shù)據(jù)進(jìn)行了單體型圖構(gòu)建。并對(duì)兩種構(gòu)建方法進(jìn)行了比對(duì),具體 比對(duì)結(jié)果如圖5至圖7。
[0114] 從圖5可以看出,單體型圖的完整性隨著測序覆蓋深度(簡稱,測序深度)的升高 也會(huì)相應(yīng)的增加,但是測序深度達(dá)到一定的程度,完整性就會(huì)達(dá)到飽和;本發(fā)明和現(xiàn)有技術(shù) 的方法所構(gòu)建的單體型圖的完整性可達(dá)到飽和的最低覆蓋深度分別為:28X和41X??梢姡?本發(fā)明的構(gòu)建方法能夠在相對(duì)較低的覆蓋深度下達(dá)到與現(xiàn)有技術(shù)相同的完整性。
[0115] 從圖6可以看出,準(zhǔn)確度隨著覆蓋深度的升高也會(huì)相應(yīng)的增加,但是測序深度達(dá) 到一定的程度,準(zhǔn)確度就會(huì)趨于平穩(wěn),隨著深度的增加提升不顯著;在20X以上的同樣的覆 蓋深度條件下,本發(fā)明的方法所構(gòu)建的單體型圖的準(zhǔn)確度高于現(xiàn)有技術(shù)的準(zhǔn)確度,因此在 進(jìn)行單體型構(gòu)建的分析時(shí),比對(duì)檢測SNP可以采用將測序reads直接進(jìn)行BWA比對(duì),無需對(duì) 測序的reads進(jìn)行剪切(tream)。
[0116] 從圖7可以看出,在同樣覆蓋深度下,本發(fā)明的構(gòu)建方法所構(gòu)建的單體型圖的分 辨率都高于現(xiàn)有技術(shù)所構(gòu)建的單體型圖。而且,當(dāng)測序覆蓋深度達(dá)到55x,本發(fā)明的完整性 可達(dá)到約95%、準(zhǔn)確度可達(dá)到96 %的效果,分辨率為33 %左右,而現(xiàn)有技術(shù)最高的分辨率 小于30%。
[0117] 在本發(fā)明的上述構(gòu)建方法中,針對(duì)于基于雜合SNP進(jìn)行候選單體型構(gòu)建的部分也 可以采用其他的現(xiàn)有方法進(jìn)行分析。而且,基于上述比較結(jié)果可以看出,本發(fā)明提供的構(gòu)建 方法具有以下優(yōu)點(diǎn):
[0118] 1.物種適應(yīng)范圍廣:可用于一切已經(jīng)發(fā)表參考基因組的物種,取材簡便,只需要 進(jìn)行目標(biāo)個(gè)體的細(xì)胞培養(yǎng)即可。
[0119] 2.實(shí)驗(yàn)操作誤差?。夯贖i-C的實(shí)驗(yàn),可用足夠的細(xì)胞量,避免擴(kuò)增帶來的偏好 性及誤差。
[0120] 3.分析結(jié)果準(zhǔn)確性高:基于Hi-C的實(shí)驗(yàn)方法可得到線性距離分布廣泛的雙末端 reads。利用reads內(nèi)部的雜合位點(diǎn)構(gòu)建出短的block,并根據(jù)雙末端reads上雜合位點(diǎn)之 間的相互連接關(guān)系將這些block串聯(lián)到一起,最終得到染色體跨度,并且準(zhǔn)確性和分辨率 都很高的個(gè)體單體型結(jié)果。
[0121] 4.分析操作簡便性好:一鍵化實(shí)現(xiàn)個(gè)體染色體跨度的單體型重建。
[0122] 5.全面性:結(jié)果統(tǒng)計(jì)部分可全面性評(píng)估單體型構(gòu)建的效果。
[0123] 6.時(shí)間短:本發(fā)明可在30天內(nèi)有效的完成實(shí)驗(yàn)及分析的工作,得到高質(zhì)量的單體 型結(jié)果。在質(zhì)量和效率上都有了可觀的提升。
[0124] 以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技 術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修 改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種染色體跨度的單體型圖的構(gòu)建方法,其特征在于,所述構(gòu)建方法包括: 步驟S1,對(duì)包含待測樣本基因組交聯(lián)位點(diǎn)的測序文庫進(jìn)行測序,得到PE reads ; 步驟S2,將所述PE reads分別與參考基因組上的序列進(jìn)行第一次比對(duì),得到第一比對(duì) 結(jié)果; 步驟S3,根據(jù)所述第一比對(duì)結(jié)果構(gòu)建所述PE reads的一致性序列,獲得高質(zhì)量的SNP 位點(diǎn);以及 步驟S4,根據(jù)獲取的所述高質(zhì)量的SNP位點(diǎn)對(duì)所述PE reads中的每一條reads進(jìn)行篩 選,獲得至少含有2個(gè)雜合SNP位點(diǎn)的reads ;利用所述雜合SNP位點(diǎn)構(gòu)建所述染色體跨度 的單體型圖。2. 根據(jù)權(quán)利要求1所述的構(gòu)建方法,其特征在于,在所述步驟S2之前,所述構(gòu)建方法還 包括判斷所述測序文庫是否合格的步驟,所述判斷測序文庫是否合格的步驟包括: 步驟a,抽取部分所述PE reads作為待質(zhì)控文庫; 步驟b,將所述待質(zhì)控文庫與所述參考基因組上的序列進(jìn)行第二次比對(duì),得到第二比對(duì) 結(jié)果; 步驟c,利用所述第二比對(duì)結(jié)果計(jì)算所述待質(zhì)控文庫的插入片段在所述參考基因組上 的跨度;以及 步驟d,若所述跨度大于10kb,且所述跨度大于IOkb的插入片段在所述待質(zhì)控文庫中 所有插入片段總數(shù)的比例為50%以上,則判斷所述測序文庫合格。3. 根據(jù)權(quán)利要求1或2所述的構(gòu)建方法,其特征在于,在所述步驟Sl之后,以及在所述 步驟S2之前,所述構(gòu)建方法還包括對(duì)PE reads進(jìn)行質(zhì)控的步驟;所述質(zhì)控的步驟包括: 檢測所述PE reads中是否存在外源樣本污染,和/或 對(duì)所述PE reads進(jìn)行低質(zhì)量數(shù)據(jù)過濾。4. 根據(jù)權(quán)利要求1或2所述的構(gòu)建方法,其特征在于,在所述步驟S2之前,還包括對(duì)所 述參考基因組上的序列進(jìn)行前處理的步驟;所述前處理的步驟包括: 基于BWA和SAMtools對(duì)所述參考基因組上的序列進(jìn)行索引文件的構(gòu)建; 對(duì)所述參考基因組上的序列的長度、堿基含量和空缺的比例進(jìn)行統(tǒng)計(jì);以及 獲取構(gòu)建所述測序文庫時(shí)所使用的限制性內(nèi)切酶在所述參考基因組序列上的分布位 置和數(shù)目。5. 根據(jù)權(quán)利要求4所述的構(gòu)建方法,其特征在于,所述步驟S2包括: 利用BWA軟件的mem模塊,將所述PE reads通過第一次比對(duì)分別比對(duì)到建好所述索引 文件的所述參考基因組的序列上,得到所述第一比對(duì)結(jié)果。6. 根據(jù)權(quán)利要求5所述的構(gòu)建方法,其特征在于,所述步驟S2在得到所述第一比對(duì)結(jié) 果后,還包括對(duì)所述PE reads進(jìn)行覆蓋均勻性檢測的步驟,所述覆蓋均勻性檢測的步驟包 括: 檢測在不同測序深度下,所述PE reads對(duì)所述參考基因組的覆蓋程度和覆蓋深度,所 述覆蓋程度是指所述PE reads覆蓋所述參考基因組上的序列的長度與所述參考基因組上 的序列的總長度的比值;所述覆蓋深度是指所述參考基因組相應(yīng)位置被所述PE reads覆 蓋到的次數(shù)。7. 根據(jù)權(quán)利要求1所述的構(gòu)建方法,其特征在于,所述步驟S3包括: 根據(jù)所述第一比對(duì)結(jié)果,利用SAMtools軟件構(gòu)建所述PE peads的一致性序列,以及 獲取所述一致性序列中存在的所述高質(zhì)量的SNP位點(diǎn)。8. 根據(jù)權(quán)利要求5至7中任一項(xiàng)所述的構(gòu)建方法,其特征在于,所述步驟S4包括: 從所述高質(zhì)量的SNP位點(diǎn)中獲取至少含有2個(gè)雜合SNP位點(diǎn)的reads ; 以所述雜合SNP位點(diǎn)為點(diǎn),以兩個(gè)所述雜合SNP之間的片段長度為邊,構(gòu)建單體型塊; 基于所述交聯(lián)位點(diǎn)之間的線性距離小于30Mb的兩側(cè)片段上的所述雜合SNP位點(diǎn),將多 個(gè)所述單體型塊進(jìn)行連接,得到候選單體型圖; 對(duì)所述候選單體型圖的完整性和分辨率進(jìn)行評(píng)估,并對(duì)評(píng)估結(jié)果依次按照完整性和分 辨率的高低進(jìn)行排序,挑取在完整性最高條件下分辨率最高的所述候選單體型圖作為所述 染色體跨度的單體型圖; 其中,挑選所述交聯(lián)位點(diǎn)之間的線性距離小于30Mb的兩側(cè)片段的步驟包括: 根據(jù)染色體的位置,對(duì)所述第一比對(duì)結(jié)果進(jìn)行排序,得到所述PE reads中的每一條 reads在所述參考基因組的序列上的位置信息; 根據(jù)所述PE reads中的每一條reads在所述參考基因組的序列上的所述位置信息,將 構(gòu)成所述交聯(lián)位點(diǎn)兩端的reads進(jìn)行配對(duì),得到所述交聯(lián)位點(diǎn)在所述參考基因組上的所述 線性距離; 根據(jù)所述線性距離,挑選得到所述交聯(lián)位點(diǎn)之間的所述線性距離小于30Mb的所述兩 側(cè)片段。9. 根據(jù)權(quán)利要求5至7中任一項(xiàng)所述的構(gòu)建方法,其特征在于,在所述步驟Sl之前,所 述構(gòu)建方法還包括:利用空間構(gòu)象捕獲的方法構(gòu)建所述包含待測樣本基因組交聯(lián)位點(diǎn)的測 序文庫;所述利用空間構(gòu)象捕獲的方法構(gòu)建所述測序文庫的步驟包括: 對(duì)所述待測樣本的DNA進(jìn)行交聯(lián)固定; 利用限制性內(nèi)切酶對(duì)所述DNA進(jìn)行酶切,產(chǎn)生具有酶切缺口的DNA片段; 利用生物素標(biāo)記的寡核苷酸將所述具有酶切缺口的DNA片段上的所述酶切缺口進(jìn)行 補(bǔ)平; 利用核酸連接酶將所述DNA片段進(jìn)行連接,得到連接交聯(lián)DNA片段; 對(duì)所述連接交聯(lián)DNA片段進(jìn)行解交聯(lián),得到解交聯(lián)DNA ;以及 對(duì)所述解交聯(lián)DNA進(jìn)行片段化文庫構(gòu)建,得到所述測序文庫。10. -種染色體跨度的單體型圖,其特征在于,所述單體型圖利用權(quán)利要求1至9中任 一項(xiàng)所述的構(gòu)建方法構(gòu)建而成。
【專利摘要】本發(fā)明提供了一種染色體跨度的單體型圖及其構(gòu)建方法。構(gòu)建方法包括對(duì)包含待測樣本基因組交聯(lián)位點(diǎn)的測序文庫進(jìn)行測序,得到PE?reads;將PE?reads分別與參考基因組上的序列進(jìn)行第一次比對(duì),得到第一比對(duì)結(jié)果;根據(jù)第一比對(duì)結(jié)果構(gòu)建PE?reads的一致性序列,獲得高質(zhì)量的SNP位點(diǎn);根據(jù)所獲取的高質(zhì)量的SNP位點(diǎn)對(duì)每一條reads進(jìn)行篩選,并從中提取至少含有2個(gè)雜合SNP位點(diǎn)的reads;并利用雜合SNP位點(diǎn)構(gòu)建染色體跨度的單體型圖。這種基于全基因組的交聯(lián)位點(diǎn)的測序數(shù)據(jù)更全面,因而得到的染色體跨度的單體型圖的準(zhǔn)確性和分辨率都很高,且具有物種適應(yīng)范圍廣的優(yōu)勢。
【IPC分類】C12N15/11, G06F19/18
【公開號(hào)】CN105046105
【申請?zhí)枴緾N201510401025
【發(fā)明人】趙洪衛(wèi)
【申請人】天津諾禾醫(yī)學(xué)檢驗(yàn)所有限公司
【公開日】2015年11月11日
【申請日】2015年7月9日
當(dāng)前第5頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
昂仁县| 广水市| 磐石市| 武宁县| 楚雄市| 柳河县| 抚远县| 翁源县| 外汇| 武宣县| 如皋市| 锦屏县| 虎林市| 修文县| 东阳市| 汉川市| 阳原县| 乌兰察布市| 厦门市| 醴陵市| 天镇县| 彭州市| 搜索| 海林市| 万盛区| 灵台县| 桃源县| 多伦县| 蓬溪县| 灵石县| 华亭县| 留坝县| 大安市| 永仁县| 溆浦县| 延庆县| 佛冈县| 墨竹工卡县| 海晏县| 威信县| 湛江市|