两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種檢測基因融合的方法及裝置的制造方法

文檔序號:9780854閱讀:529來源:國知局
一種檢測基因融合的方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明設及生物信息學領域,具體而言,設及一種檢測基因融合的方法及裝置。
【背景技術】
[000引基因突變是指基因組DNA分子發(fā)生的突然的、可遺傳的變異現(xiàn)象(gene mu化tion)。從分子水平上看,基因突變是指基因在結構上發(fā)生堿基對組成或排列順序的改 變?;螂m然十分穩(wěn)定,能在細胞分裂時精確地復制自己,但運種穩(wěn)定性是相對的。在一定 的條件下基因也可W從原來的存在形式突然改變成另一種新的存在形式,就是在一個位點 上,突然出現(xiàn)了一個新基因,代替了原有基因,運個基因叫做突變基因。于是后代的表現(xiàn)中 也就突然地出現(xiàn)祖先從未有的新性狀。
[0003] 基因突變是生物進化的重要因素之一,所W研究基因突變除了本身的理論意義W 外還有廣泛的生物學意義。基因突變?yōu)檫z傳學研究提供突變型,為育種工作提供素材,所W 它還有科學研究和生產上的實際意義。
[0004] 有的基因突變是由于染色體發(fā)生結構變異形成。在自然條件或人為因素的影響 下,染色體發(fā)生的結構變異主要有:缺失、重復、倒位和易位,其中,基因融合也是染色體發(fā) 生結構變異的一種。所謂融合基因,是指將兩個或多個基因的編碼區(qū)首尾相連,置于同一套 調控序列(包括啟動子、增強子、核糖體結合序列、終止子等)控制之下,構成的嵌合基因。
[0005] 目前,在二代測序中,常用的基因融合檢測方法是基于全基因組的DNA水平上的高 通量測序,同時使用融合基因兩端信號,加上統(tǒng)計學檢驗,判斷融合的發(fā)生。但是全基因組 測序不可能有高的測序深度,而目標區(qū)域捕獲的方法一般只設計并捕獲常見融合基因的一 端,而另一端不設計探針導致沒有信號,運兩個問題都會導致融合檢測的靈敏度非常低。

【發(fā)明內容】

[0006] 本發(fā)明旨在提供一種檢測基因融合的方法及裝置,W從DNA水平通過高通量測序 技術尋找融合序列,解決基于目標區(qū)域捕獲的二代測序對于融合檢測靈敏度低的技術問 題。
[0007] 為了實現(xiàn)上述目的,根據本發(fā)明的一個方面,提供了一種檢測基因融合的方法。該 方法包括W下步驟:S1,提取待檢測樣本的DNA,然后打斷、連接接頭;S2,使用根據目標基因 訂制的安捷倫探針利用目標區(qū)域捕獲的方法捕獲目標基因的待檢融合中的驅動基因進而 得到目標DNA片段;S3,通過高通量測序的方法對目標DNA片段進行測序,得到融合形式的序 列;S4,過濾掉低質量的序列后,檢測融合形式的序列;S4具體包括:S41,利用比對軟件將S3 得到的融合形式的序列與相應的融合形式的參考序列相比對,未比對上的序列形成軟截斷 序列,并根據比對的位置進行排序,然后建立比對結果的索引文件;S42,將融合形式的序列 的比對結果提取出來,去掉PCR產生的重復序列,找到含有軟截斷序列的序列,把同一點的 多條序列支持的軟截斷序列進行組裝,得到一致性序列,根據一致性序列過濾掉低質量的 序列,將剩下的符合要求的序列繼續(xù)比對;其中,要求包括1)含有非相同軟截斷序列至少4 條,且可W匹配一致性序列;2)含有的不可W匹配一致性序列的軟截斷序列的個數(shù)少于可 W匹配一致性序列的軟截斷序列的個數(shù);和3) -致性序列大于30nt;S43,檢測已知融合形 式:分析S42的比對結果,如果比對到參考序列上的區(qū)域在COSMIC數(shù)據庫中有與第一個斷點 發(fā)生融合的記錄,那么無論比對序列是否有同源序列,都放在結果中,并標記;W及檢測新 的融合形式:分析S42的比對結果,如果比對上的區(qū)域在COSMIC數(shù)據庫中沒有與第一個斷點 發(fā)生融合的記錄,那么看比對序列是否有同源序列,去除同源性低的比對序列,將剩下結果 輸出。
[000引進一步地,S41中的比對軟件采用的是BWA-mem比對軟件,建立比對結果索引文件 采用的軟件是samtools軟件。
[0009] 進一步地,S42中的使用Picard軟件去掉PCR產生的重復序列。
[0010] 進一步地,S42中的多條序列為4條序列。
[00川進一步地,S43中,同源性低的比對序列是指使用BWA-mem默認參數(shù)比對結果中比 對質量小于10的序列。
[0012]根據本發(fā)明的另一個方面,提供一種檢測基因融合的裝置。該裝置包括:DNA處理 模塊,用于提取待檢測樣本的DNA,然后打斷、連接接頭;基因捕獲模塊,用于使用根據目標 基因訂制的安捷倫探針利用目標區(qū)域捕獲的方法捕獲目標基因的待檢融合中的驅動基因 進而得到目標DNA片段;測序模塊,用于通過高通量測序的方法對目標DNA片段進行測序,得 到融合形式的序列;檢測模塊,用于過濾掉低質量的序列后,檢測融合形式的序列;檢測模 塊具體包括:序列比對子模塊,用于利用比對軟件將檢測模塊得到的融合形式的序列與相 應的融合形式的參考序列相比對,未比對上的序列形成軟截斷序列,并根據比對的位置進 行排序,然后建立比對結果的索引文件;序列篩選子模塊,用于將融合形式的序列的比對結 果提取出來,去掉PCR產生的重復序列,找到含有軟截斷序列的序列,把同一點的多條序列 支持的軟截斷序列進行組裝,得到一致性序列,根據一致性序列過濾掉低質量的序列,將剩 下的符合要求的序列繼續(xù)比對;其中,要求包括1)含有非相同軟截斷序列至少4條,且可W 匹配一致性序列;2)含有的不可W匹配一致性序列的軟截斷序列的個數(shù)少于可W匹配一致 性序列的軟截斷序列的個數(shù);和3) -致性序列大于30nt(堿基長度);檢測已知融合形式子 模塊:用于分析序列篩選子模塊的比對結果,如果比對到參考序列上的區(qū)域在COSMIC數(shù)據 庫中有與第一個斷點發(fā)生融合的記錄,那么無論比對序列是否有同源序列,都放在結果中, 并標記;W及檢測新的融合形式子模塊:用于分析序列篩選子模塊的比對結果,如果比對上 的區(qū)域在COSMIC數(shù)據庫中沒有與第一個斷點發(fā)生融合的記錄,那么看比對序列是否有同源 序列,去除同源性低的比對序列,將剩下結果輸出。
[001引進一步地,序列篩選子模塊中的比對軟件采用的是BWA-mem比對軟件,建立比對結 果索引文件采用的軟件是samtools軟件。
[0014] 進一步地,序列篩選子模塊中的使用Picard軟件去掉PCR產生的重復序列。
[0015] 進一步地,序列篩選子模塊中的多條序列為4條序列。
[0016] 進一步地,檢測新的融合形式子模塊中,同源性低的比對序列是指使用BWA-mem默 認參數(shù)比對結果中比對質量小于10的序列。
[0017] 應用本發(fā)明的技術方案,結合目標區(qū)域捕獲技術、高通量測序技術及融合序列信 息分析,提供了一套高靈敏度的從DNA中檢測融合的流程。其中,通過目標區(qū)域捕獲技術的 捕獲常發(fā)生融合的基因,僅對常發(fā)生融合的基因進行測序,極大的降低了測序成本;另外, 利用目標區(qū)域捕獲下融合驅使基因的單端融合信號加上數(shù)據庫可W對目標區(qū)域捕獲的基 因數(shù)據的融合檢出有非常高的靈敏度。
【附圖說明】
[0018] 構成本申請的一部分的說明書附圖用來提供對本發(fā)明的進一步理解,本發(fā)明的示 意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
[0019] 圖1示出了根據本發(fā)明一實施例的檢ii基因融合的方法的流程示意圖;從及
[0020] 圖2示出了根據本發(fā)明一實施例的組裝軟截斷序列的步驟與判斷可信度的示意 圖。
【具體實施方式】
[0021] 需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可W相 互組合。下面將參考附圖并結合實施例來詳細說明本發(fā)明。
[0022] 目前,在二代測序中,常用的基因融合檢測方法是基于全基因組的DNA水平上的高 通量測序,同時使用融合基因兩端信號,加上統(tǒng)計學檢驗,判斷融合的發(fā)生。但是全基因組 測序不可能有高的測序深度,而目標區(qū)域捕獲的方法一般只設計并捕獲常見融合基因的一 端,而另一端不設計探針導致沒有信號,運兩個問題都會導致融合檢測的靈敏度非常低。針 對現(xiàn)有技術中的上述不足,本發(fā)明提供了 W下技術方案。
[0023] 根據本發(fā)明一種典型的實施方式,提供一種檢測基因融合的方法。該方法包括W 下步驟:S1,提取待檢測樣本的DNA,然后打斷、連接接頭;S2,使用根據目標基因訂制的安捷 倫探針利用目標區(qū)域捕獲的方法捕獲目標基因的待檢融合中的驅動基因進而得到目標DNA 片段;S3,通過高通量測序的方法對目標DNA片段進行測序,得到融合形式的序列;S4,過濾 掉低質量的序列后,檢測融合形式的序列;S4具體包括:S41,利用比對軟件將S3得到的融合 形式的序列與相應的融合形式的參考序列相比對,未比對上的序列形成軟截斷序列,并根 據比對的位置進行排序,然后建立比對結果的索引文件;S42,將融合形式的序列的比對結 果提取出來,去掉PCR產生的重復序列,找到含有軟截斷序列的序列,把同一點的多條序列 支持的軟截斷序列進行組裝,得到一致性序列,根據一致性序列過濾掉低質量的序列,將剩 下的符合要求的序列繼續(xù)比對;其中,要求包括1)含有非相同軟截斷序列至少4條,且可W 匹配一致性序列;2)含有的不可W匹配一致性序列的軟截斷序列的個數(shù)少于可W匹配一致 性序列的軟截斷序列的個數(shù);和3) -致性序列大于30堿基長度;S43,檢測已知融合形式:分 析S42的比對結果,如果比對到參考序列上的區(qū)域在COSMIC數(shù)據庫中有與第一個斷點發(fā)生 融合的記錄,那么無論比對序列是否有同源序列,都放在結果中,并標記;W及檢測新的融 合形式:分析S4
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
雅安市| 乡城县| 西林县| 南丹县| 四平市| 神农架林区| 重庆市| 拉萨市| 黔西| 阜阳市| 成安县| 贡嘎县| 改则县| 颍上县| 博野县| 攀枝花市| 红安县| 南京市| 绥芬河市| 茂名市| 揭东县| 富民县| 色达县| 漳州市| 九江县| 荣成市| 惠水县| 鹰潭市| 拜城县| 万全县| 阳谷县| 岢岚县| 漾濞| 舒兰市| 胶南市| 紫阳县| 万山特区| 常德市| 交城县| 中山市| 浮山县|