本發(fā)明涉及生物
技術(shù)領(lǐng)域:
,具體而言,涉及一種低頻率基因融合的檢測方法及裝置。
背景技術(shù):
:目前,組織樣本的二代測序檢測基因融合的一般流程包括:將基因組DNA打斷成300~400bp的片段,使用捕獲探針將目標(biāo)區(qū)域捕獲下來,然后邊合成邊測序,通過專注于目標(biāo)區(qū)域的測序在相同數(shù)據(jù)量下提高測序深度,對盡量多的DNA進(jìn)行高測序深度的測序。檢測融合時通過雙端測序的兩個序列不在同一個區(qū)域判斷融合信號。目前,檢測組織中的基因融合的方案一般采用安捷倫探針捕獲目標(biāo)區(qū)域,使用illumina-Miseq或是Hiseq測序儀進(jìn)行高通量測序。下機(jī)數(shù)據(jù)使用bwa軟件比對上參考基因組,通過雙端測序結(jié)果的兩條序列在不同區(qū)域的信號找到融合。血液樣本中的ctDNA較短,為170bp左右,通過雙端測序的兩端序列難以得到可靠的融合信號,而使用單端序列的軟截斷作為融合信號又被血漿中融合DNA少這個條件所限制,因?yàn)樯倭寇浗財鄷驗(yàn)槠浣財嘈蛄虚L度短和種類少而難以和建庫或測序錯誤區(qū)分。技術(shù)實(shí)現(xiàn)要素:本發(fā)明旨在提供一種低頻率基因融合的檢測方法及裝置,以提高低頻突變檢測靈敏度。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種低頻率基因融合的檢測方法。該檢測方法包括以下步驟:S1,從全血中提取cfDNA;S2,對cfDNA進(jìn)行末端修復(fù)及3’端添加A堿基;S3,將S2得到的cfDNA的末端連接含有隨機(jī)標(biāo)簽序列的接頭;S4,根據(jù)接頭的序列及目標(biāo)區(qū)域設(shè)計多重PCR的引物進(jìn)行目標(biāo)區(qū)域捕獲,多重PCR的引物中上游引物為通用引物,匹配接頭的序列,下游引物為擴(kuò)增目標(biāo)區(qū)域的特異性引物;S5,對S4的PCR產(chǎn)物進(jìn)行磁珠純化,去除掉未非特異性擴(kuò)增的小片段DNA及引物二聚體;S6,對S5的產(chǎn)物進(jìn)行PCR擴(kuò)增,同時引入index序列,得到ctDNA超低頻突變的文庫;S7,采用IlluminaHiseqX平臺對文庫進(jìn)行上機(jī)測序,S8,對文庫測序后的數(shù)據(jù)通過隨機(jī)標(biāo)簽序列進(jìn)行聚類分析,排除掉PCR擴(kuò)增錯誤及測序錯誤產(chǎn)生的序列數(shù)據(jù);以及S9,剩余的數(shù)據(jù)質(zhì)控合格后進(jìn)入變異檢測分析。進(jìn)一步地,隨機(jī)標(biāo)簽序列的長度為12bp。進(jìn)一步地,接頭為如SEQIDNO.1和SEQIDNO.2所示的脫氧核苷酸序列。進(jìn)一步地,S8包括:S81,下機(jī)經(jīng)過排除錯誤處理后的數(shù)據(jù)使用bwa軟件比對上參考基因組,并使用samtools軟件排序后建立索引;S82,對比對文件進(jìn)行遍歷,每個位點(diǎn)上前后兩個標(biāo)簽相同的序列合并成1個,并且同時去掉相同標(biāo)簽中和其他大部分序列相比有任何不一致的序列;S83,合成的簽序列重新使用bwa軟件比對回參考基因組,并且使用samools軟件進(jìn)行排序和建立索引。進(jìn)一步地,S9中的變異檢測分析包括:S91,將S83得到的所有軟截斷中位置接近的軟截斷合成一條長的軟截斷序列,使用該序列在參考基因組上尋找融合的另一個基因位置;S92,對比數(shù)據(jù)庫將與靶向用藥相關(guān)融合提取出。根據(jù)本發(fā)明的另一方面,提供了一種低頻率基因融合的檢測裝置。該檢測裝置依次包括以下模塊:cfDNA提取模塊,用于從全血中提取cfDNA;末端修復(fù)及加A堿基模塊,用于對cfDNA進(jìn)行末端修復(fù)及3’端添加A堿基;接頭連接模塊,用于將完成末端修復(fù)及3’端添加A堿基的cfDNA的末端連接含有隨機(jī)標(biāo)簽序列的接頭;目標(biāo)區(qū)域捕獲模塊,用于根據(jù)接頭的序列及目標(biāo)區(qū)域設(shè)計多重PCR的引物進(jìn)行目標(biāo)區(qū)域捕獲,多重PCR的引物中上游引物為通用引物,匹配接頭的序列,下游引物為擴(kuò)增目標(biāo)區(qū)域的特異性引物;磁珠純化模塊,用于對PCR產(chǎn)物進(jìn)行磁珠純化,去除掉未非特異性擴(kuò)增的小片段DNA及引物二聚體;index序列引入模塊,用于對磁珠純化模塊的產(chǎn)物進(jìn)行PCR擴(kuò)增,同時引入index序列,得到ctDNA超低頻突變的文庫;測序模塊,采用IlluminaHiseqX平臺對文庫進(jìn)行上機(jī)測序,聚類分析模塊,用于對文庫測序后的數(shù)據(jù)通過隨機(jī)標(biāo)簽序列進(jìn)行聚類分析,排除掉PCR擴(kuò)增錯誤及測序錯誤產(chǎn)生的序列數(shù)據(jù);以及變異檢測分析模塊,用于將剩余的數(shù)據(jù)質(zhì)控合格后進(jìn)入變異檢測分析。進(jìn)一步地,隨機(jī)標(biāo)簽序列的長度為12bp。進(jìn)一步地,接頭為如SEQIDNO.1和SEQIDNO.2所示的脫氧核苷酸序列。進(jìn)一步地,聚類分析模塊包括:第一分析模塊,用于將下機(jī)經(jīng)過排除錯誤處理后的數(shù)據(jù)使用bwa軟件比對上參考基因組,并使用samtools軟件排序后建立索引;第二分析模塊,用于將比對文件進(jìn)行遍歷,每個位點(diǎn)上前后兩個標(biāo)簽相同的序列合并成1個,并且同時去掉相同標(biāo)簽中和其他大部分序列相比有任何不一致的序列;第三分析模塊,用于將合成的簽序列重新使用bwa軟件比對回參考基因組,并且使用samools軟件進(jìn)行排序和建立索引。進(jìn)一步地,變異檢測分析模塊的變異檢測分析包括:將第三分析模塊得到的所有軟截斷中位置接近的軟截斷合成一條長的軟截斷序列,使用該序列在參考基因組上尋找融合的另一個基因位置;以及對比數(shù)據(jù)庫將與靶向用藥相關(guān)融合提取出。本發(fā)明實(shí)際上是一種基于液相雜交捕獲二代測序進(jìn)行基因結(jié)構(gòu)變異突變檢出的方法,主要對樣本中低頻率的體細(xì)胞突變進(jìn)行檢測,使用隨機(jī)序列標(biāo)記原始DNA分子,矯正建庫和測序錯誤,去掉PCR中的指數(shù)擴(kuò)增造成的影響,進(jìn)而解決測序分析結(jié)果中的假陰性/假陽性問題,即單端序列的軟截斷作為信號檢測血漿中稀少的融合突變。附圖說明構(gòu)成本申請的一部分的說明書附圖用來提供對本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:圖1示出了根據(jù)本發(fā)明一實(shí)施方式的低頻率基因融合的檢測方法的流程示意圖。具體實(shí)施方式需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。根據(jù)本發(fā)明一種典型的實(shí)施方式,提供了一種低頻率基因融合的檢測方法。該檢測方法包括以下步驟:S1,從全血中提取cfDNA;S2,對cfDNA進(jìn)行末端修復(fù)及3’端添加A堿基;S3,將S2得到的cfDNA的末端連接含有隨機(jī)標(biāo)簽序列的接頭;S4,根據(jù)接頭的序列及目標(biāo)區(qū)域設(shè)計多重PCR的引物進(jìn)行目標(biāo)區(qū)域捕獲,多重PCR的引物中上游引物為通用引物,匹配接頭的序列,下游引物為擴(kuò)增目標(biāo)區(qū)域的特異性引物;S5,對S4的PCR產(chǎn)物進(jìn)行磁珠純化,去除掉未非特異性擴(kuò)增的小片段DNA及引物二聚體;S6,對S5的產(chǎn)物進(jìn)行PCR擴(kuò)增,同時引入index序列,得到ctDNA超低頻突變的文庫;S7,采用IlluminaHiseqX平臺對文庫進(jìn)行上機(jī)測序,S8,對文庫測序后的數(shù)據(jù)通過隨機(jī)標(biāo)簽序列進(jìn)行聚類分析,排除掉PCR擴(kuò)增錯誤及測序錯誤產(chǎn)生的序列數(shù)據(jù);以及S9,剩余的數(shù)據(jù)質(zhì)控合格后進(jìn)入變異檢測分析。本發(fā)明適用于所有基于雜交的目標(biāo)區(qū)域捕獲方法,包括但不限于Agilent、Nimblegen和Illumina的商業(yè)和定制化捕獲芯片;本發(fā)明適用于Illumina所有二代測序機(jī)型,包括但不限于Hiseq系列、Miseq系列和Nextseq系列。本發(fā)明實(shí)際上是一種基于液相雜交捕獲二代測序進(jìn)行基因結(jié)構(gòu)變異突變檢出的方法,主要對樣本中低頻率的體細(xì)胞突變進(jìn)行檢測,使用隨機(jī)序列標(biāo)記原始DNA分子,矯正建庫和測序錯誤,去掉PCR中的指數(shù)擴(kuò)增造成的影響,進(jìn)而解決測序分析結(jié)果中的假陰性/假陽性問題,即單端序列的軟截斷作為信號檢測血漿中稀少的融合突變。優(yōu)選的,隨機(jī)標(biāo)簽序列為ATGC四種堿基組成,長度12bp,連接在reads的前后兩端。根據(jù)本發(fā)明一種典型的實(shí)施方式,接頭包括如SEQIDNO.1和SEQIDNO.2所示的脫氧核苷酸序列。根據(jù)本發(fā)明一種典型的實(shí)施方式,多重PCR擴(kuò)增上游引物為SEQIDNO.3所示的脫氧核苷酸序列,多重PCR擴(kuò)增下游引物為SEQIDNO.4所示的脫氧核苷酸序列,N代表針對不同的位點(diǎn)設(shè)計的不同特異性引物,具體的N部分序列包括如SEQIDNO.5,SEQIDNO.6,SEQIDNO.7,SEQIDNO.8,SEQIDNO.9,SEQIDNO.10,SEQIDNO.11,SEQIDNO.12,SEQIDNO.13,SEQIDNO.14,SEQIDNO.15,SEQIDNO.16,SEQIDNO.17,SEQIDNO.18,SEQIDNO.19,SEQIDNO.20,SEQIDNO.21,SEQIDNO.22,SEQIDNO.23,SEQIDNO.24,SEQIDNO.25,SEQIDNO.26,SEQIDNO.27,SEQIDNO.28,SEQIDNO.29,SEQIDNO.30,SEQIDNO.31,SEQIDNO.32,SEQIDNO.33,SEQIDNO.34,SEQIDNO.35,SEQIDNO.36,SEQIDNO.37,SEQIDNO.38,SEQIDNO.39,SEQIDNO.40,SEQIDNO.41,SEQIDNO.42,SEQIDNO.43,SEQIDNO.44,SEQIDNO.45,SEQIDNO.46,SEQIDNO.47所示的脫氧核苷酸序列。根據(jù)本發(fā)明一種典型的實(shí)施方式,S8包括:S81,下機(jī)經(jīng)過排除錯誤處理(cleandata)后的數(shù)據(jù)使用bwa軟件比對上參考基因組,并使用samtools軟件排序后建立索引;S82,對比對文件進(jìn)行遍歷,每個位點(diǎn)上前后兩個標(biāo)簽相同的序列合并成1個,并且同時去掉相同標(biāo)簽中和其他大部分序列相比有任何不一致的序列;S83,合成的簽序列重新使用bwa軟件比對回參考基因組,并且使用samools軟件進(jìn)行排序和建立索引。合成相同標(biāo)簽的序列可以把序列恢復(fù)到原始情況,消除PCR中發(fā)生的錯誤,比對并建立索引可以使后續(xù)流程加快速度。根據(jù)本發(fā)明一種典型的實(shí)施方式,S9中的變異檢測分析包括:S91,將S83得到的所有軟截斷中位置接近的軟截斷合成一條長的軟截斷序列,使用該序列在參考基因組上尋找融合的另一個基因位置;S92,對比數(shù)據(jù)庫將與靶向用藥相關(guān)融合提取出。根據(jù)本發(fā)明一種典型的實(shí)施方式,提供一種低頻率基因融合的檢測裝置。該檢測裝置依次包括以下模塊:cfDNA提取模塊,用于從全血中提取cfDNA;末端修復(fù)及加A堿基模塊,用于對cfDNA進(jìn)行末端修復(fù)及3’端添加A堿基;接頭連接模塊,用于將完成末端修復(fù)及3’端添加A堿基的cfDNA的末端連接含有隨機(jī)標(biāo)簽序列的接頭;目標(biāo)區(qū)域捕獲模塊,用于根據(jù)接頭的序列及目標(biāo)區(qū)域設(shè)計多重PCR的引物進(jìn)行目標(biāo)區(qū)域捕獲,多重PCR的引物中上游引物為通用引物,匹配接頭的序列,下游引物為擴(kuò)增目標(biāo)區(qū)域的特異性引物;磁珠純化模塊,用于對PCR產(chǎn)物進(jìn)行磁珠純化,去除掉未非特異性擴(kuò)增的小片段DNA及引物二聚體;index序列引入模塊,用于對磁珠純化模塊的產(chǎn)物進(jìn)行PCR擴(kuò)增,同時引入index序列,得到ctDNA超低頻突變的文庫;測序模塊,采用IlluminaHiseqX平臺對文庫進(jìn)行上機(jī)測序,聚類分析模塊,用于對文庫測序后的數(shù)據(jù)通過隨機(jī)標(biāo)簽序列進(jìn)行聚類分析,排除掉PCR擴(kuò)增錯誤及測序錯誤產(chǎn)生的序列數(shù)據(jù);以及變異檢測分析模塊,用于將剩余的數(shù)據(jù)質(zhì)控合格后進(jìn)入變異檢測分析。優(yōu)選的,隨機(jī)標(biāo)簽序列為ATGC四種堿基組成,長度12bp,連接在reads的前后兩端。根據(jù)本發(fā)明一種典型的實(shí)施方式,接頭包括如SEQIDNO.1和SEQIDNO.2所示的脫氧核苷酸序列。根據(jù)本發(fā)明一種典型的實(shí)施方式,多重PCR擴(kuò)增上游引物為SEQIDNO.3所示的脫氧核苷酸序列,多重PCR擴(kuò)增下游引物為SEQIDNO.4所示的脫氧核苷酸序列,N代表針對不同的位點(diǎn)設(shè)計的不同特異性引物,具體的N部分序列包括如SEQIDNO.5,SEQIDNO.6,SEQIDNO.7,SEQIDNO.8,SEQIDNO.9,SEQIDNO.10,SEQIDNO.11,SEQIDNO.12,SEQIDNO.13,SEQIDNO.14,SEQIDNO.15,SEQIDNO.16,SEQIDNO.17,SEQIDNO.18,SEQIDNO.19,SEQIDNO.20,SEQIDNO.21,SEQIDNO.22,SEQIDNO.23,SEQIDNO.24,SEQIDNO.25,SEQIDNO.26,SEQIDNO.27,SEQIDNO.28,SEQIDNO.29,SEQIDNO.30,SEQIDNO.31,SEQIDNO.32,SEQIDNO.33,SEQIDNO.34,SEQIDNO.35,SEQIDNO.36,SEQIDNO.37,SEQIDNO.38,SEQIDNO.39,SEQIDNO.40,SEQIDNO.41,SEQIDNO.42,SEQIDNO.43,SEQIDNO.44,SEQIDNO.45,SEQIDNO.46,SEQIDNO.47所示的脫氧核苷酸序列。根據(jù)本發(fā)明一種典型的實(shí)施方式,聚類分析模塊包括:第一分析模塊,用于將下機(jī)經(jīng)過排除錯誤處理(cleandata)后的數(shù)據(jù)使用bwa軟件比對上參考基因組,并使用samtools軟件排序后建立索引;第二分析模塊,用于將比對文件進(jìn)行遍歷,每個位點(diǎn)上前后兩個標(biāo)簽相同的序列合并成1個,并且同時去掉相同標(biāo)簽中和其他大部分序列相比有任何不一致的序列;第三分析模塊,用于將合成的簽序列重新使用bwa軟件比對回參考基因組,并且使用samools軟件進(jìn)行排序和建立索引。根據(jù)本發(fā)明一種典型的實(shí)施方式,變異檢測分析模塊的變異檢測分析包括:將第三分析模塊得到的所有軟截斷中位置接近的軟截斷合成一條長的軟截斷序列,使用該序列在參考基因組上尋找融合的另一個基因位置;以及對比數(shù)據(jù)庫將與靶向用藥相關(guān)融合提取出。根據(jù)本發(fā)明一種典型的實(shí)施方式,如圖1所示,應(yīng)用本發(fā)明的技術(shù)方案主要包括實(shí)驗(yàn)部分和分析部分兩大部分,實(shí)施上述技術(shù)方案包括具體以下步驟(圖1示出了最主要的步驟,并非全部步驟):1)從全血中分離血漿,得血漿樣本,并對血漿樣本進(jìn)行樣本處理,提取cfDNA;2)含有隨機(jī)標(biāo)簽序列的接頭制作;3)cfDNA片段末端修復(fù)及3’端添加A堿基;4)接頭的連接,將末端連接A堿基的DNA片段末端連接步驟2)中的含有隨機(jī)標(biāo)簽序列的接頭;5)基于多重PCR的目標(biāo)區(qū)域捕獲:根據(jù)步驟4)中添加的接頭序列及目標(biāo)區(qū)域(感興趣的研究位點(diǎn)),設(shè)計多重PCR的引物,其中上游引物為通用引物,匹配步驟4)中添加的接頭序列;下游引物為目標(biāo)區(qū)域特異性引物;6)對步驟5)中的PCR產(chǎn)物進(jìn)行磁珠純化,去除掉未非特異性的小片段DNA及引物二聚體;7)文庫的擴(kuò)增及index的引入:采用特定的引物對步驟6)后的產(chǎn)物進(jìn)行PCR擴(kuò)增,同時對文庫添加index序列;8)文庫檢測:使用安捷倫2100Bioanalyzer檢測插入片段大小;使用qPCR定量檢測文庫產(chǎn)量;9)文庫上機(jī):采用IlluminaHiseqX平臺對文庫檢測后的文庫進(jìn)行上機(jī)測序;10)下機(jī)數(shù)據(jù)的分析:下機(jī)經(jīng)過排除錯誤處理(cleandata)后的數(shù)據(jù)使用bwa軟件比對上參考基因組,并使用samtools軟件排序后建立索引;對比對文件進(jìn)行遍歷,每個位點(diǎn)上前后兩個標(biāo)簽相同的序列合并成1個(融合基因1上提取軟截斷序列),并且同時去掉相同標(biāo)簽中和其他大部分序列相比有任何不一致的序列;合成的簽序列重新使用bwa軟件比對回參考基因組,并且使用samools軟件進(jìn)行排序和建立索引;將得到的所有軟截斷中位置接近的軟截斷合成一條長的軟截斷序列,使用該序列在參考基因組上尋找融合的另一個基因位置(融合基因2);對比數(shù)據(jù)庫將與靶向用藥相關(guān)融合提取出(融合檢測結(jié)果)。下面將結(jié)合實(shí)施例進(jìn)一步說明本發(fā)明的有益效果,本發(fā)明中沒有詳細(xì)描述的技術(shù)手段可以采用本領(lǐng)域的常規(guī)技術(shù)手段實(shí)現(xiàn)。實(shí)施例1本實(shí)施例中用到的樣本為非小細(xì)胞肺癌患者血漿樣本,為基因融合陽性血漿樣本,其組織RNA通過PCR的方法檢測出EML4-ALK.E6bA20.AB374362融合。下面按照本發(fā)明的方法進(jìn)行檢測。1.非小細(xì)胞肺癌患者全血10ml,采用streck公司的BCT管進(jìn)行收集和運(yùn)輸,運(yùn)輸溫度為室溫,運(yùn)輸時間不超過72h。血漿的分離采用兩步離心法,即1600g離心10min,取上清,再16000g離心10min,上清即為分離好的血漿,該血漿保存于-80℃中。血漿中cfDNA的提取采用Qiagen公司的循環(huán)DNA(circulating)提取試劑盒,提取好的cfDNA存放在-20℃中備用。樣本名稱及提取量見表1。表12.合成帶有標(biāo)簽序列的接頭。接頭序列見表2(本例中采用的標(biāo)簽序列長度為12個堿基),最多可以標(biāo)記412個DNA分子。合成好的引物采用ElutionBuffer洗脫緩沖液進(jìn)行溶解,終濃度為100uM,等比例摩爾數(shù)混合之后95℃加熱5min,然后緩慢降溫至室溫完成退火。采用乙醇沉淀法對退火完成后的接頭進(jìn)行純化,最后采用100ul無核酸酶水溶解,終濃度為20uM。表2名稱序列(5’-3’)SEQIDNO.1TCTACACTCTTTCCCTACACGCTCTTCCGATCTNNNNNNNNNNNNTSEQIDNO.2CACTGACCTCAAGTCTGCACACGAGAAGGCTAGANNNNNNNNNNNN注:含有標(biāo)簽序列的接頭,其中N代表隨機(jī)堿基。3.末端修復(fù)及3’端加A堿基參照下表3配比準(zhǔn)備反應(yīng)混合液,用槍輕柔地上下吹吸混勻。表3放入PCR儀,按下表4設(shè)置程序進(jìn)行反應(yīng)(蓋溫設(shè)為70℃,前30min不蓋熱蓋,溫度到達(dá)65℃,立即蓋上熱蓋)。表44.接頭連接按照下表5的配比準(zhǔn)備反應(yīng)混合液,用槍輕柔地上下吹吸混勻。表5分為2管,每管55ul,放于PCR儀上,20℃反應(yīng)15min。反應(yīng)結(jié)束后,使用0.8×的AMPureXP(Beckman公司)磁珠純化DNA樣本。5.PCR擴(kuò)增捕獲目標(biāo)區(qū)域按照下表6的配比準(zhǔn)備反應(yīng)混合液,用槍輕柔地上下吹吸混勻。表6用于多重PCR擴(kuò)增的上下游引物的序列見表7。表7名稱序列(5’-3’)SEQIDNO.3TCTACACTCTTTCCCTACACGACGCTSEQIDNO.4GGAGTTCAGACCGTGTGCTCTTCCGATCTN注:下游引物為混合物,N代表針對不同的位點(diǎn)設(shè)計的不同特異性引物,具體的N部分序列見表8。表8放入PCR儀,按下表9設(shè)置程序反應(yīng)。表9反應(yīng)結(jié)束后,采用1.2×的AMPureXP磁珠對擴(kuò)增產(chǎn)物進(jìn)行純化,最后將文庫溶于25ulNF-water(Ambion公司)中。6.文庫的富集及引入index序列采用含有Illumina的index引物對上一步的文庫進(jìn)行擴(kuò)增,同時引入index序列在上機(jī)時區(qū)分文庫,在本實(shí)施例中,采用的index序列為1號,按照下表10配制反應(yīng)液。表10上下游引物序列見表11。表11引物名稱序列(5’-3’)SEQIDNO.48AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACASEQIDNO.49CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCA放入PCR儀,按下表12設(shè)置程序反應(yīng)。表12反應(yīng)結(jié)束后,采用1.2×的AMPureXP磁珠對擴(kuò)增產(chǎn)物進(jìn)行純化,最后將文庫溶于30ulNF-water中。采用Qubit熒光計對文庫進(jìn)行精確定量。7.文庫檢測及上機(jī)測序?qū)⒉襟E6中的純化產(chǎn)物稀釋到2ng/ul,取出1ul進(jìn)行安捷倫2100Bioanalyzer(美國安捷倫公司)檢測;另外,再取出1ul用于qPCR檢測,根據(jù)檢測結(jié)果決定上機(jī)濃度。根據(jù)上步所得的濃度,將文庫稀釋到上機(jī)要求后(2nmol),在Illumina公司的HiseqX測序平臺上進(jìn)行PE150測序。8.下機(jī)質(zhì)控在本實(shí)施例的第二部分?jǐn)?shù)據(jù)分析中,使用bwa軟件將測序結(jié)果比對上參考基因組,合成標(biāo)簽后的序列平均測序深度為3869X,質(zhì)控信息如下表13所示。表139.拷貝數(shù)變異檢出結(jié)果如下表14所示。表14融合基因1外顯子1融合基因2外顯子2支持融合序列融合占比ALK20EML4650.1%從以上的描述中,可以看出,本發(fā)明上述的實(shí)施例實(shí)現(xiàn)了如下技術(shù)效果:本發(fā)明通過在每個原始分子上添加唯一標(biāo)簽,后續(xù)信息分析中對測序數(shù)據(jù)同一標(biāo)簽的序列合并,可以排除PCR或是測序錯誤引入的假融合序列。實(shí)施例中的0.1%低豐度的融合,一般來說在多次沒有加標(biāo)簽的測序數(shù)據(jù)中可能為有或者可能沒有,波動較大,不利于判斷樣本是不是有融合。而本發(fā)明在多次測序波動較小,對準(zhǔn)確判斷低豐度融合變異有利。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。SEQUENCELISTING<110>北京諾禾致源科技股份有限公司<120>一種低頻率基因融合的檢測方法及裝置<130>PN59542NHZY<160>49<170>PatentInversion3.5<210>1<211>46<212>DNA<213>artificial<220><223>含有隨機(jī)標(biāo)簽序列的接頭<220><221>misc_feature<222>(34)..(45)<223>nisa,c,g,ort<400>1tctacactctttccctacacgctcttccgatctnnnnnnnnnnnnt46<210>2<211>46<212>DNA<213>artificial<220><223>含有隨機(jī)標(biāo)簽序列的接頭<220><221>misc_feature<222>(35)..(46)<223>nisa,c,g,ort<400>2cactgacctcaagtctgcacacgagaaggctagannnnnnnnnnnn46<210>3<211>26<212>DNA<213>artificial<220><223>用于多重PCR擴(kuò)增的上游引物<400>3tctacactctttccctacacgacgct26<210>4<211>30<212>DNA<213>artificial<220><223>用于多重PCR擴(kuò)增的下游引物<220><221>misc_feature<223>N代表針對不同的位點(diǎn)設(shè)計的不同特異性引物<220><221>misc_feature<222>(30)..(30)<223>nisa,c,g,ort<400>4ggagttcagaccgtgtgctcttccgatctn30<210>5<211>24<212>DNA<213>artificial<220><223>NRAS_1R<400>5cacccccaggattcttacagaaaa24<210>6<211>23<212>DNA<213>artificial<220><223>NRAS_2R<400>6caagtgtgatttgccaacaagga23<210>7<211>24<212>DNA<213>artificial<220><223>NRAS_3R<400>7gttcttgctggtgtgaaatgactg24<210>8<211>26<212>DNA<213>artificial<220><223>PIK3CA_1R<400>8agaaaaccattacttgtccatcgtct26<210>9<211>25<212>DNA<213>artificial<220><223>PIK3CA_2R<400>9gcacttacctgtgactccatagaaa25<210>10<211>27<212>DNA<213>artificial<220><223>PIK3CA_3R<400>10cataagagagaaggtttgactgccata27<210>11<211>27<212>DNA<213>artificial<220><223>PIK3CA_4R<400>11caaacaagtttatatttccccatgcca27<210>12<211>24<212>DNA<213>artificial<220><223>PIK3CA_5R<400>12tgctgttcatggattgtgcaattc24<210>13<211>28<212>DNA<213>PIK3CA_6R<400>13agcatcagcatttgactttaccttatca28<210>14<211>28<212>DNA<213>artificial<220><223>PIK3CA_7R<400>14gtggaagatccaatccatttttgttgtc28<210>15<211>22<212>DNA<213>artificial<220><223>PIK3CA_8R<400>15ggttgaaaaagccgaaggtcac22<210>16<211>33<212>DNA<213>artificial<220><223>PIK3CA_9R<400>16tttaagattacgaaggtattggtttagacagaa33<210>17<211>28<212>DNA<213>artificial<220><223>PIK3CA_10R<400>17tcaatcagcggtataatcaggagttttt28<210>18<211>28<212>DNA<213>artificial<220><223>PIK3CA_11R<400>18ccttttgtgtttcatccttcttctcctg28<210>19<211>28<212>DNA<213>artificial<220><223>EGFR_1R<400>19tcagtccggttttatttgcatcatagtt28<210>20<211>23<212>DNA<213>artificial<220><223>EGFR_2R<400>20gtgccagggaccttaccttatac23<210>21<211>22<212>DNA<213>artificial<220><223>EGFR_3R<400>21tccagaccagggtgttgttttc22<210>22<211>20<212>DNA<213>artificial<220><223>EGFR_4R<400>22cggacatagtccaggaggca20<210>23<211>21<212>DNA<213>artificial<220><223>EGFR_5R<400>23ccccatggcaaactcttgcta21<210>24<211>26<212>DNA<213>artificial<220><223>EGFR_6R<400>24gcatgtgttaaacaatacagctagtg26<210>25<211>20<212>DNA<213>artificial<220><223>EGFR_7R<400>25ctgaggttcagagccatgga20<210>26<211>25<212>DNA<213>artificial<220><223>EGFR_8R<400>26cccaaagactctccaagatgggata25<210>27<211>23<212>DNA<213>artificial<220><223>MET_1R<400>27agaagttgatgaaccggtccttt23<210>28<211>27<212>DNA<213>artificial<220><223>MET_2R<400>28tctgacttggtggtaaacttttgagtt27<210>29<211>27<212>DNA<213>artificial<220><223>MET_3R<400>29gcaaaccacaaaagtatactccatggt27<210>30<211>27<212>DNA<213>artificial<220><223>MET_4R<400>30ggagacatctcacattgtttttgttga27<210>31<211>29<212>DNA<213>artificial<220><223>MET_5R<400>31cggtagtctacagattcatttgaaaccat29<210>32<211>27<212>DNA<213>artificial<220><223>MET_6R<400>32gcttttcaaaaggcttaaacacaggat27<210>33<211>23<212>DNA<213>artificial<220><223>MET_7R<400>33aggccccatacaatttgatgaca23<210>34<211>21<212>DNA<213>artificial<220><223>RET_1R<400>34ccttgttgggacctcagatgt21<210>35<211>26<212>DNA<213>artificial<220><223>RET_2R<400>35actttgcgtggtgtagatatgatcaa26<210>36<211>21<212>DNA<213>artificial<220><223>RET_3R<400>36gtggtagcagtggatgcagaa21<210>37<211>18<212>DNA<213>artificial<220><223>RET_4R<400>37ccatggtgcacctgggat18<210>38<211>22<212>DNA<213>artificial<220><223>ERBB2_1R<400>38gccatagggcataagctgtgtc22<210>39<211>23<212>DNA<213>artificial<220><223>ERBB2_2R<400>39ccttggtccttcacctaaccttg23<210>40<211>23<212>DNA<213>artificial<220><223>ERBB2_3R<400>40gtcatatctccccaaaccccaat23<210>41<211>21<212>DNA<213>artificial<220><223>ALK_1R<400>41ggaagagtggccaagattgga21<210>42<211>22<212>DNA<213>artificial<220><223>ALK_2R<400>42gcccagactcagctcagttaat22<210>43<211>29<212>DNA<213>artificial<220><223>KRAS_1R<400>43gtaaaaggtgcactgtaataatccagact29<210>44<211>27<212>DNA<213>artificial<220><223>KRAS_2R<400>44gactctgaagatgtacctatggtccta27<210>45<211>27<212>DNA<213>artificial<220><223>KRAS_3R<400>45aggcctgctgaaaatgactgaatataa27<210>46<211>27<212>DNA<213>artificial<220><223>BRAF_1R<400>46tttctttttctgtttggcttgacttga27<210>47<211>28<212>DNA<213>artificial<220><223>BRAF_2R<400>47gcttgctctgataggaaaatgagatcta28<210>48<211>41<212>DNA<213>artificial<220><223>引入index序列的上游引物<400>48aatgatacggcgaccaccgagatctacactctttccctaca41<210>49<211>44<212>DNA<213>artificial<220><223>引入index序列的下游引物<400>49caagcagaagacggcatacgagatcgtgatgtgactggagttca44當(dāng)前第1頁1 2 3