探針及其用圖
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物技術(shù)領(lǐng)域,尤其是目標(biāo)基因高通量測(cè)序技術(shù)領(lǐng)域。具體地,本發(fā) 明涉及探針及其用途,更具體地,本發(fā)明涉及--組探轉(zhuǎn)、構(gòu)建高通量測(cè)序文庫(kù)的方法、確定 待測(cè)樣本阿X;基因編碼區(qū)核酸序列的方法、構(gòu)建高通量測(cè)序文庫(kù)的裝置W及擁定待測(cè)樣本 FLG基因編碼區(qū)核酸序列的系統(tǒng)。
【背景技術(shù)】
[0002] 尋嘗型魚(yú)鱗病(Ichthyosis vulgaris)是-----'種常染色體顯性遺傳病,該疾病的發(fā) 病率為1:250-1:1000。主耍輸床癥狀包括皮膚損害呈"魚(yú)鱗"或"蛇皮"狀,毛囊角乾丘疹, 毛孔呈點(diǎn)狀,手紋和腳紋多、深、亂。與該疾病精關(guān)的基因是位于lq2i. 3的編碼絲聚蛋白 (Filaggrin)的円X;基因,該基因是表皮分化末麗編碼結(jié)掏蛋白的基因簇的一部分。FLG基 因全長(zhǎng)12. 7 - 14. 7化,包含3個(gè)外癥子巧xon) ,Exonl (巧bp)是非編媽序列,Exon2(巧9bp) 包含起始編碼序列,Exoii3 (12-14陸)包括N末端和編碼絲聚蛋白的iO-12個(gè)長(zhǎng)度達(dá)Ik的重 復(fù)序列。目it,F(xiàn)LG基因檢測(cè)方法主要是迸行長(zhǎng)P邸,然后對(duì)長(zhǎng)PCR產(chǎn)物迸行巢式擴(kuò)增,得到 特異性的目的序列后,結(jié)合sanger測(cè)序解讀FLG序列。然而,送段序列不僅組合復(fù)雜,還具 有個(gè)體特異性,使羯該方援時(shí)常會(huì)出現(xiàn)未得到特異性序列或測(cè)序失敗,實(shí)驗(yàn)過(guò)程攝不穩(wěn)定, 導(dǎo)致不能徹底解讀FLG。另:邦,第一代測(cè)序儀同時(shí)測(cè)序的樣本數(shù)少,畳需耍先經(jīng)過(guò)PCR過(guò)程, 工作量大,通量小,檢出率不到30%。
[000幻因而,目前的FLG基因檢測(cè)方法仍有待改進(jìn)。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)詞題之一。為此,本發(fā)明的一個(gè)目的 在于提出一種能夠廣效檢測(cè)特異性序列、徹底解讀円X;基因,且實(shí)驗(yàn)過(guò)程穩(wěn)定、工作量小, 通量大的FLG基因檢測(cè)方法。
[0005] 需耍說(shuō)明的是,本發(fā)明是基于發(fā)明入的T列工作而完成的:
[0006] 發(fā)明人利羯目標(biāo)區(qū)域捕獲技術(shù),使用特異的外顯子補(bǔ)獲芯片捉入FLG基因迸行高 通量測(cè)序。該技術(shù)的基本原理是使用一套寡核巧酸探針來(lái)捕獲基因組上的目標(biāo)序列,然后 使用通用引物對(duì)送些搞獲到的序列迸行PCR擴(kuò)增,再對(duì)送些擴(kuò)增產(chǎn)物迸行高通量測(cè)序,從 而識(shí)別日NA樣品中的堿基序列,通過(guò)生物信息分析方法捉測(cè)序所得序列信息迸行分析,從 而找到目標(biāo)序列的變異信息,包括單核巧酸變異,插入/缺失,重復(fù)等,該方法兩大幅提高 円石基因的檢出率,約為83 %。
[0007] 迸而,根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一組探針。根據(jù)本發(fā)明的實(shí)施例,所 述一組探針特異'註識(shí)別FLG基因編碼區(qū)的至少一部分,且所述探針滿足選自下列條粹的至 少之一:
[0008] (1)所述探針的長(zhǎng)度為巧bp ;
[000引 城所述探鐘特異性識(shí)魏阿怎基因編媽區(qū)上游IObp至下游IObp么間的序歹ij;
[0010] 城特異性識(shí)蔚j GC含量高于0. 6及低于0. 3的區(qū)域的探針,乘數(shù)大于2 ;
[0011] (4)所述探針與目標(biāo)序列的烙解溫度為60--10攝氏度,優(yōu)選80攝氏度;
[0012] 減所述探鐘不包舊發(fā)夾結(jié)構(gòu);
[0013] ㈱所述探針與參考基因組上的至多2個(gè)位點(diǎn)匹配;
[0014] (7)所述探針選擇時(shí)的窗口滑動(dòng)大小為!0bp。
[0015] 發(fā)明人假奇蛙發(fā)現(xiàn),本發(fā)明的-一組探針,對(duì)其特異性識(shí)別的FLG基因編碼區(qū)的至 少--詔分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于迸行FLG基因編碼區(qū)的 捕獲檢測(cè)。稷據(jù)本發(fā)明的實(shí)施例,刮用本發(fā)明的一紐探軒能夠灌確育效地補(bǔ)獲探針轉(zhuǎn)異性 識(shí)別的目標(biāo)序列-------------FLG基因編與區(qū)的至少一講分,從而能夠有效構(gòu)建獲得目標(biāo)序列的核 酸測(cè)序文庫(kù),迸一步,將該核酸測(cè)序文庫(kù)用于高通量測(cè)序,能夠有效確定円.G基因編碼區(qū)的 至少一部分的序列信息,并且目標(biāo)序列的測(cè)序深度高,數(shù)據(jù)利羯率高,迸而能夠?qū)崿F(xiàn)對(duì)阿X; 基因的檢測(cè)。此外,利馬上述方法構(gòu)建高通量測(cè)序文庫(kù),并迸而用于FLG基因檢測(cè),特異性 好、靈敏度和覆蓋度高,可重復(fù)性好,從而能夠成功解讀松G基因,發(fā)現(xiàn)突變,且該方法實(shí)驗(yàn) 過(guò)程穩(wěn)定、成本低、操作簡(jiǎn)單、.衛(wèi)作量小、易推廣。
[0016] 根據(jù)本發(fā)明的另一方面,本發(fā)明提供了一種構(gòu)建高通量測(cè)序文庫(kù)的方法。根據(jù)本 發(fā)明的實(shí)施例,該方法包括F步驟;將基因組DNA片段化,W便獲得DNA片段;將所述DNA 片段迸行末端修復(fù),巧便獲得經(jīng)過(guò)末端修復(fù)的DNA片段;在所述經(jīng)過(guò)末端修復(fù)的DNA片段的 3'末端添加堿基A,W便獲得具有粘性末端A的MA片段;蔣所述具有粘性末端A的DNA片 段與接頭相連,W便獲得連接產(chǎn)物;利用前面所述的一組探鐘對(duì)所述連接產(chǎn)物迸行篩選,W 便獲得肖的片段,所述旨的片段構(gòu)成所述高通量測(cè)序文庫(kù)。
[0017] 根據(jù)本發(fā)明的實(shí)旌例,本發(fā)明所采用的一組探轉(zhuǎn)捉其特異性識(shí)別的FLG基因編與 區(qū)的至少一部分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于進(jìn)行FLG基因編 碼區(qū)的捕獲檢測(cè)。迸而,利用本發(fā)明的方援能夠準(zhǔn)確有效地捕獲探轉(zhuǎn)特異性識(shí)別的目標(biāo)序 列--FLG基因編碼區(qū)的至少一部分,構(gòu)建旨標(biāo)序列的核酸測(cè)序文庫(kù),遙而將該核酸測(cè)序文 悚用十局通黨測(cè)斤后,能夠有效滿巧FLG基因編碼梭的至少一帯;分的序列倍息,并且目柄; 序列的測(cè)序深度高,數(shù)據(jù)利用率高,進(jìn)而能夠?qū)崿F(xiàn)超F(xiàn)LG基因的檢測(cè)。此外,利用本發(fā)明的 方法構(gòu)建高通量測(cè)序文庫(kù),遙而用于FLG基因檢測(cè),特異性好、靈敏度和覆蓋度高,可重復(fù) 性好,從而能夠成功解讀FLG基因,發(fā)現(xiàn)突變,且該方法實(shí)驗(yàn)過(guò)程穩(wěn)定、成本低、操作簡(jiǎn)單、 工作量小、易推廣。
[0018] 根據(jù)本發(fā)明的又-一方畫(huà),本發(fā)明提供了一種確定待測(cè)樣本FLG基因編碼區(qū)核酸序 列釣方法。根據(jù)本發(fā)明的實(shí)施例,該方法包括W下步驟;稷據(jù)前面所述的構(gòu)建高通量測(cè)序文 庫(kù)的方法,構(gòu)建特測(cè)樣本的高通量測(cè)序文庫(kù),所述高通量測(cè)序文庫(kù)包含F(xiàn)LG基因編碼區(qū)核 酸序列;犧所述待測(cè)#本的高通量測(cè)序文庫(kù)迸行測(cè)序,W便獲得測(cè)序結(jié)果;茲及基于所述 汲賠結(jié)果,確定所述特測(cè)樣本FLG基因編碼區(qū)的核酸序列。
[001引發(fā)明人發(fā)現(xiàn),本發(fā)明所采用的一組探鐘對(duì)其特異性識(shí)別的FLG基因編碼區(qū)的至少 ----部分的捕獲轉(zhuǎn)異性好、靈敏度和覆蓋度非常高,能夠育效用于FLG基因編碼區(qū)的搞獲檢 巧ij。迸而,利羯本發(fā)明的方法能夠準(zhǔn)確有效地捕獲探針特異性識(shí)別的目標(biāo)序列-------------FLG基因 編碼區(qū)的至少一部分,構(gòu)建目標(biāo)序列的核酸測(cè)序文庫(kù),并迸行高通量測(cè)序,從而能夠有效確 定FLG基因編碼區(qū)釣至少一郭分的序列信息,并畳目標(biāo)序列釣測(cè)序深度高,數(shù)據(jù)利羯率高, 迸而能壌實(shí)現(xiàn)對(duì)FLG基因的檢測(cè)。此外,利用本發(fā)明的方法構(gòu)建高通量測(cè)序文庫(kù),并滿定待 測(cè)樣本FLG基因編碼區(qū)核酸序列,轉(zhuǎn)異性好、靈敏度和覆蓋度廣,巧重復(fù)性好,結(jié)果推確可 靠,從而能夠成功解讀FLG基因,發(fā)現(xiàn)突變,且該方法實(shí)驗(yàn)過(guò)程穩(wěn)定、成本低、操作筒單、工 作量小、易推廣。
[0020] 根據(jù)本發(fā)明的再一方面,本發(fā)明提供了一種構(gòu)建高通量測(cè)序文庫(kù)的裝置。根據(jù)本 發(fā)明的實(shí)施例,該裝置包括:片段化單元,所述片段化單元羯于將基因組MA片段化,W便 獲得日NA片段;末端修復(fù)單元,所述末端修復(fù)單元與所述片段化單元指連,用于將所述DNA 片段迸行末端修復(fù),W便獲得經(jīng)過(guò)末端修復(fù)的DNA片段;堿基A添加單元,所述堿基A添加 單元與所述末端修復(fù)單元相連,用于在所述經(jīng)過(guò)末端修復(fù)的DNA片段的3'末端添加堿基A, W便獲得具有粘性末端A的MA片段;接頭連接單元,所述接頭連接單元羯于蔣所述具有粘 性末端A的DNA片段與接頭相連,W便獲得連接產(chǎn)物;化及篩選率元,所述篩選阜元與所述 接頭連接單元相連,并設(shè)置有前面所述的一組探針,屬于利用所述一組探針對(duì)所述連接產(chǎn) 物進(jìn)行歸選,W便獲得目的片段,所述目的片段構(gòu)成所述高通量測(cè)序文庫(kù)。
[0021] 根據(jù)本發(fā)明的實(shí)施例,本發(fā)明所采用的一組探轉(zhuǎn)捉其特異性識(shí)郭的円石基因編碼 區(qū)的至少一部分的搞獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于遙行FLG基因編 碼區(qū)的顯獲檢測(cè)。進(jìn)而,利用本發(fā)明的裝置能夠準(zhǔn)確有效地捕獲探轉(zhuǎn)特異性識(shí)別的肖棟序 列-----------FLG基因編與區(qū)的至少一部分,并構(gòu)建目標(biāo)序列的核酸測(cè)序文庫(kù),迸而蔣該核酸測(cè)序 文庫(kù)用于高通量測(cè)序后,能夠有效確定FLG基因編媽區(qū)的至少一轟分的序列信息,并豆目 標(biāo)序列的測(cè)序深度高,數(shù)據(jù)利羯率高,迸而能夠有效實(shí)現(xiàn)對(duì)FLG基因的檢測(cè)。賠外,利用本 發(fā)明的裝置構(gòu)建高通量測(cè)序文庫(kù),迸而用于FLG基因檢測(cè),轉(zhuǎn)異性好、靈敏度和覆蓋度高, 可重復(fù)性好,從而能壌成功解讀FLG基因,發(fā)現(xiàn)突變,且該裝置結(jié)構(gòu)簡(jiǎn)單,適用的實(shí)驗(yàn)過(guò)程 穩(wěn)定、生產(chǎn)成本低、操作簡(jiǎn)單、易推廣。
[0曰創(chuàng)根據(jù)本發(fā)明的另一方面,本發(fā)明還提供了…-種確定待測(cè)樣本阿怎基因編碼區(qū)核酸 序列的系統(tǒng)。根據(jù)本發(fā)明的實(shí)施例,該系統(tǒng)包括;文庫(kù)構(gòu)建裝置,所述文庫(kù)構(gòu)建裝置為前面 所述的構(gòu)建高通量測(cè)序文庫(kù)的裝置,用于構(gòu)建特測(cè)樣本的高通量測(cè)序文庫(kù),所述高通量測(cè) 序文庫(kù)包含F(xiàn)LG基因編碼區(qū)核酸序列:測(cè)序裝置,所述測(cè)序裝置與所述文庫(kù)構(gòu)建裝置相連, 用于對(duì)所述待測(cè)樣本的高通量測(cè)序文庫(kù)迸行測(cè)序,W便獲得測(cè)序結(jié)果;W及分析裝置,所述 分析裝置與所述測(cè)序裝置相連,屬于基于所述測(cè)序結(jié)果,確定所述待測(cè)樣本FLG基因編碼 區(qū)的核酸序列。 的0巧]發(fā)明人發(fā)現(xiàn),本發(fā)明所采用的--組探針對(duì)其特異性識(shí)割的円X;基因編碼區(qū)的至少 --郭分的捕獲特異性好、靈敏度和覆蓋度非常高,能夠有效用于FLG基因編媽區(qū)的搞獲檢 巧ij。迸而,利屬本發(fā)明的系統(tǒng)能夠準(zhǔn)確有效地補(bǔ)獲探針特異性識(shí)副的目標(biāo)序列--FLG基因 編碼區(qū)的至少一部分,構(gòu)建目標(biāo)序列的核酸測(cè)序文庫(kù),并迸行高通量測(cè)序,從而能夠畜效擁I 定化G基因編碼區(qū)的至少--部分的序列信息,并畳目標(biāo)序列的測(cè)序深度高,數(shù)據(jù)利羯率廣, 迸而能夠?qū)崿F(xiàn)對(duì)FLG基因的檢測(cè)。此外,利用本發(fā)明的系統(tǒng)構(gòu)建高通量測(cè)序文摩,并擁定待 測(cè)樣本FLG基因編碼區(qū)核酸序列,轉(zhuǎn)異性好、靈敏度和覆蓋度高,巧重復(fù)性好,結(jié)果灌確可 需,從耐能夠成巧鮮讀FLG蟲(chóng)因,發(fā)現(xiàn)炎變,瓦該系統(tǒng)結(jié)構(gòu)簡(jiǎn)畢,饋用的實(shí)驗(yàn)過(guò)程據(jù)巧、生產(chǎn) 成本低、操作簡(jiǎn)單、易推廣。
[0024] 本發(fā)明的附加方面和優(yōu)點(diǎn)蔣在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
【附圖說(shuō)明】
[002引本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合T面附圖對(duì)實(shí)施例的搖述中將變 得明顯和容易理解,其中;
[0026] 國(guó)1顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,本發(fā)明的構(gòu)建高通量測(cè)序文庫(kù)的裝置的結(jié)構(gòu) 示意圖;
[0027] 圖2顯示了稷據(jù)本發(fā)明一個(gè)實(shí)施例,本發(fā)明的確定待測(cè)樣本FLG基因編碼區(qū)核駿 序列的.巧統(tǒng)的結(jié)構(gòu)可;意圖;
[0028] 圖3顯示了根據(jù)本發(fā)明--個(gè)實(shí)施例,插入片段的大小和分布情況;
[002引圖4顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,測(cè)序數(shù)據(jù)亂質(zhì)量分布圖;
[0030] 圖5顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,單個(gè)堿基的平巧測(cè)序錯(cuò)誤率評(píng)估結(jié)果圖; [003U 圖6顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,樣本的GC含量分布情況;
[0032] 國(guó)7顯示了根據(jù)本發(fā)明--個(gè)實(shí)施例,較差的reads的拭:(AT)含量分布情況;
[0033] 圖8顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,信息分析結(jié)果報(bào)告文件截取圖;
[0034] 圖9顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,肖標(biāo)基因 FLG的各個(gè)CDS的深度、覆蓋度的緩 計(jì)結(jié)果; 防035] 圖10顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,樣本的阜堿基深度複松分布圖;
[0036] 圖11顯示了 1畏據(jù)本發(fā)明一個(gè)實(shí)施例,經(jīng)生物信息分析后樣本FLG部分?jǐn)?shù)據(jù)截圖; 賄巧圖12墨示了根據(jù)本發(fā)明一個(gè)實(shí)施例,數(shù)據(jù)解讀的流程示意圖;
[0038] 圖13顯示了很據(jù)本發(fā)明一個(gè)實(shí)施例,突變檢測(cè)的結(jié)果;
[0039] 國(guó)14顯示了根據(jù)本發(fā)