两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

染色體三倍體檢驗(yàn)方法

文檔序號(hào):6620118閱讀:1395來(lái)源:國(guó)知局
染色體三倍體檢驗(yàn)方法
【專利摘要】本發(fā)明公開(kāi)了一種染色體三倍體檢測(cè)方法,包括:將測(cè)試樣本的測(cè)序結(jié)果比對(duì)到參考序列上,得到比對(duì)結(jié)果;將比對(duì)結(jié)果按GC含量進(jìn)行分組;根據(jù)分組結(jié)果采用相關(guān)分析法得到與待檢測(cè)染色體最相關(guān)的染色體以及相關(guān)統(tǒng)計(jì)量;對(duì)最相關(guān)的染色體以及相關(guān)統(tǒng)計(jì)量進(jìn)行回歸分析以計(jì)算待檢測(cè)染色體對(duì)應(yīng)的Z值,根據(jù)Z值與預(yù)設(shè)閾值的比較結(jié)果判斷出待檢測(cè)染色體為三倍體的概率。本發(fā)明的有益效果是:通過(guò)不同染色體的GC含量的相關(guān)性,采用典型相關(guān)分析法來(lái)確定待檢測(cè)染色體與其它染色體的相關(guān)性,進(jìn)而確定出待檢測(cè)染色體對(duì)應(yīng)的Z值,由此確定待檢測(cè)染色體為三倍體的概率,而不是計(jì)算GC修正系數(shù),避免了GC修正系數(shù)計(jì)算中引入的誤差,從而去掉GC?bias在測(cè)序中的影響。
【專利說(shuō)明】染色體三倍體檢驗(yàn)方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及基因組學(xué)及生物信息學(xué)【技術(shù)領(lǐng)域】,具體涉及無(wú)創(chuàng)產(chǎn)前診斷胎兒染色體 三倍體檢驗(yàn)方法。

【背景技術(shù)】
[0002] 染色體非整倍體病變是胎兒最常見(jiàn)的染色體畸形,對(duì)胎兒染色體非整倍體病變是 降低出生缺陷、提高出生人口素質(zhì)的重要手段。依據(jù)染色體類別不同可分為常染色體非整 倍體和性染色體非整倍體。常染色體非整倍體主要包括21-三體(唐氏綜合征)、18-三體 (愛(ài)德華氏綜合征)和13-三體(帕陶氏綜合征),其中以21-三體最為常見(jiàn)。
[0003] 目前染色體異常的產(chǎn)前診斷技術(shù)分為有創(chuàng)產(chǎn)前診斷技術(shù)和無(wú)創(chuàng)產(chǎn)前診斷技術(shù)。有 創(chuàng)產(chǎn)前診斷技術(shù)(包括絨毛取材術(shù)、羊膜腔穿刺術(shù)和經(jīng)皮臍血管穿刺)通過(guò)在妊娠期獲取 胎兒來(lái)源細(xì)胞,進(jìn)行染色體核型檢測(cè),如果發(fā)現(xiàn)并確診染色體異常,則可以于分娩前盡早終 止妊娠,但有創(chuàng)產(chǎn)前技術(shù)帶來(lái)的風(fēng)險(xiǎn)就是可能引起流產(chǎn)、感染等。孕婦外周血中胎兒游離 DNA的發(fā)現(xiàn)為無(wú)創(chuàng)產(chǎn)前診斷技術(shù)奠定了堅(jiān)實(shí)的基礎(chǔ),通過(guò)采取孕婦靜脈血,利用新一代DNA 測(cè)序技術(shù)對(duì)母體外周血中的游離DNA片段進(jìn)行測(cè)序,并將測(cè)序結(jié)果進(jìn)行生物信息學(xué)分析, 通過(guò)分析得到每條染色體檢測(cè)的堿基占所有檢測(cè)堿基的百分比,并將該值與由正常血樣所 構(gòu)建的閾值作比較,從而可以確定胎兒是否具有非整倍體異常。
[0004] 這種無(wú)創(chuàng)DNA產(chǎn)前診斷信息分析存在兩大難點(diǎn):一方面孕婦外周血中胎兒遺傳物 質(zhì)所占的比例很低,并且該比例隨著孕婦個(gè)體的差異會(huì)有明顯的不同。另一方面測(cè)序過(guò)程 中GC bias (鳥(niǎo)噪呤和胞啼陡偏差,Guanine Cytosine bias)會(huì)極大的影響診斷的精確度, 在胎兒系數(shù)很低的情況下,GC的影響會(huì)讓無(wú)創(chuàng)產(chǎn)前中三倍體的診斷更加困難。胎兒系數(shù)是 指胎兒DNA占外周血中母體DNA的比例,如果是胎兒自己的全血DNA,如存在21-三體綜合 征,則其21號(hào)染色體的深度是其它染色體的1. 5倍(即三條21號(hào)染色體/兩條正常染色 體)。但是外周血中胎兒的DNA的比例通常不可能是1,一般是0. 03-0. 3,這個(gè)比例越高, 則檢測(cè)外周血的21號(hào)染色體的深度就越容易。如果是21-三體綜合征,則21號(hào)染色體的 深度就越明顯的偏高。例如胎兒DNA的比例(即胎兒系數(shù))是0.3,那么,如果胎兒是具有 21-三體綜合征,則從母體取的外周血做的產(chǎn)前診斷中,理論上21號(hào)染色體的深度應(yīng)該是 其它染色體的深度的1. 15倍。但是一般來(lái)說(shuō)胎兒系數(shù)都很低,不會(huì)有0. 3這么高,而GC的 影響又對(duì)染色體深度的影響比較大,這也是一定要做GC修正的原因,否則低到0. 1左右的 深度差異的檢測(cè)結(jié)果通常不準(zhǔn)確。


【發(fā)明內(nèi)容】

[0005] 根據(jù)本發(fā)明的一方面提供一種染色體三倍體檢測(cè)方法,包括:將測(cè)試樣本的測(cè)序 結(jié)果比對(duì)到參考序列上,得到比對(duì)結(jié)果;根據(jù)GC含量對(duì)比對(duì)結(jié)果中各染色體進(jìn)行分組,得 到各染色體對(duì)應(yīng)的GC含量的讀長(zhǎng)序列的數(shù)目;確定第一相關(guān)統(tǒng)計(jì)量和第二相關(guān)統(tǒng)計(jì)量,所 述第一相關(guān)統(tǒng)計(jì)量為待檢測(cè)染色體與另一染色體的關(guān)于讀長(zhǎng)序列的數(shù)目的比值,所述第二 相關(guān)統(tǒng)計(jì)量為另外一對(duì)染色體的關(guān)于讀長(zhǎng)序列的數(shù)目的比值,根據(jù)典型相關(guān)分析法,計(jì)算 出使所述第一相關(guān)統(tǒng)計(jì)量與所述第二相關(guān)統(tǒng)計(jì)量之間相關(guān)關(guān)系最大的相關(guān)系數(shù),得到與所 述待檢測(cè)染色體最相關(guān)的染色體;對(duì)所述最相關(guān)的染色體以及相關(guān)系數(shù)進(jìn)行回歸分析以計(jì) 算待檢測(cè)染色體對(duì)應(yīng)的Z值,根據(jù)所述Z值與預(yù)設(shè)閾值的比較結(jié)果判斷出所述待檢測(cè)染色 體為三倍體的概率。
[0006] 依據(jù)本發(fā)明的另一方面提供一種染色體非整倍性檢測(cè)裝置,包括:數(shù)據(jù)輸入單元, 用于輸入數(shù)據(jù);數(shù)據(jù)輸出單元,用于輸出數(shù)據(jù);存儲(chǔ)單元,用于存儲(chǔ)數(shù)據(jù),其中包括可執(zhí)行 的程序;處理器,與數(shù)據(jù)輸入單元、數(shù)據(jù)輸出單元及存儲(chǔ)單元數(shù)據(jù)連接,用于執(zhí)行存儲(chǔ)單元 中存儲(chǔ)的可執(zhí)行的程序,該程序的執(zhí)行包括完成上述染色體三倍體檢測(cè)方法。
[0007] 依據(jù)本發(fā)明的再一方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)供計(jì)算機(jī)執(zhí)行的 程序,本領(lǐng)域普通技術(shù)人員可以理解,在執(zhí)行該程序時(shí),通過(guò)指令相關(guān)硬件可完成上述染色 體三倍體檢測(cè)方法的全部或部分步驟。所稱存儲(chǔ)介質(zhì)可以包括:只讀存儲(chǔ)器、隨機(jī)存儲(chǔ)器、 磁盤或光盤等。
[0008] 本發(fā)明的有益效果是:通過(guò)不同染色體的GC含量的相關(guān)性,采用典型相關(guān)分析法 來(lái)確定待檢測(cè)染色體與其它染色體的相關(guān)性,進(jìn)而確定出待檢測(cè)染色體對(duì)應(yīng)的Z值,由此 確定待檢測(cè)染色體為三倍體的概率,而不是計(jì)算GC修正系數(shù),避免了 GC修正系數(shù)計(jì)算中引 入的誤差,從而去掉GC bias在測(cè)序中的影響。

【專利附圖】

【附圖說(shuō)明】
[0009] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地 介紹,其中:
[0010] 圖1為本發(fā)明一種實(shí)施例的染色體三倍體的檢測(cè)方法的流程示意圖;
[0011] 圖2為不采用本發(fā)明的一種示例中測(cè)試樣本的相對(duì)覆蓋度的示意圖;
[0012] 圖3為本發(fā)明一種示例中染色體為i = 13、j = 1、i' = 1、j' = 4的&和氏,」, 的不意圖;
[0013] 圖4為本發(fā)明一種示例中正常染色體樣本的Z值的直方圖分布示意圖;
[0014] 圖5為本發(fā)明一種示例中正常染色體樣本的Z值的Q-Q示意圖;
[0015] 圖6為本發(fā)明一種示例中染色體為i = 18、j = 1、i' = 1、j' = 5的&和氏,」, 的不意圖;
[0016] 圖7為本發(fā)明一種示例中染色體為i = 21、j = 19、i' = 8、j'= 19的氏」和Rn, 的示意圖。

【具體實(shí)施方式】
[0017] 本發(fā)明采取一種新的思路,不再去計(jì)算GC的修正系數(shù),而通過(guò)"樣品內(nèi)比對(duì)到不 同染色體的reads受到GC的影響是一致的,S卩,不同染色體的GC bias有明顯的相關(guān)性,從 而比對(duì)到不同染色體的reads數(shù)也應(yīng)該有明顯的相關(guān)性"這個(gè)原理,通過(guò)典型相關(guān)分析的方 法,找到不同染色體應(yīng)該有在怎樣的修正系數(shù)下有最大的相關(guān)性來(lái)去除GC的影響。本發(fā)明 的方法可以對(duì)測(cè)序中GC bias的去除提供一個(gè)新的思路,且經(jīng)試驗(yàn),該方法在產(chǎn)前診斷項(xiàng)目 產(chǎn)生了良好的效果,能夠以較高的檢驗(yàn)精度給出染色體的三倍體檢驗(yàn)結(jié)果。
[0018] 下面通過(guò)【具體實(shí)施方式】結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0019] 實(shí)施例1
[0020] 依據(jù)本發(fā)明的一種實(shí)施方式,提供一種染色體三倍體檢測(cè)方法,參考圖1,包括如 下步驟S11?S17。
[0021] 步驟S11,將測(cè)試樣本的測(cè)序結(jié)果比對(duì)到參考序列上,得到比對(duì)結(jié)果。
[0022] 測(cè)試樣本是指需要進(jìn)行染色體三倍體檢測(cè)的個(gè)體,例如進(jìn)行產(chǎn)前檢測(cè)的孕婦。本 實(shí)施例中測(cè)試樣本的來(lái)源不受特別限制,例如可以選自:孕婦外周血、孕婦尿液、孕婦宮頸 胎兒脫落滋養(yǎng)細(xì)胞、孕婦宮頸粘液、胎兒有核紅細(xì)胞等,只要能夠從中提取出含有胎兒遺傳 信息的核酸樣本即可。本實(shí)施例中,測(cè)試樣本優(yōu)選為來(lái)自孕婦的含有胎兒DNA的外周血,這 樣可以對(duì)胎兒進(jìn)行無(wú)創(chuàng)產(chǎn)前檢測(cè)且樣本獲取方式簡(jiǎn)便。由于樣本中除胎兒核酸外還包含孕 婦自身核酸,因此為避免干擾檢測(cè)結(jié)果,孕婦本身應(yīng)當(dāng)無(wú)染色體三倍體問(wèn)題,當(dāng)然,這種判 斷通常是十分明顯的。在其他實(shí)施方式中,也可以使用有創(chuàng)方法獲得的樣本,例如樣本可以 來(lái)自胎兒的臍帶血、胎盤組織或絨毛膜組織、未培養(yǎng)或培養(yǎng)過(guò)的羊水細(xì)胞、絨毛組細(xì)胞等。 本實(shí)施例對(duì)從樣本中提取用于測(cè)序的核酸的方法和設(shè)備不作限定,可以采用各種已有的手 段進(jìn)行,例如商品化的核酸提取試劑盒。下文提及的正常樣本涉及正常胎兒,即胎兒無(wú)染色 體三倍體問(wèn)題。
[0023] 依據(jù)本發(fā)明的實(shí)施方式對(duì)樣本的測(cè)序方法和設(shè)備沒(méi)有特殊依賴,通常會(huì)將提取自 樣本的核酸進(jìn)行打斷,并根據(jù)所選用的測(cè)序方法進(jìn)行相應(yīng)的文庫(kù)(library)制備,然后進(jìn) 行測(cè)序。例如,可選用第三代測(cè)序平臺(tái)(Metzker ML. Sequencing technologies-the next generation. Nat Rev Genet. 2010Jan ; 11 (1) : 31-46),包括但不限于Helicos 公司的真實(shí)單 分子測(cè)序技術(shù)(True Single Molecule DNA sequencing),Pacific Biosciences 公司的單 分子實(shí)時(shí)測(cè)序(single molecule real-time (SMRTTM)),以及 Life Technologies 公司的半 導(dǎo)體測(cè)序技術(shù)等。
[0024] 測(cè)試樣本的測(cè)序結(jié)果包括多個(gè)讀長(zhǎng)序列(即reads,也稱"讀段")。序列比對(duì)是 指一個(gè)或多個(gè)核酸序列與參考序列(reference)進(jìn)行比較的過(guò)程,常見(jiàn)為將一段較短的核 酸序列(如reads)與參考基因組序列相比較,以確定較短核列在參考基因組上的位置。 在將測(cè)序結(jié)果比對(duì)到參考序列時(shí),可使用各種比對(duì)軟件,例如Tmap,BWA (Burrows-Wheeler Aligner),S0AP(Short Oligonucleotide Analysis Package),samtools 等,本實(shí)施例對(duì) 此不作限定。根據(jù)比對(duì)軟件,可采用容錯(cuò)(即允許有若干個(gè)堿基錯(cuò)配(mismatch))或不容 錯(cuò)比對(duì),采用容錯(cuò)比對(duì)時(shí),一般平均l〇〇bp允許有1?3個(gè)容錯(cuò)。這里所使用的參考序列 是已知序列,可以是預(yù)先獲得的目標(biāo)個(gè)體所屬生物類別中的任意的參考模板。例如,若目 標(biāo)個(gè)體是人類,參考序列可選擇美國(guó)國(guó)家生物技術(shù)信息中心(NCBI,national center for biotechnology information)數(shù)據(jù)庫(kù)中的人類基因組參考序列。本實(shí)施方式中,參考序列 選擇為NCBI數(shù)據(jù)庫(kù)中版本37. 3(hgl9 ;NCBI Build37. 3)的人類基因組參考序列。
[0025] 在本實(shí)施例中,將原始reads (即測(cè)試樣本的測(cè)序結(jié)果)比對(duì)到reference時(shí),只 選取unique比對(duì)的reads (即只比對(duì)到一個(gè)位置上的reads,又稱唯一比對(duì)序列unique kmer,是指定位到參考序列唯一位置的序列)或者說(shuō)是0錯(cuò)配(即(Mismatch)的reads, 以盡量減少測(cè)序錯(cuò)誤導(dǎo)致的對(duì)數(shù)據(jù)分析的影響,因?yàn)榉莡nique的reads可能比對(duì)到多個(gè)染 色體,對(duì)染色體的深度產(chǎn)生影響。對(duì)于X和Y染色體,為了計(jì)算胎兒系數(shù)和辨別性別更加準(zhǔn) 確,一種實(shí)施例中還再去掉lmismatch下會(huì)比對(duì)到其它染色體的reads。
[0026] 步驟S13,將比對(duì)結(jié)果(即步驟S11比對(duì)后選取出的reads)按GC值(又稱GC含 量)進(jìn)行分組,即統(tǒng)計(jì)比對(duì)到染色體為i、GC值為γ的reads個(gè)數(shù),將其記為n iiY。
[0027] 對(duì)于一個(gè)測(cè)試樣本,可以根據(jù)測(cè)試結(jié)果計(jì)算該測(cè)試樣本的GC含量。分組的數(shù)目 是按照reads的長(zhǎng)度決定,例如,若reads的長(zhǎng)度為35bp,則對(duì)應(yīng)有35個(gè)GC值,從0/35到 35/35(即0到1)。實(shí)施例中,染色體i是染色體1-46號(hào)染色體中的任一個(gè)。
[0028] 步驟S15,對(duì)分組結(jié)果采用相關(guān)分析法找出與待檢測(cè)染色體i最相關(guān)的染色體。
[0029] 典型相關(guān)分析法是為了找出兩組變量軋A2, A3,…,Ap和&,B2, B3,…,Bp之間 的相關(guān)關(guān)系而分別對(duì)兩組變量求線性組合A' = Afap A2*a2, A3*a3,…,Ap*ap和B' = Bfbi,B2*b2, B3*b3,…,Bp*bp,使得線性組合后的兩個(gè)變量A'和B'相關(guān)性最大。本實(shí)施例是 通過(guò)統(tǒng)計(jì)學(xué)的方法找到和染色體i關(guān)聯(lián)最強(qiáng)(即相關(guān)性最高)的一些染色體,并利用這些 染色體和染色體i的相關(guān)關(guān)系進(jìn)行回歸,從而對(duì)染色體i進(jìn)行檢測(cè)。而在本實(shí)施例中,假設(shè) 存在染色體i、j、i'、j'(j尹i,j'尹i',i'尹i,i'尹j'),則可以通過(guò)典型相關(guān)分析法 找出使這四條染色體相關(guān)性最大的可能。
[0030] 簡(jiǎn)明起見(jiàn),將染色體為i、GC值為γ的reads個(gè)數(shù)niY與染色體為j、GC值為γ 的reads個(gè)數(shù)njY的比值記為RijY (即RijY = (niY/njY)),其中i是待檢測(cè)的染色體,j是 除染色體i外的其它染色體。由于相同GC值的reads對(duì)應(yīng)的不同染色體的GC bias在一 次測(cè)序中相同,所以RijY理論上只與染色體為i、j且GC值為γ相關(guān)的量,與其它 成正比,其中 Ri,j,γ,含乂類似 Rij γ,即 Ri,j,γ,= (IV γ,/llj,γ,)。
[0031] 也就是說(shuō),對(duì)于本實(shí)施例,RijY和Ri,j,γ,分別代表這四個(gè)染色體i、j、i'、j'所組 成的兩組向量(例如兩個(gè)s*35的矩陣,s表示樣本的總個(gè)數(shù)),需要利用典型相關(guān)分析法找 出兩個(gè)系數(shù)向里 γ 和 %,j,γ,,使1% …+Rij35*aij35 和 Ri,j,l*ai,j,1 +氏,」,2%,」,2+氏,」,3%,」,3+-+氏,」, 35%,」,35這兩個(gè)新的線性組合后的向量相關(guān)性最大。因?yàn)?如果相關(guān)性越高,則后續(xù)做回歸分析時(shí),回歸后殘差的標(biāo)準(zhǔn)差就越小,而殘差標(biāo)準(zhǔn)差越小, 則用于計(jì)算的染色體Z值就越精確,由此可以提高染色體檢驗(yàn)結(jié)果。
[0032] 本實(shí)施例中,計(jì)算氏」作為染色體i和染色體j之間的比值,即
[0033]

【權(quán)利要求】
1. 一種染色體三倍體檢測(cè)方法,其特征在于,包括: 將測(cè)試樣本的測(cè)序結(jié)果比對(duì)到參考序列上,得到比對(duì)結(jié)果; 根據(jù)GC含量對(duì)比對(duì)結(jié)果中各染色體進(jìn)行分組,得到各染色體對(duì)應(yīng)的GC含量的讀長(zhǎng)序 列的數(shù)目; 確定第一相關(guān)統(tǒng)計(jì)量和第二相關(guān)統(tǒng)計(jì)量,所述第一相關(guān)統(tǒng)計(jì)量為待檢測(cè)染色體與另一 染色體的關(guān)于讀長(zhǎng)序列的數(shù)目的比值,所述第二相關(guān)統(tǒng)計(jì)量為另外一對(duì)染色體的關(guān)于讀長(zhǎng) 序列的數(shù)目的比值,根據(jù)典型相關(guān)分析法,計(jì)算出使所述第一相關(guān)統(tǒng)計(jì)量與所述第二相關(guān) 統(tǒng)計(jì)量之間相關(guān)關(guān)系最大的相關(guān)系數(shù),得到與所述待檢測(cè)染色體最相關(guān)的染色體; 對(duì)所述最相關(guān)的染色體以及所述相關(guān)系數(shù)進(jìn)行回歸分析以計(jì)算待檢測(cè)染色體對(duì)應(yīng)的Z 值,根據(jù)所述Z值與預(yù)設(shè)閾值的比較結(jié)果判斷出所述待檢測(cè)染色體為三倍體的概率。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定第一相關(guān)統(tǒng)計(jì)量和第二相關(guān)統(tǒng) 計(jì)量這一步驟包括: 計(jì)算第一相關(guān)統(tǒng)計(jì)量氏0和第二相關(guān)統(tǒng)計(jì)量RiM,Y,,Rm表示第一讀長(zhǎng)序列的數(shù)目n iY 與第二讀長(zhǎng)序列的數(shù)目nh的比值,所述第一讀長(zhǎng)序列對(duì)應(yīng)待檢測(cè)染色體i且GC分量為 Y,所述第二讀長(zhǎng)序列對(duì)應(yīng)染色體j且GC分量為γ,&,」,γ,表示第三讀長(zhǎng)序列的數(shù)目rv γ, 與第四讀長(zhǎng)序列的數(shù)目IV γ,的比值,所述第三讀長(zhǎng)序列對(duì)應(yīng)待檢測(cè)染色體i'且GC分量為 Y',所述第四讀長(zhǎng)序列對(duì)應(yīng)染色體j'且GC分量為γ' ; 計(jì)算待檢測(cè)染色體i與另一個(gè)染色體j之間的第一相關(guān)統(tǒng)計(jì)量Rm計(jì)算公式為
計(jì)算另外一對(duì)染色體i'和j'之間的第二相關(guān)統(tǒng)計(jì)量Rq,,計(jì)算公式為
其中和aq,γ,均為相關(guān)系數(shù)。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)典型相關(guān)分析法,計(jì)算出使所述 第一相關(guān)統(tǒng)計(jì)量與所述第二相關(guān)統(tǒng)計(jì)量之間相關(guān)關(guān)系最大的相關(guān)系數(shù),得到與所述待檢測(cè) 染色體最相關(guān)的染色體這一步驟包括: 所述相關(guān)系數(shù)的計(jì)算公式為{30 4,」,¥,}=3找11^(〇〇1'(1^,1^,」,)),其中31」¥和 ai,j,γ,為待計(jì)算的相關(guān)系數(shù),c〇r (Rij,氏,j,)表不求取Rij和氏,j,的相關(guān)系數(shù); 所述與所述待檢測(cè)染色體最相關(guān)的染色體包括多組使Ru和Ru,相關(guān)系數(shù)較高的染色 體j、i'和j',i表示待染色體。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述最相關(guān)的染色體以及所述相 關(guān)系數(shù)進(jìn)行回歸分析以計(jì)算待檢測(cè)染色體對(duì)應(yīng)的Z值這一步驟包括: 構(gòu)建染色體關(guān)系模型,所述模型為:如果染色體k正常,則Rta = α + β RkV + ε,如果染 色體k為三倍體,則
,其中m、m'和k'為不同于k的染色體,Rta為 染色體k與m之間的統(tǒng)計(jì)量,RkVS染色體k'與m'之間的統(tǒng)計(jì)量,α和β為待求取的系 數(shù),ε為殘差,e為胎兒系數(shù); 根據(jù)所述最相關(guān)的染色體以及相關(guān)統(tǒng)計(jì)量,采用最小二乘法對(duì)所述模型進(jìn)行計(jì)算,得 到α和β,并估算出殘差ε及殘差的標(biāo)準(zhǔn)差δ ; 所述待檢測(cè)染色體對(duì)應(yīng)的Ζ值等于所述殘差與殘差的標(biāo)準(zhǔn)差的比值,對(duì)于正常 的染色體,其Ζ值服從標(biāo)準(zhǔn)正態(tài)分布,對(duì)于三倍體染色體,其Ζ值服從的正態(tài)分布為
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述Ζ值與預(yù)設(shè)閾值的比較結(jié)果 判斷出所述待檢測(cè)染色體為三倍體的概率這一步驟包括:比較所述Ζ值與預(yù)設(shè)閾值,如果 所述Ζ值大于等于所述預(yù)設(shè)閾值,則判斷所述待染色體為三倍體,如果所述Ζ值小于所述預(yù) 設(shè)閾值,則判斷所述待染色體為正常染色體。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述比對(duì)結(jié)果僅包括定位到所述參考序 列唯一位置的序列。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述序列為35bp。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述測(cè)試樣本的來(lái)源選自以下至少一種: 孕婦外周血、孕婦尿液、孕婦宮頸胎兒脫落滋養(yǎng)細(xì)胞、孕婦宮頸粘液和胎兒有核紅細(xì)胞。
【文檔編號(hào)】G06F19/10GK104156631SQ201410335037
【公開(kāi)日】2014年11月19日 申請(qǐng)日期:2014年7月14日 優(yōu)先權(quán)日:2014年7月14日
【發(fā)明者】張鳴, 王俊, 鄭偉謀 申請(qǐng)人:天津華大基因科技有限公司, 深圳華大基因醫(yī)學(xué)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
玉环县| 呈贡县| 邵阳市| 青神县| 新巴尔虎左旗| 苍山县| 辽中县| 通辽市| 香港 | 锦屏县| 永和县| 双柏县| 永丰县| 西青区| 庆元县| 稷山县| 沐川县| 虎林市| 香格里拉县| 霞浦县| 隆子县| 阳原县| 云和县| 仙桃市| 昌乐县| 中超| 武宁县| 垫江县| 论坛| 阿荣旗| 台南市| 大同县| 宣城市| 资兴市| 芒康县| 沙田区| 乌鲁木齐县| 鱼台县| 华容县| 宁都县| 阿坝县|