Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多重填補(bǔ)法的缺失值處理的方法
【專利摘要】本發(fā)明公開了一種Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多重填補(bǔ)法的缺失值處理的方法,其特點(diǎn)是:以貝葉斯概率論為基點(diǎn),以馬爾可夫蒙特卡洛(MCMC)隨機(jī)模擬方法為導(dǎo)向,基于多重填補(bǔ)法的缺失值處理,應(yīng)用于任意缺失模式的Meta分析數(shù)據(jù)缺失狀態(tài)下,實(shí)現(xiàn)將缺失值處理與常規(guī)Meta分析中缺失數(shù)據(jù)集的一體化整合。該方法可最大程度的擬合缺失數(shù)據(jù),以盡可能地保證提取數(shù)據(jù)的完整性和后續(xù)標(biāo)準(zhǔn)統(tǒng)計(jì)的可行性,顯著提升Meta分析的統(tǒng)計(jì)檢驗(yàn)效能,增強(qiáng)系統(tǒng)評價(jià)結(jié)果的穩(wěn)健性和可靠性,增強(qiáng)對系統(tǒng)綜述評價(jià)的科學(xué)性和全面性。
【專利說明】Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多重填補(bǔ) 法的缺失值處理的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及醫(yī)學(xué)統(tǒng)計(jì)學(xué)領(lǐng)域,尤其涉及一種Meta分析數(shù)值缺失狀態(tài)下MCMC模擬 導(dǎo)向的基于多重填補(bǔ)法的缺失值處理的方法。
【背景技術(shù)】
[0002] 在生物醫(yī)學(xué)領(lǐng)域,Meta分析是對具有相同研究目的的多個(gè)獨(dú)立小樣本的臨床試驗(yàn) 及基礎(chǔ)實(shí)驗(yàn)研究的結(jié)果進(jìn)行系統(tǒng)分析和定量綜合,以提高統(tǒng)計(jì)檢驗(yàn)的效能和增加效應(yīng)值估 計(jì)的精確度,解決各研究結(jié)果的不一致性以及尋求新的假說。Meta分析在臨床診斷技術(shù)準(zhǔn) 確性的評估和優(yōu)選、臨床治療效果的評價(jià)和優(yōu)化、病因?qū)W因果關(guān)聯(lián)的評估、疾病預(yù)防干預(yù)的 評價(jià)、疾病防治的成本效益分析、衛(wèi)生經(jīng)濟(jì)學(xué)研究、衛(wèi)生服務(wù)評價(jià)、衛(wèi)生決策及衛(wèi)生管理評 價(jià)中有著廣泛而深刻的應(yīng)用價(jià)值,有助于將有限的醫(yī)療資源更為合理地運(yùn)用在那些已經(jīng)在 適當(dāng)設(shè)計(jì)的評估中表現(xiàn)出有效的衛(wèi)生健康服務(wù)的方式上。
[0003] 在Meta分析中,對納入的獨(dú)立小樣本的臨床試驗(yàn)及基礎(chǔ)實(shí)驗(yàn)研究進(jìn)行數(shù)據(jù)提取 及分析過程中,因個(gè)別臨床研究在采集、填寫、錄入等過程中的隨機(jī)因素或人為因素,往往 有部分?jǐn)?shù)據(jù)的刪失以至于不能提取到需要研究的全部相關(guān)數(shù)據(jù)。缺失數(shù)據(jù)對Meta分析的 統(tǒng)計(jì)和研究推論往往造成不利影響:由于受試者部分?jǐn)?shù)據(jù)的缺失,使得受試者的數(shù)據(jù)在統(tǒng) 計(jì)分析時(shí)無效或不可靠,以致有效樣本量減少,繼而導(dǎo)致臨床結(jié)果的可靠性難以得到保障 和研究結(jié)論出現(xiàn)偏差。當(dāng)前對于研究數(shù)據(jù)的缺失,常規(guī)采取聯(lián)系其研究的原作者,以索取更 為詳細(xì)的相關(guān)資料和數(shù)據(jù),但是因?yàn)檠芯堪l(fā)表的年代差距因素或者實(shí)驗(yàn)本身的局限性因素 等諸多因素,缺失的數(shù)據(jù)往往未能得以完好的補(bǔ)充;有時(shí)在聯(lián)系原作者索取未果情況下,不 得已要將有缺失數(shù)據(jù)的某研究排除。尤其當(dāng)完全觀測數(shù)據(jù)和不完全觀測數(shù)據(jù)存在系統(tǒng)差異 時(shí),常規(guī)處理方法得到的結(jié)果通常不能代表整體,這樣可增大Meta分析的統(tǒng)計(jì)方差,降低 檢驗(yàn)效能,影響系統(tǒng)評價(jià)的穩(wěn)定性和可信度,降低評估的精確性和損耗隨機(jī)化的效果,以致 作出偏倚性結(jié)論,無法得到科學(xué)合理的解釋。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明主要目的在于提供一種Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多 重填補(bǔ)法的缺失值處理的方法,其特征在于以貝葉斯概率論為基點(diǎn),以馬爾可夫蒙特卡洛 (Markov Chain Monte Carlo algorithm,MCMC)隨機(jī)模擬方法為導(dǎo)向,基于多重填補(bǔ)法的 缺失值處理,應(yīng)用于任意缺失模式的Meta分析數(shù)據(jù)缺失狀態(tài)下,實(shí)現(xiàn)將缺失值處理與常規(guī) Meta分析中數(shù)據(jù)提取缺失的一體化整合。在Meta分析對數(shù)據(jù)提取的過程中,基于Meta分 析數(shù)據(jù)缺失狀態(tài)下的假設(shè),以貝葉斯理論為原理,以缺失值處理分析為解決策略,以缺失的 定量及等級(jí)資料為填充對象,以馬爾可夫蒙特卡洛隨機(jī)模擬方法為導(dǎo)向,以多重填補(bǔ)法作 為缺失數(shù)據(jù)處理與模型的契合點(diǎn),最大程度的擬合缺失數(shù)據(jù)集,彌補(bǔ)納入研究數(shù)據(jù)缺失的 不足,以盡可能地保證提取數(shù)據(jù)的完整性和后續(xù)標(biāo)準(zhǔn)統(tǒng)計(jì)的可行性,顯著提升Meta分析的 統(tǒng)計(jì)檢驗(yàn)效能,增強(qiáng)系統(tǒng)評價(jià)結(jié)果的穩(wěn)健性和可靠性,避免了在Meta分析中獨(dú)立研究因數(shù) 據(jù)缺失而被排除的局限性,增強(qiáng)對系統(tǒng)綜述評價(jià)的科學(xué)性和全面性。
[0005] 本發(fā)明的有益效果為:Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多重填補(bǔ) 法的缺失值處理的方法,有效論證了缺失值處理在Meta分析數(shù)據(jù)缺失狀態(tài)下應(yīng)用的可行 性,強(qiáng)化了馬爾可夫蒙特卡洛隨機(jī)模擬方法在多重填補(bǔ)缺失處理中應(yīng)用,也開創(chuàng)了在Meta 分析數(shù)據(jù)缺失狀態(tài)下缺失值處理的先例。缺失值處理在Meta分析的數(shù)據(jù)處理中的應(yīng)用,最 大程度的保證提取數(shù)據(jù)的完整性,能夠解決有缺失數(shù)據(jù)資料中相對普遍的問題,尤其當(dāng)數(shù) 據(jù)呈任意缺失模式時(shí),可以運(yùn)用MCMC模型來處理復(fù)雜的數(shù)據(jù)缺失問題,提高統(tǒng)計(jì)效率;還 可有效避免均值填充法易使變量分布扭曲,使替代后的分布更接近真值。該方法是對缺失 處理在循證醫(yī)學(xué)領(lǐng)域的拓展和創(chuàng)新,也是對現(xiàn)有Meta分析的發(fā)展和完善,有利于使Meta分 析更加科學(xué)規(guī)范化、精確具體化和綜合全面化。
【專利附圖】
【附圖說明】
[0006] 附圖1為本發(fā)明的一種實(shí)施例的示意圖。
【具體實(shí)施方式】
[0007] 本發(fā)明的具體方法由以下實(shí)施例及其附圖1給出。
[0008] 附圖1是根據(jù)本發(fā)明提出的Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多重 填補(bǔ)法的缺失值處理的方法的流程圖。下面結(jié)合圖1詳細(xì)說明依據(jù)本發(fā)明提出的具體方 法。
[0009] (1)馬爾可夫蒙特卡洛(MCMC)導(dǎo)向的多重填補(bǔ)法主要包括3個(gè)關(guān)鍵步驟:分別是 對目標(biāo)估計(jì)量的估計(jì)(即對研究變量的某種估計(jì)),嵌入借補(bǔ)值、創(chuàng)建完全數(shù)據(jù)集(即主要完 成對借補(bǔ)值的估計(jì)),以及合并對目標(biāo)估計(jì)量的估計(jì)結(jié)果。其中,對缺失數(shù)據(jù)的借補(bǔ)值的估 計(jì)正是目標(biāo)估計(jì)量的估計(jì)的關(guān)鍵所在。
[0010] (2)從貝葉斯概率論出發(fā),多重填補(bǔ)用Ymis的后驗(yàn)預(yù)測分布表征Ymis的相關(guān)信息, MCMC方法可借助馬爾可夫鏈構(gòu)造或者模擬該后驗(yàn)分布。應(yīng)用MCMC方法構(gòu)造一個(gè)有效的 馬爾可夫鏈,從而獲得對該概率分布偽隨機(jī)抽樣。根據(jù)給定的參數(shù)Θ初始值Θ 及Y(As, 多次迭代得到馬氏鏈(Y(1)mis,e(1)),(Y (2)mis,θ?),…,以1^,θω),…。從馬氏鏈中可 抽得一個(gè)數(shù)據(jù)擴(kuò)充鏈Y (k)mis,Y(2k)mis,Y(3k)mis,…,Y(nk)mis…??蓮臄?shù)據(jù)擴(kuò)充鏈中得到Y(jié)mis,當(dāng) k足夠大時(shí)馬氏鏈在(Ymis,Θ | Y(As)處收斂,并且得到鄰近的、相互獨(dú)立的兩個(gè)借補(bǔ)值。
[0011] (3)當(dāng)預(yù)處理服從多元正態(tài)分布的數(shù)據(jù)時(shí),MCMC須進(jìn)行以下三步: 初始值:計(jì)算已有觀測數(shù)據(jù)的均值與協(xié)方差矩陣,以便估計(jì)參數(shù)的后驗(yàn)分布;I-步:依 據(jù)與既定Ymis分布進(jìn)行偽隨機(jī)抽樣,從中逐次收集借補(bǔ)值;P-步:根據(jù)與缺失數(shù)據(jù) 借補(bǔ)值 Y(k+1)mis 求得 9(k+1)。
[0012] (4)多重借補(bǔ)的有限次借補(bǔ):在理想狀態(tài)下,重復(fù)借補(bǔ)理論認(rèn)為,無限次的借補(bǔ)時(shí), 該估計(jì)的均值正是對缺失數(shù)據(jù)的估計(jì)?;谡撟C有限次借補(bǔ)公式RE=1A1+λ/ m)為有限次 借補(bǔ)時(shí)相對效率,MI的高效估計(jì)與借補(bǔ)的數(shù)量、缺失數(shù)據(jù)的比率之間關(guān)系密切。優(yōu)良的估 計(jì)參數(shù)還要求盡可能小的標(biāo)準(zhǔn)誤估計(jì)、盡量窄的置信區(qū)間等。實(shí)踐中,良好的置信區(qū)間與 假設(shè)檢驗(yàn)均需要進(jìn)行一定數(shù)量的借補(bǔ),那么允許的條件下應(yīng)用多重填補(bǔ)法處理數(shù)據(jù)時(shí)應(yīng)進(jìn) 行10次或者更多次的借補(bǔ)。
【權(quán)利要求】
1. 一種Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多重填補(bǔ)法的缺失值處理的方 法,其特征在于,以馬爾可夫蒙特卡洛(MCMC)隨機(jī)模擬方法為導(dǎo)向,基于多重填補(bǔ)法的缺失 值處理,應(yīng)用于任意缺失模式的Meta分析數(shù)據(jù)缺失狀態(tài)下,實(shí)現(xiàn)將缺失值處理與常規(guī)Meta 分析中缺失數(shù)據(jù)集的一體化整合。
2. 如權(quán)利要求1所述的一種Meta分析數(shù)值缺失狀態(tài)下MCMC模擬導(dǎo)向的基于多重填 補(bǔ)法的缺失值處理的方法,特征在于,在Meta分析對納入研究的數(shù)據(jù)提取的過程中,基于 Meta分析數(shù)據(jù)缺失狀態(tài)下的假設(shè),以貝葉斯概率論為基點(diǎn),以缺失值處理分析為解決策略, 以缺失的定量及等級(jí)資料為填充對象,以馬爾可夫蒙特卡洛(MCMC)隨機(jī)模擬方法為導(dǎo)向, 以多重填補(bǔ)作為缺失數(shù)據(jù)處理與模型的契合點(diǎn),以盡可能最大程度的擬合Meta分析缺失 數(shù)據(jù)集。
【文檔編號(hào)】G06F19/00GK104091094SQ201410376311
【公開日】2014年10月8日 申請日期:2014年8月3日 優(yōu)先權(quán)日:2014年8月3日
【發(fā)明者】劉鴻 申請人:劉鴻, 周潔