二階段混合模型的智能輔助醫(yī)療決策支持方法
【專利摘要】一種二階段混合模型的智能輔助醫(yī)療決策支持方法,包括下列主要步驟:基于減聚類方法,對真實的醫(yī)療樣本數(shù)據(jù)信息進行加權(quán)預(yù)處理,將非線性不可分的特征空間轉(zhuǎn)化為可分的線性數(shù)據(jù)特征空間;基于高效的極限學(xué)習(xí)機模型,利用預(yù)處理得到的加權(quán)特征數(shù)據(jù),通過數(shù)據(jù)自學(xué)習(xí)構(gòu)建醫(yī)療決策支持模型;基于構(gòu)建的學(xué)習(xí)模型,采用真實的醫(yī)療數(shù)據(jù),對研究對象進行分類預(yù)測,從而實現(xiàn)為目標(biāo)用戶提供可靠高效的輔助預(yù)測支持,主要優(yōu)點:(1)方法簡單,易于實現(xiàn),并且能產(chǎn)生準(zhǔn)確度很高的預(yù)測結(jié)果;(2)該方法涉及的參數(shù)較少,且參數(shù)影響較小,即需要人為干預(yù)較少,便于操作;(3)該方法計算速度極快,效率高。
【專利說明】二階段混合模型的智能輔助醫(yī)療決策支持方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于智能決策領(lǐng)域,具體涉及一種二階段混合模型的智能輔助醫(yī)療決策支持方法。
【背景技術(shù)】
[0002]智能決策是數(shù)據(jù)挖掘、模式識別和機器學(xué)習(xí)等領(lǐng)域中最活躍的研究內(nèi)容之一,它具有憑借其對數(shù)據(jù)自動學(xué)習(xí),從中提取其中隱含的規(guī)則或模型,并作出智能決策的強大能力,在現(xiàn)實中有著非常廣泛的應(yīng)用(如醫(yī)療診斷和金融風(fēng)險預(yù)測等)。
[0003]醫(yī)療診斷是智能決策技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用,通過構(gòu)建診斷系統(tǒng)輔助醫(yī)生更好地對各種疾病進行診斷。傳統(tǒng)的醫(yī)療診斷過程是醫(yī)生根據(jù)臨床經(jīng)驗對新來的病人進行推理診斷的決策過程,在很大程度上主要依賴于個人的實際經(jīng)驗,需要經(jīng)過長時間的經(jīng)驗積累才能達到足夠豐富的決策水平;同時決策過程也在很大程度上受主觀意識和外界因素干擾等影響,容易做出偏差較大的分析,影響決策的準(zhǔn)確度。原始的醫(yī)療診斷方法已經(jīng)不能滿足現(xiàn)代社會發(fā)展的需求,因此發(fā)揮計算機推理和學(xué)習(xí)能力,開發(fā)出高效高精度的智能輔助醫(yī)療診斷模型或系統(tǒng)是一個重要的發(fā)展方向。這些智能決策方法可以盡可能減少因經(jīng)驗不足造成的決策錯誤,為復(fù)雜的醫(yī)療決策支持提供準(zhǔn)確、客觀的定量分析方法,在為解決這些復(fù)雜決策問題提供客觀和科學(xué)的決策等方面具有重要意義。
[0004]泛化能力對決策模型在實際應(yīng)用中發(fā)揮效果起到至關(guān)重要的作用,然而直接應(yīng)用傳統(tǒng)的學(xué)習(xí)方法往往難以達到理想的決策效果,如何構(gòu)造出強泛化能力的學(xué)習(xí)模型為決策者提供合理科學(xué)的決策支持是目前亟待解決的難題。
[0005]智能醫(yī)療診斷的基本原理是利用已知收集到的數(shù)據(jù)捕獲其中未知的、潛在的概率分布等重要特征,數(shù)據(jù)可以看作是揭示觀察到的變量之間關(guān)系的樣本,通過對數(shù)據(jù)自動進行學(xué)習(xí),識別其中的復(fù)雜模式并作出智能決策。智能決策模型能夠根據(jù)給定的實例進行泛化以便對新的病例進行分析判斷。
[0006]目前,已提出了一些決策支持方法:
[0007]I)基于神經(jīng)網(wǎng)絡(luò)(ANN)的智能醫(yī)療診斷方法。ANN具有很強的自組織性、魯棒性和容錯性,以及非線性和并行處理能力,在醫(yī)療診斷中得到廣泛應(yīng)用,2010年,Er等提出利用多種ANN模型診斷胸部疾病,同年Ayer等利用多種ANN模型對乳腺癌診斷進行研究;
[0008]2)基于演化計算的智能醫(yī)療診斷方法。2008年,zhang提出改進的遺傳規(guī)劃(GP)方法,對兩種疾病診斷問題進行研究,和其他機器學(xué)習(xí)方法包括KNN,ANN等相比,獲得更高的分類精度,2011年,Lambrou提出基于GA的保角預(yù)測方法進行疾病診斷,實驗表明該模型不僅能達到已有模型的分類準(zhǔn)確率,還能給分類器提供可靠的置信度,并從數(shù)據(jù)中提取出易理解的可信的規(guī)則;
[0009]3)基于支持向量機(SVM)的智能醫(yī)療診斷方法。2010年,Peng提出一種結(jié)合過濾算法和打包算法的混合特征選擇,并結(jié)合SVM分類器在多種疾病進行了診斷。
[0010]但每種學(xué)習(xí)方法都有各自的優(yōu)缺點,如ANN模型的權(quán)重值需要多次計算,訓(xùn)練時間長;GA中涉及許多參數(shù)需要人為調(diào)節(jié);SVM模型的參數(shù)對結(jié)果影響很大,需要慎重選擇等,并且診斷模型大多依賴于現(xiàn)有學(xué)習(xí)模型,其泛化能力還有待進一步改善,對數(shù)據(jù)的分析不夠充分,可能存在異常值嚴(yán)重影響診斷的準(zhǔn)確率,另外,隨著學(xué)習(xí)理論和方法的不斷完善,各種新方法不斷提出,整個醫(yī)療診斷領(lǐng)域需要強泛化能力的新方法。
【發(fā)明內(nèi)容】
[0011]針對醫(yī)療診斷過度依賴經(jīng)驗積累或經(jīng)驗不足造成的決策錯誤,需要構(gòu)造出強泛化能力的診斷模型等問題,本發(fā)明的目的是提供一種二階段混合模型的智能輔助醫(yī)療決策支持方法。該方法針對醫(yī)療數(shù)據(jù),通過預(yù)處理研究潛在的分布特征,利用減聚類算法進行加權(quán)化,再結(jié)合新穎的極限學(xué)習(xí)機分類方法進行分類預(yù)測并進行評估,可以獲得更準(zhǔn)確的預(yù)測結(jié)果。
[0012]本發(fā)明提供了一種二階段混合模型的智能輔助醫(yī)療決策支持方法,所述方法包括如下步驟:
[0013]SI,基于減聚類方法,對真實的醫(yī)療樣本數(shù)據(jù)信息進行加權(quán)預(yù)處理,將非線性不可分的特征空間轉(zhuǎn)化為可分的線性數(shù)據(jù)特征空間;
[0014]S2,基于高效的極限學(xué)習(xí)機模型,利用預(yù)處理得到的加權(quán)特征數(shù)據(jù),通過數(shù)據(jù)自學(xué)習(xí)構(gòu)建醫(yī)療決策支持模型;
[0015]S3,基于S2構(gòu)建的模型,采用開源的數(shù)據(jù),對研究對象進行分類預(yù)測,從而實現(xiàn)為目標(biāo)用戶提供可靠高效的輔助預(yù)測支持。
【專利附圖】
【附圖說明】
[0016]圖1給出了二階段混合模型的智能輔助醫(yī)療決策支持方法的流程示意圖。
[0017]圖2是減聚類算法對數(shù)據(jù)樣本進行加權(quán)處理方法的流程示意圖。
[0018]圖3是真實數(shù)據(jù)帕金森疾病(Parkinsons)原始數(shù)據(jù)集在三維空間上的分布示意圖。
[0019]圖4是真實數(shù)據(jù)帕金森疾病(Parkinsons)數(shù)據(jù)集加權(quán)預(yù)處理之后在三維空間上的分布示意圖。
[0020]圖5是本發(fā)明方法進行自學(xué)習(xí)構(gòu)建學(xué)習(xí)模型的流程示意圖。
[0021]圖6是本方法與其它三種相關(guān)學(xué)習(xí)方法在四個評價指標(biāo)下得到的結(jié)果。
[0022]圖7是本方法與其它三種相關(guān)學(xué)習(xí)方法在四個評價指標(biāo)下的平均誤差。
【具體實施方式】
[0023]以下實施例用于說明本發(fā)明,現(xiàn)通過附圖和實施例對本發(fā)明作進一步的詳細描述。
[0024]本發(fā)明實施例的前提是已獲得了醫(yī)療數(shù)據(jù)樣本的特征描述以及相應(yīng)的標(biāo)簽值。
[0025]圖1為本發(fā)明實施例提供的混合模型的智能輔助醫(yī)療決策支持方法的流程示意圖,本實施例主要包括以下步驟:
[0026]步驟SI,根據(jù)給定的醫(yī)療數(shù)據(jù)樣本,按照如下方法進行數(shù)據(jù)的加權(quán)預(yù)處理:將數(shù)據(jù)樣本表示成矩陣結(jié)構(gòu)M(m,η),其中m表示樣本數(shù)目,η表示特征,首先,用減聚類方法進行聚類并計算各簇的中心值cluster_center以及數(shù)據(jù)中每個特征的平均值mean (s);
[0027]其次,按照公式(I)計算矩陣數(shù)據(jù)中特征均值在各簇中的比值:
[0028]ratios (i, j) =mean (Sj) /cluster_centerj; (I)
[0029]其中,mean (Sj)為第Sj個特征的平均值,cluster_centerj為第j個簇中心值。
[0030]最后,按照公式(2)對矩陣中的每個數(shù)據(jù)特征進行加權(quán)化處理:
[0031]weighted_features (i, j)=M(m, n) ^ratios (i, j) ; (2)
[0032]圖2為上述SI步驟所描述的減聚類算法加權(quán)化數(shù)據(jù)樣本的流程示意圖。
[0033]圖3為數(shù)據(jù)樣本在三維空間上的分布情況,實施例的數(shù)據(jù)為真實帕金森數(shù)據(jù)樣本,其中黑色實心點(.)表示患者,黑色(+)為正常(非患者)。
[0034]圖4為經(jīng)過加權(quán)化預(yù)處理之后的數(shù)據(jù)樣本在三維空間上的分布情況,與圖3對比,可見采用本發(fā)明的加權(quán)化處理方法,數(shù)據(jù)間的辨別力進一步的增強。
[0035]步驟S2,將步驟I所得到的加權(quán)化數(shù)據(jù)集作為極限學(xué)習(xí)機分類器的輸入,對數(shù)據(jù)進行分析和自學(xué)習(xí),構(gòu)建輔助醫(yī)療決策支持模型;
[0036]圖5為根據(jù)步驟S2方法構(gòu)建的決策醫(yī)療決策支持模型的流程示意圖。
[0037]步驟S3,依據(jù)步驟S2的輔助醫(yī)療決策支持模型,判斷目標(biāo)對象屬于兩分類中一類:患者和正常(非患者),并顯示出結(jié)`果。
[0038]本實施例,通過對數(shù)據(jù)進行預(yù)處理,采用減聚類算法進行聚類,并將數(shù)據(jù)樣本特征加權(quán)化處理,得到加權(quán)化之后的數(shù)據(jù)樣本,基于極限學(xué)習(xí)機分類器對新生成的數(shù)據(jù)進行分析自學(xué)習(xí),構(gòu)建輔助醫(yī)療決策支持模型,以此來進行目標(biāo)對象的分析預(yù)測,最后獲得目標(biāo)對象的預(yù)測結(jié)果和評價。
[0039]以上實施例僅用于說明本發(fā)明而非對其進行限制,有關(guān)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護范圍應(yīng)由權(quán)利要求限定。
[0040]例I本發(fā)明在真實數(shù)據(jù)帕金森數(shù)據(jù)集上的實驗結(jié)果
[0041]帕金森數(shù)據(jù)集是從數(shù)據(jù)挖掘中UCI公共數(shù)據(jù)庫獲得的,它包含195個樣本,其中樣本包含22個特征,48個正常,147個患者,年齡段是從46到85歲。例I將本發(fā)明方法應(yīng)用到此數(shù)據(jù)集上進行測試驗證,并選用四個指標(biāo)評價方法的性能,分別是準(zhǔn)確率(ACC)、靈敏性(Sensitivity)、特效性(Specificity)、AUC曲線,同時與三個相關(guān)方法進行了對比,三個對比方法分別是基于K近鄰方法(KNN)、支持向量機方法(SVM)和簡單極限學(xué)習(xí)機方法(ELM)0
[0042]圖6表示本方法在四個評價指標(biāo)下的預(yù)測結(jié)果,同時與相關(guān)的三個方法進行比較,相關(guān)的這三個方法都運行在各自最優(yōu)的參數(shù)設(shè)定下,圖6反映的實驗結(jié)果:
[0043]在ACC、Sensitivity、Specificity和AUC四個評價指標(biāo)下,本發(fā)明方法的效果均明顯好于其他三個方法,且四個指標(biāo)的預(yù)測值均高達99%以上;
[0044]圖7給出了本發(fā)明方法在四個評價指標(biāo)下的均方根誤差(RMSE),同時與相關(guān)的三個方法進行比較,相關(guān)的這三個方法都運行在各自最優(yōu)的參數(shù)設(shè)定下,圖7反映了重要的實驗結(jié)果:
[0045]在ACC、Sensitivity、Specificity和AUC四個評價指標(biāo)下,本發(fā)明方法的誤差相比于其他三個方法是最低的,這說明本發(fā)明方法計算不僅穩(wěn)定并且產(chǎn)生誤差最小。
【權(quán)利要求】
1.一種二階段混合模型的智能輔助醫(yī)療決策支持方法,其特征在于,包括如下步驟: Si,基于減聚類方法,對真實的醫(yī)療樣本數(shù)據(jù)信息進行加權(quán)預(yù)處理,將非線性不可分的特征空間轉(zhuǎn)化為可分的線性數(shù)據(jù)特征空間; S2,基于高效的極限學(xué)習(xí)機模型,利用預(yù)處理得到的加權(quán)特征數(shù)據(jù),通過數(shù)據(jù)自學(xué)習(xí)構(gòu)建醫(yī)療決策支持模型; S3,基于S2構(gòu)建的模型,采用真實的醫(yī)療數(shù)據(jù),對研究對象進行分類預(yù)測,從而實現(xiàn)為目標(biāo)用戶提供可靠高效的輔助預(yù)測支持。
2.根據(jù)權(quán)利要求1所述的二階段混合模型的智能輔助醫(yī)療決策支持方法,其特征在于,該方法采用如下的基本原理對目標(biāo)用戶進行診斷預(yù)測: 醫(yī)療數(shù)據(jù)通常具有維度高且分布復(fù)雜,根據(jù)其數(shù)據(jù)的特征分布,利用聚類加權(quán)化的方法將數(shù)據(jù)從非線性不可分的特征空間轉(zhuǎn)化到線性可分的特征空間,將特征相近的數(shù)據(jù)聚集到一起,提高數(shù)據(jù)間的分辨關(guān)系,基于這種新的數(shù)據(jù)特征空間,并結(jié)合新穎的高效高精度的分類器,進而產(chǎn)生更準(zhǔn)確的預(yù)測診斷結(jié)果。
3.根據(jù)權(quán)利要求1所述的二階段混合模型的智能輔助醫(yī)療決策支持方法,其特征在于,基于給定的醫(yī)療數(shù)據(jù),按照如下方法進行數(shù)據(jù)的加權(quán)預(yù)處理: 將醫(yī)療數(shù)據(jù)用矩陣形式表示,設(shè)M(m,η)為矩陣數(shù)據(jù),其中m表示樣本數(shù)目,η表示特征,首先,用減聚類算法計算各簇中心值cluster_center和每個特征的平均值mean ; 其次,按如下公式計算矩陣數(shù)據(jù)中每一個特征的比值: ratios (i, j) =mean (Sj) /cluster_centerj; 其中,cluster_centerj為第j個簇中心值,mean (Sj)為第S」個特征的平均值; 最后,按照如下方法矩陣中的每個數(shù)據(jù)特征進行加權(quán)化處理: weighted_features(i, j)=M(m, η)氺ratios(i, j)。
4.根據(jù)權(quán)利要求1所述的二階段混合模型的智能輔助醫(yī)療決策支持方法,其特征在于,基于加權(quán)之后的特征數(shù)據(jù),結(jié)合新穎的極限學(xué)習(xí)機分類器,對數(shù)據(jù)集樣本進行十折交叉的自學(xué)習(xí)訓(xùn)練,構(gòu)建醫(yī)療決策支持模型,十折交叉驗證是常用的測試方法,將數(shù)據(jù)分成十份,輪流將其中九份作為訓(xùn)練數(shù)據(jù),一份作為測試數(shù)據(jù)進行試驗,每次都會得出相應(yīng)的正確率,然后取十次的平均值作為算法精度的估計。
5.根據(jù)權(quán)利要求1所述的二階段混合模型的智能輔助醫(yī)療決策支持方法,其特征在于,按照如下方法計算驗證測試數(shù)據(jù)的預(yù)測結(jié)果:
【文檔編號】G06F19/00GK103714261SQ201410014993
【公開日】2014年4月9日 申請日期:2014年1月14日 優(yōu)先權(quán)日:2014年1月14日
【發(fā)明者】歐陽繼紅, 馬超, 王旭, 李錫銘, 周曉堂 申請人:吉林大學(xué)