數(shù)據(jù)分析裝置以及保健事業(yè)支援方法
【專利摘要】一種數(shù)據(jù)分析裝置以及保健事業(yè)支援方法,將實例配置在適當?shù)木S度的空間。一種分析系統(tǒng),具有處理器和存儲器,對數(shù)據(jù)進行分析,所述分析系統(tǒng)能夠訪問保存包含實例間的類似度的數(shù)據(jù)間類似度信息的存儲裝置,所述分析系統(tǒng)具備:數(shù)據(jù)映射部,所述處理器基于所述數(shù)據(jù)間類似度信息設定作用于所述實例間的引力和斥力,將所述實例在某維度的矢量空間配置成,所述引力和斥力的能量小于預先確定的閾值;以及聚類分析部,對配置在所述矢量空間的實例進行分類,其中,所述數(shù)據(jù)映射部在所述矢量空間中虛擬地追加一個維度,使所述實例的坐標向所述追加的維度方向微小變動,計算對于所述微小變動而言為穩(wěn)定的矢量空間的最小的維度數(shù)。
【專利說明】數(shù)據(jù)分析裝置以及保健事業(yè)支援方法
【技術領域】
[0001]本發(fā)明涉及一種數(shù)據(jù)分析技術,特別是涉及一種對醫(yī)療數(shù)據(jù)進行分析來支援保健事業(yè)的系統(tǒng)。
【背景技術】
[0002]健康保險組合為了降低醫(yī)療費而進行著實施用于生活習慣病的預防和重癥化的預防的保健指導的保健事業(yè)。但是,為保健指導所能夠確保的保健師以及用于保健指導的費用等資源有限。因此,期望支援有效且高效的保健事業(yè)的運營的系統(tǒng)。
[0003]作為支援保健事業(yè)的運營的方法,專利文獻I中記載了如下保健事業(yè)支援系統(tǒng):該保健事業(yè)支援系統(tǒng)基于診療費用賬單信息、體檢信息以及保健指導信息,選擇保健指導對象者,該保健事業(yè)支援系統(tǒng)具備:醫(yī)療費模型制作部,制作表示針對每個健康保險加入者的重癥度和檢查值的預測醫(yī)療費的醫(yī)療費模型;檢查值改善模型制作部,制作表示針對每個重癥度和檢查值的改善量的檢查值改善模型;預測醫(yī)療費削減效果計算部,針對每個重癥度和檢查值計算保健指導所帶來的預測醫(yī)療費削減量;以及對象者選擇部,選擇屬于預測醫(yī)療費削減量高的重癥度和檢查值的健康保險加入者作為保健指導對象者。
[0004]專利文獻1:日本特開2012-128670號公報
[0005]非專利文獻1:Y.F.Hu, “Efficient, High Quality Force-Directed GraphDrawing,,,The Mathematica Journal, vol.10,n0.1,pp.37-71,2006
[0006]為了在健康保險組合的資源中進行有效且高效的保健事業(yè),需要選擇優(yōu)先實施保健指導的對象者。另外,保健指導的內(nèi)容也需要選擇適于各個對象者的內(nèi)容。
[0007]在專利文獻I中,在預測醫(yī)療費時,基于當前的重癥度和檢查值預測將來的醫(yī)療費。例如基于當前的糖尿病的重癥度和血糖值預測將來的糖尿病的重癥度,將該重癥度的平均的醫(yī)療費作為預測醫(yī)療費。
[0008]但是,關于對于將來的醫(yī)療費和重癥度的預測有效的因素(在糖尿病中為血糖值),需要作為現(xiàn)有知識通過人工進行設定。另外,重癥度的定義也需要通過人工進行設定。
[0009]關于對于將來的醫(yī)療費的預測有效的因素,除了血糖值以外,還考慮年齡、性別、其它檢查值、藥品的處方狀況以及生活習慣等各種因素,通過考慮它們,能夠進行精度更高的預測。但是,難以通過人工列出這些因素。另外,需要針對每個疾病根據(jù)現(xiàn)有知識設定這些因素。因此,難以針對所有疾病進行分析。
【發(fā)明內(nèi)容】
[0010]示出在本申請中公開的發(fā)明的代表性一例則如下。即,一種分析系統(tǒng),具有執(zhí)行程序的處理器以及保存所述程序的存儲器,通過執(zhí)行所述程序來對數(shù)據(jù)進行分析,所述分析系統(tǒng)能夠訪問保存包含實例間的類似度的數(shù)據(jù)間類似度信息的存儲裝置,所述分析系統(tǒng)具備:數(shù)據(jù)映射部,所述處理器基于所述數(shù)據(jù)間類似度信息,設定作用于所述實例間的引力和斥力,將所述實例在某維度的矢量空間配置成,所述引力和斥力的能量小于預先確定的閾值;以及聚類分析部,對配置在所述矢量空間的實例進行分類,所述數(shù)據(jù)映射部在所述矢量空間中虛擬地追加一個維度,使所述實例的坐標向所述追加的維度方向微小變動,計算對于所述微小變動而言為穩(wěn)定的矢量空間的最小的維度數(shù)。
[0011]發(fā)明效果
[0012]根據(jù)本發(fā)明的代表性實施方式,能夠基于實例間的類似度將實例配置在適當?shù)木S度的矢量空間中。因此,能夠通過以往的聚類分析方法對實例適當?shù)剡M行分類。前述以外的問題、結構以及效果會通過以下的實施例的說明而變得清楚。
【專利附圖】
【附圖說明】
[0013]圖1是表示第2實施例的醫(yī)療數(shù)據(jù)分析系統(tǒng)的結構的框圖。
[0014]圖2是表示第I實施例的數(shù)據(jù)聚類分析裝置的結構的框圖。
[0015]圖3是說明第I實施例的數(shù)據(jù)間類似度信息的圖。
[0016]圖4是說明本發(fā)明的關聯(lián)技術的圖。
[0017]圖5是第I實施例的數(shù)據(jù)映射部的處理的流程圖。
[0018]圖6是說明第2實施例的診療費用賬單基本信息的圖。
[0019]圖7是說明第2實施例的體檢信息的圖。
[0020]圖8是說明第2實施例的問診信息的圖。
[0021 ]圖9是說明第2實施例的傷病名信息的圖。
[0022]圖10是說明第2實施例的傷病名分類信息的圖。
[0023]圖11是說明第2實施例的診療行為信息的圖。
[0024]圖12是說明第2實施例的診療行為分類信息的圖。
[0025]圖13是說明第2實施例的藥品信息的圖。
[0026]圖14是說明第2實施例的藥品分類信息的圖。
[0027]圖15是說明第2實施例的整形信息的一例的圖。
[0028]圖16A是說明第2實施例的整形信息的另一例的圖。
[0029]圖16B是第2實施例的項目合并處理的流程圖。
[0030]圖17A是第2實施例的面向健康保險事業(yè)者的支援功能的處理的流程圖。
[0031]圖17B是第2實施例的面向擔當者/對象者的支援功能的處理的流程圖。
[0032]圖18A是第2實施例的群組特征附加處理的流程圖。
[0033]圖18B是說明第2實施例的所選定的項目和值的顯示例的圖。
[0034]圖19是第2實施例的重構處理的流程圖。
[0035]附圖標記說明
[0036]101:醫(yī)療數(shù)據(jù)分析裝置
[0037]102,202:輸入部
[0038]103,203:輸出部
[0039]104、204:運算裝置
[0040]105,205:存儲器
[0041]106、206:存儲介質(zhì)
[0042]107:數(shù)據(jù)整形部
[0043]108:狀態(tài)轉(zhuǎn)移模型制作部
[0044]109:加入者配置坐標生成部
[0045]110:聚類分析部
[0046]111:狀態(tài)轉(zhuǎn)移概率計算部
[0047]112:狀態(tài)轉(zhuǎn)移預測部
[0048]113:狀態(tài)特征附加/重構部
[0049]114:狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部
[0050]115:保健指導支援部
[0051]116:數(shù)據(jù)庫
[0052]117:醫(yī)療信息存儲部
[0053]118:整形信息存儲部
[0054]119:配置坐標存儲部
[0055]120:聚類分析信息存儲部
[0056]121:狀態(tài)轉(zhuǎn)移概率存儲部
[0057]122:預測結果存儲部
[0058]201:數(shù)據(jù)聚類分析裝置
[0059]207:數(shù)據(jù)映射部
[0060]208:聚類分析部
[0061]209:數(shù)據(jù)間類似度信息
【具體實施方式】
[0062]<實施例1>
[0063]在第I實施例中,說明在被提供了描述數(shù)據(jù)對彼此的類似度的數(shù)據(jù)間類似度信息的情況下基于類似度對數(shù)據(jù)進行聚類分析的數(shù)據(jù)分析裝置的例子。
[0064]圖2是表示第I實施例的數(shù)據(jù)分析裝置的結構的框圖。
[0065]數(shù)據(jù)分析裝置201具有輸入部202、輸出部203、運算裝置204、存儲器205以及存儲介質(zhì)206。
[0066]輸入部202是鼠標、鍵盤等人機接口,受理對數(shù)據(jù)分析裝置201的輸入。輸出部203是輸出由醫(yī)療數(shù)據(jù)分析系統(tǒng)得到的運算結果的顯示器、打印機。存儲介質(zhì)206是保存用于實現(xiàn)由數(shù)據(jù)分析裝置201進行的數(shù)據(jù)分析處理的各種程序以及醫(yī)療數(shù)據(jù)分析處理的執(zhí)行結果等的存儲裝置,例如是非易失性存儲介質(zhì)(磁盤驅(qū)動器、非易失性存儲器等)。運算裝置204是執(zhí)行被加載到存儲器205的程序的運算裝置,例如是CPU、GPU等。
[0067]第I實施例的數(shù)據(jù)分析裝置201既可以是由一個計算機構成的計算機系統(tǒng),也可以是由服務器和客戶終端構成的計算機系統(tǒng)。另外,數(shù)據(jù)分析裝置201的各部也可以由不同的裝置構成。數(shù)據(jù)分析裝置201是在一個計算機上或在邏輯上或物理上構成的多個計算機上構成的計算機系統(tǒng),既可以在同一計算機上在不同的線程中動作,也可以在構建于多個物理計算機資源上的虛擬計算機上動作。
[0068]由運算裝置204執(zhí)行的程序經(jīng)由可移動介質(zhì)(⑶-ROM、快閃存儲器等)或網(wǎng)絡被提供至各服務器,被保存到作為非臨時性存儲介質(zhì)的非易失性存儲裝置。因此,計算機系統(tǒng)可以具有讀取可移動介質(zhì)的接口。
[0069]接著,說明由第I實施例中的數(shù)據(jù)分析裝置201實施的處理。
[0070]首先,說明第I實施例所處理的數(shù)據(jù)間類似度信息。
[0071]圖3是說明數(shù)據(jù)間類似度信息的圖。
[0072]數(shù)據(jù)間類似度信息301記載有兩個不同的實例(instance)間的類似度。例如,表示實例Dl與實例D3的類似度是0.92。實例例如是“人”。在該情況下,數(shù)據(jù)間類似度信息301規(guī)定通過某些方法(例如郵件的發(fā)送接收頻度)定義的2個人的類似度。實例的其它例是“文檔”。在該情況下,數(shù)據(jù)間類似度信息301規(guī)定通過某些方法(例如,兩個文檔中出現(xiàn)的所有單詞中、兩文檔中出現(xiàn)的單詞的比例)定義的文檔間的類似度。數(shù)據(jù)分析裝置201進行對類似的實例進行分類的聚類分析。
[0073]接著,使用圖4說明本發(fā)明的關聯(lián)技術、S卩非專利文獻I所記載的技術中與本實施例關聯(lián)的部分。
[0074]非專利文獻I所記載的技術是用于將網(wǎng)絡在二維或三維的空間上可視化的技術。在以下說明中,網(wǎng)絡是由節(jié)點的集合V和邊沿的集合E構成的組,由圖形G= (V,E)表示。將兩個第i個節(jié)點和第j個節(jié)點通過由E定義的邊連接表示為。
[0075]以下說明的Force-Directed Algorithm基于邊沿的有無來定義節(jié)點間的引力和斥力。而且,基于所定義的引力和斥力,在二維或三維的空間上修正節(jié)點的集合V的配置使得節(jié)點間的能量變小,確定節(jié)點的穩(wěn)定的配置。
[0076]說明在兩個節(jié)點間作用的引力和斥力的定義。能夠利用式(I) (2)來定義作用于第i個節(jié)點和第j個節(jié)點的斥力fr(i, j)和引力fa(i, j)。
[0077]fr (i, j) =-CK2/I xi_xj I i 古 j、i,j e V...(I)
[0078]fa(i, j) = I xi_xj 12/K 1< 勹時...(2)
[0079]fa(i, j) = 0 不是1j 時
[0080]在式(I) (2)中,x1、xj分別是第i個、第j個節(jié)點在二維或三維的空間上的坐標,x1-xj是xi與xj之間的歐幾里得距離。另外,C、K是正的常數(shù),對于值X和n,Xn表示X
的η次方。關于斥力fr,以在所有節(jié)點間作用的方式進行定義,關于引力fa,以在由邊(邊沿)連接的節(jié)點間作用的方式進行定義。節(jié)點間的斥力也可以設為P>1而利用式(3)來定義。
[0081]fr(i, j) = -CK(1+p)/|x1-xj|p i 關 j、i,j e V...(3)
[0082]式(3)直觀上具有調(diào)整斥力有效地作用的范圍的含義,p的值越大,則斥力有效地作用的范圍越窄。
[0083]根據(jù)如上述那樣定義的力的合計,作用于節(jié)點i的力f(i)利用式⑷來表示。
[0084]f ⑴=j)v(j、i) + 2fa(i, j)v(j, i)…(4)
[0085]在式(4)中,和是針對所有i以外的節(jié)點j計算的。另外,v(j,i)是從xi朝向xj的單位矢量,能夠利用式(5)來定義。
[0086]V (j, i) = (xj-xi) / I xj-xi I …(5)
[0087]使用它,系統(tǒng)整體的能量E能夠利用式(6)來定義。
[0088]E({xi},K,C) = Σ f(i) 12…(6)
[0089]在式(6)中,和是針對所有節(jié)點i計算的,|f⑴I是矢量f(i)的大小。另外,利用{xi} = {xl,x2,...}表示節(jié)點整體的坐標配置。
[0090]算法反復修正節(jié)點的坐標{xi}使得能量E變小。由此,確定最終的節(jié)點整體的配置。
[0091]在式(6)中,常數(shù)K、C是理論上與坐標的刻度有關的常數(shù),與本質(zhì)上的節(jié)點間的配置無關?,F(xiàn)在,設使使用常數(shù)K、C時的能量E最小的最優(yōu)配置為{xi}。此時,在設使使用常數(shù)K’、C’時的能量E最小的最優(yōu)配置為s = (K’ /K) (C’ /C)1/3時,節(jié)點整體的坐標配置{xi}能夠利用式(7)來定義。
[0092]{xi} = {sxl, sx2,…}…(7)
[0093]在式(7)中,sxi是對xi的各要素乘以s而生成的矢量。這從式(8)的關系成立可知。
[0094]E ({xi},K,C) = (K/K,)2 (C/C,) 473E ({sxi},K,,C,)...(8)
[0095]在此,使用圖4說明一邊計算前述的引力和斥力、一邊逐次修正節(jié)點的坐標位置并將節(jié)點配置在二維或三維的空間上的算法。
[0096]首先,在初始坐標設定步驟401中,設定二維或三維的維度,在所設定的維度數(shù)的矢量空間上確定各節(jié)點的坐標{xi}的初始配置。節(jié)點的坐標{xi}的初始配置例如也可以利用隨機數(shù)等來設定。另外,也可以預先通過某些方法對節(jié)點進行分類,屬于同一分類的節(jié)點配置于附近。并且,也可以將使用其它的簡便的可視化算法確定的配置設為初始配置。
[0097]接著,在引力斥力設定步驟402中,如前所述,在有邊沿的節(jié)點間設定引力,在所有節(jié)點間設定斥力。常數(shù)C、K、斥力fr的參數(shù)P等使用預先確定的值。
[0098]接著,在坐標配置步驟409中,逐次修正各節(jié)點的坐標配置{xi}使得能量E變小。即,坐標配置步驟409是從圖形G按順序選擇節(jié)點來修正節(jié)點的坐標的周期。是將節(jié)點整體循環(huán)一回的I周期。
[0099]坐標修正環(huán)410是按順序選擇數(shù)據(jù)來修正數(shù)據(jù)的坐標的周期,將所有節(jié)點循環(huán)一回而結束I周期的處理。
[0100]首先,在樣本選擇步驟403中,從節(jié)點整體選擇一個節(jié)點i。接著,在力的計算步驟404中,計算作用于所選擇的節(jié)點i的力的矢量的合計f(i)。f(i)能夠利用前述的式(4)來計算。
[0101]接著,在坐標修正步驟405中,使用式(9)沿作用于所選擇的節(jié)點i的力的方向修正坐標xi。
[0102]xi 一 xi+t X f (i) / I f (i) I …(9)
[0103]在式(9)中,|f⑴I是f(i)的大小,t是調(diào)整修正的幅度的參數(shù)。關于t,最初為了大幅修正坐標而設為大的值,但是由于最終成為微調(diào),因此最好隨著周期經(jīng)過而一點一點地減小值。例如,也可以最初設定適當?shù)拇笮〉某跏贾担贗周期的坐標修正結束的時間點,利用式(10)更新t。
[0104]t —0.9Xt...(10)
[0105]接著,在步驟406中,判定所有節(jié)點中是否存在未被選擇的節(jié)點。在判定的結果為所有節(jié)點中存在未被選擇的節(jié)點的情況下,返回到樣本選擇步驟403,選擇下一個樣本。此時,由于坐標xi被修正,從節(jié)點i作用于其它節(jié)點的力發(fā)生了變化,因此在力的計算步驟404中,反映坐標的修正來計算基于新的坐標配置的力矢量。另一方面,在從所有節(jié)點中選擇了所有節(jié)點之后,進入收斂判定步驟407。
[0106]在收斂判定步驟407中,判定算法的收斂程度,判定是否結束算法。例如,將前次的坐標修正的I周期結束后的節(jié)點i的坐標配置{yi}與本次的坐標修正的I周期結束后的節(jié)點i的坐標配置Ixi}進行比較,在修正量小于規(guī)定的閾值的情況下,判定為坐標已充分收斂,結束算法。修正量例如能夠利用Σ x1-yi來計算。
[0107]之后,在可視化步驟408中,基于二維或三維的各節(jié)點的配置將圖形G的節(jié)點配置在畫面上,進行可視化。
[0108]到此為止使用圖4說明的方法以可視化為目的,因此最初將配置維度數(shù)設定為二維、三維等。但是,在存在大量的節(jié)點的情況下,在二維、三維等低維度的空間中難以表現(xiàn)節(jié)點的位置關系。在圖4所示的方法中,還能夠?qū)⒐?jié)點配置在維度數(shù)更高的空間,對節(jié)點的配置進行修正,由此容易地擴展到四維以上的空間。但是,在圖4所示的方法中,由于在配置節(jié)點之前確定空間的維度數(shù),因此難以選擇適于表現(xiàn)數(shù)據(jù)間的位置關系的維度數(shù)。例如在預先確定的維度數(shù)小的情況下,無法充分地表現(xiàn)數(shù)據(jù)的位置關系。另一方面,在預先確定的維度數(shù)大的情況下,數(shù)據(jù)的表現(xiàn)退化,之后進行的聚類分析等的精度降低,計算量增大。
[0109]在第I實施例中,提供基于數(shù)據(jù)間的類似度來選擇用于表現(xiàn)數(shù)據(jù)間的位置關系的適當?shù)木S度數(shù)的方法。由此,能夠基于數(shù)據(jù)間的類似度將數(shù)據(jù)配置在具有適當?shù)木S度數(shù)的矢量空間上。
[0110]圖5是第I實施例的數(shù)據(jù)映射部207的處理的流程圖。
[0111]數(shù)據(jù)映射部207基于數(shù)據(jù)間類似度信息209將數(shù)據(jù)配置在適當?shù)木S度數(shù)的空間上。
[0112]首先,在初始維度數(shù)設定步驟501中,設定坐標的維度的初始值。坐標的維度的初始值盡量設為小的值,但是在已知數(shù)據(jù)的表現(xiàn)中明顯需要η維以上(η為正整數(shù))的情況下,設定為η。特別是在沒有現(xiàn)有知識的情況下,也可以設定為二維。
[0113]接著,在初始坐標設定步驟502中,在通過初始維度數(shù)設定步驟501設定的維度數(shù)的矢量空間上確定各數(shù)據(jù)的坐標Ixi}的初始配置。數(shù)據(jù)的坐標Ixi}的初始配置例如也可以利用隨機數(shù)等來設定。另外,也可以預先通過某些方法對數(shù)據(jù)進行分類,屬于同一分類的節(jié)點配置于附近。并且,也可以將使用其它簡便的可視化算法確定的配置設為初始配置。
[0114]在引力斥力設定步驟503中,定義數(shù)據(jù)間的引力和斥力。當將數(shù)據(jù)i與數(shù)據(jù)j之間的類似度設為s (i,j)時,使用規(guī)定的閾值h能夠利用式(11)來定義數(shù)據(jù)i與數(shù)據(jù)j之間的引力fa(i,j)。
[0115]fa(i, j) = s(i, j) |x1-xj |2/K s(i, j)彡 h 時
[0116]fa(i, j) =0s(i,j)〈h 時...(11)
[0117]g卩,在數(shù)據(jù)i與數(shù)據(jù)j的類似度為規(guī)定的閾值h以上的情況下,弓丨力以與類似度成比例的大小來作用。另外,斥力與圖4的情況同樣地利用數(shù)式(I)來定義。預先確定常數(shù)C和K。
[0118]接著,在坐標配置步驟513中,逐次修正各數(shù)據(jù)的坐標配置{xi}使得能量E變小。由此,確定最終的數(shù)據(jù)整體的配置。能量E能夠與圖4的同樣地定義。即,作用于數(shù)據(jù)i的力能夠與圖4的情況同樣地利用數(shù)式(4)來定義。使用它,系統(tǒng)整體的能量能夠與圖4的情況同樣地利用數(shù)式(6)來定義。
[0119]算法反復修正節(jié)點的坐標{xi}使得能量E變小。由此,確定最終的數(shù)據(jù)整體的配置。
[0120]坐標修正環(huán)514是按順序選擇數(shù)據(jù)來修正數(shù)據(jù)的坐標的周期,將所有節(jié)點循環(huán)一回而結束I周期的處理。
[0121]在樣本選擇步驟504中,從數(shù)據(jù)整體選擇一個數(shù)據(jù)i。在力的計算步驟505中,計算作用于所選擇的數(shù)據(jù)i的力矢量的合計f(i)。f(i)能夠利用前述的式(4)來計算。
[0122]在坐標修正步驟506中,使用前述的式(9)沿作用于所選擇的數(shù)據(jù)i的力的方向修正坐標xi。
[0123]在式(9)中,t是調(diào)整修正的幅度的參數(shù)。關于t,最初為了大幅修正坐標而設為大的值,但是由于最終成為微調(diào),因此最好隨著周期經(jīng)過而一點一點地減小值。例如,也可以最初設定適當?shù)拇笮〉某跏贾?,在I周期的坐標修正結束的時間點,利用式(10)更新t。
[0124]接著,在步驟507中,判定所有節(jié)點中是否存在未被選擇的數(shù)據(jù)。在判定的結果為所有數(shù)據(jù)中存在未被選擇的數(shù)據(jù)的情況下,返回到樣本選擇步驟504,選擇下一個樣本。此時,由于坐標xi被修正,從數(shù)據(jù)i作用于其它數(shù)據(jù)的力發(fā)生了變化,因此在力的計算步驟505中,反映坐標的修正來計算基于新的坐標配置的力矢量。另一方面,在從所有數(shù)據(jù)中選擇了所有數(shù)據(jù)之后,進入收斂判定步驟508。
[0125]在收斂判定步驟508中,判定算法的收斂程度,判定是否結束算法。例如,將前次的坐標修正的I周期結束后的數(shù)據(jù)i的坐標配置{yi}與本次的坐標修正的I周期結束后的數(shù)據(jù)i的坐標配置Ixi}進行比較,在修正量小于規(guī)定的閾值的情況下,判定為坐標已充分收斂,結束算法。修正量例如能夠利用Σ x1-yi來計算。
[0126]在判定為坐標收斂的情況下,進入不穩(wěn)定性計算步驟509。
[0127]在第I實施例中,為了適當?shù)剡x擇維度數(shù),計算通過步驟513生成的數(shù)據(jù)的配置的穩(wěn)定性。在維度數(shù)不足的情況下,由于在數(shù)據(jù)的位置關系上發(fā)生不合理,因此估計為存在力的變形。通過計算該變形的大小來估計穩(wěn)定性。如果數(shù)據(jù)的配置穩(wěn)定,則判斷為維度數(shù)足夠。另一方面,如果數(shù)據(jù)的配置不穩(wěn)定,則在維度數(shù)加法運算步驟511中將維度數(shù)增加I維度,在增加了維度的空間中再次配置數(shù)據(jù)的坐標。
[0128]在不穩(wěn)定性計算步驟509中,通過以下方法來計算通過坐標配置步驟513生成的數(shù)據(jù)配置的不穩(wěn)定性。在當前設定的維度數(shù)為N的情況下,數(shù)據(jù)被配置在N維空間。根據(jù)在對該維度N虛擬地追加了 I維度時當前的配置變得不穩(wěn)定的程度來計算不穩(wěn)定性。S卩,在使數(shù)據(jù)沿追加維度方向微小變動時,在力沿拉回該變動的方向作用的情況下是穩(wěn)定的。另一方面,在力沿該變動的方向作用的情況下是不穩(wěn)定的。
[0129]更具體地說,數(shù)據(jù)i與數(shù)據(jù)j之間的斥力以前述的式(I)來表示,引力以前述的式
(11)來表示。
[0130]在使數(shù)據(jù)i沿追加維度方向微小變動δ的情況下,沿追加維度方向作用于數(shù)據(jù)i的引力能夠以式(12)來表示,斥力能夠以式(13)來表示。
[0131]fr (i, j) = - δ CK2/(I xi_xj 12+δ 2) N - δ CK2/ | xi~xj |2...(12)
[0132]fa(i, j) = δ s(i, j) (|x1-xj I2+δ 2)1/2/K N δ s (i, j) | xi_xj |/K s (i, j)彡 h 時
[0133]fa(i, j) =0s(i,j)〈h 時...(13)
[0134]在此,如果fr、fa的值為正,則力沿拉回向追加維度方向的微小振動的方向作用,因此數(shù)據(jù)的配置穩(wěn)定。另一方面,如果fr、fa的值為負,則力沿使向追加維度方向的微小振動變大的方向作用,因此數(shù)據(jù)的配置不穩(wěn)定。因而,當將從所有數(shù)據(jù)作用于數(shù)據(jù)i的追加維度方向的力進行合計時,能夠以式(14)來表示。
[0135]u(i, {xi}, K, C) = -Xfr(i, j)-Xfa(i, j)...(14)
[0136]在此,和是針對數(shù)據(jù)i以外的所有數(shù)據(jù)j計算的。在此,考慮與坐標的刻度有關的常數(shù)K、c以及對于數(shù)據(jù)數(shù)M的刻度,當設為δ =K時,不穩(wěn)定性的程度U能夠以式(15)來表不。
[0137]U= Σπ(?, {xi},K, C)/(KC173M(M-1))- (15)
[0138]在此,和是針對不穩(wěn)定的數(shù)據(jù)、即u(i,|xi},K,C)>0的數(shù)據(jù)計算的。分母的M(M-1)是用于以起因于樣本數(shù)的和的數(shù)來進行標準化的項,KC173是用于對坐標刻度進行標準化的項。
[0139]在不穩(wěn)定性計算步驟509中,通過以上的處理,計算U作為表示不穩(wěn)定性的指標。之后,在結束判定步驟510中,判定U是否為規(guī)定的閾值以上。在判定的結果U為規(guī)定的閾值以上的情況下,判定為數(shù)據(jù)的配置不穩(wěn)定,進入維度數(shù)加法運算步驟511。另一方面,在U小于規(guī)定的閾值的情況下,判定為數(shù)據(jù)的配置穩(wěn)定,進入數(shù)據(jù)配置輸出步驟512,輸出數(shù)據(jù)的坐標。此外,也可以在與前次的周期相比U急劇減小的情況下,判定為數(shù)據(jù)的配置穩(wěn)定。
[0140]在結束判定步驟510中,在判定為數(shù)據(jù)的配置不穩(wěn)定的情況下,返回到維度數(shù)加法運算步驟511,使維度數(shù)增加I。將追加維度中的數(shù)據(jù)的坐標設定為O。S卩,在坐標配置步驟513中數(shù)據(jù)i配置在坐標xi = (xil, xi2,..., xiN)的情況下,將數(shù)據(jù)i在N+1維空間中的初始坐標設定為xi = (xil,xi2,另外,在引力斥力設定步驟503中,設定N+1維空間中的引力和斥力。之后,在坐標配置步驟513中,確定N+1維空間中的坐標配置。
[0141]通過以上的處理,能夠?qū)?shù)據(jù)配置在適當?shù)木S度數(shù)的空間上。將該維度設為N維,將數(shù)據(jù)i的坐標設為xi = (xil,xi2,..., xiN)。
[0142]此外,在上述內(nèi)容中說明了使用Force Directed Algorithm的例子,但是也可以將改進該方法所得的Multilevel Force Directed Algorithm應用于前述的方法。
[0143]在聚類分析部208中,對配置在N維空間的數(shù)據(jù)進行聚類分析。由于將數(shù)據(jù)表示為N維空間上的點,因此在聚類分析中能夠使用K-means法、EM法等。
[0144]例如在K-means法中,首先確定群組數(shù)K。接著,將各數(shù)據(jù)隨機地分配到某一個群組。接著,針對每個群組求出屬于該群組的數(shù)據(jù)的平均矢量。接著,將各數(shù)據(jù)分配到與最近的平均矢量對應的群組。如果沒有因再分配產(chǎn)生的變化,則結束聚類分析。另一方面,如果有因再分配產(chǎn)生的變化,則返回到針對每個群組求出屬于該群組的數(shù)據(jù)的平均矢量的處理,反復進行處理。通過該處理,能夠?qū)?shù)據(jù)分類為K個群組。
[0145]如以上所說明的那樣,根據(jù)本發(fā)明的第I實施例的數(shù)據(jù)聚類分析裝置,能夠基于數(shù)據(jù)間的類似度將數(shù)據(jù)配置在適當?shù)木S度的矢量空間。例如適于如下情況:在被提供了人物彼此的類似度、文檔彼此的類似度的情況下,對相近的人物、類似的文檔進行分類。
[0146]另外,由于將數(shù)據(jù)配置在適當?shù)木S度的矢量空間,因此能夠通過以往的聚類分析方法適當?shù)貙嵗M行分類。即,以往存在對在N維空間中配置于相近的位置的點進行聚類分析的分類方法,但是根據(jù)配置了數(shù)據(jù)的空間的維度數(shù)而有時無法通過以往的聚類分析方法適當?shù)剡M行分類。因此,在第I實施例中,基于數(shù)據(jù)間的類似度確定矢量空間的適當?shù)木S度數(shù),將數(shù)據(jù)配置在該維度的空間,因此能夠應用以往的聚類分析方法。
[0147]另外,通過計算數(shù)據(jù)的配置的不穩(wěn)定性來決定適當?shù)木S度數(shù),因此能夠自動地且不需要與數(shù)據(jù)有關的現(xiàn)有知識而決定適當?shù)木S度數(shù)。
[0148]〈實施例2>
[0149]在第2實施例中,說明為了疾病的發(fā)病預防和重癥化預防而基于醫(yī)療數(shù)據(jù)(例如診療費用賬單信息、體檢信息、問診信息)建議保健指導對象者的選定、保健指導方法并預測保健指導效果的醫(yī)療數(shù)據(jù)分析系統(tǒng)的例子。
[0150]診療費用賬單信息是記錄了當健康保險的加入者接受醫(yī)療機關的診斷時的傷病名、所處方的藥品、被實施的診療行為以及醫(yī)療費(分數(shù))的信息,使用圖6說明其一例。此夕卜,將所處方的藥品以及被實施的診療行為統(tǒng)稱為醫(yī)療行為。
[0151]另外,體檢信息是健康保險的加入者在體檢機關接受的檢查的結果的信息,后面使用圖7說明其一例。問診信息是健康保險的加入者在體檢機關接受的問診(例如生活習慣、既往病歷、自覺癥狀等)的結果的信息,后面使用圖8說明其一例。
[0152]在第2實施例中,基于醫(yī)療數(shù)據(jù)對相似狀態(tài)的健康保險的加入者進行聚類分析。群組代表疾病的狀態(tài)(發(fā)病的有無、重癥度、檢查值等)。在第2實施例中,制作基于群組間的狀態(tài)轉(zhuǎn)移的模型,基于所制作的模型并根據(jù)群組內(nèi)的加入者的統(tǒng)計對加入者整體的傾向進行分析,預測將來的狀態(tài),預測醫(yī)療費。
[0153]圖1是表示第2實施例的醫(yī)療數(shù)據(jù)分析系統(tǒng)的結構的框圖。
[0154]醫(yī)療數(shù)據(jù)分析系統(tǒng)具有醫(yī)療數(shù)據(jù)分析裝置101和數(shù)據(jù)庫116。
[0155]本實施例的醫(yī)療數(shù)據(jù)分析裝置101具有輸入部102、輸出部103、運算裝置104、存儲器105以及存儲介質(zhì)106。
[0156]輸入部102是鼠標、鍵盤等人機接口,受理對醫(yī)療數(shù)據(jù)分析裝置101的輸入。輸出部103是輸出由醫(yī)療數(shù)據(jù)分析系統(tǒng)得到的運算結果的顯示器、打印機。存儲介質(zhì)106是保存用于實現(xiàn)由醫(yī)療數(shù)據(jù)分析系統(tǒng)進行的醫(yī)療數(shù)據(jù)分析處理的各種程序以及醫(yī)療數(shù)據(jù)分析處理的執(zhí)行結果等的存儲裝置,例如是非易失性存儲介質(zhì)(磁盤驅(qū)動器、非易失性存儲器等)。存儲器105中展開存儲介質(zhì)106中保存的程序。運算裝置104是執(zhí)行被加載到存儲器105的程序的運算裝置,例如是CPU、GPU等。以下說明的處理和運算是由運算裝置104執(zhí)行的。
[0157]本實施例的醫(yī)療數(shù)據(jù)分析系統(tǒng)既可以是由一個計算機構成的計算機系統(tǒng),也可以是由服務器和客戶終端構成的計算機系統(tǒng)。
[0158]醫(yī)療數(shù)據(jù)分析系統(tǒng)是在一個計算機上或在邏輯上或物理上構成的多個計算機上構成的計算機系統(tǒng),既可以在同一計算機上在不同的線程中動作,也可以在構建于多個物理計算機資源上的虛擬計算機上動作。
[0159]由處理器執(zhí)行的程序經(jīng)由可移動介質(zhì)(⑶-ROM、快閃存儲器等)或網(wǎng)絡被提供至各服務器,被保存到作為非臨時性存儲介質(zhì)的非易失性存儲裝置。因此,計算機系統(tǒng)可以具有讀取可移動介質(zhì)的接口。
[0160]首先,說明第2實施例所處理的醫(yī)療數(shù)據(jù)。
[0161]醫(yī)療信息存儲部117保存被輸入部102輸入的醫(yī)療數(shù)據(jù)。醫(yī)療數(shù)據(jù)包含診療費用賬單信息、體檢信息以及問診信息。診療費用賬單信息包含診療費用賬單基本信息、傷病名信息、診療行為信息、藥品信息、傷病名分類信息、診療行為分類信息以及藥品分類信息。
[0162]接著,說明診療費用賬單信息。
[0163]圖6是說明診療費用賬單基本信息601的圖。
[0164]診療費用賬單基本信息601是保持診療費用賬單與加入者的對應關系的信息。診療費用賬單基本信息601包含搜索號602、健康保險加入者ID603、性別604、年齡605、診療年月606以及合計分數(shù)607。
[0165]搜索號602是用于唯一地識別診療費用賬單的標識符。健康保險加入者ID603是用于唯一地識別健康保險的加入者的標識符。性別604是表示健康保險加入者的性別的信息。年齡605是表示健康保險加入者的年齡的信息。
[0166]診療年月606是健康保險加入者接受了醫(yī)療機關的診斷的年和月。合計分數(shù)607是表示一件診療費用賬單的合計分數(shù)的信息。此外,若對合計分數(shù)相乘“10”則計算出醫(yī)療費(日元)。此外,在圖9所示的傷病名信息901中的多個傷病名被登記在一個搜索號的情況下,在合計分數(shù)607中登記對于多個傷病的醫(yī)療行為的合計分數(shù)。
[0167]圖9是說明傷病名信息901的圖。
[0168]傷病名信息901包含搜索號602、傷病名碼902、傷病名903。
[0169]搜索號602是用于唯一地識別診療費用賬單的標識符,使用與診療費用賬單基本信息601的搜索號(圖6)相同的號。傷病名碼902是記載在診療費用賬單中的傷病名碼。傷病名903是與該傷病名碼對應的傷病名。
[0170]此外,一件診療費用賬單中能夠記載多個傷病名。例如在圖9所示的傷病名信息901中,搜索號602為“11”的記錄的傷病名903是“糖尿病”和“高血壓”,搜索號為“11”的診療費用賬單中記載有糖尿病和高血壓的傷病名。
[0171]圖10是說明傷病名分類信息的圖。
[0172]傷病名分類信息1001是使傷病分類與屬于該傷病分類的傷病名相對應的信息。另外,并發(fā)癥有無1003是表示傷病名是否為并發(fā)癥的傷病名的信息。
[0173]圖11是說明診療行為信息的圖。
[0174]診療行為信息1101包含搜索號602、診療行為碼1102、診療行為名1103以及診療行為分數(shù)1104。
[0175]搜索號602是用于唯一地識別診療費用賬單的標識符,使用與診療費用賬單基本信息601的搜索號(圖6)相同的號。診療行為碼1102是用于唯一地識別診療費用賬單中記載的診療行為的標識符。診療行為名1103是診療費用賬單中記載的診療行為的名稱。診療行為分數(shù)1104是診療行為所涉及的分數(shù)。
[0176]在圖11中,例如在搜索號602為“11”的診療費用賬單中記載有“診療行為A”和“診療行為C”的診療行為名1103。
[0177]圖12是說明診療行為分類信息的圖。
[0178]診療行為分類信息1201包含傷病分類1002、診療行為碼1102以及診療行為名1103。
[0179]傷病分類1002使用與傷病名分類信息1001的傷病分類1002(圖10)相同的分類。診療行為碼1102是識別根據(jù)傷病分類1002的傷病進行的診療行為的診療行為碼,使用與診療行為信息1101的診療行為碼1102(圖11)相同的碼。診療行為名1103是與該診療行為碼對應的診療行為的名稱,使用與診療行為信息1101的診療行為名1103(圖11)相同的碼。
[0180]圖13是說明藥品信息的圖。
[0181]藥品信息1301包含搜索號602、藥品碼1302、藥品名1303以及藥品分數(shù)1304。
[0182]搜索號602是用于唯一地識別診療費用賬單的標識符,使用與診療費用賬單基本信息601的搜索號602 (圖6)相同的號。藥品碼1302是用于唯一地識別診療費用賬單中記載的藥品的藥品碼。藥品名1303是診療費用賬單中記載的藥品的名稱。藥品分數(shù)1304是藥品的保險分數(shù)。
[0183]在圖13中,例如搜索號602為“11”的診療費用賬單記載有糖尿病口服藥A和高血壓口服藥A的藥品名。
[0184]圖14是說明藥品分類信息的圖。
[0185]藥品分類信息1401包含傷病分類1002、藥品碼1302以及藥品名1303。
[0186]傷病分類1002使用與傷病名分類信息1001的傷病分類1002(圖10)相同的分類。藥品碼1302是識別根據(jù)傷病分類1002中登記的分類所處方的藥品的藥品碼,使用與藥品信息1301的藥品碼1302(圖13)相同的碼。藥品名1303是與該藥品碼對應的藥品的名稱,使用與藥品信息1301的藥品名1303(圖13)相同的名稱。
[0187]此外,將圖11所示的診療行為信息1101和圖13所示的藥品信息統(tǒng)稱為醫(yī)療行為信息。另外,將圖12所示的診療行為分類信息1201和圖14所示的藥品分類信息統(tǒng)稱為醫(yī)療行為分類信息。
[0188]接著,說明體檢信息。
[0189]圖7是說明體檢信息的圖。
[0190]體檢信息701是用于管理多個加入者的多年的體檢信息的信息,包含健康保險加入者ID603、體檢受診日702以及健康診斷中的各種檢查值(例如、BMI703、腰圍704、空腹時血糖705、收縮期血壓706、中性脂肪707)。
[0191]健康保險加入者ID603是接受了健康診斷的健康保險的加入者的標識符,使用與診療費用賬單基本信息601的健康保險加入者ID603(圖6)相同的標識符。體檢受診日702是接受了健康診斷的年月日。BMI703至中性脂肪707是健康診斷的檢查的結果。
[0192]存在未接受特定的檢查的情況等體檢信息的數(shù)據(jù)欠缺的情況。例如在圖7中,健康保險加入者ID “K0004”在2004年受診的檢查項目中的收縮期血壓706的數(shù)據(jù)欠缺。
[0193]接著,說明問診信息。
[0194]圖8是說明問診信息的圖。
[0195]問診信息801是用于管理多個加入者的多年的問診信息的信息,包含健康保險加入者ID603、問診受診日802以及問診的回答(例如煙803、飲酒804、步行805)。此外,問診也可以包含生活習慣、既往病歷、過敏等體質(zhì)、自覺癥狀等。
[0196]健康保險加入者ID603是接受了問診的健康保險的加入者的標識符,使用與診療費用賬單基本信息601的健康保險加入者ID603(圖6)相同的標識符。問診受診日802是接受了問診的年月日。煙803至步行805是問診的結果。煙803在有吸煙習慣的情況下是一日的平均吸煙根數(shù),在不吸煙的情況下是“無”。飲酒804在有飲酒習慣的情況下是一日的平均飲酒量(單位=ml),在沒有飲酒習慣的情況下是“無”。步行805是一日的平均步行時間(單位=分鐘)。
[0197]此外,在問診信息中,也有時無法得到步數(shù)、飲酒量、吸煙根數(shù)等詳細的信息。有時不是具體的飲酒量,而是對預先在問診表中區(qū)分的頻度中所符合的頻度進行回答。例如是在只得到有無吸煙、飲酒的信息的情況下將飲酒的頻度分為幾個程度(例如、(I)不飲酒、
(2)—周I?2次、(3) —周3次以上)來進行回答的情況等。在該情況下,問診信息的值是沒有定量的含義的號。
[0198]在不存在對于特定的項目的回答的情況下,有時問診信息的數(shù)據(jù)欠缺。例如在圖8中,健康保險加入者ID “K0003”在2004年受診的問診項目中對于步行805的數(shù)據(jù)欠缺。
[0199]接著,說明數(shù)據(jù)整形部107的處理。數(shù)據(jù)整形部107根據(jù)醫(yī)療信息存儲部117中存儲的醫(yī)療數(shù)據(jù)對每個加入者的每個期間的診療費用賬單信息、體檢信息以及問診信息進行總計/合并,整形為表形式。下面,將一個期間設為I年來進行說明,但是也可以是半年、2年、3年等其它期間。
[0200]圖15是說明整形信息1501的一例的圖。使用圖15說明數(shù)據(jù)整形部107的處理。
[0201]整形信息1501包含對2004年的診療費用賬單信息進行整形所得的診療費用賬單整形信息。整形信息1501的各行是對與一個健康保險加入者ID對應的一年的數(shù)據(jù)進行總計所得的。
[0202]健康保險加入者ID603、性別604、年齡605以及合計分數(shù)607分別與診療費用賬單基本信息601的健康保險加入者ID603、性別604、年齡605以及合計分數(shù)607 (圖6)相同。數(shù)據(jù)年1502是成為制作該整形信息的基礎的數(shù)據(jù)的年。
[0203]傷病名碼10(1503)是該健康保險加入者ID的診療費用賬單中傷病名碼為10的診療費用賬單的數(shù)量。傷病名碼20(1504)也同樣地是該健康保險加入者ID的診療費用賬單中傷病名碼為20的診療費用賬單的數(shù)量。診療行為碼1000(1505)是該健康保險加入者ID的診療費用賬單中進行了診療行為碼為1000的診療行為的診療費用賬單的數(shù)量。藥品碼110(1506)是該健康保險加入者ID的診療費用賬單中處方了藥品碼為110的藥品的診療費用賬單的數(shù)量。
[0204]關于數(shù)據(jù)整形部107的處理,具體說明對2004年的數(shù)據(jù)進行整形的情況。
[0205]首先,選擇一個健康保險加入者ID。從診療費用賬單基本信息601獲取診療年月為2004年的該健康保險加入者ID的診療費用賬單的搜索號。接著,參照傷病名信息901,針對每個傷病名碼對記載有該傷病名碼的診療費用賬單的數(shù)量進行計數(shù)。由此,得到各傷病名碼的診療費用賬單的數(shù)量。同樣地,參照診療行為信息1101,對每個診療行為碼的診療費用賬單的數(shù)量進行計數(shù),參照藥品信息1301,對每個藥品碼的診療費用賬單的數(shù)量進行計數(shù)。由此,生成所選擇的健康保險加入者ID的2004年的數(shù)據(jù)行。對作為分析對象的所有健康保險加入者ID與年的組合進行該處理。
[0206]例如在圖15所示的整形信息1501中,第I行的健康保險加入者ID “K0001”的2004年的數(shù)據(jù)是能夠從搜索號為“11” “12” “13”的診療費用賬單基本信息601獲取。當參照傷病名信息901時,這三個診療費用賬單中傷病名碼為“10”的診療費用賬單是搜索號“11”和“13”這兩個。因而,在整形信息1501的第I行傷病名碼10的欄中登記有2。
[0207]圖15所示的整形信息1501還包含從體檢信息整形得到的體檢整形信息。各行是對與一個健康保險加入者ID對應的數(shù)據(jù)進行總計所得的。
[0208]各項目的值是健康保險加入者ID603和數(shù)據(jù)年1502所示的加入者和年的體檢數(shù)據(jù)的值。該體檢數(shù)據(jù)能夠從體檢信息701獲取。在體檢信息701包含同一健康保險加入者ID的同一年的體檢數(shù)據(jù)的情況下,既可以使用某一個受診日的數(shù)據(jù),也可以使用該年的多次體檢結果的平均。在使用一個受診日的數(shù)據(jù)的情況下,可以使用每年幾乎相同時期實施的同時體檢日的數(shù)據(jù)。另外,也可以選擇缺失少的數(shù)據(jù)。缺失數(shù)據(jù)使用預先確定的表示缺失的數(shù)值。在圖15所示的例子中使用了 -1。此外,設沒有體檢信息的加入者的值全部為缺失數(shù)據(jù)。
[0209]圖15所示的整形信息1501還包含從問診信息整形所得的問診整形信息。各行是對與一個健康保險加入者ID對應的數(shù)據(jù)進行總計所得的。
[0210]各項目的值是健康保險加入者ID603和數(shù)據(jù)年1502所示的加入者和年的問診數(shù)據(jù)的值。該問診數(shù)據(jù)能夠從問診信息801獲取。在問診信息801包含同一健康保險加入者ID的同一年的問診數(shù)據(jù)的情況下,既可以使用某一個受診日的數(shù)據(jù),也可以使用該年的多次問診結果的平均。在使用一個受診日的數(shù)據(jù)的情況下,可以使用每年幾乎相同的時期實施的同時體檢日的數(shù)據(jù)?;蛘?,也可以選擇缺失少的數(shù)據(jù)。缺失數(shù)據(jù)使用預先確定的表示缺失的數(shù)值。在圖15所示的例子中使用了 -1。此外,設沒有問診信息的加入者的值全部為缺失數(shù)據(jù)。
[0211]通過以上的處理,能夠生成診療費用賬單整形信息、體檢整形信息以及問診整形信息。此外,圖15中僅示出了 2004年的數(shù)據(jù),但是還制作其它年的整形數(shù)據(jù)。
[0212]在此,在制作診療費用賬單整形信息時,也可以匯總類似的項目來合并多個項目。例如在藥品的項目中糖尿病口服藥A的功能與糖尿病口服藥B的功能類似的情況下,也可以將它們匯總來視為一個項目進行處理。此時,將使同一年度的糖尿病口服藥A的處方次數(shù)與糖尿病口服藥B的處方次數(shù)相加所得的值設為新匯總的項目的值。用于判斷項目是否類似的基準可以設為如下。將診療行為分類信息1201中屬于同一傷病分類的診療行為名設為類似項目。另外,將藥品分類信息1401中屬于同一傷病分類的藥品名設為類似項目。另外,預先通過人工制作類似項目信息。
[0213]圖16A是說明將診療費用賬單整形信息的傷病名碼10與傷病名碼20合并所得的整形信息1501的例子的圖。傷病名碼1601的值是將圖15的傷病名碼1503的值與傷病名碼1504的值相加所得的值,是傷病名碼為“10”的診療費用賬單的數(shù)量與傷病名碼為“20”的診療費用賬單的數(shù)量的合計。
[0214]圖16B是項目合并處理的流程圖。
[0215]首先,在合并對象項目選定步驟1602中,從診療費用賬單基本信息601的項目中選定作為合并對象的項目。說明項目的選定的三個例子。第I例是在診療行為分類信息1201和藥品分類信息1401等的診療行為和藥品被分類的情況下將屬于同一傷病分類的項目設為合并對象的方法。第2例是使用國際疾病分類10版(ICDlO)等基準對屬于同一分類的項目進行合并的方法。第3例是通過與后述的聚類分析部110同樣的方法對項目進行聚類分析來對屬于同一群組的項目進行合并的方法。
[0216]接著,在處方次數(shù)合算步驟1603中,對合并的項目的值進行合算。
[0217]圖15、圖16A所示的所制作的診療費用賬單整形信息、體檢整形信息以及問診整形信息由數(shù)據(jù)庫116的整形信息存儲部118存儲。整形信息1501是表形式的數(shù)值數(shù)據(jù)。
[0218]此外,診療費用賬單整形信息的值是以診療費用賬單的數(shù)量、即處方次數(shù)進行總計所得的,但是也可以是有無處方的信息。即,也可以將處方次數(shù)為I以上的(有處方)情況匯總為1,將處方次數(shù)為O的(無處方)的情況設為0,以2值來表示。另外,也可以認為處方次數(shù)表示重癥度,診療費用賬單整形信息的值是將處方次數(shù)分類為等級的值。例如,也可以將處方次數(shù)為O次的情況設為0,將處方次數(shù)為I?4次的情況設為1,將處方次數(shù)為5次以上的情況設為2等以3等級來表示。
[0219]在前述的例子中,以每I年的期間對診療費用賬單信息、體檢信息以及問診信息進行了匯總,但是例如也可以是每2年、每3年等不同的期間。此外,下面,以每I年的期間進行匯總的情況為例進行說明。
[0220]接著,說明狀態(tài)轉(zhuǎn)移模型制作部108。狀態(tài)轉(zhuǎn)移模型制作部108具有加入者配置坐標生成部109、聚類分析部110以及狀態(tài)轉(zhuǎn)移概率計算部111。
[0221]加入者配置坐標生成部109使用整形信息計算加入者彼此的類似度,基于類似度將加入者配置在適當?shù)木S度數(shù)的空間。加入者配置坐標生成部109將加入者在被配置的空間中的坐標保存到配置坐標存儲部119。聚類分析部110基于加入者向空間的配置對加入者進行聚類分析(分類)。關于基于類似度的加入者向空間的配置以及聚類分析,能夠使用前述的第I實施例的方法。聚類分析部110將對加入者進行聚類分析所得的結果保存到聚類分析信息存儲部120。
[0222]下面,說明健康保險的加入者彼此的類似度的計算方法。其中,將年不同的同一加入者處理為不同人。即,在I萬人的醫(yī)療數(shù)據(jù)有3年量的情況下,針對3萬人進行聚類分析。當將2個加入者彼此的項目i的非類似度設為d(i)時,2個加入者的非類似度是通過對非類似度計算中使用的項目的非類似度進行合計的D= Σ(1(?)來計算。在此,和是針對非類似度計算中使用的所有同一年的項目i計算的。在著眼于特定的疾病(例如糖尿病)的情況下,關于非類似度計算中使用的項目能夠選定診療費用賬單信息的與該疾病對應的醫(yī)療行為。
[0223]接著,說明項目i的非類似度d(i)的計算方法。在項目i是問診的回答號等不具有定量的含義的項目的情況下,在2個加入者的回答相同時設為d (i) = 0,在2個加入者的回答不同時設為d(i) =V0此外,V使用預先確定的值。
[0224]接著,說明項目i是處方次數(shù)和檢查值等具有定量的含義的項目的情況。在項目i是具有定量的含義的項目的情況下,求出值的累積概率F(t) =P(X<t)。F(t)是該項目的值為t以下的加入者數(shù)相對于所有加入者數(shù)的比例,F(xiàn)(t)的最大值是I。接著,在將2個加入者的該項目的值分別設為tl、t2的情況下,設為d(i) = |F(tl)-F(t2) |。
[0225]在2個加入者中某一人的項目i的值欠缺的情況下,設為d(i) =W0此外,w使用預先確定的值。
[0226]通過以上,能夠計算非類似度D = Sd(i)。類似度例如能夠通過_D+max{d(i)}來計算。如上,通過對加入者進行聚類分析,能夠?qū)尤胝哌M行分類。
[0227]另外,在非類似度的計算中,也可以使用如圖16A所示那樣類似的疾病彼此被合并的整形信息。當使用疾病被合并的整形信息時,具有類似的效果的診療行為被匯總而計數(shù),因此能夠得到接近實際情況的非類似度。診療行為的合并中也可以使用診療行為分類信息(圖12)、藥品分類信息(圖14)。另外,也可以使用以下說明的其它合并方法。
[0228]在其它合并方法中,計算項目彼此的類似度,通過第I實施例的方法對項目進行聚類分析,對聚類分析所得的項目彼此進行合并。
[0229]說明項目彼此的類似度的計算方法。關于兩個項目,將其值按健康保險加入者ID的順序排列的矢量分別設為xl = (xil, xl2,..., xln)、x2 = (x21, x22,..., x2n)。將矢量xl與x2的相關系數(shù)設為r(xl,x2)。但是,xl, x2中包含缺失值,因此去除xl、x2的某一個中缺失的要素。例如,在xli缺失的情況下,x2i也去除。通過這樣,將從xl、x2去除缺失維度后的矢量分別設為vl = (vll,vl2,..., vim)、v2 = (v21, v22,…^〗!!!)。
[0230]在vl與v2具有相同程度的依賴性的情況下,也由于vl、v2的值的性質(zhì)的差異而在相關值r(vl,v2)的值中產(chǎn)生偏差。因而,首先,當將vl、v2的要素分別獨立地隨機重新排列的矢量設為wl、w2時,能夠估計矢量wl和w2中不具有依賴性。使用它計算|r(vl,v2) |-|r(wl,w2) |。在r (vl, v2) < |r (wl,w2) |的情況下能夠判斷為不具有依賴度。因此,將該情況下的依賴度設為0,將除此以外的情況下的依賴度設為|r(vl,v2) -1r(wl,w2) U由此,能夠計算與隨機的情況(無依賴性的情況)比較的類似度。
[0231]如上,通過使用合并所得的項目對加入者進行聚類分析,能夠?qū)尤胝哌M行分類。
[0232]加入者被分類為K個群組C1、C2、…、CK。在第2實施例中,各群組是表示疾病的狀態(tài)的群組,加入者被分類到某一個群組。但是,如已經(jīng)說明的那樣,不同的年的數(shù)據(jù)即使是同一加入者也處理為不同人。
[0233]狀態(tài)轉(zhuǎn)移概率計算部111計算群組間的轉(zhuǎn)移概率。具體說明從群組Ci向Cj的轉(zhuǎn)移概率的計算方法。首先,將屬于群組Ci的加入者中存在下一年的數(shù)據(jù)的加入者的數(shù)量設為Ml。其中,將下一年處于群組Cj的狀態(tài)的加入者的數(shù)量設為M2。從群組Ci向Cj的轉(zhuǎn)移概率為M2/M1。狀態(tài)轉(zhuǎn)移概率計算部111將所有從群組Ci向Cj的組合的轉(zhuǎn)移概率的值存儲到狀態(tài)轉(zhuǎn)移概率存儲部121。
[0234]接著,說明狀態(tài)轉(zhuǎn)移預測部112。狀態(tài)轉(zhuǎn)移預測部112具有狀態(tài)特征附加/重構部113、狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部114以及保健指導支援部115。
[0235]狀態(tài)特征附加/重構部113附加狀態(tài)的含義(附加特征),重構模型。在狀態(tài)轉(zhuǎn)移模型制作部108所制作的模型中,通過聚類分析對加入者進行分類,構成群組。通過求出所構成的群組間的狀態(tài)轉(zhuǎn)移概率,將疾病的狀態(tài)的轉(zhuǎn)移模型化。但是,群組是加入者的集合,因此需要對該群組附加特征。對群組附加特征,并將群組所表示的疾病的狀態(tài)顯示在輸出部上,由此能夠直觀地獲知疾病發(fā)病或重癥化的情形。
[0236]首先,說明群組的特征附加的方法。群組是根據(jù)屬于該群組的加入者被附加特征的。
[0237]圖18A是群組特征附加處理的流程圖。
[0238]首先,在群組內(nèi)統(tǒng)計量計算步驟1802中,計算屬于該群組的加入者的各項目的值的統(tǒng)計量,使用所計算出的統(tǒng)計量表示該群組的狀態(tài)。例如,能夠以屬于該群組的加入者的各項目的值的平均值來表現(xiàn)。例如,群組的血糖值是屬于該群組的加入者的血糖值的平均坐寸ο
[0239]接著,在異常項目計算步驟1803中,針對該群組的各項目,計算各加入者相對于平均值的脫離率。脫離率能夠通過以下說明的方法來計算。例如將該群組的某項目的值設為k。將所有加入者中該項目的值為k以下的人的比例設為Y,將該項目的值小于k的人的比例設為X。此時,設為Z= (X+Y)/2,認為,Z越接近0.5則與該項目有關的該群組的值越是平均的值。相反,認為,越比0.5大或小則脫離率越高。因此,以|Z-0.5 I來計算脫離率。這意味著,關于某項目,與所有加入者的平均相比該群組的值大幅不同的情況、或脫離正常值的情況下脫離率大。越是該脫離率高的項目,越有用于對該群組附加特征。
[0240]在特征附加項目選定步驟1804中,選定使用于特征附加的項目。此時,也可以通過人工預先確定使用于特征附加的項目候選。在此,也可以從使用于特征附加的項目候選中將脫離率高的居上位的項目選定規(guī)定的數(shù)量,制作用于將所選定的項目和值顯示在輸出部103上的畫面數(shù)據(jù)。圖18B是說明所選定的項目和值的顯示例的圖。在顯示例1801中,Pij表示從群組i向群組j的轉(zhuǎn)移概率。
[0241]接著,說明重構的方法。存在如下問題:在狀態(tài)轉(zhuǎn)移模型制作部108中制作的模型包含大量群組,在該狀態(tài)下預測的計算量大,模型復雜而顯示變得繁雜,難以理解。因此,通過將所制作的模型重構為緊湊的模型,關于當前所關注的狀態(tài)和轉(zhuǎn)移進行模型化。
[0242]圖19是重構處理的流程圖。
[0243]首先,在群組選定步驟1901中,基于被指定為關注的對象的項目,選定對該項目附加特征的群組。例如在關注糖尿病的情況下,關注的對象的項目是胰島素的處方次數(shù)、糖尿病口服藥的處方次數(shù)、血糖值等。首先,選定在這些項目中脫離率為預先確定的值以上的群組。然后,選擇與該群組的轉(zhuǎn)移概率高的(轉(zhuǎn)移概率為預先確定的值以上的)群組。
[0244]接著,在對象外群組合并步驟1902中,將未被選擇的群組合并為一個。將所選擇的群組設為R1、R2、…、RL,將未被選擇的群組匯總為一個群組O。S卩,使不屬于R1、R2、…、RL的加入者屬于群組0,由L+1個群組構成模型。
[0245]在轉(zhuǎn)移概率計算步驟1903中,計算構成模型的L+1個群組間的轉(zhuǎn)移概率。設群組Ri與Rj之間的轉(zhuǎn)移概率與由狀態(tài)轉(zhuǎn)移模型制作部108制作的原始的群組間的轉(zhuǎn)移概率pi j相同。從群組Rl向群組O的轉(zhuǎn)移概率為1-Σρ1」。和是j從I至L計算的。相反,從群組O向群組Rl的轉(zhuǎn)移概率為1-ΣΡ」1。和是j從I至L計算的。通過以上,制作重構模型中的群組和群組間的轉(zhuǎn)移概率。另外,通過與已經(jīng)說明的方法相同的方法對群組附加特征。
[0246]狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部114使用狀態(tài)轉(zhuǎn)移模型制作部108所制作的模型或狀態(tài)特征附加/重構部113所重構的模型,根據(jù)保健指導支援部115所指示的作為分析對象的加入者的今年的信息預測明年的疾病的狀態(tài)、醫(yī)療費。狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部114將所預測的疾病的狀態(tài)和醫(yī)療費保存到預測結果存儲部122。
[0247]首先,說明根據(jù)狀態(tài)轉(zhuǎn)移預測、即由保健指導支援部115指示的作為分析對象的加入者的今年的信息預測明年的狀態(tài)的方法。首先,將作為分析對象的加入者的今年的信息變換為圖15或圖16A所示的形式的整形信息。接著,基于變換得到的整形信息計算群組Cl、…、CK與所有加入者的類似度。將類似度最高的群組Ci設為作為分析對象的加入者的今年的狀態(tài)。向明年的各狀態(tài)的轉(zhuǎn)移概率能夠使用狀態(tài)轉(zhuǎn)移概率存儲部121中存儲的狀態(tài)轉(zhuǎn)移概率來計算。
[0248]接著,說明醫(yī)療費預測的處理。首先,通過與狀態(tài)轉(zhuǎn)移預測同樣的方法,基于作為分析對象的加入者的今年的信息確定所屬的群組Ci。另外,計算各群組的醫(yī)療費。設群組Cj的醫(yī)療費為屬于Cj的加入者的平均醫(yī)療費M(j)。當將從群組Ci向群組Cj的轉(zhuǎn)移概率設為P (j Ii)時,P(Jli)是分析對象的加入者處于明年的群組Cj的狀態(tài)的概率。因此,明年的醫(yī)療費的期待值(預測醫(yī)療費)能夠利用2P(j|i)M(j)來計算。
[0249]保健指導支援部115提供為了預防將來的疾病的發(fā)病并削減醫(yī)療費而進行支援的功能。
[0250]健康保健事業(yè)者期望在預算內(nèi)優(yōu)先選擇保健指導所產(chǎn)生的預防效果高的對象者,進行適于各對象者的指導。健康保健事業(yè)者所能夠提供的保健指導服務有多個(保健指導服務1、保健指導服務2、...、等)。例如,保健指導服務I是主要用于減小BMI值的指導,保健指導服務2是用于降低膽固醇值的指導等。
[0251 ] 說明面向健康保健事業(yè)者的支援功能的處理。
[0252]圖17A是面向健康保健事業(yè)者的支援功能的處理的流程圖。
[0253]首先,在對象疾病設定步驟1701中,設定作為處理的對象的疾病。例如在將作為三大生活習慣病的糖尿病、血脂異常癥以及高血壓癥設為對象的情況下,使用診療費用賬單整形信息的項目中的符合糖尿病、血脂異常癥以及高血壓癥的醫(yī)療行為的項目、健康診斷的項目以及問診的項目,狀態(tài)特征附加/重構部113重構模型。在將所有疾病設為對象的情況下,使用狀態(tài)轉(zhuǎn)移模型制作部108所制作的模型。
[0254]接著,在保健指導服務設定步驟1702中,設定保健指導服務的種類和各保健指導服務的設想效果。例如,保健指導服務I的設想效果是減體重5kg等。
[0255]接著,在保健指導效果預測步驟1703中,針對保健指導服務與保健指導對象候選者的所有組合預測醫(yī)療費削減效果。首先,說明針對保健指導服務I與保健指導對象候選者I的組合計算醫(yī)療費削減效果的方法。
[0256]最初,預測不進行保健指導服務的情況下的保健指導對象候選者I的下一年的醫(yī)療費。其中,基于今年的保健指導對象候選者I的診療費用賬單、健康診斷以及問診的值,設定與今年的項目對應的節(jié)點的狀態(tài),狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部114預測醫(yī)療費(Ml)。接著,將通過保健指導服務改善了檢查值的值設定為今年的保健指導對象候選者I的值,狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部114預測下一年的醫(yī)療費(M2)。Ml為不進行保健指導的情況下的預測醫(yī)療費,M2為進行了保健指導的情況下的預測醫(yī)療費,因此,當將保健指導所需的費用設為M3時,醫(yī)療費削減費用對效果能夠通過E = M1-M2-M3來計算。針對保健指導服務與保健指導對象候選者的所有組合進行該處理,計算醫(yī)療費削減費用對效果E。
[0257]接著,在保健指導內(nèi)容制定步驟1704中,從保健指導服務與保健指導對象候選者的組合中選擇醫(yī)療費削減費用對效果最高的組合。然后,將所選擇的保健指導對象候選者設為已選擇。接著,從對于未被選擇的保健指導對象候選者的保健指導服務與保健指導對象候選者的組合中選擇醫(yī)療費削減費用對效果最高的組合。然后,將所選擇的保健指導對象候選者設為已選擇。通過這樣,能夠按效果從高到低的順序選擇保健指導服務與保健指導對象候選者的組合。最后,在保健指導的預算的范圍內(nèi)選擇效果高的組合,設定保健指導對象者和保健指導內(nèi)容。
[0258]在效果預測步驟1705中,對通過保健指導內(nèi)容制定步驟1704選擇的組合的醫(yī)療費削減費用對效果進行合計,輸出從醫(yī)療費削減效果減去保健指導成本所得的值作為效果O
[0259]接著,說明面向擔當者和對象者的支援功能的處理。
[0260]圖17B是面向擔當者/對象者的支援功能的處理的流程圖。
[0261]首先,在對象疾病設定步驟1701中,設定作為處理的對象的疾病。例如在將作為三大生活習慣病的糖尿病、血脂異常癥以及高血壓癥設為對象的情況下,使用診療費用賬單整形信息的項目中的符合糖尿病、血脂異常癥以及高血壓癥的醫(yī)療行為的項目、健康診斷的項目以及問診的項目,狀態(tài)特征附加/重構部113重構模型。在將所有疾病設為對象的情況下,使用狀態(tài)轉(zhuǎn)移模型制作部108所制作的模型。
[0262]說明對象疾病設定步驟1701的處理的其它例。選擇對象者或擔當者希望處理的疾病。即,選擇與某醫(yī)療行為對應的項目。接著,計算該項目與其它所有項目之間的依賴度。然后,提取與該所選擇的項目之間的依賴度為一定程度以上的項目,基于該選擇項目以及所提取的項目的列表,使用狀態(tài)特征附加/重構部113重構的模型。在此,依賴度中也可以使用上述的項目彼此的類似度。
[0263]在發(fā)病概率計算步驟1706中,將所有節(jié)點的狀態(tài)設為未設定的狀態(tài)下狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部114預測下一年的各疾病的病態(tài)轉(zhuǎn)移概率和醫(yī)療費。關于各疾病,能夠作為下一年的有關與該疾病相當?shù)尼t(yī)療行為的節(jié)點的處方次數(shù)為I以上的概率來求出。這可認為是疾病的平均發(fā)病概率。接著,基于對象者的今年的診療費用賬單、健康診斷以及問診的值,設定與今年的項目對應的節(jié)點的狀態(tài),狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部114預測下一年的各疾病的病態(tài)轉(zhuǎn)移概率和醫(yī)療費。此時的各疾病的發(fā)病概率是該對象者的疾病的發(fā)病概率。因此,對于各疾病,通過將對象者的疾病的發(fā)病概率除以疾病的平均發(fā)病概率,計算對象者的發(fā)病風險是平均的幾倍。
[0264]在高風險疾病提示步驟1707中,提示發(fā)病風險比平均高預先確定的閾值以上的疾病及其風險。由此,對象者或保健指導擔當者能夠獲知對象者的疾病風險。
[0265]在改善項目提示步驟1708中,提示與通過高風險疾病提示步驟1707計算的高風險疾病所對應的醫(yī)療行為節(jié)點之間具有一定程度以上的依賴度的檢查值。在此,依賴度中也可以使用上述的項目彼此的類似度。
[0266]接著,在目標值用戶輸入步驟1709中,促使用戶輸入關于通過改善項目提示步驟1708提示的檢查項目的改善目標值(例如體重的目標值)。
[0267]最后,在效果預測步驟1710中,以目標值更新通過目標值用戶輸入步驟1709輸入的檢查項目,通過與步驟1706同樣的方法預測達到目標后的疾病的發(fā)病概率來提示發(fā)病風險的變化。用戶通過觀察發(fā)病風險的變化,能夠設定改善目標或使用于自己管理。
[0268]通過以上的處理,能夠進行對于醫(yī)療費削減有效的保健指導支援。
[0269]如以上所說明的那樣,在第2實施例的醫(yī)療數(shù)據(jù)分析系統(tǒng)中,基于診療費用賬單信息和體檢信息計算加入者間的類似度,基于類似度進行對類似的疾病的狀態(tài)的人進行分類的聚類分析。因此,能夠?qū)︻愃频臓顟B(tài)的加入者進行聚類分析來利用群組表示加入者的狀態(tài)。
[0270]另外,利用屬于群組的加入者的平均狀態(tài)對群組的狀態(tài)附加特征。因此,能夠利用群組來表現(xiàn)疾病的狀態(tài)、重癥度。例如,利用BMI值、血糖值、診療行為的處方次數(shù)、醫(yī)療費等的平均值來表示群組的狀態(tài)。
[0271]另外,使用相對于母集的偏離大的項目對群組附加特征,因此能夠自動地對群組附加特征。
[0272]然后,根據(jù)群組間的轉(zhuǎn)移概率將狀態(tài)間的轉(zhuǎn)移(疾病的狀態(tài)、重癥化)模型化。某年的一個加入者屬于某一個群組,疾病的一個狀態(tài)對應于一個群組。因此,能夠利用轉(zhuǎn)移概率來表現(xiàn)屬于該群組的人明年所屬的群組。因此,能夠以群組間的移動來直觀且易懂地表示將來的轉(zhuǎn)移的情形。
[0273]另外,根據(jù)屬于各群組的加入者的數(shù)量,能夠容易地掌握屬于何種狀態(tài)的人有幾個。另外,在與其它集之間比較屬于各群組的加入者的數(shù)量的比例,能夠獲知集的特征的差異。例如,通過將血糖值為規(guī)定值以下的集與血糖值超過規(guī)定值的集進行比較,能夠獲知糖尿病的患病率、重癥者的比例、重癥化的情形的差異等。
[0274]通過該模型,能夠有效利用包含大量項目的診療費用賬單信息和體檢信息,能夠表現(xiàn)大量疾病及其狀態(tài)。通過該模型,能夠精細且高精度地預測將來的疾病的狀態(tài)轉(zhuǎn)移、醫(yī)療費。
[0275]然后,通過基于預測結果選定保健指導對象者和保健指導內(nèi)容,能夠支援有效且高效的保健指導。
[0276]另外,根據(jù)加入者間的類似度決定分析對象者所屬的群組,因此能夠?qū)ξ粗膶ο笳哌M行聚類分析。
[0277]另外,使用將診療費用賬單信息的多個項目合并所得的項目計算加入者間的類似度,因此能夠高精度地計算類似度。
[0278]另外,使用加入者相對于母集的位置的差來計算加入者間的類似度,因此在不同的項目間也能夠以同一尺度計算類似度。
[0279]另外,利用M1-M2-M3計算醫(yī)療費削減費用對效果(Ml =不進行保健指導的情況下的預測醫(yī)療費、M2 =進行了保健指導的情況下的預測醫(yī)療費、M3 =保健指導所需的費用),因此能夠正確地估計醫(yī)療費削減費用對效果。
[0280]另外,使用群組間的轉(zhuǎn)移概率計算相對于改善目標值的發(fā)病風險,因此能夠易懂地顯示改善所產(chǎn)生的風險降低效果。
[0281]另外,選擇糖尿病、高血壓癥以及血脂異常癥的至少一個轉(zhuǎn)移概率,因此能夠以作為三大生活習慣病的糖尿病、血脂異常癥以及高血壓癥為對象來進行保健指導。
[0282]此外,本發(fā)明不限定于前述的實施例,包括所附的權利要求書的宗旨內(nèi)的各種變形例以及同等的結構。例如,前述的實施例是為了容易理解本發(fā)明而詳細說明的,本發(fā)明不限定于具備所說明的所有結構。另外,也可以將某實施例的結構的一部分置換為其它實施例的結構。另外,也可以對某實施例的結構追加其它實施例的結構。另外,關于各實施例的結構的一部分,也可以進行其它結構的追加/刪除/置換。
[0283]另外,關于前述的各結構、功能、處理部、處理單元等,例如可以通過集成電路對它們的一部分或全部進行設計等來以硬件實現(xiàn),也可以通過由處理器解釋并執(zhí)行實現(xiàn)各個功能的程序來以軟件實現(xiàn)。
[0284]實現(xiàn)各功能的程序、表、文件等信息能夠保存到存儲器、硬盤、SSD(Solid StateDrive:固態(tài)硬盤)等存儲裝置或IC卡、SD卡、DVD等記錄介質(zhì)。
[0285]另外,控制線、信息線表示認為在說明上所需要的,不限于表示實際安裝上需要的全部控制線、信息線。實際上,可認為幾乎所有的結構相互連接。
【權利要求】
1.一種分析系統(tǒng),具有執(zhí)行程序的處理器以及保存所述程序的存儲器,通過執(zhí)行所述程序來對數(shù)據(jù)進行分析,該分析系統(tǒng)的特征在于, 所述分析系統(tǒng)能夠訪問保存包含實例間的類似度的數(shù)據(jù)間類似度信息的存儲裝置, 所述分析系統(tǒng)具備: 數(shù)據(jù)映射部,所述處理器基于所述數(shù)據(jù)間類似度信息,設定作用于所述實例間的引力和斥力,將所述實例在某維度的矢量空間配置成,所述引力和斥力的能量小于預先確定的閾值;以及 聚類分析部,對配置在所述矢量空間的實例進行分類, 所述數(shù)據(jù)映射部在所述矢量空間中虛擬地追加一個維度,使所述實例的坐標向所述追加的維度方向微小變動,計算對于所述微小變動而言為穩(wěn)定的矢量空間的最小的維度數(shù)。
2.一種分析系統(tǒng),具有執(zhí)行程序的處理器以及保存所述程序的存儲器,通過執(zhí)行所述程序來對醫(yī)療數(shù)據(jù)進行分析,該分析系統(tǒng)的特征在于, 所述分析系統(tǒng)能夠訪問保存包含加入者的傷病名和對所述加入者進行的醫(yī)療行為的醫(yī)療信息、所述醫(yī)療行為的費用信息、以及包含所述加入者的健康診斷的檢查值的體檢信息的數(shù)據(jù)庫, 所述分析系統(tǒng)具備: 加入者配置坐標生成部,所述處理器基于所述醫(yī)療信息和所述體檢信息,計算所述加入者間的類似度,基于所述計算的類似度將所述加入者配置在同一維度數(shù)的矢量空間;聚類分析部,所述處理器基于配置有所述加入者的坐標,將所述加入者分類為群組,通過所述分類的群組構成模型; 狀態(tài)轉(zhuǎn)移概率計算部,所述處理器計算所述分類的群組間的轉(zhuǎn)移概率; 狀態(tài)特征附加/重構部,所述處理器基于以所指定的項目附加特征的群組、以及根據(jù)該群組和所述轉(zhuǎn)移概率確定的群組重構所述模型; 狀態(tài)轉(zhuǎn)移/醫(yī)療費預測部,所述處理器基于所述醫(yī)療行為的費用信息和所述構成的模型或所述重構的模型,預測將來的疾病的狀態(tài)和醫(yī)療費;以及 健康指導支援部,所述處理器基于所述預測的病態(tài)的狀態(tài)和醫(yī)療費,選定健康指導的對象者和健康指導內(nèi)容, 所述加入者配置坐標生成部將所述加入者在某維度的矢量空間配置成,基于所述類似度設定的作用于所述加入者間的引力和斥力的能量小于預先確定的閾值;在所述某維度的矢量空間中虛擬地追加一個維度;使所述加入者的坐標向所述追加的維度方向微小變動;計算對于所述微小變動而言為穩(wěn)定的矢量空間的最小的維度數(shù);將所述加入者配置在所述計算的維度數(shù)的矢量空間。
3.根據(jù)權利要求2所述的分析系統(tǒng),其特征在于, 所述健康指導支援部確定與分析對象的加入者之間的類似度高的加入者所屬的群組來作為所述分析對象的加入者的當前的狀態(tài), 所述健康指導支援部根據(jù)從所述確定的群組向其它群組的轉(zhuǎn)移概率,計算所述分析對象的加入者屬于所述其它群組的概率。
4.根據(jù)權利要求2所述的分析系統(tǒng),其特征在于, 所述健康指導支援部在將分析對象的加入者的體檢信息置換為接受健康指導后的預計值之后,確定與所述分析對象的加入者之間的類似度高的加入者所屬的群組, 所述健康指導支援部根據(jù)從所述確定的群組向其它群組的轉(zhuǎn)移概率,計算在接受健康指導之后所述分析對象的加入者屬于所述其它群組的概率。
5.根據(jù)權利要求2所述的分析系統(tǒng),其特征在于, 所述狀態(tài)特征附加/重構部通過對屬于所述群組的加入者的各項目的值進行統(tǒng)計處理所得的值,對該群組附加特征, 針對所述統(tǒng)計處理所得的值相對于所有加入者的平均值的偏離大的項目,所述狀態(tài)特征附加/重構部制作用于顯示對該群組附加特征的項目和所述統(tǒng)計處理所得的值的數(shù)據(jù)。
6.根據(jù)權利要求2所述的分析系統(tǒng),其特征在于, 所述加入者配置坐標生成部使用將所述醫(yī)療信息的多個項目合并所得的項目,計算所述加入者間的類似度。
7.根據(jù)權利要求2所述的分析系統(tǒng),其特征在于, 還具備數(shù)據(jù)整形部,所述處理器從所述醫(yī)療信息獲取進行了醫(yī)療行為的次數(shù)和醫(yī)療行為的費用,從所述體檢信息獲取所述檢查值,制作將所述獲取的信息針對每個所述加入者按每個規(guī)定期間匯總而得到的整形信息,將所述制作的整形信息保存到所述數(shù)據(jù)庫, 所述加入者配置坐標生成部針對所述整形信息的某項目,使用第I加入者的值以下的值的人的比例與第2加入者的值以下的值的人的比例之差,計算所述第I加入者與所述第2加入者之間的類似度。
8.根據(jù)權利要求2所述的分析系統(tǒng),其特征在于, 所述健康指導支援部通過從所述加入者的預測醫(yī)療費減去將所述加入者的檢查值置換為接受健康指導之后的檢查值而得到的第2預測醫(yī)療費以及所述健康指導的費用,來計算預測效果, 所述健康指導支援部選定所述計算的預測效果高的加入者與健康指導的組作為健康指導的對象者和健康指導內(nèi)容。
9.根據(jù)權利要求2所述的分析系統(tǒng),其特征在于, 所述健康指導支援部根據(jù)所述加入者的病態(tài)的轉(zhuǎn)移概率與病態(tài)的平均轉(zhuǎn)移概率之比來計算第I發(fā)病風險, 通過由用戶輸入檢查值改善目標值,所述健康指導支援部使用將所述加入者的檢查值置換為所述改善目標值而得到的病態(tài)的轉(zhuǎn)移概率,計算第2發(fā)病風險, 所述健康指導支援部通過比較所述第I發(fā)病風險與所述第2發(fā)病風險,生成用于顯示改善所產(chǎn)生的風險降低效果的數(shù)據(jù)。
10.根據(jù)權利要求9所述的分析系統(tǒng),其特征在于, 構成關于糖尿病、高血壓癥以及血脂異常癥中的至少一個的模型。
11.一種健康事業(yè)支援方法,使用具有執(zhí)行程序的處理器和保存所述程序的存儲器的計算機來支援健康指導,其特征在于, 所述計算機能夠訪問數(shù)據(jù)庫,該數(shù)據(jù)庫保存包含加入者的傷病名和對所述加入者進行的醫(yī)療行為的醫(yī)療信息、所述醫(yī)療行為的費用信息、以及包含所述加入者的健康診斷的檢查值的體檢信息, 所述健康事業(yè)支援方法包括如下步驟: 加入者配置坐標生成步驟,所述處理器基于所述醫(yī)療信息和所述體檢信息,計算所述加入者間的類似度,基于所述計算的類似度將所述加入者配置在同一維度數(shù)的矢量空間;聚類分析步驟,所述處理器基于所述加入者被配置的坐標,制作所述加入者被分類而成的群組,通過所述制作的群組構成模型; 狀態(tài)特征附加/重構步驟,所述處理器通過屬于所述群組的加入者的特征對所述群組附加特征,基于所述醫(yī)療信息和所述體檢信息,計算所述制作的群組間的轉(zhuǎn)移概率,基于所述轉(zhuǎn)移概率來重構通過以所指定的項目附加特征的群組構成的模型; 狀態(tài)轉(zhuǎn)移/醫(yī)療費預測步驟,所述處理器基于包含所述醫(yī)療行為的費用的信息、以及所述構成的模型或所述重構的模型,預測將來的疾病的狀態(tài)和醫(yī)療費;以及 健康指導支援步驟,所述處理器基于所述預測的病態(tài)的狀態(tài)和醫(yī)療費,選定健康指導的對象者和健康指導內(nèi)容, 在所述聚類分析步驟中, 基于所述加入者間的類似度,設定作用于所述加入者間的引力和斥力; 將所述加入者在某維度的矢量空間配置成,所述引力和斥力的能量小于預先確定的閾值; 在所述某維度的矢量空間中虛擬地追加一個維度; 使所述加入者的坐標向所述追加的維度方向微小變動; 計算對于所述微小變動而言為穩(wěn)定的矢量空間的最小的維度數(shù); 將所述加入者配置在所述計算的維度數(shù)的矢量空間。
【文檔編號】G06Q50/22GK104166881SQ201410208266
【公開日】2014年11月26日 申請日期:2014年5月16日 優(yōu)先權日:2013年5月17日
【發(fā)明者】三好利升, 長谷川泰隆, 伴秀行, 永崎健, 新莊廣 申請人:株式會社日立制作所