两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種電子病歷的檢索方法及系統(tǒng)與流程

文檔序號(hào):11286508閱讀:812來(lái)源:國(guó)知局
一種電子病歷的檢索方法及系統(tǒng)與流程

【技術(shù)領(lǐng)域】

本發(fā)明涉及一種電子病歷的檢索方法及系統(tǒng)。



背景技術(shù):

隨著醫(yī)院計(jì)算機(jī)管理網(wǎng)絡(luò)化和信息存儲(chǔ)技術(shù)的高速發(fā)展,電子病歷成為病歷管理的必然趨勢(shì)。電子病歷是醫(yī)務(wù)人員在醫(yī)療活動(dòng)過(guò)程中,使用醫(yī)療機(jī)構(gòu)信息系統(tǒng)生成的文字、符號(hào)、圖表、圖形、數(shù)據(jù)、影像等數(shù)字化信息,并能實(shí)現(xiàn)存儲(chǔ)、管理、傳輸和重現(xiàn)的醫(yī)療記錄,是病歷的一種記錄形式。電子病歷記錄了病患就診的所有信息,臨床診斷的信息檢索、醫(yī)療數(shù)據(jù)的挖掘分析等相關(guān)研究都依賴于電子病歷數(shù)據(jù)。

名醫(yī)的電子病歷代表著高效和準(zhǔn)確的行醫(yī)經(jīng)驗(yàn),建立電子病歷數(shù)據(jù)庫(kù)便是將醫(yī)生的行醫(yī)知識(shí)存儲(chǔ)起來(lái),合理利用電子病歷數(shù)據(jù)庫(kù)用于臨床輔助診斷對(duì)于提高醫(yī)院的工作效率和醫(yī)療質(zhì)量具有重大意義。然而,在目前病歷的檢索系統(tǒng)中,主要以字段、關(guān)鍵詞等進(jìn)行檢索,存在檢索準(zhǔn)確率和效率差的問(wèn)題。

以上背景技術(shù)內(nèi)容的公開(kāi)僅用于輔助理解本發(fā)明的發(fā)明構(gòu)思及技術(shù)方案,其并不必然屬于本專利申請(qǐng)的現(xiàn)有技術(shù),在沒(méi)有明確的證據(jù)表明上述內(nèi)容在本專利申請(qǐng)的申請(qǐng)日已經(jīng)公開(kāi)的情況下,上述背景技術(shù)不應(yīng)當(dāng)用于評(píng)價(jià)本申請(qǐng)的新穎性和創(chuàng)造性。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問(wèn)題是:彌補(bǔ)上述現(xiàn)有技術(shù)的不足,提出一種電子病歷的檢索方法及系統(tǒng),具有較高的檢索準(zhǔn)確率和檢索效率。

本發(fā)明的技術(shù)問(wèn)題通過(guò)以下的技術(shù)方案予以解決:

一種電子病歷的檢索方法,包括以下步驟:s1,對(duì)電子病歷數(shù)據(jù)庫(kù)中每一份電子病歷,計(jì)算電子病歷內(nèi)容特征,所述內(nèi)容特征包括圖像特征;s2,對(duì)待檢索電子病歷,提取其相應(yīng)的內(nèi)容特征;s3,根據(jù)內(nèi)容特征,計(jì)算待檢索電子病歷與電子病歷數(shù)據(jù)庫(kù)中各個(gè)電子病歷的相似度值;s4,根據(jù)步驟s3中得到的待檢索電子病歷與各個(gè)電子病歷的相似度值,取最相似的前n份電子病歷,作為檢索結(jié)果;n為由用戶或者管理員設(shè)定的正整數(shù)。

一種電子病歷的檢索系統(tǒng),包括存儲(chǔ)模塊,所述存儲(chǔ)模塊存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于由處理器加載并執(zhí)行如上所述的電子病歷的檢索方法。

本發(fā)明與現(xiàn)有技術(shù)對(duì)比的有益效果是:

本發(fā)明的電子病歷的檢索方法及系統(tǒng),提取的內(nèi)容特征中至少包括醫(yī)學(xué)圖像特征,這樣以圖像特征進(jìn)行相似度計(jì)算,檢索出最相似的前n份電子病歷。這樣,以醫(yī)學(xué)圖像特征為基礎(chǔ)進(jìn)行檢索,可檢索到相似度高并且價(jià)值大的電子病歷。本發(fā)明的電子病歷的檢索方法及系統(tǒng),檢索結(jié)果準(zhǔn)確率高,檢索效率較高,可快速準(zhǔn)確地檢索出相近似的病歷作為對(duì)醫(yī)生和患者進(jìn)行診療計(jì)劃的參考。

【附圖說(shuō)明】

圖1是本發(fā)明具體實(shí)施方式的檢索系統(tǒng)的框架示意圖;

圖2是本發(fā)明具體實(shí)施方式的電子病歷數(shù)據(jù)庫(kù)的結(jié)構(gòu)示意圖;

圖3是本發(fā)明具體實(shí)施方式中訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;

圖4是圖3所示的卷積神經(jīng)網(wǎng)絡(luò)的代價(jià)函數(shù)結(jié)果曲線圖。

【具體實(shí)施方式】

下面結(jié)合具體實(shí)施方式并對(duì)照附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)說(shuō)明。

本發(fā)明的構(gòu)思是:信息檢索的關(guān)鍵在于相似度的計(jì)算,將信息檢索技術(shù)與電子病歷結(jié)合起來(lái),采用目前先進(jìn)的相似度計(jì)算方法,特別是在圖像上的相似度計(jì)算方法來(lái)提供電子病歷檢索的準(zhǔn)確率和檢索效率。深度學(xué)習(xí)目前已經(jīng)是機(jī)器學(xué)習(xí)研究中的一個(gè)前沿領(lǐng)域,其采用多層神經(jīng)網(wǎng)絡(luò)模型,在大數(shù)據(jù)規(guī)模上進(jìn)行通過(guò)有監(jiān)督或無(wú)監(jiān)督的學(xué)習(xí),能模仿人類神經(jīng)識(shí)別過(guò)程對(duì)目標(biāo)進(jìn)行高準(zhǔn)確率的分類識(shí)別。因此,將深度學(xué)習(xí)應(yīng)用于醫(yī)學(xué)圖像的目標(biāo)識(shí)別,從而提高電子病歷檢索的準(zhǔn)確率和效率。

本發(fā)明的檢索系統(tǒng)建立在電子病歷數(shù)據(jù)庫(kù)的基礎(chǔ)上,采用深度學(xué)習(xí)等人工智能技術(shù)挖掘電子病歷數(shù)據(jù)內(nèi)容上的價(jià)值和相似度,從而達(dá)到將醫(yī)生寶貴經(jīng)驗(yàn)和知識(shí)應(yīng)用于輔助診斷的目的。由于系統(tǒng)呈現(xiàn)給用戶的結(jié)果是電子病歷數(shù)據(jù)庫(kù)中與待檢索病歷相似的原始病歷,這種客觀的原始病歷避免了人為處理造成的錯(cuò)誤,無(wú)論是經(jīng)驗(yàn)不足的醫(yī)生還是患者都可以根據(jù)這些原始病歷獲取參考信息。

本具體實(shí)施方式中,構(gòu)建電子病歷數(shù)據(jù)庫(kù),利用病歷文本、化驗(yàn)結(jié)果和醫(yī)學(xué)圖像的相關(guān)檢索方法在數(shù)據(jù)庫(kù)中查詢相似度高并且價(jià)值大的電子病歷作為對(duì)醫(yī)生和患者做出診療計(jì)劃的參考。檢索系統(tǒng)主要包括三大方面:電子病歷數(shù)據(jù)庫(kù)、價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)。

電子病歷數(shù)據(jù)庫(kù)根據(jù)電子病歷中的內(nèi)容信息存儲(chǔ)相應(yīng)的特征。而如果將電子病歷中所有的內(nèi)容作為數(shù)據(jù)庫(kù)中的項(xiàng)目會(huì)導(dǎo)致數(shù)據(jù)庫(kù)異常龐大,并增大電子病歷檢索時(shí)的困難。因此,本具體實(shí)施方式的電子病歷數(shù)據(jù)庫(kù)采取的方法是將電子病歷的文本、化驗(yàn)結(jié)果和醫(yī)學(xué)圖像等內(nèi)容信息提取后存儲(chǔ)相應(yīng)的特征。需說(shuō)明的是,至少需提取到圖像的特征,在圖像特征的基礎(chǔ)上還可以結(jié)合文本、化驗(yàn)結(jié)果進(jìn)行綜合,并非必須三種特征同時(shí)提取。

在提取文本、化驗(yàn)結(jié)果和醫(yī)學(xué)圖像的特征時(shí),本具體實(shí)施方式中通過(guò)策略網(wǎng)絡(luò)計(jì)算得到的文本、化驗(yàn)結(jié)果和醫(yī)學(xué)圖像上的量化結(jié)果作為存儲(chǔ)的項(xiàng)目。與此同時(shí),本具體實(shí)施方式中還通過(guò)價(jià)值網(wǎng)絡(luò)量化計(jì)算電子病歷的價(jià)值指標(biāo)進(jìn)行存儲(chǔ)。具體量化過(guò)程在如下的價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)中詳述。

策略網(wǎng)絡(luò)用于確定電子病歷之間的相似度。本具體實(shí)施方式中,電子病歷的相似度是文本特征相似度、化驗(yàn)結(jié)果相似度和圖像特征相似度的綜合相似度。文本特征的處理是對(duì)病歷的文本內(nèi)容進(jìn)行漢語(yǔ)分詞和提取關(guān)鍵詞的tf-idf值加權(quán)合并患者基本信息的量化值?;?yàn)結(jié)果的處理是對(duì)化驗(yàn)結(jié)果進(jìn)行“偏低置為-1、正常或陰性置為0、偏高或陽(yáng)性置為1”的量化,并結(jié)合名醫(yī)建議的項(xiàng)目重要性通過(guò)層次分析法來(lái)加權(quán)合并各個(gè)檢查項(xiàng)目。圖像特征的處理采用深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合哈希編碼函數(shù)訓(xùn)練圖像的哈希編碼,以圖像的哈希編碼來(lái)表征圖像的特征。最后綜合電子病歷的文本特征、化驗(yàn)結(jié)果和圖像特征,以兩個(gè)病歷之間這三者的相似度加權(quán)合并后作為電子病歷之間的相似度值。

價(jià)值網(wǎng)絡(luò)用于確定電子病歷的價(jià)值。本具體實(shí)施方式中,電子病歷價(jià)值的指標(biāo)為電子病歷質(zhì)量、主治醫(yī)師、相應(yīng)科室和治療效果這四個(gè)指標(biāo)的量化值。其中,電子病歷的質(zhì)量標(biāo)準(zhǔn)包括了電子病歷的規(guī)范性、電子病歷的邏輯性和電子病歷的完整性三個(gè)方面;主治醫(yī)師等級(jí)和相應(yīng)科室等級(jí)這兩個(gè)指標(biāo)是一定區(qū)域內(nèi)的統(tǒng)計(jì)量;治療效果評(píng)級(jí)分為無(wú)效、稍有好轉(zhuǎn)、明顯改善和治愈。需說(shuō)明的是,上述四個(gè)指標(biāo)中,電子病歷質(zhì)量中的邏輯性、完整性和規(guī)范性直接影響到電子病歷的正確性和可讀性,因此選取價(jià)值特征時(shí),至少包括電子病歷質(zhì)量這一價(jià)值指標(biāo)。在此基礎(chǔ)上還可包括其余三個(gè)指標(biāo)中的一個(gè)或者多個(gè),并不是必須同時(shí)選取四種指標(biāo)作為價(jià)值特征。價(jià)值指標(biāo)量化后,采用密切值法處理以一個(gè)或者多個(gè)指標(biāo)作為價(jià)值特征的電子病歷的價(jià)值排序。

檢索系統(tǒng)通過(guò)文本界面、化驗(yàn)界面和圖像界面獲取到電子病歷的文本數(shù)據(jù)、化驗(yàn)數(shù)據(jù)和圖像數(shù)據(jù),策略網(wǎng)絡(luò)計(jì)算電子病歷的文本特征、化驗(yàn)特征和圖像特征,并根據(jù)這些特征來(lái)計(jì)算數(shù)據(jù)庫(kù)中的每個(gè)電子病歷與待檢索電子病歷之間的相似度,接著基于計(jì)算出的相似度,取前n份最相似的病歷作為檢索結(jié)果輸出。由于內(nèi)容特征均通過(guò)量化處理,因此數(shù)據(jù)庫(kù)中的各個(gè)電子病歷均計(jì)算一個(gè)相似度值也不會(huì)引起過(guò)多的計(jì)算量。檢索出n份電子病歷后,再基于價(jià)值網(wǎng)絡(luò)獲取病歷的四個(gè)指標(biāo)量化值,根據(jù)這四個(gè)指標(biāo)量化值對(duì)這n份電子病歷進(jìn)行價(jià)值排序,最后將得到的排序結(jié)果對(duì)應(yīng)的電子病歷進(jìn)行輸出?;颊呋蚪?jīng)驗(yàn)不足的醫(yī)生可以通過(guò)系統(tǒng)檢索到與待檢索電子病歷相似的病歷,這些電子病歷是名醫(yī)經(jīng)驗(yàn)和知識(shí)的載體,可以為醫(yī)生和患者提供參考。檢索結(jié)果準(zhǔn)確且效率高,而且檢索結(jié)果經(jīng)過(guò)價(jià)值排序后輸出,從而便于用戶最先查看到最相關(guān)的電子病歷。

以肺癌電子病歷為例,本具體實(shí)施方式的檢索系統(tǒng)的框架示意圖如圖1所示,處理流程包括以下幾步:

步驟1,建立電子病歷數(shù)據(jù)庫(kù),其結(jié)構(gòu)示意圖如圖2所示。

數(shù)據(jù)庫(kù)核心數(shù)據(jù)表為電子病歷表和權(quán)重表。電子病歷表的主要字段為:規(guī)范性、邏輯性、完整性、主治醫(yī)師、科室、治療效果、關(guān)鍵詞k1、關(guān)鍵詞k2···關(guān)鍵詞kn、患者信息項(xiàng)p1···患者信息項(xiàng)pn、化驗(yàn)項(xiàng)d1···化驗(yàn)項(xiàng)dn、圖像哈希碼、原始電子病歷存儲(chǔ)索引。權(quán)重表的主要字段為:關(guān)鍵詞權(quán)重wk、患者信息權(quán)重wp、化驗(yàn)項(xiàng)權(quán)重wd、文本特征權(quán)重wt、化驗(yàn)結(jié)果權(quán)重wr、圖像特征權(quán)重wi。

步驟2,對(duì)電子病歷數(shù)據(jù)庫(kù)中每一份電子病歷,通過(guò)價(jià)值網(wǎng)絡(luò)模塊計(jì)算其電子病歷質(zhì)量emr_v_q、主治醫(yī)生等級(jí)emr_v_d、醫(yī)院科室等級(jí)emr_v_dp和治療效果emr_v_t。

(1)取設(shè)定的醫(yī)生群體(例如一定范圍內(nèi)達(dá)到一定水平的醫(yī)生)對(duì)電子病歷的規(guī)范性、邏輯性和完整性評(píng)估為:a1,a2,a3,則電子病歷質(zhì)量為emr_v_q=a1×a2×a3。

需說(shuō)明的是,雖然評(píng)估是通過(guò)人為產(chǎn)生的,但是可基于客觀的依據(jù)進(jìn)行評(píng)估。例如衛(wèi)生部《電子病歷基本規(guī)范(試行)》,《病歷書(shū)寫基本規(guī)范》以及地方相關(guān)部門在審核醫(yī)保時(shí)的參考標(biāo)準(zhǔn),如深圳的社?;?。當(dāng)然,按照目前的科技以及電子病歷的規(guī)范化程度只能進(jìn)行人工打分,即使有參照標(biāo)準(zhǔn)也不可能面面俱到,因此會(huì)出現(xiàn)同一病例的不同評(píng)價(jià)結(jié)果,但是通過(guò)設(shè)定一定的評(píng)估標(biāo)準(zhǔn),可使評(píng)分有據(jù)可循,盡量達(dá)到客觀的狀態(tài)。

(2)主治醫(yī)生等級(jí)和醫(yī)院科室等級(jí)是對(duì)一定范圍內(nèi)的所有醫(yī)院的統(tǒng)計(jì)量。

主治的醫(yī)生等級(jí)分為主任醫(yī)師、副主任醫(yī)師、主治醫(yī)師和住院醫(yī)師四個(gè)等級(jí),各等級(jí)指數(shù)依次表示為emr_v_d1、emr_v_d2、emr_v_d3、emr_v_d4,則:

emr_v_di=emr_v_d_gi*emr_v_d_c

其中,m為醫(yī)院統(tǒng)計(jì)數(shù),mki為第k家醫(yī)院相應(yīng)科室醫(yī)生級(jí)別為i的疾病患者治愈數(shù),tki為第k家醫(yī)院相應(yīng)科室醫(yī)生級(jí)別為i的醫(yī)生人數(shù)。表示的是第k家醫(yī)院級(jí)別為i的醫(yī)生的平均患者治愈數(shù)目,第一個(gè)式子emr_v_d_gi表示在統(tǒng)計(jì)的m家醫(yī)院這個(gè)區(qū)域內(nèi),級(jí)別為i的醫(yī)生的治愈數(shù)在所有級(jí)別醫(yī)生中的權(quán)重。

在醫(yī)生診治的患者中,病情級(jí)別為a(i=1,2,...,r)時(shí)的診治人數(shù)為na,治愈人數(shù)為ca,表示級(jí)別為a的病情的權(quán)重,表示級(jí)別為a的病情的治愈率。第二個(gè)式子emr_v_d_c計(jì)算的是整個(gè)統(tǒng)計(jì)區(qū)域內(nèi)的醫(yī)生的治愈率。

第三個(gè)式子中,對(duì)等級(jí)為i的醫(yī)生的權(quán)重emr_v_d_gi與醫(yī)生的總體治愈率的乘積即為主治醫(yī)生等級(jí)為i時(shí)的治愈率。

通過(guò)上述式子,可分別計(jì)算得到主任醫(yī)師、副主任醫(yī)師、主治醫(yī)師和住院醫(yī)師四個(gè)醫(yī)生等級(jí)指數(shù)。根據(jù)電子病歷中主治醫(yī)生屬于哪一等級(jí),相應(yīng)取哪一級(jí)的醫(yī)生等級(jí)指數(shù)。

對(duì)于醫(yī)院科室等級(jí)emr_v_dp根據(jù)如下步驟計(jì)算得到:

其中,n_d表示科室的醫(yī)生人數(shù);emr_v_d_c′表示科室中的每一個(gè)醫(yī)生的治愈率,計(jì)算方法同上述的第二個(gè)式子。只是第二個(gè)式子中的n和c是對(duì)整個(gè)區(qū)域進(jìn)行統(tǒng)計(jì),此處是對(duì)單個(gè)醫(yī)生的進(jìn)行統(tǒng)計(jì)。對(duì)各個(gè)醫(yī)生的治愈率求和后即為該科室所有醫(yī)生對(duì)患者的治愈率,除以科室人數(shù)n_d得到的emr_v_dp即表示該科室每人的平均治愈率,以該指標(biāo)體現(xiàn)一個(gè)科室的醫(yī)療能力。

(3)治療效果emr_v_t按照無(wú)效、稍有好轉(zhuǎn)、明顯改善和治愈等級(jí)賦值量化。

通過(guò)步驟2可得到電子病歷數(shù)據(jù)庫(kù)中每一份電子病歷的四個(gè)價(jià)值指標(biāo),以用于后續(xù)步驟8的價(jià)值排序中。

步驟3,對(duì)電子病歷數(shù)據(jù)庫(kù)中每一份電子病歷,通過(guò)策略網(wǎng)絡(luò)計(jì)算電子病歷內(nèi)容中文本、化驗(yàn)和圖像的特征。

(1)病歷的文本中存在著多詞同義的現(xiàn)象,檢索系統(tǒng)中將這些詞歸納為同義詞庫(kù),在處理文本內(nèi)容時(shí)對(duì)出現(xiàn)在同義詞庫(kù)中的關(guān)鍵詞進(jìn)行合并。對(duì)于某些病癥,其總是對(duì)應(yīng)某個(gè)或某幾個(gè)特異性癥狀,特異性癥狀與相應(yīng)疾病之間雖然不是同義詞,但其在病歷中能確定的意義是相同的,檢索系統(tǒng)將這些詞歸納為特異詞庫(kù),特異詞庫(kù)中的關(guān)鍵詞在處理時(shí)也進(jìn)行合并。文本中一些沒(méi)有意義的停用詞,如“的”、“我院”、“于”等在獲取關(guān)鍵詞時(shí)被去掉。檢索系統(tǒng)將這類詞歸納為停用詞庫(kù)。

存儲(chǔ)于數(shù)據(jù)庫(kù)中的文本特征來(lái)源于兩種數(shù)據(jù):一種是描述患者病情的診斷報(bào)告,另一種是患者的基本信息。檢索系統(tǒng)在計(jì)算文本特征時(shí)首先根據(jù)電子病歷數(shù)據(jù)庫(kù)中所有的診斷報(bào)告,采用中文分詞的方法得到關(guān)鍵詞,并根據(jù)關(guān)鍵詞(k1,k2,...,kn)計(jì)算其tf-idf的值得到量化的診斷報(bào)告。tf-idf表示逆文檔頻率,tf-idf可求出在一篇文檔中出現(xiàn)頻率高而在所有文檔中出現(xiàn)頻率低的關(guān)鍵詞,這樣的關(guān)鍵詞即可表示該文檔。對(duì)電子病歷中的患者信息,采用0和1二值化每一項(xiàng)(如“男”置1,“女”置0)得到量化的患者信息(p1,p2,...,pn)。

(2)在肺癌電子病歷上,檢索系統(tǒng)采用“偏低置為-1、正常或陰性置為0、偏高或陽(yáng)性置為1”的方法量化各個(gè)檢查項(xiàng)目,得到各個(gè)項(xiàng)目的化驗(yàn)特征(d1,d2,...,dn)。

(3)醫(yī)學(xué)圖像具有噪聲干擾大、不同組織灰度相近、局部效應(yīng)等特點(diǎn),這會(huì)導(dǎo)致異常圖像與正常圖像的相似性在某些時(shí)候會(huì)高于異常圖像與異常圖像的相似性。鑒于此,檢索系統(tǒng)采取圖像類別(正常和異常)優(yōu)先的策略。結(jié)合深度卷積網(wǎng)絡(luò)的兩步哈希函數(shù)訓(xùn)練法得到的圖像哈希編碼之間的漢明距離既能表征圖像的類別,又能表示同一類別不同圖像的相似度。檢索系統(tǒng)對(duì)多種類別的圖像進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。

本具體實(shí)施方式中,對(duì)肺實(shí)質(zhì)、心血管、肺癌區(qū)域、胸腔壁這四種類別的圖像進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,具體過(guò)程如下:

定義哈希算法中的圖像相似性矩陣s

定義大小為n×q的二值矩陣b,其中n為電子病歷數(shù)據(jù)庫(kù)中電子病歷的數(shù)目,q為圖像的哈希編碼位數(shù),本具體實(shí)施方式中采用8位哈希編碼。哈希碼的內(nèi)積與它們的漢明距離具有一對(duì)一的映射關(guān)系,因而根據(jù)b∈{-1,1}n×q求解b的方法為采用坐標(biāo)梯度下降法最小化下式:

式子中,f表示取范數(shù)處理。上式中,使得s與盡可能接近,這樣在哈希理論里,b即可表示與s相關(guān)的哈希編碼。b中一行一行的內(nèi)容即對(duì)應(yīng)所有的圖像的哈希編碼。

提取矩陣b中的值作為各圖像的哈希編碼,將圖像本身作為輸入,對(duì)應(yīng)哈希碼和類別作為輸出訓(xùn)練一個(gè)卷積神經(jīng)網(wǎng)絡(luò),最終訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)就是一個(gè)哈希編碼函數(shù)。

如圖3所示,為訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。神經(jīng)網(wǎng)絡(luò)中,對(duì)輸入的圖像(32*32的像素點(diǎn))經(jīng)過(guò)卷積處理,得到c1中所示的6張圖像(28*28的像素點(diǎn)),之后經(jīng)過(guò)下采樣處理,得到s2所示的6張圖像(14*14的像素點(diǎn));再接著進(jìn)行卷積處理得到c3所示的16張圖像(10*10的像素點(diǎn));之后進(jìn)行下采樣處理,得到s4所示的16張圖像(5*5的像素點(diǎn)),最后經(jīng)過(guò)全連接處理,得到c5所示的包括120個(gè)像素點(diǎn)的圖像,對(duì)該圖像繼續(xù)進(jìn)行全連接處理,輸出11位編碼。其中既包括哈希碼(8位),也包括類別信息(3位),該類別信息可用于進(jìn)一步驗(yàn)證哈希碼的準(zhǔn)確性。需說(shuō)明的是,圖3所示的具體數(shù)值僅僅用于示例性說(shuō)明,數(shù)值均可以相應(yīng)調(diào)整,不影響神經(jīng)網(wǎng)絡(luò)的哈希編碼功能的實(shí)現(xiàn)。

計(jì)算圖3所示的神經(jīng)網(wǎng)絡(luò)的代價(jià)函數(shù)結(jié)果,得到如圖4所示的代價(jià)函數(shù)結(jié)果曲線圖。從圖中可知,其代價(jià)函數(shù)越來(lái)越小,表明該神經(jīng)網(wǎng)絡(luò)可用于進(jìn)行哈希編碼。由于采用的兩步深度哈希編碼是基于圖像本身訓(xùn)練得到的,減少了人工提取特征的誤差影響,其正確率較高。

電子病歷中的圖像內(nèi)容經(jīng)過(guò)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行哈希編碼后得到的q位哈希碼即可作為電子病歷的圖像特征。

步驟4,將步驟2和步驟3的結(jié)果存儲(chǔ)于步驟1中的電子病歷數(shù)據(jù)庫(kù)的相應(yīng)數(shù)據(jù)表的相應(yīng)字段,即得到基于電子病歷大數(shù)據(jù)的數(shù)據(jù)庫(kù)。

步驟5:對(duì)待檢索電子病歷,重復(fù)步驟3得到其各種內(nèi)容特征(文本特征、化驗(yàn)特征、圖像特征),然后基于待檢索電子病歷的內(nèi)容特征和數(shù)據(jù)庫(kù)中電子病歷的內(nèi)容特征,計(jì)算相似度值。

(1)計(jì)算文本特征相似度s_t,采用tf-idf方法設(shè)文檔向量vd:

vd=[k1,d,k2,d,…,kn,d]t

其中:

在上面公式中,tft是詞項(xiàng)t在文檔d中的頻率,是倒文檔頻率,|d|是文檔集合中的文檔總數(shù),|{t∈d}|是包含詞項(xiàng)t的文檔數(shù)。

記患者信息p=[p1,p2,...,pn],

兩個(gè)電子病歷的文本相似度為:

其中,ham(pi,pj)表示文本pi與文本pj的漢明距離。

(2)計(jì)算化驗(yàn)結(jié)果相似度s_r,采用層次分析法對(duì)化驗(yàn)的各個(gè)項(xiàng)目進(jìn)行加權(quán)。

記d=[d1,d2,...,dn],則:s_rij=wd*ham(di,dj)

其中,ham(di,dj)表示第i份電子病歷與第j份電子病歷的化驗(yàn)結(jié)果之間的漢明距離。wd為各項(xiàng)化驗(yàn)項(xiàng)目的權(quán)重,采用層次分析法得到。以炎癥這種病例為例,醫(yī)院會(huì)檢查血細(xì)胞的含量,血細(xì)胞中分為白細(xì)胞、紅細(xì)胞、血小板等。白細(xì)胞、紅細(xì)胞和血小板等即為檢查項(xiàng)目。對(duì)于炎癥,白細(xì)胞的含量能檢查出發(fā)炎,而紅細(xì)胞和血小板則沒(méi)有意義,因此通過(guò)設(shè)置權(quán)重wd,可以有針對(duì)性的項(xiàng)目來(lái)表征相似度。

對(duì)于權(quán)重的計(jì)算,通過(guò)設(shè)定的醫(yī)生群體(例如一定范圍內(nèi)達(dá)到一定水平的醫(yī)生)給定項(xiàng)目重要性,采用層次分析法可得到各化驗(yàn)項(xiàng)目的權(quán)重。層次分析法概述如下:

a)構(gòu)造準(zhǔn)則層相對(duì)于目標(biāo)層的判斷矩陣;b)利用判斷矩陣確定各準(zhǔn)則相對(duì)于目標(biāo)的權(quán)重系數(shù),即可得wd;c)對(duì)判斷矩陣做一致性檢驗(yàn),若不符合一致性,則重復(fù)上述過(guò)程,直至符合一致性。

其中,b)中的權(quán)重wd是由a)中的判斷矩陣決定的,當(dāng)不一致時(shí)重復(fù)步驟a)時(shí)即重新構(gòu)造新的判斷矩陣。舉個(gè)例子,第一次可能構(gòu)造得到判斷矩陣為[1,2;1/2,1],發(fā)現(xiàn)不符合一致性,則第二次改為[1,3;1/3,1],不斷調(diào)整,最終得到符合一致性檢驗(yàn)時(shí)的wd。

(3)計(jì)算圖像特征相似度s_i,s_iij=ham(hashi,hashj)

其中,hashi表示圖像i經(jīng)過(guò)卷積神經(jīng)網(wǎng)絡(luò)哈希函數(shù)(圖3所示的深度哈希網(wǎng)絡(luò))編碼后所得的q位哈希碼,hashj表示圖像j經(jīng)過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行哈希函數(shù)編碼后所得的哈希碼。ham表示求圖像i和圖像j的哈希碼的漢明距離。所謂漢明距離為兩個(gè)哈希碼相同位置但值不同的個(gè)數(shù)。例如”10010001”和”10110011”的漢明距離是2。

步驟6:根據(jù)電子病歷的文本特征、化驗(yàn)結(jié)果和圖像特征的相似度綜合計(jì)算出待檢索電子病歷與電子病歷數(shù)據(jù)庫(kù)中的電子病歷k的相似度sk:

sk=wt×s_t+wr×s_r+wi×s_i

其中,權(quán)重wt、wr和wi的值可由設(shè)定的醫(yī)生群體(例如一定范圍內(nèi)達(dá)到一定水平的醫(yī)生)給定文本、化驗(yàn)和圖像的相對(duì)重要性通過(guò)層次分析法得到。

步驟7:根據(jù)步驟6中得到的待檢索病歷與各個(gè)病歷的相似度的值,取最相似的前n份電子病歷emr1,emr2,...,emrn,作為檢索結(jié)果。

通過(guò)步驟3~7檢索出n份電子病歷后,可結(jié)合步驟2中獲取到的價(jià)值特征進(jìn)行步驟8中的價(jià)值排序過(guò)程。

步驟8:通過(guò)價(jià)值網(wǎng)絡(luò)計(jì)算這n份電子病歷的價(jià)值排序,按照排序后的順序輸出n份電子病歷。

由于價(jià)值指標(biāo)有電子病歷質(zhì)量、主治醫(yī)師、醫(yī)院科室和治療效果四項(xiàng),因此采用密切值法來(lái)進(jìn)行多指標(biāo)決策分析:

(1)構(gòu)造數(shù)據(jù)指標(biāo)矩陣

(2)建立同向指標(biāo)矩陣:當(dāng)評(píng)價(jià)指標(biāo)為正向指標(biāo)時(shí),數(shù)值取正值;當(dāng)評(píng)價(jià)指標(biāo)為負(fù)向指標(biāo)時(shí),數(shù)值取負(fù)值,得同向指標(biāo)矩陣。本具體實(shí)施方式中得到如下矩陣,其中p=4,n=n。

(3)建立標(biāo)準(zhǔn)化矩陣

其中,

(4)確定最優(yōu)點(diǎn)和最劣點(diǎn):

最優(yōu)點(diǎn):

最劣點(diǎn):

其中

上述計(jì)算過(guò)程中,最優(yōu)點(diǎn)即是p個(gè)指標(biāo)中每一個(gè)的最大的值的集合。也即,最優(yōu)點(diǎn)的特征是所有特征中最好的,相應(yīng)的,最劣點(diǎn)的特征是所有特征中最壞的。

(5)計(jì)算各評(píng)價(jià)對(duì)象到“最優(yōu)點(diǎn)”與“最劣點(diǎn)”的距離:

(6)計(jì)算各評(píng)價(jià)對(duì)象的“密切值”,并據(jù)此排出優(yōu)劣順序:

密切值:

其中

當(dāng)ci越小時(shí),與“最優(yōu)先”越密切,與“最劣點(diǎn)”越疏遠(yuǎn),即價(jià)值越高,最先輸出?;谠撛瓌t,對(duì)n份電子病歷進(jìn)行價(jià)值排序,排序的結(jié)果就是系統(tǒng)最終的相關(guān)電子病歷輸出順序。

以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說(shuō)明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說(shuō)明。對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下做出若干替代或明顯變型,而且性能或用途相同,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
兰西县| 静海县| 常宁市| 闽清县| 商河县| 阿坝县| 章丘市| 武功县| 同心县| 迁西县| 涟水县| 呼和浩特市| 乌拉特前旗| 吐鲁番市| 湖南省| 惠来县| 开封市| 威海市| 湘潭市| 晋中市| 乐山市| 牡丹江市| 小金县| 荔波县| 木兰县| 灵川县| 利辛县| 罗源县| 苏尼特右旗| 武安市| 宝山区| 黄冈市| 凤城市| 远安县| 玉田县| 石景山区| 明光市| 日照市| 新沂市| 延吉市| 濮阳市|