两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種面向糖尿病健康管理的知識圖譜融合方法

文檔序號:40630534發(fā)布日期:2025-01-10 18:36閱讀:8來源:國知局
一種面向糖尿病健康管理的知識圖譜融合方法

本發(fā)明涉及糖尿病知識圖譜與人工智能模型,特別涉及一種面向糖尿病健康管理的知識圖譜融合方法。


背景技術(shù):

1、知識圖譜是一個結(jié)構(gòu)化的知識庫,其中包含了豐富的實體、屬性和關(guān)系信息,其應(yīng)用能夠解決知識管理、信息檢索、數(shù)據(jù)集成和智能決策等多個問題。通過將知識圖譜與健康管理系統(tǒng)相結(jié)合,系統(tǒng)能夠從圖譜中獲取豐富的領(lǐng)域知識,知識圖譜(kg)對于問答、推薦系統(tǒng)等智能應(yīng)用至關(guān)重要。雖然糖尿病研究中已有的kg可用,但它們通常不能完全滿足特定任務(wù)的要求,一方面從頭開始構(gòu)建一個全新的知識圖譜,雖然可以確保信息的全面性和準(zhǔn)確性,但這樣的過程往往周期長、成本高;另一方面目前知識圖譜融合大多都側(cè)重于如何改進(jìn)融合過程中的實體對齊方法,對知識融合整個過程的詳盡描述少之又少,沒有一套完整且行之有效的方法,因此,融合現(xiàn)有的知識圖譜,根據(jù)特定任務(wù)的需求進(jìn)行定制和優(yōu)化,是現(xiàn)有方法及技術(shù)的重要研究內(nèi)容。


技術(shù)實現(xiàn)思路

1、本發(fā)明的目的在于提供一種面向糖尿病健康管理的知識圖譜融合方法,旨在實現(xiàn)糖尿病知識圖譜的融合以及為其他領(lǐng)域的知識圖譜構(gòu)建提供普適性的方法和過程。

2、為了達(dá)到上述目的,本發(fā)明的技術(shù)方案是提供了一種面向糖尿病健康管理的知識圖譜融合方法,其特征在于,包括以下步驟:

3、s1.獲取兩個源知識圖譜并將其存儲到neo4j數(shù)據(jù)庫中;

4、s2.確定糖尿病知識圖譜的目標(biāo)scheme,并根據(jù)scheme進(jìn)行數(shù)據(jù)預(yù)處理;

5、s3.通過相似度算法和大語言模型實現(xiàn)實體對齊操作,建立實體間的對應(yīng)關(guān)系,根據(jù)模型的輸出不斷進(jìn)行調(diào)整,找到最匹配的對應(yīng)實體;

6、s4.基于實體對齊的結(jié)果及scheme規(guī)范進(jìn)行實體插入,將一個知識圖譜中存在但另一個中缺失的實體添加到相應(yīng)的位置;

7、s5.對插入的實體及關(guān)系根據(jù)schema進(jìn)行調(diào)整,消除冗余與沖突,完成知識圖譜的融合。

8、優(yōu)選的,所述步驟s1具體包括以下步驟:尋找與目標(biāo)schema相近的領(lǐng)域相關(guān)的知識圖譜作為參考,選擇與目標(biāo)schema具有高度相關(guān)性,且規(guī)模較大、在醫(yī)療領(lǐng)域具有權(quán)威性的知識圖譜。將獲取到的知識圖譜三元組利用cypher語句存儲到neo4j圖數(shù)據(jù)庫中。

9、優(yōu)選的,所述步驟s2具體包括以下步驟:

10、s21.參考斯坦福七步大學(xué)構(gòu)建法,并結(jié)合糖尿病健康管理的任務(wù)需求及diachat對話數(shù)據(jù)集中規(guī)范的領(lǐng)域確定目標(biāo)scheme。

11、s22.利用大語言模型prompt和數(shù)據(jù)可視化工具neo4j?browser對兩個知識圖譜進(jìn)行查詢和分析,發(fā)現(xiàn)問題,基于schema規(guī)范并使用cypher語句進(jìn)行問題修改。

12、優(yōu)選的,所述步驟s3具體包括以下步驟:采用levenshtein編輯距離算法作為初始的相似度計算方法,將每個實體名稱視為一個字符串,通過計算不同實體名稱之間的編輯距離,來判斷它們的相似程度。如果編輯距離小于設(shè)定的閾值,則將它們視為相似的實體;接著進(jìn)一步利用大語言模型,采用few-shot?prompt生成方法把待評估的實體對作為模型的輸入,如果模型最后輸出相似度得分大于0.8,則認(rèn)定為高相似度的實體對。

13、優(yōu)選的,所述步驟s4具體包括以下步驟:根據(jù)實體對齊的結(jié)果并使用cypher查詢語句在一個知識圖譜中尋找相對應(yīng)的節(jié)點。如果已存在,則無需重復(fù)插入;如果不存在,則進(jìn)行實體插入操作;在確定插入位置后,需要選擇適當(dāng)?shù)年P(guān)系類型來表示實體之間的關(guān)聯(lián)。根據(jù)知識圖譜的結(jié)構(gòu)和語義,在插入過程中選擇通過cypher查詢語句merge創(chuàng)建新的關(guān)系類型,將知識圖譜中的實體與插入位置的節(jié)點標(biāo)簽進(jìn)行連接,構(gòu)成上下位關(guān)系。

14、優(yōu)選的,所述步驟s4具體包括以下步驟:通過可視化工具neo4j?browser并結(jié)合cypher的模式匹配和聚合函數(shù)來檢索知識圖譜中存在的關(guān)系及屬性,然后基于schema規(guī)范手動修改其實體關(guān)系;處理修改之后產(chǎn)生的節(jié)點,主要包括刪除重復(fù)節(jié)點及創(chuàng)建關(guān)系;為圖譜中存在的新節(jié)點添加來源以及subclassof等關(guān)系,如此迭代,直到圖譜中所有實體關(guān)系及屬性處理完成。

15、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點:

16、本發(fā)明提出的面向糖尿病健康管理的知識圖譜融合方法,基于確定好的糖尿病知識圖譜的目標(biāo)schema,對源知識圖譜進(jìn)行篩選,并根據(jù)schema規(guī)范進(jìn)行數(shù)據(jù)預(yù)處理,最后在大語言模型的支持下采用實體對齊、實體插入、關(guān)系調(diào)整等技術(shù)提出了一種針對多源知識圖譜的快速知識融合框架,最后完成了知識圖譜的融合,該框架不僅適用于糖尿病領(lǐng)域,還可以應(yīng)用于其他領(lǐng)域的知識圖譜,能夠為后續(xù)健康診斷和個性化推薦工作提供數(shù)據(jù)支持。



技術(shù)特征:

1.一種面向糖尿病健康管理的知識圖譜融合方法,其特征在于,包括如下步驟:

2.根據(jù)權(quán)利要求1所述的一種面向糖尿病健康管理的知識圖譜融合方法,所述步驟s1包括:

3.根據(jù)權(quán)利要求1所述的一種面向糖尿病健康管理的知識圖譜融合方法,所述步驟s2包括:

4.根據(jù)權(quán)利要求1所述的一種面向糖尿病健康管理的知識圖譜融合方法,所述步驟s3包括:

5.根據(jù)權(quán)利要求1所述的一種面向糖尿病健康管理的知識圖譜融合方法,所述步驟s4包括:

6.根據(jù)權(quán)利要求1所述的一種面向糖尿病健康管理的知識圖譜融合方法,所述步驟s5包括:


技術(shù)總結(jié)
本發(fā)明公開了一種面向糖尿病健康管理的知識圖譜融合方法,包括:步驟1,獲取兩個源知識圖譜并將其存儲到Neo4J數(shù)據(jù)庫中;步驟2,確定糖尿病知識圖譜的目標(biāo)Scheme,并根據(jù)Scheme進(jìn)行數(shù)據(jù)預(yù)處理;步驟3,通過相似度算法和大語言模型實現(xiàn)實體對齊操作,建立實體間的對應(yīng)關(guān)系,根據(jù)模型的輸出不斷進(jìn)行調(diào)整,找到最匹配的對應(yīng)實體;步驟4,基于實體對齊的結(jié)果及Scheme規(guī)范進(jìn)行實體插入,將一個知識圖譜中存在但另一個中缺失的實體添加到相應(yīng)的位置;步驟5,對插入的實體及關(guān)系根據(jù)Schema進(jìn)行調(diào)整,消除冗余與沖突,完成知識圖譜的融合。本發(fā)明提出的方法解決了一般融合過程周期長、成本高的問題,不僅適用于糖尿病領(lǐng)域,還可以應(yīng)用于其他領(lǐng)域的知識圖譜融合。

技術(shù)研發(fā)人員:吳小凡,楊錦鋒
受保護(hù)的技術(shù)使用者:哈爾濱理工大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
郑州市| 嘉义市| 晋中市| 华宁县| 浦城县| 蚌埠市| 哈巴河县| 赣榆县| 宜兰县| 莆田市| 米林县| 淮滨县| 临湘市| 乌什县| 尼勒克县| 柳河县| 蛟河市| 淮北市| 崇州市| 都江堰市| 商水县| 平罗县| 文山县| 都安| 金山区| 黄浦区| 达尔| 临武县| 崇信县| 南召县| 前郭尔| 梅河口市| 平果县| 通山县| 荥阳市| 农安县| 台北市| 台湾省| 章丘市| 永顺县| 缙云县|