本技術(shù)涉及人工智能開(kāi)發(fā)與金融科技領(lǐng)域,尤其涉及基于人工智能的知識(shí)圖譜構(gòu)建方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在當(dāng)今快速發(fā)展的金融科技領(lǐng)域,保險(xiǎn)行業(yè)正經(jīng)歷著前所未有的數(shù)字化轉(zhuǎn)型浪潮。知識(shí)圖譜作為一種先進(jìn)的數(shù)據(jù)組織與知識(shí)管理技術(shù),以強(qiáng)大的關(guān)聯(lián)分析能力、智能推理能力以及可視化展現(xiàn)特性,為保險(xiǎn)行業(yè)提供了前所未有的數(shù)據(jù)處理與分析手段,有望顯著提升風(fēng)險(xiǎn)評(píng)估、產(chǎn)品設(shè)計(jì)及客戶服務(wù)反欺詐等多方面的效率和準(zhǔn)確性。
2、然而,目前,保險(xiǎn)領(lǐng)域的知識(shí)圖譜通常采用人工構(gòu)建的方式。這種人工構(gòu)建知識(shí)圖譜的方式,需要工作人員預(yù)先耗費(fèi)大量時(shí)間和精力來(lái)收集、整理和編輯與圖譜構(gòu)建有關(guān)的數(shù)據(jù),由于與圖譜構(gòu)建有關(guān)的數(shù)據(jù)龐雜且不斷更新,會(huì)導(dǎo)致人工編輯知識(shí)圖譜的效率較低,與此同時(shí),由于工作人員的疏忽,會(huì)導(dǎo)致知識(shí)圖譜編輯錯(cuò)誤的情況,從而導(dǎo)致知識(shí)圖譜的編輯準(zhǔn)確度較低。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的目的在于提出一種基于人工智能的知識(shí)圖譜構(gòu)建方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),以解決現(xiàn)有的人工構(gòu)建知識(shí)圖譜的方式存在效率較低且準(zhǔn)確度較低的技術(shù)問(wèn)題。
2、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例提供一種基于人工智能的知識(shí)圖譜構(gòu)建方法,采用了如下所述的技術(shù)方案:
3、獲取預(yù)先收集的原始保險(xiǎn)知識(shí)文本;
4、對(duì)所述原始保險(xiǎn)知識(shí)文本進(jìn)行預(yù)處理,得到對(duì)應(yīng)的保險(xiǎn)知識(shí)文本;
5、基于訓(xùn)練好的實(shí)體抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行實(shí)體抽取,得到所述保險(xiǎn)知識(shí)文本中的保險(xiǎn)實(shí)體;
6、基于訓(xùn)練好的實(shí)體屬性抽取模型對(duì)所述保險(xiǎn)知識(shí)文本與所述保險(xiǎn)實(shí)體進(jìn)行屬性抽取,得到所述保險(xiǎn)實(shí)體的屬性值;
7、基于訓(xùn)練好的關(guān)系抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行關(guān)系抽取,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的保險(xiǎn)關(guān)系;
8、基于訓(xùn)練好的實(shí)體鏈接模型,使用所述保險(xiǎn)實(shí)體、所述保險(xiǎn)實(shí)體的屬性值、所述保險(xiǎn)關(guān)系對(duì)預(yù)設(shè)的本體模型進(jìn)行數(shù)據(jù)映射處理,得到對(duì)應(yīng)的映射結(jié)果;
9、基于預(yù)設(shè)的圖數(shù)據(jù)庫(kù)對(duì)所述映射結(jié)果進(jìn)行知識(shí)存儲(chǔ)處理,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的目標(biāo)知識(shí)圖譜。
10、進(jìn)一步的,所述基于訓(xùn)練好的實(shí)體鏈接模型,使用所述保險(xiǎn)實(shí)體、所述保險(xiǎn)實(shí)體的屬性值、所述保險(xiǎn)關(guān)系對(duì)預(yù)設(shè)的本體模型進(jìn)行數(shù)據(jù)映射處理,得到對(duì)應(yīng)的映射結(jié)果的步驟,具體包括:
11、加載預(yù)先構(gòu)建好的本體模型;其中,所述本體模型包括預(yù)定義的實(shí)體名詞、預(yù)定義的實(shí)體屬性名詞和預(yù)定義的關(guān)系名詞;
12、對(duì)于指定保險(xiǎn)實(shí)體,基于所述實(shí)體鏈接模型計(jì)算所述指定保險(xiǎn)實(shí)體與所述本體模型中預(yù)定義的實(shí)體名詞之間的相似度數(shù)值;其中,所述指定保險(xiǎn)實(shí)體為所有所述保險(xiǎn)實(shí)體中的任意一個(gè)實(shí)體;
13、基于所述相似度數(shù)值,將所述指定保險(xiǎn)實(shí)體鏈接至所述本體模型中對(duì)應(yīng)的指定實(shí)體名詞上;
14、獲取與所述指定保險(xiǎn)實(shí)體對(duì)應(yīng)的指定屬性值,并將所述指定屬性值映射至所述本體模型中對(duì)應(yīng)的指定實(shí)體屬性名詞上;
15、獲取指定保險(xiǎn)關(guān)系,將所述指定保險(xiǎn)關(guān)系映射至所述本體模型中對(duì)應(yīng)的指定關(guān)系名詞上,直至完成對(duì)所有所述保險(xiǎn)實(shí)體、所有所述保險(xiǎn)實(shí)體的屬性值以及所有所述保險(xiǎn)關(guān)系的數(shù)據(jù)映射處理,并得到所述映射結(jié)果;其中,所述指定保險(xiǎn)關(guān)系為所有所述保險(xiǎn)關(guān)系中的任意一種關(guān)系。
16、進(jìn)一步的,所述基于預(yù)設(shè)的圖數(shù)據(jù)庫(kù)對(duì)所述映射結(jié)果進(jìn)行知識(shí)存儲(chǔ)處理,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的目標(biāo)知識(shí)圖譜的步驟,具體包括:
17、對(duì)所述映射結(jié)果進(jìn)行格式化處理,得到對(duì)應(yīng)的目標(biāo)映射結(jié)果;
18、調(diào)用所述圖數(shù)據(jù)庫(kù),并在所述圖數(shù)據(jù)庫(kù)中定義與所述本體模型相對(duì)應(yīng)的節(jié)點(diǎn)類型和關(guān)系類型;
19、基于所述節(jié)點(diǎn)類型與所述關(guān)系類型,將所述目標(biāo)映射結(jié)果轉(zhuǎn)化為所述圖數(shù)據(jù)庫(kù)中的節(jié)點(diǎn)數(shù)據(jù)與邊數(shù)據(jù);
20、將所述節(jié)點(diǎn)數(shù)據(jù)與所述邊數(shù)據(jù)導(dǎo)入至所述圖數(shù)據(jù)庫(kù)內(nèi),得到對(duì)應(yīng)的指定知識(shí)圖譜;
21、基于預(yù)設(shè)的驗(yàn)證規(guī)則對(duì)所述指定知識(shí)圖譜進(jìn)行數(shù)據(jù)驗(yàn)證;
22、若所述指定知識(shí)圖譜通過(guò)數(shù)據(jù)驗(yàn)證,則將所述指定知識(shí)圖譜作為與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的所述目標(biāo)知識(shí)圖譜。
23、進(jìn)一步的,所述對(duì)所述原始保險(xiǎn)知識(shí)文本進(jìn)行預(yù)處理,得到對(duì)應(yīng)的保險(xiǎn)知識(shí)文本的步驟,具體包括:
24、獲取預(yù)設(shè)的數(shù)據(jù)清洗策略與數(shù)據(jù)整合策略;
25、基于所述數(shù)據(jù)清洗策略對(duì)所述原始保險(xiǎn)知識(shí)文本進(jìn)行數(shù)據(jù)清洗處理,得到對(duì)應(yīng)的第一保險(xiǎn)知識(shí)文本;
26、基于所述數(shù)據(jù)整合策略對(duì)所述第一保險(xiǎn)知識(shí)文本進(jìn)行數(shù)據(jù)整合處理,得到對(duì)應(yīng)的第二保險(xiǎn)知識(shí)文本;
27、將所述第二保險(xiǎn)知識(shí)文本作為所述保險(xiǎn)知識(shí)文本。
28、進(jìn)一步的,所述基于訓(xùn)練好的實(shí)體抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行實(shí)體抽取處,得到所述保險(xiǎn)知識(shí)文本中的保險(xiǎn)實(shí)體的步驟之前,還包括:
29、收集保險(xiǎn)領(lǐng)域的第一文本數(shù)據(jù);
30、對(duì)所述文本數(shù)據(jù)進(jìn)行標(biāo)注處理,得到對(duì)應(yīng)的第二文本數(shù)據(jù);
31、將所述第二文本數(shù)據(jù)整理為符合預(yù)設(shè)的實(shí)體識(shí)別數(shù)據(jù)格式的樣本數(shù)據(jù);
32、獲取預(yù)設(shè)的大語(yǔ)言模型;
33、使用所述樣本數(shù)據(jù)與基于低秩適應(yīng)的微調(diào)算法對(duì)所述大語(yǔ)言模型進(jìn)行訓(xùn)練與微調(diào)處理,得到符合預(yù)設(shè)的模型構(gòu)建要求的指定大語(yǔ)言模型;
34、將所述指定大語(yǔ)言模型作為所述實(shí)體抽取模型。
35、進(jìn)一步的,所述基于訓(xùn)練好的關(guān)系抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行關(guān)系抽取,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的保險(xiǎn)關(guān)系的步驟之前,還包括:
36、從預(yù)設(shè)的多個(gè)數(shù)據(jù)源中收集包含實(shí)體、屬性值和關(guān)系的數(shù)據(jù)集;
37、構(gòu)建所述數(shù)據(jù)集與所述本體模型中包含的名詞之間的映射關(guān)系;
38、基于所述映射關(guān)系生成與所述數(shù)據(jù)集對(duì)應(yīng)的輸出標(biāo)簽;
39、獲取預(yù)設(shè)的分類模型;
40、將所述數(shù)據(jù)集作為模型輸入,將所述輸出標(biāo)簽作為模型輸出對(duì)所述分類模型進(jìn)行訓(xùn)練,得到對(duì)應(yīng)的指定分類模型;
41、基于預(yù)設(shè)的評(píng)估數(shù)據(jù)集對(duì)所述指定分類模型進(jìn)行模型評(píng)估;
42、若所述指定分類模型通過(guò)模型評(píng)估,則將所述指定分類模型作為所述實(shí)體鏈接模型。
43、進(jìn)一步的,在所述基于預(yù)設(shè)的圖數(shù)據(jù)庫(kù)對(duì)所述映射結(jié)果進(jìn)行知識(shí)存儲(chǔ)處理,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的目標(biāo)知識(shí)圖譜的步驟之后,還包括:
44、獲取預(yù)設(shè)的圖譜測(cè)試數(shù)據(jù)集;
45、基于所述圖譜測(cè)試數(shù)據(jù)集對(duì)所述目標(biāo)知識(shí)圖譜進(jìn)行評(píng)估測(cè)試處理,得到對(duì)應(yīng)的評(píng)估結(jié)果;
46、基于所述評(píng)估結(jié)果生成對(duì)應(yīng)的評(píng)估報(bào)告;
47、將評(píng)估報(bào)告發(fā)送至預(yù)設(shè)的目標(biāo)團(tuán)隊(duì)。
48、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種基于人工智能的知識(shí)圖譜構(gòu)建裝置,采用了如下所述的技術(shù)方案:
49、第一獲取模塊,用于獲取預(yù)先收集的原始保險(xiǎn)知識(shí)文本;
50、預(yù)處理模塊,用于對(duì)所述原始保險(xiǎn)知識(shí)文本進(jìn)行預(yù)處理,得到對(duì)應(yīng)的保險(xiǎn)知識(shí)文本;
51、第一抽取模塊,用于基于訓(xùn)練好的實(shí)體抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行實(shí)體抽取,得到所述保險(xiǎn)知識(shí)文本中的保險(xiǎn)實(shí)體;
52、第二抽取模塊,用于基于訓(xùn)練好的實(shí)體屬性抽取模型對(duì)所述保險(xiǎn)知識(shí)文本與所述保險(xiǎn)實(shí)體進(jìn)行屬性抽取,得到所述保險(xiǎn)實(shí)體的屬性值;
53、第三抽取模塊,用于基于訓(xùn)練好的關(guān)系抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行關(guān)系抽取,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的保險(xiǎn)關(guān)系;
54、映射模塊,用于基于訓(xùn)練好的實(shí)體鏈接模型,使用所述保險(xiǎn)實(shí)體、所述保險(xiǎn)實(shí)體的屬性值、所述保險(xiǎn)關(guān)系對(duì)預(yù)設(shè)的本體模型進(jìn)行數(shù)據(jù)映射處理,得到對(duì)應(yīng)的映射結(jié)果;
55、存儲(chǔ)模塊,用于基于預(yù)設(shè)的圖數(shù)據(jù)庫(kù)對(duì)所述映射結(jié)果進(jìn)行知識(shí)存儲(chǔ)處理,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的目標(biāo)知識(shí)圖譜。
56、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,采用了如下所述的技術(shù)方案:
57、所述計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本技術(shù)實(shí)施例中提出的任一項(xiàng)所述的基于人工智能的知識(shí)圖譜構(gòu)建方法的步驟。
58、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),采用了如下所述的技術(shù)方案:
59、所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本技術(shù)實(shí)施例中提出的任一項(xiàng)所述的基于人工智能的知識(shí)圖譜構(gòu)建方法的步驟。
60、與現(xiàn)有技術(shù)相比,本技術(shù)實(shí)施例主要有以下有益效果:
61、首先獲取預(yù)先收集的原始保險(xiǎn)知識(shí)文本;并對(duì)所述原始保險(xiǎn)知識(shí)文本進(jìn)行預(yù)處理,得到對(duì)應(yīng)的保險(xiǎn)知識(shí)文本;然后基于訓(xùn)練好的實(shí)體抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行實(shí)體抽取,得到所述保險(xiǎn)知識(shí)文本中的保險(xiǎn)實(shí)體;之后基于訓(xùn)練好的實(shí)體屬性抽取模型對(duì)所述保險(xiǎn)知識(shí)文本與所述保險(xiǎn)實(shí)體進(jìn)行屬性抽取,得到所述保險(xiǎn)實(shí)體的屬性值;后續(xù)基于訓(xùn)練好的關(guān)系抽取模型對(duì)所述保險(xiǎn)知識(shí)文本進(jìn)行關(guān)系抽取,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的保險(xiǎn)關(guān)系;進(jìn)一步基于訓(xùn)練好的實(shí)體鏈接模型,使用所述保險(xiǎn)實(shí)體、所述保險(xiǎn)實(shí)體的屬性值、所述保險(xiǎn)關(guān)系對(duì)預(yù)設(shè)的本體模型進(jìn)行數(shù)據(jù)映射處理,得到對(duì)應(yīng)的映射結(jié)果;最后基于預(yù)設(shè)的圖數(shù)據(jù)庫(kù)對(duì)所述映射結(jié)果進(jìn)行知識(shí)存儲(chǔ)處理,得到與所述保險(xiǎn)知識(shí)文本對(duì)應(yīng)的目標(biāo)知識(shí)圖譜。本技術(shù)基于實(shí)體抽取模型、實(shí)體屬性抽取模型、關(guān)系抽取模型、實(shí)體鏈接模型以及圖數(shù)據(jù)庫(kù)的使用對(duì)保險(xiǎn)知識(shí)文本進(jìn)行處理,可以實(shí)現(xiàn)快速準(zhǔn)確的構(gòu)建出相應(yīng)的目標(biāo)知識(shí)圖譜。由此能夠避免人工收集、整理和編輯圖譜數(shù)據(jù)所浪費(fèi)的時(shí)間,從而有效提高知識(shí)圖譜的構(gòu)建效率,同時(shí),還能夠避免由于工作人員的疏忽而導(dǎo)致圖譜編輯錯(cuò)誤的情況,進(jìn)而提高知識(shí)圖譜的構(gòu)建準(zhǔn)確度。