本發(fā)明涉及人工智能和安全生產(chǎn)與環(huán)境保護,尤其涉及安環(huán)領域知識問答方法、裝置、電子設備及存儲介質(zhì)。
背景技術:
1、安全環(huán)保領域涉及的數(shù)據(jù)種類繁多,包括環(huán)境監(jiān)測數(shù)據(jù)、污染源信息、安全生產(chǎn)記錄、政策法規(guī)等,針對安環(huán)領域知識繁雜、種類多樣、用戶需求多變導致知識復用效率低、精度不高等問題,提出一種融合大語言模型與知識圖譜的安全環(huán)保知識構(gòu)建與知識問答方法。
2、近年來,隨著知識工程的不斷進步,越來越多的企業(yè)和組織都在尋求將這一技術應用到安全環(huán)保領域。面對海量的安全環(huán)保數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理方式難以快速準確地提取有價值的信息。知識圖譜通過結(jié)構(gòu)化的知識表示和推理能力,能夠幫助決策者快速找到關鍵信息,提高決策效率和準確性,通過知識圖譜的構(gòu)建,可以實現(xiàn)知識的自動化、智能化復用,提高知識復用效率和精度,降低人力成本。因此,知識圖譜在安全環(huán)保領域的應用前景廣泛而深遠,它不僅能夠提升該領域的創(chuàng)新能力和競爭力,還能夠為企業(yè)和社會帶來實際的效益和價值。
3、然而,隨著技術的不斷發(fā)展和完善,安全環(huán)保領域的知識圖譜構(gòu)建也面臨著一些挑戰(zhàn)。由于該領域的專業(yè)性和復雜性,需要根據(jù)企業(yè)自身的特點及其積累的數(shù)據(jù)與知識,探索安全環(huán)保領域知識圖譜的自動構(gòu)建方法,實現(xiàn)安環(huán)領域知識圖譜自動構(gòu)建和智能化應用,為安全環(huán)保領域的持續(xù)發(fā)展和創(chuàng)新提供有力的支持。近年來,大語言模型(largelanguage?models,llm)在多種自然語言處理任務上展現(xiàn)出了顯著的成效。這類模型擁有龐大的參數(shù)規(guī)模和復雜的網(wǎng)絡結(jié)構(gòu),能夠有效地處理和理解自然語言任務。然而,當面對專業(yè)領域的問題時,大語言模型的生成結(jié)果可能會缺乏真實性和準確性。
技術實現(xiàn)思路
1、有鑒于此,有必要提供一種安環(huán)領域知識問答方法、裝置、電子設備及存儲介質(zhì),用以解決現(xiàn)有技術在將大語言模型與知識圖譜進行結(jié)合后面對專業(yè)領域的問題可能會缺乏真實性和準確性的技術問題。
2、為了解決上述問題,本發(fā)明提供一種安環(huán)領域知識問答方法,包括:
3、基于owl本體語言構(gòu)建結(jié)構(gòu)化標準知識描述模型構(gòu)建知識圖譜本體模型;
4、基于深度學習模型獲取安環(huán)領域的知識數(shù)據(jù);
5、結(jié)合所述知識圖譜本體模型以及知識數(shù)據(jù)構(gòu)建安環(huán)領域的知識圖譜;
6、基于大語言模型對用戶輸入的自然語言問題進行解析,得到查詢語;
7、基于所述大語言模型、知識圖譜以及查詢語生成對應的答案。
8、在一種可能的實現(xiàn)方式中,所述基于owl本體語言構(gòu)建結(jié)構(gòu)化標準知識描述模型構(gòu)建知識圖譜本體模型,包括:
9、確定知識圖譜的專業(yè)領域和范疇;
10、基于所述專業(yè)領域以及范疇確定安全環(huán)保領域內(nèi)的術語和概念;
11、在owl本體語言構(gòu)建結(jié)構(gòu)化標準知識描述模型的基礎上,根據(jù)術語列表,定義本體模型中的類及其層次結(jié)構(gòu);
12、其中,定義本體模型中的類及其層次結(jié)構(gòu),包括:
13、定義類的屬性,其中,所述屬性包括數(shù)據(jù)屬性和對象屬性;
14、定義類與類之間的關系。
15、在一種可能的實現(xiàn)方式中,所述基于深度學習模型獲取安環(huán)領域的知識數(shù)據(jù),包括:
16、對包括安全環(huán)保領域的標準規(guī)范、實驗報告以及文獻報告的安環(huán)文本數(shù)據(jù)進行預處理;
17、從預處理后的安環(huán)文本數(shù)據(jù)中提取得到實體以及實體之間的關系;
18、基于實體以及實體之間的關系構(gòu)建實體識別模型和關系識別模型;
19、基于實體識別模型和關系識別模型進行三元組抽取,并將抽取得到的知識數(shù)據(jù)存儲到neo4j圖數(shù)據(jù)庫中。
20、在一種可能的實現(xiàn)方式中,所述對安環(huán)文本數(shù)據(jù)進行預處理,包括:
21、對所述非結(jié)構(gòu)化文本數(shù)據(jù)進行數(shù)據(jù)清洗,并以txt文件的方式保存預處理后的安環(huán)文本數(shù)據(jù)。
22、在一種可能的實現(xiàn)方式中,所述從預處理后的安環(huán)文本數(shù)據(jù)中提取得到實體以及實體之間的關系,包括:
23、定義安環(huán)文本數(shù)據(jù)中的實體類型;
24、根據(jù)所述實體類型,基于brat工具對所述安環(huán)文本數(shù)據(jù)中的實體進行標注;
25、基于albert-bilstm-crf模型對標注的結(jié)果進行實體識別;
26、基于albert-bilstm模型對實體識別的結(jié)果進行關系抽取。
27、其中,關系包括包含關系、關聯(lián)關系、依賴關系以及影響關系。
28、在一種可能的實現(xiàn)方式中,所述基于大語言模型對用戶輸入的自然語言問題進行解析,得到查詢語,包括:
29、基于大語言模型對自然語言問題進行語句主干提取解析,輸出原問題的解析結(jié)果;
30、將解析結(jié)果轉(zhuǎn)化為cypher語句,得到查詢語。
31、在一種可能的實現(xiàn)方式中,所述基于所述大語言模型、知識圖譜以及查詢語生成對應的答案,包括:
32、在所述知識圖譜中檢索與查詢語對應的安環(huán)知識;
33、將所述安環(huán)知識以提示的方式和查詢語一起輸入所述大語言模型;
34、基于大語言模型進行推理生成答案。
35、本發(fā)明還提供一種安環(huán)領域知識問答裝置,包括:
36、本體模型構(gòu)建模塊,用于基于owl本體語言構(gòu)建結(jié)構(gòu)化標準知識描述模型構(gòu)建知識圖譜本體模型;
37、知識數(shù)據(jù)獲取模塊,用于基于深度學習模型獲取安環(huán)領域的知識數(shù)據(jù);
38、知識圖譜構(gòu)建模塊,用于結(jié)合所述本體模型以及知識數(shù)據(jù)構(gòu)建安環(huán)領域的知識圖譜;
39、查詢語轉(zhuǎn)換模塊,用于基于大語言模型對用戶以文字形式輸入的自然語言問題進行分析,得到查詢語;
40、答案查詢模塊,用于基于所述大語言模型、知識圖譜以及查詢語生成對應的答案。
41、本發(fā)明還提供一種電子設備,包括:
42、存儲器,用于存儲程序;
43、處理器,與所述存儲器耦合,用于執(zhí)行所述存儲器中存儲的所述程序,以實現(xiàn)上述各方法項中任意一項所述的安環(huán)領域知識問答方法中的步驟。
44、本發(fā)明還提供一種存儲介質(zhì),用于存儲計算機可讀取的程序或指令,所述程序或指令被處理器執(zhí)行時能夠?qū)崿F(xiàn)上述各方法項中任意一項所述的安環(huán)領域知識問答方法中的步驟。
45、本發(fā)明的有益效果是:本發(fā)明提供了一種安環(huán)領域知識問答方法,首先,本發(fā)明利用知識圖譜相關技術,能夠結(jié)構(gòu)化地表示安環(huán)領域知識,同時,大語言模型具備理解和生成自然語言的能力,兩者的融合使得安全環(huán)保領域的知識能夠有效整合,形成全面的領域知識體系,從而實現(xiàn)知識的廣泛共享與應用。其次,本發(fā)明獲取的安環(huán)領域非結(jié)構(gòu)化文本數(shù)據(jù)的來源真實可靠,而深度學習模型具備從大規(guī)模數(shù)據(jù)中自動學習特征表示的能力,通過訓練,深度學習模型能夠?qū)W習到安環(huán)領域非結(jié)構(gòu)化數(shù)據(jù)中的復雜模式和關聯(lián),進而提高抽取的知識的真實性以及準確性,從而有效地解決了現(xiàn)有技術在將大語言模型與知識圖譜進行結(jié)合后面對專業(yè)領域的問題可能會缺乏真實性和準確性的技術問題。
1.一種安環(huán)領域知識問答方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的安環(huán)領域知識問答方法,其特征在于,所述基于owl本體語言構(gòu)建結(jié)構(gòu)化標準知識描述模型構(gòu)建知識圖譜本體模型,包括:
3.根據(jù)權(quán)利要求1所述的安環(huán)領域知識問答方法,其特征在于,所述基于深度學習模型獲取安環(huán)領域的知識數(shù)據(jù),包括:
4.根據(jù)權(quán)利要求3所述的安環(huán)領域知識問答方法,其特征在于,所述對安環(huán)文本數(shù)據(jù)進行預處理,包括:
5.根據(jù)權(quán)利要求3所述的安環(huán)領域知識問答方法,其特征在于,所述從預處理后的安環(huán)文本數(shù)據(jù)中提取得到實體以及實體之間的關系,包括:
6.根據(jù)權(quán)利要求1所述的安環(huán)領域知識問答方法,其特征在于,所述基于大語言模型對用戶輸入的自然語言問題進行解析,得到查詢語,包括:
7.根據(jù)權(quán)利要求6所述的安環(huán)領域知識問答方法,其特征在于,所述基于所述大語言模型、知識圖譜以及查詢語生成對應的答案,包括:
8.一種安環(huán)領域知識問答裝置,其特征在于,包括:
9.一種電子設備,其特征在于,包括:
10.一種存儲介質(zhì),其特征在于,用于存儲計算機可讀取的程序或指令,所述程序或指令被處理器執(zhí)行時能夠?qū)崿F(xiàn)上述權(quán)利要求1至7中任意一項所述的安環(huán)領域知識問答方法中的步驟。