本公開涉及計(jì)算機(jī),尤其涉及深度學(xué)習(xí)、自然語言處理、大模型等人工智能,具體涉及一種數(shù)據(jù)處理方法、人機(jī)交互方法、智能體系統(tǒng)及裝置。
背景技術(shù):
1、現(xiàn)有技術(shù)中,檢索問答智能體(agent)系統(tǒng)中,前期進(jìn)行模型訓(xùn)練使用的訓(xùn)練集通常來自公開數(shù)據(jù)集或主動(dòng)挖掘的領(lǐng)域數(shù)據(jù),但是,這種方法獲得的訓(xùn)練集缺乏對(duì)實(shí)際業(yè)務(wù)場景數(shù)據(jù)的擬合,準(zhǔn)確性較低,數(shù)據(jù)質(zhì)量不高。
技術(shù)實(shí)現(xiàn)思路
1、本公開旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
2、本公開第一方面實(shí)施例提出了一種數(shù)據(jù)處理方法,包括:
3、獲取使用目標(biāo)模型的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù);
4、對(duì)所述日志數(shù)據(jù)進(jìn)行解析,獲取查詢數(shù)據(jù),及所述查詢數(shù)據(jù)對(duì)應(yīng)的檢索數(shù)據(jù);
5、將所述查詢數(shù)據(jù)和所述檢索數(shù)據(jù),分別輸入所述目標(biāo)模型及第一模型,得到至少兩個(gè)生成數(shù)據(jù);
6、利用至少兩個(gè)第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個(gè)所述生成數(shù)據(jù)的第一可信度;
7、將所述查詢數(shù)據(jù)、所述檢索數(shù)據(jù)、所述生成數(shù)據(jù)及所述第一可信度,關(guān)聯(lián)存入所述目標(biāo)模型關(guān)聯(lián)的訓(xùn)練數(shù)據(jù)庫中。
8、本公開第二方面實(shí)施例提出了一種模型更新方法,包括:
9、基于訓(xùn)練數(shù)據(jù)庫中包含的新增數(shù)據(jù)的數(shù)據(jù)量、新增數(shù)據(jù)的類型、目標(biāo)模型當(dāng)前的性能參數(shù)中的至少一項(xiàng),確定目標(biāo)更新方式,其中,所述訓(xùn)練數(shù)據(jù)庫中的新增數(shù)據(jù)為通過如本公開第一方面所述的方法生成的;
10、基于所述目標(biāo)更新方式,從所述訓(xùn)練數(shù)據(jù)庫中獲取訓(xùn)練數(shù)據(jù);
11、根據(jù)所述訓(xùn)練數(shù)據(jù)對(duì)所述目標(biāo)模型進(jìn)行更新訓(xùn)練。
12、本公開第三方面實(shí)施例提出了一種人機(jī)交互方法,包括:
13、接收輸入語句;
14、對(duì)所述輸入語句進(jìn)行識(shí)別,確定所述輸入關(guān)聯(lián)的目標(biāo)業(yè)務(wù);
15、將所述輸入語句,輸入至與所述目標(biāo)業(yè)務(wù)關(guān)聯(lián)的目標(biāo)模型,得到所述輸入語句對(duì)應(yīng)的答復(fù)語句,其中,所述目標(biāo)模型為通過本公開第二方面所述的方法生成的。
16、本公開第四方面實(shí)施例提出了一種人機(jī)交互智能體系統(tǒng),包括:
17、輸入組件,用于獲取輸入語句;
18、處理組件,用于調(diào)用第一智能體對(duì)所述輸入語句進(jìn)行識(shí)別,確定所述輸入語句關(guān)聯(lián)的目標(biāo)業(yè)務(wù),并調(diào)用所述目標(biāo)業(yè)務(wù)關(guān)聯(lián)的第二智能體,以得到所述第二智能體輸出的答復(fù)語句,其中,所述第一智能體及所述第二智能體中的至少一個(gè),被配置為用于調(diào)用本公開第二方面所述的方法生成的模型以完成對(duì)應(yīng)的功能;
19、輸出組件,用于輸出所述答復(fù)語句。
20、本公開第五方面實(shí)施例提出了一種數(shù)據(jù)處理裝置,包括:
21、第一獲取模塊,用于獲取使用目標(biāo)模型的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù);
22、第二獲取模塊,用于對(duì)所述日志數(shù)據(jù)進(jìn)行解析,獲取查詢數(shù)據(jù),及所述查詢數(shù)據(jù)對(duì)應(yīng)的檢索數(shù)據(jù);
23、處理模塊,用于將所述查詢數(shù)據(jù)和所述檢索數(shù)據(jù),分別輸入所述目標(biāo)模型及第一模型,得到至少兩個(gè)生成數(shù)據(jù);
24、第一確定模塊,用于利用至少兩個(gè)第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個(gè)所述生成數(shù)據(jù)的第一可信度;
25、存儲(chǔ)模塊,用于將所述查詢數(shù)據(jù)、所述檢索數(shù)據(jù)、所述生成數(shù)據(jù)及所述第一可信度,關(guān)聯(lián)存入所述目標(biāo)模型關(guān)聯(lián)的訓(xùn)練數(shù)據(jù)庫中。
26、本公開第六方面實(shí)施例提出了一種模型更新裝置,包括:
27、第二確定模塊,用于基于訓(xùn)練數(shù)據(jù)庫中包含的新增數(shù)據(jù)的數(shù)據(jù)量、新增數(shù)據(jù)的類型、目標(biāo)模型當(dāng)前的性能參數(shù)中的至少一項(xiàng),確定目標(biāo)更新方式,其中,所述訓(xùn)練數(shù)據(jù)庫中的新增數(shù)據(jù)為通過如本公開第一方面所述的方法生成的;
28、第三獲取模塊,用于基于所述目標(biāo)更新方式,從所述訓(xùn)練數(shù)據(jù)庫中獲取訓(xùn)練數(shù)據(jù);
29、訓(xùn)練模塊,用于根據(jù)所述訓(xùn)練數(shù)據(jù)對(duì)所述目標(biāo)模型進(jìn)行更新訓(xùn)練。
30、本公開第七方面實(shí)施例提出了一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí),實(shí)現(xiàn)如本公開第一方面實(shí)施例提出的數(shù)據(jù)處理方法、如本公開第二方面實(shí)施例提出的模型更新方法、或如本公開第三方面實(shí)施例提出的人機(jī)交互方法。
31、本公開第八方面實(shí)施例提出了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如本公開第一方面實(shí)施例提出的數(shù)據(jù)處理方法、如本公開第二方面實(shí)施例提出的模型更新方法、或如本公開第三方面實(shí)施例提出的人機(jī)交互方法。
32、本公開第九方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí),實(shí)現(xiàn)如本公開第一方面實(shí)施例提出的數(shù)據(jù)處理方法、如本公開第二方面實(shí)施例提出的模型更新方法、或如本公開第三方面實(shí)施例提出的人機(jī)交互方法。
33、本公開提供的數(shù)據(jù)處理方法、人機(jī)交互方法、智能體系統(tǒng)及裝置,存在如下有益效果:
34、本公開實(shí)施例中,首先獲取使用目標(biāo)模型的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù),并對(duì)日志數(shù)據(jù)進(jìn)行解析,獲取查詢數(shù)據(jù),及查詢數(shù)據(jù)對(duì)應(yīng)的檢索數(shù)據(jù),然后將查詢數(shù)據(jù)和檢索數(shù)據(jù),分別輸入目標(biāo)模型及第一模型,得到至少兩個(gè)生成數(shù)據(jù),之后利用至少兩個(gè)第二模型,并基于查詢數(shù)據(jù)及檢索數(shù)據(jù),確定每個(gè)生成數(shù)據(jù)的第一可信度,最后將查詢數(shù)據(jù)、檢索數(shù)據(jù)、生成數(shù)據(jù)及第一可信度,關(guān)聯(lián)存入目標(biāo)模型關(guān)聯(lián)的訓(xùn)練數(shù)據(jù)庫中。由此,通過基于使用目標(biāo)系統(tǒng)的業(yè)務(wù)系統(tǒng)的日志數(shù)據(jù),獲得查詢數(shù)據(jù)以及檢索數(shù)據(jù),并基于目標(biāo)模型以及第一模型,分別生成查詢數(shù)據(jù)以及檢索數(shù)據(jù)對(duì)應(yīng)的生成數(shù)據(jù),利用第二模型對(duì)生成數(shù)據(jù)進(jìn)行評(píng)估并獲得可信度,將查詢數(shù)據(jù)、檢索數(shù)據(jù)、生成數(shù)據(jù)以及可信度,關(guān)聯(lián)存入目標(biāo)模型對(duì)應(yīng)的數(shù)據(jù)庫中,從而保證了目標(biāo)模型關(guān)聯(lián)的訓(xùn)練數(shù)據(jù)庫中的訓(xùn)練數(shù)據(jù)擬合真實(shí)業(yè)務(wù)場景數(shù)據(jù),提高了數(shù)據(jù)質(zhì)量以及準(zhǔn)確性。
35、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種數(shù)據(jù)處理方法,包括:
2.如權(quán)利要求1所述的方法,其中,所述對(duì)所述日志數(shù)據(jù)進(jìn)行解析,獲取查詢數(shù)據(jù),及所述查詢數(shù)據(jù)對(duì)應(yīng)的檢索數(shù)據(jù),包括:
3.如權(quán)利要求1所述的方法,其中,所述將所述查詢數(shù)據(jù)和所述檢索數(shù)據(jù),分別輸入所述目標(biāo)模型及第一模型,得到至少兩個(gè)生成數(shù)據(jù),包括:
4.如權(quán)利要求3所述的方法,其中,在所述利用至少兩個(gè)第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個(gè)所述生成數(shù)據(jù)的第一可信度之前,所述方法還包括:
5.如權(quán)利要求4所述的方法,其中,所述利用至少兩個(gè)第二模型,并基于所述查詢數(shù)據(jù)及所述檢索數(shù)據(jù),確定每個(gè)所述生成數(shù)據(jù)的第一可信度,包括:
6.如權(quán)利要求5所述的方法,其中,所述根據(jù)每個(gè)所述生成數(shù)據(jù)對(duì)應(yīng)的所述第二可信度,確定所述第一可信度,包括:
7.如權(quán)利要求5所述的方法,其中,所述根據(jù)每個(gè)所述生成數(shù)據(jù)對(duì)應(yīng)的所述第二可信度,確定所述第一可信度,包括:
8.一種模型更新方法,包括:
9.如權(quán)利要求8所述的方法,其中,在所述根據(jù)所述訓(xùn)練數(shù)據(jù)對(duì)所述目標(biāo)模型進(jìn)行更新訓(xùn)練之后,所述方法還包括:
10.如權(quán)利要求9所述的方法,其中,所述方法還包括:
11.如權(quán)利要求8-10任一所述的方法,其中,在所述基于訓(xùn)練數(shù)據(jù)庫中包含的新增數(shù)據(jù)的數(shù)據(jù)量、新增數(shù)據(jù)的類型、目標(biāo)模型當(dāng)前的性能參數(shù)中的至少一項(xiàng),確定目標(biāo)更新方式之前,所述方法還包括:
12.一種人機(jī)交互方法,包括:
13.一種人機(jī)交互智能體系統(tǒng),包括:
14.一種數(shù)據(jù)處理裝置,其中,所述裝置包括:
15.如權(quán)利要求14所述的裝置,其中,所述第二獲取模塊,具體用于:
16.如權(quán)利要求14所述的裝置,其中,所述處理模塊,具體用于:
17.如權(quán)利要求16所述的裝置,其中,所述第一確定模塊,還用于:
18.如權(quán)利要求17所述的裝置,其中,所述第一確定模塊,還用于:
19.如權(quán)利要求18所述的裝置,其中,所述第一確定模塊,還用于:
20.如權(quán)利要求18所述的裝置,其中,所述第一確定模塊,還用于:
21.一種模型更新裝置,其中,所述裝置包括:
22.如權(quán)利要求21所述的裝置,其中,所述訓(xùn)練模塊,還用于:
23.如權(quán)利要求22所述的裝置,其中,所述裝置還包括:
24.如權(quán)利要求21-23任一所述的裝置,其中,所述第二確定模塊,還用于:
25.一種人機(jī)交互裝置,其中,所述裝置包括:
26.一種電子設(shè)備,其特征在于,包括:
27.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的數(shù)據(jù)處理方法、權(quán)利要求8-11中任一所述的模型更新方法、或權(quán)利要求12所述的人機(jī)交互方法。
28.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的數(shù)據(jù)處理方法、權(quán)利要求8-11中任一所述的模型更新方法、或權(quán)利要求12所述的人機(jī)交互方法。