本技術(shù)涉及人工智能,特別是涉及一種對話機(jī)器人的對話方法、系統(tǒng)和計算機(jī)設(shè)備。
背景技術(shù):
1、在人工智能領(lǐng)域,對話機(jī)器人具有廣泛的應(yīng)用場景,例如客服、售后等,為生活提供了便捷。但也隨之出現(xiàn)了對話機(jī)器人在文本數(shù)據(jù)較短時,無法準(zhǔn)確理解用戶的表達(dá)方式和意圖的問題。
2、然而,目前在文本數(shù)據(jù)較短時,幫助對話機(jī)器人理解用戶的表達(dá)意圖的方法是:通過模塊化檢索增強(qiáng)技術(shù)對文本數(shù)據(jù)進(jìn)行深度檢索,即在檢索階段增加情感識別模型或重排模型,增強(qiáng)對文本數(shù)據(jù)的檢索,但同時會導(dǎo)致檢索階段的耗時大幅度增加,導(dǎo)致對話機(jī)器人對應(yīng)的系統(tǒng)運行速度變慢。因此,目前存在當(dāng)文本數(shù)據(jù)較短時,對話機(jī)器人在問答過程中意圖識別準(zhǔn)確率較低的問題。
技術(shù)實現(xiàn)思路
1、基于此,有必要針對上述當(dāng)文本數(shù)據(jù)較短時,對話機(jī)器人在問答過程中準(zhǔn)確率較低的技術(shù)問題,提供一種對話機(jī)器人的對話方法、系統(tǒng)、計算機(jī)設(shè)備、計算機(jī)可讀存儲介質(zhì)和計算機(jī)程序產(chǎn)品。
2、第一方面,本技術(shù)提供了一種對話機(jī)器人訓(xùn)練方法,包括:
3、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對詞嵌入模型進(jìn)行訓(xùn)練得到;
4、基于分類模型得到所述第一詞嵌入向量的意圖識別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
5、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識別分類特征對應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
6、將所述第二詞嵌入向量存儲至向量數(shù)據(jù)庫,并基于預(yù)設(shè)的問答模式在所述向量數(shù)據(jù)庫中確定所述第二詞嵌入向量對應(yīng)的目標(biāo)問題;其中,所述向量數(shù)據(jù)庫中包括所述第二詞嵌入向量和所述目標(biāo)問題之間的關(guān)聯(lián)關(guān)系;
7、結(jié)合所述目標(biāo)問題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
8、在其中一個實施例中,所述方法還包括:將所述第一訓(xùn)練文本數(shù)據(jù)輸入至所述詞嵌入模型,并通過分詞技術(shù)將所述第一訓(xùn)練文本數(shù)據(jù)進(jìn)行分詞,篩選所述分詞中的非關(guān)鍵詞作為停止詞,形成停止詞庫;基于所述停止詞更新所述第一訓(xùn)練文本數(shù)據(jù)得到第一更新訓(xùn)練數(shù)據(jù),將所述第一更新訓(xùn)練數(shù)據(jù)輸入至所述詞嵌入模型,得到所述第一詞嵌入模型。
9、在其中一個實施例中,所述方法還包括:獲取業(yè)務(wù)領(lǐng)域數(shù)據(jù)、非業(yè)務(wù)領(lǐng)域數(shù)據(jù)以及業(yè)務(wù)場景數(shù)據(jù),并通過提示工程技術(shù)分別生成所述業(yè)務(wù)領(lǐng)域數(shù)據(jù)、所述非業(yè)務(wù)領(lǐng)域數(shù)據(jù)以及所述業(yè)務(wù)場景數(shù)據(jù)的相似數(shù)據(jù);基于所述相似數(shù)據(jù)更新所述第二訓(xùn)練文本數(shù)據(jù)得到第二更新訓(xùn)練數(shù)據(jù),將所述第二更新訓(xùn)練數(shù)據(jù)輸入至所述分類模型,以完成對所述分類模型的建立。
10、在其中一個實施例中,所述方法還包括:將第三訓(xùn)練文本數(shù)據(jù)輸入至結(jié)合預(yù)設(shè)核心超參數(shù)的所述第一詞嵌入模型,以完成對所述第一詞嵌入模型進(jìn)行訓(xùn)練,得到所述第二詞嵌入模型;其中,所述核心超參數(shù)包括計算精度、學(xué)習(xí)率、優(yōu)化器、溫度、池化方法和訓(xùn)練次數(shù)。
11、在其中一個實施例中,所述將所述第三訓(xùn)練文本數(shù)據(jù)輸入至結(jié)合預(yù)設(shè)核心超參數(shù)的所述第一詞嵌入模型,以完成對所述第一詞嵌入模型進(jìn)行訓(xùn)練,得到所述第二詞嵌入模型,包括:將預(yù)設(shè)的初始學(xué)習(xí)率以及預(yù)設(shè)的溫度匹配至所述第一詞嵌入模型;基于預(yù)選的優(yōu)化器,并結(jié)合半精度浮點量化方法以及分類標(biāo)記池化方法對所述第一詞嵌入模型進(jìn)行訓(xùn)練;將所述第三訓(xùn)練文本數(shù)據(jù)輸入至所述第一詞嵌入模型中進(jìn)行訓(xùn)練,在所述訓(xùn)練的所述訓(xùn)練次數(shù)大于或等于預(yù)設(shè)目標(biāo)訓(xùn)練次數(shù)、損失值位于預(yù)設(shè)目標(biāo)損失值區(qū)間內(nèi)的情況下,完成對所述第一詞嵌入模型的訓(xùn)練,得到所述第二詞嵌入模型。
12、在其中一個實施例中,所述基于預(yù)設(shè)的問答模式在所述向量數(shù)據(jù)庫中確定所述第二詞嵌入向量對應(yīng)的目標(biāo)問題,包括:獲取所述第二詞嵌入向量與所述向量數(shù)據(jù)庫中向量的相似度;基于所述相似度確定所述第二詞嵌入向量的多個相關(guān)問題以及多個所述相關(guān)問題的單個標(biāo)識符;根據(jù)所述單個標(biāo)識符,將多個所述相關(guān)問題對應(yīng)的單個目標(biāo)問題作為所述第二詞嵌入向量對應(yīng)的目標(biāo)問題。
13、在其中一個實施例中,所述預(yù)設(shè)的文本生成模式包括:常見問題解答模式和場景模式;所述結(jié)合所述目標(biāo)問題和預(yù)設(shè)的文本生成模式,生成所述待處理文本的目標(biāo)答案,包括:在所述常見問題解答模式和/或所述場景模式下,在所述向量數(shù)據(jù)庫中檢索到的預(yù)設(shè)目標(biāo)數(shù)量的所述相關(guān)問題對應(yīng)同一個所述目標(biāo)問題的情況下,則將所述目標(biāo)問題對應(yīng)的答案作為所述待處理文本的目標(biāo)答案。
14、第二方面,本技術(shù)還提供了一種對話機(jī)器人的對話系統(tǒng),包括:
15、文本處理模塊,用于接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對詞嵌入模型進(jìn)行訓(xùn)練得到;
16、特征獲取模塊,用于基于分類模型得到所述第一詞嵌入向量的意圖識別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
17、詞嵌入向量轉(zhuǎn)化模塊,用于基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識別分類特征對應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
18、目標(biāo)問題確認(rèn)模塊,用于將所述第二詞嵌入向量存儲至向量數(shù)據(jù)庫,并基于預(yù)設(shè)的問答模式在所述向量數(shù)據(jù)庫中確定所述第二詞嵌入向量對應(yīng)的目標(biāo)問題;其中,所述向量數(shù)據(jù)庫中包括所述第二詞嵌入向量和所述目標(biāo)問題之間的關(guān)聯(lián)關(guān)系;
19、目標(biāo)答案輸出模塊,用于結(jié)合所述目標(biāo)問題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
20、第三方面,本技術(shù)還提供了一種計算機(jī)設(shè)備,所述計算機(jī)設(shè)備包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)以下步驟:
21、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對詞嵌入模型進(jìn)行訓(xùn)練得到;
22、基于分類模型得到所述第一詞嵌入向量的意圖識別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
23、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識別分類特征對應(yīng)的分類標(biāo)簽,將所述第一詞嵌入向量轉(zhuǎn)化為第二詞嵌入向量;其中,所述第二詞嵌入模型基于第三訓(xùn)練文本數(shù)據(jù)對所述第一詞嵌入模型進(jìn)行訓(xùn)練得到;
24、將所述第二詞嵌入向量存儲至向量數(shù)據(jù)庫,并基于預(yù)設(shè)的問答模式在所述向量數(shù)據(jù)庫中確定所述第二詞嵌入向量對應(yīng)的目標(biāo)問題;其中,所述向量數(shù)據(jù)庫中包括所述第二詞嵌入向量和所述目標(biāo)問題之間的關(guān)聯(lián)關(guān)系;
25、結(jié)合所述目標(biāo)問題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
26、第四方面,本技術(shù)還提供了一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)以下步驟:
27、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對詞嵌入模型進(jìn)行訓(xùn)練得到;
28、基于分類模型得到所述第一詞嵌入向量的意圖識別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
29、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識別分類特征對應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
30、將所述第二詞嵌入向量存儲至向量數(shù)據(jù)庫,并基于預(yù)設(shè)的問答模式在所述向量數(shù)據(jù)庫中確定所述第二詞嵌入向量對應(yīng)的目標(biāo)問題;其中,所述向量數(shù)據(jù)庫中包括所述第二詞嵌入向量和所述目標(biāo)問題之間的關(guān)聯(lián)關(guān)系;
31、結(jié)合所述目標(biāo)問題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
32、第五方面,本技術(shù)還提供了一種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,該計算機(jī)程序被處理器執(zhí)行時實現(xiàn)以下步驟:
33、接收待處理文本,并基于第一詞嵌入模型將所述待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,所述第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對詞嵌入模型進(jìn)行訓(xùn)練得到;
34、基于分類模型得到所述第一詞嵌入向量的意圖識別分類特征;其中,所述分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;
35、基于第二詞嵌入模型、結(jié)合所述第一詞嵌入向量的所述意圖識別分類特征對應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,所述第二詞嵌入模型基于所述第一詞嵌入模型對所述第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;
36、將所述第二詞嵌入向量存儲至向量數(shù)據(jù)庫,并基于預(yù)設(shè)的問答模式在所述向量數(shù)據(jù)庫中確定所述第二詞嵌入向量對應(yīng)的目標(biāo)問題;其中,所述向量數(shù)據(jù)庫中包括所述第二詞嵌入向量和所述目標(biāo)問題之間的關(guān)聯(lián)關(guān)系;
37、結(jié)合所述目標(biāo)問題和預(yù)設(shè)的文本生成模式,輸出所述待處理文本的目標(biāo)答案。
38、上述對話機(jī)器人的對話方法、系統(tǒng)、計算機(jī)設(shè)備、存儲介質(zhì)和計算機(jī)程序產(chǎn)品,在對話機(jī)器人的對話方法中,首先接收待處理文本,并基于第一詞嵌入模型將待處理文本轉(zhuǎn)化為第一詞嵌入向量;其中,第一詞嵌入模型基于第一訓(xùn)練文本數(shù)據(jù)對詞嵌入模型進(jìn)行訓(xùn)練得到;然后基于分類模型得到第一詞嵌入向量的意圖識別分類特征;其中,分類模型基于第二訓(xùn)練文本數(shù)據(jù)建立;接著基于第二詞嵌入模型、結(jié)合第一詞嵌入向量的意圖識別分類特征對應(yīng)的分類標(biāo)簽,獲取第二詞嵌入向量;其中,第二詞嵌入模型基于第一詞嵌入模型對第一訓(xùn)練文本數(shù)據(jù)的第一詞嵌入向量進(jìn)行訓(xùn)練得到;接著將第二詞嵌入向量存儲至向量數(shù)據(jù)庫,并基于預(yù)設(shè)的問答模式在向量數(shù)據(jù)庫中確定第二詞嵌入向量對應(yīng)的目標(biāo)問題;其中,向量數(shù)據(jù)庫中包括第二詞嵌入向量和目標(biāo)問題之間的關(guān)聯(lián)關(guān)系;最后結(jié)合目標(biāo)問題和預(yù)設(shè)的文本生成模式,輸出待處理文本的目標(biāo)答案。在上述過程中,通過第一詞嵌入模型將待處理文本轉(zhuǎn)化第一詞嵌入向量,再通過分類模型得到第一詞嵌入向量的意圖識別分類特征,然后結(jié)合上述意圖識別分類特征對應(yīng)的分類標(biāo)簽、通過第二次嵌入模型獲取第二詞嵌入向量,可以提高詞嵌入向量的質(zhì)量,提高后續(xù)步驟中在向量數(shù)據(jù)庫確定目標(biāo)問題的效率,再通過目標(biāo)問題和預(yù)設(shè)的文本模式的結(jié)合,進(jìn)一步輸出目標(biāo)答案,有效提高了對話機(jī)器人在文本數(shù)據(jù)較短時的意圖識別的準(zhǔn)確率。