本發(fā)明涉及計(jì)算機(jī),特別涉及一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法。
背景技術(shù):
1、llm是一種基于深度學(xué)習(xí)的a?i技術(shù),通過學(xué)習(xí)海量文本數(shù)據(jù),掌握了詞匯、語(yǔ)法、語(yǔ)義等多方面的知識(shí),能夠用于各種語(yǔ)言任務(wù),如文本生成、翻譯、摘要、問答等?;诖笳Z(yǔ)言模型(llm)的檢索增強(qiáng)生成式(rag)問答技術(shù),傳統(tǒng)的方法是直接使用知識(shí)庫(kù)檢索出上下文,然后利用llm對(duì)于原始問題和上下文直接生成出問題答案,由于用戶的問題有時(shí)存在多樣性,語(yǔ)義模糊,存在歧義,存在錯(cuò)別字,使用傳統(tǒng)rag方法在知識(shí)庫(kù)中有時(shí)會(huì)找不到準(zhǔn)確的上下文,以至于llm回答不準(zhǔn)確。
2、因此,本申請(qǐng)研制了一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,以解決現(xiàn)有技術(shù)中存在的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明目的是:提供一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,以解決現(xiàn)有技術(shù)中由于用戶輸入問題的不清楚、存在歧義、含有錯(cuò)別字、語(yǔ)義模糊,導(dǎo)致llm輸出結(jié)果不準(zhǔn)確的問題。
2、本發(fā)明的技術(shù)方案是:一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,包括以下步驟:
3、s1:用戶提出問題;
4、s2:生成問題詞嵌入:根據(jù)用戶提出問題的文字使用詞嵌入模型生成數(shù)據(jù)向量;
5、s3:上下文檢索:根據(jù)步驟s2中的數(shù)據(jù)向量與知識(shí)向量庫(kù)進(jìn)行比較,根據(jù)與問題的相似度通過詞嵌入切片檢索出與問題相關(guān)的上下文;
6、s4:?jiǎn)栴}重寫與增強(qiáng):將用戶提出的問題和步驟s3中的上下文作為llm的輸入,并利用問題重寫提示,生成重寫增強(qiáng)后的問題;
7、s5:多級(jí)重寫與增強(qiáng):將步驟s4中重寫增強(qiáng)的問題作為步驟s2中詞嵌入模型的輸入,循環(huán)n次步驟s2、步驟s3、步驟s4,最終形成第n次重寫增強(qiáng)后的問題;
8、s6:?jiǎn)栴}回答:將步驟s5中形成的第n次重寫增強(qiáng)后的問題和第n+1次檢索的上下文和用戶的提示詞作為llm的輸入,形成問題的結(jié)果。
9、優(yōu)選的,步驟s4中的問題重寫提示包括以下子步驟:
10、s4.1:依據(jù)用戶輸入的問題和檢索的上下文,理解其語(yǔ)義內(nèi)容和意圖;
11、s4.2:分析用戶輸入問題中的歧義和錯(cuò)別字,并進(jìn)行重寫策略選擇;
12、s4.3:生成問題重寫提示供用戶編輯;
13、s4.4:根據(jù)用戶編輯的問題重寫提示形成新的問題。
14、優(yōu)選的,步驟s4.3中用戶根據(jù)不同的需要,編輯不同的問題重寫提示,使擴(kuò)充重寫的問題以及增強(qiáng)輸入問題的多樣性。
15、優(yōu)選的,步驟s5中,根據(jù)用戶的問題設(shè)置循環(huán)次數(shù)n,每次循環(huán)都對(duì)上一次的問題進(jìn)行重寫,形成新的問題并保證問題語(yǔ)義的不改變,直至循環(huán)n次后,獲得第n次后重寫的問題進(jìn)入下一步驟。
16、優(yōu)選的,步驟s6包括以下子步驟:
17、s6.1:用戶輸入完成的任務(wù)或生成內(nèi)容的指令或問題的提示詞;
18、s6.2:對(duì)用戶輸入的提示詞進(jìn)行解析;
19、s6.3:根據(jù)提示詞和第n次的重寫問題和第n+1次檢索的上下文進(jìn)行推理和計(jì)算形成文本形式的問題結(jié)果。
20、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)是:
21、(1)將用戶提出的問題經(jīng)過多次重寫和多次循環(huán)后,增強(qiáng)原始問題的多樣性,減輕語(yǔ)義模糊和歧義,消除錯(cuò)別字;
22、(2)通過用戶的提示詞針對(duì)不同場(chǎng)景進(jìn)行回答,從而大大提高了模型的適應(yīng)性和通用性,無需重新訓(xùn)練整個(gè)模型,只需調(diào)整輸入提示即可實(shí)現(xiàn)不同的功能;
23、(3)根據(jù)用戶的提示詞,能夠更準(zhǔn)確地理解用戶意圖并快速生成高質(zhì)量及高準(zhǔn)確率的答案。
1.一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,其特征在于:步驟s4中的問題重寫提示包括以下子步驟:
3.根據(jù)權(quán)利要求2所述的一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,其特征在于:步驟s4.3中用戶根據(jù)不同的需要,編輯不同的問題重寫提示,使擴(kuò)充重寫的問題以及增強(qiáng)輸入問題的多樣性。
4.根據(jù)權(quán)利要求1所述的一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,其特征在于:步驟s5中,根據(jù)用戶的問題設(shè)置循環(huán)次數(shù)n,每次循環(huán)都對(duì)上一次的問題進(jìn)行重寫,形成新的問題并保證問題語(yǔ)義的不改變,直至循環(huán)n次后,獲得第n次后重寫的問題進(jìn)入下一步驟。
5.根據(jù)權(quán)利要求1所述的一種基于上下文及l(fā)lm提高問題回答準(zhǔn)確性的方法,其特征在于:步驟s6包括以下子步驟: