本發(fā)明涉及計(jì)算機(jī),特別涉及一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法。
背景技術(shù):
1、llm憑借其強(qiáng)大的文本生成和理解能力,在問答系統(tǒng)、對話生成、文本創(chuàng)作等多個(gè)應(yīng)用場景中展現(xiàn)出巨大的潛力,然而,在實(shí)際應(yīng)用中,工業(yè)生產(chǎn)制造零部件數(shù)字人問答;農(nóng)業(yè)作物數(shù)字人問答,文博館、旅游景點(diǎn)數(shù)字人講解、問答;導(dǎo)購數(shù)字人講解問答等方面不是特別準(zhǔn)確和全面。
2、現(xiàn)有技術(shù)中,llm在回答問題時(shí)主要依賴于其訓(xùn)練過程中學(xué)到的知識和模式。然而,由于訓(xùn)練數(shù)據(jù)的多樣性和復(fù)雜性,llm在處理特定領(lǐng)域或復(fù)雜問題時(shí),往往難以準(zhǔn)確捕捉用戶意圖,導(dǎo)致生成的回答與真實(shí)需求存在偏差。此外,llm在處理包含多個(gè)相關(guān)上下文的問題時(shí),可能因缺乏有效的上下文管理機(jī)制而生成不一致或冗余的回答。
3、因此,本申請研制了一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,以解決現(xiàn)有技術(shù)中存在的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明目的是:提供一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,以解決現(xiàn)有技術(shù)中在llm在回答用戶問題或與客戶進(jìn)行問答時(shí),其答案不準(zhǔn)確的問題。
2、本發(fā)明的技術(shù)方案是:一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,包括以下步驟:
3、s1:匹配講解目標(biāo):將用戶傳感器和目標(biāo)傳感器匹配,使目標(biāo)傳感器接收到用戶傳感器的信號;
4、s2:構(gòu)建目標(biāo)知識庫和生成知識庫權(quán)重:根據(jù)目標(biāo)用戶群體和需求來定義知識庫的類型,并建立數(shù)據(jù)庫,根據(jù)匹配的用戶id,生成一組知識庫權(quán)重;
5、s3:上下文檢索:根據(jù)用戶的需求,通過問題詞嵌入和知識向量庫詞嵌入切片檢索出與用戶問題相關(guān)的上下文;
6、s4:對上下文檢索按權(quán)重加權(quán)并重新排序:將步驟s3中檢索的上下文根據(jù)步驟s2中的知識庫權(quán)重進(jìn)行加權(quán),對檢索的上下文進(jìn)行重新排序得到目標(biāo)知識上下文;
7、s5:生成問題結(jié)果:將步驟s4中重新排序后的目標(biāo)知識上下文和用戶問題作為llm的輸入,并根據(jù)用戶提示,生成問題答案。
8、優(yōu)選的,步驟s2中生成知識庫權(quán)重包括以下子步驟:
9、s2.1:明確權(quán)重評估標(biāo)準(zhǔn);
10、s2.2:選擇權(quán)重的計(jì)算方法;
11、s2.3:根據(jù)內(nèi)容的重要性和相關(guān)性進(jìn)行權(quán)重的分配。
12、優(yōu)選的,步驟s2中,根據(jù)數(shù)據(jù)庫構(gòu)建知識相關(guān)性向量庫,如下所示,
13、
14、xi,xj為知識庫中的單個(gè)樣本;
15、n為知識庫樣本總數(shù);
16、xij為xi與xj的相關(guān)性。
17、優(yōu)選的,步驟s4包括以下子步驟:
18、s4.1:讀取輸入的上下文;
19、s4.2:生成多個(gè)候選結(jié)果,每個(gè)結(jié)果代表不同的可能輸出;
20、s4.3:提取候選結(jié)果中相關(guān)性、置信度的特征;
21、s4.4:基于候選結(jié)果的相關(guān)性和置信度及上下文一致性,根據(jù)預(yù)設(shè)的規(guī)則或模型,給每個(gè)候選結(jié)果分配權(quán)重;
22、s4.5:使用分配的權(quán)重對候選結(jié)果進(jìn)行加權(quán),計(jì)算加權(quán)得分,并根據(jù)加權(quán)得分對候選結(jié)果進(jìn)行排序,選擇得分最高的結(jié)果作為最終輸出,得到重新排序后的目標(biāo)知識上下文。
23、優(yōu)選的,步驟s4中的重新排序采用如下方式:
24、將步驟s3中知識檢索相似度與步驟s2中知識相關(guān)性向量整合,當(dāng)匹配目標(biāo)id為m時(shí),
25、
26、simsoi為原始知識檢索相似度;
27、simswi為整合后的知識檢索相似度;
28、fpos(x)=2×sigmoid(x)-1
29、
30、score_max=1;
31、score_min=0;
32、alpha=[0,10]。
33、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)是:
34、(1)通過對上下文結(jié)果進(jìn)行權(quán)重加權(quán)和重排序,llm能夠優(yōu)先考慮與查詢最相關(guān)、最重要的信息,使生成的回答更加準(zhǔn)確;
35、(2)通過加權(quán)和重排序,llm能夠剔除不相關(guān)或冗余的信息,專注于與問題相關(guān)的特征,從而提高回答的準(zhǔn)確性;
36、(3)通過目標(biāo)知識庫權(quán)重的分配,llm可以優(yōu)先考慮那些對用戶問題最相關(guān)的內(nèi)容,從而生成更精準(zhǔn)的回答;
37、(4)權(quán)重的排序可以根據(jù)用戶的需求或歷史問題進(jìn)行調(diào)整,從而提供更符合用戶需求的響應(yīng)。
1.一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,其特征在于:步驟s2中生成知識庫權(quán)重包括以下子步驟:
3.根據(jù)權(quán)利要求2所述的一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,其特征在于:步驟s2中,根據(jù)數(shù)據(jù)庫構(gòu)建知識相關(guān)性向量庫,如下所示,
4.根據(jù)權(quán)利要求1所述的一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,其特征在于:步驟s4包括以下子步驟:
5.根據(jù)權(quán)利要求3所述的一種基于目標(biāo)權(quán)重提高llm問題回答準(zhǔn)確性的方法,其特征在于:步驟s4中的重新排序采用如下方式: