本申請(qǐng)涉及計(jì)算機(jī),尤其涉及一種向量召回方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在檢索場(chǎng)景中,需要根據(jù)用戶輸入的較為模糊的查詢語(yǔ)句,得到準(zhǔn)確的檢索結(jié)果。
2、在現(xiàn)有技術(shù)中,通常對(duì)查詢語(yǔ)句進(jìn)行向量化處理,得到查詢特征描述向量(queryembedding),并對(duì)查詢語(yǔ)句進(jìn)行分詞,根據(jù)查詢語(yǔ)句的分詞、前綴詞,以及查詢特征描述向量,進(jìn)行向量召回,得到向量集,上述向量集包括多個(gè)用于表征檢索結(jié)果的向量,以此基于向量集確定最終的檢索結(jié)果。
3、然而,在現(xiàn)有技術(shù)中,僅對(duì)查詢語(yǔ)句進(jìn)行解析,從查詢語(yǔ)句本身這一維度確定向量集,可能導(dǎo)致向量集不夠準(zhǔn)確,不能準(zhǔn)確的表征查詢結(jié)果。因此,如何提供一種能夠準(zhǔn)確且全面召回向量的方法,是本領(lǐng)域待以解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)的主要目的在于提供了一種向量召回方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì),旨在解決向量集不夠準(zhǔn)確,不能準(zhǔn)確的表征查詢結(jié)果的技術(shù)問題。
2、為實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)峁┮环N向量召回方法,該方法包括:
3、獲取用戶輸入的查詢語(yǔ)句和所述用戶關(guān)聯(lián)的歷史數(shù)據(jù);
4、解析所述查詢語(yǔ)句,得到所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn);
5、基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量;
6、基于所述興趣點(diǎn)和所述歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量;
7、基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集。
8、可選地,所述歷史數(shù)據(jù)包括多個(gè)歷史興趣點(diǎn)名稱,所述基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量,包括:
9、基于所述查詢語(yǔ)句,得到第一特征描述向量;
10、基于所述多個(gè)歷史興趣點(diǎn)名稱,得到向量矩陣;所述向量矩陣包括多個(gè)向量,且1個(gè)向量與1個(gè)歷史興趣點(diǎn)名稱對(duì)應(yīng);
11、基于所述向量矩陣和所述第一特征描述向量,得到第二特征描述向量;
12、拼接所述第一特征描述向量和所述第二特征描述向量,得到所述查詢特征描述向量。
13、可選地,所述基于所述查詢語(yǔ)句,得到第一特征描述向量,包括:
14、通過預(yù)設(shè)的bert模型對(duì)所述查詢語(yǔ)句進(jìn)行向量化處理,得到第一特征描述向量;
15、所述基于所述多個(gè)歷史興趣點(diǎn)名稱,得到向量矩陣,包括:
16、通過所述bert模型對(duì)所述多個(gè)歷史興趣點(diǎn)進(jìn)行向量化處理,得到向量矩陣。
17、可選地,所述基于所述向量矩陣和所述第一特征描述向量,得到第二特征描述向量,包括:
18、通過預(yù)設(shè)的注意力模型對(duì)所述向量矩陣和所述第一特征描述向量進(jìn)行內(nèi)積向量運(yùn)算,得到與所述向量矩陣中每個(gè)向量對(duì)應(yīng)的權(quán)重值;
19、通過所述注意力模型聚合所述每個(gè)向量對(duì)應(yīng)的權(quán)重值和所述向量矩陣,得到第二特征描述向量。
20、可選地,所述歷史數(shù)據(jù)包括多個(gè)搜索詞,所述多個(gè)搜索詞與所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn)相關(guān)聯(lián);
21、所述基于所述興趣點(diǎn)和所述歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量,包括:
22、基于所述興趣點(diǎn),得到第三特征描述向量;
23、基于所述多個(gè)搜索詞,得到第四特征描述向量;
24、拼接所述第三特征描述向量和所述第四特征描述向量,得到所述興趣點(diǎn)特征描述向量。
25、可選地,所述基于所述興趣點(diǎn),得到第三特征描述向量,包括:
26、通過預(yù)設(shè)的bert模型對(duì)所述興趣點(diǎn)進(jìn)行向量化處理,得到第三特征描述向量;
27、所述基于所述多個(gè)搜索詞,得到第四特征描述向量,包括:
28、通過所述bert模型對(duì)所述多個(gè)搜索詞進(jìn)行向量化處理,得到第四特征描述向量。
29、可選地,所述基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集,包括:
30、對(duì)每個(gè)查詢特征描述向量與每個(gè)興趣點(diǎn)特征描述向量進(jìn)行內(nèi)積向量運(yùn)算,得到多個(gè)目標(biāo)向量;每個(gè)目標(biāo)向量與1個(gè)查詢特征描述向量和1個(gè)興趣點(diǎn)特征描述向量相關(guān)聯(lián);
31、基于n個(gè)目標(biāo)向量,生成向量集;所述n個(gè)目標(biāo)向量為所述多個(gè)目標(biāo)向量中對(duì)應(yīng)相似度數(shù)值從高至低排序的前n個(gè),所述相似度數(shù)值用于表征目標(biāo)向量關(guān)聯(lián)的查詢特征描述向量與興趣點(diǎn)特征描述向量之間的相似度,n為大于1的正整數(shù)。
32、此外,為實(shí)現(xiàn)上述目的,本申請(qǐng)還提供一種向量召回裝置,所述向量召回裝置包括:
33、獲取模塊,用于獲取用戶輸入的查詢語(yǔ)句和所述用戶關(guān)聯(lián)的歷史數(shù)據(jù);
34、解析模塊,用于解析所述查詢語(yǔ)句,得到所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn);
35、第一確定模塊,用于基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量;
36、第二確定模塊,用于基于所述興趣點(diǎn)和所述歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量;
37、生成模塊,用于基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集。
38、為了解決上述技術(shù)問題,本申請(qǐng)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,采用了如下所述的技術(shù)方案:
39、所述計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本申請(qǐng)實(shí)施例中提出的任一項(xiàng)所述的向量召回方法的步驟。
40、為了解決上述技術(shù)問題,本申請(qǐng)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),采用了如下所述的技術(shù)方案:
41、所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請(qǐng)實(shí)施例中提出的任一項(xiàng)所述的向量召回方法的步驟。
42、與現(xiàn)有技術(shù)相比,本申請(qǐng)實(shí)施例主要有以下有益效果:
43、本申請(qǐng)實(shí)施例提供了一種向量召回方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),上述方法包括:獲取用戶輸入的查詢語(yǔ)句和用戶關(guān)聯(lián)的歷史數(shù)據(jù);解析查詢語(yǔ)句,得到查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn);基于查詢語(yǔ)句和歷史數(shù)據(jù),確定查詢特征描述向量;基于興趣點(diǎn)和歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量;基于查詢特征描述向量和興趣點(diǎn)特征描述向量,生成向量集。本實(shí)施例中,基于查詢語(yǔ)句確定查詢特征描述向量,基于歷史數(shù)據(jù)確定興趣點(diǎn)特征描述向量,進(jìn)而基于查詢特征描述向量和興趣點(diǎn)特征描述向量,生成向量集,以此從多個(gè)維度生成高置信度的向量集。
1.一種向量召回方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史數(shù)據(jù)包括多個(gè)歷史興趣點(diǎn)名稱,所述基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述查詢語(yǔ)句,得到第一特征描述向量,包括:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述向量矩陣和所述第一特征描述向量,得到第二特征描述向量,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史數(shù)據(jù)包括多個(gè)搜索詞,所述多個(gè)搜索詞與所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn)相關(guān)聯(lián);
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所述興趣點(diǎn),得到第三特征描述向量,包括:
7.根據(jù)權(quán)利要求1-6中任一項(xiàng)所述的方法,其特征在于,所述基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集,包括:
8.一種向量召回裝置,其特征在于,包括:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的向量召回方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的向量召回方法的步驟。