两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

向量召回方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40634832發(fā)布日期:2025-01-10 18:40閱讀:1來(lái)源:國(guó)知局
向量召回方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)與流程

本申請(qǐng)涉及計(jì)算機(jī),尤其涉及一種向量召回方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)。


背景技術(shù):

1、在檢索場(chǎng)景中,需要根據(jù)用戶輸入的較為模糊的查詢語(yǔ)句,得到準(zhǔn)確的檢索結(jié)果。

2、在現(xiàn)有技術(shù)中,通常對(duì)查詢語(yǔ)句進(jìn)行向量化處理,得到查詢特征描述向量(queryembedding),并對(duì)查詢語(yǔ)句進(jìn)行分詞,根據(jù)查詢語(yǔ)句的分詞、前綴詞,以及查詢特征描述向量,進(jìn)行向量召回,得到向量集,上述向量集包括多個(gè)用于表征檢索結(jié)果的向量,以此基于向量集確定最終的檢索結(jié)果。

3、然而,在現(xiàn)有技術(shù)中,僅對(duì)查詢語(yǔ)句進(jìn)行解析,從查詢語(yǔ)句本身這一維度確定向量集,可能導(dǎo)致向量集不夠準(zhǔn)確,不能準(zhǔn)確的表征查詢結(jié)果。因此,如何提供一種能夠準(zhǔn)確且全面召回向量的方法,是本領(lǐng)域待以解決的技術(shù)問題。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)的主要目的在于提供了一種向量召回方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì),旨在解決向量集不夠準(zhǔn)確,不能準(zhǔn)確的表征查詢結(jié)果的技術(shù)問題。

2、為實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)峁┮环N向量召回方法,該方法包括:

3、獲取用戶輸入的查詢語(yǔ)句和所述用戶關(guān)聯(lián)的歷史數(shù)據(jù);

4、解析所述查詢語(yǔ)句,得到所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn);

5、基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量;

6、基于所述興趣點(diǎn)和所述歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量;

7、基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集。

8、可選地,所述歷史數(shù)據(jù)包括多個(gè)歷史興趣點(diǎn)名稱,所述基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量,包括:

9、基于所述查詢語(yǔ)句,得到第一特征描述向量;

10、基于所述多個(gè)歷史興趣點(diǎn)名稱,得到向量矩陣;所述向量矩陣包括多個(gè)向量,且1個(gè)向量與1個(gè)歷史興趣點(diǎn)名稱對(duì)應(yīng);

11、基于所述向量矩陣和所述第一特征描述向量,得到第二特征描述向量;

12、拼接所述第一特征描述向量和所述第二特征描述向量,得到所述查詢特征描述向量。

13、可選地,所述基于所述查詢語(yǔ)句,得到第一特征描述向量,包括:

14、通過預(yù)設(shè)的bert模型對(duì)所述查詢語(yǔ)句進(jìn)行向量化處理,得到第一特征描述向量;

15、所述基于所述多個(gè)歷史興趣點(diǎn)名稱,得到向量矩陣,包括:

16、通過所述bert模型對(duì)所述多個(gè)歷史興趣點(diǎn)進(jìn)行向量化處理,得到向量矩陣。

17、可選地,所述基于所述向量矩陣和所述第一特征描述向量,得到第二特征描述向量,包括:

18、通過預(yù)設(shè)的注意力模型對(duì)所述向量矩陣和所述第一特征描述向量進(jìn)行內(nèi)積向量運(yùn)算,得到與所述向量矩陣中每個(gè)向量對(duì)應(yīng)的權(quán)重值;

19、通過所述注意力模型聚合所述每個(gè)向量對(duì)應(yīng)的權(quán)重值和所述向量矩陣,得到第二特征描述向量。

20、可選地,所述歷史數(shù)據(jù)包括多個(gè)搜索詞,所述多個(gè)搜索詞與所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn)相關(guān)聯(lián);

21、所述基于所述興趣點(diǎn)和所述歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量,包括:

22、基于所述興趣點(diǎn),得到第三特征描述向量;

23、基于所述多個(gè)搜索詞,得到第四特征描述向量;

24、拼接所述第三特征描述向量和所述第四特征描述向量,得到所述興趣點(diǎn)特征描述向量。

25、可選地,所述基于所述興趣點(diǎn),得到第三特征描述向量,包括:

26、通過預(yù)設(shè)的bert模型對(duì)所述興趣點(diǎn)進(jìn)行向量化處理,得到第三特征描述向量;

27、所述基于所述多個(gè)搜索詞,得到第四特征描述向量,包括:

28、通過所述bert模型對(duì)所述多個(gè)搜索詞進(jìn)行向量化處理,得到第四特征描述向量。

29、可選地,所述基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集,包括:

30、對(duì)每個(gè)查詢特征描述向量與每個(gè)興趣點(diǎn)特征描述向量進(jìn)行內(nèi)積向量運(yùn)算,得到多個(gè)目標(biāo)向量;每個(gè)目標(biāo)向量與1個(gè)查詢特征描述向量和1個(gè)興趣點(diǎn)特征描述向量相關(guān)聯(lián);

31、基于n個(gè)目標(biāo)向量,生成向量集;所述n個(gè)目標(biāo)向量為所述多個(gè)目標(biāo)向量中對(duì)應(yīng)相似度數(shù)值從高至低排序的前n個(gè),所述相似度數(shù)值用于表征目標(biāo)向量關(guān)聯(lián)的查詢特征描述向量與興趣點(diǎn)特征描述向量之間的相似度,n為大于1的正整數(shù)。

32、此外,為實(shí)現(xiàn)上述目的,本申請(qǐng)還提供一種向量召回裝置,所述向量召回裝置包括:

33、獲取模塊,用于獲取用戶輸入的查詢語(yǔ)句和所述用戶關(guān)聯(lián)的歷史數(shù)據(jù);

34、解析模塊,用于解析所述查詢語(yǔ)句,得到所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn);

35、第一確定模塊,用于基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量;

36、第二確定模塊,用于基于所述興趣點(diǎn)和所述歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量;

37、生成模塊,用于基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集。

38、為了解決上述技術(shù)問題,本申請(qǐng)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,采用了如下所述的技術(shù)方案:

39、所述計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本申請(qǐng)實(shí)施例中提出的任一項(xiàng)所述的向量召回方法的步驟。

40、為了解決上述技術(shù)問題,本申請(qǐng)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),采用了如下所述的技術(shù)方案:

41、所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請(qǐng)實(shí)施例中提出的任一項(xiàng)所述的向量召回方法的步驟。

42、與現(xiàn)有技術(shù)相比,本申請(qǐng)實(shí)施例主要有以下有益效果:

43、本申請(qǐng)實(shí)施例提供了一種向量召回方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),上述方法包括:獲取用戶輸入的查詢語(yǔ)句和用戶關(guān)聯(lián)的歷史數(shù)據(jù);解析查詢語(yǔ)句,得到查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn);基于查詢語(yǔ)句和歷史數(shù)據(jù),確定查詢特征描述向量;基于興趣點(diǎn)和歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量;基于查詢特征描述向量和興趣點(diǎn)特征描述向量,生成向量集。本實(shí)施例中,基于查詢語(yǔ)句確定查詢特征描述向量,基于歷史數(shù)據(jù)確定興趣點(diǎn)特征描述向量,進(jìn)而基于查詢特征描述向量和興趣點(diǎn)特征描述向量,生成向量集,以此從多個(gè)維度生成高置信度的向量集。



技術(shù)特征:

1.一種向量召回方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史數(shù)據(jù)包括多個(gè)歷史興趣點(diǎn)名稱,所述基于所述查詢語(yǔ)句和所述歷史數(shù)據(jù),確定查詢特征描述向量,包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述查詢語(yǔ)句,得到第一特征描述向量,包括:

4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述向量矩陣和所述第一特征描述向量,得到第二特征描述向量,包括:

5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述歷史數(shù)據(jù)包括多個(gè)搜索詞,所述多個(gè)搜索詞與所述查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn)相關(guān)聯(lián);

6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所述興趣點(diǎn),得到第三特征描述向量,包括:

7.根據(jù)權(quán)利要求1-6中任一項(xiàng)所述的方法,其特征在于,所述基于所述查詢特征描述向量和所述興趣點(diǎn)特征描述向量,生成向量集,包括:

8.一種向量召回裝置,其特征在于,包括:

9.一種計(jì)算機(jī)設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的向量召回方法的步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的向量召回方法的步驟。


技術(shù)總結(jié)
本申請(qǐng)實(shí)施例提供了一種向量召回方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),上述方法包括:獲取用戶輸入的查詢語(yǔ)句和用戶關(guān)聯(lián)的歷史數(shù)據(jù);解析查詢語(yǔ)句,得到查詢語(yǔ)句對(duì)應(yīng)的興趣點(diǎn);基于查詢語(yǔ)句和歷史數(shù)據(jù),確定查詢特征描述向量;基于興趣點(diǎn)和歷史數(shù)據(jù),確定興趣點(diǎn)特征描述向量;基于查詢特征描述向量和興趣點(diǎn)特征描述向量,生成向量集。本實(shí)施例中,基于查詢語(yǔ)句確定查詢特征描述向量,基于歷史數(shù)據(jù)確定興趣點(diǎn)特征描述向量,進(jìn)而基于查詢特征描述向量和興趣點(diǎn)特征描述向量,生成向量集,以此從多個(gè)維度生成高置信度的向量集。

技術(shù)研發(fā)人員:居夢(mèng)月,趙驥
受保護(hù)的技術(shù)使用者:深圳依時(shí)貨拉拉科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
金塔县| 丰城市| 沧源| 盐亭县| 青龙| 龙陵县| 桦南县| 临西县| 桐乡市| 天全县| 信宜市| 镇雄县| 神农架林区| 韩城市| 湘潭市| 嫩江县| 九台市| 尼玛县| 北流市| 海盐县| 玉树县| 炎陵县| 靖边县| 淮滨县| 瑞金市| 桐梓县| 元江| 安仁县| 赣州市| 集贤县| 疏附县| 聊城市| 花垣县| 建平县| 浑源县| 红桥区| 思南县| 雅安市| 九江市| 凌海市| 治县。|