本發(fā)明涉及自然語(yǔ)言處理,尤其涉及一種推薦結(jié)果的確定方法和裝置。
背景技術(shù):
1、在日常生活中,人們經(jīng)常需要查詢特定的興趣點(diǎn),如餐館、銀行、超市、商品、想要的幫助、相關(guān)說明等。隨著移動(dòng)互聯(lián)網(wǎng)和智能設(shè)備的普及,越來越多的用戶通過語(yǔ)音的方式,輸入查詢內(nèi)容。然而,語(yǔ)音輸入往往由于識(shí)別錯(cuò)誤、口音差異等因素,導(dǎo)致推薦結(jié)果的準(zhǔn)確性較差。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明實(shí)施例提供一種推薦結(jié)果的確定方法和裝置,能夠提升推薦結(jié)果的準(zhǔn)確性。
2、第一方面,本發(fā)明實(shí)施例提供了一種推薦結(jié)果的確定方法,包括:
3、確定查詢請(qǐng)求對(duì)應(yīng)的查詢文本,并生成所述查詢文本對(duì)應(yīng)的目標(biāo)計(jì)數(shù)記錄;
4、根據(jù)多個(gè)興趣點(diǎn)對(duì)應(yīng)的第一倒排索引及所述目標(biāo)計(jì)數(shù)記錄,確定所述查詢文本與各所述興趣點(diǎn)的第一匹配值;
5、根據(jù)各所述興趣點(diǎn)對(duì)應(yīng)的第一匹配值,從多個(gè)所述興趣點(diǎn)中,確定出所述查詢文本對(duì)應(yīng)的至少一個(gè)備選興趣點(diǎn);
6、生成各所述備選興趣點(diǎn)對(duì)應(yīng)的多個(gè)子文本,并構(gòu)建多個(gè)所述子文本對(duì)應(yīng)的第二倒排索引;
7、根據(jù)所述第二倒排索引及所述目標(biāo)計(jì)數(shù)記錄,確定所述查詢文本與各所述子文本的第二匹配值;
8、根據(jù)各所述子文本對(duì)應(yīng)的第二匹配值,從多個(gè)所述子文本中,確定出所述查詢文本對(duì)應(yīng)的推薦結(jié)果。
9、可選地,所述確定查詢請(qǐng)求對(duì)應(yīng)的查詢文本之前,還包括:
10、獲取多個(gè)興趣點(diǎn);
11、針對(duì)各所述興趣點(diǎn):對(duì)所述興趣點(diǎn)進(jìn)行預(yù)處理;構(gòu)建預(yù)處理后的興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄;其中,所述第一計(jì)數(shù)記錄包括:關(guān)鍵詞及其在興趣點(diǎn)中的詞頻;
12、根據(jù)多個(gè)所述興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄,構(gòu)建多個(gè)所述興趣點(diǎn)對(duì)應(yīng)的第一倒排索引;其中,所述第一倒排索引中包括多個(gè)第一索引記錄,所述第一索引記錄中包括:關(guān)鍵詞、關(guān)鍵詞出現(xiàn)的興趣點(diǎn)及關(guān)鍵詞在興趣點(diǎn)中的詞頻。
13、可選地,所述關(guān)鍵詞的類型為:模糊拼音;
14、所述構(gòu)建預(yù)處理后的興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄,包括:
15、確定預(yù)處理后的興趣點(diǎn)中的多個(gè)漢字,并確定各所述漢字對(duì)應(yīng)的拼音表示;
16、組合各所述漢字對(duì)應(yīng)的拼音表示,生成拼音表示序列;
17、針對(duì)所述拼音表示序列中的各拼音表示:響應(yīng)于所述拼音表示符合模糊處理?xiàng)l件,對(duì)所述拼音表示進(jìn)行模糊處理;
18、組合各所述拼音表示及其在所述拼音表示序列中出現(xiàn)的次數(shù),生成所述興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄。
19、可選地,所述關(guān)鍵詞的類型為:字詞;
20、所述構(gòu)建預(yù)處理后的興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄,包括:
21、確定預(yù)處理后的興趣點(diǎn)中的多個(gè)字詞;
22、組合各所述字詞及其在預(yù)處理后的興趣點(diǎn)中出現(xiàn)的次數(shù),生成所述興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄。
23、可選地,所述關(guān)鍵詞的類型為:首字母字符串;
24、所述構(gòu)建預(yù)處理后的興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄,包括:
25、確定預(yù)處理后的興趣點(diǎn)中的多個(gè)字詞,并確定各所述字詞對(duì)應(yīng)的首字母;
26、組合各所述字詞對(duì)應(yīng)的首字母,生成首字母字符串;
27、組合所述首字母字符串及預(yù)設(shè)權(quán)重,生成所述興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄。
28、可選地,所述根據(jù)多個(gè)興趣點(diǎn)對(duì)應(yīng)的第一倒排索引及所述目標(biāo)計(jì)數(shù)記錄,確定所述查詢文本與各所述興趣點(diǎn)的第一匹配值,包括:
29、從所述目標(biāo)計(jì)數(shù)記錄中,確定出至少一個(gè)目標(biāo)詞及各所述目標(biāo)詞在所述查詢文本的第二詞頻;
30、針對(duì)各所述目標(biāo)詞:根據(jù)所述第一倒排索引,確定所述興趣點(diǎn)中是否包含所述目標(biāo)詞;響應(yīng)于所述興趣點(diǎn)中包含所述目標(biāo)詞,根據(jù)所述第一倒排索引,確定所述目標(biāo)詞在所述興趣點(diǎn)中的第一詞頻;根據(jù)所述目標(biāo)詞的類型、所述目標(biāo)詞對(duì)應(yīng)的第一詞頻及所述目標(biāo)詞對(duì)應(yīng)的第二詞頻,確定所述目標(biāo)詞的第一匹配值;
31、根據(jù)各所述目標(biāo)詞的第一匹配值,確定所述查詢文本與所述興趣點(diǎn)的第一匹配值。
32、可選地,所述生成各所述備選興趣點(diǎn)對(duì)應(yīng)的多個(gè)子文本,包括:
33、對(duì)所述備選興趣點(diǎn)進(jìn)行分詞處理,得到多個(gè)分詞;
34、組合至少一個(gè)所述分詞,生成所述備選興趣點(diǎn)對(duì)應(yīng)的多個(gè)子文本。
35、可選地,所述構(gòu)建多個(gè)所述子文本對(duì)應(yīng)的第二倒排索引,包括:
36、構(gòu)建各所述子文本對(duì)應(yīng)的第二計(jì)數(shù)記錄;其中,所述第二計(jì)數(shù)記錄包括:關(guān)鍵詞及其在子文本中的詞頻;
37、根據(jù)各所述子文本對(duì)應(yīng)的第二計(jì)數(shù)記錄,構(gòu)建多個(gè)所述子文本對(duì)應(yīng)的第二倒排索引;其中,所述第二倒排索引中包括多個(gè)第二索引記錄,所述第二索引記錄中包括:關(guān)鍵詞、關(guān)鍵詞出現(xiàn)的子文本及關(guān)鍵詞在子文本中的詞頻。
38、可選地,所述根據(jù)所述第二倒排索引及所述目標(biāo)計(jì)數(shù)記錄,確定所述查詢文本與各所述子文本的第二匹配值,包括:
39、從所述目標(biāo)計(jì)數(shù)記錄中,確定出至少一個(gè)目標(biāo)詞及各所述目標(biāo)詞在所述查詢文本的第二詞頻;
40、針對(duì)各所述目標(biāo)詞:根據(jù)所述第二倒排索引,確定所述子文本中是否包含所述目標(biāo)詞;響應(yīng)于所述子文本中包含所述目標(biāo)詞,根據(jù)所述第二倒排索引,確定所述目標(biāo)詞在所述子文本中的第三詞頻;根據(jù)所述目標(biāo)詞的類型、所述目標(biāo)詞對(duì)應(yīng)的第三詞頻及所述目標(biāo)詞對(duì)應(yīng)的第二詞頻,確定所述目標(biāo)詞的第二匹配值;
41、根據(jù)各所述目標(biāo)詞的第二匹配值,確定所述查詢文本與所述子文本的第二匹配值。
42、可選地,所述根據(jù)各所述子文本對(duì)應(yīng)的第二匹配值,從多個(gè)所述子文本中,確定出所述查詢文本對(duì)應(yīng)的推薦結(jié)果,包括:
43、確定各所述子文本與所述查詢文本之間的長(zhǎng)度差值;
44、根據(jù)各所述子文本對(duì)應(yīng)的第二匹配值及長(zhǎng)度差值,從多個(gè)所述子文本中,確定出所述查詢文本對(duì)應(yīng)的推薦結(jié)果。
45、第二方面,本發(fā)明實(shí)施例提供了一種推薦結(jié)果的確定裝置,包括:
46、記錄生成模塊,用于確定查詢請(qǐng)求對(duì)應(yīng)的查詢文本,并生成所述查詢文本對(duì)應(yīng)的目標(biāo)計(jì)數(shù)記錄;
47、第一確定模塊,用于根據(jù)多個(gè)興趣點(diǎn)對(duì)應(yīng)的第一倒排索引及所述目標(biāo)計(jì)數(shù)記錄,確定所述查詢文本與各所述興趣點(diǎn)的第一匹配值;
48、第一匹配模塊,用于根據(jù)各所述興趣點(diǎn)對(duì)應(yīng)的第一匹配值,從多個(gè)所述興趣點(diǎn)中,確定出所述查詢文本對(duì)應(yīng)的至少一個(gè)備選興趣點(diǎn);
49、索引構(gòu)建模塊,用于生成各所述備選興趣點(diǎn)對(duì)應(yīng)的多個(gè)子文本,并構(gòu)建多個(gè)所述子文本對(duì)應(yīng)的第二倒排索引;
50、第二匹配模塊,用于根據(jù)所述第二倒排索引及所述目標(biāo)計(jì)數(shù)記錄,確定所述查詢文本與各所述子文本的第二匹配值;
51、結(jié)果確定模塊,用于根據(jù)各所述子文本對(duì)應(yīng)的第二匹配值,從多個(gè)所述子文本中,確定出所述查詢文本對(duì)應(yīng)的推薦結(jié)果。
52、可選地,所述索引構(gòu)建模塊還用于:
53、獲取多個(gè)興趣點(diǎn);
54、針對(duì)各所述興趣點(diǎn):對(duì)所述興趣點(diǎn)進(jìn)行預(yù)處理;構(gòu)建預(yù)處理后的興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄;其中,所述第一計(jì)數(shù)記錄包括:關(guān)鍵詞及其在興趣點(diǎn)中的詞頻;
55、根據(jù)多個(gè)所述興趣點(diǎn)對(duì)應(yīng)的第一計(jì)數(shù)記錄,構(gòu)建多個(gè)所述興趣點(diǎn)對(duì)應(yīng)的第一倒排索引;其中,所述第一倒排索引中包括多個(gè)第一索引記錄,所述第一索引記錄中包括:關(guān)鍵詞、關(guān)鍵詞出現(xiàn)的興趣點(diǎn)及關(guān)鍵詞在興趣點(diǎn)中的詞頻。
56、第三方面,本發(fā)明實(shí)施例提供了一種電子設(shè)備,包括:
57、一個(gè)或多個(gè)處理器;
58、存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)上述任一實(shí)施例所述的方法。
59、第四方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一實(shí)施例所述的方法。
60、第五方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一實(shí)施例所述的方法。
61、上述發(fā)明中的一個(gè)實(shí)施例具有如下優(yōu)點(diǎn)或有益效果:利用倒排索引實(shí)現(xiàn)了雙階段匹配過程。第一階段的倒排索引用于進(jìn)行粗略召回,在盡可能不遺漏潛在匹配項(xiàng)的前提下,從大量興趣點(diǎn)中快速篩選出備選興趣點(diǎn)。第二階段對(duì)第一階段的召回結(jié)果進(jìn)行更細(xì)致的匹配處理,通過生成多子文本,并重新構(gòu)建多個(gè)字文本的倒排索引,來確定最終的推薦結(jié)果。這種雙階段匹配策略兼顧了效率和準(zhǔn)確性,能夠顯著提高推薦結(jié)果的準(zhǔn)確性。
62、上述的非慣用的可選方式所具有的進(jìn)一步效果將在下文中結(jié)合具體實(shí)施方式加以說明。