本發(fā)明涉及推薦算法,尤其涉及一種基于位置消偏的多目標(biāo)資訊推薦方法、系統(tǒng)及裝置。
背景技術(shù):
1、目前,資訊推薦算法已經(jīng)廣泛應(yīng)用于互聯(lián)網(wǎng)產(chǎn)品,旨在為用戶提供個性化推薦服務(wù),實現(xiàn)“千人千面”的個性化體驗。資訊推薦算法的核心技術(shù)為預(yù)估用戶對資訊的轉(zhuǎn)化率,若能實現(xiàn)準(zhǔn)確預(yù)估用戶對資訊的轉(zhuǎn)化率,則意味著資訊信息能被用戶更高效的吸收,因此,把對用戶轉(zhuǎn)化率較高的資訊推薦給相應(yīng)的用戶,能實現(xiàn)提高平臺利益及用戶粘性的目的,進(jìn)而實現(xiàn)平臺的持續(xù)穩(wěn)定發(fā)展。
2、現(xiàn)有資訊推薦算法能夠在資訊和用戶打分方面,綜合用戶信息及資訊內(nèi)容等多重信息即更多關(guān)注于用戶、資訊以及上下文環(huán)境因素,基于復(fù)雜網(wǎng)絡(luò)模型對轉(zhuǎn)化率進(jìn)行預(yù)估,得到推薦結(jié)果。但是,目前的一些推薦算法忽視了資訊位置對轉(zhuǎn)化率的影響,導(dǎo)致資訊推薦算法難以達(dá)到最優(yōu)效果。比如:忽略了資訊在資訊列表中的位置,而資訊列表中的資訊排列順序能直接影響用戶的關(guān)注度及轉(zhuǎn)化率,也就是說:占據(jù)資訊列表前端的資訊,由于位置優(yōu)勢能夠吸引用戶更多的關(guān)注,因此能夠?qū)崿F(xiàn)更高的轉(zhuǎn)化率。
3、另外,現(xiàn)有資訊推薦算法還存在一個局限性即過于聚焦用戶點擊情況(可以理解為用戶點擊率),這種情況會忽略用戶在點擊資訊之后進(jìn)入詳情頁的資訊瀏覽行為及資訊瀏覽狀態(tài),因此會導(dǎo)致“標(biāo)題黨”資訊有較高的點擊率但其實用戶可能并沒有實際的資訊瀏覽行為及資訊瀏覽狀態(tài),嚴(yán)重影響了資訊推薦的準(zhǔn)確性以及資訊的轉(zhuǎn)化率。
4、也就是說,雖然目前存在一些資訊推薦算法,但是現(xiàn)有的資訊推薦算法基本上會存在限制資訊推薦內(nèi)容與用戶興趣的匹配度的情況,導(dǎo)致對用戶的推薦不夠準(zhǔn)確,無法滿足用戶對于個性化及高效化資訊推薦的期待,甚至可能對用戶體驗造成不利影響。
技術(shù)實現(xiàn)思路
1、本發(fā)明針對現(xiàn)有技術(shù)中的缺點,提供了一種基于位置消偏的多目標(biāo)資訊推薦方法、系統(tǒng)及裝置。
2、為了解決上述技術(shù)問題,本發(fā)明通過以下技術(shù)方案得以解決:
3、一種基于位置消偏的多目標(biāo)資訊推薦方法,包括以下步驟:
4、獲取用戶瀏覽資訊的日志數(shù)據(jù)并進(jìn)行預(yù)處理及解析,得到用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊數(shù)據(jù)集,其中,資訊數(shù)據(jù)集包括資訊標(biāo)簽集和資訊相關(guān)數(shù)據(jù)集;
5、對用戶相關(guān)數(shù)據(jù)集進(jìn)行特征提取得到用戶特征集,對資訊數(shù)據(jù)集進(jìn)行特征提取得到資訊特征集,其中,所述資訊特征集包括資訊特征、上下文特征及資訊序列特征;基于位置相關(guān)數(shù)據(jù)得到位置偏置數(shù)據(jù)進(jìn)而進(jìn)行特征提取得到位置偏置特征集;
6、構(gòu)建資訊推薦預(yù)訓(xùn)練模型,資訊推薦預(yù)訓(xùn)練模型包括數(shù)據(jù)輸入層、共享特征層、主結(jié)構(gòu)層及位置消偏層,數(shù)據(jù)輸入層接收用戶特征集、資訊特征集、資訊序列特征集及上下文特征集,共享特征層分別對用戶特征集、資訊特征集、資訊序列特征集及上下文特征集進(jìn)行處理得到對應(yīng)的向量表征,主結(jié)構(gòu)層對向量表征進(jìn)行處理得到資訊點擊特征向量及資訊瀏覽特征向量,位置消偏層獲取位置偏置特征集、資訊點擊特征向量及資訊瀏覽特征向量并進(jìn)行處理得到資訊點擊概率及資訊瀏覽概率;
7、基于用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊相關(guān)數(shù)據(jù)集對資訊推薦預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到資訊推薦模型;
8、基于資訊推薦模型對待推薦資訊數(shù)據(jù)進(jìn)行推理,得到用戶對資訊的點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù),通過點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù)得到資訊推薦結(jié)果。
9、作為一種可實施方式,所述資訊標(biāo)簽集包括資訊產(chǎn)品標(biāo)簽、點擊行為標(biāo)簽及有效瀏覽標(biāo)簽;
10、所述用戶特征包括人口屬性特征、用戶設(shè)備特征、用戶活躍度特征及用戶資訊偏好特征;
11、所述資訊特征包括資訊屬性特征及資訊標(biāo)簽特征,資訊標(biāo)簽特征包括資訊點擊標(biāo)簽、資訊瀏覽標(biāo)簽及有效瀏覽標(biāo)簽;
12、所述上下文特征包括當(dāng)前推薦的資訊主題及時間段;
13、所述資訊序列特征包括用戶點擊的資訊序列及用戶瀏覽的資訊序列。
14、作為一種可實施方式,所述有效瀏覽標(biāo)簽,通過以下步驟得到:
15、獲取當(dāng)前資訊內(nèi)容的字?jǐn)?shù)長度,基于字?jǐn)?shù)長度及每秒平均瀏覽字?jǐn)?shù)長度進(jìn)行計算,得到資訊瀏覽時長;
16、獲取用戶瀏覽時長,基于資訊瀏覽時長及用戶瀏覽時長進(jìn)行判斷,當(dāng)用戶瀏覽時長大于預(yù)設(shè)資訊瀏覽時長時,則為有效瀏覽標(biāo)簽,表示如下:
17、
18、其中,表示用戶瀏覽時長,表示字?jǐn)?shù)長度,表示每秒平均瀏覽字?jǐn)?shù)長度,表示常量,表示有效瀏覽標(biāo)簽。
19、作為一種可實施方式,所述共享特征層分別對用戶特征集、資訊特征集、資訊序列特征集及上下文特征集進(jìn)行處理得到對應(yīng)的向量表征,包括以下步驟:
20、將用戶特征、資訊特征及上下文特征采用look-up方法進(jìn)行轉(zhuǎn)換,得到對應(yīng)的向量表征;
21、將資訊序列特征采用訓(xùn)練方法進(jìn)行轉(zhuǎn)換,得到資訊序列特征向量。
22、作為一種可實施方式,所述主結(jié)構(gòu)層對向量表征進(jìn)行處理得到資訊點擊特征向量及資訊瀏覽特征向量,包括以下步驟:
23、通過注意力機制對資訊特征向量及資訊序列特征向量進(jìn)行處理,得到用戶資訊交叉表征;
24、將用戶資訊交叉表征、用戶特征向量及上下文特征向量進(jìn)行拼接,得到用戶拼接向量;
25、通過至少兩組全連接層及函數(shù)對用戶拼接向量進(jìn)行優(yōu)化處理,得到資訊點擊特征向量及資訊瀏覽特征向量;
26、所述注意力機制,表示如下:
27、
28、
29、
30、所述函數(shù),表示如下:
31、
32、所述用戶拼接向量,表示如下:
33、
34、其中,表示用戶資訊表征,表示資訊特征向量,表示目標(biāo)資訊向量,表示權(quán)重參數(shù),表示第個資訊特征向量,表示資訊特征向量的個數(shù),表示第層網(wǎng)絡(luò)的輸入,表示網(wǎng)絡(luò)層數(shù),表示第層網(wǎng)絡(luò)的參數(shù),a,b,c分別表示用戶資訊交叉表征、用戶特征向量及上下文特征向量,分別表示對應(yīng)的權(quán)重系數(shù)且和為1。
35、作為一種可實施方式,所述位置消偏層獲取位置偏置特征集、資訊點擊特征向量及資訊瀏覽特征向量并進(jìn)行處理得到資訊點擊概率及資訊瀏覽概率,包括以下步驟:
36、所述位置消偏層包括第一輸入層、嵌入層、全連接層及輸出層;
37、第一輸入層接收獲取位置偏置特征集、資訊點擊特征向量及資訊瀏覽特征向量;
38、嵌入層將位置特征集進(jìn)行端到端embedding處理并輸入至全連接層;
39、全連接層對位置特征集進(jìn)行分析,得到位置偏置向量;
40、所述輸出層將位置偏置向量分別與資訊點擊特征向量及資訊瀏覽特征向量進(jìn)行加權(quán)操作,得到偏置點擊向量及偏置瀏覽向量,將偏置點擊向量及偏置瀏覽向量分別輸入至函數(shù)進(jìn)行轉(zhuǎn)換,得到資訊點擊概率及資訊瀏覽概率;
41、所述函數(shù)表示如下:
42、
43、其中,表示偏置點擊向量或偏置瀏覽向量,表示資訊點擊概率或資訊瀏覽概率。
44、作為一種可實施方式,還包括以下步驟:
45、構(gòu)建損失函數(shù),通過損失函數(shù)對訓(xùn)練過程進(jìn)行優(yōu)化,所述損失函數(shù)包括資訊點擊損失函數(shù)及資訊瀏覽損失函數(shù);
46、構(gòu)建誤差模型,基于誤差模型對資訊推薦模型的準(zhǔn)確度進(jìn)行判斷,得到判斷結(jié)果,當(dāng)判斷結(jié)果最小時則表示資訊推薦模型訓(xùn)練完成;
47、所述資訊點擊損失函數(shù),表示如下:
48、
49、所述資訊瀏覽損失函數(shù),表示如下:
50、
51、所述誤差模型,表示如下:
52、
53、其中,表示資訊點擊損失函數(shù),表示資訊瀏覽損失函數(shù),表示點擊標(biāo)簽,表示資訊點擊概率,表示資訊瀏覽概率,表示樣本特征數(shù)據(jù)的個數(shù),表示瀏覽標(biāo)簽,表示實際值,表示預(yù)測值,表示次數(shù),表示第次,表示誤差結(jié)果。
54、作為一種可實施方式,所述通過點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù)得到資訊推薦結(jié)果,包括以下步驟:
55、對點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù)加權(quán)處理,得到融合偏好分?jǐn)?shù);
56、將融合偏好分?jǐn)?shù)進(jìn)行排序處理,基于排序結(jié)果進(jìn)行分析,得到資訊推薦結(jié)果;
57、其中,所述融合偏好分?jǐn)?shù),表示如下:
58、
59、
60、
61、其中,表示融合偏好分?jǐn)?shù),表示點擊偏好分?jǐn)?shù),表示瀏覽偏好分?jǐn)?shù),表示權(quán)重,,表示資訊平均點擊率,表示資訊平均瀏覽率,表示固定時間內(nèi)資訊點擊量,表示固定時間內(nèi)資訊曝光量,表示固定時間內(nèi)資訊有效瀏覽量。
62、作為一種可實施方式,所述獲取用戶瀏覽資訊的日志數(shù)據(jù)并進(jìn)行預(yù)處理及解析,得到用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊數(shù)據(jù)集,包括以下步驟:
63、對用戶瀏覽資訊的日志數(shù)據(jù)進(jìn)行收集,判斷并剔除異常數(shù)據(jù),得到預(yù)處理日志數(shù)據(jù)集;
64、對預(yù)處理日志數(shù)據(jù)集至少根據(jù)用戶行為分析、內(nèi)容偏好分析及時間序列分析中的一種或多種進(jìn)行數(shù)據(jù)提取并解析,得到用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊數(shù)據(jù)集;
65、通過以下公式計算異常得分,通過異常得分判斷是否異常并剔除異常數(shù)據(jù),表示如下:
66、
67、其中,表示日志數(shù)據(jù)的異常得分,表示數(shù)據(jù)的數(shù)量,表示數(shù)據(jù)的第一四分位數(shù),表示數(shù)據(jù)第三四分位數(shù),表示四分位距,為常數(shù),如果不小于0則的值為1,否則為0。
68、一種基于位置消偏的多目標(biāo)資訊推薦系統(tǒng),包括獲取處理模塊、模型構(gòu)建模塊、模型訓(xùn)練模塊及模型推理模塊;
69、所述獲取處理模塊,獲取用戶瀏覽資訊的日志數(shù)據(jù)并進(jìn)行預(yù)處理及解析,得到用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊數(shù)據(jù)集,其中,資訊數(shù)據(jù)集包括資訊標(biāo)簽集和資訊相關(guān)數(shù)據(jù)集;對用戶相關(guān)數(shù)據(jù)集進(jìn)行特征提取得到用戶特征集,對資訊數(shù)據(jù)集進(jìn)行特征提取得到資訊特征集,其中,所述資訊特征集包括資訊特征、上下文特征及資訊序列特征;基于位置相關(guān)數(shù)據(jù)得到位置偏置數(shù)據(jù)進(jìn)而進(jìn)行特征提取得到位置偏置特征集;
70、所述模型構(gòu)建模塊,構(gòu)建資訊推薦預(yù)訓(xùn)練模型,資訊推薦預(yù)訓(xùn)練模型包括數(shù)據(jù)輸入層、共享特征層、主結(jié)構(gòu)層及位置消偏層,數(shù)據(jù)輸入層接收用戶特征集、資訊特征集、資訊序列特征集及上下文特征集,共享特征層分別對用戶特征集、資訊特征集、資訊序列特征集及上下文特征集進(jìn)行處理得到對應(yīng)的向量表征,主結(jié)構(gòu)層對向量表征進(jìn)行處理得到資訊點擊特征向量及資訊瀏覽特征向量,位置消偏層獲取位置偏置特征集、資訊點擊特征向量及資訊瀏覽特征向量并進(jìn)行處理得到資訊點擊概率及資訊瀏覽概率;
71、所述模型訓(xùn)練模塊,基于用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊相關(guān)數(shù)據(jù)集對資訊推薦預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到資訊推薦模型;
72、所述模型推理模塊,基于資訊推薦模型對待推薦資訊數(shù)據(jù)進(jìn)行推理,得到用戶對資訊的點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù),通過點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù)得到資訊推薦結(jié)果。
73、一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如下所述的方法:
74、獲取用戶瀏覽資訊的日志數(shù)據(jù)并進(jìn)行預(yù)處理及解析,得到用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊數(shù)據(jù)集,其中,資訊數(shù)據(jù)集包括資訊標(biāo)簽集和資訊相關(guān)數(shù)據(jù)集;
75、對用戶相關(guān)數(shù)據(jù)集進(jìn)行特征提取得到用戶特征集,對資訊數(shù)據(jù)集進(jìn)行特征提取得到資訊特征集,其中,所述資訊特征集包括資訊特征、上下文特征及資訊序列特征;基于位置相關(guān)數(shù)據(jù)得到位置偏置數(shù)據(jù)進(jìn)而進(jìn)行特征提取得到位置偏置特征集;
76、構(gòu)建資訊推薦預(yù)訓(xùn)練模型,資訊推薦預(yù)訓(xùn)練模型包括數(shù)據(jù)輸入層、共享特征層、主結(jié)構(gòu)層及位置消偏層,數(shù)據(jù)輸入層接收用戶特征集、資訊特征集、資訊序列特征集及上下文特征集,共享特征層分別對用戶特征集、資訊特征集、資訊序列特征集及上下文特征集進(jìn)行處理得到對應(yīng)的向量表征,主結(jié)構(gòu)層對向量表征進(jìn)行處理得到資訊點擊特征向量及資訊瀏覽特征向量,位置消偏層獲取位置偏置特征集、資訊點擊特征向量及資訊瀏覽特征向量并進(jìn)行處理得到資訊點擊概率及資訊瀏覽概率;
77、基于用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊相關(guān)數(shù)據(jù)集對資訊推薦預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到資訊推薦模型;
78、基于資訊推薦模型對待推薦資訊數(shù)據(jù)進(jìn)行推理,得到用戶對資訊的點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù),通過點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù)得到資訊推薦結(jié)果。
79、一種基于位置消偏的多目標(biāo)資訊推薦裝置,包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如下所述的方法:
80、獲取用戶瀏覽資訊的日志數(shù)據(jù)并進(jìn)行預(yù)處理及解析,得到用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊數(shù)據(jù)集,其中,資訊數(shù)據(jù)集包括資訊標(biāo)簽集和資訊相關(guān)數(shù)據(jù)集;
81、對用戶相關(guān)數(shù)據(jù)集進(jìn)行特征提取得到用戶特征集,對資訊數(shù)據(jù)集進(jìn)行特征提取得到資訊特征集,其中,所述資訊特征集包括資訊特征、上下文特征及資訊序列特征;基于位置相關(guān)數(shù)據(jù)得到位置偏置數(shù)據(jù)進(jìn)而進(jìn)行特征提取得到位置偏置特征集;
82、構(gòu)建資訊推薦預(yù)訓(xùn)練模型,資訊推薦預(yù)訓(xùn)練模型包括數(shù)據(jù)輸入層、共享特征層、主結(jié)構(gòu)層及位置消偏層,數(shù)據(jù)輸入層接收用戶特征集、資訊特征集、資訊序列特征集及上下文特征集,共享特征層分別對用戶特征集、資訊特征集、資訊序列特征集及上下文特征集進(jìn)行處理得到對應(yīng)的向量表征,主結(jié)構(gòu)層對向量表征進(jìn)行處理得到資訊點擊特征向量及資訊瀏覽特征向量,位置消偏層獲取位置偏置特征集、資訊點擊特征向量及資訊瀏覽特征向量并進(jìn)行處理得到資訊點擊概率及資訊瀏覽概率;
83、基于用戶相關(guān)數(shù)據(jù)集、位置相關(guān)數(shù)據(jù)集及資訊相關(guān)數(shù)據(jù)集對資訊推薦預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到資訊推薦模型;
84、基于資訊推薦模型對待推薦資訊數(shù)據(jù)進(jìn)行推理,得到用戶對資訊的點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù),通過點擊偏好分?jǐn)?shù)及瀏覽偏好分?jǐn)?shù)得到資訊推薦結(jié)果。
85、本發(fā)明由于采用了以上技術(shù)方案,具有顯著的技術(shù)效果:
86、本發(fā)明通過設(shè)計符合資訊實際狀態(tài)的多目標(biāo)網(wǎng)絡(luò)并設(shè)計位置消偏輔助網(wǎng)絡(luò),搭建資訊推薦預(yù)訓(xùn)練模型,同時基于用戶日志數(shù)據(jù)獲取樣本特征數(shù)據(jù),創(chuàng)新性引入位置相關(guān)數(shù)據(jù)。通過對模型進(jìn)行迭代訓(xùn)練,得到資訊推薦模型,基于訓(xùn)練所得模型進(jìn)行數(shù)據(jù)推理,得到資訊推薦結(jié)果。本發(fā)明通過衡量用戶深層次興趣及資訊位置分布的影響,顯著提升用戶的信息服務(wù)體驗,實現(xiàn)高效且精準(zhǔn)的資訊分發(fā)。