本技術(shù)涉及人工智能、機(jī)器學(xué)習(xí)等,本技術(shù)涉及一種信息推薦方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、隨著科技的發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為人們生活中不可缺少的一部分。在互聯(lián)網(wǎng)飛速發(fā)展的時(shí)代,各種平臺(tái)也得到了快速發(fā)展,用戶可以通過(guò)各種平臺(tái)方便快捷與所感興趣的物品進(jìn)行交互。
2、本領(lǐng)域中,目前都會(huì)通過(guò)一些神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)物品的推薦。然而,雖然目前已經(jīng)存在很多不同的神經(jīng)網(wǎng)絡(luò)模型,但是基于神經(jīng)網(wǎng)絡(luò)模型進(jìn)行信息推薦的方法仍有待改進(jìn)。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供了一種信息方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。所述技術(shù)方案如下:
2、一方面,提供了一種信息推薦方法,所述方法包括:
3、獲取第一場(chǎng)景的第一訓(xùn)練集和初始網(wǎng)絡(luò)模型,所述第一訓(xùn)練集包括多個(gè)帶有標(biāo)簽的第一樣本,每個(gè)第一樣本包括屬于第一場(chǎng)景的物品和所述物品對(duì)應(yīng)的對(duì)象,所述模型包括初始元學(xué)習(xí)器和預(yù)先經(jīng)過(guò)訓(xùn)練的預(yù)測(cè)網(wǎng)絡(luò),第一樣本的標(biāo)簽表征所述第一樣本中的物品對(duì)應(yīng)于所述第一樣本中的對(duì)象的真實(shí)推薦概率;
4、基于所述第一訓(xùn)練集對(duì)初始網(wǎng)絡(luò)模型重復(fù)執(zhí)行第一訓(xùn)練操作,直至滿足第一結(jié)束條件得到第一推薦模型,并基于所述第一推薦模型得到目標(biāo)推薦模型,以基于所述目標(biāo)推薦模型進(jìn)行物品推薦;
5、其中,所述第一訓(xùn)練操作包括:
6、將各所述第一樣本分別輸入所述初始元學(xué)習(xí)器,得到各所述第一樣本的第一特征向量;
7、將各所述第一樣本和各所述第一樣本的第一特征向量輸入所述預(yù)測(cè)網(wǎng)絡(luò),得到各所述第一樣本的第一預(yù)測(cè)推薦概率,并基于各所述第一樣本的第一預(yù)測(cè)推薦概率和標(biāo)簽,確定各所述第一樣本對(duì)應(yīng)的第一損失;
8、基于各所述第一樣本的第一損失對(duì)各所述第一樣本的第一特征向量進(jìn)行調(diào)整,得到各所述第一樣本的第二特征向量;
9、基于各所述第一樣本的第二特征向量和標(biāo)簽,確定各所述第一樣本對(duì)應(yīng)的第二損失;
10、基于各所述第一樣本對(duì)應(yīng)的第一損失和第二損失,對(duì)所述初始元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
11、另一方面,提供了一種信息推薦裝置,所述裝置包括:
12、第一獲取模塊,用于獲取第一場(chǎng)景的第一訓(xùn)練集和初始網(wǎng)絡(luò)模型,所述第一訓(xùn)練集包括多個(gè)帶有標(biāo)簽的第一樣本,每個(gè)第一樣本包括屬于第一場(chǎng)景的物品和所述物品對(duì)應(yīng)的對(duì)象,所述模型包括初始元學(xué)習(xí)器和預(yù)先經(jīng)過(guò)訓(xùn)練的預(yù)測(cè)網(wǎng)絡(luò),第一樣本的標(biāo)簽表征所述第一樣本中的物品對(duì)應(yīng)于所述第一樣本中的對(duì)象的真實(shí)推薦概率;
13、第一訓(xùn)練模塊,用于基于第一訓(xùn)練集對(duì)初始網(wǎng)絡(luò)模型重復(fù)執(zhí)行第一訓(xùn)練操作,直至滿足第一結(jié)束條件得到第一推薦模型;
14、第二訓(xùn)練模塊,用于基于所述第一推薦模型得到目標(biāo)推薦模型,以基于所述目標(biāo)推薦模型進(jìn)行物品推薦;
15、其中,所述第一訓(xùn)練模塊在執(zhí)行第一訓(xùn)練操作時(shí),包括:
16、第一輸入單元,用于將各所述第一樣本分別輸入所述初始元學(xué)習(xí)器,得到各所述第一樣本的第一特征向量;
17、第一確定單元,用于將各所述第一樣本和各所述第一樣本的第一特征向量輸入所述預(yù)測(cè)網(wǎng)絡(luò),得到各所述第一樣本的第一預(yù)測(cè)推薦概率,并基于各所述第一樣本的第一預(yù)測(cè)推薦概率和標(biāo)簽,確定各所述第一樣本對(duì)應(yīng)的第一損失;
18、第一調(diào)整單元,用于基于各所述第一樣本的第一損失對(duì)各所述第一樣本的第一特征向量進(jìn)行調(diào)整,得到各所述第一樣本的第二特征向量;
19、第二確定單元,用于基于各所述第一樣本的第二特征向量和標(biāo)簽,確定各所述第一樣本對(duì)應(yīng)的第二損失;
20、第二調(diào)整單元,用于基于各所述第一樣本對(duì)應(yīng)的第一損失和第二損失,對(duì)所述初始元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
21、在一個(gè)可能實(shí)現(xiàn)方式中,所述第一獲取模塊,用于實(shí)時(shí)接收第一樣本并緩存;
22、所述裝置還包括:
23、統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)緩存的第一樣本對(duì)應(yīng)的物品類型總數(shù)、以及每種物品對(duì)應(yīng)的第一樣本的樣本數(shù);
24、所述第二調(diào)整單元,用于:
25、響應(yīng)于所述物品類型總數(shù)以及每種物品對(duì)應(yīng)的樣本數(shù)符合更新條件,基于各所述第一樣本對(duì)應(yīng)的第一損失和第二損失,對(duì)所述初始元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
26、在一個(gè)可能實(shí)現(xiàn)方式中,所述第二訓(xùn)練模塊,用于:
27、獲取第二場(chǎng)景的第二訓(xùn)練集,所述第二訓(xùn)練集包括多個(gè)帶有標(biāo)簽的第二樣本,每個(gè)第二樣本包括屬于第二場(chǎng)景的物品和所述物品對(duì)應(yīng)的對(duì)象;
28、基于所述第二訓(xùn)練集對(duì)所述第一推薦模型重復(fù)執(zhí)行第二訓(xùn)練操作,直至滿足第二結(jié)束條件,得到所述目標(biāo)推薦模型,所述第一推薦模型包括基于第一訓(xùn)練操作得到的第一元學(xué)習(xí)器以及預(yù)測(cè)網(wǎng)絡(luò);
29、其中,所述第二訓(xùn)練模塊在執(zhí)行第二訓(xùn)練操作時(shí),具體包括:
30、第二輸入單元,用于將各所述第二樣本分別輸入所述第一元學(xué)習(xí)器,得到各所述第二樣本的第三特征向量;
31、第三確定單元,用于將各所述第二樣本和各所述第二樣本的第三特征向量輸入所述預(yù)測(cè)網(wǎng)絡(luò),得到各所述第二樣本的第二預(yù)測(cè)推薦概率,并基于各所述第二樣本的第二預(yù)測(cè)推薦概率和標(biāo)簽,確定各所述第二樣本對(duì)應(yīng)的第三損失;
32、第三調(diào)整單元,用于基于各所述第二樣本對(duì)應(yīng)的第三損失對(duì)各所述第二樣本的第一特征向量進(jìn)行調(diào)整,得到各所述第二樣本對(duì)應(yīng)的第四特征向量;
33、第四確定單元,用于基于各所述第二樣本對(duì)應(yīng)的第四特征向量和標(biāo)簽,確定各所述第二樣本對(duì)應(yīng)的第四損失;
34、第四調(diào)整單元,用于基于各所述第二樣本對(duì)應(yīng)的第三損失和第四損失,對(duì)所述第一元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
35、在一個(gè)可能實(shí)現(xiàn)方式中,所述第二訓(xùn)練模塊在執(zhí)行第二訓(xùn)練操作時(shí),還包括:
36、場(chǎng)景增量約束獲取單元,用于基于第一模型參數(shù)和中間模型參數(shù)之間的距離,得到所述第二場(chǎng)景對(duì)應(yīng)的場(chǎng)景增量約束,所述場(chǎng)景增量約束用于約束中間模型參數(shù)與第一模型參數(shù)之間的距離,所述中間模型參數(shù)是上一次第二訓(xùn)練操作得到的中間推薦模型的模型參數(shù);
37、所述第四調(diào)整單元,用于:
38、基于所述第二場(chǎng)景對(duì)應(yīng)的場(chǎng)景增量約束、以及各所述第二樣本對(duì)應(yīng)的第三損失和第四損失,對(duì)所述第一元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
39、在一個(gè)可能實(shí)現(xiàn)方式中,所述場(chǎng)景增量約束獲取單元,用于以下任一項(xiàng):
40、基于第一模型參數(shù)和中間模型參數(shù)之間的距離,確定所述第二場(chǎng)景對(duì)應(yīng)的第二正則項(xiàng),將所述第二正則項(xiàng)作為所述第二場(chǎng)景對(duì)應(yīng)的場(chǎng)景增量約束;
41、通過(guò)中間推薦模型,確定所述第一訓(xùn)練集中各所述第一樣本對(duì)應(yīng)于所述中間模型參數(shù)的預(yù)測(cè)損失;基于各所述第一樣本對(duì)應(yīng)的預(yù)測(cè)損失,確定第一模型參數(shù)對(duì)應(yīng)的權(quán)重;基于所述第一模型參數(shù)對(duì)應(yīng)的權(quán)重、以及所述第一模型參數(shù)和中間模型參數(shù)之間的距離,得到第二場(chǎng)景對(duì)應(yīng)的場(chǎng)景增量約束。
42、在一個(gè)可能實(shí)現(xiàn)方式中,所述場(chǎng)景增量約束獲取單元,在基于各所述第一樣本對(duì)應(yīng)的預(yù)測(cè)損失,確定第一模型參數(shù)對(duì)應(yīng)的權(quán)重時(shí),具體用于:
43、基于各所述第一樣本對(duì)應(yīng)的預(yù)測(cè)損失,得到所述第一場(chǎng)景的場(chǎng)景總損失;
44、獲取所述第一場(chǎng)景的場(chǎng)景總損失對(duì)于所述第一模型參數(shù)的梯度,基于所述場(chǎng)景總損失對(duì)于所述第一模型參數(shù)的梯度,得到所述第一模型參數(shù)對(duì)應(yīng)的權(quán)重。
45、在一個(gè)可能實(shí)現(xiàn)方式中,所述裝置還包括:
46、場(chǎng)景增量約束獲取模塊,用于基于第一模型參數(shù)確定所述第二場(chǎng)景對(duì)應(yīng)的第一正則項(xiàng),將所述第一正則項(xiàng)作為所述第二場(chǎng)景對(duì)應(yīng)的場(chǎng)景增量約束,所述場(chǎng)景增量約束用于約束第二場(chǎng)景對(duì)應(yīng)的模型參數(shù)和第一模型參數(shù)之間的距離,所述第一模型參數(shù)是所述第一推薦模型的模型參數(shù);
47、所述第四調(diào)整單元,用于:
48、基于所述第二場(chǎng)景對(duì)應(yīng)的場(chǎng)景增量約束、以及各所述第二樣本對(duì)應(yīng)的第三損失和第四損失,對(duì)所述第一元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
49、在一個(gè)可能實(shí)現(xiàn)方式中,所述第一調(diào)整單元,用于:
50、對(duì)于每個(gè)所述第一樣本,獲取所述第一樣本對(duì)應(yīng)的第一損失對(duì)所述第一特征向量的梯度;
51、基于所述預(yù)測(cè)網(wǎng)絡(luò)對(duì)應(yīng)的學(xué)習(xí)率以及所述第一樣本對(duì)應(yīng)的梯度,確定所述第一樣本的第一特征向量對(duì)應(yīng)的調(diào)整量,并基于所述調(diào)整量將所述第一樣本的第一特征向量調(diào)整為第二特征向量。
52、在一個(gè)可能實(shí)現(xiàn)方式中,所述第二調(diào)整單元,用于:
53、對(duì)于每個(gè)第一樣本,分別基于所述第一損失對(duì)應(yīng)的第一權(quán)重和第二損失對(duì)應(yīng)的第二權(quán)重,對(duì)所述第一損失和第二損失進(jìn)行加權(quán)處理,得到所述第一樣本對(duì)應(yīng)的第一訓(xùn)練總損失;
54、基于各所述第一樣本對(duì)應(yīng)的第一訓(xùn)練總損失,對(duì)所述初始元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
55、在一個(gè)可能實(shí)現(xiàn)方式中,所述第四調(diào)整單元,用于:
56、對(duì)于每個(gè)第二樣本,獲取所述第三損失對(duì)應(yīng)的第三權(quán)重、第四損失對(duì)應(yīng)的第四權(quán)重以及場(chǎng)景增量約束對(duì)應(yīng)的第五權(quán)重;
57、分別基于第三權(quán)重、第四權(quán)重和第五權(quán)重,對(duì)所述第三損失、第四損失以及場(chǎng)景增量約束進(jìn)行加權(quán)處理,得到所述第二樣本對(duì)應(yīng)的第二訓(xùn)練總損失;
58、基于各所述第二樣本對(duì)應(yīng)的第二訓(xùn)練總損失,對(duì)所述第一元學(xué)習(xí)器的模型參數(shù)進(jìn)行調(diào)整。
59、在一個(gè)可能實(shí)現(xiàn)方式中,所述第一訓(xùn)練模塊在執(zhí)行第一訓(xùn)練操作時(shí),還用于:
60、基于各所述第一樣本對(duì)應(yīng)的第二損失,對(duì)所述初始網(wǎng)絡(luò)中的預(yù)測(cè)網(wǎng)絡(luò)的模型參數(shù)進(jìn)行調(diào)整。
61、在一個(gè)可能實(shí)現(xiàn)方式中,所述第二訓(xùn)練模塊在執(zhí)行第二訓(xùn)練操作時(shí),還用于:
62、基于所述第二場(chǎng)景對(duì)應(yīng)的場(chǎng)景增量約束、以及各所述第二樣本對(duì)應(yīng)的第四損失,對(duì)所述第一推薦模型中的預(yù)測(cè)網(wǎng)絡(luò)的模型參數(shù)進(jìn)行調(diào)整。
63、在一個(gè)可能實(shí)現(xiàn)方式中,所述裝置還包括:
64、場(chǎng)景確定模塊,用于確定所述第一場(chǎng)景和所述第二場(chǎng)景是否相同;
65、所述第二訓(xùn)練模塊,還用于若所述第一場(chǎng)景和第二場(chǎng)景不相同,基于所述第二訓(xùn)練集對(duì)所述第一推薦模型重復(fù)執(zhí)行第二訓(xùn)練操作,直至滿足第二結(jié)束條件,得到所述目標(biāo)推薦模型;
66、所述第一訓(xùn)練模塊,還用于若所述第一場(chǎng)景和第二場(chǎng)景相同,將所述第二訓(xùn)練集作為新的第一訓(xùn)練集,基于所述第二訓(xùn)練集對(duì)所述第一推薦模型重復(fù)執(zhí)行第一訓(xùn)練操作,直至滿足第三結(jié)束條件得到第三推薦模型。
67、另一方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)上述的信息推薦方法。
68、另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的信息推薦方法。
69、另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的信息推薦方法。
70、本技術(shù)實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
71、本技術(shù)提供的信息推薦方法,在基于第一訓(xùn)練集迭代訓(xùn)練初始網(wǎng)絡(luò)模型時(shí),通過(guò)先基于初始的元學(xué)習(xí)器得到各第一樣本的第一特征向量,并獲取預(yù)測(cè)網(wǎng)絡(luò)基于第一特征向量進(jìn)行預(yù)測(cè)的第一損失;然后基于第一損失對(duì)第一特征向量進(jìn)行調(diào)整,繼續(xù)獲取預(yù)測(cè)網(wǎng)絡(luò)基于調(diào)整后的第二特征向量進(jìn)行預(yù)測(cè)的第二損失。由于第一損失是基于沒(méi)有對(duì)象與物品交互數(shù)據(jù)的情況下進(jìn)行預(yù)測(cè)對(duì)應(yīng)的損失,屬于冷啟動(dòng)的損失;而第二特征向量是在基礎(chǔ)模型中經(jīng)過(guò)物品與對(duì)象的交互信息進(jìn)行調(diào)整得到的;從而第二特征向量可表征有物品對(duì)象間交互的信息,此時(shí)從冷啟動(dòng)達(dá)到了熱啟動(dòng),基于第二特征進(jìn)行預(yù)測(cè)的第二損失為熱啟動(dòng)損失。通過(guò)結(jié)合第一損失和第二損失對(duì)元學(xué)習(xí)器進(jìn)行在線學(xué)習(xí),可訓(xùn)練得到為新物品生成良好嵌入的元學(xué)習(xí)器,提高了元學(xué)習(xí)器提取物品特征的準(zhǔn)確性;且能夠解決相關(guān)技術(shù)中冷啟動(dòng)的問(wèn)題,從而提高信息推薦的準(zhǔn)確性。