專(zhuān)利名稱(chēng):基于灰色預(yù)測(cè)模型的推薦方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及推薦系統(tǒng)技術(shù)領(lǐng)域,特別涉及一種基于灰色預(yù)測(cè)模型的推薦方法及系統(tǒng)。
背景技術(shù):
Web 2. 0技術(shù)和交互式媒體的大力發(fā)展,使得人們從以往被動(dòng)的網(wǎng)頁(yè)瀏覽者逐漸成為主動(dòng)參與者,并且人們的參與度在不斷提高。然而在互聯(lián)網(wǎng)給我們帶來(lái)便利的同時(shí),也將我們帶進(jìn)了信息爆炸的時(shí)代。信息過(guò)載使得人們很難從豐富多彩的網(wǎng)絡(luò)世界中獲取對(duì)自身有價(jià)值的內(nèi)容,而且使得大量鮮為人知的信息成為網(wǎng)絡(luò)中的“暗信息”。傳統(tǒng)的基于信息過(guò)濾技術(shù)的搜索引擎缺乏個(gè)性化的考慮,仍然無(wú)法很好地解決信息過(guò)載的問(wèn)題。近年來(lái),推薦系統(tǒng)作為當(dāng)前解決信息過(guò)載問(wèn)題非常有潛力的方法被學(xué)術(shù)界和工業(yè)界高度關(guān)注。與傳統(tǒng)的基于信息過(guò)濾技術(shù)的搜索引擎不同,推薦系統(tǒng)不需要用戶(hù)提供用于搜索的關(guān)鍵詞,它通過(guò)分析用戶(hù)歷史行為挖掘出用戶(hù)潛在的興趣愛(ài)好,進(jìn)而對(duì)其進(jìn)行推薦。因此,推薦系統(tǒng)更能滿(mǎn)足用戶(hù)個(gè)性化的需求。根據(jù)推薦算法的不同,推薦系統(tǒng)可以分為如下幾類(lèi)協(xié)同過(guò)濾系統(tǒng)、基于內(nèi)容的推薦系統(tǒng)、混合推薦系統(tǒng),以及基于用戶(hù)-項(xiàng)目二部圖網(wǎng)絡(luò)結(jié)構(gòu)的推薦系統(tǒng)。協(xié)同過(guò)濾系統(tǒng)是最早被提出并得到廣泛應(yīng)用的推薦系統(tǒng)。其進(jìn)一步可分為基于最近鄰的協(xié)同過(guò)濾和基于項(xiàng)目的協(xié)同過(guò)濾。前者的基本思想是基于評(píng)分相似的最近鄰居的評(píng)分?jǐn)?shù)據(jù)向目標(biāo)用戶(hù)產(chǎn)生推薦;后者通過(guò)計(jì)算項(xiàng)目之間的相關(guān)性,然后利用用戶(hù)對(duì)相關(guān)項(xiàng)目的評(píng)分預(yù)測(cè)用戶(hù)對(duì)未評(píng)分項(xiàng)目的評(píng)分,從而推薦預(yù)測(cè)評(píng)分較高的項(xiàng)目給用戶(hù)?;谧罱彽膮f(xié)同過(guò)濾推薦系統(tǒng)最大的優(yōu)點(diǎn)是具有推薦新信息的能力,可以發(fā)現(xiàn)用戶(hù)潛在的但自己尚未察覺(jué)的興趣偏好;同時(shí)還能夠推薦音樂(lè)、電影等難以進(jìn)行內(nèi)容分析的對(duì)象。基于項(xiàng)目的協(xié)同過(guò)濾推薦系統(tǒng)通過(guò)充分挖掘用戶(hù)的興趣愛(ài)好,推薦與其之前所選擇的項(xiàng)目相似度最高的項(xiàng)目給用戶(hù)。因此,協(xié)同過(guò)濾系統(tǒng)的核心思想可以分為兩部分首先,利用用戶(hù)的歷史信息計(jì)算 用戶(hù)或項(xiàng)目之間的相似性;然后利用與目標(biāo)用戶(hù)相似性較高的鄰居對(duì)特定項(xiàng)目的評(píng)價(jià)或者利用用戶(hù)對(duì)與特定項(xiàng)目相似性較高的項(xiàng)目的評(píng)價(jià)來(lái)預(yù)測(cè)目標(biāo)用戶(hù)對(duì)特定項(xiàng)目的喜好程度。最后,系統(tǒng)根據(jù)這一喜好程度來(lái)對(duì)目標(biāo)用戶(hù)進(jìn)行推薦。不難看出,協(xié)同過(guò)濾系統(tǒng)的推薦精度取決于用戶(hù)或項(xiàng)目間相似性計(jì)算的準(zhǔn)確度,然而用戶(hù)評(píng)分?jǐn)?shù)據(jù)的稀疏性及數(shù)據(jù)間的關(guān)聯(lián)性使得主流的相似性計(jì)算方法如余弦相似性和Pearson相關(guān)相似性難以準(zhǔn)確度量用戶(hù)或項(xiàng)目間的相似性。因此,直接利用該相似性加權(quán)得到的預(yù)測(cè)評(píng)分不可信,即系統(tǒng)的推薦精度較低。此外,協(xié)同過(guò)濾系統(tǒng)也面臨著如何對(duì)新用戶(hù)進(jìn)行推薦或如何推薦新產(chǎn)品給用戶(hù)的冷啟動(dòng)問(wèn)題以及用戶(hù)和項(xiàng)目數(shù)量增多,計(jì)算量線(xiàn)性增大的算法可擴(kuò)展性問(wèn)題等等。
發(fā)明內(nèi)容
(一 )要解決的技術(shù)問(wèn)題本發(fā)明要解決的技術(shù)問(wèn)題是如何提供一種基于灰色預(yù)測(cè)模型的推薦方法及系統(tǒng),以克服現(xiàn)有推薦方法及系統(tǒng)在用戶(hù)評(píng)分?jǐn)?shù)據(jù)極端稀疏并且數(shù)據(jù)間存在嚴(yán)重關(guān)聯(lián)的情況下會(huì)導(dǎo)致推薦精度較低的缺點(diǎn)。( 二 )技術(shù)方案為解決上述技術(shù)問(wèn)題,本發(fā)明提供一種基于灰色預(yù)測(cè)模型的推薦方法,其包括步驟A :建立項(xiàng)目間相似性矩陣; B :根據(jù)所述相似性矩陣,從目標(biāo)用戶(hù)的已評(píng)項(xiàng)目中選擇與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目相似度高的預(yù)定數(shù)目的項(xiàng)目;C :按照與所述未評(píng)項(xiàng)目的相似度由低到高的順序,對(duì)所選項(xiàng)目的評(píng)分進(jìn)行排序,得到預(yù)測(cè)序列;
D :根據(jù)所述預(yù)測(cè)序列構(gòu)建灰色預(yù)測(cè)模型;E :根據(jù)所述灰色預(yù)測(cè)模型預(yù)測(cè)所述目標(biāo)用戶(hù)對(duì)所述未評(píng)項(xiàng)目的預(yù)測(cè)評(píng)分,根據(jù)所述預(yù)測(cè)評(píng)分向所述目標(biāo)用戶(hù)推薦相應(yīng)的未評(píng)項(xiàng)目。優(yōu)選地,所述步驟A具體包括步驟Al :對(duì)于任意兩個(gè)項(xiàng)目i和j,遍歷所有用戶(hù),得到同時(shí)對(duì)所述項(xiàng)目i和所述項(xiàng)目j給出評(píng)分的用戶(hù)集合U(i,j);A2 :根據(jù)所述用戶(hù)集合U(i,j)中的用戶(hù),得到所述項(xiàng)目i對(duì)應(yīng)所述項(xiàng)目j的評(píng)分向量/^,以及所述項(xiàng)目j對(duì)應(yīng)所述項(xiàng)目i的評(píng)分向量$ ;A3 :根據(jù)所述評(píng)分向量&和所述評(píng)分向量/汁算得到所述項(xiàng)目i與所述項(xiàng)目j之間的相似度;A4 :重復(fù)所述步驟Al A3,直至得到各個(gè)項(xiàng)目之間的相似度,根據(jù)各個(gè)項(xiàng)目之間的相似度建立項(xiàng)目間相似性矩陣。優(yōu)選地,所述步驟Al中,同時(shí)對(duì)所述項(xiàng)目i和所述項(xiàng)目j給出評(píng)分的用戶(hù)集合U(i, j)的計(jì)算公式如下u(i, j) = u(i) n u(j) ;(I)其中,U⑴表示所有對(duì)所述項(xiàng)目i給出評(píng)分的用戶(hù)集合;U(j)表示所有對(duì)所述項(xiàng)目j給出評(píng)分的用戶(hù)集合。優(yōu)選地,所述步驟A3中,所述項(xiàng)目i與所述項(xiàng)目j之間的相似度計(jì)算公式如下
^ Ii. Ji( 2)sim G,■/■) = eos(fj 4、二 —-— 5
I iJ IIxII 11其中,sim(i, j)表示所述項(xiàng)目i與所述項(xiàng)目j之間的相似度。優(yōu)選地,所述步驟B具體包括步驟BI :根據(jù)所述相似性矩陣,將所述目標(biāo)用戶(hù)的已評(píng)項(xiàng)目按照與所述目標(biāo)用戶(hù)的每個(gè)未評(píng)項(xiàng)目的相似度由高到低排序,得到對(duì)應(yīng)每個(gè)所述未評(píng)項(xiàng)目的已評(píng)項(xiàng)目序列;B2 :判斷所述已評(píng)項(xiàng)目序列中的項(xiàng)目數(shù)量是否大于等于預(yù)定數(shù)目,如果是,從所述已評(píng)項(xiàng)目序列中選擇前預(yù)定數(shù)目個(gè)已評(píng)項(xiàng)目作為與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目的相似度高的項(xiàng)目,執(zhí)行步驟C ;否則,執(zhí)行步驟B3 ;B3 :在所述已評(píng)項(xiàng)目序列中補(bǔ)充相應(yīng)數(shù)量的偽項(xiàng)目以使所述已評(píng)項(xiàng)目序列中的項(xiàng)目數(shù)量達(dá)到所述預(yù)定數(shù)目,設(shè)置所述偽項(xiàng)目的評(píng)分為預(yù)定評(píng)分,并且設(shè)置所述偽項(xiàng)目與所述未評(píng)項(xiàng)目的相似度為極小值;B4 :選擇所述已評(píng)項(xiàng)目序列中的所有項(xiàng)目作為與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目的相似度高的項(xiàng)目,執(zhí)行步驟C。優(yōu)選地,所述步驟C中,所述預(yù)測(cè)序列的公式如下
權(quán)利要求
1.一種基于灰色預(yù)測(cè)模型的推薦方法,其特征在于,包括步驟 A :建立項(xiàng)目間相似性矩陣; B :根據(jù)所述相似性矩陣,從目標(biāo)用戶(hù)的已評(píng)項(xiàng)目中選擇與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目相似度高的預(yù)定數(shù)目的項(xiàng)目; C :按照與所述未評(píng)項(xiàng)目的相似度由低到高的順序,對(duì)所選項(xiàng)目的評(píng)分進(jìn)行排序,得到預(yù)測(cè)序列; D :根據(jù)所述預(yù)測(cè)序列構(gòu)建灰色預(yù)測(cè)模型; E :根據(jù)所述灰色預(yù)測(cè)模型預(yù)測(cè)所述目標(biāo)用戶(hù)對(duì)所述未評(píng)項(xiàng)目的預(yù)測(cè)評(píng)分,根據(jù)所述預(yù)測(cè)評(píng)分向所述目標(biāo)用戶(hù)推薦相應(yīng)的未評(píng)項(xiàng)目。
2.如權(quán)利要求I所述的方法,其特征在于,所述步驟A具體包括步驟 Al :對(duì)于任意兩個(gè)項(xiàng)目i和j,遍歷所有用戶(hù),得到同時(shí)對(duì)所述項(xiàng)目i和所述項(xiàng)目j給出評(píng)分的用戶(hù)集合U(i,j); A2 :根據(jù)所述用戶(hù)集合U(i,j)中的用戶(hù),得到所述項(xiàng)目i對(duì)應(yīng)所述項(xiàng)目j的評(píng)分向量I,以及所述項(xiàng)目j對(duì)應(yīng)所述項(xiàng)目i的評(píng)分向量Z ; A3 :根據(jù)所述評(píng)分向量g和所述評(píng)分向量j計(jì)算得到所述項(xiàng)目i與所述項(xiàng)目j之間的相似度; A4 :重復(fù)所述步驟Al A3,直至得到各個(gè)項(xiàng)目之間的相似度,根據(jù)各個(gè)項(xiàng)目之間的相似度建立項(xiàng)目間相似性矩陣。
3.如權(quán)利要求2所述的方法,其特征在于,所述步驟Al中,同時(shí)對(duì)所述項(xiàng)目i和所述項(xiàng)目j給出評(píng)分的用戶(hù)集合U(i,j)的計(jì)算公式如下
4.如權(quán)利要求2所述的方法,其特征在于,所述步驟A3中,所述項(xiàng)目i與所述項(xiàng)目j之間的相似度計(jì)算公式如下 sim(i,j) = cos(ij,h)=:.匕,(2 ) I iJ IxII Ji I 其中,sim(i, j)表示所述項(xiàng)目i與所述項(xiàng)目j之間的相似度。
5.如權(quán)利要求I所述的方法,其特征在于,所述步驟B具體包括步驟 BI :根據(jù)所述相似性矩陣,將所述目標(biāo)用戶(hù)的已評(píng)項(xiàng)目按照與所述目標(biāo)用戶(hù)的每個(gè)未評(píng)項(xiàng)目的相似度由高到低排序,得到對(duì)應(yīng)每個(gè)所述未評(píng)項(xiàng)目的已評(píng)項(xiàng)目序列; B2 :判斷所述已評(píng)項(xiàng)目序列中的項(xiàng)目數(shù)量是否大于等于預(yù)定數(shù)目,如果是,從所述已評(píng)項(xiàng)目序列中選擇前預(yù)定數(shù)目個(gè)已評(píng)項(xiàng)目作為與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目的相似度高的項(xiàng)目,執(zhí)行步驟C ;否則,執(zhí)行步驟B3 ; B3 :在所述已評(píng)項(xiàng)目序列中補(bǔ)充相應(yīng)數(shù)量的偽項(xiàng)目以使所述已評(píng)項(xiàng)目序列中的項(xiàng)目數(shù)量達(dá)到所述預(yù)定數(shù)目,設(shè)置所述偽項(xiàng)目的評(píng)分為預(yù)定評(píng)分,并且設(shè)置所述偽項(xiàng)目與所述未評(píng)項(xiàng)目的相似度為極小值;B4 :選擇所述已評(píng)項(xiàng)目序列中的所有項(xiàng)目作為與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目的相似度高的項(xiàng)目,執(zhí)行步驟C。
6.如權(quán)利要求I所述的方法,其特征在于,所述步驟C中,所述預(yù)測(cè)序列的公式如下
7.如權(quán)利要求6所述的方法,其特征在于,所述步驟D中,所述灰色預(yù)測(cè)模型公式如下
8.如權(quán)利要求I所述的方法,其特征在于,所述步驟E具體包括步驟 El :根據(jù)所述灰色預(yù)測(cè)模型預(yù)測(cè)所述目標(biāo)用戶(hù)對(duì)每個(gè)所述未評(píng)項(xiàng)目的預(yù)測(cè)評(píng)分,所述預(yù)測(cè)評(píng)分的計(jì)算公式如下 其中,Pu, i表示用戶(hù)u對(duì)未評(píng)項(xiàng)目i的預(yù)測(cè)評(píng)分; E2 :依次判斷每個(gè)所述未評(píng)項(xiàng)目的預(yù)測(cè)評(píng)分Pu, i是否大于推薦閾值,如果是,將相應(yīng)的未評(píng)項(xiàng)目i推薦給所述目標(biāo)用戶(hù);否則,不推薦相應(yīng)的未評(píng)項(xiàng)目i。
9.一種基于灰色預(yù)測(cè)模型的推薦系統(tǒng),其特征在于,所述系統(tǒng)包括矩陣建立單元、已評(píng)項(xiàng)目選取單元、預(yù)測(cè)序列建立單元、灰色預(yù)測(cè)模型單元和預(yù)測(cè)推薦單元; 所述矩陣建立單元,用于建立項(xiàng)目間相似性矩陣; 所述已評(píng)項(xiàng)目選取單元,用于根據(jù)所述相似性矩陣,從目標(biāo)用戶(hù)的已評(píng)項(xiàng)目中選擇與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目相似度高的預(yù)定數(shù)目的項(xiàng)目; 所述預(yù)測(cè)序列建立單元,用于按照與所述未評(píng)項(xiàng)目的相似度由低到高的順序,對(duì)所選項(xiàng)目的評(píng)分進(jìn)行排序,得到預(yù)測(cè)序列; 所述灰色預(yù)測(cè)模型單元,用于根據(jù)所述預(yù)測(cè)序列構(gòu)建灰色預(yù)測(cè)模型; 所述預(yù)測(cè)推薦單元,用于根據(jù)所述灰色預(yù)測(cè)模型預(yù)測(cè)所述目標(biāo)用戶(hù)對(duì)所述未評(píng)項(xiàng)目的預(yù)測(cè)評(píng)分,根據(jù)所述預(yù)測(cè)評(píng)分向所述目標(biāo)用戶(hù)推薦相應(yīng)的未評(píng)項(xiàng)目。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述矩陣建立單元包括用戶(hù)集合模塊、評(píng)分向量模塊、相似度計(jì)算模塊和矩陣建立模塊; 所述用戶(hù)集合模塊,用于對(duì)于任意兩個(gè)項(xiàng)目i和j,遍歷所有用戶(hù),得到同時(shí)對(duì)所述項(xiàng)目i和所述項(xiàng)目j給出評(píng)分的用戶(hù)集合U(i,j); 所述評(píng)分向量模塊,用于根據(jù)所述用戶(hù)集合U(i,j)中的用戶(hù),得到所述項(xiàng)目i對(duì)應(yīng)所述項(xiàng)目j的評(píng)分向量,以及所述項(xiàng)目j對(duì)應(yīng)所述項(xiàng)目i的評(píng)分向量; 所述相似度計(jì)算模塊,用于根據(jù)所述評(píng)分向量g和所述評(píng)分向量J;計(jì)算得到所述項(xiàng)目i與所述項(xiàng)目j之間的相似度; 所述矩陣建立模塊,用于根據(jù)各個(gè)項(xiàng)目之間的相似度建立項(xiàng)目間相似性矩陣。
全文摘要
本發(fā)明公開(kāi)了一種基于灰色預(yù)測(cè)模型的推薦方法及系統(tǒng),涉及推薦系統(tǒng)領(lǐng)域。所述方法包括步驟建立項(xiàng)目間相似性矩陣;根據(jù)所述相似性矩陣,從目標(biāo)用戶(hù)的已評(píng)項(xiàng)目中選擇與所述目標(biāo)用戶(hù)的未評(píng)項(xiàng)目相似度高的預(yù)定數(shù)目的項(xiàng)目;按照與所述未評(píng)項(xiàng)目的相似度由低到高的順序,對(duì)所選項(xiàng)目的評(píng)分進(jìn)行排序,得到預(yù)測(cè)序列;根據(jù)所述預(yù)測(cè)序列構(gòu)建灰色預(yù)測(cè)模型;根據(jù)所述灰色預(yù)測(cè)模型預(yù)測(cè)所述目標(biāo)用戶(hù)對(duì)所述未評(píng)項(xiàng)目的預(yù)測(cè)評(píng)分,根據(jù)所述預(yù)測(cè)評(píng)分向所述目標(biāo)用戶(hù)推薦相應(yīng)的未評(píng)項(xiàng)目。所述推薦方法及系統(tǒng)在用戶(hù)評(píng)分?jǐn)?shù)據(jù)極端稀疏并且數(shù)據(jù)間存在嚴(yán)重關(guān)聯(lián)的情況下依然可以保證很高的推薦精度,具有廣泛的應(yīng)用前景。
文檔編號(hào)G06F17/30GK102722550SQ20121016785
公開(kāi)日2012年10月10日 申請(qǐng)日期2012年5月25日 優(yōu)先權(quán)日2012年5月25日
發(fā)明者曹軍威, 謝峰, 陳震 申請(qǐng)人:清華大學(xué)