基于用戶的協(xié)同過濾組合推薦方法
【專利摘要】本發(fā)明涉及計(jì)算機(jī)協(xié)同推薦方法,公開了一種基于用戶的協(xié)同過濾組合推薦方法,包括以下具體步驟:評分矩陣建立步驟,建立用戶-項(xiàng)目評分矩陣;相似度計(jì)算步驟,計(jì)算不同用戶之間的相似度;模糊矩陣建立步驟,建立基于不同用戶之間的相似度的模糊相似矩陣;關(guān)系簇構(gòu)造步驟,構(gòu)建基于無向圖的最近鄰居集合;預(yù)測步驟,對用戶的未評分項(xiàng)目進(jìn)行預(yù)測。本發(fā)明的優(yōu)點(diǎn)在于,有效地解決了用戶評價(jià)不完整所導(dǎo)致的推薦精度低的問題,計(jì)算方法簡單,步驟少,復(fù)雜度小,計(jì)算精確度高,通過對用戶未評分項(xiàng)進(jìn)行預(yù)測,從而提高推薦的精度,具有較好的應(yīng)用價(jià)值。
【專利說明】基于用戶的協(xié)同過濾組合推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)協(xié)同推薦方法,特別涉及一種基于用戶的協(xié)同過濾組合推薦方法。
【背景技術(shù)】
[0002]當(dāng)面對大量軟件信息時(shí),用戶經(jīng)常會(huì)迷失在商品信息空間中,無法順利找到自己需要的信息。個(gè)性化云服務(wù)推薦系統(tǒng)整合海量的用戶數(shù)據(jù),如用戶注冊信息、銷售排行和用戶消費(fèi)歷史等數(shù)據(jù),然后模擬商店銷售員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程。
[0003]在推薦系統(tǒng)領(lǐng)域,有多種基于數(shù)據(jù)挖掘的推薦技術(shù),User-based協(xié)同過濾推薦和模糊聚類是目前較流行的推薦方法。
[0004]User-based協(xié)同過濾推薦一般采用找最近鄰居的技術(shù),利用用戶的評分信息分析用戶的興趣愛好,并以此計(jì)算用戶的相似性,評分的相似度越高說明這兩個(gè)用戶越鄰近,然后可以找到目標(biāo)用戶的最近鄰居。最后根據(jù)最近鄰居的評分預(yù)測目標(biāo)用戶的評分。它基于這樣一個(gè)假設(shè):如果用戶對一些項(xiàng)的評分比較相似,則他們對其它項(xiàng)的評分也比較相似。
[0005]聚類就是按照事物的某些屬性,把事物聚集成類,按這種方式組成的類應(yīng)盡可能讓類間的相似性足夠小,而同一個(gè)類內(nèi)相似性盡可能大。而模糊聚類是一種使用模糊等價(jià)關(guān)系將對象劃分為一些等價(jià)類的聚類方法,可以使類間的相似性足夠小,而同一個(gè)類內(nèi)相似性盡可能大,給定閥值集合條件下給出的聚類結(jié)果的比傳統(tǒng)的聚類更有效,因?yàn)閭鹘y(tǒng)的聚類方法中,每個(gè)用戶均被劃分到了某一個(gè)類別,而對于一些屬性特征不明顯的用戶,他們屬于另外的類別也是合理的,將他們生硬地劃分到某一個(gè)類別顯然是不合理的;而模糊聚類引入隸屬度概念,隸屬度越高則被劃分到某一個(gè)類別的優(yōu)先級(jí)越高。
[0006]兩種推薦技術(shù)各有適用的范圍,協(xié)同過濾推薦方法是當(dāng)前最成功的也是研究最深入的推薦方法,基于用戶的協(xié)同過濾推薦可以處理更復(fù)雜的非結(jié)構(gòu)化對象,但依然存在數(shù)據(jù)極端稀疏性、新用戶和冷啟動(dòng)等問題。所以基于以上原因筆者通過將兩種不同方法相互組合,設(shè)計(jì)一種基于用戶的協(xié)同過濾組合推薦方法構(gòu)建構(gòu)建個(gè)性化推薦系統(tǒng)。
【發(fā)明內(nèi)容】
[0007]本發(fā)明針對現(xiàn)有技術(shù)中,協(xié)同過濾推薦方法中依舊存在數(shù)據(jù)稀疏,新用戶和冷啟動(dòng)數(shù)據(jù)不足的缺點(diǎn),提供了一種基于用戶的協(xié)同過濾組合推薦方法。
[0008]為實(shí)現(xiàn)上述目的,本發(fā)明可采取下述技術(shù)方案:
[0009]基于用戶的協(xié)同過濾組合推薦方法,包括以下具體步驟:
[0010]評分矩陣建立步驟:建立mXn階的用戶-項(xiàng)目評分矩陣,所述評分矩陣表示為A(m,η),其中,m為用戶數(shù),η為項(xiàng)目數(shù),第i行第j列的項(xiàng)Ru表示用戶i對項(xiàng)目j的評分;
[0011]相似度計(jì)算步驟:分別計(jì)算不同用戶之間的相似度Sim(i,j);
[0012]模糊矩陣建立步驟:建立模糊相似矩陣Mmxm,所述模糊相似矩陣為對角線的項(xiàng)為I的對稱矩陣,其余項(xiàng)為所述相似度sim(i,j),且其余項(xiàng)的行、列分別與說書評分矩陣的行、列相對應(yīng);
[0013]關(guān)系簇構(gòu)造步驟:建立對應(yīng)于所述模糊相似矩陣Mmxm的無向圖G(V,E),其中,V表示項(xiàng)目集合,E由所述模糊相似矩陣Mmxm中^≥λ的邊組成,所述Mu表示模糊相似矩陣Mmxm的項(xiàng),λ表示聚類閾值;求得聚類閾值λ的模糊等價(jià)類,所述聚類閾值λ的模糊等價(jià)類為無向圖G(V,E)在不同的聚類閾值λ上的連通分支的頂點(diǎn)集合;所述聚類閾值λ的模糊等價(jià)類為特定用戶的最近鄰居集合;
[0014]預(yù)測步驟:采用以下公式預(yù)測用戶U對未評分項(xiàng)目i的評分PUti = Ra十
【權(quán)利要求】
1.一種基于用戶的協(xié)同過濾組合推薦方法,其特征在于,包括以下具體步驟:評分矩陣建立步驟(100):建立mXn階的用戶-項(xiàng)目評分矩陣,所述評分矩陣表示為A(m,η),其中,m為用戶數(shù),η為項(xiàng)目數(shù),第i行第j列的項(xiàng)Ru表示用戶i對項(xiàng)目j的評分; 相似度計(jì)算步驟(200):分別計(jì)算不同用戶之間的相似度sim(i,j); 模糊矩陣建立步驟(300):建立模糊相似矩陣Mmxm,所述模糊相似矩陣為對角線的項(xiàng)為I的對稱矩陣,其余項(xiàng)為所述相似度sim(i,j),且其余項(xiàng)的行、列分別與所述評分矩陣的行、列相對應(yīng); 關(guān)系簇構(gòu)造步驟(400):建立對應(yīng)于所述模糊相似矩陣Mmxm的無向圖G(V,E),其中,V表示項(xiàng)目集合,E由所述模糊相似矩陣Mmxm中MuS λ的邊組成,所述Mu表示模糊相似矩陣Mmxm的項(xiàng),λ表示聚類閾值;求得聚類閾值λ的模糊等價(jià)類,所述聚類閾值λ的模糊等價(jià)類為無向圖G(V,E)在不同的聚類閾值λ上的連通分支的頂點(diǎn)集合;所述聚類閾值λ的模糊等價(jià)類為特定用戶的最近鄰居集合; 預(yù)測步驟(500):采用以下公式預(yù)測用戶u對未評分項(xiàng)目i的評分iVi =^ +
,其中,sim(u,v)表不用尸u與用尸V Z間的相似
ZiVeAfeiahbours(Ii)IsimWyJi性,Rv, i表不用戶V對項(xiàng)目i的評分,分別表不用戶u與用戶V對項(xiàng)目i的評分,Neighbours (U)表示所述用戶u的最近鄰居集合。
2.根據(jù)權(quán)利要求1所述的基于用戶的協(xié)同過濾組合推薦方法,其特征在于,還包括以下具體步驟:在評分矩陣建立步驟(100)中,當(dāng)用戶u對項(xiàng)目j未評分,則Ru = O;在預(yù)測步驟(500)中,將用戶u對未評分項(xiàng)j的預(yù)測得到的評分Py加入所述評分矩陣。
3.根據(jù)權(quán)利要求1所述的基于用戶的協(xié)同過濾組合推薦方法,其特征在于,還包括以下具體步驟:基于不同的聚類閾值λ求得至少兩個(gè)模糊等價(jià)類并得到最近鄰居集合,根據(jù)不同的最近鄰居集合在預(yù)測步驟(500)中得到不同的預(yù)測評分Pu, i,去預(yù)測評分?jǐn)?shù)值較高的評分作為用戶u對未評分項(xiàng)i的最終評分。
4.根據(jù)權(quán)利要求1所述的基于用戶的協(xié)同過濾組合推薦方法,其特征在于,所述相似度計(jì)算步驟(200)中,所述相似度
別表示用戶1、用戶j對項(xiàng)目C的評分,馬、分別表示用戶1、用戶j的平均評分,Iij表示用戶1、用戶j共同評分過的項(xiàng)的集合。
5.根據(jù)權(quán)利要求1所述的基于用戶的協(xié)同過濾組合推薦方法,其特征在于,所述關(guān)系簇構(gòu)造步驟(400)還包括:確定m個(gè)用戶作為樣本,計(jì)算所述樣本內(nèi)任意兩個(gè)用戶i,j之間的相似度sim(i,j),確定一個(gè)截集閾值集合S ;對于所述截集閾值集合S中的每一個(gè)聚類閾值λ,建立無向圖Ga (V,E),其中,V為m個(gè)用戶的集合,E為相似度sim(i,j)≤λ的邊(i,j)的集合;計(jì)算所述無向圖Ga (V,E)的連通分支,所述連通分支內(nèi)的頂點(diǎn)集合構(gòu)成聚類閾值λ的模糊等價(jià)類。
【文檔編號(hào)】H04L29/08GK104077357SQ201410242692
【公開日】2014年10月1日 申請日期:2014年5月31日 優(yōu)先權(quán)日:2014年5月31日
【發(fā)明者】琚春華, 呂曉敏, 肖亮, 魏建良, 鮑福光 申請人:浙江工商大學(xué)