两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法

文檔序號(hào):6543309閱讀:280來(lái)源:國(guó)知局
一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法,本發(fā)明在基于用戶(hù)和基于項(xiàng)目的情況下,對(duì)皮爾遜相似性和多項(xiàng)測(cè)度相似性做了對(duì)比,多向測(cè)度相似性的結(jié)果比皮爾遜相似性有顯著提高,取得了更好的推薦精度。接著,在基于用戶(hù)多向測(cè)度相似性的基礎(chǔ)上,進(jìn)一步考慮用戶(hù)對(duì)屬性的偏好作為相似性的一部分,推薦精度有一定提高。
【專(zhuān)利說(shuō)明】一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種信息推薦方法,尤其涉及一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法。

【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)快速發(fā)展,網(wǎng)絡(luò)中的資源數(shù)量以指數(shù)級(jí)增長(zhǎng),用戶(hù)不得不面對(duì)浩如煙海的網(wǎng)絡(luò)信息,加大了在其中尋找對(duì)用戶(hù)有益信息的難度,這就是信息過(guò)載。推薦系統(tǒng)作為一種信息過(guò)濾手段,可以根據(jù)用戶(hù)的興趣給用戶(hù)提供個(gè)性化推薦,是當(dāng)前解決上述問(wèn)題的有效方法。在網(wǎng)絡(luò)時(shí)代之前,人們往往會(huì)從與自己有相同喜好的同伴那里獲得各種建議以幫助自己決策,這就是協(xié)同過(guò)濾的出發(fā)點(diǎn)。協(xié)同過(guò)濾通過(guò)計(jì)算用戶(hù)或項(xiàng)目間的相似性,找出有相似偏好的用戶(hù)或相似的項(xiàng)目,預(yù)測(cè)目標(biāo)用戶(hù)的喜好,進(jìn)而作出推薦,獨(dú)立于項(xiàng)目本身的內(nèi)容,且具有易于實(shí)現(xiàn)的優(yōu)點(diǎn),目前已取得廣泛應(yīng)用。推薦系統(tǒng)的其他方法還有貝葉斯網(wǎng)絡(luò)模型,條件概率,基于圖技術(shù)的推薦算法等。與此同時(shí),數(shù)據(jù)存儲(chǔ)的方便導(dǎo)致網(wǎng)絡(luò)中的數(shù)據(jù)不斷增長(zhǎng),每一個(gè)用戶(hù)不可能對(duì)眾多的項(xiàng)目都有評(píng)分信息,進(jìn)而使用戶(hù)對(duì)項(xiàng)目的評(píng)分矩陣高度稀疏,傳統(tǒng)協(xié)同過(guò)濾相似性計(jì)算方法也逐漸暴露了其局限性,無(wú)法適應(yīng)在大數(shù)據(jù)時(shí)代下的要求,在數(shù)據(jù)稀疏情況下推薦效果不佳,我們?cè)诤竺娴慕榻B中會(huì)分析傳統(tǒng)相似性計(jì)算方法存在的弊端。另外,對(duì)于新加入系統(tǒng)的用戶(hù),其對(duì)項(xiàng)目的評(píng)分太少,以至于無(wú)法提供使推薦系統(tǒng)分析出該用戶(hù)的偏好情況的信息,系統(tǒng)不能對(duì)該用戶(hù)做出準(zhǔn)確的推薦,這就是新用戶(hù)問(wèn)題。對(duì)于新加入系統(tǒng)的項(xiàng)目,用戶(hù)對(duì)該項(xiàng)目評(píng)分太少,系統(tǒng)也不能將這個(gè)項(xiàng)目推薦給用戶(hù),這就是新項(xiàng)目問(wèn)題。新用戶(hù)和新項(xiàng)目問(wèn)題都屬于冷啟動(dòng)問(wèn)題[1°]。由于存在這些問(wèn)題,一些學(xué)者提出種種改進(jìn)措施,文獻(xiàn)【I】提出基于項(xiàng)目的項(xiàng)目評(píng)分相似性和項(xiàng)目屬性相似性自適應(yīng)權(quán)值加權(quán)結(jié)合,以解決新項(xiàng)目問(wèn)題,但不能解決新用戶(hù)問(wèn)題。文獻(xiàn)【2】提出基于閾值的對(duì)余弦相似性的改進(jìn),該方法可以提高推薦的多樣性,但不能保證推薦準(zhǔn)確度。文獻(xiàn)【3】提出基于交疊的鄰居集選擇方法,該方法要求設(shè)置合適的參數(shù)。文獻(xiàn)【4】提出基于用戶(hù)的項(xiàng)目評(píng)分池方法,根據(jù)用戶(hù)對(duì)項(xiàng)目的評(píng)分將用戶(hù)分成多個(gè)獨(dú)立子集分別對(duì)總評(píng)分做出貢獻(xiàn),該方法一定程度上提高了推薦準(zhǔn)確度,但并不能解決數(shù)據(jù)稀疏問(wèn)題,而且需要調(diào)整的參數(shù)眾多。


【發(fā)明內(nèi)容】

[0003]因此,本文提出一種基于多向測(cè)度和項(xiàng)目屬性的相似性計(jì)算方法,利用用戶(hù)對(duì)項(xiàng)目屬性的偏好程度和多向測(cè)度相似性計(jì)算方法加權(quán)結(jié)合,得到用戶(hù)間相似性,最后生成推薦。實(shí)驗(yàn)表明該方法較傳統(tǒng)相似性計(jì)算方法具有了更好的準(zhǔn)確度,在數(shù)據(jù)稀疏的情況下,結(jié)果仍較好。過(guò)程如下:
[0004]讀入用戶(hù)-項(xiàng)目評(píng)分矩陣和項(xiàng)目屬性矩陣。項(xiàng)目屬性矩陣是n*k矩陣,η是項(xiàng)目數(shù),k是屬性數(shù),元素s(i, j)=l表示項(xiàng)目i有屬性j, s(i, j)=0表示項(xiàng)目i沒(méi)有屬性j。
[0005]進(jìn)一步的,計(jì)算每個(gè)用戶(hù)的平均評(píng)分和每個(gè)項(xiàng)目的平均評(píng)分。則進(jìn)-步的,按公式

【權(quán)利要求】
1.一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法,讀入用戶(hù)-項(xiàng)目評(píng)分矩陣和項(xiàng)目屬性矩陣。項(xiàng)目屬性矩陣是n*k矩陣,η是項(xiàng)目數(shù),k是屬性數(shù),元素S (i, j) =1表示項(xiàng)目i有屬性j,s(i, j)=0表示項(xiàng)目i沒(méi)有屬性j。
2.一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法,計(jì)算每個(gè)用戶(hù)的平均評(píng)分和每個(gè)項(xiàng)目的平均評(píng)分。
3.一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法,按公式
計(jì)算用戶(hù)對(duì)項(xiàng)目屬性的評(píng)分,并計(jì)算出每個(gè)用戶(hù)對(duì)項(xiàng)目屬性的平均評(píng)分和每個(gè)屬性的平均評(píng)分,其中,sum(u,j)表示用戶(hù)u對(duì)具有屬性j的項(xiàng)目的總評(píng)分,num (u, j)表示用戶(hù)u對(duì)有屬性j的項(xiàng)目的評(píng)分次數(shù)。
4.一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法,按公式
計(jì)算用戶(hù)對(duì)項(xiàng)目的多向測(cè)度相似度simi,用戶(hù)對(duì)項(xiàng)目屬性的多向
測(cè)度相似度sims,其中,
分別表示用
戶(hù)U對(duì)項(xiàng)目i的評(píng)分和用戶(hù)V對(duì)項(xiàng)目i的評(píng)分,ξ,€分別表示用戶(hù)U和用戶(hù)V的平均評(píng)分。
5.基于權(quán)利要求4所屬的公式sim(U,V)以及多向測(cè)度相似度sims,將simi和sims加




權(quán)結(jié)合,權(quán)重為E,對(duì)simi和sims進(jìn)行歸一化,歸一化公式為
其中max,





min分別是simi中的最大相似度,最小相似度。同理,對(duì)sims歸一化,最后得到混合相似度sim, sim=simi+E*sims0
6.一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法,獲得近鄰。采用Top-k方法選擇前k個(gè)與目標(biāo)用戶(hù)相似度最大的用戶(hù)作為目標(biāo)用戶(hù)近鄰。
7.一種基于多向測(cè)度和屬性相似度的混合協(xié)同過(guò)濾方法,預(yù)測(cè)評(píng)分按公式
計(jì)算用戶(hù)U對(duì)待測(cè)項(xiàng)目評(píng)分i的預(yù)測(cè)評(píng)分,其中分別是用戶(hù)U,V的平均分,rVii表示用戶(hù)V對(duì)項(xiàng)目i的評(píng)分,Piu是用戶(hù)u對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分,Neighbor(u)表示用戶(hù)u的近鄰集合。
【文檔編號(hào)】G06F19/00GK104077468SQ201410141421
【公開(kāi)日】2014年10月1日 申請(qǐng)日期:2014年4月9日 優(yōu)先權(quán)日:2014年4月9日
【發(fā)明者】貢曉斌 申請(qǐng)人:丹陽(yáng)市天恒信息科技有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
奇台县| 毕节市| 平邑县| 泸州市| 海门市| 龙游县| 油尖旺区| 岑溪市| 青海省| 滦平县| 安平县| 苍南县| 凌云县| 梁山县| 大荔县| 连南| 遂平县| 罗甸县| 新营市| 大英县| 库伦旗| 保定市| 阿克陶县| 大庆市| 莒南县| 铜川市| 海兴县| 龙泉市| 剑河县| 衡山县| 澎湖县| 东山县| 西安市| 海原县| 泽州县| 盘山县| 巴林右旗| 天津市| 洛宁县| 松潘县| 成都市|