專利名稱:基于用戶間多相似度的協(xié)同過濾推薦方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種協(xié)同過濾推薦方法,尤指一種基于用戶間多相似度的協(xié)同過濾推薦方法。
背景技術(shù):
互聯(lián)網(wǎng)時代的到來,使人們又增加了一條極為重要的獲取信息的途徑?;ヂ?lián)網(wǎng)技術(shù)的飛速發(fā)展,也帶動了互聯(lián)網(wǎng)上的信息總量以指數(shù)級的速度增長著,從而使得互聯(lián)網(wǎng)信息過載問題日益嚴重。用戶面對浩瀚如煙的海量信息往往變得無所適從,無法快速地從中 找到自己需要的信息。而作為一種能有效改善互聯(lián)網(wǎng)信息過載問題的技術(shù)手段,推薦系統(tǒng)正越來越受到業(yè)界的重視,自從上世紀90年代中期被提出以來,無論在學(xué)術(shù)界還是實際應(yīng)用中都獲得了極大的關(guān)注。推薦系統(tǒng)通過學(xué)習(xí)用戶的行為,了解和掌握用戶的偏好,從而可以更有針對性地向用戶推薦他們可能感興趣的內(nèi)容。在已有的推薦算法中,協(xié)同過濾推薦算法是比較成熟,也是在實際應(yīng)用中使用非常廣泛的一類推薦算法。目前已有的大部分協(xié)同過濾推薦算法都可以分成三步(I)根據(jù)用戶的歷史評分記錄計算用戶之間的評分相似度;(2)從與當(dāng)前用戶相似度最高的用戶中選取若干個作為最近鄰,根據(jù)這些最近鄰對于某一項目的實際評分來預(yù)測當(dāng)前用戶對于該項目的評分;(3)選取預(yù)測評分最高的若干個項目作為推薦結(jié)果提供給當(dāng)前用戶。協(xié)同過濾推薦算法是基于用戶的歷史評分記錄來產(chǎn)生推薦的,從理論上講不需要了解用戶的個人信息,也不需要了解項目的內(nèi)容信息。因此,對于任何種類的用戶和項目,協(xié)同過濾推薦算法都能獲得相近的推薦質(zhì)量,這一特點使它特別適合用來推薦電影、音樂等其他類型的推薦算法很難處理的項目。由此可知,協(xié)同過濾推薦算法的基本思想是通過與當(dāng)前用戶相似的其他用戶對于某一項目的實際評分,來預(yù)測當(dāng)前用戶對于該項目的評分?!跋嗨啤钡挠脩艟褪侵概d趣和口味相似的用戶。因此,相似的用戶在給項目評分時往往會給出相近的評分結(jié)果,而這也是利用協(xié)同過濾進行評分預(yù)測的主要依據(jù)。但是日常經(jīng)驗告訴我們,人們對于不同類型事物的喜好程度往往是不同的。也就是說,同時對某類事物感興趣的兩個人,對于另一類事物的喜好程度有可能就會完全不同。表現(xiàn)在對項目的評分上就是這兩人對于某一類型的項目的評分比較相近,但是對于另一類項目的評分則有可能大相徑庭。因此,從這個角度來看,傳統(tǒng)的協(xié)同過濾推薦算法僅依靠單一的相似度來度量兩個用戶對于所有類型項目的喜好相似程度不是很合理。因此,如何提供一種可有效提高推薦質(zhì)量的協(xié)同過濾推薦方法,以克服現(xiàn)有技術(shù)所存在的問題,便成為目前業(yè)界急待克服的課題。
發(fā)明內(nèi)容
鑒于上述現(xiàn)有技術(shù)的缺點,本發(fā)明的目的在于提供一種基于用戶間多相似度的協(xié)同過濾推薦方法,以克服傳統(tǒng)協(xié)同過濾推薦算法中僅采用單一相似度無法準(zhǔn)確描述用戶間對于不同項目類型喜好的相似程度的問題。為達到上述目的,本發(fā)明所提供的基于用戶間多相似度的協(xié)同過濾推薦方法,其用以將欲推薦的項目的預(yù)測評分提供給第一用戶,該方法包括(1)確定欲推薦的項目所包含的多個類型;(2)定義與第一用戶共同參與評分過的屬于所確定的每個類型的項目的其他至少一個用戶為第二用戶;(3)采用相關(guān)相似性或余弦相似性分別計算第一用戶與多個第二用戶中的每一個第二用戶之間的針對所確定的各個類型的相似度;(4)自該多個第二個用戶中選取K個與第一用戶針對所確定的各個類型的相似度最高的用戶作為最近鄰用戶,并依據(jù)所計算得到的第一用戶與該K個最近鄰用戶相互之間針對所確定的各個類型的相似度,,且搭配依據(jù)該K個最近鄰用戶對屬于所確定的類型的項目的實際評分,分別計算得到第一用戶基于欲推薦的項目所包含的各個類型的多個預(yù)測評分;以及(5)對所計算得到的多個預(yù)測評分取加權(quán)平均值,并將加權(quán)平均的結(jié)果作為欲推薦的項目的預(yù)測評分提供給第一用戶。具體而言,在本發(fā)明的一個實施例中,上述步驟(3)中采用相關(guān)相似性計算第一用戶與其中一個第二用戶之間的針對由步驟(I)所確定的各個類型的相似度的計算公式如下
權(quán)利要求
1.一種基于用戶間多相似度的協(xié)同過濾推薦方法,其用以將欲推薦的項目的預(yù)測評分提供給第一用戶,所述方法包括 (1)確定欲推薦的項目所包含的多個類型; (2)定義與第一用戶共同參與評分過的屬于所確定的每個類型的項目的其他至少一個用戶為第二用戶; (3)采用相關(guān)相似性或余弦相似性分別計算第一用戶與多個第二用戶中的每一個第二用戶之間的針對所確定的各個類型的相似度; (4)自該多個第二個用戶中選取K個與第一用戶針對所確定的各個類型的相似度最高的用戶作為最近鄰用戶,并依據(jù)所計算得到的第一用戶與該K個最近鄰用戶相互之間針對所確定的各個類型的相似度,且搭配依據(jù)該K個最近鄰用戶對屬于所確定的類型的項目的實際評分,分別計算得到第一用戶基于所確定的各個類型的多個預(yù)測評分;以及 (5)對所計算得到的多個預(yù)測評分取加權(quán)平均值,并將加權(quán)平均的結(jié)果作為欲推薦的項目的預(yù)測評分提供給第一用戶。
2.根據(jù)權(quán)利要求I所述的基于用戶間多相似度的協(xié)同過濾推薦方法,其特征在于,所述步驟(3)中采用相關(guān)相似性計算第一用戶與其中一個第二用戶之間的針對由步驟(I)所確定的各個類型的相似度的計算公式如下
3.根據(jù)權(quán)利要求I所述的基于用戶間多相似度的協(xié)同過濾推薦方法,其特征在于,所述步驟(3)中采用余弦相似性計算第一用戶與其中一個第二用戶之間的針對由步驟(I)所確定的各個類型的相似度的計算公式如下
4.根據(jù)權(quán)利要求2或3所述的基于用戶間多相似度的協(xié)同過濾推薦方法,其特征在于,所述步驟(4)中第一用戶基于欲推薦的項目所包含的每個類型的預(yù)測評分采用如下公式計算
5.根據(jù)權(quán)利要求4所述的基于用戶間多相似度的協(xié)同過濾推薦方法,其特征在于,所述步驟(5)中欲推薦的項目的預(yù)測評分采用如下公式計算
全文摘要
一種基于用戶間多相似度的協(xié)同過濾推薦方法,主要是預(yù)先確定欲推薦的項目所包含的多個類型,再分別計算用戶基于這些項目類型的多個預(yù)測評分,更加準(zhǔn)確地描述了用戶間對于不同項目類型喜好的相似程度,之后對所計算得到的多個預(yù)測評分取加權(quán)平均值,以作為欲推薦的項目最后的預(yù)測評分提供予當(dāng)前用戶,有效地提高了預(yù)測評分的準(zhǔn)確性。
文檔編號G06F17/30GK102779131SQ20111012199
公開日2012年11月14日 申請日期2011年5月12日 優(yōu)先權(quán)日2011年5月12日
發(fā)明者程久軍, 范波, 蔣昌俊, 閆春鋼 申請人:同濟大學(xué)