一種基于興趣群組的群體推薦方法
【專利摘要】一種基于興趣群組的群體推薦方法涉及信息【技術領域】。目前各個網站主要進行的是個性化推薦,為每個用戶量身定做推薦內容,這樣隨著用戶的增多,推薦服務器的計算壓力比較大,難以實時推薦。本發(fā)明先根據用戶的興趣愛好將他們分配到興趣群組中,每個興趣群組用一個虛擬用戶代表這個興趣群組的愛好。為群組內用戶的推薦都使用同一個興趣群組的推薦列表。所以計算量顯著減少。在推薦系統(tǒng)中存在數據稀疏性問題,增加了項目評分支持度作為衡量某個項目的評分可信程度標準。本發(fā)明增強推薦結果的多樣性,同時也能顯著減少產生推薦結果的計算量,提高系統(tǒng)的可擴展性。
【專利說明】一種基于興趣群組的群體推薦方法
【技術領域】:
[0001] 本發(fā)明涉及信息【技術領域】,尤其涉及一種基于興趣群組的群體推薦方法。
【背景技術】:
[0002] 隨著互聯網技術的高速發(fā)展和普及,互聯網用戶群體和以互聯網為載體的各種網 絡信息服務和應用急劇增加。面對海量的信息資源,用戶很難在有限時間內通過手工方式 在如此巨大的信息空間中獲得符合其自身需求的信息,而信息提供方也很難在服務的過 程中挖掘用戶的使用習慣,從而進一步改善自身的服務,這也就產生了所謂的"信息過載" 問題。為了解決信息過載問題,傳統(tǒng)的信息服務采用了門戶網站(Yahoo !)、搜索引擎 (Google)和定制過濾內容等方法,但當用戶的需求十分模糊時,這些方法也無法為用戶提 供滿意服務。在這種背景下,推薦系統(tǒng)技術應運而生,它被認為是當前解決信息過載問題最 有效的工具之一。推薦系統(tǒng)可以依據用戶的歷史興趣偏好,通過計算用戶模型與項目的相 似度來為某個用戶產生個性化推薦。協(xié)同過濾技術是迄今為止最為成功的推薦技術,已經 廣泛應用于諸多系統(tǒng)中。在協(xié)同過濾推薦方法中,對于m*n維的用戶-項目評價矩陣,尋找 最近鄰居的算法時間復雜度將達到〇(m*n 2)。因此,當用戶和項目規(guī)模十分巨大時,計算復 雜度的增加都將嚴重影響推薦的實時性?,F有的推薦系統(tǒng)通常采用降維、聚類、概率、數據 集縮減、線性模型等技術對推薦系統(tǒng)的可擴展性進行改善。這些優(yōu)化方法通常采用離線計 算、定期更新的推薦模式,但這種離線計算方法不能充分利用最新數據以體現用戶興趣偏 好的動態(tài)變化。
[0003] 針對現有技術的上述缺陷,本發(fā)明提供一種基于興趣群組的群體推薦方法,使用 興趣相似的群體推薦代替用戶的個性化推薦,群體推薦列表既能夠反映用戶的興趣,增強 推薦結果的多樣性,同時也能顯著減少產生推薦結果的計算量,提高系統(tǒng)的可擴展性。
【發(fā)明內容】
:
[0004] 本發(fā)明提供
[0005] -種基于興趣群組的群體推薦方法,其特征在于包括如下步驟:
[0006] 1)根據群組內用戶成員的特征表示,計算產生群組虛擬用戶的特征表示,群組虛 擬用戶的特征表示代表了該群組的興趣;
[0007] 2)通過計算群組虛擬用戶和待加入群組用戶特征表示的特征相似度,形成若干興 趣群組;
[0008] 3)改進基于用戶的協(xié)同過濾方法,增加用戶評分有效性,為興趣群組內用戶生成 用戶個體評分;
[0009] 4)依據群組內用戶個體評分,產生該興趣群組的Τορ-κ推薦列表;當需要為用戶 產生推薦時,使用該用戶所在的興趣群組推薦列表代替用戶的個性化推薦列表。
[0010] 步驟1)和2)具體如下:
[0011] 步驟100 :根據用戶對項目評分,計算用戶的興趣特征;選取用戶評分的前k個項 目作為代表用戶的興趣特征;定義I = <ii,...,in>為項目集合;用戶P的興趣特征表示為 用戶對項目評分的集合:
【權利要求】
1. 一種基于興趣群組的群體推薦方法,其特征在于包括如下步驟: 1) 根據群組內用戶成員的特征表示,計算產生群組虛擬用戶的特征表示,群組虛擬用 戶的特征表示代表了該群組的興趣; 2) 通過計算群組虛擬用戶和待加入群組用戶特征表示的特征相似度,形成若干興趣群 組; 3) 改進基于用戶的協(xié)同過濾方法,增加用戶評分有效性,為興趣群組內用戶生成用戶 個體評分; 4) 依據群組內用戶個體評分,產生該興趣群組的Top-K推薦列表;當需要為用戶產生 推薦時,使用該用戶所在的興趣群組推薦列表代替用戶的個性化推薦列表。
2. 根據權利要求1所述的一種基于興趣群組的群體推薦方法,其特征在于: 步驟1)和2)具體如下:步驟100 :根據用戶對項目評分,計算用戶的興趣特征;選取用 戶評分的前k個項目作為代表用戶的興趣特征;定義I =〈ip . . .,in>為項目集合;用戶ρ 的興趣特征表示為用戶對項目評分的集合: Κρ=^^Γρ·, =}U^J G ^-n,m = n-k + \,.. ,η 其中,為用戶P對項目L的評分,r(m)為用戶p的所有項目評分的次序統(tǒng)計量;步 驟200 :根據用戶的興趣特征和興趣群組的群組特征,選擇與其興趣相近的興趣群組,將用 戶加入該組中,同時進行興趣群組的維護,包括興趣群組的群組特征向量的更新,興趣組的 分裂與合并;包括: 步驟201 :判斷用戶是否為推薦系統(tǒng)中的第一個用戶,確定所述當前用戶是推薦系統(tǒng) 第一個用戶,執(zhí)行步驟202 ;否則執(zhí)行步驟203 ; 步驟202 :建立新的興趣群組;為該群組產生新的群組編號; 步驟203 :計算所述當前用戶的興趣特征與推薦系統(tǒng)中已有興趣群組的群組特征的相 似度,并且相似度大于閾值S,δ取值為〇. 15-0. 3 ; 采用Pearson相關系數度量方法,則用戶a與群組虛擬用戶b的相似度計算方法如下: .,ΣρεΡ(Γα,ρ-0(}1,ρ-}?) snn(a,o) - t . - 一 y/XpcP^-p ^rbf 其中p= {Pi,......,pm}為m個項目的集合,ra,p為用戶a對項目p的評分,r b,p為用戶 b對項目p的評分,?和?分別為用戶a和群組虛擬用戶b對所有打過分項目的平均分; 步驟204 :在所述當前用戶的興趣特征與興趣群組的虛擬用戶特征相似度大于閾值δ 的興趣群組中,選擇相似度最高的興趣群組,作為所述當前用戶即將加入的興趣群組; 步驟205 :當有用戶加入或者離開興趣群組時,需要對興趣群組進行維護,包括: 步驟205a :判斷當前興趣群組的成員變化,如果有新用戶成員加入,執(zhí)行步驟205b ;如 果有用戶成員退出,執(zhí)行步驟205d ; 步驟205b :當有新的用戶加入時,判斷當前興趣群組內成員數量是否超過閾值 MaxNumber ;為了避免群組合并后形成的新組再次分裂,群組分裂值MaxNumber和群組合 并值MinNumber應滿足MaxNumber2*MinNumber ;如果當前興趣群組成員數量超過閾值 MaxNumber,執(zhí)行步驟205c,否則執(zhí)行步驟205f ; 步驟205c :根據用戶的興趣特征,使用K-means聚類算法,將原有興趣群組內用戶重新 聚類成2個新的興趣群組; 步驟205d:當有新的用戶退出時,判斷當前興趣群組內成員數量是否小于閾值 MinNumber ;如果當前興趣群組成員數量小于閾值MinNumber,執(zhí)行步驟205e,否則執(zhí)行步 驟 205f ; 步驟205e :通過計算興趣群組之間的虛擬用戶特征相似度,將該興趣群組成員合并到 與其興趣特征相似度最高的興趣群組中; 步驟205f :計算新生成興趣群組的虛擬用戶興趣特征;采用平均值策略,群組g對項目 i的評分為:
其中,rui為用戶u對項目i的評分,|G」為群組G中對項目i進行過評分的用戶數量; 則群組G的興趣特征表示為:
其中,為群組G對項目L的評分,re(m)為群組G的所有項目評分的次序統(tǒng)計量。
3.根據權利要求1所述的一種基于興趣群組的群體推薦方法,其特征在于: 步驟3)具體如下: 步驟301 :以用戶所在興趣群組的成員為鄰居,采用基于用戶的協(xié)同過濾方法,計算興 趣群組的用戶相似度矩陣;采用Person相關系數作為相似度計算標準; 步驟302 :用戶u對項目i的評分支持度計算法方法如下:
其中,B表示對項目i評分過的用戶集合,武表示用戶u所在興趣群組的用戶集合; 步驟303 :計算興趣群組內用戶對未評分項目的評分值,計算方法如下:
其中,?和f分別表示用戶u和用戶u'對所有項目評分的平均值,^^表示用戶u'對 項目i的評分,UserSim(u, u')表示用戶u與用戶u'的相似度,采用Pearson相關系數度 量方法; 步驟304 :結合項目評分支持度,計算興趣群組內用戶對未評分項目的評分值,計算方 法如下:
其中,%,ω2是權重系數,且ω?,ω2彡〇, ω?+ω2 = 1。
【文檔編號】G06F17/30GK104050258SQ201410265932
【公開日】2014年9月17日 申請日期:2014年6月15日 優(yōu)先權日:2014年6月15日
【發(fā)明者】王永濱, 馮爽, 蔣偉 申請人:中國傳媒大學