一種基于用戶簽到相似度的好友推薦系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于用戶簽到相似度的好友推薦系統(tǒng),該系統(tǒng)包括興趣推薦模塊、相似度計算模塊和主題提取模塊。首先經(jīng)主題提取模塊從LBSN數(shù)據(jù)庫中取得以往用戶的簽到記錄,并采用主題提取算法獲得提取用戶簽到記錄中潛在的主題;然后利用主題提取模塊提取的潛在主題,調(diào)用相似度計算模塊的計算方法分別計算候選用戶集中每個用戶在每個主題下與請求用戶的相似度;然后每個用戶將每個主題下的相似度求和得到最終的相似度。最后由興趣推薦模塊根據(jù)請求用戶的請求參數(shù)設(shè)置確定最終的推薦好友,并返回給請求用戶。
【專利說明】一種基于用戶簽到相似度的好友推薦系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種好友推薦系統(tǒng),更特別地說,是指一種通過用戶以往的簽到記錄進行計算用戶的相似度,并根據(jù)用戶的相似度進行好友推薦的系統(tǒng)。本發(fā)明系統(tǒng)屬于基于位置的社交網(wǎng)中的好友推薦【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]社交網(wǎng)絡(luò)服務(wù)提供商針對不同的群眾,有著不同的定位。比如說最初的社交網(wǎng)站是用于交友,例如美國的Friendster,Linkedin。也有網(wǎng)站專門為商務(wù)人士交友提供服務(wù),比如說中國的天極網(wǎng),德國的0PENBC。有些為商務(wù)人士提供的社交網(wǎng)站同時也兼具求職招聘的功能。不過盈利前景最大的網(wǎng)站還是婚戀交友網(wǎng)站。這些網(wǎng)站都已經(jīng)擁有上百萬用戶,盈利可觀。另外就是面向年輕人及大學(xué)生的SNS (Social Networking Services)網(wǎng)站也比較受歡迎,比如說美國的Myspace就被默多克的新聞集團高價收購。針對美國大學(xué)生的社交網(wǎng)站facebook在美國大學(xué)生中非常流行(如今facebook的用戶已更為廣泛),中國的模仿者人人網(wǎng)也被千橡互動公司收購,后者是中國很具人氣的網(wǎng)站貓撲的母公司。
[0003]目前,基于位置的社交網(wǎng)(Location-based Social Networking Services, LBSN)越來越流行。由于快速的第四代移動通信網(wǎng)絡(luò)的快速發(fā)展,以及對地圖服務(wù)和內(nèi)嵌GPS模塊智能手機強大的接口支持,它很容易為移動用戶識別他們的位置,并分享他們在LBSN。在一個LBSN中,用戶可以發(fā)現(xiàn)和創(chuàng)建興趣點(point of interest, P0I),可以在他們的當前位置進行簽到,發(fā)表評論和意見以及添加好友等。因此,LBSN,如Foursquare、FacebookPlaces、新浪微博等,已經(jīng)采取了不同的機制來吸引用戶,并激勵簽到用戶BUb分享他們的簽到信息。并且,已經(jīng)有一些研究開始利用這些有用戶產(chǎn)生的帶有地理標簽簽到信息。因為這些數(shù)據(jù)可以允許研究者可以以數(shù)據(jù)驅(qū)動的方式去分析社會層次的利益問題,并且可以根據(jù)簽到信息發(fā)現(xiàn)用戶的移動模式,預(yù)測好友關(guān)系,更好的理解城市的不同方面。
[0004]基于用戶的地理位置進行好友預(yù)測或推薦的主要有以下兩種方式:第一種方式是利用用戶產(chǎn)生的GPS軌跡,通過計算GPS軌跡的相似度,表示用戶的相似度,進而根據(jù)用戶的相似度進行好友推薦;第二種方式是通過用戶在某些興趣點共同簽到進行推薦好友。第一種方式,通過計算GPS軌跡相似度,進行好友推薦的方法在LBSN中不在適用,因為GPS軌跡是一條連續(xù)的軌跡,而LBSN中產(chǎn)生的簽到數(shù)據(jù)是一種離散的軌跡。第二種方式,這是以興趣點為中心進行好友推薦的,即如果用戶在相同的興趣點簽到,則說明推薦用戶Rl具有相同的愛好,進而推薦給請求用戶Uu0這種方式,沒有充分考慮用戶整體的興趣愛好或行為模式。
【發(fā)明內(nèi)容】
[0005]針對以上兩種好友推薦方式的不足,本發(fā)明提出了一種基于用戶簽到相似度的好友推薦系統(tǒng),綜合考慮用戶在一段時間內(nèi)所有的簽到記錄,并利用主題模型進行挖掘簽到用戶BUb記錄中的潛在主題,然后根據(jù)提取的潛在的主題計算用戶的相似度,最后,將相似度最高的候選用戶CU。推薦給將請求用戶uu。
[0006]本發(fā)明的一種基于用戶簽到相似度的好友推薦系統(tǒng),該好友推薦系統(tǒng)包括有用戶(100 )、推薦系統(tǒng)(200 )和LBSN數(shù)據(jù)庫(300 );其中:所述的推薦系統(tǒng)(200 )包括有興趣推薦模塊(201)、相似度計算模塊(202)和主題提取模塊(203);
[0007]用戶(100)將自己的推薦請求
【權(quán)利要求】
1.一種基于用戶簽到相似度的好友推薦系統(tǒng),該好友推薦系統(tǒng)包括有用戶(100)、推薦系統(tǒng)(200 )和LBSN數(shù)據(jù)庫(300 );其特征在于:所述的推薦系統(tǒng)(200 )包括有興趣推薦模塊(201)、相似度計算模塊(202)和主題提取模塊(203); 用戶(100)將自己的推薦請求I) =,disl)發(fā)送給推薦系統(tǒng)中的興趣推薦模塊(201);所述推薦請求0 =中的Uu表示請求用戶,u表示請求用戶Uu的標識號;表示好友個數(shù);dist表示簽到距離閾值; LBSN數(shù)據(jù)庫(300)—方面用于為主題提取模塊(203)提供簽到用戶BUb ;另一方面用于為相似度計算模塊(202)提供簽到用戶興趣?,.),; 興趣推薦模塊(201)第一方面用于接收用戶(100)發(fā)送的推薦請求 興趣推薦模塊(201)第二方面將= \pit,kVti 中的相似度計算請求SQ = {I!",dist}發(fā)送給相似度計算模塊(202); 興趣推薦模塊(201)第三方面用于接收相似度計算模塊(202)發(fā)送的帶有相似度的候選用戶集合CR; 興趣推薦模塊(201)第四方面依據(jù)好友個數(shù)對帶有相似度的候選用戶集合CR進行相似度高低排序,得到所有推薦用戶RUp并將前個推薦用戶Rl返回給用戶(100); 主題提取模塊(203)第一方面依據(jù)興趣截取時間CPT從LBSN數(shù)據(jù)庫(300)中檢索與之相匹配的簽到用戶BUb ; 主題提取模塊(203)第二方面依據(jù)預(yù)設(shè)主題數(shù)量t和興趣點數(shù)量V,運用隱含狄利克雷分配主題模型,得到主題集合TH =XMKh.為~}; 相似度計算模塊(202)第一方面用于接收興趣推薦模塊(201)輸出的相似度計算請求SQ = {UUJ dist}; 相似度計算模塊(202)第二方面從LBSN數(shù)據(jù)庫(300)中提取出簽到用戶BUb的簽到興趣點信息IWm4 ,即PMmtf ={pmfu\pmT\-rspmlu,'}i 相似度計算模塊(202)第三方面用于接收主題提取模塊(203)輸出的主題集合TH,即TH = [th1} I 相似度計算模塊(202 )第四方面對所述主題集合TH進行權(quán)重處理,得到主題權(quán)重向量WTH ; 相似度計算模塊(202)第五方面依據(jù)興趣點的地理位置對主題集合TH中的每一個主題進行最短距離計算,得到主題集合TH下的主題最短距離集合DTH ;相似度計算模塊(202)第六方面依據(jù)DTH計算兩個簽到用戶之間的距離均值
2.根據(jù)權(quán)利要求1所述的一種基于用戶簽到相似度的好友推薦系統(tǒng),其特征在于:所述的用戶(100)在不同的時序處理階段中有不同的身份,包括有請求用戶Uu、簽到用戶BUb、推薦用戶RUp或者候選用戶CU。。
3.根據(jù)權(quán)利要求1所述的一種基于用戶簽到相似度的好友推薦系統(tǒng),其特征在于:所述的LBSN數(shù)據(jù)庫(300)里不但包含有SNS,至少增加了用戶(100)的簽到記錄,以及興趣點信息 PM = {pm” pm2,…,pmj。
4.根據(jù)權(quán)利要求1所述的一種基于用戶簽到相似度的好友推薦系統(tǒng),其特征在于:所述基于用戶簽到相似度的好友推薦系統(tǒng)進行的推薦處理步驟為: 步驟一:請求用戶發(fā)出請求信息 任意請求用戶Uu將請求信息
【文檔編號】G06F17/30GK103488678SQ201310336664
【公開日】2014年1月1日 申請日期:2013年8月5日 優(yōu)先權(quán)日:2013年8月5日
【發(fā)明者】李巍, 蔣江濤, 李云春, 李國君 申請人:北京航空航天大學(xué)