統(tǒng)一通訊錄信息處理方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種統(tǒng)一通訊錄信息處理方法和系統(tǒng),涉及移動互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】。該方法將統(tǒng)一通訊錄抽象為多層圖模型結(jié)構(gòu),將用戶間的聯(lián)系人、好友等關(guān)系疊加為一個統(tǒng)一的網(wǎng)絡(luò)圖,通過連通的多層圖結(jié)構(gòu)解決了傳統(tǒng)的向量空間模型無法表達的友關(guān)系的傳遞性;本發(fā)明的技術(shù)方案利用聯(lián)系人關(guān)聯(lián)因子去除聯(lián)系人關(guān)系圖中可能存在的噪音信息,提出的改進的重啟型隨機游走算法,可以有效的挖掘用戶社交關(guān)系,進而為業(yè)務(wù)交叉營銷推廣和衍生其他服務(wù)提供幫助。
【專利說明】統(tǒng)一通訊錄信息處理方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,特別涉及一種統(tǒng)一通訊錄信息處理方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的爆炸式發(fā)展,與用戶聯(lián)系人、社交關(guān)系相關(guān)的業(yè)務(wù)越來越多,隨之而來無論是好友關(guān)系拓展、用戶群組劃分等業(yè)務(wù)需求都需要對用戶社交關(guān)系進行挖掘;當(dāng)前互聯(lián)網(wǎng)用戶個人社交關(guān)系信息分散,同時缺乏有效手段對用戶個人社交關(guān)系進行深度挖掘,統(tǒng)一通訊錄中蘊含了豐富的用戶社交關(guān)系,對統(tǒng)一通訊錄建模并進行數(shù)據(jù)挖掘勢在必行。
[0003]當(dāng)前的社交關(guān)系挖掘方法大多通過向量空間模型構(gòu)造用戶的特征向量,再計算兩個用戶之間的相似度;還有一些方法利用一度好友進行關(guān)系拓展?,F(xiàn)有的社交關(guān)系挖掘技術(shù)存在以下一些問題:向量空間模型僅僅計算兩個用戶之間的相似度,沒有考慮社交關(guān)系的傳遞性;如QQ圈子等對社交關(guān)系的挖掘僅僅限于一度好友,沒有做更深的分析,導(dǎo)致推薦的好友與用戶實際上并無社交關(guān)系,關(guān)系挖掘的結(jié)果出現(xiàn)大量噪音信息。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術(shù)中存在問題,并因此針對所述問題中的至少一個問題提出了一種新的技術(shù)方案。
[0005]本發(fā)明的一個目的是提供一種用于統(tǒng)一通訊錄信息處理的技術(shù)方案。
[0006]根據(jù)本發(fā)明的第一方面,提供了一種統(tǒng)一通訊錄信息處理方法,包括:
[0007]根據(jù)統(tǒng)一通訊錄中用戶、用戶的聯(lián)系人、用戶的好友信息構(gòu)建多層關(guān)系圖,其中各個用戶、用戶的聯(lián)系人、用戶的好友分別作為多層關(guān)系圖的節(jié)點;
[0008]在多層關(guān)系圖中,在用戶節(jié)點與用戶的聯(lián)系人屬性節(jié)點和用戶的好友屬性節(jié)點之間分別生成邊;將互為好友的用戶的好友屬性節(jié)點間生成邊;將互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點之間根據(jù)聯(lián)系人關(guān)聯(lián)因子確定在用戶的聯(lián)系人屬性節(jié)點間生成邊;
[0009]根據(jù)多層關(guān)系圖的連接關(guān)系生成鄰接矩陣;
[0010]根據(jù)初始概率矩陣基于鄰接矩陣通過重啟型隨機游走算法確定穩(wěn)定狀態(tài)的概率矩陣。
[0011]可選地,聯(lián)系人關(guān)聯(lián)因子根據(jù)如下公式確定:
【權(quán)利要求】
1.一種統(tǒng)一通訊錄信息處理方法,其特征在于,包括: 根據(jù)統(tǒng)一通訊錄中用戶、用戶的聯(lián)系人、用戶的好友信息構(gòu)建多層關(guān)系圖,其中各個用戶、用戶的聯(lián)系人、用戶的好友分別作為所述多層關(guān)系圖的節(jié)點; 在所述多層關(guān)系圖中,在用戶節(jié)點與所述用戶的聯(lián)系人屬性節(jié)點和所述用戶的好友屬性節(jié)點之間分別生成邊;將互為好友的用戶的好友屬性節(jié)點間生成邊;將互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點之間根據(jù)聯(lián)系人關(guān)聯(lián)因子確定在用戶的聯(lián)系人屬性節(jié)點間生成邊; 根據(jù)所述多層關(guān)系圖的連接關(guān)系生成鄰接矩陣; 根據(jù)初始概率矩陣基于所述鄰接矩陣通過重啟型隨機游走算法確定穩(wěn)定狀態(tài)的概率矩陣。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述聯(lián)系人關(guān)聯(lián)因子根據(jù)如下公式確定: (ηΑ.Ι?) = ^('{Α,'^]*Ν C(A).C(B) 其中,Α、Β為用戶節(jié)點,C(A H B)為A和B的共同聯(lián)系人的數(shù)量,C㈧、C⑶為A、B各自的聯(lián)系人數(shù)目,N為統(tǒng)一通訊錄中總共的聯(lián)系人數(shù)目。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述將互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點之間根據(jù)聯(lián)系人關(guān)聯(lián)因子確定在用戶的聯(lián)系人屬性節(jié)點間生成邊包括: 確定互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點間的聯(lián)系人關(guān)聯(lián)因子; 如果所述聯(lián)系人關(guān)聯(lián)因子大于設(shè)定閾值,則在將互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點之間生成邊。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述多層關(guān)系圖的連接關(guān)系生成鄰接矩陣包括: 根據(jù)所述多層關(guān)系圖的連接關(guān)系生成所述鄰接矩陣,其中,對于用戶節(jié)點與所述用戶的聯(lián)系人屬性節(jié)點以及所述用戶的好友屬性節(jié)點之間的邊的權(quán)重為1,對于好友屬性節(jié)點之間的邊的權(quán)重為1,對于聯(lián)系人屬性節(jié)點之間的邊的權(quán)重為歸一化的聯(lián)系人關(guān)聯(lián)因子; 將所述鄰接矩陣按列進行歸一化。
5.根據(jù)權(quán)利要求1或4所述的方法,其特征在于,所述根據(jù)初始概率矩陣基于所述鄰接矩陣通過重啟型隨機游走算法確定穩(wěn)定狀態(tài)的概率矩陣包括: 生成初始矩陣μ ^為n*i階矩陣,令種子用戶節(jié)點初始值為1,其他結(jié)點初始值為O ; 初始化μ = μ ο; 進行如下迭代: μ ?+ι=(?-λ )Μμ t+A μ 0,其中0〈 λ〈I, M為鄰接矩陣,t為迭代次數(shù); 直到穩(wěn)定退出迭代,獲得穩(wěn)定狀態(tài)的概率矩陣μ*。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括: 根據(jù)所述穩(wěn)定狀態(tài)的概率舉證計算種子用戶和其他用戶之間的緊密程度。
7.一種統(tǒng)一通訊錄信息處理系統(tǒng),其特征在于,包括: 關(guān)系圖節(jié)點生成模塊,用于根據(jù)統(tǒng)一通訊錄中用戶、用戶的聯(lián)系人、用戶的好友信息構(gòu)建多層關(guān)系圖,其中各個用戶、用戶的聯(lián)系人、用戶的好友分別作為所述多層關(guān)系圖的節(jié)占.關(guān)系圖邊生成模塊,用于在所述多層關(guān)系圖中,在用戶節(jié)點與所述用戶的聯(lián)系人屬性節(jié)點和所述用戶的好友屬性節(jié)點之間分別生成邊;將互為好友的用戶的好友屬性節(jié)點間生成邊;將互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點之間根據(jù)聯(lián)系人關(guān)聯(lián)因子確定在用戶的聯(lián)系人屬性節(jié)點間生成邊; 鄰接矩陣生成模塊,用于根據(jù)所述多層關(guān)系圖的連接關(guān)系生成鄰接矩陣; 概率矩陣確定模塊,用于根據(jù)初始概率矩陣基于所述鄰接矩陣通過重啟型隨機游走算法確定穩(wěn)定狀態(tài)的概率矩陣。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述聯(lián)系人關(guān)聯(lián)因子根據(jù)如下公式確定:
其中,A、B為用戶節(jié)點,C(A Π B)為A和B的共同聯(lián)系人的數(shù)量,C㈧、C⑶為A、B各自的聯(lián)系人數(shù)目,N為統(tǒng)一通訊錄中總共的聯(lián)系人數(shù)目。
9.根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征在于,所述關(guān)系圖邊生成模塊包括: 特征邊生成單元,用于在用戶節(jié)點與所述用戶的聯(lián)系人屬性節(jié)點和所述用戶的好友屬性節(jié)點之間分別生成邊; 好友邊生成單元,用于將互為好友的用戶的好友屬性節(jié)點間生成邊; 聯(lián)系人邊生成單元,用于確定互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點間的聯(lián)系人關(guān)聯(lián)因子,如果所述聯(lián)系人關(guān)聯(lián)因子大于設(shè)定閾值,則在將互為聯(lián)系人的用戶的聯(lián)系人屬性節(jié)點之間生成邊。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述鄰接矩陣生成模塊根據(jù)所述多層關(guān)系圖的連接關(guān)系生成所述鄰接矩陣,其中,對于用戶節(jié)點與所述用戶的聯(lián)系人屬性節(jié)點以及所述用戶的好友屬性節(jié)點之間的邊的權(quán)重為1,對于好友屬性節(jié)點之間的邊的權(quán)重為1,對于聯(lián)系人屬性節(jié)點之間的邊的權(quán)重為歸一化的聯(lián)系人關(guān)聯(lián)因子;將所述鄰接矩陣按列進行歸一化; 或 所述概率矩陣確定模塊用于生成初始矩陣Po,為N*1階矩陣,令種子用戶節(jié)點初始值為I,其他結(jié)點初始值為O ;初始化μ = μ (!,進行如下迭代: μ ?+ι=(?-λ )Μμ t+A μ 0,其中0〈 λ〈I, M為鄰接矩陣,t為迭代次數(shù); 直到穩(wěn)定退出迭代,獲得穩(wěn)定狀態(tài)的概率矩陣μ*。
【文檔編號】G06F17/30GK104182422SQ201310202471
【公開日】2014年12月3日 申請日期:2013年5月28日 優(yōu)先權(quán)日:2013年5月28日
【發(fā)明者】康為 申請人:中國電信股份有限公司