一種用戶傳播影響力的確定方法和裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及計算機技術領域,具體涉及一種用戶傳播影響力的確定方法和裝置。
【背景技術】
[0002] 社交網(wǎng)絡的發(fā)展對人類生活有著極大影響,無論是交友,工作還是購物,人們已經(jīng) 習慣依賴社交網(wǎng)絡來獲取信息。具有高影響力的用戶在社交網(wǎng)絡中可以作為信息傳播源 頭,促進社交網(wǎng)絡上有效信息的傳播。為了讓信息在網(wǎng)絡中傳播得更快,范圍更廣,關鍵就 在于尋找到最具有傳播影響力的節(jié)點。由于網(wǎng)絡中總用戶數(shù)量巨大,網(wǎng)絡結構復雜,網(wǎng)絡中 大部分節(jié)點的傳播能力極為有限,尋找有高傳播影響力的用戶一直是一大挑戰(zhàn)。
[0003] 處于網(wǎng)絡中心的節(jié)點具有更高的傳播影響力。比如一個度值較小的處于網(wǎng)絡中心 的節(jié)點比一個度值較大的處于網(wǎng)絡邊緣的節(jié)點更有影響力。例如圖1所示,圓圈表示一個傳 播網(wǎng)絡,處于圓圈L3內(nèi)的黑點表示處于網(wǎng)絡中心的節(jié)點,處于圓圈L1以內(nèi)、圓圈L2以外的黑 點表示處于網(wǎng)絡邊緣的節(jié)點,處于網(wǎng)絡中心的節(jié)點比處于網(wǎng)絡邊緣的節(jié)點更有影響力。節(jié) 點在網(wǎng)絡中的位置可以用節(jié)點的核數(shù)(用符號(^表示)來刻畫。現(xiàn)有技術中,計算節(jié)點的核 數(shù)可以使用k-殼分解(英文名稱:k-core Decomposition)法,將外圍的節(jié)點層層剝?nèi)ィ詈?得到處于內(nèi)層的節(jié)點,則這些節(jié)點擁有較高的影響力。具體分解過程如下:網(wǎng)絡中如果存在 度值為1的節(jié)點,從度中心性的角度看它們就是最不重要的節(jié)點。如果把這些度值為1的節(jié) 點及其所連接的邊都去掉,那么剩下的網(wǎng)絡中會新出現(xiàn)一些度值為1的節(jié)點,再將這些度值 為1的節(jié)點去掉,以此進行循環(huán)操作,直到所剩的網(wǎng)絡中沒有度值為1的節(jié)點為止。此時,所 有被去掉的節(jié)點組成一個層,稱為1-殼(英文名稱:Ι-shell)。對于一個節(jié)點來說,剝掉一層 之后在剩下的網(wǎng)絡中節(jié)點的度值就稱為該節(jié)點的剩余度。按上述方法繼續(xù)剝殼,去掉網(wǎng)絡 中剩余度為2的節(jié)點......重復這些操作,直到網(wǎng)絡中沒有節(jié)點為止,定義初始度為0的孤立 節(jié)點屬于〇-殼。網(wǎng)絡中的每一個節(jié)點屬于唯一的一個層,顯然任一節(jié)點i均滿足ki 2 Ci,其中 h是節(jié)點i的度,(^就是節(jié)點i的核數(shù)。所有核數(shù)大于等于Cl的節(jié)點構成Cl_核。
[0004] 本發(fā)明的發(fā)明人在實現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),現(xiàn)有技術至少存在如下的技術問 題:k-殼分解法是一個中心化(英文名稱:Centralized)的方法,因此需要知道全局信息(即 網(wǎng)絡中所有的節(jié)點信息)才能進行節(jié)點核數(shù)的計算,這必然存在大量的節(jié)點計算量。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種用戶傳播影響力的確定方法和裝置,用于通過少量的 節(jié)點計算量衡量節(jié)點的傳播影響力。
[0006] 為了達到上述目的,本發(fā)明采用這樣的如下技術方案:
[0007] -方面,本發(fā)明提供一種用戶傳播影響力的確定方法,包括:
[0008] 從網(wǎng)絡信息數(shù)據(jù)庫中獲取拓撲網(wǎng)絡的結構數(shù)據(jù),所述結構數(shù)據(jù)包括:用戶集、所述 用戶集中不同用戶之間的關聯(lián)關系,所述用戶集中包括至少N個用戶,所述N為非零的自然 數(shù);
[0009] 通過如下循環(huán)過程計算所述拓撲網(wǎng)絡中任意節(jié)點i的傳播影響力指數(shù)序列,所述 傳播影響力指數(shù)序列包括:從0階開始至η階的各個階的傳播影響力指數(shù),若所述η階傳播影 響力指數(shù)為h,則在所述任意節(jié)點i的所有鄰居節(jié)點中存在最多h個鄰居節(jié)點的(η-I)階傳播 影響力指數(shù)不小于所述h,所述任意節(jié)點i為所述拓撲網(wǎng)絡中表示任意用戶i的節(jié)點,所述i、 h、n為自然數(shù),所述i表示從1至N中的任意一個數(shù);
[0010] 其中,執(zhí)行所述循環(huán)過程包括:在時間步t = 0時獲取所述任意節(jié)點i的0階傳播影 響力指數(shù)為:=&.,所述ki是所述任意節(jié)點i的度值;在時間步t = n時,根據(jù)所述任意節(jié) 點i的鄰居節(jié)點在時間步t = η-1時更新后的(η-1)階傳播影響力指數(shù)獲取所述任意節(jié)點i的 η階傳播影響力指數(shù)為:
其中,/1,/2,一,4是任意節(jié)點1的所 有鄰居節(jié)點,所述表示所述任意節(jié)點i的鄰居節(jié)點么的(1!-1)階傳播影響力指數(shù),所述 表示所述任意節(jié)點i的鄰居節(jié)點j2的(η-I)階傳播影響力指數(shù),所述表示所述任意 節(jié)點i的鄰居節(jié)點/?的(η-1)階傳播影響力指數(shù),在時間步t = η時,所述拓撲網(wǎng)絡中所有節(jié) 點的η階傳播影響力指數(shù)都更新之后,開始時間步t = η+1時所述拓撲網(wǎng)絡中所有節(jié)點的η+1 階傳播影響力指數(shù)的更新;
[0011]在所述拓撲網(wǎng)絡中任意節(jié)點i的傳播影響力指數(shù)序列中階數(shù)(Υ+1)的傳播影響力 指數(shù)等于所述任意節(jié)點i的階數(shù)Y的傳播影響力指數(shù)的情況下,停止執(zhí)行所述循環(huán)過程,并 輸出所述拓撲網(wǎng)絡中所有節(jié)點的〇階到Y階的傳播影響力指數(shù)序列中的任意一階的傳播影 響力指數(shù)用于衡量所述拓撲網(wǎng)絡中所有節(jié)點的傳播影響力,其中,所述Y為所述拓撲網(wǎng)絡 中所有節(jié)點的傳播影響力指數(shù)的最大階數(shù)。
[0012] 另一方面,本發(fā)明提供一種用戶傳播影響力的確定裝置,包括:
[0013] 結構數(shù)據(jù)獲取模塊,用于從網(wǎng)絡信息數(shù)據(jù)庫中獲取拓撲網(wǎng)絡的結構數(shù)據(jù),所述結 構數(shù)據(jù)包括:用戶集、所述用戶集中不同用戶之間的關聯(lián)關系,所述用戶集中包括至少N個 用戶,所述N為非零的自然數(shù);
[0014] 指數(shù)序列計算模塊,用于通過如下循環(huán)過程計算所述拓撲網(wǎng)絡中任意節(jié)點i的傳 播影響力指數(shù)序列,所述傳播影響力指數(shù)序列包括:從〇階開始至η階的各個階的傳播影響 力指數(shù),若所述η階的傳播影響力指數(shù)為h,則在所述任意節(jié)點i的所有鄰居節(jié)點中存在最多 h個鄰居節(jié)點的(η-I)階傳播影響力指數(shù)不小于所述h,所述任意節(jié)點i為所述拓撲網(wǎng)絡中表 示任意用戶i的節(jié)點,所述i、h、η為自然數(shù),所述i表示從1至N中的任意一個數(shù);
[0015] 其中,所述指數(shù)序列計算模塊執(zhí)行所述循環(huán)過程包括:在時間步t = 0時獲取所述 任意節(jié)點i的〇階傳播影響力指數(shù)為:/f1 =先,所述1^是所述任意節(jié)點i的度值;在時間步t =η時,根據(jù)所述任意節(jié)點i的鄰居節(jié)點在時間步t = η-1時更新后的(η-1)階傳播影響力指 數(shù)獲取所述任意節(jié)點i的η階傳播影響力指數(shù)為:/f …,),其中, Λ,Α,···,Λ是任意節(jié)點i的所有鄰居節(jié)點,所述表示所述任意節(jié)點i的鄰居節(jié)點么的 (η-I)階傳播影響力指數(shù),所述力p表示所述任意節(jié)點i的鄰居節(jié)點j2的(η-I)階傳播影響 力指數(shù),所述<4表示所述任意節(jié)點i的鄰居節(jié)點4,.的(n-1)階傳播影響力指數(shù),在時間步 t = η時,所述拓撲網(wǎng)絡中所有節(jié)點的η階傳播影響力指數(shù)都更新之后,開始時間步t = n+1時 所述拓撲網(wǎng)絡中所有節(jié)點的n+1階傳播影響力指數(shù)的更新;
[0016] 傳播影響力指數(shù)輸出模塊,用于在所述拓撲網(wǎng)絡中任意節(jié)點i的傳播影響力指數(shù) 序列中階數(shù)(η' +1)的傳播影響力指數(shù)等于所述任意節(jié)點i的階數(shù)η'的傳播影響力指數(shù)的情 況下,停止執(zhí)行所述循環(huán)過程,并輸出所述拓撲網(wǎng)絡中所有節(jié)點的0階到Υ階的傳播影響力 指數(shù)序列中的任意一階的傳播影響力指數(shù)用于衡量所述拓撲網(wǎng)絡中所有節(jié)點的傳播影響 力,其中,所述Υ為所述拓撲網(wǎng)絡中所有節(jié)點的傳播影響力指數(shù)的最大階數(shù)。
[0017] 采用上述技術方案后,本發(fā)明提供的技術方案將有如下優(yōu)點:
[0018]本發(fā)明實施例中,采用節(jié)點的多個階的傳播影響力指數(shù)構成傳播影響力指數(shù)序 列,在拓撲網(wǎng)絡中所有節(jié)點的(rZ+1)階的傳播影響力指數(shù)等于它們Υ階的傳播影響力指數(shù) 的情況下,輸出所有節(jié)點的傳播影響力指數(shù)序列中的任意一階的傳播影響力指數(shù)用于衡量 節(jié)點的傳播影響力,由于在計算每個節(jié)點的傳播影響力指數(shù)序列時并不需要拓撲網(wǎng)絡中所 有節(jié)點的節(jié)點信息而只需要鄰居節(jié)點的節(jié)點信息,即不需要獲取拓撲網(wǎng)絡的全局信息,而 只使用需要衡量傳播影響力的節(jié)點的所有鄰居節(jié)點信息就可以完成,因此節(jié)點計算量遠小 于現(xiàn)有技術中的k-殼分解法。
【附圖說明】
[0019] 圖1為本發(fā)明實施例提供拓撲網(wǎng)絡中節(jié)點所在網(wǎng)絡位置的示意圖;
[0020] 圖2為本發(fā)明實施例提供的一種用戶傳播影響力的確定方法的流程方框示意圖;
[0021] 圖3-a為本發(fā)明實施例提供的一種用戶傳播影響力的確定裝置的組成結構示意 圖;
[0022] 圖3-b為本發(fā)明實施例提供的一種指數(shù)序列計算模塊的組成結構示意圖;
[0023] 圖3-c為本發(fā)明實施例提供的另一種用戶傳播影響力的確定裝置的組成結構示意 圖;
[0024] 圖3-d為本發(fā)明實施例提供的另一種用戶傳播影響力的確定裝置的組成結構示意 圖。
【具體實施方式】
[0025] 本發(fā)明實施例提供了一種用戶傳播影響力的確定方法和裝置,用于通過少量的節(jié) 點計算量衡量節(jié)點的傳播影響力。
[0026] 為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點能夠更加的明顯和易懂,下面將結合本發(fā)明 實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,下面所描述 的實施例僅僅是本發(fā)明一部分實施例,而非全部實施例?;诒景l(fā)明中的實施例,本領域的 技術人員所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0027] 本發(fā)明的說明書和權利要求書及上述附圖中的術語"包括"和"具有"以及他們的 任何變形,意圖在于覆蓋不排他的包含,以便包含一系列單元的過程、方法、系統(tǒng)、產(chǎn)品或設 備不必限于那些單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產(chǎn)品或設備固 有的其它單元。
[0028] 以下分別進行詳細說明。
[0029] 本發(fā)明用戶傳播影響力的確定方法的一個實施例,可應用于對拓撲網(wǎng)絡中節(jié)點的 傳輸影響力的衡量,請參閱圖2所示,本發(fā)明提供的用戶傳播影響力的確定方法,可以包括 如下步驟:
[0030] 201、從網(wǎng)絡信息數(shù)據(jù)庫中獲取拓撲網(wǎng)絡的結構數(shù)據(jù),結構數(shù)據(jù)包括:用戶集、用戶 集中不同用戶之間的關聯(lián)關系,用戶集中包括至少N個用戶,N為非零的自然數(shù)。
[0031] 在本發(fā)明實施例中,網(wǎng)絡信息數(shù)據(jù)庫中保存有拓撲網(wǎng)絡的各種記錄信息,例如網(wǎng) 絡信息數(shù)據(jù)庫中保存有多個用戶,這些用戶屬于用戶集,網(wǎng)絡信息數(shù)據(jù)庫中的所有用戶之 間有的用戶兩兩之間存在關聯(lián)關系,網(wǎng)絡信息數(shù)據(jù)庫中的用戶可以通過身份識別碼(ID, Identity)來標識,用戶之間的關