本發(fā)明屬于社交網(wǎng)絡(luò),具體涉及一種面向符號(hào)社會(huì)網(wǎng)絡(luò)正面信息最大化傳播方法、程序、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、影響力最大化旨在選擇少量用戶,以便最大化信息傳播的影響力。其中包括兩個(gè)關(guān)鍵性問題:第一是如何選擇最初最有影響力的用戶集合,這對(duì)應(yīng)的是種子節(jié)點(diǎn)選擇問題;第二是如何讓其他人受到影響并轉(zhuǎn)發(fā)信息,事實(shí)上,這是選擇不同的信息級(jí)聯(lián)模型。信息傳播可以描述謠言、疾病、模因或營(yíng)銷活動(dòng)的傳播動(dòng)態(tài),傳播的初始階段是由社會(huì)網(wǎng)絡(luò)中的一個(gè)或是一組節(jié)點(diǎn)開始的。
2、為了描述在線社交網(wǎng)絡(luò)中的信息擴(kuò)散過程,經(jīng)典的信息傳播模型包括kempe等人[david?kempe,jon?m.kleinberg,tardos.maximizing?the?spread?of?influencethrough?a?social?network[c].knowledge?discovery?anddata?mining,2003:137-146.]提出了獨(dú)立級(jí)聯(lián)(ic)模型和線性閾值(lt)模型。一些研究人員采用流行病模型(sis,sir,sirs,seir)來模擬網(wǎng)絡(luò)中節(jié)點(diǎn)的感染和恢復(fù)過程(wang等人[wang?x,lu?j,wang?z,etal.dynamics?ofdiscrete?epidemic?models?on?heterogeneous?networks[j].physicaa:statistical?mechanics?and?its?applications,2020,539(c):267-282.])。通過將信息類比為疾病,woo和chen[woo?j,chen?h.epidemic?model?for?information?diffusionin?web?forums:experiments?in?marketing?exchange?and?political?dialog[j].springerplus,2016,5(1):66-83.]使用sir模型對(duì)網(wǎng)絡(luò)論壇中的主題擴(kuò)散進(jìn)行了建模。yun?chai等人[chai?y,wang?y,zhu?l.a?stochastic?information?diffusion?model?incomplex?social?networks[j].ieee?access,2019:175897-175906.]提出了一個(gè)在復(fù)雜網(wǎng)絡(luò)上隨機(jī)擴(kuò)散的信息傳播模型,該模型在sir模型的基礎(chǔ)上,同時(shí)考慮到了社會(huì)網(wǎng)絡(luò)中種群擾動(dòng)和社會(huì)網(wǎng)絡(luò)連通性的變化,將人口的出生率和死亡率引入模型,使模型更接近現(xiàn)實(shí)生活。wu等人[wu?x,fu?l,long?h,et?al.adaptive?diffusion?of?sensitive?informationin?online?social?networks[j].ieee?transactions?on?knowledge?and?dataengineering,2021,33(8):3020-3034.]利用受約束的組合多臂強(qiáng)盜框架來實(shí)現(xiàn)非敏感信息正常擴(kuò)散的同時(shí),最小化敏感信息的傳播,其中以敏感信息擴(kuò)散大小作為強(qiáng)盜框架的獎(jiǎng)勵(lì)。隨著神經(jīng)網(wǎng)絡(luò)領(lǐng)域的快速發(fā)展,當(dāng)前工作已經(jīng)開始使用深度學(xué)習(xí)進(jìn)行擴(kuò)散建模。gao等人[sheng?g,pang?h,gallinari?p,et?al.a?novel?embedding?method?for?informationdiffusion?prediction?in?social?network?big?data[j].ieee?transactions?onindustrial?informatics,2017,13(4):2097-2105.]建議采用基于信息嵌入的傳播預(yù)測(cè)(iedp)模型。bahareh等人[fatemi?b,molaei?s,pan?s,et?al.gcnfusion:an?efficientgraph?convolutional?network?based?model?for?information?diffusion[j].expertsystems?with?application,2022(sep.):202-215.]提出一種高效的基于圖卷積網(wǎng)絡(luò)的信息擴(kuò)散模型,結(jié)合特征選擇、節(jié)點(diǎn)表示學(xué)習(xí)和信息擴(kuò)散來提出信息傳播模型。
3、在信息傳播過程中,節(jié)點(diǎn)在網(wǎng)絡(luò)中具有不同的重要性(生命力),在復(fù)雜網(wǎng)絡(luò)上或與之相關(guān)的許多過程中節(jié)點(diǎn)都起著至關(guān)重要的作用,如可控性、意見形成、防止災(zāi)難性的級(jí)聯(lián)故障以及識(shí)別高績(jī)效的研究學(xué)者等。然而,確定重要節(jié)點(diǎn)并不是一項(xiàng)容易的任務(wù)。sun等人[sun?h,du?h,huang?j,et?al.leader-aware?community?detection?in?complexnetworks[j].knowledge?and?information?systems,2020,62(2):639-668.]提出了一種新的領(lǐng)導(dǎo)者感知社區(qū)檢測(cè)算法,該算法可以找到社區(qū)結(jié)構(gòu)以及每個(gè)社區(qū)的領(lǐng)導(dǎo)者。測(cè)量每個(gè)節(jié)點(diǎn)的領(lǐng)導(dǎo),并讓每個(gè)節(jié)點(diǎn)都遵守其本地領(lǐng)導(dǎo),形成依賴樹。一旦所有依賴樹都明確,群落結(jié)構(gòu)就會(huì)出現(xiàn)。lu等人[[33]lu?p,dong?c,guo?y.anovel?methodbased?on?node’scorrelation?to?evaluate?importantnodes?in?complex?networks[j].journalofshanghai?jiaotong?university(science),2022,27(5):1-13.]提出了一種基于復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)分布和全局影響的新方法,其主要思想是節(jié)點(diǎn)被鏈接的重要性不僅與網(wǎng)絡(luò)中的相對(duì)位置有關(guān),而且還與彼此之間的相關(guān)性有關(guān),根據(jù)距離矩陣對(duì)復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行分類,然后計(jì)算節(jié)點(diǎn)對(duì)之間的相關(guān)系數(shù),從網(wǎng)絡(luò)整體的角度出發(fā),基于節(jié)點(diǎn)間的相關(guān)性和最短距離,提出了全局相似中心度(gsc)。dan-dan等人[dan-dan?lu.leader-based?communitydetectionalgorithminattributednetworks[j].ieeeaccess,2021:119666-119674.]提出了一種基于領(lǐng)導(dǎo)者的方法,該方法結(jié)合了拓?fù)浜蛯傩孕畔?talb),利用網(wǎng)絡(luò)中節(jié)點(diǎn)之間的屬性信息構(gòu)建屬性相似矩陣,然后將其與網(wǎng)絡(luò)拓?fù)湫畔⑾嘟Y(jié)合,建立節(jié)點(diǎn)之間的依賴關(guān)系?,F(xiàn)實(shí)中用戶關(guān)系有積極的、消極的、中性的或是無關(guān)系,以上影響力最大化研究均未考慮用戶關(guān)系復(fù)雜這一問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種面向符號(hào)社會(huì)網(wǎng)絡(luò)正面信息最大化傳播方法、程序、設(shè)備及存儲(chǔ)介質(zhì)。
2、本發(fā)明的目的通過如下技術(shù)方案來實(shí)現(xiàn):
3、一種面向符號(hào)社會(huì)網(wǎng)絡(luò)正面信息最大化傳播方法,具體步驟如下:
4、步驟1:社交網(wǎng)絡(luò)結(jié)構(gòu)探測(cè);通過分析社交網(wǎng)絡(luò)應(yīng)用報(bào)文,提取通信雙方的身份信息,將其輸入到社交網(wǎng)絡(luò)鏈接關(guān)系數(shù)據(jù)庫(kù);
5、這些信息隨后被輸入到社交網(wǎng)絡(luò)鏈接關(guān)系數(shù)據(jù)庫(kù),幫助構(gòu)建完整的網(wǎng)絡(luò)鏈接關(guān)系圖譜,為后續(xù)的鏈接預(yù)測(cè)、種子節(jié)點(diǎn)選擇和語義傳播操作提供了基礎(chǔ)數(shù)據(jù)支持;
6、步驟2:鏈接預(yù)測(cè);
7、通過采用符號(hào)潛在因子模型,學(xué)習(xí)符號(hào)社會(huì)網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的slf向量,以完善網(wǎng)絡(luò)的結(jié)構(gòu)信息;在鏈接預(yù)測(cè)過程中,通過計(jì)算節(jié)點(diǎn)對(duì)的符號(hào)潛在因子向量,進(jìn)行積極鏈接分?jǐn)?shù)、消極鏈接分?jǐn)?shù)、中性鏈接分?jǐn)?shù)以及無關(guān)系分?jǐn)?shù)的計(jì)算,從而實(shí)現(xiàn)對(duì)節(jié)點(diǎn)之間鏈接的預(yù)測(cè);
8、步驟3:種子節(jié)點(diǎn)選擇;
9、通過采用符號(hào)網(wǎng)絡(luò)的pagerank算法,結(jié)合鄰接矩陣和節(jié)點(diǎn)的spr值,計(jì)算符號(hào)頁(yè)面排名,用于衡量每個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中的地位和影響力;在spr算法收斂后,選擇最有影響力的個(gè)別節(jié)點(diǎn)作為信息傳播的種子節(jié)點(diǎn);通過這種方式,種子節(jié)點(diǎn)選擇裝置有助于提高信息傳播的效果,并優(yōu)化信息在社交網(wǎng)絡(luò)中的傳播路徑;
10、步驟4:語義傳播;
11、通過對(duì)社會(huì)網(wǎng)絡(luò)中易感染個(gè)體的興趣度進(jìn)行更新,從而影響其對(duì)正在傳播的正面信息的態(tài)度。根據(jù)不同的關(guān)系,以不同的方式對(duì)個(gè)體的興趣度進(jìn)行更新;在興趣度更新之后,根據(jù)個(gè)體的興趣度影響信息的傳播方向。
12、進(jìn)一步地,所述步驟2具體為:
13、步驟2.1:對(duì)社會(huì)網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)進(jìn)行初始興趣度的設(shè)置;
14、步驟2.2:利用缺失鏈接補(bǔ)全算法對(duì)符號(hào)社會(huì)網(wǎng)絡(luò)進(jìn)行鏈接預(yù)測(cè),以完善網(wǎng)絡(luò)結(jié)構(gòu)信息;
15、采用slf模型進(jìn)行鏈接預(yù)測(cè)最重要的就是學(xué)習(xí)每個(gè)節(jié)點(diǎn)的slf向量,采用負(fù)對(duì)數(shù)似然函數(shù)作為目標(biāo)函數(shù),通過最小化目標(biāo)函數(shù)來學(xué)習(xí)節(jié)點(diǎn)的slf向量;定義如下:
16、
17、其中fa(x)是一個(gè)激活函數(shù):fa(x)=poexp(x)/1+po(exp(x)-1);
18、上式中包含四個(gè)分量,分別對(duì)應(yīng)于積極的、消極的、中性的與無關(guān)系;為了最小化目標(biāo)函數(shù),采用坐標(biāo)下降法,其中固定其他slf向量來更新一個(gè)slf向量;因此目標(biāo)函數(shù)變成了:
19、
20、在上式中,和用來表示與節(jié)點(diǎn)u有積極的、消極的、中性以及無關(guān)系的后繼鄰居,同樣的和表示與節(jié)點(diǎn)u有不同社會(huì)關(guān)系的前驅(qū)鄰居;對(duì)該式中對(duì)節(jié)點(diǎn)的slf向量分別求偏導(dǎo)得到:
21、
22、進(jìn)一步地,所述步驟3具體為:
23、步驟3.1:種子節(jié)點(diǎn)選擇;
24、若信息傳播初始階段(step=0),則采用基于符號(hào)的pagerank算法選擇網(wǎng)絡(luò)中有影響力的節(jié)點(diǎn)作為種子節(jié)點(diǎn)傳播信息;若進(jìn)入信息傳播階段,將當(dāng)前網(wǎng)絡(luò)中態(tài)度為1的個(gè)體加入感染個(gè)體集合;
25、步驟3.2:信息傳播。
26、進(jìn)一步地,所述步驟4具體為:
27、步驟4.1:遍歷網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn);
28、如果節(jié)點(diǎn)為易感染個(gè)體并準(zhǔn)備好接收信息,將其加入感染個(gè)體集合;
29、如果節(jié)點(diǎn)不在感染個(gè)體集合中并且當(dāng)前時(shí)刻在其感染周期內(nèi),將其加入集合;
30、如果當(dāng)前網(wǎng)絡(luò)存在易感染個(gè)體但是當(dāng)前時(shí)間小于它們感染周期的開始時(shí)間,增加一個(gè)單位時(shí)間重新進(jìn)行信息傳播;
31、步驟4.2:興趣度更新;
32、判斷當(dāng)前網(wǎng)絡(luò)中存在處于感染周期內(nèi)的易感染個(gè)體;
33、調(diào)用興趣度更新算法更新易感染個(gè)體的興趣度;
34、判斷那些態(tài)度為1的個(gè)體是否以一定概率恢復(fù)到態(tài)度為0;
35、步驟4.3:到當(dāng)前網(wǎng)絡(luò)中的所有個(gè)體都具有傳染性或被移除,信息傳播結(jié)束。
36、一種面向符號(hào)社會(huì)網(wǎng)絡(luò)正面信息最大化傳播系統(tǒng),包括社交網(wǎng)絡(luò)結(jié)構(gòu)探測(cè)裝置、鏈接預(yù)測(cè)裝置、種子節(jié)點(diǎn)選擇裝置及語義傳播裝置;
37、所述社交網(wǎng)絡(luò)結(jié)構(gòu)探測(cè)裝置:通過分析社交網(wǎng)絡(luò)應(yīng)用報(bào)文,提取通信雙方的身份信息,將其所述輸入到社交網(wǎng)絡(luò)鏈接關(guān)系數(shù)據(jù)庫(kù);
38、鏈接預(yù)測(cè)裝置:初始化社會(huì)網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的興趣度,通過缺失鏈接補(bǔ)全算法對(duì)符號(hào)社會(huì)網(wǎng)絡(luò)進(jìn)行鏈接預(yù)測(cè),完善網(wǎng)絡(luò)結(jié)構(gòu)信息;
39、所述種子節(jié)點(diǎn)選擇裝置:該裝置采用基于符號(hào)的pagerank算法來進(jìn)行種子節(jié)點(diǎn)的選擇。該算法選擇個(gè)最具有影響力的節(jié)點(diǎn)來傳播正面信息,最大化信息傳播的影響;
40、所述語義傳播裝置:遍歷網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn),將符號(hào)社會(huì)網(wǎng)絡(luò)中個(gè)體對(duì)該正面信息的興趣度增加一定的值,再通過種子節(jié)點(diǎn)不斷感染其他節(jié)點(diǎn)實(shí)現(xiàn)正面信息的最大化傳播。
41、一種計(jì)算機(jī)裝置/設(shè)備/系統(tǒng),包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)一種面向符號(hào)社會(huì)網(wǎng)絡(luò)正面信息最大化傳播方法的步驟。
42、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)一種面向符號(hào)社會(huì)網(wǎng)絡(luò)正面信息最大化傳播方法的步驟。
43、一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于:該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)一種面向符號(hào)社會(huì)網(wǎng)絡(luò)正面信息最大化傳播方法的步驟。
44、本發(fā)明的有益效果在于:
45、本發(fā)明整合了鏈接預(yù)測(cè)、語義傳播、種子節(jié)點(diǎn)選擇和興趣度更新等關(guān)鍵步驟,通過不斷迭代信息傳播和興趣度的更新,實(shí)現(xiàn)了符號(hào)社會(huì)網(wǎng)絡(luò)中正面信息的最大化傳播。本發(fā)明考慮到當(dāng)前網(wǎng)絡(luò)中用戶關(guān)系缺失以及關(guān)系復(fù)雜這些問題,能夠通過鏈接預(yù)測(cè)技術(shù)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行完善,基于完整的網(wǎng)絡(luò)結(jié)構(gòu),通過種子節(jié)點(diǎn)選擇算法選擇最有影響力的種子節(jié)點(diǎn)傳播信息,從而使得信息的正面信息影響力最大化。