一種基于r覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法
【專利摘要】本發(fā)明公開(kāi)了一種基于R覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法,該方法的核心思想,是將觀察點(diǎn)集在網(wǎng)絡(luò)中的R覆蓋率作為判斷觀察點(diǎn)定位性能的依據(jù),在指定觀察點(diǎn)數(shù)量的情況下,選取網(wǎng)絡(luò)中R覆蓋率最大的一組節(jié)點(diǎn)作為觀察點(diǎn),使得這組觀察點(diǎn)可以用盡可能小的計(jì)算消耗達(dá)到最高的定位準(zhǔn)確率。本發(fā)明中的觀察點(diǎn)選取方法是用于傳播信息源定位的,對(duì)于相同的觀察點(diǎn)數(shù)目,本發(fā)明具有更高的定位準(zhǔn)確率。該方法能找到一組優(yōu)化的觀察點(diǎn)集合,這組觀察點(diǎn)集合可以滿足在固定觀察點(diǎn)數(shù)量的情況下,其定位準(zhǔn)確率更高;在保證定位準(zhǔn)確率的情況下,需要的觀察點(diǎn)更少,計(jì)算消耗也更小。
【專利說(shuō)明】一種基于R覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于社交網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,具體為一種基于R覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法。
【背景技術(shù)】
[0002]伴隨著博客(Blog)、微博(Mic1-Blog)等新型社交網(wǎng)絡(luò)服務(wù)的大量出現(xiàn),社交網(wǎng)絡(luò)(Social Networks Services, SNS)已經(jīng)成為社會(huì)大眾獲取信息的重要渠道之一。社交網(wǎng)絡(luò)上的信息傳播為人們帶來(lái)方便的同時(shí),也為網(wǎng)絡(luò)謠言的擴(kuò)散提供了一種途徑。因此需要對(duì)社交網(wǎng)絡(luò)中信息擴(kuò)散源進(jìn)行定位,進(jìn)而對(duì)輿情進(jìn)行監(jiān)控。一種可行的定位方法,是在網(wǎng)絡(luò)中部署觀察點(diǎn),對(duì)信息源進(jìn)行似然估計(jì)。
[0003]現(xiàn)有的觀察點(diǎn)選取方法,是在網(wǎng)絡(luò)中選取中心性特征值較大的節(jié)點(diǎn)作為觀察點(diǎn)。通過(guò)這種方法得到的觀察點(diǎn),其定位準(zhǔn)確率低,且計(jì)算消耗大,不適用于龐大的社交網(wǎng)絡(luò)。針對(duì)上述情況,本發(fā)明提出了一種基于R覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法,其目的是提高擴(kuò)散源定位的準(zhǔn)確率。通過(guò)該方法得到的觀察點(diǎn)集,在固定觀察點(diǎn)數(shù)量的情況下,其定位準(zhǔn)確率更高;在保證定位準(zhǔn)確率的情況下,需要的觀察點(diǎn)更少,計(jì)算消耗也更小。準(zhǔn)確的定位社交網(wǎng)絡(luò)中的謠言擴(kuò)散源點(diǎn),是一種有效的網(wǎng)絡(luò)輿情監(jiān)控手段。現(xiàn)有的一種定位方法,是在網(wǎng)絡(luò)中部署少量的觀察點(diǎn),根據(jù)觀察點(diǎn)記錄的信息首次傳入時(shí)間和傳入方向,計(jì)算候選信息源的似然估計(jì)值,進(jìn)而推斷信息源。這種方法的定位準(zhǔn)確性和計(jì)算消耗,都與觀察點(diǎn)在網(wǎng)絡(luò)中的部署位置有關(guān)。
[0004]現(xiàn)有的觀察點(diǎn)選取方法,一種是從網(wǎng)絡(luò)中隨機(jī)選取一定數(shù)量的觀察點(diǎn),另一種是優(yōu)先選取網(wǎng)絡(luò)中中心性特征值(例如度數(shù)中心性、介數(shù)中心性、緊密度中心性、特征向量中心性、聚類系數(shù)、K-核等)大的節(jié)點(diǎn)。這兩類方法選取的觀察點(diǎn)集合,其定位準(zhǔn)確率均較低,如果需要保證一個(gè)較高的定位準(zhǔn)確率,就需要增加觀察點(diǎn)的個(gè)數(shù)。但是,隨著觀察點(diǎn)數(shù)量的增加,計(jì)算的消耗也隨之增加。對(duì)于社交網(wǎng)絡(luò)這樣規(guī)模龐大的用戶群體來(lái)說(shuō),這樣的計(jì)算消耗會(huì)嚴(yán)重影響定位的及時(shí)性。
【發(fā)明內(nèi)容】
[0005]為了解決現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明提供一種基于R覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法,找到一組優(yōu)化的觀察點(diǎn)集合,這組觀察點(diǎn)集合可以滿足在固定觀察點(diǎn)數(shù)量的情況下,其定位準(zhǔn)確率更高;在保證定位準(zhǔn)確率的情況下,需要的觀察點(diǎn)更少,計(jì)算消耗也更小。該方法的核心思想,是將觀察點(diǎn)集在網(wǎng)絡(luò)中的R覆蓋率作為判斷觀察點(diǎn)定位性能的依據(jù)(理論依據(jù)下面有證明過(guò)程),在指定觀察點(diǎn)數(shù)量的情況下,選取網(wǎng)絡(luò)中R覆蓋率最大的一組節(jié)點(diǎn)作為觀察點(diǎn),使得這組觀察點(diǎn)可以用盡可能小的計(jì)算消耗達(dá)到最高的定位準(zhǔn)確率。其技術(shù)方案為:
[0006]一種基于R覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法,用m表示種群規(guī)模,G表示遺傳代數(shù),t表示當(dāng)前種群代數(shù),G (t)表示第t代種群,Size(G(t))表示第t代種群中染色體個(gè)數(shù),
[0007]算法.R覆蓋率優(yōu)先觀察點(diǎn)集選取算法
[0008]輸入:遺傳代數(shù)G,種群規(guī)模m
[0009]輸出:一組R覆蓋率優(yōu)先的觀察點(diǎn)集
[0010]包括以下步驟:
[0011]步驟1:當(dāng)t = O時(shí),初始化G (O);
[0012]步驟2:如果t<G
[0013]步驟3:計(jì)算G(t)中染色體的適應(yīng)度函數(shù)值:取
【權(quán)利要求】
1.一種基于R覆蓋率優(yōu)先的社交網(wǎng)絡(luò)觀察點(diǎn)選取方法,其特征在于, 用m表示種群規(guī)模,G表示遺傳代數(shù),t表示當(dāng)前種群代數(shù),G(t)表示第t代種群,size(Gt))表示第t代種群中染色體個(gè)數(shù), 算法.R覆蓋率優(yōu)先觀察點(diǎn)集選取算法 輸入:遺傳代數(shù)G,種群規(guī)模m 輸出:一組R覆蓋率優(yōu)先的觀察點(diǎn)集 包括以下步驟: 步驟1:當(dāng)t = O時(shí),初始化G(O); 步驟2:如果t < G 步驟3:計(jì)算G(t)中染色體的適應(yīng)度函數(shù)值:取一組節(jié)點(diǎn)的R覆蓋率值為該組節(jié)點(diǎn)的適應(yīng)度函數(shù),記為
即對(duì)于染色體上的基因Xi來(lái)說(shuō),當(dāng)Xi = O時(shí),Ti為空;當(dāng)Xi = I時(shí),以網(wǎng)絡(luò)中節(jié)點(diǎn)i為根做R階生成樹(shù),得到全部滿足|E(s, Xi) I≤r的節(jié)點(diǎn)的集合& ; 步驟4:對(duì)G(t)進(jìn)行復(fù)制操作,將父染色體存入G(t+1);
步驟 5:如果 size (G(t)) < m ; 步驟6:執(zhí)行交叉操作,將新生成的染色體存入G(t+1); 步驟7:執(zhí)行變異操作,將新生成的染色體存入G(t+1); 步驟8:否則 步驟9:t+l,跳到步驟2 ; 步驟10:否則 步驟11:得到當(dāng)前種群中適應(yīng)度函數(shù)值最大的染色體,解碼得到對(duì)應(yīng)的觀察點(diǎn)集合。
【文檔編號(hào)】G06F17/30GK104199884SQ201410418143
【公開(kāi)日】2014年12月10日 申請(qǐng)日期:2014年8月19日 優(yōu)先權(quán)日:2014年8月19日
【發(fā)明者】張錫哲, 張聿博, 張斌, 呂天陽(yáng) 申請(qǐng)人:東北大學(xué)