两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種改進的RBF神經(jīng)網(wǎng)絡熱點話題用戶參與行為預測方法與流程

文檔序號:11143623閱讀:488來源:國知局
一種改進的RBF神經(jīng)網(wǎng)絡熱點話題用戶參與行為預測方法與制造工藝

本發(fā)明屬于網(wǎng)絡話題分析領域,尤其涉及社交網(wǎng)絡中熱點話題的用戶行為分析與預測。



背景技術:

近年來,隨著互聯(lián)網(wǎng)的不斷普及與發(fā)展,社交網(wǎng)絡越來越成為很多人生活中的重要組成部分,微博是其中非常有代表性的社交網(wǎng)絡之一,它是一種基于關注機制的社交網(wǎng)絡平臺,不僅能夠讓用戶自主選擇自己感興趣的其他用戶進行收聽、關注,也能自由的發(fā)布自己的消息,發(fā)表的消息同時具有廣播性質(zhì),即所有人都能夠看到,所以,微博不僅具有社交網(wǎng)絡的功能,同時也兼?zhèn)涿襟w的性質(zhì)。微博平臺作為一種新的輿論媒介,吸引了我國大部分網(wǎng)民參與,其中的熱點話題也很快擴散成為整個社會的熱點事件,社會影響力也隨之激增。同時,微博也秉承自由、開放和共享的社會網(wǎng)絡媒體精神,與以往的傳統(tǒng)媒介相比,給予每個個體自由表達交流的渠道,也使得其成為新興話語傳播平臺。這就意味著,預測某話題將達到的熱度,在輿論傳播與控制上具有非常重要的意義。不僅能在發(fā)表前期預測出它可能的影響范圍,也能夠在發(fā)展中期及時的控制輿論走向。

隨之而來的就是對話題數(shù)據(jù)的分析需求也表現(xiàn)出了快速增長的趨勢,因此,有越來越多的研究人員開始關注話題的發(fā)展態(tài)勢。而話題熱度的變化可以通過參與該話題的人數(shù)動態(tài)變化來體現(xiàn),目前對用戶參與行為的預測大致分為以下幾種:基于用戶過往行為的預測、基于用戶文本興趣的預測、基于用戶所受群體影響的預測等。如Zaman等人在《Predicting information spreading in Twitter》中提出一種基于協(xié)同過濾模型的用戶行為預測方法,通過構建用戶信息矩陣來進行預測。Zhang等人在《Retweet behavior prediction using hierarchical dirichlet process》中提出一種基于分層狄利克雷過程的非參數(shù)貝葉斯模型,對用戶的興趣進行動態(tài)的主題建模。Luo等人在《Who will retweet me?Finding retweeters in Twitter》中使用了基于Pointwise的排序?qū)W習方法,針對有可能轉(zhuǎn)發(fā)某微博的用戶進行top-K排序,根據(jù)多種屬性判斷該用戶是否會產(chǎn)生轉(zhuǎn)發(fā)行為。

由于上述現(xiàn)有技術均無法體現(xiàn)用戶參與行為具有極大的不確定性的特征,忽略了用戶在做出是否參與該話題的決定時的隨機性與模糊性,因此并不能很好的擬合出實際情況,導致了并不能取得良好的預測效果。同時,多數(shù)研究成果均針對靜態(tài)的參與行為進行預測,無法體現(xiàn)用戶參與數(shù)量上的動態(tài)變化,因此也不能感知話題的態(tài)勢。因此本發(fā)明采用模糊數(shù)學中的云理論與RBF神經(jīng)網(wǎng)絡相結合的方法,使該預測模型在能夠?qū)τ脩魠⑴c行為起到良好的非線性擬合作用的同時,還能夠體現(xiàn)用戶行為的隨機性與模糊性的特征。其難點在于用戶行為的特征選取以及如何將諸多特征轉(zhuǎn)換為定性的云模型表示。



技術實現(xiàn)要素:

本發(fā)明針對現(xiàn)有技術中神經(jīng)網(wǎng)絡算法進行預測時,容易陷入局部最小值而且收斂速度慢,同時由于用戶行為成因復雜,無法準確體現(xiàn)用戶屬性與用戶行為之間的模糊性與隨機性,且用戶參與行為隨時間動態(tài)變化等問題。本發(fā)明提出了一種熱點話題用戶參與行為預測方法。該方法研究已經(jīng)參與話題用戶的粉絲,是否會在各種因素影響下繼續(xù)參與該話題。同時,分別從用戶粉絲自身特征屬性、用戶外部社交屬性兩個角度出發(fā),通過RBF神經(jīng)網(wǎng)絡進行用戶行為預測。由于用戶行為具有模糊性和隨機性,因此在模型的學習過程中引入云理論,將云模型代替RBF神經(jīng)網(wǎng)絡中的高斯函數(shù),符合網(wǎng)絡話題中用戶參與行為的不確定性。進而將用戶參與行為的分類問題轉(zhuǎn)化為話題熱度預測問題,通過時間切片化處理,并通過指數(shù)函數(shù)模型進行參數(shù)擬合,從而得出話題熱度態(tài)勢走向。提出了一種改進的RBF神經(jīng)網(wǎng)絡熱點話題用戶參與行為預測方法。本發(fā)明的技術方案如下:

一種改進的RBF神經(jīng)網(wǎng)絡熱點話題用戶參與行為預測方法,其包括以下步驟:

S1:從現(xiàn)有的社交平臺的API獲取,或者通過網(wǎng)絡爬蟲抓取web網(wǎng)頁中的內(nèi)容獲取社交網(wǎng)絡用戶數(shù)據(jù);

S2:提取相關屬性的步驟:考慮到潛在用戶參與話題主要原因包括用戶個人特征屬性以及用戶外部社交屬性的影響,將從這兩個方面提取相關屬性;并對用戶的信息做時間切片化處理,

S3:建立模型的步驟:將用戶屬性進行基于云變換的數(shù)據(jù)擬合,得到正態(tài)云后可以構建出高維云,高維云的個數(shù)即為RBF神經(jīng)網(wǎng)絡中隱含層的神經(jīng)元個數(shù),其參數(shù)即為隱含層激勵函數(shù)的聚類中心和帶寬,確定好參數(shù)后即可對RBF神經(jīng)網(wǎng)絡進行訓練,得到預測該用戶是否會參與話題的預測模型;

S4:預測和分析過程步驟:通過采用指數(shù)平滑法預測未來話題趨勢走向,將預測得出的熱點話題參與人數(shù)的時間序列(y1,y2,…,yn)做三次指數(shù)平滑計算,即可擬合出熱點話題的熱度趨勢變化,從而進行對下一時間段的預測。

進一步的,所述步驟S1獲取獲取社交網(wǎng)絡用戶數(shù)據(jù)的具體內(nèi)容為特定熱點話題下的用戶參與行為數(shù)據(jù)及用戶關系數(shù)據(jù);用戶參與行為數(shù)據(jù)包括該話題被轉(zhuǎn)發(fā)及評論的時間、參與用戶的個人信息及歷史行為數(shù)據(jù);用戶關系數(shù)據(jù)包括參與該話題下的用戶的所有粉絲和關注用戶,以及他們的個人信息。

進一步的,所述步驟S2根據(jù)用戶個人特征屬性提取相關屬性,主要包括:

提取潛在用戶個人特征屬性:潛在用戶的個人特征屬性主要包括①潛在用戶是否為活躍用戶isActivity(vi);②潛在用戶vi的標簽中是否包括與熱點話題相同的關鍵字isSameTag(Vi);③潛在用戶的關注用戶中參與話題的數(shù)量countOfHF(vi);④潛在用戶的關注用戶的話題帶動力inf(vi);將以上有關潛在用戶的自身特征屬性用xik的統(tǒng)一形式描述,表示潛在用戶vi的第k個屬性。

進一步的,所述步驟S2根據(jù)用戶外部社交屬性提取相關屬性,主要包括:潛在用戶的外部社交屬性主要包括①潛在用戶vi的關注用戶是否為認證用戶isVip(vi,vj);②潛在用戶vi的關注用戶是否為意見領袖isLeader(vi,vj);③潛在用戶vi與其關注用戶性別相同isSameS(vi,vj);④潛在用戶vi與其關注用戶性別不同isDifS(vi,vj);⑤潛在用戶vi與其關注用戶地點相同isSameL(vi,vj);⑥潛在用戶vi與其關注用戶地點不同isDifL(vi,vj);同時,潛在用戶是否會參與該熱點話題還與其所處的社團影響力有關,因此定義其團隊屬性為groupInf(vi,Cm),即潛在用戶所處的Cm社團是否為對該熱點話題感興趣的社團;將以上有關潛在用戶的自身特征屬性用xik的統(tǒng)一形式描述,表示潛在用戶vi的第k個屬性。

進一步的,步驟S3建立模型的步驟主要分以下4個步驟:

S31:對用戶自身特征屬性和用戶外部社交屬性分別采用極大值法進行云變換,云變換即對任意不規(guī)則的數(shù)據(jù)分布進行數(shù)學變換,它能對樣本點進行軟分類的模糊聚類,使其成為若干個不同的云的疊加;

S32:將通過云變換的屬性值與RBF神經(jīng)網(wǎng)絡相結合,從而確定云模型的隱含層神經(jīng)元;根據(jù)峰值法云變化,對于輸入層的每維屬性X,可以得到ni個擬合正態(tài)云,根據(jù)高維云理論和n維正向云發(fā)生器構造出n維正態(tài)云作為RBF神經(jīng)網(wǎng)絡隱含層的神經(jīng)元,可以得到(n1×n2×...×nn)個n維云模型,即n個隱含層節(jié)點;

S33:從基于n維云模型改進的隱含層神經(jīng)元中取期望值作為RBF神經(jīng)網(wǎng)絡隱含層神經(jīng)元的最終輸出值;

S34:RBF神經(jīng)網(wǎng)絡中隱含層到輸出層之間是一種線性感知器模型,且由于輸出層節(jié)點由線性函數(shù)組成,采用最小二乘法求解連接的權值。

進一步的,所述步驟S4預測和分析過程步驟包括:

S41:將獲得的時間序列做三次指數(shù)平滑變換;

S42:當時間序列體現(xiàn)出二次曲線趨勢時,即建立二次曲線修正模型,該模型為非線性預測模型,能夠體現(xiàn)出時序的變化趨勢,預測話題熱度的發(fā)展趨勢。

本發(fā)明的優(yōu)點及有益效果如下:

本發(fā)明先,考慮到神經(jīng)網(wǎng)絡能夠?qū)τ脩粜袨橹g復雜的非線性關系起到良好的擬合效果,并進一步采用RBF(Radical Basis Function,徑向基函數(shù))神經(jīng)網(wǎng)絡構建用戶參與行為預測模型,能夠在處理大規(guī)模網(wǎng)絡話題數(shù)據(jù)時具有收斂速度快、能夠局部逼近特征值的優(yōu)點,并且不易陷入局部最小值;其次,由于用戶屬性與參與行為之間的映射關系具有不確定性,引入云理論(Cloud)對RBF中隱含層的激活函數(shù)進行優(yōu)化,使得該模型既能夠充分表達用戶參與行為的模糊性及隨機性,又能對于非線性關系具有良好的逼近能力;最后,針對用戶的參與行為隨時間變化的特點,利用時間離散化及時間切片方法,對話題熱度進行基于指數(shù)函數(shù)模型的參數(shù)擬合,從而得出話題熱度變化趨勢。

本發(fā)明提出改進的RBF神經(jīng)網(wǎng)絡熱點話題用戶參與行為預測方法,不僅能夠充分表達用戶參與行為的模糊性及隨機性,又能對于非線性關系具有良好的逼近能力,而且能夠通過用戶參與行為體現(xiàn)話題的熱度變化,從而感知話題態(tài)勢,進行有效的輿情監(jiān)測與管控。

附圖說明

圖1是本發(fā)明提供優(yōu)選實施例的整體框圖。

圖2是本發(fā)明提供優(yōu)選實施例改進的RBF神經(jīng)網(wǎng)絡熱點話題用戶參與行為預測方法的總體流程圖。

圖3是本發(fā)明的預測模型圖。

圖4是本發(fā)明的學習算法流程圖。

具體實施方式

下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、詳細地描述。所描述的實施例僅僅是本發(fā)明的一部分實施例。

本發(fā)明解決上述技術問題的技術方案是:

如圖1所示為本發(fā)明整體框圖,表明本發(fā)明的輸入是話題下網(wǎng)絡結構和用戶的各項特征,經(jīng)過預測模型后的輸出是已參與該話題用戶的粉絲,即潛在用戶是否會參與該話題的預測結果。如圖2所示為本發(fā)明的總體流程圖,包括:獲取數(shù)據(jù)模塊,解析屬性模塊,構建模型模塊,預測分析模塊共四大模塊。具體說明本發(fā)明的詳細實施過程,包括如下四個步驟:

S1:獲取數(shù)據(jù)源。獲取社交網(wǎng)絡用戶數(shù)據(jù)可以從現(xiàn)有的社交平臺的API獲取,或者通過網(wǎng)絡爬蟲抓取web網(wǎng)頁中的內(nèi)容。

S2:提取相關屬性。考慮到潛在用戶參與話題主要原因包括用戶個人特征屬性以及用戶外部社交屬性的影響,將從這兩個方面提取相關屬性。并對用戶的信息做時間切片化處理,

S3:建立模型。將用戶屬性進行基于云變換的數(shù)據(jù)擬合,得到正態(tài)云后可以構建出高維云,高維云的個數(shù)即為RBF神經(jīng)網(wǎng)絡中隱含層的神經(jīng)元個數(shù),其參數(shù)即為隱含層激勵函數(shù)的聚類中心和帶寬。確定好參數(shù)后即可對RBF神經(jīng)網(wǎng)絡進行訓練,得到預測該用戶是否會參與話題的預測模型。

S4:預測和分析過程。通過采用指數(shù)平滑法預測未來話題趨勢走向,將預測得出的熱點話題參與人數(shù)的時間序列(y1,y2,…,yn)做三次指數(shù)平滑計算,即可擬合出熱點話題的熱度趨勢變化,從而進行對下一時間段的預測。

上述步驟S1獲取數(shù)據(jù)源,提取相關屬性的具體內(nèi)容為特定熱點話題下的用戶參與行為數(shù)據(jù)及用戶關系數(shù)據(jù)。用戶參與行為數(shù)據(jù)包括該話題被轉(zhuǎn)發(fā)及評論的時間、參與用戶的個人信息及歷史行為數(shù)據(jù);用戶關系數(shù)據(jù)包括參與該話題下的用戶的所有粉絲和關注用戶,以及他們的個人信息等。

上述步驟S2提取相關屬性。主要分以下2個步驟。

S21:提取潛在用戶個人特征屬性。潛在用戶的個人特征屬性主要包括①潛在用戶是否為活躍用戶isActivity(vi);②潛在用戶vi的標簽中是否包括與熱點話題相同的關鍵字isSameTag(Vi);③潛在用戶的關注用戶中參與話題的數(shù)量countOfHF(vi);④潛在用戶的關注用戶的話題帶動力inf(vi);本發(fā)明將以上有關潛在用戶的自身特征屬性用xik的統(tǒng)一形式描述,表示潛在用戶vi的第k個屬性。

S22:提取潛在用戶外部社交屬性。潛在用戶的外部社交屬性主要包括①潛在用戶vi的關注用戶是否為認證用戶isVip(vi,vj);②潛在用戶vi的關注用戶是否為意見領袖isLeader(vi,vj);③潛在用戶vi與其關注用戶性別相同isSameS(vi,vj);④潛在用戶vi與其關注用戶性別不同isDifS(vi,vj);⑤潛在用戶vi與其關注用戶地點相同isSameL(vi,vj);⑥潛在用戶vi與其關注用戶地點不同isDifL(vi,vj);同時,潛在用戶是否會參與該熱點話題還與其所處的社團影響力有關,因此定義其團隊屬性為groupInf(vi,Cm),即潛在用戶所處的Cm社團是否為對該熱點話題感興趣的社團。本發(fā)明將以上有關潛在用戶的自身特征屬性用xik的統(tǒng)一形式描述,表示潛在用戶vi的第k個屬性。

上述步驟S3提取相關屬性。主要分以下4個步驟。

S31:對用戶自身特征屬性和用戶外部社交屬性分別采用極大值法進行云變換,云變換即對任意不規(guī)則的數(shù)據(jù)分布進行數(shù)學變換,它能對樣本點進行軟分類的模糊聚類,使其成為若干個不同的云的疊加。

S311:給定其中一個用戶屬性X的頻率分布函數(shù)f(x),根據(jù)X屬性值的實際頻率分布情況,能夠自動生成若干粒度不同的云C(Exi,Eni,Hei)的疊加,其中每個云均代表一個離散的、定性的概念,將連續(xù)的屬性值轉(zhuǎn)換為離散的概念,可以表示為其中ai為幅度系數(shù);n為變換后生成離散概念的的個數(shù)。

S312:尋找數(shù)據(jù)分布函數(shù)f(x)的波峰值所在位置,將其屬性值定義為云的重心位置,即期望Exi(i=1,2,...,n),計算用于擬合f(x)的、以Exi為期望的云模型的熵,計算云模型的分布函數(shù)fi(x)。

S313:從f(x)中減去已知云模型的數(shù)據(jù)分布fi(x),得到新的數(shù)據(jù)分布函數(shù)f′(x),并在此基礎上重復步驟S312和S313,得到多個基于云的數(shù)據(jù)分布函數(shù)。

S314:根據(jù)已知的f(x),最后得到的擬合誤差函數(shù)f′(x)以及各個云模型的分布函數(shù),計算基于云模型的定性概念的3個特征值,及期望、熵和超熵。

S32:將通過云變換的屬性值與RBF神經(jīng)網(wǎng)絡相結合,從而確定云模型的隱含層神經(jīng)元。根據(jù)峰值法云變化,對于輸入層的每維屬性X,可以得到ni個擬合正態(tài)云。根據(jù)高維云理論和n維正向云發(fā)生器構造出n維正態(tài)云作為RBF神經(jīng)網(wǎng)絡隱含層的神經(jīng)元,可以得到(n1×n2×...×nn)個n維云模型,即n個隱含層節(jié)點,每個隱含層神經(jīng)元都對應一個定性聚類概念,避免了RBF神經(jīng)網(wǎng)絡中的聚類過程,該定性概念可以用三組數(shù)值特征來描述。

S33:基于n維云模型改進的隱含層神經(jīng)元實際上是一個X條件云發(fā)生器,能夠?qū)⑤斎氲膎維向量轉(zhuǎn)換為一組隨機分布的不確定性數(shù)值,這些數(shù)值雖然彼此不相等,但符合一個穩(wěn)定的分布,由此從其中取期望值作為RBF神經(jīng)網(wǎng)絡隱含層神經(jīng)元的最終輸出值,這符合人類認知中從不確定性中推導出確定性結果的特點。

對于S32步驟中得出的輸入向量xi云模型神經(jīng)元按以下公式轉(zhuǎn)換為μt

其中,ri1,ri2,...,rik,i∈[1,n]為由熵和超熵每維生成k個正態(tài)隨機數(shù),云模型隱含層神經(jīng)元的最終輸出值為:

S34:通過S33步可以得到隱含層神經(jīng)元的輸出值,RBF神經(jīng)網(wǎng)絡中隱含層到輸出層之間是一種線性感知器模型,且由于輸出層節(jié)點由線性函數(shù)組成,因此采用最小二乘法求解連接的權值。

上述步驟S4預測和分析。主要分以下2個步驟。

S41:將獲得的時間序列做三次指數(shù)平滑變換。

三次平滑模型為

其中為一次平滑值,為二次平滑值,為三次平滑值。

S42:當時間序列體現(xiàn)出二次曲線趨勢時,即建立二次曲線修正模型

其中t為當前時刻;l為預測時刻與當前時刻的時間差;為下一時刻的預測值;at,bt,ct為二次曲線修正系數(shù)。其計算公式如下

該模型為非線性預測模型,能夠體現(xiàn)出時序的變化趨勢,預測話題熱度的發(fā)展趨勢。

本發(fā)明利用社交網(wǎng)絡中熱點話題的互動數(shù)據(jù),根據(jù)用戶的歷史參與行為將用戶分為參與用戶和潛在用戶,利用基于云模型改進的RBF神經(jīng)網(wǎng)絡預測話題各個階段潛在用戶的行為,即在話題生命周期的下一階段潛在用戶是否會轉(zhuǎn)發(fā)或評論該話題下,并且通過潛在用戶行為的預測能夠把握話題發(fā)展的未來趨勢。

以上這些實施例應理解為僅用于說明本發(fā)明而不用于限制本發(fā)明的保護范圍。在閱讀了本發(fā)明的記載的內(nèi)容之后,技術人員可以對本發(fā)明作各種改動或修改,這些等效變化和修飾同樣落入本發(fā)明權利要求所限定的范圍。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
德令哈市| 景泰县| 阿荣旗| 尼勒克县| 高密市| 九龙城区| 师宗县| 江山市| 镶黄旗| 石渠县| 囊谦县| 郁南县| 监利县| 易门县| 平乡县| 丰都县| 梁山县| 通城县| 上虞市| 班玛县| 当涂县| 铁岭市| 莒南县| 修文县| 南宫市| 米林县| 抚州市| 镇江市| 威信县| 盐源县| 那曲县| 吐鲁番市| 清镇市| 岳阳市| 南溪县| 柳林县| 剑河县| 克拉玛依市| 琼海市| 元谋县| 当涂县|