一種基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度計(jì)算方法
【專利摘要】本發(fā)明公開(kāi)了一種基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度計(jì)算方法,首先通過(guò)微博用戶對(duì)相關(guān)品牌的評(píng)論信息建立與品牌相關(guān)的社會(huì)網(wǎng)絡(luò),再根據(jù)所建立的社會(huì)網(wǎng)絡(luò)的情況分析計(jì)算相關(guān)品牌的網(wǎng)絡(luò)熱度情況。本發(fā)明基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度獲取方法在建立品牌社會(huì)網(wǎng)絡(luò)時(shí),使用LDA模型計(jì)算品牌相似度,該方法在計(jì)算相似度時(shí),將文字背后的語(yǔ)義關(guān)聯(lián)也考慮在內(nèi),提高了社會(huì)網(wǎng)絡(luò)建立的準(zhǔn)確性。在計(jì)算品牌的網(wǎng)絡(luò)熱度時(shí)所使用的Cluster?Rank算法不僅僅以當(dāng)前節(jié)點(diǎn)和他的相鄰節(jié)點(diǎn)影響力為依據(jù),同時(shí)以節(jié)點(diǎn)的集聚系數(shù)為依據(jù),提高了品牌網(wǎng)絡(luò)熱度的計(jì)算準(zhǔn)確性。
【專利說(shuō)明】-種基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度計(jì)算方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,更為具體地講,涉及一種基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò) 熱度計(jì)算方法
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)媒體也相應(yīng)的發(fā)展迅速,而相關(guān)的評(píng)論也隨之表現(xiàn) 出新的特質(zhì)和發(fā)展空間。隨著互聯(lián)網(wǎng)技術(shù)的日益普及,越來(lái)越多的網(wǎng)友習(xí)慣于在網(wǎng)絡(luò)上發(fā) 表自己對(duì)各種新聞信息的看法和見(jiàn)解。這些看法和見(jiàn)解常常以帖子、評(píng)論、網(wǎng)絡(luò)日志等形式 出現(xiàn)于網(wǎng)絡(luò),當(dāng)下各新聞網(wǎng)站紛紛設(shè)立了專門的網(wǎng)絡(luò)評(píng)論欄目,搜集各路網(wǎng)友的網(wǎng)絡(luò)評(píng)論 文字,及時(shí)整合后發(fā)出自己的聲音,成為重要的輿論導(dǎo)向工具。
[0003] 目前評(píng)價(jià)網(wǎng)絡(luò)中相關(guān)信息的網(wǎng)絡(luò)熱度的方法是:利用傳統(tǒng)的人工方法,通過(guò)各大 搜索引擎觀察其涉及或者相關(guān)鏈接的點(diǎn)擊轉(zhuǎn)載情況做出匯總統(tǒng)計(jì)。
[0004] 我們發(fā)現(xiàn)現(xiàn)有的方法雖然比較普遍,但至少有如下缺點(diǎn):耗時(shí)較長(zhǎng)且效率低,數(shù)據(jù) 統(tǒng)計(jì)不準(zhǔn)確。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度 計(jì)算方法,以提高計(jì)算效率和數(shù)據(jù)統(tǒng)計(jì)的準(zhǔn)確性。
[0006] 為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度計(jì)算方法,其特征在 于,包括以下步驟:
[0007] (1)、通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取微博用戶關(guān)于品牌的評(píng)論,即包括各個(gè)品牌信息的用 戶評(píng)論;
[0008] (2)、根據(jù)步驟(1)中獲取的評(píng)論應(yīng)用LDA模型計(jì)算評(píng)論中所涉及品牌之間的相似 度;
[0009] (3)、將各個(gè)品牌對(duì)應(yīng)為社會(huì)網(wǎng)絡(luò)中的各個(gè)節(jié)點(diǎn),根據(jù)步驟2中得到的品牌相似度 當(dāng)且僅當(dāng)品牌之間相似度超過(guò)所設(shè)定的閾值時(shí),將社會(huì)網(wǎng)絡(luò)中對(duì)應(yīng)兩個(gè)節(jié)點(diǎn)進(jìn)行連邊,構(gòu) 成關(guān)于品牌的社會(huì)網(wǎng)絡(luò);
[0010] ⑷、根據(jù)步驟(3)中得到的社會(huì)網(wǎng)絡(luò),利用計(jì)算Cluster Rank的方法計(jì)算該網(wǎng)絡(luò) 中各個(gè)節(jié)點(diǎn)所對(duì)應(yīng)品牌的網(wǎng)絡(luò)熱度。
[0011] 作為進(jìn)一步的改進(jìn),步驟(2)中提到根據(jù)微博用戶評(píng)論的內(nèi)容計(jì)算品牌相似度, 步驟如下:
[0012] 2. 1)、對(duì)微博用戶的評(píng)論使用LDA提取評(píng)論主題和評(píng)論關(guān)鍵詞,并由此得到品牌 評(píng)論關(guān)鍵詞的概率矩陣;
[0013] 2. 2)、根據(jù)2. 1)中的概率矩陣可以計(jì)算得到品牌相似度。
[0014] 作為進(jìn)一步的改進(jìn),步驟(4)中提到利用計(jì)算Cluster Rank的方法計(jì)算社會(huì)網(wǎng)絡(luò) 中品牌的網(wǎng)絡(luò)熱度,其步驟如下:
[0015] 4. 1)、由步驟3中構(gòu)建的社會(huì)網(wǎng)絡(luò),利用Cluster Rank方法計(jì)算社會(huì)網(wǎng)絡(luò)中品牌的 網(wǎng)絡(luò)熱度si,網(wǎng)絡(luò)熱度計(jì)算方法如下:
[0016]
【權(quán)利要求】
1. 一種基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度計(jì)算方法,其特征在于,包括以下步驟: (1) 、通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取微博用戶關(guān)于品牌的評(píng)論,即包括各個(gè)品牌信息的用戶評(píng) 論; (2) 、根據(jù)步驟(1)中獲取的評(píng)論應(yīng)用LDA模型計(jì)算評(píng)論中所涉及品牌之間的相似度; (3) 、將各個(gè)品牌對(duì)應(yīng)為社會(huì)網(wǎng)絡(luò)中的各個(gè)節(jié)點(diǎn),根據(jù)步驟2中得到的品牌相似度當(dāng)且 僅當(dāng)品牌之間相似度超過(guò)所設(shè)定的閾值時(shí),將社會(huì)網(wǎng)絡(luò)中對(duì)應(yīng)兩個(gè)節(jié)點(diǎn)進(jìn)行連邊,構(gòu)成關(guān) 于品牌的社會(huì)網(wǎng)絡(luò); (4) 、根據(jù)步驟(3)中得到的社會(huì)網(wǎng)絡(luò),利用計(jì)算Cluster Rank的方法計(jì)算該網(wǎng)絡(luò)中各 個(gè)節(jié)點(diǎn)所對(duì)應(yīng)品牌的網(wǎng)絡(luò)熱度。
2. 根據(jù)權(quán)利要求1所述的基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度計(jì)算方法,其特征在于,步驟 (2)中提到根據(jù)微博用戶評(píng)論的內(nèi)容計(jì)算品牌相似度,步驟如下: 2. 1)、對(duì)微博用戶的評(píng)論使用LDA提取評(píng)論主題和評(píng)論關(guān)鍵詞,并由此得到品牌評(píng)論 關(guān)鍵詞的概率矩陣; 2. 2)、根據(jù)2. 1)中的概率矩陣可以計(jì)算得到品牌相似度。
3. 根據(jù)權(quán)利要求1所述的基于社會(huì)網(wǎng)絡(luò)的品牌網(wǎng)絡(luò)熱度計(jì)算方法,其特征在于,步驟 (4)中所述的利用計(jì)算Cluster Rank的方法計(jì)算社會(huì)網(wǎng)絡(luò)中品牌的網(wǎng)絡(luò)熱度,其步驟如 下: 4. 1)、由步驟3中構(gòu)建的社會(huì)網(wǎng)絡(luò),利用Cluster Rank方法計(jì)算社會(huì)網(wǎng)絡(luò)中品牌的網(wǎng)絡(luò) 熱度si,網(wǎng)絡(luò)熱度計(jì)算方法如下:
其中,此處f(Ci)定義如下: f(q)二 10-ci 其中q的定義如下:
其中h表示節(jié)點(diǎn)i的度,即節(jié)點(diǎn)i的相鄰節(jié)點(diǎn)的個(gè)數(shù),τ i表示節(jié)點(diǎn)i的相鄰節(jié)點(diǎn)的集 合,| {ejk| j, k e τ J I表示i的相鄰節(jié)點(diǎn)間的連邊數(shù),當(dāng)ki彡1時(shí),令Ci = 0。
【文檔編號(hào)】G06F17/30GK104063479SQ201410311999
【公開(kāi)日】2014年9月24日 申請(qǐng)日期:2014年7月2日 優(yōu)先權(quán)日:2014年7月2日
【發(fā)明者】曾途, 周濤, 夏虎, 高輝 申請(qǐng)人:成都數(shù)聯(lián)銘品科技有限公司