技術(shù)特征:
技術(shù)總結(jié)
本文發(fā)明涉及一種基于用戶影響力以及內(nèi)容的微博傳播預(yù)測方法,流程如下:1.利用scrapy技術(shù)對兩個(gè)用戶的個(gè)人信息和他們之間的轉(zhuǎn)發(fā)關(guān)系及轉(zhuǎn)發(fā)微博進(jìn)行爬取。2.利用RankPage影響力分析技術(shù)提取用戶影響力,形成用戶權(quán)威預(yù)測因子。3.采用單位時(shí)間粉絲轉(zhuǎn)發(fā)微博在所有發(fā)表微博的百分比,提取粉絲轉(zhuǎn)發(fā)活躍度預(yù)測因子。4.采用TF?IDF詞語權(quán)重技術(shù)對微博內(nèi)容進(jìn)行重要性分析,提取微博重要性預(yù)測因子。5.利用滾雪球的抽樣方法將提取到的轉(zhuǎn)發(fā)關(guān)系劃分成10折微博轉(zhuǎn)發(fā)訓(xùn)練集和微博忽略訓(xùn)練集。6.利用有監(jiān)督的貝葉斯網(wǎng)絡(luò)對訓(xùn)練集進(jìn)行訓(xùn)練,直至分類器參數(shù)收斂。利用本發(fā)明可以提高針對新浪微博特定粉絲轉(zhuǎn)發(fā)微博預(yù)測的準(zhǔn)確度。
技術(shù)研發(fā)人員:郭曉東;劉金碩;王麗娜;章嵐昕;楊廣益;陳煜森;李揚(yáng)眉
受保護(hù)的技術(shù)使用者:武漢大學(xué)
技術(shù)研發(fā)日:2017.03.30
技術(shù)公布日:2017.07.28