技術(shù)特征:
技術(shù)總結(jié)
一種通過大數(shù)據(jù)技術(shù),采集解析網(wǎng)絡(luò)信息及其他信息源數(shù)據(jù),進(jìn)行結(jié)構(gòu)化處理,通過細(xì)粒度語義分析及人工輔助對數(shù)據(jù)進(jìn)行多維度標(biāo)簽標(biāo)注。通過分詞、詞性識(shí)別、詞頻統(tǒng)計(jì)、主題抽取、聚類、時(shí)間序列分析等大數(shù)據(jù)挖掘方法,總結(jié)輿論熱點(diǎn)傳播四大特征:用戶內(nèi)容傾向、時(shí)間特征、內(nèi)容特征、傳播特征,構(gòu)建輿論熱點(diǎn)預(yù)測模型。當(dāng)用戶輸入預(yù)測主體及其特征之后,通過全文檢索和聚類的方式從歷史數(shù)據(jù)中抽取相關(guān)數(shù)據(jù)進(jìn)行時(shí)間特征、內(nèi)容特征、傳播特征的吻合度計(jì)算及與用戶內(nèi)容傾向進(jìn)行計(jì)算,達(dá)到一定閾值,既即可判斷該主題能夠成為輿論熱點(diǎn)。
技術(shù)研發(fā)人員:沈勁枝
受保護(hù)的技術(shù)使用者:北京清博大數(shù)據(jù)科技有限公司
技術(shù)研發(fā)日:2017.04.28
技術(shù)公布日:2017.08.11