技術(shù)總結(jié)
本發(fā)明公開了基于人群畫像技術(shù)的用戶相似度計算方法,包括標(biāo)簽推薦模塊、標(biāo)簽主題類聚模塊、用戶相似度計算模塊;標(biāo)簽推薦模塊算法步驟包括:同質(zhì)性推薦、共現(xiàn)性擴(kuò)展和消除語義冗余;標(biāo)簽主題類聚模塊用于對標(biāo)簽推薦模塊產(chǎn)生的標(biāo)簽信息進(jìn)行聚類分析;用戶相似度計算模塊用于對標(biāo)簽主題類聚模塊產(chǎn)生的用戶標(biāo)簽以及聚類分析的結(jié)果,進(jìn)行用戶的相似度的計算。本發(fā)明利用中文知識圖譜來識別標(biāo)簽中的語義冗余;將信息檢索中對關(guān)鍵詞的tf?rw打分機(jī)制應(yīng)用于微博標(biāo)簽的挖掘,提高標(biāo)簽推薦準(zhǔn)確率;將LDA文本主題模型應(yīng)用于微博用戶的標(biāo)簽集合,刻畫出每個微博用戶的主題分布,為準(zhǔn)確的人群畫像服務(wù);利用微博標(biāo)簽以及微博主題分布來計算用戶相似度。
技術(shù)研發(fā)人員:秦謙;肖仰華;王飛
受保護(hù)的技術(shù)使用者:江蘇名通信息科技有限公司
文檔號碼:201610782607
技術(shù)研發(fā)日:2016.08.30
技術(shù)公布日:2017.03.08