本發(fā)明屬于互聯(lián)網(wǎng)技術(shù),尤其涉及一種微博相關(guān)人物推薦方法。
背景技術(shù):
:在移動互聯(lián)網(wǎng)時代的當(dāng)下,微博服務(wù)作為目前主流的信息傳播媒介,越來越多的用戶每天在上面發(fā)布自己的狀態(tài),分享信息,表達(dá)自己的觀點(diǎn)、想法和意圖。這使得微博成為一個有用的、信息量巨大的數(shù)據(jù)源。微博的推薦功能主要依據(jù)的是用戶的注冊信息,根據(jù)注冊信息推薦用戶可能認(rèn)識的好友,以及可能認(rèn)識的人。但是對于向用戶本身推薦感興趣的內(nèi)容較少,不利于微博的人性化發(fā)展。因此需要改進(jìn)微博的推薦功能,使得用戶更加方便直接地關(guān)注自己感興趣的內(nèi)容和微博人物。技術(shù)實(shí)現(xiàn)要素:針對上述技術(shù)問題,本發(fā)明設(shè)計開發(fā)了一種微博相關(guān)人物推薦方法,其可以使用戶更加方便直接地關(guān)注自己感興趣的內(nèi)容和微博人物。本發(fā)明提供的技術(shù)方案為:一種微博相關(guān)人物推薦方法,包括:步驟一、微博用戶識別:解析當(dāng)前用戶所有博文中的多個關(guān)鍵字以及每個關(guān)鍵字的權(quán)重wki;在微博數(shù)據(jù)庫中獲取至少一篇相匹配博文,所述相匹配的博文具有所述多個關(guān)鍵字,獲取各相匹配博文的微博主,再獲取各微博主對所述多個關(guān)鍵字中各關(guān)鍵字的權(quán)重uwki;步驟二、相關(guān)用戶過濾:從所獲取的微博主中篩選掉已經(jīng)被當(dāng)前用戶關(guān)注的微博主,從而獲得至少一個相關(guān)用戶;步驟三、用戶相關(guān)性權(quán)重計算:依據(jù)相關(guān)性權(quán)重公式計算每個相關(guān)用戶的相關(guān)性權(quán)重,所述相關(guān)性權(quán)重公式為:其中,n為當(dāng)前用戶所有博文中關(guān)鍵字的個數(shù);步驟四、相關(guān)用戶推薦:根據(jù)所述至少一個相關(guān)用戶的相關(guān)性權(quán)重,將相關(guān)性權(quán)重排名在排序規(guī)定值之前的相關(guān)用戶推薦給當(dāng)前用戶。優(yōu)選的是,所述的微博相關(guān)人物推薦方法中,所述步驟二中,還從所獲取的微博主中篩選掉相匹配博文數(shù)量小于匹配規(guī)定值的微博主。優(yōu)選的是,所述的微博相關(guān)人物推薦方法中,所述匹配規(guī)定值小于2。優(yōu)選的是,所述的微博相關(guān)人物推薦方法中,所述步驟四中,在將相關(guān)性權(quán)重排名在排序規(guī)定值之前的相關(guān)用戶推薦給當(dāng)前用戶之前,還對所述至少一個相關(guān)用戶進(jìn)行倒序排序。優(yōu)選的是,所述的微博相關(guān)人物推薦方法中,所述排序規(guī)定值為第11名。優(yōu)選的是,所述的微博相關(guān)人物推薦方法中,所述步驟一中,使用特征提取方法從當(dāng)前用戶所有博文提取所述多個關(guān)鍵字。優(yōu)選的是,所述的微博相關(guān)人物推薦方法中,所述微博為新浪微博。本發(fā)明所述的微博相關(guān)人物推薦方法有益效果如下:本發(fā)明分析當(dāng)前用戶博文的內(nèi)容特征,使用關(guān)鍵字檢索出所有相關(guān)博文的用戶,通過權(quán)重計算進(jìn)而推薦給當(dāng)前用戶具有相關(guān)愛好的微博用戶,改變傳統(tǒng)的“好友推薦”以及“間接推薦和名人推薦”方式。附圖說明圖1為本發(fā)明所述的微博相關(guān)人物推薦方法的流程圖。具體實(shí)施方式下面對本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實(shí)施。如圖1所示,本發(fā)明提供一種微博相關(guān)人物推薦方法,包括:步驟一、微博用戶識別:解析當(dāng)前用戶所有博文中的多個關(guān)鍵字以及每個關(guān)鍵字的權(quán)重wki;在微博數(shù)據(jù)庫中獲取至少一篇相匹配博文,所述相匹配的博文具有所述多個關(guān)鍵字,獲取各相匹配博文的微博主,再獲取各微博主對所述多個關(guān)鍵字中各關(guān)鍵字的權(quán)重uwki;步驟二、相關(guān)用戶過濾:從所獲取的微博主中篩選掉已經(jīng)被當(dāng)前用戶關(guān)注的微博主,從而獲得至少一個相關(guān)用戶;步驟三、用戶相關(guān)性權(quán)重計算:依據(jù)相關(guān)性權(quán)重公式計算每個相關(guān)用戶的相關(guān)性權(quán)重,所述相關(guān)性權(quán)重公式為:其中,n為當(dāng)前用戶所有博文中關(guān)鍵字的個數(shù);步驟四、相關(guān)用戶推薦:根據(jù)所述至少一個相關(guān)用戶的相關(guān)性權(quán)重,將相關(guān)性權(quán)重排名在排序規(guī)定值之前的相關(guān)用戶推薦給當(dāng)前用戶。本發(fā)明先進(jìn)行微博用戶識別,即解析當(dāng)前用戶所有博文中的多個關(guān)鍵字以及每個關(guān)鍵字的權(quán)重,找到相匹配博文,這些相匹配博文中具有上述多個關(guān)鍵字,再獲取到這些相匹配博文的微博主,經(jīng)過用戶過濾,最終從這些微博主中提取出相關(guān)性權(quán)重排名在排序規(guī)定值之前的相關(guān)用戶,并將其推薦給當(dāng)前用戶。上述過程中,推薦是基于當(dāng)前用戶的博文以及相關(guān)用戶的博文進(jìn)行的,因此,可以向當(dāng)前用戶推薦其真正感興趣的博文以及相關(guān)用戶,從而可以滿足微博的人性化發(fā)展和個性化需求。在一個優(yōu)選的實(shí)施例中,所述的微博相關(guān)人物推薦方法中,所述步驟二中,還從所獲取的微博主中篩選掉相匹配博文數(shù)量小于匹配規(guī)定值的微博主。為了進(jìn)一步提高推薦的精確度,還相匹配博文少于匹配規(guī)定值的微博主剔除出去。在一個優(yōu)選的實(shí)施例中,所述的微博相關(guān)人物推薦方法中,所述匹配規(guī)定值小于2??梢愿鶕?jù)需要對這一數(shù)值進(jìn)行設(shè)定,以提高推薦的精確度。在一個優(yōu)選的實(shí)施例中,所述的微博相關(guān)人物推薦方法中,所述步驟四中,在將相關(guān)性權(quán)重排名在排序規(guī)定值之前的相關(guān)用戶推薦給當(dāng)前用戶之前,還對所述至少一個相關(guān)用戶進(jìn)行倒序排序。為了提高對相關(guān)用戶的提取效率,先將相關(guān)用戶進(jìn)行倒序排序,即將相關(guān)性權(quán)重從大到小排序,再提取排名在排序規(guī)定值之前的相關(guān)用戶進(jìn)行推薦。在一個優(yōu)選的實(shí)施例中,所述的微博相關(guān)人物推薦方法中,所述排序規(guī)定值為第11名??梢愿鶕?jù)需要對上述排序規(guī)定值進(jìn)行設(shè)定調(diào)整。在一個優(yōu)選的實(shí)施例中,所述的微博相關(guān)人物推薦方法中,所述步驟一中,使用特征提取方法從當(dāng)前用戶所有博文提取所述多個關(guān)鍵字。通過特征提取方法可以對當(dāng)前用戶的博文內(nèi)容進(jìn)行相對準(zhǔn)確的特征分析,繼而獲得相對準(zhǔn)確的關(guān)鍵字。在一個優(yōu)選的實(shí)施例中,所述的微博相關(guān)人物推薦方法中,所述微博為新浪微博。為使本領(lǐng)域技術(shù)人員進(jìn)一步了解本發(fā)明的技術(shù)方案,現(xiàn)提供一實(shí)施例。實(shí)施例一以“小明”微博賬號為例,例如小明在最近一段時間內(nèi)轉(zhuǎn)發(fā)了或發(fā)布了一些博文,我們通過特征選擇得到了如表1所示的關(guān)鍵詞和權(quán)重。表1當(dāng)前用戶的關(guān)鍵字以及各關(guān)鍵字的權(quán)重關(guān)鍵詞食品三星note7安全問題專車權(quán)重0.90.80.60.4通過這些關(guān)鍵詞在微博數(shù)據(jù)庫中檢索得到了“用戶1”、“用戶2”、“用戶3”、“用戶4”、“用戶5”,其中“用戶4”為“小明”所關(guān)注的用戶,“用戶5”只匹配到了一篇博文,進(jìn)行相關(guān)用戶過濾后最終剩3個用戶。3個相關(guān)用戶對于各關(guān)鍵字的權(quán)重如表2所示。表23個相關(guān)用戶對各關(guān)鍵字的權(quán)重食品三星note7安全問題專車用戶10.40.90.70.2用戶20.90.20.40.6用戶30.60.50.70.8通過用戶相關(guān)性權(quán)重算法得出“用戶1”與“小明”的相關(guān)性權(quán)重為0.4×0.9+0.9×0.8+0.7×0.6+0.2×0.4=1.58,“用戶2”與“小明”的相關(guān)性權(quán)重為0.9×0.9+0.2×0.8+0.4×0.6+0.6×0.4=1.45,“用戶3”與“小明”的相關(guān)性權(quán)重為0.6×0.9+0.5×0.8+0.7×0.6+0.8×0.4=1.68。因最終相關(guān)用戶數(shù)量少于10,所以最后將這3位用戶都推送給“小明”。盡管本發(fā)明的實(shí)施方案已公開如上,但其并不僅僅限于說明書和實(shí)施方式中所列運(yùn)用,它完全可以被適用于各種適合本發(fā)明的領(lǐng)域,對于熟悉本領(lǐng)域的人員而言,可容易地實(shí)現(xiàn)另外的修改,因此在不背離權(quán)利要求及等同范圍所限定的一般概念下,本發(fā)明并不限于特定的細(xì)節(jié)。當(dāng)前第1頁12