两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法和裝置制造方法

文檔序號(hào):6634879閱讀:347來(lái)源:國(guó)知局
用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法和裝置。其中,該用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法包括:獲取目標(biāo)對(duì)象的對(duì)象信息;根據(jù)對(duì)象信息獲取目標(biāo)熱詞,目標(biāo)熱詞為與對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),共現(xiàn)頻率為目標(biāo)熱詞與對(duì)象信息同時(shí)出現(xiàn)的頻率;從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ);以及確定目標(biāo)對(duì)象與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。通過(guò)本發(fā)明,解決了相關(guān)技術(shù)中難以判斷出高頻詞語(yǔ)與對(duì)象之間的真實(shí)關(guān)聯(lián)度的問題。
【專利說(shuō)明】用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法和裝置。

【背景技術(shù)】
[0002]目前,隨著媒體營(yíng)銷渠道的社會(huì)化發(fā)展,各商家開始重視并分析網(wǎng)民在網(wǎng)絡(luò)渠道上發(fā)出的聲音,希望將其轉(zhuǎn)化為自身的商業(yè)效益。
[0003]在相關(guān)技術(shù)中,為了分析網(wǎng)民在網(wǎng)絡(luò)渠道上發(fā)出的聲音:首先采用機(jī)器爬蟲的方式來(lái)爬取互聯(lián)網(wǎng)網(wǎng)頁(yè)上的文本信息,對(duì)機(jī)器而言,這些文本信息是由大量的詞語(yǔ)構(gòu)成的;然后,當(dāng)確定一個(gè)對(duì)象時(shí),根據(jù)所爬取的文本信息可以統(tǒng)計(jì)出與該對(duì)象同時(shí)出現(xiàn)的高頻詞語(yǔ),進(jìn)而可以判斷出這些高頻詞語(yǔ)與該對(duì)象之間的關(guān)聯(lián)度。
[0004]然而,由于受“我” “的” “這”等常規(guī)高頻詞的影響,根據(jù)上述技術(shù)方案,難以判斷出這些熱詞與該對(duì)象之間的真實(shí)關(guān)聯(lián)度。
[0005]針對(duì)相關(guān)技術(shù)中難以判斷出熱詞與對(duì)象之間的真實(shí)關(guān)聯(lián)度的問題,目前尚未提出有效的解決方案。


【發(fā)明內(nèi)容】

[0006]本發(fā)明的主要目的在于提供一種用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法和裝置,以解決相關(guān)技術(shù)中難以判斷出高頻詞語(yǔ)與對(duì)象之間的真實(shí)關(guān)聯(lián)度問題。
[0007]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法。該方法可以包括:獲取目標(biāo)對(duì)象的對(duì)象信息;根據(jù)上述對(duì)象信息獲取目標(biāo)熱詞,上述目標(biāo)熱詞為與上述對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),上述共現(xiàn)頻率為上述目標(biāo)熱詞為與上述對(duì)象信息同時(shí)出現(xiàn)的頻率;從上述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,上述常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ);以及確定上述目標(biāo)對(duì)象與上述過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。
[0008]進(jìn)一步地,從上述目標(biāo)熱詞中濾除上述常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞可以包括:獲取上述常規(guī)熱詞;以及判斷上述目標(biāo)對(duì)象熱詞中是否存在上述常規(guī)熱詞,其中,如果判斷出上述目標(biāo)對(duì)象熱詞中存在上述常規(guī)熱詞,則從上述目標(biāo)熱詞中濾除上述常規(guī)熱詞,得到上述過(guò)濾后的目標(biāo)熱詞。
[0009]進(jìn)一步地,可以通過(guò)以下方式確定上述常規(guī)熱詞:獲取上述目標(biāo)熱詞的獨(dú)現(xiàn)頻率,上述獨(dú)現(xiàn)頻率為上述目標(biāo)熱詞獨(dú)立出現(xiàn)的頻率;判斷上述目標(biāo)熱詞的上述獨(dú)現(xiàn)頻率是否大于第二預(yù)設(shè)頻率;以及如果判斷出上述目標(biāo)熱詞的上述獨(dú)現(xiàn)頻率大于上述第二預(yù)設(shè)頻率,則將上述目標(biāo)熱詞作為上述常規(guī)熱詞。
[0010]進(jìn)一步地,上述對(duì)象信息可以包括上述目標(biāo)對(duì)象的關(guān)鍵詞,根據(jù)上述對(duì)象信息獲取目標(biāo)熱詞可以包括:獲取預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲;利用上述預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲爬取目標(biāo)網(wǎng)站上的文本信息;以及根據(jù)上述關(guān)鍵詞從上述文本信息中獲取上述目標(biāo)熱詞。
[0011]進(jìn)一步地,在從上述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞之后,上述數(shù)據(jù)處理方法還可以包括:確定上述過(guò)濾后的目標(biāo)熱詞的情緒屬性;以及根據(jù)上述共現(xiàn)頻率顯示上述過(guò)濾后的目標(biāo)熱詞和上述對(duì)象信息,和/或根據(jù)上述關(guān)聯(lián)度顯示上述過(guò)濾后的目標(biāo)熱詞和上述對(duì)象信息,和/或根據(jù)上述情緒屬性顯示上述過(guò)濾后的目標(biāo)熱詞和上述對(duì)象息。
[0012]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置。該裝置包括:第一獲取單元,用于獲取目標(biāo)對(duì)象的對(duì)象信息;第二獲取單元,用于根據(jù)上述對(duì)象信息獲取目標(biāo)熱詞,上述目標(biāo)熱詞為與上述對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),上述共現(xiàn)頻率為上述目標(biāo)熱詞與上述對(duì)象信息同時(shí)出現(xiàn)的頻率;過(guò)濾單元,用于從上述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,上述常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ);以及第一確定單元,用于確定上述目標(biāo)對(duì)象與上述過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。
[0013]進(jìn)一步地,上述過(guò)濾單元包括:第一獲取模塊,用于獲取上述常規(guī)熱詞;第一判斷模塊,用于判斷上述目標(biāo)熱詞中是否存在上述常規(guī)熱詞;以及過(guò)濾模塊,用于在判斷出上述目標(biāo)熱詞中存在上述常規(guī)熱詞時(shí),從上述目標(biāo)熱詞中濾除上述常規(guī)熱詞,得到上述過(guò)濾后的目標(biāo)熱詞。
[0014]進(jìn)一步地,上述數(shù)據(jù)處理裝置還包括第二確定單元,上述第二確定單元用于確定上述常規(guī)熱詞,其中,上述第二確定單元包括:第二獲取模塊,用于獲取上述目標(biāo)熱詞的獨(dú)現(xiàn)頻率,上述獨(dú)現(xiàn)頻率為上述目標(biāo)熱詞獨(dú)立出現(xiàn)的頻率;第二判斷模塊,用于判斷上述目標(biāo)熱詞的上述獨(dú)現(xiàn)頻率是否大于第二預(yù)設(shè)頻率;確定模塊,用于在判斷出上述目標(biāo)熱詞的上述獨(dú)現(xiàn)頻率大于上述第二預(yù)設(shè)頻率時(shí),將上述目標(biāo)熱詞作為上述常規(guī)熱詞。
[0015]進(jìn)一步地,上述對(duì)象信息包括上述目標(biāo)對(duì)象的關(guān)鍵詞,上述第二獲取單元包括:第三獲取模塊,用于獲取預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲;爬取模塊,用于利用上述預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲爬取目標(biāo)網(wǎng)站上的文本信息;以及第四獲取模塊,用于根據(jù)上述關(guān)鍵詞從上述文本信息中獲取上述目標(biāo)熱詞。
[0016]進(jìn)一步地,上述數(shù)據(jù)處理還包括:第三獲取單元,用于在從上述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞之后,確定上述過(guò)濾后的目標(biāo)熱詞的情緒屬性;以及顯示單元,用于根據(jù)上述共現(xiàn)頻率顯示上述過(guò)濾后的目標(biāo)熱詞和上述對(duì)象信息,和/或根據(jù)上述關(guān)聯(lián)度顯示上述過(guò)濾后的目標(biāo)熱詞和上述對(duì)象信息,和/或根據(jù)上述情緒屬性顯示上述過(guò)濾后的目標(biāo)熱詞和上述對(duì)象信息。
[0017]通過(guò)本發(fā)明,采用獲取目標(biāo)對(duì)象的對(duì)象信息;根據(jù)對(duì)象信息獲取目標(biāo)熱詞,目標(biāo)熱詞為與對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),共現(xiàn)頻率為目標(biāo)熱詞為與對(duì)象信息同時(shí)出現(xiàn)的頻率;從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ);以及確定目標(biāo)對(duì)象與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度,解決了相關(guān)技術(shù)中難以判斷出高頻詞語(yǔ)與對(duì)象之間的真實(shí)關(guān)聯(lián)度的問題,進(jìn)而達(dá)到了提高高頻詞語(yǔ)與對(duì)象之間的關(guān)聯(lián)度的準(zhǔn)確性效果。

【專利附圖】

【附圖說(shuō)明】
[0018]構(gòu)成本申請(qǐng)的一部分的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0019]圖1是根據(jù)本發(fā)明第一實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法的流程圖;
[0020]圖2是根據(jù)本發(fā)明第二實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法的流程圖;
[0021]圖3是根據(jù)本發(fā)明第一實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置的不意圖;以及
[0022]圖4是根據(jù)本發(fā)明第二實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置的示意圖。

【具體實(shí)施方式】
[0023]需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。
[0024]為了使本【技術(shù)領(lǐng)域】的人員更好地理解本申請(qǐng)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分的實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。
[0025]需要說(shuō)明的是,本申請(qǐng)的說(shuō)明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請(qǐng)的實(shí)施例。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0026]根據(jù)本發(fā)明的實(shí)施例,提供了一種用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法,該用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法用于確定網(wǎng)頁(yè)中熱詞與對(duì)象的關(guān)聯(lián)度。該用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法可以運(yùn)行在計(jì)算機(jī)處理設(shè)備上。
[0027]圖1是根據(jù)本發(fā)明第一實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法的流程圖。如圖1所示,該方法可以包括步驟S102至步驟S108:
[0028]步驟S102,獲取目標(biāo)對(duì)象的對(duì)象信息。
[0029]目標(biāo)對(duì)象也即待分析的對(duì)象,該目標(biāo)對(duì)象的對(duì)象信息可以包括用于描述該目標(biāo)對(duì)象的數(shù)據(jù)信息,例如,其可以為目標(biāo)對(duì)象的關(guān)鍵詞。
[0030]在實(shí)施時(shí),可以預(yù)先通過(guò)多種途徑獲取目標(biāo)對(duì)象的對(duì)象信息,例如,可以接收用戶輸入的目標(biāo)對(duì)象的關(guān)鍵詞,并將該關(guān)鍵詞作為該目標(biāo)對(duì)象的對(duì)象信息。以下以對(duì)象信息為關(guān)鍵詞為例詳細(xì)闡述本發(fā)明。
[0031]步驟S104,根據(jù)對(duì)象信息獲取目標(biāo)熱詞。
[0032]目標(biāo)熱詞為與對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),共現(xiàn)頻率為目標(biāo)熱詞與對(duì)象信息同時(shí)出現(xiàn)的頻率。
[0033]在執(zhí)行步驟S104之前,可以預(yù)先通過(guò)搜索引擎,利用網(wǎng)絡(luò)爬蟲自動(dòng)爬取目標(biāo)網(wǎng)站上的文本信息,并將爬取到的文本信息存入數(shù)據(jù)庫(kù)中,其中,該文本信息包含目標(biāo)對(duì)象的關(guān)鍵詞及與該關(guān)鍵詞對(duì)應(yīng)的全部熱詞。這樣,在分析目標(biāo)對(duì)象及其熱詞的關(guān)聯(lián)度時(shí),可以從數(shù)據(jù)庫(kù)中查詢目標(biāo)熱詞(也即,與目標(biāo)對(duì)象相關(guān)聯(lián)的熱詞)。
[0034]例如,可以根據(jù)目標(biāo)對(duì)象的關(guān)鍵詞獲取與該關(guān)鍵詞相關(guān)聯(lián)的目標(biāo)熱詞,其中,目標(biāo)熱詞為與該關(guān)鍵詞的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),共現(xiàn)頻率可以為目標(biāo)熱詞與關(guān)鍵詞同時(shí)出現(xiàn)的頻率。具體地,可以從存儲(chǔ)在上述數(shù)據(jù)庫(kù)中的文本信息中篩選共現(xiàn)頻率大于第一預(yù)設(shè)頻率的目標(biāo)熱詞。
[0035]步驟S106,從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞。
[0036]常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ),例如,其可以包括“我” “的” “這”等。由于常規(guī)熱詞的出現(xiàn)頻率并不完全依賴于目標(biāo)對(duì)象的關(guān)鍵詞,也即,不管目標(biāo)對(duì)象是什么,這些常規(guī)熱詞的出現(xiàn)頻率都可能保持大于第一預(yù)設(shè)頻率的頻率值。因此,在做關(guān)聯(lián)度分析時(shí),如果不對(duì)這些常規(guī)熱詞進(jìn)行過(guò)濾處理,則會(huì)影響分析結(jié)果的準(zhǔn)確度,進(jìn)而影響用戶的網(wǎng)絡(luò)數(shù)據(jù)投放行為。因而,從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,也即,得到真正的目標(biāo)熱詞,這樣,由于過(guò)濾后的目標(biāo)熱詞可以真實(shí)的反映其與關(guān)鍵詞的關(guān)聯(lián)度,因而其可以對(duì)用戶的網(wǎng)絡(luò)數(shù)據(jù)投放行為起到準(zhǔn)確的導(dǎo)向作用。
[0037]具體地,在從網(wǎng)路爬蟲爬取的文本信息中獲取目標(biāo)熱詞之后,可以再?gòu)臄?shù)據(jù)列表中獲取預(yù)先設(shè)定的常規(guī)熱詞,然后,將所有的目標(biāo)熱詞與所有的常規(guī)熱詞逐一對(duì)比,如果某個(gè)目標(biāo)熱詞與某個(gè)常規(guī)熱詞一致,則將其濾除,否則,如果某個(gè)目標(biāo)熱詞與任何一個(gè)常規(guī)熱詞都不一致,則保留該目標(biāo)熱詞,其中,被保留下來(lái)的目標(biāo)熱詞即為過(guò)濾后的目標(biāo)熱詞。
[0038]步驟S108,確定目標(biāo)對(duì)象與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。
[0039]也即,確定目標(biāo)對(duì)象的關(guān)鍵詞與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。其中,關(guān)聯(lián)度=共現(xiàn)頻率/獨(dú)現(xiàn)頻率,獨(dú)現(xiàn)頻率可以為過(guò)濾后的目標(biāo)熱詞在文本信息中單獨(dú)出現(xiàn)的頻率。
[0040]例如,在實(shí)施時(shí),假設(shè)目標(biāo)對(duì)象為“可口可樂”,那么相應(yīng)的“可口可樂”的對(duì)象信息可以為“可口可樂”這4個(gè)字,而與“可口可樂”關(guān)聯(lián)的目標(biāo)熱詞可以包括:“劉翔”、“姚明”、“百事可樂”、“巴菲特”、“果汁”、“霧霾”、“金秀賢”、“麥當(dāng)勞”、“肯德基”以及“的”、“了”、“代言”、“明星”等等。顯然,“的”、“了”、“代言”、“明星”并不是“可口可樂”的真正的目標(biāo)熱詞,例如,即使目標(biāo)對(duì)象換為“百事可樂”,“的”、“了”、“代言”、“明星”等的共現(xiàn)頻率也會(huì)超出第一預(yù)設(shè)頻率,也即,“的”、“了”、“代言”、“明星”是常規(guī)熱詞,因此,執(zhí)行本發(fā)明的上述步驟,可以將“的”、“了”、“代言”、“明星”等常規(guī)熱詞濾除,從而可以確定“可口可樂”的真正的目標(biāo)熱詞為“劉翔”、“姚明”、“百事可樂”、“巴菲特”、“果汁”、“霧霾”、“金秀賢”、“麥當(dāng)勞”、“肯德基”,并得到“可口可樂”與這些真正的目標(biāo)熱詞的關(guān)聯(lián)度。
[0041]通過(guò)本發(fā)明實(shí)施例,由于從目標(biāo)熱詞中濾除了常規(guī)熱詞,避免了常規(guī)熱詞的干擾,過(guò)濾后的目標(biāo)熱詞能夠更加準(zhǔn)確地反映目標(biāo)對(duì)象與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度,達(dá)到了提高高頻詞語(yǔ)與對(duì)象之間的關(guān)聯(lián)度的準(zhǔn)確性效果。
[0042]圖2是根據(jù)本發(fā)明第二實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法的流程圖。該實(shí)施例可以作為圖1所示實(shí)施例的優(yōu)選實(shí)施方式。該用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法包括如下的步驟S202至步驟S212:
[0043]步驟S202和步驟S204,分別同圖1所示實(shí)施例的步驟S102和步驟S104,在此不再贅述。
[0044]步驟S206,獲取常規(guī)熱詞。
[0045]常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ),無(wú)論對(duì)象是誰(shuí),這些常規(guī)熱詞的出現(xiàn)頻率都會(huì)大于第一預(yù)設(shè)頻率。具體地,可以從數(shù)據(jù)庫(kù)列表中獲取預(yù)先設(shè)定的常規(guī)熱詞。
[0046]步驟S208,判斷目標(biāo)熱詞中是否存在常規(guī)熱詞。
[0047]可以將所有的目標(biāo)熱詞與所有的常規(guī)熱詞逐一對(duì)比,如果某個(gè)目標(biāo)熱詞與某個(gè)常規(guī)熱詞一致,則判斷出該目標(biāo)熱詞是常規(guī)熱詞;否則,如果某個(gè)目標(biāo)熱詞與任何一個(gè)常規(guī)熱詞都不一致,則判斷出該目標(biāo)熱詞不是常規(guī)熱詞。
[0048]步驟S210,如果判斷出目標(biāo)熱詞中存在常規(guī)熱詞,則從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞。
[0049]步驟S212,同圖1所示實(shí)施例的步驟S104,在此不再贅述。
[0050]通過(guò)本發(fā)明實(shí)施例,由于預(yù)先建立了常規(guī)熱詞的詞庫(kù),并將其存儲(chǔ)在相應(yīng)的數(shù)據(jù)庫(kù)列表中,便于目標(biāo)熱詞與該詞庫(kù)中的常規(guī)熱詞進(jìn)行對(duì)比。
[0051]優(yōu)選地,在本發(fā)明實(shí)施例中,可以通過(guò)以下方式確定常規(guī)熱詞:
[0052]S2,獲取目標(biāo)熱詞的獨(dú)現(xiàn)頻率,獨(dú)現(xiàn)頻率為目標(biāo)熱詞獨(dú)立出現(xiàn)的頻率,也即,目標(biāo)熱詞不依附于目標(biāo)對(duì)象的關(guān)鍵詞而單獨(dú)出現(xiàn)的頻率。
[0053]S4,判斷目標(biāo)熱詞的獨(dú)現(xiàn)頻率是否大于第二預(yù)設(shè)頻率。第二預(yù)設(shè)頻率可以與前述的第一預(yù)設(shè)頻率相同。
[0054]S6,如果判斷出目標(biāo)熱詞的獨(dú)現(xiàn)頻率大于第二預(yù)設(shè)頻率,則將目標(biāo)熱詞作為常規(guī)熱詞。
[0055]優(yōu)選地,根據(jù)本發(fā)明實(shí)施例,對(duì)象信息可以包括目標(biāo)對(duì)象的關(guān)鍵詞,根據(jù)對(duì)象信息獲取目標(biāo)熱詞可以包括:
[0056]S8,獲取預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲。
[0057]該網(wǎng)絡(luò)爬蟲可以是定向抓取相關(guān)網(wǎng)頁(yè)資源,自動(dòng)下載網(wǎng)頁(yè)程序,它根據(jù)既定的抓取目標(biāo),有選擇的訪問萬(wàn)維網(wǎng)上的網(wǎng)頁(yè)與相關(guān)的鏈接,獲取所需要的信息。它將目標(biāo)定為抓取與某一特定主題內(nèi)容相關(guān)的網(wǎng)頁(yè),為面向主題的用戶查詢準(zhǔn)備數(shù)據(jù)資源。
[0058]S10,利用預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲爬取目標(biāo)網(wǎng)站上的文本信息。這里,網(wǎng)絡(luò)爬蟲爬取的信息可以為目標(biāo)對(duì)象所在的文本信息。
[0059]S12,根據(jù)關(guān)鍵詞從文本信息中獲取目標(biāo)熱詞。
[0060]通過(guò)本發(fā)明實(shí)施例,采用網(wǎng)絡(luò)爬蟲的手段,當(dāng)確定一個(gè)對(duì)象的對(duì)象信息(如,關(guān)鍵詞)時(shí),可以從互聯(lián)網(wǎng)的網(wǎng)頁(yè)上爬取到與該關(guān)鍵詞對(duì)應(yīng)的所有的文本信息,其中,該文本信息由大量的詞語(yǔ)構(gòu)成,根據(jù)爬取的文本信息確定與該對(duì)象同時(shí)出現(xiàn)的目標(biāo)熱詞。
[0061 ] 優(yōu)選地,在本發(fā)明實(shí)施例中,在從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞之后,該數(shù)據(jù)處理方法還可以包括:
[0062]S14,確定過(guò)濾后的目標(biāo)熱詞的情緒屬性??梢酝ㄟ^(guò)語(yǔ)義分析技術(shù)分析過(guò)濾后的目標(biāo)熱詞的情緒屬性,其中,情緒屬性包含正、負(fù)情緒屬性以及中性情緒屬性。例如,在實(shí)施時(shí),可以預(yù)先設(shè)定詞語(yǔ)的情緒屬性,并將這些詞語(yǔ)存儲(chǔ)在預(yù)先設(shè)定的情緒屬性列表中,這樣,在確定過(guò)濾后的目標(biāo)熱詞的情緒屬性時(shí),可以將目標(biāo)熱詞與情緒屬性列表中的詞語(yǔ)進(jìn)行逐一匹配,如果匹配成功,則目標(biāo)熱詞的情緒屬性即為所匹配的詞語(yǔ)的情緒屬性。
[0063]S16,根據(jù)共現(xiàn)頻率顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息;和/或,根據(jù)關(guān)聯(lián)度顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息;和/或,根據(jù)情緒屬性顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息。
[0064]例如,在根據(jù)情緒屬性顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息(如,關(guān)鍵詞)時(shí),可以以氣泡、詞云等形式進(jìn)行顯示,使得目標(biāo)熱詞與目標(biāo)對(duì)象的關(guān)聯(lián)度更直觀、更形象。
[0065]例如,可以將目標(biāo)熱詞的情緒屬性展示在圖形上,并通過(guò)左右分布來(lái)區(qū)分不同情緒的目標(biāo)熱詞,以及通過(guò)目標(biāo)熱詞與坐標(biāo)原點(diǎn)的距離來(lái)表現(xiàn)關(guān)聯(lián)度的大小。例如,正面情緒的目標(biāo)熱詞可以以氣泡的形式展現(xiàn)在示意圖的右邊,負(fù)面情緒的目標(biāo)熱詞可以以氣泡的形式展現(xiàn)在示意圖的左邊。氣泡的大小表示目標(biāo)熱詞的共現(xiàn)頻率,氣泡到坐標(biāo)原點(diǎn)的距離表示關(guān)聯(lián)度大小,其中,坐標(biāo)原點(diǎn)即表示對(duì)象信息(如,關(guān)鍵詞),距離坐標(biāo)原點(diǎn)越近,目標(biāo)熱詞與對(duì)象信息(如,關(guān)鍵詞)的關(guān)聯(lián)度越大;反之,距離坐標(biāo)原點(diǎn)越遠(yuǎn),目標(biāo)熱詞與對(duì)象信息(如,關(guān)鍵詞)的關(guān)聯(lián)度越小。
[0066]需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0067]根據(jù)本發(fā)明的實(shí)施例,提供了一種用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置,該用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置用于確定網(wǎng)頁(yè)中熱詞與對(duì)象的關(guān)聯(lián)度。需要說(shuō)明的是,本發(fā)明實(shí)施例所提供的用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法可以通過(guò)本發(fā)明實(shí)施例的用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置來(lái)執(zhí)行,本發(fā)明實(shí)施例的用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置也可以用于執(zhí)行本發(fā)明實(shí)施例的用于熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法。
[0068]圖3是根據(jù)本發(fā)明第一實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置的示意圖。如圖3所示,該裝置包括:第一獲取單元10、第二獲取單元20、過(guò)濾單元30和第一確定單兀40。
[0069]第一獲取單元10用于獲取目標(biāo)對(duì)象的對(duì)象信息。目標(biāo)對(duì)象也即待分析的對(duì)象,該目標(biāo)對(duì)象的對(duì)象信息可以包括用于描述該目標(biāo)對(duì)象的數(shù)據(jù)信息,例如,其可以為目標(biāo)對(duì)象的關(guān)鍵詞。在實(shí)施時(shí),可以預(yù)先通過(guò)多種途徑獲取目標(biāo)對(duì)象的對(duì)象信息,例如,可以接收用戶輸入的目標(biāo)對(duì)象的關(guān)鍵詞,并將該關(guān)鍵詞作為該目標(biāo)對(duì)象的對(duì)象信息。以下對(duì)象信息為關(guān)鍵詞為例詳細(xì)闡述本發(fā)明。
[0070]第二獲取單元20用于根據(jù)對(duì)象信息獲取目標(biāo)熱詞,目標(biāo)熱詞為與對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),共現(xiàn)頻率為目標(biāo)熱詞與對(duì)象信息同時(shí)出現(xiàn)的頻率。目標(biāo)熱詞為與對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),共現(xiàn)頻率為目標(biāo)熱詞與對(duì)象信息同時(shí)出現(xiàn)的頻率。
[0071]在執(zhí)行第二獲取單元20的功能之前,可以預(yù)先通過(guò)搜索引擎,利用網(wǎng)絡(luò)爬蟲自動(dòng)爬取目標(biāo)網(wǎng)站上的文本信息,并將爬取到的文本信息存入數(shù)據(jù)庫(kù)中,其中,該文本信息包含目標(biāo)對(duì)象的關(guān)鍵詞及與該關(guān)鍵詞對(duì)應(yīng)的全部熱詞。這樣,在分析目標(biāo)對(duì)象及其熱詞的關(guān)聯(lián)度時(shí),可以從數(shù)據(jù)庫(kù)中查詢目標(biāo)熱詞(也即,與目標(biāo)對(duì)象相關(guān)聯(lián)的熱詞)。
[0072]例如,可以根據(jù)目標(biāo)對(duì)象的關(guān)鍵詞獲取與該關(guān)鍵詞相關(guān)聯(lián)的目標(biāo)熱詞,其中,目標(biāo)熱詞為與該關(guān)鍵詞的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),共現(xiàn)頻率可以為目標(biāo)熱詞與關(guān)鍵詞同時(shí)出現(xiàn)的頻率。具體地,可以從存儲(chǔ)在上述數(shù)據(jù)庫(kù)中的文本信息中篩選共現(xiàn)頻率大于第一預(yù)設(shè)頻率的目標(biāo)熱詞。
[0073]過(guò)濾單元30用于從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ)。常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ),例如,其可以包括“我”“的”“這”等。由于常規(guī)熱詞的出現(xiàn)頻率并不完全依賴與目標(biāo)對(duì)象的關(guān)鍵詞,也即,不管目標(biāo)對(duì)象是什么,這些常規(guī)熱詞的出現(xiàn)頻率都可能保持大于第一預(yù)設(shè)頻率的頻率值。因此,在做關(guān)聯(lián)度分析時(shí),如果不對(duì)這些常規(guī)熱詞進(jìn)行過(guò)濾處理,則會(huì)影響分析結(jié)果的準(zhǔn)確度,進(jìn)而影響用戶的網(wǎng)絡(luò)數(shù)據(jù)投放行為。因而,從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,也即,得到真正的目標(biāo)熱詞,這樣,由于過(guò)濾后的目標(biāo)熱詞可以真實(shí)的反映其與關(guān)鍵詞的關(guān)聯(lián)度,因而其可以對(duì)用戶的網(wǎng)絡(luò)數(shù)據(jù)投放行為起到準(zhǔn)確的導(dǎo)向作用。
[0074]具體地,在從網(wǎng)路爬蟲爬取的文本信息中獲取目標(biāo)熱詞之后,可以再?gòu)臄?shù)據(jù)列表中獲取預(yù)先設(shè)定的常規(guī)熱詞,然后,將所有的目標(biāo)熱詞與所有的常規(guī)熱詞逐一對(duì)比,如果某個(gè)目標(biāo)熱詞與某個(gè)常規(guī)熱詞一致,則將其濾除,否則,如果某個(gè)目標(biāo)熱詞與任何一個(gè)常規(guī)熱詞都不一致,則保留該目標(biāo)熱詞,其中,被保留下來(lái)的目標(biāo)熱詞即為過(guò)濾后的目標(biāo)熱詞。
[0075]第一確定單元40用于確定目標(biāo)對(duì)象與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。也即,確定目標(biāo)對(duì)象的關(guān)鍵詞與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。其中,關(guān)聯(lián)度=共現(xiàn)頻率/獨(dú)現(xiàn)頻率,獨(dú)現(xiàn)頻率可以為過(guò)濾后的目標(biāo)熱詞在文本信息中單獨(dú)出現(xiàn)的頻率。
[0076]通過(guò)本發(fā)明實(shí)施例,由于從目標(biāo)熱詞中濾除了常規(guī)熱詞,避免了常規(guī)熱詞的干擾,過(guò)濾后的目標(biāo)熱詞能夠更加真確地反映目標(biāo)對(duì)象與過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度,達(dá)到了提高高頻詞語(yǔ)與對(duì)象之間的關(guān)聯(lián)度的準(zhǔn)確性效果。
[0077]圖4是根據(jù)本發(fā)明第二實(shí)施例的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置的示意圖。如圖4所示,該裝置包括:第一獲取單元10、第二獲取單元20、過(guò)濾單元30和第一確定單元40,其中,過(guò)濾單元30包括:第一獲取模塊301、第一判斷模塊302和過(guò)濾模塊303。
[0078]第一獲取單元10、第二獲取單元20和第一確定單元40的作用與前述實(shí)施例中的相同,在此不再贅述。
[0079]第一獲取模塊301用于獲取常規(guī)熱詞。常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ),無(wú)論對(duì)象是誰(shuí),這些常規(guī)熱詞的出現(xiàn)頻率都會(huì)大于第一預(yù)設(shè)頻率。具體地,可以從數(shù)據(jù)庫(kù)列表中獲取預(yù)先設(shè)定的常規(guī)熱詞。
[0080]第一判斷模塊302用于判斷目標(biāo)熱詞中是否存在常規(guī)熱詞??梢詫⑺械哪繕?biāo)熱詞與所有的常規(guī)熱詞逐一對(duì)比,如果某個(gè)目標(biāo)熱詞與某個(gè)常規(guī)熱詞一致,則判斷出該目標(biāo)熱詞是常規(guī)熱詞;否則,如果某個(gè)目標(biāo)熱詞與任何一個(gè)常規(guī)熱詞都不一致,則判斷出該目標(biāo)熱詞不是常規(guī)熱詞。
[0081]過(guò)濾模塊303用于在判斷出目標(biāo)熱詞中存在常規(guī)熱詞時(shí),從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞。
[0082]通過(guò)本發(fā)明實(shí)施例,由于預(yù)先建立了常規(guī)熱詞的詞庫(kù),并將其存儲(chǔ)在相應(yīng)的數(shù)據(jù)庫(kù)列表中,便于目標(biāo)熱詞與該詞庫(kù)中的常規(guī)熱詞進(jìn)行對(duì)比。
[0083]優(yōu)選地,在本發(fā)明實(shí)施例中,該數(shù)據(jù)處理裝置還可以包括:第二確定單元。第二確定單元用于確定常規(guī)熱詞,其中,第二確定單元可以包括:第二獲取模塊、第二判斷模塊和確定模塊。第二獲取模塊用于獲取目標(biāo)熱詞的獨(dú)現(xiàn)頻率,獨(dú)現(xiàn)頻率為目標(biāo)熱詞獨(dú)立出現(xiàn)的頻率,也即,目標(biāo)熱詞不依附于目標(biāo)對(duì)象的關(guān)鍵詞而單獨(dú)出現(xiàn)的頻率。第二判斷模塊用于判斷目標(biāo)熱詞的獨(dú)現(xiàn)頻率是否大于第二預(yù)設(shè)頻率。第二預(yù)設(shè)頻率可以與前述的第一預(yù)設(shè)頻率相同。確定模塊用于在判斷出目標(biāo)熱詞的獨(dú)現(xiàn)頻率大于第二預(yù)設(shè)頻率時(shí),將目標(biāo)熱詞作為常規(guī)熱詞。
[0084]優(yōu)選地,根據(jù)本發(fā)明實(shí)施例,對(duì)象信息包括目標(biāo)對(duì)象的關(guān)鍵詞,第二獲取單元可以包括:第三獲取模塊、爬取模塊和第四獲取模塊。
[0085]第三獲取模塊用于獲取預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲。該網(wǎng)絡(luò)爬蟲可以是定向抓取相關(guān)網(wǎng)頁(yè)資源,自動(dòng)下載網(wǎng)頁(yè)程序,它根據(jù)既定的抓取目標(biāo),有選擇的訪問萬(wàn)維網(wǎng)上的網(wǎng)頁(yè)與相關(guān)的鏈接,獲取所需要的信息。它將目標(biāo)定為抓取與某一特定主題內(nèi)容相關(guān)的網(wǎng)頁(yè),為面向主題的用戶查詢準(zhǔn)備數(shù)據(jù)資源。爬取模塊用于利用預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲爬取目標(biāo)網(wǎng)站上的文本信息。這里,網(wǎng)絡(luò)爬蟲爬取的信息可以為目標(biāo)對(duì)象所在的文本信息。第四獲取模塊,用于根據(jù)關(guān)鍵詞從文本信息中獲取目標(biāo)熱詞。
[0086]通過(guò)本發(fā)明實(shí)施例,采用網(wǎng)絡(luò)爬蟲的手段,當(dāng)確定一個(gè)對(duì)象的對(duì)象信息(如,關(guān)鍵詞)時(shí),可以從互聯(lián)網(wǎng)的網(wǎng)頁(yè)上爬取到與該關(guān)鍵詞對(duì)應(yīng)的所有的文本信息,其中,該文本信息由大量的詞語(yǔ)構(gòu)成,根據(jù)爬取的文本信息確定與該對(duì)象同時(shí)出現(xiàn)的目標(biāo)熱詞。
[0087]優(yōu)選地,在本發(fā)明實(shí)施例中,該數(shù)據(jù)處理還可以包括:第三獲取單元和顯示單元。第三獲取單元用于在從目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞之后,確定過(guò)濾后的目標(biāo)熱詞的情緒屬性??梢酝ㄟ^(guò)語(yǔ)義分析技術(shù)分析過(guò)濾后的目標(biāo)熱詞的情緒屬性,其中,情緒屬性包含正、負(fù)情緒屬性以及中性情緒屬性。例如,在實(shí)施時(shí),可以預(yù)先設(shè)定詞語(yǔ)的情緒屬性,并將這些詞語(yǔ)存儲(chǔ)在預(yù)先設(shè)定的情緒屬性列表中,這樣,在確定過(guò)濾后的目標(biāo)熱詞的情緒屬性時(shí),可以將目標(biāo)熱詞與情緒屬性列表中的詞語(yǔ)進(jìn)行逐一匹配,如果匹配成功,則目標(biāo)熱詞的情緒屬性即為所匹配的詞語(yǔ)的情緒屬性。
[0088]顯示單元用于根據(jù)共現(xiàn)頻率顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息;和/或,根據(jù)關(guān)聯(lián)度顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息;和/或,根據(jù)情緒屬性顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息。例如,在根據(jù)情緒屬性顯示過(guò)濾后的目標(biāo)熱詞和對(duì)象信息(如,關(guān)鍵詞)時(shí),可以以氣泡、詞云等形式進(jìn)行顯示,使得目標(biāo)熱詞與目標(biāo)對(duì)象的關(guān)聯(lián)度更直觀、更形象。
[0089]顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0090]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法,其特征在于,包括: 獲取目標(biāo)對(duì)象的對(duì)象信息; 根據(jù)所述對(duì)象信息獲取目標(biāo)熱詞,所述目標(biāo)熱詞為與所述對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),所述共現(xiàn)頻率為所述目標(biāo)熱詞與所述對(duì)象信息同時(shí)出現(xiàn)的頻率; 從所述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,所述常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ);以及 確定所述目標(biāo)對(duì)象與所述過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。
2.根據(jù)權(quán)利要求1所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法,其特征在于,從所述目標(biāo)熱詞中濾除所述常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞包括: 獲取所述常規(guī)熱詞;以及 判斷所述目標(biāo)熱詞中是否存在所述常規(guī)熱詞;以及 如果判斷出所述目標(biāo)熱詞中存在所述常規(guī)熱詞,則從所述目標(biāo)熱詞中濾除所述常規(guī)熱詞,得到所述過(guò)濾后的目標(biāo)熱詞。
3.根據(jù)權(quán)利要求2所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法,其特征在于,通過(guò)以下方式確定所述常規(guī)熱詞: 獲取所述目標(biāo)熱詞的獨(dú)現(xiàn)頻率,所述獨(dú)現(xiàn)頻率為所述目標(biāo)熱詞獨(dú)立出現(xiàn)的頻率; 判斷所述目標(biāo)熱詞的所述獨(dú)現(xiàn)頻率是否大于第二預(yù)設(shè)頻率;以及如果判斷出所述目標(biāo)熱詞的所述獨(dú)現(xiàn)頻率大于所述第二預(yù)設(shè)頻率,則將所述目標(biāo)熱詞作為所述常規(guī)熱詞。
4.根據(jù)權(quán)利要求1所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法,其特征在于,所述對(duì)象信息包括所述目標(biāo)對(duì)象的關(guān)鍵詞,根據(jù)所述對(duì)象信息獲取目標(biāo)熱詞包括: 獲取預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲; 利用所述預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲爬取目標(biāo)網(wǎng)站上的文本信息;以及 根據(jù)所述關(guān)鍵詞從所述文本信息中獲取所述目標(biāo)熱詞。
5.根據(jù)權(quán)利要求1所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理方法,其特征在于,在從所述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞之后,所述數(shù)據(jù)處理方法還包括: 確定所述過(guò)濾后的目標(biāo)熱詞的情緒屬性;以及 根據(jù)所述共現(xiàn)頻率顯示所述過(guò)濾后的目標(biāo)熱詞和所述對(duì)象信息,和/或根據(jù)所述關(guān)聯(lián)度顯示所述過(guò)濾后的目標(biāo)熱詞和所述對(duì)象信息,和/或根據(jù)所述情緒屬性顯示所述過(guò)濾后的目標(biāo)熱詞和所述對(duì)象信息。
6.一種用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置,其特征在于,包括: 第一獲取單元,用于獲取目標(biāo)對(duì)象的對(duì)象信息; 第二獲取單元,用于根據(jù)所述對(duì)象信息獲取目標(biāo)熱詞,所述目標(biāo)熱詞為與所述對(duì)象信息的共現(xiàn)頻率大于第一預(yù)設(shè)頻率的詞語(yǔ),所述共現(xiàn)頻率為所述目標(biāo)熱詞與所述對(duì)象信息同時(shí)出現(xiàn)的頻率; 過(guò)濾單元,用于從所述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞,所述常規(guī)熱詞為預(yù)先設(shè)定的詞語(yǔ);以及 第一確定單元,用于確定所述目標(biāo)對(duì)象與所述過(guò)濾后的目標(biāo)熱詞的關(guān)聯(lián)度。
7.根據(jù)權(quán)利要求6所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置,所述過(guò)濾單元包括: 第一獲取模塊,用于獲取所述常規(guī)熱詞; 第一判斷模塊,用于判斷所述目標(biāo)熱詞中是否存在所述常規(guī)熱詞;以及 過(guò)濾模塊,用于在判斷出所述目標(biāo)熱詞中存在所述常規(guī)熱詞時(shí),從所述目標(biāo)熱詞中濾除所述常規(guī)熱詞,得到所述過(guò)濾后的目標(biāo)熱詞。
8.根據(jù)權(quán)利要求7所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置,其特征在于,所述數(shù)據(jù)處理裝置還包括第二確定單元,所述第二確定單元用于確定所述常規(guī)熱詞,其中,所述第二確定單元包括: 第二獲取模塊,用于獲取所述目標(biāo)熱詞的獨(dú)現(xiàn)頻率,所述獨(dú)現(xiàn)頻率為所述目標(biāo)熱詞獨(dú)立出現(xiàn)的頻率; 第二判斷模塊,用于判斷所述目標(biāo)熱詞的所述獨(dú)現(xiàn)頻率是否大于第二預(yù)設(shè)頻率;以及 確定模塊,用于在判斷出所述目標(biāo)熱詞的所述獨(dú)現(xiàn)頻率大于所述第二預(yù)設(shè)頻率時(shí),將所述目標(biāo)熱詞作為所述常規(guī)熱詞。
9.根據(jù)權(quán)利要求6所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置,其特征在于,所述對(duì)象信息包括所述目標(biāo)對(duì)象的關(guān)鍵詞,所述第二獲取單元包括: 第三獲取模塊,用于獲取預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲; 爬取模塊,用于利用所述預(yù)先設(shè)置的網(wǎng)絡(luò)爬蟲爬取目標(biāo)網(wǎng)站上的文本信息;以及 第四獲取模塊,用于根據(jù)所述關(guān)鍵詞從所述文本信息中獲取所述目標(biāo)熱詞。
10.根據(jù)權(quán)利要求6所述的用于網(wǎng)絡(luò)熱詞與對(duì)象的關(guān)聯(lián)度的數(shù)據(jù)處理裝置,其特征在于,所述數(shù)據(jù)處理還包括: 第三獲取單元,用于在從所述目標(biāo)熱詞中濾除常規(guī)熱詞,得到過(guò)濾后的目標(biāo)熱詞之后,確定所述過(guò)濾后的目標(biāo)熱詞的情緒屬性;以及 顯示單元,用于根據(jù)所述共現(xiàn)頻率顯示所述過(guò)濾后的目標(biāo)熱詞和所述對(duì)象信息,和/或根據(jù)所述關(guān)聯(lián)度顯示所述過(guò)濾后的目標(biāo)熱詞和所述對(duì)象信息,和/或根據(jù)所述情緒屬性顯示所述過(guò)濾后的目標(biāo)熱詞和所述對(duì)象信息。
【文檔編號(hào)】G06F17/30GK104408102SQ201410665109
【公開日】2015年3月11日 申請(qǐng)日期:2014年11月19日 優(yōu)先權(quán)日:2014年11月19日
【發(fā)明者】陳俊宏, 余德樂, 楊韜 申請(qǐng)人:北京國(guó)雙科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
阿鲁科尔沁旗| 济宁市| 拉萨市| 永靖县| 鲁山县| 澜沧| 太和县| 东乌珠穆沁旗| 滦南县| 安吉县| 本溪| 柏乡县| 那坡县| 岫岩| 肥城市| 元谋县| 托克托县| 磐石市| 普兰店市| 马龙县| 原平市| 乌兰浩特市| 瓦房店市| 曲沃县| 肃南| 福清市| 沂水县| 长阳| 泰安市| 邮箱| 江安县| 鹤壁市| 安平县| 和政县| 靖西县| 竹溪县| 肥西县| 泗阳县| 保山市| 武宣县| 湘潭市|