一種獲取產(chǎn)品信息的方法及裝置制造方法
【專利摘要】本發(fā)明適用于信息處理【技術(shù)領(lǐng)域】,提供了一種獲取產(chǎn)品信息的方法及裝置,所述方法包括:從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息;對(duì)采集的原始信息進(jìn)行過(guò)濾;對(duì)過(guò)濾后的信息進(jìn)行分析,獲取與所述產(chǎn)品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞;對(duì)所獲取的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行歸類,并對(duì)歸類后的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行統(tǒng)計(jì)和分析,獲取所述產(chǎn)品的分析報(bào)告。通過(guò)本發(fā)明可有效解決現(xiàn)有技術(shù)在獲取產(chǎn)品的相關(guān)體驗(yàn)信息時(shí)存在的成本高、效率低、平臺(tái)偏向性以及無(wú)法獲得定量數(shù)據(jù)等問(wèn)題。
【專利說(shuō)明】一種獲取產(chǎn)品信息的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于信息處理【技術(shù)領(lǐng)域】,尤其涉及一種獲取產(chǎn)品信息的方法及裝置。
【背景技術(shù)】
[0002]目如對(duì)網(wǎng)絡(luò)廣品的相關(guān)體驗(yàn)/[目息,例如網(wǎng)絡(luò)廣品使用情況、存在的問(wèn)題、建議等主要通過(guò)網(wǎng)絡(luò)問(wèn)卷調(diào)查或論壇搜集的方式獲取。
[0003]然而,網(wǎng)絡(luò)問(wèn)卷調(diào)查需要主動(dòng)邀請(qǐng)用戶的參與,尤其在非內(nèi)部平臺(tái)投放問(wèn)卷需要大量的資金支持,成本較高。而且通常需要經(jīng)過(guò)3-5天的時(shí)間進(jìn)行數(shù)據(jù)的投放和收集,并需要派專人去分類統(tǒng)計(jì),耗時(shí)較長(zhǎng)、效率較低,準(zhǔn)確率也無(wú)法保證。此外,投放問(wèn)卷的對(duì)象具有一定的平臺(tái)偏向性。
[0004]而論壇搜集也需要花費(fèi)大量的時(shí)間和精力在各大論壇網(wǎng)站監(jiān)測(cè)并搜集用戶反饋的信息,對(duì)用戶所反饋的信息只能進(jìn)行定性的統(tǒng)計(jì)分類,無(wú)法做到定量的分析。
[0005]綜上所述,現(xiàn)有技術(shù)在獲取網(wǎng)絡(luò)產(chǎn)品的相關(guān)體驗(yàn)信息時(shí),存在成本高、效率低、平臺(tái)偏向性以及無(wú)法獲得定量數(shù)據(jù)等問(wèn)題。
【發(fā)明內(nèi)容】
[0006]本發(fā)明實(shí)施例的目的在于提供一種獲取產(chǎn)品信息的方法,以解決現(xiàn)有技術(shù)存在的成本高、效率低、平臺(tái)偏向性以及無(wú)法獲得定量數(shù)據(jù)的問(wèn)題。
[0007]本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種獲取產(chǎn)品信息的方法,所述方法包括:
[0008]從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息;
[0009]對(duì)采集的原始信息進(jìn)行過(guò)濾;
[0010]對(duì)過(guò)濾后的信息進(jìn)行分析,獲取與所述產(chǎn)品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞;
[0011]對(duì)所獲取的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行歸類,并對(duì)歸類后的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行統(tǒng)計(jì)和分析,獲取所述產(chǎn)品信息的分析。
[0012]本發(fā)明實(shí)施例的另一目的在于提供一種獲取產(chǎn)品信息的裝置,所述裝置包括:
[0013]信息采集模塊,用于從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息;
[0014]信息過(guò)濾模塊,用于對(duì)所述信息采集模塊采集的原始信息進(jìn)行過(guò)濾;
[0015]信息分析模塊,用于對(duì)所述信息過(guò)濾模塊過(guò)濾后的信息進(jìn)行分析,獲取與所述產(chǎn)品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞;
[0016]結(jié)果獲取模塊,用于對(duì)所獲取的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行歸類,并對(duì)歸類后的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行統(tǒng)計(jì)和分析,獲取所述產(chǎn)品信息的分析報(bào)告。
[0017]從上述技術(shù)方案可以看出,本發(fā)明實(shí)施例通過(guò)從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息,并對(duì)所述原始信息進(jìn)行過(guò)濾、分析后獲取用戶對(duì)產(chǎn)品的評(píng)論趨勢(shì)(口碑詞)以及用戶對(duì)所述產(chǎn)品的關(guān)注熱點(diǎn)(熱點(diǎn)關(guān)注詞),對(duì)所獲取的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行歸類、統(tǒng)計(jì)和分析,獲取所述產(chǎn)品的分析報(bào)告,使得產(chǎn)品運(yùn)營(yíng)者可以根據(jù)所述分析報(bào)告充分了解用戶對(duì)所述產(chǎn)品的體驗(yàn)情況,便于對(duì)所述產(chǎn)品進(jìn)行改進(jìn),提高用戶滿意度。而且由于是直接從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息,所述原始信息都是用戶主動(dòng)提供(例如發(fā)表微博,在論壇留言等),不需要邀請(qǐng)用戶做調(diào)研,從而有效的降低了成本。同時(shí)信息采集后自動(dòng)化的處理過(guò)程,有效的提高了效率和準(zhǔn)確率。另外,由于同時(shí)覆蓋多個(gè)信息源(如騰訊微博、新浪微博、support平臺(tái)等),可有效避免由于平臺(tái)差異導(dǎo)致的偏向性、定量數(shù)據(jù)缺乏以及問(wèn)卷投放所需的高成本問(wèn)題。
【專利附圖】
【附圖說(shuō)明】
[0018]為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0019]圖1是本發(fā)明實(shí)施例一提供的獲取產(chǎn)品信息方法的實(shí)現(xiàn)流程圖;
[0020]圖2是本發(fā)明實(shí)施例二提供的獲取產(chǎn)品信息方法的具體流程圖;
[0021]圖3是本發(fā)明實(shí)施例三提供的獲取產(chǎn)品信息裝置的組成結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0022]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0023]為了說(shuō)明本發(fā)明所述的技術(shù)方案,下面通過(guò)具體實(shí)施例來(lái)進(jìn)行說(shuō)明。
[0024]實(shí)施例一:
[0025]圖1示出了本發(fā)明實(shí)施例一提供的獲取產(chǎn)品信息方法的實(shí)現(xiàn)流程,該方法過(guò)程詳述如下:
[0026]在步驟SlOl中,從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息。
[0027]具體是通過(guò)應(yīng)用程序編程接口(ApplicationProgramming Interface, API)和 /或網(wǎng)絡(luò)爬蟲(chóng)從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品(包括所述產(chǎn)品的名稱、系列別名或部分重點(diǎn)功能塊的名稱)相關(guān)的原始信息,并將采集的所述原始信息存儲(chǔ)至數(shù)據(jù)庫(kù)。在本實(shí)施例中,包括但不限于從微博和/或論壇采集原始信息,還可以從support平臺(tái)、Exp平臺(tái)
坐Φ隹
寸ο
[0028]需要說(shuō)明的是,本實(shí)施例在采集所述原始信息時(shí),可以預(yù)先設(shè)定采集的時(shí)間間隔(例如每隔I小時(shí)采集一次)或者連續(xù)多次的采集。
[0029]優(yōu)選的是,本實(shí)施例還包括:
[0030]將采集的所述原始信息按預(yù)設(shè)規(guī)則分類后存儲(chǔ),所述按預(yù)設(shè)規(guī)則分類包括按原始信息的內(nèi)容特征進(jìn)行分類,所述原始信息的內(nèi)容特征包括但不限于媒體信息、官方信息、廣告信息、預(yù)設(shè)的黑名單用戶評(píng)論信息等,如表一所示:
[0031]
【權(quán)利要求】
1.一種獲取產(chǎn)品信息的方法,其特征在于,所述方法包括: 從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息; 對(duì)采集的原始信息進(jìn)行過(guò)濾; 對(duì)過(guò)濾后的信息進(jìn)行分析,獲取與所述產(chǎn)品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞; 對(duì)所獲取的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行歸類,并對(duì)歸類后的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行統(tǒng)計(jì)和分析,獲取所述產(chǎn)品信息的分析報(bào)告。
2.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)采集的原始信息進(jìn)行過(guò)濾前還包括: 將采集的所述原始信息按其內(nèi)容特征進(jìn)行分類后存儲(chǔ)。
3.如權(quán)利要求1所述的方法,其特征在于,所述過(guò)濾包括去重處理以及去除無(wú)效信息的處理。
4.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)過(guò)濾后的信息進(jìn)行分析,獲取與所述廣品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞包括: 根據(jù)所述產(chǎn)品和/或其競(jìng)爭(zhēng)產(chǎn)品的通用名詞對(duì)過(guò)濾后的信息進(jìn)行分詞處理,獲得處理結(jié)果。
5.如權(quán)利要求4所述的方法,其特征在于,選取處理結(jié)果中達(dá)到一定出現(xiàn)頻次的詞語(yǔ),通過(guò)預(yù)存的詞庫(kù)對(duì)選取結(jié)果進(jìn)行篩選,獲取與所述產(chǎn)品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞。
6.如權(quán)利要求1所述的方法,其特征在于,所述方法在還包括: 從微博和/或論壇采集用戶評(píng)論的與所述產(chǎn)品相關(guān)的競(jìng)爭(zhēng)產(chǎn)品的信息。
7.一種獲取產(chǎn)品信息的裝置,其特征在于,所述裝置包括: 信息采集模塊,用于從微博和/或論壇采集用戶評(píng)論的與產(chǎn)品相關(guān)的原始信息; 信息過(guò)濾模塊,用于對(duì)所述信息采集模塊采集的原始信息進(jìn)行過(guò)濾; 信息分析模塊,用于對(duì)所述信息過(guò)濾模塊過(guò)濾后的信息進(jìn)行分析,獲取與所述產(chǎn)品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞; 結(jié)果獲取模塊,用于對(duì)所獲取的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行歸類,并對(duì)歸類后的熱點(diǎn)關(guān)注詞和/或口碑詞進(jìn)行統(tǒng)計(jì)和分析,獲取所述產(chǎn)品信息的分析報(bào)告。
8.如權(quán)利要求7所述的裝置,其特征在于,所述裝置包括: 信息存儲(chǔ)模塊,用于對(duì)采集的原始信息進(jìn)行過(guò)濾前,將采集的所述原始信息按其內(nèi)容特征進(jìn)行分類后存儲(chǔ)。
9.如權(quán)利要求7所述的裝置,其特征在于,所述過(guò)濾包括去重處理以及去除無(wú)效信息的處理。
10.如權(quán)利要求7所述的裝置,其特征在于,所述信息分析模塊包括: 處理模塊,用于根據(jù)所述產(chǎn)品和/或其競(jìng)爭(zhēng)產(chǎn)品的通用名詞對(duì)過(guò)濾后的信息進(jìn)行分詞處理,獲得處理結(jié)果。
11.如權(quán)利要求10所述的裝置,其特征在于,所述信息分析模塊還包括: 獲取模塊,用于從所述處理模塊的處理結(jié)果中選取達(dá)到一定出現(xiàn)頻次的詞語(yǔ),通過(guò)預(yù)存的詞庫(kù)對(duì)選取結(jié)果進(jìn)行篩選,獲取與所述產(chǎn)品相關(guān)的熱點(diǎn)關(guān)注詞和/或口碑詞。
12.如權(quán)利要求7所述的裝置,其特征在于,所述信息采集模塊還用于,從微博和/或論壇采集用戶評(píng)論的與所述產(chǎn)品相關(guān)的競(jìng)爭(zhēng)產(chǎn)品的信息。
【文檔編號(hào)】G06Q30/02GK103488635SQ201210190616
【公開(kāi)日】2014年1月1日 申請(qǐng)日期:2012年6月11日 優(yōu)先權(quán)日:2012年6月11日
【發(fā)明者】唐沐, 陳妍, 樊中一, 駱玘, 孫鵬, 牟偉成, 郭洪偉, 黃利賢, 呂虹, 胡煒, 蘇楠, 張弘 申請(qǐng)人:騰訊科技(深圳)有限公司