專利名稱:為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的計(jì)算機(jī)實(shí)現(xiàn)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)分析技術(shù),尤其涉及為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的方法和系統(tǒng)。
背景技術(shù):
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,尤其是因特網(wǎng)上的電子商務(wù)的普及,為人們的生活提供了諸多便利。在因特網(wǎng)上,人們可以對(duì)商品提供商提供的產(chǎn)品和服務(wù)作出評(píng)論,這些評(píng)論為提供商改善服務(wù),為消費(fèi)者選擇商品,提供了寶貴的信息。因特網(wǎng)上對(duì)產(chǎn)品和服務(wù)的評(píng)論,涉及產(chǎn)品或服務(wù)的各個(gè)方面,而且,即使針對(duì)同一個(gè)方面,不同的評(píng)論也常常含有不同的甚至截然相反的意見。因此,就單個(gè)評(píng)論而言,即使 該評(píng)論是嚴(yán)肅的、全面的,該評(píng)論中對(duì)所有方面的評(píng)點(diǎn),也未必全部具有代表性。因特網(wǎng)上對(duì)產(chǎn)品和服務(wù)的評(píng)論數(shù)量眾多,人們希望能從大量的評(píng)論中,看到對(duì)產(chǎn)品和服務(wù)的各個(gè)方面的具有一定可信度的評(píng)點(diǎn)內(nèi)容。
發(fā)明內(nèi)容
發(fā)明人發(fā)現(xiàn),根據(jù)其它用戶對(duì)一個(gè)產(chǎn)品評(píng)論的反饋意見來(lái)生成產(chǎn)品評(píng)論的摘錄,使生成的摘錄能反映其它用戶的總體意見,有助于提高所生成的摘錄的可信度。為此,本發(fā)明的各實(shí)施方式提供了一種用于為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的計(jì)算機(jī)實(shí)現(xiàn)的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。一方面,提供一種用于為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的計(jì)算機(jī)實(shí)現(xiàn)的方法,包含接收一個(gè)評(píng)論和對(duì)該評(píng)論的一組反饋,其中,所述評(píng)論包含多個(gè)評(píng)價(jià)語(yǔ)句,用于評(píng)價(jià)一個(gè)產(chǎn)品的產(chǎn)品特征;計(jì)算所述一組反饋對(duì)所述多個(gè)評(píng)價(jià)語(yǔ)句中的每個(gè)評(píng)價(jià)語(yǔ)句的支持度;根據(jù)所計(jì)算的對(duì)每個(gè)評(píng)價(jià)語(yǔ)句的支持度,從所述多個(gè)評(píng)價(jià)語(yǔ)句中抽取一個(gè)或多個(gè)評(píng)價(jià)語(yǔ)句,作為所述評(píng)論的摘錄。另一方面,提供一種用于為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的系統(tǒng),包含接收裝置,被配置為接收一個(gè)評(píng)論和對(duì)該評(píng)論的一組反饋,其中,所述評(píng)論包含多個(gè)評(píng)價(jià)語(yǔ)句,用于評(píng)價(jià)一個(gè)產(chǎn)品的產(chǎn)品特征;支持度計(jì)算裝置,被配置為計(jì)算所述一組反饋對(duì)所述多個(gè)評(píng)價(jià)語(yǔ)句中的每個(gè)評(píng)價(jià)語(yǔ)句的支持度;摘錄生成裝置,被配置為根據(jù)所計(jì)算的對(duì)每個(gè)評(píng)價(jià)語(yǔ)句的支持度,從所述多個(gè)評(píng)價(jià)語(yǔ)句中抽取一個(gè)或多個(gè)評(píng)價(jià)語(yǔ)句,作為所述評(píng)論的摘錄。
結(jié)合附圖并參考以下詳細(xì)說(shuō)明,本發(fā)明各實(shí)施方式的特征、優(yōu)點(diǎn)及其他方面將變得更加明顯,在此以示例性而非限制性的方式示出了本發(fā)明的若干實(shí)施方式。在附圖中圖I示意性示出了按照本發(fā)明一個(gè)實(shí)施例的系統(tǒng)的體系結(jié)構(gòu)的框圖;圖2示意性示出了按照本發(fā)明一個(gè)實(shí)施例的方法的流程圖;圖3示意性示出了按照本發(fā)明方法的另一個(gè)實(shí)施例的流程圖;圖4示意性示出了按照本發(fā)明方法的另一個(gè)實(shí)施例的流程圖。
具體實(shí)施例方式附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實(shí)施方式的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為備選的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。下面將參考若干示例性實(shí)施方式來(lái)描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解,給出這些實(shí)施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明, 而并非以任何方式限制本發(fā)明的范圍。下面參考附圖詳細(xì)描述本發(fā)明的各實(shí)施方式。本說(shuō)明書中總體涉及基于對(duì)評(píng)論的反饋,為評(píng)論生成關(guān)于產(chǎn)品的特征的摘錄。這里的產(chǎn)品,泛指一切可以由消費(fèi)者購(gòu)買的有形產(chǎn)品和無(wú)形產(chǎn)品,例如汽車、手機(jī)、旅游服務(wù)、訂票服務(wù)等等。產(chǎn)品的特征,指的是在評(píng)論中出現(xiàn)的與產(chǎn)品有關(guān)的概念,例如,對(duì)于手機(jī)這種特定產(chǎn)品而言,其特征有屏幕大小、電池容量等等,對(duì)于旅游服務(wù)這種特定產(chǎn)品而言,其特征有行程時(shí)間、安全性、舒適性等等。首先參看圖1,該圖示意性示出了按照本發(fā)明一個(gè)實(shí)施例的系統(tǒng)的體系結(jié)構(gòu)的框圖。如圖I所示的實(shí)施例的用于為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的系統(tǒng)100包含接收裝置102、支持度計(jì)算裝置104和摘錄生成裝置106。接收裝置102被配置為接收一個(gè)評(píng)論和對(duì)該評(píng)論的一組反饋,其中,所述評(píng)論包含多個(gè)評(píng)價(jià)語(yǔ)句,用于評(píng)價(jià)一個(gè)產(chǎn)品的產(chǎn)品特征。對(duì)產(chǎn)品的評(píng)論和對(duì)評(píng)論的反饋,廣泛存在于因特網(wǎng)上,例如頻繁出現(xiàn)在當(dāng)前流行的博客和微博中。常規(guī)的產(chǎn)品評(píng)論,通常篇幅較長(zhǎng),內(nèi)容比較全面。每個(gè)產(chǎn)品評(píng)論,往往能得到其它用戶的大量反饋,這種反饋針對(duì)產(chǎn)品評(píng)論中的觀點(diǎn),提出意見,通常直截了當(dāng),短小精焊。接收裝置102所接收的評(píng)論,例如可以由一個(gè)搜索引擎(圖中未予示出)響應(yīng)一個(gè)用戶搜索關(guān)于某產(chǎn)品的評(píng)論而提供。一般來(lái)說(shuō),搜索引擎可以搜索出多個(gè)關(guān)于相同產(chǎn)品的評(píng)論120_1. . . 120_m。接收裝置102所接收的評(píng)論是其中的一個(gè)評(píng)論120。為了便于說(shuō)明,作為示例,本文用下面的表1,給出一個(gè)表示因特網(wǎng)上一個(gè)對(duì)某手機(jī)的評(píng)論120。表I-評(píng)論 120最近換了一只X公司新上市的Y型手機(jī),用了半個(gè)月了,總算摸清了它的脾氣,說(shuō)出來(lái)給大家聽聽。
樣子很好看,桌面快捷方式和隱藏快捷方式很棒,雖然是電阻屏,但是靈敏度很好,分辨率還可以,通話聲音大,音盾好,耳機(jī)效果非常好,屏幕顯示效果不措,畫面亮麗,有WIFI和3G,上網(wǎng)方便且上網(wǎng)快。
系統(tǒng)不穩(wěn)定,有時(shí)程序會(huì)自動(dòng)終止,偶爾死機(jī),但并無(wú)大礙;照相不給力,無(wú)閃光燈的關(guān)系吧;電池才1000毫安,太小了。無(wú)法讓人接受的是不帶重力感應(yīng),還有應(yīng)用軟件還太少。
總體上來(lái)說(shuō),這款手機(jī)很不錯(cuò),畢竟只是中端機(jī),沒(méi)有那么高的配置很正常,滿足一般人群的使用吧!對(duì)于低收入人群、學(xué)生等是不錯(cuò)選擇。畢竟一分錢一分貨,性價(jià)比還行,我很喜歡這款手機(jī)的。_因特網(wǎng)上的評(píng)論,一般都有其它用戶對(duì)其作出的反饋125_1. . . 125_n,這些反饋也可以由搜索引擎提供。下面表2,示例性地表示對(duì)表I所示的評(píng)論120的一組反饋,該組反饋有28個(gè)反饋(125_1. . . 125_28)。為了敘述方便,以下將這些反饋統(tǒng)稱為反饋125。
表2-反饋 125
權(quán)利要求
1.一種用于為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的計(jì)算機(jī)實(shí)現(xiàn)的方法,包含 接收一個(gè)評(píng)論和對(duì)該評(píng)論的一組反饋,其中,所述評(píng)論包含多個(gè)評(píng)價(jià)語(yǔ)句,用于評(píng)價(jià)一個(gè)產(chǎn)品的產(chǎn)品特征; 計(jì)算所述一組反饋對(duì)所述多個(gè)評(píng)價(jià)語(yǔ)句中的每個(gè)評(píng)價(jià)語(yǔ)句的支持度; 根據(jù)所計(jì)算的對(duì)每個(gè)評(píng)價(jià)語(yǔ)句的支持度,從所述多個(gè)評(píng)價(jià)語(yǔ)句中抽取一個(gè)或多個(gè)評(píng)價(jià)語(yǔ)句,作為所述評(píng)論的摘錄。
2.權(quán)利要求I的方法,其中,所述計(jì)算所述一組反饋對(duì)所述多個(gè)評(píng)價(jià)語(yǔ)句中的每個(gè)評(píng)價(jià)語(yǔ)句的支持度包含 識(shí)別所述每個(gè)評(píng)價(jià)語(yǔ)句涉及的產(chǎn)品特征; 識(shí)別所述一組反饋中的每個(gè)反饋涉及的產(chǎn)品特征; 根據(jù)各自涉及的產(chǎn)品特征,在所述評(píng)論中的評(píng)論語(yǔ)句與反饋之間建立關(guān)聯(lián)關(guān)系; 確定評(píng)價(jià)語(yǔ)句是否得到相關(guān)聯(lián)的反饋的支持。
3.權(quán)利要求2的方法,其中,所述確定評(píng)價(jià)語(yǔ)句是否得到相關(guān)聯(lián)的反饋的支持包含 確定每個(gè)評(píng)價(jià)語(yǔ)句對(duì)所涉及的產(chǎn)品特征的褒貶極向; 確定每個(gè)反饋對(duì)所涉及的產(chǎn)品特征的褒貶極向; 根據(jù)該評(píng)價(jià)語(yǔ)句的褒貶極向與反饋的褒貶極向是否一致,確定評(píng)價(jià)語(yǔ)句是否得到相關(guān)聯(lián)的反饋的支持。
4.權(quán)利要求2的方法,其中,所述識(shí)別所述每個(gè)評(píng)價(jià)語(yǔ)句涉及的產(chǎn)品特征,包含利用預(yù)定義的特征詞庫(kù)來(lái)識(shí)別所述每個(gè)評(píng)價(jià)語(yǔ)句涉及的產(chǎn)品特征。
5.權(quán)利要求2的方法,其中,所述識(shí)別所述一組反饋中的每個(gè)反饋涉及的產(chǎn)品特征,包含利用預(yù)定義的特征詞庫(kù)來(lái)識(shí)別所述一組反饋中的每個(gè)反饋涉及的產(chǎn)品特征。
6.權(quán)利要求3的方法,其中,利用情感分析技術(shù)來(lái)確定每個(gè)評(píng)價(jià)語(yǔ)句對(duì)所涉及的產(chǎn)品特征的褒貶極向。
7.權(quán)利要求6的方法,其中,所述情感分析技術(shù)利用預(yù)定義的情感詞典確定每個(gè)評(píng)價(jià)語(yǔ)句中對(duì)所涉及的產(chǎn)品特征的評(píng)價(jià)詞的褒貶極向,由此確定每個(gè)評(píng)價(jià)語(yǔ)句對(duì)所涉及的產(chǎn)品特征的褒貶極向。
8.權(quán)利要求3的方法,其中,利用情感分析技術(shù)來(lái)確定每個(gè)反饋對(duì)所涉及的產(chǎn)品特征的褒貶極向。
9.權(quán)利要求8的方法,其中,所述情感分析技術(shù)利用預(yù)定義的情感詞典確定每個(gè)反饋句中對(duì)所涉及的產(chǎn)品特征的評(píng)價(jià)詞的褒貶極向,由此確定每個(gè)反饋對(duì)所涉及的產(chǎn)品特征的褒貶極向。
10.一種用于為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的系統(tǒng),包含 接收裝置,被配置為接收一個(gè)評(píng)論和對(duì)該評(píng)論的一組反饋,其中,所述評(píng)論包含多個(gè)評(píng)價(jià)語(yǔ)句,用于評(píng)價(jià)一個(gè)產(chǎn)品的產(chǎn)品特征; 支持度計(jì)算裝置,被配置為計(jì)算所述一組反饋對(duì)所述多個(gè)評(píng)價(jià)語(yǔ)句中的每個(gè)評(píng)價(jià)語(yǔ)句的支持度; 摘錄生成裝置,被配置為根據(jù)所計(jì)算的對(duì)每個(gè)評(píng)價(jià)語(yǔ)句的支持度,從所述多個(gè)評(píng)價(jià)語(yǔ)句中抽取一個(gè)或多個(gè)評(píng)價(jià)語(yǔ)句,作為所述評(píng)論的摘錄。
11.權(quán)利要求10的系統(tǒng),其中,所述支持度計(jì)算裝置包含特征識(shí)別器,被配置為識(shí)別所述每個(gè)評(píng)價(jià)語(yǔ)句涉及的產(chǎn)品特征和所述一組反饋中的每個(gè)反饋涉及的產(chǎn)品特征; 關(guān)聯(lián)裝置,被配置為根據(jù)各自涉及的產(chǎn)品特征,在該評(píng)論中的評(píng)論語(yǔ)句與反饋之間建立關(guān)聯(lián)關(guān)系; 支持性確定裝置,被配置為確定評(píng)價(jià)語(yǔ)句是否得到相關(guān)聯(lián)的反饋的支持。
12.權(quán)利要求11的系統(tǒng),其中,所述支持性確定裝置包含 極向分類器,被配置為確定每個(gè)評(píng)價(jià)語(yǔ)句對(duì)所涉及的產(chǎn)品特征的褒貶極向和每個(gè)反饋對(duì)所涉及的產(chǎn)品特征的褒貶極向; 其中,所述支持性確定裝置根據(jù)評(píng)價(jià)語(yǔ)句的褒貶極向與反饋的褒貶極向是否一致,確定評(píng)價(jià)語(yǔ)句是否得到相關(guān)聯(lián)的反饋的支持。
13.權(quán)利要求11的系統(tǒng),其中,所述特征識(shí)別器利用預(yù)定義的特征詞庫(kù)來(lái)識(shí)別所述每個(gè)評(píng)價(jià)語(yǔ)句涉及的產(chǎn)品特征。
14.權(quán)利要求11的方法,其中,所述特征識(shí)別器利用預(yù)定義的特征詞庫(kù)來(lái)識(shí)別所述一組反饋中的每個(gè)反饋涉及的產(chǎn)品特征。
15.權(quán)利要求12的方法,其中,所述極向分類器利用情感分析技術(shù)來(lái)確定每個(gè)評(píng)價(jià)語(yǔ)句對(duì)所涉及的產(chǎn)品特征的褒貶極向。
16.權(quán)利要求15的方法,其中,所述情感分析技術(shù)利用預(yù)定義的情感詞典確定每個(gè)評(píng)價(jià)語(yǔ)句中對(duì)所涉及的產(chǎn)品特征的評(píng)價(jià)詞的褒貶極向,由此確定每個(gè)評(píng)價(jià)語(yǔ)句對(duì)所涉及的產(chǎn)品特征的褒貶極向。
17.權(quán)利要求12的方法,其中,所述極向分類器利用情感分析技術(shù)來(lái)確定每個(gè)反饋對(duì)所涉及的產(chǎn)品特征的褒貶極向。
18.權(quán)利要求17的方法,其中,所述情感分析技術(shù)利用預(yù)定義的情感詞典確定每個(gè)反饋句中對(duì)所涉及的產(chǎn)品特征的評(píng)價(jià)詞的褒貶極向,由此確定每個(gè)反饋對(duì)所涉及的產(chǎn)品特征的褒貶極向。
全文摘要
本發(fā)明的各實(shí)施方式涉及數(shù)據(jù)分析技術(shù),尤其涉及為互聯(lián)網(wǎng)上的評(píng)論生成摘錄的計(jì)算機(jī)實(shí)現(xiàn)的方法和系統(tǒng),該方法包含接收一個(gè)評(píng)論和對(duì)該評(píng)論的一組反饋,其中,所述評(píng)論包含多個(gè)評(píng)價(jià)語(yǔ)句,用于評(píng)價(jià)一個(gè)產(chǎn)品的產(chǎn)品特征;計(jì)算所述一組反饋對(duì)所述多個(gè)評(píng)價(jià)語(yǔ)句中的每個(gè)評(píng)價(jià)語(yǔ)句的支持度;根據(jù)所計(jì)算的對(duì)每個(gè)評(píng)價(jià)語(yǔ)句的支持度,從所述多個(gè)評(píng)價(jià)語(yǔ)句中抽取一個(gè)或多個(gè)評(píng)價(jià)語(yǔ)句,作為所述評(píng)論的摘錄。
文檔編號(hào)G06F17/30GK102760264SQ201110110409
公開日2012年10月31日 申請(qǐng)日期2011年4月29日 優(yōu)先權(quán)日2011年4月29日
發(fā)明者?;奂? 蘇中, 蔡柯柯, 郭宏蕾 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司