两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

評論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)與流程

文檔序號:11234061閱讀:957來源:國知局
評論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)與流程

本發(fā)明實(shí)施例涉及計(jì)算機(jī)技術(shù),尤其涉及一種評論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)。



背景技術(shù):

隨著人工智能技術(shù)的飛速發(fā)展,如何讓機(jī)器能擁有和人類一樣的智能成為當(dāng)下研究的熱點(diǎn)課題。在該背景下,人們希望機(jī)器能夠讀懂一篇文章,并且能夠給出有自己觀點(diǎn)的評論,或者給出互聯(lián)網(wǎng)用戶對這篇文章的一般性觀點(diǎn)。

現(xiàn)有技術(shù)中,通過傳統(tǒng)的信息檢索技術(shù),基于評論事件的關(guān)鍵詞索引出相關(guān)評論事件的評論,并基于評論事件之間的相關(guān)性給出當(dāng)前評論事件的評論信息。該方案的缺陷在于,評論信息嚴(yán)重同質(zhì)化且相關(guān)性較差,評論信息的智能化程度低,效率低下。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供了一種評論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì),使得評論信息和評論事件的相關(guān)性增強(qiáng),評論信息的確定更加智能化,效率更高。

第一方面,本發(fā)明實(shí)施例提供了一種評論信息確定方法,包括:

獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽;

將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論,所述評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成,所述評論圖譜包含有評論內(nèi)容以及對應(yīng)的評論標(biāo)簽;

對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息。

第二方面,本發(fā)明實(shí)施例還提供了一種評論信息確定裝置,包括:

事件標(biāo)簽確定模塊,用于獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽;

候選評論確定模塊,用于將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論,所述評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成,所述評論圖譜包含有評論內(nèi)容以及對應(yīng)的評論標(biāo)簽;

評論信息確定模塊,用于對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息。

第三方面,本發(fā)明實(shí)施例還提供了一種服務(wù)器,所述服務(wù)器包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)前述評論信息確定方法。

第四方面,本發(fā)明實(shí)施例還提供了一種包含計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令在由計(jì)算機(jī)處理器執(zhí)行時(shí)用于執(zhí)行一種評論信息確定方法,該方法包括:

獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽;

將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論,所述評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成,所述評論圖譜包含有評論內(nèi)容以及對應(yīng)的評論標(biāo)簽;

對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息。

本發(fā)明實(shí)施例提供的技術(shù)方案,通過獲取評論事件的文本內(nèi)容,依據(jù)文本內(nèi)容確定評論事件的事件標(biāo)簽,將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論后在最終從候選評論中得到評論信息用以對評論事件進(jìn)行評論,使得評論信息和評論事件的相關(guān)性增強(qiáng),評論信息的確定更加智能化,效率更高。

附圖說明

通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:

圖1a是本發(fā)明實(shí)施例提供的一種評論信息確定方法的流程圖;

圖1b是本發(fā)明實(shí)施例提供的一種評論信息確定方法過程中利用到的評論圖譜的示意圖;

圖2是本發(fā)明實(shí)施例提供的另一種評論信息確定方法的流程圖;

圖3是本發(fā)明實(shí)施例提供的另一種評論信息確定方法的流程圖;

圖4是本發(fā)明實(shí)施例提供的另一種評論信息確定方法的流程圖;

圖5本發(fā)明實(shí)施例提供的評論信息確定裝置的結(jié)構(gòu)框圖;

圖6是本發(fā)明實(shí)施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步的詳細(xì)說明。可以理解的是,此處所描述的具體實(shí)施例僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。

圖1a是本發(fā)明實(shí)施例提供的一種評論信息確定方法的流程圖,本實(shí)施例可適用于自動(dòng)對評論事件進(jìn)行評論的情況,該方法可由計(jì)算設(shè)備如服務(wù)器來執(zhí)行,如圖1a所示,本實(shí)施例提供的具體方案如下:

s101、獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽。

在一個(gè)實(shí)施例中,評論事件可以是新聞事件、微信公眾號文章、微博、博客等,其中,評論事件的文本內(nèi)容為該事件的文字內(nèi)容,該文字內(nèi)容可以是描述一個(gè)具體的新聞事件,還可以是對某個(gè)明星、人物的描寫,還可以是對某個(gè)地點(diǎn)(如風(fēng)景名勝景點(diǎn))的記錄、描寫,本實(shí)施例不做限定。本方案中,可自動(dòng)生成評論信息以對該評論事件進(jìn)行評論。示例性的,如張三通過微信公眾號發(fā)布了一篇關(guān)于名人a的娛樂八卦文章,則通過本方案可自動(dòng)形成針對該八卦文章的評論信息。具體的,可通過網(wǎng)絡(luò)爬蟲爬取到張三發(fā)布的娛樂八卦文章的網(wǎng)站網(wǎng)頁,通過獲取到的網(wǎng)頁內(nèi)容確定出評論事件(即這篇八卦文章)的文本內(nèi)容。

其中,事件標(biāo)簽表征了評論事件的報(bào)道對象、地點(diǎn)、具體發(fā)生的事情等,示例性的,評論事件為一篇網(wǎng)頁新聞,網(wǎng)址為:

http://news.youth.cn/jsxw/201702/t20170224_12345678.htm,主要報(bào)道內(nèi)容是名人a曬的老年妝的照片,則相應(yīng)的,該評論事件的事件標(biāo)簽可以被確定為“名人a”、“曬”、“老年妝”、“照片”。

在一個(gè)實(shí)施例中,依據(jù)評論事件的文本內(nèi)容確定對應(yīng)的事件標(biāo)簽的過程可以是:

首先,對文本內(nèi)容進(jìn)行預(yù)處理,得到對應(yīng)的詞語集合。示例性的,通過對文本內(nèi)容進(jìn)行基于語義、語法的識別和斷句,將文本內(nèi)容表述的自然語言分?jǐn)酁檫^個(gè)單獨(dú)的詞語。舉例而言,評論事件的文本內(nèi)容為“搜狐娛樂訊23日晚,名人a曬出一張自己老年妝的照片,照片中,名人a頭發(fā)花白卷曲,架著一副老花鏡,穿著羊毛開衫,駝著背。名人a配文:多期盼能陪你老去。我可能改變了命運(yùn),因?yàn)槟慊貋砹?。歲月可能留不下美麗的容顏,但能這樣和愛的人一起老去,也挺好的?!睂?yīng)的,得到的詞語的集合可以是“搜狐、娛樂、名人a、曬、老年妝、照片...”。

在確定出評論事件文本內(nèi)容對應(yīng)的詞語集合后,通過預(yù)設(shè)學(xué)習(xí)模型確定所述詞語集合中詞語的權(quán)重值,將滿足條件的權(quán)重值對應(yīng)的詞語確定為所述評論事件的事件標(biāo)簽。具體的,該預(yù)設(shè)學(xué)習(xí)模型由svm(supportvectormachine,支持向量機(jī))通過對詞語在詞語集合中出現(xiàn)的次數(shù)、位置、是否為專業(yè)名詞、是否出現(xiàn)在標(biāo)題中等多個(gè)特征維度學(xué)習(xí)訓(xùn)練得到,其中,該預(yù)設(shè)學(xué)習(xí)模型可預(yù)先學(xué)習(xí)得到,在需要確定評論事件的事件標(biāo)簽時(shí),用于確定得到的詞語集合中詞語的權(quán)重值,示例性的,詞語集合中,詞語“名人a”出現(xiàn)了3次,且出現(xiàn)在了評論事件標(biāo)題中,則詞語“名人a”的權(quán)重值最高,其中詞語“照片”出現(xiàn)了兩次,且也出現(xiàn)在標(biāo)題中權(quán)重值也較高,詞語“搜狐”出現(xiàn)一次,出現(xiàn)頻率較低,且非標(biāo)題中的詞語,則相應(yīng)的詞語“搜狐”的權(quán)重值較低。通過確定出的詞語的權(quán)重值來最終確定合適的事件標(biāo)簽,具體的,可按照權(quán)重值的高低又高到低對詞語進(jìn)行排序,根據(jù)詞語集合中詞語的數(shù)量以及欲得到的事件標(biāo)簽的數(shù)量選取合適的百分比例,將排名靠前的詞語確定為事件標(biāo)簽。

s102、將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論。

在一個(gè)實(shí)施例中,評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成,所述評論圖譜包含有評論內(nèi)容以及對應(yīng)的評論標(biāo)簽。圖1b是本發(fā)明實(shí)施例提供的一種評論信息確定方法過程中利用到的評論圖譜的示意圖。如圖1b所示,該評論圖譜由多個(gè)節(jié)點(diǎn)以及節(jié)點(diǎn)到節(jié)點(diǎn)的邊組成。其中,評論圖譜的節(jié)點(diǎn)可以分為評論節(jié)點(diǎn)和標(biāo)簽節(jié)點(diǎn),評論節(jié)點(diǎn)中存儲(chǔ)的內(nèi)容即為具體的評論內(nèi)容,如“<名人a,真美,+>”,:“名人a,支持,+”,“無聊的人天天就關(guān)注名人事件,-”等,評論節(jié)點(diǎn)中的“+”代表了評論內(nèi)容為正向內(nèi)容,即表征積極情緒的評論內(nèi)容,“-”則相反,代表消極的,批判性的評論內(nèi)容。評論圖譜中的另一類節(jié)點(diǎn)如“名人a明星女”,“名人b明星男”即為標(biāo)簽節(jié)點(diǎn),標(biāo)簽節(jié)點(diǎn)中存儲(chǔ)的內(nèi)容即為評論標(biāo)簽,其中評論標(biāo)簽由評論內(nèi)容以及該評論內(nèi)容對應(yīng)的評論事件確定得出。

在一個(gè)實(shí)施例中,將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論。為了便于說明,將候選評論的確定過程中標(biāo)簽的比對進(jìn)行簡化,示例性的,若確定出的事件標(biāo)簽為“名人a”,則相應(yīng)的,在評論圖譜中找到包含“名人a”的評論標(biāo)簽,將該評論標(biāo)簽指向的評論內(nèi)容“名人a,真美”作為候選評論。

在一個(gè)實(shí)施例中,將確定出的事件標(biāo)簽和評論圖譜中評論內(nèi)容對應(yīng)的評論標(biāo)簽進(jìn)行比對,依據(jù)評論標(biāo)簽命中的事件標(biāo)簽的數(shù)量的大小,由高到低對所述評論內(nèi)容進(jìn)行排序,將排序靠前的評論內(nèi)容作為候選評論。

舉例而言,如確定出的評論事件的事件標(biāo)簽為“名人a曬照片”,相應(yīng)的通過評論圖譜得到的候選評論可以為(評論內(nèi)容根據(jù)命中的事件標(biāo)簽的數(shù)量由高到低排序后取排名靠前的評論內(nèi)容的結(jié)果展示):

a)怎么看都好看,小骨美美噠(該候選評論的評論標(biāo)簽為:名人a曬照片);

b)依舊是大眼睛(該候選評論的評論標(biāo)簽為:名人a曬照片);

c)名人a真漂亮(該候選評論的評論標(biāo)簽為:名人a照片)。

其中,候選評論a、b和c分別命中的事件標(biāo)簽的數(shù)量為3、3、2。

s103、對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息。

在一個(gè)實(shí)施例中,預(yù)設(shè)條件指的可以是:評論內(nèi)容對應(yīng)的評論標(biāo)簽為事件標(biāo)簽的子集,同時(shí),評論標(biāo)簽命中的事件標(biāo)簽越多的評論內(nèi)容越優(yōu)選作為評論信息。由于事件標(biāo)簽一旦沒有覆蓋到評論標(biāo)簽,即評論標(biāo)簽中出現(xiàn)事件標(biāo)簽中不存在的標(biāo)簽,則該評論內(nèi)容極易偏離評論主線,故采取上述預(yù)設(shè)條件。

以s102中舉例為例,最終確定出的評論信息可以是“怎么看都好看,小骨美美噠”和“依舊是大眼睛”。

本實(shí)施例提供了一種評論信息確定方法,借助于大數(shù)據(jù)挖掘得到的評論圖譜對評論事件進(jìn)行自動(dòng)評論,評論圖譜中的評論標(biāo)簽由評論內(nèi)容以及該評論內(nèi)容對應(yīng)的評論事件得到,而非單純的依據(jù)評論內(nèi)容提取關(guān)鍵詞和事件標(biāo)簽進(jìn)行比對得到評論信息,使得評論信息和評論事件的相關(guān)性增強(qiáng),評論信息的確定更加智能化,效率更高。

圖2是本發(fā)明實(shí)施例提供的另一種評論信息確定方法的流程圖,在上述實(shí)施例的基礎(chǔ)上,可選的,對所述文本內(nèi)容進(jìn)行預(yù)處理之前,還包括:

在所述文本內(nèi)容中抽取文本要素;

相應(yīng)的,在將滿足條件的權(quán)重值對應(yīng)的詞語確定為所述評論事件的事件標(biāo)簽之后,還包括:

將包含所述事件標(biāo)簽的文本要素中的其它關(guān)鍵詞語也確定為所述評論事件的事件標(biāo)簽。

由此,提高了確定出的事件標(biāo)簽的完整性,更加符合評論事件自身的情景。

基于上述優(yōu)化,如圖2所示,本實(shí)施例提供的技術(shù)方案具體如下:

s201、獲取評論事件的文本內(nèi)容,在所述文本內(nèi)容中抽取文本要素,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽。

其中,文本要素可通過事件抽取的方式從文本內(nèi)容中抽取得到,事件可被描述為一個(gè)動(dòng)作的發(fā)生或者狀態(tài)的變化,事件本身包括事件類型和事件要素,在ace會(huì)議中一共定義了8中事件類別以及33中事件子類別。

具體的,舉例而言,假定文本內(nèi)容為“網(wǎng)曝名人a名人b假戲真做坐實(shí)戀情,名人a名人b戀愛細(xì)節(jié)遭扒”,則相應(yīng)的通過事件抽取程序、算法確定出的文本要素為“坐實(shí)戀情,名人a,名人b,none,none”,其中文本要素中的每個(gè)單獨(dú)的詞語可被認(rèn)定為關(guān)鍵詞語。

s202、將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論。

s203、對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息,同時(shí),將包含所述事件標(biāo)簽的文本要素中的其它關(guān)鍵詞語也確定為所述評論事件的事件標(biāo)簽。

舉例而言,若確定出的事件標(biāo)簽為“名人a名人b”,s201中確定出的文本要素為“坐實(shí)戀情,名人a,名人b,none,none”,則將文本要素中沒有被確定為事件標(biāo)簽的關(guān)鍵詞語“坐實(shí)戀情”一并確定為事件標(biāo)簽。

本實(shí)施例提供了一種評論信息確定方法,在確定事件標(biāo)簽過程中,對評論事件的文本內(nèi)容進(jìn)行事件抽取得到文本要素,如果文本要素中的關(guān)鍵詞語被確定出的事件標(biāo)簽命中,則將文本要素中的其它關(guān)鍵詞語一并確定為事件標(biāo)簽,提高了確定出的事件標(biāo)簽的完整性,進(jìn)一步提高了后續(xù)評論信息的相關(guān)性。

圖3是本發(fā)明實(shí)施例提供的另一種評論信息確定方法的流程圖,在上述實(shí)施例的基礎(chǔ)上,可選的,評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成的過程包括:

通過網(wǎng)絡(luò)爬蟲定向抓取并確定評論內(nèi)容;

通過預(yù)設(shè)識別模型對所述評論內(nèi)容進(jìn)行識別,確定和所述評論內(nèi)容對應(yīng)的評論主體和評論觀點(diǎn);

依據(jù)所述評論主體、所述評論觀點(diǎn)以及所述評論內(nèi)容對應(yīng)的評論事件確定所述評論內(nèi)容對應(yīng)的評論標(biāo)簽;

將所述評論內(nèi)容以及確定出的評論標(biāo)簽以結(jié)構(gòu)化形式存儲(chǔ)為評論圖譜。

基于上述優(yōu)化,如圖3所示,本實(shí)施例提供的技術(shù)方案具體如下:

s301、通過網(wǎng)絡(luò)爬蟲定向抓取并確定評論內(nèi)容,通過預(yù)設(shè)識別模型對所述評論內(nèi)容進(jìn)行識別,確定和所述評論內(nèi)容對應(yīng)的評論主體和評論觀點(diǎn)。

在一個(gè)實(shí)施例中,評論內(nèi)容抓取、確定的方式可以是:從海量的互聯(lián)網(wǎng)網(wǎng)頁、微博以及ugc資源中,挖掘出有情感傾向的文本,利用網(wǎng)絡(luò)爬蟲,定向抓取評論類型網(wǎng)頁,新聞資訊評論,bbs,微博等潛在擁有評論數(shù)據(jù)的網(wǎng)站數(shù)據(jù),對網(wǎng)頁內(nèi)容進(jìn)行提取以及斷句,生成潛在的評論語句,利用情感傾向性分析技術(shù),選擇出有情感傾向的句子,最終確定為評論內(nèi)容。

在一個(gè)實(shí)施例中,該預(yù)設(shè)識別模型可以是crf模型(一種無向圖模型,在分詞、詞性標(biāo)注和命名實(shí)體識別等序列標(biāo)注任務(wù)中效果良好),利用crf模型對所述評論內(nèi)容進(jìn)行識別,確定和所述評論內(nèi)容對應(yīng)的評論主體和評論觀點(diǎn)。舉例而言,評論內(nèi)容為“西游伏妖篇,蠻好看的!”,則確定出的評論主體為“西游伏妖篇”,評論觀點(diǎn)為“蠻好看的”。又如,評論內(nèi)容為“我喜歡名人c”,則通過crf模型識別確定出的評論主體是“名人c”,評論觀點(diǎn)是“我喜歡”。

s302、依據(jù)所述評論主體、所述評論觀點(diǎn)以及所述評論內(nèi)容對應(yīng)的評論事件確定所述評論內(nèi)容對應(yīng)的評論標(biāo)簽,將所述評論內(nèi)容以及確定出的評論標(biāo)簽以結(jié)構(gòu)化形式存儲(chǔ)為評論圖譜。

在一個(gè)實(shí)施例中,評論標(biāo)簽是約束評論的評價(jià)環(huán)境的詞的集合,評論標(biāo)簽在確定過程中和評論事件緊密相關(guān)。具體的,首先確定評論事件的事件標(biāo)簽,確定方式如前s101中的描述,此處不再贅述,在確定完畢事件標(biāo)簽后,依據(jù)評論主體、評論觀點(diǎn)以及事件標(biāo)簽最終確定評論標(biāo)簽,評論標(biāo)簽的確定策略包括:同義詞詞典直接匹配、基于規(guī)則對專名進(jìn)行同義對齊或基于評論中的實(shí)義詞與事件標(biāo)簽的相似度進(jìn)行篩選。其中,評論圖譜的具體形式參見s102中的描述,此處不再贅述。

s303、獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽。

s304、將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論。

s305、對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息。

本實(shí)施例提供了一種評論信息確定方法,通過網(wǎng)絡(luò)爬蟲定向抓取并確定評論內(nèi)容,通過預(yù)設(shè)識別模型對所述評論內(nèi)容進(jìn)行識別,確定和所述評論內(nèi)容對應(yīng)的評論主體和評論觀點(diǎn),依據(jù)所述評論主體、所述評論觀點(diǎn)以及所述評論內(nèi)容對應(yīng)的評論事件確定所述評論內(nèi)容對應(yīng)的評論標(biāo)簽,將所述評論內(nèi)容以及確定出的評論標(biāo)簽以結(jié)構(gòu)化形式存儲(chǔ)為評論圖譜,使得評論信息和評論事件的相關(guān)性增強(qiáng),評論信息的確定更加智能化,效率更高。

圖4是本發(fā)明實(shí)施例提供的另一種評論信息確定方法的流程圖,在上述實(shí)施例的基礎(chǔ)上,可選的,對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息包括:

將候選評論中的評論標(biāo)簽和所述評論事件的事件標(biāo)簽一致且正向的候選評論確定為所述評論事件的評論信息。

由此,進(jìn)一步提高了評論信息和評論事件的相關(guān)性。

基于上述優(yōu)化,如圖4所示,本實(shí)施例提供的技術(shù)方案具體如下:

s401獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽。

s402、將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論。

s403、將候選評論中的評論標(biāo)簽和所述評論事件的事件標(biāo)簽一致且正向的候選評論確定為所述評論事件的評論信息。

舉例而言,如確定出的評論事件的事件標(biāo)簽為“名人a曬照片”,相應(yīng)的通過評論圖譜得到的候選評論可以為:

a)怎么看都好看,小骨美美噠(該候選評論的評論標(biāo)簽為:名人a曬照片);

b)依舊是大眼睛(該候選評論的評論標(biāo)簽為:名人a曬照片);

c)美圖前后差別不大(該候選評論的評論標(biāo)簽為:名人a曬美顏前后對比照片);

d)名人a真漂亮(該候選評論的評論標(biāo)簽為:名人a照片)。

其中,候選評論c中的評論標(biāo)簽雖然也全部命中了事件標(biāo)簽,但由于評論標(biāo)簽中包含了“美顏前后對比”等內(nèi)容,導(dǎo)致該條候選評論和評論事件的相關(guān)性較差,故排除c作為最終的評論信息。

機(jī)器通過對大量語句的訓(xùn)練、學(xué)習(xí)后,具備判斷一條語句是正向還是負(fù)向的能力,本實(shí)施例中,選取了正向的候選評論作為最終的評論信息,根據(jù)不同用戶、企業(yè)的需求可以選擇負(fù)向的候選評論或者不具備情感傾向性的候選評論作為評論信息。

本實(shí)施例提供了一種評論信息確定方法,將候選評論中的評論標(biāo)簽和所述評論事件的事件標(biāo)簽一致且正向的候選評論確定為所述評論事件的評論信息,進(jìn)一步提高了評論信息和評論事件的相關(guān)性,同時(shí)可人性化的選擇確定評論信息的情感傾向。

在上述技術(shù)方案的基礎(chǔ)上,所述評論事件包括新聞事件,相應(yīng)的,在將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息之后,還包括:確定所述新聞事件的情感邏輯,依據(jù)所述情感邏輯選擇符合條件的評論信息對所述新聞事件進(jìn)行評論。本方案新聞事件的情感邏輯可以是正向(積極的、宣揚(yáng)的)邏輯,還可以是負(fù)向(批判性)邏輯,在評論信息確定過程中考量評論信息的正負(fù)向性和新聞事件的情感邏輯是否一致,由此確定出的評論信息更具備指導(dǎo)意義。

圖5是本發(fā)明實(shí)施例提供的評論信息確定裝置的結(jié)構(gòu)框圖,所述裝置用于執(zhí)行上述實(shí)施例提供的評論信息確定方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。如圖5所示,所述裝置包括事件標(biāo)簽確定模塊501、候選評論確定模塊502和評論信息確定模塊503。

其中,事件標(biāo)簽確定模塊501,用于獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽;

候選評論確定模塊502,用于將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論,所述評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成,所述評論圖譜包含有評論內(nèi)容以及對應(yīng)的評論標(biāo)簽;

評論信息確定模塊503,用于對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息。

本實(shí)施例提供的評論信息確定裝置,通過獲取評論事件的文本內(nèi)容,依據(jù)文本內(nèi)容確定評論事件的事件標(biāo)簽,將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論后在最終從候選評論中得到評論信息用以對評論事件進(jìn)行評論,使得評論信息和評論事件的相關(guān)性增強(qiáng),評論信息的確定更加智能化,效率更高。

在上述技術(shù)方案的基礎(chǔ)上,所述事件標(biāo)簽確定模塊501具體用于:

對所述文本內(nèi)容進(jìn)行預(yù)處理,得到和所述文本內(nèi)容對應(yīng)的詞語集合,所述詞語集合中包含有至少兩個(gè)詞語;

通過預(yù)設(shè)學(xué)習(xí)模型確定所述詞語集合中詞語的權(quán)重值,將滿足條件的權(quán)重值對應(yīng)的詞語確定為所述評論事件的事件標(biāo)簽。

在上述技術(shù)方案的基礎(chǔ)上,所述事件標(biāo)簽確定模塊501還用于:

在對所述文本內(nèi)容進(jìn)行預(yù)處理之前,在所述文本內(nèi)容中抽取文本要素,所述文本要素包含至少兩個(gè)關(guān)鍵詞語;

在將滿足條件的權(quán)重值對應(yīng)的詞語確定為所述評論事件的事件標(biāo)簽之后,包含所述事件標(biāo)簽的文本要素中的其它關(guān)鍵詞語也確定為所述評論事件的事件標(biāo)簽。

在上述技術(shù)方案的基礎(chǔ)上,所述候選評論確定模塊502具體用于:

將確定出的事件標(biāo)簽和評論圖譜中評論內(nèi)容對應(yīng)的評論標(biāo)簽進(jìn)行比對,依據(jù)評論標(biāo)簽命中的事件標(biāo)簽的數(shù)量的大小,由高到低對所述評論內(nèi)容進(jìn)行排序,將排序靠前的評論內(nèi)容作為候選評論。

在上述技術(shù)方案的基礎(chǔ)上,所述評論信息確定模塊503具體用于:

將候選評論中的評論標(biāo)簽和所述評論事件的事件標(biāo)簽一致且正向的候選評論確定為所述評論事件的評論信息。

在上述技術(shù)方案的基礎(chǔ)上,所述評論事件包括新聞事件,所述評論信息確定模塊503還用于:

在將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息之后,確定所述新聞事件的情感邏輯,依據(jù)所述情感邏輯選擇符合條件的評論信息對所述新聞事件進(jìn)行評論。

在上述技術(shù)方案的基礎(chǔ)上,還包括評論圖譜建立模塊504,具體用于:

通過網(wǎng)絡(luò)爬蟲定向抓取并確定評論內(nèi)容;

通過預(yù)設(shè)識別模型對所述評論內(nèi)容進(jìn)行識別,確定和所述評論內(nèi)容對應(yīng)的評論主體和評論觀點(diǎn);

依據(jù)所述評論主體、所述評論觀點(diǎn)以及所述評論內(nèi)容對應(yīng)的評論事件確定所述評論內(nèi)容對應(yīng)的評論標(biāo)簽;

將所述評論內(nèi)容以及確定出的評論標(biāo)簽以結(jié)構(gòu)化形式存儲(chǔ)為評論圖譜。

圖6是本發(fā)明實(shí)施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖。圖6示出了適于用來實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性服務(wù)器12的框圖。圖6顯示的服務(wù)器12僅僅是一個(gè)示例,不應(yīng)對本發(fā)明實(shí)施例的功能和使用范圍帶來任何限制。

如圖6所示,服務(wù)器12以通用計(jì)算設(shè)備的形式表現(xiàn)。服務(wù)器12的組件可以包括但不限于:一個(gè)或者多個(gè)處理器或者處理單元16,系統(tǒng)存儲(chǔ)器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲(chǔ)器28和處理單元16)的總線18。

總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(isa)總線,微通道體系結(jié)構(gòu)(mac)總線,增強(qiáng)型isa總線、視頻電子標(biāo)準(zhǔn)協(xié)會(huì)(vesa)局域總線以及外圍組件互連(pci)總線。

服務(wù)器12典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被服務(wù)器12訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動(dòng)的和不可移動(dòng)的介質(zhì)。

系統(tǒng)存儲(chǔ)器28可以包括易失性存儲(chǔ)器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(ram)30和/或高速緩存存儲(chǔ)器32。服務(wù)器12可以進(jìn)一步包括其它可移動(dòng)/不可移動(dòng)的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲(chǔ)介質(zhì)。僅作為舉例,存儲(chǔ)系統(tǒng)34可以用于讀寫不可移動(dòng)的、非易失性磁介質(zhì)(通常稱為“硬盤驅(qū)動(dòng)器”)??梢蕴峁┯糜趯梢苿?dòng)非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動(dòng)器,以及對可移動(dòng)非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動(dòng)器。在這些情況下,每個(gè)驅(qū)動(dòng)器可以通過一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線18相連。存儲(chǔ)器28可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實(shí)施例的功能。

具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具40,可以存儲(chǔ)在例如存儲(chǔ)器28中,這樣的程序模塊42包括但不限于操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實(shí)施例中的功能和/或方法。

服務(wù)器12也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤、指向設(shè)備、顯示器24等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該服務(wù)器12交互的設(shè)備通信,和/或與使得該服務(wù)器12能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進(jìn)行。并且,服務(wù)器12還可以通過網(wǎng)絡(luò)適配器20與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器20通過總線18與服務(wù)器12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合服務(wù)器12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。

處理單元16通過運(yùn)行存儲(chǔ)在系統(tǒng)存儲(chǔ)器28中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如實(shí)現(xiàn)本發(fā)明實(shí)施例所提供的評論信息確定方法。

本發(fā)明實(shí)施例還提供了一種包含計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令在由計(jì)算機(jī)處理器執(zhí)行時(shí)用于執(zhí)行一種評論信息確定方法,其特征在于,該方法包括:

獲取評論事件的文本內(nèi)容,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽;

將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論,所述評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成,所述評論圖譜包含有評論內(nèi)容以及對應(yīng)的評論標(biāo)簽;

對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息。

可選的,依據(jù)所述文本內(nèi)容確定所述評論事件的事件標(biāo)簽包括:

對所述文本內(nèi)容進(jìn)行預(yù)處理,得到和所述文本內(nèi)容對應(yīng)的詞語集合,所述詞語集合中包含有至少兩個(gè)詞語;

通過預(yù)設(shè)學(xué)習(xí)模型確定所述詞語集合中詞語的權(quán)重值,將滿足條件的權(quán)重值對應(yīng)的詞語確定為所述評論事件的事件標(biāo)簽。

可選的,對所述文本內(nèi)容進(jìn)行預(yù)處理之前,還包括:

在所述文本內(nèi)容中抽取文本要素,所述文本要素包含至少兩個(gè)關(guān)鍵詞語;

相應(yīng)的,在將滿足條件的權(quán)重值對應(yīng)的詞語確定為所述評論事件的事件標(biāo)簽之后,還包括:

將包含所述事件標(biāo)簽的文本要素中的其它關(guān)鍵詞語也確定為所述評論事件的事件標(biāo)簽。

可選的,將確定出的事件標(biāo)簽和評論圖譜中的評論標(biāo)簽進(jìn)行比對,依據(jù)比對結(jié)果確定候選評論包括:

將確定出的事件標(biāo)簽和評論圖譜中評論內(nèi)容對應(yīng)的評論標(biāo)簽進(jìn)行比對,依據(jù)評論標(biāo)簽命中的事件標(biāo)簽的數(shù)量的大小,由高到低對所述評論內(nèi)容進(jìn)行排序,將排序靠前的評論內(nèi)容作為候選評論。

可選的,對所述候選評論進(jìn)行篩選,將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息包括:

將候選評論中的評論標(biāo)簽和所述評論事件的事件標(biāo)簽一致且正向的候選評論確定為所述評論事件的評論信息。

可選的,所述評論事件包括新聞事件,相應(yīng)的,在將滿足預(yù)設(shè)條件的候選評論確定為所述評論事件的評論信息之后,還包括:

確定所述新聞事件的情感邏輯,依據(jù)所述情感邏輯選擇符合條件的評論信息對所述新聞事件進(jìn)行評論。

可選的,評論圖譜由其它評論事件以及對應(yīng)的評論內(nèi)容生成的過程包括:

通過網(wǎng)絡(luò)爬蟲定向抓取并確定評論內(nèi)容;

通過預(yù)設(shè)識別模型對所述評論內(nèi)容進(jìn)行識別,確定和所述評論內(nèi)容對應(yīng)的評論主體和評論觀點(diǎn);

依據(jù)所述評論主體、所述評論觀點(diǎn)以及所述評論內(nèi)容對應(yīng)的評論事件確定所述評論內(nèi)容對應(yīng)的評論標(biāo)簽;

將所述評論內(nèi)容以及確定出的評論標(biāo)簽以結(jié)構(gòu)化形式存儲(chǔ)為評論圖譜。

本發(fā)明實(shí)施例的計(jì)算機(jī)存儲(chǔ)介質(zhì),可以采用一個(gè)或多個(gè)計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是但不限于電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。

計(jì)算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計(jì)算機(jī)可讀的信號介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。

計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無線、電線、光纜、rf等等,或者上述的任意合適的組合。

可以以一種或多種程序設(shè)計(jì)語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設(shè)計(jì)語言—諸如”c”語言或類似的程序設(shè)計(jì)語言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。

注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
芒康县| 洪洞县| 宁河县| 讷河市| 乐亭县| 开封县| 澄迈县| 绥滨县| 新余市| 花垣县| 莲花县| 广河县| 逊克县| 游戏| 吉水县| 大荔县| 洛扎县| 天峻县| 奈曼旗| 山阴县| 香格里拉县| 云和县| 平潭县| 双桥区| 饶河县| 舞阳县| 扶绥县| 凭祥市| 淮南市| 徐汇区| 卢湾区| 鄱阳县| 三门峡市| 若尔盖县| 孟连| 卓尼县| 财经| 佛教| 中阳县| 边坝县| 洛扎县|