两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于構(gòu)建極性詞素?cái)?shù)據(jù)庫以及確定詞的極性的方法和裝置的制作方法

文檔序號:6607955閱讀:273來源:國知局
專利名稱:用于構(gòu)建極性詞素?cái)?shù)據(jù)庫以及確定詞的極性的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般地涉及文字處理。更具體地,本發(fā)明涉及詞的極性的判斷。
背景技術(shù)
詞的極性(polarity)的確定廣泛應(yīng)用于文章分類、觀點(diǎn)挖掘和情感分析等。在傳統(tǒng)的方法中,為了提高詞的極性識(shí)別的性能,構(gòu)造包括大量的具有手工標(biāo)注詞性的詞的詞典。構(gòu)造這樣的詞典費(fèi)時(shí)且成本高。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面,提供了一種用于構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法,包括從語料庫和/或詞語庫中提取具有極性的單音節(jié)詞;以及對具有極性的單音節(jié)詞標(biāo)注極性,被標(biāo)注極性的單音節(jié)詞構(gòu)成極性詞素?cái)?shù)據(jù)庫。根據(jù)本發(fā)明的第二方面,提供了一種用于確定詞的極性的方法,包括對于要確定極性的詞,計(jì)算詞與預(yù)定的極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息、以及詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息;根據(jù)所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性,并根據(jù)所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性;以及對詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性以及詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性進(jìn)行比較,根據(jù)比較結(jié)果判定詞的極性。根據(jù)本發(fā)明的第三方面,提供了一種用于構(gòu)建極性詞素?cái)?shù)據(jù)庫的裝置,包括提取單元,被配置用于從語料庫和/或詞語庫中提取具有極性的單音節(jié)詞;以及標(biāo)注單元,被配置用于對具有極性的單音節(jié)詞標(biāo)注極性,被標(biāo)注極性的單音節(jié)詞構(gòu)成極性詞素?cái)?shù)據(jù)庫。根據(jù)本發(fā)明的第四方面,提供了一種用于確定詞的極性的裝置,包括互信息計(jì)算單元,被配置用于對于要確定極性的詞,計(jì)算詞與預(yù)定的極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息、以及詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息;關(guān)聯(lián)性計(jì)算單元,被配置用于根據(jù)互信息計(jì)算單元所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性,并根據(jù)互信息計(jì)算單元所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性;以及判定單元,被配置用于對關(guān)聯(lián)性計(jì)算單元所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性以及詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性進(jìn)行比較,根據(jù)比較結(jié)果判定詞的極性。依據(jù)本發(fā)明的其它實(shí)施例,還提供了相應(yīng)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)
P
根據(jù)本發(fā)明的實(shí)施例,可以有效地構(gòu)建極性詞素?cái)?shù)據(jù)庫以及確定詞的極性。通過以下結(jié)合附圖對本發(fā)明的最佳實(shí)施例的詳細(xì)說明,本發(fā)明的這些以及其它的優(yōu)點(diǎn)將更加明顯。


參照下面結(jié)合附圖對本發(fā)明實(shí)施例的說明,會(huì)更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。附圖中圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖;圖2示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖;圖3示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖;圖4示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖;圖5示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定詞的極性的方法的流程圖;圖6示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的用于確定詞的極性的方法的流程圖;圖7示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于構(gòu)建極性詞素?cái)?shù)據(jù)庫的裝置的框圖;圖8示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的用于構(gòu)建極性詞素?cái)?shù)據(jù)庫的裝置的框圖;圖9示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定詞的極性的裝置的框圖;圖10示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的用于確定詞的極性的裝置的框圖;以及圖11示出了可用于實(shí)施根據(jù)本發(fā)明實(shí)施例的方法和裝置的計(jì)算機(jī)的示意性框圖。
具體實(shí)施例方式在下文中將結(jié)合附圖對本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡明起見, 在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖和說明中僅僅描述了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了對與本發(fā)明關(guān)系不大的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。在以下的部分描述中,以漢語為例子介紹了本發(fā)明的實(shí)施例。但是本發(fā)明不限于此。本發(fā)明也可以適用于與漢語類似的語言。圖1示出了一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖。在步驟SlOl中,從語料庫和/或詞語庫中提取具有極性的單音節(jié)詞。在步驟S102 中,對具有極性的單音節(jié)詞標(biāo)注極性,被標(biāo)注極性的單音節(jié)詞可以構(gòu)成極性詞素?cái)?shù)據(jù)庫。語料庫可以是任何包含大量語料(句子)的集合。詞語庫可以是包括大量詞語的
5詞典。在步驟S102中可以通過查詢現(xiàn)有的極性詞素?cái)?shù)據(jù)庫的方式來為單音節(jié)詞標(biāo)注極性,即褒義(positive)或者貶義(negative),也可以通過顯示提取的單音節(jié)詞并接收操作者輸入的該單音節(jié)詞的極性的方式來標(biāo)注極性。在本實(shí)施例中,只利用具有極性的單音節(jié)詞構(gòu)成極性詞素?cái)?shù)據(jù)庫。由于具有極性的單音節(jié)詞的數(shù)目相對較少,而具有極性的雙音節(jié)詞或多音節(jié)詞數(shù)量龐大。另外,絕大多數(shù)具有極性的雙音節(jié)詞或多音節(jié)詞都可以根據(jù)其中所包括的單音節(jié)詞來確定其極性。也就是說,一般地可以由單音節(jié)詞的極性來確定雙音節(jié)詞或多音節(jié)詞的詞性。因此通過構(gòu)建具有較少數(shù)目的單音節(jié)詞的極性詞素?cái)?shù)據(jù)庫,可以節(jié)省時(shí)間和成本。圖2示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖。在步驟S201中,從語料庫和/或詞語庫中提取具有極性的單音節(jié)詞。在步驟S202中,從具有極性的單音節(jié)詞中選擇預(yù)定數(shù)量的常用的單音節(jié)詞。在步驟S203中,對所選擇的所述預(yù)定數(shù)量的常用的單音節(jié)詞標(biāo)注極性。被標(biāo)注極性的單音節(jié)詞可以構(gòu)成極性詞素?cái)?shù)據(jù)庫。圖2的實(shí)施例與圖1的不同之處在于,只選擇預(yù)定數(shù)量的常用的單音節(jié)詞進(jìn)行標(biāo)注。在一個(gè)示例中,步驟S202可以包括顯示提取的單音節(jié)詞并接收操作者的對與該單音節(jié)詞是否為常用的單音節(jié)詞的輸入。在另一個(gè)示例中,步驟S202可以包括根據(jù)單音節(jié)詞出現(xiàn)的頻率,選擇出現(xiàn)頻率最高的預(yù)定數(shù)量的單音節(jié)詞。單音詞出現(xiàn)的頻率可以通過查詢現(xiàn)有的統(tǒng)計(jì)結(jié)果獲得,或者可以在步驟S201中統(tǒng)計(jì)具有極性的單音節(jié)詞在語料庫和/或詞語庫中出現(xiàn)的頻率。在本實(shí)施例中,通過只選擇預(yù)定數(shù)量的常用的單音節(jié)詞,可以進(jìn)一步減小極性詞素?cái)?shù)據(jù)庫的規(guī)模,從而可以進(jìn)一步節(jié)省時(shí)間和成本。圖3示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖。在步驟S301中,將雙音節(jié)詞語庫中的雙音節(jié)詞切分成單音節(jié)詞。在步驟S302中,分析所切分的各個(gè)單音節(jié)詞的詞性。在步驟S303中,根據(jù)所切分的各個(gè)單音節(jié)詞的詞性以及所切分的各個(gè)單音節(jié)詞在雙音節(jié)詞中的相對位置,從切分的單音節(jié)詞中選擇非語義核心的具有極性的單音節(jié)詞。在步驟S304中,對具有極性的單音節(jié)詞標(biāo)注極性,被標(biāo)注極性的單音節(jié)詞可以構(gòu)成極性詞素?cái)?shù)據(jù)庫。在本實(shí)施例中,從雙音節(jié)詞語庫中提取具有極性的單音節(jié)詞。雙音節(jié)詞語庫可以是任何已有雙音節(jié)詞語庫,可以是從通用詞語庫中選取雙音節(jié)詞而構(gòu)成的雙音節(jié)詞語庫。在步驟S301中,將雙音節(jié)詞切分成單音節(jié)詞是本領(lǐng)域的技術(shù)人員可以實(shí)現(xiàn)的。這里不再詳細(xì)描述。在步驟S302中,可以采用各種已知的詞性分析方法來分析所切分的各個(gè)單音節(jié)詞的詞性。例如,對于雙音節(jié)詞“劣質(zhì)”,對其進(jìn)行詞性分析可以得到“[劣.a.][質(zhì).η.] ”, 即表示“劣”為形容詞,“質(zhì)”為名詞。在步驟S303中,根據(jù)所切分的各個(gè)單音節(jié)詞的詞性以及所切分的各個(gè)單音節(jié)詞在雙音節(jié)詞中的相對位置,從切分的單音節(jié)詞中選擇非語義核心的具有極性的單音節(jié)詞。 可以采用各種方法來確定雙音節(jié)詞中哪個(gè)單音節(jié)詞是具有極性的單音節(jié)詞。例如,對于“[劣.a.][質(zhì).η.] ”,由于第一個(gè)單音節(jié)詞是形容詞,第二個(gè)單音節(jié)詞是名詞,所以可以確定“劣”是具有極性的單音節(jié)詞。這里,在雙音節(jié)詞“劣質(zhì)”中,“質(zhì)”是語義核心,而“劣”是非語義核心。注意,有可能一個(gè)雙音節(jié)詞中的兩個(gè)單音節(jié)詞都不被認(rèn)為是具有極性的單音節(jié)詞?;蛘?,有可能一個(gè)雙音節(jié)詞中的兩個(gè)單音節(jié)詞都被認(rèn)為是具有極性的單音節(jié)詞。本領(lǐng)域的技術(shù)人員還可以設(shè)想其他確定具有極性的單音節(jié)詞的規(guī)則,這里不再詳細(xì)描述。步驟S304與圖1中的步驟S103類似,這里不再詳細(xì)描述。與圖2中的實(shí)施例類似,在圖3的實(shí)施例中,也可以只選擇預(yù)定數(shù)量的單音節(jié)詞來構(gòu)成極性語素?cái)?shù)據(jù)庫。圖4示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法的流程圖。在步驟S401中,對語料庫中的語句進(jìn)行分詞處理。在步驟S402中,分析分詞后的語句中的各個(gè)詞的詞性。在步驟S403中,根據(jù)分詞后的語句中的各個(gè)詞的詞性及相對位置,從分詞后的語句中的各個(gè)詞中選擇非語義核心的具有極性的單音節(jié)詞。在步驟S404中,對具有極性的單音節(jié)詞標(biāo)注極性,被標(biāo)注極性的單音節(jié)詞可以構(gòu)成極性詞素?cái)?shù)據(jù)庫。在步驟S401中,本領(lǐng)域的技術(shù)人員可以采用各種方法進(jìn)行分詞處理。在本實(shí)施例中,一般將語句分詞為單音節(jié)詞和/或雙音節(jié)詞。例如,可以將語句“從結(jié)果來看,自動(dòng)白平衡所能獲得的色溫是非常準(zhǔn)確的。”分詞為“從/結(jié)果/來看/,/自動(dòng)/白/平衡/所/能
/獲得/的/色/溫/是/非常/準(zhǔn)確/的八/”。在步驟S402中,可以采用各種已知的詞性分析方法來分析分詞后的語句中的各個(gè)詞的詞性。例如,對“從/結(jié)果/來看/,/自動(dòng)/白/平衡/所/能/獲得/的/色/溫 /是/非常/準(zhǔn)確/的八/”進(jìn)行詞性分析可以得到“從/P結(jié)果/n來看/u,/w自動(dòng)/d白 /d平衡/a所/u能/ν獲得/ν的/u色/n溫/Ng是/ν非常/d準(zhǔn)確/a的/u。/V,,其中ρ 表示介詞,η表示名詞,u表示其他助詞,w表示標(biāo)點(diǎn)符號,d表示副詞,a表示形容詞,ν表示動(dòng)詞,Ng表示名詞性語素。在步驟S403中,首先可以根據(jù)分詞后的語句中的各個(gè)詞的詞性及相對位置,從分詞后的語句中的各個(gè)詞中選擇具有極性的詞。例如“非?!笔歉痹~,其后的“準(zhǔn)確”是形容詞,可以將“準(zhǔn)確”確定為具有極性的詞。然后,如果所確定的具有極性的詞是雙音節(jié)詞或多音節(jié)詞,可以將其切分為單音節(jié)詞,在根據(jù)所切分的各個(gè)單音節(jié)詞的詞性以及所切分的各個(gè)單音節(jié)詞在雙音節(jié)詞中的相對位置,從切分的單音節(jié)詞中選擇非語義核心的具有極性的單音節(jié)詞。例如可以將“準(zhǔn)確”中的“準(zhǔn)”確定為非語義核心的具有極性的單音節(jié)詞。步驟S404與圖2中的步驟S203類似,這里不再詳細(xì)描述。與圖2中的實(shí)施例類似,在圖4的實(shí)施例中,也可以只選擇預(yù)定數(shù)量的單音節(jié)詞來構(gòu)成極性語素?cái)?shù)據(jù)庫。在一個(gè)實(shí)施例中,可以將圖3和圖4相結(jié)合,即將在步驟303和步驟304中獲得的具有極性的單音節(jié)詞相組合,對其標(biāo)注極性,從而構(gòu)成極性語素?cái)?shù)據(jù)庫。圖5示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于確定詞的極性的方法的流程圖。在步驟S501中,對于要確定極性的詞,計(jì)算該詞與預(yù)定的極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息、以及詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息。在步驟S502中,根據(jù)所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性,并根據(jù)所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性。在步驟S503中,對詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性以及詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性進(jìn)行比較,根據(jù)比較結(jié)果判定詞的極性。在步驟S501中,可以以各種方式計(jì)算詞與詞之間的互信息。例如,可以采用如下公式計(jì)算互信息MI (wl,w2) = 2p (wl,w2) / [ρ (wl) +ρ (w2)]其中wl和w2表示要計(jì)算互信息的兩個(gè)詞,ρ (Wl,W2)是W1與W2共現(xiàn)的次數(shù),P (W1) 表示W(wǎng)1出現(xiàn)的次數(shù),P(W2)表示W(wǎng)2出現(xiàn)的次數(shù),MI (wl, w2)表示W(wǎng)l和w2之間的互信息。 P(W15W2)jp(W1)和P(W2)可以從各種現(xiàn)有的統(tǒng)計(jì)結(jié)果中得到。另外,可以采用逐點(diǎn)互信息PMI (Pointwise Mutual Information) 計(jì)算互信息MI (W1 ,W2) = Iog2 ’,)、其中wl和w2表示要計(jì)算互信息的兩個(gè)詞,ρ (Wl,W2)是W1與W2共現(xiàn)的次數(shù),P (W1) 表示W(wǎng)1出現(xiàn)的次數(shù),P(W2)表示W(wǎng)2出現(xiàn)的次數(shù),MI (wl, w2)表示W(wǎng)l和w2之間的互信息。 P(W15W2)jp(W1)和P(W2)可以從各種現(xiàn)有的統(tǒng)計(jì)結(jié)果中得到。在步驟S502中,在一個(gè)示例中,詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性可以與詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息成正比,詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性計(jì)可以與詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息成正比。在步驟S503中,可以判斷詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性以及詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性二者孰大。如果該詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性較大,則判斷該詞為褒義。 如果該詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性較大,則判斷該詞為貶義。若二者相等,可以判定該詞無極性或者為中性詞。圖6示出了根據(jù)本發(fā)明的另一個(gè)實(shí)施例的用于確定詞的極性的方法的流程圖。在步驟S601中,計(jì)算詞與預(yù)定的極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息、以及詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息。在步驟S602中,對所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息進(jìn)行求和,獲得第一求和結(jié)果。在步驟S603中,對所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息進(jìn)行求和,獲得第二求和結(jié)果。在步驟S604中,如果第一求和結(jié)果大于第二求和結(jié)果則判定詞的極性為褒義,如果第一求和結(jié)果小于第二求和結(jié)果則判定詞的極性為貶義。步驟S601與圖5中的步驟S501類似,這里不再詳細(xì)描述。
在步驟S602中,利用以下公式計(jì)算第一求和結(jié)果
權(quán)利要求
1.一種用于構(gòu)建極性詞素?cái)?shù)據(jù)庫的方法,包括從語料庫和/或詞語庫中提取具有極性的單音節(jié)詞;以及對所述具有極性的單音節(jié)詞標(biāo)注極性,所述被標(biāo)注極性的單音節(jié)詞構(gòu)成所述極性詞素?cái)?shù)據(jù)庫。
2.一種用于確定詞的極性的方法,包括對于要確定極性的詞,計(jì)算所述詞與預(yù)定的極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息、以及所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息;根據(jù)所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息, 計(jì)算所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性,并根據(jù)所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息,計(jì)算所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性;以及對所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性以及所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性進(jìn)行比較,根據(jù)比較結(jié)果判定所述詞的極性。
3.如權(quán)利要求2所述的方法,其中所述計(jì)算關(guān)聯(lián)性的步驟包括對所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息進(jìn)行求和,獲得第一求和結(jié)果;以及對所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息進(jìn)行求和,獲得第二求和結(jié)果。
4.如權(quán)利要求3所述的方法,其中所述判定的步驟包括對所述第一求和結(jié)果和第二求和結(jié)果進(jìn)行比較,如果第一求和結(jié)果大于第二求和結(jié)果則判定所述詞的極性為褒義,如果第一求和結(jié)果小于第二求和結(jié)果則判定所述詞的極性為貶義。
5.如權(quán)利要求2所述的方法,其中所述極性詞素?cái)?shù)據(jù)庫為由權(quán)利要求1所述的方法構(gòu)建的極性詞素?cái)?shù)據(jù)庫。
6.一種用于構(gòu)建極性詞素?cái)?shù)據(jù)庫的裝置,包括提取單元,被配置用于從語料庫和/或詞語庫中提取具有極性的單音節(jié)詞;以及標(biāo)注單元,被配置用于對所述具有極性的單音節(jié)詞標(biāo)注極性,所述被標(biāo)注極性的單音節(jié)詞構(gòu)成所述極性詞素?cái)?shù)據(jù)庫。
7.一種用于確定詞的極性的裝置,包括互信息計(jì)算單元,被配置用于對于要確定極性的詞,計(jì)算所述詞與預(yù)定的極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息、以及所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息;關(guān)聯(lián)性計(jì)算單元,被配置用于根據(jù)互信息計(jì)算單元所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息,計(jì)算所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性,并根據(jù)互信息計(jì)算單元所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息,計(jì)算所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性;以及判定單元,被配置用于對關(guān)聯(lián)性計(jì)算單元所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性以及所述詞與所述極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性進(jìn)行比較,根據(jù)比較結(jié)果判定所述詞的極性。
8.如權(quán)利要求7所述的裝置,其中所述關(guān)聯(lián)性計(jì)算單元包括第一求和模塊,被配置用于對互信息計(jì)算單元所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息進(jìn)行求和,獲得第一求和結(jié)果;以及第二求和模塊,被配置用于對互信息計(jì)算單元所計(jì)算的所述詞與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息進(jìn)行求和,獲得第二求和結(jié)果。
9.如權(quán)利要求8所述的裝置,其中所述判定單元被配置成對所述關(guān)聯(lián)性計(jì)算單元所獲得的所述第一求和結(jié)果和第二求和結(jié)果進(jìn)行比較,如果第一求和結(jié)果大于第二求和結(jié)果則判定所述詞的極性為褒義,如果第一求和結(jié)果小于第二求和結(jié)果則判定所述詞的極性為貶義。
10.如權(quán)利要求7所述的裝置,其中所述極性詞素?cái)?shù)據(jù)庫為由權(quán)利要求6所述的裝置構(gòu)建的極性詞素?cái)?shù)據(jù)庫。
全文摘要
用于構(gòu)建極性詞素?cái)?shù)據(jù)庫以及確定詞的極性的方法和裝置。用于確定詞的極性的方法包括對于要確定極性的詞,計(jì)算其與預(yù)定的極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息、與所述極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息;根據(jù)所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為褒義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為褒義的詞之間的關(guān)聯(lián)性,根據(jù)所計(jì)算的詞與極性詞素?cái)?shù)據(jù)庫中的每個(gè)極性為貶義的詞之間的互信息,計(jì)算詞與極性詞素?cái)?shù)據(jù)庫中的所有極性為貶義的詞之間的關(guān)聯(lián)性;以及對以上兩種關(guān)聯(lián)性進(jìn)行比較,根據(jù)比較結(jié)果判定詞的極性。
文檔編號G06F17/27GK102375838SQ20101025763
公開日2012年3月14日 申請日期2010年8月17日 優(yōu)先權(quán)日2010年8月17日
發(fā)明者于浩, 孟遙, 張潔 申請人:富士通株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
体育| 开封市| 南投县| 太白县| 耿马| 泾源县| 柳州市| 屯留县| 哈尔滨市| 上高县| 红安县| 从化市| 迭部县| 清涧县| 河间市| 隆安县| 湘西| 乌鲁木齐县| 赤壁市| 镇远县| 台北市| 余干县| 东丰县| 新郑市| 比如县| 湘潭市| 山西省| 子洲县| 富蕴县| 家居| 定陶县| 竹山县| 公主岭市| 南涧| 蓬安县| 乌兰县| 怀安县| 太湖县| 清丰县| 双城市| 夏河县|