两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

多語言智能預(yù)處理實時統(tǒng)計機(jī)器翻譯系統(tǒng)的后處理模塊的制作方法

文檔序號:11620551閱讀:655來源:國知局

人工智能機(jī)器翻譯技術(shù)領(lǐng)域,具體來說,涉及一種多語言智能預(yù)處理實時統(tǒng)計機(jī)器翻譯系統(tǒng)的后處理模塊。



背景技術(shù):

機(jī)器翻譯是利用計算機(jī)對人類自然語言進(jìn)行自動翻譯的技術(shù),是利用計算機(jī)把一種自然語言轉(zhuǎn)換成另一種自然語言的過程,而且兩種自然語言在意義上應(yīng)該是等價的。

目前,一種比較成熟而且主流的機(jī)器翻譯方法是基于統(tǒng)計的方法,該方法的優(yōu)點在于幾乎不需要人工撰寫翻譯規(guī)則,所有的翻譯信息都是自動地從語料中學(xué)習(xí)而獲得,因此該方法最大程度地發(fā)揮了計算機(jī)高速運算的特點,極大地降低了人工成本。

基于統(tǒng)計模型的機(jī)器翻譯技術(shù)從平行語料庫中學(xué)習(xí)從一種語言a到另一種語言b的短語翻譯。在翻譯新的句子時,把輸入語言a的句子分解成若干短語,根據(jù)學(xué)習(xí)來的短語(a語言)-短語(b語言)的共現(xiàn)概率,把語言a的句子翻譯成語言b的句子。整個學(xué)習(xí)、翻譯過程完全根據(jù)統(tǒng)計模型。

目前基于統(tǒng)計模型的機(jī)器翻譯技術(shù)的后處理模塊功能弱小,大多數(shù)都是將機(jī)器翻譯的結(jié)果直接作為最終的結(jié)果輸出,因此,會造成輸出結(jié)果不準(zhǔn)確、西文作為翻譯目標(biāo)語言時輸出格式有問題等。



技術(shù)實現(xiàn)要素:

針對相關(guān)技術(shù)中的上述技術(shù)問題,本發(fā)明提出一種多語言智能預(yù)處理實時統(tǒng)計機(jī)器翻譯系統(tǒng)的后處理模塊,能夠克服現(xiàn)有技術(shù)的上述不足。

為實現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:

一種多語言智能預(yù)處理實時統(tǒng)計機(jī)器翻譯系統(tǒng)的后處理模塊,所述后處理模塊包括單詞標(biāo)點規(guī)范化模塊、大小寫轉(zhuǎn)換模塊和格式轉(zhuǎn)換模塊;所述單詞標(biāo)點規(guī)范化模塊用于將翻譯結(jié)果中的單詞和標(biāo)點規(guī)范化為目標(biāo)語言的表現(xiàn)形式,所述大小寫轉(zhuǎn)換模塊用于對翻譯結(jié)果中的大小寫進(jìn)行轉(zhuǎn)換。

進(jìn)一步的,待翻譯語言為英語,翻譯目標(biāo)語言為中文時,單詞標(biāo)點規(guī)范化模塊將翻譯結(jié)果里中文單詞間的空格去掉。

進(jìn)一步的,翻譯目標(biāo)語言是西語時,單詞標(biāo)點規(guī)范化模塊將翻譯結(jié)果里標(biāo)點符號與其前面一個單詞間的空格去掉。

進(jìn)一步的,翻譯目標(biāo)語言是西語時,大小寫轉(zhuǎn)換模塊將翻譯結(jié)果里英文句子的首字母及專有名詞的字母轉(zhuǎn)化為大寫字母。

進(jìn)一步的,所述格式轉(zhuǎn)換模塊用于對翻譯結(jié)果格式進(jìn)行轉(zhuǎn)換,使輸出語言的格式與輸入語言的格式一致。

本發(fā)明的有益效果:本發(fā)明機(jī)器翻譯的后處理模塊能夠?qū)C(jī)器翻譯的翻譯結(jié)果進(jìn)行單詞標(biāo)點規(guī)范化、大小寫轉(zhuǎn)換及格式轉(zhuǎn)換等基本操作,使最終的輸出結(jié)果格式與輸入的格式一致,并且輸出結(jié)果符合翻譯目標(biāo)語言的常用表現(xiàn)形式。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是根據(jù)本發(fā)明實施例所述的一種多語言智能預(yù)處理實時統(tǒng)計機(jī)器翻譯系統(tǒng)的后處理模塊的流程圖。

具體實施方式

下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。

如圖1所示,根據(jù)本發(fā)明實施例所述的一種多語言智能預(yù)處理實時統(tǒng)計機(jī)器翻譯系統(tǒng)的后處理模塊,所述后處理模塊包括單詞標(biāo)點規(guī)范化模塊、大小寫轉(zhuǎn)換模塊和格式轉(zhuǎn)換模塊;所述單詞標(biāo)點規(guī)范化模塊用于將翻譯結(jié)果中的單詞和標(biāo)點規(guī)范化為目標(biāo)語言的表現(xiàn)形式,所述大小寫轉(zhuǎn)換模塊用于對翻譯結(jié)果中的大小寫進(jìn)行轉(zhuǎn)換。

在一具體實施例中,待翻譯語言為英語,翻譯目標(biāo)語言為中文時,單詞標(biāo)點規(guī)范化模塊將翻譯結(jié)果里中文單詞間的空格去掉。

在一具體實施例中,翻譯目標(biāo)語言是西語時,單詞標(biāo)點規(guī)范化模塊將翻譯結(jié)果里標(biāo)點符號與其前面一個單詞間的空格去掉。

在一具體實施例中,翻譯目標(biāo)語言是西語時,大小寫轉(zhuǎn)換模塊將翻譯結(jié)果里英文句子的首字母及專有名詞的字母轉(zhuǎn)化為大寫字母,其中,所述的標(biāo)點符號包括句號、逗號、問號、分號、感嘆號和括號等。

在一具體實施例中,所述格式轉(zhuǎn)換模塊用于對翻譯結(jié)果格式進(jìn)行轉(zhuǎn)換,使輸出語言的格式與輸入語言的格式一致。

為了方便理解本發(fā)明的上述技術(shù)方案,以下通過具體使用方式上對本發(fā)明的上述技術(shù)方案進(jìn)行詳細(xì)說明。

在具體使用時,本發(fā)明的后處理模塊用于對翻譯結(jié)果做進(jìn)一步處理,使其更加接近目標(biāo)語言的表達(dá)習(xí)慣,并作為最終結(jié)果輸出,如附圖中圖1所示:后處理模塊主要包括d.1單詞標(biāo)點規(guī)范化模塊,d.1單詞標(biāo)點規(guī)范化模塊把機(jī)器翻譯結(jié)果中的單詞和標(biāo)點規(guī)范化為翻譯目標(biāo)語言的常用表現(xiàn)形式,例如,將英-中翻譯的翻譯結(jié)果中中文單詞間的空格去掉,將西語翻譯結(jié)果句號與其前面一個單詞間的空格,逗號與其前面一個單詞間的空格去掉等;d.2大小寫轉(zhuǎn)換模塊主要適用于西語作為目標(biāo)語言的翻譯,例如英文句子的首字母要大寫,一些專用名詞的字母,例如usa也要大寫,該d.2大小寫轉(zhuǎn)換模塊把翻譯結(jié)果中相應(yīng)的小寫字母轉(zhuǎn)換成大寫字母;d.3格式轉(zhuǎn)換即保證輸出與輸入的格式一致,將輸出結(jié)果的格式轉(zhuǎn)化為輸入一致的格式,例如輸入的語言文本是圖片格式,則格式轉(zhuǎn)換模塊也將輸出結(jié)果轉(zhuǎn)換為圖片格式輸出。

綜上所述,本發(fā)明機(jī)器翻譯的后處理模塊能夠?qū)C(jī)器翻譯的翻譯結(jié)果進(jìn)行單詞標(biāo)點規(guī)范化、大小寫轉(zhuǎn)換及格式轉(zhuǎn)換等基本操作,使最終的輸出結(jié)果格式與輸入的格式一致,并且輸出結(jié)果符合翻譯目標(biāo)語言的常用表現(xiàn)形式。

以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。



技術(shù)特征:

技術(shù)總結(jié)
本發(fā)明公開了一種多語言智能預(yù)處理實時統(tǒng)計機(jī)器翻譯系統(tǒng)的后處理模塊,所述后處理模塊包括單詞標(biāo)點規(guī)范化模塊、大小寫轉(zhuǎn)換模塊和格式轉(zhuǎn)換模塊;所述單詞標(biāo)點規(guī)范化模塊用于將翻譯結(jié)果中的單詞和標(biāo)點規(guī)范化為目標(biāo)語言的表現(xiàn)形式,所述大小寫轉(zhuǎn)換模塊用于對翻譯結(jié)果中的大小寫進(jìn)行轉(zhuǎn)換。本發(fā)明機(jī)器翻譯的后處理模塊能夠?qū)C(jī)器翻譯的翻譯結(jié)果進(jìn)行單詞標(biāo)點規(guī)范化、大小寫轉(zhuǎn)換及格式轉(zhuǎn)換等基本操作,使最終的輸出結(jié)果格式與輸入的格式一致,并且輸出結(jié)果符合翻譯目標(biāo)語言的常用表現(xiàn)形式。

技術(shù)研發(fā)人員:張昱琪;唐亮
受保護(hù)的技術(shù)使用者:唐亮
技術(shù)研發(fā)日:2017.03.30
技術(shù)公布日:2017.08.04
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
都江堰市| 东源县| 正安县| 莱州市| 开封市| 大厂| 拉萨市| 洛隆县| 大渡口区| 兴化市| 乌苏市| 陆川县| 芜湖县| 马山县| 吐鲁番市| 澄城县| 蓬溪县| 涡阳县| 新津县| 睢宁县| 青神县| 文水县| 祁连县| 绍兴市| 米脂县| 象山县| 通山县| 澳门| 嘉兴市| 西乡县| 方山县| 突泉县| 横峰县| 鹤山市| 弥渡县| 贵南县| 阿图什市| 石阡县| 福泉市| 陕西省| 托里县|