两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種文字轉(zhuǎn)換方法及裝置的制作方法

文檔序號(hào):6483592閱讀:164來源:國知局

專利名稱::一種文字轉(zhuǎn)換方法及裝置的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及計(jì)算機(jī)及通信領(lǐng)域,特別是涉及文字轉(zhuǎn)換方法及裝置。
背景技術(shù)
:伴隨著信息技術(shù)的發(fā)展以及全球網(wǎng)絡(luò)的一體化趨勢(shì),機(jī)器翻譯技術(shù)也得以不斷提高,翻譯軟件的輔助翻譯作用愈發(fā)明顯。目前,國內(nèi)的機(jī)器翻譯軟件就不下百種,根據(jù)這些軟件的翻譯特點(diǎn),大致可以分為三大類詞典翻譯類、漢化翻譯類和專業(yè)翻譯類。詞典翻譯類僅是提供詞的查找和翻譯,無法提供句子或文章的翻譯。對(duì)于漢化翻譯類,在平時(shí)的翻譯過程中,句型相同或相似的句子也經(jīng)常出現(xiàn),軟件大多采用的是語法樹結(jié)構(gòu)的翻譯內(nèi)核,這種內(nèi)核適用于比較有規(guī)律的語句,而對(duì)于變化多端的自然語言,采用千篇一律的翻譯模式,往往不能奏效。另一種以語法模式為主的翻譯內(nèi)核,是基于傳統(tǒng)語法樹和以自然語言為基礎(chǔ)的一種廣義語法結(jié)構(gòu),計(jì)算機(jī)根據(jù)這些規(guī)則"舉一反三"地進(jìn)行翻譯,在不斷"學(xué)習(xí)"新語法的情況下,高質(zhì)量的參考譯文就出現(xiàn)了。廣義語法的基礎(chǔ)是"句型"和"類別",這使語法的表現(xiàn)形式更簡(jiǎn)單、易用,并可分類繼承,提高了系統(tǒng)的專業(yè)翻譯水平。然而該方法仍存在一定的局限性,對(duì)靈活的自然語言翻譯仍不夠準(zhǔn)確。專業(yè)翻譯類是一種人工輔助翻譯方式,需要有外語基礎(chǔ)的工作人員來輔助完成翻譯工作,無法自動(dòng)完成較理想的翻譯工作。綜上,現(xiàn)有的翻譯方法所實(shí)現(xiàn)的翻譯結(jié)果均不理想。
發(fā)明內(nèi)容本發(fā)明實(shí)施例提供一種文字轉(zhuǎn)換方法及裝置,用于提高自然語言自動(dòng)翻譯的準(zhǔn)確性。—種文字轉(zhuǎn)換方法,包括以下步驟根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng);根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng);根據(jù)獲得的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞;根據(jù)第二語言的語法表達(dá)規(guī)則將第二語言文字表達(dá)的詞組織成句子?!N用于實(shí)現(xiàn)文字轉(zhuǎn)換的裝置,包括語義查詢模塊,用于根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng);語義轉(zhuǎn)換模塊,用于根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng);詞查找模塊,用于根據(jù)獲得的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞;組織模塊,用于根據(jù)第二語言的語法規(guī)則將第二語言文字表達(dá)的詞組織成句子?!N用于實(shí)現(xiàn)文字轉(zhuǎn)換的系統(tǒng),包括第一用戶設(shè)備,用于獲得第一語言表達(dá)文字的句子;以及獲得該句子的句法代碼;根據(jù)該句法代碼以通用句法結(jié)構(gòu)的形式將該句子輸出給用戶,和/或,根據(jù)該句法代碼將該句子中每個(gè)詞對(duì)應(yīng)的語義項(xiàng)輸出給用戶,并將用戶確認(rèn)后的句法代碼發(fā)送給服務(wù)器和第二用戶設(shè)備;其中,句法代碼用于表示通用句法結(jié)構(gòu),并且當(dāng)通用句法結(jié)構(gòu)的各結(jié)構(gòu)對(duì)應(yīng)有詞時(shí),句法代碼還包括與句子中每個(gè)詞的語義項(xiàng)對(duì)應(yīng)的語義代碼;服務(wù)器,用于判斷本地是否存有第一語言表達(dá)的句子所對(duì)應(yīng)的句法代碼;若有,則將所述句子的句法代碼發(fā)送給第一用戶設(shè)備;否則,根據(jù)第一語言表達(dá)的句子獲得該句子的句法代碼并發(fā)送給第一用戶設(shè)備,或者,指示第一用戶設(shè)備根據(jù)第一語言表達(dá)的句子獲得該句子的句法代碼;第二用戶設(shè)備,用于根據(jù)獲得的句法代碼中的語義代碼獲得第二語言文字表達(dá)的詞,并根據(jù)第二語言的語法表達(dá)規(guī)則和句法代碼將第二語言文字表達(dá)的詞組織成句子。本發(fā)明實(shí)施例根據(jù)第一語言的詞查找與其具有相同或相近含義的第二語言的詞,從而實(shí)現(xiàn)第一語言到第二語言的翻譯,并且文字轉(zhuǎn)換結(jié)果更準(zhǔn)確。附圖說明圖1為本發(fā)明實(shí)施例中文字轉(zhuǎn)換方法的主要流程圖;圖2為本發(fā)明實(shí)施例中文字轉(zhuǎn)換方法的詳細(xì)流程圖;圖3為本發(fā)明實(shí)施例中第一語言操作界面的示意圖;圖4為本發(fā)明實(shí)施例中第二語言操作界面的示意圖;圖5為本發(fā)明實(shí)施例中根據(jù)用戶的輸入和指示進(jìn)行文字轉(zhuǎn)換方法的詳細(xì)流程圖;圖6為本發(fā)明實(shí)施例中包含語義項(xiàng)輸入的操作界面的示意圖;圖7為本發(fā)明實(shí)施例中裝置的主要結(jié)構(gòu)圖;圖8為本發(fā)明實(shí)施例中裝置的詳細(xì)結(jié)構(gòu)圖;圖9為本發(fā)明實(shí)施例中系統(tǒng)的結(jié)構(gòu)圖。具體實(shí)施例方式發(fā)明人發(fā)現(xiàn),自然語言通訊的基本原則是語義約定通訊,可以首先基于自然語言學(xué)常識(shí)推導(dǎo)出各種自然語言通用的句子語義約定基本定律,然后再根據(jù)這組定律進(jìn)行多種語言之間的文字轉(zhuǎn)換。定律1:各種自然語言詞匯及固定搭配短語的語義,均可用本語言基礎(chǔ)詞匯進(jìn)行語義約定(例如,朗曼英語詞典用1000多常用詞匯對(duì)任意詞匯、固定搭配短語進(jìn)行語義約定);并且,一種自然語言的基礎(chǔ)詞匯,可以對(duì)其他語言的任意詞匯進(jìn)行語義約定(用一種自然語言的常用詞匯對(duì)其他自然語言的任意詞匯符號(hào)進(jìn)行語義描述)。定律2:從定律1可以自然引申出基礎(chǔ)詞匯語義約定定律各種自然語言基礎(chǔ)詞匯的語義彼此循環(huán)約定(例如,"'好''壞'的反義詞"。"'父親'兒子的爸爸"。"'美'美麗、漂亮、好看......."。)。定律3:自然語言語義符號(hào)冗余定律在不參照句子以外上下文的前提下,如果一個(gè)句子中缺損某個(gè)語義符號(hào)(包括詞匯、語法、句法規(guī)則符號(hào)表達(dá)式)不影響讀者理解語義,并且讀者知道缺損的是什么符號(hào),則此符號(hào)屬于習(xí)慣性表達(dá)冗余符號(hào)(例如,漢語中的大多數(shù)量詞、英語中的不定冠詞、不可能實(shí)現(xiàn)的虛擬語氣表達(dá)規(guī)則)。對(duì)于不同自然語言之間的語義信息通訊而言,此類冗余符號(hào)不需要進(jìn)行語義約定。定律4:只有各種自然語言通用的語法概念才是必要語法概念。雖然各種自然語言的語法概念的表達(dá)形式不同,雖然自然語言翻譯既可以直譯也可以意譯。但是,無論直譯還是意譯,任何一種自然語言翻譯的譯文語法轉(zhuǎn)換過程,都是在憑空添加原文中沒有的譯文特殊語法概念。因此,各種自然語言的特殊語法概念實(shí)際上均滿足"缺損某個(gè)詞匯、語法、句法規(guī)則符號(hào)表達(dá)式不影響讀者理解語義,并且讀者知道缺損的是什么符號(hào)"的冗余成分判定條件。定律5:任何一個(gè)不規(guī)范的句子語義表達(dá)式(含詞匯語義和語法語義)均可以用規(guī)范的句子語義表達(dá)式進(jìn)行語義約定(例如,任何一個(gè)固定搭配句子、成分缺損句子、口語句子,均可以用一個(gè)規(guī)范的書面語體句子表達(dá)式進(jìn)行語義約定)。從實(shí)用層面上講,從上述定律出發(fā),將有可能產(chǎn)生一種各種自然語言通用的、能夠保障語義信息傳遞質(zhì)量的自然語言語義約定翻譯方法。本發(fā)明實(shí)施例通過第一語言文字的詞來查找與該詞的語義項(xiàng)對(duì)應(yīng)的第二語言文字的詞,即根據(jù)相同或相近的語義項(xiàng),將第一語言文字轉(zhuǎn)換為第二語言文字,使得轉(zhuǎn)換結(jié)果更準(zhǔn)確。本發(fā)明實(shí)施例中的語義項(xiàng)是指詞的含義解釋。如,詞"好"的含義1:形容詞與壞相對(duì),優(yōu)、精、良、妙、出色(0001-1);含義2:名稱友愛、友善、友好、和睦、投機(jī)(0001-2)。含義1和含義2所指的內(nèi)容即為語義項(xiàng),0001-1和0001-2為語義項(xiàng)對(duì)應(yīng)的語義代碼。參見圖l,本實(shí)施例中文字轉(zhuǎn)換的主要方法流程如下步驟101:根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng)。步驟102:根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng)。步驟103:根據(jù)查找到的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞。步驟104:根據(jù)第二語言的語法表達(dá)規(guī)則將第二語言文字表達(dá)的詞組織成句子。所述的語法表達(dá)規(guī)則是指語法概念的表達(dá)規(guī)則。例如,英語、漢語主要用句子中詞匯排序來表達(dá)句子成分(如主語、賓語)語法概念,俄語則在詞匯符號(hào)中直接標(biāo)識(shí)主格、賓格表達(dá)句子成分。英語用添加專用符號(hào)+動(dòng)詞變形表達(dá)"過去完成時(shí)"時(shí)態(tài)概念,漢語則用獨(dú)立詞匯符號(hào)"已經(jīng)....過了"表達(dá)"過去完成時(shí)"時(shí)態(tài)概念。其中,第一語言文字表達(dá)的詞、第一語言文字表達(dá)的語義項(xiàng)、語義代碼、第二語言文字表達(dá)的語義項(xiàng)和第二語言文字表達(dá)的詞之間的對(duì)應(yīng)關(guān)系如表1所示表1<table>tableseeoriginaldocumentpage7</column></row><table>參見圖2,本實(shí)施例中文字轉(zhuǎn)換的詳細(xì)方法流程如下步驟201:獲得的第一語言文字表達(dá)的句子,對(duì)該句進(jìn)行分詞處理,得到第一語言文字表達(dá)的詞。該分詞過程可自動(dòng)完成,也可通過用戶的操作實(shí)現(xiàn)。若獲得的是第一語言文字表達(dá)的段或文章,可先將其拆分為句,再進(jìn)行分詞處理。步驟202:根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng)。其中,預(yù)先設(shè)有詞與語義項(xiàng)的對(duì)應(yīng)關(guān)系。當(dāng)該詞有多個(gè)語義項(xiàng)時(shí),根據(jù)該詞在句中的詞性確定語義項(xiàng),和/或,從多個(gè)語義項(xiàng)中選擇使用頻率最高的語義項(xiàng),并更新語義項(xiàng)的使用頻率。本實(shí)施例中使用頻率可以是該語義項(xiàng)的應(yīng)用次數(shù),或者是該語義項(xiàng)的應(yīng)用次數(shù)與所有語義項(xiàng)的應(yīng)用次數(shù)的和的比值,或者是該語義項(xiàng)在一段時(shí)間內(nèi)的應(yīng)用次數(shù)與所有語義項(xiàng)在該時(shí)間段內(nèi)的應(yīng)用次數(shù)的和的比值,也可以是其它能反映頻率性質(zhì)的參數(shù)。步驟203:將獲得的第一語言文字表達(dá)的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中。該步驟可以在步驟202之前執(zhí)行,然后根據(jù)詞所對(duì)應(yīng)的結(jié)構(gòu)確定詞的詞性,在步驟202中根據(jù)詞的詞性確定詞的語義項(xiàng)。步驟204:根據(jù)獲得的語義項(xiàng)查找對(duì)應(yīng)的語義代碼。其中,預(yù)先建立有語義項(xiàng)與語義代碼的對(duì)應(yīng)關(guān)系。步驟205:根據(jù)獲得的語義代碼獲得第二語言文字表達(dá)的詞。當(dāng)一個(gè)語義項(xiàng)對(duì)應(yīng)有多個(gè)詞時(shí),可從中選擇使用頻率最高的詞,并更新詞的使用頻率。同時(shí),可根據(jù)需要的詞的詞性,來選擇合適的詞。步驟206:根據(jù)第二語言的語法表達(dá)規(guī)則和各詞在通用句法結(jié)構(gòu)中所對(duì)應(yīng)的結(jié)構(gòu),將第二語言文字表達(dá)的詞組織成句子。第一語言以漢語為例,參見圖3所示,3-l中示出了一段文章,該文章可以是用戶輸入的,也可以是從郵件、即時(shí)通信或網(wǎng)頁等處獲得的。并且,3-l所示的文章已進(jìn)行了分詞處理,該分詞處理可以是自動(dòng)實(shí)現(xiàn),也可通過用戶操作來實(shí)現(xiàn),或者在自動(dòng)實(shí)現(xiàn)后由用戶對(duì)分詞結(jié)果進(jìn)行確認(rèn),當(dāng)認(rèn)為分詞結(jié)果不正確時(shí),用戶可通過修改3-1中的"\"來修改分詞結(jié)果。3-2中示出了經(jīng)過分詞處理的一句話"女王陛下\要求\我\朗讀\以下\咨文",每個(gè)詞旁的小號(hào)字為該詞對(duì)應(yīng)的語義項(xiàng),如"女王陛下"的語義項(xiàng)(即含義)是"名(詞性)對(duì)女王的尊稱"??梢栽讷@得語義項(xiàng)的同時(shí),將獲得的詞對(duì)應(yīng)到到3-3所示的通用句法結(jié)構(gòu)的各結(jié)構(gòu)中。本實(shí)施例中通用句法結(jié)構(gòu)包括主語區(qū)、謂語區(qū)和賓語區(qū),每個(gè)區(qū)還包括修飾區(qū)、核心區(qū)和補(bǔ)充區(qū)。其中將句間連詞或特殊句法結(jié)構(gòu)詞等不確定成分對(duì)應(yīng)到主語區(qū)的補(bǔ)充區(qū)。3-4所示的結(jié)構(gòu)是對(duì)3-3中子句的進(jìn)一步分析。為了便于模塊或設(shè)備間的數(shù)據(jù)傳輸,本實(shí)施例對(duì)各結(jié)構(gòu)進(jìn)行編碼,如3-3中按由左至右從上到下的順序,各結(jié)構(gòu)的編碼如Al、A2、A3、B1、B2、B3、C1、C2和C3,句子女王陛下\要求\我\朗讀\以下\咨文"中各詞的語義項(xiàng)所對(duì)應(yīng)的語義代碼如0010-1、0011-1、0012-1、0013-1、0014-1和0015-1,則該句的編碼為"A1(),A2(0010-1),A3(),Bl(),B2(0011-1),B3(),Cl(),C2(Al(),A2(0012-1),A3(),Bl(),B2(0013-1),B3(),Cl(0014-1),C2(0015-1),C3()),C3();",多種語言相同含義的語義項(xiàng)可對(duì)應(yīng)相同的語義代碼。然后,根據(jù)該編碼進(jìn)行文字轉(zhuǎn)換,第二語言以英語為例,參見圖4所示。根據(jù)語義代碼確定第二語言文字表示的語義項(xiàng),即4-2中小字號(hào)所示的內(nèi)容。然后根據(jù)該語義項(xiàng)確定相應(yīng)的詞,即4-2中大字號(hào)所示的內(nèi)容。4-3和4-4示出了獲得的詞所對(duì)應(yīng)的結(jié)構(gòu),根據(jù)該結(jié)構(gòu)和英語語法,將結(jié)構(gòu)中的內(nèi)容組陣成4-l中所示的句子。從而實(shí)現(xiàn)了中文到英文的翻譯,其中圖4中的內(nèi)容為圖3中內(nèi)容的英文譯文。圖4所示的界面為用戶提供了查詢功能,如可先在4-l中顯示句子,用戶可通過點(diǎn)擊4-l中的句子或句子中的詞來查詢?cè)摼渥拥慕Y(jié)構(gòu)、句子中每個(gè)詞的語義項(xiàng)、和/或句子中每個(gè)詞對(duì)應(yīng)的結(jié)構(gòu),查詢結(jié)果在4-2和/或4-3中顯示。用戶根據(jù)4-2中所示的語義項(xiàng)可更準(zhǔn)確的理解詞在句子中的含義,從而更準(zhǔn)確的理解句子。其中,在步驟203中將獲得的第一語言文字表達(dá)的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中的具體實(shí)現(xiàn)過程包括確定句子中所有詞的所有可能的詞性,并確定具有唯一詞性的詞。如句子"女王陛下\要求\我\朗讀\以下\咨文"中,"女王陛下"為名詞,"要求"為動(dòng)詞或名詞,"我"為代詞,"朗讀"為動(dòng)詞,"以下"為介詞,"咨文"為名詞,具有唯一詞性的詞有"女王陛下"、"我"、"朗讀"、"以下"和"咨文"。根據(jù)語法表達(dá)規(guī)則和/或通用句法結(jié)構(gòu)中各結(jié)構(gòu)對(duì)詞性的要求,確定各詞在句子中的成分,較佳的,先確定具有唯一詞性的詞在句子中的成分,再確定其它詞在句子中的成分。如"女王陛下"為名稱,可能是主語或賓語,又因?yàn)?女王陛下"出現(xiàn)在句首,后接的詞"要求"可以有動(dòng)詞詞性,則確定"女王陛下"為主語,從而確定"要求"為謂語,"要求"后面的內(nèi)容應(yīng)為賓語。代詞"我"可能是主語或賓語,因?yàn)?我"后接的詞"朗讀"為動(dòng)詞,則確定在子句"我\朗讀\以下\咨文"中"我"為主語,從而確定"朗讀"為謂語,"以下\咨文"為賓語。上述舉例是根據(jù)語法表達(dá)規(guī)則所設(shè)置的判斷條件,來確定各詞在句子中的成分,也可以將句子中各詞的詞性與預(yù)設(shè)的有效句型中各結(jié)構(gòu)的詞性按順序進(jìn)行匹配,若匹配一致,則可根據(jù)匹配成功的有效句型確定句子中各詞的成分。如句子"女王陛下\要求\我\朗讀\以下\咨文"中各詞的詞性與有效句型"(主句)主語_名詞、(主句)謂_動(dòng)詞、(賓語)子句主語-代詞、(賓語)子句謂語-動(dòng)詞、(賓語)子句賓語-名詞"的詞性匹配一致,或者說匹配程度最高,從而可確定句子"女王陛下\要求\我\朗讀\以下\咨文"中各詞的句子成分。若一個(gè)句子與所有的有效句型均不匹配,或者匹配程度均低于預(yù)設(shè)的程度門限(如60%),則該句子屬于無效句型,由用戶重新輸入或由用戶通過在3-3中的操作來進(jìn)行結(jié)構(gòu)劃分??筛鶕?jù)用戶劃分后的結(jié)構(gòu)生成新的有效句型。本實(shí)施例中圖3所示的界面為可操作界面,用戶可以通過該界面對(duì)其中的內(nèi)容進(jìn)行更改。如將3-1中的詞用鼠標(biāo)拖動(dòng)到3-2或3-3中,或者在3-3中直接輸入詞,3_2和3_1自動(dòng)根據(jù)3-3中的內(nèi)容進(jìn)行相應(yīng)的輸出。當(dāng)某個(gè)詞有多個(gè)語義項(xiàng)時(shí),在3-2中詞的旁邊可輸出多個(gè)語義項(xiàng),由用戶選擇確定的語義項(xiàng),如果用戶認(rèn)為3-2中輸出的語義項(xiàng)均不準(zhǔn)確時(shí),還可以自行輸入語義項(xiàng)。下面是帶有用戶操作過程的文字轉(zhuǎn)換流程進(jìn)行詳細(xì)介紹。參見圖5,本實(shí)施例中根據(jù)用戶操作進(jìn)行文字轉(zhuǎn)換的方法流程如下步驟501:獲得的第一語言文字表達(dá)的句子,對(duì)該句進(jìn)行分詞處理,得到第一語言文字表達(dá)的詞。若獲得的是第一語言文字表達(dá)的段或文章,可先將其拆分為句,再進(jìn)行分詞處理。步驟502:根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng)。當(dāng)該詞有多個(gè)語義項(xiàng)時(shí),根據(jù)用戶的操作確定其中的一個(gè)語義項(xiàng)?;蛘?,參見圖6所示,由用戶在6-1的"語義描述"中輸入相應(yīng)的語義項(xiàng),并將該語義項(xiàng)顯示在3-2中。根據(jù)用戶在6-l中設(shè)置的時(shí)態(tài)等內(nèi)容,可得到更為準(zhǔn)確的轉(zhuǎn)換結(jié)果。步驟503:通過用戶的拖動(dòng)操作,將獲得的第一語言文字表達(dá)的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中。還可進(jìn)一步判斷拖動(dòng)后的對(duì)應(yīng)結(jié)果是否可滿足有效句型詞性匹配規(guī)則,若不滿足,則提示用戶重新操作。步驟504:將獲得的語義項(xiàng)轉(zhuǎn)換為第二語言文字表達(dá)的語義項(xiàng)。該過程可參見圖1或圖2所示的文字轉(zhuǎn)換流程。步驟505:根據(jù)第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞。在該步驟中,將第二語言文字表達(dá)的語義項(xiàng)作為第二語言文字表達(dá)的詞。例如漢語固定搭配"一箭雙雕"的語義項(xiàng)是"一個(gè)行為達(dá)到兩個(gè)目的",然而可能"一箭雙雕"沒有對(duì)應(yīng)的英文固定搭配表達(dá),則將"一個(gè)行為達(dá)到兩個(gè)目的"翻譯成英文,然后在"一箭雙雕"出現(xiàn)的位置用"一個(gè)行為達(dá)到兩個(gè)目的"的英文表達(dá)來代替"一箭雙雕"。步驟506:根據(jù)第二語言的語法表達(dá)規(guī)則和各詞在通用句法結(jié)構(gòu)中所對(duì)應(yīng)的結(jié)構(gòu),將第二語言文字表達(dá)的詞組織成句子。在步驟503后,可以根據(jù)獲得的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼。當(dāng)語義項(xiàng)為用戶自行定義的時(shí),根據(jù)語義代碼的生成規(guī)則自動(dòng)為該語義項(xiàng)生成語義代碼,生成的語義代碼可唯一標(biāo)識(shí)語義項(xiàng)即可。并建立生成的語義代碼與轉(zhuǎn)換后的第二語言文字表達(dá)的語義項(xiàng)的對(duì)應(yīng)關(guān)系,便于第二語言用戶直接查詢。其中,語義代碼的生成規(guī)則有多種,如將用戶自行定義的語義項(xiàng)中各詞的語義項(xiàng)對(duì)應(yīng)的語義代碼順序組合成新的語義代碼,該新的語義代碼即為用戶自行定義的語義項(xiàng)所對(duì)應(yīng)的語義代碼。通過以上介紹了解了文字轉(zhuǎn)換的實(shí)現(xiàn)過程,該方法可由一個(gè)裝置或由多個(gè)裝置構(gòu)成的系統(tǒng)實(shí)現(xiàn),下面先對(duì)實(shí)現(xiàn)該方法的裝置進(jìn)行介紹。參見圖7,文字轉(zhuǎn)換裝置包括語義查詢模塊701、語義轉(zhuǎn)換模塊702、詞查找模塊703和組織模塊704。語義查詢模塊701用于根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng)。當(dāng)?shù)玫脚c詞對(duì)應(yīng)的多個(gè)語義項(xiàng)時(shí),根據(jù)用戶的指示從多個(gè)語義項(xiàng)中確定一個(gè)語義項(xiàng),或者,根據(jù)語義項(xiàng)的使用頻率從多個(gè)語義項(xiàng)中確定一個(gè)使用頻率最高的語義項(xiàng),或者,根據(jù)該詞在句子中的詞性從多個(gè)語義項(xiàng)中確定一個(gè)語義項(xiàng)。語義轉(zhuǎn)換模塊702用于根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng)。其中語義轉(zhuǎn)換模塊702可以包括第一轉(zhuǎn)換子模塊,用于根據(jù)獲得的語義項(xiàng)查找對(duì)應(yīng)的語義代碼;第二轉(zhuǎn)換子模塊,用于根據(jù)獲得的語義代碼查找對(duì)應(yīng)的第二語言文字表達(dá)的語義項(xiàng)。詞查找模塊703用于根據(jù)查找到的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞。組織模塊704用于根據(jù)第二語言的語法表達(dá)規(guī)則將第二語言文字表達(dá)的詞組織成句子。所述裝置還包括分詞模塊705,參見圖8所示,分詞模塊705用于當(dāng)獲得了第一語言文字表達(dá)的句子時(shí),對(duì)獲得的第一語言文字表達(dá)的句子進(jìn)行分詞,獲得第一語言文字表達(dá)的詞。所述裝置還包括接口模塊706,用于為用戶提供操作界面,并獲得用戶輸入的句、詞和語義項(xiàng)等。例如,通過為用戶提供的操作界面,獲得用戶根據(jù)第一語言文字表達(dá)的詞輸入的與詞對(duì)應(yīng)的語義項(xiàng);語義查詢模塊701還用于根據(jù)獲得的語義項(xiàng)所包含的詞,查找與該詞對(duì)應(yīng)的語義項(xiàng);組織模塊704還用于將組織成的句子作為第二語言文字表達(dá)的語義項(xiàng)傳輸給詞查找模塊;詞查找模塊703用于將查找到的第二語言文字表達(dá)的語義項(xiàng)作為第二語言文字表達(dá)的詞。接口模塊706還用于獲得點(diǎn)擊組織成的句子中的詞的操作。語義查詢模塊701還用于通過點(diǎn)擊組織成的句子中的詞來查詢?cè)撛~對(duì)應(yīng)的語義項(xiàng)。所述裝置還包括存儲(chǔ)模塊707,用于存儲(chǔ)多種語言的詞、語義項(xiàng)和語義代碼等及它們之間的對(duì)應(yīng)關(guān)系。所述裝置還包括結(jié)構(gòu)分析模塊708,用于將獲得的第一語言文字表達(dá)的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中。組織模塊704用于根據(jù)第二語言的語法規(guī)則和各詞在通用句法結(jié)構(gòu)中所對(duì)應(yīng)的結(jié)構(gòu),將第二語言文字表達(dá)的詞組織成句子。具體的,組織模塊704用于根據(jù)第二語言的語法表達(dá)規(guī)則和包括語義代碼的通用句法結(jié)構(gòu)的句法代碼,將第二語言文字表達(dá)的詞組織成句子。接口模塊706用于通過為用戶提供的操作界面獲得用戶將獲得的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中的操作。語義查詢模塊701還可以根據(jù)結(jié)構(gòu)分析模塊708的結(jié)構(gòu)劃分結(jié)果確定各詞的詞性,并根據(jù)各詞的詞性來確定各詞的語義項(xiàng)。所述裝置中的各模塊可以位于多個(gè)物理實(shí)體中,則該多個(gè)物理實(shí)體構(gòu)成了系統(tǒng)。可以將所述裝置制成插件,便于在即時(shí)通信、郵件和網(wǎng)頁等場(chǎng)景中實(shí)現(xiàn)多種語言之間的翻譯。參見圖9,本實(shí)施例中文字轉(zhuǎn)換系統(tǒng)包括第一用戶設(shè)備901、服務(wù)器902和第二用戶設(shè)備903。第一用戶設(shè)備901用于獲得第一語言表達(dá)文字的句子;以及獲得該句子的句法代碼;根據(jù)該句法代碼以通用句法結(jié)構(gòu)的形式將該句子輸出給用戶,和/或,根據(jù)該句法代碼將該句子中每個(gè)詞對(duì)應(yīng)的語義項(xiàng)輸出給用戶,并將用戶確認(rèn)后的句法代碼發(fā)送給服務(wù)器902和第二用戶設(shè)備903;其中,句法代碼用于表示通用句法結(jié)構(gòu),并且當(dāng)通用句法結(jié)構(gòu)的各結(jié)構(gòu)對(duì)應(yīng)有詞時(shí),句法代碼還包括與句子中每個(gè)詞的語義項(xiàng)對(duì)應(yīng)的語義代碼。服務(wù)器902用于判斷本地是否存有第一語言表達(dá)的句子所對(duì)應(yīng)的句法代碼;若有,則將所述句子的句法代碼發(fā)送給第一用戶設(shè)備;否則,根據(jù)第一語言表達(dá)的句子獲得該句子的句法代碼并發(fā)送給第一用戶設(shè)備,或者,指示第一用戶設(shè)備根據(jù)第一語言表達(dá)的句子獲得該句子的句法代碼。服務(wù)器902還可以保存第一用戶設(shè)備901發(fā)送的句法代碼。第二用戶設(shè)備903用于根據(jù)獲得的句法代碼中的語義代碼獲得第二語言文字表達(dá)的詞,并根據(jù)第二語言的語法規(guī)則和句法代碼將第二語言文字表達(dá)的詞組織成句子。第二用戶設(shè)備903還用于通過獲得點(diǎn)擊組織成的句子或句子中的詞的操作,來查詢?cè)撛~對(duì)應(yīng)的語義項(xiàng)和/或通用句法結(jié)構(gòu)中的結(jié)構(gòu)并輸出給用戶。第一用戶設(shè)備901與第二用戶設(shè)備903可以是完全相同的設(shè)備,只是在不同場(chǎng)景下起著不同的作用。第一用戶設(shè)備901、服務(wù)器902和第二用戶設(shè)備903之間的信息傳輸可通過即時(shí)通信系統(tǒng)、郵件系統(tǒng)或網(wǎng)頁(WEB)系統(tǒng)等實(shí)現(xiàn)。用于實(shí)現(xiàn)本發(fā)明實(shí)施例的軟件可以存儲(chǔ)于軟盤、硬盤、光盤和閃存等存儲(chǔ)介質(zhì)。本發(fā)明實(shí)施例根據(jù)第一語言的詞查找與其具有相同或相近含義的第二語言的詞,從而實(shí)現(xiàn)第一語言到第二語言的翻譯,并且文字轉(zhuǎn)換結(jié)果更準(zhǔn)確。當(dāng)一個(gè)詞有多個(gè)語義項(xiàng)時(shí),可通過使用頻率、詞性或用戶的指示等確定一個(gè)最貼切的語義項(xiàng),根據(jù)該語義項(xiàng)獲得的第二語言的詞也更準(zhǔn)確。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若對(duì)本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。權(quán)利要求一種用于實(shí)現(xiàn)文字轉(zhuǎn)換的裝置,其特征在于,包括語義查詢模塊,用于根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng);語義轉(zhuǎn)換模塊,用于根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng);詞查找模塊,用于根據(jù)獲得的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞;組織模塊,用于根據(jù)第二語言的語法表達(dá)規(guī)則將第二語言文字表達(dá)的詞組織成句子。2.如權(quán)利要求1所述的裝置,其特征在于,還包括接口模塊,用于通過為用戶提供的操作界面,獲得用戶根據(jù)第一語言文字表達(dá)的詞輸入的與詞對(duì)應(yīng)的語義項(xiàng);語義查詢模塊還用于根據(jù)獲得的語義項(xiàng)所包含的詞,查找與該詞對(duì)應(yīng)的語義項(xiàng);組織模塊還用于將組織成的句子作為第二語言文字表達(dá)的語義項(xiàng)傳輸給詞查找模塊;詞查找模塊用于將獲得的第二語言文字表達(dá)的語義項(xiàng)作為第二語言文字表達(dá)的詞。3.如權(quán)利要求1所述的裝置,其特征在于,還包括結(jié)構(gòu)分析模塊,用于將獲得的第一語言文字表達(dá)的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中;組織模塊用于根據(jù)第二語言的語法表達(dá)規(guī)則和各詞在通用句法結(jié)構(gòu)中所對(duì)應(yīng)的結(jié)構(gòu),將第二語言文字表達(dá)的詞組織成句子。4.如權(quán)利要求3所述的裝置,其特征在于,組織模塊用于根據(jù)第二語言的語法表達(dá)規(guī)則和包括語義代碼的通用句法結(jié)構(gòu)的句法代碼,將第二語言文字表達(dá)的詞組織成句子。5.如權(quán)利要求3所述的裝置,其特征在于,還包括接口模塊,用于通過為用戶提供的操作界面獲得用戶將獲得的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中的操作。6.如權(quán)利要求3所述的裝置,其特征在于,語義查詢模塊用于當(dāng)?shù)玫脚c詞對(duì)應(yīng)的多個(gè)語義項(xiàng)時(shí),根據(jù)用戶的指示從多個(gè)語義項(xiàng)中確定一個(gè)語義項(xiàng),或者,根據(jù)語義項(xiàng)的使用頻率從多個(gè)語義項(xiàng)中確定一個(gè)使用頻率最高的語義項(xiàng),或者,根據(jù)該詞的詞性從多個(gè)語義項(xiàng)中確定一個(gè)語義項(xiàng)。7.如權(quán)利要求1所述的裝置,其特征在于,還包括接口模塊,用于獲得點(diǎn)擊組織成的句子或句子中的詞的操作;語義查詢模塊還用于通過點(diǎn)擊組織成的句子中的詞來查詢?cè)撛~對(duì)應(yīng)的語義項(xiàng)。8.—種文字轉(zhuǎn)換方法,其特征在于,包括以下步驟根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng);根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng);根據(jù)獲得的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞;根據(jù)第二語言的語法規(guī)則將第二語言文字表達(dá)的詞組織成句子。9.如權(quán)利要求8所述的文字轉(zhuǎn)換方法,其特征在于,根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng)的步驟包括通過為用戶提供的操作界面,獲得用戶根據(jù)第一語言文字表達(dá)的詞輸入的與詞對(duì)應(yīng)的語義項(xiàng);根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的第二語言文字表達(dá)的語義項(xiàng)的步驟包括根據(jù)獲得的語義項(xiàng)所包含的詞,查找與該詞對(duì)應(yīng)的語義項(xiàng);根據(jù)查找到的語義項(xiàng)查找對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng);根據(jù)查找到的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞;根據(jù)第二語言的語法表達(dá)規(guī)則將第二語言文字表達(dá)的詞組織成句子,得到第二語言文字表達(dá)的語義項(xiàng);根據(jù)查找到的第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞的步驟包括將查找到的第二語言文字表達(dá)的語義項(xiàng)作為第二語言文字表達(dá)的詞。10.如權(quán)利要求8所述的文字轉(zhuǎn)換方法,其特征在于,在根據(jù)第二語言的語法表達(dá)規(guī)則將第二語言文字表達(dá)的詞組織成句子之前,將獲得的第一語言文字表達(dá)的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中;根據(jù)第二語言的語法規(guī)則將第二語言文字表達(dá)的詞組織成句子的步驟包括根據(jù)第二語言的語法規(guī)則和各詞在通用句法結(jié)構(gòu)中所對(duì)應(yīng)的結(jié)構(gòu),將第二語言文字表達(dá)的詞組織成句子。11.如權(quán)利要求io所述的文字轉(zhuǎn)換方法,其特征在于,根據(jù)第二語言的語法表達(dá)規(guī)則和各詞在通用句法結(jié)構(gòu)中所對(duì)應(yīng)的結(jié)構(gòu),將第二語言文字表達(dá)的詞組織成句子的步驟包括根據(jù)第二語言的語法表達(dá)規(guī)則和包括語義代碼的通用句法結(jié)構(gòu)的句法代碼,將第二語言文字表達(dá)的詞組織成句子。12.如權(quán)利要求IO所述的文字轉(zhuǎn)換方法,其特征在于,將獲得的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中的步驟包括通過為用戶提供的操作界面獲得用戶將獲得的詞對(duì)應(yīng)到通用句法結(jié)構(gòu)的各結(jié)構(gòu)中的操作。13.如權(quán)利要求8所述的文字轉(zhuǎn)換方法,其特征在于,當(dāng)?shù)玫脚c詞對(duì)應(yīng)的多個(gè)語義項(xiàng)時(shí),根據(jù)用戶的指示從多個(gè)語義項(xiàng)中確定一個(gè)語義項(xiàng),或者,根據(jù)語義項(xiàng)的使用頻率從多個(gè)語義項(xiàng)中確定一個(gè)使用頻率最高的語義項(xiàng),或者,根據(jù)該詞的詞性從多個(gè)語義項(xiàng)中確定一個(gè)語義項(xiàng)。14.如權(quán)利要求8所述的文字轉(zhuǎn)換方法,其特征在于,還包括步驟通過點(diǎn)擊組織成的句子或句子中的詞來查詢?cè)撛~對(duì)應(yīng)的語義項(xiàng)和/或通用句法結(jié)構(gòu)中的結(jié)構(gòu)。15.—種用于實(shí)現(xiàn)文字轉(zhuǎn)換的系統(tǒng),其特征在于,包括第一用戶設(shè)備,用于獲得第一語言表達(dá)文字的句子;以及獲得該句子的句法代碼;根據(jù)該句法代碼以通用句法結(jié)構(gòu)的形式將該句子輸出給用戶,和/或,根據(jù)該句法代碼將該句子中每個(gè)詞對(duì)應(yīng)的語義項(xiàng)輸出給用戶,并將用戶確認(rèn)后的句法代碼發(fā)送給服務(wù)器和第二用戶設(shè)備;其中,句法代碼用于表示通用句法結(jié)構(gòu),并且當(dāng)通用句法結(jié)構(gòu)的各結(jié)構(gòu)對(duì)應(yīng)有詞時(shí),句法代碼還包括與句子中每個(gè)詞的語義項(xiàng)對(duì)應(yīng)的語義代碼;服務(wù)器,用于判斷本地是否存有第一語言表達(dá)的句子所對(duì)應(yīng)的句法代碼;若有,則將所述句子的句法代碼發(fā)送給第一用戶設(shè)備;否則,根據(jù)第一語言表達(dá)的句子獲得該句子的句法代碼并發(fā)送給第一用戶設(shè)備,或者,指示第一用戶設(shè)備根據(jù)第一語言表達(dá)的句子獲得該句子的句法代碼;第二用戶設(shè)備,用于根據(jù)獲得的句法代碼中的語義代碼獲得第二語言文字表達(dá)的詞,并根據(jù)第二語言的語法表達(dá)規(guī)則和句法代碼將第二語言文字表達(dá)的詞組織成句子。16.如權(quán)利要求15所述的系統(tǒng),其特征在于,第二用戶設(shè)備還用于通過獲得點(diǎn)擊組織成的句子或句子中的詞的操作,來查詢?cè)摼渥又械脑~對(duì)應(yīng)的語義項(xiàng)和/或通用句法結(jié)構(gòu)中的結(jié)構(gòu)并輸出給用戶。全文摘要本發(fā)明公開了一種文字轉(zhuǎn)換方法,用于提高自然語言自動(dòng)翻譯的準(zhǔn)確性。所述方法包括根據(jù)獲得的第一語言文字表達(dá)的詞得到與詞對(duì)應(yīng)的語義項(xiàng);根據(jù)與詞對(duì)應(yīng)的語義項(xiàng)獲得對(duì)應(yīng)的語義代碼或第二語言文字表達(dá)的語義項(xiàng);根據(jù)獲得的語義代碼或第二語言文字表達(dá)的語義項(xiàng)獲得第二語言文字表達(dá)的詞;根據(jù)第二語言的語法規(guī)則將第二語言文字表達(dá)的詞組織成句子。本發(fā)明還公開了用于實(shí)現(xiàn)所述方法的裝置和系統(tǒng)。文檔編號(hào)G06F17/28GK101777043SQ200910076370公開日2010年7月14日申請(qǐng)日期2009年1月14日優(yōu)先權(quán)日2009年1月14日發(fā)明者劉莎申請(qǐng)人:北京思在信息技術(shù)有限責(zé)任公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
太保市| 营山县| 建昌县| 新兴县| 芷江| 龙川县| 安岳县| 德保县| 铜川市| 定远县| 梨树县| 临夏市| 襄城县| 定远县| 青田县| 丹巴县| 西乡县| 北票市| 东乌珠穆沁旗| 钟山县| 乐清市| 嘉禾县| 大同县| 林口县| 济源市| 台中市| 彩票| 阜平县| 临泉县| 门头沟区| 历史| 喀喇| 蒲城县| 吉木乃县| 昌江| 彩票| 衡南县| 大渡口区| 监利县| 合水县| 张家界市|