專利名稱:語句構(gòu)件裝置和基于語句構(gòu)件的多語種專業(yè)翻譯方法
語句構(gòu)件裝置和基于語句構(gòu)件的多語種專業(yè)翻譯方法技術(shù)領(lǐng)域:
本發(fā)明涉及一種自然語言的處理或轉(zhuǎn)換的裝置和方法;特別涉及一種用于專業(yè)領(lǐng)域的多 語種機(jī)器輔助翻譯方法。背景技術(shù):
機(jī)器翻譯,如《自然語言的計(jì)算機(jī)處理》 一書,馮志偉著,上海外語教育出版社1996 年10月出版,其中第八章第一節(jié)機(jī)器翻譯。全文詳細(xì)闡述了 19世紀(jì)30年代初法國科學(xué)家阿 爾楚尼提出用機(jī)器來進(jìn)行語言翻譯的想法開始;到1946年世界第一臺(tái)計(jì)算機(jī)問世,同年就開 始了機(jī)器翻譯的研究,并一時(shí)興旺起來;1966年11月美國科學(xué)院的語言自動(dòng)處理咨詢委員 會(huì)公布了題為"語言與機(jī)器(ALPAC)"的報(bào)告,否定了機(jī)器翻譯并指出機(jī)器翻譯遇到了難 以克服的"語義障礙";繼后機(jī)器翻譯出現(xiàn)的空前蕭條;1970-1976年復(fù)蘇;以至1976年后的 繁榮等等,洋洋兩萬言,最后指出"1964年,美國ALPAC報(bào)告指出的機(jī)器翻譯遇到的H吾 義障礙'至今仍然存在,機(jī)器翻譯技術(shù)至今似乎仍然沒有突破性的進(jìn)展"。"機(jī)器翻譯系統(tǒng)的 實(shí)用化和商品化問題面臨著嚴(yán)峻的考驗(yàn)"。
大眾軟件,2004年第二期,作者王槊,采訪業(yè)界多位專家后報(bào)道,《機(jī)器翻譯,路在何 方》 一文中寫道"目前的機(jī)器翻譯主要有兩種形式,MT和TM。 MT (machine translation) 就是我們常見的基于規(guī)則的機(jī)器翻譯軟件,其主要用途是為了幫助英文不好的用戶提供翻譯 參考,但準(zhǔn)確性不高。其關(guān)鍵技術(shù)有4個(gè)方面單詞分析、語法分析、意義分析和文理分析。 它的工作過程是,先把語句分成幾個(gè)單詞,通過存放于機(jī)器數(shù)據(jù)庫內(nèi)的電子字典査清詞義, 根據(jù)語法規(guī)則分析語句的意思,并把它變換成概念構(gòu)造,然后借助語言模型生成目標(biāo)語言。 盡管從原理上來看,要實(shí)現(xiàn)這一系列步驟并不困難,但由于語言的特殊性和多樣化,以及人 工智能技術(shù)發(fā)展水平的限制,目前要做到不同語種間正確互譯是不可能的,這也是為什么現(xiàn) 在的機(jī)器翻譯軟件無法滿足人們的要求,翻譯出來的結(jié)果往往令人啼笑皆非的原因……。TM (Translation Memory,翻譯記憶),主要面向?qū)I(yè)翻譯人員和機(jī)構(gòu)設(shè)計(jì),以翻譯記憶和人機(jī) 交互為核心,要求使用者具備獨(dú)立的翻譯能力。它的原理是基于數(shù)據(jù)庫,將翻譯過的所有材 料以句子為單位存入數(shù)據(jù)庫。翻譯時(shí)系統(tǒng)自動(dòng)對(duì)電子文檔進(jìn)行分析,100%匹配的句子可以自 動(dòng)替換,部分匹配的句子可根據(jù)匹配度提出翻譯建議,新句子則通過系統(tǒng)提供的翻譯建議進(jìn) 行人工翻譯。科學(xué)研究表明,翻譯中的重復(fù)工作量約為30%, TM翻譯軟件使、、相同的句子永遠(yuǎn) 不需要翻譯第二遍〃,從而提高了工作效率。"最后作者指出"機(jī)器翻譯技術(shù)本身存在的問題 是阻礙其發(fā)展的硬傷。目前不僅在中國,整個(gè)世界范圍內(nèi)機(jī)器翻譯技術(shù)都沒有很大的突破"。 外語研究,2007年第五期,作者蘇明陽,在《翻譯記憶系統(tǒng)的現(xiàn)狀及其啟示》 一文中指 出記憶翻譯技術(shù)本身的局限,"相同的句子永遠(yuǎn)不需要翻譯第二遍"。然而"現(xiàn)實(shí)中的翻譯活 動(dòng)大多缺乏重復(fù)性,只有在某些特定的領(lǐng)域中,文本的重復(fù)才能達(dá)到一定的比例"。 一般認(rèn)為 文本重復(fù)可達(dá)30%。剩下70%還得依靠人工…。
總而言之。機(jī)器翻譯基于規(guī)則,受人工智能水平所限,不能適應(yīng)語言的特殊性和多樣化 而譯文質(zhì)量太差。記憶翻譯基于對(duì)源目句對(duì)的記憶,譯文質(zhì)量可以達(dá)到專業(yè)水平,但只適宜 4分重復(fù)文本,對(duì)于大部分非重復(fù)文本無能為力。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供①一種語句構(gòu)件裝置,為計(jì)算機(jī)處理涉足 語義開拓捷徑,提高譯文質(zhì)量。'然而更進(jìn)一步提供一種②基于語句構(gòu)件的多語種專業(yè)翻譯方 法,拓展翻譯記憶,使具有相同句型的句子可以自動(dòng)或半自動(dòng)進(jìn)行機(jī)器翻譯。 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是-〈一〉、提供一種語句構(gòu)件裝置,其特征在于包括 語句構(gòu)件存儲(chǔ)部(101),語句構(gòu)件存儲(chǔ)部含有用電子數(shù)據(jù)形式構(gòu)成的語句構(gòu)件的語句構(gòu)
件庫-
句型庫(300),用于存儲(chǔ)句型構(gòu)件,有句型碼、多文種句型字段,其包含至少一個(gè)記 錄,同記錄內(nèi)的不同文種句型之語意相同;
艙模庫(400),用于存儲(chǔ)艙模構(gòu)件,有艙模碼、多文種艙模字段,其包含至少一個(gè)記 錄,同記錄內(nèi)的不同文種艙模之語意相同;
意群串庫(500、 502),用于存儲(chǔ)意群串構(gòu)件,有意群碼、多文種串字段,其包含至 少一個(gè)記錄,同記錄內(nèi)的不同文種意群串之語意相同;
習(xí)語庫(600),用于存儲(chǔ)小習(xí)語構(gòu)件,有習(xí)語碼、多文種習(xí)語字段,其包含至少一個(gè) 記錄,同記錄內(nèi)的不同文種小習(xí)語之語意相同;
意通代碼編制部(102),與語句構(gòu)件存儲(chǔ)部(101)相連,用于對(duì)語句構(gòu)件庫的每一個(gè)記錄 編制一個(gè)意通代碼。
根據(jù)〈一〉所述的語句構(gòu)件裝置,其特征是所述語句構(gòu)件庫的語句構(gòu)件是不同的語義塊, 用于組裝語言句子的另部件、或?qū)渥舆M(jìn)行編碼的標(biāo)準(zhǔn)件,語句構(gòu)件包括如下四種
① 句型構(gòu)件(201,301),用于構(gòu)成句子的基本結(jié)構(gòu)框架,代表了該類句子基本語意類屬, 也決定了該類句子所含句艙的位次和個(gè)數(shù),并包攬了該類句子的復(fù)雜的語法現(xiàn)象;
② 艙模構(gòu)件(202,401),用于構(gòu)成復(fù)雜句艙的基本結(jié)構(gòu)框架,代表了該類句艙基本語意 類屬,也決定了該類句艙所含艙眼的位次和個(gè)數(shù),并包攬了該類句艙的復(fù)雜的語法現(xiàn)象;
③ 意群串構(gòu)件(501、 503),是由意群串充當(dāng)?shù)臉?gòu)件,用于填充簡(jiǎn)單句艙(203 204)或艙 眼(205 207)的構(gòu)件;
④ 小習(xí)語構(gòu)件(601),由過于簡(jiǎn)短不足以分出句型、句艙的句子充當(dāng)小習(xí)語構(gòu)件,用于 直接構(gòu)成簡(jiǎn)短的句子。
根據(jù)〈一〉所述的語句構(gòu)件裝置,其特征是
語句構(gòu)件庫的多文種構(gòu)件字段以文種設(shè)置, 一個(gè)文種對(duì)應(yīng)一個(gè)文種構(gòu)件字段;
句型、艙模、意群串或習(xí)語四個(gè)構(gòu)件庫可以提取其中的碼字段,和文句型、文艙模、文
串或文習(xí)語兩個(gè)字段構(gòu)成文分庫、文語言庫、第一語言庫或第二語言庫,用于語言翻譯、文
本轉(zhuǎn)換;
所述意通代碼編制部,僅當(dāng)上述四個(gè)庫任何之一出現(xiàn)新記錄時(shí),把當(dāng)前庫代表數(shù)作高位 加上當(dāng)前庫記錄號(hào)合成意通代碼,并填入當(dāng)前庫新記錄的某某碼字段,作為語句構(gòu)件統(tǒng)一的 雙字定長16進(jìn)制的意通代碼,意通代碼唯一地表示當(dāng)前庫當(dāng)前記錄內(nèi)各語種構(gòu)件相同的語
〈二> .一種基于語句構(gòu)件的多語種專業(yè)翻譯方法,其特征是包括如下步驟-Sl.當(dāng)讀入源語句得到句型庫、艙模庫和意群串庫全方位支持時(shí),自動(dòng)給出(703)前目語句子,接受用戶便捷式校改;
52. 當(dāng)讀入源語句得到句型庫支持和艙模庫、意群串庫的部分支持時(shí),接受干預(yù)、半自 動(dòng)給出(704)當(dāng)前目語句子,接受用戶校改;
53. 當(dāng)讀入源語句沒有得到句型庫支持,查無匹配句型時(shí),調(diào)用記憶庫如果獲得支持、 給出當(dāng)前目語句參考,機(jī)輔式給出(705)當(dāng)前目語句子;
54. 當(dāng)讀入源語句沒有得到句型庫支持、也沒有得到記憶庫的支持時(shí),利用意群串庫的 部分支持人工式給出(706)當(dāng)前目語句子;
55. 在專業(yè)翻譯過程中相關(guān)庫內(nèi)容進(jìn)行自動(dòng)或半自動(dòng)積累,在專業(yè)翻譯活動(dòng)前、后進(jìn)行 庫擴(kuò)充、統(tǒng)計(jì)優(yōu)化、專業(yè)劃分或?qū)I(yè)翻譯初始準(zhǔn)備。
根據(jù)〈二〉所述的多語種專業(yè)翻譯方法,其特征是自動(dòng)給出當(dāng)前目語句子的步驟Sl進(jìn) 一步包括如下步驟-
5101. 用讀入的源語句査詢習(xí)語庫,如果是,確定為小習(xí)語句,直接給出目語小習(xí)語句, 如果否、續(xù)S102;
5102. 根據(jù)讀入的源語句査詢句型庫,取唯一或最長,用該記錄的源語句型將讀入的源 語句對(duì)號(hào)入座地套入,用該記錄的目語句型作為自動(dòng)給出當(dāng)前句子的框架;
5103. 依次取出被套入源語句型的句艙內(nèi)容查詢艙模庫,有、取唯一或最長,用該記錄 的源語艙模將該句艙內(nèi)容對(duì)號(hào)入座地套入,用該記錄的目語艙模作為自動(dòng)給出當(dāng)前句艙的框 架并置入到句型框架相應(yīng)的位置;
5104. 依次取出被套入源語句型、艙模中的簡(jiǎn)單句艙或艙眼內(nèi)容,逐詞條查詢意群串庫, 將查得的目語所有解釋連同當(dāng)前的句艙或艙眼標(biāo)號(hào)存入反悔庫,取其一作為預(yù)選置入目語框 架相應(yīng)位置;
5105. 將已經(jīng)由目語句型、艙模構(gòu)成的框架并填入了預(yù)選目語解釋的自動(dòng)給出當(dāng)前目語 句子連同句艙、艙眼標(biāo)號(hào)顯示給出,如果某句艙或某艙眼以及它們的內(nèi)容校改庫有記錄的, 根據(jù)校改庫信息更正后再給出,等待用戶的便捷式校改并作個(gè)備份句;
5106. 當(dāng)用戶點(diǎn)擊不滿意的目語預(yù)選解釋時(shí),列出反悔庫中相同句艙、艙眼和串次的所 有解釋接受用戶點(diǎn)擊另選,置換預(yù)選解釋;
5107. 當(dāng)用戶點(diǎn)擊某個(gè)目語預(yù)選解釋后點(diǎn)擊向前或向后位移命令按鈕時(shí)將該目語解釋向 前或向后置換一個(gè)串位;
5108. 當(dāng)用戶點(diǎn)擊返回命令按鈕時(shí),當(dāng)前目語句子確定,與備份句不同的句艙或艙眼內(nèi) 容以及相關(guān)的句型、句艙、艙眼標(biāo)號(hào)信息納入校改庫,棄去所有句艙、艙眼標(biāo)號(hào),將其自動(dòng) 給出并尾加于譯文文件;
5109. 清空反悔庫,讀入下一個(gè)源語句子,接續(xù)步驟S101。
根據(jù)〈二>所述的多語種專業(yè)翻譯方法,其特征是半自動(dòng)給出當(dāng)前目語句子的步驟S2 進(jìn)一步包括如下步驟
5201. 根據(jù)讀入的源語句査詢句型庫,有二或多個(gè)匹配句型時(shí),接受用戶點(diǎn)選干預(yù),然 后用該記錄的源語句型將讀入的源語句對(duì)號(hào)入座地套入,用該記錄的目語句型作為半自動(dòng)給 出當(dāng)前句的框架;
5202. 依次取出被套入源語句型的句艙內(nèi)容査詢艙模庫,有二或多個(gè)艙模匹配時(shí),接受 用戶點(diǎn)選干預(yù),然后用該記錄的源語艙模將該句艙內(nèi)容對(duì)號(hào)入座地套入,用該記錄的目語艙 模作為半自動(dòng)給出當(dāng)前句艙的框架并置入到句型框架相應(yīng)的位置,如果沒有符合艙模的復(fù)雜句艙暫且不作為;
5203. 依次取出被套入源語句型、艙模中的簡(jiǎn)單句艙或艙眼內(nèi)容,逐詞條查詢意群串庫, 將査得的目語所有解釋連同當(dāng)前的句艙或艙眼標(biāo)號(hào)存入反悔庫,取其一作為預(yù)選置入目語框 架相應(yīng)位置,如果出現(xiàn)意群串庫未登錄的詞條,啟動(dòng)外詞典連接,在用戶的干預(yù)下登錄到本 方法的意群串庫;
5204. 將已經(jīng)由目語句型、艙模構(gòu)成的框架并填入了預(yù)選目語解釋的當(dāng)前目語句子連同 句艙、艙眼標(biāo)號(hào)顯示給出,如果某句艙或某艙眼以及它們的內(nèi)容校改庫有記錄的,根據(jù)校改 庫信息更正后再給出,準(zhǔn)備接受用戶校改作好備份句;
5205. 當(dāng)用戶點(diǎn)擊不滿意的目語預(yù)選解釋時(shí),列出反悔庫中相同句艙、艙眼和串次的所 有解釋接受用戶點(diǎn)擊另選,賞換預(yù)選解釋,如果用尸對(duì)根據(jù)反悔庫所列的待選解釋都不滿意, 接受用戶添加解釋并納入意群串厙;
當(dāng)用戶點(diǎn)擊某個(gè)目語預(yù)選解釋后點(diǎn)擊向前或向后位移命令按鈕時(shí)將該目語解釋 向前或向后置換一個(gè)串位;
5207. 在S202步驟當(dāng)中因沒有符合艙模而不作為的句艙,突出顯示并接受用/',人工編 輯該句艙目語內(nèi)容;
5208. j用戶點(diǎn)擊返回命令按鈕時(shí),給出當(dāng)前目語句子確記,跳開不作為句艙,其它與 備份句不RI的句艙成艙服內(nèi)容連冋句型、句艙、艙眼標(biāo)號(hào)信息納入校改庫,最后弁去所有句 艙、艙服標(biāo)號(hào),將其給出并尾加丁譯文文件
5209. 潔空反悔庫,提示用戶應(yīng)3對(duì)S202步驟不作為句艙補(bǔ)作艙模,如果應(yīng)答S,跳 轉(zhuǎn)S507作艙模;
5210. 如果應(yīng)答否,讀入下一個(gè)源語句子,接續(xù)步驟S1。
根據(jù)〈二〉所述的多語種專業(yè)翻譯方法,其特征是給出當(dāng)前目語句參考、機(jī)輔式給出當(dāng) 前目語句子的步驟S3進(jìn)一步包括如下步驟
5301. 當(dāng)根據(jù)讀入的源語句査詢句型庫,無匹配句型時(shí),再用瀆入的源語句査洵記憶庫, 如果有相似記錄,把它們羅列于臨時(shí)庫,計(jì)算它們的相似度;
5302. 選相似度最大記錄的目語字段內(nèi)容作為目語參考句給出,同時(shí)將該記錄的頻度字 段之值加一;
5303. 接受用戶編輯、校改,當(dāng)用戶點(diǎn)擊返回命令按鈕后,作為當(dāng)前目語句給出并尾加 于澤文文件;
5304. 清空反悔庫,提示用戶制作句型,如果應(yīng)答是,續(xù)步驟S501制作句型;
5305. 如果應(yīng)答否,將當(dāng)前源語句子、目語句子分別存入記憶庫相應(yīng)字段,再讀入下一 個(gè)源語句子,接續(xù)步驟S1。
根據(jù)〈二〉所述的多語種專業(yè)翻譯方法,其特征是利用意群串庫的部分支持人工式給出
當(dāng)前目語句子的步驟S4進(jìn)一步包括如下步驟.-
S401.當(dāng)根據(jù)讀入的源語句査詢句型庫,無匹配句型,再査詢記憶庫,又沒有相似記錄
時(shí),依次取出讀入的源語句所有同串,逐條詞串査詢意群串庫,將査得的目語所有解釋連同 、k tr.+r左x r^根度 飾tr--*日;五;fis沐細(xì)怒;h','度:Mt^ii乾!nfr曰;s ^乎^ 壬n向;安入的:'n
qdn9 a田a占-:i:-餘爭(zhēng)fm對(duì)i^7 FK;Tii7漆傷忍^^、卜 萬ii,屮r^'銜i^由i-mTTi史序的^7^r傷忍釋;f主
受用戶點(diǎn)擊另選,置換預(yù)選解釋5403. 給出一個(gè)可編輯框,接受用戶編輯、校改,當(dāng)用戶點(diǎn)擊返回命令按鈕時(shí)確定為當(dāng) 前目語句給出并尾加于譯文文件;
5404. 清空反悔庫,提示用戶制作句型,如果應(yīng)答是,后續(xù)步驟S501制作句型;
5405. 如果應(yīng)答否定,將當(dāng)前源語句子、目語句子分別存入記憶庫相應(yīng)字段,讀入下一 個(gè)源語句子,接續(xù)步驟S1。
根據(jù)〈二〉所述的多語種專業(yè)翻譯方法,其特征是步驟S5所述在專業(yè)翻譯過程中相關(guān) 庫內(nèi)容進(jìn)行自動(dòng)或半自動(dòng)積累進(jìn)一步包括如下步驟-
5501. 將讀入的源語句和確定的當(dāng)前目語給出句作為句對(duì)例顯示,接受用戶挖句艙操作 如果源語、目語都缺句型的接續(xù)步驟S502,如果源語有句型只是目語缺句型的接續(xù)步驟S505;
5502. 當(dāng)用戶點(diǎn)擊挖句艙命令按鈕后,在源語句和目語句用戶點(diǎn)擊的兩個(gè)至少相隔一個(gè) 詞條的點(diǎn)作為一個(gè)句艙,挖去其中內(nèi)容,標(biāo)以[A],相似操作依操作次序標(biāo)以[B]、 [C]……
5503. 當(dāng)用戶點(diǎn)擊存句型命令按鈕后,對(duì)挖去句艙所剩部份作為句型,進(jìn)行格式檢査, 通過后以源語結(jié)構(gòu)次序從左到右以{1}、 {2}、 {3}替換原以操作次序^\]、 [B]、 [C]的標(biāo)注, 目語以句艙語意相應(yīng)標(biāo)號(hào)相同,最后分別存入句型庫相應(yīng)的源語句型字段和目語句型字段
5504. 如果當(dāng)前源語句、目語句太短,不便以上操作劃分出句型、句艙,用戶沒有點(diǎn)擊 挖句型而直接點(diǎn)擊存句型命令按鈕時(shí),把當(dāng)前源語、目語句子作為小習(xí)語,分別存入習(xí)語庫 相應(yīng)字段
5505. 將讀入的源語句對(duì)號(hào)入座地套入源語句型,依次取出句艙內(nèi)容,査詢意群串庫, 取與目語句一致的解釋確定為當(dāng)前句艙的首、尾點(diǎn)以及當(dāng)前句艙內(nèi)容,用型例結(jié)合型式顯示, 當(dāng)前句艙全部匹配完成后,接受用戶確定或糾正,然后復(fù)制當(dāng)前源語的句艙標(biāo)號(hào)作為目語當(dāng) 前句艙標(biāo)3,直至完成全句的^似操作
5506. 當(dāng)用戶點(diǎn)擊存句型命令按鈕后,抽出目語句型,進(jìn)行格式檢S,通過后存入句型 庫與當(dāng)前源語句型相同記錄的目語句型字段;
5507. 將3前源語、目語句例分別套入當(dāng)前源語、目語句型,依次檢S每個(gè)句艙內(nèi)容是 否超出簡(jiǎn)單句艙的規(guī)定,如果超出將當(dāng)前句艙的源語、目語上下行顯示,接受用戶挖艙眼操 作;
5508. 當(dāng)用戶點(diǎn)擊挖艙眼命令按鈕后,在源語句艙和目語句艙用戶點(diǎn)擊的兩個(gè)至少相隔 一個(gè)詞條的點(diǎn)作為一個(gè)艙眼,挖去其中內(nèi)容,標(biāo)以[A],相似操作依操作次序標(biāo)以[B] 、 [C]……;
5509. 當(dāng)用戶點(diǎn)擊存艙模命令按鈕后,對(duì)挖去艙眼所剩部份作為艙模,進(jìn)行格式檢査, 通過后以源語結(jié)構(gòu)次序從左到右以[l]、 [2]、 [3]替換原以操作次序[A]、 [B]、 [C]的標(biāo)注, 目語以艙眼語意相應(yīng)標(biāo)號(hào)相同,最后分別存入艙模庫相應(yīng)的源語艙模字段和目語艙模字段;
5510. 清除制作句型、艙模的相關(guān)顯示,進(jìn)行判別返回調(diào)用者或讀入下一個(gè)源語句子, 接續(xù)步驟S1。
根據(jù)〈二〉所述的多語種專業(yè)翻譯方法,其特征是在遠(yuǎn)行步驟Sl前有庫擴(kuò)充命令按鈕 在待命、遠(yuǎn)行步驟S1、 S2、 S3、 S4的適當(dāng)區(qū)間有擴(kuò)查詞命令按鈕在待命,進(jìn)一步包括如下步 驟
s01.當(dāng)庫擴(kuò)充命令按鈕被點(diǎn)擊-.
s02.搜索記憶庫、取出最高頻度記錄的源、目語句例對(duì),當(dāng)前記錄作刪除標(biāo)志,跳轉(zhuǎn)S501 作句型
s03.繼續(xù)s02.步驟,僅當(dāng)庫擴(kuò)充命令按鈕再次被點(diǎn)擊,返回到遠(yuǎn)行步驟S1前斷點(diǎn);s04.當(dāng)用戶選定源語一條或若干詞串后點(diǎn)擊擴(kuò)査詞命令按鈕,進(jìn)行判斷;
s05.當(dāng)所選是若干條詞串,以它們的各種可能排列查詢意群串庫,把它們的排列和同目 語的所有解釋列表給出,同時(shí)顯示選復(fù)、改饋復(fù)命令按鈕;
s06.當(dāng)用戶點(diǎn)擊列表中某項(xiàng)后點(diǎn)擊了選復(fù)命令按鈕,把源語相應(yīng)詞條以"_"連成復(fù)詞, 以該項(xiàng)目語解釋置換原有解釋,
s07.當(dāng)修改了列表中某項(xiàng)后點(diǎn)擊了改饋復(fù)命令按鈕,將該修改項(xiàng)作為新增復(fù)詞及其解釋 存入意群串庫的復(fù)詞分庫;
s08.當(dāng)所選是一條詞串,先査詢不規(guī)則詞表,再根據(jù)詞尾變化規(guī)律作出可能的變形和原 形詞條,以它們分別查詢意群串庫,把源語詞條的原形或變形和同它們的目語所有解釋列表 給出,同時(shí)顯示選單、改饋單命令按鈕;
s09.當(dāng)用戶點(diǎn)擊列表中某項(xiàng)后點(diǎn)擊了選單命令按鈕,以該項(xiàng)目語解釋置換原有解釋;
s10.當(dāng)用戶修改了列表中某項(xiàng)后點(diǎn)擊了改饋單命令按鈕,將該修改項(xiàng)作為新增解釋存入 意群串庫的單詞分庫,判斷并返回命令按鈕被擊中斷點(diǎn)。
與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)和有益效果是
1、 語句構(gòu)件裝置的語句構(gòu)件存貯部設(shè)有四個(gè)庫,分別存貯句型、'艙模、意群串和小習(xí) 語四類語句構(gòu)件;只有相同語意的同類構(gòu)件同處一個(gè)記錄,同一記錄又設(shè)計(jì)了某某碼字段,
用以編制意通代碼。意通代碼不但唯一地代表了同記錄同類構(gòu)件的共同語意,而且可以分解 為某庫某記錄。這樣的設(shè)計(jì)得到構(gòu)件與構(gòu)件之間可以直接轉(zhuǎn)換或通過意通代碼轉(zhuǎn)換而語意不 變的有益效果。
2、 句型、艙模構(gòu)件為句子提供了框架,包攬了復(fù)雜的語法,決定了所含句艙及艙眼的 位次,這就避免了現(xiàn)有技術(shù)利用人工智能作句法分析、語法分析之不力。有效益于譯文質(zhì)量 的提升。
3、 基于語句構(gòu)件的多語種專業(yè)翻譯方法,由于語句構(gòu)件是大小不等的語義塊,有構(gòu)架 也有組件,是當(dāng)今計(jì)算機(jī)處理涉足語義的捷徑;加上交互式人機(jī)密切配合;為譯句語意與源文 一致提供了保證。
4、 基于語句構(gòu)件的多語種專業(yè)翻譯方法,根據(jù)構(gòu)件庫的不同支持程度,有自動(dòng)給出、 半自動(dòng)給出、機(jī)輔給出和人工給出四種方式給出目語句子,拓展了翻譯記憶。
5、 本發(fā)明方法使具有相同句型的句子可以自動(dòng)及半自動(dòng)地進(jìn)行機(jī)器翻譯,提高專業(yè)翻 譯的自動(dòng)化程度,同時(shí)降低了對(duì)譯員的外語程度要求;使大多數(shù)科技工作者兼任專業(yè)翻譯成 為可能。
6、 本發(fā)明方法的缺點(diǎn)是構(gòu)件庫可能很大,引發(fā)干預(yù)太多;因而根據(jù)實(shí)際應(yīng)用面向?qū)I(yè) 以至翻譯者個(gè)人,分設(shè)各種專業(yè)版本;不但可以克服缺點(diǎn),還能使本方法發(fā)明達(dá)到最好的發(fā) 揮。
圖1是本發(fā)明語句構(gòu)件裝置結(jié)構(gòu)示意圖; 圖2是語句構(gòu)件示意圖; 圖3是句型庫示意圖; 圖4是艙模庫示意圖; 圖5a是意群串庫(英單串)示意12圖5b是意群串庫(英復(fù)串)示意圖; 圖6是習(xí)語庫示意圖7是本發(fā)明基于語句構(gòu)件的多語種專業(yè)翻譯方法流程圖; 圖8是圖7模塊(703)自動(dòng)句給出進(jìn)一步的流程圖; 圖9是圖7模塊(704)半自動(dòng)句給出進(jìn)一步的流程圖; 圖10是圖7模塊(705)機(jī)輔式句給出進(jìn)一步的流程圖; 圖11是圖7模塊(706)人工式句給出進(jìn)一步的流程圖; 圖12是圖7模塊(708、 709)作句型、作艙模進(jìn)一步的流程具體實(shí)施方式
本發(fā)明人認(rèn)為,對(duì)于計(jì)算機(jī)語言文字信息處理來說,語法、語音、詞匯不同不是難題, 關(guān)鍵是不同自然語言的字、詞、句表意不對(duì)等,也不統(tǒng)一;機(jī)內(nèi)表達(dá)亦然,無奈強(qiáng)求計(jì)算機(jī)要 象人一樣理解分析,從而致使"〃語義障礙"至今仍然存在,譯文結(jié)果往往令人啼笑皆非"。
句型構(gòu)件理論(本發(fā)明人的發(fā)現(xiàn),末公開)-
我們明白,電腦還不能象人腦一樣理解語義;電腦之長在于存貯和搜索。人腦正好與電 腦相反,能理解語義,但存貯和搜索能力都遠(yuǎn)遠(yuǎn)不及電腦。人腦與電腦有著很好的互補(bǔ),但 能否實(shí)現(xiàn)很好的互補(bǔ),有懶于語言文字在計(jì)算機(jī)內(nèi)的表達(dá)。非常慶幸,自然語言的本質(zhì)就是 表意,并且所表之意人類互通。各種語言文字都由字符組成詞匯,詞匯組成句子,句子組成 文章;其本質(zhì)屬性是句子是表達(dá)完整語意的基本單元;不同語言文字的句子可以表達(dá)相同 的語意。自然語言是整個(gè)人類社會(huì)發(fā)展的產(chǎn)物。人類產(chǎn)生語言文字的時(shí)候,由于時(shí)空的隔離, 人們被分散在許多獨(dú)立的社會(huì)里生活;語言文字也在這許多獨(dú)立社會(huì)里,在各自獨(dú)立體系內(nèi) 緩慢演變和發(fā)展。正因?yàn)楦鞣N語言文字都在各自的獨(dú)立體系內(nèi)緩慢地演變發(fā)展而來。不同語 言文字之間,語音不同,語法不一樣,詞匯字符更是形形色色。這也就造成了不同語言文字 之間字、詞、句表意不對(duì)等也不統(tǒng)一。假如語言文字在計(jì)算機(jī)中的表達(dá)(表示),字、詞、句 表意能夠?qū)Φ群徒y(tǒng)一;不同語言文字之間的翻譯和轉(zhuǎn)換就不是什么難事了。如何才能使不同 語言文字之間的字、詞、句表意能夠?qū)Φ群徒y(tǒng)一呢?
本發(fā)明人從句型著手研究,不是語法書上的句型,是便于計(jì)算機(jī)操作的句型。經(jīng)過多年 的探討,得出語句構(gòu)件理論。這里把語句構(gòu)件論所涉及的主要論斷、與本發(fā)明有關(guān)的、具有 特定意義的概念定義和解釋如下
句子——在自然語言里,表達(dá)完整語意的基本單元稱為句子;不同語言文字的句子可以 表達(dá)相同的語意。句子可分為句型、句艙兩部分, 一個(gè)句型至少包含一個(gè)句艙。
句型——出自一類句子的抽象,在句子中相對(duì)穩(wěn)定,體現(xiàn)句子基本語意及類屬;構(gòu)成該 類句子基本結(jié)構(gòu)框架部分稱句型。句型體現(xiàn)句子基本語意及類屬是面向全人類的、跨語種的; 而其基本結(jié)構(gòu)框架是面向具體自然語言,并包攬著自然語言復(fù)雜、個(gè)性化的語法現(xiàn)象。
句艙一鑲嵌在句型這個(gè)基本結(jié)構(gòu)框架上的那些靈活的可替換部分稱為句艙。句艙接受 句型的選擇和制約;句艙可用意群串填充或替換,形成豐富多彩的、具體的句子。句艙個(gè)數(shù)、 其語意內(nèi)容是面向全人類的、跨語種的;但其在句型基本結(jié)構(gòu)框架中的位置、次序和用以填 充的意群串是面向具體自然語言的;句艙即使有語法現(xiàn)象也極為簡(jiǎn)單。
句型句艙舉例解釋(#示行號(hào)) 1#只要會(huì)句型(01074) 2個(gè)艙2# 只要你{1},你就會(huì){2}。
3# {1} and you will {2}.
4# Ecjih {1}, to {2}.
5tt 略(其它語種)
6#象一句型(00892) 4個(gè)艙
7# {1}象{4}一樣{3}{2}嗎?
8# Does{l}{2}as{3}as{4}
9# {1} {2}TaK{3}K3K{4}
10# 略(其它語種)
1{約翰}4{亨利}3{努力}2{工作} 1{John}2{work}3{hard}4{Henry}
1(Pa6oTaeT) 2(/^mcoh) 3{ycepHo} 4{reHjra}
lift的高句型(00922) 3個(gè)艙 12tt {2}的{1}高于{3}。
2{智慧} 1{價(jià)值} 3{紅寶石} 1 {price} 2{wisdom} 3{rubies}
1{Ctohmocti>} 2{Myz pocTH} 3(py6朋a)
13# The{1}of {2}is above{3} 14# OH2} BHine {3}.
15# 略(其它語種)
上例①1恥WW三行各表示三個(gè)句型的表示基本語意和類屬,面向世界、跨語種部分;其 中如"只要會(huì)句型"表示類屬和基本語意,(01074)表示句型號(hào),是意通代碼低位字十進(jìn)制數(shù)。
2 5#、 7 10#、 12 15#表示三個(gè)句型的結(jié)構(gòu)框架,是面向具體自然語言的。每行的 左前部分是句型的框架結(jié)構(gòu),花括號(hào)內(nèi)是句艙;右后部分是相應(yīng)句艙及內(nèi)容例。其中2#7#12共 面向中文;3#8#13#面向英文;4#9#14#面向俄語;5#10#15#面向其它語種等。
③上述舉例花括號(hào)內(nèi)或其前面的數(shù)字為句艙號(hào)。句艙的個(gè)數(shù)(如ltt有2個(gè)艙、6ft有4個(gè) 艙),和各句艙表示的語意是面向世界、跨語種的;而其在句型框架結(jié)構(gòu)中的位置、次序、用 以填充的意群串是面向語種的(如7 9#中的{2}在中英俄文句型內(nèi)的位次不同;填充的意群 串分別是工作、work 、 fl豕o h )。
對(duì)于語法而舎,復(fù)雜的語法現(xiàn)象都攬?jiān)诰湫蜕希痪渑摷词购姓Z法也極其簡(jiǎn)單。上述就 是句型、句艙的定義和解釋的簡(jiǎn)潔舉例。
句艙由意群統(tǒng)領(lǐng)的意群串填充或組成(也可初步近似地理解為由詞串填充或組成)。但 句艙的大小有較大差別。最小的句艙只包含一個(gè)意群串;最大的句艙可以包含一個(gè)從句或分 句。我們把句艙分為簡(jiǎn)單句艙和復(fù)雜句艙兩種
意群——意群是自然語言的字、詞、詞組或短語之"意"的對(duì)等和統(tǒng)一;是人類思維活 動(dòng)的基本單元。意群無語種之限,屬于全人類;也隨人類社會(huì)發(fā)展而代謝著。
意群串一意群在語言文字里相應(yīng)的表示稱意群文字串,簡(jiǎn)稱意群串。意群串分單串、 復(fù)串兩種;以拼音文字為例,只含有一個(gè)原有詞串的為單串(如圖5a中的英文串);由兩個(gè) 或兩個(gè)以上原有詞串組成,并用"_"相連為復(fù)串(如圖5b中的英文串)。
簡(jiǎn)單句船——除不表意虛詞外不超過三個(gè)意群串的句艙稱簡(jiǎn)單句艙(如圖2所標(biāo)203 204)。英文如"a an the in on to and"等常不表意可忽略不計(jì);中文的量詞同樣 可不計(jì)。其它語種如此類推。不同語種之間,這三個(gè)串只要求有相應(yīng)的、語意相等的串就可 以,不要求它們前后次序的一致。
復(fù)雜句艙——大于簡(jiǎn)單句艙,含有艙模的句艙稱復(fù)雜句艙。
上文所列舉例句的句艙都屬于簡(jiǎn)單句艙。下面這個(gè)例句含有復(fù)雜句艙
1{the fisherman} consents to 2{ return the_feather—suit} , on condition that 3{fairy dance and play heavenly music for him}.
14在3{仙女為他跳舞并演奏天上的樂曲}的條件下,1 {漁夫}答應(yīng)2 {歸還羽衣}。 本例句艙l、句艙2都是簡(jiǎn)單句艙,句艙2英文含復(fù)串;句艙3大于簡(jiǎn)單句艙,含有艙 模,為復(fù)雜句艙。
艙模和艙眼——進(jìn)一步剖析復(fù)雜句艙的內(nèi)容;得出如同句型的框架結(jié)構(gòu)部分稱艙模鑲 嵌在艙??蚣芙Y(jié)構(gòu)上的可替換部分稱艙眼。句艙和艙眼是上、下位概念;但簡(jiǎn)單句艙和蹌眼 的大小相等,同樣是除不表意虛詞外不大于三個(gè)意群串。
如上例句艙3(fairy dance and play heavenly music for him} 3(仙女為他瑕fe舞并 演奏天上的樂曲}利用句型理論剖析,可得出艙模
(00205) {l}+{2}+and+{3}+for him {1}+為他+{2}+并+{3}
其中(00205)是艙模號(hào);這個(gè)艙模包含3個(gè)艙眼,三個(gè)艙眼的內(nèi)容都不大于三個(gè)意群串 3{l{fairy} 2{dance} and 3{play heavenly music} for him} 3{1{仙女}為他2{跳舞} 并3{演奏天上的樂曲}}
小習(xí)ig——過于簡(jiǎn)短不足以分出句型、句艙的句子為小習(xí)語。如"How do you do 您 好! Get away!滾開!"等等。
語句構(gòu)件——語句構(gòu)件是不同語言文字之間,字、詞、句表意的對(duì)等和統(tǒng)一。根據(jù)自然 語言之表意人類互通,剖析比對(duì)多語句對(duì);得出表意對(duì)等和統(tǒng)一的句型、艙模、意群串和小習(xí) 語等語句構(gòu)件。經(jīng)建庫編碼后的語句構(gòu)件可以是組裝句子的另部件或?qū)渥舆M(jìn)行編碼的標(biāo)準(zhǔn) 件。語句構(gòu)件包括句型構(gòu)件、艙模構(gòu)件、意群串構(gòu)件和小習(xí)語構(gòu)件。
意通代碼——面向多語種,語意相等、互通的語句構(gòu)件的統(tǒng)一編碼稱意通代碼。
世界文——由意通代碼生成,體現(xiàn)多文種語意互通,并可進(jìn)行多文種讀出或文本轉(zhuǎn)換特 殊的文本文件,這種特殊的文件有望通用于世界而稱世界文。
句型構(gòu)件理論簡(jiǎn)化了自然語言的復(fù)雜性、又適應(yīng)它的靈活性;并化解它們之間語法不一 致難題。然而,我們把辺語法分析、語義理解分配給人腦。組織專家根據(jù)句型原理,對(duì)句子 進(jìn)行句型、意群串兩個(gè)層面的語意剖析、比對(duì)整理。這些需要理解的艱難的也是一勞永逸的 事由人腦完成。同時(shí)②把經(jīng)常性的、單調(diào)、繁瑣的記憶、搜索、匹配等工作交給電腦。讓計(jì) 算機(jī)提供一個(gè)便捷的操作的平臺(tái),利用人機(jī)交互的形式,讓人腦、電腦能夠很好地互補(bǔ)。把 剖析、比對(duì)過程中產(chǎn)生的句型、艙模、意群串和小習(xí)語等語句構(gòu)件建庫保存,并統(tǒng)一編制意 通代碼,如此產(chǎn)生語句構(gòu)件庫。
語句構(gòu)件庫存貯的是語句構(gòu)件。這些語句構(gòu)件,是多種語言文字之間表意得以對(duì)等的、 可以組裝、拼接成句子的(圖2)。
下文參照附圖、利用實(shí)施例將本發(fā)明的內(nèi)容進(jìn)一步說明如下 一、 一種語句構(gòu)件裝置
圖l是本發(fā)明語句構(gòu)件裝置結(jié)構(gòu)示意圖。圖2是語句構(gòu)件示意圖;圖3是句型庫示意圖; 圖4是艙模庫示意圖;圖5a是意群串庫(英單串)示意圖;圖5b是意群串庫(英復(fù)串)示 意圖;圖6是習(xí)語庫示意圖。它們都與語句構(gòu)件相關(guān)聯(lián),下面以內(nèi)容為序說明之。
如圖1所示,語句構(gòu)件裝置包括語句構(gòu)件存儲(chǔ)部101、意通代碼編制部102、以及構(gòu) 件庫操作控制、接口部103等三個(gè)部件
(-)語句構(gòu)件存儲(chǔ)部101,是本裝置的中心部件。含有用電子數(shù)據(jù)形式構(gòu)成的、存儲(chǔ)了多語種語意對(duì)等的語句構(gòu)件的二維數(shù)據(jù)庫表。它們是句型庫、艙模庫、意群串庫和習(xí)語庫(參 附圖3 6)四個(gè)語句構(gòu)件庫
1、 句型庫300,用于存儲(chǔ)句型構(gòu)件,有句型碼、英文句型、中文句型、俄文句型字段, 如圖3所示。其包含至少一個(gè)記錄,相同語意的句型同處一個(gè)記錄,相應(yīng)文種的句型存儲(chǔ)在 相應(yīng)文種句型字段內(nèi)301。這句所述文種句型實(shí)際是指句型的框架部分,是面向各自然語言 的。其中的花括號(hào)表示句艙,中間的數(shù)字是該句艙的編號(hào),句艙由意群串填充,句艙在句型 中的位置、次序以及填充的意群串都是面向各自然語言的;從圖3的庫中內(nèi)容301可以看出, 同一個(gè)句艙,其標(biāo)號(hào)一樣但它在各語種句型中的位置、次序并不一致。句型碼字段存放句型 碼,句型碼代表了同一記錄內(nèi)各文種句型字段內(nèi)的各文種句型的語意。句型體現(xiàn)該類句子基 本語意及類屬是面向全人類的、跨語種的;它所包含的句艙個(gè)數(shù)、句艙語意都是面向全人類, 跨語種的;面向人類,跨語種的表示就是句型碼。也就是說,句型碼代表句型語意,影射了 各文種句型;各文種句型又可以通過句型碼影射另一個(gè)文種句型。至于語法是屬于各自然語 言的,句型的框架部分包攬著自然語言復(fù)雜、個(gè)性化的語法現(xiàn)象,然而句艙即使有語法現(xiàn)象 也極為簡(jiǎn)單了。
2、 艙模庫400,用于存儲(chǔ)艙模構(gòu)件,有艙模碼、英文艙模、中文艙模、俄文艙模字段, 如圖4所示。其包含至少一個(gè)記錄,相同語意的艙模同處一個(gè)記錄,相應(yīng)文種的艙模存儲(chǔ)在 相應(yīng)文種艙模字段內(nèi)401。艙模是復(fù)雜句艙的框架結(jié)構(gòu)部分,是面向各自然語言的。其中的 方括號(hào)表示艙眼,中間的數(shù)字是該艙眼的編號(hào),艙眼也由意群串填充。艙眼在艙模中的位置、 次序以及填充的意群串都是面向各自然語言的;從圖4的庫中內(nèi)容401可以看出,同一個(gè)艙 眼,其標(biāo)號(hào)一樣但它在各語種艙模中的位置、次序并不一致。艙模碼字段存放艙模碼,艙模 碼代表了同一記錄內(nèi)各文種艙模字段內(nèi)的各文種艙模的語意。艙模的基本語意,是面向全人 類的、跨語種的;它所包含的艙眼個(gè)數(shù)、艙眼語意都是面向全人類,跨語種的;其表示就是 艙模碼。也就是說,艙模碼代表艙模語意,影射了各文種艙模;各文種艙模又可以通過艙模 碼影射另一個(gè)文種艙模。至于句艙內(nèi)的語法也是屬于各自然語言的,艙模包攬著自然語言的 語法現(xiàn)象,然而艙眼即使有語法現(xiàn)象也極為簡(jiǎn)單。
3、 意群串庫500、 502,用于存儲(chǔ)意群串構(gòu)件,有意群碼、英文串、中文串、俄文串字 段,如圖5a-b所示。其包含至少一個(gè)記錄,相同語意的意群串同處一個(gè)記錄,相應(yīng)文種的意 群串存儲(chǔ)在相應(yīng)文種串字段內(nèi)501、 503。意群串是句艙或艙眼的內(nèi)容,句艙與艙眼是上下位 概念,句艙分簡(jiǎn)單句艙和復(fù)雜句艙兩種,復(fù)雜句艙抽出如同句型的框架結(jié)構(gòu)后就是艙眼。句 艙和艙眼是上、下位概念但簡(jiǎn)單句艙和艙眼的大小相等,同樣是除不表意虛詞外不大于三 個(gè)意群串。拼音文字的意群串有單串復(fù)串兩種,單串即一個(gè)原有詞串501,復(fù)串是由多于一 個(gè)原有詞串,并以"—"相連而成503。意群碼字段存放意群碼,意群碼代表了同一記錄內(nèi)各 文種意群串字段內(nèi)的各文種意群串的語意,是面向人類,跨語種的;各文種意群串是面向各 自然語言的。也就是說,意群碼代表意群串的語意,影射了各文種意群串;各文種意群串又 可以通過意群碼影射另一個(gè)文種意群串。
4、 習(xí)語庫600,用于存儲(chǔ)小習(xí)語構(gòu)件,有習(xí)語碼、英文習(xí)語、中文習(xí)語、俄文習(xí)語字段, 如圖6所示。其包含至少一個(gè)記錄,相同語意的小習(xí)語同處一個(gè)記錄,相應(yīng)文種的小習(xí)語存 儲(chǔ)在相應(yīng)文種習(xí)語字段內(nèi)601。習(xí)語碼代表了同一記錄內(nèi)各文種習(xí)語字段內(nèi)的各文種小習(xí)語 的語意。也就是說,習(xí)語碼代表小習(xí)語的語意,影射了各文種小習(xí)語;各文種小習(xí)語又可以 通過習(xí)語碼影射另 一個(gè)文種小習(xí)語。
16上述四個(gè)庫的結(jié)構(gòu)強(qiáng)調(diào)只有相同語意的同類構(gòu)件才同處一個(gè)記錄,同一記錄又設(shè)計(jì)了某 某碼字段,用以編制意通代碼。意通代碼與同記錄的同類構(gòu)件的相互影射。這樣的結(jié)構(gòu)保證 了構(gòu)件與構(gòu)件之間可以直接轉(zhuǎn)換或通過意通代碼轉(zhuǎn)換而語意不變;也就是說,不同語種之間 可以借此進(jìn)行相互轉(zhuǎn)換。上述四個(gè)庫之間的關(guān)系是平列的,它們互不干預(yù)又共處語句構(gòu)件存 貯部之中。都要接受其它部件的操作或控制。
O意通代碼編制部102,與語句構(gòu)件存儲(chǔ)部101相連。僅當(dāng)上述四個(gè)庫任何之一出現(xiàn)新 記錄時(shí),把當(dāng)前庫代表數(shù)例如習(xí)語庫寸F00H、句型庫二F000H、艙摸庫二EF00H、意群串庫K)001H (也是這四個(gè)庫的庫標(biāo)、數(shù)值段段標(biāo);數(shù)段的起點(diǎn),止點(diǎn)即下一個(gè)庫標(biāo)數(shù)-l)作高位字加上 當(dāng)前庫記錄號(hào)合成意通代碼;并填入當(dāng)前庫的某某碼字段,作為語句構(gòu)件統(tǒng)一的雙字定長的 多語種語意互通的意通代碼。意通代碼對(duì)于當(dāng)前庫、當(dāng)前記錄內(nèi)各語種構(gòu)件的同一語意的代 表是唯一的;
曰構(gòu)件庫操作控制、接口部103,通過構(gòu)件讀出、構(gòu)件匹配、構(gòu)件添加部構(gòu)成。用于接 收基于本語句構(gòu)件的各種應(yīng)用的調(diào)用或接收相關(guān)命令進(jìn)行操作,返回調(diào)用者所需語句構(gòu)件, 或通過本接口與基于語句構(gòu)件的各種應(yīng)用裝置相連接。
上文所述語句構(gòu)件(參附圖2及圖3 6)是用于組裝語言句子的另部件,也是對(duì)句子進(jìn) 行另部件拆分、編碼的標(biāo)準(zhǔn)件。有如下四種
1、 句型構(gòu)件201,301,用于構(gòu)成句子的基本結(jié)構(gòu)框架。代表了該類句子基本語意類屬, 也決定了該類句子所含句艙的位次和個(gè)數(shù),并包攬了該類句子的較復(fù)雜的語法現(xiàn)象。
2、 艙模構(gòu)件202,401,用于構(gòu)成復(fù)雜句艙的基本結(jié)構(gòu)框架。代表了該類句艙基本語意類 屬,也決定了該類句艙所含艙眼的位次和個(gè)數(shù),并包攬了該類句艙的較復(fù)雜的語法現(xiàn)象。
句型和艙模構(gòu)件都為句子提供了框架結(jié)構(gòu),包攬了復(fù)雜的語法,決定了所含句艙及艙眼 的位次,這就避免了現(xiàn)有技術(shù)利用人工智能作句法分析、語法分析之不力。有貢獻(xiàn)于結(jié)果表 意能與原文一致。
3、 意群串構(gòu)件501 503,是由意群串充當(dāng)?shù)臉?gòu)件。用于填充簡(jiǎn)單句艙203 204或艙眼 205 207的構(gòu)件,簡(jiǎn)單句艙與艙眼是上、下位概念而大小一樣,都是除不表意虛詞外不超過 三個(gè)意群串;
4、 小習(xí)語構(gòu)件601,由過于簡(jiǎn)短不足以分出句型、句艙的句子充當(dāng)小習(xí)語構(gòu)件。用于直 接構(gòu)成簡(jiǎn)短的句子。
語句構(gòu)件庫中的多文種構(gòu)件字段,它們是以文種設(shè)置, 一個(gè)文種對(duì)應(yīng)一個(gè)文種構(gòu)件字段。 例如多文種句型字段,包括英文句型、中文句型、俄文句型等等語種句型字段。其它多文種 艙模、多文種串(意群串)、多文種習(xí)語同樣如此。
上文所述的語句構(gòu)件裝置,除已有的相應(yīng)文種(英文、中文、俄文)夕卜,每增加一個(gè)語 種,首先應(yīng)將句型庫、艙模庫、意群串庫、習(xí)語庫分別依次各增加一個(gè)某文句型、某文艙模、 某文串、某文習(xí)語字段。并且新加文種的構(gòu)件只有與已有語種構(gòu)件的語意相同的才能填加在 同一個(gè)記錄上。也即再次強(qiáng)調(diào)只有相同語意的語句構(gòu)件才能共處一個(gè)記錄。
對(duì)于上述四個(gè)庫,可以只提取二個(gè)字段構(gòu)成相應(yīng)分庫;即提取句型庫、艙模庫、意群串 庫、習(xí)語庫中的某文句型、某文艙模、某文串或某文習(xí)語和某某碼兩個(gè)字段,構(gòu)成某某語言 庫或第一語言庫、第二語言庫而應(yīng)用于語言翻譯或文本轉(zhuǎn)換等場(chǎng)合。
上文所述語句構(gòu)件的來源,其一、是通過專家操作、人機(jī)交互的方式,剖析比對(duì)雙語對(duì) 訓(xùn)練樣本語料得到。其二、即另一個(gè)來源是專業(yè)用戶在專業(yè)翻譯過程中、或事后閑時(shí)再加入。通過支持網(wǎng)站實(shí)現(xiàn)。
二、 一種基于語句構(gòu)件的多語種專業(yè)翻譯方法
下面結(jié)合附圖以英翻中為實(shí)例進(jìn)行說明。
圖7是本發(fā)明基于語句構(gòu)件的多語種專業(yè)翻譯方法流程圖。如圖7所示,701句讀入, 根據(jù)句末符號(hào)判斷,讀入源語一個(gè)句子。接續(xù)702,通過査表、判斷進(jìn)行分流
當(dāng)讀入源語句得到句型庫、艙模庫和意群串庫全方位支持時(shí)。即源語句子全部可以由四 個(gè)構(gòu)件庫中查出,接續(xù)自動(dòng)句給出703;
當(dāng)讀入源語句得到句型庫支持和艙模庫、意群串庫的部分支持時(shí)。例如出現(xiàn)多匹配句型 需要干預(yù)選取、某個(gè)復(fù)雜句艙査艙模庫無、某詞條意群串庫無等情況,需要接受干預(yù),接續(xù) 半自動(dòng)句給出704;
當(dāng)讀入源語句沒有得到句型庫支持,即査無匹配句型時(shí),査詢記憶庫,有相似句對(duì),接 續(xù)機(jī)輔式句給出705;
當(dāng)讀入源語句沒有得到句型庫支持、也沒有得到記憶庫的支持時(shí)。即査句型庫無査記 憶庫也沒有相似記錄時(shí)。接續(xù)人工式句給出706。
圖8是圖7模塊703自動(dòng)句給出進(jìn)一步的流程圖。假如當(dāng)前讀入句是"Ho* do you do " 用讀入的源語句査詢習(xí)語庫,是,確定為小習(xí)語句,直接給出目語小習(xí)語句,"您好!"。再例 如當(dāng)前讀入句是"The fisherman consents to return the_feather—suit, on condition that fairy dance andplayheavenly music for him."査習(xí)語庫,無,再査詢記憶庫,如果是,并且源語100%相似, 取該句對(duì)目語句直接給出。否則,續(xù)
圖8模塊801句型處理,根據(jù)讀入的源語句査詢句型庫,取唯一或最長,得句型1059 號(hào),用該記錄的源語句型"the [1] consents to [2], on condition that [3."將讀入的源語句對(duì)號(hào) 入座地套入,如"the 1 {fisherman} consents to 2 {return the—feather—suit} , on condition that 3 {fairy dance and play heavenly music for him}.,,; 用該記錄的目語句型,如"在 [3]的條件下,[1]答應(yīng)[2]。"作為自動(dòng)給出當(dāng)前句子的框架。
續(xù)圖8模塊802句艙處理,依次取出被套入源語句型的句艙內(nèi)容査詢艙模庫。這里句艙 1,句艙2都是簡(jiǎn)單句艙,査艙模庫,無;而當(dāng)用句艙3査艙模庫時(shí),有、取唯一或最長得句 艙205號(hào),用該記錄的源語艙模將該句艙內(nèi)容對(duì)號(hào)入座地套入,如"1 [fairy] 2[dance] and 3[play heavenly music] for him",用該記錄的目語艙模"[1]為他[2]并[3]的條件下"作 為自動(dòng)給出當(dāng)前句艙的框架并置入到句型框架相應(yīng)的位置,如"在3{[1]為他[2]并[3]的條 件下}, {1}答應(yīng){2}。"
續(xù)圖8模塊803査串置反悔庫,依次取出被套入源語句型、艙模中的簡(jiǎn)單句艙或艙眼內(nèi) 容,逐詞條査詢意群串庫,將査得的目語所有解釋連同當(dāng)前的句艙或艙眼標(biāo)號(hào)存入反悔庫。 反悔庫有"艙或眼號(hào)、源語串、目語解釋、源串序、預(yù)選"等字段,其內(nèi)容業(yè)界人員明白(略)。 再取其一作為預(yù)選置入目語框架相應(yīng)位置。然后將已經(jīng)由目語句型、艙模構(gòu)成的框架并填入 了預(yù)選目語解釋的自動(dòng)給出當(dāng)前目語句子連同句艙、艙眼標(biāo)號(hào)顯示給出,如
"在3{1<仙女 > 為他2<跳舞 > 并3<游戲天上的樂曲>}的條件下,1{漁 夫}答應(yīng)2{歸還羽衣}。"如果某句艙或某艙眼以及它們的內(nèi)容校改庫有記錄的,根據(jù)校改庫信息更正后再給出(即下文所述自動(dòng)更正;本句無),然而等待用戶的便捷式校改。
續(xù)圖8模塊804,詞意或詞序的自動(dòng)更正或干預(yù)更正。當(dāng)用戶點(diǎn)擊不滿意的目語預(yù)選解 釋時(shí),列出反悔庫中相同句艙、艙眼和串次的所有解釋接受用戶點(diǎn)擊另選,置換預(yù)選解釋。 這很明顯, 一眼便看到"游戲"不對(duì),因"游戲天上的樂曲"不通,所以當(dāng)用戶點(diǎn)擊"游 戲"后,取串反悔庫中該詞條的所有解釋列出如"游戲、玩、演奏、節(jié)目游戲、比賽、運(yùn)動(dòng)、 賭博、劇本、扮演、播放";當(dāng)用戶點(diǎn)選"演奏"后,將"演奏"置換原預(yù)選解釋"游戲"為 "演奏天上的樂曲"。如果簡(jiǎn)單句艙或艙眼的詞序不對(duì)。當(dāng)用戶點(diǎn)擊某個(gè)目語預(yù)選解釋后點(diǎn) 擊向前或向后位移命令按鈕時(shí)將該目語解釋向前或向后置換一個(gè)串位;該例無。
續(xù)圖8模塊805句給出,當(dāng)用戶點(diǎn)擊返回命令按鈕時(shí),當(dāng)前目語句子確定,與備份句不 同的句艙或艙眼內(nèi)容以及相關(guān)的句型、句艙、艙眼標(biāo)號(hào)信息納入校改庫。當(dāng)前例雖然沒有作 詞序移動(dòng),但置換了預(yù)選解釋;相關(guān)信息納入校改庫(含句型、艙或眼號(hào)、源語內(nèi)容、正后 目等字段),即為上文所述的自動(dòng)更正作好了準(zhǔn)備;相同情況的相同源語內(nèi)容就直接以"演奏 天上的樂曲"給出了。
最后把"在3{1<仙女〉為他2〈跳舞 > 并3<演奏天上的樂曲>}的條件下, 1{漁夫}答應(yīng)2{歸還羽衣}。"棄去所有句艙、艙眼標(biāo)號(hào),如"在仙女為他跳舞并演奏 天上的樂曲的條件下,漁夫答應(yīng)歸還羽衣。";將其自動(dòng)給出并尾加于譯文文件;清空反悔庫, 讀入下一個(gè)源語句子,接續(xù)模塊701。
圖9是圖7模塊(704)半自動(dòng)句給出進(jìn)一步的流程圖;如圖9所示 模塊901干預(yù)性句型處理。假如當(dāng)前讀入句是"The doctor told his patient that he would prescribe him some patent medicine on condition that he strictly follow his instructions.,,根據(jù)讀入 的源語句查詢句型庫,有二或多個(gè)匹配句型時(shí),接受用戶點(diǎn)選干預(yù),本例最長句型只一個(gè), 不必點(diǎn)選干預(yù),同自動(dòng)句給出(略)。然后用該記錄的源語句型將讀入的源語句對(duì)號(hào)入座地套 入,如"the 1 {doctor} told his 2{patient} that 3{he would prescribe him some patent medicine} on condition that 4{he strictly follow his instructions}.,,。用該記錄的 目語句型作為半自動(dòng)給出當(dāng)前句的框架,如告訴他的[2],如果能[4],就可以 [3]。"。
續(xù)圖9模塊902干預(yù)性句艙處理,依次取出被套入源語句型的句艙內(nèi)容査詢艙模庫,當(dāng) 前例句艙l、句艙2都是簡(jiǎn)單句艙,無;而句艙3、句艙4都是復(fù)雜句艙。以句艙3內(nèi)容查詢 艙模庫。有二或多個(gè)艙模匹配時(shí),接受用戶點(diǎn)選千預(yù),該例點(diǎn)選艙模206。然后用該記錄的 源語艙模將該句艙內(nèi)容對(duì)號(hào)入座地套入,如"he would prescribe him l{some patent medicine}"。用該記錄的目語艙模作為半自動(dòng)給出當(dāng)前句艙的框架并置入到句型框架相應(yīng)的 位置,如"{1}告訴他的{2},如果能{4},就可以3{開[1]給他}。";如果沒有符合 艙模的非簡(jiǎn)單句艙(即復(fù)雜句艙)暫且不作為;當(dāng)以句艙4的內(nèi)容查詢艙模庫時(shí)沒有匹配艙 模,然而暫且不作為。
續(xù)圖9模塊903査串置反悔庫。依次取出被套入源語句型、艙模中的簡(jiǎn)單句艙或艙眼內(nèi) 容,逐詞條査詢意群串庫,將査得的目語所有解釋連同當(dāng)前的句艙或艙眼標(biāo)號(hào)存入反悔庫。 反悔庫結(jié)構(gòu)同上(略);取其一作為預(yù)選置入目語框架相應(yīng)位置(見后);如果出現(xiàn)意群串庫 未登錄的詞條,可即時(shí)加入或啟動(dòng)外詞典連接,在用戶的干預(yù)下登錄到本方法的意群串庫;
本例無,不必。接續(xù)將已經(jīng)由目語句型、艙模構(gòu)成的框架并填入了預(yù)選目語解釋的當(dāng)前目語句子連同句艙、艙眼標(biāo)號(hào)顯示給出,如"1{醫(yī)生}告訴他的2{病人},如果能{4}, 就可以3{開l〈幾特效藥 > 給他}。";如果用戶對(duì)根據(jù)反悔庫所列的待選解釋都不滿意, 接受用戶添加解釋并納入意群串庫。如果某句艙或某艙眼以及它們的內(nèi)容校改庫有記錄的, 根據(jù)校改庫信息更正后再給出,即自動(dòng)更正。
續(xù)圖9模塊904詞義或詞序的自動(dòng)或干預(yù)更正。當(dāng)用戶點(diǎn)擊不滿意的目語預(yù)選解釋時(shí), 列出反悔庫中相同句艙、艙眼和串次的所有解釋接受用戶點(diǎn)擊另選,置換預(yù)選解釋。暫不管 句艙4;本例"3{開1<幾特效藥〉給他}"中的"幾特效藥"不妥v點(diǎn)擊"幾"后列 出"幾、一些"等,用戶選"一些"后者置換預(yù)選解釋"幾"。成為"H醫(yī)生}告訴他的2{病 人},如果能{4},就可以3{開l〈 一些特效藥 > 給他}。";當(dāng)用戶點(diǎn)擊某個(gè)目語預(yù) 選解釋后點(diǎn)擊向前或向后位移命令按鈕時(shí)將該目語解釋向前或向后置換一個(gè)串位;本例也沒 有。
續(xù)圖9模塊905不作為句艙處理,在S202步驟當(dāng)中因沒有符合艙模而不作為的句艙, 突出顯示。本例的句艙4,如"4{he strictly follow his instructions}"; " 4{ 他嚴(yán) 格遵守地的囑咐}"。接受用戶人工編輯該句艙目語內(nèi)容,假定用戶把"4{他嚴(yán)格遵 守他的囑咐}"。修改為"4{嚴(yán)格執(zhí)行他的醫(yī)囑}"。
續(xù)圖9模塊906句給出。給出目語句為"1{醫(yī)生}告訴他的2{病人},如果能4{嚴(yán) 格執(zhí)行他的醫(yī)囑},就可以3{開K 一些特效藥 > 給他}。"當(dāng)用戶點(diǎn)擊返回命令按 鈕時(shí),給出當(dāng)前目語句子確定,跳開不作為句艙,其它與備份句不同的句艙或艙眼內(nèi)容連同 句型、句艙、艙眼標(biāo)號(hào)信息納入校改庫,最后棄去所有句艙、艙眼標(biāo)號(hào),將其"醫(yī)生告訴他 的病人,如果能嚴(yán)格遵守他的醫(yī)囑,就可以開一些特效藥給他。"給出并尾加于譯文文件。清 空反悔庫,提示用戶應(yīng)當(dāng)對(duì)不作為句艙補(bǔ)作艙模,如果應(yīng)答是,跳轉(zhuǎn)S507作艙模。該例假定 應(yīng)答,否。讀入下一個(gè)源語句子,接續(xù)模塊701。
圖10是圖7模塊(705)機(jī)輔式句給出進(jìn)一步的流程圖
如圖10所示,模塊1001搜索記憶庫,例如當(dāng)前讀入的源語句是"'What do you want in a Man7, or 'What do you want in a girl* ' is often the question to the boy or girl who is seeking for his/her partner.";以它査詢句型庫,無匹配句型;再用讀入的、源語 句査詢記憶庫。上文已經(jīng)述及,在進(jìn)入模塊703時(shí),曾經(jīng)搜索過記憶庫,并把與源語100%相 似句對(duì)的目語句直接給出了。這里再搜索,只是低于100%的只能作為參考的句例。如果有相 似記錄,把它們羅列于臨時(shí)庫,計(jì)算它們的相似度;當(dāng)前句的相似度最大,96.3%;選相似度 最大記錄的目語字段內(nèi)容""你理想的男友是什么樣的"或〃你理想的女友是什么樣的〃是大多
數(shù)男孩或女孩在尋找伴侶的時(shí)候提出的問題。";作為目語參考句給出,同時(shí)將該記錄的使用
頻度字段之值加一。然后接受用戶編輯、校改,本句只需對(duì)分句引號(hào)梢作改進(jìn)即可。當(dāng)用戶 點(diǎn)擊返回命令按鈕后,作為當(dāng)前目語句"'你理想的男友是什么樣的,或'你理想的女友是什
么樣的'是大多數(shù)男孩或女孩在尋找伴侶的時(shí)候提出的問題。";給出并尾加于譯文文件。然
后提示用戶制作句型,如果應(yīng)答是,續(xù)步驟S501制作句型。本例假定應(yīng)答否,讀入下一個(gè)源 語句子,接續(xù)模塊701。
圖11是圖7模塊(706)人工式句給出進(jìn)一步的流程如圖11所示,模塊1101全句査串置反悔庫。例如當(dāng)前讀入的源語句是"China beganimplementation of and made a good start on its Eleventh Five—Year Plan in 2006 , making major achievements in economic and social development .,,., 這里源語句子已經(jīng)査詢過 句型庫,也査詢過記憶庫,都沒有得到支持。然而為了提高翻譯工作效力;同時(shí)又降低對(duì)操 作人員的外語程度要求,還可利用意群串庫。依次取出讀入的源語句所有詞串,逐條詞串査 詢意群串庫,將査得的目語所有解釋連同當(dāng)前串序號(hào)存入反悔庫,取其一作為目語預(yù)選解釋 按序排列構(gòu)成目語參考句,和同讀入的源語句上下兩行顯示。目語參考句為"中國開始執(zhí) 行的和犯了 一好開始在它的Eleventh Five-Year Plan在2006 ,產(chǎn)生主修課成 就在經(jīng)濟(jì)和社會(huì)的發(fā)展.";當(dāng)用戶點(diǎn)擊參考句不對(duì)的目語預(yù)選解釋時(shí),列出反悔庫中 相同串序的所有解釋接受用戶點(diǎn)擊另選,置換預(yù)選解釋;給出一個(gè)可編輯框,接受用戶編輯、 校改。假如用戶對(duì)當(dāng)前句編輯為"2006年,是我國實(shí)施"十一五"規(guī)劃并實(shí)現(xiàn)良好開局的一 年,國民經(jīng)濟(jì)和社會(huì)發(fā)展取得重大成就。"并點(diǎn)擊返回命令按鈕確定為當(dāng)前目語句給出并尾加 于譯文文件。清空反悔庫,提示用戶制作句型,如果應(yīng)答是,后續(xù)步驟S501制作句型;這里 假定應(yīng)答否定,將當(dāng)前源語句子、目語句子分別存入記憶庫相應(yīng)字段,讀入下一個(gè)源語句子, 接續(xù)模塊701。
圖12是圖7模塊(708、 709)作句型、作艙模進(jìn)一步的流程在專業(yè)翻譯過程中相關(guān)庫內(nèi)容進(jìn)行自動(dòng)或半自動(dòng)積累。如模塊708的作句型;模塊709 的作句艙。如圖7所示,作句型708在流程上處于機(jī)輔式句給出705、人工式句給出706之 后。在這兩個(gè)循環(huán)點(diǎn)上,用戶可以選擇馬上進(jìn)行或暫且放下閑時(shí)再作,也就是在專業(yè)翻譯活 動(dòng)前、后進(jìn)行庫擴(kuò)充707時(shí)再作。作句型708之后緊隨作句艙709,作句艙又可以在半自動(dòng) 句給出704后進(jìn)行因?yàn)槟硰?fù)雜句艙缺少艙模是由"自動(dòng)"降為"半自動(dòng)"的主要原因。作 艙模后就完成了一輪循環(huán),接續(xù)下一個(gè)循環(huán)而返回到句讀入701。
作句型708、作艙模709的進(jìn)一步的流程圖如圖12所示首先說明的是需要作句型(作 艙模相同、下略)有兩種情況,其一是運(yùn)作第一個(gè)語對(duì)時(shí),需要對(duì)A、 B語句都作句型。從運(yùn) 作第二個(gè)語對(duì)開始,因?yàn)榘岩延械恼Z種作為A語;新加的語種作為B語。所以只需對(duì)B語制 作句型;并且可以由A到B半自動(dòng)地進(jìn)行,比同時(shí)對(duì)A、 B語作句型要容易簡(jiǎn)單得多。因而下 文便以同時(shí)對(duì)A、 B語作句型為例進(jìn)行說明。
如圖12模塊1201源目句對(duì)例所示,將讀入的源語句和已確定的目語給出句作為句對(duì)例 顯示,接受用戶挖句艙操作。假如當(dāng)前源目句對(duì)是
It was owing to the victory of the revolutionary war of 1776 led by Washington that the American people won independence.
正是由于1776年華盛頓領(lǐng)導(dǎo)的革命戰(zhàn)爭(zhēng)的勝利,才使得美國人民贏得了獨(dú)立。
模塊1202挖句艙,挖句艙操作由用戶在源語句或目語句點(diǎn)擊兩個(gè)點(diǎn),這兩個(gè)點(diǎn)之間要 求最少含有一個(gè)詞串,這就是將要挖去的句艙之首尾。用戶可以先點(diǎn)挖源語句,也可以先點(diǎn) 挖目語句;可以從左到右點(diǎn)挖,也可以從右到左點(diǎn)挖。但必須源、目句各點(diǎn)擊兩個(gè)點(diǎn)后,點(diǎn) 擊挖句艙命令按鈕挖完一個(gè)句艙后再挖下一個(gè)。這個(gè)過程中需測(cè)試存句型命令按鈕是否被點(diǎn) 擊?如果沒有被點(diǎn)擊,在源語句和目語句用戶點(diǎn)擊的兩個(gè)至少相隔一個(gè)詞條的點(diǎn)作為一個(gè)句 艙,挖去其中內(nèi)容,標(biāo)以[A],如
It was owing to [A] that the American people won independence.
正是由于[A],才使得美國人民贏得了獨(dú)立。
21如果還是沒有被點(diǎn)擊,接續(xù)相同的挖句艙操作,依次標(biāo)以[B]、 [C]……。如 It was owing to [A] that [C] won [B]. 正是由于[A],才使得[C]贏得了[B]。 如果這時(shí)存句型命令按鈕被點(diǎn)擊表示挖句艙結(jié)束。
續(xù)圖12模塊1203操作句型或小習(xí)語。把挖去句艙所剩部份作為句型,進(jìn)行格式檢査, 格式檢査由編程人員根據(jù)具體情況編制。通過后以源語(這里源語是A語,下同)結(jié)構(gòu)次序 從左到右以Uh {2}、 {3}替換原以操作時(shí)序"]、[B]、 [C]的標(biāo)注,如:
It was owing to {1} that {2} won {3}.
正是由于{1},才使得{2}贏得了{(lán)3}。
最后分別存入句型庫相應(yīng)的源語句型字段和目語句型字段。如果當(dāng)前源語句、目語句太 短,不便以上操作劃分出句型、句艙,用戶點(diǎn)擊存句型命令按鈕后,沒有査到被挖的句艙, 把當(dāng)前源語、目語句子作為小習(xí)語,分別存入習(xí)語庫相應(yīng)字段。假如當(dāng)前句對(duì)是"See you tomorrow.","明天見。"那就是小習(xí)語,把它們存入習(xí)語庫。而本例不是這種情況。
續(xù)圖12模塊1204套句型與檢測(cè);它也是來自模塊704半自動(dòng)句給出的一個(gè)入口。該模 塊操作,將當(dāng)前源語、目語句例分別套入當(dāng)前源語、目語句型,如
It was owing to 1 { the victory of the revolutionary war of 1776 led by Washington} that 2{the American people} won 3{independence}.
正是由于1U776年華盛頓領(lǐng)導(dǎo)的革命戰(zhàn)爭(zhēng)的勝利},才使得2{美國人民}贏得了 3{獨(dú)立}。
依次檢査每個(gè)句艙內(nèi)容是否簡(jiǎn)單句艙,如果不是,既超出簡(jiǎn)單句艙的規(guī)定,將當(dāng)前句艙 的源語、目語上下行顯示,接受用戶挖艙眼1205的操作。本例句艙l超出,是復(fù)雜句艙;而 句艙2、句艙3都是簡(jiǎn)單句艙不要挖艙眼。句艙l要挖艙眼制作艙模
the victory of the revolutionary war of 1776 led by Washington
1776年華盛頓領(lǐng)導(dǎo)的革命戰(zhàn)爭(zhēng)的勝利
挖艙眼操作與挖句艙一樣,在源語句艙和目語句艙用戶點(diǎn)擊的兩個(gè)至少相隔一個(gè)詞條的 點(diǎn)作為一個(gè)艙眼,挖去其中內(nèi)容,標(biāo)以[A],相似操作依次標(biāo)以[B]、 [C]……;(簡(jiǎn)略)。
續(xù)圖12模塊1206操作保存艙模。當(dāng)用戶點(diǎn)擊存艙模命令按鈕后,對(duì)挖去艙眼所剩部份 作為艙模,進(jìn)行格式檢査,通過后以源語結(jié)構(gòu)次序從左到右以[l]、 [2]、 [3]替換原以操作時(shí) 序[A]、 [B]、 [C]的標(biāo)注,得艙模 ___
the victory of [1] of [2] led byT^l [3]領(lǐng)導(dǎo)的[1]的勝利
它們的模例結(jié)合型式"1{ the victory of l[the revolutionary war] of 2[1776] led by 3[Washington] } ", "1{ 2[1776年]3[華盛頓]領(lǐng)導(dǎo)的1 [革命戰(zhàn)爭(zhēng)]的勝利}"
最后把艙模分別存入艙模庫相應(yīng)的源語艙模字段和目語艙模字段。最后,清除制作句型、 艙模的相關(guān)顯示,進(jìn)行判別返回調(diào)用者或讀入下一個(gè)源語句子,接續(xù)步驟701。
上文所述是在專業(yè)翻譯過程中相關(guān)庫內(nèi)容進(jìn)行自動(dòng)或半自動(dòng)積累的主要內(nèi)容。當(dāng)然作句 型、作艙模也是在專業(yè)翻譯活動(dòng)前、后進(jìn)行庫擴(kuò)充的主要內(nèi)容。關(guān)于在專業(yè)翻譯活動(dòng)前、后 進(jìn)行庫擴(kuò)充是在圖7遠(yuǎn)行步驟Sl模塊703前有庫擴(kuò)充命令按鈕在待命。當(dāng)庫擴(kuò)充命令按鈕 被點(diǎn)擊;搜索記憶庫、取出最高頻度記錄的源、目語句例對(duì),當(dāng)前記錄作刪除標(biāo)志,跳轉(zhuǎn)模
22塊708作句型,即上文細(xì)述的作句型;如果庫擴(kuò)充命令按鈕沒有再次被點(diǎn)擊(作句型、句艙 之后)繼續(xù)本節(jié)所述作句型、作句艙的步驟,僅當(dāng)庫擴(kuò)充命令按鈕再次被點(diǎn)擊,返回到遠(yuǎn)行 步驟S1模塊703前斷點(diǎn)。
在專業(yè)翻譯過程中相關(guān)庫內(nèi)容進(jìn)行自動(dòng)或半自動(dòng)積累,還有遠(yuǎn)行步驟Sl、 S2、 S3、 S4 的適當(dāng)區(qū)間有擴(kuò)査詞命令按鈕在待命,進(jìn)一步包括如下步驟。
當(dāng)用戶選定源語一條或若干詞串后點(diǎn)擊擴(kuò)査詞命令按鈕,進(jìn)行判斷。
當(dāng)所選是若干條詞串,以它們的各種可能排列査詢意群串庫,把它們的排列和同目語的 所有解釋列表給出,同時(shí)顯示選復(fù)、改饋復(fù)命令按鈕。例如用戶選取了 "a little too small for you";顯示出復(fù)詞"a—little—too—small","稍微小一點(diǎn)"
當(dāng)用戶點(diǎn)擊列表中某項(xiàng)后點(diǎn)擊了選復(fù)命令按鈕,把源語相應(yīng)詞條"a little too small", 以"_"連成復(fù)詞"a—little—too—small",并以該項(xiàng)目語解釋置換原有解釋,
當(dāng)修改了列表中某項(xiàng)后點(diǎn)擊了改饋復(fù)命令按鈕,例如將"a little too small"修改為 "a little too big","稍微大一點(diǎn)"后點(diǎn)擊了改饋復(fù)命令按鈕,將該修改項(xiàng)作為新增復(fù)詞 及其解釋"a—little—too—big","稍微大一點(diǎn)"存入意群串庫的復(fù)詞分庫。
當(dāng)所選是一條詞串,先査詢不規(guī)則詞表,再根據(jù)詞尾變化規(guī)律作出可能的變形和原形詞 條,以它們分別査詢意群串庫,把源語詞條的原形或變形和同它們的目語所有解釋列表給出, 同時(shí)顯示選單、改饋單命令按鈕。
當(dāng)用戶點(diǎn)擊列表中某項(xiàng)后點(diǎn)擊了選單命令按鈕,以該項(xiàng)目語解釋置換原有解釋。
當(dāng)用戶修改了列表中某項(xiàng)后點(diǎn)擊了改饋單命令按鈕,將該修改過的作為新增解釋存入意 群串庫的單詞分庫,判斷并返回命令按鈕被擊中斷點(diǎn)。
拼音文字在意群串庫包括單詞分庫和復(fù)詞分庫。各行業(yè)的專業(yè)詞典絕大多數(shù)由多詞條組 成而處復(fù)詞庫中;少數(shù)處單詞庫中。
在專業(yè)翻譯活動(dòng)前、后進(jìn)行的除庫擴(kuò)充外;還有重要的統(tǒng)計(jì)優(yōu)化、專業(yè)劃分和專業(yè)翻譯 初始準(zhǔn)備?,F(xiàn)分述如下
統(tǒng)計(jì)優(yōu)化——本發(fā)明所公開的語句構(gòu)件庫之內(nèi)容與現(xiàn)有技術(shù)的電子詞典內(nèi)容有很大區(qū) 別。電子詞典來自紙上詞典、即給人看、給人理解參考的書上詞典;基本上照搬進(jìn)入電腦。 而本發(fā)明的構(gòu)件庫不是給人看、不是給人理解參考;而是讓計(jì)算機(jī)處理,裝配成句子的組件。 因而有一個(gè)社會(huì)性積累和優(yōu)化過程,這個(gè)優(yōu)化過程是基于統(tǒng)計(jì)的。比如句型與句型之間的相 對(duì)獨(dú)立;比如一個(gè)句型如何能更好地代表一類句子的基本語意,又如何能更適宜計(jì)算機(jī)操作 等等有很大的優(yōu)化空間。
專業(yè)劃^——上文述及,本發(fā)明產(chǎn)品面向?qū)I(yè),甚至面向某些、某個(gè)專業(yè)翻譯者個(gè)人。 然后適當(dāng)?shù)財(cái)U(kuò)大范圍,適宜一個(gè)群。其中也有上文述及的可能構(gòu)件庫很大,不至于為此而影 響實(shí)用。原則是從小到大,從一個(gè)到一群。達(dá)到一定程度時(shí),甚至可以面向?qū)I(yè)翻譯者量身 定做。
專業(yè)翻譯的初始準(zhǔn)備——與現(xiàn)有技術(shù)類似,由于要適宜用戶個(gè)人,需要用戶把手中已有 的專業(yè)詞典納入意群串庫,翻譯過的源目句對(duì)例子納入記憶庫等等。本發(fā)明提供相應(yīng)方法和 措施。
實(shí)施本發(fā)明所產(chǎn)生的軟件系統(tǒng)可以在現(xiàn)有的中型、小型、微、巨型計(jì)算機(jī),筆記本電腦、掌上電腦等單獨(dú)的或者相連成網(wǎng)的計(jì)算機(jī)上運(yùn)行實(shí)施??梢栽诟鞣N計(jì)算機(jī)網(wǎng)絡(luò),特別是在因 特網(wǎng)上運(yùn)行實(shí)施。還可以在諸如"個(gè)人數(shù)字助理",PDA (Personal Digital Assistant)的裝 置上運(yùn)行實(shí)施。本發(fā)明實(shí)施后的產(chǎn)品,可以應(yīng)用于專業(yè)翻譯,可以使廣大科技工作者兼作專 業(yè)翻譯。拓展翻譯記憶,在"相同的句子永遠(yuǎn)不需要翻譯第二遍"的同時(shí);使"具有相同句 型的句子可以進(jìn)行自動(dòng)或半自動(dòng)語意一致的機(jī)器翻譯"。
作句型操作者參考
作句型的要點(diǎn)是挖句艙,其中該如何挖、該如何制作句型。要求就是保證可操作性的前 提下追求代表性??刹僮餍约醋岆娔X無需理解、分析做諸如上述的査表、判斷、存儲(chǔ)等操作。 代表性即句型涵蓋的句例多少,可涵蓋句例越多代表性越好。作句型過程中要求專職人員掌 握的原則措施如下-
① 多語對(duì)語義考慮原則
從多語對(duì)、至少是雙語對(duì)的語義上考慮。如果條件許可,自然是取盡可能多的語對(duì)同時(shí) 進(jìn)行句型提??;正是因?yàn)椴豢赡懿乓笾辽偈请p語對(duì)進(jìn)行。如 We used to go to the movies about once a week. 通常我們每周大約去看一次電影。 這個(gè)句對(duì),英文可以把"go to the movies",作為一個(gè)句艙,但是中文相應(yīng)的"看電 影"中間插有"一次"。"once a week"作為一個(gè)句艙,中文的"每周一次"又被其它詞隔開。 這兩種情況都不行,必須在雙語對(duì)語義上考慮均可才行。這個(gè)句對(duì)可 1{We} used to 2{go to the movies about once} a week. 通常1{我們}每周2{大約去看一次電影}。
② 代表性考慮原則
句艙的多少、大小直接影響句型的代表性。我們的原則是保證可操作性的前提下追求代 表性。關(guān)于句艙大小以何為宜,下文解說。這里先解釋一下代表性的問題 How many are there in your family1 你家有幾口人"?
這個(gè)句對(duì)如果只把"your family"作為句艙;可用"his family; John' s family; your class"等等填充。但是由于"How many"與"family"語義有關(guān)聯(lián)。中文對(duì)于"家" 問"幾口人";但對(duì)于"班級(jí)"應(yīng)問"多少學(xué)生",或"多少人"。這樣只把"your family" 作為句艙代表性就差。如果把"How many"與"family"作成兩個(gè)句艙,不但語意上可以相 互照應(yīng);而且代表性也增加了。
③ 樸質(zhì)準(zhǔn)確的考慮原則
鑒于意通文本的定位是"樸質(zhì)準(zhǔn)確地傳遞語義",當(dāng)挖句艙顧此失彼而無耐時(shí),可以修 改華麗的譯句為樸質(zhì)直譯,再挖句型。如
There can never be too much deception in war . 兵不厭詐。
該例譯句"兵不厭詐"既華麗又簡(jiǎn)練,但句型采集難以操作。把中文改為樸質(zhì)直譯"戰(zhàn)
爭(zhēng)中再多的詭計(jì)也不為過。"再作挖句艙處理
There can never be too much 1{deception} in 2{war}. 2{戰(zhàn)爭(zhēng)}中再多的1{詭計(jì)}也不為過。
For all their great size , the elephants moved absolutely noiselessly . 盡管象的身軀龐大,它走動(dòng)起來卻一點(diǎn)聲音也沒有。這"一點(diǎn)聲音也沒有";很難落實(shí)到句型或某個(gè)句艙;將它改為樸質(zhì)直譯"走動(dòng)起來卻 靜靜地"問題便迎刃而解了
For all their 1{great size} , 2{the elephants} 3{moved} absolutely 4{noiselessly}.
盡管2{象}的1{身軀龐大} , 2{它} 3{走動(dòng)}起來卻4{靜靜地}。
④ 語法簡(jiǎn)繁的原則
從語法方面考慮,復(fù)雜的、個(gè)性化的語法現(xiàn)象都攬到句型上;使句艙內(nèi)語法極為簡(jiǎn)單。 上面所舉的例子不難明白這一點(diǎn)。在具體操作上還可以適當(dāng)增加句艙個(gè)數(shù)來降低句艙復(fù)雜程 度,盡量少作大句艙(詳下文)。
1 {She} never 2{comes} but l{she} 3{brings something for the children}-
1{她}沒有一次2{耒}不是就3{為孩子們帶來一些東西}。
如增加句艙,把句艙{3}改成{3}{4}復(fù)雜性就降低了。如
l{She} never 2{comes} but l{she} brings 3{something} for the 4{children}. 1{她}沒有一次2{耒}不是就為4{孩子們}帶來3{—些東西}。
⑤ 詞性和可替換性的原則
句艙是可以被其它詞匯替換的部分,可替換的詞匯越多,可替代性越強(qiáng);間接地使句型 的代表性加強(qiáng)。句艙內(nèi)詞匯的詞性盡可能局限于數(shù)詞、名詞、形容詞、復(fù)串,少數(shù)情況才考 慮其它詞類(如動(dòng)詞、副詞等)。如果說要給做句艙的詞類排優(yōu)先次序,那首先就是數(shù)串、 專用串,次則名串、形容詞串……,最后考慮動(dòng)詞串。最不考慮的是介詞和連詞。也就是介 詞、連詞幾乎都納歸句型部分。
⑥ 句型詞不宜太少的原則
要求句型采集達(dá)到句艙內(nèi)語法極為簡(jiǎn)單,復(fù)雜語法現(xiàn)象盡攬于句型;挖去句艙后留下的 句型,所含句型詞不宜太少,因?yàn)樘倭瞬槐憔湫偷臋z出。
最理想的情況是每個(gè)句艙之前后都有句型詞,也就是沒有連續(xù)句艙的情況。原則是任何 一個(gè)句型,在任何文種里的框架結(jié)構(gòu)必須有一個(gè)或一個(gè)以上的文字串作為句型詞。不允許在 多語對(duì)當(dāng)中,某文種甚至沒有句型詞,中文因?yàn)樽詈?jiǎn)潔,這種情況時(shí)有發(fā)生, 一但發(fā)生就得 返工,必須避免。
有時(shí)連續(xù)出現(xiàn)幾個(gè)句艙,即連續(xù)句艙問題。還有是句艙的大小,盡量少作大句艙問題, 這些都與句型詞不宜太少相關(guān),這些情況在相關(guān)標(biāo)題下闡述。
⑦ 多連續(xù)句艙盡量避免的原則
1{1} 2{get to work} at 3{nine o'clock} every morning . 每天早上3{九點(diǎn)鐘} 1{我} 2{開始工作}。
上例英連續(xù)出現(xiàn){1}{2}兩個(gè)句艙;相應(yīng)的中文則變?yōu)閧3}{1}{2}三個(gè)連續(xù)句艙。二個(gè)或
二個(gè)以上句艙相連稱連續(xù)句艙;三個(gè)或三個(gè)以上句艙相連稱多連續(xù)句艙。連續(xù)句艙不但具有
句型詞太少之弊,套句型還得人工干預(yù)。特別是連續(xù)三個(gè)或更多的情況應(yīng)盡量避免。如上例 減少到兩個(gè)句艙就無此之慮了
I 1{get to work} at 2{nine o'clock} every morning . 每天早上2{九點(diǎn)鐘}我1{開始工作}。
⑧ 盡量少作大句艙的原則
句艙有大有小,最小的句艙只含一個(gè)意群串;最大的句艙可以包含一個(gè)分句或從句。我 們?cè)谧骶湫蜁r(shí),宜盡量少作大句艙。那么,如何掌握這個(gè)盡量少,以何為尺度呢?以"只能 這樣"為準(zhǔn)。例如下面句對(duì)Can, you guess 1{what I was doing} 2{this morning} 你能猜到2{今天上午} 1{我在做什么}嗎?
I have forgotten l{what time} he said he 2{had dinner} 3{last night}.
我忘記他說他3{昨天晚上}是1{什么時(shí)候} 2{吃的晚飯}。
What were you doing when 1{I called you on the telephone}
1{我打電話給你}的時(shí)候,你在做什么?
I have forgotten 1{what he said his address was}-
我忘記1{他說他的住址在哪里}了 。
上面四個(gè)句對(duì),分別由what、 when引出一個(gè)從句。第一對(duì)可以把主謂、時(shí)間狀語分開 作成兩個(gè)句艙。第二對(duì)可以作成三個(gè)句艙。第三對(duì)不能將狀語分開,只能作成一個(gè)句艙;第 四對(duì)What針對(duì)表語提問,也不能分開,只能作成一個(gè)句艙。第三、四兩對(duì)都"只能這樣", 這就是少作大句艙要把握的尺度。
⑨挖句艙后的審定原則
挖句艙之后還得認(rèn)真審定將句型、以至每個(gè)句艙分別審定。先看句型義, 一定要都來 自句型詞,與句艙內(nèi)容無粘連。然后審定每個(gè)句艙,它們必須是可替換的,與句型分開的, 不與句型義有粘連。如果某句艙與某句型詞有所粘連,必須修改之。例如
When do you think 1{the meeting will be held}
你認(rèn)為1{會(huì)議在什么時(shí)候召開}
這樣劃句型、句艙不對(duì),句艙內(nèi)容"什么時(shí)候"與句型詞"When"有粘連。應(yīng)修改為 When do you think 1{the meeting} will be 2{held} 你認(rèn)為1{會(huì)議}會(huì)在什么時(shí)候2{召開}
組復(fù)詞操作者參考
句艙層面比對(duì)操作如上述"組復(fù)詞",將原有詞串以"_"相連成復(fù)詞(復(fù)串);它們的目 的是便于更好地體現(xiàn)詞義;以便不同文種之間詞匯表意的對(duì)齊。主要有如下幾種情況,要求 專職人員掌握
① 直接詞譯不能表達(dá)時(shí),按意群組成復(fù)串
you were gone直譯應(yīng)是"你(是)走";"了"來源于過去式,故組成復(fù)串 "you—were一gone你走了,,
call一on一me來訪我 knew—nothing—about—it —無所知
compelled—to—go非去不可
show—himself—in—his—true—colours現(xiàn)出原形、現(xiàn)出本色
② 以簡(jiǎn)潔看齊,復(fù)雜表示者組成復(fù)串
英"per-mu grain yield,每畝谷物產(chǎn)量";中為"畝產(chǎn)"。將英組成復(fù)串
"per-mu—grain—yield", 向中看齊。又如 Late—at—night 深夜 down—to—the—countryside下鄉(xiāng) fight—it—out—to—the—end 斗爭(zhēng)到底
③ 有轉(zhuǎn)義表示一事物,或經(jīng)常性搭配的組成復(fù)串
fell—asleep入睡 knows—nothing —無所知
come—back—from—the—front 下火線汗如雨下; 近照
④詞義有重合或重復(fù)的組成復(fù)串 very—well 不錯(cuò); c
doubts—of—questions疑問; the—far—distance遠(yuǎn)處;
bear_fruit結(jié)果;
經(jīng)過上述組復(fù)詞的操作,往往在一個(gè)句艙里,部分詞串組成了復(fù)串,使部分看似復(fù)雜的 句艙變?yōu)楹?jiǎn)單句艙。組復(fù)詞也是意群對(duì)齊的措施之一,應(yīng)靈活應(yīng)用。
"意群對(duì)齊"操作者參考-
① 依照實(shí)例、延伸或增補(bǔ)詞義
Nothing can be 1 {wholly beautiful} that is not 2{useful}.凡是未經(jīng)2{應(yīng)用的) 就不可能1{完美}。
其中"usefur詞義有"有用的、有幫手的、有益的",選它們都不適合;增補(bǔ)"應(yīng)用的" 詞義項(xiàng)。
l{She} was 2 {strong} , for all l{she} was so 3{small} .1{她}雖然3{瘦小}, 但很2{結(jié)實(shí)}。如其中small小的,增補(bǔ)"瘦小"詞義項(xiàng)。 I am very ill.我患重病。把動(dòng)詞"am"增補(bǔ)"患"的詞義。 Learn the truth 明白真相,Learn增補(bǔ)"明白"詞義項(xiàng)。
② 不改變?cè)凶帧卧~的前提下加減串長度,便于拼接
I ask you to teach me every other day. 我請(qǐng)你每隔一天來教我。其中"teach" v有 "講授、教授"詞義;減詞串長為"教"便于拼接,增加"教"詞義項(xiàng)。
Sttend school入學(xué);sttend力tl "入"詞義項(xiàng),簡(jiǎn)釋"加入";school力fl "學(xué)"詞義 項(xiàng),簡(jiǎn)釋"學(xué)校"。
③ 粘帶附隨詞串
如"good好"粘帶成"好處、好事、好心、好用"等(中文別附隨量詞,后者另行處理)。 如"word詞"粘帶成"詞jy等。
④ 詞形變化增補(bǔ)詞義(分詞r比較級(jí)等表達(dá)的語意,增加相應(yīng)詞義),這樣可以省略詞形
分析、處理。
been增補(bǔ)"還是、怎么樣"詞義; punished增補(bǔ)"受處分"詞義;
best增補(bǔ)"最好的"詞義; had增補(bǔ)"以前"詞義;
done增補(bǔ)"做好了、完成了"詞義; village^增補(bǔ)"多個(gè)農(nóng)村"詞義。
2權(quán)利要求
1. 一種語句構(gòu)件裝置,其特征在于包括語句構(gòu)件存儲(chǔ)部(101),語句構(gòu)件存儲(chǔ)部含有用電子數(shù)據(jù)形式構(gòu)成的語句構(gòu)件的語句構(gòu)件庫句型庫(300),用于存儲(chǔ)句型構(gòu)件,有句型碼、多文種句型字段,其包含至少一個(gè)記錄,同記錄內(nèi)的不同文種句型之語意相同;艙模庫(400),用于存儲(chǔ)艙模構(gòu)件,有艙模碼、多文種艙模字段,其包含至少一個(gè)記錄,同記錄內(nèi)的不同文種艙模之語意相同;意群串庫(500、502),用于存儲(chǔ)意群串構(gòu)件,有意群碼、多文種串字段,其包含至少一個(gè)記錄,同記錄內(nèi)的不同文種意群串之語意相同;習(xí)語庫(600),用于存儲(chǔ)小習(xí)語構(gòu)件,有習(xí)語碼、多文種習(xí)語字段,其包含至少一個(gè)記錄,同記錄內(nèi)的不同文種小習(xí)語之語意相同;意通代碼編制部(102),與語句構(gòu)件存儲(chǔ)部(101)相連,用于對(duì)語句構(gòu)件庫的每一個(gè)記錄編制一個(gè)意通代碼。
2. 根據(jù)權(quán)利要求1所述的語句構(gòu)件裝置,其特征是所述語句構(gòu)件庫的語句構(gòu)件是不同的語義塊,用于組裝語言句子的另部件、或?qū)渥舆M(jìn)行編碼的標(biāo)準(zhǔn)件,語句構(gòu)件包括如下四種① 句型構(gòu)件(201,301),用于構(gòu)成句子的基本結(jié)構(gòu)框架,代表了該類句子基本語意類屬,也決定了該類句子所含句艙的位次和個(gè)數(shù),并包攬了該類句子的復(fù)雜的語法現(xiàn)象;② 艙模構(gòu)件(202,401),用于構(gòu)成復(fù)雜句艙的基本結(jié)構(gòu)框架,代表了該類句艙基本語意類屬,也決定了該類句艙所含艙眼的位次和個(gè)數(shù),并包攬了該類句艙的復(fù)雜的語法現(xiàn)象;③ 意群串構(gòu)件(501、 503),是由意群串充當(dāng)?shù)臉?gòu)件,用于填充簡(jiǎn)單句艙(203 204)或艙眼(205 207)的構(gòu)件; 小習(xí)語構(gòu)件(601),由過于簡(jiǎn)短不足以分出句型、句艙的句子充當(dāng)小習(xí)語構(gòu)件,用于直接構(gòu)成簡(jiǎn)短的句子。
3. 根據(jù)權(quán)利要求1所述的語句構(gòu)件裝置,其特征是語句構(gòu)件庫的多文種構(gòu)件字段以文種設(shè)置, 一個(gè)文種對(duì)應(yīng)一個(gè)文種構(gòu)件字段;句型、艙模、意群串或習(xí)語四個(gè)構(gòu)件庫可以提取其中的碼字段,和文句型、文艙模、文串或文習(xí)語兩個(gè)字段構(gòu)成文分庫、文語言庫、第一語言庫或第二語言庫,用于語言翻譯、文本轉(zhuǎn)換;所述意通代碼編制部,僅當(dāng)上述四個(gè)庫任何之一出現(xiàn)新記錄時(shí),把當(dāng)前庫代表數(shù)作高位加上當(dāng)前庫記錄號(hào)合成意通代碼,并填入當(dāng)前庫新記錄的某某碼字段,作為語句構(gòu)件統(tǒng)一的雙字定長16進(jìn)制的意通代碼,意通代碼唯一地表示當(dāng)前庫當(dāng)前記錄內(nèi)各語種構(gòu)件相同的語意。
4. 一種基于語句構(gòu)件的多語種專業(yè)翻譯方法,其特征是包括如下步驟51. 當(dāng)讀入源語句得到句型庫、艙模庫和意群串庫全方位支持時(shí),自動(dòng)給出(703)當(dāng)前目語句子,接受用戶便捷式校改;52. 當(dāng)讀入源語句得到句型庫支持和艙模庫、意群串庫的部分支持時(shí),接受干預(yù)、半自動(dòng)給出(704)當(dāng)前目語句子,接受用戶校改;S3. 當(dāng)讀入源語句沒有得到句型庫支持,查無匹配句型時(shí),調(diào)用記憶庫如果獲得支持、 給出當(dāng)前目語句參考,機(jī)輔式給出(705)當(dāng)前目語句子;S4. 當(dāng)讀入源語句沒有得到句型庫支持、也沒有得到記憶庫的支持時(shí),利用意群串庫的 部分支持人工式給出(706)當(dāng)前目語句子;S5. 在專業(yè)翻譯過程中相關(guān)庫內(nèi)容進(jìn)行自動(dòng)或半自動(dòng)積累,在專業(yè)翻譯活動(dòng)前、后進(jìn)行 庫擴(kuò)充、統(tǒng)計(jì)優(yōu)化、專業(yè)劃分或?qū)I(yè)翻譯初始準(zhǔn)備。
5. 根據(jù)權(quán)利要求4所述的多語種專業(yè)翻譯方法,其特征是自動(dòng)給出當(dāng)前目語句子的步驟 Sl進(jìn)一步包括如下步驟S101. 用讀入的源語句査詢習(xí)語庫,如果是,直接給出目語小習(xí)語句,如果否、査詢記 憶庫,無,續(xù)S102,是,將源語100%相似句對(duì)的目語句直接給出;S102. 根據(jù)讀入的源語句查詢句型庫,取唯一或最長,用該記錄的源語句型將讀入的源 語句對(duì)號(hào)入座地套入,用該記錄的目語句型作為自動(dòng)給出當(dāng)前句子的框架;S103. 依次取出被套入源語句型的句艙內(nèi)容査詢艙模庫,有、取唯一或最長,用該記錄 的源語艙模將該句艙內(nèi)容對(duì)號(hào)入座地套入,用該記錄的目語艙模作為自動(dòng)給出當(dāng)前句艙的框 架并置入到句型框架相應(yīng)的位置;S104. 依次取出被套入源語句型、艙模中的簡(jiǎn)單句艙或艙眼內(nèi)容,逐詞條査詢意群串庫, 將査得的目語所有解釋連同當(dāng)前的句艙或艙眼標(biāo)號(hào)存入反悔庫,取其一作為預(yù)選置入目語框 架相應(yīng)位置;S105. 將已經(jīng)由目語句型、艙模構(gòu)成的框架并填入了預(yù)選目語解釋的自動(dòng)給出當(dāng)前目語 句子連同句艙、艙眼標(biāo)號(hào)顯示給出,如果某句艙或某艙眼以及它們的內(nèi)容校改庫有記錄的, 根據(jù)校改庫信息更正后再給出,等待用戶的便捷式校改并作個(gè)備份句;S106. 當(dāng)用戶點(diǎn)擊不滿意的目語預(yù)選解釋時(shí),列出反悔庫中相同句艙、艙眼和串次的所 有解釋接受用戶點(diǎn)擊另選,置換預(yù)選解釋;S107. 當(dāng)用戶點(diǎn)擊某個(gè)目語預(yù)選解釋后點(diǎn)擊向前或向后位移命令按鈕時(shí)將該目語解釋向 前或向后置換一個(gè)串位;S108. 當(dāng)用戶點(diǎn)擊返回命令按鈕時(shí),當(dāng)前目語句子確定,與備份句不同的句艙或艙眼內(nèi) 容以及相關(guān)的句型、句艙、艙眼標(biāo)號(hào)信息納入校改庫,棄去所有句艙、艙眼標(biāo)號(hào),將其自動(dòng) 給出并尾加于譯文文件;5109. 清空反悔庫,讀入下一個(gè)源語句子,接續(xù)步驟S101。
6. 根據(jù)權(quán)利要求4所述的多語種專業(yè)翻譯方法,其特征是半自動(dòng)給出當(dāng)前目語句子的 步驟S2進(jìn)一步包括如下步驟S201. 根據(jù)讀入的源語句査詢句型庫,有二或多個(gè)匹配句型時(shí),接受用戶點(diǎn)選千預(yù),然 后用該記錄的源語句型將讀入的源語句對(duì)號(hào)入座地套入,用該記錄的目語句型作為半自動(dòng)給 出當(dāng)前句的框架;S202. 依次取出被套入源語句型的句艙內(nèi)容査詢艙模庫,有二或多個(gè)艙模匹配時(shí),接受 用戶點(diǎn)選干預(yù),然后用該記錄的源語艙模將該句艙內(nèi)容對(duì)號(hào)入座地套入,用該記錄的目語艙 模作為半自動(dòng)給出當(dāng)前句艙的框架并置入到句型框架相應(yīng)的位置,如果沒有符合艙模的復(fù)雜 句艙暫且不作為;S203. 依次取出被套入源語句型、艙模中的簡(jiǎn)單句艙或艙眼內(nèi)容,逐詞條査詢意群串庫,將査得的目語所有解釋連同當(dāng)前的句艙或艙眼標(biāo)號(hào)存入反悔庫,取其一作為預(yù)選置入目語框架相應(yīng)位置,如果出現(xiàn)意群串庫未登錄的詞條,即時(shí)加入或啟動(dòng)外詞典連接,在用戶的干預(yù)下登錄到本方法的意群串庫;S204. 將已經(jīng)由目語句型、艙模構(gòu)成的框架并填入了預(yù)選目語解釋的當(dāng)前目語句子連同句艙、艙眼標(biāo)號(hào)顯示給出,如果某句艙或某艙眼以及它們的內(nèi)容校改庫有記錄的,根據(jù)校改庫信息更正后再給出,準(zhǔn)備接受用戶校改并作好備份句;S205. 當(dāng)用戶點(diǎn)擊不滿意的目語預(yù)選解釋時(shí),列出反悔庫中相同句艙、艙眼和串次的所有解釋接受用戶點(diǎn)擊另選,置換預(yù)選解釋,如果用戶對(duì)根據(jù)反悔庫所列的待選解釋都不滿意,接受用戶添加解釋并納入意群串庫;S206. 當(dāng)用戶點(diǎn)擊某個(gè)目語預(yù)選解釋后點(diǎn)擊向前或向后位移命令按鈕時(shí)將該目語解釋向前或向后置換一個(gè)串位;S207. 在S202步驟當(dāng)中因沒有符合艙模而不作為的句艙,突出顯示并接受用戶人工編輯該句艙目語內(nèi)容;S208. 當(dāng)用戶點(diǎn)擊返回命令按鈕時(shí),確定給出當(dāng)前目語句子,跳開不作為句艙,其它與備份句不同的句艙或艙眼內(nèi)容連同句型、句艙、艙眼標(biāo)號(hào)信息納入校改庫,最后棄去所有句艙、艙眼標(biāo)號(hào),將其給出并尾加于譯文文件;S209. 清空反悔庫,提示用戶應(yīng)當(dāng)對(duì)S202步驟不作為句艙補(bǔ)作艙模,如果應(yīng)答是,跳轉(zhuǎn)S507作艙模;S210. 如果應(yīng)答否,讀入下一個(gè)源語句子,接續(xù)步驟S1。
7. 根據(jù)權(quán)利要求4所述的多語種專業(yè)翻譯方法,其特征是給出當(dāng)前目語句參考、機(jī)輔式給出當(dāng)前目語句子的步驟S3進(jìn)一步包括如下步驟S301. 當(dāng)根據(jù)讀入的源語句査詢句型庫,無匹配句型時(shí),再用讀入的源語句査詢記憶庫,如果有相似記錄,把它們羅列于臨時(shí)庫,計(jì)算它們的相似度;S302. 選相似度最大記錄的目語字段內(nèi)容作為目語參考句給出,同時(shí)將該記錄的使用頻度字段之值加一;S303. 接受用戶編輯、校改,當(dāng)用戶點(diǎn)擊返回命令按鈕后,作為當(dāng)前目語句給出并尾加于譯文文件;S304. 提示用戶制作句型,如果應(yīng)答是,續(xù)步驟S501制作句型;S305. 如果應(yīng)答否,讀入下一個(gè)源語句子,接續(xù)步驟S1。
8. 根據(jù)權(quán)利要求4所述的多語種專業(yè)翻譯方法,其特征是利用意群串庫的部分支持人工式給出當(dāng)前目語句子的步驟S4進(jìn)一步包括如下步驟-S40L當(dāng)根據(jù)讀入的源語句查詢句型庫,無匹配句型,再查詢記憶庫,又沒有相似記錄時(shí),依次取出讀入的源語句所有詞串,逐條詞串査詢意群串庫,將査得的目語所有解釋連同當(dāng)前串序號(hào)存入反悔庫,取其一作為目語預(yù)選解釋按序排列構(gòu)成目語參考句,和同讀入的源語句上下兩行顯示;S402.當(dāng)用戶點(diǎn)擊參考句不對(duì)的目語預(yù)選解釋時(shí),列出反悔庫中相同串序的所有解釋接受用戶點(diǎn)擊另選,置換預(yù)選解釋;s403. 給出一個(gè)可編輯框,接受用戶編輯、校改,當(dāng)用戶點(diǎn)擊返回命令按鈕時(shí)確定為當(dāng) 前目語句給出并尾加于譯文文件;s404. 清空反悔庫,提示用戶制作句型,如果應(yīng)答是,后續(xù)步驟S501制作句型;s405. 如果應(yīng)答否定,將當(dāng)前源語句子、目語句子分別存入記憶庫相應(yīng)字段,讀入下一 個(gè)源語句子,接續(xù)歩驟S1。
9. 根據(jù)權(quán)利要求4所述的多語種專業(yè)翻譯方法,其特征是步驟S5所述在專業(yè)翻譯過程 中相關(guān)庫內(nèi)容進(jìn)行自動(dòng)或半自動(dòng)積累進(jìn)一步包括如下步驟s501. 將讀入的源語句和確定的當(dāng)前目語給出句作為句對(duì)例顯示,接受用戶挖句艙操作 如果源語、目語都缺句型的接續(xù)步驟S502,如果源語有句型只是目語缺句型的接續(xù)步驟S505;s502. 當(dāng)用戶點(diǎn)擊挖句艙命令按鈕后,在源語句和目語句用戶點(diǎn)擊的兩個(gè)至少相隔一個(gè) 詞條的點(diǎn)作為一個(gè)句艙,挖去其中內(nèi)容,標(biāo)以[A],相似操作依操作次序標(biāo)以[B]、 [C]……;s503. 當(dāng)用戶點(diǎn)擊存句型命令按鈕后,對(duì)挖去句艙所剩部份作為句型,進(jìn)行格式檢査, 通過后以源語結(jié)構(gòu)次序從左到右以{1}、 {2}、 {3}替換原以操作次序"]、[B]、 [C]的標(biāo)注, 目語以句艙語意相應(yīng)標(biāo)號(hào)相同,最后分別存入句型庫相應(yīng)的源語句型字段和目語句型字段;s 504. 如果當(dāng)前源語句、目語句太短,不便以上操作劃分出句型、句艙,用戶沒有點(diǎn)擊 挖句型而直接點(diǎn)擊存句型命令按鈕時(shí),把當(dāng)前源語、目語句子作為小習(xí)語,分別存入習(xí)語庫 相應(yīng)字段;s505. 將讀入的源語句對(duì)號(hào)入座地套入源語句型,依次取出句艙內(nèi)容,査詢意群串庫, 取與目語句一致的解釋確定為當(dāng)前句艙的首、尾點(diǎn)以及當(dāng)前句艙內(nèi)容,用型例結(jié)合型式顯示, 當(dāng)前句艙全部匹配完成后,接受用戶確定或糾正,然后復(fù)制當(dāng)前源語的句艙標(biāo)號(hào)作為目語當(dāng) 前句艙標(biāo)號(hào),直至完成全句的類似操作;s506. 當(dāng)用戶點(diǎn)擊存句型命令按鈕后,抽出目語句型,進(jìn)行格式檢査,通過后存入句型 庫與當(dāng)前源語句型相同記錄的目語句型字段;s507. 將當(dāng)前源語、目語句例分別套入當(dāng)前源語、目語句型,依次檢査每個(gè)句艙內(nèi)容是否 超出簡(jiǎn)單句艙的規(guī)定,如果超出將當(dāng)前句艙的源語、目語上下行顯示,接受用戶挖艙眼操作;s508. 當(dāng)用戶點(diǎn)擊挖艙眼命令按鈕后,在源語句艙和目語句艙用戶點(diǎn)擊的兩個(gè)至少相隔 一個(gè)詞條的點(diǎn)作為一個(gè)艙眼,挖去其中內(nèi)容,標(biāo)以[A],相似操作依操作次序標(biāo)以[B] 、 [C]……;s509. 當(dāng)用戶點(diǎn)擊存艙模命令按鈕后,對(duì)挖去艙眼所剩部份作為艙模,進(jìn)行格式檢査, 通過后以源語結(jié)構(gòu)次序從左到右以[l]、 [2]、 [3]替換原以操作次序[A]、 [B]、 [C]的標(biāo)注, 目語以艙眼語意相應(yīng)標(biāo)號(hào)相同,最后分別存入艙模庫相應(yīng)的源語艙模字段和目語艙模字段;s510. 清除制作句型、艙模的相關(guān)顯示,進(jìn)行判別返回調(diào)用者或讀入下一個(gè)源語句子, 接續(xù)步驟S1。
10. 根據(jù)權(quán)利要求4所述的多語種專業(yè)翻譯方法,其特征是在遠(yuǎn)行步驟Sl前有庫擴(kuò)充 命令按鈕在待命、遠(yuǎn)行步驟S1、 S2、 S3、 S4的適當(dāng)區(qū)間有擴(kuò)查詞命令按鈕在待命,進(jìn)一步包 括如下步驟s01.當(dāng)庫擴(kuò)充命令按鈕被點(diǎn)擊;s02.搜索記憶庫、取出最高頻度記錄的源、目語句例對(duì),當(dāng)前記錄作刪除標(biāo)志,跳轉(zhuǎn)S501 作句型;s03.繼續(xù)s02.步驟,僅當(dāng)庫擴(kuò)充命令按鈕再次被點(diǎn)擊,返回到遠(yuǎn)行步驟S1前斷點(diǎn);s04.當(dāng)用戶選定源語一條或若干詞串后點(diǎn)擊擴(kuò)査詞命令按鈕,進(jìn)行判斷;s05.當(dāng)所選是若干條詞串,以它們的各種可能排列査詢意群串庫,把它們的排列和同目語的所有解釋列表給出,同時(shí)顯示選復(fù)、改饋復(fù)命令按鈕;s06.當(dāng)用戶點(diǎn)擊列表中某項(xiàng)后點(diǎn)擊了選復(fù)命令按鈕,把源語相應(yīng)詞條以"_"連成復(fù)詞,以該項(xiàng)目語解釋置換原有解釋,s07.當(dāng)修改了列表中某項(xiàng)后點(diǎn)擊了改饋復(fù)命令按鈕,將該修改項(xiàng)作為新增復(fù)詞及其解釋存入意群串庫的復(fù)詞分庫;s08.當(dāng)所選是一條詞串,先査詢不規(guī)則詞表,再根據(jù)詞尾變化規(guī)律作出可能的變形和原形詞條,以它們分別査詢意群串庫,把源語詞條的原形或變形和同它們的目語所有解釋列表給出,同時(shí)顯示選單、改饋單命令按鈕;s09.當(dāng)用戶點(diǎn)擊列表中某項(xiàng)后點(diǎn)擊了選單命令按鈕,以該項(xiàng)目語解釋置換原有解釋;s10.當(dāng)用戶修改了列表中某項(xiàng)后點(diǎn)擊了改饋單命令按鈕,將該修改項(xiàng)作為新增解釋存入意群串庫的單詢分庫,判斷并返回命令按鈕被擊中斷點(diǎn)。
全文摘要
一種語句構(gòu)件裝置和一種基于語句構(gòu)件的多語種專業(yè)翻譯方法。裝置含句型庫、艙模庫、意群串庫和習(xí)語庫;庫內(nèi)語句構(gòu)件是大小不等的語義塊,有構(gòu)架也有組件。基于語句構(gòu)件的多語種專業(yè)翻譯方法根據(jù)四種庫的不同支持程度,可自動(dòng)給出目語句子或半自動(dòng)給出目語句子;有機(jī)地結(jié)合現(xiàn)有技術(shù)基于句對(duì)記憶庫的機(jī)輔式給出目語句子。拓展翻譯記憶,在“相同的句子永遠(yuǎn)不需要翻譯第二遍”的同時(shí);使“具有相同句型的句子可以進(jìn)行自動(dòng)或半自動(dòng)語意一致的機(jī)器翻譯”。提高翻譯自動(dòng)化程度的同時(shí),又降低對(duì)操作者外語程度的要求。在專業(yè)翻譯過程中,以及過程的前、后,可自動(dòng)或半自動(dòng)地進(jìn)行庫擴(kuò)充,越用越好。
文檔編號(hào)G06F17/28GK101510194SQ20091012909
公開日2009年8月19日 申請(qǐng)日期2009年3月15日 優(yōu)先權(quán)日2009年3月15日
發(fā)明者劉樹根 申請(qǐng)人:劉樹根