两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

機器輔助翻譯工具的制作方法

文檔序號:6419044閱讀:490來源:國知局
專利名稱:機器輔助翻譯工具的制作方法
背景技術(shù)
1.發(fā)明領(lǐng)域本方面涉及文本和語言的機器處理過程,特別涉及一種方法和裝置,其中包括一種用于機器輔助翻譯或機器翻譯的軟件實現(xiàn)。
2.討論相關(guān)技術(shù)將文本從一種語言翻譯成另一種語言一般是一項需要有經(jīng)驗的翻譯的乏味工作。在出現(xiàn)計算機不久以后,研究人員就開始利用計算機來幫助進行自然語言的翻譯。最早的機器翻譯(MT)系統(tǒng)取決于大的雙語詞典,其中記錄了對應(yīng)于一個或多個目標語言(TL)同義詞的源語言(SL)詞匯。很快,顯然由于該詞典的句法和語法規(guī)則是如此復(fù)雜,以致專家不能開發(fā)出一個可描述的綜合規(guī)則集,從而放棄了機器翻譯。
但是整個世界中的多語言文化和多國家貿(mào)易產(chǎn)生了對翻譯服務(wù)的需求。翻譯商業(yè)和技術(shù)文獻的需求體現(xiàn)了一個大的、日趨增長的翻譯市場。這些文獻包括合同、使用手冊、表格和計算機軟件。通常在一個產(chǎn)品或服務(wù)被定位于一個新市場時,大量的文獻必須被翻譯,從而產(chǎn)生了效能成本合算的翻譯需求。由于商業(yè)和技術(shù)信息經(jīng)常是詳細而精確的,所以繼而需要準確的翻譯。
機器翻譯(MT)系統(tǒng)一般被分為直接翻譯、基于轉(zhuǎn)換的翻譯或基于中間語言的翻譯。在直接翻譯方法中,源語言和目標語言之間沒有中間表現(xiàn)形式。源語言文本被“直接”處理以將其轉(zhuǎn)換為目標文本。這種處理基本上是一種字對字的翻譯,同時進行一些調(diào)整。但是由于忽略句子內(nèi)部結(jié)構(gòu)的所有方面而導(dǎo)致的明顯缺陷使得目前的任何MT系統(tǒng)都不采用這種方法。
在基于轉(zhuǎn)換的翻譯方法中,來自對源文本的不同分析級別的信息被轉(zhuǎn)換成生成的目標文本級別。例如,通過設(shè)置在詞法級、語法級或由語法構(gòu)建而成的結(jié)構(gòu)級等的對應(yīng)關(guān)系來實現(xiàn)轉(zhuǎn)換。轉(zhuǎn)換方法只適用于特定的語言對,因此必須特別和費心地生成每個語言對。
基于中間語言的翻譯方法的基礎(chǔ)是假設(shè)能夠定義一種合適的中間表達形式,使源文本能夠映射到該中間表達形式,而中間表達形式再映射到目標文本。在理論上,這種方法顯然很吸引人,因為與基于轉(zhuǎn)換的方法不同,其不必為每個語言對構(gòu)建獨立的轉(zhuǎn)換程序。但在是否能夠產(chǎn)生一種真正的語言獨立中間表達形式是不清楚的。當(dāng)前的基于中間語言的系統(tǒng)對其所宣稱的中間表達形式的普遍性少有信心。對于高質(zhì)量的翻譯來說,經(jīng)常需要涉及源和目標語言的某些特定方面。
在基于轉(zhuǎn)換的方法中,近期已有了一些進展。在開發(fā)語法的數(shù)學(xué)和計算模型過程中,越來越注重于通過與詞法項相關(guān)的結(jié)構(gòu)將句法以及語義信息直接定位到詞法項并定義用于組成這些對象的操作。在這個角度上,所有與語言相關(guān)的特定信息都被密封到詞法項和與其相關(guān)的結(jié)構(gòu)中。在這個級別區(qū)分不同的語言,但與組成這些結(jié)構(gòu)的操作無關(guān),其對所有的語言都是一樣的。然后此方法在這一級定義所有的雙語對應(yīng)關(guān)系。這種方法是否能夠在多種不同的語言中執(zhí)行還拭目以待。
一些現(xiàn)有的MT系統(tǒng)需要以高度受限的文本編寫文獻。這些系統(tǒng)對于以不同的語言編寫手冊是有用的。此時,該系統(tǒng)并不是將以一種自然語言寫成的手冊翻譯成一系列其它自然語言,而是從一個高度受限的文本生成多語言文本,從而避免了現(xiàn)有MT中的很多問題。
最近,研究已經(jīng)集中在利用機器輔助翻譯人員的方式而不是自主執(zhí)行翻譯過程。這種方法被稱為機助人譯(MAHT)。系統(tǒng)在利用由翻譯人員完成的預(yù)翻譯片段來產(chǎn)生商業(yè)通信的高質(zhì)量翻譯方面是可用的。機器輔助翻譯工具的一個例子是翻譯存儲器(TM)系統(tǒng)。翻譯存儲器系統(tǒng)將創(chuàng)造性的工作留給翻譯人員,但是它們能夠從翻譯人員處進行學(xué)習(xí),并且它們通過自動提示現(xiàn)有的翻譯和術(shù)語來積極地支持翻譯過程。一個翻譯存儲器是一個數(shù)據(jù)庫,該數(shù)據(jù)庫在執(zhí)行翻譯時收集這些翻譯以及源語言同義詞。在執(zhí)行并在翻譯存儲器中存儲了一定數(shù)量的翻譯之后,能夠訪問該翻譯存儲器來輔助新的翻譯過程,其中新的翻譯過程包括與已經(jīng)包括在翻譯存儲器中的文本相同或相似的源語言文本。
這種系統(tǒng)的優(yōu)點在于其在理論上平衡了現(xiàn)有的MT技術(shù),使翻譯人員在不犧牲由翻譯人員所提供的傳統(tǒng)準確性的前提下更為有效。該系統(tǒng)通過確保翻譯人員不會將相同的源文本翻譯兩次來使翻譯過程更為有效。在一個翻譯人員工作的同時,翻譯存儲器在后臺工作以“學(xué)習(xí)”原句及其相應(yīng)的譯句。在此過程中,這個數(shù)據(jù)可被鏈接到神經(jīng)網(wǎng)絡(luò)中。稍后,翻譯存儲器快速找到相同或相似的句子并將其作為生成新譯句的工作基礎(chǔ)而自動顯示。這樣,翻譯存儲器確保了沒有句子需要被翻澤兩次。
翻譯存儲器在不僅能夠定位于相同匹配,而且能夠定位于相似或“模糊”匹配時最為有用。模糊匹配使對在詞序、詞法、格或拼寫上稍有不同的文本的檢索變得容易。相似匹配是必需的,因為在自然語言文本中可能有較大的區(qū)別。通過神經(jīng)網(wǎng)絡(luò)技術(shù),看到了用于找到具有相似內(nèi)容的句子的模糊匹配的最佳性能。除由存儲器自動提示方法以外,翻譯人員還具有在多種可替換的翻譯方法中進行選擇的選擇權(quán)。與原句及其譯句一起,每個翻譯單元還存儲關(guān)于用戶、使用日期和頻率、分類屬性以及文本字段的信息。這些信息使隨著時間日益增大的翻譯存儲器易于維護。
詞匯索引是翻譯人員通常使用的另一種工具。電子詞匯索引具有文本串,即字、短語或句子,它們與該字在一個特定文獻這出現(xiàn)的語境相匹配。當(dāng)一個翻譯人員不確定一個給定字的意思時,詞匯索引能夠演示該字是如何在幾個不同的語境中使用的。此信息文體感了一個更正確的譯句選擇以準確地反映一個源語言文獻的意思。電子詞匯索引包括文本查找軟件,改軟件允許翻譯人員將所有文本串提取到一個包含所需字或短語的庫中??焖贆z查提取出的文本串以更清楚地理解一個特殊的字或短語是如何在上下文中使用的。
多語言自然語言處理體現(xiàn)了在國際商業(yè)和通信領(lǐng)域中日益增長的需求和機會。機器輔助翻譯工具需要使文獻翻譯更加高效和低成本。而且,機器輔助翻譯工具需要有效地平衡(leverage)所存儲的大量可用知識作為預(yù)翻譯的商業(yè)和技術(shù)文獻。具體地,需要一個語言獨立的翻譯存儲器工具并提供對預(yù)翻譯資料的準確而快速的模糊檢索。
迄今為止,被認為是一個可確定位置(placeable)的文本必須由翻譯人員進行翻譯和手工輸入??纱_定位置經(jīng)常在譯本或一個轉(zhuǎn)換后的形式中被重新使用。這種可確定位置的例子為專有名詞,標題和名稱,日期,時間,單位和度量,編號,格式信息,諸如文本中的標記或轉(zhuǎn)義序列,類型,圖形,超級鏈接,前后對照,自動字段,或其它任何種類沒有關(guān)于上下文知識的沒有被翻譯但被轉(zhuǎn)換的信息??纱_定位置的翻譯是費時的,并且在進行諸如將現(xiàn)金從美元轉(zhuǎn)換成人民幣和將速度從每小時的英里數(shù)轉(zhuǎn)換成每小時的公里數(shù)時可能出現(xiàn)錯誤。這就需要一個程序,其識別被看作可確定位置的文本,進行必要的轉(zhuǎn)換并將該可確定位置插入到目標文本中。
發(fā)明概述本發(fā)明提供了一種用于將一種源語言翻澤成目標語言的改進方法和裝置。本發(fā)明利用可確定位置,通過促進目標語言中可確定位置的自動或半自動替代,并依據(jù)目標地區(qū),如“德語-標準”進行一些必要的轉(zhuǎn)換來輔助一個翻譯人員。這里所用的可確定位置是一個術(shù)語,它指定不需要翻譯成目標語言的數(shù)據(jù)或在某些情況下特別適合半自動替代的數(shù)據(jù)類型(例如專有名詞,標題和名稱,諸如標記、轉(zhuǎn)義序列、類型、圖形之類的格式信息)和需要進行不改變數(shù)據(jù)上下文的翻譯的數(shù)據(jù)(例如物理和現(xiàn)金單位,時間區(qū),日期格式,超級鏈接等)。此外,一個可確定位置可能更加復(fù)雜和高深。例如,通過專門的詞典和/或為翻譯指定的全部信息的上下文或環(huán)境信息,例如在化學(xué)環(huán)境、汽車環(huán)境、音樂歌詞、法律環(huán)境中的數(shù)據(jù),來確定一個可確定位置。上下文和環(huán)境信息將決定如何翻譯特定術(shù)語??衫靡粋€源可確定位置標識符,根據(jù)與可確定位置的上下文和環(huán)境相關(guān)的源詞匯索引來識別源信息中的可確定位置,例如源區(qū)(locale)。在翻譯存儲器中,可確定位置可被轉(zhuǎn)換成一種語言獨立格式,例如元表示法。該語言獨立格式允許翻譯存儲器將可確定位置轉(zhuǎn)換成任何目標語言,因為該格式對所有地區(qū)公用。在轉(zhuǎn)換成獨立格式之后,可確定位置被自動或半自動地置于目標譯句中。一個目標可確定位置轉(zhuǎn)換器用于根據(jù)與可確定位置的上下文和環(huán)境相關(guān)的目標詞匯索引將可確定位置轉(zhuǎn)換成目標信息,例如目標地區(qū)。
依據(jù)本發(fā)明,一個系統(tǒng)可標識一個可確定位置并確定其類型以便易于對該可確定位置的后續(xù)操作,典型地就是易于確定該可確定位置的位置、轉(zhuǎn)換或翻譯??赏ㄟ^一個基于規(guī)則的處理來完成一個可確定位置的識別和其類型的確定。另外,可通過或借助于一個有限狀態(tài)機來執(zhí)行識別和確定過程,諸如查表功能或逐字符確定。
在通過將源和目標單元與可確定位置信息一起存儲為模板或骨架語句來按對縮減存儲源和目標單元所需的存儲空間量,利用本發(fā)明的數(shù)據(jù)庫驅(qū)動TM中具有很大的潛力。
本發(fā)明的一個目的是通過允許將可確定位置插入到目標信息中和借助于一個目標可確定位置轉(zhuǎn)換器執(zhí)行任何所需的轉(zhuǎn)換來消除手工打字或?qū)⒖纱_定位置移動到譯句中,從而節(jié)省了一個翻澤人員將源信息翻譯成目標信息所需的工作。
本發(fā)明的另一個目的是通過自動將諸如日期和度量單位之類的可確定位置轉(zhuǎn)換成插入的目標文本,節(jié)省翻譯源文本所需的時間或工作量。
本發(fā)明的另一個目的是通過自動轉(zhuǎn)換可確定位置數(shù)據(jù)來減少在一個翻譯人員將源文本中的度量單位手動轉(zhuǎn)換成目標文本時發(fā)生的錯誤。
本發(fā)明的另一個目的時通過自動識別格式代碼并將這些代碼插入到一個目標文本中,來減少翻譯源文本所需的時間或工作量。
本發(fā)明的另一個目的是通過自動翻譯超級文本鏈接來減少將一個源文本翻譯成目標文本所需的時間或工作量。
本發(fā)明的另一個目的是將可確定位置轉(zhuǎn)換成一種語言獨立格式。
本發(fā)明的一個目的是如果適當(dāng),例如通過轉(zhuǎn)換度量單位,日期格式,現(xiàn)金值和單位,標題和名稱等,自動改變可確定位置元素的外部特征。
本發(fā)明的一個目的是在翻譯源信息時,在與用戶對話的同時,例如通過一個或多個按鍵,一個或多個口頭命令,單擊或雙擊鼠標等方式,半自動地將可確定位置元素插在目標文本中的一個用戶定義的位置上。
本發(fā)明的一個目的是借助于參考資料或其它機器可計算信息,自動插入可確定位置元素,這些資料或信息允許機器不與用戶對話即可確定插入位置。
本發(fā)明的一個目的是可利用人工翻譯或翻譯存儲器。
附圖簡要說明

圖1示出了本發(fā)明的一個實施例;圖2示出了本發(fā)明的另一個實施例;圖3示出了本發(fā)明的另一個實施例;
圖4示出了本發(fā)明的另一個實施例;圖5示出了本發(fā)明的另一個實施例。
優(yōu)選實施例的詳細說明可利用多種商業(yè)上可用的語言翻譯計算機軟件程序來實現(xiàn)本發(fā)明。本發(fā)明可與一個翻譯存儲器一同工作,但翻譯存儲器并不是必需的。有利的是,該系統(tǒng)將支持至少兩種語言。
首先,系統(tǒng)接收輸入或以不同方式(例如數(shù)據(jù)文件,掃描數(shù)據(jù),聲音記錄,語音命令等)檢索到的輸入源翻譯信息,諸如文本數(shù)據(jù)或聲音數(shù)據(jù)。程序可將源翻譯信息分成語言形式或數(shù)據(jù)翻譯單元。這是通過將源翻譯信息分段為字、句或段而實現(xiàn)的。這個過程可由系統(tǒng)指定或由用戶指定。
人工翻譯圖1示出了在翻譯人員不使用翻譯存儲器時依據(jù)本發(fā)明的一個過程的流程圖。最初,輸入的源翻譯信息被分成分段,例如句。分段的元素被提供給位置(110)上的處理器。系統(tǒng)確定一個元素是否被認為是一個可確定位置(120)。在翻譯文本的同時,系統(tǒng)告知翻譯人員一個數(shù)據(jù)元素是一個可確定位置并允許翻譯人員將這個可確定位置插入到目標文本(130)中。此時,系統(tǒng)還可確定可確定位置的類型以便輔助翻譯人員。類型信息可以任何適當(dāng)形式,例如通過一個引導(dǎo)信號、顏色、字體變化等,提供給翻譯人員。在這種方法中,翻譯人員可依據(jù)一個或多個按鍵,依據(jù)一個或多個口頭命令,依據(jù)鼠標等確定可確定位置被插入的位置。如果該可確定位置需要向目標信息的轉(zhuǎn)換,在用戶選擇將可確定位置拉到目標文本(140)中時,這個系統(tǒng)被設(shè)置為根據(jù)類型自動指揮可確定位置。這個轉(zhuǎn)換過程由一個目標可確定位置轉(zhuǎn)換器依據(jù)目標輸出的位置信息(例如根據(jù)目標環(huán)境/上下文的目標地區(qū),目標詞典)來執(zhí)行。人工翻譯可在Windows環(huán)境下執(zhí)行。
翻譯存儲器翻譯存儲器在翻譯信息時被用作參考。圖2示出了一個用于管理在利用翻譯存儲器進行翻譯時的參考資料的商業(yè)可用軟件程序。參考資料是文本集合,一般為兩種或更多種語言,而以前被翻譯的源文本單元與目標文本單元相關(guān)。指定進行翻譯的輸入信息被認為是源翻譯信息。如上面所提到的,翻譯存儲器在它們不僅可探測相同匹配,而且可以探測相近或“模糊匹配”時最為有用。模糊匹配有利于檢索與源翻澤信息稍有不同的文本。翻澤存儲器能夠向翻譯人員提供指明檢索到的建議信息與源翻譯信息如何接近的信息。這個信息可以以一個數(shù)字,例如百分比的形式散布。在一個要翻譯的文本(即源翻譯信息)單元與出現(xiàn)在翻譯存儲器中的源文本單元相同或非常相似并且以前已經(jīng)對其進行了準確翻譯的情況下,一個檢索系統(tǒng)將存儲在翻譯存儲器中的參考資料作為目標文本進行顯示。然后翻譯人員復(fù)制這個參考單元并對其進行修改以適應(yīng)新的源翻譯信息。在現(xiàn)有的系統(tǒng)中,如果一個出現(xiàn)在要翻譯的文本中的可確定位置不同于翻譯存儲器源文本的對應(yīng)元素,翻譯人員需要進行人工轉(zhuǎn)換,如果有必要要將可確定位置數(shù)據(jù)翻譯或轉(zhuǎn)換成目標信息。
翻譯軟件的用戶接口提供了一個用于為翻譯人員顯示不同項的程序窗口(200)。這個特殊的例子同時示出了翻譯軟件程序窗口(210)和一個字處理器的程序窗口(240)使得用戶能夠在翻譯過程中看到整個源翻譯信息或感興趣的更小單元。項(240)也可在翻譯過程中顯示最終的目標信息,例如譯本。項(210)示出了一個一個區(qū)域(220),其中翻譯程序可顯示指定進行翻譯的源翻譯信息的語言形式或數(shù)據(jù)翻譯單元。另外,窗口(210)可在利用翻譯存儲器工具(230)時顯示一些建議的用于該語言形式的譯句。
圖3和圖5示出了利用一個翻譯存儲器時的本發(fā)明。首先,源翻譯信息的語言單位被進一步分成標記或源元素。一旦將一個源元素標識為可確定位置(310),就確定其類型(330)(即日期、時間、鏈接等),然后將該可確定位置轉(zhuǎn)換成一種語言獨立格式(340),例如元表示,或直接被轉(zhuǎn)換成一種目標語言或地區(qū)。元表示(420,520)允許該系統(tǒng)將可確定位置轉(zhuǎn)換成任何目標語言,因為其格式(元表示)適用于所有地區(qū)??梢愿鶕?jù)任何目標地區(qū)來轉(zhuǎn)換元表示以產(chǎn)生一個目標可確定位置(360)。此時,可確定位置可被插入到目標語言中并可自動或半自動地進行任意轉(zhuǎn)換。
考慮下面的句子為“A man,called Mr.Miller,left hisapartment on the 25thof January in a car that is capable ofdriving at speeds above 160 mph.”。一個機器翻譯程序在確定是“一個人與Miller先生打電話”還是“一個人”與“Miller先生”為同一個人的問題上遇到很大的困難。這個問題只能通過理解上下文來回答。換言之,如果只單獨看“called”這個詞,實際上是不可能正確翻譯這個句子的。但是,如果這個標記(410)為“A man,calledMr.Miller”,那么你(或一臺機器)就能夠提出有意義的譯句了。圖3示出了本發(fā)明如何處理這個句子以及在一個可確定位置首次被標識時如何進行處理。有三個被標識的可確定位置Mr.Miller、25thofJanuary和160mph。
當(dāng)系統(tǒng)將前述文本作為要翻譯的文本(例如,源翻譯信息)的部分輸入顯示時,該系統(tǒng)首先對該文本分段,最好分成句子。然后方便地對上述句子進行標記。依據(jù)本發(fā)明的一個實施例,其可被標記成與源翻譯句子中的字或短語對應(yīng)的元素。該標記化過程考慮根據(jù)基于規(guī)則的提問和/或利用諸如查詢表之類的有限狀態(tài)工具是否可以將這些元素標識為可確定位置。然后將確定被標識為可確定位置的元素的類型。也可以通過基于規(guī)則的提問和/或利用表之類的有限狀態(tài)處理來完成這個確定過程。標記化裝置的輸出將包括不確定位置元素和任何可確定位置元素的類型指示。這個輸出可被提供給一個翻譯存儲器以便定位在以前已被翻譯的任何相同或相似的分段。系統(tǒng)根據(jù)翻譯存儲器中的以前被翻譯的目標文本和根據(jù)具有或不具有可確定位置元素轉(zhuǎn)換的直接位置,提出一個譯句。系統(tǒng)可通過諸如個人電腦之類的通用計算機中的軟件而實現(xiàn)。
可確定位置的確定可是一種利用一個基于規(guī)則的系統(tǒng)/有限狀態(tài)系統(tǒng)的一步或兩步方法。一步方法也可通過利用一個能夠看到整個標記的基于規(guī)則的系統(tǒng)確定其類型而實現(xiàn)。例如,這個標記是一個日期?是一個專有名詞?是一個超級鏈接?兩步方法則首先確定該標記是否是一個可確定位置,然后確定其類型。這可利用一個有限狀態(tài)過程來實現(xiàn),該有限狀態(tài)過程一次檢查一個標記的每個字符,直到實現(xiàn)一個確定過程為止。
一個可確定位置的識別特征之一是其含義不可能隨上下文而變。這種可確定位置包括可直接用在一個譯句中的類型,例如數(shù)字或圖形。另一種可確定位置可在轉(zhuǎn)換之后使用,諸如與單位匹配的數(shù)字。例如,一個以“62英里/小時”的形式出現(xiàn)的可確定位置可被轉(zhuǎn)換成“100公里/小時”。通過公式即可從一個譯句中區(qū)分出這種轉(zhuǎn)換。一個公式轉(zhuǎn)換適用于上下文不可能影響翻譯的情況。
下面的例子示出了包括一個另一種源文本的相似可確定位置的文本翻譯。該翻譯存儲系統(tǒng)包括下述源文本單元,外加其依據(jù)參考文件而得到的譯句翻譯存儲器源文本單元“A man,called Mr.Smith,left hisapartment on the 1stof April in a car that is capable of drivingat speeds above 100mph.”翻譯存儲器目標文本單元(德語)“Ein Mann,namens Herr Smith,verliess sein Apartment am 1.April in einem Auto,dasschneller als 160km/h fahren kann.”要翻譯的新文本單元為“A man,called Mr.Miller,left hisapartment on the 25th of January in a car that is capable ofdriving at speeds above 160 mph.”如圖5所示,新的源文本單元被分成元素(510)。然后對可確定位置進行分類并將其轉(zhuǎn)換成一種語言獨立格式(520)。當(dāng)軟件能夠使翻譯存儲器目標文本單元中的三個可確定位置與翻譯存儲器源文本單元和要被翻譯的新文本中的可確定位置都相互關(guān)聯(lián)時,一個利用本發(fā)明的翻譯存儲系統(tǒng)能夠自動確定并提出這些可確定位置的插入位置,即不需要用戶的參與。在上面的例子中,該系統(tǒng)能夠確定I.在三個標記中發(fā)現(xiàn)文本單元(要翻譯的)與翻譯存儲器源文本單元(以前已經(jīng)翻譯過的相似文本)之間的唯一區(qū)別。
II.三個標記都是可確定位置。
III.在翻譯存儲器源文本單元和要翻譯的文本中,可確定位置標記的類型(即,日期、速度、姓名)是相同的。
IV.在舊的目標文本單元中,能夠發(fā)現(xiàn)完全相同的數(shù)字和可確定位置標記的類型。翻譯系統(tǒng)可建議再次使用以前的譯句(翻譯存儲器目標文本單元)并用新的姓名(=Mr.Miller)、新的日期(=25thJanuary)和新的速度(=160mph)來代替可確定位置標記。
V.該軟件能夠根據(jù)類型轉(zhuǎn)換特定的可確定位置對。在這個例子中“Herr Miller”、“25 Januar”和“280km/h”(330)。
存儲可確定位置當(dāng)今市場上有兩種類型的翻譯存儲系統(tǒng)參考文件驅(qū)動的TM和數(shù)據(jù)庫驅(qū)動的TM。參考文件驅(qū)動的TM將源文本和目標文本保存在兩個不同的位置上,通過保留彼此的參考指針列表來排列它們。在參考文件驅(qū)動的系統(tǒng)中,所有被寫過(或創(chuàng)建)的源文本單元和其所有譯句都被實際存儲和保存在文件中。在利用本發(fā)明的數(shù)據(jù)庫驅(qū)動的TM中,在只通過將文本單元作為模板或骨架語句簡單存儲,從而保存數(shù)據(jù)存儲空間方面具有很大的潛力。
權(quán)利要求
1.一種用于處理源信息的方法,包括步驟將輸入的源信息進行語法分析,解析為元素;利用預(yù)定標準對可確定位置元素進行標識;通過類型指定所述可確定位置元素。
2.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定一個源地區(qū)。
3.如權(quán)利要求1所述的處理源信息的方法,還包括步驟應(yīng)用一個源可確定位置標識符以確定所述元素的所述類型。
4.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定一個目標地區(qū)。
5.如權(quán)利要求1所述的處理源信息的方法,還包括步驟應(yīng)用一個目標可確定位置轉(zhuǎn)換器以轉(zhuǎn)換所述元素的所述類型。
6.如權(quán)利要求2所述的處理源信息的方法,還包括步驟應(yīng)用所述源地區(qū)以通過類型確定所述元素。
7.如權(quán)利要求1所述的處理源信息的方法,還包括步驟將所述元素轉(zhuǎn)換成一種語言獨立格式。
8.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否是一個專有名詞;將所述可確定位置直接置于一個目標輸出中。
9.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否是一個日期;根據(jù)一個目標地區(qū)信息,將所述日期轉(zhuǎn)換成一個目標信息。
10.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否是一個專有名詞;將所述可確定位置轉(zhuǎn)換成一種語言獨立格式。
11.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否是一個專有名詞;將所述可確定位置轉(zhuǎn)換成一種元表示。
12.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否是一個日期;將所述可確定位置轉(zhuǎn)換成一種語言獨立格式。
13.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否需要轉(zhuǎn)換。
14.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否是一個專有名詞。
15.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定所述可確定位置是否是一個日期。
16.如權(quán)利要求1所述的處理源信息的方法,還包括步驟確定用于轉(zhuǎn)換的輸出請求。
17.一種用于處理源信息的計算機驅(qū)動語言處理系統(tǒng),包括一個語法分析器;一個與所述語法分析器的輸出相連的元素標識符;一個與所述元素標識符的一個輸出相連的類型指定器。
18.一種用于處理源信息的計算機驅(qū)動語言處理系統(tǒng),包括一個語法分析器,用于將輸入的源信息進行語法分析,解析為元素;一個元素標識符,用于利用預(yù)定標準對可確定位置元素進行標識;一個類型指定器,用于通過類型指定所述可確定位置元素。
19.一種用于處理源信息的方法,包括步驟將輸入的源信息分段為元素;利用預(yù)定標準對可確定位置元素進行標識;通過類型指定所述可確定位置元素。
20.如權(quán)利要求8所述的處理源信息的方法,還包括步驟將所述可確定位置元素與一個數(shù)據(jù)集合進行比較。
21.如權(quán)利要求8所述的處理源信息的方法,還包括步驟通過類型比較所述可確定位置元素和一個數(shù)據(jù)集合。
全文摘要
本發(fā)明提供了一種改進的用于將一種源語言翻譯成一種目標語言的方法和裝置。本發(fā)明利用可確定位置(例如專有名詞、標題和姓名、日期、時間、單位和度量、數(shù)字、諸如標記或轉(zhuǎn)義序列,字體,圖形,超級鏈接之類的格式信息)來輔助翻譯人員,即不必重新輸入不需要翻譯的信息并且如果需要,提供向目標地區(qū)的轉(zhuǎn)換,例如速度。
文檔編號G06F17/28GK1308748SQ99808249
公開日2001年8月15日 申請日期1999年4月30日 優(yōu)先權(quán)日1998年5月4日
發(fā)明者J·胡梅爾, I·克尼普豪森 申請人:特雷道斯股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
江川县| 陈巴尔虎旗| 和龙市| 无为县| 万州区| 海阳市| 玉树县| 黎城县| 丰原市| 永仁县| 宝兴县| 武乡县| 大城县| 江川县| 华亭县| 辉县市| 定州市| 道孚县| 仲巴县| 德州市| 陵川县| 南川市| 清苑县| 乡城县| 四子王旗| 乐至县| 新营市| 盘锦市| 招远市| 石家庄市| 都昌县| 兰溪市| 连江县| 铜山县| 枣强县| 梓潼县| 青铜峡市| 朝阳县| 遂川县| 土默特右旗| 湘阴县|