两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

信息處理裝置和通過外碼輸入目標(biāo)語言文字的方法

文檔序號(hào):9374834閱讀:175來源:國(guó)知局
信息處理裝置和通過外碼輸入目標(biāo)語言文字的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息處理技術(shù),并且更具體地,涉及通過外碼來輸入文字的信息處理 裝置和通過外碼向信息處理裝置輸入文字的方法。
【背景技術(shù)】
[0002] 在與例如計(jì)算機(jī)、便攜終端和智能電子設(shè)備的信息處理裝置進(jìn)行交互的過程中, 經(jīng)常需要輸入文字信息。能夠通過輸入裝置直接輸入信息處理裝置的信息元素是有限的。 例如,在使用英文鍵盤的情況下,能夠直接輸入的信息元素限于英文字母、其它符號(hào)和控制 信息。例如漢語、日語的某些語言的字符集規(guī)模遠(yuǎn)大于能夠直接輸入信息處理裝置的信息 元素集的規(guī)模。當(dāng)要輸入這樣的語言的文字時(shí),通常預(yù)先規(guī)定信息元素的組合(也稱作外 碼或編碼)與該語言的文字(單字或單字的組合)間的映射規(guī)則(也稱作編碼映射規(guī)則)。 在與信息處理裝置交互時(shí),通過輸入裝置輸入外碼。根據(jù)編碼映射規(guī)則確定與輸入的外碼 對(duì)應(yīng)的文字,從而把該對(duì)應(yīng)的文字作為針對(duì)信息處理裝置的最終輸入。
[0003] 經(jīng)常存在同一外碼能夠映射到多個(gè)單字或組合的情形(也稱為重碼)。如果遇 到這種情形,需要有進(jìn)一步的輸入來從重碼中選擇真正想輸入的文字。在中國(guó)專利申請(qǐng) CN102662490A中提出了一種具有輔助翻譯功能的輸入方法,包括讀取待翻譯句子,識(shí)別待 翻譯句子中所有可能的術(shù)語,從該句子所對(duì)應(yīng)的領(lǐng)域的字典中獲取術(shù)語的翻譯,從普通的 雙語電子字典中獲取所有待譯非術(shù)語詞匯的翻譯,建立一個(gè)高優(yōu)先級(jí)樹,將這些翻譯結(jié)果 及詞匯對(duì)應(yīng)的概率放入這個(gè)高優(yōu)先級(jí)樹中,當(dāng)用戶輸入文字時(shí),同時(shí)匹配輸入當(dāng)中的一般 詞匯樹和高優(yōu)先級(jí)樹,并根據(jù)其概率進(jìn)行對(duì)匹配的結(jié)果進(jìn)行綜合排序。

【發(fā)明內(nèi)容】

[0004] 本公開的一個(gè)方面涉及一種信息處理裝置。能夠通過外碼向信息處理裝置輸入目 標(biāo)語言文字。信息處理裝置包含識(shí)別單元和轉(zhuǎn)換單元。識(shí)別單元能夠從最近輸入的目標(biāo)語 言文字中獲得目標(biāo)語句序列。識(shí)別單元能夠根據(jù)下述準(zhǔn)則,針對(duì)目標(biāo)語句序列中的每個(gè)目 標(biāo)語句,在源語言的源語句序列中識(shí)別一個(gè)對(duì)應(yīng)源語句子序列:每個(gè)目標(biāo)語句是相應(yīng)源語 句子序列的每個(gè)源語句的譯文的可能性較大,并且目標(biāo)語句序列中相鄰目標(biāo)語句的對(duì)應(yīng)源 語句子序列在源語句序列中的相互距離較小。每個(gè)源語句子序列包含盡可能多的上述可能 性較大的連續(xù)源語句。識(shí)別單元能夠估計(jì)源語句序列中的可能當(dāng)前源語句??赡墚?dāng)前源語 句包括在覆蓋所有源語句子序列的最小區(qū)間之外但與該區(qū)間接近的至少一個(gè)語句。轉(zhuǎn)換單 元能夠根據(jù)編碼映射規(guī)則把輸入的外碼轉(zhuǎn)換為目標(biāo)語言文字。進(jìn)一步地,轉(zhuǎn)換單元能夠在 假設(shè)當(dāng)前正在輸入或?qū)⒁斎肟赡墚?dāng)前語句的目標(biāo)語言的譯文的情況下,減少輸入的外碼 的歧義。
[0005] 本公開的另一個(gè)方面涉及一種通過外碼向信息處理裝置輸入目標(biāo)語言文字的方 法。根據(jù)該方法,從最近輸入的目標(biāo)語言文字中獲得目標(biāo)語句序列。根據(jù)下述準(zhǔn)則,針對(duì)目 標(biāo)語句序列中的每個(gè)目標(biāo)語句,在源語言的源語句序列中識(shí)別一個(gè)對(duì)應(yīng)源語句子序列:每 個(gè)目標(biāo)語句是相應(yīng)源語句子序列的每個(gè)源語句的譯文的可能性較大,并且目標(biāo)語句序列中 相鄰目標(biāo)語句的對(duì)應(yīng)源語句子序列在源語句序列中的相互距離較小。每個(gè)源語句子序列包 含盡可能多的上述可能性較大的連續(xù)源語句。估計(jì)源語句序列中的可能當(dāng)前源語句??赡?當(dāng)前源語句包括在覆蓋所有源語句子序列的最小區(qū)間之外但與該區(qū)間接近的至少一個(gè)語 句。在假設(shè)當(dāng)前正在輸入或?qū)⒁斎肟赡墚?dāng)前語句的目標(biāo)語言的譯文的情況下,減少輸入 的外碼的歧義。
【附圖說明】
[0006] 參照下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例的說明,會(huì)更加容易地理解本發(fā)明的以上和其 它目的、特點(diǎn)和優(yōu)點(diǎn)。在附圖中,相同的或?qū)?yīng)的技術(shù)特征或部件將采用相同或?qū)?yīng)的附圖 標(biāo)記來表示。
[0007] 圖1是示出根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理裝置的示例性結(jié)構(gòu)的框圖。
[0008] 圖2是說明源語句子序列的兩種情形的不意圖。
[0009] 圖3是示出根據(jù)本發(fā)明一個(gè)實(shí)施例的通過外碼向信息處理裝置輸入目標(biāo)語言文 字的方法的示例性過程的流程圖。
[0010] 圖4是說明目標(biāo)語句與源語句子序列的集合之間的關(guān)系的示意圖。
[0011] 圖5是示出其中實(shí)現(xiàn)本發(fā)明的設(shè)備和方法的計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。
【具體實(shí)施方式】
[0012] 本文中所用的術(shù)語,僅僅是為了描述特定的實(shí)施例,而不意圖限定本發(fā)明。本文中 所用的單數(shù)形式的"一"和"該",旨在也包括復(fù)數(shù)形式,除非上下文中明確地另行指出。還 要知道,"包含"一詞在本說明書中使用時(shí),說明存在所指出的特征、整體、步驟、操作、單元 和/或組件,但是并不排除存在或增加一個(gè)或多個(gè)其它特征、整體、步驟、操作、單元和/或 組件,以及/或者它們的組合。
[0013] 以下參照按照本發(fā)明實(shí)施例的方法、設(shè)備的流程圖和/或框圖描述本發(fā)明。應(yīng)當(dāng) 注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的 部件和處理的表示和描述。流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框 的組合,都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提供給通用計(jì)算機(jī)、專用 計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,使得通過計(jì)算機(jī)或其 它可編程數(shù)據(jù)處理裝置執(zhí)行的這些指令,產(chǎn)生實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功 能/操作的裝置。
[0014] 也可以把這些計(jì)算機(jī)程序指令存儲(chǔ)在能指令計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置 以特定方式工作的計(jì)算機(jī)可讀介質(zhì)中,這樣,存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令產(chǎn)生一個(gè)包 括實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令裝置(instruction means) 的制造品。
[0015] 也可以把計(jì)算機(jī)程序指令加載到計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置上,使得在計(jì) 算機(jī)或其它可編程數(shù)據(jù)處理裝置上執(zhí)行一系列操作步驟,以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過程,從而 在計(jì)算機(jī)或其它可編程裝置上執(zhí)行的指令就提供實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定 的功能/操作的過程。
[0016] 應(yīng)當(dāng)明白,附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實(shí)施例的系統(tǒng)、方法和 計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方 框可以代表一個(gè)模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一 個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中, 方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的 方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能 而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的 組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬 件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
[0017] 通常,在用戶將一種語言(下文中也稱為源語言)的文字翻譯成另一種語言(下 文中也稱為目標(biāo)語言)的文字的過程中,用戶看到一個(gè)源語言的語句(也稱為源語句), 然后將相應(yīng)的目標(biāo)語言的語句(也稱為目標(biāo)語句)輸入至少信息處理裝置中。為輸入目 標(biāo)語句,用戶直接向信息處理裝置輸入相應(yīng)的外碼,信息處理裝置則將輸入的外碼轉(zhuǎn)換成 目標(biāo)語言文字。同一外碼可能對(duì)應(yīng)不同的目標(biāo)語言文字。關(guān)于當(dāng)前翻譯的目標(biāo)語言語句 的知識(shí)可幫助減輕這樣的問題。例如,在目標(biāo)語言是中文并且外碼是拼音碼的情況下,外 碼"yingjian"可以對(duì)應(yīng)于中文文字"硬件"和"營(yíng)建"。假設(shè)源語言是英語并且當(dāng)前翻譯 的源語言語句是"CPU is hardware"。如果能夠通過諸如機(jī)器翻譯的自動(dòng)翻譯技術(shù)得知 "hardware"的譯文是"硬件",那么會(huì)有助于排除外碼"yingjian"對(duì)應(yīng)于"營(yíng)建"的可能。 然而,在沒有任何用戶指定或指示信息的情況下,信息處理裝置的負(fù)責(zé)通過外碼輸入文字 的處理部分無法得知當(dāng)前翻譯的源語句?;谏鲜鲇^察,發(fā)明人提出了根據(jù)輸入歷史從原 文,即源語句序列中識(shí)別當(dāng)前翻譯的源語句的方案。
[0018] 圖1是示出根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理裝置100的示例性結(jié)構(gòu)的框圖,其 中能夠通過外碼向信息處理裝置100輸入文字。如圖1所示,信息處理裝置100包含識(shí)別 單元101和轉(zhuǎn)換單元102。
[0019] 識(shí)別單元101被配置為從用戶的輸入歷史104中獲得目標(biāo)語句序列。輸入歷史 104記錄有用戶輸入的目標(biāo)語言文字。信息處理裝置100可以將用戶輸入的目標(biāo)語言文字 記錄在輸入歷史104中。語句的劃分取決于所采取的斷句規(guī)則。例如可以根據(jù)例如句號(hào)的 標(biāo)點(diǎn)符號(hào)或例如回車換行符的特殊結(jié)束符來斷句。輸入歷史104中記錄了按照輸入時(shí)間順 序排列的目標(biāo)語句序列Y = {yt,...,yt+J,而識(shí)別單元104從中獲取最近的目標(biāo)語句序列 Y' = {yt+m,…,yt+J,其中0彡m彡n。Y'是Y的子序歹(J,且包含最新輸入的目標(biāo)語句。
[0020] 獲取目標(biāo)語言語句序列Υ'是基于這樣的考慮。當(dāng)用戶對(duì)照源語言文字來進(jìn)行翻 譯時(shí),通常會(huì)按照源語言文字中語句的順序來逐句翻譯成目標(biāo)語句。所獲取的目標(biāo)語句序 列Υ'應(yīng)當(dāng)是從一個(gè)源語句集合翻譯過來的。根據(jù)用戶的逐句翻譯的規(guī)律,能夠把源語言文 字中在源語句集合的邊界,即最大序號(hào)語句和最小序號(hào)語句附近的語句識(shí)別為可能要翻譯 的下一語句(也稱為可能當(dāng)前源語句)。用戶可能會(huì)非連續(xù)地進(jìn)行翻譯,然而要翻譯的下一 句通常不會(huì)剛翻譯的語句距離太遠(yuǎn)。相應(yīng)地,源語句集合中的語句不應(yīng)彼此距離太遠(yuǎn)。
[0021] 對(duì)于單個(gè)目標(biāo)語句,可能在源語言文字中找到多于一個(gè)的連續(xù)源語句作為該目標(biāo) 語句的可能原文。在這樣的情況下,可以把能夠作為可能原文的所有連續(xù)源語句作為特殊 源語句包含在源語句集合中。<
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
玉山县| 株洲市| 乐平市| 中山市| 芒康县| 新平| 郓城县| 南昌市| 航空| 海晏县| 改则县| 沿河| 腾冲县| 孟连| 徐闻县| 禹城市| 楚雄市| 宣化县| 扬中市| 潢川县| 屯留县| 彭山县| 大方县| 阜宁县| 赤城县| 浮山县| 潞城市| 永平县| 贡山| 唐山市| 乌鲁木齐市| 米泉市| 姚安县| 黄冈市| 木兰县| 高雄县| 衡阳县| 绥德县| 休宁县| 哈尔滨市| 桑日县|