專(zhuān)利名稱(chēng):一種簡(jiǎn)便快速的重碼漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種重碼漢字輸入方法以及與此相關(guān)的重碼處理方法,利用這種方法可以方便、快速地輸入重碼漢字。這種方法適用于任何漢字編碼輸入重碼漢字的場(chǎng)合。
漢字輸入是計(jì)算機(jī)漢字信息處理中的一項(xiàng)重要課題,通常采用小鍵盤(pán)漢字編碼輸入方法。由于漢字?jǐn)?shù)量多,編碼中往往遇到重碼,即一個(gè)代碼對(duì)應(yīng)一個(gè)以上的漢字,當(dāng)遇到重碼時(shí)就不能根據(jù)代碼唯一地確定漢字,還需要進(jìn)一步處理重碼。絕大多數(shù)漢字編碼都有重碼,有重碼就會(huì)影響輸入速度,重碼率越高影響的越大,怎樣處理重碼就成為漢字輸入中的關(guān)鍵問(wèn)題,重碼處理得好壞直接影響漢字輸入的效率。
通常采用以下三種方法處理重碼。第一種方法就是通過(guò)人機(jī)對(duì)話(huà)選擇漢字,當(dāng)遇到重碼時(shí),提示全部或部分重碼漢字,根據(jù)每個(gè)漢字的提示序號(hào)按鍵選擇。這種方法簡(jiǎn)單,但是重碼多時(shí)要反復(fù)地選擇漢字,影響了漢字輸入速度。第二種方法是在詞組中確定漢字,輸入詞組第一個(gè)漢字的代碼時(shí),如果遇到重碼,不必選擇,接著輸入第二個(gè)漢字的代碼,即使再遇到重碼也不必選擇,能夠在詞組中確定這兩個(gè)漢字。前一個(gè)重碼由后一個(gè)漢字確定,后一個(gè)漢字由前一個(gè)漢字確定,不需要人機(jī)對(duì)話(huà)選擇。這種方法比較方便,也可以提高輸入速度,但是它對(duì)不能組詞的漢字無(wú)能為力,而且有時(shí)侯也有重碼的情況,還需要通過(guò)人機(jī)對(duì)話(huà)再選擇。第三種方法通過(guò)增加編碼規(guī)則減少重碼。編碼規(guī)則越多,重碼出現(xiàn)的越少,重碼少可以提高輸入速度,但是這種處理方法由于增加了編碼規(guī)則,使編碼難以掌握,使用起來(lái)比較困難。具體操作中一般把三種方法結(jié)合使用,在編碼中增加一些規(guī)則,降低重碼率;在輸入漢字時(shí)采用詞組輸入,用詞組確定部分重碼漢字;余下的重碼漢字用人機(jī)對(duì)話(huà)方法處理。即使這樣,現(xiàn)有的重碼漢字處理方法還是不能方便、快速地輸入重碼漢字。
《漢字讀音編碼及其集中處理重碼法》(專(zhuān)利申請(qǐng)?zhí)?3117951.3)提出了給重碼漢字加標(biāo)識(shí)、通過(guò)重碼標(biāo)識(shí)處理重碼的方法。這種方法分離了漢字輸入操作和重碼處理操作,在輸入中遇到重碼不必馬上選擇,面是先輸入一個(gè)代表漢字,并且給這個(gè)代表漢字加上重碼標(biāo)識(shí)(內(nèi)部碼第二字節(jié)的最高位為0)。最后再把全部帶重碼標(biāo)識(shí)的漢字集中到一起統(tǒng)一處理。這種方法的優(yōu)點(diǎn)在于實(shí)現(xiàn)了重碼漢字的盲打輸入,即使有較多的重碼也能象沒(méi)有重碼一樣輸入,因此加快了輸入速度。但是這種方法要改變漢字的內(nèi)部碼,與通常使用的雙高位均為1的漢字內(nèi)部碼(國(guó)標(biāo)碼)有區(qū)別,在處理漢字信息時(shí)必須考慮重碼標(biāo)識(shí),不能與現(xiàn)有的漢字處理軟件兼容,因此使用起來(lái)不太方便。
本發(fā)明提供一種不必加重碼標(biāo)識(shí)便可以集中處理重碼的方法。輸入重碼漢字不必馬上選擇,臨時(shí)輸入一個(gè)使用頻度最高的代表重碼字,不必給這個(gè)代表字加上重碼標(biāo)識(shí),它的內(nèi)部碼結(jié)構(gòu)與非重碼漢字的內(nèi)部碼結(jié)構(gòu)完全一致。輸入若干漢字后再集中處理其中的重碼漢字,也就是把臨時(shí)輸入的代表重碼字經(jīng)過(guò)選擇替換成打算輸入的漢字。對(duì)于重碼漢字不是根據(jù)重碼標(biāo)識(shí)而是根據(jù)一張代表重碼字表來(lái)查找。
以拼音碼為例說(shuō)明重碼漢字的輸入方法和重碼處理方法。首先要有三個(gè)相互關(guān)聯(lián)的數(shù)據(jù)表,這三張表用來(lái)輸入重碼漢字和處理重碼,基本結(jié)構(gòu)如下代碼 代表重碼字對(duì)應(yīng)重碼字a阿啊呵吖鈳腌嗄ai 愛(ài)埃礙哀矮挨哎…an 安按案暗岸氨胺…重碼就是對(duì)應(yīng)兩個(gè)以上漢字的代碼,代表重碼字就是一組重碼字中使用頻度最高的漢字,對(duì)應(yīng)重碼字是一組重碼字中除了代表重碼字外的其余重碼字。三個(gè)表之間有內(nèi)在的聯(lián)系,代碼與代表重碼字一一對(duì)應(yīng),從代碼或代表重碼字可以查到對(duì)應(yīng)重碼字。例如輸入“阿”時(shí),輸入代碼a并鍵入空格鍵結(jié)束本次代碼輸入,由轉(zhuǎn)換程序去代碼表中查找a,可以根據(jù)這個(gè)代碼在表中的位置找到代表重碼字“阿”和其余對(duì)應(yīng)重碼字。這是一個(gè)重碼漢字,使用集中處理重碼方法就不必通過(guò)人機(jī)對(duì)話(huà)選擇,面是出程序自動(dòng)先把這個(gè)代表重碼字“阿”輸入,在內(nèi)部碼中不加任何標(biāo)識(shí),然后繼續(xù)輸入下一個(gè)漢字。臨時(shí)輸入的只是這組重碼字中的代表重碼字,代表重碼字可能與所要輸入的漢字不同,如輸入“啊”字時(shí)暫時(shí)輸入的是代表字“阿”。這樣輸入的好處在于不必選擇重碼漢字,即使是重碼漢字也可以盲打輸入,加快了輸入速度。
按照這種方法輸入完一段漢字后,用一個(gè)專(zhuān)用程序來(lái)查找其中的重碼漢字。查找重碼漢字時(shí)不是根據(jù)重碼標(biāo)識(shí),面是根據(jù)代表重碼字表,可以根據(jù)代表重碼字表區(qū)別重碼漢字和非重碼漢字。專(zhuān)用程序自動(dòng)測(cè)試字符內(nèi)部碼,如果找到一個(gè)漢字,就去查代表重碼字表,看它是否為代表重碼字,如果不是代表重碼字就是非重碼漢字,沒(méi)有處理重碼的必要;如果是代表重碼字,就根據(jù)這個(gè)代表重碼字查到其它對(duì)應(yīng)重碼字,用重碼處理方法確定所要輸入的漢字,把代表重碼漢字替換成確定的漢字,這就完成了重碼處理。例如查到“阿”字時(shí),去代表重碼字表中查找,找到了“阿”字,說(shuō)明這是一個(gè)重碼漢字,再根據(jù)代表重碼字和對(duì)應(yīng)重碼字的關(guān)聯(lián)查到其余重碼字,利用人機(jī)對(duì)話(huà)等方法選擇所要輸入的漢字。把不確定的代表重碼字替換成選定的漢字,完成了最后的輸入。
現(xiàn)有的漢字編碼輸入方法通常一次性輸入重碼漢字,遇到重碼時(shí)馬上用人機(jī)對(duì)話(huà)方法選定之后輸入。采用集中處理重碼方法可以分兩步輸入一個(gè)重碼漢字。第一步輸入代表重碼字時(shí)不必看屏選字,有很多重碼也可以盲打輸入,提高了速度。第二步處理重碼時(shí)可以借助下面介紹的方法方便、快速地確定所要輸入的重碼漢字。分兩步輸入一個(gè)重碼漢字比一次性輸入一個(gè)漢字更方便、更快速,在輸入大量文字時(shí)這個(gè)優(yōu)點(diǎn)表現(xiàn)得更加明顯。
在查找重碼、確定漢字時(shí)可以使用以下幾種方法。
(1)連續(xù)處理同一個(gè)重碼。
在漢字文件中,一個(gè)重碼漢字往往重復(fù)出現(xiàn)許多次,一個(gè)一個(gè)地確定這些重碼漢字非常麻煩,許多都是不必要的重復(fù)勞動(dòng)。本發(fā)明提供的連續(xù)處理同一個(gè)重碼的方法可以方便、快速地確定重復(fù)出現(xiàn)的重碼漢字。
查重程序根據(jù)代表重碼字表(或重碼標(biāo)識(shí))查找重碼字,找到重碼字后根據(jù)代表重碼字查到其余對(duì)應(yīng)重碼字,用簡(jiǎn)單的人機(jī)對(duì)話(huà)方法選擇確定這個(gè)重碼漢字。這是集中處理重碼的基本方法。連續(xù)處理同一個(gè)重碼的方法就是根據(jù)這個(gè)基本方法連續(xù)處理完一個(gè)漢字文件中多次出現(xiàn)的同一個(gè)重碼。在處理重碼過(guò)程中,查找并處理完一個(gè)重碼漢字之后,在文件中繼續(xù)查找這個(gè)重碼漢字進(jìn)行處理,對(duì)其他重碼漢字暫時(shí)不做處理,直到全部處理完文件中出現(xiàn)的這個(gè)重碼漢字,再去處理其他重碼漢字。例如在一段文字中重復(fù)出現(xiàn)幾次代表重碼字“阿”,面且不是連續(xù)出現(xiàn)的,中間還隔有其他漢字,在處理重碼時(shí),第一次查到代表重碼字“阿”,根據(jù)代表重碼字找到其他對(duì)應(yīng)重碼字,選擇所要輸入的漢字,接下來(lái)繼續(xù)尋找“阿”字并處理,處理完全部“阿”字之后再去處理其他重碼漢字。
連續(xù)處理同一個(gè)重碼時(shí),在提示行中出現(xiàn)的重碼字及其序號(hào)位置完全一樣,選擇一次或幾次之后,可以短時(shí)記憶某個(gè)漢字的序號(hào)。由于連續(xù)選擇同一組重碼漢字,中間不處理其他重碼,面且往往選定的是同一個(gè)漢字,所以不必看提示行,根據(jù)短期記憶可以正確地選擇所要輸入的漢字。不必反復(fù)地看提示行,這就減少了找字的負(fù)擔(dān),加快了處理重碼的速度。在具體的操作中,也可以一次選定多次重復(fù)出現(xiàn)的重碼漢字,例如在一段文字中有許多“阿”字,當(dāng)?shù)谝淮芜x定“阿”字之后,以下就自動(dòng)選擇“阿”字,不需要操作者的干預(yù)。也可以只選定同一詞組中出現(xiàn)的重碼漢字,例如在“阿姨”這個(gè)詞中選定“阿”字之后,以下查找“阿”字時(shí),檢測(cè)后一個(gè)漢字是否為“姨”字,如果是“姨”字便自動(dòng)選定前一個(gè)漢字為“阿”字。這樣處理更方便,也更快。
處理重碼時(shí)可以把提示信息移到正在處理的漢字附近,這樣選擇重碼漢字就更方便。在處理重碼時(shí)也可以只顯示包含所處理的漢字在內(nèi)的一小段文字,例如前后各三個(gè)字,根據(jù)前后幾個(gè)字就可以確定所要輸入的漢字,其他文字都不顯示,面且把這一小段文字顯示在固定的位置上,可以避免其他無(wú)用信息的干擾。
(2)利用鼠標(biāo)器、光筆等設(shè)備處理重碼。
輸入重碼漢字時(shí)暫時(shí)輸入一個(gè)代表重碼字,要輸入的可能是這個(gè)代表漢字,也可能是其他漢字,如果所要輸入的是這個(gè)作為代表重碼字的漢字,那么就不必替換這個(gè)漢字。上述方法(1)對(duì)全部重碼漢字都要選擇一次,即使代表重碼字就是所要輸入的漢字也得選擇一下,這也是不必要的重復(fù)勞動(dòng)。因?yàn)榇碇卮a漢字是一組重碼漢字中使用頻度最高的漢字,所以很多時(shí)侯暫時(shí)輸入的代表重碼字就是所要輸入的漢字,只須處理其他需要替換的代表重碼漢字。利用鼠標(biāo)器、光筆等設(shè)備可以做到這一點(diǎn)。
具體方法是把鼠標(biāo)器或光筆指向要替換的漢字,并且選取這個(gè)漢字,程序自動(dòng)識(shí)別這個(gè)漢字,根據(jù)代表重碼字表判斷這個(gè)漢字是否為重碼漢字,如果是重碼漢字,就根據(jù)這個(gè)代表重碼字查找其他對(duì)應(yīng)重碼字,在這個(gè)代表字下面開(kāi)一個(gè)小窗口,把重碼漢字和序號(hào)顯示在內(nèi),利用鼠標(biāo)器、光筆或鍵盤(pán)選擇處理。因?yàn)闇p少了選擇次數(shù),也提高了處重碼的速度這種方法可以借助于任何能夠移動(dòng)光標(biāo)的設(shè)備實(shí)現(xiàn)。
(3)智能處理重碼。
一個(gè)重碼漢字可以在詞語(yǔ)中確定,智能處理重碼的方法就是要在詞組和語(yǔ)句中確定重碼漢字。具體方法如下專(zhuān)用的查重程序根據(jù)代表重碼字表或重碼標(biāo)識(shí)自動(dòng)查找重碼漢字,找到重碼漢字后,再取前一個(gè)漢字和后一個(gè)漢字,如果前一個(gè)漢字或后一個(gè)漢字是重碼漢字,則根據(jù)代表重碼字查到其他對(duì)應(yīng)重碼字。首先根據(jù)一張?jiān)~組表,檢測(cè)前一個(gè)漢字與正在處理的重碼漢字能否構(gòu)成詞組,要對(duì)一組重碼字中的每一個(gè)都檢測(cè)一次,并記錄檢測(cè)結(jié)果。然后用同樣的方法檢測(cè)后一個(gè)漢字與正在處理的重碼漢字能否構(gòu)成詞組,要對(duì)一組重碼字中的每一個(gè)都檢測(cè)一次,并記錄檢測(cè)結(jié)果。根據(jù)檢測(cè)結(jié)果做如下判定如果在檢測(cè)的全部重碼漢字中,只有一個(gè)漢字可以與前一個(gè)漢字或后一個(gè)漢字組成詞組,那么這個(gè)詞組中的漢字就是所選的漢字,程序用這個(gè)選定的漢字自動(dòng)替換代表重碼漢字;如果在檢測(cè)的全部重碼漢字中,沒(méi)有一個(gè)漢字可以與前一個(gè)漢字或后一個(gè)漢字組成詞組,那么不自動(dòng)選擇重碼字;如果在檢測(cè)的全部重碼漢字中,有一個(gè)以上漢字可以與前一個(gè)漢字或后一個(gè)漢字組成詞組,那么不自動(dòng)選擇重碼字。由于智能方法能夠根據(jù)詞組和語(yǔ)法自動(dòng)選定重碼漢字,所以大大地提高了重碼漢字的處理速度。用來(lái)檢測(cè)構(gòu)詞情況的詞組表應(yīng)該包含所有的常用詞組,根據(jù)需要還應(yīng)有相應(yīng)的專(zhuān)業(yè)詞組和個(gè)人詞組,詞量在一萬(wàn)至三萬(wàn)之間比較合適。智能處理方法還可以增加語(yǔ)法判斷,進(jìn)一步增進(jìn)智能處理的可靠性。不能由智能方法確定的重碼漢字可以用方法(1)和方法(2)處理。
結(jié)合使用這三種方法可以方便、快速地處理重碼。
由于不同的漢字編碼中的重碼不同,相應(yīng)地代表重碼字和對(duì)應(yīng)重碼字也不一樣,只有根據(jù)輸入漢字時(shí)使用的代表重碼字表和相應(yīng)的對(duì)應(yīng)重碼字表才能正確處理重碼。
本發(fā)明提供的重碼漢字輸入方法和三種重碼處理方法獨(dú)立于任何漢字編碼方案,只要編碼有重碼都可以利用它方便、快速地輸入重碼漢字??梢栽诓僮飨到y(tǒng)中使用,也可以在漢字編輯軟件中使用,甚至所有涉及漢字輸入的軟件都能夠使用。
這種方法分兩步輸入一個(gè)重碼漢字,也能實(shí)現(xiàn)重碼漢字的盲打輸入,即使有較多重碼也不影響輸入速度??梢允购?jiǎn)單的漢字編碼獲得較快的輸入速度,解決了漢字輸入中簡(jiǎn)單與快速的矛盾。
本發(fā)明提供的重碼漢字輸入方法與《漢字讀音編碼輸入及其集中處理重碼法》的根本區(qū)別在于不給重碼漢字加重碼標(biāo)識(shí)。因?yàn)椴桓淖儩h字內(nèi)部碼,所以與現(xiàn)有的漢字信息處理軟件完全兼容,使用起來(lái)更方便。在漢字輸入中重碼漢字和非重碼漢字沒(méi)有區(qū)別,在查找重碼漢字時(shí)不是根據(jù)重碼標(biāo)識(shí),面是根據(jù)代表重碼字表判定是否重碼漢字。并且為這種重碼漢字輸入方法提供了三種重碼處理方法,比起《漢字讀音編碼輸入及其集中處理重碼法》的人機(jī)對(duì)話(huà)方法更方便、更快速。這三種重碼處理方法使得漢字輸入真正實(shí)現(xiàn)了簡(jiǎn)單和快速的統(tǒng)一。
權(quán)利要求
1.重碼漢字輸入方法及其重碼處理方法,其特征是利用重碼與代表重碼字的關(guān)系以及代表重碼字與其對(duì)應(yīng)重碼字的關(guān)系分兩步輸入一個(gè)重碼漢字,首先輸入不帶重碼標(biāo)識(shí)的代表重碼字,然后根據(jù)代表重碼字表判斷哪些漢字是重碼字,并從代表重碼字找到其對(duì)應(yīng)重碼字,利用重碼處理方法確定所要輸入的漢字。
2.根據(jù)權(quán)利要求1,把漢字編碼中的重碼、代表重碼字、對(duì)應(yīng)重碼字制成數(shù)據(jù)表,這個(gè)數(shù)據(jù)表供漢字輸入程序和重碼處理程序使用,其中重碼和代表重碼字一一對(duì)應(yīng),從重碼或代表重碼字可以查到與其對(duì)應(yīng)的重碼字。
3.根據(jù)權(quán)利要求1或2,輸入重碼漢字時(shí),根據(jù)重碼與代表重碼字的一一對(duì)應(yīng)關(guān)系暫時(shí)輸入代表重碼字,這個(gè)代表重碼字不帶重碼標(biāo)識(shí),其內(nèi)碼結(jié)構(gòu)與非代表重碼字一致。
4.根據(jù)權(quán)利要求1或2,查找重碼漢字時(shí)利用重碼代表字表判斷漢字是否為代表重碼字,如果是代表重碼字就根據(jù)它與對(duì)應(yīng)重碼字的聯(lián)系找到其余對(duì)應(yīng)重碼字,利用相應(yīng)的重碼處理方法確定所要輸入的漢字。
5.根據(jù)權(quán)利要求4,用下面的幾種方法處理重碼(1)處理重碼時(shí)連續(xù)處理同一個(gè)重碼,全部處理完這個(gè)重碼之后再去處理其他重碼;(2)處理重碼時(shí),把查到的對(duì)應(yīng)重碼字及其序號(hào)顯示在代表重碼字的下面或上面,以便選擇;(3)處理重碼時(shí),利用鼠標(biāo)器、光筆等外部設(shè)備把光標(biāo)移動(dòng)到代表重碼字處,并選取這個(gè)漢字,查到其對(duì)應(yīng)重碼字并顯示出來(lái),選擇所要輸入的重碼漢字;(4)處理重碼時(shí)利用漢字詞組和漢語(yǔ)語(yǔ)法智能確定重碼漢字,首先由程序自動(dòng)尋找代表重碼字。并查到其對(duì)應(yīng)重碼字,再判斷代表重碼字和對(duì)應(yīng)重碼字是否與前后漢字構(gòu)成詞組,同時(shí)判斷是否符合漢語(yǔ)語(yǔ)法,能夠唯一地與前一字或后一字組成詞組,并且符合漢語(yǔ)語(yǔ)法,那么程序自動(dòng)選擇這個(gè)重碼漢字。
全文摘要
本發(fā)明提供一種方便、快速地輸入重碼漢字的方法。輸入重碼漢字時(shí)首先輸入不加重碼標(biāo)識(shí)的代表重碼字,然后根據(jù)代表重碼字表判斷哪些漢字是重碼漢字,哪些漢字不是重碼漢字,根據(jù)代表重碼字與對(duì)應(yīng)重碼字的聯(lián)系,利用方便的重碼處理方法確定其中的重碼漢字。這種方法適用于任何漢字編碼輸入重碼漢字的場(chǎng)合。
文檔編號(hào)G06F3/023GK1122468SQ9510108
公開(kāi)日1996年5月15日 申請(qǐng)日期1995年1月17日 優(yōu)先權(quán)日1995年1月17日
發(fā)明者蘭久富 申請(qǐng)人:蘭久富