專(zhuān)利名稱(chēng):包容五筆字型的五碼詞為主、字為輔復(fù)合碼計(jì)算機(jī)輸入編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是一種計(jì)算機(jī)輸入中文編碼方法。
國(guó)內(nèi)外計(jì)算機(jī)輸入中文編碼方法很多,其中達(dá)到使用推廣程度的只有十幾種。在這些編碼方法中,王永民發(fā)明的五筆字型編碼方法一花獨(dú)秀,為百萬(wàn)計(jì)算機(jī)用戶所采用,覆蓋率達(dá)到國(guó)內(nèi)外中文計(jì)算機(jī)輸入的90%以上。這種編碼方法有很多優(yōu)點(diǎn),如以字體折分為碼,易被接受,規(guī)則簡(jiǎn)單,構(gòu)成合理,記憶量少,輸入速度快等,但它也有嚴(yán)重缺點(diǎn),就是實(shí)行單字輸入,不符合中文構(gòu)成以詞為主,字為輔的自然狀態(tài)。
中文的構(gòu)成,兩字和兩字以上組成的詞占70%左右,單字僅占30%左右。計(jì)算機(jī)輸入采用單字輸入,必然造成平均每字擊鍵數(shù)較多的嚴(yán)重缺陷。如果能采用以詞為主,字為輔的輸入方式,無(wú)疑輸入速度將明顯提高。有一種說(shuō)法認(rèn)為中文字有限,詞無(wú)限,因此實(shí)現(xiàn)以詞為主輸入是不可能的。這種說(shuō)法是片面的。漢字可以組成很多的詞,每天都有新詞出現(xiàn),但是每天也都有舊詞成為生僻詞而死亡。在實(shí)際語(yǔ)言文字的應(yīng)用中常用詞是有限的,而且也是相對(duì)穩(wěn)定的,常用詞只有一萬(wàn)個(gè)左右?!冬F(xiàn)代漢語(yǔ)詞典》收詞相當(dāng)多,也只有五萬(wàn)多個(gè),《辭?!肥杖氪罅咳嗣⒌孛?、事件名等,也不過(guò)收詞八萬(wàn)多個(gè)。有人對(duì)中文的用詞情況進(jìn)行過(guò)大量的統(tǒng)計(jì)和分析,發(fā)現(xiàn)不到一萬(wàn)個(gè)常用詞和三、四千常用字出現(xiàn)的累計(jì)頻率占到了中文的97%以上。這說(shuō)明實(shí)行以詞為主,字為輔和詞字復(fù)合碼計(jì)算機(jī)輸入是完全可行的。人能不能記住幾萬(wàn)個(gè)詞的編碼?人的腦力潛力非常大。一個(gè)人可以認(rèn)識(shí)和記憶幾十萬(wàn)種事物,因此,幾萬(wàn)個(gè)詞的編碼字,只要常用,是可以記住的。特別是本發(fā)明詞的編碼與五筆字型的編碼相近似,規(guī)則又很簡(jiǎn)單,只要能記住五筆字型三、四千常用字的編碼,記住本發(fā)明幾萬(wàn)個(gè)詞的編碼是很容易的。
本發(fā)明的目的是為了提供一種即具有五筆字型全部?jī)?yōu)點(diǎn),又能實(shí)現(xiàn)詞碼與字碼合一,以詞輸入為主,以字輸入為輔的,規(guī)則簡(jiǎn)單,不需特別記憶,輸入速度比五筆字型快得多,易于被使用者接受和推廣的新型中文計(jì)算機(jī)輸入編碼方法。
本發(fā)明的目的是這樣實(shí)現(xiàn)的它采用五筆字型的字根,字型、筆劃和漢字編碼規(guī)則和方法的大部分。在編碼中包含全部五筆字型漢字編碼。它沒(méi)有采用五筆字型的詞匯編碼及“Z”鍵作為萬(wàn)能學(xué)習(xí)鍵和標(biāo)準(zhǔn)單位碼長(zhǎng)為四碼的規(guī)則。
本發(fā)明標(biāo)準(zhǔn)單位碼長(zhǎng)為五碼。計(jì)算機(jī)輸入時(shí),如遇到輸入字碼或詞碼簡(jiǎn)碼,其編碼不足五碼,要在其后加打空格鍵。例如,輸入“命”字編碼為“WGKB”不足五碼,要加打空格鍵。輸入詞“我們”,詞碼簡(jiǎn)碼為“QZ”不足五碼,要加打空格鍵。
本發(fā)明的關(guān)鍵是詞碼如何構(gòu)成,要使它不與字碼相混,又非常易記,為此本發(fā)明規(guī)定,詞碼編碼由兩部分組成,前部為詞首字全碼,后部為詞后字部分編碼,同時(shí)又規(guī)定,字母“Z”鍵或其他予留鍵,在一般情況下,出現(xiàn)在詞碼編碼一、二、三位時(shí)為詞首字全碼定義碼。
本發(fā)明為了縮短常用詞的編碼長(zhǎng)度,減少詞碼的重碼率,充分安排詞碼簡(jiǎn)碼,利用編碼空間,規(guī)定了作為詞首字的25個(gè)一級(jí)特碼字和75個(gè)二級(jí)特碼字。這是本發(fā)明的又一高明之處。一級(jí)特碼字的選擇原則為除了五筆字型的一級(jí)簡(jiǎn)碼字以外,作為詞首字組詞,在中文出現(xiàn)頻率最高,其五筆字型字的編碼的首碼又分別屬于除“Z”以外的25個(gè)字母的25個(gè)字。這25個(gè)字為A革、B出、C對(duì)、D大、E勝、F起、G下、H戰(zhàn)、I沒(méi)、J時(shí)、K只、L因、M山、N已、O火、P實(shí)、Q多、R看、S可、T看、U前、V那、W他、X結(jié)、Y文。二級(jí)特碼字的選擇原則為除了五筆字型一、二級(jí)簡(jiǎn)碼字和一級(jí)特碼字以外,作為詞首字組詞,在中文中出現(xiàn)頻率最高,每三個(gè)字為一組,其五筆字型字的編碼大多數(shù)首碼,少數(shù)二碼或三碼或四碼又分別屬于除“Z”以外的25個(gè)字母的75個(gè)字。例如“A”為“勞”、“其”、“花”三個(gè)字,“B”為“階”、“孩”、“隨”三個(gè)字。
本發(fā)明的詞碼的詞首字全碼有三種(一)五碼字型的字全碼即為詞首字全碼。例如“命”字的詞首字全碼為“WHKB”“十”字的詞首字全碼為“FGH”。(二)為五筆字型一、二級(jí)簡(jiǎn)碼字編碼之后加詞首字全碼定義碼構(gòu)成詞首字全碼。例如一級(jí)簡(jiǎn)碼字“我”的字簡(jiǎn)碼編碼為“Q”,其詞首字全碼為“QZ”。二級(jí)簡(jiǎn)碼字“產(chǎn)”字的簡(jiǎn)碼編碼為“UT”,其詞首字全碼為“UTZ”。(三)由本發(fā)明規(guī)定的一、二級(jí)特碼字的編碼加詞首字全碼定義碼構(gòu)成。具體規(guī)則為在一級(jí)特碼字編碼前加一個(gè)詞首字全碼定義碼構(gòu)成詞首字全碼,例如“革”字一級(jí)特碼字編碼為“A”,其詞首字全碼為“ZA”?!俺觥弊忠患?jí)特碼字編碼為“B”其詞首字全碼為“ZB”。二級(jí)特碼字共75個(gè)字,分成25個(gè)字一隊(duì)的三隊(duì)。每個(gè)隊(duì)的25個(gè)字都分屬于25字母,或者說(shuō)每個(gè)字母都代表3個(gè)字,例如“A”為“勞”、“其”、“花”三個(gè)字。“勞”在一隊(duì),“其”在二隊(duì),“花”在三隊(duì),一隊(duì)二級(jí)特碼字編碼之后加兩個(gè)詞首字全碼定義碼構(gòu)成詞首字全碼,例如“勞”字的詞首字全碼為“ZZA”。二隊(duì)二級(jí)特碼字編碼前后各加一個(gè)詞首字全碼定義碼構(gòu)成詞首字全碼,例如“其”字的詞首字全碼為“ZAZ”。三隊(duì)二級(jí)簡(jiǎn)碼字編碼后加兩個(gè)詞首字碼定義碼構(gòu)成詞首字全碼。例如“花”字的詞首字全碼為“AZZ”。
詞碼的標(biāo)準(zhǔn)單位碼長(zhǎng)為五碼,詞首字全碼的碼長(zhǎng)為二至四碼,相應(yīng)的詞后字部分編碼的碼長(zhǎng)為三至一碼。
對(duì)詞后字部分編碼的規(guī)則為采用五筆字型字全碼編碼,而不采用五筆字型簡(jiǎn)碼和本發(fā)明規(guī)定的特碼字編碼。例如“自我”一詞的詞碼詞首字全碼為“ZT”,詞后字部分編碼有三碼?!拔摇弊值囊患?jí)簡(jiǎn)碼為“Q”,不采用,采用“我”字的全碼“TRNT”的前三碼,“自我”一詞的詞碼為“ZTTRN”。
詞后字部分編碼為三碼時(shí),如是二字詞,則三碼分別是詞二字的首碼、二碼、三碼。如是三字詞,則三碼分別為詞二字的首碼、二碼、詞三字的首碼。如是四字詞或四字以上詞,則三碼分別為詞二字首碼,詞三字首碼,詞四字或詞未字首碼。為二碼時(shí),如是二字詞,則二碼分別為詞二字首碼,二碼。如是三字詞或三字詞以上詞,則二碼分別為詞二字首碼,詞三字或詞末字首碼。為一碼時(shí),無(wú)論是幾字詞,詞后字部分編碼均為詞末字首碼。這些規(guī)則與五筆字型詞匯編碼規(guī)則相近,因此不再舉例。
本發(fā)明規(guī)定了詞碼簡(jiǎn)碼。一級(jí)詞碼簡(jiǎn)碼為25個(gè)詞首字為五筆字型一級(jí)簡(jiǎn)碼字和25個(gè)詞首字為本發(fā)明規(guī)定的一級(jí)特碼字組成的詞碼簡(jiǎn)碼。輸入時(shí),在其詞首字全碼后加打空格鍵即可。例如“我們”的詞碼全碼為“QZWUN”,一級(jí)詞碼簡(jiǎn)碼為詞首字全碼“QZ”加打空格鍵。又和“因?yàn)椤币辉~的全碼為“ZLYLY”,一級(jí)詞碼簡(jiǎn)碼為詞首字全碼“ZL”加打空格鍵。一共有50個(gè)最常見(jiàn)的詞被規(guī)定為一級(jí)詞碼簡(jiǎn)碼,輸入時(shí)只擊鍵三次,平均每字1.5鍵。
二級(jí)詞碼簡(jiǎn)碼為詞首字是五百多個(gè)五筆字型二級(jí)簡(jiǎn)碼字和75個(gè)本發(fā)明規(guī)定的二級(jí)特碼字組成的詞碼簡(jiǎn)碼。輸入時(shí),在其詞首字全碼后加打空格鍵即可。例如“東西”一詞的詞碼全碼為“AIZSG”,二級(jí)詞碼簡(jiǎn)碼為詞首字全碼“AIZ”加打空格鍵。又如“月亮”一詞的詞碼全碼為“EZZYK”,二級(jí)詞碼簡(jiǎn)碼為詞首字全碼“EZZ”加打空格鍵。
還有一種二級(jí)詞碼簡(jiǎn)碼是由詞首字為一級(jí)簡(jiǎn)碼字和一級(jí)特碼字的詞首字全碼后加某個(gè)字母組成。例如“因此”一詞的詞碼全碼為“ZLHXN”,“ZL”是詞首字“因”的詞首字全碼,后加字母“H”,組成“ZLH”為“因此”一詞的詞碼簡(jiǎn)碼。輸入時(shí)也要加打空格鍵。二級(jí)詞碼簡(jiǎn)碼理論上有大約近二千字之多。二級(jí)詞碼簡(jiǎn)碼擊鍵數(shù)四次,平均每字兩次。
本發(fā)明還依據(jù)上述方法規(guī)定了三萬(wàn)個(gè)三級(jí)詞碼簡(jiǎn)碼。
另外,對(duì)于詞首字為非一、二級(jí)簡(jiǎn)碼字或一、二級(jí)特碼字的詞碼,也可利用五筆字型字編碼的空檔,規(guī)定詞碼簡(jiǎn)碼。
規(guī)定了詞碼簡(jiǎn)碼后,相應(yīng)的詞碼全碼仍然保留。
本發(fā)明為了減少因記憶不清而造成的不便,規(guī)定了詞首字組詞提示碼。字母“Z”或其他予留鍵在詞首字全碼之后出現(xiàn)為該詞首字的組詞提示碼。這時(shí)要求計(jì)算機(jī)將該字作為詞首字,詞中字,詞尾字所組成的常用詞及編碼顯示出來(lái)。例如“命”字的編碼為“WGKB”在其后加組詞提示碼,成為“WGKBZ”顯示屏將顯示“命運(yùn)”“任命”“性命關(guān)天”等詞及編碼。有一種例外,就是對(duì)于一級(jí)簡(jiǎn)碼字或一級(jí)特碼字要把組詞提示碼加在詞首字全碼前面,而且要連加三個(gè)。例如“我”字的組詞提示為“ZZZQZ”,“因”字的組詞提示為“ZZZZL”。
至于五筆字型規(guī)定的“Z”鍵作為萬(wàn)能學(xué)習(xí)鍵的功能,可以另外規(guī)定某個(gè)予留鍵來(lái)?yè)?dān)任。
考慮到使用者方便、快捷輸入中文的需要,還可設(shè)置這樣一些功能如根據(jù)不同人的習(xí)慣設(shè)置容錯(cuò)碼。又如在輸入某詞時(shí),可以在顯示屏的邊部顯示出該詞的繁體字,簡(jiǎn)稱(chēng)或全稱(chēng),同義詞和可能的后接詞或字,易寫(xiě)錯(cuò)的字、詞,易讀錯(cuò)的字、詞等,供采用。
本發(fā)明的優(yōu)點(diǎn)有七條①本發(fā)明是以詞為主,字為輔,詞碼、字碼合一的復(fù)合碼,完全符合中文構(gòu)成的實(shí)際情況,也就是說(shuō)是順其自然。它要比五筆字型單字輸入更為科學(xué)合理。
②五筆字型推廣10年,擁有百萬(wàn)用戶,覆蓋率達(dá)國(guó)內(nèi)外中文計(jì)算機(jī)輸入的90%以上。這是任何一種全新的中文編碼(除非具有巨大的優(yōu)點(diǎn))都不可能取而代之的。而本發(fā)明利用了五筆字型的巨大的推廣效應(yīng),因此很易被接受和推廣。
③本發(fā)明包含了五筆字型全部?jī)?yōu)點(diǎn),也就是說(shuō)五筆字型能做到的,它都能做到,它又有更多的優(yōu)點(diǎn),這就使本發(fā)明必然取代五筆字型。
④本發(fā)明輸入擊鍵數(shù)明顯少于五筆字型。五筆字型一級(jí)簡(jiǎn)碼擊鍵2次,而本發(fā)明的詞碼一級(jí)簡(jiǎn)碼擊鍵3次,平均每字擊鍵1.5次。五筆字型全碼平均每字擊鍵4次,而本發(fā)明詞碼全碼擊鍵5次,平均每字擊鍵2.5次。本發(fā)明輸入速度比五筆字型快得多。
⑤本發(fā)明構(gòu)思巧妙,特別是對(duì)詞碼和一、二級(jí)特碼字的規(guī)定,詞碼與字碼的區(qū)別和詞碼組成的規(guī)則等,這些都是其他中文編碼所沒(méi)有的高明之處。
⑥本發(fā)明規(guī)則簡(jiǎn)單,記憶量少,很易掌握。熟悉五筆字型的人半小時(shí)可掌握規(guī)則,一周可記熟數(shù)萬(wàn)個(gè)常用詞的編碼。
⑦本發(fā)明的編碼重碼是有的,但很少,在合理范圍之內(nèi),特別是不會(huì)出現(xiàn)常用字與常用詞,常用詞之間的重碼,這使重碼對(duì)輸入速度這個(gè)大局沒(méi)有大的妨礙。
權(quán)利要求
1.包容五筆字型的五碼詞為主字為輔復(fù)合碼是一種計(jì)算機(jī)輸入編碼,它采用五筆字型的字根、字型、筆劃和大部分漢字編碼規(guī)則及方法,對(duì)五筆字型的漢字編碼全包容,其特征在于它的標(biāo)準(zhǔn)單位編碼碼長(zhǎng)為五碼,詞碼由詞首字全碼加上詞后字部分編碼組成,字母“Z”鍵或其他予留鍵為詞首字全碼定義碼和組詞提示碼,規(guī)定了作為詞首字的25個(gè)一級(jí)特碼字和75個(gè)二級(jí)特碼字以及詞碼簡(jiǎn)碼。
2.根據(jù)權(quán)利要求1所述的標(biāo)準(zhǔn)單位編碼碼長(zhǎng)為五碼,字碼和詞碼簡(jiǎn)碼碼長(zhǎng)不足五碼,輸入計(jì)算機(jī)時(shí),后面要加打空格鍵。
3.根據(jù)權(quán)利要求1所述的字母“Z”鍵或其他予留鍵,在一般情況下,在詞碼編碼第一位,第二位、第三位出現(xiàn)時(shí),是作為詞首字全碼定義碼使用的。
4.根據(jù)權(quán)利要求1所述的詞碼的詞首字全碼有三種(一)五筆字型字編碼全碼,(二)五筆字型一、二級(jí)簡(jiǎn)碼字編碼后加詞首字全碼定義碼,(三)本發(fā)明規(guī)定的一、二級(jí)特碼字編碼加上詞首字全碼定義碼。
5.根據(jù)權(quán)利要求1和4所述的本發(fā)明規(guī)定的作為詞首字的一、二級(jí)特碼字為25個(gè)一級(jí)特碼字是除了五筆字型一級(jí)簡(jiǎn)碼字以外,作為詞首字組詞,在中文中出現(xiàn)頻率最高的,其五筆字型字編碼首碼分屬于除“Z”以外的25個(gè)字母的25個(gè)字;75個(gè)二級(jí)特碼字為除了五筆字型一、二級(jí)簡(jiǎn)碼字和一級(jí)特碼字以外,作為詞首字組詞,在中文中出現(xiàn)頻率最高的,每三個(gè)字為一組,共25個(gè)組,其五筆字型字編碼的大部分首碼,少部分二碼或三碼或四碼分屬于除“Z”以外的25個(gè)字母的75個(gè)字。
6.根據(jù)權(quán)利要求1、3、4、5所述的除是五筆字型編碼全碼以外的詞首字全碼組成規(guī)則為五筆字型一、二級(jí)簡(jiǎn)碼字的編碼后加一個(gè)詞首字全碼定義碼;一級(jí)特碼字的編碼前加一個(gè)詞首字全碼定義碼;二級(jí)特碼字分成三隊(duì),每隊(duì)25個(gè)字,一隊(duì)二級(jí)特碼字編碼,后加兩個(gè)詞首字全碼定義碼,二隊(duì)二級(jí)特碼字編碼,前后各加一個(gè)詞首字全碼定義碼,三隊(duì)二級(jí)特碼字編碼,前加兩個(gè)詞首字全碼定義碼。
7.根據(jù)權(quán)利要求1所述的詞碼的詞后字部分編碼采用五筆字型全碼編碼;詞后字部分編碼碼長(zhǎng)為三至一碼;詞后字部分編碼的規(guī)則為為三碼時(shí),如是二字詞,則三碼分別為詞二字的首碼,二碼、三碼;如是三字詞,則三碼分別為詞二字的首碼,二碼,詞三字的首碼;如是四字詞或四字以上詞,則三碼分別為詞二字首碼,詞三字首碼,詞四字或末字首碼;為二碼時(shí),如是二字詞,則二碼分別為詞二字首碼,二碼;如是三字詞或三字以上詞,則二碼分別為詞二字首碼,詞三字或末字首碼;為一碼時(shí),無(wú)論幾字詞,詞后字部分編碼均為詞末字首碼。
8.根據(jù)權(quán)利要求1所述的詞碼簡(jiǎn)碼有詞首字為五筆字型的一、二級(jí)簡(jiǎn)碼字,本發(fā)明規(guī)定的一、二級(jí)特碼字組成的詞碼簡(jiǎn)碼和正好位于五筆字型字編碼空檔的詞碼簡(jiǎn)碼這兩種簡(jiǎn)碼。
9.根據(jù)權(quán)利要求1所述的字母“Z”或其他予留鍵在詞碼編碼的詞首字全碼后出現(xiàn)時(shí),是作為組詞提示碼使用的;特殊的是,對(duì)于五筆字型一級(jí)簡(jiǎn)碼字和本發(fā)明規(guī)定的一級(jí)特碼字在組詞提示時(shí),是在其詞首字全碼之前加三個(gè)組詞提示碼;組詞提示是將被提示的字,作為詞首字,詞中字,詞尾字所組成的常見(jiàn)詞及編碼顯示出來(lái),起到組詞提示作用。
全文摘要
中文都是以詞為主、字為輔。而五筆字型是單字輸入。本發(fā)明是借助五筆字型編碼規(guī)則并加以創(chuàng)新的一種以詞為主、字為輔的計(jì)算機(jī)輸入編碼。本發(fā)明標(biāo)準(zhǔn)碼長(zhǎng)為五碼,簡(jiǎn)碼為二至四碼,收入近十萬(wàn)個(gè)常用詞和全部國(guó)標(biāo)漢字,重碼少,輸入速度比五筆字型快得多,編碼規(guī)則簡(jiǎn)單,不需特別記憶。熟悉五筆字型的人半小時(shí)可掌握,一周可記熟數(shù)萬(wàn)個(gè)常用詞的編碼。本發(fā)明推廣容易,必將成為替代五筆字型的,在國(guó)內(nèi)外使用面最廣的計(jì)算機(jī)輸入編碼。
文檔編號(hào)G06F3/023GK1091533SQ9311489
公開(kāi)日1994年8月31日 申請(qǐng)日期1993年11月24日 優(yōu)先權(quán)日1993年11月24日
發(fā)明者王小寧 申請(qǐng)人:王小寧