專利名稱:統(tǒng)一漢字輸入法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種形碼電腦漢字輸入法及其鍵盤,尤其涉及一種統(tǒng)一漢字輸入法及其鍵盤。
背景技術(shù):
眾所周知,現(xiàn)在流行的漢字輸入法是王碼五筆,還有智能,ABC,拼音輸入法等等,用于手機(jī)上的漢字輸入法是Motorola的9鍵漢字輸入法(采用的是一位教授的漢字輸入法專利技術(shù)),基于5個基本筆劃(橫豎撇點(diǎn)折)的漢字輸入法,還有在香港流行的九方漢字輸入法。但王碼五筆基本上不能用于移動電話或手機(jī)、PDA和電子詞典上,9鍵以及基于5個基本筆劃的用于PC機(jī)卻效率都很低。“九”方的漢字輸入法是導(dǎo)碼輸入方式(即一步一步提示選擇輸入),應(yīng)用于pc機(jī)則不能盲打。全拼的重碼率太高,頻繁選字造成輸入效率大大下降,形碼比之于全拼,輸入效率要高很多,但由于使用難度大,使得其普及應(yīng)用還遠(yuǎn)遠(yuǎn)比不上全拼輸入法,形碼僅僅占輸入法市場10%的用戶,而全拼依然擁有90%的用戶?!半p筆劃”輸入法基本上使用的是《辭?!冯p比劃檢字法,但是打字時,把雙筆劃翻譯為按鍵的記憶回映時間較長。人們對漢字的認(rèn)識還是基于偏旁部首和分塊結(jié)構(gòu)的,“雙筆劃”就顯得很不直觀,不符合對漢字的認(rèn)識與學(xué)習(xí)規(guī)律?!巴醮a五筆”雖是基于字根分塊的,但不是表形碼,字根分類有一定的隨意性,很多專家認(rèn)為不符合認(rèn)知與學(xué)習(xí)的形象思維,學(xué)習(xí)與記憶難度相當(dāng)大,必須經(jīng)過幾個月嚴(yán)格的培訓(xùn),才能逐漸熟練,打得快但不好學(xué),不用即忘,打字員的勞動強(qiáng)度非常高。“王碼五筆”最典型的缺點(diǎn)是若一段時間不使用就會忘記?!皞}頡”是比“王碼五筆”更難學(xué)的輸入法,只是香港、臺灣地區(qū)和東南亞一些國家的主流輸入法?,F(xiàn)在市場上還出現(xiàn)了一種叫“酷極”的形碼輸入法,“酷極”表形碼雖然屬于形碼,但其分類的易于記憶的特征不足,即象形特征不足,不能對“五筆”構(gòu)成威脅,也不易成為最好的輸入法。所以目前來說仍然有大量人員在研究更加適合用戶的簡單易用而使用效率更高的漢字輸入法。
發(fā)明內(nèi)容
本發(fā)明的目的在于為克服現(xiàn)有技術(shù)的不足而提供一種易于記憶,使用方便,重碼率低的統(tǒng)一漢字輸入法及鍵盤。其技術(shù)方案為統(tǒng)一漢字輸入法及鍵盤,用符合編碼規(guī)則的一至五位碼長進(jìn)行漢字編碼,用字母鍵形成拼形組字,拼形組詞,將優(yōu)選的字根分配在計(jì)算機(jī)通用鍵盤的二十六個字母鍵里,用漢字特征根分類,用漢字字尾特征識別碼識別和減少重碼,對手機(jī)鍵盤,將26個字母分成12類,分別安排在0-9和※、#號鍵, 各字母鍵,字根(見附圖6)。
字尾特征識別碼分為十六類(見附圖2)。
字尾特征識別碼是當(dāng)漢字的字尾是如上圖中的情況時可補(bǔ)打?qū)?yīng)的字母。統(tǒng)一輸入法用這種字尾識別碼取代王碼五筆的基于五個單筆劃和三個字形特征組成的識別矩陣,不用推算,更為直觀,效率更高,具有比王碼五筆識別碼更大的優(yōu)越性。上圖中的數(shù)字1/2/3/4/5/6/7/8是用于12鍵手機(jī)鍵盤(見附圖5)的識別碼。
對手機(jī)鍵盤,還可采用將字根分配在0-9數(shù)字鍵和※、#鍵里,其數(shù)字,字根(見附圖3,12鍵可充分利用手機(jī)的硬件資源)。
本發(fā)明主要采用象形編碼、漢字部件或字根大多數(shù)都與英文字母的字型相似或通過聯(lián)想相似,從分類規(guī)律上看,由于有與相關(guān)字母的極其相似和可聯(lián)想的特點(diǎn),比之如王碼五筆等大量的輸入法,可以發(fā)現(xiàn)其記憶性能和易用性的大大增強(qiáng),基本上可以見字識碼,使得漢字輸入法有了巨大的進(jìn)步。
本發(fā)明26鍵編碼方法應(yīng)用于6763個GB2312漢字,其重碼數(shù)為0;該編碼方法應(yīng)用于22100個GBK漢字進(jìn)行測試重碼率為2.2%(重碼對數(shù)為500做右),而“五筆”用于6763個漢字的重碼對數(shù)為60~90對,港臺流行的“倉頡”漢字輸入法用于13000個BIG5漢字其重碼數(shù)為400多(但如果改為4位碼長,則重碼對數(shù)為1500多),德仔表形碼用于22000個GBK漢字,其重碼對數(shù)為5000-6000多,由此對比可見,“統(tǒng)一”加上了字尾特征識別碼后其重碼率是遠(yuǎn)遠(yuǎn)優(yōu)于當(dāng)今的主流漢字輸入法的,其應(yīng)用前景勢不可擋。
本發(fā)明把26個鍵組合到手機(jī)的12個鍵上,若使用GB2312字庫的6763個漢字進(jìn)行測試,重碼率為33%。用22100個漢字進(jìn)行測試,其重碼率為43%。但實(shí)際效果要好得多,因?yàn)槌S米执蠹s只有3750個左右,用2-4鍵就可把常用字打出候選,重碼數(shù)一般在2-4個,大大地?cái)U(kuò)大了該輸入法的使用范圍,使之可用于成千上萬的手機(jī)上面。
圖1是本發(fā)明統(tǒng)一漢字輸入法及其鍵盤的字根表; 圖2是本發(fā)明統(tǒng)一漢字輸入法及其鍵盤的漢字字尾特征識別碼及分類; 圖3是本發(fā)明統(tǒng)一漢字輸入法(26鍵)應(yīng)用于手機(jī)的鍵盤字母分布圖; 圖4是一個33鍵輸入法的字根表圖。
圖5是一個12鍵的手機(jī)鍵盤字根分布圖。
圖6是本發(fā)明統(tǒng)一漢字輸入法及其鍵盤的字母鍵、字根圖。
具體實(shí)施例方式 下面結(jié)合附圖,對本發(fā)明作進(jìn)一步詳述 實(shí)施例1參見附圖1,附圖2,本發(fā)明的統(tǒng)一漢字輸入及其鍵盤將字根,漢字字尾識別碼列入表中,將字根分配在如圖1所示的計(jì)算機(jī)通用鍵盤的26個字母里,用字母鍵形成拼形組字,拼形組詞的格局。
附圖1說明如下 AA鍵上的字根都很象字母‘A’的“人”字結(jié)構(gòu),都隱含有“人”的特征;
這個字根是為了對有些繁體字進(jìn)行編碼,禿寶蓋上方的兩個并排的火字規(guī)定拆為一個字根。飠與食的字根都在該鍵上。
BB鍵上的字根如“早日”,口中有一豎或一橫的字根,另外兩個口字并排的結(jié)構(gòu)在繁體字集中用的很多,也作為一個字根處理。
CC鍵可叫“馬車”鍵,上部都有個缺口,“土”字也可沿豎線分解為兩個缺口。還有如C型的缺口已己
巴,起筆逆時針方向旋轉(zhuǎn)的“折”,但不包括
DD型“刀片”鍵“刀片爿
”,包括起筆順時針方向旋轉(zhuǎn)的“折”,但不包括如
乙Z型的折。另有如“了阝卩 馬乃”等字根,以“橫折”起筆。D鍵上的字根沒有交叉結(jié)構(gòu)。
E“三E”鍵,E型的左右對稱型,字根上都隱含有三橫。‘王’字可劃分為左右對稱的兩個E型。
F含有“禾”兩個主字根,隱含有兩橫,還有近似于F的變型。
G“G鍵”有些含有兩個連繼的折,另外的都含有“撇折+點(diǎn)”,非常類似于字母G的寫法。G鍵上還有三個又形,含2或三個交點(diǎn)。
H“艸”草頭及其變形草頭,還有如“工業(yè)皿革”等左右對稱的結(jié)構(gòu)。尤其是“業(yè)”的各種簡繁體寫法中的對稱結(jié)構(gòu)與“贏鼎肅“這三個字中的復(fù)雜結(jié)構(gòu)如
Ii型含有如卜
丨等子結(jié)構(gòu)的部件,如“上止”。
Jj鍵上面一排包含類似于“廣”起筆的結(jié)構(gòu)如疒
勹
,多為半包圍結(jié)構(gòu)。下面一排多為“折點(diǎn)”、“折撇”起筆。另外還有4種叉型
寸力
K除主字根“蟲”,其它是隱含“冫”子結(jié)構(gòu)或其旋轉(zhuǎn)子結(jié)構(gòu)的字根類。
L以點(diǎn)或點(diǎn)橫起筆的字根集(言文方
,不含“K”型子結(jié)構(gòu)。
M包括“十忄宀車門”主字根,另外還有M型字根
甫
用
(有3到4個縱向的筆劃)。
N缺口朝下的n型構(gòu)件,要特別注意
這幾個字根,如“凹凸”可分別拆為“upp”和“npp”。
O口,○筐的內(nèi)部不含有其它筆劃或字,如囡qv。
P橫及橫起筆的一些字根“一西酉石牙”。P型字根“尸”,門的半邊很象P,也作P型字根。
Q方筐中有兩個或以上筆劃“田目罒臼貝”,還有“口日”與“十”的筐叉結(jié)構(gòu)“母毋
甲”,
,“
甲”。
R“立人”鍵r含“撇”,直立的“亻彳”字鍵,把
刂這些部件想象成站立的人的兩條腿。
S“川水”鍵,如彎彎的河流,包括各種水的變型,為便于記憶,還把“雨黑”兩個含有四點(diǎn)水的部件放在S鍵上。
Tt鍵包含象“T”和“t”型的結(jié)構(gòu),除“扌手”外最多只有一個交叉點(diǎn)。
U十與“E”型的交叉結(jié)構(gòu),“缺口”內(nèi)含有部件的較復(fù)雜字根。
V“魚尾”鍵,“撇,橫折”起筆,還有“女”
,注意對33鍵的輸入法丷在V鍵而不在A上。
W主要字根是“钅釒”主要是“撇撇”,“撇橫”,“撇橫點(diǎn)”,“撇折點(diǎn)“夕”雙筆劃起筆的字根。
X象形于x或*的交叉形字根“乂
犭
米
”。
Y“小木”鍵,Y形部件,如“丫
”。
ZZ形的折
乙
,‘廴
身舟’,之的底部,還有“五
”的Z字型結(jié)構(gòu),‘五’的草書字體也很象
,字根‘又’是
的上半部。
本發(fā)明將漢字分為字根字,非字根字兩大類,每個字根都有一個代碼,某些字根本身就是一個單字即為字根字,非字根字的編碼方法如下 成字字根=字根編碼+字尾識別碼+聲碼+重復(fù)聲碼; 單字(有兩個字根)=第一字根編碼+第二字根編碼+字尾識別碼+聲碼; 單字(有三個字根)=第一字根編碼+第二字根編碼+第三字根編碼+字尾識別碼; 單字(大于三個字根)=第一字根編碼+第二字根編碼+第三字根編碼+最末字根編碼; 字尾特征識別碼包括了基本的橫P、豎i、撇r、點(diǎn)L(捺)四個單筆畫。根據(jù)折筆的起筆運(yùn)轉(zhuǎn)方向,把折筆分為4種情況 逆時針起筆的折(C鍵)
ㄣ,例如區(qū)cx/cxc,兦ac/accw; 順時針起筆的折(D鍵)乛亅ㄋ
,例如則nr/nrd,到gcr/gcrd; 豎折鉤(U鍵)乚,例如扎tu/tuu,倉ac/acu; 類似于Z鍵形狀的折(Z)廴
乙
辶
,例如億rz/rzz,之lz/lzl,遠(yuǎn)fwz/fwzl; “人”字型字尾特征為A鍵,例如責(zé)en/ena,姀vf/vfa,米x/xa,是bi/bia,蛽kq/lqa,林yy/yya; K形特征的識別碼在K鍵,例如衣lk/lkk,長k/kk,跳zws/zwsk,疼jvs/jvsk,炎aa/aak,冰ks/ksk,食a/ak,家mp/mpk/mpkk,張dek/dekk; “日”字型的識別碼在Q鍵,例如昍bb/bbq,昌bb; “四目田口”其他除”日”字的四面圍特征根的識別碼在B鍵,例四q/qb,晶bbb,晿bbb/bbbq,品ob/obq,灑sp/spb,酒sp,圓qon/qonb; “小”“心”以及有四點(diǎn)水的特征識別碼為S鍵,例如小y/ys,雷sq/sqs,黯skb/skbs,志cg/cgs,馼cl/cls,傌rc/rcs。要注意“馬鳥魚雨黑”這幾個字作為偏旁部首無論出現(xiàn)在字首或字尾,其字尾識別碼都為S。
“又攵夂文”型識別碼為X鍵,例又z/zx,枚yv/yvx,紋gl/glx,雙zz/zzx,復(fù)wbv/wbvx; “ㄨ”的識別碼為V鍵,例岡nx/nxv,風(fēng)ux/uxv;“月”的識別碼為F鍵,例有xn/xnf; “丨”豎的識別碼為i鍵,例申bi/bii,吲odi/odii; “一”橫的識別碼為P鍵,例二f/fp,仨re/rep; “丿”撇的識別碼為r鍵,例易bjw/bjwr,勿jw/jwrw; “丶”點(diǎn)的識別為L鍵,例勺/jl/jll,村yj/yjl。
如果漢字加字尾識別后不滿四碼還可加一到兩個聲碼(這里聲碼是指該漢字拼音的首字母)。
詞組編碼方法一 雙字詞=第一字的前兩碼+第二字的前兩碼; 三字詞=第一字的前一碼+第二字的前一碼+第三字的前三碼; 四字詞=第一字的前一碼+第二字的前一碼+第三字的前一碼+第四字的前兩碼; 五字及以上的詞=第一字的前一碼+第二字的前一碼+第三字的前一碼+第四字的前一碼+第一的前一碼; 詞組編碼方法二 雙字詞=第一字的聲碼+第二字的聲碼+第一字的形碼+第二字的形碼; 三字詞=第一字的聲碼+第二字的聲碼+第三字的聲碼+第二字的形碼+第三字的形碼; 四字詞=第一字的聲碼+第二字的聲碼+第三字的聲碼+第四字的聲碼+第四字的第一形碼; 四字以上詞=第一字的聲碼+第二字的聲碼+第三字的聲碼+第四字的聲碼+第五字的聲碼; 詞組編碼方法二是以聲碼為主的編碼方法,因?yàn)榭紤]到全拼輸入法占有90%的用戶,采用方法二對三字及以上長度的詞組編碼來說,可以大大方便用戶,提高輸入效率。在七萬多漢字中有很多是沒有讀音的,所以形碼和拼音要做到具有互補(bǔ)性。
鑒于全拼擁有90%的用戶,詞組編碼方法二就是針對懂漢語拼音的用戶而專門設(shè)計(jì)的詞組輸入方法,可以更加提高輸入效率。
實(shí)施例2,參見附圖4,統(tǒng)一漢字輸入法及其鍵盤的33鍵輸入法,它采用了比26鍵多加了=、/、\、-、·、,、;七個按鍵符號,將繁體字偏旁和簡體字偏旁分開,使繁體字和簡體字無重碼,編碼方法相同。
實(shí)施例3,參見附圖3,26鍵統(tǒng)一漢字輸入法及其鍵盤在手機(jī)上的應(yīng)用。
從附圖3上可以看出使用了12個鍵,對于21鍵的手機(jī),硬件資源稍微有點(diǎn)緊張,要用一個確認(rèn)鍵來輸入空格,標(biāo)點(diǎn)符號需要編入漢字組。對于有24個按鍵的手機(jī),輸入標(biāo)點(diǎn)符號和空格是沒有任何問題的。若使用GB2312標(biāo)準(zhǔn)的6763個漢字集,其重碼率為33%。應(yīng)用于手機(jī)是完全可行的,比全拼輸入法在手機(jī)上應(yīng)用時的重碼率小得多。
實(shí)施例4,統(tǒng)一漢字輸入法精簡字根集用在手機(jī)鍵盤上的字根分布圖(見附圖5),把字根分布在1、2、3、4、5、6、7、8、9、0、※、#十二個鍵上。對漢字采用碼長為四,取一二三末字根的編碼方法。
權(quán)利要求
1、 一種統(tǒng)一漢字輸入法及其鍵盤,用符合編碼規(guī)則的一至五個位碼長進(jìn)行漢字編碼,用字母鍵形成拼形組字,拼形組詞,其特征在于將優(yōu)選的字根分配在計(jì)算機(jī)通用鍵盤的二十六個字母鍵里,用漢字特征根分類,用漢字字尾特征識別碼識別和減少重碼,對手機(jī)鍵盤,將26個字母分成12類,分別安排在0-9和※、#號鍵,各字母鍵,字根如下
A人入八
亽
飠
B
日曰
C 匚已己
巴
土士
D刀乃了乛亅
弓卩阝馬[刀片爿
]
E
彐
耳
F 禾
斤
夫
G纟
幺心戔戈
糹鬼
H工艸廿廾
皿
業(yè)
革
i礻衤卜
丨上
j
虍
戊
寸力
k 蟲冫習(xí)羽巛
長
立六
L 讠丶
文方
m 宀門古十
忄
用
n
貝
O 口
P一石酉西
尸
門
Q 目
罒四口
母
r 亻彳
刂 丿
s 氵灬
川水灬
雨黑
t扌(手)
七丁
U 山由
肀
尹
臣九幾乚
V魚魚
女
W 钅
爫兒
彡夕歹
釒
K大米乂
Y 丫
木小
Z 廴
乙
辶
五
字尾特征識別碼分為十六類如下
1 i 丨
2 p-一
3 L 丶
辶 之
6 r / 丿
4 c
7 D
亅 乛
6 u 乚
6 z 乙
8 B 口四目田囗西酉
k 食
火長
5A木
貝
米
X
夂夂又文
S
雨
小心
V乂
F月
Q
日
曰
2、 根據(jù)權(quán)利要求1所述的一種統(tǒng)一漢字輸入法及其鍵盤,其特征在于對手機(jī)鍵盤還可采用將字根分配在0-9數(shù)字鍵和※、#鍵里,其數(shù)字、字根如下
1 亻彳忄卜
丨上止
刂
2 讠言一亠二
3 丶冫
氵
水
4
纟
心[
女](4形交點(diǎn))
5 人入八
6 釒钅
乚丿兒
7 衤礻
8 日
9
冂門
0
囗
* 大乂木米
# 扌
艸廿(多于兩個交點(diǎn))
(只有一個交點(diǎn))。
全文摘要
本發(fā)明公開了一種統(tǒng)一漢字輸入法及其鍵盤,用符合編碼規(guī)則的一至五位碼長進(jìn)行漢字編碼,用字母鍵形成拼形組字,拼形組詞,其特征在于將優(yōu)選的字根分配在計(jì)算機(jī)通用鍵盤的二十六個字母鍵里,按漢字特征根分類,用漢字字尾特征識別碼識別和減少重碼,對手機(jī)鍵盤,將26個字母分成12類,分別安排在0-9和※、#號鍵,各字母鍵,本發(fā)明從分類規(guī)律上看,由于有與相關(guān)字母的極其相似和可聯(lián)想的特點(diǎn),比之如王碼五筆等大量的輸入法,可以發(fā)現(xiàn)其記憶性能和易用性的大大增強(qiáng),基本上可以見字識碼,使得漢字輸入法有了巨大的進(jìn)步。
文檔編號H04M1/23GK101286090SQ20071005045
公開日2008年10月15日 申請日期2007年11月7日 優(yōu)先權(quán)日2007年11月7日
發(fā)明者趙元鴻 申請人:趙元鴻