專利名稱:計算機(jī)漢字字音碼編碼方法及輸入鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼方法,尤其是一種計算機(jī)漢字編碼輸入方法以及輸入鍵盤。
現(xiàn)有的漢字編碼技術(shù)方案,設(shè)計效果上都面臨一個矛盾,即操作速度快、重碼率低的編碼方案(多為形碼)其編碼規(guī)則比較復(fù)雜,并要求用戶硬記大量的漢字拆分符號,掌握起來難度較大,而且對于操作者寫不出來的字或者寫不正確的字則無法輸入;編碼規(guī)則簡單,記憶量小的編碼方案(多為音碼)其輸入速度又比較低,且重碼率較高,對于不認(rèn)識的字也無法輸入。因此,現(xiàn)有的漢字編碼方案,無論是音碼還是形碼都存在著自己的編碼盲區(qū)。音碼和形碼的這些缺點(diǎn),是由于它們在利用現(xiàn)有漢語基礎(chǔ)知識時的偏頗造成的。音碼完全排斥有關(guān)漢字字形結(jié)構(gòu)的語文基礎(chǔ)知識,而形碼則反過來完全排斥有關(guān)漢語語音的基礎(chǔ)知識。在現(xiàn)實(shí)的編碼領(lǐng)域內(nèi),音碼和形碼各自的優(yōu)缺點(diǎn)引出一種割據(jù)局面一方面,大多數(shù)非專業(yè)漢字輸入的用戶使用著規(guī)則簡單,容易掌握,但錄入效率很低的音碼;另一方面,少數(shù)專業(yè)漢字輸入的用戶,不得已使用著一種記憶量大,規(guī)則復(fù)雜,較難掌握,但高效率、低重碼的形碼。很多高效率,低重碼編碼方案的設(shè)計著眼點(diǎn),主要是放在提高輸入速度和降低重碼上,在拆分上很少,也很難兼顧漢字本身的結(jié)構(gòu)規(guī)律,這就給操作者帶來難于掌握、難于記憶、難于拆分,重碼率高,輸入速度慢等諸多不便,另外還難以同漢語教學(xué)密切有機(jī)地結(jié)合。如何最大限度地克服上述矛盾,設(shè)計出高效率,低重碼,使用規(guī)則簡單,要求記憶量少,拆分上能順應(yīng)漢字結(jié)構(gòu)規(guī)律,并能同漢語教學(xué)密切有機(jī)結(jié)合的優(yōu)質(zhì)編碼方案,是人們共同關(guān)心的焦點(diǎn)問題。
本發(fā)明的目的在于克服現(xiàn)有技術(shù)之不足,提供一種易于拆分,無需記憶,不存在編碼盲區(qū),重碼率低,輸入快捷,且符合漢語規(guī)范的計算機(jī)漢字編碼方法。
本發(fā)明的另一個目的在于提供一種適用于上述編碼方法的輸入鍵盤。
本發(fā)明的編碼方案在漢字編碼中屬形音結(jié)合碼類。編碼碼長四位,前三碼為形碼,第四碼為音碼。形碼有一至三碼不等,而末碼必須是一位音碼。
本發(fā)明的具體編碼方案是將漢字拆分為筆畫、成字元、常字元和異字元四種不同性質(zhì)的結(jié)構(gòu)成分,并將它們讀音的首位字母歸入所對應(yīng)的英文字母鍵盤上。
所述漢字筆畫分為橫、豎、撇、捺、折五種,以其讀音的首位字母為編碼,具體是漢字筆畫一丨丨丿乀丶乙 …名稱橫 豎 撇捺 折編碼h s p n z所述成字元就是以獨(dú)體結(jié)構(gòu)形態(tài)存在于漢字結(jié)構(gòu)中的常用漢字。以其讀音的首位字母為編碼(個別帶“*”號者除外),具體是a 凹b 八巴白百半辦本必丙卜不步匕c 才冊叉廠長車臣成尺赤斥蟲丑出川串匆寸丞d 大歹丹旦刀電刁丁東e 而兒耳二f 乏凡方非飛豐夫弗甫木*g 干甘戈個更工弓瓜廣果丐h 禾乎互戶火j 擊及幾己夾甲柬巾今井久九臼k 開虧l 來樂里吏立隸力良兩了龍m 馬毛矛么門米面滅民皿末母目n 乃內(nèi)鳥牛農(nóng)女o 口*p 皮片平q 七乞氣千且丘求曲犬r 人刃入冉日(曰曰)s 三山上勺少申身甚生升失尸十石史矢士世氏術(shù)手首束水己肅豕巳t 太天田屯w 瓦丸萬王亡韋為未衛(wèi)我烏無五午戊勿x 西夕習(xí)下鄉(xiāng)小心血y 丫牙亞嚴(yán)央羊也業(yè)夷亦義尹永用尤由酉又于予雨與禹玉月夭禺幺z 再乍丈兆正之止中重州朱主爪專子自所述常字元就是漢字結(jié)構(gòu)中經(jīng)常出現(xiàn)的不成字符號,以該符號名稱中關(guān)鍵字讀音的首位字母為編碼(帶“*”者除外),具體是常字元符號 常字元名稱 關(guān)鍵字編碼字例醫(yī)函己貝同三匡兒 匡k醫(yī)己且貝山尸兇弓月同央上卜字變體 卜b卡占上盧刂丌師臨 立刀旁 刀d別師臨齊氘覽養(yǎng)一每字頭 每m復(fù)乍年氣每乞亻 單人旁 人r位什佛廠 斜廠兒 廠c反斤質(zhì)后派盾立 倒八頭 八b曾丫半兌關(guān)蘭并關(guān)單友義 斜叉兒 叉c友右丈希殺駁義勹 句字頭 句j勺勾句勿包匈旬葡亠 京字頭 京j京亡市衣亦文亭哀冫 兩點(diǎn)水 水s冷涼沖斗 兩點(diǎn)兒 點(diǎn)d冬頭斗寒讠*言字旁 u說計談講阝卩厄 耳朵旁 耳e耶卻防衛(wèi)報服倉厄危欠 刀字頭 刀d色角欠爾負(fù)危爭予 矛字頭 矛m矛勇予厶 私字兒 私s至雄叁牟弘宏套棄育廴辶 走之底 之z邊這建迢邁豐 奉字底 奉f奉擇舉敖艸廿共 草字頭 草c草花共黃展廾 弄字底 弄n弄開升井鼻痹棄扌*提手旁 a提拋?zhàn)酱蚩?四邊圍 圍w國囪囟鹵因彳雙人旁人r行徐徒彷彡三撇兒撇p參彰形犭豹 反犬旁犬q狗狄獲豹霾犯饣食字旁食s蝕飲餅饑飼丬爿 將字旁將j漿將北狀妝忄小 豎心旁心x悍愉怖添恬懷氵* 三點(diǎn)水 v漢江池溪彐彐 橫山兒山s歸隸尹宀冖 寶蓋兒蓋g寶字富冗堂營冤農(nóng)光小字變體 小x黨肖當(dāng)黨光纟纟* 絞絲旁 p紅編絲巛三拐兒拐g巢巡生青字頭青q青表責(zé)老老字頭老l老者足足字底足z是走蛋足特告 牛字旁牛n特牧告靠先攵冬 反文旁文w攻收備冬各衣衣字底衣y表衣農(nóng)哀裹采爪字變體 爪z采愛舀孚灬四點(diǎn)底點(diǎn)d杰然點(diǎn)煮春春字頭春c春泰秦卷卷字頭卷j卷眷拳券礻示字旁示s社禮視曼假四字四s署羅蜀钅金字旁金j銅鐵鋼鋁拜手字變體 手s看拜掰
afo,puv;手木口,絲言水。
字音碼的最后一碼為音碼,取該漢字整字讀音的首位字母。
字音碼的編碼原則是筆序原則和后并原則。筆序原則是指形碼按書寫筆序取一二末碼。在拆分漢字取得形碼時,處于漢字結(jié)構(gòu)中間部分的字元(或筆畫)并入前面的部分或并入后面的部分會使得拆分取碼不確定。遇此情況應(yīng)將處于中間的部分的字元(或筆畫)并入后面的部分,這就是后并原則。
例如正誤干→一十 干→二丨開→一廾 開→二丌王→一土 王→干一朱→丿未 朱→每木字音碼的編碼過程是在編碼原則下,將漢字區(qū)分為獨(dú)體字和合體字,然后拆取形碼,形碼不足三碼時,如有可能,應(yīng)進(jìn)行末復(fù)拆分補(bǔ)碼,將形碼補(bǔ)足為三碼,最后加上該漢字的整字讀音的首位字母(音碼)。
所述編碼過程中,獨(dú)體字拆取形碼的方法是依序按[字元+筆畫]、[字元+字元]、[字元+i]、[筆畫++]四種類型拆分編碼,具體是[字元+筆畫]型拆分是把獨(dú)體字拆分成一個可識字元和一個筆畫,如獨(dú)體字 拆分 編碼獨(dú)體字 拆分編碼干 一十hsg 刃 丶刀 ndr日 口一ohr 歹 一夕 hxd衛(wèi) 卩一ehw 乞 乞乙 mzq生 丿生pqs 么 丿厶 psm子 了一lhz 成 戊乙戈 wzgc由一個可識字元和兩個互不粘連的獨(dú)立筆畫組成,或由一個筆畫和兩個可識字元組成的獨(dú)體字也適合這種拆分類型,如獨(dú)體字 拆分 編碼 獨(dú)體字拆分 編碼冊月月一kkhc瓜 廠厶乀 csng氣乞一乙mhzq爪 廠丨乀 csnz今人丶乙rnzj為 丶力丶 nlnb[字元+字元]型拆分是把一個獨(dú)體字拆分成兩個完整(不留筆畫)的可識字元,如獨(dú)體字 拆分 編碼 獨(dú)體字拆分 編碼央 貝大人 kdry且 貝三二kseq月 月二 key 夷 大弓口dgky弗 弓丌口 gdkf農(nóng) 冖衣 gyn[字元+i]型拆分是,對于一半是可識字元,另一半是異字元的獨(dú)體字,拆取這個可識字元和異字元,如獨(dú)體字 拆分 編碼 獨(dú)體字拆分 編碼石石口 ios 蟲 中蟲口zioc斤斤斤 cij 年 每年 min可識字元和異字元間筆畫交叉的獨(dú)體字不適用[字元+i]型拆分,如曳、甫、專、樂、東……。型拆分就是,凡不能按以上拆分類型進(jìn)行拆分的獨(dú)體字,視為是純粹由筆構(gòu)成的獨(dú)體字,一律拆取一二末三個筆畫,這就是[筆畫++]型拆分,如獨(dú)體字 拆分 編碼 獨(dú)體字拆分 編碼凹丨乙一 szha 重 丿一一 phhc不一丿丶 hpnb 求 一丨丶hsnq廠一丿 hpc 長 丿一人 phnc所述編碼過程中,合體字拆取形碼的方法是根據(jù)編碼原則,從合體字中拆取一二末三個字元和單一筆畫。在拆分合體字時須強(qiáng)調(diào)注意以下三點(diǎn)1.常字元任何時后都只能按整體來對待,當(dāng)其是合體結(jié)構(gòu)時也不能被拆分,如合體字 正確拆分錯誤拆分錯誤原因路路夂口 口止口 拆分了常字元病病丙內(nèi) 廣習(xí)丙 拆分了常字元2.從合體字中拆取的筆畫只能是單個筆畫。同一結(jié)構(gòu)區(qū)域內(nèi),連續(xù)兩個及兩個以上的散筆畫應(yīng)作為字元,構(gòu)不成可識字元者,當(dāng)異字元看待,如合體字拆分 編碼漢字拆分編碼合 人一口rhoh 以 以人iry修 亻丨彡rspx 歸 歸歸dsg言 一二口jeoy 分 八刀bdf臉 月人僉yril 學(xué) 興冖子 igzx3.成字元是獨(dú)體結(jié)構(gòu),既不能錯取成合體結(jié)構(gòu),也不能錯把成字元拆開,如合體字正確拆分錯誤拆分 錯誤原因則 貝人刂 貝刂把合體結(jié)構(gòu)當(dāng)成成字元蘇 艸辦艸力八 拆分了成字元“辦”所述編碼過程中,末復(fù)拆分補(bǔ)碼是指不論是合體字還是獨(dú)體字,拆取形碼只能得到兩碼時,編碼長度不夠,容易引起重碼。此時應(yīng)從已拆得的成字元(如果有)中,復(fù)拆取最末一個可識字元作為補(bǔ)碼,如漢字 拆分編碼 說明最 日耳又 reyz 碼長已夠三碼不需末復(fù)拆分補(bǔ)碼開 一開 hnk無成字元可進(jìn)行末復(fù)拆分補(bǔ)碼可 丁口 dok已拆得的成字元不能復(fù)拆分出可識字元江 氵工 vgj(同上)引 弓丨口 gsky 從“弓”中復(fù)拆取可識字元“口”作補(bǔ)碼咱口自目ozmz 從“自”中復(fù)拆取可識字元“目”作補(bǔ)碼親立木立lfbq “立”中復(fù)拆取可識字元最末者是“立”使用字音碼編碼,必須區(qū)分合體字和獨(dú)體字。從漢字中的正確拆分出成字元和異字元也必須確定它是獨(dú)體結(jié)構(gòu)還是合體結(jié)構(gòu)。這就存在一個合、獨(dú)體判別的問題。漢字有上下、左右、內(nèi)外、獨(dú)體四種結(jié)構(gòu)類型,前三種是合體結(jié)構(gòu)。其中,內(nèi)外結(jié)構(gòu)又分為全包圍和半包圍兩個亞類型。
例上下結(jié)構(gòu)昌、元、其、形、示、六、曼、最、合、亭、警左右結(jié)構(gòu)補(bǔ)、收、誰、結(jié)、種、謝、禮、副、修、舊、幻全包圍結(jié)構(gòu) 國、囪、四半包圍結(jié)構(gòu) 床、過、氛、匡、同、南、函、坐、噩、咸、武獨(dú)體結(jié)構(gòu)王、永、主、中、井、勿、氣、兆、非、八、川、小、乙、一筆畫以彼此交錯和粘連的方式組成的結(jié)構(gòu)是獨(dú)體結(jié)構(gòu),例如,車、田、毛、十、工、日。完全由散列筆畫組成的結(jié)構(gòu)也是獨(dú)體結(jié)構(gòu),例如,川、三、州、小、兒、八。另外“非”和“兆”這兩個左右筆畫塊都構(gòu)不成獨(dú)立可識結(jié)構(gòu)體的漢字也是獨(dú)體結(jié)構(gòu)。
獨(dú)體結(jié)構(gòu)和左右結(jié)構(gòu)之間的界限是清楚的。而獨(dú)體結(jié)構(gòu)和上下結(jié)構(gòu)之間,獨(dú)體結(jié)構(gòu)和內(nèi)外結(jié)構(gòu)之間,個別時候,特別是有異字元存在時,結(jié)構(gòu)界限就不太明顯,如矛、斤、皮、發(fā)、予、蟲、石、立、至、卑、亦、興、兔、羊、鬼、單、亦、赤、鬼、單、卑、免、弟、卡、古、占、反、甬、圭、巨、旦、習(xí)、乞、少、勺在編碼過程中,遇結(jié)構(gòu)界限不明顯情況時,視其為過渡結(jié)構(gòu),并按下列規(guī)定處理1.不論整體上可識與否,凡能完全(不留筆畫)拆分成兩個以上可識字元者,應(yīng)拆分取碼,如
正 誤合體字 拆分 編碼合體字拆分編碼戰(zhàn)上口戈bogz 戰(zhàn) 占戈口 bgoz朝十日月sryc 朝 朝月二 iyec飯饣廠又scyf 飯 饣反又 sfyf所廠口斤ckjs 所 所斤廠 ijcs南十冂干skgn 南 南豐iin2.由一個可識字元和一個筆畫組成的結(jié)構(gòu)是獨(dú)體結(jié)構(gòu)。其整體上可識是成字元,應(yīng)整體拆取,如正誤合體字 拆分 編碼合體字 拆分 編碼床廣木廠gfcc 床 丶廠木 ncfc但亻旦日rdrd 但 亻日一 rrhd吃口乞乞oqmc 吃 口乞乙 omzc羽習(xí)習(xí)冫xxsy 羽 習(xí)冫冫 zssx整體上不可識,應(yīng)拆分成可識字元和筆畫,如合體字拆分編碼 合體字拆分編碼斷 米口斤 mzjd 斷 斷斤斤 ijcd局 尸習(xí)口 szoj 局 局口ioj向丿冂口pkox 向 向口iox竹乞丨丨mssz 竹 竹竹iiz郎丶既阝ngel 郎 郎阝iel底廣氏丶gsnd 底 廣底廠 gicd是日一疋rhzs 是 日疋口 rios番丿米田pmtf 番 米田日 itrf蛋一足蟲zzcd 蛋 疋蟲中 iczd
至 一厶土hstz 至 云土十 itsz首 立一自bhzs 首 前自目 izms3.整體能獨(dú)立成字,內(nèi)含異字元筆畫數(shù)不超過四筆者,應(yīng)整取為成字元,不滿足此條件,則分別拆取可識字元和異字元。
例(整體能獨(dú)立成字,內(nèi)含異字元筆畫數(shù)不超過四筆)正 誤合體字拆分 編碼 合體字拆分 編碼碰 石立亞sbyp 碰 石口亞 ioyp站 立上口lboz 站 立立口 jboz舉 興豐八xfbj 舉 興八豐 ibfj道 首辶自szzd 道 興一辶 bhzd到 至刂土zdtd 到 一厶刂 hsdd掙 扌爭色azdz 掙 扌爭爭 adiz樣 木羊豐fyfy 樣 木興豐 fbfy撥 扌發(fā)又afyb 撥 扌發(fā)又 aiyb例(整體能獨(dú)立成字,但內(nèi)含異字元筆畫數(shù)超過了四筆)正誤合體字 拆分 編碼 合體字 拆分 編碼愧 忄鬼厶xisk愧 忄鬼厶 xgsk遞 興弟辶bizd遞 弟辶興 dzbd彈 弓興單gbid彈 弓單興 gdbd啤 口卑十oisp啤 口卑十 obsp晚 日爭免rdiw晚 日免免 rmdw真 十真八sibz真 十具八 sjbz例(整體不能獨(dú)立成字)
正誤合體字 拆分 編碼合體字拆分編碼朔立
月 biys朔 朔月二 iyes套大且厶dist套 大套人 dirt展尸艸畏sciz展 尸展口 sikz派氵廠派vcip派 氵派 vip缺每缶抉miiq缺 缶決 iiq本發(fā)明與現(xiàn)有技術(shù)相比具有下列優(yōu)點(diǎn)1,本發(fā)明提供的編碼方法綜合了音碼的記憶少,編碼簡單、容易掌握等易學(xué)性以及形碼的錄入快、重碼率低等易用性的優(yōu)點(diǎn),使之成為高錄入、低重碼、易學(xué)少記、簡單規(guī)范的漢字編碼方案。
2,本發(fā)明編碼方案順應(yīng)漢字本身的結(jié)構(gòu)規(guī)律,對漢字進(jìn)行編碼拆分,全面、準(zhǔn)確、系統(tǒng)地定義了編碼結(jié)構(gòu)成分的基本內(nèi)容——漢字筆畫和漢字字元。字音碼的漢字筆畫分類,采用現(xiàn)代漢字查字法中通用的筆畫分類,其優(yōu)點(diǎn)是完全利用既有漢語知識而使編碼獲得最佳簡易性效果。字音碼的漢字字元定義在漢字結(jié)構(gòu)中獨(dú)體結(jié)構(gòu)這個自然層次上,同時采用過渡結(jié)構(gòu)處理技術(shù)避免了編碼時必須在漢字結(jié)構(gòu)中硬性區(qū)分合獨(dú)體的機(jī)械作法,使編碼更趨自然,同漢字既有知識體系也更加融合。
3,本發(fā)明編碼方案對字元進(jìn)行了屬性分類,針對不同屬性的字元的特殊性質(zhì),采用不同的編碼處理方法。這是字音碼區(qū)別于別的編碼的一個顯著的變革性技術(shù)進(jìn)步。字音碼的漢字字元分性質(zhì)處理后,符號數(shù)量最多的成字元改用定義來規(guī)定,剩余少數(shù)常字元基本是使用者已經(jīng)十分熟習(xí)的漢字常用不成字符號。所以,字音碼率先成為了一種基本無記憶量編碼。
4,本發(fā)明編碼方案不硬性強(qiáng)行拆分漢字結(jié)構(gòu)中的不可識獨(dú)體結(jié)構(gòu)(異字元)和獨(dú)體字。這是字音碼有別于別的現(xiàn)有編碼的另一技術(shù)性進(jìn)步特征。字音碼遵照漢字結(jié)構(gòu)的自然區(qū)劃,承認(rèn)漢字結(jié)構(gòu)中獨(dú)體非常用不成字符號(異字元)的存在,并用歸類方法進(jìn)行編碼處理。由此一來,使編碼方法更簡捷,更趨合理。字音碼在對待獨(dú)體字的拆分上持特別謹(jǐn)慎的態(tài)度。獨(dú)體字的每一種拆分方法都十分簡單直觀,并建立在使用者時常使用的一些方法基礎(chǔ)上。例如,“大”字下加一點(diǎn)是“太”字;“木”字帶“口”為“束”字等等。總之,字音碼的獨(dú)體字拆分方法有著廣泛的、現(xiàn)實(shí)的群眾基礎(chǔ),基本做到了不強(qiáng)行、隨意亂拆獨(dú)體字。這有利于使用者對編碼的掌握,有利于增強(qiáng)編碼方法的語言規(guī)范性。
5,本發(fā)明編碼方案以字元和筆畫的讀音(或名稱)的音序作編碼,實(shí)現(xiàn)了漢字編碼的音形有機(jī)結(jié)合。給用戶帶來基本勿需記憶就掌握一種高錄入效率編碼的便利。
6,本編碼設(shè)計時靜態(tài)重碼率控制在5%以左右,并特別注意了控制高頻字的重碼。估計字音碼的動態(tài)重碼率在千分之二左右。由于絕大多數(shù)常用漢字在本方案中都有一、二、三級簡碼,利用簡碼進(jìn)行輸入不但可以提高錄入速度,而且還可以進(jìn)一步離散重碼,所以實(shí)際在使用本編碼時就基本上碰不到什么重碼了。低重碼率為本編碼實(shí)現(xiàn)計算機(jī)漢字輸入高速盲打奠定了基礎(chǔ)。
7,本發(fā)明編碼方案在形音結(jié)合,字元分性質(zhì)編碼,過渡結(jié)構(gòu)處理技術(shù),不強(qiáng)行拆分異字元和獨(dú)體字以及末復(fù)拆分補(bǔ)碼一系列新發(fā)明的技術(shù)措施的支持下,降低了對使用者漢語語音知識的要求,使用戶在較短時間內(nèi),就能快速、容易地掌握它。因此,是一種高效率編碼。
8,本發(fā)明的編碼方案把漢語拼音輸入法融入字音碼中,并使二者相互兼容。這樣一來,當(dāng)用戶遇不認(rèn)識的字時,可只輸入該字的前三個形碼,并用“?”替代這個字的音碼;當(dāng)用戶遇寫不出的字時,直接輸入該字的漢語拼音即可(拼音字串長度超過四碼時取一二三末)。因此,不存在其它編碼普遍存在的輸入盲區(qū)。
權(quán)利要求
1,一種計算機(jī)漢字編碼方法及輸入鍵盤,其特征在于將漢字拆分為筆畫、成字元、常字元和異字元四種不同性質(zhì)的結(jié)構(gòu)成分,并將它們讀音的首位字母歸入所對應(yīng)的英文字母鍵盤上。
2,根據(jù)權(quán)利要求1所述的漢字編碼方法,其特征在于所述漢字筆畫分為橫、豎、撇、捺、折五種,以其讀音的首位字母為編碼,具體是漢字筆畫一丨丨 丿乀丶乙 …名稱橫 豎撇捺 折編碼h s p n z。
3,根據(jù)權(quán)利要求1所述的漢字編碼方法,其特征在于所述成字元就是以獨(dú)體結(jié)構(gòu)形態(tài)存在于漢字結(jié)構(gòu)中的常用漢字。以其讀音的首位字母為編碼(個別帶“*”號者除外),具體是a 凹b 八巴白百半辦本必丙卜不步匕c 才冊叉廠長車臣成尺赤斥蟲丑出川串匆寸丞d 大歹丹旦刀電刁丁東e 而兒耳二f 乏凡方非飛豐夫弗甫木*g 干甘戈個更工弓瓜廣果丐h 禾乎互戶火j 擊及幾己夾甲柬巾今井久九臼k 開虧l 來樂里吏立隸力良兩了龍m 馬毛矛么門米面滅民皿末母目n 乃內(nèi)鳥牛農(nóng)女o 口*p 皮片平q 七乞氣千且丘求曲犬r 人刃入冉日(曰曰)s 三山上勺少申身甚生升失尸十石史矢士世氏術(shù)手首束水己肅豕巳t 太天田屯w 瓦丸萬王亡韋為未衛(wèi)我烏無五午戊勿x 西夕習(xí)下鄉(xiāng)小心血y 丫牙亞嚴(yán)央羊也業(yè)夷亦義尹永用尤由酉又于予雨與禹玉月夭禺幺z 再乍丈兆正之止中重州朱主爪專子自。
3,根據(jù)權(quán)利要求1所述的漢字編碼方法,其特征在于所述常字元就是漢字結(jié)構(gòu)中經(jīng)常出現(xiàn)的不成字符號,以該符號名稱中關(guān)鍵字讀音的首位字母為編碼(帶“*”者除外),具體是常字元符號常字元名稱關(guān)鍵字編碼字例醫(yī)函己貝同三匡兒 匡k 醫(yī)己且貝山尸兇弓月同央上卜字變體卜b 卡占上盧刂丌師臨 立刀旁 刀d 別師臨齊氘覽養(yǎng)一每字頭 每m 復(fù)乍年氣每乞亻單人旁 人r 位什佛廠斜廠兒 廠c 反斤質(zhì)后派盾立倒八頭 八b 曾丫半兌關(guān)蘭并關(guān)單友義 斜叉兒 叉c 友右丈希殺駁義勹句字頭 句j 勺勾句勿包匈旬葡亠京字頭 京j 京亡市衣亦文亭哀冫兩點(diǎn)水 水s 冷涼沖斗兩點(diǎn)兒 點(diǎn)d 冬頭斗寒讠* 言字旁u 說計談講阝卩厄耳朵旁 耳e 耶卻防衛(wèi)報服倉厄危欠刀字頭 刀d 色角欠爾負(fù)危爭予矛字頭 矛m 矛勇予厶私字兒 私s 至雄叁牟弘宏套棄育廴辶 走之底 之z 邊這建迢邁豐奉字底 奉f 奉擇舉敖艸廿共草字頭 草c 草花共黃展廾弄字底 弄n 弄開升井鼻痹棄扌* 提手旁a 提拋?zhàn)酱蚩谒倪厙鷩鷚國囪囟鹵因彳雙人旁人r行徐徒彷彡三撇兒撇p參彰形犭豹 反犬旁犬q狗狄獲豹霾犯饣食字旁食s蝕飲餅饑飼丬爿 將字旁將j漿將北狀妝忄小 豎心旁心x悍愉怖添恬懷氵* 三點(diǎn)水 v漢江池溪彐彐 橫山兒山s歸隸尹宀冖 寶蓋兒蓋g寶字富冗堂營冤農(nóng)光小字變體 小x黨肖當(dāng)黨光纟纟* 絞絲旁 p紅編絲巛三拐兒拐g巢巡生青字頭青q青表責(zé)老老字頭老l老者足足字底足z是走蛋足特告 牛字旁牛n特牧告靠先攵冬 反文旁文w攻收備冬各衣衣字底衣y表衣農(nóng)哀裹采爪字變體 爪z采愛舀孚灬四點(diǎn)底點(diǎn)d杰然點(diǎn)煮春春字頭春c春泰秦卷卷字頭卷j卷眷拳券礻示字旁示s社禮視曼假四字四s署羅蜀钅金字旁金j銅鐵鋼鋁拜手字變體手s看拜掰疒病字旁 病b病痛疼療衤衣字旁 衣y補(bǔ)衫褲襪錄水字變體水s泰錄隸犀登登字頭 登d登癸要西字頭 西x要票栗虎虎字頭 虎h慮虜虛虎竺竹字頭 竹z筷笑籃筆艮即 根字邊 根g根墾即良祭祭字頭 祭j祭蔡察趵足字旁 足z路躍跳跟雪雨字頭 雨y霧雷霏
4,根據(jù)權(quán)利要求1所述的漢字編碼方法,其特征在于所述異字元是指漢字結(jié)構(gòu)中的非常用且不成字的獨(dú)體符號,或者說漢字結(jié)構(gòu)中既不是成字元,又不是常字元,也不是單一筆畫的獨(dú)體結(jié)構(gòu)符號就是異字元,一律以字母“i”為編碼,具體是丁
其
耒
戔缶旡
尞
朿
疌
囊豖巿
追
然夜姊卵制學(xué)脊島興僉沈那以弟朔迎勁收亥楊暇爭錄眉互聿鹿庚庸唐卵發(fā)決鼎蚩
5,根據(jù)權(quán)利要求1所述的漢字編碼方法,其特征在于漢字的拆分方法是將漢字區(qū)分為獨(dú)體字和合體字,然后拆取形碼,形碼不足三碼時,如有可能,應(yīng)進(jìn)行末復(fù)拆分補(bǔ)碼,將形碼補(bǔ)足為三碼,最后加上該漢字的整字讀音的首位字母(音碼)。
6,根據(jù)權(quán)利要求5所述的漢字編碼方法,其特征在于所述獨(dú)體字拆取形碼的方法是依序按[字元+筆畫]、[字元+字元]、[字元+i]、[筆面++]四種類型拆分編碼。
7,根據(jù)權(quán)利要求5所述的漢字編碼方法,其特征在于所述合體字拆取形碼的方法是根據(jù)編碼原則,從合體字中拆取一二末三個字元和單一筆畫。
8,根據(jù)權(quán)利要求5所述的漢字編碼方法,其特征在于所述末復(fù)拆分補(bǔ)碼是指不論是合體字還是獨(dú)體字,拆取形碼只能得到兩碼時,編碼長度不夠,容易引起重碼。此時應(yīng)從已拆得的成字元(如果有)中,復(fù)拆取最末一個可識字元作為補(bǔ)碼。
全文摘要
本發(fā)明提供一種計算機(jī)漢字編碼方法及輸入鍵盤,其特征在于將漢字拆分為筆畫、成字元、常字元和異字元四種不同性質(zhì)的結(jié)構(gòu)成分,并將它們讀音的首位字母歸入所對應(yīng)的英文字母鍵盤上。它綜合了音碼的記憶少、編碼簡單、容易掌握等易學(xué)性以及形碼的錄入快、重碼率低等易用性的優(yōu)點(diǎn),使之成為高錄入、低重碼、易學(xué)少記、簡單規(guī)范的漢字編碼方案。
文檔編號G06F3/023GK1262475SQ9911748
公開日2000年8月9日 申請日期1999年12月24日 優(yōu)先權(quán)日1999年12月24日
發(fā)明者向永模 申請人:向永模