專利名稱:簡易漢字輸入法的制作方法
技術(shù)領(lǐng)域:
信息技術(shù)二、技術(shù)背景漢字輸入一直存在的問題是輸入法的易學與輸入速度的快捷相矛盾,即針對普通大眾而言,大凡容易掌握的輸入法其輸入速度較慢,而復雜些的輸入法其輸入速度較快。因而尋找既易學、易于推廣普及又輸入快捷的漢字輸入法一直是人們關(guān)注的問題。本輸入法試圖在這兩者之間能得到兼顧。
發(fā)明內(nèi)容
本輸入法從人們最熟悉的漢字的讀音和偏旁部首出發(fā),運用漢字讀音的第一個字母和該字的偏旁部首出發(fā),運用漢字讀音的第一個字母和該字的偏旁部首以及筆劃順序構(gòu)成編碼,利用動態(tài)基本字庫管理,根據(jù)用戶使用漢字容量的大小有針對性地構(gòu)成用戶基本字庫,以降低重碼率,提高輸入速度。
1、輸入法編碼方案(1)漢字拼音編碼單元選取漢字拼音的第一個字母作為一個編碼單元??蓸?gòu)成該編碼單元的字母共有23個,即A-H,J-T,W-Z。若不知發(fā)音,以字母“V”表示未知漢字拼音的編碼單元。即拼音編碼單元共有24個字鍵。
(2)偏旁部首編碼單元選取構(gòu)成漢字常用的66個偏旁部首作為編碼單元所對應(yīng)的要素,以26個字母A~Z作為它們的編碼單元。簡單漢字(無偏旁部首)及由66個偏旁部首之外的偏旁部首構(gòu)成的漢字,其編碼單元為@。即偏旁部首編碼單元共有27個字鍵,如下表
本輸入法中的66個偏旁部首必須是位于每個漢字的上、中、下、左、中、右或是內(nèi)、外的位置。如“雄”的偏旁部首認定為“亻”。
(3)偏旁部首編碼單元的確定確定偏旁部首編碼單元需要考慮的因素①各個編碼單元對應(yīng)的若干個偏旁部首所構(gòu)成的漢字數(shù)量不能相差懸殊,否則,將增加重碼率并降低編碼單元的使用效率。②便于記憶。
基于以上兩點,采用“讀音部首助記字映射法”來確定編碼單元。所謂“讀音部首助記字映射法”是把66個常用偏旁部首,每若干個偏旁部首組成一個漢字,稱該字為“助記字”,用該助記字拼音的第一個字母作為編碼單元,來對應(yīng)組成該字的偏旁部首。如“宀”、“女”兩個偏旁部首組合成“安”字,則“安”字拼音的第一個字母“A”就作為偏旁部首“宀”、“女”的編碼單元,即由“宀”或“女”聯(lián)想到“安”,到“安”的讀音,再映射到字母“A”。再如,“辶”、“米”兩個偏旁部首組合成“迷”字,則“M”即為偏旁部首“辶”、“米”的編碼單元。從“辶”、“米”聯(lián)想到“迷”,再想到“M”,即容易記住了“M”是“辶”、“米”的編碼單位。以上的“安”、“迷”為助記字,依此類推。由于考慮到所構(gòu)成助記字的偏旁部首不能重復使用(否則就產(chǎn)生編碼單元混亂),由“A~T”,“W~Z”構(gòu)成第一個拼音字母的助記字各自只能產(chǎn)生一個,再考慮重碼率及編碼效率等因素,通過排列、組合,產(chǎn)生以下28個助記字安、狽、促、篤、餌、煩、閨,暉、諳、酒、礦、霖、迷、廿;嘔、盼、悄、衽、疝、提、廠,戶、魚、心、蚊、徐、紜、釗。
其中,“諳”字的讀音與字母“i”的讀音近似,且言字旁“讠”與字母“i”又形似,故以字母“i”作為言字旁的編碼單元,同時考慮了言字旁的漢字比較多,不宜與其它偏旁部首共用一個編碼單位(減少重碼率),所以用“諳”字作為助記字,有助于記憶。類似的助記字還有“嘔”與“提”,分別是以字母“O”作為“口”字偏旁部首的編碼單位,以字母“T”作為“扌”的編碼單位。其余各助記字基本上都是由相關(guān)偏旁部首所組成。另外,由于字母“U”、“V”無法作為漢字的第一個拼音字母,所以特別指定其所代表的偏旁部首,也不難記憶。
總之,28個助記字構(gòu)成一首七言詩,讀音又與26個英文字母諧音,易于掌握。
(4)筆劃順序編碼單位筆劃順序編碼單位就是通過去除包含在66個偏旁部首中的某個偏旁部首(構(gòu)成編碼單元的偏旁部首)后,余下的字形(若無偏旁部首,或是由66個偏旁部首之外的偏旁部首構(gòu)成的漢字,即為該字本身),以漢字的五種基本筆劃作為編碼單元,按該字形的筆劃順序。規(guī)定為
綜上,本輸入法編碼方案即為第一字鍵為漢字拼音編碼,第二字鍵為偏旁部首編碼,第三字鍵及以后的字鍵為筆劃順序編碼。例如“漢”的編碼為HJZD,“作”的編碼為ZCPHSHH,“新”的編碼為X@DHDP…
1、動態(tài)基本字庫管理由于每一個漢字輸入法使用者的學識水平不同,職業(yè)不同,從事的專業(yè)不同,社會背景不同,個人興趣愛好不同,年齡性別不同,導致對一部分漢字的使用頻率發(fā)生差異,常用的漢字數(shù)量也不相同。為了提高漢字輸入的效率,選取新的字庫取代傳統(tǒng)的國標6763個簡化漢字的字庫,即通過剔除6763個漢字中的一些較偏僻的字,余下約5300字,作為高級基本字庫(一級字庫);再從5300字中剔除一些不常用的漢字,余下約4200字,作為中級基本字庫(二級字庫),再從4200字中保留最常用的約3000個漢字作為初級基本字庫(三級字庫)。一級字庫可供知識分子使用,二級字庫可供中學文化程度者使用,三級字庫供小學或初中文化程度者使用。每一級字庫均可增加漢字,即增加使用者認為需要的而本級字庫沒有的漢字,構(gòu)建使用者自身的基本字庫,增加的漢字既可來自國標漢字庫,也可來自任何漢字庫中的漢字。這樣,一種由使用者根據(jù)自身的情況來選擇基本字庫,并可調(diào)整字庫容易的方式,實現(xiàn)了動態(tài)字庫管理。它最大程度地提高了字庫的使用效率,減少重碼率,能提高漢字輸入速度。這一點,對大多數(shù)漢字輸入法都有實際意義。
2、本輸入法的效率以使用“一級字庫”,即5300個漢字為基本字庫,說明本輸入法的效率。據(jù)統(tǒng)計,輸入兩個字鍵后所能選取的漢字占72%(一屏漢字最多以10個計),輸入三個字鍵后,所能選取的漢字占96%。也就是說,在5300個漢字中,有96%的漢字只需輸入不多于三個字鍵即可被選取。若使用的是“三級字庫”,即以3000個常用漢字為基本字庫,則輸入兩個字鍵后所能選取的漢字占92%,字庫中的所有漢字輸入的字鍵不超過3次。因此,本輸入法具有較好的實用價值。
權(quán)利要求
1.本輸入法簡單、易學。大部分的字兩個鍵即可輸入;以讀音及偏旁部首為編碼,符合漢字使用者的習慣;而采用讀音的第一個字母為編碼不要求使用者掌握準確的漢字拼音,易于普及;助記字易于記憶;采用動態(tài)基本字庫管理減少了重碼率。漢字拼音的第一個字母與漢字偏旁部首同時作為漢字輸入法的編碼。
2.漢字偏旁部首以其助記字的第一個拼音字母為編碼,而助記字形象地表述了這些偏旁部首。
3.動態(tài)基本字庫管理把用戶使用的漢字庫按用戶掌握的漢字數(shù)量大小分為一級、二級、三級字庫,每級字庫均可根據(jù)需要增加所需的其它任何漢字,構(gòu)成用戶字庫取代傳統(tǒng)輸入法中的國標簡化漢字字庫。
全文摘要
本輸入法解決信息技術(shù)領(lǐng)域中漢字輸入存在著輸入法易學與輸入速度快捷相矛盾的問題。本輸入法試圖在這兩者之間能得到兼顧。本輸入法從人們最熟悉的漢字的讀音和偏旁部首出發(fā),運用漢字讀音的第一個字母和該字的偏旁部首出發(fā),運用漢字讀音的第一個字母和該字的偏旁部首以及筆劃順序構(gòu)成編碼,利用動態(tài)基本字庫管理,根據(jù)用戶使用漢字容量的大小有針對性地構(gòu)成用戶基本字庫,以降低重碼率,提高輸入速度。本輸入法主要用于電腦、移動通信終端(手機)或包含26個英文字母鍵盤的其它電子設(shè)備的漢字輸入。
文檔編號G06F3/023GK1801052SQ20051000541
公開日2006年7月12日 申請日期2005年1月5日 優(yōu)先權(quán)日2005年1月5日
發(fā)明者鄭可璇 申請人:鄭可璇, 榮華