專利名稱:部件聲母筆劃識別漢字編碼法及其鍵盤的制作方法
一.本發(fā)明是一種漢字編碼方法及其鍵盤。它利用漢字高頻度部件容易拼讀發(fā)音的特點,精心選取了121種共181個高頻度、易拼讀部件(字根),部件通過其常規(guī)讀法之關(guān)鍵字與漢語拼音聲母建立對應(yīng)關(guān)系,漢語拼音聲母又與英文字母建立對應(yīng)關(guān)系,這樣便在英文鍵盤上建立本編碼法的漢字部件鍵盤。該鍵盤體現(xiàn)了漢字部件、部件拼音(主要是聲母)、部件代碼(鍵盤上的英文字母)三者之間全部的對應(yīng)關(guān)系。部件以其漢語拼音的聲母發(fā)音(英文鍵O,V上的部件除外)。聲母與英文字母對應(yīng)關(guān)系是聲母ZH和Z、CH、SH分別對應(yīng)英文A、I、U,拼音YU及YUE、SHUI分別對應(yīng)英文V、O,其他聲母與其同形的英文字母對應(yīng)。
例如,’廣’的常規(guī)讀法為’廣字旁兒’(GuangZiPangr),關(guān)鍵字為’廣’,其拼音聲母是’G’,部件’廣’便定位在漢字部件鍵盤上的G(哥)鍵。按此法,80%的部件可在漢字部件鍵盤上定位,其他部件按筆劃、筆劃數(shù)、位置、易記等要素定位。部件及其代碼詳見說明書附圖-部件聲母筆劃識別漢字編碼法漢字部件鍵盤。
二.拆字取部件依照常規(guī)法則書寫順序、直觀、能大不小,能離不連、能連不交。
三.編碼公式與法則編碼公式為漢字編碼=部件代碼+漢字首末筆劃識別碼+低頻字重碼處理碼部件代碼為必需項,其后二者為可選項,最長碼為四碼。
單字編碼法則1.由四個或四個以上部件構(gòu)成的字取其前三部件和末部件的代碼
2.不足四部件的字取其部件代碼,并加上漢字首末筆劃識別碼(簡稱識別碼),識別碼多達(dá)20個,按首筆劃分5組。
(1)首筆劃為橫末筆劃分別為橫、豎、撇和捺(點)、折的漢字的識別碼分別為G、F、D、S。
(2)首筆劃為豎末筆劃分別為橫、豎、撇和捺(點)、折的漢字的識別碼分別為H、J、K、L。
(3)首筆劃為撇末筆劃分別為橫、豎、撇和捺(點)、折的漢字的識別碼分別為T、R、E、W。
(4)首筆劃為捺(點)末筆劃分別為橫、豎、撇和捺(點)、折的漢字的識別碼分別為Y、U、I、O。
(5)首筆劃為折末筆劃分別為橫、豎、撇和捺(點)、折的漢字的識別碼分別為B、V、C、X。
在識別碼中,末筆劃為撇、捺、點者作為同一種筆劃處理,本編碼法通稱它們?yōu)椤薄?,折包括除豎鉤外的勾類筆劃。
例對-YC(部件代碼)+C(識別碼,首筆劃為折,末筆劃是點)討-YC(部件代碼)+I(識別碼,首筆劃為點,末筆劃為點)3.對于漢字鍵盤上的成字。如’大’,’立’,先取該成字部件的代碼,然后取其第一,二,末單筆劃的代碼,不足四碼則取實際碼長,例如D鍵上的’大’字的編碼為DGTY,F(xiàn)鍵的’二’為FGG4.按照情況1.2.3.構(gòu)成的漢字編碼,如出現(xiàn)重碼,高頻字排先,如此時重碼中含國標(biāo)基本集的二級漢字,則這些二級字三碼字加’Z’,四碼字則改第四碼為’Z’,以便減少重碼。
5.簡碼(1)一級簡碼(一碼)為A些 B的 C過 D大 E被 F把 G不 H和 I在 J幾 K國 L了M同 N好 O沒 Q比 R是 S能 T我 U著 V也 W這 X要 Y說(2)二級簡碼(二碼)選取的基本原則一級漢字中的雙部件字,在不加識別碼的情況下,無重碼者即為簡碼,有重碼者選最高頻度字為簡碼。
(3)三級簡碼(三碼)選取的基本原則在不加識別碼的情況下的一級三部件漢字與加識別碼后的一級二部件漢字編碼總和中,無重碼者即為簡碼,有重碼者選最高頻度字為簡。
5.2,5.3中的漢字頻度依照《現(xiàn)代漢語頻率詞典》(北京語言學(xué)院語言教學(xué)研究所編._1996.06)四.詞匯編碼法則雙字詞匯,各取前兩部件代碼。例理論-WRYR三字詞匯,前兩字取首碼。第三字取前兩碼,例計算機(jī)-YAMJ四字詞匯,取四字首碼。例市場經(jīng)濟(jì)-YTSO四字以上詞匯,取前三字取首碼,取最后一字首碼。
例計算機(jī)應(yīng)用-YAJV五.本漢字編碼法的優(yōu)點是易學(xué)好用、直觀、輸入效率高。
六.
名稱部件聲母筆劃識別漢字編碼法漢字部件鍵盤。
1.部件按5種情況排列在鍵盤上(1)按其習(xí)慣讀法之關(guān)鍵字的漢字拼音聲母與英文字母對應(yīng)關(guān)系。例土-T,口-K,山-U(拼音聲母SH)石(Shi)例外。
(2)接其漢字拼音與英文字母對應(yīng)關(guān)系例如水(拼音Shui)-I 雨(拚音Yu)-V(3)按其屬同一部首或形狀類似排列例如犬和犭,己和巳(4)按筆劃、筆劃數(shù)、位置、易記等要素定位。
例如一二三四橫的代碼分別是G、F、D、S一折二折三折的代碼都是V(5)按漢語’衣’與英文字母E發(fā)音相似排在E鍵上2.每個英文字母鍵上的部件的位置是固定的,分上、中、下排3.Z鍵為低頻字重碼處理碼4.P鍵在漢字輸入系統(tǒng)中用作替代任意部件,以實現(xiàn)模糊查找(前方一致或前后方一致中間任意)七.本漢字編碼法機(jī)及其鍵盤容易應(yīng)用于漢字輸入系統(tǒng),本發(fā)明者已利用關(guān)系型數(shù)據(jù)庫管理系統(tǒng)Foxpro V2.5的開發(fā)工具實現(xiàn)了國標(biāo)《信息交換用漢字編碼字符集(基本集)》中的6763個漢字和6000常用詞匯的編碼、建庫和漢字輸入及編輯功能。
權(quán)利要求
1.部件聲母筆劃識別漢字編碼法及其鍵盤,其特征是全部漢字由該編碼法中固定在漢字部件鍵盤上的120種180個部件構(gòu)成,漢字編碼按照本編碼法單字編碼的五條法則由部件代碼+漢字首末筆劃識別碼+低頻字重碼處理碼生成,部件代碼為必需項,識別碼和低頻字重碼處理碼項為可選項。詞組編碼遵照本編碼法中詞組編碼法則。
2.按權(quán)利要求1所述的部件及其代碼,其特征是140個部件通過其常規(guī)讀法之關(guān)鍵字與漢語拼音聲母建立對應(yīng)關(guān)系,漢語拼音聲母又與英文字母建立對應(yīng)關(guān)系,最終建立部件與英文字母直接的對應(yīng)關(guān)系(即代碼關(guān)系),這里所指的140個部件包含相同部首和部件形狀類似兩種情況。
3.按權(quán)利要求1中所述的漢字編碼生成,其特征是最長碼為四碼,四個或四個以上部件的字取其前三部件和末部件的代碼。不足四部件的字取其部件代碼,并加上漢字首末筆劃識別碼。
4.按權(quán)利要求1所述的漢字首末筆劃識別碼,其特征是首筆劃分別為橫、豎、撇和捺(點)、折,末筆劃分別為橫、豎、撇、捺(點)、折的五組識別碼分別是(G F D S)、(H J K L)、(T R E W)、(Y U I O)、(B V C X)。
5.按權(quán)利要求1中所述的低頻字重碼處理碼,其特征是部件代碼+漢字首末筆劃識別碼出現(xiàn)重碼時,對于重碼中的國標(biāo)基本集中的二級漢字,三碼字加'Z',四碼字則改第四碼為'Z'。
全文摘要
部件聲母筆劃識別漢字編碼法及鍵盤涉及中文信息處理。它利用漢字高頻度部件容易拼讀的特點,選取了120種共180個高頻度易拼讀部件,大部分部件通過其常規(guī)讀法之關(guān)鍵字與漢語拼音聲母、拼音聲母與英文字母這兩個對應(yīng)關(guān)系,建立部件代碼及部件鍵盤。漢字編碼由部件代碼+漢字首末筆劃識別碼+低頻字重碼處理碼生成。部件代碼為必需項,后二者為可選項,最長碼為4碼。該編碼法具有易學(xué)好用、直觀、重碼少、輸入效率高的特點。
文檔編號G06F3/023GK1099494SQ94110908
公開日1995年3月1日 申請日期1994年4月1日 優(yōu)先權(quán)日1994年4月1日
發(fā)明者唐曉衛(wèi) 申請人:唐曉衛(wèi)