專利名稱:塊狀漢字輸入法的制作方法
技術領域:
本發(fā)明涉及一種電子計算機的漢字輸入方法。
雖然十多年來人們創(chuàng)造了幾百種計算機漢字輸入法,但是比較實用和流行的卻很少。目前多數(shù)人便用的還是五筆字型、拼音、雙拼音輸入法。拼音、雙拼音輸入法如不懂漢語拼音或讀音不準根本無法使用,五筆字型輸入法則存在字根太多,記憶困難,拆字方法模糊等缺點,使人們對計算機漢字拆字的鍵盤輸入望而生畏。
本發(fā)明的目的在于克服五筆字型輸入法存在的缺點,提供一種需要記憶的編碼碼元少,編碼簡單直觀,拆字科學好學易記地形、音編碼漢字輸入方法。
本發(fā)明目的是通過以下方案實現(xiàn)的
本發(fā)明所述的塊狀漢字輸入法是采用標準英文鍵盤,以字形為主輔以字音編碼,其特征是將漢字分為鍵面塊、交叉塊、最少成字塊和不規(guī)則塊進行編碼,其中a.將組字能力強,出現(xiàn)頻率高的漢字偏傍部首為鍵面塊標注鍵盤上;b.將漢字中筆畫連續(xù)且筆畫有相交的列為交叉塊;c.將松散筆畫群中無明顯左右結構關系,按書寫順序連續(xù)的筆畫在該群體中組成一個筆畫最少的漢字列為最小成字塊,組不成漢字筆順連續(xù)的列為不規(guī)則塊。
以下結合附圖和實施例對本發(fā)明進行詳細說明。
圖1是本發(fā)明漢字分塊示意圖。
圖2是本發(fā)明鍵面塊總圖。
本發(fā)明在實施時考慮到已有相當多的用戶使用過五筆字型,為了照顧用戶的打字習慣,使已用過五筆字型的用戶很快就能適應使用,本塊狀漢字輸入法的筆畫種類和鍵盤的鍵位分區(qū)與五筆字型完全相同,即塊狀漢字輸入法的鍵盤與五筆字型輸入法的鍵盤接軌。以下詳細介紹塊狀漢字的筆畫和鍵盤以及輸入方法。
1.漢字的筆畫
中華民族古老的方塊字筆畫形態(tài)多變,為了能正確區(qū)分各種筆畫,方便拆字,本塊狀漢字輸入法的筆畫只考慮書寫筆畫的運筆方向,而不管該筆畫的長短輕重。本輸入法將漢字的筆畫歸納為五種,分別為橫、豎、撇、捺、折,并依次用代號1、2、3、4、5來表示。對其它形態(tài)的筆畫則認為是這五種筆畫的變形,并歸類如下
①提筆視為橫
如現(xiàn)、場、特、扛、沖各字的左部末筆勻視為橫。
②點歸屬于捺
如村、學、家、心各字中的右點都視為捺。
③一切帶折的筆畫都歸為折(左鉤除外,左鉤應歸為豎)。
2.塊狀漢字的筆畫群
筆畫在漢字中按照其結合的緊密程度有散、連、交叉三種。本塊狀漢字輸入法為了減少拆字的模糊性,把散連的筆畫合二為一,稱為松散筆畫。因此,本塊狀漢字的筆畫組合只分為兩種,即松散筆畫群和交叉筆畫群,其定義如下。
交叉筆畫群按筆順凡筆畫連續(xù),且筆畫相交連為一體的若干筆畫組合成一個交叉筆畫群。例如
女是一個交叉筆畫群。
爻由“×”和“×”兩個交叉筆畫群組成。
書其中
是一個交叉筆畫群。踐其中
是一個交叉筆畫群。
松散筆畫群按筆順凡筆畫連續(xù)的且筆畫無相交的若干筆畫組合,稱為一個松散筆畫群。例如
三、二每字都是一個松散筆畫群。
斤、盡每字都是一個松散筆畫群。
羊、并分別由一個松散筆畫“
”和一個交叉筆畫“
”構成。五 由兩個松散筆畫“
”和“一”與一個交叉筆畫群“
”構成。
3.塊狀漢字的輸入鍵盤
塊狀漢字輸入法采用英文鍵盤上的A-Z,共26個字母進行編碼,把其中25個鍵分為五區(qū),以中間為界向兩邊輻射,一區(qū)代表橫,鍵位為G、F、D、S、A,二區(qū)代表豎,鍵位為H、J、K、L、M,三區(qū)代表撇,鍵位為T、R、E、W、Q,四區(qū)代表捺,鍵位為Y、U、I、O、P,五區(qū)代表折,鍵位為N、B、V、C、X。
在五區(qū)中,每一區(qū)又分為五位,并用代號1、2、3、4、5表示,分別代表橫、豎、撇、捺、折,對應的鍵位為以中間為起點向兩邊輻射排列。
4.漢字的分塊方法
為了正確反映每個漢字的基本特征,減少漢字拆字的多義性,本塊狀漢字輸入法歸并起來,選取了六十多個組字能力強,出現(xiàn)頻率高的漢字偏傍部首作為漢字的標準塊,記在鍵面上,稱為鍵面塊。除鍵面塊外由松散筆畫或交叉筆畫按規(guī)則拆分而成的塊,因不標注在鍵面上,稱為非鍵面塊。
①漢字的鍵面塊
塊狀漢字輸入法鍵面塊的具體數(shù)量和在鍵面的分布情況請看圖2。
②非鍵面塊
將漢字按書寫順序首先拆成鍵面塊,那些不能組合成鍵面塊的筆畫,應以鍵面塊為斷點,再按下面的規(guī)則分塊。由交叉筆畫群拆分出來的稱為交叉塊;由松散筆畫群拆分出來的有兩種,即最小成字塊和不規(guī)則塊。
a.交叉塊
筆畫相交連為一體,且書寫筆順連續(xù)的,稱為一個交叉塊,交叉塊由交叉筆畫群拆分而成。
例如
好女子其中“女”是一個交叉塊,“子”是鍵面塊。
史口×其中“口”是鍵面塊,“×”是交叉塊。
b.最小成字塊和不規(guī)則塊
在松散筆畫群中筆畫如果無明顯的左右結構關系,連續(xù)的筆畫在該群體中組成一個筆畫最小的漢字為一塊,稱為最小成字塊;組不成漢字筆順連續(xù)的為另一種塊稱為不規(guī)則塊。每一松散筆畫群可以分為一塊或者若干個成字塊或不規(guī)則塊。
例如
卡上卜“卜”是最小成字塊。嚴
“廠”是最小成字塊,“
”是不規(guī)則塊。只口八“口”是鍵面塊,“八”是最小成字塊。正一止“一”是松散塊,“止”是最小成字塊。矢大“”是松散塊,“大”是鍵面塊。升丿
“丿”是松散塊,“
”是交叉塊。
如果松散筆畫有明顯的左中右結構關系,應先以左中右分界線為分塊的斷點,再按上述原則分塊。
例如順川貝順字中“川”和“”有明顯的左右關系,為兩不規(guī)則塊;“貝”為鍵面塊。糾纟
糾字中“纟”和“
”有明顯的左右關系,為兩不規(guī)則塊。紇纟乙紇字中“纟”和“”有明顯的左右關系,為兩不規(guī)則塊;“乙”為成字塊。需要指出的是,意連的筆畫沒有左右關系,應當一塊處理,比如“辦”的撇和捺,“肅”字的撇和豎,因此“辦”字拆成力八,“肅”字拆為彐小
。
為了減少拆字的模糊性,一般松散筆畫群不以筆畫的上下關系進行分塊,有少數(shù)幾個特例漢字如“絲”“茲”等字其上結構或下結構有明顯的左右關系,其下或上結構又沒左右關系,那么這些漢字其上下筆畫也作為塊的斷點,這樣規(guī)定的目的是為了更接近人們對漢字分塊的理解習慣性,因此“絲”字拆分為“
”“一”
較小漢字是指,在一個松散筆畫群中,除“一”和“二”字之外連續(xù)的筆畫組合成筆畫最少的漢字,比如,“三”只能分為一塊,不要分為兩塊。
綜上所述,塊狀漢字輸入法把漢字歸納為四種類型塊作為漢字的編碼單位,它們分別為鍵面塊,交叉塊,最小成字塊和不規(guī)則塊。其中,交叉塊由交叉筆畫群拆分而成;最小成字塊和不規(guī)則塊是由松散筆畫群拆分而成。
原則上拆分出來的每一塊筆畫都應是連續(xù)的,即不能跨其它塊組合??紤]到拆字的直觀性和完整性,象下列結構的漢字應以直觀為原則進行拆分。
比如“可”拆分為丁口
“酉”拆分為西一
“戌”拆分為戊一
“困”拆分為囗木
“或”拆分為
口一、
5.塊拆分的優(yōu)先原則
塊狀漢字輸入法漢字分塊按下面優(yōu)先級別進行拆分
(1)鍵面塊優(yōu)于非鍵面塊,其中,鍵面塊以口字優(yōu)先,大塊優(yōu)于小塊;
(2)在非鍵面塊中松散筆畫不能與交叉筆畫組合為一塊;
(3)在松散筆畫群中,成字塊優(yōu)于不規(guī)則塊,成字塊又以筆畫少的漢字優(yōu)于筆畫多的漢字;
(4)按上述優(yōu)先原則,如果一個漢字的某一筆既可以和前面的筆畫組合為一塊,又可以與后面的筆畫組合為一塊,那么該筆畫應與結構最緊密者優(yōu)先組合成塊,否則,與前面的筆畫組合成塊。例如“噴”字拆成口十艸貝;
分塊舉例
束一口小(“口”字優(yōu)于“木”字)
光小一兒(“兒”字是最小成字塊)
征彳一止(分別是鍵面塊、松散塊和最小成字塊)
盟日月皿(全部是鍵面塊)
圍口韋 (“囗”為鍵面塊,“韋”為交叉塊)
下一卜(小字優(yōu)于大字)
夫一大(鍵面塊優(yōu)于非鍵面塊)
春二大日(鍵面優(yōu)塊于非鍵面塊)
賁十艸貝(筆畫結構緊密者優(yōu)先)
6.塊狀漢字的塊代碼和聲碼
(1)鍵面塊的代碼
鍵面塊所在鍵所對應的英文字母就是該塊的代碼。
(2)非鍵面塊的代碼
以該塊的首筆為區(qū)號,次筆為位號,所對應鍵位的英文字母就是該塊的代碼,只有一筆的塊,以該筆畫作為區(qū)號,位號規(guī)定為一位。很顯然,非鍵面塊代碼不需記憶。
(3)塊狀漢字的聲碼
在塊狀漢字輸入法編碼方案中,聲碼僅作為輔助編碼,只有形碼不足四碼時,才在形碼之后補打一個聲碼。漢字的聲碼取該漢字的漢語拼音首位字母,所對應的英文字母為該漢字的代碼(ZH、CH、SH分別只取Z、C、S),因此,塊狀漢字輸入法對讀音的準確性要求不高。
7.單字輸入編碼規(guī)則
熟悉了漢字的分塊方法和字塊代碼后就可以著手輸入漢字了。下面介紹單個漢字的輸入方法。單個漢字的輸入方法分鍵面漢字輸入和非鍵面漢字輸入兩大類
(1)鍵面漢字輸入
鍵面漢字(塊)的輸入方法,是將所在鍵字母連打三下加該字的拼音首字母。
例金QQQJ
人WWWR
白RRRB
木SSSM
西SSSX
大DDDD
石DDDS
若鍵面漢字作為其它漢字編碼使用時,只須打一下鍵名所在鍵。
(2)非鍵面漢字的編碼與輸入
鍵面漢字是我們要處理的漢字中極少的一部份,經(jīng)常用到的大量漢字還是需要經(jīng)過拆分輸入。按照上述分塊原則,有些漢字由多塊組成,有些漢字只有一塊,它們的編碼方法略有差別。
A多塊漢字的編碼與輸入
(1)有四塊或四塊以上的漢字編碼是取其一、二、次末、末四塊形碼作為該漢字的輸入碼,即前后各取兩塊,忽略中間。
(2)如果一個漢字少于四塊,連續(xù)取完形碼補一個聲碼。例容宀八人口編碼為PWWK天一大編碼為GDD(“天”字的拼音首字母為“D”)夫一大編碼為GDF(“夫”字的拼音首字母為“F”)正一十編碼為GHJ(“正”字的拼音首字母為“J”)干一十編碼為GFG(“干”字的拼音首字母為“G”)
B只有一塊的漢字的編碼與輸入
如果一個漢字只有一塊就用單筆畫輸入,取其一二三末筆碼,作為該漢字的輸入碼,少于四筆的漢字補打一個該漢字的聲碼(單筆的代碼是以其筆畫作為區(qū)號,位號為1來確定)。例三一一一 編碼為GGGS
二一一 編碼為GGE斤
丿 一丨 編碼為TTGH十一丨編碼為GHS
C一個漢字最多輸入四碼,不足四碼的漢字可以用空格鍵斷碼。
8.詞組輸入的取碼規(guī)則
雙字詞取各字編碼的前面碼,三字詞取每字首碼加末字第二碼,多字詞組取1、2、3和末字的首位編碼。
9.一級簡碼
塊狀漢字輸入法一級簡碼共25個,它們分別是我人有的和主產(chǎn)不為這工要在地一上是中國經(jīng)以發(fā)了民同。
10.二級簡碼和三級簡碼
塊狀漢字輸入法也和其它漢字輸入法一樣有二級和三級簡碼,這些簡碼漢字都在提示行顯示出來而不需要專門記憶。為了方便不熟悉漢語拼音的用戶,打完形碼該漢字已在提示行顯示出來,因此,對于不熟識漢語拼音的用戶可以用簡碼或根據(jù)提示輸入,也可采用詞組輸入。
11.塊狀漢字輸入法的使用
塊狀漢字輸入法之所以采用以形碼在前音碼在后的設計方案,目的是使懂拼音和不懂拼音的用戶都能快速地輸入漢字,因為本輸入法輸完形碼后,漢字的重碼率已經(jīng)很低,在提示行顯示的重碼字一般只有二三個字,即使采用選字輸入也很容易,而且大部份的常用字輸完形碼后+空格鍵一般可以選中,或采用詞組輸入也不用輸入音碼,因此不懂拼音的用戶也不感覺有什么不便。當然,懂拼音的用戶輸入的速度更快,可以實現(xiàn)盲打輸入,這是對專業(yè)打字員的要求。
對于已經(jīng)比較熟練五筆字形的用戶,也許剛開始使用本輸入法有些不習慣,當你使用幾天后,使用本輸入法打字,同樣可以達到高速盲打輸入,你會發(fā)現(xiàn)不用輸入末筆字型識別碼頭腦會更輕松,輸入漢字更自然。
按國標信息交換一二級字庫所列漢字共6763個計算,塊狀漢字輸入法的重碼字總計474個,重碼率為7.01%,與五筆字型的重碼字497個,重碼率為7.35%,本輸入法的重碼率低于五筆字形。
本塊狀漢字輸入法,采用了以形為主,以聲為輔的編碼方法,克服了以音為主的漢字輸入法因不會讀音而不能輸入漢字和純形碼漢字輸入法需要大量記憶字根以及編碼困難的缺點,該漢字輸入法記憶量少,編碼規(guī)則簡單,同時又具有編碼拆字的直觀性和習慣性,因此它不但完全具有五筆字型的優(yōu)點,而且又克服了五筆字型輸入法存在的缺點。雖然采用了形聲編碼,但聲碼只是起輔助作用,不管你是否會讀音都能使用本方法正確快速地輸入漢字,使人們在使用本輸入法輸入漢字時感覺象五筆字型那樣直觀、快速,編碼象拼音輸入法那樣輕松、容易,既適合于一般人員,又適合于專業(yè)人員使用。它的主要優(yōu)點概括如下
①.需要記憶的編碼碼元少,好學易記;
②.編碼簡單直觀,重碼率低,輸入速度快,可以盲打輸入;
③.拆字科學,基本克服拆字的多義性,做到拆字的唯一性。
權利要求
1.一種塊狀漢字輸入法,采用標準英文鍵盤,以字形為主輔以字音編碼,其特征是將漢字的形碼部份分為鍵面塊、交叉塊、最小成字塊和不規(guī)則塊進行編碼,其中
a.組字能力強,出現(xiàn)頻率高的漢字編傍部首為鍵面塊,寫在鍵盤上;
b.筆畫連續(xù)且筆畫相交連為一體的列為交叉塊;
c.將松散筆畫群中的筆畫無明顯左右結構關系,連續(xù)的筆畫在該群體中組成一個筆畫最少的漢字列為最小成字塊,組不成漢字筆順連續(xù)的列為不規(guī)則塊。
2.按照權利要求1所述的塊狀漢字輸入法,其特征在于鍵面塊是由以下漢字編傍部首組成并分布在對應的鍵盤字母鍵上
3.按照權利要求1所述的塊狀漢字輸入法,其特征在于聲碼是取該漢字的漢語拼音首位字母所對應的英文鍵輸入,只有形碼不足四碼時才在形碼之后補打一個聲碼。
4.按照權利要求1所述的塊狀漢字輸入法,其特征在于輸入鍵面漢字時,將所在鍵字母連打三下加該字的拼音首字母;輸入非鍵面漢字時,a由多塊組成的漢字,有4塊或4塊以上的取其一、二、次末、末四塊作為該漢字的輸入碼,不足4塊連續(xù)取完形碼補打聲碼;b由一塊構成的漢字,取其一、二、三、末筆碼輸入,少于四筆的補打該漢字的聲碼。
5.按照權利要求1所述的塊狀漢字輸入法,其特征在于非鍵面塊是以其首筆為區(qū)號,次筆為位號,所對應鍵位的英文字母就是該塊的代碼,只有一筆的塊,以該筆畫作為區(qū)號,位號規(guī)定為一位。
全文摘要
一種采用標準英語鍵盤,以字形為主輔以字音編碼的塊狀漢字輸入法。將漢字分為鍵面塊、交叉塊、最小成字塊和不規(guī)則塊,按塊輸入,當形碼不足四碼時才在形碼之后補打一個聲碼。本發(fā)明編碼簡單直觀,需要記憶的碼元少,重碼率低,輸入速度快,特別好學易記。
文檔編號G06F3/023GK1210298SQ9711609
公開日1999年3月10日 申請日期1997年9月4日 優(yōu)先權日1997年9月4日
發(fā)明者容錫業(yè) 申請人:容錫業(yè)