專利名稱:教育規(guī)范五筆字型漢字輸入法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字信息處理技術(shù)領(lǐng)域,對一項廣為使用的五筆字型現(xiàn)有形碼漢字電腦輸入技術(shù)的全方位的創(chuàng)新和突破性技術(shù)進步。
國內(nèi)外現(xiàn)行的“五筆字型”漢字輸入技術(shù),包括1985年4月1日申請中國專利,1992年2月26日獲得中國專利局授權(quán)的85100837.2號發(fā)明專利,以及在該技術(shù)方案的原則下經(jīng)發(fā)明人王永民稍加調(diào)整,從1986年3月開始推廣普及的現(xiàn)行“五筆字型”技術(shù)。
“五筆字型”已在國內(nèi)外獲得了廣泛的應(yīng)用,成為目前有90%以上電腦用戶使用、在國內(nèi)占主導(dǎo)地位地漢字輸入技術(shù)?!拔骞P字型”不僅使高效率輸入漢字在報業(yè)、出版業(yè)、辦公自動化等方面成為現(xiàn)實,在聯(lián)合國、東南亞獲得廣泛應(yīng)用,而且,“五筆字型”也正在大規(guī)模地走入學(xué)校和家庭,幾乎成了中國當代青年文明就業(yè)的一項必備技術(shù)。
科學(xué)和技術(shù)的發(fā)展是一個過程,“五筆字型”也是一項由初級階段向高級階段不斷發(fā)展、不斷創(chuàng)新的技術(shù)。十年來大規(guī)模的應(yīng)用實踐,在驗證“五筆字型”現(xiàn)有技術(shù)作為一項開拓性發(fā)明的科學(xué)性、創(chuàng)造性、實用性的同時,隨著學(xué)術(shù)的進步,應(yīng)用水平的提高以及電腦的普及并進入中小學(xué)教育領(lǐng)域,發(fā)現(xiàn)了“五筆字型”在規(guī)范化、科學(xué)性、實用性等方面尚存在著不足甚至嚴重缺陷,不能滿足中小學(xué)教育對漢字輸入技術(shù)學(xué)習(xí)的強烈要求。這說明,“五筆字型”向規(guī)范化、高水平、實用化方向的創(chuàng)新和發(fā)展,不但是必要的,也更是極為迫切的。
為克服現(xiàn)行“五筆字型”技術(shù)的不足和缺陷,本發(fā)明人自1986年起,經(jīng)過10年潛心研究,廣泛聽取國內(nèi)外各界用戶的意見,特別是在國家語委多位著名的語言文字學(xué)專家、科技界信息處理技術(shù)專家、電腦專家的直接指導(dǎo)下,采用理論分析、反復(fù)試驗和機助設(shè)計相結(jié)合的手段,終于從五個方面突破了現(xiàn)行“五筆字型”技術(shù)方案的框架,確定了該新一代符合教育規(guī)范和漢字規(guī)范的更高水平、更加實用化的輸入技術(shù)方案及其裝置。
鑒于本發(fā)明完成于1995年,本發(fā)明的簡稱為“95版五筆字型及其鍵盤”或“95版五筆字型”。取“規(guī)范”和“五筆”的漢語拼音首字母,即構(gòu)成本發(fā)明的名稱縮寫字母代碼——GWB;
又鑒于十年來社會上已約定俗成地把王永民發(fā)明的“五筆字型”編碼輸入技術(shù)叫做“王碼”,本發(fā)明的另一種簡稱叫做“95王碼”或“規(guī)范王碼”。
本發(fā)明的對比技術(shù)即85100837.2號專利所構(gòu)成的“五筆字型”技術(shù)方案,也即當前在國內(nèi)外廣為應(yīng)用的現(xiàn)行“五筆字型”技術(shù),以下統(tǒng)一簡稱之為“原方案”。
為了描述之便,以下對本發(fā)明簡稱“95版五筆字型”、“GWB方案”或“GWB”。
根據(jù)本發(fā)明,描述其輸入法及其輸入鍵盤所使用的概念和技術(shù)術(shù)語定義如下
1、基本筆畫本發(fā)明所定義的基本筆畫有5種,筆畫形態(tài)及其數(shù)字代號為
橫(一、
),方向為從左到右,數(shù)字代號為1;
豎(丨、亅),方向為從上到下,數(shù)字代號為2;
撇(丿),方向為右上到左下,數(shù)字代號為3;
點(捺) (丶、_),方向為左上到右下,數(shù)字代號為4;
折(乙),帶轉(zhuǎn)折的筆畫,數(shù)字代號為5;
其中折(乙)還包括以下兩大類23種
順時針方向
_
乛
ㄋ
反時針方向_ _
_
ㄑ
ㄣ
2、字型指漢字的拓樸圖形分類
左右排列者為左右型,數(shù)字代號1
上下排列者為上下型,數(shù)字代號2
既不是左右又不是上下排列者,為雜合型,數(shù)字代號為3。
為了提取字型信息以離散重碼,特別是離散對CJK10646大字符集編碼時產(chǎn)生的重碼,字型還可進一步細分為4-10種,屆時其代號可用0~9代表之。
3、區(qū)指按首筆筆畫種類劃分的字根或部件表上的一個區(qū)域或鍵盤上的一個區(qū)域,區(qū)號從1到5。
4、位指按部件的次筆特征或末筆特征排列的每一個區(qū)中5個鍵中的某一個鍵,位號從11到55。
5、部件部件專指被本發(fā)明優(yōu)選作為構(gòu)字單位的傳統(tǒng)部首、筆畫結(jié)構(gòu)及其變形或與之“形似”的筆畫結(jié)構(gòu)。本發(fā)明不采用“字根”這一概念。當依習(xí)慣提及“字根”時,在本發(fā)明中也專指“部件”。當提及部件拆分的順序時,為便于稱謂,仍沿用“根序”一詞。部件中凡成字者為“成字部件”,不成字者為“非字部件”或“不成字部件”。
6、鍵名指本發(fā)明中5區(qū)各5位共25個鍵位上有代表性的第一個部件。
7、主部件、同位部件包括鍵名在內(nèi)的有代表性的部件叫主部件,而排列在主部件之后,用括號括起來的該部件的變形或與之同源、形似的筆畫結(jié)構(gòu)為同位部件。
8、部件總表本發(fā)明中所選中的全部部件,按5區(qū)各5位共25位,依主部件在前,同位的部件變形或形似部件在后可用( )括起來,繁體部件可用( )括起來,同時包括雙碼部件、各單筆畫以及由單筆畫復(fù)合而成的筆形、帶“乙”類全部筆畫及高頻字的表格。
9、鍵盤圖指本發(fā)明中將鍵名、區(qū)位碼、全部部件或部分部件標示或設(shè)計在按鍵上的設(shè)計圖或示意圖。按照本發(fā)明的鍵盤圖制做的鍵盤,或使用本發(fā)明的某系統(tǒng)中配置的鍵盤都叫做“GWB鍵盤”。
10、高頻字指被安排在本發(fā)明25個位(鍵)上、每位(鍵)一個的、最常用的25個漢字。一般來說,多數(shù)高頻字與所在鍵位(鍵)上的部件有某種聯(lián)系。
11、單字編碼即字的編碼,指按本發(fā)明編碼法為單字編制的輸入碼,該輸入碼有部件分解、區(qū)位、字母三種方式。
12、詞庫也叫詞語庫、語料庫,指由2個以上漢字構(gòu)成的漢字詞語的一個集合。詞條的多少不限,在系統(tǒng)中以數(shù)據(jù)的形式存儲在一定的空間中,備查備用。
13、詞碼指按本發(fā)明編碼法為兩個以上漢字構(gòu)成的詞匯編制的輸入碼,該輸入碼有可分別單獨使用的部件分解、區(qū)位、字母三種方式。
14、二字詞指由2個漢字組成的詞。
15、三字詞指由3個漢字組成的詞。
16、四字詞指由4個漢字組成的詞。
17、多字詞指由4個以上漢字組成的詞。
18、部件體系指本發(fā)明所優(yōu)選出的部件的總和及其在本發(fā)明中相容性、規(guī)律性、諧調(diào)性按多目標統(tǒng)一的要求分區(qū)劃位的排列組合。
19、單碼部件指一個部件只編一個碼的部件。
20、雙碼部件指一個部件有兩個碼的部件,雙碼部件有時也叫“雙碼字根”。
21、編碼部件指依照拆分規(guī)則將單字或詞語拆分成為部件序列之后,再依照取碼規(guī)則取出用于編碼和輸入的部件序列,一般由2-4個部件組成。
22、編碼體系指本發(fā)明所制訂的漢字拆分規(guī)則、字詞的編碼規(guī)則以及依此對本發(fā)明所適用的漢字集合所建立的部件分解方式、或區(qū)位碼方式、或字母方式的字詞編碼碼表,或字詞編碼字典。
23、編碼空間指某一碼長編碼的可能性。四級空間指4碼的全部可能性,三級空間指3碼的全部可能性,二級空間指2碼的全部可能性,一級空間指1碼的全部可能性。在本發(fā)明中,二級空間即25×25=625,余類推。
24、原碼序列指將編碼部件對應(yīng)的區(qū)位碼(或字母碼)從左到右全部列出來后形成的一組代碼序列,該序列中如有雙碼部件,則該雙碼部件的2個碼全部列入。
25、編碼流程圖指本發(fā)明中依編碼規(guī)則對單字或詞語進行拆分編碼的操作步驟示意圖。
26、識別碼即“末筆字型交叉識別碼”,指本發(fā)明中當一個字拆不夠4個部件,因而碼長不足4時,必須在其編碼之后補加的一個由該字的“末筆代號”與“字型代號”復(fù)合而成的一個“交叉識別碼”。識別碼的多少可由選用的字型多少而定
當采用4種字型時,為5×4=20種,
當采用3種字型時,為5×3=15種,
當采用2種字型時,為5×2=10種,
當采用1種字型時,為5×1=5種。
識別碼共有三種可分別單獨使用的方式,即部件方式、區(qū)位方式、字母方式。
27、碼長指依本發(fā)明的編碼法,為字、詞所編出的輸入代碼的長度,在不計空格鍵時,該編碼長度在本發(fā)明中與相應(yīng)字、詞的輸入擊鍵次數(shù)相等。
28、漢字頻度表用于計算鍵位負荷,其根據(jù)是國家語委傅永和先生等編著的《現(xiàn)代漢語通用字表》(語文出版社1989年6月版)“信息交換用漢字編碼字符集基本集內(nèi)漢字數(shù)據(jù)統(tǒng)計表”所提供的漢字使用頻度數(shù)據(jù)。
29、相容性指若干個部件同處一個鍵位、享用同一個編碼時,相互容納的程度,可以量化為對重碼的影響,即重碼數(shù)。
30、規(guī)律性指部件排列劃分鍵位的規(guī)律??蓪⒃O(shè)計者宣布的若干條規(guī)律直接量化到每一個部件上,形成該部件的“規(guī)律度”。
31、諧調(diào)性指根據(jù)人機工程學(xué)和工程心理學(xué)的原理和試驗方法,測算出的鍵位負荷分布情況。
32、鍵位負荷指用某種輸入法輸入漢字時,每一個鍵位擊鍵次數(shù)在總擊鍵次數(shù)中所占的百分比值。
33、靜態(tài)負荷指用某種輸入法輸入GB-2312.80中全部6763個漢字各一個時,每一鍵位或某一部件被擊次數(shù)占總擊鍵次數(shù)的百分比值。
34、動態(tài)負荷指用某種輸入法輸入“漢字頻度表”所涉及的全部漢字時,每一鍵位或某一部件擊鍵次數(shù)在總的擊鍵次數(shù)中所占的百分比值。
35、鍵位負荷圖指將各鍵位負荷百分比標記在鍵盤圖上而形成的一張便于查閱、分析、對比的圖表。
本發(fā)明基本上保留沿用“五筆字型”現(xiàn)有技術(shù)的如下設(shè)計內(nèi)容
(1)5種筆畫橫(一)、豎(丨)、撇(丿)、點(丶、_)、折(乙)及其對應(yīng)的數(shù)字代號1、2、3、4、5。
(2)使用有25個輸入鍵的鍵盤,該鍵盤既可以是任何一個含有25個字符鍵位的專用鍵盤,也可以是一個標準的西文鍵盤。
(3)將25個鍵依5種筆畫分為5個區(qū),每區(qū)5個位。
(4)鍵名、成字根及最多取“一、二、三、末”四碼的字詞編碼規(guī)則。
(5)重碼提示、容錯碼輸入的設(shè)計方法。
(6)簡易型“五筆畫”輸入法。
以下詳細介紹,本發(fā)明在突破性地解決原方案的五個方面的不足與缺陷之后而確立的該新的95版五筆字型技術(shù)方案,即GWB方案。
首先,介紹原方案存在的以下五個方面的不足
一、原方案“字根體系”缺乏規(guī)范,不符合中小學(xué)教育中關(guān)于漢字字源和漢字構(gòu)造規(guī)律的規(guī)范化要求
1、原方案中“自造”了一些不規(guī)范的“字根”。
原方案中有“
_、_、
”等“自造字根”。“自造字根”破壞了傳統(tǒng)部首筆畫結(jié)構(gòu)的整體性。這些“自造”的、專門用于電腦輸入的“部件”,雖然在字根歸并、減少重碼中起到了一定作用,但畢竟與字源、與傳統(tǒng)認知習(xí)慣和教學(xué)規(guī)范相去甚遠,因而不易于被使用者接受,甚至有些專家因此批評說“五筆字型污染了漢字環(huán)境”。
2、字根“止”與“
”,“羊、
”與“_”都是同一字源,但在現(xiàn)有技術(shù)中要么同源根分在兩處,要么被拆成完全不相同的幾個部分。
3、“字根”與“非字根”界限不清,不規(guī)范。因字根體系未曾按規(guī)范化要求確認,常使學(xué)習(xí)使用者感到“似象似不象”,在拆分漢字時不敢“下刀”,產(chǎn)生“二義性”甚至“多義性”,嚴重地影響了漢字拆分的準確性和初學(xué)者的學(xué)習(xí)進度。
如字根“
”在實際拆分中均拆作“七”,但在字根表中并未標明“七”還同時代表“
”
再如字根口用”實際上還代表了“
、用”,但字根表中未能指示出來。
二、原方案“編碼體系”不符合傳統(tǒng)習(xí)慣和中小學(xué)教育中關(guān)于漢字教學(xué)的規(guī)范化要求
1、一批漢字的字根“拆分順序”不符合正確的書寫順序規(guī)范。
如敝丷冂
攵 (按規(guī)范應(yīng)為_冂八攵)
燕廿
口 灬 (按規(guī)范應(yīng)為廿口
灬)
篼_
白兒 (按規(guī)范應(yīng)為_白
兒)
2、一批漢字的字根“拆分結(jié)果”不符合漢字的構(gòu)字規(guī)范。
如束一口
(按規(guī)范應(yīng)為木口)
離文凵冂厶 (按規(guī)范應(yīng)為亠乂凵厶)
亍二_ (按規(guī)范應(yīng)為一丁)
象 _
(按規(guī)范應(yīng)為_口
)
3、一批漢字的“拆分筆畫順序”不符合中小學(xué)教學(xué)中關(guān)于筆畫順序的規(guī)范要求。
如方 丶一丿
(應(yīng)為丶一
丿)
成一丿
丶丿(應(yīng)為一丿
丿丶)
毋 _
一丿 (應(yīng)為_
丿一)
三、原方案“鍵盤設(shè)計”由于許多“自造”字根的存在,不符合漢字規(guī)范
由于鍵盤上出現(xiàn)了10多個“
_、
_”等“自造”符號,使原方案的鍵盤設(shè)計用作“拼形組字”輸入時,不利于中小學(xué)生對漢字的正確認知和使用,自然也有礙于在教育系統(tǒng)中普及漢字輸入技術(shù)。
四、原方案“鍵盤設(shè)計”在人機工程學(xué)方面亟需改進,以便使各鍵位的手指負荷分配更為合理、擊鍵更加諧調(diào)
由于歷史上發(fā)明人對于字根的鍵位設(shè)計只作過定性的研究而未曾定量地同時計算各排鍵、各手指的靜態(tài)和動態(tài)負荷,因而出現(xiàn)了不匹配、不協(xié)調(diào)的現(xiàn)象,使得原方案在輸入漢字時,上、中、下三排鍵以及每排鍵的各個手指的負荷分配不盡合理,使操作者易于疲勞而影響輸入效率。
另外,由于字根選取的不合理,未把諸如“母”、“氏”等常用部件作為整部件(即要拆開),也使得原方案在輸入相當一些常用漢字,如“每、海、梅、紙、底、低”等時,出現(xiàn)“不順手”甚至“別手”的現(xiàn)象,從而影響速度,使錯碼率升高。
五、原方案的嚴重缺陷必然對漢字規(guī)范教學(xué)、規(guī)范輸入產(chǎn)生不良影響
綜上所述,現(xiàn)行“五筆字型”在字根選取、編碼規(guī)則、編碼體系以及鍵盤設(shè)計方面存在著比較嚴重的不足和缺陷。與規(guī)范化要求相比,在國家標準6763個漢字中,總共涉及到40%以上的漢字,這其中大部分還是常用字。如果將原方案繼續(xù)推廣下去,而不及時改進、創(chuàng)新,特別是當“五筆字型”大規(guī)模地進入學(xué)校和家庭之后,必然會產(chǎn)生嚴重影響
1、不利于中小學(xué)里漢字的規(guī)范教學(xué),特別是當電腦普及之后,原方案的普及,反過來會影響中小學(xué)生對漢字的正確書寫。
2、不利于國家語委、國家教委就語言文字規(guī)范所頒布的有關(guān)文件的貫徹執(zhí)行。
3、因原方案的字根體系、拆分規(guī)則、拆分結(jié)果與文字結(jié)構(gòu)傳統(tǒng)和漢字教學(xué)規(guī)范化的要求不相一致,“五筆字型”便不可能大規(guī)模地、社會化地進入學(xué)校和家庭。
4、不利于進一步提高漢字輸入的效率和質(zhì)量。
5、不利于實現(xiàn)從“用筆書寫”向“用電腦書寫”這一書寫方式的過渡。
6、不利于我國漢字形碼輸入技術(shù)走向統(tǒng)一。
本發(fā)明的目的是克服“五筆字型”現(xiàn)有技術(shù)以上所列舉的全部不足和缺陷,以重新設(shè)計的部件集合、部件體系、雙碼部件及其編碼輸入法、含雙碼部件的“根序優(yōu)先、筆順規(guī)范、盡量取大、兼顧直觀”的拆分編碼原則及其輸入鍵盤共同形成了一個符合漢字教學(xué)規(guī)范、更科學(xué)、更實用、便于在中小學(xué)中推廣應(yīng)用的漢字輸入系統(tǒng),本發(fā)明是以“五筆字型”現(xiàn)有技術(shù)為基礎(chǔ)的一次全方位的發(fā)展和創(chuàng)新。
以下結(jié)合說明書附圖,對本發(fā)明的技術(shù)方案加以詳細介紹,通過以下描述將會從根本上了解本發(fā)明的特點、優(yōu)點和巨大的進步意義
附
圖1GWB部件體系
附圖2GWB部件體系與現(xiàn)有技術(shù)對比變化一覽表
附圖3GWB從現(xiàn)行五筆字型字根體系中減少的字根
附圖4GWB較現(xiàn)行五筆字型字根體系新增的部件及其所處鍵位
附圖5GWB的“雙碼部件”及其鍵位分布
附圖6GWB確定的同源、形似、變形部件及其鍵位分布
附圖7GWB繁體部件及其鍵位分布
附圖8GWB基本筆畫及其不同形態(tài)
附圖9GWB編碼規(guī)則及編碼流程圖
附圖10GWB鍵盤(用標準英文鍵盤)
附圖11GWB鍵盤(專用中文鍵盤)
附圖12GWB部件布局“規(guī)律度”
附圖13原方案字根布局“規(guī)律度”
附圖14GWB部件靜態(tài)頻度表
附圖15GWB部件分類表
附圖16GWB主部件開頭的部件序列圖
附圖17GWB檢索裝置
附圖18大、中鍵盤之內(nèi)的GWB輸入鍵盤
附圖19GWB5×5超小型輸入鍵盤
附圖20GWB的信息處理系統(tǒng)
1.本發(fā)明通過減少原方案的字根、取消不符合漢字規(guī)范的“自造”字根、盡量采用傳統(tǒng)部首、設(shè)計雙碼部件、增加部件、重新設(shè)計部件區(qū)位以及細化筆畫形態(tài)等措施,形成了一個符合漢字規(guī)范的用于編碼和輸入的部件體系(圖1,圖2)。
圖1顯示本發(fā)明全新的部件體系;
圖2詳列了本發(fā)明的部件體系與現(xiàn)有技術(shù)的根本不同。
(1)本發(fā)明針對漢字的現(xiàn)代規(guī)范字形而設(shè)計,為了使部件的優(yōu)選與確定符合漢字的結(jié)構(gòu)規(guī)律和規(guī)范教學(xué)的要求,特按照國家語委對漢字規(guī)范化的要求以及著名文字學(xué)專家的意見,以下面幾項原則作為理論指導(dǎo)
①字源分析法經(jīng)對漢字部件進行字源分析,根據(jù)漢字的造字法選取與主部件屬于同一字源的部件作為“同源部件”,并將同源部件緊列在主部件之后,如
“忄”、“
”與“心”同源,被選用,并列在“心”后;
“
”、“
”與“止”同源,被選用,并列在“止”之后;
“
”與“米”同源,被選用,并列在“米”之后;
依此選取符合漢字構(gòu)字規(guī)律和教學(xué)規(guī)范的部件。
②字素分析法字素分析法指漢字的構(gòu)字法,部件的選取如果完全按照字源分析法,則未必適用于現(xiàn)代漢字字形的認識。如“穎”字,從“禾”,“頃”聲,按字源法應(yīng)分為“禾”和“頃”,按字素分析法,則應(yīng)分為“匕禾_貝”等4個部件。
③綜合運用原則部件的選取盡可能選用傳統(tǒng)部首,傳統(tǒng)部首如因鍵位限制不能入選為整字部件時,也不能拆成幾個“自造”的部分,既要照顧到規(guī)范化,又要合理地設(shè)計編碼。
④習(xí)慣約定原則獨體字“果”未能入選為部件,按字源,應(yīng)拆成“田木”兩個部分,但按“筆畫不能切斷”這一習(xí)慣,“果”只能拆成“日木”兩個部分,可謂約定俗成。
⑤系統(tǒng)規(guī)定由于編碼空間的限制以及部件相容性的考慮,本發(fā)明對部件作出了本系統(tǒng)獨特的規(guī)定如“雙碼部件”的設(shè)計以及補加“識別碼”的規(guī)定,既保證了部件的規(guī)范化,又合理地設(shè)計了鍵位和編碼,使系統(tǒng)在“小鍵盤、規(guī)范化”方面獲得了突破性進展。
(2)按照(1)中的理論指導(dǎo),本發(fā)明取消了原方案中構(gòu)字能力差的以及不符合漢字規(guī)范的“自造”的以下16個字根(圖3)
戔、弋、
_、_、
_、
在本發(fā)明中它們之中的一部分分別按以下方式分解為部件或筆畫,如
戔一戈, 弋
丶,亠口
丶,ク
(3)按照(1)的理論指導(dǎo),本發(fā)明在現(xiàn)行五筆字型字根的基礎(chǔ)上新增以下25個整字或傳統(tǒng)部首作為部件(圖4)
_、戊、豸、隹、氏、母、氣、爿、不、耒、酉、革、皮、舟、牜、飠、犭、魚、羊、
_、礻、衤、艮、
經(jīng)過對這些部件放入各鍵后對重碼、諧調(diào)性等參數(shù)的影響進行浩繁的計算,本發(fā)明將上列前8個部件分別設(shè)計在以下鍵位上
_——21,戊——13,豸——33,隹——34,氏——33,
母——55,氣——32,爿——42
(4)按照(1)的理論指導(dǎo),本發(fā)明新設(shè)計了與主要部件同源的、或形似變形的、或便于聯(lián)想記憶的以下35個部件,并分別安排在以下所示的鍵位上(圖6)
——12
——13
覀 ——14
——21
廾 ——15日
——22
——24
——25
月
用 ——33_
——35
_
氺 ——43
——44
爿 ——42_
——53
ユ ——51
匕七——55
(5)本發(fā)明新增加了以下用于繁體字編碼的部件11個,當不使用這些部件時,本發(fā)明就成為只處理簡體字的技術(shù);當使用這些部件、而不使用與之對應(yīng)的簡體部件時,本發(fā)明便成為只處理繁體字的技術(shù);當簡體、繁體部件同時使用時,本發(fā)明就成為既可以處理繁體又可以同時處理簡體的技術(shù)(圖7)。
車 貝
鳥
魚 言 門 馬 糹
(6)按照(1)的理論指導(dǎo),本發(fā)明為了使?jié)h字的拆分直觀易學(xué),還規(guī)范明確了單筆畫拆分時的不同形態(tài),并在碼本中直觀地標示出來,以便于中小學(xué)生拆分漢字和學(xué)習(xí)編碼輸入時對比使用(圖8)。
一
丨亅
丿
_ 丶
乙
_
乛
ㄋ
_乚
_
ㄑ
ㄣ
(7)本發(fā)明將55(X)鍵的鍵名由“纟”改為“幺”,將51(N)的鍵名“已”改為“己”,以便于稱謂和記憶。
(8)按照(1)的理論指導(dǎo)和部件選取符合教育規(guī)范的要求,本發(fā)明中構(gòu)字能力低的部件、新增傳統(tǒng)部首、雙碼部件以及同源、形似、變形部件,除了還可以在教學(xué)和實用過程中做小幅度的增減之外,整個的區(qū)與整個的位之間,必要時還可以作整體對調(diào)。
2.本發(fā)明創(chuàng)造性地提出了“雙碼部件”的設(shè)計,這一設(shè)計是解決小鍵盤輸入方案中整字部件不能太多這一突出矛盾的技術(shù)突破既保證了傳統(tǒng)部首在部件總表中的完整性,合理地分配了編碼空間,又明顯地改進了鍵面設(shè)計,使之符合規(guī)范,更加實用。
本發(fā)明取消了現(xiàn)行方案中“
_、
_、
_、
”等非傳統(tǒng)部首,而用傳統(tǒng)部首和整字束、酉、革、皮、舟、牛、飠、犭、魚、魚、羊、
_、礻、衤、艮、
等“雙碼部件”取而代之。為了使這些部件在鍵盤上的排列不但符合規(guī)律性要求,又能夠合理地分配編碼空間,不致于因這些部件在鍵盤上因享用一個鍵、一個碼而“獨霸一方”,從而導(dǎo)致大量增加重碼,本發(fā)明采用機助設(shè)計,經(jīng)過大量的統(tǒng)計、分析、測試、研究、計算和反復(fù)的試驗比較,確定
將“革、礻、衤、皮、犭、牜”等18個傳統(tǒng)部首分別按其“朱筆筆畫特征”或“末筆筆畫的結(jié)構(gòu)特征”定義為“雙碼部件”(圖5),即
本發(fā)明中“雙碼部件”的數(shù)目可多可少。本發(fā)明提出并設(shè)計“雙碼部件”的意義在于
①使部件與傳統(tǒng)部首保持一致、保持完整而不被拆分,而且符合文字結(jié)構(gòu)傳統(tǒng),不給中小學(xué)生增加不認識、不規(guī)范的筆畫結(jié)構(gòu),因而便于學(xué)習(xí)和使用,有效地縮短培訓(xùn)時間。
②使鍵盤設(shè)計更加簡明合理,符合構(gòu)字規(guī)范,使拆字擊鍵與認字寫字的傳統(tǒng)習(xí)慣保持一致,操作方便,提高效率。
另外,依據(jù)本發(fā)明關(guān)于“雙碼部件”的設(shè)計方法,在簡體字范圍內(nèi)為了進一步減少重碼,“雙碼字根”的數(shù)目實際上還可增加,可以進一步將占據(jù)漢字拓撲圖形左部和上部、組字較多(如超過25個漢字)、引起重碼太多的傳統(tǒng)“部首”也確定為“雙碼部件”。例如,可以依照“雙碼部件”的方法再將以下“部首”擴展設(shè)計為“雙碼部件”
依據(jù)本發(fā)明,當處理繁體字時,特別是處理CJK10646中20902個漢字或更大集合的漢字時,“雙碼部件”的數(shù)目還可以再增加
依據(jù)本發(fā)明,“雙碼部件”的兩個碼,在減少重碼和合理分配鍵位負荷成為主要矛盾時,同時考慮方便記憶的情況下,第二個碼的確定,在依據(jù)部件的筆形特征的前提下,可以比較靈活。如“舟”的兩個碼,既可以是“31、33”(TE),也可以是“31、41”(TY);“羊”的兩個碼既可以是“42、13”(UD),也可以是“42、21”(UH)。前者是依據(jù)末筆所在的筆畫組的筆形,后者則是依據(jù)末筆畫。
本發(fā)明所創(chuàng)造的雙碼部件是一個新的技術(shù)方案,它完全不同于現(xiàn)有技術(shù)“鄭碼”中的“多碼字根”
本發(fā)明的“雙碼”與鄭碼的“多碼”比較
本發(fā)明的“雙碼部件”在應(yīng)用時,在鍵盤上或者說明書中均以完整字根的形式表示,特別是對于一開始就學(xué)習(xí)使用本發(fā)明的學(xué)習(xí)者。
然而,對于學(xué)習(xí)使用過原方案的人,有時為了使原方案與本發(fā)明盡快銜接過渡,或者為了照顧一部分使用者的個人方便,本發(fā)明的一切“雙碼部件”,仍然可以被“強行”拆作兩個包含有不規(guī)范“部件”的兩個部分,并分別按其“雙碼”中的第一碼與第二碼將該兩個部分安排在相應(yīng)的區(qū)位(鍵位)上,如
一般情況下,“強行”拆分結(jié)果中出現(xiàn)的非規(guī)范部件的編碼和鍵位,與使用“雙碼部件”并無不同。但有時為了更為合理地分配鍵位負荷,或更為合理地將雙碼中的第二個碼設(shè)計在整個編碼空間中比較不“擁擠”之處,也可以給非規(guī)范部件“人為地”指定一個編碼,就相當于把非規(guī)范部件人為地設(shè)計在某個鍵位上。而且,根據(jù)編碼空間合理分配及部件相容性的需要,一個雙碼部件有時可以人為地依形“強行”拆分成2種甚至3種結(jié)果,如上表中的“不”和“舟”所示,這種情況叫“系統(tǒng)約定”。
這樣,就形成了一個便于從“不完全規(guī)范”過渡到“完全規(guī)范”的“過渡性部件集合”、“過渡性編碼體系”、“過渡性部件總表”及其鍵盤。為便于從原方案過渡到本發(fā)明,從實用的角度出發(fā),這一點對于本發(fā)明也是許可的。
依據(jù)本發(fā)明,在對漢字拆分提取“編碼部件”之后,當“原碼序列”不足4個碼時,應(yīng)補加末筆字型識別碼(下表中不列出)
a、“編碼部件”為2時b、“編碼部件”為3時c、“編碼部件”為4時
輸入碼2是4個編碼部件各取第一碼,即無論雙碼部件有幾個,一律取ABCD。這一種取碼方法的優(yōu)點是對重碼的離散效果好,重碼少,缺點是對“原碼序列”來說,不是順序取碼。所以,以上兩種取碼法使用時,只擇其一種。當處理CJK10646大字符集時,為減少重碼,以第二種方法為好。這一方法有時也可以用于三個編碼部件的情況。
以此形成的雙碼部件的編碼規(guī)則和雙碼部件輸入法;
3.本發(fā)明依規(guī)范化的要求,創(chuàng)造性地提出“根序優(yōu)先、筆順規(guī)范、盡量取大、兼顧直觀”作為編碼拆分的總則,使?jié)h字輸入與漢字教學(xué)規(guī)范、書寫規(guī)范兼顧,與以上關(guān)于雙碼部件的編碼規(guī)則一起,形成了新的編碼體系(圖9)。
筆畫構(gòu)成部件,部件構(gòu)成漢字,漢字構(gòu)成詞語。筆畫、部件、整字是漢語文字在輸入電腦時的“三個層次”。
本發(fā)明將所選取的構(gòu)字單位統(tǒng)稱為“部件”。實際上是構(gòu)成漢字的“零件”。
本發(fā)明對漢字拆分的總的規(guī)范化指導(dǎo)思想是漢字拆成部件,部件拆成單筆畫。
書寫漢字時,人們重視的是筆畫的順序——筆順——即書寫順序。
鍵入漢字時,人們重視的是字根的順序——根序——即鍵入順序。
在大多數(shù)情況下,“筆順”與“根序”在漢字中是完全一致的。
如“樹”、“總”、“詞”、“戇”等,它們的字根(部件)順序與其筆畫順序是完全一致的。
然而,當把“包圍型”及“套迭型”漢字拆分成一串“部件序列”時,“筆順”與“根序”就常常發(fā)生矛盾。
如“國”
筆順為丨_一一丨一丶一
根序為口王丶
其中,“國”的最后一個筆畫“橫”,被字根“
”“帶”到第一個部件上了。
再如“束”
筆順為一丨_一丨丿_
根序為木口
其中,第四筆寫成的“口”的末筆,被部件“口”“帶”到第二個部件里,而在“口”之后書寫的“丿_”反倒被“木”“帶”到第一個部件里了。
拆分輸入時要依照根序,而漢字教學(xué)中又強調(diào)筆順規(guī)范,這兩者的矛盾,在現(xiàn)有的形碼編碼方案中,包括“五筆字型”現(xiàn)有技術(shù)中,一直沒有一個能應(yīng)付所有情況的統(tǒng)一的規(guī)則,因而使拆分普遍存在著任意性、多義性,既無法與教學(xué)“接軌”,又不能提高編碼的質(zhì)量。
為了解決以上矛盾,本發(fā)明提出“根序優(yōu)先,筆順規(guī)范,盡量取大,兼顧直觀”作為一條拆分總則。即在“根序”與“筆順”發(fā)生矛盾時,優(yōu)先按“根序”取碼,當需要拆成單筆畫時,則嚴格按照規(guī)范的書寫順序進行。
在將漢字拆分成部件時,要盡量拆成最大的已知部件;如不能形成已知的最大部件,可以拆成較小的已知部件;如不能形成較小的部件,則拆成單筆畫,此即“盡量取大”。
當一個獨體字被拆成字素或部件時,應(yīng)以拆出的部件直觀性好為優(yōu)選拆法,如“自”既可以拆成“
_三”,也可以拆成“丿目”,但后者直觀性好,故本發(fā)明取后者,此即“兼顧直觀”。
這一規(guī)定的意義在于既能使部件的拆分符合漢字構(gòu)字的規(guī)范和傳統(tǒng)。又能使筆畫的拆分符合教學(xué)規(guī)范,便于漢字輸入技術(shù)進入中小學(xué)漢字教學(xué)之中。
按照“根序優(yōu)先、筆順規(guī)范、盡量取大、兼顧直觀”的拆分總則,本發(fā)明字、詞的拆分取碼輸入規(guī)則如下
①鍵名編碼及輸入法
依據(jù)本發(fā)明,每個鍵位上一組部件中,可選一個有代表性的部件作為該鍵位的鍵名,鍵名既可以沿用現(xiàn)行五筆字型技術(shù)中將本鍵連打四下輸入鍵名漢字,
如禾禾禾禾禾,(31 31 31 31,TTTT)
也可以不按打四下輸入,而將鍵名作為“成字部件”輸入,
如禾禾丿一_,(31 31 11 41,TTGY)
②單碼部件編碼及輸入法
依據(jù)本發(fā)明,成字部件中非雙碼部件的單碼部件,其輸入法是
部件區(qū)位碼+首筆單筆碼+次筆單筆碼+末筆單筆碼。
如果按以上輸入不足4個碼,則要在前后補打空格鍵以完成輸入。
依據(jù)本發(fā)明,單碼部件還可以采用拆成單筆畫后取其中某幾個筆畫以及根據(jù)編碼空間分布定義或半定義的辦法為之設(shè)計輸入碼。
③雙碼部件編碼及輸入法
依據(jù)本發(fā)明,其雙碼部件的編碼及輸入法有4種可分別單獨使用或同時使用其中幾種的編碼輸入方式。
a)直接以雙碼部件的2個碼作為輸入碼
如革15 12(AF)
b)雙碼中的第一碼+第二碼+首筆單筆+末筆單筆
如革15 12 11 21 (AFGH)
c)雙碼中的第一碼+首筆單筆+次筆單筆+末筆單筆
如革15 11 21 21 (AGHH)
d)在雙碼部件的兩個碼前邊加前綴碼,或后邊補加后綴碼,或前后同時加前綴碼和后綴碼形成輸入碼輸入
如“革”的雙碼為15 12 (AF)
加前綴革24 15 12(LAP)
加后綴革15 12 24(AFL)
同時加前綴和后綴碼革24 15 12 24(LAFL)
用于前綴或后綴的那個碼(字母),可以是編碼空間中的空余碼,即不致于因補加而產(chǎn)生重碼的11~55(G~X)中的任何一個碼,前綴碼、后綴碼也可以是同一個碼。
e)拆成不超過4個的單筆畫,不足4個時,補加空格鍵輸入
如革一丨 丨 丨
④單字拆分編碼及輸入法
依據(jù)本發(fā)明,其簡體和繁體漢字的拆分編碼及輸入流程見說明書附圖9。
⑤詞語編碼及輸入法
依據(jù)本發(fā)明,其包含有雙碼部件的詞語編碼及輸入法為
a、兩字詞每字各取其單字全碼的前2個碼,共4碼,
如經(jīng)濟纟ス氵文(55 54 43 41,XCIY)
b、三字詞第一字、第二字各取其單字全碼的第一碼,再加第三字全碼的前兩碼,共4碼,
如計算機讠_木幾(41 31 14 32,YTSR)
c、四字詞四個字各取其全碼的第一碼,共4碼,
如科學(xué)技術(shù)禾_扌木(31 43 32 14,TIRS)
d、多字詞取第一、二、三及最末一個字的全碼的第一個碼,共4碼,
如中華人民共和國口亻人口(23 34 34 24,KWWL)
⑥單筆畫輸入法
根據(jù)本發(fā)明,5種單筆畫的編碼和輸入方法是將所在的鍵連打兩下再補加2個定義碼
一11 11 24 24(GGLL)
丨21 21 24 24(HHLL)
丿31 31 24 24(TTLL)
乙51 51 24 24(NNLL)
其中定義碼可以是24(L)以外的其它編碼,可以是一個也可以是2-3個;
⑦末筆交叉識別碼
依據(jù)本發(fā)明,其“末筆字型識別碼”可以全部直接沿用現(xiàn)行五筆字型技術(shù)中的“5種末筆×3種字型”計15個識別碼,也可以將上下型與雜合型進一步歸為一種,即將字型進一步減少為“左右型”以及“非左右型”2種。此時“末筆字型識別碼”則有以下10種
左右型11(一,G),21(丨,H),31(丿,T),41(_,Y),51(乙,N)非左右型12(二,F(xiàn)),2 2(||,J),32(
,R),42(
,U),52(ㄍ,B)
另外,依據(jù)本發(fā)明,為進一步簡化“末筆字型識別碼”,
可以只將1型字(左右型)按上述方式補加識別碼,而非1型字不加“識別碼”,此時,識別碼只有5種
11(一,G),21(丨,H),31(丿,T),41(_,Y),51(乙,N)。
對于不足4個碼的字來說,這一點在實際上,就等于凡1型(左右型)的字補加一個末筆畫而已,而非1型(左右型)的字,則只輸入其部件碼。這一情況是“識別碼”這一創(chuàng)造的最簡化的實施例。
⑧高頻字
本發(fā)明各鍵位上的高頻字,既可以保留原方案,也可以按照漢字的頻度重新選定。
4.本發(fā)明依據(jù)符合漢字規(guī)范的部件體系和人機工程學(xué)原理,采用機助手段,定量計算部件體系各部件的構(gòu)字頻度、各部件的實用頻度、動態(tài)重碼率、靜態(tài)重碼率及各鍵位的靜態(tài)負荷、動態(tài)負荷,運用調(diào)整部件鍵位及拆分規(guī)則相結(jié)合的方法,使部件共容一鍵的相容性、部件鍵位分布的規(guī)律性、擊鍵時手指的諧調(diào)性等三個目標,在更高的水平上達到了諧調(diào)統(tǒng)一,形成了符合漢字規(guī)范、科學(xué)、實用的輸入鍵盤(圖10,圖11)。
眾所周知,計算機漢字輸入法及其鍵盤的設(shè)計,其所以舉世稱難,蓋因它是一項涉及到語言文字學(xué)、信息論、計算機科學(xué)和人機工程學(xué)的全新的交叉科學(xué)。只有將諸多學(xué)科的理論同時運用并加以創(chuàng)造,才有可能創(chuàng)造出真正科學(xué)化、實用化的漢字輸入技術(shù)。
五筆字型問世之后,本發(fā)明人對自己1978年——1995年長達16年的理論探索和科研實踐加以總結(jié),創(chuàng)造性地提出了在符合漢字規(guī)范的情況下,保證一項形碼設(shè)計具有科學(xué)性、實用性的“形碼設(shè)計三原理”,即
A.相容性原理
指若干個部件共容一鍵時,對重碼率的影響,即對編碼“唯一性”的影響。相容性越好,引起的重碼越少。研究過程中,“相容性”常常直接用量化為重碼的字數(shù)來表示;
B.規(guī)律性原理
指部件在鍵盤上排列布局的易學(xué)性。規(guī)律性好的排列布局便于記憶,容易掌握。一般來說,規(guī)律性是一個可以體會但很難量化,因而很難評價的軟指標。在這里,本發(fā)明人創(chuàng)造了一種方法,即將設(shè)計者提出的部件在鍵盤上排列的“規(guī)律性”,量化為表示相對值的數(shù)字。在本發(fā)明中這種量化值是
據(jù)此,可以計算出任何一個部件的“規(guī)律度”。雙碼部件的“規(guī)律度”可按其兩個碼的“規(guī)律度”相加取平均值計算。
本發(fā)明部件的靜態(tài)“規(guī)律度”平均值為G=7.42(圖12)
原方案字根的靜態(tài)“規(guī)律度”平均值為G=7.26(圖13)
由此可見,本發(fā)明比原方案部件(字根)布局的規(guī)律性明顯提高。
部件的“規(guī)律度”,作為一項重要的理論指標,對于一個形碼設(shè)計來說,是衡量其學(xué)習(xí)難易程度、評價其優(yōu)劣的極為重要的數(shù)據(jù)。方案調(diào)整優(yōu)化的一種追求,部件排列的規(guī)律性改進,就是要使“規(guī)律度”這個值增大。
“規(guī)律度”可分為靜態(tài)和動態(tài)兩個值。靜態(tài)值是只考慮部件的構(gòu)字頻度計算出的各部件的規(guī)律度;動態(tài)值則是按照《漢字頻度表》將靜態(tài)值加權(quán)計算出的規(guī)律度。
C.諧調(diào)性原理
指手指擊鍵的負荷分配、擊鍵時各手指動作的相關(guān)性和諧調(diào)性。
諧調(diào)性的研究是一個非常復(fù)雜的人機工程學(xué)和工程心理學(xué)問題。無論是形碼或是音碼設(shè)計,諧調(diào)性的研究和應(yīng)用,對于輸入效率都會產(chǎn)生重大的、根本性的影響。
眾所周知,打英文的字母鍵盤,被近來證明是一個效率很低但因“木已成舟”不能更改的設(shè)計。鑒于漢字輸入鍵盤目前還沒有定型,所以一開始就設(shè)計效率高,即諧調(diào)性好的鍵盤,便具有重大意義甚至深遠的歷史意義。
為了使本發(fā)明的鍵盤設(shè)計在科學(xué)的理論指導(dǎo)下達到良好的諧調(diào)性,本發(fā)明通過大量的統(tǒng)計研究并根據(jù)工程心理學(xué)的試驗數(shù)據(jù)得出結(jié)論
①同一個手單個手指的敲擊運動間隔平均為0.09秒(同指連擊);
②同一個手的不同手指敲擊運動間隔為0.03秒(同手異指輪擊),平均擊鍵次數(shù)為單手單指時的3倍;
③不同手的手指之間敲擊運動的間隔為0.02秒(左右輪擊),平均擊鍵次數(shù)為單手單指時的4.5倍。
而且,通過上千人次的實驗測出,人的各個手指連續(xù)敲擊的頻率如下表所示(每分鐘次數(shù))
這一研究表明,一個諧調(diào)性好、效率高的輸入鍵盤,應(yīng)當做到
①充分發(fā)揮食指、中指的功能;
②要減輕雙手小指的負荷;
③盡量避免單手單指打鍵;
④部件拆分及編碼設(shè)計要盡量實現(xiàn)左右手交替擊鍵。
“三原理”是一個三者互相影響的多目標。當強調(diào)某一個目標時,其它兩個便會減弱。如特別強調(diào)規(guī)律性,即特別重視易學(xué)性,則重碼必然增加,諧調(diào)性必然被破壞。因此可以在三者總體協(xié)調(diào)的情況下,對同一個部件集合設(shè)計出許多個利弊取舍有所不同的實施例來。
依據(jù)關(guān)于漢字規(guī)范化的要求以及上述“形碼設(shè)計三原理”,本發(fā)明符合漢字規(guī)范的鍵盤設(shè)計依照以下方法進行并具有以下特點
(1)采用符合漢字規(guī)范的部件體系形成符合漢字規(guī)范的鍵面布局
①消除了“自造”部件“
_、_、
_、
_、
”等非規(guī)范筆畫結(jié)構(gòu)。
②增加了傳統(tǒng)部首”不、耒、酉、革、皮、舟、牜、飠、犭、魚、魚、羊、
_、礻、衤、艮、
”等作為“雙碼字根”。
③增加了傳統(tǒng)部首“_、戊、氏、豸、母、隹、氣”等作為“整字部件”。
④將同源部件、變形部件、或形似部件“
爿、_、
_、
”等設(shè)計在鍵盤上。
⑤將折筆“乙”的不同形態(tài)表示在鍵位上或鍵盤上。
以上措施不但使部件規(guī)范化,鍵面布局、鍵盤設(shè)計規(guī)范化,而且使部件的平均“規(guī)律度”得以提高。
根據(jù)規(guī)范化的要求和實踐經(jīng)驗,鍵盤上的傳統(tǒng)部首、雙碼部件、同源部件、形似部件和變形部件還可以適當增減。
(2)依據(jù)部件拆分輸入時對指法諧調(diào)性的影響,設(shè)計部件并分配其鍵位,使輸入時手指的諧調(diào)性顯著進步,有利于減輕錄入員的疲勞并提高輸入速度
①關(guān)于“
”和“_”——減輕A鍵負荷的設(shè)計
原方案中無“_”,遇到“_”輸入時,就要拆分為2個部件
_——
七(21 15,HA)
因此,凡輸入含“_”的字,必然要用最“低能”的左手小指擊A鍵。本發(fā)明設(shè)計了“_”之后,使左手小指的負荷減少。而且“_”仍處在21(H)鍵,使規(guī)律度仍然為8,不受任何影響;
②關(guān)于“母”——避免下、中、上三排擊鍵
原方案中無“母”,遇到“母”,就要拆成3個部件
母——
一
(55 11 42,XGU)
而“XGU”分別在三排鍵上。故輸入時必然要擊三排鍵,不但容易出錯,而且影響速度。
本發(fā)明增加“母”后,改善了負荷分配,使“每、海、敏、繁、梅”這些常用字的輸入符合諧調(diào)性的要求,打起來“順手”。
③關(guān)于“氏”——避免小指連擊,轉(zhuǎn)移小指負荷
原方案中無“氏”,凡含“氏”的字一律要拆為用同一小指擊鍵的2個部件
氏——
(35 15,QA)
本發(fā)明增加整字部件“氏”后,明顯減少小指連擊QA的負荷,對于常用字“低、紙、底、抵、婚、昏”等字來說,手指的諧調(diào)性大為改善,從而提高輸入速度、減少錯誤擊鍵,降低錯碼率。
雖然將“氏”設(shè)計在“33”上因“次筆不符合位號”而使“規(guī)律度”減少了4,但這一犧牲卻大大改進了諧調(diào)性,因而是值得的。
在本發(fā)明總的指導(dǎo)思想之下,采用相同的方法,還可以根據(jù)規(guī)范化的要求,再調(diào)整若干個部件的鍵位,而使諧調(diào)性在與相容性、規(guī)律性三者的利弊權(quán)衡中作新的取舍而成為新的實施例。如還可以為了減輕45(P)的負荷,將“礻、衤”移到44(O)鍵上,為減輕A鍵負荷,將“工”移到12(F)鍵上等等。
(3)本發(fā)明卓有成效地合理分配了鍵位的擊鍵負荷,使諧調(diào)性有重要進步
為了解決32(R)鍵和44(O)鍵平均擊鍵負荷明顯偏低而影響指法諧調(diào)性和輸入速度的問題,對使用頻度和構(gòu)字頻度都相當高的常用的3個部件——幾、乂、廣,用機助的方法,通過對該3個部件所涉及的348個字的編碼構(gòu)成、實用頻度及其對鍵位負荷、重碼率、規(guī)律性的綜合影響等參數(shù),進行計算對比和權(quán)衡,本發(fā)明將該3個部件設(shè)計在如下鍵位上
將“幾”從25(M)鍵移到32(R)鍵;
將“乂”從35(Q)鍵移到32(R)鍵;
將“廣”從41(Y)鍵移到44(O)鍵;
以下表格定量地表示以上設(shè)計對鍵位負荷、重碼數(shù)及規(guī)律性的影響
幾、乂、廣的鍵位設(shè)計對相容性、規(guī)律性、諧調(diào)性的影響對比表
以上表中,重碼組數(shù)欄1-1指一級漢字間的重碼,1-2指一級字與二級字之間的重碼;2-2指二級字之間的重碼。
由上表可知,一個涉及一大批漢字的部件的移動,常常對“三原理”同時產(chǎn)生影響。
為了更為詳細具體地介紹為部件重新設(shè)計鍵位的目的、方法及其效果,現(xiàn)以部件“廣”從41(Y)鍵移到44(O)鍵前后對重碼的影響為例,來說明這一設(shè)計除改善鍵位負荷之外,對相容性還作出了很大的貢獻(以下字后邊的*代表一級字,**代表二級字)
①“廣”在41(Y)鍵上時所引起的重碼
1.5959 壙 FYT ** 2327 坊 FYT *
2.3602 蘑 AYSD * 6234 蘼 AYSD **
3.8566 踱 KHYC ** 8583 躞 KHYC **
4.3550 靡 YSSD * 3605 磨 YSSD *
5.3473 麻 YSSI * 8767 縻 YSSI **
6.3607 魔 YSSC * 8765 麼 YSSC **
7.2987 謹 YAKG * 6659 廑 YAKG **
8.5105 鷹 YWWG * 5863 讖 YWWG **
9.5568 率 YWWF * 5589 座 YWWF * 10.2567 廣 YYGT * 2329 方 YYGT * 11.5527 諄 YYKB * 3210 廓 YYKB * 12.3314 廉 YUVO * 3911 謙 YUVO * 13.3346 廖 YNWE * 3593 謬 YNWE * 14.5887 鄺 YBH ** 5890 邡 YBH ** 15.2493 庚 YVWI * 6655 庾 YVWI ** 16.7094 纊 XYT ** 2336 紡 XYT *
以上重碼共有16對,重碼字共有32個
其中一級字共有20個,二級字共有12個
其中1-1重碼=6,1-2重碼=8,2-2重碼=2
②“廣”設(shè)計在44(O)鍵上后所引起的重碼
1.3602 蘑 AOSD * 6234 蘼 AOSD **
2.8711 鳙 QGOH * 3359 鱗 QGOH *
3.3550 靡 OSSD * 3605 磨 OSSD *
4.3473 麻 OSSI * 8767 縻 OSSI **
5.3607 魔 OSSC * 8765 麼 OSSC **
6.4505 庭 OTFP * 1858 糙 OTFP *
7.2493 庚 OVWI * 6655 庾 OVWI **
以上新重碼共有7對,新重碼字共有14個
其中一級字共有9個,二級字共有5個
其中1-1重碼=2,1-2重碼=5,2-2重碼=0
部件“廣”共計涉及了117個漢字,“廣”的移位雖然犧牲了一部分規(guī)律性,從首二筆完全與區(qū)位一致的“41”移到了只有首筆與區(qū)號符合的44鍵,使規(guī)律度減少了4,下降了一個級別,但這點犧牲換來的卻是
a.相容性更好使由“廣”引起的重碼總數(shù)從16對降為7對,其中一級字之間的重碼就減少了4對;而且從以上所列重碼可見,移后仍存在的2對一級字間的重碼“靡、磨”和“庭、糙”中,只有一個字“庭”是常用字。這對于部件的相容性即輸入時的“唯一性”來說,無疑是一個很大的貢獻;
b.諧調(diào)性大為改善將原來由右手食指(共控制6個鍵)本來就偏重的靜態(tài)負荷0.26%(動態(tài)負荷0.2%)到右手無名指控制的44(O)鍵上來,使44(O)鍵原來太輕的動態(tài)負荷從1.33%明顯上升到1.69%,這樣就會明顯改善右手的諧調(diào)性,必將減輕操作員的疲勞程度而提高輸入效率。
由此可見,移動構(gòu)字能力強、實用頻度高的部件,以實現(xiàn)規(guī)范化、科學(xué)化的要求,與移動構(gòu)字能力弱、實用頻度低的部件是根本不同的,前者涉及到復(fù)雜的多學(xué)科的理論和分析,旨要達到“多目標”的統(tǒng)一或定量對比權(quán)衡利弊,而后者則因為牽涉到很少、很不常用的字,對重碼和諧調(diào)性的影響均無足輕重。
當然,依據(jù)“形碼設(shè)計三原理”的以上設(shè)計,僅僅是在GWB部件體系之基礎(chǔ)上,依據(jù)“三原理”的一組實施例。同理,依照相同的方法,還可以在本發(fā)明的基礎(chǔ)上繼續(xù)改變?nèi)舾蓚€部件的鍵位而成為另外的一些實施例。例如把“力”移到53(V)鍵上或再減少增加少量部件等。
(4)本發(fā)明通過對“形碼設(shè)計三原理”的研究和應(yīng)用,突破性地解決了部件區(qū)位分布中相容性、規(guī)律性對諧調(diào)性的制約,實現(xiàn)了鍵位負荷的重新分配,使本發(fā)明的諧調(diào)性設(shè)計達到了空前的高水平
本發(fā)明通過部件的優(yōu)選和布局以及拆分規(guī)則的確定,合理地重新分配了各個手指的擊鍵負荷,使
①上排下排的手指負荷減輕;
②同一排中,左右兩端特別是左右手小指的負荷減輕;
③使上排跨排到下排連擊以及從下排跨排到上排連擊的負荷減輕。
依據(jù)本發(fā)明的鍵盤及編碼體系和《漢字頻度表》,可以計算出本發(fā)明各鍵的擊鍵靜態(tài)負荷,與原方案和鄭碼可作以下對比
表中,原方案指當前流行的五筆字型四版。鄭碼的碼本,來源于北京中易電子公司1993年2月印制的“鄭碼”《標準型使用手冊》中的“鄭碼”碼本,用同一軟件計算得來。
由以上對比數(shù)據(jù)可以明顯地看出本發(fā)明在鍵位負荷方面的優(yōu)越性和突出進步。表中的三個方案中
①本發(fā)明的中排負荷最高,即手指導(dǎo)鍵(原始位置)的負荷高,平均手指行程最短,便于擊鍵,能夠提高效率;
②本發(fā)明的下排鍵負荷最低,使手指彎曲縮回擊鍵的負荷減輕,能夠提高效率;
③本發(fā)明上排負荷略高于其它兩個方案,是由于從下排移入了一部分負荷,向上排伸指擊鍵比下排縮指擊鍵效率更高。
為了定量地考慮部件組字頻度與鍵位負荷的關(guān)系達到科學(xué)設(shè)計的目的,本發(fā)明計算出了各部件的動態(tài)和靜態(tài)負荷(圖14)。
5.GWB部件體系在鍵位上的布局,可以有以下三種方式
(1)簡體方式鍵位圖上只列出簡體部件,此時,本發(fā)明適用于輸入簡體字、詞的情況;
(2)繁體方式當某個部件有簡體、繁體兩種形式時,只列出其中繁體形式的鍵位圖,則只適用于處理繁體字、詞的情況;
(3)簡繁并行方式全部部件的簡體、繁體都列在鍵位圖上的方式即為簡繁并行方式,用這種方式可同時輸入簡體字和繁體字。
當用以上(1)時,通過軟件可以把輸入的文本由簡體轉(zhuǎn)換成繁體;當用以上(2)時,通過軟件可以把輸入的文本由繁體轉(zhuǎn)換成簡體;
以上功能即謂“簡繁并行、兼容互換”。
6.本發(fā)明將部件總表中的所有部件分為筆形、鍵名、部件、雙碼部件四大類(圖15)
例如42(U)鍵的情況
這一分類是為了達到易學(xué)之目的而設(shè)計的。
7.本發(fā)明同一區(qū)位(鍵位)上的部件,以主部件為開頭分組排列(圖16)
本發(fā)明從每一鍵位上的筆形、鍵名、部件之中,各選出若干個典型代表作為主部件,這些主部件,連同與之同源、形似或便于聯(lián)想記憶的部件,以鍵位為單位,各自排列成為一個由主部件打頭的序列。在列表或在鍵盤上表示時,主部件的字號可大于“同位部件”、“同位件”。這一方法可以大大地減少記憶量,縮短學(xué)習(xí)周期。
例如15(A)鍵上的字根的情況是
而33(E)鍵的情況是
8.本發(fā)明可以形成簡繁通用的“GWB”漢字排序法、漢字檢索法及其檢索裝置。
依據(jù)本發(fā)明,當對漢字進行編碼之后,便可以依漢字的“GWB”編碼對任何漢字集建立字庫、語料庫或文件庫,并按本發(fā)明的編碼法進行排序檢索。這種檢索,既可以按部首或部件的區(qū)位碼(11~55)進行,也可以按部件在英文標準鍵盤上對應(yīng)的25個字母(A~Y)。由此,便必然可以由本發(fā)明產(chǎn)生出一種實用化的漢字字典、字庫、文獻的“GWB”排序法和查字法、檢索法。當本發(fā)明納入中小學(xué)教育之后,“GWB”檢索法將會獲得廣泛應(yīng)用。由于“GWB”是完全依形編碼,所以“GWB”排序法、檢索法可以通用于簡體字和繁體字。
將此排序法、檢索法通過軟件用于具有輸入鍵盤、字庫、顯示屏的系統(tǒng)上,該系統(tǒng)即成為GWB檢索裝置,可廣泛地應(yīng)用于圖書、檔案、信息檢索之中(圖15),其步驟是
(1)、在GWB編碼體系的鍵位上敲擊部件所對應(yīng)的鍵位之后,鍵盤即輸出部件所對應(yīng)的編碼或代碼,其中“雙碼部件”所在的鍵位,在敲擊相應(yīng)的“雙碼部件”之后即輸出相應(yīng)“雙碼部件”所對應(yīng)的編碼或代碼,該對應(yīng)的編碼或代碼,通過軟件被傳輸?shù)较鄳?yīng)的字庫、詞語庫中進行檢索;
(2)、GWB具有傳統(tǒng)部首、同源部件、形似部件、變形部件及“雙碼部件”的輸入鍵盤具有簡繁漢字互換的功能,該互換功能對應(yīng)于相應(yīng)的簡繁漢字的字庫,進行相應(yīng)的簡繁漢字的單字檢索;
(3)、GWB鍵盤的區(qū)位碼相對應(yīng)設(shè)定有與傳統(tǒng)部首、同源部件、形似部件、變形部件及“雙碼部件”相關(guān)聯(lián)的字庫、詞語庫,該字庫、詞語庫與上述鍵盤的部件的區(qū)位碼相對應(yīng),檢索包含有上述部件的單字和詞語;
(4)、GWB鍵盤的區(qū)位碼和相應(yīng)的字、詞庫的指令相對應(yīng),顯示根據(jù)鍵盤部件的區(qū)位碼所對應(yīng)的包含有上述傳統(tǒng)部首、同源部件、形似部件、變形部件及雙碼部件的字、詞的顯示屏;
9.本發(fā)明將顯示器、主機、漢字資料庫、打印機聯(lián)結(jié)成硬件系統(tǒng),利用在不少于25個鍵位的以5區(qū)各5位共25個鍵位分配漢字部件構(gòu)成五筆字型鍵位分布的鍵盤,或利用類似窗口式顯示,可以方便地進行漢字資料檢索的系統(tǒng),其步驟是
(1)、在5區(qū)5位共25個鍵位上,以11,12,……54,55作為每一組部件的區(qū)位碼,以傳統(tǒng)部首、同源部件、形似部件、變形部件以及“雙碼部件”形成與鍵位一一對應(yīng)的部件體系;
(2)、以上述部件體系,將漢字以“根序優(yōu)先,筆順規(guī)范,盡量取大,兼顧直觀”的拆分方法拆分為部件序列,取其最多第一、第二、第三及前后一個部件作為輸入編碼部件,以該部件所在的區(qū)位或其代碼作為其輸入代碼,不足4碼的補加識別碼而形成的檢索輸入方法;
(3)、以上述檢索編碼體系,通過軟件,自動地對任何漢字資料進行單字或詞語排序,并利用該檢索編碼部件體系和檢索編碼輸入方法對任何漢字資料進行檢索;
(4)、通過鍵盤、顯示器、打印機對上述檢索結(jié)果進行編輯、顯示與輸出;
以此構(gòu)成可用于圖書、檔案、信息處理的漢字排序及其漢字檢索系統(tǒng)。
10.本發(fā)明所附的“五筆畫輸入鍵盤”在筆畫分類上,將折筆“乙”明細在鍵位或附表上
11.本發(fā)明按漢字的實用頻度顯示重碼 當輸入某一漢字遇到重碼字時,該字和與之重碼的字按其實用頻度從左至右顯示在屏幕的提示行中,最常用的字顯示在最左端,當需要這個字時,只要輸入文件中該字后邊的字,該字即可自動顯示到編輯位置上去。當需要的字在第2、第3等位置上時,可用鍵盤上方的數(shù)字鍵挑選。
12.本發(fā)明智能處理重碼當輸入某一漢字遇到重碼時,可視為沒有重碼,而利用機內(nèi)已裝入的詞庫及智能處理軟件自動地判別下文輸入的字與重碼字之間的搭配關(guān)系,自動將重碼字當中能與下文構(gòu)詞的那個字確定下來或補正過來。
13.本發(fā)明的輸入裝置可以是一個專門制造的中文鍵盤,也可以直接沿用一個標準的英文鍵盤,當是一個專門制造的中文鍵盤時,既可以是一個大鍵盤、中鍵盤之內(nèi)包含有25個鍵的一個區(qū)域(圖16),也可以是一個5排、每排5個鍵位的超小型鍵盤(圖17)。
14.本發(fā)明通過對簡繁漢字進行編碼,編寫輸入軟件模塊,使用鍵盤向電腦或其它通訊設(shè)備輸入漢字信息,通過軟件和系統(tǒng)從字庫中檢索出所要輸入的字或詞,并將字或詞顯示在屏幕上或直接打印出來,以此形成一套漢字信息處理系統(tǒng),該系統(tǒng)包括輸入鍵盤、輸入軟件、操作系統(tǒng)、字庫、詞庫、主機、顯示器、打印機、終端及工作站等(圖18)。
15.本發(fā)明由輸入編碼為主要內(nèi)容的輸入模塊,可以適用于并移植到各種電腦及信息處理系統(tǒng)上去。
16.本發(fā)明的部件集合、部件體系、編碼體系、輸入鍵盤、信息處理系統(tǒng)、還可以處理CJK10646大字符集或更大集合的漢字及其詞語。
17.本發(fā)明較之現(xiàn)行五筆字型的顯著優(yōu)點和實質(zhì)性進步在于
本發(fā)明取消了不符合漢字規(guī)范的“自造”字根,增加符合漢字規(guī)范的傳統(tǒng)部首作為部件,設(shè)計符合漢字規(guī)范的雙碼部件,設(shè)計同源、形似部件,設(shè)計繁體部件,明確折筆形態(tài),改變鍵名,與原方案相比,有以下優(yōu)點和積極效果
①.部件(字根)體系符合漢字規(guī)范與原方案相比明顯不同且具有顯著優(yōu)點
本發(fā)明與現(xiàn)行技術(shù)相比,取得了實質(zhì)性進步,僅從改變拆分和編碼的字數(shù)便可以從下表看出
本發(fā)明與原方案拆分編碼異同比較表
②.編碼體系符合漢字規(guī)范,比原方案有質(zhì)的進步和突破。
③.部件分區(qū)劃位的規(guī)律性有明顯提高,部件的平均“規(guī)律度”從原方案的7.26提高到本發(fā)明的7.42。
④.部件的相容性有實質(zhì)性進步。
作為漢字編碼學(xué)術(shù)界的常識,人們知道,在鍵數(shù)一定的前提下,部件拆得越“碎”,越不易產(chǎn)生重碼;反過來,部件越“大”,越是容易引起重碼。而本發(fā)明在對現(xiàn)行方案作如此大幅度改進、增加了20多個符合漢字教學(xué)規(guī)范的傳統(tǒng)部首作為部件,在規(guī)范化方面取得了如此實質(zhì)性創(chuàng)新的情況下,總的重碼不但沒有增加,反而有明顯降低了19對,這是不經(jīng)過長期認真研究反復(fù)探討就不可能達到的一個新水平、新高度。
⑤.部件分區(qū)劃位及鍵位設(shè)計符合人機工程學(xué)原理,輸入擊鍵的諧調(diào)性有重大進步,可以減輕錄入人員的疲勞、減少差錯、提高輸入效率。本發(fā)明與原方案各鍵位動態(tài)負荷對比如下,表中各鍵上邊一排數(shù)據(jù)為原方案的,下邊一排為本發(fā)明的
本發(fā)明與原方案各鍵位動態(tài)負荷對比表(%)
從以上對比可以看出,最“無能”的左手小手指控制的35(Q)、15(A)的負荷明顯下降;原方案中負荷太輕的44(0)鍵和32(R)鍵的負荷則明顯上升,本發(fā)明無論是靜態(tài)負荷分布還是動態(tài)負荷分布,都明顯地優(yōu)于原方案。鑒于到目前為止國內(nèi)還沒有報道過為設(shè)計輸入技術(shù)量化計算鍵位負荷的實例,還沒有計算部件負荷與鍵位負荷的先例,所以可以說,在實現(xiàn)手指擊鍵的諧調(diào)性方面,本發(fā)明取得了空前的進步。
⑥.鍵盤設(shè)計符合漢字規(guī)范和人機工程學(xué)原理,便于在中小學(xué)中普及應(yīng)用。
本發(fā)明是在國內(nèi)外中文電腦信息處理技術(shù)迅速發(fā)展、廣泛應(yīng)用、迅速進入教學(xué)、進入家庭的情況下應(yīng)運而生的。在當前“五筆字型”已在中文輸入技術(shù)中占據(jù)主導(dǎo)地位的情況下,本發(fā)明及時而有效地克服了“五筆字型”在規(guī)范化、科學(xué)化、實用化等方面明顯存在的問題,使本發(fā)明能夠在科學(xué)性、創(chuàng)造性、規(guī)范化、實用化等方面比現(xiàn)行方案有一個突破性發(fā)展。
本發(fā)明是一個系統(tǒng)工程,對于包括主機、顯示器、輸入鍵盤、打印機、字庫、詞庫及軟件等在內(nèi)的系統(tǒng)進行了全新的創(chuàng)造符合教育規(guī)范的含有雙碼部件的部件體系、雙碼編碼體系、雙碼鍵位鍵盤的創(chuàng)立,以及與雙碼編碼體系之編碼相對應(yīng)的字、詞庫的設(shè)置和相應(yīng)系統(tǒng)的確立,保證了本發(fā)明得以順利實施,并如愿以償?shù)剡_到了所預(yù)期之目的——使五筆字型技術(shù)走向規(guī)范化、科學(xué)化和更加實用化,有更高的效率,有更為廣闊的應(yīng)用領(lǐng)域乃至在中小學(xué)校中普及。這些都是十年來發(fā)明人創(chuàng)造性勞動的成果。這一成果使得本發(fā)明與現(xiàn)行五筆字型技術(shù)即原方案相比,有著質(zhì)的飛躍,使本發(fā)明成為可以在國內(nèi)外直接進入中小學(xué)教育系統(tǒng),實現(xiàn)規(guī)范化的漢字教學(xué)與規(guī)范化的漢字輸入教學(xué)密切地結(jié)合起來,加上本發(fā)明對CJK10646大字符集的先進有效的處理,本發(fā)明必將成為在世界范圍內(nèi)簡繁通用、簡繁互用、字詞共融的一項為弘揚中華文化做出重大貢獻、有巨大社會意義的嶄新技術(shù)。
權(quán)利要求
1、在不少于25個鍵的鍵位上以5區(qū)各5位分配部件和輸入碼的鍵盤布局,并依據(jù)最多取“一、三、三、末”部件編碼輸入漢字的一種教育規(guī)范五筆字型電腦漢字輸入方法,其特征在于
(1)按照漢字規(guī)范教學(xué)以及字源分析、字素分析、綜合運用、習(xí)慣約定、系統(tǒng)規(guī)定等優(yōu)選、確定部件的原則,形成了一個符合漢字規(guī)范、符合教學(xué)規(guī)范、簡繁并行、兼容互換的規(guī)范化五筆字型編碼部件的集合。該編碼部件的集合在于新增符合漢字規(guī)范的整字或傳統(tǒng)部首作為部件
_、戊、豸、隹、氏、母、氣、爿、不、耒、酉、革、皮、舟、牜、飠、犭、魚、羊
、_)、礻、衤、艮(
);
(2)在上述讀編碼部件的集合中,將符合漢字規(guī)范的部分傳統(tǒng)部首設(shè)計為“雙碼部件”,即將若干個傳統(tǒng)部首的編碼依其筆畫特征和其編碼在整個編碼空間中分布的合理性設(shè)計為2個碼,以此形成符合漢字規(guī)范的“雙碼部件”
不、耒、酉、革、皮、舟、牜、飠、犭、魚、羊
、_)、礻、衤、艮(
);
(3)在上述部件集合中增加與主部件同源的、形似的、變形的或便于聯(lián)想記憶的同位部件
覀、
廾、日、
月、
用、冖、
_、
氺、
爿、_、
匕、七
以此形成了符合漢字規(guī)范的部件集合;
(4)依據(jù)部件分組劃位時的相容性,并以首筆與區(qū)號一致、次筆與位號一致的規(guī)律性、各區(qū)位的負荷分配與手指擊鍵的諧調(diào)性三者實現(xiàn)多目標的統(tǒng)一為依據(jù),將上述部件及其它部件的集合劃分為5個區(qū),每個區(qū)5個位,分別以11,12,13,……54,55作為每一組部件的區(qū)位碼,以此形成的一個符合漢字規(guī)范并與鍵位一一對應(yīng)的、可以對簡體與繁體漢字以及CJKl0646大字符集進行拆分編碼的部件體系
GWB部件體系在鍵位上的布局
(5)按照“根序優(yōu)先、筆順規(guī)范、盡量取大、兼顧直觀”取一、二、三、末最多四個部件、不足四碼補加識別碼的方法形成漢字拆分編碼的總則;
利用上述包括傳統(tǒng)部首、雙碼部件、同源部件、形似部件、變形部件及其它部件的鍵位輸入碼的編碼輸入步驟為
A單字輸入
①本身是部件的單字
a、單筆畫單筆碼+單筆碼+定義碼+定義碼(或加一個定義碼)
b、鍵名字將所在鍵連擊4下,或按單碼成字者輸入或拆作2-4個單筆畫輸入
c、單碼部件成字者區(qū)位碼+首筆單筆+次筆單筆+末筆單筆
不足4碼時,補空格鍵作為輸入結(jié)束標記
或拆成2-4個單筆畫
d、雙碼成字者有5種可分別使用或同時使用其中幾種的編碼輸入方式
i)直接以雙碼部件的2個碼作為輸入碼;
ii)第一碼+第二碼+首筆單筆+末筆單筆;
iii)第一碼+首筆單筆+次筆單筆+末筆單筆;
iv)在雙碼部件的2個碼的前邊加前綴碼或后邊加后綴碼,或前后同時加前綴和后綴碼形成輸入碼輸入;
v)拆成不超過4個的單筆畫輸入,不足4個時,補加空格鍵輸入;
②非部件單字
一律依照“根序優(yōu)先,筆順規(guī)范,盡量取大,兼顧直觀”的拆分總則,將其拆分成為單碼部件或雙碼部件的序列之后
a、不含雙碼部件時
5個部件以上時,取一、二、三、末部件編碼輸入
4個部件時,取其全部部件依次編碼輸入
2~3個部件時,依次取其全部部件之后,補加“末筆字型識別碼”,仍不足4碼,打空格鍵作為輸入結(jié)束標記;
b、含有雙碼部件時,上述符合漢字規(guī)范的雙碼部件參加拆分和編碼輸入時,按以下步驟進行
①取一、二、三、末部件即依部件拆分規(guī)則,以部件為單位將漢字拆分為“部件序列”,再從該“部件序列”中最多取一、二、三、末四個部件作為“編碼部件”;
②將步驟①中被取中的“編碼部件”所對應(yīng)的區(qū)位碼或英文字母依次列出,成為一個“原碼序列”,其中如有雙碼部件時,雙碼部件的2個碼都要列入;
③依以下三種情況從“原碼序列”中取最多“一、二、三、末”四個碼作為該漢字的正確編碼即輸入碼;
三種情況的取碼規(guī)則如下例所示其中以ABCD作為“一、二、三、末”部件的單一碼或第一碼,以WXYZ作為“編碼部件”之中雙碼部件的第二碼;當“原碼序列”不足4個碼時,還應(yīng)如現(xiàn)行五筆字型技術(shù)那樣補加“末筆字型識別碼”;
a、“編碼部件”為2時
b、“編碼部件”為3時
c、“編碼部件”為4時
輸入碼2是將4個“編碼部件”各取第一碼,即無論其中雙碼部件有幾個,一律取ABCD;
B.詞語輸入
無論組成詞匯的單字結(jié)構(gòu)中是否含有雙碼部件,其詞語的編碼輸入方法都一樣,即都以其單字的全碼作為取碼的基礎(chǔ),其中
①兩字詞
每字各取其單字全碼的前兩個碼共4碼輸入
②三字詞
前2字各取其單字全碼的第一個碼、最后一個字取其單字全碼的前兩個碼共計4碼輸入
③四字詞
每字取其單字全碼的第一個碼共計4碼輸入
④多字詞
取第一、第二、第三及最后一個字單字全碼的第一個碼共計4碼輸入;
含有雙碼部件的詞語的編碼輸入法與不合雙碼部件的詞語的編碼榆入法相同,其步驟是以單字的全碼為基礎(chǔ),分2字詞、3字詞、4字詞與多字詞分別按以上要求取碼并輸入;
以此形成的含有傳統(tǒng)部首、雙碼部件、同源部件、形似部件、變形部件的部件集合、編碼體系和輸入法;
2、根據(jù)權(quán)利要求1的雙碼字、詞編碼輸入方法,其特征在于,雙碼部件的編碼輸入也可以拆分為可能含有非規(guī)范部件的兩部分后,分別編碼并輸入,此時,拆分中可能出現(xiàn)的非規(guī)范部件就相當于處在雙碼部件第二個碼所指的鍵位上,或其它依據(jù)編碼在編碼空間中分布的合理性、相容性而依形人為地指定的鍵位上,即
不43——一
(11 43) 魚 11——
一 (35 11)
——_ 卜 (13 21) 魚 44——
灬 (35 44)
耒43——三
(13 43) 羊 13—— 丷 _ (42 13)
酉11——西 一 (14 11)
13—— 丷 _ (42 13)
革12—— 廿
(15 12) _ 13—— 丷 王 (42 11)
皮54——_ 又 (21 54) 礻 41—— _ 丶 (45 41)
舟41——丿
(31 33) 衤 42——
(45 42)
丿、 丶 (31 41) 艮 33——彐
(53 33)
飠33——人
(34 54)
54——彐
(53 54)
犭31——
丿 (35 31)
以此形成從“不完全規(guī)范”過渡到“完全規(guī)范”的過渡性部件集合及其編碼體系;
3、一種教育規(guī)范五筆字型電腦漢字輸入鍵盤,其特征在于
在5區(qū)各5位的25個鍵位上設(shè)定有全新的編碼部件,其中
(1)在以下鍵位上新增了符合漢字規(guī)范的整字或傳統(tǒng)部首作為編碼輸入部件
13.D—戊 21.H——_ 32.R——氣 33.E——豸
34.W——隹 35.Q——氏 42U——爿 55.X—母
(2)在以下鍵位上設(shè)計了符合漢字規(guī)范的“雙碼部件”
11.G——不 13.D——耒 14.S——酉
15.A——革 21.H——皮 31.T——舟、牜
34.W——飠 35.Q——犭、魚、魚
42.U——羊、
_ 45.P——礻、衤 53.V——艮、
(3)在以下鍵位上設(shè)計了同源部件、形似部件、變形部件
12.F——
13.D——
14.S——覀
15.A——
廾 21.H——
22.J——日
24.L——
25.M——
33.E——
月
用
35.Q——_
42.U——爿 43.I——
_
氺
44.O——
51.N——
ユ53.V——_
55.X——
匕七
(4)在以下鍵位上新設(shè)計了原方案中的部件
32.R——幾乂
44.O——廣
(5)55(X)鍵的鍵名設(shè)定為“幺”,51(N)鍵的鍵名設(shè)定為“己”;
(6)51.N鍵上的折筆“乙”同時代表
以此構(gòu)成既可以輸入漢字的簡體字、詞,也可以輸入繁體字、詞,并適用于處理CJK10646大字符集漢字的符合漢字規(guī)范的輸入鍵盤;
4、包括顯示器、主機、字庫、詞語庫、打印機,并利用在不少于25個鍵位的以5區(qū)5位共25個鍵位分配漢字部件構(gòu)成五筆字型鍵位布局的鍵盤,依據(jù)最多輸入第一、第二、第三及最末一個部件或其編碼完成單體與繁體漢字的單字和詞語輸入的一種教育規(guī)范五筆字型電腦漢字輸入系統(tǒng),其特征在于
(1)在5區(qū)各5位共25個鍵位的鍵盤的以下區(qū)位即鍵位上
a、增加符合漢字規(guī)范的傳統(tǒng)部首作為整字部件,設(shè)計在如下區(qū)位上
_——21,戊——13,豸——33,隹——34,氏——33,
母——55,氣——32,爿——42
b、在5區(qū)5位共25個鍵位的鍵盤的以下區(qū)位即鍵位上將同源部件、形似部件、變形部件歸并于主部件所在的區(qū)位上
——12
——13
覀——14
——21
廾 ——15 日
——22
——24
——25
月
用 ——33 _
——35
_
氺——43
——44
爿——42 _
——53
ユ ——51
匕七 ——55
c、將構(gòu)字頻度和實用頻度都相當高的常用部件“幾”、“乂”、“廣”依其在鍵盤上的相容性、規(guī)律性、諧調(diào)性三者的多目標統(tǒng)一設(shè)計在以下鍵位上
幾——32(R) 乂——32(R) 廣——44(O)
d、將“幺”定為55.Q的鍵名,“己”定為51.N的鍵名
e、將折筆“乙”代表如下筆形
f、在5區(qū)各5位共25個鍵的鍵盤的以下區(qū)位即鍵位上將符合漢字規(guī)范的“雙碼部件”設(shè)計在相應(yīng)的區(qū)位上
在以上輸入編碼體系的鍵位上敲擊部件所對應(yīng)的鍵位之后,鍵盤即輸出部件所對應(yīng)的編碼或代碼,其中“雙碼部件”所在的鍵位,在敲擊相應(yīng)的“雙碼部件”之后即輸出相應(yīng)“雙碼部件”所對應(yīng)的編碼或代碼,該對應(yīng)的編碼或代碼,通過軟件被傳輸?shù)较鄳?yīng)的字庫、詞語庫中進行檢索;
(2)上述具有傳統(tǒng)部首、同源部件、形似部件、變形部件及“雙碼部件”的輸入鍵盤具有簡繁漢字互換的功能,該互換功能對應(yīng)于相應(yīng)的簡繁漢字的字庫,進行相應(yīng)的簡繁漢字的單字檢索;
(3)與上述鍵盤的區(qū)位碼相對應(yīng)設(shè)定有與傳統(tǒng)部首、同源部件、形似部件、變形部件及“雙碼部件”相關(guān)聯(lián)的字庫、詞語庫,該字庫、詞語庫與上述鍵盤的部件的區(qū)位碼相對應(yīng),檢索包含有上述部件的單字和詞語;
(4)與上述鍵盤的區(qū)位碼和相應(yīng)的字、詞庫的指令相對應(yīng),顯示根據(jù)鍵盤部件的區(qū)位碼所對應(yīng)的包含有上述傳統(tǒng)部首、同源部件、形似部件、變形部件及雙碼部件的字、詞的顯示屏;
5、一種包括顯示器、主機、漢字資料庫、打印機、并利用在不少于25個鍵位的以5區(qū)各5位共25個鍵位分配漢字部件構(gòu)成五筆字型鍵位分布的鍵盤或利用類似顯示窗口進行漢字資料檢索的系統(tǒng),其特征是
(1)在5區(qū)5位共25個鍵位上,以11,12,……54,55作為每一組部件的區(qū)位碼,以傳統(tǒng)部首、同源部件、形似部件、變形部件以及“雙碼部件”形成與鍵位一一對應(yīng)的部件體系
GWB部件體系在鍵位上的布局
(2)以上述部件體系,將漢字以“根序優(yōu)先,筆順規(guī)范,盡量取大,兼顧直觀”的拆分方法拆分為部件序列,取其最多第一、第二、第三及前后一個部件作為輸入編碼部件,以該部件所在的區(qū)位或其代碼作為其輸入代碼,不足4碼的補加識別碼而形成的檢索輸入方法;
(3)以上述檢索編碼體系,通過軟件,自動地對任何漢字資料進行單字或詞語排序,并利用該檢索編碼部件體系和檢索編碼輸入方法對任何漢字資料進行檢索;
(4)通過鍵盤、顯示器、打印機對上述檢索結(jié)果進行編輯、顯示與輸出;
以此構(gòu)成可用于圖書、檔案、信息處理的漢字排序及其漢字檢索系統(tǒng)。
全文摘要
教育規(guī)范五筆字型漢字輸入法及其裝置,系現(xiàn)行五筆字型的發(fā)明人王永民教授又經(jīng)十年研究,按照漢字教學(xué)規(guī)范的要求,運用人機工程學(xué)原理,采用字源分析、字素歸納、習(xí)慣約定、系統(tǒng)規(guī)定等方法,大量選用傳統(tǒng)部首,創(chuàng)造雙碼部件,完全取消自造字根,以此形成一整套全新的部件體系、拆分總則、編碼體系和全新的鍵盤設(shè)計,從根本上克服了原發(fā)明的嚴重缺陷,使本發(fā)明在科學(xué)性、實用性、規(guī)范化方面,創(chuàng)造性地全面突破并發(fā)展了現(xiàn)有技術(shù)。
文檔編號G06F3/023GK1154502SQ9510593
公開日1997年7月16日 申請日期1995年6月9日 優(yōu)先權(quán)日1995年6月9日
發(fā)明者王永民 申請人:王永民