專利名稱:雙分輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,也就是中文輸入法。它將漢 字分為獨(dú)體字和合體字,將合體字按整體結(jié)構(gòu)一分為二,并且將漢字 部件根據(jù)起筆以每二列排列在字母鍵上,進(jìn)行編碼,輸入漢字,因此 稱為雙分輸入法。
背景技術(shù):
鍵盤輸入是目前漢字輸入法中使用最廣泛的輸入法。 分為音 碼、形碼、音形碼和三類輸入漢字。利用音碼輸入漢字,因為簡單易 學(xué),使用最為廣泛??奢斎胨俣炔豢欤€有個弱點(diǎn),那就是不認(rèn)識的 漢字無法輸入。為此,本人發(fā)明了三五音碼輸入法,已獲發(fā)明專利, 它屬于音形碼,比音碼稍微復(fù)雜,但因為重碼少,輸入速度卻極為迅 速,足以與任何輸入法相比,缺點(diǎn)是發(fā)音不準(zhǔn)的漢字不能很快輸入。 形碼雖然復(fù)雜難記,卻能輸入任何不認(rèn)識的漢字,而且往往很快。形 碼常將漢字部件按象形、拼音和筆畫等方式歸類編碼,由于筆畫是有 史以來最偉大的發(fā)明之一,因此按筆畫歸類的輸入法要勝過按拼音和 象形歸類的輸入法,往往較為流行。五筆字型是形碼的典型代表,優(yōu)
點(diǎn)是重碼少,輸入速度快,但該輸入法僅僅利用25個字母鍵輸入漢 字,還無視各漢字部件的組字頻率高低不一,硬將漢字部件按起筆分 為五區(qū)五位,給組字頻率相當(dāng)?shù)偷恼坶_頭的漢字部件也分了五個位, 而組字頻率相當(dāng)高的起筆為橫、豎、點(diǎn)的漢字部件也只分得了五區(qū),
此舉浪費(fèi)了個把鍵位,又會造成一定的重碼。為降低重碼,五筆字型 不得不將起筆為橫的漢字部件中的t并入到撇區(qū)中,將起筆為點(diǎn)的個 和心插入到折區(qū)中,這完全是不能接受的,因為t 、十和心的實(shí)際組 字頻率已遠(yuǎn)遠(yuǎn)高于排在同一鍵上的其它部件的組字頻率之和,使得排 ^ 、十和心的鍵實(shí)際上應(yīng)算作橫區(qū)和點(diǎn)區(qū),可五筆字型硬把它歸入到 撇區(qū)和折區(qū)。"車、九、幾"等漢字部件的歸類也不符合按區(qū)劃分的 規(guī)律。五筆字型將每區(qū)又按第二筆分為橫、豎、撇、捺、折五位更是 有點(diǎn)牽強(qiáng),以豎區(qū)為例,第二筆通常是折,按理應(yīng)集中安排在豎折這 個區(qū)位鍵上,這會帶來嚴(yán)重的重碼,因此不得不分散排列在各個鍵上。
25個鍵名部件中竟有10來個部件不符合所謂的區(qū)位排列規(guī)律,這樣 的規(guī)律實(shí)際上已不能算規(guī)律。還有,五筆字型只用了25個鍵,白白 浪費(fèi)一個字母鍵,若能充分利用26個鍵的話,貝lj一、 二、三級簡碼 會更多,輸入速度也會有所提高,也就是說應(yīng)該還有比五筆字型更快 的漢字輸入法。另外86版五筆字型還存在著若干漢字部件不符合語 言文字規(guī)范、數(shù)量過多、拆分不便等問題。鄭碼對此有所改進(jìn),充分 利用了26鍵,部件符合規(guī)范,按起筆分區(qū)時考慮了漢字的組字頻率, 較為合理,可也存在著橫區(qū)多了點(diǎn)、豎區(qū)少了點(diǎn),在鍵盤上排列不夠 有序的缺點(diǎn),更糟糕的是它將漢字分為主根、副根,除了第一主根外, 其它第二主根、包根、雜根等漢字部件均用兩個字母作為代號編碼, 盡管這有利于降低重碼,可取碼規(guī)則相當(dāng)繁雜,另外選取的漢字部件 也較多,難學(xué)難記。為減少漢字部件,目前不少輸入法都通過五種基 本筆畫兩兩組合的辦法,進(jìn)行編碼。這種方法實(shí)際上是受五筆字型的
影響,同樣沒有充分考慮到漢字筆畫特別是雙筆畫的組字頻率相差懸 殊的情況,排列到鍵盤上后同樣表面顯得整齊劃一,實(shí)際上各字母鍵 冷熱不均,容易產(chǎn)生重碼,另外還存在著不夠直觀,影響打字速度等
問題。為此,本人發(fā)明了26鍵輸入法,它只用了 100來個漢字部件, 部件選取合理,分區(qū)規(guī)范,拆分容易直觀,輸入漢字快速等優(yōu)點(diǎn)。但 用了 100來個漢字部件似乎還是有點(diǎn)多了,有點(diǎn)難記。
發(fā)明內(nèi)容
這樣,目前形碼輸入法要么漢字部件過多或不規(guī)范、分區(qū)不合理, 要么拆分困難,不夠直觀、影響思維,要么沒能充分利用26個鍵, 都沒能做到簡便快速地輸入漢字。
本發(fā)明的目的是提供一種漢字部件比較規(guī)范、分區(qū)合理,拆分簡 便直觀的,輸入漢字簡便快速的計算機(jī)漢字輸入法即雙分輸入法。
為了達(dá)到雙分輸入法的目的,本發(fā)明在將漢字各種筆畫按國家語 委的規(guī)定歸類為橫、豎、撇、點(diǎn)、折后,又從《信息處理用GB13000.1 字符集漢字部件規(guī)范》精選了 70來個組字頻率高的漢字部件,這些 精選的漢字部件還可包含若干個組字頻率并不高,但同源或同形的同 類的漢字部件,通稱為基本部件。將它們按起筆歸類到橫、豎、撇、 點(diǎn)、折五個區(qū)中。再根據(jù)每個區(qū)中漢字部件的組字頻率的高低來決定 每個區(qū)所包含的鍵位多少,經(jīng)科學(xué)測算,起筆為橫、點(diǎn)、豎的漢字部 件組字頻率較高、數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率 次之,分得五個鍵位,折起筆的漢字部件頻率最低,僅安排三個鍵位。 各個漢字部件在字母鍵上的分布見附圖1,該圖在標(biāo)準(zhǔn)鍵盤上以二列
為一區(qū),將點(diǎn)區(qū)、橫區(qū)、豎區(qū)、撇區(qū)、折區(qū)從左到右依次以兩列為界 排列,極具規(guī)律性,是本人十余年潛心研究的結(jié)果,是本發(fā)明的最大
創(chuàng)造性所在,也是借鑒本人發(fā)明的26鍵輸入法的結(jié)果。根據(jù)以兩列 為界將漢字部件按起筆分區(qū)排列的方法,點(diǎn)區(qū)占兩列字母鍵,得六個 字母鍵;橫區(qū)占兩列字母鍵,得六個字母鍵,豎區(qū)占兩列字母鍵,得 六個字母鍵,撇區(qū)雖占五個字母鍵,卻也只得兩列,折區(qū)僅占三個字 母鍵,卻也得兩列,從而達(dá)到了點(diǎn)、橫、豎、撇、折各區(qū)組字頻率不 同,所占的字母鍵數(shù)也因而不同,卻都占兩列的巧妙目的。比將漢字 部件五區(qū)五列排列的輸入法來,無疑更有規(guī)律,更符合指法練習(xí),是 一種巨大進(jìn)步。當(dāng)然由于豎區(qū)和撇區(qū)漢字部件的組字頻率相近,也可 規(guī)定作豎區(qū)占五個字母鍵位,撇區(qū)占六個字母鍵位。另外還將點(diǎn)區(qū)、 橫區(qū)、豎區(qū)在鍵盤上的位置互換。這些都是對本發(fā)明的變形,還是以 本發(fā)明所舉的實(shí)施列為最佳。另外本發(fā)明將點(diǎn)、橫、豎、撇、折五種 基本筆畫分別排在Q、 E、 T、 U、 O鍵上,用相應(yīng)的字母編碼,由于 都位于上排,且僅隔一個字母鍵,也顯得極有規(guī)律,簡單易學(xué)。
另外本發(fā)明采用了將合體字一分為二的技術(shù),并規(guī)定首部可取頭 尾兩碼,使得大量的偏旁部首,特別是筆畫過多或過少且不很常用的 偏旁無須再排在鍵上,從而使部件的數(shù)量大為減少。這也是本發(fā)明簡 單易學(xué)的原因。
接著又將漢字分為兩類 一類是獨(dú)體字, 一類是合體字。獨(dú)體字 又分兩類 一類是本身就是基本部件的漢字,它排列在字母鍵上,稱 為鍵內(nèi)獨(dú)體字,編碼規(guī)則是成字基本部件的代碼+首筆畫代碼+次筆
畫代碼+末筆畫代碼。另一類是多個基本部件組合而成的漢字,它不 出現(xiàn)在鍵上,稱為鍵外獨(dú)體字,編碼規(guī)則是按書寫順序拆分成基本部 件進(jìn)行編碼。
由合體字的編碼時,要按書寫順序?qū)⒃摑h字按整體結(jié)構(gòu)一分為 二,拆分成二個部分,先寫的部分稱為第一部分,簡稱首部,后寫的 部分稱為第二部分,簡稱余部。編碼規(guī)則是首部頭尾取2碼,余部 頭尾取2碼,首部最多只能取l碼時,余部最多可取3碼。
單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的漢 字部件編碼,應(yīng)保證按書寫順序每次拆分出盡可能大的漢字部件,不 要把筆畫多的部件拆分成筆畫少的部件。根據(jù)這一規(guī)則可引申出一條 規(guī)則那就是多筆畫部件肯定比單筆畫部件即五種基本筆畫優(yōu)先編碼。 另外還要兼顧直觀,在拆分出基本部件數(shù)目相等的條件下,能按不相 交編碼就按不相交編碼,尤其需要注意的是在拆分時千萬不要將筆畫 割斷。
在拆分漢字時有個非常讓人頭疼的情況,那就是遇到幾個筆畫相 交的基本部件時如何拆分,這時往往有多種拆分方法。本人經(jīng)過長達(dá) 十余年的潛心研究,終于成功解決了這一舉世難題。為方便漢字拆分, 特別規(guī)定按書寫順序與前二筆及以上的筆畫相交的后寫筆畫必須單 獨(dú)取出,按單個筆畫編碼,基本部件例外?;静考遣豢稍俨鸱值?, 不宜將基本部件中與多個筆畫相交的后寫筆畫單獨(dú)拆出編碼。
有些漢字,它們包含的基本部件相同,只是基本部件的位置不同, 為區(qū)分這些漢字的編碼,使其不重碼,必須增加字型信息,用區(qū)分碼
加以區(qū)分。漢字的字型可分為獨(dú)體型和合體型二類,合體型約占漢字
的96%,合體型漢字不足四碼時需補(bǔ)上區(qū)分碼。合體型又可分為左右 型、上下型、包圍型,分別用","、"."、"/"表示。方法是只有二 碼的可補(bǔ)上其字型編碼,再補(bǔ)上其最末筆的編碼。有三碼的漢字,只 在三個代碼后補(bǔ)上其字型編碼。本區(qū)分碼比起五筆字型的識別碼是一 個巨大的改進(jìn),五筆字型將末筆與字型合并用一個鍵表示,給記憶帶 來了嚴(yán)重的不便,影響頭腦反應(yīng),讓許多人頭疼不已。本輸入法則將 字型與筆畫分開表示,并且只有兩碼的漢字才需要補(bǔ)上漢字的末筆,
三碼的漢字則只需補(bǔ)上字型信息,無需補(bǔ)上末筆畫,從而大大方便了 用戶操作。當(dāng)然也可用拼音首字母作區(qū)分碼,甚至不考慮漢字的字型 信息,不用區(qū)分碼參與編碼。
利用輸入法軟件,在鍵盤上敲擊某個漢字相應(yīng)的編碼所在的鍵就 可輸入該漢字。
圖1為雙分輸入法基本部件鍵盤排列圖
具體實(shí)施例方式
下面結(jié)合優(yōu)選的實(shí)施例和附圖作詳細(xì)說明。
本發(fā)明在編碼時對漢字筆畫的認(rèn)識完全科學(xué)。筆畫是構(gòu)成楷書漢 字字形的最小連筆單位,是書寫漢字時一次連續(xù)寫成的一個線條。按 國家語委的規(guī)定,在只考慮漢字的運(yùn)筆方向而不計其輕重長短時,即 只考慮其筆形時可分為橫、豎、撇、點(diǎn)、折五種基本筆畫,其中提并 入橫,豎鉤并入豎,捺并入點(diǎn),各種折筆都作折,也就是說其他各種
帶轉(zhuǎn)折的筆畫都作折。國家語委稱五種基本筆畫為橫、豎、撇、點(diǎn)、 折,而本人傾向于稱橫、豎、撇、捺、折。因為點(diǎn)的筆畫是很短的, 不象其它筆畫那樣具有一定的長度,且有時運(yùn)筆方向下垂,幾乎與撇 相同。當(dāng)然國家語委規(guī)定稱點(diǎn)可能是因為點(diǎn)成字,而且組字頻率高于 捺。由于是國家語委的規(guī)定,只好遵守,其實(shí)國家語委還可規(guī)定稱捺 也允許。漢字部件是由幾個筆畫組成的具有組配漢字功能的構(gòu)字單 位,漢字部件有多筆畫部件和單筆畫部件之分,單筆畫部件在本發(fā)明 中即五種基本筆畫。
接著將漢字分為合體字和獨(dú)體字二類,合體字是指具有上下、左 右、包圍結(jié)構(gòu)的漢字,它的二個部分往往具有明顯的界線。獨(dú)體字是 指不具有上下、左右、包圍結(jié)構(gòu)的漢字,它的筆畫往往交叉粘連、渾 然一體。
漢字部件的定義與國家語委的規(guī)定相同,它是由幾個筆畫構(gòu)成的 相對不變的筆畫結(jié)構(gòu),組合后可構(gòu)成漢字。漢字部件按《信息處理用
GB13000.1字符集漢字部件規(guī)范》規(guī)定多達(dá)六百多個,這是規(guī)定交叉 不拆的緣故。其實(shí)這樣規(guī)定是不怎么合理的,本人認(rèn)為當(dāng)某個筆畫與 前二個及不止二個筆畫相交時,這個后寫的筆畫必須單獨(dú)拆出。若這 么規(guī)定,則大量的所謂漢字部件實(shí)際上是由其它幾個漢字部件拼湊組 成的,完全可以排除這些所謂的漢字部件。為減少記憶量,從《信息 處理用GB13000.1字符集漢字部件規(guī)范》中精選了 70來個組字頻率 高的漢字部件,這些精選的漢字部件在本發(fā)明中稱為基本部件,將它 們按起筆歸類到橫、豎、撇、點(diǎn)、折五個區(qū)。再主要根據(jù)每個區(qū)中基本部件的組字頻率的高低,兼顧基本部件的多寡來決定每個區(qū)中包含 的鍵位多少,經(jīng)科學(xué)測算,起筆為橫、點(diǎn)、豎的漢字部件組字頻率較 高、數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率次之,分得五 個鍵位,折起筆的漢字部件組字頻率最低,僅安排三個鍵位。為便于 記憶和兼顧指法操作,并參照新華字典部首排列規(guī)律,按點(diǎn)、橫、豎、 撇、折的次序分區(qū)從左到右依次排列。將點(diǎn)區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤
最左邊兩列的六個字母鍵位上,即排在Q、 A、 Z、 W、 S、 X上,將 橫區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中點(diǎn)區(qū)的右邊兩列六個字母鍵位上,即排 在E、 D、 C、 R、 F、 V上,將豎區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中橫區(qū)的 右邊兩列六個字母鍵位上,即排在T、 G、 B、 Y、 H、 N上,將撇區(qū) 部件分別排在標(biāo)準(zhǔn)鍵盤中豎區(qū)的右邊兩列的五個字母鍵上,即排在 U、 J、 M、 I、 K上,折區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤最右邊的兩列的三 個字母鍵上。各個基本部件在字母鍵上的分布見附圖l。具體講,點(diǎn) 區(qū)中的、、i、言、i 、廣等部件排在Q鍵上,用Q作代碼;立、廣、 、/、々、?等部件排在A鍵上,用A作代碼;?、水等部件排在Z鍵 上,用Z作代碼;火和,、、、等部件排在W上,用W作代碼;十、心等部 件排在S上,用S作代碼;〃、^、 i_、凈等部件排在X上,用X 作代碼;王、 一、蟲等部件排在E上,用E作代碼;土等部件排在 D上,用D作代碼;大、石等部件排在C上,用C作代碼;矛、寸 等部件排在R上,用R作代碼;木等部件排在放F上,用F作代碼; 工、七、"^等部件排在V上,用V作代碼;止、蟲、I等部件排在T 上,用T作代碼;日、IJ等部件排在G上,用G作代碼;小、山等
部件排在G上,用G作代碼;目、田等部件排在Y上,用Y作代碼;
口等部件排在H上,用H作代碼;貝、門等部件排在N上,用N作 代碼;未、竹、胂、夂、久、;等部件排在U上,用U作代碼;4 、 人,乂等部件排在J上,用J作代碼;八、,、金等部件排在M上, 用M作代碼;月、兒、.僅等部件排在I上,用I作代碼;勺、々、 幾等部件排在K上,用K作代碼;乙、馬、尸、巳、P等部件排在0 上,用O作代碼,乙代表所有的折筆畫;女、己、又等部件排在L 上,用L作代碼;厶、力、鄉(xiāng)等部件排在L上,用L作代碼;為便 于記憶和遵循習(xí)慣,個別組字頻率不高的部件也被排列到鍵上,它們 并不一定按起筆歸類,而是按同源和近形歸類到組字頻率高的基本部 件中。如?含水、,含金、辨含竹等部件。為減少重碼,以及便于用 區(qū)分碼區(qū)分重碼,往往有意使各個鍵上的基本部件的末筆畫不同。 漢字的編碼是指用一組代碼表示一個漢字。
鍵內(nèi)獨(dú)體字的編碼規(guī)則是成字基本部件的代碼+首筆畫代碼+ 次筆畫代碼+末筆畫代碼,若該基本部件不足三筆,按書寫順序取完 所有的筆畫的代碼為止。例如"言"字,言的代碼為Q;起筆為點(diǎn), 代碼為Q;次筆為橫,代碼為E;末筆為橫,代碼為E,言的編碼就 為QQEE。又如"一"字, 一的代碼為E,首筆為橫,代碼為E,"一" 的編碼就為EE。
鍵外獨(dú)體字,編碼規(guī)則是按書寫順序拆分成基本部件,取第一、 二、三和最末個基本部件的代號進(jìn)行編碼。如"甫"字,是獨(dú)體字, 按書寫順序取橫、月、豎、點(diǎn)的代碼E、 I、 T、 Q,"甫"的編碼就為
EITQ。
合體字的輸入規(guī)則是按正確的書寫順序?qū)h字拆分成首部和余 部進(jìn)行編碼,首部頭尾取2個基本部件的代碼,余部頭尾取2個基本
部件的代碼,首部只能取1個部件的代碼時,余部最多可按書寫順序
取第1、 2和最末個部件的代碼,若余部只有一個或兩個基本部件時,
取完為止。拆分時要把握的原則是按書寫順序,每次都拆分出筆畫 數(shù)盡可能多的基本部件,并且還要兼顧直觀,斧基本部件能按不相交 拆分就按不相交拆分,特別規(guī)定當(dāng)遇到某個筆畫跟前二筆或更多筆畫 相交的筆畫,該筆畫必須單獨(dú)拆出編碼,但基本部件除外,如主中的 豎不能單獨(dú)取出,否則設(shè)立這個部件無意義。漢字輸入法中最頭疼的 是遇到相交的筆畫如何拆分,如"曹"字的上半部分,不同的輸入法 有不同的拆分方法,給初學(xué)者帶來了嚴(yán)重的不便。這條特別規(guī)定則解 決了漢字輸入法中長期未能解決的難題,使"曹"字上半部分的中間 的兩豎必須單獨(dú)拆分成兩個基本筆畫編碼。
如"編"字,它的第一部分只有一個基本部件鄉(xiāng),代碼為P,這 時第二部分可按書寫順序取第一、二和最末個基本部件、、尸、卄,
代碼分別為Q、 O、 V,編碼就為PQOV。
合體字若不足四碼,補(bǔ)上區(qū)分碼編碼。區(qū)分碼的編碼方法是將左 右型、上下型和包圍型分別用三個互不相同的標(biāo)點(diǎn)符號比如用","、 "."和"/"表示,只有二碼的漢字,需在這二個基本部件的代碼后 補(bǔ)上其字型編碼,再補(bǔ)上該漢字的最末筆的編碼。三個基本部件組成 的漢字,僅需在這三個基本部件的代碼后補(bǔ)上其字型編碼。需要指出
將左右型、上下型和包圍型分別用","、"."和"/"編碼也是一個創(chuàng) 新,因為一來簡單易記,二來區(qū)分碼的位置不可能出現(xiàn)在漢字編碼的 第一個位置,不影響標(biāo)點(diǎn)符號輸入。如"杜"字,前二個部件為"木"、 "土",代碼為F、 D,不足四碼,需補(bǔ)上區(qū)分碼是左右結(jié)構(gòu),因此
用","編碼,最末筆是橫,編碼是E,這樣"男"的編碼為"FD,E"。 對于常用漢字,若只取其完整編碼的前邊一個、二個、三個,再 補(bǔ)上空格鍵,就構(gòu)成了一、 二、三級簡碼。本輸入法中一、二、三級 簡碼的數(shù)量都多于25鍵的輸入法,重碼率又很低,因此單字輸入速 度比25鍵的輸入法要快些。
為提高輸入速度,目前各類輸入法都提供了詞語輸入的功能,本 輸入法也如此,規(guī)定不論詞語的長短,其編碼長度都為4碼,并且字 詞兼容。詞語的編碼規(guī)則是二字詞,分別取每個字的完整編碼的前 2碼。如詞語"過程"的編碼,分別取"過"前二碼R、 X,"程"的 前二碼U、 H,過程的編碼就為RXUH。三字詞,分別取前二個字的 完整編碼的第1碼,取第三個字的完整編碼的前2碼。如詞語"計算 機(jī)"的編碼,分別取計的第一碼,部件i的代碼Q,算的第一碼即部 件^的代碼U,機(jī)的前二碼即部件木、幾的代碼F、 K,"計算機(jī)"的 代碼就為QUFK。四個字及四個以上字的多字詞,分別取第l、第2、 第3和最后一個字的完整編碼的第一碼。詞組輸入是提高輸入速度的 重要方法。要盡量利用詞組輸入。
雙分輸入法的重碼率比較低,為最大限度減少重碼,在軟件設(shè)計 中有意將發(fā)生重碼的兩個字中的其中一個字列為二級簡碼,另一個字
列為三級簡碼,從而實(shí)際上消除重碼。
為了便于使用,還設(shè)置了容錯碼,對一些編碼容易出錯的漢字, 在錯誤輸入時也能出現(xiàn)所要輸入的漢字。
權(quán)利要求
1、一種計算機(jī)漢字編碼輸入法即雙分輸入法,在將漢字各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點(diǎn)、折后,其特征是精選了100來個組字頻率高的漢字部件,作為基本部件,將它們按起筆歸類到橫、豎、撇、點(diǎn)、折五個區(qū)中;再根據(jù)每個區(qū)中基本部件的組字頻率的高低來決定每個區(qū)包含的鍵位多少,經(jīng)測算,起筆為橫、點(diǎn)、豎的基本部件各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵位,折起筆的基本部件頻率最低,僅安排三個鍵位;按點(diǎn)、橫、豎、撇、折的次序分區(qū)從左到右依次以每兩列為界排列;點(diǎn)區(qū)中的丶、亠、言、讠、廣等部件排在Q鍵上,用Q作代碼;立、疒、丷、id="icf0001" file="A2006101469560002C1.gif" wi="4" he="3" top= "98" left = "150" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>冫等部件排在A鍵上,用A作代碼;氵、水等部件排在Z鍵上,用Z作代碼;火和灬等部件排在W上,用W作代碼;忄、心等部件排在S上,用S作代碼;冖、宀、辶、衤等部件排在X上,用X作代碼;王、一、id="icf0002" file="A2006101469560002C2.gif" wi="6" he="4" top= "132" left = "29" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在E上,用E作代碼;土等部件排在D上,用D作代碼;大、石等部件排在C上,用C作代碼;扌、寸等部件排在R上,用R作代碼;木等部件排在放F上,用F作代碼;工、七、艸等部件排在V上,用V作代碼;止、蟲、丨等部件排在T上,用T作代碼;日、刂等部件排在G上,用G作代碼;小、山等部件排在G上,用G作代碼;目、田等部件排在Y上,用Y作代碼;口等部件排在H上,用H作代碼;貝、冂等部件排在N上,用N作代碼;禾、竹、id="icf0003" file="A2006101469560002C3.gif" wi="8" he="6" top= "192" left = "29" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>攵、夂、丿等部件排在U上,用U作代碼;亻、人,乂等部件排在J上,用J作代碼;八、钅、金等部件排在M上,用M作代碼;月、兒、id="icf0004" file="A2006101469560002C4.gif" wi="6" he="5" top= "210" left = "49" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在I上,用I作代碼;勹、、幾等部件排在K上,用K作代碼;乙、馬、尸、巳、阝等部件排在0上,用O作代碼,乙代表所有的折筆畫;女、己、又等部件排在L上,用L作代碼;厶、力、纟等部件排在L上,用L作代碼;用L作代碼;個別組字頻率不高的部件也被排列到鍵上,它們并不一定按起筆歸類,而是按同源和近形歸類到組字頻率高的基本部件中,如氵含水、小含id="icf0005" file="A2006101469560003C1.gif" wi="7" he="6" top= "35" left = "34" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>钅含金、id="icf0006" file="A2006101469560003C2.gif" wi="6" he="5" top= "35" left = "63" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>含竹等部件;接著編碼,鍵內(nèi)獨(dú)體字的編碼規(guī)則是成字基本部件的代碼+首筆畫代碼+次筆畫代碼+末筆畫代碼;鍵外獨(dú)體字的編碼規(guī)則是按書寫順序拆分成基本部件進(jìn)行編碼;合體字的編碼規(guī)則是首部頭尾取2碼,余部頭尾取2碼,首部最多只能取1碼時,余部最多可取3碼。
2、根據(jù)權(quán)利要求1所述的雙分輸入法,其特征是區(qū)分碼的編碼方法是將左右型、上下型和包圍型這三類字型分別用三個互不相同的標(biāo)點(diǎn)符號比如","、"."和"/"表示,只有二碼的合體字,需在這二碼后面先補(bǔ)上其字型編碼,再補(bǔ)上該漢字最末的筆畫的編碼;三碼的合體字,需在這三碼后面補(bǔ)上該漢字字型編碼。
3、 根據(jù)權(quán)利要求1所述的雙分輸入法,其特征是單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的基本部件編碼,還 要兼顧直觀,避免把四邊封閉的方框形的基本部件按書寫順序拆開編 碼,特別規(guī)定按書寫順序與前二筆或更多的筆畫相交的后寫筆畫必須 單獨(dú)取出,按單個基本筆畫編碼,基本部件例外。
4、 根據(jù)權(quán)利要求1所述的雙分輸入法,其特征是詞組的編碼 規(guī)則為二字詞,分別取每個字的完整編碼的前2碼;三字詞,分別 取前二個字的完整編碼的第1碼,取第三個字的完整編碼的前2碼; 四字及多字詞,分別取第K第2、第3和最后一個字的完整編碼的第一碼。
全文摘要
本發(fā)明雙分輸入法屬于計算機(jī)漢字編碼輸入法,在將漢字各種筆畫歸類為橫、豎、撇、點(diǎn)、折后,精選了70來個組字頻率高的基本部件,將它們按起筆歸類到橫、豎、撇、點(diǎn)、折五個區(qū)中;起筆為橫、點(diǎn)、豎基本部件各得六個鍵位,起筆為撇的漢字分得五個鍵位,折起筆的基本部件安排三個鍵位;并從左到右依次以每兩列為界排列,再將漢字分為合體字和獨(dú)體字,合體字又一分為二進(jìn)行編碼。
文檔編號G06F3/023GK101192103SQ20061014695
公開日2008年6月4日 申請日期2006年11月22日 優(yōu)先權(quán)日2006年11月22日
發(fā)明者王治陽 申請人:王治陽