两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

漢字多功能編碼鍵盤(pán)和二叉樹(shù)編碼法的制作方法

文檔序號(hào):6406273閱讀:310來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):漢字多功能編碼鍵盤(pán)和二叉樹(shù)編碼法的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于中文信息處理技術(shù)領(lǐng)域,涉及一種漢字三十七字元通用多功能編碼鍵盤(pán)和一種科學(xué)的漢字二叉樹(shù)編碼方法。漢字二叉樹(shù)編碼法以漢字可以生成漢字二叉樹(shù)這一特點(diǎn)為設(shè)計(jì)依據(jù)。
現(xiàn)有的漢字編碼很多種,一般可歸為形碼、音碼和形音碼三大類(lèi)型。但似乎還沒(méi)有一種編碼被人們公認(rèn)是較理想的編碼,原因在于它們或編碼較長(zhǎng),或重碼字多,或編碼規(guī)則復(fù)雜,或使用編碼字元較多等。
本發(fā)明的目的是要提供一種適合用筆形方式和形音綜合方式,對(duì)所有現(xiàn)代漢字、詞語(yǔ)和句子進(jìn)行編碼的漢字三十七字元通用多功能編碼鍵盤(pán);其次提供一種建立在漢字二叉樹(shù)理論基礎(chǔ)上的,反映漢字二叉樹(shù)特點(diǎn)的漢字二叉樹(shù)編碼方法。漢字二叉樹(shù)編碼法簡(jiǎn)單直觀,并具有統(tǒng)一的規(guī)律性,與漢字三十七字元多功能編碼鍵盤(pán)相編合,效果更佳,特別能實(shí)現(xiàn)快速輸入處理計(jì)算機(jī)漢字信息,適合專(zhuān)職和非專(zhuān)職人員學(xué)習(xí)使用。
漢字多功能編碼鍵盤(pán)的實(shí)現(xiàn)及特點(diǎn)漢字多功能編碼鍵盤(pán)選用三十七個(gè)使用頻度和實(shí)用頻度較高的字元,包括可讀字元和不可讀字元、實(shí)筆畫(huà)字元和虛筆畫(huà)字元,以及由實(shí)虛筆畫(huà)共同組成的字元,把其中二十六個(gè)含實(shí)筆畫(huà)的字元按照首筆畫(huà)特點(diǎn)劃分為“丶,一,丨,丿,
”五組,然后按組基本由簡(jiǎn)到繁(指實(shí)筆畫(huà)部分)順序地將字元排列于標(biāo)準(zhǔn)鍵盤(pán)上的二十六個(gè)英文符鍵上,另外十一個(gè)字元復(fù)蓋在前者當(dāng)中的十一字元上,起著鍵位頻度和條件概率的互補(bǔ)作用,如附圖
(1)所示。
多功能編碼鍵盤(pán)上的三十七個(gè)字元,它們各有自身的特點(diǎn)和作用,一般象征表示若干同類(lèi)字元,除本身以外,對(duì)于由實(shí)虛筆畫(huà)共同組成的字元,更主要是表示去掉全部虛筆畫(huà)所剩下的實(shí)筆畫(huà)字元;對(duì)于部分不可讀音的實(shí)筆畫(huà)字元。還表示它的貫用讀音字元;所有字元,一般還表示它的若干相似變體字元。
約定1 全體實(shí)筆畫(huà)字元及其相似變體字元,統(tǒng)稱(chēng)為鍵盤(pán)實(shí)系列字元或鍵盤(pán)基系列字元。
約定2 全體虛筆畫(huà)字元和實(shí)筆畫(huà)字元的讀音字元,以及這些字元的相似變體字元,統(tǒng)稱(chēng)為鍵盤(pán)虛系列字元。
約定3 全體由實(shí)虛筆畫(huà)共同組成的字元及其相似變體字元,統(tǒng)稱(chēng)為鍵盤(pán)中性系列字元。
約定4 鍵盤(pán)實(shí)系列字元、虛系列字元和中性系列字元的全體,總稱(chēng)為鍵盤(pán)系列字元。
鍵盤(pán)系列字元表現(xiàn)為三十七字元鍵盤(pán),鍵盤(pán)實(shí)系列字元表現(xiàn)為三十四字元鍵盤(pán),如附圖(2)所示,三十七字元鍵盤(pán)隱含三十四字元鍵盤(pán)。實(shí)系列字元中絕大多數(shù)字元,不僅是基礎(chǔ)型字元的字頭和字尾子字元。而且是組成任何字元的基本筆畫(huà)和筆畫(huà)組。這里所指的字元的頭尾順序是指從左到右、從上到下、從外到內(nèi)這樣的書(shū)寫(xiě)順序。在確定字頭子字元時(shí),要求字頭子字元盡可能屬于較多筆畫(huà)的鍵盤(pán)實(shí)字元。但是,除內(nèi)外插入關(guān)系外,一般復(fù)筆畫(huà)字頭子字元不能有“丨”筆畫(huà)插入下面的子字元中,否則要修改字頭子字元。鍵盤(pán)虛系列字元主要是針對(duì)標(biāo)準(zhǔn)編碼是三單元以下的編碼設(shè)計(jì)的,對(duì)四單元以上的編碼,虛系列字元一般不作為編碼字元使用。鍵盤(pán)中性系列字元主要為了快速輸入實(shí)用頻度較高的漢字而設(shè)計(jì)的,不論標(biāo)準(zhǔn)編碼數(shù)多少,它們當(dāng)中的字元,即可作為編碼字元使用,也可不作為編碼字元使用,根據(jù)具體編碼而定。
漢字多功能編碼鍵盤(pán)除三十七個(gè)中文字元外,還有兩個(gè)功能一、表示二十六個(gè)拼音碼,所謂拼音碼是指漢語(yǔ)拼音的聲母或第一韻母的代碼,除聲母“ch、sh、zh”分別用字符“I、U、V”表示外,其它聲母和韻母的代碼就是它本身;二、字符鍵“A、E、O”上面共有三個(gè)數(shù)字,除表示相應(yīng)序數(shù)外,還可用來(lái)代表一定的字形,主要在處理重碼字時(shí)使用。詳細(xì)鍵盤(pán)系列字元及其說(shuō)明,參見(jiàn)表(1)。
綜上所述,漢字多功能編碼鍵盤(pán)明顯具有以下優(yōu)特點(diǎn)第一,漢字多功能編碼鍵盤(pán)上的三十七個(gè)字元安排巧妙,具有較強(qiáng)的規(guī)律性,簡(jiǎn)單易記,符合鍵位頻度、條件概率、鑄盤(pán)指法及人們各方面的心理要求;第二,漢字多功能編碼鍵盤(pán)利用實(shí)虛筆畫(huà)相結(jié)合的方法,貫用讀音的方法和相似變體的方法,增強(qiáng)了漢字多功能編碼鍵盤(pán)的表示能力,漢字三十七字元鍵盤(pán)同時(shí)隱含漢字三十四字元鍵盤(pán),并很容易被人們記憶和理解,保持了鍵盤(pán)的清晰度;第三,漢字多功能編碼鍵盤(pán)適合對(duì)所有現(xiàn)代漢字,詞語(yǔ)和句子進(jìn)行編碼,不論是純形型或形音型、等長(zhǎng)或不等長(zhǎng)的編碼都具有一定的靈活性和方便性,但一般主要根據(jù)基礎(chǔ)字元的字頭或字尾特點(diǎn)進(jìn)行編碼,效果良好,并具有處理重碼字的能力。從使用角度出發(fā),定義漢字,詞語(yǔ)和句子的標(biāo)準(zhǔn)編碼為四單元碼比較適宜,一般可控制重碼率小于5%;從實(shí)用角度出發(fā),定義漢字、詞語(yǔ)和句子的標(biāo)準(zhǔn)編碼為三單元碼,一般可控制重碼率小于20%。
在實(shí)際實(shí)施過(guò)程中,根據(jù)具體的應(yīng)用環(huán)境和需要,漢字多功能編碼鍵盤(pán)可以適當(dāng)修改。如(1)鍵盤(pán)字元的實(shí)虛筆畫(huà)可以用不同的顏色來(lái)表示;(2)當(dāng)僅設(shè)計(jì)四元碼漢字輸入系統(tǒng)時(shí),則字元“、竹、貝”可以不寫(xiě)在鍵盤(pán)上;(3)當(dāng)僅設(shè)計(jì)三元碼漢字輸入系統(tǒng)時(shí),則字元“、竹、貝”可以用實(shí)筆畫(huà)形式寫(xiě)在鍵盤(pán)上;(4)由于具體編碼的需要,中性系列字元可以刪減。若特別需要,鍵盤(pán)字元可以重新布局,但不改變鍵盤(pán)字元的組合關(guān)系。總之,附圖(1)所示的鍵盤(pán)圖作為一個(gè)總體設(shè)計(jì),目標(biāo)是全方位的和多功能的。
漢字二叉樹(shù)編碼方法及特點(diǎn)漢字二叉樹(shù)編碼法是通過(guò)嚴(yán)格分析漢字構(gòu)形和讀音特點(diǎn)進(jìn)行設(shè)計(jì)的,認(rèn)為漢字是可讀音的字元。任何字元都可以看成是一個(gè)平面二叉樹(shù)圖塊。
約定5 如果一個(gè)字元是由若干子字元主要以連接和插入方式相結(jié)合組成的字元,叫做基礎(chǔ)型字元,否則叫做非基礎(chǔ)型字元。
約定6 如果一個(gè)字元正好由兩個(gè)可讀音的子字元組成,則這個(gè)字元叫做復(fù)型字元,如果組成字元都是不可讀音字元,則這個(gè)字元叫做原型字元,否則稱(chēng)為一般型字元,同屬于基礎(chǔ)字元和原型字元的字元以及簡(jiǎn)單的原型字元,叫做整體形字元。
任何非整體形字元都可以看成是由兩個(gè)子字元組成的,由于兩個(gè)子字元的重心位置關(guān)系不同存在三種基本構(gòu)形,即左右形、上下和內(nèi)外形,其中左右形漢字最多,約占漢字總量的54%,內(nèi)外形又包括全包圍形、三邊包圍形、兩鄰邊包圍形和兩對(duì)邊包圍形等,如“國(guó)、周、這、哀”字等。
事實(shí)上,任何非整體形字元都很容易按照其基本構(gòu)形和讀音特點(diǎn)以及異構(gòu)形性分解為兩個(gè)子字元。一般,位于左邊、上面和外圍的子字元叫做首子字元,位于右邊,下面和內(nèi)部的子字元叫做未子字元,從子字元的可讀性和構(gòu)形的復(fù)雜性來(lái)講,其中一個(gè)相對(duì)可讀的或構(gòu)形復(fù)雜的子字元叫做字體子字元或中心子字元。一般,子字元同樣具有上述特性,所以,任何字元都可以生成一棵由字元作結(jié)點(diǎn)的二叉樹(shù),叫做漢字二叉樹(shù),漢字二叉樹(shù)屬于滿(mǎn)二叉樹(shù),漢字二叉樹(shù)的根結(jié)點(diǎn)就是字元本身,每個(gè)結(jié)點(diǎn)字元分解后,其首子字元生成這個(gè)結(jié)點(diǎn)的左子樹(shù),而未子字元生成這個(gè)結(jié)點(diǎn)的右子樹(shù),直到二叉樹(shù)中每個(gè)葉子字元都是整體形字元或滿(mǎn)足其它具體要求為止。如果二叉樹(shù)中每個(gè)葉子字元都是整體形字元,則叫做完整漢字二叉樹(shù),否則叫做不完整漢字二叉樹(shù)。如附圖(3)-a就是漢字“照”的完整漢字二叉樹(shù)圖。
漢字二叉樹(shù)編碼就是建立在漢字二叉樹(shù)理論基礎(chǔ)上的,利用漢字二叉樹(shù)特點(diǎn)進(jìn)行編碼的一種編碼方案,由于選擇編碼字元的規(guī)則不一樣等,可以產(chǎn)生多種具體的漢字二叉樹(shù)編碼,但不論是哪種具體的編碼,其一般編碼規(guī)則反映在漢字二叉樹(shù)上都具有統(tǒng)一的規(guī)律性,不直接受具體字形的影響,而已有的各種漢字編碼一般不具備這一特點(diǎn)。如“照”和“調(diào)”的一種二叉樹(shù)二元筆形碼分別是“JYH”和“VUD”,這種三元筆形碼的一般編碼規(guī)則反映在漢字二叉樹(shù)上就是按照從矮葉子字元到高葉子字元,從所有左葉子字元到右葉子字元取三個(gè)葉子字元,然后用三個(gè)葉子字元本身或字頭子字元的代碼,按照從左到右、從上到下和從外到內(nèi)這樣的書(shū)寫(xiě)順序組成樹(shù)根字元的三元筆形碼。對(duì)于具體的各種二叉樹(shù)編碼,不能排除有若干簡(jiǎn)單的特殊規(guī)定,如當(dāng)二叉樹(shù)葉子字元數(shù)小于標(biāo)準(zhǔn)碼數(shù)時(shí)的特殊處理規(guī)定等。
漢字二叉樹(shù)編碼法適合用漢字三十七字元多功能編碼鍵盤(pán)按照筆形特點(diǎn)和形音特點(diǎn)進(jìn)行編碼,不僅重碼字小,而且符合鑄盤(pán)指法要求。從理論上講,漢字二叉樹(shù)編碼法一般分為三個(gè)步驟進(jìn)行,第一,生成相應(yīng)的漢字二叉樹(shù),對(duì)于是否需要生成完整漢字二叉樹(shù),由具體的編碼和漢字的特點(diǎn)決定;第二,按照規(guī)定原則選取編碼字元;第三,組成編碼。但實(shí)際編碼過(guò)程中是不需要生成相應(yīng)的漢字二叉樹(shù)圖的,原因在于任何漢字實(shí)質(zhì)都可以看成是被演變了的二叉樹(shù)圖塊,如果約定園點(diǎn)“·”表示由這點(diǎn)指向的兩個(gè)子字元所合成的字元,那么很容易得到如附圖(3)-b表示“照”一樣的二叉樹(shù)圖塊,把二叉樹(shù)圖塊中的園點(diǎn)“·”和箭頭“→”去掉,便還原成漢字。因此說(shuō)明,漢字二叉樹(shù)編碼方法不僅理論完善,而且編碼規(guī)則十分簡(jiǎn)單直觀而有規(guī)律性,是目前較理想的一種編碼方案。對(duì)于實(shí)際使用的漢字二叉樹(shù)三元筆形碼、四元筆形碼、三元形音碼和四元形音碼,特別能實(shí)現(xiàn)快速輸入處理計(jì)算機(jī)漢字信息。
漢字二叉樹(shù)編碼法也適合對(duì)詞語(yǔ)進(jìn)行編碼,方法類(lèi)似。首先,把詞語(yǔ)看成是一個(gè)左右結(jié)構(gòu)的“字元”,以字和子詞為單位按層次分解。并生成相應(yīng)的“漢字二叉樹(shù)”,然后按照漢字二叉樹(shù)編碼法進(jìn)行編碼。如“中華人民共和國(guó)”,它的“漢字二叉樹(shù)圖”如附圖(4)所示,因此它的一種二叉樹(shù)三元筆形碼和四元筆形碼分別是“LIJ”和“LITJ”。
權(quán)利要求
1.漢字多功能編碼鍵盤(pán)用標(biāo)準(zhǔn)鍵盤(pán)中二十六個(gè)英文字符鍵表示三十七個(gè)中文字元、二十六個(gè)拼音字符和三個(gè)數(shù)字,對(duì)于中文字元,由于主要采用實(shí)虛筆畫(huà)相結(jié)合的方法,以及相似變體和貫用讀音的方法,使鍵盤(pán)清晰、記憶量小,表示能力強(qiáng),適用范圍廣。
2.漢字二叉樹(shù)編碼法認(rèn)為,任何非整體形字元都很容易按照其簡(jiǎn)單的構(gòu)形和讀音特點(diǎn),以及異構(gòu)形性分解為兩個(gè)子字元。子字元又具有上述特性,即任何漢字都可以生成一棵由字元作結(jié)點(diǎn)的漢字二叉樹(shù),任何漢字實(shí)質(zhì)上是被演變了的漢字二叉樹(shù)平面圖塊。漢字二叉樹(shù)編碼法就是建立在漢字二叉樹(shù)理論基礎(chǔ)上的,并反映漢字二叉樹(shù)特點(diǎn)的一種編碼方案。由于選擇字元和編碼規(guī)則不一樣,可以產(chǎn)生多種具體的漢字二叉樹(shù)編碼,但每一種具體的二叉樹(shù)編碼。其一般編碼規(guī)則反映在漢字二叉樹(shù)上都具有統(tǒng)一的規(guī)律性,即可以用漢字二叉樹(shù)理論來(lái)描述其編碼規(guī)則,而不直接受具體字形的影響,但不排除有簡(jiǎn)單的特殊約定。
3.漢字三十七字元多功能編碼鍵盤(pán)隱含漢字三十四字元(含中性字元)鍵盤(pán),鍵盤(pán)上三十四實(shí)字元是多功能編碼鍵盤(pán)的核心和基礎(chǔ)。除以外,多功能編碼鍵盤(pán)中其它內(nèi)容可以根據(jù)具體應(yīng)用環(huán)境和需要適當(dāng)刪除和修改。
4.漢字多功能編碼鍵盤(pán)適合用筆形方式和形音方式對(duì)漢字、詞語(yǔ)和句子進(jìn)行編碼。當(dāng)利用漢字三十七字元進(jìn)行編碼時(shí),主要根據(jù)字元的字頭和字尾特點(diǎn)進(jìn)行編碼。
5.漢字二叉樹(shù)編碼法主要適合筆形方式和形音方式對(duì)所有現(xiàn)代漢字和詞語(yǔ)進(jìn)行編碼。
6.漢字二叉樹(shù)編碼法適合與多功能編碼鍵盤(pán)相結(jié)合進(jìn)行編碼,編碼綜合效果很好。
全文摘要
多功能編碼鍵盤(pán)用標(biāo)準(zhǔn)鍵盤(pán)中二十六個(gè)英文字符鍵表示三十七個(gè)中文字元、二十六個(gè)拼音字符和三個(gè)數(shù)字,著重采用實(shí)虛筆畫(huà)相結(jié)合的方法,鍵盤(pán)清晰,記憶量小,符合鍵位頻率,條件概率和鍵盤(pán)指法要求,二叉樹(shù)編碼法以漢字可以生成漢字二叉樹(shù)這一特點(diǎn)為依據(jù),簡(jiǎn)單直觀,不受具體字形的影響,以上兩者相結(jié)合,效果更佳,重碼字很小,適合計(jì)算機(jī)專(zhuān)職和非專(zhuān)職人員學(xué)習(xí)使用。
文檔編號(hào)G06F3/023GK1057531SQ9110427
公開(kāi)日1992年1月1日 申請(qǐng)日期1991年6月20日 優(yōu)先權(quán)日1991年6月20日
發(fā)明者周耀瑜 申請(qǐng)人:周耀瑜
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
铁岭县| 宜兰市| 大姚县| 林口县| 安陆市| 伊宁县| 远安县| 安岳县| 竹山县| 大竹县| 娄底市| 平邑县| 浮梁县| 福建省| 额济纳旗| 侯马市| 旬阳县| 大冶市| 长乐市| 宝兴县| 军事| 竹溪县| 元朗区| 昌宁县| 奉贤区| 昌吉市| 邵阳市| 辛集市| 佛山市| 合阳县| 东丰县| 江孜县| 交口县| 汝州市| 绥棱县| 大足县| 新宾| 台前县| 汾阳市| 尤溪县| 沁水县|