两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種漢字編碼方法及其鍵盤(pán)的制作方法

文檔序號(hào):6602646閱讀:265來(lái)源:國(guó)知局
專(zhuān)利名稱:一種漢字編碼方法及其鍵盤(pán)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及漢字編碼法尤其是音形結(jié)合的漢字編碼方法及其所用鍵盤(pán)。
中國(guó)專(zhuān)利申請(qǐng)?zhí)枮?3118140.2的“漢字形音輸入法”公開(kāi)了一種漢字編碼方法“其特征為(1)漢字讀音的第一個(gè)漢語(yǔ)拼音字母作為XY碼的第一個(gè)字符。(2)漢字拆分后的首部件、次部件和末部件讀音的第一個(gè)漢語(yǔ)拼音字母作為漢字XY碼的第2、3、4個(gè)字符。(3)不認(rèn)識(shí)的漢字、無(wú)法給出漢字讀音,可以通過(guò)拆分的首部件、次部件、第三部件和末部件讀音的第一個(gè)漢語(yǔ)拼音字母得到漢字XY碼。”該編碼法由于僅用漢字及其部件讀音的第一個(gè)漢語(yǔ)拼音字母作漢字的編碼,其重碼率較高并限制了編入詞組的數(shù)量。
本發(fā)明的目的就是針對(duì)上述不足進(jìn)而提供一種漢字輸入重碼率較低且能編入較多詞組的漢字編碼方法及其所用鍵盤(pán)。
本發(fā)明的技術(shù)方案是,一種漢字編碼方法,其要點(diǎn)是將漢字按其讀音拆分成聲母和韻母,并按其字型結(jié)構(gòu)拆成漢字部件,使得每一漢字或詞組由聲母、韻母和/或漢字部件組拼而成,所述漢字部件包括整字字根部件、非整字字根部件、非字根整字部件,本編碼法將聲母、韻母作為漢字的音碼,將漢字部件作為漢字的形碼,漢字字根部件及其代碼如下
而且,漢字拆成漢字部件的原則是(1)順序拆字、盡量取大,(2)先取優(yōu)先,(3)整字字根優(yōu)先,(4)交叉優(yōu)先。
而且,漢字按聲母、韻母、漢字部件順序編碼(1)單字的編碼順序?yàn)槁暷浮㈨嵞讣白鳛樽R(shí)別碼的漢字部件;(2)兩字詞組的編碼順序?yàn)榈谝粋€(gè)字的聲母和韻母、第二個(gè)字的聲母和韻母及作為識(shí)別碼的漢字部件;(3)三字詞組的編碼順序?yàn)槿衷~組識(shí)別碼、詞組各字的聲母及漢字部件;(4)四字及四字以上詞組的編碼順序?yàn)樗淖衷~組識(shí)別碼、四字及四字以上詞組第一、二、三字和末位字的聲母。
或者,漢字按漢字字根部件、聲母、韻母順序編碼(1)單字的編碼為漢字字根部件和識(shí)別碼,識(shí)別碼為該字的聲母和韻母;(2)兩字詞組的編碼順序?yàn)榈谝粋€(gè)字的首部件。第二部件和第二字的首部件、第二部件及第一、第二字的聲母;(3)多字詞組的編碼順序?yàn)槿衷~組取第一字的首部件、第二部件和第二、第三字的首部件及三字詞組識(shí)別碼;四字及四字以上詞組取各字的首部件及四字詞組識(shí)別碼或多字詞組的第一個(gè)字或其后字的聲母。
而且,數(shù)字符號(hào)、標(biāo)點(diǎn)符號(hào)、字根符號(hào)、日、俄文漢符號(hào)和其他特殊符號(hào)的編碼依次為“IZFH”、“BDFH”、“ZEFH”、“RWZM”、“EWZM”和“TIFH”。
本發(fā)明提供的鍵盤(pán),包括A、B、C………X、Y、Z二十六個(gè)英文大寫(xiě)字母鍵及空格鍵,其特點(diǎn)是,漢字的聲母、韻母及字根部件的鍵位如下安排
其中“A”鍵和“O”鍵分別為三字詞組和四字以上詞組的識(shí)別碼。
本發(fā)明由于將漢字的聲母、韻母及漢字部件作為基本碼元,并采用若干識(shí)別碼來(lái)減少重碼,將漢字字根在鍵盤(pán)上的排列盡可能兼顧了在每個(gè)鍵位上所容納的漢字和詞組的均衡性,在編入國(guó)際一、二級(jí)漢字庫(kù)的6763個(gè)漢字以及35000條常用詞組的情況下,其單個(gè)漢字和詞組輸入的絕對(duì)重碼率降低到1‰以下,因此本發(fā)明不僅編入詞組多而且重碼率低。
下面詳細(xì)介紹本發(fā)明的鍵盤(pán)及其漢字輸入方法。
本發(fā)明可按前述對(duì)應(yīng)關(guān)系將漢字的聲母、韻母及字根部件定義在鍵盤(pán)上,并按下述方法輸入漢字一、以音碼為主輸入漢字這種方法特別適合于用戶在創(chuàng)作文稿時(shí)邊想邊打或邊聽(tīng)邊打時(shí)使用。單個(gè)漢字和兩字、三字詞組輸入的標(biāo)準(zhǔn)編碼長(zhǎng)度為四碼,極少數(shù)輸入第四碼后仍會(huì)出現(xiàn)重碼的單字和兩字、三字詞組可以取第五碼作為識(shí)別碼輸入。四字詞組的標(biāo)準(zhǔn)編碼長(zhǎng)度為五碼。但最常用的26個(gè)漢字只取一碼可輸入,約有600多個(gè)常用漢字和少量詞組可以取兩碼輸入,絕大多數(shù)的單個(gè)漢字和詞組取三碼或四碼便可輸入。因此,實(shí)際上只有少數(shù)詞組才需取第五碼作為識(shí)別碼輸入,為了照顧一些用戶的習(xí)慣,偶爾遇到重碼時(shí)也可以用數(shù)字鍵選擇輸入。
1、單字 單個(gè)漢字輸入的前兩碼為雙拼音碼,第一碼為其聲母,第二碼為其韻母。例如要輸入“方”字,先輸入聲母“F”對(duì)應(yīng)字母鍵F,再輸入韻母“ang”對(duì)應(yīng)字母鍵G,即可在屏幕下方提示行出現(xiàn)“方”字。對(duì)于無(wú)聲母漢字如“啊、安、愛(ài)、奧、昂、恩、兒、歐、哦”等,以E鍵作為其虛擬聲母,例如要輸入“安”字,先輸入虛擬聲母“E”,再輸入韻母“an”對(duì)應(yīng)的字母鍵F,“安”字即會(huì)出現(xiàn)在提示行。輸入前兩碼后,所有的同音漢字都會(huì)出現(xiàn)在屏幕下方提示行,此時(shí)可通過(guò)數(shù)字鍵進(jìn)行挑選,重碼如果太多還可用“=”鍵或“-”鍵向后或向前翻頁(yè)進(jìn)行挑選。但完全用雙拼輸入法輸入單個(gè)漢字很不方便而且很慢。因而本發(fā)明在輸入雙拼編碼后,還可接著輸入漢字的形碼來(lái)輸入用戶所選擇的漢字,即拆取漢字的部件并輸入相應(yīng)的形碼,用戶選擇的漢字就可以馬上出現(xiàn)在屏幕上。
漢字部件的拆取及形碼的確定如果對(duì)漢字的字型結(jié)構(gòu)和人們識(shí)字的過(guò)程加以分析,我們可以發(fā)現(xiàn),所有的漢字實(shí)際上都是由兩類(lèi)部件組成的一類(lèi)是筆劃較少的整字部件,例如“類(lèi)”字就是由“米”字和“大”字組成的;另一類(lèi)是非整字部件,包括單筆劃部件和多筆劃部件結(jié)合而成的偏旁部首,例如“斤”字是
和“”兩個(gè)部件組成的。本發(fā)明形碼就是拆取這兩種類(lèi)型的部件編成的。為了避免將漢字拆分得太細(xì)變得過(guò)于繁瑣,同時(shí)又不能拆得太粗引起大量重碼,本發(fā)明選取了100多個(gè)經(jīng)常用來(lái)組成漢字的整字、偏旁部首和單筆劃,將其規(guī)定為“字根”,并對(duì)這些字根加以科學(xué)的歸類(lèi)和排列,使其很容易便能全部記熟。因此,本發(fā)明實(shí)際上將所有的漢字部件分為整字字根(包括變形整字字根,例如整字字根“水”的變形字根“氺”“云”的變形字根
等),非整字字根和非字根整字三種類(lèi)型,并對(duì)這三種類(lèi)型和部件規(guī)定了特定的拆分和編碼規(guī)則。
本輸入法拆取形碼的規(guī)則非常簡(jiǎn)單,具體規(guī)定可歸納為四句話(1)順序拆字,盡量取大。這一規(guī)則的含義是,拆取單個(gè)漢字的形碼一般應(yīng)按照漢字書(shū)寫(xiě)的筆順規(guī)則拆取由連續(xù)筆劃組成的盡可能較大的字根或整字部件。拆取第一個(gè)部件(首部件)后,接著再按同樣的原則從余下的部分中拆取第二部件。例如“蝶”字的形碼應(yīng)取“蟲(chóng)”部為首部件,取“世”部為第二部件;“劍”字的首部件取
,第二部件取“刂”。也就是說(shuō),形碼的首部件不僅可以拆取字根,還可以拆取非字根的整字。但形碼的第二部件能否取非字根整字部件則要視該整字部件是否為字根及拆取后是否還有余下的部件而定。如果第二部件拆取非字根整字后還有剩余部件,則可以取非字根整字作形碼的第二部件。如果拆取后不再有剩余部件,則該整字部件還須再拆開(kāi)。例如“腰”字的首部件“月”部拆取后,余下的部件為“要”字,但如果將其全部取為第二部件,就沒(méi)有剩余的部件了。因此“要”字還必須再拆開(kāi)。這時(shí)仍須按“順序拆字,盡量取大”的原則,將“要”字拆分為“西”部和“女”部,所以應(yīng)取“西”部作為“腰”字的第二部件。如果拆取形碼首部件后僅剩一個(gè)字根部件,則不管它是整字字根或是非整字字根,一律不再拆開(kāi),例如“偉”字的首字根部件為“亻”,第二字根部件為“韋”。也就是說(shuō),字根是組成一個(gè)漢字的最小部件單位,遇到字根部件一律不拆。但對(duì)于字根整字應(yīng)視同一個(gè)獨(dú)立的整字拆開(kāi)輸入。例如“大”字應(yīng)拆為“一”和“人”;“羊”字應(yīng)拆為“”和“”,等等。
拆出漢字部件后便可按該漢字的第一部件和第二部件輸入形碼部分的首碼和第二碼了。如果是規(guī)定的字根部件,則按字根在編碼表中對(duì)應(yīng)的代碼輸入形碼;如果是非字根整字部件,則按該整字的聲母輸入形碼。例如上例幾個(gè)單字的編碼即為DMUI(蝶)、JJQJ(劍)、YDLO(腰)、WWRW(偉)。
按書(shū)寫(xiě)筆順拆取字根或整字部件并非毫無(wú)例外的絕對(duì)原則,為了拆取方便和更加符合人們對(duì)漢字的直觀感,對(duì)少數(shù)字根規(guī)定可以不按連續(xù)書(shū)寫(xiě)的筆順拆取。這些字根主要是①由方框“口”構(gòu)成的漢字,先取字根“口”,再取里面的內(nèi)容。類(lèi)似方框的字根
也是先取外框,再取里面的內(nèi)容。②半包圍結(jié)構(gòu)的字根如“匚”和“”,也是先取外框,再取里面的內(nèi)容。但與字根“凵”結(jié)合組成的漢字仍按筆順拆字,即先取“凵”部里面的內(nèi)容,再取“凵”。③由整字字根“木”、“禾”、“干”、“戈”、“戊”等組成的漢字,如“束”、“乘”、“平”、“戒”、“成”等字,按整字字根優(yōu)先的原則應(yīng)先取整字字根,再取剩余的部件。
(2)先取優(yōu)先?!跋热?yōu)先”的規(guī)則是指先拆取的部件與后拆取的部件都可以采用中間的幾筆組成字根或整字部件時(shí),一般應(yīng)該讓先取的部件優(yōu)先采用。例如“壬”字按先取優(yōu)先的規(guī)則應(yīng)拆為“千”部和“一”部,而不是拆為“丿”部和“士”部;“丈”字應(yīng)拆為“ナ”和“”而不是“一”和“乂”;“章”字應(yīng)拆為“音”和“十”而不是拆為“立”和“早”等等。但這一規(guī)則也有例外,即如果先取的部件與后取的部件都可采取中間的一筆組成整字部件時(shí),則這一筆可為先后兩個(gè)部件共同采用。例如“產(chǎn)”字應(yīng)拆為“立”和“廠”;“缶”字應(yīng)拆為“午”和“山”。此外還有“出”字、“重”字和“哥”字等,這些字從直觀上看也是共同一筆構(gòu)成的兩個(gè)字,即“山、山”、“千、里”和“可、可”,所以它們的形碼分別為“山、山”、“千、田”和“可、丁”。
(3)整字字根優(yōu)先?!罢肿指鶅?yōu)先”的規(guī)則主要是指先拆取的部件與后拆取的部件都可以采用中間的筆劃時(shí),一般應(yīng)該讓整字字根優(yōu)先采用。例如按照整字優(yōu)先的規(guī)則,“白”字應(yīng)拆為“丿”和“日”,而不應(yīng)拆為
和“一”;“百”字應(yīng)拆為“一”和“白”,而不應(yīng)拆為“丆”和“日”;“蘭”字應(yīng)拆為“丷”和“三”,而不應(yīng)拆為“”和“二”,等等。但后取部件若為非字根整字而不是整字字根時(shí)則不能優(yōu)先,如“方”字應(yīng)拆為“亠”和
,而不是“丶”和“萬(wàn)”;“關(guān)”字應(yīng)拆為“”和“大”,而不是“丷”和“天”,等等。
“整字字根優(yōu)先”的另一含義是拆取整字字根時(shí)可以不按連續(xù)筆劃的順序,優(yōu)先采用后面的筆劃。例如前面提到的“束”字、“乘”字和“平”字等,分別應(yīng)該先取“木”、“禾”和“干”部作為首字根。此外還有“及”字(首字根取“人”部),等等。
(4)交叉優(yōu)先?!敖徊鎯?yōu)先”的規(guī)則是指先拆取的部件與后拆取的部件都可以采用中間的筆劃時(shí),交叉結(jié)構(gòu)的部件應(yīng)該比相連和離散結(jié)構(gòu)的部件優(yōu)先采用。例如,按交叉優(yōu)先的原則,“開(kāi)”字的首碼應(yīng)拆為“一”部,而不應(yīng)拆為“二”部;“?!睉?yīng)拆為“丿”和“”,而不應(yīng)拆為“”和“十”;“禾”字應(yīng)拆為“丿”和“木”,而不應(yīng)拆為“千”和“人”,等等。
盡管本輸入法的單字輸入的標(biāo)準(zhǔn)編碼為四位編碼,但實(shí)際上大多數(shù)的單字只需要取三位、兩位甚至一位編碼(稱為三級(jí)、二級(jí)和一級(jí)簡(jiǎn)碼)便可輸入。因?yàn)榇蠖鄶?shù)漢字取到第三位編碼時(shí),已經(jīng)是提示行唯一的漢字,即使不是唯一的,一般最常用的漢字也是放在最前面的,這時(shí)只需擊空格鍵便可輸入了。
本輸入法輸入單入個(gè)漢字取到第四位編碼一般都能順利輸入,只有極少數(shù)單字的輸入在取足第四碼時(shí)仍會(huì)遇到重碼,例如“吧”和“叭”兩個(gè)字的編碼均為“BAKB”。解決重碼的方法是當(dāng)輸入前三碼“BAK”時(shí),提示行將出現(xiàn)“1吧2叭”,此時(shí)擊空格鍵即可輸入排在第一位的“吧”字;如果繼續(xù)輸入第四碼“B”,則提示行變?yōu)椤?叭2吧”,此時(shí)擊空格鍵即可輸入排在第一位的“叭”字。如果輸入第四碼后,想輸入排在第二位的重碼字,可重復(fù)擊一下第四碼,即可輸入。例如欲輸入“欷”字,當(dāng)鍵入其前四位編碼“XIXQ”時(shí),提示行會(huì)出現(xiàn)“1歙2欷”,面在此之前,“欷”字一直未能出現(xiàn)在提示行的首位。此時(shí),只要將第四碼再擊一次,即可輸入“欷”字。通過(guò)采用這種方法,本發(fā)明使單個(gè)漢字輸入的重碼率降低為零,從而完全不需高以數(shù)字鍵選擇輸入。
2、詞組輸入(1)雙字詞組輸入雙字詞組輸入采用雙拼的方法,即用詞組第一個(gè)字的雙拼編碼(聲母和韻母)加上第二個(gè)字的雙拼編碼(聲母和韻母)。例如,“詞組”一詞的編碼為“CIZU”。雙拼輸入詞組的優(yōu)點(diǎn)是簡(jiǎn)單容易且速度很快,但傳統(tǒng)的雙拼詞組輸入有時(shí)會(huì)遇到較多(有時(shí)甚至多達(dá)十個(gè)以上)的詞組重碼,挑選時(shí)也很麻煩。本發(fā)明解決這一問(wèn)題的辦法是輸入第四碼后遇到重碼詞組時(shí),只讓一個(gè)最常用的詞組出現(xiàn)在提示行,但并不立即進(jìn)入文件。如果這時(shí)所出現(xiàn)的詞組是用戶所要的詞組,則擊空格鍵即可輸入;如果用戶所要輸入的詞組沒(méi)有出現(xiàn)在提示行,這時(shí)可接著輸入該詞組第一個(gè)字的首字根形碼作為識(shí)別碼;如果這時(shí)提示行出現(xiàn)了兩個(gè)以上的重碼詞組(通常這兩個(gè)詞組的第一個(gè)字是相同的),則取第二個(gè)字的首字根形碼作為識(shí)別碼。例如,輸入編碼“JIXV”后,提示行會(huì)出現(xiàn)“繼續(xù)”一詞,但并不象一般雙字詞組那樣立即進(jìn)入文件中,此時(shí)如果該詞組正是所要輸入的詞組,則擊空格鍵即可輸入。如果所要輸入的是沒(méi)有出現(xiàn)在提示行的“積蓄”一詞,則只要接著再擊“積”字的首字根“禾”的形碼“H”鍵,即可輸入“積蓄”一詞。再如,輸入編碼“VTII”后,提示行會(huì)出現(xiàn)多個(gè)雙字詞組“1正式2正是3正視4正事4正史6證實(shí)”,此時(shí),如果要輸入后面的某個(gè)雙字詞組,譬如要輸入“正視”一詞,只要鍵入其第二個(gè)字的首字根形碼“I”即可輸入(當(dāng)然,此時(shí)也可以用數(shù)字鍵選擇輸入)。采用這種辦法使雙字詞組輸入的重碼率降低為零。
(2)多字詞組的輸入本發(fā)明將“A”鍵和“O”鍵作為三字詞組和四字以上詞組的識(shí)別碼。
對(duì)于三字詞組,基本上采用四位編碼輸入,首碼一律為“A”,其余三碼為該詞組三個(gè)字的聲母。例如欲輸入“現(xiàn)代化”一詞,先鍵入“A”,再鍵入“XDH”,即可輸入該詞組,如果鍵入第四碼后所要輸入的三字詞組出現(xiàn)在提示行而并不進(jìn)入文件中,則可擊空格鍵使其輸入;如果鍵入第四碼后提示行出現(xiàn)的并非所要輸入的三字詞組,只要接著鍵入應(yīng)輸入的三字詞組第一個(gè)字的首字根形碼,即可輸入所要的三字詞組。這樣,三字詞組輸入的重碼率也降低為零。
四字以上詞組的編碼采用五位編碼輸入,首碼一律為“O”,其余四碼為該詞組四個(gè)字的聲母。例如欲輸入“千家萬(wàn)戶”一詞,先鍵入“O”,再鍵入“QJWH”,即可輸入該詞。用本法輸入四字詞組,雖然不會(huì)與單個(gè)漢字、雙字詞組和三字詞組發(fā)生重碼,但少數(shù)四字詞組會(huì)相互發(fā)生重碼,此時(shí)重碼的詞組會(huì)出現(xiàn)在提示行,可以用數(shù)字鍵選擇輸入。四字詞組的重碼率很低,在編入近萬(wàn)條四字詞組的情況下,其相互之間的重碼率小于1%,加上四字詞組在漢字輸入時(shí)出現(xiàn)的頻率很低,因此,對(duì)輸入速度沒(méi)有多大影響。實(shí)際上,由于四字詞組輸入時(shí)減少了擊鍵次數(shù)(一字一碼),所以反而會(huì)提高輸入速度。總之本發(fā)明的多字詞組輸入方法不僅使多字詞組的輸入與單個(gè)漢字和雙字詞組的輸入完全區(qū)別開(kāi)來(lái)而不會(huì)發(fā)生重碼,而且多字詞組本身也幾乎完全消除了重碼,從而大大提高了漢字的輸入速度。二、以形碼為主輸入漢字1、單字單個(gè)漢字輸入的標(biāo)準(zhǔn)編碼為四碼,其形碼主要通過(guò)拆取漢字的部件組成,拆取漢字部件的規(guī)則與以音碼為主輸入漢字的拆取規(guī)則基本相同,具體方法如下(1)按上述“順序拆取、盡量取大,先取優(yōu)先,整字字根優(yōu)先,交叉優(yōu)先”的原則依次拆取一個(gè)漢字首部件、第二部件、第三部件和最后一個(gè)部件。與前述拆取規(guī)則唯一不同的一點(diǎn)是本法拆取漢字部件時(shí),遇到非字根整字一律拆成字根。例如輸入“夠”字時(shí),將其拆成字根部件應(yīng)為“勹口夕夕”。大多數(shù)漢字只能拆成兩個(gè)或三個(gè)字根。例如“部”字應(yīng)拆為“立、口、阝”;“件”字應(yīng)拆為“亻、?!薄?br> (2)按部件輸入編碼。拆取漢字的部件后,再依次按每個(gè)部件輸入其對(duì)應(yīng)的形碼編碼即可輸入該單字了。例如“揮”字的部件為“扌、冖、車(chē)”,輸入對(duì)應(yīng)的編碼應(yīng)為“FBU”,“揮”字即可出現(xiàn)在屏幕的提示行。
(3)輸入識(shí)別碼。以形碼為主輸入漢字的標(biāo)準(zhǔn)編碼為四碼,即通常在鍵入四碼后,便可將所要輸入的漢字送入文件。但在鍵入兩碼或三碼后,如果所要輸入的漢字已出現(xiàn)為提示行唯一的一個(gè)漢字,或所要輸入的漢字出現(xiàn)在幾個(gè)漢字的最前面時(shí),也可通過(guò)擊空格鍵輸入,即以二級(jí)或三級(jí)簡(jiǎn)碼的方式輸入。例如輸入“如”字時(shí),鍵入其兩個(gè)部件“女”和“口”對(duì)應(yīng)的形碼“NK”后,“如”字即出現(xiàn)在提示行的第一位,此時(shí)只要擊空格鍵即可輸入該字。如果所要輸入的漢字的形碼不足四個(gè),還可以補(bǔ)充鍵入識(shí)別碼來(lái)輸入。對(duì)于只有三個(gè)形碼的漢字,識(shí)別碼為該字的聲母音碼。對(duì)于只有兩個(gè)形碼的漢字,識(shí)別碼為該字的聲母和韻母音碼。例如,“腰”字的形碼為“L(月)”、“O(西)”和“N(女)”,識(shí)別碼為“Y”;“根”字的形碼為“Y(木)”和“P(艮)”,識(shí)別碼為“GR”。實(shí)際上,除了極少數(shù)字以外,只有兩個(gè)形碼的漢字一般無(wú)須取韻母音碼使可輸入,因?yàn)樵谳斎霑r(shí)這些字總是被放在揭示行最前面,可通過(guò)擊空格鍵輸入。而且只要鍵入所拆取漢字的全部形碼,所要輸入的漢字就會(huì)出現(xiàn)在屏幕的提示行,因此不會(huì)拼音的用戶使用本法輸入漢字時(shí),也可通過(guò)數(shù)字鍵從提示行選擇來(lái)代替識(shí)別碼。盡管本法單字輸入的標(biāo)準(zhǔn)編碼為四碼,但絕大多數(shù)的單個(gè)漢字實(shí)際上只需要取三位、兩位編碼便可輸入。
與以音碼為主輸入漢字一樣,以形碼為主輸入單個(gè)漢字時(shí),重碼的單個(gè)字會(huì)在鍵入其編碼的過(guò)程中輪流出現(xiàn)在提示行的第一位,使用戶可以通過(guò)擊空格鍵將其輸入。只有極個(gè)別的漢字輸入時(shí)在鍵入第四碼后,仍會(huì)與其他漢字發(fā)生重碼,而且也不出現(xiàn)在提示行的第一位,此時(shí)則可再鍵入一次該單字的第四碼作為識(shí)別碼,所要輸入的漢字即可進(jìn)入文件中。例如欲輸入“峁”字,當(dāng)鍵入其編碼“EUJP”后,提示行出現(xiàn)“1聊2峁”,再鍵入其第四碼“P”即可輸入“峁”字。
2、詞組輸入(1)兩字詞組輸入法。以形碼為主的兩字詞組輸入的標(biāo)準(zhǔn)編碼長(zhǎng)度為四碼。輸入方法為依次分別采用兩個(gè)字的首部件和第二部件的形碼。例如“只要”一詞的前兩碼為“K(口)、B(八)”,后兩碼為“O(西)、N(女)。鍵入“KBON”,即可輸入該詞組。如果鍵入第四碼后,所要輸入的詞組出現(xiàn)在提示行第一位但并不進(jìn)入文件,可擊空格鍵將其輸入;如果已鍵入第四碼,而提示行出現(xiàn)的是單個(gè)漢字,或雖是雙字詞組但卻不是用戶所要輸入的雙字詞組,則需要繼續(xù)輸入第五碼。對(duì)未出現(xiàn)在提示行的詞組鍵入該詞組第一個(gè)字的聲母即可輸入。例如欲輸入“韻母”一詞,輸入前四碼“LOMA”后屏幕提示行出現(xiàn)“意料”一詞而未見(jiàn)“韻母”,此時(shí)可接著輸入“韻”字的聲母“Y” 即可將“韻母”一詞輸入。如果輸入第四碼后,提示行出現(xiàn)了兩個(gè)以上的雙字詞組,則對(duì)第一位詞組擊空格鍵輸入,對(duì)其后面的詞組鍵入該詞組第二個(gè)字的聲母即可輸入。例如鍵入編碼“HRHK”后,提示行出現(xiàn)“1大豆2,大事3大哥4大煙”四個(gè)雙字詞組,此時(shí)如果欲輸入“大豆”,可擊空格鍵;欲輸入“大事”,可擊“事”字的聲母鍵“I”;欲輸入“大哥”,可擊“哥”字聲母鍵“G”;欲輸入“大煙”,可擊“煙”字的聲母鍵“Y”即可。
(2)多字詞組輸入法。以形碼為主的多字詞組輸入的標(biāo)準(zhǔn)編碼為四碼。三字詞組的輸入依次采用第一個(gè)字的形碼的第一碼和第二碼,以及第二個(gè)字和第三個(gè)字形碼的第一碼;四字詞組(四字以上詞組視同四字詞組)的輸入則取四個(gè)字的首部件形碼依次輸入(多于四字的詞組取第一、二、三和最后一字)。例如,“形聲碼”一詞的輸入編碼為“H(一)、C(廾)、T(士)、Q(石)”;“風(fēng)塵仆仆”一詞的輸入編碼為“J(),、X(小)、R(亻)”;“發(fā)展中國(guó)家”一詞的輸入編碼為“L(ㄥ)、P(尸)、K(口)、B(宀)”。
一般情況下,絕大多數(shù)多字詞組在輸入第三碼或第四碼后便可成為提示行唯一的詞組,此時(shí)擊空格鍵即可輸入。例如欲輸入三字詞組“形聲碼”,鍵入其編碼“HCTQ”后,“形聲碼”一詞出現(xiàn)在提示行,但并不進(jìn)入文件,此時(shí)再擊一下“A”鍵即可輸入該詞組。
如果輸入第四碼后未見(jiàn)三字或四字詞組出現(xiàn)在屏幕的提示行,而只出現(xiàn)單個(gè)漢字或雙字詞組時(shí),只要再擊一下“A”鍵(輸入三字詞組時(shí))或“O”鍵(輸入四字詞組時(shí))即可輸入該多字詞組。例如欲輸入四字詞組“一本萬(wàn)利,”鍵入其前四位編碼“HYTH”后,提示行出現(xiàn)的是一個(gè)雙字詞組“無(wú)上”,此時(shí)只要再擊一下“O“鍵,即可輸入“一本萬(wàn)利”。
如果輸入第四碼后提示行雖然出現(xiàn)了多字詞組,但并非所要輸入的多字詞組,則只要鍵入所要輸入的多字詞組第一個(gè)字的聲母即可輸入該詞組。例如欲輸入四字詞組“淵源流長(zhǎng)”,鍵入其前四位編碼“AAAJ”后,提示行出現(xiàn)的是“污泥濁水”一詞,此時(shí)只要接著鍵入“淵”字的聲母“Y”,即可輸入“淵源流長(zhǎng)”一詞。如果此時(shí)提示行出現(xiàn)的多字詞組的第一個(gè)字與所欲輸入的多字詞組的第一個(gè)字相同,則應(yīng)鍵入第二個(gè)字的聲母;如果此時(shí)提示行出現(xiàn)的多字詞組的前兩個(gè)字與所欲輸入的多字詞組的前兩個(gè)字均相同,則應(yīng)鍵入第三個(gè)字的聲母;例如輸入三字詞組“第二次”時(shí),當(dāng)鍵入其四位編碼“ZGHD”后,提示行出現(xiàn)了“1第一次”,此時(shí)接著鍵入“二”字的聲母“E”(虛擬聲母)即可輸入“第二次”。
采用以形碼為主的多字詞組的輸入方法,既可使多字詞組輸入與單個(gè)漢字和雙字詞組的輸入完全不會(huì)發(fā)生重碼,三字詞組與四字詞組之間也不會(huì)發(fā)生重碼,又可將三字詞組輸入和四字詞組的輸入本身相互發(fā)生的重碼減至幾乎為零(在編入的近萬(wàn)條多字詞組中僅見(jiàn)兩三個(gè)不能消除的重碼)。
本發(fā)明以音為主輸入漢字和以形為主輸入漢字兩者之間可通過(guò)轉(zhuǎn)換鍵任意切換,用戶可根據(jù)需要加以選擇。以音為主輸入漢字時(shí),遇到不會(huì)拼讀的字,可轉(zhuǎn)入以形為主輸入。反之,遇到以形為主輸入漢字不便時(shí),可轉(zhuǎn)入以音為主輸入。
權(quán)利要求
1.一種漢字編碼方法,尤其是音形結(jié)合的漢字編碼方法,其特征是,將漢字按其讀音拆分成聲母和韻母,并按字型結(jié)構(gòu)拆成漢字部件,使得每一漢字或詞組由聲母、韻母和/或漢字部件組拼而成,所述漢字部件包括整字字根部件、非整字字根部件和非字根整字部件,整字字根部件、非整字字根部件及其代碼如下
2.根據(jù)權(quán)利要求1所述的漢字編碼方法,其特征是,漢字拆成漢字部件的原則為(1)順序拆字、盡量取大;②先取優(yōu)先;(3)整字字根優(yōu)先;(4)交叉優(yōu)先。
3.根據(jù)權(quán)利要求2所述的漢字編碼方法,其特征是,漢字按聲母、韻母、漢字部件順序編碼(1)單字的編碼順序?yàn)槁暷?、韻母及作為識(shí)別碼的漢字部件;(2)兩字詞組的編碼順序?yàn)榈谝蛔值碾p拼編碼、第二字的雙拼編碼及作為識(shí)別碼的漢字部件;(3)三字詞組的編碼順序?yàn)槿衷~組識(shí)別碼、詞組各字的聲母及漢字部件;(4)四字及四字以上詞組編碼的順序?yàn)樗淖衷~組識(shí)別碼、詞組第一、二、三字及末字的聲母。
4.根據(jù)權(quán)利要求2所述的編碼方法,其特征是,漢字按漢字字根部件、聲母、韻母順序編碼(1)單字的編碼為漢字字根部件和識(shí)別碼,識(shí)別碼取該字的聲母和韻母;(2)兩字詞組的編碼順序?yàn)榈谝蛔值氖撞考?、第二部件和第二字的首部件、第二部件及第一或第二字的聲母?3)三字詞組的編碼順序?yàn)榈谝蛔值氖撞考?、第二部件和第二、三字的首部件及三字詞組識(shí)別碼;(4)四字及四字以上詞組的編碼順序取第一、二、三字和末字的首部件及四字詞組識(shí)別碼或該詞組第一個(gè)字的聲母。
5.根據(jù)權(quán)利要求3或4所述的編碼方法,其特征是數(shù)字符號(hào)、標(biāo)點(diǎn)符號(hào)、字根符號(hào)、日、俄文符號(hào)和其他特殊符號(hào)的編碼分別為“IZFH”、“BDFH、“ZGFH”、“RWFH”、“EWFH”和“TIFH”。
6.一種鍵盤(pán),包括“ABC……XYZ”二十六個(gè)英文字母鍵及空格鍵,其特征在于,漢字的聲母、韻母及字根部件的鍵位安排如下
其中,“A”鍵和“O”鍵分別為三字詞組和四字及四字以上詞組的識(shí)別碼。
全文摘要
本發(fā)明涉及漢字編碼法,尤其是音形結(jié)合的漢字編碼法及其鍵盤(pán)。本發(fā)明將漢字的聲母、韻母及漢字部件作為基本碼元,并采用若干識(shí)別碼來(lái)減少重碼,將漢字字根在鍵盤(pán)上的定義排列盡可能地兼顧了在每個(gè)鍵位上所容納的漢字和詞組的均衡性,因而能夠?qū)崿F(xiàn)在編入國(guó)際一、二級(jí)漢字庫(kù)的6763個(gè)漢字以及35000多條常用詞組的情況下,其單個(gè)漢字和詞組輸入的絕對(duì)重碼率降低到1‰以下。因此,本發(fā)明不僅編入詞組多而且重碼率低,漢字輸入速度快。
文檔編號(hào)G06F3/023GK1152740SQ96102150
公開(kāi)日1997年6月25日 申請(qǐng)日期1996年2月14日 優(yōu)先權(quán)日1996年2月14日
發(fā)明者汪爭(zhēng)平 申請(qǐng)人:汪爭(zhēng)平
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
南京市| 平凉市| 吕梁市| 泗水县| 龙海市| 阳谷县| 通江县| 阳新县| 四川省| 连平县| 清镇市| 尚志市| 若尔盖县| 壤塘县| 恩施市| 衡山县| 钦州市| 湖口县| 如东县| 平安县| 阿拉尔市| 循化| 嘉禾县| 宽城| 肃南| 南和县| 曲沃县| 河北区| 瓦房店市| 鹤岗市| 台北市| 民县| 夹江县| 原平市| 平舆县| 叶城县| 尼玛县| 中超| 江北区| 商水县| 龙井市|