專利名稱::甲骨文拼音與部件拆分輸入法的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種用于電子計算機的甲骨文字輸入法。
背景技術(shù):
:目前己經(jīng)出現(xiàn)的甲骨文輸入法方案有以下三種(1)"古文字三級字符全拼檢索法"(劉志基,《辭書研究》2002年第1期)。該編碼方案將甲骨文部件分為基本字符、物象字符、幾何圖形字符?;咀址喈斢趥鹘y(tǒng)的偏旁、部首;物象字符是描摹事物形象類別的構(gòu)字成分,字形中有取象于鳥的成分,則拆分出的物象字符編碼為"niaoxing";基本字符和物象字符之外的構(gòu)字成分作為幾何圖形字符,字形中有圓形構(gòu)字成分,則拆分出的幾何圖形字符編碼為"yuan"。此種編碼方法思路可嘉,但是對每一部件都要判斷所屬字符類別,規(guī)則繁多,很不簡便,編碼過長,如有的字形編碼為"zhenglirenshang",使用起來很不方便。(2)"之乎者也"一一對應數(shù)象甲骨文金文輸入法(專利申請?zhí)?00310114032.6)。該編碼方案以字形任意筆畫形成的交點、接點、折點、重合點及封閉空間為單位,歸納為"之乎者也唯其同兮由于"十個字象系列。按次序?qū)谕ㄓ面I盤及數(shù)字鍵盤上,以等同的字象數(shù)序編碼。該編碼方案需要對甲骨文字形進行仔細分析,區(qū)分甲骨文字形的結(jié)構(gòu),甲骨文字形在微觀上筆畫無法區(qū)分這一局限,使得該方案可操作性不強。該方案規(guī)則也很多,記憶負擔也是很大的。該方案沒有甲骨文字庫平臺的支撐,其性能不得而知。(3)甲骨文電腦輸入法(專利申請?zhí)?200510004998.3)。該編碼方案將甲骨文字形分析為三類結(jié)構(gòu)封閉曲線結(jié)構(gòu)、交叉線段結(jié)構(gòu)、飄離曲線或點結(jié)構(gòu)。根據(jù)結(jié)構(gòu)的不同分為眼碼、睫碼、葉碼、枝碼、飄碼、結(jié)構(gòu)碼。對字形進行結(jié)構(gòu)分析后順序?qū)懗錾鲜隽a就得出甲骨文字形的編碼序列。比如的編碼為001201。此種編碼方案編碼時需要對甲骨文字形仔細分析筆畫之間的組合關(guān)系,方案中各碼之間容易混淆,不易區(qū)分,并且該方案碼長為6,每一個字形均須分析各類碼是否存在,效率低。該方案也沒有規(guī)范完整的甲骨文字庫平臺的支撐。
發(fā)明內(nèi)容本發(fā)明的目的是要提供一種甲骨文拼音與部件拆分輸入法,該方法編碼短,效率高,使用方便。本發(fā)明的目的是這樣實現(xiàn)的該輸入法包括拼音組字和拼形組字,拼音組字采用全拼式拼音輸入法,拼形組字是將甲骨文字歸納出569個部件,將得到的部件與鍵盤上的26個英文字母建立映射關(guān)系以便進行拆分取碼,形成拼形組字的甲骨文字輸入編碼。所述的拼音組字是將甲骨文字的拼音字母與鍵盤上的英文字母對應起來,形成拼音輸入的編碼序列。所述的拼形組字是按照從左到右、從上到下及從外到內(nèi)的順序?qū)坠俏淖诌M行拆分取碼。所述的拆分取碼是取甲骨文字的第一、二、三、末碼作為字形的輸入碼,不足四碼的以空格鍵結(jié)束。所述的部件包括形似英文字母部件,形似英文字母部件與相應的英文字母建立映射關(guān)系。所述的輸入編碼中的字符為26個英文字母,含有l(wèi)、2、3、4個字母的編碼序列分別稱為一級簡碼、二級簡碼、三級簡碼、四級簡碼。所述的輸入法還包括甲骨文字庫,甲骨文字庫使用的是采用二次貝塞爾曲線技術(shù)生成的TrueType格式甲骨文字庫,采用國際標準Unicode編碼,使用的Unicode編碼空間為自定義區(qū)(PrivateUseArea,E000-F9FF),在生成甲骨文字庫擬合甲骨文字形的過程中,使用二次貝塞爾曲線來擬合甲骨文字形,通過對緩慢彎曲的較長曲線增加額外控制點的方法提高了字形擬合的精度,字庫包括可識讀音和意義的甲骨文字形,同時包括未識讀音和意義的甲骨文字形。所述的編碼序列和甲骨文字庫中的字形序號形成拼音碼表和拼形碼表,拼音碼表的格式-〈甲骨文字拼音序列xTab鍵x字形序號[〈Tab鍵>字形序號]>,拼形碼表的格式4斥分部件對應的字母序列xTab鍵x字形序號卜Tab鍵>字形序號]>。所述的569個甲骨文部件與英文字母映射關(guān)系是-,部件<table>tableseeoriginaldocumentpage5</column></row><table><table>tableseeoriginaldocumentpage6</column></row><table>本發(fā)明優(yōu)點:1.使用拼音,簡捷方便。對于甲骨文中可以知道讀音的字形,直接輸入拼音就可以把字形的所有異體字從甲骨文字庫中調(diào)出來。這樣,可識讀音的字形就具備了兩種輸入方法——拼音輸入和拆分取碼輸入。拼音方案是最自然、最易于為大眾接受的編碼方案,甲骨文中可識讀音的字形占20%以上。對于甲骨文知識的普及教學、平面藝術(shù)設計及一般出版物的排版等方面的普通用戶來說,使用拼音是最自然的選擇。目前已出現(xiàn)的其他方案都未能對甲骨文的讀音信息加以利用。對于不知道讀音的字形,可以按照甲骨文字形的拓樸結(jié)構(gòu),利用甲骨文部件象形的特點通過拆分出部件來編碼輸入。對于從事甲骨文學術(shù)研究的科研人員等高級用戶來說,由于這部分用戶由于對甲骨文字形具有一定的了解,熟悉甲骨文字形的結(jié)構(gòu),因而采用拆分輸入方法是可行的,記住一些編碼規(guī)則也是可能的和必要的。由于利用了甲骨文部件象形的特點,甲骨文部件與鍵盤字母之間存在很強的相似性,關(guān)聯(lián)性強,大大減輕了記憶負擔。"古文字三級字符全拼檢索法"需要對每一部件都要判斷所屬字符類別,規(guī)則繁多,很不簡便,編碼過長,如有的字形編碼為"zhenglirenshang",使用起來很不方便。"之乎者也"一一對應數(shù)象甲骨文金文輸入法(專利申請?zhí)?00310114032.6)需要對甲骨文字形進行仔細分析,區(qū)分甲骨文字形的細微結(jié)構(gòu),甲骨文字形在微觀上筆畫無法區(qū)分這一局限,使得該方案可操作性不強,也沒有利用甲骨文部件象形的特點來減輕記憶負擔。該方案規(guī)則也很多,記憶負擔也是很大的。甲骨文電腦輸入法(專利申請?zhí)?00510004998.3)需要對甲骨文字形仔細分析筆畫之間的組合關(guān)系,方案中各碼之間容易混淆,不易區(qū)分,并且該方案碼長為6,每一個字形均須分析各類碼是否存在,效率低。3.碼符集為26個英文字母,設計了一級簡碼、二級簡碼、三級簡碼、四級簡碼,平均碼長短,接近3。"古文字三級字符全拼檢索法"中,有的字形編碼為"zhenglirenshang",編碼過長,使用起來很不方便。甲骨文電腦輸入法(專利申請?zhí)?00510004998.3)中對每個字形的編碼碼長為6,也是很長的。4.具備自主開發(fā)的規(guī)范完整的TrueType格式甲骨文字庫的支撐平臺,實用性強。目前出現(xiàn)的其他甲骨文輸入方案,均不具備規(guī)范完整的甲骨文字庫平臺的支撐,即使有的輸入法方案制作了樣本字庫,也只是部分甲骨文字形,使用的字形擬合軟件也存在著明顯的局限性,無法準確擬合具備獨特特征的甲骨文字形,因此,只能是一種設計、設想而己,其性能不得而知,實用價值也不大。本發(fā)明無論是在電腦屏幕上顯示,還是打印輸出,都非常地方便,實現(xiàn)了所見即所得。圖1是本發(fā)明實施例的拼音組字的鍵盤示意圖。圖2是本發(fā)明實施例的拼形組字的鍵盤示意圖。具體實施方式在圖1中,拼音組字采用全拼式拼音輸入法,它是將甲骨文字的拼音字母A-Z與鍵盤上的26英文字母A-Z—一對應起來,形成拼音輸入的編碼序列。拼音碼表的格式如下〈甲骨文字拼音序列xTab鍵x字形序號卜Tab鍵>字形序號]>例如da01972386dan11403846dang20552255dao24763132de1918拼音方案是最自然、最易于為大眾所接受的編碼方案。據(jù)統(tǒng)計,甲骨文中可識讀音的字形占20%以上。對于這類可識讀音和意義的常用甲骨文字形,在甲骨文知識的普及教學、平面藝術(shù)設計及一般出版物的排版等方面用途較廣,在這些使用領(lǐng)域?qū)坠俏膬?nèi)部結(jié)構(gòu)的研究無需任何要求,但輸入方案要簡便易用。因此無需記住一些繁瑣的規(guī)則,可以采用拼音輸入的方法。在Word文檔中,當我們在電腦上切入到甲骨文輸入法的的拼音輸入方法時,屏幕上即可輸入、顯示甲骨文,并能隨意排版。非常適合于對易用性要求很高的普通用戶使用。在圖2中,拼形組字是將甲骨文字歸納出569個部件,將得到的部件與鍵盤上的26個英文字母建立映射關(guān)系以便進行拆分取碼,形成拼形組字的甲骨文字輸入編碼。拼形組字是按照從左到右、從上到下及從外到內(nèi)的順序?qū)坠俏淖诌M行拆分取碼。拆分取碼是取甲骨文字的第一、二、三、末碼作為字形的輸入碼,不足四碼的以空格鍵結(jié)束。部件包括形似英文字母部件,形似英文字母部件與相應的英文字母建立映射關(guān)系。輸入編碼中的字符為26個英文字母,含有l(wèi)、2、3、4個字母的編碼序列分別稱為一級簡碼、二級簡碼、三級簡碼、四級簡碼。輸入法字庫使用的是采用二次貝塞爾曲線技術(shù)生成的TrueType格式甲骨文字庫,采用國際標準Unicode編碼,使用的Unicode編碼空間為自定義區(qū)(PrivateUseArea,E000-F9FF),在生成甲骨文字庫擬合甲骨文字形的過程中,使用二次貝塞爾曲線來擬合甲骨文字形,通過對緩慢彎曲的較長曲線增加額外控制點的方法提高了字形擬合的精度,字庫包括可識讀音和意義的甲骨文字形,同時包括未識讀音和意義的甲骨文字形。拼形碼表的格式如下〈拆分部件對應的字母序列xTab鍵x字形序號[〈Tab鍵>字形序號]>例如U20362247351235343549UA012008100812UAAD2900UACD2104UAD2255對于甲骨文中可以知道讀音的字形可以通過兩種方法輸入第一種方法是直接利用拼音作為其輸入編碼,通過拼音可以把具有該讀音的所有字形包括異體字從字庫中調(diào)出來;第二種方法是通過拆分的方法。比如,甲骨文字形"ir',讀音為fii,輸入拼音"fii",則可以把包括"ir'在內(nèi)的所有讀音為"fU"的字形從甲骨文字庫中調(diào)出來。對于甲骨文知識的一般教學、平面設計領(lǐng)域的藝術(shù)字體設計等一般用戶來說,使用簡便,無需培訓。同時,還可以使用拆分的方法來輸入,甲骨文字形"為左右結(jié)構(gòu),由部件i和^構(gòu)成,分別對應碼元F、D,輸入編碼即為FD。對于不知道讀音的甲骨文字形可以采取拆分的方法。(l)對于無法分析出結(jié)構(gòu),難以拆分出部件的字形,這類字通常都是象形的獨體字,例如要輸入甲骨文字形"D"時,該字形似大寫英文字母d,是一級簡碼,對應的鍵位是d鍵,那么其輸入編碼即為d。(2)對于那些可以分析出結(jié)構(gòu),可以拆分出部件的字形,拆分出的部件數(shù)在四個以內(nèi)的,取第一、二、三、四部件對應的編碼作為該字形的輸入編碼。不足四碼的以空格結(jié)束。例如要輸入甲骨文字形"t",該字形為左右結(jié)構(gòu),按照從左到右的順序,可以拆分出"1"、"V'等部件,所對應的鍵位是g、x,它的輸入碼即為gx。又如要輸入甲骨文字形"!S",該字形可以拆分為"X"、"X"、""、"l人"等4個部件,這四個部件所對應的鍵位是x、x、q、p,其輸入編碼即為xxqp。(3)對于那些可以分析出結(jié)構(gòu),可以拆分出部件的字形,而且拆分出的部件超出四個以上的,則取第一、二、三、末碼構(gòu)成該字形的輸入編碼。例如要輸入甲骨文字形"針",可以拆分出"『、"爭',、"》"、"::"、"2"等五個部件,分別對應的碼元為c、e、x、h、s,取第一、二、三、末碼,編碼序列為cexs。權(quán)利要求1.一種甲骨文拼音與部件拆分輸入法,其特征是該輸入法包括拼音組字和拼形組字,拼音組字采用全拼式拼音輸入法,拼形組字是將甲骨文字歸納出569個部件,將得到的部件與鍵盤上的26個英文字母建立映射關(guān)系以便進行拆分取碼,形成拼形組字的甲骨文字輸入編碼。2.根據(jù)權(quán)利要求1所述的甲骨文拼音與部件拆分輸入法,其特征是拼音組字是將甲骨文字的拼音字母與鍵盤上的英文字母對應起來,形成拼音輸入的編碼序列。3.根據(jù)權(quán)利要求1所述的甲骨文拼音與部件拆分輸入法,其特征是拼形組字是按照從左到右、從上到下及從外到內(nèi)的順序?qū)坠俏淖诌M行拆分取碼。4.根據(jù)權(quán)利要求1所述的甲骨文拼音與部件拆分輸入法,其特征是拆分取碼是取甲骨文字的第一、二、三、末碼作為字形的輸入碼,不足四碼的以空格鍵結(jié)束。5.根據(jù)權(quán)利要求1所述的甲骨文拼音與部件拆分輸入法,其特征是部件包括形似英文字母部件,形似英文字母部件與相應的英文字母建立映射關(guān)系。6.根據(jù)權(quán)利要求1所述的甲骨文拼音與部件拆分輸入法,其特征是輸入編碼中的字符為26個英文字母,含有l(wèi)、2、3、4個字母的編碼序列分別稱為一級簡碼、二級簡碼、三級簡碼、四級簡碼。7.根據(jù)權(quán)利要求1所述的甲骨文拼音與部件拆分輸入法,其特征是該輸入法還包括甲骨文字庫,甲骨文字庫使用的是采用二次貝塞爾曲線技術(shù)生成的TrueType格式甲骨文字庫,采用國際標準Unicode編碼,使用的Unicode編碼空間為自定義區(qū),字庫包括可識讀音和意義的甲骨文字形,同時包括未識讀音和意義的甲骨文字形。8.根據(jù)權(quán)利要求6所述的甲骨文拼音與部件拆分輸入法,其特征是編碼序列和甲骨文字庫中的字形序號形成拼音碼表和拼形碼表,拼音碼表的格式〈甲骨文字拼音序列xTab鍵x字形序號KTab鍵>字形序號]>,拼形碼表的格式〈拆分部件對應的字母序列xTab鍵x字形序號KTab鍵>字形序號]>。9.根據(jù)權(quán)利要求l所述的甲骨文拼音與部件拆分輸入法,其特征是569個甲骨文部件與英文字母映射關(guān)系是<table>tableseeoriginaldocumentpage2</column></row><table><table>tableseeoriginaldocumentpage3</column></row><table>全文摘要本發(fā)明公開了一種用于電子計算機甲骨文字輸入的甲骨文拼音與部件拆分輸入法,該輸入法包括拼音組字和拼形組字,拼音組字采用全拼式拼音輸入法,拼形組字是將甲骨文字歸納出569個部件,將得到的部件與鍵盤上的26個英文字母建立映射關(guān)系以便進行拆分取碼,形成拼形組字的甲骨文字輸入編碼。拼音簡捷方便;拆分直觀,規(guī)則簡單。甲骨文部件與鍵盤字母之間存在很強的相似性,關(guān)聯(lián)性強,大大減輕了記憶負擔。碼符集為26個英文字母,設計了一級簡碼、二級簡碼、三級簡碼、四級簡碼,平均碼長短接近3。規(guī)范完整的TrueType格式甲骨文字庫的支撐平臺,實用性強。顯示與打印輸出非常方便,實現(xiàn)了所見即所得。文檔編號G06F3/023GK101231558SQ200810049218公開日2008年7月30日申請日期2008年1月31日優(yōu)先權(quán)日2008年1月31日發(fā)明者楊亦鳴,顧紹通,馬小虎申請人:徐州師范大學