两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

京韻漢字輸入法的制作方法

文檔序號:6417508閱讀:279來源:國知局

專利名稱::京韻漢字輸入法的制作方法
技術領域
:本發(fā)明涉及我國計算機漢字信息處理方法,更具體說,是涉及到鍵盤漢字輸入及語音識別技術輸入的方法。據(jù)本
技術領域
專業(yè)人員所共知,當前國內(nèi)研制成功的鍵盤漢字輸入方法已有近千種。按照漢字屬性的不同,可分為音碼、形碼、音形碼和數(shù)碼四種類型。這些編碼各有其長處和短處。除去編碼無規(guī)律、難記憶的老式電報數(shù)碼之外,其它各種編碼皆存在一個共同的缺點,就是重碼和速度問題,也就是我國計算機漢字輸入長期以來文字信息處理存在的一個“瓶頸”問題。由于這個“瓶頸”的存在,不僅鍵盤不能像英語那樣用26個拉丁字母直接輸入,重碼不能根絕,嚴重影響輸入的速度,特別是新興語音輸入識別技術,由于缺乏普通話漢字聲、韻、調(diào)全息音素聲學建?;?,搜索聲音轉換數(shù)字編碼過程比較模糊,合成的語音難以達到百分之百的識別率。說到底,還是方塊漢字字形結構復雜,不能表音,特別是同音字多,又沒有一個與漢字功能相等的科學傳遞信息來代替,自從百年前電報技術問世以來就出現(xiàn)這個“瓶頸”問題,所以叫“百年瓶頸”。清末民初年間,國難日甚,多少志士仁人面對列強的欺凌,在尋求救國救民的道路上首先把矛頭指向方塊漢字,魯迅說“漢字和大眾,是勢不兩立的。”“漢字也是中國勞苦大眾身上的一個結核,倘不除去它,結果只有自己死”(引自魯迅全集《且介亭雜文》)。當時語音文字學家和多少革新者都在紛紛研討制訂文字改革方案,那勢頭不下于現(xiàn)在的“萬碼奔騰”。但其結果是以王照、勞乃宣為代表研制的民族形式漢字偏旁的千百種拼音文字方案,到《國語注音字母》公布之日而告終;以趙元任創(chuàng)制的《國語羅馬字》為代表的各種拉丁字母拼音文字方案,至《漢語拼音方案》的推行而結束。六十年前魯迅55歲死于結核,半個多世紀以來,方塊漢字的貴體雖被革新勢力沖擊得支離破碎,至今猶存。歷史證明,以上試圖用改革方塊漢字的辦法解決“百年瓶頸”的問題,都失敗了。所以,“瓶頸”依然健在。不過,歷史走過的曲折道路,前人用血汗換取的經(jīng)驗教訓,那是一筆寶貴財富。針對上述問題,本發(fā)明人深知要徹底解決這種問題,不可急功近利只憑一時心血之來潮。因此,本人為突破“瓶頸”致力于斯事已五十余載,畢生欲完成的一個任務就是要創(chuàng)制出一種“和漢字功能完全相等的傳遞信息載體與它溝通交替,使它如同英文一樣得心應手的為中國人服務”,簡稱為“漢字等值載體”,這是“漢語言文字”領域里的一個最新理論,也是半個世紀以來,本發(fā)明人研制《京韻漢字》的基本原則。在“漢字等值載體”路標的指引下,分別解決漢語同音字的單字拼音字形,徹底消除產(chǎn)生“瓶頸“的根源,使中國的漢字鍵盤輸入和語音識別輸入,在綜合技術性能和輸入速度上,都要超過世界先進水平。其目的就是要真正鋪設起中國式“新世紀的信息高速公路!”為達到上述目的,本發(fā)明根據(jù)方塊漢字字形字義的特點及其音素特性,用國際音標分析漢語普通話的內(nèi)涵音值,對國際通用的26個拉丁字母重新定音賦值,共發(fā)明了175個特定功能賦值的新字母,并接納歷代前人創(chuàng)制的各種《漢語拼音方案》的血汗結晶,據(jù)以分別編制出聲母表、韻母表、聲調(diào)符號(簡稱聲符)表,繼以“漢字等值載體”為造字法則,共造出以北京語音為標準音的10000余個聲、韻、調(diào)具備的全息拼音單字,定名為《拉丁字母北京聲、韻、調(diào)全息切音漢字》,簡稱《京韻漢字》。京韻漢字的單字,最多用四個字母組成,10000余個單字每字平均3、8個字母,比世界各國用拉丁字母組合的文字拼式都短。京韻漢字作為計算機輸入法,在當前千百種漢字輸入法中,它是唯一使用拼音文字作“編碼”的漢字輸入方法。因為京韻漢字和方塊漢字是一一對應的,所以制定出的《京韻漢字鍵盤輸入法》絕無重碼。它和《漢語拼音輸入法》相似,易學、易用,適用于一切國際通用的鍵盤和操作系統(tǒng),與漢語拼音最大的區(qū)別就是根除了重碼。其中有2066個常用字和漢語拼音的聲、韻母完全相同,學過漢語拼音人,一看就會,比學形碼容易得多,只要熟悉了這些常用字,鍵盤操作就能像使用英文一樣閉目盲打,輸入速度已經(jīng)超過世界先進水平;因為京韻漢字和方塊漢字不僅僅是一一對應的,它對有些漢字的一形多音字,像一、七、八、不、啊等,在說話當中經(jīng)常發(fā)生變韻變調(diào)的多音字,都要分別設置字形。這樣,把漢語普通話的音變數(shù)值盡可能準確地定位包容在每一個京韻漢字之中,使用10000余個聲、韻、調(diào)具備的全息京韻漢字編制出的《京韻漢字聲、韻、調(diào)全息語音輸入識別法》——附圖是《京韻漢字輸入語音技術流程圖》,和英語輸入識別法相比,因為京韻漢字拼式短,對語言音素兼容性強,在綜合技術性能及輸入速度上,都已超過他們。京韻漢字的三種表格是一、聲母表以上聲母表內(nèi)共有141個聲母(其中國標3755個常用字聲母61個,不常用字聲母80個)。常用字聲母共有九種類型,分別說明如下——(一)單一直拼聲母b、p、m、f、d、t、n、l、g、k、h、w、z、c、s、r,共16個。這16個聲母,和漢語拼音聲母的發(fā)音完全一樣。(二)特定音節(jié)聲母zh、zk、hc、kc、hs、ks,共6個。這6個聲母,其中“zh、ch、sh”是漢語拼音中原有的特定音節(jié)聲母,新增加的“zk、ck、sk”三個和原有三個聲母的發(fā)音完全一樣。(三)韻頭母v,只此一個。此字母除在京韻漢字組合單字時起隔音作用之外,在韻母表中還兼替《漢語拼音韻母》的“eng”,它的功能和兩用字母“n”有些相似。(四)單一含介聲母j、q、x、y,共4個。j、q、x、y=ji、qi、xi、yi。前面4個單一聲母內(nèi)各自包含一個特定賦值的介母“i”,所以叫做單一含介聲母。“i、u、ü”在韻母表中是韻母又叫介母?!敖槟浮奔唇橛诼暷负晚嵞钢g起橋梁作用的字母。以下幾種皆歸類于雙拼音節(jié)聲母(五)直拼借介聲母fw、fx、ll、lw、ww、hw、qw、yw,共8個?!敖杞椤奔匆罁?jù)于原漢語拼音聲母,再增加一個非介母的字母來代替介母“i”或“u”的音值,與其直接拼合,組成一個音節(jié),例如“fw(夫)”。(六)特定借介聲母hz、kz、hc、kc、hs、ks,共6個。由“zh、zk、ch、ck、sh、sk”6個特定音節(jié)聲母反其道演變而來的,把借來的介母“u”包含在其中,就變成“朱hz、kz、出hc、kc、叔hs、ks”。(七)特定借介含韻聲母nz、lz、zl、gz、kl、hl、lh、jz、jc,共9個。這9個雙拼聲母,和第五種的8個直拼借介聲母有相似之處,所不同的,是這9個雙拼音節(jié)除依據(jù)原漢語拼音聲母,再加一個非介母的字母來代替介母“i”或“u”的音值以外,還要增加一個韻母“a”的音值,即兩個字母包含三個音素。它們的音節(jié)形式就是“娘nz、倆lz、zl、瓜gz、夸kl、花hl、lh、加jz、jc”。(八)特定擬聲借介含韻聲母tl、lt、th、dl、ld、dh、bl、lb、bk,共9個。這9個雙拼音節(jié)聲母和其它雙拼音節(jié)聲母不同之處,就在于其它雙拼音節(jié)聲母,都和原《漢語拼音》的聲母有關連,而它們的拼式及音值皆是特別擬定出來賦予的,和原《漢語拼音》的音、形基本無關。這些特別擬定的雙拼音節(jié)聲母,其中除有一個聲母之外,還有一個韻母“a”,或者還有一個介母“u”再加一個韻母“a”,即兩個字母包含兩個或三個音素。它們的全息讀音形式就是“扎tl、lt,插dl、ld,殺bl、lb,抓th,揣dh,刷bk”。(九)反切借介聲母wl、xl,共2個。這兩個聲母和其它雙拼音節(jié)不同之處,就是依據(jù)原漢語拼音聲母的“l(fā)(勒)”,再借一個字母代售介母“ü”的音值,朝相反的方向拼切,就變成“wl、xl呂”?!皐”是《漢語拼音》中的韻頭母“w(u烏)”,“x”是《國語注音符號》中的介母“ㄨ(烏)”,京韻漢字韻母表的“u與ü”相通,二者都和原《漢語拼音》有關連。(十)以上第(七)種特定借介含韻聲母中的“zl(倆)”,也是反切聲母,只是它借來的字母“z”和該音節(jié)的介母“ia”的音值無關,“ia”的音值是特定賦予的,所以叫特定借介含韻聲母。二、韻母表<p>以上韻母表內(nèi)共有56個韻母,其中除“a、o、e、i、r、u、n、v”8平單一韻母外,其余48個皆是復合韻母,復合韻母最多由兩個字母組成。分別說明如下(一)韻母表中“★eng”格內(nèi)的“ev、v”兩個韻母和其它格內(nèi)多形同音韻母一樣,音值彼此相等,相當于注音字母的“ㄥ”,是“亨(ㄏㄥ)”聲字的韻母。(二)“r”在聲母表中發(fā)“日”音,在韻母表中和“i”的音值相等,“i”格內(nèi)的“ii、ir、ri、rr”四個復合韻母也和“i”的音值相等。(三)“a*、o*”和“ia*、ra*……”等13個帶“*”符號的復合韻母是變音韻母,在一定的環(huán)境中不發(fā)本音而發(fā)該韻母下邊括號()內(nèi)的標音,例如(1)“a*”出現(xiàn)在“dw、jw、qw、xw、yw”復合聲母后面時不發(fā)“a啊”音而發(fā)“an安”音,如“煅dwap、雋jwap、圈qwas、泫xwap、轅ywah”等;“o*”由現(xiàn)在“hz、kz、hc、kc、hs、ks”后面時,發(fā)“ou”音,如“周hzos、仇hcok、收hsoc”等。(2)“ia*、ra*”出現(xiàn)在“b、p、m、d、t、n、l”聲母后面時不發(fā)“ia鴉”音而發(fā)“ian煙”音,如“邊biac、篇pias、眠miah、典diaj、天tiac、年niah、連liah”等。(3)“ua*、oa*”出現(xiàn)在“d、t、n、l、j、q、x、y、z、c、s、r”聲母后面時,不發(fā)“ua蛙”音而發(fā)“彎uan或冤üan”音,如“端duac、團tuah、暖nuaz、巒luah、捐juac、圈quas、宣xuas、冤yuaw、鉆zuap、汆cuac、酸suac、軟ruaz”等。(四)“eu”和“ü”音值相等,在一定的環(huán)境中變音,當“uo、ue、oe、un、on、uv、ov”結合韻母的現(xiàn)在“j、q、x、y”聲母后面時即以“u”代替“ü”,例如“絕juok、缺quec、鉞yoep、群qunh、峻jomp兇xuvs、雍yovc”等?!盀鮱”格內(nèi)的介母“u”及重疊介母“uu”與括號()內(nèi)的介母“ü”及重疊介母“üü”的音值相等,在上例一定環(huán)境中以“u、uu”代替“ü、üü”。三、聲符表聲符表內(nèi)共有18個聲調(diào)符號,在組合京韻漢字時,分別把它們拼寫在單字韻母的后面,它們是表達《京韻漢字四聲》和精確描寫京韻漢語語音字調(diào)的主要手段,和聲母、韻母一樣,是京韻漢字的重要組成部分。作為京韻漢字鍵盤編碼及語音識別編碼輸入法,又是區(qū)別同音字形,杜絕重碼,提高識別率,加快輸入速度的根本辦法。第一聲(陰平)用“c、s、w、x、m”五個字母,形狀短平居中都在一個水平線上,代表一聲“-”高平始終一致的字調(diào)兒。五度制相對調(diào)值是55,樂譜音階調(diào)值是i.7,例字如“baoc包”。第二聲(陽平)用“h、k、b、d、l”五個字母,形狀居中向上,代表二聲“′”抑揚高升抑暫揚久的字調(diào)兒。五度制相對調(diào)值是35,樂譜音階調(diào)值是5#1,例字如“baoh雹”。第三聲(上聲)因字數(shù)較少,只用“z、j、f”三個字母,體態(tài)彎轉,形狀曲折,代表三聲“ˇ”先降后升降久升暫的曲折字調(diào)幾。五度制相對調(diào)值是214,樂譜音階調(diào)值是326,例字如“baoz?!薄5谒穆?去聲)字數(shù)較多,也只能用“p、y、g、q、t”五個字母,形狀居中朝下,代表四聲“`”下降深遠的字調(diào),五度相對調(diào)值是51,樂譜音階調(diào)值是132,例字如“baop報”。以上三種表格內(nèi)特定功能賦值的拉丁字母,是創(chuàng)制京韻漢字的根椐,或者說是《京韻漢字輸入法編碼的碼源》?,F(xiàn)將《京韻漢字》的單字結構形式與《漢語拼音》的音節(jié)形式舉例對照說明如下</tables>從上表M聲字第五單元可以看出,這個同音字組里共有27個漢字,其中有13個是常用字、有14個是不常用字。13個常用字即;“貓maoc、貓maoh、毛maok、矛maob、錨maod、茅maol、卯maoz、鉚maoj、冒maop、貿(mào)maoy、茂maog、貌maoq、帽maot”。這13個常用字的聲母及韻母,和“漢語拼音”“muo”的聲母和韻母完全相同,二者只有一點差別,就是那個“貓”字的聲調(diào)符號不一樣,漢語拼音聲調(diào)符號“′”是在“á”的頭頂上,而京韻漢字則把“′”改成字母“h”移植到韻母“o”的后邊,就變成“maoh(貓)”的全息拼音單字。像這樣與漢語拼音拼式結構基本無差別的字形,在京韻漢字萬字表中只有2066個。當然,這2066個聲、韻、調(diào)具備的全息音素單字,比起漢語拼音的407個無聲調(diào)音節(jié)來,單是在數(shù)量上已經(jīng)增加了五倍,用鍵盤輸入可大大減少重碼,用于語音輸入可大大提高識別率。但是,要徹底解決“瓶頸”問題,這2066個單字還遠遠不夠。所以又產(chǎn)生了14個不常用字的字形旄mauh、髦mauk、蝥maub、蟊maud、茆maul、牦meoh、昴mauz、峁mauj、泖mauf、耄maup、懋mauy、瑁maug、袤mauq、瞀maut。這14個字形,和前面13個常用字的聲、韻只有一個字母不同,除去“meoh”之外,其它13個字的韻母是用的國際音標“au”,但還是不夠用,所以又產(chǎn)生了韻母“eo”,這就是《漢字等值載體思維演繹造字法則》,—直到滿足漢字語文領域的一切需要、徹底解決“瓶頸”問題為止。因為“瓶頸”不解決,中國人在語文信息處理上永遠不能翻身。當百年前世界上出現(xiàn)電報技術時,因漢字瓶頸障礙,中國多年不能應用;電子計算機1946年問世,中國13年之后造出計算機,又被瓶頸卡住。后來雖研制出千百種輸入法,因重碼障礙也提高不了速度?,F(xiàn)在搞出了智能聯(lián)想、詞組輸入等等,在速度方面所謂已經(jīng)趕上國際先進水平,可是語音輸入識別技術又為瓶頸攔阻。誰曉得將來世界上還會出現(xiàn)什么新花樣新技術——中國人不能永遠跟在別人屁股后面爬行。為此,本發(fā)明以“漢字等值載體”為準則,制作出的每個單字除去完全補償方塊漢字的功能之外,更把前人創(chuàng)制的音碼、形碼、音形碼、數(shù)碼等各種輸入法的成果全部繼承而熔鑄到京韻漢字之中,把方塊漢字創(chuàng)造的文化遺產(chǎn)全部繼承發(fā)揚,把它的缺點徹底克服,實現(xiàn)這個目的的手段,就是“拉丁字母漢字等值載體造字法則”。京韻漢字萬字表,其單字結構都在四個字母以下,如果再增加一位數(shù),使用五個字母結構,單字數(shù)量能增加幾倍,用于輸入法,可以滿足《全漢字集》的需要,可以滿足中國語言文字一切科學
技術領域
里的需要。權利要求1.一種京韻漢字輸入法,在當前千百種漢字輸入法中,它是唯一使用拼音文字“編碼”的漢字輸入方法。其特征在于,它是運用聲母表、韻母表、聲符表三種表格內(nèi)特定功能賦值的26個拉丁字母,根據(jù)方塊漢字字形字義的特點及其內(nèi)涵音值的特性,用國際音標分析漢語普通話的內(nèi)涵實際音素,共發(fā)明了175個特定功能賦值的新字母。繼以“漢字等值載體”為造字法則,所產(chǎn)生的國標6763——新華字典10000余個聲、韻、調(diào)具備的全息拼音漢字,乃是本發(fā)明的獨特產(chǎn)物及核心標識。(a)京韻漢字聲母表內(nèi)共有141個聲母,其中除去原《漢語拼音方案》中已公知的21個(即b、p、m、f、d、t、n、l、g、k、h、j、q、x、zh、ch、sh、r、z、c、s)聲母和2個(即y、w)韻頭母一共23個之外,其余118個新賦音值的聲母皆是本發(fā)明所獨創(chuàng)。118個新聲母,其中除“v”是重新賦值的單一字母外,其它117個都是特定音值的雙拼音節(jié)聲母,它們是bs、bw、bx、ps、pw、px、mc、ms、sm、mw、mx、mm、fw、fx、fm、wf、xf、mf、dc、dz、ds、dw、tc、tw、nz、ns、nw、lz、zl、lc、ll、ls、sl、lw、lx、lm、wl、xl、ml、gg、gz、gc、gw、gx、gm、wg、kc、kl、lk、kw、hd、hl、lh、hb、bh、hw、hx、hm、vc、vs、jz、jc、js、zj、cj、sj、jw、jx、qi、qz、qc、qw、qx、xz、xc、xw、yz、yc、ys、yw、yx、ym、zk、ck、sk、tl、lt、dl、ld、bl、lb、bt、ww、wx、wm、wz、wc、ws、th、ht、dt、dh、bk、zc、zs、cs、sc、hz、kz、hc、kc、sw、sx、hs、ks、rw、v.(b)京韻漢字韻母表內(nèi)共有56個韻母,其中除去原《漢語拼音方案》韻母表內(nèi)已公知的16個(即a、o、e、ai、ei、ao、ou、an、en、i、ia、ie、in、u、ua、uo)韻母之外,其余40個新賦音值的韻母皆是本發(fā)明所獨創(chuàng)。40個新韻母是ae、ar、ea、er、au、eo、oo、oo、aa、n、av、ee、ev、v、ii、ir、ri、rr、ra、io、ro、re、iu、ru、rn、iv、rv、uu(üü)oa、ue、oe、ui、ur、oi、or、un、on、uv、ov、eu(ü).(c)京韻漢字聲符表內(nèi)共有18個精確描寫京韻漢語字調(diào)的符號,完全是本發(fā)明所獨創(chuàng)。18個聲調(diào)符號是c、s、w、x、m、h、k、b、d、l、z、j、f、p、y、g、q、t.2.根據(jù)權利要求1所產(chǎn)生的6763——10000個京韻漢字而制作的,其特征在于絕無重碼的《京韻漢字鍵盤輸入法》。3.根據(jù)權利要求l、2所述而編制的,其特征在于,以漢語10000余個聲、韻、調(diào)具備的全息京韻漢字拼音單字為基元建模單位的,《京韻漢字語音輸入識別法》。全文摘要京韻漢字輸入法,在中國計算機輸入技術里,它是唯一使用拼音文字編碼的輸入方法。其特征是用國際音標分析漢字音素,對26個拉丁字母重新定音賦值,共創(chuàng)制出175個特定功能新字母,結合《漢語拼音方案》原有的39個聲、韻母,運用《漢字等值載體造字法則》,每個單字最多用四個字母,共組合成10000余個聲、韻、調(diào)具備的全息音素單字,用作《漢字鍵盤輸入法》,可根絕重碼,用作《輸入語音技術處理》,為達到百分之百的識別率創(chuàng)造了前提。上述兩項在綜合技術性能和輸入速度上,都超過世界先進水平。文檔編號G06F3/023GK1260531SQ9912665公開日2000年7月19日申請日期1999年12月23日優(yōu)先權日1999年12月23日發(fā)明者魏洪志申請人:魏洪志
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
海兴县| 鹿泉市| 海淀区| 南宁市| 杨浦区| 依安县| 贵阳市| 庆元县| 三河市| 恩平市| 临安市| 松原市| 巴彦县| 上思县| 松潘县| 蓝田县| 息烽县| 福州市| 泰兴市| 连州市| 尼勒克县| 云阳县| 西昌市| 渑池县| 泰兴市| 西城区| 临武县| 磴口县| 宁海县| 吕梁市| 衡水市| 灵山县| 买车| 南平市| 宝应县| 临颍县| 如东县| 马鞍山市| 锡林浩特市| 五家渠市| 天台县|