两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù)的制作方法

文檔序號(hào):6416544閱讀:1276來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)鍵盤(pán)輸入處理技術(shù)領(lǐng)域的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),尤其涉及漢語(yǔ)音節(jié)代碼及其字符和漢字代碼及其字符的鍵盤(pán)輸入。
現(xiàn)有的漢語(yǔ)信息處理系統(tǒng)如圖16所示,采用通用或?qū)S糜?jì)算機(jī)基本硬件及其DOS6.22中文版,UCDOS,SPDOS,Windows3.2/95/98中文版,Windows NT,外掛的中文之星,四通立方RichWin,以及COSA和COSIX等漢字操作系統(tǒng)10,在此基礎(chǔ)上(1).使用通用鍵盤(pán)裝置4,鍵盤(pán)輸入處理軟件8,實(shí)現(xiàn)漢字信息的鍵盤(pán)輸入處理;(2).使用顯示輸出處理軟件9,和顯示輸出設(shè)備7實(shí)現(xiàn)字符和圖形地顯示輸出處理;(3).使用圖形掃描輸入設(shè)備11,圖形字符處理軟件12實(shí)現(xiàn)字符和圖形的輸入處理;(4).使用打印輸出處理軟件13,和打印機(jī)類(lèi)輸出設(shè)備14,實(shí)現(xiàn)字符和圖形的打印輸出處理;(5).使用話筒等聲音輸入設(shè)備1,聲卡2的模擬/數(shù)字轉(zhuǎn)換器,“世音通”或IBM ViaVoice等漢語(yǔ)語(yǔ)音識(shí)別輸入軟件5,實(shí)現(xiàn)漢語(yǔ)語(yǔ)音識(shí)別輸入處理;(6).使用“天音話王”等漢語(yǔ)語(yǔ)音合成輸出軟件6,聲卡2的數(shù)字/模擬轉(zhuǎn)換器和聲音輸出設(shè)備3例如揚(yáng)聲器實(shí)現(xiàn)漢語(yǔ)語(yǔ)音合成輸出處理;(7).使用GB2312-80與BIG5碼相互轉(zhuǎn)換軟件15,或者BIG5與GB13000.1-93碼相互轉(zhuǎn)換軟件16,或者GB13000.1-93與其它漢字代碼相互轉(zhuǎn)換軟件17,實(shí)現(xiàn)不同代碼漢字的相互轉(zhuǎn)換處理,使用漢字與漢語(yǔ)拼音相互轉(zhuǎn)換軟件18實(shí)現(xiàn)漢字與漢語(yǔ)拼音的相互變換處理。從而分別在公知的大、中、小、微型、便攜、掌上型計(jì)算機(jī),數(shù)字助理,網(wǎng)絡(luò)計(jì)算機(jī)、終端機(jī)、工控機(jī)、單片機(jī)等各種計(jì)算機(jī),中外文打印機(jī)、字幕機(jī)、室內(nèi)外廣告顯示屏等文字處理設(shè)備,電報(bào)機(jī)、電傳機(jī)、網(wǎng)絡(luò)電話機(jī)等漢語(yǔ)通訊設(shè)備上,實(shí)現(xiàn)各種漢語(yǔ)信息的輸入輸出和相互變換處理。
其中的漢語(yǔ)鍵盤(pán)輸入處理,把要輸入的漢語(yǔ)音節(jié)符號(hào)和漢字詞語(yǔ)等漢語(yǔ)信息,分解為漢語(yǔ)拼音的聲母、韻母和聲調(diào),或注音符號(hào)的聲母,介母,韻母和聲調(diào)等輸入要素,附加或單獨(dú)使用漢字的筆畫(huà)、部件、字根、字義、字序等字形信息的輸入要素,相互合并和分組而成為輸入碼元,標(biāo)記或映射在普通鍵盤(pán)或?qū)S面I盤(pán)的輸入鍵位上,在漢字操作系統(tǒng)軟件10上運(yùn)行輸入字符與目標(biāo)漢語(yǔ)信息的對(duì)照轉(zhuǎn)換軟件,實(shí)現(xiàn)漢語(yǔ)信息的鍵盤(pán)輸入處理。
目前已有近千種漢字編碼輸入法問(wèn)世。其中全拼音輸入法應(yīng)用最廣,但輸入速度太慢;聲韻雙拼輸入法很受歡迎,但同音字太多、不認(rèn)識(shí)的字難以輸入,速度很難提高,鍵盤(pán)布局也難以統(tǒng)一;“WPS文字處理系統(tǒng)”的雙音雙拼輸入技術(shù),利用雙字詞輸入單字,簡(jiǎn)單易學(xué),但不認(rèn)識(shí)的字難以輸入。漢字鍵盤(pán)輸入公認(rèn)的世界記錄是由″聲數(shù)碼″于1992年創(chuàng)造的,簡(jiǎn)體連續(xù)文本的輸入速度達(dá)到每分鐘269.7字,其單字用漢字讀音的聲母,韻母,聲調(diào)和排序號(hào)選字輸入,非單字詞用聲韻雙拼或聲母編碼輸入,重碼較多,難以記憶,至今難以廣泛應(yīng)用;專(zhuān)業(yè)打字員使用″五筆字型輸入法″,一般人需要死記硬背幾個(gè)月才能達(dá)到每分鐘上百字的輸入速度,一旦不用又容易忘記,并且只能看著材料輸入,很難邊聽(tīng)邊輸入或邊寫(xiě)作邊輸入。香港和臺(tái)灣等地,則采用注音符號(hào)和技術(shù)水平與大陸相當(dāng)?shù)男未a編碼輸入法。計(jì)算機(jī)專(zhuān)業(yè)的華人主要使用英語(yǔ)操作計(jì)算機(jī)。因此,漢字鍵盤(pán)輸入是華人使用計(jì)算機(jī)的一個(gè)“瓶頸”式障礙,能夠快速輸入漢字的人很少,使計(jì)算機(jī)的普及和應(yīng)用受到限制。因此,社會(huì)上普遍存在著漢字輸入“好學(xué)的打不快、打得快的不好學(xué)”等技術(shù)偏見(jiàn)。其實(shí),這只是現(xiàn)有技術(shù)的概括和總結(jié)。
存在這些問(wèn)題的原因是,鍵盤(pán)輸入的目的只有漢字詞語(yǔ),忽略了漢語(yǔ)音節(jié)。漢語(yǔ)信息尤其是漢語(yǔ)音節(jié)信息的分析和研究沒(méi)有適應(yīng)漢語(yǔ)信息處理的發(fā)展需要。
法定《漢語(yǔ)拼音方案》的漢語(yǔ)音節(jié)由聲母、韻母和聲調(diào)組成,其雙拼為聲母+帶調(diào)韻母。聲母只有21個(gè),帶調(diào)韻母多達(dá)175個(gè),只區(qū)分四聲也有140個(gè),分別映射在最多47個(gè)字符鍵的普通鍵盤(pán)上,聲母偏少、韻母偏多,無(wú)法實(shí)現(xiàn)帶調(diào)雙拼輸入,只好改成聲母、韻母和聲調(diào)的三拼輸入方式,輸入漢語(yǔ)音節(jié)的編碼效率不足50%,三鍵一音不比平均三鍵一字的形碼輸入法效率高,所以通常采用聲韻雙拼。漢語(yǔ)注音符號(hào)的漢語(yǔ)音節(jié),由聲母,介母,韻母和聲調(diào)組成,其中介母和韻母組成《漢語(yǔ)拼音方案》的韻母,其余相類(lèi)似。總之,還沒(méi)有一種漢語(yǔ)語(yǔ)音方案在普通鍵盤(pán)上非常規(guī)范地實(shí)現(xiàn)帶調(diào)雙拼,并且支持漢語(yǔ)拼音化。這是一切以字音為基礎(chǔ)漢字編碼輸入法的局限性之根源。
形碼編碼輸入法經(jīng)過(guò)20多年的發(fā)展已經(jīng)很成熟,各種各樣的方法均有人進(jìn)行了嘗試。由于漢字的字根至少有600個(gè),漢字總數(shù)多達(dá)數(shù)萬(wàn)個(gè),組字規(guī)律千變?nèi)f化,分別映射在最多47個(gè)字符鍵的鍵盤(pán)上很難記憶。漢字信息主要是讀音其次才是字形,因此,所有的形碼編碼輸入法,單字的平均動(dòng)態(tài)碼長(zhǎng)均為3左右,很難再縮短,達(dá)到了極限,留給詞碼的編碼空間又很少,因此形碼的詞輸入并沒(méi)有優(yōu)勢(shì)。而且,大字符集給形碼增加了難度,″98規(guī)范王碼″不得不使用5個(gè)鍵輸入一個(gè)單字。
本發(fā)明人于1992年7月20日申請(qǐng),并于1994年2月2日公開(kāi)了“雙拼漢語(yǔ)編碼法及其鍵盤(pán)”(公開(kāi)號(hào)CN1081523A),提出一種在普通鍵盤(pán)上擊鍵兩次即可輸入一個(gè)漢語(yǔ)音節(jié),從而實(shí)現(xiàn)漢語(yǔ)信息帶調(diào)雙拼輸入的方案。但當(dāng)時(shí)只找出一種方案,輸入要素的選取及其鍵位布局很不合理,規(guī)律較少難以記憶,重碼較多。本發(fā)明人于1997年4月27日又提出″全息漢語(yǔ)輸入技術(shù)及其鍵盤(pán)和漢語(yǔ)計(jì)算機(jī)″(申請(qǐng)?zhí)?7110633.9)的專(zhuān)利申請(qǐng),并于1998年4月26日利用優(yōu)先權(quán)提出改進(jìn)的申請(qǐng)″漢語(yǔ)輸入技術(shù)及其漢語(yǔ)鍵盤(pán)和漢語(yǔ)計(jì)算機(jī)″(申請(qǐng)?zhí)?8107699.8)。本發(fā)明則是進(jìn)一步的改進(jìn)、創(chuàng)新、完善和提高。
1995年3月22日公開(kāi)的發(fā)明專(zhuān)利申請(qǐng)″新拼音漢字輸入法及其鍵盤(pán)設(shè)計(jì)″(公開(kāi)號(hào)為CN1100538A),用52個(gè)聲母及15個(gè)韻母拼寫(xiě)漢字,設(shè)計(jì)出44鍵的漢字輸入方案。其鍵盤(pán)設(shè)計(jì)不盡完善,同一個(gè)韻母i卻安排在不同的三列健位上,聲調(diào)的布局沒(méi)有考慮其實(shí)用頻度的差別,其輸入的目的也僅限于漢字。
《計(jì)算機(jī)研究與發(fā)展》1998年5月期刊登″大規(guī)模文本計(jì)算機(jī)音字相互轉(zhuǎn)換技術(shù)的研究″一文,提出一種基于統(tǒng)計(jì)和分析方法相結(jié)合語(yǔ)言理解模型的計(jì)算機(jī)自動(dòng)音字轉(zhuǎn)換技術(shù),已用于大詞表非特定人孤立詞語(yǔ)音識(shí)別系統(tǒng)和中文Windows95和98,Windows NT4.0的″微軟拼音輸入法″,使用英文字符組成拼音符號(hào)輸入,可用數(shù)字標(biāo)調(diào)。其實(shí)驗(yàn)測(cè)試的音字正確轉(zhuǎn)換率平均為不帶聲調(diào)88.5%,帶聲調(diào)94.7%。實(shí)際使用發(fā)現(xiàn),不區(qū)分聲調(diào)的轉(zhuǎn)換錯(cuò)誤較多難以容忍;區(qū)分聲調(diào)的轉(zhuǎn)換錯(cuò)誤明顯減少,比較實(shí)用,但輸入一個(gè)帶調(diào)音節(jié)至少擊鍵三次,沒(méi)有明顯的速度優(yōu)勢(shì)。
UCDOS等漢字軟件實(shí)現(xiàn)的智能拼音輸入技術(shù)比較成熟,其音節(jié)符號(hào)的鍵盤(pán)輸入也是聲韻雙拼和全拼,對(duì)于詞庫(kù)中沒(méi)有的詞或任意漢字的組合,可以智能動(dòng)態(tài)的生成新詞,再出現(xiàn)時(shí)可以按詞輸入。
總之,現(xiàn)有的漢字鍵盤(pán)輸入法問(wèn)題較多。受歡迎的技術(shù)有各種形碼的單字編碼輸入,能夠輸入不認(rèn)識(shí)的字;聲韻雙拼的詞輸入,按音輸入非常簡(jiǎn)單;雙音雙拼的詞帶單字輸入,無(wú)需記憶字根一學(xué)就會(huì);智能拼音的動(dòng)態(tài)造詞輸入,造詞方便;拼音/漢字智能轉(zhuǎn)換輸入,通用詞語(yǔ)的輸入快捷簡(jiǎn)單。這些方法各有其優(yōu)勢(shì),但尚未融合和統(tǒng)一。
現(xiàn)有的漢語(yǔ)語(yǔ)音合成輸出技術(shù),例如漢語(yǔ)聲卡,“天音話王”等,均是面向漢字的,沒(méi)有涉及漢語(yǔ)音節(jié)符號(hào)?,F(xiàn)有漢語(yǔ)語(yǔ)音識(shí)別輸入技術(shù),美國(guó)IBM公司的ViaVoice最具有代表性,已經(jīng)被多家公司采用,其識(shí)別的結(jié)果均為漢字字符,不支持漢語(yǔ)音節(jié)符號(hào)。對(duì)于識(shí)別不準(zhǔn)的給出首選漢字,不易和其它漢字相區(qū)別而難以事后校對(duì)和修改。
現(xiàn)有漢字字符的顯示輸出技術(shù),主要有DOS下16X16點(diǎn)陣的常規(guī)顯示、24X24點(diǎn)陣的特殊顯示,以及Windows下的所見(jiàn)即所得的漢字顯示。而漢語(yǔ)音節(jié)符號(hào)只限于漢語(yǔ)拼音符號(hào)等常規(guī)音節(jié)符號(hào)的顯示,實(shí)用價(jià)值有限。
現(xiàn)有的漢字字符的打印輸出,主要有點(diǎn)陣字形,矢量字形和Windows的Truetype字形等,漢語(yǔ)音節(jié)符號(hào)只限于漢語(yǔ)拼音符號(hào)等常規(guī)音節(jié)符號(hào)的打印輸出,實(shí)用價(jià)值也有限。
現(xiàn)有的手寫(xiě)體和印刷體漢字字符識(shí)別輸入技術(shù)比較成熟,如美國(guó)Motorola公司的″慧筆″手寫(xiě)體識(shí)別輸入,清華文通公司的″清華OCR″印刷體識(shí)別輸入等產(chǎn)品,但漢語(yǔ)音節(jié)符號(hào)的字符識(shí)別只限于漢語(yǔ)拼音符號(hào)或漢語(yǔ)注音符號(hào)等常規(guī)音節(jié)符號(hào)。
現(xiàn)有的漢語(yǔ)音節(jié)符號(hào)和漢字符號(hào)的相互變換處理,主要用于漢語(yǔ)語(yǔ)音識(shí)別輸入,如美國(guó)IBM公司的ViaVoice軟件;或語(yǔ)音合成輸出,如中國(guó)福建中銀集團(tuán)的“天音話王”等軟件;或漢字鍵盤(pán)輸入,如“微軟拼音輸入法”等。其中漢語(yǔ)音節(jié)代碼一般使用英文字符的組合,不通用,不可讀。
現(xiàn)有的漢語(yǔ)音節(jié)符號(hào)都是組合符號(hào),沒(méi)有整體符號(hào),與漢字符號(hào)相比較,沒(méi)有得到應(yīng)有的重視,還不是漢語(yǔ)信息處理的主要對(duì)象。
總之,現(xiàn)有漢語(yǔ)信息的輸入、輸出和變換處理,一般僅限于單一的漢字。漢語(yǔ)語(yǔ)音音節(jié)符號(hào)及其代碼的輸入、輸出和變換處理僅用作漢字處理的輔助手段,而不是直接處理對(duì)象。因此,無(wú)論是理論,還是實(shí)際產(chǎn)品,都稱(chēng)作漢字或中文處理系統(tǒng),而忽略了漢語(yǔ)語(yǔ)音音節(jié)符號(hào)及其代碼。至今還沒(méi)有能夠同時(shí)或交互式地處理漢字和音節(jié)的漢語(yǔ)處理系統(tǒng)出現(xiàn)。
計(jì)算機(jī)的應(yīng)用操作已經(jīng)從最初的DOS命令行一維界面,演變?yōu)槟壳暗亩S圖形界面。然而,迄今為止,文字還是主要的信息處理對(duì)象。雖然有多媒體技術(shù)的外在支持,但語(yǔ)音和文字的信息處理并沒(méi)有合而為一,口語(yǔ)和漢字讀音的音節(jié)信息沒(méi)有得到充分重視。文字符號(hào)都有代碼,但音節(jié)符號(hào)有代碼的并不多,例如英語(yǔ)就沒(méi)有通用的音節(jié)代碼。語(yǔ)言是從口語(yǔ)演變而來(lái),先有口語(yǔ)后有文字,文字是語(yǔ)音的記錄符號(hào),可以沒(méi)有文字,但不能沒(méi)有口語(yǔ)。因此,口語(yǔ)的信息處理比文字更為重要。即使是漢語(yǔ)語(yǔ)音產(chǎn)品,也是把漢語(yǔ)語(yǔ)音轉(zhuǎn)換為漢字,再利用漢字字符去操作計(jì)算機(jī),如Dutty++中文語(yǔ)音導(dǎo)航系統(tǒng),其漢語(yǔ)語(yǔ)音識(shí)別的輸入操作就是通過(guò)漢字指令中轉(zhuǎn)實(shí)現(xiàn)的,而且與漢字的鍵盤(pán)輸入不相關(guān)聯(lián)。其實(shí),只使用音節(jié)符號(hào),就足以支持語(yǔ)音操作功能。
由于地理,政治和歷史等原因,導(dǎo)致漢字代碼多種體系并存,有中國(guó)大陸的GB2312-80,GB13000.1-93,臺(tái)灣的BIG5等,使不同代碼的漢語(yǔ)信息難以相互交流。四通利方的RichWin軟件,″東方快車(chē)″翻譯軟件,″漢神中文視窗″軟件等,都提供不同漢字代碼的文本轉(zhuǎn)換工具,把漢字文本從一種代碼,轉(zhuǎn)換為另一種代碼,并且能夠自動(dòng)識(shí)別和顯示不同代碼的漢字,甚至實(shí)現(xiàn)了不同代碼漢字的同屏無(wú)縫顯示。但漢字的鍵盤(pán)輸入還沒(méi)有突破代碼體系的限制,一般僅限于同一代碼體系內(nèi)的漢字輸入處理,難以超越漢字代碼的限制。
本發(fā)明的目的分別為
1.從漢語(yǔ)音節(jié)的鍵盤(pán)輸入入手,總結(jié)出漢語(yǔ)音節(jié)的兩元分解和兩元合成規(guī)律,提出直接實(shí)現(xiàn)漢語(yǔ)音節(jié)帶調(diào)雙拼的“漢語(yǔ)語(yǔ)音方案”,利用計(jì)算機(jī)及其普通鍵盤(pán),每擊鍵兩次即可輸入一個(gè)漢語(yǔ)音節(jié),從而設(shè)計(jì)出漢語(yǔ)鍵盤(pán),可以直接輸入兩個(gè)單字節(jié)字符組成的漢語(yǔ)音節(jié)代碼,根據(jù)需要轉(zhuǎn)換為注音符號(hào),漢語(yǔ)拼音符號(hào),代音漢字,與漢字字符相互兼容并且字節(jié)數(shù)相等的″漢語(yǔ)音節(jié)字符″等漢語(yǔ)音節(jié)符號(hào),使?jié)h語(yǔ)音節(jié)的鍵盤(pán)輸入相互統(tǒng)一。承認(rèn)漢語(yǔ)音節(jié)在漢語(yǔ)信息處理中的獨(dú)特地位和作用,承認(rèn)可記錄口語(yǔ)的漢語(yǔ)表音文字的實(shí)際存在,設(shè)計(jì)出與漢字字符字節(jié)數(shù)相等并且相互兼容的漢語(yǔ)音節(jié)字符及其代碼,成為漢語(yǔ)語(yǔ)音的通用代碼,使?jié)h語(yǔ)的語(yǔ)音和文字兩種媒介的信息,在漢語(yǔ)音節(jié)的層次上相互統(tǒng)一,便于相互變換和處理;
2.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)同音同義漢語(yǔ)音節(jié)符號(hào)的同步轉(zhuǎn)換輸入;
3.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)同音字的選擇輸入;
4.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)漢字詞語(yǔ)的編碼輸入;
5.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)漢字詞語(yǔ)整音節(jié)編碼輸入,以便與漢語(yǔ)語(yǔ)音識(shí)別輸入相互兼容和相互補(bǔ)償;
6.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)單個(gè)漢字的雙音單字編碼輸入,簡(jiǎn)化單字的輸入;
7.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)字形不同的同音同義漢字的同步轉(zhuǎn)換輸入,主要是簡(jiǎn)體漢字和繁體漢字的同步轉(zhuǎn)換輸入;
8.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)不同代碼體系的同音同義漢字的同步轉(zhuǎn)換輸入;
9.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng)實(shí)現(xiàn)同音同義的漢字/音節(jié)符號(hào)的同步轉(zhuǎn)換輸入;
10.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng),連續(xù)輸入漢字語(yǔ)句讀音的漢語(yǔ)音節(jié)符號(hào),利用音節(jié)-漢字智能轉(zhuǎn)換程序轉(zhuǎn)換為漢字,簡(jiǎn)化漢字的鍵盤(pán)輸入;
11.把音節(jié)/漢字智能轉(zhuǎn)換輸入與漢字詞語(yǔ)編碼輸入結(jié)合起來(lái),以便相互補(bǔ)償,提高輸入準(zhǔn)確度;
12.在智能轉(zhuǎn)換與字詞編碼輸入相結(jié)合的基礎(chǔ)上,增加新詞自動(dòng)生成功能,使連續(xù)兩個(gè)或兩個(gè)以上單個(gè)輸入的漢字,以后再出現(xiàn)時(shí)用其讀音自動(dòng)轉(zhuǎn)換輸入;
13.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng),采用命令行方式的符合“規(guī)范漢語(yǔ)”的漢語(yǔ)語(yǔ)音指令及其音節(jié)符號(hào)指令和相應(yīng)的漢字指令操作計(jì)算機(jī),使?jié)h語(yǔ)指令相互統(tǒng)一,構(gòu)成漢語(yǔ)操作界面;
14.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng),把漢語(yǔ)信息的鍵盤(pán)輸入與漢語(yǔ)語(yǔ)音識(shí)別輸入結(jié)合起來(lái),構(gòu)成漢語(yǔ)輸入處理系統(tǒng);
15.在圖形界面的基礎(chǔ)上增加命令行方式的漢語(yǔ)語(yǔ)音指令及其音節(jié)符號(hào)指令和相應(yīng)的漢字指令操作和應(yīng)用計(jì)算機(jī),構(gòu)成漢語(yǔ)圖形操作界面;
16.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng),把漢語(yǔ)信息的鍵盤(pán)輸入與漢語(yǔ)語(yǔ)音合成輸出結(jié)合起來(lái);
17.使用漢語(yǔ)鍵盤(pán)輸入系統(tǒng),把漢語(yǔ)信息的鍵盤(pán)輸入,漢語(yǔ)語(yǔ)音的識(shí)別輸入和合成輸出綜合起來(lái),使?jié)h語(yǔ)音節(jié)符號(hào)和漢字詞語(yǔ)在音節(jié)的層次上相互統(tǒng)一,構(gòu)成完整的漢語(yǔ)處理系統(tǒng);
漢語(yǔ)信息包括漢語(yǔ)語(yǔ)音聲音信號(hào)及其音節(jié)符號(hào)和漢字詞語(yǔ)兩種媒介的多種信息。漢語(yǔ)語(yǔ)音含義很廣,包括所有華人使用的各種方言,以下用漢語(yǔ)普通話為代表。漢語(yǔ)音節(jié)符號(hào)包括切音漢字,注音符號(hào),代音漢字,表音類(lèi)漢語(yǔ)盲文,漢語(yǔ)拼音,威妥瑪式拼法,國(guó)際音標(biāo)等,參見(jiàn)漢語(yǔ)拼音和威妥瑪式拼法音節(jié)對(duì)照表,以及漢語(yǔ)拼音聲母韻母和國(guó)際音標(biāo)對(duì)照表(《漢英詞典》第957-960頁(yè),商務(wù)印書(shū)館,1980年10月第一版),均具有特定的表音功能,一般以漢語(yǔ)拼音為代表。漢字詞語(yǔ)由于受到計(jì)算機(jī)信息處理和相互交換的限制,一般是指中國(guó)國(guó)家標(biāo)準(zhǔn)GB2312-80《信息交換用漢字編碼字符集-基本集》;或者國(guó)際標(biāo)準(zhǔn)ISO-10646和相應(yīng)的中國(guó)國(guó)家標(biāo)準(zhǔn)GB13000.1-93“信息技術(shù)通用多八位編碼字符集(UCS)第一部分體系結(jié)構(gòu)與多文種平面”,包括GBK擴(kuò)展國(guó)標(biāo)字符代碼和Unicode國(guó)際字符代碼;以及臺(tái)灣和香港等地的BIG5代碼,或者其它國(guó)家或地區(qū)已經(jīng)制訂的以及將要制定的漢字代碼標(biāo)準(zhǔn),以下一律表述為漢字詞語(yǔ)。
漢語(yǔ)信息的結(jié)構(gòu)組成可以用公式表示
漢語(yǔ)信息=語(yǔ)言信息(音節(jié)信號(hào)+音節(jié)符號(hào))+文字信息(漢字符號(hào)+漢字讀音)
=音節(jié)信息(音節(jié)信號(hào)+漢字讀音)+字符信息(音節(jié)符號(hào)+漢字符號(hào))
其中,語(yǔ)言信息是漢語(yǔ)口語(yǔ);文字信息是漢語(yǔ)書(shū)面語(yǔ)。音節(jié)符號(hào)包括漢語(yǔ)拼音,注音符號(hào),代音漢字等。漢語(yǔ)的語(yǔ)言和文字兩種媒介信息的共性是音節(jié)信息,其個(gè)性分別是語(yǔ)音信息和字符信息,有多種不同的語(yǔ)音和符號(hào)體系。用音節(jié)符號(hào)描述的漢語(yǔ)信息,是純正的表音文字;而英語(yǔ)等表音文字,由于文字與其讀音有一定的差別,并不是完全對(duì)應(yīng)的,因此就其表音功能來(lái)說(shuō)還不如漢語(yǔ)音節(jié)符號(hào)精確。所以,用漢語(yǔ)音節(jié)符號(hào)記錄的漢語(yǔ),是最純粹的表音文字,最容易學(xué)習(xí)。
各種漢語(yǔ)信息共同的、本質(zhì)的、和最基本的信息就是漢語(yǔ)音節(jié),是所有漢語(yǔ)信息不可缺少的。所說(shuō)的漢語(yǔ)音節(jié)是帶有聲調(diào)并實(shí)際存在的,不區(qū)分聲調(diào)的只是音節(jié)的組合,對(duì)此不再另外說(shuō)明。
音節(jié)和語(yǔ)義相同的漢語(yǔ)語(yǔ)音及其音節(jié)符號(hào)和漢字詞語(yǔ)的信息處理,包含三個(gè)不同層次,可以合并處理而在整體上得到簡(jiǎn)化。由于聲音信號(hào)與時(shí)間相關(guān)聯(lián)且不可分離,需要話筒,聲卡和揚(yáng)聲器等輸入輸出設(shè)備,其信息處理主要是數(shù)字化聲音數(shù)據(jù)的實(shí)時(shí)處理及其與音節(jié)符號(hào)的相互變換,即漢語(yǔ)語(yǔ)音識(shí)別輸入和語(yǔ)音合成輸出,是漢語(yǔ)信息處理的第一個(gè)層次。聲音信號(hào)雖然比較復(fù)雜,基本信息卻是簡(jiǎn)單的漢語(yǔ)音節(jié),可以用音節(jié)符號(hào)記錄,分詞之后也具有表義能力,是世界上最簡(jiǎn)單的表音文字,例如漢語(yǔ)速記,漢語(yǔ)盲文,漢語(yǔ)手指語(yǔ)和漢語(yǔ)旗語(yǔ)等。語(yǔ)音識(shí)別的結(jié)果和語(yǔ)音合成的對(duì)象以及語(yǔ)音記錄符號(hào)都可以歸結(jié)為漢語(yǔ)音節(jié)符號(hào),這是漢語(yǔ)信息處理的第二個(gè)層次。第三個(gè)層次的漢字詞語(yǔ)除具有讀音的音節(jié)信息外,還具有字形和筆畫(huà)信息,信息總量最為豐富,是漢語(yǔ)信息處理的主要對(duì)象,是世界上最復(fù)雜的文字,鍵盤(pán)輸入也最難。其最接近的漢語(yǔ)信息就是漢語(yǔ)音節(jié)符號(hào)。所以,第二個(gè)層次的漢語(yǔ)音節(jié)符號(hào)是漢語(yǔ)語(yǔ)音和漢字詞語(yǔ)的紐帶,是漢語(yǔ)信息處理的關(guān)鍵。
為了表述方便,本發(fā)明以漢語(yǔ)拼音為主描述漢語(yǔ)音節(jié),其結(jié)論并不限于漢語(yǔ)拼音。如果改成其它的漢語(yǔ)音節(jié)符號(hào),例如注音符號(hào),國(guó)際音標(biāo)等,以及在本發(fā)明基礎(chǔ)上制定的各種音節(jié)符號(hào),其表音功能都是相同的。
本發(fā)明把漢語(yǔ)音節(jié)分解為聲介母和帶調(diào)韻母或帶調(diào)介母,把《漢語(yǔ)拼音方案》中屬于韻母的介母i、u、ü分離出來(lái),與聲母合并分別組成i介、u介、ü介聲介母,無(wú)介母的聲介母稱(chēng)作零介聲介母。有幾個(gè)韻母,in是ien的簡(jiǎn)化,ing是ieng的簡(jiǎn)化,iu是iou的簡(jiǎn)化,ui是uei的簡(jiǎn)化,un是uen的簡(jiǎn)化,不簡(jiǎn)化才能正確的分離出介母和韻母。韻母一律帶調(diào)。介母i、u、ü單獨(dú)用作韻母或單獨(dú)構(gòu)成音節(jié)時(shí),既要分離出介母歸入聲介母,又要保留帶調(diào)介母。不需要相互區(qū)分時(shí),帶調(diào)韻母和帶調(diào)介母統(tǒng)稱(chēng)為帶調(diào)韻母。聲介母可稱(chēng)作“首音”,帶調(diào)韻母和帶調(diào)介母可稱(chēng)作“尾音”,能夠組成幾乎所有的漢語(yǔ)音節(jié),稱(chēng)作“漢語(yǔ)音節(jié)要素”,由此形成“漢語(yǔ)語(yǔ)音方案”,與中國(guó)國(guó)家標(biāo)準(zhǔn)GB/T15720-1995″中國(guó)盲文″的″漢語(yǔ)雙拼盲文方案″較為接近,具體內(nèi)容如下
聲介母(62個(gè))
b,p,m,f,d,t,n,l,g,k,h,zh,ch,sh,r,z,c,s,零聲母,計(jì)19個(gè)零介聲介母;bi,pi,mi,di,ti,ni,li,ji,qi,xi,zhi,chi,shi,ri,zi,ci,si,yi,計(jì)18個(gè)i介聲介母;bu,pu,mu,fu,du,tu,nu,lu,gu,ku,hu,zhu,chu,shu,ru,zu,cu,su,w,計(jì)19個(gè)u介聲介母;ju,qu,xu,yu,nü,lü,計(jì)6個(gè)ü介聲介母。其中聲介母zhi,chi,shi,ri,zi,ci,si可以省略,聲介母數(shù)量減少為55個(gè)。如果取消零聲母,則聲介母減少為54個(gè);
帶調(diào)韻母(52個(gè))。
ā,á,ǎ,à,āi,ái,ǎi,ài,ān,án,ǎn,àn,āng,áng,ǎng,àng,āo,áo,ǎo,ào,ē,é,ě,è,ēi,éi,ěi,èi,ēn,én,ěn,èn,ēng,éng,ěng,èng,er,ér,ěr,èr,ō,ó,ǒ,ò,ōng,óng,ǒng,òng,ōu,óu,ǒu,òu,其中er是兒化音的標(biāo)記符號(hào),用以代替漢字″兒″;
帶調(diào)介母(12個(gè))
ī,í,ǐ,ì,ū,ú,ǔ,ù,ǖ,ǘ,ǚ,ǜ。
帶調(diào)介母只能和含有相同介母的聲介母組成音節(jié)ī,í,ǐ,ì只能和i介聲介母組成音節(jié),ū,ú,ǔ,ù只能和u介聲介母組成音節(jié),ǖ,ǘ,ǚ,ǜ只能和ü介聲介母組成音節(jié)。除聲介母Y和W外,其它聲介母與帶調(diào)介母直接組合的音節(jié)符號(hào),中間多出一個(gè)介母,原本是介母一分為二所致,應(yīng)與帶調(diào)介母合而為一,否則與拼音音節(jié)符號(hào)有所區(qū)別。但也可以接受。如果省略zhi,chi,shi,ri,zi,ci,si,則帶調(diào)介母i可以直接與聲母zh,ch,Sh,r,z,c,s組成帶調(diào)音節(jié)。零介、i介,u介和o介聲介母分別和帶調(diào)韻母連讀即可直接組成相應(yīng)的零介,i介,u介和ü介音節(jié)。
輕聲聲調(diào)只有幾十個(gè),實(shí)用頻度也不大,可以并入其它聲調(diào)之中,例如并入陰平聲調(diào)或去聲聲調(diào)。而m、n,ng等幾個(gè)鼻韻母。一般可以省略,需要時(shí)可以特殊處理。有一個(gè)特殊音節(jié)“Fiào”,對(duì)應(yīng)一個(gè)方言用字,需要時(shí)可以增加一個(gè)聲介母“Fi”。
表1列出簡(jiǎn)化拼音,漢語(yǔ)拼音和注音符號(hào)的聲介母對(duì)照表,表2列出簡(jiǎn)化拼音。漢語(yǔ)拼音和注音符號(hào)的帶調(diào)韻母對(duì)照表,表1和表2可以稱(chēng)作“漢語(yǔ)音節(jié)要素表”。其中表1簡(jiǎn)拼的聲介母Zhi,Chi,Shi,Ri,Zi,Ci,Si直接省略。
漢語(yǔ)音節(jié)的切分和合成規(guī)則是把漢語(yǔ)音節(jié)在介母之后切分,介母在最后則切分出帶調(diào)介母聲介母和同介母的帶調(diào)介母,或聲介母和帶調(diào)韻母連讀組成漢語(yǔ)音節(jié)。表3列出漢語(yǔ)音節(jié)的兩元分解和兩元組合表,表中使用代音漢字作為漢語(yǔ)音節(jié)符號(hào)。
漢語(yǔ)音節(jié)要素總計(jì)126個(gè),可簡(jiǎn)化為119個(gè),用數(shù)字代碼表示,稱(chēng)作音節(jié)要素代碼用高位置1的單字節(jié)表示,則兼容高位置0的英文字符代碼,但不兼容雙字節(jié)的漢字代碼;用高位置0的單字節(jié)表示,兼容高位置1的雙字節(jié)漢字代碼,但不兼容高位置0的單字節(jié)英文字符代碼。是純粹的漢語(yǔ)系統(tǒng)。從計(jì)算機(jī)的最底層支持漢語(yǔ)介于中間的方案,直接兼容單字節(jié)英文字符代碼和雙字節(jié)漢字代碼,用單字節(jié)字符表示音節(jié)要素代碼,兩個(gè)單字節(jié)字符的組合表示一個(gè)漢語(yǔ)音節(jié),但必須區(qū)分聲介母和帶調(diào)韻母的先后順序,否則前面刪除奇數(shù)個(gè)單字節(jié),后面的聲介母和帶調(diào)韻母會(huì)串位而產(chǎn)生錯(cuò)誤,音節(jié)之間使用空格等分隔符號(hào)就可避免,但不容易識(shí)別和認(rèn)讀,顯示或打印時(shí)需要轉(zhuǎn)換為漢語(yǔ)音節(jié)符號(hào)。個(gè)別音節(jié)容易和兩個(gè)字母的英文單詞如“an”和“be”等混淆。使用雙字節(jié)代碼表示最多126個(gè)音節(jié)要素,幾乎可以在任何一個(gè)漢字系統(tǒng)上利用其造字程序?qū)崿F(xiàn),其音節(jié)代碼均為兩個(gè)雙字節(jié)組成的四個(gè)字節(jié)。其音節(jié)符號(hào)可以直接使用半角的英文字母構(gòu)造,比較直觀,容易推廣,但比漢字符號(hào)的字節(jié)數(shù)多一倍,與漢字混合排版比較方便,仍有相互變換時(shí)的串位問(wèn)題,比普通的漢語(yǔ)拼音符號(hào)更適合計(jì)算機(jī)處理.此外,代音漢字可直接作為雙字節(jié)的音節(jié)代碼。但與漢字難區(qū)分。
本發(fā)明設(shè)計(jì)出與漢字代碼相互兼容并且字節(jié)數(shù)相等的漢語(yǔ)音節(jié)字符及其代碼,是漢語(yǔ)音節(jié)的直接代表。也是一切漢語(yǔ)信息的共有信息,使?jié)h語(yǔ)的語(yǔ)音和文字兩種媒介信息,在漢語(yǔ)音節(jié)的層次上相互統(tǒng)一,便于相互變換和處理。由于中國(guó)國(guó)家標(biāo)準(zhǔn)GB2312-80還有1300多個(gè)空碼位,GBl3000.1-93以及未來(lái)擴(kuò)展的ISO/IEC-10646代碼體系。都將保留一定數(shù)量的空碼位,可以為漢語(yǔ)音節(jié)編碼,按通用的音序排列。由于UniCode另有“oxe000-oxe760”總計(jì)1888個(gè)連續(xù)的字符編碼空間空閑。可以為漢語(yǔ)音節(jié)編碼。更便于排序和檢索,但不能向下兼容GB2312-80的音節(jié)字符。在美國(guó)微軟公司繁體版Windows95的BIG5漢字代碼體系中,十六進(jìn)制8100-a0fe的編碼空間均空閑,可為漢語(yǔ)音節(jié)編碼,如果與GB2312-80的音節(jié)代碼分段落對(duì)應(yīng),使之只差幾個(gè)常數(shù),則便于信息交換。
依據(jù)《漢語(yǔ)拼音方案》,可以縮短拼式,用
代替Zh,用
代替Ch,用
代替Sh。用
代替ng,也可以直接用g代替ng而不會(huì)產(chǎn)生歧義,使每個(gè)音節(jié)的字母數(shù)不超過(guò)4個(gè),從而設(shè)計(jì)出漢語(yǔ)音節(jié)的專(zhuān)用字符。稱(chēng)作“漢語(yǔ)音節(jié)字符”,既代表漢語(yǔ)語(yǔ)音音節(jié),又代表漢字的讀音音節(jié)。見(jiàn)表4“漢語(yǔ)音節(jié)字符及其代碼和代音漢字”。由于字母較多,每個(gè)音節(jié)字符至少需要24×24的點(diǎn)陣才能顯示或打印。
音節(jié)字符必須簡(jiǎn)化才能使用16×16點(diǎn)陣的顯示字形。把聲介母ji,qi,xi,zhi,chi,shi,ri,zi,ci,si的介母i省略,視為隱含在聲母中,則jang就是jiang,qeng就是qieng,而xong就是xjong,等等。可以減少新增字符的數(shù)量,但音節(jié)符號(hào)與漢語(yǔ)拼音有一定區(qū)別??梢院?jiǎn)化介母i,u、ü,分別標(biāo)在聲母符號(hào)上,用一個(gè)點(diǎn)表示i,一個(gè)橫表示u,兩個(gè)點(diǎn)表示ü,拼音音節(jié)最多3個(gè)字母。注音符號(hào)音節(jié)最多2個(gè)字母。便可以用16×16點(diǎn)陣構(gòu)造漢語(yǔ)音節(jié)字符。見(jiàn)表5"簡(jiǎn)化漢語(yǔ)音節(jié)字符",缺點(diǎn)是需要特殊記憶。
上述兩種字形的音節(jié)字符可以使用相同的代碼,以便相互補(bǔ)償。使用時(shí),能用表4的漢語(yǔ)音節(jié)字符。就不用表5的簡(jiǎn)化漢語(yǔ)音節(jié)字符。對(duì)于DOS等軟件,無(wú)論是低版本,還是高版本,由于使用16×16點(diǎn)陣的基本顯示字形,所以,只能使用簡(jiǎn)化的漢語(yǔ)音節(jié)字符,除非支持24×24點(diǎn)陣的特殊顯示;而Windows3.2/95/98中文版等漢字系統(tǒng)軟件,兩種音節(jié)字符均可使用,但需要重新造字。不同字形的音節(jié)字符可視為同一音節(jié)代碼的不同字體。
表4和表5的音節(jié)字符是利用MSDOS6.22中文版的造字程序?qū)崿F(xiàn)的。其中音節(jié)字符按十進(jìn)制區(qū)號(hào)和16進(jìn)制國(guó)標(biāo)頁(yè)號(hào)區(qū)分段落,中間用“區(qū)”字分開(kāi)。表4的音節(jié)字符后面標(biāo)出其十進(jìn)制的位號(hào)和16進(jìn)制位號(hào)。例如,音節(jié)“Hàn”處在13區(qū)ad的段落內(nèi),音節(jié)后的符號(hào)是20b4,因此其區(qū)位碼為1320,而國(guó)標(biāo)碼為ADB4。表5只標(biāo)出簡(jiǎn)化音節(jié)字符,可與表4對(duì)照查看。
還可以使用注音符號(hào),國(guó)際音標(biāo)等漢浯音節(jié)符號(hào)設(shè)計(jì)漢語(yǔ)音節(jié)字符,盡可能使用相同的音節(jié)代碼而音節(jié)字符的字形可以不同,以便于信息交流。注音符號(hào)的音節(jié)一般只有3個(gè)字母,不需要改動(dòng)就能直接用作注音符號(hào)的音節(jié)字符,需要壓縮時(shí)把介母ㄧ,ㄨ,ㄩ簡(jiǎn)化為其前面聲母符號(hào)上的“.”,“-”和“..”即可,相應(yīng)的音節(jié)符號(hào)減少為兩個(gè)字母。還可以利用國(guó)際音標(biāo)設(shè)計(jì)音節(jié)字符。
漢語(yǔ)音節(jié)代碼一定要統(tǒng)一,以便于信息交流。法定標(biāo)準(zhǔn)發(fā)布之前,希望實(shí)施者都采用本發(fā)明制定的標(biāo)準(zhǔn)。
除代音漢字和音節(jié)字符之外,其它音節(jié)符號(hào)都是單字節(jié)字符或雙字節(jié)字符的組合符號(hào),其整個(gè)音節(jié)符號(hào)與漢字字符不等長(zhǎng),不便于交互處理或相互變換處理,而代音漢字難以和普通漢字相區(qū)分,所以,本發(fā)明以音節(jié)字符為主。需要時(shí)利用相應(yīng)的音節(jié)字符/音節(jié)符號(hào)轉(zhuǎn)換軟件,轉(zhuǎn)換為其它的漢語(yǔ)音節(jié)符號(hào)。
表3比依據(jù)《漢語(yǔ)拼音方案》編制的漢浯音節(jié)表大為簡(jiǎn)化,所以才能簡(jiǎn)化鍵盤(pán)輸入。漢語(yǔ)音節(jié)要素,印刷。成型或映射在普通鍵盤(pán)的字符鍵位上,首次輸入聲介母,再次輸入帶調(diào)介母或帶調(diào)韻母,擊鍵兩次即可輸入一個(gè)漢語(yǔ)音節(jié),稱(chēng)作漢語(yǔ)鍵盤(pán)。由于一個(gè)鍵位一般設(shè)置兩個(gè)音節(jié)要素,所輸入的英文字符轉(zhuǎn)換為漢語(yǔ)音節(jié)符號(hào)后才容易識(shí)讀,所以,漢語(yǔ)鍵盤(pán)不能脫離計(jì)算機(jī)。計(jì)算機(jī)可以附帶普通計(jì)算機(jī)鍵盤(pán),通過(guò)運(yùn)行漢語(yǔ)鍵盤(pán)輸入軟件而支持漢語(yǔ)鍵盤(pán);此外,漢語(yǔ)鍵盤(pán)可以有專(zhuān)用的計(jì)算機(jī)。
圖1-圖15列出15種類(lèi)型的漢語(yǔ)鍵盤(pán),兼容英文鍵盤(pán)。聲介母Zhi,chi,shi,ri,zi,ci,si省略,用聲介母zh,ch,sh,r,z,c,s與帶調(diào)介母ī,í,ǐ,ì分別組成相應(yīng)的音節(jié)。輕聲聲調(diào)與陰平聲調(diào)合并。聲介母Fi與ào組成特殊音節(jié)“Fiào”,需要時(shí)把Fi作為聲介母安排在聲介母F鍵上。
依據(jù)表1和表2,圖1-圖15的鍵盤(pán)圖,所標(biāo)注的漢語(yǔ)拼音符號(hào)可以替換為注音符號(hào),簡(jiǎn)化的漢語(yǔ)拼音符號(hào)等漢語(yǔ)音節(jié)符號(hào),從而構(gòu)成相應(yīng)的漢語(yǔ)鍵盤(pán)實(shí)施例。
人名和地名等不標(biāo)調(diào)的漢語(yǔ)拼音,是漢語(yǔ)譯成外語(yǔ)的國(guó)際標(biāo)準(zhǔn);音譯的外國(guó)人名和地名等專(zhuān)有詞,可以使用不標(biāo)聲調(diào)的音節(jié)字符代替漢字。因此,可以把音節(jié)字符的陰平聲調(diào)并入輕聲聲調(diào),如表5的陰平聲調(diào)一律不標(biāo)調(diào),可以代表不區(qū)分聲調(diào)的音節(jié)組即聲韻雙拼音節(jié),用于不標(biāo)調(diào)的場(chǎng)合。
使用漢語(yǔ)鍵盤(pán),先輸入聲介母,再輸入帶調(diào)韻母或帶調(diào)介母;但零聲母音節(jié)的輸入順序相反,用帶調(diào)韻母補(bǔ)加一個(gè)隔音符號(hào)“`”輸入,可視為在帶調(diào)韻母之后書(shū)寫(xiě),或稱(chēng)作零聲母音節(jié)的補(bǔ)位輸入鍵,在圖1-15中標(biāo)注為“補(bǔ)位”。
實(shí)施漢語(yǔ)鍵盤(pán)的簡(jiǎn)單方法是采用聯(lián)想漢字輸入環(huán)境、DOS6.22中文版,Windows95,98中文版及其包含的DOS7.0中文版等軟件,依據(jù)其碼表規(guī)則編制漢語(yǔ)音節(jié)符號(hào)與英文字符的輸入碼對(duì)照表,即可通過(guò)簡(jiǎn)單編譯,實(shí)現(xiàn)漢語(yǔ)音節(jié)符號(hào)的鍵盤(pán)編碼輸入。編制專(zhuān)用的輸入法軟件才能支持特殊的輸入功能。
漢語(yǔ)鍵盤(pán)使用46個(gè)輸入字符,而DOS6.22及DOS7.0中文版、Windows3.2中文版,UCDOS等軟件,其原有設(shè)置限制個(gè)別字符的使用。例如符號(hào)健“-”和“=”用作重碼的翻頁(yè)鍵,可以改用Shift鍵或Alt鍵與PgUp,PgDn等鍵的組合鍵替代。最好與軟件的開(kāi)發(fā)商協(xié)商修改,有的軟件經(jīng)過(guò)分析也能自行修改,但其修改的后果有時(shí)難以預(yù)料,必須自行承擔(dān)其責(zé)任。例如,對(duì)于MSDOS6.22和MSDOS7.0,使用PCTOOL工具軟件修改鍵盤(pán)模塊HZKBD,方法是找到3b75改成3a75,找到2d75改成4075,找到3d74改成2374,找到3d0d2d0c改成2b0d5f0c,則47個(gè)字符都可用作輸入字符。本方法只是一個(gè)實(shí)施例,是否可靠需經(jīng)美國(guó)微軟公司確認(rèn)。
也可以不使用“-”和“=”。圖1-15中,字符“-”的帶調(diào)韻母ǎi用字符“\”替代,“-”鍵的聲介母Xu則拆成Xu,Xuan,Xue,Xuen四個(gè)整體音節(jié),補(bǔ)加帶調(diào)韻母ǖ,ǘ,ǚ,ǜ輸入。圖1-15的圓括號(hào)“()”中分別標(biāo)出代替“-”和“=”鍵的輸入要素。
本發(fā)明的漢語(yǔ)鍵盤(pán),其更為精確的定義就是漢語(yǔ)鍵盤(pán)輸入系統(tǒng),依賴于支持漢字字符的漢字處理系統(tǒng),以及增加雙字節(jié)或多字節(jié)漢語(yǔ)音節(jié)字符的漢語(yǔ)處理平臺(tái)。圖16漢字處理系統(tǒng)結(jié)構(gòu)框圖中,由通用鍵盤(pán)裝置4,鍵盤(pán)輸入處理軟件8和計(jì)算機(jī)基本硬件及漢字操作系統(tǒng)軟件10構(gòu)成漢字鍵盤(pán)輸入系統(tǒng);圖17的漢語(yǔ)處理系統(tǒng)結(jié)構(gòu)框圖中,增加獨(dú)立的音節(jié)/漢字轉(zhuǎn)換軟件19構(gòu)成漢語(yǔ)鍵盤(pán)輸入系統(tǒng)。兩種鍵盤(pán)輸入系統(tǒng)均能輸入常規(guī)漢語(yǔ)音節(jié)符號(hào)和漢字詞語(yǔ)。留有至少1280個(gè)雙字節(jié)或多字節(jié)空閑字符代碼的漢字處理系統(tǒng),增加音節(jié)字符的顯示字庫(kù)和打印字庫(kù),組成圖17的″漢語(yǔ)音節(jié)代碼及其音節(jié)字符支持平臺(tái)21,才能處理音節(jié)字符。也有一些漢字處理系統(tǒng)例如希望漢字系統(tǒng)UCDOS等軟件,不能支持雙字節(jié)的1280個(gè)漢語(yǔ)音節(jié)字符,需要進(jìn)行系統(tǒng)改造。
同音同義的漢語(yǔ)語(yǔ)音及其音節(jié)符號(hào)和漢字詞語(yǔ),都包含共同的漢語(yǔ)音節(jié)信息,在漢語(yǔ)音節(jié)的層次上相互統(tǒng)一其中注音符號(hào),漢語(yǔ)拼音,音節(jié)字符等音節(jié)符號(hào)的差別是字形不同,相互間一一對(duì)應(yīng);而漢字符號(hào)有多種代碼體系,還有簡(jiǎn),繁體之分,相互間基本一一對(duì)應(yīng);音節(jié)符號(hào)和漢字符號(hào)之間的對(duì)應(yīng)關(guān)系較為復(fù)雜,需要音節(jié)/漢字或漢字/音節(jié)轉(zhuǎn)換程序及其智能轉(zhuǎn)換知識(shí)庫(kù)的支持??梢愿爬ǖ卣f(shuō),同音同義的漢語(yǔ)信息有漢語(yǔ)語(yǔ)音及其各種音節(jié)符號(hào)和各種代碼體系的漢字詞語(yǔ),只要輸入其中一種漢語(yǔ)信息,就可以利用同步轉(zhuǎn)換程序,采用不同的提示行,同一個(gè)編輯窗口的不同編輯區(qū)域,或不同的編輯窗口,進(jìn)行同步轉(zhuǎn)換輸入。所輸入的不同代碼可以分別保存在不同的文件中,從而形成對(duì)比文件。
同音同義漢語(yǔ)信息的同步轉(zhuǎn)換輸入包括(1).同音同義的音節(jié)符號(hào)同步轉(zhuǎn)換輸入;(2).不同代碼體系的同音同義漢字字符的同步轉(zhuǎn)換輸入;(3).同音同義的漢字字符及其音節(jié)符號(hào)的同步轉(zhuǎn)換輸入;(4).同音同義的音節(jié)符號(hào)及其漢字字符的同步轉(zhuǎn)換輸入。
1.使用漢語(yǔ)鍵盤(pán)輸入漢語(yǔ)音節(jié)符號(hào)
使用漢語(yǔ)鍵盤(pán)輸入每個(gè)漢語(yǔ)音節(jié)的兩個(gè)英文字符,稱(chēng)作輸入字符,是最直接的漢語(yǔ)音節(jié)代碼,補(bǔ)加空格等分隔標(biāo)記適用于純西文軟件,但不容易認(rèn)讀;使用其識(shí)別轉(zhuǎn)換程序則能轉(zhuǎn)換為容易識(shí)讀的漢語(yǔ)音節(jié)符號(hào),類(lèi)似英文制表符的識(shí)別轉(zhuǎn)換。
漢語(yǔ)鍵盤(pán)的直接輸入目標(biāo)是注音符號(hào),漢語(yǔ)拼音符號(hào)和漢語(yǔ)音節(jié)字符等漢語(yǔ)音節(jié)符號(hào)。利用輸入字符與音節(jié)符號(hào)的編碼對(duì)照表編制音節(jié)符號(hào)的鍵盤(pán)輸入軟件就能分別輸入。
在GB2312-80標(biāo)準(zhǔn)及GB13000.1-93標(biāo)準(zhǔn)中,用雙字節(jié)的字母組成一個(gè)漢語(yǔ)音節(jié)符號(hào),漢語(yǔ)拼音需要1-6個(gè),注音符號(hào)需要2-4個(gè)(必須補(bǔ)加標(biāo)調(diào)符號(hào)),音節(jié)符號(hào)較長(zhǎng)。可以利用126個(gè)雙字節(jié)空閑字符編碼設(shè)計(jì)雙字節(jié)的聲介母,帶調(diào)韻母和帶調(diào)介母符號(hào),分別包含1-3個(gè)字母,其字形如表1和表2所示,兩個(gè)雙字節(jié)符號(hào)組成一個(gè)4字節(jié)的音節(jié)符號(hào),其中Y和W之外的聲介母與帶調(diào)介母的組合,中間多一個(gè)介母i,u或ü,例如音節(jié)“Juǜ”,“Lií”等。韻母符號(hào)例如iu,ui,un,ing等不再簡(jiǎn)化,其余相同。與音節(jié)字符相比,占用字符編碼少,容易實(shí)現(xiàn),易推廣,比原有符號(hào)簡(jiǎn)捷,能夠直接發(fā)揮漢語(yǔ)鍵盤(pán)的輸入優(yōu)勢(shì),但字節(jié)數(shù)比漢字多一倍,相互變換時(shí)和排版時(shí)字符必然串位??梢杂糜诓恢С蛛p字節(jié)音節(jié)字符的漢字系統(tǒng),例如UCDOS。
把26個(gè)大寫(xiě)英文字母改為標(biāo)調(diào)的a,o,e,i,u,ü符號(hào),參見(jiàn)″漢神中文視窗軟件″的字體,配合小寫(xiě)英文字母,可以組成規(guī)范的漢語(yǔ)拼音音節(jié)符號(hào),但不能兼容大寫(xiě)的英文字母;除非使用1,2,3,4,5等符號(hào)分別表示陰平,陽(yáng)平,上聲,去聲和輕聲聲調(diào)。
每個(gè)漢語(yǔ)音節(jié)中選取較常用的漢字稱(chēng)作代音漢字,如表3所示,可以直接利用現(xiàn)有的漢字系統(tǒng)資源,容易認(rèn)讀,但很難和普通漢字符號(hào)區(qū)分,需要長(zhǎng)時(shí)間學(xué)習(xí)才能應(yīng)用,而習(xí)慣用漢字的人又覺(jué)得別扭。
上述的漢語(yǔ)音節(jié)符號(hào)及其代碼,可以直接記錄漢語(yǔ)口語(yǔ)即漢語(yǔ)速記,組成漢語(yǔ)音節(jié)文本即口語(yǔ)文件,能夠直接使用語(yǔ)音合成軟件輸出語(yǔ)音。音節(jié)符號(hào)與漢字字符混用,就是把漢語(yǔ)的語(yǔ)音和文字兩種媒介的信息在字符層次上合而為一,有利于相互變換處理。日語(yǔ)把表音的假名和漢字混合使用,發(fā)揮了重要作用,并以假名的鍵盤(pán)輸入為基礎(chǔ),通過(guò)假名-漢字轉(zhuǎn)換程序?qū)崿F(xiàn)日語(yǔ)漢字的鍵盤(pán)輸入。
漢浯音節(jié)字符的鍵盤(pán)輸入,可以作為漢字輸入的一個(gè)中間環(huán)節(jié),利用音節(jié)-漢字智能轉(zhuǎn)換技術(shù),動(dòng)態(tài)實(shí)時(shí),或靜態(tài)一次性地。把“音節(jié)字符”文本轉(zhuǎn)化為相應(yīng)的漢字字符文本。那些難以自動(dòng)轉(zhuǎn)換的“音節(jié)字符”可以保留,以便以后進(jìn)行手工替換性的轉(zhuǎn)換。這比使用頻度判據(jù)給出錯(cuò)誤的漢字,在所有的漢字中尋找錯(cuò)誤的漢字再進(jìn)行人工修改明顯優(yōu)越。
采用圖1-圖15所示的任意一種漢語(yǔ)鍵盤(pán),首次輸入聲介母、再次輸入帶調(diào)韻母或帶調(diào)介母,擊健兩次即可輸入一個(gè)漢語(yǔ)音節(jié)即“兩鍵一音”,再利用輸入字符與漢語(yǔ)音節(jié)符號(hào)對(duì)照表,由鍵盤(pán)輸入處理模塊把輸入字符轉(zhuǎn)換為所要輸入的漢語(yǔ)音節(jié)符號(hào)。設(shè)定最大輸入碼長(zhǎng)為2,個(gè)別有重碼的使用聲音告警,用數(shù)字鍵選擇輸入。
輸入“HànYǔZhēnJīngQi”5個(gè)音節(jié),首先拆分出“H、àn。Yü、ǚ,Zh、ēn,Ji、ēng。Qi、i”10個(gè)輸入要素。在漢語(yǔ)鍵盤(pán)上找到相應(yīng)的輸入健位,依次擊健即可。采用圖1所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2;rjtq,”;或者采用圖2所示類(lèi)型的漢看鍵盤(pán),依次鍵入英文字符“hh.2irjtq,”;或者采用圖3所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2irjtq,”;或者采用圖4所示類(lèi)型的漢語(yǔ)鍵盤(pán)。依次鍵入英文字符“hh.2irjtq,”,或者采用圖5所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2vvjtq,”,或者采用圖6所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2arjtq,”,或者采用圖7所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2irjtq,”,或者采用圖8所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.5iwjyq,”,或者采用圖9所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hf.5iyjwq,”。或者采用圖10所示類(lèi)型的漢語(yǔ)鍵盤(pán)。依次鍵入英文字符“hh.2;rjtqc”,或者采用圖11所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2;rjtqc”?;蛘卟捎脠D12所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2irjtqc”,或者采用圖13所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2irjtqc”,或者采用圖14所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2;rjtqc”,或者采用圖15所示類(lèi)型的漢語(yǔ)鍵盤(pán),依次鍵入英文字符“hh.2irjtqc”,都能輸入這些漢語(yǔ)音節(jié)。
所輸入的兩個(gè)英文字符,可以分別轉(zhuǎn)換為全角漢語(yǔ)拼音符號(hào)“HànYǚZhēnJīngQi”,4字節(jié)的漢語(yǔ)拼音音節(jié)符號(hào)“(H)(àn)(Y)(ǚ)(Zh)(ēn)(Ji)(ēng)(Qi)(i)”(括號(hào)內(nèi)是一個(gè)雙字節(jié)符號(hào),以下同)。全角注音符號(hào)“ㄏ

ㄓㄣㄐ丨ㄥㄑ
”,4字節(jié)注音音節(jié)符號(hào)“(ㄏ)(
)(ㄩ)(
)(ㄓ)(ㄣ)(ㄐㄧ)(ㄥ)(ㄑㄧ)(
)”依據(jù)注音符號(hào)設(shè)計(jì)的雙字節(jié)音節(jié)字符“(ㄏ
)(ㄩ
)(ㄓㄣ)(ㄐㄧㄥ)(ㄑ
)”,表3的代音漢字“漢與真經(jīng)其”。表4所示的漢語(yǔ)音節(jié)字符“(Hàn)(Yǚ)(
ēn)(Jiē
)(Qi)”表5所示的簡(jiǎn)化音節(jié)字符“(Hàn)(
ǚ)(
ēn)(jē
)(Qi)”等漢語(yǔ)音節(jié)符號(hào)。具體的輸入方法是分別建立各種漢語(yǔ)音節(jié)符號(hào)與其輸入字符對(duì)照表,編譯出相應(yīng)的鍵盤(pán)輸入程序,即可分別輸入各種漢語(yǔ)音節(jié)符號(hào)。其中雙字節(jié)的音節(jié)字符需要圖17中漢語(yǔ)音節(jié)代碼及其音節(jié)字符支持平臺(tái)21才能顯示或打印,其它音節(jié)符號(hào)在普通的漢字系統(tǒng)上就能實(shí)現(xiàn),其中4字節(jié)的音節(jié)符號(hào)需要使用造字程序造出相應(yīng)的雙字節(jié)音節(jié)要素符號(hào)組合而成。
使用漢語(yǔ)鍵盤(pán)能夠輸入各種類(lèi)型的漢語(yǔ)音節(jié)代碼或其音節(jié)符號(hào),不管是單字節(jié)的組合代碼或其符號(hào),還是雙字節(jié)。四字節(jié)或多字節(jié)的音節(jié)代碼或其音節(jié)符號(hào),甚至是加密的音節(jié)代碼或其音節(jié)符號(hào)。其前提是提供一個(gè)漢語(yǔ)鍵盤(pán)的輸入字符與目標(biāo)音節(jié)代碼或其音節(jié)符號(hào)的對(duì)照表。編譯出相應(yīng)的鍵盤(pán)輸入程序即可輸入。所有的音節(jié)代碼或其音節(jié)符號(hào),都可以歸結(jié)為同一種類(lèi)型的漢語(yǔ)音節(jié)信息。
與現(xiàn)有技術(shù)相比,輸入一個(gè)漢語(yǔ)音節(jié)的擊鍵次數(shù)由三次減少為兩次。漢語(yǔ)音節(jié)的輸入碼長(zhǎng)由3減少為2,輸入效率提高50%。漢語(yǔ)音節(jié)的輸入速度與漢語(yǔ)口語(yǔ)表達(dá)速度相接近,可達(dá)200個(gè)音節(jié)/分鐘,最高可達(dá)300個(gè)音節(jié)/分鐘,本身就是漢語(yǔ)電腦速記。漢語(yǔ)音節(jié)的編碼效率由三鍵一音的42%(1300÷22÷35÷4),提高為兩鍵一音的61%(1300÷46÷46)。漢語(yǔ)音節(jié)的重碼率僅為千分之五,只有6對(duì)音節(jié)重碼。在普通鍵盤(pán)上非常規(guī)范地實(shí)現(xiàn)了"兩鍵一音",即漢語(yǔ)音節(jié)的帶調(diào)雙拼。與《漢語(yǔ)拼音方案》相比,161個(gè)音節(jié)要素減少為126個(gè)音節(jié)要素??梢赃M(jìn)一步簡(jiǎn)化為119個(gè);音節(jié)符號(hào)基本相同,用雙字節(jié)即可編碼,與漢字符號(hào)字節(jié)數(shù)相同并且相互兼容,能夠混合使用。交互處理。從而改進(jìn)為《漢語(yǔ)語(yǔ)音方案》。
漢語(yǔ)鍵盤(pán)輸入要素的健位布局不同。其音節(jié)的具體輸入健位也有所不同。為了表述方便,以下涉及音節(jié)的輸入時(shí)。不再區(qū)分具體的鍵盤(pán)布局。因?yàn)槊總€(gè)鍵盤(pán)都能輸入音節(jié),輸入的結(jié)果是相同的。
2.同音同義音節(jié)符號(hào)的同步轉(zhuǎn)換輸入
同音同義的音節(jié)符號(hào)之間一一對(duì)應(yīng),輸入其中一種符號(hào),就可以同步地轉(zhuǎn)換為其它的音節(jié)符號(hào)。除鍵盤(pán)的音節(jié)輸入字符,代音漢字和音節(jié)字符為兩個(gè)字節(jié)的符號(hào)之外。其它的音節(jié)符號(hào)均是多個(gè)字節(jié),而且不等長(zhǎng)。音節(jié)輸入字符是鍵盤(pán)輸入的基本字符,因?yàn)楝F(xiàn)有的漢字系統(tǒng)幾乎都建立在英文系統(tǒng)之上,為了及時(shí)發(fā)現(xiàn)輸入錯(cuò)誤,音節(jié)輸入字符一般作為提示符號(hào)顯示,一個(gè)輸入過(guò)程完成后即清除。
音節(jié)字符最有代表性,可以作為所有音節(jié)符號(hào)的同步轉(zhuǎn)換輸入的基礎(chǔ)。建立音節(jié)輸入字符與音節(jié)字符對(duì)照表,實(shí)現(xiàn)音節(jié)字符的鍵盤(pán)輸入,再分別建立音節(jié)字符與漢語(yǔ)拼音,注音符號(hào),代音漢字等漢語(yǔ)音節(jié)符號(hào)在同一個(gè)代碼體系內(nèi)或不同代碼體系之間的代碼對(duì)照表,在音節(jié)字符的輸入過(guò)程中調(diào)用,即可同步轉(zhuǎn)換輸入其它的漢語(yǔ)音節(jié)符號(hào)。如果輸入目標(biāo)不是音節(jié)字符,則可以作為一個(gè)中間過(guò)渡符號(hào)無(wú)需顯示,直接顯示目標(biāo)音節(jié)符號(hào)如果輸入目標(biāo)是音節(jié)字符。其它的音節(jié)符號(hào)可以作為提示符號(hào),以便使用輸入者熟悉的音節(jié)符號(hào)輸入不熟悉的音節(jié)字符。鍵盤(pán)輸入的提示符號(hào)和目標(biāo)符號(hào)還可以是任意的漢語(yǔ)音節(jié)符號(hào),例如,輸入注音符號(hào)時(shí),可以使用漢語(yǔ)拼音符號(hào)提示。即使輸入者不認(rèn)識(shí)注音符號(hào)也能正確輸入。因此,除具有輸入字符的提示外,還可以增加相同或不同代碼體系的各種音節(jié)符號(hào)的同步轉(zhuǎn)換輸入提示,其中后者需要使用現(xiàn)有的不同代碼體系的同屏顯示技術(shù),能夠利用輸入者熟悉的音節(jié)符號(hào),輸入不熟悉的音節(jié)符號(hào),熟悉一種音節(jié)符號(hào),就能夠輸入任意的音節(jié)符號(hào)。
輸入目標(biāo)也不限于一個(gè),可以選擇同音同義的兩個(gè)或多個(gè)音節(jié)符號(hào)同步轉(zhuǎn)換輸入,所輸入的音節(jié)字符,可以相互對(duì)比排列在同一行上,例如“ㄊㄨ
/tóng/同_ㄅ
/bù/不_ㄓㄨ
/zhuǎn/轉(zhuǎn)_ㄏㄨ
/huàn/換_ㄕㄨ/shū/書(shū)_ㄖ
/rù/入_ㄒㄧㄣ/xiēn/新_ㄐ
/jì既_ㄕ
/shù/數(shù)”,其中的漢字是代音漢字,或者相互對(duì)比排列在上下對(duì)應(yīng)的兩行或多行上,例如
“ㄊㄨ


ㄏㄨ
ㄕㄨ ㄖ
ㄒ ㄧ ㄣ ㄐ


“tóng bù zhuǎn huànshū rù xiēn jì shù”
“同 不 轉(zhuǎn) 換 書(shū)入新 既術(shù)”所輸入的目標(biāo)信息,可以是各種類(lèi)型同音同義的漢語(yǔ)音節(jié)代碼或其音節(jié)符號(hào),甚至是隨意加密的漢語(yǔ)音節(jié)代碼或其音節(jié)符號(hào),只要提供漢語(yǔ)鍵盤(pán)的音節(jié)輸入字符與其漢語(yǔ)音節(jié)代碼或其音節(jié)字符的對(duì)照表,就可以編譯出同步轉(zhuǎn)換的鍵盤(pán)輸入程序而同步輸入,即使是不能顯示的音節(jié)代碼,使用其它音節(jié)符號(hào)也能同步提示輸入。
也可以把同音同義的兩種或多種音節(jié)符號(hào),同步轉(zhuǎn)換地輸入兩個(gè)或多個(gè)相互對(duì)比的文件中。例如在分欄編輯的兩個(gè)文件之中,分別輸入漢語(yǔ)拼音符號(hào)和漢語(yǔ)音節(jié)字符,使輸入過(guò)程相互同步,在一個(gè)文件中輸入或修改,在另一個(gè)文件中自動(dòng)地進(jìn)行同樣的輸入或修改。只要其中一個(gè)文件的輸入正確無(wú)誤,其它同步轉(zhuǎn)換輸入的文件也一定正確無(wú)誤,哪怕輸入的音節(jié)符號(hào)屬于其它的代碼體系,不能在本代碼體系內(nèi)顯示和打印,也能一次性的正確輸入。例如,中國(guó)大陸的人可以在一個(gè)文件中輸入漢語(yǔ)拼音的音節(jié)符號(hào),進(jìn)行必要的編輯和修改,在另一個(gè)文件中同步轉(zhuǎn)換輸入,同步編輯和同步修改為同音同義的臺(tái)灣BIG5碼的注音符號(hào),甚至不需要顯示,再利用電子郵件發(fā)給臺(tái)灣人,對(duì)方不需要代碼轉(zhuǎn)換程序就能直接認(rèn)讀。如果使用不同代碼體系的同屏顯示技術(shù),則可以進(jìn)行不同代碼體系的音節(jié)符號(hào)的同步轉(zhuǎn)換輸入和同屏對(duì)比的顯示,編輯和修改,直接生成兩個(gè)或多個(gè)相互對(duì)比的同音同義的音節(jié)符號(hào)文件。
這項(xiàng)技術(shù)使?jié)h語(yǔ)音節(jié)的信息處理超越了不同代碼體系的界限和簡(jiǎn),繁體的字形差別,只要使用一種漢語(yǔ)音節(jié)符號(hào),就能輸入各種同音同義的漢語(yǔ)音節(jié)符號(hào),或一次輸入多個(gè)同音同義的音節(jié)符號(hào)文件,使輸入效率明顯提高,使?jié)h語(yǔ)信息處理和華人之間的信息交流更加方便。
3.同音字選擇輸入
漢語(yǔ)音節(jié)的輸入字符替換成相應(yīng)漢語(yǔ)音節(jié)的同音漢字,依據(jù)靜態(tài)的或動(dòng)態(tài)的字頻順序排列,最大輸入碼長(zhǎng)為2,同音字選擇輸入,這是最基本的漢字輸入方法,其前提是必須認(rèn)識(shí)所要輸入的漢字。對(duì)于支持音節(jié)字符的軟件,例如圖17所示的漢語(yǔ)處理系統(tǒng),把音節(jié)字符也作為一種漢字,按同音字輸入,以便代替漢語(yǔ)拼音記錄漢語(yǔ)語(yǔ)音,直接音譯外來(lái)語(yǔ),或作為只知道讀音卻不知道具體漢字的語(yǔ)音記錄符號(hào),便于以后修改。
同音字通常依據(jù)字的統(tǒng)計(jì)頻度按固定順序靜態(tài)排列,頻度高的字排在前面,其中第一個(gè)字用其讀音音節(jié)補(bǔ)加空格即可輸入,定義為二級(jí)簡(jiǎn)碼,可以直接使用表3所示的代音漢字。其它的字使用數(shù)字或上檔字符選擇輸入。經(jīng)常打字的人記住其固定順序就不需要看提示行選字了。也可在此基礎(chǔ)上進(jìn)行動(dòng)態(tài)調(diào)整,把剛剛用過(guò)的字作為最常用字,排在其它同音字的前面,因字的位置不固定,所以不適合經(jīng)常打字的人,比較適合偶爾打字的人。把兩者結(jié)合起來(lái),以統(tǒng)計(jì)數(shù)據(jù)為基礎(chǔ),每個(gè)字都標(biāo)注其頻度值,以后出現(xiàn)一次頻度加1,依據(jù)當(dāng)前頻度值由大到小的順序排列同音字,則字的相對(duì)位置比較穩(wěn)定,該調(diào)整時(shí)還能針對(duì)具體的使用者予以調(diào)整,可稱(chēng)作動(dòng)態(tài)累頻調(diào)序。此外,還可以輔助人工強(qiáng)行調(diào)序。
編制漢語(yǔ)音節(jié)的輸入字符與多個(gè)同音漢字的編碼對(duì)照表,利用一些漢字系統(tǒng)提供的漢字編碼輸入法編譯程序,就可以實(shí)現(xiàn)漢字同音字的輸入。設(shè)定最大輸入碼長(zhǎng)為2,首次擊健輸入漢字讀音的聲介母,再次擊健輸入漢字讀音的帶調(diào)介母或帶調(diào)韻母,同音漢字就顯示在提示行上,用數(shù)字或上檔字符等選擇即可輸入所要的字。動(dòng)態(tài)累頻調(diào)序的實(shí)施比較復(fù)雜,需要編制動(dòng)態(tài)累頻調(diào)序程序。
代音漢字與同音漢字的輸入可以結(jié)合起來(lái),設(shè)定最大輸入碼長(zhǎng)為2,每輸入一個(gè)音節(jié)之后,如果再輸入一個(gè)音節(jié),則前一個(gè)音節(jié)的代音漢字直接上屏,否則,輸入一個(gè)空格或其它不用于編碼的字符等標(biāo)記進(jìn)入剛剛輸入音節(jié)的同音字選擇狀態(tài),用數(shù)字或上檔字符選擇輸入。
對(duì)于電腦速記等應(yīng)用,音節(jié)的鍵盤(pán)輸入和同音字的手工選擇可以分開(kāi)處理。現(xiàn)場(chǎng)記錄時(shí)使用漢語(yǔ)音節(jié)符號(hào),之后再利用軟件逐個(gè)音節(jié)進(jìn)行手工轉(zhuǎn)換或校對(duì)。其中的音節(jié)符號(hào)使用″音節(jié)字符″或代音漢字較為適用;而其它音節(jié)符號(hào)不等長(zhǎng),有的還需要為某些音節(jié)補(bǔ)加分隔符號(hào)如空格等,選字后音節(jié)的字節(jié)數(shù)還可能變化而影響段落的整齊性。這是本發(fā)明設(shè)計(jì)″音節(jié)字符″的一個(gè)主要原因。
對(duì)于音節(jié)字符文本,可以一次性成批的選字,把光標(biāo)自動(dòng)或手動(dòng)地移動(dòng)到一個(gè)音節(jié)符號(hào),自動(dòng)打開(kāi)同音字提示行,用數(shù)字或上檔字符選字輸入。支持整句拼音輸入的″拼音王″軟件就有類(lèi)似的特色。
還可以使用單字的翻字鍵,設(shè)立一個(gè)向前順序的翻字鍵和一個(gè)向后順序的翻字鍵,例如使用成對(duì)的上下或左右光標(biāo)鍵,依據(jù)上述同音字的順序,把當(dāng)前剛剛輸入或光標(biāo)所指的音節(jié)符號(hào)或其同音字,一個(gè)一個(gè)地依次更替,直至所要輸入的字出現(xiàn)為止。
實(shí)施時(shí),需要編制每個(gè)音節(jié)符號(hào)的同音字鏈表,音節(jié)符號(hào)及其同音字依據(jù)一定的順序,一般是字的頻度順序排列,光標(biāo)指向哪個(gè)音節(jié)符號(hào)或代音漢字或任何一個(gè)同音字,就調(diào)出哪個(gè)同音字鏈表,用數(shù)字或上檔字符選擇輸入,或使用單個(gè)字的翻字鍵逐個(gè)選字輸入。
例如,輸入“漢語(yǔ)信息”四個(gè)字,分別輸入音節(jié)“hàn”提示出“1漢2焊3罕4翰5撼6捍7旱8憾9汗0悍”選1或輸入空格輸入;輸入音節(jié)“yǚ”提示出“1與2語(yǔ)3予4雨5隅6隅7虞8嶼9字0禹”選2輸入,或按一次正向翻字鍵而輸入;輸入音節(jié)“xièn”提示出“1信2芯3釁4囟”選1輸入或輸入空格輸入;輸入音節(jié)“xī”提示出“1西2息3希4析5吸6烯7昔8熙9硒0矽”選2輸入或按一次正向翻字鍵輸入?;蛘咭淮涡暂斎搿皾h語(yǔ)信息”的4個(gè)音節(jié)字符“(hàn)(yǚ)(xièn)(xī)”,以后再把光標(biāo)移動(dòng)到某個(gè)音節(jié)字符上,同時(shí)打開(kāi)同音字提示行,用數(shù)字等選字符號(hào)輸入漢字,或進(jìn)入單個(gè)漢字的翻字狀態(tài),用成對(duì)的翻字鍵依次更替。
與現(xiàn)有技術(shù)相比,區(qū)分聲調(diào)后同音字的字?jǐn)?shù)僅是不區(qū)分聲調(diào)的四分之一,同音字的選字范圍明顯減小,GB2312-80中,每個(gè)音節(jié)中最多的漢字?jǐn)?shù)為60個(gè),平均為6個(gè),一般不需要翻頁(yè)選字。
4.漢字詞語(yǔ)編碼輸入
兩鍵一音,使?jié)h字詞語(yǔ)的編碼輸入大為簡(jiǎn)化。設(shè)定最大輸入碼長(zhǎng)為4,雙字詞直接輸入讀音;三字詞輸入每個(gè)字讀音的聲介母,也可再補(bǔ)加第三個(gè)字的帶調(diào)韻母;四字及四字以上詞則輸入第一,二,三,四或最后一字的聲介母。單字的輸入則復(fù)雜一些。
除獨(dú)體字外,大部分漢字是兩個(gè)或兩個(gè)以上的字根組成,而字根幾乎都有讀音,用字根讀音或其聲介母和帶調(diào)韻母為漢字編碼,把單字看作由字根組成的詞,按詞的方式輸入。還可以利用整字的讀音代替那些難讀、難記、或結(jié)構(gòu)復(fù)雜難以拆分的字根。至于常用字,可以設(shè)計(jì)1300個(gè)一、二級(jí)簡(jiǎn)碼,用一、兩個(gè)輸入字符加一個(gè)空格輸入。表3的代音漢字也是依據(jù)漢語(yǔ)音節(jié)而選定的二級(jí)簡(jiǎn)碼漢字,具體的輸入健位取決于所用的漢語(yǔ)鍵盤(pán)。一級(jí)簡(jiǎn)碼依據(jù)每個(gè)鍵位的聲介母選定,選取每個(gè)健位的聲介母中最常用的字。
現(xiàn)有的漢字編碼輸入法,使用單個(gè)健位定義常用字根,稱(chēng)作基本字根,一般為100個(gè)左右,其余的字根要拆成基本字根,往往違背漢字的結(jié)構(gòu)規(guī)律。總計(jì)約600個(gè)字根,都必須直接或間接地標(biāo)記或映射在幾十個(gè)鍵位上,其難學(xué)、難記是不可避免的。而本發(fā)明只利用字根的讀音即兩個(gè)鍵位的組合來(lái)標(biāo)記或映射在鍵位上,所以,對(duì)基本字根的數(shù)量沒(méi)有限制,無(wú)需再拆分字根。把一個(gè)可拆的漢字看成字根組成的非單字詞而按詞輸入,認(rèn)識(shí)字根就足以輸入,并不需要記住漢字的編碼。這是人們?nèi)粘I钪幸回灢捎玫姆椒?,有著悠久的歷史,如“矢口否認(rèn)”是“知”字拆成的“矢”和“口”,等等。除一些非單字字根或不常用的字根其讀音不為人們所熟悉、需要特殊記憶之外,大部分字根都是人們認(rèn)識(shí)的。這種方法對(duì)漢字的總量沒(méi)有限制,對(duì)簡(jiǎn)體和繁體都適用。
漢字字根的制定和漢字的拆分方法取決于所用的字符集。對(duì)于GB2312-80和GB13000.1兩個(gè)字符集而言,以《信息處理用GB13000.1字符集漢字部件規(guī)范》為基礎(chǔ),有明確讀音的字根直接采用,沒(méi)有讀音的字根歸入字形相近的字根,或者″放大″字根,采用包含該字根且有讀音的字根。只能組成一,兩個(gè)字又沒(méi)有讀音的字根,直接使用其所組成的字為字根,例如″可″字的外圍字根只組成一個(gè)″可″字,所以直接使用″可″字為字根。由于字根位置的變化產(chǎn)生的筆畫(huà)變形,其字根視為同一個(gè)。例如,處在左側(cè)的字根,如果其最后一筆為“一”或“橫彎勾”,則變形為“提”“子”在左側(cè)變形為“孑”,“己”在“改”字中的筆畫(huà)變形都很明顯;處在上下位置的字根也有變形,豎長(zhǎng)形的字根變成扁形;有的字根是書(shū)寫(xiě)習(xí)慣所致,例如“絲”實(shí)際上不是三個(gè)字根組成,而是左右兩個(gè)字根的聯(lián)筆而成。此外,“印”字的左部分字根是“爪”字的變形;“獎(jiǎng)”字的上半部分字根是“將”字簡(jiǎn)化而來(lái),因此其字根應(yīng)讀“jiǎng”。與普通輸入法不同的是,由于一、二級(jí)簡(jiǎn)碼多達(dá)1300個(gè),常用字一般人都認(rèn)識(shí),很多字都按詞輸入,所以,拆字輸入的只是一小部分,只要是常用字,盡管很難拆分,也沒(méi)必要象形碼那樣非拆不可,利用簡(jiǎn)碼或同音字選字輸入也很輕松。
制定一個(gè)數(shù)量最少的基本字根集,減輕初學(xué)者的字根記憶負(fù)擔(dān);再適當(dāng)增加一些組合字根作為輔助字根,以便使用最大的字根拆分漢字。拆字的規(guī)則主要依據(jù)《信息處理用GB13000.1字符集漢字部件規(guī)范》的“《漢字基礎(chǔ)部件表》使用規(guī)則”。
對(duì)于組字頻度很高且讀音相同的字根,采取一些特殊措施以便減少重碼的數(shù)量。例如,字根″目″和″木″,可以把其中一個(gè)字根進(jìn)一步拆分,把″目″拆成″口″和″二″,或把″木″拆成″十″和″八″。
拆分漢字時(shí),盡可能拆成兩個(gè)可讀的字根,依據(jù)漢字的整體結(jié)構(gòu)而不單純依據(jù)筆畫(huà)的書(shū)寫(xiě)順序,否則容易偏離組字的本義。一般是先左后右,先上后下,先外后內(nèi),先左上角起筆后右下角末筆。例如,“講”字先拆“讠”后拆“井”;“晨”字先拆“日”后拆“辰”;“國(guó)”字先拆“口”后拆“玉”;“這”字先拆“文”后拆“辶”。上下結(jié)構(gòu)的“男”拆成“田、力”而不是“日、力”;“房”拆成“戶、方”;品字結(jié)構(gòu)的字則拆成2個(gè)或3個(gè)字根,“品”字拆成“口、口、口”,“眾”字拆成“人,從”或“人,人,人”。難以拆分的字,整字又不認(rèn)識(shí)的,可以用筆劃的讀音檢索輸入。例如用這些字的第一、二個(gè)筆劃的讀音,必要時(shí)使用第一,二,三,四或最后一個(gè)筆劃讀音的聲介母檢索輸入。也可使用通配符,替代罕用的字根。
字根的輸入,可以按其讀音補(bǔ)加一個(gè)或兩個(gè)未使用的字符而輸入,例如圖1-圖15中的字符組合fj,或圖1-圖9中的字符組合dk等,均是未用的字符組合。
拆分漢字的原則是拆大不拆小,拆整不拆零,拆相離不拆相交。例如,“意”字應(yīng)該拆成“音”和“心”而不是“立”,“日”和“心”;“嘩”字拆成“口”和“華”而不是“口”,“化”和“十”;“元”字拆成“一”和“兀”而不是“二”和“兒”。
實(shí)施例如下
設(shè)定最大輸入碼長(zhǎng)為4,雙字詞和詞組依次取其讀音的音節(jié)直接輸入;三字詞和詞組依次取第一、二、三個(gè)字讀音的聲介母補(bǔ)加空格或第三個(gè)字的帶調(diào)韻母輸入;四字及四字以上的詞和詞組依次取第一、二、三及末字讀音的聲介母編碼輸入;
單字的輸入有幾種方式
首選聲介母補(bǔ)加空格輸入的一級(jí)簡(jiǎn)碼數(shù)字鍵,符號(hào)鍵補(bǔ)加空格鍵輸入原符號(hào)的全角字符,但符號(hào)“/”補(bǔ)加空格輸入頓號(hào)“、”,字母鍵補(bǔ)加空格輸入其所表示聲介母的音節(jié)中最常用漢字作為一級(jí)簡(jiǎn)碼漢字,分別為聲介母Du-對(duì),聲介母B和Bu-不,聲介母C-從,聲介母D-的,聲介母Di和Mu-地,聲介母F-分,聲介母G-個(gè),聲介母H-和,聲介母Sh-是,聲介母Ji-就,聲介母K-可,聲介母L-了,聲介母M-每,聲介母N-能,聲介母Li-兩,聲介母P-派,聲介母Qi-其,聲介母R-人,聲介母S-三,聲介母T-他,聲介母Hu和Nü-或,聲介母Bi和Fu-并,聲介母W-為,聲介母Xi-下,聲介母Y-一,聲介母Z-在。
如果把每個(gè)輸入字符補(bǔ)加一個(gè)鍵例如“=”而輸入其全角字符,則數(shù)字鍵和符號(hào)鍵也可補(bǔ)加空格輸入一級(jí)簡(jiǎn)碼聲介母Tu-圖,聲介母Ti-條,聲介母Zu-作,聲介母Su-所,聲介母Cu-村,聲介母Qu和Ru-如,聲介母Gu-過(guò),聲介母Ju和Nu-軍,聲介母Ni-年,聲介母Ku-快,聲介母Lu和Lü-路,聲介母Yu-與,聲介母Xu-學(xué),聲介母Pi和Pu-平,聲介母Zh-中,聲介母Zhu-住,聲介母Ch-成,聲介母Chu-出,聲介母Shu-水,聲介母Mi-面。
每個(gè)音節(jié)補(bǔ)加空格輸入二級(jí)簡(jiǎn)碼,例如采用表3中的代音漢字作為二級(jí)簡(jiǎn)碼;
每個(gè)音節(jié)補(bǔ)加fj輸入該音節(jié)的同音字,重碼用數(shù)字鍵選擇輸入;
圖1-圖9所示的漢語(yǔ)鍵盤(pán),每個(gè)音節(jié)補(bǔ)加dk,而圖10-圖15所示的漢語(yǔ)鍵盤(pán)則補(bǔ)加kd,輸入該音節(jié)讀音的字根,重碼用數(shù)字選擇輸入;
表6列出字根讀音表,包括″常用字根″,用于輸入GB2312-80國(guó)標(biāo)字符集的一級(jí)漢字;補(bǔ)加″非常用字根″,輸入GB2312-80國(guó)標(biāo)字符集的漢字;補(bǔ)加″擴(kuò)充至大字符集簡(jiǎn)體字的字根″,輸入GB13000.1-93國(guó)標(biāo)大字符集簡(jiǎn)體漢字;補(bǔ)加″擴(kuò)充至大字符集繁體字的字根″,輸入GB13000.1-93國(guó)標(biāo)大字符集的漢字。根據(jù)使用者的具體應(yīng)用進(jìn)行選擇記憶。難以拆分的字列出難拆字表,用筆順等字形信息排序,便于查找和輸入。例如,根據(jù)一,丨,丿,丶,乙的筆畫(huà)順序分別排列難拆字,以便于檢索和查找。
用每個(gè)字的字根讀音為該字編碼,編碼方法與非單字詞的編碼相似,2個(gè)字根組成的字依次按其字根的讀音音節(jié)輸入,3個(gè)字根組成的字依次取字根讀音的聲介母補(bǔ)加空格或第3個(gè)字根的帶調(diào)韻母輸入,4個(gè)或4個(gè)以上字根組成的字依次取第1,2,3,4或末字根讀音的聲介母輸入。
例如,輸入“漢語(yǔ)”依次輸入音節(jié)“hàn”,“yǚ”;輸入“計(jì)算機(jī)”依次輸入聲介母“ji”,“su”,“ji”補(bǔ)加空格,或者依次輸入聲介母“ji”,“su”,“ji”補(bǔ)加第三個(gè)字“機(jī)”的帶調(diào)韻母“ī”;輸入“哈爾濱市”依次輸入聲介母“h”,“ěr”,“bi”,“shi”;輸入“人民解放軍”依次輸入聲介母“r”,“mi”,“ji”和“f”或“ju”;輸入“人造地球衛(wèi)星”依次輸入聲介母“r”,“z”,“di”和“qi”或“xi”;輸入“第一次世界大戰(zhàn)”依次輸入聲介母“di”,“y”,“ci”和“shi”或“zh”。輸入單字“鐵”拆成“钅”和“失”依次輸入音節(jié)“jiēn”,“shī”;輸入單字“眾”拆成“人”,“人”,“入”依次輸入聲介母“r”,“r”,“r”補(bǔ)加空格或補(bǔ)加第三個(gè)字的帶調(diào)韻母“én”;輸入單字“除”拆成“阝”,“人”,“一”,“木”依次輸入聲介母“fu”,“r”,“h”,“mu”;輸入單字“器”拆成“口”,“口”,“大”,“丶”,“口”,“口”依次輸入聲介母“k”,“k”,“d”,“k”。
標(biāo)點(diǎn)符號(hào)和數(shù)字符號(hào)采用原符號(hào)補(bǔ)加空格輸入,類(lèi)似于一級(jí)簡(jiǎn)碼。
這種輸入方式,除單字拆成字根再按其讀音輸入外,非單字詞取其全部或部分讀音信息即可輸入,再配合一級(jí)簡(jiǎn)碼和一千二百多個(gè)二級(jí)簡(jiǎn)碼,輸入每個(gè)漢字的平均動(dòng)態(tài)碼長(zhǎng)為2.1接近2這個(gè)極限;而現(xiàn)有技術(shù),幾乎無(wú)一例外地徘徊在平均動(dòng)態(tài)碼長(zhǎng)為3的水平上,輸入效率提高近50%。
漢語(yǔ)語(yǔ)音及其音節(jié)符號(hào)和漢字詞語(yǔ)是漢語(yǔ)信息的不同表現(xiàn)形式,是本發(fā)明實(shí)現(xiàn)了這些不同形式漢語(yǔ)信息鍵盤(pán)輸入上的統(tǒng)一,不僅輸入鍵位相同,輸入方法也基本相同,為漢語(yǔ)信息的綜合應(yīng)用和相互變換處理創(chuàng)造了條件。
5.漢字詞語(yǔ)整音節(jié)編碼輸入
把完整的漢語(yǔ)音節(jié)作為基本單元為漢字詞語(yǔ)編碼。不限定最大輸入碼長(zhǎng),以空格等字符作為結(jié)束標(biāo)記,兩字及兩字以上的詞和詞組直接按其讀音音節(jié)依次輸入,單字拆成兩個(gè)或兩個(gè)以上的字根,也按其讀音音節(jié)依次輸入,用空格等字符完成一個(gè)詞或字的輸入。例如″張″拆成″弓″和″長(zhǎng)″,″蠔″拆成″蟲(chóng)″和″毛″等分別輸入。
采用本發(fā)明第3項(xiàng)漢字詞語(yǔ)編碼輸入技術(shù),不限定最大輸入碼長(zhǎng),每個(gè)漢字詞語(yǔ)的鍵盤(pán)輸入都以空格作為結(jié)束符號(hào),就能直接實(shí)施本項(xiàng)發(fā)明。例如,輸入“漢語(yǔ)”按其讀音依次輸入音節(jié)“hà n”,“yǚ”補(bǔ)加空格結(jié)束;輸入“差不多”按其讀音依次輸入音節(jié)“chà”,“bù”,“duō”補(bǔ)加空格結(jié)束;輸入“中華人民共和國(guó)”按其讀音依次輸入音節(jié)“zhōng”,“huó”,“rén”,“mién”,“gòng”,“hé”,“guó”補(bǔ)加空格結(jié)束;輸入單字“鋼”拆成“钅”和“岡”依次輸入音節(jié)“jiēn”,“gāng”補(bǔ)加空格結(jié)束;輸入單字“眾”拆成基本字根“人”,“人”,“人”依次輸入音節(jié)“rén”,“rén”,“rén”補(bǔ)加空格結(jié)束;或者拆成“人”,和“從”依次輸入音節(jié)“rén”,“cóng”補(bǔ)加空格結(jié)束;輸入單字“除”拆成基本字根“阝”,“人”,“一”,“木”依次輸入音節(jié)“fù”,“rén”,“héng”,“mù”補(bǔ)加空格結(jié)束;或者拆成“阝”和“余”依次輸入音節(jié)“fù”,“yǘ”補(bǔ)加空格結(jié)束;輸入單字“器”拆成基本字根“口”,“口”,“大”,“丶”,“口”,“口”依次輸入音節(jié)“kǒu”,“kǒu”,“dà”,“diǎn”,“kǒu”,“kǒu”補(bǔ)加空格結(jié)束;或者拆成字根“哭”和基本字根“口”,“口”依次輸入音節(jié)“kū”,“kǒu”,“kǒu”補(bǔ)加空格結(jié)束。
標(biāo)點(diǎn)符號(hào)按其讀音音節(jié)輸入,例如“,”號(hào)用“dòuhào”輸入,“ㄍ”用“zuǒ shū mién ghào”輸入。
這種輸入方式不是最快的,但最小輸入單位都是音節(jié),和漢語(yǔ)語(yǔ)音識(shí)別輸入相同,能夠相互補(bǔ)償各自的缺點(diǎn),納入到一個(gè)系統(tǒng)中交互處理,是本發(fā)明的特色之一。由于漢語(yǔ)語(yǔ)音識(shí)別輸入的識(shí)別率有限,不認(rèn)識(shí)的漢字和單字難以準(zhǔn)確輸入,可以采用鍵盤(pán)輸入方法把漢字拆成幾個(gè)字根讀入,但需讀入空格等結(jié)尾標(biāo)記。
6.雙音單字漢語(yǔ)鍵盤(pán)輸入
以漢字詞語(yǔ)的鍵盤(pán)輸入為基礎(chǔ),用雙字詞輸入所含的單字,共有三種方法
(1).把要輸入的單字作為雙字詞的第一個(gè)字,輸入雙字詞后再用退格鍵刪除后一個(gè)字。實(shí)際上就是漢字詞語(yǔ)編碼輸入方式,只是增加單字的雙音輸入技巧。例如,要輸入單字″各″,可以輸入″各個(gè)″一詞,再用退格鍵刪除單字″個(gè)″。
(2).把漢字詞語(yǔ)輸入作為常態(tài),設(shè)置一個(gè)狀態(tài)轉(zhuǎn)換鍵,使用右Shift鍵或字符組合鍵,按一下就進(jìn)入雙音單字輸入狀態(tài),鍵入雙字詞只輸入第一個(gè)字,補(bǔ)加空格則輸入第二個(gè)字,除非再按一下轉(zhuǎn)換鍵返回詞語(yǔ)輸入狀態(tài),否則繼續(xù)保持雙音單字輸入狀態(tài)。例如,把漢字詞語(yǔ)輸入作為常態(tài),用右Shift鍵作為狀態(tài)轉(zhuǎn)換鍵,按一下之后,再輸入雙音節(jié)詞只輸入第一個(gè)字,鍵入“我們”只輸入“我”,再鍵入“來(lái)到”只輸入“來(lái)”,若此時(shí)輸入空格則輸入“到”字。直到再按一次右Shift鍵回到正常的詞語(yǔ)編碼輸入狀態(tài)。適合非單字詞比單字多的文本輸入。
(3).把雙音單字的輸入狀態(tài)作為常態(tài),需要輸入第二個(gè)字則補(bǔ)加一個(gè)空格,需要輸入非單字詞語(yǔ)則用右Shift鍵或字符組合鍵作為狀態(tài)轉(zhuǎn)換鍵切換,與輸入方式(2)正好相反。例如,把雙音單字輸入作為常態(tài),鍵入雙字詞只輸入第一個(gè)單字,補(bǔ)加空格再輸入第二個(gè)字,用組合鍵″Alt″+J等作為狀態(tài)轉(zhuǎn)換鍵,按一下進(jìn)入漢字詞語(yǔ)的編碼輸入狀態(tài),再按一下回到雙音單字輸入狀態(tài),適合單字比非單字詞多的文本輸入。
方法(2)和(3)可以納入到一個(gè)系統(tǒng)中,增設(shè)狀態(tài)轉(zhuǎn)換鍵相互切換,例如使用“Ctrl+H”的組合鍵進(jìn)行切換,以便適應(yīng)不同的輸入場(chǎng)合。
這種方法輸入單字比較容易,不需要記憶字根的讀音,容易學(xué)習(xí),可以充分發(fā)揮本發(fā)明的技術(shù)優(yōu)勢(shì)。選取與單字詞意義相同的雙字詞輸入單字,能夠促進(jìn)漢語(yǔ)雙音化,減少單字詞的使用。此外,不管單字還是非單字詞,其簡(jiǎn)體及其繁體的輸入方法均是一致的,有利于海峽兩岸及其海內(nèi)外的文化交流,也便于古籍經(jīng)典的整理和研究。
7.字形不同的同音同義漢字的同步轉(zhuǎn)換輸入
前述的第3,4,5,6項(xiàng),輸入目標(biāo)都是漢字,無(wú)論是簡(jiǎn)體漢字,還是繁體漢字,不管是GB2312-80字符集,還是GB13000.1-93字符集,或者是ISO/IEC10646字符集,以及BIG5字符集,只要有相應(yīng)的漢字系統(tǒng)的支持,編寫(xiě)相應(yīng)的漢字鍵盤(pán)輸入程序就能直接輸入。同音同義的簡(jiǎn),繁體漢字或不同代碼體系的漢字,其差別僅在于字形和代碼,原則上是同一種漢語(yǔ)信息的不同表達(dá)形式,因此只要輸入一種字形和代碼的漢字,就能夠利用固定的相互關(guān)系知識(shí)庫(kù),同步轉(zhuǎn)換輸入同音同義的其它字形的漢字代碼。這種轉(zhuǎn)換方式需要有簡(jiǎn)體和繁體相互兼容的字符集的支持,例如有Windows95中文版/98中文版的GBK字符集或WindowsNT的CJK字符集等的支持。
在GB13000.1-93字符集內(nèi),包含簡(jiǎn),繁兩種字體的漢字,可以依據(jù)其相互映射關(guān)系編制同音同義簡(jiǎn)體/繁體映射表和繁體/簡(jiǎn)體映射表,依據(jù)一種字體,就能轉(zhuǎn)換出另一種字體。應(yīng)用在鍵盤(pán)輸入過(guò)程,就是簡(jiǎn)/繁體或繁/簡(jiǎn)體同步轉(zhuǎn)換輸入。除提示鍵盤(pán)的輸入字符外,還可以提示相互對(duì)照的簡(jiǎn),繁體漢字,以便同時(shí)輸入相互對(duì)照的兩個(gè)文件,或使用認(rèn)識(shí)的漢字作為提示而輸入并不認(rèn)識(shí)的另一種字體的漢字。
由于簡(jiǎn)體漢字是從繁體漢字發(fā)展而來(lái),繁體與簡(jiǎn)體是多對(duì)一,而簡(jiǎn)體到繁體是一對(duì)多,因此繁體到簡(jiǎn)體的轉(zhuǎn)換比簡(jiǎn)體到繁體的轉(zhuǎn)換簡(jiǎn)單和容易。把繁體作為基礎(chǔ),建立繁體詞庫(kù)等知識(shí)庫(kù),配合繁體/簡(jiǎn)體轉(zhuǎn)換程序,就可以同時(shí)處理繁體和簡(jiǎn)體文字。
依據(jù)《國(guó)際標(biāo)準(zhǔn)漢字大字典》(電子工業(yè)出版社,1998年5月第一版),可以建立簡(jiǎn)體漢字/繁體漢字,以及繁體漢字/簡(jiǎn)體漢字的轉(zhuǎn)換對(duì)照表,實(shí)現(xiàn)相互變換處理。
8.代碼不同的同音同義漢字的同步轉(zhuǎn)換輸入
同樣,不同字符集的同一個(gè)漢字或簡(jiǎn)體和繁體字形不同的漢字,編制相互對(duì)照的同音同義漢字代碼映射表,例如GB2312-80與BIG5,GB13000.1-93與BIG5等等,輸入其中一種代碼的漢字,就能同步轉(zhuǎn)換為同音同義的另一種代碼的漢字。
不同代碼體系的漢字?jǐn)?shù)量都有差別,例如GB2312-80和BIG5,漢字?jǐn)?shù)分別為6763和1萬(wàn)3千多個(gè),并非一一對(duì)應(yīng),但常用漢字基本上都包含了,因此相互間的代碼轉(zhuǎn)換一般是沒(méi)問(wèn)題的。需要有GB2312-80到BIG5的代碼映射表,以及BIG5到GB2312-80的代碼映射表,才能進(jìn)行相互變換。只要輸入其中一種代碼,就可以同步地轉(zhuǎn)換為另一種代碼。在單一代碼體系的漢字系統(tǒng)上,兩者難以同時(shí)顯示,除非利用“東方快車(chē)”或“漢神中文視窗”等不同代碼漢字的同屏顯示技術(shù)才能同時(shí)顯示。
所輸入的同音同義的不同代碼的漢字,可以相互對(duì)比排列在同一行內(nèi),或者相互對(duì)比排列在上下對(duì)應(yīng)的兩行或多行上,或左右對(duì)應(yīng)的兩列或多列上。也可以把同音同義的不同代碼的漢字,同步轉(zhuǎn)換地輸入相互對(duì)比的兩個(gè)或多個(gè)文件中,每個(gè)文件輸入一種代碼的漢字。例如在分欄對(duì)比編輯的兩個(gè)文件之中,在其中一個(gè)文件中輸入簡(jiǎn)體或繁體漢字,相應(yīng)的在另一個(gè)文件中輸入同音同義的繁體或簡(jiǎn)體漢字;使輸入過(guò)程相互同步,在一個(gè)文件中輸入或修改,在另一個(gè)文件中自動(dòng)地進(jìn)行同樣的輸入或修改。只要其中一個(gè)文件的輸入正確無(wú)誤,同步轉(zhuǎn)換輸入的文件也一定正確無(wú)誤,哪怕輸入的漢字屬于其它的代碼體系,不能在本代碼體系內(nèi)顯示和打印,也能一次性的正確輸入。例如,中國(guó)大陸的人可以輸入簡(jiǎn)體漢字,同步轉(zhuǎn)換輸入臺(tái)灣的繁體漢字,直接用電子郵件發(fā)給臺(tái)灣人,對(duì)方不需要代碼轉(zhuǎn)換程序就能直接認(rèn)讀。如果使用不同代碼體系的同屏顯示技術(shù),則可以進(jìn)行同音同義不同代碼漢字的同屏對(duì)比輸入提示和編輯,直接輸入,編輯和生成兩個(gè)或多個(gè)相互對(duì)比的文件。
這項(xiàng)技術(shù)使?jié)h語(yǔ)信息處理超越了不同代碼體系的界限和簡(jiǎn),繁體的差別,只要使用一種代碼的漢字,就能輸入同音同義的各種代碼漢字,一次輸入多個(gè)對(duì)比文件,使輸入效率明顯提高,使?jié)h語(yǔ)信息處理和華人之間的信息交流更加方便。此外,只要使用輸入者熟悉的一種代碼漢字,就能輸入其它代碼體系同音同義漢字的代碼,便于相互交流。
9.同音同義的漢字和音節(jié)符號(hào)的同步轉(zhuǎn)換輸入
現(xiàn)有的音節(jié)符號(hào)/漢字符號(hào)智能轉(zhuǎn)換鍵盤(pán)輸入,都包含音節(jié)符號(hào)和漢字符號(hào)的輸入過(guò)程,只是把漢字作為唯一的輸入目標(biāo)而忽略了音節(jié)符號(hào),原因之一就是普通音節(jié)符號(hào)的實(shí)用性較差。音節(jié)字符與漢字符號(hào)兼容而且字節(jié)數(shù)相等,就可以和漢字混合使用。
漢字的語(yǔ)音合成輸出,漢字的自動(dòng)注音等都需要利用漢字提取其讀音信息。漢字包含其讀音的音節(jié)信息,所以輸入漢字能夠同步轉(zhuǎn)換輸入其音節(jié)符號(hào)。
只有一個(gè)讀音的漢字其漢字/音節(jié)轉(zhuǎn)換很簡(jiǎn)單,有一個(gè)漢字/音節(jié)映射表即可;有多個(gè)讀音的漢字,必須利用漢字的組詞屬性確定其讀音,其漢字/音節(jié)轉(zhuǎn)換較為復(fù)雜,需要漢字/音節(jié)詞庫(kù)和漢字/音節(jié)轉(zhuǎn)換知識(shí)庫(kù)。為了提高正確轉(zhuǎn)換率,漢字/音節(jié)詞庫(kù)側(cè)重于多音字的詞。每個(gè)多音字都有一個(gè)常用讀音,列入常用漢字讀音表,其它的讀音列入漢字/音節(jié)詞庫(kù)。進(jìn)行漢字/音節(jié)轉(zhuǎn)換,首先檢索漢字/音節(jié)映射表,沒(méi)有再檢索漢字/音節(jié)詞庫(kù)和漢字/音節(jié)轉(zhuǎn)換知識(shí)庫(kù),還沒(méi)有則檢索常用漢字讀音表給出常用讀音。轉(zhuǎn)換的漢字讀音可以直接使用漢語(yǔ)音節(jié)符號(hào)。使用音節(jié)字符較為理想,既能簡(jiǎn)化映射表,又便于使用音節(jié)字符/音節(jié)符號(hào)映射表轉(zhuǎn)換為其它音節(jié)符號(hào)。
漢字/音節(jié)智能轉(zhuǎn)換輸入的主要用途是漢字及其音節(jié)符號(hào)對(duì)照文本的輸入處理,主要用于漢語(yǔ)教學(xué)領(lǐng)域,兒童讀物的編輯和出版。現(xiàn)有方法有手工注音,漢語(yǔ)自動(dòng)分詞注音等,需要專(zhuān)門(mén)的軟件支持。本發(fā)明則利用圖16的漢字/音節(jié)轉(zhuǎn)換軟件22,和音節(jié)代碼與漢語(yǔ)拼音,注音符號(hào),代音漢字等的轉(zhuǎn)換軟件18,19和20,分別實(shí)現(xiàn)漢字與音節(jié)字符,漢語(yǔ)拼音,注音符號(hào),代音漢字等的轉(zhuǎn)換處理。
這項(xiàng)技術(shù)能夠同步地輸入漢字及其拼音的對(duì)照文件,用于兒童出版物的編輯和排版,提高工作效率。例如,漢字及其讀音的漢語(yǔ)拼音符號(hào)在上下兩行對(duì)比排列,只要輸入漢字,就可以利用漢字/漢語(yǔ)拼音轉(zhuǎn)換程序,同步地轉(zhuǎn)換出相應(yīng)的漢語(yǔ)拼音,標(biāo)在相應(yīng)的漢字上面,從而同時(shí)輸入,也可以同時(shí)編輯和修改。例如,以下只要輸入漢字,利用漢字/音節(jié)轉(zhuǎn)換就能同步地輸入音節(jié)符號(hào);或者只輸入第一行的注音符號(hào)或第二行的漢語(yǔ)拼音,借助音節(jié)/漢字智能轉(zhuǎn)換輸入程序的支持就能同步地輸入第三行的漢字及另一種音節(jié)符號(hào)
“ㄊㄨ

ㄓㄨ
ㄏㄨ
ㄕㄨ ㄖ
ㄒㄧㄣ ㄐ


“tóng bùzhuǎn huàn shū rù xiēnjì shù”
“同 步 轉(zhuǎn) 換 輸入 新 技 術(shù)”
10.音節(jié)/漢字智能轉(zhuǎn)換輸入
使用漢語(yǔ)鍵盤(pán)輸入漢語(yǔ)音節(jié),再采用比較成熟的音節(jié)-漢字智能轉(zhuǎn)換技術(shù),把所輸入的音節(jié)轉(zhuǎn)換為漢字詞語(yǔ),可以達(dá)到或接近兩鍵一字的漢字輸入極限,使?jié)h字輸入的難度極大的簡(jiǎn)化,便于全面的普及和應(yīng)用。圖16的漢字鍵盤(pán)輸入處理系統(tǒng),需要獨(dú)立的音節(jié)-漢字智能轉(zhuǎn)換輸入軟件;圖17的漢語(yǔ)鍵盤(pán)輸入處理系統(tǒng),直接包含音節(jié)/漢字轉(zhuǎn)換軟件19。
把微軟拼音輸入法的輸入鍵盤(pán)進(jìn)行重新定義,使用本發(fā)明的漢語(yǔ)鍵盤(pán),其漢語(yǔ)音節(jié)的表音符號(hào)由單字節(jié)的英文字母組成,其標(biāo)調(diào)符號(hào)使用數(shù)字符號(hào),即與微軟拼音輸入法相適應(yīng),就可以直接實(shí)施本項(xiàng)技術(shù)。
例如,輸入″漢語(yǔ)鍵盤(pán)是一種新技術(shù)產(chǎn)品″,依次輸入其讀音的漢語(yǔ)音節(jié),則整句轉(zhuǎn)換的過(guò)程為輸入“hàn”轉(zhuǎn)換為“漢”;輸入“yǚ”轉(zhuǎn)換為“漢語(yǔ)”;輸入“jiàn”轉(zhuǎn)換為“漢語(yǔ)建”;輸入“pó n”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)”;輸入“shì”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)是”;輸入“yì”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)示意”;輸入“zhǒng”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)是一種”;輸入“xīn”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)是一種新”;輸入“jì”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)是一種心跡”;輸入“shù”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)是一種新技術(shù)”;輸入“chǎn”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)是一種新技術(shù)產(chǎn)”;輸入“piěn”轉(zhuǎn)換為“漢語(yǔ)鍵盤(pán)是一種新技術(shù)產(chǎn)品”。
也可以把輸入的音節(jié)用音節(jié)字符表示,則在整個(gè)句子輸入完出現(xiàn)標(biāo)點(diǎn)符號(hào)或其它非漢字字符之后,整個(gè)句子一次性轉(zhuǎn)換為″漢語(yǔ)鍵盤(pán)是一種新技術(shù)產(chǎn)品″。
把音節(jié)字符作為一種漢字符號(hào)處理,那些不能確切轉(zhuǎn)換或不需要轉(zhuǎn)換的音節(jié)字符就可以直接保留,需要人工轉(zhuǎn)換時(shí)自動(dòng)查找音節(jié)字符,手工替換為漢字符號(hào)。例如用整句轉(zhuǎn)換輸入法輸入″他的名字叫章英革″,直接轉(zhuǎn)換為漢字且中間不增加修改過(guò)程的結(jié)果為″它的名字叫張應(yīng)葛″,夾雜音節(jié)字符則結(jié)果為″(tā)的名字叫(zhāng)(yīng)(gě)″,其中括號(hào)內(nèi)的拼音符號(hào)代表音節(jié)字符,如果不聯(lián)系上下文,人也很難把這些音節(jié)轉(zhuǎn)換為準(zhǔn)確的漢字,因此不能過(guò)分要求計(jì)算機(jī),所以,保留其音節(jié)字符是合理的。其后修改時(shí),凡是遇到音節(jié)字符都調(diào)出其同音字選擇輸入,或者用查找與替換的方法替換成漢字。對(duì)于外來(lái)語(yǔ)轉(zhuǎn)譯回來(lái)的不常用的中國(guó)人名,地名等,以及外國(guó)人名,地名等專(zhuān)有名詞,可以直接使用音節(jié)字符,沒(méi)必要轉(zhuǎn)換為漢字。
在音節(jié)的智能轉(zhuǎn)換輸入過(guò)程中,允許使用聲介母補(bǔ)加空格輸入一級(jí)簡(jiǎn)碼甚至二級(jí)簡(jiǎn)碼如果第偶數(shù)次輸入一個(gè)空格,則空格前面輸入的視為聲介母而輸入一級(jí)簡(jiǎn)碼漢字;如果第奇數(shù)次輸入一個(gè)空格,則空格前面輸入了完整的音節(jié),該空格的作用可以是人工切分出一個(gè)短語(yǔ),或者把剛剛輸入的音節(jié)作為二級(jí)簡(jiǎn)碼漢字處理,此時(shí)連續(xù)輸入兩個(gè)空格才能輸入一個(gè)空格。
使用漢語(yǔ)鍵盤(pán)作為″微軟拼音輸入法″的輸入鍵盤(pán),由于直接區(qū)分聲調(diào),其輸入的效果就會(huì)明顯地提高,而且能夠達(dá)到兩鍵一字的漢字輸入極限,是目前所有的漢字輸入技術(shù)都無(wú)法實(shí)現(xiàn)的。由于本發(fā)明的特殊性,音節(jié)/漢字智能轉(zhuǎn)換輸入的效率能夠進(jìn)一步地提高。
11.音節(jié)-漢字智能轉(zhuǎn)換,輔助漢字詞語(yǔ)編碼,一次性精確地輸入漢字詞語(yǔ)
以音節(jié)-漢字智能轉(zhuǎn)換為基礎(chǔ),系統(tǒng)支持的通用漢字詞語(yǔ)按其讀音的音節(jié)依次輸入,出現(xiàn)非通用的漢字詞語(yǔ),例如人名,地名,單位名等難以智能轉(zhuǎn)換的漢字或無(wú)序的及不認(rèn)識(shí)的漢字,以及字?jǐn)?shù)超過(guò)2的多字詞等,先輸入字符″\″等符號(hào)作為編碼輸入的引導(dǎo)符號(hào),把剛剛輸入的音節(jié)符號(hào)串智能轉(zhuǎn)換為漢字串,隨后編碼輸入單字或多字詞,最大輸入碼長(zhǎng)為4,重碼選擇輸入。可以使用一級(jí)簡(jiǎn)碼,二級(jí)簡(jiǎn)碼,單字編碼和詞編碼,補(bǔ)加空格或達(dá)到最大輸入碼長(zhǎng)后,如果不再輸入引導(dǎo)符號(hào),就返回到智能轉(zhuǎn)換輸入狀態(tài)。由于雙字詞只需輸入音節(jié),其數(shù)量最多,編碼輸入還需要引導(dǎo)符號(hào),因此雙字詞編碼輸入意義不大;但同音雙字詞中不常用的詞,用戶自定義的新雙字詞,也可以使用編碼方法輸入。三字及三字以上的多字詞,編碼輸入比音節(jié)符號(hào)的輸入擊鍵次數(shù)少,其詞的字?jǐn)?shù)越多越是明顯,所以多字詞的編碼輸入可以保留。有的單字拆分成字根之后,其字根的讀音可能與某些通用詞或詞組相同而產(chǎn)生重碼,使用引導(dǎo)符號(hào)就可以相互隔離而避免重碼。編碼輸入的引導(dǎo)符號(hào)可以采用閑置的字符如“\”,上擋字符如大寫(xiě)的英文符號(hào),“Tab”鍵和空格鍵等。如果使用空格,半角空格輸入兩次才能輸入一個(gè)全角空格。還可設(shè)立一個(gè)狀態(tài)轉(zhuǎn)換鍵,在音節(jié)-漢字智能轉(zhuǎn)換輸入和輔助漢字詞語(yǔ)編碼輸入的兩個(gè)輸入狀態(tài)之間進(jìn)行切換。
把本發(fā)明的漢字編碼輸入法和微軟拼音輸入法兩項(xiàng)技術(shù)結(jié)合起來(lái),就可以實(shí)施本項(xiàng)技術(shù)。例如,輸入″他的名字叫章英革″,不能正確轉(zhuǎn)換的音節(jié)(tā),(zhāng),(yīng),(gě),可以用編碼輸入漢字,用字符“\”作為編碼輸入的引導(dǎo)符號(hào)。其輸入過(guò)程為鍵入“\rényě”輸入“他”,再鍵入“dē”,“míng”,“zì”,“jiào”轉(zhuǎn)換為“的名字叫”,鍵入“\lìzǎo”輸入“章”,鍵入“\cǎoyāng”輸入“英”,“革”拆成“廿”,“口”和“十”,取每個(gè)字根的聲介母鍵入“ni”,“k”,“sh”補(bǔ)加空格輸入。
這種輸入方式能夠克服微軟拼音輸入法的缺點(diǎn),而不單純依賴音節(jié)-漢字智能轉(zhuǎn)換輸入。一般人不認(rèn)識(shí)的字以及非詞庫(kù)中的詞,還能利用漢字編碼輸入法拆字輸入,能夠正確的一次性完成整個(gè)輸入過(guò)程,避免出現(xiàn)不能正確轉(zhuǎn)換的錯(cuò)誤。
12.智能轉(zhuǎn)換,字詞編碼和動(dòng)態(tài)造詞相結(jié)合
在上述音節(jié)-漢字智能轉(zhuǎn)換和字詞編碼輸入的基礎(chǔ)上,再進(jìn)一步,凡是用字詞編碼輸入的連續(xù)排列的幾個(gè)單字,只要是系統(tǒng)詞庫(kù)中沒(méi)有的詞,都智能動(dòng)態(tài)的自動(dòng)生成新詞,臨時(shí)或永久保留在新增詞庫(kù)中,其后一旦出現(xiàn),輸入各個(gè)單字的讀音音節(jié)即可自動(dòng)轉(zhuǎn)換為漢字。新詞還同時(shí)生成新詞的鍵盤(pán)輸入編碼。
與現(xiàn)有智能拼音輸入法不同,新詞的輸入編碼與其各個(gè)單字的輸入編碼無(wú)關(guān),只與其單字的讀音有關(guān)。只有一個(gè)讀音的單字直接使用其讀音的音節(jié)或聲介母為新詞編碼,有多個(gè)讀音的單字,用其多個(gè)讀音的音節(jié)或聲介母為新詞生成多個(gè)編碼,第一次使用新詞輸入后,根據(jù)輸入者使用的讀音保留一個(gè)編碼,其余的編碼則取消。如果生成的新詞不止一個(gè)讀音,則需要不止一個(gè)新詞的生成過(guò)程;也可以保留新詞多個(gè)讀音的多個(gè)輸入編碼,但會(huì)產(chǎn)生一些無(wú)用的輸入碼,可以人工或自動(dòng)地定期刪除。
例如,上述的“章英革”在第一次輸入之后,用漢字/音節(jié)轉(zhuǎn)換程序得出其音節(jié)詞“(zhāng)(yēng)(gě)”,把音節(jié)字符與其漢字對(duì)等保存成為新詞,再出現(xiàn)時(shí)輸入三個(gè)連續(xù)的音節(jié)“(zhāng)(yēng)(gě)”就可以輸入其相應(yīng)的漢字詞“章英革”。再利用音節(jié)字符與其漢語(yǔ)鍵盤(pán)的輸入字符對(duì)照表,取這三個(gè)字讀音的聲介母“Zh”,“Y”,“G”補(bǔ)加空格或“革”字的帶調(diào)韻母“ě”而生成新詞的輸入編碼。以后直接利用其輸入編碼輸入。
同樣,用漢字編碼連續(xù)輸入“畢”和“升”兩個(gè)字之后,計(jì)算機(jī)自動(dòng)生成新詞“畢升”并保存起來(lái),以后再出現(xiàn)這個(gè)人名,輸入“BìShēng”兩個(gè)音節(jié)即可自動(dòng)輸入。
動(dòng)態(tài)自動(dòng)生成新詞的方法是,把字詞編碼輸入的連續(xù)排列的幾個(gè)單字,利用漢字/音節(jié)轉(zhuǎn)換程序轉(zhuǎn)換為相應(yīng)的音節(jié)字符,臨時(shí)或永久地保存在一個(gè)附加的音節(jié)詞-漢字詞雙向?qū)φ赵~庫(kù)中,與通用詞庫(kù)一起使用,可以選擇通用詞庫(kù)優(yōu)先或新增詞庫(kù)優(yōu)先。
13.漢語(yǔ)操作界面
漢語(yǔ)操作界面包括漢字操作界面和漢語(yǔ)音節(jié)操作界面,是漢語(yǔ)信息處理的進(jìn)一步深化。采用命令行方式的符合“規(guī)范漢語(yǔ)”的音節(jié)字符指令或相應(yīng)的漢字指令操作和應(yīng)用計(jì)算機(jī),使音節(jié)字符指令和漢字指令以及語(yǔ)音指令相互統(tǒng)一,構(gòu)成漢語(yǔ)操作界面。
在DOS操作系統(tǒng)基礎(chǔ)上,一些漢字系統(tǒng)采用漢字指令代替英文指令操作和應(yīng)用計(jì)算機(jī),由于漢字的輸入本來(lái)就比較困難,因此,阻礙了漢字指令的廣泛應(yīng)用,很多人不得不使用英文指令。實(shí)際上,操作和應(yīng)用計(jì)算機(jī)的指令很少,充其量不過(guò)幾千個(gè)詞,但卻難住了絕大多數(shù)華人。本發(fā)明使用漢語(yǔ)音節(jié)符號(hào)指令,尤其是音節(jié)字符指令,與漢語(yǔ)語(yǔ)音識(shí)別輸入的語(yǔ)音指令相統(tǒng)一。其中音節(jié)符號(hào)指令適用于漢語(yǔ)的初學(xué)者,由于漢語(yǔ)的音節(jié)符號(hào)與漢語(yǔ)口語(yǔ)一一對(duì)應(yīng),所以只要具備一定的口語(yǔ)詞匯就能使用,比以英語(yǔ)為母語(yǔ)的人學(xué)習(xí)英文指令還容易。
采用無(wú)重碼的非單音詞作為漢語(yǔ)音節(jié)字符指令,一一對(duì)應(yīng)相應(yīng)的漢字指令,具有相同的音節(jié)信息,根據(jù)需要進(jìn)行選擇,依據(jù)音節(jié)字符-漢字對(duì)照表相互轉(zhuǎn)換,語(yǔ)音信號(hào)指令則轉(zhuǎn)換為相應(yīng)的漢語(yǔ)音節(jié)字符指令再執(zhí)行,因此,漢語(yǔ)音節(jié)指令包含語(yǔ)音信號(hào)及其音節(jié)字符和相應(yīng)的漢字三種類(lèi)型,無(wú)重碼的非單音詞是確定漢語(yǔ)音節(jié)指令的規(guī)范,稱(chēng)作“漢語(yǔ)音節(jié)指令規(guī)范”。符合這一規(guī)范的漢語(yǔ)音節(jié)指令可以用作音節(jié)字符和漢字字符的鍵盤(pán)輸入指令以及語(yǔ)音識(shí)別輸入的語(yǔ)音指令。
無(wú)論使用鍵盤(pán),還是使用語(yǔ)音識(shí)別輸入裝置操作計(jì)算機(jī),或者使用字符編寫(xiě)漢語(yǔ)程序設(shè)計(jì)語(yǔ)言,都可以使用漢語(yǔ)音節(jié)指令代替英文指令,使計(jì)算機(jī)的應(yīng)用和操作徹底漢語(yǔ)化。
相應(yīng)于命令行的英文DOS指令,可以編制對(duì)等的漢語(yǔ)音節(jié)指令,既可以使用音節(jié)字符指令,又可以使用相應(yīng)的漢字字符指令,配合語(yǔ)音識(shí)別輸入裝置,又能支持漢語(yǔ)語(yǔ)音指令。例如,英文指令dir是列目錄的命令,可以使用漢語(yǔ)音節(jié)及其字符指令“mùlù”或相應(yīng)的漢字指令“目錄”代替。每個(gè)英文指令都有相應(yīng)的漢語(yǔ)音節(jié)字符及其漢字指令對(duì)應(yīng),只使用漢語(yǔ)就可以操作計(jì)算機(jī)。
《漢語(yǔ)程序設(shè)計(jì)語(yǔ)言》(電子工業(yè)出版社,1994年5月出版),采用漢字作為漢語(yǔ)匯編語(yǔ)言和程序設(shè)計(jì)語(yǔ)言的基本指令,其漢字指令的鍵盤(pán)輸入就比較困難。改成音節(jié)字符指令,難度就大為減小。
DOS命令行的字符指令可以使用圖形界面操作替代,但語(yǔ)音指令是一維線性的與圖形界面難以融合,難以替代.所以一維的漢語(yǔ)操作界面還有一定的使用價(jià)值。
采用符合“漢語(yǔ)音節(jié)指令規(guī)范”的漢語(yǔ)語(yǔ)音及其音節(jié)字符和相應(yīng)的漢字字符指令,使?jié)h語(yǔ)的語(yǔ)音和文字兩種媒介信息的指令相互統(tǒng)一。使用一種指令實(shí)現(xiàn)的操作,使用另外兩種指令也有效。漢語(yǔ)的初學(xué)者使用音節(jié)字符指令,一般人使用漢字字符指令,兩者都能使用漢語(yǔ)語(yǔ)音指令,易于普及和推廣。
14.漢語(yǔ)輸入處理系統(tǒng)
把漢語(yǔ)信息的鍵盤(pán)輸入與漢語(yǔ)語(yǔ)音識(shí)別輸入結(jié)合起來(lái),可以交替地使用鍵盤(pán)或話筒輸入漢語(yǔ)音節(jié)符號(hào)或漢字詞語(yǔ)。其中,漢語(yǔ)語(yǔ)音音節(jié)的識(shí)別輸入和音節(jié)符號(hào)的鍵盤(pán)輸入相互等效,漢字詞語(yǔ)的鍵盤(pán)編碼輸入和依據(jù)整音節(jié)漢字詞語(yǔ)編碼讀入的漢字詞語(yǔ)識(shí)別輸入相等效。
圖16中,由聲音輸入設(shè)備1輸入聲音信號(hào),用聲卡2轉(zhuǎn)換為語(yǔ)音數(shù)據(jù),再由語(yǔ)音識(shí)別輸入軟件5識(shí)別出漢字代碼,組成現(xiàn)有的漢語(yǔ)語(yǔ)音識(shí)別輸入系統(tǒng),其實(shí)質(zhì)總是包含漢語(yǔ)音節(jié)的識(shí)別輸入和音節(jié)-漢字轉(zhuǎn)換兩個(gè)環(huán)節(jié)。由于不能直接接收鍵盤(pán)輸入的漢語(yǔ)音節(jié)符號(hào),所以難以結(jié)合成一個(gè)整體。
圖17中,分離出獨(dú)立的音節(jié)/漢字轉(zhuǎn)換軟件19,可以同時(shí)或分別交替地處理來(lái)自鍵盤(pán)輸入處理軟件8和語(yǔ)音識(shí)別輸入軟件5的漢語(yǔ)音節(jié)符號(hào),使?jié)h語(yǔ)語(yǔ)音識(shí)別輸入和漢語(yǔ)信息的鍵盤(pán)輸入相互統(tǒng)一,構(gòu)成完整的漢語(yǔ)輸入系統(tǒng)。
以漢語(yǔ)鍵盤(pán)輸入為主,語(yǔ)音音節(jié)識(shí)別輸入為輔,使用相同的音節(jié)符號(hào)及其代碼,在同一個(gè)輸入窗口或輸入編輯區(qū)內(nèi)進(jìn)行輸入處理。例如,輸入“zhōnghuárénmíngònghé guó”,可以分別或交替地使用漢語(yǔ)鍵盤(pán)和漢語(yǔ)語(yǔ)音音節(jié)識(shí)別輸入。
把漢字詞語(yǔ)的鍵盤(pán)編碼輸入,應(yīng)用于漢字詞語(yǔ)的語(yǔ)音識(shí)別輸入,能夠提高語(yǔ)音識(shí)別輸入的準(zhǔn)確性和實(shí)用性。尤其是直接使用語(yǔ)音識(shí)別輸入難以正確識(shí)別的單字詞,不常用的漢字和不認(rèn)識(shí)的漢字,可以把單字拆成兩個(gè)或兩個(gè)以上的音節(jié)讀入。例如輸入″漢斯″兩個(gè)字,因?yàn)椴皇峭ㄓ迷~,只能按單字輸入,用語(yǔ)音識(shí)別按讀音很難正確輸入,可以使用鍵盤(pán)輸入的拆字方法拆成“shuěi
ò u”讀入“漢”字,“qī jīn”讀入“斯”字。
實(shí)施本項(xiàng)發(fā)明,在DOS環(huán)境下把語(yǔ)音識(shí)別輸入的音節(jié)或漢字轉(zhuǎn)換為音節(jié)符號(hào)或漢字字符,與鍵盤(pán)輸入相互融合即可。由于語(yǔ)音識(shí)別對(duì)系統(tǒng)的要求較高,因此DOS下的語(yǔ)音識(shí)別一般采用較多的硬件支持,目前還沒(méi)有統(tǒng)一的規(guī)范。
這類(lèi)輸入方法能夠有選擇的充分利用鍵盤(pán)輸入的準(zhǔn)確性,以及語(yǔ)音識(shí)別輸入的簡(jiǎn)單方便性,使兩者合而為一,在音節(jié)輸入的層次上相互統(tǒng)一,優(yōu)勢(shì)互補(bǔ)。
15.漢語(yǔ)圖形操作界面
在圖形操作界面的基礎(chǔ)上增加上述命令行方式的漢語(yǔ)語(yǔ)音指令及其音節(jié)字符指令和相應(yīng)的漢字指令操作和應(yīng)用計(jì)算機(jī),構(gòu)成漢語(yǔ)圖形操作界面。
現(xiàn)有的圖形操作界面,雖然定義了各種形式的鍵盤(pán)操作快捷鍵,但與命令行的字符指令不同,都包含控制鍵,實(shí)際是用鍵盤(pán)直接操作。由于語(yǔ)音操作的逐漸介入,必須定義適當(dāng)?shù)恼Z(yǔ)音指令。
Dutty++所實(shí)現(xiàn)的語(yǔ)音控制,和鍵盤(pán)輸入的字符指令沒(méi)有關(guān)聯(lián),因此不能實(shí)現(xiàn)鍵盤(pán)和語(yǔ)音指令的相互補(bǔ)償和相互替代。以字符的鍵盤(pán)輸入為基礎(chǔ),支持符合規(guī)范的音節(jié)字符指令和相應(yīng)的漢字指令,就能實(shí)現(xiàn)漢語(yǔ)語(yǔ)音及其音節(jié)字符和相應(yīng)漢字字符的指令操作。
在字符編輯狀態(tài)使用漢語(yǔ)鍵盤(pán),必須區(qū)別字符和字符指令兩種輸入狀態(tài)字符指令可以用回車(chē)鍵或“Tab”鍵等確認(rèn)鍵輸入,否則輸入的就是字符。使用語(yǔ)音識(shí)別輸入方式,需要區(qū)分語(yǔ)音指令識(shí)別輸入和語(yǔ)音字符識(shí)別輸入兩個(gè)狀態(tài),可以用鼠標(biāo)操作設(shè)置,或者用鍵盤(pán)輸入操作設(shè)置,也可以直接使用語(yǔ)音指令設(shè)置,例如使用“打開(kāi)語(yǔ)音控制”和“關(guān)閉語(yǔ)音控制”的語(yǔ)音指令,但其相應(yīng)字符的識(shí)別輸入必須與此相區(qū)別。
在Windows95中文版的圖形操作界面上,利用鍵盤(pán)輸入程序創(chuàng)建漢語(yǔ)操作界面,使用符合“漢語(yǔ)音節(jié)指令規(guī)范”的漢語(yǔ)音節(jié)字符指令,使?jié)h語(yǔ)語(yǔ)音識(shí)別輸入操作,漢語(yǔ)音節(jié)字符的鍵盤(pán)輸入操作,漢字字符的鍵盤(pán)輸入操作,在漢語(yǔ)音節(jié)的層次上通過(guò)漢語(yǔ)鍵盤(pán)輸入程序相互統(tǒng)一。依據(jù)其漢字編碼鍵盤(pán)輸入程序的設(shè)計(jì)規(guī)范,以及本發(fā)明第1項(xiàng)的漢語(yǔ)音節(jié)符號(hào)輸入方法,利用前述的雙向音節(jié)-漢字對(duì)照詞庫(kù)進(jìn)行相互變換,使用音節(jié)符號(hào)指令與漢語(yǔ)語(yǔ)音識(shí)別輸入程序等應(yīng)用程序相聯(lián)接,就能夠編制出符合標(biāo)準(zhǔn)IME格式的漢語(yǔ)鍵盤(pán)輸入程序。
例如,用鍵盤(pán)或語(yǔ)音識(shí)別輸入“GuānJī”的漢語(yǔ)語(yǔ)音指令及其音節(jié)字符指令或相應(yīng)的漢字字符指令“關(guān)機(jī)”,計(jì)算機(jī)經(jīng)過(guò)必要的提示和確認(rèn)即查找相應(yīng)的指令操作程序完成其操作而把計(jì)算機(jī)的電源切斷。其中“關(guān)機(jī)”指令通過(guò)漢字/音節(jié)轉(zhuǎn)換程序轉(zhuǎn)換為音節(jié)字符指令,再查找并執(zhí)行相應(yīng)的應(yīng)用程序。
16.漢語(yǔ)信息的鍵盤(pán)輸入與漢語(yǔ)語(yǔ)音合成輸出的結(jié)合
漢語(yǔ)鍵盤(pán)輸入的漢語(yǔ)音節(jié)符號(hào)或漢字詞語(yǔ),都具有讀音的信息,可以使用語(yǔ)音合成輸出程序輸出語(yǔ)音,從而實(shí)現(xiàn)鍵盤(pán)輸入的動(dòng)態(tài)語(yǔ)音校對(duì),不需要觀看顯示器即可判斷當(dāng)前的輸入是否正確,從而把視線集中到打字的文稿上,提高打字速度和準(zhǔn)確度。
語(yǔ)音合成輸出包含漢字-音節(jié)轉(zhuǎn)換和音節(jié)合成輸出兩個(gè)部分,現(xiàn)有技術(shù)通常忽略中間的音節(jié),只采用音節(jié)代碼而沒(méi)有可讀的音節(jié)符號(hào),使音節(jié)的鍵盤(pán)輸入和音節(jié)的合成輸出難以融合。圖17中,分離出獨(dú)立的漢字/音節(jié)轉(zhuǎn)換軟件20,使語(yǔ)音合成輸出軟件6能夠接收漢語(yǔ)鍵盤(pán)輸入的音節(jié)符號(hào)而直接輸出漢語(yǔ)語(yǔ)音,從而介入鍵盤(pán)輸入過(guò)程。
在整音節(jié)漢字詞語(yǔ)編碼輸入過(guò)程中,鍵盤(pán)的音節(jié)輸入直接用語(yǔ)音合成輸出,就可以進(jìn)行語(yǔ)音校對(duì),從而代替利用顯示器的視力校對(duì)。例如,輸入單字“國(guó)”,只要在鍵盤(pán)輸入過(guò)程中同步地用語(yǔ)音合成輸出“wéiyǜ”2個(gè)音節(jié)的聲音,就能判斷鍵盤(pán)輸入是正確無(wú)誤的,不再需要觀看顯示結(jié)果了。
漢語(yǔ)音節(jié)的鍵盤(pán)輸入是本發(fā)明的基礎(chǔ),漢字詞語(yǔ)的輸入是通過(guò)漢語(yǔ)音節(jié)的輸入實(shí)現(xiàn)的,所以,漢語(yǔ)音節(jié)的語(yǔ)音合成輸出校對(duì)對(duì)于漢字詞語(yǔ)的輸入很有意義,不但在漢字輸入之后能夠進(jìn)行校對(duì),在漢字輸入過(guò)程中也能進(jìn)行校對(duì),從而提高漢字輸入的精確性,減少輸入中觀看顯示器的次數(shù),降低工作強(qiáng)度。
17.漢語(yǔ)處理系統(tǒng)
把漢語(yǔ)信息的鍵盤(pán)輸入,漢語(yǔ)語(yǔ)音識(shí)別輸入和語(yǔ)音合成輸出綜合起來(lái),使?jié)h語(yǔ)音節(jié)符號(hào)和漢字詞語(yǔ)在音節(jié)的層次上相互統(tǒng)一,構(gòu)成完整的漢語(yǔ)處理系統(tǒng),能夠處理屬于文字和聲音兩種不同媒介的漢語(yǔ)信息。
由于漢語(yǔ)信息=漢字信息+音節(jié)信息,所以漢語(yǔ)處理系統(tǒng)=漢字處理系統(tǒng)+音節(jié)處理系統(tǒng)。其中音節(jié)處理系統(tǒng)主要處理音節(jié)字符,包括漢語(yǔ)語(yǔ)音識(shí)別輸入和語(yǔ)音合成輸出,音節(jié)字符的鍵盤(pán)輸入,手寫(xiě)體或印刷體識(shí)別輸入,顯示輸出和打印輸出等。由于漢語(yǔ)音節(jié)及其音節(jié)字符只有1300對(duì),與漢字字符相互兼容,使兩種字符的信息處理合而為一,所以其信息處理大為簡(jiǎn)化。
漢語(yǔ)語(yǔ)音聲音信號(hào)的識(shí)別輸入,把音節(jié)字符作為中間識(shí)別結(jié)果,與鍵盤(pán)輸入使用相同的音節(jié)-漢字轉(zhuǎn)換軟件轉(zhuǎn)換為漢字,從而簡(jiǎn)化系統(tǒng)開(kāi)銷(xiāo),避免重復(fù)處理。
漢語(yǔ)語(yǔ)音合成輸出,一改傳統(tǒng)的漢字到語(yǔ)音的直接轉(zhuǎn)換方式,利用漢字/音節(jié)轉(zhuǎn)換軟件把漢字轉(zhuǎn)換為音節(jié)字符,然后再調(diào)用聲音數(shù)據(jù)輸出語(yǔ)音信號(hào)。這樣,不管是音節(jié)文本,還是漢字文本,都能用語(yǔ)音合成輸出。
圖16是現(xiàn)有漢字處理系統(tǒng)的結(jié)構(gòu)框圖,處理的主要對(duì)象是漢字字符和英文字符。在公知的計(jì)算機(jī)基本硬件和漢字操作系統(tǒng)軟件10的基礎(chǔ)上
聲音輸入設(shè)備1,聲卡2上的模數(shù)/轉(zhuǎn)換器和語(yǔ)音識(shí)別輸入軟件5構(gòu)成的漢語(yǔ)語(yǔ)音識(shí)別輸入系統(tǒng),以及語(yǔ)音合成輸出軟件6,聲卡2上的數(shù)字/模擬轉(zhuǎn)換器,及聲音輸出設(shè)備3構(gòu)成的漢語(yǔ)語(yǔ)音合成輸出系統(tǒng),其處理對(duì)象均是漢字字符和常規(guī)漢語(yǔ)音節(jié)符號(hào),所用的漢語(yǔ)音節(jié)代碼通常是過(guò)渡性臨時(shí)代碼,不能顯示和識(shí)讀。通用鍵盤(pán)裝置4和鍵盤(pán)輸入處理軟件8構(gòu)成的漢字鍵盤(pán)輸入系統(tǒng),顯示輸出處理軟件9和顯示輸出設(shè)備7構(gòu)成的漢字顯示輸出處理系統(tǒng),圖形掃描輸入設(shè)備11和圖形字符處理軟件12構(gòu)成的圖形和漢字輸入處理系統(tǒng),打印輸出處理軟件13和打印機(jī)類(lèi)輸出設(shè)備14構(gòu)成的圖形及字符打印輸出處理系統(tǒng)等,都是以漢字為主要的輸入對(duì)象和輸出結(jié)果,均不包含與漢字字符地位相等同的漢語(yǔ)音節(jié)字符的輸入和輸出處理;
圖17是漢語(yǔ)處理系統(tǒng)的結(jié)構(gòu)框圖,是在圖16的漢字處理系統(tǒng)基礎(chǔ)上,使用漢語(yǔ)鍵盤(pán)輸入漢語(yǔ)信息,增加與漢字字符相互兼容并且字節(jié)數(shù)相等的漢語(yǔ)音節(jié)字符及其代碼的輸入,輸出及其變換處理。其中,聲音輸入設(shè)備1,聲卡2上的模/數(shù)轉(zhuǎn)換器和漢語(yǔ)語(yǔ)音識(shí)別輸入軟件5構(gòu)成漢語(yǔ)語(yǔ)音識(shí)別輸入系統(tǒng);漢語(yǔ)語(yǔ)音合成輸出軟件6,聲卡2上的數(shù)字/模擬轉(zhuǎn)換器及聲音輸出設(shè)備3構(gòu)成漢語(yǔ)語(yǔ)音合成輸出系統(tǒng);通用鍵盤(pán)裝置4,鍵盤(pán)輸入處理軟件8和音節(jié)/漢字轉(zhuǎn)換軟件21構(gòu)成漢語(yǔ)鍵盤(pán)輸入處理系統(tǒng);顯示輸出處理軟件9和顯示輸出設(shè)備7構(gòu)成圖形和字符顯示輸出處理系統(tǒng);圖形掃描輸入設(shè)備11和圖形字符處理軟件12構(gòu)成圖形和字符輸入處理系統(tǒng);打印輸出處理軟件13和打印機(jī)類(lèi)輸出設(shè)備14構(gòu)成圖形及字符打印輸出處理系統(tǒng);都是以漢語(yǔ)音節(jié)及其音節(jié)符號(hào)和漢字詞語(yǔ)為主要的輸入對(duì)象和輸出結(jié)果。
圖17與圖16相比,增加獨(dú)立的音節(jié)/漢字轉(zhuǎn)換軟件21,除處理來(lái)自語(yǔ)音識(shí)別輸入軟件5的漢字字符和音節(jié)字符外,還處理來(lái)自鍵盤(pán)輸入處理軟件8的音節(jié)字符;還增加獨(dú)立的漢字/音節(jié)轉(zhuǎn)換軟件22,把來(lái)自于系統(tǒng)軟件10和音節(jié)/漢字轉(zhuǎn)換軟件21的漢字直接轉(zhuǎn)換為漢語(yǔ)音節(jié)字符或其它漢語(yǔ)音節(jié)符號(hào),使語(yǔ)音合成輸出軟件只需處理音節(jié)符號(hào),并且可以直接把鍵盤(pán)輸入處理軟件8和語(yǔ)音識(shí)別輸入軟件5輸入的音節(jié)符號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào)輸出,簡(jiǎn)化原有的漢字處理環(huán)節(jié)。
為了向下兼容,圖17中可以選用包含音節(jié)/漢字轉(zhuǎn)換過(guò)程的語(yǔ)音識(shí)別輸入軟件5,和包含漢字/音節(jié)轉(zhuǎn)換過(guò)程的語(yǔ)音合成輸出軟件6.能夠充分發(fā)揮圖17漢語(yǔ)處理系統(tǒng)整體效率的方案則是使語(yǔ)音識(shí)別輸入軟件5不包含音節(jié)/漢字轉(zhuǎn)換過(guò)程,而語(yǔ)音合成輸出軟件6則不包含漢字/音節(jié)轉(zhuǎn)換過(guò)程。
漢語(yǔ)音節(jié)字符和漢字符號(hào)的相互變換處理,是漢語(yǔ)信息處理的一個(gè)關(guān)鍵環(huán)節(jié),也是一個(gè)難點(diǎn),難就難在漢語(yǔ)的口語(yǔ)和書(shū)面語(yǔ)的差別上。
漢語(yǔ)的語(yǔ)言和文字是同一語(yǔ)言的不同表現(xiàn)形式,其共性多于個(gè)性。每個(gè)漢字都有明確的讀音,每個(gè)語(yǔ)音音節(jié)都有相應(yīng)的漢字。不考慮字形的差別,只要是無(wú)重碼的非單字詞,兩者就是等同的,可以一一對(duì)應(yīng)和互換。單字詞的差別就明顯了,一音多字,一字多音比較普遍。因此,無(wú)重碼的非單字詞是漢語(yǔ)的語(yǔ)言和文字兩種信息的交集,也是能夠近似表達(dá)相同漢語(yǔ)意義的關(guān)鍵所在,可以稱(chēng)作“規(guī)范漢語(yǔ)”,與之對(duì)應(yīng)的稱(chēng)作“不規(guī)范漢語(yǔ)”,兩者的分界線就是“無(wú)重碼的非單字詞”,兩者的組合就是漢語(yǔ)的全集。應(yīng)用智能處理技術(shù),“規(guī)范漢語(yǔ)”會(huì)越來(lái)越大,最終成為漢語(yǔ)全集。
漢語(yǔ)的雙音化趨勢(shì)使“規(guī)范漢語(yǔ)”的集合越來(lái)越大,而“不規(guī)范漢語(yǔ)”的集合越來(lái)越小。如果用漢語(yǔ)音節(jié)字符代表其所有的同音單字詞,“規(guī)范漢語(yǔ)”與“不規(guī)范漢語(yǔ)”就合而為一了。就是說(shuō),音節(jié)字符也是一種漢字,其字義是同音字意義的總和。
使用“規(guī)范漢語(yǔ)”,更便于漢語(yǔ)尤其是口語(yǔ)的交流和理解,而且足以應(yīng)付常規(guī)的漢語(yǔ)信息處理需要。因此其用途很廣。
只有不加修改地處理現(xiàn)有的文字資料時(shí),才需要使用“不規(guī)范漢語(yǔ)”,通常是專(zhuān)業(yè)打字員的工作;如果自己用計(jì)算機(jī)寫(xiě)文章,可以只使用“規(guī)范漢語(yǔ)”而回避“不規(guī)范漢語(yǔ)”;至于操作計(jì)算機(jī),使用“規(guī)范漢語(yǔ)”已經(jīng)足夠了
可以用音節(jié)符號(hào)記錄漢語(yǔ)口語(yǔ),用空格分詞。最小的語(yǔ)言表達(dá)單位,一般語(yǔ)言是詞,漢語(yǔ)則是音節(jié)。漢字組詞的屬性是隱含的,但也是分詞的,因?yàn)槎嘁糇衷谠~中的讀音卻是明確的,只是漢語(yǔ)書(shū)面語(yǔ)沒(méi)有分詞斷空的習(xí)慣。
用漢語(yǔ)音節(jié)符號(hào)分詞表達(dá),就是漢語(yǔ)的表音文字,是漢字改革的一個(gè)方向,適合漢語(yǔ)的初學(xué)者使用,是漢語(yǔ)教學(xué)的第一個(gè)學(xué)習(xí)內(nèi)容。如果配合漢語(yǔ)音節(jié)自動(dòng)分詞技術(shù),可以不需要人工分詞,接近漢語(yǔ)口語(yǔ)的自然表達(dá)方式。
漢語(yǔ)音節(jié)的自動(dòng)分詞方法是把具有分詞標(biāo)記的音節(jié)詞和詞組,按照一定的順序如音序排列即構(gòu)成音節(jié)詞庫(kù),再增加分詞知識(shí)庫(kù)進(jìn)行分詞或組詞把詞或詞組的音節(jié)之間,用空格等分詞標(biāo)記分開(kāi);或者把組詞的音節(jié)用組詞標(biāo)記如聯(lián)字符號(hào)“-”等聯(lián)接;對(duì)于具有分隔標(biāo)記的音節(jié)串,在詞或詞組之間去除分隔標(biāo)記。由于音節(jié)詞庫(kù)總是有限的,并且不斷地增加新詞,所以,對(duì)于具有分隔標(biāo)記的音節(jié)串比較容易分詞,詞庫(kù)中沒(méi)有的詞,音節(jié)之間保持分離狀態(tài)。
符合“規(guī)范漢語(yǔ)”的音節(jié)文本和漢字文本的差別在于字形,利用音節(jié)-漢字雙向詞庫(kù)就能相互變換。所述詞庫(kù)需要分詞標(biāo)記,或組詞標(biāo)記,音節(jié)詞或漢字詞分別按照相同的次序?qū)Φ扰帕?,還可單獨(dú)用于漢語(yǔ)音節(jié)或漢字字符的自動(dòng)分詞。
不符合“規(guī)范漢語(yǔ)”的音節(jié)文本和漢字文本,其相互變換處理的難度大得多,除需要規(guī)范的音節(jié)-漢字詞庫(kù)的支持外,還需要智能轉(zhuǎn)換知識(shí)庫(kù)的支持。
必須指出,世界逐漸走向同一,漢字中夾雜一些英文字符已經(jīng)習(xí)已為常,夾雜本民族的漢語(yǔ)音節(jié)字符也理所當(dāng)然。本發(fā)明使?jié)h語(yǔ)音節(jié)字符具有漢字一樣的語(yǔ)言表達(dá)地位,是音節(jié)符號(hào)與漢字夾雜使用的一個(gè)基礎(chǔ)。
把漢語(yǔ)信息鍵盤(pán)輸入,漢語(yǔ)語(yǔ)音識(shí)別輸入,漢語(yǔ)語(yǔ)音合成輸出綜合起來(lái),把原有的鍵盤(pán)輸入和語(yǔ)音識(shí)別輸入以及音節(jié)文本到漢字文本轉(zhuǎn)換的音節(jié)-漢字轉(zhuǎn)換模塊,以及原有的語(yǔ)音合成輸出和漢字文本到音節(jié)文本的漢字-音節(jié)轉(zhuǎn)換模塊分離出來(lái)公用,從而組成漢語(yǔ)處理系統(tǒng)。其系統(tǒng)構(gòu)成建立在前述各個(gè)分項(xiàng)技術(shù)基礎(chǔ)之上,前述一些實(shí)施例的匯總就是本項(xiàng)技術(shù)的綜合實(shí)施例采用圖1所示類(lèi)型的漢語(yǔ)鍵盤(pán),表4所示的漢語(yǔ)音節(jié)字符及其代碼,本發(fā)明第1項(xiàng)的漢語(yǔ)音節(jié)符號(hào)輸入技術(shù)實(shí)施例,第4項(xiàng)的漢字詞語(yǔ)整音節(jié)編碼輸入技術(shù)實(shí)施例,第8項(xiàng)的智能轉(zhuǎn)換,字詞編碼和動(dòng)態(tài)造詞相結(jié)合的漢字詞語(yǔ)輸入技術(shù)實(shí)施例,第9項(xiàng)漢語(yǔ)輸入處理系統(tǒng)實(shí)施例,第10項(xiàng)漢語(yǔ)信息的鍵盤(pán)輸入與漢語(yǔ)語(yǔ)音合成輸出的結(jié)合實(shí)施例,就構(gòu)成一個(gè)漢語(yǔ)處理系統(tǒng)實(shí)施例。
由于本發(fā)明確立出適應(yīng)信息時(shí)代的漢語(yǔ)音節(jié)的分解和組合規(guī)則,設(shè)計(jì)出最能表現(xiàn)漢語(yǔ)特色的漢語(yǔ)音節(jié)字符,兼容漢字字符,使?jié)h語(yǔ)語(yǔ)音及其音節(jié)符號(hào)和漢字詞語(yǔ)的信息處理在音節(jié)的層次上相互統(tǒng)一,構(gòu)成漢語(yǔ)計(jì)算機(jī)的基本符號(hào)體系,使具備漢語(yǔ)拼音基礎(chǔ)知識(shí)的人就能使用計(jì)算機(jī),而無(wú)需掌握足夠多的漢字知識(shí),使學(xué)習(xí)計(jì)算機(jī)的年齡由通常小學(xué)畢業(yè)以后提前為小學(xué)一年級(jí)以后。由此可以建立具有民族特色并且直接與漢語(yǔ)語(yǔ)音系統(tǒng)相互兼容的漢語(yǔ)處理系統(tǒng),推進(jìn)計(jì)算機(jī)的漢語(yǔ)應(yīng)用和普及。


圖1-圖15是本發(fā)明設(shè)計(jì)的15種類(lèi)型的漢語(yǔ)鍵盤(pán)圖。每個(gè)鍵盤(pán)圖上,除標(biāo)注英文鍵盤(pán)的符號(hào)外,還標(biāo)注與英文符號(hào)不同的漢語(yǔ)拼音形式的聲介母,帶調(diào)韻母和帶調(diào)介母。其中聲介母的第一個(gè)字母大寫(xiě),以便與英文字符相適應(yīng),相應(yīng)的音節(jié)符號(hào)也要大寫(xiě),突出漢語(yǔ)的單音節(jié)特性。
表1簡(jiǎn)化拼音,漢語(yǔ)拼音和注音符號(hào)的聲介母對(duì)照表
表2簡(jiǎn)化拼音,漢語(yǔ)拼音和注音符號(hào)的帶調(diào)韻母對(duì)照表
表3漢語(yǔ)音節(jié)的兩元分解和兩元組合表
表4漢語(yǔ)音節(jié)字符及其代碼和代音漢字
表4漢語(yǔ)音節(jié)字符及其代碼和代音漢字(續(xù)1)
表4漢語(yǔ)音節(jié)字符及其代碼和代音漢字(續(xù)2)
表5簡(jiǎn)化漢語(yǔ)音節(jié)字符
表6 常用字根
續(xù)表6
續(xù)表權(quán)利要求
1.一種屬于計(jì)算機(jī)鍵盤(pán)輸入處理技術(shù)領(lǐng)域的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),利用公知的各種類(lèi)型計(jì)算機(jī)硬件設(shè)備及其軟件系統(tǒng),使用鍵盤(pán)輸入軟件,把漢語(yǔ)音節(jié)和漢字詞語(yǔ)等漢語(yǔ)信息分解為聲介母和帶調(diào)韻母或聲介母和帶調(diào)介母,標(biāo)記或映射在計(jì)算機(jī)鍵盤(pán)上,敲擊相應(yīng)的輸入健位,實(shí)現(xiàn)漢語(yǔ)信息的鍵盤(pán)輸入;本發(fā)明其特征是
(1).所述聲介母為b,p,m,f,d,t,n,l,g,k,h,zh,ch,sh,r,z,c,s,零聲母計(jì)19個(gè)零介聲介母;bi,pi,mi,di,ti,ni,li,ji,qi,xi,zhi,chi,shi,ri,zi,ci,si,y計(jì)18個(gè)i介聲介母;bu,pu,mu,fu,du,tu,nu,lu,gu,ku,hu,zhu,chu,shu,ru,zu,cu,su,w計(jì)19個(gè)u介聲介母;ju,qu,xu,yu,nü,lü計(jì)6個(gè)ü介聲介母;所述帶調(diào)韻母為ā,á,ǎ,à,ā i,ái,ǎi,ài,ān,án,ǎn,àn,āng,áng,ǎng,àng,āo,áo,ǎo,ào,ē,é,ě,è,ēi,éi,ěi,èi,ēn,én,ěn,èn,ēng,éng,ěng,èng,ér,ěr,èr,ō,ó,ǒ,ò,ōng,óng,ǒng,òng,ōu,óu,ǒu,òu;所述帶調(diào)介母為ī,í,ǐ,ì,ū,ú,ǔ,ù,ǖ,ǘ,ǚ,ǜ;
(2).帶調(diào)介母只能和含有相同介母的聲介母組成音節(jié),零介、i介、u介和ü介聲介母分別和帶調(diào)韻母連讀即可組成相應(yīng)的漢語(yǔ)音節(jié);
(3)所述聲介母,帶調(diào)韻母和帶調(diào)介母,分別標(biāo)記或映射在計(jì)算機(jī)鍵盤(pán)的字符鍵上,從而組成圖1,圖2,圖3,圖4,圖5,圖6,圖7,圖8,圖9,圖10,圖11,圖12,圖13,圖14或圖15所示類(lèi)型的漢語(yǔ)鍵盤(pán);
(4)首次擊鍵輸入聲介母,再次擊鍵輸入帶調(diào)介母或帶調(diào)韻母,擊鍵兩次即可輸入一對(duì)字符組成的漢語(yǔ)音節(jié)代碼,補(bǔ)加空格等分隔標(biāo)記即可代表一個(gè)漢語(yǔ)音節(jié);或者直接轉(zhuǎn)換成注音符號(hào),簡(jiǎn)化的注音符號(hào),漢語(yǔ)拼音符號(hào),簡(jiǎn)化的漢語(yǔ)拼音符號(hào),代音漢字,與漢字字符及其代碼相互兼容并且字節(jié)數(shù)相等的漢語(yǔ)音節(jié)字符及其代碼等任意一種漢語(yǔ)音節(jié)符號(hào)。
2.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是所述漢語(yǔ)鍵盤(pán)輸入的任意一種漢語(yǔ)音節(jié)符號(hào),根據(jù)輸入需要可同步轉(zhuǎn)換為同音同義的其它漢語(yǔ)音節(jié)符號(hào)。
3.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是首次輸入漢字讀音的聲介母,再次輸入漢字讀音的帶調(diào)介母或帶調(diào)韻母,擊鍵兩次即可輸入一組同音漢字,按照一定的順序排列選擇輸入。
4.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是所輸入的漢語(yǔ)信息是單個(gè)漢字、詞和詞組,最大輸入碼長(zhǎng)為4,在所述漢語(yǔ)鍵盤(pán)的輸入鍵位上,聲介母補(bǔ)加空格輸入一級(jí)簡(jiǎn)碼單字詞,每個(gè)漢語(yǔ)音節(jié)補(bǔ)加空格輸入二級(jí)簡(jiǎn)碼單字詞,雙字詞或兩個(gè)字根組成的漢字按其讀音直接輸入,三字詞或三個(gè)字根組成的漢字依次按其讀音的聲介母補(bǔ)加空格或補(bǔ)加第3個(gè)讀音的帶調(diào)韻母輸入,四字及四字以上詞和詞組或四個(gè)和四個(gè)以上字根組成的漢字分別取第1、2、3及最后一個(gè)讀音的聲介母輸入。
5.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是不限定最大輸入碼長(zhǎng),每個(gè)漢語(yǔ)音節(jié)補(bǔ)加空格輸入簡(jiǎn)碼單字詞,兩字及兩字以上的詞和詞組按其讀音的音節(jié)依次輸入,補(bǔ)加空格結(jié)束,單字拆成兩個(gè)或兩個(gè)以上的字根,也按其讀音的漢語(yǔ)音節(jié)依次輸入,補(bǔ)加空格結(jié)束。
6.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是最大輸入碼長(zhǎng)為4,使用雙字詞讀音的兩個(gè)音節(jié)輸入雙字詞的第一個(gè)字,補(bǔ)加空格再輸入雙字詞的第二個(gè)字。
7.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是輸入簡(jiǎn)體漢字或繁體漢字,使用簡(jiǎn)體-繁體或繁體-簡(jiǎn)體轉(zhuǎn)換程序,同步地轉(zhuǎn)換為同音同義的繁體漢字或簡(jiǎn)體漢字。
8.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是輸入任意一種代碼體系的漢字,使用相互轉(zhuǎn)換程序,同步地轉(zhuǎn)換為同音同義的其它代碼體系的漢字。
9.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是輸入漢字詞語(yǔ),使用漢字/讀音轉(zhuǎn)換程序,同步地轉(zhuǎn)換為漢語(yǔ)音節(jié)符號(hào)。
10.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是連續(xù)輸入漢字語(yǔ)句讀音的漢語(yǔ)音節(jié)符號(hào),使用音節(jié)-漢字智能轉(zhuǎn)換程序轉(zhuǎn)換為漢字。
11.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是對(duì)于通用漢字詞語(yǔ)組成的短語(yǔ),連續(xù)輸入其讀音的漢語(yǔ)音節(jié)符號(hào),直至出現(xiàn)非通用的人名,地名,單位名,不常用和不認(rèn)識(shí)的漢字等不能正確智能轉(zhuǎn)換的漢字,先輸入字符“\”等狀態(tài)轉(zhuǎn)換標(biāo)記完成當(dāng)前短語(yǔ)的輸入,利用相應(yīng)的音節(jié)-漢字智能轉(zhuǎn)換程序把此前輸入的音節(jié)符號(hào)轉(zhuǎn)換為漢字,并切換為一個(gè)且僅限于一個(gè)漢字詞語(yǔ)的編碼輸入狀態(tài),用漢字編碼輸入法輸入漢字。
12.按照權(quán)利要求11所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是利用漢字編碼輸入的連續(xù)兩個(gè)或兩個(gè)以上的漢字,自動(dòng)生成新詞及其輸入編碼,再次出現(xiàn)時(shí)可以使用詞的編碼輸入,或使用其讀音的漢語(yǔ)音節(jié)符號(hào)智能轉(zhuǎn)換輸入。
13.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是采用命令行方式的漢語(yǔ)語(yǔ)音及其音節(jié)符號(hào)指令和相應(yīng)的漢字指令操作計(jì)算機(jī),使?jié)h語(yǔ)語(yǔ)音指令及其音節(jié)符號(hào)指令和漢字指令在音節(jié)層次上相互統(tǒng)一,構(gòu)成漢語(yǔ)操作界面。
14.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是把漢語(yǔ)信息的鍵盤(pán)輸入與漢語(yǔ)語(yǔ)音識(shí)別輸入結(jié)合起來(lái),可以交替地使用鍵盤(pán)或話筒輸入漢語(yǔ)音節(jié)符號(hào)或漢字詞語(yǔ),構(gòu)成漢語(yǔ)輸入系統(tǒng)。
15.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是在圖形界面的基礎(chǔ)上增加命令行方式的漢語(yǔ)語(yǔ)音指令及其音節(jié)符號(hào)指令和相應(yīng)的漢字指令操作和應(yīng)用計(jì)算機(jī),構(gòu)成漢語(yǔ)圖形操作界面。
16.按照權(quán)利要求1所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是使用相同的漢語(yǔ)音節(jié)符號(hào)及其代碼,把漢語(yǔ)鍵盤(pán)輸入的漢語(yǔ)音節(jié)直接用漢語(yǔ)語(yǔ)音合成輸出,漢字則通過(guò)漢字-音節(jié)轉(zhuǎn)換程序轉(zhuǎn)換為音節(jié)符號(hào)再進(jìn)行語(yǔ)音合成輸出。
17.按照權(quán)利要求15和權(quán)利要求16所述的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),其特征是使用相同的漢語(yǔ)音節(jié)符號(hào)及其代碼,把漢語(yǔ)信息的鍵盤(pán)輸入,漢語(yǔ)語(yǔ)音識(shí)別輸入和語(yǔ)音合成輸出綜合起來(lái),使?jié)h語(yǔ)音節(jié)及其音節(jié)符號(hào)和漢字詞語(yǔ)的信息處理在音節(jié)的層次上相互統(tǒng)一,構(gòu)成漢語(yǔ)信息處理系統(tǒng)。
全文摘要
一種屬于計(jì)算機(jī)鍵盤(pán)輸入處理技術(shù)領(lǐng)域的漢語(yǔ)鍵盤(pán)輸入系統(tǒng)及其應(yīng)用技術(shù),使用公知的計(jì)算機(jī)及其普通鍵盤(pán),依次輸入聲介母和帶調(diào)韻母即可輸入一個(gè)漢語(yǔ)音節(jié),進(jìn)而輸入漢字詞語(yǔ),設(shè)計(jì)出與漢字字符相互兼容并且字節(jié)數(shù)相等的音節(jié)字符及其代碼,使?jié)h語(yǔ)語(yǔ)音及其表音符號(hào)和漢字詞語(yǔ)的鍵盤(pán)輸入,顯示和打印輸出,相互變換處理,語(yǔ)音識(shí)別輸入和合成輸出處理等,在音節(jié)層次上相互統(tǒng)一,是使用漢語(yǔ)操作和應(yīng)用計(jì)算機(jī)最全面和最徹底的解決方案。
文檔編號(hào)G06F3/023GK1275732SQ99108119
公開(kāi)日2000年12月6日 申請(qǐng)日期1999年5月30日 優(yōu)先權(quán)日1999年5月30日
發(fā)明者梁晨 申請(qǐng)人:梁晨
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
靖安县| 万全县| 大兴区| 桑日县| 康乐县| 织金县| 宁武县| 阳朔县| 措勤县| 永春县| 周宁县| 乌审旗| 铁岭市| 六安市| 乡城县| 商南县| 磐安县| 利津县| 岢岚县| 康马县| 博乐市| 呼图壁县| 富宁县| 曲水县| 札达县| 安丘市| 浦东新区| 大理市| 海门市| 广州市| 衡东县| 临夏市| 西吉县| 海宁市| 讷河市| 安仁县| 乌兰浩特市| 平利县| 孟连| 颍上县| 普兰店市|