專利名稱:精確語音輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于計算機、通訊、娛樂等智能系統(tǒng)的,用語音來輸入文字和命令的方法。
目前,現(xiàn)有的語音輸入方法都有一個重要的缺點,就是識別率在理論上和實際上都無法達到百分之百。為了提高識別率,語音輸入軟件越來越復(fù)雜,占用的計算機內(nèi)存也越來越大,使得語音輸入在手持無線電話等便攜式小型智能系統(tǒng)上的應(yīng)用受到了限制;而且,錯誤的識別導(dǎo)致錯誤的輸入再導(dǎo)致修改,使得這些語音輸入方法的效率大打折扣。
本發(fā)明的目的是為計算機、通訊、娛樂等智能系統(tǒng)提供一種精確可靠、快速便捷的用語音輸入文字和命令的方法。
本發(fā)明的技術(shù)方案是,確定一組簡單、易區(qū)分的發(fā)音單元,使其與一種輸入法的各個碼元一一對應(yīng);按照該輸入法編碼的規(guī)則,依次讀出欲輸入的文字和命令的編碼所對應(yīng)的發(fā)音單元;再使智能系統(tǒng)把這些經(jīng)過了編碼的發(fā)音單元按照該輸入法的編碼規(guī)則轉(zhuǎn)換成對應(yīng)的文字和命令,從而實現(xiàn)這些文字和命令的輸入。本方案的特點,是按照一定的編碼輸入法規(guī)則,用發(fā)音單元組成的聲音編碼來實現(xiàn)智能系統(tǒng)的文字和命令輸入,而不是直接按照文字或命令的自然語音本身來輸入。
本發(fā)明的有益效果使語音軟件大大地簡化,占用的計算機內(nèi)部資源也大大減少,使得語音輸入在手持無線電話等超小型智能系統(tǒng)上的也能方便地應(yīng)用;由于該輸入法最少可以只接受40個左右的發(fā)音單元,所以能夠輕易地排除其它聲音的干擾,在理論上可達到準零誤輸;可以在非常嘈雜的環(huán)境中工作,甚至有人在旁邊大聲說話也不影響正常輸入;也可以用耳語輸入以免干擾他人;輸入者可用語音的方式按自己熟悉的鍵盤輸入法來輸入,簡單易行;熟練后的輸入漢字的速度約相當于自然語言速度的1.3倍。
實施例1確定一組簡單、易區(qū)分的發(fā)音單元,使其與計算機、通訊、娛樂等智能系統(tǒng)的輸入鍵盤上用于文字輸入的鍵(如字母鍵、數(shù)字鍵、符號鍵、空格鍵、回車鍵、功能鍵等)建立一一對應(yīng)的關(guān)系;每當操作者說出一個發(fā)音單元時,就使智能系統(tǒng)作出一個反應(yīng),相當于使對應(yīng)的鍵被擊下;按照一定的鍵盤輸入法的編碼規(guī)則,確定欲輸入的文字和命令的編碼及該編碼所對應(yīng)的各個鍵;說出與這些鍵對應(yīng)的發(fā)音單元,再使智能系統(tǒng)對這些經(jīng)過了編碼的發(fā)音單元依次作出反應(yīng),相當于使對應(yīng)的鍵被依次擊下;從而按照該輸入法實現(xiàn)文字和命令的輸入。
實施例2確定一組簡單、易區(qū)分,并且與所要輸入的文字本身具有較強關(guān)聯(lián)性的發(fā)音單元,是將本發(fā)明成功用于各種輸入法的關(guān)鍵之一。下面是一個將本發(fā)明用于漢字的筆順或筆形輸入法時,確定發(fā)音單元的實施例。
筆順或筆形輸入法一般把漢字的筆劃歸為五種橫(heng)、豎(shu)、撇(pie)、捺(na)、折(zhe);取這五種筆劃的任意兩種,可形成25種筆順,把這五種筆劃的漢語讀音分別簡化為橫(ho)、豎(su)、撇(pi)、捺(na)、折(ze)。這些簡化后的讀音的特點是,均由一個單聲母和一個單韻母組成,聲母和韻母都不重復(fù)使用,既保留了這些筆劃的原漢語讀音的主要特征,又使這些讀音簡單短促、容易區(qū)分。
把25種筆順的讀音再作一次簡化,用一個“特音”來代表。特音是這樣構(gòu)成的第一個筆劃簡化讀音的聲母+第二個筆劃簡化讀音的韻母。25種筆順組合及其特音列表如下橫橫(ho)、橫豎(hu)、橫撇(hi)、橫捺(ha)、橫折(he)
豎橫(so)、豎豎(su)、豎撇(si)、豎捺(sa)、豎折(se)撇橫(po)、撇豎(pu)、撇撇(pi)、撇捺(pa)、撇折(pe)捺橫(no)、捺豎(nu)、捺撇(ni)、捺捺(na)、捺折(ne)折橫(zo)、折豎(zu)、折撇(zi)、折捺(za)、折折(ze)使這些特音與一種筆順或筆形輸入法的碼元一一對應(yīng);按照該輸入法編碼的規(guī)則,依次說出欲輸入的文字和命令的編碼所對應(yīng)的特音;再使智能系統(tǒng)把這些經(jīng)過了編碼的特音按照該輸入法的編碼規(guī)則轉(zhuǎn)換成對應(yīng)的文字和命令,從而實現(xiàn)這些文字和命令的輸入。
將本發(fā)明及本實施例的特音的確定方法與筆順或筆形輸入法結(jié)合起來使用,具有極好的直觀性,這樣就可使輸入者見字會讀,使?jié)h字的輸入實現(xiàn)“音形書統(tǒng)一”。
權(quán)利要求
1.一種用于計算機、通訊、娛樂等智能系統(tǒng)的,用語音來輸入文字的方法,其特征是確定一組簡單、易區(qū)分的發(fā)音單元,使其與一種輸入法的各個碼元一一對應(yīng);按照該輸入法編碼的規(guī)則,依次說出欲輸入的文字和命令的編碼所對應(yīng)的發(fā)音單元;再使智能系統(tǒng)把這些經(jīng)過了編碼的發(fā)音單元按照該輸入法的編碼規(guī)則轉(zhuǎn)換成對應(yīng)的文字和命令,從而實現(xiàn)這些文字和命令的輸入。
2.根據(jù)權(quán)利要求1所述的語音輸入法,其特征是確定一組簡單、易區(qū)分的發(fā)音單元,使其與計算機、通訊、娛樂等智能系統(tǒng)的輸入鍵盤上用于文字輸入的鍵(如字母鍵、數(shù)字鍵、符號鍵、空格鍵、回車鍵、功能鍵等)建立一一對應(yīng)的關(guān)系;每當操作者說出一個發(fā)音單元時,就使智能系統(tǒng)作出一個反應(yīng),相當于使對應(yīng)的鍵被擊下;按照一定的鍵盤輸入法的編碼規(guī)則,確定欲輸入的文字和命令的編碼及該編碼所對應(yīng)的各個鍵;說出與這些鍵對應(yīng)的發(fā)音單元,再使智能系統(tǒng)對這些經(jīng)過了編碼的發(fā)音單元依次作出反應(yīng),相當于使對應(yīng)的鍵被依次擊下;從而按照該輸入法實現(xiàn)文字和命令的輸入。
3.根據(jù)權(quán)利要求1所述的語音輸入法,其特征是把漢字中“橫豎撇捺折”五種筆劃的漢語讀音,分別簡化為橫(ho)、豎(su)、撇(pi)、捺(na)、折(ze);把由這五種筆劃兩兩組合形成的25種筆順的讀音,在前述筆劃簡化讀音的基礎(chǔ)上再作一次簡化,構(gòu)成“特音”;特音的構(gòu)成規(guī)律是這樣的第一個筆劃簡化讀音的聲母+第二個筆劃簡化讀音的韻母;25種筆順及其特音列表如下橫橫(ho)、橫豎(hu)、橫撇(hi)、橫捺(ha)、橫折(he)豎橫(so)、豎豎(su)、豎撇(si)、豎捺(sa)、豎折(se)撇橫(po)、撇豎(pu)、撇撇(pi)、撇捺(pa)、撇折(pe)捺橫(no)、捺豎(nu)、捺撇(ni)、捺捺(na)、捺折(ne)折橫(zo)、折豎(zu)、折撇(zi)、折捺(za)、折折(ze)使這些特音與一種筆順或筆形輸入法的碼元一一對應(yīng);按照該輸入法的編碼規(guī)則,依次說出欲輸入的文字和命令的編碼所對應(yīng)的特音;再使智能系統(tǒng)把這些經(jīng)過了編碼的特音,按照該輸入法的編碼規(guī)則轉(zhuǎn)換成對應(yīng)的文字和命令,從而實現(xiàn)這些文字和命令的輸入。
全文摘要
一種用于計算機、通訊、娛樂等智能系統(tǒng)的,用語音來輸入文字的方法。它用若干個指定的發(fā)音所組成的編碼來實現(xiàn)智能系統(tǒng)的文字和命令輸入,而不是直接按照語音本身來輸入文字和命令。它使語音軟件大大簡化,能方便地用于手機等超小型智能系統(tǒng)上;基本上沒有識別錯誤;抗干擾力強,即使有人在旁邊大聲說話也不影響輸入;可以用耳語輸入;可按自己熟悉的鍵盤輸入法來輸入;熟練后的輸入漢字的速度約相當于自然語言速度的1.3倍。
文檔編號G06F3/023GK1420421SQ01139520
公開日2003年5月28日 申請日期2001年11月20日 優(yōu)先權(quán)日2001年11月20日
發(fā)明者邵躍波 申請人:邵躍波, 張彥