两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語(yǔ)音識(shí)別用的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置的制作方法

文檔序號(hào):2822411閱讀:345來(lái)源:國(guó)知局
專利名稱:語(yǔ)音識(shí)別用的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及識(shí)別非特定說(shuō)話者語(yǔ)音的語(yǔ)音識(shí)別裝置,該裝置能夠?qū)δ行缘牡鸵?、女性的高音及孩子的聲音在大范圍?nèi)進(jìn)行語(yǔ)音識(shí)別處理,更詳細(xì)地說(shuō),本發(fā)明涉及將識(shí)別對(duì)象語(yǔ)音的音程與語(yǔ)音識(shí)別裝置的標(biāo)準(zhǔn)語(yǔ)音的音程加以對(duì)照進(jìn)行標(biāo)準(zhǔn)化處理的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置。
背景技術(shù)
近年來(lái),語(yǔ)音識(shí)別技術(shù)由于數(shù)字信號(hào)處理技術(shù)的進(jìn)步、處理用LSI的性能不斷提高且價(jià)格日益降低,正大量引入民用裝置中,從而有助于提高該裝置的操作性能。語(yǔ)音識(shí)別裝置的基本原理是將輸入的語(yǔ)音變換成數(shù)字語(yǔ)音信號(hào),再將該數(shù)字語(yǔ)音信號(hào)與預(yù)先準(zhǔn)備的語(yǔ)音辭典中登錄的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行對(duì)照,來(lái)識(shí)別輸入的語(yǔ)音。由此,為了便于與標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)進(jìn)行比較,采用了一些方法,例如對(duì)于作為語(yǔ)音識(shí)別對(duì)象的特定說(shuō)話者要求采用特別的發(fā)音方法,或者這些特定說(shuō)話者的語(yǔ)音預(yù)先登錄在語(yǔ)音識(shí)別裝置中。
但是,在將語(yǔ)音識(shí)別裝置用于民用裝置中時(shí),如果限定說(shuō)話者,則方便性大大降低,其商品價(jià)值受到影響。因此,必須將非特定說(shuō)話者發(fā)出的語(yǔ)音作為輸入語(yǔ)音進(jìn)行識(shí)別。當(dāng)然,非特定說(shuō)話者的發(fā)聲是各種各樣的。對(duì)于這樣的非特定說(shuō)話者產(chǎn)生的富有變化的發(fā)聲,可將有損語(yǔ)音識(shí)別精度影響語(yǔ)音識(shí)別的主要因素大致分為發(fā)聲速度及語(yǔ)音音程兩種。
關(guān)于影響語(yǔ)音識(shí)別的第1個(gè)因素,即發(fā)聲速度,例如說(shuō)話說(shuō)得快的人等,因說(shuō)話者不同,說(shuō)話速度就有差別。語(yǔ)音識(shí)別是將輸入的語(yǔ)音與預(yù)先準(zhǔn)備的語(yǔ)音辭典中登錄的標(biāo)準(zhǔn)速度語(yǔ)音進(jìn)行比較,從而來(lái)實(shí)現(xiàn)識(shí)別的。因此,若兩者發(fā)聲速度之差達(dá)到一定程度以上,就不能正確進(jìn)行比較,也不能進(jìn)行語(yǔ)音識(shí)別。
關(guān)于影響語(yǔ)音識(shí)別的第2個(gè)主要因素,即語(yǔ)音音程,例如男性低音的語(yǔ)音、女性或孩子發(fā)出的高音等,因說(shuō)話者不同,其語(yǔ)音音程就有差別。這種情況下,若預(yù)先準(zhǔn)備的語(yǔ)音辭典中登錄的語(yǔ)音音程與非特定說(shuō)話者發(fā)聲的語(yǔ)音音程之差達(dá)到一定程度以上,就不能正確進(jìn)行比較,也不能進(jìn)行語(yǔ)音識(shí)別。
圖5所示為解決上述問(wèn)題在特開平9-325798號(hào)公報(bào)中提出的語(yǔ)音識(shí)別裝置。如該圖所示,語(yǔ)音識(shí)別裝置VRAc包括語(yǔ)音輸入部111、發(fā)聲速度計(jì)算部112、發(fā)聲速度變換率決定部113、發(fā)聲速度變換部114及語(yǔ)音識(shí)別部115。
語(yǔ)音輸入部111將取入的非特定說(shuō)話者發(fā)出語(yǔ)音的模擬語(yǔ)音信號(hào)經(jīng)過(guò)A/D變換,變換為數(shù)字信號(hào),生成語(yǔ)音信號(hào)。發(fā)聲速度計(jì)算部112根據(jù)語(yǔ)音信號(hào)計(jì)算出輸入的非特定說(shuō)話者的發(fā)聲速度。發(fā)聲速度變換決定部113將發(fā)聲速度計(jì)算部112計(jì)算出的發(fā)聲速度與基準(zhǔn)速度進(jìn)行比較,確定速度變換率。發(fā)聲速度變換部114根據(jù)該速度變換率將發(fā)聲速度加以變換。語(yǔ)音識(shí)別部115對(duì)發(fā)聲速度變換部114進(jìn)行了速度變換的輸入語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別。
下面說(shuō)明語(yǔ)音識(shí)別裝置VRAc的動(dòng)作。由非特定說(shuō)話者發(fā)出的語(yǔ)音經(jīng)過(guò)語(yǔ)音輸入部111的話筒及放大器取入,再利用A/D變換器,從模擬信號(hào)變換為數(shù)字信號(hào),發(fā)聲速度計(jì)算部112從變換的數(shù)字語(yǔ)音信號(hào)取出輸入語(yǔ)音的一個(gè)音。然后,發(fā)聲速度計(jì)算部112根據(jù)取出一個(gè)音的取出時(shí)間,計(jì)算一個(gè)音的發(fā)聲速度。
設(shè)發(fā)聲速度計(jì)算部112取出一個(gè)音所需要的時(shí)間(下面稱為“一個(gè)音取出時(shí)間”)為Ts,非特定說(shuō)話者一個(gè)音發(fā)聲所需要的基準(zhǔn)時(shí)間(下面稱為“一個(gè)音發(fā)聲基準(zhǔn)時(shí)間”)為Th。在發(fā)聲速度變換率決定部分113中,根據(jù)一個(gè)音取出時(shí)間Ts及一個(gè)音發(fā)聲基準(zhǔn)時(shí)間Th,將一個(gè)音發(fā)聲速度1/Ts與基準(zhǔn)一個(gè)音發(fā)聲速度1/Th進(jìn)行比較,確定速度變換率α。速度變換率α利用下式(1)能夠算出。
α=Ts/Th…(1)由上述式(1)可知,當(dāng)一個(gè)音取出時(shí)間Ts比一個(gè)音發(fā)聲基準(zhǔn)時(shí)間Th要短,即輸入語(yǔ)音的發(fā)聲速度比聲音識(shí)別裝置VRAc能夠正確識(shí)別的發(fā)聲速度要快時(shí),速度變換率α小于1。這種情況下,必須將輸入語(yǔ)音的發(fā)聲速度放慢。反之,當(dāng)一個(gè)音取出時(shí)間Ts比一個(gè)音發(fā)聲基準(zhǔn)時(shí)間Th要長(zhǎng),即輸入語(yǔ)音的發(fā)聲速度比聲音識(shí)別裝置VRAc能夠正確識(shí)別的發(fā)聲速度慢時(shí),速度變換率α大于1。這種情況下,必須將輸入語(yǔ)音的發(fā)聲速率加快。
在語(yǔ)音識(shí)別裝置VRAc中,根據(jù)速度變換率α,發(fā)聲速度變換部114對(duì)輸入語(yǔ)音信號(hào)進(jìn)行速度變換,使發(fā)聲速度成為一定,從而生成速度變換輸入語(yǔ)音信號(hào)。語(yǔ)音識(shí)別部115對(duì)速度變換輸入語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別處理,將得到的識(shí)別結(jié)果輸出。
上述速度變換利用最近的數(shù)字技術(shù)很容易能夠?qū)崿F(xiàn)。例如要使輸入語(yǔ)音的發(fā)聲速度放慢時(shí),只要在語(yǔ)音信號(hào)中增加若干個(gè)與輸入語(yǔ)音的一個(gè)音有相關(guān)性的母音波形而使語(yǔ)音信號(hào)的發(fā)聲時(shí)間延長(zhǎng)即可。另外,要使輸入語(yǔ)音的發(fā)聲速度加快時(shí),只要從語(yǔ)音信號(hào)多次抽掉輸入語(yǔ)音中一個(gè)音的母音波形即可。
該處理是不改變輸入語(yǔ)音的音程而改變語(yǔ)速的稱為語(yǔ)速變換技術(shù)。即在語(yǔ)音識(shí)別中,對(duì)于發(fā)聲速率因人而異的非特定說(shuō)話者中,特別是對(duì)于說(shuō)得快的說(shuō)話者所發(fā)出的語(yǔ)音,利用語(yǔ)速變換技術(shù)能夠提高對(duì)說(shuō)得快的說(shuō)話者發(fā)出語(yǔ)音的識(shí)別率。
在上述以往的語(yǔ)音識(shí)別裝置VRAc中,對(duì)于與基準(zhǔn)一個(gè)音發(fā)聲速度1/Th相比,發(fā)聲速度不一樣的非特定說(shuō)話者的語(yǔ)音能夠提高識(shí)別率,即對(duì)于影響語(yǔ)音識(shí)別的第1個(gè)主要因素是有效的。但是,對(duì)于相對(duì)基準(zhǔn)語(yǔ)音有高低差的發(fā)聲語(yǔ)音,即影響語(yǔ)音識(shí)別的第2個(gè)主要因素,也就是有高低差的發(fā)聲語(yǔ)音,不能指望提高識(shí)別率。
詳細(xì)來(lái)說(shuō),語(yǔ)音識(shí)別裝置VRAc雖然能夠適應(yīng)男性的低音及女性和孩子的高音等很寬的頻率范圍,但語(yǔ)音識(shí)別率不高。另外,對(duì)于說(shuō)得快的說(shuō)話者,只要使說(shuō)話者慢慢說(shuō)就可解決問(wèn)題,但希望說(shuō)話者改變音色來(lái)發(fā)聲就比較困難。說(shuō)話者基準(zhǔn)發(fā)聲頻率是取決于說(shuō)話者喉部形狀及大小。也就是說(shuō),由于不能改變說(shuō)話者的喉部形狀,因此也不能改變其發(fā)聲音色。
所以,語(yǔ)音識(shí)別裝置VRAc存在的問(wèn)題是,為了對(duì)非特定說(shuō)話者各自發(fā)聲的音色差也能夠提高語(yǔ)音識(shí)別率,必須具有多種對(duì)男性語(yǔ)音、女性及小孩語(yǔ)音等進(jìn)行語(yǔ)音識(shí)別所需要的不同音程的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù),再根據(jù)說(shuō)話者的音色,來(lái)切換所參照的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)。
發(fā)明揭示本發(fā)明為達(dá)到上述目的,具有下述特征。
本發(fā)明第1方面的一種輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置,用于根據(jù)語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù),識(shí)別非特定講話者發(fā)出的輸入語(yǔ)音的語(yǔ)音識(shí)別裝置,把該輸入語(yǔ)音的音程變換成與該語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系的音程,該輸入語(yǔ)音標(biāo)準(zhǔn)化裝置包括
判斷所述輸入語(yǔ)音與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程差的音程判斷手段;音程變換手段,根據(jù)所述音程差判斷手段判斷的音程差變換所述輸入語(yǔ)音的頻率,使所述輸入語(yǔ)音的音程與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程為預(yù)定關(guān)系。
如上所述,在第1方面中,輸入語(yǔ)音音程調(diào)整成與語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程一致,從而可提高語(yǔ)音識(shí)別率。
本發(fā)明第2方面,在第1方面中,該裝置還包括暫存所述輸入語(yǔ)音的存儲(chǔ)器;從所述存儲(chǔ)器讀出所述輸入語(yǔ)音串,生成識(shí)別對(duì)象語(yǔ)音信號(hào)的讀出控制器;所述音程差判斷器包括頻率分量分析器,分析所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率分量,生成頻率分量信號(hào);音程判定器,根據(jù)所述頻率分量信號(hào),求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)信號(hào)的基頻,同時(shí),判定所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)與該基頻的音程差,生成音程差信號(hào)。
如上所述,在第2方面中,輸入語(yǔ)音可是1個(gè)音,也可是多個(gè)音組成的單詞。
本發(fā)明第3方面,在第2方面中,所述音程判定器求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰作為基頻,并比較該識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的第1共振峰以判定所述音程差,從而不管所述識(shí)別對(duì)象語(yǔ)音是一個(gè)音還是幾個(gè)音構(gòu)成,均可穩(wěn)定判定音程差。
如上所述,在第3方面中,不管輸入語(yǔ)音是一個(gè)音或多個(gè)音構(gòu)成的單詞,均可按輸入語(yǔ)音單元,以頻率特性穩(wěn)定的第1共振峰與識(shí)別標(biāo)準(zhǔn)特性數(shù)據(jù)作音程比較,從而不需進(jìn)行從輸入語(yǔ)音切取一個(gè)音的處理,使處理迅速且裝置構(gòu)成簡(jiǎn)單。
本發(fā)明第4方面,在第3方面中,所述音程變換器包含讀出時(shí)鐘控制器,確定所述存儲(chǔ)器的讀出定時(shí)時(shí)鐘頻率,生成讀出時(shí)鐘信號(hào),以便根據(jù)所述音程差信號(hào)變換所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率;所述存儲(chǔ)器根據(jù)所述讀出時(shí)鐘信號(hào),輸出所述識(shí)別對(duì)象語(yǔ)音信號(hào),使與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系。
如上所述,在第4方面中,通過(guò)改變存儲(chǔ)器讀出定時(shí),可不損害識(shí)別對(duì)象語(yǔ)音信號(hào)的波形特征而改變其音程,從而不需插補(bǔ)和抽取處理。
本發(fā)明第5方面是備有第4方面輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置的語(yǔ)音識(shí)別裝置。
本發(fā)明第6方面的一種語(yǔ)音識(shí)別裝置,根據(jù)語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù),識(shí)別不特定講話者發(fā)出的輸入語(yǔ)音;它包括把所述輸入語(yǔ)音的音程變換成與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系的音程的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置;語(yǔ)音分析器,比較變換所述音程的輸入語(yǔ)音與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù),生成指示與所述輸入語(yǔ)音一致的語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的識(shí)別信號(hào)。
如上所述,在第6方面,把輸入語(yǔ)音音程調(diào)整得與語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程一致,從而可提高語(yǔ)音識(shí)別率。
本發(fā)明第7方面,在第6方面中,該裝置還包括暫存所述輸入語(yǔ)音的存儲(chǔ)器;從所述存儲(chǔ)器讀出所述輸入語(yǔ)音串,生成識(shí)別對(duì)象語(yǔ)音信號(hào)的讀出控制器;所述音程差判斷器包括頻率分量分析器,分析所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率分量,生成頻率分量信號(hào);音程判定器,根據(jù)所述頻率分量信號(hào),求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)的基頻,同時(shí),判定所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)與該基頻的音程差,生成音程差信號(hào)。
如上所述,在第7方面,輸入語(yǔ)音可是1個(gè)音,也可是多個(gè)音構(gòu)成的單詞。
本發(fā)明第8方面,在第7方面中,所述音程判定器求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰作為基頻,并比較該識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的第1共振峰以判定所述音程差,從而不管所述識(shí)別對(duì)象語(yǔ)音是一個(gè)音還是幾個(gè)音構(gòu)成,均可穩(wěn)定判定音程差。
如上所述,在第8方面,不管輸入語(yǔ)音是一個(gè)音或多個(gè)音構(gòu)成的單詞,均可按輸入語(yǔ)音單元,以頻率特性穩(wěn)定的第1共振峰與識(shí)別標(biāo)準(zhǔn)特性數(shù)據(jù)作音程比較,從而不需進(jìn)行從輸入語(yǔ)音切取一個(gè)音的處理,使處理迅速且裝置構(gòu)成簡(jiǎn)單。
本發(fā)明第9方面,在第8方面中,所述音程變換器包含讀出時(shí)鐘控制器,確定所述存儲(chǔ)器的讀出定時(shí)時(shí)鐘頻率,生成讀出時(shí)鐘信號(hào),以便根據(jù)所述音程差信號(hào)變換所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率;所述存儲(chǔ)器根據(jù)所述讀出時(shí)鐘信號(hào),輸出所述識(shí)別對(duì)象語(yǔ)音信號(hào),使與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系。
如上所述,在第9方面中,通過(guò)改變存儲(chǔ)器讀出定時(shí),可不損害識(shí)別對(duì)象語(yǔ)音信號(hào)的波形特征而改變其音程,從而不需插補(bǔ)和抽取處理。
圖2是有不同音程的語(yǔ)音頻譜圖。
圖3是語(yǔ)音波形隨時(shí)間變化的例子及其間進(jìn)行的音程變換方法的說(shuō)明圖。
圖4是示于

圖1的輸入語(yǔ)音標(biāo)準(zhǔn)化裝置的動(dòng)作流程圖。
圖5是以往的語(yǔ)音識(shí)別裝置的構(gòu)成框圖。
參照?qǐng)D1,對(duì)內(nèi)含本發(fā)明實(shí)施形態(tài)的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置的語(yǔ)音識(shí)別裝置加以說(shuō)明。語(yǔ)音識(shí)別裝置VRAp包含A/D變換器1、輸入語(yǔ)音標(biāo)準(zhǔn)化裝置Tr、標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13、語(yǔ)音分析器15及控制器17。標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13存儲(chǔ)作為語(yǔ)音識(shí)別基準(zhǔn)的語(yǔ)音頻率分量模式Psf,以預(yù)定定時(shí)輸出存儲(chǔ)的語(yǔ)音頻率模式Psf。由不特定說(shuō)話者發(fā)出的語(yǔ)音,經(jīng)話筒和放大器(未圖示)作為模擬語(yǔ)音信號(hào)Sva輸入至語(yǔ)音識(shí)別裝置VRAp。
控制器17,根據(jù)由語(yǔ)音識(shí)別裝置VRAp的其它構(gòu)成要素1、Tr、13和15輸出的表示其動(dòng)作狀態(tài)的動(dòng)作狀態(tài)信號(hào)Ss,生成對(duì)這些構(gòu)成要素的動(dòng)作進(jìn)行控制的控制信號(hào)Sc,對(duì)整個(gè)語(yǔ)音識(shí)別裝置VRAp的動(dòng)作進(jìn)行控制。另外,動(dòng)作狀態(tài)信號(hào)Ss、控制信號(hào)Sc及控制器17,由于是公知技術(shù),為簡(jiǎn)化說(shuō)明,只要不是特別需要就不再談到。
A/D變換器1對(duì)輸入的模擬語(yǔ)音信號(hào)Sva進(jìn)行A/D變換處理,生成數(shù)字語(yǔ)音信號(hào)Svd,輸入至輸入語(yǔ)音標(biāo)準(zhǔn)化裝置Tr。輸入語(yǔ)音標(biāo)準(zhǔn)化裝置Tr,根據(jù)輸入的數(shù)字語(yǔ)音信號(hào)Svd,對(duì)照語(yǔ)音識(shí)別裝置VRAp的標(biāo)準(zhǔn)音程,生成經(jīng)過(guò)音程變換的音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc,輸入至語(yǔ)音分析器15。語(yǔ)音分析器15,根據(jù)從標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13讀出的語(yǔ)音頻率模式Psf,對(duì)輸入語(yǔ)音標(biāo)準(zhǔn)化裝置Tr輸出的音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc進(jìn)行分析,輸出識(shí)別信號(hào)Src,指示與輸入語(yǔ)音一致的語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)。
如圖1所示,輸入語(yǔ)音標(biāo)準(zhǔn)化裝置Tr包含存儲(chǔ)器3、讀出控制器5、頻率分量分析器7、音程判定器9及讀出時(shí)鐘控制器11。存儲(chǔ)器3暫存A/D變換器1輸出的數(shù)字語(yǔ)音信號(hào)Svd。讀出控制器5監(jiān)測(cè)存儲(chǔ)器3對(duì)數(shù)字語(yǔ)音信號(hào)Svd的存儲(chǔ),同時(shí),生成讀出控制信號(hào)Src,控制存儲(chǔ)器3使保存的數(shù)字語(yǔ)音信號(hào)Svd中獨(dú)立發(fā)聲所對(duì)應(yīng)的部分讀出作為數(shù)字語(yǔ)音信號(hào)單元Svu。
頻率分量分析器7,對(duì)存儲(chǔ)器3輸出的數(shù)字語(yǔ)音信號(hào)單元Svu施加高速傅里葉變換處理,進(jìn)行頻譜分析。頻率分量分析器7,根據(jù)數(shù)字語(yǔ)音信號(hào)單元Svu的頻譜分析結(jié)果,生成頻率分量信號(hào)Sfc。
音程判定器9從頻率分量分析器7輸出的頻率分量信號(hào)Sfc中抽取第1共振峰,根據(jù)音程判定器9中預(yù)存的標(biāo)準(zhǔn)語(yǔ)音(標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13)的第1共振峰,求輸入語(yǔ)音(Sva、Svd、Svu)的音程與該標(biāo)準(zhǔn)語(yǔ)音音程的差。根據(jù)求得的音程差,音程判定器9再生成音程變換率信號(hào)Scr,指示輸入語(yǔ)音(Svd、Sva、Svu)的音程作何種程度變換才能符合標(biāo)準(zhǔn)音程。
讀出時(shí)鐘控制器11,根據(jù)音程判定器9輸出的音程變換率信號(hào)Scr,控制對(duì)存儲(chǔ)器3的讀出時(shí)鐘頻率,生成讀出時(shí)鐘信號(hào)Scc。
存儲(chǔ)器3以讀出時(shí)鐘信號(hào)Scc規(guī)定的定時(shí),讀出存儲(chǔ)的數(shù)字語(yǔ)音信號(hào)Svd,從而輸出數(shù)字語(yǔ)音信號(hào)Svd的音程調(diào)整成與標(biāo)準(zhǔn)語(yǔ)音的音程一致的音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc。即,音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音Svc與基準(zhǔn)語(yǔ)音頻率分量模式Psf有預(yù)定的音程關(guān)系。所謂預(yù)定的音程關(guān)系不一定指相同,也可認(rèn)為是語(yǔ)音識(shí)別裝置VRAp(尤其是語(yǔ)音分析器15)的性能自然確定的允許范圍。
語(yǔ)音分析器15對(duì)存儲(chǔ)器3輸入的音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc進(jìn)行分析,輸出表示與標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13讀出的基準(zhǔn)語(yǔ)音頻率分量模式Psf一致的識(shí)別信號(hào)Src。
接著,參照?qǐng)D2和圖3,對(duì)語(yǔ)音識(shí)別裝置VPAp的動(dòng)作基本原理進(jìn)行說(shuō)明。
圖2中示出對(duì)頻率分量析器7的數(shù)字語(yǔ)音信號(hào)Svd施加快速傅里葉變換得到的頻譜的一個(gè)例子。圖中,橫軸表示頻率f,縱軸表示強(qiáng)度A。點(diǎn)劃線L1表示數(shù)字語(yǔ)音信號(hào)Svd是男性發(fā)出的語(yǔ)音時(shí)其典型語(yǔ)音頻譜的一個(gè)例子,虛線L2表示數(shù)字語(yǔ)音信號(hào)Svd是女性或小孩發(fā)出的語(yǔ)音時(shí)其典型語(yǔ)音頻譜的一個(gè)例子。
實(shí)線LS表示作為語(yǔ)音識(shí)別用的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)在標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13中的語(yǔ)音頻譜的例子。通常,即使是相同語(yǔ)音(詞)。如點(diǎn)劃線L1所示,男性場(chǎng)合與標(biāo)準(zhǔn)語(yǔ)音相比頻譜出現(xiàn)在低頻區(qū)域側(cè),又如虛線L2所示,在女性或小孩的場(chǎng)合,與標(biāo)準(zhǔn)語(yǔ)音相比,頻譜出現(xiàn)在高頻區(qū)域側(cè)。
若設(shè)這些頻率分量各自基頻即第1共振峰頻率為f1、f2和fs,這些基頻對(duì)說(shuō)話者大致是恒定的?,F(xiàn)在簡(jiǎn)單說(shuō)明這里所述的第1共振峰頻率。如果把語(yǔ)音波形從時(shí)域變換為頻域,觀測(cè)通常5KHz以下對(duì)母音識(shí)別相當(dāng)重要的稱為共振峰的約4~5個(gè)峰。這些共振峰從低頻起名命為第1共振峰、第2共振峰、第3共振峰……。由同一講話者發(fā)出語(yǔ)音的第1共振峰不論是一個(gè)音還是幾個(gè)音構(gòu)成的句子,均大致一定。
其理由與如上所述由講話者的喉部形狀和大小決定講話者基準(zhǔn)發(fā)聲頻率的理由相同。即,上述非特定說(shuō)話者發(fā)出的語(yǔ)音第1共振峰頻率與標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)的第1共振峰頻譜的差,與性別、年齡差異及言詞內(nèi)容無(wú)關(guān),對(duì)同一講話者實(shí)質(zhì)上是相同的。也就是說(shuō),發(fā)出的語(yǔ)音不論是僅1個(gè)音(一個(gè)語(yǔ)音單元)還是多個(gè)音構(gòu)成的單詞和句子這種語(yǔ)音串,該語(yǔ)音串的第1共振峰對(duì)同一講話者是一定的。
基于該事實(shí),在本發(fā)明中,根據(jù)頻率分量信號(hào)Sfc,音程判定器9求非特定說(shuō)話者發(fā)出的語(yǔ)音的第1共振峰頻率,然后求非特定講話者語(yǔ)音的基頻fi(下文稱為“輸入語(yǔ)音基頻fi”)。在音程判定器9中,把輸入語(yǔ)音基頻fi與標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)的基頻fs(下文稱為“標(biāo)準(zhǔn)語(yǔ)音基頻fs”)進(jìn)行比較,按照下式(2)計(jì)算輸入語(yǔ)音基頻fi對(duì)標(biāo)準(zhǔn)語(yǔ)音基準(zhǔn)fs的音程比CR。
CR=fs/fi……(2)如上所述,第1共振峰頻率,在音響方面,由講話者喉部形狀(長(zhǎng)度、寬度)唯一地確定。男性喉部長(zhǎng)粗,其語(yǔ)音的基頻fm比標(biāo)準(zhǔn)語(yǔ)音的基頻fs低。結(jié)果,音程比CR比1大。另一方面,高音女性和小孩喉部短細(xì),其基頻fc比標(biāo)準(zhǔn)語(yǔ)音基頻fs高。結(jié)果,音程比CR比1小。每個(gè)講話者都具有這種通常的傾向,但其音程比CR是固有的。頻率分量分析器7生成音程變換率信號(hào)Scr,表示音程比CR的值。
讀出時(shí)鐘控制器11,根據(jù)音程判定器9輸出的音程變換率信號(hào)Scr,以數(shù)字語(yǔ)音信號(hào)Svd的采樣定時(shí)CR倍的定時(shí),從存儲(chǔ)器3讀出數(shù)字語(yǔ)音信號(hào)Svd,由此,生成音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc。為此目的,存儲(chǔ)器3通常由稱為環(huán)形存儲(chǔ)器的循環(huán)存儲(chǔ)器構(gòu)成。
音程比CR比1小,即輸入語(yǔ)音(Svd)音程低時(shí),以比采樣時(shí)鐘早的定時(shí),從存儲(chǔ)器3讀出數(shù)字語(yǔ)音信號(hào)Svd,生成音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc。另一方面,在音程比CR小于1,即輸入語(yǔ)音(Svd)的音程高時(shí),以比采樣時(shí)鐘延遲的定時(shí)讀出數(shù)字語(yǔ)音信號(hào)Svd,從而生成音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc。
參照?qǐng)D3,再說(shuō)明音程判定器9的音程變換處理。該圖中,橫軸表示時(shí)間t,縱軸表示語(yǔ)音強(qiáng)度A。波形WS表示標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13中存儲(chǔ)的語(yǔ)音波形隨時(shí)間變化的例子。波形WL表示與標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)相比音程低的語(yǔ)音波形(例如男性語(yǔ)音),波形WH表示比標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)音程高的語(yǔ)音波形(例如女性和孩子的語(yǔ)音)。該圖中,波形WS、WL和WH的1個(gè)周期分別表示為PL、PS和PH。周期PL和PH相當(dāng)于上述輸入語(yǔ)音基頻fi的倒數(shù),周期PS相當(dāng)于標(biāo)準(zhǔn)語(yǔ)音基頻fs的倒數(shù)。
為了把波形WL音程變換成與波形WS一致,只要以比對(duì)語(yǔ)音波形進(jìn)行A/D變換時(shí)的采樣時(shí)鐘快(PL/PS倍)的讀出時(shí)鐘進(jìn)行讀出即可實(shí)現(xiàn)。同樣,為了把波形WH音程變換成與波形WS一致,以對(duì)輸入語(yǔ)音波形作A/D變換時(shí)的采樣時(shí)鐘慢(PH/PS倍)的讀出時(shí)鐘讀即可實(shí)現(xiàn)。即,根據(jù)上式(2)規(guī)定的音程比CR變換采樣時(shí)鐘可獲得讀出時(shí)鐘。
這樣,可獲得把數(shù)字語(yǔ)音信號(hào)Svd的音程變換成符合標(biāo)準(zhǔn)語(yǔ)音音程的音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc。但是,音程提高時(shí),語(yǔ)音波形時(shí)間軸變短,音程降低時(shí),語(yǔ)音波形時(shí)間軸變長(zhǎng),因而語(yǔ)速發(fā)生了變化。為解決該問(wèn)題,在音程提高時(shí)追加母音波形,在音程降低時(shí)抽取母音波形,從而可調(diào)整語(yǔ)速。該技術(shù)是公知的,不是本發(fā)明目的所在,故省略其說(shuō)明。讀出時(shí)鐘頻率變換也易于用以往熟知的主時(shí)鐘分頻時(shí)鐘產(chǎn)生。
接著,參照示于圖4的流程圖,對(duì)聲音識(shí)別裝置VRAp中裝入的輸入語(yǔ)音標(biāo)準(zhǔn)化裝置Tr的動(dòng)作加以說(shuō)明。驅(qū)動(dòng)語(yǔ)音識(shí)別裝置VRAp,開始其語(yǔ)音識(shí)別動(dòng)作。
在步驟S2,非特定說(shuō)話者經(jīng)話筒等裝置發(fā)出語(yǔ)音,作為模擬語(yǔ)音信號(hào)Sva輸入至A/D變換器1。處理進(jìn)至下一步驟S4。
在步驟S4,A/D變換器1依次對(duì)輸入的模擬語(yǔ)音信號(hào)Sva進(jìn)行A/D變換,生成數(shù)字語(yǔ)音信號(hào)Svd,輸出至存儲(chǔ)器3。上述步驟S2和S4構(gòu)成講話者所發(fā)語(yǔ)音的輸入受理子程序#100。
在步驟S6,讀出控制器5監(jiān)測(cè)存儲(chǔ)器3的輸入狀態(tài),判斷講話者語(yǔ)音輸入(模擬語(yǔ)音信號(hào)Sva)是否完成。作為一個(gè)例子,可判斷模擬語(yǔ)音信號(hào)Sva輸入中斷時(shí)間是否達(dá)到預(yù)定閾值。另外,也可構(gòu)成為,講話者用適當(dāng)手段向語(yǔ)音識(shí)別裝置VRAp或輸入語(yǔ)音標(biāo)準(zhǔn)化裝置Tr指示其輸入結(jié)束。
在講話者繼續(xù)發(fā)聲時(shí),判定“否”,處理流程返回步驟S4,繼續(xù)生成數(shù)字語(yǔ)音信號(hào)Svd并向存儲(chǔ)器3輸入。在進(jìn)話者發(fā)出的一個(gè)音或多個(gè)語(yǔ)音組成的獨(dú)立的語(yǔ)音串的模擬語(yǔ)音信號(hào)Sva的輸入結(jié)束時(shí)刻,流程判斷為“是”,處理流程進(jìn)入下一步驟S8。
在步驟S8,讀出控制器5,從存儲(chǔ)器3存儲(chǔ)的數(shù)字語(yǔ)音信號(hào)Svd中,讀出與獨(dú)立的語(yǔ)音串對(duì)應(yīng)的數(shù)字語(yǔ)音信號(hào)單元Svu,向頻率分量分析器7輸出。數(shù)字語(yǔ)音信號(hào)單元Svu是語(yǔ)音識(shí)別裝置VRAp的語(yǔ)音識(shí)別對(duì)象。然后,處理流程進(jìn)至下一步驟S10。上述步驟S6和S8構(gòu)成識(shí)別對(duì)象語(yǔ)音提取子程序#200,從講話發(fā)出語(yǔ)音中提取作為識(shí)別對(duì)象的語(yǔ)音。
在步驟S10,頻率分量分析器7對(duì)從存儲(chǔ)器3輸入的數(shù)字語(yǔ)音信號(hào)單元Svu施加快速傅里葉變換,進(jìn)行數(shù)字語(yǔ)音信號(hào)單元Svu的頻譜(圖2)分析。然后,處理流程進(jìn)入下一步驟S12。
在步驟S12,如參照?qǐng)D2已說(shuō)明的,頻率分量分析器7生成頻率分量信號(hào)Sfc。接著,處理流程進(jìn)入下一步驟S14。
在步驟S14,頻率分量分析器7生成的頻率分量信號(hào)Sfc向音程判定器9輸出。處理流程進(jìn)至步驟S16。上述步驟S10、S12和S14構(gòu)成數(shù)字語(yǔ)音信號(hào)單元Svu的頻譜分析子程序#300。
在步驟S16,音程判定器9根據(jù)從頻率分量分析器7輸入的頻率分量信號(hào)Sfc,提取輸入語(yǔ)音(數(shù)字語(yǔ)音信號(hào)單元Svu)的基頻,即第1共振峰。接著,處理進(jìn)入下一步驟S18。
在步驟S18,音程判定器9比較步驟S16求得的第1共振峰與標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13中存儲(chǔ)的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)的第1共振峰,按照上述式(2),計(jì)算音程比CR。然后,處理進(jìn)入下一步驟S20。
在步驟S20,音程判定器9生成表示音程比CR的音程變換率信號(hào)Scr,向讀出時(shí)鐘控制器11輸出。處理進(jìn)入下一步驟S22。上述步驟S16、S18和S20,構(gòu)成判斷輸入語(yǔ)音相對(duì)于標(biāo)準(zhǔn)語(yǔ)音音程高低的音程判定子程序#400。
在步驟S22,讀出時(shí)鐘控制器11根據(jù)音程判定器9輸出的音程變換率信號(hào)Scr,生成決定存儲(chǔ)器3讀出定時(shí)的讀出時(shí)鐘Scc。處理進(jìn)至下一步驟S24。
在步驟S24,根據(jù)讀出時(shí)鐘Scc,從存儲(chǔ)器3讀出音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc。上述步驟S22和S24構(gòu)成輸入語(yǔ)音的音程標(biāo)準(zhǔn)化子程序#500。
如上所述經(jīng)子程序#100、#200、#300、#400和#500處理后生成的音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc,由語(yǔ)音分析器15,與存儲(chǔ)在標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13中的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)對(duì)照,進(jìn)行識(shí)別處理。進(jìn)而,語(yǔ)音分析器15生成表示識(shí)別結(jié)果的識(shí)別信號(hào)Src,加以輸出。
雖然音程判定子程序#400(S16)中基頻(第1共振峰)檢測(cè)僅以一個(gè)音即能求得,他也可取全部發(fā)聲單詞的平均值。這是由于如上所述,不論是說(shuō)話者發(fā)出的語(yǔ)音的一個(gè)音還是多個(gè)音構(gòu)成的語(yǔ)音,其第1共振峰,對(duì)每個(gè)講話者大致均是一定的。
進(jìn)而,音程比CR不必嚴(yán)格求得,音程變換中通常用100φ(音程)(cent)單位近似,也可獲得充分的音程變換效果。語(yǔ)音分析器15,參照如上所述進(jìn)行音程變換的語(yǔ)音數(shù)字信號(hào)(音程標(biāo)準(zhǔn)化數(shù)字語(yǔ)音信號(hào)Svc),計(jì)算標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)存儲(chǔ)器13中所存的語(yǔ)音識(shí)別用的語(yǔ)音頻率分量模式與輸入語(yǔ)音頻率分量模式的一致程度,進(jìn)行語(yǔ)音識(shí)別分析。
這樣,通過(guò)把非特定說(shuō)話者發(fā)出的輸入語(yǔ)音作音程變換,變換成預(yù)存的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)的音程,可不必具有許多標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù),即可處理非特定說(shuō)話者寬的頻率范圍,可提高語(yǔ)音識(shí)別率。也可把標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)的音程變換成與輸入語(yǔ)音(數(shù)字語(yǔ)音信號(hào)Svd)音程一致,來(lái)代替把輸入語(yǔ)音(數(shù)字語(yǔ)音信號(hào)Svd)的音程變換成與標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)的音程一致。
如上所述,本發(fā)明的語(yǔ)音識(shí)別裝置,通過(guò)分析輸入語(yǔ)音信號(hào)的頻率分量,把輸入語(yǔ)音作音程變換,使其變成語(yǔ)音識(shí)別用的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù),從而提高講話者音色有差異的語(yǔ)音的識(shí)別率,且不必具有多個(gè)標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù),可減少存儲(chǔ)器容量。
產(chǎn)業(yè)利用可能性如上所述,本發(fā)明可有效使用于需識(shí)別電視等非特定講話者發(fā)出語(yǔ)音的用途中。
權(quán)利要求
1.一種輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置,用于根據(jù)語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù),識(shí)別非特定講話者發(fā)出的輸入語(yǔ)音的語(yǔ)音識(shí)別裝置,把該輸入語(yǔ)音的音程變換成與該語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系的音程,其特征在于,該輸入語(yǔ)音標(biāo)準(zhǔn)化裝置包括判斷所述輸入語(yǔ)音與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程差的音程判斷手段;音程變換手段,根據(jù)所述音程差判斷手段判斷的音程差變換所述輸入語(yǔ)音的頻率,使所述輸入語(yǔ)音的音程與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程為預(yù)定關(guān)系。
2.如權(quán)利要求1所述的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置,其特征在于,該裝置還包括暫存所述輸入語(yǔ)音的存儲(chǔ)手段;從所述存儲(chǔ)手段讀出所述輸入語(yǔ)音串,生成識(shí)別對(duì)象語(yǔ)音信號(hào)的讀出控制手段;所述音程差判斷手段包括頻率分量分析手段,分析所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率分量,生成頻率分量信號(hào);音程判定手段,根據(jù)所述頻率分量信號(hào),求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)的基頻,同時(shí),判定所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)與該基頻的音程差,生成音程差信號(hào)。
3.如權(quán)利要求2所述的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置,其特征在于,所述音程判定手段求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰作為基頻,并比較該識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的第1共振峰以判定所述音程差,從而不管所述識(shí)別對(duì)象語(yǔ)音是一個(gè)音還是幾個(gè)音構(gòu)成,均可穩(wěn)定判定音程差。
4.如權(quán)利要求3所述的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置,其特征在于,所述音程變換手段包含讀出時(shí)鐘控制手段,確定所述存儲(chǔ)器的讀出定時(shí)時(shí)鐘頻率,生成讀出時(shí)鐘信號(hào),以便根據(jù)所述音程差信號(hào)變換所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率;所述存儲(chǔ)器根據(jù)所述讀出時(shí)鐘信號(hào),輸出所述識(shí)別對(duì)象語(yǔ)音信號(hào),使與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系。
5.一種語(yǔ)音識(shí)別裝置,其特征在于,它包括權(quán)利要求4所述的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置。
6.一種語(yǔ)音識(shí)別裝置,根據(jù)語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù),識(shí)別不特定講話者發(fā)出的輸入語(yǔ)音;其特征在于,它包括把所述輸入語(yǔ)音的音程變換成與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系的音程的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置;語(yǔ)音分析手段,比較變換所述音程的輸入語(yǔ)音與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù),生成指示與所述輸入語(yǔ)音一致的語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的識(shí)別信號(hào)。
7.如權(quán)利要求6所述的語(yǔ)音識(shí)別裝置,其特征在于,該裝置還包括暫存所述輸入語(yǔ)音的存儲(chǔ)手段;從所述存儲(chǔ)手段讀出所述輸入語(yǔ)音串,生成識(shí)別對(duì)象語(yǔ)音信號(hào)的讀出控制手段;所述音程差判斷手段包括頻率分量分析手段,分析所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率分量,生成頻率分量信號(hào),音程判定手段,根據(jù)所述頻率分量信號(hào),求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)的基頻,同時(shí),判定所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)與該基頻的音程差,生成音程差信號(hào)。
8.如權(quán)利要求7所述的語(yǔ)音識(shí)別裝置,其特征在于,所述音程判定手段求得所述識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰作為基頻,并比較該識(shí)別對(duì)象語(yǔ)音信號(hào)的第1共振峰與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的第1共振峰以判定所述音程差,從而不管所述識(shí)別對(duì)象語(yǔ)音是一個(gè)音還是幾個(gè)音構(gòu)成,均可穩(wěn)定判定音程差。
9.如權(quán)利要求8所述的語(yǔ)音識(shí)別裝置,其特征在于,所述音程變換手段包含讀出時(shí)鐘控制手段,確定所述存儲(chǔ)器的讀出定時(shí)時(shí)鐘頻率,生成讀出時(shí)鐘信號(hào),以便根據(jù)所述音程差信號(hào)變換所述識(shí)別對(duì)象語(yǔ)音信號(hào)的頻率;所述存儲(chǔ)器根據(jù)所述讀出時(shí)鐘信號(hào),輸出所述識(shí)別對(duì)象語(yǔ)音信號(hào),使與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)的音程有預(yù)定關(guān)系。
全文摘要
本發(fā)明揭示在識(shí)別非特定講話者發(fā)出的輸入語(yǔ)音信號(hào)(Svc)的語(yǔ)音識(shí)別裝置(VRAp)中所用的、把該輸入語(yǔ)音(Svu)的音程變換成與語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)(Psf)的音程有特定關(guān)系(CR)的音程的輸入語(yǔ)音音程標(biāo)準(zhǔn)化裝置(Tr),在該裝置中,音程差判斷器(3、5、7、9;#100、#200、#300、#400)判斷所述輸入語(yǔ)音(Svu)與語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)(Psf)的音程差(CR),音程變換器(11、3;#500)根據(jù)所述音程差判斷器判斷的音程差(CR),變換所述輸入語(yǔ)音(Svc)的音程,使其與所述語(yǔ)音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)(Psf)的音程有預(yù)定關(guān)系(CR=1)。
文檔編號(hào)G10L15/07GK1310839SQ00800952
公開日2001年8月29日 申請(qǐng)日期2000年5月16日 優(yōu)先權(quán)日1999年5月21日
發(fā)明者小田幹夫 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
沧州市| 沙洋县| 柘城县| 手游| 三明市| 久治县| 辉南县| 四川省| 大关县| 绍兴县| 开江县| 古浪县| 北京市| 奇台县| 霸州市| 南陵县| 灌阳县| 和政县| 娱乐| 成安县| 长治市| 沈阳市| 龙游县| 宽城| 长海县| 镇雄县| 怀安县| 扶风县| 汉沽区| 揭西县| 枝江市| 双鸭山市| 砚山县| 商都县| 隆子县| 永济市| 舒城县| 峨眉山市| 阿巴嘎旗| 浮山县| 炎陵县|