两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語(yǔ)音識(shí)別裝置的制作方法

文檔序號(hào):2824740閱讀:239來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):語(yǔ)音識(shí)別裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種高效地進(jìn)行設(shè)施名稱(chēng)等大詞匯的語(yǔ)音識(shí)別的語(yǔ)音識(shí)別裝置。
背景技術(shù)
在構(gòu)建以賓館、觀光設(shè)施的名稱(chēng)作為識(shí)別對(duì)象的語(yǔ)音識(shí)別系統(tǒng)的情況下,用戶有時(shí)不知道正式的名稱(chēng),因此考慮對(duì)一個(gè)設(shè)施準(zhǔn)備多個(gè)名稱(chēng)(替換詞)。例如“橫濱王子賓館” 的情況下,作為識(shí)別詞匯,考慮除了準(zhǔn)備“橫濱王子賓館”這一名稱(chēng)以外,作為替換詞而準(zhǔn)備 “橫濱王子”、“王子賓館”等名稱(chēng)。這樣的技術(shù)記載在日本特開(kāi)第2005-202198號(hào)公報(bào)(專(zhuān)利文獻(xiàn)1)、日本特開(kāi)2001-083982號(hào)公報(bào)(專(zhuān)利文獻(xiàn)2)中。但是,語(yǔ)音識(shí)別一般是通過(guò)進(jìn)行語(yǔ)音的特征向量的時(shí)間序列與語(yǔ)音模式模型之間的模式匹配來(lái)實(shí)現(xiàn)的,其中上述語(yǔ)音的特征向量是對(duì)語(yǔ)音進(jìn)行聲音分析得到的,上述語(yǔ)音模式模型是將識(shí)別詞匯的特征向量的時(shí)間序列的模式模型化而得到的,因此存在如下問(wèn)題如果對(duì)大量的替換詞準(zhǔn)備上述語(yǔ)音模式模型,則用于模式匹配的運(yùn)算量變得龐大。另外,存在如下問(wèn)題即使人工或自動(dòng)地生成替換詞,也難以生成所有的替換詞。而且,有在用于自動(dòng)生成的規(guī)則、數(shù)據(jù)庫(kù)制作上花費(fèi)非常大的勞力的問(wèn)題。專(zhuān)利文獻(xiàn)1 日本特開(kāi)2005-202198號(hào)公報(bào)專(zhuān)利文獻(xiàn)2 日本特開(kāi)2001-083982號(hào)公報(bào)

發(fā)明內(nèi)容
發(fā)明要解決的問(wèn)題本發(fā)明是為了解決上述問(wèn)題而完成的,其目的在于抑制運(yùn)算量的增加并高精度地識(shí)別替換詞。目的還在于減輕替換詞的生成規(guī)則、數(shù)據(jù)庫(kù)制作的勞力。用于解決問(wèn)題的方案本發(fā)明所涉及的語(yǔ)音識(shí)別裝置具備語(yǔ)音識(shí)別單元,其使用語(yǔ)言模型和聲音模型對(duì)所輸入的語(yǔ)音進(jìn)行語(yǔ)音識(shí)別,輸出規(guī)定個(gè)數(shù)的由識(shí)別得分和文本表述的組構(gòu)成的識(shí)別結(jié)果;詞素詞典存儲(chǔ)器,其保持將識(shí)別對(duì)象詞匯的表述分割為詞素單位的詞素詞典;以及N最優(yōu)候選重構(gòu)單元,其將上述語(yǔ)音識(shí)別單元的識(shí)別結(jié)果的表述與上述詞素詞典存儲(chǔ)器的內(nèi)容進(jìn)行對(duì)照,檢查上述識(shí)別結(jié)果的表述是否能夠用上述詞素詞典存儲(chǔ)器中的某個(gè)識(shí)別詞匯的詞素的組合來(lái)表現(xiàn),在能夠表現(xiàn)的情況下修正上述識(shí)別得分,按照修正后的識(shí)別得分重新排列識(shí)別結(jié)果的位次并作為識(shí)別結(jié)果。發(fā)明的效果根據(jù)本發(fā)明的語(yǔ)音識(shí)別裝置,語(yǔ)音識(shí)別單元輸出規(guī)定個(gè)數(shù)的由識(shí)別得分和文本表述的組構(gòu)成的識(shí)別結(jié)果,N最優(yōu)候選重構(gòu)單元將語(yǔ)音識(shí)別單元的識(shí)別結(jié)果的表述與上述詞素詞典存儲(chǔ)器的內(nèi)容進(jìn)行對(duì)照,檢查上述識(shí)別結(jié)果的表述是否能夠用上述詞素詞典存儲(chǔ)器中的某個(gè)識(shí)別詞匯的詞素的組合來(lái)表現(xiàn),在能夠表現(xiàn)的情況下修正上述識(shí)別得分,按照修正后的識(shí)別得分重新排列識(shí)別結(jié)果的位次并作為識(shí)別結(jié)果,因此能夠降低N最優(yōu)候選重構(gòu)單元中的與詞素詞典之間的內(nèi)容對(duì)照運(yùn)算量,并且還能夠提高識(shí)別結(jié)果的精度。


圖1是表示本發(fā)明的語(yǔ)音識(shí)別裝置的實(shí)施方式1的結(jié)構(gòu)的框圖。圖2是詞素詞典存儲(chǔ)器的內(nèi)容的一例的說(shuō)明圖。圖3是語(yǔ)音識(shí)別單元的輸入語(yǔ)音的語(yǔ)音識(shí)別結(jié)果的輸出例的說(shuō)明圖。圖4是N最優(yōu)候選重構(gòu)單元的處理結(jié)果輸出例的說(shuō)明圖。圖5是實(shí)施方式1中的N最優(yōu)候選重構(gòu)單元的具體的處理過(guò)程的流程圖。圖6是表示本發(fā)明的語(yǔ)音識(shí)別裝置的實(shí)施方式2的結(jié)構(gòu)的框圖。圖7是子詞索引存儲(chǔ)器的內(nèi)容例的說(shuō)明圖。圖8是實(shí)施方式2中的N最優(yōu)候選重構(gòu)單元的具體的處理過(guò)程的流程圖。
具體實(shí)施例方式實(shí)施方式1在本實(shí)施方式中,以對(duì)日本全國(guó)的設(shè)施、觀光點(diǎn)的名稱(chēng)(以后為了簡(jiǎn)化而將設(shè)施和觀光點(diǎn)統(tǒng)稱(chēng)為設(shè)施)進(jìn)行語(yǔ)音識(shí)別的情況為例進(jìn)行說(shuō)明。圖1是表示本發(fā)明的語(yǔ)音識(shí)別裝置的實(shí)施方式1的結(jié)構(gòu)的框圖。在該圖中,1是語(yǔ)音的輸入端,2是輸入語(yǔ)音,3是語(yǔ)音識(shí)別單元,4是N最優(yōu) (N-best)候選重構(gòu)單元,5是詞素詞典存儲(chǔ)器,6是語(yǔ)言模型存儲(chǔ)器,7是聲音模型存儲(chǔ)器,8 是識(shí)別結(jié)果。在語(yǔ)言模型存儲(chǔ)器6中事先制作并保存統(tǒng)計(jì)語(yǔ)言模型。在本實(shí)施方式中,將日本全國(guó)的設(shè)施的表述的音節(jié)列作為學(xué)習(xí)數(shù)據(jù),事先學(xué)習(xí)并保存以音節(jié)為單位的三連詞 (trigram)。此外,以音節(jié)為單位的優(yōu)點(diǎn)是不管作為學(xué)習(xí)數(shù)據(jù)的設(shè)施數(shù)量如何,音節(jié)的種類(lèi)數(shù)都收斂到幾百個(gè)以下,因此能夠制作抑制了識(shí)別時(shí)的運(yùn)算量增加的語(yǔ)言模型。另外,通過(guò)使用統(tǒng)計(jì)語(yǔ)言模型,即使不將替換詞作為語(yǔ)言模型的學(xué)習(xí)數(shù)據(jù)來(lái)提供也能夠進(jìn)行識(shí)別,因此能夠減輕替換詞的生成規(guī)則、數(shù)據(jù)庫(kù)制作的勞力。聲音模型存儲(chǔ)器7中保存有將語(yǔ)音的特征模型化而成的聲音模型。在本實(shí)施方式中,設(shè)聲音模型例如是HMM (Hidden Markov Model 隱馬爾可夫模型)。在詞素詞典存儲(chǔ)器5中保存有作為搜索對(duì)象的所有的設(shè)施名稱(chēng)的ID號(hào)碼和表述、 以及上述表述的詞素的平假名表述。上述詞素能夠通過(guò)如下方式得到使用一般的詞素分析方法對(duì)上述表述進(jìn)行詞素分析,提取各詞素的平假名表述。圖2示出詞素詞典存儲(chǔ)器的內(nèi)容的一例。接下來(lái)說(shuō)明語(yǔ)音識(shí)別和搜索的動(dòng)作。當(dāng)從語(yǔ)音的輸入端1輸入語(yǔ)音2時(shí),語(yǔ)音識(shí)別單元3使用保存在語(yǔ)言模型存儲(chǔ)器 6中的語(yǔ)言模型和保存在聲音模型存儲(chǔ)器7中的聲音模型,通過(guò)例如維特比算法(Viterbi algorithm)進(jìn)行語(yǔ)音識(shí)別,按識(shí)別得分從大到小的順序輸出作為前N個(gè)識(shí)別結(jié)果的音節(jié)列的表述、聲音似然度、語(yǔ)言似然度以及上述識(shí)別得分。此外,上述識(shí)別得分是上述聲音似然度與語(yǔ)言似然度之和。在本實(shí)施方式中,設(shè)識(shí)別結(jié)果的輸出個(gè)數(shù)N為N= 50。另外,在實(shí)施方式中,與保存在詞素詞典存儲(chǔ)器5中的詞素詞典同樣地將上述音節(jié)列的表述設(shè)為平假名表述。圖3示出語(yǔ)音2的發(fā)聲內(nèi)容為“J C ti f tI; J-
(yokohamakyogijo)(橫濱比賽場(chǎng))”的情況下的語(yǔ)音識(shí)別單元3的輸出例。在該時(shí)刻,作為正確答案的“ J (i主巻J 一各’υ J: — (yokohamakyogijo) ”處于第2位。接著,N最優(yōu)候選重構(gòu)單元4將上述N個(gè)識(shí)別結(jié)果作為輸入,分別針對(duì)上述N個(gè)識(shí)別結(jié)果檢查其平假名表述是否與詞素詞典存儲(chǔ)器5中的某個(gè)設(shè)施的詞素詞典匹配,在匹配的情況下,修正語(yǔ)言似然度并重新計(jì)算識(shí)別得分,按該重新計(jì)算得到的識(shí)別得分從大到小的順序重新排列識(shí)別候選。此外,在此,上述“匹配”是指識(shí)別結(jié)果的音節(jié)列能夠以某設(shè)施的詞素的組合來(lái)表現(xiàn)的情況。例如,識(shí)別候選“ A 二 ii t J 一 BM; J — (yokohamakyogijo) (橫濱比賽場(chǎng))”能夠以作為設(shè)施名“橫濱國(guó)際綜合比賽場(chǎng)”的詞素詞典的“A 二 i (yokohama)、二 < ^。(kokusai)、 一 r 一(sogo)、t J 一莒一 C J 一 (kyogi jo) ”中的詞素“ J: 二 ii t (yokohama),,和“ t J 一各‘I; J 一 (kyogi jo),,的組合來(lái)表現(xiàn),因此與上述詞素詞典匹配。另一方面,例如關(guān)于識(shí)別候選“ A C ti f tυ J - (yokohamakyugijo) (橫濱球技場(chǎng))”,由于在上述詞素詞典中不存在“t吵一各'"一 (kyugijo)”,因此不匹配。下面參照?qǐng)D5說(shuō)明N最優(yōu)候選重構(gòu)單元4的具體的處理過(guò)程。過(guò)程1)從所輸入的N個(gè)識(shí)別結(jié)果的前NL個(gè)中求出語(yǔ)言似然度的最大值,并將其設(shè)為SLmax。此外,上述NL是滿足NL彡N的常數(shù),例如NL = 10 (圖5的stlOl)。過(guò)程2)設(shè) k = 1 (圖 5 的 st 102)。過(guò)程3)將第k位結(jié)果的音節(jié)列依次與詞素詞典存儲(chǔ)器5中的各設(shè)施的詞素詞典進(jìn)行對(duì)照,檢查是否與某個(gè)設(shè)施的詞素詞典匹配(圖5的stl03、stl04)。在此,“匹配”的定義如上所述。此外,在與某個(gè)設(shè)施的詞素詞典匹配了的時(shí)刻,不進(jìn)行與之后的詞素詞典的對(duì)照,而進(jìn)入下述過(guò)程4。過(guò)程4)在過(guò)程3中與某個(gè)詞素詞典匹配了的情況下,按照(1)式對(duì)第k位的新得分S' (k)進(jìn)行修正(圖5的st 105)。S' (k) = Sa(k)+S' L · · · (1)在此,Sa(k)是第k位結(jié)果的聲音似然度,S' L是修正后的語(yǔ)言似然度,利用(2) 式求出。S' L = SLfflax+offset · · · (2)在此,SLfflax是在過(guò)程2中求出的語(yǔ)言似然度的最大值,offset是預(yù)先確定的常數(shù)。 在本實(shí)施方式中,例如設(shè)offset = 3。因此,在圖3所示的例子的情況下,因?yàn)镾一是識(shí)別位次第1位的語(yǔ)言似然度,且Stax = -8,所以S' L = "8+3 = _5。另一方面,在未匹配的情況下,利用(3)式求出新得分S' (k)。S卩,得分不變(圖 5 的 stl06)。S' (k) = S(k) · · · (3)過(guò)程5)如果k = K,則進(jìn)入過(guò)程6。如果k < K,則設(shè)為k = k+Ι,返回到過(guò)程3 (圖 5的stl07,stl08)。在此,K是預(yù)先確定的滿足K SN的常數(shù)。在本實(shí)施方式中,設(shè)K = N, 即 K = 50。過(guò)程6)使用在過(guò)程5中修正后的新得分S' (k) (k = 1 K),對(duì)識(shí)別結(jié)果重新評(píng)分(rescored),并確定最終的識(shí)別結(jié)果(圖5的stl09)。
本實(shí)施方式1的處理動(dòng)作如上所述。如上述過(guò)程3中所述,本實(shí)施方式1的方式具有如下效果通過(guò)對(duì)“允許任意詞素的省略和語(yǔ)順的改換的替換詞”提高識(shí)別得分,變得容易識(shí)別。圖4示出對(duì)圖3的結(jié)果應(yīng)用本實(shí)施方式1的方式的結(jié)果??芍?,作為正確答案的“ J: 二 ii t t J: 一各‘I; J 一 (yokohamakyogijo)(橫濱比賽場(chǎng)),,處于識(shí)別位次第1位。 這是因?yàn)?,?J (i主巻J 一爸’υ J: — (yokohamakyogijo) ”與設(shè)施ID = 3的詞素詞典匹配而語(yǔ)言似然度被修正而變高,與此相對(duì),在輸入到N最優(yōu)候選重構(gòu)單元4的時(shí)刻處于第1位的“J: ti i ,吵一 B.· I; J 一(yokohamaimigijo)”與任一個(gè)詞素詞典都不匹配而似然度未被修正,所以識(shí)別得分與上述“ A 'S主t C J 一(yokohamaiii^gijo)”發(fā)生逆轉(zhuǎn)。此外,在本實(shí)施方式中,在與某個(gè)詞素詞典匹配的情況下,識(shí)別得分的修正是通過(guò)如⑴式所示那樣地修正語(yǔ)言似然度來(lái)進(jìn)行的,但是也可以通過(guò)如⑷式所示那樣地加上固定的偏移值來(lái)修正識(shí)別得分,能夠得到同樣的效果。S' (k) = S(k) + a · · · (4)在此,α是通過(guò)實(shí)驗(yàn)而確定的大于0的常數(shù),例如a = 10。另外,在本實(shí)施方式中,保存在詞素詞典存儲(chǔ)器5中的詞素詞典如圖2所示那樣地僅由設(shè)施名的詞素構(gòu)成,但是也可以追加用戶會(huì)與設(shè)施名稱(chēng)同時(shí)發(fā)聲的詞匯。例如,“橫濱國(guó)際綜合比賽場(chǎng)”位于神奈川縣,因此用戶有可能發(fā)聲為“神奈川縣的橫濱國(guó)際綜合比賽場(chǎng)”。為了應(yīng)對(duì)這種情況,考慮在詞素詞典中追加“辦^力、'(kanagawakenno) ”這一詞素。另外,在本實(shí)施方式中,詞素詞典如圖2所示那樣地僅由設(shè)施名的詞素構(gòu)成,但是也可以事先追加詞素的同義詞、近義詞。例如,在“橫濱高爾夫球場(chǎng)”這一設(shè)施名的詞素詞典是 “ J: 二 ii t (yokohama)、易么 I; J: 一 (gorufujo),,的情況下,也可以將“如 k h ” 一 < 6 ^ (kantorikurabu) ”等作為“r易么I; J: 一 (gorufujo) ”的近義詞而追加到詞素詞典中。另外,在本實(shí)施方式中,在語(yǔ)言模型存儲(chǔ)器6中保存以音節(jié)為單位的三連詞來(lái)使用,但是上述單位能夠使用單詞、詞素等任意的單位。另外,也可以組合音節(jié)、單詞、詞素等的任意的單位。另外,也可以使用雙連詞(bigram)、任意的η連詞作為統(tǒng)計(jì)語(yǔ)言模型。另外,也可以不使用統(tǒng)計(jì)語(yǔ)言模型,而使用允許在音節(jié)、單詞、詞素等識(shí)別單位之間的任意的連接的語(yǔ)言模型、以及確定了在音節(jié)、單詞、詞素等識(shí)別單位之間的連接規(guī)則的句法規(guī)則型的語(yǔ)言模型。在不使用統(tǒng)計(jì)語(yǔ)言模型的情況下,不計(jì)算語(yǔ)言似然度,因此識(shí)別得分的修正使用(4)式即可。實(shí)施方式2本實(shí)施方式中的語(yǔ)音識(shí)別裝置是在上述實(shí)施方式1的語(yǔ)音識(shí)別裝置中新附加子詞索引(sub-word index)存儲(chǔ)器9并如后所述地變更了 N最優(yōu)候選重構(gòu)單元的動(dòng)作的裝置。圖6示出本實(shí)施方式的語(yǔ)音識(shí)別裝置的結(jié)構(gòu)例。此外,除了子詞索引存儲(chǔ)器9以外,與上述實(shí)施方式1相同,因此省略說(shuō)明。子詞索引存儲(chǔ)器9是保持倒置索引的存儲(chǔ)器,該倒置索引是使用作為識(shí)別對(duì)象的所有的設(shè)施名的平假名表述而預(yù)先制作的。圖7示出子詞索引存儲(chǔ)器9的內(nèi)容例。如該圖所示,子詞索引是從作為識(shí)別對(duì)象的所有設(shè)施名的平假名表述中提取音節(jié)、并針對(duì)各音節(jié)列舉包含該音節(jié)的設(shè)施名的ID號(hào)碼而得到的。例如,作為識(shí)別對(duì)象的設(shè)施名如圖2所示的情況下,包含音節(jié)“ *、(ka) ”的設(shè)施是“i < b爸J: 一 t力、凡(kamakurakyodokan)(鐮倉(cāng)鄉(xiāng)土館)”和“鐮倉(cāng)公園(辦i < 6 二一 λ /i ) (kamakurakoen),,等,上述兩個(gè)設(shè)施的ID號(hào)碼分別是1、2,因此子詞索引存儲(chǔ)器9的與音節(jié)“力> (ka) ”對(duì)應(yīng)的設(shè)施ID號(hào)碼是1,2,..。接著說(shuō)明本實(shí)施方式的動(dòng)作。當(dāng)從語(yǔ)音的輸入端1輸入語(yǔ)音2時(shí),語(yǔ)音識(shí)別單元3 進(jìn)行與實(shí)施方式1相同的動(dòng)作,按識(shí)別得分從大到小的順序輸出作為前N個(gè)識(shí)別結(jié)果的音節(jié)列的表述、聲音似然度、語(yǔ)言似然度以及上述識(shí)別得分。將N與實(shí)施方式1同樣地設(shè)為N =50。接著,N最優(yōu)候選重構(gòu)單元4將語(yǔ)音識(shí)別單元3所輸出的上述N個(gè)結(jié)果作為輸入, 在如后述那樣地與各設(shè)施的詞素詞典進(jìn)行對(duì)照之前,參照子詞索引存儲(chǔ)器9,限制進(jìn)行對(duì)照的詞素詞典。由此,能夠減少與詞素詞典的對(duì)照數(shù)量,能夠降低運(yùn)算量。下面參照?qǐng)D8,說(shuō)明N最優(yōu)候選重構(gòu)單元4的具體的處理過(guò)程。過(guò)程1)從所輸入的N個(gè)候選中的前NL個(gè)候選中求出語(yǔ)言似然度的最大值,并將其設(shè)為Sl_。此外,上述NL是滿足NL彡N的常數(shù),例如NL = 10 (圖8的stlOl)。過(guò)程2)設(shè)為 k= 1(圖 8 的 stl02)。過(guò)程3a)接著,N最優(yōu)候選重構(gòu)單元4參照子詞索引存儲(chǔ)器9,提取包含第k位結(jié)果的平假名表述的全部的音節(jié)的設(shè)施ID號(hào)碼(圖8的stl03a)。例如,在圖2的第2位的音節(jié)列“ J: C ti f t Jr-β" I; J - (yokohamakyogijo)”的情況下,提取將包含全部的音節(jié) “ J: (yo),,“ (ko),,“ ti (ha),,“ t (ma) ”“爸 J 一 (kyo),,“ β" (gi),,“ I; J: 一 (jo),,的設(shè)施的設(shè)施ID號(hào)碼。這是通過(guò)如下方式得到的參照子詞索引存儲(chǔ)器9,針對(duì)上述各音節(jié)提取包含該音節(jié)的設(shè)施ID號(hào)碼的集合,取得所提取的上述集合的交集(η )。例如在上述“ J 二 ii t t J: 一各‘I; J: 一 (yokohamakyogijo),,的情況下,包含音節(jié) “ J (yo),,的設(shè)施 ID 號(hào)碼的集合是{3,4, ·},包含“二 (ko)”的設(shè)施ID號(hào)碼的集合是{2,3,4*},包含“這(ha)” 的設(shè)施ID號(hào)碼的集合是{3,4},包含“$ (ma)”的設(shè)施ID號(hào)碼的集合是{1,2,3,4 ·},包含 ‘ 一 (kyo),,的設(shè)施ID號(hào)碼的集合是{1,3,· },包含“各’(gi),,的設(shè)施ID號(hào)碼的集合是{3,·},包含一(jo)”的設(shè)施ID號(hào)碼的集合是{3,·},所以作為這些集合的交集而提取設(shè)施ID號(hào)碼{3,·}。可知,在除了所提取出的設(shè)施ID號(hào)碼以外的設(shè)施名中,在其詞素詞典中不包含上述“J: C ti f t J: 一各'I; J: 一(yokohamakyogijo)”中的任一個(gè)以上的音節(jié),因此上述所提取出的設(shè)施ID號(hào)碼以外的詞素詞典不會(huì)與上述“J C ti f tI; J 一 (yokohamakyogijo),,匹配。因而,能夠從對(duì)照對(duì)象中排除這些詞素詞典。過(guò)程3b)將在過(guò)程3a中提取出的設(shè)施ID號(hào)碼的音節(jié)依次與保存在詞素詞典存儲(chǔ)器5中的設(shè)施的詞素詞典進(jìn)行對(duì)照,檢查與某個(gè)設(shè)施的詞素詞典匹配(圖8的stl03b、 stl04)。在此,“匹配”的定義與實(shí)施方式1相同。另外,與實(shí)施方式1同樣地,在與某個(gè)設(shè)施的詞素詞典匹配了的時(shí)刻,不進(jìn)行與之后的詞素詞典之間的對(duì)照,而進(jìn)入下述過(guò)程4。過(guò)程4)在過(guò)程北中與某個(gè)詞素詞典匹配了的情況下,與實(shí)施方式1同樣地,按照 ⑴式或⑷式修正第k位候選的新得分S' (k)(圖8的stl05)。另一方面,在未匹配的情況下,與實(shí)施方式1 一樣,得分不變(圖8的stl06)。過(guò)程5)如果k = K,則進(jìn)入過(guò)程6。如果k < K,則設(shè)為k = k+Ι,返回到過(guò)程3a。 (圖8的stl07,stl08)。在此,K是預(yù)先確定的滿足KSN的常數(shù)。在本實(shí)施方式中設(shè)為K = N,即 K = 50。過(guò)程6)使用過(guò)程5中修正后的新得分S' (k) (k = 1 K)對(duì)識(shí)別結(jié)果重新評(píng)分, 并確定最終的識(shí)別結(jié)果(圖8的stl09)。以上,如所說(shuō)明的那樣,在本實(shí)施方式所涉及的語(yǔ)音識(shí)別裝置中,在上述過(guò)程3a 中,N最優(yōu)候選重構(gòu)單元4參照子詞索引存儲(chǔ)器9,提取包含第k位候選的平假名表述的全部的音節(jié)的設(shè)施ID號(hào)碼,對(duì)于上述第k位候選的平假名表述,僅檢查是否與在過(guò)程北中所提取出的上述設(shè)施ID的詞素詞典匹配,因此能夠減少與詞素詞典的對(duì)照數(shù)量,能夠降低運(yùn)
鈴旦昇里。此外,在本實(shí)施方式中,保存在詞素詞典存儲(chǔ)器5中的詞素詞典如圖2所示那樣地僅由設(shè)施名的詞素構(gòu)成,但是也可以追加用戶會(huì)與設(shè)施名稱(chēng)同時(shí)發(fā)聲的詞匯。例如,“橫濱國(guó)際綜合比賽場(chǎng)”位于神奈川縣,因此用戶有可能發(fā)聲為“神奈川縣的橫濱國(guó)際綜合比賽場(chǎng)”。為了應(yīng)對(duì)這種情況,考慮在詞素詞典中追加“辦^力、'打It凡O (kanagarakenno) ”這一詞素。另外,在本實(shí)施方式中,詞素詞典如圖2所示那樣僅由設(shè)施名的詞素構(gòu)成,但是也可以事先追加詞素的同義詞、近義詞。例如,在“橫濱高爾夫球場(chǎng)”這一設(shè)施名的詞素詞典是 "J C ti t (yokohama) 6 ^ υ J: — (gorufujo),,的情況下,也可以將“眾九 i >9 一 < 6 ^ (kantorikurabu),,等作為“ r 3么I; J: 一 (gorufujo),,的近義詞而追加到詞素詞典中。另外,在本實(shí)施方式中,在語(yǔ)言模型存儲(chǔ)器6中保存以音節(jié)為單位的三連詞來(lái)使用,但是上述單位能夠使用單詞、詞素等任意的單位。另外,也可以組合音節(jié)、單詞、詞素等的任意的單位。另外,也可以使用雙連詞(bigram)、任意的η連詞作為統(tǒng)計(jì)語(yǔ)言模型。另外,也可以不使用統(tǒng)計(jì)語(yǔ)言模型,而使用允許在音節(jié)、單詞、詞素等識(shí)別單位之間的任意的連接的語(yǔ)言模型、確定了在音節(jié)、單詞、詞素等識(shí)別單位之間的連接規(guī)則的句法規(guī)則型的語(yǔ)言模型。在不使用統(tǒng)計(jì)語(yǔ)言模型的情況下,不計(jì)算語(yǔ)言似然度,因此識(shí)別得分的修正使用⑷式即可。產(chǎn)業(yè)上的可利用性本發(fā)明的語(yǔ)音識(shí)別裝置能夠利用于語(yǔ)音識(shí)別中的數(shù)據(jù)庫(kù)的搜索裝置、例如車(chē)載導(dǎo)航裝置等語(yǔ)音識(shí)別導(dǎo)航裝置。
權(quán)利要求
1.一種語(yǔ)音識(shí)別裝置,其特征在于,具備語(yǔ)音識(shí)別單元,使用語(yǔ)言模型和聲音模型對(duì)所輸入的語(yǔ)音進(jìn)行語(yǔ)音識(shí)別,輸出規(guī)定個(gè)數(shù)的由識(shí)別得分和文本表述的組構(gòu)成的識(shí)別結(jié)果;詞素詞典存儲(chǔ)器,保持將識(shí)別對(duì)象詞匯的表述分割為詞素單位的詞素詞典;以及N最優(yōu)候選重構(gòu)單元,將所述語(yǔ)音識(shí)別單元的識(shí)別結(jié)果的表述與所述詞素詞典存儲(chǔ)器的內(nèi)容進(jìn)行對(duì)照,檢查所述識(shí)別結(jié)果的表述是否能夠以所述詞素詞典存儲(chǔ)器中的某個(gè)識(shí)別詞匯的詞素的組合來(lái)表現(xiàn),在能夠表現(xiàn)的情況下修正所述識(shí)別得分,按照修正后的識(shí)別得分重新排列識(shí)別結(jié)果的位次并作為識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別裝置,其特征在于,還具備子詞索引存儲(chǔ)器,該子詞索引存儲(chǔ)器保持以音素、音節(jié)等的子詞作為索引語(yǔ)的針對(duì)所述識(shí)別對(duì)象詞匯的倒置索引,所述N最優(yōu)候選重構(gòu)單元將所述語(yǔ)音識(shí)別單元的識(shí)別結(jié)果的表述作為輸入,參照所述子詞索引存儲(chǔ)器而提取包含所述識(shí)別結(jié)果的表述中的全部的子詞的識(shí)別對(duì)象詞匯,僅將所提取出的識(shí)別對(duì)象詞匯與詞素詞典存儲(chǔ)器的詞素詞典進(jìn)行對(duì)照。
3.根據(jù)權(quán)利要求1或2所述的語(yǔ)音識(shí)別裝置,其特征在于,所述詞素詞典除了包含識(shí)別對(duì)象詞匯的表述的詞素之外,還包含有可能與該識(shí)別對(duì)象詞匯同時(shí)發(fā)聲的詞匯的詞素的表述。
4.根據(jù)權(quán)利要求1 3中的任一項(xiàng)所述的語(yǔ)音識(shí)別裝置,其特征在于,所述詞素詞典除了包含識(shí)別對(duì)象詞匯的表述的詞素之外,還包含所述詞素的同義詞、 近義詞的表述。
全文摘要
語(yǔ)音識(shí)別是通過(guò)與語(yǔ)音模式模型之間的模式匹配來(lái)進(jìn)行的,因此在對(duì)賓館、觀光設(shè)施名等一個(gè)設(shè)施需要多個(gè)替換詞的情況下,成為針對(duì)所有的替換詞的與語(yǔ)音模式模型之間的模式匹配,運(yùn)算量變得龐大。另外,難以生成所有的替換詞,并且花費(fèi)很大的勞力。通過(guò)語(yǔ)音識(shí)別單元使用語(yǔ)言模型和聲音模型對(duì)輸入語(yǔ)音進(jìn)行語(yǔ)音識(shí)別,輸出規(guī)定個(gè)數(shù)的由識(shí)別得分和文本表述的組構(gòu)成的識(shí)別結(jié)果,具備N(xiāo)最優(yōu)候選重構(gòu)單元,該N最優(yōu)候選重構(gòu)單元將該識(shí)別結(jié)果與詞素詞典存儲(chǔ)器所保持的詞素詞典進(jìn)行對(duì)照,檢查識(shí)別結(jié)果的表述是否能夠以詞素詞典的某個(gè)詞素的組合來(lái)表現(xiàn),在能夠表現(xiàn)的情況下修正識(shí)別得分,按照修正后的識(shí)別得分重新排列位次并作為識(shí)別結(jié)果。
文檔編號(hào)G10L15/28GK102341843SQ20108001015
公開(kāi)日2012年2月1日 申請(qǐng)日期2010年1月27日 優(yōu)先權(quán)日2009年3月3日
發(fā)明者岡登洋平, 花沢利行 申請(qǐng)人:三菱電機(jī)株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
武定县| 五家渠市| 沭阳县| 镇平县| 特克斯县| 钟祥市| 古蔺县| 安国市| 大冶市| 泌阳县| 营山县| 金川县| 玉环县| 多伦县| 江油市| 米易县| 繁峙县| 奈曼旗| 花垣县| 阜阳市| 潮安县| 凌海市| 洪泽县| 长泰县| 军事| 石嘴山市| 泾阳县| 娄烦县| 洪泽县| 绿春县| 苏尼特左旗| 葵青区| 东平县| 丰城市| 双辽市| 秦安县| 绥江县| 新和县| 南木林县| 大理市| 南涧|