發(fā)音信息生產(chǎn)裝置、車載信息裝置以及數(shù)據(jù)庫生成方法
【專利摘要】單詞串信息DB存儲部(1)存儲有登記了單詞串的書寫信息與正式發(fā)音信息的單詞串信息DB。該單詞串信息DB在根據(jù)書寫信息自動生成的發(fā)音信息與正式發(fā)音信息一致的情況下,僅登記書寫信息,在不一致的情況下,登記書寫信息與正式發(fā)音信息。單詞串信息檢索部(2)從單詞串信息DB存儲部(1)獲取與輸入字符串相一致的單詞串的信息,發(fā)音信息生成判定部(3)若判定未登記該單詞串的正式發(fā)音信息,則使發(fā)音信息生成部(4)生成發(fā)音信息并進行外部輸出,若判定登記有該單詞串的正式發(fā)音信息,則從發(fā)音信息輸出部(5)對該正式發(fā)音信息進行外部輸出。
【專利說明】發(fā)音信息生產(chǎn)裝置、車載信息裝置以及數(shù)據(jù)庫生成方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及生成單詞串或者單詞的發(fā)音信息的發(fā)音信息生成裝置、使用該發(fā)音信息生成裝置進行聲音合成或聲音識別處理的車載信息裝置以及為了使該發(fā)音信息生成裝置生成發(fā)音信息所需的單詞串信息數(shù)據(jù)庫的生成方法。
【背景技術(shù)】
[0002]當前,車載導(dǎo)航裝置中一般具有聲音輸入輸出接口,需要對城市名以及到道路名等地名進行聲音輸出的聲音合成功能、以及對用戶所發(fā)聲的地名進行聲音識別的功能。在車載導(dǎo)航裝置中,為了進行聲音合成以及聲音識別,需要發(fā)音信息,該發(fā)音信息表示地名等作為對象的單詞的讀音。因此,現(xiàn)有的聲音合成裝置具有存儲有表示單詞的書寫的書寫信息以及與書寫相對應(yīng)的發(fā)音信息的數(shù)據(jù)庫(例如,參照專利文獻1、2)。
[0003]另一方面,存在生成與書寫相對應(yīng)的發(fā)音信息的字素音素(Grapheme-to-Phoneme ;G2P或者GTP)轉(zhuǎn)換等技術(shù)。例如,若對紐約州的城市的書寫“ALDERBEND”進行G2P轉(zhuǎn)換,則生成《*” 011 dir" bEnd))以作為發(fā)音信息。
現(xiàn)有技術(shù)文獻 專利文獻
[0004]專利文獻I
日本專利特開平9 - 325789號公報 專利文獻2
日本專利特開2004 - 326367號公報
【發(fā)明內(nèi)容】
發(fā)明所要解決的技術(shù)問題
[0005]現(xiàn)有的聲音合成裝置在數(shù)據(jù)庫中存儲有對于各個書寫的發(fā)音信息,因此數(shù)據(jù)庫的大小變得非常大。因此,具有需要存儲數(shù)據(jù)庫的大容量存儲器的問題。
[0006]另一方面,在利用G2P轉(zhuǎn)換等技術(shù)生成與書寫相對應(yīng)的發(fā)音信息的情況下,在數(shù)據(jù)庫中僅存儲書寫信息,根據(jù)需要生成發(fā)音信息即可,因此能減小數(shù)據(jù)庫的大小。然而,具有所生成的發(fā)音信息不一定正確的問題。例如,紐約州的城市書寫“ALDER BR00K”的正確的發(fā)音信息是《*” 01 I dir" brUk)),但若利用G2P轉(zhuǎn)換,則會生成錯誤的發(fā)音信息《*” 01 Id@r” krik))0
[0007]本發(fā)明是為了解決上述問題而完成的,其目的在于,使用小容量的數(shù)據(jù)庫,來生成與書寫相對應(yīng)的正確的發(fā)音信息。
解決技術(shù)問題所采用的技術(shù)方案
[0008]本發(fā)明的發(fā)音信息生成裝置包括:單詞串/單詞信息數(shù)據(jù)庫,該單詞串/單詞信息數(shù)據(jù)庫在根據(jù)單詞串或者單詞的書寫信息自動生成的發(fā)音信息與該單詞串或者單詞的書寫所對應(yīng)的正式的發(fā)音信息不一致的情況下,一并登記書寫信息與正式的發(fā)音信息,在一致的情況下,登記書寫信息而不登記正式的發(fā)音信息;單詞串信息檢索部,該單詞串信息檢索部從單詞串/單詞信息數(shù)據(jù)庫獲取與輸入的單詞串或者單詞相應(yīng)的書寫信息;發(fā)音信息生成判定部,該發(fā)音信息生成判定部判定與單詞串信息檢索部所取得的書寫信息相對應(yīng)的正式的發(fā)音信息是否已登記到單詞串/單詞信息數(shù)據(jù)庫中;發(fā)音信息生成部,該發(fā)音信息生成部根據(jù)發(fā)音信息生成判定部的判定結(jié)果,從未登記正式的發(fā)音信息的書寫信息生成發(fā)音信息;以及發(fā)音信息輸出部,該發(fā)音信息輸出部根據(jù)發(fā)音信息生成判定部的判定結(jié)果,在未登記書寫信息的正式的發(fā)音信息的情況下,輸出發(fā)音信息生成部生成的發(fā)音信息,在登記了正式的發(fā)音信息的情況下,輸出單詞串/單詞信息數(shù)據(jù)庫中所登記的對應(yīng)的正式的發(fā)音信息。
[0009]此外,本發(fā)明的車載信息裝置包括上述發(fā)音信息生成裝置,且具有聲音合成部與聲音識別部中的至少一個,該聲音合成部利用發(fā)音信息生成裝置生成進行聲音輸出的單詞串或者單詞的發(fā)音信息,并將該生成的發(fā)音信息轉(zhuǎn)換為合成聲音,該聲音識別部將聲音識別對象即單詞串或者單詞作為輸入字符串,基于利用發(fā)音信息生成裝置生成的發(fā)音信息,生成聲音識別詞典,利用該聲音識別詞典,對輸入的聲音信息進行聲音識別。
[0010]此外,本發(fā)明的數(shù)據(jù)庫生成方法包括:發(fā)音信息生成步驟,該發(fā)音信息生成步驟中,基于包含單詞串或者單詞的書寫信息以及與該單詞串或者單詞的書寫相對應(yīng)的正式的發(fā)音信息的輸入數(shù)據(jù),從書寫信息來生成發(fā)音信息;發(fā)音信息比較步驟,該發(fā)音信息比較步驟中,將發(fā)音信息生成步驟中所生成的發(fā)音信息與輸入數(shù)據(jù)中包含的正式的發(fā)音信息進行比較;以及單詞串信息登記步驟,該單詞串信息登記步驟中,根據(jù)發(fā)音信息比較步驟的比較結(jié)果,在發(fā)音信息生成步驟中所生成的發(fā)音信息與正式的發(fā)音信息不一致的情況下,一并將書寫信息與正式的發(fā)音信息登記至數(shù)據(jù)庫,在一致的情況下,登記書寫信息而不登記正式的發(fā)音信息。
發(fā)明效果
[0011]根據(jù)本發(fā)明,在預(yù)先判明自動生成的發(fā)音信息與正式的發(fā)音信息一致的情況下,在發(fā)音信息生成處理中根據(jù)書寫信息生成發(fā)音信息,因此無需在數(shù)據(jù)庫中預(yù)先登記正式的發(fā)音信息,從而能減小數(shù)據(jù)庫的大小。另一方面,在預(yù)先判明自動生成的發(fā)音信息與正式的發(fā)音信息不一致的情況下,預(yù)先在數(shù)據(jù)庫中登記正式的發(fā)音信息,在發(fā)音信息生成處理中并不根據(jù)書寫信息生成發(fā)音信息,而是使用登記在數(shù)據(jù)庫中的發(fā)音信息,因此能防止生成錯誤的發(fā)音信息。因此,能利用小容量的數(shù)據(jù)庫來生成與書寫相對應(yīng)的、正確的發(fā)音信息。
[0012]此外,根據(jù)本發(fā)明能提供一種發(fā)音信息生成裝置,該發(fā)音信息生成裝置由于減小了數(shù)據(jù)庫大小,因此能使發(fā)音信息生成裝置小型化,適合用于要求小型化的車載信息裝置。
【專利附圖】
【附圖說明】
[0013]圖1是表示本發(fā)明的實施方式I所涉及的發(fā)音信息生成裝置的結(jié)構(gòu)的框圖。
圖2是表示實施方式I所涉及的發(fā)音信息生成裝置具有的單詞串信息DB的一個示例的圖。
圖3是表示實施方式I所涉及的發(fā)音信息生成裝置具有的單詞串信息DB的其他示例的圖。
圖4是表示實施方式I所涉及的發(fā)音信息生成裝置的動作的流程圖。圖5是表示實施方式I所涉及的DB生成裝置的結(jié)構(gòu)的框圖。
圖6是表示實施方式I所涉及的DB生成裝置的動作的流程圖。
圖7是表示本發(fā)明的實施方式2所涉及的DB生成裝置的結(jié)構(gòu)的流程圖。
圖8是表示實施方式2所涉及的DB生成裝置所生成的單詞串信息DB的一個示例的圖。 圖9是表示實施方式2所涉及的DB生成裝置的動作的流程圖。
圖10是表示本發(fā)明的實施方式3所涉及的發(fā)音信息生成裝置具有的單詞串信息DB以及發(fā)音信息列表的一個示例的圖。
圖11是表示實施方式3所涉及的發(fā)音信息生成裝置的動作的流程圖。
圖12是表示實施方式3所涉及的發(fā)音信息生成裝置具有的單詞串信息DB以及發(fā)音信息列表的其他示例的圖。
圖13是表示本發(fā)明的實施方式4所涉及的DB生成裝置所生成的單詞串信息DB以及發(fā)音信息列表的一個示例的圖。
圖14是表示本發(fā)明的實施方式5所涉及的導(dǎo)航裝置的結(jié)構(gòu)的框圖。
【具體實施方式】
[0014]下面,為了對本發(fā)明進行更加詳細的說明,參照附圖對本發(fā)明的實施方式進行說明。
實施方式I
圖1所示的發(fā)音信息生成裝置將字`符串用于輸入,并生成與該輸入字符串相對應(yīng)的發(fā)音信息,包括單詞串信息數(shù)據(jù)庫(`以下稱為DB)存儲部1、單詞串信息檢索部2、發(fā)音信息生成判定部3、發(fā)音信息生成部4以及發(fā)音信息輸出部5。
[0015]單詞串信息DB存儲部I是存儲裝置,其存儲有將書寫信息與發(fā)音信息成組來作為單詞串信息進行登記的DB(下面,稱為單詞串信息DBla),其中書寫信息表示單詞串的書寫,發(fā)音信息以文字及符號來表不該書寫的正式的聲音。
圖2是表示單詞串信息DBla的一個示例的圖。當根據(jù)單詞串的書寫信息、利用G2P轉(zhuǎn)換等自動生成的發(fā)音信息與從發(fā)音字典以及地圖DB等人工整備的DB取得的發(fā)音信息(下面,稱為正式的發(fā)音信息)不一致時,與書寫信息成組地登記正式的發(fā)音信息。
另一方面,當利用G2P轉(zhuǎn)換等自動生成的發(fā)音信息與該單詞串的正式的發(fā)音信息一致時,僅在單詞串?目息DBla中登記書寫彳目息。
另外,關(guān)于單詞串信息DBla的生成方法將在后面闡述。
[0016]例如,紐約州的城市“ALDER BR00K”的正式的發(fā)音信息是《*”01 I d@r”brUk》,而利用G2P轉(zhuǎn)換等自動生成的結(jié)果為《*”01 I d@r”krik》。在該情況下,登記正式的發(fā)音信息《*”01 I d@r”brUk》,以作為與書寫信息“ALDER BR00K”成組的發(fā)音信息。
另一方面,紐約州的城市“ALDER BEND”的正式的發(fā)音信息是《*”01 I d@r”bEnd》,而利用G2P轉(zhuǎn)換等自動生成的結(jié)果為《*”01 I dir"bEnd))0在該情況下,能通過自動生成獲得正式的發(fā)音信息,因此作為與書寫信息“ALDER BEND”成組的發(fā)音信息,不登記任何發(fā)音信息。
[0017]此外,例如,書寫信息“HERVEY STREET”能通過自動生成獲得正式的發(fā)音信息,因此單詞串信息DBla中未登記發(fā)音信息,另一方面,書寫信息“QUAKER STREET”不能通過自動生成獲得正式的發(fā)音信息,因此在單詞串信息DBla中登記正式的發(fā)音信息《*”kwe I k@r,,strit〉〉。
另外,為了方便說明,適當?shù)丶僭O(shè)例示的各單詞串是否能通過G2P轉(zhuǎn)換等自動生成正式的發(fā)音信息,有可能與實際通過G2P轉(zhuǎn)換自動生成的發(fā)音信息不同。
[0018]另外,單詞串信息DBla中登記的單詞串并不限于如上所述的地名,住址名稱、設(shè)施名稱、人名、公司名稱等,與發(fā)音信息的使用目的相對應(yīng)的單詞串即可。
[0019]單詞串信息檢索部2將發(fā)音信息的生成對象即輸入字符串用作檢索關(guān)鍵字對單詞串信息DB存儲部I的單詞串信息DBla進行檢索,從而取得具有與該檢索關(guān)鍵字相一致的信息的單詞串信息。該輸入字符串的單詞串的書寫信息設(shè)為(“ALDER BR00K”等)。
[0020]發(fā)音信息生成判定部3調(diào)查由單詞串信息檢索部2取得的單詞串信息中是否存儲有正式的發(fā)音信息,并利用后級的發(fā)音信息生成部4來判定是否自動生成發(fā)音信息。在判定為需要自動生成發(fā)音信息的情況下,將相對應(yīng)的單詞串信息從發(fā)音信息生成判定部3輸出至發(fā)音信息生成部4。另一方面,在判定為不需要自動生成發(fā)音信息的情況下,將相對應(yīng)的單詞串信息從發(fā)音信息生成判定部3輸出至發(fā)音信息輸出部5。
[0021]在由發(fā)音信息生成判定部3判定為需要自動生成發(fā)音信息的情況下,發(fā)音信息生成部4從發(fā)音信息生成判定部3接受單詞串信息,并通過G2P轉(zhuǎn)換等規(guī)定的方法自動生成與該單詞串的書寫信息相對應(yīng)的發(fā)音信息。
[0022]在由發(fā)音信息生成判定部3判定為需要自動生成發(fā)音信息的情況下,發(fā)音信息輸出部5接受發(fā)音信息生成部4自動生成的發(fā)音信息,并進行外部輸出。另一方面,在判定為不需要自動生成的情況下,發(fā)音信息輸出部5經(jīng)由單詞串信息檢索部2以及發(fā)音信息生成判定部3,接受登記于單詞串信息DBla中的正式的發(fā)音信息,并進行外部輸出。
[0023]另外,單詞串信息DB存儲部I也可以存儲有圖3所示的單詞串信息DBlb以代替圖2所示的單詞串信息DBla。如圖3所示,單詞串信息DBlb中作為單詞串信息登記有書寫信息以及發(fā)音信息,除此以外還成組地登記有單詞串固有的識別信息(下面稱為ID)以及表示有無發(fā)音信息的標記(True (真)或者False (假))。
在單詞串信息DBlb的情況下,輸入至單詞串信息檢索部2的輸入字符串例如可以是單詞串的書寫信息(“ALDER BR00K”等),也可以是單詞串固有的ID (“I”等)。然后,單詞串信息檢索部2根據(jù)輸入字符串的種類(書寫信息或者ID ),來變更單詞串信息DBlb的檢索范圍(書寫信息或者ID)即可。
[0024]接著,利用圖4所示的流程圖,對發(fā)音信息生成裝置的動作進行說明。
首先,在步驟STl中,將發(fā)音信息的生成對象即輸入字符串輸入至單詞串信息檢索部2,單詞串信息檢索部2將該輸入字符串用作檢索關(guān)鍵字對單詞串信息DBla進行檢索,檢索與檢索關(guān)鍵字相一致的單詞串信息。
[0025]接著,在步驟ST2中,若單詞串信息檢索部2未找到與檢索關(guān)鍵字一致的單詞串信息(步驟ST2為“否”),則結(jié)束一連串的發(fā)音信息生成處理。此時,例如發(fā)音信息輸出部5也可以將表示該單詞串未登記在單詞串信息DBla中這一情況進行外部輸出。
另一方面,若找到一致的單詞串信息(步驟ST2為“是”),則單詞串信息檢索部2取得該單詞串信息,并前進至下一個步驟ST3。
例如,在單詞串信息DB存儲部I存儲有圖2所示的單詞串信息DBla或者圖3所示的單詞串信息DBlb的任一種的情況下,若輸入輸入字符串“ALDER BROOK",則單詞串信息檢索部2將該輸入字符串用作書寫信息的檢索關(guān)鍵字,從單詞串信息DBla或者單詞串信息DBlb取得包含書寫信息“ALDER BROOK”以及成組的發(fā)音信息《*” 01 I d@r”brUk》的單詞
串信息。
此外,例如,在單詞串信息DB存儲部I存儲有圖3所示的單詞串信息DBlb的情況下,作為輸入字符串輸入了“I”,則單詞串信息檢索部2將該輸入字符串用作ID的檢索關(guān)鍵字,從圖3所示的單詞串信息DBlb取得包含ID “I”、以及成組的書寫信息“ALDER BR00K”、發(fā)音信息《*”01 I d@r”brUk》4^a“Ture (真)”的單詞串信息。
[0026]接著,在步驟ST3中,發(fā)音信息生成判定部3檢查從單詞串信息檢索部2輸入的單詞串信息中是否包含發(fā)音信息,若包含(步驟ST3為“是”),則判定為無需利用發(fā)音信息生成部4自動生成單詞串的發(fā)音信息,并前進至步驟ST6,若不包含(步驟ST3為“否”),則判定為需要利用發(fā)音信息生成部4自動生成單詞串的發(fā)音信息,并前進至步驟ST4。
另外,在單詞串信息中包含表示有無發(fā)音信息的標記的情況下,發(fā)音信息生成判定部3可檢查該標記來判定自動生成的必要性。
[0027]在由發(fā)音信息生成判定部3判定為需要自動生成單詞串的發(fā)音信息的情況下(步驟ST3為“否”),接著在步驟ST4中,發(fā)音信息生成部4根據(jù)由單詞串信息檢索部2所獲得的單詞串信息中包含的顯示信息,通過G2P轉(zhuǎn)換等,生成該單詞串的發(fā)音信息并輸出至發(fā)音信息輸出部5。接著,在步驟ST5中,發(fā)音信息輸出部5對由發(fā)音信息生成部4自動生成的發(fā)音信息進行外部輸出。
另一方面,在由發(fā)音信息生成判定部3判定為無需自動生成單詞串的發(fā)音信息的情況下(步驟ST3為“是”),接著在步驟ST6中,發(fā)音信息輸出部5對包含在由發(fā)音信息生成部4獲得的單詞串信息中的發(fā)音信息`進行外部輸出。另外,在判定為無需自動生成發(fā)音信息的情況下,發(fā)音信息輸出部5也可以從單詞串信息DBla取得發(fā)音信息。
[0028]接下來,對存儲在單詞串信息DB存儲部I中的單詞串信息DBla的生成方法進行說明。
圖5是表示生成單詞串信息DBla的DB生成裝置的結(jié)構(gòu)的框圖。圖5所示的DB生成裝置是生成單詞串信息DBla的裝置,該單詞串信息DBla登記了包含于輸入數(shù)據(jù)中的單詞串信息,該裝置包括單詞串信息取得部6、發(fā)音信息生成部4、發(fā)音信息比較部7、單詞串信息登記部8。另外,作為前提,設(shè)為DB生成裝置所具有的發(fā)音信息生成部4的發(fā)音信息生成方法與圖1所示的發(fā)音信息生成裝置所具有的發(fā)音信息生成部4的方法(G2P轉(zhuǎn)換等)相同。此外,輸入到DB生成裝置的輸入數(shù)據(jù)例如在將圖1所示的發(fā)音信息生成裝置應(yīng)用于導(dǎo)航裝置的情況下,是表示地圖DB中所包含的地名等書寫信息與正式的發(fā)音信息成組的單詞串信息。
[0029]單詞串信息取得部6從輸入數(shù)據(jù)取得未處理的單詞串信息。
發(fā)音信息生成部4根據(jù)由單詞串信息取得部6取得的單詞串信息中包含的書寫信息,利用G2P轉(zhuǎn)換等規(guī)定的方法,自動生成發(fā)音信息。
發(fā)音信息比較部7將由單詞串信息取得部6取得的單詞串信息中包含的正式的發(fā)音信息與由發(fā)音信息生成部4自動生成的發(fā)音信息進行比較,來判定兩者是否一致。
在判定為由發(fā)音信息生成部4自動生成的發(fā)音信息與正式的發(fā)音信息一致的情況下,單詞串信息登記部8僅將包含在單詞串信息中的書寫信息登記到單詞串信息DBla,而不登記發(fā)音信息。另一方面,在判定為發(fā)音信息不一致的情況下,將經(jīng)由單詞串信息取得部6、發(fā)音信息生成部4以及發(fā)音信息比較部7接受的、輸入數(shù)據(jù)中的單詞串信息中包含的書寫信息與正式的發(fā)音信息成組地登記到單詞串信息DBla中。因此,登記有圖2所示的單詞串信息的DB被生成以作為單詞串信息DBla。
[0030]接著,利用圖6所示的流程圖,對DB生成裝置的動作進行說明。
首先,在步驟STl I中,若作為單詞串信息DBla的登記對象的輸入數(shù)據(jù)被輸入至單詞串信息取得部6,則在存在未處理的單詞串信息的情況下(步驟STll為“是”),單詞串信息取得部6取得該單詞串信息并輸出至發(fā)音信息生成部4以及發(fā)音信息比較部7 (步驟ST12)。另一方面,在不存在未處理的單詞串信息的情況下(步驟STll為“否”),結(jié)束DB生成處理。
[0031]在步驟ST13中,發(fā)音信息生成部4根據(jù)由單詞串信息取得部6取得的單詞串信息所包含的書寫信息,利用G2P轉(zhuǎn)換等,自動生成該單詞串的發(fā)音信息,并輸出至發(fā)音信息比較部7。接著,在步驟ST14中,發(fā)音信息比較部7將由發(fā)音信息生成部4自動生成的發(fā)音信息與由單詞串信息取得部6所取得的、同一個單詞串的單詞串信息中包含的正式的發(fā)音信息進行比較,來判定兩者是否一致,并將判定結(jié)果輸出至單詞串信息登記部8。
另外,在單詞串由多個單詞構(gòu)成的情況下,發(fā)音信息比較部7僅在所有的單詞發(fā)音信息均一致的情況下判定為一致。例如,對于書寫信息“ALDER BR00K”,在從輸入數(shù)據(jù)取得的發(fā)音信息為《*”01 |d@r”brUk》、而自動生成的發(fā)音信息為《*”01 |d@r”krik》的情況下,由于單詞“ALDER”的發(fā)音信息一致,但單詞“BR00K”的發(fā)音信息不一致,因此發(fā)音信息比較部7判定為作為整個單詞串不一致。
[0032]在發(fā)音信息比較部7判定為兩者一致的情況下(步驟ST14為“是”),接著在步驟ST15中,單詞串信息登記部8將由單詞串信息取得部6取得的單詞串信息所包含的書寫信息登記到單詞串信息DBla,不登記發(fā)音信息。
另一方面,在發(fā)音信息比較部7判定為兩者不一致的情況下(步驟ST14為“否”),接著在步驟ST16中,單詞串信息登記部8將由單詞串信息取得部6取得的單詞串信息所包含的書寫信息與正式的發(fā)音信息成組地登記到單詞串信息DBla。
[0033]在DB生成裝置中,若登記對象的單詞串信息的處理在步驟ST15或者ST16為止結(jié)束,則再次返回到步驟ST11,開始對輸入數(shù)據(jù)的下一個單詞串信息進行處理。
[0034]另外,DB生成裝置所生成的DB除了圖2所示的單詞串信息DBla那樣的結(jié)構(gòu)以外,也可以是圖3所示的單詞串信息DBlb那樣的結(jié)構(gòu)。在該情況下,在圖6的步驟ST116中,單詞串信息登記部8將單詞串信息登記到單詞串信息DBla中時,也登記該單詞串固有的ID以及表示有無發(fā)音信息的標記。
[0035]如上所述,根據(jù)實施方式1,發(fā)音信息生裝置包括:單詞串信息DB存儲部1,該單詞串信息DB存儲部I存儲有單詞串信息DBla,在根據(jù)單詞串的書寫信息并利用G2P轉(zhuǎn)換等規(guī)定的方法自動生成的發(fā)音信息與該單詞串的書寫所對應(yīng)的正式的發(fā)音信息不一致的情況下,該單詞串信息DBla —并登記書寫信息與正式的發(fā)音信息,在一致的情況下,該單詞串信息DBla僅登記書寫信息;單詞串信息檢索部2,該單詞串信息檢索部2從單詞串信息DBla取得包含與該輸入字符串相應(yīng)的書寫信息的單詞串信息;發(fā)音信息生成判定部3,該發(fā)音信息生成判定部3判定與單詞串信息檢索部2所取得的書寫信息相對應(yīng)的正式的發(fā)音信息和與從單詞串信息DBla取得的書寫信息相對應(yīng)的正式的發(fā)音信息是否登記在單詞串信息DBla中;發(fā)音信息生成部4,該發(fā)音信息生成部4根據(jù)發(fā)音信息生成判定部3的判定結(jié)果,從未登記正式的發(fā)音信息的書寫信息利用G2P轉(zhuǎn)換等規(guī)定的方法,來生成發(fā)音信息;以及發(fā)音信息輸出部5,該發(fā)音信息輸出部5根據(jù)發(fā)音信息生成判定部3的判定結(jié)果,在對于書寫信息未登記正式的發(fā)音信息的情況下,輸出發(fā)音信息生成部4生成的發(fā)音信息,在登記了正式的發(fā)音信息的情況下,輸出登記于單詞串信息DBla中的該正式的發(fā)音信息。因此,在預(yù)先判明根據(jù)單詞串的書寫信息自動生成的發(fā)音信息與該單詞串正式的發(fā)音信息一致的情況下,由于無需將發(fā)音信息登記到單詞串信息DBla,由此,能相應(yīng)減小單詞串信息DBla的容量。另一方面,在預(yù)先判明根據(jù)單詞串的書寫信息自動生成的發(fā)音信息與該單詞串正式的發(fā)音信息不一致的情況下,在單詞串信息DBla中存儲正式的發(fā)音信息,在發(fā)音信息生成處理過程中不進行自動生成,而是使用存儲的正式的發(fā)音信息,因此能防止生成錯誤的發(fā)音信息。因此,能利用小容量的數(shù)據(jù)庫來生成正確的發(fā)音信息。
[0036]另外,在上述實施方式I中,DB生成裝置在單詞串信息DBla、lb中以單詞串單位(“ALDER BR00K”等)來登記書寫信息與發(fā)音信息,但并不限于此,也可以以單詞單位(“ALDER”等)來登記書寫信息與發(fā)音信息(B卩,單詞信息DB)。并且,在發(fā)音信息生成裝置中,單詞串信息DB存儲部I存儲了單詞單位的單詞串信息DBlaUb情況下,單詞串信息檢索部2、發(fā)音信息生成判定部3、發(fā)音信息生成部4以及發(fā)音信息輸出部5以單詞單位進行處理即可。
此外,圖示例中示出了由兩個單詞構(gòu)成的單詞串,也可以是由三個以上的單詞構(gòu)成的單詞串,或者可以不是單詞串而是單詞。
[0037]另外,在發(fā)音信息生成裝置由計算機構(gòu)成的情況下,可以是如下結(jié)構(gòu):計算機的存儲器中存儲有描述了單詞串信息DBla、單詞串信息檢索部2、發(fā)音信息生成判定部3、發(fā)音信息生成部4、發(fā)音信息輸出部5的處理內(nèi)容的程序,計算機的CPU執(zhí)行存儲于存儲器中的程序。
同樣地,在DB生成裝置由計算機構(gòu)成的情況下,可以是如下結(jié)構(gòu):計算機的存儲器中存儲有描述了發(fā)音信息生成部4、單詞串信息取得部6、發(fā)音信息比較部7、單詞串信息登記部8的處理內(nèi)容的程序,計算機的CPU執(zhí)行存儲于存儲器中的程序。
[0038]實施方式2.圖7是表示本實施方式2所涉及的DB生成裝置的結(jié)構(gòu)的框圖。該DB生成裝置新包括了對單詞串信息DB中的單詞串的出現(xiàn)頻度進行計算的出現(xiàn)頻度計算部9,單詞串信息登記部8根據(jù)出現(xiàn)頻度來判定是否登記單詞串,并考慮出現(xiàn)頻度來生成單詞串信息DBlc。除此以外,對于圖7中與圖5相同或相當?shù)牟糠郑瑯俗⑾嗤臉颂?,并省略說明。
此外,使用本實施方式2所涉及的DB生成裝置所生成的單詞串信息DBlc的發(fā)音信息生成裝置與圖1所示的發(fā)音信息生成裝置結(jié)構(gòu)相同,因此引用圖1。
[0039]在上述實施方式I中,在由發(fā)音信息生成部4自動生成的發(fā)音信息與正式的發(fā)音信息一致的情況下,單詞串信息DBla、Ib中未登記正式的發(fā)音信息,但在本實施方式2中,即使在兩者一致的情況下,若該單詞串的出現(xiàn)頻度在指定的閥值以上時,則預(yù)先將正式的發(fā)音信息登記到單詞串信息DBlc。
此處所謂的出現(xiàn)頻度是指單詞串信息DB I c中的出現(xiàn)頻度,但由于DB生成時DB中的出現(xiàn)頻度不明,因此等效地使用生成單詞串信息DB的原始數(shù)據(jù)、即輸入數(shù)據(jù)(發(fā)音詞典、地圖DB等)中的出現(xiàn)頻度。例如,在利用發(fā)音信息生成裝置生成的發(fā)音信息來進行聲音合成以及聲音識別處理的導(dǎo)航裝置中,認為地圖DB中出現(xiàn)頻度較高的單詞串的發(fā)音信息在導(dǎo)航動作中被頻繁地使用。因此,預(yù)先在單詞串信息DB中登記使用頻度較高的發(fā)音信息,在使用時,發(fā)音信息生成裝置不進行自動生成也行,從而縮短發(fā)音信息生成處理時間。
此外,若出現(xiàn)頻度的閥值較小,則存在單詞串信息DBlc的數(shù)據(jù)量增加而發(fā)音信息生成處理時間縮短的趨勢,若閥值較大,則存在單詞串信息DBlc的數(shù)據(jù)量減小而發(fā)音信息生成處理時間增長的趨勢。因此,兼顧單詞串信息DBlc的數(shù)據(jù)量與發(fā)音信息生成處理時間,相對應(yīng)地設(shè)定閥值即可。
[0040]圖8是表示實施方式2的DB生成裝置生成的單詞列信息DBlc的一個示例的圖。 圖2所示的單詞串信息DBla中,書寫信息“ALDER BEND”以及“HERVEY STREET”能自
動生成正式的發(fā)音信息,因此未登記發(fā)音信息,但在圖8所示的單詞串信息DBlc中,由于其中的書寫信息“ALDER BEND”的出現(xiàn)頻度在閥值以上,因此登記有正式的發(fā)音信息。
[0041]接著,利用圖9所示的流程圖,對DB生成裝置的動作進行說明。另外,圖9所示的步驟ST21?ST24是與上述實施方式I的圖6中說明的步驟STll?ST14相同的處理,因此省略說明。
在判定為由發(fā)音信息生成部4自動生成的發(fā)音信息與由單詞串信息取得部6所取得的正式的發(fā)音信息不一致的情況下(步驟ST24為“否”),接著在步驟ST25中,單詞串信息登記部8c將由單詞串信息取得部6所取得的正式的發(fā)音信息與其書寫信息成組地登記到單詞串信息DBlc中。
[0042]另一方面,在判定為兩者一致的情況下(步驟ST24為“是”),接著在步驟ST26中,出現(xiàn)頻度計算部9計算出該發(fā)音信息的單詞串在輸入數(shù)據(jù)中的出現(xiàn)頻度,并輸出至單詞串信息登記部8c,單詞串信息登記部Sc將該出現(xiàn)頻度與規(guī)定的閥值進行比較。當出現(xiàn)頻度在閥值以上時(步驟ST26為“是”),單詞串信息登記部Sc將由單詞串信息取得部6所取得的正式的發(fā)音信息與其書寫信息成組地登記到單詞串信息DBlc中(步驟ST25)。另一方面,當出現(xiàn)頻度小于閥值時(步驟ST26為“否”),單詞串信息登記部Sc僅將由單詞串信息取得部6所取得的書寫信息登記到單詞串信息DBlc中(步驟ST27)。
[0043]另外,在單詞串信息DBlc構(gòu)成為登記有單詞串固有ID以及表示有無發(fā)音信息的標記的情況下,單詞串信息登記部8c在將單詞串信息登記到單詞串信息DBlc時,也可以登記該單詞串固有ID以及表示有無發(fā)音信息的標記(步驟ST26、27)。
此外,圖9的流程圖在步驟ST26中出現(xiàn)頻度計算部9計算出現(xiàn)頻度,但計算時刻并不限于此,例如也可以在步驟ST21的處理開始前計算輸入數(shù)據(jù)的各單詞串的出現(xiàn)頻度。
[0044]如上所述,根據(jù)實施方式2,發(fā)音信息生成裝置的單詞串信息DB存儲部I所存儲的單詞串信息DBlc在根據(jù)單詞串的書寫信息自動生成的發(fā)音信息與該單詞串的正式的發(fā)音信息不一致的情況下,一并登記有書寫信息與正式的發(fā)音信息,在一致的情況下且單詞串信息DBlc中該單詞串的出現(xiàn)頻度在規(guī)定的閥值以上時,也一并登記有書寫信息與正式的發(fā)音信息,另一方面,在一致的情況且出現(xiàn)頻度小于閥值時,僅登記書寫信息。因此,通過恰當?shù)卦O(shè)定出現(xiàn)頻度的閥值,能兼顧到數(shù)據(jù)庫容量的減少以及發(fā)音信息生成處理時間的縮短。[0045]另外,在上述實施方式2中,DB生成裝置在單詞串信息DBlc中以單詞串單位(“ALDER BR00K”等)來登記書寫信息與發(fā)音信息,但并不限于此,也可以以單詞單位(“ALDER”等)來登記書寫信息與發(fā)音信息。然后,DB生成裝置的出現(xiàn)頻度計算部9以單詞單位來計算出現(xiàn)頻度,并且單詞串信息取得部6、發(fā)音信息生成部4、發(fā)音信息比較部7以及單詞串信息登記部8c以單詞單位進行處理即可。并且,在發(fā)音信息生成裝置中,單詞串信息DB存儲部I存儲了單詞單位的單詞串信息DBlc情況下,單詞串信息檢索部2、發(fā)音信息生成判定部3、發(fā)音信息生成部4以及發(fā)音信息輸出部5以單詞單位進行處理即可。
此外,圖示例中示出了由兩個單詞構(gòu)成的單詞串,也可以是由三個以上的單詞構(gòu)成的單詞串,或者可以不是單詞串而是單詞。
[0046]實施方式3.本實施方式3所涉及的發(fā)音信息生成裝置的結(jié)構(gòu)與圖1的發(fā)音信息生成裝置在圖上是大致相同的結(jié)構(gòu),因此引用圖1來進行說明。
[0047]圖10是表示本實施方式3的發(fā)音信息生成裝置中的、單詞串信息DB存儲部I所存儲的單詞串信息DBld以及發(fā)音信息列表IOd的一個示例的圖。單詞串信息DBld成組地登記有單詞串的書寫信息以及位置信息,該位置信息為存儲與該書寫信息相對應(yīng)的發(fā)音信息的發(fā)音信息列表IOd內(nèi)的位置信息。該位置信息以單詞單位來登記。此外,發(fā)音信息列表IOd中與位置信息成組地登記有從發(fā)音詞典、地圖DB等由人工配備的DB取得的正式的發(fā)音信息。在根據(jù)單詞的書寫信息并利用G2P轉(zhuǎn)換等自動生成的發(fā)音信息與正式的發(fā)音信息不一致的情況下,該單詞的正式的發(fā)音信息與位置信息成組地登記到發(fā)音信息列表IOd中,單詞串信息DBld中成組地登記有書寫信息與位置信息。
另一方面,當利用G2P轉(zhuǎn)換等自動生成的發(fā)音信息與該單詞列的正式的發(fā)音信息一致時,不登記發(fā)音信息的位置信息。
另外,關(guān)于單詞串信息DBld以及發(fā)音信息列表IOd的生成方法在后面闡述。
[0048]例如,單詞串“ALDER BR00K”由單詞“ALDER”與“BROOK”構(gòu)成,根據(jù)“ALDER”自動生成的發(fā)音信息《*”011 d@r》與正式的發(fā)音信息一致,因此位置信息成為“(空字符串)”。另一方面,根據(jù)“BR00K”自動生成的發(fā)音信息《” krik》與正式的發(fā)音信息《”brUk》不同,因此位置信息成為“I”。因此,單詞串信息DBld中作為書寫信息“ALDER BR00K”的發(fā)音信息的位置信息登記有“(空字符串)/I”。
另外,在本例中,書寫信息的單詞單位的劃分符號為“(空字符串)”,位置信息的劃分符號為“/”。于是,單詞串信息DBld中的“I”是單詞“BR00K”的正式的發(fā)音信息的位置信息,該位置信息所表示的發(fā)音信息列表IOd的位置處,登記有“BR00K”的正式的發(fā)音信息即(("brUk)) 0
[0049]此外,例如單詞串“ ALDER BEND ”能利用自動生成一并獲得單詞“ ALDER”以及“BEND”的正式的發(fā)音信息,因此作為與書寫信息“ALDER BEND”成組的發(fā)音信息的位置信息不登記任何信息(即“(空字符串)/ (空字符串)”)。
[0050]此夕卜,例如,單詞串“HERVEY STREET”中,“HERVEY”能利用自動生成獲得正式的發(fā)音信息,但“STREET”不能獲得,因此僅登記書寫信息“STREET”的發(fā)音信息的位置信息。因此,單詞串信息DBld中作為位置信息登記有“(空字符串)/2”。于是,發(fā)音信息列表IOd中,在“2”的位置處登記了書寫信息“STREET”的正式的發(fā)音信息《” strit》。 另一方面,對于單詞串“QUAKER STREET”,無法自動生成“QUAKER”以及“STREET”的正式的發(fā)音信息,因此登記各自的發(fā)音信息的位置信息。其中,“STREET”的正式的發(fā)音信息《”strit》已經(jīng)登記在發(fā)音信息列表IOd的“2”的位置,因此單詞串信息DBld中作為位置信息登記有“3/2”。另一方面,發(fā)音信息列表IOd中,在“3”的位置處登記了書寫信息“QUAKER”的正式的發(fā)音信息《*” kwe I kirh
因此,對于像“STREET”這樣相同的書寫的正式的發(fā)音信息無需重復(fù)登記到發(fā)音信息列表IOd中,因此,能減少預(yù)先存儲發(fā)音信息列表IOd的單詞串信息DB存儲部I的容量。
另外,為了方便說明,適當?shù)丶僭O(shè)例示的各單詞是否能通過G2P轉(zhuǎn)換等來自動生成正式的發(fā)音信息,有可能與實際通過G2P轉(zhuǎn)換自動生成的發(fā)音信息不同。
[0051]另外,與上述實施方式I的圖1不同,本實施方式3所涉及的發(fā)音信息生成裝置中發(fā)音信息輸出部5能參照單詞串信息DB存儲部I的發(fā)音信息列表10d。
[0052]接著,使用圖11所示的流程圖,對利用單詞串信息DBld以及發(fā)音信息列表IOd的發(fā)音信息生成裝置的動作進行說明。另外,圖11所示的步驟ST31、ST32是與上述實施方式I的圖4中說明的步驟ST1、ST2相同的處理,因此省略說明。
當與檢索關(guān)鍵字一致的單詞串信息不存在于單詞串信息DB存儲部I所存儲的單詞串信息DBld中時(步驟ST32為“否”),結(jié)束一連串的發(fā)音信息生成處理。此時,例如發(fā)音信息輸出部5也可以將表示該單詞串未登記在單詞串信息DBld中這一情況進行外部輸出。
[0053]另一方面,當與檢索關(guān)鍵字一致的單詞串信息存在于單詞串信息DBld中時(步驟ST32為“是”),單詞串信息檢索部2從單詞串信息DBld取得包含與檢索關(guān)鍵字一致的書寫信息以及發(fā)音信息的位置信息的單詞串信息,并輸出至發(fā)音信息生成判定部3。
例如,在單詞串信息DB存儲部I存儲有圖10所示的單詞串信息DBld與發(fā)音信息列表IOd的情況下,若輸入輸入字符串“ALDER BR00K”,則單詞串信息檢索部2將該字符串用作書寫息的檢索關(guān)鍵字,從單詞串息DBld取得單詞串信息,該單詞串信息包含書寫信息"ALDER BR00K”、以及與書寫信息成組的發(fā)音信息的位置信息“(空字符串)/I”。
[0054]接下來,在步驟ST33?ST38中,對于構(gòu)成單詞串信息檢索部2所取得的單詞串的各個單詞,生成發(fā)音信息并進行外部輸出。
首先,在步驟ST33中,發(fā)音信息生成判定部3檢查關(guān)于構(gòu)成從單詞串信息檢索部2輸入的單詞串信息的所有單詞是否存在發(fā)音信息,在所有單詞的發(fā)音信息均存在的情況或者已完成生成的情況下(步驟ST33為“是”),判斷為不再需要生成發(fā)音信息,從而結(jié)束一連串的發(fā)音信息生成處理,若在上述以外的情況下(步驟ST33為“否”),則從單詞串的首個單詞開始按照順序來判定是否需要生成各個單詞的發(fā)音信息(步驟ST34)。具體而言,調(diào)查與作為處理對象的單詞的書寫信息相對應(yīng)的位置信息是否包含在單詞串信息中。
[0055]在與處理對象的單詞的書寫信息相對應(yīng)的位置信息未包含在單詞串信息中的情況下,發(fā)音信息生成判定部3判定為需要自動生成關(guān)于該單詞的發(fā)音信息(步驟ST34為“否”),并將該單詞的書寫信息輸出至發(fā)音信息生成部4。接著,在步驟ST35中,發(fā)音信息生成部4根據(jù)從發(fā)音信息生成判定部3輸入的書寫信息并利用G2P轉(zhuǎn)換等,生成發(fā)音信息并輸出至發(fā)音信息輸出部5。接著,在步驟ST365中,發(fā)音信息輸出部5對由發(fā)音信息生成部4自動生成的發(fā)音信息進行外部輸出。
在上述“ALDER BR00K”的示例的情況下,在步驟ST33?ST38的重復(fù)處理的第一次中,與首個單詞的書寫信息“ALDER”相對應(yīng)的發(fā)音信息的位置信息為“(空字符串)”,表示發(fā)音信息列表IOd中未登記正式的發(fā)音信息。因此,發(fā)音信息生成部4根據(jù)書寫信息“ALDER”自動生成與正式的發(fā)音信息相同的發(fā)音信息《*” Ol I dir)),發(fā)音信息輸出部5進行外部輸出。
[0056]另一方面,在與處理對象的單詞的書寫信息相對應(yīng)的位置信息包含在單詞串信息中的情況下,發(fā)音信息生成判定部3判定為無需自動生成關(guān)于該單詞的發(fā)音信息(步驟ST34為“是”),并將該單詞的發(fā)音信息的位置信息輸出至發(fā)音信息輸出部5。接著,在步驟ST37中,發(fā)音信息輸出部5基于從發(fā)音信息生成判定部3輸入的發(fā)音信息的位置信息,從單詞串信息DB存儲部I的發(fā)音信息列表IOd取得該位置處所登記的發(fā)音信息。于是,發(fā)音信息輸出部5在接下來的步驟ST38中,將從發(fā)音信息列表IOd取得的發(fā)音信息進行外部輸出。
在上述“ALDER BR00K”的示例的情況下,在步驟ST33?ST38的重復(fù)處理的第二次中,與從頭開始的第二個單詞的書寫信息“BR00K”相對應(yīng)的發(fā)音信息的位置信息為“1”,表示發(fā)音信息列表IOd的位置“I”中登記了正式的發(fā)音信息《”brUk》。因此,發(fā)音信息輸出部5從發(fā)音信息列表IOd取得發(fā)音信息《” brUk》,并進行外部輸出。
[0057]若到步驟ST36或者步驟ST38為止處理結(jié)束,則再次返回到步驟ST33,開始對單詞串信息中包含的下一個單詞進行處理。由此,發(fā)音信息生成裝置從與輸入字符串相應(yīng)的單詞串的首個單詞開始按順序?qū)Πl(fā)音信息進行外部輸出。
另外,也可以不以單詞單位來對發(fā)音信息進行外部輸出,而是以單詞串單位來進行外部輸出。在該情況下,發(fā)音信息輸出部5以輸入的順序來組合從發(fā)音信息生成判定部3輸入的單詞的發(fā)音信息與從發(fā)音信息生成部4輸入的單詞的發(fā)音信息,從而生成單詞串的發(fā)音信息即可。
[0058]此外,圖11的流程圖中,單詞串信息檢索部2從單詞串信息DBld取得書寫信息與發(fā)音信息的位置信息,并將該位置信息通知給發(fā)音信息輸出部5,發(fā)音信息輸出部5從發(fā)音信息列表IOd取得與該位置信息相對應(yīng)的發(fā)音信息,但并不限于此,也可以單詞串信息檢索部2從單詞串信息DBld取得書寫信息與發(fā)音信息的位置信息的同時,從發(fā)音信息列表IOd取得與該位置信息相對應(yīng)的發(fā)音信息,發(fā)音信息生成部4經(jīng)由發(fā)音信息生成判定部3從單詞串信息檢索部2獲取發(fā)音信息。
[0059]此外,單詞串信息DB存儲部I也可以存儲有圖12所示的單詞串信息DBle以及發(fā)音信息列表IOe以代替圖10所示的單詞串信息DBld以及發(fā)音信息列表10d。如圖12所示,發(fā)音信息列表IOe僅預(yù)先登記了各單詞串中重復(fù)出現(xiàn)的單詞(“STREET”等)的正式的發(fā)音信息。此外,單詞串信息DBle中登記了各單詞串中重復(fù)的單詞(“STREET”等)的書寫信息與成組的發(fā)音信息的位置信息(“ I ”等),直接登記不重復(fù)單詞(“BR00K”等)的書寫信息與成組的正式的發(fā)音信息(《”brUk》等),對于不重復(fù)的單詞且能利用G2P轉(zhuǎn)換等自動生成與正式的發(fā)音信息相同的發(fā)音信息的單詞(“ALDER”等)的書寫信息,不登記發(fā)音信息(即“(空字符串)”。
[0060]接著,對DB生成裝置的動作進行說明。本實施方式3所涉及的DB生成裝置的結(jié)構(gòu)除了單詞串信息DBla以外與圖5的DB生成裝置在圖上是大致相同的結(jié)構(gòu),因此,引用圖5進行說明。本實施方式3所涉及的DB生成裝置生成單詞串信息DBld以及發(fā)音信息列表IOd以代替單詞串信息DBla。 該DB生成裝置與上述實施方式I的圖6所示的流程圖為大致相同的動作。其中,上述實施方式I的DB生成裝置以單詞串單位來進行發(fā)音信息的生成以及登記到DB,但實施方式3的DB生成裝置以單詞單位來進行發(fā)音信息的生成以及登記到DB。此外,在圖6的步驟ST16中,單詞串信息登記部8對于無法自動生成正式的發(fā)音信息的單詞,將從輸入數(shù)據(jù)獲取的正式的發(fā)音信息登記到發(fā)音信息列表10d,并將該單詞的書寫信息與發(fā)音信息的位置信息登記到單詞串信息DBld。
另一方面,在生成圖12所示的單詞串信息DBle與發(fā)音信息列表IOe的情況下,在步驟ST16中、單詞串信息登記部8在發(fā)音信息列表IOe中登記發(fā)音信息時,確認是否已經(jīng)登記了相同的發(fā)音信息,若已登記,則在單詞串信息DBle中登記該發(fā)音信息的位置信息。若發(fā)音信息列表IOe中未登記相同的發(fā)音信息,貝U在發(fā)音信息列表IOe中登記該單詞的正式的發(fā)音信息,在單詞串信息DBle中登記書寫信息與位置信息。
[0061]如上所述,根據(jù)實施方式3,發(fā)音信息生成裝置的單詞串信息DB存儲部I包括發(fā)音信息列表IOd,該發(fā)音信息列表IOd對于根據(jù)書寫信息自動生成的發(fā)音信息與正式的發(fā)音信息不一致的單詞,登記有該單詞的正式的發(fā)音信息,單詞串信息DBld中一并登記了表示在發(fā)音信息列表IOd內(nèi)的該單詞的正式的發(fā)音信息的登記位置的位置信息以及書寫信息,由該位置信息代替正式的發(fā)音信息,單詞串信息檢索部2從單詞串信息DBld獲取與輸入字符串一致的書寫信息,發(fā)音信息生成判定部3判定與單詞串信息檢索部2所取得的書寫信息相對應(yīng)的位置信息是否登記在單詞串信息DBld中,發(fā)音信息生成部4根據(jù)發(fā)音信息生成判定部3的判定結(jié)果,根據(jù)未登記位置信息的書寫信息并利用G2P轉(zhuǎn)換等規(guī)定的方法生成發(fā)音信息,發(fā)音信息輸出部5根據(jù)發(fā)音信息生成判定部3的判定結(jié)果,在未登記與書寫信息相對應(yīng)的位置信息的情況下,輸出發(fā)音信息生成部4生成的發(fā)音信息,在登記了與書寫信息相對應(yīng)的位置信息的情況下,輸出發(fā)音信息列表IOd中的該位置信息所指位置中登記的正式的發(fā)音信息。因此,發(fā)音信息列表IOd不會多次重復(fù)登記相同的發(fā)音信息,從而能減少單詞串信息DB存儲部I存儲的信息量。
[0062]另外,在上述實施方式3中,DB生成裝置在單詞串信息DBlcUle中以單詞單位(“ALDER”等)登記書寫信息與發(fā)音信息的位置信息,但并不限于此,也可以以單詞串單位(“ALDER BR00K”等)登記書寫信息與發(fā)音信息的位置信息。在發(fā)音信息生成裝置中,單詞串信息DB存儲部I存儲了單詞串單位的單詞串信息DBlcUle情況下,單詞串信息檢索部2、發(fā)音信息生成判定部3、發(fā)音信息生成部4以及發(fā)音信息輸出部5以單詞串單位進行處理即可。
此外,圖示例中示出了由兩個單詞構(gòu)成的單詞串,也可以是由三個以上的單詞構(gòu)成的單詞串,或者可以不是單詞串而是單詞。
[0063]并且,在如單詞串“ALDER BROOK ROAD”以及“ALDER BROOK PARK”那樣可視作是單詞串“ALDER BR00K”與單詞“R0AD (或者PARK)”的組合情況下,能在單詞串信息DBld、Ie中混合登記單詞串與單詞。
在該情況下,輸入至DB生成裝置的輸入數(shù)據(jù)以及輸入至發(fā)音信息生成裝置的輸入字符串中預(yù)先定義有用于劃分單詞的劃分符號(例如“(空字符串)”)與表示劃分登記單位的劃分符號(例如“/”)。然后,在各裝置中根據(jù)劃分符號來使“ALDER BR00K/R0AD”等單詞串劃分為單詞串與單詞,并對各個進行處理即可。 另一方面,即使在輸入至DB生成裝置的輸入數(shù)據(jù)中能預(yù)先定義了多種劃分符號,也可能對于輸入至發(fā)音信息生成裝置的輸入字符串不能預(yù)先定義多種劃分符號。在該情況下,DB生成裝置根據(jù)如上所述的多種劃分符號來生成單詞串與單詞處于混合狀態(tài)的單詞串信息DBlcUle即可。另一方面,發(fā)音信息生成裝置中,單詞串信息檢索部2僅根據(jù)用于劃分單詞的劃分符號(例如“(空字符串)”),例如首先從單詞串信息DBlcUle中檢索“ALDER BROOKR0AD”,在未登記的情況下,接下來分為“ALDER BR00K”與“ROAD”來進行檢索。若它們也未登記,則還有如下方法:改變劃分位置,分為“ALDER”與“BROOK ROAD”來進行檢索等,對于一個單詞串利用多個劃分位置來劃分并進行檢索。
[0064]實施方式4.本實施方式4所涉及的DB生成裝置的結(jié)構(gòu)除了單詞串信息DBlc以外與圖7的DB生成裝置在圖上是大致相同的結(jié)構(gòu),因此,引用圖7進行說明。本實施方式4所涉及的DB生成裝置生成圖13所示的單詞串信息DBlf以及發(fā)音信息列表IOf以代替單詞串信息DBlc。
此外,本實施方式4所涉及的使用DB生成裝置所生成的單詞串信息DBlf以及發(fā)音信息列表IOf的發(fā)音信息生成裝置與圖1所示的發(fā)音信息生成裝置結(jié)構(gòu)相同,因此引用圖1。
[0065]在上述實施方式3中,在由發(fā)音信息生成部4自動生成的發(fā)音信息與正式的發(fā)音信息一致的情況下,單詞串信息DBld、Ie中未登記正式的發(fā)音信息,但在本實施方式4中,即使在兩者一致的情況下,若該單詞串的出現(xiàn)頻度在指定的閥值以上,則預(yù)先將正式的發(fā)音信息登記到單詞串信息DBlf。
[0066]圖13是表示本發(fā)明的實施方式4所涉及的DB生成裝置生成的單詞串信息DBlf以及發(fā)音信息列表IOf的一個不例的圖。
書寫信息“ALDER”能自動生成正式的發(fā)音信息,但出現(xiàn)頻度計算部9計算出的出現(xiàn)頻度在規(guī)定的閥值以上,因此,圖13所示的單詞串信息DBlf中登記有發(fā)音信息的位置信息“I”。并且,發(fā)音信息列表IOf的位置“I”中登記了正式的發(fā)音信息《*”01 |d@r》。
與此相對,在上述實施方式3中,圖10所示的單詞串信息DBld中未登記書寫信息“ALDER”的發(fā)音信息的位置信息。
關(guān)于其他的單詞,即使能自動生成發(fā)音信息,但由于出現(xiàn)頻度小于閥值,因此與圖10所示的單詞串信息DBld相同。其中,發(fā)音信息列表IOf的位置“I”中登記了《*”011 d@r》,因此之后的位置位移一位。
[0067]接著,對DB生成裝置的動作進行說明。另外,該DB生成裝置與上述實施方式2的圖9所示的流程圖為大致相同的動作。其中,上述實施方式2的DB生成裝置以單詞串單位來進行發(fā)音信息的生成以及登記到DB,但實施方式4的DB生成裝以單詞單位來進行發(fā)音信息的生成以及登記到DB。此外,在圖9的步驟ST25中,單詞串信息登記部Sc對于無法自動生成正式的發(fā)音信息的單詞或能自動生成正式的發(fā)音信息但出現(xiàn)頻度在閥值以上的單詞,將從輸入數(shù)據(jù)獲取的正式的發(fā)音信息登記到發(fā)音信息列表IOf,并將該單詞的書寫信息與發(fā)音信息的位置信息登記到單詞串信息DBlf。
[0068]如上所述,根據(jù)實施方式4,發(fā)音信息生成裝置的單詞串信息DB存儲部I包括發(fā)音信息列表IOf,該發(fā)音信息列表IOf對于根據(jù)書寫信息自動生成的發(fā)音信息與正式的發(fā)音信息不一致的單詞,登記有該單詞的正式的發(fā)音信息,單詞串信息DBlf在根據(jù)單詞的書寫信息自動生成的發(fā)音信息與該單詞的正式的發(fā)音信息不一致的情況下,一并登記了書寫信息以及表示在發(fā)音信息列表IOf內(nèi)的該單詞的正式的發(fā)音信息的登記位置的位置信息,在一致的情況下且當單詞串信息DBlf中該單詞的出現(xiàn)頻度在規(guī)定的閥值以上時,也一并登記書寫信息與位置信息,另一方面,在一致的情況下而當該單詞的出現(xiàn)頻度小于閥值時,僅登記書寫信息。因此,與上述實施方式3相同,發(fā)音信息列表IOf不會多次重復(fù)登記相同的發(fā)音信息,從而能減少單詞串信息DB存儲部I存儲的信息量。此外,與上述實施方式2相同,通過恰當?shù)卦O(shè)定出現(xiàn)頻度的閥值,能兼顧單詞串信息DB存儲部I存儲的信息量的減小以及發(fā)音信息生成處理時間的縮短。
[0069]另外,在上述實施方式4中,DB生成裝置在單詞串信息DBlf中以單詞單位(“ALDER “等)登記書寫信息與發(fā)音信息的位置信息,但并不限于此,也可以以單詞串單位(“ALDER BR00K”等)登記書寫信息與發(fā)音信息。然后,DB生成裝置的出現(xiàn)頻度計算部9以單詞單位來計算出現(xiàn)頻度,并單詞串信息取得部6、發(fā)音信息生成部4、發(fā)音信息比較部7以及單詞串信息登記部Sc以單詞串單位進行處理即可。并且,在發(fā)音信息生成裝置中,單詞串信息DB存儲部I中存儲了單詞串單位的單詞串信息DBlf情況下,單詞串信息檢索部2、發(fā)音信息生成判定部3、發(fā)音信息生成部4以及發(fā)音信息輸出部5以單詞串單位進行處理即可。
此外,圖示例中示出了由兩個單詞構(gòu)成的單詞串,也可以是由三個以上的單詞構(gòu)成的單詞串,或者可以不是單詞串而是單詞。
并且,對于像“ALDER BROOK ROAD”以及“ALDERB ROOK PARK”那樣單詞串與單詞混合的單詞串信息,與上述實施方式3所說明的情況相同地,可以將單詞串與單詞混合登記到單詞串信息DB If。
[0070]實施方式5.圖14是表示本發(fā)明的實施方式5所涉及的導(dǎo)航裝置的結(jié)構(gòu)的框圖。該導(dǎo)航裝置包括:發(fā)音信息生成裝置100,該發(fā)音信息生成裝置100生成聲音合成以及聲音識別中使用的發(fā)音信息;地圖DB101,該地圖DBlOl存儲有包含地名、道路名稱、設(shè)施名稱以及各個位置的地圖信息;導(dǎo)航控制部102,該導(dǎo)航控制部102利用地圖信息來進行路徑搜索以及路徑引導(dǎo)等;聲音合成部103,該聲音合成部103對進行路徑引導(dǎo)的聲音進行合成;輸出合成聲音的揚聲器104 ;對用戶發(fā)出的聲音進行集聲的麥克風(fēng)105 ;聲音識別部106,該聲音識別部106利用聲音識別詞典107進行目的地等的聲音識別;以及聲音識別詞典生成部108,該聲音識別詞典生成部108根據(jù)發(fā)音信息生成裝置100的發(fā)音信息生成聲音識別詞典107。
[0071]發(fā)音信息生成裝置100是上述實施方式I?4中說明的發(fā)音信息生成裝置。此處,以實施方式I所涉及的發(fā)音信息生成裝置為例來說明發(fā)音信息生成裝置100,并引用圖1。發(fā)音信息生成裝置100的單詞串信息DB存儲部I存儲了從地圖DBlOl中所存放的地名,設(shè)施名稱等單詞串或單詞生成的單詞串信息DB。
聲音識別詞典生成部108利用發(fā)音信息生成裝置100輸出的發(fā)音信息來生成聲音識別用的聲音識別詞典107。由于從發(fā)音信息生成聲音識別詞典的方法使用眾所周知的技術(shù)即可,因此此處省略說明。
[0072]在導(dǎo)航裝置中,例如在進行路徑搜索時,導(dǎo)航控制部102在檢索某個地點周邊的設(shè)施(當前所在地或者目的地周邊的設(shè)施等)時,從地圖DBlOl取得作為檢索對象的設(shè)施名稱,并輸出至發(fā)音信息生成裝置100。發(fā)音信息生成裝置100生成與所輸入的設(shè)施名稱的單詞串或單詞相對應(yīng)的發(fā)音信息,并輸出至聲音識別詞典生成部108。聲音識別詞典生成部108利用輸入的單詞串或者單詞生成聲音識別詞典107。
或者,導(dǎo)航控制部102在檢索某個城市中包含的道路名稱時,從地圖DBlOl取得作為檢索對象的道路名稱(通過所選擇的城市的道路名稱),并輸出至發(fā)音信息生成裝置100,與上述設(shè)施名稱相同,也能生成道路名稱的聲音識別詞典107。
[0073]接著,導(dǎo)航控制部102對作為檢索對象的設(shè)施名稱進行畫面顯示,令用戶說出表示所希望的目的地的設(shè)施名稱,并利用麥克風(fēng)105進行集聲,聲音識別部106使用聲音識別詞典107進行聲音識別,返回至導(dǎo)航控制部102。
接著,為了確認用戶說出的目的地是否被正確地聲音識別出,導(dǎo)航控制部102將從聲音識別部106輸入的表示目的地的聲音識別結(jié)果的字符串(或者對該字符串所設(shè)定的固有ID)輸出至聲音合成部103,聲音合成部103向發(fā)音信息生成裝置100輸出目的地的字符串(或者ID)。發(fā)音信息生成裝置100生成與目的地的單詞串或單詞相對應(yīng)的發(fā)音信息,并輸出至聲音合成部103。然后,聲音合成部103對與該發(fā)音信息相對應(yīng)的聲音信息進行合成,并從揚聲器104輸出。
[0074]此外,例如在進行路徑引導(dǎo)時,導(dǎo)航控制部102將引導(dǎo)中使用的地名、設(shè)施名稱、道路名稱等字符串(或者ID)輸出至聲音合成部103,聲音合成部103從發(fā)音信息生成裝置100取得與該字符串(或者ID)相對應(yīng)的發(fā)音信息,對聲音信息進行合成,并從揚聲器104輸出。
[0075]另外,發(fā)音信息生成裝置100除了圖14所示的導(dǎo)航裝置以外,例如也能適用于音頻裝置中。若是音頻裝置,則包括用于進行⑶等的重放的音頻控制部,以代替導(dǎo)航控制部102。
然后,例如在將媒體插入到音頻裝置中時,將目錄數(shù)據(jù)(例如曲名、藝術(shù)家名等)作為輸入字符串,發(fā)音信息生成裝置100與聲音識別詞典生成部108進行協(xié)作,生成藝術(shù)家名的聲音識別用、曲名的聲音識別用等聲音識別詞典107。
此外,例如用戶在進行某個檢索時,也能將檢索結(jié)果(例如以藝術(shù)家名作為檢索關(guān)鍵字所提取的專輯名稱)作為輸入字符串,來生成專輯名稱的聲音識別用的聲音識別詞典107。
接著,聲音識別部106對用戶說出的曲名、藝術(shù)家名、專輯名稱等進行聲音識別,音頻控制部根據(jù)該識別結(jié)果來重放樂曲,或聲音合成部103對該樂曲的曲目數(shù)據(jù)進行聲音合成并通知用戶。
并且,也可以是音頻一體型的導(dǎo)航裝置。此外,也可以包括執(zhí)行免提通話等電話用的功能。在該情況下,在電話與汽車音響本體(head unit)相連接時,從電話簿檢索用的詞典中提取出電話簿的各條目名稱(人名、飯店名稱等設(shè)施名稱),使用發(fā)音信息生成裝置100生成聲音識別詞典。于是,能對用戶發(fā)出的聲音進行聲音識別來確定撥打?qū)ο?,從而開始通話。
[0076]如上所述,上述實施方式I?4的任一種發(fā)音信息生成裝置能通過減小數(shù)據(jù)庫大小來實現(xiàn)小型化,因此適合用于要求小型化的車載導(dǎo)航裝置或者車載音頻裝置等車載信息裝置中。此外,在使用離線狀態(tài)下預(yù)先生成的聲音識別詞典時,存儲裝置的大小會變大,但在本實施方式5中利用發(fā)音信息生成裝置100以在線狀態(tài)生成聲音識別詞典,因此聲音識別詞典所使用的存儲裝置的大小減小。
另外,導(dǎo)航裝置并不限于車輛,也可以是包含人、鐵道、船舶、飛機等移動體用的導(dǎo)航裝置,例如為帶入車輛內(nèi)或者適用于車載的導(dǎo)航裝置。
[0077]此外,上述實施方式I?5中,以英語的單詞串為例進行說明,但并不限于此,當然也能適用于日語、中文、德語等任意語言。此外,發(fā)音信息的書寫方式并不限于圖示例,也可以使用國際首標(IPA)等。
[0078]除此以外,本發(fā)明申請在其發(fā)明范圍內(nèi)可以進行各實施方式的自由組合,對各實施方式的任意構(gòu)成要素進行變形,或者在各實施方式中省略任意構(gòu)成要素。
工業(yè)上的實用性
[0079]如上所述,本發(fā)明所涉及的發(fā)音信息生成裝置使用小容量的數(shù)據(jù)庫來生成正確的發(fā)音信息,因此適用于車載導(dǎo)航裝置以及車載音頻裝置等車載信息裝置中。
標號說明
I單詞串信息DB存儲部、
Ia?If單詞串信息DB (單詞串/單詞信息數(shù)據(jù)庫)、
2單詞串信息檢索部、
3發(fā)音信息生成判定部、
4發(fā)音信息生成部、
5發(fā)音信息輸出部、
6單詞串信息取得部、
7發(fā)音信息比較部、
8,8c單詞串信息登記部、
9出現(xiàn)頻度計算部、
IOd?IOf發(fā)音信息列表、
100發(fā)音信息生成裝置、
101 地圖DB、
102導(dǎo)航控制部、
103聲音合成部、
104揚聲器、
105麥克風(fēng)、
106聲音識別部、
107聲音識別詞典、
108聲音識別詞典生成部。
【權(quán)利要求】
1.一種發(fā)音信息生成裝置,其特征在于,包括: 單詞串/單詞信息數(shù)據(jù)庫,該單詞串/單詞信息數(shù)據(jù)庫在根據(jù)單詞串或者單詞的書寫信息自動生成的發(fā)音信息與該單詞串或者單詞的書寫所對應(yīng)的正式的發(fā)音信息不一致的情況下,一并登記所述書寫信息與所述正式的發(fā)音信息,在一致的情況下,登記所述書寫信息而不登記所述正式的發(fā)音信息; 單詞串信息檢索部,該單詞串信息檢索部從所述單詞串/單詞信息數(shù)據(jù)庫獲取與所輸入的單詞串或者單詞相應(yīng)的書寫信息; 發(fā)音信息生成判定部,該發(fā)音信息生成判定部判定與所述單詞串信息檢索部所取得的所述書寫信息相對應(yīng)的正式的發(fā)音信息是否已登記到所述單詞串/單詞信息數(shù)據(jù)庫中;發(fā)音信息生成部,該發(fā)音信息生成部根據(jù)所述發(fā)音信息生成判定部的判定結(jié)果,從未登記正式的發(fā)音信息的所述書寫信息來生成發(fā)音信息;以及 發(fā)音信息輸出部,該發(fā)音信息輸出部根據(jù)所述發(fā)音信息生成判定部的判定結(jié)果,在未登記與所述書寫信息對應(yīng)的正式的發(fā)音信息的情況下,輸出所述發(fā)音信息生成部生成的所述發(fā)音信息,在登記了正式的發(fā)音信息的情況下,輸出所述單詞串/單詞信息數(shù)據(jù)庫中所登記的該正式的發(fā)音信息。
2.如權(quán)利要求1所述的發(fā)音信息生成裝置,其特征在于, 在根據(jù)單詞串或者單詞的書寫信息自動生成的發(fā)音信息與該單詞串或者單詞的正式的發(fā)音信息不一致的情況下,在單詞串/單詞信息數(shù)據(jù)庫中一并登記所述書寫信息與所述正式的發(fā)音信息,在一致的情況下且當所述單詞串/單詞信息數(shù)據(jù)庫中該單詞串或者單詞的出現(xiàn)頻度在規(guī)定的閥值以上時,也在單詞串/單詞信息數(shù)據(jù)庫中一并登記所述書寫信息與所述正式的發(fā)音信息,在一致的情況下且當所述出現(xiàn)頻度小于規(guī)定的閥值時,在單詞串/單詞信息數(shù)據(jù)庫中登記所述書寫信息而不登記所述正式的發(fā)音信息。
3.如權(quán)利要求1所述的發(fā)音信息生成裝置,其特征在于, 包括發(fā)音信息列表,該發(fā)音信息列表對于根據(jù)書寫信息自動生成的發(fā)音信息與正式的發(fā)音信息不一致的單詞串或者單詞,登記該正式的發(fā)音信息, 在單詞串/單詞信息數(shù)據(jù)庫中一并登記了表示所述發(fā)音信息列表內(nèi)的所述正式的發(fā)音信息的登記位置的位置信息以及所述書寫信息,以表示所述發(fā)音信息列表內(nèi)的所述正式的發(fā)音信息的登記位置的位置信息來代替所述正式的發(fā)音信息, 發(fā)音信息生成判定部判定與單詞串信息檢索部所取得的書寫信息相對應(yīng)的位置信息是否登記在所述單詞串/單詞信息數(shù)據(jù)庫中, 所述發(fā)音信息生成部根據(jù)所述發(fā)音信息生成判定部的判定結(jié)果,從未登記位置信息的所述書寫信息生成發(fā)音信息, 發(fā)音信息輸出部根據(jù)所述發(fā)音信息生成判定部的判定結(jié)果,在未登記與所述書寫信息相對應(yīng)的位置信息的情況下,輸出所述發(fā)音信息生成部所生成的發(fā)音信息,在登記了所述位置信息的情況下,輸出登記在所述發(fā)音信息列表中的該位置信息所指位置的正式的發(fā)音信息。
4.如權(quán)利要求3所述的發(fā)音信息生成裝置,其特征在于, 在根據(jù)單詞串或者單詞的書寫信息自動生成的發(fā)音信息與該單詞串或者單詞的正式的發(fā)音信息不一致的情況下,在單詞串/單詞信息數(shù)據(jù)庫中一并登記所述書寫信息與表示發(fā)音信息列表內(nèi)的所述正式的發(fā)音信息的登記位置的位置信息,在一致的情況下且當所述單詞串/單詞信息數(shù)據(jù)庫中該單詞串或者單詞的出現(xiàn)頻度在規(guī)定的閥值以上時,也在單詞串/單詞信息數(shù)據(jù)庫中一并登記所述書寫信息與所述位置信息,在一致的情況下且當所述出現(xiàn)頻度小于規(guī)定的閥值時,登記所述書寫信息而不登記所述正式的發(fā)音信息。
5.一種車載信息裝置,其特征在于,包括: 權(quán)利要求1所述的發(fā)音信息生成裝置;以及 具有聲音合成部與聲音識別部中的至少一個, 該聲音合成部利用所述發(fā)音信息生成裝置生成進行聲音輸出的單詞串或者單詞的發(fā)音信息,并將該生成的發(fā)音信息轉(zhuǎn)換為合成聲音, 該聲音識別部將聲音識別對象即單詞串或者單詞作為輸入字符串,基于利用所述發(fā)音信息生成裝置生成的發(fā)音信息,生成聲音識別詞典,利用該聲音識別詞典,對輸入的聲音信息進行聲音識別。
6.一種數(shù)據(jù)庫生成方法,其特征在于,包括: 發(fā)音信息生成步驟,該發(fā)音信息生成步驟中,基于包含單詞串或者單詞的書寫信息以及與該單詞串或者單詞的書寫相對應(yīng)的正式的發(fā)音信息的輸入數(shù)據(jù),從書寫信息來生成發(fā)音信息; 發(fā)音信息比較步驟,該發(fā)音信息比較步驟中,將所述發(fā)音信息生成步驟中所生成的發(fā)音信息與所述輸入數(shù)據(jù)中包含的所述正式的發(fā)音信息進行比較;以及 單詞串信息登記步驟,該單詞串信息登記步驟中,根據(jù)所述發(fā)音信息比較步驟的比較結(jié)果,在所述發(fā)音信息生成步驟中所生成的發(fā)音信息與所述正式的發(fā)音信息不一致的情況下,一并將所述書寫信息與所述正式的發(fā)音信息登記至數(shù)據(jù)庫,在一致的情況下,將所述書寫信息登記至所述數(shù)據(jù)庫,而不登記所述正式的發(fā)音信息。
【文檔編號】G10L13/08GK103635961SQ201180071596
【公開日】2014年3月12日 申請日期:2011年6月14日 優(yōu)先權(quán)日:2011年6月14日
【發(fā)明者】山崎道弘 申請人:三菱電機株式會社