專利名稱:裝備有話音用戶接口的電子設(shè)備以及在電子設(shè)備中用于執(zhí)行用戶接口的語言配置的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種電子設(shè)備,它包括-一個話音用戶接口和一個用于控制所述設(shè)備功能的可能的終端用戶接口,-用于實現(xiàn)所述話音用戶接口的語音識別設(shè)備,以及-存儲器,其中語言配置數(shù)據(jù)被安排用于所述用戶接口,其包括若干個語言包,在語言包中若干種語言被分組,其中至少一些語言可以屬于若干個語言包并且這些語言包中的至少一個被選擇供所述用戶接口使用。
另外,本發(fā)明還涉及一種在電子設(shè)備中用于執(zhí)行用戶接口的語言配置的方法,以及一種在根據(jù)本發(fā)明的電子設(shè)備中被執(zhí)行的計算機(jī)程序。
最近開發(fā)了很多與揚聲器無關(guān)的話音用戶接口(VUI)用于各種電子設(shè)備。這種用戶接口需要用若干種語言的語言配置。現(xiàn)在,一些生產(chǎn)商的與揚聲器無關(guān)的語音識別系統(tǒng)支持多達(dá)數(shù)十種語言。
由于所述設(shè)備有限的存儲性質(zhì)和語音識別系統(tǒng)有限的處理能力,不能將全部語言包括在一個單一的包中,它們必須被分到更小的語言包中。如果太多種語言被安排在單一的數(shù)據(jù)包中,則這將降低語音識別的準(zhǔn)確性。另外,聲學(xué)語音模型的“訓(xùn)練”隨后能夠被優(yōu)化用于幾種語言區(qū)域,這將例如在不同方言的識別中帶來優(yōu)點。每個語言包可以包括幾種語言,其數(shù)量可以是,例如,4-10種語言。例如,根據(jù)地理劃分區(qū)域,語言可以被安排到語言包中。因此,必須為所述設(shè)備的用戶接口,例如為話音用戶接口,單獨選擇要使用的語言包,該語言包隨后例如在語音識別中被使用。
例如,具有特殊地理區(qū)域特性的語言可以被安排到單獨的語言包中。除這些語言外,所述語言包可以包括一些廣泛分布并且通常被使用的世界語言(例如,英語、葡萄牙語、西班牙語、德語、俄語、意大利語),由于一些原因,可能希望它們被包括在若干個語言包中。根據(jù)這種劃分,每種被支持的語言被包括在至少一個語言包中,同時一些語言被包括在若干個語言包中。這樣,并且通常在這種應(yīng)用中,一種語言的方言也可以被理解為一種語言。
由于目前多語言系統(tǒng)仍十分稀少,因此在現(xiàn)有技術(shù)中僅已知實現(xiàn)語言包選擇的十分粗略的方法。其中,用戶每次必須自己決定并且手動地從設(shè)備的用戶接口中選擇要被使用的語言包。然而,這存在如下弱點允許選擇錯誤的語言包,這將導(dǎo)致不良性能的語音識別。另外,如果所述設(shè)備根本未被通知語音語言,則所述語音識別操作將更差。
目前由用戶完成的語言包選擇易出差錯。一個例子是,在一種情況中,例如,俄語用戶希望使用例如德語作為VUI語言(即,他們希望通過說這種語言來控制所述設(shè)備),并且希望使用俄語作為用戶接口語言(即,例如,在所述設(shè)備的圖形用戶接口GUI中,這種語言被使用)。因為德語是一種全球語言,它被安排在幾種語言包中,并且用戶將具有若干個從中選擇一個語言包的備選對象,這本身便可能在所述設(shè)備的可用性中導(dǎo)致不希望的不便。
不理解語言包的通常相當(dāng)隱含的意義以及它們的內(nèi)容的用戶可能例如從中央歐洲語言包中選擇德語來供語音識別使用。這種選擇將阻止用戶選擇例如他們所希望的俄語作為用戶接口語言,因為出于適當(dāng)性的原因,在中央歐洲語言包中被認(rèn)為沒有必要包括俄語。這種情況可能徹底使用戶迷惑并且使他們不能重新選擇語言包。通常,聽任這種情況出現(xiàn)是對用戶特別不友好的。
而且,在若干個不同的區(qū)域中說的世界語言的發(fā)音可能有很大的區(qū)域性的差別。例如,斯拉夫人英語發(fā)音不同于英語是其母語的人的英語發(fā)音。例如在瑞士人/奧地利人說的德語和德國人說的德語之間也存在類似的典型的差別。這也可能導(dǎo)致選擇錯誤的語言包,以及后來的語音識別和進(jìn)而話音用戶接口的‘有缺陷的’操作。
現(xiàn)有技術(shù)的一種情況在美國專利5,917,484中被揭示,其中,在一種電子設(shè)備,特別是在計算機(jī)中,要被使用的語言被選擇。然而,這種解決方法決未應(yīng)對其中上面被描述的問題相當(dāng)大的話音用戶接口或它們中所使用的語音識別功能性。而且,在WO公開出版2004/019207A1(諾基亞公司)中,描述了涉及特別用于語言設(shè)置的編輯的用戶接口語言設(shè)立的現(xiàn)有技術(shù)。其中,未討論任何關(guān)于涉及話音用戶接口的語言包選擇問題。
本發(fā)明旨在創(chuàng)立一種具有更發(fā)達(dá)的用戶接口語言裝置的新型電子設(shè)備和一種在電子設(shè)備中用于執(zhí)行用戶接口的語言配置的方法。根據(jù)本發(fā)明的設(shè)備的特有特征在所附的權(quán)利要求1中被陳述,并且根據(jù)本發(fā)明的方法的特有特征在權(quán)利要求9中被陳述。另外,本發(fā)明還涉及一種在根據(jù)本發(fā)明的設(shè)備中要被執(zhí)行的計算機(jī)程序,其特有的特征在所附的權(quán)利要求16中被陳述。
本發(fā)明特別涉及話音用戶接口和在語音識別中要被使用的語言包的選擇,以及在電子設(shè)備中語言配置數(shù)據(jù)的安排。
根據(jù)本發(fā)明的設(shè)備和方法的特征在于決定語言包選擇的設(shè)備登記語言信息。所述語言信息包括關(guān)于用于至少一個用戶接口的至少第一語言的信息。在這種語言的基礎(chǔ)上,所述設(shè)備可以根據(jù)第一種實施方案選擇語言包。為了執(zhí)行所述選擇,關(guān)于包括在語言包中的語言的信息被安排在所述設(shè)備中。
在本發(fā)明中,被希望在用戶接口中使用的語言包現(xiàn)在例如根據(jù)從所述用戶已登記的語言信息通過所述設(shè)備的操作被選擇。那樣,可以有一種被安排在所述設(shè)備中的數(shù)據(jù)結(jié)構(gòu),它包括這個語言包信息。根據(jù)由所述用戶提供的語言信息,所述設(shè)備能夠在每種選擇-備選對象情況中選擇最適當(dāng)?shù)恼Z言包供所述設(shè)備使用,所述設(shè)備根據(jù)一種規(guī)定的標(biāo)準(zhǔn)被鏈接到這種語言信息。
根據(jù)一個實施方案,語言包可以根據(jù)涉及甚至一種單一語言的信息被選擇。根據(jù)第二個實施方案,如果所述語言包選擇不能充分明確地被執(zhí)行,則關(guān)于第二種語言的信息可以另外被使用。那樣,所述語言包可以根據(jù)這些語言,以設(shè)定的方式被選擇。
根據(jù)一個實施方案,可以為每種語言定義一種本國語言包,它被選擇用作某種特定的選擇情況中的默認(rèn)值。在這種情況下,不管用戶的語言選擇如何,總是得到最適合的語言包供使用。
根據(jù)一個實施方案,在所述設(shè)備中被登記的語言信息可以包括例如用戶說的并且他們希望在話音用戶接口中使用的語言的信息。例如,如果打算在所述設(shè)備用戶接口中被使用的語言不同于用戶的語音語言選擇,則所述語言包可能不一定被明確地選擇。這種情況的第二個例子是,其中想要供話音用戶接口使用的語言被安排在若干個語言包中,這樣,語言包的選擇也不一定是明確的。在本發(fā)明中,通過所述設(shè)備、例如根據(jù)從用戶接收的語言信息自動地選擇語言包來解決這個問題。
借助于本發(fā)明,得到的優(yōu)點是,用戶不必自己選擇難以理解的適當(dāng)?shù)恼Z言包,使得可能選擇錯誤的語言包。在根據(jù)本發(fā)明的情況中,如果用戶以被選擇的順序說明所說的語言和所述用戶接口的語言,則語言包可以被明確和自動地選擇,其中甚至不必在每一種情況中都說明第二種語言。
根據(jù)一個實施方案,一個語言選擇組合查找表可以被安排在所述設(shè)備的存儲器中,它顯示全部或者至少大多數(shù)涉及用戶接口語言的選擇備選對象的語言選擇組合,或者另一方面,只顯示可能的語言選擇組合。可以被選擇供使用的語言包被附加到每一個組合?,F(xiàn)在,除了最佳語言包適合被選擇外,在不必就用戶的選擇來打擾或干擾他/她的情況下,全部最離奇和全部不合邏輯的選擇甚至也都能夠明確地被實現(xiàn)。
根據(jù)本發(fā)明的設(shè)備和方法的其它特有特征根據(jù)所附的權(quán)利要求將變得顯而易見,并且獲得的額外優(yōu)點在說明部分被逐條列舉。
下面,根據(jù)本發(fā)明的電子設(shè)備和相關(guān)的方法被參考附圖來更詳細(xì)地檢驗,其并不受限于下面描述的實施方案,在附圖中
圖1顯示一個根據(jù)本發(fā)明的電子設(shè)備的一個例子的粗略的框圖,圖2顯示被安排在每個語言包中的語言的一個實施方案,圖3a顯示一個語言列表的例子,其中,每種語言只在一個語言包中,圖3b顯示一個語言列表的例子,其中,每種語言在若干個語言包中,圖3c顯示語言在若干個語言包中的本國語言包列表的例子,圖3d顯示作為部分列表供選擇語言包使用的查找表的一個實施方案,圖3e顯示作為一個用于確定特定實例的列表,供選擇語言包使用的查找表的一個實施方案,以及圖4顯示一個在選擇語言包中根據(jù)本發(fā)明的方法的一個實施方案的流程圖。
圖1顯示一個根據(jù)本發(fā)明的電子設(shè)備10的一個例子的粗略框圖,并且在下面被描述為一個在移動站情況下的實施例。應(yīng)當(dāng)指出,可以應(yīng)用本發(fā)明的電子設(shè)備種類必須被理解成特別廣的范圍。所述設(shè)備的其它一些例子通常包括便攜式和手提式設(shè)備,諸如PDA(個人數(shù)字助理)類型設(shè)備(例如,Palm,Vizor)、掌上電腦、靈巧電話機(jī)、多媒體設(shè)備、照相機(jī)設(shè)備、游戲控制臺、電話、以及指令機(jī)。另外,本發(fā)明還可以被應(yīng)用于例如,視頻/DVD設(shè)備、衛(wèi)星/數(shù)字盒調(diào)諧器、電視機(jī)、傳真設(shè)備、復(fù)印機(jī)、計算機(jī)、自動販賣機(jī)、以及其它類似的電子設(shè)備。然而,根據(jù)本發(fā)明的設(shè)備主要具有共同的特征,即,它們包括話音用戶接口VUI,并且更特別地,這種話音用戶接口通過使用語音識別功能SR被實現(xiàn)。
圖1中所示的移動站10可以是一種已知的類型,它的諸如發(fā)射機(jī)/接收機(jī)TR的與本發(fā)明不相關(guān)的部件,在本文中不需要被進(jìn)一步解釋。
設(shè)備10的功能可以使用處理器單元DSP/CPU 13被控制,處理器單元DSP/CPU 13被用于控制例如在設(shè)備10的顯示器部件19上舉例而言用圖形用戶接口GUI被顯示的信息。處理器單元13的操作可以使用控制設(shè)備14被控制,控制設(shè)備14例如可以作為小鍵盤15或各種開關(guān)被實現(xiàn)。例如,通過使用在設(shè)備10的顯示器19上被顯示的圖形用戶接口GUI和/或,另一方面,還通過使用話音用戶接口VUI,設(shè)備10的功能可以通過終端用戶接口TUI被控制。除允許設(shè)備10的控制外,用戶接口VUI/GUI還可以提供關(guān)于設(shè)備10的當(dāng)前狀態(tài)的信息。
移動站10可以包括,比如用戶接口,一個話音用戶接口VUI和一個圖形用戶接口GUI,通常一個或若干個用戶接口UI。這些可以被并行或單獨使用來控制設(shè)備10的功能。
為了實現(xiàn)話音用戶接口VUI,設(shè)備10可以包括語音識別設(shè)備SR和音頻輸入/輸出接口12,它可以包括麥克風(fēng)設(shè)備MIC和揚聲器設(shè)備SPKR。能夠以一種已知方式被實現(xiàn)的語音識別SR需要語言配置數(shù)據(jù)LP1-LP9以便起作用。語言配置數(shù)據(jù)以一種規(guī)定的方式被安排在設(shè)備10的存儲設(shè)備MEM中。
圖2顯示一個語言包劃分的示意的例子。若干個語言包LP1-LP9可以在設(shè)備10的存儲器MEM中根據(jù)語言配置數(shù)據(jù)被構(gòu)成。可以被選擇供用戶接口VUI/GUI使用的語言L1-L34中的一種或幾種,例如4-10種語言以一種被選擇的方式被分組在語言包LP1-LP9中。可用的語言L1-L34的每一種屬于語言包LP1-LP9中的至少一個。在正被討論的實施方案的情況下,表3a顯示只在一個語言包LP1-LP9中的語言列表的一個例子。另外,語言L6、L7、L11、L13、L16、L29中的至少一些可以屬于語言包LP1-LP9中的若干個,例如至少兩個。在正被討論的實施方案的情況下,表3b顯示屬于若干個語言包LP1-LP9的這些語言列表的例子。
參考圖2、3d、和3e,用于確定語言包LP1-LP9的語言劃分的一個標(biāo)準(zhǔn)是每個地理區(qū)域或甚至是國家的語言特征,根據(jù)該特征,語言包LP1-LP9也可以被劃分。語言L1-L34中的一些可以在若干個語言包LP1-LP9中,這例如是歸因于它們的全世界定位。在本實施方案中,這些語言的例子是,英國英語=L6、德語=L7、俄語=L11、法語=L13、意大利語=L6、以及美國英語=L29。語言包LP1-LP9中的至少一個可以被選擇供設(shè)備10的用戶接口VUI/GUI使用,特別是在實現(xiàn)話音用戶接口VUI的語音識別SR中使用。
在每種語言L1-L34的情況中,屬于語言包LP1-LP9的語言特定的數(shù)據(jù)可以包括例如以正被討論的語言L1-L34的可能命令,用于控制設(shè)備10的功能。另一方面,例如,在世界語言L6、L7、L11、L13、L16、L29的情況中,語言數(shù)據(jù)還可以包括用于語音識別引擎SR的、關(guān)于在每個地理區(qū)域中正被討論的語言L6、L7、L11、L13、L16、L29的語音類型/重音(方言特定的特征)的重要信息,或者甚至是以正被討論的方言的、用于設(shè)備10的命令。這樣的一個例子是包中歐LP4,其中使用對于奧地利/瑞士德語優(yōu)化的語言配置來代替德國本國德語是可能的。然而,通常,所述語言數(shù)據(jù)可以被理解為包括支持語言L1-L34的語音模型。另外,一種多語言系統(tǒng)也可以包括用于基于文本的語言識別的模型數(shù)據(jù)。
例如,通過軟件實現(xiàn)的登記功能17可以被安排在圖1所示的根據(jù)本發(fā)明的設(shè)備10中,根據(jù)一個實施方案,它可以向用戶請求關(guān)于想要在設(shè)備10中使用的語言包LP1-LP9的語言信息,并且特別用于選擇用戶接口語言VUIL/UIL。所述語言信息可以包括有關(guān)用于至少一個用戶接口的至少一種語言的信息。根據(jù)這個被登記的語言信息,設(shè)備10能夠最簡單地選擇要被使用的語言包。
如果根據(jù)第一種語言信息,設(shè)備10不能明確地執(zhí)行所述選擇,則例如,通過另外向用戶請求用于第二個用戶接口的第二種語言,設(shè)備10可以被登記。例如,如果用戶選擇的第一種語言L6屬于若干個,例如,至少兩個語言包LP1-LP7,則需要兩個問題的這種情況會出現(xiàn)。根據(jù)登記的第一種和第二種語言L6、L11,設(shè)備10按照被鏈接到每個語言選擇備選對象并且與設(shè)備10有關(guān)地被安排的語言包能夠明確地執(zhí)行語言包的選擇。根據(jù)一個實施方案,第一種語言可以是一種話音用戶接口語言VUIL,即,一種語音語言,而第二種語言可以是一種用戶接口語言UIL。相反的選擇順序也是可能的。
例如,選擇功能17的軟件實現(xiàn)可以例如以這樣的方式被創(chuàng)立,即使用設(shè)備10的處理器13來以預(yù)定義的順序執(zhí)行一組預(yù)置命令。例如,功能17可以作為一種操作系統(tǒng)級可更新的計算機(jī)程序被存儲在設(shè)備10的存儲器MEM中。
圖2顯示在設(shè)備10的存儲器MEM中被安排的語言包LP1-LP9的一個實施方案。其中,每個語言包LP1-LP9中已經(jīng)被分組給屬于它的語言L1-L34。在這種情況下,以一種被選擇的方式通過語言被組織的若干個語言包LP1-LP9被存儲在設(shè)備10的存儲器MEM中,根據(jù)一個實施方案,在從用戶獲得的語言信息的基礎(chǔ)上,設(shè)備10從語言包LP1-LP9中自動地選擇最適當(dāng)?shù)恼Z言包。實際上,由于例如設(shè)備10和語音識別SR的有限的處理和工作存儲器WMEM的容量,所以在任何一個時間只有一個語言包LP1能夠在使用中。
除上述外,如果被希望在話音用戶接口VUI中并且隨后還在每個語音識別SR中被使用的語言L6屬于若干個語言包LP1-LP9,例如是所謂的‘世界語言’L6、L7、L11、L13、L16、L29之一,則這種情況將使要在設(shè)備10中使用的語言包LP1的選擇復(fù)雜化,特別是在該選擇由用戶進(jìn)行的情況下。在那種情況下,用戶可以無意識地從這樣一個語言包中選擇他們希望在話音用戶接口VUI中使用的話音語言VUIL,即該語言包具有的語言模型與他們所說的語言模型并不對應(yīng)。
有問題的情況的第二個例子可以是這樣的,其中用戶從一個語言包LP2中選擇他們希望在話音用戶接口VUI中使用的話音語言VUIL,而從另一個語言包LP1選擇他們希望在圖形用戶接口GUI中使用的UI語言。由于上述原因,這種選擇實際上不能被實現(xiàn),所述情況對于設(shè)備10而言是難以處理的,更不用說它可能給用戶造成的混亂。
圖3d和3e部分地顯示了一個用于從語言包LP1-LP9的查找表18中選擇語言包LPx的實施方案,該語言包LP1-LP9被安排在設(shè)備10存儲器MEM中。根據(jù)用戶提供給設(shè)備10的語言信息(VUIL、UIL),可以從查找表18中選擇適當(dāng)?shù)恼Z言包LPx供使用。在查找表18中可以利用程序17操作。
通常,有關(guān)屬于每個語言包LP1-LP9的語言L1-L34的信息被安排在查找表18中。特別地,查找表18可以根據(jù)想要的方式被分組,例如,根據(jù)全部或者至少大部分可能的話音語言/UI-語言VUIL/UIL組合(a-g)和可能的(不明確的)特例(圖3e),以及在每個組合(a-g,特例)的情況中要被選擇的語言包LP1-LP9組,查找表18可以被分組。必須理解,圖3d沒有顯示完整的查找表,該查找表從g部分繼續(xù),至少包括全部可能的語言選擇組合。
為每種語言L1-L34設(shè)置一個所謂的本國語言包也是可能的,在從用戶被接收的‘離奇的’語言組合的情況中,如果被選擇的用戶接口語言VUIL/UIL沒有意義,或者如果對于設(shè)備10來說選擇一個適當(dāng)?shù)恼Z言包是完全不可能的,則設(shè)備10將選擇所述本國語言作為默認(rèn)值。一個本國語言包也可以被設(shè)置成被選擇用于在若干個語言包LP1-LP9中出現(xiàn)的語言L6、L7、L11、L13、L16、L29,所述本國語言包可以例如根據(jù)語言L6、L7、L11、L13、L16、L29的歸屬區(qū)域/國家被定義。表3c顯示一個被設(shè)置用于這些‘世界語言’的本國默認(rèn)語言包列表的例子。
圖3e顯示部分查找表18的一個例子,如果話音語言VUIL和用戶接口語言UIL都屬于若干個語言包LP1-LP9、該語言包中的至少一些包對于兩種語言是共同的,則所述查找表可以被應(yīng)用。為了分配這種情況,可以用一種被選擇的方式來設(shè)置被選擇用于每對語言的語言包組。用于特例的選擇方式并不是至關(guān)緊要的,它甚至也不必能夠被鏈接到任何特殊的準(zhǔn)則,相反,它可以例如根據(jù)應(yīng)用開發(fā)者的決定來被定義。
根據(jù)一個實施方案,可以使備選的語言對的順序這樣,使得最可能的選擇備選對象在查找表18的上部,而最不可能的選擇備選對象在下部。不過,根據(jù)一個實施方案,查找表18可以根據(jù)全部或至少大部分語言選擇對VUIL/UIL被安排,這允許在每個語言選擇實例中為用戶選擇最適當(dāng)?shù)恼Z言包。
圖4顯示在設(shè)備10中根據(jù)本發(fā)明的語言包選擇方法的一個實施方案。設(shè)備10本身,或者可替代地,用戶可以激活語言包選擇過程17(階段400)。例如,設(shè)備10第一次被使用時,激活可以是自發(fā)的。如果用戶因為某些原因希望改變他們使用的語音語言VUIL,則他們可以表示需要改變所述語言包。在那種情況下,如果可以從目前在設(shè)備10中現(xiàn)用的語言包LP1中發(fā)現(xiàn)新的語音語言VUIL,則不必執(zhí)行語言包選擇過程17。另一方面,如果在當(dāng)前的語言包LP1中未發(fā)現(xiàn)新的語音語言VUIL,則所述語言包選擇功能必須被激活,以便例如至少為了語音識別而選擇一個新的語言包LPx(x=1-9)并且從中選擇一種新的語言Lx(x=1-34)。
在所描述的實施方案中,一旦所述選擇過程17已經(jīng)被啟動,則設(shè)備10例如在它的顯示部件19上顯示可以被選擇的全部語言備選對象L1-L34的列表(階段401)。所述選擇過程可以從用于話音用戶接口VUI(VUIL),或者另一方面用于用戶接口GUI(UIL)的語言Lx的選擇開始。通常來說,例如,通過為至少一個用戶接口VUI、UI向用戶請求第一種語言L1/L6,設(shè)備10可以登記。
在這個實施方案中,用戶給設(shè)備10提供關(guān)于想要的第一種語言,即,現(xiàn)在的話音用戶接口語言,即,語音語言VUIL的信息。設(shè)備10登記用戶的語言選擇(階段402),并且軟件功能17調(diào)查是否可以在一個以上的語言包LP1-LP9中發(fā)現(xiàn)被用戶選擇的VUI-語言VUIL(階段403)。語言包LP1-LP9可以用文件的形式被安排在所述設(shè)備的存儲器MEM中,它們中的每一個具有它自己的ID標(biāo)識符。所述語言包還可以包括關(guān)于包LP1-LP9已經(jīng)被設(shè)置來表示的區(qū)域/國家的信息。設(shè)備10從被安排在它的存儲器MEM中的查找表18或者根據(jù)圖3a、3b的表格中執(zhí)行搜索操作。為了執(zhí)行所述搜索操作,包括關(guān)于一個或若干個語言包LP1-LP9的數(shù)據(jù)的語言-語言包信息以上面被描述的方式被安排在設(shè)備10中,每種語言L1-L34被安排屬于該一個或者若干個語言包。
如果不能從一個以上的語言包中發(fā)現(xiàn)由用戶選擇或輸入的VUIL-語言,則由用戶進(jìn)行的語言選擇是明確的。如果所述語言是一種所謂的較少被說的語言,則這種情況可能出現(xiàn)。在這個基礎(chǔ)上,設(shè)備10選擇對應(yīng)于被用戶選擇的VUI-語言VUIL的語言包LP1并且把它裝載到設(shè)備10的工作存儲器WMEM中,且激活它以便在語音識別SR中被使用(階段404.1和405.1)。同時,正被討論的語言包LP1可以被設(shè)置在設(shè)備10永久的配置中,在這種情況下,每當(dāng)設(shè)備10后來被啟動時,就不必總是再次執(zhí)行語言包LP1的選擇。每次設(shè)備被接通和話音用戶接口VUI被激活時,所述語音識別功能SR裝載關(guān)于希望被使用的語言包LP1的信息,并且更特別地,裝載關(guān)于語言L1的信息。
另一方面,如果在階段403被設(shè)備10執(zhí)行的查找表/列表分析顯示可以在若干個語言包LP1-LP9中發(fā)現(xiàn)用戶陳述的VUI-語言VUIL,則語言包LP1-LP9的選擇不再明確。如前面被描述的,在若干個語言包中被安排的廣泛被說的語言L6、L7、L11、L13、L16、L29的實例中出現(xiàn)這種情況。除了上面涉及的語言L6、L7、L11、L13、L16、L29外,還包括具有它們的各種方言的西班牙語和葡萄牙語,這些語言的例子決不是限制性的。設(shè)備10現(xiàn)在需要UI-語言信息,以便決定語言包的選擇。
在這種情況下,階段403后可以跟隨要被顯示給用戶的第二種語言備選對象的第二個列表之后,用于第二個用戶接口GUI(階段404.2)。這第二個列表,例如可以是有限的,但也可以是完整的。在所述有限的列表中,只有第二個語言備選對象可以被顯示,它和第一種被選擇的語言L6一起出現(xiàn)在相同的語言包LP1中。如果所述列表以完整的形式被顯示,則在非合作用戶的情況中(在這種情況中不適當(dāng)?shù)恼Z言選擇也是可能的),本國語言包信息(圖3c)和查找表18的特殊情況部分(圖3e)被應(yīng)用。
設(shè)備10登記被用戶從所述列表執(zhí)行的語言選擇L1(階段405.2)。下一步,根據(jù)第一個和第二個,即,現(xiàn)在由用戶進(jìn)行的VUI和UI-語言選擇L6、L1,設(shè)備10從被安排在它的存儲器MEM內(nèi)的查找表18(圖3)中選擇要在設(shè)備10中被使用并且特別在話音用戶接口VUI的語音識別SR中被使用的語言包LP1。
如果被選擇的語言VUIL和UIL沒有一個單獨共同的語言包,則所述選擇可以根據(jù)被鏈接到所述被選擇的話音語言VUIL的本國語言包被執(zhí)行。如果由用戶進(jìn)行的第二個,在這種情況下是后一語言選擇L1只在一個語言包LP1中出現(xiàn),則要被使用的語言包的選擇是明確的。設(shè)備10隨后選擇使用其中出現(xiàn)此第二種語言L1的語言包LP1。如果VUIL語言和UIL語言是相同的并且只在一個共同的語言包中出現(xiàn),則所述語言包根據(jù)本國語言包鏈接被選擇。然而,如果兩種語言選擇L6、L7在相同語言包LP1-LP9中的若干個,即,現(xiàn)在在至少兩個語言包中出現(xiàn),則設(shè)備10根據(jù)在查找表18中定義的特殊情況(圖3e)選擇語言包LP1。在那種情況下,根據(jù)查找表18,語言包LP3(北歐)應(yīng)該被選擇。而且,如果在階段404.2中存在全部語言而沒有排除根據(jù)第一種語言VUIL被執(zhí)行,并且第二種語言UIL沒有和第一種語言VUIL一樣的單一的語言包,則所述語言包根據(jù)語音語言VUIL被選擇。因此,還是在這種情況中,根據(jù)所述語言選擇,提供了最適當(dāng)?shù)恼Z言包。
過程從階段406.2移動到VUI-語言的激活(階段405.1),并且以上面描述的方式行動是可能的。
階段405.1和406.2后面都可以跟隨有UI-語言的可能激活,它根據(jù)上面描述的語言包選擇階段(階段407.2)被執(zhí)行,在這之后,所述選擇過程可以被終止(階段500)。
上面描述了在話音語言VUIL首先被登記,之后跟隨用戶接口語言UIL被登記的情況中語言包LP1-LP9的選擇。相反的登記順序也是可能的。在那種情況下,當(dāng)UI-語言UIL在階段403只從一個語言包中被發(fā)現(xiàn)時,階段404.1被執(zhí)行,并且之后是一個未被描述的子階段,用于從被UI-語言UIL定義的明確的語言包中選擇VUIL語言。
相對地,如果UI-語言在階段403從若干個語言包中被發(fā)現(xiàn),則階段404.2-406.2以相應(yīng)的順序被執(zhí)行以便選擇VUI-語言VUIL。因此,所討論的語言UIL、VUIL的順序的變化實際上對于增加所述選擇過程的復(fù)雜性沒有影響。
根據(jù)由用戶提供的用戶接口語言信息的選擇,還得到的優(yōu)點是不僅最適當(dāng)?shù)恼Z言包LP1被使用,而且額外的確定性被給予語音識別SR的操作。這是因為考慮了在正被討論的地理上的或者甚至國家區(qū)域中出現(xiàn)的語言的典型方言。當(dāng)努力為所述用戶接口完成最自然的操作時,例如,在執(zhí)行不同配置選擇的情況中,希望在用戶和設(shè)備10之間的交互被最小化,這一特性也通過使用本發(fā)明來獲得。
上面,根據(jù)一個單獨的實施方案描述了本發(fā)明。應(yīng)當(dāng)指出,本領(lǐng)域普通技術(shù)人員可以改變上面描述的軟件過程,并且可以用與上面描述的方案不同的方式執(zhí)行所述過程。另外,增加例如幫助功能和錯誤狀態(tài)處理的各種附加階段也是可能的。
必須理解,上述的說明和有關(guān)的附圖僅僅是為了說明本發(fā)明。因此,本發(fā)明決不被在權(quán)利要求中揭示或陳述的實施方案限制,并且在所附權(quán)利要求中被定義的本發(fā)明的思想范圍內(nèi),本發(fā)明很多不同的變化和適配是可能的,這些對于本領(lǐng)域普通技術(shù)人員將是顯而易見的。
權(quán)利要求
1.一種電子設(shè)備(10),它包括-用于控制設(shè)備(10)的功能的話音用戶接口(VUI)和可能的終端用戶接口(TUI),-用于實現(xiàn)話音用戶接口(VUI)的語音識別設(shè)備(SR),以及-存儲器(MEM),其中,語言配置數(shù)據(jù)被安排用于用戶接口(VUI、UI),其包括若干個語言包(LP1-LP9),若干種語言(L1-L34)被分組到所述包(LP1-LP9)中,這些語言(L1-L34)中的至少一些可以屬于若干個語言包(LP1-LP9),并且語言包(LP1-LP9)中的至少一個(LP1)被選擇以便供用戶接口(VUI、UI)使用,其特征在于,該設(shè)備(10)被安排為至少一個用戶接口(VUI,UI)登記至少第一種語言(L1/L6),根據(jù)所述語言信息(L1/L6),該設(shè)備(10)被安排執(zhí)行語言包(LP1/LP2)的選擇,并且為了執(zhí)行所述選擇,有關(guān)屬于每個語言包(LP1-LP9)的語言(L1-L34)的信息(18)被安排在設(shè)備(10)中。
2.根據(jù)權(quán)利要求1中所述的設(shè)備(10),其特征在于,如果被選擇的第一種語言(L6)屬于至少兩個語言包(LP1-LP9),則設(shè)備(10)被安排另外為第二個用戶接口(UI/VUI)登記第二種語言(L11),根據(jù)第一種和第二種語言信息(L6,L11),所述設(shè)備被安排來選擇語言包(LP2)。
3.根據(jù)權(quán)利要求1或2中所述的設(shè)備(10),其特征在于,為每種語言(L1-L34)設(shè)置本國語言包。
4.根據(jù)權(quán)利要求1-3中任何一個所述的設(shè)備(10),其特征在于,所述第一種語言(L1/L6)是話音用戶接口語言(VUIL)。
5.根據(jù)權(quán)利要求1-4中任何一中所述的設(shè)備(10),其特征在于,所述第二種語言(L11)是用戶接口語言(UIL)。
6.根據(jù)權(quán)利要求1-5中任何一個所述的設(shè)備(10),其特征在于,被安排在設(shè)備(10)的存儲器(MEM)中的有關(guān)屬于每個語言包(LP1-LP9)的語言(L1-L34)的信息被安排構(gòu)成查找表(18),安排從查找表(18)中執(zhí)行語言包(LP3)的選擇。
7.根據(jù)權(quán)利要求6中所述的設(shè)備(10),其特征在于,話音用戶接口語言/用戶接口語言組合(VUIL-UIL)被安排在查找表(18)中,適合于選擇的語言包(LP1-LP9)被鏈接到所述組合(VUIL-UIL)中的每一個。
8.根據(jù)權(quán)利要求1-7中任何一個所述的設(shè)備(10),其特征在于,所述設(shè)備(10)是一個移動站。
9.一種用于在電子設(shè)備(10)中執(zhí)行用戶接口語言配置(VUIL/UIL)的方法,在所述設(shè)備中,用戶接口可以是例如一個話音用戶接口(VUI),以及例如一個終端用戶接口(TUI),并且在所述設(shè)備(10)中,語音識別(SR)被用于實現(xiàn)話音用戶接口(VUI),語音識別(SR)利用一個語言包(LP3),在設(shè)備(10)中可以有若干個語言包,并且語言包(LP1-LP9)中的每一個擁有若干種語言(L1-L34),該語言(L1-L34)中的一些可以屬于若干個語言包(LP1-LP9),并且可以從所述語言包(LP1-LP9)中選擇一個供用戶接口(VUI,TUI)使用,其特征在于,在所述方法中-語言信息(L1/L6/L11)被登記在設(shè)備(10)中(401-402,404.2-405.2)并且-設(shè)備(10)根據(jù)所述語言信息(L1/L6/L11)選擇要被激活的語言包(LP1/LP2)來使用(403,404.1,406.2)。
10.根據(jù)權(quán)利要求9中所述的方法,其特征在于,在所述方法中-至少一個第一種語言(L1/L6)被登記作為設(shè)備(10)中的語言信息用于一個用戶接口(VUI,UI)(401-402)并且-如果所述第一種語言(L1)屬于一單個語言包(LP1),則設(shè)備(10)根據(jù)第一種語言(L1)選擇語言包(LP1)(403,404.1)。
11.根據(jù)權(quán)利要求10中所述的方法,其特征在于,如果被選擇的第一種語言(L6)屬于若干個語言包(LP1-LP9),則另外在所述方法中-在所述設(shè)備(10)中第二種語言(L11)被登記用于第二個用戶接口(UI,VUI)(404.2,405.2)并且-設(shè)備(10)根據(jù)第一種和第二種語言(L6,L11)選擇語言包(LP2)(406.2)。
12.根據(jù)權(quán)利要求9-11中任何一個所述的方法,其特征在于,為每種語言(L1-L34)設(shè)置本國語言包。
13.根據(jù)權(quán)利要求9-12中任何一個所述的方法,其特征在于,語言-語言包信息被安排在設(shè)備(10)中構(gòu)成查找表(18),從該查找表中執(zhí)行語言包(LP1-LP3)選擇。
14.根據(jù)權(quán)利要求9-13中任何一個所述的方法,其特征在于,所述第一種語言(L1/L6)是話音用戶接口語言(VUIL)。
15.根據(jù)權(quán)利要求9-14中任何一個所述的方法,其特征在于,所述第二種語言(L11)是用戶接口語言(UIL)。
16.用于在根據(jù)權(quán)利要求1-8中任何一個的電子設(shè)備(10)中執(zhí)行用戶接口語言配置(LP1,LP2)的計算機(jī)程序(17),其特征在于,所述程序(17)被安排來-登記關(guān)于打算在設(shè)備(10)中被使用的其中至少一種語言(VUIL)的至少第一種語言信息(L1,L6)(402),并且-根據(jù)所述被登記的語言信息(L1),從被安排在設(shè)備(10)中的語言包信息(18)中選擇要在設(shè)備(10)中使用的語言包(LP1)(404.1)。
17.根據(jù)權(quán)利要求16中所述的計算機(jī)程序(17),其特征在于,所述程序(17)被安排來-調(diào)查鏈接到第一種語言信息(L6)的語言包(LP1-LP9)的數(shù)量,以此為基礎(chǔ),程序(17)被安排另外登記第二種語言(UIL)的語言信息(L11)(403,405.2),并且-根據(jù)所述第一種和第二種語言信息(L6,L11),從被安排在設(shè)備(10)內(nèi)的所述語言-語言包信息(18)中選擇要在設(shè)備(10)中被使用的語言包(LP2)(406.2)。
18.根據(jù)權(quán)利要求16或17中所述的計算機(jī)程序(17),其特征在于,語言-語言包信息被安排在設(shè)備(10)中作為查找表(18),安排利用計算機(jī)程序(17)執(zhí)行從所述查找表中對語言包(LP1,LP3)的選擇。
全文摘要
本發(fā)明涉及一種電子設(shè)備(10),它包括-一個話音用戶接口(VUI),-用于實現(xiàn)所述話音用戶接口(VUI)的語音識別設(shè)備(SR),以及-存儲器(MEM),其中,語言配置數(shù)據(jù)被安排用于用戶接口(VUI、UI),包括若干個語言包(LP1-LP9),在所述包(LP1-LP9)中,幾種語言(L1-L34)被分組,這些語言(L1-L34)中的至少一些可以屬于若干個語言包(LP1-LP9),并且安排至少一個語言包(LP1)被選擇用于用戶接口(VUI、UI)中。在本發(fā)明中,語言包(LP1-LP9)由設(shè)備(10)選擇。
文檔編號H04M1/00GK1894687SQ200480037990
公開日2007年1月10日 申請日期2004年12月9日 優(yōu)先權(quán)日2003年12月19日
發(fā)明者J·伊索-西皮萊, O·維基 申請人:諾基亞有限公司