两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于顯示語音識別結(jié)果的方法和設(shè)備的制作方法

文檔序號:2821463閱讀:191來源:國知局
專利名稱:用于顯示語音識別結(jié)果的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明通常涉及語音識別,更具體地說,本發(fā)明涉及一種關(guān)聯(lián)語音識別結(jié)果的置信度數(shù)值的圖形化表示。
背景技術(shù)
隨著語音識別能力的發(fā)展,語音識別應(yīng)用軟件和用途的數(shù)量也有了相應(yīng)的增長。根據(jù)語音識別的用戶位置,不同類型的語音識別應(yīng)用軟件和系統(tǒng)已得到開發(fā)。一個這樣的示例就是本地或嵌入式的語音識別引擎,例如SpeechToGo語音識別引擎,它是由位于695 AtlanticAvenue,Boston,Massachusetts,02111的Speech Works International,Inc.銷售的。另一種類型的語音識別引擎是基于網(wǎng)絡(luò)的語音識別引擎,例如Speech Works 6,它是由位于695 Atlantic Avenue,Boston,Massachusetts,02111的Speech Works International,Inc.銷售的。
嵌入式或本地語音識別引擎為識別此語音輸入提供了額外的優(yōu)勢,其中語音輸入中包括了任何類型的可聽得到或基于音頻的輸入信號。嵌入式語音或本地語音識別引擎的一個缺點(diǎn)是這些引擎只能包含有限的詞匯表。由于存儲容量限制和系統(tǒng)處理的要求,再加上能量消耗的限制,嵌入式或本地語音識別引擎僅僅能夠識別基于網(wǎng)絡(luò)的語音識別引擎可以識別的音頻輸入信號的一小部分。
在減少存儲和處理限制條件的基礎(chǔ)上,基于網(wǎng)絡(luò)的語音識別引擎為容量更多的詞匯表提供了額外的優(yōu)勢。然而也存在一個不利方面,就是在用戶提供語音輸入時(shí)和對語音輸入進(jìn)行識別并返回給用戶確認(rèn)時(shí)之間存在額外的等待時(shí)間。在典型的語音識別系統(tǒng)中,用戶提供音頻輸入信號,音頻輸入信號經(jīng)由通信路徑提供給服務(wù)器,然后進(jìn)行識別。在另一個實(shí)施例中,音頻輸入信號也可以提供給嵌入式語音識別引擎。
當(dāng)識別結(jié)果包括大量的識別項(xiàng),并且其中每個識別項(xiàng)都具有預(yù)設(shè)門限范圍內(nèi)的關(guān)聯(lián)置信度值時(shí),問題就出現(xiàn)了。為用戶提供落在預(yù)設(shè)門限范圍內(nèi)的識別項(xiàng)列表是非常重要的,這樣用戶就可以選擇合適的識別項(xiàng)。而且,在只有有限顯示數(shù)量的設(shè)備中,需要一種有效的方法來顯示識別結(jié)果及其關(guān)聯(lián)的置信度值,從而為用戶提供自動和直接的語音識別反饋。盡管存在某些系統(tǒng)為了在有限的顯示空間內(nèi)顯示識別置信度值而為終端用戶提供產(chǎn)生的N-最優(yōu)列表(N-best list),但是沒有系統(tǒng)會提供表示關(guān)聯(lián)置信度等級的非字母數(shù)字的符號。例如,典型的語音識別結(jié)果列表可能包括按數(shù)字排序的項(xiàng)列表,但是不會提供不同項(xiàng)置信度等級之間差異的指示。為終端用戶提供帶有識別結(jié)果的關(guān)聯(lián)表示的識別結(jié)果列表是有好處的,這樣用戶就可以更好地理解語音識別引擎的關(guān)聯(lián)性能。此外,在顯示空間非常有限的顯示區(qū)域中,提供語音識別列表和關(guān)聯(lián)置信度值以及關(guān)聯(lián)列表中每個項(xiàng)之間差異的可視指示,這是非常困難的。


參考下列附圖,本發(fā)明將更易于理解圖1示出了顯示語音識別結(jié)果的設(shè)備的一個示例。
圖2示出了語音識別N-最優(yōu)列表和關(guān)聯(lián)置信度等級的一個示例。
圖3示出了帶有置信度等級和關(guān)聯(lián)Δ值的N-最優(yōu)語音識別列表的另一個示例。
圖4示出了顯示語音識別結(jié)果的設(shè)備的另一個示例。
圖5示出了顯示語音識別結(jié)果的方法的一個示例。
圖6示出了顯示語音識別結(jié)果的設(shè)備的另一個示例。
圖7示出了顯示語音識別結(jié)果的方法的另一個示例。
圖8示出了N-最優(yōu)語音識別結(jié)果列表的非字母數(shù)字表示的一個示例。
圖9示出了N-最優(yōu)語音識別結(jié)果列表的非字母數(shù)字表示的另一個示例。
圖10示出了N-最優(yōu)語音識別結(jié)果列表的非字母數(shù)字表示的另一個示例。
圖11示出了N-最優(yōu)語音識別結(jié)果列表的非字母數(shù)字表示的另一個示例。
圖12示出了帶有有限顯示屏幕來顯示語音識別結(jié)果的一種便攜式設(shè)備。
具體實(shí)施例方式
簡而言之,用于顯示語音識別結(jié)果的方法和設(shè)備包括一個識別過濾器,它能夠接收包括大量語音識別項(xiàng)的識別結(jié)果列表。每個語音識別項(xiàng)都具有特定的識別置信度值,這樣識別過濾器會產(chǎn)生修正的識別結(jié)果列表,其中包括具有特定的識別關(guān)聯(lián)置信度值的語音識別項(xiàng)中的至少一個。
用于顯示語音識別結(jié)果的方法和設(shè)備還包括與識別過濾器相關(guān)的顯示發(fā)生器。顯示發(fā)生器接收修正的識別結(jié)果列表,并產(chǎn)生圖形化的識別結(jié)果列表。圖形化的識別結(jié)果列表包括語音識別項(xiàng)中的一個或多個,對于每一個語音識別項(xiàng)都有一個特定的識別置信度值的圖形化表示。特定項(xiàng)的識別置信度值的圖形化表示是一個非字母數(shù)字的符號。這種設(shè)備和方法還包括顯示識別項(xiàng)和特定項(xiàng)置信度值的圖形化表示。
圖1示出了便攜式設(shè)備100,它包括識別過濾器102和顯示發(fā)生器104。識別過濾器102包括在硬件或軟件方面易于組合的所有設(shè)備,它可以接收識別結(jié)果列表106并產(chǎn)生修正的識別結(jié)果列表108。顯示發(fā)生器104接收修正的識別結(jié)果列表108并產(chǎn)生圖形化的識別結(jié)果列表110。便攜式設(shè)備100包括能夠接收音頻輸入(未示出)并接收識別結(jié)果列表106的所有設(shè)備,例如能夠與服務(wù)器或其他通信網(wǎng)絡(luò)進(jìn)行通信的無線或有線設(shè)備,包括但不僅限于蜂窩式電話、筆記本電腦、臺式電腦、尋呼機(jī)、智能電話、個人數(shù)字助理或其他能夠進(jìn)行或接收語音識別的便攜式設(shè)備。
識別過濾器102可能包含最小置信度門限值和最大置信度門限值,由此對識別結(jié)果列表106進(jìn)行過濾,從而去除不在置信度門限值內(nèi)的所有語音識別項(xiàng)。在另一個實(shí)施例中,如果存在至少一個或多個識別項(xiàng)的置信度值高于最大置信度門限值,識別過濾器還可能丟棄識別值低于特定置信度值的所有項(xiàng)。而且,在另一個實(shí)施例中,如果不存在任何語音識別項(xiàng)的識別置信度等級高于最小門限置信度值,識別過濾器102還可能產(chǎn)生誤差消息。應(yīng)該注意,在一個實(shí)施例中,識別置信度門限值可以由終端用戶來決定。
顯示發(fā)生器104在接收到修正的識別結(jié)果列表時(shí),會產(chǎn)生非字母數(shù)字的符號作為每個特定項(xiàng)識別置信度值的圖形化表示。由此,圖形化的識別結(jié)果列表110包括語音識別項(xiàng)和關(guān)聯(lián)的圖形化表示。在一個實(shí)施例中,可向包括在便攜式設(shè)備100內(nèi)的顯示器(未示出)提供圖形化識別結(jié)果列表110。
為了說明的目的,圖2示出了語音識別引擎提供的識別結(jié)果列表。識別結(jié)果列表120包括項(xiàng)列表122和置信度值列表124。識別結(jié)果列表106通常是對提供給語音識別引擎的語音輸入的響應(yīng)。使用示例項(xiàng)122,識別結(jié)果列表會包括具有置信度值“68”128的項(xiàng)“New York”126,具有置信度值“64”132的項(xiàng)“Newark”130,具有置信度值“62”136的項(xiàng)“Newtown”134,具有置信度值“52”140的項(xiàng)“New London”138,具有置信度值“44”144的項(xiàng)“New Castle”142,具有置信度值“36”148的項(xiàng)“New Haven”146,具有置信度值“30”152的項(xiàng)“Nevada”150。在一個實(shí)施例中,這個識別結(jié)果列表106中會被提供給圖1中的識別過濾器102。
圖3用表格的形式示出了基于識別結(jié)果列表106的修正的識別結(jié)果列表108。修正的識別結(jié)果列表108包括項(xiàng)160、Δ值162和置信度值164。僅為了示例的目的,假定識別過濾器102包括最大置信度門限值70%和最小置信度門限值50%,因此項(xiàng)“New York”126、“Newark”130、“Newtown”134、“New London”138是唯一在修正的識別結(jié)果列表108中的項(xiàng)。而且,關(guān)聯(lián)的置信度值128、132、136和144分別也都在修正的識別結(jié)果列表108中。此外還包括指示關(guān)聯(lián)項(xiàng)置信度值之間差異的Δ值162,例如Δ值為4表示具有置信度值“64%”132的項(xiàng)“Newark”130與具有置信度值“68%”128的項(xiàng)“NewYork”126之間的置信度值差異為4個百分點(diǎn)。
圖4示出了的系統(tǒng)170帶有便攜式設(shè)備100,它帶有音頻輸入設(shè)備174,例如麥克風(fēng)或其他所有能夠接收音頻輸入176的設(shè)備。音頻輸入176通常是由終端用戶提供的口頭命令,但也可能是由音頻輸入設(shè)備174提供的任何類型的可聽得見的輸入。便攜式設(shè)備100還包括嵌入式語音識別引擎178。便攜式設(shè)備100還包括識別過濾器102和顯示發(fā)生器104。
識別過濾器102與存儲器180和處理器182相連接,顯示發(fā)生器104與顯示設(shè)備184相連接。處理器182可能但不僅限于是一個處理器、多個處理器、DSP、微處理器、ASIC、狀態(tài)機(jī)、或是其他所有能夠處理并執(zhí)行軟件或離散邏輯的實(shí)現(xiàn)方式,或是其他所有硬件、軟件和/或固件的適當(dāng)組合。項(xiàng)處理器不應(yīng)被解釋為專指能夠執(zhí)行軟件的硬件,而可能暗中包括DSP硬件、用來存儲軟件的ROM、RAM和其他所有易失或非易失性的存儲媒介。存儲器180可能但不僅限于是單獨(dú)的存儲器、多個存儲單元、共享的存儲器、CD、DVD、ROM、RAM、EEPROM、光學(xué)存儲器或其他所有能夠存儲數(shù)字?jǐn)?shù)據(jù)給處理器182使用的非易失存儲器。正如本領(lǐng)域普通技術(shù)人員所能認(rèn)識到的,顯示設(shè)備184可以是用于音頻輸出的揚(yáng)聲器、用于視頻輸出的顯示器或監(jiān)視器、或其他所有提供輸出的適當(dāng)接口。
音頻輸入設(shè)備174可以為嵌入式語音識別引擎178提供編碼后的音頻輸入184A,然后產(chǎn)生識別結(jié)果列表106A。在另一個實(shí)施例中,如果便攜式設(shè)備100是能夠經(jīng)由通信網(wǎng)絡(luò)186進(jìn)行通信的有線或無線設(shè)備,音頻輸入設(shè)備174就可以向通信網(wǎng)絡(luò)提供編碼后的音頻輸入184B,這樣通信網(wǎng)絡(luò)就可以向外部的語音識別引擎190提供語音輸入188。外部語音識別引擎190或基于網(wǎng)絡(luò)的語音識別引擎可能是SpeechWorks 6,它是由位于695 Atlantic Avenue,Boston,Massachusetts,02111的Speech Works International,Inc.銷售的。通信網(wǎng)絡(luò)186可以是無線區(qū)域網(wǎng)絡(luò)、無線局域網(wǎng)、蜂窩式通信網(wǎng)絡(luò)、或者其他所有提供便攜式設(shè)備100和外部語音識別引擎190之間通信的適當(dāng)網(wǎng)絡(luò)。因此,通信網(wǎng)絡(luò)186可以為識別過濾器102提供基于網(wǎng)絡(luò)的識別結(jié)果列表106B。
在前面討論過的一個實(shí)施例中,識別過濾器102會產(chǎn)生修正的識別結(jié)果列表108以提供給顯示發(fā)生器104,這樣就可以向顯示發(fā)生器104提供圖形化的識別結(jié)果列表110。
識別過濾器102可以從存儲器180接收過濾器信息192,或從處理器182接收信息194。在一個實(shí)施例中,識別過濾器102可以直接從存儲器180中恢復(fù)過濾器信息192,在另一個實(shí)施例中,處理器182可以執(zhí)行由存儲器180提供的可執(zhí)行指令196,作為那些可執(zhí)行指令的響應(yīng),它可以向識別過濾器102提供過濾器信息194。在一個實(shí)施例中,過濾器信息可能包括最大置信度門限值和最小置信度門限值,這樣考慮到這些門限值而產(chǎn)生識別結(jié)果列表104。過濾器信息192或194還可能包括能夠用于每個語音識別項(xiàng)的加權(quán)指示,由此調(diào)整特定項(xiàng)的識別置信度值。
顯示發(fā)生器104還可以從處理器182接收優(yōu)選信號198,或從存儲器180接收優(yōu)選信號200,這與識別過濾器接收過濾器信息192和194的情形相同。優(yōu)選信號198或200包括用來指示圖形化識別結(jié)果列表110的圖形化表示的信息。分布在顯示發(fā)生器104中的圖形化表示可以是帶有不同顏色的多個線條、具有不同寬度的多個線條、其間具有不同間隔的多個線條、或者其間具有至少一線條指示的幾何元素,諸如下面參考圖8-10所討論的。
圖5示出了顯示語音識別結(jié)果方法的一個實(shí)施例步驟的流程圖,此方法通過接收包括至少一個語音識別項(xiàng)的識別結(jié)果列表而開始于步驟210,步驟212中,至少一個語音識別項(xiàng)中的每一個都具有特定項(xiàng)的置信度值。如參考圖1所說明的,識別結(jié)果列表106有大量的識別項(xiàng)122,每個都帶有特定項(xiàng)的置信度值124。此方法的下個步驟214會產(chǎn)生圖形化表示,它表示了至少一個識別項(xiàng)和至少一個識別項(xiàng)中每一個的特定項(xiàng)的置信度值,這樣圖形化表示就會包括至少一個非字母數(shù)字的符號,它指示了至少一個特定項(xiàng)的置信度值中的每一個。
在另一個實(shí)施例中,產(chǎn)生了修正的識別結(jié)果列表108,而由顯示發(fā)生器104產(chǎn)生的至少一個識別項(xiàng)的圖形化表示是基于修正的識別結(jié)果列表108的,如前面參考圖1所討論的。下個步驟216包括了顯示至少一個識別項(xiàng)和特定項(xiàng)的置信度值的圖形化表示。然后,在步驟218中完成此方法。
按照一個實(shí)施例,圖6示出了帶有最大門限過濾器230、最小門限過濾器232、由應(yīng)用決定的加權(quán)施加器234、Δ計(jì)算器236和Δ加權(quán)施加器238的識別過濾器102。最大門限過濾器230接收分別來自存儲器180或處理器182的信號192或194內(nèi)的識別結(jié)果列表106和最大置信度門限值。最大門限過濾器230對輸入的識別結(jié)果列表106進(jìn)行過濾以確定是否存在置信度值高于最大門限值的識別項(xiàng)。最大門限過濾器230接著會產(chǎn)生最大過濾列表240以提供給最小門限過濾器232或由應(yīng)用決定的加權(quán)施加器234。在一個實(shí)施例中,如果最大門限過濾器230確定有一個或多個識別項(xiàng)高于最大置信度門限值,所有其他項(xiàng)將被丟棄,因此最大門限識別列表不需要由最小門限過濾器232進(jìn)行過濾。在另一個實(shí)施例中,最小門限過濾器232會消除掉來自存儲器180或處理器194的置信度值低于最小置信度門限值的所有識別項(xiàng)。
因此,將過濾后的列表242提供給由應(yīng)用決定的加權(quán)施加器234,作為對來自于存儲器180或處理器194的加權(quán)命令的響應(yīng),將加權(quán)因子施加用于識別結(jié)果列表中的項(xiàng)。例如,如果處理器182在執(zhí)行涉及到機(jī)場的應(yīng)用程序,由應(yīng)用決定的加權(quán)施加器234可以向所有項(xiàng)提供更進(jìn)一步的加權(quán)因子,比如帶有機(jī)場的特定城市的名稱。
因此,將加權(quán)后的列表244提供給Δ計(jì)算器236,它可以根據(jù)不同項(xiàng)之間的置信度等級差異計(jì)算出Δ值,如圖3中所示,項(xiàng)160的Δ值162是基于置信度值164的。Δ計(jì)算的列表246被提供給Δ加權(quán)施加器238,在一個實(shí)施例中,它還可以提供特定項(xiàng)的加權(quán),這是根據(jù)指示特定值之間差異的Δ因子確定的。例如,Δ加權(quán)因子可以為Δ值高于特定門限值的所有項(xiàng)提供特定的加權(quán),這就說明后面最鄰近的識別項(xiàng)間存在特定的置信度差異。此處,Δ加權(quán)施加器238會產(chǎn)生修正的識別結(jié)果列表108以提供給顯示發(fā)生器104,如上面參考圖1和4所討論的那樣。在一個實(shí)施例中,顯示發(fā)生器104因此會產(chǎn)生圖形化的識別結(jié)果列表110,并作為優(yōu)選信號198和/或200的響應(yīng)。
圖7示出了顯示語音識別結(jié)果方法的步驟的另一個示例。此方法通過接收包括至少一個語音識別項(xiàng)的識別結(jié)果列表而開始于步驟250,步驟252中,至少一個語音識別項(xiàng)中的每一個都具有特定項(xiàng)的置信度值。下個步驟254包括將至少一個語音識別項(xiàng)中每一個的特定項(xiàng)的置信度值與最小門限值進(jìn)行比較,并將至少一個語音識別項(xiàng)中其特定項(xiàng)的置信度值低于最小門限值的所有項(xiàng)丟棄。
接下來,在步驟256中,將至少一個語音識別項(xiàng)中每一個的特定項(xiàng)的置信度值與最大門限值進(jìn)行比較,并將至少一個語音識別項(xiàng)中其特定項(xiàng)的置信度值高于最大門限值的所有項(xiàng)丟棄。在步驟258中,會產(chǎn)生至少一個語音識別項(xiàng)的圖形化表示和至少一個語音識別項(xiàng)中每一個的特定項(xiàng)的置信度值,這樣圖形化表示中會包括至少一個非字母數(shù)字的符號以說明至少一個特定項(xiàng)中每一個的置信度值。這樣,通過顯示出至少一個識別項(xiàng)和特定項(xiàng)的置信度值的圖形化表示,此方法在步驟260中得到結(jié)論。因此,在步驟262中完成此方法。
圖8示出了多個識別項(xiàng)和每個特定項(xiàng)的置信度值的圖形化表示的顯示270。第一個項(xiàng)“New York”272包括一個具有特定長度的實(shí)心長方條,它比其他項(xiàng)的長方條的長度要長,因此如圖3中所示出的那樣,項(xiàng)“New York”具有最高的置信度值128。項(xiàng)“Newark”276顯示為稍短的長方條278,它用圖形化的方式表明了其置信度值低于項(xiàng)“New York”272的。如圖3中所示出的,項(xiàng)“New Town”280和“NewLondon”282分別與長方條284和286相關(guān)聯(lián),它用圖形化的方式表示出了相關(guān)聯(lián)的置信度值。
圖9示出了具有多個項(xiàng)272、276、280和282并分別與置信度值指標(biāo)288、290、292和294相關(guān)聯(lián)的另一個實(shí)施例。特定項(xiàng)的置信度值的圖形化表示288-294指示出了幾何形狀,在這里是一個三角形,其中分布著大量的豎條,豎條的分布與其到三角形左邊緣的距離有關(guān),它表示了每個項(xiàng)之間關(guān)聯(lián)的置信度值和關(guān)聯(lián)的Δ值。
在另一種更加簡單直接的方法中,圖10還包括分別與項(xiàng)272、276、280和282相關(guān)聯(lián)的標(biāo)準(zhǔn)圖形化表示長方條296、298、300和302。圖形化表示296-302包括大量的具有標(biāo)準(zhǔn)厚度的豎條,每個都有不同的特定分布,并與長方形的左邊緣有一定的距離,它指示了不同項(xiàng)之間的關(guān)聯(lián)的置信度值和關(guān)聯(lián)的Δ值。
圖11示出了另一個實(shí)施例,它包括為不同項(xiàng)提供不同的字體和可能的顏色表示,來為多個項(xiàng)提供置信度值和關(guān)聯(lián)的Δ值的指示。在顯示270中,第一個項(xiàng)“New York”304用一個大的長方形來表示可能增大的字體,項(xiàng)304的實(shí)際顯示尺寸也會增大來表示更高的置信度值。并且,關(guān)于顯示306、308和310,較小的長方形說明使用不同的字體尺寸為特定項(xiàng)提供較小的顯示,因此也表示和說明了語音識別結(jié)果的相關(guān)聯(lián)的置信度值。
正如本領(lǐng)域普通技術(shù)人員所能認(rèn)識到的,顯示270包括較大的顯示區(qū)域,它能夠在同一時(shí)間顯示所有項(xiàng)。在某些便攜式設(shè)備中,顯示區(qū)域可能是受限制的,因此提供多個項(xiàng)可能是有問題的。因此,圖12示出了典型的便攜式設(shè)備320,它具有可選的鍵區(qū)322和顯示324,聲音輸入326和聲音輸出328。如圖12中所示出的,顯示324給出了一個航班預(yù)訂系統(tǒng)的示例,在其中用戶輸入來源城市330和目的城市332。在此實(shí)施例中,有限的顯示區(qū)域不允許顯示所有的多個項(xiàng),因此與項(xiàng)336關(guān)聯(lián)的圖形化表示334會讓用戶能夠在列表模式中看到多個語音識別項(xiàng),這種每次只能看到一個項(xiàng)的方式是易于觀看的,并且圖形化表示的存在也指示了可能會存在識別項(xiàng)。模塊334指示存在更多的項(xiàng),也指示了示出的特定項(xiàng)的識別置信度等級。
因此在此實(shí)施例中,會給用戶提供語音識別引擎具有的直接的可視反饋能力,以及識別引擎具有的檢測與用戶本身輸入有關(guān)的語音識別項(xiàng)的能力。通過允許用戶快速有效地識別那些在語音識別引擎和用戶之間存在有歧義的項(xiàng)、或者是語音識別引擎存在正確識別困難的項(xiàng),可視的自動反饋可以有助于將來改進(jìn)的語音識別能力。因此,可以結(jié)合N-最優(yōu)識別列表的顯示為用戶提供自動反饋,這樣用戶就可以根據(jù)便攜式設(shè)備,例如蜂窩電話320中執(zhí)行的應(yīng)用程序快速有效地選擇正確的語音識別項(xiàng)。
在另一個實(shí)施例中,顯示發(fā)生器104也會產(chǎn)生可聽到的識別結(jié)果列表,它包括多個識別項(xiàng)中的至少一個和特定項(xiàng)的識別置信度值的可聽到的表示。正如上面所討論過的,顯示發(fā)生器104會給出非字母數(shù)字的圖形化表示,同時(shí)會給出特定項(xiàng)的識別置信度值的可聽到的表示。在此實(shí)施例中,顯示發(fā)生器將可聽到的識別結(jié)果提供給顯示設(shè)備,例如揚(yáng)聲器,在這里顯示設(shè)備會接收可聽到的識別結(jié)果列表并輸出此可聽到的識別結(jié)果列表。在一個實(shí)施例中,可聽到的表示包括對識別項(xiàng)的基頻調(diào)整、音量調(diào)整、發(fā)音速度調(diào)整或?qū)Πl(fā)音增加一個或多個聲調(diào)。
應(yīng)該理解的是,本發(fā)明及其不同方面存在著其他變化和修正的實(shí)現(xiàn)方式,正如本領(lǐng)域普通技術(shù)人員易于弄清楚的,并且本發(fā)明不限于此處描述的特定實(shí)施例。例如,嵌入式語音識別引擎178和外部語音識別引擎190都可以用于向識別過濾器提供N-最優(yōu)列表,因此識別過濾器102可以基于兩種語音識別引擎產(chǎn)生修正的識別結(jié)果列表108。因此當(dāng)前的發(fā)明預(yù)期并包含了所有的修正、變化或落入本發(fā)明權(quán)利要求公開了的潛在原理的精神和范圍之內(nèi)的等同物。
權(quán)利要求
1.一種便攜式設(shè)備,包括識別過濾器,接收識別結(jié)果列表,所述識別結(jié)果列表包括多個語音識別項(xiàng),每個語音識別項(xiàng)都具有特定項(xiàng)的識別置信度值,以使識別過濾器產(chǎn)生修正的識別結(jié)果列表,所述修正的識別結(jié)果列表包括具有相關(guān)聯(lián)的特定項(xiàng)識別置信度值的多個語音識別項(xiàng)中的至少一個;以及與識別過濾器相連接的顯示發(fā)生器,以使顯示發(fā)生器接收修正的識別結(jié)果列表并產(chǎn)生圖形化的識別結(jié)果列表,其中,圖形化的識別結(jié)果列表包括多個語音識別項(xiàng)中的至少一個,并且,為所述至少一個語音識別項(xiàng)中的每一個都產(chǎn)生特定項(xiàng)的識別置信度值的圖形化表示,其中,圖形化表示是非字母數(shù)字的符號。
2.權(quán)利要求1中的便攜式設(shè)備,還包括與顯示發(fā)生器相連接的顯示設(shè)備,以使顯示設(shè)備接收圖形化的識別結(jié)果列表并將圖形化的識別結(jié)果列表顯示出來。
3.權(quán)利要求2中的便攜式設(shè)備,還包括能夠接收音頻輸入的音頻輸入設(shè)備,其中,音頻輸入設(shè)備與語音識別引擎相連接,以將音頻輸入提供給語音識別引擎。
4.權(quán)利要求1中的便攜式設(shè)備,其中,所述的圖形化表示包括以下至少一項(xiàng)具有不同顏色的多個的線條,具有不同間隔的多個的線條,其間具有不同間隔的多個的線條,具有在其間分布的至少一個指示線條的幾何元素。
5.權(quán)利要求1中的便攜式設(shè)備,其中,所述的識別過濾器接收最大置信度門限值和最小置信度門限值,從而,考慮下列至少一個來產(chǎn)生修正的識別結(jié)果列表最大置信度門限值和最小置信度門限值。
6.權(quán)利要求1中的便攜式設(shè)備,其中,所述的識別過濾器接收能夠施加到多個語音識別項(xiàng)中的每一個的加權(quán)指示,以調(diào)整特定項(xiàng)的識別置信度值。
7.一種用于顯示語音識別結(jié)果的方法,包括接收識別結(jié)果列表,所述識別結(jié)果列表包括至少一個語音識別項(xiàng),其中至少一個語音識別項(xiàng)中的每一個都具有特定項(xiàng)的置信度值;為至少一個語音識別項(xiàng)中的每一個產(chǎn)生至少一個識別項(xiàng)和特定項(xiàng)的置信度值的圖形化表示,以使圖形化表示包括至少一個非字母數(shù)字的符號,該符號指示了至少一個特定項(xiàng)的置信度值中的每一個;以及顯示所述至少一個識別項(xiàng)及特定項(xiàng)的置信度值的圖形化表示。
8.權(quán)利要求7中的方法,還包括在產(chǎn)生至少一個識別項(xiàng)和特定項(xiàng)的置信度值的圖形化表示之前,將至少一個語音識別項(xiàng)中的每一個的特定項(xiàng)的置信度值與最小門限值進(jìn)行比較,并將至少一個語音識別項(xiàng)中特定項(xiàng)的置信度值低于最小門限值的所有項(xiàng)丟棄;將至少一個語音識別項(xiàng)中的每一個的特定項(xiàng)的置信度值與最大門限值進(jìn)行比較,并將至少一個語音識別項(xiàng)中特定項(xiàng)的置信度值高于最大門限值的所有項(xiàng)丟棄。
9.權(quán)利要求8中的方法,還包括對于圖形化識別列表的至少一個語音識別項(xiàng)中的每一個,接收加權(quán)因子。
10.權(quán)利要求9中的方法,其中,所述的加權(quán)因子是從以下至少一個中接收到的存儲器和可執(zhí)行應(yīng)用程序。
11.權(quán)利要求7中的方法,其中,所述的圖形化表示包括以下的至少一個具有不同顏色的多個的線條,具有不同寬度的多個的線條,其間具有不同間隔的多個的線條,具有在其間分布的至少一個指示線條的幾何元素。
全文摘要
用于顯示語音識別結(jié)果的方法和設(shè)備,包括識別過濾器(102),它接收識別結(jié)果列表(106),包括多個語音識別項(xiàng)(122),其中每個語音識別項(xiàng)(122)都具有特定項(xiàng)的識別置信度值(124)。識別過濾器(102)會產(chǎn)生修正的識別結(jié)果列表(108),它包括具有特定項(xiàng)的識別置信度值的一個或多個語音識別項(xiàng)。此方法和設(shè)備還包括顯示發(fā)生器(104),它接收修正的識別結(jié)果列表(108)并產(chǎn)生圖形化的識別結(jié)果列表(110)。圖形化的識別結(jié)果列表(110)包括語音識別項(xiàng)和非字母數(shù)字的符號,它作為特定項(xiàng)的識別置信度值(128)和語音識別項(xiàng)(126)的圖形化表示。
文檔編號G10L21/00GK1729511SQ200380107106
公開日2006年2月1日 申請日期2003年11月18日 優(yōu)先權(quán)日2002年12月18日
發(fā)明者馬克·T·阿勒紐斯 申請人:摩托羅拉公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
博爱县| 诏安县| 西盟| 阳朔县| 柳江县| 洛隆县| 古丈县| 郎溪县| 伊吾县| 盐城市| 吴忠市| 无为县| 辽中县| 新兴县| 盘锦市| 青神县| 阳朔县| 三穗县| 延安市| 南岸区| 碌曲县| 五莲县| 景洪市| 建瓯市| 虞城县| 寿阳县| 健康| 岑溪市| 喜德县| 大理市| 抚远县| 定日县| 彩票| 买车| 新龙县| 尉犁县| 天峨县| 公主岭市| 丰宁| 肇源县| 威信县|