專利名稱:一種語(yǔ)音識(shí)別系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,特別涉及一種語(yǔ)音識(shí)別系統(tǒng)和方法。
背景技術(shù):
目前多種智能音視頻設(shè)備都添加了語(yǔ)音識(shí)別功能。圖I是現(xiàn)有的一種音視頻設(shè)備的組成結(jié)構(gòu)的示意圖。如圖I所示,該音視頻設(shè)備包括麥克風(fēng)陣列101、音頻編碼電路102、攝像頭103、視頻處理電路104、主控集成電路105、系統(tǒng)主控微控制單元(系統(tǒng)主控MCU)106、揚(yáng)聲器107及顯示屏108。其中,麥克風(fēng)陣列101負(fù)責(zé)語(yǔ)音信號(hào)的拾取并轉(zhuǎn)換成模擬音頻信號(hào)后輸出給音頻編碼電路102,音頻編碼電路102將從麥克風(fēng)陣列101接收的模擬音頻信號(hào)進(jìn)行數(shù)字編碼,
然后輸出給主控集成電路105 ;攝像頭103用于捕獲視頻信號(hào)并輸出給視頻處理電路104,視頻處理電路104用于對(duì)攝像頭103輸出的信號(hào)進(jìn)行編碼處理后輸出給主控集成電路105 ;主控集成電路105匯集視頻信號(hào)和音頻信號(hào)后,合成音視頻數(shù)據(jù)流輸出給系統(tǒng)主控微控制單元106。系統(tǒng)主控微控制單元106為該音視頻設(shè)備的核心器件,負(fù)責(zé)音視頻數(shù)據(jù)鏈路的管理。從系統(tǒng)主控微控制單元106輸出的音頻信號(hào)通過(guò)音頻揚(yáng)聲器107變成聲音信號(hào),從系統(tǒng)主控微控制單元106.輸出的視頻信號(hào)通過(guò)顯示屏108進(jìn)行顯示。此外,圖I所示的音視頻設(shè)備還包括作為外圍接口的USB接口和負(fù)責(zé)整個(gè)系統(tǒng)的穩(wěn)定供電的電源電路等,這里不再贅述。在現(xiàn)有的如圖I所示的具有語(yǔ)音識(shí)別功能的音視頻設(shè)備中,不論采用全指向麥克風(fēng)陣列還是采用單指向麥克風(fēng)音陣列,都有一定的識(shí)別距離,所以只能進(jìn)行近距離語(yǔ)音識(shí)別,而對(duì)遠(yuǎn)距離語(yǔ)音無(wú)能為力。
發(fā)明內(nèi)容
本發(fā)明提供了一種語(yǔ)音識(shí)別系統(tǒng)和方法,以解決只有麥克風(fēng)陣列作為音頻輸入的語(yǔ)音識(shí)別系統(tǒng)無(wú)法對(duì)遠(yuǎn)距離語(yǔ)音進(jìn)行識(shí)別的問(wèn)題。為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的本發(fā)明公開(kāi)了一種語(yǔ)音識(shí)別系統(tǒng),包括麥克風(fēng)陣列、音頻編碼電路、主控集成電路、藍(lán)牙接收模塊和藍(lán)牙發(fā)射模塊,其中麥克風(fēng)陣列,用于接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào)后輸出給音頻編碼電路;音頻編碼電路,用于將所接收的模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào)后輸出給主控集成電路;藍(lán)牙發(fā)射模塊,用于接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)后通過(guò)藍(lán)牙方式發(fā)送給藍(lán)牙接收模塊;藍(lán)牙接收模塊,用于將所接收的數(shù)字音頻信號(hào)發(fā)送給主控集成電路;主控集成電路,用于選擇接收來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。
在上述語(yǔ)音識(shí)別系統(tǒng)中,具有一個(gè)藍(lán)牙接收模塊和一個(gè)以上的藍(lán)牙發(fā)射模塊。在上述語(yǔ)音識(shí)別系統(tǒng)中,所述主控集成電路具有按鍵,所述主控集成電路根據(jù)用戶對(duì)該按鍵的操作選擇來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。上述語(yǔ)音識(shí)別系統(tǒng)還包括系統(tǒng)主控微控制單元,用于接收來(lái)自主控集成電路的音頻數(shù)據(jù)流;該系統(tǒng)主控微控制單元具有按鍵,該系統(tǒng)主控微控制單元根據(jù)用戶對(duì)該按鍵的操作向主控集成電路發(fā)送選擇來(lái)自音頻編碼電路的數(shù)字音 頻信號(hào)的指令或選擇來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)的指令;主控集成電路根據(jù)系統(tǒng)主控微控制單元的指令選擇來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。本發(fā)明還公開(kāi)了一種語(yǔ)音識(shí)別的方法,該方法包括通過(guò)麥克風(fēng)陣列接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào),然后將該模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào),得到第一路數(shù)字音頻信號(hào);通過(guò)藍(lán)牙音頻鏈路接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào),得到第二路數(shù)字音頻信號(hào);選擇第一路數(shù)字音頻信號(hào)或第二路數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。在上述方法中,所述藍(lán)牙音頻鏈路包括藍(lán)牙發(fā)射模塊和藍(lán)牙接收模塊;所述通過(guò)藍(lán)牙音頻鏈路接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)包括通過(guò)藍(lán)牙發(fā)射模塊接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)后發(fā)送給藍(lán)牙接收模塊,藍(lán)牙接收模塊將所接收的數(shù)字音頻信號(hào)作為所述第二路數(shù)字音頻信號(hào)輸出。所述藍(lán)牙音頻鏈路包括一個(gè)以上的藍(lán)牙發(fā)射模塊和一個(gè)藍(lán)牙接收模塊。在上述方法中,所述選擇第一路數(shù)字音頻信號(hào)或第二路數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理包括根據(jù)用戶的按鍵操作選擇第一路數(shù)字音頻信號(hào)或第二路數(shù)字音頻信號(hào),對(duì)并所選擇的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。由上述可見(jiàn),在本發(fā)明的方案中,由于語(yǔ)音識(shí)別系統(tǒng)包括麥克風(fēng)陣列鏈路和藍(lán)牙鏈路兩路語(yǔ)音輸入鏈路,在進(jìn)行語(yǔ)音識(shí)別時(shí)在兩路鏈路中進(jìn)行選擇,其中的藍(lán)牙鏈路可以實(shí)現(xiàn)遠(yuǎn)距離語(yǔ)音的接收,因此可以對(duì)遠(yuǎn)距離的語(yǔ)音進(jìn)行識(shí)別。
圖I是現(xiàn)有的一種音視頻設(shè)備的組成結(jié)構(gòu)的示意圖;圖2為本發(fā)明實(shí)施例中的包含語(yǔ)音識(shí)別系統(tǒng)的音視頻設(shè)備的組成結(jié)構(gòu)的示意圖。
具體實(shí)施例方式本發(fā)明中,通過(guò)麥克風(fēng)陣列接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào),然后將該模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào),得到第一路數(shù)字音頻信號(hào);并且通過(guò)藍(lán)牙音頻鏈路接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào),得到第二路數(shù)字音頻信號(hào);然后選擇第一路數(shù)字音頻信號(hào)或第二路數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。這樣,對(duì)于較近的一些語(yǔ)音可以通過(guò)麥克風(fēng)陣列進(jìn)行拾取,而對(duì)于較遠(yuǎn)局域的語(yǔ)音,則可以通過(guò)的藍(lán)牙鏈路實(shí)現(xiàn)接收,因此解決了只有麥克風(fēng)陣列作為音頻輸入的語(yǔ)音識(shí)別系統(tǒng)無(wú)法對(duì)遠(yuǎn)距離語(yǔ)音進(jìn)行識(shí)別的問(wèn)題。為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。圖2為本發(fā)明實(shí)施例中的包含語(yǔ)音識(shí)別系統(tǒng)的音視頻設(shè)備的組成結(jié)構(gòu)的示意圖。如圖2所示,該系統(tǒng)包括麥克風(fēng)陣列101、音頻編碼電路102、攝像頭103、視頻處理電路104、主控集成電路205、系統(tǒng)主控微控制單元206、揚(yáng)聲器107、顯示屏108、藍(lán)牙接收模塊201和藍(lán)牙發(fā)射模塊202。這里藍(lán)牙發(fā)射模塊202的個(gè)數(shù)為一個(gè)或多個(gè),圖2中示意出了多個(gè)藍(lán)牙發(fā)射模塊202。另外由于本發(fā)明的實(shí)施例中對(duì)主控集成電路和系統(tǒng)主控微控制單元的功能都進(jìn)行了改進(jìn),因此采用了與圖I中不同的附圖標(biāo)記。其中,麥克風(fēng)陣列101,用于接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào)后輸出給音頻編碼電路102。音頻編碼電路102,用于將所接收的模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào)后輸出給主控集成電路205。攝像頭103用于捕獲視頻信號(hào)并輸出給視頻處理電路104,視頻處理電路104用于對(duì)攝像頭103輸出的信號(hào)進(jìn)行編碼處理后輸出給主控集成電路205 ;·藍(lán)牙發(fā)射模塊202,用于接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)后通過(guò)藍(lán)牙方式發(fā)送給藍(lán)牙接收模塊201 ;藍(lán)牙接收模塊201,用于將所接收的數(shù)字音頻信號(hào)發(fā)送給主控集成電路205 ;主控集成電路205,用于選擇來(lái)自音頻編碼電路102的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊201的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。即主控集成電路205先在來(lái)自音頻編碼電路102的數(shù)字音頻信號(hào)和來(lái)自藍(lán)牙接收模塊102的數(shù)字音頻信號(hào)之間進(jìn)行選擇,然后將選擇的數(shù)字音頻信號(hào)與來(lái)自視頻處理電路104的數(shù)字視頻信號(hào)匯集,合成音視頻數(shù)據(jù)流后輸出給系統(tǒng)主控微控制單元206。系統(tǒng)主控微控制單元206負(fù)責(zé)音視頻數(shù)據(jù)鏈路的管理。從系統(tǒng)主控微控制單元206輸出的音頻信號(hào)通過(guò)音頻揚(yáng)聲器107變成聲音信號(hào),從系統(tǒng)主控微控制單元206輸出的視頻信號(hào)通過(guò)顯示屏108進(jìn)行顯示??梢?jiàn),在圖2所示的實(shí)施例中有兩條音頻輸入鏈路,分別為麥克風(fēng)陣列音頻鏈路和藍(lán)牙音頻鏈路。其中,麥克風(fēng)陣列音頻鏈路包括麥克風(fēng)陣列101和音頻編碼電路102,麥克風(fēng)陣列101接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào)后輸出給音頻編碼電路102,音頻編碼電路102將所接收的模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào)后作為第一路數(shù)字音頻信號(hào)輸出給主控集成電路205。藍(lán)牙音頻鏈路包括藍(lán)牙發(fā)射模塊202和藍(lán)牙接收模塊201 ;通過(guò)藍(lán)牙發(fā)射模塊202接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)后發(fā)送給藍(lán)牙接收模塊201,藍(lán)牙接收模塊201將所接收的數(shù)字音頻信號(hào)作為第二路數(shù)字音頻信號(hào)輸出給主控集成電路205。主控集成電路205在第一路數(shù)字音頻信號(hào)和第二路數(shù)字音頻信號(hào)之間進(jìn)行選擇。在本法明的上述實(shí)施中,保留了麥克風(fēng)陣列,以實(shí)現(xiàn)近距離的語(yǔ)音識(shí)別。在此基礎(chǔ)上增加了藍(lán)牙語(yǔ)音輸入方式,以實(shí)現(xiàn)遠(yuǎn)程語(yǔ)音識(shí)別。藍(lán)牙傳輸技術(shù)支持一對(duì)多的通信,即可以設(shè)置一個(gè)藍(lán)牙接收模塊和多個(gè)的藍(lán)牙發(fā)射模塊。實(shí)踐中可以根據(jù)需要配備多個(gè)藍(lán)牙發(fā)射模塊,以實(shí)現(xiàn)多點(diǎn)語(yǔ)音識(shí)別。由于用藍(lán)牙方式可以遠(yuǎn)距離傳輸信號(hào),故本系統(tǒng)可以進(jìn)行遠(yuǎn)程語(yǔ)音識(shí)別。在本發(fā)明的實(shí)施例中,可以通過(guò)按鍵控制主控集成電路205的對(duì)數(shù)字音頻信號(hào)的選擇。
例如,可以在主控集成電路205上設(shè)置一個(gè)按鍵式的控制端,主控集成電路205根據(jù)用戶對(duì)該按鍵的操作選擇來(lái)自音頻編碼電路102的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊201的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。或者,也可以在系統(tǒng)主控微控制單元206上設(shè)置按鍵式的控制端,系統(tǒng)主控微控制單元206根據(jù)用戶對(duì)該按鍵的操作向主控集成電路205發(fā)送選擇來(lái)自音頻編碼電路102的數(shù)字音頻信號(hào)的指令或選擇來(lái)自藍(lán)牙接收模塊201的數(shù)字音頻信號(hào)的指令;主控集成電路205根據(jù)系統(tǒng)主控微控制單元206的指令選擇來(lái)自音頻編碼電路102的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊201的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。本發(fā)明實(shí)施例中對(duì)系統(tǒng)主控微控制單元的改進(jìn)也正是在于此。綜上所述,在本發(fā)明的方案中,由于語(yǔ)音識(shí)別系統(tǒng)包括麥克風(fēng)陣列鏈路和藍(lán)牙鏈路兩路語(yǔ)音輸入鏈路,在進(jìn)行語(yǔ)音識(shí)別時(shí)在兩路鏈路中進(jìn)行選擇,其中的藍(lán)牙鏈路可以實(shí)現(xiàn)遠(yuǎn)距離語(yǔ)音的接收以及實(shí)現(xiàn)多點(diǎn)語(yǔ)音控制,因此可以對(duì)多個(gè)遠(yuǎn)距離的語(yǔ)音進(jìn)行識(shí)別,使用戶更好的體會(huì)語(yǔ)音識(shí)別的優(yōu)越性。 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種語(yǔ)音識(shí)別系統(tǒng),其特征在于,包括麥克風(fēng)陣列、音頻編碼電路、主控集成電路、藍(lán)牙接收模塊和藍(lán)牙發(fā)射模塊,其中 麥克風(fēng)陣列,用于接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào)后輸出給音頻編碼電路; 音頻編碼電路,用于將所接收的模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào)后輸出給主控集成電路; 藍(lán)牙發(fā)射模塊,用于接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)后通過(guò)藍(lán)牙方式發(fā)送給藍(lán)牙接收模塊; 藍(lán)牙接收模塊,用于將所接收的數(shù)字音頻信號(hào)發(fā)送給主控集成電路; 主控集成電路,用于選擇來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。
2.根據(jù)權(quán)利要求I所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于該系統(tǒng)具有一個(gè)藍(lán)牙接收模塊和一個(gè)以上的藍(lán)牙發(fā)射模塊。
3.根據(jù)權(quán)利要求I或2所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于,所述主控集成電路具有按鍵,所述主控集成電路根據(jù)用戶對(duì)該按鍵的操作選擇來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。
4.根據(jù)權(quán)利要求I或2所述的語(yǔ)音識(shí)別系統(tǒng),其特征在于,該語(yǔ)音識(shí)別系統(tǒng)還包括系統(tǒng)主控微控制單元,用于接收來(lái)自主控集成電路的音頻數(shù)據(jù)流; 該系統(tǒng)主控微控制單元具有按鍵,該系統(tǒng)主控微控制單元根據(jù)用戶對(duì)該按鍵的操作向主控集成電路發(fā)送選擇來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)的指令或選擇來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)的指令; 主控集成電路根據(jù)系統(tǒng)主控微控制單元的指令選擇來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。
5.一種語(yǔ)音識(shí)別的方法,其特征在于,該方法包括 通過(guò)麥克風(fēng)陣列接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào),然后將該模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào),得到第一路數(shù)字音頻信號(hào); 通過(guò)藍(lán)牙音頻鏈路接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào),得到第二路數(shù)字音頻信號(hào); 選擇第一路數(shù)字音頻信號(hào)或第二路數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。
6.根據(jù)權(quán)利要求5所述的語(yǔ)音識(shí)別方法,其特征在于,所述藍(lán)牙音頻鏈路包括藍(lán)牙發(fā)射模塊和藍(lán)牙接收模塊; 所述通過(guò)藍(lán)牙音頻鏈路接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)包括通過(guò)藍(lán)牙發(fā)射模塊接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)后發(fā)送給藍(lán)牙接收模塊,藍(lán)牙接收模塊將所接收的數(shù)字音頻信號(hào)作為所述第二路數(shù)字音頻信號(hào)輸出。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述藍(lán)牙音頻鏈路包括一個(gè)以上的藍(lán)牙發(fā)射模塊和一個(gè)藍(lán)牙接收模塊。
8.根據(jù)權(quán)利要求5或6所述的語(yǔ)音識(shí)別方法,其特征在于,所述選擇對(duì)第一路數(shù)字音頻信號(hào)或二路數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理包括 根據(jù)用戶的按鍵操作選擇第一路數(shù)字音頻信號(hào)或第二路數(shù)字音頻信號(hào),并對(duì)所選擇的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。
全文摘要
本發(fā)明公開(kāi)了一種語(yǔ)音識(shí)別系統(tǒng)和方法。其中語(yǔ)音識(shí)別系統(tǒng)包括麥克風(fēng)陣列,接收語(yǔ)音信號(hào)并轉(zhuǎn)換成模擬音頻信號(hào)后輸出給音頻編碼電路;音頻編碼電路,用于將所接收的模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字音頻信號(hào)后輸出給主控集成電路;藍(lán)牙發(fā)射模塊,用于接收語(yǔ)音信號(hào)并轉(zhuǎn)換成數(shù)字音頻信號(hào)后通過(guò)藍(lán)牙方式發(fā)送給藍(lán)牙接收模塊;藍(lán)牙接收模塊,用于將所接收的數(shù)字音頻信號(hào)發(fā)送給主控集成電路;主控集成電路,用于選擇來(lái)自音頻編碼電路的數(shù)字音頻信號(hào)或來(lái)自藍(lán)牙接收模塊的數(shù)字音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別處理。本發(fā)明的技術(shù)方案解決了只有麥克風(fēng)陣列作為音頻輸入的語(yǔ)音識(shí)別系統(tǒng)無(wú)法對(duì)遠(yuǎn)距離語(yǔ)音進(jìn)行識(shí)別的問(wèn)題。
文檔編號(hào)G10L15/02GK102820032SQ201210290828
公開(kāi)日2012年12月12日 申請(qǐng)日期2012年8月15日 優(yōu)先權(quán)日2012年8月15日
發(fā)明者王平平, 郄勇 申請(qǐng)人:歌爾聲學(xué)股份有限公司