專利名稱:一種語音識(shí)別的方法、裝置及數(shù)字電視的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語音識(shí)別的方法、系統(tǒng)及數(shù)字電視。
背景技術(shù):
語音識(shí)別是ー門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10年內(nèi),語音識(shí)別技術(shù)將進(jìn)入エ業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。當(dāng)前智能家電的概念已經(jīng)深入人心,隨著智能家電的普及,很多人性化的功能也隨之而來,例如語音識(shí)別功能就是目前ー個(gè)潮流,然而要使用戶準(zhǔn)確,快捷的使用語音識(shí)別功能,必須首先準(zhǔn)確的提取音頻輸入設(shè)備輸入的音頻流,這樣才能盡可能準(zhǔn)確的得到識(shí)別 結(jié)果,因此輸入音頻流的準(zhǔn)確提取就是語音識(shí)別功能是否能被廣大用戶接受的ー個(gè)前提。目前安卓Android語音識(shí)別技術(shù)的實(shí)現(xiàn)方式是首先通過音頻系統(tǒng)的錄音功能提取輸入語音的音頻流,然后將此音頻流傳送到遠(yuǎn)端的語音識(shí)別數(shù)據(jù)庫,通過遠(yuǎn)端的語音識(shí)別數(shù)據(jù)庫對輸入音頻流進(jìn)行匹配,得到識(shí)別結(jié)果,再將識(shí)別結(jié)果傳送到本地。然而,Android系統(tǒng)提取音頻流的方式是通過Audio系統(tǒng)的錄音程序AudioRecorder來實(shí)現(xiàn)的,由于Android系統(tǒng)可以兼容多種音頻輸入設(shè)備,而不同的音頻輸入設(shè)備在相同的錄音增益下錄制到系統(tǒng)中的音頻流是不一樣的,這樣會(huì)使得語音識(shí)別的效果在使用不同音頻輸入設(shè)備時(shí)表現(xiàn)出很大的不同,導(dǎo)致語音識(shí)別效率較低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種語音識(shí)別的方法、裝置及數(shù)字電視,g在解決現(xiàn)有技術(shù)提供的語音識(shí)別方法,存在使得語音識(shí)別效率較低的問題?!矫妫峁┮环N語音識(shí)別的方法,所述方法包括獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào);根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值;按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲音;提取輸入的音頻流;對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。另ー方面,提供一種語音識(shí)別的裝置,所述裝置包括型號(hào)獲取單元,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào);增益值獲取單元,用于根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值;聲音調(diào)整單元,用于按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲
曰;音頻流提取単元,用于提取輸入的音頻流;
語音識(shí)別單元,用于對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。再一方面,提供ー種數(shù)字電視,所述數(shù)字電視包括如上所述的語音識(shí)別的裝置。在本發(fā)明實(shí)施例中,可以按照預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,為不同設(shè)備型號(hào)的音頻輸入設(shè)備設(shè)置不同的錄音增益值,通過該錄音増益值來調(diào)整當(dāng)前音頻輸入設(shè)備的音量,可以得到最佳的音頻流,然后,對該音頻流進(jìn)行語音識(shí)別。這樣,用戶在Android設(shè)備上使用多種音頻輸入設(shè)備都可以得到滿意的語音識(shí)別結(jié)果,解決了現(xiàn)有技術(shù)語音識(shí)別率降低的問題。
圖I是本發(fā)明實(shí)施例一提供的語音識(shí)別的方法的實(shí)現(xiàn)流程圖;
圖2是本發(fā)明實(shí)施例ニ提供的語音識(shí)別的方法的實(shí)現(xiàn)流程圖;圖3是本發(fā)明實(shí)施例三提供的語音識(shí)別的裝置的結(jié)構(gòu)框圖;圖4是本發(fā)明實(shí)施例四提供的語音識(shí)別的裝置的結(jié)構(gòu)框圖;圖5是本發(fā)明實(shí)施例五提供的數(shù)字電視的結(jié)構(gòu)框圖;圖6是本發(fā)明實(shí)施例六提供的數(shù)字電視的結(jié)構(gòu)框圖。
具體實(shí)施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)ー步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。在本發(fā)明實(shí)施例中,獲取到當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)后,即可根據(jù)預(yù)設(shè)的設(shè)備型號(hào)與錄音增益值的映射關(guān)系獲取到適合當(dāng)前音頻輸入設(shè)備的錄音增益值,再按照該錄音増益值調(diào)整當(dāng)前音頻輸入設(shè)備的音量,即可得到最佳的音頻流,然后再對該音頻流進(jìn)行語音識(shí)別,由于該音頻流是得到的最佳音頻流,所以,語音識(shí)別的效率較高。以下結(jié)合具體實(shí)施例對本發(fā)明的實(shí)現(xiàn)進(jìn)行詳細(xì)描述實(shí)施例一圖I示出了本發(fā)明實(shí)施例一提供的語音識(shí)別的方法的實(shí)現(xiàn)流程,該方法可以應(yīng)用在語音識(shí)別的裝置中,其中,該語音識(shí)別的裝置可以為麥克風(fēng),其可內(nèi)置于數(shù)字電視中,也可以內(nèi)置于可以進(jìn)行音頻播放的音視頻播放器等Android家電設(shè)備中,本發(fā)明以數(shù)字電視為例來進(jìn)行說明,詳述如下在步驟SlOl中,獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)。在本實(shí)施例中,語音識(shí)別的裝置首先獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào),具體設(shè)備型號(hào)可以根據(jù)所述音頻輸入設(shè)備的廠商ID和產(chǎn)品ID來確定。在步驟S102中,根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值。在本實(shí)施例中,預(yù)先為不同設(shè)備型號(hào)的音頻輸入設(shè)備設(shè)置不同的錄音增益值,當(dāng)按照該預(yù)設(shè)的錄音增益值調(diào)整音頻輸入設(shè)備的聲音后,音頻輸入設(shè)備輸入的音頻流可以達(dá)到最佳。比如,對A型號(hào)的音頻輸入設(shè)備,設(shè)置錄音增益值為GainA,對B型號(hào)的音頻輸入設(shè)備,設(shè)置錄音增益值為GainB。當(dāng)語音識(shí)別的裝置監(jiān)測到當(dāng)前音頻輸入設(shè)備是A型號(hào)的音頻輸入設(shè)備后,可以根據(jù)預(yù)先設(shè)置的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系獲取到該A型號(hào)的音頻輸入設(shè)備對應(yīng)的錄音増益值為GainA,然后按照GainA調(diào)整A型號(hào)的音頻輸入設(shè)備輸
入的聲音。在步驟S103中,按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲音。在步驟S104中,提取輸入的音頻流。
在步驟S105中,對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。本實(shí)施例,獲取到當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)后,即可根據(jù)預(yù)設(shè)的設(shè)備型號(hào)與錄音增益值的映射關(guān)系獲取到適合當(dāng)前音頻輸入設(shè)備的錄音增益值,再按照該錄音增益值調(diào)整當(dāng)前音頻輸入設(shè)備輸入的聲音,即可得到最佳的音頻流,然后再對該音頻流進(jìn)行語音識(shí)別,由于該音頻流是得到的最佳音頻流,所以,語音識(shí)別的效果可以達(dá)到最佳。本實(shí)施例不僅可以提高在Android設(shè)備上使用語音識(shí)別功能的用戶體驗(yàn),用戶在Android設(shè)備上使用多種音頻輸入設(shè)備都可以得到滿意的識(shí)別結(jié)果,解決了之前由于使用某些特定的音頻輸入設(shè)備而導(dǎo)致語音識(shí)別率降低的問題。實(shí)施例ニ圖2示出了本發(fā)明實(shí)施例ニ提供的語音識(shí)別的方法的實(shí)現(xiàn)流程,詳述如下在步驟S201中,預(yù)先生成設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系。在本實(shí)施例中,由于不同的音頻輸入設(shè)備在相同的錄音增益下錄制到Android系統(tǒng)中的音頻流是不一樣的,因此,為了得到最佳的音頻流,可以預(yù)先為不同型號(hào)的音頻輸入設(shè)備設(shè)置不同的錄音增益值。比如,對A型號(hào)的音頻輸入設(shè)備,設(shè)置錄音增益值為GainA,對B型號(hào)的音頻輸入設(shè)備,設(shè)置錄音增益值為GainB。在步驟S202中,獲取當(dāng)前音頻輸入設(shè)備的設(shè)備信息。其中,音頻輸入設(shè)備可以為PCI總線接ロ設(shè)備,也可以為USB總線接ロ設(shè)備。在本實(shí)施例中,音頻輸入設(shè)備為USB總線接ロ設(shè)備。當(dāng)開啟語音識(shí)別功能后,并且語音識(shí)別的裝置監(jiān)測到音頻輸入設(shè)備接入U(xiǎn)SB總線接ロ后,首先讀取預(yù)設(shè)目錄下的devices文件,從所述devices文件中解析出所述音頻輸入設(shè)備的設(shè)備信息,其中,所述音頻輸入設(shè)備的設(shè)備信息存儲(chǔ)在預(yù)設(shè)目錄的devices文件中。一般Linux系統(tǒng)中預(yù)設(shè)的目錄是/proc/busAisb (有些版本的Linux系統(tǒng)中預(yù)設(shè)的目錄可倉泛在 /proc/bus/inputA音頻識(shí)別的裝置獲取到的設(shè)備信息的格式(一個(gè)設(shè)備的信息)如下I:Bus=0003 Vendor=0ac8 Product=3420 Version=OlfaN:Name="Gsou USB2. 0 Camera"P: Phys=usb-mstar-l/buttonS:Sysfs=/devices/platform/Mstar-ehci-3.2/usb3/3_l/3_l: I. 0/input/input9UiUniq=H:Handlers=kbd event3B:EV=3B:KEY=100000000000具體含義
I :這行包含設(shè)備的身份信息,顯示的總線類型Bus是3 (表示該設(shè)備是USB總線接ロ設(shè)備)、Vendor表示廠商ID、Product表示產(chǎn)品ID、Version表示產(chǎn)品版本。N:這行包含了設(shè)備的名稱信息。P :這行包含了設(shè)備的物理信息。H:這行包含了與設(shè)備關(guān)聯(lián)的驅(qū)動(dòng)程序handler drivers。B:這些行包含了顯示設(shè)備能力的一些位域(bit field)。在步驟S203中,從所述設(shè)備信息中提取出廠商ID和產(chǎn)品ID,所述廠商ID和產(chǎn)品ID為當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)。在本實(shí)施例中,語音識(shí)別的裝置獲取到當(dāng)前音頻輸入設(shè)備的設(shè)備信息后,可以從 所述設(shè)備信息中的I行根據(jù)標(biāo)識(shí)Vendor和Product獲取到當(dāng)前音頻輸入設(shè)備的廠商ID和產(chǎn)品ID,根據(jù)所述廠商ID和產(chǎn)品ID即可確定所述當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)。在步驟S204中,根據(jù)預(yù)設(shè)的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值。在步驟S205中,按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲音。在步驟S206中,提取輸入的音頻流。在步驟S207中,對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。在本實(shí)施例中,步驟S204-S207的執(zhí)行過程和上述實(shí)施例一中的步驟S101-S105的執(zhí)行過程類似,詳情參見上述實(shí)施例一的描述。步驟S202-S203是步驟SlOl的細(xì)化步驟,詳細(xì)的描述了步驟SlOl的實(shí)現(xiàn)過程。本實(shí)施例,先預(yù)設(shè)設(shè)備型號(hào)與錄音增益值的映射關(guān)系,獲取到當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)后,即可根據(jù)該映射關(guān)系獲取到適合當(dāng)前音頻輸入設(shè)備的錄音增益值,再按照該錄音増益值調(diào)整當(dāng)前音頻輸入設(shè)備的音量,即可得到最佳的音頻流,然后再對該音頻流進(jìn)行語音識(shí)別,由于該音頻流是得到的最佳音頻流,所以,語音識(shí)別的效果可以達(dá)到最佳。本實(shí)施例不僅可以提高在Android設(shè)備上使用語音識(shí)別功能的用戶體驗(yàn),用戶在Android設(shè)備上使用多種音頻輸入設(shè)備都可以得到滿意的識(shí)別結(jié)果,解決了現(xiàn)有技術(shù)語音識(shí)別率降低的問題。實(shí)施例三圖3示出了本發(fā)明實(shí)施例三提供的語音識(shí)別的裝置的具體結(jié)構(gòu)框圖,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。該語音識(shí)別的裝置可以是內(nèi)置于Android設(shè)備的軟件單元、硬件單元或者軟硬件結(jié)合的單元,在本實(shí)施例中,該Android設(shè)備是數(shù)字電視,該語音識(shí)別的裝置包括型號(hào)獲取單元31、增益值獲取單元32、音量調(diào)整單元33、音頻流提取單元34和語音識(shí)別單元35。其中,型號(hào)獲取單元31,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào);增益值獲取單元32,用于根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值;聲音調(diào)整單元33,用于按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲
曰;音頻流提取單元34,用于提取輸入的音頻流;語音識(shí)別單元35,用于對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。
本發(fā)明實(shí)施例提供的語音識(shí)別的裝置可以應(yīng)用在前述對應(yīng)的方法實(shí)施例一中,詳情參見上述實(shí)施例一的描述,在此不再贅述。實(shí)施例四圖4示出了本發(fā)明實(shí)施例四提供的語音識(shí)別的裝置的具體結(jié)構(gòu)框圖,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。該語音識(shí)別的裝置可以是內(nèi)置于Android設(shè)備的軟件單元、硬件單元或者軟硬件結(jié)合的單元,在本實(shí)施例中,該Android設(shè)備是數(shù)字電視,該語音識(shí)別的裝置包括映射關(guān)系生成単元41、型號(hào)獲取單元42、增益值獲取單元43、音量調(diào)整單元44、音頻流提取單元45和語音識(shí)別單元46。其中,映射關(guān)系生成単元41,用于預(yù)先生成設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系O
型號(hào)獲取單元42,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào);增益值獲取單元43,用于根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值;聲音調(diào)整單元44,用于按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲
曰;音頻流提取單元45,用于提取輸入的音頻流;語音識(shí)別單元46,用于對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。具體的,所述型號(hào)獲取單元42包括設(shè)備信息獲取模塊421、ID提取模塊422。其中,設(shè)備信息獲取模塊421,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備信息;ID提取模塊422,用于從所述設(shè)備信息中提取出廠商ID和產(chǎn)品ID,所述廠商ID和產(chǎn)品ID為當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)。具體的,所述設(shè)備信息獲取模塊421包括文件讀取子模塊和文件解析子模塊。其中,文件讀取子模塊,用于讀取預(yù)設(shè)目錄下的devices文件;文件解析子模塊,用于從所述devices文件中解析出所述音頻輸入設(shè)備的設(shè)備信
O本發(fā)明實(shí)施例提供的語音識(shí)別的裝置可以應(yīng)用在前述對應(yīng)的方法實(shí)施例ニ中,詳情參見上述實(shí)施例ニ的描述,在此不再贅述。實(shí)施例五圖5示出了本發(fā)明實(shí)施例五提供的數(shù)字電視的具體結(jié)構(gòu)框圖,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。所述數(shù)字電視包括語音識(shí)別的裝置5,所述語音識(shí)別的裝置5包括型號(hào)獲取單元51、增益值獲取單元52、音量調(diào)整單元53、音頻流提取単元54和語音識(shí)別單元55。其中,型號(hào)獲取單元51,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào);增益值獲取單元52,用于根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值;聲音調(diào)整單元53,用于按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲
曰;音頻流提取單元54,用于提取輸入的音頻流;語音識(shí)別單元55,用于對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。
本發(fā)明實(shí)施例提供的數(shù)字電視可以應(yīng)用在前述對應(yīng)的方法實(shí)施例一中,詳情參見上述實(shí)施例一的描述,在此不再贅述。實(shí)施例六圖6示出了本發(fā)明實(shí)施例六提供的數(shù)字電視的具體結(jié)構(gòu)框圖,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。所述數(shù)字電視包括語音識(shí)別的裝置6,所述語音識(shí)別的裝置6包括映射關(guān)系生成単元61、型號(hào)獲取單元62、增益值獲取單元63、音量調(diào)整單元64、音頻流提取單元65和語音識(shí)別單元66。其中,映射關(guān)系生成単元61,用于預(yù)先生成設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系O
型號(hào)獲取單元62,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào);增益值獲取單元63,用于根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值;聲音調(diào)整單元64,用于按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲
曰;音頻流提取單元65,用于提取輸入的音頻流;語音識(shí)別單元66,用于對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。具體的,所述型號(hào)獲取單元62包括設(shè)備信息獲取模塊621、ID提取模塊622。其中,設(shè)備信息獲取模塊621,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備信息;ID提取模塊622,用于從所述設(shè)備信息中提取出廠商ID和產(chǎn)品ID,所述廠商ID和產(chǎn)品ID為當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)。具體的,所述設(shè)備信息獲取模塊621包括文件讀取子模塊和文件解析子模塊。其中,文件讀取子模塊,用于讀取預(yù)設(shè)目錄下的devices文件;文件解析子模塊,用于從所述devices文件中解析出所述音頻輸入設(shè)備的設(shè)備信
ο本發(fā)明實(shí)施例提供的數(shù)字電視可以應(yīng)用在前述對應(yīng)的方法實(shí)施例ニ中,詳情參見上述實(shí)施例ニ的描述,在此不再贅述。值得注意的是,上述系統(tǒng)實(shí)施例中,所包括的各個(gè)單元只是按照功能邏輯進(jìn)行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能単元的具體名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。另外,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述各實(shí)施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,相應(yīng)的程序可以存儲(chǔ)于ー計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述的存儲(chǔ)介質(zhì),如R0M/RAM、磁盤或光盤等。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種語音識(shí)別的方法,其特征在于,所述方法包括 獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào); 根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值; 按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲音; 提取輸入的音頻流; 對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。
2.如權(quán)利要求I所述的方法,其特征在于,在所述獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)的步驟之前,所述方法還包括 預(yù)先生成設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系。
3.如權(quán)利要求I所述的方法,其特征在于,所述獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)包括 獲取當(dāng)前音頻輸入設(shè)備的設(shè)備信息; 從所述設(shè)備信息中提取出廠商ID和產(chǎn)品ID,所述廠商ID和產(chǎn)品ID為當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)。
4.如權(quán)利要求I所述的方法,其特征在于,所述獲取當(dāng)前音頻輸入設(shè)備的設(shè)備信息包括 讀取預(yù)設(shè)目錄下的devices文件; 從所述devices文件中解析出所述音頻輸入設(shè)備的設(shè)備信息。
5.一種語音識(shí)別的裝置,其特征在于,所述裝置包括 型號(hào)獲取單元,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào); 增益值獲取單元,用于根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值; 聲音調(diào)整單元,用于按照所述錄音増益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲音; 音頻流提取単元,用于提取輸入的音頻流; 語音識(shí)別單元,用于對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。
6.如權(quán)利要求5所述的裝置,其特征在于,所述裝置還包括 映射關(guān)系生成単元,用于預(yù)先生成設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系。
7.如權(quán)利要求5所述的裝置,其特征在于,所述型號(hào)獲取單元包括 設(shè)備信息獲取模塊,用于獲取當(dāng)前音頻輸入設(shè)備的設(shè)備信息; ID提取模塊,用于從所述設(shè)備信息中提取出廠商ID和產(chǎn)品ID,所述廠商ID和產(chǎn)品ID為當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào)。
8.如權(quán)利要求7所述的裝置,其特征在于,所述設(shè)備信息獲取模塊包括 文件讀取子模塊,用于讀取預(yù)設(shè)目錄下的devices文件; 文件解析子模塊,用于從所述devices文件中解析出所述音頻輸入設(shè)備的設(shè)備信息。
9.ー種數(shù)字電視,其特征在于,所述數(shù)字電視包括如權(quán)利要求5至8任意ー項(xiàng)所述的語音識(shí)別的裝置。
全文摘要
本發(fā)明適用于語音識(shí)別技術(shù)領(lǐng)域,提供了一種語音識(shí)別的方法、裝置及數(shù)字電視,所述方法包括獲取當(dāng)前音頻輸入設(shè)備的設(shè)備型號(hào);根據(jù)預(yù)先生成的設(shè)備型號(hào)與錄音增益值之間的映射關(guān)系,獲取與所述設(shè)備型號(hào)對應(yīng)的錄音增益值;按照所述錄音增益值調(diào)整所述當(dāng)前音頻輸入設(shè)備輸入的聲音;提取輸入的音頻流;對所述音頻流進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。本發(fā)明,為不同設(shè)備型號(hào)的音頻輸入設(shè)備設(shè)置不同的錄音增益值,通過該錄音增益值來調(diào)整當(dāng)前音頻輸入設(shè)備的音量,得到最佳的音頻流,然后,對該音頻流進(jìn)行語音識(shí)別,解決了之前由于使用某些特定的音頻輸入設(shè)備而導(dǎo)致語音識(shí)別率降低的問題。
文檔編號(hào)H04N21/43GK102693722SQ201210163919
公開日2012年9月26日 申請日期2012年5月23日 優(yōu)先權(quán)日2012年5月23日
發(fā)明者霍平華 申請人:Tcl集團(tuán)股份有限公司