專利名稱:一種消除語音輸入中背景噪聲的方法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種消除語音輸入中背景噪聲的方法及其裝置。
背景技術(shù):
針對(duì)語音通話中的背景噪聲問題,目前主要有兩種解決方法采用模擬濾波器消除背景噪聲和采用數(shù)字信號(hào)處理器(DSP)消除背景噪聲,其中采用模擬濾波器的方法,如圖1所示,模擬濾波器主要包括高通和低通兩種濾波器。高通濾波器可以濾掉噪音中語音通話不關(guān)注的低頻段部分,如低于200Hz以下的部分。低通濾波器可以濾掉噪音中語音通話不關(guān)注的高頻段部分,如高于4kHz以上的部分。
采用模擬濾波器方法的優(yōu)點(diǎn)在于實(shí)現(xiàn)簡(jiǎn)單,硬件成本低,功耗小。但它的明顯缺點(diǎn)是效果非常有限,應(yīng)用范圍相當(dāng)窄。因?yàn)樗荒苋コ肼曋械牡皖l和高頻部分,對(duì)于跟語音同頻段的噪聲無能為力。然而不幸的是,背景噪聲還主要集中在聽覺比較敏感的中頻段。
采用數(shù)字信號(hào)處理器(DSP)的方法,如圖2所示,麥克輸出的模擬信號(hào)經(jīng)模數(shù)(AD)變換成數(shù)字信號(hào);DSP根據(jù)一定算法處理后,將數(shù)字信號(hào)送到數(shù)模(DA)變換器;DA變換器將數(shù)字信號(hào)還原為模擬信號(hào),并將此信號(hào)送入說話者的手機(jī)。
DSP方法的優(yōu)點(diǎn)是靈活,應(yīng)用范圍廣,它能根據(jù)噪聲的特點(diǎn)(如頻譜分布、幅度分布以及其它的一些統(tǒng)計(jì)特征)采用不同的軟件算法,能實(shí)現(xiàn)相當(dāng)好的噪聲消除效果。但它的缺點(diǎn)是實(shí)現(xiàn)復(fù)雜,硬件成本高(需要AD,DA及DSP),功耗大。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種消除語音輸入中背景噪聲的方法及其裝置,能實(shí)現(xiàn)更好的性能代價(jià)比。
為了解決上述技術(shù)問題,本發(fā)明提供一種消除語音輸入中背景噪聲的方法,包括以下步驟(a)系統(tǒng)在收到模擬輸入的語音信號(hào)后,將所述信號(hào)變換成為數(shù)字語音信號(hào)采樣點(diǎn)序列;(b)計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì),得到一統(tǒng)計(jì)值;(c)如果所述統(tǒng)計(jì)值低于一設(shè)定噪聲門限,對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減,然后再將衰減后的采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出,否則,直接將原采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出。
進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述步驟(a)中,將所述信號(hào)變換為數(shù)字語音信號(hào)時(shí),先將輸入的模擬語音信號(hào)變換成為1位的過采樣率信號(hào),再對(duì)該信號(hào)進(jìn)行頻段壓縮濾波處理,變成1倍采樣率的多位數(shù)字信號(hào),從而濾除噪聲中的高頻段部分。
進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述步驟(a)中,在得到變成1倍采樣率的多位數(shù)字信號(hào)后,還讓該信號(hào)經(jīng)過一高通濾波器,以濾除噪聲中的低頻段部分。
進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述采樣點(diǎn)的能量值是用采樣點(diǎn)的幅度值或者功率值來表示的。
進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述步驟(b)中得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述步驟(c)中對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減時(shí),是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述設(shè)定的噪聲門限為10~20mV。
本發(fā)明還提供一種消除語音輸入中背景噪聲的裝置,包括模數(shù)變換模塊,幅度統(tǒng)計(jì)模塊,噪聲消除模塊以及數(shù)模變換模塊,其特征在于
所述模數(shù)變換模塊,用于將輸入的模擬語音信號(hào)變換為數(shù)字語音信號(hào),并分別輸出給噪聲消除模塊和幅度統(tǒng)計(jì)模塊;所述幅度統(tǒng)計(jì)模塊,用于計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì),得到一統(tǒng)計(jì)值,輸出到噪聲消除模塊;所述噪聲消除模塊,用于判斷所述統(tǒng)計(jì)值是否低于一設(shè)定噪聲門限,如果是,對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減,然后輸出到所述數(shù)模變換模塊,否則,直接將原采樣點(diǎn)序列輸出到所述數(shù)模變換模塊;所述數(shù)模變換模塊,用于輸入的衰減后的采樣點(diǎn)序列或者未經(jīng)衰減的采樣點(diǎn)序列變換成為模擬語音信號(hào)輸出。
進(jìn)一步地,上述裝置還可具有以下特點(diǎn)所述模數(shù)變換模塊進(jìn)一步包括西格碼-得爾塔變換模塊和頻段壓縮濾波模塊,其中所述西格碼-得爾塔變換模塊,用于將輸入的模擬語音信號(hào)經(jīng)過西格碼-得爾塔變換成為1位的過采樣率的數(shù)字信號(hào)輸出給頻段壓縮濾波模塊;所述頻段壓縮濾波模塊,用于將上述1位信號(hào)變成1倍采樣率的多位數(shù)字信號(hào)輸出。
進(jìn)一步地,上述裝置還可具有以下特點(diǎn)所述模數(shù)變換模塊進(jìn)一步包括高通濾波模塊,用于接收所述頻段壓縮濾波模塊輸出的數(shù)字信號(hào),濾除噪聲中的低頻段部分。
進(jìn)一步地,上述裝置還可具有以下特點(diǎn)所述幅度統(tǒng)計(jì)模塊得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
進(jìn)一步地,上述裝置還可具有以下特點(diǎn)所述噪聲消除模塊在進(jìn)行噪聲衰減時(shí),是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
綜上所述,采用本發(fā)明消除語音輸入中背景噪聲的方法及其裝置,本發(fā)明性能代價(jià)均處于現(xiàn)有兩種方案之間,但在本發(fā)明指定的范圍內(nèi)能實(shí)現(xiàn)比原方案更好的性能代價(jià)比。
圖1是現(xiàn)有采用模擬濾波器消除背景噪聲的裝置示意圖;圖2是現(xiàn)有采用DSP消除背景噪聲的裝置示意圖;圖3是本發(fā)明實(shí)施例裝置所應(yīng)用的系統(tǒng)的示意圖;圖4是本發(fā)明實(shí)施例AD變換模塊的示意圖。
具體實(shí)施例方式
本發(fā)明的目的主要是濾除人不說話時(shí)的環(huán)境噪聲,因?yàn)橐话闱闆r下背景噪音的幅度小于語音信號(hào)的幅度,因此認(rèn)為幅度很小的信號(hào)為背景噪聲,對(duì)小幅度信號(hào)進(jìn)行幅度衰減,從而達(dá)到消除噪聲的目的。
本實(shí)施例采用數(shù)字技術(shù),用硬件的方法實(shí)現(xiàn)噪聲的消除。如圖3所示,本實(shí)施例裝置包括AD變換模塊,幅度統(tǒng)計(jì)模塊,噪聲消除模塊以及DA變換模塊,其中AD變換模塊,用于將輸入的模擬語音信號(hào)變換為數(shù)字語音信號(hào),并分別輸出給噪聲消除模塊和幅度統(tǒng)計(jì)模塊。
幅度統(tǒng)計(jì)模塊,用于計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的幅值,統(tǒng)計(jì)出其中幅度的統(tǒng)計(jì)最大值(該最大值并不一定是實(shí)際的最大值,故稱為統(tǒng)計(jì)最大值),輸出到噪聲消除模塊。
噪聲消除模塊,用于比較幅度的統(tǒng)計(jì)最大值是否低于一設(shè)定噪聲門限,如果是,對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行幅度衰減,然后輸出到所述數(shù)模變換模塊,否則,直接將原采樣點(diǎn)序列輸出到所述數(shù)模變換模塊;數(shù)模變換模塊,用于將輸入的衰減后的采樣點(diǎn)序列或者未經(jīng)衰減的采樣點(diǎn)序列變換成為模擬語音信號(hào)輸出。
如圖4所示,本實(shí)施例的AD變換模塊還具有濾除噪聲中的低頻段部分和高頻段部分的功能,進(jìn)一步包括以下單元西格碼-得爾塔(SIGMA-DELTA)變換單元,用于將輸入的模擬語音信號(hào)經(jīng)過SIGMA-DELTA變換成為1位(BIT)的128倍過采樣率(也可以是64倍,256倍等等)的數(shù)字信號(hào)輸出給頻段壓縮濾波模塊;頻段壓縮濾波單元,用于將上述1BIT信號(hào)變成1倍采樣率的16BIT(可以根據(jù)需要設(shè)定,例如24BIT等)的數(shù)字信號(hào)輸出給高通濾波模塊;高通濾波單元,用于濾除噪聲中的低頻段部分。
語音信號(hào)經(jīng)上述西格碼-得爾塔變換單元和頻段壓縮單元處理后,能將高頻段噪聲壓縮到大于0.5倍采樣率的頻段,并將它濾除,因此使得AD變換模塊具有良好的低通特性。
本實(shí)施例中消除背景噪聲的方法,應(yīng)用于如圖3所示的語音處理系統(tǒng),包括以下步驟步驟一,系統(tǒng)收到輸入的模擬語音信號(hào)后,對(duì)其進(jìn)行AD變換,得到數(shù)字語音信號(hào)采樣點(diǎn)序列,并濾除噪聲中的高頻段和低頻段部分;在本實(shí)施例中,先將輸入的模擬語音信號(hào)經(jīng)過SIGMA-DELTA變換成為1BIT的過采樣率(128倍采樣率)的數(shù)字信號(hào),在將該1BIT信號(hào)變成1倍采樣率的16BIT的數(shù)字信號(hào)。
步驟二,計(jì)算出當(dāng)前采樣塊中采樣點(diǎn)幅度,并進(jìn)行統(tǒng)計(jì),得到幅度的統(tǒng)計(jì)最大值Emax;在本實(shí)施例中,利用以下算法獲得當(dāng)前采樣塊的幅度統(tǒng)計(jì)最大值Emax,但也可以采用任何其它算法。
假設(shè)e(n)為對(duì)應(yīng)于采樣點(diǎn)序列x(n)的幅度序列,x(n)為當(dāng)前的16BIT數(shù)據(jù),n=0,1,......,L-1,L為采樣塊包含的采樣點(diǎn)個(gè)數(shù),本實(shí)施例L=1024。
令e(0)=α|x(0)|,e(n)=α|x(n)|+(1-α)e(n-1);當(dāng)|x(n)|>e(n-1)為迅速上升段,α采用迅速上升段系數(shù)α_attack(用戶可通過寄存器來設(shè)置此系數(shù)),否則,α采用非迅速上升段系數(shù)α_non_attack(用戶可通過寄存器來設(shè)置此系數(shù));然后計(jì)算該采樣塊各采樣點(diǎn)幅度中的統(tǒng)計(jì)最大值Emax=Max(e(n))。
步驟三,如果得到的Emax低于一設(shè)定門限值noise_threshold,對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行幅度衰減,然后再將衰減后的采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出,否則,直接將原采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出。
在本實(shí)施例中,如果Emax<noise_threshold(noise_threshold為設(shè)定的噪聲門限,該門限可由用戶自行設(shè)定,范圍較佳在10~20mV。則調(diào)整輸出的采樣點(diǎn)的幅度為其原幅度乘以Emax再除以noise_threshold。從而達(dá)到衰減噪聲的目的。
在本發(fā)明的另一個(gè)實(shí)施例中,當(dāng)Emax<noise_threshold時(shí),可以令噪音消除后的數(shù)字信號(hào)為0,但是這種處理使得說話者的尾音突然中斷,令聽者感覺不好,而上述衰減噪聲的方法,則可以令說話者的尾音逐漸變小,是更為人性化的設(shè)計(jì)。
在上述實(shí)施例的基礎(chǔ)上,也可以各種其它的變換方式,如改為計(jì)算采樣點(diǎn)的功率,用信號(hào)功率代替信號(hào)幅度進(jìn)行判決,效果是一樣的,事實(shí)上反映的都是信號(hào)的能量。另外,本發(fā)明也不局限于實(shí)施例中的判斷規(guī)則,例如,可以取數(shù)字語音信號(hào)采樣點(diǎn)序列中幅度最大的M個(gè)采樣點(diǎn)的幅度(或功率)進(jìn)行平均后,再來與一個(gè)門限比較,如大于該門限,再進(jìn)行信號(hào)幅度的衰減,也是可以的,M可以取固定數(shù),或者采樣塊長(zhǎng)度的比值,等等。而在衰減時(shí),也可以將幅度降為原幅度的其它小于1的值,如1/4等,不過自適應(yīng)性相對(duì)要差一點(diǎn)。
權(quán)利要求
1.一種消除語音輸入中背景噪聲的方法,包括以下步驟(a)系統(tǒng)在收到模擬輸入的語音信號(hào)后,將所述信號(hào)變換成為數(shù)字語音信號(hào)采樣點(diǎn)序列;(b)計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì),得到一統(tǒng)計(jì)值;(c)如果所述統(tǒng)計(jì)值低于一設(shè)定噪聲門限,對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減,然后再將衰減后的采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出,否則,直接將原采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟(a)中,將所述信號(hào)變換為數(shù)字語音信號(hào)時(shí),先將輸入的模擬語音信號(hào)變換成為1位的過采樣率信號(hào),再對(duì)該信號(hào)進(jìn)行頻段壓縮濾波處理,變成1倍采樣率的多位數(shù)字信號(hào),從而濾除噪聲中的高頻段部分。
3.如權(quán)利要求2所述的方法,其特征在于,所述步驟(a)中,在得到變成1倍采樣率的多位數(shù)字信號(hào)后,還讓該信號(hào)經(jīng)過一高通濾波器,以濾除噪聲中的低頻段部分。
4.如權(quán)利要求1所述的方法,其特征在于,所述采樣點(diǎn)的能量值是用采樣點(diǎn)的幅度值或者功率值來表示的。
5.如權(quán)利要求4所述的方法,其特征在于,所述步驟(b)中得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
6.如權(quán)利要求5所述的方法,其特征在于,所述步驟(c)中對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減時(shí),是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
7.如權(quán)利要求5所述的方法,其特征在于,所述設(shè)定的噪聲門限為10~20mV。
8.一種消除語音輸入中背景噪聲的裝置,包括模數(shù)變換模塊,幅度統(tǒng)計(jì)模塊,噪聲消除模塊以及數(shù)模變換模塊,其特征在于所述模數(shù)變換模塊,用于將輸入的模擬語音信號(hào)變換為數(shù)字語音信號(hào),并分別輸出給噪聲消除模塊和幅度統(tǒng)計(jì)模塊;所述幅度統(tǒng)計(jì)模塊,用于計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì),得到一統(tǒng)計(jì)值,輸出到噪聲消除模塊;所述噪聲消除模塊,用于判斷所述統(tǒng)計(jì)值是否低于一設(shè)定噪聲門限,如果是,對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減,然后輸出到所述數(shù)模變換模塊,否則,直接將原采樣點(diǎn)序列輸出到所述數(shù)模變換模塊;所述數(shù)模變換模塊,用于輸入的衰減后的采樣點(diǎn)序列或者未經(jīng)衰減的采樣點(diǎn)序列變換成為模擬語音信號(hào)輸出。
9.如權(quán)利要求8所述的裝置,其特征在于,所述模數(shù)變換模塊進(jìn)一步包括西格碼-得爾塔變換模塊和頻段壓縮濾波模塊,其中所述西格碼-得爾塔變換模塊,用于將輸入的模擬語音信號(hào)經(jīng)過西格碼-得爾塔變換成為1位的過采樣率的數(shù)字信號(hào)輸出給頻段壓縮濾波模塊;所述頻段壓縮濾波模塊,用于將上述1位信號(hào)變成1倍采樣率的多位數(shù)字信號(hào)輸出。
10.如權(quán)利要求9所述的裝置,其特征在于,所述模數(shù)變換模塊進(jìn)一步包括高通濾波模塊,用于接收所述頻段壓縮濾波模塊輸出的數(shù)字信號(hào),濾除噪聲中的低頻段部分。
11.如權(quán)利要求8所述的方法,其特征在于,所述幅度統(tǒng)計(jì)模塊得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
12.如權(quán)利要求8所述的方法,其特征在于,所述噪聲消除模塊在進(jìn)行噪聲衰減時(shí),是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
全文摘要
本發(fā)明公開一種消除語音輸入中背景噪聲的方法及其裝置,其中模數(shù)變換模塊在收到模擬輸入的語音信號(hào)后,將所述信號(hào)變換成為數(shù)字語音信號(hào)采樣點(diǎn)序列;幅度統(tǒng)計(jì)模塊計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì),得到一統(tǒng)計(jì)值;如果所述統(tǒng)計(jì)值低于一設(shè)定噪聲門限,噪聲消除模塊對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減,然后再將衰減后的采樣點(diǎn)序列經(jīng)數(shù)模變換模塊轉(zhuǎn)換為模擬語音信號(hào)輸出,否則,噪聲消除模塊直接將原采樣點(diǎn)序列經(jīng)數(shù)模變換模塊轉(zhuǎn)換為模擬語音信號(hào)輸出。采用本發(fā)明方法消除語音輸入中的背景噪聲,能實(shí)現(xiàn)更好的性能代價(jià)比。
文檔編號(hào)H04M9/08GK1822092SQ20061001157
公開日2006年8月23日 申請(qǐng)日期2006年3月28日 優(yōu)先權(quán)日2006年3月28日
發(fā)明者楊作興 申請(qǐng)人:北京中星微電子有限公司