一種消除語音輸入中背景噪聲的方法及其裝置的制作方法

文檔序號(hào)：7953104閱讀：266來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種消除語音輸入中背景噪聲的方法及其裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種消除語音輸入中背景噪聲的方法及其裝置。
背景技術(shù)：
針對(duì)語音通話中的背景噪聲問題，目前主要有兩種解決方法采用模擬濾波器消除背景噪聲和采用數(shù)字信號(hào)處理器(DSP)消除背景噪聲，其中采用模擬濾波器的方法，如圖1所示，模擬濾波器主要包括高通和低通兩種濾波器。高通濾波器可以濾掉噪音中語音通話不關(guān)注的低頻段部分，如低于200Hz以下的部分。低通濾波器可以濾掉噪音中語音通話不關(guān)注的高頻段部分，如高于4kHz以上的部分。
采用模擬濾波器方法的優(yōu)點(diǎn)在于實(shí)現(xiàn)簡(jiǎn)單，硬件成本低，功耗小。但它的明顯缺點(diǎn)是效果非常有限，應(yīng)用范圍相當(dāng)窄。因?yàn)樗荒苋コ肼曋械牡皖l和高頻部分，對(duì)于跟語音同頻段的噪聲無能為力。然而不幸的是，背景噪聲還主要集中在聽覺比較敏感的中頻段。
采用數(shù)字信號(hào)處理器(DSP)的方法，如圖2所示，麥克輸出的模擬信號(hào)經(jīng)模數(shù)(AD)變換成數(shù)字信號(hào)；DSP根據(jù)一定算法處理后，將數(shù)字信號(hào)送到數(shù)模(DA)變換器；DA變換器將數(shù)字信號(hào)還原為模擬信號(hào)，并將此信號(hào)送入說話者的手機(jī)。
DSP方法的優(yōu)點(diǎn)是靈活，應(yīng)用范圍廣，它能根據(jù)噪聲的特點(diǎn)(如頻譜分布、幅度分布以及其它的一些統(tǒng)計(jì)特征)采用不同的軟件算法，能實(shí)現(xiàn)相當(dāng)好的噪聲消除效果。但它的缺點(diǎn)是實(shí)現(xiàn)復(fù)雜，硬件成本高(需要AD，DA及DSP)，功耗大。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種消除語音輸入中背景噪聲的方法及其裝置，能實(shí)現(xiàn)更好的性能代價(jià)比。
為了解決上述技術(shù)問題，本發(fā)明提供一種消除語音輸入中背景噪聲的方法，包括以下步驟(a)系統(tǒng)在收到模擬輸入的語音信號(hào)后，將所述信號(hào)變換成為數(shù)字語音信號(hào)采樣點(diǎn)序列；(b)計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì)，得到一統(tǒng)計(jì)值；(c)如果所述統(tǒng)計(jì)值低于一設(shè)定噪聲門限，對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減，然后再將衰減后的采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出，否則，直接將原采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出。
進(jìn)一步地，上述方法還可具有以下特點(diǎn)所述步驟(a)中，將所述信號(hào)變換為數(shù)字語音信號(hào)時(shí)，先將輸入的模擬語音信號(hào)變換成為1位的過采樣率信號(hào)，再對(duì)該信號(hào)進(jìn)行頻段壓縮濾波處理，變成1倍采樣率的多位數(shù)字信號(hào)，從而濾除噪聲中的高頻段部分。
進(jìn)一步地，上述方法還可具有以下特點(diǎn)所述步驟(a)中，在得到變成1倍采樣率的多位數(shù)字信號(hào)后，還讓該信號(hào)經(jīng)過一高通濾波器，以濾除噪聲中的低頻段部分。
進(jìn)一步地，上述方法還可具有以下特點(diǎn)所述采樣點(diǎn)的能量值是用采樣點(diǎn)的幅度值或者功率值來表示的。
進(jìn)一步地，上述方法還可具有以下特點(diǎn)所述步驟(b)中得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
進(jìn)一步地，上述方法還可具有以下特點(diǎn)所述步驟(c)中對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減時(shí)，是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
進(jìn)一步地，上述方法還可具有以下特點(diǎn)所述設(shè)定的噪聲門限為10～20mV。
本發(fā)明還提供一種消除語音輸入中背景噪聲的裝置，包括模數(shù)變換模塊，幅度統(tǒng)計(jì)模塊，噪聲消除模塊以及數(shù)模變換模塊，其特征在于
所述模數(shù)變換模塊，用于將輸入的模擬語音信號(hào)變換為數(shù)字語音信號(hào)，并分別輸出給噪聲消除模塊和幅度統(tǒng)計(jì)模塊；所述幅度統(tǒng)計(jì)模塊，用于計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì)，得到一統(tǒng)計(jì)值，輸出到噪聲消除模塊；所述噪聲消除模塊，用于判斷所述統(tǒng)計(jì)值是否低于一設(shè)定噪聲門限，如果是，對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減，然后輸出到所述數(shù)模變換模塊，否則，直接將原采樣點(diǎn)序列輸出到所述數(shù)模變換模塊；所述數(shù)模變換模塊，用于輸入的衰減后的采樣點(diǎn)序列或者未經(jīng)衰減的采樣點(diǎn)序列變換成為模擬語音信號(hào)輸出。
進(jìn)一步地，上述裝置還可具有以下特點(diǎn)所述模數(shù)變換模塊進(jìn)一步包括西格碼-得爾塔變換模塊和頻段壓縮濾波模塊，其中所述西格碼-得爾塔變換模塊，用于將輸入的模擬語音信號(hào)經(jīng)過西格碼-得爾塔變換成為1位的過采樣率的數(shù)字信號(hào)輸出給頻段壓縮濾波模塊；所述頻段壓縮濾波模塊，用于將上述1位信號(hào)變成1倍采樣率的多位數(shù)字信號(hào)輸出。
進(jìn)一步地，上述裝置還可具有以下特點(diǎn)所述模數(shù)變換模塊進(jìn)一步包括高通濾波模塊，用于接收所述頻段壓縮濾波模塊輸出的數(shù)字信號(hào)，濾除噪聲中的低頻段部分。
進(jìn)一步地，上述裝置還可具有以下特點(diǎn)所述幅度統(tǒng)計(jì)模塊得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
進(jìn)一步地，上述裝置還可具有以下特點(diǎn)所述噪聲消除模塊在進(jìn)行噪聲衰減時(shí)，是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
綜上所述，采用本發(fā)明消除語音輸入中背景噪聲的方法及其裝置，本發(fā)明性能代價(jià)均處于現(xiàn)有兩種方案之間，但在本發(fā)明指定的范圍內(nèi)能實(shí)現(xiàn)比原方案更好的性能代價(jià)比。

圖1是現(xiàn)有采用模擬濾波器消除背景噪聲的裝置示意圖；圖2是現(xiàn)有采用DSP消除背景噪聲的裝置示意圖；圖3是本發(fā)明實(shí)施例裝置所應(yīng)用的系統(tǒng)的示意圖；圖4是本發(fā)明實(shí)施例AD變換模塊的示意圖。
具體實(shí)施例方式
本發(fā)明的目的主要是濾除人不說話時(shí)的環(huán)境噪聲，因?yàn)橐话闱闆r下背景噪音的幅度小于語音信號(hào)的幅度，因此認(rèn)為幅度很小的信號(hào)為背景噪聲，對(duì)小幅度信號(hào)進(jìn)行幅度衰減，從而達(dá)到消除噪聲的目的。
本實(shí)施例采用數(shù)字技術(shù)，用硬件的方法實(shí)現(xiàn)噪聲的消除。如圖3所示，本實(shí)施例裝置包括AD變換模塊，幅度統(tǒng)計(jì)模塊，噪聲消除模塊以及DA變換模塊，其中AD變換模塊，用于將輸入的模擬語音信號(hào)變換為數(shù)字語音信號(hào)，并分別輸出給噪聲消除模塊和幅度統(tǒng)計(jì)模塊。
幅度統(tǒng)計(jì)模塊，用于計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的幅值，統(tǒng)計(jì)出其中幅度的統(tǒng)計(jì)最大值(該最大值并不一定是實(shí)際的最大值，故稱為統(tǒng)計(jì)最大值)，輸出到噪聲消除模塊。
噪聲消除模塊，用于比較幅度的統(tǒng)計(jì)最大值是否低于一設(shè)定噪聲門限，如果是，對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行幅度衰減，然后輸出到所述數(shù)模變換模塊，否則，直接將原采樣點(diǎn)序列輸出到所述數(shù)模變換模塊；數(shù)模變換模塊，用于將輸入的衰減后的采樣點(diǎn)序列或者未經(jīng)衰減的采樣點(diǎn)序列變換成為模擬語音信號(hào)輸出。
如圖4所示，本實(shí)施例的AD變換模塊還具有濾除噪聲中的低頻段部分和高頻段部分的功能，進(jìn)一步包括以下單元西格碼-得爾塔(SIGMA-DELTA)變換單元，用于將輸入的模擬語音信號(hào)經(jīng)過SIGMA-DELTA變換成為1位(BIT)的128倍過采樣率(也可以是64倍，256倍等等)的數(shù)字信號(hào)輸出給頻段壓縮濾波模塊；頻段壓縮濾波單元，用于將上述1BIT信號(hào)變成1倍采樣率的16BIT(可以根據(jù)需要設(shè)定，例如24BIT等)的數(shù)字信號(hào)輸出給高通濾波模塊；高通濾波單元，用于濾除噪聲中的低頻段部分。
語音信號(hào)經(jīng)上述西格碼-得爾塔變換單元和頻段壓縮單元處理后，能將高頻段噪聲壓縮到大于0.5倍采樣率的頻段，并將它濾除，因此使得AD變換模塊具有良好的低通特性。
本實(shí)施例中消除背景噪聲的方法，應(yīng)用于如圖3所示的語音處理系統(tǒng)，包括以下步驟步驟一，系統(tǒng)收到輸入的模擬語音信號(hào)后，對(duì)其進(jìn)行AD變換，得到數(shù)字語音信號(hào)采樣點(diǎn)序列，并濾除噪聲中的高頻段和低頻段部分；在本實(shí)施例中，先將輸入的模擬語音信號(hào)經(jīng)過SIGMA-DELTA變換成為1BIT的過采樣率(128倍采樣率)的數(shù)字信號(hào)，在將該1BIT信號(hào)變成1倍采樣率的16BIT的數(shù)字信號(hào)。
步驟二，計(jì)算出當(dāng)前采樣塊中采樣點(diǎn)幅度，并進(jìn)行統(tǒng)計(jì)，得到幅度的統(tǒng)計(jì)最大值Emax；在本實(shí)施例中，利用以下算法獲得當(dāng)前采樣塊的幅度統(tǒng)計(jì)最大值Emax，但也可以采用任何其它算法。
假設(shè)e(n)為對(duì)應(yīng)于采樣點(diǎn)序列x(n)的幅度序列，x(n)為當(dāng)前的16BIT數(shù)據(jù)，n＝0，1，......，L-1，L為采樣塊包含的采樣點(diǎn)個(gè)數(shù)，本實(shí)施例L＝1024。
令e(0)＝α|x(0)|，e(n)＝α|x(n)|+(1-α)e(n-1)；當(dāng)|x(n)|＞e(n-1)為迅速上升段，α采用迅速上升段系數(shù)α_attack(用戶可通過寄存器來設(shè)置此系數(shù))，否則，α采用非迅速上升段系數(shù)α_non_attack(用戶可通過寄存器來設(shè)置此系數(shù))；然后計(jì)算該采樣塊各采樣點(diǎn)幅度中的統(tǒng)計(jì)最大值Emax＝Max(e(n))。
步驟三，如果得到的Emax低于一設(shè)定門限值noise_threshold，對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行幅度衰減，然后再將衰減后的采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出，否則，直接將原采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出。
在本實(shí)施例中，如果Emax＜noise_threshold(noise_threshold為設(shè)定的噪聲門限，該門限可由用戶自行設(shè)定，范圍較佳在10～20mV。則調(diào)整輸出的采樣點(diǎn)的幅度為其原幅度乘以Emax再除以noise_threshold。從而達(dá)到衰減噪聲的目的。
在本發(fā)明的另一個(gè)實(shí)施例中，當(dāng)Emax＜noise_threshold時(shí)，可以令噪音消除后的數(shù)字信號(hào)為0，但是這種處理使得說話者的尾音突然中斷，令聽者感覺不好，而上述衰減噪聲的方法，則可以令說話者的尾音逐漸變小，是更為人性化的設(shè)計(jì)。
在上述實(shí)施例的基礎(chǔ)上，也可以各種其它的變換方式，如改為計(jì)算采樣點(diǎn)的功率，用信號(hào)功率代替信號(hào)幅度進(jìn)行判決，效果是一樣的，事實(shí)上反映的都是信號(hào)的能量。另外，本發(fā)明也不局限于實(shí)施例中的判斷規(guī)則，例如，可以取數(shù)字語音信號(hào)采樣點(diǎn)序列中幅度最大的M個(gè)采樣點(diǎn)的幅度(或功率)進(jìn)行平均后，再來與一個(gè)門限比較，如大于該門限，再進(jìn)行信號(hào)幅度的衰減，也是可以的，M可以取固定數(shù)，或者采樣塊長(zhǎng)度的比值，等等。而在衰減時(shí)，也可以將幅度降為原幅度的其它小于1的值，如1/4等，不過自適應(yīng)性相對(duì)要差一點(diǎn)。
權(quán)利要求
1.一種消除語音輸入中背景噪聲的方法，包括以下步驟(a)系統(tǒng)在收到模擬輸入的語音信號(hào)后，將所述信號(hào)變換成為數(shù)字語音信號(hào)采樣點(diǎn)序列；(b)計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì)，得到一統(tǒng)計(jì)值；(c)如果所述統(tǒng)計(jì)值低于一設(shè)定噪聲門限，對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減，然后再將衰減后的采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出，否則，直接將原采樣點(diǎn)序列轉(zhuǎn)換為模擬語音信號(hào)輸出。
2.如權(quán)利要求1所述的方法，其特征在于，所述步驟(a)中，將所述信號(hào)變換為數(shù)字語音信號(hào)時(shí)，先將輸入的模擬語音信號(hào)變換成為1位的過采樣率信號(hào)，再對(duì)該信號(hào)進(jìn)行頻段壓縮濾波處理，變成1倍采樣率的多位數(shù)字信號(hào)，從而濾除噪聲中的高頻段部分。
3.如權(quán)利要求2所述的方法，其特征在于，所述步驟(a)中，在得到變成1倍采樣率的多位數(shù)字信號(hào)后，還讓該信號(hào)經(jīng)過一高通濾波器，以濾除噪聲中的低頻段部分。
4.如權(quán)利要求1所述的方法，其特征在于，所述采樣點(diǎn)的能量值是用采樣點(diǎn)的幅度值或者功率值來表示的。
5.如權(quán)利要求4所述的方法，其特征在于，所述步驟(b)中得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
6.如權(quán)利要求5所述的方法，其特征在于，所述步驟(c)中對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減時(shí)，是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
7.如權(quán)利要求5所述的方法，其特征在于，所述設(shè)定的噪聲門限為10～20mV。
8.一種消除語音輸入中背景噪聲的裝置，包括模數(shù)變換模塊，幅度統(tǒng)計(jì)模塊，噪聲消除模塊以及數(shù)模變換模塊，其特征在于所述模數(shù)變換模塊，用于將輸入的模擬語音信號(hào)變換為數(shù)字語音信號(hào)，并分別輸出給噪聲消除模塊和幅度統(tǒng)計(jì)模塊；所述幅度統(tǒng)計(jì)模塊，用于計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì)，得到一統(tǒng)計(jì)值，輸出到噪聲消除模塊；所述噪聲消除模塊，用于判斷所述統(tǒng)計(jì)值是否低于一設(shè)定噪聲門限，如果是，對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減，然后輸出到所述數(shù)模變換模塊，否則，直接將原采樣點(diǎn)序列輸出到所述數(shù)模變換模塊；所述數(shù)模變換模塊，用于輸入的衰減后的采樣點(diǎn)序列或者未經(jīng)衰減的采樣點(diǎn)序列變換成為模擬語音信號(hào)輸出。
9.如權(quán)利要求8所述的裝置，其特征在于，所述模數(shù)變換模塊進(jìn)一步包括西格碼-得爾塔變換模塊和頻段壓縮濾波模塊，其中所述西格碼-得爾塔變換模塊，用于將輸入的模擬語音信號(hào)經(jīng)過西格碼-得爾塔變換成為1位的過采樣率的數(shù)字信號(hào)輸出給頻段壓縮濾波模塊；所述頻段壓縮濾波模塊，用于將上述1位信號(hào)變成1倍采樣率的多位數(shù)字信號(hào)輸出。
10.如權(quán)利要求9所述的裝置，其特征在于，所述模數(shù)變換模塊進(jìn)一步包括高通濾波模塊，用于接收所述頻段壓縮濾波模塊輸出的數(shù)字信號(hào)，濾除噪聲中的低頻段部分。
11.如權(quán)利要求8所述的方法，其特征在于，所述幅度統(tǒng)計(jì)模塊得到的所述統(tǒng)計(jì)值是指當(dāng)前采樣塊各采樣點(diǎn)的幅度或功率中的統(tǒng)計(jì)最大值。
12.如權(quán)利要求8所述的方法，其特征在于，所述噪聲消除模塊在進(jìn)行噪聲衰減時(shí)，是將輸出采樣點(diǎn)的幅度調(diào)整為其原幅度乘以所述幅度或功率中的統(tǒng)計(jì)最大值再除以所述噪聲門限值。
全文摘要
本發(fā)明公開一種消除語音輸入中背景噪聲的方法及其裝置，其中模數(shù)變換模塊在收到模擬輸入的語音信號(hào)后，將所述信號(hào)變換成為數(shù)字語音信號(hào)采樣點(diǎn)序列；幅度統(tǒng)計(jì)模塊計(jì)算出當(dāng)前采樣塊各采樣點(diǎn)的能量值并進(jìn)行統(tǒng)計(jì)，得到一統(tǒng)計(jì)值；如果所述統(tǒng)計(jì)值低于一設(shè)定噪聲門限，噪聲消除模塊對(duì)當(dāng)前采樣塊的采樣點(diǎn)進(jìn)行噪聲衰減，然后再將衰減后的采樣點(diǎn)序列經(jīng)數(shù)模變換模塊轉(zhuǎn)換為模擬語音信號(hào)輸出，否則，噪聲消除模塊直接將原采樣點(diǎn)序列經(jīng)數(shù)模變換模塊轉(zhuǎn)換為模擬語音信號(hào)輸出。采用本發(fā)明方法消除語音輸入中的背景噪聲，能實(shí)現(xiàn)更好的性能代價(jià)比。
文檔編號(hào)H04M9/08GK1822092SQ20061001157
公開日2006年8月23日申請(qǐng)日期2006年3月28日優(yōu)先權(quán)日2006年3月28日
發(fā)明者楊作興申請(qǐng)人:北京中星微電子有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊作興
技術(shù)所有人：北京中星微電子有限公司
我是此專利的發(fā)明人

上一篇：一種網(wǎng)絡(luò)認(rèn)證方法
上一篇：一種改進(jìn)的在移動(dòng)終端上發(fā)送和接收語音信息的方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

消除噪聲的方法相關(guān)技術(shù)

搜狗語音輸入使用方法相關(guān)技術(shù)

電話噪聲消除相關(guān)技術(shù)

iphone電話噪聲消除相關(guān)技術(shù)

噪聲消除相關(guān)技術(shù)

電話噪聲消除有什么用相關(guān)技術(shù)

視頻噪聲消除軟件相關(guān)技術(shù)

matlab消除噪聲相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種消除語音輸入中背景噪聲的方法及其裝置的制作方法