两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

利用頻譜減除的雙拾音器信號(hào)降噪系統(tǒng)和方法

文檔序號(hào):7598421閱讀:1622來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):利用頻譜減除的雙拾音器信號(hào)降噪系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明與通信系統(tǒng)有關(guān),特別是與減小通信信號(hào)中的破壞性背景噪聲分量的影響的方法和設(shè)備有關(guān)。
背景技術(shù)
現(xiàn)在,技術(shù)和用戶(hù)要求生產(chǎn)體積趨小的移動(dòng)電話機(jī)。隨著移動(dòng)電話機(jī)越來(lái)越小,拾音器的位置在使用期間越來(lái)越離開(kāi)說(shuō)話者(近端用戶(hù))的嘴。這種距離的增大就更需要語(yǔ)音增強(qiáng)來(lái)抑制被拾音器拾取、發(fā)送給遠(yuǎn)端用戶(hù)的破壞性背景噪聲。也就是說(shuō),由于使用新的小移動(dòng)電話機(jī)時(shí)拾音器與近端用戶(hù)之間的距離比較大,因此拾音器所拾取的不僅是近端用戶(hù)的語(yǔ)音,而且還有近端用戶(hù)處的任何噪聲。例如,近端拾音器通常拾取諸如周?chē)慕煌ā⒌缆泛涂团撛肼?、室?nèi)噪聲之類(lèi)的聲音。所得到的有噪聲的近端語(yǔ)音對(duì)于遠(yuǎn)端用戶(hù)來(lái)說(shuō)可能是很討厭的,甚至是無(wú)法忍受的。因此所希望的的是盡可能減小背景噪聲,最好在近端信號(hào)處理鏈中及早處理(例如,在接收到的近端拾音器信號(hào)加到近端語(yǔ)音編碼器前處理)。
為了抑制背景噪聲,一些電話系統(tǒng)包括一個(gè)降噪處理器,用來(lái)消除加在近端信號(hào)處理鏈輸入端上的背景噪聲。

圖1為這樣的一個(gè)系統(tǒng)100的總體方框圖。在圖1中,降噪處理器110設(shè)置在拾音器120的輸出端與近端信號(hào)處理通路(未示出)的輸入端之間。在工作中,降噪處理器110接收來(lái)自拾音器120的有噪聲的語(yǔ)音信號(hào)x,加以處理后提供較干凈的噪聲減小了的語(yǔ)音信號(hào)sNR,通過(guò)近端信號(hào)處理鏈,最終送至遠(yuǎn)端用戶(hù)。
一種眾所周知的實(shí)現(xiàn)圖1的降噪處理器110的方法在這個(gè)技術(shù)領(lǐng)域內(nèi)稱(chēng)為頻譜減除(Spectral Subtraction)。例如可參見(jiàn)S.F.Boll的“利用頻譜減除抑制語(yǔ)音中的音頻噪聲”(“Suppression of AcousticNoise in Speech using Spectral Subtraction”,IEEE Trans.Acoust.Speech and Sig.Proc.,27113-120,1979),該文在此列作參考全面引用。概括地說(shuō),頻譜減除利用對(duì)噪聲譜和有噪聲的語(yǔ)音譜的估計(jì)形成一個(gè)基于信噪比(SNR)的增益函數(shù),用它乘以輸入頻譜來(lái)抑制SNR低的頻率。雖然頻譜減除確實(shí)提供了值得注意的降噪,但是它也有一些眾所周知的缺點(diǎn)。例如,頻譜減除的輸出信號(hào)通常含有在這個(gè)技術(shù)領(lǐng)域中稱(chēng)為樂(lè)音的不自然現(xiàn)象。此外,經(jīng)處理的信號(hào)塊之間的不連續(xù)點(diǎn)往往導(dǎo)致從遠(yuǎn)端用戶(hù)看來(lái)語(yǔ)音質(zhì)量有所下降。
近年來(lái)已經(jīng)研究了許多對(duì)這種基本的頻譜減除方法的改進(jìn)措施。例如參見(jiàn)N.Virage的“基于聽(tīng)覺(jué)系統(tǒng)的遮蔽特性的語(yǔ)音增強(qiáng)”(“SpeechEnhancement Based on Masking Properties of the Auditory System” ,IEEE ICASSP.Proc.796-799 vol.1,1995),D.Tsoukalas、M.Paraskevas和J.Mourjopoulos的“應(yīng)用心理聲學(xué)準(zhǔn)則的語(yǔ)音增強(qiáng)”(“Speech Enhancement using Psychoacoustic Criteria”,IEEE ICASSP.Proc.,359-362 vol.2,1993),F(xiàn).Xie和D.Van Compernolle的“利用頻譜幅度估計(jì)的語(yǔ)音增強(qiáng),一種統(tǒng)一的方法”(“Speech Enhancementby Spectral Magnitude Estimation-A Unifying Approach”),IEEESpeech Communication,89-104 vol.19,1996),R.Martin的“基于頻譜減除的最小統(tǒng)計(jì)特性”(“Spectral Subtraction Based onMinimum Statistics”,UESIPCO,Proc.,1182-1185 vol;2,1994),以及J.A.Heinen的“改進(jìn)被有色、非平穩(wěn)噪聲污染的語(yǔ)音的頻譜減除方法”(“A Spectral Subtraction Method for Enhancement of SpeechCorrupted by Nonwhite,Nonstationary Noise”,IEEE IECON.Proc.,872-877 vol.2,1995)。
新近,頻譜減除已經(jīng)用正確的卷積和取決于頻譜的指數(shù)增益函數(shù)平均來(lái)實(shí)現(xiàn)。在1998年5月27日遞交的共同待決美國(guó)專(zhuān)利申請(qǐng)No.09/084,387“利用線性卷積和因果濾波器的頻譜減除減小信號(hào)噪聲”(“Signal Noise Reduction by Spectral Subtraction using LinearConvolution and Causal Filtering”)和也是1998年5月27日遞交的共同待決美國(guó)專(zhuān)利申請(qǐng)No.09/084,503“利用取決于頻譜的指數(shù)增益函數(shù)平均的頻譜減除減小信號(hào)噪聲”(“Signal Noise Reduction bySpectral Subtraction using Spectrum Dependent Exponential GainFunction Averaging”)中揭示了這些技術(shù)。
頻譜減除利用了兩個(gè)頻譜估計(jì),一個(gè)是對(duì)“受擾”信號(hào)的而一個(gè)是對(duì)“干擾”信號(hào)的,形成一個(gè)基于信噪比(SNR)的增益函數(shù)。受擾頻譜乘以這個(gè)增益函數(shù)就可以提高頻譜的SNR。在諸如配合免提電話機(jī)使用的單拾音器頻譜減除應(yīng)用中,根據(jù)干擾的背景噪聲增強(qiáng)語(yǔ)音。噪聲在語(yǔ)音間歇期期間估計(jì),或者用一個(gè)在語(yǔ)音期期間的噪聲模型估計(jì)。這意味著噪聲必須是平穩(wěn)的,在語(yǔ)音期期間具有類(lèi)似的性質(zhì),或者模型適合于活動(dòng)的背景噪聲。不幸的是,對(duì)于大多數(shù)日常環(huán)境中的大多數(shù)背景噪聲,情況都不是這樣。
因此,有必要開(kāi)發(fā)一種采用頻譜減除技術(shù)的降噪系統(tǒng),可以適合在有大多數(shù)日常的可變背景噪聲的環(huán)境中使用。
發(fā)明概要本發(fā)明通過(guò)在一個(gè)雙拾音器系統(tǒng)內(nèi)提供用頻譜減除執(zhí)行降噪的方法和設(shè)備滿(mǎn)足了以上所述及其他一些需要。按照一些示范性的實(shí)施例,在用一個(gè)遠(yuǎn)嘴拾音器與一個(gè)近嘴拾音器配合時(shí),只要可以不斷地從單個(gè)輸入樣點(diǎn)塊估計(jì)出噪聲譜就能處理非平穩(wěn)的背景噪聲。遠(yuǎn)嘴拾音器除拾取背景噪聲之外,還拾取說(shuō)話者的語(yǔ)音,但所得到的電平比近嘴拾音器的低。為了加強(qiáng)噪聲估計(jì),用一個(gè)頻譜減除級(jí)來(lái)抑制遠(yuǎn)嘴拾音器信號(hào)內(nèi)的語(yǔ)音。為了能加強(qiáng)噪聲估計(jì),用另一個(gè)頻譜減除級(jí)根據(jù)近嘴信號(hào)形成一個(gè)粗語(yǔ)音估計(jì)。最后,用一個(gè)第三頻譜減除級(jí)用加強(qiáng)的背景噪聲估計(jì)抑制背景噪聲來(lái)增強(qiáng)近嘴信號(hào)。
以下將結(jié)合附圖所示的一些例示性例子詳細(xì)說(shuō)明本發(fā)明的以上所述及其他一些特性和優(yōu)點(diǎn)。熟悉該技術(shù)領(lǐng)域的人員可以理解,在這里所揭示的這些實(shí)施例只是為了說(shuō)明本發(fā)明從而能更好地理解本發(fā)明,因此可以想象本發(fā)明有許多等效的具體實(shí)現(xiàn)方式。
附圖簡(jiǎn)要說(shuō)明圖1為一個(gè)可以實(shí)現(xiàn)頻譜減除的降噪系統(tǒng)的方框圖;圖2示出了一個(gè)傳統(tǒng)的頻譜減除降噪處理器;圖3-4示出了按照本發(fā)明的示范性實(shí)施例設(shè)計(jì)的示范性的頻譜減除降噪處理器;圖5示出了在本發(fā)明的一個(gè)示范性的實(shí)施例中近嘴和遠(yuǎn)嘴拾音器的布置情況;圖6示出了一個(gè)示范性的雙拾音器頻譜減除系統(tǒng);以及圖7示出了一個(gè)用于本發(fā)明的一個(gè)示范性的實(shí)施例的示范性的頻譜減除級(jí)。
發(fā)明詳細(xì)說(shuō)明為了理解本發(fā)明的各個(gè)特色和優(yōu)點(diǎn),首先來(lái)看一下傳統(tǒng)的頻譜減除技術(shù)是有益的。概括地說(shuō),頻譜減除建立在通信應(yīng)用中的噪聲信號(hào)和語(yǔ)音信號(hào)都是隨機(jī)和不相關(guān)的、相加后形成有噪聲的語(yǔ)音信號(hào)的假設(shè)上。例如,如果s(n)、w(n)和x(n)分別表示語(yǔ)音、噪聲和有噪聲的語(yǔ)音的短期統(tǒng)計(jì)平穩(wěn)的過(guò)程,于是有x(n)=s(n)+w(n)(1)Rx(f)=Rs(f)+Rw(f) (2)其中,R(f)表示隨機(jī)過(guò)程的功率譜密度。
噪聲功率譜密度Rw(f)可以在語(yǔ)音間歇期間(即此時(shí)x(n)=w(n))。為了估計(jì)語(yǔ)音的功率譜密度,形成如下估計(jì)R^s(f)=R^x(f)-R^w(f)---(3)]]>這種估計(jì)功率譜密度的傳統(tǒng)方式需使用一種周期圖(periodogram)。例如,如果XN(fu)為x(n)的N點(diǎn)傅里葉變換而WN(fu)為w(n)的相應(yīng)傅里葉變換,于是R^s(fu)=Px,N(fu)=1N|XN(fu)|2,fu=uN,u=0,...,N-1---(4)]]>R^w(fu)=Pw,N(fu)=1N|WN(fu)|2,fu=uN,u=0,...,N-1---(5)]]>式(3)、(4)和(5)可以合并成|SN(fu)|2=|XN(fu)|2-|WN(fu)|2(6)
或者,可以給出更為廣義的形式|SN(fu)|α=|XN(fu)|α-|WN(fu))|α(7)其中,功率譜密度改換成譜密度的廣義形式。
由于人的耳朵對(duì)語(yǔ)音的相位誤差并不敏感,干凈的語(yǔ)音的相位φs(f)可以用有噪聲的語(yǔ)音的相位φx(fu)來(lái)近似φs(fu)≈φx(fu) (8)因此,估計(jì)干凈的語(yǔ)音的傅里葉變換的廣義表達(dá)式為SN(fu)=(|XN(fu)|α-k·|WN(fu)|α)1α·ejφx(fu)---(9)]]>其中,參數(shù)k用來(lái)控制噪聲減去量。
為了簡(jiǎn)化表示,引入矢量形式XN=XN(f0)XN(f1)...XN(fN-1)-----(10)]]>這些矢量按元對(duì)元進(jìn)行計(jì)算。為了清楚起見(jiàn),矢量的元對(duì)元相乘在這里表示為⊙。因此,式(9)可以用增益函數(shù)GN和矢量表示法寫(xiě)成 其中,增益函數(shù)為GN=(|XN|α-k·|WN|α|XN|α)1α=(1-k·|WN|α|XN|α)1α---(12)]]>式(12)表示了傳統(tǒng)的頻譜減除算法,示于圖2。在圖2中,傳統(tǒng)的頻譜減除降噪處理器200包括快速傅里葉變換處理器210、幅度平方處理器220、語(yǔ)音活動(dòng)檢測(cè)器230、按塊平均裝置240、按塊增益計(jì)算處理器250、乘法器260和快速傅里葉逆變換處理器270。
如圖所示,有噪聲的語(yǔ)音輸入信號(hào)加到快速傅里葉變換處理器210的輸入端上,快速傅里葉變換處理器210的輸出端與幅度平方處理器220的輸入端和乘法器260的第一輸入端連接。幅度平方處理器220的輸出端與開(kāi)關(guān)225的第一觸點(diǎn)和增益計(jì)算處理器250的第一輸入端連接。語(yǔ)音活動(dòng)檢測(cè)器230的輸出端與開(kāi)關(guān)225的投擲輸入端連接,而開(kāi)關(guān)225的第二觸點(diǎn)與按塊平均裝置240的輸入端連接。按塊平均裝置240的輸出端與增益計(jì)算處理器250的第二輸入端連接,增益計(jì)算處理器250的輸出端與乘法器260的第二輸入端連接。乘法器260的輸出端與快速傅里葉逆變換處理器270的輸入端連接,快速傅里葉逆變換處理器270的輸出端提供傳統(tǒng)的頻譜減除系統(tǒng)200的輸出。
在工作中,這個(gè)傳統(tǒng)的頻譜減除系統(tǒng)200用如上所述的傳統(tǒng)頻譜減除算法處理來(lái)到的有噪聲的語(yǔ)音信號(hào),提供噪聲得到減小的較干凈的語(yǔ)音信號(hào)。在實(shí)踐中,圖2中的各個(gè)組成部分可以用任何已知的數(shù)字信號(hào)處理技術(shù)實(shí)現(xiàn),包括通用計(jì)算機(jī)、一些集成電路和/或?qū)S眉呻娐?ASIC)。
要注意的是,傳統(tǒng)的頻譜減除算法有兩個(gè)參數(shù),α和k,控制噪聲減去量和語(yǔ)音質(zhì)量。將第一參數(shù)α設(shè)置為2就最進(jìn)行功率譜減除,而將第一參數(shù)α設(shè)置為1就是進(jìn)行幅度譜減除。此外,將第一參數(shù)α設(shè)置為0.5可以增大降噪,而只使語(yǔ)音有適當(dāng)?shù)氖д妗_@是由于在從有噪聲的語(yǔ)音中減去噪聲前頻譜受到了壓縮。
可以調(diào)整第二參數(shù)k來(lái)達(dá)到降噪要求。例如,如果選擇較大的k,就會(huì)增大語(yǔ)音失真。在實(shí)踐中,參數(shù)k通常根據(jù)第一參數(shù)的選擇設(shè)置。減小α通常會(huì)導(dǎo)致也要減小參數(shù)k,以便保持語(yǔ)音失真小。在功率譜減除的情況下,通常是用過(guò)減除(即,k>1)。
傳統(tǒng)的頻譜減除增益函數(shù)(見(jiàn)式(12))是根據(jù)一個(gè)全塊估計(jì)得出的,具有零相位。結(jié)果,相應(yīng)的脈沖響應(yīng)gN(u)就是非因果的,長(zhǎng)度為N(等于塊長(zhǎng)度)。因此,增益函數(shù)GN(l)與輸入信號(hào)XN的相乘(見(jiàn)式(11))導(dǎo)致與一個(gè)非因果濾波器的周期性循環(huán)卷積。如上所述,周期性的循環(huán)卷積可以導(dǎo)致不合乎需要的在時(shí)域的混疊,而濾波器的這種非因果性質(zhì)可以導(dǎo)致塊與塊之間的不連續(xù),從而使語(yǔ)音質(zhì)量較差。有益的是,本發(fā)明所給出的方法和設(shè)備提供了與一個(gè)因果增益濾波器的正確卷積,從而消除了以上所述的時(shí)域混疊和塊間不連續(xù)的問(wèn)題。
對(duì)于時(shí)域混疊問(wèn)題,要注意的是在時(shí)域的卷積相當(dāng)于在頻域的相乘。也就是說(shuō)x(u)*y(u)-X(f)·Y(f),u=-∞,...,∞(13)在變換用長(zhǎng)度為N的快速傅里葉變換(FFT)得到時(shí),相乘的結(jié)果不是正確的卷積。確切些說(shuō),結(jié)果是周期為N的循環(huán)卷積 其中,符號(hào) 表示循環(huán)卷積。
為了在用快速傅里葉變換時(shí)得到正確的卷積,脈沖響應(yīng)xN和yN的階之和必須小于或等于塊長(zhǎng)度減1,即小于或等于(N-1)。
因此,利用總階數(shù)小于或等于N-1的一個(gè)增益函數(shù)GN(l)和一個(gè)輸入信號(hào)塊XN可以解決由于周期性的循環(huán)卷積產(chǎn)生的時(shí)域混疊問(wèn)題。
按照傳統(tǒng)的頻譜減除,輸入信號(hào)的頻譜XN具有整個(gè)抉的長(zhǎng)度。然而,按照本發(fā)明,用一個(gè)長(zhǎng)度為L(zhǎng)(L<N)的輸入信號(hào)塊xL構(gòu)造一個(gè)階為L(zhǎng)的頻譜。長(zhǎng)度L稱(chēng)為幀長(zhǎng)度,因此xL為一個(gè)幀。由于乘以長(zhǎng)度為N的增益函數(shù)的頻譜也應(yīng)該具有長(zhǎng)度N,因此將幀xL補(bǔ)零到整個(gè)塊長(zhǎng)度N,得到XL\N。
為了構(gòu)造一個(gè)長(zhǎng)度為N的增益函數(shù),按照本發(fā)明可以從一個(gè)長(zhǎng)度為(M<N)的增益函數(shù)GM(l)內(nèi)插,形成GM\N(l)。為了得到本發(fā)明的低階增益函數(shù)GM\N(l),可以用任何巳知的或還沒(méi)有公開(kāi)的頻譜估計(jì)技術(shù)來(lái)替換以上所揭示的簡(jiǎn)單的傅里葉變換周期圖。有一些已知的譜估計(jì)技術(shù)可以使所得到的增益函數(shù)的方差較小。例如,參見(jiàn)J.G.Proakis和D.G.Manolakis的“數(shù)字信號(hào)處理原理、算法和應(yīng)用”(“Digital SignalProcessing;Principles,Algorithms,and Applications”,Macmillan,Second Ed.,1992)。
按照例如眾所周知的Bartlett方法,將長(zhǎng)度為N的塊分成K個(gè)長(zhǎng)度為M的子塊。然后計(jì)算出每個(gè)子塊的周期圖,對(duì)結(jié)果進(jìn)行平均后得到一個(gè)長(zhǎng)為M的對(duì)于整個(gè)塊的周期圖Px,M(fu)=1KΣk=0K-1Px,M(fu),fu=uM,u=0,...,M-1---(15)]]>=1KΣk=0K-1|F(x(k·M+u))|2]]>有益的是,在各子塊不相關(guān)時(shí),與整個(gè)塊長(zhǎng)度的周期圖相比,方差減小了一個(gè)因子K。頻率分辨率也降低了相同的因子。
或者,也可以采用Welch方法。Welch方法與Bartlett方法類(lèi)似,只是每個(gè)子塊加了一個(gè)Hanning窗,而且允許子塊相互交疊,從而得到較多個(gè)子塊。Welch方法給出的方差比Bartlett方法的還要小。Bartlett和Welch方法只是兩種譜估計(jì)技術(shù),而其他已知的譜估計(jì)技術(shù)也可以采用。
無(wú)論所實(shí)現(xiàn)的是哪種精確的譜估計(jì)技術(shù),還可以利用平均技術(shù)進(jìn)一步減小噪聲周期圖估計(jì)的方差。例如,在噪聲為長(zhǎng)期平穩(wěn)的假設(shè)下,可以對(duì)根據(jù)上述Bartlett和Welch方法得到的周期圖進(jìn)行平均。一種技術(shù)是指數(shù)平均Px,M(l)=α·Px,M+(l-1)+(1-α)·Px,M(l) (16)在式(16)中,函數(shù)Px,M(l)P用Bartlett或Welch方法計(jì)算,函數(shù)Px,M(l)為對(duì)當(dāng)前塊的指數(shù)平均,而函數(shù)Px,M(l-1)為對(duì)上一個(gè)塊的指數(shù)平均。參數(shù)α控制指數(shù)記憶的長(zhǎng)度,通常這長(zhǎng)度不應(yīng)該超過(guò)可以將噪聲認(rèn)為是平穩(wěn)的長(zhǎng)度。α接近于1導(dǎo)致有較長(zhǎng)的指數(shù)記憶,可以顯著地減小周期圖的方差。
長(zhǎng)度M稱(chēng)為子塊長(zhǎng)度,所得到的低階增益函數(shù)具有長(zhǎng)度為M的脈沖響應(yīng)。因此,在組成增益函數(shù)中所用的噪聲周期圖估計(jì) 和有噪聲的語(yǔ)音周期圖估計(jì) 也具有長(zhǎng)度MGM(l)=(1-k·P‾xL,Mα(l)PxL,Mα(l))1α---(17)]]>按照本發(fā)明,這是采用例如Bartlett方法從輸入幀XL得到較短的周期圖估計(jì)再加以平均實(shí)現(xiàn)的。Bartlett方法(或其他適當(dāng)?shù)墓烙?jì)方法)減小了所估計(jì)的周期圖的方差,也減小了頻率分辨率。分辯率從L個(gè)頻率區(qū)間減小到M個(gè)頻率區(qū)間意味著周期圖估計(jì) 也具有長(zhǎng)度M。此外,還可以用如上所述的指數(shù)平均進(jìn)一步減小噪聲周期圖估計(jì) 的方差。
為了滿(mǎn)足總階數(shù)小于或等于N-1的要求,應(yīng)使幀長(zhǎng)度L加上子塊長(zhǎng)度M小于N。結(jié)果,可以形成所要求的輸出塊;SN=GM\N(l)⊙XL\N(18)有益的是,按照本發(fā)明設(shè)計(jì)的這種低階濾波器還提供了解決由于傳統(tǒng)的頻譜減除算法中增益濾波器的非因果特性引起的問(wèn)題(即塊間不連續(xù)和語(yǔ)音質(zhì)量降低)的機(jī)會(huì)。具體地說(shuō),按照本發(fā)明,可以為增益函數(shù)加上一個(gè)相位來(lái)提供一個(gè)因果濾波器。按照一些示范性的實(shí)施例,這個(gè)相位可以根據(jù)幅度函數(shù)設(shè)計(jì),按需要可以是線性相位也可以最小相位。
為了按照本發(fā)明構(gòu)造一個(gè)線性相位濾波器,首先注意到的是,如果FFT的塊長(zhǎng)度為長(zhǎng)度M,那么在時(shí)域的循環(huán)移位就是在頻域乘以一個(gè)相位函數(shù)g(n-l)M↔GM(fu)·e-j2πul/M,fu=uM,u=0,...,M-1---(19)]]>在當(dāng)前情況下,l等于M/2+1,因?yàn)槊}沖響應(yīng)的第一個(gè)位置應(yīng)該具有零延遲(即,一個(gè)因果濾波器)。因此g(n-(M/2+1))M↔GM(fu)·e-jπu(1+2M)---(20)]]>從而得到線性相位濾波器GM(fu)為G‾M(fu)=GM(fu)·e-jπu(1+2M)---(21)]]>按照本發(fā)明,增益函數(shù)也內(nèi)插到長(zhǎng)度N,這例如可以用一種平滑內(nèi)插來(lái)執(zhí)行。添加給增益函數(shù)的相位因此改變,得到G‾M/N(fu)=GM/N(fu)·e-jπu(1+2M)·MN---(22)]]>有益的是,構(gòu)造線性相位濾波器也可以在時(shí)域執(zhí)行。在這種情況下,用IFFT將增益函數(shù)GM(fu)變換到時(shí)域,執(zhí)行循環(huán)移位。經(jīng)移位的脈沖響應(yīng)補(bǔ)零到長(zhǎng)度N后再用N點(diǎn)FFT變換回來(lái)。這樣就得到一個(gè)所需的經(jīng)內(nèi)插的因果線性相位濾波器GM\N(fu)。
按照本發(fā)明設(shè)計(jì)的因果最小相位濾波器可以用Hilbert變換關(guān)系根據(jù)增益函數(shù)構(gòu)造。例如,可參見(jiàn)A.V.Oppenheim和R.W.Schafer的“離散時(shí)間信號(hào)處理”(“Discrete-Time Signal Processing”,Prentic-Hall,Inter.Ed.,1989)。Hubert變換關(guān)系隱含著一個(gè)復(fù)值函數(shù)的實(shí)部與虛部之間的獨(dú)特關(guān)系。有益的是,對(duì)于幅度與相位之間的關(guān)系也可以使用這個(gè)關(guān)系,如果采用復(fù)信號(hào)的對(duì)數(shù)ln(|GM(fu)|·ej·arg(GM(fu)))=ln(|GM(fu)|)+ln(ej·arg(GM(fu)))---(23)]]>=ln(|GM(fu)|)+j·arg(GM(fu))]]>在當(dāng)前情況下,相位為零,從而得到一個(gè)實(shí)函數(shù)。函數(shù)ln(|GM(fu)|)用長(zhǎng)度為M的IFFT變換到時(shí)域后,形成gM(n)。將這個(gè)時(shí)域函數(shù)重新整理后,有 函數(shù)gM(n)用M點(diǎn)FFT變換回頻域,產(chǎn)生 。按此形成函數(shù)GM(fu)。然后將因果最小相位濾波器GM(fu)內(nèi)插到長(zhǎng)度N。這個(gè)內(nèi)插以與在如上所述的線性相位情況中相同的方式進(jìn)行。這樣得到的經(jīng)內(nèi)插的濾波器GM\N(fu)是因果的,具有大致最小相位。
圖3示出了按照發(fā)明實(shí)現(xiàn)的上述頻譜減除設(shè)計(jì)。在圖3中,所示的提供線性卷積和因果濾波器的頻譜減除降噪處理器300包括Bartlett處理器305、幅度平方處理器320、語(yǔ)音活動(dòng)檢測(cè)器330、塊平均處理器340、低階增益計(jì)算處理器350、增益相位處理器355、內(nèi)插處理器356、乘法器360、快速傅里葉逆變換處理器370和交疊增添處理器380。
如圖所示,有噪聲的語(yǔ)音輸入信號(hào)加到Bartlett處理器305的輸入端上和加到快速傅里葉變換處理器310的輸入端上。Bartlett處理器305的輸出端與幅度平方處理器320的輸入端連接,快速傅里葉變換處理器310的輸出端與乘法器360的第一輸入端連接。幅度平方處理器320的輸出端與開(kāi)關(guān)325的第一觸點(diǎn)和低階增益計(jì)算處理器350的第一輸入端連接。語(yǔ)音活動(dòng)檢測(cè)器330的控制輸出端與開(kāi)關(guān)325的投擲輸入端連接,開(kāi)關(guān)325的第二觸點(diǎn)與按塊平均裝置340的輸入端連接。
按塊平均裝置340的輸出端與低階增益計(jì)算處理器350的第二輸入端連接,低階增益計(jì)算處理器350的輸出端與增益相位處理器355的輸入端連接。增益相位處理器355的輸出端與內(nèi)插處理器356的輸入端連接,內(nèi)插處理器356的輸出端與乘法器360的第二輸入端連接。乘法器360的輸出端與快速傅里葉逆變換處理器370的輸入端連接,快速傅里葉逆變換處理器370的輸出端與交疊相加處理器380連接。交疊相加處理器380的輸出端給出這個(gè)示范性的降噪處理器300的噪聲得到減小的、干凈的語(yǔ)音輸出。
在工作中,頻譜減除降噪處理器300用如上所述的線性卷積因果濾波算法處理來(lái)到的有噪聲的語(yǔ)音信號(hào),提供噪聲得到減小的、干凈的語(yǔ)音信號(hào)。在實(shí)踐中,圖3中的各個(gè)組成部分可以用任何巳知的數(shù)字信號(hào)處理技術(shù)實(shí)現(xiàn),包括通用計(jì)算機(jī)、一些集成電路和/或?qū)S眉呻娐?ASIC)。
有益的是,本發(fā)明的增益函數(shù)GM(l)的方差還可以按照本發(fā)明通過(guò)受控制的指數(shù)增益函數(shù)平均進(jìn)一步減小。按照一些示范性的實(shí)施例,這種平均按當(dāng)前的塊頻譜Px,M(l)與平均噪聲譜Px,M(l)之間的差異進(jìn)行。例如,在差異小時(shí),可以對(duì)增益函數(shù)GM(l)進(jìn)行長(zhǎng)時(shí)間平均,這相當(dāng)于是平穩(wěn)背景噪聲情況。相反,在差異大時(shí),可以對(duì)增益函數(shù)GM(l)進(jìn)行短時(shí)間平均,這相當(dāng)于有語(yǔ)音的情況或者背景噪聲改變很快的情況。
為了處理從語(yǔ)音期到背景噪聲期的暫態(tài)轉(zhuǎn)換,對(duì)增益函數(shù)的平均不是與差異的減小成正比增大,因?yàn)檫@樣的話會(huì)引入一個(gè)聽(tīng)得到的寄生語(yǔ)音(因?yàn)檫m合于語(yǔ)音頻譜的增益函數(shù)要保持一段長(zhǎng)的時(shí)間)。代之以允許漸漸增大平均,可以提供使增益函數(shù)適應(yīng)平穩(wěn)的輸入的時(shí)間。
按照一些示范性實(shí)施例,頻譜之間的差異的測(cè)度定義為β(l)=Σu|Px,M,u(l)-P‾x,M,u(l)|ΣuP‾x,M,u(l)---(25)]]>其中,β(l)限制為
其中,β(l)=1導(dǎo)致不對(duì)增益函數(shù)進(jìn)行指數(shù)平均,而β(l)=βmin提供最大限度的指數(shù)平均。
參數(shù)β(l)為頻譜之間差異的指數(shù)平均,示為β(l)=γ·β(l-1)+(1-γ)·β(l)(27)式(27)中的參數(shù)γ用來(lái)保證在出現(xiàn)從頻譜之間差異大的時(shí)期過(guò)渡到差異小的時(shí)期時(shí)增益函數(shù)適應(yīng)新的電平。如上所述,這是為了防止寄生語(yǔ)音。按照這些示范性的實(shí)施例,這種自適應(yīng)是在由于β(l)減小而開(kāi)始增大對(duì)增益函數(shù)的指數(shù)平均前完成的。因此γ={γc,β‾(l-1)≥β(l),0<γc<10,β‾(l-1)<β(l)---(28)]]>在差異β(l)增大時(shí),參數(shù)β(l)隨著增大,但是在差異減小時(shí),對(duì)β(l)用了指數(shù)平均,形成平均的參數(shù)β(l)。增益函數(shù)的指數(shù)平均示為GM(l)=(1-β(l))·GM(l-1)+β(l)·GM(l)(29)對(duì)于不同的輸入信號(hào)情況,以上這些等式可以說(shuō)明如下。在噪聲期期間,方差減小。只要噪聲譜對(duì)于每個(gè)頻率都具有穩(wěn)定的平均值,就可以對(duì)它進(jìn)行平均,以減小方差。噪聲電平改變將導(dǎo)致平均的噪聲譜Px,M(l)與當(dāng)前塊的頻譜Px,M(l)之間的差異。因此,這種受控的指數(shù)平均方法減小對(duì)增益函數(shù)的平均,直到噪聲電平穩(wěn)定到一個(gè)新的電平上。這樣就能處理噪聲電平的改變,既可以在平穩(wěn)的噪聲期期間減小方差,也可以迅速響應(yīng)噪聲的改變。高能量的語(yǔ)音通常具有一些時(shí)變的頻譜峰。在這些頻譜峰以不同的塊平均時(shí),它們的頻譜估計(jì)含有這些尖峰的平均,因此看來(lái)像一個(gè)較寬的頻譜,這將導(dǎo)致語(yǔ)音質(zhì)量下降。因此,指數(shù)平均在高能量的語(yǔ)音期期間保持為最小。由于平均的噪聲譜Px,M(l)與當(dāng)前高能量語(yǔ)音譜Px,M(l)之間的差異大,因此不對(duì)增益函數(shù)進(jìn)行指數(shù)平均。在較低能量的語(yǔ)音期期間,采用取決于當(dāng)前低能量語(yǔ)音譜與平均噪聲譜之間的差異的短記憶的指數(shù)平均。所以,對(duì)于低能量的語(yǔ)音,方差減小比在背景噪聲期期間的小,而比高能量語(yǔ)音期的大。
圖4示出了按照本發(fā)明設(shè)計(jì)的上述頻譜減除方案。在圖4中,提供線性卷積、因果濾波和受控指數(shù)平均的頻譜減除降噪處理器400示為包括圖3所示系統(tǒng)300的Bartlett處理器305、幅度平方處理器320、語(yǔ)音活動(dòng)檢測(cè)器330、按塊平均裝置340、低階增益計(jì)算處理器350、增益相位處理器355、內(nèi)插處理器356、乘法器360、快速傅里葉逆變換處理器370和交疊相加處理器380,以及平均控制處理器445、指數(shù)平均處理器446和可選的固定FIR后置濾波器465。
如圖所示,有噪聲的語(yǔ)音輸入信號(hào)加到Bartlett處理器305的輸入端上和加到快速傅里葉變換處理器310的輸入端上。Bartlett處理器305的輸出端與幅度平方處理器320的輸入端連接,快速傅里葉變換處理器310的輸出端與乘法器360的第一輸入端連接。幅度平方處理器320的輸出端與開(kāi)關(guān)325的第一觸點(diǎn)、低階增益計(jì)算處理器350的第一輸入端和平均控制處理器445的第一輸入端連接。
語(yǔ)音活動(dòng)檢測(cè)器330的控制輸出端與開(kāi)關(guān)325的投擲輸入端連接,開(kāi)關(guān)325的第二觸點(diǎn)與按塊平均裝置340的輸入端連接。按塊平均裝置340的輸出端與低階增益計(jì)算處理器350的第二輸入端和平均控制器445的第二輸入端連接。低階增益計(jì)算處理器350的輸出端與指數(shù)平均處理器446的信號(hào)輸入端連接,平均控制器445的輸出端與指數(shù)平均處理器446的控制輸入端連接。
指數(shù)平均處理器446的輸出端與增益相位處理器355的輸入端連接,增益相位處理器355的輸出端與內(nèi)插處理器356的輸入端連接。內(nèi)插處理器356的輸出端與乘法器360的第二輸入端連接,可選的固定FIR后置濾波器465的輸出端與乘法器360的第三輸入端連接。乘法器360的輸出端與快速傅里葉逆變換處理器370的輸入端連接,快速傅里葉逆變換處理器370的輸出端與交疊相加處理器380的輸入端連接。交疊相加處理器380的輸出端給出這個(gè)示范性的系統(tǒng)400的干凈的語(yǔ)音信號(hào)。
在工作中,按照本發(fā)明實(shí)現(xiàn)的頻譜減除降噪處理器400用如上所述的線性卷積、因果濾波和受控指數(shù)平均算法處理來(lái)到的有噪聲的語(yǔ)音信號(hào),提供噪聲得到減小的改善語(yǔ)音信號(hào)。就象圖3的實(shí)施例那樣,圖4中的各個(gè)組成部分可以用任何巳知的數(shù)字信號(hào)處理技術(shù)實(shí)現(xiàn),包括通用計(jì)算機(jī)、一些集成電路和/或?qū)S眉呻娐?ASIC)。
注意,由于幀長(zhǎng)度L和子塊長(zhǎng)度M之和按照示范性的實(shí)施例選擇成不到N-1,因此可以如圖4所示增添一個(gè)長(zhǎng)度J≤N-1-L-M的附加固定FIR濾波器465。后置濾波器465將內(nèi)插的濾波器脈沖響應(yīng)與信號(hào)譜相乘,如圖所示。這個(gè)內(nèi)插到長(zhǎng)度N是通過(guò)對(duì)濾波器補(bǔ)零再應(yīng)用N點(diǎn)FFT來(lái)實(shí)現(xiàn)的。后置濾波器465可用來(lái)濾除電話帶寬之外或恒定的音調(diào)成分。或者,也可以將后置濾波器465的功能直接包括在增益函數(shù)內(nèi)。
在實(shí)踐中,上述算法的參數(shù)根據(jù)實(shí)現(xiàn)算法的具體應(yīng)用設(shè)定。以下將以GSM移動(dòng)電話機(jī)為例說(shuō)明參數(shù)選擇情況。
首先,根據(jù)GSM規(guī)范,將幀長(zhǎng)度L設(shè)置為160個(gè)樣點(diǎn),提供為20ms的幀。在其他系統(tǒng)中可以選用其他的L。然而,應(yīng)指出的是幀長(zhǎng)度L增大相當(dāng)于延遲增大。使子塊長(zhǎng)度M(例如,Bartlett處理器的周期圖長(zhǎng)度)小可以提供大的方差縮減M。由于用FFT來(lái)計(jì)算周期圖,因此將長(zhǎng)度M設(shè)置為2的冪更為方便。于是,頻率分辨率為B=FsM---(30)]]>GSM系統(tǒng)的采樣率為8000Hz。因此,長(zhǎng)度M為16、32和64給出的頻率分辨率分別為500Hz、250Hz和125Hz。
為了在一個(gè)諸如移動(dòng)電話機(jī)之類(lèi)的噪聲可變的系統(tǒng)中采用上述的頻譜減除技術(shù),本發(fā)明應(yīng)用了一種2拾音器系統(tǒng)。圖5例示了這種2拾音器系統(tǒng),其中,582為移動(dòng)電話機(jī),584為近嘴拾音器,而586為遠(yuǎn)嘴拾音器。在用一個(gè)遠(yuǎn)嘴拾音器與一個(gè)近嘴拾音器配合時(shí),只要可以不斷地從單個(gè)輸入樣點(diǎn)塊估計(jì)出噪聲譜就能處理非平穩(wěn)的背景噪聲。
遠(yuǎn)嘴拾音器586除拾取背景噪聲之外,還拾取說(shuō)話者的語(yǔ)音,但所得到的電平比近嘴拾音器584的低一些。為了加強(qiáng)噪聲估計(jì),用一個(gè)頻譜減除級(jí)來(lái)抑制遠(yuǎn)嘴拾音器586的信號(hào)內(nèi)的語(yǔ)音。為了能加強(qiáng)噪聲估計(jì),用另一個(gè)頻譜減除級(jí)根據(jù)近嘴信號(hào)形成一個(gè)粗語(yǔ)音估計(jì)。最后,用一個(gè)第三頻譜減除級(jí)通過(guò)濾除增強(qiáng)的背景噪聲來(lái)增強(qiáng)近嘴信號(hào)。
由于語(yǔ)音和噪聲估計(jì)只能根據(jù)一個(gè)短的數(shù)據(jù)樣點(diǎn)塊形成,因此采用上述技術(shù)的一個(gè)潛在的問(wèn)題是需要作出小方差的濾波器(即增益函數(shù))估計(jì)。為了減小增益函數(shù)的變動(dòng),采用上面所討論的單拾音器頻譜減除算法。這樣,這種方法利用減小方差的Bartlett譜估計(jì)方法來(lái)減小增益函數(shù)的變動(dòng)。這種方法也減小了頻率分辨率,而這個(gè)屬性用來(lái)實(shí)現(xiàn)因果的實(shí)線性卷積。在本發(fā)明的一個(gè)示范性的實(shí)施例中,用噪聲與有噪聲的語(yǔ)音的譜估計(jì)之間的差異大小所控制的自適應(yīng)平均進(jìn)一步減小了增益函數(shù)的變動(dòng)。
在本發(fā)明的這種2拾音器系統(tǒng)中,如圖6所示,有兩個(gè)信號(hào)來(lái)自近嘴拾音器584的語(yǔ)音占優(yōu)勢(shì)的連續(xù)信號(hào)xs(n);以及來(lái)自遠(yuǎn)嘴拾音器586的噪聲更占優(yōu)勢(shì)的連續(xù)信號(hào)xn(n)。來(lái)自近嘴拾音器584的信號(hào)加到緩存器689的輸入端上,在緩存器689內(nèi)分解為一些塊xs(i)。在本發(fā)明的所有示范性實(shí)施例中,緩存器689也是一個(gè)語(yǔ)音編碼器。來(lái)自遠(yuǎn)嘴拾音器586的信號(hào)加到緩存器687的輸入端上,在緩存器687內(nèi)分解為一些塊xn(i)。緩存器687和689也都可以包括進(jìn)一步增強(qiáng)本發(fā)明的性能的諸如回聲消除器之類(lèi)的其他信號(hào)處理。模擬數(shù)字(A/D)變換器(未示出)將來(lái)自拾音器584、586的模擬信號(hào)變換成數(shù)字信號(hào),從而可由本發(fā)明的這些頻譜減除級(jí)處理。A/D變換器可以設(shè)在緩存器687、689前或后。
第一頻譜減除級(jí)601將一個(gè)近嘴信號(hào)塊xs(i)和上一幀的噪聲估計(jì)Yn(f,i-1)作為它的輸入。上一幀的噪聲估計(jì)是通過(guò)將第二頻譜減除級(jí)602的輸出耦合到延遲電路688的輸入端來(lái)產(chǎn)生的。延遲電路688的輸出端與第一頻譜減除級(jí)601連接。這個(gè)第一頻譜減除級(jí)用來(lái)對(duì)語(yǔ)音作出一個(gè)粗估計(jì)Yn(f,i)。第一頻譜減除級(jí)601的輸出提供給第二頻譜減除級(jí)602,第二頻譜減除級(jí)602利用這個(gè)估計(jì)(Yn(f,i))和一個(gè)遠(yuǎn)嘴信號(hào)塊xn(i)估計(jì)當(dāng)前幀的噪聲譜Yn(f,i)。最后,第二頻譜減除級(jí)602的輸出提供給第三頻譜減除級(jí)603,第三頻譜減除級(jí)603利用這個(gè)當(dāng)前噪聲譜估計(jì)Yn(f,i)和一個(gè)近嘴信號(hào)塊xs(i)估計(jì)出噪聲減小了的語(yǔ)音Ys(f,i)。第三頻譜減除級(jí)603的輸出端與快速傅里葉逆變換處理器670的輸入端連接,快速傅里葉逆變換處理器670的輸出端與交疊相加處理器680的輸入端連接。交疊相加處理器680的輸出端提供一個(gè)干凈的語(yǔ)音信號(hào)作為這個(gè)示范性的系統(tǒng)600的輸出。
在本發(fā)明的一個(gè)示范性的實(shí)施例中,頻譜減除級(jí)601-603各有一個(gè)控制減除量的參數(shù)。這個(gè)參數(shù)最好為根據(jù)拾音器的輸入SNR和所用的降噪方法設(shè)置。此外,在本發(fā)明的另一個(gè)示范性的實(shí)施例中,用一個(gè)控制器動(dòng)態(tài)地按可變的噪聲環(huán)境更為精確地設(shè)置各頻譜減除級(jí)601-603的這個(gè)參數(shù)。此外,由于遠(yuǎn)嘴拾音器信號(hào)用來(lái)估計(jì)要從近嘴有噪聲的語(yǔ)音譜中減去的噪聲譜,因此本發(fā)明的性能在背景噪聲譜在兩個(gè)拾音器內(nèi)具有相同的特性時(shí)就較好。例如,在用一個(gè)有方向性的近嘴拾音器時(shí),它所得到的背景特性就與一個(gè)全方向的遠(yuǎn)嘴拾音器所得到的不同。為了補(bǔ)償在這種情況下的差別,兩個(gè)拾音器信號(hào)或者其中一個(gè)拾音器信號(hào)應(yīng)該予以濾波,以減小的譜的差別。
在本發(fā)明的一個(gè)示范性的實(shí)施例中,可取的是使電話通信中的延遲盡可能小,從而防止回聲干擾和不自然的間歇。在信號(hào)塊長(zhǎng)度與移動(dòng)電話系統(tǒng)的語(yǔ)音編碼器的塊長(zhǎng)度匹配時(shí),本發(fā)明使用與話音編碼器相同的樣點(diǎn)塊。這樣,緩存信號(hào)塊不會(huì)引入額外的延遲。因此,引入的延遲只是本發(fā)明的降噪計(jì)算時(shí)間加上在最后的頻譜減除級(jí)內(nèi)進(jìn)行增益函數(shù)濾波的群延遲。如在第三級(jí)所示,可以使振幅增益函數(shù)加上一個(gè)最小相位,從而在因果濾波器的制約下給出一個(gè)短的延遲。
由于本發(fā)明使用兩個(gè)拾音器,因此不再需要使用如對(duì)圖3和4中使用單個(gè)拾音器的頻譜減除所述的VAD 330、開(kāi)關(guān)325和平均塊340。也就是說(shuō),遠(yuǎn)嘴拾音器可用來(lái)提供一個(gè)在語(yǔ)音期和非語(yǔ)音期期間都恒定的噪聲信號(hào)。此外,IFFT 370和交疊相加電路380移到了最終輸出級(jí),示為圖6中的670和680。
上述在雙拾音器實(shí)現(xiàn)中所用的各個(gè)頻譜減除級(jí)都可以如圖7所示那樣實(shí)現(xiàn)。在圖7中,提供線性卷積、因果濾波和受控指數(shù)平均的頻譜減除級(jí)700示為包括Bartlett處理器705、頻率抽取器722、低階增益計(jì)算處理器750、增益相位處理器和內(nèi)插處理器755/756和乘法器760。
如圖所示,有噪聲的語(yǔ)音輸入信號(hào)X(·)(i)加到Bartlett處理器705的輸入端和快速傅里葉變換處理器710的輸入端。符號(hào)X(·)(i)用來(lái)表示加到頻譜減除級(jí)601-603的輸入端上的Xn(i)或Xs(i),如圖6中所示。長(zhǎng)度為N的干擾信號(hào)的振幅譜Y(·,N)(f,i)、Y(·)(f,i)加到頻率抽取器722的輸入端上。符號(hào)Y(·)(f,i)用來(lái)表示Yn(f,i-1)、Yr(f,i)或Yn(f,i)。頻率抽取器722的輸出為具有長(zhǎng)度M的Y(·,N)(f,i)振幅譜,其中M<N。此外,頻率抽取器722使輸出振幅譜的方差比輸入振幅譜的小。Bartlett處理器705的振幅譜輸出和頻率抽取器722的振幅譜分別加到低階增益計(jì)算處理器750的輸入端上??焖俑道锶~變換處理器710的輸出端與乘法器760的第一輸入端連接。
低階增益計(jì)算處理器750的輸出端與可選的指數(shù)平均處理器746的信號(hào)輸入端連接。指數(shù)平均處理器746的輸出端與增益相位和內(nèi)插處理器755/756的輸入端連接。處理器755/756的輸出端與乘法器760的第二輸入端連接。經(jīng)濾波的譜Y*(f,i)因此就是乘法器760的輸出,其中符號(hào)Y*(f,i)用來(lái)表示Yr(f,i)、Yn(f,i)或Ys(f,i)。圖7中所用的增益函數(shù)為GM(f,i)=(1-k(·)·|Y(·),M(f,i)|α|X(·),M(f,i)|α)1α---(31)]]>其中|X(·),M(f,i)|為Bartlett處理器705的輸出,|X(·),M(f,i)|為頻率抽取器722的輸出,α為譜指數(shù),k(·)為控制用于具體頻譜減除級(jí)的抑制量的減除因子??梢詫⒃鲆婧瘮?shù)選擇成自適應(yīng)平均的。這種增益函數(shù)相應(yīng)于一個(gè)非因果時(shí)變?yōu)V波器。得到一個(gè)因果濾波器的一種方法是強(qiáng)加一個(gè)最小相位。得到一個(gè)因果濾波器的另一種方法是強(qiáng)加一個(gè)線性相位。為了得到一個(gè)有著與輸入塊X(·),N(f,i)相同的FFT區(qū)間數(shù)的增益函數(shù)GM(f,i),將增益函數(shù)內(nèi)插為GM\N(f,i)。增益函數(shù)GM\N(f,i)現(xiàn)在就相應(yīng)于一個(gè)具有長(zhǎng)度M的因果線性濾波器。經(jīng)傳統(tǒng)的FFT濾波后,可以得到一個(gè)沒(méi)有周期性效應(yīng)的輸出信號(hào)。
在工作中,按照本發(fā)明設(shè)計(jì)的頻譜減除級(jí)700用如上所述的線性卷積、因果濾波和受控指數(shù)平均算法處理來(lái)到的有噪聲的語(yǔ)音信號(hào),提供噪聲得到減小的改善語(yǔ)音信號(hào)。就象圖3和4的實(shí)施例那樣,圖7-8中的各個(gè)組成部分可以用任何巳知的數(shù)字信號(hào)處理技術(shù)實(shí)現(xiàn),包括通用計(jì)算機(jī)、一些集成電路和/或?qū)S眉呻娐?ASIC)。
總之,本發(fā)明提供了改進(jìn)的利用線性卷積、因果濾波和/或?qū)υ鲆婧瘮?shù)的受控指數(shù)平均的雙拾音器頻譜減除的方法和設(shè)備。熟悉該技術(shù)領(lǐng)域的人員很容易認(rèn)識(shí)到本發(fā)明可以提高諸如音樂(lè)之類(lèi)的任何音頻信號(hào)的質(zhì)量,而不只是局限于語(yǔ)音音頻信號(hào)。這些示范性的方法可以處理非平穩(wěn)的背景噪聲,因?yàn)楸景l(fā)明所根據(jù)的不只是對(duì)只有噪聲的那些時(shí)段進(jìn)行的噪聲測(cè)量。此外,在短期平穩(wěn)的背景噪聲期間,由于可以在只有噪聲和也有語(yǔ)音期間估計(jì)背景噪聲,因此語(yǔ)音質(zhì)量也得到了改善。此外,本發(fā)明可以使用有或沒(méi)有方向性的拾音器,而且兩個(gè)拾音器的類(lèi)型也可以不同。此外,降噪量可以調(diào)節(jié)到適當(dāng)?shù)某潭?,以適應(yīng)具體要求的語(yǔ)音質(zhì)量。
熟悉該技術(shù)領(lǐng)域的人員可以理解,本發(fā)明并不局限于在這里為了說(shuō)明而例舉的這些具體的示范性實(shí)施例,有許多可能的實(shí)施方式也是可行的。例如,雖然本發(fā)明以移動(dòng)通信應(yīng)用為例進(jìn)行說(shuō)明,但是熟悉該技術(shù)領(lǐng)域的人員可以理解,本發(fā)明的原理同樣可用于任何需要除去特定信號(hào)分量的信號(hào)處理應(yīng)用。因此,本發(fā)明的專(zhuān)利保護(hù)范圍由所附權(quán)利要求書(shū)限定而不是上述說(shuō)明,所附權(quán)利要求書(shū)涵蓋了所有含意與之一致的等效實(shí)現(xiàn)方式。
權(quán)利要求
1.一種降噪系統(tǒng),所述降噪系統(tǒng)包括一個(gè)第一頻譜減除處理器,配置成對(duì)一個(gè)第一信號(hào)濾波,提供一個(gè)噪聲得到減小的輸出信號(hào);一個(gè)第二頻譜減除處理器,配置成對(duì)一個(gè)第二信號(hào)濾波,提供一個(gè)噪聲估計(jì)輸出信號(hào);以及一個(gè)第三頻譜減除處理器,配置成按所述噪聲估計(jì)輸出信號(hào)對(duì)所述第一信號(hào)濾波。
2.權(quán)利要求1的系統(tǒng),其中所述第二頻譜減除處理器配置成按所述第一噪聲得到減小的輸出信號(hào)對(duì)所述第二信號(hào)濾波。
3.權(quán)利要求1的系統(tǒng),所述系統(tǒng)還包括一個(gè)延遲電路,所述噪聲估計(jì)輸出信號(hào)加到所述延遲電路的一個(gè)輸入端上;以及其中所述第一頻譜減除處理器配置成按所述延遲電路的輸出對(duì)所述第一信號(hào)濾波。
4.權(quán)利要求1的系統(tǒng),所述系統(tǒng)還包括一個(gè)第一拾音器;以及一個(gè)第二拾音器,其中所述第一信號(hào)從所述第一拾音器的輸出端得到,而所述第二信號(hào)從所述第二拾音器的輸出端得到。
5.權(quán)利要求4的系統(tǒng),其中所述第一拾音器具有與所述第二拾音器不同的類(lèi)型。
6.權(quán)利要求4的系統(tǒng),其中所述第一拾音器比所述第二拾音器接近一個(gè)所要求的聲波源。
7.權(quán)利要求1的系統(tǒng),其中至少所述第一、第二和第三頻譜減除處理器之一的一個(gè)增益函數(shù)根據(jù)一個(gè)對(duì)一個(gè)輸入信號(hào)的譜密度的估計(jì)和根據(jù)對(duì)所述輸入信號(hào)中的不希望有的成分的譜密度的估計(jì)計(jì)算,其中所述至少所述第一、第二和第三頻譜減除處理器之一的輸出信號(hào)的一個(gè)樣點(diǎn)塊根據(jù)所述輸入信號(hào)的一個(gè)相應(yīng)樣點(diǎn)塊和根據(jù)所述增益函數(shù)的一個(gè)相應(yīng)樣點(diǎn)塊計(jì)算,以及其中所述輸入信號(hào)的相應(yīng)樣點(diǎn)塊的階與所述增益函數(shù)的相應(yīng)樣點(diǎn)塊的階之和小于輸出信號(hào)塊的樣點(diǎn)數(shù)。
8.權(quán)利要求7的系統(tǒng),其中一個(gè)相位加到所述增益函數(shù)上使得至少所述第一、第二和第三頻譜減除處理器之一提供因果濾波。
9.權(quán)利要求8的系統(tǒng),其中所述增益函數(shù)具有線性相位。
10.權(quán)利要求8的系統(tǒng),其中所述增益函數(shù)具有最小相位。
11.一種處理一個(gè)有噪聲的輸入信號(hào)和一個(gè)噪聲信號(hào)從而提供一個(gè)噪聲得到減小的輸出信號(hào)的方法,所述方法包括下列步驟(a)利用頻譜減除對(duì)所述有噪聲的輸入信號(hào)濾波,提供一個(gè)第一噪聲得到減小的輸出信號(hào);(b)利用頻譜減除對(duì)所述噪聲信號(hào)濾波,提供一個(gè)噪聲估計(jì)輸出信號(hào);以及(c)利用頻譜減除按所述噪聲估計(jì)輸出信號(hào)對(duì)所述有噪聲的輸入信號(hào)濾波。
12.權(quán)利要求11的方法,其中所述步驟(b)根據(jù)所述第一噪聲得到減小的輸出信號(hào)對(duì)所述噪聲信號(hào)濾波。
13.權(quán)利要求11的方法,所述方法還包括下列步驟(d)延遲所述噪聲估計(jì)輸出信號(hào);以及其中所述步驟(a)還包括利用所述頻譜減除按所述步驟(d)的結(jié)果對(duì)所述有噪聲的輸入信號(hào)濾波,提供所述第一噪聲得到減小的輸出信號(hào)。
14.權(quán)利要求11的方法,其中至少所述第一、第二和第三頻譜減除處理器之一的一個(gè)增益函數(shù)根據(jù)一個(gè)對(duì)一個(gè)輸入信號(hào)的譜密度的估計(jì)和根據(jù)一個(gè)對(duì)所述輸入信號(hào)中的不希望有的成分的譜密度的估計(jì)計(jì)算,其中所述至少所述第一、第二和第三頻譜減除處理器之一的輸出信號(hào)的一個(gè)樣點(diǎn)塊根據(jù)所述輸入信號(hào)的一個(gè)相應(yīng)樣點(diǎn)塊和根據(jù)所述增益函數(shù)的一個(gè)相應(yīng)樣點(diǎn)塊計(jì)算,以及其中所述輸入信號(hào)的相應(yīng)樣點(diǎn)塊的階與所述增益函數(shù)的相應(yīng)樣點(diǎn)決的階之和小于輸出信號(hào)塊的樣點(diǎn)數(shù)。
15.權(quán)利要求14的方法,其中一個(gè)相位加到所述增益函數(shù)上使得至少所述第一、第二和第三頻譜減除處理器之一提供因果濾波。
16.權(quán)利要求15的方法,其中所述增益函數(shù)具有線性相位。
17.權(quán)利要求15的方法,其中所述增益函數(shù)具有最小相位。
18.一種移動(dòng)電話機(jī),所述移動(dòng)電話機(jī)包括一個(gè)接收從一個(gè)第一拾音器得到的第一信號(hào)的輸入端;一個(gè)接收從一個(gè)第二拾音器得到的一個(gè)第二信號(hào)的輸入端;一個(gè)第一頻譜減除處理器,配置成對(duì)所述第一信號(hào)濾波,提供一個(gè)噪聲得到減小的輸出信號(hào);一個(gè)第二頻譜減除處理器,配置成對(duì)所述個(gè)第二信號(hào)濾波,提供一個(gè)噪聲估計(jì)輸出信號(hào);以及一個(gè)第三頻譜減除處理器,配置成按所述噪聲估計(jì)輸出信號(hào)對(duì)所述第一信號(hào)濾波。
19.權(quán)利要求18的移動(dòng)電話機(jī),其中所述第二頻譜減除處理器配置成按所述第一噪聲得到減小的輸出信號(hào)對(duì)所述第二信號(hào)濾波。
20.權(quán)利要求18的移動(dòng)電話機(jī),所述移動(dòng)電話機(jī)還包括一個(gè)延遲電路,所述噪聲估計(jì)輸出信號(hào)加到所述延遲電路的一個(gè)輸入端上;以及其中所述第一頻譜減除處理器配置成按所述延遲電路的輸出對(duì)所述第一信號(hào)濾波。
21.權(quán)利要求18的移動(dòng)電話機(jī),其中所述第一拾音器具有與所述第二拾音器不同的類(lèi)型。
22.權(quán)利要求18的移動(dòng)電話機(jī),其中所述第一拾音器比所述第二拾音器接近一個(gè)所要求的聲波源。
全文摘要
在雙拾音器降噪系統(tǒng)中,通過(guò)采用線性卷積、因果濾波和/或按頻譜對(duì)頻譜減除增益函數(shù)進(jìn)行指數(shù)平均的一些頻譜減除算法提供了語(yǔ)音增強(qiáng)。按照一些示范性的實(shí)施例,在用一個(gè)遠(yuǎn)嘴拾音器與一個(gè)近嘴拾音器配合時(shí),只要可以不斷地從單個(gè)輸入樣點(diǎn)塊估計(jì)出噪聲譜就能處理非平穩(wěn)的背景噪聲。遠(yuǎn)嘴拾音器除拾取背景噪聲之外,還拾取說(shuō)話者的語(yǔ)音,但所得到的電平比近嘴拾音器的低。為了加強(qiáng)噪聲估計(jì),用一個(gè)頻譜減除級(jí)來(lái)抑制遠(yuǎn)嘴拾音器信號(hào)內(nèi)的語(yǔ)音。為了能加強(qiáng)噪聲估計(jì),用另一個(gè)頻譜減除級(jí)根據(jù)近嘴信號(hào)形成一個(gè)粗語(yǔ)音估計(jì)。最后,用一個(gè)第三頻譜減除函數(shù)用加強(qiáng)的背景噪聲估計(jì)抑制背景噪聲來(lái)增強(qiáng)近嘴信號(hào)。
文檔編號(hào)H04R3/00GK1356014SQ00808870
公開(kāi)日2002年6月26日 申請(qǐng)日期2000年4月11日 優(yōu)先權(quán)日1999年4月12日
發(fā)明者H·古斯塔夫松, I·克萊松, S·諾德霍爾姆 申請(qǐng)人:艾利森電話股份有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
溧阳市| 祁阳县| 怀安县| 清徐县| 清原| 南充市| 称多县| 织金县| 饶河县| 揭西县| 乐东| 会宁县| 金川县| 永昌县| 韩城市| 贞丰县| 彭泽县| 响水县| 岗巴县| 铁力市| 探索| 绥滨县| 昌都县| 横峰县| 富顺县| 博客| 屯昌县| 灌阳县| 宜川县| 涪陵区| 花莲县| 深州市| 镇坪县| 开原市| 洛南县| 建平县| 襄樊市| 久治县| 曲麻莱县| 新干县| 长汀县|