專(zhuān)利名稱:一種非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及傳聲器陣列語(yǔ)音增強(qiáng)領(lǐng)域,特別涉及一種在非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法。
背景技術(shù):
在視頻會(huì)議系統(tǒng)、車(chē)載免提系統(tǒng)、語(yǔ)音識(shí)別系統(tǒng)等應(yīng)用場(chǎng)合,通常需要在較遠(yuǎn)距離拾取目標(biāo)語(yǔ)音。然而,由于背景噪聲、干擾噪聲及回聲的存在,拾取的語(yǔ)音信噪比通常較低,而基于傳聲器陣列的語(yǔ)音增強(qiáng)技術(shù)是提高接收語(yǔ)音信噪比的常用手段之一。目前,傳聲器陣列語(yǔ)音增強(qiáng)技術(shù)主要有兩類(lèi),一類(lèi)是基于常規(guī)波束形成的方法,這種方法的波束形狀是固定的,不會(huì)隨著干擾聲信號(hào)的變化而變化,其對(duì)非方向性噪聲如混響聲有較好的抑制效果,語(yǔ)音增強(qiáng)性能隨著傳聲器數(shù)量增多而提高,但是,對(duì)方向性干擾噪聲,其抑制效果有限;另一類(lèi)是基于自適應(yīng)波束形成算法,其波束形狀會(huì)隨著干擾語(yǔ)音的變化而發(fā)生改變,自適應(yīng)波束形成算法能夠有效的抑制方向性干擾噪聲但在弱相關(guān)噪聲場(chǎng)或在散射噪聲場(chǎng)中,性能不如傳統(tǒng)波束形成算法。上述兩種算法通常均需要干擾噪聲是平穩(wěn)過(guò)程,然而在實(shí)際使用環(huán)境下,干擾噪聲通常是突發(fā)非平穩(wěn)的,如語(yǔ)音干擾,在這種情況下,目前大部分的語(yǔ)音增強(qiáng)技術(shù)性能有限。
發(fā)明內(nèi)容
本發(fā)明的目的在于,針對(duì)現(xiàn)有技術(shù)中存在的不足局限性,從而提供一種在非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法。為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供的一種在非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法,通過(guò)利用通道之間的相位信息,準(zhǔn)確判斷有效信號(hào)的概率,以提高抗非平穩(wěn)噪聲干擾的性能。該方法的步驟包括:(I)根據(jù)傳聲器陣列的輸入信號(hào)估計(jì)出噪聲參考信號(hào)r (η);(2)采用自適應(yīng)算法初步濾除各通道的輸入信號(hào)中所含的噪聲信號(hào);(3)對(duì)各通道中自適應(yīng)濾波器的輸出信號(hào)進(jìn)行分幀加窗,再采用快速傅立葉變換變換至頻域;(4)估計(jì)背景噪聲功率譜η(ω),并由此得到當(dāng)前幀的信噪比SNR(n,ω);(5)利用各通道之間的相位信息,再進(jìn)一步根據(jù)和值與預(yù)定義門(mén)限T1的關(guān)系得到有效語(yǔ)音信號(hào)存在概率P1 (η,ω);(6)估計(jì)出當(dāng)前幀是有效語(yǔ)音幀的概率Pf (η);(7)計(jì)算出輸出信號(hào)在各個(gè)頻率點(diǎn)增益G(η,ω);(8)把處理后的頻譜信號(hào)通過(guò)反傅里葉變換變換到時(shí)間域,作為輸出信號(hào);所述步驟(5)中的估計(jì)出有效信號(hào)存在概率具體包括如下步驟:(51)根據(jù)所需波束寬度計(jì)算門(mén)限T1 = NL sin(0)/Fs,其中N表示幀長(zhǎng),L表示傳聲器單元間距,Θ表示波束寬度,F(xiàn)s為采樣頻率;(52)計(jì)算各通道輸入信號(hào)在各頻率點(diǎn)相位差ω的和值pd(n,ω);(53)當(dāng)pd(n,ω) > ω (M-1)T1時(shí),該頻率點(diǎn)存在有效信號(hào)概率P1 (η,ω) = 1,否則?1(1!,ω) = 0,其中,M表示傳聲器個(gè)數(shù)。作為上述技術(shù)方案的一種改進(jìn),所述的步驟¢)中的估計(jì)當(dāng)前幀是有效語(yǔ)音幀的概率具體包括如下步驟:(61)當(dāng)前幀能量
權(quán)利要求
1.一種非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法,該方法包括的步驟如下: (1)根據(jù)傳聲器陣列的輸入信號(hào)估計(jì)出噪聲參考信號(hào)r(η); (2)采用自適應(yīng)算法初步濾除各通道的輸入信號(hào)中所含的噪聲信號(hào); (3)對(duì)各通道中自適應(yīng)濾波器的輸出信號(hào)進(jìn)行分幀加窗,再采用快速傅立葉變換變換至頻域; (4)估計(jì)背景噪聲功率譜η(ω),并由此得到當(dāng)前幀的信噪比SNR(η,ω); (5)利用各通道之間的相位信息,再進(jìn)一步根據(jù)和值與預(yù)定義門(mén)限T1的關(guān)系得到有效語(yǔ)音信號(hào)存在概率P1Oi, ω); (6)估計(jì)出當(dāng)前幀是有效語(yǔ)音幀的概率Pf(η); (7)計(jì)算出輸出信號(hào)在各個(gè)頻率點(diǎn)增益G(η,ω); (8)把處理后的頻譜信號(hào)通過(guò)反傅里葉變換變換到時(shí)間域,作為輸出信號(hào); 所述步驟(5)中的估計(jì)出有效信號(hào)存在概率具體包括如下步驟: (51)根據(jù)所需波束寬度計(jì)算門(mén)限T1= NL sin(0)/Fs,其中N表示幀長(zhǎng),L表示傳聲器單元間距,Θ表示波束寬度,F(xiàn)s為采樣頻率; (52)計(jì)算各通道輸入信號(hào)在各頻率點(diǎn)相位差ω的和值pd(η,ω); (53)當(dāng)pd(n,ω)> ω (M_l)T1時(shí),該頻率點(diǎn)存在有效信號(hào)概率P1 (η,ω) = 1,否則Pi (η, ω) = O,其中,M表示傳聲器個(gè)數(shù)。
2.根據(jù)權(quán)利要求1所述的非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法,其特征在于,所述的步驟出)中的估計(jì)當(dāng)前幀是有效語(yǔ)音幀的概率具體包括如下步驟: (61)當(dāng)前幀能量
3.根據(jù)權(quán)利要求1或2所述的非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法,其特征在于,所述的傳聲器陣列為兩個(gè)傳聲器單元,該方法的具體步驟包括: (1)根據(jù)兩個(gè)傳聲器輸入信號(hào)計(jì)算參考背景噪聲信號(hào): r (n) = X1 (η) -χ2 (η); 其中,Xi (η)表不第i個(gè)傳聲器在時(shí)刻η的輸入信號(hào); (2)以背景噪聲信號(hào)作為參考信號(hào)對(duì)傳聲器信號(hào)進(jìn)行自適應(yīng)濾波初步去除傳聲器輸入信號(hào)中的噪聲,所述的自適應(yīng)濾波算法采用NLMS算法,具體描述如下: Wi (k, n) = Wi (k, η-1) - μ (n) ej (η) η (η) k = 0...K-1 ;
全文摘要
本發(fā)明涉及一種在非平穩(wěn)噪聲環(huán)境下傳聲器陣列的語(yǔ)音增強(qiáng)方法,通過(guò)利用通道之間的相位信息,準(zhǔn)確判斷有效信號(hào)的概率,以提高抗非平穩(wěn)噪聲干擾的性能。該方法估計(jì)出有效信號(hào)存在概率具體包括如下步驟(51)根據(jù)所需波束寬度計(jì)算門(mén)限T1=NL sin(θ)/Fs,其中N表示幀長(zhǎng),L表示傳聲器單元間距,θ表示波束寬度,F(xiàn)s為采樣頻率;(52)計(jì)算各通道輸入信號(hào)在各頻率點(diǎn)相位差ω的和值pd(n,ω);(53)當(dāng)pd(n,ω)>ω(M-1)T1時(shí),該頻率點(diǎn)存在有效信號(hào)概率p1(n,ω)=1,否則p1(n,ω)=0,其中,M表示傳聲器個(gè)數(shù)。本發(fā)明由于利用了通道之間的相位信息,使得對(duì)有效信號(hào)的概率判斷更加準(zhǔn)確,提高了拾取語(yǔ)音的信噪比,提高了整體性能,特別是抗非平穩(wěn)噪聲干擾性能。
文檔編號(hào)G10L21/0208GK103165137SQ201110427329
公開(kāi)日2013年6月19日 申請(qǐng)日期2011年12月19日 優(yōu)先權(quán)日2011年12月19日
發(fā)明者吳鳴, 楊飛然, 楊軍 申請(qǐng)人:中國(guó)科學(xué)院聲學(xué)研究所