基于非局部均值濾波的語音增強(qiáng)方法
【專利摘要】本發(fā)明公開了一種基于非局部均值濾波的語音增強(qiáng)方法,主要解決現(xiàn)有技術(shù)在語音增強(qiáng)后易產(chǎn)生音樂噪聲的問題。其實(shí)現(xiàn)步驟是:(1)輸入帶噪語音,計(jì)算帶噪語音信號(hào)功率譜;(2)對帶噪語音信號(hào)功率譜進(jìn)行修改譜減法預(yù)處理,得到帶噪語音估計(jì)功率譜;(3)由估計(jì)功率譜得到估計(jì)頻譜,再對估計(jì)頻譜進(jìn)行短時(shí)傅立葉逆變換,得到預(yù)處理后語音;(4)對預(yù)處理后語音進(jìn)行非局部均值濾波,計(jì)算語音修正值;(5)使用計(jì)算出來的修正值替代原始含噪語音信號(hào)。本發(fā)明為以非局部原理為基礎(chǔ),通過對待增強(qiáng)點(diǎn)鄰域內(nèi)的相似點(diǎn)進(jìn)行加權(quán)平均,既能抑制背景噪聲同時(shí)保持了語音清晰度,有效提高了語音質(zhì)量,可用于移動(dòng)通信。
【專利說明】基于非局部均值濾波的語音增強(qiáng)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于語音處理【技術(shù)領(lǐng)域】,具體地說是基于非局部均值濾波,利用信號(hào)鄰域內(nèi)相似信號(hào)點(diǎn)加權(quán)平均來降低語音噪聲,可用于移動(dòng)通信。
【背景技術(shù)】
[0002]語音是人類特有的功能,也是相互傳遞信息的最主要手段?,F(xiàn)實(shí)生活中的語音不可避免的要受到周圍環(huán)境的影響。一些較強(qiáng)的背景噪聲,如機(jī)械噪聲、其他說話者的語音等均會(huì)嚴(yán)重的影響語音信號(hào)的質(zhì)量。此外,傳輸系統(tǒng)本身也會(huì)產(chǎn)生各種噪聲,因此在接收端的信號(hào)為帶噪語音信號(hào)。語音增強(qiáng)的主要目標(biāo)就是在接收端盡可能從帶噪語音中提取純凈的語音信號(hào),降低聽眾的聽覺疲勞程度,提高可懂度。
[0003]語音增強(qiáng)是語音信號(hào)處理的一個(gè)重要分支,一直活躍的研究領(lǐng)域。人們對語音增強(qiáng)的研究已有一個(gè)世紀(jì)的歷史。早在上個(gè)世紀(jì)初,Bell實(shí)驗(yàn)室的研究人員就對電話系統(tǒng)的音節(jié)清晰度進(jìn)行了系統(tǒng)的實(shí)驗(yàn)。七十年代后期,電子計(jì)算機(jī)技術(shù)的進(jìn)步促進(jìn)了語音信號(hào)處理技術(shù)的迅速發(fā)展。譜減法是這個(gè)時(shí)期最具影響的語音增強(qiáng)算法。在八十年代至今,語音識(shí)別與移動(dòng)通信技術(shù)的飛速發(fā)展為語音增強(qiáng)的研究提供了動(dòng)力,各種新算法以及原有算法的改進(jìn)形式相繼問世。如基于信號(hào)子帶空間的語音增強(qiáng)算法;利用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)語音增強(qiáng)的方法;基于小波分解的濾波方法;最小均方誤差濾波麗SE ;對數(shù)譜最小均方誤差估計(jì) LSA-MMSE 等。
[0004]語音信號(hào)是一個(gè)非平穩(wěn)信號(hào),但在10_30ms —段時(shí)間內(nèi)可以認(rèn)為人的聲帶、聲道等特征基本不變,語音 的短時(shí)譜具有相對的穩(wěn)定性和較強(qiáng)的相關(guān)性,而噪聲的前后相關(guān)性很弱,所以可以利用短時(shí)譜這種特性進(jìn)行語音增強(qiáng),由于人耳對相位的信息不敏感,僅考慮幅度的估計(jì)即可。因此,基于短時(shí)譜幅度估計(jì)shorttimespectralamplitude的語音增強(qiáng)算法,是現(xiàn)在人們研究較多的一種語音增強(qiáng)技術(shù)。
[0005]上述傳統(tǒng)的語音增強(qiáng)方法,由于需要得到準(zhǔn)確的噪聲功率譜和先驗(yàn)信噪比,而現(xiàn)實(shí)中噪聲功率譜和先驗(yàn)信噪比的準(zhǔn)確估計(jì)是難以實(shí)現(xiàn)的,因而導(dǎo)致語音增強(qiáng)后背景易殘留噪聲,影響聽覺質(zhì)量。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于針對上述已有技術(shù)的問題,提出一種基于非局部的語音增強(qiáng)方法,以有效避免對噪聲功率譜和先驗(yàn)信噪比準(zhǔn)確估計(jì)的過分依賴,減少語音背景中平穩(wěn)或非平穩(wěn)噪聲,提高語音清晰度。
[0007]為實(shí)現(xiàn)上述目的,本發(fā)明包括如下步驟:
[0008]I)采集帶噪語音y (i),以每幀256個(gè)語音點(diǎn)將帶噪語音分為N幀,幀間重疊128個(gè)點(diǎn),并逐幀加漢明窗,通過短時(shí)傅里葉變換獲得逐幀的頻譜Υλ(ω),進(jìn)而得到帶噪語音逐中貞功率譜|yλ (ω) I2,i表示時(shí)域信號(hào)離散點(diǎn)序列,1 = 1,2,...,m,m表示語音序號(hào)總數(shù)目,λ表示幀序列數(shù),λ = I, 2,..., N, ω表示離散頻率點(diǎn),ω = I, 2,..., 256 ;[0009]2)根據(jù)帶噪語音前η幀功率譜I Υλ (ω) |2,得到噪聲估計(jì)功率譜|N(w) |2:
[0010]
【權(quán)利要求】
1.一種基于非局部均值濾波的語音增強(qiáng)方法,包括如下步驟: 1)采集帶噪語音I(i),以每幀256個(gè)語音點(diǎn)將帶噪語音分為N幀,幀間重疊128個(gè)點(diǎn),并逐幀加漢明窗,通過短時(shí)傅里葉變換獲得逐幀的頻譜Υλ (ω ),進(jìn)而得到帶噪語音逐幀功率譜|Υλ (ω) |2,i表示時(shí)域信號(hào)離散點(diǎn)序列,i = 1,2,...,m,m表示語音序號(hào)總數(shù)目,λ表示中貞序列數(shù),λ = I, 2,..., N, ω表示離散頻率點(diǎn),ω = I, 2,..., 256 ; 2)根據(jù)帶噪語音前η幀功率譜IΥλ (ω) 12,得到噪聲估計(jì)功率譜IN (w) |2:
2.根據(jù)權(quán)利要求書I所述的基于非局部均值濾波的語音增強(qiáng)方法,其中步驟6)所述的用非局部均值濾波算法計(jì)算出語音信號(hào).?.(/)內(nèi)所有語音點(diǎn)的修正值,按如下步驟進(jìn)行: 6a)對于語音點(diǎn)i,以其當(dāng)前位置為中心,在語音點(diǎn)i的鄰域內(nèi)左右各取f個(gè)語音點(diǎn)構(gòu)成一列向量為;再在其鄰域內(nèi)左右各取t個(gè)語音點(diǎn)構(gòu)成搜索窗Λ,Δ內(nèi)各語音點(diǎn)的位置依次用j標(biāo)記,j = 1,2,...,2t+l,對于搜索窗內(nèi)第j個(gè)語音點(diǎn),以其當(dāng)前位置為中心,在其鄰域內(nèi)左右各取f個(gè)語音點(diǎn)構(gòu)成另一列向量:?, 6b)根據(jù)步驟6a)所取的兩列向量,將語音點(diǎn)i與其搜索窗內(nèi)語音點(diǎn)j的相似性權(quán)值表示為
【文檔編號(hào)】G10L21/0232GK103971697SQ201410227922
【公開日】2014年8月6日 申請日期:2014年5月27日 優(yōu)先權(quán)日:2014年5月27日
【發(fā)明者】鐘樺, 焦李成, 周偉, 田小林, 王爽, 侯彪, 王桂婷, 馬文萍, 尚榮華 申請人:西安電子科技大學(xué)