本發(fā)明具體涉及一種基于寬帶噪聲的同態(tài)濾波語音增強方法,屬于語音處理方法
技術領域:
。
背景技術:
:實際環(huán)境中語音信號處理技術包含著很多方面,而語音增強技術是其中解決語音受噪聲污染的有效方法之一,它所研究的目標就是系統(tǒng)輸出盡可能的從帶噪語音信號中提取純凈的語音信號,提高傳輸質量;而傳統(tǒng)的語音增強技術也有很多種,有譜減法、中心濾波法、同態(tài)濾波抗噪法、非線性處理法,自適應分析方法、小波分析方法等等,噪聲的處理過程中,根據(jù)語音不同的特性,人耳的感知特性,不同的噪聲性質,將選用不同的語音增強方法。傳統(tǒng)的同態(tài)濾波抗噪法在同態(tài)處理時,許多情況下倒譜中的基音峰值將變得不清晰甚至會消失,在語音信號與噪聲信號分離時,容易產生相位多值性問題,即相位卷繞,會造成提取的特征參數(shù)誤差過大,很難恢復原始的語音信號,不能滿足系統(tǒng)的實時性;傳統(tǒng)的自相關分析方法在自相關處理時容易產生二次諧波,不易直接對帶噪語音信號的自相關系數(shù)做特征提取,以達到語音增強的目的,并且自相關分析要求信號要有很強的周期性,否則自相關函數(shù)類似于噪聲的高頻波形,更不易除噪分析;傳統(tǒng)的中心濾波法在語音增強時會造成語音質量的損壞,中心濾波法的門限選擇很重要,很容易損失語音信號的相關信息,且只能在頻域中分析;傳統(tǒng)的譜減法由于語音能量較集中在某頻段內,語音增強處理后,仍然會有大量的殘余噪聲,在除噪過程中,如果不能消除大功率分量的噪聲,語音信號中仍然容易產生純音噪聲。針對傳統(tǒng)方法語音增強時存在的問題,目前,也有很多不同背景噪聲環(huán)境下的語音增強的新方法研究,白噪聲下基于各向異性濾波的語音增強算法研究[j].佳木斯大學學報(自然科學版),2015,06:902-904,提出在白噪聲為背景噪聲的情況下,采用各向異性濾波方法,具有較好的濾波性能,其算法復雜度低,計算量小,運行時間較短;改進小波閾值函數(shù)的語音增強算法研究[j].信號處理,2016,02:203-213,是采用改進小波閾值函數(shù)的語音增強算法來有效提升語音信號的可懂度和整體質量;基于倒譜預處理技術的語音增強算法研究[j].科學技術與工程,2013,21:6111-6117,采用倒譜預處理通過抑制語音中濁音的諧頻成分,避免在非平穩(wěn)噪聲跟蹤過程中將語音濁音信號功率譜錯誤估計成噪聲功率譜,快速有效跟蹤噪聲的同時能避免噪聲功率譜過估,來提高語音的傳輸質量;低信噪比條件下的語音增強算法研究[j].中國新通信,2015,15:73-74,針對低信噪比背景條件下,譜減算法在話音增強方面存在著音樂噪聲問題和低清晰度問題,提出了基于倒譜距離和譜減算法的話音增強算法。短時自相關分析是語音信號時域分析中常用的方法,定義語音信號sn(m)的短時自相關函數(shù)zn(k)的計算表達式如下:其中,l是最大延遲點數(shù)。自相關處理抗噪法,濾波后諧波分量減少了,曲線變得平滑,但仍存在二次諧波,峰值仍然不是很尖銳,在提取語音信號特征時仍然容易產生誤差。傳統(tǒng)的同態(tài)濾波抗噪法,語音信號的倒譜第一峰值仍然不是很明顯,原點與第二峰值間的高頻分量較多,這會影響觀察特征值的準確性。降噪后的語音信號仍然會存在較多的殘留噪聲。技術實現(xiàn)要素:因此,針對現(xiàn)有技術在提取語音信號特征時仍然容易產生誤差,以及降噪后的語音信號仍然會存在較多的殘留噪聲的問題,本發(fā)明提供一種基于寬帶噪聲的同態(tài)濾波語音增強方法。所述方法具體為:獲取短時平穩(wěn)的語音信號,然后對語音信號進行自相關分析,得到自相關系數(shù),再將自相關系數(shù)做同態(tài)濾波分析處理,同態(tài)濾波分析處理時,求出帶噪語音信號的倒譜,清除帶噪語音信號的倒譜的噪聲成分,得到增強語音的倒譜,經過譜分析獲得降噪后的特征參數(shù),合成降噪后的語音信號。進一步的,所述方法中對語音信號進行自相關分析,得到自相關系數(shù)具體為:設語音信號sn(m)所占的間隔是[0,n-1],則語音信號的短時自相關為:其中,l是最大延遲點數(shù)。進一步的,所述方法中將自相關系數(shù)做同態(tài)濾波分析處理具體為:自相關系數(shù)fft變換rn(ejw);對rn(ejw)的實部作對數(shù)運算可得:對結果進行fft逆變換得到改進的cn(m):本發(fā)明的有益效果在于:本發(fā)明提供一種基于寬帶噪聲的同態(tài)濾波語音增強方法,通過對傳統(tǒng)方法的改進,優(yōu)于傳統(tǒng)方法,其平均相對誤差更小,準確性更高,將更有利于語音識別和語音合成。改進的同態(tài)濾波抗噪法能夠增強語音倒譜特征對環(huán)境噪聲的魯棒性,較準確的得到語音的特征信息,其頑健性更好,能夠更好的達到語音增強的目的。附圖說明圖1為實施例中自相關抗噪法的處理流程圖;圖2為實施例中自相關抗噪法中原始的語音信號“你好”的波形圖;圖3為在圖2中截取一幀語音信號做自相關分析示意圖;圖4為傳統(tǒng)的自相關抗噪法語音增強的仿真效果圖;圖5為傳統(tǒng)的同態(tài)濾波抗噪法流程圖;圖6為傳統(tǒng)的同態(tài)濾波抗噪法效果圖;圖7為傳統(tǒng)的同態(tài)濾波特征提取示意圖;圖8為改進的同態(tài)濾波抗噪法流程圖;圖9為改進的同態(tài)濾波抗噪法語音增強的仿真效果圖;圖10為改進的同態(tài)濾波輸出提取語音信號的特征參數(shù)仿真圖。具體實施方式下面結合附圖對本發(fā)明的具體實施方式進行說明:本發(fā)明在傳統(tǒng)的自相關處理抗噪法和傳統(tǒng)的同態(tài)濾波抗噪法基礎上改進,設計了改進的同態(tài)濾波抗噪法。傳統(tǒng)的自相關抗噪法自相關處理抗噪法對帶噪聲的語音信號進行自相關分析,可以得到與不帶噪聲的語音信號同樣的自相關序列,語音信號的自相關與噪聲無關,因此,帶噪語音信號的自相關可以近似為純凈語音信號的自相關,所以,將自相關系數(shù)作為語音處理系統(tǒng)的特征值,就可以達到抗噪聲的目的。自相關抗噪法的處理流程如圖1所示。在普通室內環(huán)境采用cooledit錄制女生帶噪語音信號“你好”,采樣頻率為22khz,單聲道,如圖2所示。截取一幀語音信號做自相關分析,如圖3所示。圖3可以看出,原始的一幀帶噪語音信號有一定的周期性,但諧波分量較多,峰值不是很尖銳,在特征參數(shù)的提取過程中會產生一定的誤差。對原始的帶噪語音信號采用傳統(tǒng)的自相關抗噪法語音增強的仿真效果如圖4所示。通過仿真圖4可以看出,濾波后諧波分量減少了,曲線變得平滑,但仍存在二次諧波,峰值仍然不是很尖銳,在提取語音信號特征時仍然容易產生誤差。傳統(tǒng)的同態(tài)濾波抗噪法語音信號不是加性信號,而是卷積性信號。為了能用線性系統(tǒng)對其進行處理,可以先采用卷積同態(tài)系統(tǒng)處理。假設被處理的語音信號s(n)所占用的間隔是[0,n-1],這里所用的間隔長度n可以選擇大于實際的長度;n的大小決定著倒譜c(n)中是否存在有混疊,代表著離散時域頻譜是否有更佳的分辨率。當n大于s(n)的實際長度時,可以在s(n)的后方添若干個零來補足所需的長度,這稱為“補零”。若語音信號s(n)經過同態(tài)濾波可以還原原始的語音信號,則證明該語音信號不存在混疊失真,可以直接求出語音信號s(n)的倒譜c(n)。設:則對其取對數(shù)可得:復數(shù)的對數(shù)仍然是復數(shù),它包含實部和虛部;對數(shù)的虛部arg[s(ejw)]由于是s(ejw)的相位,所以將產生不一致性。如果我們只考慮的實部,并令c(n)=f-1ln|s(ejw)|(公式c)c(n)是可以認為是語音信號s(n)對數(shù)幅度譜的傅里葉逆變換,c(n)稱為“倒譜”。那么,傳統(tǒng)的同態(tài)濾波抗噪法流程圖如圖5所示。其中,a為短時語音信號;b為短時頻譜;c為對數(shù)頻譜;d為倒譜系數(shù);e為對數(shù)頻譜包絡;f為基本周期。對原始的帶噪語音信號采用傳統(tǒng)的同態(tài)濾波抗噪法,語音增強的仿真效果如圖6所示。通過仿真圖6可以看出,采用傳統(tǒng)的同態(tài)濾波抗噪法后,語音信號的倒譜第一峰值仍然不是很明顯,原點與第二峰值間的高頻分量較多,這會影響觀察特征值的準確性。對傳統(tǒng)的同態(tài)濾波輸出提取語音信號的特征參數(shù),如圖7所示。從圖7可以看出,傳統(tǒng)的同態(tài)濾波輸出,接近原點的第一峰值坐標為(12,0.12),第一峰值比較平滑,特征提取時會造成較大的誤差,降噪后的語音信號仍然會存在較多的殘留噪聲。本發(fā)明的方法在本發(fā)明中,采用改進的同態(tài)濾波抗噪法對語音信號的前期處理和傳統(tǒng)的同態(tài)濾波抗噪法是一樣的,語音信號都必須先進行數(shù)字化和預處理,獲取短時平穩(wěn)的語音信號,然后對其信號進行自相關分析,得到自相關系數(shù),再將自相關系數(shù)做同態(tài)濾波分析,同態(tài)處理時,求出帶噪語音信號的倒譜,清除帶噪語音信號的倒譜的噪聲成分,得到增強語音的倒譜,并經過譜分析獲得降噪后的特征參數(shù),合成降噪后的語音信號,到達語音增強的目的,具體算法流程如圖8所示。其中,a為短時語音信號;b為自相關系數(shù);c為自相關短時頻譜;d為自相關對數(shù)頻譜;e為改進的倒譜系數(shù);f為對數(shù)頻譜包絡;g為基本周期。1)求短時語音信號的自相關:設語音信號sn(m)所占的間隔是[0,n-1]。則語音信號的短時自相關為:2)對自相關系數(shù)同態(tài)處理:a)自相關系數(shù)fft變換rn(ejw);b)對rn(ejw)的實部作對數(shù)運算可得:c)對上面的結果進行fft逆變換得到改進的cn(m):對原始的帶噪語音信號采用改進的同態(tài)濾波抗噪法,語音增強的仿真效果如圖9所示;通過仿真圖9可以看出,采用改進的同態(tài)濾波抗噪法,諧波分量明顯減少了,周期性變得更加清楚,這將提高帶噪語音信號特征參數(shù)提取的準確性。對改進的同態(tài)濾波輸出提取語音信號的特征參數(shù)仿真如圖10所示。從圖10可以看出,改進的同態(tài)濾波輸出,接近原點的第一峰值坐標為(11,0.34),第一峰值比較尖銳,更接近原點,會提高特征提取的準確性,可以更好的合成降噪后的語音信號,從而到達語音增強的目的。本發(fā)明方法與傳統(tǒng)同態(tài)濾波抗噪法的比對分析為進一步比較傳統(tǒng)同態(tài)濾波抗噪法和本發(fā)明相關-同態(tài)濾波抗噪法的性能,對帶噪語音錄音進行20次的實驗仿真。使用兩種算法進行信噪比的比對分析,進行10次語音信號大信噪比和10次語音信號小信噪比的比對,并計算平均相對誤差(百分比)。實驗結果大信噪比語音信號平均相對誤差如表1所示,小信噪比語音信號平均相對誤差如表2所示。表1檢測算法傳統(tǒng)同態(tài)濾波相關-同態(tài)濾波平均相對誤差0.550.46表2檢測算法傳統(tǒng)同態(tài)濾波相關-同態(tài)濾波平均相對誤差20.315.9由以上帶噪語音信號信噪比的比對分析可得,相關-同態(tài)濾波法優(yōu)于傳統(tǒng)同態(tài)濾波法,其平均相對誤差更小,準確性更高,將更有利于語音識別和語音合成。噪聲可以是加性噪聲,也可以是非加性噪聲,而說話時呼吸引起的寬帶噪聲為非加性噪聲,需要采用同態(tài)濾波轉為加性噪聲,對純凈的語音信號和噪聲信號進行分離,提出純凈語音信號,在上述分析中,可以看出,改進的同態(tài)濾波抗噪法能夠增強語音倒譜特征對環(huán)境噪聲的魯棒性,較準確的得到語音的特征信息,其頑健性更好,能夠更好的達到語音增強的目的。以上是本發(fā)明的優(yōu)選實施方式,應當指出,對于本
技術領域:
的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。當前第1頁12