專利名稱:用于噪聲活動檢測的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本公開一般地涉及用于例如噪聲削減系統(tǒng)中的噪聲活動檢測器。
背景技術(shù):
在諸如回聲消除、語音識別、語音編碼、IP電話的許多信號處理應(yīng)用中,并且尤其 是在噪聲削減系統(tǒng)中,收集關(guān)于信號中的噪聲的實(shí)時信息和統(tǒng)計(jì)量是重要的。這最常見的 是通過檢測何時存在有用數(shù)量的所希望的信號,并且將信號的這個部分視為“非噪聲”來實(shí) 現(xiàn)的。在其它時刻,認(rèn)為信號僅是噪聲,并且在這些時間期間收集所希望的信息和統(tǒng)計(jì)量。在單信道系統(tǒng)中,噪聲和所希望的信號混合在一起,并且進(jìn)入的混合噪聲信號被 認(rèn)為是所希望的信號和不需要的噪聲的線性和。通過檢測混合信號中何時有所希望的信號 出現(xiàn),在這部分信號期間不更新噪聲信息。而是在其它時刻對噪聲特性的更新允許以適合 的處理執(zhí)行噪聲削減。在語音通信系統(tǒng)中,確定僅有噪聲的時期的出現(xiàn)的需要已經(jīng)引發(fā)了多種語音確定 方法的激增,由于混合信號的語音部分是所希望的部分,它們通常被稱為語音檢測或語音 活動檢測(VAD)方法。這些方法依賴這樣的事實(shí),即,說話的人必須至少聽到其自己的聲音的一部分,以 便正確組織其話語。為了可靠地聽到自己的談話,說話的人必須將其自己的語音保持為高 于環(huán)境或背景噪聲級別大約10dB。因此,在存在大的背景噪聲時,說話的人自然提高其聲音 級別,并且將其保持為略高于競爭的背景噪聲級別。不論是在時域中還是在頻域中實(shí)現(xiàn)的語音活動檢測方法利用這種事實(shí)。許多這種 系統(tǒng)基于檢測進(jìn)入噪聲信號的總能量高于一個閾值,并且當(dāng)滿足這種條件時指示存在語音 的裝置。當(dāng)然,該閾值必須被調(diào)整為總是在信號的背景噪聲部分的級別之上,但是在組合的 語音加噪聲級別的級別之下。出于這個目的,已經(jīng)設(shè)計(jì)了許多復(fù)雜的方法,以便創(chuàng)建這種實(shí) 時的動態(tài)閾值調(diào)整。然而,這些“逆向”方法-即,檢測所希望的信號從而可以暗示噪聲時期,而不是 直接檢測噪聲部分本身,具有缺點(diǎn)。例如,在大約90dB SPL(聲壓級別)之上的噪聲中,人 們幾乎不可能進(jìn)一步提高其語音的音量,并且輸入信號的SNR(信噪比)通常降低到低于 0dB(l 1)。當(dāng)SNR變低,例如,低于IOdB時,常規(guī)的語音檢測系統(tǒng)工作得不好,或完全不能工 作。只要語音信號功率顯著地高于噪聲信號功率,這種系統(tǒng)就能夠檢測到語音的出現(xiàn)。但 是在越發(fā)嘈雜的情況下,語音檢測準(zhǔn)確性下降,直到這些系統(tǒng)完全不能工作。另一個顯著的問題是對風(fēng)噪的檢測,風(fēng)噪是空氣流過語音檢測系統(tǒng)中使用的麥克風(fēng)時產(chǎn)生的噪聲。隨著移動通信設(shè)備的激增,風(fēng)噪成為是至關(guān)重要的。這種噪聲可以表現(xiàn) 出高度可變的屬性,并且因此這些系統(tǒng)通常會對風(fēng)的噪聲錯誤地分類。當(dāng)出現(xiàn)這種情況時, 由于噪聲模板的不正確更新,可能會損害基于VAD的噪聲削減系統(tǒng)的噪聲削減。對于被正 確分類的風(fēng)噪,必須以更大的復(fù)雜性和更多花費(fèi)的代價實(shí)現(xiàn)附加的方法或處理以便對風(fēng)噪進(jìn)行可靠地檢測。常規(guī)語音檢測方案的另一個難點(diǎn)是語音信號不會突然終止,而是在每個發(fā)音后慢 慢地衰減。盡管語音仍然存在,但當(dāng)語音信號的衰退的尾部下降到閾值級別之下時,基于噪 聲功率閾值之上的語音功率的語音檢測會錯誤地指示發(fā)音的結(jié)束。因此,這些系統(tǒng)通常增 加所謂的“拖尾”定時器以便延遲噪聲開始的指示。經(jīng)典的語音檢測方法假設(shè)背景噪聲是靜態(tài)的或僅僅緩慢地改變。在非靜態(tài)噪聲狀 態(tài)下,由于噪聲級別的迅速改變,經(jīng)典語音檢測方案是不可靠的,尤其是不能將噪聲上跳與 語音串的開始加以區(qū)分,并且因此將給出語音存在的錯誤指示。這種語音檢測器還對用戶語音之外的附近語音的存在有所反應(yīng),即使在用戶自己 的語音是唯一所希望的信號的系統(tǒng)中背景語音實(shí)際上是“噪聲”的情況下亦是如此。另外,幾乎所有語音檢測方法依賴于基于信號先前歷史而不是基于當(dāng)前瞬時狀態(tài) 的一個或多個閾值的設(shè)置或更新。由于依賴先前信息,這些閾值不能被快速更新,并且語音 檢測輸出對背景噪聲的快速改變反應(yīng)緩慢,從而會產(chǎn)生錯誤直到系統(tǒng)可被最終調(diào)整為止。通過給信號功率閾值檢測的基本原理增加某些改進(jìn),在歷史上已經(jīng)對語音檢測的 這些問題給予了關(guān)注。這些改進(jìn)包括用于追蹤噪聲級別以便實(shí)時更新閾值的方法、增加單 獨(dú)的風(fēng)檢測器方案、允許以更高精度設(shè)置閾值以便在較低SNR狀態(tài)下工作的提高了靈敏度 的方法、增加防止當(dāng)發(fā)音的結(jié)尾簡單地是下降到閾值之下時錯誤地指示發(fā)音結(jié)束的拖尾方 法、和創(chuàng)建等待比任意預(yù)期自然出現(xiàn)的發(fā)音時段更長的時間的鎖定時期,在該時段后允許 更迅速地調(diào)整閾值,以便試圖適應(yīng)背景噪聲級別中的突發(fā)或階躍。然而,使用這些改進(jìn)仍然 產(chǎn)生受限的操作,并且仍然導(dǎo)致對僅有噪聲信號狀態(tài)的錯誤檢測。已經(jīng)創(chuàng)建了依賴于對諸如來自傳感器或麥克風(fēng)陣列的多于一個信號的可獲得性 的其它語音檢測方法。然而,這些系統(tǒng)具有很大的缺點(diǎn),即,僅當(dāng)可獲得多個信號時,或僅在 可以提供多個傳感器的情況下這些方法才能工作。另外,它們增加了這些系統(tǒng)的復(fù)雜性、成 本、大小和功耗。已知的其它解決方案依賴于復(fù)雜的信號處理計(jì)算,諸如自相關(guān)、互相關(guān)、方差、線 性預(yù)測編碼(LPC)系數(shù)、各種統(tǒng)計(jì)噪聲預(yù)測器(例如,高斯、拉普拉斯和伽馬分布)、靜態(tài)測 量等。一般地,這些解決方案不能顯著提高性能,并且仍然旨在檢測發(fā)音時段,而不是檢測 僅有噪聲的時段本身。
發(fā)明內(nèi)容
如此處描述的,一種用于檢測信號中的噪聲活動的方法包括a)計(jì)算信號在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用平均能量產(chǎn)生對與頻率相關(guān)的閾值函數(shù)的動態(tài)修改;d)識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識別出的具有該閾值之上的能量的頻率分 量的平均能量;e)識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的能量的頻率分量, 并且確定第二平均能量值,第二平均能量值表示識別出的具有該閾值之下的能量的頻率分量的平均能量; f)給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對獲得的第一平均能量值和第二平均能量值彼此進(jìn)行 比較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能 量值,則指示噪聲活動的出現(xiàn)。此處還描述了一種用于產(chǎn)生對信號中的噪聲活動的指示的噪聲活動檢測器,包 括a)第一電路,配置為計(jì)算關(guān)鍵頻帶中的平均能量;b)第二電路,配置為確定與頻率相關(guān)的閾值函數(shù);c)第三電路,配置為使用該平均能量產(chǎn)生對與頻率相關(guān)的閾值函數(shù)的動態(tài)修改;d)第四電路,配置為識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的 能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識別出的具有該閾值之 上的能量的頻率分量的平均能量;e)第五電路,配置為識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的 能量的頻率分量,并且確定第二平均能量值,第二平均能量值表示識別出的具有該閾值之 下的能量的頻率分量的平均能量;f)第六電路,配置為給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移 值;g)第七電路,配置為在應(yīng)用所述偏移值之后,對第一和第二平均能量值彼此進(jìn)行 比較;和h)第八電路,配置為如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于 獲得的第二平均能量值,則指示噪聲活動的出現(xiàn)。此處還描述了一種用于產(chǎn)生對信號中的噪聲活動的指示的噪聲活動檢測器,包 括a)用于計(jì)算信號在關(guān)鍵頻帶中的平均能量的裝置;b)用于確定與頻率相關(guān)的閾值函數(shù)的裝置;c)用于使用該平均能量產(chǎn)生對與頻率相關(guān)的閾值函數(shù)的動態(tài)修改的裝置;d)用于識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的能量的頻率 分量,并且確定第一平均能量值的裝置,第一平均能量值表示識別出的具有該閾值之上的 能量的頻率分量的平均能量;e)用于識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的能量的頻率 分量,并且確定第二平均能量值的裝置,第二平均能量值表示識別出的具有該閾值之下的 能量的頻率分量的平均能量;f)用于給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移值的裝置;g)用于在應(yīng)用所述偏移值之后,對獲得的第一平均能量值和第二平均能量值彼此 進(jìn)行比較的裝置;和h)用于如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平 均能量值,則指示噪聲活動的出現(xiàn)的裝置。
此處還描述了一種機(jī)器可讀的程序存儲設(shè)備,該程序存儲設(shè)備包含有用于執(zhí)行產(chǎn) 生對信號中的噪聲活動的指示的方法的機(jī)器可執(zhí)行指令的程序,該方法包括a)計(jì)算信號在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用平均能量產(chǎn)生對與頻率相關(guān)的閾值函數(shù)的動態(tài)修改;d)識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的能量的頻率分量, 并且確定第一平均能量值,第一平均能量值表示識別出的具有該閾值之上的能量的頻率分 量的平均能量;e)識別信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的能量的頻率分量, 并且確定第二平均能量值,第二平均能量值表示識別出的具有該閾值之下的能量的頻率分 量的平均能量;f)給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對第一和第二平均能量值彼此進(jìn)行比較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能 量值,則指示噪聲活動的出現(xiàn)。
結(jié)合在本說明書中并且構(gòu)成本說明書的一部分的附圖示出了實(shí)施例的一個或多 個例子,并且與對示例實(shí)施例的描述一起用于解釋這些實(shí)施例的原理和實(shí)現(xiàn)。在附圖中圖1-7是相應(yīng)于不同聲音狀態(tài)的測量數(shù)據(jù)的圖,并且每個圖包括作為表示噪聲功 率的曲線的模型的長虛線;圖8是典型通信系統(tǒng)前端的方框圖,示出了可以在其中使用噪聲活動檢測器 (NAD) 20的上下文;圖9是可由NAD 20執(zhí)行的各種步驟或任務(wù)的流程圖;圖10是實(shí)現(xiàn)在圖9的流程圖中提出的任務(wù)的電路的方框圖;圖11是示出了使用NAD20的設(shè)備的性能的圖。
具體實(shí)施例方式此處,在處理器或單獨(dú)電路或所執(zhí)行的處理的流程圖的上下文中描述示例實(shí)施 例。本領(lǐng)域的普通技術(shù)人員將會認(rèn)識到,下面的描述僅是說明性的,并且不旨在以任何方式 作為限制。受益于本公開的本領(lǐng)域的技術(shù)人員容易構(gòu)想其它實(shí)施例?,F(xiàn)在詳細(xì)參考附圖中 示出的示例實(shí)施例的實(shí)現(xiàn)。在附圖和下面的描述中盡可能使用相同的參考指示符指示相同 或類似的項(xiàng)目。為了清楚起見,未示出和描述此處描述的實(shí)現(xiàn)的所有常規(guī)特征。當(dāng)然,應(yīng)當(dāng)明了, 在任意這種實(shí)際實(shí)現(xiàn)的開發(fā)中,必須做出若干特定于實(shí)現(xiàn)的決策,以便實(shí)現(xiàn)開發(fā)者的特定 目標(biāo),諸如對與應(yīng)用和商業(yè)相關(guān)的限制的符合性,并且這些特定的目標(biāo)將根據(jù)實(shí)現(xiàn)的不同 以及開發(fā)者的不同而改變。另外,應(yīng)當(dāng)明了,這種研發(fā)實(shí)踐可能是復(fù)雜并且費(fèi)時的,但是對 于受益于本公開的本領(lǐng)域的普通技術(shù)人員來說,仍然是工程上的例行任務(wù)。
根據(jù)本公開,可以使用各種類型的操作系統(tǒng)、計(jì)算平臺、計(jì)算機(jī)程序和/或通用機(jī)器實(shí)現(xiàn)此處描述的組件、處理步驟和/或數(shù)據(jù)結(jié)構(gòu)。另外,本領(lǐng)域的普通技術(shù)人員將認(rèn)識 至|J,還可以使用通用屬性較弱的設(shè)備,諸如硬布線設(shè)備、現(xiàn)場可編程門陣列(FPGA)、專用集 成電路(ASIC)等,而不脫離此處公開的創(chuàng)造性概念的范圍和精神。在以計(jì)算機(jī)或機(jī)器實(shí)現(xiàn) 包括一系列處理步驟的方法,并且這些處理步驟可被存儲為一系列機(jī)器可讀的指令的情況 下,它們可被存儲在諸如計(jì)算機(jī)存儲器設(shè)備(例如,R0M(只讀存儲器)、PROM(可編程只讀 存儲器)、EEPROM(電可擦除可編程只讀存儲器)、閃存、Jump Drive等)、磁存儲介質(zhì)(例 如,磁帶、磁盤驅(qū)動器等)、光學(xué)存儲介質(zhì)(例如,⑶-R0M、DVD-R0M、紙卡、紙帶等)和其它類 型的程序存儲器的有形介質(zhì)上。此處公開的噪聲檢測器,也被稱為噪聲活動檢測器(NAD),基于噪聲與其它信號 的特性,特別是所希望信號的特性,不相同的獨(dú)特特性。一般地,它適合于檢測信號僅為噪 聲的時段,并且因此尤其適用于諸如噪聲削減系統(tǒng)的系統(tǒng),在這些系統(tǒng)中,為了實(shí)現(xiàn)系統(tǒng)功 能,必須具有關(guān)于僅有噪聲的時段的知識。特別地,此處公開的布置涉及對混合麥克風(fēng)輸入 信號中僅有聲學(xué)噪聲的時段的可靠檢測,所述麥克風(fēng)輸入信號可以包含語音、風(fēng)噪和聲學(xué) 背景噪聲。一種替換用途是作為語音活動檢測器。更具體地,其涉及在諸如,尤其是,蜂窩 電話、Bluetooth 無線耳機(jī)、語音命令和控制以及自動語音識別的語音級通信系統(tǒng)和設(shè) 備中的使用。出于本討論的目的,識別三類聲音聲噪、風(fēng)噪和語音。圖1是以測量信號功率的分貝(dB)相對于赫茲(Hz)頻率繪制的,由在擁擠的 餐館內(nèi)講話的大量人產(chǎn)生的環(huán)境背景噪聲的測量數(shù)據(jù)的圖??紤]相應(yīng)于大約300HZ到 3,OOOHz的人類語音通信頻帶的感興趣的頻帶,測量的噪聲功率隨著頻率增加以每倍頻程 大約6dB的速率下降。為了方便下面的詳細(xì)描述,確定從大約250Hz到大約2,500Hz的頻 率范圍上的平均功率級別。圖1的示例測量數(shù)據(jù)的平均功率級別大約為_50db,并且在圖中 被以短虛線表示。另外,構(gòu)造長虛線以便模擬表示實(shí)際噪聲功率的曲線。對于這種數(shù)據(jù)和 這個特定的例子,該模型線被選擇為是具有每倍頻程_6dB的斜率的直線。應(yīng)當(dāng)理解,術(shù)語 “線”不限于直線,并且每倍頻程_6db的說明性斜率不是限制,還可以設(shè)想其它正負(fù)斜率。注意模型曲線(長虛線)與平均噪聲級別線(短虛線)在略微高于700Hz的被稱 為有效頻率處相交是有益的。將在下面更詳細(xì)地解釋這種有效頻率的意義,以及選擇和構(gòu) 造模型曲線的方式。假設(shè)已經(jīng)正確地確定了該模型曲線(長虛線)以便相對準(zhǔn)確地對應(yīng)典型噪聲功 率頻率特性形狀,通過抬高或降低模型曲線,直到模型曲線在大約250Hz到大約2,500Hz 的所選帶寬上的平均功率和測量數(shù)據(jù)的實(shí)際平均噪聲功率相同為止,使得模型曲線在大約 250Hz到大約2,500Hz的所選擇的帶寬上的平均功率等于測量數(shù)據(jù)的實(shí)際平均噪聲功率。 這被通過在數(shù)學(xué)上求解使得平均模型功率匹配實(shí)際平均測量功率的模型的幅值來實(shí)現(xiàn)。然 后可以確定該模型和實(shí)際平均功率線交叉(即,相等)處的有效頻率。實(shí)際上,模型曲線 穿過平均功率線,從而當(dāng)被繪制在幅值平方相對于頻率的圖上時(未示出),在有效頻率交 點(diǎn)上下在模型曲線和平均功率線之間產(chǎn)生相等的面積??梢妼τ谶@種數(shù)據(jù),當(dāng)它們在近似 700Hz處交叉時,具有_6dB斜率的模型提供了對噪聲數(shù)據(jù)特性的緊密近似。因此,700Hz被 確定為這種數(shù)據(jù)的有效頻率。應(yīng)當(dāng)認(rèn)識到,測量數(shù)據(jù)的形狀取決于特定信號拾取系統(tǒng)的特性。對于其它系統(tǒng),彎曲(非直)線可能是該系統(tǒng)的噪聲響應(yīng)的更適合的模型。對于圖1所示的數(shù)據(jù),針對200HZ到3,400Hz范圍內(nèi)的信號測量來校準(zhǔn)測量系統(tǒng),并且該范圍之外的繪圖應(yīng)當(dāng)被認(rèn)為不是準(zhǔn) 確地表示實(shí)際環(huán)境噪聲所必需的。圖2是緊鄰交通繁忙的街道測量的交通噪聲的圖。如圖1所示,垂直軸是dB噪聲 功率,水平軸是Hz頻率,短虛線表示250Hz到2,500Hz頻帶上的平均噪聲功率,并且長虛線 表示被構(gòu)造為具有每倍頻程_6dB的斜率的直線。模型線(長虛線)與平均功率線(短虛 線)在與圖1的餐館噪聲幾乎相同的有效頻率處相交。重要的是,雖然起源、特性和聲音非 常不同,但是交通噪聲具有與餐館噪聲十分類似的頻譜模式,其噪聲功率隨著頻率增加以 大約每倍頻程6dB的速率下降。圖3示出了在車箱內(nèi)測量的噪聲的一對圖,下部的圖是在車輛在車窗關(guān)閉并且沒 有其它噪聲源的情況下緩慢運(yùn)動時進(jìn)行的測量,而上部的圖是車輛在打開收音機(jī)和A/CM 扇的情況下以每小時70英里行駛時進(jìn)行的測量。短虛線和長虛線再次表示噪聲數(shù)據(jù)的平 均功率,以及給出相應(yīng)平均模型功率“曲線”的具有_6dB的斜率的模型線。注意,這些模型 線在與圖1的情況所確定的相同的有效頻率處相交。從圖3可見,雖然不如前面噪聲情況 那么接近,仍然可以用相同的每倍頻程_6dB的模型描述車內(nèi)噪聲的頻譜模式。這些線仍然 是車箱噪聲的十分合理的模型。圖4和5分別是低風(fēng)速和高風(fēng)速“噪聲”的圖。風(fēng)“噪聲”不同于其它聲音,即,它 是(多個)獨(dú)立麥克風(fēng)端口處的空氣湍流的結(jié)果,并且僅由于麥克風(fēng)的存在而存在。它是 由風(fēng)在(多個)麥克風(fēng)端口處感應(yīng)出的噪聲,而不是風(fēng)固有的并且被麥克風(fēng)感測到的聲學(xué) 噪聲。這種風(fēng)感應(yīng)出的噪聲導(dǎo)致通常被稱為“風(fēng)噪”的電子麥克風(fēng)輸出信號。圖4示出了當(dāng)風(fēng)速低并且從而未灌滿麥克風(fēng)時收集的數(shù)據(jù)。該噪聲信號以相對持 續(xù)的噪聲串為特征,該噪聲串表現(xiàn)出高的平穩(wěn)性和具有陡峭斜率的功率頻率響應(yīng)。圖5示 出了在高風(fēng)速狀態(tài)下收集的數(shù)據(jù),其中風(fēng)灌滿了麥克風(fēng),并且極其“突然”。在該情況下,噪 聲信號以短的、強(qiáng)度不平穩(wěn)的信號串為特征。在中間風(fēng)狀態(tài)下,信號在這兩種特征之間輪流 改變。根據(jù)圖4和5,可以看到由風(fēng)感應(yīng)出的噪聲具有與大部分常見類型的聲學(xué)噪聲本 質(zhì)不同的特征,包括頻譜差異和動態(tài)模式差異。另外,這種噪聲在統(tǒng)計(jì)上與多傳感器陣列系 統(tǒng)內(nèi)的每個傳感器信號無關(guān)。噪聲抑止處理通常必須忽略這種由風(fēng)感應(yīng)出的噪聲信號,對 其進(jìn)行單獨(dú)處理或以不同于這些處理響應(yīng)聲源噪聲方式的方式處理這種由風(fēng)感應(yīng)出的噪 聲信號。同樣,在圖4和5中,在平均功率級別出畫出了水平的短虛線,并且示出了具有_6dB 斜率的長虛線噪聲模型線,其中模型平均功率與測量信號功率在示出的交點(diǎn)頻率處匹配。通過分析以此處公開的系統(tǒng)可被用于其中的系統(tǒng)測量的多種噪聲信號,確定當(dāng)模 型曲線(在該情況下,"6dB/oct.的直線)被設(shè)置為在750Hz處等于平均測量噪聲信號功 率時,模型的確產(chǎn)生了對所有聲學(xué)噪聲信號的良好近似。然而,聲學(xué)噪聲信號表現(xiàn)出相對于 該模型的微小偏差,而語音(下面討論)和風(fēng)噪相對于該模型都表現(xiàn)出顯著偏差。如上所 述,出于本討論的目的,識別三種類型的聲音聲噪、風(fēng)噪和語音。聲學(xué)噪聲一般地是所有非 風(fēng)噪和非語音聲音的統(tǒng)稱。從圖中可見,雖然圖1-3中的噪聲數(shù)據(jù)緊密地聚集在該模型(長虛線)周圍,圖4 和5中的風(fēng)噪的圖不是這樣。可以使用這種不同區(qū)分風(fēng)噪和其它噪聲。
低風(fēng)感應(yīng)噪聲和高風(fēng)感應(yīng)噪聲之間的區(qū)分是個相對概念;可以看到它們的圖顯著 不同。由于“風(fēng)噪”是在麥克風(fēng)的(多個)端口處產(chǎn)生的,圖4和5的結(jié)果之間的過渡風(fēng)速 取決于麥克風(fēng)的物理特性。然而,一般關(guān)系是適用的;即,低風(fēng)速產(chǎn)生陡峭的頻譜曲線,而高 風(fēng)速(相對于物理配置)產(chǎn)生明顯更高的頻率信號,并且一般產(chǎn)生平坦的頻譜響應(yīng)??梢?觀察到圖4和5的圖在200Hz處相當(dāng)接近,但是對于高風(fēng)速隨著頻率的增加圖5示出逐漸 更大的功率,并且在2,OOOHz處示出大得多的功率。對于一種麥克風(fēng)的物理配置,這些曲線 可以相應(yīng)于272mph和5mph的風(fēng)速,并且對于具有不同端口設(shè)計(jì)和/或內(nèi)置風(fēng)篩的麥克風(fēng) 系統(tǒng),分別相應(yīng)于5mph和IOmph的風(fēng)速。然而,圖4和5代表特定麥克風(fēng)可能在一種風(fēng)速 范圍上產(chǎn)生的風(fēng)感應(yīng)噪聲的變化種類。圖6和7分別是安靜房間狀態(tài)下的有聲談話(voiced speech)和強(qiáng)烈噪聲中的有 聲談話的圖。圖7的圖示中使用的噪聲包括與擴(kuò)散源模擬中來自多個方向的語音串音混合 在一起的商業(yè)錄制的音樂,它們在麥克風(fēng)處產(chǎn)生大約85dB SPL的噪聲。在這些狀態(tài)下,該 信號的SNR是-3dB。這種模擬旨在近似各種聚集狀態(tài),諸如機(jī)場、戲院幕間休息、零售店等。 如前面附圖的情況,以水平短虛線表示平均信號功率級別(包括所有語音和/或噪聲),并 且以長虛線示出了 _6dB的直線模型。圖6和7的圖示出了即使語音包括大量噪聲,語音的 特征頻譜模式產(chǎn)生大量語音格式的頻譜功率峰,并且因此頻率能量的改變比任意噪聲狀態(tài) 大得多。即使在零下SNR混合輸入信號中,頻譜模式中的這種差異可以容易地區(qū)分語音和 噪聲。此處公開的噪聲活動檢測器(NAD)使用上述特性識別信號,并 且指出何時出現(xiàn)信 號的僅有噪聲的時段。存在對這種操作的無數(shù)應(yīng)用——例如,它可被用于提供選通其它功 能的控制信號,諸如在頻譜相減處理中更新噪聲模板、更新自動麥克風(fēng)匹配表、當(dāng)僅存在噪 聲時阻止自動增益電路提高增益等等。在通信系統(tǒng)的音頻信號的上下文中描述此處公開的 噪聲活動檢測器。然而,此處公開的處理不限于單通道、單頻帶應(yīng)用,而是可用于多通道應(yīng) 用以及多頻帶應(yīng)用。由于在頻域中執(zhí)行處理,選擇在其上進(jìn)行操作的頻率范圍是簡單的,并 且噪聲檢測器的附加實(shí)現(xiàn)可被用于其它頻率范圍。這種應(yīng)用的例子是多頻帶頻譜相減處 理,其中當(dāng)相應(yīng)頻帶中僅存在噪聲時,即使在其它頻帶中可能存在語音信號和/或風(fēng)感應(yīng) 出的信號,獨(dú)立地更新每個頻帶的噪聲模板將會是必須的。噪聲活動檢測器還可用于多通 道應(yīng)用,以便為每個通道提供何時其信號僅為噪聲的指示。雖然對于許多的多通道系統(tǒng)來 說,每個輸入信號可能類似于其它傳感器接收到的信號,誕生存在許多不是如此的情況,諸 如對于風(fēng)感應(yīng)出的噪聲,以及諸如通過與操作者的皮膚或與其它物體的物理接觸而在端口 處機(jī)械地產(chǎn)生的噪聲。作為可能的應(yīng)用的例子,應(yīng)用于多通道系統(tǒng)的每個通道的來自噪聲的控制信號可 被用于特定于通道的頻譜相減處理,和/或可以組合來自不同通道上的噪聲檢測器的信 號,以便能夠進(jìn)行自動麥克風(fēng)匹配處理,以便補(bǔ)償多個麥克風(fēng)的靈敏度變化。在后一種應(yīng)用 中,特定于通道的噪聲檢測器確保麥克風(fēng)匹配不會與出現(xiàn)在單個通道上的噪聲相匹配。圖8是示出了可以使用噪聲活動檢測器(NAD) 20的上下文的典型通信系統(tǒng)前端的 方框圖。噪聲活動檢測器以多頻帶處理操作,從而時域信號被劃分到多個頻帶內(nèi)。可以使 用一組帶通濾波器(未示出),或通過應(yīng)用傅立葉變換處理,或通過用于多頻帶轉(zhuǎn)換的任意 其它處理完成多頻帶轉(zhuǎn)換。到頻域的轉(zhuǎn)換是公知的處理,該處理可以使用例如短時傅立葉變換(STFT)技術(shù)或其它公知的頻域轉(zhuǎn)換方法。由于使用NAD 20的系統(tǒng)很可能為諸如頻譜相減、麥克風(fēng)靈敏度匹配和/或自動增益控制處理的其它處理采用STFT方法,很可能已經(jīng) 可獲得該轉(zhuǎn)換步驟,并且NAD 20需要很少的附加處理。示例實(shí)施例采用快速傅立葉變換, 并且在頻域執(zhí)行NAD 20的處理。因此,按照示例系統(tǒng),可以在應(yīng)用此處公開的處理之前將 輸入信號轉(zhuǎn)換到頻域。參考圖8,在組幀方框10對例如將來自麥克風(fēng)(未示出)的模擬輸入信號組成 幀。使用窗口方框12用于創(chuàng)建窗口,窗口應(yīng)用方框13將該窗口應(yīng)用于成幀的數(shù)據(jù)。以傅 立葉變換方框14 (例如,快速傅立葉變換(FFT)或如上面解釋的其它適合的變換處理)將 成幀的窗口數(shù)據(jù)轉(zhuǎn)換到頻域,并且以子頻帶選擇方框15將該頻域結(jié)果劃分到一個,或可選 擇地,多于一個的子頻帶內(nèi)。在示例實(shí)施例中,具有Sksps(千樣本每秒)采樣速率的通信音頻信號被劃分為 512個樣本幀,對其應(yīng)用漢明窗口,使用FFT (快速傅立葉變換)將其轉(zhuǎn)換到頻域,并且選擇 由250Hz和2,500Hz之間的頻率區(qū)間組成的單個子頻帶。將獲得的子頻帶區(qū)間作為輸入提供給NAD 20,提供NAD 20的輸出用于對與特定 通信應(yīng)用相關(guān)聯(lián)的所希望處理的后續(xù)控制。方框16表示在使用噪聲檢測器的系統(tǒng)的設(shè)計(jì)過程中,由專業(yè)人員執(zhí)行的噪聲模 型和頻率處理確定,并且是特定應(yīng)用的一種功能。分析由預(yù)期應(yīng)用的傳感器系統(tǒng)感測到的 典型噪聲,以便使用公知的曲線擬合方法進(jìn)行曲線擬合。擬合的數(shù)學(xué)曲線的形狀就是噪聲 模型,例如,在圖1-3中,該模型是以下降的長虛線示出的直線。在設(shè)計(jì)處理過程中還通過 確定建模功率與平均功率值相等處的頻率,確定有效頻率Fe。方框17表示對關(guān)鍵帶寬的確定。關(guān)鍵帶寬通常是連續(xù)的頻率范圍,其包括這樣的 范圍,在該范圍中數(shù)據(jù)與所述模型相適合。在圖1-3的信號中,可以看到被測量系統(tǒng)的數(shù)據(jù) 在從大約200HZ到2,500Hz和3,OOOHz之間的某個頻率的頻率范圍上與該直線模型相適 合。作為例子,可以選擇250HZ到2,500Hz的頻率范圍。對所選擇的頻率范圍進(jìn)行小的調(diào) 整以便提供適合數(shù)目的FFT區(qū)間不會明顯影響噪聲檢測器的性能。在示例實(shí)施例中,噪聲 活動檢測器所使用的帶寬包括128個FFT區(qū)間,當(dāng)是2的偶數(shù)冪時,它是計(jì)算128個區(qū)間內(nèi) 的平均功率的適合的除數(shù)。方框16和17的關(guān)鍵帶寬、噪聲功率模型和有效頻率確定處理可以使用如下步 驟 在典型輸入信號狀態(tài)下檢查輸入信號的功率譜。這樣選擇將要使用的子頻帶 (方框15),從而它僅包括針對該任務(wù)的有效信息。例如,在單通道語音級通信系統(tǒng)中,從 250HZ延伸到3000Hz的子頻帶是適合的??梢匀菀椎卮_定用于其它系統(tǒng)的子頻帶帶寬和子 頻帶數(shù)目?!槊總€子頻帶選擇模型和模型復(fù)雜度(方框16)(對于每個子頻帶,它們不必相 同)。可以為這個步驟使用多項(xiàng)式曲線擬合,或可以應(yīng)用任意其它常見的曲線擬合方法。最 好是單調(diào)函數(shù)。對于上述示例實(shí)施例,該模型使用具有兩個參數(shù)(即,斜率和截距)的一階 曲線(直線)。 根據(jù)典型的僅為噪聲的數(shù)據(jù)確定參數(shù)值。在示例實(shí)現(xiàn)中,根據(jù)頻率響應(yīng)數(shù)據(jù)確定 斜率,并且以平均能量確定截距。
·計(jì)算有效頻率——即,在該頻率處模型功率曲線的值與包含在實(shí)際測量噪聲信 號的該子頻帶部分內(nèi)的平均信號功率相等的頻率。如圖1-3所示,這是短虛線與長虛線在 圖上相交處的頻率——即,746Hz。當(dāng)然,746Hz的值僅針對此處描述的例子,并且其它應(yīng)用 將具有不同的有效頻率。 參考圖9更詳細(xì)地描述方框16的處理,圖9是一般地示出了噪聲活動檢測器 (NAD) 20的操作的流程圖。輸入信號是子頻帶信號22,它是由圖8的子頻帶選擇處理15提 供的輸出信號,并且在關(guān)鍵帶寬步驟30中被用于計(jì)算平均能量。在步驟26執(zhí)行噪聲模型確定,并且在步驟28執(zhí)行有效頻率確定。步驟26和28 相應(yīng)于圖8的方框16。如前所述,可以基于視覺觀察執(zhí)行噪聲模型確定,或以已知的曲線擬 合算法更嚴(yán)謹(jǐn)?shù)卮_定噪聲模型。從而,可以確定任意特定功率曲線模型表示測量的信號功 率數(shù)據(jù)的適合性如何。在圖1-3的數(shù)據(jù)的情況下,可以看出具有近似每倍頻程_6dB的斜率 的直線相當(dāng)好地模擬了對于這些圖中示出的所有噪聲源數(shù)據(jù)的傳感器系統(tǒng)響應(yīng),并且通過 麥克風(fēng)系統(tǒng)測量的噪聲功率在大約200Hz到2,500Hz的頻率范圍上大體上符合直線模型。 因此,對關(guān)鍵帶寬的確定(步驟17)可將這種帶寬用于單通道系統(tǒng),或可將多個關(guān)鍵子頻帶 用于多通道系統(tǒng)。不同的麥克風(fēng)設(shè)計(jì)將產(chǎn)生不同的結(jié)果,并且可能需要噪聲信號的曲線模 型而不是直線模型??梢允褂脟?yán)謹(jǐn)?shù)那€擬合方法以便提供精確的模型,但是為了實(shí)現(xiàn)所 希望的結(jié)果一般不需要這樣做,并且模型越復(fù)雜,操作噪聲檢測器所需的處理能力越多。另外,如上所述完成對有效頻率Fe的確定(步驟28),并且將對其進(jìn)行更全面的描 述。在已經(jīng)確定了噪聲功率模型26和關(guān)鍵帶寬17的形狀之后,在關(guān)鍵帶寬上對功率模型 積分,以便確定平均模型功率級別。這個級別與噪聲功率模型曲線相交處的頻率是有效頻 率Fe ο設(shè)噪聲功率模型被定義為Pnm (f) = a · Sn (f)(1)其中PM(f)是噪聲功率模型,Sn(f)是噪聲功率模型形狀函數(shù),f是頻率,并且α 是將被確定的幅值矢量因子。在關(guān)鍵帶寬上對形狀模型積分,并且然后將其除以關(guān)鍵帶寬 Bffc,以便產(chǎn)生平均噪聲功率模型級別。假設(shè)子頻帶的關(guān)鍵帶寬被以其下頻率邊界flOT和其上頻率邊界fhi定義。在此處 討論的示例情況下,flow = 200并且fhi = 2500。因此Bffc = fhi-flow(2)并且,平均噪聲功率模型級別是rm evs ‘
DWc A,(3)平均噪聲模型功率級別在有效頻率Fe處與噪聲功率模型的值相等。艮口,Pnm avg = Pnm(Fe)(4)因此,通過求解等式4可以找到Fe。容易發(fā)現(xiàn),單調(diào)的模型曲線是優(yōu)選的。對于示例的情況,Pnm (f) = a · Γ2(5)并且<formula>formula see original document page 14</formula>
它實(shí)際上為大約700Ηζ。還可以在噪聲檢測器的設(shè)計(jì)過程中預(yù)先確定關(guān)鍵帶寬、噪聲功率模型和有效頻率 的所有上述參數(shù),并且不必實(shí)時計(jì)算這些參數(shù),從而減少了操作系統(tǒng)所需的計(jì)算能力?,F(xiàn)在參考圖9描述噪聲活動檢測器(NAD) 20的實(shí)時操作,圖9示出了所執(zhí)行的各 種步驟或任務(wù)的流程圖。應(yīng)當(dāng)理解,如圖10所示,這些任務(wù)中的每一個可被在專用電路中 執(zhí)行,或可以使用一個或多個電路執(zhí)行這些任務(wù)中的一個或多個。另外,可以使用單個處理 器或幾個處理器執(zhí)行這些任務(wù),每個處理器具有可專用于一個或多個任務(wù)的一個或多個模 塊。在圖9的步驟30,計(jì)算BW。中的平均能量,并且在所選擇的子頻帶的整個關(guān)鍵帶寬 上累加該功率,并且將其除以關(guān)鍵帶寬BW。,以便產(chǎn)生當(dāng)前幀的信號平均功率級別的值。提 供圖10的電路102用于這個任務(wù)。在圖9的步驟32使用這個平均功率級別值,以便定義 當(dāng)前數(shù)據(jù)幀所特有的閾值函數(shù)Th (f)。提供圖10的電路104用于這個目的。定義閾值函數(shù)Th (f),通過計(jì)算當(dāng)前數(shù)據(jù)幀中的平均功率,并且設(shè)置模型的級別 α,從而在有效頻率Fe處當(dāng)前幀的平均功率級別與模型的值相等,步驟32 (并且電路104) 使用在步驟26確定的噪聲功率模型PNM(f)、在步驟28確定的有效頻率Fe確定動態(tài)的頻率 相關(guān)閾值。艮口,
<formula>formula see original document page 14</formula>(7)其中?_8是當(dāng)前平均功率級別。因此,在步驟32中電路104將第i個數(shù)據(jù)幀的閾 值函數(shù)確定為<formula>formula see original document page 14</formula>(8)注意,該閾值不是單個級別,并且不取決于先前的數(shù)據(jù)幀,這兩點(diǎn)對于其它這種檢 測器是共同的。由于閾值是立即性的——即,僅為當(dāng)前幀計(jì)算并且僅由當(dāng)前幀使用——使 得NAD 20能夠跟蹤背景噪聲的迅速改變。因此,使用利用平均能量對頻率相關(guān)閾值函數(shù)進(jìn) 行的動態(tài)修改。使用閾值函數(shù)Thi (f)將當(dāng)前幀的頻譜數(shù)據(jù)劃分為兩組,功率數(shù)據(jù)幅值大于該閾值 的FFT頻率區(qū)間,以及功率數(shù)據(jù)幅值小于該閾值的FFT頻率區(qū)間。示出了風(fēng)噪和語音特性 的圖4-7全部表示這樣的數(shù)據(jù),當(dāng)被應(yīng)用于噪聲活動檢測器20的示例實(shí)施例時,該數(shù)據(jù)產(chǎn) 生每個相應(yīng)圖的長虛線所示的閾值函數(shù)。每個FFT區(qū)間擁有一個復(fù)數(shù)值,該值具有相應(yīng)于 一幀時段上該FFT區(qū)間的頻率帶寬內(nèi)的信號內(nèi)容的平均幅值的幅值。在BW。步驟30中計(jì)算 平均能量時,取每個FFT區(qū)間的幅值的平方,并且求這些平方值的平均值,從而提供在這些 幀的時間段上的每個區(qū)間的平均能量。如上所述,步驟32 (電路104)使用這個值確定Cii 的值,并且因此當(dāng)前幀的閾值函數(shù)Thi (f),其中i是幀索引。由電路106執(zhí)行計(jì)算Th (f)之 下的平均能量步驟34,其累加相應(yīng)于具有小于該閾值的幅值的區(qū)間的幅值的平方,并且將 該總和除以具有小于該閾值的幅值的區(qū)間的數(shù)目,得到具有小于該閾值的幅值的區(qū)間的每區(qū)間平均能量。另外,由電路108執(zhí)行計(jì)算Th(f)之上的平均能量步驟36,其累加相應(yīng)于 具有大于該閾值的幅值的區(qū)間的幅值的平方,并且將該總和除以具有大于該閾值的幅值的 區(qū)間的數(shù)目,得到具有大于該閾值的幅值的區(qū)間的每區(qū)間平均能量。步驟34提供信號Eb_ 而步驟36提供信號Eabqve。在步驟38和40中計(jì)算每個能量均值Eb_和Eabqve的對數(shù),并且可選擇地將得到 的值提供給濾波器,所述濾波器通過作用于來自連續(xù)幀的數(shù)據(jù),產(chǎn)生時間平滑功能。圖10 的對數(shù)電路110和濾波電路112提供這些功能。雖然平滑不是本申請的噪聲檢測器的正常 操作所需要的,但如果需要,可以使用這種濾波產(chǎn)生較長的拖尾時間。然而,由于即使當(dāng)進(jìn) 入信號中的語音功率完全在噪聲功率之下時,該檢測器也能夠正確地確定語音的存在,因 此附加的拖尾通常是多余的。當(dāng)希望時,以下列形式的指數(shù)濾波器執(zhí)行示例實(shí)施例中的步驟38和40的濾波Exavg= αχ · (log(EYi)-log(EXi_1))+log(EXi_1) (9)其中Ey是Ebemw或Eab■,α χ是確定平滑量的時間常數(shù),其中α χ在0和1之間,并 且其中典型的值為0. 1。下標(biāo)X表示對于ABOVE和BELOW情況,α x可以不同。Ey是平滑輸 出信號,其中Y可以是指定平滑哪個信號的ABV或BLW。對(多個)平滑濾波器的類型和復(fù)雜性沒有限制,并且許多平滑濾波器是本領(lǐng)域 公知的??梢允褂每梢蕴峁┎粚ΨQ的上升(發(fā)起)和下降(衰退)時間常數(shù)的更復(fù)雜的平 滑濾波器。當(dāng)ABOVE平滑信號的上升能夠比下降快,并且BELOW平滑信號的下降能夠比上 升快時產(chǎn)生拖尾。上述方法對于噪聲檢測器20的典型噪聲信號輸入提供兩個幅值類似的信號,從 而對輸入信號中僅為噪聲的部分的檢測被簡化為這些信號中的一個是否相對于另一個發(fā) 生了偏移。在系統(tǒng)設(shè)計(jì)過程中,由專業(yè)人員在確定偏移步驟42中確定偏移,其中該偏移略 微大于噪聲信號被輸入噪聲檢測器20時的兩個對數(shù)信號的隨機(jī)變化。這種偏移量防止噪 聲檢測器的錯誤的否定觸發(fā),即,當(dāng)輸入信號的確僅為噪聲時,對存在噪聲之外的信號的錯 誤指示。這種錯誤的觸發(fā)在相關(guān)聯(lián)的噪聲削減或使用噪聲檢測器的其它處理的操作中不產(chǎn) 生錯誤,但是它使得某些操作變慢了。因此,該偏移旨在最小化這種作用。在增加偏移步驟 44中將所述偏移(可以是負(fù)數(shù))增加到對數(shù)和濾波器步驟40的輸出。只因如此,增加偏移 步驟可以在步驟38之后,并且該偏移被應(yīng)用于信號Eav,。在這種情況下,為了實(shí)現(xiàn)相同結(jié) 果,在步驟42中確定的偏移值具有相反的符號。在對兩個信號之一進(jìn)行偏移之后,在判斷步驟46 (電路114)中比較結(jié)果值。如果 步驟38的輸出Eav,大于步驟44的輸出EAV_HI,判斷步驟46使得設(shè)置噪聲指示器步驟48 (電 路116)將NAD輸出設(shè)置為指示僅有噪聲存在的“on”狀態(tài)。當(dāng)Eav,小于EAV_HI時,決定判 斷步驟46使得重置噪聲指示器步驟50將NAD輸出重置為指示輸入信號中存在噪聲之外的 信號的“off ”狀態(tài)。替換實(shí)施例使用取決于NAD輸出當(dāng)前為on還是off的偏移值,并且以 這種方式,對于希望具有更穩(wěn)定的NAD輸出的應(yīng)用,可以在NAD轉(zhuǎn)換中結(jié)合滯后。為了示出這種噪聲檢測器的性能,圖11是未平滑的E^^+offset (偏移)信號, Ebeot信號和噪聲活動檢測器輸出信號的圖。水平刻度被示出為幀時間,并且垂直刻度對于 E-vfoffset和Ebeot信號是dB。在這個圖中,當(dāng)檢測到僅有噪聲狀態(tài)時,NAD輸出信號為 高,并且當(dāng)發(fā)現(xiàn)非噪聲時,NAD輸出信號為低。由于NAD輸出表示on/off 二值標(biāo)記,因此用于NAD輸出的刻度是任意的。圖的頂部帶有數(shù)字的部分指示不同時間的輸入信號特性。部分(1)和(5)是僅為 寂靜,并且噪聲檢測器20沒有信號輸入的時段。在該情況下,由于輸入信號既不是噪聲也 不是非噪聲,所以噪聲檢測器指示哪個狀態(tài)都是可接受的,并且噪聲削減系統(tǒng)沒有要被減 小的輸入噪聲。部分(2)是噪聲檢測器20的信號輸入是安靜環(huán)境狀態(tài)下的清晰語音的時段。第 二部分的結(jié)尾的僅具有正常房間環(huán)境聲音而沒有語音的短暫時段。該噪聲檢測器正確地處 理這種相對容易的狀態(tài),指出作為非噪聲的語音的存在,并且仍然檢測出僅有噪聲期間的 語音缺失。圖11的圖使用的系統(tǒng)包括平滑濾波器,以便通過在語音串停止之后存在檢測器 輸出不改變指示的短時間的設(shè)計(jì)提供附加的拖尾。部分(3)由非常響(85dB SPL)的僅有輸入噪聲的聲音組成,該聲音是音樂、單個 大聲語音和來自多個方向的串音的混合體。此處可見,噪聲檢測器指出大部分僅為噪聲,但 是即使背景語音的SNR低于-10dB,還作為單個響亮背景語音的結(jié)果產(chǎn)生非噪聲指示。在旁邊的部分(4)中,向部分(3)中的噪聲增加了語音,增加的語音SNR近似 為-3dB。按照設(shè)計(jì),NAD輸出示出正確地指出了僅有噪聲的時段,同時在談話過程中,NAD 正確地指出了非噪聲。這種低輸入SNR級別下的正確操作示出了這種新噪聲/語音檢測器 的能力。雖然已經(jīng)示出并且描述了實(shí)施例和應(yīng)用,從本公開中受益的本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明了,可以做出比上述更多的修改而不脫離此處公開的創(chuàng)造性概念。因此,除了所附權(quán)利 要求的精神之外,本發(fā)明不受限制。
權(quán)利要求
一種用于產(chǎn)生信號中的噪聲活動的指示的方法,包括a)計(jì)算所述信號在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用所述平均能量產(chǎn)生對所述與頻率相關(guān)的閾值函數(shù)的動態(tài)修改;d)識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上的能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識別出的具有該閾值之上的能量的頻率分量的平均能量;e)識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下的能量的頻率分量,并且確定第二平均能量值,第二平均能量值表示識別出的具有該閾值之下的能量的頻率分量的平均能量;f)給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對獲得的第一平均能量值和第二平均能量值彼此進(jìn)行比較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能量值,則指示噪聲活動的出現(xiàn)。
2.如權(quán)利要求1所述的方法,其中在多幀處理的各獨(dú)立幀上執(zhí)行過程a)_h)。
3.如權(quán)利要求1所述的方法,還包括在比較過程g)之前進(jìn)行濾波。
4.如權(quán)利要求3所述的方法,其中使用指數(shù)濾波器執(zhí)行所述濾波。
5.如權(quán)利要求3所述的方法,其中將具有不對稱的上升和下降時間常數(shù)的所述濾波應(yīng) 用于表示識別出的具有所述閾值之上的能量的頻率分量的平均能量的信號,和識別出的具 有所述閾值之下的能量的頻率分量的平均能量的信號。
6.一種用于產(chǎn)生信號中的噪聲活動的指示的噪聲活動檢測器,包括a)第一電路,配置為計(jì)算關(guān)鍵帶寬中的平均能量;b)第二電路,配置為確定與頻率相關(guān)的閾值函數(shù);c)第三電路,配置為使用所述平均能量產(chǎn)生對所述與頻率相關(guān)的閾值函數(shù)的動態(tài)修改;d)第四電路,配置為識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上 的能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識別出的具有該閾值 之上的能量的頻率分量的平均能量;e)第五電路,配置為識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下 的能量的頻率分量,并且確定第二平均能量值,第二平均能量值表示識別出的具有該閾值 之下的能量的頻率分量的平均能量;f)第六電路,配置為給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移值;g)第七電路,配置為在應(yīng)用所述偏移值之后,對獲得的第一平均能量值和第二平均能 量值彼此進(jìn)行比較;和h)第八電路,配置為如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得 的第二平均能量值,則指示噪聲活動的出現(xiàn)。
7.如權(quán)利要求6所述的檢測器,其中所述電路在多幀處理的各獨(dú)立幀上執(zhí)行其功能。
8.如權(quán)利要求6所述的檢測器,還包括用于在比較之前進(jìn)行濾波的濾波器。
9.如權(quán)利要求8所述的檢測器,其中所述濾波器是指數(shù)濾波器。
10.如權(quán)利要求8所述的檢測器,其中所述濾波器包括合并有不對稱的上升和下降時 間常數(shù)的至少一個濾波器。
11.一種用于產(chǎn)生信號中的噪聲活動的指示的噪聲活動檢測器,包括a)用于計(jì)算所述信號在關(guān)鍵帶寬中的平均能量的裝置;b)用于確定與頻率相關(guān)的閾值函數(shù)的裝置;c)用于使用所述平均能量產(chǎn)生對所述與頻率相關(guān)的閾值函數(shù)的動態(tài)修改的裝置;d)用于識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上的能量的頻 率分量,并且確定第一平均能量值的裝置,第一平均能量值表示識別出的具有該閾值之上 的能量的頻率分量的平均能量;e)用于識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下的能量的頻 率分量,并且確定第二平均能量值的裝置,第二平均能量值表示識別出的具有該閾值之下 的能量的頻率分量的平均能量;f)用于給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移值的裝置;g)用于在應(yīng)用所述偏移值之后,對獲得的第一平均能量值和第二平均能量值彼此進(jìn)行 比較的裝置;和h)用于如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能 量值,則指示噪聲活動的出現(xiàn)的裝置。
12.如權(quán)利要求11所述的噪聲活動檢測器,其中在多幀處理的各獨(dú)立幀上執(zhí)行過程 a)_h)。
13.如權(quán)利要求11所述的噪聲活動檢測器,還包括在比較過程g)之前進(jìn)行濾波。
14.如權(quán)利要求13所述的噪聲活動檢測器,其中使用指數(shù)濾波器執(zhí)行所述濾波。
15.如權(quán)利要求13所述的噪聲活動檢測器,其中將具有不對稱的上升和下降時間常數(shù) 的所述濾波應(yīng)用于表示識別出的具有所述閾值之上的能量的頻率分量的平均能量的信號, 和識別出的具有所述閾值之下的能量的頻率分量的平均能量的信號。
16.一種機(jī)器可讀的程序存儲設(shè)備,該程序存儲設(shè)備包含有用于執(zhí)行產(chǎn)生信號中的噪 聲活動的指示的方法的機(jī)器可執(zhí)行指令的程序,該方法包括a)計(jì)算所述信號在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用所述平均能量產(chǎn)生對所述與頻率相關(guān)的閾值函數(shù)的動態(tài)修改;d)識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上的能量的頻率分 量,并且確定第一平均能量值,第一平均能量值表示識別出的具有該閾值之上的能量的頻 率分量的平均能量;e)識別所述信號的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下的能量的頻率分 量,并且確定第二平均能量值,第二平均能量值表示識別出的具有該閾值之下的能量的頻 率分量的平均能量;f)給第一平均能量值和第二平均能量值中的至少一個應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對獲得的第一平均能量值和第二平均能量值彼此進(jìn)行比 較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能量 值,則指示噪聲活動的出現(xiàn)。
17.如權(quán)利要求16所述的設(shè)備,其中在多幀處理的各獨(dú)立幀上執(zhí)行過程a)_h)。
18.如權(quán)利要求16所述的設(shè)備,還包括 在比較過程g)之前進(jìn)行濾波。
19.如權(quán)利要求18所述的設(shè)備,其中使用指數(shù)濾波器執(zhí)行所述濾波。
20.如權(quán)利要求18所述的設(shè)備,其中將具有不對稱的上升和下降時間常數(shù)應(yīng)用于的所 述濾波表示識別出的具有所述閾值之上的能量的頻率分量的平均能量的信號,和識別出的 具有所述閾值之下的能量的頻率分量的平均能量的信號。
全文摘要
一種噪聲活動檢測器,包括用于計(jì)算關(guān)鍵頻帶中的平均能量的電路,用于確定閾值函數(shù)的電路,用于產(chǎn)生對閾值函數(shù)的動態(tài)修改的電路,用于識別信號的具有根據(jù)該閥值函數(shù)所確定的閾值之上的能量的頻率分量,并且確定第一平均能量值的電路,其中第一平均能量值表示識別出的具有該閾值之上的能量的頻率分量的平均能量,用于識別信號的具有根據(jù)該閾值函數(shù)所確定的閾值之下的能量的頻率分量,并且確定第二平均能量值的電路,其中第二平均能量值表示識別出的具有該閾值之下的能量的頻率分量的平均能量,用于偏移第一平均能量值和第二平均能量值中的至少一個的電路,用于對第一和第二平均能量值彼此進(jìn)行比較的電路,用于如果第一平均能量值低于第二平均能量值,則指示噪聲活動的出現(xiàn)的電路。
文檔編號H04B15/00GK101821971SQ200880111290
公開日2010年9月1日 申請日期2008年8月22日 優(yōu)先權(quán)日2007年8月22日
發(fā)明者J·C·塔恩澤 申請人:杜比實(shí)驗(yàn)室特許公司