專(zhuān)利名稱(chēng):用于從兩聲道音頻信號(hào)進(jìn)行環(huán)境提取的基于相關(guān)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻處理技術(shù)。更具體地,本發(fā)明涉及用于從音頻信號(hào)提取環(huán)境的系 統(tǒng)和方法。
背景技術(shù):
各種技術(shù)可用于從兩聲道立體聲信號(hào)提取環(huán)境分量(ambiencecomponent)。立體 聲信號(hào)可被分解成基本分量(primary component)和環(huán)境分量。這些方法的一個(gè)常見(jiàn)應(yīng)用 是收聽(tīng)增強(qiáng)系統(tǒng)(listening enhancementsystem),其中環(huán)境信號(hào)分量被修改和/或被空 間地重新分布于多聲道揚(yáng)聲器之上,同時(shí)基本信號(hào)分量不被修改或者被不同地處理。在這 些系統(tǒng)中,環(huán)境分量通常被定向至環(huán)繞揚(yáng)聲器。此環(huán)境重新分布幫助增加了收聽(tīng)體驗(yàn)中的 沉浸感,而沒(méi)有損害立體聲的音場(chǎng)(sound stage) 0一些現(xiàn)有的頻域環(huán)境提取方法導(dǎo)出作為時(shí)間和頻率的函數(shù)的、描述輸入信號(hào)中的 環(huán)境量(amount of ambience)的乘法屏蔽(multiplicativemask)。這些方案使用用于從 輸入信號(hào)的相關(guān)量來(lái)確定這些環(huán)境提取屏蔽(ambience extraction mask)的專(zhuān)門(mén)函數(shù),導(dǎo) 致了次優(yōu)的提取性能。當(dāng)主要的(非環(huán)境的)源被移動(dòng)(pan)到每個(gè)聲道時(shí),一個(gè)特定的 誤差來(lái)源(source of error)便出現(xiàn);現(xiàn)有方法容許這些情況下主要源的顯著泄漏。現(xiàn)有 方法中的另一誤差來(lái)源產(chǎn)生自對(duì)互相關(guān)系數(shù)的幅度的短期估計(jì)。短期估計(jì)對(duì)于基于屏蔽的 方法的操作而言是必要的,但是用于短期估計(jì)的現(xiàn)有方法導(dǎo)致了對(duì)環(huán)境量的低估。所希望的是用于環(huán)境提取的改進(jìn)方法。
發(fā)明內(nèi)容
本發(fā)明提供了用于利用環(huán)境提取屏蔽從多聲道輸入信號(hào)提取環(huán)境分量的系統(tǒng)和 方法。對(duì)環(huán)境提取屏蔽的求解基于從輸入信號(hào)計(jì)算的信號(hào)相關(guān)量,并且取決于關(guān)于信號(hào)模 型中的環(huán)境分量的各種假設(shè)。本發(fā)明在各種實(shí)施例中實(shí)現(xiàn)了時(shí)頻分析合成框架中的環(huán)境提 取。環(huán)境是基于所導(dǎo)出的乘法屏蔽來(lái)提取的,所導(dǎo)出的乘法屏蔽反映了每個(gè)頻帶內(nèi)的輸入 信號(hào)的當(dāng)前所估計(jì)組成。一般地,操作是在感興趣的每個(gè)頻帶中獨(dú)立地執(zhí)行的。就輸入信 號(hào)的互相關(guān)和自相關(guān)而言來(lái)表達(dá)結(jié)果。利用時(shí)頻表示來(lái)執(zhí)行分析合成,因?yàn)檫@樣的表示促 進(jìn)了基本分量和環(huán)境分量的分辨率。在每個(gè)時(shí)間和頻率處,估計(jì)每個(gè)輸入聲道的環(huán)境分量。根據(jù)本發(fā)明的一個(gè)方面,一種從多聲道輸入信號(hào)進(jìn)行環(huán)境提取的方法包括將輸入 信號(hào)轉(zhuǎn)換成時(shí)頻表示。對(duì)于輸入聲道信號(hào)的時(shí)頻表示的自相關(guān)和互相關(guān)被確定?;谒_定的自相關(guān)和互相關(guān)的環(huán)境提取屏蔽被乘法地應(yīng)用于輸入聲道信號(hào)的時(shí)頻表示以導(dǎo)出環(huán) 境分量。屏蔽基于與輸入信號(hào)的各個(gè)聲道中的環(huán)境水平有關(guān)的假設(shè)關(guān)系。根據(jù)本發(fā)明的另一個(gè)方面,一種環(huán)境提取的方法包括分析輸入信號(hào)以確定輸入信 號(hào)中的環(huán)境量。分析輸入信號(hào)包括估計(jì)短期互相關(guān)系數(shù)。該方法還包括補(bǔ)償短期互相關(guān)系 數(shù)的估計(jì)中的偏置。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于從多聲道輸入信號(hào)提取環(huán)境分量的系 統(tǒng)。該系統(tǒng)包括時(shí)間到頻率變換模塊、相關(guān)計(jì)算模塊、環(huán)境屏蔽導(dǎo)出模塊、環(huán)境屏蔽乘法模 塊和頻率到時(shí)間變換模塊。時(shí)間到頻率變換模塊被配置為將多聲道輸入信號(hào)轉(zhuǎn)換成對(duì)于多 聲道輸入信號(hào)的各個(gè)聲道的時(shí)頻表示。相關(guān)計(jì)算模塊被配置為確定信號(hào)相關(guān),信號(hào)相關(guān)包 括時(shí)頻表示中對(duì)于每個(gè)時(shí)間和頻率的互相關(guān)和自相關(guān)。環(huán)境屏蔽導(dǎo)出模塊被配置為根據(jù)所 確定的信號(hào)相關(guān)以及與多聲道輸入信號(hào)的各個(gè)聲道中的環(huán)境水平有關(guān)的假設(shè)關(guān)系來(lái)導(dǎo)出 環(huán)境提取屏蔽。環(huán)境屏蔽乘法模塊被配置為將環(huán)境提取屏蔽與時(shí)頻表示相乘,以生成多聲 道輸入信號(hào)的各個(gè)聲道的環(huán)境分量的時(shí)頻表示。頻率到時(shí)間變換模塊被配置為將環(huán)境分量 的時(shí)頻表示轉(zhuǎn)換成各個(gè)時(shí)間表示。下面參考附圖來(lái)描述本發(fā)明的這些和其他的特征和優(yōu)點(diǎn)。
圖1A和圖1B示出了作為相關(guān)系數(shù)和輸入信號(hào)之間的水平差異的函數(shù)的環(huán)境 屏蔽的環(huán)境比和性狀(behavior)。圖1C是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的提取環(huán)境的方法的流程圖。圖2示出對(duì)于遺忘因子\的一個(gè)范圍的所估計(jì)互相關(guān)系數(shù)的實(shí)部、虛部和幅度的 概率分布函數(shù)。圖3示出對(duì)于\的一個(gè)范圍、作為真實(shí)| cK」的函數(shù)的平均估計(jì)的相關(guān)系數(shù)幅度
小 LE I °圖4是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的環(huán)境提取的方法的流程圖。圖5示出根據(jù)本發(fā)明的各種實(shí)施例的、用于從多聲道輸入信號(hào)提取環(huán)境分量的系 統(tǒng)。
具體實(shí)施例方式現(xiàn)在將詳細(xì)參考本發(fā)明的優(yōu)選實(shí)施例。優(yōu)選實(shí)施例的示例在附圖中被示出。雖然 本發(fā)明將結(jié)合這些優(yōu)選實(shí)施例來(lái)描述,但是將會(huì)被理解的是,不希望將本發(fā)明限制到這樣 的優(yōu)選實(shí)施例。相反,希望覆蓋可被包括在所附權(quán)利要求限定的本發(fā)明的精神和范圍內(nèi)的 替換、修改和等同物。在下面的描述中,陳述了許多具體細(xì)節(jié)以提供對(duì)本發(fā)明的徹底理解。 可在沒(méi)有一些或全部的這些具體細(xì)節(jié)的情況下實(shí)踐本發(fā)明。在其他實(shí)例中,公知的機(jī)制沒(méi) 有被詳細(xì)地描述,以便不會(huì)不必要地模糊本發(fā)明。這里應(yīng)當(dāng)注意,貫穿各種繪圖,類(lèi)似的標(biāo)號(hào)指稱(chēng)類(lèi)似的部分。這里所示出和描述的 各種繪圖被用來(lái)示出本發(fā)明的各種特征。在特定特征在一個(gè)繪圖中而非在另一繪圖中被示 出的范圍內(nèi),除去另有指示的情況或者結(jié)構(gòu)固有地禁止特征的結(jié)合的情況,要理解的是,這 些特征可適于被包括在其他圖中所表示的實(shí)施例中,仿佛它們?cè)谶@些圖中被充分地示出。除非另有注明,否則繪圖未必是按比例的。繪圖上所提供的任何尺寸對(duì)于本發(fā)明的范圍而 言不希望是限制性的,而希望是僅僅例示性的。1.介紹本發(fā)明的實(shí)施例提供了用在空間音頻增強(qiáng)算法中的環(huán)境提取的改進(jìn)的系統(tǒng)和方 法,空間音頻增強(qiáng)算法例如2到N的環(huán)繞上混合(upmix)、改進(jìn)的頭戴式耳機(jī)再現(xiàn)、以及揚(yáng)聲 器上的沉浸虛擬化。本發(fā)明實(shí)施例包括基于信號(hào)模型以及從輸入信號(hào)計(jì)算出的相關(guān)量的、 用于每個(gè)輸入信號(hào)中的時(shí)間依賴(lài)和頻率依賴(lài)的環(huán)境量的分析解法。算法在頻域中操作。分 析解法提供了相對(duì)于現(xiàn)有技術(shù)的顯著質(zhì)量改進(jìn)。本發(fā)明實(shí)施例還包括用于補(bǔ)償對(duì)環(huán)境量的 低估的方法,其中對(duì)環(huán)境量的低估是由短期互相關(guān)估計(jì)的幅度中的偏置引起的。為了進(jìn)一步闡述,本發(fā)明實(shí)施例提供了在給出輸入信號(hào)的自相關(guān)和互相關(guān)的情況 下針對(duì)環(huán)境提取屏蔽的分析解法。這些解法基于與輸入聲道內(nèi)的相對(duì)環(huán)境水平有關(guān)的某些 假設(shè)以及信號(hào)模型。關(guān)于相對(duì)水平的兩個(gè)不同假設(shè)被描述。根據(jù)一些實(shí)施例,技術(shù)被提供 以補(bǔ)償小時(shí)間常數(shù)對(duì)短期互相關(guān)估計(jì)的平均幅度的影響。時(shí)間常數(shù)的補(bǔ)償預(yù)期對(duì)于利用短 期互相關(guān)計(jì)算的任何技術(shù)都是有用的,上述技術(shù)包括商業(yè)可得的環(huán)境提取方法以及當(dāng)前的 空間音頻編碼標(biāo)準(zhǔn)。在目前最先進(jìn)的立體聲上混合中,在基本(直接)聲音與環(huán)境之間進(jìn)行區(qū)別是常 見(jiàn)的?;韭曇粲煽啥ㄎ坏穆曇羰录M成,并且上混合的通常目標(biāo)是保持相對(duì)的位置并 且增強(qiáng)基本源的空間圖像穩(wěn)定性。另一方面,環(huán)境由混響(reverberation)或其他空間分 布的聲源所組成。立體聲揚(yáng)聲器系統(tǒng)被限制在它呈現(xiàn)周?chē)h(huán)境的能力中,但是可通過(guò)提取 環(huán)境并且(部分地)將環(huán)境分布于多聲道揚(yáng)聲器系統(tǒng)的環(huán)繞聲道來(lái)克服此限制。當(dāng)提取環(huán)境時(shí),可使用單聲道方法,其中利用基于輸入信號(hào)的自相關(guān)和互相關(guān)的 標(biāo)量環(huán)境提取屏蔽,來(lái)從左輸入信號(hào)提取左環(huán)境聲道并從右輸入聲道提取右環(huán)境聲道。然 而,為了使所選擇的時(shí)間和頻率分辨率內(nèi)的所估計(jì)環(huán)境信號(hào)的幅度與真實(shí)環(huán)境信號(hào)的幅度 相對(duì)應(yīng),提取屏蔽應(yīng)當(dāng)與各個(gè)聲道中的環(huán)境的比例相對(duì)應(yīng)。為了解出環(huán)境分量的時(shí)間依賴(lài) 和頻率依賴(lài)的水平,進(jìn)行關(guān)于輸入信號(hào)的、具體地關(guān)于輸入信號(hào)中的環(huán)境水平的某些假設(shè) 是有幫助的。在本發(fā)明的不同實(shí)施例中,對(duì)于環(huán)境水平做了不同的假設(shè)。在第一實(shí)施例中,在輸 入信號(hào)的各個(gè)聲道(例如左和右聲道)內(nèi)假設(shè)了相等的比。在第二實(shí)施例中,假設(shè)了輸入 信號(hào)的各個(gè)聲道(例如左和右聲道)中的相等環(huán)境水平。一般地,兩聲道輸入信號(hào)的聲道 被稱(chēng)為“左”和“右”聲道。這些方法提供了從輸入內(nèi)容提取環(huán)境的進(jìn)一步改進(jìn),其中主要 的(非環(huán)境的)源被移動(dòng)到任何特定的聲道。此外,根據(jù)本發(fā)明的各種實(shí)施例,利用應(yīng)用到所估計(jì)互相關(guān)系數(shù)的幅度上的補(bǔ)償 因子,來(lái)改進(jìn)對(duì)互相關(guān)系數(shù)的短時(shí)估計(jì)。這樣,更有效的環(huán)境提取屏蔽可被導(dǎo)出并且被應(yīng)用 于輸入信號(hào),以用于提取環(huán)境。2. 一般的考慮2. 1.環(huán)境提取框架在時(shí)頻(time-frequency)分析合成(analysis-synthesis)框架中實(shí)現(xiàn)這里 所描述的環(huán)境提取技術(shù)。對(duì)于多個(gè)非固定的基本源的任意混合,此方法實(shí)現(xiàn)了對(duì)同時(shí) 的源(假如它們?cè)陬l率上基本不重疊)的魯棒且獨(dú)立的處理、以及從混合中對(duì)環(huán)境分量的魯棒提取。還可基于人類(lèi)聽(tīng)覺(jué)系統(tǒng)如何處理空間線(xiàn)索(spatial cue)的心理聲學(xué) (psychoacoustical)證據(jù)而啟示出時(shí)頻處理框架(參見(jiàn) J. Blauert,Spatial Hearing The Psychophysics of HumanSound Localization. Cambridge, MA, USA :The MIT Press, revised ed.,1997,其內(nèi)容通過(guò)引用而被全部結(jié)合于此)。對(duì)于下面第3節(jié)中描述的方法,環(huán)境提取處理是以導(dǎo)出乘法屏蔽為基礎(chǔ)的,其中 乘法屏蔽反映了每個(gè)頻帶內(nèi)的輸入信號(hào)的當(dāng)前所估計(jì)組成。屏蔽然后在頻域中應(yīng)用于輸入 信號(hào),因而有效地實(shí)現(xiàn)了時(shí)變的過(guò)濾。2. 2.記法和定義一般地,針對(duì)具有由所選擇的時(shí)間分辨率確定的任意有限持續(xù)時(shí)間的解析(復(fù)數(shù) 的)時(shí)域信號(hào),來(lái)導(dǎo)出此詳細(xì)描述中的表達(dá)式。復(fù)數(shù)表示法(complex formulation)使得 能夠?qū)⒎匠讨苯討?yīng)用于從輸入信號(hào)的短時(shí)傅里葉變換(short-time Fourier transform) (STFT)產(chǎn)生的個(gè)體變換指標(biāo)(transform index)(頻帶)。此外,方程不加修改地適用于實(shí) 信號(hào),并且可容易地應(yīng)用于其他的時(shí)頻信號(hào)表示,例如通過(guò)任意濾波器組(filterbank)導(dǎo) 出的子帶信號(hào)。此外,假設(shè)運(yùn)算是在感興趣的每個(gè)頻帶中獨(dú)立地執(zhí)行的。(子帶)時(shí)域信 號(hào)一般表示為列向量,并且在信號(hào)標(biāo)志之上被標(biāo)以箭頭符號(hào)(例如X)。然而,為了更加清 楚地展示,時(shí)間依賴(lài)性和/或頻率依賴(lài)性在一些情況下被顯式地(explicitly)寫(xiě)成記號(hào) (notate),并且向量符號(hào)被省略。至于信號(hào)模型,組成信號(hào)的真實(shí)分量被標(biāo)以正常符號(hào)(例 如λ ),并且對(duì)這些分量的估計(jì)被標(biāo)以相應(yīng)的斜體符號(hào)(例如j )。按照兩個(gè)輸入信號(hào)的相關(guān)來(lái)表達(dá)此詳細(xì)描述中所導(dǎo)出的很多結(jié)果。信號(hào) 足=W1] [2]… [斤]]"和毛=[ [1] ΧΛ[2]… [叫]7■的自相關(guān)和
互相關(guān)出于本說(shuō)明書(shū)的目的而被定義為 并且互相關(guān)系數(shù)被定義為 其中τ標(biāo)示轉(zhuǎn)置,Η標(biāo)示Hermitian轉(zhuǎn)置,*標(biāo)示復(fù)共軛,并且| |. | |標(biāo)示向量的幅 度。注意,信號(hào)向量的幅度等同于相應(yīng)自相關(guān)的平方根。2. 3.信號(hào)模型出于此詳細(xì)描述的目的,處于單個(gè)頻帶的并且在感興趣的時(shí)間段內(nèi)的任何輸入信 號(hào)被假設(shè)為由單個(gè)基本分量和環(huán)境所組成 其中&和&是基本分量,并且是環(huán)境分量。在可能存在多個(gè)基本聲音的情 況中,此假設(shè)不完全有效,但是它已證明是在時(shí)頻環(huán)境提取框架內(nèi)的合理近似。為了估計(jì)基本的和環(huán)境的信號(hào)分量,關(guān)于它們的性質(zhì)可做一些進(jìn)一步的假設(shè)。在 此詳細(xì)描述中稍后討論的情況下,假設(shè)兩個(gè)環(huán)境信號(hào)互相不相關(guān),并且與基本聲音不相關(guān)。 此外,可假設(shè)基本信號(hào)的互相關(guān)系數(shù)具有一個(gè)基本信號(hào)的幅度,這意思是除了可能的水平 和相位的差異以外、基本信號(hào)是相同的。允許水平和相位的差異有效地實(shí)現(xiàn)了基本聲音的 范疇內(nèi)的幅度以及/或者延遲移動(dòng)的(delay-panned)和矩陣編碼的分量(為了在矩陣 編碼/解碼的上下文中對(duì)環(huán)境提取進(jìn)行進(jìn)一步的討論,參見(jiàn)J. -M. Jot, A. Krishnaswamy, J. Laroche, J. Merimaa,and M. M. Goodwin, "Spatial AudioScene Coding in a universal two-channel 3-D stereo format,,,in AES 123rdConvention,(New York,NY,USA),October 2007,其內(nèi)容通過(guò)引用而被全部結(jié)合于此)。利用以上的假設(shè), 其中|. |標(biāo)示復(fù)數(shù)的幅度。3.環(huán)境提取屏蔽基于第2. 3節(jié)中定義的信號(hào)模型,可導(dǎo)出適用于第2. 1節(jié)的框架的幾個(gè)環(huán)境提取 方法。此節(jié)專(zhuān)注于單聲道的方法,其中利用基于輸入信號(hào)的自相關(guān)和互相關(guān)的標(biāo)量環(huán)境提 取屏蔽,來(lái)從左輸入信號(hào)提取左環(huán)境聲道并從右輸入聲道提取右環(huán)境聲道。處理可形式地 描述為(9) AL(t, f) = a L (t,f) XL (t,f)AE(t, f) = a E(t, f)XE(t, f)其中ciL(t,f)和aK(t,f)是環(huán)境提取屏蔽,t是時(shí)間,并且f是頻率。出于此節(jié)的目的,dL(t,f)和aK(t,f)限于實(shí)的正值。為了使所選擇的時(shí)間和頻 率分辨率內(nèi)的所估計(jì)環(huán)境信號(hào)的幅度與真實(shí)環(huán)境信號(hào)的幅度相對(duì)應(yīng),提取屏蔽應(yīng)當(dāng)與各個(gè) 聲道中的環(huán)境的比例相對(duì)應(yīng)。也就是說(shuō),根據(jù) 的屏蔽被尋找,其中環(huán)境信號(hào)的真實(shí)水平需要被估計(jì)。方程(6)和⑶給出了在已知輸入信號(hào)的自相關(guān)和互相關(guān)與四個(gè)未知信號(hào)分量的 水平之間的三個(gè)關(guān)系,四個(gè)未知信號(hào)分量是左基本聲音和環(huán)境以及右基本聲音和環(huán)境。為 了有效地解出環(huán)境分量的時(shí)間依賴(lài)和頻率依賴(lài)的水平,可進(jìn)行關(guān)于輸入信號(hào)的額外假設(shè)。 在下面的第3. 1和3. 2小節(jié)中調(diào)查了兩個(gè)可替代的假設(shè)。
8
3. 1.相等的環(huán)境比在一些工作中(例如,參見(jiàn) C. Avendano and J. -Μ. Jot, "A frequency-domain approach to multichannel upmix,,,L. Audio Eng. So. ,vol. 52,pp. 740-749, July/August 2004,其內(nèi)容被通過(guò)引用而全部結(jié)合于此并且在這里被稱(chēng)為“C. Avendano and J. -Μ. Jot, July/August 2004”),共同的屏蔽被用來(lái)從左和右信號(hào)提取環(huán)境。該屏蔽可被表示為對(duì)二 進(jìn)制屏蔽方法的軟判決(soft-decision)替換。在二進(jìn)制情況下,在每個(gè)時(shí)間和頻率處, 進(jìn)行關(guān)于信號(hào)是由基本分量還是由環(huán)境組成的判決;如果信號(hào)被認(rèn)為是環(huán)境的則環(huán)境提取 屏蔽被選為1,并且如果信號(hào)被認(rèn)為是基本的則環(huán)境提取屏蔽被選為0。因?yàn)檫@樣的硬判決 (hard decision)方法導(dǎo)致了不希望的假象(artifact),所以軟判決函數(shù)被引入以從相關(guān) 系數(shù)來(lái)確定共同屏蔽 其中Γ (.)是基于環(huán)境提取處理的所希望的特性而選擇的非線(xiàn)性函數(shù);自變量 1-1 Φ Ε|顯示了軟判決環(huán)境屏蔽的一般所希望的趨勢(shì);所希望的趨勢(shì)是當(dāng)相關(guān)系數(shù)接近一 (指示基本分量)時(shí)屏蔽應(yīng)當(dāng)接近零,并且當(dāng)相關(guān)系數(shù)接近零(指示環(huán)境)時(shí)屏蔽應(yīng)當(dāng)接近 一,以使得與屏蔽相乘選擇了環(huán)境分量并且抑制了基本分量。函數(shù)r (.)提供了基于主觀 評(píng)估來(lái)調(diào)整趨勢(shì)的能力(參見(jiàn) C. Avendano and J. -Μ. Jot, July/August 2004)。對(duì)主觀調(diào)整判決函數(shù)的一個(gè)替換是設(shè)置= α κ,并且解答方程(6)、⑶和(I0) 的系統(tǒng)以得到用于正確估計(jì)環(huán)境分量能量的理想的共同屏蔽。此方法產(chǎn)生(12)Ofcom=VHti 注意,這表明了平方根是方程(11)中的Γ (.)函數(shù)的可行選項(xiàng)。 aL= α ^的選擇暗示了如下假設(shè)
(13) 在存在著聲道之間的相當(dāng)大的水平差異的情況下,此假設(shè)已證明在收聽(tīng)評(píng)估中是 有問(wèn)題的。在僅僅在一個(gè)聲道中有信號(hào)的極端情況下,互相關(guān)系數(shù)未被定義,并且a。。m不能 被計(jì)算。此外,“寂靜的”聲道中的任何不相關(guān)的背景噪聲理論上導(dǎo)致a。。m= 1,并且活動(dòng) 的聲道因此將被估計(jì)為是完全環(huán)境的,這沒(méi)有為環(huán)境提取的目的服務(wù)。在C. Avendano and J. "Μ. Jot, July/August 2004中,通過(guò)采用額外的約束以使得如果輸入信號(hào)的水平差異在 所設(shè)置的閾值之上則輸入信號(hào)被視為完全基本的,來(lái)解決這些問(wèn)題。類(lèi)似的方法可結(jié)合在 本發(fā)明中。實(shí)現(xiàn)對(duì)于具有相當(dāng)大的水平差異的輸入信號(hào)的正確處理的另一方式是修改與環(huán) 境信號(hào)分量的相對(duì)水平有關(guān)的假設(shè),這將在下面進(jìn)行。3. 2.相等的環(huán)境水平如C. Avendano and J. -Μ. Jot, July/August 2004 中所討論的,環(huán)境通常在典型立 體聲記錄中的左右輸入聲道中具有相等的水平。對(duì)環(huán)境提取的一個(gè)邏輯假設(shè)因此是 (14) 其中記號(hào)Ia被引入以標(biāo)示環(huán)境水平。利用此假設(shè),環(huán)境屏蔽可如下被導(dǎo)出。從方
(6)、(8)和(14),可導(dǎo)出下面的方程
為了從以上的二次方程中解答/j,需要2I2ASrLL +r艦,即總的環(huán)境能量小于或等 于總的信號(hào)能量。這將解的數(shù)目限制為一個(gè),產(chǎn)生了 左和右提取屏蔽因此簡(jiǎn)單地是 或者,就自相關(guān)而言, 此外,總的估計(jì)的環(huán)境能量與總的信號(hào)能量的比可表達(dá)為 圖1A和圖IB示出了作為相關(guān)系數(shù)和輸入信號(hào)之間的水平差異的函數(shù)的環(huán)境 屏蔽的環(huán)境比和性狀。具體地,圖1A示出作為互相關(guān)系數(shù)和輸入信號(hào)的水平差異的函 數(shù)的Ea——總環(huán)境能量的分?jǐn)?shù)(fraction),而圖1B示出作為和輸入信號(hào)的水平差異
的函數(shù)的《£——&中的環(huán)境能量的分?jǐn)?shù)。對(duì)于完全相關(guān)的輸入信號(hào),根據(jù)信號(hào)模型,不管輸入信號(hào)的水平為何,環(huán)境比都為
),環(huán)境比是互相關(guān)系數(shù)的
0。對(duì)于相等水平的輸入信號(hào)(1 =、或者等同地I兄=
線(xiàn)性函數(shù),并且在此情況下方程(18)中的環(huán)境屏蔽等于方程(12)中表示的共同屏蔽。然 而,對(duì)于具有相關(guān)系數(shù)0的信號(hào)而言,僅針對(duì)相等水平的輸入信號(hào)的情況,環(huán)境比才為1 ;對(duì) 于增加的水平差異而言,由于輸入聲道中的環(huán)境總是具有相等水平的假設(shè),算法將更強(qiáng)的 信號(hào)解釋為是愈加基本的。為了提供對(duì)環(huán)境提取處理的一般概述,圖1C描繪了示出根據(jù)本發(fā)明的一個(gè)實(shí)施 例的提取環(huán)境的方法的流程圖。該方法以操作102中對(duì)立體聲輸入信號(hào)的接收開(kāi)始。接下 來(lái),在操作104中,利用任何已知的方法,例如短時(shí)傅里葉變換,來(lái)將輸入信號(hào)轉(zhuǎn)換為頻域 或子帶表示。接下來(lái),在操作106中,針對(duì)每個(gè)頻帶并且在感興趣的時(shí)間段內(nèi)計(jì)算輸入信號(hào) 的自相關(guān)和互相關(guān)。接下來(lái),在操作108中,計(jì)算環(huán)境提取屏蔽。這些是基于輸入信號(hào)的互相關(guān)和自相 關(guān)來(lái)計(jì)算的,并且這些還基于與輸入信號(hào)的各個(gè)左右聲道中的環(huán)境水平有關(guān)的假設(shè)。在一 個(gè)實(shí)施例中,假設(shè)了聲道中相等的環(huán)境水平。在另一實(shí)施例中,假設(shè)了相等的環(huán)境比。在操作110中,環(huán)境提取屏蔽應(yīng)用于輸入信號(hào)的時(shí)頻表示,以生成時(shí)頻的環(huán)境分量信號(hào)。在操作112中,從時(shí)頻的環(huán)境分量生成時(shí)域的輸出信號(hào)。在操作114中,通過(guò)對(duì)相 關(guān)領(lǐng)域的技術(shù)人員而言已知的任何合適的方法,來(lái)將輸出信號(hào)轉(zhuǎn)換到時(shí)域。最后,在操作 116中,輸出信號(hào)被提供給呈現(xiàn)或再現(xiàn)系統(tǒng)。4.相關(guān)計(jì)算根據(jù)本發(fā)明的一些實(shí)施例,提供了方法以用于補(bǔ)償短期互相關(guān)的估計(jì)中的偏置。 遞歸相關(guān)計(jì)算中所使用的時(shí)間常數(shù)對(duì)輸入信號(hào)的互相關(guān)的平均估計(jì)幅度具有相當(dāng)大的影 響。在相關(guān)計(jì)算中使用小時(shí)間常數(shù)導(dǎo)致了對(duì)環(huán)境量的低估。然而,希望使用相對(duì)小的時(shí)間常 數(shù)來(lái)改進(jìn)從動(dòng)態(tài)信號(hào)的環(huán)境提取。對(duì)小時(shí)間常數(shù)的影響的補(bǔ)償保持了對(duì)動(dòng)態(tài)信號(hào)的性能, 同時(shí)糾正了低估。在實(shí)際的實(shí)時(shí)實(shí)現(xiàn)方式中,自相關(guān)和互相關(guān)可利用遞歸公式被近似為(34)rLL( ^XrLL(t-\) + {\-X)X[ (t)XL (t)rm ( ) = Xrm ( -1) + (1 - λ)Χ; ( Xr (/)rLR ( ) = ;I ( -1) + (1 -λ)Χ[ (t)XR ( 其中λ e
是遺忘因子(參見(jiàn) J. Allen, D. Berkeley, and J. Blauert, "Multi-microphone signal-processing technique to remove room reverberation fromspeech signals, " J. Acoust. Soc. Am. , vol. 62, pp.912-915, October 1977,以及 C.Avendano and J. -M. Jot, "Ambience extraction and synthesis from stereosignals for multi-channel audio up—mix,,,in Proc. IEEE Int. Conf. on Acoust. , Speech, Signal Processing, (Orlando,F(xiàn)L,USA),May 2002,它們的內(nèi)容通過(guò)引用而被全部結(jié)合于此)。處理的時(shí)間常數(shù)是由遺忘因子確定的,并且可表達(dá)為 其中f。是計(jì)算中所用的采樣率。注意,計(jì)算中所用的采樣率未必等于輸入信號(hào)的
采樣率。具體地,在STFT實(shí)現(xiàn)方式中,/e = ‘,其中fs是原始時(shí)域信號(hào)的采樣率,并且h是
h
分析中所用的跳距(hop size)。對(duì)于接近1的λ的值,相關(guān)估計(jì)趨近過(guò)去信號(hào)的真實(shí)相關(guān);然而注意,(34)中的 計(jì)算對(duì)于λ = 1是定義錯(cuò)誤的。對(duì)于較小的λ,遞歸近似對(duì)應(yīng)于計(jì)算用指數(shù)衰減時(shí)間窗 口加權(quán)過(guò)的信號(hào)的相關(guān)。短時(shí)間常數(shù)對(duì)于正確地處理瞬態(tài)信號(hào)是必要的;然而,對(duì)于平穩(wěn)信 號(hào),對(duì)計(jì)算時(shí)間段的限制導(dǎo)致了估計(jì)誤差。在下面,評(píng)價(jià)遞歸估計(jì)方法的這些誤差。然而注 意,所識(shí)別的問(wèn)題不特定針對(duì)遞歸估計(jì),而是與計(jì)算短時(shí)估計(jì)有關(guān)。對(duì)于可替代的互相關(guān)估 計(jì)方法,因此也發(fā)生類(lèi)似的誤差(例如,參見(jiàn)R. Μ. Aarts, R. Irwan, and A. J. Ε. Μ. Janssen, "Efficient tracking of the cross-correlationcoefficient," IEEE Trans.Speech Audio Proc.,vol. 10,pp. 391-402,S印tember2002,其內(nèi)容通過(guò)引用而被全部結(jié)合于此)。對(duì)于平穩(wěn)的輸入信號(hào),相關(guān)估計(jì)的分布取決于遺忘因子,以使得λ越大,估計(jì)與 真實(shí)值的偏差越小。這針對(duì)圖2所示的模擬結(jié)果中的互相關(guān)系數(shù)(Kk而被示出。互相關(guān) 系數(shù)是針對(duì)具有真實(shí)互相關(guān)0.5的、兩個(gè)240,000樣本的相等水平的高斯信號(hào)來(lái)計(jì)算出的。 利用長(zhǎng)度1024的50%重疊Hann開(kāi)窗(Hann-windowed)時(shí)間幀,而在STFT域中執(zhí)行計(jì)算;
11所描繪的數(shù)據(jù)是在分析已到達(dá)穩(wěn)定狀態(tài)之后對(duì)所有產(chǎn)生的時(shí)頻拼塊(tile)的聚集。圖2中的頂板(top panel)示出對(duì)于遺忘因子入的一個(gè)范圍的所估計(jì)互相關(guān)系 數(shù)的實(shí)部、虛部和幅度的概率分布函數(shù)(PDF)。底板(bottompanel)還示出了相應(yīng)的估計(jì)值 的平均數(shù)(實(shí)線(xiàn))以及25%和75%四分位數(shù)(虛線(xiàn))。通過(guò)在所有的時(shí)頻面元(bin)上形 成所分析的量的直方圖,來(lái)估計(jì)PDF。對(duì)于實(shí)部和虛部,不管\為何,平均值是近似正確的。然而,平均起來(lái),互相關(guān)系 數(shù)?、堑姆葘?duì)于小的、而言被相當(dāng)?shù)馗吖懒恕_@是由于如下的事實(shí)互相關(guān)系數(shù)的幅度 是幅度的函數(shù),而不是所估計(jì)的實(shí)部和虛部的帶符號(hào)的值的函數(shù)。接下來(lái),圖3還示出了對(duì)于入的一個(gè)范圍、作為真實(shí)| cK」的函數(shù)的平均估計(jì)相 關(guān)系數(shù)幅度I 」。對(duì)于小的入,平均數(shù)的范圍被相當(dāng)?shù)貕嚎s了。在環(huán)境提取的語(yǔ)境中,這 暗示了輸入信號(hào)中的環(huán)境量將被低估。下面進(jìn)一步討論了改進(jìn)相關(guān)估計(jì)的補(bǔ)償方法。最后,應(yīng)當(dāng)注意,對(duì)于所計(jì)算的自相關(guān)(信號(hào)能量),也發(fā)生估計(jì)誤差。這些誤差相 比于對(duì)互相關(guān)系數(shù)的幅度的估計(jì)中所看到的誤差通常是小的。然而,不相關(guān)的信號(hào)將產(chǎn)生 波動(dòng)的短時(shí)水平差異估計(jì),這些估計(jì)對(duì)環(huán)境提取可能有影響。具體地,由于自相關(guān)中的估計(jì) 誤差,假設(shè)純的環(huán)境具有左右聲道中的相等水平的任何方法將會(huì)把這樣的純的環(huán)境描述為 部分基本的。對(duì)于較小的遺忘因子,由于對(duì)輸入信號(hào)之間平均互相關(guān)的高估,提取正確的環(huán)境 量的能力惡化了。然而,如利用互相關(guān)準(zhǔn)則所測(cè)量的,單聲道方法的性能對(duì)于較小的遺忘因 子而言改進(jìn)了。如第2. 1節(jié)中所提到的,這些方法本質(zhì)上實(shí)現(xiàn)了輸入信號(hào)的時(shí)間依賴(lài)的過(guò) 濾。它們的分開(kāi)信號(hào)內(nèi)的環(huán)境聲音和基本聲音的能力因此取決于能夠找到如下的時(shí)頻區(qū) 域在其中,這些分量中的一個(gè)比其他的占優(yōu)勢(shì)。雖然使用小的遺忘因子增加了相關(guān)估計(jì)處 理中的誤差,但是它是必要的,以便可靠地找到這樣的時(shí)頻區(qū)域。因?yàn)槭褂孟鄬?duì)小的時(shí)間常數(shù)對(duì)于單聲道環(huán)境提取方法而言顯得是有利的,所以調(diào) 查互相關(guān)系數(shù)的平均幅度的高估是否可被補(bǔ)償以便進(jìn)一步改進(jìn)提取結(jié)果是令人感興趣的。 圖3建議所估計(jì)互相關(guān)系數(shù)的平均的范圍被壓縮至粗略地[1-X,1]。因此,作為很粗糙的 近似,對(duì)互相關(guān)系數(shù)的短時(shí)估計(jì)可通過(guò)如下形式的補(bǔ)償而被改進(jìn) 此補(bǔ)償在[1_X,1]到
的范圍中線(xiàn)性地?cái)U(kuò)展了相關(guān)系數(shù)。max{}算子 (operator)的函數(shù)是要給原始地在1_入之下到0的最初的幅度估計(jì)設(shè)立閾值,以便防止經(jīng) 補(bǔ)償?shù)姆鹊竭_(dá)負(fù)值。對(duì)于單聲道的方法,補(bǔ)償增加了所提取的環(huán)境能量的分?jǐn)?shù),以使得它變得很接近 于小的環(huán)境量的正確值。此外,改進(jìn)了相等比的方法提取相關(guān)基本分量的能力。然而,相等 水平的方法的相應(yīng)的基本相關(guān)較少得到改進(jìn)。這可通過(guò)相等水平的方法對(duì)自相關(guān)中的估計(jì) 誤差的敏感性來(lái)解釋。雖然當(dāng)左右聲道中的環(huán)境的真實(shí)比例相同時(shí)兩個(gè)單聲道方法理論上是相同的,但 是相等水平的方法由于在不相關(guān)環(huán)境信號(hào)之間發(fā)生的隨機(jī)瞬時(shí)水平差異而低估了環(huán)境量。 如早些時(shí)候所提及的,使用相對(duì)短的時(shí)間常數(shù)是必要的,以便正確地處理動(dòng)態(tài)信號(hào)。具體 地,能夠正確地分類(lèi)基本瞬態(tài)是在分離具有主觀基本和環(huán)境的性質(zhì)的信號(hào)分量時(shí)的重要因素.為了進(jìn)一步闡述,圖4描繪了示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的環(huán)境提取的方法的 流程圖。該方法以操作402中對(duì)立體聲輸入信號(hào)的接收開(kāi)始。接下來(lái),在操作404中,輸入 信號(hào)被分析以確定立體聲輸入信號(hào)中的環(huán)境量??衫萌魏苇h(huán)境估計(jì)方法,例如這里所討 論的單聲道方法,來(lái)分析輸入信號(hào)。根據(jù)各種實(shí)施例,對(duì)輸入信號(hào)的分析包括對(duì)短期互相關(guān) 系數(shù)的估計(jì)。分析還可包括利用任何已知的方法,例如短時(shí)傅里葉變換,來(lái)使輸入信號(hào)被轉(zhuǎn) 換為頻域或子帶的表示。一般地,針對(duì)每個(gè)頻帶并且在感興趣的時(shí)間段內(nèi)執(zhí)行輸入信號(hào)的 自相關(guān)和互相關(guān)。在操作406中,可利用補(bǔ)償因子來(lái)補(bǔ)償從對(duì)短期互相關(guān)系數(shù)的估計(jì)而產(chǎn)生的任何 偏置(例如方程(44))。接下來(lái),在操作408中,導(dǎo)出環(huán)境提取屏蔽。這些是基于輸入信號(hào) 的經(jīng)補(bǔ)償?shù)亩唐诨ハ嚓P(guān)系數(shù)(在一些實(shí)施例中被可選地補(bǔ)償)、互相關(guān)以及自相關(guān)來(lái)導(dǎo)出 的,并且這些還基于與輸入信號(hào)的各個(gè)聲道中的環(huán)境水平有關(guān)的假設(shè)。在一個(gè)實(shí)施例中,假 設(shè)了聲道中相等的環(huán)境水平。在另一實(shí)施例中,假設(shè)了相等的環(huán)境比。在操作410中,環(huán)境提取屏蔽應(yīng)用于輸入信號(hào)的時(shí)頻表示,以生成時(shí)頻的環(huán)境分 量信號(hào)。在操作412中,從時(shí)頻的環(huán)境分量生成時(shí)域的輸出信號(hào)。在操作414中,通過(guò)對(duì)相 關(guān)領(lǐng)域的技術(shù)人員而言已知的任何合適的方法,來(lái)將輸出信號(hào)轉(zhuǎn)換到時(shí)域。最后,在操作 416中,輸出信號(hào)被提供給呈現(xiàn)或再現(xiàn)系統(tǒng)。圖5示出了根據(jù)本發(fā)明的各種實(shí)施例的、用于從多聲道輸入信號(hào)502提取環(huán)境分 量的系統(tǒng)500。系統(tǒng)500包括時(shí)間到頻率變換模塊504、相關(guān)計(jì)算模塊506、環(huán)境屏蔽導(dǎo)出 模塊508、環(huán)境屏蔽乘法模塊510和頻率到時(shí)間變換模塊512。本領(lǐng)域的技術(shù)人員將會(huì)認(rèn)識(shí) 到,系統(tǒng)500可被配置為包括一些或全部的這些模塊以及與其他系統(tǒng)、例如再現(xiàn)系統(tǒng)514集 成,以產(chǎn)生用于音頻回放的音頻系統(tǒng)。應(yīng)當(dāng)注意,系統(tǒng)500的各種部分可被實(shí)現(xiàn)在計(jì)算機(jī)軟 件和/或硬件中。例如,模塊504、506、508、510、512可被實(shí)現(xiàn)為程序子例程,這些程序子例 程被計(jì)算機(jī)系統(tǒng)的處理器編程進(jìn)存儲(chǔ)器和執(zhí)行。此外,模塊504、506、508、510、512可被實(shí) 現(xiàn)為分開(kāi)的模塊或組合的模塊。參考圖5,多聲道輸入信號(hào)502被示為到時(shí)間到頻率變換模塊504的聲道輸入。一 般地,多聲道輸入信號(hào)502包括多個(gè)聲道。然而,為了促進(jìn)對(duì)本發(fā)明的理解,多聲道輸入信 號(hào)502在圖5中被示為具有右聲道和左聲道的立體聲信號(hào)。每個(gè)聲道可被分解成基本分量 和環(huán)境分量。時(shí)間到頻率變換模塊504被配置為將多聲道輸入信號(hào)502轉(zhuǎn)換成對(duì)多聲道輸 入信號(hào)的任何數(shù)目的聲道的時(shí)頻表示。因此,左右聲道被轉(zhuǎn)換成時(shí)頻表示并被從模塊504 輸出。來(lái)自模塊504的輸出變?yōu)榈较嚓P(guān)計(jì)算模塊506的輸入。相關(guān)計(jì)算模塊506被配置 為確定來(lái)自模塊504的輸出的信號(hào)相關(guān)。例如,信號(hào)相關(guān)可包括時(shí)頻表示中每個(gè)時(shí)間和頻 率的互相關(guān)和自相關(guān)。相關(guān)計(jì)算模塊506還可被配置為通過(guò)使用本發(fā)明的技術(shù)選擇來(lái)估計(jì) 短期互相關(guān)系數(shù)和/或補(bǔ)償對(duì)短期互相關(guān)系數(shù)的估計(jì)中的偏置。如圖5所示,對(duì)左和右聲 道的自相關(guān)和互相關(guān)被輸入進(jìn)環(huán)境屏蔽導(dǎo)出模塊508??蛇x地,互相關(guān)線(xiàn)路被配置為與對(duì)短 期互相關(guān)系數(shù)的經(jīng)補(bǔ)償估計(jì)相對(duì)應(yīng)。環(huán)境屏蔽導(dǎo)出模塊508被配置為根據(jù)所確定的信號(hào)相關(guān)、經(jīng)補(bǔ)償?shù)亩唐诨ハ嚓P(guān)系 數(shù)(可選的)、和/或所假設(shè)的關(guān)于多聲道輸入信號(hào)的各個(gè)聲道中的環(huán)境水平的關(guān)系來(lái)導(dǎo)出環(huán)境提取屏蔽。根據(jù)一個(gè)實(shí)施例,所假設(shè)的關(guān)系是輸入信號(hào)的各個(gè)聲道中存在相等的環(huán)境 比。根據(jù)優(yōu)選實(shí)施例,所假設(shè)的關(guān)系是多聲道輸入信號(hào)的各個(gè)聲道中存在相等的環(huán)境水平??蓪?dǎo)出任何數(shù)目的環(huán)境提取屏蔽。所導(dǎo)出的環(huán)境提取屏蔽可以是用于應(yīng)用到多個(gè) 聲道的共同屏蔽或獨(dú)立屏蔽。根據(jù)一個(gè)實(shí)施例,共同屏蔽被導(dǎo)出,用于應(yīng)用到左右聲道兩 者。在優(yōu)選實(shí)施例中,獨(dú)立屏蔽被導(dǎo)出,用于分別應(yīng)用到左右聲道。一旦環(huán)境提取屏蔽被導(dǎo) 出,它就被輸出至環(huán)境屏蔽乘法模塊510。圖5示出從模塊508輸出的用于左右聲道的兩個(gè) 環(huán)境提取屏蔽。環(huán)境屏蔽乘法模塊510被配置為將環(huán)境提取屏蔽與時(shí)頻表示相乘,以生成多聲道 輸入信號(hào)的各個(gè)聲道的環(huán)境分量的時(shí)頻表示。這樣,模塊510接收來(lái)自模塊504的時(shí)頻表 示輸入以及來(lái)自模塊508的環(huán)境提取屏蔽輸入,并且輸出右和左聲道的環(huán)境分量的相應(yīng)時(shí) 頻表示。環(huán)境分量的相應(yīng)時(shí)頻表示然后被輸入進(jìn)頻率到時(shí)間變換模塊512,頻率到時(shí)間變 換模塊512被配置為將環(huán)境分量轉(zhuǎn)換成各個(gè)時(shí)間表示。頻率到時(shí)間變換模塊512執(zhí)行時(shí)間 到頻率變換模塊504的逆操作。在環(huán)境分量被轉(zhuǎn)換之后,它們的各個(gè)時(shí)間表示被輸出進(jìn)再 現(xiàn)系統(tǒng)514。參考圖5,再現(xiàn)系統(tǒng)514還接收多聲道輸入信號(hào)502作為輸入。再現(xiàn)系統(tǒng)514可包括用于再現(xiàn)來(lái)自系統(tǒng)500的經(jīng)處理音頻的任何數(shù)目的組件。本 領(lǐng)域的技術(shù)人員將會(huì)認(rèn)識(shí)到,這些組件可包括混合器、轉(zhuǎn)換器、放大器、揚(yáng)聲器等。例如,混 合器可用來(lái)從多聲道輸入信號(hào)502 (多聲道輸入信號(hào)502包括右和左聲道的基本分量和環(huán) 境分量)減去環(huán)境分量,以便從多聲道輸入信號(hào)502提取基本分量。為了進(jìn)一步增強(qiáng)收聽(tīng) 體驗(yàn),在一些實(shí)施例中,在回放之前在再現(xiàn)系統(tǒng)514中加強(qiáng)(boost)環(huán)境分量。根據(jù)本發(fā)明 的各種實(shí)施例,基本分量和環(huán)境分量然后被分開(kāi)地分布以用于回放。例如,在多聲道揚(yáng)聲器 系統(tǒng)中,一些環(huán)境被發(fā)送至環(huán)繞聲道;在頭戴式耳機(jī)系統(tǒng)中,環(huán)境可與基本分量不同地被虛 擬化。以此方式,可增強(qiáng)收聽(tīng)體驗(yàn)中的沉浸感。5.結(jié)論描述了幾個(gè)基于相關(guān)的環(huán)境提取方法?;谒捎玫男盘?hào)模型以及關(guān)于環(huán)境水平 的不同假設(shè)來(lái)解析地導(dǎo)出了兩個(gè)新的單聲道環(huán)境提取屏蔽,所述不同假設(shè)是左右輸入信 號(hào)內(nèi)的相等比和相等水平。描述了相等水平假設(shè)對(duì)于相等比方法是優(yōu)選的。還描述了遞歸相關(guān)計(jì)算中所使用的時(shí)間常數(shù)對(duì)輸入信號(hào)的互相關(guān)的平均估計(jì)幅 度具有相當(dāng)大的影響。根據(jù)一些方法,使用小時(shí)間常數(shù)導(dǎo)致了對(duì)環(huán)境量的低估。然而,相對(duì) 小的時(shí)間常數(shù)對(duì)于單聲道屏蔽方法的成功操作而言是有利的。還描述了小時(shí)間常數(shù)改進(jìn)了 從動(dòng)態(tài)輸入信號(hào)的環(huán)境提取。呈現(xiàn)了對(duì)時(shí)間常數(shù)的影響的簡(jiǎn)單補(bǔ)償,以改進(jìn)環(huán)境提取結(jié)果。雖然出于清楚理解的目的已多少詳細(xì)地描述了上述發(fā)明,但是將會(huì)清楚的是在所 附權(quán)利要求的范圍內(nèi)可實(shí)踐某些改變和修改。因此,本實(shí)施例要被視作例示性的而非限制 性的,并且本發(fā)明將不限于這里所給出的細(xì)節(jié),而是可在所附權(quán)利要求的范圍和等同物內(nèi) 被修改。
權(quán)利要求
一種從多聲道輸入信號(hào)進(jìn)行環(huán)境提取的方法,所述方法包括將所述多聲道輸入信號(hào)轉(zhuǎn)換成時(shí)頻表示;確定信號(hào)相關(guān),所述信號(hào)相關(guān)包括所述時(shí)頻表示中對(duì)于每個(gè)時(shí)間和頻率的互相關(guān)和自相關(guān);以及將環(huán)境提取屏蔽應(yīng)用于所述時(shí)頻表示,其中所述屏蔽基于所確定的信號(hào)相關(guān)并且基于與所述多聲道輸入信號(hào)的各個(gè)聲道中的環(huán)境水平有關(guān)的假設(shè)關(guān)系。
2.根據(jù)權(quán)利要求1所述的方法,其中所述假設(shè)關(guān)系是所述多聲道輸入信號(hào)的各個(gè)聲道 中存在相等的環(huán)境水平。
3.根據(jù)權(quán)利要求2所述的方法,其中環(huán)境水平是就所述多聲道輸入信號(hào)的各個(gè)聲道中 的能量水平而言來(lái)被測(cè)量的。
4.根據(jù)權(quán)利要求1所述的方法,其中所述假設(shè)關(guān)系是所述多聲道輸入信號(hào)的各個(gè)聲道 中存在相等的環(huán)境比。
5.根據(jù)權(quán)利要求4所述的方法,其中相等的環(huán)境比是就各個(gè)相應(yīng)聲道的、環(huán)境能量相 比于輸入信號(hào)能量而言來(lái)被測(cè)量的。
6.根據(jù)權(quán)利要求1所述的方法,其中將所述多聲道輸入信號(hào)轉(zhuǎn)換成所述時(shí)頻表示產(chǎn)生 了與所述多聲道輸入信號(hào)的每個(gè)聲道相對(duì)應(yīng)的獨(dú)立時(shí)頻表示。
7.根據(jù)權(quán)利要求6所述的方法,其中將所述環(huán)境提取屏蔽應(yīng)用于所述時(shí)頻表示包括將所述環(huán)境提取屏蔽和相應(yīng)的時(shí)頻表示相乘,相乘產(chǎn)生了環(huán)境的相應(yīng)時(shí)頻表示。
8.根據(jù)權(quán)利要求6所述的方法,還包括根據(jù)所確定的信號(hào)相關(guān)以及與所述多聲道輸入信號(hào)的各個(gè)聲道中的環(huán)境水平有關(guān)的 所述假設(shè)關(guān)系來(lái)導(dǎo)出所述環(huán)境提取屏蔽。
9.根據(jù)權(quán)利要求8所述的方法,其中導(dǎo)出所述環(huán)境提取屏蔽產(chǎn)生了共同的環(huán)境提取屏 蔽,所述共同的環(huán)境提取屏蔽用于應(yīng)用到所述多聲道輸入信號(hào)的各個(gè)聲道的時(shí)頻表示。
10.根據(jù)權(quán)利要求8所述的方法,其中導(dǎo)出所述環(huán)境提取屏蔽產(chǎn)生了不同的環(huán)境提取 屏蔽,所述不同的環(huán)境提取屏蔽用于應(yīng)用到所述多聲道輸入信號(hào)的各個(gè)聲道的時(shí)頻表示。
11.一種環(huán)境提取的方法,包括分析輸入信號(hào)以確定所述輸入信號(hào)中的環(huán)境量,其中分析所述輸入信號(hào)包括估計(jì)短期 互相關(guān)系數(shù);以及補(bǔ)償對(duì)所述短期互相關(guān)系數(shù)的估計(jì)中的偏置。
12.根據(jù)權(quán)利要求11所述的方法,其中分析所述輸入信號(hào)包括將所述輸入信號(hào)轉(zhuǎn)換成時(shí)頻表示;確定信號(hào)相關(guān),所述信號(hào)相關(guān)包括所述時(shí)頻表示中對(duì)于每個(gè)時(shí)間和頻率的互相關(guān)和自 相關(guān);以及將環(huán)境提取屏蔽應(yīng)用于所述時(shí)頻表示,其中所述屏蔽基于所確定的信號(hào)相關(guān)、經(jīng)補(bǔ)償 的短期互相關(guān)系數(shù),并且基于與所述輸入信號(hào)的各個(gè)聲道中的環(huán)境水平有關(guān)的假設(shè)關(guān)系。
13.根據(jù)權(quán)利要求12所述的方法,其中所述假設(shè)關(guān)系是所述輸入信號(hào)的各個(gè)聲道中存 在相等的環(huán)境水平。
14.根據(jù)權(quán)利要求12所述的方法,其中所述假設(shè)關(guān)系是所述輸入信號(hào)的各個(gè)聲道中存 在相等的環(huán)境比。
15.根據(jù)權(quán)利要求12所述的方法,其中所述環(huán)境提取屏蔽包括共同的環(huán)境提取屏蔽, 所述共同的環(huán)境提取屏蔽用于應(yīng)用到所述輸入信號(hào)的各個(gè)聲道的時(shí)頻表示。
16.根據(jù)權(quán)利要求12所述的方法,其中所述環(huán)境提取屏蔽包括不同的環(huán)境提取屏蔽, 所述不同的環(huán)境提取屏蔽用于應(yīng)用到所述輸入信號(hào)的各個(gè)聲道的時(shí)頻表示。
17.一種用于從多聲道輸入信號(hào)提取環(huán)境分量的系統(tǒng),所述系統(tǒng)包括時(shí)間到頻率變換模塊,所述時(shí)間到頻率變換模塊可操作用于將所述多聲道輸入信號(hào)轉(zhuǎn) 換成對(duì)于所述多聲道輸入信號(hào)的各個(gè)聲道的時(shí)頻表示;相關(guān)計(jì)算模塊,所述相關(guān)計(jì)算模塊可操作用于確定信號(hào)相關(guān),所述信號(hào)相關(guān)包括所述 時(shí)頻表示中對(duì)于每個(gè)時(shí)間和頻率的互相關(guān)和自相關(guān);環(huán)境屏蔽導(dǎo)出模塊,所述環(huán)境屏蔽導(dǎo)出模塊可操作用于根據(jù)所確定的信號(hào)相關(guān)以及與 所述多聲道輸入信號(hào)的各個(gè)聲道中的環(huán)境水平有關(guān)的假設(shè)關(guān)系來(lái)導(dǎo)出環(huán)境提取屏蔽;環(huán)境屏蔽乘法模塊,所述環(huán)境屏蔽乘法模塊可操作用于將所述環(huán)境提取屏蔽與所述時(shí) 頻表示相乘,以生成所述多聲道輸入信號(hào)的各個(gè)聲道的環(huán)境分量的時(shí)頻表示;以及頻率到時(shí)間變換模塊,所述頻率到時(shí)間變換模塊可操作用于將所述環(huán)境分量的時(shí)頻表 示轉(zhuǎn)換成各個(gè)時(shí)間表示。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所述相關(guān)計(jì)算模塊還可操作用于估計(jì)短期互相 關(guān)系數(shù)以及用于補(bǔ)償對(duì)所述短期互相關(guān)系數(shù)的估計(jì)中的偏置。
19.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所述假設(shè)關(guān)系是所述多聲道輸入信號(hào)的各個(gè)聲 道中存在相等的環(huán)境水平。
20.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所導(dǎo)出的環(huán)境提取屏蔽產(chǎn)生了不同的環(huán)境提取 屏蔽,所述不同的環(huán)境提取屏蔽用于應(yīng)用到所述多聲道輸入信號(hào)的各個(gè)聲道的時(shí)頻表示。
全文摘要
一種環(huán)境提取的方法,包括分析輸入信號(hào)以確定輸入信號(hào)中的時(shí)間依賴(lài)和頻率依賴(lài)的環(huán)境量,其中環(huán)境量是基于信號(hào)模型以及從輸入信號(hào)計(jì)算出的相關(guān)量來(lái)確定的,并且其中環(huán)境是利用乘法的時(shí)頻屏蔽來(lái)提取的。另一種環(huán)境提取的方法包括補(bǔ)償對(duì)短期互相關(guān)系數(shù)的估計(jì)中的偏置。此外,公開(kāi)了具有用于實(shí)現(xiàn)以上方法的各種模塊的系統(tǒng)。
文檔編號(hào)G10L19/00GK101889308SQ200880119431
公開(kāi)日2010年11月17日 申請(qǐng)日期2008年10月2日 優(yōu)先權(quán)日2007年10月4日
發(fā)明者吉恩-馬克·喬特, 朱哈·O·梅里瑪, 邁克爾·M·古德溫 申請(qǐng)人:創(chuàng)新科技有限公司