專(zhuān)利名稱(chēng):多聲道音頻信號(hào)表示方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)使用空間參數(shù)的音頻信號(hào)的多聲道表示進(jìn)行編碼。本發(fā)明講授了用于估計(jì)和定義合適參數(shù)的新方法,來(lái)從數(shù)目少于輸出聲道數(shù)的聲道中再現(xiàn)多聲道信號(hào)。具體地,本發(fā)明的目標(biāo)在于最小化多聲道表示的比特率,以及為所有可能的聲道配置提供能實(shí)現(xiàn)數(shù)據(jù)簡(jiǎn)易編碼和解碼的多聲道信號(hào)的編碼表示。
背景技術(shù):
如 PCT/SE02/01372” Efficient and scalable Parametric Stereo Coding for Low Bit rate Audio Coding Applications”中所示,可以從給定了立體聲圖像壓縮表示的單聲道信號(hào)中再現(xiàn)出和原始立體聲圖像非常接近的立體聲圖像?;驹硎菍⑤斎胄盘?hào)劃分成頻帶和時(shí)間段,對(duì)這些頻帶和時(shí)間段,估算聲道間強(qiáng)度差(IID)和聲道間相干度 (ICC)。第一個(gè)參數(shù)是在特定的頻帶上對(duì)功率在兩聲道間分布的測(cè)量,而第二個(gè)參數(shù)是在特定的頻帶上對(duì)兩聲道間相干度的估計(jì)。在解碼器一側(cè),通過(guò)按照IID-數(shù)據(jù)把單聲道信號(hào)在兩個(gè)輸出聲道間分布以及加入一解相關(guān)信號(hào)來(lái)保留原始立體聲聲道的聲道相干度,從而將立體聲圖像從單聲道信號(hào)中再現(xiàn)出來(lái)。對(duì)于多聲道的情況(多聲道在上下文中指多于兩個(gè)輸出聲道),不得不考慮若干額外的問(wèn)題。目前存在若干種多聲道配置。最熟知的是5.1配置(中聲道,前置左/右,環(huán)繞左/右,和LFE聲道)。但是也存在許多其它配置。根據(jù)完整的編碼/解碼系統(tǒng)的觀點(diǎn),希望得到的系統(tǒng)能對(duì)所有的聲道配置使用相同的參數(shù)集(例如IID和ICC)或其子集。ITU-R BS. 775定義了若干縮混(down-mix)方案,能夠從給定的聲道配置中獲得由更少聲道組成的聲道配置。和總是不得不對(duì)所有聲道解碼以及對(duì)縮混的依賴(lài)不同,希望得到一種多聲道表示,使接收機(jī)在對(duì)聲道解碼之前能夠提取和現(xiàn)有聲道配置相關(guān)的參數(shù)。此外,根據(jù)可擴(kuò)展或嵌入式編碼的觀點(diǎn),希望得到內(nèi)在可擴(kuò)展的參數(shù)集,其中,例如在比特流的增強(qiáng)層存儲(chǔ)與環(huán)繞聲道相對(duì)應(yīng)的數(shù)據(jù)是可能的。和上述相反,還希望得到的是能夠基于被處理信號(hào)的特性采用不同的參數(shù)定義, 來(lái)在參數(shù)化之間切換,這導(dǎo)致針對(duì)當(dāng)前所處理信號(hào)段的最小比特率開(kāi)銷(xiāo)。本領(lǐng)域中還有另一種所熟知的采用加和信號(hào)或縮混信號(hào)以及附加參數(shù)側(cè)面信息的多聲道信號(hào)表示,叫做雙聲道提示編碼(BCC,binaural cue coding) 0此項(xiàng)技術(shù)在〃 Binaural Cue Coding-Part 1 :Psycho_Acoustic Fundamentals and Design Principles" , IEEE Transactions on Speech and Audio Processing, vol.11, No. 6, November 2003, F. Baumgarte, C. Faller,禾口〃 Binaural Cue Coding. Part IISchemes and Applications" , IEEE Transactions on Speech and Audio Processing vol.11, No. 6,November 2003,C. Faller and F. Baumgarte 中進(jìn)行了描述。一般來(lái)說(shuō),雙聲道提示編碼是一種根據(jù)一個(gè)縮混音頻聲道和側(cè)面信息進(jìn)行多聲道空間呈現(xiàn)的方法。由BCC編碼器計(jì)算及BCC解碼器使用的用于音頻重建和音頻呈現(xiàn)的若干參數(shù)包括聲道間幅度差,聲道間時(shí)間差和聲道間相干參數(shù)。這些聲道間提示是感知空間圖像的決定性因素。針對(duì)原始多聲道信號(hào)的多個(gè)時(shí)間樣本塊給出這些參數(shù),并且這些參數(shù)的給出具有頻率選擇性,使得多聲道信號(hào)的每一個(gè)樣本塊對(duì)若干個(gè)頻段有若干個(gè)提示。對(duì)于 C回放聲道的一般情況,在聲道對(duì)之間每個(gè)子帶中考慮聲道間幅度差和聲道間時(shí)間差,也就是說(shuō)相對(duì)于參考聲道考慮每一個(gè)聲道。針對(duì)每個(gè)聲道間幅度差都定義一個(gè)聲道作為參考聲道。通過(guò)聲道間幅度差和聲道間時(shí)間差,將音源呈現(xiàn)到所使用的回放設(shè)備的某一揚(yáng)聲器對(duì)之間的任何方向上是有可能的。為了確定所呈現(xiàn)音源的廣度或擴(kuò)散,對(duì)所有的音頻聲道來(lái)說(shuō)每個(gè)子帶考慮一個(gè)參數(shù)就足夠了。這個(gè)參數(shù)就是聲道間相干參數(shù)。所呈現(xiàn)音源的寬度通過(guò)修改子帶信號(hào)來(lái)控制,使得所有可能的聲道對(duì)具有相同的聲道間相干參數(shù)。在BCC編碼中,所有的聲道間幅度差在參考聲道1和其它聲道之間來(lái)確定。例如當(dāng)中聲道被確定為參考聲道時(shí),將計(jì)算出左聲道和中聲道之間的第一聲道間幅度差、右聲道和中聲道之間的第二聲道間幅度差、左環(huán)繞聲道和中聲道之間的第三聲道間幅度差以及右環(huán)繞聲道和中聲道之間的第四聲道間幅度差。這一情況描述了五聲道的配置方案。當(dāng)五聲道配置方案另外包括一低頻加強(qiáng)聲道也就是所熟知的“重低音”聲道時(shí),將計(jì)算出低頻加強(qiáng)聲道和中聲道也就是唯一的參考聲道之間的第五聲道間幅度差。當(dāng)使用一個(gè)縮混聲道也即被稱(chēng)為“單聲道”的聲道,以及使用傳輸提示如ICLD (聲道間幅度差)、ICTD(聲道間時(shí)間差)和ICC(聲道間相干)來(lái)重建原始多聲道時(shí),通過(guò)使用這些提示來(lái)修改單聲道信號(hào)的頻譜系數(shù)。通過(guò)使用用來(lái)為每個(gè)頻譜系數(shù)確定幅度修正的正實(shí)數(shù)來(lái)完成幅度修正。通過(guò)使用用來(lái)為每個(gè)頻譜系數(shù)確定相位修正的復(fù)數(shù)數(shù)值來(lái)生成聲道間時(shí)間差。另一函數(shù)確定了相干度影響。每個(gè)聲道用于幅度修正的因子通過(guò)首先計(jì)算參考聲道的因子來(lái)算出。參考聲道因子的計(jì)算使得對(duì)每個(gè)頻率部分,所有聲道的功率之和等于信號(hào)和的功率。然后,根據(jù)參考聲道的幅度修正因子,其他聲道的幅度修正因子可以用相應(yīng)的ICLD參數(shù)計(jì)算出來(lái)。于是,為了完成BCC合成,要計(jì)算出參考聲道的幅度修正因子。對(duì)于該計(jì)算,一頻帶的所有ICLD參數(shù)都是必需的。然后,根據(jù)該單個(gè)聲道的幅度修正,將計(jì)算出其它聲道也就是非參考聲道的幅度修正因子。這種方法的缺點(diǎn)在于,為了完全重建,需要每一個(gè)聲道間幅度差。當(dāng)存在易出錯(cuò)的傳輸信道時(shí),這個(gè)要求就更成問(wèn)題了。傳輸?shù)穆暤篱g幅度差中的每一個(gè)錯(cuò)誤將導(dǎo)致重建的多聲道信號(hào)的錯(cuò)誤,因?yàn)樾枰總€(gè)聲道間幅度差來(lái)計(jì)算多聲道輸出信號(hào)的每個(gè)聲道。此外, 當(dāng)一個(gè)聲道間幅度差在傳輸中丟失,重建就是不可能的,盡管這個(gè)聲道間幅度差僅僅對(duì)例如左環(huán)繞聲道或右環(huán)繞聲道是必需的,而左環(huán)繞或右環(huán)繞聲道對(duì)多聲道重建并不太重要, 因?yàn)槎鄶?shù)信息包含在了左前置聲道即后來(lái)被稱(chēng)作的左聲道、右前置聲道即后來(lái)被稱(chēng)作的右聲道或中聲道中。當(dāng)?shù)皖l加強(qiáng)聲道的聲道間幅度差在傳輸中丟失,這種情形變得甚至更糟。 在這種情況下,沒(méi)有或者僅有錯(cuò)誤的多聲道重建是可能的,盡管低頻加強(qiáng)聲道對(duì)聽(tīng)眾的聽(tīng)覺(jué)舒適度不太具有決定性。所以,單個(gè)的聲道間幅度差中的錯(cuò)誤蔓延成每個(gè)重建輸出聲道中的錯(cuò)誤。此外,現(xiàn)有的BCC方案,即在AES會(huì)議文章5574,〃Binaural Cue Coding applied to Stereo and Multi-channel Audio Compression" ,C. Faller,F. Baumgarte,May 10 to 13,2002,Munich, Germany中描述的方案,當(dāng)考慮直覺(jué)聆聽(tīng)場(chǎng)景時(shí),因?yàn)閮H有的一個(gè)參考聲道,是不太適宜的。將每個(gè)事物都聯(lián)系到單一的參考聲道對(duì)人類(lèi)來(lái)說(shuō)是不自然的,當(dāng)然,這是整個(gè)音頻處理的最終目標(biāo)。不同的是,人有兩只耳朵,位于頭部不同的兩側(cè)。所以,人的自然聽(tīng)覺(jué)印象是,信號(hào)是否更向左或者更向右平衡,或者在前后之間平衡。與其相反的是, 讓人感覺(jué)音場(chǎng)中某聲源在各個(gè)揚(yáng)聲器相對(duì)于單個(gè)參考揚(yáng)聲器之間是否處于某種平衡,這是不自然的。當(dāng)考慮比特率要求、可擴(kuò)展性要求、靈活性要求、重建人工信號(hào)要求或者錯(cuò)誤魯棒性要求時(shí),這種一方面是自然聽(tīng)覺(jué)印象而另一方面是BCC的數(shù)學(xué)/物理模型之間的分歧可能導(dǎo)致編碼方案的負(fù)面結(jié)果。
發(fā)明內(nèi)容
本發(fā)明的目的是提供表示多聲道音頻信號(hào)的改進(jìn)思想。這個(gè)目的通過(guò)根據(jù)權(quán)利要求1所述的用于產(chǎn)生多聲道輸入信號(hào)的參數(shù)表示的設(shè)備、根據(jù)權(quán)利要求21所述的用于產(chǎn)生重建的多聲道表示的設(shè)備、權(quán)利要求31或32所述的方法、根據(jù)權(quán)利要求33所述的計(jì)算機(jī)程序或者根據(jù)權(quán)利要求34所述的參數(shù)表示來(lái)實(shí)現(xiàn)。本發(fā)明基于如下的發(fā)現(xiàn),即對(duì)于多聲道表示,必須依靠聲道對(duì)之間的平衡參數(shù)。而且,還發(fā)現(xiàn)通過(guò)提供至少兩個(gè)不同的平衡參數(shù),即表示兩個(gè)不同聲道對(duì)之間平衡的參數(shù),多聲道信號(hào)的參數(shù)表示是可能實(shí)現(xiàn)的。具體地,靈活性、可擴(kuò)展性、錯(cuò)誤魯棒性以至比特率效率都是如下事實(shí)的結(jié)果,即作為第一平衡參數(shù)基礎(chǔ)的第一聲道對(duì)和作為第二平衡參數(shù)基礎(chǔ)的第二聲道對(duì)是不同的,其中,形成這些聲道對(duì)的四個(gè)聲道互不相同。所以,本發(fā)明的思想和單一的參考聲道的思想不同,而是采用了多平衡或者超平衡的思想,這種思想對(duì)人的聽(tīng)覺(jué)感受來(lái)說(shuō)更直觀、更自然。具體地,作為第一和第二平衡參數(shù)基礎(chǔ)的聲道對(duì)可以包含原始聲道、縮混聲道,或者優(yōu)選的,輸入聲道間的特定組合。已經(jīng)發(fā)現(xiàn),從作為聲道對(duì)第一聲道的中聲道以及作為聲道對(duì)第二聲道的原始左聲道和原始右聲道之和得出的平衡參數(shù),對(duì)于在中聲道、左聲道和右聲道之間提供準(zhǔn)確的能量分布特別有用。還要在上下文中注意的是,這三個(gè)聲道一般涵蓋了聲音情景的大部分信息,其中特別是左右立體聲定位不僅僅受到左右之間平衡的影響,還受到中聲道與左右聲道之和之間平衡的影響。這個(gè)發(fā)現(xiàn)通過(guò)使用基于本發(fā)明優(yōu)選實(shí)施例的該平衡參數(shù)來(lái)反映。優(yōu)選地,當(dāng)傳輸一個(gè)單聲道縮混信號(hào)時(shí),還發(fā)現(xiàn),除了中/左加右平衡參數(shù)之外, 左/右平衡參數(shù)、后左/后右平衡參數(shù)以及前/后平衡參數(shù)是具有高效比特率參數(shù)表示的最佳解決方案,這種參數(shù)表示靈活,抗錯(cuò)能力好,并且具有相當(dāng)?shù)谋U娑取T诮邮諜C(jī)側(cè),和BCC合成中僅通過(guò)傳輸?shù)男畔?lái)計(jì)算每個(gè)聲道不同,本發(fā)明的多平衡表示利用關(guān)于用來(lái)產(chǎn)生縮混聲道的縮混方案的信息。于是,根據(jù)本發(fā)明,除了平衡參數(shù),在現(xiàn)有技術(shù)系統(tǒng)中并不使用的縮混方案信息,也在上混(up-mix)中使用。因此執(zhí)行上混操作,使得重建多聲道信號(hào)內(nèi)形成平衡參數(shù)所依賴(lài)的聲道對(duì)的聲道之間的平衡由該平衡參數(shù)決定。這種思想,也就是對(duì)不同的平衡參數(shù)形成不同的聲道對(duì),使得在對(duì)每個(gè)傳輸?shù)钠胶鈪?shù)不知曉得情況下可以獲得一些聲道。具體地,根據(jù)本發(fā)明,在不知曉任何后左/后右平衡或前/后平衡的情況下,仍可以對(duì)左、右和中聲道進(jìn)行重建。這種效果為非常細(xì)微調(diào)節(jié)的可擴(kuò)展性提供了可能,因?yàn)閺谋忍亓髦刑崛「郊訁?shù)或者傳輸附加平衡參數(shù)到接收機(jī), 都將允許重建一個(gè)或多個(gè)附加聲道。這和現(xiàn)有技術(shù)的單一參考系統(tǒng)不同,在現(xiàn)有技術(shù)的單一參考系統(tǒng)中,需要每個(gè)聲道間幅度差來(lái)重建所有重建輸出聲道中的全部或者一組聲道。
本發(fā)明的思想也是有靈活性的,其中平衡參數(shù)的選擇可適應(yīng)特定的重建環(huán)境。例如,當(dāng)五聲道配置結(jié)構(gòu)形成原始的多聲道信號(hào)結(jié)構(gòu)時(shí),且當(dāng)四聲道結(jié)構(gòu)形成重建多聲道結(jié)構(gòu)時(shí),其中該結(jié)構(gòu)只有一個(gè)環(huán)繞揚(yáng)聲器,例如該揚(yáng)聲器位于聽(tīng)者之后,前后平衡參數(shù)在對(duì)左環(huán)繞聲道和右環(huán)繞聲道不知曉的情況下為計(jì)算組合環(huán)繞聲道提供可能。這和單一參考聲道系統(tǒng)不同,單一參考聲道系統(tǒng)中必須從數(shù)據(jù)流中提取左環(huán)繞聲道的聲道間幅度差及右環(huán)繞聲道的聲道間幅度差。然后,必須計(jì)算出左環(huán)繞聲道和右環(huán)繞聲道。最后,必須將兩聲道疊加來(lái)獲得四聲道重現(xiàn)結(jié)構(gòu)的一個(gè)環(huán)繞揚(yáng)聲器聲道。在更具直覺(jué)感知的和更具有聽(tīng)者導(dǎo)向的平衡參數(shù)表示中上述所有步驟都不是必須執(zhí)行的,因?yàn)檫@種表示由于平衡參數(shù)表示自動(dòng)產(chǎn)生出組合環(huán)繞聲道,這種表示不是和單一的參考聲道關(guān)聯(lián),而是允許將原始聲道的組合作為平衡參數(shù)聲道對(duì)的聲道。本發(fā)明涉及音頻信號(hào)的參數(shù)化多聲道表示的問(wèn)題。提供了一種高效率的方式來(lái)為多聲道表示定義合適的參數(shù),且提供了一種不需要對(duì)所有聲道進(jìn)行解碼就能提取出用于表示想要聲道的參數(shù)的能力。本發(fā)明進(jìn)一步解決了為給定信號(hào)段選擇最佳參數(shù)配置使得對(duì)給定信號(hào)段的空間參數(shù)進(jìn)行編碼所需的比特率最小化的問(wèn)題。本發(fā)明還概述了如何應(yīng)用之前僅對(duì)一般多聲道環(huán)境的兩個(gè)聲道情況才適用的解相關(guān)方法。在優(yōu)選實(shí)施例中,本發(fā)明有以下特征-在編碼器一側(cè)將多聲道信號(hào)縮混到單聲道或雙聲道表示;-在給定多聲道信號(hào)的條件下,定義表示多聲道信號(hào)的參數(shù),或者靈活的以每幀為基礎(chǔ)以最小化比特率,或者使得解碼器能在比特流層上提取出聲道配置;-在解碼器一側(cè),給定解碼器當(dāng)前所支持的聲道配置,提取相關(guān)的參數(shù)集;-給定當(dāng)前的聲道配置,生成所需數(shù)量的互相解相關(guān)的信號(hào);-給定從比特流數(shù)據(jù)中解碼得到的參數(shù)集以及解相關(guān)的信號(hào),再現(xiàn)輸出信號(hào)。-多聲道音頻信號(hào)參數(shù)化的定義,使得相同的參數(shù)或者參數(shù)的子集的使用和聲道配置無(wú)關(guān)。-多聲道音頻信號(hào)參數(shù)化的定義,使得參數(shù)可在可擴(kuò)展編碼方案中應(yīng)用,其中參數(shù)集的子集在可擴(kuò)展數(shù)據(jù)流的不同層中傳輸。-多聲道音頻信號(hào)參數(shù)化的定義,使得解碼器輸出信號(hào)的能量重建,不會(huì)被用來(lái)對(duì)縮混信號(hào)進(jìn)行編碼的底層音頻編解碼器所破壞。-不同多聲道音頻信號(hào)參數(shù)化之間的切換,使得用來(lái)對(duì)參數(shù)化進(jìn)行編碼的比特率開(kāi)銷(xiāo)最小化。-多聲道音頻信號(hào)參數(shù)化的定義,其中包含表示縮混信號(hào)的能量修正因子的參數(shù)。-使用若干互相解相關(guān)的解相關(guān)器來(lái)重現(xiàn)多聲道信號(hào)。-根據(jù)基于所傳輸?shù)膮?shù)集而計(jì)算出的上混矩陣H,重現(xiàn)多聲道信號(hào)。
本發(fā)明將參考附圖通過(guò)說(shuō)明性的例子來(lái)描述,當(dāng)然發(fā)明的范圍或精神不限于此, 附圖中圖1圖示了本發(fā)明中的用于5. 1聲道配置的術(shù)語(yǔ);圖2圖示了本發(fā)明的可能的編碼器實(shí)現(xiàn);
圖3圖示了本發(fā)明的可能的解碼器實(shí)現(xiàn);圖4圖示了本發(fā)明的一優(yōu)選多聲道信號(hào)參數(shù)化方案;圖5圖示了本發(fā)明的一優(yōu)選多聲道信號(hào)參數(shù)化方案;圖6圖示了本發(fā)明的一優(yōu)選多聲道信號(hào)參數(shù)化方案;圖7圖示了產(chǎn)生一個(gè)基本聲道或兩個(gè)基本聲道的縮混方案的示意性結(jié)構(gòu);圖8圖示了基于本發(fā)明的平衡參數(shù)和關(guān)于縮混方案的信息的上混方案的示意性結(jié)構(gòu);圖9a圖示了編碼器一側(cè)幅度參數(shù)的確定;圖9b圖示了解碼器一側(cè)幅度參數(shù)的使用;圖IOa圖示了在比特流的不同層擁有多聲道參數(shù)化的不同部分的可擴(kuò)展比特流;圖IOb圖示了可擴(kuò)展性表格,指示用哪些平衡參數(shù)能構(gòu)建哪些聲道,而哪些平衡參數(shù)和聲道是不使用的或不計(jì)算的;以及圖11圖示了基于本發(fā)明的上混矩陣的應(yīng)用。
具體實(shí)施例方式下述的實(shí)施例僅僅是為了闡述本發(fā)明關(guān)于音頻信號(hào)多聲道表示的原理。將認(rèn)識(shí)到,對(duì)此處描述的布置和細(xì)節(jié)的修改和變更對(duì)于本領(lǐng)域其他技術(shù)人員來(lái)說(shuō)是顯而易見(jiàn)的。 因此,目的僅僅是將其受限于即將作出的權(quán)利要求的范圍,而不受限于此處描述的詳細(xì)細(xì)節(jié)和對(duì)實(shí)施例的闡釋。在如下對(duì)本發(fā)明的描述中,概述了如何參數(shù)化IID和ICC參數(shù),以及如何使用它們來(lái)重現(xiàn)音頻信號(hào)的多聲道表示,其中假設(shè)所有涉及的信號(hào)是濾波器組中的子帶信號(hào),或者是相應(yīng)聲道的全部頻率范圍中一部分的某些其他頻率選擇性表示。所以認(rèn)識(shí)到,本發(fā)明不限于特定的濾波器組,且本發(fā)明在下文中對(duì)信號(hào)的子帶表示的一個(gè)頻帶進(jìn)行了概述,并且相同的操作適用于所有的子帶信號(hào)。盡管平衡參數(shù)被稱(chēng)作“聲道間強(qiáng)度差(IID) ”參數(shù),要強(qiáng)調(diào)的是,聲道對(duì)之間的平衡參數(shù)并不必須是聲道對(duì)中第一聲道的能量或強(qiáng)度與聲道對(duì)中第二聲道的能量或強(qiáng)度之間的比率。一般,平衡參數(shù)表示聲源在聲道對(duì)的兩個(gè)聲道之間的定位。盡管該定位通常由能量/幅度/強(qiáng)度差給出,也可以使用信號(hào)的其他特性,如兩個(gè)聲道的功率量度或者聲道的時(shí)間或頻率包絡(luò)等。圖1中可見(jiàn)用于5. 1聲道配置的不同聲道,其中a(t)101表示左環(huán)繞聲道, b (t) 102表示左前置聲道,c (t) 103中聲道,d (t) 104表示右前置聲道,e (t) 105表示右環(huán)繞聲道,以及f(t) 106表示LFE (低頻聲效)聲道。假設(shè)定義期望算符為
權(quán)利要求
1.一種用于產(chǎn)生具有多個(gè)原始聲道的多聲道信號(hào)的參數(shù)表示中的幅度參數(shù)的設(shè)備,所述參數(shù)表示包括參數(shù)集,所述參數(shù)集當(dāng)與至少一個(gè)縮混聲道一起使用時(shí)實(shí)現(xiàn)多聲道重建, 所述設(shè)備包括幅度參數(shù)計(jì)算器(900),用于計(jì)算幅度參數(shù)(rM),所述幅度參數(shù)是主縮混和參數(shù)表示所基于的參數(shù)縮混之間的能量比,其中,所述幅度參數(shù)和所述參數(shù)集或者所述幅度參數(shù)和所述至少一個(gè)縮混聲道能夠傳輸至接收機(jī)。
2.一種用于使用具有參數(shù)集的參數(shù)表示,產(chǎn)生具有至少三個(gè)原始聲道的原始多聲道信號(hào)的重建多聲道表示的設(shè)備,所述參數(shù)集當(dāng)與至少一個(gè)縮混聲道一起使用時(shí)實(shí)現(xiàn)多聲道重建,所述參數(shù)表示包括幅度參數(shù),所述幅度參數(shù)是主縮混和參數(shù)表示所基于的參數(shù)縮混之間的能量比,所述設(shè)備包括幅度修正器(902),用于通過(guò)使用幅度參數(shù)來(lái)對(duì)所述至少一個(gè)縮混聲道進(jìn)行加權(quán),來(lái)使用幅度參數(shù)對(duì)所述至少一個(gè)縮混聲道應(yīng)用幅度修正。
3.一種用于產(chǎn)生具有多個(gè)原始聲道的多聲道信號(hào)的參數(shù)表示中的幅度參數(shù)的方法,所述參數(shù)表示包括參數(shù)集,所述參數(shù)集當(dāng)與至少一個(gè)縮混聲道一起使用時(shí)實(shí)現(xiàn)多聲道重建, 所述方法包括計(jì)算(900)幅度參數(shù)(rM),所述幅度參數(shù)是主縮混和參數(shù)表示所基于的參數(shù)縮混之間的能量比;以及生成包括所述幅度參數(shù)和所述參數(shù)集或者包括所述幅度參數(shù)和所述至少一個(gè)縮混聲道的輸出數(shù)據(jù)。
4.一種用于使用具有參數(shù)集的參數(shù)表示,產(chǎn)生具有至少三個(gè)原始聲道的原始多聲道信號(hào)的重建多聲道表示的方法,所述參數(shù)集當(dāng)與至少一個(gè)縮混聲道一起使用時(shí)實(shí)現(xiàn)多聲道重建,所述參數(shù)表示包括幅度參數(shù),所述幅度參數(shù)是主縮混和參數(shù)表示所基于的參數(shù)縮混之間的能量比,所述方法包括通過(guò)使用幅度參數(shù)來(lái)對(duì)所述至少一個(gè)縮混聲道進(jìn)行加權(quán),來(lái)使用幅度參數(shù)對(duì)所述至少一個(gè)縮混聲道應(yīng)用(90 幅度修正,從而獲得了通過(guò)使用參數(shù)集中的參數(shù)進(jìn)行上混而得到的修正多聲道重建。
全文摘要
含至少三個(gè)原始聲道的多聲道輸入信號(hào)采用多聲道信號(hào)的參數(shù)表示方式進(jìn)行表示。計(jì)算出第一聲道對(duì)之間的第一平衡參數(shù)(r1)、第一相干參數(shù)或者第一聲道間時(shí)間差和第二聲道對(duì)之間的第二平衡參數(shù)(r2)、或第二相干參數(shù)或者第二聲道間時(shí)間差參數(shù)。這組參數(shù)就是原始信號(hào)的參數(shù)表示。第一聲道對(duì)(102,104)有兩個(gè)聲道,它們不同于第二聲道對(duì)(102,104,103)中的兩個(gè)聲道。此外,兩個(gè)聲道對(duì)中的每個(gè)聲道都是原始聲道之一、或者原始聲道的加權(quán)組合,并且第一聲道對(duì)和第二聲道對(duì)包含關(guān)于三個(gè)原始聲道的信息。為了多聲道重建的目的,以可擴(kuò)展方式運(yùn)用參數(shù)并結(jié)合縮混信息來(lái)產(chǎn)生數(shù)目可選的輸出聲道。
文檔編號(hào)G10L19/14GK102157155SQ201110097029
公開(kāi)日2011年8月17日 申請(qǐng)日期2005年4月12日 優(yōu)先權(quán)日2004年4月16日
發(fā)明者克里斯托弗·薛林, 拉爾斯·維爾默斯, ??啤て展? 約納斯·勒登, 約納斯·恩德加 申請(qǐng)人:科丁技術(shù)公司