專利名稱:音頻編碼器、音頻解碼器及利用復(fù)預(yù)測處理多信道音頻信號的相關(guān)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻處理,且具體地,涉及具有兩個以上信道信號的多信道信號的多
信道音頻處理。
背景技術(shù):
已知在多信道或立體聲處理領(lǐng)域中應(yīng)用所謂的中/側(cè)(mid/side)立體聲編碼。在此概念中,形成了左或第一音頻信道信號與右或第二音頻信道信號的合成,以獲得中間或單信號M。此外,形成了左或第一信道信號與右或第二信道信號之間的差,以獲得側(cè)信號
S。當(dāng)左信號與右信號彼此非常相似時,由于側(cè)信號將變得非常小,所以該中/側(cè)編碼方法導(dǎo)致了顯著的編碼增益。通常,當(dāng)要量化/熵編碼的值的范圍變得更小時,量化器/熵編碼器級的編碼增益將變得更高。因此,對于PCM或基于霍夫曼或算術(shù)熵編碼器,當(dāng)側(cè)信號變得更小時,編碼增益增大。然而,存在中/側(cè)編碼將不會導(dǎo)致編碼增益的特定情況。該情況可能在兩個信道中的信號彼此例如相移90°時發(fā)生。則中信號和側(cè)信號可處于非常相似的范圍內(nèi),且因此,利用熵編碼器來編碼中信號和側(cè)信號將不會產(chǎn)生編碼增益且甚至可能產(chǎn)生增大的位率。因此,例如在側(cè)信號未相對于原始左信號變小到特定程度的情況下,可應(yīng)用頻率選擇性的中/側(cè)編碼以停用頻帶中的中/側(cè)編碼。盡管當(dāng)左右信號相同時側(cè)信號將變?yōu)榱悖捎趥?cè)信號消除而產(chǎn)生了最大編碼增益,當(dāng)中信號與側(cè)信號關(guān)于波形形狀相同時,情況再次變得不同,但兩個信號之間唯一不同是它們的總振幅。在該情況下,當(dāng)另外假定側(cè)信號與中信號無相移時,側(cè)信號顯著增大,盡管另一方面,中信號相對于其值的范圍不會減少那么多。當(dāng)該情況發(fā)生在特定頻帶中時,則由于缺少編碼增益而將再次停用中/側(cè)編碼。中/側(cè)編碼可被頻率選擇性地應(yīng)用或可替代性地應(yīng)用在時域中。存在不依賴于與中/側(cè)編碼相同的波形方法類型而依賴于基于特定雙耳線索的參數(shù)處理的替代性多信道編碼技術(shù)。該技術(shù)被冠名為術(shù)語“雙耳線索編碼”、“參數(shù)立體聲編碼”或“MPEG環(huán)繞編碼”。這里,特定線索針對多個頻帶而計算。這些線索包括內(nèi)信道量級差、內(nèi)信道相干性測量、內(nèi)信道時間差和/或內(nèi)信道相差。這些方法從假定由聽眾感受到的多信道印象不必依賴于兩個信道的精細(xì)波形而是依賴于準(zhǔn)確的頻率選擇性提供的線索或內(nèi)信道信息開始。這意味著,在渲染機(jī)中,必須關(guān)注渲染準(zhǔn)確反映線索的多信道信號,但波形不具決定性意義。該方法可能在解碼器必須應(yīng)用解相關(guān)處理以人工產(chǎn)生彼此解相關(guān)的立體聲信號的情況下尤其復(fù)雜,盡管所有這些信道均源自一個和相同的下混信道。根據(jù)它們的實施,為此目的的解相關(guān)器復(fù)雜且可能引入偽差,尤其在瞬時信號部分的情況下。此外,相比波形編碼,參數(shù)編碼方法是有損編碼方法,其不可避免地導(dǎo)致由典型量化引入的以及通過關(guān)注雙耳線索而非具體波形而引入的信息損失。該方法產(chǎn)生非常低的位率,但可能包括質(zhì)量折衷。存在對圖7a所示的統(tǒng)一語音和音頻編碼(USAC)的新發(fā)展。核心解碼器700在輸入端701處執(zhí)行編碼立體聲信號的解碼操作,該編碼立體聲信號可以是中/側(cè)編碼的。核心解碼器在線702上輸出中信號且在線703上輸出側(cè)或剩余(residual,余差)信號。兩個信號由QMF濾波器組704和705轉(zhuǎn)換到QMF域中。隨后,應(yīng)用MPEG環(huán)繞解碼器706來生成左信道信號707和右信道信號708。這些低頻帶信號隨后被引入頻帶復(fù)制(SBR)解碼器709中,解碼器709在線710和711上生成寬帶左信號和右信號,寬帶左信號和右信號隨后由QMF合成濾波器組712、713轉(zhuǎn)換到時域中,從而獲得寬帶左右信號L、R0圖7b示出了 MPEG環(huán)繞解碼器706將執(zhí)行中/側(cè)解碼的情況??商娲?,MPEG環(huán)繞解碼器塊706可執(zhí)行基于雙耳線索的參數(shù)解碼以由單個單核解碼器信號生成立體聲信號。自然,MPEG環(huán)繞解碼器706也可使用諸如內(nèi)信道量級差、內(nèi)信道相干性測量或其他這種內(nèi)信道信息參數(shù)的參數(shù)信息來生成多個低頻帶輸出信號,該多個低頻帶輸出信號將被輸入到SBR解碼器塊709中。當(dāng)MPEG環(huán)繞解碼器塊706執(zhí)行圖7b所示中/側(cè)解碼時,可應(yīng)用實際增益因子g,且DMX/RES和L/R分別為在復(fù)混合QMF域中給出的下混/剩余和左/右信號。使用塊706與塊709的結(jié)合僅使計算復(fù)雜度相比用作基礎(chǔ)的立體聲解碼器小幅增力口,因為信號的復(fù)QMF表示已可用作SBR解碼器的一部分。然而,在非SBR配置中,由于該實例性64頻帶分析組和64頻帶合成組中將需要的必要QMF組,如USAC背景下提出的基于QMF的立體聲編碼將導(dǎo)致計算復(fù)雜度顯著增加。僅為立體聲編碼的目的,必須添加這些濾波器組。然而,在正處于開發(fā)中的MPEG USAC系統(tǒng)中,通常在未使用SBR時,也存在高位率的編碼模式。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種改善后的音頻處理概念,其一方面產(chǎn)生高編碼增益,且另一方面,產(chǎn)生良好音頻質(zhì)量和/或減小的運(yùn)算復(fù)雜度。該目的由根據(jù)權(quán)利要求1所述的音頻解碼器、根據(jù)權(quán)利要求15所述的音頻編碼器、根據(jù)權(quán)利要求21所述的音頻解碼方法、根據(jù)權(quán)利要求22所述的音頻編碼方法、根據(jù)權(quán)利要求23所述的計算機(jī)程序或根據(jù)權(quán)利要求24所述的編碼后的多信道音頻信號來實現(xiàn)。本發(fā)明依賴于高質(zhì)量波形編碼方法的編碼增益可通過利用第一合成信號預(yù)測第二合成信號來顯著增強(qiáng)的研究成果,其中,利用合成規(guī)則(諸如中/側(cè)合成規(guī)則),這兩個合成信號均源自于原始信道信號。已發(fā)現(xiàn)該預(yù)測信息由音頻編碼器中的預(yù)測器來計算,從而滿足最優(yōu)化目標(biāo),僅產(chǎn)生很小開銷,但卻在不損失任何音頻質(zhì)量的情況下使得側(cè)信號所需的位率顯著減小,因為本發(fā)明的預(yù)測終究是基于波形的編碼而非基于參數(shù)的立體聲或多信道編碼方法。為減小計算復(fù)雜性,優(yōu)選執(zhí)行頻域編碼,其中,預(yù)測信息以頻帶選擇方式源自于頻域輸入數(shù)據(jù)。用于將時域表示轉(zhuǎn)換成頻譜表示的轉(zhuǎn)換算法優(yōu)選是臨界采樣過程(critically sampled process)(諸如修改后的離散余弦轉(zhuǎn)換(MDCT)或修改后的離散正弦轉(zhuǎn)換(MDST)),其與復(fù)轉(zhuǎn)換的不同之處在于僅計算實值或僅計算虛值,而在復(fù)轉(zhuǎn)換中,計算頻譜的實值和復(fù)值,產(chǎn)生2倍過采樣。優(yōu)選地,使用基于混疊(aliasing)引入和消除的轉(zhuǎn)換。具體地,MDCT即是這種轉(zhuǎn)換且允許在隨后的塊之間交叉淡入淡出而沒有任何開銷,這是由于由解碼器側(cè)的交疊-相加處理獲得的已知時域混疊消除(TDAC)特性所致。優(yōu)選地,在編碼器中計算、發(fā)送至解碼器以及在解碼器中使用的預(yù)測信息包括虛部,該虛部可有利地反映在0°與360°之間任意選擇的量的兩音頻信道之間的相位差。當(dāng)僅實值轉(zhuǎn)換或者一般地,僅提供實部頻譜或僅提供虛部頻譜的轉(zhuǎn)換被應(yīng)用時,計算復(fù)雜性顯著降低。為利用指示左信號的特定頻帶與右信號的相應(yīng)頻帶之間的相移的這一虛預(yù)測信息,實部-虛部轉(zhuǎn)換器或者取決于轉(zhuǎn)換實施、虛部-實部轉(zhuǎn)換器在解碼器中被提供以由第一合成信號來計算相對于原始合成信號相位旋轉(zhuǎn)的預(yù)測剩余信號。該相位旋轉(zhuǎn)預(yù)測剩余信號可隨后與在位流中傳送的預(yù)測剩余信號合成以重新產(chǎn)生側(cè)信號,該側(cè)信號最終可與中信號合成以獲得特定頻帶中的解碼左信道和該頻帶中的解碼右信道。為提高音頻質(zhì)量,當(dāng)預(yù)測剩余信號在編碼器中計算時,應(yīng)用于解碼器側(cè)的相同的實部-虛部或虛部-實部轉(zhuǎn)換器也在編碼器側(cè)實施。本發(fā)明的優(yōu)勢在于其提供了相比具有相同位率或具有相同音頻質(zhì)量的系統(tǒng)的改善后的音頻質(zhì)量和降低的位率。此外,在通常未使用SBR的情況下,獲得了有關(guān)在高位速率下的MPEG USAC系統(tǒng)中有用的統(tǒng)一立體聲編碼的計算效率的優(yōu)勢。這些方法在基本的立體聲轉(zhuǎn)換編碼器的本地MDCT域中實施基于剩余的預(yù)測立體聲編碼,而不是處理復(fù)混合QMF域中的信號。根據(jù)本發(fā)明的一個方面,本發(fā)明包括用于由MDCT域中的復(fù)預(yù)測生成立體聲信號的設(shè)備或方法,其中,復(fù)預(yù)測利用實數(shù)-復(fù)數(shù)轉(zhuǎn)換在MDCT域中完成,其中,該立體聲信號可以是編碼器側(cè)的編碼立體聲信號,或者可替代地,當(dāng)用于生成立體聲信號的設(shè)備或方法被應(yīng)用于解碼器側(cè)時可以是解碼/發(fā)送立體聲信號。
隨后參照附圖來討論本發(fā)明的優(yōu)選實施方式,其中:圖1是音頻解碼器的優(yōu)選實施方式的示意圖;圖2是音頻編碼器的優(yōu)選實施方式的框圖;圖3a示出了圖2的編碼器計算器的實施;圖3b示出了圖2的編碼器計算器的替代性實施;圖3c示出了應(yīng)用于編碼器側(cè)的中/側(cè)合成規(guī)則;圖4a示出了圖1的解碼器計算器的實施;圖4b示出了矩陣計算器形式的解碼器計算器的替代性實施;圖4c示出了對應(yīng)于圖3c所示的合成規(guī)則的中/側(cè)逆合成規(guī)則;圖5a示出了在優(yōu)選為實值頻域的頻域中工作的音頻編碼器的實施方式;圖5b示出了在頻域中工作的音頻解碼器的實施;圖6a示出了在MDCT域中工作并利用實部-虛部轉(zhuǎn)換的音頻編碼器的替代性實施;圖6b示出了在MDCT域中工作并利用實部_虛部轉(zhuǎn)換的音頻解碼器;圖7a示出了利用立體聲解碼器和隨后連接的SBR解碼器的音頻后處理器;圖7b示出了中/側(cè)上混矩陣;圖8a示出了圖6a中的MDCT塊的詳細(xì)示圖8b示出了圖6b的MDCr1塊的詳細(xì)示圖;圖9a示出了以相對于MDCT輸出的減小的分辨率運(yùn)行的優(yōu)化器的實施;圖9b示出了計算預(yù)測信息的MDCT頻譜和相應(yīng)的較低分辨率頻帶的表示;圖1Oa示出了圖6a或圖6b中的實部-虛部轉(zhuǎn)換器的實施;以及圖1Ob示出了圖1Oa的虛部頻譜計算器的可行實施。
具體實施例方式圖1示出了用于解碼在輸入線100處獲得的編碼后的多信道音頻信號的音頻解碼器。該編碼后的多信道音頻信號包括利用用于合成表示多信道音頻信號的第一信道信號與第二信道信號的合成規(guī)則生成的編碼后的第一合成信號、編碼后的預(yù)測剩余信號和預(yù)測信息。該編碼后的多信道信號可以是數(shù)據(jù)流,諸如具有三個復(fù)用形式分量的位流。其他側(cè)信息可包括在線100上的編碼后的多信道信號中。該信號被輸入到輸入接口 102中。輸入接口 102可被實施為數(shù)據(jù)流解復(fù)用器,其在線104上輸出編碼后的第一合成信號,在線106上輸出編碼后的剩余信號,以及在線108上輸出預(yù)測信息。優(yōu)選地,該預(yù)測信息是具有不等于零的實部和/或異于零的虛部的因子。編碼后的合成信號和編碼后的剩余信號被輸入到信號解碼器110中來解碼第一合成信號以在線112上獲得解碼后的第一合成信號。此外,信號解碼器110被配置為解碼編碼后的剩余信號以在線114上獲得解碼后的剩余信號。根據(jù)音頻編碼器側(cè)的編碼處理,該信號解碼器可包括熵解碼器(諸如霍夫曼解碼器、算術(shù)解碼器或任何其他熵解碼器),以及用于執(zhí)行與關(guān)聯(lián)音頻編碼器中的量化運(yùn)算相匹配的解量化運(yùn)算的隨后連接的解量化級。線112和114上的信號被輸入到解碼器計算器115中,解碼器計算器115在線117上輸出第一信道信號,以及在線118上輸出第二信道信號,其中,這兩個信號是立體聲信號或多信道音頻信號的兩個信道。例如,當(dāng)多信道音頻信號包括五個信道時,則這兩個信號是來自多信道信號的兩個信道。為完全編碼具有五個信道的這種多信道信號,可應(yīng)用圖1所示的兩個解碼器,其中,第一解碼器處理左信道和右信道,第二解碼器處理左環(huán)繞信道和右環(huán)繞信道,以及第三單信道解碼器將用于執(zhí)行中心信道的單信道編碼。然而,也可應(yīng)用波形編碼器和參數(shù)編碼器的其他分組或組合。概括多于兩個信道的預(yù)測方案的替代性方式將是同時處理三個(或更多個)信號,即利用兩個預(yù)測系數(shù)由第一和第二信號來預(yù)測第三合成信號,非常類似于MPEG環(huán)繞聲中的“二到三”模塊。解碼器計算器116被配置為利用解碼后的剩余信號114、預(yù)測信息108和解碼后的第一合成信號112來計算具有解碼后的第一信道信號117和解碼后的第二信道信號118的解碼后的多信道信號。具體地,解碼器計算器116被配置為以使解碼后的第一信道信號和解碼后的第二信道信號至少為輸入到相應(yīng)編碼器中的多信道信號的第一信道信號和第二信道信號的近似這一方式來工作,當(dāng)生成第一合成信號和預(yù)測剩余信號時,解碼后的第一信道信號和解碼后的第二信道信號由合成規(guī)則來合成。具體地,線108上的預(yù)測信息包括異于零的實值部分和/或異于零的虛部。解碼器計算器116可以不同方式來實施。第一實施在圖4a中示出。該實施包括預(yù)測器1160、合成信號計算器1161和合成器1162。該預(yù)測器接收解碼后的第一合成信號112和預(yù)測信息108,并輸出預(yù)測信號1163。具體地,預(yù)測器1160被配置為向解碼后的第一合成信號112或源自于解碼后的第一合成信號的信號應(yīng)用預(yù)測信息108。用于導(dǎo)出應(yīng)用預(yù)測信息108的該信號的導(dǎo)出規(guī)則可以是實部-虛部轉(zhuǎn)換,或等價地,虛部-實部轉(zhuǎn)換或加權(quán)運(yùn)算,或者根據(jù)實施,相移運(yùn)算或合成的加權(quán)/相移運(yùn)算。預(yù)測信號1163與解碼后的剩余信號一起輸入到合成信號計算器1161中以計算解碼后的第二合成信號1165。信號112和1165均被輸入到合成器1162中,合成器1162合成解碼后的第一合成信號與第二合成信號以分別在輸出線1166和1167上獲得具有解碼后的第一信道信號和解碼后的第二信道信號的解碼后的多信道音頻信號??商娲兀摻獯a器計算器被實施為矩陣計算器1168,該矩陣計算器1168接收解碼后的第一合成信號或信號M、解碼后的剩余信號或信號D以及預(yù)測信息α 108作為輸入。矩陣計算器1168向信號M、D應(yīng)用如1169所示的轉(zhuǎn)換矩陣以獲得輸出信號L、R,其中,L是解碼后的第一信道信號,以及R是解碼后的第二信道信號。圖4b中的符號類似于具有左信道L和右信道R的立體聲符號。該符號已被應(yīng)用以提供更簡單的理解,但對于本領(lǐng)域技術(shù)人員而言,顯然信號L、R可以是具有多于兩個信道信號的多信道信號中的兩個信道信號的任何合成。矩陣運(yùn)算1169將圖4a的塊1160、1161和1162中的運(yùn)算統(tǒng)一成一種“單次”矩陣計算,且向圖4a電路的輸入和從圖4a電路的輸出與向矩陣計算器1168的輸入或從矩陣計算器1168的輸出相同。圖4c示出了關(guān)于由圖4a中的合成器1162應(yīng)用的逆合成規(guī)則的一個實例。具體地,該合成規(guī)則類似于已知的中/側(cè)編碼中的解碼器側(cè)合成規(guī)則,其中,L=M+S,且R=M-S。需要理解,由圖4c中的逆合成規(guī)則使用的信號S是由合成信號計算器計算的信號,即線1163上的預(yù)測信號與線114上的解碼后的剩余信號的合成。需要理解,在該說明書中,線上的信號有時由用于該線的附圖標(biāo)記來命名,或者有時由已屬于該線的附圖標(biāo)記本身來指示。因此,該符號如下:具有特定信號的線指示信號本身。線可以是硬連線實施中的物理線。然而,在計算機(jī)化實施中,物理線并不存在,但由該線表示的信號從一個計算模塊被發(fā)送至另一計算模塊。圖2示出了用于編碼具有兩個以上信道信號的多信道音頻信號200的音頻編碼器,其中,第一信道信號在201處示出且第二信道在202處示出。兩個信號均被輸入到編碼器計算器203中以利用第一信道信號201和第二信道信號202以及預(yù)測信息206來計算第一合成信號204和預(yù)測剩余信號205,使得當(dāng)預(yù)測剩余信號205與源自于第一合成信號204和預(yù)測信息206的預(yù)測信號合成時,產(chǎn)生第二合成信號,其中,利用合成規(guī)則,第一合成信號和第二合成信號均可從第一信道信號201和第二信道信號202獲得。該預(yù)測信息由用于計算預(yù)測信息206的優(yōu)化器207生成,使得預(yù)測剩余信號滿足最優(yōu)化目標(biāo)208。第一合成信號204和剩余信號205被輸入到信號編碼器209中以編碼第一合成信號204來獲得編碼后的第一合成信號210以及編碼剩余信號205來獲得編碼后的剩余信號211。編碼信號210、211兩者均被輸入到輸出接口 212中以合成編碼后的第一合成信號210和編碼后的預(yù)測剩余信號211以及預(yù)測信息206來獲得編碼后的多信道信號213,編碼后的多信道信號213與輸入到圖1所示的音頻解碼器的輸入接口 102中的編碼后的多信道信號100類似。根據(jù)實施,優(yōu)化器207接收第一信道信號201和第二信道信號202,或如由線214和215所不源自于圖3a的合成器2031的第一合成信號214和第二合成信號215,這將后續(xù)討論。優(yōu)選的最優(yōu)化目標(biāo)在圖2中示出,其中,編碼增益被最大化,即盡可能降低位率。在該最優(yōu)化目標(biāo)中,剩余信號D相對于α被最小化。換言之,這意味著預(yù)測信息α被選定為使得I IS- a M| I2最小化。這產(chǎn)生了針對圖2所示α的解。信號S、M以逐塊方式給出,且優(yōu)選為頻域信號,其中,符號I I…I I是指自變量的2-范數(shù),以及其中,〈…〉通常示出點積。當(dāng)?shù)谝恍诺佬盘?01和第二信道信號202被輸入到優(yōu)化器207中時,則該優(yōu)化器將必須應(yīng)用合成規(guī)則,其中,示例性合成規(guī)則在圖3c中示出。然而,當(dāng)?shù)谝缓铣尚盘?14和第二合成信號215被輸入到優(yōu)化器207中時,則優(yōu)化器207本身并不需要實施該合成規(guī)則。其他最優(yōu)化目標(biāo)可與感知質(zhì)量有關(guān)。最優(yōu)化目標(biāo)可以是獲得最大感知質(zhì)量。則該優(yōu)化器將需要來自感知模型的附加信息。最優(yōu)化目標(biāo)的其他實施可與獲得最小的或固定的位率有關(guān)。則優(yōu)化器207將被實施以執(zhí)行量化/熵編碼操作來確定特定α值所需的位率,使得α可被設(shè)定為滿足這些要求,諸如最小位率,或可替代地,固定位率。該最優(yōu)化目標(biāo)的其他實施可與編碼器或解碼器資源的最小利用率有關(guān)。在實施該最優(yōu)化目標(biāo)的情況下,關(guān)于特定最優(yōu)化所需資源的信息將可供優(yōu)化器207使用。此外,這些最優(yōu)化目標(biāo)或其他最優(yōu)化目標(biāo)的合成可用于控制計算預(yù)測信息206的優(yōu)化器207。圖2中的編碼器計算器203可以不同方式來實施,其中,示例性第一實施在圖3a中示出,其中,顯式(explicit)合成規(guī)則在合成器2031中執(zhí)行。替代性示例性實施在圖3b中示出,其中,使用矩陣計算器2039。圖3a中的合成器2031可被實施以執(zhí)行圖3c所示的合成規(guī)則,該合成規(guī)則是示例性已知的中/側(cè)編碼規(guī)則,其中,加權(quán)因子0.5被應(yīng)用于所有分支。然而,根據(jù)實施,可實現(xiàn)其他加權(quán)因子或完全沒有加權(quán)因子。此外,需要注意,只要存在可應(yīng)用于圖4a所示的解碼器合成器1162的相應(yīng)逆合成規(guī)則(解碼器合成器1162應(yīng)用與由編碼器應(yīng)用的合成規(guī)則相反的合成規(guī)則),可應(yīng)用其他合成規(guī)則(諸如其他線性合成規(guī)則或非線性合成規(guī)則)。由于本發(fā)明的預(yù)測,任何可逆預(yù)測規(guī)則均可被使用,因為對波形的影響被該預(yù)測“平衡”,即任何誤差均包括在所發(fā)送的剩余信號中,這是因為由與編碼器計算器203結(jié)合的優(yōu)化器207執(zhí)行的預(yù)測操作是波形保持處理。合成器2031輸出第一合成信號204和第二合成信號2032。該第一合成信號被輸入到預(yù)測器2033中,以及第二合成信號2032被輸入到剩余計算器2034中。預(yù)測器2033計算預(yù)測信號2035,該預(yù)測信 號2035與第二合成信號2032合成以最終獲得剩余信號205。具體地,合成器2031被配置為以兩種不同方式來合成多信道音頻信號的兩個信道信號201和202以獲得第一合成信號204和第二合成信號2032,其中,這兩種不同方式在圖3c的示例性實施方式中示出。預(yù)測器2033被配置為向第一合成信號204或源自于該第一合成信號的信號應(yīng)用預(yù)測信息以獲得預(yù)測信號2035。源自于該合成信號的信號可由任何非線性或線性運(yùn)算來導(dǎo)出,其中,實部-虛部轉(zhuǎn)換/虛部-實部轉(zhuǎn)換是優(yōu)選的,該轉(zhuǎn)換可利用線性濾波器(諸如執(zhí)行特定值的加權(quán)加法的FIR濾波器)來實施。圖3a中的剩余計算器2034可執(zhí)行減法運(yùn)算,使得該預(yù)測信號從第二合成信號中被減去。然而,該剩余計算器中的其他運(yùn)算也是可行的。相應(yīng)地,圖4a中的合成信號計算器1161可執(zhí)行加法運(yùn)算,其中,解碼后的剩余信號114與預(yù)測信號1163相加到一起來獲得第二合成信號1165。圖5a示出了音頻編碼器的優(yōu)選實施。相比圖3a所示的音頻編碼器,第一信道信號201是時域第一信道信號55a的頻譜表示。相應(yīng)地,第二信道信號202是時域信道信號55b的頻譜表示。從時域到頻譜表示的轉(zhuǎn)換由用于第一信道信號的時間/頻率轉(zhuǎn)換器50和用于第二信道信號的時間/頻率轉(zhuǎn)換器51來執(zhí)行。優(yōu)選但非必要地,頻譜轉(zhuǎn)換器50、51被實施為實值轉(zhuǎn)換器。轉(zhuǎn)換算法可以是離散余弦轉(zhuǎn)換、僅使用實部的FFT變換、MDCT或提供實值頻譜值的任何其他轉(zhuǎn)換??商娲?,這兩種轉(zhuǎn)換均可被實施為虛部轉(zhuǎn)換,諸如僅使用虛部而摒棄實部的DST、MDST或FFT。也可使用僅提供虛部的任何其他轉(zhuǎn)換。利用純實值轉(zhuǎn)換或純虛部轉(zhuǎn)換的一個目的在于計算復(fù)雜性,因為對于每一頻譜值而言,僅單一值(諸如幅值或?qū)嵅?必須被處理,或者可替代地,相位或虛部必須被處理。相比之下,對于完全復(fù)轉(zhuǎn)換(諸如FFT),兩個值(即針對每一頻譜線的實部和虛部)將必須被處理,這使計算復(fù)雜性增加至少2的倍數(shù)。這里,利用實值轉(zhuǎn)換的另一原因是該轉(zhuǎn)換通常是臨界采樣的,且因此為信號量化和熵編碼(實施在“MP3”、AAC或類似音頻編碼系統(tǒng)中的標(biāo)準(zhǔn)“感知音頻編碼”范例)提供合適(和常用)的域。圖5a另外示出了作為加法器的剩余計算器2034,其在“加”輸入處接收側(cè)信號并在“減”輸入處接收由預(yù)測器2033輸出的預(yù)測信號。此外,圖5a示出了預(yù)測器控制信息從優(yōu)化器轉(zhuǎn)發(fā)至復(fù)用器212的情況,該復(fù)用器212輸出表示編碼后的多信道音頻信號的復(fù)用位流。具體地,預(yù)測操作以側(cè)信號由中信號預(yù)測這一方式來執(zhí)行,如由圖5a右側(cè)方程所示。優(yōu)選地,預(yù)測器控制信息206是如圖3b右側(cè)所示的因子。在預(yù)測控制信息僅包括實部(諸如復(fù)值α的實部或復(fù)值α的大小,其中,該部分對應(yīng)于異于零的因子)的實施方式中,當(dāng)中信號與側(cè)信號由于其波形結(jié)構(gòu)而彼此類似但具有不同振幅時,可獲得顯著的編碼增益。然而,當(dāng)預(yù)測控制信息僅包括第二部分(該第二部分可以是復(fù)值因子的虛部或復(fù)值因子的相位信息,其中,該虛部或相位信息異于零)時,本發(fā)明對于彼此相移異于0°或180°的值以及除相移之外具有類似波形特性和類似振幅關(guān)系的信號獲得顯著編碼增益。優(yōu)選地,預(yù)測控制信息是復(fù)值的。則可針對振幅不同且相移的信號獲得顯著編碼增益。在時間/頻率轉(zhuǎn)換提供復(fù)頻譜的情況下,運(yùn)算2034將是復(fù)運(yùn)算,其中,該預(yù)測器控制信息的實部被應(yīng)用于復(fù)頻譜M的實部以及該復(fù)預(yù)測信息的虛部被應(yīng)用于復(fù)頻譜的虛部。則在加法器2034中,該預(yù)測操作的結(jié)果是預(yù)測實部頻譜和預(yù)測虛部頻譜,且該預(yù)測實部頻譜將從側(cè)信號S的實部頻譜中被減去(頻帶式),以及該預(yù)測虛部頻譜將從S的頻譜虛部中被減去以獲得復(fù)的剩余頻譜D。時域信號L和R是實值信號,但頻域信號可以是實值或復(fù)值的。當(dāng)頻域信號為實值時,則該轉(zhuǎn)換是實值轉(zhuǎn)換。當(dāng)頻域信號為復(fù)數(shù)時,則該轉(zhuǎn)換是復(fù)值轉(zhuǎn)換。這意味著到時間-頻率轉(zhuǎn)換的輸入和頻率-時間轉(zhuǎn)換的輸出是實值的,而頻域信號可以是例如復(fù)值QMF域信號。圖5b示出了對應(yīng)于圖5a所示的音頻編碼器的音頻解碼器。關(guān)于圖1音頻解碼器的類似元件具有類似附圖標(biāo)記。由圖5a中的位流復(fù)用器212輸出的位流被輸入到圖5b中的位流解復(fù)用器102中。位流解復(fù)用器102將該位流解復(fù)用為下混信號M和剩余信號D。下混信號M被輸入到解量化器IlOa中。剩余信號D被輸入到解量化器IlOb中。此外,位流解復(fù)用器102將來自位流的預(yù)測器控制信息108解復(fù)用并同樣輸入到預(yù)測器1160中。預(yù)測器1160輸出預(yù)測側(cè)信號α.Μ,以及合成器1161合成由解量化器IlOb輸出的剩余信號與預(yù)測側(cè)信號以最終獲得重構(gòu)側(cè)信號S。該信號隨后被輸入到合成器1162中,合成器1162執(zhí)行例如和/差處理,如圖4c中針對中/側(cè)編碼所示。具體地,塊1162執(zhí)行(逆)中/側(cè)解碼以獲得左信道的頻域表示和右信道的頻域表示。該頻域表示隨后由相應(yīng)頻率/時間轉(zhuǎn)換器52和53轉(zhuǎn)換為時域表不。根據(jù)系統(tǒng)的實施,當(dāng)頻域表示是實值表示時,頻率/時間轉(zhuǎn)換器52、53是實值頻率/時間轉(zhuǎn)換器,或者當(dāng)頻域表示是復(fù)值表示時,頻率/時間轉(zhuǎn)換器52、53是復(fù)值頻率/時間轉(zhuǎn)換器。然而,對于提高效率而言,執(zhí)行實值轉(zhuǎn)換是優(yōu)選的,如針對編碼器的圖6a中和針對解碼器的圖6b中的另一實施所示。實值轉(zhuǎn)換50和51由MDCT實施。此外,預(yù)測信息按照具有實部和虛部的復(fù)值來計算。由于兩頻譜M、S均為實值頻譜,且因此由于該頻譜的虛部不存在,所以提供了由信號M的實值頻譜計算估計的虛部頻譜600的實部-虛部轉(zhuǎn)換器2070。該實部-虛部轉(zhuǎn)換器2070是優(yōu)化器207的一部分,且由塊2070估計的虛部頻譜600與實部頻譜M—起被輸入到α優(yōu)化器級2071中以計算預(yù)測信息206,預(yù)測信息206現(xiàn)在具有在2073處所示的實值因子和在2074處所示的虛部因子。現(xiàn)在,根據(jù)該實施方式,第一合成信號M的實值頻譜乘以實部ακ2073以獲得預(yù)測信號,該預(yù)測信號隨后從實值側(cè)頻譜中被減去。此外,虛部頻譜600乘以在2074處所示的虛部Ci1以獲得另一預(yù)測信號,其中,該預(yù)測信號隨后從在2034b處所示的實值側(cè)頻譜中被減去。隨后,預(yù)測剩余信號D在量化器20%中被量化,而M的實值頻譜在塊209a中被量化/編碼。此外,優(yōu)選在量化器/熵編碼器2072中量化和編碼預(yù)測信息α以獲得編碼后的復(fù)α值,該復(fù)α值被轉(zhuǎn)發(fā)至例如圖5a的位流復(fù)用器212,且其最終被輸入到位流中作為預(yù)測信息。關(guān)于針對α的量化/編碼(Q/C)模塊2072的位置,需要注意,乘法器2073和2074優(yōu)選利用恰好相同的(量化)α,α也將在解碼器中使用。因此,我們可直接移動2072到2071的輸出,或者我們可考慮α的量化已在2071的優(yōu)化處理中考慮到。盡管我們可在編碼器側(cè)計算復(fù)頻譜,但由于所有信息均可用,所以優(yōu)選在編碼器的塊2070中執(zhí)行實數(shù)-復(fù)數(shù)轉(zhuǎn)換,從而產(chǎn)生關(guān)于圖6b所示解碼器的類似情況。解碼器接收第一合成信號的實值編碼頻譜和編碼后的剩余信號的實值頻譜表示。此外,編碼后的復(fù)預(yù)測信息在108處獲得,且熵解碼和解量化在塊65中執(zhí)行以獲得1160b處所示的實部α Ε和1160c處所示的虛部α ΙΟ由加權(quán)元件1160b和1160c輸出的中信號被添加到解碼和解量化后的預(yù)測剩余信號中。具體地,在復(fù)預(yù)測因子的虛部被用作加權(quán)因子的情況下,輸入到加權(quán)器1160c中的頻譜值由實部-虛部轉(zhuǎn)換器1160a從實值頻譜M獲得,這優(yōu)選以與有關(guān)編碼器側(cè)的圖6a的塊2070相同的方式來實施。與編碼器側(cè)相比,在解碼器側(cè),中信號或側(cè)信號的復(fù)值表示不可用。原因在于由于位率和復(fù)雜性的原因,僅編碼后的實值頻譜從編碼器被發(fā)送至解碼器。實部-虛部轉(zhuǎn)換器1160a或圖6a的相應(yīng)塊2070可按照在W02004/013839A1或W02008/014853A1或者美國專利第6,980, 933號中公開的來實施??商娲兀绢I(lǐng)域已知的任何其他實施均可被應(yīng)用,且優(yōu)選實施在圖10a、圖1Ob背景下討論。具體地,如圖1Oa所示,實部-虛部轉(zhuǎn)換器1160a包括連接至虛部頻譜計算器1001的頻譜巾貞(frame)選擇器1000。頻譜巾貞選擇器1000在輸入1002處接收當(dāng)前巾貞i的指示,且根據(jù)實施,在控制輸入1003處接收控制信息。例如,當(dāng)線1002上的指示指出要計算關(guān)于當(dāng)前幀i的虛部頻譜時,以及當(dāng)控制信息1003指出僅當(dāng)前幀將被用于計算時,則頻譜幀選擇器1000僅選擇當(dāng)前幀i并將該信息轉(zhuǎn)發(fā)至虛部頻譜計算器。隨后,虛部頻譜計算器僅利用當(dāng)前幀i的頻譜線來針對頻率接近或在當(dāng)前頻譜線k附近執(zhí)行位于當(dāng)前幀中的線的加權(quán)合成(塊1008),虛部線將如圖1Ob中的1004所示來計算。然而,當(dāng)頻譜幀選擇器1000接收指示前一幀i_l和后一幀i+Ι也將用于計算虛部頻譜的控制信息1003時,則該虛部頻譜計算器另外接收來自幀i_l和i+Ι的值,并執(zhí)行關(guān)于幀i_l的1005和關(guān)于幀i+Ι的1006處所示的相應(yīng)幀中的線的加權(quán)合成。加權(quán)運(yùn)算的結(jié)果由塊1007中的加權(quán)合成來合成以最終獲得關(guān)于幀A的虛部線k,該虛部線k隨后乘以元件1160c中的預(yù)測信息的虛部以獲得關(guān)于該線的預(yù)測信號,該預(yù)測信號隨后被添加至關(guān)于解碼器的加法器1161b中的中信號的相應(yīng)線。在編碼器中,執(zhí)行相同操作,但在元件2034b中完成減法。必須指出,控制信息1003可另外指示使用多于兩個周圍幀的幀,或者例如僅利用當(dāng)前幀和恰好一個或多個先前幀而不利用“未來”幀以減少系統(tǒng)性延遲。此外,需要指出,圖1Ob所示的第一操作中來自一個幀的線被合成且隨后來自這些逐幀合成操作的結(jié)果自身合成的逐級加權(quán)合成也可以另一順序來執(zhí)行。另一順序意味著在第一步驟中,關(guān)于來自由控制信息103所示的一些相鄰幀的當(dāng)前頻率k的線由加權(quán)合成來合成。根據(jù)將用于估計虛部線的相鄰線的數(shù)目,該加權(quán)合成針對線k、k-1、k-2、k+Uk+2等來完成。隨后,來自這些“逐個時間”合成的結(jié)果經(jīng)過“頻率方向”中的加權(quán)合成以最終獲得關(guān)于幀A的虛部線k。優(yōu)選地,權(quán)重被設(shè)定為-1與I之間的值,且該權(quán)重可以直接FIR或IIR濾波器合成來實施,該直接FIR或IIR濾波器合成執(zhí)行來自不同頻率和不同幀的頻譜線或頻譜信號的線性合成。如圖6a和圖6b所示,優(yōu)選轉(zhuǎn)換算法為MDCT轉(zhuǎn)換算法,其應(yīng)用于圖6a的元件50和51中的正向且應(yīng)用于元件52、53中的反向,并在頻譜域中運(yùn)行的合成器1162中的合成操作之后。圖8a示出了塊50或51的更詳細(xì)實施。具體地,時域音頻樣本的序列被輸入到分析窗口器500中,分析窗口器500利用分析窗口來執(zhí)行窗口化操作,且具體地,以逐巾貞方式來執(zhí)行該操作,但利用50%的步長(stride)或交疊。該分析窗口器的結(jié)果(即窗口化樣本的幀序列)被輸入到MDCT轉(zhuǎn)換塊501中,MDCT轉(zhuǎn)換塊501輸出實值MDCT幀的序列,其中,這些幀被混疊影響。示例性地,該分析窗口器應(yīng)用具有2048個樣本長度的分析窗口。隨后,MDCT轉(zhuǎn)換塊501輸出具有1024條實部頻譜線或MDCT值的MDCT頻譜。優(yōu)選地,分析窗口器500和/或MDCT轉(zhuǎn)換器501可由窗口長度或轉(zhuǎn)換長度控制502來控制,使得例如對于信號中的瞬時部分,減小窗口長度/轉(zhuǎn)換長度以獲得較好的編碼結(jié)果。圖Sb示出了塊52和53中執(zhí)行的逆MDCT運(yùn)算。示例性地,塊52包括用于執(zhí)行逐幀逆MDCT轉(zhuǎn)換的塊520。例如,當(dāng)MDCT值的幀具有1024個值時,則該MDCT逆轉(zhuǎn)換的輸出具有2048個混疊影響的時間樣本。該幀被提供給合成窗口器521,合成窗口器521對2048個樣本的該巾貞應(yīng)用合成窗口。窗口化巾貞隨后被轉(zhuǎn)發(fā)至交疊/相加處理器522,不例性地,交疊/相加處理器522在兩個連續(xù)幀之間應(yīng)用50%的交疊,且隨后執(zhí)行逐樣本相加,使得2048個樣本的塊最終產(chǎn)生無混疊輸出信號的1024個新樣本。另外,優(yōu)選利用例如在編碼后的多信道信號的側(cè)信息中傳送的信息來應(yīng)用523處所示的窗口 /轉(zhuǎn)換長度控制。α預(yù)測值可針對MDCT頻譜的每條單個頻譜線來計算。然而,已發(fā)現(xiàn)這并不是必需的,且可通過執(zhí)行預(yù)測信息的逐頻帶計算來節(jié)省大量側(cè)信息。換言之,圖9所示頻譜轉(zhuǎn)換器50例如是如圖8a背景下討論的MDCT處理器,其提供具有圖9b中所示的特定頻譜線的高頻分辨率頻譜。該高頻分辨率頻譜被頻譜線選擇器90利用,頻譜線選擇器90提供包括特定頻帶B1、B2、B3、…、BN的低頻分辨率頻譜。該低頻分辨率頻譜被轉(zhuǎn)發(fā)至用于計算預(yù)測信息的優(yōu)化器207,使得預(yù)測信息不針對每一頻譜線來計算,而是僅針對每一頻帶來計算。為此,優(yōu)化器207接收每一頻帶中的頻譜線,并始于相同α值用于頻帶中的所有頻譜線的假設(shè)來計算最優(yōu)化操作。優(yōu)選地,頻帶以心理聲學(xué)方式成形,使得該頻帶的帶寬從低頻增至高頻,如圖9b所示??商娲?,盡管不如增加的帶寬實施那樣優(yōu)選,但也可使用等大小的頻帶,其中,每一頻帶具有至少兩個或通常更多,諸如至少30條頻率線。通常,對于1024條頻譜線的頻譜,少于30個復(fù)α值且優(yōu)選地,多于5個α值被計算。對于具有少于1024條頻譜線(例如,128條線)的頻譜,優(yōu)選更少的頻帶(例如,6個)被用于α。對于計算α值而言,不一定需要高分辨率的MDCT頻譜??商娲?,具有類似于計算α值所需分辨率的頻率分辨率的濾波器組也可被利用。當(dāng)要實施頻率上增大的頻帶時,則該濾波器組應(yīng)具有變化的帶寬。然而,當(dāng)從低頻到高頻的恒定帶寬足夠時,則具有等寬次頻帶的傳統(tǒng)濾波器組可被使用。根據(jù)實施,圖3b或圖4b所示的α值的符號可反轉(zhuǎn)。然而,為保持一致,該符號反轉(zhuǎn)必須用于編碼器側(cè)以及用于解碼器側(cè)。相比圖6a,圖5a示出了編碼器的概圖,其中,項目2033是由預(yù)測器控制信息206控制的預(yù)測器,預(yù)測器控制信息206在項目207中被確定,且嵌入位流中作為側(cè)信息。代替圖6a的塊50、51中使用的MDCT,一般化時間/頻率轉(zhuǎn)換如所討論的用于圖5a中。如先前所述,圖6a是對應(yīng)于圖6b中的解碼器處理的編碼器處理,其中,L代表左信道信號,R代表右信道信號,M代表中信號或下混信號,S代表側(cè)信號,以及D代表剩余信號??商娲?,L也被稱作第一信道信號201,R也被稱作第二信道信號202,M也被稱作第一合成信號204,以及S也被稱作第二合成信號2032。優(yōu)選地,編碼器中的模塊2070和解碼器中的1160a應(yīng)恰好匹配以確保正確的波形編碼。這優(yōu)選適用于以下情況:其中,這些模塊利用某些形式的近似,諸如截尾濾波,或者當(dāng)僅利用一個或兩個而非三個MDCT幀(即線60上的當(dāng)前MDCT幀、線61上的前一 MDCT幀、以及線62上的下一 MDCT幀)時。此外,優(yōu)選圖6a的編碼器中的模塊2070利用非量化MDCT頻譜M作為輸入,盡管解碼器中的實部-虛部(R2I)模塊1160a僅具有量化的MDCT頻譜可用作輸入。可替代地,我們還可利用編碼器使用量化的MDCT系數(shù)作為向模塊2070的輸入的實施。然而,從感知觀點來看,利用非量化的MDCT頻譜作為向模塊2070的輸入是優(yōu)選方法。隨后,更詳細(xì)討論本發(fā)明實施方式的若干方面。標(biāo)準(zhǔn)的參數(shù)立體聲編碼依賴于過采樣復(fù)(混合)QMF域允許時間和頻率變化的感知激勵的信號處理而不引入混疊偽差的能力。然而,在下混/剩余編碼(如用于這里考慮的高位率)的情況下,所獲得的統(tǒng)一立體聲編碼器用作波形編碼器。由于波形編碼范例確保MDCT-MDCT處理鏈的混疊消除特性被足夠好地保留,所以這允許在臨界采樣域(如MDCT域)中的操作。 然而,為能夠利用可在具有信道間時間或相位差的立體聲信號的情況下利用復(fù)值預(yù)測系數(shù)α實現(xiàn)的改善后的編碼效率,下混信號DMX的復(fù)值頻域表示需要作為向復(fù)值上混矩陣的輸入。這可通過使用除了對DMX信號的MDCT轉(zhuǎn)換之外的MDST轉(zhuǎn)換來獲得。MDST頻譜可由MDCT頻譜(精確或作為近似地)計算。此外,上混矩陣的參數(shù)化可通過發(fā)送復(fù)預(yù)測系數(shù)α代替MPS參數(shù)來簡化。因此,僅兩個參數(shù)(α的實部和虛部)而非三個(ICC、CLD和IPD)被發(fā)送。在下混/剩余編碼的情況下,這由于MPS參數(shù)化中的冗余而可行。MPS參數(shù)化包括關(guān)于添加到解碼器中的解相關(guān)的相對量(即RES與DMX信號之間的能量比)的信息,且當(dāng)實際DMX和RES信號被發(fā)送時,該/[目息是冗余的。由于相同原因,在下混/剩余編碼的情況下,上述上混矩陣中所示的增益因子g被舍棄。因此,用于利用復(fù)預(yù)測的下混/剩余編碼的上混矩陣現(xiàn)在是:
Γχ] f1-a i YdmxU]=b+ - 財 _。相比圖4b中的方程1169,α的符號在該方程中相反,以及DMX=M且RES=D。因此,相對于圖4b,這是替代性實施/符號。兩個選擇可用于在編碼器中計算預(yù)測剩余信號。一個選擇是利用下混的量化MDCT頻譜值。由于編碼器和解碼器利用相同值來生成預(yù)測,所以這將導(dǎo)致與Μ/S編碼相同的量化誤差分布。另一選擇是利用非量化的MDCT頻譜值。這意味著編碼器和解碼器將不使用相同數(shù)據(jù)來生成預(yù)測,這允許編碼誤差根據(jù)信號的瞬時屏蔽特性空間上重新分布,代價是編碼增益有所減少。優(yōu)選如所討論的利用三個相鄰MDCT幀的二維FIR濾波在頻域中直接計算MDST頻譜。后者可被視為“實部-虛部”(R2I)轉(zhuǎn)換。MDST的頻域運(yùn)算的復(fù)雜性可以不同方式來減小,這意味著僅MDST頻譜的近似 被計算:.限定FIR濾波器分接(tap)的數(shù)目。 僅由當(dāng)前MDCT幀來估計MDST。.由當(dāng)前和前一 MDCT幀來估計MDST。只要相同近似法用在編碼器和解碼器中,波形編碼特性不受影響。然而,這種MDST頻譜的近似法可能導(dǎo)致由復(fù)預(yù)測獲得的編碼增益的減小。若基本MDCT編碼器支持窗口形狀切換,則用于計算MDST頻譜的二維FIR濾波器的系數(shù)必須適應(yīng)實際窗口形狀。應(yīng)用于當(dāng)前框的MDCT頻譜的濾波器系數(shù)取決于完整窗口,即每種窗口類型和每一窗口過渡所需的一組系數(shù)。應(yīng)用前一 /下一幀的MDCT頻譜的濾波器系數(shù)僅取決于窗口與當(dāng)前幀的半交疊,即這組系數(shù)僅需要針對每一種窗口類型來使用(無用于過渡的其他系數(shù))。若基本MDCT編碼器利用轉(zhuǎn)換長度切換,包括近似中的前一和/或下一 MDCT幀在不同轉(zhuǎn)換長度之間的過渡附近變得更加復(fù)雜。由于當(dāng)前和前一 /下一幀中MDCT系數(shù)的不同數(shù)目,在該情況下,二維濾波更加復(fù)雜。為避免增加計算和結(jié)構(gòu)復(fù)雜性,以針對相應(yīng)幀的近似的精度減小為代價,前一 /下一幀可從轉(zhuǎn)換長度過渡的濾波中被排除。此外,需要特別關(guān)注MDST頻譜的最低和最高部分(接近DC和fs/2),其中,比所需的更少的周圍MDCT系數(shù)可用于FIR濾波。這里,濾波處理需要適應(yīng)于正確計算MDST頻譜。這可通過針對缺少的系數(shù)使用MDCT頻譜的對稱擴(kuò)展(根據(jù)時間離散信號的頻譜的周期性),或者通過相應(yīng)調(diào)適濾波器系數(shù)來完成。當(dāng)然,這些特定情況的處理在以MDST頻譜的邊界附近的精度減小為代價的前提下可被簡化。在解碼器中由發(fā)送的MDCT頻譜計算精確的MDST頻譜使解碼器延遲增加一幀(這里假定有1024個樣本)。通過利用不需要下一幀的MDCT頻譜作為輸入的MDST頻譜的近似,可避免其他延
遲。 以下項目列表總結(jié)了基于MDCT的統(tǒng)一立體聲編碼勝過基于QMF的統(tǒng)一立體聲編碼的優(yōu)勢:.計算復(fù)雜性僅小幅增加(當(dāng)未使用SBR時)。.若MDCT頻譜未被量化,則最多達(dá)到完美重構(gòu)。注意這不是針對基于QMF的統(tǒng)一立體聲編碼的情況。.Μ/S編碼和強(qiáng)度立體聲編碼的自然擴(kuò)展。.由于立體聲信號處理和量化/編碼可緊密耦合,所以有簡化編碼器調(diào)諧的更簡潔架構(gòu)。注意在基于QMF的統(tǒng)一立體聲編碼中,MPEG環(huán)繞幀和MDCT幀并不對準(zhǔn)且標(biāo)度因子頻帶與參數(shù)頻帶不匹配。.由于僅必須發(fā)送兩個參數(shù)(復(fù)α ),而不是如MPEG環(huán)繞中那樣三個參數(shù)(ICC、CLD、IPD)必須被發(fā)送,所以能有效編碼立體聲參數(shù)。 若MDST頻譜被計算為近似(未利用下一幀),則無其他解碼器延遲。實施的重要特性可被總結(jié)如下:a)MDST頻譜利用二維FIR濾波從當(dāng)前、前一和下一 MDCT頻譜來計算。通過減少所使用的FIR濾波器分接的數(shù)目和/或MDCT幀的數(shù)目,關(guān)于MDST計算(近似)的不同復(fù)雜性/質(zhì)量折衷是可行的。具體地,若相鄰幀由于在發(fā)送或轉(zhuǎn)換長度切換期間的幀損失而不可用,則特定幀從MDST估計中被排除。對于轉(zhuǎn)換長度切換的情況,該排除在位流中信號傳送。b)僅發(fā)送兩個參數(shù),復(fù)預(yù)測系數(shù)α的實部和虛部,而非ICC、CLD和IPD。α的實部和虛部被獨立處理,限定為范圍[-3.0, 3.0]且以0.1的步長大小來量化。若特定參數(shù)(α的實部或虛部)在給定幀中未使用,則這在位流中信號傳送,且不發(fā)送不相關(guān)參數(shù)。這些參數(shù)以時間差異或頻率差異來編碼,且最終利用標(biāo)度因子編碼簿來應(yīng)用霍夫曼編碼。預(yù)測系數(shù)每過兩個標(biāo)度因子頻帶而被更新,這產(chǎn)生了與MPEG環(huán)繞的頻率分辨率類似的頻率分辨率。該量化和編碼方案對于具有96kb/s目標(biāo)位率的典型配置內(nèi)的立體聲側(cè)信息產(chǎn)生約2kb/s的平均位率。優(yōu)選的其他或替代性實施細(xì)節(jié)包括:c)對α的兩個參數(shù)中的每一個而言,我們可在每個幀或每個串流的基礎(chǔ)上選擇非差分(PCM)或差分(DPCM)編碼,由位流中的相應(yīng)位以信號發(fā)送。對于DPCM編碼而言,時間或頻率差分編碼是可行的。另外,這可利用一位標(biāo)志來以信號發(fā)送。d)代替重新利用預(yù)定義編碼簿(諸如AAC標(biāo)度因子簿),我們也可利用專用不變的或信號自適應(yīng)的編碼簿來編碼α參數(shù)值,或者我們可恢復(fù)使用固定長度(例如,4位)無符號或兩個補(bǔ)碼字。e) α參數(shù)值的范圍以及參數(shù)量化步長大小可任意選擇并優(yōu)化為眼前的信號特性。f)有效α參數(shù)頻帶的數(shù)目以及頻譜和/或時間寬度可被任意選擇并優(yōu)化為給定信號特性。具體地,頻帶配置可在每個幀或每個串流的基礎(chǔ)上以信號發(fā)送。g)除了以上a)中所述的機(jī)制以外或者代替該機(jī)制,可利用位流中的每幀一位來外顯地發(fā)信號,使得僅當(dāng)前幀的MDCT頻譜用于計算MDST頻譜近似,即未考慮相鄰MDCT幀。實施方式與用于MDCT域中的統(tǒng)一立體聲編碼的發(fā)明系統(tǒng)有關(guān)。即使在較高位率下(在SBR未被使用的情況下)也能利用MPEG USAC系統(tǒng)中的統(tǒng)一立體聲編碼的優(yōu)勢,而將伴隨基于QMF方法的計算復(fù)雜性未明顯增加。以下兩個列表總結(jié)了前述優(yōu)選配置方面,這些方面可彼此交替使用或附加至其他方面來使用:Ia) 一般性概念:由中MDCT和MDST復(fù)預(yù)測側(cè)MDCT ;Ib )利用一個以上幀(3幀引入延遲)由頻域中的MDCT(“ R2I ”)來計算/近似MDST ;Ic)濾波器截尾(甚至降至I幀2分接,即,[-101])以減少計算復(fù)雜性;I d )恰當(dāng)處理 DC 和 fs/2 ;le)恰當(dāng)處理窗口形狀切換;If)若其具有不同轉(zhuǎn)換大小,則不使用前一 /下一幀;Ig)基于編碼器中的非量化或量化MDCT系數(shù)來預(yù)測;2a)直接量化和編碼復(fù)預(yù)測系數(shù)的實部和虛部(即沒有MPEG環(huán)繞參數(shù)化);2b)對此使用統(tǒng)一量化器(步長大小例如0.1);2c)使用針對預(yù)測系數(shù)的適當(dāng)頻率分辨率(例如,每2個標(biāo)度因子頻帶I個系數(shù));2d)在所有預(yù)測系數(shù)均為實數(shù)的情況下廉價信號傳送;2e)每幀有顯式位以迫使I幀R2I運(yùn)算發(fā)生。在一種實施方式中,編碼器另外包括:用于將兩個信道信號的時域表示轉(zhuǎn)換成具有關(guān)于該兩個信道信號的次頻帶信號的兩個信道信號的頻譜表示的頻譜轉(zhuǎn)換器(50、51),其中,合成器(2031)、預(yù)測器(2033)和剩余信號計算器(2034)被配置為單獨處理每個次頻帶信號,從而獲得針對多個次頻帶的第一合成信號和剩余信號,其中,輸出接口(212)被配置為合成針對多個次頻帶的編碼后的第一合成信號和編碼后的剩余信號。盡管已在設(shè)備背景下描述了某些方面,但應(yīng)清楚,這些方面也表示對相應(yīng)方法的描述,其中,塊或裝置對應(yīng)于方法步驟或方法步驟的特征。類似地,在方法步驟背景下描述的方面也表示對相應(yīng)設(shè)備的相應(yīng)塊或項目或者特征的描述。在本發(fā)明的實施方式中,應(yīng)用窗口形狀切換的恰當(dāng)處理。當(dāng)考慮圖1Oa時,窗口形狀信息109可被輸入到虛部頻譜計算器1001中。具體地,執(zhí)行諸如MDCT頻譜的實值頻譜的實部-虛部轉(zhuǎn)換的虛部頻譜計算器(諸如圖6a中的元件2070或圖6b中的元件1160a)可被實施為FIR或IIR濾波器。該實部-虛部模塊1001中的FIR或IIR系數(shù)取決于當(dāng)前幀的左半部分和右半部分的窗口形狀。該窗口形狀可對于正弦窗口或KBD (西澤貝索衍生)窗口是不同的,且以給定窗口序列配置為準(zhǔn),可以是長窗口、開始窗口、停止窗口和停止-開始窗口或短窗口。實部-虛部模塊可包括二維FIR濾波器,其中,一個維度是時間維度,其中,兩個連續(xù)的MDCT幀被輸入到FIR濾波器中,以及第二維度是頻率維度,其中,輸入幀的頻率系數(shù)。下表給出針對關(guān)于不同窗口形狀的當(dāng)前窗口序列的不同MDST濾波器系數(shù),以及該窗口的左半部分和右半部分的不同實施。
表A-針對當(dāng)前窗口的MDST濾波器參數(shù)
權(quán)利要求
1.一種用于解碼編碼后的多信道音頻信號(100)的音頻解碼器,所述編碼后的多信道音頻信號包括基于用于合成多信道音頻信號中的第一信道音頻信號與第二信道音頻信號的合成規(guī)則生成的編碼后的第一合成信號、編碼后的預(yù)測剩余信號和預(yù)測信息,所述音頻解碼器包括: 信號解碼器(110),其用于解碼所述編碼后的第一合成信號(104)以獲得解碼后的第一合成信號(112),以及用于解碼所述編碼后的剩余信號(106)以獲得解碼后的剩余信號(114);以及 解碼器計算器(116),其用于利用所述解碼后的剩余信號(114)、所述預(yù)測信息(108)和所述解碼后的第一合成信號(112)來計算具有解碼后的第一信道信號(117)和解碼后的第二信道信號(118)的解碼后的多信道信號,使得所述解碼后的第一信道信號(117)和所述解碼后的第二信道信號(118 )至少是所述多信道信號的所述第一信道信號和所述第二信道信號的近似,其中,所述預(yù)測信息(108)包括異于零的實值部和/或異于零的虛部。
2.根據(jù)權(quán)利要求1所述的音頻解碼器,其中,所述解碼器計算器(116)包括: 預(yù)測器(1160),其用于將所述預(yù)測信息(108)應(yīng)用于所述解碼后的第一合成信號(112)或源自所述解碼后的第一合成信號的信號(601)以獲得預(yù)測信號(1163); 合成信號計算器(1161 ),其用于通過合成所述解碼后的剩余信號(114)與所述預(yù)測信號(1163)來計算第二合成信號(1165);以及 合成器(1162),其用于合成所述解碼后的第一合成信號(112)與所述第二合成信號(1165)以獲得具有所述解碼后的第一信道信號(117)和所述解碼后的第二信道信號(118)的解碼后的多信道音頻信號。
3.根據(jù)權(quán)利要求1或2所述的音頻解碼器, 其中,所述編碼后的第一合成信號(104)和所述編碼后的剩余信號(106)已利用生成時間-頻譜轉(zhuǎn)換的混疊來生成, 其中,所述解碼器還包括: 頻譜-時間轉(zhuǎn)換器(52、53),其用于利用與時間-頻譜轉(zhuǎn)換算法相匹配的頻譜-時間轉(zhuǎn)換算法來生成時域第一信道信號和時域第二信道信號; 交疊/相加處理器(522),其用于對所述時域第一信道信號和對所述時域第二信道信號進(jìn)行交疊-相加處理以獲得無混疊第一時域信號和無混疊第二時域信號。
4.根據(jù)前述權(quán)利要求中任一項所述的音頻解碼器,其中,所述預(yù)測信息(108)包括異于零的實數(shù)因子, 其中,所述預(yù)測器(1160)被配置為將所述解碼后的第一合成信號乘以所述實數(shù)因子以獲得所述預(yù)測信號的第一部分,以及 其中,所述合成信號計算器被配置為線性合成所述解碼后的剩余信號與所述預(yù)測信號的所述第一部分。
5.根據(jù)前述權(quán)利要求中任一項所述的音頻解碼器,其中,所述預(yù)測信息(108)包括異于零的虛數(shù)因子,以及 其中,所述預(yù)測器(1160)被配置為利用所述解碼后的第一合成信號(112)的實部來估計(1160a)所述解碼后的第一合成信號(112)的虛部, 其中,所述預(yù)測器(1160)被配置為將所述解碼后的第一合成信號的虛部(601)乘以所述預(yù)測信息(108)的虛數(shù)因子以獲得所述預(yù)測信號的第二部分;以及 其中,所述合成信號計算器(1161)被配置為線性合成所述預(yù)測信號的所述第一部分以及所述預(yù)測信號的所述第二部分與所述解碼后的剩余信號以獲得第二合成信號(1165)。
6.根據(jù)前述權(quán)利要求中任一項所述的音頻解碼器, 其中,所述編碼或解碼后的第一合成信號(104)和所述編碼或解碼后的預(yù)測剩余信號(106)分別包括第一多個子帶信號, 其中,所述預(yù)測信息包括第二多個預(yù)測信息參數(shù),所述第二多個小于所述第一多個,其中,所述預(yù)測器(1160 )被配置為將相同預(yù)測參數(shù)應(yīng)用于所述解碼后的第一合成信號的至少兩個不同子帶信號, 其中,所述解碼器計算器(116)或所述合成信號計算器(1161)或者所述合成器(1162)被配置為執(zhí)行逐個子帶處理;以及 其中,所述音頻解碼器還包括合成濾波器組(52、53 ),其用于合成所述解碼后的第一合成信號的子帶信號與所述解碼后的第二合成信號的子帶信號以獲得時域第一解碼信號和時域第二解碼信號。
7.根據(jù)權(quán)利要求2所述的音頻解碼器, 其中,所述預(yù)測器(1160)被配置為利用線性濾波器(1004、1005、1006、1007)來對至少兩個時間相繼的幀濾波,其中,所 述兩個時間相繼的幀中的一個幀在所述第一合成信號的當(dāng)前幀之前或之后,以獲得所述第一合成信號的當(dāng)前幀的估計的虛部。
8.根據(jù)權(quán)利要求2所述的音頻解碼器, 其中,所述解碼后的第一合成信號包括實值信號幀序列,以及其中,所述預(yù)測器(1160)被配置為利用僅當(dāng)前實值信號幀,或者利用所述當(dāng)前實值信號幀和僅一個以上之前實值信號幀或僅一個以上后續(xù)實值信號幀,或者利用所述當(dāng)前實值信號幀和一個以上之前實值信號幀以及一個以上后續(xù)實值信號幀來估計(1160a)當(dāng)前信號幀的虛部。
9.根據(jù)權(quán)利要求2所述的音頻解碼器,其中,所述預(yù)測器(1160)被配置為接收窗口形狀信息(109),以及使用不同濾波器系數(shù)來計算虛數(shù)頻譜,其中,所述不同濾波器系數(shù)取決于由所述窗口形狀信息(109 )指示的不同窗口形狀。
10.根據(jù)權(quán)利要求7、8或9所述的音頻解碼器, 其中,所述解碼后的第一合成信號與由包括在所述編碼后的多信道信號(100)中的變換長度指示符指示的不同變換長度相關(guān)聯(lián),以及 其中,所述預(yù)測器(1160)被配置為僅使用具有相同關(guān)聯(lián)變換長度的所述第一合成信號的一個以上幀來估計關(guān)于第一合成信號的當(dāng)前幀的虛部。
11.根據(jù)權(quán)利要求2至10中任一項所述的音頻解碼器, 其中,所述預(yù)測器(1160)被配置為使用所述解碼后的第一合成信號的頻率上相鄰的多個子帶來估計所述第一合成信號的虛部,以及 其中,在低頻或高頻的情況下,所述第一合成信號的當(dāng)前幀的頻率的對稱性擴(kuò)展被用于與低于或等于零的頻率或者高于或等于所述當(dāng)前幀基于的采樣頻率的一半的頻率相關(guān)聯(lián)的子帶,或者其中,包括在所述預(yù)測器(1160a)中的濾波器的濾波器系數(shù)針對缺失子帶被設(shè)定為與非缺失子帶相比不同的值。
12.根據(jù)前述權(quán)利要求中任一項所述的音頻解碼器, 其中,所述預(yù)測信息(108)以量化和熵編碼表示包括在所述編碼后的多信道信號中,其中,所述音頻解碼器還包括用于熵解碼或解量化的預(yù)測信息解碼器(65)以獲得由所述預(yù)測器(1160 )使用的解碼后的預(yù)測信息,或者 其中,所述編碼后的多信道音頻信號包括數(shù)據(jù)單元,所述數(shù)據(jù)單元在第一狀態(tài)下指示所述預(yù)測器(1160)使用時間上在所述解碼后的第一合成信號的當(dāng)前幀之前或之后的至少一個幀,以及在第二狀態(tài)下指示所述預(yù)測器(1160)使用所述解碼后的第一合成信號的僅單個幀,來估計關(guān)于所述解碼后的第一合成信號的當(dāng)前幀的虛部,以及其中,所述預(yù)測器(1160)被配置為檢測所述數(shù)據(jù)單元的狀態(tài)并相應(yīng)操作。
13.根據(jù)前述權(quán)利要求中任一項所述的音頻解碼器,其中,所述預(yù)測信息(108)包括時間相繼的或頻率相鄰的復(fù)數(shù)值之間的差的碼字,以及 其中,所述音頻解碼器被配置為執(zhí)行熵解碼步驟和隨后的差解碼步驟以獲得時間相繼的量化復(fù)預(yù)測值或針對相鄰頻帶的復(fù)預(yù)測值。
14.根據(jù)權(quán)利要求1至10中任一項所述的音頻解碼器,其中,所述編碼后的多信道信號包括作為側(cè)信息的實數(shù)指示符,所述實數(shù)指示符指示針對所述編碼后的多信道信號的幀的所有預(yù)測系數(shù)均為實值, 其中,所述音頻解碼器被配置為從所述編碼后的多信道音頻信號(100)中提取所述實數(shù)指示符,以及 其中,所述解碼器計算器(116)被配置為不計算關(guān)于幀的虛數(shù)信號,針對所述幀,所述實數(shù)指示符僅指示實值預(yù)測系數(shù)。
15.一種用于編碼具有兩個以上信道信號的多信道音頻信號的音頻編碼器,包括: 編碼器計算器(203 ),其用于利用第一信道信號(201)和第二信道信號(202 )以及預(yù)測信息(206)來計算第一合成信號(204)和預(yù)測剩余信號205,使得預(yù)測剩余信號在與源自所述第一合成信號的預(yù)測信號或源自所述第一合成信號和所述預(yù)測信息(206 )的信號合成時產(chǎn)生第二合成信號(2032),利用合成規(guī)則,所述第一合成信號204)和所述第二合成信號(2032)可從所述第一信道信號(201)和所述第二信道信號(202)得出; 優(yōu)化器(207),其用于計算所述預(yù)測信息(206),使得所述預(yù)測剩余信號205滿足最優(yōu)化目標(biāo)(208); 信號編碼器(209),其用于編碼所述第一合成信號204和所述預(yù)測剩余信號205)以獲得編碼后的第一合成信號(210)和編碼后的剩余信號(211);以及 輸出接口(212),其用于合成所述編碼后的第一合成信號(210)、所述編碼后的預(yù)測剩余信號(211)和所述預(yù)測信息(206)以獲得編碼后的多信道音頻信號。
16.根據(jù)權(quán)利要求15所述的音頻編碼器,其中,所述編碼器計算器(203)包括: 合成器(2031 ),其用于以兩種不同方式合成所述第一信道信號(201)與所述第二信道信號(202)以獲得所述第一合成信號(204)和所述第二合成信號(2032); 預(yù)測器(2033 ),其用于將所述預(yù)測信息(206 )應(yīng)用于所述第一合成信號(204)或源自所述第一合成信號(204)的信號(600)以獲得預(yù)測信號(2035);以及 剩余信號計算器(2034),其用于通過合成所述預(yù)測信號(2035)與所述第二合成信號(2032)來計算所述預(yù)測剩余信號(205)。
17.根據(jù)權(quán)利要求16所述的音頻編碼器,其中,所述預(yù)測器(2033)包括量化器,所述量化器用于量化所述第一信道信號、所述第二信道信號、所述第一合成信號或所述第二合成信號以獲得一個或多個量化信號,以及其中,所述預(yù)測器(2033)被配置為使用量化信號來計算所述剩余信號。
18.根據(jù)權(quán)利要求15至17中任一項所述的音頻編碼器, 其中,所述第一信道信號為樣本塊的頻譜表示; 其中,所述第二信道信號為樣本塊的頻譜表示, 其中,所述頻譜表示是純實數(shù)頻譜表示或純虛數(shù)頻譜表示, 其中,所述優(yōu)化器(207)被配置為將所述預(yù)測信息(206)計算為異于零的實值因子和/或異于零的虛數(shù)因子,以及 其中,所述編碼器計算器(203 )被配置為計算所述第一合成信號和所述預(yù)測剩余信號,使得所述預(yù)測信號利用所述實值因子從所述純實數(shù)頻譜表示或所述純虛數(shù)頻譜表示得出。
19.根據(jù)權(quán)利要求15至18中任一項所述的音頻編碼器, 其中,所述第一信道信號為樣本塊的頻譜表示; 其中,所述第二信道信號為樣本塊的頻譜表示, 其中,所述頻譜表示是純實數(shù)頻譜表示或純虛數(shù)頻譜表示, 其中,所述優(yōu)化器(207)被配置為將所述預(yù)測信息(206)計算為異于零的實值因子和/或異于零的虛數(shù)因子,以及 其中,所述編碼器計算器(203 )包括實數(shù)-虛數(shù)變換器(2070 )或虛數(shù)-實數(shù)變換器,其用于從所述第一合成信號得出變換頻譜表示,以及 其中,所述編碼器計算器(203)被配置為計算所述第一合成信號(204)和第一剩余信號(2032),使得所述預(yù)測信號利用所述虛數(shù)因子從所述變換頻譜得出。
20.根據(jù)權(quán)利要求15至19中任一項所述的編碼器, 其中,所述預(yù)測器(2033)被配置為將所述第一合成信號(204)乘以所述預(yù)測信息(2073)的實部以獲得所述預(yù)測信號的第一部分; 利用所述第一合成信號(204 )來估計(2070 )所述第一合成信號的虛部(600 ); 將所述第一合成信號的虛部乘以所述預(yù)測信息(2074)的虛部以獲得所述預(yù)測信號的第二部分;以及 其中,所述剩余計算器(2034)被配置為線性合成所述預(yù)測信號的第一部分信號或所述預(yù)測信號的第二部分信號與所述第二合成信號以獲得所述預(yù)測剩余信號(205)。
21.一種解碼編碼后的多信道音頻信號(100)的方法,所述編碼后的多信道音頻信號包括基于用于合成多信道音頻信號中的第一信道音頻信號與第二信道音頻信號的合成規(guī)則生成的編碼后的第一合成信號、編碼后的預(yù)測剩余信號和預(yù)測信息,所述方法包括: 解碼(110)所述編碼后的第一合成信號(104)以獲得解碼后的第一合成信號(112),以及解碼所述編碼后的剩余信號(106)以獲得解碼后的剩余信號(114);以及 利用所述解碼后的剩余信號(114)、所述預(yù)測信息(108)和所述解碼后的第一合成信號(112)來計算(116)具有解碼后的第一信道信號(117)和解碼后的第二信道信號(118)的解碼后的多信道信號,使得所述解碼后的第一信道信號(117)和所述解碼后的第二信道信號(118)至少是所述多信道信號的所述第一信道信號和所述第二信道信號的近似,其中,所述預(yù)測信息(108)包括異于零的實值部和/或異于零的虛部。
22.一種編碼具有兩個以上信道信號的多信道音頻信號的方法,包括: 利用第一信道信號(201)和第二信道信號(202)以及預(yù)測信息(206)來計算(203)第一合成信號(204)和預(yù)測剩余信號(205),使得預(yù)測剩余信號在與源自所述第一合成信號的預(yù)測信號或源自所述第一合成信號和所述預(yù)測信息(206)的信號合成時產(chǎn)生第二合成信號(2032),利用合成規(guī)則,所述第一合成信號(204)和所述第二合成信號(2032)可從所述第一信道信號(201)和所述第二信道信號(202)得出; 計算(207)所述預(yù)測信息(206),使得所述預(yù)測剩余信號(205)滿足最優(yōu)化目標(biāo)(208); 編碼(209)所述第一合成信號(204)和所述預(yù)測剩余信號(205)以獲得編碼后的第一合成信號(210)和編碼后的剩余信號(211);以及 合成( 212)所述編碼后的第一合成信號(210)、所述編碼后的預(yù)測剩余信號(211)和所述預(yù)測信息(206 )以獲得編碼后的多信道音頻信號。
23.一種計算機(jī)程序,當(dāng)在計算機(jī)或處理器上運(yùn)行時,所述計算機(jī)程序用于執(zhí)行根據(jù)權(quán)利要求21所述的方法或根據(jù)權(quán)利要求22所述的方法。
24.一種編碼后的多信道音頻信號,其包括基于用于合成多信道音頻信號中的第一信道音頻信號與第二信道音頻信號的合成規(guī)則生成的編碼后的第一合成信號、編碼后的預(yù)測剩余信號和預(yù)測信息。
全文摘要
一種音頻編碼器和音頻解碼器基于兩個音頻信道(201、202)的合成以獲得作為中信號的第一合成信號(204)和可利用源自中信號的預(yù)測側(cè)信號得出的剩余信號(205)。第一合成信號和預(yù)測剩余信號連同基于最優(yōu)化目標(biāo)(208)由優(yōu)化器(207)得出的預(yù)測信息(206)一起被編碼(209)并寫入(212)數(shù)據(jù)流(213)中。解碼器利用預(yù)測剩余信號、第一合成信號和預(yù)測信息得出解碼后的第一信道信號和解碼后的第二信道信號。在編碼器實例或解碼器實例中,實部-虛部轉(zhuǎn)換可應(yīng)用于估計第一合成信號的頻譜的虛部。為計算在預(yù)測剩余信號的得出中使用的預(yù)測信號,實值第一合成信號乘以復(fù)預(yù)測信息的實部且第一合成信號的估計虛部乘以復(fù)預(yù)測信息的虛部。
文檔編號G10L19/00GK103098126SQ201180028369
公開日2013年5月8日 申請日期2011年3月23日 優(yōu)先權(quán)日2010年4月9日
發(fā)明者??啤て諣柤{根, 蓬圖斯·卡爾松, 拉爾斯·維萊蒙斯, 朱利安·羅比利亞德, 馬蒂亞斯·紐辛格, 克里斯蒂安·赫爾姆里希, 約翰內(nèi)斯·希爾珀特, 尼古勞斯·雷特爾巴赫, 薩沙·迪施, 貝恩德·埃德勒 申請人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司, 杜比Ab國際公司