專利名稱:近透明或透明的多聲道編碼器/解碼器方案的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多聲道編碼方案,具體涉及參數(shù)多聲道編碼方案。
技術(shù)背景如今,有兩種技術(shù)在充分利用立體聲音頻信號中所包含的立體聲冗余和不相干方面占優(yōu)勢。中側(cè)(M/S)立體聲編碼[l],主要針對冗余去除,并基于以下事實(shí)由于兩個(gè)聲道經(jīng)常完全相關(guān),因此對這兩個(gè)聲道之和以及差進(jìn)行編碼更加有益。因此,與較低功率側(cè)信號(side signal)(或差信號)相比,可以在高功率的和信號上消耗更多比特。 另一方面,強(qiáng)度立體聲編碼[2, 3]在每個(gè)子帶上通過以和信號和方位 角代替兩個(gè)信號來實(shí)現(xiàn)不相干去除。在解碼器中,將方位角參數(shù)用于 控制由子帶和信號所表示的聽覺事件的空間位置。將中側(cè)和強(qiáng)度立體 聲廣泛地用于現(xiàn)有的音頻編碼標(biāo)準(zhǔn)[4]。M/S方法關(guān)于冗余利用的問題在于,如果兩個(gè)分量異相(一個(gè)相 對于另一個(gè)延遲),則M/S編碼增益為零。這是概念問題,因?yàn)樵趯?shí) 際的音頻信號中時(shí)間經(jīng)延遲頻繁發(fā)生。例如,空間聽力在很大程度上 依靠信號(尤其是低頻率信號)之間的時(shí)間差[5]。在音頻記錄中, 時(shí)間延遲源于立體聲麥克風(fēng)裝備,以及人工后處理(音響效果)。在中 側(cè)編碼中,經(jīng)常將自組織解決方案用于時(shí)間延遲問題中在不同信號 的功率小于和信號的功率的常因子時(shí)只采用M/S編碼[l]。在[6]中更 好地提出了對準(zhǔn)問題,在其中從另一個(gè)信號分量來預(yù)測信號分量之一。 在編碼器中,逐幀得到預(yù)測濾波器,并將其作為側(cè)信號方面信息進(jìn)行 傳輸。在[7]中,考慮了反向自適應(yīng)備選。要注意的是,性能增益很大 程度上取決于信號類型,但是針對特定類型的信號,獲得了與M/S立 體聲編碼相比的顯著增益。
近來,參數(shù)立體聲編碼受到了很大關(guān)注[8-11]?;诤诵膯温暤?(單一聲道)編碼器,這種參數(shù)方案提取了立體聲(多聲道)分量, 并以相對低的比特率對其進(jìn)行獨(dú)立編碼??梢詫⒋丝醋鲝?qiáng)度立體聲編 碼的概括。參數(shù)立體聲編碼方法在音頻編碼的低比特率范圍內(nèi)特別有 用,這導(dǎo)致只將全部比特預(yù)算中的一小部分用于立體聲分量的質(zhì)量的 顯著增長。參數(shù)方法還由于可以縮放到多聲道(多于兩個(gè)聲道)情況 并具有提供反向兼容的能力而引人注目MP3環(huán)繞聲[12]就是這樣的 一個(gè)示例,其中對多聲道數(shù)據(jù)進(jìn)行編碼,并通過數(shù)據(jù)流的側(cè)信號聲場 進(jìn)行傳輸。這允許接收機(jī)不具有對正常的立體聲信號進(jìn)行編碼的多聲 道性能,但是環(huán)繞聲使能的接收機(jī)可以享有多聲道音頻。參數(shù)方法經(jīng) 常依靠對不同的技術(shù)心理聲學(xué),主要是聲道間電平差(ICLD's)和聲 道間時(shí)間差(ICTD's)。在[11]中,提出了相干參數(shù)對于固有的音響效 果具有重要意義。然而,參數(shù)方法受到以下限制由于固有的模型限 制,編碼器在較高比特率時(shí)不能夠達(dá)到透明質(zhì)量。該問題涉及參數(shù)多聲道編碼器,該參數(shù)多聲道編碼器的最大可獲 得質(zhì)量值被限制到明顯在透明質(zhì)量之下的閾值。參數(shù)質(zhì)量閾值如圖11 中的1100所示。從表示根據(jù)BBC增強(qiáng)型單聲道編碼器(1102)的質(zhì) 量/比特率的示意性曲線圖中可以看出,該質(zhì)量不能超過與比特率無關(guān) 的參數(shù)質(zhì)量閾值1100。這意味著,即使使用增大的比特率,這種參數(shù) 多聲道編碼器的質(zhì)量也不再增大。BCC增強(qiáng)型單聲道編碼器是針對當(dāng)前存在的立體聲編碼器或多 聲道編碼器的示例,在其中執(zhí)行立體聲-下混音或多聲道下混音。此外, 通過描述聲道間電平關(guān)系、聲道間時(shí)間關(guān)系、聲道間相干關(guān)系等導(dǎo)出 參數(shù)。該參數(shù)不同于諸如中側(cè)編碼器的側(cè)信號之類的波形信號,因?yàn)榕c 參數(shù)表示相比,該側(cè)信號描述了以波形格式存在的兩個(gè)聲道之差,這 通過給出特定參數(shù)而非逐個(gè)樣本的波形表示描述了兩個(gè)聲道之間的相 似性或相異性。在參數(shù)需要用于從編碼器傳輸?shù)浇獯a器的少量比特的 同時(shí),波形描述,即從波形中導(dǎo)出的殘留信號,需要比理論上所允許 的透明重構(gòu)更多的比特。
圖11示出了根據(jù)這種基于波形的傳統(tǒng)的立體聲編碼器(1104) 的典型質(zhì)量/比特率。從圖11中可以明顯看出,比特率越大,諸如中 側(cè)立體聲編碼器的傳統(tǒng)立體聲編碼器^J質(zhì)量也越高,直至該質(zhì)量達(dá)到 透明質(zhì)量。存在一種"交叉比特率",在這個(gè)比特率處,參數(shù)多聲道編 碼器的特性曲線1102和傳統(tǒng)的基于波形的立體聲編碼器的曲線1104 相互交叉。在這個(gè)交叉(cross-over)比特率之下,參數(shù)多聲道編碼器遠(yuǎn)優(yōu)于 傳統(tǒng)的立體聲編碼器。當(dāng)針對兩個(gè)編碼器考慮同一比特率時(shí),參數(shù)多 聲道編碼器提供了比傳統(tǒng)的基于波形的立體聲編碼器的質(zhì)量高出質(zhì)量 差1108的質(zhì)量。換言之,當(dāng)希望具有特定質(zhì)量lllO時(shí),可以使用參 數(shù)編碼器按照與傳統(tǒng)的基于波形的立體聲編碼器相比減少了差比特率 1112的比特率來實(shí)現(xiàn)這個(gè)質(zhì)量。然而,在交叉比特率之上,情況則完全不同。因?yàn)閰?shù)編碼器處 于其最大參數(shù)編碼器質(zhì)量閾值1100,所以可以只通過使用傳統(tǒng)的基于 波形的立體聲編碼器來獲得較好的質(zhì)量,該立體聲編碼器使用與參數(shù) 編碼器中所使用的相同數(shù)量的比特。發(fā)明內(nèi)容本發(fā)明的目的是提供一種與現(xiàn)有多聲道編碼方案相比允許增大 的質(zhì)量和減少的比特率的編碼/解碼方案。根據(jù)本發(fā)明的第一方面,這個(gè)目的可以由多聲道編碼器來實(shí)現(xiàn), 該多聲道編碼器用于對具有至少兩個(gè)聲道的原始多聲道信號進(jìn)行編 碼,該多聲道編碼器包括參數(shù)提供器,用于提供一個(gè)或多個(gè)參數(shù), 形成一個(gè)或多個(gè)參數(shù),使得可以使用從多聲道信號和一個(gè)或多個(gè)參數(shù) 中所導(dǎo)出的一個(gè)或多個(gè)下混音信號來形成重構(gòu)多聲道信號;殘留信號 編碼器,基于原始多聲道信號、 一個(gè)或多個(gè)下混音聲道或一個(gè)或多個(gè) 參數(shù)來產(chǎn)生己編碼的殘留信號,所以使用殘留信號所形成的重構(gòu)多聲 道信號比不使用殘留信號所形成的重構(gòu)多聲道信號與原始多聲道信號 更相似;以及數(shù)據(jù)流成形器,用于形成具有殘留信號以及一個(gè)或多個(gè) 參數(shù)的數(shù)據(jù)流。
根據(jù)本發(fā)明的第二方面,這個(gè)目的可以由多聲道解碼器來實(shí)現(xiàn), 該多聲道解碼器用于對具有一個(gè)或多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù) 以及已編碼的殘留信號的己編碼的多聲道信號進(jìn)行解碼,該多聲道解 碼器包括殘留信號解碼器,用于基于己編碼的殘留信號產(chǎn)生已解碼 的殘留信號;以及多聲道解碼器,用于使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來產(chǎn)生第一重構(gòu)多聲道信號,其中該多聲道解碼器還 可以用于使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留信號來代替第一 重構(gòu)多聲道信號或者除了第一多聲道信號之外又產(chǎn)生第二重構(gòu)多聲道 信號,其中該第二重構(gòu)多聲道信號比第一重構(gòu)多聲道信號與原始多聲 道信號更為相似。根據(jù)本發(fā)明的第三方面,這個(gè)目的可以由多聲道編碼器來實(shí)現(xiàn), 該多聲道編碼器用于對具有至少兩個(gè)聲道的原始多聲道信號進(jìn)行編碼,該多聲道編碼器包括時(shí)間對準(zhǔn)器,用于使用對準(zhǔn)參數(shù)對至少兩 個(gè)聲道的第一聲道和第二聲道進(jìn)行對準(zhǔn);下混音器,用于使用已對準(zhǔn) 的聲道產(chǎn)生下混音聲道;增益計(jì)算器,計(jì)算用于對已對準(zhǔn)的聲道進(jìn)行 加權(quán)的不等于l的增益參數(shù),因此與增益值l相比,已對準(zhǔn)的聲道之 間的差減少;以及數(shù)據(jù)流成形器,用于形成具有關(guān)于下混音聲道的信 息、關(guān)于對準(zhǔn)參數(shù)的信息以及關(guān)于增益參數(shù)的信息的數(shù)據(jù)流。根據(jù)本發(fā)明的第四方面,這個(gè)目的可以由多聲道解碼器來實(shí)現(xiàn), 該多聲道解碼器用于對具有關(guān)于一個(gè)或多個(gè)下混音聲道的信息、關(guān)于 增益參數(shù)的信息、關(guān)于對準(zhǔn)參數(shù)的信息的已編碼的多聲道信號進(jìn)行解 碼,該多聲道解碼器包括下混音聲道解碼器,用于產(chǎn)生已解碼的下 混音信號;以及處理器,用于使用增益參數(shù)對已解碼的下混音聲道進(jìn) 行處理,以獲得第一解碼輸出聲道,此外該處理器使用增益參數(shù)對已 解碼的下混音聲道進(jìn)行處理,并使用對準(zhǔn)參數(shù)進(jìn)行解對準(zhǔn),以獲得第 二解碼輸出聲道。本發(fā)明的另一個(gè)方面包括相應(yīng)的方法、數(shù)據(jù)流/文件和計(jì)算機(jī)程序。本發(fā)明基于以下結(jié)論通過結(jié)合參數(shù)編碼和基于波形的編碼提出 了涉及傳統(tǒng)的參數(shù)編碼器以及基于波形的解碼器的問題。本發(fā)明的這
種編碼器產(chǎn)生縮放數(shù)據(jù)流,該數(shù)據(jù)流具有作為第一增強(qiáng)層的已編碼的 參數(shù)表示以及作為第二增強(qiáng)層的己編碼的殘留信號,該殘留信號優(yōu)選 地為波形類型的信號。通常,在純參數(shù)多聲道編碼器中不被提供的另 外的殘留信號,可用于改進(jìn)可實(shí)現(xiàn)的質(zhì)量,尤其是圖11中的交叉比特 率與最大透明質(zhì)量之間的質(zhì)量。在圖11中可以看出,即使處于交叉比 特率以下,對于可比較的比特率處的質(zhì)量,本發(fā)明的編碼器算法仍然 優(yōu)于純參數(shù)多聲道編碼器。然而,與完全基于波形的傳統(tǒng)的立體聲編 碼器相比,本發(fā)明的組合參數(shù)/波形編碼/解碼方案具有更高的比特效 率。換言之,本發(fā)明的設(shè)備最優(yōu)地結(jié)合了參數(shù)編碼和基于波形編碼的 優(yōu)點(diǎn),使得即使在交叉比特率之上,本發(fā)明的編碼器仍可以利用參數(shù) 概念,但優(yōu)于純參數(shù)編碼器。根據(jù)特定實(shí)施例,本發(fā)明的優(yōu)點(diǎn)或多或少優(yōu)于現(xiàn)有技術(shù)的參數(shù)編 碼器或傳統(tǒng)的基于波形的多聲道編碼器。更先進(jìn)的實(shí)施例提供了更好 的質(zhì)量/比特率特性,而本發(fā)明的低水平的實(shí)施例則需要編碼器和/或 解碼器方面較少的處理功率,但是,由于純參數(shù)編碼器的質(zhì)量受圖11中的閾值質(zhì)量1100限制,那么由于另外進(jìn)行編碼的殘留信號則導(dǎo)致比純參數(shù)編碼器更好的質(zhì)量。本發(fā)明的編碼/解碼方案的優(yōu)點(diǎn)在于能夠無縫地從純參數(shù)編碼轉(zhuǎn) 移到近似波形或完全波形的透明編碼。優(yōu)選地,將參數(shù)立體聲編碼和中側(cè)立體聲編碼結(jié)合成能夠朝著透 明質(zhì)量會聚的方案。在這個(gè)優(yōu)選的中側(cè)立體聲相關(guān)的方案中,更有效 地利用了信號分量(即左聲道和右聲道)之間的相關(guān)性。一般而言,在一些實(shí)施例中,可以將本發(fā)明的思想應(yīng)用于參數(shù)多 聲道編碼器。在一個(gè)實(shí)施例中,從原始信號中導(dǎo)出殘留信號,而沒有 使用也可用于編碼器的參數(shù)信息。本實(shí)施例在處理功率和處理器的可 能的能量消耗之間存在爭議的情況下是優(yōu)選地。這種情況可以發(fā)生在 具有諸如移動(dòng)電話、掌上設(shè)備等的具有受限的功率可能性的手持設(shè)備 上。殘留信號只從原始信號中導(dǎo)出,并且不依靠下混音或參數(shù)。因此, 在解碼器側(cè),使用下混音聲道和參數(shù)所產(chǎn)生的第一重構(gòu)多聲道信號不 用于產(chǎn)生第二重構(gòu)多聲道信號。 然而, 一方面在參數(shù)中存在一些冗余,另一方面在殘留信號中存 在一些冗余??梢酝ㄟ^其他用于計(jì)算已編碼的殘留信號的編碼器/解碼 器系統(tǒng)來獲得冗余去除,該編碼器/解碼器系統(tǒng)利用在編碼器處可用的 參數(shù)信息,并且還可選地利用也在編碼器中可用的下混音聲道。根據(jù)特定情況,殘留信號編碼器可以是由合成設(shè)備通過使用下混 音聲道和參數(shù)信息來計(jì)算完全重構(gòu)多聲道信號的分析。然后,基于該 重構(gòu)信號,可以產(chǎn)生每個(gè)聲道的差信號,從而獲得多聲道差錯(cuò)表示, 可以使用不同方式來處理該多聲道差錯(cuò)表示。 一種方式是將另一種參 數(shù)多聲道編碼方案應(yīng)用于多聲道差錯(cuò)表示。另一種可能性是執(zhí)行用于 對多聲道差錯(cuò)表示進(jìn)行下混音的矩陣變換方案。另一種可能性是從左 和右環(huán)繞聲道中除去差錯(cuò)信號,然后只對中間聲道差錯(cuò)信號進(jìn)行編碼 或者,此外還對左聲道差錯(cuò)信號和右差錯(cuò)聲道差錯(cuò)信號進(jìn)行編碼。因此,存在基于差錯(cuò)表示來實(shí)現(xiàn)殘留信號處理器的多種可能性。上面所提到的實(shí)施例允許對殘留信號進(jìn)行縮放編碼的高靈活性。 然而,因?yàn)樵诰幋a器處執(zhí)行完全的多聲道重構(gòu),然后產(chǎn)生多聲道信號 中的每個(gè)聲道的差錯(cuò)表示,并將其輸入殘留信號處理器中,這完全是 處理功率的要求。在解碼器側(cè),首先必須計(jì)算第一重構(gòu)多聲道信號, 然后基于作為對差錯(cuò)信號的任意表示的己編碼的殘留信號,必須產(chǎn)生 第二重構(gòu)信號。因此,不管是否將要輸出第一重構(gòu)信號的事實(shí),都必 須在解碼器側(cè)對該第一重構(gòu)信號進(jìn)行計(jì)算。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,不考慮是否將要輸出第一重構(gòu) 多聲道信號的事實(shí),都由對殘留信號的直接編碼側(cè)的計(jì)算來代替對編 碼器側(cè)的合成方法的分析以及對第一重構(gòu)多聲道信號的計(jì)算。這是基 于取決于多聲道參數(shù)的對原始聲道的加權(quán),或者基于還是取決于對準(zhǔn) 參數(shù)的一種類型的改進(jìn)的下混音。在本方案中,通過使用參數(shù)和原始 信號,而不是使用一個(gè)或多個(gè)下混音聲道,來非迭代地計(jì)算另外的信 息,即殘留信號。本方案在編碼器和解碼器側(cè)都非常有效。當(dāng)由于帶寬需求而不傳 輸殘留信號或者從可縮放的數(shù)據(jù)流中除去殘留信號時(shí),本發(fā)明的解碼 器自動(dòng)基于下混音聲道和增益以及對準(zhǔn)參數(shù)而產(chǎn)生第一重構(gòu)多聲道信
號,當(dāng)輸入不等于零的殘留信號時(shí),多聲道重構(gòu)器不計(jì)算第一重構(gòu)多 聲道信號,而只計(jì)算第二重構(gòu)多聲道信號,因此,此編碼器/解碼器方 案具有優(yōu)點(diǎn)允許在編碼器側(cè)以及解碼器側(cè)進(jìn)行十分有效的計(jì)算,并 將參數(shù)表示用于減少殘留信號中的冗余,從而獲得具有非常高的處理 功率效率和比特率效率的編碼/解碼方案。
關(guān)于附圖,對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)描述,在附圖中圖1是本發(fā)明的多聲道編碼器的總體表示的方框圖;圖2是多聲道解碼器的總體表示的方框圖;圖3是低處理功率的編碼器側(cè)的實(shí)施例的方框圖;圖4是針對圖3的編碼器系統(tǒng)的解碼器實(shí)施例的方框圖;圖5是基于合成分析的編碼器實(shí)施例的方框圖;圖6是與圖5中的編碼器實(shí)施例相對應(yīng)的解碼器實(shí)施例的方框圖;圖7是在已編碼的殘留信號中具有減少的冗余的直接編碼器實(shí)施 例的總體方框圖;圖8是與圖7中的編碼器相對應(yīng)的解碼器的優(yōu)選實(shí)施例;圖9a是基于圖7和圖8的概念的編碼器/解碼器方案的優(yōu)選實(shí)施例;圖9b是圖9a的實(shí)施例中不傳輸殘留信號而只傳輸對準(zhǔn)和增益參 數(shù)時(shí)的優(yōu)選實(shí)施例;圖9c是用于圖9a和圖9b中的編碼器側(cè)的方程組;圖9d是用于圖9a和圖9b中的解碼器側(cè)的方程組;圖10是基于圖9a到圖9d的方案的實(shí)施例的分析濾波器組/合成 濾波器組;以及圖11示出了參數(shù)和傳統(tǒng)的基于波形的編碼器與本發(fā)明的增強(qiáng)型 編碼器的典型性能的比較。
具體實(shí)施例方式
圖1示出了用于對具有至少兩個(gè)聲道的原始多聲道信號進(jìn)行編碼 的多聲道編碼器的優(yōu)選實(shí)施例。在立體聲環(huán)境下,第一聲道可以是左聲道10a,而第二聲道可以是右聲道10b。雖然在立體聲方案的上下文 中描述了本發(fā)明的實(shí)施例,但因?yàn)榫哂欣?個(gè)聲道的多聲道表示具 有若干對第一聲道和第二聲道,所以縮放成多聲道方案是直接的。在 5.1環(huán)繞方案的上下文中,第一聲道可以是左前聲道,而第二聲道可 以是右前聲道??蛇x地,第一聲道可以是左前聲道,而第二聲道可以 是中央聲道??蛇x地,第一聲道可以是中央聲道,而第二聲道可以是 右前聲道??蛇x地,第一聲道可以是左后聲道(左環(huán)繞聲道),而第二 聲道可以是右后聲道(右環(huán)繞聲道)。本發(fā)明的編碼器可以包括用于產(chǎn)生一個(gè)或多個(gè)下混音聲道的下 混音器12。在立體聲環(huán)境下,下混音器12將產(chǎn)生單一的下混音聲道。 然而在多聲道環(huán)境下,下混音器12可以產(chǎn)生若干下混音聲道。在5.1 的多聲道環(huán)境下,下混音器13優(yōu)選地產(chǎn)生兩個(gè)下混音聲道。通常,下 混音聲道的數(shù)量小于原始多聲道信號中的聲道的數(shù)量。本發(fā)明的多聲道編碼器還包括用于提供一個(gè)或多個(gè)參數(shù)的參數(shù) 提供器14,形成一個(gè)或多個(gè)參數(shù)使得可以使用從多聲道信號和一個(gè)或 多個(gè)參數(shù)中導(dǎo)出的一個(gè)或多個(gè)下混音聲道來形成重構(gòu)多聲道信號。重要的是,本發(fā)明的多聲道編碼器還包括用于產(chǎn)生已編碼的殘留 信號的殘留信號編碼器16。基于原始多聲道信號、 一個(gè)或多個(gè)下混音 聲道或一個(gè)或多個(gè)參數(shù),產(chǎn)生已編碼的殘留信號。通常,產(chǎn)生已編碼 的殘留信號,使得使用殘留信號所形成的重構(gòu)多聲道信號比不使用殘 留信號所形成的重構(gòu)多聲道信號與原始多聲道信號更相似。因此,已 編碼的殘留信號允許解碼器產(chǎn)生具有高于圖11中所示的參數(shù)質(zhì)量閾 值1100的質(zhì)量的重構(gòu)多聲道信號。將一個(gè)或多個(gè)參數(shù)和已編碼的殘留 信號輸入到數(shù)據(jù)流成形器18中,該數(shù)據(jù)流成形器18形成具有殘留信 號和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。優(yōu)選地,由數(shù)據(jù)流成形器18所輸出的 數(shù)據(jù)流是具有包括關(guān)于一個(gè)或多個(gè)參數(shù)的信息的第一增強(qiáng)層以及包括 關(guān)于已編碼的殘留信號的信息的第二增強(qiáng)層的縮放數(shù)據(jù)流。如現(xiàn)有技 術(shù)中已知的,可以單獨(dú)對縮放數(shù)據(jù)流中的不同縮放層進(jìn)行解碼,使得 諸如純參數(shù)編碼器的低水平設(shè)備處于通過簡單地忽略第二增強(qiáng)層來對 縮放數(shù)據(jù)流進(jìn)行解碼的位置。在本發(fā)明的一個(gè)實(shí)施例中,縮放數(shù)據(jù)流還包括作為底層的一個(gè)或 多個(gè)下混音聲道。然而,本發(fā)明還可用于在其中用戶己經(jīng)占有下混音 聲道的環(huán)境。這種情況可以發(fā)生在下混音聲道是單聲道或立體聲信號 時(shí),其中用戶已經(jīng)通過另一個(gè)傳輸聲道或通過相同的傳輸聲道進(jìn)行接 收,但是早于對第一增強(qiáng)層和第二增強(qiáng)層的接收。當(dāng)存在下混音聲道 和第一以及第二增強(qiáng)層的單獨(dú)傳輸時(shí),編碼器不必包括下混音器12。 這種情況由下混音器框中的虛線所表示。此外,參數(shù)提供器14不必基于第一和第二原始聲道對參數(shù)進(jìn)行實(shí)際計(jì)算。在針對特定聲道信號的參數(shù)已經(jīng)存在的情況下,足以向圖 1中的編碼器提供已產(chǎn)生的參數(shù),因此將這些參數(shù)提供給數(shù)據(jù)流成形器18以及殘留信號編碼器,以便可選地用于殘留信號的計(jì)算,并將其 引入縮放數(shù)據(jù)流中。然而,優(yōu)選地,殘留信號編碼器還使用由虛連接 線19所示的參數(shù)。在本發(fā)明的優(yōu)選實(shí)施例中,可以通過單獨(dú)的比特率控制輸入端來 控制殘留信號編碼器16。在這種情況下,殘留信號編碼器包括諸如具 有可控量化器步長的量化器之類的特定有損編碼器。當(dāng)通過比特率輸 入端來發(fā)送大的量化器的步長時(shí),己編碼的殘留信號將具有與通過比 特率控制輸入端來發(fā)送較小的量化器的步長的情況相比的較小的值范 圍(由量化器輸出最大的量化指標(biāo))。較大的量化器的步長將導(dǎo)致對已 編碼的殘留信號的較低比特需求,并因此導(dǎo)致已縮放的數(shù)據(jù)流,與在 其中在殘留信號編碼器16內(nèi)的量化器具較小的量化器步長從而導(dǎo)致 了已編碼的殘留信號需要更多比特的情況相比,該已縮放的數(shù)據(jù)流具 有減少的比特率。嚴(yán)格地說,上述要點(diǎn)適用于標(biāo)量量化。然而,總得來說,使用具 有可控分辨率的基于向量量化技術(shù)的編碼器是優(yōu)選的。當(dāng)分辨率較高 時(shí),與分辨率較低的情況相比,需要更多的比特來對殘留信號進(jìn)行編 碼。圖2示出了本發(fā)明的多聲道解碼器的優(yōu)選實(shí)施例,該多聲道解碼
器可以與圖1中的編碼器一起使用。具體地,圖2示出了用于對具有 一個(gè)或多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號的已 編碼的多聲道信號進(jìn)行解碼。所有這些信息,即下混音聲道、參數(shù)以 及已編碼的殘留信號都包括在被輸入到數(shù)據(jù)流剖析器的縮放數(shù)據(jù)流20中,該數(shù)據(jù)流剖析器從縮放數(shù)據(jù)流20中提取已編碼的殘留信號, 并將已編碼的殘留信號轉(zhuǎn)發(fā)到殘留信號編碼器22中。類似地,將一個(gè) 或多個(gè)已優(yōu)選編碼的下混音聲道提供給下混音解碼器24。此外,將一 個(gè)或多個(gè)己優(yōu)選編碼的參數(shù)提供給參數(shù)解碼器23,以便以已解碼的形 式提供一個(gè)或多個(gè)參數(shù)。將由框22、 23和24所輸出的信息輸入到用 于產(chǎn)生第一重構(gòu)多聲道信號26或第二重構(gòu)多聲道信號27的多聲道解 碼器25中。由多聲道解碼器25通過使用一個(gè)或多個(gè)下混音聲道和一 個(gè)或多個(gè)參數(shù)而不是使用殘留信號來產(chǎn)生第一重構(gòu)多聲道信號。然而, 第二重構(gòu)多聲道信號27是通過使用一個(gè)或多個(gè)下混音聲道和已解碼 的殘留信號來產(chǎn)生的。因?yàn)闅埩粜盘柊硗獾男畔?,?yōu)選地包括波 形信息,所以第二重構(gòu)多聲道信號27比第一重構(gòu)多聲道信號與原始多 聲道信號(例如圖1中的聲道10a和10b)更相似。根據(jù)多聲道解碼器25的特定實(shí)現(xiàn),多聲道解碼器25輸出第一重 構(gòu)聲道26或第二重構(gòu)聲道信號27??蛇x地,除了第二重構(gòu)多聲道信 號之外,多聲道解碼器25還對第一重構(gòu)多聲道信號進(jìn)行計(jì)算。必然地, 在所有的實(shí)現(xiàn)中,當(dāng)縮放數(shù)據(jù)流包括已編碼的殘留信號時(shí),多聲道解 碼器25只輸出第一重構(gòu)多聲道信號。然而,在通過除去第二增強(qiáng)層對 縮放數(shù)據(jù)流按照其方式從編碼器到解碼器進(jìn)行處理時(shí),多聲道解碼器 25將只輸出第一重構(gòu)多聲道信號。這種去除第二增強(qiáng)層可以發(fā)生在編 碼器和解碼器之間存在傳輸聲道時(shí),這具有非常嚴(yán)格限制的帶寬資源, 因此縮放數(shù)據(jù)流的傳輸只在沒有第二增強(qiáng)層時(shí)可能。圖3和圖4示出了本發(fā)明的概念的一個(gè)實(shí)施例,該實(shí)施例在編碼 器側(cè)(圖3)以及解碼器側(cè)(圖4)都只需要減少的處理功率。圖3 中的編碼器包括強(qiáng)度立體聲編碼器30,該強(qiáng)度立體聲編碼器30 —方 面輸出單聲道下混音信號,另一方面輸出參數(shù)強(qiáng)度立體聲的直接信息。 將優(yōu)選地通過添加第一和第二輸入聲道所形成的單聲道下混音輸入數(shù)
據(jù)率減速器31中。對于單聲道下混音聲道,數(shù)據(jù)率減速器31可以包 括任意公知的音頻編碼器,例如MP3編碼器、ACC編碼器或針對單 聲道信號的任意其他音頻編碼器。對于參數(shù)方向信息,數(shù)據(jù)率減速器 31可以包括針對參數(shù)信息的任意已知編碼器,例如差值編碼器、均衡 器和/諸如Huffman編碼器或算術(shù)編碼器之類的熵編碼器。因此,圖3 中的框30和31提供了圖l編碼器中的框12和14所示意性示出的功 能。殘留信號編碼器16包括側(cè)信號計(jì)算器32和隨后所采用的數(shù)據(jù)率 減速器33。側(cè)信號計(jì)算器32對從現(xiàn)有技術(shù)的中側(cè)立體聲編碼器中已 知的幅值信號執(zhí)行計(jì)算。 一個(gè)優(yōu)選示例是對第一聲道10a和第二聲道 10b之間的逐個(gè)樣本的差進(jìn)行計(jì)算,以獲得波形類型的側(cè)信號,然后 將該側(cè)信號輸入針對數(shù)據(jù)率壓縮的數(shù)據(jù)率減速器33中。數(shù)據(jù)率減速器 33可以包括與上面所概述的關(guān)于數(shù)據(jù)率減速器31的相同的元件。在 框33的輸出處獲得已編碼的殘留信號,將該殘留信號輸入數(shù)據(jù)流成形 器18中,從而得到優(yōu)選地縮放的數(shù)據(jù)流?,F(xiàn)在,由框18所輸出的數(shù)據(jù)流包括除了單聲道下混音以外的參 數(shù)強(qiáng)度立體聲方向信息和以波形類型編碼的殘留信號。通過結(jié)合圖1已經(jīng)討論的比特率控制輸入端,可以控制數(shù)據(jù)率減 速器31。在另一個(gè)實(shí)施例中,數(shù)據(jù)率減速器33被設(shè)置用于產(chǎn)生縮放 輸出數(shù)據(jù)流,該數(shù)據(jù)流在其底層以每采樣較少數(shù)量比特進(jìn)行殘留信號 編碼,并且在其第一增強(qiáng)層中以每采樣中等數(shù)量的比特進(jìn)行殘余編碼, 以及在其下一個(gè)增強(qiáng)層中以每采樣較多數(shù)量比特進(jìn)行殘余編碼。對于 數(shù)據(jù)率減速器輸出端的底層,可以使用例如每采樣0.5比特。例如, 針對第一增強(qiáng)層,可以使用例如每采樣4比特,以及對于第二增強(qiáng)層, 可以使用例如每采樣16比特。圖4中示出了相應(yīng)的解碼器。將輸入到數(shù)據(jù)流剖析器21中的數(shù) 據(jù)流解析成單獨(dú)輸出到解壓縮器23的參數(shù)信息。將己編碼的下混音信 息輸入解壓縮器24,并將已編碼的殘留信號輸入到殘留信號解壓縮器 22中。圖4中的解碼器還包括直接的強(qiáng)度立體聲解碼器40,此外還包 括中/側(cè)解碼器41。這兩個(gè)解碼器40和41執(zhí)行多聲道解碼器25的功
能,以便輸出由強(qiáng)度立體聲解碼器40單獨(dú)產(chǎn)生的第一重構(gòu)多聲道信號26,以及輸出由MS解碼器41單獨(dú)產(chǎn)生的第二重構(gòu)多聲道信號27。當(dāng)數(shù)據(jù)流包括已編碼的殘留信號時(shí),圖4中的直接實(shí)現(xiàn)將輸出第 一重構(gòu)多聲道信號26以及第二重構(gòu)多聲道信號。在這種情況下,必然 只有更好的第二重構(gòu)多聲道信號27對用戶是有益的。因此,可以提供 解碼器控制42,以便自動(dòng)檢測數(shù)據(jù)流中是否存在已編碼的殘留信號。 當(dāng)自動(dòng)檢測到數(shù)據(jù)流中沒有這種已編碼的殘留信號時(shí),解碼器控制42 起到了對中側(cè)解碼器40進(jìn)行去激活以節(jié)約處理功率的作用,因此電池 電源在諸如移動(dòng)電話等的低功率手持設(shè)備中尤其有用。圖5示出了本發(fā)明的另一個(gè)實(shí)施例,其中基于合成分析方法產(chǎn)生 了已編碼的殘留信號。此外,將第一和第二聲道10a、 10b輸入下混音 器50,下混音器50后面接著數(shù)據(jù)率減速器51。在框51的輸出處,獲得具有一個(gè)或多個(gè)下混音聲道的優(yōu)選壓縮的下混音信號,并將其提供 給數(shù)據(jù)流成形器18。因此,框50和51提供圖1中的下混音器設(shè)備12 的功能。此外,將第一和第二聲道10a、 10b提供給參數(shù)計(jì)算器53, 并將參數(shù)計(jì)算器所輸出的參數(shù)轉(zhuǎn)發(fā)到用于對一個(gè)或多個(gè)參數(shù)進(jìn)行壓縮 的另一個(gè)數(shù)據(jù)率減速器54。因此,框53和54提供了與圖1中的參數(shù) 提供器14相同的功能。然而,與圖3中的實(shí)施例相比,殘留信號編碼器16更為復(fù)雜。 具體地,殘留信號編碼器16包括參數(shù)多聲道重構(gòu)器55。以兩個(gè)聲道 為例,多聲道重構(gòu)器產(chǎn)生第一重構(gòu)聲道和第二重構(gòu)聲道。因此參數(shù)多 聲道重構(gòu)器只使用下混音聲道和參數(shù),所以由框55所輸出的重構(gòu)多聲 道信號的質(zhì)量將與圖11中的曲線1102相對應(yīng),并始終在圖11中的參 數(shù)閾值1100之下。將重構(gòu)多聲道信號輸入到差錯(cuò)計(jì)算器56中。差錯(cuò)計(jì)算器56還可 用于接收第一和第二輸入聲道10a、 10b,并輸出第一差錯(cuò)信號和第二 差錯(cuò)信號。優(yōu)選地,差錯(cuò)計(jì)算器計(jì)算原始聲道和相應(yīng)的重構(gòu)聲道(輸 出框55)之間的逐個(gè)樣本的差。針對每對原始聲道和重構(gòu)聲道,執(zhí)行 此過程。差錯(cuò)計(jì)算器56的輸出又是多聲道表示,但是此時(shí)與原始聲道 信號相比為多聲道差錯(cuò)信號。將這個(gè)具有與原始聲道信號相同數(shù)量的
聲道的多聲道差錯(cuò)信號輸入用于產(chǎn)生已編碼的殘留信號的殘留信號處理器57中。存在殘留信號處理器57的多個(gè)實(shí)現(xiàn),這些實(shí)現(xiàn)全都取決于帶寬 需求、所需的可縮放度、質(zhì)量需求等。在一個(gè)優(yōu)選實(shí)施例中,殘留信號處理器57再次實(shí)現(xiàn)為用于產(chǎn)生 一個(gè)或多個(gè)差錯(cuò)下混音聲道和差錯(cuò)下混音參數(shù)的多聲道編碼器。因?yàn)?殘留信號處理器57可以包括框50、 51、 53和54,可以認(rèn)為這個(gè)實(shí)施 例是一種迭代多聲道編碼器。可選地,殘留信號處理器57可用于只從其具有最大能量的輸入 信號中選擇單一或兩個(gè)差錯(cuò)聲道,并只對最大能量差錯(cuò)信號進(jìn)行處理, 以獲得已編碼的殘留信號。除了這個(gè)準(zhǔn)則以外或者代替這個(gè)準(zhǔn)則,可 以使用基于可感知的更激發(fā)的差錯(cuò)測量的更先進(jìn)的準(zhǔn)則??蛇x地,殘 留信號處理器可以包括用于將輸入聲道下混音為一個(gè)或多個(gè)下混音聲 道的矩陣化方案,使得相應(yīng)的解碼器設(shè)備可以執(zhí)行模擬解矩陣過程。 然而,可以使用公知的單聲道或立體聲編碼器的元件來對一個(gè)或多個(gè) 下混音聲道進(jìn)行處理,或者可以使用上面所提到的單聲道/立體聲編碼 器中的一個(gè)來對一個(gè)或多個(gè)下混音聲道進(jìn)行完全處理,以獲得已編碼 的殘留信號。圖6中示出了針對圖5中的編碼器的解碼器。與圖2的實(shí)施例相 比,圖6顯示了多聲道解碼器25包括參數(shù)多聲道重構(gòu)器60和合成器 61。參數(shù)多聲道重構(gòu)器60只基于已解碼的下混音和已解碼的參數(shù)信息 來產(chǎn)生第一重構(gòu)多聲道信號26。當(dāng)數(shù)據(jù)流中不包括已編碼的殘留信號 時(shí),可以輸出第一重構(gòu)信號26。然而,當(dāng)數(shù)據(jù)流中包括己編碼的殘留 信號時(shí),則不輸出第一重構(gòu)信號,而是將其輸入到合成器61中,以便 將參數(shù)重構(gòu)的多聲道信號26合成為已解碼的殘留信號,這里已解碼的 殘留信號是在上面所討論的圖5中的差錯(cuò)計(jì)算器56的輸出處的差錯(cuò)表 示的表示之一。合成器61將己解碼的殘留信號(即,差錯(cuò)信號的任意 表示)和參數(shù)重構(gòu)的多聲道信號進(jìn)行合成,以輸出第二重構(gòu)號27。當(dāng) 關(guān)于圖11來考慮圖6中的解碼器時(shí),顯而易見的是,針對特定比特率, 第一重構(gòu)信號具有由線1102所確定的質(zhì)量,而第二重構(gòu)信號27具有
由線1114針對相同比特率所確定的較高的質(zhì)量。因?yàn)橐丫幋a的殘留信號中的冗余減少,所以圖5/圖6中的實(shí)施例 優(yōu)于圖3/圖4中的實(shí)施例。然而,圖5/圖6中的實(shí)施例需要較大量的 處理功率、存儲、電池資源和算法延遲。隨后,參考關(guān)于編碼器表示的圖7以及關(guān)于解碼器表示的圖8, 描述了對圖3/圖4中的實(shí)施例與圖5/圖6中的實(shí)施例之間的優(yōu)選折衷。 該編碼器包括使用第一和第二輸入聲道10a、 10b來執(zhí)行下混音的特定 下混音器74。與只通過添加原始聲道10a、 10b來獲得單聲道信號所 產(chǎn)生的簡單下混音相比,下混音器74由通過參數(shù)計(jì)算器71所產(chǎn)生的 對準(zhǔn)參數(shù)控制。這里,在將兩個(gè)信號彼此相加之前,對兩個(gè)輸入聲道 10a、 10b進(jìn)行相互間的時(shí)間對準(zhǔn)。按照這種方式下,在下混音器70 的輸出處得到特定的單聲道信號,例如該單聲道信號不同于在圖3中 以30示出的低電平強(qiáng)度立體聲編碼器所產(chǎn)生的單聲道信號。除了對準(zhǔn)參數(shù)之外,或代替對準(zhǔn)參數(shù),參數(shù)計(jì)算器71可用于產(chǎn) 生增益參數(shù)。將該增益參數(shù)輸入加權(quán)設(shè)備72中,以便在執(zhí)行側(cè)信號的 計(jì)算之前,優(yōu)選地使用增益參數(shù)對第二聲道10b進(jìn)行加權(quán)。在計(jì)算第 一和第二聲道之間的類似波形差之前,對第二聲道的加權(quán)導(dǎo)致較小的 殘留信號,如圖所示將該殘留信號作為特定側(cè)信號輸入到任何適當(dāng)?shù)?數(shù)據(jù)率減速器33中。圖7中所示的數(shù)據(jù)率減速器33可以完全地實(shí)現(xiàn) 為圖3中所示的數(shù)據(jù)率減速器33。圖7中的實(shí)施例與圖3中的實(shí)施例的不同之處在于優(yōu)選地在下 混音器70以及殘留信號計(jì)算中說明參數(shù)信息,這樣由圖7中的數(shù)據(jù)率 減速器33所輸出的殘留信號可以由比數(shù)據(jù)率減速器33所輸出的信號 更少數(shù)量的比特來表示。這是由于圖7中的殘留信號包括的冗余小于 圖3中的殘留信號所包括的冗余的事實(shí)。圖8示出了與圖7中的編碼器實(shí)現(xiàn)相對應(yīng)的解碼器實(shí)現(xiàn)的優(yōu)選實(shí) 施例。與圖6中的解碼器相比,多聲道重構(gòu)器25可用于在側(cè)信號(即 殘留信號)為零時(shí)自動(dòng)輸出第一重構(gòu)多聲道信號26,或者在殘留信號 不等于零時(shí)自動(dòng)輸出第二重構(gòu)多聲道信號27。因此,圖8中的多聲道 重構(gòu)器25不能同時(shí)輸出兩個(gè)信號26和27,但是可以只輸出這兩個(gè)信
號中的第一個(gè)或這兩個(gè)信號中的第二個(gè)。因此,圖8中的實(shí)施例不需 要諸如圖4中所示的任意解碼器控制。具體地,圖8中的殘留信號解碼器22輸出由圖7中的相應(yīng)的解 碼器元件72所產(chǎn)生的特定側(cè)信號。此外,下混音解碼器24輸出由圖 7中的下混音器70所產(chǎn)生的特定單聲道信號。然后,將特定側(cè)信號和特定單聲道信號與增益參數(shù)以及時(shí)間對準(zhǔn) 參數(shù)一起輸入多聲道解碼器。增益參數(shù)可用于控制增益級84根據(jù)第一 增益規(guī)則來采用增益。此外,增益參數(shù)控制另外的增益級82、 83根據(jù) 不同的第二增益規(guī)則來應(yīng)用增益。此外,多聲道重構(gòu)器包括減法器84 和加法器85以及時(shí)間解對準(zhǔn)框86,以產(chǎn)生重構(gòu)第一聲道和重構(gòu)第二 聲道。隨后,參考圖7和圖8的編碼器/解碼器方案的優(yōu)選實(shí)施例。圖 9a示出了根據(jù)本發(fā)明的方面的完全編碼器/解碼器方案,其中殘余信號 d (n)不等于零。此外,圖9b指示了在沒有計(jì)算差信號d (n)或者 己經(jīng)除去數(shù)據(jù)流以減少殘留信號(例如由于傳輸帶寬相關(guān)的需求)時(shí) 的圖9a中的可縮放的編碼器/解碼器。在圖9a的實(shí)施例中,在從編碼 器傳輸?shù)浇獯a器的數(shù)據(jù)流中除去已編碼的殘留信號的情況下,圖9a 的實(shí)施例變成了純參數(shù)多聲道場景,其中對準(zhǔn)參數(shù)和增益參數(shù)是多聲 道參數(shù),而特定的單聲道信號是從編碼器側(cè)傳輸?shù)浇獯a器側(cè)的下混音 聲道。因?yàn)樵诮獯a器側(cè)沒有接收到殘留信號,即d(n)等于零,則只通 過使用對準(zhǔn)和增益參數(shù)來執(zhí)行解碼器側(cè)的多聲道重構(gòu)。圖9c示出了基于本發(fā)明的編碼器的方程,而圖9d則指示了基于 本發(fā)明的解碼器的方程。具體地,本發(fā)明的編碼器包括作為來自圖1的參數(shù)提供器14 的參數(shù)計(jì)算器71。參數(shù)計(jì)算器71可用于計(jì)算時(shí)間對準(zhǔn)參數(shù),以便將 右聲道r (n)與左聲道l (n)對準(zhǔn)。在圖9a到圖9d中,已對準(zhǔn)的右 聲道由ra (n)表示。優(yōu)選地,從輸入信號的重疊塊中提取出對準(zhǔn)參數(shù)。 該對準(zhǔn)參數(shù)與左聲道和右聲道之間的時(shí)間延遲相對應(yīng),并優(yōu)選地使用 時(shí)間域的互相關(guān)技術(shù)來對該對準(zhǔn)參數(shù)進(jìn)行估計(jì)。針對在子帶中不存在
對準(zhǔn)增益的情況,例如在獨(dú)立信號的情況下,將延遲參數(shù)設(shè)為零。優(yōu) 選地,在子帶結(jié)構(gòu)中,每個(gè)子帶估計(jì)一個(gè)延遲(時(shí)間對準(zhǔn))參數(shù)。在優(yōu)選實(shí)施例中,采用46ms的估定分析率和50%的重疊漢明窗。參數(shù)計(jì)算器71還計(jì)算增益值。該增益值也優(yōu)選地從信號的重疊 塊中提取。自然地,增益參數(shù)與在諸如公知的技術(shù)心理聲學(xué)編碼方案 之類的參數(shù)編碼中普遍使用的電平差參數(shù)??蛇x地,可以使用迭代方 法來計(jì)算增益值,其中將差信號反饋到參數(shù)計(jì)算器中,并且設(shè)置增益 值,使得差信號達(dá)到如圖9a中的虛線90所示的最小值。 一旦計(jì)算了 參數(shù)對準(zhǔn)和增益,則可以開始圖7中的下混音器70以及圖7中的殘留 信號編碼器16。具體地,圖7中的下混音器70包括用于將一個(gè)聲道 延遲所計(jì)算的時(shí)間對準(zhǔn)參數(shù)的對準(zhǔn)框91。然后,使用加法設(shè)備92將 所延遲的第二聲道ra (n)與第一聲道相加。在加法器92的輸出處, 存在下混音聲道。因此,圖7中的下混音器70包括框91和92以形成 特定的單聲道信號。圖7中的殘留信號編碼器16還包括加權(quán)器93和后續(xù)的側(cè)信號計(jì) 算器94,側(cè)信號計(jì)算器94用于計(jì)算原始第一聲道和已對準(zhǔn)且已加權(quán) 的第二聲道之間的差。具體地,為了對已對準(zhǔn)的第二聲道進(jìn)行加權(quán), 執(zhí)行用于相應(yīng)的解碼器側(cè)框80中的第一加權(quán)規(guī)則。因此,殘留信號編 碼器16包括對準(zhǔn)設(shè)備91、加權(quán)設(shè)備93、以及側(cè)信號計(jì)算器94。因?yàn)?將已對準(zhǔn)的第二聲道用于下混音以及殘留信號計(jì)算,對已對準(zhǔn)的右聲 道進(jìn)行一次計(jì)算則足夠,并將結(jié)果轉(zhuǎn)發(fā)到圖7中的下混音器70以及加 權(quán)器/側(cè)信號計(jì)算器72中。優(yōu)選地,選擇對準(zhǔn)和增益因子,使得該處理可逆,因此可以很好 地定義了圖9d中的方程并在數(shù)值對其進(jìn)行了良好的限定??梢詫⑵胀▎温暤谰幋a器51用于對和信號進(jìn)行編碼,并且將優(yōu) 選為專用的殘留信號編碼器33應(yīng)用于殘留信號。當(dāng)單聲道編碼器51是無損耗的,即不再對單聲道信號進(jìn)行量化, 或者殘留信號編碼器也是無損耗的,或者對準(zhǔn)信號模型與源信號完全 匹配時(shí),圖9a中所示的本發(fā)明的編碼結(jié)構(gòu)具有也假設(shè)了對準(zhǔn)和增益參 數(shù)只用于無損耗編碼方案的理想重構(gòu)屬性。 圖9a中的本發(fā)明的系統(tǒng)為可以在如圖11中的線1114所示的幅度 多個(gè)范圍內(nèi)作用于功能下降的方案提供架構(gòu)。具體地,不進(jìn)行殘留信 號編碼,即d(n)-0,則該方案通過只傳輸除了單聲道信號(作為下 混音聲道)以外的對準(zhǔn)和增益參數(shù)(作為多聲道參數(shù))而變成參數(shù)立 體聲編碼。圖9b中示出了這種情況。此外,本發(fā)明的系統(tǒng)具有優(yōu)點(diǎn) 該對準(zhǔn)方法自動(dòng)提出單聲道下混音問題。隨后,參考圖10,圖10將圖9a到9b中所示的本發(fā)明的實(shí)施例 的實(shí)現(xiàn)作為子帶編碼結(jié)構(gòu)示出。將原始左和右聲道輸入分析濾波組 1000中,以得到若干子帶信號。針對每個(gè)子帶信號,使用如圖9a到 9d所示的編碼/解碼方案。在解碼器側(cè),在合成濾波器組1010中對重 構(gòu)子帶信號進(jìn)行合成,以最終到達(dá)全帶重構(gòu)多聲道信號。自然地,對 于每個(gè)子帶,如圖10中的箭頭1020所示,將對準(zhǔn)參數(shù)和增益參數(shù)從 編碼器側(cè)傳輸?shù)浇獯a器側(cè)。圖10中的子帶編碼結(jié)構(gòu)的優(yōu)選實(shí)現(xiàn)是基于具有兩個(gè)級的余弦調(diào) 制的濾波器組,以便實(shí)現(xiàn)不相等的子帶帶寬(以可感知的激發(fā)尺寸)。 第一級將信號分割成M個(gè)子帶。對M個(gè)子帶信號進(jìn)行重要的抽取, 并將其饋入第二級濾波器組。第二級的第k個(gè)濾波器具有Mk個(gè)頻帶,ke{l.....M}。在優(yōu)選實(shí)現(xiàn)中,使用M:8個(gè)頻帶,子子帶的結(jié)構(gòu)如圖10中的表所示,并在兩個(gè)級之后優(yōu)選地導(dǎo)致36個(gè)有效子帶。根據(jù) [13],設(shè)計(jì)在抑制頻帶具有至少100dB衰減的原型濾波器。第一級的 濾波器階數(shù)為116,第二級的最大濾波器階數(shù)為256。然后,將此編碼 結(jié)構(gòu)應(yīng)用于子帶對(與左和右子帶聲道相對應(yīng))。第一和第二級濾波器組之間的子帶的相應(yīng)組如圖10右邊的表所 示,可以清楚地看出第一子帶k包括16個(gè)子子帶。此外,第二子帶包 括8個(gè)子子帶等。利用高斯模型(GM)向量量化(VQ)技術(shù)來實(shí)現(xiàn)有效的參數(shù)編 碼?;贕M模型的量化在語音編碼[14-16]領(lǐng)域內(nèi)非常普遍,并且有 利于高尺寸VQ的低復(fù)雜度的實(shí)現(xiàn)。在優(yōu)選實(shí)施例中,本發(fā)明對增益 和延遲參數(shù)的36維向量進(jìn)行向量量化。所有的GM模型都具有16個(gè) 混合分量,并在從60分鐘的音頻數(shù)據(jù)(具有變化的內(nèi)容,并與隨后的
估計(jì)測試信號分開)中提取的參數(shù)的數(shù)據(jù)庫中進(jìn)行訓(xùn)練。基于清楚的 統(tǒng)計(jì)模型的方法在音頻編碼中比在語音編碼中要不經(jīng)常使用。 一個(gè)原 因是不相信統(tǒng)計(jì)模型能夠捕捉通用音頻中所包含的所有相關(guān)信息的能 力。然而在優(yōu)選情況下,通過使用對參數(shù)模型的開和閉測試流程的初 步估計(jì)確實(shí)表示了在這種情況下上述并不成問題。針對增益和延遲參數(shù)所產(chǎn)生的比特率是2.3kbps。將子帶結(jié)構(gòu)充分用于對殘留信號進(jìn)行編碼。通過使用如上述所描述的相同塊,估計(jì)每個(gè)子帶中的變化,并使用GMVQ互子帶來對該 變化進(jìn)行向量量化(即,每次對一個(gè)36維的向量進(jìn)行編碼)。該變化 有利于采用貪婪比特分配算法[17、 p.234]在子帶之間進(jìn)行比特分配。 然后使用統(tǒng)一的標(biāo)量量化來對子帶信號進(jìn)行編碼。通過對塊估計(jì)的線性內(nèi)插,得到瞬時(shí)增益g (n)和延遲r (n)。 基于對脈沖響應(yīng)的正弦函數(shù)的截?cái)嗖⒓訚h明窗,通過73rd階的分?jǐn)?shù)延 遲濾波器來實(shí)現(xiàn)時(shí)間變化延遲。通過使用內(nèi)插的延遲差數(shù),基于每個(gè) 樣本來更新濾波器的系數(shù)。提出了針對通用音頻中的立體聲圖像的靈活編碼的架構(gòu)。通過使 用新的結(jié)構(gòu),可以從參數(shù)立體聲模式無縫地移到波形近似編碼。使用 未編碼的殘留信號來對該思想的示例實(shí)現(xiàn)進(jìn)行測試,以估計(jì)殘留信號 編碼器的比特率的增長效應(yīng),以及使用MP3核心編碼器來估計(jì)更實(shí)際 的場景中的方案。.為了使立體聲圖像穩(wěn)定,優(yōu)選地對純參數(shù)系統(tǒng)或可縮放系統(tǒng)中的 參數(shù)進(jìn)行低通濾波,該純參數(shù)系統(tǒng)或可縮放系統(tǒng)具有純參數(shù)部分,可 以如示例[9]所進(jìn)行的由解碼器未對殘余信號進(jìn)行處理來使用該純參 數(shù)部分。這減少了系統(tǒng)的對準(zhǔn)增益。通過使用標(biāo)量子帶編碼對殘留信 號進(jìn)行編碼,經(jīng)一步增大了質(zhì)量,并且質(zhì)量接近透明質(zhì)量。具體地, 通過向殘留信號增加比特來穩(wěn)定立體聲圖像,而且還增加了立體聲寬 度。此外,優(yōu)選地使用靈活的時(shí)間分割以及可變速率(例如,比特貯 備)技術(shù)來更好地利用通用音頻的動(dòng)態(tài)特性。優(yōu)選地,相干參數(shù)包括 在對準(zhǔn)濾波器中,以增強(qiáng)參數(shù)模式。改進(jìn)的殘留信號編碼、采用知覺 掩蔽、向量量化、以及差分編碼,導(dǎo)致更有效的不相干以及冗余去除。
雖然在立體聲編碼的上下文以及參數(shù)增強(qiáng)的中側(cè)編碼方案的上 下文中對本發(fā)明的系統(tǒng)進(jìn)行了描述,這里要注意的是,諸如通用強(qiáng)度 立體聲類型的編碼之類的每個(gè)多聲道參數(shù)編碼/解碼方案,可以利用另外公開的側(cè)信號元件,以便最終達(dá)到理想的重構(gòu)屬性。雖然已經(jīng)通過 使用編碼器側(cè)的時(shí)間對準(zhǔn)、傳輸對準(zhǔn)參數(shù)、以及使用解碼器側(cè)的時(shí)間 解對準(zhǔn)來對本發(fā)明的編碼器/解碼器方案的優(yōu)選實(shí)施例進(jìn)行了描述,但 還是存在另外的可選項(xiàng),該可選項(xiàng)在編碼器側(cè)執(zhí)行時(shí)間對準(zhǔn)以產(chǎn)生小 的差信號,但是不在解碼器側(cè)執(zhí)行時(shí)間解對準(zhǔn),因此不將對準(zhǔn)參數(shù)從 編碼器傳輸?shù)浇獯a器。在本實(shí)施例中,時(shí)間解對準(zhǔn)的忽略必然包括人 為現(xiàn)象。然而,在大多數(shù)情況下,這種人為現(xiàn)象并不嚴(yán)重,因此這個(gè) 實(shí)施例尤其適于低價(jià)多聲道解碼器。因此,還可以將本發(fā)明看作優(yōu)選的BCC類型的參數(shù)立體聲編碼方案或任意其他多聲道編碼方案的縮放,當(dāng)去除已編碼的殘留信號時(shí), 其完全回退到純參數(shù)方案。根據(jù)本發(fā)明,通過傳輸各種類型的額外信 息來增強(qiáng)純參數(shù)系統(tǒng),額外信息優(yōu)選地包括波形類型的殘留信號、增 益參數(shù)和/或時(shí)間對準(zhǔn)參數(shù)。因此,使用額外信息的解碼操作導(dǎo)致比可 單獨(dú)用于參數(shù)技術(shù)更高的質(zhì)量。根據(jù)需求,用于編碼或解碼的本發(fā)明的方法可以在硬件、軟件或 固件上實(shí)現(xiàn)。因此,本發(fā)明還涉及一種用于存儲程序代碼的計(jì)算機(jī)可 讀介質(zhì),在計(jì)算機(jī)上運(yùn)行該程序代碼時(shí),該程序代碼導(dǎo)致本發(fā)明方法 之一。因此,本發(fā)明是具有程序代碼的計(jì)算機(jī)程序,該程序代碼在計(jì) 算機(jī)上運(yùn)行時(shí)導(dǎo)致本發(fā)明的方法。
參考文獻(xiàn)列表[I] J.D. Johnston and A.J. Ferreira, .Sum-difference stereo transform coding," in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 1992, vol. 2, pp. 569.572.[2] R. Waal and R. Veldhuis, .Subband coding of stereophonic digitalaudio signals," in Proc. IEEE Int. Conf. Acoust-, Speech, SignalProcessing (ICASSP), 1991, pp. 3601.3604. [3] J. Herre, K. Brandenburg, and D. Lederer, .Intensity stereocoding," in Preprint 3799, 96th AES Convention, 1994. [4] K. Brandenburg, .MP3 and AAC explained," in Proc. of the AES17th International Conference, paper no. 17-009, 1999. [5] J. Blauert, Spatial hearing: the psychophysics of human soundlocalization, The MIT Press, Cambridge, Massachusetts, 1997. [6] H. Fuchs, .Improving joint stereo audio coding by adaptiveinter-channel prediction," in Proc. of IEEE Workshop onApplications of Signal Processing to Audio and Acoustics, 1993,pp. 39.42.[7] H. Fuchs, .Improving MPEG audio coding by backward adaptive linear stereo prediction," in Preprint 4086, 99th AES Convention, 1995.[8] F. Baumgarte and C. Faller, .Binaural cue coding, part I:Psychoacoustic fundamentals and design principles," IEEE Trans.Speech Audio Processing, vol. 11, no. 6, pp. 509.519, 2003. [9] C. Faller and F. Baumgarte, .Binaural cue coding, part II: Schemesand applications," IEEE Trans. Speech Audio Processing, vol. 11,no. 6, pp. 520.531, 2003. [10]C. Faller, Parametric Coding of Spatial Audio, Ph.D. thesis, EcolePolytechnique Federale de Lausanne, 2004.[II] J. Breebaart, S. van de Par, A. Kohlrausch, and E. Schuijers,"High-quality parametric spatial audio coding at low bitrates," in Preprint 6072, 116th AES Convention, 2004. [12] J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, and C. Spenger, .MP3 surround: Efficient and compatible coding of multi-channel audio," in Preprint 6049, 116th AES Convention, 2004.[13]Y-P. Lin and P.P. Vaidyanaythan, .A Kaiser window approach forthe design of prototype filters of cosine modulated filterbanks,"IEEE Signal Processing Letters, vol. 5, no. 6, pp. 132.134, 1998. [14]P. Hedelin and J. Skoglund, "Vector quantization based onGaussian mixture models," IEEE Trans. Speech Audio Processing,vol. 8, no. 4, pp. 385,401, 2000. [15]A.D. Subramaniam and B.D. Rao, .PDF optimized parametricvector quantization of speech line spectral frequencies," IEEETrans. Speech Audio Processing, vol. 11, no. 2, pp. 130.142, 2003. [16]J. Lindblom and P. Hedelin, .Variable-dimension quantization ofsinusoidal amplitudes using Gaussian mixture models," in Proc.IEEE Int. Conf. A謹(jǐn)st., Speech, Signal Processing (ICASSP),2004, vol. l,pp. 153.156. [17]A. Gersho and R. M. Gray, Vector Quantization and SignalCompression, Kluwer Academic Publishers, Boston, 1992. [18]T.I. Laakso, V. Valim汪ki, M. Karjalainen, and U.K. Laine, "Toolsfor fractional delay filter design," IEEE Signal ProcessingMagazine, pp. 30.60, January 1996. [19]ITU-R Recommendation BS.1534, Method for the SubjectiveAssessment of Intermediate Quality Level of Coding Systems,ITU-T, 2001.[20]The LAME project, http:〃lame.sourceforge.net/, July 2004, v3.96丄
權(quán)利要求
1.一種多聲道編碼器,用于對具有至少兩個(gè)聲道的原始多聲道信號進(jìn)行編碼,所述多聲道編碼器包括參數(shù)提供器,用于提供一個(gè)或多個(gè)參數(shù),形成所述一個(gè)或多個(gè)參數(shù),使得可以使用從多聲道信號和一個(gè)或多個(gè)參數(shù)中獲得的一個(gè)或多個(gè)下混音聲道來形成重構(gòu)多聲道信號;殘留信號編碼器,用于基于原始多聲道信號、一個(gè)或多個(gè)下混音聲道、或一個(gè)或多個(gè)參數(shù)來產(chǎn)生已編碼的殘留信號,使得使用殘留信號所形成的重構(gòu)多聲道信號比沒有使用殘留信號所形成的重構(gòu)多聲道信號與原始多聲道信號更相似;以及數(shù)據(jù)流成形器,用于形成具有殘留信號和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。
2. 如權(quán)利要求1所述的多聲道編碼器,其中所述數(shù)據(jù)流成形器 用于形成可縮放數(shù)據(jù)流,其中一個(gè)或多個(gè)參數(shù)和殘留信號處于不同的 縮放層。
3. 如權(quán)利要求1所述的多聲道編碼器,其中所述殘留信號編碼 器用于將已編碼的殘留信號作為波形殘留信號進(jìn)行計(jì)算。
4. 如權(quán)利要求1所述的多聲道編碼器,其中所述殘留信號編碼 器用于基于一個(gè)或多個(gè)參數(shù)和原始多聲道信號而非一個(gè)或多個(gè)下混音 聲道來產(chǎn)生殘留信號,因此與沒有使用一個(gè)或多個(gè)參數(shù)的殘留信號的 產(chǎn)生相比,所述殘留信號具有較小的能量。
5. 如權(quán)利要求4所述的多聲道編碼器,其中所述參數(shù)提供器包括對準(zhǔn)計(jì)算器,用于計(jì)算將要提供給用于對至少兩個(gè)聲道中的第一 聲道和第二聲道進(jìn)行對準(zhǔn)的時(shí)間對準(zhǔn)器的時(shí)間對準(zhǔn)參數(shù);或者增益計(jì)算器,計(jì)算用于對聲道進(jìn)行加權(quán)的不等于1的增益,使得 兩個(gè)聲道之間的差與增益值1相比減少。
6. 如權(quán)利要求5所述的多聲道編碼器,其中所述殘留信號編碼 器用于對從第一聲道和己對準(zhǔn)或已加權(quán)的第二聲道中獲得的差信號進(jìn) 行計(jì)算和編碼。
7. 如權(quán)利要求5所述的多聲道編碼器,還包括使用己對準(zhǔn)的聲 道來產(chǎn)生下混音聲道的下混音器。
8. 如權(quán)利要求1所述的多聲道編碼器,還包括用于將多聲道信 號分割成多個(gè)頻帶的分析濾波器組,其中所述參數(shù)提供器和殘留信號編碼器用于對子帶信號進(jìn)行操 作,以及其中所述數(shù)據(jù)流成形器用于收集針對多個(gè)頻帶的已編碼的殘留 信號和參數(shù)。
9. 如權(quán)利要求1所述的多聲道編碼器,其中所述殘留信號編碼 器還包括多聲道解碼器,通過使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參 數(shù)來產(chǎn)生已解碼的多聲道信號;差錯(cuò)計(jì)算器,用于基于已解碼的多聲道信號和原始多聲道信號來 計(jì)算多聲道差錯(cuò)信號表示;以及殘留信號處理器,用于對多聲道差錯(cuò)信號表示進(jìn)行處理,以獲得 己編碼的殘留信號。
10. 如權(quán)利要求9所述的多聲道編碼器,其中所述殘留信號處理 器包括用于產(chǎn)生多聲道差錯(cuò)信號表示的多聲道表示的多聲道編碼器。
11. 如權(quán)利要求IO所述的多聲道編碼器,其中所述殘留信號處 理器還用于產(chǎn)生多聲道差錯(cuò)信號表示的一個(gè)或多個(gè)下混音聲道。
12. 如權(quán)利要求1所述的多聲道編碼器,其中所述參數(shù)提供器用 于提供技術(shù)心理聲學(xué)編碼(BCC)參數(shù),例如聲道間電平差、聲道間 相干參數(shù)、聲道間時(shí)間差或聲道包絡(luò)提示。
13. —種用于對具有至少兩個(gè)聲道的原始多聲道信號進(jìn)行編碼 的方法,所述方法包括以下步驟-提供一個(gè)或多個(gè)參數(shù),形成所述一個(gè)或多個(gè)參數(shù),使得可以使用 從多聲道信號和一個(gè)或多個(gè)參數(shù)中所獲得的一個(gè)或多個(gè)下混音聲道來 形成重構(gòu)多聲道信號; 基于原始多聲道信號、 一個(gè)或多個(gè)下混音聲道、或一個(gè)或多個(gè)參 數(shù)來產(chǎn)生已編碼的殘留信號,使得使用殘留信號所形成的重構(gòu)多聲道 信號比沒有使用殘留信號所形成的重構(gòu)多聲道信號與原始多聲道信號 更相似;以及形成具有殘留信號和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。
14. 一種多聲道解碼器,用于對具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)和已編碼的殘留信號的已編碼多聲道信號進(jìn)行解碼,所 述多聲道解碼器包括殘留信號解碼器,用于基于已編碼的殘留信號,產(chǎn)生已解碼的殘 留信號;以及多聲道解碼器,通過使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參 數(shù)來產(chǎn)生第一重構(gòu)多聲道信號;其中代替第一重構(gòu)多聲道信號或除了第一多聲道信號以外,所述 多聲道解碼器還用于通過使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留 信號來產(chǎn)生第二重構(gòu)多聲道信號,其中所述第二重構(gòu)多聲道信號比所述第一重構(gòu)多聲道信號與原 始多聲道信號更相似。
15. 如權(quán)利要求14所述的多聲道解碼器,其中所述已編碼的多 聲道信號由己縮放的數(shù)據(jù)流表示,所述已縮放的數(shù)據(jù)流具有包括一個(gè) 或多個(gè)參數(shù)的第一縮放層以及包括已編碼的殘留信號的第二縮放層,其中所述多聲道編碼器還包括數(shù)據(jù)流剖析器,用于提取第一縮放層或第二縮放層。
16. 如權(quán)利要求14所述的多聲道解碼器, 其中所述已編碼的殘留信號取決于一個(gè)或多個(gè)參數(shù);以及 其中所述多聲道解碼器用于使用一個(gè)或多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù)以及已解碼的殘留信號來產(chǎn)生第二重構(gòu)多聲道信號。
17. 如權(quán)利要求14所述的多聲道解碼器, 其中所述下混音聲道取決于對準(zhǔn)參數(shù)或增益參數(shù),以及 其中所述多聲道解碼器用于使用基于增益參數(shù)的第一加權(quán)規(guī)則來對下混音聲道進(jìn)行加權(quán),以及通過使用增益參數(shù)的第二加權(quán)規(guī)則來 對下混音聲道進(jìn)行加權(quán),或者針對使用對準(zhǔn)參數(shù)的其他輸出聲道,對一個(gè)輸出聲道進(jìn)行解對準(zhǔn)。
18. 如權(quán)利要求14所述的多聲道解碼器,其中下混音聲道取決 于對準(zhǔn)參數(shù)或增益參數(shù),以及其中所述多聲道解碼器用于使用增益參數(shù)對下混音聲道進(jìn)行加權(quán),將己解碼的殘留信號加到已加權(quán)的下混音聲道中,并再次對所產(chǎn) 生的聲道進(jìn)行加權(quán),以獲得第一多聲道輸出聲道,從下混音聲道中減去已解碼的殘留信號,并使用增益參數(shù)對所產(chǎn) 生的聲道進(jìn)行加權(quán),或者對下混音聲道和己解碼的殘留信號之間的差進(jìn)行解對準(zhǔn),以獲得 第二多聲道輸出信號。
19. 如權(quán)利要求14所述的多聲道解碼器,其中所述參數(shù)包括技 術(shù)心理聲學(xué)編碼(BCC)參數(shù),例如聲道間電平差、聲道間相干參數(shù)、 聲道間時(shí)間差或聲道包絡(luò)提示,以及其中所述多聲道解碼器用于根據(jù)技術(shù)心理聲學(xué)編碼(BCC)方案 來執(zhí)行多聲道解碼操作。
20. 如權(quán)利要求14所述的多聲道解碼器,其中一個(gè)或多個(gè)下混 音聲道、一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號由子帶專用數(shù)據(jù)表示, 所述多聲道解碼器還包括合成濾波器組,用于對由多聲道解碼器所產(chǎn)生的重構(gòu)子帶數(shù)據(jù)進(jìn) 行合成,以獲得第一或第二重構(gòu)多聲道信號的全頻帶表示。
21. —種用于對具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)以 及已編碼的殘留信號的已編碼的多聲道信號進(jìn)行解碼的方法,所述方 法包括基于已編碼的殘留信號,產(chǎn)生已解碼的殘留信號;以及 通過使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來產(chǎn)生第一 重構(gòu)多聲道信號,或者通過使用一個(gè)或多個(gè)下混音聲道和已解碼的殘 留信號來產(chǎn)生第二重構(gòu)多聲道信號,其中所述第二重構(gòu)多聲道信號比 所述第一重構(gòu)多聲道信號與原始多聲道信號更相似。
22. —種多聲道編碼器,用于對具有至少兩個(gè)聲道的原始多聲道信號進(jìn)行編碼,所述多聲道編碼器包括時(shí)間對準(zhǔn)器,用于使用對準(zhǔn)參數(shù),對至少兩個(gè)聲道的第一聲道和 第二聲道進(jìn)行對準(zhǔn);下混音器,用于使用已對準(zhǔn)的聲道來產(chǎn)生下混音聲道;增益計(jì)算器,用于計(jì)算不等于1的增益參數(shù),以便對已對準(zhǔn)的聲 道進(jìn)行加權(quán),因此已對準(zhǔn)的聲道之間的差與增益值l相比減少;以及數(shù)據(jù)流成形器,用于形成具有關(guān)于下混音聲道的信息、關(guān)于對準(zhǔn) 參數(shù)的信息、以及關(guān)于增益參數(shù)的信息的數(shù)據(jù)流。
23. 如權(quán)利要求20所述的多聲道編碼器,還包括用于對從第一 聲道和己對準(zhǔn)且已加權(quán)的第二聲道中獲得的差信號進(jìn)行計(jì)算和編碼,其中所述數(shù)據(jù)流成形器還用于將已編碼的殘留信號包括進(jìn)數(shù)據(jù) 流中。
24. —種多聲道解碼器,用于對具有關(guān)于一個(gè)或多個(gè)下混音聲道 的信息、關(guān)于增益參數(shù)的信息、以及關(guān)于對準(zhǔn)參數(shù)的信息的已編碼的 多聲道信號進(jìn)行解碼,所述多聲道解碼器包括下混音聲道解碼器,用于產(chǎn)生已解碼的下混音信號; 處理器,用于使用增益參數(shù)對己解碼的下混音聲道進(jìn)行處理,以 獲得第一已解碼的輸出聲道,以及用于使用增益參數(shù)對已解碼的下混 音聲道進(jìn)行處理,以及使用對準(zhǔn)參數(shù)進(jìn)行解對準(zhǔn),以獲得第二已解碼 的輸出聲道。
25. 如權(quán)利要求23所述的多聲道解碼器,其中所述已編碼的多 聲道信號還包括已編碼的殘留信號,所述多聲道解碼器還包括殘留信號解碼器,用于產(chǎn)生己解碼的殘留信號,以及 其中所述處理器用于使用增益參數(shù)對下混音聲道進(jìn)行第一次加 權(quán),以添加已解碼的殘留信號;使用增益參數(shù)進(jìn)行第二次加權(quán),以獲 得第一重構(gòu)聲道,以及從加權(quán)之前的下混音聲道中減去己解碼的殘留 信號,以進(jìn)行解對準(zhǔn),獲得第二重構(gòu)聲道。
26. —種對具有至少兩個(gè)聲道的原始多聲道信號進(jìn)行編碼的方 法,所述方法包括-使用對準(zhǔn)參數(shù)對至少兩個(gè)聲道的第一聲道和第二聲道進(jìn)行時(shí)間對準(zhǔn);使用已對準(zhǔn)的聲道來產(chǎn)生下混音聲道;計(jì)算不等于l的增益參數(shù),以便對已對準(zhǔn)的聲道進(jìn)行加權(quán),因此 與增益值l相比,減少已對準(zhǔn)的聲道之間的差;以及形成具有關(guān)于下混音聲道的信息、關(guān)于對準(zhǔn)參數(shù)的信息、以及關(guān) 于增益參數(shù)的信息的數(shù)據(jù)流。
27. —種用于對具有關(guān)于一個(gè)或多個(gè)下混音聲道的信息、關(guān)于增 益參數(shù)的信息、以及關(guān)于對準(zhǔn)參數(shù)的信息的已編碼的多聲道信號進(jìn)行 解碼的方法,所述方法包括產(chǎn)生已解碼的下混音信號;通過使用增益參數(shù)對己解碼的下混音聲道進(jìn)行處理,以獲得第一 已解碼的輸出聲道,以及通過使用增益參數(shù)和基于對準(zhǔn)參數(shù)的解對準(zhǔn), 對己解碼的下混音聲道進(jìn)行處理,以獲得第二己解碼的輸出聲道。
28. —種已編碼的多聲道信號,具有關(guān)于一個(gè)或多個(gè)下混音聲 道、關(guān)于在第一重構(gòu)多聲道信號中與一個(gè)或多個(gè)下混音聲道合成所產(chǎn) 生的一個(gè)或多個(gè)參數(shù)、以及關(guān)于在第二重構(gòu)多聲道信號中與一個(gè)或多 個(gè)下混音聲道合成所產(chǎn)生的己編碼的殘留信號的信息,其中所述第二 重構(gòu)多聲道信號比所述第一重構(gòu)多聲道信號與原始多聲道信號更相 似。
29. —種計(jì)算機(jī)程序,用于在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行對具有一個(gè)或 多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號的己編碼的 多聲道信號進(jìn)行解碼的方法,所述方法包括以下步驟基于已編碼的殘留信號,產(chǎn)生已解碼的殘留信號;以及 通過使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來產(chǎn)生第一 重構(gòu)多聲道信號,或者通過使用一個(gè)或多個(gè)下混音聲道和已解碼的殘 留信號來產(chǎn)生第二重構(gòu)多聲道信號,其中所述第二重構(gòu)多聲道信號比 所述第一重構(gòu)多聲道信號與原始多聲道信號更相似。
全文摘要
多聲道編碼器/解碼器方案優(yōu)選地另外產(chǎn)生波形類型的殘留信號(16)。將所述殘留信號(16)與一個(gè)或多個(gè)多聲道參數(shù)(14)一起傳輸?shù)浇獯a器中。與純參數(shù)多聲道解碼器相比,增強(qiáng)型解碼器由于另外的殘留信號而產(chǎn)生具有改進(jìn)的輸出質(zhì)量的多聲道輸出信號。
文檔編號G10L19/00GK101120615SQ200580048291
公開日2008年2月6日 申請日期2005年10月4日 優(yōu)先權(quán)日2005年2月22日
發(fā)明者約納斯·林德布羅姆 申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會