適應性殘余音頻編碼的制作方法

文檔序號：2830028閱讀：322來源：國知局

專利名稱：適應性殘余音頻編碼的制作方法
技術領域：
本發(fā)明與音頻信號的編碼與解碼有關，特別是與音頻通道對的有效高質量編碼有關。
背景技術：
最近，隨著利用像是衛(wèi)星或地面數字音頻或視頻廣播所進行的壓縮音頻或視頻內容數字分發(fā)的廣泛使用，使得有效高質量編碼的音頻信號變的愈來愈重要。舉例而言，已知的MP3技術，允許遍及因特網或其它具有有限的帶寬傳送通道的音頻標題的方便傳送。除MP3以外，許多其它音頻編碼結構的目標，都是將給定壓縮比例或比特率下的音頻質量最大化。在PCT/SE02/01372的"Efficient and scalable Parametric Stereo Coding for Low Bit rate Audio Coding Application"中己經證明當附加地使用一種通常稱為"空間信號(spatial cue)"的立體聲信號的緊湊表示時，可以從單聲道信號重新建立幾乎與基礎的原始立體聲圖像非常類似的立體聲信號。此公開的原則是將該立體聲輸入信號分至頻帶中，并為了每個頻帶分別估計稱為通道間強度差(IID)與通道間相干性(ICC)的參數。第一參數描述在特定頻帶中兩個通道之間的功率分布測量，而第二參數描述兩個通道之間相關性的估計。在"High-Quality Parametric Spatial Audio Coding at Low Bitrates"， J. Breebaart, S. van de Par, A. Kohlrausch禾口 E. Schuijers, Proc. 116th AES會議，柏林(德國)，2004年5月8-11日中可以獲得更完整的空間參數敘述。根據這些空間信號，將立體聲輸入信號適應性地組合為單聲道信號。對空間信號與單聲道信號兩者進行編碼，并將編碼后的表示多路復用至比特流中，接著傳送至解碼器。在解碼器側，通過根據IID數據在兩輸出通道之間分布單聲道信號能量，并通過加入保
留如由ICC參數所描述的原始立體聲通道的通道相關性的去相關信號，以從所述單聲道信號中重新建立該立體聲圖像。當可以利用更多的傳送帶寬時，可以通過以所傳送的殘余信號取代解碼器中的去相關性單聲道信號，以獲得較高的音頻質量。也就是說，需要將附加的殘余信號傳送至該解碼器。在對立體聲信號通道的和與差進行編碼、而并非對左通道與右通道進行直接編碼的中-側(MS)編碼(mid-side coding)的情況中也是如此。在"Sum-difference stereo transform coding", Proc. Int. Conf. Acoust. Speech Signal Process (ICASSP), San Francisco, USA, 1992, pp. II 569-572中，可獲得對于MS 技術的描述。MS編碼是根據立體聲信號的左與右通道可能具有相當高的相似程度的發(fā)現。因此，在大多時間中，左通道與右通道之差在大多數時間只產生具有較低強度的信號，換言之，差信號的振幅將相當的小。因此，當對差信號進行編碼時，可節(jié)約大量的比特率，因為描述了所述差信號的參數可以被粗略地量化。當進行編碼時，所述和信號顯然將需要大概與所述單個左通道或右通道相同的帶寬。因此，當利用MS編碼方案時，總體上而言可節(jié)約大量的帶寬。當在左通道與右通道之間存在大強度差時，MS技術存在限制，因為差通道也明顯地包含大量能量，并因此需要較高的帶寬。然而可以注意的是，由于高編碼成本的因素，在規(guī)則的立體聲編碼實施方式中，在這種情況下并不使用MS編碼。在那些情況中，有利的情況是可以根據已經編碼的原始音頻通道所具備的強度，在一般立體聲編碼與所述MS編碼之間進行切換。通過發(fā)明具有描述了由兩立體聲通道組合而成的兩中間通道的組成的矩陣元素的解碼器旋轉矩陣，來代替構建要進行編碼的兩立體聲通道的和與差的靜態(tài)概念，便可以克服上述的問題。所述矩陣元素取決于參數化立體聲參數，該參數化立體聲參數是從立體聲信號的左與右通道中所提取的。適應性殘余編碼能夠動態(tài)地使用于產生中間通道的所述組合規(guī)則適于當前信號的屬性，以通過MS編碼獲得明顯的性能增益。從所述參數化立體聲參數中選擇稱為旋轉矩陣的矩陣元素的適合的相關性，便可以實現使差通道中的能量盡可能的最小化，如同在歐洲申請專利申請EP 04103168.3中已經提到的。當引入了旋轉矩陣以將所述(下混音或上混音)立體聲信號轉換為信號m與s (中間信號，換言之，下混音信號m與殘余信號s)時，對于所述方法而言，重要的是所述旋轉矩陣(解碼器旋轉矩陣與編碼器旋轉矩陣)必須受到限制。這意味著所述矩陣之中的矩陣元素不會在可能的參數化立體聲編碼參數完整范圍之中發(fā)散至無限大。換句話說，必須要限制這兩個旋轉矩陣，從而在所述矩陣條件數量足夠小以至于對于所述參數化立體聲編碼參數完整范圍而言可以允許進行無疑的矩陣轉換，而這并非在現有技術中所實現的情況。發(fā)明內容本發(fā)明的目標是提供一種高質量音頻編碼的概念，該高質量音頻編碼形成了音頻信號的一種高度壓縮表示，并同時有效避免了由編碼或解碼引入的人工信號(artefact)。根據本發(fā)明的第一方面，此目標是通過一種用以對具有至少兩個通道的音頻信號進行編碼的音頻編碼器所實現，所述音頻編碼器包括參數提取器，用以從音頻信號導出空間參數，其中所述空間參數描述所述至少兩個通道之間的相互關系；限制器，用以利用限制規(guī)則限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及下混音器，用以利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號。根據本發(fā)明的第二方面，此目標是通過一種音頻解碼器所實現，所述音頻解碼器用以對表示具有至少兩個通道原始音頻信號的編碼音頻信號進行解碼，所述編碼音頻信號具有下混音信號、殘余信號與描述所述至少兩個通道之間相互關系的空間參數，所述音頻解碼器包括-限制器，用以利用一種限制規(guī)則限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及上混音器，用以利用取決于所述限制后的空間參數的上混音
規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。根據本發(fā)明的第三方面，此目標是通過一種用于對具有至少兩個通道的音頻信號進行編碼的方法所實現，所述方法包括從所述音頻信號導出空間參數，其中所述空間參數描述了在所述至少兩個通道之間的相互關系；利用限制規(guī)則限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號。根據本發(fā)明的第四方面，此目標是通過一種用以對表示具有至少兩個通道原始音頻信號的編碼音頻信號進行解碼的方法所實現，所述編碼音頻信號具有下混音信號、殘余信號與描述所述至少兩個通道之間相互關系的空間參數，所述方法包括利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。根據本發(fā)明的第五方面，此目標是通過一種傳送器或音頻記錄器所實現，其具有用以對具有至少兩個通道的音頻信號進行編碼的音頻編碼器，所述傳送器或音頻記錄器包括參數提取器，用以從所述音頻信號導出空間參數，其中所述空間參數描述了在所述至少兩個通道之間的相互關系；限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及下混音器，用以利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號。根據本發(fā)明的第六方面，此目標是通過一種接收器或音頻播放器所實現，其具有用以對表示具有至少兩個通道的原始音頻信號的編碼音頻信號進行解碼的音頻解碼器，所述編碼音頻信號具有下混音信號、殘余信號與描述所述至少兩個通道之間相互關系的空間參數，所述接收器或音頻播放器包括限制器，用以利用限制規(guī)則來限制所述空間
參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及上混音器，用以利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。根據本發(fā)明的第七方面，此目標是通過一種進行傳送或音頻記錄的方法所實現，所述方法具有產生編碼信號的方法，所述方法包括用于對具有至少兩個通道的音頻信號進行編碼的方法，所述方法包括從所述音頻信號導出空間參數，其中所述空間參數描述在所述至少兩個通道之間的相互關系；利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號。根據本發(fā)明的第八方面，此目標是通過一種用于接收或音頻播放的方法所實現，所述方法具有用以對編碼音頻信號進行解碼的方法，所述方法包括用以對表示具有至少兩個通道原始音頻信號的編碼音頻信號進行解碼的方法，所述編碼音頻信號具有下混音信號、殘余信號與描述所述至少兩個通道之間相互關系的空間參數，所述方法包括利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。根據本發(fā)明的第九方面，此目標是通過一種傳送系統(tǒng)所實現，其具有傳送器與接收器，所述傳送器具有對具有至少兩個通道音頻信號進行編碼的音頻編碼器，包括參數提取器，用以從所述音頻信號導出空間參數，其中所述空間參數描述在所述至少兩個通道之間的相互關系；限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及下混音器，用以利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號；以及所述接收器具有用以對表示具有至少兩個通道原始音頻信號的編碼音頻信號
進行解碼的音頻解碼器，所述編碼音頻信號具有下混音信號、殘余信號與描述所述至少兩個通道之間相互關系的空間參數，包括限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及上混音器，用以利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。根據本發(fā)明的第十方面，此目標是通過一種傳送與接收的方法所實現，所述方法包括傳送方法，其具有產生具有至少兩個通道的音頻信號的編碼信號的方法，所述傳送方法包括從所述音頻信號導出空間參數，其中所述空間參數描述在所述至少兩個通道之間的相互關系；利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號；所述方法也包括接收方法，其具有對編碼音頻信號進行解碼的方法，所述接收方法包括利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。根據本發(fā)明的第十一方面，此目標是通過一種表示具有至少兩個通道音頻信號的編碼音頻信號所實現，所述編碼音頻信號具有描述在所述至少兩個通道之間相互關系的空間參數、下混音信號與殘余信號，其中所述下混音信號與殘余信號是利用取決于限制后的空間參數的下混音規(guī)則，從所述音頻信號所導出的，而所述限制后的空間參數則是利用取決于所述至少兩個通道相互關系的限制規(guī)則所導出的。本發(fā)明是根據當一種具有至少兩個通道的音頻信號，其所使用的下混音規(guī)則取決于由所述音頻信號所導出的空間參數，并由限制器進行后處理以對所述導出空間參數應用特定限制時，可以被有效地下混音為下混音信號與殘余信號，并以避免在上混音或下混音處理期間的不穩(wěn)定為目標。通過具有一種與描述所述音頻通道之間相互關系動態(tài) 相關的下混音規(guī)則，可確保在所述下混音殘余信號中的能量是盡可能的小，這對于編碼效率的方面是有利的。通過在下混音之前利用限制器進行所述空間參數后處理的方式，可避免在下混音或上混音中的不穩(wěn)定，否則便會造成所述編碼或解碼音頻信號的空間感知的干擾。在本發(fā)明的一實施例中，將具有左與右通道的原始立體聲信號供應至下混音器與參數提取器。所述參數提取器導出一般所知的空間參數ICC (通道間相關)及IID (通道間強度差)。下混音器能夠將左與右通道下混音為下混音信號與殘余信號，其中所述下混音規(guī)則使得所述形成的殘余信號具有最小可獲得的能量。因此，利用標準音頻編碼器對所形成的殘余信號進行后續(xù)壓縮將會形成一種極為緊湊的代碼。這可以通過使取決于空間參數ICC及IID的下混音規(guī)則方程式化來實現，因為所述兩參數都描述所述原始立體聲通道的強度或振幅比率。在編碼期間的普遍問題是能量保存。原始信號與編碼信號兩者都需要包含相同的能量，因為違反能量守恒將造成對該編碼信號的不同響度感知，或甚至造成在所述編碼信號響度中的不可控制的跳躍。因此，在上述的編碼方案中，下混音信號與殘余信號必須利用縮放因子進行縮放，該縮放因子確保了能量守恒規(guī)則。如果要進行編碼的原始音頻信號具有特定特性，特別是左與右原始通道完全不相關時，換言之，當左與右原始通道具有相同振幅而其相位差異剛好為180°時，可將此縮放因子進行發(fā)散(diverge)。在本發(fā)明概念中，這種不穩(wěn)定性可以通過對ICC參數應用限制函數所避免，其中所述限制函數取決于最大可接受縮放因子和IID參數。為了避免可能的發(fā)散，直接地改變描述所述下混音的規(guī)則，而在現有技術的實施方式中，所述縮放因子僅簡單地利用設置閾值的方式限制，并在超過所述閾值時利用所述閾值數值取代所述縮放因子。本發(fā)明概念的極大優(yōu)點為，在下混音通道與殘余通道兩者內的信號都通過改變作為下混音處理基礎的參數來進行改變。當根據現有技術應用閾值時，只對下混音通道中的信號產生影響，因此之后利用本發(fā)明概念，便可以實現更好地保存原始左與右通道之間相互關系的目的。
上述概念的另一項優(yōu)點是，通常在編碼過程中導出所使用的空間參數。因此可以實現所需要的限制邏輯，而無須引入其它的新參數。
在本發(fā)明的另一實施例中，在解碼器側應用限制器，該限制器具有與編碼器側的限制器所具有的相同的限制規(guī)則。這意味著在所述解碼器側上，接收到下混音與殘余信號以及空間參數IID與ICC，而所接收的空間參數則利用在所述編碼處理期間所使用的相同限制規(guī)則進行限制。接著，上混音取決于限制后的空間參數，這確保了在所述上混音處理中不會發(fā)生發(fā)散。在所述編碼與解碼中具有相同限制規(guī)則的優(yōu)點是很明顯的，因為只需要進行一次的硬件電路開發(fā)或軟件算法實現。可以利用低成本的方式開發(fā)具有編碼與解碼功能的硬件或軟件，因為對于所述限制功能而言能夠重新利用相同的硬件或軟件。
在本發(fā)明的另一實施例中，下混音信號與空間參數在產生之后便進行壓縮，產生了用于所述下混音信號的兩音頻比特流以及具有壓縮空間參數的參數比特流。這降低了要傳送的編碼表示的尺寸，進一步節(jié)省了帶寬，其中編碼可以是有損耗或無損耗的，因為所述編碼規(guī)則本身與本發(fā)明概念無關。根據本發(fā)明概念的本發(fā)明解碼器包括解壓縮
級，其中所述壓縮表示在進行上混音之前，被解壓縮為空間參數、下混音通道與殘余通道。
在本發(fā)明的另一實施例中，考慮到在存儲介質上方便地存儲所產生的文件，例如通過多路復用，將已經被壓縮的音頻比特流與參數字元串流組合成組合后的比特流。這也考慮到流形成應用，舉例而言，通過因特網而將編碼后的內容形成流，因為所有的相關信息均被包括在單個文件或比特流之中，在與傳送三個分離比特流的情況相比之下，形成一種更方便的處理。相應的本發(fā)明解碼器具有去組合級，這可以是一種多路分解器，用于將所述比特流去組合為三個分離比特流，也就是兩個音頻比特流與參數比特流。
在此要注意的是，本發(fā)明概念對于現有技術殘余編碼而言提供了完美的后向兼容性，其中，所述空間參數并不受到限制，甚至在現有技術的參數化立體聲編碼中(其中解碼器并無法利用殘余信號)。所以這當然主要優(yōu)點，因為可以利用本發(fā)明解碼器以最大可能的質量再現
新的編碼音頻數據，而也可以利用根據現有技術的現有解碼器進行再現。
在本發(fā)明的另一實施例中，組合三個本發(fā)明的編碼器，以對包括六個各自通道的多通道音頻信號進行編碼，其中三個本發(fā)明的編碼器的每一個都對通道對進行編碼、導出用于每個通道對的空間參數、下混音與殘余信號。本發(fā)明的概念也可以用來進行多通道音頻信號的編碼，其中所述編碼的效率與所形成的表示的壓縮程度具有更高的優(yōu)先級，因為要進行編碼與傳送的數據總量比立體聲信號高得多。原則上，可以組合任意數目的本發(fā)明的音頻編碼器，以同時對基本上具有任意單個音頻通道數目的多通道音頻信號進行編碼。在多通道音頻編碼器
的另一實施例中，利用3比2下混音器，對各自下混音信號與殘余信號及所述參數比特流進行組合，以接收公共左信號、公共右信號、公共殘余信號與組合后的參數比特流，另外減少所需帶寬的總量。相應的解碼器直接包括2比3的上混音級。
在本發(fā)明的另一實施例中，傳送器或音頻記錄器包括本發(fā)明的編碼器，用以進行緊湊、高質量的音頻記錄或傳送，其中可以大大地減少所傳送或存儲的音頻內容的尺寸。這樣的音頻內容可以存儲在給定容量的存儲介質上，或是在所述音頻信號的傳送期間使用較少的帶寬。
在另一實施例中，接收器或音頻播放器具有本發(fā)明的解碼器，允許在移動電話之類的有限的帶寬環(huán)境中的流應用，或是利用具有有限的容量以允許小型可攜式回放設備的結構。
本發(fā)明傳送器與接收器的組合形成了一種傳送系統(tǒng)，可以通過有線或無線傳送接口進行方便的音頻內容傳送，像是無線LAN、藍牙、有線LAN、電力線技術、無線電傳送或是任何其它的數據傳送形式。

接下來，通過參照附圖對本發(fā)明的優(yōu)選實施例進行描述，其中-
圖1顯示本發(fā)明編碼器的框圖2顯示本發(fā)明編碼原則的框圖3顯示本發(fā)明編碼器的另一實施例；
圖4顯示對于現有技術解碼器具有后向兼容性的本發(fā)明編碼方
案；
圖5顯示本發(fā)明多通道音頻編碼器；
圖6顯示本發(fā)明音頻解碼器的框圖7顯示本發(fā)明解碼概念的框圖8顯示本發(fā)明解碼器的另一實施例；
圖9顯示本發(fā)明多通道音頻解碼器的實施例；
圖IO顯示本發(fā)明音頻編碼器的可選實施例；
圖11顯示本發(fā)明音頻解碼器的可選實施例；
圖12顯示本發(fā)明傳送器/音頻記錄器；
圖13顯示本發(fā)明接收器/音頻播放器；
圖14顯示本發(fā)明傳送系統(tǒng)。
具體實施例方式
圖1顯示本發(fā)明音頻編碼器10的框圖，包括下混音器12、限制器14，以及參數提取器16。
具有左與右通道的立體聲信號18被同時輸入至所述下混音器12 與所述參數提取器16之中。所述參數提取器16提取空間參數19，空間參數19描述了在所述立體聲信號18的左與右通道之間的相互關系。這些參數一方面可用于傳送，另一方面也被輸入至所述限制器14之中。所述限制器14對所述參數應用限制規(guī)則。在后續(xù)章節(jié)中應導出適當限制規(guī)則的細節(jié)。
限制器導出限制后的空間參數，并將其輸入至所述下混音器12 之中，其中所述下混音器12對所述立體聲信號18的左與右通道應用下混音規(guī)則，以從所述立體聲信號的左與右通道導出下混音信號20 與殘余信號22。所述下混音規(guī)則另外取決于所述限制后的空間參數。
當選擇用于所述限制器的適當限制規(guī)則時，只向下混音器12供應限制后的參數，所述限制后的參數是以所述下混音規(guī)則不因為下混音動作而造成發(fā)散或產生任何使所述左與右通道空間相互關系惡化的方式所限制。
因此，在音頻編碼器IO執(zhí)行編碼處理之后，立體聲信號18便由
下混音信號20、殘余信號22與空間參數表示。
為了理解下混音規(guī)則與限制規(guī)則必須如何關聯以提供包含最小可用能量的所產生的殘余信號22，同時限制空間參數，使得下混音規(guī) 則不造成任何的發(fā)散，在后續(xù)一些章節(jié)中更詳細地闡釋本發(fā)明所構成的基本概念。
由參數提取器16所提取的參數典型地來自于離散時間信號的復調制濾波器組分析中的子帶樣本的單個時間與頻率間隔。這意味著立體聲信號18的左與右通道的音頻信號首先被分為給定長度的時間幀，而在所述單個時間幀中，將頻譜細分為多個子帶采樣。對于每個單個子帶而言，參數提取器16通過比較所感興趣的子帶中的立體聲信號的左與右通道來導出空間參數。因此，在圖1中立體聲信號18的左與右通道和下混音信號m及殘余信號s必須被理解為離散及有限長度的向量，描述了離散時間間隔之中的基本信號。如同以上所指出的，在下混音期間必須確保能量保存。對于離散的復向量x、 y而言，復數內積與平方范數(與能量相比)被定義為
<formula>formula see original document page 21</formula>
依照一般的規(guī)范，*標示復數共軛。從此開始，大寫字母表示由小寫字母所標注的相應有限長度復向量的平方和或能量。
根據本發(fā)明，由所述適應性下混音所產生的下混音通道m(xù)為原始
左與右通道的能量加權總和，并因此由以下表達式定義附=g. (" 。 (2)
其中g為調整后的實數正數增益因子，使得下混音信號(M)的能量與左(L)與右(R)通道信號向量的能量總和相等(M=L+R)。
隨著該增益因子發(fā)散至無限大，當1與r為非同相位并具有可比較的能量時(換言之，在方程式(2)中的1+fO)，便需要以一種最大增益因子go限制該因子，go—般是位于區(qū)間[l，2]之中。如在圖1中所顯示，參數提取器16提取空間音頻參數IID (通道間強度差)與ICC (通道間相干性)，IID和ICC由以下表達式所表示-丄 ""ftRe,戶(3)在此，c標示IID參數，而P標示ICC參數。增益因子g可以依據所述ICC與IID參數進行表示，而所述增益因子所需限制可以由以下表達式所表示goc2+lc +1 + 2/X(4)小一般來說，因為W"，便得到2^"2+1，因此^^^gSg。。為了達到最大的編碼效率，便期望在殘余信號22中的能量為最后續(xù)推導求解了一種更一般的優(yōu)化問題，該問題包括附加殘余信號t，該附加殘余信號t接著可由方程式(9)證明是多余的。從解碼器側考慮此問題，需要確定增益a、 b，從而在所述上混音中的s、 t便具有最小能量方程式(5)的解為3中(6)(7)在系數a、6為實數的額外限制之下，同樣的問題具有將方程式(7) 的實數部分帶入至方程式(6)中所得到的解答。在這種情況中，；？可以表示為PS參數"/7，如同以下表達式-通過將方程式(6)帶入方程式(5)，并加上方程式(5)之中的兩方程式，可得到
以一般矩陣標注描述所述上混音處理，所述上混音可以利用一種如以下所表示的旋轉矩陣H表示.-<formula>formula see original document page 23</formula>在g并不由方程式(4)中的go所限制的情況中，所述最佳系數a、 b的不同表示則如以下表達式所表示<formula>formula see original document page 23</formula>所述旋轉矩陣H的第一列與參數化立體聲中所使用的振幅旋轉器(例如，在WO 03/090206 A1中所導出的)相同。所述下混音需要與所述上混音兼容的意思為當消除所有的有損耗的編碼步驟時，可以獲得完美重建。因此下混音矩陣D，<formula>formula see original document page 23</formula>(12)必須為上混音旋轉器H的反矩陣。所進行的基本計算獲得了<formula>formula see original document page 23</formula>(13)其中所述第一行與方程式(2)—致。利用方程式(10)與(13)所給定的兩個最佳旋轉器存在穩(wěn)定性問題。當(c，P)趨近于(l，-l)時，由方程式(8)給定的；？值發(fā)生發(fā)散。因此不得不在所述PS參數域的該點附近的最佳旋轉器中發(fā)生偏離。由本發(fā)明所得到的解決方案是利用在編碼器與解碼器兩者中的不穩(wěn)定限制器來修正所述PS參數。在一般形式中，這樣的限制器將改變在(1,-1)附近的^ P)對的值，以達成一種對于p而言的限制范圍。一種特別吸引人的解決方案基于方程式(8)分母與方程式(4)分母相同的發(fā)現。本發(fā)明的解決方案保持c 不變，而在方程式(4)中通過go來限制適應性下混音增益g時正確地修正P。這在以下表達式的情況中發(fā)生P的相應值則是由^帶入方程式(8)中的P所給定的，p的相應值具有以下的性質在之前的章節(jié)中，對于導致了限制器14的定義的問題分析進行詳細說明。雖然所述標注是以立體聲信號為基礎的，但明顯的是所述相同的方法也可以應用至任何的音頻信號對，如從多通道音頻信號的部分下混音所產生或選擇的通道對。特別有利的是，相同的限制規(guī)則也可以用來限制所述上混音與所述降混頻矩陣之中的參數。圖2利用框圖描述本發(fā)明音頻的編碼步驟，其顯示如何以本發(fā)明概念的方式來執(zhí)行音頻編碼。在第一參數提取步驟30中，導出ICC 與IID參數。這些參數接著被轉發(fā)作為輸出23，并傳送以用作所述限制步驟 32之中的輸入，其中，利用所計算的最小ICC參數ICC^與所述ICC 參數進行比較，其中ICC^取決于IID。在第一情況中，所述ICC參數超過所述最小ICC參數ICCmin(IID)，將所述ICC參數直接轉發(fā)至下混音步驟34。如果所述ICC參數并未超過ICCmin(IID)參數，則進行額外的交換步驟36，其中所述ICC參數值被所述最小ICC參數ICCmin(IID)的值所取代。在交換步驟36之后，便將具有新值的ICC參數傳送至下混音步驟34。在下混音步驟34中，根據參數ICC與IID，從通道l與r中導出下混音信號20與殘余信號22。
最后，參數23 (ICC與IID)、下混音信號20與殘余信號22便可用作編碼步驟的輸出。圖3顯示本發(fā)明音頻編碼設備50的另一實施例，該音頻編碼設備50包括音頻編碼器10，具有第一音頻壓縮器52、第二音頻壓縮器 54與參數壓縮器56的信號處理單元51，以及輸出接口58。所述音頻編碼器10的組件已經在先前章節(jié)中所討論。因此，在后續(xù)章節(jié)中只討論從所述音頻編碼器10進行擴展的音頻編碼設備50 的部分。所述信號處理單元51的一般目的是用來壓縮下混音信號20、殘余信號22以及參數23。因此，下混音信號20便被輸入至第一音頻壓縮器52，殘余信號22被輸入至第二音頻壓縮器54，而空間參數23 被輸入至參數壓縮器56。第一音頻壓縮器52導出第一音頻比特流60，第二音頻壓縮器54導出第二音頻比特流62，而參數壓縮器56導出參數比特流64。第一與第二音頻比特流(60、 62)與參數比特流64被用作所述輸出接口的輸入，輸出接口將所述三個比特流(60、 62、 64) 進行組合，以導出組合后的比特流66，作為本發(fā)明編碼設備50的輸出。由所述輸出接口 58所執(zhí)行的組合可以例如是對所述三個輸入比特流的簡單的多路復用。此外，也可以是產生單個輸出比特流66的任何種類的組合。對于如通過因特網或其它數據鏈路的流形成的處理而言，只處理單個比特流方便得多。換句話說，圖3描述一種編碼器，該編碼器利用包括通道1、 r的雙通道音頻信號作為輸入，并產生之后由參數化立體聲解碼器進行解碼的比特流。適應性下混音利用所述雙通道信號1、 r，產生單聲道下混音信號m與殘余信號s。接著這些信號可以利用感知音頻編碼器進行編碼，以產生緊湊的音頻比特流。參數化立體聲(PS)參數估算器則利用所述雙通道信號1、 r作為輸入，并產生PS參數組。所述不穩(wěn)定限制器修正控制所述適應性下混音的PS參數。編碼塊從PS參數估計的未修正輸出中產生參數化立體聲側信息(PS側信息)。多路復用器將所有的編碼數據組合以形成組合后的比特流。
本發(fā)明編碼概念的主要優(yōu)點之一，是與現有技術的參數化立體聲解碼器完全地后向兼容。為了描述此優(yōu)點，圖4顯示一種現有技術的參數化立體聲解碼器。所述參數化立體聲解碼器70包括輸入接口 72、音頻解碼器74、參數解碼器76與上混音器78。輸入接口 72接收由本發(fā)明音頻編碼器50產生的組合后的比特流 80。現有技術參數化立體聲解碼器70的輸入接口 72并不辨識殘余信號22，因此只從輸入比特流80中提取下混音信號60 (圖3中的第一音頻比特流60)與參數比特流64。音頻解碼器74為所述第一音頻壓縮器52的互補設備，而參數解碼器76為所述參數壓縮器56的互補設備。因此，所述音頻比特流60被解碼為下混音信號20，而所述參數比特流64則被解碼為空間參數23。因為空間參數23己經被直接地傳送，并且并未由本發(fā)明的編碼器10或50進行進一步處理，因此現有技術的上混音器78便可進行左與右通道的重建，利用空間參數23從下混音信號20建立輸出信號80。換句話說，圖4描述一種參數化立體聲解碼器，其利用本發(fā)明編碼設備50所產生的兼容比特流作為輸入，并產生包括通道1與r的立體聲音頻信號，而不需要利用或不需要取得描述了殘余信號的比特流部分。首先，多路分解器利用兼容比特流作為輸入，并將其分解為音頻比特流與PS側信息。所述感知音頻解碼器產生單聲道信號m，而所述參數化立體聲側信息被解碼為PS參數。PS合成根據所述PS參數，將所述單聲道信號轉換為左右信號l及r，特別是通過加入一去相關后的信號，以重新獲得原始立體聲通道的通道相關性。圖5顯示一種本發(fā)明多通道音頻編碼器100，用于將6通道音頻信號編碼為立體聲下混音信號與多個參數組。所述多通道音頻編碼器100包括第一適應性編碼器102、第二適應性編碼器104、估計模塊106、參數提取器108與3比2下混音器 110。所述第一適應性編碼器102與第二適應性編碼器104為本發(fā)明編碼器10的實施例。所述6通道輸入信號具有左前通道112a、左后通
道112b、右前通道114a、右后通道114b、中心通道U6a與低頻增強通道116b。所述左前通道112a與左后通道112b被輸入至所述第一適應性編碼器102之中，以導出第一下混音信號U8a、相應的殘余信號 118b與空間參數118c。所述右前通道U4a與右后通道114b則被輸入至所述第二適應性編碼器104，以導出第二下混音信號120a、相應的殘余信號120b與基礎空間參數120c。所述中心通道116a與低頻增強通道116b被輸入至求和模塊106之中，該求和模塊將信號相加以建立單聲道信號122a與相應的空間參數122b。所述3比2下混音器110接收下混音信號118a、 120a與122a，以將它們下混音為具有左與右通道的立體聲輸出信號124。所述3比2 下混音器110另外從輸入通道118a、 120a與122a導出殘余信號126。此外，所述3比2下混音器110從所述參數組118b、 120b與122b中導出一參數組128。簡單總結來說，圖5描述空間音頻編碼器的部分，該空間音頻編碼器利用5.1格式的多通道音頻信號作為輸入，包括Lf (左前)、Lr (左后)、Rf (右前)、Rr (右后)、C (中心)與LFE (低頻有效)通道，并建立包括LO與RO的立體聲下混音信號以及多個參數組。在此圖中并未顯示的是時間至頻率的轉換、下混音信號與參數的編碼，以及將所述編碼信息多路復用為可以由相應的空間音頻解碼器進行解碼的比特流。所述適應性下混音利用信號Lf和Lr作為輸入，并產生單聲道信號L與殘余信號L。所述參數化立體聲(PS)參數估計利用雙通道信號Lf和Lr作為輸入，并產生PS參數組。所述不穩(wěn)定限制器修正控制適應性下混音的PS參數。以類似的方式，所述適應性下混音利用信號Rf和Rr作為輸入，并產生單聲道信號R與殘余信號R。所述參數化立體聲(PS)參數估計利用雙通道信號Rf和Rr作為輸入，并產生PS參數組。所述不穩(wěn)定限制器修正控制所述適應性下混音的所述PS參數。所述求和模塊將信號C與LFE相加，以建立單聲道信號C。所述參數化立體聲(PS)參數估計利用雙通道信號C與LFE 作為輸入，并產生IID參數組，PS參數的子集。所述單聲道信號L、與C則由所述3比2模塊混合為立體聲信號(Lo與Ro)及殘余信號
Eo。所述3比2模塊也輸出參數組(Lo,R^。圖6描述一種本發(fā)明音頻解碼器140，包括上混音器142與限制器144。本發(fā)明解碼器140接收下混音信號146、殘余信號148與空間參數150。所述下混音信號146與所述殘余信號148被輸入至所述上混音器142之中，而所述空間參數150被輸入至所述限制器144之中。所述限制器144限制所述空間參數150以導出限制后的空間參數152。重要的是要注意，所述限制器是利用與相應編碼器在編碼處理期間所使用的相同的限制規(guī)則，以導出所述限制后的參數。所述限制后的參數用來控制在所述上混音器142中的上混音過程，上混音器從所述下混音信號146與所述殘余信號148中導出具有左與右通道的立體聲信號154。圖7顯示描述本發(fā)明解碼器原則的框圖。在第一限制步驟160中，限制所述接收空間參數ICC與IID。也就是說，檢查所接收的ICC參數是否超過最小ICC參數(ICCmin(IID))。如果超過，便將所述空間參數150 (ICC與IID)、所接收的下混音信號146與所接收的殘余信號 148傳送至所述上混音步驟162。如果所述ICC參數并未超過所述最小ICC參數(ICCmin(IID))，便額外執(zhí)行限制步驟164，也就是利用參數ICCn^(IID)的值來交換所述ICC參數的值，這具有以下效果將所述ICCmin(IID)的值傳送至所述上混音步驟162。在所述上混音步驟162中，利用所述空間參數ICC與IID，從所述下混音信號146與所述殘余信號148中導出具有左與右通道的立體聲信號154。圖8顯示本發(fā)明解碼設備180的另一實施例，所述解碼設備180 包括解碼器140、具有第一音頻解碼器184、第二音頻解碼器186與參數解碼器188的信號處理單元182。所述解碼設備180另外包括輸入接口 190，用以接收由本發(fā)明編碼設備50所產生的組合后的比特流 192。所述組合后的比特流192由所述輸入接口 190分解為第一音頻比特流194a、第二音頻比特流194b與參數比特流196。
所述第一音頻比特流194a被輸入至所述第一音頻解碼器184之中，所述第二音頻比特流194b被輸入至所述第二音頻解碼器186之中，而所述參數比特流196則被輸入至所述參數解碼器188之中。所述分解的下混音信號198 (m)與所述殘余信號200 (s)被輸入至所述解碼器140的上混音器142之中。由所述參數解碼器188所導出的空間參數202被輸入至所述音頻解碼器140的限制器144之中。所述空間參數與所述上混音的限制已經在所述音頻解碼器140的敘述中所說明。其詳細敘述可從圖6的相關章節(jié)描述所得。本發(fā)明解碼設備180最后輸出具有左與右通道的立體聲信號204。換句話說，圖8描述一種參數化立體聲解碼器，其利用兼容比特流作為輸入，并產生包括通道1與r的立體聲音頻信號。首先多路分解器利用所述兼容比特流作為輸入，并將其分解為兩個音頻比特流及PS側信息。感知音頻解碼器分別產生單聲道信號m與殘余信號s，所述PS側信息通過所述參數解碼器解碼為PS參數。所述上混音器通過由不穩(wěn)定限制器所修正的PS參數所定義的旋轉矩陣，將所述單聲道與所述殘余信號轉換為左與右信號1及r。圖9顯示一種本發(fā)明多通道音頻解碼器210，包括第一雙通道解碼器212、第二雙通道解碼器2M、合成模塊216與2比3模塊218。圖9顯示空間音頻解碼器的部分，其利用立體聲音頻信號(包括 Lo與Ro)、殘余信號Eo與參數組(Lo,RoM乍為輸入。所述2比3模塊 218從上述提到的輸入中產生三個音頻通道L、 R與C。所述單通道L 與所述殘余通道L通過第一雙通道解碼器212轉換為所述Lf和Lr輸出信號。所述不穩(wěn)定限制器修正所述PS參數組L。類似地，所述單通道R與所述殘余通道R通過第二雙通道解碼器214轉換為所述Rf和 Rr輸出信號。在產生所述單通道信號R的期間，同樣也使用所述不穩(wěn) 定限制器修正所述PS參數組R。所述PS合成模塊216利用所述單通道C與所述參數組C，產生所述C與LFE輸出通道。圖IO與11顯示在避免不穩(wěn)定問題的情況下，對于編碼器與解碼器的可選解決方案。所述可選方案基于將限制后的空間參數用作要進行編碼與傳送的參數。這可以從圖10中的本發(fā)明編碼器中所見，它基
于圖3的本發(fā)明編碼設備。圖10顯示了對己經在圖3中顯示的本發(fā)明編碼器的修改，其差異在于，在節(jié)點300處(即在所述限制處理之后)采用了饋入參數編碼器56中的參數。也就是說，取代所述原始參數，對所述限制后的參數進行編碼及傳送。在圖11中所顯示的解碼器側，其修正為與所述解碼設備180相比可以省略所述限制器。因此，所述解碼空間參數310便直接地輸入至所述上混音器142，以導出所述立體聲信號204。此方法與先前所教導取代不穩(wěn)定限制器以及在先前圖標中所顯示的方法相比之下，其缺點分為兩方面。首先，所述有限參數的量化將進一步使得所述旋轉器離開所需要的優(yōu)化狀況。所述殘余信號的尺寸一般上便因此變的較大，導致對于所述殘余編碼方法而言的一種編碼增益損失。第二，將會失去對于參數化立體聲解碼的后向兼容性。在臨界情況中，當所述原始通道的通道相關性為負值時，所述解碼器將無法在不取得所述殘余信號的情況下再現此相關性。圖12顯示一種本發(fā)明的音頻傳送器或記錄器330，具有音頻編碼器50、輸入接口 332與輸出接口 334。在所述傳送器/記錄器330的輸入接口 332處可以供應音頻信號。所述音頻信號是利用在所述傳送器/記錄器之中的本發(fā)明的編碼器50 進行編碼，而所述編碼表示在所述傳送器/記錄器330的輸出接口 334 處輸出。所述編碼表示接著可以被傳送或存儲在存儲介質上。圖13顯示一種本發(fā)明的接收器或音頻播放器340，具有本發(fā)明的音頻解碼器180、比特流輸入342與音頻輸出344。在本發(fā)明的接收器/音頻播放器340輸入342處，可以輸入比特流。所述比特流可以通過所述解碼器180進行解碼，而所述解碼信號在本發(fā)明接收器/音頻播放器340輸出344處輸出或播放。圖14顯示了一種傳送系統(tǒng)，包括本發(fā)明的傳送器330及本發(fā)明的接收器340。對在所述傳送器330的輸入接口 332處輸入的音頻信號進行編碼，并從所述傳送器330的輸出334傳送至所述接收器340的輸入342。
所述接收器對所述音頻信號進行解碼，并在其輸出344上播放或輸出所述音頻信號。以上提及及敘述的本發(fā)明實施例只是用于描述本發(fā)明改善是應用殘余編碼的原則。應該了解的是，在此描述的配置與細節(jié)修正可以由本領域其它技術人員所運用。因此，這僅受到所附權利要求的范圍的限制，但不局限于在此敘述與說明實施例的特定細節(jié)。雖然在上述圖示中所敘述的本發(fā)明實施例主要只利用對于立體聲信號所使用的術語所描述，明顯的是本發(fā)明并不只局限于立體聲信號，其可以應用至任何的兩音頻信號結合形式，例如在圖5與圖9中所顯示的多通道音頻編碼器及解碼器。利用具有傳送器與接收器的本發(fā)明的傳送系統(tǒng)，在所述傳送器與所述接收器之間的傳送可以利用多種方式所實現。例如可以直接通過電纜線或像是無線局域網絡、藍牙與其它可想象的數據聯結方式連接所述傳送器與所述接收器，通過因特網或其它網絡媒介的生活流，并在計算機可讀取介質上存儲文件及傳送所述介質。雖然已經詳細敘述，所述ICC參數的改變只是用來確保得到一種不發(fā)散的上混音與下混音矩陣，也可以限制所述IID與ICC參數，從而不產生任何的發(fā)散。更一般地，應用本發(fā)明概念也可以導出其它空間參數，并對這些參數應用限制規(guī)則，以確保一種不發(fā)散的上混音與下混音。在本發(fā)明編碼器與解碼器中的輸出與輸入接口并不僅局限為簡單的多路復用器與多路分解器。在一種更復雜的變化中，所述輸出接口可以不只利用所述多路復用，也利用其它的裝置進行比特流的組合，甚至可能嘗試某些額外的熵編碼技術，以減少所述比特流的尺寸。根據本發(fā)明方法的特定實施方式要求，本發(fā)明方法也可以在硬件或軟件中實現。所述實現可以利用一種數字存儲介質進行，特別是在其上存儲有電子可讀控制信號的盤、DVD或CD，其與一可程序化計算機系統(tǒng)結合，以實現本發(fā)明方法。一般來說，本發(fā)明因此是一種計算機程序產品，其具有在機器可讀介質上所存儲的程序代碼，所述程序代碼在所述計算機程序產品于計算機上執(zhí)行時，可以操作以實作本
發(fā)明方法。換句話說，本發(fā)明因此是一種計算機程序，用于當所述計算機程序于計算機上執(zhí)行時具有實現至少本發(fā)明方法之一的程序代碼。雖然之前己經特別說明并敘述所述參考特定實施例，本領域技術人員應該了解的是，在不背離本發(fā)明方面及精神下可以進行細節(jié)與形式的改變。應該了解的是在不背離在此公開與由權利要求所包含的概念下，可以在不同的實施例中調整各種不同的變化。
權利要求
1.一種音頻編碼器，用以對具有至少兩個通道的音頻信號進行編碼，包括參數提取器，用以從音頻信號導出空間參數，其中所述空間參數描述所述至少兩個通道之間的相互關系；限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及下混音器，用以利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號。
2. 如權利要求〗所述的音頻編碼器，其中所述參數提取器操作以導出針對音頻信號的給定時間部分的多個空間參數，其中每個空間參數描述了針對預定頻率間隔的所述至少兩個通道的相互關系。
3. 如權利要求1所述的音頻編碼器，其中所述參數提取器操作以導出ICC參數和IID參數，所述ICC參數描述所述至少兩個通道的第一與第二通道之間的相干性，所述IID參數描述所述第一與第二通道之間的電平差。
4. 如權利要求1所述的音頻編碼器，其中所述限制器操作以限制所述空間參數，使得描述了所述下混音信號與所述至少兩個通道之間的強度比例的增益因子不超過預定限制。
5. 如權利要求3所述的音頻編碼器，其中所述限制器操作以限制所述ICC參數，使得描述了所述下混音信號與所述至少兩個通道之間的強度比例的增益因子不超過預定限制，其中所述icc參數的限制取決于所述IID參數。
6. 如權利要求5所述的音頻編碼器，其中所述限制規(guī)則使得能夠通過以下表達式來描述取決于預定增益因子go及所述IID參數的所述 ICC參數的下限<formula>formula see original document page 3</formula>
7. 如權利要求6所述的音頻編碼器，其中所述預定增益因子go是從區(qū)間[1,2]中所選擇的。
8. 如權利要求1所述的音頻編碼器，其中所述下混音器操作以使用下混音規(guī)則，使得通過從所述至少兩個通道形成通道的線性組合而導出所述下混音信號與所述殘余信號，其中所述線性組合的系數取決于所述限制后的空間參數。
9. 如權利要求8所述的音頻編碼器，其中所述參數提取器操作以導出ICC參數和IID參數，所述ICC參數描述所述至少兩個通道的第一與第二通道之間的相干性，所述IID參數描述所述第一與第二通道之間的電平差；以及所述下混音規(guī)則使得能夠根據所述ICC和IID參數，通過以下等式來描述所述下混音信號m和所述殘余信號s的導出
10. 如權利要求1所述的音頻編碼器，進一步包括信號處理單元，用以處理或傳送所述下混音信號、所述殘余信號與所述空間參數，以導出處理后的下混音信號、處理后的殘余信號與處理后的參數。
11. 如權利要求IO所述的音頻編碼器，其中所述信號處理單元操作以導出所述處理后的下混音信號、所述處理后的殘余信號與所述處理后的參數，使得所述導出包含所述下混音信號、所述殘余信號與所述空間參數的壓縮。
12. 如權利要求10所述的音頻編碼器，進一步包括輸出接口，用以提供所述處理后的下混音信號、所述處理后的殘余信號與所述處理后的空間參數的信息。
13. 如權利要求12所述的音頻編碼器，其中所述輸出接口操作以將所述處理后的下混音信號、所述處理后的殘余信號與所述處理后的空間參數組合，以導出輸出比特流，所述輸出比特流具有所述處理后的下混音信號、所述處理后的殘余信號與所述處理后的參數的信息。
14. 如權利要求13所述的音頻編碼器，其中所述輸出接口操作以對所述處理后的下混音信號、所述處理后的殘余信號與所述處理后的空間參數進行多路復用，以導出所述輸出比特流。
15. 如權利要求1所述的音頻編碼器，其中對所述多個通道對進行編碼，其中為每一通道對導出空間參數、下混音信號與殘余信號。
16. 如權利要求15所述的音頻編碼器，其中所述多個通道對包括左前、左后、右前、右后、低頻增強與中心通道。
17. —種音頻解碼器，用以對編碼音頻信號進行解碼，所述編碼音頻信號表示具有至少兩個通道的原始音頻信號，所述編碼音頻信號具有下混音信號、殘余信號以及空間參數，所述空間參數描述了所述至少兩個通道之間的相互關系，所述音頻解碼器包括限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及上混音器，用以利用取決于所述限制后的空間參數的上混音規(guī) 則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。
18. 如權利要求17所述的音頻解碼器，其中所述限制器操作以限制針對與所述原始音頻信號的時間幀相對應的編碼音頻信號的給定時間部分的多個空間參數，其中每個空間參數描述了針對所述時間幀中預定頻率間隔的所述至少兩個通道之間的相互關系。
19. 如權利要求17所述的音頻解碼器，其中所述限制器操作以限制ICC參數和IID參數，所述ICC參數描述所述至少兩個通道的第一與第二通道之間的相干性，所述IID參數描述所述第一與所述第二通道之間的電平差。
20. 如權利要求17所述的音頻解碼器，其中所述限制器操作以限制所述空間參數，使得描述了所述下混音信號與所述原始音頻信號的所述至少兩個通道之間的強度比例的增益因子不超過所述預定限制。
21. 如權利要求19所述的音頻解碼器，其中所述限制器操作以限制所述ICC參數，使得描述了所述下混音信號與所述原始音頻信號的所述至少兩個通道之間的強度比例的增益因子不超過所述預定限制。
22. 如權利要求21所述的音頻解碼器，其中所述限制規(guī)則使得能夠通過以下表達式來描述取決于預定增益因子go及所述IID參數的所述ICC參數的下限<formula>formula see original document page 5</formula>
23. 如權利要求22所述的音頻解碼器，其中所述預定增益因子go 是從區(qū)間[1，2]中所選擇的。
24. 如權利要求17所述的音頻解碼器，其中所述上混音器操作以使用上混音規(guī)則，使得通過形成所述下混音信號與所述殘余信號的線性組合來導出所述至少兩個通道的第一重建通道與第二重建通道，其中所述線性組合的系數取決于所述限制后的空間參數。
25. 如權利要求24所述的音頻解碼器，其中所述限制器操作以限制ICC參數和IID參數，所述ICC參數描述所述至少兩個通道的第一與第二通道之間的相干性，所述IID參數描述所述第一與第二通道之間的電平差；以及所述上混音規(guī)則使得能夠通過以下等式來描述從所述下混音信號m與所述殘余信號s對所述第一重建通道1與所述第二重建通道r 的導出<formula>formula see original document page 5</formula>其中<formula>formula see original document page 5</formula>
26.如權利要求17所述的音頻解碼器，進一步包括信號處理單元，用以傳送或處理處理后的殘余信號、處理后的下混音信號與處理后的空間參數，以導出所述殘余信號、所述下混音信號與所述空間參數。
27. 如權利要求26所述的音頻解碼器，其中所述信號處理單元操作以導出所述殘余信號、所述下混音信號與所述空間參數，使得所述殘余信號、所述下混音信號與所述空間參數的導出包括對所述處理后的殘余信號、所述處理后的下混音信號與所述處理后的空間參數的解壓縮。
28. 如權利要求26所述的音頻解碼器，進一步包括輸入接口，用以提供所述處理后的所述殘余信號、所述處理后的下混音信號與所述處理后的空間參數。
29. 如權利要求28所述的音頻解碼器，其中所述輸入接口操作以分解單個輸入比特流，以導出所述處理后的所述殘余信號、所述處理后的下混音信號與所述處理后的空間參數。
30. 如權利要求29所述的音頻解碼器，其中所述輸入接口操作以分解所述單個輸入比特流，使得所述處理后的殘余信號、所述處理后的下混音信號與所述處理后的參數的導出包括對所述輸入比特流的多路分解。
31. —種用于將具有至少兩個通道的音頻信號進行編碼的方法，所述方法包括從所述音頻信號導出空間參數，其中所述空間參數描述了在所述至少兩個通道之間的相互關系；利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號。
32. —種用以對編碼音頻信號進行解碼的方法，所述編碼音頻信號表示具有至少兩個通道的原始音頻信號，所述編碼音頻信號具有下混音信號、殘余信號，以及空間參數，所述空間參數描述了所述至少兩個通道之間的相互關系，所述方法包括利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。33. —種編碼音頻信號，所述編碼音頻信號是具有至少兩個通道的音頻信號的表示，所述編碼音頻信號具有空間參數、下混音信號與殘余信號，所述空間參數描述了在所述至少兩個通道之間的相互關系，其中所述下混音信號和所述殘余信號是利用取決于限制后的空間參數的下混音規(guī)則而從所述音頻信號所導出的，所述限制后的空間參數則是利用取決于所述至少兩個通道的相互關系的限制規(guī)則所導出的。34. —種機器可讀存儲介質，在其上存儲編碼音頻信號，所述編碼音頻信號表示具有至少兩個通道的音頻信號，所述編碼音頻信號具有空間參數、下混音信號與殘余信號，所述空間參數描述了所述至少兩個通道之間的相互關系，其中所述下混音信號和所述殘余信號是利用取決于限制后的空間參數的下混音規(guī)則而從所述音頻信號所導出的，所述限制后的空間參數則是利用取決于所述至少兩個通道的相互關系的限制規(guī)則所導出。35. —種傳送器或音頻記錄器，其具有音頻編碼器，用以對具有至少兩個通道的音頻信號進行編碼，所述傳送器或音頻記錄器包括參數提取器，用以從所述音頻信號導出空間參數，其中所述空間參數描述了在所述至少兩個通道之間的相互關系；限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及下混音器，用以利用取決于所述限制后的空間參數的下混音規(guī) 則，從所述音頻信號導出下混音信號與殘余信號。36. —種接收器或音頻播放器，其具有音頻解碼器，用以將表示具有至少兩個通道的原始音頻信號的編碼音頻信號進行解碼，所述編碼音頻信號具有下混音信號、殘余信號以及空間參數，所述空間參數描述了所述至少兩個通道之間的相互關系，所述接收器或音頻播放器包括限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及上混音器，用以利用取決于所述限制后的空間參數的上混音規(guī) 則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。37. —種用于對具有產生編碼信號的方法進行傳送或音頻記錄的方法，所述方法包括用于對具有至少兩個通道的音頻信號進行編碼的方法，所述方法包括從所述音頻信號導出空間參數，其中所述空間參數描述在所述至少兩個通道之間的相互關系；利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號。38. —種用于接收或音頻播放的方法，所述方法具有對編碼音頻信號進行解碼的方法，所述方法包括用以對表示具有至少兩個通道的原始音頻信號的編碼音頻信號進行解碼的方法，所述編碼音頻信號具有下混音信號、殘余信號以及空間參數，所述空間參數描述了所述至少兩個通道之間的相互關系，所述方法包括利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。39. —種傳送系統(tǒng)，具有傳送器與接收器，所述傳送器具有音頻編碼器，用以對具有至少兩個通道的音頻信號迸行編碼，所述傳送器包括參數提取器，用以從所述音頻信號導出空間參數，其中所述空間參數描述了在所述至少兩個通道之間的相互關系；限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及下混音器，用以利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號；以及所述接收器具有音頻解碼器，用以對表示具有至少兩個通道的原始音頻信號的編碼音頻信號進行解碼，所述編碼音頻信號具有下混音信號、殘余信號以及空間參數，所述空間參數描述了所述至少兩個通道之間的相互關系，所述接收器包括限制器，用以利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及上混音器，用以利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。40.—種傳送與接收的方法，所述方法包括傳送方法，具有產生具有至少兩個通道的音頻信號的編碼信號的方法，所述傳送方法包括從所述音頻信號導出空間參數，其中所述空間參數描述了在所述至少兩個通道之間的相互關系；利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的下混音規(guī)則，從所述音頻信號導出下混音信號與殘余信號；以及接收方法，具有對編碼音頻信號進行解碼的方法，所述接收方法包括利用限制規(guī)則來限制所述空間參數，以導出限制后的空間參數，其中所述限制規(guī)則取決于所述至少兩個通道之間的相互關系；以及利用取決于所述限制后的空間參數的上混音規(guī)則，從所述下混音信號與所述殘余信號導出對所述原始音頻信號的重建。 41.一種計算機程序，用于當在計算機上運行時，執(zhí)行如權利要求32、 33、 37、 38或40之一所述的方法中的方法。
全文摘要
當所使用的下混音規(guī)則取決于空間參數時，具有至少兩個通道的音頻信號可被有效地下混音為下混音信號與殘余信號，所述空間參數是從所述音頻信號導出的并由限制器進行后處理，以將特定限制應用于所導出的空間參數，從而避免在上混音或下混音處理期間的不穩(wěn)定。通過具有一種動態(tài)地取決于描述了音頻通道之間相互關系的參數的下混音規(guī)則，可確保在所述下混音殘余信號中的能量是盡可能的小，這對于編碼效率是有利的。在下混音中使用限制器之前，使用限制器對空間參數進行后處理，可避免在下混音或上混音中的不穩(wěn)定，否則這會造成對編碼或解碼音頻信號的空間感知的干擾。
文檔編號G10L19/00GK101160619SQ200680012121
公開日2008年4月9日申請日期2006年4月7日優(yōu)先權日2005年4月15日
發(fā)明者拉斯·維萊摩爾斯, 法蘭寇斯·菲利普司·梅布格申請人:科丁技術公司;皇家飛利浦電子股份有限公司

完整全部詳細技術資料下載