本發(fā)明涉及音頻信號處理,更具體地,涉及音頻數據位流編碼和解碼以便實現輸出音頻信號的期望響度水平。
背景技術:
1、dolby?ac-4是用于高效率地分布富媒體內容的音頻格式。ac-4為廣播公司和內容制作商提供了以高效率的方式分布和編碼內容的靈活框架。內容可以分布在若干個子流上,例如m&e(音樂和效果)在一個子流中,對話在第二子流中。對于一些音頻內容,可能有利的是,例如,將對話的語言從一種語言切換到另一種語言,或者能夠將例如評論子流添加到內容或包括為了視力障礙者而進行的描述的附加子流。
2、為了確保呈現給消費者的內容的適當調平(leveling),對內容的響度需要有一定精確度的了解。當前響度要求具有2db(atsc?a/85)、0.5db(ebu?r128)的容限,而一些規(guī)范具有低達0.1db的容限。這意味著,具有評論音軌并且具有使用第一語言的對話的輸出音頻信號的響度應與不具有評論音軌、但具有使用第二語言的對話的輸出音頻信號的響度基本上相同。
技術實現思路
1、本發(fā)明提供了一種對包括多個內容子流的位流進行處理的方法,每個內容子流表示音頻信號,該方法包括:從位流提取一個或多個呈現數據結構,每個呈現數據結構包括對于所述內容子流中的至少一個的引用,每個呈現數據結構還包括對于元數據子流的引用,該元數據子流表示描述所引用的一個或多個內容子流的組合的響度數據;接收指示所述一個或多個呈現數據結構中的選擇的呈現數據結構和期望響度水平的數據;對選擇的呈現數據結構所引用的一個或多個內容子流進行解碼;并且基于解碼的內容子流形成輸出音頻信號,該方法還包括基于選擇的呈現數據結構所引用的響度數據來對解碼的一個或多個內容子流或輸出音頻信號進行處理以達到所述期望響度水平。
2、本發(fā)明還提供了一種用于對包括多個內容子流的位流進行處理的解碼器,每個內容子流表示音頻信號,該解碼器包括:接收部件,其被配置為接收位流;解復用器,其被配置為從位流提取一個或多個呈現數據結構,每個呈現數據結構包括對所述內容子流中的至少一個的引用,并且還包括對元數據子流的引用,該元數據子流表示描述所引用的一個或多個內容子流的組合的響度數據;回放狀態(tài)部件,其被配置為接收指示在一個或多個呈現數據結構之中的選擇的呈現數據結構以及期望響度水平的數據;以及混合部件,其被配置為對選擇的呈現數據結構所引用的一個或多個內容子流進行解碼,并且基于解碼的內容子流形成輸出音頻信號,其中,混合部件還被配置為基于選擇的呈現數據結構所引用的響度數據來對解碼的一個或多個內容子流或輸出音頻信號進行處理以達到所述期望響度水平。
3、本發(fā)明還提供了一種音頻編碼方法,包括:接收表示相應音頻信號的多個內容子流;定義一個或多個呈現數據結構,每個呈現數據結構引用所述多個內容子流中的至少一個;對于一個或多個呈現數據結構中的每個,應用預定義響度函數來獲得描述所引用的一個或多個內容子流的組合的響度數據,并且包括對來自呈現數據結構的響度數據的引用;并且形成位流,該位流包括所述多個內容子流、所述一個或多個呈現數據結構以及呈現數據結構所引用的響度數據。
4、本發(fā)明還提供了一種音頻編碼器,包括:響度部件,其被配置為應用預定義響度函數來獲得響度數據,該響度數據描述表示相應音頻信號的一個或多個內容子流的組合;呈現數據部件,其被配置為定義一個或多個呈現數據結構,每個呈現數據結構包括對多個內容子流之中的一個或多個內容子流的引用以及對描述所引用的內容子流的組合的響度數據的引用;以及復用部件,其被配置為形成位流,該位流包括所述多個內容子流、所述一個或多個呈現數據結構以及呈現數據結構所引用的響度數據。
1.一種對包括多個內容子流(412)的位流(p)進行處理的方法,每個內容子流表示音頻信號,所述方法包括:
2.根據權利要求1所述的方法,其中,所述選擇的呈現數據結構還引用要應用于所述多個內容子流的至少兩個混合系數,
3.根據權利要求2所述的方法,其中,所述位流包括多個時間幀,并且其中,所述選擇的呈現數據結構所引用的混合系數能夠獨立地分配給每個時間幀;和/或
4.根據前述權利要求中的任一項所述的方法,其中,所述位流包括多個時間幀,并且其中,指示所述一個或多個呈現數據結構當中的所述選擇的呈現數據結構的數據能夠獨立地分配給每個時間幀。
5.根據權利要求4所述的方法,還包括:
6.一種用于對包括多個內容子流(412)的位流(p)進行處理的解碼器,每個內容子流表示音頻信號,所述解碼器包括被配置為執(zhí)行根據權利要求1-5中的任一項所述的方法的一個或多個部件。
7.一種計算機程序產品,所述計算機程序產品包括指令,所述指令在由計算設備或系統(tǒng)執(zhí)行時執(zhí)行根據權利要求1-5中的任一項所述的方法。
8.一種方法,包括:
9.一種解碼裝置,包括: