两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

音頻元數(shù)據(jù)校驗的制作方法

文檔序號:2830029閱讀:977來源:國知局
專利名稱:音頻元數(shù)據(jù)校驗的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號處理,尤其涉及對音頻系統(tǒng)中采用的元數(shù)據(jù)進(jìn)行校驗和糾正。本發(fā)明尤其用于稱為Dolby Digital ( AC-3 ) 、 Dolby Digital Plus和Dobly E的音頻編碼系統(tǒng)。Dolby、 Dolby Digital、 Dolby Digital Plus和Dobly E是杜比實驗室認(rèn)證7>司(Dolby Laboratories Licensing Corporation)的商標(biāo)。本發(fā)明的各方面還可與其它類型的 音頻編碼(諸如MPEG-4 AAC ) —起4吏用。
背景技術(shù)
在以下的參考文獻(xiàn)中闡述Dolby Digital的細(xì)節(jié)J71S"C 5Vflw^rJ爿52Z4.. D/g/,a/爿《^ CV 附/7rew》w 5Va </fln/(!4C-3」,7 ev/s7ow爿,Advanced Television Systems Committee, 20 Aug.2001.在環(huán)球網(wǎng)上,可在http:〃www.atsc.org/standards.html找到A/52 A文獻(xiàn)。Craig C. Todd等人的"Flexible Perceptual Coding for Audio Transmission and Storage", 96th Co ve //o < //Ae^m/iV 五"g,7iem."g 5W/豐1994年2月26日,預(yù)印3796;Steve Vernon的"Design and Implementation of AC-3 Coders", 7>,. C歸"五/e"簡/cs, Vol. 41, No.3, 1995年8月。Mark Davis 的"The AC-3 Multichannel Coder,, , Audio Engineering Society預(yù)印3774, 95th AES Convention, 1993年10月。Bosi等人的"High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications", Audio Engineering Society預(yù)印3365, 93th AES Convention, 1992年10月。第5,583,962、 5,632,005、 5,633,981、 5,727,119和6,021,386號美
國專利。在以下文獻(xiàn)中闡述Dolby Digital Phis的細(xì)節(jié)"Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System", AES Convention Paper 6196, 117th AES Convention, 2004 年10月28日。在以下文獻(xiàn)中闡述Dolby E編碼的細(xì)節(jié)"Efficient Bit Allocation, Quantization, and Coding in an Audio Distribution System", AES預(yù) 印5068, 107thAES Conference, 1999年8月;以及"Professional Audio Coder Optimized for Use with Video", AES預(yù)訂5033, 107th AES Conference, 1999年8月。在以下文獻(xiàn)中闡述MPEG-2 AAC編碼的細(xì)節(jié)ISO/IEC 13818-7: 1997(E)"InformaUon technology — Generic coding of moving pictures and associated audio information -, Part 7: Advanced Audio Coding (AAC),"Interiiational Standards Organization (1997年4月); Karlheinz Brandenburg的"MP3 and AAC Explained", AES 17th International Conference on High Quality Audio Coding, 1999年8 月;以及Bosi等人的"ISO/IEC MPEG-2 Advanced Audio Coding", AES預(yù)印4382, 101st AES Convention, 1996年10月。在以下文獻(xiàn)中闡述了包括Dolby編碼器、MPEG編碼器等的各 種感知編碼器的概況Karlheinz Brandenburg和Marina Bosi的 "Overview of MPEG Audio: Current and Future Standards for Low-Bit-Rate Audio Coding", J. Audio Eng. Soc., Vol.45, No. 1/2, 1997年1月/2月。上述引用的所有參考文獻(xiàn)通觀引用全部合并于此。盡管本發(fā)明不限于在AC-3中使用,但是為了方便,將在AC-3 系統(tǒng)的環(huán)境中描述本發(fā)明。AC-3是用于在包括數(shù)字電視、DVD視頻 和DVD音頻的應(yīng)用中傳送音頻的數(shù)字音頻數(shù)據(jù)壓縮系統(tǒng)。AC-3比特 流包括兩種關(guān)鍵分量音頻內(nèi)容和元數(shù)據(jù)。使用感知音頻編碼來壓縮 1到6個聲道的音頻內(nèi)容。在AC-3中的各種類型的元數(shù)據(jù)中,存在
若干音頻元數(shù)據(jù)參數(shù),其特別用于改變傳送到收聽環(huán)境的節(jié)目的聲 音。這些將在下面進(jìn)行描述。AC-3系統(tǒng)在二進(jìn)制信息幀中傳送包括數(shù)據(jù)壓縮的音頻的比特 流。每幀包含數(shù)字音頻的1536個樣點的音頻內(nèi)容和元數(shù)據(jù)。對于 48kHz的采樣率,意味著32毫秒的數(shù)字音頻或者音頻的每秒31.25幀 的速率。每幀中包含的比特數(shù)量取決于正在傳送的聲道數(shù)量以及應(yīng)用 于所述聲道的數(shù)據(jù)壓縮量。例如,DVD視頻盤通常以每秒448,000比 特的數(shù)據(jù)率或1792字節(jié)(1字節(jié)有8比特)的幀大小來傳送6個聲道 的音頻。將每個AC-3幀劃分成片段。所述片段包括(1)同步信息(SI), 其包含同步字(SW)、兩個糾錯字中的第一糾錯字(CRC1) ; (2) 比特流信息(BSI),其包含多數(shù)元數(shù)據(jù);(3)6個音頻塊(AB0-AB5 ), 其包含數(shù)據(jù)壓縮的音頻內(nèi)容;(4)無用比特(W),其包含任何在 音頻內(nèi)容被壓縮之后剩下的未使用比特;(5)輔助(AUX)信息, 其包含更多元數(shù)據(jù);以及(6)所述兩個糾錯字中的第二糾錯字 (CRC2)。上述項在稍后進(jìn)一步描述的圖9中示出。在以上引用的 AC-3參考文獻(xiàn)以及以下對圖9的描述中詳細(xì)描述了 AC-3幀,其包括 感知音頻數(shù)據(jù)壓縮以及伴隨的元數(shù)據(jù)。如上所述,在AC-3中,存在若干音頻元數(shù)據(jù)參數(shù),其特別用于 改變傳送到收聽環(huán)境的節(jié)目的聲音。這些將在下面進(jìn)行描述。這些元 數(shù)據(jù)參數(shù)中的以下三個參數(shù)涉及重放信號電平以及動態(tài)范圍 DIALNORM、 COMPR和DYNRNG。 DIALNORM參數(shù)影響音頻重 放信號電平,而相關(guān)的COMPR和DYNRNG參數(shù)有時在下面被稱為 "動態(tài)范圍壓縮"參數(shù)一影響音頻重放信號的電平。根據(jù)解碼模式,在 解碼中使用COMPR和DYNRNG參數(shù)之一或者不使用兩者中的任何 一個,但是不會全部使用這兩個參數(shù)。盡管當(dāng)用戶沒有設(shè)置值時存在 默認(rèn)的DIALNORM值,但是DIALNORM通常由用戶來設(shè)置(該參 數(shù)不會自動產(chǎn)生)。例如,用戶或"內(nèi)容創(chuàng)建者"可利用AC-3編碼器 外部的處理或裝置進(jìn)行響度測量,隨后將結(jié)果傳遞到編碼器。因此,
依靠用戶來正確地設(shè)置DIALNORM參數(shù)值。COMPR和DYNRNG 參數(shù)盡管涉及DIALNORM參數(shù),但是通常響應(yīng)于多個動態(tài)范圍壓縮 簡檔(profile)之一 (或者不存在簡檔,這將導(dǎo)致應(yīng)用DIALNORM 但是允許再現(xiàn)全動態(tài)范圍)以及用戶設(shè)置的DIALNORM參數(shù)值在編 碼期間自動計算COMPR和DYNRNG參數(shù)。每個這種簡檔包含標(biāo)準(zhǔn) 音頻動態(tài)壓縮參數(shù)信息,所述信息包括上升時間常數(shù)和釋放時間常 數(shù),以及壓縮率。在收聽環(huán)境中影響聲音的其它元數(shù)據(jù)參數(shù)包括各種 縮混(downmixing )參數(shù)CLEV、 CMIXLEV、 SLEV、 SURMIXLEV、 MIXLEVEL和MIXLEVEL2。這種縮混元數(shù)據(jù)提供用于解碼器將原 始的5.1聲道縮混為較少數(shù)量的再現(xiàn)聲道(例如,1或2個聲道)的 指令。DIALNORM參數(shù)允許在解碼任何AC-3比特流時均勻地再現(xiàn)口 語對話。將普通口語對話的主觀聲級(level)用作參考。因此,再現(xiàn) 系統(tǒng)增益變?yōu)槭章犝咂谕挠糜趯υ挼脑佻F(xiàn)聲壓級別和DIALNORM 值兩者的函數(shù)。盡管原則上,可在解碼(在數(shù)字域或模擬域進(jìn)行)之 后將DIALNORM值應(yīng)用于時域以調(diào)整重放增益,但是AC-3解碼器 通常在解碼器內(nèi)將DIALNORM值用于數(shù)字域中以對增益進(jìn)行縮放, 這引起對重放增益的調(diào)整。盡管存在用于方便且容易地測量音頻內(nèi)容中對話的聲級的有用 工具(例如,Dolby LM100響度儀),并且AC-3提供用于傳達(dá)對話 的聲級的元數(shù)據(jù)(使用DIALNORM參數(shù)),但是在沒有將壓縮音頻 完全解碼為PCM并且沒有利用被認(rèn)可的測量技術(shù)執(zhí)行響度測量的情 況下,不存在校驗AC-3比特流中的DIALNORM值是否被正確設(shè)置 以及是否域音頻的真實對話響度值匹配的方法。在Smithers等人于 2004年7月1日提交的第10/884,177號題為"Method for Correctingthe Playback Loudness and Dynamic Range of AC-3 (Dolby Digital) Compressed Audio Information"的美國專利申請中描述了所述全解 碼方式。所述申請通過引用全部合并于此。存在幾種導(dǎo)致AC-3比特流中的DIALNORM參數(shù)會不正確的不同原因。首先,如上所述,如果內(nèi)容創(chuàng)建者沒有設(shè)置DIALNORM值, 則每個AC-3編碼器具有默認(rèn)的DIALNORM值,該DIALNORM值 在產(chǎn)生比特流期間被使用。所述默認(rèn)值通常被選為-27dB,該值可能 與音頻的實際對話響度聲級非常不同。其次,即使內(nèi)容創(chuàng)建者測量響 度并相應(yīng)地設(shè)置了 DIALNORM參數(shù),但是所使用的響度測量算法或 儀器可能不符合所推薦的AC-3響度測量方法,這將導(dǎo)致不正確的 DIALNORM值。第三,即使通過由內(nèi)容創(chuàng)建者測量并正確設(shè)置的 DIALNORM值創(chuàng)建了 AC-3比特流,但是在比特流的傳輸和/或存儲 期間,其可能已經(jīng)變?yōu)椴徽_的值。例如,在電視廣播應(yīng)用中,經(jīng)常 使用不正確的DIALNORM元數(shù)據(jù)信息來解碼、修改隨后重新編碼 AC-3比特流。因此,盡管DIALNORM值總是包含在AC-3比特流中, 但是其可能不正確或者不準(zhǔn)確,因此,會給收聽體驗帶來質(zhì)量上的負(fù) 面影響。因此,需要一種用于校驗AC-3比特流中的DIALNORM參數(shù)是 否由內(nèi)容創(chuàng)建者正確地設(shè)置并且是否在分配和傳輸期間沒有改變的 方法。優(yōu)選地,這種校驗不應(yīng)改變AC-3比特流的標(biāo)準(zhǔn)語法,從而比 特流保持與現(xiàn)有AC-3解碼器的兼容(即,保持向后兼容性)。


圖1是^f艮據(jù)本發(fā)明各方面的用于產(chǎn)生比特流的配置的功能示意框圖。圖2是用于比特流中的元數(shù)據(jù)校驗數(shù)據(jù)的格式示例的抽象表示。 圖3實際上是示出圖4的流程圖中的判斷步驟的細(xì)節(jié)的判斷流程圖。圖4實際上是與確保比特流具有正確的元數(shù)據(jù)和匹配元數(shù)據(jù)校 驗數(shù)據(jù)相關(guān)的用于理解本發(fā)明各方面的判斷流程圖。圖5是用于實施圖4的步驟404到413的各個子集的配置的功能 示意框圖。圖6a是用于實施圖4的步驟408到410的子集的配置的功能示
意框圖。圖6b是用于實施圖4的步驟408和411到413的子集的配置的 功能示意框圖。圖7是示出用于實施重新打包比特流功能的配置或圖6a的裝置 的功能示意框圖。圖8實際上是用于理解本發(fā)明中與知道校驗數(shù)據(jù)的解碼有關(guān)的 各方面的判斷流程圖。圖9a是示出AC-3串行編碼的比特流的幀的示意圖。該圖不是 按照比例顯示的。圖9b是更詳細(xì)地示出AC-3串行編碼的比特流的SI部分的示意 圖。該圖不是按照比例顯示的。圖9c是更詳細(xì)地示出AC-3串行編碼的比特流的比特流頭部信 息(BSI)部分的示意圖。該圖不是按照比例顯示的。圖9d是更詳細(xì)地示出AC-3串行編碼的比特流的音頻塊部分的 示意圖。該圖不是按照比例顯示的。圖9e是AC-3編碼器或編碼功能的功能示意框圖。圖10a是示出三種示例性音頻項的DIALNORM聲級和動態(tài)范圍 的假設(shè)圖。圖10b是示出三種示例性音頻項在重放期間的DIALNORM聲 級和動態(tài)范圍的假設(shè)圖。圖lla是示出關(guān)于三種示例性音頻項的動態(tài)范圍控制參數(shù)的效 果的假設(shè)圖。圖lib是示出關(guān)于三種示例性音頻項在重放期間的DIALNORM 和動態(tài)范圍控制參數(shù)的效果的假設(shè)圖。發(fā)明內(nèi)容可將本發(fā)明看作具有若干方面,所有這些方面均涉及音頻元數(shù)據(jù) 校驗信息。所述方面中的某些包括以下項(1)編碼的音頻比特流,其具有正確的元數(shù)據(jù)以及校驗所述15
元數(shù)據(jù)的至少一部分的正確性的信息;(2) 如下處理方法或裝置,其產(chǎn)生編碼的音頻比特流,所述 編碼的音頻比特流具有正確的元數(shù)據(jù)以及校驗所述元數(shù)據(jù)的至少 一部分的正確性的信息;(3) 如下處理方法或裝置,其確保編碼的音頻比特流具有正 確的元數(shù)據(jù),并且還包含校驗所述元數(shù)據(jù)的至少一部分的正確性的 信息;以及(4) 如下處理方法或裝置,其無論編碼的音頻比特流的所有 元數(shù)據(jù)是否正確均對所述編碼的音頻比特流進(jìn)行解碼,產(chǎn)生并替代 糾正的元數(shù)據(jù),如果存在校驗所述元數(shù)據(jù)的至少一部分的正確性的 信息,則考慮該信息。在權(quán)利要求以及說明書和附圖中闡述本發(fā)明的其它方面。 應(yīng)注意到音頻元數(shù)據(jù)校驗信息不承擔(dān)提供比特差錯檢查和/或 糾正的功能。攜帶校驗信息的比特流通常具有某種比特差錯檢查和/ 或糾正,例如,AC-3比特流中的CRC碼字。在本發(fā)明的各方面中, 元數(shù)據(jù)因為以下原因可能不正確例如,元數(shù)據(jù)開始沒有被正確設(shè)置, 或者即使開始被正確設(shè)置,但是由于人為干預(yù)或其它原因在傳輸或存 儲期間被改變,但是元數(shù)據(jù)的不正確并不是由于傳輸或存儲中的比特 差錯所引起。事實上,因為音頻元數(shù)據(jù)校驗信息的目的在于在元數(shù)據(jù) 不正確的情況下將所述元數(shù)據(jù)改變?yōu)檎_的值,所以元數(shù)據(jù)校驗信息 的目的不在于進(jìn)行比特差錯檢測或糾正。比特差錯糾正僅僅糾正元數(shù) 據(jù)的比特差錯,但是盡管沒有了比特差錯,元數(shù)據(jù)本身的不正確仍舊 沒有被糾正。換言之,音頻元數(shù)據(jù)校驗信息涉及作為代表元數(shù)據(jù)的比 特的基礎(chǔ)的信息的正確性,而不是所述比特本身的正確性。盡管在這里描述的本發(fā)明各方面的示例中,編碼的音頻比特流是 Dolby Digital (AC-3)編碼的比特流,元數(shù)據(jù)的集合為DIALNORM 以及相關(guān)的動態(tài)范圍控制元數(shù)據(jù),并且校驗信息相應(yīng)于正確的 DIALNORM元數(shù)據(jù),但是本發(fā)明的各方面可應(yīng)用于其它編碼系統(tǒng)以 及所述編碼系統(tǒng)的比特流中的其它元數(shù)據(jù)??墒褂帽景l(fā)明的各方面的 其它音頻編碼系統(tǒng)包括例如,Dolby E系統(tǒng)和MPEG-4AAC系統(tǒng)。 關(guān)于Dolby Digital,元數(shù)據(jù)可以是除DIALNORM以及相關(guān)的動態(tài)范 圍控制元數(shù)據(jù)之外的縮混元數(shù)據(jù)(在這種情況下,校驗信息還涉及縮 混元數(shù)據(jù)),或者替代DIALNORM以及相關(guān)的動態(tài)范圍控制元數(shù)據(jù) 的縮混元數(shù)據(jù)(在這種情況下,作為替代,校驗信息涉及縮混元數(shù)據(jù))。在編碼的音頻比特流中,可按照所述比特流向后兼容現(xiàn)有或舊有 處理和裝置的方式攜帶校驗信息。在這里描述的本發(fā)明各方面的示例 中,在上述AC-3無用比特中攜帶校驗信息,在其它方式中所述無用 比特將不攜帶有用信息并且通常被標(biāo)準(zhǔn)AC-3解碼器忽略。其它音頻 編碼系統(tǒng)具有"無用"比特或者可用并且通常被標(biāo)準(zhǔn)解碼器忽略的類 似比特(有時稱為"空,,比特、"填充,,比特等),例如,諸如MPEG-4 AAC中的數(shù)據(jù)流元素的附加數(shù)據(jù)字段、用戶定義的數(shù)據(jù)片段。然而, 某些編碼系統(tǒng)中的所述比特不會被編碼/解碼操作破壞,當(dāng)本發(fā)明各方 面在AC-3編碼系統(tǒng)中時,上述特征為本發(fā)明各方面的有用特征。在 Truman等的第6,807,528B1號題為"Adding Data to a Compressed Data Frame"美國專利中7>開了在編碼比特流中的"無用"比特或類似 比特中攜帶數(shù)據(jù)的技術(shù),該專利通過引用全部合并于此。還可通過將校驗信息"隱藏,,的方式在編碼的音頻比特流中攜帶 所述校驗信息。例如,在無用比特中攜帶的校驗信息可被加密。隱藏 校驗數(shù)據(jù)的好處在于某些故意改變編碼的音頻比特流中的 DIALNORM的人將難以改變或者無法改變校驗信息。盡管不是每個AC-3幀均具有足夠的未使用數(shù)據(jù)比特來傳遞附加 信息,但是當(dāng)DIALNORM值在整個節(jié)目期間恒定時就不存在問題-這是因為至少某些AC-3幀具有足夠的未使用數(shù)據(jù)比特以用于校驗數(shù) 據(jù)就足夠了?;蛘?,作為在可被編碼的無用比特中攜帶校驗信息的替代方式, 可使用諸如在以下專利中描述的技術(shù)將校驗信息隱秘 (steganographically)編碼為比特流:Watson等人在2001年8月15 日提交的(PCT)題為"Modulating One or More Parameters of an Audio or Video Perceptual Coding System in Response to Supplemental Information"的第10/344,388號美國專利申請,其于 2004年2月5日作為US 2004/0024588A1公開。所述申請通過引用全 部合并于此。隱秘編碼的優(yōu)點在于其保持向后兼容性,還隱藏所述數(shù) 據(jù)。然而,缺點在于對比特流進(jìn)行解碼和重新編碼不會擦除或"清 除"校驗信息(如以下進(jìn)一步所討論的)。最簡單的形式的校驗數(shù)據(jù)可以是正確的DIALNORM值(連同適 當(dāng)?shù)慕M幀或同步和標(biāo)識數(shù)據(jù))的副本。因為AC-3比特流中的未使用 比特通常被設(shè)置為空值或隨機(jī)值,但是與DIALNORM校驗數(shù)據(jù)格式 匹配的AC-3比特流中存在未使用數(shù)據(jù)比特的可能性很低。此外,如 通常情況,當(dāng)每個編碼的AC-3節(jié)目僅使用一個恒定DIALNORM值 時,包含在未使用數(shù)據(jù)比特中的DIALNORM校驗信息也是恒定的固 定值。在這種情況下,檢查一系列AC-3幀中DIALNORM校驗數(shù)據(jù)如果實時連續(xù)地對AC-3比特流執(zhí)行DIALNORM測量、元數(shù)據(jù) 產(chǎn)生和校驗數(shù)據(jù)插入,則整個節(jié)目期間的恒定DIALNORM值不會出 現(xiàn)。在這種情況下,可通過分析一系列AC-3幀(其會包含各種 DIALNORM元數(shù)據(jù)值)和檢查置于未使用數(shù)據(jù)比特中的 DIALNORM校驗字段在它們存在時匹配于DIALNORM值,而執(zhí)行 校驗。為了減少未使用數(shù)據(jù)字段中的隨機(jī)數(shù)據(jù)匹配DIALNORM參數(shù) 值的可能性,會需要最少數(shù)量的匹配DIALNORM和DIALNORM校 驗數(shù)據(jù)字段。本發(fā)明的另一方面在于優(yōu)選地僅允許已認(rèn)可的處理或裝置將 DIALNORM校驗數(shù)據(jù)寫入AC-3比特流。這樣處理確保了校驗數(shù)據(jù) 的有效性。因此,盡管由于上述原因而無法保證DIALNORM元數(shù)據(jù) 參數(shù)值的正確性是正確的,但是可在確保精確性的情況下使用 DIALNORM校驗數(shù)據(jù)。此外,因為DIALNORM校驗數(shù)據(jù)被置于 AC-3比特流的其它未使用數(shù)據(jù)比特中,所以克服了正確的 DIALNORM參數(shù)被破壞的問題。如果包含有效校驗數(shù)據(jù)的AC-3比
特流被解碼和重新編碼,則即使使用相同的AC-3 DIALNORM元數(shù) 據(jù)值,作為重新編碼的結(jié)果替代DIALNORM校驗數(shù)據(jù)的作為結(jié)果生 成的未使用數(shù)據(jù)比特將保持正確的可能性較高。這確保校驗的AC-3 比特流的任何附加處理將"清除"校驗數(shù)據(jù)(如以下所解釋的,除非已 認(rèn)可的具有響度測量的AC-3編碼器和校驗?zāi)芰Ρ挥糜谥匦绿幚?。本發(fā)明的這些和其它方面將被更好地理解為用于實現(xiàn)本發(fā)明的 以下方式。
具體實施方式
產(chǎn)生具有正確的DIALNORM和匹配校驗數(shù)據(jù)的AC-3比特流本發(fā)明的該方面涉及創(chuàng)建具有正確的DIALNORM參數(shù)值和具 有匹配DIALNORM校驗數(shù)據(jù)的AC-3比特流。圖1示出包括兩個部件的配置100,所述兩個部件為改進(jìn)型 AC-3編碼功能或改進(jìn)型AC-3編碼器("改進(jìn)型AC-3編碼,,)102和 對話聲級測量功能或?qū)υ捖暭墱y量器("測量對話的聲級")104。 PCM 音頻101;故應(yīng)用于改進(jìn)型AC-3編碼102和測量對話的聲級104兩者。 改進(jìn)型AC-3編碼可以與標(biāo)準(zhǔn)AC-3編碼器或編碼功能相同,只是改 進(jìn)型AC-3編碼還能夠接受DIALNORM校驗數(shù)據(jù)并按照上述某種適 合的方式將DIALNORM校驗數(shù)據(jù)插入AC-3比特流。改進(jìn)型AC-3 編碼提供包括DIALNORM校驗數(shù)據(jù)的向后兼容的AC-3比特流輸出。 測量對話的聲級104分析輸入的PCM,計算正確的DIALNORM值, 并將其發(fā)送(經(jīng)由103 )到改進(jìn)型AC-3編碼102。在普通AC-3編碼中,可用未使用比特的數(shù)量直接與音頻的復(fù)雜 性有關(guān)(即,按照期望的比特率對音頻進(jìn)行編碼的難度)。因為每個 AC-3音頻幀可用的比特數(shù)量是固定的,所以越難對音頻進(jìn)行編碼, 用于達(dá)到某個等級的質(zhì)量的比特越多,因此,用于編碼處理且可用于 攜帶DIALNORM校驗數(shù)據(jù)的比特越少。所以,更易于進(jìn)行編碼的音特。因此,對改進(jìn)型AC-3編碼器而言可選但是有用的改進(jìn)在于能夠
指定編碼處理在編碼期間不使用的最少數(shù)量的數(shù)據(jù)比特的能力。假設(shè)需要少量的比特來傳達(dá)DIALNORM校驗數(shù)據(jù)(如以下所描述的), 故意保留一些未使用數(shù)據(jù)比特對于編碼的音頻信號的影響很小,或者 沒有影響。測量對話的聲級可通過首先隔離主要包含講話的音頻內(nèi)容的片段來執(zhí)行對于對 話的響度聲級的測量。所述方法在以下專利中進(jìn)行描述Vinton等人 的第10/233,073號題為"Controlling Loudness of Speech in Signals That contain Speech and Other Types of Audio Information,,的美國 專利,其于3月4日作為US2004/0044525Al/^開。所述申請通過引 用全部合并于此。然而,可使用其它方法。隨后將主要作為講話的音 頻片段傳遞到響度測量算法。在AC-3中,所述算法為標(biāo)準(zhǔn)A權(quán)重功 率測量。還可使用其它響度測量,包括B權(quán)重或C權(quán)重功率測量, 或者基于響度的心理聲學(xué)模型的響度測量。相對于音頻數(shù)字全標(biāo)度 (full-scale)正弦波形(0dBFS)來計算功率測量。對于講話片段的隔離不是必需的,然而,這一處理提高了測量的 精度并在收聽者看來提供了更加令人滿意的結(jié)果。因為并非所有的音 頻內(nèi)容均包含講話,所以當(dāng)存在講話時,整個音頻內(nèi)容的響度測量可 足夠接近音頻的對話聲級。如果對于連續(xù)比特流而不是有限長度的比特流操作該方法,則可 連續(xù)更新所述測量,并且所述測量可代表對話的聲級(例如,僅代表 最后幾秒鐘)。如果對于預(yù)先存儲的有限長度的比特流(諸如存儲在 硬盤上的音頻文件)操作該方法,則可分析整個節(jié)目,并計算單個 DIALNORM值。改進(jìn)型AC-3編碼102使用改進(jìn)型AC-3編碼對輸入音頻PCM進(jìn)行編碼,所述改進(jìn)型 AC-3編碼使用計算的DIALNORM值來設(shè)置比特流DIALNORM以 及有關(guān)的動態(tài)范圍壓縮元數(shù)據(jù)參數(shù)。所述改進(jìn)型AC-3編碼可以與普 通AC-3編碼相同,只是在改進(jìn)型AC-3編碼中,如上所述的附加響
度測量功能或裝置104明確并正確地測量DIALNORM參數(shù)值并將其 提供給編碼器,以便所述DIALNORM參數(shù)值被包括在比特流中。改 進(jìn)編碼器還創(chuàng)建DIALNORM校驗數(shù)據(jù)并將其插入AC-3的其它未使 用數(shù)據(jù)比特,原因在于在該示例中,已認(rèn)可的DIALNORM測量處理 已經(jīng)提供客觀測量。由改進(jìn)型AC-3編碼102產(chǎn)生的AC-3比特流優(yōu) 選地符合在以上引用的A/52A文獻(xiàn)中定義的AC-3比特流的標(biāo)準(zhǔn),使 得與現(xiàn)有AC-3解碼器向后兼容。如果改進(jìn)型AC-3編碼還具有指定最少數(shù)量的未使用數(shù)據(jù)比特的 能力,則其可通過改變每個AC-3幀中可用于音頻編碼的比特總數(shù)的 值來實現(xiàn)。例如,如果可用于AC-3編碼處理的比特數(shù)量通常為 N—TOTAL—ENCODE—BITS , 并且期望至少擁有 N—TOTAL—VERIFICATION—BITS,則可用的編碼比特的新的總數(shù)將 為(N—TOTAL ENCODE BITS-N—TOTAL VERIFICATION—BITS ), 并且按照通常情況進(jìn)行音頻編碼處理。DIALNORM校驗數(shù)據(jù)的格式為了容易地識別DIALNORM校驗數(shù)據(jù)并在不經(jīng)過解碼的情況 下從AC-3比特流讀取所述DIALNORM校驗數(shù)據(jù),數(shù)據(jù)具有預(yù)先定 義的格式將是有用的。圖2概述用于按照字節(jié)對齊的方式來存儲 DIALNORM校驗數(shù)據(jù)的適合格式,其使得從未解碼的AC-3比特流 定位并讀取數(shù)據(jù)變得簡單(在實時AC-3比特流或存儲為數(shù)字文件的 AC-3比特流的情況下)。所述格式并非決定性的,可使用其它格式。 如圖2所示,用于DIALNORM校驗數(shù)據(jù)的示例格式包括若干連續(xù)的 字節(jié)。第一字節(jié)是預(yù)先定義的DIALNORM校驗頭部字節(jié)。該頭部字 節(jié)可采用任何值,然而,優(yōu)選的是非零值(與AC-3 SYNCWORD類 似但不相同),這是因為在其它AC-3比特流中,未使用數(shù)據(jù)比特被 初始化到0值。在該示例中的DIALNORM校驗頭部之后,數(shù)據(jù)字節(jié) 用于傳遞DIALNORM校驗和附加可選數(shù)據(jù)。因為標(biāo)準(zhǔn)AC-3 DIALNORM值包括5比特,所以一個數(shù)據(jù)字節(jié)提供三個附加數(shù)據(jù)比 特,兩個數(shù)據(jù)字節(jié)提供11個附加數(shù)據(jù)比特。在圖2的示例中示出對
兩個DIALNORM校驗數(shù)據(jù)字節(jié)的使用。這些字節(jié)可用于存儲諸如所 使用的響度算法類型或版本的信息或其它信息。圖2所示的最后字節(jié) 是循環(huán)冗余校驗(CRC)數(shù)據(jù)字節(jié),使用DIALNORM校驗頭部和數(shù) 據(jù)字節(jié)來計算所述CRC數(shù)據(jù)字節(jié)。該字節(jié)的用處在于其大大減少了 AC-3比特流中未使用數(shù)據(jù)比特(包含具有有效DIALNOMR校驗頭 部字節(jié)、兩個中間數(shù)據(jù)字節(jié)和CRC字節(jié)的比特序列)經(jīng)過對全部四 個字節(jié)進(jìn)行CRC檢查的可能性。如先前所討論的,如果改進(jìn)型AC-3編碼器預(yù)留足夠的未使用數(shù) 據(jù)比特來包含DIALNORM校驗數(shù)據(jù),則在圖2概述的結(jié)構(gòu)中,對于 每個1792字節(jié)的AC-3數(shù)據(jù)幀僅需要四個字節(jié)或32比特,這僅相應(yīng) 于總數(shù)據(jù)的0.2%。確保AC-3比特流具有正確的DIALNORM和匹配校驗數(shù)據(jù) 本發(fā)明的另 一方面在于確保AC-3比特流中的DIALNORM值正 確并且比特流具有匹配DIALNORM校驗信息。本發(fā)明的這一方面在 圖4的示例性流程圖中闡述。如以下所解釋的,可采用所有圖4處理 或圖4處理的子集。例如,所述處理或采用所述處理的步驟的裝置可 用于在由內(nèi)容創(chuàng)建者創(chuàng)建比特流之后以及對于收聽者進(jìn)行比特流的 最終解碼之前,傳輸或存儲所述比特流。應(yīng)理解圖4的步驟及其子集可代表一個或多個處理的各部分,或者可以是在一個或多個裝置中 執(zhí)行的功能??蓪Υ碛邢揲L度音頻項的音頻的比特流執(zhí)行圖4的步驟。例 如,音頻項包括以數(shù)字形式存儲在文件服務(wù)器等的電視節(jié)目或廣告。 如這里所使用的,"音頻項"是連續(xù)的音頻信息段;例如,30秒的電視 廣告或整個電影(運(yùn)動圖像)。然而,圖4的步驟還可用于測量和更 新AC-3幀的連續(xù)實時的比特流,例如,代表電視臺或聲道的音頻的 連續(xù)AC-3比特流。測試DIALNORM校驗數(shù)據(jù)的存在(圖3和圖4的步驟401) 如圖4所示,執(zhí)行第一步驟(步驟401 )以確定AC-3 DIALNORM 校驗數(shù)據(jù)是否存在于編碼的AC-3比特流中。圖3示出用于執(zhí)行所述
檢查的的示例性流程圖。如圖3所示,輸入是可按照逐幀為基礎(chǔ)來處 理的AC-3音頻比特流。因為已知未使用數(shù)據(jù)比特在AC-3幀中的位 置,所以不必對整個幀或比特流執(zhí)行徹底的搜索一搜索可開始于未使 用比特片段的開端。盡管DIALNORM校驗數(shù)據(jù)包括連續(xù)的數(shù)據(jù)字節(jié), 但是所述數(shù)據(jù)可以是與其它AC-3幀數(shù)據(jù)對齊的字節(jié),也可以不是與 其它AC-3幀數(shù)據(jù)對齊的字節(jié)。因此,圖3的處理中的第一步驟(步 驟301)"從比特流讀取數(shù)據(jù),,可要求逐比特地讀取數(shù)據(jù)并從每一個讀 取的比特構(gòu)建連續(xù)的數(shù)據(jù)字節(jié)。在圖3的示例中的步驟303,將從AC-3幀讀取的每個數(shù)據(jù)字節(jié) 與預(yù)先定義的DIALNORM校驗頭部字節(jié)進(jìn)行比較。如果字節(jié)不匹配, 則讀取更多數(shù)據(jù)并執(zhí)行另一字節(jié)比較。如果所述字節(jié)值匹配頭部值, 則讀取所述匹配字節(jié)之后的連續(xù)的數(shù)據(jù)字節(jié)。如果匹配校驗頭部字節(jié) 的字節(jié)靠近AC-3幀的末尾(如步驟302所確定的),并且三個字節(jié) 的后續(xù)數(shù)據(jù)不可用,則中斷數(shù)據(jù)搜索。四個字節(jié)(包括如圖2概述的 匹配校驗頭部字節(jié))用于在步驟304計算CRC檢查。如果CRC檢查 通過(步驟305 ),則DIALNORM校驗數(shù)據(jù)存在,并且如以下進(jìn)一 步所述,可從數(shù)據(jù)字節(jié)檢索DIALNORM校驗信息。測試DIALNORM校驗數(shù)據(jù)是否匹配AC-3 DIALNORM數(shù)據(jù) (402 )如圖4的步驟401所示,當(dāng)DIALNORM校驗數(shù)據(jù)存在時(步驟 401的輸出為"是,,),進(jìn)行下一步驟(步驟402)以確定所述校驗數(shù) 據(jù)是否匹配AC-3 DIALNORM值。如圖9所示,按照以下進(jìn)一步所 討論的,普通DILANORM數(shù)據(jù)的位置和格式是已知的,并且可從 AC-3比特流容易地讀取。用于確定普通DIALNORM和校驗 DILANORM值是否匹配的測試是簡單的數(shù)值比較。如果所述值匹配, 則普通DIALNORM值是正確的,并且不需要進(jìn)一步分析或處理。如 果所述兩個值之差的絕對值小于閾值,則可認(rèn)為所述值足夠"匹配"。 如果期望的話,則可將所述閾值設(shè)置為等于O,但是在優(yōu)選的實現(xiàn)中, 選擇閾值以在以下各項之間進(jìn)行權(quán)衡元數(shù)據(jù)參數(shù)的精確性、實現(xiàn)本
發(fā)明所需的計算資源的成本、以及DI ALNORM值與校驗值之差會在 重放期間使音頻信息的質(zhì)量降級的可能性。閾值3 (3dB)可能適合 于許多應(yīng)用。可對AC-3比特流輸出進(jìn)行存儲、傳輸或解碼。利用DIALNORM校驗數(shù)據(jù)糾正普通AC-3 DIALNORM數(shù)據(jù) (步驟403 )當(dāng)DIALNORM校驗數(shù)據(jù)被從AC-3比特流提取并且與普通 AC-3 DIALNORM元數(shù)據(jù)不匹配時(步驟402的輸出為"否"),隨后, 利用校驗DIALNORM值來更新DIALNORM元數(shù)據(jù)(即,將 DIALNORM元數(shù)據(jù)設(shè)置或產(chǎn)生為與校驗DIALNORM值相同) (403)。因為普通DIALNORM值已經(jīng)凈皮確定為不正確并且應(yīng)該祐: 更新,所以有關(guān)的AC-3動態(tài)范圍壓縮元數(shù)據(jù)可能也不正確。因此, 應(yīng)該分析動態(tài)范圍壓縮信息,如果它正確,則僅更新DIALNORM元 數(shù)據(jù)參數(shù)。如果動態(tài)范圍壓縮信息不正確,則也應(yīng)該將其更新。以下 結(jié)合圖4的步驟409到413以及圖6a、圖6b和圖9c來進(jìn)一步解釋所 述分析和更新的細(xì)節(jié)。沒有在AC-3比特流中的校驗數(shù)據(jù)DIALNORM元數(shù)據(jù)正確(步驟404-407 )如圖4的示例所示,如果DIALNORM校驗數(shù)據(jù)沒有包含在AC-3 比特流之內(nèi)(步驟401的輸出為"否"),則在不應(yīng)用DIALNORM參 數(shù)以及有關(guān)的動態(tài)范圍控制參數(shù)的情況下(因為這些元數(shù)據(jù)參數(shù)可能 不正確)將AC-3比特流解碼為PCM,從而解碼的音頻內(nèi)容與用于創(chuàng) 建比特流的編碼器的輸入位于相同聲級(步驟404)。隨后,測量對 話的響度以確定正確的DIALNORM聲級(步驟405)。所述測量可 通過上述測量對話的聲級104的裝置或功能來實現(xiàn)。在步驟405測量 對話的聲級之后,在步驟406將測量的值與AC-3 DIALNORM元數(shù) 據(jù)進(jìn)行比較(以下給出所述比較的細(xì)節(jié))。如步驟406的"是"輸出之 后所示,如果普通DIALNORM元數(shù)據(jù)正確,則僅需要的動作為將 DIALNORM校驗數(shù)據(jù)格式化并將其存儲在AC-3比特流中(步驟 407)。
如上所述,可用的未使用數(shù)據(jù)比特的數(shù)量取決于音頻的復(fù)雜性,并且某些AC-3幀可能不具有足夠的未使用數(shù)據(jù)比特以將 DIALNORM校驗數(shù)據(jù)存儲在每一幀中。可進(jìn)行以下兩種選項將校 驗數(shù)據(jù)僅存儲在具有足夠的未使用數(shù)據(jù)比特的AC-3幀中(在這種情 況下,可將DIALNORM校驗數(shù)據(jù)插入原始的輸入AC-3比特流中, 而不是插入通過對步驟404解碼的AC-3比特流重新編碼產(chǎn)生的AC-3 比特流中);或者對通過步驟404的AC-3解碼產(chǎn)生的音頻進(jìn)行重新 編碼,預(yù)留足夠數(shù)量的未使用數(shù)據(jù)比特來保證校驗數(shù)據(jù)適合每一 幀。對步驟404的AC-3解碼以及步驟405的響度測量的替換選擇在 于通過不需要對AC-3比特流進(jìn)行完整解碼的技術(shù)來獲得響度的近 似。所述技術(shù)對諸如AC-3比特流的比特流進(jìn)行部分解碼,以便基于 子帶指數(shù)(subband exponent)的幅度來獲得對編碼的音頻頻譜的粗 略估計,該技術(shù)^^開于Brett Graham Crockett、 Michael John Smithers、 Alan Jeffrey Seefeldt于本申請的同 一天提交的代理人案號 為DOL 157的美國臨時專利申請中。所述Crockett等人的DOL 157 號申請通過引用全部合并于此。圖5示出用于實施圖4的步驟404到413的各個子集的配置的示 例。如圖5所示,通過改進(jìn)型AC-3解碼功能或解碼器("AC-3解碼 器")502將AC-3幀501解碼為數(shù)字音頻503。在通過AC-3解碼器 502對AC-3幀進(jìn)行解碼期間,盡管如下所述,DIALNORM參數(shù)以及 動態(tài)范圍壓縮信息被恢復(fù)以進(jìn)行潛在的其它用途,但是所述 DIALNORM參數(shù)以及動態(tài)范圍壓縮信息被省略以便進(jìn)行音頻解碼, 從而解碼的音頻503與用于創(chuàng)建比特流的編碼器的輸入位于相同電平 并具有相同的動態(tài)范圍。對話聲級測量功能或?qū)υ捖暭墱y量器("測 量對話的聲級,,)504接收解碼的音頻503并計算對話的聲級505。測 量對話的聲級504可以是與以上結(jié)合圖1描述的測量對話的聲級104 相同的功能或裝置。AC-3解碼器502可執(zhí)行如上所述的步驟404,測 量對話的聲級504可執(zhí)行如上所述的步驟405。比特更新功能或更新 器("更新比特流,,)506將對話的聲級與出現(xiàn)在每一幀中的 DIALNORM參數(shù)進(jìn)行比較。以下給出所述比較的更多細(xì)節(jié)。此外, 根據(jù)步驟406和步驟408的判決,可執(zhí)行步驟407、步驟408-410 (參 見圖6a及其下面的描述)或步驟408和411-413 (參見圖6b及其下 面的描述)。當(dāng)執(zhí)行步驟407時,將DIALNORM校驗信息插入輸入 的AC-3比特流,保留原始DIALNORM和有關(guān)的動態(tài)范圍控制信息。 在執(zhí)行步驟407時,更新比特流506還在AC-3幀中搜索未使用數(shù)據(jù) 比特。對具有足夠數(shù)量的未使用數(shù)據(jù)比特的AC-3幀進(jìn)行改進(jìn),從而 未使用比特被更新為包含DIALNORM校驗數(shù)據(jù)?;蛘?,由AC-3解 碼502產(chǎn)生的解碼的音頻可被重新編碼,預(yù)留足夠數(shù)量的未使用數(shù)據(jù) 比特來保證校驗數(shù)據(jù)適合每一幀(在這種情況下,更新比特流506包 括諸如圖1的改進(jìn)型AC-3編碼102的改進(jìn)型AC-3編碼器)。更具體地說,在執(zhí)行步驟406時,更新比特流506將測量的對話 的聲級與如DIALNORM參數(shù)指示的對話的聲級進(jìn)行比較。 DIALNORM參數(shù)具有包括-31dB到-ldB,以ldB為增量的范圍。如 果測量的對話的聲級位于所述范圍之內(nèi)并且不同于來自所述比特流 的DIALNORM的值,則,利用測量的聲級(例如,進(jìn)行最接近ldB的 取整)來有條件地更新DIALNORM參數(shù)(當(dāng)確定是否存在足夠的未 使用比特可用于攜帶校驗信息時,所述更新為"有條件,,的)。如果所 述兩個值之差的絕對值小于閾值,則可認(rèn)為測量的對話的聲級不同于 所述比特流中的DIALNORM的值。如果期望的話,則可將所述閾值 設(shè)置為等于0,但是在優(yōu)選的實現(xiàn)中,選擇閾值以在以下各項之間進(jìn) 行權(quán)衡元數(shù)據(jù)參數(shù)的精確性、實現(xiàn)本發(fā)明所需的計算資源的成本、 以及DIALNORM值與測量的對話聲級之差會在重放期間使音頻信息 的質(zhì)量降級的可能性。閾值3 (3dB)可能適合于許多應(yīng)用。除了更 新比特流以包含正確的DIALNORM參數(shù)之外,更新比特流506還搜 索每一 AC-3幀中的未使用數(shù)據(jù)比特。如果某幀包含足夠數(shù)量的未使 用數(shù)據(jù)比特,則用DIALNORM校驗數(shù)據(jù)來替換所述未使用數(shù)據(jù)比特, 這表示已經(jīng)進(jìn)行精確的已認(rèn)可的響度測量處理,避過那且嵌入AC-3 比特流中的DIALNORM值是正確的。
沒有在AC-3比特流中的校驗數(shù)據(jù) DIALNORM元數(shù)據(jù)不正確在DIALNORM參數(shù)范圍之內(nèi)的響度(步驟408-410 )如圖4的示例所示,如果檢驗信息不存在(步驟401的輸出為 "否,,)并且現(xiàn)有AC-3 DIALNORM值不正確(步驟406的輸出為 "否,,),則應(yīng)該確定測量的響度聲級是否位于DIALNORM參數(shù)的有 效范圍之內(nèi)(步驟408)。當(dāng)測量的對話的聲級505位于如AC-3比 特流中所允許的DIALNORM參數(shù)的有效范圍之外時,DIALNORM 參數(shù)不具有足夠的范圍來傳遞所述聲級。也就是說,測量的聲級小于 -31dB或大于-ldB。如果DIALNORM參數(shù)具有足夠的范圍來傳遞所 述聲級(步驟408的輸出為"是,,),則如下執(zhí)行步驟409和410,所 述步驟409和410的進(jìn)一步細(xì)節(jié)結(jié)合圖6a和圖7示出。圖6a示出當(dāng)DIALNORM的值被改變并且DIALNORM校驗數(shù) 據(jù)被插入時,如何確定新的動態(tài)范圍壓縮信息(步驟409)以及如何 更新和重新打包比特流(步驟410)。如上所述,圖6a的示例時用于 執(zhí)行步驟408-410的圖5的更新比特流507的變型。圖6a的部件可被 描述如下。提取DIALNORM 602如圖5和圖6a所示,從AC-3比特流提取DIALNORM參數(shù)的 值一將未解碼的比特流501應(yīng)用于DIALNORM提取裝置或功能602 ("提取DIALNORM,,602 )。 確定動態(tài)范圍壓縮簡檔604如圖6a所示,動態(tài)范圍壓縮簡檔確定裝置或功能("確定動態(tài)范 圍壓縮簡檔,,604 )接收從未解碼的比特流提取的DIALNORM參數(shù)以 及AC-3解碼(圖5的502)的輸出,并確定動態(tài)范圍壓縮簡檔。AC-3 幀中的動態(tài)范圍壓縮元數(shù)據(jù)代表可在解碼期間應(yīng)用于音頻內(nèi)容的增 益改變。所述元數(shù)據(jù)作為兩種不同的參數(shù)存在。比特流信息(BSI) 中的COMPR參數(shù)具有-48.14dB到+ 47.88dB的范圍,并且是應(yīng)用于 整個音頻幀的縮放比例。每個音頻塊(AB)中的DYNRNG參數(shù)具有-24.06dB到+ 23.94dB的范圍,并且提供用于獨立地對每個塊進(jìn)行縮 放的手段。根據(jù)解碼模式,這些參數(shù)之一用于解碼器,或者所述參數(shù) 均不用于解碼器,而這些參數(shù)不會都用于解碼器。如上所述,使用DIALNORM參數(shù)以及多個動態(tài)范圍壓縮簡檔之 一,或者使用DIALNORM參數(shù)而不使用多個動態(tài)范圍壓縮簡檔中的 任何一個在編碼期間計算COMPR和DYNPNG參數(shù)。每個簡檔包含 標(biāo)準(zhǔn)音頻動態(tài)范圍壓縮參數(shù)信息,所述信息包括上升時間常數(shù)和釋放 時間常數(shù),以及壓縮率。因為DIALNORM被改變,所以比特流中的COMPR和 DYNRNG的值可能不再正確??稍诒忍亓髦斜A鬋OMPR和 DYNRNG不變,但是重放時的音頻會表現(xiàn)出劇烈和惱人的增益波動 并/或?qū)е陆獯a器過栽(或數(shù)字限幅)。更好的方式為更新COMPR 和DYNRNG參數(shù)。最好在知道用于計算它們的原始值的動態(tài)范圍壓 縮筒檔的情況下實現(xiàn)所述更新。因為關(guān)于簡檔的信息不存在于比特流 中,所以可選擇任意簡檔(同時包括禁用動態(tài)范圍壓縮),或者可從 比特流中的原始COMPR和DYNRNG值推導(dǎo)所述簡檔。推導(dǎo)簡檔會 更接近地匹配內(nèi)容創(chuàng)建者關(guān)于動態(tài)范圍壓縮的原始意圖。在確定動態(tài)范圍壓縮簡檔604中,解碼的音頻503和原始 DIALNORM值603被共同用來計算多組COMPR和DYNRNG值-一組用于已知存在于AC-3編碼器中的每個簡檔。COMPR和 DYNRNG值的組合最接近地匹配原始比特流中的COMPR和 DYNRNG值的簡檔的索引號被輸出為606。如果對連續(xù)的幀流操作所述方法,則簡檔索引可被連續(xù)地更新。例如,其可代表先前幾秒的幀中最可能的簡檔。估計的動態(tài)范圍壓縮簡檔可以與原始使用的簡檔不同。因此,如 上所示,可期望僅當(dāng)測量的對話的聲級與DIALNORM值之差的絕對 值大于閾值時彩更新DIALNORM和動態(tài)范圍壓縮信息。計算新的動態(tài)范圍信息607功能或裝置("計算新的動態(tài)范圍信息")607計算新的動態(tài)范圍
信息。對話的實際聲級505 (圖5)的測量被取整并變?yōu)樾碌?DIALNORM值。向最接近ldB取整雖然不是必需的,但是可被使用。 使用簡檔索引606,計算解碼的音頻503 (不需要向其應(yīng)用舊的 DIALNORM和動態(tài)范圍壓縮)、新的DIALNORM值(取整的505)、 一組新的COMPR和DYNRNG值608。 重新打包比特流609比特流重新打包器或重新打包功能("重新打包比特流,,)609接 收未解碼的AC-3比特流501、 COMPR和DYNRNG值608以及測量 的對話聲級505。如上所述,對話的實際聲級505的測量被取整(例 如,向最接近ldB取整,盡管這不是必需的),并變?yōu)樾碌腄YNRNG 值。在未解碼的AC-3比特流501中更新新的DYNRNG值以及新的 COMPR和DYNRNG值。此外,如果如重新打包比特流609中所確 定的,存在足夠的未使用數(shù)據(jù)比特,則DYNRNG校驗數(shù)據(jù)用于替換 某些或所有未使用數(shù)據(jù)比特。新更新的AC-3比特流作為新的比特流 610被輸出。在以下會描述的圖7的示例中闡述重新打包比特流609的細(xì)節(jié)。 確定可用空間701功能或裝置("確定可用空間")701識別所有的未使用數(shù)據(jù)比特, 所述未使用數(shù)據(jù)比特可用于更新COMPR和DYNRNG值并用于包括 新的DYNRNG校驗數(shù)據(jù)。COMPR和DYNRNG參數(shù)兩者均需要AC-3 比特流中的8比特。所述參數(shù)的每次出現(xiàn)具有有條件的"存在"標(biāo)記。 COMPR參數(shù)具有COMPRE標(biāo)記,該標(biāo)記如果被設(shè)置為1,則指示 在比特流中跟隨有COMPR參數(shù)。類似地,每個DYNRNG參數(shù)具有 DYNRNGE標(biāo)記,該標(biāo)記如果被設(shè)置為1,則指示在比特流中跟隨有 DYNRNG參數(shù)。如果幀的第一塊中的DYNRNGE標(biāo)記被設(shè)置為0, 則解碼器假設(shè)初始DYNRNG值為0dB。如果幀的塊1到塊5中的任 何塊中的DYNRNGE標(biāo)記被設(shè)置為0,則解碼器重新使用來自先前塊 的DYNRNG值。COMPR和DYNRNG參數(shù)在每一幀中的這種有條 件的存在表示由COMPR和DYNRNG使用的比特總數(shù)可變化。
因為新的COMPR和DYNRNG值所需的比特總數(shù)可能待遇由舊 的COMPR和DYNRNG值使用的比特總數(shù)(因為COMPR和 DYNRNG的存在和值取決于DIALNORM值),所以有必要確定幀 中是否存在任何未使用的比特。這些未使用比特可用于新的 DIALNORM校驗數(shù)據(jù)以及在AC-3幀之內(nèi)移動信息,以便為新的 COMPR和DYNRNG值所需的附加比特留出空間。減少動態(tài)范圍壓縮信息703功能或裝置("減少D.R.C信息")703接收未使用數(shù)據(jù)比特702 的表示并計算新的動態(tài)范圍信息608,以便如果用于這些值的比特總 數(shù)大于未使用比特加上由舊的COMPR和DYNRNG值使用的比特總 數(shù)的總和,則減少新的COMPR和DYNRNG值所需的比特數(shù)量。功 能或裝置703的輸出是新的COMPR和DYNRNG值,其可能已經(jīng)根 據(jù)所述比特要求被調(diào)整。對于每個AC-3幀存在約束。圖9a示出兩個幀邊界,第5/8幀邊 界以及音頻塊1與音頻塊2之間的幀邊界(AB1-AB2)。所述約束在 于當(dāng)幀被編碼時,AB1-AB2邊界不能被進(jìn)一步編碼為超過第5/8幀 邊界的比特流。如果音頻塊0和1中的新的DYNRNG值所需的比特 數(shù)量大于音頻塊0和1中未使用的跳過數(shù)據(jù)比特加上音頻塊0和1中 的舊的DYNRNG值使用的比特數(shù)量的總和,則遵循為附加比特留 出空間會將AB1-AB2邊界推過第5/8幀邊界。如果出現(xiàn)這種情況,則 應(yīng)該減少塊0和1中的新的DYNRNG值所需的比特數(shù)量??砂凑崭?種方式來執(zhí)行這一處理。適合的方法為首先分析音頻塊0和1的新的DYNRNG值和 DYNRNGE標(biāo)記。如果只有塊0中的新的DYNRNGE標(biāo)記被設(shè)置為 1,則將這一標(biāo)記設(shè)置為0,并將塊0和塊1的新的DYNRNG值設(shè)置 為等于0。如果只有塊1中的新的DYNRNGE標(biāo)記被設(shè)置為1,則將 這一標(biāo)記設(shè)置為0,并將塊1的新的DYNRNG值設(shè)置為等于塊0的 DYNRNG值。如果塊0和1中的新的DYNRNGE標(biāo)記被設(shè)置為1, 則執(zhí)行兩種比較。如果塊0的DYNRNG的新值與0dB之間的絕對差
小于塊0和1的DYNRNG的新值之間的絕對差,則將塊0的新的 DYNRNGE標(biāo)記設(shè)置為0,并將塊0的DYNRNG的新值設(shè)置為0。 否則,將塊1的新的DYNRNGE標(biāo)記設(shè)置為0,并且將塊0和1的新 的DYNRNG值設(shè)置為來自塊0和1的DYNRNG的最小值。這將新 的DYNRNG字所需的比特數(shù)量減少了 8比特。如果塊0或1的 DYNRNGE標(biāo)記之一被設(shè)置為1,并且需要進(jìn)一步減少比特,則重復(fù) 上述處理。在任何比特減少完成之后,將塊1的新的DYNRNG值與 塊2的新的DYNRNG值進(jìn)行比較。如果所述值相等,則將塊2的新 的DYNRNGE標(biāo)記設(shè)置為0。如果新的DYNRNG值不相等,則將塊 2的新的DYNRNGE標(biāo)記被"i殳置為1。查看6個塊的整個幀;如果新的COMPR和DYNRNG值所需的 比特總數(shù)多余未使用比特加上由舊的COMPR和DYNRNG值使用的 比特總數(shù)的總和,則有必要減少新的參數(shù)所需的比特數(shù)量??砂凑崭?種方式來執(zhí)行這一處理。適合的方法為查看幀中的6個音頻塊中的新的DYNRNG值和 DYNRNGE標(biāo)記,并將所述塊組合為區(qū),其中,每個區(qū)代表DYNRNGE 標(biāo)記祐z沒置為1的塊、或者塊0的DYNRNGE標(biāo)記械 沒置為0的情 況下的第一塊加上DYNRNGE標(biāo)記被設(shè)置為0的任何后續(xù)塊。應(yīng)遵 循區(qū)的數(shù)量可低至1,其中,所有塊不具有被設(shè)置為1的DYNRNGE 標(biāo)記或者第一塊僅具有被設(shè)置為1的存在標(biāo)記;或者區(qū)的數(shù)量可高至 6,其中,每個塊具有被設(shè)置為1的DYNRNGE標(biāo)記。將每個區(qū)的 DYNRNG的值與每個鄰近區(qū)中的DYNRNG的值進(jìn)行比較。隨后,通 過以下處理將具有最接近的DYNRNG值的一對鄰近的區(qū)組合為一個 區(qū)首先將兩個區(qū)中的DYNRNG值設(shè)置為任一區(qū)的最小值,然后將 第二區(qū)的DYNRNGE標(biāo)記設(shè)置為0。這將新的COMPR和DYNRNG 信息所需的比特總數(shù)減少了 8比特。重復(fù)所述處理,直到新的COMPR 和DYNRNG值所需的比特總數(shù)小于或等于未使用比特加上由舊的 COMPR和DYNRNG值所需的比特總數(shù)的總和。如上所示,AC-3幀中的所有未使用數(shù)據(jù)比特可用于更新的
DYNRNG和COMPR參數(shù),從而不保留未使用比特以用于 DIALNORM校驗數(shù)據(jù)。如先前所討論的,期望這一結(jié)果,并且該結(jié)那些幀的實用性。更新DIALNORM、動態(tài)范圍壓縮和DIALNORM校驗信息705 裝置或功能("更新DIALNORM、 D.R.C和DIALNORM校驗 信息")705接收未解碼的AC-3比特流501、已根據(jù)比特要求調(diào)整的 新的COMPR和DYNRNG值704和測量的對話聲級505,并更新比 特流的DIALNORM參數(shù)、動態(tài)范圍參數(shù),將DIALNORM校驗信息 插入比特流。因為幀已經(jīng)具有DIALNORM參數(shù),所以可將新的DIALNORM 值寫入它在BSI中的預(yù)定位置。然而,對COMPR和DYNRNG參數(shù) 的更新可能涉及移動AC-3幀的各個部分以便未新的值留出空間。如 果新的COMPR和DYNRNG值所需的比特總數(shù)大于由舊的值使用的 比特總數(shù),則需要減少某些SKIPD字段的長度,并且可減少無用比 特(W)的長度。然而,如果所需的新的比特的總數(shù)較少,則增加無 用比特(W)的長度。如果在這些參數(shù)更新之后存在足夠數(shù)量的未使 用數(shù)據(jù)比特,則將DIALNORM校驗數(shù)據(jù)置于未使用數(shù)據(jù)比特的位置。為了更新COMPR參數(shù),如果舊的COMPRE標(biāo)記被設(shè)置為1, 則可利用新的COMPR值重寫舊的COMPR值。然而,如果舊的 COMPRE標(biāo)記被設(shè)置為0,并且新計算的COMPRE值被設(shè)置為1, 則應(yīng)該將COMPRE參數(shù)之后的所有二進(jìn)制數(shù)據(jù)移動8位以便為新的 COMPR值留出空間。隨后,將幀中的COMPRE標(biāo)記設(shè)置為1,并 將新的COMPR值寫入新創(chuàng)建的8位空間。如果舊的COMPRE標(biāo)記 被i殳置為1并且新的COMPRE標(biāo)記被設(shè)置為0,則將幀中的 COMPRE設(shè)置為0,并應(yīng)該將COMPRE參數(shù)之后的所有二進(jìn)制數(shù)據(jù) 移動8位,這是因為COMPR參數(shù)不再存在于幀中。為了更新每個音頻塊中的DYNRNG參數(shù),如果舊的COMPRE 標(biāo)i己被i殳置為1,則可利用新的DYNRNG值重寫舊的DYNRNG值。
然而,如果舊的DYNRNGE標(biāo)記4皮設(shè)置為0,并且新的DYNRNGE 標(biāo)記被設(shè)置為1,則應(yīng)該將DYNRNGE參數(shù)之后的所有二進(jìn)制數(shù)據(jù)移 動8位以便為新的DYNRNG值留出空間。隨后,將幀中的DYNRNGE 標(biāo)記設(shè)置為1,并可將新的DYNRNG值寫入新創(chuàng)建的8位空間。如 果舊的DYNRNGE標(biāo)記被設(shè)置為1并且新的DYNRNGE標(biāo)記祐 沒置 為0,則將幀中的DYNRNGE標(biāo)記設(shè)置為0,并應(yīng)該將DYNRNGE 參數(shù)之后的所有二進(jìn)制數(shù)據(jù)移動8位,這是因為DYNRNG參數(shù)不再 存在于比特流中。SKIPL參數(shù)以字節(jié)來指示SKIPD字段的長度。為了減少SKIPD 字段的長度,應(yīng)該將SKIPD字段右側(cè)的二進(jìn)制數(shù)據(jù)移動8位的整數(shù) 倍。隨后更新SKIPL參數(shù)以反映SKIPD字段的新長度。有時候, SKIPD字段可包含沒有在AC3標(biāo)準(zhǔn)(例如,參見以上已用的A52/A 文獻(xiàn))中正式定義的可選信息。如果SKIPD字段中的第一比特等于1, 則在SKIPD字段中跟隨有負(fù)載數(shù)據(jù)的信息,否則,SKIPD字段中的 比特均被設(shè)置為0。如果存在信息并且需要縮短SKIPD字段,則僅可 將SKIPD字段縮短至所述信息。這允許信息被保留在AC-3幀之內(nèi)。在修改和更新未使用數(shù)據(jù)比特之后,可將DIALNORM校驗數(shù)據(jù) 插入未使用比特中。如先前所討論的,所述數(shù)據(jù)可采取幾種形式,包 括具有足夠的同步和標(biāo)識數(shù)據(jù)信息的雙幀DIALNORM參數(shù)。這允許 DIALNORM校驗解碼器處理搜索未使用數(shù)據(jù)比特,識別是否存在 DIALNORM校驗數(shù)據(jù),并將其與嵌入AC-3比特流中的標(biāo)準(zhǔn) DIALNORM參數(shù)進(jìn)行比較。更新CRC 707更新的AC-3比特流包括DIALNORM校驗信息,將所述更新的 AC-3比特流應(yīng)用于糾錯字產(chǎn)生裝置或功能("更新CRC") 707。當(dāng) AC-3幀中的數(shù)據(jù)已經(jīng)改變時,應(yīng)該重新計算兩個檢錯字CRC1和 CRC2。如果只有最多到達(dá)第5/8幀邊界的數(shù)據(jù)被改變,則僅需要重 新計算CRC1。同理,如果只有從第5/8幀邊界到幀的末端的數(shù)據(jù)被 改變,則僅需要重新計算CRC2。
沒有在AC-3比特流中的校驗數(shù)據(jù)DIALNORM元數(shù)據(jù)不正確,DIALNORM范圍不足以傳達(dá)聲級 如圖4的示例所示,如果校驗信息不存在(步驟'401的輸出為 "否,,)并且現(xiàn)有AC-3 DIALNORM值不正確(步驟406的輸出為 "否,,),則應(yīng)該確定測量的響度聲級是否位于DIALNORM的有效范 圍幀內(nèi)(步驟408 )。如上所述,當(dāng)測量的對話的聲級505位于如AC-3 比特流中所允許的DIALNORM參數(shù)的有效范圍之外時, DIALNORM參數(shù)不具有足夠的范圍來傳遞聲級。也就是說,測量的 聲級低于-31dB或大于-ldB。在這種情況下,步驟408的輸出為"否"。 如上所述, 一種用于糾正這種情況的方式為利用最接近的有效值來更 新幀中的DIALNORM參數(shù)。然而,這會在DIALNORM值與測量的 對話的聲級之間留下一些誤差。如以下參照圖6b的示例所描述的, 最小化上述差錯的適合的替代選擇為執(zhí)行圖4的步驟411、412和413。 如上所述,圖6b是用于執(zhí)行步驟411、 412和413的圖5的更新比特 流507的變型??扇缦旅枋霾煌趫D6a的圖6b的部件。圖6a和圖 6b共有的部件保有相同的各自的標(biāo)號。 調(diào)整增益611將解碼的音頻503應(yīng)用于可調(diào)整增益改變器或增益改變功能 ("調(diào)整增益")611。可將適合的增益改變應(yīng)用于音頻以減少測量的 對話聲級與DIALNORM值之間的誤差(步驟411)。例如,如果測 量的對話聲級為-36dB ,則可將DIALNORM設(shè)置為最接近的有效值, 即,-31dB,從而將音頻增加5dB,即,從-36dB增加到-31dB。改進(jìn)型AC-3編碼629然后,使用改進(jìn)型AC-3音頻編碼對調(diào)整增益的音頻進(jìn)行重新編 碼,將其連同新的DIALNORM和動態(tài)范圍壓縮信息608 (步驟412 ) 應(yīng)用于改進(jìn)型AC-3編碼器或編碼功能("改進(jìn)型AC-3編碼")629。 改進(jìn)型AC-3編碼的特征在于"改進(jìn),,,這是因為其意識到DIALNORM 校驗數(shù)據(jù)能力的應(yīng)用,并且在編碼處理之后和最終比特流打包之前, 將所述數(shù)據(jù)插入未使用數(shù)據(jù)比特。這種重新編碼保留來自原始比特流501幀的所有原始BSI(除了 DIALNORM、動態(tài)范圍壓縮信息和 DIALNORM校驗)以及AUX元數(shù)據(jù),并包括計算新的檢錯字。圖6b的其它功能和裝置可以與上述圖6a的相應(yīng)功能和裝置相同。由于對音頻內(nèi)容的解碼和重新編碼,所以實施步驟411、 412和 413會導(dǎo)致某些聲音質(zhì)量的損失。因此,如果測量的對話聲級與最接 近的DIALNORM值之間的絕對誤差大于閾值,則可期望僅對內(nèi)容重 新編碼。閾值3 (3dB)可能適合于許多應(yīng)用。圖4的子集如上所述,可采用所有圖4的處理或圖4處理的子集,或者采用 所述處理的步驟的裝置。圖4處理的一種有用且花費不多的子集為采用步驟401到403。 如果校驗信息存在于比特流中(401為"是"),則步驟402和403如 上所述進(jìn)行操作,以保留AC-3比特流不變或?qū)IALNORM值設(shè)置 為校驗值。如果比特流中不存在校驗信息(401的輸出為"否"),則 可保留DIALNORM不變或?qū)⑵湓O(shè)置成等于默認(rèn)值。圖4處理的另一有用子集為釆用步驟401以及步驟404到407。 所述子集用于不存在校驗數(shù)據(jù)時,并且當(dāng)現(xiàn)有DIALNORM正確時, 期望添加校驗信息。如果校驗信息存在于比特流中(401為"是"), 則可保留比特流不變。如果校驗信息不存在(401的輸出為"否"), 則步驟404、 405和406確定現(xiàn)有DIALNORM正確(406的輸出為 "是")還是不正確(406的輸出為"否")。如果現(xiàn)有DIALNORM正 確,則可將校驗信息添加到比特流。如果現(xiàn)有DIALNORM不正確, 則可將DIALNORM i殳置為默i人值。圖4處理或裝置的另一有用但花費較多的子集為采用步驟401 到406。當(dāng)存在校驗信息時(401的輸出為"是,,)僅描述操作,但是 當(dāng)校驗信息不存在時(401的輸出為"否"),步驟404、 405和406確 定現(xiàn)有DIALNORM正確(406的輸出為"是")還是不正確(406的 輸出為"否")。如果現(xiàn)有DIALNORM正確,則可保留比特流不變。
如果現(xiàn)有DIALNORM不正確,則可將DIALNORM設(shè)置為默認(rèn)值。 知道校驗數(shù)據(jù)的(Verification-Data-Aware)解碼
本發(fā)明的另一方面在于適當(dāng)?shù)貙C-3比特流進(jìn)行解碼,不考慮 其是否具有正確的DIALNORM和匹配校驗數(shù)據(jù),但是當(dāng)存在校驗數(shù) 據(jù)時,所述解碼處理使用所述校驗數(shù)據(jù)。這可被稱為"知道校驗數(shù)據(jù) 的"解碼。在圖8的示例性流程圖中闡述本發(fā)明的該方面。如以下所 解釋的,可采用所有圖8處理或圖8處理的子集。例如,采用所述處 理的步驟的這種處理或裝置可用于對比特流進(jìn)行解碼。與圖4中的步 驟大致相應(yīng)的圖8中的步驟采用相應(yīng)的標(biāo)號(例如,"801"和"401")。 應(yīng)理解圖8的步驟或其子集可代表一個或多個處理的各部分,或者 可以是在一個或多個裝置中執(zhí)行的功能。
測試DIALNORM校驗數(shù)據(jù)的存在(801)
如圖8所示,執(zhí)行第一步驟(步驟801 )以確定AC-3 DIALNORM 校驗數(shù)據(jù)是否存在于AC-3比特流中??砂凑张c上述圖4的步驟401 相同的方式執(zhí)行這一步驟(包括圖3所示的步驟401的細(xì)節(jié))。
測試DIALNORM校驗數(shù)據(jù)是否匹配AC-3 DIALNORM數(shù)據(jù) (802 )
如圖8的步驟801所示,當(dāng)DIALNORM校驗數(shù)據(jù)存在時(步驟 801的輸出為"是"),進(jìn)行下一步驟(步驟802 )以確定所述校驗數(shù) 據(jù)是否匹配AC-3 DIALNORM值。可按照與上述圖4的步驟402相 同的方式來執(zhí)行這一步驟。如果所述值匹配,則普通DIALNORM值 是正確的,并且如步驟814所示,可使用AC-3比特流的現(xiàn)有 DIALNORM以及有關(guān)的動態(tài)范圍元數(shù)據(jù)對應(yīng)用于所述處理的AC-3 比特流(步驟801的輸入)進(jìn)行解碼,從而提供解碼的AC-3音頻比 特流。如以上結(jié)合步驟402的描述所解釋的,可通過所述值是否位于 閾值之內(nèi)來確定所述值是否"匹配"。
利用DIALNORM校驗數(shù)據(jù)糾正普通AC-3 DIALNORM數(shù)據(jù) (步驟803 )
當(dāng)DIALNORM校驗數(shù)據(jù)被從AC-3比特流提取并且與普通AC-3 DIALNORM元數(shù)據(jù)不匹配時(步驟802的輸出為"否"),隨后, 利用校驗DIALNORM值來更新DIALNORM元數(shù)據(jù)(803 )。因為 普通DIALNORM值已經(jīng)被確定為不正確并且應(yīng)該被更新,所以有關(guān) 的AC-3動態(tài)范圍壓縮元數(shù)據(jù)可能也不正確。因此,應(yīng)該分析動態(tài)范 圍壓縮信息,如果它正確,則僅更新DIALNORM元數(shù)據(jù)參數(shù)。如果 動態(tài)范圍壓縮信息不正確,則也應(yīng)該將其更新。以下結(jié)合圖4的步驟 409到413以及圖6b在此解釋所述分析和更新的細(xì)節(jié)。沒有在AC-3比特流中的校驗數(shù)據(jù)DIALNORM元數(shù)據(jù)正確如圖8的示例所示,如果DIALNORM校驗數(shù)據(jù)沒有包含在AC-3 比特流之內(nèi)(步驟801的輸出為"否,,),則可在不應(yīng)用DIALNORM 參數(shù)以及有關(guān)的動態(tài)范圍控制參數(shù)的情況下(因為這些元數(shù)據(jù)參數(shù)可 能不正確)將AC-3比特流解碼為音頻(例如,PCM編碼的音頻)(步 驟804),從而解碼的音頻內(nèi)容與用于創(chuàng)建比特流的編碼器的輸入位 于相同聲級。接著,測量解碼的音頻的DIALNORM聲級(步驟805)。 所述DIALNORM的測量可以與上述測量對話的聲級104所執(zhí)行的測 量相同。在步驟805測量對話的聲級之后,在步驟806將測量的值與 輸入AC-3比特流的AC-3 DIALNORM元數(shù)據(jù)值進(jìn)行比較。如步驟 806的"是"輸出之后所示,如果所述DIALNORM值正確(步驟806 的輸出為"是"),則將輸入AC-3比特流的原始DIALNORM值和有 關(guān)的原始動態(tài)范圍壓縮信息應(yīng)用于步驟804中由AC-3解碼產(chǎn)生的解 碼的音頻,以便提供已經(jīng)應(yīng)用正確的DIALNORM和動態(tài)范圍壓縮參 數(shù)值的解碼的AC-3音頻比特流。沒有在AC-3比特流中的校驗數(shù)據(jù)DIALNORM元數(shù)據(jù)不正確當(dāng)現(xiàn)有DIALNORM元數(shù)據(jù)不正確時(步驟806的輸出為"否,,), 有必要將DIALNORM值設(shè)置為步驟805測量的DIALNORM值,并 從所述測量的DIALNORM參數(shù)值來確定新的動態(tài)范圍壓縮信息。這 可在步驟815中實現(xiàn),步驟815可以與步驟412相同。隨后,可在步
驟816將測量的DIALNORM值以及通過步驟815確定的動態(tài)范圍壓 縮信息應(yīng)用于通過步驟804產(chǎn)生的解碼的數(shù)字或模擬音頻。 圖8的子集如上所述,可采用所有圖8的處理或圖8處理的子集,或者采用 所述處理的步驟的裝置。圖8處理的一種有用且花費不多的子集為采用步驟801到803 以及步驟814。如果校驗信息存在于比特流中(801為"是,,),則步 驟802、803以及814如上所述進(jìn)行操作,以對AC-3比特流進(jìn)行解碼。 如果比特流中不存在校驗信息(801的輸出為"否"),則可使用比特 流的現(xiàn)有DIALNORM值和有關(guān)的動態(tài)范圍壓縮參數(shù)值或者通過使用圖8處理的另一有用但花費較多的子集為釆用除步驟815以外的 所有步驟。該子集避免了確定與測量的DIALNORM有關(guān)的動態(tài)范圍 壓縮信息所需的計算。所進(jìn)行的操作正如結(jié)合圖8所描述的,只是當(dāng) 步驟806確定現(xiàn)有DIALNORM不正確時,可通過將DIALNORM和 有關(guān)的動態(tài)范圍參數(shù)值設(shè)置為默認(rèn)值對輸入AC-3比特流進(jìn)行解碼。附加背景技術(shù)AC-3比特分配以及未使用數(shù)據(jù)比特圖9e示出簡化的AC-3編碼器框圖。PCM音頻采樣被輸入頻域 變換功能902。使用具有50%重疊的512點改進(jìn)離散余弦變換 (MDCT)來對輸入數(shù)據(jù)加窗以避免塊處理和邊緣偽像。在瞬態(tài)信號 的情況下,通過使用塊切換技術(shù)來實現(xiàn)改進(jìn)的時間性能(減少瞬態(tài)預(yù) 噪聲),在所述塊切換技術(shù)中,計算兩個265點的變換來代替512點 的變換。將來自功能902的變換系數(shù)應(yīng)用于塊浮點處理904,所述卯4 將每個變換系數(shù)分為指數(shù)和尾數(shù)對。利用由比特分配功能908分配的 可變數(shù)量的比特在尾數(shù)量化功能906中量化變換系數(shù)尾數(shù),所述比特 分配功能908相應(yīng)于塊浮點指數(shù)對參數(shù)比特分配模型進(jìn)行操作。AC-3比特分配模型使用心理聲學(xué)掩蔽的原理來選擇分配到給定
頻帶中的每個尾數(shù)的比特數(shù)量。根據(jù)掩蔽的范圍,某些尾數(shù)可接收非 常少的比特,或者甚至根本不接收比特。這減少了代表源音頻所需的 比特數(shù)量,其代價為增加(盡管不可聽)噪聲。與某些其它的編碼系統(tǒng)不同,AC-3沒有已壓縮的音頻比特流將 比特分配結(jié)果傳遞到解碼器。相反,所采用的是參數(shù)逼近(parametric approach),其中,音頻編碼器基于變換系數(shù)指數(shù)以及較少的根據(jù)鍵 信號的參數(shù)來構(gòu)建它的掩蔽模型。將這些參數(shù)從比特分配功能908傳 遞到比特流打包功能910,已經(jīng)由比特流傳遞到解碼器,所需要的比 特要比發(fā)送未處理的比特分配值所需的比特少很多。產(chǎn)生編碼的音頻 比特流的比特流打包功能910還接收指數(shù)和量化的尾數(shù)以將其包括在 比特流中。在解碼器,基于接收的指數(shù)以及比特分配參數(shù)來重新構(gòu)建 比特分配。所述配置構(gòu)建混合式向后/向前自適應(yīng)比特分配。由于以下兩個主要特點,AC-3的編碼效率隨著源聲道數(shù)量的增 加而提高全局比特池和高效聯(lián)結(jié)。全局比特池技術(shù)允許比特分配器 基于隨需模式在音頻聲道之間分發(fā)可用比特。如果一個或多個聲道在 特定蝕刻處于非活動狀態(tài),則剩余聲道接收比其它情況下接收的比特 更多的比特。在AC-3音頻壓縮系統(tǒng)中,比特分配處理采用有限搜索。在搜索 的每次反復(fù)中,變化信噪比(SNR)參數(shù)以控制比特的分配。這還影 響其它參數(shù)的值。在搜索的末尾,如果使用的比特數(shù)量超過分配的比 特數(shù)量,則使用最后的合法分配。通常,該分配不能使用所有可用比 特,從而留下未使用比特或無用比特。如先前所討論的,AC-3串行編碼的音頻比特流由通常如圖9a 所示被構(gòu)建的幀序列構(gòu)成。每個AC-3幀代表所有編碼的聲道中1536 個PCM采樣的恒定時間間隔,并且包含6個編碼的音頻塊(ABO到 AB5),所述音頻塊均代表256個新的音頻采樣。每個AC-3幀具有 固定的大小(范圍從64比特到1920比特的比特數(shù)量中的幾種大小中 的一個),所述固定的大小取決于PCM采樣率(32kHz、 44.1kHz 或48kHz)和編碼的音頻比特率(范圍從32kbps到640kbps的離散值)。位于每一幀的開端的同步信息(SI)頭部包含捕獲和保持同步 所需的信息。比特流信息(BSI)頭部跟在SI字段之后,并包含描述 編碼的音頻服務(wù)的參數(shù)。SI和BSI字段描述比特流配置,包括采樣 率、數(shù)據(jù)率、編碼的音頻聲道數(shù)量以及若干其它系統(tǒng)級的元素。在編 碼的音頻塊(AB0到AB5)之后的是輔助數(shù)據(jù)(AUX)字段。在每一 幀的末尾是檢錯字段,其包括用于檢錯的CRC字(循環(huán)冗余糾錯碼 字)。此外,另一CRC字位于SI頭部中。盡管圖9a中的比特流元素的寬度大致給出每個元素中的典型比 特數(shù)量,但是該附圖不是按照比例顯示的。塊ABO顯示為比其它塊寬, 這是因為每一幀必須獨立于其它幀,塊AB1到AB5可共享塊ABO攜 帶的信息而不必重復(fù)所述信息,從而允許塊AB1到AB5攜帶比塊ABO 少的比特。除了可進(jìn)行共享之外,音頻塊還具有可變長度,這是因為 在每個塊中可分配給量化尾數(shù)的比特數(shù)量可變。如以上引用的第6,807,528號美國專利中所解釋的,每當(dāng)編碼器中的比特分配功能沒有采用所有可用比特來對音頻信號進(jìn)行編碼時, 幀中存在未使用比特。如果最終比特分配不足以使用所有可用比特或 者輸入音頻不需要所有可用比特,則出現(xiàn)上述情況。因為應(yīng)該將這些 未^f吏用比特置于幀中的某些位置,以便所述幀具有強(qiáng)制的固定大小, 所以編碼器將偽比特或空比特出入比特流,以便填滿比特的長度。所 述空比特被插入一個或多個音頻塊中的"跳過字段"(如圖9d所示) 以及AUX字段。每個跳過字段按照8比特的字節(jié)來接受空比特,而 aux字段最多接收7個空比特以便提供對幀長度的"精細(xì)調(diào)整"并確保 最終CRC字出現(xiàn)在幀的最后16比特中。實際上,空比特是隨機(jī)的比 特。所述空比特是不攜帶有用信息的無用比特。本發(fā)明的一方面在于 使用某些或所有所述空比特的值以攜帶與某些包含在比特流之內(nèi)的 AC-3參數(shù)有關(guān)的負(fù)載信息的比特(特別是圖9c所示的DIALNORM 參數(shù))。解碼器跳過或忽略掉過字段和AUX字段中的空比特。盡管AC-3 解碼器能夠識別空比特并忽略它們,但是空比特的數(shù)量以及它們在比
特流中的位置不是事先已知的(它們的數(shù)量和位置在幀之間變化,即,跳過字段具有可變大小,它們在塊AB1到AB5的開始位置有所變化, 類似地,AUX字段具有可變大小,它的開始位置也變化),也不能夠 僅僅通過對AC-3比特流的檢測就分辨出它們的數(shù)量和位置(空比特 是隨機(jī)的,并且在比特流中無法與其它數(shù)據(jù)相區(qū)分)。每個音頻塊(AB0到AB5)開始于"固定數(shù)據(jù)",所述固定數(shù)據(jù) 由事先已知其字大小(比特長度)的比特流元素構(gòu)成(即,這些固定 數(shù)據(jù)元素具有預(yù)先分配的比特數(shù)量,并且比特分配處理不向其分配比 特)。固定數(shù)據(jù)是參數(shù)和標(biāo)記的集合,包括塊切換標(biāo)記、聯(lián)結(jié)信息、 指數(shù)和比特分配參數(shù)。在固定數(shù)據(jù)之后是"跳過字段,,數(shù)據(jù),其在跳過 字段不包括空比特的情況下具有1比特的最小大小,在跳過字段包含 空比特的情況下具有522比特的最大大小。作為跳過字段的最少內(nèi)容 的1比特字指示跳過字段是否包括空比特。如果包括空比特,則接著 由9比特字指示空比特字節(jié)的數(shù)量。其后跟隨有空字節(jié)。在跳過字段 子后為尾數(shù)數(shù)據(jù)。尾數(shù)數(shù)據(jù)的大小可變并由比特分配來確定。通過以下規(guī)則來確定特定音頻塊是否包含具有空比特的跳過字 段1) SYCINFO字段(即,SYNCWORD、第一 CRC字段、采樣 頻率碼字和幀大小碼字)、BSI字段、音頻塊0 (AB0)和音頻塊1(AB1)的組合大小從不超過幀的5/8; 2)音頻塊5 ( AB5 )尾數(shù)數(shù) 據(jù)、AUX數(shù)據(jù)字段和檢錯字段的組合大小從不超過幀的最后3/8。 5/8 和3/8的配置用于減少等待時間(第一CRC字應(yīng)用于幀的開始5/8, 允許更快的解碼)。原則上,如果不是5/8和3/8配置,則可將所有 空比特插入AUX字段,不需要一個或多個跳過字段。AUX數(shù)據(jù)字段具有兩個功能。以上所述的AUX數(shù)據(jù)字段的一種 功能在于提供對于幀長度的精細(xì)調(diào)整,并確保幀的最后16比特用于 第二CRC字。最多將7個空比特插入AUX數(shù)據(jù)。AUX字段的第二 功能是可選的并且獨立于第一功能,所述第二功能為攜帶附加信息("auxdata"),其代價為使用本可分配給音頻塊中的尾數(shù)的比特。 AUX數(shù)據(jù)字段的最后比特指示是否存在任何可選auxdata。如果該比 特指示存在auxdata,則之前的14比特字指示auxdata的長度,接下 來的先前比特為auxdata。如果存在空比特,則其位于AUX字段中的 auxdata數(shù)據(jù)之前。如果aux字段不具有auxdata,則存在空比特的 話,空比特位于AUX數(shù)據(jù)字段末尾的單個比特之前,該單個比特指 示是否存在auxdata。因此,無論是否存在auxdata,在AUX字段中 可以存在或不存在空比特。如果不存在未使用比特(在給定幀中不存 在未使用比特,而在許多連續(xù)的幀中出現(xiàn)這種情況的可能性極低)或 者空比特的數(shù)量不能被8整除,則AUX字段中不存在空比特,因此, 所有的空比特在一個或多個跳過字段中攜帶。在標(biāo)準(zhǔn)AC-3編碼配置中,在AUX字段和/或AUX字段和一個 或多個跳過字段中的空比特是未使用比特或無用比特(即,它們不攜 帶有用信息)。根據(jù)本發(fā)明的各方面,如以上所討論的,用攜帶信息 的元數(shù)據(jù)校驗比特來替換某些或所有所述未使用比特,同時保留與現(xiàn) 有AC-3編碼器和解碼器的完全兼容并避免任何編碼的音頻信號的降 級。新的攜帶信息的比特優(yōu)選地符合已知或預(yù)定的格式或語法,從而 可通過元數(shù)據(jù)參數(shù)(例如DIALNORM)校驗解碼器處理來恢復(fù)所述 攜帶信息的比特??稍谌魏斡行C-3編碼器創(chuàng)建AC-3比特流之后 實現(xiàn)元數(shù)據(jù)(DIALNORM)校驗比特對無用比特的替換。例如,可 采用傳統(tǒng)的非改進(jìn)型AC-3編碼器來產(chǎn)生標(biāo)準(zhǔn)AC-3比特流。分析所 產(chǎn)生的比特流,以識別每一幀中某些或所有未使用比特的位置。隨后, 用攜帶信息的比特(DIALNORM校驗數(shù)據(jù)比特)來替換某些或所有 識別的未使用比特,所述攜帶信息的比特被嵌入由未使用比特先前占 據(jù)的位置。因為某些數(shù)據(jù)被改變(某些或所有空比特被改變),所以 重新計算用于整個幀的校驗和,并用新的CRC字來替換應(yīng)用于整個 幀的第二 CRC字,如果所述幀的開始3/8中的數(shù)據(jù)被改變,則重新 計算用于該幀的所述部分的校驗和,也用新的CRC字來替換應(yīng)用于 幀的開始3/8的第一 CRC字?;蛘?,不用遵循標(biāo)準(zhǔn)編碼的攜帶信息的比特來替換某些后所有
AC-3比特流中的未使用比特,包括附加分析和元數(shù)據(jù)校驗?zāi)芰Φ母?進(jìn)型AC-3編碼器可在編碼處理期間將攜帶信息的比特插入幀的某些 或所有未使用比特位置而不是隨機(jī)的空比特。不管在編碼處理之前還是之后對AC-3比特流進(jìn)行改進(jìn),所產(chǎn)生 的改進(jìn)比特流對于傳統(tǒng)AC-3解碼器而言是相同的。接收改進(jìn)比特流 的非改進(jìn)型AC-3解碼器按照其在相同的比特位置忽略或跳過空比特 的相同方式來忽略攜帶信息的比特??稍诟倪M(jìn)型AC-3解碼器或?qū)S?AC-3元數(shù)據(jù)分析處理中恢復(fù)替換未使用比特的攜帶信息的比特,所 述改進(jìn)型AC-3解碼器或?qū)S肁C-3元數(shù)據(jù)分析處理識別幀中未使用 比特的位置,檢測未使用比特位置中的數(shù)據(jù),并報告對AC-3比特流 執(zhí)行的元數(shù)據(jù)校驗分析的結(jié)果。在任何情況下,對替換AC-3比特流此,本發(fā)明的各方面可通過以下兩種方式來保持音頻質(zhì)量不使用其 它情況下會被用于音頻的比特,并且可避免對比特流進(jìn)行解碼和重新 編碼的需要(盡管如上所述,這種處理可能是必要和有用的)。 AC-3對話聲級以及壓縮元數(shù)據(jù)參數(shù)如上所述,包括在AC-3幀元數(shù)據(jù)中的是指示包含在壓縮音頻中 的講話或?qū)υ挼捻懚嚷暭壍膮?shù)。該參數(shù)被稱為DIALNORM,并且 該參數(shù)的目的在于在音頻項被編碼或進(jìn)行數(shù)據(jù)壓縮之前,測量所述項 中的對話或講話的主要聲級。該測量隨后用于在包含壓縮音頻項的比 特流的每一幀中設(shè)置DIALNORM參數(shù)。在重放所述比特流期間, AC-3解碼器使用DIALNORM參數(shù)來修改所述項的重放聲級或響度, 從而對話的感知響度處于一致的聲級上。圖10a示出包含三種不同的音頻項的示例。數(shù)字聲級是數(shù)據(jù)壓縮 的音頻內(nèi)容相對于數(shù)字實比正弦波形的聲級(0dBFS)。示出用于每 一項的最大和最小聲級,連同對話的預(yù)定聲級。用于每一項的 DIALNORM參數(shù)是對話的聲級,其按照ldB為單位進(jìn)行取整、圖10b 示出在重放期間,解碼器如何對每一項的聲級進(jìn)行縮放,使得每一項 的對話的聲級或響度相同或非常近似。對于AC-3系統(tǒng),每一項的對
話被縮放的參考聲級為-31dBFS。隨后,可在重放系統(tǒng)中將所述參考 數(shù)字聲級校準(zhǔn)到期望的聲壓級別。在AC-3中對DIALNORM參數(shù)的使用通過減少存在于不同音頻 項之間的劇烈響度差來向收聽者提供更加一致和可預(yù)見的收聽體驗, 其中,所述不同音頻項由不同的人在不同收聽環(huán)境中為了不同的目的 而創(chuàng)建。然而,由于以上討論的原因,DIALNORM參數(shù)可能不正確。動態(tài)范圍壓縮在AC-3幀元數(shù)據(jù)中還包括參數(shù),所述參數(shù)如果在重放期間應(yīng)用 于音頻,則用于減少音頻內(nèi)容的動態(tài)范圍。也就是說,使得音頻的較 響部分變得較安靜,并使得音頻的較安靜部分變得較響。這些動態(tài)范 圍壓縮參數(shù)被稱為COMPR和DYNRNG,并且在對AC-3比特流進(jìn) 行編碼期間被自動計算。參見圖9。減少音頻的動態(tài)范圍的能力可用于多種情況。例如,當(dāng)在深夜觀 看電影時,通常有必要在降低的重放音量下來收聽,從而不會打擾睡 著的家庭成員或鄰居。因為電影易于具有非常大的動態(tài)范圍,所以降 低的重放音量導(dǎo)致電影的大部分過于安靜以致收聽不到。動態(tài)范圍壓 縮的使用有助于增加安靜的部分,使得它們能夠被聽到,并減少最響 的部分,使得它們對人的打擾較輕。參照由DIALNORM參數(shù)指示的對話的聲級來計算動態(tài)范圍壓 縮參數(shù)。這保證對話的平均聲級不變而只有音頻的較響或較輕柔部分 被改變。圖12示出包含三種不同的音頻項的示例。圖12a示出未處理音 頻項的平均對話聲級和動態(tài)范圍。圖12b示出在重放期間,動態(tài)范圍 壓縮以及DIALNORM參數(shù)的應(yīng)用如何在所有三種項之間導(dǎo)致一致的 平均對話聲級以及減少的動態(tài)范圍輸出信號。因為動態(tài)范圍壓縮參數(shù)的計算與對話聲級相關(guān),所以它們的使用 依賴于內(nèi)容創(chuàng)建者正確地測量并設(shè)置DIALNORM參數(shù)。如果在由 DIALNORM指示的對話的聲級與音頻內(nèi)容中對話的實際聲級之間存 在差錯,則由于壓縮,對話很可能表現(xiàn)出不希望得到的可聽動態(tài)增益改變。DIALNORM2、 COMPR2和DINRNG2在多數(shù)情況下,AC-3系統(tǒng)對于所有的聲道使用單個對話聲級以 及單組動態(tài)范圍信息參數(shù)。然而,AC-3包括允許兩個聲道獨立操作 的操作模式;也就是說,每個聲道具有獨立的對話聲級和動態(tài)范圍信 息。在該模式下,所述兩個聲道中的第二聲道使用DIALNORM2、 COMPR2和DYNRNG2參數(shù)(見圖9 )。因為按照與DIALNORM、 COMPR和DYNRNG完全相同的方式來解釋和使用DIALNORM2、 COMPR2和DYNRNG2,所以在該文檔中僅描述前者的操作。實現(xiàn)可利用硬件或軟件、或者兩者的組合(例如,可編程邏輯陣列) 來實現(xiàn)本發(fā)明。除非另外說明,否則作為本發(fā)明的一部分所包括的算 法或處理并非必然涉及任何特定的計算機(jī)或其它設(shè)備。具體說來,各 種通用機(jī)器可通過根據(jù)這里的教導(dǎo)寫入的程序來使用,或者可更加方 便地構(gòu)建更加專用的設(shè)備(例如,集成電路)來執(zhí)行需要的方法步驟。 因此,可通過在一個或多個可編程計算機(jī)系統(tǒng)上運(yùn)行的一個或多個計 算機(jī)程序來實現(xiàn)本發(fā)明,所述一個或多個可編程計算機(jī)系統(tǒng)均包括 至少一個處理器、至少一個數(shù)據(jù)存儲系統(tǒng)(包括易失性和非易失性存 儲器和/或存儲元件)、至少一個輸入裝置或端口和至少一個輸出裝置 或端口 。將程序代碼應(yīng)用于輸入數(shù)據(jù)以執(zhí)行這里所述的功能并產(chǎn)生輸 出信息。按照已知的方式將輸出信息應(yīng)用于一個或多個輸出裝置??砂凑杖魏纹谕挠嬎銠C(jī)語言(包括機(jī)器語言、匯編語言或高級 程序語言、邏輯語言或面向?qū)ο蟮木幊陶Z言)來實現(xiàn)每個所述的程序 以與計算機(jī)系統(tǒng)通信。在任何情況下,所述語言可以是編譯或解釋的語言。應(yīng)認(rèn)識到在示例性附圖中示出的某些步驟或功能執(zhí)行多個子步 驟,并且還可顯示為多個步驟或功能,而不是一個步驟或功能。還應(yīng) 認(rèn)識到在這里的各個示例中示出和描述的各個裝置、功能、步驟和
或分離。例如,當(dāng)通過計算機(jī)軟件指令序列來實現(xiàn)示例性附圖中的各 個功能和步驟時,可通過在適合的數(shù)字信號處理硬件上運(yùn)行的多線程 軟件指令序列來實現(xiàn)所述各個功能和步驟,在這種情況下,附圖中所 示的示例中的各個裝置和功能可相應(yīng)于軟件指令部分。每個所述計算機(jī)程序被優(yōu)選地存儲或下載到通用或?qū)S每删幊?計算機(jī)可讀取的存儲介質(zhì)或裝置(例如,固態(tài)存儲器或介質(zhì)、或者磁 介質(zhì)或光介質(zhì)),以便當(dāng)計算機(jī)系統(tǒng)讀取存儲介質(zhì)或裝置時,配置并 操作計算機(jī)來執(zhí)行這里所述的過程。還可考慮將本發(fā)明的系統(tǒng)實現(xiàn)為 配置有計算機(jī)程序的計算機(jī)可讀存儲介質(zhì),其中,將存儲介質(zhì)配置為 促使系統(tǒng)按照特定的預(yù)先定義的方式來執(zhí)行這里所述的功能。已經(jīng)描述了本發(fā)明的若干實施例。然而,將理解到在不脫離本發(fā)明的精神和范圍的情況下,可進(jìn)行各種改進(jìn)。例如,這里描述的某 些步驟可以不按順序發(fā)生,因此可按照不同于所描述的順序來執(zhí)行這 些步驟。
權(quán)利要求
1、一種數(shù)字比特流,包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的元數(shù)據(jù)以及元數(shù)據(jù)校驗信息,其中,全部或部分元數(shù)據(jù)對于音頻而言可能不正確,所述元數(shù)據(jù)校驗信息能夠用于檢測元數(shù)據(jù)對于音頻而言是否正確,并且如果不正確,則對其進(jìn)行改變以使其正確。
2、 如權(quán)利要求1所述的數(shù)字比特流,其中,能夠用于檢測和改 變元數(shù)據(jù)的元數(shù)據(jù)校驗信息包括所述元數(shù)據(jù)的正確版本的副本或數(shù) 據(jù)壓縮的副本。
3、 一種數(shù)字比特流,包括代表音頻的數(shù)據(jù)比特、用于音頻的 元數(shù)據(jù)以及元數(shù)據(jù)校驗信息,所述元數(shù)據(jù)校驗信息包括所述元數(shù)據(jù)的 副本或數(shù)據(jù)壓縮的副本,所述校驗信息能夠用于檢測元數(shù)據(jù)及其副本 是否位于彼此的閾值差之內(nèi),如果它們沒有位于彼此的閾值差之內(nèi), 則用副本來替換元數(shù)據(jù)。
4、 如權(quán)利要求1-3中的任何一個所述的數(shù)字比特流,其中,元 數(shù)據(jù)校驗信息被加密。
5、 如權(quán)利要求1-4中的任何一個所述的數(shù)字比特流,其中,代 表元數(shù)據(jù)校驗信息的比特替換比特流中通常不攜帶任何信息的多個 比特中的全部比特或一些比特。
6、 如權(quán)利要求1-4中的任何一個所述的數(shù)字比特流,其中,元 數(shù)據(jù)校驗信息在比特流中被隱秘編碼。
7、 如權(quán)利要求1-6中的任何一個所述的數(shù)字比特流,其中,音 頻是數(shù)據(jù)壓縮的音頻。
8、 一種編碼器,其產(chǎn)生如權(quán)利要求1-7中的任何一個所述的數(shù) 字比特流。
9、 一種解碼器,用于接收如權(quán)利要求1-7中的任何一個所述的 數(shù)字比特流,其中,解碼器使用所述元數(shù)據(jù)以及所述元數(shù)據(jù)校驗信息 對代表音頻的數(shù)據(jù)比特進(jìn)行解碼。
10、 如權(quán)利要求9所述的解碼器,其中,解碼器在對代表音頻的 數(shù)據(jù)比特進(jìn)行解碼時使用所述元數(shù)據(jù)校驗信息改變元數(shù)據(jù),并在對音 頻進(jìn)行解碼時使用所述改變的元數(shù)據(jù)。
11、 一種響應(yīng)于音頻而產(chǎn)生數(shù)字比特流的處理方法,所述處理方 法包括產(chǎn)生對于音頻而言正確的元數(shù)據(jù),產(chǎn)生元數(shù)據(jù)校驗信息,元數(shù)據(jù)校驗信息能夠用于檢測元數(shù)據(jù)對于 音頻而言是否正確,并且如果不正確,則對其進(jìn)行改變以使其正確, 以及組裝數(shù)字比特流,所述數(shù)字比特流包括代表音頻的數(shù)據(jù)比特、 元數(shù)據(jù)以及元數(shù)據(jù)校驗信息。
12、 一種響應(yīng)于音頻而產(chǎn)生數(shù)字比特流的處理方法,所述處理方 法包括產(chǎn)生用于音頻的元數(shù)據(jù),產(chǎn)生元數(shù)據(jù)校驗信息,所述元數(shù)據(jù)校驗信息包括所述元數(shù)據(jù)的副 本或數(shù)據(jù)壓縮的副本,所述元數(shù)據(jù)校驗信息能夠用于檢測元數(shù)據(jù)及其 副本是否位于彼此的閾值差之內(nèi),如果它們沒有位于彼此的閾值差之 內(nèi),則用副本來替換元數(shù)據(jù),以及組裝數(shù)字比特流,所述數(shù)字比特流包括代表音頻的數(shù)據(jù)比特、 元數(shù)據(jù)以及元數(shù)據(jù)校驗信息。
13、 如權(quán)利要求11或12所述的處理方法,其中,所述產(chǎn)生元數(shù) 據(jù)的步驟基于音頻的測量來產(chǎn)生元數(shù)據(jù)。
14、 如權(quán)利要求13所述的處理方法,其中,所述音頻的測量是 音頻的響度的測量。
15、 如權(quán)利要求11-14中的任何一個所述的處理方法,其中,能版本的副本或數(shù)據(jù)壓縮的副本。
16、如權(quán)利要求11-15中的任何一個所述的處理方法,其中,校 驗信息被加密。
17、 如權(quán)利要求11-16中的任何一個所述的處理方法,其中,代 表元數(shù)據(jù)校驗信息的比特替換比特流中通常不攜帶任何信息的多個 比特中的全部比特或一些比特。
18、 如權(quán)利要求11-16中的任何一個所述的處理方法,其中,元 數(shù)據(jù)校驗信息在比特流中被隱秘編碼。
19、 一種用于處置數(shù)字音頻比特流的處理方法,所述數(shù)字音頻比 特流包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的元數(shù)據(jù), 其中,全部或部分元數(shù)據(jù)對于音頻而言可能不正確,并且所述數(shù)字音 頻比特流可包括代表元數(shù)據(jù)校驗信息的數(shù)據(jù)比特,所述元數(shù)據(jù)校驗信 息能夠用于檢測元數(shù)據(jù)對于音頻而言是否正確,并且如果不正確,則 對其進(jìn)行改變以使其正確,所述處理方法包括確定元數(shù)據(jù)校驗信息是否存在于比特流中,以及 如果存在元數(shù)據(jù)校驗信息,則確定其是否證實至少一部分元數(shù)據(jù) 的正確性,如果元數(shù)據(jù)校驗信息證實所述至少一部分元數(shù)據(jù)的正確性,則保 留比特流不變,以及如果元數(shù)據(jù)校驗信息沒有證實所述至少一部分元數(shù)據(jù)的正確性, 則使用它來糾正元數(shù)據(jù)。
20、 一種用于處置數(shù)字音頻比特流的處理方法,所述數(shù)字音頻比 特流包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的元數(shù)據(jù), 其中,全部或部分元數(shù)據(jù)對于音頻而言可能不正確,并且所述數(shù)字音 頻比特流可包括代表元數(shù)據(jù)校驗信息的數(shù)據(jù)比特,所述元數(shù)據(jù)校驗信 息能夠用于檢測對于音頻而言不正確的元數(shù)據(jù),所述處理方法包括確定元數(shù)據(jù)校驗信息是否存在于比特流中, 如果不存在元數(shù)據(jù)校驗信息,則確定至少一部分元數(shù)據(jù)是否正確,如果所述至少一部分元數(shù)據(jù)正確,則將用于所述至少一部分元數(shù) 據(jù)的元數(shù)據(jù)校驗信息插入到比特流中,以及如果所述至少一部分元數(shù)據(jù)不正確,則將所述至少一部分元數(shù)據(jù)  設(shè)置為等于默認(rèn)值。
21、 一種用于處置數(shù)字音頻比特流的處理方法,所述數(shù)字音頻比 特流包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的元數(shù)據(jù), 其中,全部或部分元數(shù)據(jù)對于音頻而言可能不正確,并且所述數(shù)字音 頻比特流可包括代表元數(shù)據(jù)校驗信息的數(shù)據(jù)比特,所述元數(shù)據(jù)校驗信 息能夠用于檢測對于音頻而言不正確的元數(shù)據(jù),并且如果不正確,則 對其進(jìn)行改變以使其正確,所述處理方法包括確定元數(shù)據(jù)校驗信息是否存在于比特流中,以及 如果存在元數(shù)據(jù)校驗信息,則確定其是否證實至少 一部分元數(shù)據(jù) 的正確性,如果元數(shù)據(jù)校驗信息證實所述正確性,則保留比特流不變, 如果元數(shù)據(jù)校驗信息沒有證實所述正確性,則糾正所述至少 一部 分元數(shù)據(jù),如果不存在元數(shù)據(jù)校驗信息,則確定至少一部分元數(shù)據(jù)是否正確,如果所述至少一部分元數(shù)據(jù)正確,則保留比特流不變,以及 如果所述至少一部分元數(shù)據(jù)不正確,則將所述至少一部分元數(shù)據(jù) 設(shè)置為等于默認(rèn)值。
22、 一種用于處置數(shù)字音頻比特流的處理方法,所述數(shù)字音頻比 特流包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的 DIALNORM元數(shù)據(jù)和有關(guān)的動態(tài)范圍壓縮元數(shù)據(jù),其中,全部或部 分元數(shù)據(jù)對于音頻而言可能不正確,并且所述數(shù)字音頻比特流可包括 代表元數(shù)據(jù)校驗信息的數(shù)據(jù)比特,所迷元數(shù)據(jù)校驗信息能夠用于檢測 DIALNORM元數(shù)據(jù)值對于音頻而言是否正確,并且如果不正確,則 對其進(jìn)行改變以使其正確,所述處理方法包括確定元數(shù)據(jù)校驗信息是否存在于比特流中,如果存在元數(shù)據(jù)校驗信息,則確定其是否證實DIALNORM元數(shù) 據(jù)值的正確性,如果元數(shù)據(jù)校驗信息證實所述正確性,則保留比特流不變, 如果元數(shù)據(jù)校驗信息沒有證實所述正確性,則改變DIALNORM 元數(shù)據(jù)值,以使其對于音頻而言正確,如果不存在元數(shù)據(jù)校驗消息,則通過以下處理來確定 DIALNORM元數(shù)據(jù)值對于音頻而言是否正確在不使用 DIALNORM元數(shù)據(jù)值和有關(guān)的動態(tài)范圍壓縮元數(shù)據(jù)的情況下對比特 流進(jìn)行解碼,測量解碼的音頻的響度以確定測量的DIALNORM值, 并將比特流的DIALNORM元數(shù)據(jù)值與測量的DIALNORM值進(jìn)行比 較,如果比特流中的DIALNORM元數(shù)據(jù)值位于測量的DIALNORM 元數(shù)據(jù)值的閾值差之內(nèi),則保留比特流不變,如果DIALNORM元數(shù)據(jù)沒有位于所述閾值之內(nèi),則確定測量的 DIALNORM元數(shù)據(jù)值是否位于有效DIALNORM值的范圍之內(nèi),如果測量的響度位于有效DIALNORM元數(shù)據(jù)值的范圍之內(nèi),則 確定新的動態(tài)范圍壓縮元數(shù)據(jù),并利用測量的DIALNORM元數(shù)據(jù)值 和有關(guān)的動態(tài)范圍壓縮元數(shù)據(jù)以及利用對于測量的DIALNORM值而 言正確的元數(shù)據(jù)校驗信息對比特流重新打包,以及如果測量的響度沒有位于有效DIALNORM值的范圍之內(nèi),則改 變解碼的音頻的增益以將所述響度帶入有效DIALNORM值的范圍之 內(nèi),確定新的動態(tài)范圍壓縮元數(shù)據(jù),并使用經(jīng)增益調(diào)整的音頻、測量 的DIALNORM元數(shù)據(jù)值以及新確定的動態(tài)范圍壓縮元數(shù)據(jù)對比特流 重新編碼。
23、 一種用于處置數(shù)字音頻比特流的處理方法,所述數(shù)字音頻比 特流包括代表音頻的數(shù)據(jù)比特、音頻元數(shù)據(jù)和音頻元數(shù)據(jù)校驗信息, 所述音頻元數(shù)據(jù)校驗信息包括所述音頻元數(shù)據(jù)的副本或數(shù)據(jù)壓縮的 副本,所述校驗信息能夠用于檢測元數(shù)據(jù)及其所述副本是否位于彼此 的閾值差之內(nèi),并且如果它們沒有位于彼此的閾值差之內(nèi),則用副本 替換元數(shù)據(jù),所述處理方法包括改變元數(shù)據(jù),以及改變校驗信息,從而元數(shù)據(jù)以及元數(shù)據(jù)的副本或數(shù)據(jù)壓縮的副本位于所述彼此的閾值差之內(nèi)。
24、 一種用于對數(shù)字音頻比特流進(jìn)行解碼的處理方法,所述數(shù)字 音頻比特流包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的元 數(shù)據(jù),其中,全部或部分元數(shù)據(jù)對于音頻而言可能不正確,并且所述 數(shù)字音頻比特流可包括代表元數(shù)據(jù)校驗信息的數(shù)據(jù)比特,所述元數(shù)據(jù) 校驗信息能夠用于檢測元數(shù)據(jù)對于音頻而言是否正確,并且如果不正 確,則對其進(jìn)行改變以使其正確,所述處理方法包括確定元數(shù)據(jù)校驗信息是否存在于比特流中, 如果存在元數(shù)據(jù)校驗信息,則確定其是否證實至少一部分元數(shù)據(jù) 的正確性,如果所述信息證實所述正確性,則使用所述元數(shù)據(jù)對比特流進(jìn)行解碼,如果元數(shù)據(jù)校驗信息沒有證實所述至少 一部分元數(shù)據(jù)的正確性, 則使用它來糾正元數(shù)據(jù)并使用糾正的元數(shù)據(jù)對比特流進(jìn)行解碼,以及如果元數(shù)據(jù)校驗信息沒有存在于比特流中,則使用比特流中的元 數(shù)據(jù)對比特流進(jìn)行解碼,或者使用默認(rèn)元數(shù)據(jù)對比特流進(jìn)行解碼。
25、 一種用于對數(shù)字音頻比特流進(jìn)行解碼的處理方法,所述數(shù)字 音頻比特流包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的元 數(shù)據(jù),其中,全部或部分元數(shù)據(jù)對于音頻而言可能不正確,并且所述 數(shù)字音頻比特流可包括代表元數(shù)據(jù)校驗信息的數(shù)據(jù)比特,所述元數(shù)據(jù) 校驗信息能夠用于檢測元數(shù)據(jù)對于音頻而言是否正確,并且如果不正 確,則對其進(jìn)行改變以使其正確,所述處理方法包括確定元數(shù)據(jù)校驗信息是否存在于比特流中, 如果存在元數(shù)據(jù)校驗信息,則確定其是否證實至少 一部分元數(shù)據(jù) 的正確性,如果所述信息證實所述正確性,則使用所述元數(shù)據(jù)對比特流進(jìn)行解碼,如果元數(shù)據(jù)校驗信息沒有證實所述至少 一部分元數(shù)據(jù)的正確性, 則使用它來糾正元數(shù)據(jù)并使用糾正的元數(shù)據(jù)對比特流進(jìn)行解碼, 如果元數(shù)據(jù)校驗信息沒有存在于比特流中,則確定所述至少一部 分元數(shù)據(jù)是否正確,如果所述至少一部分元數(shù)據(jù)正確,則使用所述元數(shù)據(jù)對比特流進(jìn) 行解碼,以及如果所述至少 一部分元數(shù)據(jù)不正確,則利用被設(shè)置為等于默認(rèn)值 的所述至少 一部分元數(shù)據(jù)對比特流進(jìn)行解碼。
26、 一種用于對數(shù)字音頻比特流進(jìn)行解碼的處理方法,所述數(shù)字 音頻比特流包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的 DIALNORM元數(shù)據(jù)和有關(guān)的動態(tài)范圍元數(shù)據(jù),其中,全部或部分元 數(shù)據(jù)對于音頻而言可能不正確,并且所述數(shù)字音頻比特流可包括代表 元數(shù)據(jù)校驗信息的數(shù)據(jù)比特,所述元數(shù)據(jù)校驗信息能夠用于檢測 DIALNORM元數(shù)據(jù)對于音頻而言是否正確,并且如果不正確,則對 其進(jìn)行改變以使其正確,所述處理方法包括確定元數(shù)據(jù)校驗信息是否存在于比特流中,如果存在元數(shù)據(jù)校驗信息,則確定其是否證實DIALNORM元數(shù) 據(jù)的正確性,如果所述信息證實所述正確性,則使用所述DIALNORM元數(shù)據(jù) 對比特流進(jìn)行解碼,如果元數(shù)據(jù)校驗信息沒有證實所述DIALNORM元數(shù)據(jù)的正確 性,則使用元數(shù)據(jù)校驗信息來糾正DIALNORM元數(shù)據(jù),并使用糾正 的DIALNORM元數(shù)據(jù)對比特流進(jìn)行解碼,如果不存在元數(shù)據(jù)校驗信息,則通過以下處理來確定 DIALNORM元數(shù)據(jù)值對于音頻而言是否正確在不使用 DIALNORM元數(shù)據(jù)值和有關(guān)的動態(tài)范圍壓縮元數(shù)據(jù)的情況下對比特 流進(jìn)行解碼,測量解碼的音頻的響度以確定測量的DIALNORM值, 并將比特流的DIALNORM元數(shù)據(jù)值與測量的DIALNORM值進(jìn)行比 較,如果比特流中的DIALNORM值位于測量的DIALNORM值的 閾值差之內(nèi),則使用比特流中的DIALNORM元數(shù)據(jù)和有關(guān)的動態(tài)范 圍壓縮元數(shù)據(jù)對比特流進(jìn)行解碼,以及如果比特流中的DIALNORM值沒有位于測量的DIALNORM 值的閾值差之內(nèi),則利用測量的DIALNORM元數(shù)據(jù)值來糾正 DIALNORM元數(shù)據(jù)值,確定新的動態(tài)范圍壓縮元數(shù)據(jù),并使用糾正 的DIALNORM元數(shù)據(jù)和新的動態(tài)范圍壓縮元數(shù)據(jù)對比特流進(jìn)行解 碼。
27、 一種適合執(zhí)行如權(quán)利要求12到26中的任何一個所述的方法 的設(shè)備。
28、 一種存儲在計算機(jī)可讀介質(zhì)上的計算機(jī)程序,用于使計算機(jī) 執(zhí)行如權(quán)利要求11到26中的任何一個所述的方法。
全文摘要
一種數(shù)字比特流,包括代表音頻的數(shù)據(jù)比特、預(yù)期對于音頻而言正確的元數(shù)據(jù)以及元數(shù)據(jù)校驗信息,其中,全部或部分元數(shù)據(jù)對于音頻而言可能不正確。所述元數(shù)據(jù)校驗信息可用于檢測元數(shù)據(jù)對于音頻而言是否正確,以及如果不正確,則對其進(jìn)行改變以使其正確??捎糜跈z測并改變元數(shù)據(jù)的元數(shù)據(jù)校驗信息可包括元數(shù)據(jù)正確版本的副本或數(shù)據(jù)壓縮的副本。
文檔編號G10L11/00GK101160616SQ200680012133
公開日2008年4月9日 申請日期2006年3月23日 優(yōu)先權(quán)日2005年4月13日
發(fā)明者布萊特·G·克羅克特 申請人:杜比實驗室特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
托克托县| 醴陵市| 涟水县| 宁陵县| 郁南县| 葵青区| 兰坪| 兰考县| 莱州市| 昭通市| 吉木萨尔县| 昂仁县| 隆昌县| 正定县| 保康县| 建昌县| 黄浦区| 延吉市| 泾源县| 汤原县| 曲松县| 松桃| 绥宁县| 大庆市| 巧家县| 阿坝县| 太白县| 凤翔县| 和静县| 张家口市| 平果县| 天台县| 丰顺县| 永康市| 长顺县| 阳高县| 多伦县| 东乡族自治县| 东明县| 鄯善县| 佛教|