用于新媒體設(shè)備上的具有及不具有嵌入式響度元數(shù)據(jù)的媒體的標(biāo)準(zhǔn)化音頻播放的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及對(duì)在電子重現(xiàn)設(shè)備上以數(shù)字形式播放的音頻、視頻及多媒體內(nèi)容的響度的控制,具體而言但非排他性地,涉及常發(fā)生在新媒體設(shè)備上的對(duì)播放響度的控制,其中內(nèi)容是制作成具有及不具有嵌入式響度元數(shù)據(jù)。
【背景技術(shù)】
[0002]在產(chǎn)生及傳輸音樂(lè)、視頻及其它多媒體內(nèi)容時(shí),在不同歌曲間或在不同節(jié)目間執(zhí)行響度標(biāo)準(zhǔn)化過(guò)程來(lái)確保消費(fèi)者聽(tīng)到具有適當(dāng)響度的音頻信號(hào)。自早期的錄音及電影以來(lái),此操作在產(chǎn)生過(guò)程期間進(jìn)行或經(jīng)由用于劇場(chǎng)的重現(xiàn)標(biāo)準(zhǔn)來(lái)進(jìn)行。當(dāng)今在音樂(lè)及無(wú)線電廣播業(yè)內(nèi)的慣常做法是將響度調(diào)整為接近媒體的最大峰值水平的值,而在電影及電視業(yè)內(nèi)的做法是使用比最大峰值水平低20dB至31dB的若干標(biāo)準(zhǔn)響度水平中的之一。在媒體匯流(media convergence)之前的時(shí)代,消費(fèi)者并未注意到上述情形,因?yàn)槭褂梅珠_(kāi)的設(shè)備或音量設(shè)定來(lái)播放每種類(lèi)型的內(nèi)容。
[0003]隨著用于播放音樂(lè)及電影內(nèi)容兩者的移動(dòng)設(shè)備(諸如移動(dòng)電話或可攜式媒體播放器)的出現(xiàn),若將未經(jīng)修改的內(nèi)容傳輸至設(shè)備,則生產(chǎn)實(shí)踐中的此差異導(dǎo)致可能高達(dá)30dB的響度差異。當(dāng)從一種類(lèi)型的內(nèi)容切換至另一種類(lèi)型時(shí),上述情形可能導(dǎo)致電影的音量太小或音樂(lè)的音量太大。
[0004]相關(guān)趨勢(shì)為,在錄音的母帶后期處理(mastering)期間經(jīng)由使用強(qiáng)烈的動(dòng)態(tài)范圍壓縮、限制及限幅(clipping)來(lái)增大許多類(lèi)型的錄制音樂(lè)的響度。此種母帶后期處理是在僅考慮諸如光盤(pán)片的無(wú)損耗記錄媒體的情況下進(jìn)行,但是當(dāng)今所售的大多數(shù)音樂(lè)是諸如MPEG AAC及MP3的有損耗的數(shù)據(jù)壓縮格式。數(shù)據(jù)壓縮過(guò)程可能引入在播放期間在解碼器中重構(gòu)的時(shí)域波形的變化,這種變化引起波形中超過(guò)信號(hào)的全尺度限值或最大峰值的過(guò)沖(overshoot) 0在通常用于移動(dòng)設(shè)備中的定點(diǎn)解碼器(或飽和浮點(diǎn)解碼器)中,上述情形可導(dǎo)致將過(guò)沖限幅至全尺度限值,從而引起重現(xiàn)信號(hào)中的額外可聽(tīng)見(jiàn)的限幅。
[0005]在一些情況下,對(duì)音樂(lè)的強(qiáng)烈壓縮及限幅是出于藝術(shù)目的進(jìn)行,但更常見(jiàn)的是為了以下目的進(jìn)行:通過(guò)使錄音比其它錄音“聽(tīng)起來(lái)更響”來(lái)增加錄音的商業(yè)吸引力,或?yàn)榱嗽谒袃A聽(tīng)環(huán)境中(諸如在機(jī)場(chǎng)或嘈雜場(chǎng)所以及安靜環(huán)境中)提供可被理解的內(nèi)容。
[0006]在電影及視頻行業(yè)內(nèi),在一些類(lèi)型中使用廣泛音頻動(dòng)態(tài)范圍來(lái)獲得巨大效果及創(chuàng)造更具吸引力的體驗(yàn)。當(dāng)經(jīng)由杜比數(shù)位或MPEG-4AAC編碼傳送給消費(fèi)者時(shí),通常包括音頻動(dòng)態(tài)范圍控制元數(shù)據(jù),以便允許在存在嘈雜環(huán)境的情況下或在大聲場(chǎng)景過(guò)于煩擾的情況下在接收器或播放器處選擇地減小動(dòng)態(tài)范圍。
[0007]由杜比數(shù)位來(lái)編碼的DVD或BluRay內(nèi)容中所包括的傳統(tǒng)元數(shù)據(jù)或在由杜比數(shù)位(在先進(jìn)電視系統(tǒng)委員會(huì)公司的音頻壓縮標(biāo)準(zhǔn)A/52中標(biāo)準(zhǔn)化)或MPEG-4AAC (在IS0/IEC14496-3及ETSI TS 101 154中標(biāo)準(zhǔn)化)來(lái)編碼的TV信號(hào)中所傳輸?shù)膫鹘y(tǒng)元數(shù)據(jù)包括以下分量:
[0008]1.單個(gè)靜態(tài)元數(shù)據(jù)值,其指示節(jié)目的總體長(zhǎng)期整合響度,在MPEG標(biāo)準(zhǔn)中稱為節(jié)目參考水平。
[0009]2.降混增益的靜態(tài)元數(shù)據(jù)值,其用來(lái)控制多聲道內(nèi)容的降混以便經(jīng)由立體聲或單聲道設(shè)備輸出。
[0010]3.動(dòng)態(tài)范圍控制增益或縮放因子之兩個(gè)集合,其是在音頻信號(hào)中針對(duì)用于多個(gè)頻帶或頻區(qū)的每一經(jīng)數(shù)據(jù)壓縮的比特流幀加以發(fā)送。在行業(yè)術(shù)語(yǔ)中,一個(gè)集合是用于“輕度”壓縮,且另一個(gè)集合用于“重度”壓縮。所述輕度及重度DRC值的使用通常與在針對(duì)操作模式“線路模式”及“RF模式”所建立的解碼器響度目標(biāo)水平上的操作有關(guān)。針對(duì)此等模式的命名慣例及操作點(diǎn)是在數(shù)字媒體的初期建立的,在數(shù)字媒體的初期可能必需將數(shù)字音頻轉(zhuǎn)換為模擬信號(hào),所述這些模擬信號(hào)發(fā)送基頻纜線至后續(xù)設(shè)備上的線路輸入端或經(jīng)由RF載波傳輸至模擬電視機(jī)裝置。
[0011]這個(gè)元數(shù)據(jù)的使用允許在播放期間以非破壞性方式使重現(xiàn)適應(yīng)于傾聽(tīng)環(huán)境??捎貌煌脑獢?shù)據(jù)集合或完全不使用元數(shù)據(jù)來(lái)播放相同的流或文件,以便產(chǎn)生不同的動(dòng)態(tài)范圍。不同于使用僅存在于播放設(shè)備中的壓縮器,使用元數(shù)據(jù)的動(dòng)態(tài)范圍控制允許創(chuàng)造性藝術(shù)家必要時(shí)在產(chǎn)生過(guò)程期間監(jiān)視及控制壓縮的性質(zhì)。
[0012]不幸的是,常常在諸如MPEG AAC或杜比數(shù)字家族的有損耗多媒體數(shù)字信號(hào)編解碼器中實(shí)現(xiàn)的動(dòng)態(tài)范圍控制元數(shù)據(jù)不能對(duì)足夠強(qiáng)的信號(hào)進(jìn)行壓縮以便與當(dāng)代音樂(lè)的響度匹配,因?yàn)樵撛獢?shù)據(jù)以音頻壓縮幀為基礎(chǔ)影響信號(hào)的平均功率(可能在若干頻帶中),其中常見(jiàn)的幀周期為20ms至40ms。此逐幀增益控制不夠快,以致于不能將信號(hào)的峰值與平均值之比減小至經(jīng)高度處理的當(dāng)代音樂(lè)的峰值與平均值之比。
[0013]如[5]中所描述的,由Wolters等人用來(lái)解決此問(wèn)題的方法是在播放設(shè)備中使用接在解碼器后面的音頻限制器來(lái)增加平均響度。此將解決響度匹配問(wèn)題,以使得音樂(lè)及電影內(nèi)容具有相等響度,但有若干缺點(diǎn)。當(dāng)消費(fèi)者在安靜環(huán)境中(可能在安靜房間內(nèi)使用連接至揚(yáng)聲器的移動(dòng)設(shè)備,或使用具有強(qiáng)隔音效果的頭戴式耳機(jī)或入耳式耳機(jī))播放內(nèi)容時(shí),電影內(nèi)容被壓縮的強(qiáng)烈程度將與音樂(lè)相同,這是不符合要求的。限制器亦在設(shè)備CPU或DSP上引入額外工作負(fù)載,從而縮短電池壽命。
[0014]由Camerer等人在[6]中描述一種不同的方法,其提議將諸如ITU標(biāo)準(zhǔn)BS.1770-2中所描述的響度量測(cè)結(jié)果編碼作為音樂(lè)文件中的元數(shù)據(jù),并且將每一文件的播放標(biāo)準(zhǔn)化為設(shè)備的音量控制所設(shè)定的目標(biāo)水平集合。此方法依靠先前的音樂(lè)響度標(biāo)準(zhǔn)化系統(tǒng),諸如SoundCheck (www.apple, com)及 ReplayGain (www.replaygain.0rg),這些所述系統(tǒng)是諸如iPod的一些音樂(lè)播放器的可選擇的特征。在這些他們的方法中,提倡要求響度標(biāo)準(zhǔn)化預(yù)設(shè)為開(kāi)啟;然而,并未規(guī)定當(dāng)使用者關(guān)閉響度標(biāo)準(zhǔn)化時(shí)出現(xiàn)什么情況,或更重要的是,當(dāng)播放未用響度元數(shù)據(jù)來(lái)編碼的內(nèi)容時(shí)出現(xiàn)什么情況。假設(shè)所有內(nèi)容在播放前將由播放設(shè)備或由安全的可信賴的散布者(諸如iTunes)進(jìn)行分析。另外,關(guān)于調(diào)整內(nèi)容的總體動(dòng)態(tài)范圍來(lái)使其適應(yīng)于傾聽(tīng)環(huán)境并未作出規(guī)定。
[0015]因此,本發(fā)明之一的目標(biāo)是提供統(tǒng)一的方法來(lái)解決使以下兩種內(nèi)容的播放響度標(biāo)準(zhǔn)化的問(wèn)題:電影/視頻式內(nèi)容,其可能具有廣泛的動(dòng)態(tài)范圍及可能的嵌入式響度元數(shù)據(jù);以及音樂(lè)或無(wú)線電/播客內(nèi)容,其可能具有極窄的動(dòng)態(tài)范圍及強(qiáng)烈的壓縮、限制及限幅,可能含有但很可能不含嵌入式響度元數(shù)據(jù),由于消費(fèi)者已經(jīng)擁有或交換了大量先前音樂(lè)內(nèi)容。
[0016]本發(fā)明的另一目標(biāo)是允許按消費(fèi)者之傾聽(tīng)環(huán)境或品味來(lái)調(diào)整含有動(dòng)態(tài)范圍控制元數(shù)據(jù)的內(nèi)容的動(dòng)態(tài)范圍。
[0017]本發(fā)明的另一目標(biāo)是預(yù)防有損耗的數(shù)據(jù)壓縮音頻解碼器(諸如AAC、MP3或杜比數(shù)位解碼器)中由信號(hào)分量變化引起的可能的限幅,這些變化是由數(shù)據(jù)壓縮過(guò)程引入。
[0018]本發(fā)明的另一目標(biāo)是對(duì)音樂(lè)錄制業(yè)提供輕微的激勵(lì),以使其放棄對(duì)其內(nèi)容中的更強(qiáng)的動(dòng)態(tài)范圍壓縮、限制及限幅的追求。
[0019]本發(fā)明的又一目標(biāo)是限制設(shè)備CPU或DSP上由響度處理或限幅預(yù)防所引起的額外工作負(fù)載。
【發(fā)明內(nèi)容】
[0020]本發(fā)明之一實(shí)施例包括一種用于解碼比特流以便從該比特流產(chǎn)生音頻輸出信號(hào)的解碼器設(shè)備,該比特流包含音頻數(shù)據(jù)且選擇地包含含有一參考響度值的響度元數(shù)據(jù),該解碼器設(shè)備包含:
[0021]音頻解碼器設(shè)備,其被配置為從該音頻數(shù)據(jù)重構(gòu)音頻信號(hào);以及
[0022]信號(hào)處理器,其被配置為基于該音頻信號(hào)產(chǎn)生該音頻輸出信號(hào);
[0023]其中該信號(hào)處理器包含增益控制設(shè)備,該增益控制設(shè)備被配置為調(diào)整該音頻輸出信號(hào)的水平;
[0024]其中該增益控制設(shè)備包含參考響度解碼器,該參考響度解碼器被配置為產(chǎn)生一響度值,其中在該參考響度值存在于該比特流中的情況下,該響度值為該參考響度值;
[0025]其中該增益控制設(shè)備包含增益計(jì)算器,該增益計(jì)算器被配置為基于該響度值且基于音量控制值計(jì)算增益值,該音量控制值是由允許使用者控制該音量控制值的使用者接口提供;
[0026]其中該增益控制設(shè)備包含響度處理器,該響度處理器被配置為基于該增益值控制該音頻輸出信號(hào)的響度。
[0027]該音頻解碼器設(shè)備可為能夠從壓縮式比特流的音頻數(shù)據(jù)重構(gòu)音頻信號(hào)的任何設(shè)備。信號(hào)處理器可以是能夠在來(lái)自音頻解碼器設(shè)備的音頻信號(hào)被設(shè)定至其時(shí)產(chǎn)生音頻輸出信號(hào)并且具有如下文所闡述的增益控制設(shè)備的任何設(shè)備。增益控制設(shè)備是經(jīng)設(shè)置來(lái)控制音頻輸出信號(hào)的響度的設(shè)備。
[0028]參考響度解碼器被配置為解碼比特流中所含的響度元數(shù)據(jù)。若響度元數(shù)據(jù)含有參考響度值,則參考響度解碼器正是將此參考響度值輸出為響度值。
[0029]增益計(jì)算器是用于計(jì)算增益值的設(shè)備,該增益值是基于由參考響度解碼器輸出的響度值及由解碼器設(shè)備的使用者設(shè)定的音量控制值。為了設(shè)定音量控制值,可使用任何使用者界面。增益計(jì)算器特定而言可為減法器。
[0030]響度處理器能夠基于由增益計(jì)算器提供的增益值來(lái)控制音頻輸出信號(hào)的響度水平。響度處理器特定而言可為乘法器。
[0031]不同于可攜式設(shè)備中或消費(fèi)者電子設(shè)備中所使用的傳統(tǒng)的壓縮式解碼器設(shè)備(諸如杜比數(shù)位或AAC解碼器設(shè)備),用可變?cè)鲆嬷祷蚪獯a器目標(biāo)臨界值(對(duì)應(yīng)于全尺度比特流的解碼水平)來(lái)操作壓縮解碼器設(shè)備,該臨界值受控于使用者的音量控制。此允許解碼器設(shè)備通常在設(shè)備的數(shù)字音頻系統(tǒng)的最大全尺度范圍以下很好地操作。此操作避免了限幅解碼器過(guò)沖的可能性,且允許不具有重度動(dòng)態(tài)范圍壓縮及限制的電影式內(nèi)容的響度標(biāo)準(zhǔn)化至具有重度壓縮及限制的音樂(lè)內(nèi)容的響度標(biāo)準(zhǔn)化,而無(wú)需不會(huì)如通常所需對(duì)電影式內(nèi)容進(jìn)行進(jìn)一步壓縮或限制。僅出于響度匹配目的,本發(fā)明在不減小內(nèi)容的動(dòng)態(tài)范圍的情況下執(zhí)行此標(biāo)準(zhǔn)化。
[0032]在本發(fā)明之一優(yōu)選實(shí)施例中,在參考響度值不存在于比特流中的情況下,響度值為預(yù)設(shè)響度值。此等特征允許不具有響度元數(shù)據(jù)的比特流的高質(zhì)量播放。
[0033]在本發(fā)明之一優(yōu)選實(shí)施例中,預(yù)設(shè)響度值被設(shè)定為介于_4dB與-1OdB之間的值,特定而言,介于_6dB與-SdB之間,該值被稱為全尺度振幅。當(dāng)代音樂(lè)的實(shí)驗(yàn)研究顯示,傾向于進(jìn)行全尺度播放的音樂(lè)內(nèi)容的響度的觀測(cè)上限約為_(kāi)7dB。因此,所主張預(yù)設(shè)響度值提供用于播放不具有響度元數(shù)據(jù)的比特流的最佳化模式。
[0034]在本發(fā)明之一優(yōu)選實(shí)施例中,信號(hào)處理器包含動(dòng)態(tài)范圍控制設(shè)備,該動(dòng)態(tài)范圍控制設(shè)備被配置為調(diào)整音頻輸出信號(hào)的動(dòng)態(tài)范圍,
[0035]其中該動(dòng)態(tài)范圍控