自動(dòng)響度控制的制作方法
【專利摘要】一種改進(jìn)的自動(dòng)響度控制系統(tǒng)和方法包括:控制施加至輸入音頻信號(hào)的增益/衰減并且提供為放大的/衰減的輸入音頻信號(hào)的輸出音頻信號(hào);根據(jù)輸入音頻信號(hào)來評(píng)估輸入音頻信號(hào)的實(shí)際響度并且根據(jù)音量控制輸入來評(píng)估輸入音頻信號(hào)的期望響度;以及根據(jù)輸入音頻信號(hào)的實(shí)際響度和期望響度來評(píng)估施加至輸入音頻信號(hào)的增益/衰減。
【專利說明】自動(dòng)響度控制
【技術(shù)領(lǐng)域】
[0001]本文中公開的系統(tǒng)和方法涉及尤其用于音頻再現(xiàn)系統(tǒng)的自動(dòng)響度控制系統(tǒng)和方法。
【背景技術(shù)】
[0002]任何類型的音頻內(nèi)容均可以音頻信號(hào)的形式存儲(chǔ)在諸如CD、DVD、半導(dǎo)體存儲(chǔ)器、硬盤等的多種大容量存儲(chǔ)介質(zhì)上。高效音頻信號(hào)壓縮方法(如MP3)允許存儲(chǔ)甚至更多的音頻內(nèi)容(例如但不限于較小存儲(chǔ)介質(zhì)上的具有多個(gè)不同種類和藝術(shù)家的音樂)。不同的內(nèi)容可合并成播放列表。廣播可為包括音樂和語音、電臺(tái)節(jié)目和廣告等在內(nèi)的不同音頻內(nèi)容的來源。單獨(dú)的或彼此組合的各種內(nèi)容可提供具有強(qiáng)烈變化的信號(hào)級(jí)和信號(hào)動(dòng)態(tài)的音頻信號(hào),所述音頻信號(hào)由于具有不同的響度級(jí)而被聽眾察覺。然而,通常認(rèn)為過度的響度級(jí)、高動(dòng)態(tài)等會(huì)令人不悅或甚至令人煩惱。常見的自動(dòng)響度控制系統(tǒng)和方法旨在整平此類響度波動(dòng),但其不能足夠有效或者會(huì)使音頻內(nèi)容劣化。為了解決這些和其它所關(guān)注的問題,改進(jìn)的自動(dòng)響度控制(ALC)系統(tǒng)和方法將有所幫助。
【發(fā)明內(nèi)容】
[0003]一種改進(jìn)的自動(dòng)響度控制系統(tǒng)包括:具有增益/衰減控制輸入、音頻信號(hào)輸入、音頻信號(hào)輸出的可控增益/衰減單元,并且其在音頻信號(hào)輸出與音頻信號(hào)輸入之間的增益/衰減由增益/衰減控制輸入信號(hào)控制。增益/衰減評(píng)估單元連接至可控增益/衰減單元的增益/衰減控制輸入并且具有實(shí)際響度輸入和期望響度輸入。實(shí)際響度評(píng)估單元連接在可控增益/衰減單元的音頻信號(hào)輸入之間并且向增益/衰減評(píng)估單元提供實(shí)際響度輸入。期望響度評(píng)估單元連接至增益/衰減評(píng)估單元的期望響度輸入并且具有音量控制輸入。增益/衰減評(píng)估單元被配置用于根據(jù)提供至期望響度評(píng)估單元的音量控制輸入和可控增益/衰減單元的音頻信號(hào)輸入的信號(hào)來控制可控增益/衰減單元。
[0004]一種改進(jìn)的自動(dòng)響度控制方法包括:控制施加至輸入音頻信號(hào)的增益/衰減并且提供為放大的/衰減的輸入音頻信號(hào)的輸出音頻信號(hào);根據(jù)輸入音頻信號(hào)來評(píng)估輸入音頻信號(hào)的實(shí)際響度并且根據(jù)音量控制輸入來評(píng)估輸入音頻信號(hào)的期望響度;以及根據(jù)輸入音頻信號(hào)的實(shí)際響度和期望響度來評(píng)估施加至輸入音頻信號(hào)的增益/衰減。
【專利附圖】
【附圖說明】
[0005]下文根據(jù)附圖中各圖所示出的示例性實(shí)施方案對(duì)各具體實(shí)施方案進(jìn)行更加詳細(xì)地描述。除非另外說明,相似或相同的部分在所有的圖中用相同的參考標(biāo)號(hào)來標(biāo)記。
[0006]圖1為示出響度與響度級(jí)之間關(guān)系的圖。
[0007]圖2為示出人耳的f等響度級(jí)曲線的圖。
[0008]圖3為示出具有頻率獨(dú)立增益/衰減控制的示例性自動(dòng)響度控制系統(tǒng)的框圖。
[0009]圖4為示出具有頻率獨(dú)立增益/衰減控制的另一示例性自動(dòng)響度控制系統(tǒng)的框圖。
[0010]圖5為示出具有頻率依賴增益/衰減控制的示例性自動(dòng)響度控制系統(tǒng)的框圖。
[0011]圖6為示出具有頻率依賴增益/衰減控制的另一示例性自動(dòng)響度控制系統(tǒng)的框圖,所述自動(dòng)響度控制系統(tǒng)涉及合成背景噪聲。
[0012]圖7為示出各種車速下車輛內(nèi)部背景噪聲的典型特性的圖。
[0013]圖8為示出具有頻率依賴動(dòng)態(tài)增益/衰減控制的示例性自動(dòng)響度控制系統(tǒng)的框圖,所述自動(dòng)響度控制系統(tǒng)利用心理聲學(xué)模型(PAM)來計(jì)算輸入信號(hào)的頻譜響度。
[0014]圖9為示出具有頻率依賴動(dòng)態(tài)增益/衰減控制的另一示例性自動(dòng)響度控制系統(tǒng)的框圖,所述自動(dòng)響度控制系統(tǒng)涉及合成背景噪聲以限定由音量設(shè)置控制的響度的期望頻譜軌跡。
[0015]圖10為示出具有頻率依賴動(dòng)態(tài)增益/衰減控制的另一示例性自動(dòng)響度控制系統(tǒng)的框圖,所述自動(dòng)響度控制系統(tǒng)涉及由音量設(shè)置控制的期望合成背景噪聲的頻譜響度曲線。
[0016]圖11為示出用于在改進(jìn)的ALC系統(tǒng)中實(shí)現(xiàn)期望響度曲線的示例性心理聲學(xué)建模單元的框圖。
[0017]圖12為示出具有頻率依賴動(dòng)態(tài)增益/衰減控制的示例性自動(dòng)響度控制系統(tǒng)的框圖,所述自動(dòng)響度控制系統(tǒng)涉及聽覺拾取的背景噪聲。
[0018]圖13為示出具有頻率依賴動(dòng)態(tài)增益/衰減控制的另一示例性自動(dòng)響度控制系統(tǒng)的框圖,所述自動(dòng)響度控制系統(tǒng)涉及聽覺拾取的背景噪聲。
[0019]圖14為示出具有頻率依賴動(dòng)態(tài)增益/衰減控制的另一示例性自動(dòng)響度控制系統(tǒng)的框圖,所述自動(dòng)響度控制系統(tǒng)涉及聽覺拾取的背景噪聲。
[0020]圖15為示出不同有色噪聲的頻率特性的框圖。
【具體實(shí)施方式】
[0021 ] 根據(jù)美國國家標(biāo)準(zhǔn)學(xué)會(huì)的〃美國國家心理聲學(xué)術(shù)語(American nationalpsychoacoustical terminology) 〃,S3.20, 1973,美國標(biāo)準(zhǔn)協(xié)會(huì),〃響度〃被定義為〃聲音按照其從安靜到響亮的范圍排序的聽覺屬性〃。換言之,響度為聲音的質(zhì)量,其主要是物理強(qiáng)度的心理關(guān)聯(lián)(量級(jí))。對(duì)響度的感知與聲壓級(jí)和聲音持續(xù)時(shí)間有關(guān)。人的聽覺系統(tǒng)會(huì)整合(均化)600-1,OOOrns窗口內(nèi)的聲壓級(jí)(SPL)的效應(yīng)。例如,當(dāng)將20、50、100、200ms的樣本播放達(dá)到最多大約I秒時(shí)(此刻對(duì)響度的感知將穩(wěn)定),將感知到恒定SPL的聲音的響度增加。對(duì)于大于I秒的長持續(xù)時(shí)間聲音,對(duì)響度的瞬間感知將基于對(duì)前600-1,OOOrns的整
八
口 ο
[0022]就長于I秒的聲音的SPL與響度之間的關(guān)系而言,其可近似地由相對(duì)于聲壓或聲強(qiáng)繪制的冪函數(shù)斯蒂文思冪定律(Stevens Power Law)來表示。隨后進(jìn)行更加精確的測量,其顯示響度在低級(jí)別和高級(jí)別下快速增長(具有較高的指數(shù)),在中等級(jí)別下增長不快(具有較低的指數(shù))。
[0023]用于度量響度的單位是宋(響度N)和方(響度級(jí)L)。對(duì)于逸出的均勻噪聲信號(hào),宋與方之間的關(guān)系如圖1所示。均勻的逸出噪聲旨在表示平均音頻信號(hào)。窄帶信號(hào),特別是周期信號(hào)表現(xiàn)出不同的關(guān)系。[0024]人耳的敏感度隨著頻率變化,如圖2的圖所示。該圖中的每個(gè)線條表示要感知為等響度的頻率所需的SPL,據(jù)此實(shí)線描繪出根據(jù)IS0226:2003修訂本的等響度線,并且標(biāo)記有"ο"的線條描繪出針對(duì)40方的初始ISO標(biāo)準(zhǔn)。該圖表明,人對(duì)2 - 4kHz左右的聲音最為敏感,其中敏感度在此區(qū)域的任一側(cè)均會(huì)下降。響度感知的完整模型包括通過每種聲音的頻率和持續(xù)時(shí)間對(duì)SPL的整合。
[0025]當(dāng)同時(shí)聽到兩種聲音時(shí),一種聲音可能〃掩蔽〃另一種聲音,這意味著聽眾僅會(huì)聽到兩種聲音中較響的聲音。這被稱為同時(shí)掩蔽或聽覺掩蔽。同時(shí)掩蔽僅在一種聲音幾乎完全覆蓋另一種聲音的時(shí)頻分布時(shí)發(fā)生。較響的信號(hào)可稱為"掩蔽信號(hào)",而較靜的信號(hào)可稱為"被掩蔽信號(hào)"。如果在每個(gè)頻率上掩蔽信號(hào)和信號(hào)兩者的響度與單獨(dú)的掩蔽信號(hào)的響度之間的差值低于響度的最小可覺差(JND)(約ldB),則發(fā)生同時(shí)掩蔽。
[0026]時(shí)域掩蔽也稱為〃異時(shí)掩蔽",其在突然刺激聲音使得恰好在刺激之前或刺激之后存在的其它聲音無法聽見時(shí)發(fā)生。使得恰好在掩蔽信號(hào)之前的聲音模糊的掩蔽稱為后向掩蔽或超前掩蔽,而使得恰好在掩蔽信號(hào)之后的聲音模糊的掩蔽稱為前向掩蔽或滯后掩蔽。時(shí)域掩蔽的效率從掩蔽信號(hào)的起始到偏移以指數(shù)衰減,其中起始衰減持續(xù)大約20ms,偏移衰減持續(xù)大約100ms。與同時(shí)掩蔽類似,時(shí)域掩蔽反映出聽覺系統(tǒng)所進(jìn)行的頻率分析。當(dāng)具有相似頻率的兩個(gè)音調(diào)一起播放時(shí),其組合響度為其強(qiáng)度之和的立方根。當(dāng)各頻率相隔比一個(gè)臨界頻帶更遠(yuǎn)時(shí),它們的響度級(jí)反而會(huì)疊加在一起。
[0027]現(xiàn)參照?qǐng)D3,示出示例性自動(dòng)響度控制系統(tǒng),其連接在音頻信號(hào)源I與揚(yáng)聲器2之間。該系統(tǒng)包括可控增益/衰減單元3,例如,具有可控增益或衰減器的放大器或允許同時(shí)控制增益和衰減的倍增器,視情況而定。音頻源I生成輸入音頻信號(hào)X [k],該音頻信號(hào)被提供至心理聲學(xué)建模(PAM)單元如響度建模單元4和提供至可控增益/衰減單元3的音頻信號(hào)輸入。響度建模單元4通過電例如數(shù)字信號(hào)并且根據(jù)(數(shù)字)心理聲學(xué)掩蔽模型來重現(xiàn)人耳的聲學(xué)掩蔽行為或其選定的掩蔽效應(yīng)。
[0028]響度建模單元4將·表示輸入音頻信號(hào)x[k]的經(jīng)計(jì)算的(寬頻帶)響度(級(jí))曲線的響度信號(hào)LoudSig[k]提供至響度級(jí)計(jì)算單元5,響度級(jí)計(jì)算單元5計(jì)算輸入音頻信號(hào)x[k]的響度級(jí)信號(hào)LoudLevsig[k],即其實(shí)際響度級(jí)。通過音量-響度級(jí)轉(zhuǎn)換單元6將期望響度級(jí)以期望響度級(jí)信號(hào)LoudLev1^[Vol]提供。音量-響度級(jí)轉(zhuǎn)換單元6可例如利用查表法或轉(zhuǎn)換計(jì)算方案??赏ㄟ^音量控制元件(未示出)如控制輪、電位計(jì)、鍵盤、觸摸屏等來選擇期望響度級(jí),該音量控制元件向音量-響度級(jí)轉(zhuǎn)換單元6提供音量(Vol)設(shè)置(或信號(hào))。
[0029]將實(shí)際響度級(jí)和期望響度級(jí),即響度信號(hào)LoudLevsig[k]和LoudLevDes [Vol]饋送入生成控制增益/衰減單元3的增益/衰減控制信號(hào)G[k]的增益/衰減計(jì)算單元7,使得輸入音頻信號(hào)x[k]被增益/衰減單元3放大/衰減,從而將輸出音頻信號(hào)輸出[k]提供至揚(yáng)聲器2。因此,控制施加至輸入音頻信號(hào)的增益/衰減并且以輸出音頻信號(hào)輸出(k)的形式提供放大的/衰減的輸入音頻信號(hào)。根據(jù)輸入音頻信號(hào)來確定(例如計(jì)算)輸入音頻信號(hào)的實(shí)際響度,并根據(jù)音量控制輸入來確定(例如計(jì)算)輸入音頻信號(hào)的期望響度。根據(jù)輸入音頻信號(hào)的實(shí)際響度和期望響度來確定待施加至輸入音頻信號(hào)的增益/衰減。
[0030]在圖4中,示出根據(jù)音量(Vol)設(shè)置生成期望響度級(jí)信號(hào)LoudLevlles [Vol]的替代方式。向音量-響度級(jí)轉(zhuǎn)換單元8提供Vol設(shè)置以由其提供音量級(jí)信號(hào)VolLev[Vol]。音量-響度級(jí)轉(zhuǎn)換單元8可利用表示響度N與響度級(jí)L之間的關(guān)系(如圖1中所示)的圖表或數(shù)學(xué)方程,其中音量(Vol)對(duì)應(yīng)于響度N并且音量級(jí)VolLev [Vol]對(duì)應(yīng)于響度N。將音量級(jí)VolLev [Vol]提供至向等響度單元9,等響度單元9提供表示期望寬頻帶響度的期望響度信號(hào)L0UdDes[V0l]。等響度單元9可通過圖表、數(shù)學(xué)算法、軟件模型等利用感知等響度級(jí)的曲線,也稱為等響度曲線或等響度級(jí)曲線,如圖2的圖所示。然后通過響度級(jí)計(jì)算單元10將期望響度,即期望響度信號(hào)LoudDes[Vol]轉(zhuǎn)換成期望響度級(jí)信號(hào)LoudLeVDes[Vol],將該期望響度級(jí)信號(hào)提供至增益/衰減計(jì)算單元7。
[0031]圖3和4的系統(tǒng)對(duì)于其中響度的頻譜方面不太重要或不占主導(dǎo)(例如與單調(diào)或均勻的音頻信號(hào)一樣)的所有應(yīng)用而言完全足夠。然而,在其中所有音頻信號(hào)頻譜分布重要的所有情況中,就頻譜特性而言,更先進(jìn)的系統(tǒng)是有利的。
[0032]參照?qǐng)D5,其基于圖4的系統(tǒng)。圖4的系統(tǒng)具有頻率依賴可控增益/衰減單元,例如代替頻率獨(dú)立增益/衰減單元3的可控均衡(EQ)單元11可代替增益/衰減計(jì)算單元7的濾波器系數(shù)計(jì)算單元12。可除去響度級(jí)計(jì)算單元5和響度級(jí)計(jì)算單元10以使得響度建模單元4和等響度單元9直接耦合至可控均衡單元11,從而將實(shí)際響度信號(hào)LoudSig[k]和期望響度信號(hào)Loudltes[Vol]提供至可控均衡單元11??煽鼐鈫卧?1向輸入音頻信號(hào)x[k]提供頻率依賴增益/衰減。
[0033]有若干種方法來實(shí)現(xiàn)可控均衡單元11的均衡功能性。例如,將頻域中的快速卷積與時(shí)域中的輸入音頻信號(hào)X[k]的快速傅里葉變換(FFT)和頻域中的經(jīng)處理的信號(hào)音頻信號(hào)x[k]的快速傅里葉逆變換結(jié)合使用,使得輸出音頻信號(hào)輸出[k]處于時(shí)域中。另一種選擇是用(受限)有限脈沖響應(yīng)濾波器(FIR)來處理時(shí)域中的輸入音頻信號(hào)x[k]。第一種選擇需要更大的內(nèi)存,但計(jì)算時(shí)間較短;第二中選擇需要較小的內(nèi)存,但計(jì)算時(shí)間較長。均衡的其它適用方法可包括預(yù)測器或預(yù)測誤差濾波器,其系數(shù)可通過使用例如梯度自適應(yīng)格型(GAL)或萊文森-德賓(Levinson-Durbin)遞歸算法進(jìn)行線性預(yù)測編碼(LPC)分析來確定。
[0034]自動(dòng)響度控制系統(tǒng)和方法的缺點(diǎn)(尤其是在汽車應(yīng)用中)是背景噪聲。例如在車輛中,揚(yáng)聲器2發(fā)出的聲學(xué)音頻信號(hào)應(yīng)可由聽眾感知,這意味著其必須超過所存在的噪聲,但總的音頻信號(hào)級(jí)不應(yīng)超過某個(gè)級(jí)以便仍然被感知為是愉悅的。
[0035]參照?qǐng)D6,為了解決背景噪聲問題,向圖5的系統(tǒng)添加噪聲合成器單元13,其利用噪聲合成模型并且評(píng)估至少一種對(duì)應(yīng)于背景噪聲的(非聲學(xué))噪聲相關(guān)信號(hào)nrs[k],例如代表車輛速度或車輛引擎的每分轉(zhuǎn)數(shù)(rpm)的信號(hào)。例如,由電機(jī)產(chǎn)生并且主要取決于電機(jī)的噪聲和/或由車輪或風(fēng)產(chǎn)生并且主要取決于車輛速度的噪聲可能對(duì)車輛內(nèi)部的背景噪聲貢獻(xiàn)最大。噪聲合成器單元13根據(jù)經(jīng)評(píng)估的噪聲相關(guān)信號(hào)nrs[k]產(chǎn)生與車輛內(nèi)部的背景噪聲相似或甚至相同的聲音,并且將該合成的(例如"估計(jì)的〃)噪聲以背景噪聲信號(hào)b[k]的形式作為二次輸入提供至響度建模單元4,然后響度建模單元4生成輸入音頻信號(hào)x[k]和背景噪聲信號(hào)b[k]兩者的實(shí)際響度信號(hào)LoudSig[k]和Loud噪聲[k]并且將其提供至濾波器系數(shù)計(jì)算單元12。濾波器系數(shù)計(jì)算單元12控制可控均衡單元11的濾波器系數(shù),可控均衡單元11根據(jù)兩種實(shí)際響度信號(hào)LoudSig[k]和Loud噪聲[k]來提供輸入音頻信號(hào)x[k]的頻率依賴增益/衰減。計(jì)算可包括將信號(hào)LoucLs[Vol]和Loud噪聲[k]的最大值進(jìn)行相互對(duì)比,從而形成與實(shí)際響度信號(hào)LoudSig[k]進(jìn)行對(duì)比的新的基準(zhǔn)(而非僅Loudltes[Vol])。新的基準(zhǔn)與實(shí)際響度信號(hào)LoudSig[k]之間的差異指示要達(dá)到期望響度而必須對(duì)系數(shù)進(jìn)行改變的程度。[0036]可使用背景噪聲分布(B卩,各種車速rpm等的實(shí)際背景噪聲特性來評(píng)估車輛內(nèi)部存在的背景噪聲,而非基于表示噪聲的信號(hào)的估計(jì)。圖7以噪聲SPL(單位dB)和頻率f (單位Hz)示出車輛內(nèi)部針對(duì)各種車速的背景噪聲的此類(如一次測量的和存儲(chǔ)的)特性??煽闯?,振幅和頻率按照速度的分布表現(xiàn)出相似的形狀,然而,針對(duì)頻率的水平根據(jù)車輛速度偏移-速度越高,水平越高。通過此背景噪聲分布和測定車輛速度的傳感器,可易于合成背景噪聲。
[0037]圖8示出主要在頻域中處理信號(hào)的改進(jìn)的ALC系統(tǒng)。在圖8的系統(tǒng)中,音頻信號(hào)源I將位于時(shí)域中的輸入音頻信號(hào)x[k]提供至快速傅里葉變換(FFT)單元15,快速傅里葉變換(FFT)單元15將輸入音頻信號(hào)X[k]變換成頻域中的輸入音頻信號(hào)Χ(ω)。將輸入音頻信號(hào)Χ(ω)提供至心理聲學(xué)模型(PAM)單元如心理聲學(xué)增益成形單元14以及提供至倍增器16,倍增器16還接收來自心理聲學(xué)增益成形單元14的表示頻譜增益系數(shù)的信號(hào)G(co)并且生成頻譜輸出音頻信號(hào)輸出(ω),該頻譜輸出音頻信號(hào)輸出被饋送入快速傅里葉逆變換(IFFT)單元17,在其中變換成時(shí)域中的輸出音頻信號(hào)輸出[k]。通過另一快速傅里葉變換(FFT)單元18將估計(jì)的噪聲頻譜Ns(co)提供至心理聲學(xué)增益成形單元14,快速傅里葉變換(FFT)單元18將來自時(shí)域的噪聲信號(hào)\[?變換成頻域中估計(jì)的噪聲頻譜Ns(co)。估計(jì)的噪聲信號(hào)ns[k]為背景噪聲發(fā)生器/合成器20的放大的/衰減的輸出信號(hào)。根據(jù)音量(Vol)設(shè)置通過可控增益/衰減單元19將增益/衰減施加至輸入音頻信號(hào)X [k],其可通過心理聲學(xué)模型(PAM)變換成期望的寬頻帶響度函數(shù)。
[0038]可將線性預(yù)測編碼(LPC)用作通過縮減長度并且在時(shí)域中轉(zhuǎn)換增益/衰減系數(shù)g的簡單而有效的方g,所述增益/衰減系數(shù)g可施加到預(yù)測濾波器中??墒褂每焖俑道锶~變換(FFT)(或翹曲快速傅里葉變換(WFFT))進(jìn)行時(shí)間向頻譜域的轉(zhuǎn)換,其中某些頻譜槽可以心理聲學(xué)刺激的不同寬度的頻帶(例如基于Bark標(biāo)度)歸組。
[0039]線性預(yù)測編碼(LPC)是頻 譜估計(jì)和合成的方法。在語音編碼中,LPC嘗試以濾波器系數(shù)估計(jì)聲音的功率譜密度(PSD),當(dāng)施加至激勵(lì)源時(shí)需要所述濾波器系數(shù)來合成所述聲音,激勵(lì)源可為其中諧波具有相同振幅噪聲或頻帶限制脈沖波。在這種情況下的合成應(yīng)用中,可修改激勵(lì)波形和濾波器系數(shù)(在頻率和時(shí)域兩者中)以創(chuàng)建初始聲音的相關(guān)變量。
[0040]當(dāng)計(jì)算頻率依賴增益系數(shù)G(co)時(shí),輸入音頻信號(hào)Χ(ω)的頻譜可連同估計(jì)的噪聲頻譜Ns(Co) —起使用。這樣做時(shí),除了耳特性的詳細(xì)再現(xiàn)之外,還考慮了掩蔽效應(yīng)。人耳的區(qū)分頻率分解性質(zhì)可視為早在時(shí)間范圍向頻譜范圍的轉(zhuǎn)換期間-例如使用心理聲學(xué)刺激的濾波器組或WFFT,但這并非強(qiáng)制性的。還可使用常規(guī)的FFT,然后以心理聲學(xué)刺激的組和子帶自適應(yīng)濾波器的可變抽頭分布來處理頻譜線。
[0041]可在頻域中使用快速卷積進(jìn)行輸入音頻信號(hào)x[k]的均衡。根據(jù)FIR濾波器或FFT(快速傅里葉變換)的長度,此方法可顯著地縮短計(jì)算時(shí)間。一般的經(jīng)驗(yàn)法則是:使用快速卷積可以比在時(shí)域中更高的計(jì)算效率實(shí)施長度為約30個(gè)抽頭的FIR濾波器。然而,快速卷積可在某些情況下顯著地增加內(nèi)存要求。這不僅是與快速卷積相關(guān)的問題;其還發(fā)生在頻域中每種形式的信號(hào)處理時(shí)。具有不同寬度的頻帶的FFT或翹曲FFT(WFFT)或心理聲學(xué)刺激的濾波器組可用于時(shí)間向頻域的轉(zhuǎn)換。此處可能已考慮人耳的頻率分解特性。然而,如已經(jīng)提到的,還可使用常規(guī)的FFT。在這種情況下,隨后以頻域中的組來處理頻譜線以考慮人耳的頻率分解特性。適用的心理聲學(xué)模型為例如Johnston模型或MPEG模型。[0042]圖9中示出圖8的改進(jìn)的系統(tǒng)。在圖9的系統(tǒng)中,噪聲信號(hào)Ns(GJ)的放大/衰減從時(shí)域偏移到頻域。因此,省略了在時(shí)域中操作的可控增益/衰減單元19,而在快速傅里葉變換(FFT)單元18與心理聲學(xué)增益成形單元14之間添加了在頻域中操作的可控增益/衰減單元21。
[0043]圖10中示出圖9的改進(jìn)的系統(tǒng)。在圖10的系統(tǒng)中,省略了在時(shí)域中操作的背景噪聲發(fā)生器/合成器20并且省略了快速傅里葉變換(FFT)單元18,而在可控增益/衰減單元21上游增加了背景噪聲合成器22。圖10的系統(tǒng)在性能方面效率高并且使得任何方式的有色噪聲信號(hào)或其功率譜密度(PSD)根據(jù)心理聲學(xué)頻譜例如Bark標(biāo)度直接進(jìn)行處理,并且在應(yīng)用心理聲學(xué)模型之前由音量(Vol)設(shè)置直接進(jìn)行控制。從圖10可看出,不需要在時(shí)域中操作的額外的噪聲發(fā)生器/合成器和具有例如Bark標(biāo)度的FFT。根據(jù)基準(zhǔn)信號(hào)(規(guī)定為期望噪聲)和輸入音頻信號(hào)例如音樂信號(hào))的響度/掩蔽閾值之間的差值通過頻率依賴增M /裳減(G (ω))控制來在圖10的系統(tǒng)(如在圖8和9的系統(tǒng)中)中進(jìn)彳丁均衡。
[0044]可通過諸如傳聲器的聲學(xué)傳感器來拾取瞬時(shí)噪聲信號(hào),而非根據(jù)非聲學(xué)傳感器信號(hào)近似或估計(jì)噪聲信號(hào)。此類傳聲器可在車輛內(nèi)部接近聽眾的頭部布置。在圖12、13和14中,描述了利用聲學(xué)噪聲傳感器和甚至更先進(jìn)的心理聲學(xué)建模的ALC系統(tǒng)。
[0045]參照?qǐng)D11,用于改進(jìn)的ALC系統(tǒng)的示例性心理聲學(xué)建模單元(在頻域中)可包括兩個(gè)提供輸出掩蔽閾值MaskThm(m)和MaskThn(m)的掩蔽閾值計(jì)算單元23和24。一個(gè)掩蔽閾值計(jì)算單元(23)解決音頻信號(hào)的掩蔽,另一個(gè)掩蔽閾值計(jì)算單元(24)解決關(guān)于音量(Vol)設(shè)置(和噪聲,視情況而定)的掩蔽。掩蔽閾值計(jì)算單元23接收表示正常人耳聽力的絕對(duì)閾值的聲壓級(jí)掩蔽閾值Thm splOn)和閾值Τ,(πι)。掩蔽閾值計(jì)算單元24接收表示等響度級(jí)曲線的聲壓級(jí)掩蔽閾值Thn spl (m)和閾值Td(m)。閾值Tq(m)由例如存儲(chǔ)器25提供;閾值Thmspl (m)和Thn spl (m)由接收閾值Tm (m)、Tn (m)和(如果需要)參考級(jí)P_Ref的SPL轉(zhuǎn)換單元26提供;并且閾值Td(Hi)由 等響度單元27提供。向音量-響度級(jí)轉(zhuǎn)換單元28提供音量設(shè)置Vol以由其提供音量級(jí)信號(hào)\(m)。音量-響度級(jí)轉(zhuǎn)換單元28可利用表示響度N與響度級(jí)L之間的關(guān)系(如圖1中所示)的圖表或數(shù)學(xué)方程,其中音量Vol對(duì)應(yīng)于響度N并且音量級(jí)'對(duì)應(yīng)于響度N。將音量級(jí)VJm)提供至向等響度單元27。在本文中,k為(離散)時(shí)間指數(shù),ω為(離散)頻率指數(shù)(槽)并且m為某個(gè)頻群槽的數(shù)量(例如在Bark中)。
[0046]如在以上參照?qǐng)D5描述的系統(tǒng)中,在圖11的心理聲學(xué)建模單元的部分中,音量(Vol)設(shè)置被轉(zhuǎn)換成響度級(jí)VJm)。通過響度級(jí)VJm),等響度單元27中選擇等響度級(jí)曲線中的一條曲線,據(jù)此閾值Td(m)表示所選曲線,例如在可在內(nèi)存消耗方面更有效并且在心理聲學(xué)方面是有效的心理聲學(xué)頻(Bark)域中。為了增加由曲線數(shù)量限定的閾值Td(m)的分辨率,可應(yīng)用兩條相鄰曲線之間的插值。
[0047]如圖11中所示的心理聲學(xué)建模單元的部分可集成于與圖6、8、9和10中所示的那些類似的ALC系統(tǒng)中。實(shí)現(xiàn)此的一種有效方式可僅在心理聲學(xué)建模過程的后期包括等響度級(jí)的Bark標(biāo)度曲線。內(nèi)存需求較小,對(duì)于1024點(diǎn)FFT而言,因?yàn)閮H需存儲(chǔ)24個(gè)Bark值而非513個(gè)。該操作可描述如下:
[0048]Tn spl (m),如果 Tn—spl (m) > 增益偏移 Td (m)
[0049]掩蔽Thn(m) = {(I)
[0050]增益偏移Td (m),其他情況[0051]Bark 增益(m) =掩蔽 Thn(m)_ 掩蔽 Thm (m)(2)
[0052]方程⑴描述了所選等響度曲線Td(m)如何可與所測噪聲信號(hào)Tn spl(Hi)的(多個(gè))掩蔽閾值結(jié)合,所選等響度曲線獨(dú)立于輸入音頻信號(hào)X[k]用作期望響度的基準(zhǔn)。可看出,檢測兩者的最大值,據(jù)此在檢測最大值之前,對(duì)所選等響度曲線Td(Hl)進(jìn)行加權(quán),以便將曲線偏移到適當(dāng)?shù)牟僮鞣秶小?闪硗獾鼗蛱娲卦谄渌胤竭M(jìn)行加權(quán),例如在音量-響度級(jí)轉(zhuǎn)換單元中。[0053]方程⑵描述了如何計(jì)算頻譜增益/衰減G(co)??煽闯觯l譜增益/衰減G(co)對(duì)應(yīng)于輸入音頻信號(hào)(音樂信號(hào))的掩蔽閾值Tm(Hi)與如由方程(I)推導(dǎo)出的既表示背景噪聲又表示期望響度的掩蔽閾值!^!!!)的差值。根據(jù)方程(2)計(jì)算的Bark增益(衰減Kt-Bark增益(m)可為正和負(fù)(并且反之亦然)。[0054]Bark增益(衰減)值-Bark增益(m)可根據(jù)瞬時(shí)音頻信號(hào)或其掩蔽閾值-掩蔽Thm(m)不僅控制音頻信號(hào)的響度,還控制其頻譜(頻率特性)。因此,本文提出的ALC系統(tǒng)和方法可能能夠根據(jù)當(dāng)前背景噪聲的音頻信號(hào)和實(shí)際響度來調(diào)節(jié)音頻信號(hào)的正確實(shí)際響度和正確實(shí)際心理聲學(xué)頻譜。
[0055]圖11的心理聲學(xué)建模單元還可應(yīng)用于圖12中所示的ALC系統(tǒng),在該系統(tǒng)中,其被稱為心理聲學(xué)增益成形單元29。在圖12的系統(tǒng)中,音頻信號(hào)源I將輸入音頻信號(hào)x[k],例如來自CD播放器、收音機(jī)、盒式放音機(jī)等的音樂信號(hào)提供至在頻域中操作的ALC系統(tǒng)并且將輸出音頻信號(hào)輸出[k]提供至揚(yáng)聲器2。揚(yáng)聲器2從信號(hào)輸出[k]生成聲學(xué)信號(hào);所述聲學(xué)信號(hào)經(jīng)由可由傳遞函數(shù)H(Z)描述的傳遞路徑31傳遞至傳聲器30。來自傳聲器30的信號(hào)可經(jīng)由頻譜語音抑制裝置32、33、34和心理聲學(xué)增益成形單元29 (兩者均在頻域中操作)提供至可控頻譜增益/衰減單元11,例如可控均衡單元。
[0056]ALC系統(tǒng)還包括用于將來自時(shí)域的信號(hào)變換成頻域中的信號(hào)的快速傅里葉變換(FFT)單元35。頻譜語音抑制裝置32、33、34包括連接在快速傅里葉變換(FFT)單元35下游的平均值計(jì)算單元32、后續(xù)語音活動(dòng)解碼器(VAD) 33和后續(xù)最大量級(jí)檢測器34,后續(xù)最大量級(jí)檢測器34檢測通過VAD33向其提供的信號(hào)和從快速傅里葉變換(FFT)單元18接收的信號(hào)的最大量級(jí)。在平均值計(jì)算單元32中,將來自FFT單元35的頻域信號(hào)均化并且提供至VAD33以抑制來自FFT單元35的信號(hào)中的頻譜語音信號(hào)分量。可使用用于檢測和抑制語音分量的任何其它布置方式或方法(例如最小統(tǒng)計(jì)算法)來代替VAD。
[0057]可將來自最大量級(jí)檢測器34的信號(hào)提供至心理聲學(xué)增益成形單元29,心理聲學(xué)增益成形單元29從快速傅里葉變換(FFT)單元15接收信號(hào)并且將信號(hào)傳輸至頻譜增益/衰減單元11。增益/衰減單元11連接在快速傅里葉變換(FFT)單元15下游,快速傅里葉變換(FFT)單元15接收信號(hào)x[k]并且將其變換成頻譜信號(hào)Χ(ω)??蓪⑿盘?hào)Χ(ω)提供至頻域自適應(yīng)濾波器(FDAF) 36、心理聲學(xué)增益成形單元29和增益/衰減單元11 (如倍增器),增益/衰減單元11還可接收表示頻譜增益/衰減系數(shù)G(co)的頻譜增益/衰減信號(hào)并且生成頻譜信號(hào)輸出(ω),頻譜信號(hào)輸出(ω)被饋送入快速傅里葉逆變換(IFFT)單元17,在其中變換成時(shí)域輸出音頻信號(hào)輸出[k]。
[0058]在頻域中操作的自適應(yīng)濾波器36接收表示所討論的環(huán)境中的總聲級(jí)的時(shí)域傳聲器信號(hào)d[k],其中總聲級(jí)包括來自揚(yáng)聲器2的聲音輸出和該環(huán)境中的環(huán)境噪聲(例如揚(yáng)聲器-房間-傳聲器系統(tǒng))。來自快速傅里葉變換(FFT)單元35的信號(hào)Χ(ω)可用作自適應(yīng)濾波器36的基準(zhǔn)信號(hào)。將由自適應(yīng)濾波器36輸出的信號(hào)Υ(ω)提供至快速傅里葉逆變換(IFFT)單元37并且變換成信號(hào)y [k]。在減法器38中,將信號(hào)y [k]從來自傳聲器30的信號(hào)中減去并且作為信號(hào)s[k]+n[k]提供至FFT單元35。
[0059]將音量(Vol)設(shè)置提供至心理聲學(xué)增益成形單元29和在時(shí)域中操作的增益/衰減單元19,增益/衰減單元19將來自噪聲發(fā)生器20的噪聲信號(hào)放大/衰減并且向快速傅里葉變換(FFT)單元18提供放大的/衰減的噪聲信號(hào)\[10。由快速傅里葉變換(FFT)單元18提供的信號(hào)Ν3(ω)被饋送入最大量級(jí)檢測器34,最大量級(jí)檢測器34還接收來自VAD33的信號(hào)Ν_(ω)并且將信號(hào)N~(ω)提供至心理聲學(xué)增益成形單元29。向VAD33提供來自平均值計(jì)算單元32的信號(hào)S_(co)+N_(co),該信號(hào)表示來自快速傅里葉變換(FFT)單元35的均化信號(hào)S(?)+N(co)。
[0060]在圖11的ALC系統(tǒng)中,除了測量的、估計(jì)的或以其它方式評(píng)估的背景噪聲之外,還將音頻信號(hào)輸入到響度/掩蔽模型中。當(dāng)可具有任何著色和任何級(jí)別的噪聲被輸入到響度/掩蔽模型中時(shí),自動(dòng)計(jì)算或選擇相關(guān)的等響度曲線。因此,當(dāng)很早就結(jié)合背景噪聲和期望響度(基準(zhǔn))時(shí),無需提供多組等響度級(jí)曲線。
[0061]從圖12中可看出,噪聲發(fā)生器20在時(shí)域中生成任何方式的有色噪聲信號(hào),該有色噪聲信號(hào)在增益/衰減單元19中根據(jù)音量(Vol)設(shè)置加權(quán)(g)并且隨后變換成頻域,在頻域中,確定其PSD并且與由信號(hào)N~(ω)表示的估計(jì)的背景噪聲的PSD進(jìn)行比較。在此比較中確定由信號(hào)Ν_(ω)表示的最大值并且該最大值隨后被饋送入掩蔽模型(例如Johnston模型)。
[0062]圖13中示出圖12的改進(jìn)的系統(tǒng)。在圖13的系統(tǒng)中,放大/衰減從時(shí)域偏移到頻域。因此,省略了在時(shí)域中操作的可控增益/衰減單元19,而在快速傅里葉變換(FFT)單元18與最大量級(jí)檢測器34之間添加了在頻域中操作的可控增益/衰減單元21。
[0063]圖14中示出圖13的 改進(jìn)的系統(tǒng)。在圖14的系統(tǒng)中,省略了在時(shí)域中操作的背景噪聲合成器20并且省略了快速傅里葉變換(FFT)單元18,而在可控增益/衰減單元21下游增加了背景噪聲合成器22。
[0064]在上述示例性系統(tǒng)中,利用計(jì)算或估計(jì)單元和方法進(jìn)行評(píng)估,但也可應(yīng)用任何其它類型的評(píng)估單元或方法。此外,在以上參照?qǐng)D9和10描述的系統(tǒng)的簡單構(gòu)造中,應(yīng)用于背景噪聲的心理聲學(xué)模型可通過含有表示掩蔽閾值的數(shù)據(jù)的圖表來建立。這些數(shù)據(jù)通過對(duì)應(yīng)于背景噪聲的信號(hào),例如表示速度、rpm等的信號(hào)來選擇。因此,對(duì)應(yīng)于背景噪聲的信號(hào)未變換成表示背景噪聲的信號(hào),并由此用于直接確定掩蔽閾值。
[0065]圖15示出不同有色噪聲,特別是白噪聲WN、粉紅噪聲PN和(改變的)IEC286噪聲IN的頻率特性。如果使用心理聲學(xué)標(biāo)度如Bark標(biāo)度,僅需存儲(chǔ)每種特性的24個(gè)點(diǎn)。為了更大的靈活性,可存儲(chǔ)多種噪聲特性的特性。
[0066]盡管已公開了各種實(shí)施例,但本領(lǐng)域的技術(shù)人員顯然可在不脫離本發(fā)明的精神和范圍的情況下根據(jù)各實(shí)施方案的【具體實(shí)施方式】做出改變和修改。對(duì)于本領(lǐng)域的熟練的技術(shù)人員而言顯然可適當(dāng)?shù)卮鎴?zhí)行相同功能的其它部件。對(duì)理念的此類修改意欲為所附權(quán)利要求所涵蓋。
【權(quán)利要求】
1.一種自動(dòng)響度控制系統(tǒng),其包括 可控增益/衰減單元,其具有增益/衰減控制輸入、音頻信號(hào)輸入、音頻信號(hào)輸出,并且其在音頻信號(hào)輸入與音頻信號(hào)輸出之間的增益/衰減由增益/衰減控制輸入信號(hào)控制; 增益/衰減評(píng)估單元,其連接至所述可控增益/衰減單元的所述增益/衰減控制輸入,并且具有實(shí)際響度輸入和期望響度輸入; 實(shí)際響度評(píng)估單元,其連接在所述可控增益/衰減單元的所述音頻信號(hào)輸入之間,并且向所述增益/衰減評(píng)估單元提供所述實(shí)際響度輸入;和 期望響度評(píng)估單元,其連接至所述增益/衰減評(píng)估單元的所述期望響度輸入,并且具有音量控制輸入; 其中所述增益/衰減評(píng)估單元被配置用于根據(jù)提供至所述期望響度評(píng)估單元的所述音量控制輸入和所述可控增益/衰減單元的所述音頻信號(hào)輸入的信號(hào)來控制所述可控增益/衰減單元。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述增益/衰減計(jì)算單元和所述實(shí)際響度評(píng)估單元中的至少一者進(jìn)一步包括心理聲學(xué)建模單元。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中所述心理聲學(xué)建模單元利用心理聲學(xué)掩蔽模型。
4.根據(jù)權(quán)利要求2或3所述的系統(tǒng),其中所述心理聲學(xué)建模單元利用心理聲學(xué)頻標(biāo)。
5.根據(jù)權(quán)利要求2-4中一項(xiàng)所述的系統(tǒng),其中所述心理聲學(xué)建模單元接收表示或?qū)?yīng)于環(huán)境背景噪聲的信號(hào)。
6.根據(jù)權(quán)利要求1-5中的一項(xiàng)所述的系統(tǒng),其中所述心理聲學(xué)建模單元接收表示期望響度的信號(hào)。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其中所述心理聲學(xué)建模單元接收來自最大量級(jí)比較器的信號(hào),所述信號(hào)提供所述背景噪聲和所述輸入音頻信號(hào)的最大量級(jí)中的較高的一者。
8.根據(jù)權(quán)利要求1-7中的一項(xiàng)所述的系統(tǒng),其中所述增益/衰減評(píng)估單元和所述可控增益/衰減單元被配置用于對(duì)所述增益/衰減提供頻率依賴控制,以在音頻信號(hào)輸入與音頻信號(hào)輸出之間提供頻率依賴增益/衰減。
9.根據(jù)權(quán)利要求1-8中的一項(xiàng)所述的系統(tǒng),其中所述可控增益/衰減單元被配置用于在所述頻域中操作。
10.一種自動(dòng)響度控制方法,其包括: 控制施加至輸入音頻信號(hào)的增益/衰減并且提供輸出音頻信號(hào),所述輸出音頻信號(hào)為放大的/衰減的輸入音頻信號(hào); 根據(jù)所述輸入音頻信號(hào)來評(píng)估所述輸入音頻信號(hào)的實(shí)際響度,并且根據(jù)音量控制輸入來評(píng)估所述輸入音頻信號(hào)的期望響度;和 根據(jù)所述輸入音頻信號(hào)的所述實(shí)際響度和所述期望響度來評(píng)估施加至所述輸入音頻信號(hào)的所述增益/衰減。
11.根據(jù)權(quán)利要求10所述的方法,其中增益/衰減計(jì)算和實(shí)際響度評(píng)估中的至少一者利用心理聲學(xué)模型。
12.根據(jù)權(quán)利要求11所述的方法,其中所述心理聲學(xué)模型包括心理聲學(xué)掩蔽模型。
13.根據(jù)權(quán)利要求11或12所述的方法,其中所述心理聲學(xué)模型利用心理聲學(xué)頻標(biāo)。
14.根據(jù)權(quán)利要求11-13中的一項(xiàng)所述的方法,其中所述心理聲學(xué)模型包括對(duì)表不環(huán)境背景噪聲的信號(hào)的評(píng)估。
15.根據(jù)權(quán)利要求11-14中的一項(xiàng)所述的方法,其中所述心理聲學(xué)模型包括對(duì)表不期望響度的信號(hào)的評(píng)估。
16.根據(jù)權(quán)利要求10-15中的一項(xiàng)所述的方法,其進(jìn)一步包括接收提供所述背景噪聲和所述輸入音頻信號(hào)的最大量級(jí)中的較高的一者的信號(hào)。
17.根據(jù)權(quán)利要求10-16中的一項(xiàng)所述的方法,其中所述音頻信號(hào)的所述增益/衰減是頻率依賴的。
18.根據(jù)權(quán)利要求10-17中的一項(xiàng)所述的方法,其中所述音頻信號(hào)的增益/衰減的施加在所述頻域進(jìn)行。
【文檔編號(hào)】H03G7/00GK103580631SQ201310331512
【公開日】2014年2月12日 申請(qǐng)日期:2013年8月1日 優(yōu)先權(quán)日:2012年8月1日
【發(fā)明者】M.克里斯托夫 申請(qǐng)人:哈曼貝克自動(dòng)系統(tǒng)股份有限公司