編碼混響聲音信號的制作方法

文檔序號：2829045閱讀：443來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：編碼混響聲音信號的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及音頻信號編碼領(lǐng)域。尤其是，本發(fā)明涉及對混響音頻信號進(jìn)行高效編碼的領(lǐng)域。本發(fā)明涉及一種編碼器、一種解碼器、用于編碼和解碼的方法、一種編碼的音頻信號、具有表示這種編碼信號的數(shù)據(jù)的存儲和傳輸介質(zhì)、以及具有編碼器和/或解碼器的音頻設(shè)備。
混響是由在其中記錄聲音的環(huán)境例如音樂廳的音響效果引起的。它由相對于該環(huán)境表面的反射構(gòu)成。因此，所記錄的聲音信號不僅包含直達(dá)“干(dry)”音頻信號，而且包含一系列延遲和衰減的反射。即混響分量由直達(dá)“干”聲音的延遲和衰減的形式構(gòu)成，結(jié)果，該混響分量與該直達(dá)信號相關(guān)。這里，“干”是指“無回聲的”，即基本上不包含回聲或混響。
實(shí)驗(yàn)顯示，一些非透明的聲音編解碼器并不通過對具有大量混響的聲音信號進(jìn)行編碼而正確地運(yùn)行，即這些編解碼器產(chǎn)生具有清楚可聽的人工產(chǎn)物(artefact)的聲音信號。然而，相同的聲音編解碼器可以對具有非?；蚣兇狻案伞毙盘柕穆曇粜盘?、即在無回聲的環(huán)境中記錄的聲音信號或者不添加混響的人工創(chuàng)建的聲音運(yùn)行良好。
在許多應(yīng)用中，混響被認(rèn)為是聲音信號的負(fù)面特性。例如，當(dāng)語音包含混響時，自動語音識別系統(tǒng)的性能會降級，并且在通信應(yīng)用中，混響對語音的可理解性和質(zhì)量產(chǎn)生消極的影響。該問題的解決方案可以是從信號中除去混響，即去混響，并且這也在一些系統(tǒng)中被實(shí)現(xiàn)(Basbug等人，2003)，參見參考文獻(xiàn)的列表。
然而，在高質(zhì)量的音頻編碼中，情形有所不同。音頻編碼爭取透明性，并因此也需要對混響進(jìn)行編碼。而且，在音樂中混響分量是信號的重要部分，并且具有該分量的音頻信號比沒有該分量的信號更受歡迎，沒有該分量的信號聽起來“干”或單調(diào)乏味，并且該聲音缺乏記錄環(huán)境的顯著個性。
據(jù)本發(fā)明人所知，在現(xiàn)有技術(shù)中沒有采取專門的預(yù)防措施來對聲音信號的混響分量進(jìn)行編碼，這會導(dǎo)致質(zhì)量問題。
可以視為本發(fā)明的目的的是，提供一種通過使用音頻編解碼器而能夠高質(zhì)量地處理混響音頻信號的方法以及音頻編碼器和解碼器。
根據(jù)本發(fā)明的第一方面，該目的通過提供一種適于對音頻信號進(jìn)行編碼的音頻編碼器而被履行，該音頻編碼器包括-分離裝置，適于將音頻信號分為基本上無回聲的音頻信號和描述與該音頻信號相關(guān)的混響場的信息，-編碼器裝置，適于將所述基本上無回聲的音頻信號編碼為第一編碼信號部分，以及將描述混響場的信息編碼為第二編碼信號部分。
該分離裝置用來將音頻信號分為無回聲的即“干”部分，以及分為有關(guān)涉及該音頻信號的混響方面的信息。換句話說，對該音頻信號進(jìn)行去混響，并且提取描述與該音頻信號相關(guān)的混響場的信息，即能夠基本上透明地再造混響的信息。
該編碼器裝置分別地處理該“干”部分和混響部分。因此，有可能將用于編碼“干”部分的音頻編解碼器應(yīng)用于第一編碼信號部分，同時可以根據(jù)適于描述混響的完全不同的算法來編碼混響部分，例如對于在編碼器處基本上再造該信號的混響部分足夠精確的參數(shù)描述。
這減輕了音頻編解碼器編碼混響分量的任務(wù)，從而解決了編碼混響聲音信號的問題。作為替代，用于編碼混響音頻信號的混響部分的裝置可以包括基于例如使用非常有限數(shù)目的參數(shù)的、原始音頻信號的混響部分的參數(shù)描述的混響算法。結(jié)果，參數(shù)編解碼器可以單獨(dú)用來編碼非常適合這種編解碼器的“干”信號。由此，有可能與用于編碼混響音頻信號的混響部分的裝置相結(jié)合來利用音頻編解碼器，基本上透明地編碼和解碼混響音頻信號。
另外，與直接編碼混響聲音信號相比，編碼效率得到提高。這歸因于這樣的事實(shí)，即根據(jù)第一方面的編碼器最大程度地利用通過混響場引入到聲音信號中的相關(guān)性，從而導(dǎo)致更高的編碼效率。即，專門考慮混響部分中的冗余性。
在一個實(shí)施例中，編碼器可以適于根據(jù)參數(shù)音頻編解碼器來編碼基本上無回聲的音頻信號。例如(Schuijers等人，2003)。在另一優(yōu)選實(shí)施例中，分離裝置適于將Unoki的去混響算法應(yīng)用于音頻信號，以便將其分為基本上無回聲的部分和描述混響場的信息。Unoki的去混響算法被理解為在下述中描述的去混響原理M.Unoki，M.Furukawa，K.Sakata和M.Akagi的“A Method based on the MTF Concept fordereverberating the Power Envelope from the Reverberant Signal”，inProc.IEEE Int.Conf.on Acoust.，Speech，Signal Processing，Hong Kong，China，April 6-19，Vol.I，pp.840-843，2003。由此該論文被結(jié)合以供參考。
本發(fā)明的第二方面提供一種音頻解碼器，其適于由具有第一和第二部分的編碼音頻信號再生音頻信號，該音頻解碼器包括-解碼器裝置，適于將第一編碼信號部分解碼為基本上無回聲的音頻信號，該解碼器裝置還適于由第二編碼信號部分生成描述與該音頻信號相關(guān)的混響場的信息，以及-變換裝置，適于基于描述混響場的信息來將混響添加到基本上無回聲的音頻信號上。
因此，根據(jù)第二方面的音頻解碼器適于解碼來自根據(jù)第一方面的音頻編碼器的編碼信號，并從而構(gòu)成一個編碼器/解碼器系統(tǒng)。
在解碼器裝置中重建“干”信號。然后基于混響信息通過變換裝置來將混響添加到“干”信號上。這從現(xiàn)有的人工混響發(fā)生器或房間模擬器可知，它們能夠基于幾個參數(shù)來產(chǎn)生高音頻質(zhì)量的混響。該方法的特別優(yōu)點(diǎn)即在解碼器中添加混響在于，該混響屏蔽了解碼的“干”信號中的一些潛在人工產(chǎn)物。
優(yōu)選地，變換裝置包括用于將該再生的無回聲音頻信號與作為時間t的函數(shù)的脈沖響應(yīng)h(t)進(jìn)行卷積的裝置，其中h(t)基于第二編碼信號部分。
優(yōu)選地，第二編碼信號部分包括下述的表示-與音頻信號的混響時間相關(guān)的第一參數(shù)T，以及-與音頻信號的混響幅度相關(guān)的第二參數(shù)A。
該解碼器裝置可以適于根據(jù)參數(shù)音頻編解碼器來解碼第一編碼信號部分。
在第三方面，本發(fā)明提供一種編碼音頻信號的方法，包括以下步驟-將音頻信號分為基本上無回聲的部分和描述與該音頻信號相關(guān)的混響場的信息，-將所述音頻信號的基本上無回聲部分編碼為第一編碼信號，
-將描述混響場的信息編碼為第二編碼信號。
在第四方面，本發(fā)明提供一種解碼表示原始音頻信號的編碼音頻信號的方法，該方法包括以下步驟-將第一編碼信號部分解碼為第一音頻信號，-將第二編碼信號部分解碼為描述與原始音頻信號相關(guān)的混響場的信息，以及-基于描述混響場的信息，通過添加混響來變換第一音頻信號，以便再生該原始音頻信號。
在第五方面，本發(fā)明提供一種表示原始音頻信號的編碼音頻信號，該編碼信號包括-第一部分，表示該原始音頻信號的基本上無回聲的部分，以及-第二部分，表示有關(guān)與該原始音頻信號相關(guān)的混響場的信息。
該編碼信號可以是具有根據(jù)標(biāo)準(zhǔn)數(shù)字音頻格式的格式的數(shù)字電信號。該信號可以利用兩個音頻設(shè)備之間的電連接電纜來傳輸。然而，該編碼信號可以是無線信號，例如使用射頻載波的空中傳播的信號，或者它可以是適于利用光纖傳輸?shù)墓庑盘枴?br> 在第六方面，本發(fā)明提供一種存儲介質(zhì)，包括表示根據(jù)第五方面的編碼音頻信號的數(shù)據(jù)。該存儲介質(zhì)優(yōu)選是標(biāo)準(zhǔn)的音頻數(shù)據(jù)存儲介質(zhì)，例如DVD、CD、可讀寫CD、小型光盤、MP3盤、小型閃存，記憶棒等等。然而，它還可以是計算機(jī)數(shù)據(jù)存儲介質(zhì)，例如計算機(jī)硬盤、計算機(jī)存儲器、軟盤等等。
在第七方面，本發(fā)明提供一種包括根據(jù)第一方面的音頻編碼器的音頻設(shè)備。
在第八方面，本發(fā)明提供一種包括根據(jù)第二方面的音頻解碼器的音頻設(shè)備。
根據(jù)第七和第八方面的優(yōu)選音頻設(shè)備是所有不同類型的磁帶、磁盤或基于存儲器的音頻記錄器和播放器。例如MP3播放器、DVD播放器以及用于計算機(jī)的音頻處理器等等。另外，它對于移動電話會是有利的。
在下文中參考附

圖1對本發(fā)明進(jìn)行更詳細(xì)的描述，附圖1說明了根據(jù)本發(fā)明的優(yōu)選編碼器和解碼器的框圖。
盡管本發(fā)明容易進(jìn)行各種變型和替代形式，但是已經(jīng)通過附圖中的例子示出了特定實(shí)施例，并將在此對其進(jìn)行詳細(xì)描述。然而，應(yīng)當(dāng)理解，本發(fā)明并不打算限于所公開的特定形式。更確切地說，本發(fā)明要覆蓋落在如由所附權(quán)利要求書限定的本發(fā)明的精神和范圍之內(nèi)的所有變型、等同和替代方案。
圖1示出了相對于信號流說明編碼器1和解碼器2的優(yōu)選實(shí)施例的原理的框圖。
在編碼器1的輸入端IN接收音頻信號。首先，由混響提取器REVEXT處理該音頻信號。此處，使用Unoki的去混響算法(Unoki等人，2003)對該音頻信號進(jìn)行去混響。應(yīng)當(dāng)注意，對于單聲道信號，從混響音頻信號中提取混響分量并非是無足輕重的。然而，該提取不必是完全的，并且增益可能已經(jīng)通過除去混響場部分而獲得。對于多聲道信號，已經(jīng)存在良好的去混響算法。
然后，在例如(Schuijers等人，2003)中描述的編碼器裝置ENC中的SSC編碼器部分中對所得到的“干”信號進(jìn)行編碼，同時該編碼器裝置ENC的另一部分對由混響提取器REV EXT提取的混響部分進(jìn)行編碼。來自編碼器1的輸出具有兩部分第一部分是由編碼器裝置ENC的SSC編碼器部分提供的比特流3，以及第二部分包括由混響提取器REV EXT提供的兩個混響參數(shù)4，即所除去的原始音頻信號的混響部分的參數(shù)描述。優(yōu)選地，這兩個混響參數(shù)4是混響時間TR和混響幅度常數(shù)A，它們與原始音頻信號的混響部分相對于該音頻信號的“干”部分的電平相關(guān)，是房間混響脈沖響應(yīng)h(t)的非常簡短的描述。也可以在信號的開始發(fā)送完整的房間混響脈沖響應(yīng)h(t)，并且當(dāng)需要時在信號期間進(jìn)行更新；這也是高效的，因?yàn)閔(t)通常變化緩慢或者根本不變化。編碼器裝置ENC中對混響部分進(jìn)行編碼的編碼器部分高度依賴于由混響提取器REV EXT所傳送的混響部分的實(shí)際形式。在混響提取器REV EXT僅傳送幾個混響參數(shù)的情況下，混響部分的編碼可以被說成是包含在提取本身當(dāng)中，從而編碼器裝置ENC可能不需要對從混響提取器REV EXT接收到的混響部分添加進(jìn)一步的編碼。
解碼器2從編碼器1接收SSC編碼的信號3和兩個混響參數(shù)4。應(yīng)當(dāng)理解，圖1僅僅說明了編碼器/解碼器系統(tǒng)的原理。編碼信號3、4或表示這些信號3、4的數(shù)據(jù)通?？梢源鎯υ跀?shù)據(jù)載體或存儲介質(zhì)上，例如用于MP3播放器的音頻盤等。
在解碼器2中，由解碼器裝置DEC的SSC解碼器部分對SSC編碼的信號3進(jìn)行解碼，從而恢復(fù)基本上“干”的音頻信號。然后，將該恢復(fù)的“干”信號饋送給混響處理器REV。該混響處理器REV還接收已經(jīng)由解碼器裝置DEC的另一部分解碼的兩個混響參數(shù)4，并且基于這些參數(shù)4，混響處理器REV基于在這兩個混響參數(shù)4中所提取的混響信息生成脈沖響應(yīng)，即基于這兩個混響參數(shù)4創(chuàng)建房間脈沖響應(yīng)。通過與所生成的混響脈沖響應(yīng)進(jìn)行卷積，將原始音頻信號的混響部分施加給來自解碼器裝置DEC的SSC解碼器部分的所恢復(fù)“干”音頻信號。因此將所恢復(fù)的“干”音頻信號變換為恢復(fù)的或者至少基本上恢復(fù)的原始音頻信號。最終，在編碼器2的輸出端OUT提供此恢復(fù)的原始音頻信號。
在混響處理器REV中生成的房間混響脈沖響應(yīng)h(t)優(yōu)選是下述的形式，其中t表示時間h(t)＝A*exp(-6.9 t/TR)*n(t)，其中n(t)為白噪聲信號。
原則上本發(fā)明可以與任何音頻編碼器結(jié)合起來使用，例如(Schuijers等人，2003)中描述提及的SSC編碼器，該SSC編碼器目前在MPEG中被標(biāo)準(zhǔn)化，并且本發(fā)明可以與任何去混響算法結(jié)合起來使用。
根據(jù)本發(fā)明的編碼器和解碼器可以在具有數(shù)字信號處理器的單個芯片上實(shí)現(xiàn)。然后可以將該芯片嵌入到與這種設(shè)備的信號處理器能力無關(guān)的音頻設(shè)備中。也可以僅僅通過在應(yīng)用設(shè)備的主信號處理器上運(yùn)行的算法來替代地實(shí)現(xiàn)這些編碼器和解碼器。
在權(quán)利要求書中，僅僅為了清楚的原因而包含附圖的參考標(biāo)記。附圖中示范性實(shí)施例的這些參考文獻(xiàn)無論如何都不應(yīng)當(dāng)解釋為對權(quán)利要求范圍的限制。
參考文獻(xiàn)列表F. Basbug，K. Swaminathan，and S.Nandkumar，“Noise Reduction and EchoCancellation Front-End for Speech Codecs，”IEEE Transactions on Speech and AudioProcessing，vol.11，no.1，2003.
E. Schuijers，W.Oomen，B.den Brinker，J. Breebaart，“Advances inParametric Coding for High-Quality Audio，” in Proc. of the 114th AES Convention 2003March 22-25 Amsterdam， The Netherlands， 2003.
M. Unoki，M. Furukawa，K. Sakata，and M. Akagi，“A Method based on theMTF Concept for dereverberating the Power Envelope from the Reverberant Signal，”in Proc.IEEE Int. Conf. on Acoust.，Speech，Signal Processing，Hong Kong，China，April 6-19，Vol.I，pp. 840-843，2003.
權(quán)利要求
1.一種適于對音頻信號進(jìn)行編碼的音頻編碼器(1)，該音頻編碼器(1)包括-分離裝置，適于將音頻信號分為基本上無回聲的音頻信號和描述與該音頻信號相關(guān)的混響場的信息，-編碼器裝置，適于將所述基本上無回聲的音頻信號編碼為第一編碼信號部分(3)，以及將描述混響場的信息編碼為第二編碼信號部分(4)。
2.根據(jù)權(quán)利要求1所述的音頻編碼器(1)，其中所述分離裝置適于將Unoki的去混響算法應(yīng)用于音頻信號，以便將其分為基本上無回聲的部分和描述混響場的信息。
3.根據(jù)權(quán)利要求1所述的音頻編碼器(1)，其中所述編碼器裝置適于根據(jù)參數(shù)音頻編解碼器對基本上無回聲的音頻信號進(jìn)行編碼。
4.一種適于由具有第一(3)和第二部分(4)的編碼音頻信號再生音頻信號的音頻解碼器(2)，該音頻解碼器(2)包括-解碼器裝置，適于將第一編碼信號部分(3)解碼為基本上無回聲的音頻信號，該解碼器裝置還適于由第二編碼信號部分(4)生成描述與該音頻信號相關(guān)的混響場的信息，以及-變換裝置，適于基于描述混響場的信息來將混響添加到基本上無回聲的音頻信號上。
5.根據(jù)權(quán)利要求4所述的音頻解碼器(2)，其中所述變換裝置包括用于對基本上無回聲的音頻信號與作為時間t的函數(shù)的脈沖響應(yīng)h(t)進(jìn)行卷積的裝置，其中h(t)基于描述混響場的信息。
6.根據(jù)權(quán)利要求5所述的音頻解碼器(2)，其中所述解碼器裝置適于由第二編碼信號部分(4)生成-與音頻信號的混響時間相關(guān)的第一參數(shù)T，以及-與音頻信號的混響幅度相關(guān)的第二參數(shù)A。
7.根據(jù)權(quán)利要求6所述的音頻解碼器(2)，其中所述變換裝置適于基于所述第一和第二參數(shù)來將所述脈沖響應(yīng)h(t)計算為h(t)＝A*exp(k*t/T)*n(t)，其中k表示常數(shù)，以及n(t)表示噪聲信號。
8.根據(jù)權(quán)利要求4所述的音頻解碼器(2)，其中該解碼器裝置適于根據(jù)參數(shù)音頻編解碼器來解碼第一編碼信號部分(3)。
9.一種編碼音頻信號的方法，包括以下步驟-將音頻信號分為基本上無回聲的部分和描述與該音頻信號相關(guān)的混響場的信息，-將所述音頻信號的基本上無回聲部分編碼為第一編碼信號，-將描述混響場的信息編碼為第二編碼信號。
10.一種解碼表示原始音頻信號的編碼音頻信號的方法，該方法包括以下步驟-將第一編碼信號部分解碼為第一音頻信號，-將第二編碼信號部分解碼為描述與原始音頻信號相關(guān)的混響場的信息，以及-基于描述混響場的信息，通過添加混響來變換第一音頻信號，以便再生該原始音頻信號。
11.表示原始音頻信號的編碼音頻信號(3)、(4)，該編碼信號(3)、(4)包括-第一部分(3)，表示該原始音頻信號的基本上無回聲的部分，以及-第二部分(4)，表示有關(guān)與該原始音頻信號相關(guān)的混響場的信息。
12.一種存儲介質(zhì)，包括表示根據(jù)權(quán)利要求11所述的編碼音頻信號(3)、(4)的數(shù)據(jù)。
13.包括根據(jù)權(quán)利要求1所述的音頻編碼器(1)的音頻設(shè)備。
14.包括根據(jù)權(quán)利要求4所述的音頻解碼器(2)的音頻設(shè)備。
全文摘要
本發(fā)明涉及一種音頻編碼器和解碼器以及用于音頻編碼和解碼的方法。在編碼器中，優(yōu)選通過僅使用諸如混響時間和混響幅度的幾個參數(shù)的表示，將音頻信號分成無回聲信號部分和關(guān)于與該音頻信號相關(guān)的混響場的信息。然后使用音頻編解碼器對無回聲信號進(jìn)行編碼。在解碼器處，使用音頻編解碼器恢復(fù)該無回聲信號部分，并且通過根據(jù)有關(guān)該混響場的信息來施加混響，優(yōu)選通過與基于該混響場信息生成的房間脈沖響應(yīng)進(jìn)行卷積，將所恢復(fù)的無回聲信號變換成基本上原始的音頻信號。根據(jù)本發(fā)明，所涉及的音頻編解碼器只需要能夠?qū)o回聲音頻信號進(jìn)行編碼，從而解決了參數(shù)音頻編解碼器對混響音頻信號提供差的性能的問題。
文檔編號G10L19/00GK1965610SQ200580018839
公開日2007年5月16日申請日期2005年6月3日優(yōu)先權(quán)日2004年6月8日
發(fā)明者N·H·范施恩德爾, A·J·杰里茨, C·博斯卡里諾申請人:皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：N.H.范施恩德爾;A.J.杰里茨;C.博斯卡里諾
技術(shù)所有人：皇家飛利浦電子股份有限公司
我是此專利的發(fā)明人

上一篇：實(shí)木碳纖維布復(fù)合音板的制作方法
上一篇：多聲道音頻信號表示方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

聲音混響相關(guān)技術(shù)

win7立體聲混響沒聲音相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

編碼混響聲音信號的制作方法