編碼/解碼多聲道音頻信號的方法和裝置的制作方法

文檔序號：2836968閱讀：213來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：編碼/解碼多聲道音頻信號的方法和裝置的制作方法
技術(shù)領(lǐng)域：
：本發(fā)明涉及編碼和解碼多聲道音頻信號的方法以及用于編碼和解碼多聲道音頻信號的裝置，尤其涉及可通過高效率地編碼/解碼關(guān)于多聲道音頻信號的多個空間參數(shù)來降低比特率的編碼和解碼多聲道音頻信號的方法以及用于編碼和解碼多聲道音頻信號的裝置。
背景技術(shù)：
：目前，已開發(fā)出各種數(shù)字音頻譯碼技術(shù)，并且越來越多的與數(shù)字音頻譯碼有關(guān)的產(chǎn)品已進(jìn)入市場。同樣，基于心理聲學(xué)模型的各種多聲道音頻譯碼技術(shù)已被開發(fā)，且目前正在標(biāo)準(zhǔn)化。心理聲學(xué)模型是基于人類感知聲音的方式來確立的，例如，基于這樣的事實在存在響亮聲音時，微弱的聲音就變得聽不見了；人類的耳朵名義上可聽到20-20000Hz范圍的聲音。通過使用這種心理聲學(xué)模型，可通過在數(shù)據(jù)的譯碼期間去除多余的音頻信號來有效減小數(shù)據(jù)量。通常，多聲道音頻信號的比特流是通過執(zhí)行固定量化來生成的，其中單純地涉及對待編碼數(shù)據(jù)使用單一的量化表。結(jié)果，比特率增加
發(fā)明內(nèi)容技術(shù)問題本發(fā)明提供可高效率地編碼/解碼多聲道音頻信號和多聲道音頻信號的空間參數(shù)、且因而可應(yīng)用于任意擴(kuò)展的聲道環(huán)境的編碼和解碼多聲道音頻信號的方法以及編碼和解碼多聲道音頻信號的裝置。技術(shù)方案根據(jù)本發(fā)明的一個方面，提供一種編碼具有多個聲道的多聲道音頻信號的方法。該方法包括確定多個聲道中的一對聲道之間的聲道電平差(CLD);考慮一對聲道的位置性質(zhì)來量化CLD。根據(jù)本發(fā)明的另一個方面，提供一種接收比特流并解碼具有多個聲道的音頻信號的方法。該方法包括從比特流中提取多個聲道中的一對聲道之間經(jīng)量化的CLD;以及利用考慮一對聲道的位置性質(zhì)的量化表來逆量化該經(jīng)量化的CLD。根據(jù)本發(fā)明的另一個方面，提供一種接收比特流并解碼具有多個聲道的音頻信號的方法。該方法包括從比特流中提取多個聲道中的一對聲道之間經(jīng)量化的CLD和與量化模式有關(guān)的信息；如果量化模式是第一模式則利用第一量化表逆量化該經(jīng)量化的CLD;以及如果量化模式是第二模式則利用考慮一對聲道的位置性質(zhì)的第二量化表來逆量化該經(jīng)量化的CLD。根據(jù)本發(fā)明的另一個方面，提供一種用于編碼具有多個聲道的音頻信號的裝置。該裝置包括空間參數(shù)提取單元，其確定多個聲道中的一對聲道之間的CLD;以及量化單元，其考慮一對聲道的位置性質(zhì)來量化CLD。根據(jù)本發(fā)明的另一個方面，提供一種用于接收比特流并解碼具有多個聲道的多聲道音頻信號的裝置。該裝置包括拆分單元，其從比特流中提取多個聲道中的一對聲道之間經(jīng)量化的CLD;以及逆量化單元，其利用考慮一對聲道的位置性質(zhì)的量化表來逆量化該經(jīng)量化的CLD。根據(jù)本發(fā)明的另一個方面，提供一種用于執(zhí)行編碼和解碼具有多個聲道的音頻信號的方法之一的程序記錄于其上的計算機(jī)可讀記錄介質(zhì)。根據(jù)本發(fā)明的另一個方面，提供了一種具有多個聲道的音頻信號的比特流。該比特流具有CLD字段，其包括有關(guān)一對聲道之間經(jīng)量化的CLD的信息；以及表信息字段，其包括與用于形成經(jīng)量化的CLD的量化表有關(guān)的信息，其中量化表考慮一對聲道的位置。有益效果編碼和解碼多聲道音頻信號的方法以及用于編碼和解碼多聲道音頻信號的裝置可通過減少所需的量化比特數(shù)來實現(xiàn)高效率地編碼/解碼。附圖簡述通過參考附圖詳細(xì)描述本發(fā)明的示例性實施例，本發(fā)明的以上和其它特征和優(yōu)點將變得顯而易見，附圖中圖1是根據(jù)本發(fā)明的一個實施例的多聲道音頻信號編碼器和解碼器的框圖2是用于解釋多聲道配置的圖3是用于解釋人耳如何感知音頻信號的圖4是根據(jù)本發(fā)明的一個實施例用于編碼多聲道音頻信號的空間參數(shù)的裝置的框圖5是根據(jù)本發(fā)明的一個實施例用于解釋通過圖4所示的量化單元確定虛擬聲源的位置的圖6是根據(jù)本發(fā)明的另一個實施例用于解釋通過圖4所示的量化單元確定虛擬聲源的位置的圖7是根據(jù)本發(fā)明的一個實施例用于解釋利用角間隔將一對聲道之間的空間分割成多個部分的圖8是根據(jù)本發(fā)明的一個實施例用于解釋通過圖4所示的量化單元量化聲道電平差(CLD)的圖9是根據(jù)本發(fā)明的一個實施例用于解釋利用兩個或多個角間隔將一對聲道之間的空間分割成多個部分的圖10是根據(jù)本發(fā)明的另一個實施例用于解釋通過圖4所示的量化單元來量化CLD的圖11是根據(jù)本發(fā)明的一個實施例，圖4中所示的空間參數(shù)提取單元的框圖12是根據(jù)本發(fā)明的一個實施例用于解碼多聲道音頻信號的空間參數(shù)的裝置的框圖13是根據(jù)本發(fā)明的一個實施例示出編碼多聲道音頻信號的空間參數(shù)的方法的流程圖14是根據(jù)本發(fā)明的另一個實施例示出編碼多聲道音頻信號的空間參數(shù)的方法的流程圖15是根據(jù)本發(fā)明的另一個實施例示出編碼多聲道音頻信號的空間參數(shù)的方法的流程圖；圖16是根據(jù)本發(fā)明的另一個實施例示出編碼多聲道音頻信號的空間參數(shù)的方法的流程圖17是根據(jù)本發(fā)明的一個實施例示出解碼多聲道音頻信號的空間參數(shù)的方法的流程圖18是根據(jù)本發(fā)明的另一個實施例示出解碼多聲道音頻信號的空間參數(shù)的方法的流程圖19是根據(jù)本發(fā)明的另一個實施例示出解碼多聲道音頻信號的空間參數(shù)的方法的流程圖20是根據(jù)本發(fā)明的另一個實施例示出解碼多聲道音頻信號的空間參數(shù)的方法的流程本發(fā)明的最佳實施方式現(xiàn)在將參考示出本發(fā)明的示例性實施例的附圖更全面地描述本發(fā)明。圖1是根據(jù)本發(fā)明的一個實施例的多聲道音頻信號編碼器和解碼器的框圖。參考圖l，多聲道音頻信號編碼器包括聲道縮減混音器iio和空間參數(shù)估計器120，而多聲道信號解碼器包括空間參數(shù)解碼器130和空間參數(shù)合成器140。聲道縮減混音器110生成基于諸如5.1聲道源之類的多聲道源聲道縮減混音處理成立體聲或單聲道的信號。空間參數(shù)估計器120獲取形成多聲道所需的空間參數(shù)。空間參數(shù)包括指示從多個聲道中選出的一對聲道的能級之間的差的聲道電平差(CLD)、作為用于基于一對聲道信號生成三個聲道信號的預(yù)測系數(shù)的聲道預(yù)測系數(shù)(CPC)、指示一對聲道之間的相關(guān)性的聲道間相關(guān)性(ICC)、以及指示一對聲道之間的時間差的聲道時間差(CTD)。在外部處理的藝術(shù)聲道縮減混音信號103可被輸入至多聲道音頻信號編碼器?？臻g參數(shù)解碼器130解碼向其發(fā)送的空間信號?？臻g參數(shù)合成器140對經(jīng)編碼的聲道縮減混音信號進(jìn)行解碼，并合成經(jīng)解碼的聲道縮減混音信號和由空間參數(shù)解碼器130提供的經(jīng)解碼的空間參數(shù)，從而生成多聲道音頻信號105。圖2是根據(jù)本發(fā)明的一個實施例的用于解釋多聲道配置的圖。具體地，圖2示出5.1聲道配置。因為0.1聲道是低頻增強(qiáng)聲道且不考慮位置，所以在圖2中未示出。參考圖2，左聲道L和右聲道R與中心聲道C距離30度。左環(huán)繞聲道Ls和右環(huán)繞聲道Rs與中心聲道C距離110度、且分別與左聲道L和右聲道R距離80度。圖3是用于解釋人耳如何感知音頻信號，尤其是音頻信號的空間參數(shù)的圖。參考圖3,多聲道音頻信號的譯碼是基于人耳將音頻信號感覺為三維(3D)的事實。多組空間參數(shù)用于將音頻信號表示為3D空間信息。表示多聲道音頻信號的空間參數(shù)可包括CLD、ICC、CPC和CTD。CLD指示聲道電平之差，尤其是聲道能級之差。ICC指示一對聲道之間的相關(guān)性，CPC是用于基于一對聲道信號生成三個聲道信號的預(yù)測系數(shù)，CTD指示一對聲道之間的時間差。在下文中將參考圖3詳細(xì)描述人耳如何在空間上感知音頻信號以及如何生成關(guān)于音頻信號的空間參數(shù)。參考圖3，第一徑直聲波303從遠(yuǎn)離用戶的聲源301傳輸?shù)接脩舻淖蠖?07，第二徑直聲波303從聲源301通過衍射傳輸?shù)接脩舻挠叶?06。第一和第二徑直聲波302和303可能具有不同的到達(dá)時間和不同的能級，因而產(chǎn)生第一和第二徑直聲波302和303之間的CLD、CPC和CTD?？赏ㄟ^將本發(fā)明應(yīng)用于根據(jù)上述原理生成的空間參數(shù)的量化來提高量化的效率。圖4是根據(jù)本發(fā)明的一個實施例用于編碼多聲道音頻信號的空間參數(shù)的裝置(在下文中稱為編碼裝置)的框圖。參考圖4，當(dāng)多聲道音頻信號IN被輸入時，多聲道音頻信號IN由濾波器組401分割成分別對應(yīng)于多個子頻帶(即，子頻帶1至N)的信號。濾波器組401可以是子頻帶濾波器組或正交鏡像濾波器(QMF)濾波器組?？臻g參數(shù)提取單元402從每一個經(jīng)分割的信號中提取一個或多個空間參數(shù)。量化單元403量化所提取的空間參數(shù)。詳細(xì)地，量化單元403考慮多個聲道中的一對聲道的位置性質(zhì)來量化該對聲道之間的CLD。量化左聲道L和右聲道R之間的CLD所需的量化步長和量化步驟的數(shù)目(在下文中稱為量化步驟數(shù))可與量化左聲道L和左環(huán)繞聲道Ls之間的CLD所需的量化步長和量化步驟數(shù)不同。下文中將參考圖13詳細(xì)描述根據(jù)本發(fā)明的一個實施例的空間參數(shù)的量化。參考圖13，在操作940中，空間參數(shù)提取單元402從經(jīng)分割的音頻信號中提取空間參數(shù)。所提取的空間參數(shù)的例子包括CLD、CTD、ICC和CPC。在操作945中，量化單元403利用將預(yù)定角間隔作為量化步長的量化表來量化所提取的空間參數(shù)一具體的是CLD。量化單元403可將與操作945中獲取的經(jīng)量化CLD相對應(yīng)的索引信息輸出至編碼單元404?？蓪⒉僮?45中獲取的經(jīng)量化的CLD定義為多個多聲道音頻信號之間功率比的以IO為底的對數(shù)，如等式(l)所指示數(shù)學(xué)演算1CZZ):':=10log10-r其中n指示時隙索引，m指示混合子頻帶索引。之后，比特流生成單元404利用經(jīng)聲道縮減混音的音頻信號和經(jīng)量化的空間參數(shù)一包括在操作945中獲取的經(jīng)量化的CLD—來生成比特流。圖5是根據(jù)本發(fā)明的一個實施例用于解釋通過量化單元403確定虛擬聲源的位置的圖，并對解釋正弦/正切定律所需的振幅掃調(diào)定律(amplitudepanninglaw)進(jìn)行解釋。參考圖5，當(dāng)聽眾面向前時，可通過調(diào)節(jié)一對聲道chl和ch2的大小來使虛擬聲源位于任何任意位置(例如，點C)。在這種情形中，可根據(jù)聲道chl和ch2的大小確定虛擬聲源的位置，如等式(2)所指示的數(shù)學(xué)演算2si，=g「g2其中^指示虛擬聲源與聲道chl和ch2之間的中心之間的角度。p。指示聲道chl和ch2之間的中心之間的角度，gi指示與聲道chi相對應(yīng)的增益因子。當(dāng)聽眾面向虛擬聲源時，等式(2)可被重新安排成等式(3)數(shù)學(xué)演算3ta，=gt-g2ta，0g+g2基于等式(l)、(2)和(3)，聲道chl和ch2之間的CLD可由等式(4)定義。數(shù)學(xué)演算4<formula>formulaseeoriginaldocumentpage11</formula>基于等式(2)和(4)，聲道chl和eh2之間的CLD還可利用虛擬聲源與聲道chl和ch2的角度位置來定義，如等式(5)和(6)所指示的<formula>formulaseeoriginaldocumentpage11</formula>數(shù)學(xué)演算6<formula>formulaseeoriginaldocumentpage11</formula>根據(jù)等式(5)和(6)，CLD可對應(yīng)于虛擬聲源的角位置^。換言之，聲道chl和ch2之間的CLD，即聲道chl和ch2的能級之間的差可由位于聲道chl和ch2之間的虛擬聲源的角位置P來表示。圖6是根據(jù)本發(fā)明的另一個實施例用于解釋通過圖4所示的量化單元403確定虛擬聲源的位置的圖。當(dāng)如圖6所示布置多個揚(yáng)聲器時，第i聲道和第i-1聲道之間的CLD可基于等式(4)和(5)來表示，如等式(7)和(8)所指示的。數(shù)學(xué)演算7<formula>formulaseeoriginaldocumentpage11</formula>數(shù)學(xué)演算8<formula>formulaseeoriginaldocumentpage11</formula>其中《.指示位于第i聲道和第(i-l)聲道之間的虛擬聲源的角位置，a指示第i揚(yáng)聲器的角位置。根據(jù)等式(7)和(8)，一對聲道之間的CLD可由用于任何揚(yáng)聲器配置的聲道之間的虛擬聲源的角位置來表示。圖7是用于解釋利用預(yù)定角間隔將一對聲道之間的空間分割成多個部分的圖。圖7解釋將形成30。角的中心聲道和左聲道之間的空間分割成多個部分。人類的空間信息分辨能力是指關(guān)于可由人類感覺到的任意聲音的空間信息最小差。根據(jù)心理聲學(xué)研究，人類的空間信息分辨能力約是3°。因此，可將量化一對聲道之間的CLD所需的量化步長設(shè)定為3'的角間隔。因此，可將中心聲道和左聲道之間的空間分割成多個部分，每一個部分具有3°角。參考圖7，《-《—，=30°。中心聲道和左聲道之間的CLD可通過從0。至3(T每次增加《3'來計算。計算的結(jié)果在表l中示出。表1<table>tableseeoriginaldocumentpage12</column></row><table>中心聲道和左聲道之間的CLD可通過將表1用作量化表來量化。在這種情形中，量化中心聲道和左聲道之間的CLD所需的量化步驟數(shù)是11。圖8是根據(jù)本發(fā)明的一個實施例用于解釋由量化單元403利用量化表量化CLD的圖。參考圖8，可將量化表中一對相鄰角度的平均值設(shè)定為量化閾值。假設(shè)中心聲道和右聲道之間的角度是30°，且中心聲道和右聲道之間的CLD通過將中心聲道和右聲道之間的空間分割成多個部分、每一個部分具有3。角來量化。由空間參數(shù)提取單元402提取的CLD利用等式(7)和(8)轉(zhuǎn)換成虛擬聲源角位置。如果虛擬聲源角位置介于1.5°和4.5°之間，則所提取的CLD可被量化成存儲在表l中的與3。角有關(guān)的值。如果虛擬聲源角位置介于4.5和7.5之間，則所提取的CLD可被量化成存儲在表l中的與6。角有關(guān)的值。以上述方式獲取的經(jīng)量化的CLD可由索引信息表示。為此，可基于表1創(chuàng)建包括索引信息的量化表，即表2。表2<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>表5不僅可用于形成80。角的左聲道和左環(huán)繞聲道，還可用于形成80°角的右聲道和右環(huán)繞聲道。表6是量化形成80。角的左環(huán)繞聲道和右環(huán)繞聲道之間的CLD所需的量化表。表6具有3。的量化步長。表6<table>tableseeoriginaldocumentpage14</column></row><table>在根據(jù)本發(fā)明編碼多聲道音頻信號的空間參數(shù)的方法中，一對聲道之間的CLD可被線性量化成聲道之間的虛擬聲源的角位置，而不是線性量化成預(yù)定值。因此，可實現(xiàn)高效適當(dāng)?shù)牧炕?，供心理聲學(xué)模型中使用。不僅可將根據(jù)本發(fā)明編碼多聲道音頻信號的空間參數(shù)的方法應(yīng)用于CLD，還可將其應(yīng)用于CLD以外的空間參數(shù)，比如ICC禾nCPC。根據(jù)本實施例，如果用于解碼多聲道音頻信號的空間參數(shù)的裝置(在下文中稱為解碼裝置)不具有量化單元403進(jìn)行CLD量化所使用的量化表，則比特流生成單元404可將關(guān)于量化表的信息插入比特流中，并將該比特流發(fā)送到解碼裝置，這將在下文中進(jìn)一步詳細(xì)描述。根據(jù)本發(fā)明的實施例，關(guān)于在圖4所示的編碼裝置中使用的量化表的信息可通過將量化表中的所有數(shù)值一包括索引和分別對應(yīng)于各索引的CLD值插入比特流中并將該比特流發(fā)送至解碼裝置的方式發(fā)送至解碼裝置。根據(jù)本發(fā)明的另一個實施例，關(guān)于編碼裝置中使用的量化表的信息可通過向解碼裝置發(fā)送恢復(fù)編碼裝置所使用的量化表所需的信息的方式發(fā)送至解碼裝置。例如，在編碼裝置中所使用的量化表中所使用的最小和最大角度、量化步驟數(shù)可被插入比特流中，然后可將該比特流發(fā)送到解碼裝置。然后，解碼裝置可基于由編碼裝置發(fā)送的信息和等式(7)和(8)恢復(fù)編碼裝置所使用的量化表。根據(jù)本發(fā)明的另一個實施例的空間參數(shù)的量化將在下文中參考圖14詳細(xì)描述。根據(jù)本發(fā)明，關(guān)于多聲道音頻信號的空間參數(shù)可使用兩個或多個具有不同量化分辨能力的量化表來量化。參考圖14，在操作950中，空間信息提取單元402從待編碼的音頻信號中提取一個或多個空間參數(shù)，其中的待編碼的音頻信號是通過分割多聲道音頻信號獲取的、并分別對應(yīng)于多個子頻帶的多個音頻信號中的一個。所提取的空間參數(shù)的例子包括CLD、CTD、ICC禾BCPC。在操作955中，量化單元403從具有完全量化分辨能力的精細(xì)模式和量化分辨能力比精細(xì)模式低的粗糙模式中確定一個作為待編碼的音頻信號的量化模式。精細(xì)模式比粗糙模式的量化步驟數(shù)多、量化步長較小。量化單元403可根據(jù)音頻信號的能級確定精細(xì)模式和粗糙模式中的一個作為量化模式。根據(jù)心理聲學(xué)模型，精密地量化具有高能級的音頻信號比精密地量化具有低能級的音頻信號效率更高。因此，如果音頻信號的能級高于預(yù)定基準(zhǔn)值，則量化單元403可以以精細(xì)模式量化多聲道音頻信號，否則以粗糙模式量化多聲道音頻信號。例如，量化單元403可將由R-OTT模塊處理的信號的能級與待編碼的音頻信號的能級進(jìn)行比較。然后，如果由R-OTT模塊處理的信號的能級低于待編碼的音頻信號的能級，則量化單元403可以以粗糙模式進(jìn)行量化。另一方面，如果由R-OTT模塊處理的信號的能級高于待編碼的音頻信號的能級，則量化單元403可以以精細(xì)模式進(jìn)行量化。如果模塊具有5_1_5-1配置，則量化單元403可將分別經(jīng)由左和右聲道輸入的音頻信號的能級與待編碼的音頻信號的能級進(jìn)行比較，以便確定用于輸入至R-0TT3的音頻信號的CLD量化模式。在操作960中，如果在操作955中將精細(xì)模式確定為待編碼的音頻信號的量化模式，則量化單元403利用具有完全量化分辨能力的第一量化表量化CLD。第一量化表包括31個量化步驟，且通過將一對聲道之間的空間分成31部分來量化一對聲道之間的CLD。在精細(xì)模式中，可將相同的量化表應(yīng)用于每對聲道。在操作965中，如果在操作955中將粗糙模式確定為待編碼的音頻信號的量化模式，則量化單元403使用量化分辨能力比第一量化表低的第二量化表來量化CLD。第二量化表以預(yù)定的角間隔作為量化步長。第二量化表的創(chuàng)建和利用第二量化表來量化CLD的過程可與如以上參考圖7和圖8所描述的相同。根據(jù)本發(fā)明的另一個實施例的空間參數(shù)的量化將在下文中參考圖15進(jìn)行詳細(xì)描述。參考圖15，在操作970中，空間參數(shù)提取單元402從待編碼的音頻信號中提取一個或多個空間參數(shù)，其中該待編碼的音頻信號是通過分割多聲道音頻信號獲取并分別對應(yīng)于多個子頻帶的多個音頻信號中的一個。所提取的空間參數(shù)的例子包括CLD、CTD、ICC和CPD。在操作975中，量化單元403利用將兩個或多個角度作為量化步長的量化表來量化所提取的空間參數(shù)一具體的是CLD。在這種情形中，量化單元403可將與在操作975中所獲取的經(jīng)量化的CLD值相對應(yīng)的索引信息發(fā)送至編碼單元404。圖9是用于解釋利用兩個或多個角度間隔將一對聲道分割成具有不同角度的多個部分的圖，用于根據(jù)一對聲道的位置以可變角度間隔執(zhí)行CLD量化操作。根據(jù)心理聲學(xué)研究，人類的空間信息分辨能力根據(jù)聲源的位置而改變。當(dāng)聲源位于前方時，人類的空間信息分辨能力可以是3.6。。當(dāng)聲源位于左方時，人類的空間信息分辨能力可以是9.2。。當(dāng)聲源位于后方時，人類的空間信息分辨能力是5.5。。依此，對于位于前方的聲道，可將量化步長設(shè)定為約3.6。的角間隔，對于位于左方或右方的聲道，將其設(shè)定為約9.2。的角間隔，對于位于后方的聲道，將其設(shè)定為約5.5。的角間隔。為了從前方至左方或從左方至后方的平滑轉(zhuǎn)變，可將量化步長設(shè)定為不規(guī)則角間隔。換言之，角間隔沿從前方至左方的方向逐漸增加，使得量化步長增加。另一方面，角間隔沿從左方至后方的方向逐漸減小，使得量化步長減少。參考圖9中所示的多個聲道，聲道X位于前方，聲道Y位于左方，而聲道Z位于后方。為了確定聲道X和聲道Y之間的CLD，聲道X和聲道Y之間的空間被分成分別具有角度",至^的k個部分。角度^至a之間的關(guān)系可由等式(9)來表示。數(shù)學(xué)演算9為了確定聲道Y和聲道Z之間的CLD，聲道Y和聲道Z之間的空間可被分成分別具有角度A至凡的m個部分和分別具有角度乂至凡的n個部分。角間隔沿從聲道Y至左方的方向逐漸增加，而沿從左方至聲道Z的方向逐漸減小。角度A至^之間以及角度力至凡之間的關(guān)系可分別由等式(io)和(ii)來表示數(shù)學(xué)演算10數(shù)學(xué)演算11角度a、凡和^是用于解釋利用兩個或多個角間隔分割一對聲道之間的空間的示例性角度，其中根據(jù)多聲道的位置數(shù)用于分割一對聲道之間的空間所使用的角間隔的數(shù)目可以是4或更大。同樣，角度a、凡和^可以是一致的或可變的。如果角度a、A和^是一致的，則它們由等式(12)表示數(shù)學(xué)演算12等式(10)指示根據(jù)人類的空間信息分辨能力的角間隔特性。例如，&=3.6。、凡-9.2°和5.5°表7表示與通過利用兩個或多個角度間隔將形成30。角的中心聲道和左聲道之間的空間進(jìn)行分割而獲取的多個相鄰部分相對應(yīng)的多個CLD值和多個角之間的對應(yīng)關(guān)系。表7<table>tableseeoriginaldocumentpage17</column></row><table><table>tableseeoriginaldocumentpage18</column></row><table>參考表7，角度指示虛擬聲源和中心聲道之間的角度，CLD(X)指示與X相對應(yīng)的CLD值。CLD值CLD(X)可利用等式(7)和等式(8)來計算。通過將表7作為量化表，中心聲道和左聲道之間的CLD可被量化。在這種情形中，量化中心聲道和左聲道之間的CLD所需的量化步驟數(shù)是11。參考表7，隨著方向角間隔沿著從前方至左方的方向增加，量化步長相應(yīng)地增加，這指示人類的空間信息分別能力沿從前方至左方的方向增加。在表7中表示的CLD值可由各自對應(yīng)的索引來表示。在這種情形中，可基于表7創(chuàng)建表8。表8<table>tableseeoriginaldocumentpage18</column></row><table>圖10是根據(jù)本發(fā)明的另一個實施例用于解釋通過圖4所示的量化單元利用量化表量化CLD的圖。參考圖IO，可將量化表中示出的一對相鄰角度的平均值設(shè)定為量化閾值。詳細(xì)地，在位于前方的聲道A和位于右方的聲道B之間的CLD的情形中，可將聲道A和聲道B之間的空間分成分別對應(yīng)于k個角度《、《、...、《的k個部分。角度《、《、…、《可由等式(13)來表示數(shù)學(xué)演算13等式(13)指示根據(jù)聲道位置的角間隔特性。根據(jù)等式(13)，人類的空間信息分辨能力沿從前方至左方的方向增加。量化單元403利用等式(7)和(8)將由空間參數(shù)提取單元402提取的CLD轉(zhuǎn)換成虛擬聲源角位置。如等式(io)所指示的，如果虛擬聲源角介于l和《+l之間，則所提取的CLD可被量化成與《對應(yīng)的值。另一方面，如果虛擬聲源角介于《+，和《+&+|之間，則所提取的CLD可被量化成與角度e,和e2相對應(yīng)的和。在量化用于三個或多個聲道的CLD的情形中，可將不同的量化表用于不同的聲道對。換言之，可將多個量化表分別用于多個具有不同位置的聲道對。可按上述方式創(chuàng)建用于不同聲道對中的每一個的量化表。根據(jù)本實施例，一對聲道之間的CLD根據(jù)該對聲道的位置通過使用兩個或多個角間隔作為量化步長來量化，而不是被線性量化成一個預(yù)定的值。因此，可實現(xiàn)一種供心理聲學(xué)模型中使用的有效且適當(dāng)?shù)腃LD量化。根據(jù)本實施例的編碼多聲道音頻信號的空間參數(shù)的方法可被應(yīng)用于CLD以外的空間參數(shù)，比如ICC和CPC。在下文中將參考圖16詳細(xì)描述根據(jù)本發(fā)明的另一個實施例編碼多聲道音頻信號的空間參數(shù)的方法。根據(jù)圖16所示的實施例，可將具有不同量化分辨能力的兩個或多個量化表用于量化空間參數(shù)。參考圖16，在操作980中，從待編碼的音頻信號中提取空間參數(shù)，其中該待編碼的音頻信號是通過分割多聲道音頻信號獲取并分別對應(yīng)于多個子頻帶的多個音頻信號中的一個。所提取的空間參數(shù)的例子包括CLD、CTD、ICC禾口CPC。在操作985中，量化單元403從具有完全量化分辨能力的精細(xì)模式和量化分辨能力比精細(xì)模式低的粗糙模式中確定一個作為待編碼的音頻信號的量化模式。精細(xì)模式對應(yīng)于比粗糙模式多的量化步驟數(shù)和比其要小的量化步長。量化單元403可根據(jù)待編碼的音頻信號的能級確定精細(xì)模式和粗糙模式中的一個作為量化模式。根據(jù)心理聲學(xué)模型，精密地量化具有高能級的音頻信號比精密地量化具有低能級的音頻信號效率更高。因此，如果音頻信號的能級高于預(yù)定基準(zhǔn)值，則量化單元403可以以精細(xì)模式量化多聲道音頻信號，否則以粗糙模式量化音頻信號。例如，量化單元403可將由R-OTT模塊處理的信號的能級與待編碼的音頻信號的能級進(jìn)行比較。然后，如果由R-OTT模塊處理的信號的能級低于音頻信號的能級，則量化單元403可以以粗糙模式進(jìn)行量化。另一方面，如果由R-OTT模塊處理的信號的能級高于待編碼的音頻信號的能級，則量化單元403可以以精細(xì)模式進(jìn)行量化。如果模塊具有5-1-5-1配置，則量化單元403可將分別經(jīng)由左和右聲道輸入的音頻信號的能級與待編碼的音頻信號的能級進(jìn)行比較，以便確定用于輸入至R-0TT3的音頻信號的CLD量化模式。在操作990中，如果在操作985中將精細(xì)模式確定為待編碼的音頻信號的量化模式，則量化單元403利用具有完全量化分辨能力的第一量化表量化CLD。第一量化表包括31個量化步驟。在精細(xì)模式中，應(yīng)用于每對聲道的量化表具有相同量化步驟數(shù)。在操作995中，如果在操作985中將粗糙模式確定為待編碼的音頻信號的量化模式，則量化單元403使用量化分辨能力比第一量化表低的第二量化表來量化CLD。第二量化表具有作為量化步長的兩個或多個角間隔。第二量化表的創(chuàng)建和利用第二量化表來量化CLD的過程可與如以上參考圖9和圖10所描述的相同。根據(jù)本實施例，如果用于解碼多聲道音頻信號的空間參數(shù)的裝置(在下文中稱為解碼裝置)不具有量化單元403進(jìn)行CLD量化所使用的量化表，則比特流生成單元404可將關(guān)于量化表的信息插入比特流中，并將該比特流發(fā)送到解碼裝置，這將在下文中進(jìn)一步詳細(xì)描述。根據(jù)本發(fā)明的實施例，關(guān)于在圖4所示的編碼裝置中使用的量化表的信息可通過將量化表中的所有的值一包括索引和分別對應(yīng)于各索引的CLD值一插入比特流中并將該比特流發(fā)送至解碼裝置的方式發(fā)送至解碼裝置。根據(jù)本發(fā)明的另一個實施例，關(guān)于編碼裝置中使用的量化表的信息可通過向解碼裝置發(fā)送恢復(fù)編碼裝置所使用的量化表所需的信息的方式發(fā)送至解碼裝置。例如，在編碼裝置中所使用的量化表的最小和最大角度、量化步驟數(shù)和兩個或多個角度間隔可被插入比特流中，然后可將該比特流發(fā)送到解碼裝置。然后，解碼裝置可基于由編碼裝置發(fā)送的信息和等式(7)和(8)恢復(fù)編碼裝置所使用的量化表。圖11是圖4中所示的空間參數(shù)提取單元402—即空間參數(shù)提取單元910的例子的框圖。參考圖11，空間參數(shù)提取單元910包括第一空間參數(shù)提取測量單元911和第二空間參數(shù)測量單元913。第一空間參數(shù)測量器911基于輸入的多聲道音頻信號測量多個聲道之間的CLD。第二空間參數(shù)測量單元913利用預(yù)定的角間隔或兩個或多個角間隔將多個聲道中的一對聲道之間的空間分割成若干部分，并創(chuàng)建適用于聲道對組合的量化表。然后，量化單元920利用量化表量化由空間參數(shù)提取單元910提取的CLD。圖12是根據(jù)本發(fā)明的一個實施例解碼多聲道音頻信號的空間參數(shù)的裝置的框圖(在下文中稱為解碼裝置)。參考圖12，解碼裝置包括拆分單元930和逆量化單元935。拆分單元930從輸入的比特流中提取與一對聲道的能級之間的差相對應(yīng)的經(jīng)量化的CLD。逆量化單元935考慮一對聲道的位置性質(zhì)利用量化表對經(jīng)量化的CLD進(jìn)行逆量化。在下文中間參考圖17詳細(xì)描述根據(jù)本發(fā)明的一個實施例解碼多聲道音頻信號的空間參數(shù)的方法。參考圖17，在操作1000中，拆分單元930從輸入的比特流中提取經(jīng)量化的CLD。在操作1005中，逆量化單元935利用將預(yù)定角間隔作為量化步長的量化表來對經(jīng)量化的CLD進(jìn)行逆量化。量化步長可以是3。。在操作1005中使用的量化表與在以上參考圖7和8描述的操作期間由編碼裝置使用的量化表相同，因此將跳過其詳細(xì)描述。根據(jù)本實施例，如果逆量化單元930不具有任何關(guān)于量化表的信息，則逆量化單元930可從輸入比特流中提取關(guān)于量化表的信息，并基于所提取的信息恢復(fù)量化表。根據(jù)本發(fā)明的實施例，量化表中的所有值一包括索引和分別對應(yīng)于索引的CLD值可被插入于比特流中。根據(jù)本發(fā)明的另一個實施例，量化表的最小和最大角度和量化步驟數(shù)可包括在比特流中。圖18是根據(jù)本發(fā)明的另一個實施例示出解碼多聲道音頻信號的空間參數(shù)的方法的流程圖。根據(jù)圖18所示的實施例，空間參數(shù)可利用具有不同量化分辨能力的兩個或多個量化表來逆量化。參考圖18，在操作1010中，拆分單元930從輸入比特流中提取經(jīng)量化的CLD和量化模式信息。在操作1015中，逆量化單元935基于所提取的量化模式信息確定編碼裝置用于形成經(jīng)量化的CLD的量化模式是具有完全量化分辨能力的精細(xì)模式還是量化分辨能力比精細(xì)模式低的粗糙模式。精細(xì)模式對應(yīng)于比粗糙模式多的量化步驟數(shù)和比其要小的量化步長。在操作1020中，如果用于形成經(jīng)量化的CLD的量化模式在操作1015中被確定為精細(xì)模式，則逆量化單元935利用具有完全量化分辨能力的第一量化表逆量化經(jīng)量化的CLD。第一量化表包括31個量化步驟，并通過將一對聲道之間的空間分割成31個部分來量化一對聲道之間的CLD。在精細(xì)模式中，可將相同的量化步驟數(shù)應(yīng)用于每一對聲道。在操作1025中，如果用于形成經(jīng)量化的CLD的量化模式在操作1015中被確定為粗糙模式，則逆量化單元935利用量化分辨能力比第一量化表低的第二量化表逆量化經(jīng)量化的CLD。第二量化表可具有預(yù)定角間隔作為量化步長。利用預(yù)定角間隔作為量化步長的第二量化表可與以上參考圖7和8描述的量化表相同。將參考圖19詳細(xì)描述根據(jù)本發(fā)明的另一個實施例解碼多聲道音頻信號的空間參數(shù)的方法。參考圖19，在操作1030中，拆分單元930從輸入比特流中提取經(jīng)量化的CLD。在操作1035中，逆量化單元935利用將兩個或多個角間隔用作量化步長的量化表來逆量化經(jīng)量化的CLD。在操作1035中使用的量化表與以上參考圖9和IO所描述的操作期間編碼裝置使用的量化表相同，因此跳過其詳細(xì)描述。根據(jù)本實施例，如果逆量化單元930不具有任何關(guān)于量化表的信息，則逆量化單元930可從輸入比特流中提取關(guān)于量化表的信息，并基于所提取的信息恢復(fù)量化表。根據(jù)本發(fā)明的實施例，量化表中的所有值一包括索引和分別對應(yīng)于索引的CLD值可被插入于比特流中。根據(jù)本發(fā)明的另一個實施例，量化表的最小和最大角度、量化步驟數(shù)以及兩個或多個角間隔可包括在比特流中。圖20是根據(jù)本發(fā)明的另一個實施例示出解碼多聲道音頻信號的空間參數(shù)的方法的流程圖。根據(jù)圖20所示的實施例，空間參數(shù)可利用具有不同量化分辨能力的兩個或多個量化表來逆量化。參考圖20，在操作1040中，拆分單元930從輸入比特流中提取經(jīng)量化的CLD和量化模式信息。在操作1045中，逆量化單元935基于所提取的量化模式信息確定用于形成經(jīng)量化的CLD的量化模式是具有完全量化分辨能力的精細(xì)模式還是量化分辨能力比精細(xì)模式低的粗糙模式。精細(xì)模式對應(yīng)于比粗糙模式多的量化步驟數(shù)和比其要小的量化步長。在操作1050中，如果用于產(chǎn)生經(jīng)量化的CLD的量化模式在操作1015中被確定為精細(xì)模式，則逆量化單元935利用具有完全量化分辨能力的第一量化表逆量化經(jīng)量化的CLD。第一量化表包括31個量化步驟，并通過將一對聲道之間的空間分割成31個部分來量化一對聲道之間的CLD。在精細(xì)模式中，可將相同的量化步驟數(shù)應(yīng)用于每一對聲道。在操作1055中，如果用于產(chǎn)生經(jīng)量化的CLD的量化模式在操作1045中被確定為粗糙模式，則逆量化單元935利用量化分辨能力比第一量化表低的第二量化表逆量化經(jīng)量化的CLD。第二量化表可具有兩個或多個預(yù)定角間隔作為量化步長。利用兩個或多個預(yù)定角間隔作為量化步長的第二量化表可與以上參考圖9和IO描述的量化表相同?？蓪⒈景l(fā)明實現(xiàn)為寫在計算機(jī)可讀記錄介質(zhì)上的計算機(jī)可讀代碼。計算機(jī)可度記錄介質(zhì)可以是其中數(shù)據(jù)以計算機(jī)可讀方式存儲的任何類型的記錄設(shè)備。計算機(jī)可讀記錄介質(zhì)的例子包括ROM、RAM、CD-ROM、磁帶、軟盤、光數(shù)據(jù)存儲器、載波(例如，通過因特網(wǎng)的數(shù)據(jù)傳輸)?？蓪⒂嬎銠C(jī)可讀記錄介質(zhì)分布在連接至網(wǎng)絡(luò)的多個計算機(jī)系統(tǒng)上，使得計算機(jī)可讀代碼能以分散的方式向其寫入或從其執(zhí)行。實現(xiàn)本發(fā)明所需的功能程序、代碼和代碼段可由本領(lǐng)域的普通技術(shù)人員容易地解釋。工業(yè)適用性如上所述，根據(jù)本發(fā)明，可通過減少所需的量化比特數(shù)來提高編碼/解碼的效率。通常，多個任意聲道之間的CLD通過將可構(gòu)成多個任意聲道的每一對聲道之間的空間不加區(qū)分地分割成31部分來計算，因此，總共需要5個量化比特。另一方面，根據(jù)本發(fā)明，可將一對聲道之間的空間分成多個部分，且每一部分具有例如3。角。如果一對聲道之間的角度是30。，則該對聲道之間的空間可被分成ll部分，因此需要總共4個量化比特。因此，根據(jù)本發(fā)明，可減少所需的量化比特數(shù)。此外，根據(jù)本發(fā)明，可通過參考實際的揚(yáng)聲器配置信息進(jìn)行量化來進(jìn)一步提高編碼/解碼效率。隨著聲道數(shù)增加，數(shù)據(jù)量按3PN(N是聲道數(shù))增加。根據(jù)本發(fā)明，隨著聲道數(shù)增加，量化每一對聲道之間的CLD所需的量化步驟數(shù)減小，使得數(shù)據(jù)的總量統(tǒng)一維持不變。因此，本發(fā)明不僅可應(yīng)用于5.1聲道環(huán)境還可應(yīng)用于任意擴(kuò)展的聲道環(huán)境，因此實現(xiàn)高效率的編碼/解碼。盡管已經(jīng)參考本發(fā)明的示例性實施例具體示出并描述了本發(fā)明，但本領(lǐng)域的技術(shù)人員將理解可在不背離由以下權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下在形式和細(xì)節(jié)上進(jìn)行各種改變。權(quán)利要求1.一種編碼具有多個聲道的音頻信號的方法，所述方法包括確定所述多個聲道中的一對聲道之間的聲道電平差(CLD)；以及考慮所述一對聲道的位置性質(zhì)來量化所述CLD。2.如權(quán)利要求l所述的方法，其特征在于，量化所述多個聲道中的第一和第二聲道之間的CLD的量化步驟數(shù)不同于量化所述多個聲道中的第三和第四聲道之間的CLD的量化步驟數(shù)。3.如權(quán)利要求l所述的方法，其特征在于，所述量化包括利用角間隔作為量化步長來量化CLD。4.如權(quán)利要求1所述的方法，其特征在于，所述量化包括利用兩個或多個角間隔作為量化步長來量化CLD。5.—種接收比特流并解碼具有多個聲道的音頻信號的方法，所述方法包括從所述比特流中提取所述多個聲道中的一對聲道之間經(jīng)量化的CLD;以及利用考慮所述一對聲道的位置性質(zhì)的量化表來逆量化所述經(jīng)量化的CLD。6.如權(quán)利要求5所述的方法，其特征在于，在所述量化表中，量化所述多個聲道中的第一和第二聲道之間經(jīng)量化的CLD的量化步驟數(shù)不同于量化所述多個聲道中的第三和第四聲道之間的CLD的量化步驟數(shù)。7.如權(quán)利要求5所述的方法，其特征在于，在所述量化表中，將角間隔用作量化步長。8.如權(quán)利要求7所述的方法，其特征在于，在所述量化表中，量化所述多個聲道中的第一和第二聲道之間經(jīng)量化的CLD的量化步長與量化所述多個聲道中的第三和第四聲道之間的CLD的量化步長相等。9.如權(quán)利要求5所述的方法，其特征在于，在所述量化表中，將兩個或多個角間隔用作量化步長。10.如權(quán)利要求9所述的方法，其特征在于，在所述量化表中，量化步長根據(jù)所述一對聲道的位置而改變。11.如權(quán)利要求9所述的方法，其特征在于，在所述量化表中，量化步長沿著從前方或后方至左方或右方的方向增加。12.如權(quán)利要求9所述的方法，其特征在于，還包括從所述比特流中提取關(guān)于所述量化表的信息；以及基于所述提取的信息恢復(fù)所述量化表，其中關(guān)于所述量化表的信息包括所述量化表中的量化步長信息、量化分辨能力信息以及最小和最大索引。13.—種接收比特流并解碼具有多個聲道的音頻信號的方法，所述方法包括從比特流中提取多個聲道中的一對聲道之間經(jīng)量化的CLD和與量化模式有關(guān)的信息；以及如果所述量化模式是第一模式則利用第一量化表逆量化該經(jīng)量化的CLD;以及如果所述量化模式是第二模式則利用考慮所述一對聲道的位置性質(zhì)的第二量化表來逆量化該經(jīng)量化的CLD。14.如權(quán)利要求13所述的方法，其特征在于，在所述第二量化表中，量化所述多個聲道中的第一和第二聲道之間經(jīng)量化的CLD的量化步驟數(shù)不同于量化所述多個聲道中的第三和第四聲道之間的CLD的量化步驟數(shù)。15.如權(quán)利要求13所述的方法，其特征在于，在所述第二量化表中，將角間隔用作量化步長16.如權(quán)利要求13所述的方法，其特征在于，在所述第二量化表中，將兩個或多個角間隔用作量化步長。17.如權(quán)利要求16所述的方法，其特征在于，在所述第二量化表中，量化步長沿著從前方或后方至左方或右方的方向增加。18.—種用于編碼具有多個聲道的音頻信號的裝置，所述裝置包括-空間參數(shù)提取單元，其確定所述多個聲道中的一對聲道之間的CLD;以及量化單元，其考慮所述一對聲道的位置性質(zhì)來量化所述CLD。19.一種用于接收比特流并解碼具有多個聲道的音頻信號的裝置，所述裝置包括拆分單元，其從所述比特流中提取所述多個聲道中的一對聲道之間經(jīng)量化的CLD;以及逆量化單元，其利用考慮所述一對聲道的位置性質(zhì)的量化表來逆量化所述經(jīng)量化的CLD。20.如權(quán)利要求19所述的裝置，其特征在于，在所述量化表中，將角間隔用作量化步長。21.如權(quán)利要求19所述的裝置，其特征在于，在所述量化表中，將兩個或多個角間隔用作量化步長。22.如權(quán)利要求21所述的裝置，其特征在于，在所述量化表中，量化步長沿著從前方或后方至左方或右方的方向增加。23.—種用于執(zhí)行如權(quán)利要求1所述的方法的具有程序記錄于其上的計算機(jī)可讀記錄介質(zhì)。24.—種用于執(zhí)行如權(quán)利要求5所述的方法的具有程序記錄于其上的計算機(jī)可讀記錄介質(zhì)。25.—種具有多個聲道的音頻信號的比特流，包括CLD字段，其包括與一對聲道之間經(jīng)量化的CLD有關(guān)的信息；以及表信息字段，其包括與用于形成所述經(jīng)量化的CLD的量化表有關(guān)的信息，其中所述量化表考慮所述一對聲道的位置。26.如權(quán)利要求25所述的比特流，其特征在于，在所述量化表中，將角間隔用作量化步長。27.如權(quán)利要求25所述的比特流，其特征在于，將兩個或多個角間隔用作量化步長。全文摘要本發(fā)明提供了編碼和解碼多聲道音頻信號的方法和用于編碼和解碼多聲道音頻信號的裝置。用于解碼多聲道音頻信號的方法包括拆分單元，其從比特流中提取多個聲道中的一對聲道之間經(jīng)量化的CLD；以及逆量化單元，其利用考慮一對聲道的位置性質(zhì)的量化表來逆量化該經(jīng)量化的CLD。編碼和解碼多聲道音頻信號的方法和用于編碼和解碼多聲道音頻信號的裝置可通過減少所需的量化比特數(shù)來實現(xiàn)高效率的編碼/解碼。文檔編號G10L19/00GK101427307SQ200680044023公開日2009年5月6日申請日期2006年9月26日優(yōu)先權(quán)日2005年9月27日發(fā)明者吳賢午,房熙錫,林宰顯,鄭亮源,金東秀申請人:Lg電子株式會社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鄭亮源;房熙錫;吳賢午;金東秀;林宰顯
技術(shù)所有人：LG電子株式會社
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

音頻編解碼芯片相關(guān)技術(shù)

音頻編解碼相關(guān)技術(shù)

silk音頻編解碼協(xié)議相關(guān)技術(shù)

音頻編解碼技術(shù)相關(guān)技術(shù)

音頻編解碼matlab相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

編碼/解碼多聲道音頻信號的方法和裝置的制作方法