两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

使用關(guān)于非典型子序列的部分信息的語音和音頻編碼參數(shù)的量化的制作方法

文檔序號:2830030閱讀:616來源:國知局
專利名稱:使用關(guān)于非典型子序列的部分信息的語音和音頻編碼參數(shù)的量化的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息編碼領(lǐng)域,本發(fā)明特別涉及使用關(guān)于待量化的數(shù) 據(jù)序列中子序列的非典型行為的信息的數(shù)據(jù)量化。15背景技術(shù)語音和音頻編碼器一般是通過統(tǒng)計冗余去除和感知不相關(guān)去除 的組合以及隨后對剩余的歸一化參數(shù)進行量化(編碼)來對信號進行 編碼。通過這個組合,當(dāng)前大部分先進的語音和音頻編碼器以小于1 或2比特/輸入的采樣速率操作。但是,即使通過統(tǒng)計和不相關(guān)去除技20術(shù)獲得改善,根據(jù)定義,所考慮的比特率經(jīng)常使得以小于1比特/標(biāo)量 參數(shù)的速率對許多歸一化參數(shù)進行編碼。以此速率是非常難以在不增 加復(fù)雜度的情況下提高量化器的性能的。由于比特分配(資源分配) 的粒度和量化器的性能是有限的,特別是當(dāng)在統(tǒng)計等價的參數(shù)間均衡 地分配比特時,也非常難以控制或利用量化和/或不相干去除的感知效25 果。在包括音頻和語音編碼器設(shè)計的先進的編碼器設(shè)計中所見到的 許多壓縮,是由于對冗余和不相關(guān)進行有效地編碼和/或?qū)⑵渥鳛閺男?號中去除的目標(biāo)的編碼早期階段和使用有效技術(shù)對剩余的統(tǒng)計歸一化 且感知相關(guān)的參數(shù)進行量化的編碼后續(xù)階段的組合。 30 在低比特速率時,冗余和不相關(guān)去除階段必須是有效的。有大量的關(guān)于怎樣使得冗余和不相關(guān)去除有效的示例。例如,使用信號頻譜的總體(短期)形態(tài)的線性預(yù)測系數(shù)(LPC , Linear Predictive Coefficient)模型,可以使冗余和不相關(guān)去除有效。該模型是高度緊 湊的表示,應(yīng)用于很多設(shè)計中,例如在碼激勵線性預(yù)測編碼器、正弦 5 編碼器、以及其它編碼器如變換域加權(quán)交織矢量量化(TWIN-VQ)和 變換預(yù)測編碼器等中。使用各種狀態(tài)的現(xiàn)有技術(shù)例如對線譜對參數(shù)的 矢量量化和預(yù)測量化,能夠?qū)€性預(yù)測系數(shù)模型本身進行有效地編碼。 另一個關(guān)于怎樣使冗余和不相關(guān)去除階段有效的示例是使用信 號中的諧波或音調(diào)結(jié)構(gòu)的緊湊特性。這些結(jié)構(gòu)表示頻域中的冗余結(jié)構(gòu)10 或者時域中的(長期)冗余結(jié)構(gòu)。常見的技術(shù)通常使用表示這樣的結(jié) 構(gòu)的周期的參數(shù),例如頻域表示的譜峰間距或者準(zhǔn)定態(tài)時域波形間距, 使用經(jīng)典的參數(shù)如音調(diào)延遲(時域)或"ddta-f"(頻域)。另一個關(guān)于怎樣使冗余和不相關(guān)去除階段有效的示例是使用增 益因子,以在不同的時域和/或頻域區(qū)域中對信號能量的近似值進行顯15 式編碼??梢允褂酶鞣N對這些增益進行編碼的技術(shù),包括對增益的標(biāo) 量量化或矢量量化或者參數(shù)技術(shù),例如使用上述的線性預(yù)測系數(shù)模型。 這些增益經(jīng)常接著用于在進一步編碼之前在不同區(qū)域中對信號進行歸 一化。另一個關(guān)于怎樣使冗余和不相關(guān)去除階段有效的示例為指定不 20 同時域/頻域的目標(biāo)噪聲/量化級別。通過分析輸入信號的頻譜和時間 特性來計算該級別。可通過很多技術(shù)明確該級別,包括顯式地通過編 碼器和解碼器己知的比特分配或者噪聲級別參數(shù)(例如量化步驟大 小),以及隱式地通過編碼器中的參數(shù)的變長量化。目標(biāo)級別本身通常 為感知相關(guān)的,并成為一些不相關(guān)去除的基礎(chǔ)。通常通過應(yīng)用于時間 25 或頻率中的給定區(qū)域(參數(shù)組)的單個目標(biāo)級別的總體方式來說明這 些基本級別。一旦這些技術(shù)達到其能力的極限,例如在它們已經(jīng)對信號統(tǒng)計完 全地歸一化并基于這些歸一化參數(shù)產(chǎn)生比特分配或者噪聲級別參數(shù)分 配的極端情況下,這些技術(shù)不再能夠用于進一步提高編碼效率。 30 應(yīng)該注意的是,即使使用最佳的上述的冗余和不相關(guān)技術(shù),歸一
化參數(shù)在其中也可能有變化。在某些工程領(lǐng)域中參數(shù)的子序列中出現(xiàn) 變化是眾所周知的。特別地,在更高的參數(shù)維度,在諸如信息論的領(lǐng) 域中該變化已經(jīng)得到了關(guān)注。信息論注意到可將統(tǒng)計等價的標(biāo)量(隨 機變量)劃分到兩組中 一組中的子序列符合基于相應(yīng)的測度的"典 5 型的"行為,而另一 "非典型"組中的序列偏離于基于同樣的測度的 "典型"行為。為了信息論中的理論分析的目的,需要將序列精確地 和完全地劃分到這兩組中。但是,信息論所使用的一個考慮是遇到這些后者即"非典型"序 列的概率變得可以忽略,這是因為這些子序列本身在長度也即維度上 10 增長。結(jié)果,在信息論的漸近理論分析中拋棄了 "非典型"子序列(及 其效果和精確的處理)。實際上,理論分析使用對這些"非典型"子序列的非常低效率的處理,其低效率是漸近無關(guān)的(irrelevant asymptotically)。在更低的維度,主要的問題是這些變化是否足夠重要 而值得謹(jǐn)慎的處理,或者是否能夠或應(yīng)該忽略它們。15 先前已使用更高維度的矢量量化器隱式地(間接地)處理了信號統(tǒng)計中的局部變化,例如具有能與所考慮的序列的整個長度同樣大的 維度的量化器。因此,當(dāng)高維度的量化器中的碼字可以或不可以反映 序列中的一些局部平均變化時,沒有顯式地考慮這些變化。有許多使 用更高維度的矢量量化器的方法。最基本的是生成量化器的直接(強20 制)方法,其碼本由高維度矢量組成。這是最復(fù)雜的方法,但在速率 與失真的折衷方面具有最佳性能。還有其它復(fù)雜度更小的方法也能夠接近于直接的高維度量化器 方法。 一種方法是進一步模仿信號(例如使用假設(shè)的概率邊際密度函 數(shù))并使用參數(shù)化的高維度量化器進行量化。參數(shù)化的量化器不必需25 要已存儲的碼本,這是因為其假設(shè)無關(guān)緊要的信號統(tǒng)計(例如均勻的 分配)。 一個參數(shù)化的示例是Trdlis結(jié)構(gòu)。這樣的結(jié)構(gòu)也允許在編碼 過程中的簡單搜索。還有多種其它己知為結(jié)構(gòu)化量化器的技術(shù)。還有用于更直接地處理所關(guān)注的目標(biāo)矢量中的變化的方法。有許 多方法用于檢查目標(biāo)矢量并產(chǎn)生關(guān)于應(yīng)該怎樣對矢量進行編碼的標(biāo)30準(zhǔn)。例如,運動圖像專家組格式(MPEG)型編碼器取修正離散余弦 變換(MDCT)系數(shù)的矢量,分析輸入信號,并產(chǎn)生用于不同的MDCT 系數(shù)的組的保真度標(biāo)準(zhǔn)。 一般地, 一組系數(shù)在時間和頻率中跨越某個 支持區(qū)域。編碼器例如變換預(yù)測編碼器和基本變換編碼器使用給定子 帶中的信號能量信息以推斷用于該帶的比特分配。 5 實際上,產(chǎn)生標(biāo)準(zhǔn)是大多數(shù)適合所述信號的語音和音頻編碼方案的基礎(chǔ)。產(chǎn)生標(biāo)準(zhǔn)是處理冗余去除和不相關(guān)去除的編碼算法的早期階 段的功能。這些階段產(chǎn)生用于參數(shù)的每個目標(biāo)序列"x"的保真度標(biāo)準(zhǔn)。 單個目標(biāo)"x"可表示編碼器中的單個子帶或比例因子。 一般地,在給 定的語音或音頻幀中有許多這樣的"x",每個"x"具有其本身的保真10 度標(biāo)準(zhǔn)。這些保真度標(biāo)準(zhǔn)本身可為早期的方案所關(guān)注的總體統(tǒng)計的和 不相關(guān)的變化的函數(shù)。通過使用變長的量化例如霍夫曼(Huffman)編碼,能夠利用歸 一化矢量的序列中的統(tǒng)計變化。分配給每個目標(biāo)矢量的碼本表示為變 長的碼。所使用的碼趨向于較不頻繁使用的碼字較長,而較頻繁使用15 的碼字較短。本質(zhì)上,情況可以是較有效地表示"典型的"碼字,而 較低效地表示"非典型的"碼字。平均地,用于描述碼字的比特的數(shù) 量少于如果使用固定長度的代碼(固定比特數(shù)量)來表示碼字索引的 情況。最后,在近來的工作中,存在關(guān)于在沒有變量出現(xiàn)的順序(位置) 20 信息的情況下確定變量序列中的唯一值與在沒有關(guān)于所述值的信息的 情況下僅確定所述順序之間的平衡的討論。更多近來的工作也提到只 確定關(guān)于所述順序的"部分信息(partial information)"。 一旦能夠證 明變量的順序或值是不重要的,所述工作未顯示對任何類型的信息的 忽略是有益的。在關(guān)于語音和音頻編碼器的工作中,順序和值都是重 25要的,盡管可能不同的值具有不同的重要性級別。這在所參考的工作 中未陳述。更多的信息參見L Varshney和V. K. Goyal的"Ordered and Disordered Source Coding " , Information Theory and Application Workshop, Feb 6-10, 2006禾口 L. Varshney禾口 V. K, Goyal的"Toward a Source Coding Theory for Sets", Data Compression Conference, March 30 200
發(fā)明內(nèi)容
此處公開了一種用于使用關(guān)于非典型序列的部分信息對參數(shù)進行 量化的方法及裝置。在一個實施例中,該方法包括部分地將目標(biāo)矢量5中的第一多個子序列分類到許多所選擇的組中,基于由分類獲得的信 息對第一多個子序列中的每個子序列產(chǎn)生細(xì)化的保真度標(biāo)準(zhǔn),將目標(biāo) 矢量劃分到第二多個子序列中,并對第二多個子序列進行編碼,其包 括在給定的細(xì)化的保真度標(biāo)準(zhǔn)下對第二多個子序列進行量化。在另一 實施例中,第一和第二多個可以是相同的數(shù)量。10


根據(jù)下文給出的詳細(xì)描述以及本發(fā)明各種實施例的附圖將更充分 地理解本發(fā)明,但是其僅用于解釋和理解,而不應(yīng)根據(jù)其將本發(fā)明限 制為特定的實施例。 15 圖1為量化過程的一個實施例的流程圖;圖2為逆量化過程的一個實施例的流程圖;圖3描述了編碼過程的一個實施例的流程圖;圖4描述了解碼過程的一個實施例的流程圖;圖5描述了具有對比特分配的附加的感知增強的編碼過程的一個 20 實施例的流程圖;圖6描述了具有對比特分配的附加的感知增強的解碼過程的一個 實施例的流程圖;圖7描述了具有噪聲填充操作的解碼過程的一個實施例的流程圖;25 圖8描述了具有自適應(yīng)量化的編碼過程的一個實施例的流程圖;圖9為計算機系統(tǒng)的一個實施例的框圖。
具體實施方式
描述了提高對歸一化(統(tǒng)計等價的)參數(shù)進行量化的性能的技術(shù)。 30在一個實施例中,在有限的量化器維度和低速率操作的限制下執(zhí)行量
化。這里描述的技術(shù)還具有自然地允許其利用感知因素和不相干去除 的特性。在一個實施例中,將不再受益于傳統(tǒng)的統(tǒng)計冗余去除技術(shù)的參數(shù) 序列劃分到更小的部分(子序列)中。將這些子序列的子集或者許多5子集標(biāo)記為包括統(tǒng)計的變化。這里將該變化指示為"非典型"行為, 將這樣被標(biāo)記的序列稱為"非典型"序列。也就是說,根據(jù)不存在假 設(shè)的統(tǒng)計結(jié)構(gòu)的參數(shù)矢量,產(chǎn)生關(guān)于該矢量中包括的參數(shù)子序列之間 存在的實際(一般是隨機的)變化的部分(不完全的)信息。該將被 使用的信息是部分的,因為它不是統(tǒng)計變化的完整說明。完整說明將10 不是有效的,因為它需要比僅需要發(fā)送部分信息時更多的額外的輔助 信息??蛇x地,對于每個子集也可關(guān)注變化的類型或多個類型(也可 能和經(jīng)常是不精確的)。編碼器和解碼器均使用所述部分信息,以修改它們對整個參數(shù)序 列的處理。因此,解碼器和編碼器不需要對哪個序列是"非典型的"15 的完全了解或者關(guān)于變化的類型的完全信息。最后,將所述部分信息 編碼到比特流中,并發(fā)送給與如果編碼和發(fā)送完整信息相比具有更低 開銷的解碼器。下面描述了許多關(guān)于如何確定該信息和如何基于該信 息修改編碼器行為的方法。在一個實施例中,新方法包括目標(biāo)矢量,在這種情況下只有一個20上述的本領(lǐng)域中的"x"類型,并將這個"x"劃分到多個子序列中, 對每個子序列產(chǎn)生細(xì)化的保真度標(biāo)準(zhǔn)(refined fidelity criteria)。在一 個實施例中,以用于子序列的比特分配的形式實現(xiàn)保真度標(biāo)準(zhǔn)。在一 個實施例中,子序列中的比特分配作為部分信息的函數(shù)而產(chǎn)生。而且, 可選地,這些操作包括產(chǎn)生比特分配中的有目的的模式,以在給定部25 分信息的情況下,提高在該部分信息未包括的剩余的不確定部分中的 感知性能。在一個實施例中,過程促進有效地接收零比特分配的矢量中的區(qū) 域(子序列)數(shù)量的增長。該實施例還能通過使用噪聲填充以產(chǎn)生對 于接收零比特分配的區(qū)域有用的信號以利用該方法。該聯(lián)合過程對非 30常低的速率是有效的。而且,噪聲填充本身能基于準(zhǔn)確的模式或在量 化過程中調(diào)整。例如,可調(diào)整噪'聲填充的能量。該操作還包括使用比 特分配和噪聲填充對整個目標(biāo)進行量化(編碼)和逆量化(解碼),以 產(chǎn)生參數(shù)序列的編碼版本。有大量的關(guān)于這里描述的技術(shù)的差別和優(yōu)勢。首先,這里描述的5 技術(shù)不依賴于子序列中的任何預(yù)測或結(jié)構(gòu)統(tǒng)計變化。即使當(dāng)序列的組 成部分來自獨立同分布的統(tǒng)計源時,該技術(shù)仍然可行。第二,該技術(shù) 不需要提供所有子序列的信息或者關(guān)于任何給定序列的完整信息。在 一個實施例中,僅提供關(guān)于非典型子序列的存在和特性的部分的可能 不精確的信息。這是有益的,因為它降低了針對這樣的信息所傳輸?shù)?10 信息量。該信息是部分的這個事實意味著,在該信息未說明的不確定 部分中可選擇具有己知的或潛在的感知優(yōu)勢的改變(量化選項)。如果 沒有任何部分信息,該不確定部分太大而不能產(chǎn)生或區(qū)分改變,而如 果有完整的信息則沒有不確定部分。在一個實施例中,使用早期階段所提供的信息。更明確地,根據(jù) 15定義,當(dāng)生成精確標(biāo)準(zhǔn)時,原始的標(biāo)準(zhǔn)必須已經(jīng)存在。同樣地,假設(shè) 已對信號結(jié)構(gòu)進行歸一化。在這些假設(shè)下,能有效地使用部分信息以 作出剩余的更細(xì)的區(qū)分。在一個實施例中,將部分信息簡單地編碼為數(shù)字編號"V"。原始標(biāo)準(zhǔn)"C"和"V"共同直接地生成精確標(biāo)準(zhǔn)。該精確標(biāo)準(zhǔn)可由共同符20合"C"的許多子標(biāo)準(zhǔn)的模式組成。當(dāng)在低比特速率下使用這里描述的技術(shù)時,其具有與對噪聲填充 和模式化的比特分配的組合使用的自然的連接。該與噪聲填充的連接 來自于該方法還能(有效地分配零比特至)從一些"x"的子區(qū)域去除 量化源的事實。因此,存在資源的不均衡分布,并且一些區(qū)域中的資25 源成為零。換句話說, 一些區(qū)域中的值是不重要的,因此以比特分配 量化的觀點來看,其可被設(shè)為零。但是感知上更好的是分配非零(通 常是隨機的)值而非絕對的零值。隨后將討論模式化的比特分配,其 為信息的不確定部分中的自由的結(jié)果。在一個實施例中,將子序列按組改變,每組表示所關(guān)注的變化的30某個分類。組中子序列的成員資格表示該子序列更可能具有(不是必 須具有)所關(guān)注的變化。該實施例允許最佳的成員資格信息和不精確 的成員資格信息之間的平衡。不精確的成員資格信息簡單地傳達了給 定類型的信息(分類)是更可能的。例如,可對子序列"k"分配組"j" 的成員資格,只因為這與將子序列"k"分配給另一組相比占用更少的5信息。因此所述關(guān)于變化的部分信息的形式之一是組中的不精確度的 或部分的成員資格。在另一實施例中,所使用的組之一表示沒有關(guān)于該組的成員的分 類正被傳達,僅暗示該信息不是其它組的成員。同樣地,這是部分信 息的一個示例。10 在另一實施例中,能修改信息的類型,也即能根據(jù)多個可能性選擇組的數(shù)量和定義。被編碼入編號"V"的信息的一部分表示對于給 定的"x"所選擇的可能性。例如,如果有四個可能的定義,則"V" 中的2比特信息表示在使用哪個定義。在下面的描述中,提出許多細(xì)節(jié)以提供對本發(fā)明的更充分的說15 明。但是,對于本領(lǐng)域中的技術(shù)人員而言,顯而易見的是可以不使用 這些特定的細(xì)節(jié)而實施本發(fā)明。在其它示例中,以框圖的形式示出了 眾所周知的結(jié)構(gòu)和裝置,而非詳細(xì)地示出,以免模糊本發(fā)明。下面的詳細(xì)描述的一些部分以算法和對計算機存儲器中的數(shù)據(jù) 比特的操作的符號表示的方式表示。這些算法描述和表示是數(shù)據(jù)處理20 領(lǐng)域中的技術(shù)人員所使用的方法,以將他們的工作實質(zhì)最有效地傳達 給該領(lǐng)域中的其他技術(shù)人員。 一般將這里的算法構(gòu)思為通向期望的結(jié) 果的自相一致的步驟序列。這些步驟是那些需要對物理量的物理操作 的步驟。盡管不是必須地,這些量通常為能夠被存儲、組合、比較和 以其它方式操作的電或磁信號的形式。主要是由于通常的用法,將這25 些信號表示為比特、值、元素、符號、字母、術(shù)語、數(shù)字等等已證明 是方便的。但是,應(yīng)當(dāng)理解的是,所有這些及相似的術(shù)語與適當(dāng)?shù)奈锢砹肯?關(guān),并且是應(yīng)用于這些物理量的方便的標(biāo)簽。可以理解的是從始至終 的描述中,除非明確地陳述否則作為從以下的討論所顯而易見的,使 30用例如"處理"或"用計算機計算"或"計算"或"確定"或"顯示" 等的術(shù)語的討論,是指示計算機系統(tǒng)或相似的電子計算裝置的操作和 處理,其將計算機系統(tǒng)的寄存器和存儲器中的以物理(電子)量表示 的數(shù)據(jù)操作和轉(zhuǎn)換為其它同樣地以計算機系統(tǒng)的存儲器或寄存器或其 它這樣的信息存儲、傳輸或顯示裝置中的物理量表示的數(shù)據(jù)。5 本發(fā)明還涉及用于執(zhí)行這里的操作的裝置。該裝置可被特別地構(gòu)造用于所需要的目的,或者可包括被選擇性啟動的或者被計算機中存 儲的計算機程序所重配置的通用計算機。這樣的計算機程序可存儲于 計算機可讀存儲介質(zhì)中,例如但不限于任何類型的盤,包括軟盤、光 盤、只讀光盤存儲器(CD-ROM)、以及磁光盤、只讀存儲器(ROMs)、10 隨機存取存儲器(RAMs)、可擦可編程只讀存儲器(EPROMs)、電可 擦可編程只讀存儲器(EEPROMs)、磁或光卡、或任何類型的適合于 存儲電指令的介質(zhì),并且其每個被耦合到計算機系統(tǒng)總線。這里的算法和顯示并非固有地與任何特定的計算機或其它裝置 相關(guān)??梢允褂酶鞣N具有與這里的教義相一致的算法的通用系統(tǒng),或15 者已證明為方便的是構(gòu)造更專用的裝置來執(zhí)行所需要的方法步驟。下 面的描述將示出用于多種的這些系統(tǒng)的所需要的結(jié)構(gòu)。此外,并非參 考任何特別的編程語言來描述本發(fā)明??梢岳斫獾氖强梢允褂枚喾N編 程語言來實現(xiàn)這里所描述的本發(fā)明的教義。機器可讀介質(zhì)包括任何用于以機器(例如計算機)可讀的形式存20 儲或傳輸信息的裝置。例如,機器可讀介質(zhì)包括只讀存儲器("ROM");隨機存取存儲器("RAM");磁盤存儲介質(zhì);光存儲介質(zhì);閃存裝置; 電、光、聲或其它形式的傳播信號(例如載波、紅外信號、數(shù)字信號 等)等。25 鵬在參數(shù)序列中,即使是統(tǒng)計獨立且相同的參數(shù),在局部統(tǒng)計中可 能有更細(xì)微的變化。這對即使是理論(分析)序列例如獨立同分布的 高斯和拉普拉斯隨機變量也是真實的。實際上,許多所關(guān)注的真實參 數(shù)的統(tǒng)計,例如許多語音和音頻編碼器的歸一化的MDCT系數(shù)(即使 30 是那些非常接近于統(tǒng)計獨立和等價的),經(jīng)常導(dǎo)致在局部參數(shù)統(tǒng)計中有 重大變化。重要地,當(dāng)在低維度測量/觀察時,例如當(dāng)考慮單個參數(shù)或2、 3、 5等連續(xù)參數(shù)的子序列的局部能量時,這些變化傾向于更極端。 而且,在低比特速率時這些變化對于量化性能的影響經(jīng)常更加顯著。 雖然即使當(dāng)考慮獨立等同分布(i.i.d)的參數(shù)時,也即當(dāng)沒有統(tǒng) 5 計冗余時,這些變化仍然存在,試圖在給定這些變化所表現(xiàn)的細(xì)微的 和隨機的細(xì)節(jié)的情況下去除這些局部變化或?qū)λ羞@些局部變化進行 編碼是無效的。實際上,當(dāng)參數(shù)是獨立同分布時,在高比特速率時應(yīng) 該完全忽略這些變化。這是在這樣的獨立同分布的情況下主流編碼方 法忽略這樣的變化并僅僅通過使用更高維度的量化器的技術(shù)來間接的10 利用它們的原因。因此這樣的變化并非傳統(tǒng)的編碼器設(shè)計中的冗余和 不相關(guān)去除步驟的重點,并且通常當(dāng)考慮這些設(shè)計中所使用的低維度 量化器時未被考慮。當(dāng)涉及更低的比特速率時它們變得重要。但是,這個新方法中的關(guān)鍵意見是不需要去除、編碼或提供關(guān)于 所有這些局部變化的完整信息。而是,如果對即使是關(guān)于這些局部變15 化的部分信息進行編碼,可以通過編碼器和解碼器而利用該信息,用 于更好的全部客觀量化和感知(主觀)性能。其原因是部分信息與更 完整的信息相比需要更少的信息開銷,并且一般僅需要一些用于獲得 優(yōu)勢的變化。具有優(yōu)勢的變化是相對于平均信號統(tǒng)計而言足夠"非典 型的"變化。部分信息的示例包括但不限于僅說明組中存在的一些20 變化、不精確地說明變化的一般位置或級別、模糊地對變化分類等等。 在低比特速率時,這樣的變化可具有對性能的重要影響。通過獲知這些變化的存在和近似位置及類型,編碼器和解碼器調(diào) 整它們的編碼策略,以提高目標(biāo)性能例如提高期望均方誤差,以及利 用量化的感知效果。 一般地,來自期望行為的變化可表示具有這樣變25 化的子序列應(yīng)該得到優(yōu)先的或者不優(yōu)先的(即使是不利的)處理。通 過產(chǎn)生目標(biāo)矢量組(例如這樣的獨立同分布矢量的組)中的比特分配 的非平凡模式,能夠進行處理中的變化。比特分配表示應(yīng)被怎樣精確 表示目標(biāo)矢量(子序列)。平凡模式僅僅是將比特均衡地分配給所有目 標(biāo)矢量。非平凡(也即不均衡)模式能提高目標(biāo)性能,例如均方誤差,30 并允許有效地使用感知相關(guān)模式和噪聲填充。
因此,在一個實施例中,基本方法是產(chǎn)生該部分信息,該信息為 不必基于任何統(tǒng)計結(jié)構(gòu)的信息,使用該部分信息以產(chǎn)生比特分配的非 平凡模式,通過噪聲填充和感知掩蔽技術(shù)有效地和有目的地使用模式。圖1為量化(編碼)過程的一個實施例的流程圖。通過處理編碼5 器側(cè)的邏輯來執(zhí)行該過程。通過處理可包括硬件(電路、專用邏輯等)、 軟件(例如在通用計算機系統(tǒng)或?qū)S脵C器上運行)、或這兩者的組合的 邏輯來執(zhí)行該過程。參考圖1,該過程始于待編碼的目標(biāo)矢量"x" 120和目標(biāo)全局保 真度標(biāo)準(zhǔn)"B" 121的輸入。全局標(biāo)準(zhǔn)僅僅是將被應(yīng)用于整個矢量的標(biāo)10 準(zhǔn)(或比特方式的資源)。假設(shè)在冗余和不相關(guān)去除的早期編碼階段中 產(chǎn)生目標(biāo)和全局標(biāo)準(zhǔn)。目標(biāo)矢量"x" 120由"M"個符號的序列組成。 預(yù)定的和/或從早期編碼階段的比特流中傳輸?shù)男畔?比特)所注意到 的目標(biāo)全局保真度"B" 121為解碼器所已知。處理邏輯初始地交織目標(biāo)矢量(處理框IOI)。這是可選的。在一15個實施例中,通過交織函數(shù)實現(xiàn)交織。在這種情況下,表示該函數(shù)的 信息"I"(表示為比特序列)被打包到比特流中并被發(fā)送至解碼器。 注意,如果交織函數(shù)"I"在解碼器處是固定的或先驗的,例如如同上 述的"B"中所假設(shè)的,不需要發(fā)送信息至解碼器。交織具有許多作 用,其一是潛在地隨機化量化的方塊(局部化的區(qū)域)效應(yīng)。20 接著,處理邏輯將目標(biāo)矢量120劃分到大量(大于1)的用于分類的符號的子序列中(處理框102)。在一個實施例中,這個劃分(這 里表示為"劃分1")至少部分地是保真度標(biāo)準(zhǔn)"B"的函數(shù)。例如, 子序列的長度、子序列的數(shù)量可為"B"的函數(shù)。在一個實施例中, 該劃分至少部分地是目標(biāo)120的維度"M"的函數(shù)。而在另一實施例25中,該劃分為任何其它來自先前的編碼階段的輔助信息的函數(shù)。注意, 該劃分不需要是它們中任何一個的函數(shù)。無論如何,假設(shè)編碼器己知 所有相關(guān)信息并因此能基于對劃分l的解析而重新產(chǎn)生信息。注意, 劃分1還可為這里表示為"劃分2"的另一劃分的函數(shù),其在下文將 被描述并在量化(編碼)子序列時被使用。30 處理邏輯分析這些子序列以判定任何子序列是否表示和/或包含
所關(guān)注的行為上的變化(處理框103)。關(guān)注這樣的"非典型"子序列 也即具有"非典型"變化的子序列,并且選擇其中一些的索引用于包 括在發(fā)送至解碼器的部分信息中。注意,也可以選擇不具有所關(guān)注的 行為的子序列用于這樣的分類。如果這樣的不精確的(部分的)分類 5 實際上比準(zhǔn)確的分類更有效則可以這樣做。例如,使算法說明固定的 預(yù)先選擇的數(shù)字如"u",否則總共"v"個子序列中的子序列需要與允 許靈活地選擇這樣的子序列中的1,2,...,或者u相比更少的信息。處理邏輯基于"非典型"子序列的索引和它們可能表現(xiàn)的變化的 類型,將信息編碼到參數(shù)"V"中(處理框104)。用將被打包到比特10 流中的比特序列表示該參數(shù)。在上述的一個實施例中,該參數(shù)定義了 不同組中的子序列的成員資格。不必將所有的子序列分配到組中。組 中的子序列不必實際上具有或表現(xiàn)同樣的"非典型"變化。組中的成 員資格僅僅表示可將這些子序列視為具有這樣的變化。例如,與消耗 資源以說明和限制優(yōu)先處理那個子序列相比,可能更有效的是優(yōu)先處15 理更多的子序列。為了對目標(biāo)矢量120編碼,處理邏輯還將目標(biāo)矢量劃分到子序列 y(l),...,y(n)中(處理框106)。該劃分(這里表示為"劃分2")不必與 在分析目標(biāo)矢量120中的變化時所使用的劃分(劃分1)相同。在一 個實施例中,如同使用劃分1地,劃分2是"B"和"M"或者任何20其它來自先前的編碼階段的輔助信息的函數(shù)。在一個實施例中,劃分 2是"V"的函數(shù)。為描述簡潔起見,假設(shè)這些子序列每個具有"p" 個符號。如果該劃分是可變的或者是任何其它在這個解碼中的階段未 在解碼器側(cè)出現(xiàn)的函數(shù),將必須以比特的形式向解碼器發(fā)送附加信息 以完全地描述該劃分。25 然后,處理邏輯使用保真度目標(biāo)"B"和由"V"表示的部分信息參數(shù),對劃分2中的目標(biāo)子序列產(chǎn)生細(xì)化的保真度標(biāo)準(zhǔn)f(l),…,f(n), 其中f(k)應(yīng)用于目標(biāo)y(k)(處理框105)。通過下面所討論的進一步細(xì)化(基于分配的改變),可以在保真 度標(biāo)準(zhǔn)f(l),...,f(n)中隱含地表示感知增強。30 可選地,處理邏輯測試是否有用于進一步使標(biāo)準(zhǔn)細(xì)化的新的信息(處理框108),如果有則判定隨著量化過程繼續(xù)而獲得的量化信息 (發(fā)送至處理框115的信息的一部分)是否能實際上使標(biāo)準(zhǔn)細(xì)化(處 理框109)。如果是,則處理框?qū)⒃撔畔l(fā)送至處理框105。該可選的 迭代步驟在一些情況下可提高性能。在一個包括處理框108和109的 5實施例中,y(k)的量化版本可直接用于改變將來的y(k)的量化。注意, 在解碼器中的逆操作中,以與編碼時同樣的順序恢復(fù)y(k)的量化版本, 因此在解碼器側(cè)能夠準(zhǔn)確地重復(fù)該過程。 一個調(diào)整是使用在給定時間 已知的y(k)的量化以估計原始的y(k)的實際能量。這可能提供了關(guān)于 剩余的y(k)的能量的信息,因此可使用該信息以調(diào)整量化技術(shù)。由于 10來自早期編碼步驟的原始統(tǒng)計歸一化過程,整個矢量"x"通常具有給 定的總期望能量。這使得這樣的估計是可能的。在另一實施例中,先 前的y(k)的估計能量可表示將來的y(k)的潛在的感知重要性或感知關(guān) 聯(lián)性。處理邏輯對劃分2中的子序列y(l),...,y(n)進行量化(根據(jù)保真度 15標(biāo)準(zhǔn)f(l),...,f(n)(或任何其感知細(xì)化),使用任何優(yōu)選的量化方法,例 如傳統(tǒng)的標(biāo)量或矢量量化技術(shù))(處理框107)。傳統(tǒng)技術(shù)將子序列 "y(k)"映射到碼本中的索引。碼本設(shè)計,例如碼本中的條目的數(shù)量 及其成員,是f(k)的函數(shù)。索引說明碼本中的應(yīng)該被用于表示子序列 "y(k)"的近似版本的唯一條目。 20 處理邏輯以已知的順序?qū)⒘炕饕虬絽?shù)"Q"中。該參數(shù)可簡單地是所有索引的集合,或者是一些從索引集合到另一參數(shù)值的 一對一的唯一映射(處理框115),并以比特序列方式作為發(fā)送至解碼 器的比特流的一部分而發(fā)送該信息。圖2為逆量化過程的一個實施例的流程圖。通過在解碼器側(cè)的處 25理邏輯執(zhí)行該過程。通過可包括硬件(電路、專用邏輯等)、軟件(例 如在通用計算機系統(tǒng)或?qū)S脵C器上運行)、或這兩者的組合的邏輯來執(zhí) 行該過程。注意,此方案不具有感知增強。參照圖2,解碼器中的處理邏輯接收從編碼器發(fā)送的比特流(處 理框201)。處理邏輯可接收來自早期編碼階段的可能(或可能不)是 30必需的參數(shù),例如"B"和"M"。
處理邏輯從比特流中提取參數(shù)"V"并使用該參數(shù)(和可能的其 它來自早期編碼階段的參數(shù)如"B"),以生成編碼器側(cè)所使用的保真 度標(biāo)準(zhǔn)f(l),...,f(n)(例如比特分配)(處理框204)。使用f(l)","f(n),處理邏輯能夠獲得"Q"并從比特流中提取和 5恢復(fù)量化索引(處理框202)。處理邏輯連同根據(jù)處理框202中的比特流所估計的參數(shù)"Q" — 起使用該保真度標(biāo)準(zhǔn),以恢復(fù)目標(biāo)(子序列)y(l),...,y(n)的量化版本 w(l),...w(n)(處理框203)。通過恢復(fù)所有的量化索引來完成這些。也 就是說,處理邏輯在給定細(xì)化的保真度標(biāo)準(zhǔn)和量化信息的情況下,以 10 已知的順序?qū)ψ有蛄羞M行逆量化(在給定所恢復(fù)的索引的情況下提取 必需的碼本條目)。在一個實施例中,處理邏輯是一所估計的量化信息以測試是否有 用于進一步使保真度標(biāo)準(zhǔn)細(xì)化的新的信息(處理框220),如果有,則 處理邏輯測試該信息是否能進一步使保真度標(biāo)準(zhǔn)細(xì)化(處理框211)。 15 在第12頁倒數(shù)第2段中描述了相關(guān)的迭代過程。如果是,則處理邏輯 將量化信息發(fā)送給處理框204,其對保真度標(biāo)準(zhǔn)進行細(xì)化(例如比特 分配)并相應(yīng)地修改對將來的量化索引的提取。使用假設(shè)在編碼器側(cè)和解碼器側(cè)均已知(并且可能是其它參數(shù)的 函數(shù))的劃分2,處理邏輯將w(l),...w(n)集合到長度為"M"的已解 20碼的矢量中(處理框205)。如果必需的話(如果在編碼器側(cè)已經(jīng)進行了交織),處理邏輯可 選地對已解碼的矢量解交織,該過程反轉(zhuǎn)目標(biāo)"x "的"M"維度的 量化版本即量化矢量"w" 230 (處理框206)。25 本發(fā)明的其他實施例在這里所描述的教導(dǎo)的應(yīng)用中,有許多用于該部分信息的產(chǎn)生和 使用的可能的選項。圖3描述了使用部分信息的編碼過程的一個實施 例的流程圖。通過編碼器側(cè)的處理邏輯來執(zhí)行該過程。該處理邏輯可 包括硬件(電路、專用邏輯等)、軟件(例如在通用計算機系統(tǒng)或?qū)S?0機器上運行)、或這兩者的組合。
參照圖3,處理開始于處理邏輯選擇性地對具有維度"M" 302 的目標(biāo)矢量302進行交織(處理框311)?;诮豢椇瘮?shù)(I) 303完成 該交織。交織函數(shù)(I) 303以比特表示。也就是說,"I"表示完整地 描述交織函數(shù)所需要的比特(可為O)。 5 在一個實施例中,不使用交織函數(shù),并且保真度標(biāo)準(zhǔn)"B"指定了將被用于對目標(biāo)x編碼的比特的數(shù)量??杉僭O(shè)在不失共性的情況下 "B"相當(dāng)于指定將使用"B"比特對目標(biāo)矢量302進行編碼。目標(biāo)"x"由"M"個符號組成。在一個實施例中,每個符號本身 表示矢量。在最簡單的情況下,單個符號是實值或復(fù)值的標(biāo)量(數(shù)字)。10 在選擇性地交織之后,處理邏輯執(zhí)行劃分1。最后,處理邏輯將矢量302分解到子序列中(處理框312),對變化進行檢測和分類(處 理框3B),并響應(yīng)于關(guān)于維度"M"的信息,基于變化對部分信息進 行編碼(處理框314)。編碼結(jié)果的一個輸出是完整地描述部分信息所 需要的編碼。這在圖3中以V表示。15 在一個實施例中,劃分1中的子序列是不相重疊的,并被簡單地定義為連續(xù)的每個包括"m"個符號的子序列。在一個實施例中,值 "m"是"B"和"M"的函數(shù)。因此在劃分1中有q二M/m個(假設(shè) q為整數(shù))這樣的子序列。為了此處的目的,將這些子序列表示為 x(l),...,x(q)。在另一實施例中,劃分1中的子序列可以相重疊。20 處理邏輯基于說明維度M的輸入信息對部分信息和變化進行解碼(處理框315)。處理邏輯使用目標(biāo)全局保真度標(biāo)準(zhǔn)對矢量、B30K維度M、對來 自部分信息解碼框315的變化的部分信息進行解碼的結(jié)果、以及處理 框320的輸出進行編碼,對每個的"p"維度的子序列產(chǎn)生新的保真度25 標(biāo)準(zhǔn)。在處理框320中,處理邏輯執(zhí)行劃分2,其包括選擇用于將目 標(biāo)矢量302劃分(交織)為用于編碼的子序列的方法。在一個實施例 中,劃分2是劃分1的細(xì)化,其中每個"m"個符號的矢量x(k)被劃 分到"a"個子序列中,每個子序列的維度"p"滿足a=m/p且假設(shè)p 為整數(shù)。為了此處的目的,將這些劃分2的子序列表示為<formula>formula see original document page 18</formula>因此,在劃分2中共有n-a+q個p維度的子序列。將
產(chǎn)生新的保真度標(biāo)準(zhǔn)的結(jié)果發(fā)送至處理框330。在處理框321,處理邏輯將矢量劃分到用于基于處理框320所選 擇的方法的編碼的子序列中。在一個實施例中,用于編碼的序列是維 度為"p"的子序列。將該子序列表示為y(l),...,y(n)。 5 響應(yīng)于處理框321和316的輸出,處理邏輯對子序列進行編碼(處理框330)。通過共同包括信息"Q"的參數(shù)(例如量化索引)描述每 個已編碼的子序列。該"Q"與完整地描述部分信息V所需要的比特 一起被輸出和發(fā)送至復(fù)用和打包邏輯340。復(fù)用和打包邏輯340接收完整地描述交織函數(shù)"I"所需要的比特、10完整地描述部分信息"V"所需要的比特、以及完整地描述可解釋為 給定的"V"(和可能地"I")的量化所需要的比特"Q"。響應(yīng)于此, 通過邏輯340將其復(fù)用和打包至比特流中。將復(fù)用和打包邏輯340的 輸出發(fā)送至復(fù)用和打包邏輯341,后者將該信息與來自早期階段304 的參數(shù)一起復(fù)用和打包至比特流350中。15 圖4為解碼過程的一個實施例的流程圖。通過解碼器中的處理邏輯執(zhí)行該過程。通過可包括硬件(電路、專用邏輯等)、軟件(例如在 通用計算機系統(tǒng)或?qū)S脵C器上運行)、或這兩者的組合的邏輯來執(zhí)行該 過程。參照圖4,通過產(chǎn)生用于早期階段(例如M和B)的比特流420 20和參數(shù)的解復(fù)用和解包邏輯411接收比特流401。將比特流420輸入 至執(zhí)行對比特流的解復(fù)用和解包以產(chǎn)生I、 V和Q的解復(fù)用和解包邏 輯412,其中I為完整地描述交織函數(shù)所需要的比特,V為完整地描 述部分信息所需要的比特,Q為完整地描述給定的量化V所需要的比 特。將V個比特發(fā)送至處理框403,其中處理邏輯響應(yīng)于表示目標(biāo)矢 25量的維度的輸入M,基于變化對部分信息進行解碼。在處理框404使 用解碼結(jié)果,其中處理邏輯響應(yīng)于目標(biāo)全局保真度標(biāo)準(zhǔn)B和目標(biāo)矢量 的維度M,對每個"p"維度的子序列產(chǎn)生新的保真度標(biāo)準(zhǔn)。在一個 實施例中,還響應(yīng)于處理框405所指定的對用于將目標(biāo)矢量劃分到用 于編碼的子序列中的方法的選擇,產(chǎn)生新的保真度。將以f(l),…,f(n) 30表示的新的保真度發(fā)送至處理框406。
在處理框406,處理邏輯響應(yīng)于處理框404所指定的保真度標(biāo)準(zhǔn), 對涉及每個子序列的來自解復(fù)用和解包邏輯412的"Q"中表示的信 息進行解碼。將已解碼的子序列發(fā)送至處理框407,其中處理邏輯將 重新獲得的子序列集合到維度為M的已解碼序列中。處理邏輯響應(yīng)于 5 如處理框405所指定的用于將目標(biāo)矢量劃分(交織)到子序列的方法, 對子序列進行集合。隨后,處理邏輯執(zhí)行任何必需的解交織(處理框408)。這是響應(yīng) 于由來自解復(fù)用和解包邏輯412的輸出I所指定的交織函數(shù)而完成的。 處理框408的輸出為目標(biāo)X的M維度的已解碼版本。10變麵量對于每個"m"維度的矢量x(l),...,x(q)計算對變化的測量。該測 量必須匹配于所使用的感知標(biāo)準(zhǔn)和量化方案。在一個實施例中,量化 方案基于固定速率的矢量量化器,而標(biāo)準(zhǔn)是每個子序列的能量。15 處理邏輯基于用于基于測量對子序列分類的類別的離散數(shù)字 "D"。每個類別的成員表示在某種意義上偏離于典型行為的矢量。在 一個實施例中,使用單個類別,其中注意到具有最大的測度例如能量 的變化的子序列。在這種情況下,該類別具有單個成員。在另一實施 例中,使用兩個類別第一類別為具有最高能量的"d"個矢量,第二20 類別為具有最低能量的"h"個矢量。在這種情況下,第一組具有"d" 個成員,第二組具有"h"個成員。注意,所使用的類別通常不提供關(guān)于所考慮的測度值例如子序列 的能量值的精確信息。實際上如同在當(dāng)"a"H時的情況下地,不必 提供在劃分2的粒度的信息。所有必需的是變化區(qū)分一個或更多的子25 序列與所考慮的序列的組中的剩余者。也就是說,類別是用于在給定 表示低維度的矢量的有限的采樣的情況下與其它子序列相比是"非典 型"的子序列。上面的示例表示實踐中所使用的類別。在一個實施例 中,類別是固定的。在另一實施例中,類別是來自早期階段的信息例 如"B"的函數(shù),并且假設(shè)為解碼器和編碼器己知。如果類別本身變30化,使用附加的輔助信息以用信號將信息通知給解碼器。該輔助信息
可簡單地作為前述的"V"的一部分被包括。在該方法的使用中,使類別主要是"B"、 "M"和"m"的函數(shù)就足夠了。如下文所述的附加 的輔助信息在指定類別(和"m")時也可是有用的,這在一些情況下 可顯示為有益的。5 對每個類別的成員進行編碼。為了執(zhí)行該編碼,首先回想在劃分1中有原始的"q"個m維度的子序列,其中僅有一些可以被分類。 假設(shè)有"D"個類別,每個類別具有預(yù)定的固定數(shù)量d(l),...,dCD)的成 員。指定該分類需要不多于"V"個比特的信息,其中10 其中<formula>formula see original document page 21</formula>且、-AH/(g!(W-g)!)例如,在具有兩個類別、每個類別僅具有一個成員的情況下, k)g2(q(q-l))個比特用于描述所關(guān)注的這兩個類別中的成員資格是足夠 的。這將構(gòu)成圖3和圖4中的信息"V"。注意在這個示例中q-2個子 15 序列是隱式地包括在除了這些子序列不在所關(guān)注的兩個類別中之外未 給出任何信息的第三類別中。部分信息的一個示例包括"D"個類別的定義、"D"個類別中的 成員資格、以及許多序列可以不被放入"非典型"類別的部分信息中 的事實。20 假設(shè)"B"簡單地是"B"個比特,"V"簡單地表示為"V"個比特。在一個實施例中,為了使用處理框326或404產(chǎn)生比特分配 f(l),…,f(n),以被認(rèn)為是在劃分1的"q"個m維度的子序列x(l),...,x(q) 中是均衡的方式初始地劃分被分配到目標(biāo)矢量"x"的(B — V)個比 特。這在沒有部分信息的情況下將是有意義的,因為早期編碼階段假25 設(shè)或者通過本性和設(shè)計試圖使得子序列全部統(tǒng)計等價且目標(biāo)矢量"x" 不具有結(jié)構(gòu)。但是,附加的部分信息使得可以做得更好,特別是在低比特速率 時。修改作為"B"和"m"以及所選擇的類別和信息"V"的函數(shù)的 比特分配,以產(chǎn)生在q個子序列中的不平均分配。這產(chǎn)生q個m維度 30的子序列中的粗略的初始不平均比特分配F(l),...,F(xiàn)(q)。例如,如果有
兩個類別類別l為具有最大能量的子序列,類別2為具有最小能量 的子序列,算法可簡單地從類別2的子序列中去除給定數(shù)量的比特并 加到類別1中的子序列。這里將被傳輸?shù)谋忍氐臄?shù)量表示為"不齊量(skew)"。在另一實施例中,如果有兩個類別,類別l為具有最大能 5量的子序列,類比2為具有第二大能量的子序列,算法可簡單地從任 何或所有的剩余矢量中去除給定數(shù)量的比特并可能不平均地將該比特 加到類別1和類別2。同樣地,將被傳輸?shù)谋忍氐臄?shù)量表示為"不齊 量"。在上述的兩個示例中,已經(jīng)發(fā)現(xiàn)對于"不齊量",隱式地基于"M"、 "m"和"B"是足夠的。也就是說,"M"、 "m"和"B",即編碼器 10 和解碼器均已知的變量連同所使用的類別對于定義不齊量而言是足夠 的。當(dāng)從許多其它未被部分信息區(qū)分的矢量中去除比特時,如同第二 個示例,盡可能均勻地從這些矢量中去除比特以彌補不齊量。給定分配F(k),盡可能在組中平等地對待子序列x(k)中的"a"個 劃分2的子序列x(k,l),…,x(k,a)??捎玫牟糠中畔⒉粦?yīng)用于任何子序 15 列x(k)中的比特分配的細(xì)化,因此平均對待是邏輯的,并可通過在"a" 個子序列之間盡可能平均地劃分完畢比特來實現(xiàn)。這是對所有"k"個 將F(l),...,F(xiàn)(q)個比特到x(l),...,x(q)的粗略比特分配細(xì)化為應(yīng)用于"n" 個"p"維度的子序列x(l,l),...x(q,a)的"n"個分配f(l),…,f(n)而執(zhí)行 的,其中n=q*a。注意,盡管從感知的觀點來看,可用的部分信息未 20 應(yīng)用于任何子序列x(k)中比特分配的細(xì)化,該方案可關(guān)注組中實際的 分配并交換(安排它們)以具有感知優(yōu)勢。這將在下文通過講解和圖 6和圖7所描述。新的比特分配用于指導(dǎo)"n"個目標(biāo)x(U),…,x(q,a)的量化。通過 使用基于n=m*q個"p"維度的矢量x(l,l),…,x(U),x(2,l),…,x(q,a) 25的p維度的量化來執(zhí)行實際的量化。對于任何給定的x(k,j),使用如上 文所述的傳統(tǒng)的量化技術(shù)例如標(biāo)量或矢量量化,來執(zhí)行基于比特分配 的實際量化。附加的感知增強30 在一個實施例中,修改圖3的編碼方案和圖4的解碼方案,以增
加感知細(xì)化的能力。這些感知細(xì)化使比特分配和/或噪聲填充模式化。 應(yīng)用這些方法的原因之一是基于新方法的一些特性。也就是說,從f(i)、 f(j)、 f(l)到同樣類別中的子序列(也即同樣的X(k)中的子序列,或者 不同X(k)的相同類別的子序列)的分配可在無預(yù)期(平均)目標(biāo)(例 5 如均方誤差)性能損耗的情況下被改變順序。根據(jù)定義,部分信息不 將這樣的矢量彼此區(qū)分。
應(yīng)用這些方法的另一原因是該過程產(chǎn)生不均衡的比特分配,并且
當(dāng)在足夠低的比特速率使用該過程時,許多分配f(n)經(jīng)常為零。即使
當(dāng)F(k)〉0到子序列x(k)的非零分配在對于子序列x(k,l),…,x(k,a)的"a" 10個不同的分配中被中止時,則一些子序列可比其它子序列多獲得l比
特,除非F(k)為"a"的整數(shù)倍數(shù)。如果F(k)〈a,則一些矢量通常必需
獲得零比特的分配。
將模式化的比特分配的使用直接鏈接到這些特性的第一個,在圖
5和圖6中描述了用于解碼器和編碼器的該過程。該過程為接受分配 15f(l),...f(n)并產(chǎn)生為該分配的有限改變的新的分配g(l),...,g(n)。僅允許
同樣類別的子序列之間的分配的改變。
圖5描述了對圖3的修改,其中感知增強框501對于每個子序列
和每個表示V中的同樣的部分信息的組,檢查新產(chǎn)生的保真度的輸出。
處理邏輯接著對f(i),...f(n)重新排序,以具有更好的感知效果。將重新 20排序后的分配發(fā)送至編碼框530,編碼框530將這些子序列按其產(chǎn)生
的方式進行編碼。同樣在圖6中與此類似。 下面給出了變化的結(jié)合的一個實施例。
確定具有每子序列最高平均比特分配的單個類別的子序列。如果 可能,改變這些分配以具有最高可能的感知效果。在一個實施例中, 25如果矢量x(l,l),...,x(q,a)表示頻域矢量,因此符號序列x(k)包括頻帶, 使高比特分配一起在頻率中集群,例如接受隨機分配f(j),…,f(j+s)= [5,4,5,4,4]并排序為g(j),..,,g(j+s) = [4,4,5,5,4]。在這種情況下, 一般規(guī)
則可為使該集群集中于頻帶的中心。另一規(guī)則為對頻帶的邊緣附近的 分配進行集群,例如g(j),…,g(j+s" [5,4,4,4,5]。選擇使用哪個取決于 30在先前階段所編碼的其它信號特性(信息)和f(k)的實際值。也就是
說,該改變是完全隱式地基于現(xiàn)存的信息。
在分類之后,對目標(biāo)進行量化。有時最先量化接收最大比特分配 的目標(biāo)的方式是有益的。注意,該信息首先被打包到Q中的比特流中。
基于g(J),…,g(J+s)的值以及可能地基于Q中已量化的索引,評估 5已解碼的矢量的感知掩蔽特性W(j),...,w(j+s:)。
然后,關(guān)注將受到該基于f(k)的剩余的值的掩蔽的最大影響的下 一個目標(biāo)子序列。如果可能,改變它們的比特分配,以盡可能多地利 用或增強來自已編碼的矢量的掩蔽效應(yīng)。例如,如果已判定由 g(j),…,g(j+s)所覆蓋的區(qū)域具有對相鄰區(qū)域以及具有f(j-t),…f(j-l)= 10[l,O,l,O,l]的相鄰區(qū)域的非平凡的掩蔽效應(yīng),則一個過程將對一些非零 分配進行集群,以使其遠(yuǎn)離已編碼的區(qū)域并且不使用噪聲填充(或者 己使用的非常低的能量的噪聲填充,也即g(j-t),...,g(j-l) = [l,l,l,0,0]。 重復(fù)直到已產(chǎn)生全部分配g(l),...,g(n)并且已對所有子序列進行 了編碼。噪聲填充取決于第二特性并可在改變或不改變?nèi)鐖D7的模式 15化的比特分配的情況下使用。參照圖7,噪聲填充處理框701對于不 具有Q中的信息的子序列以規(guī)定的能量產(chǎn)生隨機序列。
噪聲填充通常以提高均方誤差的代價來有效地提高潛在的解碼 模式中的可變性。對于具有零比特分配的區(qū)域,所提高的可變性是感 知上更舒適的,并且是通過生成隨機模式在給定的噪聲能量級別產(chǎn)生 20 的。當(dāng)用于該方案而不考慮g(l),...,g(n)的準(zhǔn)確的模式時,對于接收零 比特分配的子序列,以所選擇的級別簡單地生成噪聲填充。當(dāng)該方案 適合g(l),...,g(n)的準(zhǔn)確的模式時,可通過改變不同的區(qū)域中的噪聲填 充的能量級別來這樣做。特別地,如果認(rèn)為具有零比特分配的區(qū)域被 另一區(qū)域(被編碼而非零比特分配)感知掩蔽,則解碼器可以判定不 25 在該區(qū)域使用任何噪聲填充或者降低噪聲填充的能量。
對實施例的性能增強 可使用進一步的性能增強。
首先,調(diào)整用于基于子序列的類別對子序列的編碼的量化器。如 30圖8所示。在使用("p"維度的)前向(straight-forward)矢量量化
器的情況下,為了實現(xiàn)這個方案,該方案將簡單地具有用于不同類別 的不同的碼本?;谝逊诸惖挠?xùn)練數(shù)據(jù)而訓(xùn)練該碼本。
第二個增強是同時使用該方案的兩個或更多的實施例,例如,使
用不同的"m"、不同的"p"、不同的類別等等。對于每個實施方式, 5使用每個實施方式進行編碼,接著僅從一個實施方式中選擇信息用于 傳輸給解碼器。如果測試了 "r"個不同的實施方式,則向解碼器發(fā)送 附加的1og2(r)比特的輔助信息,以傳遞已使用和發(fā)送哪種實施方式的信號。
10 附加實施例
有大量的附加的實施方式。在一個實施例中,重疊劃分l中的子 序列。該重疊本身可用于提高由類別所提供的對信息的分解。例如, 如果兩個重疊的子序列是同一個類別的成員,則可能重疊區(qū)域(對兩 個子序列而言是相同的)是產(chǎn)生非典型變化的區(qū)域?;叵耄瑸榱似胶?5 用于描述類別的"V"個比特與用于進行量化的"(B-V)"個比特,組 中的子序列可以實際上不具有該組試圖表示的變化。但是,在這種情 況下,將這樣的子序列放入這樣的組中,將它們視為具有該變化而非 花費更多的信息用于試圖提供說明它們不在該組中的信息,是更有效 的。重疊的組可為以增量方式不準(zhǔn)確地對這樣的信息進行細(xì)化的方法。
20 在一個實施例中,目標(biāo)保真度標(biāo)準(zhǔn)"B"可以除比特之外的方式
表示。例如,在一個實施方式中,目標(biāo)保真度標(biāo)準(zhǔn)"B"表示對于每 個目標(biāo)矢量的誤差的限度。
在一個實施例中,值"m"為來自早期階段的信息的函數(shù),例如 "M"和"B"??赡苡幸娴氖牵ㄟ^使用附加的輔助信息和/或使用其
25 它參數(shù)來提供對該值的附加的調(diào)整。例如, 一個這樣的方案使用"m" 的兩個潛在值,并將所使用的針對給定序列的選擇通過信號使用1比 特傳遞給解碼器。
在一個實施例中,交織器是固定的或者是來自早期階段的信息的 函數(shù)(不需要輔助信息)或者是可變的(需要輔助信息)。
30 在一個實施例中,關(guān)于"p"個子序列的新的保真度標(biāo)準(zhǔn)不符合 全局保真度標(biāo)準(zhǔn)"B"。例如,附加的部分信息可能足夠用于促使早期階段所計算的"B"標(biāo)準(zhǔn)中的變化。在一個實施例中,生成新的感知模式g(l),...,g(n)的過程并非如同 己完成量化而產(chǎn)生的增量過程。模式g(l),…,g(n)可直接從f(l),...,f(n)5中產(chǎn)生而不需要任何來自Q的信息。這提高了編碼對比特誤差的適應(yīng) 能力。典型計算機系統(tǒng)圖9為可執(zhí)行一個或多個這里描述的操作的示例性計算機系統(tǒng)的 10框圖。參照圖9,計算機系統(tǒng)900可包括示例性客戶端或服務(wù)器計算 機系統(tǒng)。計算機系統(tǒng)900包括用于計算信息的計算機裝置或總線911, 以及用于處理信息的與總線911耦合的處理器912。處理器912包括 微處理器,但是不限于微處理器,例如Pentium 、PowerPC 、 Alpha 等15 系統(tǒng)900還包括隨機存取存儲器(RAM)或者其它耦合到總線911的用于存儲信息和將被處理器912執(zhí)行的指令的動態(tài)存儲裝置904 (表示為主存儲器)。主存儲器904還可用于存儲臨時變量或其它處理 器912執(zhí)行指令過程中的中間信息。計算機系統(tǒng)900還包括只讀存儲器(ROM)和/或其它耦合到總 20線911的用于存儲靜態(tài)信息和用于處理器912的指令的靜態(tài)存儲裝置 906,以及數(shù)據(jù)存儲裝置907,例如磁盤或光盤及其相應(yīng)的盤驅(qū)動器。 數(shù)據(jù)存儲裝置907被耦合到總線911,用于存儲信息和指令。計算機系統(tǒng)900還可被耦合到顯示裝置921,例如陰極射線管 (CRT)或液晶顯示器(LCD),該顯示裝置921被耦合到總線911, 25用于向計算機用戶顯示信息。字母數(shù)字輸入裝置922,包括字母數(shù)字 鍵和其它鍵,還可被耦合到總線911,用于將信息和命令選擇傳送至 處理器912。附加的用戶輸入裝置是耦合到總線911的用于將方向信 息和命令選擇傳送至處理器912以及控制顯示器921上的指針運動的 指針控制923,例如鼠標(biāo)、軌跡球、軌跡板、觸針、或指針方向鍵。 30 另一可被耦合到總線911的裝置是硬拷貝裝置924,其可用于在
諸如紙、膠片或其它類似類型的介質(zhì)上標(biāo)記信息。另一可被耦合到總線911的裝置是有線/無線通信能力925,用于與電話或手持掌上設(shè)備 通信。注意,在本發(fā)明中,可使用系統(tǒng)900的任何或所有部件及相關(guān)的 5硬件。但是,可以理解的是,計算機系統(tǒng)的其它結(jié)構(gòu)可包括一些或所 有的所述裝置。盡管對于已閱讀上述說明的本領(lǐng)域普通技術(shù)人員而言,對本發(fā)明 的諸多變更和修改無疑是顯而易見的,應(yīng)當(dāng)理解的是,任何通過描述 的方式示出和說明的特定實施例決不應(yīng)被認(rèn)為是限制性的。因此,對 10各種實施例的細(xì)節(jié)的參考并非傾向于限制權(quán)利要求的范圍,權(quán)利要求 本身僅陳述那些被認(rèn)為對本發(fā)明而言是必要的特征。
權(quán)利要求
1、一種方法,包括部分地將目標(biāo)矢量中的第一多個子序列分類到許多所選擇的組中;基于由分類獲得的信息,對第一多個子序列中的每個子序列產(chǎn)生細(xì)化的保真度標(biāo)準(zhǔn);將目標(biāo)矢量劃分到第二多個子序列中;以及對第二多個子序列進行編碼,包括在給定的細(xì)化的保真度標(biāo)準(zhǔn)下對第二多個子序列進行量化。
2、 一種制造品,包括一個或多個存儲有指令的計算機可讀介質(zhì), 當(dāng)所述指令被系統(tǒng)執(zhí)行時促使系統(tǒng)執(zhí)行包括以下步驟的方法-部分地將目標(biāo)矢量中的第一多個子序列分類到許多所選擇的組15 中;基于由分類獲得的信息,對第一多個子序列中的每個子序列產(chǎn)生 細(xì)化的保真度標(biāo)準(zhǔn);將目標(biāo)矢量劃分到第二多個子序列中;以及 對第二多個子序列進行編碼,包括在給定的細(xì)化的保真度標(biāo)準(zhǔn)下 20 對第二多個子序列進行量化。
3、 一種方法,包括 接收具有已編碼的信息的比特流;對來自該比特流的分類信息進行解碼,在編碼過程中通過對目標(biāo) 矢量中的子序列進行部分地分類而產(chǎn)生所述分類信息; 25 基于已解碼的分類信息,對第一多個子序列中的每個子序列產(chǎn)生保真度標(biāo)準(zhǔn);以及基于已知的順序和保真度標(biāo)準(zhǔn),對來自比特流的第一多個已編碼 的子序列進行解碼。
4、 一種制造品,包括一個或多個存儲有指令的計算機可讀介質(zhì), 30 當(dāng)所述指令被系統(tǒng)執(zhí)行時促使系統(tǒng)執(zhí)行包括以下步驟地方法接收具有己編碼的信息的比特流;對來自該比特流的分類信息進行解碼,在編碼過程中通過對目標(biāo) 矢量中的子序列進行部分地分類而產(chǎn)生所述分類信息;基于已解碼的分類信息,對第一多個子序列中的每個子序列產(chǎn)生 5保真度標(biāo)準(zhǔn);以及基于己知的順序和保真度標(biāo)準(zhǔn),對來自比特流的第一多個已編碼 的子序列進行解碼。
全文摘要
公開了一種使用關(guān)于非典型子序列的部分信息對參數(shù)進行量化的方法及裝置。在一個實施例中,該方法包括部分地將目標(biāo)矢量中的第一多個子序列分類到多個所選擇的組中,基于從分類中提取的信息,對第一多個子序列的每個子序列生成細(xì)化的保真度標(biāo)準(zhǔn),將目標(biāo)矢量劃分到第二多個子序列中,對第二多個子序列進行編碼,包括在給定細(xì)化的保真度標(biāo)準(zhǔn)情況下對第二多個子序列進行量化。
文檔編號G10L19/02GK101160621SQ200680012440
公開日2008年4月9日 申請日期2006年4月20日 優(yōu)先權(quán)日2005年4月20日
發(fā)明者希恩·A·蘭普拉賽德 申請人:株式會社Ntt都科摩
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
永安市| 东源县| 攀枝花市| 怀柔区| 密山市| 蓬溪县| 巴中市| 大埔县| 平阳县| 来凤县| 壤塘县| 九江市| 玛纳斯县| 乌拉特中旗| 清涧县| 根河市| 仁怀市| 唐海县| 广西| 特克斯县| 康保县| 德保县| 永福县| 山西省| 教育| 方山县| 嫩江县| 小金县| 汉沽区| 郯城县| 济宁市| 清丰县| 鹤庆县| 桂东县| 晋中市| 喀什市| 阳朔县| 正安县| 云阳县| 会理县| 吉水县|