專利名稱:無損音頻解碼/編碼方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號編碼/解碼的領(lǐng)域,更特別地,涉及一種用于在調(diào)整位速率時的無損編碼/解碼音頻信號的裝置和方法。
背景技術(shù):
無損音頻編碼可以分類為子午線無損音頻壓縮(MLP子午線無損壓縮,Meridian Lossless Packing)、轉(zhuǎn)環(huán)音頻(Monkey’s Audio)和自由無損音頻編碼(FLACFree Lossless Audio Coding)。特別的,MLP(子午線無損壓縮)可以應(yīng)用于數(shù)字通用光盤音頻(DVD-A)?;ヂ?lián)網(wǎng)帶寬的增長使得提供大量的多媒體內(nèi)容成為可能。當(dāng)提供音頻服務(wù)時,需要進(jìn)行無損音頻編碼。歐洲聯(lián)盟(EU)已經(jīng)通過數(shù)字音頻廣播(DAB)系統(tǒng)初始化了數(shù)字音頻廣播,并且廣播站或內(nèi)容提供商已經(jīng)采用了用于數(shù)字音頻廣播的無損音頻編碼。在這種連接中,ISO/IEC 14496-32001/AMD 5、音頻可伸縮無損編碼(SLS)標(biāo)準(zhǔn)正在發(fā)展為用于通過運(yùn)動圖像專家組(MPEG)進(jìn)行無損音頻編碼的標(biāo)準(zhǔn)。這個標(biāo)準(zhǔn)支持精細(xì)粒度可伸縮性(FGS)并使能無損音頻壓縮。
在無損音頻壓縮技術(shù)中作為最重要因素的壓縮率可以通過從數(shù)據(jù)中去除冗余信息來改善。冗余信息可以從相鄰數(shù)據(jù)中被評估和去除,或者利用相鄰數(shù)據(jù)的上下文來去除。
假定整數(shù)改進(jìn)型離散余弦變換(MDCT)系數(shù)表示拉普拉斯分布(Laplaciandistribution)。在這種情況中,Golomb編碼產(chǎn)生編碼的最佳結(jié)果,同時位平面進(jìn)一步被要求提供FGS。Golomb編碼和位平面編碼的結(jié)合被稱為位平面Golomb編碼(BPGC),它允許音頻數(shù)據(jù)以最佳速率被壓縮并提供FGS。然而,有一種情況不能應(yīng)用以上的假定。由于BPGC是一種基于以上假定的算法,當(dāng)整數(shù)MDCT系數(shù)不表示拉普拉斯分布時,不可能獲得最佳的壓縮率。相應(yīng)地,用于開發(fā)可以保證最佳壓縮率而不管整數(shù)MDCT系數(shù)是否表示拉普拉斯分布的無損音頻編碼/解碼的需要日益增長。
發(fā)明內(nèi)容
本發(fā)明提供了一種能夠獲得最佳壓縮率而不管整數(shù)改進(jìn)型離散余弦變換(MDCT)系數(shù)是否表示拉普拉斯分布的無損音頻編碼方法和裝置。
本發(fā)明還提供了一種能夠獲得最佳壓縮率而不管整數(shù)改進(jìn)型離散余弦變換(MDCT)系數(shù)是否表示拉普拉斯分布的無損音頻解碼方法和裝置。
根據(jù)本發(fā)明的一個方面,提供了一種無損音頻編碼方法,該方法包括將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;根據(jù)這個頻率,將頻域中的音頻頻譜信號映射為位平面信號;以及利用根據(jù)預(yù)定的上下文確定的概率模型來無損地編碼位平面的二元樣本。二元樣本的無損編碼可以包括根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面的數(shù)據(jù);獲得最高有效位和用于每個位平面的golomb參數(shù);以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要被編碼的二元樣本;利用在包括所選二元樣本的相同的位平面上存在的先前編碼的樣本,來計(jì)算所選二元樣本的上下文;利用所獲得的golomb參數(shù)和上下文來選擇概率模型;以及利用概率模型來無損地編碼二元樣本。
根據(jù)本發(fā)明的另一方面,提供了一種無損音頻編碼方法,該方法包括(a)將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;(b)對頻域中的音頻頻譜信號進(jìn)行定標(biāo),使得它可以被匹配來輸入到有損編碼單元;(c)有損編碼已定標(biāo)的信號來獲得有損編碼的數(shù)據(jù);(d)計(jì)算為在有損編碼的數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別的誤差映射信號;(e)利用上下文來無損地編碼誤差映射信號;以及(f)多路復(fù)用該無損編碼的信號和有損編碼的信號,來產(chǎn)生位流。(e)可以包括(e1)根據(jù)其頻率,將在(d)中獲得的誤差映射信號映射為位平面的數(shù)據(jù);(e2)獲得最高有效位和位平面的golomb參數(shù);(e3)以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要被編碼的二元樣本;(e4)利用在包括所選二元樣本的相同的位平面上存在的先前編碼的樣本,來計(jì)算所選的二元樣本的上下文;(e5)利用golomb參數(shù)和上下文,選擇概率模型;以及(e6)利用概率模型,無損編碼所選的二元樣本。
在(e4)中,可以獲得在包括所選擇的二元樣本的同樣的位平面上的先前編碼的樣本的標(biāo)量值,并且可以利用該標(biāo)量值來計(jì)算所選擇的二元樣本的上下文。在(e4)中,可以計(jì)算預(yù)定樣本將會具有值為1的概率,該概率可以被乘以預(yù)定的整數(shù)來獲得整數(shù)概率,并且可以利用該整數(shù)概率來計(jì)算所選擇的二元樣本的上下文,所述預(yù)定樣本存在在包括所選擇的二元樣本的同樣的位平面上。在(e4)中,可以利用其中所選擇的二元樣本所位于的以同樣頻率已經(jīng)編碼的上部位平面的值來計(jì)算所選擇的二元樣本的上下文。在(e4)中,利用關(guān)于已經(jīng)以同樣的頻率編碼的上部位平面值是否存在的信息,可以計(jì)算所選擇的二元樣本的上下文,以及當(dāng)上部位平面值中的至少一個為1時,可以確定上下文具有值1,否則確定上下文具有值0。
根據(jù)本發(fā)明的另一個方面,提供了一種無損音頻編碼裝置,該裝置包括整數(shù)時間頻率轉(zhuǎn)換器,用于將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;以及無損編碼單元,用于根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面的數(shù)據(jù),并利用預(yù)定上下文來無損編碼位平面的二元樣本。所述無損編碼單元包括位平面映射器,用于根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面的數(shù)據(jù);參數(shù)獲得單元,用于獲得最高有效位和位平面的golomb參數(shù);二元樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇二元樣本;上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上的先前編碼的樣本,來計(jì)算所選擇的二元樣本的上下文;概率模型選擇器,用于利用golomb參數(shù)和所計(jì)算的上下文,來選擇概率模型;以及二元樣本編碼器,用于利用概率模型,無損編碼所選擇的二元樣本。整數(shù)時間頻率轉(zhuǎn)換器可以執(zhí)行整數(shù)改進(jìn)型離散余弦變換。
更根據(jù)本發(fā)明的另一方面,提供了一種無損音頻編碼裝置,該裝置包括整數(shù)時間頻率轉(zhuǎn)換器,用于將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;定標(biāo)單元(scaling unit),用于定標(biāo)音頻頻譜信號,使得音頻頻譜信號可以被匹配輸入到有損編碼單元;有損編碼單元,用于有損編碼已定標(biāo)信號;誤差映射器,用于計(jì)算為在有損編碼的信號和通過整數(shù)時間頻率轉(zhuǎn)換器生成的音頻頻譜信號之間的差別的誤差映射信號;無損編碼單元,用于利用上下文,無損編碼誤差映射信號;以及多路復(fù)用器,用于多路復(fù)用有損編碼的信號和無損編碼的信號,來產(chǎn)生位流。所述無損編碼單元包括位平面映射器,用于根據(jù)其頻率,將誤差映射信號映射為位平面的數(shù)據(jù);參數(shù)獲得單元,用于獲得最高有效位和位平面的golomb參數(shù);二元樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇二元樣本;上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上存在的先前編碼的樣本,計(jì)算所選擇的二元樣本的上下文;概率模型選擇器,用于利用golomb參數(shù)和所計(jì)算的上下文,選擇概率模型;以及二元樣本編碼器,用于利用概率模型,無損編碼所選擇的二元樣本。
更根據(jù)本發(fā)明的另一方面,提供了一種無損音頻解碼方法,該方法包括從音頻數(shù)據(jù)中獲得golomb參數(shù);以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要被解碼的二元樣本;利用已經(jīng)解碼的樣本來計(jì)算預(yù)定的上下文;利用golomb參數(shù)和上下文選擇概率模型;利用概率模型來算術(shù)解碼所選擇的二元樣本;以及重復(fù)執(zhí)行二元樣本的選擇、預(yù)定上下文的計(jì)算、概率模型的選擇和所選擇的二元樣本的算術(shù)解碼(arithmetically decoding),直到所有所選擇的二元樣本被解碼為止。預(yù)定上下文的計(jì)算可以包括利用在包括所選擇的二元樣本的同樣的位平面上存在的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及利用其中所選擇的二元樣本所位于的以同樣的頻率已經(jīng)解碼的上部位平面樣本,來計(jì)算第二上下文。
更根據(jù)本發(fā)明的另一方面,提供了一種無損音頻解碼方法,該方法包括(aa)通過多路分配(demultiplex)音頻位流,來從誤差數(shù)據(jù)中提取有損編碼的預(yù)定有損位流和誤差位流,該誤差數(shù)據(jù)相應(yīng)于在有損編碼的音頻數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別;(bb)有損解碼所提取的已編碼有損位流;(cc)無損解碼所提取的誤差位流;(dd)利用已解碼的有損位流和誤差位流,來恢復(fù)原始的音頻頻率頻譜信號;以及(ee)通過在音頻頻譜信號上執(zhí)行反向整數(shù)時間頻率變換,恢復(fù)時域中的原始音頻信號。(cc)可以包括(cc1)從音頻數(shù)據(jù)的位流中獲得golomb參數(shù);(cc2)以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本;(cc3)利用已經(jīng)解碼的樣本,計(jì)算預(yù)定的上下文;(cc4)利用golomb參數(shù)和上下文,選擇概率模型;(cc5)利用概率模型,算術(shù)上解碼所選擇的二元樣本;以及(cc6)重復(fù)進(jìn)行(cc2)到(cc5),直到所有位平面的樣本被解碼為止。(cc3)可以包括利用在包括所選擇的二元樣本的同樣的位平面上的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及利用其中所選擇的二元樣本所位于的以同樣頻率已經(jīng)解碼的上部位平面樣本,來計(jì)算第二上下文。
更根據(jù)本發(fā)明的另一方面,提供了一種無損音頻解碼裝置,該裝置包括參數(shù)獲得單元,用于從音頻數(shù)據(jù)的位流中獲得golomb參數(shù);樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本;上下文計(jì)算單元,用于利用已經(jīng)解碼的樣本,來計(jì)算預(yù)定的上下文;概率模型選擇器,用于利用golomb參數(shù)和上下文,選擇概率模型;算術(shù)解碼器,用于利用概率模型,算術(shù)上解碼所選擇的二元樣本。所述上下文計(jì)算單元可以包括第一上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上存在的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及第二上下文計(jì)算器,用于利用其中所選擇的二元樣本所位于的已經(jīng)以同樣頻率解碼的上部位平面樣本,來計(jì)算第二上下文。
更根據(jù)本發(fā)明的另一方面,提供了一種無損音頻解碼裝置,該裝置包括多路分配器,用于多路分配音頻位流來從誤差數(shù)據(jù)中提取有損編碼的預(yù)定的有損位流和誤差位流,該誤差數(shù)據(jù)對應(yīng)于在有損編碼的音頻數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別;有損解碼單元,用于有損編碼所提取的有損位流;無損解碼單元,用于無損解碼所提取的誤差位流;音頻信號合成單元,用于合成所解碼的有損位流和誤差位流來恢復(fù)音頻頻率頻譜信號;以及反向整數(shù)時間頻率轉(zhuǎn)換器,用于對所恢復(fù)的音頻頻率頻譜信號執(zhí)行反向整數(shù)時間頻率變換,以恢復(fù)時域中的原始音頻信號。
有損解碼單元可以是AAC(自動幅度控制)解碼器。無損音頻解碼裝置可以進(jìn)一步包括用于將通過有損解碼單元解碼的有損位流恢復(fù)為時域中的音頻信號的反向時間頻率轉(zhuǎn)換器。有損解碼單元包括參數(shù)獲得單元,用于從音頻數(shù)據(jù)的位流中獲得golomb參數(shù);樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本;上下文計(jì)算單元,用于利用已經(jīng)解碼的樣本,計(jì)算預(yù)定的上下文;概率模型選擇器,用于利用golomb參數(shù)和上下文,選擇概率模型;以及算術(shù)解碼器,用于利用概率模型,在算術(shù)上解碼所選擇的二元樣本。
上下文計(jì)算單元可以包括第一上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上存在的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及第二上下文計(jì)算器,用于利用其中所選擇的二元樣本所位于的已經(jīng)以同樣頻率解碼的上部位平面樣本,來計(jì)算第二上下文。
更根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算機(jī)可讀記錄介質(zhì),用于存儲利用計(jì)算機(jī)執(zhí)行權(quán)利要求1到8和權(quán)利要求18到24的任意一種方法的程序。
本發(fā)明的上述和其它方面和優(yōu)點(diǎn)將通過參考附圖來詳細(xì)描述它的示范性實(shí)施例而變得更加明顯,其中 圖1是根據(jù)本發(fā)明的一個實(shí)施例的無損音頻編碼裝置的方框圖; 圖2是圖1的無損編碼單元的詳細(xì)方框圖; 圖3是根據(jù)本發(fā)明的另一個實(shí)施例的無損音頻編碼裝置的方框圖。
圖4是圖3的無損編碼單元的方框圖; 圖5是根據(jù)本發(fā)明的一個實(shí)施例的圖1的無損音頻編碼裝置的操作的流程圖; 圖6是根據(jù)本發(fā)明的一個實(shí)施例的圖1的無損編碼單元的操作的流程圖; 圖7是根據(jù)本發(fā)明的一個實(shí)施例的圖3的無損音頻編碼裝置的操作的流程圖; 圖8說明了根據(jù)其頻率映射到位平面的數(shù)據(jù)的音頻信號; 圖9是根據(jù)本發(fā)明的一個實(shí)施例的無損音頻解碼單元的方框圖; 圖10是圖9的上下文計(jì)算的詳細(xì)方框圖; 圖11是根據(jù)本發(fā)明的另一個實(shí)施例的無損音頻解碼單元的方框圖; 圖12是圖11的無損解碼單元的詳細(xì)方框圖; 圖13是根據(jù)本發(fā)明的一個實(shí)施例的圖9的無損音頻解碼裝置的操作的流程圖;和 圖14是根據(jù)本發(fā)明的一個實(shí)施例的圖11的無損音頻解碼裝置的操作的流程圖。
具體實(shí)施例方式 現(xiàn)在將參考附圖來詳細(xì)描述一種根據(jù)本發(fā)明的無損音頻編碼/解碼方法和裝置。通常,為音頻編碼提供精細(xì)粒度可伸縮性(FGSFine GrainScalability),以及為無損音頻編碼執(zhí)行整數(shù)改進(jìn)型離散余弦變換(MDCT)。特別的,當(dāng)音頻信號的輸入樣本顯示拉普拉斯分布時,位平面Golomb編碼(BPGC)產(chǎn)生編碼的最有利的結(jié)果。眾所周知,BPGC的結(jié)果等價于Golomb編碼的結(jié)果。Golomb參數(shù)L可以通過For(L=0;(N<<L+1))<=A;L++);來獲得。根據(jù)Golomb編碼,小于Golomb參數(shù)L的位平面將具有0或1的值的概率為1/2。然而,在這種情況中,僅僅當(dāng)音頻信號的輸入樣本顯示出拉普拉斯分布時,有可能獲得編碼的最佳結(jié)果。相應(yīng)地,本發(fā)明是即使數(shù)據(jù)的分布不同于拉普拉斯分布,也能通過利用數(shù)據(jù)的上下文和統(tǒng)計(jì)分析來提供最佳壓縮率。
圖1是根據(jù)本發(fā)明的一個實(shí)施例的無損音頻編碼裝置的方框圖。圖1的無損音頻編碼裝置包括整數(shù)時間頻率轉(zhuǎn)換器100和無損編碼單元120。整數(shù)時間頻率轉(zhuǎn)換器100將時域中的音頻信號轉(zhuǎn)換為頻域中具有整數(shù)的音頻頻譜信號,優(yōu)選地使用整數(shù)MDCT。無損編碼單元120根據(jù)其頻率將頻域中的音頻信號映射為位平面的數(shù)據(jù),并利用預(yù)定的上下文來無損編碼構(gòu)成位平面的二元樣本。無損編碼單元120包括位平面映射器200、Golomb參數(shù)獲得單元210、二元樣本選擇器220、上下文計(jì)算器230、概率模型選擇器240和二元樣本編碼器250。
位平面映射器200根據(jù)其頻率,將頻域中的音頻信號映射為位平面的數(shù)據(jù)。圖8說明了根據(jù)其頻率映射到位平面的數(shù)據(jù)的音頻信號。
Golomb參數(shù)獲得單元210獲取最高有效位(MSB)和位平面的Golomb參數(shù)。二元樣本選擇器220以從MSB到最低有效位(LSB)和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要編碼的二元樣本。
上下文計(jì)算器230利用位于包括所選擇的二元樣本的位平面上的先前編碼的二元樣本,來計(jì)算所選擇的二元樣本的上下文。概率模型選擇器240利用所獲得的Golomb參數(shù)和所計(jì)算的上下文,來選擇概率模型。二元樣本編碼器250利用所選擇的概率模型來無損編碼所選擇的二元樣本。
圖3是根據(jù)本發(fā)明的另一個實(shí)施例的無損音頻編碼裝置的方框圖。圖3的無損音頻編碼裝置包括整數(shù)時間頻率轉(zhuǎn)換器300、定標(biāo)單元310、有損編碼單元320、誤差映射器330、無損編碼單元340和多路復(fù)用器350。
整數(shù)時間頻率轉(zhuǎn)換器300將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號。在這個情況中,對于這個變換,整數(shù)MDCT被優(yōu)選執(zhí)行。定標(biāo)單元310定標(biāo)從整數(shù)時間頻率轉(zhuǎn)換器300輸出的音頻頻率信號,使得其能夠被匹配來輸入到有損編碼單元320。從整數(shù)時間頻率轉(zhuǎn)換器300輸出的音頻頻率信號被表示為整數(shù),因此,不能被直接輸入到有損編碼單元320。因此,音頻頻率信號必須通過定標(biāo)單元310進(jìn)行定標(biāo),使得其可以被輸入到有損編碼單元320。
有損編碼單元320有損編碼已定標(biāo)的音頻頻率信號,優(yōu)選利用ACC核心編碼器(未示出)。誤差映射器330獲得為在有損編碼的信號和從整數(shù)時間頻率轉(zhuǎn)換器300輸出的音頻頻率信號之間的差別的誤差映射信號。無損編碼單元340利用上下文來無損編碼該誤差映射信號。多路復(fù)用器350多路復(fù)用無損編碼的信號和有損編碼的信號,以便產(chǎn)生位流。
圖4是圖3的無損編碼單元340的方框圖。無損編碼單元340包括位平面映射器400、參數(shù)獲得單元410、二元樣本選擇器420、上下文計(jì)算器430、概率模型選擇器440和二元樣本編碼器450。
位平面映射器400根據(jù)其頻率,將通過誤差映射器330生成的誤差映射數(shù)據(jù)映射為位平面的數(shù)據(jù)。參數(shù)獲得單元410獲得MSB和位平面的Golomb參數(shù)。二元樣本選擇器420以從MSB到LSB和從最低頻率分量到最高頻率分量的順序,從位平面中選擇二元樣本。上下文計(jì)算器430利用位于包括所選擇的二元樣本的位平面上的先前編碼的二元樣本,來計(jì)算所選擇的二元樣本的上下文。概率模型選擇器440利用所獲得的Golomb參數(shù)和所計(jì)算的上下文,來選擇概率模型。二元樣本編碼器450利用概率模型來無損編碼所選擇的二元樣本。
圖2和4的上下文計(jì)算器230和430能夠?qū)⑽挥诎ㄋx擇的二元樣本的位平面上的先前編碼的二元樣本變化為標(biāo)量值,并利用該標(biāo)量值計(jì)算所選擇的二元樣本的上下文??蛇x地,上下文計(jì)算器230和430可以計(jì)算位于包括所選擇的二元樣本的位平面上的預(yù)定樣本將會具有值為1的概率,以預(yù)定整數(shù)乘以該概率來獲得整數(shù),并利用該整數(shù)來計(jì)算所選擇的二元樣本的上下文。同樣,上下文計(jì)算器230和430可以利用其中所選擇的二元樣本所位于的以同樣頻率已經(jīng)編碼的上部位平面的值,來計(jì)算上下文。同樣,基于關(guān)于已經(jīng)編碼的上部位平面值是否存在的信息,當(dāng)至少一個上部位平面值為‘1’時,可以確定上下文為1,否則確定上下文為0。
圖5是根據(jù)本發(fā)明的一個實(shí)施例的圖1的無損音頻編碼裝置的操作的流程圖。參考圖5,當(dāng)相應(yīng)于時域中的音頻信號的脈沖編碼調(diào)制(PCM)信號被輸入到整數(shù)時間頻率轉(zhuǎn)換器100中時,整數(shù)時間頻率轉(zhuǎn)換器100將這個信號轉(zhuǎn)換為頻域中具有整數(shù)的音頻頻譜信號(操作500)。對于這個變換,整數(shù)MDCT被優(yōu)選執(zhí)行。然后,正如在圖8中示出的,根據(jù)其頻率,頻域中的音頻頻譜信號被映射為位平面信號(操作520)。然后,利用由預(yù)定上下文確定的概率模型,來無損編碼位平面的二元樣本(操作540)。
圖6是根據(jù)本發(fā)明的一個實(shí)施例的圖1的無損編碼單元120的操作的流程圖。參考圖6,當(dāng)頻域中的音頻頻譜信號被輸入到位平面映射器200中時,根據(jù)其頻率,頻域中的音頻頻譜信號被映射為位平面的數(shù)據(jù)(操作600)。然后,通過Golomb參數(shù)獲得單元210來獲得MSB和位平面的Golomb參數(shù)(操作610)。接著,二元樣本選擇器220以從MSB到LSB和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要編碼的二元樣本(操作620)。接著,利用位于包括所選擇的二元樣本的位平面上的先前編碼的二元樣本,來計(jì)算所選擇的二元樣本的上下文(操作630)。接著,利用由Golomb參數(shù)獲得單元210獲得的Golomb參數(shù)和由上下文計(jì)算器230計(jì)算的上下文,來選擇概率模型(操作640)。此后,利用概率模型來無損編碼所選擇的二元樣本(操作650)。
圖7是根據(jù)本發(fā)明的一個實(shí)施例的圖3的無損編碼單元的操作的流程圖。參考圖3,通過整數(shù)時間頻率轉(zhuǎn)換器300,時域中的音頻信號被轉(zhuǎn)換為頻域中具有整數(shù)的音頻頻譜信號(操作710)。
接著,通過定標(biāo)單元310定標(biāo)頻域中的音頻頻譜信號,使得它可以被匹配輸入到有損編碼單元320中(操作720)。接著,通過有損編碼單元320來有損編碼該已定標(biāo)的音頻頻譜信號(操作730)。AAC核心編碼器優(yōu)選地用于該已定標(biāo)的音頻頻譜信號的有損編碼。
接著,誤差映射器330獲得為在有損編碼的信號和頻域中具有整數(shù)的音頻頻譜信號之間的差別的誤差映射信號(操作740)。接著,無損編碼單元340利用上下文來無損編碼該誤差映射信號(操作750)。
然后,多路復(fù)用器350多路復(fù)用由無損編碼單元340生成的無損編碼的信號和由有損編碼單元320生成的有損編碼的信號,以便產(chǎn)生位流(操作760)。
在操作750中,誤差映射信號根據(jù)其頻率被映射為位平面信號,接著,執(zhí)行與圖6的操作610到650相同的操作。
圖8說明了用于計(jì)算要編碼的樣本的上下文而從位平面中選擇的樣本的范圍,該位平面包括將要編碼的樣本。由虛線指明的部分表示可用于計(jì)算要編碼的樣本的概率分布的樣本。
通常,執(zhí)行MDCT造成在頻率軸上的相鄰樣本之間產(chǎn)生相關(guān)性(correlation)的頻譜泄露。換句話說,如果相鄰樣本的值為X,很有可能當(dāng)前樣本的值近似為X。因此,當(dāng)為了上下文的計(jì)算而選擇相鄰的樣本時,有可能利用其間的相關(guān)性來提高壓縮率。
統(tǒng)計(jì)揭露出上部位平面值與較低樣本的分布緊密相關(guān)。因此,當(dāng)為了上下文的計(jì)算而選擇相鄰的樣本時,有可能利用其間的相關(guān)性來提高壓縮率。
現(xiàn)在將描述上下文的計(jì)算。在包括用于編碼的所選擇的樣本的同樣的位平面上存在的已經(jīng)編碼的樣本可以用于上下文的計(jì)算。存在利用已經(jīng)編碼的樣本來計(jì)算上下文的各種各樣的方法。以下將描述代表性的方法。
在第一種方法中,在同樣的位平面上的具有預(yù)定長度的已經(jīng)編碼的二元樣本的值被改變成將被用作上下文的標(biāo)量值。假定四個已經(jīng)編碼的二元樣本被用于上下文的計(jì)算。如果四個二元樣本表示0100的值,則0100被認(rèn)為是二進(jìn)制數(shù)字,即0100(2),并且0100(2)表示4,上下文的值被確定為4。在這種情況中,很有可能當(dāng)前樣本具有1的值。在某些情況中,考慮到模型的大小而限制上下文值的范圍。通常,上下文值具有從8到16的范圍。
在第二種方法中,在同樣的位平面上存在的1的數(shù)目被計(jì)算,并且已經(jīng)編碼的樣本會具有值1的概率被計(jì)算。接著,通過以整數(shù)N乘以已經(jīng)編碼的樣本會具有值1的概率,來獲得整數(shù)值。如果獲得的整數(shù)是0,則已經(jīng)編碼的樣本沒有具有值1的。在這種情況中,要被編碼的樣本很有可能具有值1。如果獲得的整數(shù)近似于整數(shù)N,則大多數(shù)已經(jīng)編碼的樣本具有值1,因此,要被編碼的樣本很有可能具有值0。在某些情況中,考慮到模型的大小而限制上下文值的范圍。通常,上下文值具有從8到16的范圍。
以同樣頻率的上部位平面樣本,其中存在要被編碼的樣本,可以用于上下文計(jì)算。存在利用已經(jīng)編碼的樣本來計(jì)算上下文的各種各樣的方法。以下將描述代表性的方法。
在第一種方法中,已經(jīng)編碼的上部位平面值被用于上下文計(jì)算。如果上部位平面樣本表示0110的值,則0100被認(rèn)為是二進(jìn)制數(shù)字,即,0110(2),且0110(2)表示6,上下文的值被確定為6。在某些情況中,考慮到模型的大小而限制上下文值的范圍。通常,上下文值具有從8到16的范圍。
在第二種方法中,關(guān)于已經(jīng)編碼的上部位平面值是否存在的信息被用于上下文計(jì)算。當(dāng)至少一個上部位平面值為1時,上下文值被確定為1,否則被確定為0。也就是說,如果MSB還沒有被編碼,則很有可能要被編碼的當(dāng)前樣本具有值1。
假定第三位平面的第四樣本將被編碼,則第四樣本具有值0,Golomb參數(shù)為4。在同樣的位平面上存在的樣本的上下文將會被計(jì)算。
在相同的位平面上獲得上下文的第一種方法被使用。第一,根據(jù)第一種方法,樣本表示二進(jìn)制值001(2),因此,上下文值(context1)為1。第二,在同樣的頻率處的樣本表示二進(jìn)制值10(2),因此,它們的上下文值(context2)為2。
因此,利用以上三個參數(shù)來選擇概率模型,例如具有值4的Golomb參數(shù)、上下文值1和上下文值2。概率模型可以被表示為代表三維排列的Prob[Golomb][Context1][Context2]。
接著,利用概率模型來無損編碼音頻信號。算術(shù)編碼(arithmeticencoding)可以被用于無損編碼音頻信號。
現(xiàn)在將描述一種根據(jù)本發(fā)明的無損音頻解碼裝置和方法。圖9是根據(jù)本發(fā)明的一個實(shí)施例的無損音頻解碼裝置的方框圖。圖9的裝置包括參數(shù)獲得單元900、樣本選擇器910、上下文計(jì)算單元920、概率模型選擇器930和算術(shù)解碼器940。
當(dāng)音頻數(shù)據(jù)的位流被輸入到參數(shù)獲得單元900時,參數(shù)獲得單元900從位流中獲得MSB和Golomb參數(shù)。樣本選擇器910以從MSB到LSB和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本。
上下文計(jì)算單元920利用已經(jīng)解碼的樣本來計(jì)算預(yù)定的上下文值。如在圖10中示出的,上下文計(jì)算單元920包括第一上下文計(jì)算器1000和第二上下文計(jì)算器1020。第一上下文計(jì)算器1000利用在包括所選擇的二元樣本的位平面上存在的已經(jīng)解碼的樣本,來計(jì)算第一上下文。第二上下文計(jì)算器1020利用其中所選擇的二元樣本所位于的以同樣頻率已經(jīng)解碼的上部位平面樣本,來計(jì)算第二上下文。
概率模型選擇器930利用由參數(shù)獲得單元900獲得的Golomb參數(shù)和由上下文計(jì)算器920計(jì)算的上下文來選擇概率模型。算術(shù)解碼器940利用概率模型來在算術(shù)上解碼所選擇的二元樣本。
圖11是根據(jù)本發(fā)明的另一個實(shí)施例的無損音頻解碼裝置的方框圖。圖11的裝置包括多路分配器1100、有損解碼單元1110、無損解碼單元1120、音頻信號合成單元1130和反向整數(shù)時間頻率轉(zhuǎn)換器1140。該裝置最好進(jìn)一步包括反向時間頻率轉(zhuǎn)換器1150。
當(dāng)音頻位流被輸入到多路分配器1100中時,多路分配器1100多路分配音頻位流,來提取(extract)當(dāng)利用預(yù)定的有損編碼方法編碼位流時生成的有損位流和誤差數(shù)據(jù)的誤差位流。
有損解碼單元1110利用相應(yīng)于編碼位流所采用的有損編碼方法的有損解碼方法來有損解碼有損位流。無損解碼單元1120利用相應(yīng)于編碼位流所采用的無損編碼方法的無損解碼方法來無損解碼由多路分配器1100提取的誤差位流。
音頻信號合成單元1130合成解碼的有損位流和誤差位流,以獲得原始的頻率頻譜信號。反向整數(shù)時間頻率轉(zhuǎn)換器1140對頻率頻譜信號執(zhí)行反向整數(shù)時間頻率的變換,以獲得時域中的原始音頻信號。
同樣,反向時間頻率轉(zhuǎn)換器1150將由有損解碼單元1110生成的頻域中的音頻信號恢復(fù)為時域中的原始音頻信號。通過有損解碼來獲得所恢復(fù)的音頻信號。
圖12是圖11的無損解碼單元1120的詳細(xì)方框圖。無損解碼單元1120包括參數(shù)獲得單元1200、樣本選擇器1210、上下文計(jì)算單元1220、概率模型選擇器1230和算術(shù)解碼器1240。
參數(shù)獲得單元1200從音頻位流中獲得MSB和Golomb參數(shù)。樣本選擇器1210以從MSB到LSB和從最低頻率分量到最高頻率分量的順序,來選擇要被解碼的二元樣本。
上下文計(jì)算單元1220利用已經(jīng)解碼的樣本來計(jì)算預(yù)定的上下文。上下文計(jì)算單元1220包括第一上下文計(jì)算器(未示出)和第二上下文計(jì)算器(未示出)。第一上下文計(jì)算器利用在包括所選擇的二元樣本的同樣的位平面上存在的先前解碼的樣本,來計(jì)算第一上下文。第二上下文計(jì)算器利用其中所選擇的二元樣本存在的以同樣頻率已經(jīng)解碼的上部位平面樣本,來計(jì)算第二上下文。
概率模型選擇器1230利用Golomb參數(shù)以及第一和第二上下文值來選擇概率模型。算術(shù)解碼器1240利用概率模型來算術(shù)解碼所選的二元樣本。
圖13是根據(jù)本發(fā)明的一個實(shí)施例的圖9的無損音頻解碼裝置的操作的流程圖。參考圖13,當(dāng)音頻數(shù)據(jù)的位流被輸入到參數(shù)獲得單元900時,從位流中獲得Golomb參數(shù)(操作1300)。接著,樣本選擇器910以從MSB到LSB和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本(操作1310)。
在選擇了二元樣本后,上下文計(jì)算器920利用已經(jīng)解碼的樣本來計(jì)算預(yù)定的上下文(操作1320)。在此,預(yù)定的上下文包括第一上下文和第二上下文。利用在包括所選擇的二元樣本的同樣的位平面上存在的已經(jīng)解碼的樣本,由圖10的第一上下文計(jì)算器1000來計(jì)算第一上下文。利用其中所選擇的二元樣本所位于的以同樣頻率已經(jīng)解碼的上部位平面樣本,由圖10的第二上下文計(jì)算器1020來計(jì)算第二上下文。
接著,概率模型選擇器930利用Golomb參數(shù)以及第一和第二上下文來選擇概率模型(操作1330)。然后,利用概率模型來算術(shù)解碼所選擇的二元樣本(操作1340)。重復(fù)進(jìn)行操作1310到1340,直到所有選擇到位平面的二元樣本被解碼為止(操作1350)。
圖14是根據(jù)本發(fā)明的一個實(shí)施例的圖11的無損音頻解碼裝置的操作的流程圖。在這個實(shí)施例中,在有損編碼的音頻數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別被稱為是誤差數(shù)據(jù)。參考圖14,當(dāng)音頻位流被輸入到多路分配器1100中時,多路分配位流以便提取利用預(yù)定的有損編碼方法生成的有損位流和誤差數(shù)據(jù)的誤差位流(操作1400)。
接著,所提取的有損位流被輸入到有損解碼單元1110,并由有損解碼單元1110利用相應(yīng)于編碼位流所采用的有損編碼方法的預(yù)定有損解碼,來進(jìn)行有損解碼(操作1410)。同樣,所提取的誤差位流被輸入到無損解碼單元1120,并通過無損解碼單元1120來進(jìn)行無損解碼(操作1420)。操作1420與圖13中的操作相似,因此,這里將省略其詳細(xì)的描述。
接著,由有損解碼單元1110生成的有損位流和由無損解碼單元1120生成的誤差位流被輸入到音頻信號合成單元1130,以便來恢復(fù)原始頻率頻譜信號(操作1430)。頻率頻譜信號被輸入到反向整數(shù)時間頻率轉(zhuǎn)換器1140來恢復(fù)時域中的原始音頻信號(操作1440)。
本發(fā)明可以被具體化為在計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)可讀代碼。在此,計(jì)算機(jī)可以是能夠處理信息的任意裝置。同樣,計(jì)算機(jī)可讀介質(zhì)可以是能夠存儲由計(jì)算機(jī)系統(tǒng)讀取的數(shù)據(jù)的任意記錄裝置,例如只讀存儲器(ROM)、隨機(jī)存取存儲器(RAM)、壓縮光盤(CD)-ROM、磁帶、軟盤、光學(xué)數(shù)據(jù)存儲設(shè)備等。
根據(jù)本發(fā)明的無損音頻編碼/解碼方法和裝置能夠利用基于整數(shù)MDCT系數(shù)的統(tǒng)計(jì)分布而不是整數(shù)MDCT系數(shù)的實(shí)際上的分布的概率模型,以最佳的壓縮率來編碼/解碼音頻信號。也就是說,可以達(dá)到最佳的壓縮率而不管整數(shù)MDCT系數(shù)是否顯示出拉普拉斯分布。相應(yīng)的,可以利用基于上下文的編碼來以最佳的壓縮率壓縮音頻信號,比當(dāng)利用BPGC的時候要好。
以下的偽碼表示了根據(jù)本發(fā)明的一個實(shí)施例的使用無損編碼單元(算術(shù)編碼單元)的例子以及執(zhí)行無損音頻解碼的上下文模型。本發(fā)明可適用于MPEG-4音頻可伸縮無損音頻壓縮標(biāo)準(zhǔn)。
-用于依靠上下文的熵編碼的偽碼 while(there exists cur_bp[g][sfb]>=0){for(g=0;g<num_windows_group;g++){for(sfb=0;sfb<total_sfb;sfb++){if(cur_bp[g][sfb]>=0&&low_energy_mode_used?。?){width=swb_offset[g][sfb+1]?swb-offset[g][sfb];for(win=0;win<window_group-len[g];win++){for(bin=0;bin<width;bin++){if(!is_lle_ics_eof()){if(M[g][win][sfb][bin]>=cur_bp[g][sfb]){context1=Context1_Calculation();probVa1=model_select(context);res[g][win][sfb][bin]+=bpgc_decode(probVa1)<<cur_bp[g][sfb];/*decode bit-plane cur_bp*/if((!is_sig[g][win][sfb][bin])&&(res[g][win][sfb][bin])){res[g][win][sfb][bin]*=(bpgc_decode())?1-1;is_sig[g][win][sfb][bin]=1;}else{/* lossy mode*/if(is_sig[g][win][sfb][bin]){res[g][win][sfb][bin]+=res_fill;is_sig[g][win][sfb][bin]=0;}}}}<!-- SIPO <DP n="14"> --><dp n="d14"/>}cur_bp[g][sfb]--;/*progress to next bit-plane*/}}if(low_energy_mode_used){decode_low_energy_mode();}}} 雖然已經(jīng)參考本發(fā)明的示范性實(shí)施例特別顯示和描述了本發(fā)明,但是本技術(shù)領(lǐng)域技術(shù)人員可以理解,在不脫離由所附的權(quán)利要求定義的本發(fā)明的精神和范圍的前提下,這里可以在形式和細(xì)節(jié)上進(jìn)行各種各樣的變化。
權(quán)利要求
1、一種無損音頻編碼方法,包括
將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;
根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面信號;以及
利用根據(jù)預(yù)定的上下文確定的概率模型來無損編碼位平面的二元樣本。
2、根據(jù)權(quán)利要求1所述的無損音頻編碼方法,其中,二元樣本的無損編碼包括
根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面的數(shù)據(jù);
獲得最高有效位和用于每個位平面的golomb參數(shù);
以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要被編碼的二元樣本;
利用在包括所選二元樣本的相同的位平面上存在的先前編碼的樣本,來計(jì)算所選二元樣本的上下文;
利用所獲得的golomb參數(shù)和上下文來選擇概率模型;以及
利用概率模型來無損編碼二元樣本。
3、一種無損音頻編碼方法,包括
(a)將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;
(b)對頻域中的音頻頻譜信號進(jìn)行定標(biāo),使得其能被匹配來輸入到有損編碼單元;
(c)有損編碼已定標(biāo)的信號來獲得有損編碼的數(shù)據(jù);
(d)計(jì)算為在有損編碼的數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別的誤差映射信號;
(e)利用上下文來無損編碼誤差映射信號;以及
(f)多路復(fù)用該無損編碼的信號和有損編碼的信號,來產(chǎn)生位流。
4、根據(jù)權(quán)利要求3所述的無損音頻編碼方法,其中(e)包括
(e1)根據(jù)其頻率,將在(d)中獲得的誤差映射信號映射為位平面的數(shù)據(jù);
(e2)獲得最高有效位和位平面的golomb參數(shù);
(e3)以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要被編碼的二元樣本;
(e4)利用在包括所選擇的二元樣本的相同的位平面上存在的先前編碼的樣本,來計(jì)算所選擇的二元樣本的上下文;
(e5)利用golomb參數(shù)和上下文,來選擇概率模型;以及
(e6)利用概率模型,無損編碼所選擇的二元樣本。
5、根據(jù)權(quán)利要求4所述的無損音頻編碼方法,其中在(e4)中,獲得在包括所選擇的二元樣本的同樣的位平面上存在的先前編碼的樣本的標(biāo)量值,并且利用該標(biāo)量值來計(jì)算所選擇的二元樣本的上下文。
6、根據(jù)權(quán)利要求4所述的無損音頻編碼方法,其中在(e4)中,計(jì)算預(yù)定樣本將會具有值為1的概率,該概率被乘以預(yù)定的整數(shù)來獲得整數(shù)概率,并且利用該整數(shù)概率,來計(jì)算所選擇的二元樣本的上下文,所述預(yù)定樣本存在在包括所選擇的二元樣本的同樣的位平面上。
7、根據(jù)權(quán)利要求4所述的無損音頻編碼方法,其中在(e4)中,利用所選擇的二元樣本所位于的以同樣頻率已經(jīng)編碼的上部位平面值,來計(jì)算所選擇的二元樣本的上下文。
8、根據(jù)權(quán)利要求4所述的無損音頻編碼方法,其中在(e4)中,利用關(guān)于已經(jīng)以同樣頻率編碼的上部位平面值是否存在的信息,來計(jì)算所選擇的二元樣本的上下文,以及
當(dāng)至少一個上部位平面值為1時,確定上下文具有值1,以及否則就確定上下文具有值0。
9、一種無損音頻編碼裝置,包括
整數(shù)時間頻率轉(zhuǎn)換器,用于將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;以及
無損編碼單元,用于根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面的數(shù)據(jù),并利用預(yù)定的上下文來無損編碼位平面的二元樣本。
10、根據(jù)權(quán)利要求9所述的無損音頻編碼裝置,其中,所述無損編碼單元包括
位平面映射器,用于根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面的數(shù)據(jù);
參數(shù)獲得單元,用于獲得最高有效位和位平面的golomb參數(shù);
二元樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇二元樣本;
上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上的先前編碼的樣本,來計(jì)算所選擇的二元樣本的上下文;
概率模型選擇器,用于利用golomb參數(shù)和所計(jì)算的上下文,來選擇概率模型;以及
二元樣本編碼器,用于利用概率模型,來無損編碼所選擇的二元樣本。
11、根據(jù)權(quán)利要求9所述的無損音頻編碼裝置,其中,所述整數(shù)時間頻率轉(zhuǎn)換器執(zhí)行整數(shù)改進(jìn)型離散余弦變換。
12、一種無損音頻編碼裝置,包括
整數(shù)時間頻率轉(zhuǎn)換器,用于將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;
定標(biāo)單元,用于定標(biāo)音頻頻譜信號,使得音頻頻譜信號能被匹配輸入到有損編碼單元;
有損編碼單元,用于有損編碼已定標(biāo)的信號;
誤差映射器,用于計(jì)算為在有損編碼的信號和通過整數(shù)時間頻率轉(zhuǎn)換器生成的音頻頻譜信號之間的差別的誤差映射信號;
無損編碼單元,用于利用上下文,無損編碼誤差映射信號;以及
多路復(fù)用器,用于多路復(fù)用有損編碼的信號和無損編碼的信號,來產(chǎn)生位流。
13、根據(jù)權(quán)利要求12所述的裝置,其中,所述無損編碼單元包括
位平面映射器,用于根據(jù)其頻率,將誤差映射信號映射為位平面的數(shù)據(jù);
參數(shù)獲得單元,用于獲得最高有效位和位平面的golomb參數(shù);
二元樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇二元樣本;
上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上存在的先前編碼的樣本,來計(jì)算所選擇的二元樣本的上下文;
概率模型選擇器,用于利用golomb參數(shù)和所計(jì)算的上下文,來選擇概率模型;以及
二元樣本編碼器,用于利用概率模型,無損編碼所選擇的二元樣本。
14、根據(jù)權(quán)利要求13所述的裝置,其中,所述上下文計(jì)算器通過獲得先前編碼的樣本的標(biāo)量值,來計(jì)算所選擇的二元樣本的上下文。
15、根據(jù)權(quán)利要求13所述的裝置,其中,所述上下文計(jì)算器通過計(jì)算在同樣的位平面上的預(yù)定樣本具有值為1的概率來計(jì)算所選擇的二元樣本的上下文,將該概率乘以預(yù)定的整數(shù)來獲得整數(shù)概率,以及利用該整數(shù)概率來計(jì)算上下文。
16、根據(jù)權(quán)利要求13所述的裝置,其中,所述上下文計(jì)算器利用所選擇的二元樣本所位于的已經(jīng)以同樣的頻率編碼的上部位平面值,來計(jì)算所選擇的二元樣本的上下文。
17、根據(jù)權(quán)利要求13所述的裝置,其中,所述上下文計(jì)算器利用關(guān)于所選擇的二元樣本所位于的已經(jīng)以同樣的頻率編碼的上部位平面值是否存在的信息,來計(jì)算所選擇的二元樣本的上下文,以及
當(dāng)至少一個上部位平面值為1時,確定上下文具有值1,否則確定上下文具有值0。
18、一種無損音頻解碼方法,包括
從音頻數(shù)據(jù)中獲得golomb參數(shù);
以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,從位平面中選擇要被解碼的二元樣本;
利用已經(jīng)解碼的樣本來計(jì)算預(yù)定的上下文;
利用golomb參數(shù)和上下文來選擇概率模型;
利用概率模型來算術(shù)解碼所選擇的二元樣本;以及
重復(fù)執(zhí)行二元樣本的選擇、預(yù)定上下文的計(jì)算、概率模型的選擇和所選擇的二元樣本的算術(shù)解碼,直到所有所選擇的二元樣本被解碼為止。
19、根據(jù)權(quán)利要求18所述的無損音頻解碼方法,其中,預(yù)定上下文的計(jì)算包括
利用在包括所選擇的二元樣本的同樣的位平面上存在的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及
利用所選擇的二元樣本所位于的已經(jīng)以同樣的頻率解碼的上部位平面樣本,來計(jì)算第二上下文。
20、一種無損音頻解碼方法,包括
(aa)通過多路分配音頻位流,來從誤差數(shù)據(jù)中提取有損編碼的預(yù)定有損位流和誤差位流,該誤差數(shù)據(jù)相應(yīng)于在有損編碼的音頻數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別;
(bb)有損解碼所提取的已編碼有損位流;
(cc)無損解碼所提取的誤差位流;
(dd)利用所解碼的有損位流和誤差位流,來恢復(fù)原始的音頻頻率頻譜信號;以及
(ee)通過對音頻頻譜信號執(zhí)行反向整數(shù)時間頻率變換,來恢復(fù)時域中的原始音頻信號。
21、根據(jù)權(quán)利要求20所述的無損音頻解碼方法,其中,(cc)包括
(cc1)從音頻數(shù)據(jù)的位流中獲得golomb參數(shù);
(cc2)以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本;
(cc3)利用已經(jīng)解碼的樣本,來計(jì)算預(yù)定的上下文;
(cc4)利用golomb參數(shù)和上下文,來選擇概率模型;
(cc5)利用概率模型,來算術(shù)解碼所選擇的二元樣本;以及
(cc6)重復(fù)進(jìn)行(cc2)到(cc5),直到所有位平面的樣本被解碼為止。
22、根據(jù)權(quán)利要求21所述的無損音頻解碼方法,其中,(cc3)包括利用在包括所選擇的二元樣本的同樣的位平面上的已經(jīng)解碼的樣本,來計(jì)算第一上下文。
23、根據(jù)權(quán)利要求21所述的無損音頻解碼方法,其中,(cc3)包括利用所選擇的二元樣本所位于的已經(jīng)以同樣頻率解碼的上部位平面樣本,來計(jì)算第二上下文。
24、根據(jù)權(quán)利要求21所述的無損音頻解碼方法,其中,(cc3)包括
利用在包括所選擇的二元樣本的同樣的位平面上的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及
利用所選擇的二元樣本所位于的已經(jīng)以同樣頻率解碼的上部位平面樣本,來計(jì)算第二上下文。
25、一種無損音頻解碼裝置,包括
參數(shù)獲得單元,用于從音頻數(shù)據(jù)的位流中獲得golomb參數(shù);
樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本;
上下文計(jì)算單元,用于利用已經(jīng)解碼的樣本,來計(jì)算預(yù)定的上下文;
概率模型選擇器,用于利用golomb參數(shù)和上下文,來選擇概率模型;以及
算術(shù)解碼器,用于利用概率模型,來算術(shù)解碼所選擇的二元樣本。
26、根據(jù)權(quán)利要求25所述的無損音頻解碼裝置,其中,所述上下文計(jì)算單元包括
第一上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上存在的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及
第二上下文計(jì)算器,用于利用所選擇的二元樣本所位于的已經(jīng)以同樣頻率解碼的上部位平面樣本,來計(jì)算第二上下文。
27、一種無損音頻解碼裝置,包括
多路分配器,用于多路分配音頻位流來從誤差數(shù)據(jù)中提取有損編碼的預(yù)定有損位流和誤差位流,該誤差數(shù)據(jù)對應(yīng)于在有損編碼的音頻數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別;
有損解碼單元,用于有損編碼所提取的有損位流;
無損解碼單元,用于無損解碼所提取的誤差位流;
音頻信號合成單元,用于合成所解碼的有損位流和誤差位流來恢復(fù)音頻頻率頻譜信號;以及
反向整數(shù)時間頻率轉(zhuǎn)換器,用于對所恢復(fù)的音頻頻率頻譜信號執(zhí)行反向整數(shù)時間頻率變換,以恢復(fù)時域中的原始音頻信號。
28、根據(jù)權(quán)利要求27所述的無損音頻解碼裝置,其中,所述有損解碼單元是ACC解碼器。
29、根據(jù)權(quán)利要求27所述的無損音頻解碼裝置,還包括反向時間頻率轉(zhuǎn)換器,用于將通過有損解碼單元解碼的有損位流恢復(fù)為時域中的音頻信號。
30、根據(jù)權(quán)利要求27所述的無損音頻解碼裝置,其中,所述有損解碼單元包括
參數(shù)獲得單元,用于從音頻數(shù)據(jù)的位流中獲得golomb參數(shù);
樣本選擇器,用于以從最高有效位到最低有效位和從最低頻率分量到最高頻率分量的順序,選擇要被解碼的二元樣本;
上下文計(jì)算單元,用于利用已經(jīng)解碼的樣本,來計(jì)算預(yù)定的上下文;
概率模型選擇器,用于利用golomb參數(shù)和上下文,來選擇概率模型;和
算術(shù)解碼器,用于利用概率模型,來算術(shù)解碼所選擇的二元樣本。
31、根據(jù)權(quán)利要求30所述的無損音頻解碼裝置,其中,所述上下文計(jì)算單元包括
第一上下文計(jì)算器,用于利用在包括所選擇的二元樣本的同樣的位平面上存在的已經(jīng)解碼的樣本,來計(jì)算第一上下文;以及
第二上下文計(jì)算器,用于利用所選擇的二元樣本所位于的已經(jīng)以同樣頻率解碼的上部位平面樣本,來計(jì)算第二上下文。
全文摘要
本發(fā)明提供了一種無損音頻編碼/解碼方法和裝置。無損音頻編碼方法包括將時域中的音頻信號轉(zhuǎn)換為頻域中的具有整數(shù)的音頻頻譜信號;根據(jù)其頻率,將頻域中的音頻頻譜信號映射為位平面信號;和利用根據(jù)預(yù)定上下文確定的概率模型來無損編碼位平面的二元樣本。無損音頻解碼方法包括通過多路分配音頻位流,從誤差數(shù)據(jù)中提取有損編碼的預(yù)定有損位流和誤差位流,該誤差數(shù)據(jù)相應(yīng)于在有損編碼的音頻數(shù)據(jù)和頻域中具有整數(shù)的音頻頻譜信號之間的差別;有損解碼所提取的編碼有損位流;無損解碼所提取的誤差位流;利用所解碼的有損位流和誤差位流,恢復(fù)原始的音頻頻率頻譜信號;和通過對音頻頻譜信號執(zhí)行反向整數(shù)時間頻率變換,恢復(fù)時域中的原始音頻信號。
文檔編號G10L19/02GK1684371SQ20051007178
公開日2005年10月19日 申請日期2005年2月28日 優(yōu)先權(quán)日2004年2月27日
發(fā)明者金重會, 苗磊, 李時和, 金尚煜, 吳殷美, 金度亨 申請人:三星電子株式會社