運動圖像專家組音頻編碼方法及裝置的制作方法

文檔序號：2821469閱讀：216來源：國知局

專利名稱：運動圖像專家組音頻編碼方法及裝置的制作方法
技術領域：
本發(fā)明涉及數(shù)字音頻數(shù)據(jù)的壓縮，尤其涉及運動圖像專家組(MPEG)音頻編碼方法以及MPEG音頻編碼裝置。
背景技術：
MPEG音頻是用于國際標準化組織/國際電工委員會(ISO/IEC)的高質(zhì)量、高效率立體聲編碼的標準方法，也就是說，與運動圖像編碼平行，在ISO/IEC小組29/工作組11(SC 29/WG 11)的MPEG中，MPEG音頻被標準化。當壓縮時，使用基于32個頻帶的子帶編碼(頻帶分割編碼)和改進的離散余弦變換(MDCT)，并且通過使用心理聲學特性，獲得高效率的壓縮。利用該新技術，MPEG語音能實現(xiàn)比現(xiàn)有技術的壓縮編碼方法更高的聲音質(zhì)量。
MPEG音頻使用感知編碼方法，其中，為了以高效率壓縮音頻信號，通過采用人類的感知特性來忽略具有較低敏感性的細節(jié)信息，以減小編碼量。
而且，在MPEG音頻中使用心理聲學特性的感知編碼方法采用在無聲環(huán)境下的最小可聽界限(minimum audible limit)和掩蔽特性(maskingcharacteristic)。無聲環(huán)境下的最小可聽界限是可由人耳聽見的最小級別的聲音，并且涉及人耳可以聽到的無聲環(huán)境中的噪聲限制。無聲環(huán)境下的最小可聽界限相對于聲音頻率而變化。在某一頻率中，可以聽見大于無聲環(huán)境下的最小可聽界限的聲音，而小于該界限的聲音不能被聽見。而且，通過一起收聽的另一聲音，預定聲音的可聽界限大大改變，這被稱為“掩蔽效應(maskingeffect)”。其中發(fā)生掩蔽效應的頻率寬度被稱為“臨界頻帶”。為了有效地使用諸如這種臨界頻帶的聲音心理學，首先由頻率分割信號是很重要的，為此，頻帶被分成32個頻帶，并執(zhí)行子帶編碼。同時，在這時候，采用稱為“多相位濾波器組”的濾波器來消除MPEG音頻中的32個頻帶的混淆噪聲(aliasingnoise)。
因而，MPEG音頻包括使用濾波器組和心理聲學模型的位分配以及量化。通過使用心理聲學模型2、生成作為執(zhí)行MDCT的結果的MDCT系數(shù)被壓縮，同時分配最優(yōu)量化位。為了分配最優(yōu)位，心理聲學模型2基于快速傅立葉變換(FFT)，并通過使用擴展函數(shù)計算掩蔽效應，從而需要大量的計算復雜性。
圖1是示出MPEG-1第三層中的傳統(tǒng)編碼過程的流程圖。
首先，如果在步驟S110中接收1152個采樣的輸入PCM信號，則在步驟S120中，這些信號通過濾波器組，且信號中的噪聲被消除。然后，這些信號被輸入到MDCT步驟。
而且，對于接收到這些輸入信號，在步驟S130中執(zhí)行心理聲學模型2，其中在步驟S140中計算信噪比(SNR)，在步驟S150中執(zhí)行預回聲消除，并且在步驟S160中計算每一子帶的信號掩蔽比(SMR)。
通過使用這樣計算的SMR值，在步驟S170中，對通過濾波器組的信號執(zhí)行MDCT。
然后，在步驟S180，對MDCT系數(shù)執(zhí)行量化，并且在步驟S190，通過利用量化結果，執(zhí)行MPEG-1第三層位流壓縮。
在圖2中示出圖1所示的心理聲學模型2的特定過程。
首先，如果從輸入緩沖器接收到576個采樣，則計算SNR。
首先，在步驟S141中對所接收信號執(zhí)行FFT。在步驟S142中，針對FFT結果的量值r(w)，根據(jù)下列公式1和2計算能量eb(b)和非預測性Cweb(b)＝∑r(w)2(1)Cw=(((r(w)cos(f(w)-rp(w)cos(fp(w))2+((r(w)sin(f(w)-rp(w)sin(fp(w))2)0.5r(w)+abs(rp(w))...(2)]]>這里，r(w)表示FFT的幅值，f(w)表示FFT的相位，rp(w)表示預測的幅值，而fp(w)表示預測的相位。
然后，在步驟S143，根據(jù)下面的公式3和4計算每一頻帶的能量e(b)和非預測性c(b)e(b)=Σbandlowbandhighr(w)2...(3)]]>C(b)=Σbandlowbandhighr(w)2×Cw...(4)]]>接著，在步驟S144，通過利用擴展函數(shù)，根據(jù)下列公式5和6計算每一頻帶的能量ec(b)和非預測性門限值ct(b)ec(b)=Σbandlowbandhighe(b)*spreadingfunc....(5)]]>
ct(b)=Σbandlowbandhighc(b)*spreadingfunc....(6)]]>接著，根據(jù)下列公式7計算音調(diào)指數(shù)(tonality index)tb(b)=-0.2999-0.43(ct(b)ec(b))...(7)]]>接著，在步驟S145，根據(jù)下列公式計算SNRSNR＝max(min val，tb(b)*TMN+(1-tb(b)NMT)(8)這里，minval表示在每一頻帶中的最小SNR值，TNM表示音調(diào)掩蔽噪聲，NMT表示噪聲掩蔽音調(diào)，SNR表示信噪比。
接著，在步驟S146中，計算感知能量。
然后，在步驟S151中，確定所計算的感知平均信息量(entropy)是否超過預定門限值。
如果確定結果指示感知平均信息量超過了預定門限值，則在步驟S153中，確定輸入的576采樣信號塊是短塊，而如果感知熵沒有超過預定門限值，則在步驟S152中，確定輸入的576采樣信號塊是長塊。
接著，當確定輸入塊是長塊時，如下計算63個頻帶每個的ratio_lratio_l＝ct(b)/eb(b)接著，當確定輸入塊是短塊時，43個頻帶的每個被分成三個部分，并且如下計算ratio_sratio_s＝ct(b)/eb(b)如上所述的傳統(tǒng)編碼處理對輸入的采樣執(zhí)行FFT，計算在頻域中的能量和非預測性，以及將擴展函數(shù)應用于每一頻帶，使得需要大量的計算。
心理聲學模型使得可以通過利用人耳的特性來使能音頻信號壓縮，并且在音頻壓縮中起到重要意義。然而，實現(xiàn)該模型需要大量計算。特別是，利用FFT的心理聲學模型的計算、非預測性和擴展函數(shù)需要大量的計算。
圖3A是示出MPEG-1第3層中的FFT計算的結果的圖，圖3B是示出執(zhí)行MPEG-1第3層中的長窗口MDCT的結果的圖。
參照圖3A和3B，雖然FFT結果和MDCT結果彼此不同，但是現(xiàn)有技術將在FFT域中的計算結果應用于MDCT，從而造成位浪費。

發(fā)明內(nèi)容
本發(fā)明提供MPEG音頻編碼方法、用于在編碼MPEG音頻時確定窗口類型的方法、在編碼MPEG音頻時的心理聲學建模方法、MPEG音頻編碼設備、用于在編碼MPEG音頻時確定窗口類型的設備、在MPEG音頻編碼系統(tǒng)中的心理聲學模型設備，通過上述設備和方法，可以降低計算的復雜度，以及可以防止位的浪費。
根據(jù)本發(fā)明的一個方面，提供一種運動圖像專家組(MPEG)音頻編碼方法，包括(a)在時域中對輸入音頻信號執(zhí)行改進的離散余弦變換(MDCT)；(b)使用執(zhí)行MDCT的MDCT系數(shù)作為輸入，執(zhí)行心理聲學模型；和(c)通過使用執(zhí)行心理聲學模型的結果來執(zhí)行量化，并壓縮位流。
根據(jù)本發(fā)明的另一方面，提供一種MPEG音頻編碼方法，包括(a)通過使用在幀中的信號的能量差和不同幀的信號的能量差在時域中確定輸入音頻信號的幀的窗口類型；(b)通過在時域中對輸入音頻信號執(zhí)行MDCT所獲得的MDCT系數(shù)，根據(jù)掩蔽前(pre-masking)參數(shù)和掩蔽后(post-masking)參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)的后向掩蔽的代表值；以及(c)通過使用執(zhí)行心理聲學模型的結果來執(zhí)行量化，并壓縮位流。
仍根據(jù)本發(fā)明的另一方面，提供一種在編碼MPEG音頻時的窗口類型確定方法，包括(a)在時域中接收輸入音頻信號，并將其變換成絕對值；(b)將被變換成絕對值的信號分成預定數(shù)量的頻帶，并對于每一頻帶，計算頻帶和，所述頻帶和是屬于一個頻帶的信號的和；(c)通過使用頻帶之間的頻帶和差來執(zhí)行第一窗口類型確定；(d)計算幀和，所述幀和是被變換成絕對值的全部信號的和，并通過使用在前一幀和與當前幀和之間的差來執(zhí)行第二窗口類型確定；以及(e)通過組合執(zhí)行第一窗口類型確定的結果和執(zhí)行第二窗口類型確定的結果來確定窗口類型。
還根據(jù)本發(fā)明的另一方面，提供一種在編碼MPEG音頻時的基于參數(shù)的心理聲學模型方法，包括(a)接收通過對輸入音頻信號執(zhí)行MDCT所獲得的MDCT系數(shù)，并將其變換成絕對值；(b)通過使用所變換的絕對值信號來計算主掩蔽參數(shù)；(c)通過使用所變換的絕對值信號來計算每一頻帶的每一信號的量值，以及通過使用所變換的絕對值信號和主掩蔽參數(shù)來計算主掩蔽的量值；(d)通過將掩蔽前參數(shù)和掩蔽后參數(shù)應用于每一頻帶的量值來計算頻帶的量值，以及通過將所述掩蔽前參數(shù)和掩蔽后參數(shù)應用于主掩蔽的量值來計算主掩蔽門限值，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)是后向掩蔽的代表值；和(e)計算每一頻帶的所計算的量值對所計算的主掩蔽門限值的比。
根據(jù)本發(fā)明的再一方面，提供一種MPEG音頻編碼設備，包括改進離散余弦變換(MDCT)單元，用于在時域中對輸入音頻信號執(zhí)行MDCT以生成MDCT系數(shù)；心理聲學模型執(zhí)行單元，用于基于MDCT系數(shù)來執(zhí)行心理聲學模型；量化單元，用于基于心理聲學模型的結果來執(zhí)行量化；和壓縮單元，用于將所述量化單元的量化結果壓縮成位流。
根據(jù)本發(fā)明的再一方面，提供一種MPEG音頻編碼設備，包括窗口類型確定單元，用于根據(jù)在幀中的信號的能量差和不同幀的信號的能量差來確定時域中的輸入音頻信號的幀的窗口類型；心理聲學模型執(zhí)行單元，對于通過在時域中對輸入音頻信號執(zhí)行改進的離散余弦變換(MDCT)所獲得的MDCT系數(shù)，根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)的后向掩蔽的代表值；以及量化單元，用于基于執(zhí)行心理聲學模型的結果來執(zhí)行量化；和壓縮單元，用于將量化單元的量化結果壓縮成位流。
根據(jù)本發(fā)明的再一方面，提供一種在編碼MPEG音頻時的窗口類型確定設備，包括絕對值變換單元，用于接收包括在時域中的多個采樣的輸入音頻信號，并將所述采樣變換成絕對值；頻帶和計算單元，用于將被變換成絕對值的采樣分成形成幀的預定數(shù)量的頻帶，并對于每一頻帶，計算頻帶和，所述頻帶和是屬于頻帶的絕對值的和；第一窗口類型確定單元，用于基于相鄰頻帶的頻帶和之間的差來執(zhí)行第一窗口類型確定；第二窗口類型確定單元，用于計算幀和，所述幀和是幀的所有絕對值之和，并根據(jù)在前幀和與當前幀和之間的差來執(zhí)行第二窗口類型確定；和乘法單元，用于通過組合執(zhí)行第一窗口類型確定的結果和執(zhí)行第二窗口類型確定的結果來確定窗口類型。
根據(jù)本發(fā)明的另一方面，提供一種在MPEG音頻編碼系統(tǒng)中的心理聲學模型設備，所述設備包括絕對值變換單元，用于接收通過對具有多個頻帶的輸入音頻信號執(zhí)行改進離散余弦變換(MDCT)所獲得的MDCT系數(shù)，并將所述MDCT系數(shù)變換成絕對值；主掩蔽計算單元，用于基于所述絕對值計算主掩蔽參數(shù)；第一計算單元，用于根據(jù)每一頻帶的相應絕對值來計算每一頻帶的第一量值，以及根據(jù)每一頻帶的相應絕對值和主掩蔽參數(shù)來計算每一頻帶的主掩蔽的量值；第二計算單元，用于通過將掩蔽前參數(shù)和掩蔽后參數(shù)應用于每一頻帶的第一量值來計算頻帶的第二量值，以及通過將所述掩蔽前參數(shù)和掩蔽后參數(shù)應用于主掩蔽的量值來計算主掩蔽門限值，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)是后向掩蔽的代表值；和比值計算單元，用于計算每一頻帶的第二量值對每一頻帶的主掩蔽門限值的比。
為了減少在編碼MPEG音頻時的位浪費和計算量，本發(fā)明旨在不對MDCT使用在FFT域中心理聲學模型的計算結果，而采用通過使用MDCT系數(shù)的心理聲學模型。通過這樣做，由于在FFT域和MDCT域之間的差異所造成的位浪費可以被減少，并且通過將擴展函數(shù)簡化成兩個參數(shù)，掩蔽后和掩蔽前參數(shù)可以減少復雜度，同時可以保持相同的性能。

圖1是示出MPEG-1第3層中的傳統(tǒng)編碼處理的流程圖；圖2是示出在圖1中所示的心理聲學模型2的特定處理的流程圖；圖3A是示出在MPEG-1第3層中的FFT計算的結果的圖；圖3B是示出在MPEG-1第3層中執(zhí)行長窗口MDCT的結果的圖；圖4是示出根據(jù)本發(fā)明的MPEG-1第3層中的編碼處理的示例的流程圖；圖5是示出根據(jù)本發(fā)明的在編碼處理中輸入的信號的結構的圖；圖6是圖4所示的確定窗口類型的過程的詳細流程圖；圖7A是示出在確定窗口類型中使用的原始信號的結構的圖；圖7B是示出通過相加如圖7A中所示的原始信號的每一頻帶中的值而獲得的頻帶值；圖7C是示出通過在每一幀中相加如圖7B所示的頻帶值而獲得的值的圖；圖8是圖4中所示的MDCT和基于參數(shù)的心理聲學模型處理的詳細流程圖；圖9A是示出在執(zhí)行心理聲學模型的處理中所使用的MDCT系數(shù)值的結構的圖；圖9B是示出將圖9A中所示的值轉換成絕對值的結果的圖；圖9C是用于說明應用于每一頻帶的掩蔽前和掩蔽后的圖；圖10是示出圖6所示的執(zhí)行窗口類型確定的窗口類型確定單元的詳細結構的方框圖；圖11是示出圖10中所示的信號預處理單元的詳細結構的方框圖；
圖12是示出執(zhí)行圖8中所示的MDCT和基于參數(shù)的心理聲學模型處理的心理聲學模型執(zhí)行單元的詳細結構的圖；圖13是示出圖12中所示的信號預處理單元的結構的圖；圖14A是在圖12所示的掩蔽前/掩蔽后表中的短窗口掩蔽表；和圖14B是在圖13所示的掩蔽前/掩蔽后表中的長窗口掩蔽表。
具體實施例方式
圖4是示出根據(jù)本發(fā)明的在MPEG-1第3層中的編碼處理400的示例的流程圖。
首先，在步驟S410，接收到包括1152個采樣的輸入PCT信號。
在圖5中示出在MPEG編碼中使用的輸入信號的結構。輸入信號包括兩個通道，通道0和通道1，每一通道包括1152個采樣。在實際執(zhí)行編碼時處理的單元被稱為顆粒(granule)且包括576個采樣。下文中，包括576個采樣的輸入信號的單元將被稱為幀。
接著，在步驟S420，為接收的原始信號的每一幀確定幀的窗口類型。與通過利用對原始信號執(zhí)行FFT的結果來確定窗口類型的現(xiàn)有技術不同，本發(fā)明在時域中確定原始信號的窗口類型。通過利用未執(zhí)行FFT的原始信號來確定窗口類型，本發(fā)明與現(xiàn)有技術相比可以極大地減少計算量。
而且，在步驟S430中，所接收的原始信號通過濾波器組被發(fā)送以消除在該信號中的噪聲，以及在步驟S440中，對通過濾波器組的信號執(zhí)行MDCT。
然后，在步驟S450，根據(jù)執(zhí)行MDCT的MDCT系數(shù)和窗口類型的確定結果來執(zhí)行基于參數(shù)的心理聲學模型處理。和其中為通過執(zhí)行心理聲學模型2所獲得的數(shù)據(jù)執(zhí)行MDCT的傳統(tǒng)編碼處理不同，在本發(fā)明中，首先執(zhí)行MDCT，然后對所變換的MDCT系數(shù)值執(zhí)行改進的心理聲學模型。如上所述，由于在FFT結果和MDCT結果之間存在差異，所以在本發(fā)明中，不使用FFT結果，而將心理聲學模型應用于MDCT結果，使得可以完全執(zhí)行編碼而不浪費位。
接著，在步驟S460，通過使用執(zhí)行心理聲學模型的結果，執(zhí)行量化，以及在步驟S470，對被量化的值執(zhí)行MPEG-1第3層位流壓縮。
圖6是圖4所示的確定窗口類型的處理的詳細流程圖。
首先，如果在步驟S610中接收到原始輸入信號，則在步驟S620中，每一原始信號被變換成絕對值。
圖7A示出被變換成絕對值的原始信號。在圖7A中，示出兩個幀，并且每個幀包括576個采樣。
然后，在步驟S630，根據(jù)時間排列的信號被分成頻帶，并且計算在每一頻帶中的信號的和。例如，如圖7A所示，一個幀被分成9個頻帶，并且如圖7B所示，總計在每一頻帶中的信號。
接著，在步驟S640，通過使用該頻帶信號，執(zhí)行窗口類型確定1。
確定是(前一頻帶＞當前頻帶*因子)，還是(當前頻帶＞前一頻帶*因子)。這將確定幀中的每一頻帶的窗口類型。如果所總計的頻帶的信號值之間的差是大的，則類型被確定為短窗口類型，而如果差不大，則該類型被確定為長窗口類型。
如果確定結果不滿足條件，則在步驟S680，窗口類型被確定為長窗口，而如果確定結果滿足條件，則在步驟S650，計算幀輸入信號的總和。例如，如圖7C所示，通過相加一幀中的頻帶值，計算幀和(frame sum)信號。
接著，在步驟S660，通過利用幀和信號，執(zhí)行窗口類型確定2。
也就是說，確定是否(前一幀和＞當前幀和*0.5)。這以幀為單位確定窗口類型，并且即使在所總計的頻帶的信號值之間的差是大的，如果幀和之間的差是大的，則確定窗口類型為長窗口類型。
如果確定結果滿足條件，則窗口類型被確定為長窗口，而如果結果不滿足條件，則在步驟S670，窗口類型被確定為短窗口。
如果通過上述方法來確定窗口類型，則可以以較高的精度確定窗口類型，這是因為首先考慮一幀中的信號的幅度中的變化程度，并且接著考慮幀之間的信號量值中的變化程度。
圖8是圖4所示的MDCT和基于參數(shù)的心理聲學模型的詳細流程圖。
首先，在步驟S810，接收圖9A所示的MDCT系數(shù)作為輸入信號，并且在步驟S820中，被變換成絕對值。圖9B示出被變換成絕對值的MDCT系數(shù)。
接著，在步驟S830中，通過使用被變換成絕對值的MDCT系數(shù)，計算主掩蔽系數(shù)。主掩蔽系數(shù)是作為用于計算掩蔽門限值的參考值的值。
接著，在步驟S840，通過利用被變換成絕對值的MDCT系數(shù)和主掩蔽系數(shù)，計算每一頻帶的量值e(b)和主掩蔽c(b)。
頻帶的量值e(b)是屬于每一頻帶的被變換成絕對值的MDCT系數(shù)的和，并且可被認為是指示原始信號的量值的值。例如，如圖9B所示，頻帶1的e(b)是通過簡單地相加在頻帶1中的被變換成絕對值的所有MDCT系數(shù)，即，從bandlow(1)到bandhigh(1)。主掩蔽c(b)是通過將主掩蔽系數(shù)加權(即相乘)到被變換成屬于每一頻帶的絕對值的MDCT系數(shù)所產(chǎn)生的值，并且可被理解為表示主掩蔽的量值的值。例如，在圖9C中，附圖標記901表示頻帶1的頻帶量值e(b)，而902表示主掩蔽c(b)。
接著，在步驟850中，計算每一頻帶的量值ec(b)和主掩蔽ct(b)，其中對于所述頻帶，對每一頻帶的量值e(b)和主掩蔽c(b)應用掩蔽前和掩蔽后。
和采用擴展函數(shù)的現(xiàn)有技術不同，本發(fā)明使用掩蔽前參數(shù)和掩蔽后參數(shù)以用于計算。掩蔽前參數(shù)是前向掩蔽(forward masking)的代表值，而掩蔽后是后向掩蔽(backward masking)的代表值。例如，在圖9C中，頻帶量值e(b)的掩蔽后由903表示，掩蔽前由904表示，而主掩蔽c(b)的掩蔽后由905表示，以及掩蔽前由906表示。
掩蔽前和掩蔽后是考慮甚至信號的兩邊部分由一個值表達的概念，而ec(b)是由(掩蔽后903+e(b)901+掩蔽前904)表達的值，而ct(b)是由(掩蔽后905+c(b)902+掩蔽前906)表達的值。
接著，在步驟S860中，通過計算所計算的ec(b)和ct(b)來計算ratio_1。ratio_1是ec(b)對ct(b)的比值。
雖然從方法論的觀點，圖4所示的處理被表達成流程圖，但是可以通過設備來實現(xiàn)流程圖中所示的每一步驟。因此，圖4中所示的編碼處理也可以被實現(xiàn)為編碼設備。因此，編碼設備的結構沒有被分開示出，并且圖4中所示的每一步驟可被認為是編碼設備的每一部件。
圖10是示出執(zhí)行圖6中所示的窗口類型確定的窗口類型確定單元的詳細結構的方框圖。
窗口類型確定單元1000包括信號預處理單元1010，用于預處理所接收的原始信號；第一窗口類型確定單元1020，用于利用從信號預處理單元1010輸出的結果來執(zhí)行窗口類型確定1；第二窗口類型確定單元1030，用于利用從信號預處理單元1010輸出的結果來執(zhí)行窗口類型確定2；以及乘法單元1040，用于將第一窗口類型確定單元1020的輸出和第二窗口類型確定單元1030的輸出相乘并輸出結果。
在圖11中示出信號預處理單元1010的詳細結構。
信號預處理單元1010包括絕對值變換單元1011、頻帶和計算單元1012以及幀和計算單元1013。
絕對值變換單元1011接收包括576個采樣的一幀的原始信號S(w)，將所述采樣變換成絕對值，并輸出所變換的絕對值信號abs(S(w))到頻帶和計算單元1012以及幀和計算單元1013。
頻帶和計算單元1012接收絕對值信號，將包括576個采樣的信號分成9個頻帶，計算屬于(包括頻帶(0)，、、、，頻帶(8))的每一頻帶的絕對值信號的和，并輸出到第一窗口類型確定單元1020。
幀和計算單元1013接收絕對值信號，通過簡單相加包括576個采樣的信號來計算幀和，并輸出到第二窗口類型確定單元1030。
通過這樣使用所接收的頻帶和信號(band sum signal)，第一窗口類型確定單元1020執(zhí)行窗口類型確定1，并輸出所確定的窗口類型信號到乘法單元1040。
窗口類型確定1是確定在幀中的信號之間的能量差的程度。如果在較大的頻帶之間存在信號差，則類型被確定為短窗口類型，而如果在較大的頻帶之間不存在信號差，則類型被確定為長窗口類型。
也就是說，根據(jù)下列判定來確定窗口類型。由于9個頻帶處于一個幀中，所以針對每一頻帶執(zhí)行判定，并且如果存在滿足下列條件的任何一個頻帶，則該頻帶所屬的幀，即當前幀，被判定為短窗口類型。

通過利用接收的幀和信號，第二窗口類型確定單元1030執(zhí)行窗口類型確定2，并且輸出所確定窗口類型到乘法單元1040。
窗口類型確定2確定在不同幀的信號之間的能量差的程度。如果在前一幀信號和以及當前幀信號和之間的能量差大于預定值，則類型被確定為長窗口類型，而如果能量差不大于預定值，則類型被確定為短窗口類型。其次，這確定窗口類型。也就是說，窗口類型由下列條件來確定。

乘法單元1040包括AND門，用于接收第一窗口類型確定單元1020和第二窗口類型確定單元1030的輸出信號，并且僅當兩個信號都是1時，輸出1。也就是說，可以實現(xiàn)乘法單元1040以便僅當從第一窗口類型確定單元1020和第二窗口類型確定單元1030輸出的兩個窗口類型都是短窗口類型時，乘法單元1040輸出短窗口類型作為最終窗口類型，否則，輸出長窗口類型。
通過如上所述實現(xiàn)該單元，其中雖然一個幀中的信號之間的能量差大，但是在不同幀的信號之間的能量差不大時的情形可以被認為是整個能量差不大的情形，因此，通過首先考慮在一個幀中的信號之間的能量差并且然后再考慮不同幀的信號之間的能量差，可以精確地執(zhí)行窗口類型確定。
圖12是示出執(zhí)行MDCT和圖8中所示的基于參數(shù)的心理聲學模型處理的心理聲學模型執(zhí)行單元1200的詳細結構的圖。首先將說明當類型被確定為長窗口類型的情況。
心理聲學模型執(zhí)行單元1200包括信號預處理單元1210，用于接收和預處理MDCT系數(shù)并輸出預處理信號結果到e(b)和c(b)計算單元1220；所述e(b)和c(b)計算單元1220，計算每一頻帶的能量e(b)和主掩蔽c(b)；掩蔽前/掩蔽后表1230，用于存儲掩蔽前和掩蔽后參數(shù)；ec(b)和ct(b)計算單元1240，用于通過對于由e(b)和c(b)計算單元1220所計算的每一頻帶的主掩蔽和頻帶的量值考慮存儲在掩蔽前/掩蔽后表1230中的掩蔽前和掩蔽后參數(shù)來計算頻帶的量值ec(b)和主掩蔽ct(b)；以及比值計算單元1250，用于使用所計算的ec(b)和ct(b)值來計算比值。
圖13中示出信號預處理單元1210的整體結構。
信號預處理單元1210包括；絕對值變換單元1211和主掩蔽計算單元1212。
絕對值變換單元1211接收MDCT系數(shù)r(w)并根據(jù)下列公式9將其變換成絕對值r(w)＝abs(r(w))......(9)然后，將被變換成絕對值的信號值輸出到e(b)和c(b)計算單元1220以及主掩蔽計算單元1212。
主掩蔽計算單元1212因此接收從絕對值變換單元1211輸出的被變換成絕對值的MDCT系數(shù)，并根據(jù)下列公式10，對采樣0到205計算主掩蔽值
MCw=abs(r(w)-abs(2r(w-1)-(r(w-2))abs(r(w)+abs(2r(w-1)-(r(w-2))...(10)]]>對于采樣207到512，主掩蔽值被設置為例如0.4，而對于采樣513到575，不計算主掩蔽值。這是因為即使使用主掩蔽值，由于幀中有意義的信號集中在幀的前面部分這一特征，所以性能沒有受到特別的影響，并且隨著離前面部分的距離增加，有效信號的數(shù)量減少。
主掩蔽計算單元1212輸出這樣計算的主掩蔽值到e(b)和c(b)計算單元1220。
e(b)和c(b)計算單元1220接收被變換成絕對值的MDCT系數(shù)r(w)，并且由信號預處理單元1210輸出主掩蔽MCw，根據(jù)下面公式11計算每一頻帶的能量e(b)和主掩蔽c(b)，并且輸出所計算的結果到ec(b)和ct(b)計算單元1240e(b)=Σbandlowbandhighr(w),c(b)=Σbandlowbandhighr(w)×MCw...(10)]]>顯示出頻帶的能量e(b)是屬于該頻帶的被變換成絕對值的MDCT系數(shù)的簡單相加，而主掩蔽c(b)是通過將屬于每一頻帶的被變換成絕對值MDCT系數(shù)與所接收的主掩蔽MCw相乘所得到的值的和。這里，每一頻帶的量值是可變的，并且用于確定bandlow和bandhigh的值的頻帶間隔使用標準文檔中公開的表值。實際上，由于有效信息被包含在信號間隔的前面部分，因此，在信號間隔的前部分中的頻帶的長度被縮短，信號值被精確地分析，并且在信號間隔的后部分中的頻帶的長度被延長，使得計算量減少。
ec(b)和ct(b)計算單元1240根據(jù)下面公式12和13來計算頻帶量值ec(b)和主掩蔽ct(b)，這考慮了從e(b)和c(b)計算單元1220輸出的每一頻帶的量值和主掩蔽，在掩蔽前/掩蔽后表1230中存儲的掩蔽前和掩蔽后參數(shù)，并輸出所計算的結果到比值計算單元1250ec(b)＝e(b_1)*post_masking+e(b)+e(b+1)*pre_masking......(12)ct(b)＝c(b-1)*post_masking+c(b)+c(b+1)*pre_masking......(13)考慮參數(shù)的量值ec(b)是相加通過將前一頻帶的量值與掩蔽后值相乘所得到的值、當前頻帶的量值、通過將下一頻帶的量值與掩蔽前值相乘所得到的值而得到的值。
考慮參數(shù)的主掩蔽ct(b)是相加通過將前一頻帶的量值與掩蔽后值相乘所得到的值、當前主掩蔽值的量值、通過將下一頻帶的量值與掩蔽前值相乘所得到的值而得到的值。
這里，從圖12中所示的掩蔽前/掩蔽后表1230發(fā)送掩蔽后值和掩蔽前值，并且圖14A和14B示出在掩蔽前/掩蔽后表中存儲的值。
應用于長窗口類型的表在圖14B中示出。例如，示出頻帶1的掩蔽后值是0.376761，頻帶1的掩蔽前值是0.51339。
比值計算單元1250接收從ec(b)和ct(b)計算單元1240輸出的ec(b)和ct(b)，并根據(jù)下列公式14計算比值；ratio_l(b)=ct(b)ec(b)...(14)]]>對短窗口類型的計算和對長窗口類型的計算相同，除了每一頻帶被分成子帶和以子帶為單位執(zhí)行計算之外。
現(xiàn)在將說明類型被確定為短窗口類型的情形，著重于那些與長窗口類型不同的部分。
絕對值變換單元1211接收MDCT系數(shù)r(w)并且根據(jù)下列公式15將其變換成絕對值r_s(sub_band)(w)＝abs(r(sub_band)×3+i))......(15)然后，將被變換成絕對值的信號值輸出到e(b)和c(b)計算單元1220以及主掩蔽計算單元1212。
主掩蔽計算單元1212接收從絕對值變換單元1211輸出的、被變換成絕對值的MDCT系數(shù)，并且根據(jù)下列公式16計算采樣0到55的主掩蔽參數(shù)MC_Sw=abs(r_s(sub_band)(w)-abs(2r_s(sub_band)(w-1)-(r_s(sub_band)(w-2))abs(r_s(sub_band)(w)+abs(2r_s(sub_band)(w-1)-(r_s(sub_band)(w-2))...(16)]]>然后，對于采樣56到128，主掩蔽值被設置為例如0.4，并且不計算采樣129到575的主掩蔽值。這是因為即使使用該主掩蔽值，由于幀中有意義的信號集中在幀的前部分這一特征，所以性能沒有受到特別的影響，并且隨著從前部分開始的距離增加，有效信號的數(shù)量減少。
主掩蔽計算單元1212因此輸出這樣計算的主掩蔽值到e(b)和c(b)計算單元1220。
e(b)和c(b)計算單元1220接收被變換成絕對值的MDCT系數(shù)r(w)，由信號預處理單元1210輸出主掩蔽MCw，根據(jù)下面公式17計算每一頻帶的能量e(b)和主掩蔽c(b)，并且輸出所計算的結果到ec(b)和ct(b)計算單元1240
e(sub_band)(b)=Σbandlowbandhighr_s(sub_band)(w),]]>c(sub_band)(b)=Σbandlowbandhigh{r_s(sub_band)(w)×MC_Sw}...(17)]]>示出頻帶的能量e(b)是屬于該頻帶的被變換成絕對值的MDCT系數(shù)的簡單相加，而主掩蔽c(b)是通過將屬于每一頻帶的被變換成絕對值MDCT系數(shù)與所接收的主掩蔽MCw相乘所得到的值的和。這里，每一頻帶的量值是可變的，并且用于確定bandlow(低帶)和bandhigh(高帶)的值的頻帶間隔使用標準文檔中公開的表值。實際上，由于有效信息被包含在信號間隔的前面部分，因此，在信號間隔的前部分中的頻帶的長度被縮短，信號值被精確地分析，并且在信號間隔的后部分中的頻帶的長度被延長，使得計算量減少。
ec(b)和ct(b)計算單元1240根據(jù)下面公式18和19來計算頻帶的頻帶量值ec(b)和主掩蔽ct(b)，這考慮了從e(b)和c(b)計算單元1220輸出的每一頻帶的量值和主掩蔽，在掩蔽前/掩蔽后表1230中存儲的掩蔽前和掩蔽后參數(shù)，并輸出所計算的結果到比值計算單元1250ec(sub_band)(b)＝e(sub_band)(b-1)*post_masking+e(sub_band)(b)+e(sub_band)(b+1)*pre_masking......(18)ct(sub_band)(b)＝c(sub_band)(b-1)*post_masking+c(sub_band)(b)+c(sub_band)(b+1)*pre_masking......(19)考慮參數(shù)的量值ec(b)是相加通過將前一頻帶的量值與掩蔽后值相乘所得到的值、當前頻帶的量值、通過將下一頻帶的量值與掩蔽前值相乘所得到的值而得到的值。
考慮參數(shù)的主掩蔽ct(b)是相加通過將前一主掩蔽值與掩蔽后值相乘所得到的值、當前主掩蔽值的量值、通過將下一主掩蔽值與掩蔽前值相乘所得到的值而得到的值。
這里，從圖12中所示的掩蔽前/掩蔽后表1230發(fā)送掩蔽后值和掩蔽前值，并且圖14A和14B示出在掩蔽前/掩蔽后表中存儲的值。
應用于短窗口類型的表在圖14A中示出。例如，示出頻帶1的掩蔽后值是0.376761，頻帶1的掩蔽前值是0.51339。
比值計算單元1250接收從ec(b)和ct(b)計算單元1240輸出的ec(b)和ct(b)，并根據(jù)下列公式20計算比值；ratio_s(sub_band)(b)=ct(sub_band)(b)ec(sub_band)(b)...(20)]]>
因此，與傳統(tǒng)心理聲學模型相比，本發(fā)明的心理聲學模型提供了具有減少的復雜度的類似的性能。也就是說，在傳統(tǒng)心理聲學模型中的基于FFT的計算被基于MDCT的計算所替代，從而消除不必要的計算。同時，通過由兩個參數(shù)，掩蔽后和掩蔽前參數(shù)，來替換擴展函數(shù)的計算，可以減少計算量。也就是說，執(zhí)行采用PCM文件(13秒)作為測試文件以及采用bladencoder 0.92版本作為MP3編碼器的實驗，在該實驗中，在現(xiàn)有技術的MP3中使用的基于FFT的MP3算法用了20秒，而根據(jù)本發(fā)明的算法用了12秒。因此，與傳統(tǒng)方法相比，根據(jù)本發(fā)明的方法減少達40％的計算量。
而且，在執(zhí)行與現(xiàn)有技術相同的功能時，本發(fā)明的性能顯示出與傳統(tǒng)方法很小的差別。
工業(yè)應用性如上所述，本發(fā)明通過減少計算的復雜度和防止位的浪費，對于MPEG音頻編碼方法和設備、編碼MPEG音頻時的心理聲學模型方法很有用。
權利要求
1.一種運動圖像專家組(MPEG)音頻編碼方法，包括(a)在時域中對輸入音頻信號執(zhí)行改進的離散余弦變換(MDCT)以生成MDCT系數(shù)；(b)基于MDCT系數(shù)執(zhí)行心理聲學模型；和(c)基于心理聲學模型的結果來執(zhí)行量化，并壓縮位流。
2.如權利要求1所述的方法，其中基于掩蔽前參數(shù)和掩蔽后參數(shù)執(zhí)行步驟(b)，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)是后向掩蔽的代表值。
3.一種運動圖像專家組(MPEG)音頻編碼方法，包括(a)根據(jù)幀中的信號的能量差和不同幀的信號的能量差來確定時域中的輸入音頻信號的幀的窗口類型；(b)對于通過對時域中的輸入音頻信號執(zhí)行改進離散余弦變換(MDCT)所獲得的MDCT系數(shù)，根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)是后向掩蔽的代表值；以及(c)執(zhí)行量化，并根據(jù)心理聲學模型的結果壓縮位流。
4.如權利要求3所述的方法，其中在步驟(a)中，根據(jù)幀中的信號的能量差是否大于第一預定門限值值以及不同幀的信號的能量差是否大于第二預定門限值值，所述窗口類型被確定為短窗口類型或者長窗口類型。
5.如權利要求4所述的方法，其中在步驟(b)中，如果所確定的窗口類型是長窗口類型，則以信號的頻帶為單位，根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型，并且如果所確定的窗口類型是短窗口類型，則以信號的每一頻帶中的子帶為單位，根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型。
6.如權利要求4所述的方法，其中步驟(b)包括(b1)根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)如下計算頻帶的量值和掩蔽門限值頻帶量值＝前一頻帶的量值*掩蔽后參數(shù)+當前頻帶的量值+下一頻帶的量值*掩蔽前參數(shù)，和掩蔽門限值＝前一頻帶的主掩蔽的量值*掩蔽后參數(shù)+當前頻帶的主掩蔽的量值+下一頻帶的主掩蔽的量值*掩蔽前參數(shù)；以及(b2)計算所計算的頻帶的量值對所計算的掩蔽門限值的比。
7.一種在編碼運動圖像專家組(MPEG)音頻時的窗口類型確定方法，包括(a)接收包括在時域中的多個采樣的輸入音頻信號，并將所述采樣變換成絕對值；(b)將被變換成絕對值的采樣分成形成幀的預定數(shù)量的頻帶，并對于每一頻帶，計算頻帶和，所述頻帶和是屬于頻帶的絕對值的和；(c)基于相鄰頻帶的頻帶和之間的差來執(zhí)行第一窗口類型確定；(d)計算當前的幀和，所述幀和是在幀中的絕對值之和，并根據(jù)在前一幀和與當前幀和之間的差來執(zhí)行第二窗口類型確定；以及(e)通過組合第一窗口類型確定的結果和執(zhí)行第二窗口類型確定的結果來確定窗口類型。
8.如權利要求7所述的方法，其中在步驟(c)中，根據(jù)幀中的當前頻帶和是否大于預定多個前一頻帶和，或前一頻帶和是否大于預定多個當前頻帶和，窗口類型被確定為短窗口類型或長窗口類型。
9.如權利要求8所述的方法，其中在步驟(d)中，根據(jù)前一幀和是否大于預定多個當前幀和，窗口類型被確定為短窗口類型或長窗口類型。
10.如權利要求9所述的方法，其中在步驟(e)中，如果步驟(c)和(d)的確定結果都是短窗口類型，則窗口類型被最終確定為短窗口類型，而當步驟(c)和(d)的確定結果都不是短窗口類型，則窗口類型被確定為長窗口類型。
11.一種在編碼運動圖像專家組(MPEG)音頻時基于參數(shù)的心理聲學建模方法，包括(a)接收通過對具有多個頻帶的輸入音頻信號執(zhí)行改進的離散余弦變換(MDCT)所獲得的MDCT系數(shù)，并將所述MDCT系數(shù)變換成絕對值；(b)基于絕對值計算主掩蔽參數(shù)；(c)通過使用每一頻帶的相應絕對值來計算每一頻帶的第一量值，并根據(jù)每一頻帶的相應絕對值和主掩蔽參數(shù)來計算每一頻帶的主掩蔽的量值；(d)通過將掩蔽前參數(shù)和掩蔽后參數(shù)應用于每一頻帶的第一量值來計算每一頻帶的第二量值，以及通過將所述掩蔽前參數(shù)和掩蔽后參數(shù)應用于主掩蔽量值來計算主掩蔽門限值，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)是后向掩蔽的代表值；和(e)計算每一頻帶的第二量值對每一頻帶的主掩蔽門限值的比。
12.如權利要求11所述的方法，其中在步驟(b)中，根據(jù)下列公式，基于絕對值r(w)計算主掩蔽參數(shù)MCw，MCw=abs(r(w)-abs(2r(w-1)-(r(w-2))abs(r(w)+abs(2r(w-1)-(r(w-2))]]>
13.如權利要求12所述的方法，其中在步驟(c)中，根據(jù)下列公式來計算每一頻帶b的量值e(b)和每一頻帶b的主掩蔽c(b)的量值e(b)=Σbandlowbandhighr(w),C(b)=Σbandlowbandhighr(w)×MCw]]>
14.如權利要求13所述的方法，其中在步驟(d)中，根據(jù)下列公式計算每一頻帶b的第一量值ec(b)和每一頻帶b的主掩蔽門限值ct(b)ec(b)＝e(b-1)*post_masking+e(b)+e(b+1)*pre_maskingct(b)＝c(b-1)*post_masking+c(b)+c(b+1)*pre_masking
15.一種運動圖像專家組(MPEG)音頻編碼設備，包括改進離散余弦變換(MDCT)單元，用于在時域中對輸入音頻信號執(zhí)行MDCT以生成MDCT系數(shù)；心理聲學模型執(zhí)行單元，用于基于MDCT系數(shù)來執(zhí)行心理聲學模型；量化單元，用于基于心理聲學模型的結果來執(zhí)行量化；和壓縮單元，用于將所述量化單元的量化結果壓縮成位流。
16.如權利要求15所述的設備，其中所述心理聲學模型執(zhí)行單元基于掩蔽前參數(shù)和掩蔽后參數(shù)執(zhí)行心理聲學模型，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)是后向掩蔽的代表值。
17.一種運動圖像專家組(MPEG)音頻編碼設備，包括窗口類型確定單元，用于根據(jù)在幀中的信號的能量差和不同幀的信號的能量差來確定時域中的輸入音頻信號的幀的窗口類型；心理聲學模型執(zhí)行單元，對于通過在時域中對輸入音頻信號執(zhí)行改進的離散余弦變換(MDCT)所獲得的MDCT系數(shù)，根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)的后向掩蔽的代表值；以及量化單元，用于基于執(zhí)行心理聲學模型的結果來執(zhí)行量化；和壓縮單元，用于將量化單元的量化結果壓縮成位流。
18.如權利要求17所述的設備，其中，根據(jù)在幀中的信號的能量差是否大于第一預定門限值以及不同幀的信號的能量差是否大于第二預定門限值，所述窗口類型被確定為短窗口類型或者長窗口類型。
19.如權利要求18所述的設備，其中，如果所確定的窗口類型是長窗口類型，則所述心理聲學模型執(zhí)行單元以信號的頻帶為單位，根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型，如果所確定的窗口類型是短窗口類型，則以在信號的每一頻帶中的子帶為單位，根據(jù)掩蔽前參數(shù)和掩蔽后參數(shù)來執(zhí)行基于參數(shù)的心理聲學模型。
20.如權利要求18所述的設備，其中所述心理聲學模型執(zhí)行單元根據(jù)下列公式，基于掩蔽前參數(shù)和掩蔽后參數(shù)計算頻帶的量值和掩蔽門限值頻帶量值＝前一頻帶的量值*掩蔽后參數(shù)+當前頻帶的量值+下一頻帶的量值*掩蔽前參數(shù)，和掩蔽門限值＝前一頻帶的主掩蔽的量值*掩蔽后參數(shù)+當前頻帶的主掩蔽的量值+下一頻帶的主掩蔽的量值*掩蔽前參數(shù)；以及計算頻帶的量值對掩蔽門限值的比。
21.一種在編碼運動圖像專家組(MPEG)音頻時的窗口類型確定設備，包括絕對值變換單元，用于接收包括在時域中的多個采樣的輸入音頻信號，并將所述采樣變換成絕對值；頻帶和計算單元，用于將被變換成絕對值的采樣分成形成幀的預定數(shù)量的頻帶，并對于每一頻帶，計算頻帶和，所述頻帶和是屬于頻帶的絕對值的和；第一窗口類型確定單元，用于基于相鄰頻帶的頻帶和之間的差來執(zhí)行第一窗口類型確定；第二窗口類型確定單元，用于計算幀和，所述幀和是幀的所有絕對值之和，并根據(jù)在前幀和與當前幀和之間的差來執(zhí)行第二窗口類型確定；和乘法單元，用于通過組合執(zhí)行第一窗口類型確定的結果和執(zhí)行第二窗口類型確定的結果來確定窗口類型。
22.如權利要求21所述的設備，其中所述第一窗口類型確定單元根據(jù)幀中的當前頻帶和是否大于預定多個前一頻帶和，或前一頻帶和是否大于預定多個當前頻帶和，將窗口類型確定為短窗口類型或長窗口類型。
23.如權利要求22所述的設備，其中所述第二窗口類型確定單元根據(jù)幀之間的前一幀和是否大于預定多個當前幀和，將窗口類型被確定為短窗口類型或長窗口類型。
24.如權利要求23所述的設備，其中如果第一窗口類型確定單元和第二窗口類型確定單元的確定結果都是短窗口類型，則乘法單元將所述類型確定為短窗口類型，而如果第一窗口類型確定單元和第二窗口類型確定單元的確定結果都不是短窗口類型，則窗口類型被確定為長窗口類型。
25.一種在運動圖像專家組(MPEG)音頻編碼系統(tǒng)中的心理聲學模型設備，所述設備包括絕對值變換單元，用于接收通過對具有多個頻帶的輸入音頻信號執(zhí)行改進離散余弦變換(MDCT)所獲得的MDCT系數(shù)，并將所述MDCT系數(shù)變換成絕對值；主掩蔽計算單元，用于基于所述絕對值計算主掩蔽參數(shù)；第一計算單元，用于根據(jù)每一頻帶的相應絕對值來計算每一頻帶的第一量值，以及根據(jù)每一頻帶的相應絕對值和主掩蔽參數(shù)來計算每一頻帶的主掩蔽的量值；第二計算單元，用于通過將掩蔽前參數(shù)和掩蔽后參數(shù)應用于每一頻帶的第一量值來計算頻帶的第二量值，以及通過將所述掩蔽前參數(shù)和掩蔽后參數(shù)應用于主掩蔽的量值來計算主掩蔽門限值，其中所述掩蔽前參數(shù)是前向掩蔽的代表值，所述掩蔽后參數(shù)是后向掩蔽的代表值；和比值計算單元，用于計算每一頻帶的第二量值對每一頻帶的主掩蔽門限值的比。
26.如權利要求25所述的設備，其中所述主掩蔽參數(shù)計算單元根據(jù)下列公式，基于絕對值r(w)計算主掩蔽參數(shù)MCw，MCw=abs(r(w)-abs(2r(w-1)-(r(w-2))abs(r(w)+abs(2r(w-1)-(r(w-2))]]>
27.如權利要求26所述的設備，其中所述第一計算單元根據(jù)下列公式來計算每一頻帶b的量值e(b)和每一頻帶b的主掩蔽c(b)的量值e(b)=Σbandlowbandhighr(w),C(b)=Σbandlowbandhighr(w)×MCw]]>
28.如權利要求27所述的設備，其中所述第二計算單元根據(jù)下列公式計算每一頻帶b的第二量值ec(b)和每一頻帶b的主掩蔽門限值ct(b)ec(b)＝e(b-1)*post_masking+e(b)+e(b+1)*pre_maskingct(b)＝c(b-1)*post_masking+c(b)+c(b+1)*pre_masking
全文摘要
提供MPEG音頻編碼方法、在編碼MPEG音頻時確定窗口類型的方法、在編碼MPEG音頻時的心理聲學模型方法、MPEG音頻編碼裝置、用于在編碼MPEG音頻時確定窗口類型的裝置、和在MPEG音頻編碼系統(tǒng)中的心理聲學模型裝置。所述MPEG音頻編碼方法包括在時域中對輸入音頻信號執(zhí)行改進的離散余弦變換(MDCT)；利用被執(zhí)行MDCT的MDCT系數(shù)作為輸入，執(zhí)行心理聲學模型；和通過使用執(zhí)行心理聲學模型的結果，執(zhí)行量化，以及壓縮位流。根據(jù)該方法，可以降低計算的復雜度，以及防止位的浪費。
文檔編號G10L19/00GK1732530SQ200380107679
公開日2006年2月8日申請日期2003年11月7日優(yōu)先權日2002年11月7日
發(fā)明者河昊振申請人:三星電子株式會社

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：河昊振
技術所有人：三星電子株式會社
我是此專利的發(fā)明人

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！