本發(fā)明涉及對音信號等時序信號進行編碼或者解碼的技術(shù)。
背景技術(shù):
作為低比特(例如10kbit/s~20kbit/s左右)的音信號的編碼方法,已知對于dft(離散傅里葉變換)、mdct(變形離散余弦變換)等頻域中的正交變換系數(shù)的自適應(yīng)編碼。例如作為標準規(guī)范技術(shù)的mepgusac(統(tǒng)一語音和音頻編碼(unifiedspeechandaudiocoding))具有tcx(transformcodedexcitation:變換編碼激勵)編碼模式,其中,將mdct系數(shù)按每幀進行歸一化并量化后進行可變長編碼(例如,參照非專利文獻1)。
在圖1中示出以往的基于tcx的編碼裝置的結(jié)構(gòu)例。圖1的編碼裝置具備頻域變換單元11、線性預(yù)測分析單元12、振幅頻譜包絡(luò)序列生成單元13、包絡(luò)歸一化單元14、以及編碼單元15。以下,說明圖1的各單元。
<頻域變換單元11>
向頻域變換單元11輸入時域的音信號。音信號例如是聲音信號或者音響信號。
頻域變換單元11以規(guī)定的時間長度的幀為單位,將所輸入的時域的音信號變換為頻域的n點的mdct系數(shù)串x(0),x(1),……,x(n-1)。n為正整數(shù)。
變換后mdct系數(shù)串x(0),x(1),……,x(n-1)被輸出至包絡(luò)歸一化單元14。
<線性預(yù)測分析單元12>
向線性預(yù)測分析單元12輸入時域的音信號。
線性預(yù)測分析單元12通過進行對于以幀為單位輸入的音信號的線性預(yù)測分析,生成線性預(yù)測系數(shù)α1,α2,……,αp。此外,線性預(yù)測分析單元12對所生成的線性預(yù)測系數(shù)α1,α2,……,αp進行編碼而生成線性預(yù)測系數(shù)碼。線性預(yù)測系數(shù)碼的例子是與對應(yīng)于線性預(yù)測系數(shù)α1,α2,……,αp的lsp(線譜對(linespectrumpairs))參數(shù)串的量化值的串對應(yīng)的碼即lsp碼。p為2以上的整數(shù)。
此外,線性預(yù)測分析單元12生成與所生成的線性預(yù)測系數(shù)碼對應(yīng)的線性預(yù)測系數(shù)即量化線性預(yù)測系數(shù)^α1,^α2,……,^αp。
所生成的量化線性預(yù)測系數(shù)^α1,^α2,……,^αp被輸出至振幅頻譜包絡(luò)序列生成單元13。此外,所生成的線性預(yù)測系數(shù)碼被輸出至解碼裝置。
在線性預(yù)測分析中,例如,使用求得對于以幀為單位輸入的音信號的自相關(guān),利用所求得的自相關(guān)進行l(wèi)evinson-durbin算法從而得到線性預(yù)測系數(shù)的方法?;蛘?,也可以使用向線性預(yù)測分析單元12輸入頻域變換單元11求得的mdct系數(shù)串,對于對mdct系數(shù)串的各系數(shù)的平方值的序列進行傅里葉逆變換后的序列進行l(wèi)evinson-durbin算法從而得到線性預(yù)測系數(shù)的方法。
<振幅頻譜包絡(luò)序列生成單元13>
向振幅頻譜包絡(luò)序列生成單元13輸入線性預(yù)測分析單元12生成的量化線性預(yù)測系數(shù)^α1,^α2,……,^αp。
振幅頻譜包絡(luò)序列生成單元13使用量化線性預(yù)測系數(shù)^α1,^α2,……,^αp,生成由以下的式(1)定義的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)。將·設(shè)為實數(shù),exp(·)為以納皮爾數(shù)為底的指數(shù)函數(shù),j為虛數(shù)單位。γ為1以下的正的常數(shù),是使由以下的式(2)定義的振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)的振幅的凹凸平緩的系數(shù)、換言之是將振幅頻譜包絡(luò)序列平滑化的系數(shù)。
所生成的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)被輸出至包絡(luò)歸一化單元14。
<包絡(luò)歸一化單元14>
向包絡(luò)歸一化單元14輸入頻域變換單元11生成的mdct系數(shù)串x(0),x(1),……,x(n-1)及振幅頻譜包絡(luò)序列生成單元13輸出的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)。
包絡(luò)歸一化單元14將mdct系數(shù)串的各系數(shù)x(k)以平滑化振幅頻譜包絡(luò)序列的各值^wγ(k)歸一化,從而生成歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)。也就是說,xn(k)=x(k)/^wγ(k)[k=0,1,……,n-1]。
所生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)被輸出至編碼單元15。
在此,為了實現(xiàn)聽覺上失真小的量化,包絡(luò)歸一化單元14使用使振幅頻譜包絡(luò)平緩的序列即平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1),以幀為單位將mdct系數(shù)串x(0),x(1),……,x(n-1)歸一化。
<編碼單元15>
向編碼單元15輸入包絡(luò)歸一化單元14生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)。
編碼單元15生成與歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)對應(yīng)的碼。
所生成的與歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)對應(yīng)的碼被輸出至解碼裝置。
編碼單元15將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以增益(全局增益)g,將對將其結(jié)果量化后的整數(shù)值的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行編碼而得到的碼設(shè)為整數(shù)信號碼。在非專利文獻1的技術(shù)中,編碼單元15決定該整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的增益g。并且,編碼單元15生成與該決定的增益g對應(yīng)的增益碼、和與該決定的增益g對應(yīng)的整數(shù)信號碼。
該生成的增益碼及整數(shù)信號碼作為與歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)對應(yīng)的碼而被輸出至解碼裝置。
[編碼單元15進行的編碼處理的具體例]
說明編碼單元15進行的編碼處理的具體例。
在圖2中示出編碼單元15的具體例的結(jié)構(gòu)例。編碼單元15如圖2所示,具備增益取得單元151、量化單元152、rice參數(shù)決定單元153、golomb-rice編碼單元154、增益編碼單元155、判定單元156、以及增益更新單元157。以下,說明圖2的各單元。
<增益取得單元151>
增益取得單元151根據(jù)所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1),決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g并進行輸出。增益取得單元151得到的全局增益g成為在量化單元152中使用的全局增益的初始值。
<量化單元152>
量化單元152得到基于將所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以增益取得單元151或者增益更新單元157得到的全局增益g的結(jié)果的整數(shù)部分的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)并進行輸出。
在此,量化單元152在初次執(zhí)行時使用的全局增益g是增益取得單元151得到的全局增益g、即全局增益的初始值。此外,量化單元152在第二次以后執(zhí)行時使用的全局增益g是增益更新單元157得到的全局增益g、即全局增益的更新值。
<rice參數(shù)決定單元153>
rice參數(shù)決定單元153根據(jù)量化單元152得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1),通過下述的式(3)得到rice參數(shù)r并進行輸出。
其中,將·設(shè)為任意的數(shù),[·]為對于·的取整操作。
<golomb-rice編碼單元154>
golomb-rice編碼單元154使用rice參數(shù)決定單元153得到的rice參數(shù)r,對量化單元152得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行g(shù)olomb-rice編碼而得到整數(shù)信號碼,輸出整數(shù)信號碼、和整數(shù)信號碼的比特數(shù)即消耗比特數(shù)c。
<判定單元156>
判定單元156在增益的更新次數(shù)為預(yù)先決定的次數(shù)的情況下,輸出整數(shù)信號碼,且對增益編碼單元155輸出將增益更新單元157得到的全局增益g進行編碼的指示信號,在增益的更新次數(shù)小于預(yù)先決定的次數(shù)的情況下,對增益更新單元157輸出golomb-rice編碼單元154測量的消耗比特數(shù)c。
<增益更新單元157>
增益更新單元157在golomb-rice編碼單元154測量的消耗比特數(shù)c比分配比特數(shù)b多的情況下將全局增益g的值更新為較大的值并進行輸出,在消耗比特數(shù)c比分配比特數(shù)b少的情況下將全局增益g的值更新為較小的值,輸出更新后的全局增益g的值。
<增益編碼單元155>
增益編碼單元155按照判定單元156輸出的指示信號,對增益更新單元157得到的全局增益g進行編碼而得到增益碼并進行輸出。
判定單元156輸出的整數(shù)信號碼、和增益編碼單元155輸出的增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
以上那樣,在以往的基于tcx的編碼中,使用使振幅頻譜包絡(luò)平緩的平滑化振幅頻譜包絡(luò)序列對mdct系數(shù)串進行了歸一化后,對歸一化mdct系數(shù)串進行編碼。該編碼方法在上述的mpeg-4usac等中被采用。
現(xiàn)有技術(shù)文獻
非專利文獻
非專利文獻1:m.neuendorf,etal.,“mpegunifiedspeechandaudiocoding-theiso/mpegstandardforhigh-efficiencyaudiocodingofallcontenttypes,”aes132ndconvention,budapest,hungary,2012.
技術(shù)實現(xiàn)要素:
發(fā)明要解決的課題
所輸入的系數(shù)串的包絡(luò)的凸凹盡量小則編碼單元15的編碼效率好。但是,在以往的編碼裝置中,為了減小聽覺上的失真,在包絡(luò)歸一化單元14中將mdct序列x(0),x(1),……,x(n-1)以平滑化振幅頻譜包絡(luò)序列而不是振幅頻譜包絡(luò)序列進行歸一化,被輸入至編碼單元15的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)盡管不像mdct系數(shù)串x(0),x(1),……,x(n-1)那樣,但具有包絡(luò)的凹凸。即,在以往的編碼裝置中,平滑化振幅頻譜包絡(luò)序列的包絡(luò)的凸凹引起編碼單元15的編碼效率變差。
本發(fā)明的目的在于,提供能夠進行比以往效率好的編碼或者解碼的編碼裝置、解碼裝置、它們的方法及程序。
用于解決課題的手段
根據(jù)本發(fā)明的一方式的編碼裝置,將時序信號在頻域進行編碼,其中,具備:頻譜包絡(luò)估計單元,將η設(shè)為2以外的規(guī)定的正數(shù),將與時序信號對應(yīng)的頻域樣本串的絕對值的η次方視為功率譜而進行頻譜包絡(luò)的估計;以及編碼單元,對與時序信號對應(yīng)的頻域樣本串的各系數(shù)進行基于所估計出的頻譜包絡(luò)而改變比特分配或者實質(zhì)上比特分配改變的編碼。
根據(jù)本發(fā)明的一方式的解碼裝置,通過頻域中的解碼而得到與時序信號對應(yīng)的頻域樣本串,其中,包含:線性預(yù)測系數(shù)解碼單元,對所輸入的線性預(yù)測系數(shù)碼進行解碼而得到能夠變換為線性預(yù)測系數(shù)的系數(shù);非平滑化頻譜包絡(luò)序列生成單元,將η設(shè)為2以外的規(guī)定的正數(shù),得到對與能夠變換為線性預(yù)測系數(shù)的系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列進行1/η次方后的序列即非平滑化頻譜包絡(luò)序列;以及解碼單元,按照基于非平滑化頻譜包絡(luò)序列而改變的比特分配或者實質(zhì)上改變的比特分配,進行所輸入的整數(shù)信號碼的解碼從而得到與時序信號對應(yīng)的頻域樣本串。
發(fā)明效果
能夠進行比以往效率好的編碼或者解碼。
附圖說明
圖1是用于說明以往的編碼裝置的例子的框圖。
圖2是用于說明以往的編碼單元的例子的框圖。
圖3是用于說明技術(shù)背景的直方圖。
圖4是用于說明本發(fā)明的編碼裝置的例子的框圖。
圖5是用于說明本發(fā)明的編碼方法的例子的流程圖。
圖6是用于說明本發(fā)明的編碼單元的例子的框圖。
圖7是用于說明本發(fā)明的編碼單元的例子的框圖。
圖8是用于說明本發(fā)明的編碼單元的處理的例子的流程圖。
圖9是用于說明本發(fā)明的解碼裝置的例子的框圖。
圖10是用于說明本發(fā)明的解碼方法的例子的流程圖。
圖11是用于說明本發(fā)明的解碼單元的處理的例子的流程圖。
圖12是用于說明本發(fā)明的技術(shù)背景的圖。
圖13是用于說明本發(fā)明的編碼方法的例子的流程圖。
圖14是用于說明本發(fā)明的編碼單元的例子的框圖。
圖15是用于說明本發(fā)明的編碼單元的例子的框圖。
圖16是用于說明本發(fā)明的解碼裝置的例子的框圖。
圖17是用于說明本發(fā)明的解碼單元的處理的例子的流程圖。
具體實施方式
[技術(shù)背景]
與基于振幅頻譜包絡(luò)序列的歸一化相比,基于平滑化振幅頻譜包絡(luò)的mdct序列x(0),x(1),……,x(n-1)的歸一化不將mdct序列x(0),x(1),……,x(n-1)白色化。具體而言,與將mdct系數(shù)串x(0),x(1),……,x(n-1)以振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)歸一化而得到的歸一化后的序列x(0)/^w(0),x(1)/^w(1),……,x(n-1)/^w(n-1)相比,將mdct系數(shù)串x(0),x(1),……,x(n-1)以平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)歸一化而得到的歸一化mdct系數(shù)串xn(0)=x(0)/^wγ(0),xn(1)=x(1)/^wγ(1),……,xn(n-1)=x(n-1)/^wγ(n-1)凸凹大^w(0)/^wγ(0),^w(1)/^wγ(1),……,^w(n-1)/^wγ(n-1)。從而,若設(shè)為將mdct系數(shù)串x(0),x(1),……,x(n-1)以振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)歸一化而得到的歸一化后的序列x(0)/^w(0),x(1)/^w(1),……,x(n-1)/^w(n-1)的包絡(luò)的凸凹被平坦到適于編碼單元15中的編碼的程度,則在被輸入至編碼單元15的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)中,殘留以^w(0)/^wγ(0),^w(1)/^wγ(1),……,^w(n-1)/^wγ(n-1)的序列(以下,歸一化振幅頻譜包絡(luò)序列^wn(0),^wn(1),……,^wn(n-1))表示的包絡(luò)的凸凹。
在圖3中示出歸一化mdct序列的包絡(luò)的凹凸^w(0)/^wγ(0),^w(1)/^wγ(1),……,^w(n-1)/^wγ(n-1)取各值的情況下的、歸一化mdct系數(shù)串中包含的各系數(shù)的值的出現(xiàn)頻度。envelope:0.2-0.3的曲線表示與歸一化mdct序列的包絡(luò)的凹凸^w(k)/^wγ(k)為0.2以上且小于0.3的樣本k對應(yīng)的歸一化mdct系數(shù)xn(k)的值的頻度。envelope:0.3-0.4的曲線表示與歸一化mdct序列的包絡(luò)的凹凸^w(k)/^wγ(k)為0.3以上且小于0.4的樣本k對應(yīng)的歸一化mdct系數(shù)xn(k)的值的頻度。envelope:0.4-0.5的曲線表示與歸一化mdct序列的包絡(luò)的凹凸^w(k)/^wγ(k)為0.4以上且小于0.5的樣本k對應(yīng)的歸一化mdct系數(shù)xn(k)的值的頻度。
若觀看圖3,則可知歸一化mdct系數(shù)串中包含的各系數(shù)的值平均大致為0,但方差與包絡(luò)的值具有關(guān)聯(lián)性。即,可知歸一化mdct序列的包絡(luò)的凹凸越大,則表示頻度的曲線的斜坡越寬,所以歸一化mdct序列的包絡(luò)的凹凸大與歸一化mdct系數(shù)的值的方差大有關(guān)聯(lián)性。為了實現(xiàn)更高效的壓縮,進行利用了該關(guān)聯(lián)性的編碼。具體而言,對成為編碼的對象的頻域樣本串的各系數(shù),進行基于頻譜包絡(luò)而改變比特分配或者實質(zhì)上比特分配改變的編碼。
因此,例如(i)在對已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行g(shù)olomb-rice編碼的情況下,使用基于頻譜包絡(luò)而決定的rice參數(shù)。此外,例如(ii)在對已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行算術(shù)編碼的情況下,使用基于頻譜包絡(luò)而決定的方差參數(shù)。
首先,說明(i)的情況下的技術(shù)背景。
在以往的編碼裝置中,根據(jù)包含例如已量化歸一化系數(shù)序列中包含的系數(shù)的平均的以下的式(4)而求得在golomb-rice編碼中使用的rice參數(shù),對已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)中包含的全部系數(shù)使用根據(jù)式(4)而求得的相同的rice參數(shù)進行了golomb-rice編碼。
其中,將·設(shè)為任意的數(shù),[·]為對于·的取整操作。
相對于此,在本發(fā)明的第二實施方式中,根據(jù)與各自的系數(shù)對應(yīng)的歸一化振幅頻譜包絡(luò)序列^wn(0),^wn(1),……,^wn(n-1)的各值和全局增益g,通過以下的式(5)算出對于已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)的rice參數(shù)。
其中,σ為預(yù)測殘差的能量σ2的平方根。即,σ為正數(shù)。也就是說,將對于已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)的rice參數(shù)設(shè)為在將與該各系數(shù)對應(yīng)的歸一化振幅頻譜包絡(luò)的值輸入至規(guī)定的單調(diào)非遞減函數(shù)的情況下的輸出值。通過這樣,能夠得到適于各系數(shù)的rice參數(shù)而不會為了表示對于各系數(shù)的rice參數(shù)而新追加信息,能夠提高golomb-rice編碼的效率。
另外,也可以利用通過與以往不同的方法而求得的頻譜包絡(luò)。具體而言,在本發(fā)明的第一實施方式中,對將mdct系數(shù)的絕對值的序列進行傅里葉逆變換后的序列進行l(wèi)evinson-durbin算法,將對由此得到的線性預(yù)測系數(shù)進行量化后的系數(shù)即^β1,^β2,……,^βp代替量化線性預(yù)測系數(shù)^α1,^α2,……,^αp來使用,分別根據(jù)下述的式(6)和式(7)
求得非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)和平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),將所求得的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)的各系數(shù)除以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各系數(shù)而得到歸一化振幅頻譜包絡(luò)序列^hn(0)=^h(0)/^hγ(0),^hn(1)=^h(1)/^hγ(1),……,^hn(n-1)=^h(n-1)/^hγ(n-1),根據(jù)歸一化振幅頻譜包絡(luò)序列和全局增益g,通過下述的式(8)算出rice參數(shù)。
在式(8)中,也將對于已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)的rice參數(shù)設(shè)為在將與該各系數(shù)對應(yīng)的歸一化振幅頻譜包絡(luò)的值輸入至規(guī)定的單調(diào)非遞減函數(shù)的情況下的輸出值。
上述技術(shù)基于以在對已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行g(shù)olomb-rice編碼時的碼長為基準的最小化問題。以下敘述上述技術(shù)的導(dǎo)出。
若在將已量化歸一化系數(shù)xq(k)分別通過rice參數(shù)r(k)進行g(shù)olomb-rice編碼時的碼長忽略四舍五入誤差的影響,則由
來表示。其中,正負符號設(shè)為以其他途徑編碼。為了減小該碼長,考慮基于已經(jīng)進行了量化及編碼的線性預(yù)測系數(shù)而求得rice參數(shù)序列r(0),r(1),……,r(n-1)。上面的式(9)能夠通過進行式變形而重寫為
。其中,設(shè)為ln為以納皮爾數(shù)為底的對數(shù),c為對于rice參數(shù)的常數(shù),并且dis(x|y)為x離y的板倉齋藤距離。
也就是說,對于rice參數(shù)序列的碼長l的最小化問題被歸結(jié)于(log2e)2r(k)和xq(k)的板倉齋藤距離的總和的最小化問題。在此,若決定一個rice參數(shù)序列r(0),r(1),……,r(n-1)和線性預(yù)測系數(shù)β1,β2,……,βp、預(yù)測殘差的能量σ2的對應(yīng)關(guān)系,則能夠建立求得將碼長最小化的線性預(yù)測系數(shù)的最佳化問題,但為了使用以往的高速解法而在此如下相關(guān)聯(lián)。
若已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)忽略量化的影響,則能夠使用mdct序列x(0),x(1),……,x(n-1)和平滑化振幅頻譜包絡(luò)^hγ(0),^hγ(1),……,^hγ(n-1)、全局增益g分別表示為xq(k)=x(k)/(g^hγ(k)),因此式(10)的依賴于rice參數(shù)的項通過式(11),如
那樣,表示為mdct系數(shù)序列的絕對值和全極點的頻譜包絡(luò)的板倉齋藤距離。已知以往的線性預(yù)測分析、也就是說對將功率譜進行傅里葉逆變換后的功率譜應(yīng)用levinson-durbin算法是求得將功率譜和全極點型的頻譜包絡(luò)的板倉齋藤距離最小化的線性預(yù)測系數(shù)的操作。從而,上述的碼長最小化問題能夠通過對將振幅頻譜、也就是說mdct系數(shù)序列的絕對值進行傅里葉逆變換后的頻譜應(yīng)用levinson-durbin算法,與以往方法同樣地求得最佳解。
接著,說明(ii)的情況下的技術(shù)背景。
在編碼對象所屬的概率分布有多樣性時,若將假設(shè)了屬于某概率分布(例如,拉普拉斯分布)的編碼對象的最佳的比特分配對屬于從該假設(shè)偏離的概率分布的編碼對象來進行,則存在壓縮效率降低的可能性。
因此,作為編碼對象所屬的概率分布,使用能夠表現(xiàn)各種概率分布的分布的、用以下的式表示的一般化高斯分布。
一般化高斯分布能夠通過改變形狀參數(shù)η(>0),如圖12那樣,η=1時表現(xiàn)拉普拉斯分布,η=2時表現(xiàn)高斯分布那樣的各種分布。η是比0大的規(guī)定的數(shù)。η也可以是比0大且2以外的規(guī)定的數(shù)。具體而言,η也可以是小于2的規(guī)定的正數(shù)。η的值也可以預(yù)先決定,或者按每個規(guī)定的時間區(qū)間即幀而選擇或者可變。此外,上式的
以下,設(shè)為決定一個形狀參數(shù)η。
在本發(fā)明的第三實施方式中,除了預(yù)測殘差的能量σ2及全局增益g的信息之外還取入所使用的分布的信息,將對于已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)的方差參數(shù)例如通過以下的式(a1)來算出。
其中,σ為σ2的平方根。
具體而言,對于將對mdct系數(shù)的絕對值進行η次方后的值的序列進行傅里葉逆變換后的序列進行l(wèi)evinson-durbin算法,對將由此得到的線性預(yù)測系數(shù)進行量化后的系數(shù)即β1,^β2,……,^βp代替量化線性預(yù)測系數(shù)^α1,^α2,……,^αp來使用,分別根據(jù)下述的式(a2)和式(a3)
求得非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)和平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),將所求得的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)的各系數(shù)除以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各系數(shù)而得到歸一化振幅頻譜包絡(luò)序列^hn(0)=^h(0)/^hγ(0),^hn(1)=^h(1)/^hγ(1),……,^hn(n-1)=^h(n-1)/^hγ(n-1),根據(jù)歸一化振幅頻譜包絡(luò)序列和全局增益g,通過上述的式(a1)算出方差參數(shù)。
在此,式(a1)的σ2/η/g是與熵緊密相關(guān)的值,若比特率固定則每幀的值的變動小。因此,還能夠使用預(yù)先決定為σ2/η/g的固定值。在這樣使用固定值的情況下,不需要為了本發(fā)明的方法而新追加信息。
上述技術(shù)基于以在對已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行算術(shù)編碼時的碼長為基準的最小化問題。以下敘述上述技術(shù)的導(dǎo)出。
若設(shè)為關(guān)于在將已量化歸一化系數(shù)xq(k)分別通過方差參數(shù)
成比例。為了減小該碼長,考慮基于已經(jīng)進行了量化及編碼的線性預(yù)測系數(shù)而求得方差參數(shù)序列
。其中,設(shè)為ln為以納皮爾數(shù)為底的對數(shù),c為對于方差參數(shù)的常數(shù),并且dis(x|y)為x離y的板倉齋藤距離。
也就是說,對于方差參數(shù)序列的碼長l的最小化問題被歸結(jié)于
若已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)忽略量化的影響,則能夠使用mdct序列x(0),x(1),……,x(n-1)和平滑化振幅頻譜包絡(luò)^hγ(0),^hγ(1),……,^hγ(n-1)、全局增益g分別表示為xq(k)=x(k)/(g^hγ(k)),因此式(a5)的依賴于方差參數(shù)的項通過式(a6),如
那樣,表示為mdct系數(shù)序列的絕對值和全極點的頻譜包絡(luò)的板倉齋藤距離。已知以往的線性預(yù)測分析、也就是說對將功率譜進行傅里葉逆變換后的功率譜應(yīng)用levinson-durbin算法是求得將功率譜和全極點的頻譜包絡(luò)的板倉齋藤距離最小化的線性預(yù)測系數(shù)的操作。從而,上述的碼長最小化問題能夠通過對將振幅頻譜的η次方、也就是說mdct系數(shù)序列的絕對值的η次方進行傅里葉逆變換后的頻譜應(yīng)用levinson-durbin算法,與以往方法同樣地求得最佳解。
[第一實施方式]
(第一實施方式的編碼)
在圖4中示出第一實施方式的編碼裝置的結(jié)構(gòu)例。第一實施方式的編碼裝置如圖4所示,例如具備頻域變換單元21、線性預(yù)測分析單元22、非平滑化振幅頻譜包絡(luò)序列生成單元23、平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25、以及編碼單元26。在圖5中示出由該編碼裝置實現(xiàn)的第一實施方式的編碼方法的各處理的例子。
以下,說明圖4的各單元。
<頻域變換單元21>
向頻域變換單元21輸入時域的音信號。音信號的例子是聲音數(shù)字信號或者音響數(shù)字信號。
頻域變換單元21以規(guī)定的時間長的幀為單位,將所輸入的時域的音信號變換為頻域的n點的mdct系數(shù)串x(0),x(1),……,x(n-1)(步驟a1)。n為正整數(shù)。
所得到的mdct系數(shù)串x(0),x(1),……,x(n-1)被輸出至線性預(yù)測分析單元22和包絡(luò)歸一化單元25。
只要沒有特別提及,設(shè)為以后的處理以幀為單位來進行。
這樣,頻域變換單元21求得與音信號對應(yīng)的、例如作為mdct系數(shù)串的頻域樣本串。
<線性預(yù)測分析單元22>
向線性預(yù)測分析單元22輸入頻域變換單元21得到的mdct系數(shù)串x(0),x(1),……,x(n-1)。
線性預(yù)測分析單元22使用mdct系數(shù)串x(0),x(1),……,x(n-1),對由以下的式(12)定義的~x(0),~x(1),……,~x(n-1)進行線性預(yù)測分析而生成線性預(yù)測系數(shù)β1,β2,……,βp,對所生成的線性預(yù)測系數(shù)β1,β2,……,βp進行編碼而生成與線性預(yù)測系數(shù)碼和與線性預(yù)測系數(shù)碼對應(yīng)的量化后的線性預(yù)測系數(shù)即量化線性預(yù)測系數(shù)^β1,^β2,……,^βp(步驟a2)。
所生成的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp被輸出至非平滑化頻譜包絡(luò)序列生成單元23和平滑化振幅頻譜包絡(luò)序列生成單元24。
此外,所生成的線性預(yù)測系數(shù)碼被發(fā)送至解碼裝置。
具體而言,線性預(yù)測分析單元22首先通過進行相當于將mdct系數(shù)串x(0),x(1),……,x(n-1)的絕對值視為了功率譜的傅里葉逆變換的運算、即式(12)的運算,求得與mdct系數(shù)串x(0),x(1),……,x(n-1)對應(yīng)的時域的信號串即偽相關(guān)函數(shù)信號串~x(0),~x(1),……,~x(n-1)。并且,線性預(yù)測分析單元22使用所求得的偽相關(guān)函數(shù)信號串~x(0),~x(1),……,~x(n-1)進行線性預(yù)測分析,生成線性預(yù)測系數(shù)β1,β2,……,βp。并且,線性預(yù)測分析單元22通過對所生成的線性預(yù)測系數(shù)β1,β2,……,βp進行編碼,得到線性預(yù)測系數(shù)碼、和與線性預(yù)測系數(shù)碼對應(yīng)的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp。
線性預(yù)測系數(shù)β1,β2,……,βp是與在將mdct系數(shù)串x(0),x(1),……,x(n-1)的絕對值視為了功率譜時的時域的信號對應(yīng)的線性預(yù)測系數(shù)。
基于線性預(yù)測分析單元22的線性預(yù)測系數(shù)碼的生成例如通過以往的編碼技術(shù)來進行。以往的編碼技術(shù)例如是將與線性預(yù)測系數(shù)本身對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)、將線性預(yù)測系數(shù)變換為lsp參數(shù)而將與lsp參數(shù)對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)、將線性預(yù)測系數(shù)變換為parcor系數(shù)而將與parcor系數(shù)對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)等。例如,將與線性預(yù)測系數(shù)本身對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)是,預(yù)先決定多個量化線性預(yù)測系數(shù)的候選,各候選與線性預(yù)測系數(shù)碼預(yù)先相關(guān)聯(lián)而存儲,決定候選的其中一個作為對于所生成的線性預(yù)測系數(shù)的量化線性預(yù)測系數(shù),得到量化線性預(yù)測系數(shù)和線性預(yù)測系數(shù)碼的技術(shù)。
<非平滑化振幅頻譜包絡(luò)序列生成單元23>
向非平滑化振幅頻譜包絡(luò)序列生成單元23輸入線性預(yù)測分析單元22生成的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp。
非平滑化振幅頻譜包絡(luò)序列生成單元23生成與量化線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)(步驟a3)。
所生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)被輸出至編碼單元26。
非平滑化振幅頻譜包絡(luò)序列生成單元23使用量化線性預(yù)測系數(shù)^β1,^β2,……,^βp,生成由以下的式(13)定義的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)作為非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)。
這樣,非平滑化振幅頻譜包絡(luò)序列生成單元23得到與音信號對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列。
<平滑化振幅頻譜包絡(luò)序列生成單元24>
向平滑化振幅頻譜包絡(luò)序列生成單元24輸入線性預(yù)測分析單元22生成的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp。
平滑化振幅頻譜包絡(luò)序列生成單元24生成使與量化線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凸凹平緩的序列即平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)(步驟a4)。
所生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)被輸出至包絡(luò)歸一化單元25及編碼單元26。
平滑化振幅頻譜包絡(luò)序列生成單元24使用量化線性預(yù)測系數(shù)^β1,^β2,……,^βp和校正系數(shù)γ,生成由以下的式(14)定義的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)作為平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)。
在此,校正系數(shù)γ是預(yù)先決定的小于1的常數(shù)并且是使非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)的振幅的凹凸平緩的系數(shù)、換言之將非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)平滑化的系數(shù)。
這樣,平滑化振幅頻譜包絡(luò)序列生成單元24得到將非平滑化振幅頻譜包絡(luò)序列的振幅的凸凹平滑化后的序列即平滑化振幅頻譜包絡(luò)序列。
<包絡(luò)歸一化單元25>
向包絡(luò)歸一化單元25輸入頻域變換單元21得到的mdct系數(shù)串x(0),x(1),……,x(n-1)及平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)。
包絡(luò)歸一化單元25通過將mdct系數(shù)串x(0),x(1),……,x(n-1)的各系數(shù)以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各值歸一化,從而生成歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)(步驟a5)。
所生成的歸一化mdct系數(shù)串被輸出至編碼單元26。
包絡(luò)歸一化單元25通過例如設(shè)為k=0,1,……,n-1,將mdct系數(shù)串x(0),x(1),……,x(n-1)的各系數(shù)x(k)除以平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),從而生成歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)xn(k)。即,設(shè)為k=0,1,……,n-1,xn(k)=x(k)/^hγ(k)。
這樣,包絡(luò)歸一化單元25例如將mdct系數(shù)串即頻域樣本串的各樣本以平滑化振幅頻譜包絡(luò)序列的對應(yīng)的樣本歸一化,得到例如歸一化mdct系數(shù)串即歸一化頻域樣本串。
<編碼單元26>
向編碼單元26輸入包絡(luò)歸一化單元25生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)、非平滑化振幅頻譜包絡(luò)生成單元23生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)及平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)。
編碼單元26通過進行圖8中例示的步驟a6-1至步驟a6-5的處理從而進行編碼(步驟a6)。即,編碼單元26求得與歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)對應(yīng)的全局增益g(步驟a6-1),求得基于對將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以全局增益g后的結(jié)果進行量化后的整數(shù)值的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)(步驟a6-2),根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)和平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),通過上述的式(8)求得與已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)對應(yīng)的rice參數(shù)r(0),r(1),……,r(n-1)(步驟a6-3),使用rice參數(shù)r(0),r(1),……,r(n-1)對已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行g(shù)olomb-rice編碼而得到整數(shù)信號碼(步驟a6-4),得到與全局增益g對應(yīng)的增益碼(步驟a6-5)。
在此,上述的式(8)中的歸一化振幅頻譜包絡(luò)序列^hn(0),^hn(1),……,^hn(n-1)是將非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)的各值除以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各值后的序列、即通過以下的式(15)求得的序列。
所生成的整數(shù)信號碼和增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
編碼單元26通過上述的步驟a6-1~a6-5,實現(xiàn)決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g,生成與所決定的全局增益g對應(yīng)的增益碼、和與該決定的全局增益g對應(yīng)的整數(shù)信號碼的功能。
編碼單元26進行的步驟a6-1至步驟a6-5之中包含特征的處理的是步驟a6-3。在通過對全局增益g和已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各個進行編碼從而得到與歸一化mdct系數(shù)串對應(yīng)的碼的編碼處理本身中,存在包含非專利文獻1中記載的技術(shù)的各種公知技術(shù)。以下說明兩個編碼單元26進行的編碼處理的具體例。
[編碼單元26進行的編碼處理的具體例1]
作為編碼單元26進行的編碼處理的具體例1,說明不包含循環(huán)處理的例子。
在圖6中示出具體例1的編碼單元26的結(jié)構(gòu)例。具體例1的編碼單元26如圖6所示,例如具備增益取得單元261、量化單元262、rice參數(shù)決定單元263、golomb-rice編碼單元264、以及增益編碼單元265。以下,說明圖6的各單元。
<增益取得單元261>
增益取得單元261根據(jù)所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1),決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g并進行輸出(步驟261)。增益取得單元261例如得到所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的能量的合計的平方根和與分配比特數(shù)b有負相關(guān)的常數(shù)的乘法值作為全局增益g并進行輸出?;蛘?,也可以是增益取得單元261將所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的能量的合計、分配比特數(shù)b、全局增益g的關(guān)系預(yù)先表格化,通過參照該表而得到全局增益g并進行輸出。
這樣,增益取得單元261得到例如用于對歸一化mdct系數(shù)串即歸一化頻域樣本串的全樣本進行除法的增益。
<量化單元262>
量化單元262得到基于將所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以增益取得單元261得到的全局增益g后的結(jié)果的整數(shù)部分的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)并進行輸出(步驟262)。
這樣,量化單元262例如將歸一化mdct系數(shù)串即歸一化頻域樣本串的各樣本除以增益且進行量化而求得已量化歸一化系數(shù)序列。
<rice參數(shù)決定單元263>
rice參數(shù)決定單元263根據(jù)增益取得單元261得到的全局增益g、所輸入的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、所輸入的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),通過上述的式(8)得到rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)并進行輸出(步驟263)。
這樣,rice參數(shù)決定單元263基于平滑化振幅頻譜包絡(luò)序列、非平滑化振幅頻譜包絡(luò)序列、增益,按量化歸一化系數(shù)序列的各系數(shù)的每個求得用于對已量化歸一化系數(shù)序列進行g(shù)olomb-rice編碼的rice參數(shù)。
編碼側(cè)的萊斯參數(shù)決定裝置是至少具備rice參數(shù)決定單元263的裝置。編碼側(cè)的萊斯參數(shù)決定裝置也可以具備非平滑化振幅頻譜包絡(luò)序列生成單元23、平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25、增益取得單元261、量化單元262等其他單元。
<golomb-rice編碼單元264>
golomb-rice編碼單元264使用rice參數(shù)決定單元263得到的rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)作為與已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)對應(yīng)的rice參數(shù),對量化單元262得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行g(shù)olomb-rice編碼而得到整數(shù)信號碼并進行輸出(步驟264)。
<增益編碼單元265>
增益編碼單元265對增益取得單元261得到的全局增益g進行編碼而得到增益碼并進行輸出(步驟265)。
所生成的整數(shù)信號碼和增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
即,本具體例的步驟261至265分別與上述的步驟a6-1~a6-5對應(yīng)。
[編碼單元26進行的編碼處理的具體例2]
作為編碼單元26進行的編碼處理的具體例2,說明包含循環(huán)處理的例子。
在圖7中示出具體例2的編碼單元26的結(jié)構(gòu)例。具體例2的編碼單元26如圖7所示,例如具備增益取得單元261、量化單元262、rice參數(shù)決定單元263、golomb-rice編碼單元264、增益編碼單元265、判定單元266、以及增益更新單元267。以下,說明圖7的各單元。
<增益取得單元261>
增益取得單元261根據(jù)所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1),決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g并進行輸出(步驟261)。增益取得單元261例如得到歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的能量的合計的平方根和與分配比特數(shù)b有負相關(guān)的常數(shù)的乘法值作為全局增益g并進行輸出。
增益取得單元261得到的全局增益g成為在量化單元262及rice參數(shù)決定單元263中使用的全局增益的初始值。
這樣,增益取得單元261得到例如用于對作為歸一化mdct系數(shù)串的歸一化頻域樣本串的全樣本進行除法的增益。
<量化單元262>
量化單元262得到基于將所輸入的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以增益取得單元261或者增益更新單元267得到的全局增益g后的結(jié)果的整數(shù)部分的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)并進行輸出(步驟262)。
在此,在初次執(zhí)行量化單元262的處理時使用的全局增益g是增益取得單元261得到的全局增益g、即全局增益的初始值。此外,在第二次以后執(zhí)行量化單元262的處理時使用的全局增益g是增益更新單元267得到的全局增益g、即全局增益的更新值。
這樣,量化單元262將例如歸一化mdct系數(shù)串即歸一化頻域樣本串的各樣本除以增益且進行量化而求得已量化歸一化系數(shù)序列。
<rice參數(shù)決定單元263>
rice參數(shù)決定單元263根據(jù)增益取得單元261或者增益更新單元267得到的全局增益g、所輸入的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、所輸入的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),通過上述的式(8)得到rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)并進行輸出(步驟263)。
在此,在初次執(zhí)行rice參數(shù)決定單元263的處理時使用的全局增益g是增益取得單元261得到的全局增益g、即全局增益的初始值。此外,在第二次以后執(zhí)行rice參數(shù)決定單元263的處理時使用的全局增益g是增益更新單元267得到的全局增益g、即全局增益的更新值。
這樣,rice參數(shù)決定單元263基于平滑化振幅頻譜包絡(luò)序列、非平滑化振幅頻譜包絡(luò)序列、增益,按量化歸一化系數(shù)序列的各系數(shù)的每個求得用于對已量化歸一化系數(shù)序列進行g(shù)olomb-rice編碼的rice參數(shù)。
編碼側(cè)的萊斯參數(shù)決定裝置是至少具備rice參數(shù)決定單元263的裝置。編碼側(cè)的萊斯參數(shù)決定裝置也可以具備非平滑化振幅頻譜包絡(luò)序列生成單元23、平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25、增益取得單元261、量化單元262等其他單元。
<golomb-rice編碼單元264>
golomb-rice編碼單元264使用rice參數(shù)決定單元263得到的rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)作為與已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)對應(yīng)的rice參數(shù),對量化單元262得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行g(shù)olomb-rice編碼而得到整數(shù)信號碼,輸出整數(shù)信號碼、和整數(shù)信號碼的比特數(shù)即消耗比特數(shù)c(步驟264)。
<判定單元266>
判定單元266進行基于增益的更新次數(shù)的判定。具體而言,判定單元266在增益的更新次數(shù)為預(yù)先決定的次數(shù)的情況下,輸出整數(shù)信號碼,且對增益編碼單元265輸出對增益更新單元267得到的全局增益g進行編碼的指示信號,在增益的更新次數(shù)小于預(yù)先決定的次數(shù)的情況下,對增益更新單元267輸出golomb-rice編碼單元264測量的消耗比特數(shù)c(步驟s266)。
<增益更新單元267>
增益更新單元267在golomb-rice編碼單元264測量的消耗比特數(shù)c比分配比特數(shù)b多的情況下將全局增益g的值更新為較大的值并進行輸出,在消耗比特數(shù)c比分配比特數(shù)b少的情況下將全局增益g的值更新為較小的值,輸出更新后的全局增益g的值(步驟267)。
<增益編碼單元265>
增益編碼單元265按照判定單元266輸出的指示信號,對增益更新單元267得到的全局增益g進行編碼而得到增益碼并進行輸出(步驟265)。
判定單元266輸出的整數(shù)信號碼、和增益編碼單元265輸出的增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
即,在本具體例中,最后進行的步驟267、步驟262、步驟263、步驟264分別對應(yīng)于上述的步驟a6-1~a6-4,步驟265對應(yīng)于上述的步驟a6-5。
另外,關(guān)于編碼單元26進行的編碼處理的具體例2,在國際公開2014/054556等中進一步詳細說明。
(第一實施方式的解碼)
在圖9中示出與第一實施方式的編碼裝置對應(yīng)的解碼裝置的結(jié)構(gòu)例。第一實施方式的解碼裝置如圖9所示,例如具備線性預(yù)測系數(shù)解碼單元31、非平滑化振幅頻譜包絡(luò)序列生成單元32、平滑化振幅頻譜包絡(luò)序列生成單元33、解碼單元34、包絡(luò)逆歸一化單元35、以及時域變換單元36。在圖10中示出由該解碼裝置實現(xiàn)的第一實施方式的解碼方法的各處理的例子。
向解碼裝置至少輸入編碼裝置輸出的與歸一化mdct系數(shù)串對應(yīng)的碼及線性預(yù)測系數(shù)碼。
以下,說明圖9的各單元。
<線性預(yù)測系數(shù)解碼單元31>
向線性預(yù)測系數(shù)解碼單元31輸入編碼裝置輸出的線性預(yù)測系數(shù)碼。
線性預(yù)測系數(shù)解碼單元31按每幀而通過例如以往的解碼技術(shù)對所輸入的線性預(yù)測系數(shù)碼進行解碼而得到解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp(步驟b1)。
所得到的解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp被輸出至非平滑化振幅頻譜包絡(luò)序列生成單元32及平滑化振幅頻譜包絡(luò)序列生成單元33。
在此,以往的解碼技術(shù)例如是,在線性預(yù)測系數(shù)碼為與量化后的線性預(yù)測系數(shù)對應(yīng)的碼的情況下對線性預(yù)測系數(shù)碼進行解碼而得到與量化后的線性預(yù)測系數(shù)相同的解碼線性預(yù)測系數(shù)的技術(shù)、在線性預(yù)測系數(shù)碼為與量化后的lsp參數(shù)對應(yīng)的碼的情況下對線性預(yù)測系數(shù)碼進行解碼而得到與量化后的lsp參數(shù)相同的解碼lsp參數(shù)的技術(shù)等。此外,線性預(yù)測系數(shù)和lsp參數(shù)能夠相互變換,根據(jù)所輸入的線性預(yù)測系數(shù)碼和后級的處理中所需的信息,進行解碼線性預(yù)測系數(shù)和解碼lsp參數(shù)之間的變換處理即可是公知的。根據(jù)以上,包含上述的線性預(yù)測系數(shù)碼的解碼處理和根據(jù)需要進行的上述的變換處理的處理稱為“基于以往的解碼技術(shù)的解碼”。
<非平滑化振幅頻譜包絡(luò)序列生成單元32>
向非平滑化振幅頻譜包絡(luò)序列生成單元32輸入線性預(yù)測系數(shù)解碼單元31得到的解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp。
非平滑化振幅頻譜包絡(luò)序列生成單元32通過上述的式(13)生成與解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)(步驟b2)。
所生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)被輸出至解碼單元34。
這樣,非平滑化振幅頻譜包絡(luò)序列生成單元32得到與對應(yīng)于所輸入的線性預(yù)測系數(shù)碼的線性預(yù)測系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列。
<平滑化振幅頻譜包絡(luò)序列生成單元33>
向平滑化振幅頻譜包絡(luò)序列生成單元33輸入線性預(yù)測系數(shù)解碼單元31得到的解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp。
平滑化振幅頻譜包絡(luò)序列生成單元33通過上述的式(14)生成使與解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凸凹平緩的序列即平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)(步驟b3)。
所生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)被輸出至解碼單元34及包絡(luò)逆歸一化單元35。
這樣,平滑化振幅頻譜包絡(luò)序列生成單元33得到將與對應(yīng)于所輸入的線性預(yù)測系數(shù)碼的線性預(yù)測系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凸凹平滑化的序列即平滑化振幅頻譜包絡(luò)序列。
<解碼單元34>
向解碼單元34輸入與編碼裝置輸出的歸一化mdct系數(shù)串對應(yīng)的碼、非平滑化振幅頻譜包絡(luò)生成單元32生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)及平滑化振幅頻譜包絡(luò)生成單元33生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)。
解碼單元34具備rice參數(shù)決定單元341。
解碼單元34通過進行圖11中例示的步驟b4-1至步驟b4-4的處理來進行編碼(步驟b4)。即,解碼單元34按每幀而對與所輸入的歸一化mdct系數(shù)串對應(yīng)的碼中包含的增益碼進行解碼而得到全局增益g(步驟b4-1)。解碼單元34的rice參數(shù)決定單元341根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),通過上述的式(8)求得rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)(步驟b4-2)。解碼單元34使用rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)對與歸一化mdct系數(shù)串對應(yīng)的碼中包含的整數(shù)信號碼進行g(shù)olomb-rice解碼而得到已解碼歸一化系數(shù)序列^xq(0),^xq(1),……,^xq(n-1)(步驟b4-3),對已解碼歸一化系數(shù)序列^xq(0),^xq(1),……,^xq(n-1)的各系數(shù)乘以全局增益g而生成解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)(步驟b4-4)。
所生成的解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)被輸出至包絡(luò)逆歸一化單元35。
這樣,rice參數(shù)決定單元341基于平滑化振幅頻譜包絡(luò)序列、非平滑化振幅頻譜包絡(luò)序列、增益,按上述已解碼量化歸一化系數(shù)序列的各系數(shù)的每個求得用于通過golomb-rice解碼得到已解碼歸一化系數(shù)序列的rice參數(shù)。
此外,解碼單元34對于對所輸入的整數(shù)信號碼進行g(shù)olomb-rice解碼而得到的已解碼歸一化系數(shù)序列的各系數(shù)乘以對所輸入的增益碼進行解碼而得到的增益,得到例如解碼歸一化mdct系數(shù)串即解碼歸一化頻域樣本串。
解碼側(cè)的萊斯參數(shù)決定裝置是至少具備rice參數(shù)決定單元341的裝置。解碼側(cè)的萊斯參數(shù)決定裝置也可以具備非平滑化振幅頻譜包絡(luò)序列生成單元32等其他單元。
<包絡(luò)逆歸一化單元35>
向包絡(luò)逆歸一化單元35輸入平滑化振幅頻譜包絡(luò)生成單元33生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)及解碼單元34生成的解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)。
包絡(luò)逆歸一化單元35使用平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),對解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)進行逆歸一化,從而生成解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)(步驟b5)。
所生成的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)被輸出至?xí)r域變換單元36。
例如,包絡(luò)逆歸一化單元35設(shè)為k=0,1,……,n-1,對解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)的各系數(shù)^xn(k)乘以平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各包絡(luò)值^hγ(k)從而生成解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)。即,設(shè)為k=0,1,……,n-1,^x(k)=^xn(k)×^hγ(k)。
這樣,包絡(luò)逆歸一化單元35得到例如將解碼歸一化mdct系數(shù)串即歸一化頻域樣本串的各系數(shù)、和平滑化振幅頻譜包絡(luò)序列的對應(yīng)的系數(shù)相乘后的結(jié)果即解碼頻域樣本串。
<時域變換單元36>
向時域變換單元36輸入包絡(luò)逆歸一化單元35生成的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)。
時域變換單元36按每幀而將包絡(luò)逆歸一化單元35得到的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)變換為時域,得到幀單位的音信號(解碼音信號)(步驟b6)。
這樣,時域變換單元36得到例如與解碼mdct系數(shù)串即解碼頻域樣本串對應(yīng)的解碼音信號。
[第二實施方式]
(第二實施方式的編碼)
在圖4中示出第二實施方式的編碼裝置的結(jié)構(gòu)例。第二實施方式的編碼裝置如圖4所示,例如具備頻域變換單元21、線性預(yù)測分析單元22、非平滑化振幅頻譜包絡(luò)序列生成單元23、平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25、編碼單元26。在圖5中示出由該編碼裝置實現(xiàn)的第二實施方式的編碼方法的各處理的例子。
以下,說明圖4的各單元。
<頻域變換單元21>
向頻域變換單元21輸入時域的音信號。音信號的例子是聲音數(shù)字信號或者音響數(shù)字信號。
頻域變換單元21以規(guī)定的時間長的幀為單位,將所輸入的時域的音信號變換為頻域的n點的mdct系數(shù)串x(0),x(1),……,x(n-1)(步驟a1)。n為正整數(shù)。
所得到的mdct系數(shù)串x(0),x(1),……,x(n-1)被輸出至線性預(yù)測分析單元22和包絡(luò)歸一化單元25。
只要沒有特別提及,設(shè)為以后的處理以幀為單位來進行。
這樣,頻域變換單元21求得與音信號對應(yīng)的例如mdct系數(shù)串即頻域樣本串。
<線性預(yù)測分析單元22>
向線性預(yù)測分析單元22輸入頻域變換單元21得到的mdct系數(shù)串x(0),x(1),……,x(n-1)。
線性預(yù)測分析單元22使用mdct系數(shù)串x(0),x(1),……,x(n-1),對由以下的式(16)定義的~x(0),~x(1),……,~x(n-1)進行線性預(yù)測分析而生成線性預(yù)測系數(shù)α1,α2,……,αp,對所生成的線性預(yù)測系數(shù)α1,α2,……,αp進行編碼,生成線性預(yù)測系數(shù)碼和與線性預(yù)測系數(shù)碼對應(yīng)的量化后的線性預(yù)測系數(shù)即量化線性預(yù)測系數(shù)^α1,^α2,……,^αp(步驟a2)。
所生成的量化線性預(yù)測系數(shù)^α1,^α2,……,^αp被輸出至非平滑化頻譜包絡(luò)序列生成單元23和平滑化振幅頻譜包絡(luò)序列生成單元24。
此外,所生成的線性預(yù)測系數(shù)碼被發(fā)送至解碼裝置。
具體而言,線性預(yù)測分析單元22通過進行式(16)的運算,求得與mdct系數(shù)串x(0),x(1),……,x(n-1)對應(yīng)的時域的信號串即偽相關(guān)函數(shù)信號串~x(0),~x(1),……,~x(n-1)。并且,線性預(yù)測分析單元22使用所求得的偽相關(guān)函數(shù)信號串~x(0),~x(1),……,~x(n-1)進行線性預(yù)測分析,生成線性預(yù)測系數(shù)α1,α2,……,αp。并且,線性預(yù)測分析單元22通過對所生成的線性預(yù)測系數(shù)α1,α2,……,αp進行編碼,得到線性預(yù)測系數(shù)碼、和與線性預(yù)測系數(shù)碼對應(yīng)的量化線性預(yù)測系數(shù)^α1,^α2,……,^αp。
基于線性預(yù)測分析單元22的線性預(yù)測系數(shù)碼的生成例如通過以往的編碼技術(shù)來進行。以往的編碼技術(shù)例如是,將與線性預(yù)測系數(shù)本身對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)、將線性預(yù)測系數(shù)變換為lsp參數(shù)而將與lsp參數(shù)對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)、將線性預(yù)測系數(shù)變換為parcor系數(shù)而將與parcor系數(shù)對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)等。例如,將與線性預(yù)測系數(shù)本身對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)是,預(yù)先決定多個量化線性預(yù)測系數(shù)的候選,各候選與線性預(yù)測系數(shù)碼預(yù)先相關(guān)聯(lián)而存儲,決定候選的其中一個作為對于所生成的線性預(yù)測系數(shù)的量化線性預(yù)測系數(shù),得到量化線性預(yù)測系數(shù)和線性預(yù)測系數(shù)碼的技術(shù)。
<非平滑化振幅頻譜包絡(luò)序列生成單元23>
向非平滑化振幅頻譜包絡(luò)序列生成單元23輸入線性預(yù)測分析單元22生成的量化線性預(yù)測系數(shù)^α1,^α2,……,^αp。
非平滑化振幅頻譜包絡(luò)序列生成單元23生成與量化線性預(yù)測系數(shù)^α1,^α2,……,^αp對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)(步驟a3)。
所生成的非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)被輸出至編碼單元26。
非平滑化振幅頻譜包絡(luò)序列生成單元23使用量化線性預(yù)測系數(shù)^α1,^α2,……,^αp,生成由以下的式(17)定義的非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)作為非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)。
這樣,非平滑化振幅頻譜包絡(luò)序列生成單元23得到與音信號對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列。
<平滑化振幅頻譜包絡(luò)序列生成單元24>
向平滑化振幅頻譜包絡(luò)序列生成單元24輸入線性預(yù)測分析單元22生成的量化線性預(yù)測系數(shù)^α1,^α2,……,^αp。
平滑化振幅頻譜包絡(luò)序列生成單元24生成使與量化線性預(yù)測系數(shù)^α1,^α2,……,^αp對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凸凹平緩的序列即平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)(步驟a4)。
所生成的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)被輸出至包絡(luò)歸一化單元25及編碼單元26。
平滑化振幅頻譜包絡(luò)序列生成單元24使用量化線性預(yù)測系數(shù)^α1,^α2,……,^αp和校正系數(shù)γ,生成由以下的式(18)定義的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)作為平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)。
在此,校正系數(shù)γ是預(yù)先決定的小于1的常數(shù)并且是使非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)的振幅的凹凸平緩的系數(shù)、換言之將非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)平滑化的系數(shù)。
這樣,平滑化振幅頻譜包絡(luò)序列生成單元24得到將非平滑化振幅頻譜包絡(luò)序列的振幅的凸凹平滑化的序列即平滑化振幅頻譜包絡(luò)序列。
<包絡(luò)歸一化單元25>
向包絡(luò)歸一化單元25輸入頻域變換單元21得到的mdct系數(shù)串x(0),x(1),……,x(n-1)及平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)。
包絡(luò)歸一化單元25通過將mdct系數(shù)串x(0),x(1),……,x(n-1)的各系數(shù)以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)的各值來歸一化,從而生成歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)(步驟a5)。
所生成的歸一化mdct系數(shù)串被輸出至編碼單元26。
包絡(luò)歸一化單元25例如設(shè)為k=0,1,……,n-1,將mdct系數(shù)串x(0),x(1),……,x(n-1)的各系數(shù)x(k)除以平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1),從而生成歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)xn(k)。即,設(shè)為k=0,1,……,n-1,xn(k)=x(k)/^wγ(k)。
這樣,包絡(luò)歸一化單元25將例如mdct系數(shù)串即頻域樣本串的各樣本以平滑化振幅頻譜包絡(luò)序列的對應(yīng)的樣本來歸一化,得到例如歸一化mdct系數(shù)串即歸一化頻域樣本串。
<編碼單元26>
向編碼單元26輸入包絡(luò)歸一化單元25生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)、非平滑化振幅頻譜包絡(luò)生成單元23生成的非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)及平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)。
編碼單元26通過進行圖8中例示的步驟a6-1至步驟a6-5的處理來進行編碼(步驟a6)。即,編碼單元26求得與歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)對應(yīng)的全局增益g(步驟a6-1),求得基于對將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以全局增益g后的結(jié)果進行量化后的整數(shù)值的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)(步驟a6-2),根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)、平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1),通過上述的式(5)求得與已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)對應(yīng)的rice參數(shù)r(0),r(1),……,r(n-1)(步驟a6-3),使用rice參數(shù)r(0),r(1),……,r(n-1)對已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)進行g(shù)olomb-rice編碼而得到整數(shù)信號碼(步驟a6-4),得到與全局增益g對應(yīng)的增益碼(步驟a6-5)。在此,關(guān)于上述的式(5)中的歸一化振幅頻譜包絡(luò)序列^wn(0),^wn(1),……,^wn,將非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)的各值除以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)的各值、即通過以下的式(19)而求得。
所生成的整數(shù)信號碼和增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
編碼單元26通過上述的步驟a6-1~a6-5,實現(xiàn)決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g,生成與所決定的全局增益g對應(yīng)的增益碼、和與該決定的全局增益g對應(yīng)的整數(shù)信號碼的功能。
編碼單元26進行的步驟a6-1至步驟a6-5之中包含特征的處理的是步驟a6-3。在通過對全局增益g和已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各個進行編碼從而得到與歸一化mdct系數(shù)串對應(yīng)的碼的編碼處理本身中,存在包含非專利文獻1中記載的技術(shù)的各種公知技術(shù)。
編碼單元26進行的編碼處理的具體例如第一實施方式的編碼單元26的說明處所說明的那樣。
這樣,rice參數(shù)決定單元263基于平滑化振幅頻譜包絡(luò)序列、非平滑化振幅頻譜包絡(luò)序列、增益,按量化歸一化系數(shù)序列的各系數(shù)的每個求得用于對已量化歸一化系數(shù)序列進行g(shù)olomb-rice編碼的rice參數(shù)。
編碼側(cè)的萊斯參數(shù)決定裝置是至少具備rice參數(shù)決定單元263的裝置。編碼側(cè)的萊斯參數(shù)決定裝置也可以具備非平滑化振幅頻譜包絡(luò)序列生成單元23、平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25、增益取得單元261、量化單元262等其他單元。
(第二實施方式的解碼)
在圖9中示出與第二實施方式的編碼裝置對應(yīng)的解碼裝置的結(jié)構(gòu)例。第二實施方式的解碼裝置如圖9所示,例如具備線性預(yù)測系數(shù)解碼單元31、非平滑化振幅頻譜包絡(luò)序列生成單元32、平滑化振幅頻譜包絡(luò)序列生成單元33、解碼單元34、包絡(luò)逆歸一化單元35、時域變換單元36。在圖10中示出由該解碼裝置實現(xiàn)的第二實施方式的解碼方法的各處理的例子。
向解碼裝置至少輸入編碼裝置輸出的與歸一化mdct系數(shù)串對應(yīng)的碼及線性預(yù)測系數(shù)碼。
以下,說明圖9的各單元。
<線性預(yù)測系數(shù)解碼單元31>
向線性預(yù)測系數(shù)解碼單元31輸入編碼裝置輸出的線性預(yù)測系數(shù)碼。
線性預(yù)測系數(shù)解碼單元31按每幀而通過例如以往的解碼技術(shù)對所輸入的線性預(yù)測系數(shù)碼進行解碼而得到解碼線性預(yù)測系數(shù)^α1,^α2,……,^αp(步驟b1)。
所得到的解碼線性預(yù)測系數(shù)^α1,^α2,……,^αp被輸出至非平滑化振幅頻譜包絡(luò)序列生成單元32及非平滑化振幅頻譜包絡(luò)序列生成單元33。
在此,以往的解碼技術(shù)例如是,在線性預(yù)測系數(shù)碼為與量化后的線性預(yù)測系數(shù)對應(yīng)的碼的情況下對線性預(yù)測系數(shù)碼進行解碼而得到與量化后的線性預(yù)測系數(shù)相同的解碼線性預(yù)測系數(shù)的技術(shù)、在線性預(yù)測系數(shù)碼為與量化后的lsp參數(shù)對應(yīng)的碼的情況下對線性預(yù)測系數(shù)碼進行解碼而得到與量化后的lsp參數(shù)相同的解碼lsp參數(shù)的技術(shù)等。此外,線性預(yù)測系數(shù)和lsp參數(shù)能夠相互變換,根據(jù)所輸入的線性預(yù)測系數(shù)碼和后級的處理中所需的信息,進行解碼線性預(yù)測系數(shù)和解碼lsp參數(shù)之間的變換處理即可是公知的。根據(jù)以上,包含上述的線性預(yù)測系數(shù)碼的解碼處理和根據(jù)需要進行的上述的變換處理的處理稱為“基于以往的解碼技術(shù)的解碼”。
<非平滑化振幅頻譜包絡(luò)序列生成單元32>
向非平滑化振幅頻譜包絡(luò)序列生成單元32輸入線性預(yù)測系數(shù)解碼單元31得到的解碼線性預(yù)測系數(shù)^α1,^α2,……,^αp。
非平滑化振幅頻譜包絡(luò)序列生成單元32通過上述的式(17)生成與解碼線性預(yù)測系數(shù)^α1,^α2,……,^αp對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)(步驟b2)。
所生成的非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)被輸出至解碼單元34。
這樣,非平滑化振幅頻譜包絡(luò)序列生成單元32得到與對應(yīng)于所輸入的線性預(yù)測系數(shù)碼的線性預(yù)測系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列。
<平滑化振幅頻譜包絡(luò)序列生成單元33>
向平滑化振幅頻譜包絡(luò)序列生成單元33輸入線性預(yù)測系數(shù)解碼單元31得到的解碼線性預(yù)測系數(shù)^α1,^α2,……,^αp。
平滑化振幅頻譜包絡(luò)序列生成單元33通過上述的式(18)生成使與解碼線性預(yù)測系數(shù)^α1,^α2,……,^αp對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凸凹平緩的序列即平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)(步驟b3)。
所生成的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)被輸出至解碼單元34及包絡(luò)逆歸一化單元35。
這樣,平滑化振幅頻譜包絡(luò)序列生成單元33得到將與對應(yīng)于所輸入的線性預(yù)測系數(shù)碼的線性預(yù)測系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凸凹平滑化的序列即平滑化振幅頻譜包絡(luò)序列。
<解碼單元34>
向解碼單元34輸入與編碼裝置輸出的歸一化mdct系數(shù)串對應(yīng)的碼、非平滑化振幅頻譜包絡(luò)生成單元32生成的非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)及平滑化振幅頻譜包絡(luò)生成單元33生成的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)。
解碼單元34具備rice參數(shù)決定單元341。
解碼單元34通過進行圖11中例示的步驟b4-1至步驟b4-4的處理來進行解碼(步驟b4)。即,解碼單元34按每幀而對與所輸入的歸一化mdct系數(shù)串對應(yīng)的碼中包含的增益碼進行解碼而得到全局增益g(步驟b4-1)。解碼單元34的rice參數(shù)決定單元341根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^w(0),^w(1),……,^w(n-1)、平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1),通過上述的式(5)求得rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)(步驟b4-2)。解碼單元34使用rice參數(shù)序列r(0),r(1),……,r(n-1)的各rice參數(shù)對與歸一化mdct系數(shù)串對應(yīng)的碼中包含的整數(shù)信號碼進行g(shù)olomb-rice解碼而得到已解碼歸一化系數(shù)序列^xq(0),^xq(1),……,^xq(n-1)(步驟b4-3),對已解碼歸一化系數(shù)序列^xq(0),^xq(1),……,^xq(n-1)的各系數(shù)乘以全局增益g而生成解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)(步驟b4-4)。
所生成的解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)被輸出至包絡(luò)逆歸一化單元35。
這樣,rice參數(shù)決定單元341基于平滑化振幅頻譜包絡(luò)序列、非平滑化振幅頻譜包絡(luò)序列、增益,按上述已解碼量化歸一化系數(shù)序列的各系數(shù)的每個求得用于通過golomb-rice解碼得到已解碼歸一化系數(shù)序列的rice參數(shù)。
此外,解碼單元34對于對所輸入的整數(shù)信號碼進行g(shù)olomb-rice解碼而得到的已解碼歸一化系數(shù)序列的各系數(shù)乘以對所輸入的增益碼進行解碼而得到的增益,得到例如解碼歸一化mdct系數(shù)串即解碼歸一化頻域樣本串。
解碼側(cè)的萊斯參數(shù)決定裝置是至少具備rice參數(shù)決定單元341的裝置。解碼側(cè)的萊斯參數(shù)決定裝置也可以具備非平滑化振幅頻譜包絡(luò)序列生成單元32等其他單元。
<包絡(luò)逆歸一化單元35>
向包絡(luò)逆歸一化單元35輸入平滑化振幅頻譜包絡(luò)生成單元33生成的平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)及解碼單元34生成的解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)。
包絡(luò)逆歸一化單元35使用平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1),對解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)進行逆歸一化,從而生成解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)(步驟b5)。
所生成的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)被輸出至?xí)r域變換單元36。
例如,包絡(luò)逆歸一化單元35設(shè)為k=0,1,……,n-1,對解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)的各系數(shù)^xn(k)乘以平滑化振幅頻譜包絡(luò)序列^wγ(0),^wγ(1),……,^wγ(n-1)的各包絡(luò)值^wγ(k)從而生成解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)。即,設(shè)為k=0,1,……,n-1,^x(k)=^xn(k)×^wγ(k)。
這樣,包絡(luò)逆歸一化單元35得到例如將解碼歸一化mdct系數(shù)串即歸一化頻域樣本串的各系數(shù)、和平滑化振幅頻譜包絡(luò)序列的對應(yīng)的系數(shù)相乘的解碼頻域樣本串。
<時域變換單元36>
向時域變換單元36輸入包絡(luò)逆歸一化單元35生成的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)。
時域變換單元36按每幀而將包絡(luò)逆歸一化單元35得到的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)變換為時域,得到幀單位的音信號(解碼音信號)(步驟b6)。
這樣,時域變換單元36得到例如與解碼mdct系數(shù)串即解碼頻域樣本串對應(yīng)的解碼音信號。
[第三實施方式]
(第三實施方式的編碼)
在圖4中示出第三實施方式的編碼裝置的結(jié)構(gòu)例。第三實施方式的編碼裝置如圖4所示,例如具備頻域變換單元21、線性預(yù)測分析單元22、非平滑化振幅頻譜包絡(luò)序列生成單元23、平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25、以及編碼單元26。在圖5中示出由該編碼裝置實現(xiàn)的第三實施方式的編碼方法的各處理的例子。
以下,說明圖4的各單元。
<頻域變換單元21>
向頻域變換單元21輸入作為時域的時序信號的音信號。音信號的例子是聲音數(shù)字信號或者音響數(shù)字信號。
頻域變換單元21以規(guī)定的時間長的幀為單位,將所輸入的時域的音信號變換為頻域的n點的mdct系數(shù)串x(0),x(1),……,x(n-1)(步驟a1)。n為正整數(shù)。
所得到的mdct系數(shù)串x(0),x(1),……,x(n-1)被輸出至線性預(yù)測分析單元22和包絡(luò)歸一化單元25。
只要沒有特別提及,設(shè)為以后的處理以幀為單位來進行。
這樣,頻域變換單元21求得與音信號對應(yīng)的例如mdct系數(shù)串即頻域樣本串。
<線性預(yù)測分析單元22>
向線性預(yù)測分析單元22輸入頻域變換單元21得到的mdct系數(shù)串x(0),x(1),……,x(n-1)。
線性預(yù)測分析單元22使用mdct系數(shù)串x(0),x(1),……,x(n-1),對由以下的式(a7)定義的~r(0),~r(1),……,~r(n-1)進行線性預(yù)測分析而生成線性預(yù)測系數(shù)β1,β2,……,βp,對所生成的線性預(yù)測系數(shù)β1,β2,……,βp進行編碼而生成線性預(yù)測系數(shù)碼和與線性預(yù)測系數(shù)碼對應(yīng)的量化后的線性預(yù)測系數(shù)即量化線性預(yù)測系數(shù)^β1,^β2,……,^βp(步驟a2)。
其中,η為形狀參數(shù),預(yù)先決定。例如,將η設(shè)為2以外的規(guī)定的整數(shù)。
所生成的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp被輸出至非平滑化頻譜包絡(luò)序列生成單元23和平滑化振幅頻譜包絡(luò)序列生成單元24。另外,以線性預(yù)測分析處理的過程算出預(yù)測殘差的能量σ2。在該情況下,所算出的預(yù)測殘差的能量σ2被輸出至方差參數(shù)決定單元268。
此外,所生成的線性預(yù)測系數(shù)碼被發(fā)送至解碼裝置。
具體而言,線性預(yù)測分析單元22首先進行相當于將mdct系數(shù)串x(0),x(1),……,x(n-1)的絕對值的η次方視為了功率譜的傅里葉逆變換的運算、即式(a7)的運算,求得與mdct系數(shù)串x(0),x(1),……,x(n-1)的絕對值的η次方對應(yīng)的時域的信號串即偽相關(guān)函數(shù)信號串~r(0),~r(1),……,~r(n-1)。并且,線性預(yù)測分析單元22使用所求得的偽相關(guān)函數(shù)信號串~r(0),~r(1),……,~r(n-1)進行線性預(yù)測分析,生成線性預(yù)測系數(shù)β1,β2,……,βp。并且,線性預(yù)測分析單元22對所生成的線性預(yù)測系數(shù)β1,β2,……,βp進行編碼,從而得到線性預(yù)測系數(shù)碼、和與線性預(yù)測系數(shù)碼對應(yīng)的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp。
線性預(yù)測系數(shù)β1,β2,……,βp是與將mdct系數(shù)串x(0),x(1),……,x(n-1)的絕對值的η次方視為了功率譜時的時域的信號對應(yīng)的線性預(yù)測系數(shù)。
基于線性預(yù)測分析單元22的線性預(yù)測系數(shù)碼的生成例如通過以往的編碼技術(shù)來進行。以往的編碼技術(shù)例如是,將與線性預(yù)測系數(shù)本身對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)、將線性預(yù)測系數(shù)變換為lsp參數(shù)而將與lsp參數(shù)對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)、將線性預(yù)測系數(shù)變換為parcor系數(shù)而將與parcor系數(shù)對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)等。例如,將與線性預(yù)測系數(shù)本身對應(yīng)的碼設(shè)為線性預(yù)測系數(shù)碼的編碼技術(shù)是,預(yù)先決定多個量化線性預(yù)測系數(shù)的候選,各候選與線性預(yù)測系數(shù)碼預(yù)先相關(guān)聯(lián)而存儲,決定候選的其中一個作為對于所生成的線性預(yù)測系數(shù)的量化線性預(yù)測系數(shù),得到量化線性預(yù)測系數(shù)和線性預(yù)測系數(shù)碼的技術(shù)。
這樣,線性預(yù)測分析單元22使用將例如mdct系數(shù)串即頻域樣本串的絕對值的η次方視為了功率譜的通過進行傅里葉逆變換而得到的偽相關(guān)函數(shù)信號串來進行線性預(yù)測分析,生成能夠變換為線性預(yù)測系數(shù)的系數(shù)。
<非平滑化振幅頻譜包絡(luò)序列生成單元23>
向非平滑化振幅頻譜包絡(luò)序列生成單元23輸入線性預(yù)測分析單元22生成的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp。
非平滑化振幅頻譜包絡(luò)序列生成單元23生成與量化線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)(步驟a3)。
所生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)被輸出至編碼單元26。
非平滑化振幅頻譜包絡(luò)序列生成單元23使用量化線性預(yù)測系數(shù)^β1,^β2,……,^βp,生成由式(a2)定義的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)作為非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)。
這樣,非平滑化振幅頻譜包絡(luò)序列生成單元23通過得到對與由線性預(yù)測分析單元22生成的能夠變換為線性預(yù)測系數(shù)的系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列進行1/η次方后的序列即非平滑化頻譜包絡(luò)序列,從而進行頻譜包絡(luò)的估計。在此,將c設(shè)為任意的數(shù),對由多個值構(gòu)成的序列進行c次方后的序列是,由對多個值的各個值進行c次方后的值構(gòu)成的序列。例如,對振幅頻譜包絡(luò)的序列進行1/η次方后的序列是,由對振幅頻譜包絡(luò)的各系數(shù)進行1/η次方后的值構(gòu)成的序列。
基于非平滑化振幅頻譜包絡(luò)序列生成單元23的1/η次方的處理因由線性預(yù)測分析單元22進行的將頻域樣本串的絕對值的η次方視為了功率譜的處理引起。即,基于非平滑化振幅頻譜包絡(luò)序列生成單元23的1/η次方的處理為了通過由線性預(yù)測分析單元22進行的將頻域樣本串的絕對值的η次方視為了功率譜的處理將η次方后的值返回原來的值而進行。
在第一實施方式及第二實施方式中使用由式(13)定義的hγ(k)[k=0,1,……,n-1],相對于此,在第三實施方式中使用由式(a2)定義的hγ(k)[k=0,1,……,n-1]。
<平滑化振幅頻譜包絡(luò)序列生成單元24>
向平滑化振幅頻譜包絡(luò)序列生成單元24輸入線性預(yù)測分析單元22生成的量化線性預(yù)測系數(shù)^β1,^β2,……,^βp。
平滑化振幅頻譜包絡(luò)序列生成單元24生成使與量化線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凸凹平緩的序列即平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)(步驟a4)。
所生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)被輸出至包絡(luò)歸一化單元25及編碼單元26。
平滑化振幅頻譜包絡(luò)序列生成單元24使用量化線性預(yù)測系數(shù)^β1,^β2,……,^βp和校正系數(shù)γ,生成由式(a3)定義的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)作為平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)。
在此,校正系數(shù)γ為預(yù)先決定的小于1的常數(shù)并且是使非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)的振幅的凹凸平緩的系數(shù)、換言之將非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)平滑化的系數(shù)。
在第一實施方式及第二實施方式中使用由式(14)定義的^hγ(k)[k=0,1,……,n-1],相對于此,在第三實施方式中使用由式(a3)定義的^hγ(k)[k=0,1,……,n-1]。
<包絡(luò)歸一化單元25>
向包絡(luò)歸一化單元25輸入頻域變換單元21得到的mdct系數(shù)串x(0),x(1),……,x(n-1)及平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)。
包絡(luò)歸一化單元25通過將mdct系數(shù)串x(0),x(1),……,x(n-1)的各系數(shù)以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各值來歸一化,從而生成歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)(步驟a5)。
所生成的歸一化mdct系數(shù)串被輸出至編碼單元26。
包絡(luò)歸一化單元25例如設(shè)為k=0,1,……,n-1,將mdct系數(shù)串x(0),x(1),……,x(n-1)的各系數(shù)x(k)除以平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),從而生成歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)xn(k)。即,設(shè)為k=0,1,……,n-1,xn(k)=x(k)/^hγ(k)。
<編碼單元26>
向編碼單元26輸入包絡(luò)歸一化單元25生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)、非平滑化振幅頻譜包絡(luò)生成單元23生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)及線性預(yù)測分析單元22算出的平均殘差的能量σ2。
編碼單元26通過例如進行圖13所示的步驟a61至步驟a65的處理來進行編碼(步驟a6)。
編碼單元26求得與歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)對應(yīng)的全局增益g(步驟a61),求得基于對將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以全局增益g后的結(jié)果進行量化后的整數(shù)值的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)(步驟a62),根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)、平均殘差的能量σ2,通過式(a1)求得與已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)對應(yīng)的方差參數(shù)
在此,上述的式(a1)中的歸一化振幅頻譜包絡(luò)序列^hn(0),^hn(1),……,^hn是將非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)的各值除以對應(yīng)的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各值、即通過以下的式(a8)求得的序列。
所生成的整數(shù)信號碼和增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
編碼單元26通過步驟a61至步驟a65,實現(xiàn)以下的功能,即,決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g,生成與所決定的全局增益g對應(yīng)的增益碼、和與該決定的全局增益g對應(yīng)的整數(shù)信號碼。
編碼單元26進行的步驟a61至步驟a65之中包含特征的處理的是步驟a63,在通過對全局增益g和已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各個進行編碼,從而得到與歸一化mdct系數(shù)串對應(yīng)的碼的編碼處理本身中,存在包含非專利文獻1中記載的技術(shù)的各種公知技術(shù)。以下說明兩個編碼單元26進行的編碼處理的具體例。
[編碼單元26進行的編碼處理的具體例1]
作為編碼單元26進行的編碼處理的具體例1,說明不包含循環(huán)處理的例子。
在圖14中示出具體例1的編碼單元26的結(jié)構(gòu)例。具體例1的編碼單元26如圖14所示,例如具備增益取得單元261、量化單元262、方差參數(shù)決定單元268、算術(shù)編碼單元269、增益編碼單元265。以下,說明圖14的各單元。
<增益取得單元261>
向增益取得單元261輸入包絡(luò)歸一化單元25生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)。
增益取得單元261根據(jù)歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1),決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g并進行輸出(步驟s261)。增益取得單元261例如得到歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的能量的合計的平方根和與分配比特數(shù)b有負相關(guān)的常數(shù)的乘法值作為全局增益g并進行輸出。或者,也可以是增益取得單元261將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的能量的合計、分配比特數(shù)b、全局增益g的關(guān)系預(yù)先表格化,通過參照該表而得到全局增益g并進行輸出。
這樣,增益取得單元261得到用于對例如歸一化mdct系數(shù)串即歸一化頻域樣本串的全樣本進行除法的增益。
所得到的全局增益g被輸出至量化單元262及方差參數(shù)決定單元268。
<量化單元262>
向量化單元262輸入包絡(luò)歸一化單元25生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)及增益取得單元261得到的全局增益g。
量化單元262得到基于將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以全局增益g后的結(jié)果的整數(shù)部分的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)并進行輸出(步驟s262)。
這樣,量化單元262將例如歸一化mdct系數(shù)串即歸一化頻域樣本串的各樣本除以增益且進行量化而求得已量化歸一化系數(shù)序列。
所得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)被輸出至算術(shù)編碼單元269。
<方差參數(shù)決定單元268>
向方差參數(shù)決定單元268輸入增益取得單元261得到的全局增益g、非平滑化振幅頻譜包絡(luò)生成單元23生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)及線性預(yù)測分析單元22得到的預(yù)測殘差的能量σ2。
方差參數(shù)決定單元268根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)、預(yù)測殘差的能量σ2,通過上述的式(a1)、式(a8)得到方差參數(shù)序列
所得到的方差參數(shù)序列
<算術(shù)編碼單元269>
向算術(shù)編碼單元269輸入量化單元262得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)及方差參數(shù)決定單元268得到的方差參數(shù)序列
算術(shù)編碼單元269使用方差參數(shù)序列
算術(shù)編碼單元269在算術(shù)編碼時,構(gòu)成在已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)遵照一般化高斯分布
所得到的整數(shù)信號碼被輸出至解碼裝置。
也可以跨越已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)之中的多個系數(shù)進行算術(shù)編碼。在該情況下,從式(a1),式(a8)可知,方差參數(shù)序列
<增益編碼單元265>
向增益編碼單元265輸入增益取得單元261得到的全局增益g。
增益編碼單元265對全局增益g進行編碼而得到增益碼并進行輸出(步驟s265)。
所生成的整數(shù)信號碼和增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
本具體例1的步驟s261、s262、s268、s269、s265分別對應(yīng)于上述的步驟a61、a62、a63、a64、a65。
[編碼單元26進行的編碼處理的具體例2]
作為編碼單元26進行的編碼處理的具體例2,說明包含循環(huán)處理的例子。
在圖15中示出具體例2的編碼單元26的結(jié)構(gòu)例。具體例2的編碼單元26如圖15所示,例如具備增益取得單元261、量化單元262、方差參數(shù)決定單元268、算術(shù)編碼單元269、增益編碼單元265、判定單元266、增益更新單元267。以下,說明圖15的各單元。
<增益取得單元261>
向增益部261輸入包絡(luò)歸一化單元25生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)。
增益取得單元261根據(jù)歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1),決定整數(shù)信號碼的比特數(shù)為預(yù)先分配的比特數(shù)即分配比特數(shù)b以下,且成為盡量大的值的全局增益g并進行輸出(步驟s261)。增益取得單元261例如得到歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的能量的合計的平方根和與分配比特數(shù)b有負相關(guān)的常數(shù)的乘法值作為全局增益g并進行輸出。
所得到的全局增益g被輸出至量化單元262及方差參數(shù)決定單元268。
增益取得單元261得到的全局增益g成為在量化單元262及方差參數(shù)決定單元268中使用的全局增益的初始值。
<量化單元262>
向量化單元262輸入包絡(luò)歸一化單元25生成的歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)及增益取得單元261或者增益更新單元267得到的全局增益g。
量化單元262得到基于將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以全局增益g后的結(jié)果的整數(shù)部分的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)并進行輸出(步驟s262)。
在此,量化單元262在初次執(zhí)行時使用的全局增益g是增益取得單元261得到的全局增益g、即全局增益的初始值。此外,量化單元262在第二次以后執(zhí)行時使用的全局增益g是增益更新單元267得到的全局增益g、即全局增益的更新值。
所得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)被輸出至算術(shù)編碼單元269。
<方差參數(shù)決定單元268>
向方差參數(shù)決定單元268輸入增益取得單元261或者增益更新單元267得到的全局增益g、非平滑化振幅頻譜包絡(luò)生成單元23生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)生成單元24生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)及線性預(yù)測分析單元22得到的預(yù)測殘差的能量σ2。
方差參數(shù)決定單元268根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)、預(yù)測殘差的能量σ2,通過上述的式(a1)、式(a8)得到方差參數(shù)序列
在此,方差參數(shù)決定單元268在初次執(zhí)行時使用的全局增益g是增益取得單元261得到的全局增益g、即全局增益的初始值。此外,方差參數(shù)決定單元268在第二次以后執(zhí)行時使用的全局增益g是增益更新單元267得到的全局增益g、即全局增益的更新值。
所得到的方差參數(shù)序列
<算術(shù)編碼單元269>
向算術(shù)編碼單元269輸入量化單元262得到的已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)及方差參數(shù)決定單元268得到的方差參數(shù)序列
算術(shù)編碼單元269使用方差參數(shù)序列
算術(shù)編碼單元269在算術(shù)編碼時,通過算術(shù)碼進行在已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)遵照一般化高斯分布
所得到的整數(shù)信號碼及消耗比特數(shù)c被輸出至判定單元266。
也可以跨越已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)之中的多個系數(shù)來進行算術(shù)編碼。在該情況下,從式(a1),式(a8)可知,方差參數(shù)序列
<判定單元266>
向判定單元266輸入算術(shù)編碼單元269得到的整數(shù)信號碼。
判定單元266在增益的更新次數(shù)為預(yù)先決定的次數(shù)的情況下,輸出整數(shù)信號碼,且對增益編碼單元265輸出對增益更新單元267得到的全局增益g進行編碼的指示信號,在增益的更新次數(shù)小于預(yù)先決定的次數(shù)的情況下,對增益更新單元267輸出算術(shù)編碼單元264測量的消耗比特數(shù)c(步驟s266)。
<增益更新單元267>
向增益更新單元267輸入算術(shù)編碼單元264測量的消耗比特數(shù)c。
增益更新單元267在消耗比特數(shù)c比分配比特數(shù)b多的情況下將全局增益g的值更新為較大的值并進行輸出,在消耗比特數(shù)c比分配比特數(shù)b少的情況下將全局增益g的值更新為較小的值,輸出更新后的全局增益g的值(步驟s267)。
增益更新單元267得到的更新后的全局增益g被輸出至量化單元262及增益編碼單元265。
<增益編碼單元265>
向增益編碼單元265輸入來自判定單元266的輸出指示及增益更新單元267得到的全局增益g。
增益編碼單元265按照指示信號,對全局增益g進行編碼而得到增益碼并進行輸出(步驟265)。
判定單元266輸出的整數(shù)信號碼、和增益編碼單元265輸出的增益碼作為與歸一化mdct系數(shù)串對應(yīng)的碼而被輸出至解碼裝置。
即,在本具體例2中,最后進行的步驟s267對應(yīng)于上述的步驟a61,步驟s262、s263、s264、s265分別對應(yīng)于上述的步驟a62、a63、a64、a65。
另外,關(guān)于編碼單元26進行的編碼處理的具體例2,在國際公開公報wo2014/054556等中進一步詳細說明。
[編碼單元26的變形例]
也可以是編碼單元26通過進行例如以下的處理,進行基于所估計出的頻譜包絡(luò)(非平滑化振幅頻譜包絡(luò))而改變比特分配的編碼。
編碼單元26首先求得與歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)對應(yīng)的全局增益g,求得基于對將歸一化mdct系數(shù)串xn(0),xn(1),……,xn(n-1)的各系數(shù)除以全局增益g后的結(jié)果進行量化后的整數(shù)值的序列即已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)。
假設(shè)與該已量化歸一化系數(shù)序列xq(0),xq(1),……,xq(n-1)的各系數(shù)對應(yīng)的量化比特的xq(k)的分布在某范圍內(nèi)一致,能夠根據(jù)包絡(luò)的估計值來決定該范圍。還能夠?qū)Χ鄠€樣本的每個的包絡(luò)的估計值進行編碼,但編碼單元26能夠例如以下的式(a9)那樣使用基于線性預(yù)測的歸一化振幅頻譜包絡(luò)序列的值^hn(k)來決定xq(k)的范圍。
在對某k時的xq(k)進行量化時,為了將xq(k)的平方誤差設(shè)為最小,基于
b為預(yù)先決定的正整數(shù)。此時也可以是編碼單元26進行以下b(k)的再調(diào)整的處理:進行四舍五入以使b(k)成為整數(shù),或在比0小的情況下設(shè)為b(k)=0等。
此外,編碼單元26將多個樣本匯總而決定分配比特數(shù)而不是按每個樣本的分配,對量化來說也能夠進行將多個樣本匯總的每個矢量的量化而不是按每個樣本的標量量化。
若樣本k的xq(k)的量化比特數(shù)b(k)如上述提供,按每個樣本進行編碼,則xq(k)可以取-2b(k)-1至2b(k)-1的2b(k)種類的整數(shù)。編碼單元26以b(k)比特對各樣本進行編碼而得到整數(shù)信號碼。
所生成的整數(shù)信號碼被輸出至解碼裝置。例如,與所生成的xq(k)對應(yīng)的b(k)比特的整數(shù)信號碼從k=0依次被輸出至解碼裝置。
如果xq(k)超過上述的-2b(k)-1至2b(k)-1的范圍的情況下置換為最大值、或者最小值。
若g過小則在該置換中產(chǎn)生量化失真,若g過大則量化誤差變大,xq(k)可取的范圍與b(k)相比過小,不能有效利用信息。因此,也可以進行g(shù)的最佳化。
編碼單元26對全局增益g進行編碼而得到增益碼并進行輸出。
如該編碼單元26的變形例那樣,編碼單元26也可以進行算術(shù)編碼以外的編碼。
(第三實施方式的解碼)
在圖16中示出與第三實施方式的編碼裝置對應(yīng)的解碼裝置的結(jié)構(gòu)例。第三實施方式的解碼裝置如圖16所示,例如具備線性預(yù)測系數(shù)解碼單元31、非平滑化振幅頻譜包絡(luò)序列生成單元32、平滑化振幅頻譜包絡(luò)序列生成單元33、解碼單元34、包絡(luò)逆歸一化單元35、時域變換單元36。在圖10中示出由該解碼裝置實現(xiàn)的第三實施方式的解碼方法的各處理的例子。
向解碼裝置至少輸入編碼裝置輸出的與歸一化mdct系數(shù)串對應(yīng)的碼及線性預(yù)測系數(shù)碼。
以下,說明圖16的各單元。
<線性預(yù)測系數(shù)解碼單元31>
向線性預(yù)測系數(shù)解碼單元31輸入編碼裝置輸出的線性預(yù)測系數(shù)碼。
線性預(yù)測系數(shù)解碼單元31按每幀而通過例如以往的解碼技術(shù)對所輸入的線性預(yù)測系數(shù)碼進行解碼,得到解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp(步驟b1)。
所得到的解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp被輸出至非平滑化振幅頻譜包絡(luò)序列生成單元32及非平滑化振幅頻譜包絡(luò)序列生成單元33。
在此,以往的解碼技術(shù)例如是,在線性預(yù)測系數(shù)碼為與量化后的線性預(yù)測系數(shù)對應(yīng)的碼的情況下對線性預(yù)測系數(shù)碼進行解碼而得到與量化后的線性預(yù)測系數(shù)相同的解碼線性預(yù)測系數(shù)的技術(shù)、在與線性預(yù)測系數(shù)碼為與量化后的lsp參數(shù)對應(yīng)的碼的情況下對線性預(yù)測系數(shù)碼進行解碼而得到與量化后的lsp參數(shù)相同的解碼lsp參數(shù)的技術(shù)等。此外,線性預(yù)測系數(shù)和lsp參數(shù)能夠相互變換,根據(jù)所輸入的線性預(yù)測系數(shù)碼和后級的處理中所需的信息,進行解碼線性預(yù)測系數(shù)和解碼lsp參數(shù)之間的變換處理即可是公知的。根據(jù)以上,包含上述的線性預(yù)測系數(shù)碼的解碼處理和根據(jù)需要進行的上述的變換處理的處理稱為“基于以往的解碼技術(shù)的解碼”。
這樣,線性預(yù)測系數(shù)解碼單元31通過對所輸入的線性預(yù)測系數(shù)碼進行解碼,生成能夠變換為與通過進行將與時序信號對應(yīng)的頻域樣本串的絕對值的η次方視為了功率譜的傅里葉逆變換而得到的偽相關(guān)函數(shù)信號串對應(yīng)的線性預(yù)測系數(shù)的系數(shù)。
<非平滑化振幅頻譜包絡(luò)序列生成單元32>
向非平滑化振幅頻譜包絡(luò)序列生成單元32輸入線性預(yù)測系數(shù)解碼單元31得到的解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp。
非平滑化振幅頻譜包絡(luò)序列生成單元32通過上述的式(a2)生成與解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列即非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)(步驟b2)。
所生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)被輸出至解碼單元34。
這樣,非平滑化振幅頻譜包絡(luò)序列生成單元32將η設(shè)為2以外的規(guī)定的正數(shù),得到對與由線性預(yù)測系數(shù)解碼單元31生成的能夠變換為線性預(yù)測系數(shù)的系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列進行1/η次方后的序列即非平滑化頻譜包絡(luò)序列。非平滑化振幅頻譜包絡(luò)序列生成單元32使用的η為預(yù)先決定,與對應(yīng)的編碼裝置中預(yù)先決定的η相同。
<平滑化振幅頻譜包絡(luò)序列生成單元33>
向平滑化振幅頻譜包絡(luò)序列生成單元33輸入線性預(yù)測系數(shù)解碼單元31得到的解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp。
平滑化振幅頻譜包絡(luò)序列生成單元33通過上述的式a(3)生成使與解碼線性預(yù)測系數(shù)^β1,^β2,……,^βp對應(yīng)的振幅頻譜包絡(luò)的序列的振幅的凹凸平緩的序列即平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)(步驟b3)。
所生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)被輸出至解碼單元34及包絡(luò)逆歸一化單元35。
<解碼單元34>
向解碼單元34輸入與編碼裝置輸出的歸一化mdct系數(shù)串對應(yīng)的碼、非平滑化振幅頻譜包絡(luò)生成單元32生成的非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)及平滑化振幅頻譜包絡(luò)生成單元33生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)。
解碼單元34具備方差參數(shù)決定單元342。
解碼單元34通過例如進行圖17所示的步驟b41至步驟b44的處理來進行解碼(步驟b4)。即,解碼單元34按每幀而對與所輸入的歸一化mdct系數(shù)串對應(yīng)的碼中包含的增益碼進行解碼,得到全局增益g(步驟b41)。解碼單元34的方差參數(shù)決定單元342根據(jù)全局增益g、非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),通過上述的式(a1)求得方差參數(shù)序列
另外,在通過[編碼單元26的變形例]中記載的處理進行編碼的情況下,解碼單元34例如進行以下的處理。解碼單元34按每幀而對與所輸入的歸一化mdct系數(shù)串對應(yīng)的碼中包含的增益碼進行解碼,得到全局增益g。解碼單元34的方差參數(shù)決定單元342根據(jù)非平滑化振幅頻譜包絡(luò)序列^h(0),^h(1),……,^h(n-1)、平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),通過上述的式(a9)求得方差參數(shù)序列
所生成的解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)被輸出至包絡(luò)逆歸一化單元35。
<包絡(luò)逆歸一化單元35>
向包絡(luò)逆歸一化單元35輸入平滑化振幅頻譜包絡(luò)生成單元33生成的平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)及解碼單元34生成的解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)。
包絡(luò)逆歸一化單元35使用平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1),對解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)進行逆歸一化,從而生成解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)(步驟b5)。
所生成的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)被輸出至?xí)r域變換單元36。
例如,包絡(luò)逆歸一化單元35設(shè)為k=0,1,……,n-1,對解碼歸一化mdct系數(shù)串^xn(0),^xn(1),……,^xn(n-1)的各系數(shù)^xn(k)乘以平滑化振幅頻譜包絡(luò)序列^hγ(0),^hγ(1),……,^hγ(n-1)的各包絡(luò)值^hγ(k)從而生成解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)。即,設(shè)為k=0,1,……,n-1,^x(k)=^xn(k)×^hγ(k)。
<時域變換單元36>
向時域變換單元36輸入包絡(luò)逆歸一化單元35生成的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)。
時域變換單元36按每幀而將包絡(luò)逆歸一化單元35得到的解碼mdct系數(shù)串^x(0),^x(1),……,^x(n-1)變換為時域變換,得到幀單位的音信號(解碼音信號)(步驟b6)。
這樣,解碼裝置通過頻域中的解碼而得到時序信號。
[變形例等]
可以說若將線性預(yù)測分析單元22及非平滑化振幅頻譜包絡(luò)序列生成單元23理解為一個頻譜包絡(luò)估計單元2a,則該頻譜包絡(luò)估計單元2a將η設(shè)為2以外的規(guī)定的正數(shù),進行將與時序信號對應(yīng)的例如mdct系數(shù)串即頻域樣本串的絕對值的η次方視為了功率譜的頻譜包絡(luò)(非平滑化振幅頻譜包絡(luò)序列)的估計。例如,在第一實施方式中可以說是進行η為1的情況下的處理。在第二實施方式中可以說是進行η為2的情況下的處理。此外,在第三實施方式中可以說是進行η為2以外的規(guī)定的正數(shù)的情況下的處理。在此,“視為了功率譜”“視為功率譜”意味著,在通常使用功率譜時使用η次方的頻譜。
在該情況下,可以說將η設(shè)為2以外的規(guī)定的整數(shù),頻譜包絡(luò)估計單元2a的線性預(yù)測分析單元22使用通過進行將例如mdct系數(shù)串即頻域樣本串的絕對值的η次方視為了功率譜的傅里葉逆變換而得到的偽相關(guān)函數(shù)信號串來進行線性預(yù)測分析,得到能夠變換為線性預(yù)測系數(shù)的系數(shù)。此外,可以說頻譜包絡(luò)估計單元2a的非平滑化振幅頻譜包絡(luò)序列生成單元23將η設(shè)為2以外的規(guī)定的整數(shù),通過得到將與由線性預(yù)測分析單元22得到的能夠變換為線性預(yù)測系數(shù)的系數(shù)對應(yīng)的振幅頻譜包絡(luò)的序列進行1/η次方后的序列即非平滑化頻譜包絡(luò)序列從而進行頻譜包絡(luò)的估計。
此外,可以說若將平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25及編碼單元26理解為一個編碼單元2b,則該編碼單元2b對與時序信號對應(yīng)的例如mdct系數(shù)串即頻域樣本串的各系數(shù)進行基于由頻譜包絡(luò)估計單元2a估計的頻譜包絡(luò)(非平滑化振幅頻譜包絡(luò)序列)而改變比特分配或者實質(zhì)上比特分配改變的編碼。
第一實施方式至第三實施方式中說明的頻譜包絡(luò)估計單元2a的處理(即,線性預(yù)測分析單元22及非平滑化振幅頻譜包絡(luò)序列生成單元23的處理)、及編碼單元2b的處理(即,平滑化振幅頻譜包絡(luò)序列生成單元24、包絡(luò)歸一化單元25及編碼單元26的處理)不過是一例。頻譜包絡(luò)估計單元2a也可以進行第一實施方式至第三實施方式中說明的處理以外的、將與時序信號對應(yīng)的例如mdct系數(shù)串即頻域樣本串的絕對值的η次方視為了功率譜的頻譜包絡(luò)(非平滑化振幅頻譜包絡(luò)序列)的估計的處理。此外,編碼單元2b也可以進行第一實施方式至第三實施方式中說明的處理以外的、對與時序信號對應(yīng)的例如mdct系數(shù)串即頻域樣本串的各系數(shù)進行基于由頻譜包絡(luò)估計單元2a估計的頻譜包絡(luò)(非平滑化振幅頻譜包絡(luò)序列)而改變比特分配或者實質(zhì)上比特分配改變的編碼的處理。
例如也可以在編碼單元2b中不設(shè)置平滑化振幅頻譜包絡(luò)序列生成單元24。在該情況下,不進行基于包絡(luò)歸一化單元25的mdct系數(shù)串的歸一化處理,編碼單元26代替歸一化mdct系數(shù)串而對mdct系數(shù)串進行與上述同樣的編碼處理。此外,在該情況下,編碼單元26的方差參數(shù)決定單元268代替式(a1)而基于下述的式(a11)決定方差參數(shù)。
此外,在該情況下,也可以在解碼裝置中不設(shè)置平滑化振幅頻譜包絡(luò)序列生成單元33。在該情況下,不進行基于包絡(luò)逆歸一化單元35的解碼歸一化mdct系數(shù)串的逆歸一化處理,通過解碼單元34的解碼而得到解碼mdct系數(shù)串。此外,在該情況下,解碼單元34的方差參數(shù)決定單元342代替式(a1)而基于上述的式(a11)決定方差參數(shù)。進而,在該情況下,時域變換單元36代替解碼歸一化mdct系數(shù)串而對解碼mdct系數(shù)串進行與上述同樣的時域變換。
此外,例如也可以在編碼單元2b中不設(shè)置包絡(luò)歸一化單元25。在該情況下,編碼單元26代替歸一化mdct系數(shù)串而對mdct系數(shù)串進行與上述同樣的編碼處理。此外,在該情況下,也可以在解碼裝置中不設(shè)置包絡(luò)逆歸一化單元35。在該情況下,通過解碼單元34的解碼而得到解碼mdct系數(shù)串,時域變換單元36代替解碼歸一化mdct系數(shù)串而對解碼mdct系數(shù)串進行與上述同樣的時域變換。
可以說若將解碼單元34及包絡(luò)逆歸一化單元35理解為一個解碼單元3a,則該解碼單元3a按照基于非平滑化頻譜包絡(luò)序列而改變的比特分配或者實質(zhì)上改變的比特分配,進行所輸入的整數(shù)信號碼的解碼從而得到與時序信號對應(yīng)的頻域樣本串。
上述說明的處理不僅按照記載的順序而時序地執(zhí)行,也可以根據(jù)執(zhí)行處理的裝置的處理能力或者根據(jù)需要而并行或者單獨執(zhí)行。
此外,也可以由計算機來實現(xiàn)各裝置中的各單元的處理。在該情況下,各裝置的處理內(nèi)容通過程序來記述。并且,通過在計算機中執(zhí)行該程序,從而在計算機上實現(xiàn)各裝置中的各單元的處理。
記述了該處理內(nèi)容的程序能夠記錄至計算機可讀取的記錄介質(zhì)。作為計算機可讀取的記錄介質(zhì),例如也可以是磁記錄裝置、光盤、光磁記錄介質(zhì)、半導(dǎo)體存儲器等任意介質(zhì)。
此外,該程序的流通例如通過對記錄了該程序的dvd、cd-rom等可移動記錄介質(zhì)進行銷售、轉(zhuǎn)讓、借出等來進行。進而,也可以將該程序儲存至服務(wù)器計算機的存儲裝置,經(jīng)由網(wǎng)絡(luò)從服務(wù)器計算機向其他計算機轉(zhuǎn)發(fā)該程序,從而使該程序流通。
執(zhí)行這樣的程序的計算機例如首先將在可移動記錄介質(zhì)中記錄的程序或從服務(wù)器計算機轉(zhuǎn)發(fā)的程序暫時儲存至自己的存儲部。并且,在執(zhí)行處理時,該計算機讀取在自己的存儲部中儲存的程序,執(zhí)行按照所讀取的程序的處理。此外,作為該程序的另一實施方式,也可以設(shè)為計算機從可移動記錄介質(zhì)直接讀取程序,執(zhí)行按照該程序的處理。進而,也可以設(shè)為在每次從服務(wù)器計算機向該計算機轉(zhuǎn)發(fā)程序時,逐次執(zhí)行按照所接受的程序的處理。此外,也可以設(shè)為不進行從服務(wù)器計算機向該計算機的程序的轉(zhuǎn)發(fā),而是通過僅通過其執(zhí)行指示和結(jié)果取得來實現(xiàn)處理功能的所謂asp((應(yīng)用服務(wù)提供商(applicationserviceprovider))型的服務(wù)來執(zhí)行上述的處理的結(jié)構(gòu)。另外,設(shè)為在程序中,包括供于電子計算機的處理用的信息且遵照程序的數(shù)據(jù)(雖然不是對于計算機的直接指令但具有規(guī)定計算機的處理的性質(zhì)的數(shù)據(jù)等)。
此外,設(shè)為在計算機上執(zhí)行預(yù)定的程序而構(gòu)成了各裝置,但這些處理內(nèi)容的至少一部分也可以通過硬件來實現(xiàn)。