一種低比特率語(yǔ)音編碼器的制作方法

文檔序號(hào)：2831325閱讀：248來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：一種低比特率語(yǔ)音編碼器的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種語(yǔ)音編碼器，特別涉及一種基于局部余弦變換(LocalCosine Transform，LCT)的低比特率語(yǔ)音編碼器，適合于要求低比特率語(yǔ)音編碼的通信系統(tǒng)中使用。
背景技術(shù)：
低比特率語(yǔ)音編碼在過(guò)去20年已成為一個(gè)主要研究主題，結(jié)果導(dǎo)致已經(jīng)將比特率從16kb/s到2.4kb/s范圍的很多語(yǔ)音編碼算法標(biāo)準(zhǔn)化。目前語(yǔ)音編碼器研究的重點(diǎn)在4kb/s及更低的高質(zhì)量語(yǔ)音編碼。雖然CELP波形編碼器在低于6.3kb/s比特率時(shí)仍能產(chǎn)生高質(zhì)量的語(yǔ)音，但當(dāng)比特率減少至4kb/s及更低時(shí)，由于沒(méi)有足夠的比特對(duì)波形細(xì)節(jié)進(jìn)行編碼，波形編碼系統(tǒng)將會(huì)產(chǎn)生大量量化噪聲。另一方面，參數(shù)編碼(也稱(chēng)聲碼器)并不企圖產(chǎn)生與原始信號(hào)相似的波形，而代之，試圖找到能夠較好地表示語(yǔ)音知覺(jué)重要屬性的一組參數(shù)，但它們對(duì)各種特殊環(huán)境噪聲的魯棒性較差。
然而，對(duì)于在4kb/s比特率及更低比特率的語(yǔ)音編碼，最近的研究顯示在頻域進(jìn)行語(yǔ)音編碼比已存在的基于CELP的編碼器具有更好語(yǔ)音質(zhì)量的潛力。譜編碼器試圖重構(gòu)語(yǔ)音振幅譜而不是精確地恢復(fù)語(yǔ)音波形。盡管以上的編碼器廣泛應(yīng)用于低比特率語(yǔ)音編碼，它們大多受假設(shè)的模型精度的限制，還有它們主要依賴于正確的參數(shù)估計(jì)，往往這些要求很難得到保證。所以，在特殊環(huán)境下，這些編碼方法的魯棒性是很差的，編碼后的語(yǔ)音質(zhì)量具有一定的局限性。
由Coifman和Meyer(1991)及Auscher等(1992)先后構(gòu)造的局部余弦基是由平滑、緊支撐鐘函數(shù)與余弦函數(shù)乘積構(gòu)成的。這些局部化的余弦函數(shù)仍保留著正交性，并且具有較小的Heisenberg乘積。近些年來(lái)，局部余弦變換理論方法得到廣泛深入的研究，該方法在圖像壓縮編碼中應(yīng)用較多，而應(yīng)用在語(yǔ)音信號(hào)處理方面的研究相對(duì)較少，特別是應(yīng)用在語(yǔ)音編碼中則更少。但在MalvarH.S.“Lapped transforms for efficient transform/subband coding”.IEEETrans.on Acoust.，Speech Signal Processing，1990.，vol.38(6)，Page(s)969-978發(fā)表的文獻(xiàn)中證明了在語(yǔ)音編碼中LCT方法的編碼增益優(yōu)于DCT編碼，并且十分接近于KL變換編碼。特別是與DCT編碼方法相比，明顯減少了幀之間的“喀嚓”聲，不需要象DCT變換編碼在編碼中為了減少幀之間出現(xiàn)的異?！翱︵辍甭曇舳?jīng)常采用半幀長(zhǎng)滑動(dòng)的方法。所以，該LCT方法比DCT方法減少接近一半的計(jì)算量。在Wickerhauser M.V.于1994年發(fā)表的文獻(xiàn)“Comparison of picture compression methodswavelet，waveletpacket and local cosine”.WaveletsTheory，Algorithms，and Applications，Editor(Charles K.Chui and Laura Montefusco and Luigia Puccio)，Academic Press，San Diego，California，p.585～621，中進(jìn)行的幾個(gè)二維圖像編碼方法對(duì)比研究也表明了在編碼增益上LCT方法優(yōu)于DCT方法，并同樣也非常接近于KL變換方法。研究表明，提高變換編碼的編碼增益的關(guān)鍵在于正交基的選取，同樣，在局部余弦變換編碼中的關(guān)鍵也是局部余弦正交基的選取，而影響局部余弦正交基選取的主要因素卻是鐘函數(shù)的選取。以上少量的將LCT方法應(yīng)用于語(yǔ)音編碼中的研究只是停留在簡(jiǎn)單的編碼增益對(duì)比，并沒(méi)有真正設(shè)計(jì)一個(gè)可行的語(yǔ)音編碼器。

發(fā)明內(nèi)容
本發(fā)明的目的是利用局部余弦變換具有較高的編碼增益的特點(diǎn)，提供一種在局部余弦變換域內(nèi)實(shí)用的優(yōu)良的低比特率語(yǔ)音編碼器。
實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案是一種低比特率語(yǔ)音編碼器，它基于局部余弦變換，由高通濾波預(yù)處理器對(duì)輸入編碼器的原始語(yǔ)音信號(hào)進(jìn)行處理，然后進(jìn)行局部余弦變換(LCT)處理，其特征在于所述的LCT變換中的鐘函數(shù)bnew(n)符合如下條件 ξ[n](n)為采用的整形函數(shù)，符合條件ξ[n+1]=defξ[n][sin(πt/2)]]]>和ξ
(t)=defξ(t),]]>其中
下標(biāo)n為該整形函數(shù)的迭代次數(shù)；鐘函數(shù)在1～4m的寬度上取值。
所述的鐘函數(shù)bnew(n)確保與余弦函數(shù)相乘形成一個(gè)局部余弦正交基。
所述的整形函數(shù)的迭代次數(shù)n為8～10。
每一幀經(jīng)過(guò)LCT變換后的LCT系數(shù)，先按從低頻到高頻分別40、40、40、20進(jìn)行分維矢量維數(shù)的劃分，再利用四個(gè)不同的分維矢量量化碼書(shū)進(jìn)行分維矢量量化，從第一維矢量到第四維矢量分配的比特位分別依次為12、12、8、8比特，每一幀的增益量化采用8比特標(biāo)量量化，按照從第一分維矢量比特位到第四分維矢量比特位、增益量化比特位的順序輸出比特位為48比特，用6個(gè)字節(jié)表示每一幀輸出的比特流。
所述的語(yǔ)音編碼器還有一個(gè)與其匹配的語(yǔ)音解碼器。
本發(fā)明由于應(yīng)用了一個(gè)可以靈活調(diào)整的整形函數(shù)，利用這個(gè)整形函數(shù)對(duì)Donoho采用的鐘函數(shù)進(jìn)行整形，得到一個(gè)能夠提高譜能量聚集性的新的鐘函數(shù)；對(duì)局部余弦變換系數(shù)的編碼，采用分維量化方法，對(duì)于每一維矢量，均采用LGB方法設(shè)計(jì)碼書(shū)；編碼中碼書(shū)的搜索采用樹(shù)形結(jié)構(gòu)搜索方法，實(shí)現(xiàn)了一種在局部余弦變換域內(nèi)具有優(yōu)良的低比特語(yǔ)音編碼器。經(jīng)客觀參數(shù)評(píng)價(jià)和非正式聽(tīng)力測(cè)試表明，該編碼器比LPC-10e編碼器具有更好的自然度和可理解性，它適合于各種環(huán)境下的語(yǔ)音編碼。

圖1是本發(fā)明實(shí)施例語(yǔ)音編碼器中的整形函數(shù)隨著遞歸次數(shù)變化的曲線圖；圖2是本發(fā)明實(shí)施例語(yǔ)音編碼器中所采用的整形后的鐘函數(shù)隨著遞歸次數(shù)的增加低半頻能量增加百分比圖(英語(yǔ)+漢語(yǔ))；圖3是本發(fā)明實(shí)施例語(yǔ)音編碼器的結(jié)構(gòu)示意圖；圖4是本發(fā)明實(shí)施例語(yǔ)音解碼器的結(jié)構(gòu)示意圖；具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例，對(duì)本發(fā)明所述的技術(shù)方案作進(jìn)一步的闡述。
參見(jiàn)附圖3、附圖4，附圖中分別提供了本實(shí)施例所述的低比特率編碼器和解碼器的結(jié)構(gòu)示意圖。
本發(fā)明實(shí)施例的關(guān)鍵技術(shù)為一、最佳整形后的鐘函數(shù)的獲得圖3中，對(duì)輸入編碼器的原始語(yǔ)音信號(hào)進(jìn)行高通濾波預(yù)處理，然后進(jìn)行LCT變換處理，在LCT變換中，本發(fā)明采用整形后的鐘函數(shù)為上述整形后的鐘函數(shù)由如下步驟得到1、采用Donoho的鐘函數(shù)在Wickerhauser M.V.于1994年出版的專(zhuān)著中闡述局部余弦變換算法時(shí)，給出的鐘函數(shù)對(duì)于給定的Ij和r，則鐘形函數(shù)是固定不變的。
下面給出Donoho采用的鐘函數(shù)簡(jiǎn)單構(gòu)造過(guò)程。設(shè)Ij＝2m，r＝m，則鐘形窗寬度為4m，令t(n)＝n-0.5，1≤n≤m. (1)x(n)＝(1+t(n)/m)/2 (2)那么，Donoho采用的鐘形窗函數(shù)為 2、整形函數(shù)的構(gòu)造為令輸入實(shí)值序列t(n)為t(n)＝[2(n-1)-m+0.5]/2m，1≤n≤m (4)定義一個(gè)實(shí)值連續(xù)函數(shù) 對(duì)于上式重復(fù)用sin(πt/2)代替t，對(duì)于任意大固定整數(shù)d，可以獲得d次連續(xù)可微函數(shù)(ξ∈Cd)。定義如下遞歸函數(shù)
ξ
(t)=defξ(t)]]>ξ[n+1]=defξ[n][sin(πt/2)]]]>其中ξ的下標(biāo)表示遞歸次數(shù)。通過(guò)遞歸將會(huì)看到ξ[n](t)在t＝+1和t＝-1點(diǎn)上2n-1階導(dǎo)數(shù)為0，也即意味著ξ[n]∈C2n-1。如圖1為這個(gè)整形函數(shù)的幾個(gè)遞歸結(jié)果曲線，這里m＝80。
3、整形后的鐘函數(shù)的求取通過(guò)改變遞歸次數(shù)產(chǎn)生各種整形函數(shù)，利用遞歸n次后的整形函數(shù)ξ[n](t)對(duì)(6.3)式中的鐘函數(shù)進(jìn)行整形得到如下一個(gè)新的鐘函數(shù) 上式中的鐘函數(shù)確保與余弦函數(shù)相乘形成一個(gè)局部余弦正交基。
在實(shí)際問(wèn)題中，需要在一個(gè)固定的窗寬度上求取最佳的正交基。也就是要求設(shè)計(jì)一個(gè)能夠靈活調(diào)整的鐘函數(shù)來(lái)滿足實(shí)際問(wèn)題的需要。在本實(shí)施例中，采用的技術(shù)方案是對(duì)語(yǔ)音信號(hào)進(jìn)行解相關(guān)去冗余，目的是使固定幀長(zhǎng)語(yǔ)音信號(hào)譜能量較好地集中在若干頻帶內(nèi)，便于分頻帶編碼。為此，本發(fā)明實(shí)施例所提供的整形方法，是能夠?qū)onoho采用的鐘函數(shù)進(jìn)行靈活整形的整形函數(shù)，從中選取適合于頻率域語(yǔ)音編碼的整形函數(shù)，進(jìn)而得到最佳的鐘函數(shù)。
4、最佳鐘形函數(shù)的確定本發(fā)明實(shí)施例中將要涉及到變換域語(yǔ)音編碼的實(shí)際問(wèn)題，需要解決的是確定進(jìn)行多少次遞歸后形成的整形函數(shù)對(duì)Donoho采用的鐘形函數(shù)進(jìn)行整形而得到的鐘函數(shù)最適合。在本實(shí)施例中，把幀長(zhǎng)為20ms，采樣率為8kHz的語(yǔ)音信號(hào)的頻帶劃分為高低兩個(gè)頻帶，整形鐘函數(shù)的目的是要求譜能量盡可能集中在信息量較大的低半頻頻帶內(nèi)，便于后面編碼對(duì)高、低半頻帶的譜系數(shù)進(jìn)行比特位數(shù)的優(yōu)化分配。
參見(jiàn)附圖2，本發(fā)明實(shí)施例采用英語(yǔ)和漢語(yǔ)語(yǔ)音進(jìn)行測(cè)試而得到的隨著遞歸次數(shù)的變化，利用整形后的鐘函數(shù)比采用Donoho的鐘函數(shù)進(jìn)行局部余弦變換后低半頻帶的譜能量占總的譜能量百分比的增加量。從圖2可以看到，當(dāng)遞歸9次時(shí)譜能量增加最大，因此，本發(fā)明實(shí)施例選擇9次遞歸的整形函數(shù)進(jìn)行整形。雖然譜能量增加的比例較小，但說(shuō)明了調(diào)整合適的鐘函數(shù)能夠改變譜能量聚集程度，便于編碼時(shí)對(duì)比特位的分配優(yōu)化。
二、分維矢量量化方法粗略地講，成年人語(yǔ)音信號(hào)前四個(gè)共振峰分別位于500Hz、1500Hz、2500Hz和3500Hz。這實(shí)際上將語(yǔ)音信號(hào)劃分成四個(gè)重要區(qū)域，要求我們?cè)诰幋a時(shí)對(duì)這四個(gè)區(qū)域的譜區(qū)別對(duì)待。對(duì)于變換域的參數(shù)進(jìn)行編碼，大多采用分維矢量量化(Splitted Vector Quantization)方法，所以，本發(fā)明實(shí)施例中，所設(shè)計(jì)的編碼器將局部余弦變換的系數(shù)采取分維量化的方法。對(duì)于每一維矢量分別進(jìn)行碼書(shū)訓(xùn)練。當(dāng)利用LGB算法生成碼書(shū)后，為了提高編解碼時(shí)碼書(shū)的搜索速度采用樹(shù)形碼書(shū)搜索方法。
在分維量化時(shí)，各個(gè)維矢量的變換系數(shù)數(shù)目劃分從低頻到高頻分別為40、40、40、20。我們把這四個(gè)矢量分別稱(chēng)為第一維矢量、第二維矢量、第三維矢量和第四維矢量。由于對(duì)采樣率為8kHz的語(yǔ)音信號(hào)，只保留3500Hz以下的譜成分就足以較好地恢復(fù)出滿意質(zhì)量的語(yǔ)音信號(hào)。為了降低計(jì)算復(fù)雜度，第四維矢量只用20個(gè)系數(shù)。在解碼器中的反變換合成語(yǔ)音信號(hào)時(shí)，將剩余最高頻成分的20個(gè)系數(shù)填充為0。
在本發(fā)明實(shí)施例中，比特位分配是從低頻到高頻的各維矢量分配的比特位數(shù)分別為12、12、8、8。語(yǔ)音編碼器的增益是通過(guò)采用將輸入信號(hào)譜能量與編碼時(shí)搜索的四個(gè)碼矢量的譜能量和之比計(jì)算得來(lái)的。增益的量化采用8比特標(biāo)量量化方法。本發(fā)明實(shí)施例中設(shè)計(jì)的編碼器每幀總的比特分配如表1所示。
語(yǔ)音編碼器輸入語(yǔ)音信號(hào)是采樣率為8kHz 16比特PCM格式的語(yǔ)音信號(hào)。本實(shí)施例采用的是wav格式的語(yǔ)音數(shù)據(jù)，所以電平幅值是歸一化了的。系統(tǒng)對(duì)語(yǔ)音的種類(lèi)沒(méi)有特殊的要求，適合于各種語(yǔ)種的語(yǔ)音編碼。
對(duì)本發(fā)明實(shí)施例所述的編碼器的評(píng)價(jià)1、客觀評(píng)價(jià)與發(fā)明實(shí)施例所述的編碼器進(jìn)行測(cè)試對(duì)比時(shí)所采用的其它標(biāo)準(zhǔn)化了的編碼器有G.729 Annex B(G.729B)、GSM Half-Rate、FS1016、FS1015(LPC-10e)?？陀^評(píng)價(jià)采用的參數(shù)有信噪比(Signal to Noise Ratio，SNR)和峰值信噪比(Peak Signal to Noise Ratio，PSNR)
SNR=10log10(σx2)(σe2)]]>這里σx2是語(yǔ)音信號(hào)的均方，σe2為原始語(yǔ)音信號(hào)與重構(gòu)的語(yǔ)音信號(hào)差的均方。
PSNR=10log10NX2||x-x~||2]]>這里N為重構(gòu)信號(hào)的長(zhǎng)度，X為在長(zhǎng)度為N的信號(hào)x內(nèi)的絕對(duì)值最大值，為原始信號(hào)與重構(gòu)信號(hào)之間差的平方和。
眾所周知，對(duì)編碼后的語(yǔ)音信號(hào)進(jìn)行客觀評(píng)價(jià)有時(shí)得到令人費(fèi)解的結(jié)果。即使一個(gè)編碼器編碼后的語(yǔ)音具有高信噪比，有時(shí)可能它的語(yǔ)音質(zhì)量不一定比另一個(gè)編碼器編碼后產(chǎn)生低信噪比的語(yǔ)音質(zhì)量高。相反，同樣也成立。所以說(shuō)客觀參數(shù)評(píng)價(jià)不能作為語(yǔ)音編碼器性能評(píng)價(jià)的主要指標(biāo)，它只能作為一個(gè)輔助評(píng)價(jià)。
表2為本實(shí)施例語(yǔ)音編碼器(FBR-LCT)與G.729B、GSM Half-Rate、FS1016和FS1015編碼標(biāo)準(zhǔn)進(jìn)行對(duì)比的結(jié)果。該結(jié)果也說(shuō)明了客觀評(píng)價(jià)方法在語(yǔ)音編碼器性能評(píng)價(jià)的可靠性。G.729B、GSM Half-Rate和FS1016都屬于中低比特率的編碼標(biāo)準(zhǔn)，它們編碼的語(yǔ)音質(zhì)量遠(yuǎn)遠(yuǎn)超過(guò)FS1015和LCT編碼方法，但從這兩個(gè)指標(biāo)看，相比較而言LCT方法具有相當(dāng)高的優(yōu)勢(shì)。與相同比特率的FS1015編碼器進(jìn)行比較，表明LCT編碼方法的SNR和PSNR明顯比FS1015標(biāo)準(zhǔn)的SNR和PSNR最多高出近5dB。
本發(fā)明實(shí)施例編碼器所采用的編碼方法是在變換域內(nèi)進(jìn)行的，其實(shí)質(zhì)是波形編碼的范疇。所以利用SNR和PSNR兩個(gè)評(píng)價(jià)指標(biāo)來(lái)進(jìn)行客觀評(píng)價(jià)，對(duì)其是有利的。所以，客觀地講單從若干個(gè)客觀指標(biāo)對(duì)編碼器進(jìn)行評(píng)價(jià)是不能說(shuō)明問(wèn)題的，只能作為一個(gè)參考。
2、主觀評(píng)價(jià)語(yǔ)音編碼器產(chǎn)生的語(yǔ)音最終的接受對(duì)象是人的耳朵，所以編碼后的語(yǔ)音質(zhì)量好壞主要是接受人的聽(tīng)覺(jué)感知評(píng)價(jià)。一般采用非正式語(yǔ)音聽(tīng)力測(cè)試進(jìn)行語(yǔ)音質(zhì)量的評(píng)價(jià)。
對(duì)于無(wú)噪聲清晰語(yǔ)音，本發(fā)明實(shí)施例所采用的LCT編碼方法重構(gòu)(FBR-LCT)的語(yǔ)音具有輕微的模糊，所以聽(tīng)不到象LPC-10e重構(gòu)的語(yǔ)音洪亮。沒(méi)有G.729B、GSM Half-Rate和FS1016編碼標(biāo)準(zhǔn)產(chǎn)生的語(yǔ)音清晰度高，但是它的理解性和自然度是好的，且明顯比同比特率的LPC-10e方法要好。LCT編碼方法具有較強(qiáng)的魯棒性，它的編碼失真隨著信號(hào)的改變不敏感，甚至于對(duì)G.729B、GSM Half-Rate、FS1016和LPC-10e方法無(wú)效的信號(hào)仍然很穩(wěn)定。當(dāng)使用背景音樂(lè)或其它非語(yǔ)音信號(hào)時(shí)，F(xiàn)BR-LCT編碼方法比LPC-10e方法明顯好。這些完全是由于LCT編碼方法屬于在變換域內(nèi)的波形編碼，所以它不依賴于如基音等語(yǔ)音特征參數(shù)。相反，G.729B、GSM Half-Rate、FS1016及LPC-10e是基于語(yǔ)音源-濾波生成模型及線性預(yù)測(cè)參數(shù)的估計(jì)，對(duì)參數(shù)估計(jì)的精度特別敏感。本發(fā)明所述的的基于局部余弦變換低比特率編碼器還可通過(guò)軟件仿真實(shí)現(xiàn)。
表1分維矢量增益幀第一維矢量第二維矢量第三維矢量第四維矢量(比特)(比特)12 12 88848表2英語(yǔ)漢語(yǔ)漢語(yǔ)+背景音樂(lè)比特率編碼器類(lèi)SNR(dB) PSNR(dB) SNR(dB) PSNR(dB) SNR(dB) PSNR(dB) (kb/s)G.729 Annex -0.95 15.08 -1.4618.32 -1.1815.58 8GSM Half-Rate-1.24 14.81 -0.8219.46 -0.7416.09 5.6FS1016 0.71 16.74 1.37 21.63 1.27 18.09 4.8FS1015(LPC10e) -3.59 12.47 -2.6517.64 -1.8015.02 2.4FBR-LCT -0.44 15.08 0.26 20.54 -1.0715.75 2.權(quán)利要求
1.一種低比特率語(yǔ)音編碼器，它基于局部余弦變換，由高通濾波預(yù)處理器對(duì)輸入編碼器的原始語(yǔ)音信號(hào)進(jìn)行處理，然后進(jìn)行局部余弦變換處理，其特征在于所述的局部余弦變換中的鐘函數(shù)bnew(n)符合如下條件 ξ[n](n)為采用的整形函數(shù)，符合條件ξ[n+1]=defξ[n][sin(πt/2)]]]>和ξ
(t)=defξ(t),]]>其中下標(biāo)n為該整形函數(shù)的迭代次數(shù)；鐘函數(shù)在1～4m的寬度上取值。
2.根據(jù)權(quán)利要求1所述的一種低比特率語(yǔ)音編碼器，其特征在于所述的鐘函數(shù)bnew(n)確保與余弦函數(shù)相乘形成一個(gè)局部余弦正交基。
3.根據(jù)權(quán)利要求1所述的一種低比特率語(yǔ)音編碼器，其特征在于所述的整形函數(shù)的迭代次數(shù)n為8～10。
4.根據(jù)權(quán)利要求1所述的一種低比特率語(yǔ)音編碼器，其特征在于每一幀經(jīng)過(guò)局部余弦變換后的局部余弦變換系數(shù)，先按從低頻到高頻分別40、40、40、20進(jìn)行分維矢量維數(shù)的劃分，再利用四個(gè)不同的分維矢量量化碼書(shū)進(jìn)行分維矢量量化，從第一維矢量到第四維矢量分配的比特位分別依次為12、12、8、8比特，每一幀的增益量化采用8比特標(biāo)量量化，按照從第一分維矢量比特位到第四分維矢量比特位、增益量化比特位的順序輸出比特位為48比特，用6個(gè)字節(jié)表示每一幀輸出的比特流。
5.根據(jù)權(quán)利要求1所述的一種低比特率語(yǔ)音編碼器，其特征在于所述的語(yǔ)音編碼器還有一個(gè)與其匹配的語(yǔ)音解碼器。
全文摘要
本發(fā)明公開(kāi)了一種語(yǔ)音編碼器，特別涉及一種基于局部余弦變換的低比特率語(yǔ)音編碼器，適用于要求低比特率語(yǔ)音編碼的通信系統(tǒng)中。它應(yīng)用了一個(gè)可以靈活調(diào)整的整形函數(shù)，利用這個(gè)整形函數(shù)對(duì)Donoho采用的鐘函數(shù)進(jìn)行整形，得到一個(gè)能夠提高譜能量聚集性的新的鐘函數(shù)；對(duì)局部余弦變換系數(shù)的編碼，采用分維量化方法，對(duì)于每一維矢量，均采用LGB方法設(shè)計(jì)碼書(shū)；編碼中碼書(shū)的搜索采用樹(shù)形結(jié)構(gòu)搜索方法，實(shí)現(xiàn)了一種在局部余弦變換域內(nèi)具有優(yōu)良的低比特語(yǔ)音編碼器。經(jīng)客觀參數(shù)評(píng)價(jià)和非正式聽(tīng)力測(cè)試表明，該編碼器比LPC－10e編碼器具有更好的自然度和可理解性。
文檔編號(hào)G10L19/02GK1632861SQ200410103219
公開(kāi)日2005年6月29日申請(qǐng)日期2004年12月31日優(yōu)先權(quán)日2004年12月31日
發(fā)明者董恩清申請(qǐng)人:蘇州大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：董恩清
技術(shù)所有人：蘇州大學(xué)
我是此專(zhuān)利的發(fā)明人

上一篇：一種低比特變速率語(yǔ)言編碼器的制作方法
上一篇：數(shù)字廣播接收裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音編碼器相關(guān)技術(shù)

wav降低比特率相關(guān)技術(shù)

降低比特率相關(guān)技術(shù)

wav轉(zhuǎn)flac比特率降低相關(guān)技術(shù)

如何降低總比特率相關(guān)技術(shù)