專利名稱:增益量化系統(tǒng)用于改進語音丟包修補質量的方法
技術領域:
本發(fā)明屬于信號編碼領域。具體講是語音編碼領域;尤其是專為改進在語音包傳輸時丟 包后性能的補償。
背景技術:
傳統(tǒng)來講,所有的參數(shù)化語音編碼方法常常都是利用語音信號本身的冗余,來減少必須 傳輸?shù)男畔⒘浚⒐浪阏Z音信號短時段內的參數(shù)。這種冗余首先起因于語音波形周期性的重 復和頻譜包絡慢變過程。
不同形式語音波形的冗余對應于不同類型的語音信號,如濁聲和清聲。就濁聲語音而言,
語音信號基本上是周期性的;然而,這種周期性在語音段中是變化的,且周期波形在語音段 之間緩慢變化。低比特率的語音編碼可以很大地受益于這種周期性。濁聲周期稱為基音周期 (pitch),這種基音周期性預測被命名為長項預測。至于清音,其信號更像一個隨機噪聲,周 期性也較小。
在任何情況下,參數(shù)編碼通過分割頻譜包絡和語音段的激勵來減少語音段的冗余。頻譜 包絡慢變過程被描述成線性預測(也稱作短項預測)。低比特率的語音編碼也同樣受益于短項 預測。這種編碼的優(yōu)點就來自于參數(shù)的慢速變化。然而,在幾毫秒內這些參數(shù)值有很大變化 的可能性很小。因此,在8kHz或16kHz采樣時,語音編碼算法是將10~30毫秒語音段作為一 幀。而20毫秒是最常用的幀長。在較近期的知名國際標準中,諸如G723、 G729、 EFR、 AMR, 編碼激勵線性預測技術(CELP)已經(jīng)被廣泛采用;通常編碼激勵線性預測技術(CELP)被 理解為是編碼激勵、長項預測和短項預測各技術的綜合。利用編碼激勵線性預測技術(CELP) 的語音編碼算法在語音壓縮領域已經(jīng)相當流行。
圖1顯示CELP初始語音編碼器,利用綜合分析法,綜合語音102和原始語音101之間 的加權誤差109被減到最小,即最小化113。 W (z)是加權濾波器110。它對誤差信號111 進行加權濾波處理。1/B(z)是長項預測濾波器105,1/A(z)是短項預測濾波器,標為103。 編碼激勵108,又被稱作固化碼本(fixedcodebook)激勵,在通過線性濾波器前乘于增益Gc (標 為106)。短項預測線性濾波(標為103)通過分析原始信號101完成,并由一個線性預測系 數(shù)集合表示=乞l + a,. z-' ,, = 1,2,—,i> (1)
加權濾波器(110 )涉及和用到上面的短項預測濾波。 一個典型的加權濾波器可表示為
,)==, (2)
其中-<", 0<"<l,0<a《l。長項預測(105)取決于基音周期和基音周期增益; 對基音周期的估計基于原始信號、殘留信號或者加權原始信號。長項預測函數(shù)可表示為
卿=1 - / -z掘 (3)
編碼激勵(108 )通常由類似脈沖的信號或類似噪音的信號構成,這些信號可用數(shù)學方 法實時產(chǎn)生或者存到碼本中。最后,將編碼激勵指數(shù),量化的增益指數(shù),量化的長項預測參 數(shù)指數(shù)和量化的短項預測參數(shù)指數(shù)傳到解碼器中。
圖2顯示初始的語音解碼器,在綜合語音后添加后處理單元207。解碼器由編碼激勵201、 長項預測203、短項預測205、后期處理207等幾個單元組成。除后期處理單元,其它都和 圖1中的編碼器定義相同。后期處理單元由短項后期處理和長項后期處理組成。
圖3顯示基本的CELP編碼器。它和圖1的唯一不同之處在于用含有過去的綜合激勵 304的自適應碼本307來實現(xiàn)長項預測。語音的基音周期信息用來產(chǎn)生相應的自適應激勵分 量。這一激勵分量將乘于一增益G^ (標為305)(也稱作周期增益)。兩個由增益控制幅度的 激勵分量在通過短項預測濾波器(標為303)前被加到一起。這兩個增益變量(G^和Ge306) 需量化,然后送到解碼器。自適應碼本307激勵分量和固化碼本308激勵分量加在一起產(chǎn)生 總的激勵e 入
圖4顯示基本的CELP解碼器,它完全對應于圖3中的編碼器,但在綜合語音407后添 加了后處理單元408。這個解碼器除自適應碼本外,其它類似于圖2。解碼器也由幾個單元組 成,包括編碼激勵402、自適應碼本401、短項預測406和后期處理408。除了后期處理單元, 每個單元都和圖3中的編碼器有相同的定義。
固化碼本激勵308的產(chǎn)生方式有一個很長歷史。編碼激勵產(chǎn)生的設計受三個主要因素的 影響。第一個是感性質量;第二個是計算的復雜性;第三個是所需存儲空間的大小。激勵的 最初模型由隨機的噪聲激勵組成。噪聲激勵可以產(chǎn)生高質量的清音語音,但濁音語音的質量 卻不盡人意。另一個流行的激勵模型是脈沖激勵,像多脈沖激勵,其中每個可能脈沖的脈沖 位置和幅度都需要編碼并發(fā)送到解碼器。該脈沖激勵可以產(chǎn)生高質量的濁音語音。另一種變 型的脈沖激勵模型(ACELP激勵模型或者二元激勵模型)在工作時每個脈沖位置指數(shù)都需要發(fā)送到解碼器;但除了需要發(fā)送到解碼器的幅度符號(+1或-1)夕卜,所有幅度都賦予常數(shù)值 1。這是目前最流行的一種激勵模型,應用于多個國際標準中。
增益量化系統(tǒng)可分類為標量量化(SQ)和矢量量化(VQ);也可分類為直接量化和非直接 量化;還可分為預測量化和非預測量化;更進一步,可以將上述方法相互組合。標量量化(SQ) 意思是每個參數(shù)獨立量化。矢量量化(VQ)意思是參數(shù)組聯(lián)合量化,這需要參照先期存儲的 碼本表,從參數(shù)表中選出最優(yōu)的矢量量化參數(shù),從而受益于參數(shù)間的相關性。直接量化系統(tǒng) 是將兩個增益(^305和6^306)直接量化。非直接量化是將兩個增益參數(shù)轉化為另一組參數(shù), 再將這組參數(shù)量化;量化指數(shù)要傳給解碼器;解碼器再將這組參數(shù)變回到原來形式。預測性 量化用以前的量化參數(shù)來預測當前的參數(shù),并且僅僅對參數(shù)不可預測部分進行量化。這種預 測可以減少量化這些參數(shù)所需的比特數(shù);但是在傳輸中有比特流包丟失時會造成錯誤傳播延 長。
發(fā)明內容
本發(fā)明的目的是為了克服上述現(xiàn)有技術中的不足之處,提出一個改進的增益量化系統(tǒng), 它能夠在丟包后快速地恢復到正確的激勵能量,改進語音丟包后的修補質量,有效地減少錯 誤傳播的增益量化系統(tǒng)用于改進語音丟包修補質量的方法。
本發(fā)明的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,可以為語音信號或普通信號
編解碼,編碼系統(tǒng)包含兩個激勵元或兩個激勵分量; 一個激勵元通過增益(標為ft)控制能
量,這一激勵元稱為自適應碼本激勵,基音周期激勵或者稱為由以前綜合激勵貢獻的激勵; 另一個激勵元通過增益(標為《)控制能量,這一激勵元稱為固化碼本激勵或者當前貢獻的 激勵;其特征在于兩個增益值(G和"。)首先被轉化為另兩個參數(shù), 一個表示全部的激勵能 量,另一個表示自適應激勵的能量部分占全部激勵能量的比重;這兩個變換后的參數(shù)可標為
所述編碼系統(tǒng)包含CELP技術。 所述激勵的總能量可以用激勵的平均能量來表示; 所述激勵的總能量可以用激勵的平均能量幅值來表示; 所述激勵的總能量可以用激勵能量的和來表示; 所述激勵的能量比是指激勵元之一的能量相對總能量的比值。 所述激勵的能量比是指激勵元之一的能量幅值相對總能量幅值的比值。 所述方法進一步包含以下幾步在編碼器中量化變換后的參數(shù)發(fā)送量化指數(shù) 到解碼器;在解碼器將量化參數(shù)算回到原始增益(G和G)。本發(fā)明使用增益量化系統(tǒng)進行改進語音丟包修補質量的方法,主要是先將兩個增益(Gp
和GC)轉化為兩個特殊的參數(shù) 一個表示全部的激勵能量,另一個表示自適應激勵的能量部
分占全部激勵能量的比值。然后,將轉化后的參數(shù)量化,送到解碼器。在解碼端將這兩個參
數(shù)恢復為原始增益形式(Gp和Gc)。具有能夠在丟包后快速地恢復到正確的激勵能量,改進
語音丟包后的修補質量,有效地減少錯誤傳播等優(yōu)點。
圖1是初始CELP語音編碼器方框圖2是初始CELP語音解碼器方框圖3是基本的CELP編碼器方框圖4是基本的CELP解碼器方框圖; 圖5是一種比特流包丟失示例的示意圖。
具體實施例方式
結合附圖對本發(fā)明作進一步描述如下
以下的描述包括了相關的編碼激勵線性預測技術CELP的詳細信息。同時,熟悉相關技
術的人會發(fā)現(xiàn)本方法可以實踐于其它各種不同的語音編碼技術算法中,而非只局限于本文所 討論的應用。此外,為了突出本發(fā)明的特性,本文對一些本技術領域內的一般性知識細節(jié)并 沒有討論。
本文附圖及其附帶說明也只是針對本發(fā)明的一些舉例。為了簡明扼要,其它應用本發(fā)明 的相關方法的實體將不一一詳細敘述或給出圖示。
圖3舉了一個能說明本發(fā)明的編碼器示例。參照圖3和圖4,對短項預測濾波器303的 總激勵是由二個分量組成。 一個來自于自適應碼本307。另一個來自于編碼激勵108 ;編 碼激勵又被稱作固化碼本(fixed codebook)激勵。長項預測在濁音編碼中扮演著重要角色, 這是由于濁音的強周期性。同時,相鄰的語音基音周期非常相似,這就導致下面表達式中激 勵的基音周期增益^ 305數(shù)值上很高。編碼^t勵分量無論對濁音還是清音都很重要。組合后 的總激勵可表達為
上式中& 是以n為取樣序數(shù)的一個子幀,它從包含過去激勵304的自適應碼本307 得來;e。 6 J來自于作用于當前激勵的編碼激勵碼本308 (又叫固化碼本fixed codebook)。 對于濁音,e, "J的作用更顯著,周期增益《305是一個1附近的值。 一般情況下激勵每 一子幀更新一次。典型的幀長為20毫秒;子幀長為5毫秒。
固化碼本激勵308的產(chǎn)生方式有一個很長歷史。編碼激勵產(chǎn)生的設計受三個主要因素的影響。第一個是感性質量;第二個是計算的復雜性;第三個是所需存儲空間的大小。激勵的 最初模型由隨機的噪聲激勵組成。噪聲激勵可以產(chǎn)生高質量的清音語音,但濁音語音的質量 卻不盡人意。另一個流行的激勵模型是脈沖激勵,像多脈沖激勵,其中每個可能脈沖的脈沖 位置和幅度都需要編碼并發(fā)送到解碼器。該脈沖激勵可以產(chǎn)生高質量的濁音語音。另一種變 型的脈沖激勵模型(ACELP激勵模型或者二元激勵模型)在工作時每個脈沖位置指數(shù)都需要 發(fā)送到解碼器;但除了需要發(fā)送到解碼器的幅度符號(+l或-l)外,所有幅度都賦予常數(shù)值 1。這是目前最流行的一種激勵模型,應用于多個國際標準中。
增益量化系統(tǒng)可分類為標量量化(SQ)和矢量量化(VQ);也可分類為直接量化和非直接 量化;還可分為預測量化和非預測量化;更進一步,可以將上述方法相互組合。標量量化(SQ) 意思是每個參數(shù)獨立量化。矢量量化(VQ)意思是參數(shù)組聯(lián)合量化,這需要參照先期存儲的 碼本表,從參數(shù)表中選出最優(yōu)的矢量量化參數(shù),從而受益于參數(shù)間的相關性。直接量化系統(tǒng) 是將兩個增益(&305和& 306)直接量化。非直接量化是將兩個增益參數(shù)轉化為另一組參 數(shù),再將這組參數(shù)量化;量化指數(shù)要傳給解碼器;解碼器再將這組參數(shù)變回到原來形式。預 測性量化用以前的量化參數(shù)來預測當前的參數(shù),并且僅僅對參數(shù)不可預測部分進行量化。這 種預測可以減少量化這些參數(shù)所需的比特數(shù);但是在傳輸中有比特流包丟失時會造成錯誤傳 播延長。
本發(fā)明將提出一個改進的量化系統(tǒng),它能夠在丟包后快速地恢復到正確的激勵能量,有 效地減少錯誤傳播。
圖3中顯示,激勵可以表示成(4)式。對于濁音語音,來自于自適應碼本的ep 的
作用非常顯著,所以,增益G是一個1附近的值,其能量比|^.^(")『/|卜(《)|2相對較高。對
于清音語音,來自于固化碼本的& 679作用更顯著,其能量比|^.^( )|2/|—( )|2也相對較高。
如果增益(G和是直接量化的,在前一個語音包發(fā)生丟失的情況下,盡管當前的包已經(jīng) 正常,當前直接量化增益(G和G)也正確,但當前激勵e f"J的能量可能要大大偏離正確 值。這是因為當前的自適應激勵分量ep "J仍然是前一個丟包后激勵的估計。而造成錯誤能 量估計的另一個原因之一是& 6jJ和e。 的對應關系在語音包丟失后發(fā)生了改變。在發(fā) 生丟包后,為了快速恢復正確的激勵能量和自適應激勵的比重,先將兩個增益(G和G)轉 化為兩個特殊的參數(shù) 一個表示全部的激勵能量,另一個表示自適應激勵的能量部分占全部 激勵能量的比重。
從等式(4)出發(fā),e 是長為A一s"6的一個子幀激勵,其總能量可以用相應的平均 能量來表示<formula>formula see original document page 8</formula> (5)
其中,
<formula>formula see original document page 8</formula>
以上各式中a a c的值在增益量化以前已經(jīng)確定。能量參數(shù)也可簡單地定義為激勵能 量的和-
<formula>formula see original document page 8</formula>(6)
第二個轉化了的參數(shù)表示兩個激勵元各自所占能量的比重,定義為
<formula>formula see original document page 8</formula> (7)
用方程組K5), (7)}或{(6), (7)},原始增益參數(shù){^和《}被轉化成另外兩個參數(shù){《,及",
然后被量化并送到解碼器。{玄"/^}的量化可基于SQ或VQ,在直接域或dB域量化。(g,及" 量化后,量化指數(shù)送到解碼器在解碼端,由(7)式回算《;由(5)式或(6)式回算6u 由于是變換后的參數(shù)(g,及"被量化并送到解碼器,在丟包幀后緊跟的正確幀中,分別由參
數(shù)店,及"表示的激勵能量和激勵周期性能得到維持;因此一旦收到正確包后,將迅速恢復 正確的激勵能量(見圖5)和周期性。圖5中501為丟失幀;502為丟失幀的后繼不丟失幀;正確的激勵能量在502幀中迅速恢復正確。
下面是兩個轉化后參數(shù)的量化表示例
{0. 010000, 0. 066667, 0. 133333, 0. 200000, 0. 266667, 0. 333333, 0. 400000, 0. 466667, 0. 533333, 0. 600000, 0. 666667, 0. 733333, 0. 800000, 0. 866667, 0. 933333, 0. 980000};
fe: {0.100000, 0. 309747, 0. 715438, 1. 246790, 1. 942727, 2. 854229, 4. 048066, 5. 611690
,7. 659643,10. 341944, 13. 855080,18. 456401, 24. 482967, 32. 376247, 42. 714448, 56. 254879, 73. 989421, 97. 217189,127. 639694' 167. 485488, 219. 673407, 288. 026391, 377. 551525, 494. 8 06824, 648.381632, 849. 525815, 1112. 973860,1458. 024216,1909. 952975, 2501. 865431, 3277 .121151, 4292. 510210, 5622. 413252, 7364. 250123, 9645. 616199,12633.629177,16547.17099 9,21672. 921696, "..}.
本發(fā)明可以有其他具體的不偏離其精髓或本質特征的表現(xiàn)形式。文中所述的實例也只是 具有說明性的而非嚴格限制性的意義。因此,較前面的敘述,后面的附加權利要求更明顯地 體現(xiàn)了本發(fā)明的范圍。全部與權利要求的意義等價的變化都包含在這權利要求的范圍內。
權利要求
1、一種增益量化系統(tǒng)用于改進語音丟包修補質量的方法,可以為語音信號或普通信號編解碼,編碼系統(tǒng)包含兩個激勵元或兩個激勵分量;一個激勵元通過增益(標為Gp)控制能量,這一激勵元稱為自適應碼本激勵,基音周期激勵或者稱為由以前綜合激勵貢獻的激勵;另一個激勵元通過增益(標為Gc)控制能量,這一激勵元稱為固化碼本激勵或者當前貢獻的激勵;其特征在于兩個增益值(Gp和Gc)首先被轉化為另兩個參數(shù),一個表示全部的激勵能量,另一個表示自適應激勵的能量部分占全部激勵能量的比重;這兩個變換后的參數(shù)可標為{Rp}。
2、 如權利要求l所述的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,其特征在于所 述編碼系統(tǒng)包含CELP技術。
3、 如權利要求1所述的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,其特征在于所 述激勵的總能量可以用激勵的平均能量來表示;
4、 如權利要求1所述的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,其特征在于所 述激勵的總能量可以用激勵的平均能量幅值來表示;
5、 如權利要求1所述的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,其特征在于所 述激勵的總能量可以用激勵能量的和來表示;
6、 如權利要求l所述的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,其特征在于所 述激勵的能量比是指激勵元之一的能量相對總能量的比值。
7、 如權利要求1所述的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,其特征在于所 述激勵的能量比是指激勵元之一的能量幅值相對總能量幅值的比值。
8、 如權利要求1中所述的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,其特征在于該方法進一步包含以下幾步在編碼器中量化變換后的參數(shù)(g,/ ";發(fā)送量化指數(shù)到解碼 器;在解碼器將量化參數(shù)算回到原始增益(G和G)。
全文摘要
本發(fā)明的增益量化系統(tǒng)用于改進語音丟包修補質量的方法,主要是先將兩個激勵元增益(Gp和Gc)轉化為兩個特殊的參數(shù)一個表示全部的激勵能量,另一個表示自適應激勵的能量部分占全部激勵能量的比值。然后,將轉化后的參數(shù)量化,送到解碼器。在解碼端將這兩個參數(shù)恢復為原始增益形式(Gp和Gc)。具有能夠在丟包后快速地恢復到正確的激勵能量,改進語音丟包后的修補質量,有效地減少錯誤傳播等優(yōu)點。
文檔編號G10L19/00GK101286320SQ20071019427
公開日2008年10月15日 申請日期2007年12月12日 優(yōu)先權日2006年12月26日
發(fā)明者揚 高 申請人:揚 高