專利名稱:用編碼索引實(shí)現(xiàn)的空缺子帶填充方法及編碼索引生成方法
技術(shù)領(lǐng)域:
本發(fā)明屬于可分級編解碼,特別涉及利用編碼索引實(shí)現(xiàn)的空缺子帶填充方法 及編碼索引生成方法。
技術(shù)背景可分級編解碼技術(shù)將碼流劃分為一個(gè)核心層及多個(gè)增強(qiáng)層,其中核心層保 證信號的最低重建質(zhì)量,增強(qiáng)層則通過提高信噪比或者擴(kuò)展頻帶的方式漸次改 善重建質(zhì)量。接收到的增強(qiáng)層數(shù)越多,解碼的編碼音質(zhì)越高??煞旨壘幋a方法 通過直接丟棄增強(qiáng)層碼流的方式適應(yīng)網(wǎng)絡(luò)帶寬波動。在可分級編解碼過程中,如果碼率較低,編碼比特不足以對全頻帶信號進(jìn) 行編碼時(shí),會使解碼信號在頻譜上出現(xiàn)空洞,從而由于頻譜上的不連貫導(dǎo)致噪 聲的出現(xiàn),使最終的解碼效果大打折扣?,F(xiàn)有技術(shù)中,為應(yīng)對頻譜空洞現(xiàn)象所設(shè)計(jì)的空缺子帶填充方法機(jī)制比較簡單,在提升音質(zhì)方面效果不佳。例如3GPP的AMR-WB+中,通過生成高斯隨機(jī)噪聲 并依據(jù)能量進(jìn)行調(diào)整后來填充空缺子帶,此方法計(jì)算復(fù)雜度低,但是效果甚微。 還有ITU-T的G729. l中,采用帶寬擴(kuò)展的數(shù)據(jù)并依據(jù)能量進(jìn)行調(diào)整后來填充空缺 子帶,在一定程度上利用了填充子帶的原始信息,但是由于調(diào)整的手段單一, 填充效果不佳。因此如何解決頻譜空洞問題,避免其對解碼信號產(chǎn)生的不良影 響,是當(dāng)前可分級編解碼研究的重點(diǎn)。 發(fā)明內(nèi)容本發(fā)明提供了利用編碼索引實(shí)現(xiàn)的空缺子帶填充方法及編碼索引生成方 法,以便解決可分級編解碼過程中的頻譜空洞問題,提升解碼音質(zhì)。本發(fā)明提供了一種利用編碼索引實(shí)現(xiàn)的空缺子帶填充方法,包括以下步驟: 步驟l,接收編碼碼流,獲取編碼碼流中的核心層編碼索引、第一增強(qiáng)層編碼索 引和第二增強(qiáng)層編碼索引;步驟2,根據(jù)第一增強(qiáng)層編碼索引確定第一增強(qiáng)層解碼信息,根據(jù)第二增強(qiáng)層編 碼索引確定第二增強(qiáng)層解碼信息;步驟3,根據(jù)第一增強(qiáng)層解碼信息和第二增強(qiáng)層解碼信息對未量化子帶進(jìn)行填充 并作平滑后處理,包括以下2個(gè)步驟,步驟3. 1,根據(jù)第一增強(qiáng)層解碼信息初步填充第二增強(qiáng)層未能解碼的高頻成分步驟3.2,在完成初步填充之后,對填充子帶和其鄰接子帶做平滑處理。 而且,所述平滑處理的具體方式為,選取鄰接子帶平滑點(diǎn),將填充子帶以 及兩端鄰接子帶的平滑點(diǎn)納入平滑范圍內(nèi);計(jì)算填充子帶的平均能量Ar^/zoW 作為門限,計(jì)算平滑范圍內(nèi)的平均能量A;令變量^^ = &,若t即低于 決"AoW,則將其增大1.5db,若tmp高于Ar^2oW,則將其降低l. 5db;最后將平滑范圍內(nèi)的點(diǎn)按比例因子^ =、,進(jìn)行統(tǒng)一縮放。而且,根據(jù)空缺子帶與鄰接子帶的能量差值和鄰接子帶的平滑程度選取鄰 接子帶平滑點(diǎn)。本發(fā)明還提供了用于上述空缺子帶填充方法的編碼索引生成方法,技術(shù)方案為將當(dāng)前輸入信號分解為低頻信號和高頻信號分別進(jìn)行編碼;核心層對低頻信號進(jìn)行編碼,生成核心層編碼索引;-增強(qiáng)層使用帶寬擴(kuò)展參數(shù)編碼方法對高頻信號進(jìn)行編碼實(shí)現(xiàn)頻帶擴(kuò)展,帶寬擴(kuò)展參數(shù)編碼索引作為第一增強(qiáng)層 編碼索引;第二增強(qiáng)層將低頻殘差信號和高頻信號轉(zhuǎn)換到頻域后并量化,矢量 量化編碼索引作為第二增強(qiáng)層編碼索引,所述低頻殘差信號由低頻信號轉(zhuǎn)換得到。本發(fā)明提供的技術(shù)方案符合音頻信號的連續(xù)性和鄰接子帶相關(guān)性原則,并 且以空缺子帶能量為基本依據(jù),結(jié)合空缺子帶鄰接子帶信息共同完成對空缺子 帶的填充。因而,本發(fā)明可以有效減少頻譜空洞現(xiàn)象對解碼信號產(chǎn)生的不良影 響,提升解碼信號的音質(zhì)效果。
圖l為本發(fā)明實(shí)施例的編碼原理示意圖;圖2為本發(fā)明實(shí)施例的第一增強(qiáng)層編碼原理示意圖; 圖3為本發(fā)明實(shí)施例的第二增強(qiáng)層編碼原理示意圖; 圖4為本發(fā)明實(shí)施例的解碼原理示意圖; 圖5為本發(fā)明實(shí)施例的第一增強(qiáng)層解碼原理示意圖; 圖6為本發(fā)明實(shí)施例的第二增強(qiáng)層解碼原理示意圖; 圖7為本發(fā)明實(shí)施例的空缺子帶填充流程圖。
具體實(shí)施方式
本發(fā)明提供了一種利用編碼索引實(shí)現(xiàn)的空缺子帶填充方法,包括以下步驟 步驟l,接收編碼碼流,獲取編碼碼流中的核心層編碼索引、第一增強(qiáng)層編碼索 引和第二增強(qiáng)層編碼索引;步驟2,根據(jù)第一增強(qiáng)層編碼索引確定第一增強(qiáng)層解碼信息,根據(jù)第二增強(qiáng)層編 碼索引確定第二增強(qiáng)層解碼信息;步驟3,根據(jù)第一增強(qiáng)層解碼信息和第二增強(qiáng)層解碼信息對未量化子帶進(jìn)行填充 并作平滑后處理,包括以下2個(gè)步驟,步驟3. 1,根據(jù)第一增強(qiáng)層解碼信息初步填充第二增強(qiáng)層未能解碼的高頻成分;步驟3.2,在完成初步填充之后,對填充子帶和其鄰接子帶做平滑處理。第一增強(qiáng)層編碼索引是高頻空缺子帶填充的重建參考信息,可被視為子帶 粗略重建參考信息;第二增強(qiáng)層編碼索引可被視為子帶精確重建參考信息。聯(lián) 合子帶粗略重建參考信息和精確重建參考信息可以確定需要填充的子帶以及填 充內(nèi)容,最后還需要對精確重建信號中由于比特?cái)?shù)的限制而未能量化的子帶進(jìn) 行填充,即是所謂空缺子帶填充。本發(fā)明提出的空缺子帶填充方案,在根據(jù)第 一增強(qiáng)層解碼信息初步填充第二增強(qiáng)層未能解碼的高頻成分之后,對填充子帶 和其鄰接子帶做平滑處理。這種平滑處理手段巧妙符合音頻信號連續(xù)性和鄰接 子帶相關(guān)性原則,因此填充效果非常好,并且實(shí)施時(shí)計(jì)算復(fù)雜度不高,具有良 好的實(shí)用效果。具體實(shí)施時(shí),第一增強(qiáng)層編碼索引和第二增強(qiáng)層編碼索引根據(jù)編碼時(shí)第一 增強(qiáng)層和第二增強(qiáng)層的具體編碼處理方式而決定生成內(nèi)容。本發(fā)明提供了編碼索引生成優(yōu)選方案選擇第一增強(qiáng)層使用帶寬擴(kuò)展參數(shù)編碼方法對高頻信號進(jìn)行編碼實(shí)現(xiàn)頻帶擴(kuò)展,帶寬擴(kuò)展參數(shù)編碼索引作為第一增強(qiáng)層編碼索引,提供高頻空缺子帶填充的重建參考信息;第二增強(qiáng)層將低頻殘差信號和高頻信號轉(zhuǎn) 換到頻域后并量化,量化信號用于增強(qiáng)全頻帶編碼信號感知質(zhì)量,使合成信號編碼信噪比逐級提升,矢量量化編碼索引作為第二增強(qiáng)層編碼索引。帶寬擴(kuò)展 參數(shù)編碼方法為現(xiàn)有技術(shù),具體實(shí)施時(shí)若選用其他編碼方式,生成的第一增強(qiáng) 層編碼索引和第二增強(qiáng)層編碼索引也能用于本發(fā)明提供的空缺子帶填充方法。在實(shí)際運(yùn)用中,本發(fā)明提供的空缺子帶填充技術(shù)方案是可分級編解碼過程 的一部分,具體實(shí)施時(shí)可分級編解碼過程的核心層編解碼等其他部分可以采用 編解碼領(lǐng)域現(xiàn)有技術(shù)內(nèi)容。為了便于對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明,以下 提供實(shí)施例的完整可分級編解碼過程。參見圖l,可分級編碼過程具體包括以下5個(gè)步驟(11) 對輸入的音頻信號進(jìn)行正交鏡像濾波;具體將采樣率為16kHz,幀長為20ms的輸入音頻信號 ,(m)通過下采樣濾波后,經(jīng)正交鏡像濾波器分解為低頻信號和高頻信號,正交鏡像濾波器由低通濾 波器A(z)和高通濾波器//2(z)構(gòu)成,將音頻信號S,(力通過(z)得到低頻信號 &s(m),通過A(力得到高頻信號S,(n)。低通濾波器/Z^)為一對稱的64階FIR濾 波器,且i^(z)和/7々)存在以下關(guān)系//2(") = (-1)"^(")(12) 將低頻信號&,(^)送入核心層進(jìn)行CELP編碼;具體將低頻信號S^(w)通過核心層CELP編碼器得到輸出合成信號S:(w),用 以保證基本編碼質(zhì)量,并將編碼索引寫入編碼碼流。(13) 將高頻信號&,(力送入第一增強(qiáng)層進(jìn)行編碼;第一增強(qiáng)層提取一系列高頻參數(shù)(這一系列參數(shù)粗略的表征高頻信號s^w特征),如圖2所示,這一系列高頻參數(shù)包括一組時(shí)域包絡(luò)參數(shù)以及一組頻域包絡(luò)參數(shù)。具體包括以下過程(131)計(jì)算時(shí)域包絡(luò)參數(shù)。以每10樣點(diǎn)的對數(shù)域能量來表征高頻信號&,(") 時(shí)域包絡(luò),具體計(jì)算如下o備iog/ix/("十"0)2 i 一、"=0(132)計(jì)算頻域包絡(luò)參數(shù)。為高頻信號S,(")計(jì)算12個(gè)頻域包絡(luò)參數(shù) F柳,(7'), _/ = 0v..,ll,首先對S朋(")加窗wO)。窗w,0)形式如下1 — cos.l一cos、i力2;rO-16)) 111 = (), -,71 w = 72,.'-,127可以看到,這是一個(gè)128階長(16ms)的窗,其中上升沿是一個(gè)144階的 Hanning窗,滾降沿是一個(gè)112階的Hanning窗。KvO)對每10ms幀加窗一次,加窗時(shí),將Mv(")的最大樣值點(diǎn)至于當(dāng)前10ms 幀的中心,艮口;(w) = s朋(w). wf (m + 31), = —31,.."96加窗后,對加窗后信號《々)做64階FFT變換,F(xiàn)FT變換式如下"《(^> =尸尸7;4(^£(>) +《8(> + 64)), & = 0"."63, " = —31,…,32 對計(jì)算得到的FFT系數(shù),由下式計(jì)算得到對數(shù)域的12個(gè)頻域包絡(luò)參數(shù)'2(川) 、2 、其屮^(Q為一個(gè)頻域加權(quán)窗,窗值如下!^(0)二0.5, )^(1) = 1, &(2) = 0.5 (133)時(shí)域包絡(luò)參數(shù)量化。在量化時(shí)域包絡(luò)參數(shù)r,(/), z、0,…,15前,首先計(jì)算時(shí)域包絡(luò)均值參數(shù)Mp再通過分裂矢量量化進(jìn)行量化。Mr計(jì)算如下:然后,從7, 中移除量化值A(chǔ)7 :將均值移除后時(shí)域包絡(luò)參數(shù)分裂為以下2個(gè)8維矢量分別進(jìn)行量化<formula>formula see original document page 10</formula>(134)頻域包絡(luò)參數(shù)量化。在量化頻域包絡(luò)參數(shù)f,(乂) ,7' = 0,...,11前,首先計(jì)算頻域包絡(luò)均值參數(shù)Mp再通過分裂矢量量化進(jìn)行量化。M,計(jì)算如下:<formula>formula see original document page 10</formula>然后,從&力')中移除量化值4 :<formula>formula see original document page 10</formula>將均值移除后頻域包絡(luò)參數(shù)分裂為以下3個(gè)4維矢量分別進(jìn)行量化 <formula>formula see original document page 10</formula>步驟(133)和步驟(134)分別得到的時(shí)域包絡(luò)參數(shù)量化索引和頻域包絡(luò)參數(shù)量化索引共同構(gòu)成帶寬擴(kuò)展參數(shù)編碼索引,作為第一增強(qiáng)層編碼索引。(14)計(jì)算低頻加權(quán)殘差信號"(");首先計(jì)算低頻殘差信號《B(M),具體為將低頻信號&JM)減去合成信號 《"")得到<formula>formula see original document page 10</formula>然后將低頻殘差信號《B (力通過感知加權(quán)濾波器W』(Z)得到低頻加權(quán)殘差信號《W"), W』(Z)表達(dá)式如下』o其中n'和^'為常數(shù),/"c為增益補(bǔ)償,且:,其中i(z)為量化線性預(yù)測濾波器。J(z/;V)(15)將全頻帶信號送入第二增強(qiáng)層進(jìn)行編碼。如圖3所示,第二增強(qiáng)層對 全頻帶信號進(jìn)行編碼,使合成信號編碼信噪比逐級提升,具體包括以下過程(151) 譜整合。第二增強(qiáng)層輸入由兩部分構(gòu)成低頻加權(quán)殘差信號";(《)和高頻信號s,w,這兩個(gè)信號均為時(shí)域信號,需要進(jìn)行頻域轉(zhuǎn)換,得到低頻頻 域加權(quán)殘差信號J;(W和卨頻頻域信號s,(w并進(jìn)行譜整合,組成全頻段頻域信 號,記作1W;(152) 子帶劃分。將全頻帶頻域信號r(A) (320個(gè)樣點(diǎn))平均劃分為40個(gè) 子帶,每個(gè)子帶8個(gè)樣點(diǎn),對應(yīng)一個(gè)8維矢量,以便進(jìn)行格型矢量量化。定義 W —Zw朋J(力為第j個(gè)子帶的起始點(diǎn),則有一 Z ow7(i (y) S < A —Z)omW (乂 + 1), 7 = 0,…,39(153) 譜包絡(luò)計(jì)算及編碼;為了在量化y(々)時(shí)根據(jù)各子帶的感知重要性指導(dǎo)比特分配,需要計(jì)算各子 帶頻譜包絡(luò),頻譜包絡(luò)表達(dá)子帶的平均能量信息,可以用于在解碼端重建頻譜數(shù)據(jù)。各子帶頻譜包絡(luò)計(jì)算如下log— r薦(力二垂log:* — 2 w、其中,^.、為一微小偏移以防止k)g函數(shù)輸入為0,這里采用差分哈夫曼方法:化頻譜包絡(luò),—z>Mfex(y)為頻譜包絡(luò)量化索弓1; (154)子帶比特分配;定義^(力為第7個(gè)子帶的感知重要性:*C0 = |log:腦jC02 j. = 0,..,,39其中,mw 一 = 214 Jmfex(j')為量化的頻譜包絡(luò),W為偏移量,—^/)2為信號的子帶能量,為方便比較感知重要性,設(shè)定o,"=且,則:然后按子帶感知重要性^(/)從高到低分配各子帶編碼比特?cái)?shù),存于"&'《乂)中;(155)頻譜數(shù)據(jù)量化。根據(jù)己分配好的各子帶編碼比特?cái)?shù)^^(y'),運(yùn)用格型矢量量化方法量化頻譜數(shù)據(jù)F(W,并將該量化索引寫入碼流。此格型矢量量化索引和頻域包絡(luò)量化索引,L,^fcW共同構(gòu)成矢量量化編碼索引,作為第二增強(qiáng)層編碼索引。參見圖4,相應(yīng)的可分級解碼過程具體包括以下4個(gè)步驟(20核心層celp解碼;根據(jù)從收到的碼流中解析獲得的碼本索引,計(jì)算出代數(shù)碼本,然后通過lp合成濾波器以及長時(shí)相關(guān)合成濾波器,得到輸出合成信號s:w ; (22)第一增強(qiáng)層解碼;如圖5所示,第一增強(qiáng)層解碼具體包括以下過程,包括5個(gè)步驟(221)時(shí)域/頻域包絡(luò)參數(shù)解碼。時(shí)域包絡(luò)參數(shù)量化索引和頻域包絡(luò)參數(shù)量化索引共同構(gòu)成帶寬擴(kuò)展參數(shù)編碼索引,因此時(shí)域/頻域包絡(luò)參數(shù)解碼的根據(jù)即為帶寬擴(kuò)展參數(shù)編碼索引。需要解碼的包絡(luò)參數(shù)包括時(shí)域均值參數(shù)A,、頻域均值參數(shù)a^以及下列矢量t;^ 、 t;,2、 d、 f,.2、 &由分裂矢量t;^和r,,,合并得到均值移除矢量r:(/),然后再加上時(shí)域均 值參數(shù)Ar得到時(shí)域包絡(luò)參數(shù)r:(/):
C7f("r" = 0,…,.,15
由分裂矢量f:,p F二2和F二3合并得到均值移除矢量Ffc/),然后再加上
頻域均值參數(shù)^,.得到頻域包絡(luò)參數(shù)F:(乂)
F:(;) = Ff(y"F,7. = o,.....,ii
(222) 高頻激勵(lì)生成。將由核心層參數(shù)模擬生成的激勵(lì)信號exc(w)通過一 個(gè)截至頻率為4kHz的低通濾波器,得到最終的高頻激勵(lì)信號S^(");
(223) 時(shí)域包絡(luò)整形。通過對激勵(lì)信號S:(")時(shí)域包絡(luò)整形,得到的信號
^(w)將具有和原始高頻信號^(M)相近的時(shí)域包絡(luò)形狀,整形通過如下方式實(shí) 現(xiàn)
《 = g々)* 4C 0)," = 0,….,159
gj")的計(jì)算如下:
首先對激勵(lì)信號《e(w)進(jìn)行時(shí)域包絡(luò)參數(shù)計(jì)算,得到一組激勵(lì)信號時(shí)域包絡(luò) 嗜女t^), / = 0"..,15。
然后,利用解碼時(shí)域包絡(luò)參數(shù)7;:(/)和激勵(lì)信號時(shí)域包絡(luò)參數(shù)^,,(0,計(jì)算一
組預(yù)增益參數(shù):
gV(/) = 2fd"(0, / = 0,.."15
最后,對這組預(yù)增益參數(shù)進(jìn)行插值得到^("):
、o)-gV(0 +w,0 + io).g'r(卜i) w = 0,…,4
其中,gV(-l)定義為上一幀最后1.25ms計(jì)算得到的gV(15), w,(")為一平 頂Ha皿ing窗,窗表達(dá)式如下1 —COS
1 —COS
、
1
("+ 9);
、 6
"=0,..,,4 w = 10, .,14
(224)頻域包絡(luò)整形。解碼得到的頻域包絡(luò)參數(shù)/^(j'), 乂 = 0,...,11表征的 是每一個(gè)20ms幀第二個(gè)10ms幀的頻域包絡(luò),而第一個(gè)10ms幀的頻域包絡(luò)參數(shù)通
過插值得到
1
Fenv,int (力=5 (F卿,。w (乂) + F卿())))=0"."11
其中F:(y)為當(dāng)前幀的頻域包絡(luò)參數(shù),F(xiàn)柳廁G')為上一幀的頻域包絡(luò)參數(shù)。
然后,將時(shí)域包絡(luò)已調(diào)激勵(lì)信號sL^)分為2個(gè)10ms幀進(jìn)行頻域包絡(luò)參數(shù)計(jì) 算,得到分別對應(yīng)幀號/ = 1,2的頻域包絡(luò)參數(shù)巧, ,,(力,7' = 0,...,11,再得到頻域
預(yù)增益-
及GF,2(i) = 2
,)=0,.."11
接著利用此預(yù)測增益計(jì)算得到兩個(gè)FIR濾波器沖擊響應(yīng)
11
~, (w) 二 J]j (/)《)0) + 0 1 , " = 0,…,32, / = 1, 2
最后對時(shí)域包絡(luò)己調(diào)激勵(lì)信號《,(《)進(jìn)行頻域包絡(luò)整形
32
《s(") 二 Z《s("-附)~,i—), w = 0,…,79
32
《s(") = S&(" — — ~ 2—) ," = 80,…,159
(225)自適應(yīng)幅度壓縮后處理。經(jīng)過時(shí)域/頻域包絡(luò)整形后的信號S^W, 可能伴隨有一些咔-嗒的噪聲,有必要對《,(")進(jìn)行后處理。后處理的方法為將《》中每1. 25ms塊的能量與對應(yīng)的時(shí)域包絡(luò)參數(shù)r,(/)進(jìn)行比較,然后壓縮l
到合成信號S,("),具體處理原則如下
<formula>formula see original document page 15</formula>
(23 )包括本發(fā)明實(shí)施例聲明空缺子帶填充方法的第二增強(qiáng)層解碼; 第二增強(qiáng)層解碼后,頻譜信號將被分為高頻和低頻兩個(gè)部分,分別進(jìn)行時(shí)
域轉(zhuǎn)換后得到時(shí)域信號。高頻部分的時(shí)域信號即為原信號,低頻信號的時(shí)域《
號將作為擴(kuò)展核心層CELP解碼的補(bǔ)充,來改進(jìn)低頻合成信號的效果,其中一個(gè) 關(guān)鍵的過程即為本發(fā)明實(shí)施例聲明的空缺子帶填充方法。如圖6所示,解碼具體 包括以下過程
(231)包譜絡(luò)解碼。 從碼流中得到包譜絡(luò)量化索引rms —/"&x(./),并得到頻譜包絡(luò)
中;
<formula>formula see original document page 15</formula>
(232)子帶比特分配。首先計(jì)算第y個(gè)子帶的感知重要性^(力
然后按子帶感知重要性*(/)從高到低分配各子帶編碼比特?cái)?shù),存于"6"(力
(233)矢量量化解碼。根據(jù)各子帶編碼比特?cái)?shù)M&Y(力以及格型矢量量化索
引碼流,通過查找碼本得到量化頻譜數(shù)據(jù)r(";
(234)空缺子帶填充平滑。受限于碼率,在編碼時(shí)如果沒有足夠的比特對
所有子帶進(jìn)行量化,解碼得到的量化信號就會出現(xiàn)頻譜空洞現(xiàn)象,較大地影響解碼音質(zhì),因此需要對未量化子帶進(jìn)行填充以保證頻譜連續(xù)。
如圖7所示,本發(fā)明實(shí)施例提出了一種新的空缺子帶填充方案,結(jié)合空缺子 帶鄰接子帶信息共同完成對空缺子帶的平滑填充,符合音頻信號的連續(xù)性和鄰 接子帶相關(guān)性原則,可以有效減少頻譜空洞現(xiàn)象對解碼信號產(chǎn)生的不良影響, 提升解碼信號的音質(zhì)效果。具體實(shí)現(xiàn)過程可以包括
(2341)空缺子帶初步填充。在比特?cái)?shù)不夠的情況下,高頻部分有可能未 能編碼從而導(dǎo)致頻譜空洞,這里用第一增強(qiáng)層參數(shù)編碼頻譜信息初步填補(bǔ)第二 增強(qiáng)層未能編碼的高頻成分,則第y個(gè)子帶的填充如下
<formula>formula see original document page 16</formula>(2342)平滑填充子帶和鄰接子帶。在完成初步填充之后,需要對填充子
帶和鄰接子帶一起做平滑處理以避免邊界噪聲的出現(xiàn)。本發(fā)明提供了進(jìn)一步技 術(shù)方案,以空缺子帶能量為基本依據(jù)實(shí)現(xiàn)平滑,是提升解碼信號音質(zhì)效果的最 優(yōu)選平滑方案
首先選取鄰接子帶所需平滑點(diǎn)的數(shù)量N,選取可以參考兩個(gè)因素決定, 一是
空缺子帶與鄰接子帶的能量差值,另一個(gè)是鄰接子帶的平滑程度。假設(shè)鄰接子 帶為^ =(",,",... ,),其平均能量為^;而填充子帶為S^VZv.Ae),其通過編碼
端傳遞的能量值為& ,則選取的點(diǎn)數(shù)由下式?jīng)Q定<formula>formula see original document page 16</formula>其中<formula>formula see original document page 16</formula>,"表征臨近子帶的平滑程度。
<formula>formula see original document page 16</formula>表征填充子帶與臨近子帶的能量差異的大小。然后將填充子帶以及兩端鄰接子帶需平滑的點(diǎn)納入平滑范圍內(nèi),進(jìn)行統(tǒng)一 平滑。平滑范圍為
乂鵬,+8 + 1后。 平滑思想是將這#_個(gè)點(diǎn)的能量水平調(diào)整至填充子帶的能量水平,計(jì)算
填充子帶的平均能量Am^oW作為門限,艮卩
8
并計(jì)算平滑范圍內(nèi)的平均能量& :
若^低于門限值^^/zo/J,則將其增大1.5db;若高于,則降低1.5db。 由此來進(jìn)行譜線平滑。具體包括以下操作
首先,設(shè)定變量加p以便進(jìn)行平滑調(diào)整,首先對加p進(jìn)行初始賦值,令 加/ = &
然后,根據(jù)判斷結(jié)果,
若tmp〈threshold,令tmp=tmp*l. 414 (艮卩土曾大1.5db),此時(shí),若 tmp〉threshold, 貝U令tmp二threshold。
若tmp>=threshold,令tmp=tmp/l. 414 (即降低1.5db),此時(shí),若 trnp〈threshold, 貝U令tmp二threshold。
最后,根據(jù)變量加p的值計(jì)算比例因子P = J^,再將平滑范圍內(nèi)的點(diǎn)按比
五&
例因子^進(jìn)行統(tǒng)一縮放。本發(fā)明實(shí)施例選取了1.5db作為調(diào)整幅度,具體實(shí)施時(shí), 對A的調(diào)整可根據(jù)具體需要選取其他數(shù)值,在O. 5db~2. Odb范圍內(nèi)取值為佳。 經(jīng)過上述空缺子帶填充平滑處理后,頻譜空洞現(xiàn)象得以解決,同時(shí)由于對重建信號進(jìn)行能量平滑,消除了重建信號中"毛刺"噪聲,有效提升了解碼音質(zhì)。
(235)幅度調(diào)整。
根據(jù)量化頻譜包絡(luò)信息n/^ j(/)對信號—進(jìn)行能量調(diào)整得到最終解 碼信號f("。
(24)生成重構(gòu)合成音頻信號《,(")。將低頻合成信號S:(力和高頻合成信 號S:(")通過正交鏡像濾波器生成重構(gòu)音頻信號S,(力。即為高頻 信號&5(")的量化信號,又稱高頻合成信號。對低頻合成信號《』(力的處理還涉 及到低頻加權(quán)殘差信號J:(") , Aw二A(w)即為低頻加權(quán)殘差信號《(w)的量 化信號,又稱量化加權(quán)殘差信號。
可見;通過上述本發(fā)明實(shí)施例可以在編解碼端提供了一種性能良好的空缺 子帶填充實(shí)現(xiàn)方案。本發(fā)明實(shí)施例聯(lián)合帶寬擴(kuò)展參數(shù)編碼信息以及頻譜數(shù)據(jù)量 化信息對未量化子帶進(jìn)行填充,從而有效地消除了解碼合成信號頻譜空洞現(xiàn)象, 實(shí)現(xiàn)了編碼后的感知音質(zhì)的提高。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局 限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易 想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù) 范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1. 一種用編碼索引實(shí)現(xiàn)的空缺子帶填充方法,其特征在于,包括以下步驟步驟1,接收編碼碼流,獲取編碼碼流中的核心層編碼索引、第一增強(qiáng)層編碼索引和第二增強(qiáng)層編碼索引;步驟2,根據(jù)第一增強(qiáng)層編碼索引確定第一增強(qiáng)層解碼信息,根據(jù)第二增強(qiáng)層編碼索引確定第二增強(qiáng)層解碼信息;步驟3,根據(jù)第一增強(qiáng)層解碼信息和第二增強(qiáng)層解碼信息對未量化子帶進(jìn)行填充并作平滑后處理,包括以下2個(gè)步驟,步驟3.1,根據(jù)第一增強(qiáng)層解碼信息初步填充第二增強(qiáng)層未能解碼的高頻成分;步驟3.2,在完成初步填充之后,對填充子帶和其鄰接子帶做平滑處理。
2. 如權(quán)利要求1所述的空缺子帶填充方法,其特征在于所述平滑處理的具體 方式為,選取鄰接子帶平滑點(diǎn),將填充子帶以及兩端鄰接子帶的平滑點(diǎn)納入平 滑范圍內(nèi);計(jì)算填充子帶的平均能量A^^oW作為門限,計(jì)算平滑范圍內(nèi)的平 均能量&;令變量加^ = &,若tmp低于Am^oW,則將其增大1.5db,若t即高于決re涵oW,則將其降低1.5db;最后將平滑范圍內(nèi)的點(diǎn)按比例因子^ =進(jìn)行統(tǒng)一縮放。
3. 如權(quán)利要求2所述的空缺子帶填充方法,其特征在于根據(jù)空缺子帶與鄰接子帶的能量差值和鄰接子帶的平滑程度選取鄰接子帶平滑點(diǎn)。
4. 用于權(quán)利要求1或2或3所述的空缺子帶填充方法的編碼索引生成方法,其特 征在于將當(dāng)前輸入信號分解為低頻信號和高頻信號分別進(jìn)行編碼;核心層對低頻信號進(jìn)行編碼,生成核心層編碼索引;第一增強(qiáng)層使用帶寬擴(kuò)展參數(shù)編碼 方法對高頻信號進(jìn)行編碼實(shí)現(xiàn)頻帶擴(kuò)展,帶寬擴(kuò)展參數(shù)編碼索引作為第一增強(qiáng) 層編碼索引;第二增強(qiáng)層將低頻殘差信號和高頻信號轉(zhuǎn)換到頻域后并量化,矢 量量化編碼索引作為第二增強(qiáng)層編碼索引,所述低頻殘差信號由低頻信號轉(zhuǎn)換 得到。
全文摘要
本發(fā)明提供的空缺子帶填充方法包括接收編碼碼流,獲取第一增強(qiáng)層編碼索引和第二增強(qiáng)層編碼索引;根據(jù)第一增強(qiáng)層編碼索引確定解碼信息,根據(jù)第二增強(qiáng)層編碼索引確定解碼信息;根據(jù)解碼信息對未量化子帶進(jìn)行填充并作平滑處理,根據(jù)第一增強(qiáng)層解碼信息初步填充第二增強(qiáng)層未能解碼的高頻成分,對填充子帶和鄰接子帶做平滑處理。編碼索引生成時(shí)第一增強(qiáng)層使用帶寬擴(kuò)展參數(shù)編碼方法,帶寬擴(kuò)展參數(shù)編碼索引作為第一增強(qiáng)層編碼索引;第二增強(qiáng)層將低頻殘差信號和高頻信號轉(zhuǎn)換到頻域后并量化,矢量量化編碼索引作為第二增強(qiáng)層編碼索引。本發(fā)明可以有效減少頻譜空洞現(xiàn)象對解碼信號產(chǎn)生的不良影響,提升解碼信號的音質(zhì)效果。
文檔編號G10L19/08GK101281748SQ20081004772
公開日2008年10月8日 申請日期2008年5月14日 優(yōu)先權(quán)日2008年5月14日
發(fā)明者成 周, 楊玉紅, 胡瑞敏, 昭 謝, 戈 高 申請人:武漢大學(xué)