两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于在音頻信號解碼器中進(jìn)行頻帶擴(kuò)展的優(yōu)化縮放因子的制作方法

文檔序號:9621056閱讀:587來源:國知局
用于在音頻信號解碼器中進(jìn)行頻帶擴(kuò)展的優(yōu)化縮放因子的制作方法
【專利說明】用于在音頻信號解碼器中進(jìn)行頻帶擴(kuò)展的優(yōu)化縮放因子
[0001] 本發(fā)明涉及為了對音頻信號(如語音、音樂或其他此類信號)進(jìn)行傳輸或存儲(chǔ)而 對其進(jìn)行編碼/解碼和處理的領(lǐng)域。
[0002] 更具體而言,本發(fā)明涉及一種用于確定優(yōu)化縮放因子的方法和裝置,作為在解碼 器或處理器中增強(qiáng)音頻信號的頻帶擴(kuò)展的一部分,該優(yōu)化縮放因子可用來對激勵(lì)信號的電 平進(jìn)行調(diào)整或者以等效方式對濾波器的電平進(jìn)行調(diào)整。
[0003] 存在許多技術(shù)用于壓縮(有損耗)音頻信號(如語音或音樂)。
[0004] 通常將用于對話式應(yīng)用的常規(guī)編碼方法分類為:波形編碼("脈沖編碼調(diào)制"PCM、 "自適應(yīng)差分脈沖編碼調(diào)制"ADCPM、變換編碼等);參數(shù)編碼("線性預(yù)測編碼"LPC、正弦編 碼等);以及通過"合成分析(analysisbysynthesis)"對參數(shù)進(jìn)行量化的參數(shù)混合編碼, 其中,CELP( "碼激勵(lì)線性預(yù)測")編碼是最著名的示例。
[0005] 對于非對話式應(yīng)用,(單)音頻信號編碼的現(xiàn)有技術(shù)由通過變換或以子頻帶進(jìn)行 的感知編碼與通過頻帶復(fù)制進(jìn)行的對高頻的參數(shù)編碼所組成。
[0006] 可以在以下這些著作中找到對常規(guī)語音和音頻編碼方法的回顧:W.B.克萊因 (W.B.Kleijn)和Κ·K.帕利埃爾(Κ·K.Paliwal)(編輯),《語音編碼與合成》(Speech CodingandSynthesis),愛思唯爾出版社,1995 ;Μ·博瑟(Μ·Bosi)、R.Ε·高德博 格(R.E.Goldberg),《數(shù)字音頻編碼和標(biāo)準(zhǔn)介紹》(IntroductiontoDigitalAudio CodingandStandards),斯普林格出版社,2002 ;J.貝尼斯提(J.Benesty)、Μ·M.松 迪(Μ·Μ·Sondhi)、Υ·黃(Υ·Huang)(編輯),《語音處理手冊》(HandbookofSpeech Processing),斯普林格出版社,2008。
[0007] 在此,更具體地關(guān)注3GPP標(biāo)準(zhǔn)化AMR-WB( "寬帶自適應(yīng)多速率")編解碼器(編碼 器和解碼器),該編解碼器在16kHz的輸入/輸出頻率上進(jìn)行操作并且其中信號被分成兩個(gè) 子頻帶:低頻帶(OkHz-6. 4kHz)和高頻帶(6. 4kHz-7kHz),該低頻帶以12. 8kHz進(jìn)行采樣并 且由CELP模型進(jìn)行編碼,而該高頻帶取決于當(dāng)前幀的模式在有附加信息或者沒有附加信 息的情況下通過"頻帶擴(kuò)展"(或者"帶寬擴(kuò)展"BWE)參數(shù)化地進(jìn)行重建。在此,可以注意到 的是,在7kHz上對AMR-WB編解碼器的編碼頻帶的限制實(shí)質(zhì)上與以下事實(shí)相關(guān)聯(lián):根據(jù)在標(biāo) 準(zhǔn)ITU-TP. 341中所定義的頻率掩模并且更具體地通過使用在標(biāo)準(zhǔn)ITU-TG. 191中所定義 的截?cái)?kHz以上的頻率的所謂"P341"濾波器(此濾波器遵循在P. 341中所定義的掩模) 在進(jìn)行標(biāo)準(zhǔn)化(ETSI/3GPP,然后ITU-T)時(shí)近似估計(jì)在寬帶終端的傳輸過程中的頻率響應(yīng)。 然而,理論上,眾所周知的是,以16kHz采樣的信號可以具有所限定的從0Hz到8000Hz的音 頻頻帶;因此,AMR-WB編解碼器通過與8kHz的理論帶寬進(jìn)行比較來引入對高頻帶的限制。
[0008] 在2001年,主要針對關(guān)于GSM(2G)和UMTS(3G)的電路模式(CS)電話技術(shù)應(yīng)用對 3GPPAMR-WB語音編解碼器進(jìn)行了標(biāo)準(zhǔn)化。還在2003年由ITU-T以建議G. 722. 2 "使用自 適應(yīng)多速率寬帶(AMR-WB)以大約16kbit/s進(jìn)行寬帶編碼語音"的形式對這種相同的編解 碼器進(jìn)行了標(biāo)準(zhǔn)化。
[0009]它包括從6. 6kbit/s到23. 85kbit/s的九種比特率(稱為模式),并且包括多種 連續(xù)傳輸機(jī)制(DTX,"不連續(xù)傳輸")以及多種丟失幀校正機(jī)制("幀擦除隱藏"FEC,有時(shí)也 稱為"包丟失隱藏"PLC),這些連續(xù)傳輸機(jī)制具有語音活動(dòng)檢測(VAD)以及來自靜音描述幀 (SID,"靜音插入描述符")的舒適噪音生成(CNG)。
[0010] 在此不再重復(fù)AMR-WB編碼和解碼算法的細(xì)節(jié)??梢栽谝韵挛墨I(xiàn)中找到對這種 編解碼的詳細(xì)說明:3GPP規(guī)范(TS26. 190、26. 191、26. 192、26. 193、26. 194、26. 204); ITU-T-G.722.2(以及相應(yīng)的附件和附錄);Β·貝塞特(B.Bessette)等人的題為《自適 應(yīng)多速率寬帶語音編解碼器(AMR-WB)》("Theadaptivemultiratewidebandspeech codec(AMR-WB)")的文章,IEEE語音和音頻處理會(huì)刊,第10卷,第8期,2002年,620-636 頁;以及相關(guān)聯(lián)的3GPP標(biāo)準(zhǔn)和ITU-T標(biāo)準(zhǔn)的源代碼。
[0011] AMR-WB編解碼器中的頻帶擴(kuò)展原理是相當(dāng)基礎(chǔ)的。實(shí)際上,高頻帶(6. 4kHz-7kHz) 是通過時(shí)間(以每子幀增益的形式應(yīng)用的)和頻率(通過應(yīng)用線性預(yù)測合成濾波器或"線 性預(yù)測編碼"LPC)包絡(luò)對白噪聲進(jìn)行整形而生成的。在圖1中展示了這種頻帶擴(kuò)展技術(shù)。
[0012] 由線性同余生成器針對每5ms子幀以16kHz生成白噪聲uHB1 (η),n= 0,…,79 (框 100)。通過對每個(gè)子幀應(yīng)用增益而及時(shí)地對此噪聲uHB1 (η)進(jìn)行格式化。此操作被分解為 兩個(gè)處理步驟(框102、106或109):
[0013] ?計(jì)算第一因子(框101)以將白噪聲uHB1(n)設(shè)置(框102)在與在低頻帶中以 12. 8kHz解碼的激勵(lì),η= 0·…· 63,的電平類似的電平處:
[0014]
[0015] 在此可以注意到的是,在不對多個(gè)米樣頻率(12. 8kHz或16kHz)的差異進(jìn)彳丁補(bǔ)償 的情況下,通過對具有不同尺寸的塊(針對u(η)為64并且針對uHB1 (η)為80)進(jìn)行比較來 完成對能量的歸一化。
[0016] ?然后,獲得高頻帶中的激勵(lì)(框106或109),形式如下:
[0017] uHB(n)r=gHBuHB1{n)
[0018] 其中,增益堯廊是根據(jù)比特率以不同的方式獲得的。如果當(dāng)前幀的比特率 〈23. 85kbit/s,那么增益被估計(jì)為"盲式(blind) "(也就是說,沒有附加信息);在這種 情況下,框103通過具有400Hz的截止頻率的高通濾波器對在低頻帶中所解碼的信號進(jìn)行 濾波來獲得信號,η= 0, "·,63-一此高通濾波器消除了非常低頻率的可以使在框 104中所作出的估計(jì)發(fā)生偏移的影響一一然后,通過歸一化的自相關(guān)(框104)來計(jì)算信號 的被表示為etllt的"傾斜度(tilt) "(頻譜斜率指示符):
[0019]
[0020] 并且最終,用以下形式來計(jì)算會(huì)拙:
[0021 ] ?拙=UspSsp + 容se
[0022] 其中,gSP=l_etllt是應(yīng)用于有效語音(SP)幀的增益,gBG= 1. 25gSP是應(yīng)用于與背 景(BG)噪聲相關(guān)聯(lián)的無效語音幀的增益,并且wSP是取決于語音活動(dòng)檢測(VAD)的加權(quán)函 數(shù)。應(yīng)理解的是,對傾斜度(etllt)的估計(jì)使得有可能根據(jù)信號的頻譜性質(zhì)對高頻帶的電平 進(jìn)行適配;當(dāng)CELP解碼信號的頻譜斜率為使得在頻率增加時(shí)平均能量減少時(shí)(語音信號的 情況,其中,etllt接近于1,因此,gSP= 1-etllt被由此減?。?,這種估計(jì)尤其重要。還應(yīng)注意 的是,AMR-WB解碼中的因子是有界的,在范圍[0.1,1.0]內(nèi)取值。實(shí)際上,對于在頻率 增加時(shí)能量增加的信號(etllt接近于-1,gSP接近于2),增益通常被低估。
[0023] 以23. 85kbit/s,校正信息項(xiàng)由AMR-WB編碼器所傳輸并且被解碼(框107、框108) 以便改進(jìn)針對每個(gè)子幀所估計(jì)的增益(每5毫秒4比特或0. 8kbit/s)。然后,通過具有傳 遞函數(shù)l/AHB(z)并且以16kHz的采樣頻率進(jìn)行操作的LPC合成濾波器(框111)來對人工 激勵(lì)uHB (η)進(jìn)行濾波(框111)。這種濾波器的構(gòu)造取決于當(dāng)前幀的比特率:
[0024] ?以6. 6kbit/s,通過按照因子γ= 0. 9對階數(shù)為20的LPC濾波器1 / ⑵進(jìn)行 加權(quán)來獲得濾波器1/ΑΗΒ (ζ),這對在低頻帶中(以12. 8kHz)所解碼的階數(shù)為16的LPC濾波 器l/2(z)進(jìn)行"外插"--在標(biāo)準(zhǔn)G. 722. 2第6. 3. 2. 1節(jié)中描述了在ISF(導(dǎo)抗頻譜頻率) 參數(shù)領(lǐng)域中進(jìn)行的外插的細(xì)節(jié)。在這種情況下,
[0025] MAm(z) = \!A^izfγ)
[0026] ?以比特率>6. 6kbit/s,濾波器1/ΑΗΒ(ζ)的階數(shù)為16,并且簡單對應(yīng)于:
[0027] \{ΑΗΒ(β)=·\ΙΑ{ζ1γ)
[0028] 其中,γ= 0. 6。應(yīng)注意的是,在這種情況下,在16kHz上使用濾波器1, , 這導(dǎo)致此濾波器的頻率響應(yīng)從[0kHz,6. 4kHz]擴(kuò)展(通過比例變換)至[0kHz,8kHz]。
[0029] 結(jié)果sHB(n)最終由FIR("有限脈沖響應(yīng)")類型的帶通濾波器(框112)處理以僅 保留6kHz-7kHz的頻帶;以23. 85kbit/s,同樣為FIR類型的低通濾波器(框113)被添加 到處理過程中以進(jìn)一步衰減7kH以上的頻率。高頻(HF)合成最終被添加(框130)到通過 框120至框122所獲得的低頻(LF)合成中并且被以16kHz進(jìn)行再采樣(框123)。從而,即 使在AMR-WB編解碼器中高頻帶理論上從6. 4kHz擴(kuò)展至7kHz,HF合成在與LF合成相加之 前而是被包含在6kHz-7kHz頻帶中。
[0030] 可以對AMR-WB編解碼器的頻帶擴(kuò)展技術(shù)的許多缺點(diǎn)進(jìn)行標(biāo)識,具體而言:
[0031] ?對每個(gè)子幀的增益(框101、框103至框105)的估計(jì)不是最佳的。部分地,它是 基于對不同頻率上的信號之間的每子幀"絕對"能量所進(jìn)行的均衡(框101) :16kHz上的人 工激勵(lì)(白噪聲)以及12. 8kHz上的信號(經(jīng)解碼的ACELP激勵(lì))。具體地,可注意到的 是,這種方法隱含地引起了對高頻帶激勵(lì)的衰減(按照比例12. 8/16 = 0. 8進(jìn)行);實(shí)際上, 還將注意的是,在AMR-WB編解碼器中未對高頻帶進(jìn)行去加重,這隱含地引起了相對接近于 0. 6的放大(這對應(yīng)于1八1-0. 68z》在6400Hz處的頻率響應(yīng)的值)。實(shí)際上,因子1/0. 8 與0.6得到了近似補(bǔ)償。
[0032] ?關(guān)于語音,記錄于3GPP報(bào)告TR26. 976中的3GPPAMR-WB編解碼器特征化測試 已經(jīng)示出以23. 85kbit/s的模式具有與在23. 05kbit/s上的模式相比不是很好的質(zhì)量,其 質(zhì)量實(shí)際上類似于以15. 85kbit/s的模式的質(zhì)量。這具體地示出了必須非常謹(jǐn)慎地控制人 工HF信號的電平,因?yàn)橘|(zhì)量在23. 85kbit/s上降低,而每幀4比特被認(rèn)為是最有可能使得 可以接近于原始高頻的能量。
[0033] ?在7kHz上的低通濾波器(框113)在低頻帶與高頻帶之間引入了幾乎lms的 偏移,這可能會(huì)通過以23. 85kbit/s對這兩個(gè)頻帶稍微進(jìn)行去同步而降低某些信號的質(zhì) 量--這種去同步還會(huì)在將比特率從23. 85kbit/s切換至其他模式時(shí)帶來多種問題。
[0034] 在描述AMR-WB+編解碼器的3GPP標(biāo)準(zhǔn)TS26. 290 (標(biāo)準(zhǔn)化于2005年)中描述了通 過時(shí)間方式進(jìn)行頻帶擴(kuò)展的示例。在圖2a的框圖(一般框圖)和圖2b的框圖(通過響應(yīng) 電平校正進(jìn)行的增益預(yù)測)中展示了本示例,這兩個(gè)框圖分別對應(yīng)于3GPP規(guī)范TS26.290 的圖16和圖10。
[0035] 在AMR-WB+編解碼器中,以頻率Fs(Hz)采樣的(單)輸入信號被分成兩個(gè)單獨(dú)的 頻帶,其中,兩個(gè)LPC濾波器被單獨(dú)地計(jì)算和編碼:
[0036] ?-個(gè)LPC濾波器(被表示為A(z))在低頻帶(O-Fs/4)上一一其量化版本被表示 為A(y-)
[0037] ?另一個(gè)LPC濾波器(被表示為AHF(z))在頻譜混疊的高頻帶(Fs/4-Fs/2)上一一 其量化版本被表示為(z)
[0038] 如在3GPP規(guī)范TS26. 290的第5. 4節(jié)(HF編碼)和第6. 2節(jié)(HF解碼)中所詳 細(xì)描述的,在AMR-WB+編解碼器中完成頻帶擴(kuò)展。其原理概述于此:該擴(kuò)展在于使用在低頻 處所解碼的激勵(lì)(LFC激勵(lì))并且通過每子幀時(shí)間增益(框205)和LPC合成濾波(框207) 將此激勵(lì)格式化;此外,如在圖2a中所展示的那些實(shí)現(xiàn)對激勵(lì)進(jìn)行增強(qiáng)(后處理)(框206) 以及對重建的HF信號的能量進(jìn)行平滑處理(框208)的那些處
當(dāng)前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
安吉县| 新建县| 和硕县| 泰安市| 陇川县| 环江| 偃师市| 循化| 建宁县| 玉门市| 神农架林区| 吉木乃县| 泗水县| 涡阳县| 曲阳县| 鹿邑县| 万全县| 上犹县| 定州市| 玛纳斯县| 郴州市| 天气| 盐边县| 和龙市| 咸宁市| 萨嘎县| 开阳县| 安阳市| 江津市| 抚州市| 绥德县| 富平县| 天水市| 望江县| 德惠市| 新闻| 宝兴县| 巴里| 沂南县| 鄂伦春自治旗| 和平县|