編碼裝置、解碼裝置、編碼方法和解碼方法
【專利摘要】公開(kāi)了通過(guò)將使高峰性為足夠低的狀態(tài)的低頻部分復(fù)制到高頻部分(擴(kuò)展頻帶),能夠防止在高頻部分中產(chǎn)生高峰性過(guò)大的頻譜,生成高質(zhì)量的擴(kuò)展頻帶頻譜的編碼裝置。在該裝置中,最大值搜索單元(132)在將語(yǔ)音信號(hào)及/或音樂(lè)信號(hào)的規(guī)定頻率以下的低頻部分劃分得到的多個(gè)子帶中,分別搜索對(duì)低頻部分的編碼數(shù)據(jù)即第一編碼數(shù)據(jù)進(jìn)行解碼得到的第一頻譜的振幅的最大值,振幅歸一化單元(133)用各子帶的振幅的最大值對(duì)各子帶中包含的第一頻譜分別進(jìn)行歸一化,得到歸一化頻譜。
【專利說(shuō)明】編碼裝置、解碼裝置、編碼方法和解碼方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及編碼裝置、解碼裝置、編碼方法和解碼方法。
【背景技術(shù)】
[0002]專利文獻(xiàn)I中,公開(kāi)了能夠?qū)Τ瑢拵?Super-Wide-band:SWB。一般為0.05?14kHz頻帶)的語(yǔ)音信號(hào)或音樂(lè)信號(hào)高效率地進(jìn)行編碼的技術(shù),該技術(shù)在ITU-T中已標(biāo)準(zhǔn)化(例如,非專利文獻(xiàn)I和2)。該技術(shù)中,語(yǔ)音信號(hào)或音樂(lè)信號(hào)等輸入信號(hào)的低頻部分(例如,7kHz以下的頻帶)由核心編碼單元進(jìn)行編碼,高頻部分(例如,高于7kHz的頻帶)由擴(kuò)展頻帶編碼單元進(jìn)行編碼。
[0003]另外,一般而言,核心編碼單元使用CELP (Code Excited Linear Prediction:碼激勵(lì)線性預(yù)測(cè))編碼。另一方面,擴(kuò)展頻帶編碼單元使用由核心編碼單元進(jìn)行了編碼的信息在頻域中進(jìn)行編碼。具體而言,擴(kuò)展頻帶編碼單元對(duì)由核心編碼單元進(jìn)行了編碼的低頻部分(7kHz以下)的窄頻帶信號(hào)進(jìn)行解碼,將變換為MDCT (Modified Discrete CosineTransform:改進(jìn)的離散余弦變換)系數(shù)(頻譜)得到的頻譜(低頻解碼頻譜)用于高頻部分(頻率高于7kHz的頻帶。以下稱為“擴(kuò)展頻帶”)的編碼。
[0004]在擴(kuò)展頻帶中進(jìn)行編碼時(shí),首先,對(duì)于由核心編碼單元生成的低頻解碼頻譜,用頻譜功率的包絡(luò)(或包絡(luò)線(envelope)。以下稱為包絡(luò)線)進(jìn)行歸一化。具體而言,將包含低頻解碼譜的低頻部分劃分為多個(gè)子帶,對(duì)每個(gè)子帶計(jì)算能量(子帶能量)。接著,進(jìn)行子帶能量的平滑化,以使頻域中的能量變動(dòng)平滑。接著,使用平滑化后的子帶能量,進(jìn)行各子帶中包含的頻譜的歸一化。擴(kuò)展頻帶編碼單元在如上得到的頻譜(歸一化頻譜)與輸入信號(hào)的擴(kuò)展頻帶頻譜之間搜索相關(guān)性高的頻帶,將表示相關(guān)性高的頻帶的信息作為滯后(lag)進(jìn)行編碼。另外,擴(kuò)展頻帶編碼單元將相關(guān)性高的低頻頻帶復(fù)制(copy)到擴(kuò)展頻帶,以將相關(guān)性高的低頻頻帶用作擴(kuò)展頻帶的頻譜精細(xì)結(jié)構(gòu)(頻率精細(xì)結(jié)構(gòu))。然后,擴(kuò)展頻帶編碼單元在頻譜精細(xì)結(jié)構(gòu)與擴(kuò)展頻帶頻譜之間計(jì)算增益,并對(duì)增益進(jìn)行編碼。
[0005]通過(guò)進(jìn)行以上處理,從低頻的頻譜生成擴(kuò)展頻帶的頻譜。
[0006]此外,在輸入信號(hào)中從低頻頻譜生成擴(kuò)展頻帶頻譜時(shí)對(duì)低頻頻譜進(jìn)行歸一化的理由如下。一般而言,在低頻頻譜中能量的偏頗非常大,在高頻的擴(kuò)展頻帶頻譜中能量的偏頗小。即,高頻部分中,與低頻部分相比,局部性地出現(xiàn)大峰值的情況較少,因而若將高峰性高的信號(hào)復(fù)制到高頻部分(擴(kuò)展頻帶),則有可能導(dǎo)致音質(zhì)劣化。因此,在編碼裝置中對(duì)低頻頻譜進(jìn)行歸一化是因?yàn)?,在消除低頻頻譜的能量偏頗來(lái)進(jìn)行平坦化(歸一化)之后計(jì)算與擴(kuò)展頻帶頻譜之間的相關(guān)性,則能夠更高效率地進(jìn)行編碼。
[0007]另一方面,非專利文獻(xiàn)3中公開(kāi)了在核心編碼單元中使用變換編碼的現(xiàn)有技術(shù)。在該現(xiàn)有技術(shù)中,將MPEG (Moving Picture Experts Group,動(dòng)態(tài)圖像專家組)AAC (高級(jí)音頻編碼)方式用于核心編碼單元。另外,使用與上述說(shuō)明的擴(kuò)展頻帶的編碼方式不同的SBR(Spectral Band Replication,頻帶復(fù)制)方式進(jìn)行擴(kuò)展頻帶的編碼。
[0008]現(xiàn)有技術(shù)文獻(xiàn)[0009]專利文獻(xiàn)
[0010][專利文獻(xiàn)I]日本特表2009-515212號(hào)公報(bào)
[0011]非專利文獻(xiàn)
[0012][非專利文獻(xiàn) I] ITU-T Standard G.718Annex B, 2008
[0013][非專利文獻(xiàn) 2] ITU-T Standard G.729Annex E, 2008
[0014][非專利文獻(xiàn) 3]Martin Dietz, Lars Liljeryd, Kristofer Kjorling, OliverKunz,,,Spectral Band Replication, a novel approach in audio coding,,,Preprint5553,112th AES Convention, Munich,2002
【發(fā)明內(nèi)容】
[0015]發(fā)明要解決的問(wèn)題
[0016]在非專利文獻(xiàn)I和2中,核心編碼單元中使用CELP編碼。CELP編碼有能夠?qū)τ谡Z(yǔ)音信號(hào)非常高效率地進(jìn)行編碼,且編碼性能良好的優(yōu)點(diǎn),但有對(duì)于音樂(lè)信號(hào)編碼性能不足的缺點(diǎn)。
[0017]但是,在用于對(duì)采樣率為32kHz的SWB的信號(hào)(SWB信號(hào))進(jìn)行編碼時(shí),需要提高音樂(lè)信號(hào)的編碼性能。在此情況下,可以考慮在核心編碼單元中使用變換編碼來(lái)代替CELP編碼。一般而言,變換編碼使用限定了數(shù)量的脈沖對(duì)頻譜進(jìn)行編碼,因而低頻頻譜由離散的脈沖串表現(xiàn)。
[0018]在對(duì)于這種以離散的脈沖串表現(xiàn)的頻譜,如非專利文獻(xiàn)I和2所述,劃分成子帶來(lái)計(jì)算子帶能量,進(jìn)行平滑化并估計(jì)包絡(luò)線的情況下,用于正確地計(jì)算子帶能量的頻譜就不足了。因此,在編碼裝置中,有可能估計(jì)出偏離本來(lái)的包絡(luò)線(即輸入信號(hào)的包絡(luò)線)的形狀的包絡(luò)線。即使編碼裝置用這樣求得的不正確的包絡(luò)線進(jìn)行低頻頻譜的歸一化,有時(shí)歸一化頻譜也得不到平坦化,會(huì)存在振幅極大的頻譜。
[0019]觀察語(yǔ)音信號(hào)或音樂(lè)信號(hào)的頻譜,在高頻部分中,與低頻部分相比,基本上不會(huì)局部地出現(xiàn)大的峰值。因此,若將高峰性高的狀態(tài)的低頻部分復(fù)制到高頻部分,則高頻部分產(chǎn)生高峰性過(guò)大的頻譜,導(dǎo)致音質(zhì)劣化。這樣,在低頻頻譜的特性不平坦的情況下,對(duì)使用低頻頻譜生成的擴(kuò)展頻帶的音質(zhì)造成不良影響。
[0020]本發(fā)明的目的在于,提供通過(guò)將使峰值性為足夠低的狀態(tài)的低頻部分復(fù)制到高頻部分(擴(kuò)展頻帶),能夠防止在高頻部分中產(chǎn)生高峰性過(guò)大的頻譜,生成高質(zhì)量的擴(kuò)展頻帶頻譜的編碼裝置、解碼裝置、編碼方法和解碼方法。
[0021]解決問(wèn)題的方案
[0022]本發(fā)明的一個(gè)方案的編碼裝置包括:第一編碼單元,對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼,生成第一編碼數(shù)據(jù);歸一化單元,對(duì)所述第一編碼數(shù)據(jù)進(jìn)行解碼得到的第一頻譜進(jìn)行歸一化,生成歸一化頻譜;頻帶搜索單元,搜索所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜即第二頻譜和所述歸一化頻譜之間的相關(guān)值為最大的特定的頻帶;增益計(jì)算單元,計(jì)算將所述特定的頻帶的所述歸一化頻譜復(fù)制到所述高頻部分得到的頻譜即第三頻譜和所述第二頻譜之間的增益;以及第二編碼單元,對(duì)包含所述特定的頻帶和所述增益的信息進(jìn)行編碼,生成第二編碼數(shù)據(jù),所述歸一化單元包括:最大值搜索單元,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及振幅歸一化單元,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,從而得到所述歸一化頻譜。
[0023]本發(fā)明的一個(gè)方案的編碼裝置采用的結(jié)構(gòu)包括:變換單元,將作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)變換到頻域而生成輸入信號(hào)頻譜;第一比特分配單元,確定對(duì)以規(guī)定的帶寬劃分所述輸入信號(hào)頻譜的整個(gè)頻帶得到的各子帶分配的比特?cái)?shù);第一編碼單元,使用分配的比特對(duì)所述輸入信號(hào)頻譜進(jìn)行編碼,生成第一編碼數(shù)據(jù);第二比特分配單元,確定對(duì)以規(guī)定的帶寬劃分所述輸入信號(hào)頻譜的低于規(guī)定頻率的低頻部分的頻譜得到的各子帶分配的比特?cái)?shù);第二編碼單元,使用分配的比特對(duì)所述輸入信號(hào)的低于規(guī)定頻率的低頻部分的頻譜進(jìn)行編碼,生成第二編碼數(shù)據(jù);第三編碼單元,對(duì)所述輸入信號(hào)頻譜的高于規(guī)定頻率的高頻部分的頻譜進(jìn)行編碼,生成第三編碼數(shù)據(jù);判定單元,分析所述輸入信號(hào)頻譜的高于規(guī)定頻率的高頻部分的頻譜的編碼所消費(fèi)的比特?cái)?shù)而得到判定信息;以及切換單元,根據(jù)所述判定信息,對(duì)每幀切換所述輸入信號(hào)頻譜的編碼是僅由所述第一編碼單元進(jìn)行,還是組合所述第二編碼單元和所述第三編碼單元進(jìn)行。
[0024]本發(fā)明的一個(gè)方案的解碼裝置采用的結(jié)構(gòu)包括:第一解碼單元,將在編碼裝置中對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼生成的第一編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第一頻譜;歸一化單元,對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜;以及第二解碼單元,將所述歸一化頻譜以及由所述編碼裝置生成的第二編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第二頻譜,所述第二編碼數(shù)據(jù)包含:表示在編碼側(cè)第一頻譜和編碼側(cè)第二頻譜之間相關(guān)值為最大的特定的頻帶的信息,所述編碼側(cè)第一頻譜是所述編碼裝置中的所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜,所述編碼側(cè)第二頻譜是在所述編碼裝置中對(duì)通過(guò)解碼所述第一編碼數(shù)據(jù)而生成的頻譜進(jìn)行歸一化得到的頻譜,以及表示在編碼側(cè)第三頻譜和所述編碼側(cè)第一頻譜之間計(jì)算出的增益的信息,所述編碼側(cè)第三頻譜是將所述特定的頻帶的所述編碼側(cè)第二頻譜復(fù)制到所述高頻部分得到的頻譜,所述歸一化單元包括:最大值搜索單元,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及振幅歸一化單元,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,生成所述歸一化頻譜。
[0025]本發(fā)明的一個(gè)方案的編碼方法采用的結(jié)構(gòu)包括如下步驟:第一編碼步驟,對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼,生成第一編碼數(shù)據(jù);歸一化步驟,對(duì)所述第一編碼數(shù)據(jù)進(jìn)行解碼得到的第一頻譜進(jìn)行歸一化,生成歸一化頻譜;頻帶搜索步驟,搜索所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜即第二頻譜和所述歸一化頻譜之間的相關(guān)值為最大的特定的頻帶;增益計(jì)算步驟,計(jì)算將所述特定的頻帶的所述歸一化頻譜復(fù)制到所述高頻部分得到的頻譜即第三頻譜和所述第二頻譜之間的增益;以及第二編碼步驟,對(duì)包含所述特定的頻帶和所述增益的信息進(jìn)行編碼,生成第二編碼數(shù)據(jù),所述歸一化步驟包括:最大值搜索步驟,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及振幅歸一化步驟,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,得到所述歸一化頻譜。
[0026]本發(fā)明的一個(gè)方案的解碼方法采用的結(jié)構(gòu)包括如下步驟:第一解碼步驟,將在編碼裝置中對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼生成的第一編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第一頻譜;歸一化步驟,對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜;以及第二解碼步驟,將所述歸一化頻譜以及由所述編碼裝置生成的第二編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第二頻譜,所述第二編碼數(shù)據(jù)包含:表示在編碼側(cè)第一頻譜和編碼側(cè)第二頻譜之間相關(guān)值為最大的特定的頻帶的信息,所述編碼側(cè)第一頻譜是所述編碼裝置中的所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜,所述編碼側(cè)第二頻譜是在所述編碼裝置中對(duì)通過(guò)解碼所述第一編碼數(shù)據(jù)而生成的頻譜進(jìn)行歸一化得到的頻譜,以及表示在編碼側(cè)第三頻譜和所述編碼側(cè)第一頻譜之間計(jì)算出的增益的信息,所述編碼側(cè)第三頻譜是將所述特定的頻帶的所述編碼側(cè)第二頻譜復(fù)制到所述高頻部分得到的頻譜,所述歸一化步驟包括:最大值搜索步驟,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及振幅歸一化步驟,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,得到所述歸一化頻譜。
[0027]發(fā)明的效果
[0028]根據(jù)本發(fā)明,通過(guò)將使高峰性為足夠低的狀態(tài)的低頻部分復(fù)制到高頻部分(擴(kuò)展頻帶),能夠防止在高頻部分中產(chǎn)生高峰性過(guò)大的頻譜,生成高質(zhì)量的擴(kuò)展頻帶頻譜。
【專利附圖】
【附圖說(shuō)明】
[0029]圖1是表示本發(fā)明實(shí)施方式I的編碼裝置的結(jié)構(gòu)的方框圖。
[0030]圖2是表示本發(fā)明實(shí)施方式I的編碼裝置的頻帶搜索單元的動(dòng)作情形的圖。
[0031]圖3是表示本發(fā)明實(shí)施方式I的解碼裝置的結(jié)構(gòu)的方框圖。
[0032]圖4是表示本發(fā)明實(shí)施方式I的解碼裝置的擴(kuò)展頻帶解碼單元的動(dòng)作情形的圖。
[0033]圖5是表示本發(fā)明實(shí)施方式I的子帶振幅歸一化單元的內(nèi)部結(jié)構(gòu)的方框圖。
[0034]圖6是表示以往的包絡(luò)線計(jì)算處理的圖。
[0035]圖7是表示以往的歸一化低頻頻譜的圖。
[0036]圖8是表示本發(fā)明實(shí)施方式I的歸一化低頻頻譜的圖。
[0037]圖9是表示本發(fā)明實(shí)施方式2的編碼裝置的結(jié)構(gòu)的方框圖。
[0038]圖10是表示本發(fā)明實(shí)施方式2的解碼裝置的結(jié)構(gòu)的方框圖。
[0039]圖11是表示本發(fā)明實(shí)施方式2的包絡(luò)線計(jì)算處理、以及諧波增強(qiáng)歸一化低頻頻譜的圖。
[0040]圖12是表示本發(fā)明實(shí)施方式3的編碼裝置的結(jié)構(gòu)的方框圖。
[0041]圖13是表示本發(fā)明實(shí)施方式3的解碼裝置的結(jié)構(gòu)的方框圖。
[0042]圖14是表示本發(fā)明實(shí)施方式4的編碼裝置的結(jié)構(gòu)的方框圖。
[0043]圖15是表示本發(fā)明實(shí)施方式4的解碼裝置的結(jié)構(gòu)的方框圖。
[0044]圖16是表示本發(fā)明實(shí)施方式4的編碼裝置的頻譜包絡(luò)歸一化單元的內(nèi)部結(jié)構(gòu)的方框圖。
[0045]圖17是表示本發(fā)明實(shí)施方式5的編碼裝置的頻帶搜索單元的動(dòng)作情形的圖。
[0046]圖18是表示本發(fā)明實(shí)施方式5的解碼裝置的擴(kuò)展頻帶解碼單元的動(dòng)作情形的圖。
[0047]圖19是表示本發(fā)明實(shí)施方式6的編碼裝置的將輸入信號(hào)頻譜劃分為多個(gè)子帶的圖。
[0048]圖20是表示本發(fā)明實(shí)施方式6的編碼裝置的結(jié)構(gòu)的方框圖。
[0049]圖21是表示本發(fā)明實(shí)施方式6的編碼裝置的模式判定單元的結(jié)構(gòu)的圖。[0050]圖22是表示本發(fā)明實(shí)施方式6的解碼裝置的結(jié)構(gòu)的方框圖。
[0051]圖23是表示本發(fā)明實(shí)施方式8的編碼裝置的頻譜包絡(luò)歸一化單元的內(nèi)部結(jié)構(gòu)的方框圖。
[0052]標(biāo)號(hào)說(shuō)明
[0053]100、300、500、700、900 編碼裝置
[0054]101、901時(shí)間-頻率變換單元
[0055]102核心編碼單元
[0056]103、203、501、601子帶振幅歸一化單元
[0057]104頻帶搜索單元
[0058]105增益計(jì)算單元
[0059]106、擴(kuò)展頻帶編碼單元
[0060]107、906 復(fù)用單元
[0061]131頻帶劃分單元
[0062]132最大值搜索單元
[0063]133振幅歸一化單元
[0064]200、400、600、800、1010 解碼裝置
[0065]201、1011 分離單元
[0066]202核心解碼單元
[0067]204擴(kuò)展頻帶解碼單元
[0068]205頻率-時(shí)間變換單元
[0069]301、401、503、603 諧波增強(qiáng)單元
[0070]502,602閾值控制單元
[0071]701,801歸一化方法判定單元
[0072]702、702a、802、802a頻譜包絡(luò)歸一化單元
[0073]731頻帶劃分單元
[0074]732子帶能量計(jì)算單元
[0075]733平滑化單元
[0076]734頻譜校正單元
[0077]902模式判定單元
[0078]903、905比特分配確定單元
[0079]904變換編碼單元
[0080]907、908 開(kāi)關(guān)
[0081]1015變換編碼解碼單元
【具體實(shí)施方式】
[0082]本發(fā)明中,編碼裝置在使用低頻部分的頻譜(低頻頻譜)生成擴(kuò)展頻帶的頻譜(擴(kuò)展頻帶頻譜)的編解碼中,將低頻頻譜劃分為多個(gè)子帶,對(duì)每個(gè)子帶的頻譜用各子帶中包含的頻譜的振幅最大值進(jìn)行歸一化。這樣一來(lái),即使低頻頻譜為離散的頻譜,也能夠抑制振幅極大的頻譜的產(chǎn)生,得到平坦的歸一化低頻頻譜。由此,編碼裝置通過(guò)將使高峰性抑制為足夠低的狀態(tài)的低頻部分復(fù)制到擴(kuò)展頻帶,能夠防止在擴(kuò)展頻帶中產(chǎn)生高峰性過(guò)大的頻譜,生成高質(zhì)量的擴(kuò)展頻帶頻譜。
[0083]下面,參照附圖詳細(xì)地說(shuō)明本發(fā)明的各實(shí)施方式。另外,作為本發(fā)明的編碼裝置和解碼裝置的輸入信號(hào)或輸出信號(hào),語(yǔ)音信號(hào)、音樂(lè)信號(hào)和這些信號(hào)混合存在的信號(hào)都作為對(duì)象的信號(hào)。
[0084](實(shí)施方式I)
[0085]圖1是表示實(shí)施方式I的編碼裝置100的結(jié)構(gòu)的方框圖。
[0086]圖1所示的編碼裝置100由時(shí)間-頻率變換單元101、核心編碼單元102、子帶振幅歸一化單元103、頻帶搜索單元104、增益計(jì)算單元105、擴(kuò)展頻帶編碼單元106、以及復(fù)用單元107構(gòu)成。本實(shí)施方式中,輸入到編碼裝置100的輸入頻譜中規(guī)定頻率以下的低頻部分(低頻頻譜)由核心編碼單元102進(jìn)行編碼,輸入頻譜中,高于由核心編碼單元102進(jìn)行編碼的頻帶的高頻帶(頻率高于規(guī)定頻率的頻帶。以后稱為擴(kuò)展頻帶)的頻譜由擴(kuò)展頻帶編碼單元106進(jìn)行編碼。
[0087]時(shí)間-頻率變換單元101將輸入的時(shí)域的輸入信號(hào)(語(yǔ)音信號(hào)或/及音樂(lè)信號(hào))變換為頻域的信號(hào),將得到的輸入信號(hào)頻譜輸出到核心編碼單元102、頻帶搜索單元104、以及增益計(jì)算單元105。此外,這里,作為時(shí)間-頻率變換單元101中的時(shí)間-頻率變換處理,以MDCT變換為前提進(jìn)行說(shuō)明。但是,時(shí)間-頻率變換單元101也可以使用從時(shí)域向頻域變換的 FFT (Fast Fourier Transform,快速傅立葉變換)、DCT (Discrete CosineTransform,離散余弦變換)等正交變換。
[0088]核心編碼單元102對(duì)從時(shí)間-頻率變換單元101輸入的輸入信號(hào)頻譜中的低頻頻譜進(jìn)行編碼,生成編碼數(shù)據(jù)。核心編碼單元102使用變換編碼進(jìn)行編碼。核心編碼單元102將生成的編碼數(shù)據(jù)作為核心編碼數(shù)據(jù)輸出到復(fù)用單元107。另外,核心編碼單元102將對(duì)核心編碼數(shù)據(jù)進(jìn)行解碼得到的核心編碼低頻頻譜輸出到子帶振幅歸一化單元103。
[0089]子帶振幅歸一化單元103對(duì)從核心編碼單元102輸入的核心編碼低頻頻譜進(jìn)行歸一化,生成歸一化低頻頻譜。具體而言,子帶振幅歸一化單元103將核心編碼低頻頻譜劃分為多個(gè)子帶,對(duì)各個(gè)子帶的頻譜用各子帶所包含的頻譜的振幅(絕對(duì)值)的最大值分別進(jìn)行歸一化。子帶振幅歸一化單元103將通過(guò)歸一化處理得到的歸一化低頻頻譜輸出到頻帶搜索單元104和增益計(jì)算單元105。此外,子帶振幅歸一化單元103的結(jié)構(gòu)和動(dòng)作的細(xì)節(jié)將后述。
[0090]頻帶搜索單元104、增益計(jì)算單元105、以及擴(kuò)展頻帶編碼單元106進(jìn)行輸入信號(hào)頻譜中的、擴(kuò)展頻帶的頻譜(輸入擴(kuò)展頻帶頻譜)的編碼處理。
[0091]頻帶搜索單元104從時(shí)間-頻率變換單元101輸入的輸入信號(hào)頻譜中,搜索輸入擴(kuò)展頻帶頻譜與從子帶振幅歸一化單元103輸入的歸一化低頻頻譜之間的相關(guān)值為最大的特定的頻帶。接著,頻帶搜索單元104將表示搜索到的上述特定的頻帶(歸一化低頻頻譜的對(duì)象頻帶(復(fù)制源)以及擴(kuò)展頻帶的對(duì)象頻帶(復(fù)制目的地))的信息(稱為滯后或滯后信息)輸出到增益計(jì)算單元105和擴(kuò)展頻帶編碼單元106。
[0092]圖2是表示頻帶搜索單元104的動(dòng)作情形的圖。在頻帶搜索單元104中,從輸入的歸一化低頻頻譜中,對(duì)于預(yù)先確定的每個(gè)滯后候選(圖2中作為例子是LO?L3的4候選),截取與各滯后候選對(duì)應(yīng)的頻譜。截取出的頻譜以從基準(zhǔn)頻率f0起移位了由滯后候選表示的預(yù)定樣本值的位置為起點(diǎn),包含在與輸入擴(kuò)展頻帶頻譜(擴(kuò)展頻帶的整個(gè)頻帶或部分頻帶)的帶寬相同的帶寬中。截取出的頻譜作為相關(guān)值計(jì)算的候選頻譜被輸出到相關(guān)值計(jì)算單元104a。在本例中,4種候選頻譜成為相關(guān)值計(jì)算的對(duì)象。
[0093]相關(guān)值計(jì)算單元104a計(jì)算按照滯后候選確定的各個(gè)候選頻譜與輸入頻帶頻譜之間的相關(guān)值,將表示這些相關(guān)值中的最高值時(shí)的滯后候選作為表示所述特定的頻帶的信息,輸出到增益計(jì)算單元105和擴(kuò)展頻帶編碼單元106。
[0094]增益計(jì)算單元105將在頻帶搜索單元104中搜索到的上述特定的頻帶的歸一化低頻頻譜復(fù)制(復(fù)寫)到擴(kuò)展頻帶而得到的頻譜,作為頻譜精細(xì)結(jié)構(gòu)(頻率精細(xì)結(jié)構(gòu))。接著,增益計(jì)算單元105在得到的頻譜精細(xì)結(jié)構(gòu)與從時(shí)間-頻率變換單元101輸入的輸入擴(kuò)展頻帶頻譜之間計(jì)算增益。增益計(jì)算單元105將表示計(jì)算出的增益的信息輸出到擴(kuò)展頻帶編碼單元106。增益計(jì)算單元105計(jì)算增益以使從歸一化低頻頻譜復(fù)制來(lái)的信號(hào)的能量和輸入信號(hào)頻譜的擴(kuò)展頻帶中的能量基本一致(或接近)。作為計(jì)算增益的最簡(jiǎn)單的方法,例如有將輸入信號(hào)頻譜的擴(kuò)展頻帶的能量除以從歸一化低頻頻譜復(fù)制來(lái)的信號(hào)的能量,并將得到的值的平方根作為增益的方法。
[0095]擴(kuò)展頻帶編碼單元106對(duì)從頻帶搜索單元104輸入的表示特定的頻帶的信息進(jìn)行編碼,并且對(duì)從增益計(jì)算單元105輸入的增益進(jìn)行編碼。擴(kuò)展頻帶編碼單元106將對(duì)特定的頻帶和增益進(jìn)行編碼而生成的編碼數(shù)據(jù)作為擴(kuò)展頻帶編碼數(shù)據(jù)輸出到復(fù)用單元107。
[0096]復(fù)用單元107對(duì)從核心編碼單元102輸入的核心編碼數(shù)據(jù)和從擴(kuò)展頻帶編碼單元106輸入的擴(kuò)展頻帶編碼數(shù)據(jù)進(jìn)行復(fù)用,輸出編碼數(shù)據(jù)。
[0097]下面,說(shuō)明本實(shí)施方式的解碼裝置200。圖3是表示解碼單元200的結(jié)構(gòu)的方框圖。
[0098]圖3所示的解碼裝置200由分離單元201、核心解碼單元202、子帶振幅歸一化單元203、擴(kuò)展頻帶解碼單元204以及頻率-時(shí)間變換單元205構(gòu)成。
[0099]分離單元201將輸入的編碼數(shù)據(jù)分離為核心編碼數(shù)據(jù)和擴(kuò)展頻帶編碼數(shù)據(jù)。分離單元201將核心編碼數(shù)據(jù)輸出到核心解碼單元202,將擴(kuò)展頻帶編碼數(shù)據(jù)輸出到擴(kuò)展頻帶解碼單元204。
[0100]如上所述,核心編碼數(shù)據(jù)是在編碼裝置100中對(duì)輸入信號(hào)(語(yǔ)音信號(hào)或/及音樂(lè)信號(hào))的規(guī)定頻率以下的低頻部分進(jìn)行編碼而得到的編碼數(shù)據(jù)。另外,擴(kuò)展頻帶編碼數(shù)據(jù)中,包含表示輸入信號(hào)(語(yǔ)音信號(hào)或/及音樂(lè)信號(hào))的高于規(guī)定頻率的高頻部分的頻譜(輸入擴(kuò)展頻帶頻譜)和歸一化頻譜之間相關(guān)值為最大的特定的頻帶的信息、以及表示將特定的頻帶的歸一化頻譜復(fù)制到高頻部分而得到的頻譜(頻譜精細(xì)結(jié)構(gòu))和輸入擴(kuò)展頻帶頻譜之間的增益的信息。
[0101]核心解碼單元202對(duì)從分離單元201輸入的核心編碼數(shù)據(jù)進(jìn)行解碼,生成核心編碼低頻頻譜。核心解碼單元202將生成的核心編碼低頻頻譜輸出到子帶振幅歸一化單元203和頻率-時(shí)間變換單元205。
[0102]子帶振幅歸一化單元203對(duì)從核心接碼單元202輸入的核心編碼低頻頻譜進(jìn)行歸一化,生成歸一化低頻頻譜。子帶振幅歸一化單元203將生成的歸一化低頻頻譜輸出到擴(kuò)展頻帶解碼單元204。此外,子帶振幅歸一化單元203的結(jié)構(gòu)和動(dòng)作與圖1所示的子帶振幅歸一化單元103的結(jié)構(gòu)和動(dòng)作(將后述)相同,因而省略詳細(xì)的說(shuō)明。[0103]擴(kuò)展頻帶解碼單元204使用從子帶振幅歸一化單元203輸入的歸一化低頻頻譜和從分離單元201輸入的擴(kuò)展頻帶編碼數(shù)據(jù)進(jìn)行解碼處理,得到擴(kuò)展頻帶頻譜。擴(kuò)展頻帶解碼單元204對(duì)擴(kuò)展頻帶編碼數(shù)據(jù)進(jìn)行解碼,得到滯后信息和增益。擴(kuò)展頻帶解碼單元204基于滯后信息,確定要復(fù)制到擴(kuò)展頻帶的歸一化低頻頻譜的規(guī)定頻帶,將歸一化低頻頻譜的規(guī)定頻帶復(fù)制到擴(kuò)展頻帶。接著,擴(kuò)展頻帶解碼單元204通過(guò)對(duì)于將歸一化低頻頻譜的規(guī)定頻帶復(fù)制到擴(kuò)展頻帶所得到的頻譜,乘以解碼后的增益,由此得到擴(kuò)展頻帶頻譜。然后,擴(kuò)展頻帶解碼單元204將得到的擴(kuò)展頻帶頻譜輸出到頻率-時(shí)間變換單元205。
[0104]圖4是表示擴(kuò)展頻帶解碼單元204的動(dòng)作情形的圖。首先,擴(kuò)展頻帶解碼單元204基于滯后信息,確定用于復(fù)制到擴(kuò)展頻帶的歸一化低頻頻譜的起點(diǎn)。圖4中,以得到滯后信息LI的情況為例子,因而將位于Π的頻譜作為起點(diǎn)。
[0105]接著,擴(kuò)展頻帶解碼單元204在擴(kuò)展頻帶頻譜生成單元204a中,從該起點(diǎn)開(kāi)始,截取包含在與輸入擴(kuò)展頻帶頻譜(擴(kuò)展頻帶的整個(gè)頻帶或部分頻帶)的帶寬相同的帶寬中的頻譜,生成擴(kuò)展頻帶頻譜(乘以增益之前的)。
[0106]頻率-時(shí)間變換單元205首先結(jié)合從核心解碼單元202輸入的核心編碼低頻頻譜和從擴(kuò)展頻帶解碼單元204輸入的擴(kuò)展頻帶頻譜,生成解碼頻譜。接著,頻率-時(shí)間變換單元205對(duì)解碼頻譜進(jìn)行正交變換,變換為時(shí)域的信號(hào)并作為輸出信號(hào)輸出。
[0107]接下來(lái)詳細(xì)說(shuō)明編碼裝置100的子帶振幅歸一化單元103的結(jié)構(gòu)和動(dòng)作。
[0108]子帶振幅歸一化單元103消除從核心編碼單元102輸入的核心編碼低頻頻譜的能量偏頗,得到歸一化低頻頻譜。這里,消除頻譜的能量偏頗的通常的方法是,求頻譜的包絡(luò)線,并將頻帶內(nèi)的各頻譜除以每個(gè)頻帶的包絡(luò)線的代表值,由此進(jìn)行歸一化。非專利文獻(xiàn)I和2中,也通過(guò)同樣的方法對(duì)低頻頻譜進(jìn)行歸一化。
[0109]但是,在核心編碼單元102中使用變換編碼并且比特率較低的情況下,低頻頻譜表現(xiàn)為離散的脈沖串。根據(jù)表示低頻頻譜的離散的脈沖串,難以正確地求包絡(luò)線。因此,在使用這種根據(jù)低頻頻譜求得的不正確的包絡(luò)線對(duì)低頻頻譜進(jìn)行了歸一化時(shí),產(chǎn)生歸一化低頻頻譜中留有能量偏頗而殘存振幅極大的頻譜的問(wèn)題。若搜索在這種歸一化低頻頻譜和輸入擴(kuò)展頻帶頻譜之間相關(guān)性大的頻帶,將相關(guān)性大的頻帶的歸一化低頻頻譜復(fù)制到擴(kuò)展頻帶,則在高頻段側(cè)生成原本在擴(kuò)展頻帶(高頻部分)中不會(huì)出現(xiàn)的高峰性強(qiáng)的信號(hào),音質(zhì)極大地劣化。
[0110]因此,本實(shí)施方式中,子帶振幅歸一化單元103作為消除能量偏頗的方法,對(duì)每個(gè)子帶求低頻頻譜的絕對(duì)值的最大振幅值(以下稱為子帶最大值),用各子帶中求得的子帶最大值,分別對(duì)各子帶中包含的頻譜進(jìn)行歸一化。由此,歸一化后的各子帶中的頻譜的絕對(duì)值的最大值在子帶之間得到統(tǒng)一。據(jù)此,在歸一化低頻頻譜中,不再存在振幅極大的頻譜。
[0111]圖5表示實(shí)現(xiàn)上述處理的子帶振幅歸一化單元103的結(jié)構(gòu)。圖5所示的子帶振幅歸一化單元103由子帶劃分單元131、最大值搜索單元132以及振幅歸一化單元133構(gòu)成。
[0112]子帶劃分單元131將從核心編碼單元102輸入的包含核心編碼低頻頻譜的頻帶(即低頻部分)劃分為多個(gè)子帶,將得到的每個(gè)子帶的頻譜作為子帶劃分核心編碼低頻頻譜,輸出到最大值搜索單元132和振幅歸一化單元133。以下,為了簡(jiǎn)化,說(shuō)明子帶劃分單元131等間隔劃分核心編碼低頻頻譜的整個(gè)頻帶的情況。另外,以下用表示各子帶的帶寬(樣本數(shù))。例如,I個(gè)子帶可以由8個(gè)樣本(w = 8)構(gòu)成。[0113]最大值搜索單元132在多個(gè)子帶的每個(gè)子帶中,搜索從子帶劃分單元131輸入的子帶劃分核心編碼低頻頻譜的振幅(絕對(duì)值)的最大值(即,各子帶的子帶最大值)。最大值搜索單元132將各子帶的子帶最大值輸出到振幅歸一化單元133。以下,用M[j]表示第j核心編碼低頻頻譜,用S表示子帶數(shù),用s表示子帶索引。此時(shí),子帶s中的子帶最大值Mmax[s]如下式(I)所表示。
[0114]Mmax [s] = max (abs (M[ j])), w* (s_l) < j < w*s, I ^ s ^ S (I)
[0115]振幅歸一化單元133將從子帶劃分單元131輸入的子帶劃分核心編碼低頻頻譜,用從最大值搜索單元132輸入的各子帶的子帶最大值進(jìn)行歸一化,從而得到歸一化低頻頻譜。即,振幅歸一化單元133將各子帶中包含的子帶劃分核心編碼低頻頻譜,分別用各子帶的子帶最大值進(jìn)行歸一化。例如,用下式(2)表示歸一化低頻頻譜Mn。
[0116]
【權(quán)利要求】
1.編碼裝置,包括: 第一編碼單元,對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼,生成第一編碼數(shù)據(jù); 歸一化單元,對(duì)所述第一編碼數(shù)據(jù)進(jìn)行解碼得到的第一頻譜進(jìn)行歸一化,生成歸一化頻譜; 頻帶搜索單元,搜索所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜即第二頻譜和所述歸一化頻譜之間的相關(guān)值為最大的特定的頻帶; 增益計(jì)算單元,計(jì)算將所述特定的頻帶的所述歸一化頻譜復(fù)制到所述高頻部分得到的頻譜即第三頻譜和所述第二頻譜之間的增益;以及 第二編碼單元,對(duì)包含所述特定的頻帶和所述增益的信息進(jìn)行編碼,生成第二編碼數(shù)據(jù), 所述歸一化單元包括: 最大值搜索單元,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及 振幅歸一化單元,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,得到所述歸一化頻譜。
2.如權(quán)利要求1所·述的編碼裝置,還包括: 增強(qiáng)單元,增強(qiáng)所述歸一化頻譜的諧波結(jié)構(gòu), 所述頻帶搜索單元使用增強(qiáng)了諧波結(jié)構(gòu)的所述歸一化頻譜和所述第二頻譜,搜索所述特定的頻帶, 所述增益計(jì)算單元計(jì)算將所述特定的頻帶的、增強(qiáng)了諧波結(jié)構(gòu)的所述歸一化頻譜復(fù)寫到所述高頻部分得到的所述第三頻譜和所述第二頻譜之間的增益。
3.如權(quán)利要求2所述的編碼裝置, 所述增強(qiáng)單元對(duì)于所述低頻部分內(nèi)的所述歸一化頻譜中的各子帶的所述振幅最大值,留下具有規(guī)定的比率以上的振幅的頻譜,抑制或去除所述具有規(guī)定的比率以上的振幅的頻譜以外的頻譜。
4.如權(quán)利要求2所述的編碼裝置,還包括: 閾值控制單元,在所述多個(gè)子帶中搜索振幅的最大值,在各子帶的所述振幅的最大值相對(duì)于搜索到的最大值的比率為規(guī)定值以上的子帶中,將所述增強(qiáng)單元中用于判定是留下還是去除所述歸一化頻譜的閾值設(shè)定得小,對(duì)于所述多個(gè)子帶中所述比率小于所述規(guī)定值的子帶,將所述閾值設(shè)定得大, 所述增強(qiáng)單元留下各子帶中包含的所述歸一化頻譜中具有對(duì)各子帶設(shè)定的所述閾值以上的振幅的頻譜,抑制或去除具有小于對(duì)各子帶設(shè)定的所述閾值的振幅的頻譜。
5.如權(quán)利要求1所述的編碼裝置,還包括: 第二歸一化單元,對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜;以及 判定單元,分析所述第一頻譜而得到判定信息, 所述第二歸一化單元求劃分所述低頻部分得到的多個(gè)子帶的各自的能量,對(duì)所述子帶能量進(jìn)行平滑化而求平滑化子帶能量,用所述平滑化子帶能量對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜,所述判定單元分析所述第一頻譜的頻譜而求所述第一頻譜的特征量,根據(jù)所述特征量選擇所述歸一化單元或所述第二歸一化單元,使用選擇出的歸一化單元對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜。
6.如權(quán)利要求5所述的編碼裝置, 所述第二歸一化單元還包括: 附加單元,對(duì)所述第一頻譜附加基于隨機(jī)數(shù)生成的噪聲。
7.如權(quán)利要求5所述的編碼裝置, 所述第二歸一化單元還包括: 削波單元,對(duì)所述歸一化頻譜進(jìn)行削波處理。
8.如權(quán)利要求1所述的編碼裝置, 所述頻帶搜索單元從以所述歸一化頻譜的振幅值為非零的位置為起點(diǎn)的頻帶的多個(gè)候選中,搜索相關(guān)值為最大的特定的頻帶。
9.編碼裝置,包括: 變換單元,將作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)變換到頻域而生成輸入信號(hào)頻譜; 第一比特分配單元,確定分配給以規(guī)定的帶寬劃分所述輸入信號(hào)頻譜的整個(gè)頻帶得到的各子帶的比特?cái)?shù); 第一編碼單元,使用分配的`比特對(duì)所述輸入信號(hào)頻譜進(jìn)行編碼,生成第一編碼數(shù)據(jù);第二比特分配單元,確定分配給以規(guī)定的帶寬劃分所述輸入信號(hào)頻譜的低于規(guī)定頻率的低頻部分的頻譜得到的各子帶的比特?cái)?shù); 第二編碼單元,使用分配的比特對(duì)所述輸入信號(hào)的低于規(guī)定頻率的低頻部分的頻譜進(jìn)行編碼,生成第二編碼數(shù)據(jù); 第三編碼單元,對(duì)所述輸入信號(hào)頻譜的高于規(guī)定頻率的高頻部分的頻譜進(jìn)行編碼,生成第三編碼數(shù)據(jù); 判定單元,分析所述輸入信號(hào)頻譜的高于規(guī)定頻率的高頻部分的頻譜的編碼所消費(fèi)的比特?cái)?shù)而得到判定信息;以及 切換單元,根據(jù)所述判定信息,對(duì)每幀切換所述輸入信號(hào)頻譜的編碼是僅由所述第一編碼單元進(jìn)行,還是組合所述第二編碼單元和所述第三編碼單元進(jìn)行。
10.如權(quán)利要求9所述的編碼裝置, 所述判定單元包括: 計(jì)算單元,計(jì)算用第一編碼單元進(jìn)行所述輸入信號(hào)的高頻頻譜的編碼的情況下消費(fèi)的比特?cái)?shù);以及 比較單元,將所述比特?cái)?shù)與用第三編碼單元消費(fèi)的比特?cái)?shù)進(jìn)行比較。
11.如權(quán)利要求9所述的編碼裝置, 根據(jù)子帶能量的大小,所述比特的分配對(duì)子帶能量大的子帶分配較多比特,對(duì)子帶能量小的子帶分配較少比特。
12.解碼裝置,包括: 第一解碼單元,將在編碼裝置中對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼生成的第一編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第一頻譜;歸一化單元,對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜;以及第二解碼單元,將所述歸一化頻譜以及由所述編碼裝置生成的第二編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第二頻譜, 所述第二編碼數(shù)據(jù)包含: 表示在編碼側(cè)第一頻譜和編碼側(cè)第二頻譜之間相關(guān)值為最大的特定的頻帶的信息,所述編碼側(cè)第一頻譜是所述編碼裝置中的所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜,所述編碼側(cè)第二頻譜是在所述編碼裝置中對(duì)通過(guò)解碼所述第一編碼數(shù)據(jù)而生成的頻譜進(jìn)行歸一化得到的頻譜,以及 表示在編碼側(cè)第三頻譜和所述編碼側(cè)第一頻譜之間計(jì)算出的增益的信息,所述編碼側(cè)第三頻譜是將所述特定的頻帶的所述編碼側(cè)第二頻譜復(fù)制到所述高頻部分得到的頻譜,所述歸一化單元包括: 最大值搜索單元,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及 振幅歸一化單元,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,生成所述歸一化頻譜。
13.如權(quán)利要求12所述的解碼裝置,還包括: 增強(qiáng)單元,增強(qiáng)所述歸一化頻譜的諧波結(jié)構(gòu), 所述第二解碼單元將 增強(qiáng)了諧波結(jié)構(gòu)的所述歸一化頻譜以及所述第二編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第二頻譜。
14.如權(quán)利要求13所述的解碼裝置, 所述增強(qiáng)單元留下所述低頻部分內(nèi)的所述歸一化頻譜中相對(duì)于各子帶的所述振幅最大值具有規(guī)定的比率以上的振幅的頻譜,抑制或去除所述具有規(guī)定的比率以上的振幅的頻譜以外的頻譜。
15.如權(quán)利要求13所述的解碼裝置,還包括: 閾值控制單元,在所述多個(gè)子帶中搜索振幅的最大值,在各子帶的所述振幅的最大值相對(duì)于搜索到的最大值的比率為規(guī)定值以上的子帶中,將所述增強(qiáng)單元中用于判定是留下還是去除所述歸一化頻譜的閾值設(shè)定得小,在所述多個(gè)子帶中所述比率小于所述規(guī)定值的子帶中,將所述閾值設(shè)定得大, 所述增強(qiáng)單元留下各子帶中包含的所述歸一化頻譜中具有對(duì)各子帶設(shè)定的所述閾值以上的振幅的頻譜,抑制或去除具有小于對(duì)各子帶設(shè)定的所述閾值的振幅的頻譜。
16.如權(quán)利要求12所述的解碼裝置,還包括: 第二歸一化單元,對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜;以及 判定單元,分析所述第一頻譜而得到判定信息, 所述第二歸一化單元求劃分所述低頻部分得到的多個(gè)子帶的各自的能量,對(duì)所述子帶能量進(jìn)行平滑化而求平滑化子帶能量,用所述平滑化子帶能量對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜, 所述判定單元分析所述第一頻譜的頻譜而求所述第一頻譜的特征量,根據(jù)所述特征量選擇所述歸一化單元或所述第二歸一化單元,使用選擇出的歸一化單元對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜。
17.如權(quán)利要求12所述的解碼裝置, 所述第二解碼單元從以所述歸一化頻譜的振幅值為非零的位置為起點(diǎn)的頻帶的多個(gè)候選中,搜索相關(guān)值為最大的特定的頻帶。
18.解碼裝置,包括: 第一解碼單元,將在編碼裝置中對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)進(jìn)行編碼生成的第一編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第一頻譜; 第二解碼單元,將在編碼裝置中對(duì)所述輸入信號(hào)的低于規(guī)定頻率的低頻部分進(jìn)行編碼生成的第二編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第二頻譜; 第三解碼單元,將在編碼裝置中對(duì)所述輸入信號(hào)的規(guī)定頻率以上的高頻部分進(jìn)行編碼生成的第三編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第三頻譜;以及 切換單元,使用從編碼裝置發(fā)送的模式判定信息,切換編碼數(shù)據(jù)的解碼是僅由所述第一解碼單元進(jìn)行,還是組合所述第二解碼單元和所述第三解碼單元進(jìn)行。
19.編碼方法,包括如下步驟: 第一編碼步驟,對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼,生成第一編碼數(shù)據(jù); 歸一化步驟,對(duì)所述第一編碼數(shù)據(jù)進(jìn)行解碼得到的第一頻譜進(jìn)行歸一化,生成歸一化頻譜; 頻帶搜索步驟,搜索所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜即第二頻譜和所述歸一化頻譜之間的相關(guān)值為最大的特定的頻帶; 增益計(jì)算步驟,計(jì)算將所述特定的頻帶的所述歸一化頻譜復(fù)制到所述高頻部分得到的頻譜即第三頻譜和所述第二頻譜之間的增益;以及 第二編碼步驟,對(duì)包含所述特定的頻帶和所述增益的信息進(jìn)行編碼,生成第二編碼數(shù)據(jù), 所述歸一化步驟包括: 最大值搜索步驟,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及 振幅歸一化步驟,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,得到所述歸一化頻譜。
20.編碼方法,包括如下步驟: 變換步驟,將作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)變換到頻域而生成輸入信號(hào)頻譜; 第一比特分配步驟,確定對(duì)以規(guī)定的帶寬劃分所述輸入信號(hào)頻譜的整個(gè)頻帶得到的各子帶分配的比特?cái)?shù); 第一編碼步驟,使用分配的比特對(duì)所述輸入信號(hào)頻譜進(jìn)行編碼,生成第一編碼數(shù)據(jù);第二比特分配步驟,確定對(duì)以規(guī)定的帶寬劃分所述輸入信號(hào)頻譜的低于規(guī)定頻率的低頻部分的頻譜得到的各子帶分配的比特?cái)?shù); 第二編碼步驟,使用分配的比特對(duì)所述輸入信號(hào)的低于規(guī)定頻率的低頻部分的頻譜進(jìn)行編碼,生成第二編碼數(shù)據(jù); 第三編碼步驟,對(duì)所述輸入信號(hào)頻譜的高于規(guī)定頻率的高頻部分的頻譜進(jìn)行編碼,生成第三編碼數(shù)據(jù); 判定步驟,分析所述輸入信號(hào)頻譜的高于規(guī)定頻率的高頻部分的頻譜的編碼所消費(fèi)的比特?cái)?shù)而得到判定信息;以及 切換步驟,根據(jù)所述判定信息,對(duì)每幀切換所述輸入信號(hào)頻譜的編碼是僅由所述第一編碼步驟進(jìn)行,還是組合所述第二編碼步驟和所述第三編碼步驟進(jìn)行。
21.解碼方法,包括如下步驟: 第一解碼步驟,將在編碼裝置中對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)的規(guī)定頻率以下的低頻部分進(jìn)行編碼生成的第一編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第一頻譜;歸一化步驟,對(duì)所述第一頻譜進(jìn)行歸一化,生成歸一化頻譜;以及第二解碼步驟,將所述歸一化頻譜以及由所述編碼裝置生成的第二編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第二頻譜, 所述第二編碼數(shù)據(jù)包含: 表示在編碼側(cè)第一頻譜和編碼側(cè)第二頻譜之間相關(guān)值為最大的特定的頻帶的信息,所述編碼側(cè)第一頻譜是所述編碼裝置中的所述輸入信號(hào)的高于所述規(guī)定頻率的高頻部分的頻譜,所述編碼側(cè)第二頻譜是在所述編碼裝置中對(duì)通過(guò)解碼所述第一編碼數(shù)據(jù)而生成的頻譜進(jìn)行歸一化得到的頻譜,以及 表示在編碼側(cè)第三頻譜和所述編碼側(cè)第一頻譜之間計(jì)算出的增益的信息,所述編碼側(cè)第三頻譜是將所述特定的頻 帶的所述編碼側(cè)第二頻譜復(fù)制到所述高頻部分得到的頻譜,所述歸一化步驟包括: 最大值搜索步驟,在劃分所述低頻部分得到的多個(gè)子帶中,分別搜索所述第一頻譜的振幅的最大值;以及 振幅歸一化步驟,對(duì)各子帶中包含的所述第一頻譜,使用各子帶的所述振幅的最大值分別進(jìn)行歸一化,得到所述歸一化頻譜。
22.解碼方法,包括如下步驟: 第一解碼步驟,將在編碼裝置中對(duì)作為語(yǔ)音信號(hào)或/及音樂(lè)信號(hào)的輸入信號(hào)進(jìn)行編碼生成的第一編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第一頻譜; 第二解碼步驟,將在編碼裝置中對(duì)所述輸入信號(hào)的低于規(guī)定頻率的低頻部分進(jìn)行編碼生成的第二編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第二頻譜; 第三解碼步驟,將在編碼裝置中對(duì)所述輸入信號(hào)的規(guī)定頻率以上的高頻部分進(jìn)行編碼生成的第三編碼數(shù)據(jù)作為輸入并進(jìn)行解碼,生成第三頻譜;以及 切換步驟,使用從編碼裝置發(fā)送的模式判定信息,切換編碼數(shù)據(jù)的解碼是僅由所述第一解碼步驟進(jìn)行,還是組合所述第二解碼步驟和所述第三解碼步驟進(jìn)行。
【文檔編號(hào)】G10L21/04GK103718240SQ201280036790
【公開(kāi)日】2014年4月9日 申請(qǐng)日期:2012年8月24日 優(yōu)先權(quán)日:2011年9月9日
【發(fā)明者】河島拓也, 大毛勝統(tǒng), 押切正浩 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社