高頻重建期間的音頻信號(hào)處理的制作方法
【專利說(shuō)明】
[0001] 本發(fā)明申請(qǐng)是申請(qǐng)日期為2011年7月14日、申請(qǐng)?zhí)枮?201180016982. 8"、發(fā)明名 稱為"高頻重建期間的音頻信號(hào)處理"的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
[0002] 本申請(qǐng)涉及音頻信號(hào)的HFR(高頻重建/再生)。具體地,本申請(qǐng)涉及一種用于執(zhí) 行音頻信號(hào)的HFR的方法和系統(tǒng),該音頻信號(hào)跨越用于重建音頻信號(hào)的高頻的低頻范圍具 有能量水平的大的變化。
【背景技術(shù)】
[0003] 諸如譜帶復(fù)制(SBR)技術(shù)的HFR技術(shù)允許顯著提高傳統(tǒng)的感知音頻編解碼器的編 碼效率。HFR與MPEG-4高級(jí)音頻編碼(AAC)相結(jié)合形成了極為高效的音頻編解碼器,其已 用在XM衛(wèi)星廣播系統(tǒng)和世界數(shù)字廣播聯(lián)盟中,并且還在3GPP、DVD論壇等中被標(biāo)準(zhǔn)化。AAC 和SBR的組合被稱為aacPlus。aacPlus是MPEG-4標(biāo)準(zhǔn)的一部分,在MPEG-4標(biāo)準(zhǔn)中aacPlus 被稱為高效AAC簡(jiǎn)檔(HE-AAC)。通常,HFR技術(shù)可以通過(guò)向后和向前兼容的方式與任何感 知音頻編解碼器組合,因此提供了升級(jí)已建立的如EurekaDAB系統(tǒng)中使用的MPEGLayer-2 的廣播系統(tǒng)的可能。HFR方法還可以與語(yǔ)音編解碼器組合以允許超低位率的寬帶語(yǔ)音。
[0004] HFR的基本思想在于如下觀測(cè)結(jié)果:信號(hào)的高頻范圍的特性和同一信號(hào)的低 頻范圍的特性之間通常存在強(qiáng)相關(guān)性。因此,通過(guò)從低頻范圍到高頻范圍的信號(hào)變調(diào) (transposition)可以實(shí)現(xiàn)對(duì)信號(hào)的原始輸入高頻范圍的表示的良好近似。
[0005] 在通過(guò)引用合并于此的W098/57436中建立了這一變調(diào)概念,作為一種用于從音 頻信號(hào)的低頻帶重建高頻帶的方法。通過(guò)在音頻編碼和/或語(yǔ)音編碼中使用這一概念,可 以獲得位率的顯著節(jié)約。在下文中,將參考音頻編碼,但是應(yīng)注意,所描述的方法和系統(tǒng)同 樣適用于語(yǔ)音編碼以及統(tǒng)一語(yǔ)音和音頻編碼(USAC)。
[0006] 使用濾波器組或可選的變換,可以在時(shí)域或頻域中執(zhí)行高頻重建。該處理通常牽 涉若干步驟,其中兩個(gè)主要操作是首先創(chuàng)建高頻激勵(lì)信號(hào),以及隨后對(duì)高頻激勵(lì)信號(hào)構(gòu)形 以近似原始高頻譜的譜包絡(luò)。創(chuàng)建高頻激勵(lì)信號(hào)的步驟可以例如基于單邊帶調(diào)制(SSB),其 中具有頻率《的正弦波被映射到具有頻率《+A?的正弦波,其中A?是固定頻移。換 言之,通過(guò)低頻子帶到高頻子帶的"上復(fù)制(copy-up) "操作,可以從低頻信號(hào)生成高頻信 號(hào)。創(chuàng)建高頻激勵(lì)信號(hào)的另一方法可以牽涉低頻子帶的諧波變調(diào)。T階的諧波變調(diào)典型地 被設(shè)計(jì)為將低頻信號(hào)的頻率為《的正弦波映射到高頻信號(hào)的具有頻率Tu(其中T>1)的 正弦波。
[0007] HFR技術(shù)可以用作源編碼系統(tǒng)的一部分,其中用于引導(dǎo)HFR處理的分類控制信息 連同窄帶/低頻信號(hào)的表示一起從編碼器傳送到解碼器。對(duì)于其中不可以傳送額外的控制 信號(hào)的系統(tǒng),可以利用根據(jù)解碼器側(cè)的可用信息估計(jì)的適當(dāng)?shù)目刂茢?shù)據(jù),在解碼器側(cè)應(yīng)用 該處理。
[0008] 高頻激勵(lì)信號(hào)的前述包絡(luò)調(diào)整的目的在于實(shí)現(xiàn)模擬原始高帶譜形的譜形。為此, 必須修改高頻信號(hào)的譜形。換言之,將應(yīng)用于高帶的調(diào)整是現(xiàn)有譜包絡(luò)和期望的目標(biāo)譜包 絡(luò)的函數(shù)。
[0009] 對(duì)于在頻域中操作的系統(tǒng),例如在偽QMF濾波器組中實(shí)現(xiàn)的HFR系統(tǒng),由于借助于 組合來(lái)自源頻率范圍的若干貢獻(xiàn)來(lái)創(chuàng)建高帶信號(hào)會(huì)將人工譜包絡(luò)引入到將進(jìn)行包絡(luò)調(diào)整 的高帶中,因此現(xiàn)有技術(shù)方法在這一點(diǎn)上不是最優(yōu)的。換言之,在HFR處理期間從低頻信號(hào) 生成的高帶或高頻信號(hào)典型地呈現(xiàn)人工譜包絡(luò)(典型地包括譜中斷)。這給譜包絡(luò)調(diào)整器 造成了困難,因?yàn)檎{(diào)整器不僅必須有能力以適當(dāng)?shù)臅r(shí)間和頻率分辨率應(yīng)用期望的譜包絡(luò), 而且調(diào)整器還必須能夠清除由HFR信號(hào)生成器人工引入的譜特性。這給包絡(luò)調(diào)整器的設(shè)計(jì) 約束造成了困難。結(jié)果,這些困難往往導(dǎo)致感知的高頻能量損失,以及高帶信號(hào)中的譜形的 可聽中斷,特別是對(duì)于語(yǔ)音類型的信號(hào)。換言之,傳統(tǒng)的HFR信號(hào)生成器往往將中斷和水平 變化引入達(dá)到在低帶范圍中具有大的水平變化的信號(hào)(例如撕撕聲)的高帶信號(hào)中。當(dāng)隨 后包絡(luò)調(diào)整器暴露于該高帶信號(hào)時(shí),包絡(luò)調(diào)整器不能合理地和一致地從低帶信號(hào)的任何自 然譜特征中分離新引入的中斷。
[0010] 本文描述了針對(duì)前述問(wèn)題的解決方案,其導(dǎo)致了提高的感知音頻質(zhì)量。具體地,本 文描述了對(duì)從低帶信號(hào)生成高帶信號(hào)的問(wèn)題的解決方案,其中有效地調(diào)整高帶信號(hào)的譜包 絡(luò)以在不引入不合需要的人工產(chǎn)物的情況下模擬高帶中的原始譜包絡(luò)。
【發(fā)明內(nèi)容】
[0011] 本文提出了作為高頻重建信號(hào)生成的一部分的附加的校正步驟。作為該附加的校 正步驟的結(jié)果,提高了高頻分量或高帶信號(hào)的音頻質(zhì)量。該附加的校正步驟可以應(yīng)用于使 用高頻重建技術(shù)的所有源編碼系統(tǒng),以及目的在于重建音頻信號(hào)的高頻的任何單端后處理 方法或系統(tǒng)。
[0012] 根據(jù)一個(gè)方面,提供了一種編碼器(901),其被配置成從音頻信號(hào)(903)生成控制 數(shù)據(jù)(905),編碼器(901)包括:用于分析音頻信號(hào)(903)的譜形并且確定當(dāng)根據(jù)音頻信號(hào) (903)的多個(gè)低頻子帶信號(hào)(602)再生音頻信號(hào)(903)的高頻分量時(shí)引入的譜包絡(luò)中斷的 程度的裝置;以及用于生成用于基于中斷的程度控制高頻分量的再生的控制數(shù)據(jù)(905)的 裝置。
[0013] 根據(jù)一個(gè)方面,還提供了一種音頻解碼器(700),被配置成對(duì)位流(704)解碼,位 流(704)表示低頻音頻信號(hào)(707)以及描述相應(yīng)的高頻音頻信號(hào)的譜包絡(luò)的目標(biāo)能量集 合(708),其中,位流(704)還表示控制數(shù)據(jù)(905),音頻解碼器(700)被配置成:根據(jù)與低 頻音頻信號(hào)(707)和目標(biāo)能量集合相關(guān)聯(lián)的多個(gè)低頻子帶信號(hào)(602)確定多個(gè)高頻子帶信 號(hào),其中,控制數(shù)據(jù)(905)表示是否還使用多個(gè)譜增益系數(shù)用于確定多個(gè)高頻子帶信號(hào),其 中,多個(gè)譜增益系數(shù)與多個(gè)低頻子帶信號(hào)(602)中的各個(gè)低頻子帶信號(hào)的能量相關(guān)聯(lián);以 及根據(jù)多個(gè)低頻子帶信號(hào)和多個(gè)高頻子帶信號(hào)生成寬帶音頻信號(hào)。
[0014] 根據(jù)一個(gè)方面,還提供了一種用于從音頻信號(hào)(903)生成控制數(shù)據(jù)(905)的方法, 該方法包括:分析音頻信號(hào)(903)的譜形以確定當(dāng)根據(jù)音頻信號(hào)(903)的多個(gè)低頻子帶信 號(hào)再生音頻信號(hào)(903)的高頻分量時(shí)引入的譜包絡(luò)中斷的程度;以及生成用于基于中斷的 程度控制高頻分量的再生的控制數(shù)據(jù)(905)。
[0015] 根據(jù)一個(gè)方面,還提供了一種用于對(duì)位流(704)進(jìn)行解碼的方法,位流(704)表示 低頻音頻信號(hào)(707)以及描述相應(yīng)的高頻音頻信號(hào)的譜包絡(luò)的目標(biāo)能量集合(708),其中, 位流(704)還表示控制數(shù)據(jù)(905),該方法包括:根據(jù)與低頻音頻信號(hào)(707)和目標(biāo)能量集 合相關(guān)聯(lián)的多個(gè)低頻子帶信號(hào)(602)確定多個(gè)高頻子帶信號(hào),其中,控制數(shù)據(jù)(905)表示是 否還根據(jù)多個(gè)譜增益系數(shù)確定多個(gè)高頻子帶信號(hào),其中,多個(gè)譜增益系數(shù)與多個(gè)低頻子帶 信號(hào)(602)中的各個(gè)低頻子帶信號(hào)的能量相關(guān)聯(lián);以及根據(jù)多個(gè)低頻子帶信號(hào)和多個(gè)高頻 子帶信號(hào)生成寬帶音頻信號(hào)。
[0016]根據(jù)一個(gè)方面,描述了一種被配置成生成覆蓋高頻區(qū)間的多個(gè)高頻子帶信號(hào)的系 統(tǒng)。該系統(tǒng)可以被配置成從多個(gè)低頻子帶信號(hào)生成多個(gè)高頻子帶信號(hào)。多個(gè)低頻子帶信號(hào) 可以是低帶或窄帶音頻信號(hào)的子帶信號(hào),可以使用分析濾波器組或變換來(lái)確定它們。特別 地,可以使用分析QMF(正交鏡像濾波器)濾波器組或FFT(快速傅立葉變換)從低帶時(shí)域 信號(hào)確定多個(gè)低頻子帶信號(hào)。多個(gè)生成的高頻子帶信號(hào)可以對(duì)應(yīng)于從其得到多個(gè)低頻子帶 信號(hào)的原始音頻信號(hào)的高頻子帶信號(hào)的近似。特別地,多個(gè)低頻子帶信號(hào)和多個(gè)(重新) 生成的高頻子帶信號(hào)可以對(duì)應(yīng)于QMF濾波器組和/或FFT變換的子帶。
[0017]該系統(tǒng)可以包括用于接收多個(gè)低頻子帶信號(hào)的裝置。這樣,該系統(tǒng)可以設(shè)置在從 低帶信號(hào)生成多個(gè)低頻子帶信號(hào)的分析濾波器組或變換的下游。低帶信號(hào)可以是已在核心 解碼器中從接收到的位流解碼的音頻信號(hào)。位流可以存儲(chǔ)在例如致密盤或 DVD的存儲(chǔ)介質(zhì) 上,或者位流可以通過(guò)例如光學(xué)或無(wú)線傳送介質(zhì)的傳送介質(zhì)在解碼器處被接收。
[0018] 該系統(tǒng)可以包括用于接收目標(biāo)能量集合的裝置,目標(biāo)能量也可以稱為尺度因子 (scalefactor)能量。每個(gè)目標(biāo)能量可以覆蓋高頻區(qū)間中的不同的目標(biāo)區(qū)間,該目標(biāo)區(qū)間 也可以稱為尺度因子帶。典型地,與目標(biāo)能量集合對(duì)應(yīng)的目標(biāo)區(qū)間集合覆蓋整個(gè)高頻區(qū)間。 目標(biāo)能量集合的目標(biāo)能量