專(zhuān)利名稱(chēng):對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法
技術(shù)領(lǐng)域:
本發(fā)明屬于編碼領(lǐng)域,其中,例如在視頻以及音頻編碼中,針對(duì) 編碼速率來(lái)使用將被編碼的數(shù)據(jù)的不同特性。
背景技術(shù):
當(dāng)前技術(shù)的編碼策略可以利用將被編碼的數(shù)據(jù)流的特性。例如, 在音頻編碼中,使用感知模型對(duì)原始數(shù)據(jù)進(jìn)行壓縮,而在重新播放時(shí) 幾乎不會(huì)有顯著的質(zhì)量降低和降級(jí)。現(xiàn)代的感知音頻編碼方案,例如
MPEG 2/4 AAC (MPEG=Moving Pictures Expert Group,運(yùn)動(dòng)圖像專(zhuān)家 組;AAC=Advanced Audio Coding,高級(jí)音頻編碼),參見(jiàn)Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, International Standard 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997,可以使用濾波器組,例如修正離散余弦變 換(Modified Discrete Cosine Transform, MDCT),以便在頻域中表示 音頻信號(hào)。
在頻域中,可以依據(jù)感知模型來(lái)進(jìn)行頻率系數(shù)的量化。對(duì)于一般 類(lèi)型的音頻信號(hào)(例如音樂(lè)),這樣的編碼器可以提供優(yōu)越的感知音頻 質(zhì)量。另一方面,現(xiàn)代的語(yǔ)音編碼器,例如ACELP (ACELP=Algebraic Code Excited Linear Prediction,代數(shù)碼激發(fā)線(xiàn)性預(yù)測(cè)),使用一種預(yù)測(cè) 的方式,并且利用此種方式可以在時(shí)域中表示音頻/語(yǔ)音信號(hào)。這樣的 語(yǔ)音編碼器可以對(duì)人類(lèi)語(yǔ)音產(chǎn)生過(guò)程(即,人類(lèi)聲道)的特征進(jìn)行建 模,從而以較低的比特率即可達(dá)到優(yōu)越的語(yǔ)音信號(hào)性能。反之,對(duì)于 以低比特率編碼的語(yǔ)音,感知音頻編碼器無(wú)法達(dá)到語(yǔ)音編碼器所提供 的性能水平,并且使用語(yǔ)音編碼器來(lái)表示一般的音頻信號(hào)/音樂(lè)會(huì)造成 顯著的質(zhì)量減損。
7傳統(tǒng)的構(gòu)思提供一種分層組合,在所述分層組合中所有的局部編 碼器始終是活動(dòng)的(即,時(shí)域和頻域編碼器),通過(guò)將這些局部編碼器 對(duì)于一個(gè)給定的處理過(guò)的時(shí)間幀所作的貢獻(xiàn)相組合,計(jì)算出最終的輸
出信號(hào)。分層編碼的一般示例是MPEG-4可縮放語(yǔ)音/音頻編碼,具有 作為基本層的語(yǔ)音編碼器以及基于濾波器組的增強(qiáng)層,參見(jiàn)Bemhard Grill, Karlheinz Brandenburg, "A Two-or Three Stage Bit-Rate Scalable Audio Coding System,", Preprint Number 4132, 99th Convention of the AES (1995年9月)。
傳統(tǒng)的頻域編碼器可以利用MDCT濾波器組。因?yàn)镸DCT優(yōu)秀的
性質(zhì),其已經(jīng)成為用于傳統(tǒng)感知音頻編碼器的最具優(yōu)勢(shì)的濾波器組。 舉例而言,MDCT可以在處理塊之間提供平滑的交叉衰落(crossfade)。
例如,即使由于譜系數(shù)的量化使得在每一個(gè)處理塊中的信號(hào)皆以不同 的方式改變,然而因?yàn)榧哟暗闹丿B/加法(windowed overlap/add )操作, 所以不會(huì)產(chǎn)生因?yàn)閺囊粋€(gè)塊到另一個(gè)塊的突然轉(zhuǎn)變而造成的分塊偽跡 (blocking artifact)。 MDCT使用時(shí)域混迭消除(time-domain aliasing cancellation, TDAC)的構(gòu)思。
MDCT是一種以IV型離散余弦變換為基礎(chǔ)的傅立葉相關(guān)變換,具 有重迭的附加性質(zhì)。MDCT被設(shè)計(jì)為用于在較大數(shù)據(jù)集合的連續(xù)塊中 執(zhí)行,其中隨后的塊互相重疊,使得一個(gè)塊的后半部與下一個(gè)塊的前 半部重合。除了DCT的能量壓縮(energy-compaction)質(zhì)量之外,這 種重疊使得MDCT對(duì)于信號(hào)壓縮應(yīng)用是特別有吸引力的,因?yàn)檫@種重 疊有助于避免源于塊邊界的所述偽跡。作為重迭變換(lapped transform), MDCT與其它傅立葉相關(guān)的變換相比的些許不同之處在 于,MDCT的輸出的數(shù)目?jī)H有輸入的數(shù)目的一半,而非與輸入的數(shù)目 相同。具體地,將2N個(gè)實(shí)數(shù)轉(zhuǎn)換成N個(gè)實(shí)數(shù),其中N是正整數(shù)。
逆MDCT也稱(chēng)為IMDCT。因?yàn)檩斎肱c輸出的數(shù)目不相同,在乍看 之下MDCT似乎是不可逆的。然而,通過(guò)將隨后重疊塊的重疊IMDCT 相加,實(shí)現(xiàn)了完美的可逆性,這使得消除誤差并恢復(fù)原始數(shù)據(jù)(即, 實(shí)現(xiàn)TDAC)。
于是,濾波器組輸出處譜值的數(shù)目等于該濾波器組輸入處時(shí)域輸入值的數(shù)目,這也稱(chēng)作臨界采樣(critical sampling)。
MDCT濾波器組提供了高頻率選擇性,并且能夠得到高編碼增益。 通過(guò)使用時(shí)域混迭消除技術(shù),可以實(shí)現(xiàn)塊和臨界采樣的重疊性質(zhì),參 見(jiàn)J. Princen, A. Bradley, "Analysis/Synthesis Filter Band Design Based on Time Domain Aliasing Cancellation,", IEEE Trans. ASSP, ASSP-34(5): 1153-1161, 1986。圖4說(shuō)明了MDCT的這些效應(yīng)。圖4示出了MDCT輸 入信號(hào),以沿著上面的時(shí)間軸400的脈沖來(lái)表示。然后利用兩個(gè)連續(xù)的 加窗和MDCT塊對(duì)輸入信號(hào)400進(jìn)行轉(zhuǎn)換,其中在圖4中輸入信號(hào)400 的下方示出了窗410。在圖4中以時(shí)間線(xiàn)420和425顯示了經(jīng)過(guò)后向變換 之后獨(dú)立的、加窗的信號(hào)。
在逆MDCT之后,第一塊產(chǎn)生具有正號(hào)的混迭分量420,第二塊產(chǎn) 生具有相同大小并且具有負(fù)號(hào)的混迭分量425。如在圖4的底部的最終 輸出430處所顯示的,在兩個(gè)輸出信號(hào)420與425相加之后這兩個(gè)混迭分 量互相抵消。
在"擴(kuò)展適應(yīng)性多速率寬帶(AMR-WB+)編解碼器",3GPP TS 26.290V6.3.0 , 2005-06技術(shù)規(guī)范中,詳細(xì)說(shuō)明了 AMR-WB+ (AMR-WB=Adaptive Multi-Rate Wideband,適應(yīng)性多速率寬帶)編解 碼器。依據(jù)第5.2節(jié),AMR-WB+編解碼器核心的編碼算法基于混合 ACELP/TCX (TCX=Transform Coded Excitation,變換編碼激發(fā))模型。 對(duì)于輸入信號(hào)的每一個(gè)塊,編碼器可以在開(kāi)回路或者閉回路模式下決 定哪一種編碼模式,艮卩,ACELP或者TCX,是最佳的。ACELP是時(shí)域 預(yù)測(cè)編碼器,最適于語(yǔ)音和瞬態(tài)信號(hào)。AMR-WB編碼器用于ACELP 模式中。備選地,TCX模型是基于變換的編碼器,并且更適于典型的 音樂(lè)采樣。
具體地,AMR-WB+針對(duì)變換編碼模式TCX使用離散傅立葉變換 (DFT)。為了允許相鄰塊之間的平滑轉(zhuǎn)變,使用加窗和重疊。這種加 窗和重疊對(duì)于不同的編碼模式(TCX/ACELP)之間的轉(zhuǎn)變以及對(duì)于連 續(xù)的TCX幀之間的轉(zhuǎn)變而言都是必要的。因此,DFT與加窗和重疊一 起表示并未經(jīng)過(guò)臨界采樣的濾波器組。濾波器組產(chǎn)生比新的輸入采樣 的數(shù)目更多的頻率值,參見(jiàn)在3GPP TS 26.290V6.3.0 (3GPP=ThirdGeneration Partnership Project , 第三代伙伴計(jì)戈!j , TS=Technical Specification,技術(shù)規(guī)范)中的圖4。每一個(gè)TCX幀使用1/8幀長(zhǎng)度的重 疊,所述幀長(zhǎng)度系等于新的輸入采樣的數(shù)目。因此,該DFT的對(duì)應(yīng)長(zhǎng) 度是9/8幀長(zhǎng)度。
考慮在TCX中非臨界采樣的DFT濾波器組,S卩,在濾波器組輸出 處譜值的數(shù)目大于在該濾波器組輸入處時(shí)域輸入值的數(shù)目,這種頻域 編碼模式與諸如AAC (AAC=Advanced Audio Coding,高級(jí)音頻編碼) 等使用MDCT (臨界采樣的重迭變換)的音頻編解碼器不同。
在Fielder, Louis D.; Todd, Craig C., "The Design of a Video Friendly Audio Coding System for Distributing Applications,", Paper Number 17-008, The AES 17th International Conference: High-Qqality Audio Coding (1999年8月),以及Fielder, Louis D.; Davidson, Grant A., "Audio Coding Tools for Digital Television Distribution,", Preprint Number 5104, 108th Convention of the AES (2000年1月)中,描述了 杜比E (Dolby E)編解碼器。杜比E編解碼器使用MDCT濾波器組。在 這種編碼的設(shè)計(jì)中,特別關(guān)注在編碼域中直接執(zhí)行編輯的可能性。為 了達(dá)成這個(gè)目標(biāo),使用特殊的無(wú)混迭窗。在這些窗的邊界,不同信號(hào) 部分的平滑交叉衰落或接合是可能的。在前文中所參考的文件中概括 出,例如參見(jiàn)"The Design of a Video Friendly Audio Coding System for Distribution Applications,"第三節(jié),僅簡(jiǎn)單地使用會(huì)引入時(shí)域混迭的一 般MDCT窗是不可能實(shí)現(xiàn)這一點(diǎn)的。然而,其中也指出,為了消除混 迭,所需要的代價(jià)是變換系數(shù)的數(shù)目增加,這個(gè)結(jié)果指出所得到的濾 波器組將不再具有臨界采樣的性質(zhì)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種更高效的編碼和解碼數(shù)據(jù)段的構(gòu)思。 利用根據(jù)權(quán)利要求l所述的用于解碼的設(shè)備、根據(jù)權(quán)利要求22所 述的用于解碼的方法、根據(jù)權(quán)利要求24所述的用于產(chǎn)生已編碼數(shù)據(jù)流 的設(shè)備、以及根據(jù)權(quán)利要求35所述的用于產(chǎn)生已編碼數(shù)據(jù)流的方法, 實(shí)現(xiàn)了這一目的。本發(fā)明基于以下成果通過(guò)使用時(shí)域和頻域編碼器的組合,以及 相應(yīng)地時(shí)域和頻域解碼器的組合,可以實(shí)現(xiàn)更高效的編碼和解碼。通 過(guò)在解碼器中將時(shí)域數(shù)據(jù)轉(zhuǎn)換至頻域,以及通過(guò)將得到的轉(zhuǎn)換后的頻 域數(shù)據(jù)與接收到的已經(jīng)解碼頻域數(shù)據(jù)相組合,可以以有效地對(duì)抗時(shí)間 混迭問(wèn)題。通過(guò)使施加到數(shù)據(jù)段的重疊窗的重疊區(qū)域適于編碼領(lǐng)域的 變化,可以減少開(kāi)銷(xiāo)。當(dāng)使用時(shí)域編碼時(shí),以及相應(yīng)地從時(shí)域編碼切 換或者切換至?xí)r域編碼時(shí),采用具有較小重疊區(qū)域的窗可以是有利的。
本發(fā)明的實(shí)施例可以提供一種通用的音頻編碼和解碼構(gòu)思,對(duì)于 例如語(yǔ)音信號(hào)和音樂(lè)信號(hào)這兩種類(lèi)型的輸入信號(hào)可以實(shí)現(xiàn)更高的性 能。實(shí)施例可以很好地利用將多種編碼方式(如,時(shí)域和頻域編碼構(gòu) 思)相組合的優(yōu)點(diǎn)。實(shí)施例可以有效地將基于濾波器組的和基于時(shí)域 為的編碼構(gòu)思組合成單個(gè)方案。實(shí)施例可以得到一種組合的編解碼器, 可以例如在用于音樂(lè)類(lèi)音頻內(nèi)容的音頻編解碼器與用于語(yǔ)音類(lèi)內(nèi)容的 語(yǔ)音編解碼器之間進(jìn)行切換,實(shí)施例可以頻繁地使用這種切換機(jī)制, 特別是對(duì)于混合的內(nèi)容。
本發(fā)明的實(shí)施例可以提供不出現(xiàn)切換偽跡的優(yōu)點(diǎn)。在實(shí)施例中, 對(duì)于切換過(guò)程,可以使附加傳輸數(shù)據(jù)或者附加編碼采樣的量最小化, 以避免在該操作階段降低效率。由此,局部編碼器的切換式組合的構(gòu) 思與所有局部編碼器始終是活動(dòng)的分層組合是不同的。
圖la示出了用于解碼的設(shè)備的實(shí)施例;
圖lb示出了用于解碼的設(shè)備的另一實(shí)施例;
圖lc示出了用于解碼的設(shè)備的另一實(shí)施例;
圖ld示出了用于解碼的設(shè)備的另一實(shí)施例;
圖le示出了用于解碼的設(shè)備的另一實(shí)施例;
圖lf示出了用于解碼的設(shè)備的另一實(shí)施例; 圖2a示出了用于編碼的設(shè)備的實(shí)施例; 圖2b示出了用于編碼的設(shè)備的另一實(shí)施例; 圖2c示出了用于編碼的設(shè)備的另一實(shí)施例;圖3a說(shuō)明了在一個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域和時(shí)域編碼之間進(jìn)行 切換時(shí)的重疊區(qū)域;
圖3b說(shuō)明了在兩個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域編碼和時(shí)域編碼之間
進(jìn)行切換時(shí)的重疊區(qū)域;
圖3c說(shuō)明了具有不同的重疊區(qū)域的多個(gè)窗; 圖3d說(shuō)明了在實(shí)施例中對(duì)具有不同重疊區(qū)域的窗的使用;以及 圖4示出了使用MDCT時(shí)的時(shí)域混迭消除。
具體實(shí)施例方式
在下文中將參考附圖來(lái)詳細(xì)描述本發(fā)明的實(shí)施例。 圖la示出了用于對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備 100,數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的,在頻域中編碼的數(shù)據(jù)段 具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊。例如,所述數(shù) 據(jù)流可以與音頻流相對(duì)應(yīng),其中這些數(shù)據(jù)塊當(dāng)中的一些數(shù)據(jù)塊在時(shí)域 中編碼,而其他數(shù)據(jù)塊在頻域中編碼。在頻域中編碼的數(shù)據(jù)塊或者數(shù) 據(jù)段可以表示重疊數(shù)據(jù)塊的時(shí)域數(shù)據(jù)采樣。
設(shè)備100包括時(shí)域解碼器110,用于對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行 解碼。此外,設(shè)備100包括處理器120,用于處理在頻域中編碼的數(shù)據(jù) 段以及時(shí)域解碼器110的輸出數(shù)據(jù),以獲得重疊的時(shí)域數(shù)據(jù)塊。此外, 設(shè)備100包括重疊/加法組合器130,用于將重疊的時(shí)域數(shù)據(jù)塊相組合,
以獲者時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
圖lb示出了設(shè)備100的另一個(gè)實(shí)施例。在實(shí)施例中,處理器120可 以包括頻域解碼器122,用于對(duì)在頻域中編碼的數(shù)據(jù)段進(jìn)行解碼,以獲 得頻域數(shù)據(jù)段。此外,在實(shí)施例中,處理器120可以包括時(shí)域至頻域轉(zhuǎn) 換器124,用于對(duì)時(shí)域解碼器110的輸出數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以獲得轉(zhuǎn)換后 的頻域數(shù)據(jù)段。
此外,在實(shí)施例中,處理器120可以包括頻域組合器126,用于將 頻域段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合,以獲得頻域數(shù)據(jù)流。處理器 120還可以包括頻域至?xí)r域轉(zhuǎn)換器128,用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊 的時(shí)域數(shù)據(jù)塊,然后可以由重疊/加法組合器130來(lái)組合這些重疊的時(shí)
12實(shí)施例可以在不作任何修改的情況下,尤其是在不放棄任何臨界
采樣性質(zhì)的情況下,使用MDCT濾波器組,如同例如在MPEG-4 AAC 中所使用的。實(shí)施例可以提供最佳的編碼效率。實(shí)施例可以實(shí)現(xiàn)平滑 的轉(zhuǎn)變,轉(zhuǎn)變至與已建立的MDCT窗兼容的時(shí)域編解碼器,同時(shí)并不 引入額外的切換偽跡并且僅帶來(lái)最小的開(kāi)銷(xiāo)。
實(shí)施例可以在濾波器組中保持時(shí)域混迭,并且刻意地將對(duì)應(yīng)的時(shí) 域混迭引入由時(shí)域編解碼器編碼的信號(hào)部分中。因此,所得到的時(shí)域 混迭分量可以互相抵消,所采用的方式與它們針對(duì)MDCT譜的兩個(gè)連
續(xù)幀所采用的方式相同。
圖lc說(shuō)明了設(shè)備100的另一實(shí)施例,依據(jù)圖lc,頻域解碼器122可 以包括重新量化級(jí)122a。此外,時(shí)域至頻域轉(zhuǎn)換器124可以包括余弦調(diào) 制濾波器組(cosine modulated filterbank)、擴(kuò)展重迭變換(extended lapped transform).低延遲濾波器組或者多相濾波器組。圖lc所示的實(shí) 施例說(shuō)明時(shí)域至頻域轉(zhuǎn)換器124可以包括MDCT 124a。
此外,圖lc描述了頻域組合器126可以包括加法器126a。如圖lc 所示,頻域至?xí)r域轉(zhuǎn)換器128可以分別包括余弦調(diào)制濾波器組以及逆 MDCT 128a??梢岳镁幋a器來(lái)產(chǎn)生包括時(shí)域編碼和頻域編碼的數(shù)據(jù) 段在內(nèi)的數(shù)據(jù)流,該編碼器將在下文中更詳細(xì)地描述。通過(guò)利用頻域 編碼器對(duì)輸入信號(hào)的一些部分進(jìn)行編碼,以及利用時(shí)域編碼器對(duì)一些 輸入信號(hào)的部分進(jìn)行編碼,可以實(shí)現(xiàn)在頻域編碼與時(shí)域編碼之間的切 換。圖lc所示的設(shè)備100的實(shí)施例說(shuō)明了對(duì)應(yīng)的用于解碼的設(shè)備100的
原理結(jié)構(gòu)。在其它的實(shí)施例中,重新量化122a以及逆修正離散余弦變 換128a可以代表頻域解碼器。
如圖lc所示,對(duì)于由時(shí)域解碼器110所接管的信號(hào)部分,可以利用 前向MDCT 124a對(duì)時(shí)域解碼器110的時(shí)域輸出進(jìn)行變換。時(shí)域解碼器 可以利用預(yù)測(cè)濾波器對(duì)時(shí)域編碼的數(shù)據(jù)進(jìn)行解碼。此處,在MDCT 124a的輸入會(huì)引入一些重疊,且從而會(huì)引入一些開(kāi)銷(xiāo)。在下文中,將 描述可以減小或者最小化這種開(kāi)銷(xiāo)的一些實(shí)施例。
理論上,圖lc中所示的實(shí)施例還包括操作模式,在所述操作模式
13下兩個(gè)編解碼器可以并行地操作。在實(shí)施例中,處理器120可以適于處
理在時(shí)域以及在頻域中并行編碼的數(shù)據(jù)段。以此方式,信號(hào)可以部分 在頻域中編碼,部分在時(shí)域中編碼,類(lèi)似于分層編碼方式。所得到的
信號(hào)之后在頻域中加在一起,比較頻域組合器126a。然而,實(shí)施例可 以執(zhí)行專(zhuān)門(mén)在兩個(gè)編解碼器之間進(jìn)行切換的操作模式,并且優(yōu)選地僅 具有最小數(shù)目的采樣,其中這兩個(gè)編解碼器都是活動(dòng)的,以獲得最佳 的可能效率。
在圖lc中,時(shí)域解碼器110的輸出由MDCT 124a來(lái)轉(zhuǎn)換,接著再 由IMDCT128a來(lái)轉(zhuǎn)換。在另一個(gè)實(shí)施例中,這兩個(gè)步驟可以有利地組 合成單個(gè)步驟,以降低復(fù)雜度。圖ld說(shuō)明了設(shè)備100的一個(gè)實(shí)施例,以 說(shuō)明此種方法。圖ld所示的設(shè)備100說(shuō)明處理器120可以包括計(jì)算器 129,用于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)計(jì)算重疊的時(shí)域數(shù)據(jù)塊。處 理器120或者計(jì)算器129可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù),再現(xiàn) 頻域至?xí)r域轉(zhuǎn)換器128的性質(zhì)以及相應(yīng)地重疊性質(zhì),即,處理器120或 者計(jì)算器129可以再現(xiàn)時(shí)域數(shù)據(jù)塊的重疊特性,該重疊特性類(lèi)似于由頻 域至?xí)r域轉(zhuǎn)換器128所產(chǎn)生的的重疊特性。此外,處理器120或者計(jì)算 器129可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)再現(xiàn)時(shí)域混迭,該時(shí)域 混迭類(lèi)似于由頻域至?xí)r域轉(zhuǎn)換器128所引入的時(shí)域混迭。
之后,頻域至?xí)r域轉(zhuǎn)換器128可以適于將頻域解碼器122所提供的 頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。重疊/加法組合器130可以適于 組合由頻域至?xí)r域轉(zhuǎn)換器128以及計(jì)算器129所提供的數(shù)據(jù)塊,以獲得
時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
如在圖le的實(shí)施例中所說(shuō)明的,計(jì)算器129可以包括時(shí)域混迭級(jí)
129a。時(shí)域混迭級(jí)129a可以適于對(duì)時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行時(shí)間混 迭,以獲得重疊的時(shí)域數(shù)據(jù)塊。
對(duì)于時(shí)域編碼數(shù)據(jù),MDCT和IMDCT的組合可以使實(shí)施例中的過(guò) 程在結(jié)構(gòu)以及計(jì)算復(fù)雜度方面都更為簡(jiǎn)化,因?yàn)樵谶@些實(shí)施例中僅剩 下時(shí)域混迭(time-domain aliasing, TDA)過(guò)程。這個(gè)高效的過(guò)程可 以基于許多觀(guān)察。對(duì)2N個(gè)采樣的輸入段進(jìn)行加窗的(windowed)MDCT
可以分成三個(gè)步驟。第一,將輸入信號(hào)乘以分析窗。
第二,然后將得到的結(jié)果從2N個(gè)采樣折迭(fold down)成N個(gè)采 樣。對(duì)于MDCT,該過(guò)程意味著將采樣的時(shí)間反轉(zhuǎn)順序的第一個(gè)四分 之一與釆樣的第二個(gè)四分之一組合(即,后者減去前者),以及將采樣 的第四個(gè)四分之一與采樣的時(shí)間反轉(zhuǎn)順序的第三個(gè)四分之一組合(即, 相加)。在信號(hào)的修改過(guò)的第二和第三個(gè)四分之一中,所得到的結(jié)果是 經(jīng)過(guò)時(shí)間混迭的、下采樣后的信號(hào),包括N個(gè)采樣。
第三,然后使用正交DCT式變換對(duì)下采樣后的信號(hào)進(jìn)行轉(zhuǎn)換,其 中所述正交DCT式變換將N個(gè)輸入映射到N個(gè)輸出采樣,以形成最終的 MDCT輸出。
對(duì)N個(gè)譜釆樣的輸入序列進(jìn)行加窗的IMDCT重建同樣也可以分 成三個(gè)步驟。
第一,使用正交逆DCT式變換對(duì)N個(gè)譜采樣的輸入序列進(jìn)行轉(zhuǎn)換, 所述正交逆DCT式變換將N個(gè)輸入映射到N個(gè)輸出采樣。
第二,將得到的結(jié)果從N個(gè)采樣展開(kāi)成2N個(gè)采樣,這是通過(guò)以下 方式來(lái)實(shí)現(xiàn)的將逆DCT變換后的值寫(xiě)入2N個(gè)采樣輸出緩沖區(qū)的第二 和第三個(gè)四分之一,并且分別以第二個(gè)四分之一的時(shí)間反轉(zhuǎn)且反相后 的版本填充第一個(gè)四分之一,以及以第三個(gè)四分之一的時(shí)間反轉(zhuǎn)的版 本填充第四個(gè)四分之一。
第三,將得到的2N個(gè)采樣乘以合成窗,以形成加窗的IMDCT輸
出。 .
因此,在實(shí)施例中,利用由加窗的MDCT的第一和第二步驟,以 及加窗的IMDCT的第二和第三步驟所構(gòu)成的序列,可以高效地執(zhí)行加 窗的MDCT與加窗的IMDCT的級(jí)聯(lián)(concatenation^在實(shí)施例中可以 完全省略的MDCT的第三步驟以及IMDCT的第一步驟,因?yàn)樗鼈兪窍?對(duì)于彼此逆運(yùn)算且從而互相抵銷(xiāo)。其余的步驟可以?xún)H在時(shí)域中執(zhí)行, 因此使用此種方式的實(shí)施例在計(jì)算復(fù)雜度上可以實(shí)質(zhì)上很低。
對(duì)于由MDCT以及相繼的IMDCT組成的一個(gè)塊,MDCT的第二和 第三步驟以及IMDCT的第二和第三步驟可以寫(xiě)成與下列的稀疏 2Nx2N矩陣相乘。1 一l o ...... 0
一l 1 o ...... 0
0 ...... 0 1 1
o ...... 0 1 1
換句話(huà)說(shuō),計(jì)算器129可以適于將時(shí)域解碼器110的輸出分割成包 括2N個(gè)連續(xù)采樣的計(jì)算器區(qū)段(calculator segment),依據(jù)分析窗函數(shù) 對(duì)這2N個(gè)采樣施加權(quán)重,從第二N/2個(gè)采樣中減去反轉(zhuǎn)順序的第一N/2 個(gè)采樣,將反轉(zhuǎn)順序的最后N/2個(gè)采樣加至第三N/2個(gè)采樣中,使第二 和第三N/2個(gè)采樣反相,以第二N/2個(gè)采樣的時(shí)間反轉(zhuǎn)且反相后的版本 取代第一N/2個(gè)采樣,以第三N/2個(gè)采樣的時(shí)間反轉(zhuǎn)的版本取代第四N/2 個(gè)采樣,以及依據(jù)合成窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重。
在其它的實(shí)施例中,重疊/加法組合器130可以適于依據(jù)合成窗函 數(shù),對(duì)頻域至?xí)r域轉(zhuǎn)換器128所提供的重疊時(shí)域數(shù)據(jù)塊施加權(quán)重。此外, 重疊/加法組合器130可以適于依據(jù)以下合成窗函數(shù)來(lái)施加權(quán)重該合
成窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小相適應(yīng)。
計(jì)算器129可以適于依據(jù)分析窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重,該分
析窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小相適應(yīng),該計(jì)算器 還可以適于依據(jù)合成窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重,該合成窗函數(shù)與重
疊區(qū)域的大小相適應(yīng)。
在實(shí)施例中,在頻域中編碼的兩個(gè)連續(xù)時(shí)域數(shù)據(jù)塊的重疊區(qū)域的 大小,可以大于一個(gè)塊在頻域中編碼而另一個(gè)塊在時(shí)域中編碼的兩個(gè) 連續(xù)時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小。
在實(shí)施例中,數(shù)據(jù)塊的大小可以與重疊區(qū)域的大小相適應(yīng)。在實(shí) 施例中,可以高效實(shí)現(xiàn)組合的MDCT/IMDCT過(guò)程,即,包括分析加窗、 折迭與展開(kāi)、以及合成加窗在內(nèi)的塊TDA。此外,在實(shí)施例中,可以
在實(shí)際實(shí)現(xiàn)中將這些步驟當(dāng)中的一些步驟部分地或者完全地相組合。 如圖lf所示的設(shè)備100的另一個(gè)實(shí)施例說(shuō)明了,設(shè)備100可以進(jìn)一步包括針對(duì)處理器120和重疊/加法組合器130的旁路140,旁路140適于 在時(shí)域中編碼的數(shù)據(jù)段中沒(méi)有出現(xiàn)重疊的連續(xù)時(shí)域數(shù)據(jù)塊時(shí),繞過(guò)處 理器120和重疊/加法組合器130。如果多個(gè)數(shù)據(jù)段是在時(shí)域中編碼的, 即并不需要轉(zhuǎn)換至頻域以解碼連續(xù)的數(shù)據(jù)段,則可以在沒(méi)有任何重疊 的情況之下傳輸這些數(shù)據(jù)段。對(duì)于這些情況,圖lf中所示的實(shí)施例可 以繞過(guò)處理器120和重疊/加法組合器130。在實(shí)施例中,可以依據(jù)AAC
規(guī)范來(lái)確定塊的重疊。
圖2a示出了設(shè)備200的實(shí)施例,設(shè)備200用于依據(jù)時(shí)域數(shù)據(jù)流來(lái)產(chǎn)
生己編碼的數(shù)據(jù)流,該時(shí)域數(shù)據(jù)流具有信號(hào)采樣。該時(shí)域數(shù)據(jù)流可以 例如對(duì)應(yīng)于音頻信號(hào),所述音頻信號(hào)包括語(yǔ)音片段以及音樂(lè)片段或者 同時(shí)包括這兩者。設(shè)備200包括區(qū)段處理器210,用于從數(shù)據(jù)流提供數(shù) 據(jù)段,兩個(gè)連續(xù)的數(shù)據(jù)段具有第一或者第二重疊區(qū)域,第二重疊區(qū)域 小于第一重疊區(qū)域。設(shè)備200還包括時(shí)域編碼器220,用于編碼在時(shí) 域中的數(shù)據(jù)段;以及頻域編碼器230,用于依據(jù)第一或者第二窗函數(shù)對(duì) 時(shí)域數(shù)據(jù)流的采樣施加權(quán)重以獲得加窗的數(shù)據(jù)段,以及用于在頻域中 對(duì)加窗的窗數(shù)據(jù)段進(jìn)行編碼,其中所述第一和第二窗函數(shù)適于第一和 第二重疊區(qū)域。
此外,設(shè)備200包括時(shí)域數(shù)據(jù)分析器240,用于確定與數(shù)據(jù)段相 關(guān)聯(lián)的傳輸指示;以及控制器250,用于控制該設(shè)備,使得對(duì)于具有第 一轉(zhuǎn)變指示的數(shù)據(jù)段,將時(shí)域編碼器220的輸出數(shù)據(jù)包含于已編碼的數(shù) 據(jù)流中,對(duì)于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段,將頻域編碼器230的輸出數(shù) 據(jù)包含于已編碼的數(shù)據(jù)流中。
在實(shí)施例中,時(shí)域數(shù)據(jù)分析器240可以適于從時(shí)域數(shù)據(jù)流中,或 者從區(qū)段處理器210所提供的數(shù)據(jù)段中,確定轉(zhuǎn)變指示。在圖2b中示出 了這些實(shí)施例。在圖2b中說(shuō)明,時(shí)域數(shù)據(jù)分析器240可以耦合至區(qū)段處 理器210的輸入,以從時(shí)域數(shù)據(jù)流中確定轉(zhuǎn)變指示。在另一實(shí)施例中, 時(shí)域數(shù)據(jù)分析器240可以耦合至區(qū)段處理器210的輸出,以從數(shù)據(jù)段中 確定轉(zhuǎn)變指示。在實(shí)施例中,時(shí)域數(shù)據(jù)分析器240可以直接耦合至區(qū)段 處理器210,以從該區(qū)段處理器直接地提供的數(shù)據(jù)中確定轉(zhuǎn)變指示。這 些實(shí)施例在圖2b中以虛線(xiàn)表示。
17在實(shí)施例中,時(shí)域數(shù)據(jù)分析器240可以適于確定轉(zhuǎn)變度量 (transition measure),所述轉(zhuǎn)變度量基于在時(shí)域數(shù)據(jù)流或者數(shù)據(jù)段中 的瞬時(shí)性(transience)的水平,其中轉(zhuǎn)變指示器可以指示瞬時(shí)性的水 平是否超過(guò)預(yù)定的閾值。
圖2c示出了設(shè)備200的另一個(gè)實(shí)施例。在圖2c所示的實(shí)施例中,區(qū) 段處理器210可以適于提供具有第一和第二重疊區(qū)域的數(shù)據(jù)段,時(shí)域編 碼器220可以適于對(duì)所有數(shù)據(jù)段進(jìn)行編碼,頻域編碼器230可以適于對(duì) 所有加窗的數(shù)據(jù)段進(jìn)行編碼,以及控制器250可以適于控制時(shí)域編碼器 220以及頻域編碼器220以及該頻域編碼器230,使得對(duì)于具有第一轉(zhuǎn)變 指示的數(shù)據(jù)段,將時(shí)域編碼器220的輸出數(shù)據(jù)包含于已編碼的數(shù)據(jù)流 中,以及對(duì)于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段,將頻域編碼器230的輸出數(shù) 據(jù)包含于已編碼的數(shù)據(jù)流中。在其它的實(shí)施例中,可以將時(shí)域編碼器 220和頻域編碼器230兩者的輸出數(shù)據(jù)都包含于己編碼的數(shù)據(jù)流中。轉(zhuǎn) 變指示器可以指示,數(shù)據(jù)段是與語(yǔ)音信號(hào)還是與音樂(lè)信號(hào)相關(guān)聯(lián)或有 關(guān)。在實(shí)施例中,頻域編碼器230可以用于更類(lèi)似于音樂(lè)的數(shù)據(jù)段,時(shí) 域編碼器220可以用于更類(lèi)似于語(yǔ)音的數(shù)據(jù)段。在實(shí)施例中,可以使用 并行編碼,例如對(duì)于具有背景音樂(lè)的類(lèi)似語(yǔ)音的音頻信號(hào)。
在圖2c所示的實(shí)施例中,對(duì)于控制器250控制設(shè)備200內(nèi)的多個(gè)組 件,可以想到多種可能性。在圖2c中以虛線(xiàn)來(lái)表示不同的可能性。舉 例而言,控制器250可以耦合至?xí)r域編碼器220和頻域編碼器230,以選
擇哪個(gè)編碼器應(yīng)該依據(jù)該轉(zhuǎn)變指示來(lái)產(chǎn)生己編碼的輸出。在另一實(shí)施 例中,控制器250可以對(duì)時(shí)域編碼器220和頻域編碼器230的輸出處的開(kāi)
關(guān)加以控制。
在這樣的實(shí)施例中,時(shí)域編碼器220和頻域編碼器230皆可以對(duì)所 有數(shù)據(jù)段進(jìn)行編碼,控制器250可以適于依據(jù)編碼效率以及相應(yīng)地 (respectively)轉(zhuǎn)變指示-,經(jīng)由所述耦合至編碼器輸出的幵關(guān)來(lái)選擇
應(yīng)當(dāng)將哪個(gè)已編碼的數(shù)據(jù)段包含于已編碼的數(shù)據(jù)流中。在其它的實(shí)施 例中,控制器250可以適于控制區(qū)段處理器210向時(shí)域編碼器220或者頻 域編碼器230提供數(shù)據(jù)段??刂破?50也可以控制區(qū)段處理器210,以為 數(shù)據(jù)段設(shè)置重疊區(qū)域。在其它的實(shí)施例中,控制器250還可以適于控制
18在區(qū)段處理器210與時(shí)域編碼器220之間,以及相應(yīng)地與頻域編碼器230 之間的開(kāi)關(guān)??刂破?50接著可以影響該開(kāi)關(guān),以將數(shù)據(jù)段傳遞至這兩 個(gè)解碼器之一,以及相應(yīng)地傳遞至兩者??刂破?50還可以適于設(shè)置針 對(duì)頻域編碼器230的加窗函數(shù)以及重疊區(qū)域和編碼策略。
此外,在實(shí)施例中,頻域編碼器230可以適于依據(jù)AAC規(guī)范來(lái)施 加窗函數(shù)的權(quán)重。頻域編碼器230可以適于將加窗的數(shù)據(jù)段轉(zhuǎn)換至頻 域,以獲得頻域數(shù)據(jù)段。此外,頻域編碼器230可以適于對(duì)頻域數(shù)據(jù)段 進(jìn)行量化,頻域編碼器230還可以適于依據(jù)感知模型來(lái)評(píng)估頻域數(shù)據(jù) 段。
頻域編碼器230可以適于使用余弦調(diào)制濾波器組、擴(kuò)展重迭變換、 低延遲濾波器組或者多相濾波器組來(lái)獲得頻域數(shù)據(jù)段。
頻域編碼器230可以適于使用MDCT來(lái)獲得頻域數(shù)據(jù)段。時(shí)域編碼 器220可以適于使用預(yù)測(cè)模型來(lái)編碼數(shù)據(jù)段。
在實(shí)施例中,頻域編碼器230中的MDCT操作于所謂的長(zhǎng)塊模式 下,即,用于編碼非瞬時(shí)輸入信號(hào)的常規(guī)操作模式,對(duì)照AAC規(guī)范, 切換過(guò)程所引入的開(kāi)銷(xiāo)可能很高。這對(duì)于以下情況也成立只有一個(gè) 幀(即,N個(gè)釆樣的長(zhǎng)度/幀速率(framing rate))應(yīng)當(dāng)使用時(shí)域編碼器 220而非頻域編碼器230來(lái)編碼。
然后可能必須利用時(shí)域編碼器220對(duì)MDCT的所有輸入值進(jìn)行編 碼,即,在頻域解碼器110的輸出處2N個(gè)采樣是可用的。因此會(huì)引入N 個(gè)附加采樣的開(kāi)銷(xiāo)。圖3a至3d圖說(shuō)明了一些可以想到的區(qū)段重疊區(qū)域, 以及相應(yīng)地可應(yīng)用的加窗函數(shù)??赡鼙仨毨脮r(shí)域編碼器220對(duì)2N個(gè) 采樣進(jìn)行編碼,以取代一塊(one block of)頻域編碼數(shù)據(jù)。圖3a示出 了示例,其中使用實(shí)線(xiàn)來(lái)表示頻域編碼的數(shù)據(jù)塊,使用虛線(xiàn)來(lái)表示時(shí) 域編碼的數(shù)據(jù)。在加窗函數(shù)下面描述了可以在頻域中編碼(實(shí)線(xiàn)方塊) 或者在時(shí)域中編碼(虛線(xiàn)方塊)的數(shù)據(jù)段。在圖3b至圖3d中也將參考這 種表示。
圖3a示出了以下情況在這種情況下,在頻域中編碼數(shù)據(jù),所述 數(shù)據(jù)被在時(shí)域中編碼的一個(gè)數(shù)據(jù)段所中斷,并且在其之后的數(shù)據(jù)段再 次地在頻域中編碼。為了提供對(duì)于消除由頻域編碼器230所引起的時(shí)域混迭所需要的時(shí)域數(shù)據(jù),在從頻域切換至?xí)r域時(shí)需要重疊的區(qū)段大小
的一半,這對(duì)于從時(shí)域切換回頻域時(shí)也同樣成立。假設(shè)短3a中時(shí)域編 碼數(shù)據(jù)段的大小為2N,那么該時(shí)域編碼數(shù)據(jù)段在其開(kāi)始和結(jié)尾處與頻 域編碼數(shù)據(jù)有著N/2個(gè)采樣的重疊。
如果可以使用時(shí)域編碼器220對(duì)多于一個(gè)的后續(xù)幀進(jìn)行編碼,則 對(duì)于時(shí)域編碼部分的開(kāi)銷(xiāo)維持在N個(gè)采樣。如圖3b所示,在時(shí)域中對(duì) 兩個(gè)連續(xù)的幀進(jìn)行編碼,并且在時(shí)域編碼部分的開(kāi)始和結(jié)尾處的重疊 區(qū)域具有與先前參考圖3a所解釋的相同的重疊。圖3b示出了在以時(shí)域 編碼器220來(lái)編碼兩個(gè)幀的情況下的重疊結(jié)構(gòu)。在此情況中,必須利用 時(shí)域編碼器220對(duì)3N個(gè)采樣進(jìn)行編碼。
例如,在實(shí)施例中,可以依據(jù)在AAC中所使用的結(jié)構(gòu)通過(guò)使用窗 切換來(lái)減小這種開(kāi)銷(xiāo)。圖3c示出了如在AAC中所使用的,由長(zhǎng)窗、開(kāi) 始窗、短窗以及停止窗所組成的序列。從圖3c可以看出,窗大小、數(shù) 據(jù)段大小、以及從而的重疊區(qū)域大小隨著不同的窗而不同。圖3c所示 的序列是上述序列的示例。
實(shí)施例不應(yīng)該局限于AAC窗大小的窗,然而,實(shí)施例可以利用具 有不同重疊區(qū)域的窗以及不同持續(xù)時(shí)間的窗。在實(shí)施例中,可以使用 減小的重疊來(lái)轉(zhuǎn)變至短窗或者從短窗轉(zhuǎn)變,例如在下述文獻(xiàn)中所公開(kāi) 的Bemd Edler, "Codierung von Audiosignalen mit iiberlappender Transformation und adaptiven Fensterfunktionen,,, Frequenz, Vol. 43, No. 9, p. 252-256, September 1989, 以及Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, International Standard 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997,這可以用在一些實(shí)施例中,以減小轉(zhuǎn)變至?xí)r域編碼區(qū)域或者從 時(shí)域編碼區(qū)域轉(zhuǎn)變所需要的開(kāi)銷(xiāo),如在圖3d中所說(shuō)明的。圖3d說(shuō)明了 四個(gè)數(shù)據(jù)段,其中前兩個(gè)以及最后一數(shù)據(jù)段是在頻域中編碼的,而第 三個(gè)區(qū)段是在時(shí)域中編碼的。當(dāng)從頻域切換至?xí)r域時(shí),使用具有減小 的重疊大小的不同窗,由此減小了開(kāi)銷(xiāo)。
在實(shí)施例中,可以根據(jù)與AAC中所使用的完全相同的開(kāi)始窗和停 止窗來(lái)實(shí)現(xiàn)轉(zhuǎn)變。用于轉(zhuǎn)變至?xí)r域編碼區(qū)域或者從時(shí)域編碼區(qū)域轉(zhuǎn)變的、對(duì)應(yīng)的窗是僅具有小區(qū)域重疊的窗。因此,開(kāi)銷(xiāo),即,由于切換 過(guò)程而導(dǎo)致的要額外傳送的值的數(shù)目可以實(shí)質(zhì)上減少。
一般而言,對(duì)
于具有N。v,個(gè)采樣的窗重疊的每個(gè)轉(zhuǎn)變來(lái)說(shuō),開(kāi)銷(xiāo)可以是N。v,/2。因此, 如AAC—樣,N。v尸1024的常規(guī)完全重疊窗的轉(zhuǎn)變,對(duì)于左側(cè)(即,淡 入窗)會(huì)帶來(lái)1024/2=512個(gè)釆樣的開(kāi)銷(xiāo),對(duì)于右側(cè)(即,該淡出窗) 會(huì)帶來(lái)1024/2=512個(gè)采樣的開(kāi)銷(xiāo),轉(zhuǎn)變所造成的總開(kāi)銷(xiāo)是1024^N)個(gè) 采樣。選擇減小的重疊窗,例如N。v產(chǎn)128的AAC短塊窗,僅會(huì)造成128 個(gè)采樣的總開(kāi)銷(xiāo)。
實(shí)施例可以在頻域編碼器230中使用濾波器組,例如,廣為使用 的MDCT濾波器組;然而,其它實(shí)施例也可以與基于其它余弦調(diào)制濾 波器組的頻域編解碼器一起使用。這可以包括MDCT的衍生物 (derivates),例如,擴(kuò)展重迭變換、或者低延遲濾波器組以及例如在 MPEG-l-Layer-l/2/3音頻編解碼器中所使用的多相濾波器組。在實(shí)施 例中,前向/后向?yàn)V波器組操作的高效實(shí)現(xiàn)可以考慮在濾波器組中使用 的特定類(lèi)型窗以及折迭/展開(kāi)過(guò)程。對(duì)于每種類(lèi)型的調(diào)制濾波器組,可 以通過(guò)預(yù)處理步驟以及用于調(diào)制的塊變換(即,DCT式或者DFT),來(lái) 高效地實(shí)現(xiàn)分析級(jí)。在實(shí)施例中,可以使用對(duì)應(yīng)的逆變換以及后處理 步驟來(lái)實(shí)現(xiàn)對(duì)應(yīng)的合成級(jí)。在實(shí)施例中,也可以針對(duì)時(shí)域編碼信號(hào)部 分僅使用預(yù)處理和后處理步驟。
本發(fā)明的實(shí)施例所提供的優(yōu)點(diǎn)是,可以實(shí)現(xiàn)更佳的編碼效率,這 是因?yàn)?,可以在時(shí)域編碼器220和頻域編碼器230之間進(jìn)行切換,這僅
帶來(lái)非常低的開(kāi)銷(xiāo)。在實(shí)施例中,僅在后續(xù)時(shí)域編碼的信號(hào)部分中可 以完全省略重疊。設(shè)備100的實(shí)施例使得可以對(duì)己編碼的數(shù)據(jù)流進(jìn)行對(duì)
應(yīng)的解碼。
由此實(shí)施例提供了以下優(yōu)點(diǎn)例如,可以針對(duì)音頻信號(hào)的相同質(zhì) 量實(shí)現(xiàn)較低的編碼速率,以及相應(yīng)地可以以相同的編碼速率來(lái)實(shí)現(xiàn)較 高的質(zhì)量,這是因?yàn)椋鱾€(gè)編碼器可以適于音頻信號(hào)中的瞬時(shí)性。
依據(jù)本發(fā)明方法的特定實(shí)現(xiàn)需求,可以以硬件、軟件或者其組合 來(lái)實(shí)現(xiàn)本發(fā)明的方法??梢允褂脭?shù)字儲(chǔ)存介質(zhì)來(lái)執(zhí)行所述實(shí)現(xiàn),所述 數(shù)字存儲(chǔ)介質(zhì)具體為盤(pán)、DVD或CD,其上存儲(chǔ)有電可讀控制信號(hào),所述電可讀控制信號(hào)與可編程計(jì)算機(jī)系統(tǒng)協(xié)作以使本發(fā)明的方法可以 執(zhí)行。因此, 一般來(lái)說(shuō)發(fā)明的實(shí)施例是在機(jī)器可讀載體上存儲(chǔ)有計(jì)算 機(jī)程序代碼的計(jì)算機(jī)程序產(chǎn)品,所述程序代碼用于當(dāng)所述計(jì)算機(jī)程序 產(chǎn)品運(yùn)行于計(jì)算機(jī)上時(shí)執(zhí)行本發(fā)明的方法。換句話(huà)說(shuō),發(fā)明方法的實(shí) 施例因此是具有程序代碼的計(jì)算機(jī)程序,所述程序代碼用于當(dāng)計(jì)算機(jī) 程序碼運(yùn)行于計(jì)算機(jī)上時(shí)執(zhí)行本發(fā)明的方法當(dāng)中的至少一個(gè)方法。
參考列表
100用于解碼的設(shè)備
110時(shí)域解碼器
120處理器
122頻域解碼器
122a重新量化
124時(shí)域至頻域轉(zhuǎn)換器
124a修正離散余弦變換
126頻域組合器
126a加法器
128頻域至?xí)r域轉(zhuǎn)換器
128a逆修正離散余弦變換
129計(jì)算器
129a時(shí)域混迭級(jí)
130重疊/加法組合器
200用于編碼的設(shè)備
210區(qū)段處理器
220時(shí)域編碼器
230頻域編碼器
240時(shí)域數(shù)據(jù)分析器
250控制器
400修正離散余弦變換輸入 410窗420逆修正離散余弦變換輸出第一窗
425逆修正離散余弦變換輸出第二窗 430最終輸出
權(quán)利要求
1.一種用于對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備,數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的,在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊,該設(shè)備包括時(shí)域解碼器,用于對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼;處理器,用于對(duì)在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理,以獲得重疊的時(shí)域數(shù)據(jù)塊;以及重疊/加法組合器,用于將重疊的時(shí)域數(shù)據(jù)塊相組合,以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
2.根據(jù)權(quán)利要求l所述的設(shè)備,其中,所述處理器包括頻域解碼 器,用于對(duì)在頻域中編碼的數(shù)據(jù)段進(jìn)行解碼,以獲得頻域數(shù)據(jù)段。
3.根據(jù)權(quán)利要求l所述的設(shè)備,其中,所述處理器適于并行地處 理在時(shí)域中以及在頻域中編碼的數(shù)據(jù)段。
4. 根據(jù)權(quán)利要求2所述的設(shè)備,其中,所述處理器包括時(shí)域至頻 域轉(zhuǎn)換器,用于對(duì)時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以獲得轉(zhuǎn)換后的 頻域數(shù)據(jù)段。
5. 根據(jù)權(quán)利要求4所述的設(shè)備,其中,所述處理器包括頻域組合 器,用于將頻域數(shù)據(jù)段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合,以獲得頻域 數(shù)據(jù)流。
6. 根據(jù)權(quán)利要求5所述的設(shè)備,其中,所述處理器包括頻域至?xí)r 域轉(zhuǎn)換器,用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。
7. 根據(jù)權(quán)利要求2所述的設(shè)備,其中,所述頻域解碼器還包括重 新量化級(jí)。
8. 根據(jù)權(quán)利要求4所述的設(shè)備,其中,所述時(shí)域至頻域轉(zhuǎn)換器包 括余弦調(diào)制濾波器組、擴(kuò)展重迭變換、低延遲濾波器組、多相濾波器 組或者修正離散余弦變換。
9. 根據(jù)權(quán)利要求5所述的設(shè)備,其中,所述頻域組合器包括加法器o
10. 根據(jù)權(quán)利要求6所述的設(shè)備,其中,所述頻域至?xí)r域轉(zhuǎn)換器包括余弦調(diào)制濾波器組或者逆修正離散余弦變換。
11. 根據(jù)權(quán)利要求l所述的設(shè)備,其中,所述時(shí)域解碼器適于使用 預(yù)測(cè)濾波器對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼。
12. 根據(jù)權(quán)利要求l所述的設(shè)備,其中,所述處理器包括計(jì)算器, 用于依據(jù)時(shí)域解碼器的輸出數(shù)據(jù)來(lái)計(jì)算重疊的時(shí)域數(shù)據(jù)塊。
13. 根據(jù)權(quán)利要求12所述的設(shè)備,其中,所述計(jì)算器適于依據(jù)時(shí) 域解碼器的輸出數(shù)據(jù)來(lái)再現(xiàn)頻域至?xí)r域轉(zhuǎn)換器的重疊性質(zhì)。
14. 根據(jù)權(quán)利要求13所述的設(shè)備,其中,所述計(jì)算器適于依據(jù)時(shí) 域解碼器的輸出數(shù)據(jù)來(lái)再現(xiàn)頻域至?xí)r域轉(zhuǎn)換器的時(shí)域混迭特性。
15. 根據(jù)權(quán)利要求6所述的設(shè)備,其中,所述頻域至?xí)r域轉(zhuǎn)換器適 于將頻域解碼器所提供的頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。
16. 根據(jù)權(quán)利要求15所述的設(shè)備,其中,所述重疊/加法組合器適于將頻域至?xí)r域轉(zhuǎn)換器和計(jì)算器所提供的、重疊的時(shí)域數(shù)據(jù)塊相組合, 以獲得時(shí)域數(shù)據(jù)流的己解碼數(shù)據(jù)段。
17. 根據(jù)權(quán)利要求8所述的設(shè)備,其中,所述計(jì)算器包括時(shí)域混迭 級(jí),用于對(duì)時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行時(shí)間混迭,以獲得重疊的時(shí)域 數(shù)據(jù)塊。
18. 根據(jù)權(quán)利要求12所述的設(shè)備,其中,所述計(jì)算器適于 將時(shí)域解碼器的輸出分割成包括2N個(gè)連續(xù)采樣的計(jì)算器區(qū)段, 依據(jù)分析窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重, 從第二N/2個(gè)采樣中減去反轉(zhuǎn)順序的第一N/2個(gè)采樣, 將反轉(zhuǎn)順序的最后N/2個(gè)采樣加到第三N/2個(gè)采樣中, 使第二N/2個(gè)釆樣以及第三N/2個(gè)采樣反相,將第一N/2個(gè)采樣替換成第二N/2個(gè)采樣經(jīng)過(guò)時(shí)間反轉(zhuǎn)并且反相 后的版本,將第四N/2個(gè)采樣替換成第三N/2個(gè)采樣的時(shí)間反轉(zhuǎn)版本,以及 依據(jù)合成窗函數(shù)對(duì)2/N個(gè)采樣施加權(quán)重。
19. 根據(jù)權(quán)利要求6所述的設(shè)備,其中,所述重疊/加法組合器適 于依據(jù)合成窗函數(shù)對(duì)頻域至?xí)r域轉(zhuǎn)換器所提供的重疊的時(shí)域數(shù)據(jù)塊施 加權(quán)重。
20. 根據(jù)權(quán)利要求19所述的設(shè)備,其中,所述重疊/加法組合器適 于依據(jù)合成窗函數(shù)來(lái)施加權(quán)重,所述合成窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù) 塊的重疊區(qū)域的大小相適應(yīng)。
21. 根據(jù)權(quán)利要求20所述的設(shè)備,其中,所述計(jì)算器適于依據(jù)分 析窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重,所述分析窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù) 塊的重疊區(qū)域的大小相適應(yīng),以及,其中所述計(jì)算器系可適于依據(jù)合 成窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重,所述合成窗函數(shù)與重疊區(qū)域的大小相 適應(yīng)。
22. 根據(jù)權(quán)利要求l所述的設(shè)備,其中,在頻域中編碼的兩個(gè)連續(xù) 時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小大于一個(gè)數(shù)據(jù)塊在頻域中編碼并且另一 個(gè)數(shù)據(jù)塊在時(shí)域中編碼的兩個(gè)連續(xù)時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小。
23. 根據(jù)權(quán)利要求l所述的設(shè)備,其中,數(shù)據(jù)塊的重疊區(qū)域是依據(jù) AAC規(guī)范來(lái)確定的。
24. 根據(jù)權(quán)利要求l所述的設(shè)備,還包括針對(duì)處理器和重疊/加法 組合器的旁路,該旁路適于在時(shí)域中編碼的數(shù)據(jù)段中沒(méi)有出現(xiàn)重疊的 連續(xù)時(shí)域數(shù)據(jù)塊時(shí),繞過(guò)處理器和重疊/加法組合器。
25. —種對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的方法,數(shù)據(jù)段是 在時(shí)域中或者在頻域中編碼的,在頻域中編碼的數(shù)據(jù)段具有表示連續(xù) 且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊,該方法包括步驟對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼;對(duì)在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理, 以獲得重疊的時(shí)域數(shù)據(jù)塊;以及將重疊的時(shí)域數(shù)據(jù)塊相組合,以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
26. —種具有程序代碼的計(jì)算機(jī)程序,所述程序代碼用于在運(yùn)行 于計(jì)算機(jī)上時(shí)執(zhí)行根據(jù)權(quán)利要求25所述的方法。
27. —種用于依據(jù)時(shí)域數(shù)據(jù)流來(lái)產(chǎn)生已編碼數(shù)據(jù)流的設(shè)備,所述 時(shí)域數(shù)據(jù)流具有信號(hào)的采樣,該設(shè)備包括區(qū)段處理器,用于從數(shù)據(jù)流提供數(shù)據(jù)段,兩個(gè)連續(xù)的數(shù)據(jù)段具有 第一重疊區(qū)域和第二重疊區(qū)域,第二重疊區(qū)域小于第一重疊區(qū)域;時(shí)域編碼器,用于在時(shí)域中對(duì)加窗的數(shù)據(jù)段進(jìn)行編碼; 頻域編碼器,用于依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對(duì)時(shí)域數(shù) 據(jù)流的采樣施加權(quán)重,以獲得加窗的數(shù)據(jù)段,所述第一加窗函數(shù)和第 二加窗函數(shù)適于第一重疊區(qū)域和第二重疊區(qū)域,所述頻域編碼器適于 在頻域中對(duì)加窗的數(shù)據(jù)段進(jìn)行編碼;時(shí)域數(shù)據(jù)分析器,用于確定與數(shù)據(jù)段有關(guān)的轉(zhuǎn)變指示;以及 控制器,用于控制該設(shè)備,使得對(duì)于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段, 將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中,以及對(duì)于具有第二 轉(zhuǎn)變指示的數(shù)據(jù)段,將頻域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
28. 根據(jù)權(quán)利要求27所述的設(shè)備,其中,所述時(shí)域數(shù)據(jù)分析器適 于從時(shí)域數(shù)據(jù)流、數(shù)據(jù)段中或者從區(qū)段處理器直接提供的數(shù)據(jù)中,判 確定轉(zhuǎn)變指示。
29. 根據(jù)權(quán)利要求27所述的設(shè)備,其中,所述時(shí)域數(shù)據(jù)分析器適 于確定轉(zhuǎn)變度量,所述轉(zhuǎn)變度量基于在時(shí)域數(shù)據(jù)流或者數(shù)據(jù)段中的瞬 時(shí)性的水平,以及,其中轉(zhuǎn)變指示器指示瞬時(shí)性的水平是否超過(guò)預(yù)定 的閾值。
30. 根據(jù)權(quán)利要求27所述的設(shè)備,其中,所述區(qū)段處理器適于提 供具有第一重疊區(qū)域和第二重疊區(qū)域的數(shù)據(jù)段,時(shí)域編碼器適于對(duì)數(shù)據(jù)段進(jìn)行編碼, 頻域編碼器適于對(duì)加窗的數(shù)據(jù)段進(jìn)行編碼,以及 控制器適于控制時(shí)域編碼器以及該頻域編碼器,使得對(duì)于具有第 一轉(zhuǎn)變指示的數(shù)據(jù)段,將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流 中,以及對(duì)于具有第二轉(zhuǎn)變指示的、加窗的數(shù)據(jù)段,將頻域編碼器的 輸出數(shù)據(jù)包含于己編碼數(shù)據(jù)流中。
31. 根據(jù)權(quán)利要求27所述的設(shè)備,其中,所述控制器適于控制區(qū)段處理器將數(shù)據(jù)段提供給時(shí)域編碼器或者頻域編碼器。
32. 根據(jù)權(quán)利要求27所述的設(shè)備,其中,所述頻域編碼器適于依 據(jù)AAC規(guī)范來(lái)施加窗函數(shù)的權(quán)重。
33. 根據(jù)權(quán)利要求27所述的設(shè)備,其中,所述頻域編碼器適于將 加窗的數(shù)據(jù)段轉(zhuǎn)換至頻域,以獲得頻域數(shù)據(jù)段。
34. 根據(jù)權(quán)利要求33所述的設(shè)備,其中,所述頻域編碼器適于對(duì) 頻域數(shù)據(jù)段進(jìn)行量化。
35. 根據(jù)權(quán)利要求34所述的設(shè)備,其中,所述頻域編碼器適于依 據(jù)感知模型來(lái)評(píng)估頻域數(shù)據(jù)段。
36. 根據(jù)權(quán)利要求35所述的設(shè)備,其中,所述頻域編碼器適于使 用余弦調(diào)制濾波器組、擴(kuò)展重迭變換、低延遲濾波器組或者多相濾波 器組來(lái)獲得頻域數(shù)據(jù)段。
37. 根據(jù)權(quán)利要求33所述的設(shè)備,其中,所述頻域編碼器適于使用修正離散余弦變換來(lái)獲得頻域數(shù)據(jù)段。
38. 根據(jù)權(quán)利要求27所述的設(shè)備,其中,所述時(shí)域編碼器適于使 用預(yù)測(cè)濾波器,以對(duì)數(shù)據(jù)段進(jìn)行編碼。
39. —種依據(jù)時(shí)域數(shù)據(jù)流來(lái)產(chǎn)生已編碼數(shù)據(jù)流的方法,所述時(shí)域 數(shù)據(jù)流具有信號(hào)的采樣,該方法包括步驟從數(shù)據(jù)流提供數(shù)據(jù)段,兩個(gè)連續(xù)的數(shù)據(jù)段具有第一重疊區(qū)域和第 二重疊區(qū)域,第二重疊區(qū)域小于第一重疊區(qū)域; 確定與數(shù)據(jù)段相關(guān)聯(lián)的轉(zhuǎn)變指示;在時(shí)域中對(duì)數(shù)據(jù)段進(jìn)行編碼,和/或依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對(duì)時(shí)域數(shù)據(jù)流的采樣 施加權(quán)重以獲得加窗的數(shù)據(jù)段,以及在頻域中對(duì)加窗的數(shù)據(jù)段進(jìn) 行編碼,所述第一加窗函數(shù)和第二加窗函數(shù)適于第一重疊區(qū)域和 第二重疊區(qū)域;以及控制,使得對(duì)于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段,將在時(shí)域中編碼的 輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中,以及對(duì)于具有第二轉(zhuǎn)變指示的數(shù)據(jù) 段,將在頻域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
40. —種具有種程序代碼的計(jì)算機(jī)程序,所述程序代碼用于在運(yùn) 行于計(jì)算機(jī)上時(shí)執(zhí)行根據(jù)權(quán)利要求39所述的方法。
全文摘要
一種用于對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備,數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的,在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊連續(xù)數(shù)據(jù)塊。設(shè)備包括時(shí)域解碼器,用于對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼;以及處理器,用于對(duì)在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理,以獲得重疊的時(shí)域數(shù)據(jù)塊。該設(shè)備還包括重疊/加法組合器,用于將重疊的時(shí)域數(shù)據(jù)塊相組合,以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
文檔編號(hào)G10L19/02GK101589623SQ200780046188
公開(kāi)日2009年11月25日 申請(qǐng)日期2007年12月7日 優(yōu)先權(quán)日2006年12月12日
發(fā)明者于爾根·赫勒, 尼古拉斯·里特爾博謝, 拉爾夫·蓋格爾, 斯特凡·蓋爾斯貝格, 橫谷義一, 馬克斯·諾伊恩多夫 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)