對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法

文檔序號(hào)：2830595閱讀：233來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法
技術(shù)領(lǐng)域：
本發(fā)明屬于編碼領(lǐng)域，其中，例如在視頻以及音頻編碼中，針對(duì) 編碼速率來(lái)使用將被編碼的數(shù)據(jù)的不同特性。
背景技術(shù)：
當(dāng)前技術(shù)的編碼策略可以利用將被編碼的數(shù)據(jù)流的特性。例如，在音頻編碼中，使用感知模型對(duì)原始數(shù)據(jù)進(jìn)行壓縮，而在重新播放時(shí) 幾乎不會(huì)有顯著的質(zhì)量降低和降級(jí)。現(xiàn)代的感知音頻編碼方案，例如
MPEG 2/4 AAC (MPEG=Moving Pictures Expert Group,運(yùn)動(dòng)圖像專(zhuān)家組；AAC=Advanced Audio Coding,高級(jí)音頻編碼)，參見(jiàn)Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, International Standard 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997，可以使用濾波器組，例如修正離散余弦變換(Modified Discrete Cosine Transform, MDCT)，以便在頻域中表示音頻信號(hào)。
在頻域中，可以依據(jù)感知模型來(lái)進(jìn)行頻率系數(shù)的量化。對(duì)于一般類(lèi)型的音頻信號(hào)(例如音樂(lè))，這樣的編碼器可以提供優(yōu)越的感知音頻質(zhì)量。另一方面，現(xiàn)代的語(yǔ)音編碼器，例如ACELP (ACELP=Algebraic Code Excited Linear Prediction,代數(shù)碼激發(fā)線(xiàn)性預(yù)測(cè))，使用一種預(yù)測(cè) 的方式，并且利用此種方式可以在時(shí)域中表示音頻/語(yǔ)音信號(hào)。這樣的語(yǔ)音編碼器可以對(duì)人類(lèi)語(yǔ)音產(chǎn)生過(guò)程(即，人類(lèi)聲道)的特征進(jìn)行建模，從而以較低的比特率即可達(dá)到優(yōu)越的語(yǔ)音信號(hào)性能。反之，對(duì)于以低比特率編碼的語(yǔ)音，感知音頻編碼器無(wú)法達(dá)到語(yǔ)音編碼器所提供的性能水平，并且使用語(yǔ)音編碼器來(lái)表示一般的音頻信號(hào)/音樂(lè)會(huì)造成顯著的質(zhì)量減損。
7傳統(tǒng)的構(gòu)思提供一種分層組合，在所述分層組合中所有的局部編碼器始終是活動(dòng)的(即，時(shí)域和頻域編碼器)，通過(guò)將這些局部編碼器對(duì)于一個(gè)給定的處理過(guò)的時(shí)間幀所作的貢獻(xiàn)相組合，計(jì)算出最終的輸
出信號(hào)。分層編碼的一般示例是MPEG-4可縮放語(yǔ)音/音頻編碼，具有作為基本層的語(yǔ)音編碼器以及基于濾波器組的增強(qiáng)層，參見(jiàn)Bemhard Grill， Karlheinz Brandenburg, "A Two-or Three Stage Bit-Rate Scalable Audio Coding System,", Preprint Number 4132， 99th Convention of the AES (1995年9月)。
傳統(tǒng)的頻域編碼器可以利用MDCT濾波器組。因?yàn)镸DCT優(yōu)秀的
性質(zhì)，其已經(jīng)成為用于傳統(tǒng)感知音頻編碼器的最具優(yōu)勢(shì)的濾波器組。舉例而言，MDCT可以在處理塊之間提供平滑的交叉衰落(crossfade)。
例如，即使由于譜系數(shù)的量化使得在每一個(gè)處理塊中的信號(hào)皆以不同的方式改變，然而因?yàn)榧哟暗闹丿B/加法(windowed overlap/add )操作，所以不會(huì)產(chǎn)生因?yàn)閺囊粋€(gè)塊到另一個(gè)塊的突然轉(zhuǎn)變而造成的分塊偽跡 (blocking artifact)。 MDCT使用時(shí)域混迭消除(time-domain aliasing cancellation, TDAC)的構(gòu)思。
MDCT是一種以IV型離散余弦變換為基礎(chǔ)的傅立葉相關(guān)變換，具有重迭的附加性質(zhì)。MDCT被設(shè)計(jì)為用于在較大數(shù)據(jù)集合的連續(xù)塊中執(zhí)行，其中隨后的塊互相重疊，使得一個(gè)塊的后半部與下一個(gè)塊的前半部重合。除了DCT的能量壓縮(energy-compaction)質(zhì)量之外，這種重疊使得MDCT對(duì)于信號(hào)壓縮應(yīng)用是特別有吸引力的，因?yàn)檫@種重疊有助于避免源于塊邊界的所述偽跡。作為重迭變換(lapped transform), MDCT與其它傅立葉相關(guān)的變換相比的些許不同之處在于，MDCT的輸出的數(shù)目?jī)H有輸入的數(shù)目的一半，而非與輸入的數(shù)目相同。具體地，將2N個(gè)實(shí)數(shù)轉(zhuǎn)換成N個(gè)實(shí)數(shù)，其中N是正整數(shù)。
逆MDCT也稱(chēng)為IMDCT。因?yàn)檩斎肱c輸出的數(shù)目不相同，在乍看之下MDCT似乎是不可逆的。然而，通過(guò)將隨后重疊塊的重疊IMDCT 相加，實(shí)現(xiàn)了完美的可逆性，這使得消除誤差并恢復(fù)原始數(shù)據(jù)(即，實(shí)現(xiàn)TDAC)。
于是，濾波器組輸出處譜值的數(shù)目等于該濾波器組輸入處時(shí)域輸入值的數(shù)目，這也稱(chēng)作臨界采樣(critical sampling)。
MDCT濾波器組提供了高頻率選擇性，并且能夠得到高編碼增益。通過(guò)使用時(shí)域混迭消除技術(shù)，可以實(shí)現(xiàn)塊和臨界采樣的重疊性質(zhì)，參見(jiàn)J. Princen， A. Bradley, "Analysis/Synthesis Filter Band Design Based on Time Domain Aliasing Cancellation,", IEEE Trans. ASSP, ASSP-34(5): 1153-1161, 1986。圖4說(shuō)明了MDCT的這些效應(yīng)。圖4示出了MDCT輸入信號(hào)，以沿著上面的時(shí)間軸400的脈沖來(lái)表示。然后利用兩個(gè)連續(xù)的加窗和MDCT塊對(duì)輸入信號(hào)400進(jìn)行轉(zhuǎn)換，其中在圖4中輸入信號(hào)400 的下方示出了窗410。在圖4中以時(shí)間線(xiàn)420和425顯示了經(jīng)過(guò)后向變換之后獨(dú)立的、加窗的信號(hào)。
在逆MDCT之后，第一塊產(chǎn)生具有正號(hào)的混迭分量420，第二塊產(chǎn) 生具有相同大小并且具有負(fù)號(hào)的混迭分量425。如在圖4的底部的最終輸出430處所顯示的，在兩個(gè)輸出信號(hào)420與425相加之后這兩個(gè)混迭分量互相抵消。
在"擴(kuò)展適應(yīng)性多速率寬帶(AMR-WB+)編解碼器"，3GPP TS 26.290V6.3.0 ， 2005-06技術(shù)規(guī)范中，詳細(xì)說(shuō)明了 AMR-WB+ (AMR-WB=Adaptive Multi-Rate Wideband，適應(yīng)性多速率寬帶)編解碼器。依據(jù)第5.2節(jié)，AMR-WB+編解碼器核心的編碼算法基于混合 ACELP/TCX (TCX=Transform Coded Excitation,變換編碼激發(fā))模型。對(duì)于輸入信號(hào)的每一個(gè)塊，編碼器可以在開(kāi)回路或者閉回路模式下決定哪一種編碼模式，艮卩，ACELP或者TCX，是最佳的。ACELP是時(shí)域預(yù)測(cè)編碼器，最適于語(yǔ)音和瞬態(tài)信號(hào)。AMR-WB編碼器用于ACELP 模式中。備選地，TCX模型是基于變換的編碼器，并且更適于典型的音樂(lè)采樣。
具體地，AMR-WB+針對(duì)變換編碼模式TCX使用離散傅立葉變換 (DFT)。為了允許相鄰塊之間的平滑轉(zhuǎn)變，使用加窗和重疊。這種加窗和重疊對(duì)于不同的編碼模式(TCX/ACELP)之間的轉(zhuǎn)變以及對(duì)于連續(xù)的TCX幀之間的轉(zhuǎn)變而言都是必要的。因此，DFT與加窗和重疊一起表示并未經(jīng)過(guò)臨界采樣的濾波器組。濾波器組產(chǎn)生比新的輸入采樣的數(shù)目更多的頻率值，參見(jiàn)在3GPP TS 26.290V6.3.0 (3GPP=ThirdGeneration Partnership Project ，第三代伙伴計(jì)戈!j ， TS=Technical Specification,技術(shù)規(guī)范)中的圖4。每一個(gè)TCX幀使用1/8幀長(zhǎng)度的重疊，所述幀長(zhǎng)度系等于新的輸入采樣的數(shù)目。因此，該DFT的對(duì)應(yīng)長(zhǎng) 度是9/8幀長(zhǎng)度。
考慮在TCX中非臨界采樣的DFT濾波器組，S卩，在濾波器組輸出處譜值的數(shù)目大于在該濾波器組輸入處時(shí)域輸入值的數(shù)目，這種頻域編碼模式與諸如AAC (AAC=Advanced Audio Coding,高級(jí)音頻編碼) 等使用MDCT (臨界采樣的重迭變換)的音頻編解碼器不同。
在Fielder, Louis D.; Todd, Craig C., "The Design of a Video Friendly Audio Coding System for Distributing Applications,", Paper Number 17-008， The AES 17th International Conference: High-Qqality Audio Coding (1999年8月)，以及Fielder, Louis D.; Davidson, Grant A.， "Audio Coding Tools for Digital Television Distribution,", Preprint Number 5104, 108th Convention of the AES (2000年1月)中，描述了杜比E (Dolby E)編解碼器。杜比E編解碼器使用MDCT濾波器組。在這種編碼的設(shè)計(jì)中，特別關(guān)注在編碼域中直接執(zhí)行編輯的可能性。為了達(dá)成這個(gè)目標(biāo)，使用特殊的無(wú)混迭窗。在這些窗的邊界，不同信號(hào) 部分的平滑交叉衰落或接合是可能的。在前文中所參考的文件中概括出，例如參見(jiàn)"The Design of a Video Friendly Audio Coding System for Distribution Applications，"第三節(jié)，僅簡(jiǎn)單地使用會(huì)引入時(shí)域混迭的一般MDCT窗是不可能實(shí)現(xiàn)這一點(diǎn)的。然而，其中也指出，為了消除混迭，所需要的代價(jià)是變換系數(shù)的數(shù)目增加，這個(gè)結(jié)果指出所得到的濾波器組將不再具有臨界采樣的性質(zhì)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種更高效的編碼和解碼數(shù)據(jù)段的構(gòu)思。利用根據(jù)權(quán)利要求l所述的用于解碼的設(shè)備、根據(jù)權(quán)利要求22所述的用于解碼的方法、根據(jù)權(quán)利要求24所述的用于產(chǎn)生已編碼數(shù)據(jù)流的設(shè)備、以及根據(jù)權(quán)利要求35所述的用于產(chǎn)生已編碼數(shù)據(jù)流的方法，實(shí)現(xiàn)了這一目的。本發(fā)明基于以下成果通過(guò)使用時(shí)域和頻域編碼器的組合，以及相應(yīng)地時(shí)域和頻域解碼器的組合，可以實(shí)現(xiàn)更高效的編碼和解碼。通過(guò)在解碼器中將時(shí)域數(shù)據(jù)轉(zhuǎn)換至頻域，以及通過(guò)將得到的轉(zhuǎn)換后的頻域數(shù)據(jù)與接收到的已經(jīng)解碼頻域數(shù)據(jù)相組合，可以以有效地對(duì)抗時(shí)間混迭問(wèn)題。通過(guò)使施加到數(shù)據(jù)段的重疊窗的重疊區(qū)域適于編碼領(lǐng)域的變化，可以減少開(kāi)銷(xiāo)。當(dāng)使用時(shí)域編碼時(shí)，以及相應(yīng)地從時(shí)域編碼切換或者切換至?xí)r域編碼時(shí)，采用具有較小重疊區(qū)域的窗可以是有利的。
本發(fā)明的實(shí)施例可以提供一種通用的音頻編碼和解碼構(gòu)思，對(duì)于例如語(yǔ)音信號(hào)和音樂(lè)信號(hào)這兩種類(lèi)型的輸入信號(hào)可以實(shí)現(xiàn)更高的性能。實(shí)施例可以很好地利用將多種編碼方式(如，時(shí)域和頻域編碼構(gòu) 思)相組合的優(yōu)點(diǎn)。實(shí)施例可以有效地將基于濾波器組的和基于時(shí)域為的編碼構(gòu)思組合成單個(gè)方案。實(shí)施例可以得到一種組合的編解碼器，可以例如在用于音樂(lè)類(lèi)音頻內(nèi)容的音頻編解碼器與用于語(yǔ)音類(lèi)內(nèi)容的語(yǔ)音編解碼器之間進(jìn)行切換，實(shí)施例可以頻繁地使用這種切換機(jī)制，特別是對(duì)于混合的內(nèi)容。
本發(fā)明的實(shí)施例可以提供不出現(xiàn)切換偽跡的優(yōu)點(diǎn)。在實(shí)施例中，對(duì)于切換過(guò)程，可以使附加傳輸數(shù)據(jù)或者附加編碼采樣的量最小化，以避免在該操作階段降低效率。由此，局部編碼器的切換式組合的構(gòu) 思與所有局部編碼器始終是活動(dòng)的分層組合是不同的。

圖la示出了用于解碼的設(shè)備的實(shí)施例；
圖lb示出了用于解碼的設(shè)備的另一實(shí)施例；
圖lc示出了用于解碼的設(shè)備的另一實(shí)施例；
圖ld示出了用于解碼的設(shè)備的另一實(shí)施例；
圖le示出了用于解碼的設(shè)備的另一實(shí)施例；
圖lf示出了用于解碼的設(shè)備的另一實(shí)施例；圖2a示出了用于編碼的設(shè)備的實(shí)施例；圖2b示出了用于編碼的設(shè)備的另一實(shí)施例；圖2c示出了用于編碼的設(shè)備的另一實(shí)施例；圖3a說(shuō)明了在一個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域和時(shí)域編碼之間進(jìn)行切換時(shí)的重疊區(qū)域；
圖3b說(shuō)明了在兩個(gè)窗的持續(xù)時(shí)間內(nèi)在頻域編碼和時(shí)域編碼之間
進(jìn)行切換時(shí)的重疊區(qū)域；
圖3c說(shuō)明了具有不同的重疊區(qū)域的多個(gè)窗；圖3d說(shuō)明了在實(shí)施例中對(duì)具有不同重疊區(qū)域的窗的使用；以及圖4示出了使用MDCT時(shí)的時(shí)域混迭消除。
具體實(shí)施例方式
在下文中將參考附圖來(lái)詳細(xì)描述本發(fā)明的實(shí)施例。圖la示出了用于對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備 100，數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊。例如，所述數(shù) 據(jù)流可以與音頻流相對(duì)應(yīng)，其中這些數(shù)據(jù)塊當(dāng)中的一些數(shù)據(jù)塊在時(shí)域中編碼，而其他數(shù)據(jù)塊在頻域中編碼。在頻域中編碼的數(shù)據(jù)塊或者數(shù) 據(jù)段可以表示重疊數(shù)據(jù)塊的時(shí)域數(shù)據(jù)采樣。
設(shè)備100包括時(shí)域解碼器110，用于對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼。此外，設(shè)備100包括處理器120，用于處理在頻域中編碼的數(shù)據(jù) 段以及時(shí)域解碼器110的輸出數(shù)據(jù)，以獲得重疊的時(shí)域數(shù)據(jù)塊。此外，設(shè)備100包括重疊/加法組合器130，用于將重疊的時(shí)域數(shù)據(jù)塊相組合，
以獲者時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
圖lb示出了設(shè)備100的另一個(gè)實(shí)施例。在實(shí)施例中，處理器120可以包括頻域解碼器122，用于對(duì)在頻域中編碼的數(shù)據(jù)段進(jìn)行解碼，以獲得頻域數(shù)據(jù)段。此外，在實(shí)施例中，處理器120可以包括時(shí)域至頻域轉(zhuǎn) 換器124，用于對(duì)時(shí)域解碼器110的輸出數(shù)據(jù)進(jìn)行轉(zhuǎn)換，以獲得轉(zhuǎn)換后的頻域數(shù)據(jù)段。
此外，在實(shí)施例中，處理器120可以包括頻域組合器126，用于將頻域段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合，以獲得頻域數(shù)據(jù)流。處理器 120還可以包括頻域至?xí)r域轉(zhuǎn)換器128，用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊，然后可以由重疊/加法組合器130來(lái)組合這些重疊的時(shí)
12實(shí)施例可以在不作任何修改的情況下，尤其是在不放棄任何臨界
采樣性質(zhì)的情況下，使用MDCT濾波器組，如同例如在MPEG-4 AAC 中所使用的。實(shí)施例可以提供最佳的編碼效率。實(shí)施例可以實(shí)現(xiàn)平滑的轉(zhuǎn)變，轉(zhuǎn)變至與已建立的MDCT窗兼容的時(shí)域編解碼器，同時(shí)并不引入額外的切換偽跡并且僅帶來(lái)最小的開(kāi)銷(xiāo)。
實(shí)施例可以在濾波器組中保持時(shí)域混迭，并且刻意地將對(duì)應(yīng)的時(shí) 域混迭引入由時(shí)域編解碼器編碼的信號(hào)部分中。因此，所得到的時(shí)域混迭分量可以互相抵消，所采用的方式與它們針對(duì)MDCT譜的兩個(gè)連
續(xù)幀所采用的方式相同。
圖lc說(shuō)明了設(shè)備100的另一實(shí)施例，依據(jù)圖lc，頻域解碼器122可以包括重新量化級(jí)122a。此外，時(shí)域至頻域轉(zhuǎn)換器124可以包括余弦調(diào) 制濾波器組(cosine modulated filterbank)、擴(kuò)展重迭變換(extended lapped transform).低延遲濾波器組或者多相濾波器組。圖lc所示的實(shí) 施例說(shuō)明時(shí)域至頻域轉(zhuǎn)換器124可以包括MDCT 124a。
此外，圖lc描述了頻域組合器126可以包括加法器126a。如圖lc 所示，頻域至?xí)r域轉(zhuǎn)換器128可以分別包括余弦調(diào)制濾波器組以及逆 MDCT 128a?？梢岳镁幋a器來(lái)產(chǎn)生包括時(shí)域編碼和頻域編碼的數(shù)據(jù) 段在內(nèi)的數(shù)據(jù)流，該編碼器將在下文中更詳細(xì)地描述。通過(guò)利用頻域編碼器對(duì)輸入信號(hào)的一些部分進(jìn)行編碼，以及利用時(shí)域編碼器對(duì)一些輸入信號(hào)的部分進(jìn)行編碼，可以實(shí)現(xiàn)在頻域編碼與時(shí)域編碼之間的切換。圖lc所示的設(shè)備100的實(shí)施例說(shuō)明了對(duì)應(yīng)的用于解碼的設(shè)備100的
原理結(jié)構(gòu)。在其它的實(shí)施例中，重新量化122a以及逆修正離散余弦變換128a可以代表頻域解碼器。
如圖lc所示，對(duì)于由時(shí)域解碼器110所接管的信號(hào)部分，可以利用前向MDCT 124a對(duì)時(shí)域解碼器110的時(shí)域輸出進(jìn)行變換。時(shí)域解碼器可以利用預(yù)測(cè)濾波器對(duì)時(shí)域編碼的數(shù)據(jù)進(jìn)行解碼。此處，在MDCT 124a的輸入會(huì)引入一些重疊，且從而會(huì)引入一些開(kāi)銷(xiāo)。在下文中，將描述可以減小或者最小化這種開(kāi)銷(xiāo)的一些實(shí)施例。
理論上，圖lc中所示的實(shí)施例還包括操作模式，在所述操作模式
13下兩個(gè)編解碼器可以并行地操作。在實(shí)施例中，處理器120可以適于處
理在時(shí)域以及在頻域中并行編碼的數(shù)據(jù)段。以此方式，信號(hào)可以部分在頻域中編碼，部分在時(shí)域中編碼，類(lèi)似于分層編碼方式。所得到的
信號(hào)之后在頻域中加在一起，比較頻域組合器126a。然而，實(shí)施例可以執(zhí)行專(zhuān)門(mén)在兩個(gè)編解碼器之間進(jìn)行切換的操作模式，并且優(yōu)選地僅具有最小數(shù)目的采樣，其中這兩個(gè)編解碼器都是活動(dòng)的，以獲得最佳的可能效率。
在圖lc中，時(shí)域解碼器110的輸出由MDCT 124a來(lái)轉(zhuǎn)換，接著再由IMDCT128a來(lái)轉(zhuǎn)換。在另一個(gè)實(shí)施例中，這兩個(gè)步驟可以有利地組合成單個(gè)步驟，以降低復(fù)雜度。圖ld說(shuō)明了設(shè)備100的一個(gè)實(shí)施例，以說(shuō)明此種方法。圖ld所示的設(shè)備100說(shuō)明處理器120可以包括計(jì)算器 129，用于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)計(jì)算重疊的時(shí)域數(shù)據(jù)塊。處理器120或者計(jì)算器129可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)，再現(xiàn) 頻域至?xí)r域轉(zhuǎn)換器128的性質(zhì)以及相應(yīng)地重疊性質(zhì)，即，處理器120或者計(jì)算器129可以再現(xiàn)時(shí)域數(shù)據(jù)塊的重疊特性，該重疊特性類(lèi)似于由頻域至?xí)r域轉(zhuǎn)換器128所產(chǎn)生的的重疊特性。此外，處理器120或者計(jì)算器129可以適于依據(jù)時(shí)域解碼器110的輸出數(shù)據(jù)再現(xiàn)時(shí)域混迭，該時(shí)域混迭類(lèi)似于由頻域至?xí)r域轉(zhuǎn)換器128所引入的時(shí)域混迭。
之后，頻域至?xí)r域轉(zhuǎn)換器128可以適于將頻域解碼器122所提供的頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。重疊/加法組合器130可以適于組合由頻域至?xí)r域轉(zhuǎn)換器128以及計(jì)算器129所提供的數(shù)據(jù)塊，以獲得
時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
如在圖le的實(shí)施例中所說(shuō)明的，計(jì)算器129可以包括時(shí)域混迭級(jí)
129a。時(shí)域混迭級(jí)129a可以適于對(duì)時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行時(shí)間混迭，以獲得重疊的時(shí)域數(shù)據(jù)塊。
對(duì)于時(shí)域編碼數(shù)據(jù)，MDCT和IMDCT的組合可以使實(shí)施例中的過(guò) 程在結(jié)構(gòu)以及計(jì)算復(fù)雜度方面都更為簡(jiǎn)化，因?yàn)樵谶@些實(shí)施例中僅剩下時(shí)域混迭(time-domain aliasing, TDA)過(guò)程。這個(gè)高效的過(guò)程可以基于許多觀(guān)察。對(duì)2N個(gè)采樣的輸入段進(jìn)行加窗的(windowed)MDCT
可以分成三個(gè)步驟。第一，將輸入信號(hào)乘以分析窗。
第二，然后將得到的結(jié)果從2N個(gè)采樣折迭(fold down)成N個(gè)采樣。對(duì)于MDCT，該過(guò)程意味著將采樣的時(shí)間反轉(zhuǎn)順序的第一個(gè)四分之一與釆樣的第二個(gè)四分之一組合(即，后者減去前者)，以及將采樣的第四個(gè)四分之一與采樣的時(shí)間反轉(zhuǎn)順序的第三個(gè)四分之一組合(即，相加)。在信號(hào)的修改過(guò)的第二和第三個(gè)四分之一中，所得到的結(jié)果是經(jīng)過(guò)時(shí)間混迭的、下采樣后的信號(hào)，包括N個(gè)采樣。
第三，然后使用正交DCT式變換對(duì)下采樣后的信號(hào)進(jìn)行轉(zhuǎn)換，其中所述正交DCT式變換將N個(gè)輸入映射到N個(gè)輸出采樣，以形成最終的 MDCT輸出。
對(duì)N個(gè)譜釆樣的輸入序列進(jìn)行加窗的IMDCT重建同樣也可以分成三個(gè)步驟。
第一，使用正交逆DCT式變換對(duì)N個(gè)譜采樣的輸入序列進(jìn)行轉(zhuǎn)換，所述正交逆DCT式變換將N個(gè)輸入映射到N個(gè)輸出采樣。
第二，將得到的結(jié)果從N個(gè)采樣展開(kāi)成2N個(gè)采樣，這是通過(guò)以下方式來(lái)實(shí)現(xiàn)的將逆DCT變換后的值寫(xiě)入2N個(gè)采樣輸出緩沖區(qū)的第二和第三個(gè)四分之一，并且分別以第二個(gè)四分之一的時(shí)間反轉(zhuǎn)且反相后的版本填充第一個(gè)四分之一，以及以第三個(gè)四分之一的時(shí)間反轉(zhuǎn)的版本填充第四個(gè)四分之一。
第三，將得到的2N個(gè)采樣乘以合成窗，以形成加窗的IMDCT輸
出。 .
因此，在實(shí)施例中，利用由加窗的MDCT的第一和第二步驟，以及加窗的IMDCT的第二和第三步驟所構(gòu)成的序列，可以高效地執(zhí)行加窗的MDCT與加窗的IMDCT的級(jí)聯(lián)(concatenation^在實(shí)施例中可以完全省略的MDCT的第三步驟以及IMDCT的第一步驟，因?yàn)樗鼈兪窍?對(duì)于彼此逆運(yùn)算且從而互相抵銷(xiāo)。其余的步驟可以?xún)H在時(shí)域中執(zhí)行，因此使用此種方式的實(shí)施例在計(jì)算復(fù)雜度上可以實(shí)質(zhì)上很低。
對(duì)于由MDCT以及相繼的IMDCT組成的一個(gè)塊，MDCT的第二和第三步驟以及IMDCT的第二和第三步驟可以寫(xiě)成與下列的稀疏 2Nx2N矩陣相乘。1 一l o ...... 0
一l 1 o ...... 0
0 ...... 0 1 1
o ...... 0 1 1
換句話(huà)說(shuō)，計(jì)算器129可以適于將時(shí)域解碼器110的輸出分割成包括2N個(gè)連續(xù)采樣的計(jì)算器區(qū)段(calculator segment),依據(jù)分析窗函數(shù) 對(duì)這2N個(gè)采樣施加權(quán)重，從第二N/2個(gè)采樣中減去反轉(zhuǎn)順序的第一N/2 個(gè)采樣，將反轉(zhuǎn)順序的最后N/2個(gè)采樣加至第三N/2個(gè)采樣中，使第二和第三N/2個(gè)采樣反相，以第二N/2個(gè)采樣的時(shí)間反轉(zhuǎn)且反相后的版本取代第一N/2個(gè)采樣，以第三N/2個(gè)采樣的時(shí)間反轉(zhuǎn)的版本取代第四N/2 個(gè)采樣，以及依據(jù)合成窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重。
在其它的實(shí)施例中，重疊/加法組合器130可以適于依據(jù)合成窗函數(shù)，對(duì)頻域至?xí)r域轉(zhuǎn)換器128所提供的重疊時(shí)域數(shù)據(jù)塊施加權(quán)重。此外，重疊/加法組合器130可以適于依據(jù)以下合成窗函數(shù)來(lái)施加權(quán)重該合
成窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小相適應(yīng)。
計(jì)算器129可以適于依據(jù)分析窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重，該分
析窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小相適應(yīng)，該計(jì)算器還可以適于依據(jù)合成窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重，該合成窗函數(shù)與重
疊區(qū)域的大小相適應(yīng)。
在實(shí)施例中，在頻域中編碼的兩個(gè)連續(xù)時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小，可以大于一個(gè)塊在頻域中編碼而另一個(gè)塊在時(shí)域中編碼的兩個(gè) 連續(xù)時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小。
在實(shí)施例中，數(shù)據(jù)塊的大小可以與重疊區(qū)域的大小相適應(yīng)。在實(shí) 施例中，可以高效實(shí)現(xiàn)組合的MDCT/IMDCT過(guò)程，即，包括分析加窗、折迭與展開(kāi)、以及合成加窗在內(nèi)的塊TDA。此外，在實(shí)施例中，可以
在實(shí)際實(shí)現(xiàn)中將這些步驟當(dāng)中的一些步驟部分地或者完全地相組合。如圖lf所示的設(shè)備100的另一個(gè)實(shí)施例說(shuō)明了，設(shè)備100可以進(jìn)一步包括針對(duì)處理器120和重疊/加法組合器130的旁路140，旁路140適于在時(shí)域中編碼的數(shù)據(jù)段中沒(méi)有出現(xiàn)重疊的連續(xù)時(shí)域數(shù)據(jù)塊時(shí)，繞過(guò)處理器120和重疊/加法組合器130。如果多個(gè)數(shù)據(jù)段是在時(shí)域中編碼的，即并不需要轉(zhuǎn)換至頻域以解碼連續(xù)的數(shù)據(jù)段，則可以在沒(méi)有任何重疊的情況之下傳輸這些數(shù)據(jù)段。對(duì)于這些情況，圖lf中所示的實(shí)施例可以繞過(guò)處理器120和重疊/加法組合器130。在實(shí)施例中，可以依據(jù)AAC
規(guī)范來(lái)確定塊的重疊。
圖2a示出了設(shè)備200的實(shí)施例，設(shè)備200用于依據(jù)時(shí)域數(shù)據(jù)流來(lái)產(chǎn)
生己編碼的數(shù)據(jù)流，該時(shí)域數(shù)據(jù)流具有信號(hào)采樣。該時(shí)域數(shù)據(jù)流可以例如對(duì)應(yīng)于音頻信號(hào)，所述音頻信號(hào)包括語(yǔ)音片段以及音樂(lè)片段或者同時(shí)包括這兩者。設(shè)備200包括區(qū)段處理器210，用于從數(shù)據(jù)流提供數(shù) 據(jù)段，兩個(gè)連續(xù)的數(shù)據(jù)段具有第一或者第二重疊區(qū)域，第二重疊區(qū)域小于第一重疊區(qū)域。設(shè)備200還包括時(shí)域編碼器220，用于編碼在時(shí) 域中的數(shù)據(jù)段；以及頻域編碼器230，用于依據(jù)第一或者第二窗函數(shù)對(duì) 時(shí)域數(shù)據(jù)流的采樣施加權(quán)重以獲得加窗的數(shù)據(jù)段，以及用于在頻域中對(duì)加窗的窗數(shù)據(jù)段進(jìn)行編碼，其中所述第一和第二窗函數(shù)適于第一和第二重疊區(qū)域。
此外，設(shè)備200包括時(shí)域數(shù)據(jù)分析器240，用于確定與數(shù)據(jù)段相關(guān)聯(lián)的傳輸指示；以及控制器250，用于控制該設(shè)備，使得對(duì)于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時(shí)域編碼器220的輸出數(shù)據(jù)包含于已編碼的數(shù) 據(jù)流中，對(duì)于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將頻域編碼器230的輸出數(shù) 據(jù)包含于已編碼的數(shù)據(jù)流中。
在實(shí)施例中，時(shí)域數(shù)據(jù)分析器240可以適于從時(shí)域數(shù)據(jù)流中，或者從區(qū)段處理器210所提供的數(shù)據(jù)段中，確定轉(zhuǎn)變指示。在圖2b中示出了這些實(shí)施例。在圖2b中說(shuō)明，時(shí)域數(shù)據(jù)分析器240可以耦合至區(qū)段處理器210的輸入，以從時(shí)域數(shù)據(jù)流中確定轉(zhuǎn)變指示。在另一實(shí)施例中，時(shí)域數(shù)據(jù)分析器240可以耦合至區(qū)段處理器210的輸出，以從數(shù)據(jù)段中確定轉(zhuǎn)變指示。在實(shí)施例中，時(shí)域數(shù)據(jù)分析器240可以直接耦合至區(qū)段處理器210，以從該區(qū)段處理器直接地提供的數(shù)據(jù)中確定轉(zhuǎn)變指示。這些實(shí)施例在圖2b中以虛線(xiàn)表示。
17在實(shí)施例中，時(shí)域數(shù)據(jù)分析器240可以適于確定轉(zhuǎn)變度量 (transition measure),所述轉(zhuǎn)變度量基于在時(shí)域數(shù)據(jù)流或者數(shù)據(jù)段中的瞬時(shí)性(transience)的水平，其中轉(zhuǎn)變指示器可以指示瞬時(shí)性的水平是否超過(guò)預(yù)定的閾值。
圖2c示出了設(shè)備200的另一個(gè)實(shí)施例。在圖2c所示的實(shí)施例中，區(qū) 段處理器210可以適于提供具有第一和第二重疊區(qū)域的數(shù)據(jù)段，時(shí)域編碼器220可以適于對(duì)所有數(shù)據(jù)段進(jìn)行編碼，頻域編碼器230可以適于對(duì) 所有加窗的數(shù)據(jù)段進(jìn)行編碼，以及控制器250可以適于控制時(shí)域編碼器 220以及頻域編碼器220以及該頻域編碼器230，使得對(duì)于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時(shí)域編碼器220的輸出數(shù)據(jù)包含于已編碼的數(shù)據(jù)流中，以及對(duì)于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將頻域編碼器230的輸出數(shù) 據(jù)包含于已編碼的數(shù)據(jù)流中。在其它的實(shí)施例中，可以將時(shí)域編碼器 220和頻域編碼器230兩者的輸出數(shù)據(jù)都包含于己編碼的數(shù)據(jù)流中。轉(zhuǎn) 變指示器可以指示，數(shù)據(jù)段是與語(yǔ)音信號(hào)還是與音樂(lè)信號(hào)相關(guān)聯(lián)或有關(guān)。在實(shí)施例中，頻域編碼器230可以用于更類(lèi)似于音樂(lè)的數(shù)據(jù)段，時(shí) 域編碼器220可以用于更類(lèi)似于語(yǔ)音的數(shù)據(jù)段。在實(shí)施例中，可以使用并行編碼，例如對(duì)于具有背景音樂(lè)的類(lèi)似語(yǔ)音的音頻信號(hào)。
在圖2c所示的實(shí)施例中，對(duì)于控制器250控制設(shè)備200內(nèi)的多個(gè)組件，可以想到多種可能性。在圖2c中以虛線(xiàn)來(lái)表示不同的可能性。舉例而言，控制器250可以耦合至?xí)r域編碼器220和頻域編碼器230，以選
擇哪個(gè)編碼器應(yīng)該依據(jù)該轉(zhuǎn)變指示來(lái)產(chǎn)生己編碼的輸出。在另一實(shí)施例中，控制器250可以對(duì)時(shí)域編碼器220和頻域編碼器230的輸出處的開(kāi)
關(guān)加以控制。
在這樣的實(shí)施例中，時(shí)域編碼器220和頻域編碼器230皆可以對(duì)所有數(shù)據(jù)段進(jìn)行編碼，控制器250可以適于依據(jù)編碼效率以及相應(yīng)地 (respectively)轉(zhuǎn)變指示-，經(jīng)由所述耦合至編碼器輸出的幵關(guān)來(lái)選擇
應(yīng)當(dāng)將哪個(gè)已編碼的數(shù)據(jù)段包含于已編碼的數(shù)據(jù)流中。在其它的實(shí)施例中，控制器250可以適于控制區(qū)段處理器210向時(shí)域編碼器220或者頻域編碼器230提供數(shù)據(jù)段?？刂破?50也可以控制區(qū)段處理器210，以為數(shù)據(jù)段設(shè)置重疊區(qū)域。在其它的實(shí)施例中，控制器250還可以適于控制
18在區(qū)段處理器210與時(shí)域編碼器220之間，以及相應(yīng)地與頻域編碼器230 之間的開(kāi)關(guān)?？刂破?50接著可以影響該開(kāi)關(guān)，以將數(shù)據(jù)段傳遞至這兩個(gè)解碼器之一，以及相應(yīng)地傳遞至兩者?？刂破?50還可以適于設(shè)置針對(duì)頻域編碼器230的加窗函數(shù)以及重疊區(qū)域和編碼策略。
此外，在實(shí)施例中，頻域編碼器230可以適于依據(jù)AAC規(guī)范來(lái)施加窗函數(shù)的權(quán)重。頻域編碼器230可以適于將加窗的數(shù)據(jù)段轉(zhuǎn)換至頻域，以獲得頻域數(shù)據(jù)段。此外，頻域編碼器230可以適于對(duì)頻域數(shù)據(jù)段進(jìn)行量化，頻域編碼器230還可以適于依據(jù)感知模型來(lái)評(píng)估頻域數(shù)據(jù) 段。
頻域編碼器230可以適于使用余弦調(diào)制濾波器組、擴(kuò)展重迭變換、低延遲濾波器組或者多相濾波器組來(lái)獲得頻域數(shù)據(jù)段。
頻域編碼器230可以適于使用MDCT來(lái)獲得頻域數(shù)據(jù)段。時(shí)域編碼器220可以適于使用預(yù)測(cè)模型來(lái)編碼數(shù)據(jù)段。
在實(shí)施例中，頻域編碼器230中的MDCT操作于所謂的長(zhǎng)塊模式下，即，用于編碼非瞬時(shí)輸入信號(hào)的常規(guī)操作模式，對(duì)照AAC規(guī)范，切換過(guò)程所引入的開(kāi)銷(xiāo)可能很高。這對(duì)于以下情況也成立只有一個(gè) 幀(即，N個(gè)釆樣的長(zhǎng)度/幀速率(framing rate))應(yīng)當(dāng)使用時(shí)域編碼器 220而非頻域編碼器230來(lái)編碼。
然后可能必須利用時(shí)域編碼器220對(duì)MDCT的所有輸入值進(jìn)行編碼，即，在頻域解碼器110的輸出處2N個(gè)采樣是可用的。因此會(huì)引入N 個(gè)附加采樣的開(kāi)銷(xiāo)。圖3a至3d圖說(shuō)明了一些可以想到的區(qū)段重疊區(qū)域，以及相應(yīng)地可應(yīng)用的加窗函數(shù)?？赡鼙仨毨脮r(shí)域編碼器220對(duì)2N個(gè) 采樣進(jìn)行編碼，以取代一塊(one block of)頻域編碼數(shù)據(jù)。圖3a示出了示例，其中使用實(shí)線(xiàn)來(lái)表示頻域編碼的數(shù)據(jù)塊，使用虛線(xiàn)來(lái)表示時(shí) 域編碼的數(shù)據(jù)。在加窗函數(shù)下面描述了可以在頻域中編碼(實(shí)線(xiàn)方塊) 或者在時(shí)域中編碼(虛線(xiàn)方塊)的數(shù)據(jù)段。在圖3b至圖3d中也將參考這種表示。
圖3a示出了以下情況在這種情況下，在頻域中編碼數(shù)據(jù)，所述數(shù)據(jù)被在時(shí)域中編碼的一個(gè)數(shù)據(jù)段所中斷，并且在其之后的數(shù)據(jù)段再次地在頻域中編碼。為了提供對(duì)于消除由頻域編碼器230所引起的時(shí)域混迭所需要的時(shí)域數(shù)據(jù)，在從頻域切換至?xí)r域時(shí)需要重疊的區(qū)段大小
的一半，這對(duì)于從時(shí)域切換回頻域時(shí)也同樣成立。假設(shè)短3a中時(shí)域編碼數(shù)據(jù)段的大小為2N，那么該時(shí)域編碼數(shù)據(jù)段在其開(kāi)始和結(jié)尾處與頻域編碼數(shù)據(jù)有著N/2個(gè)采樣的重疊。
如果可以使用時(shí)域編碼器220對(duì)多于一個(gè)的后續(xù)幀進(jìn)行編碼，則對(duì)于時(shí)域編碼部分的開(kāi)銷(xiāo)維持在N個(gè)采樣。如圖3b所示，在時(shí)域中對(duì) 兩個(gè)連續(xù)的幀進(jìn)行編碼，并且在時(shí)域編碼部分的開(kāi)始和結(jié)尾處的重疊區(qū)域具有與先前參考圖3a所解釋的相同的重疊。圖3b示出了在以時(shí)域編碼器220來(lái)編碼兩個(gè)幀的情況下的重疊結(jié)構(gòu)。在此情況中，必須利用時(shí)域編碼器220對(duì)3N個(gè)采樣進(jìn)行編碼。
例如，在實(shí)施例中，可以依據(jù)在AAC中所使用的結(jié)構(gòu)通過(guò)使用窗切換來(lái)減小這種開(kāi)銷(xiāo)。圖3c示出了如在AAC中所使用的，由長(zhǎng)窗、開(kāi) 始窗、短窗以及停止窗所組成的序列。從圖3c可以看出，窗大小、數(shù) 據(jù)段大小、以及從而的重疊區(qū)域大小隨著不同的窗而不同。圖3c所示的序列是上述序列的示例。
實(shí)施例不應(yīng)該局限于AAC窗大小的窗，然而，實(shí)施例可以利用具有不同重疊區(qū)域的窗以及不同持續(xù)時(shí)間的窗。在實(shí)施例中，可以使用減小的重疊來(lái)轉(zhuǎn)變至短窗或者從短窗轉(zhuǎn)變，例如在下述文獻(xiàn)中所公開(kāi) 的Bemd Edler， "Codierung von Audiosignalen mit iiberlappender Transformation und adaptiven Fensterfunktionen，，, Frequenz， Vol. 43， No. 9, p. 252-256, September 1989，以及Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, International Standard 13818-7， ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997，這可以用在一些實(shí)施例中，以減小轉(zhuǎn)變至?xí)r域編碼區(qū)域或者從時(shí)域編碼區(qū)域轉(zhuǎn)變所需要的開(kāi)銷(xiāo)，如在圖3d中所說(shuō)明的。圖3d說(shuō)明了四個(gè)數(shù)據(jù)段，其中前兩個(gè)以及最后一數(shù)據(jù)段是在頻域中編碼的，而第三個(gè)區(qū)段是在時(shí)域中編碼的。當(dāng)從頻域切換至?xí)r域時(shí)，使用具有減小的重疊大小的不同窗，由此減小了開(kāi)銷(xiāo)。
在實(shí)施例中，可以根據(jù)與AAC中所使用的完全相同的開(kāi)始窗和停止窗來(lái)實(shí)現(xiàn)轉(zhuǎn)變。用于轉(zhuǎn)變至?xí)r域編碼區(qū)域或者從時(shí)域編碼區(qū)域轉(zhuǎn)變的、對(duì)應(yīng)的窗是僅具有小區(qū)域重疊的窗。因此，開(kāi)銷(xiāo)，即，由于切換過(guò)程而導(dǎo)致的要額外傳送的值的數(shù)目可以實(shí)質(zhì)上減少。
一般而言，對(duì)
于具有N。v,個(gè)采樣的窗重疊的每個(gè)轉(zhuǎn)變來(lái)說(shuō)，開(kāi)銷(xiāo)可以是N。v,/2。因此，如AAC—樣，N。v尸1024的常規(guī)完全重疊窗的轉(zhuǎn)變，對(duì)于左側(cè)(即，淡入窗)會(huì)帶來(lái)1024/2=512個(gè)釆樣的開(kāi)銷(xiāo)，對(duì)于右側(cè)(即，該淡出窗) 會(huì)帶來(lái)1024/2=512個(gè)采樣的開(kāi)銷(xiāo)，轉(zhuǎn)變所造成的總開(kāi)銷(xiāo)是1024^N)個(gè) 采樣。選擇減小的重疊窗，例如N。v產(chǎn)128的AAC短塊窗，僅會(huì)造成128 個(gè)采樣的總開(kāi)銷(xiāo)。
實(shí)施例可以在頻域編碼器230中使用濾波器組，例如，廣為使用的MDCT濾波器組；然而，其它實(shí)施例也可以與基于其它余弦調(diào)制濾波器組的頻域編解碼器一起使用。這可以包括MDCT的衍生物 (derivates)，例如，擴(kuò)展重迭變換、或者低延遲濾波器組以及例如在 MPEG-l-Layer-l/2/3音頻編解碼器中所使用的多相濾波器組。在實(shí)施例中，前向/后向?yàn)V波器組操作的高效實(shí)現(xiàn)可以考慮在濾波器組中使用的特定類(lèi)型窗以及折迭/展開(kāi)過(guò)程。對(duì)于每種類(lèi)型的調(diào)制濾波器組，可以通過(guò)預(yù)處理步驟以及用于調(diào)制的塊變換(即，DCT式或者DFT)，來(lái) 高效地實(shí)現(xiàn)分析級(jí)。在實(shí)施例中，可以使用對(duì)應(yīng)的逆變換以及后處理步驟來(lái)實(shí)現(xiàn)對(duì)應(yīng)的合成級(jí)。在實(shí)施例中，也可以針對(duì)時(shí)域編碼信號(hào)部分僅使用預(yù)處理和后處理步驟。
本發(fā)明的實(shí)施例所提供的優(yōu)點(diǎn)是，可以實(shí)現(xiàn)更佳的編碼效率，這是因?yàn)?，可以在時(shí)域編碼器220和頻域編碼器230之間進(jìn)行切換，這僅
帶來(lái)非常低的開(kāi)銷(xiāo)。在實(shí)施例中，僅在后續(xù)時(shí)域編碼的信號(hào)部分中可以完全省略重疊。設(shè)備100的實(shí)施例使得可以對(duì)己編碼的數(shù)據(jù)流進(jìn)行對(duì)
應(yīng)的解碼。
由此實(shí)施例提供了以下優(yōu)點(diǎn)例如，可以針對(duì)音頻信號(hào)的相同質(zhì) 量實(shí)現(xiàn)較低的編碼速率，以及相應(yīng)地可以以相同的編碼速率來(lái)實(shí)現(xiàn)較高的質(zhì)量，這是因?yàn)椋鱾€(gè)編碼器可以適于音頻信號(hào)中的瞬時(shí)性。
依據(jù)本發(fā)明方法的特定實(shí)現(xiàn)需求，可以以硬件、軟件或者其組合來(lái)實(shí)現(xiàn)本發(fā)明的方法?？梢允褂脭?shù)字儲(chǔ)存介質(zhì)來(lái)執(zhí)行所述實(shí)現(xiàn)，所述數(shù)字存儲(chǔ)介質(zhì)具體為盤(pán)、DVD或CD，其上存儲(chǔ)有電可讀控制信號(hào)，所述電可讀控制信號(hào)與可編程計(jì)算機(jī)系統(tǒng)協(xié)作以使本發(fā)明的方法可以執(zhí)行。因此，一般來(lái)說(shuō)發(fā)明的實(shí)施例是在機(jī)器可讀載體上存儲(chǔ)有計(jì)算機(jī)程序代碼的計(jì)算機(jī)程序產(chǎn)品，所述程序代碼用于當(dāng)所述計(jì)算機(jī)程序產(chǎn)品運(yùn)行于計(jì)算機(jī)上時(shí)執(zhí)行本發(fā)明的方法。換句話(huà)說(shuō)，發(fā)明方法的實(shí) 施例因此是具有程序代碼的計(jì)算機(jī)程序，所述程序代碼用于當(dāng)計(jì)算機(jī) 程序碼運(yùn)行于計(jì)算機(jī)上時(shí)執(zhí)行本發(fā)明的方法當(dāng)中的至少一個(gè)方法。
參考列表
100用于解碼的設(shè)備
110時(shí)域解碼器
120處理器
122頻域解碼器
122a重新量化
124時(shí)域至頻域轉(zhuǎn)換器
124a修正離散余弦變換
126頻域組合器
126a加法器
128頻域至?xí)r域轉(zhuǎn)換器
128a逆修正離散余弦變換
129計(jì)算器
129a時(shí)域混迭級(jí)
130重疊/加法組合器
200用于編碼的設(shè)備
210區(qū)段處理器
220時(shí)域編碼器
230頻域編碼器
240時(shí)域數(shù)據(jù)分析器
250控制器
400修正離散余弦變換輸入 410窗420逆修正離散余弦變換輸出第一窗
425逆修正離散余弦變換輸出第二窗 430最終輸出
權(quán)利要求
1.一種用于對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備，數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊，該設(shè)備包括時(shí)域解碼器，用于對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼；處理器，用于對(duì)在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理，以獲得重疊的時(shí)域數(shù)據(jù)塊；以及重疊/加法組合器，用于將重疊的時(shí)域數(shù)據(jù)塊相組合，以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
2.根據(jù)權(quán)利要求l所述的設(shè)備，其中，所述處理器包括頻域解碼器，用于對(duì)在頻域中編碼的數(shù)據(jù)段進(jìn)行解碼，以獲得頻域數(shù)據(jù)段。
3.根據(jù)權(quán)利要求l所述的設(shè)備，其中，所述處理器適于并行地處理在時(shí)域中以及在頻域中編碼的數(shù)據(jù)段。
4. 根據(jù)權(quán)利要求2所述的設(shè)備，其中，所述處理器包括時(shí)域至頻域轉(zhuǎn)換器，用于對(duì)時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行轉(zhuǎn)換，以獲得轉(zhuǎn)換后的頻域數(shù)據(jù)段。
5. 根據(jù)權(quán)利要求4所述的設(shè)備，其中，所述處理器包括頻域組合器，用于將頻域數(shù)據(jù)段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合，以獲得頻域數(shù)據(jù)流。
6. 根據(jù)權(quán)利要求5所述的設(shè)備，其中，所述處理器包括頻域至?xí)r 域轉(zhuǎn)換器，用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。
7. 根據(jù)權(quán)利要求2所述的設(shè)備，其中，所述頻域解碼器還包括重新量化級(jí)。
8. 根據(jù)權(quán)利要求4所述的設(shè)備，其中，所述時(shí)域至頻域轉(zhuǎn)換器包括余弦調(diào)制濾波器組、擴(kuò)展重迭變換、低延遲濾波器組、多相濾波器組或者修正離散余弦變換。
9. 根據(jù)權(quán)利要求5所述的設(shè)備，其中，所述頻域組合器包括加法器o
10. 根據(jù)權(quán)利要求6所述的設(shè)備，其中，所述頻域至?xí)r域轉(zhuǎn)換器包括余弦調(diào)制濾波器組或者逆修正離散余弦變換。
11. 根據(jù)權(quán)利要求l所述的設(shè)備，其中，所述時(shí)域解碼器適于使用預(yù)測(cè)濾波器對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼。
12. 根據(jù)權(quán)利要求l所述的設(shè)備，其中，所述處理器包括計(jì)算器，用于依據(jù)時(shí)域解碼器的輸出數(shù)據(jù)來(lái)計(jì)算重疊的時(shí)域數(shù)據(jù)塊。
13. 根據(jù)權(quán)利要求12所述的設(shè)備，其中，所述計(jì)算器適于依據(jù)時(shí) 域解碼器的輸出數(shù)據(jù)來(lái)再現(xiàn)頻域至?xí)r域轉(zhuǎn)換器的重疊性質(zhì)。
14. 根據(jù)權(quán)利要求13所述的設(shè)備，其中，所述計(jì)算器適于依據(jù)時(shí) 域解碼器的輸出數(shù)據(jù)來(lái)再現(xiàn)頻域至?xí)r域轉(zhuǎn)換器的時(shí)域混迭特性。
15. 根據(jù)權(quán)利要求6所述的設(shè)備，其中，所述頻域至?xí)r域轉(zhuǎn)換器適于將頻域解碼器所提供的頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時(shí)域數(shù)據(jù)塊。
16. 根據(jù)權(quán)利要求15所述的設(shè)備，其中，所述重疊/加法組合器適于將頻域至?xí)r域轉(zhuǎn)換器和計(jì)算器所提供的、重疊的時(shí)域數(shù)據(jù)塊相組合，以獲得時(shí)域數(shù)據(jù)流的己解碼數(shù)據(jù)段。
17. 根據(jù)權(quán)利要求8所述的設(shè)備，其中，所述計(jì)算器包括時(shí)域混迭級(jí)，用于對(duì)時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行時(shí)間混迭，以獲得重疊的時(shí)域數(shù)據(jù)塊。
18. 根據(jù)權(quán)利要求12所述的設(shè)備，其中，所述計(jì)算器適于將時(shí)域解碼器的輸出分割成包括2N個(gè)連續(xù)采樣的計(jì)算器區(qū)段，依據(jù)分析窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重，從第二N/2個(gè)采樣中減去反轉(zhuǎn)順序的第一N/2個(gè)采樣，將反轉(zhuǎn)順序的最后N/2個(gè)采樣加到第三N/2個(gè)采樣中，使第二N/2個(gè)釆樣以及第三N/2個(gè)采樣反相，將第一N/2個(gè)采樣替換成第二N/2個(gè)采樣經(jīng)過(guò)時(shí)間反轉(zhuǎn)并且反相后的版本，將第四N/2個(gè)采樣替換成第三N/2個(gè)采樣的時(shí)間反轉(zhuǎn)版本，以及依據(jù)合成窗函數(shù)對(duì)2/N個(gè)采樣施加權(quán)重。
19. 根據(jù)權(quán)利要求6所述的設(shè)備，其中，所述重疊/加法組合器適于依據(jù)合成窗函數(shù)對(duì)頻域至?xí)r域轉(zhuǎn)換器所提供的重疊的時(shí)域數(shù)據(jù)塊施加權(quán)重。
20. 根據(jù)權(quán)利要求19所述的設(shè)備，其中，所述重疊/加法組合器適于依據(jù)合成窗函數(shù)來(lái)施加權(quán)重，所述合成窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù) 塊的重疊區(qū)域的大小相適應(yīng)。
21. 根據(jù)權(quán)利要求20所述的設(shè)備，其中，所述計(jì)算器適于依據(jù)分析窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重，所述分析窗函數(shù)與連續(xù)重疊時(shí)域數(shù)據(jù) 塊的重疊區(qū)域的大小相適應(yīng)，以及，其中所述計(jì)算器系可適于依據(jù)合成窗函數(shù)對(duì)2N個(gè)采樣施加權(quán)重，所述合成窗函數(shù)與重疊區(qū)域的大小相適應(yīng)。
22. 根據(jù)權(quán)利要求l所述的設(shè)備，其中，在頻域中編碼的兩個(gè)連續(xù) 時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小大于一個(gè)數(shù)據(jù)塊在頻域中編碼并且另一個(gè)數(shù)據(jù)塊在時(shí)域中編碼的兩個(gè)連續(xù)時(shí)域數(shù)據(jù)塊的重疊區(qū)域的大小。
23. 根據(jù)權(quán)利要求l所述的設(shè)備，其中，數(shù)據(jù)塊的重疊區(qū)域是依據(jù) AAC規(guī)范來(lái)確定的。
24. 根據(jù)權(quán)利要求l所述的設(shè)備，還包括針對(duì)處理器和重疊/加法組合器的旁路，該旁路適于在時(shí)域中編碼的數(shù)據(jù)段中沒(méi)有出現(xiàn)重疊的連續(xù)時(shí)域數(shù)據(jù)塊時(shí)，繞過(guò)處理器和重疊/加法組合器。
25. —種對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的方法，數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù) 且重疊的時(shí)域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊，該方法包括步驟對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼；對(duì)在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理，以獲得重疊的時(shí)域數(shù)據(jù)塊；以及將重疊的時(shí)域數(shù)據(jù)塊相組合，以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
26. —種具有程序代碼的計(jì)算機(jī)程序，所述程序代碼用于在運(yùn)行于計(jì)算機(jī)上時(shí)執(zhí)行根據(jù)權(quán)利要求25所述的方法。
27. —種用于依據(jù)時(shí)域數(shù)據(jù)流來(lái)產(chǎn)生已編碼數(shù)據(jù)流的設(shè)備，所述時(shí)域數(shù)據(jù)流具有信號(hào)的采樣，該設(shè)備包括區(qū)段處理器，用于從數(shù)據(jù)流提供數(shù)據(jù)段，兩個(gè)連續(xù)的數(shù)據(jù)段具有第一重疊區(qū)域和第二重疊區(qū)域，第二重疊區(qū)域小于第一重疊區(qū)域；時(shí)域編碼器，用于在時(shí)域中對(duì)加窗的數(shù)據(jù)段進(jìn)行編碼；頻域編碼器，用于依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對(duì)時(shí)域數(shù) 據(jù)流的采樣施加權(quán)重，以獲得加窗的數(shù)據(jù)段，所述第一加窗函數(shù)和第二加窗函數(shù)適于第一重疊區(qū)域和第二重疊區(qū)域，所述頻域編碼器適于在頻域中對(duì)加窗的數(shù)據(jù)段進(jìn)行編碼；時(shí)域數(shù)據(jù)分析器，用于確定與數(shù)據(jù)段有關(guān)的轉(zhuǎn)變指示；以及控制器，用于控制該設(shè)備，使得對(duì)于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對(duì)于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將頻域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
28. 根據(jù)權(quán)利要求27所述的設(shè)備，其中，所述時(shí)域數(shù)據(jù)分析器適于從時(shí)域數(shù)據(jù)流、數(shù)據(jù)段中或者從區(qū)段處理器直接提供的數(shù)據(jù)中，判確定轉(zhuǎn)變指示。
29. 根據(jù)權(quán)利要求27所述的設(shè)備，其中，所述時(shí)域數(shù)據(jù)分析器適于確定轉(zhuǎn)變度量，所述轉(zhuǎn)變度量基于在時(shí)域數(shù)據(jù)流或者數(shù)據(jù)段中的瞬時(shí)性的水平，以及，其中轉(zhuǎn)變指示器指示瞬時(shí)性的水平是否超過(guò)預(yù)定的閾值。
30. 根據(jù)權(quán)利要求27所述的設(shè)備，其中，所述區(qū)段處理器適于提供具有第一重疊區(qū)域和第二重疊區(qū)域的數(shù)據(jù)段，時(shí)域編碼器適于對(duì)數(shù)據(jù)段進(jìn)行編碼，頻域編碼器適于對(duì)加窗的數(shù)據(jù)段進(jìn)行編碼，以及控制器適于控制時(shí)域編碼器以及該頻域編碼器，使得對(duì)于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時(shí)域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對(duì)于具有第二轉(zhuǎn)變指示的、加窗的數(shù)據(jù)段，將頻域編碼器的輸出數(shù)據(jù)包含于己編碼數(shù)據(jù)流中。
31. 根據(jù)權(quán)利要求27所述的設(shè)備，其中，所述控制器適于控制區(qū)段處理器將數(shù)據(jù)段提供給時(shí)域編碼器或者頻域編碼器。
32. 根據(jù)權(quán)利要求27所述的設(shè)備，其中，所述頻域編碼器適于依據(jù)AAC規(guī)范來(lái)施加窗函數(shù)的權(quán)重。
33. 根據(jù)權(quán)利要求27所述的設(shè)備，其中，所述頻域編碼器適于將加窗的數(shù)據(jù)段轉(zhuǎn)換至頻域，以獲得頻域數(shù)據(jù)段。
34. 根據(jù)權(quán)利要求33所述的設(shè)備，其中，所述頻域編碼器適于對(duì) 頻域數(shù)據(jù)段進(jìn)行量化。
35. 根據(jù)權(quán)利要求34所述的設(shè)備，其中，所述頻域編碼器適于依據(jù)感知模型來(lái)評(píng)估頻域數(shù)據(jù)段。
36. 根據(jù)權(quán)利要求35所述的設(shè)備，其中，所述頻域編碼器適于使用余弦調(diào)制濾波器組、擴(kuò)展重迭變換、低延遲濾波器組或者多相濾波器組來(lái)獲得頻域數(shù)據(jù)段。
37. 根據(jù)權(quán)利要求33所述的設(shè)備，其中，所述頻域編碼器適于使用修正離散余弦變換來(lái)獲得頻域數(shù)據(jù)段。
38. 根據(jù)權(quán)利要求27所述的設(shè)備，其中，所述時(shí)域編碼器適于使用預(yù)測(cè)濾波器，以對(duì)數(shù)據(jù)段進(jìn)行編碼。
39. —種依據(jù)時(shí)域數(shù)據(jù)流來(lái)產(chǎn)生已編碼數(shù)據(jù)流的方法，所述時(shí)域數(shù)據(jù)流具有信號(hào)的采樣，該方法包括步驟從數(shù)據(jù)流提供數(shù)據(jù)段，兩個(gè)連續(xù)的數(shù)據(jù)段具有第一重疊區(qū)域和第二重疊區(qū)域，第二重疊區(qū)域小于第一重疊區(qū)域；確定與數(shù)據(jù)段相關(guān)聯(lián)的轉(zhuǎn)變指示；在時(shí)域中對(duì)數(shù)據(jù)段進(jìn)行編碼，和/或依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對(duì)時(shí)域數(shù)據(jù)流的采樣施加權(quán)重以獲得加窗的數(shù)據(jù)段，以及在頻域中對(duì)加窗的數(shù)據(jù)段進(jìn) 行編碼，所述第一加窗函數(shù)和第二加窗函數(shù)適于第一重疊區(qū)域和第二重疊區(qū)域；以及控制，使得對(duì)于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將在時(shí)域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對(duì)于具有第二轉(zhuǎn)變指示的數(shù)據(jù) 段，將在頻域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
40. —種具有種程序代碼的計(jì)算機(jī)程序，所述程序代碼用于在運(yùn) 行于計(jì)算機(jī)上時(shí)執(zhí)行根據(jù)權(quán)利要求39所述的方法。
全文摘要
一種用于對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行解碼的設(shè)備，數(shù)據(jù)段是在時(shí)域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時(shí)域數(shù)據(jù)采樣塊連續(xù)數(shù)據(jù)塊。設(shè)備包括時(shí)域解碼器，用于對(duì)在時(shí)域中編碼的數(shù)據(jù)段進(jìn)行解碼；以及處理器，用于對(duì)在頻域中編碼的數(shù)據(jù)段以及時(shí)域解碼器的輸出數(shù)據(jù)進(jìn)行處理，以獲得重疊的時(shí)域數(shù)據(jù)塊。該設(shè)備還包括重疊/加法組合器，用于將重疊的時(shí)域數(shù)據(jù)塊相組合，以獲得時(shí)域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
文檔編號(hào)G10L19/02GK101589623SQ200780046188
公開(kāi)日2009年11月25日申請(qǐng)日期2007年12月7日優(yōu)先權(quán)日2006年12月12日
發(fā)明者于爾根·赫勒, 尼古拉斯·里特爾博謝, 拉爾夫·蓋格爾, 斯特凡·蓋爾斯貝格, 橫谷義一, 馬克斯·諾伊恩多夫申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：拉爾夫.蓋格爾;馬克斯.諾伊恩多夫;橫谷義一;尼古拉斯.里特爾博謝;于爾根.赫勒;斯特凡.蓋爾斯貝格
技術(shù)所有人：弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)
我是此專(zhuān)利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

數(shù)據(jù)流圖中的箭頭表示相關(guān)技術(shù)

時(shí)域編碼相關(guān)技術(shù)

數(shù)據(jù)流圖相關(guān)技術(shù)

數(shù)據(jù)流相關(guān)技術(shù)

數(shù)據(jù)流小說(shuō)相關(guān)技術(shù)

空氣流量計(jì)正常數(shù)據(jù)流相關(guān)技術(shù)

單向數(shù)據(jù)流相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法

對(duì)表示時(shí)域數(shù)據(jù)流的數(shù)據(jù)段進(jìn)行編碼和解碼的編碼器、解碼器以及方法