專利名稱:音頻編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼至少部分音頻信號。
背景技術(shù):
在音頻編碼的現(xiàn)有技術(shù)中,線性預(yù)測編碼(LPC)是為大家所熟知用于表示譜容量的。此外,已經(jīng)為這種線性預(yù)測系統(tǒng)建議了許多高效的量化方案,例如對數(shù)區(qū)域比[1],反射系數(shù)[2]和諸如行譜對或行譜頻率[3,4,5]的行譜表示。
在不對怎樣把所述濾波器系數(shù)變換為行譜表示進行詳細描述(參考文獻[6,7,8,9,10]有更詳細的描述)的情況下,結(jié)果是把M階全極LPC濾波器H(z)變換為M個頻率,常常被稱為行譜頻率(LSF)。這些頻率唯一地表示所述濾波器H(z)。舉例來說參見圖1。注意為了清楚起見已經(jīng)在圖1中已將行譜頻率描繪成朝向所述濾波器的振幅響應(yīng)的線條,不過它們只不過是頻率,并且因而在它們自己中不包含任何振幅信息。
發(fā)明內(nèi)容
本發(fā)明的目標(biāo)是提供對至少部分音頻信號進行有益編碼。為此,本發(fā)明提供了如在獨立權(quán)利要求中定義的一種編碼方法、一種編碼器、一種編碼的音頻信號、一種存儲介質(zhì),一種解碼方法、一種解碼器、一種發(fā)送器、一種接收器和一種系統(tǒng)。在所述從屬權(quán)利要求中定義了有益的實施例。
依照本發(fā)明第一方面,對至少部分音頻信號進行編碼以便獲得編碼信號,所述編碼包括對所述至少部分音頻信號進行預(yù)測性地編碼以便獲得表示所述至少部分音頻信號的、諸如時間包絡(luò)之類的時間屬性的預(yù)測系數(shù);把所述預(yù)測系數(shù)變換為表示所述預(yù)測系數(shù)的時間集,和把所述時間集包括在所述編碼信號中。注意沒有任何振幅信息的時間足以表示所述預(yù)測系數(shù)。
盡管還可以把其信號或其分量的時間形狀以一組振幅或增益值的形式直接編碼,但是發(fā)明人認(rèn)識到通過使用用于獲得預(yù)測系數(shù)的預(yù)測編碼并且把這些預(yù)測系數(shù)變換為時間集可以獲得更高的質(zhì)量,所述預(yù)測系數(shù)表示諸如時間包封之類的時間屬性。由于與固定時間軸技術(shù)相比可以獲得局部(在需要處)更高的時間分辨率,因而可以獲得更高質(zhì)量。通過使用LPC濾波器的振幅響應(yīng)可以實現(xiàn)所述預(yù)測編碼以便表示所述時間包絡(luò)。
發(fā)明人還進一步認(rèn)識到使用所述行譜表示的時域?qū)?shù)或等價物對于編碼這種表示時間包絡(luò)的預(yù)測系數(shù)是尤其有益的,這是因為由于這一技術(shù)嚴(yán)格定義了時間或瞬時,這使它們更適于進一步編碼。因此,依照本發(fā)明的這個方面,獲得至少部分音頻信號的時間屬性的高效編碼,這有助于對至少部分音頻信號的更好壓縮。
可以把本發(fā)明的實施例解釋為使用LPC譜來描述時間包絡(luò)而不是譜包絡(luò),并且在譜包絡(luò)的情況下時間現(xiàn)在是頻率,反之亦然,如圖2底部所示。這意味著現(xiàn)在使用行譜表示得出時間或瞬時集而不是頻率。注意,在本方法中時間不是在時軸上預(yù)定間隔上固定的,而是時間本身表示所述預(yù)測系數(shù)。
發(fā)明人認(rèn)識到當(dāng)對時間包絡(luò)使用重疊幀分析/合成時,可以利用所述重疊處的行譜表示中的冗余。本發(fā)明的實施例依照有益的方式利用這種冗余。
本發(fā)明和其實施例對于依照諸如在WO 01/69593-A1中所公開的參量音頻編碼方案中編碼在所述音頻信號中噪聲分量的時間包封特別有益。在這種參量音頻編碼方案中,可以把音頻信號分解成瞬時信號分量、正弦信號分量和噪聲分量。表示所述正弦分量的所述參數(shù)可以是振幅、頻率和相位。對于所述瞬時分量,具有包絡(luò)描述的這種參數(shù)的擴展是高效的表示。
注意本發(fā)明和其實施例可以被用于所述音頻信號或其分量的整個相關(guān)的頻帶上,但也可用于較小頻帶上。
參考附圖的闡述,本發(fā)明的這些及其他方面將是顯而易見。
在附圖中圖1示出了依照現(xiàn)有技術(shù)的具有對應(yīng)于8行譜頻率的8極的LPC譜的例子;圖2示出了(上面)使用LPC以使H(z)表示頻譜,(底部)使用LPC以使H(z)表示時間包絡(luò);
圖3示出了示例性的分析/合成窗口的程式化視圖;圖4示出了兩個相繼的幀的LSF時間的示例序列;圖5示出了通過相對于先前幀k-1移位在幀k中的LSF時間來匹配LSF時間;圖6示出了作為重疊函數(shù)的加權(quán)函數(shù);和圖7示出了依照本發(fā)明實施例的系統(tǒng)。
所述附圖只示出了那些為理解本發(fā)明實施例所必需的元素。
具體實施例方式
盡管下面描述針對LPC濾波器的使用和LSF的時域?qū)?shù)或等價物的計算,但是本發(fā)明還適用于屬于所述權(quán)利要求范圍內(nèi)的其它濾波器和表示。
圖2示出了怎樣使用諸如LPC濾波器之類的預(yù)測濾波器來描述音頻信號或其分量的時間包封。為了能夠使用傳統(tǒng)的LPC濾波器,首先通過例如傅立葉變換把所述輸入信號從時域變換到頻率域。因此事實上,把所述時間形狀變換到譜形狀,通過通常用于編碼譜形狀的隨后的傳統(tǒng)LPC濾波器來編碼所述頻譜形狀。所述LPC濾波器分析提供表示所述輸入信號的時間形狀的預(yù)測系數(shù)。在時間分辨率和頻率分辨率之間存在平衡。比方說例如所述LPC譜往往由許多非常尖的峰(正弦曲線)組成。于是,所述聽覺系統(tǒng)對時間分辨率變化就不怎么靈敏,從而需要較小的分辨率,并且在另一方面,例如在瞬變過程內(nèi)所述頻譜的分辨率不需要很準(zhǔn)確。在這種意義上講人們可以把這視為組合編碼,所述時域的分辨率取決于所述頻率域的分辨率,反之亦然。人們還可以使用多個LPC曲線用于時域估計,例如低和高頻帶,這里所述分辨率還可以取決于頻率估計的分辨率等,因而它可以被利用。
LPC濾波器H(z)通??梢员幻枋鰹镠(z)=1A(z)11+a1z-1+a2z-2+...+amz-m]]>所述系數(shù)ai是由所述LPC分析產(chǎn)生的預(yù)測濾波器系數(shù),i從1到m。所述系數(shù)ai決定了H(z)。
為了計算LSF的時域等價物,可以使用以下過程。該過程的大部分對通常的全極濾波器H(z)有效,因此也對頻率域有效。已知的用于導(dǎo)出在頻域中LSF的其它過程也可以被用來計算所述LSF的時域等價物。
把所述多項式A(z)分成m+1階的兩個多項式P(z)和Q(z)。通過向A(z)增加+1的反射系數(shù)(以網(wǎng)格濾波器形式)來形成多項式P(z),通過增加-1的反射系數(shù)來形成Q(z)。在以直接形式(上面的方程式)和格構(gòu)形式的LPC濾波器之間存在遞歸關(guān)系A(chǔ)i(z)=Ai-1(z)+kiz-iAi-1(z-1)其中i=1,2,...,m,A0(z)=1并且ki為所述反射系數(shù)。
按照如下獲得多項式P(z)和Q(z)P(z)=Am(z)+z-(m+1)Am(z-1)Q(z)=Am(z)-z-(m+1)Am(z-1)用這種方法獲得的所述多項式P(z)=1+p1z-1+p2z-2+...+pmz-m+z-(m+1)和Q(z)=1+q1z-1+q2z-2+...+qmz-m是相當(dāng)對稱的和反對稱的p1=pmq1=qmp2=pm-1q2=-qm-1 這些多項式的一些重要屬性為-P(z)和Q(z)的所有零在z平面的單位圓上。
-P(z)和Q(z)的零交織在所述單位圓上并且不相互重疊。
-在H(z)的量化保障穩(wěn)定性之后保持A(z)的最小相位屬性。
兩個多項式P(z)和Q(z)都具有m+1個零。可以容易看出z=-1和z=1在P(z)或Q(z)中始終是零。因此通過除以1+z-1和1-z-1消除它們。
如果m是偶數(shù)這產(chǎn)生P′(z)=P(z)1+z-1]]>Q′(z)=Q(z)1-z-1]]>如果m是奇數(shù)P′(z)=P(z)Q′(z)=Q(z)(1-z-1)(1+z-1)]]>現(xiàn)在通過zi=ejt來描述所述多項式P′(z)和Q′(z)的零,這是由于所述LPC濾波器應(yīng)用在所述時域中。從而所述多項式P′(z)和Q′(z)的零完全以它們的時間t為特征,所述t在一幀上從0到π,其中0對應(yīng)于所述幀的開始并且π對應(yīng)于該幀的結(jié)束,實際上所述幀可以具有任意的實際長度,例如10或20ms??梢园延稍撏茖?dǎo)產(chǎn)生的時間t解釋為所述行譜頻的時域等價物,這里所述時間進一步被稱作LSF時間。為了計算實際LSF時間,必須計算P′(z)和Q′(z)的根。還可以在本上下文內(nèi)使用在[9],[10],[11]中提出的不同的技術(shù)。
圖3示出了時間包絡(luò)的分析與合成的示例性情況的程式化視圖。在每個幀k,使用窗口(不必是矩形)來由LPC分析所述段。因此對于每個幀,在轉(zhuǎn)換之后,獲得具有N個LSF時間的集。注意原則上N不必是常量,不過多數(shù)情況下這會產(chǎn)生更高效的表示。在這個實施例中我們假定所述LSF時間被均勻地量化,不過在這里也可以應(yīng)用像矢量量化之類的其它技術(shù)。
實驗已經(jīng)示出了在如圖3所示的重疊區(qū)域中常常存在在幀k-1和幀k的LSF時間之間的冗余。同時參考圖4和5。在如下所述的本發(fā)明實施例中,為了更有效地編碼所述LSF時間,利用該冗余,這有助于更好地壓縮所述至少部分音頻信號。注意圖4和5示出了在所述重疊區(qū)域中幀k的LSF時與在幀k-1中的LSF時間不相同但是卻相當(dāng)接近的通常情況。
使用重疊幀的第一實施例在使用重疊幀的第一實施例中,假定在重疊區(qū)域的LSF時間之間的差可以被在感覺上忽略或產(chǎn)生在質(zhì)量上可接受的損失。對于一對LSF時間-幀k-1中一個和幀k中一個,導(dǎo)出的LSF時間是從所述對中的LSF時間的加權(quán)平均值導(dǎo)出的。此應(yīng)用中的加權(quán)平均值看作是包括其中只選擇所述LSF時間對中一個的情況。可以把這種選擇解釋為這樣的加權(quán)平均,其中所選擇的LSF時間的權(quán)重為一并且未選擇倍數(shù)的權(quán)重為零。還可能所述對的兩個LSF時間具有相同的權(quán)重。
例如,如圖4所示假定對于幀k-1,LSF時間為{l0,l1,l2,...,lN},并且對于幀k,LSF時間為{l0,l1,l2,...,lM}。把在幀k中的LSF時間移位以致一定的量化級1處于兩個幀中每一個的相同的位置上?,F(xiàn)在假定對于每個幀在所述重疊區(qū)域中存在三個LSF時間,如圖4和圖5中的情況。那么可以形成以下相應(yīng)對{lN-2,k-1l0,k,lN-1, k-1l1,k,lN,k-1l2,k}。在此實施例中,根據(jù)兩個具有三個LSF時間的原始集構(gòu)造具有三個導(dǎo)出的LSF時間的新集。實際的方法是只取幀k-1(或k)的LSF時間,并且通過簡單地移位幀k-1(或k)的LSF時間來計算幀k(或k-1)的LSF時間以便在時間上對準(zhǔn)所述幀。在所述編碼器和所述解碼器中都執(zhí)行這種移位。在所述編碼器中把右?guī)琸的LSF移位以便使之匹配在左幀k-1的LSF。這對尋找對并且最后確定所述加權(quán)平均值來說是必需的。
在優(yōu)選實施例中,把所導(dǎo)出的時間或加權(quán)平均值編碼為位流作為‘表示等級’,所述表示等級是表示0到π的從0到255(8位)的整數(shù)值。在實際實施例中也適用霍夫曼編碼。對于第一幀絕對地編碼第一LSF時間(沒有基準(zhǔn)點),相對其前一時間差分地編碼所有隨后的LSF時間(包括最后所加權(quán)的那個)?,F(xiàn)在,使用幀k-1的最后3個LSF時間,所述幀k可以利用‘技巧(trick)’。對于解碼,那么幀k取幀k-1的最后三個表示等級(其在區(qū)域0到255的末尾),并且把它們移位回到自己的時軸上(在區(qū)域0到255的開始)。從對應(yīng)于在所述重疊區(qū)域中的最后LSF的表示等級(在幀k的軸上)開始,相對于其前一時間差分地編碼在幀k中所有隨后LSF時間。如果幀k不能利用所述‘技巧’,那么用絕對值編碼幀k的第一LSF時間并且?guī)琸的所有隨后LSF時間相對于其前一時間差分地編碼。
實際方法是取每對相應(yīng)的LSF時間的平均值,例如(lN-2,k-1+l0,k)/2,(lN-1,k-1+l1,k)/2和(lN,k-1+l2,k)/2。
如圖3所示,一種更有益的方法考慮了所述窗口典型地示出淡入/淡出狀態(tài)。依照這種方法計算每對的加權(quán)平均值,所述加權(quán)平均值給出了感覺上更好的結(jié)果。為此所述過程如下。所述重疊區(qū)域?qū)?yīng)于所述區(qū)域(π-r,π)。如在圖6中所描述導(dǎo)出加權(quán)函數(shù)。對于每對分別如下計算左幀k-1的時間的權(quán)重wk-1=π-lmeanr]]>其中l(wèi)mean是對的平均值(平均),例如lmean=(lN-2,k-1+l0,k)/2。
幀k的權(quán)重被計算為wk=1-wk-1?,F(xiàn)在新的LSF時間被計算為lweighted=lk-1wk-1+lkwk.
其中l(wèi)k-1和lk形成一對。最后均勻地量化所述加權(quán)LSF時間。
因為在位流中的第一幀沒有歷史,在沒有利用如上述技術(shù)的情況下,始終需要編碼LSF時間的第一幀。這可以通過使用霍夫曼編碼來絕對地編碼第一LSF時間來完成,并且使用固定霍夫曼表將幀內(nèi)所有隨后值相對于其前者差分地編碼。實際上在第一幀之后的所有幀都可以有利地利用上述技術(shù)。當(dāng)然這種技術(shù)并不總是有益的。設(shè)想這樣的例子,其中在兩個幀的所述重疊區(qū)域中存在相等數(shù)目的LSF時間,但是卻存在非常糟糕的匹配。那么計算(加權(quán))平均值可能導(dǎo)致感覺上變差。優(yōu)選地是,上述技術(shù)并不定義這種情況,其中在幀k-1中LSP時間的數(shù)目與在幀k中LSF時間的數(shù)目不同。因此對于LSF時間的每一幀,把諸如單個位之類的指示包括在所述已編碼信號中以便指示是否使用上述技術(shù),即是否應(yīng)當(dāng)根據(jù)先前幀檢索LSF時間的第一個或它們是否在所述位流中。例如,如果所述指示位是1那么與在幀k-1中相對于它們的前者差分地編碼所述加權(quán)LSF時間,對于幀k根據(jù)在幀k-1中的LSF導(dǎo)出在重疊區(qū)域中的第一個LSF時間。如果所述指示位是0,那么用絕對值編碼幀k的第一LSF時間,相對于它們前面的時間差分地編碼所有隨后的LSF。
在實際實施例中,所述LSF時間幀相當(dāng)長,例如以44.1kHz的1440采樣;在這種情況下對這一額外的指示位大約每秒只需要30比特。實驗示出了大部分幀可以有益地利用上述技術(shù),產(chǎn)生每個幀的凈比特節(jié)省。
使用重疊幀的進一步實施例依照本發(fā)明的進一步實施例,無損失地編碼所述LSF時間數(shù)據(jù)。因此代替把所述重疊對合并為單個LSF時間,相對于在另一幀中的LSF時間編碼給定幀中所述LSF時間的差。因此在圖3的例子中當(dāng)檢索出幀k-1的值l0到lN時,通過分別解碼對幀k-1的ln-2、ln-1和ln的差(在位流中)來檢索來自幀k的最初的三個值l0到l3。通過參照在一個其它幀中的一個LSF時間來編碼LSF時間,所述時間在時間上比在其它幀中的任何其它LSF時間更接近,由于可以參照最接近的時間最好地編碼所述時間,從而獲得了不錯的冗余的利用。由于它們的差通常相當(dāng)小,因此通過使用獨立的霍夫曼表可以相當(dāng)有效地編碼它們。因此除表示是否使用如在第一實施例中所描述的技術(shù)的位之外,對于本特定的例子,還把所述差l0,k-lN-2,k-1,l1,k-1n-1,k-1,l2,k-lN,k-1放入所述位流,在這種情況下,第一實施例并不用于所涉及的重疊。
盡管不是很有益,不過做為選擇可以相對于在先前幀中的其它LSF時間來編碼所述差。例如,可以只相對于所述先前幀的最后LSF時間編碼隨后幀的第一LSF時間的差,繼而在隨后幀中相對于在相同幀中前面的LSF時間編碼每個隨后LSF時間,例如如下對于幀k-1lN-1-lN-2,lN-lN-1并且隨后對于幀kl0,k-lN,k-1,l1,k-l0,k等。
系統(tǒng)描述圖7示出了依照本發(fā)明實施例的系統(tǒng)。所述系統(tǒng)包括用于發(fā)送或記錄編碼信號[S]的設(shè)備1。所述設(shè)備1包括用于接收至少部分音頻信號S的輸入單元10,優(yōu)選地是,所述至少部分音頻信號S為所述音頻信號的噪聲分量。所述輸入單元10可以是天線、麥克風(fēng)、網(wǎng)絡(luò)連接等。所述設(shè)備1還包括編碼器11,用于依照本發(fā)明上述實施例來編碼所述信號S(特別是參見圖4,5和6)以便獲得編碼信號。所述輸入單元10可以接收完全音頻信號并且向其它專用編碼器提供其分量。把所述編碼信號提供給輸出單元12,所述輸出單元12變換具有適合經(jīng)由傳輸介質(zhì)或存儲介質(zhì)2進行傳輸或存儲的格式且采用位流的所述編碼的音頻信號[S]。所述系統(tǒng)還包括接收器或再現(xiàn)設(shè)備3,它在輸入單元30中接收所述編碼信號[S]。所述輸入單元30把所述編碼信號[S]供給到所述解碼器31。所述解碼器通過執(zhí)行解碼過程來解碼所述編碼信號,所述解碼過程基本上是在所述編碼器11中所述編碼的逆運算,在其中獲得解碼信號S′,所述解碼信號除在所述編碼過程期間丟失的那些部分外均對應(yīng)于所述原始信號S。所述解碼器31把所述解碼信號S′供給到提供所述解碼信號S的輸出單元32。所述輸出單元32可以是諸如揚聲器之類的再現(xiàn)單元,用于再現(xiàn)所述解碼信號S′。所述輸出單元32還可以是發(fā)送器,用于例如經(jīng)由家庭網(wǎng)絡(luò)等進一步發(fā)送所述解碼信號S′。在這種情況下,所述信號S′是諸如噪聲分量之類的音頻信號分量的重構(gòu),所述輸出單元32可以包括組合裝置,用于把所述信號S′與其它已重構(gòu)的分量組合起來以便提供完全的音頻信號。
本發(fā)明實施例可以應(yīng)用于因特網(wǎng)分發(fā),固態(tài)音頻,3G終端,GPRS和其商業(yè)后繼設(shè)備,以及等等。
應(yīng)指出,上述實施例示例而不是限制本發(fā)明,本領(lǐng)域內(nèi)的技術(shù)人員在不脫離所附權(quán)利要求的范圍內(nèi)的情況下可以設(shè)計很多替換的實施例。在這些權(quán)利要求中,不應(yīng)當(dāng)將括號內(nèi)的任何標(biāo)記看作是對權(quán)利要求的限制。所述詞“包括”并不排除那些沒有列出在權(quán)利要求中的元件或步驟。本發(fā)明可以用包括一些不同的元件的硬件來實現(xiàn),也可以依靠適當(dāng)?shù)鼐幊痰挠嬎銠C來實現(xiàn)。在列舉一些裝置的設(shè)備權(quán)利要求中,若干這些裝置可以體現(xiàn)為一個相同的硬件項。在彼此不同的從屬權(quán)利要求中所提到的某些措施,實際上并不意味著把這些措施結(jié)合是無益的。
參考文獻[1]R.Viswana than和J.Makhoul,“Quantization propertiesof transmission parameters in linear predictive sytems”,IEEE Trans.Acoust.,Speech,Signal Processing,卷ASSP-23,第309-321頁,1975年6月。
A.H.Gray,Jr.和J.D.Markel,“Quantization andbit allocation in speech processing”,IEEE Trans,Acoust.,Speech,Signal Processing,卷ASSP-24,第459-473頁,1976年12月。
F.K.Soong和B.-H.Juang,“Line Spectrum Pair(LSP)and Speech Data Compression”,Proc.ICASSP-84,卷1,第1.10.1-4頁,1984。
K.K.Paliwal,“Efficient Vector Quantization of LPGParameters at 24 Bits/Frame”,IEEE Trans.on Speech and AudioProcessing,卷1,第3-14頁,1993年1月。
F.K.Soong和B.-H.Juang,“Optimal Quantization ofLSP Parameters”,IEEE Trans.on Speech and Audio Processing,卷1,第15-24頁,1993年1月。
F.Itakura,“Line Spectrum Representation of LinearPredictive Coefficients of Speech Signals”,J.Acoust.Soc.Am.,57,535(A),1975。
N.Sagumura和F.Itakura,“Speech Data Compressionby LSP Speech Analysis-Synthesis Technique”,Trans.IECE′81/8,卷J 64-A,No.8,第599.606頁。
P.Kabal和R.P.Ramachandran,“Computation of linespectral frequencies using chebyshev polynomials”,IEEE Trans.on ASSP,卷34,no.6,第1419-1426頁,1986年12月。
J.Rothweiler,“A rootfinding algorithm for linespectral frequencies”,ICASSP-99。
Engin Erzin和A.Enis Cetin,“Intel-frameDifferential Vector Coding of Line Spectrum Frequencies”,Proc.of the Int.Conf.on Acoustic,Speech and SignalProcessing 1993(ICASSP′93),卷II,第25-28頁,1993年4月27日。
權(quán)利要求
1.一種編碼至少部分音頻信號以便獲得編碼信號的方法,所述方法包括步驟預(yù)測地編碼所述至少部分音頻信號以便獲得預(yù)測系數(shù),所述預(yù)測系數(shù)表示所述至少部分音頻信號的諸如時間包絡(luò)之類的時間屬性;把所述預(yù)測系數(shù)變換為表示所述預(yù)測系數(shù)的時間集;和把所述時間集包括在所述編碼信號中。
2.如權(quán)利要求1所述的方法,其中通過使用濾波器執(zhí)行所述預(yù)測編碼并且其中所述預(yù)測系數(shù)是濾波器系數(shù)。
3.如權(quán)利要求1或2所述的方法,其中所述預(yù)測編碼是線性預(yù)測編碼。
4.如先前權(quán)利要求中任何一個所述的方法,其中在所述預(yù)測編碼步驟之前對至少部分音頻信號執(zhí)行從時域到頻率域的變換,以便獲得頻率域信號,并且其中對所述頻率域信號而不是對至少部分音頻信號執(zhí)行所述預(yù)測編碼步驟。
5.如先前權(quán)利要求中任何一個所述的方法,其中所述時間是行譜頻率的時域?qū)?shù)或等價物。
6.如先前權(quán)利要求中任何一個所述的方法,其中在至少第一幀和第二幀中把所述至少部分音頻信號分段,并且其中第一幀和第二幀具有重疊,所述重疊包括每個幀的至少一個時間。
7.如權(quán)利要求6所述的方法,其中對由在所述重疊中的第一幀的一個時間和在所述重疊中第二幀的一個時間組成的一對時間,把導(dǎo)出時間包括在所述編碼信號中,所述導(dǎo)出時間是第一幀的一個時間和第二幀的一個時間的加權(quán)平均值。
8.如權(quán)利要求7所述的方法,其中所述導(dǎo)出的時間等于所述時間對中所選擇的一個時間。
9.如權(quán)利要求7所述的方法,其中較接近于幀邊界的時間具有比遠離于所述邊界的時間較低的權(quán)重。
10.如權(quán)利要求6所述的方法,其中相對于在第一幀中的時間差分地編碼第二幀的給定時間。
11.如權(quán)利要求10所述的方法,其中相對于在第一幀中的時間差分地編碼第二幀的給定時間,所述第一幀中的時間在時間上與在第二幀中的給定時間比在第一幀中的任何其它時間要更近。
12.如權(quán)利要求7、8、9、10或11中任何一個所述的方法,其中還把諸如單個位的指示符包括在所述編碼信號中,所述指示符指示所述編碼信號在所述指示符與其相關(guān)的重疊中是否包括一個導(dǎo)出時間。
13.如權(quán)利要求7,8,9,10,11或12中任何一個所述的方法,其中還把諸如單個位的指示符包括在所述編碼信號中,所述指示符指示編碼類型,所述編碼類型用來在所述指示符與其相關(guān)的重疊中編碼時間或?qū)С鰰r間。
14.一種編碼器,用于編碼至少部分音頻信號以便獲得編碼信號,所述編碼器包括用于預(yù)測地編碼所述至少部分音頻信號以便獲得預(yù)測系數(shù)的裝置,所述預(yù)測系數(shù)表示所述至少部分音頻信號的諸如時間包絡(luò)之類的時間屬性;用于把所述預(yù)測系數(shù)變換為表示所述預(yù)測系數(shù)的時間集的裝置;和用于把所述時間集包括在所述編碼信號中的裝置。
15.一種表示至少部分音頻信號的編碼信號,所述編碼信號包括表示預(yù)測系數(shù)的時間集,所述預(yù)測系數(shù)表示所述至少部分音頻信號的諸如時間包絡(luò)之類的時間屬性。
16.如權(quán)利要求15所述的編碼信號,其中所述時間與在所述至少部分音頻信號中的至少第一幀和第二幀有關(guān),并且其中第一幀和第二幀具有包括每個幀的至少一個時間的重疊,以及其中所述編碼信號包括至少一個導(dǎo)出時間,所述導(dǎo)出時間是第一幀的一個時間和第二幀的一個時間的加權(quán)平均值。
17.如權(quán)利要求16所述的編碼信號,所述編碼信號還包括諸如單個位之類的指示符,所述指示符指示所述編碼信號在所述指示符與其相關(guān)的重疊中是否包括一個導(dǎo)出時間。
18.一種其上存儲有如權(quán)利要求15、16或17中任何一個所述的編碼信號的存儲介質(zhì)。
19.一種對編碼信號進行解碼的方法,所述編碼信號表示至少部分音頻信號,所述編碼信號包括表示預(yù)測系數(shù)的時間集,所述預(yù)測系數(shù)表示所述至少部分音頻信號的諸如時間包絡(luò)之類的時間屬性,所述方法包括步驟從所述時間集導(dǎo)出諸如所述時間包絡(luò)之類的時間屬性,并且使用這些時間屬性來獲得解碼信號,和提供所述解碼信號。
20.如權(quán)利要求19所述的解碼方法,其中所述方法包括變換所述時間集以便獲得所述預(yù)測系數(shù)的步驟,并且其中從所述預(yù)測系數(shù)而不是從所述時間集導(dǎo)出所述時間屬性。
21.如權(quán)利要求19或20所述的解碼方法,其中所述時間與在所述至少部分音頻信號中的至少第一幀和第二幀有關(guān),并且其中第一幀和第二幀具有包括每個幀的至少一個時間的重疊,以及其中所述編碼信號包括至少一個導(dǎo)出時間,所述導(dǎo)出時間是由在所述重疊中第一幀的一個時間和在所述重疊中第二幀的一個時間組成的一對時間的加權(quán)平均值,所述重疊在原始的至少部分音頻信號中,其中所述方法還包括在解碼第一幀中以及在解碼第二幀中使用至少一個導(dǎo)出時間的步驟。
22.如權(quán)利要求21所述的解碼方法,其中所述編碼信號還包括諸如單個位之類的指示符,所述指示符指示所述編碼信號在所述指示符與其相關(guān)的重疊中是否包括一個導(dǎo)出時間,所述方法還包括步驟從所述編碼信號中獲得所述指示符,只有在所述指示符指示所述指示符與其相關(guān)的重疊的確包含導(dǎo)出時間時,才執(zhí)行使用至少一個導(dǎo)出時間來解碼第一幀以及解碼第二幀的步驟。
23.一種用于對編碼信號進行解碼的解碼器,所述編碼信號表示至少部分音頻信號,所述編碼信號包括表示預(yù)測系數(shù)的時間集,所述預(yù)測系數(shù)表示所述至少部分音頻信號的諸如時間包絡(luò)之類的時間屬性,所述方法包括步驟從所述時間集導(dǎo)出諸如所述時間包絡(luò)之類的時間屬性,并且使用這些時間屬性來獲得解碼信號,和提供所述解碼信號。
24.一種發(fā)送器,包括輸入單元,用于接收至少部分音頻信號,如權(quán)利要求14所述的編碼器,用于編碼所述至少部分音頻信號以便獲得編碼信號,和輸出單元,用于發(fā)送所述編碼信號。
25.一種接收器,包括輸入單元,用于接收表示至少部分音頻信號的編碼信號,如權(quán)利要求23所述的解碼器,用于對所述編碼信號進行解碼以便獲得解碼信號,和輸出單元,用于提供所述解碼信號。
26.一種系統(tǒng),包括如權(quán)利要求24所述的發(fā)送器和如權(quán)利要求25所述的接收器。
全文摘要
依照本發(fā)明第一方面,對至少部分音頻信號進行編碼以便獲得編碼的信號,所述編碼包括對所述至少部分音頻信號進行預(yù)測性地編碼以便獲得表示所述至少部分音頻信號的諸如時間包絡(luò)之類的時間屬性的預(yù)測系數(shù);把所述預(yù)測系數(shù)轉(zhuǎn)變換為表示所述預(yù)測系數(shù)的時間集,和將該時間集包括在所述編碼信號中。在編碼這種預(yù)測系數(shù)中使用行譜表示的時域?qū)?shù)或等價物是尤其有益的,這是由于在該技術(shù)中嚴(yán)格地定義了時間或瞬時,這使它們更適于進一步編碼。對于時間包絡(luò)的重疊幀分析/合成,可以利用所述重疊在所述行譜表示中的冗余。本發(fā)明的實施例依照有益的方式利用這種冗余。
文檔編號G10L19/06GK1669075SQ03816697
公開日2005年9月14日 申請日期2003年7月11日 優(yōu)先權(quán)日2002年7月16日
發(fā)明者E·G·P·舒杰斯, A·J·里恩伯格, N·托帕洛維 申請人:皇家飛利浦電子股份有限公司