專利名稱:帶有改進(jìn)的編碼器的音頻傳輸系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及傳輸系統(tǒng),其中包含帶有音頻編碼器的發(fā)射機(jī),該音頻編碼器包括用于把輸入音頻信號(hào)劃分為連續(xù)信號(hào)分段的分割裝置,該編碼器還包含用于確定連續(xù)信號(hào)分段內(nèi)出現(xiàn)的鏈接信號(hào)分量的跟蹤判定裝置,該發(fā)射機(jī)還包括發(fā)射裝置用于通過傳輸媒介向接收機(jī)發(fā)送代表該被鏈接信號(hào)分量的信號(hào),該接收機(jī)包括用于從傳輸媒介中接收代表該信號(hào)分量的信號(hào)的接收裝置和用于從代表該信號(hào)分量的信號(hào)中得到重構(gòu)的音頻信號(hào)的解碼器。
本發(fā)明還進(jìn)一步涉及發(fā)射機(jī)、編碼器、編碼方法、承載計(jì)算機(jī)程序的有形媒介以及承載計(jì)算機(jī)程序的信號(hào)。
從US4885790可以了解到一種依照前序部分的傳輸系統(tǒng)。這種傳輸系統(tǒng)以及音頻編碼器被用于如下應(yīng)用其中音頻信號(hào)必須要通過傳輸容量受限的傳輸媒介來傳輸,或者必須要被存儲(chǔ)在存儲(chǔ)容量受限的存儲(chǔ)介質(zhì)中。這種應(yīng)用的實(shí)例包括通過互聯(lián)網(wǎng)傳輸音頻信號(hào)、從移動(dòng)電話向基站傳輸音頻信號(hào)及其反向傳輸,以及在CD-ROM、固態(tài)存儲(chǔ)器或者硬盤驅(qū)動(dòng)器中存儲(chǔ)音頻信號(hào)。
在適當(dāng)比特率情況下,試圖采用不同的音頻編碼器工作原理去獲得良好的音頻質(zhì)量。在其中一種操作方法中,被傳輸?shù)囊纛l信號(hào)要被分割成為多個(gè)分段,每個(gè)分段擁有5-50ms的固定或者與分段相關(guān)的長(zhǎng)度。在各所述分段中,音頻信號(hào)都是由多個(gè)信號(hào)分量來代表的,所述信號(hào)分量可以是由其幅度、頻率以及可能還有其相位來定義的正弦信號(hào)。
發(fā)射裝置向接收機(jī)發(fā)送信號(hào)分量的幅度和頻率表示。發(fā)射機(jī)所執(zhí)行的操作可以包括信道編碼、交織和調(diào)制。
接收裝置從傳輸信道中接收代表音頻信號(hào)的信號(hào),并且執(zhí)行類似解調(diào)、去交織和信道解碼的操作。解碼器從接收機(jī)得到音頻信號(hào)的表示,并且根據(jù)該表示來通過生成多個(gè)由編碼信號(hào)所描述的正弦信號(hào)并且把它們組合形成輸出信號(hào),而得到重構(gòu)的音頻信號(hào)。
音頻信號(hào)中,當(dāng)前信號(hào)分段內(nèi)的信號(hào)分量與前一分段內(nèi)的信號(hào)分量之間通常都存在一定的關(guān)系。音頻信號(hào)可以包括例如對(duì)多個(gè)信號(hào)分段的持續(xù)時(shí)間的正弦分量的頻率掃描。這種信號(hào)的存在可以被用于編碼過程,對(duì)第一個(gè)信號(hào)分段之后出現(xiàn)的信號(hào)分段的頻率和幅度進(jìn)行差分編碼。這意味著只需要傳輸當(dāng)前信號(hào)分段內(nèi)信號(hào)分量的頻率與前一信號(hào)分量的頻率之間的差值,而不傳輸該信號(hào)分段的頻率和幅度。對(duì)連續(xù)兩個(gè)分段的幅度也可以采用相同的方法。
為了做到這一點(diǎn),編碼器內(nèi)包含跟蹤判定裝置,用于判定需要鏈接哪一個(gè)信號(hào)分量。根據(jù)上面提到的美國(guó)專利,在傳輸系統(tǒng)內(nèi)利用當(dāng)前幀內(nèi)與前一幀內(nèi)信號(hào)分量之間的頻率差別去決定應(yīng)該鏈接哪一個(gè)頻率分量,以及哪個(gè)信號(hào)分量不應(yīng)該被鏈接。然而實(shí)驗(yàn)表明這樣做并不總能保證重構(gòu)音頻信號(hào)有最佳質(zhì)量。
本發(fā)明的目的在于提供一種具有提高的重構(gòu)音頻信號(hào)質(zhì)量的傳輸系統(tǒng)。
為實(shí)現(xiàn)該目的,依照前序部分的傳輸系統(tǒng)具備如下特點(diǎn)在跟蹤裝置內(nèi)包括選擇裝置,用于選擇被鏈接的信號(hào)分量,使得在該被鏈接信號(hào)分量基礎(chǔ)上判定的合成音頻信號(hào)與該輸入音頻信號(hào)之間的誤差測(cè)量達(dá)到最小。
通過嘗試多個(gè)候選的被鏈接信號(hào)分量并選擇其中一組能夠使得誤差測(cè)量達(dá)到最小的被鏈接信號(hào)分量,可以使得重構(gòu)音頻信號(hào)的質(zhì)量得到提高。差測(cè)量可以包括例如均方誤差或感性加權(quán)誤差測(cè)量。可以看到通常都有必要真正地生成合成語(yǔ)音信號(hào),但是也可以根據(jù)誤差信號(hào)表達(dá)方式,利用分析方法去決定信號(hào)分量的最佳參數(shù)。
本發(fā)明實(shí)施例的特征在于編碼器中包含合成裝置,用于在連續(xù)兩個(gè)信號(hào)分段內(nèi),基于該候選鏈接信號(hào)分量的至少一個(gè)參數(shù)得到合成信號(hào)。
通過在連續(xù)兩個(gè)信號(hào)分段的至少一個(gè)參數(shù)(頻率、幅度)的基礎(chǔ)上得到合成信號(hào),合成信號(hào)內(nèi)該參數(shù)的變化會(huì)更加平穩(wěn),這能更好地與輸入音頻信號(hào)的特性相對(duì)應(yīng)。
本發(fā)明的另外一個(gè)實(shí)施例的特征在于設(shè)計(jì)合成裝置以便根據(jù)對(duì)應(yīng)于至少兩個(gè)連續(xù)信號(hào)分段的信號(hào)分量參數(shù)得到內(nèi)插信號(hào)分量參數(shù),以及在該內(nèi)插信號(hào)分量參數(shù)的基礎(chǔ)上得到合成信號(hào)。
通過使用根據(jù)兩個(gè)(或多個(gè))連續(xù)信號(hào)分段的信號(hào)分量參數(shù)的內(nèi)插信號(hào)分量參數(shù),可以得到聽起來更加自然的合成音頻信號(hào)。
本發(fā)明的另外一個(gè)實(shí)施例的特征在于跟蹤裝置內(nèi)包含預(yù)選裝置,用于從所有可能的鏈接信號(hào)分量當(dāng)中選擇有限數(shù)量的候選鏈接信號(hào)分量。
通過在真正選擇鏈接信號(hào)分量之前進(jìn)行預(yù)選,可以使得所要求的計(jì)算資源大大地減少。
本發(fā)明的另外一個(gè)實(shí)施例的特征在于設(shè)計(jì)預(yù)選裝置去選擇那些頻率偏差小于預(yù)定值的信號(hào)分量做為候選的鏈接信號(hào)分量。
一種預(yù)選候選信號(hào)分量的適當(dāng)方法是選擇頻率偏差相對(duì)較小的候選信號(hào)分量。被允許的頻率偏差是在質(zhì)量和計(jì)算復(fù)雜度之間的折衷。然而可以觀察到,如果允許頻率偏差高于給定值,則重構(gòu)語(yǔ)音信號(hào)的質(zhì)量幾乎不會(huì)得到改善。
本發(fā)明的另外一個(gè)實(shí)施例的特征在于設(shè)計(jì)跟蹤裝置以便在已經(jīng)確定的鏈接信號(hào)分量參數(shù)的基礎(chǔ)上擴(kuò)展跟蹤。
由于免除了對(duì)大量候選信號(hào)分量要進(jìn)行的處理,所以通過外推方式來擴(kuò)展當(dāng)前跟蹤會(huì)大大降低跟蹤判定裝置的復(fù)雜度。
下面將參考附圖來解釋本發(fā)明。
圖1給出其中可應(yīng)用本發(fā)明的傳輸系統(tǒng);圖2給出根據(jù)本發(fā)明、用于依照?qǐng)D1中的傳輸系統(tǒng)內(nèi)的編碼器第一實(shí)施例;圖3給出根據(jù)本發(fā)明、用于依照?qǐng)D1中的傳輸系統(tǒng)內(nèi)的編碼器第二實(shí)施例;圖4給出依照?qǐng)D3中的編碼器內(nèi)的跟蹤模塊44可能的實(shí)施方案。
在根據(jù)圖1的傳輸系統(tǒng)內(nèi),要被傳輸?shù)囊纛l信號(hào)被加到發(fā)射機(jī)2內(nèi)的編碼器4。編碼器4對(duì)輸入信號(hào)進(jìn)行編碼,形成對(duì)被鏈接信號(hào)分量的跟蹤。該跟蹤可以這樣表示第一個(gè)信號(hào)分段的起始頻率、起始幅度以及起始相位,隨后是跟蹤中下一個(gè)分段的頻率和幅度差值。
表示該跟蹤的信號(hào)被加到發(fā)射裝置6。發(fā)射裝置6的操作可以包括信道編碼、交織和調(diào)制。發(fā)射機(jī)2的輸出通過傳輸媒介(或記錄媒介)8被發(fā)送到接收機(jī)10。在接收機(jī)10內(nèi),接收信號(hào)被送到接收裝置12。接收裝置10的操作可以包括解調(diào)、去交織和信道解碼。接收裝置12的輸出與解碼器14的輸入相連,該解碼器被設(shè)計(jì)對(duì)編碼的音頻信號(hào)進(jìn)行解碼。解碼器14的操作原理在上面提到的美國(guó)專利內(nèi)有描述。
在根據(jù)圖2的編碼器4中,輸入信號(hào)被加到分割裝置20,后者把輸入信號(hào)分割成為擁有從5-50ms范圍內(nèi)的固定或與信號(hào)有關(guān)的長(zhǎng)度的信號(hào)分段。這些分段可以是部分相互重疊的,但也可能沒有重疊。分割裝置20選擇部分信號(hào),其中包含做為頻譜分析裝置22輸入的數(shù)據(jù)以及做為閉環(huán)跟蹤塊44輸入的數(shù)據(jù)。通過在各自的單元中進(jìn)行開窗口來得到任一單元內(nèi)的適當(dāng)數(shù)據(jù)。分割裝置20還生成時(shí)間標(biāo)記Tk,用于標(biāo)記當(dāng)前信號(hào)分段內(nèi)與要被基于當(dāng)前信號(hào)分段計(jì)算的瞬時(shí)跟蹤參數(shù)相對(duì)應(yīng)的時(shí)刻,Tk-1對(duì)應(yīng)于當(dāng)前分段內(nèi)前一次迭代過程中已經(jīng)計(jì)算的瞬時(shí)跟蹤參數(shù)的時(shí)刻。在第k個(gè)分段內(nèi)經(jīng)過閉環(huán)跟蹤之后得到的參數(shù)由下標(biāo)k來表示,例如Ak。分割裝置20的輸出與頻譜分析儀22的輸入以及減法器36的第一輸入相連。
頻譜分析儀22對(duì)其輸入信號(hào)頻譜進(jìn)行粗略判定。該頻譜構(gòu)成一個(gè)用于確定被鏈接信號(hào)分量的基礎(chǔ)。這種由頻譜分析儀22來完成的粗略搜索可以基于中等尺寸的FFT,然后選擇振幅譜中的主要峰值。頻譜分析儀22的輸出信號(hào)被傳送到分量標(biāo)識(shí)裝置24,其中執(zhí)行對(duì)信號(hào)分量參數(shù)的精確搜索。這種精確搜索可以在頻譜分析儀22所確定的主要峰值附近進(jìn)行,從而獲得更加準(zhǔn)確的參數(shù)(幅度、頻率以及相位)估計(jì)。不同信號(hào)分量的幅度和頻率的起始值可以通過振幅譜內(nèi)的對(duì)應(yīng)峰值的幅度和頻率來確定。
分量標(biāo)識(shí)裝置24的輸出信號(hào)被送到跟蹤裝置28的第一輸入,以及送到延時(shí)單元26(有一幀時(shí)段的時(shí)延)。延時(shí)單元26的輸出被連接到跟蹤裝置28的第二輸入。在開始時(shí),跟蹤裝置28確定有限數(shù)量的候選鏈接分量。選擇有限數(shù)量的候選鏈接分量可以在幅度和頻率差值的基礎(chǔ)上進(jìn)行。對(duì)于前一幀內(nèi)的每一個(gè)信號(hào)分量來說,當(dāng)前幀內(nèi)所有幅度和頻率差值小于預(yù)定門限值的分量都被添加到候選鏈接分量表中??梢愿鶕?jù)可用的幅度和頻率數(shù)據(jù),以及另外根據(jù)更新速率(即1/Tk-Tk-1)來設(shè)定門限值。因此可以得到包含多個(gè)組且每個(gè)組內(nèi)包含兩個(gè)被鏈接信號(hào)分量的表。這種表的實(shí)例隨后給出。
f1,k=149 f2,k=220 f3,k=289 f4,k=361 f5,k428 f6,k=500 f7,k=579f1,k-1=131 xxf2,k-1=255 xx xxf3,k-1=380 xx xf4,k-1=495 x x Xf5,k-1=594 x X每一組內(nèi)信號(hào)分量的幅度與頻率都被加到合成器32,用于根據(jù)被鏈接的信號(hào)分量生成合成音頻信號(hào)。
可以通過在幀邊界之間對(duì)頻率和幅度進(jìn)行線性內(nèi)插來計(jì)算合成音頻信號(hào)Ci,j(鏈接第k-1幀內(nèi)的第i個(gè)分量與第k幀內(nèi)的第j個(gè)分量)。對(duì)應(yīng)一個(gè)跟蹤i,j的合成信號(hào)可以根據(jù)下式來計(jì)算ci,j=M[n]·cos(β2(n-Tk-1)2+θi,k-1(n-Tk-1)+φ);Tk-1≤n≤Tk------(1)]]>在式(1)內(nèi),M[n]由下式給出M[n]=Tk-nTk-Tk-1Ai,k-1+n-Tk-1Tk-Tk-1Aj,k;Tk-1≤n≤Tk------(2)]]>以及β等于β=θj,k-1-θi,kTk-Tk-1--------(3)]]>其中θ=2πf/fs。相位φ可以被設(shè)為φi,k-1,表示前一幀末尾的相位。相位φ也可以通過導(dǎo)致最小誤差測(cè)量的相位值φi,k得到。
上述合成器的另外一個(gè)方案可以是例如公知的重疊相加合成器。
合成器32的輸出連接到減法器36的第二輸入。減法器36判定分割裝置20的輸出信號(hào)與合成器32的輸出信號(hào)之間的差值。減法器36的輸出被連接到MSE單元34的輸入。該MSE單元34判定一幀內(nèi)減法器36輸出信號(hào)的均方值。或者在MSE單元34內(nèi)可以包括加權(quán)濾波器,用于對(duì)前一次判定的均方值進(jìn)行感性加權(quán)。MSE單元34的輸出被連接到跟蹤裝置28的第三輸入。
跟蹤裝置28利用MSE單元34的輸出信號(hào)去判定哪一組鏈接信號(hào)分量的組合可以使得MSE單元34的輸出信號(hào)達(dá)到最小。這可以通過對(duì)所有可能的鏈接組合進(jìn)行全面合成來實(shí)現(xiàn),但是也可能執(zhí)行次優(yōu)的搜索,后者所需要的計(jì)算資源會(huì)大大地減小。在次優(yōu)搜索過程中,僅對(duì)一個(gè)分量進(jìn)行合成,并且計(jì)算輸入信號(hào)與該合成分量之間的均方誤差。對(duì)于所有可能的跟蹤都這樣做,并且構(gòu)造所謂的誤差矩陣。在這個(gè)矩陣中,所有可能的跟蹤都與其對(duì)應(yīng)的誤差一起被標(biāo)識(shí)。下面給出這種矩陣的一個(gè)實(shí)例。
f1,k=149 f2,k=220 f3,k=289 f4,k=361 f5,k=428 f6,k=500 f7,k=579f1,k-1=131 52876 62929f2,k-1=255 76778 90541 55049 69752f3,k-1=380 80849 8981663016f4,k-1=49570948 74605 69535f5,k-1=594 73881 70260在該矩陣中只包括對(duì)應(yīng)于預(yù)選鏈接的分量的誤差。
盡管上述實(shí)例中給出了所有鏈接,但是仍然可能省略那些導(dǎo)致誤差增加而非減少的鏈接。當(dāng)決定了可能的鏈接之后,情況必須是這樣的,即當(dāng)前幀內(nèi)信號(hào)分量在前一幀內(nèi)只有單個(gè)的對(duì)應(yīng)分量,而且前一幀的信號(hào)分量在當(dāng)前幀內(nèi)也只有單個(gè)的對(duì)應(yīng)分量。在上述矩陣中,這就意味著行和列內(nèi)不會(huì)有多個(gè)項(xiàng)。
一種可能的搜索最終結(jié)果的次優(yōu)方法是首先選擇每一列內(nèi)誤差最小的元素,然后選擇每一行內(nèi)誤差最小的元素。選擇列中的單一元素之后,矩陣變化為f1,k=149 f2,k=220 f3,k=289 f4,k=361 f5,k=428 f6,k=500 f7,k=579f1,k-1=131 52876 62929f2,k-1=255 55049 69752f3,k-1=38063016f4,k-1=495 69535f5,k-1=594 73881隨后選擇行內(nèi)的單一元素,得到最終的鏈接矩陣。
f1,k=149 f2,k=220 f3,k=289 f4,k=361 f5,k=428 f6,k=500 f7,k=579f1,k-1=131 52876f2,k-1=255 55049f3,k-1=380 63016f4,k-1=49569535f5,k-1=594 73881也可以先選擇每一行內(nèi)誤差最小的元素,然后選擇每一列內(nèi)誤差最小的元素。還可以嘗試這兩種選擇方法,然后選擇那種能夠?qū)е戮秸`差(=所有矩陣元素之和)最小的選擇方法的結(jié)果。
在過程的最后,能夠得到要被繼續(xù)的跟蹤。前一幀內(nèi)沒有被鏈接的信號(hào)分量可以是跟蹤終點(diǎn)或獨(dú)立點(diǎn)。當(dāng)前幀內(nèi)沒有被鏈接的分量可以是新出現(xiàn)的跟蹤或獨(dú)立點(diǎn)。在要被傳輸?shù)男盘?hào)中包括獨(dú)立點(diǎn)的參數(shù)可以基于例如屏蔽門限值的主觀測(cè)量,或者基于例如減小誤差的客觀測(cè)量,或者聯(lián)合使用兩種方法。由于包括這些獨(dú)立分量也對(duì)比特率有影響,所以在這一過程中也要考慮比特預(yù)算。
在選擇裝置已經(jīng)選定要被發(fā)送的被鏈接信號(hào)分量以及獨(dú)立點(diǎn)之后,表示鏈接分量跟蹤的信號(hào)被加到復(fù)用器30中,后者把它們組成適于傳輸?shù)膹?fù)用信號(hào)。
在根據(jù)圖3的編碼器4中,分割單元20(其功能前面已經(jīng)描述)選擇部分信號(hào),其中包含做為頻譜分析裝置22輸入的數(shù)據(jù)以及做為閉環(huán)跟蹤模塊44輸入的數(shù)據(jù)。通過在各自的單元中進(jìn)行開窗口來得到任一單元內(nèi)的適當(dāng)數(shù)據(jù)。
存儲(chǔ)器單元32保存來自前一分段k-1的相關(guān)信息描述??刂茊卧?0利用從存儲(chǔ)器單元32接收到的輸入信號(hào)以及可能從頻譜分析裝置22接收的輸入,去估計(jì)跟蹤繼續(xù)參數(shù)。繼續(xù)數(shù)據(jù)包括有關(guān)哪一個(gè)跟蹤應(yīng)該被繼續(xù)以及那些不應(yīng)該被繼續(xù)的信息。對(duì)于每一個(gè)要被繼續(xù)的跟蹤來說,要提供至少一個(gè)將要繼續(xù)的頻率位置的估計(jì)。
控制單元40的輸出與當(dāng)前輸入分段一起做為閉環(huán)跟蹤模塊44的輸入。閉環(huán)跟蹤模塊44的輸出由繼續(xù)跟蹤和新出現(xiàn)跟蹤的跟蹤數(shù)據(jù)(圖3內(nèi)使用TD標(biāo)識(shí))組成。圖3中跟蹤模塊44的輸出FD中除了包括跟蹤數(shù)據(jù)TD之外,還包括有輔助信息。輔助信息內(nèi)包含完成本地合成所必要的信息,并且還可能包括附加信息(例如得到的誤差減小)。
跟蹤數(shù)據(jù)TD被送到復(fù)用器30,其中對(duì)信息進(jìn)行組合,形成適合于傳輸?shù)膹?fù)用信號(hào)。
控制單元40的其中一個(gè)任務(wù)就是決定在當(dāng)前分段內(nèi)是否有跟蹤要被繼續(xù)。該判定是在包括輔助信息的可用跟蹤信息的基礎(chǔ)上進(jìn)行的。另外一個(gè)任務(wù)是為每一個(gè)被繼續(xù)的跟蹤計(jì)算Tk時(shí)刻的一個(gè)或者多個(gè)初始頻率估計(jì)。這種計(jì)算可以在各種復(fù)雜度級(jí)別上進(jìn)行,從零階外推開始(只要求Tk-1時(shí)刻的頻率信息)一直到更高階的預(yù)測(cè)(使用Ti(i<k-1)時(shí)刻的頻率信息)。在此計(jì)算過程中,可以利用頻譜分析裝置22輸出的可用附加信息。
圖4中給出了跟蹤模塊44的一種可能的實(shí)施方案??刂茊卧?0以及分割單元20的輸出做為繼續(xù)跟蹤裝置50的輸入。繼續(xù)跟蹤裝置進(jìn)行搜索過程,使其能夠傳遞與連續(xù)跟蹤相對(duì)應(yīng)的最佳參數(shù)以及輔助信息。利用這一點(diǎn),可以由合成器52對(duì)信號(hào)進(jìn)行合成。合成器52的輸出與分割單元20的輸出一起以及可能還有控制單元40的輸出都可以被新出現(xiàn)分量的跟蹤裝置54所利用,去傳遞用于新出現(xiàn)跟蹤的最佳參數(shù)和輔助信息。跟蹤裝置50和54的輸出都被用于分離器56,進(jìn)行跟蹤數(shù)據(jù)(TD)和反饋數(shù)據(jù)(FD)的傳遞。
繼續(xù)跟蹤裝置50實(shí)施搜索過程,以便傳遞Tk時(shí)刻的頻率θm的改善估計(jì)連同最佳幅度Am和相位φm,以及輔助信息。搜索本身基于加權(quán)平方誤差最小化,可以表達(dá)如下E=Σnwk(n)·[x(n)-s(n)]2---------(4)]]>其中wk是第k個(gè)分段的加權(quán)函數(shù),x[n]是輸入分段,s[n]是合成分段,n表示加權(quán)函數(shù)所定義的間隔。在分段長(zhǎng)度和標(biāo)記符Tk-Tk-1的基礎(chǔ)上生成加權(quán)函數(shù)。令s(n)根據(jù)下式表示合成信號(hào)s(n)=Σm=1v(Tk-1)am(n)cos(φm(n))+bm(n)sin(φm(n))-----(5)]]>在公式(5)中,v是當(dāng)前幀內(nèi)繼續(xù)跟蹤的個(gè)數(shù),式(7)中的系數(shù)am(n)、bm(n)和φm(n)由下列公式計(jì)算am(n)=am(Tk-1)+{am(Tk)-am(Tk-1)}n-Tk-1Tk-Tk-1---(6)]]>bm(n)=bm(Tk)n-Tk-1Tk-Tk-1-------(7)]]>θm(n)=θm(Tk-1)+{θm(Tk)-θm(Tk-1)}n-Tk-1Tk-Tk-1--(8)]]>φm(n)=φm(Tk-1)+Σ1=Tk=1n-1θ(1)-----(9)]]>φm(Tk-1)=φm(Tk-1) (10)am(Tk-1)=Am(Tk-1) (11)這樣公式(6)的最小值可以表達(dá)如下minEθm(Tk),am(Tk),bm(Tk) (12)其中根據(jù)1≤m≤v(Tk-1),對(duì)所有m取最小值。然而值得注意的是,在s(n)中am(Tk)和bm(Tk)都是以線性方式出現(xiàn)的。這意味著根據(jù)給定的最小化準(zhǔn)則,它們的最佳值就是一組常規(guī)方程的解,因此可以簡(jiǎn)化搜索過程,并且把問題簡(jiǎn)化成為對(duì)θm(Tk)進(jìn)行最小化。
利用(7)到(12),(4)可以被重新寫為E=Σnwk(n)·[x(n)-Σm=1v(Tk-1)am(Tk-1)(1-n-Tk-1Tk-Tk-1)cos(φm(n))---(13)]]>-Σm=1v(Tk-1)am(Tk)(n-Tk-1Tk-Tk-1)cos(φm(n))-Σm=1v(Tk-1)bm(Tk)(n-Tk-1Tk-Tk-1)sin(φm(n))]2]]>搜索過程的每一次迭代都是從選擇θm(Tk)值并計(jì)算am(Tk)和bm(Tk)的最佳對(duì)應(yīng)值開始的。為了計(jì)算am(Tk)和bm(Tk)值,需要進(jìn)行如下的替換x~(n)=x(n)-Σm=1v(Tk-1)am(Tk-1)(1-n-Tk-1Tk-Tk-1)cos(φm(n))----(14)]]>p2m-1(n)=n-Tk-1Tk-Tk-1cos(φm(n))-----(15)]]>p2m(n)=n-Tk-1Tk-Tk-1sin(φm(n))-----------(16)]]>c2m-1=am(Tk) (17)c2m=bm(Tk) (18)把(15)-(19)代入到(14)當(dāng)中,得到如下要被最小化的準(zhǔn)則E=Σnwk(n)·[x-(n)-Σm=12v(Tk-1)cm·pm(n)]2-------(19)]]>使公式(19)對(duì)每一個(gè)值cm進(jìn)行微分,并且令導(dǎo)數(shù)為零,可以求得E的最小值。這會(huì)得到下列一組方程,根據(jù)這些方程必須確定常量c1,c2,…,c2v-1,c2v。Σnwk(n)·x~(n)·p1(n)-Σnwk(n)·Σm=12v(Tk-1)cm·pm(n)·p1(n)=0]]>Σnwk(n)·x~(n)·p2(n)-Σnwk(n)·Σm=12v(Tk-1)cm·pm(n)·p2(n)=0]]> (20)Σnwk(n)·x-(n)·p2v-1(n)-Σnwk(n)·Σm=12v(Tk-1)cm·pm(n)·p2v-1(n)=0]]>Σnwk(n)·x~(n)·p2v(n)-Σnwk(n)·Σm=12v(Tk-1)cm·pm(n)·p2v(n)=0]]>根據(jù)d--Ac-=0-]]>,把(21)寫成矩陣形式,其中 、A、 等于 (21)A= (22) (23)現(xiàn)在可以根據(jù)下式來計(jì)算 c-=A-1·d----------(24)]]>最佳化過程可以對(duì)所有跟蹤同時(shí)進(jìn)行,也可以逐條跟蹤的進(jìn)行。在后一種情況中,最優(yōu)化塊可以根據(jù)一定的順序來進(jìn)行判定。這種判定可以是例如根據(jù)在Am中所表達(dá)的前一次強(qiáng)度來進(jìn)行。可以使用常規(guī)技術(shù)來終止該搜索過程。根據(jù)Tk時(shí)刻的am、bm以及φm可以根據(jù)下式計(jì)算Tk時(shí)刻的Am值和φm值A(chǔ)m=am2+bm2]]>φm=φm-ψm(25)其中ψm對(duì)應(yīng)復(fù)數(shù)am+jbm的幅角。
新出現(xiàn)分量跟蹤裝置54在功能上類似繼續(xù)跟蹤裝置50。它們的不同之處在于新出現(xiàn)分量跟蹤裝置54識(shí)別的是新出現(xiàn)的跟蹤,而不是繼續(xù)跟蹤。因此,根據(jù)迄今合成的分段、s[n]以及輸入分段x[n],可以得到誤差最小的目標(biāo)信號(hào)。在最簡(jiǎn)單的形式中,這可以通過從x中減去s的方法得到。此外,Tk時(shí)刻的幅度Am與相位φm都被設(shè)定為零。在新出現(xiàn)跟蹤期間,必須要基于當(dāng)前分段中的頻率或相位的跟蹤來進(jìn)行假設(shè)。在初始階段假設(shè)頻率保持不變是合理的。這樣以最簡(jiǎn)單的形式,可以根據(jù)不變的頻率跟蹤來設(shè)定Tk-1時(shí)刻的頻率值θm。
可以看到本發(fā)明可以以專用硬件形式、DSP上運(yùn)行的軟件形式或者通用計(jì)算機(jī)的形式來實(shí)施。本發(fā)明可以被包含在有形媒介中(例如CD-ROM或者DVD-ROM)來實(shí)施,后者承載用于執(zhí)行根據(jù)本發(fā)明的編碼方法的計(jì)算機(jī)程序。本發(fā)明還可以具體化成在數(shù)據(jù)網(wǎng)(例如互聯(lián)網(wǎng))中傳輸?shù)男盘?hào),或者通過廣播服務(wù)發(fā)送的信號(hào)。
權(quán)利要求
1.一種傳輸系統(tǒng),其中包含帶有音頻編碼器的發(fā)射機(jī),該音頻編碼器包括用于把輸入的音頻信號(hào)劃分為連續(xù)信號(hào)分段的分割裝置,該編碼器還包含用于確定連續(xù)信號(hào)分段內(nèi)出現(xiàn)的鏈接信號(hào)分量的跟蹤判定裝置,發(fā)射機(jī)還包括發(fā)射裝置用于通過傳輸媒介向接收機(jī)發(fā)送代表該被鏈接信號(hào)分量的信號(hào),該接收機(jī)包括用于從傳輸媒介中接收代表信號(hào)分量的信號(hào)的接收裝置,以及用于從該代表信號(hào)分量的信號(hào)中得到重構(gòu)的音頻信號(hào)的解碼器,該傳輸系統(tǒng)的特征在于跟蹤裝置內(nèi)包括選擇裝置,用于選擇被鏈接信號(hào)分量,使得在該被鏈接信號(hào)分量基礎(chǔ)上判定到的合成音頻信號(hào)與該輸入音頻信號(hào)之間的誤差測(cè)量達(dá)到最小。
2.權(quán)利要求1中的傳輸系統(tǒng),其特征在于編碼器中包含合成裝置,用于在連續(xù)兩個(gè)信號(hào)分段內(nèi),基于至少其中一個(gè)該候選鏈接信號(hào)分量的參數(shù)得到合成信號(hào)。
3.權(quán)利要求2中的傳輸系統(tǒng),其特征在于設(shè)計(jì)合成裝置以便根據(jù)對(duì)應(yīng)于至少兩個(gè)連續(xù)信號(hào)分段的信號(hào)分量參數(shù)得到內(nèi)插信號(hào)分量參數(shù),以及在該內(nèi)插信號(hào)分量參數(shù)的基礎(chǔ)上得到合成信號(hào)。
4.權(quán)利要求1、2或3中的傳輸系統(tǒng),其特征在于跟蹤裝置內(nèi)包含預(yù)選裝置,用于從所有可能的鏈接信號(hào)分量當(dāng)中選擇有限數(shù)量的候選鏈接信號(hào)分量。
5.權(quán)利要求4中的傳輸系統(tǒng),其特征在于設(shè)計(jì)預(yù)選裝置去選擇那些頻率偏差小于預(yù)定值的信號(hào)分量做為候選的鏈接信號(hào)分量。
6.權(quán)利要求1中的傳輸系統(tǒng),其特征在于設(shè)計(jì)跟蹤裝置以便在已經(jīng)確定的鏈接信號(hào)分量參數(shù)的基礎(chǔ)上擴(kuò)展跟蹤。
7.權(quán)利要求6中的傳輸系統(tǒng),其特征在于設(shè)計(jì)跟蹤裝置以便在對(duì)一個(gè)跟蹤合成的基礎(chǔ)上確定被鏈接的信號(hào)分量。
8.包含音頻編碼器的發(fā)射機(jī),該音頻編碼器包括用于把輸入的音頻信號(hào)劃分為連續(xù)信號(hào)分段的分割裝置,該編碼器還包含用于確定連續(xù)信號(hào)分段內(nèi)出現(xiàn)的鏈接信號(hào)分量的跟蹤判定裝置,發(fā)射機(jī)還包括發(fā)射裝置用于發(fā)射代表該被鏈接信號(hào)分量的信號(hào),其特征在于跟蹤裝置內(nèi)包括選擇裝置,用于選擇被鏈接信號(hào)分量,使得在該被鏈接信號(hào)分量的基礎(chǔ)上判定的合成音頻信號(hào)與該輸入音頻信號(hào)之間的誤差測(cè)量達(dá)到最小。
9.權(quán)利要求8中的發(fā)射機(jī),其特征在于編碼器中包含合成裝置,用于在連續(xù)兩個(gè)信號(hào)分段內(nèi),基于至少其中一個(gè)該候選鏈接信號(hào)分量的參數(shù)得到合成信號(hào)。
10.權(quán)利要求9中的發(fā)射機(jī),其特征在于合成裝置包括加權(quán)裝置,用于根據(jù)對(duì)應(yīng)加權(quán)函數(shù)對(duì)連續(xù)兩個(gè)信號(hào)分段內(nèi)的信號(hào)分量進(jìn)行加權(quán),以及該合成裝置還包括用于把加權(quán)信號(hào)分段組合成為合成音頻信號(hào)的組合裝置。
11.權(quán)利要求8、9或10中的發(fā)射機(jī),其特征在于跟蹤裝置內(nèi)包含預(yù)選裝置,用于從所有可能的鏈接信號(hào)分量當(dāng)中選擇有限數(shù)量的候選鏈接信號(hào)分量。
12.權(quán)利要求8中的發(fā)射機(jī),其特征在于設(shè)計(jì)跟蹤裝置以便在已經(jīng)確定的鏈接信號(hào)分量參數(shù)的基礎(chǔ)上擴(kuò)展跟蹤。
13.一種音頻編碼器,包括用于把輸入音頻信號(hào)劃分為連續(xù)信號(hào)分段的分割裝置,該編碼器還包含用于確定連續(xù)信號(hào)分段內(nèi)出現(xiàn)的鏈接信號(hào)分量的跟蹤判定裝置,發(fā)射機(jī)還包括發(fā)射裝置用于發(fā)射代表該被鏈接信號(hào)分量的信號(hào),其特征在于跟蹤裝置內(nèi)包括選擇裝置,用于選擇被鏈接信號(hào)分量,使得在該被鏈接信號(hào)分量基礎(chǔ)上判定的合成音頻信號(hào)與該輸入音頻信號(hào)之間的誤差測(cè)量達(dá)到最小。
14.一種編碼方法,包括把輸入音頻信號(hào)分割成為連續(xù)信號(hào)分段,確定出現(xiàn)在連續(xù)信號(hào)分段之內(nèi)的鏈接信號(hào)分量,發(fā)射表示該被鏈接信號(hào)分量的信號(hào),其特征在于,該方法內(nèi)包括選擇被鏈接信號(hào)分量,使得在該被鏈接信號(hào)分量基礎(chǔ)上判定的合成音頻信號(hào)與該輸入音頻信號(hào)之間的誤差測(cè)量達(dá)到最小。
15.包括用于執(zhí)行根據(jù)權(quán)利要求13的編碼方法的計(jì)算機(jī)程序的有形媒介。
16.承載用于執(zhí)行根據(jù)權(quán)利要求13的編碼方法的計(jì)算機(jī)程序的信號(hào)。
全文摘要
在傳輸系統(tǒng)內(nèi),音頻信號(hào)由編碼器(4)進(jìn)行編碼,并且由發(fā)射裝置(6)通過媒介(8)發(fā)送到接收機(jī)(10)。在音頻編碼器(4)中,音頻分段由多個(gè)正弦信號(hào)來表示,其中每一個(gè)正弦信號(hào)都擁有自己的頻率和幅度。為了把音頻分段鏈接在一起,鏈接連續(xù)分段中的正弦信號(hào)是有利的。分段鏈接過程中的問題是發(fā)現(xiàn)哪一個(gè)正弦信號(hào)應(yīng)該被鏈接。現(xiàn)有技術(shù)中,是在信號(hào)分量的頻率差值(最近頻率相鄰準(zhǔn)則)基礎(chǔ)上鏈接信號(hào)分量。根據(jù)本發(fā)明,采用分析-合成方法來進(jìn)行鏈接。為了減小搜索的復(fù)雜性,最好進(jìn)行預(yù)選。這種預(yù)選可以在最近頻率相鄰準(zhǔn)則的基礎(chǔ)上進(jìn)行。
文檔編號(hào)G10L19/02GK1320257SQ00801732
公開日2001年10月31日 申請(qǐng)日期2000年6月8日 優(yōu)先權(quán)日1999年6月18日
發(fā)明者R·陶里, R·J·斯盧伊特爾, A·C·登布林克爾 申請(qǐng)人:皇家菲利浦電子有限公司