專利名稱:可擴展編碼裝置和可擴展編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對立體聲信號實施編碼的可擴展編碼裝置和可擴展編碼方法。
背景技術(shù):
正如通過移動電話進行通話那樣,目前移動通信系統(tǒng)中的語音通信以單 聲道方式進行的通信(單聲道通信)為主流。但是,今后如第四代移動通信 系統(tǒng)那樣,如果傳輸速率的更高比特速率化繼續(xù)推進,則能夠確保用于傳輸 多個聲道的頻帶,從而可期待在語音通信中立體聲方式的通信(立體聲通信) 也將變得普及。例如,將音樂存儲于搭載了 HDD(硬盤)的便攜式音頻播放器,并在該播 放器安裝立體聲用的耳機或頭戴式耳機等來欣賞立體聲音樂的用戶越來越 多,考慮到該現(xiàn)狀可以預(yù)測,今后將移動電話與音樂播放器相結(jié)合,在使用 立體聲用的耳機或頭戴式耳機等裝備的同時,進行立體聲方式的語音通信的 生活方式將廣為普及。此外,在最近日漸普及的電視會議等環(huán)境中,為了可 進行富有臨場感的會話,預(yù)計也將要進行立體聲通信。另一方面,在移動通信系統(tǒng)和有線方式的通信系統(tǒng)等中,為了減輕系統(tǒng) 的負荷, 一般進行通過對所傳輸?shù)恼Z音信號預(yù)先進行編碼來謀求傳輸信息的 低比特速率化。因此,最近對立體聲語音信號進行編碼的技術(shù)備受矚目。例 如,已存在使用cross-channel prediction來提高預(yù)測殘差信號的編碼效率的編 碼技術(shù)(參照非專利文獻1),該預(yù)測殘差信號為立體聲語音信號的CELP編碼 的被加權(quán)的信號。此外,可以預(yù)測,即使普及了立體聲通信,依然要進行單聲道通信。原 因是,單聲道通信是低比特速率所以可以期待降低通信成本,此外,因為僅 對應(yīng)單聲道通信的移動電話的電路規(guī)模變小所以價格低廉,不需要高質(zhì)量語 音通信的用戶可能購買僅對應(yīng)單聲道通信的移動電話。因此,在一個通信系 統(tǒng)中,混合存在對應(yīng)立體聲通信的移動電話和對應(yīng)單聲道通信的移動電話,
從而通信系統(tǒng)有必要對應(yīng)立體聲通信以及單聲道通信。進而,在移動通信系 統(tǒng)中通過無線信號進行通信數(shù)據(jù)的交換,所以有時由于傳播路徑環(huán)境而使一 部分通信數(shù)據(jù)丟失。因此,如果移動電話具有即使丟失一部分的通信數(shù)據(jù)也 能夠從剩余的接收數(shù)據(jù)恢復(fù)原來的通信數(shù)據(jù)的功能,將非常有用。作為能夠應(yīng)對立體聲通信以及單聲道通信,而且即使丟失一部分的通信 數(shù)據(jù),也能夠從剩余的接收數(shù)據(jù)恢復(fù)原來的通信數(shù)據(jù)的功能,有由立體聲信 號和單聲道信號構(gòu)成的可擴展編碼。作為具有該功能的可擴展編碼裝置的例子,例如有非專利文獻2所公開的裝置。非專利文獻1Ramprashad, S. A.、 "Stereophonic CELP coding using cross channel prediction"、 Proc. IEEE Workshop on Speech Coding、 Pages: 136 — 138、 (17-20 Sept. 2000)[非專利文獻2] ISO/IEC 14496-3:1999 (B.14 Scalable AAC with core coder)
發(fā)明內(nèi)容
發(fā)明要解決的問題但是,在非專利文獻1所公開的技術(shù)中,對兩個聲道的語音信號分別單 獨具有自適應(yīng)代碼本和固定代碼本等,對各個聲道產(chǎn)生各自的驅(qū)動音源信號,并生成合成信號。也就是說,對各個聲道進行語音信號的CELP編碼,并將 獲得的各個聲道的編碼信息輸出到解碼端。因此存在以下問題,生成相當(dāng)于 聲道數(shù)的數(shù)量的編碼參數(shù),增大了編碼率,同時編碼裝置的電路規(guī)模也變大。 如果減少自適應(yīng)代碼本和固定代碼本等的個數(shù),雖然能夠降低編碼率并能夠 削減電路規(guī)模,但是反而會帶給解碼信號大的音質(zhì)惡化。這是即使是非專利 文獻2所公開的可擴展編碼裝置也同樣產(chǎn)生的問題。因此,本發(fā)明的目的在于提供一種能夠防止解碼信號的音質(zhì)惡化,同時 能夠削減編碼率,并能夠削減電路規(guī)模的可擴展編碼裝置和可擴展編碼方法。解決該問題的方案本發(fā)明的可擴展編碼裝置釆用以下結(jié)構(gòu),包括單聲道信號生成單元, 使用用于構(gòu)成立體聲信號的多個聲道信號來生成單聲道信號;第一編碼單元, 對所述單聲道信號進行編碼而生成音源參數(shù);單聲道相似信號生成單元,使 用所述聲道信號和所述單聲道信號來生成第一單聲道相似信號;合成單元,
使用所述音源參數(shù)和所述第一單聲道相似信號來生成合成信號;以及第二編 碼單元,使用所述合成信號和所述第一單聲道相似信號來生成失真最小化參數(shù)。發(fā)明有益效果根據(jù)本發(fā)明,能夠防止解碼信號的音質(zhì)惡化,同時能夠削減編碼率,并 能夠削減編碼裝置的電路規(guī)模。
圖1是表示實施方式1的可擴展編碼裝置的主要結(jié)構(gòu)的方框圖; 圖2是表示實施方式1的單聲道信號生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖3是表示實施方式1的單聲道信號編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖4是表示實施方式1的第二層編碼器內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖5是表示實施方式1的第一變換單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖6是表示對來自同一發(fā)生源的信號在不同的位置所獲得的信號的波形 頻譜的一例的圖;圖7是表示實施方式1的音源信號生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖8是表示實施方式1的失真最小化單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖9是匯總了 L聲道處理系統(tǒng)的編碼處理的概要的圖; 圖10是表示匯總了 L聲道和R聲道在第二層的編碼處理的步驟的流程圖;圖11是表示實施方式2的第二層編碼器的主要結(jié)構(gòu)的方框圖;圖12是表示實施方式2的第二變換單元內(nèi)部的主要結(jié)構(gòu)的方框圖;圖13是表示實施方式2的失真最小化單元內(nèi)部的主要結(jié)構(gòu)的方框圖;以及圖14是表示實施方式1的第二層解碼器內(nèi)部的主要結(jié)構(gòu)的方框圖;具體實施方式
以下,參照附圖詳細說明本發(fā)明的實施方式。另外,這里以對由L聲道 以及R聲道兩個聲道構(gòu)成的立體聲語音信號進行編碼的情況為例進行說明。 (實施方式1)圖l是表示本發(fā)明的實施方式l的可擴展編碼裝置的主要結(jié)構(gòu)的方框圖。
這里以使用CELP編碼作為各層的編碼方式為例進行說明。本實施方式的可擴展編碼裝置具有第一層編碼器100以及第二層編碼器150,在第一層(基本層)中進行單聲道信號的編碼,在第二層(擴展層)中進行 立體聲信號的編碼,并將在各層所獲得的編碼參數(shù)傳輸?shù)浇獯a端。更加具體的為下述處理,在第一層編碼器100中,在單聲道信號生成單 元101從所輸入的立體聲語音信號,即L聲道信號Ll以及R聲道信號Rl生 成單聲道信號Ml,在單聲道信號編碼單元102,對該信號M1進行編碼,并 獲得與聲道信息有關(guān)的編碼參數(shù)(LPC量化索引)以及與音源信息有關(guān)的編碼 參數(shù)(音源參數(shù))。在該第一層所獲得的音源參數(shù),即驅(qū)動音源在第二層中也被 使用。第二層編碼器150進行后述的第一變換而生成第一變換信號,并輸出該 第一變換所使用的第一變換系數(shù),以使L聲道信號和R聲道信號在波形上相 似于單聲道信號。此外,第二層編碼器150使用在第一層所生成的驅(qū)動音源 進行第一變換信號的LPC分析以及LPC合成。該第一變換的細節(jié)將后述。進而,第二層編碼器150對各個LPC合成信號實施第二變換,該第二變 換為使這些合成信號對第一變換信號的編碼失真成為最小的變換,并輸出在 該第二變換中所使用的第二變換系數(shù)的編碼參數(shù)。通過使用代碼本,進行各 個聲道的閉環(huán)搜索求代碼本索引,來進行該第二變換。該第二變換的細節(jié)也 將后述。這樣,通過在第一層和第二層共享驅(qū)動音源,本實施方式的可擴展編碼 裝置能夠?qū)崿F(xiàn)低比特率的編碼。此外,在第二層,進行第一變換,以使立體聲信號的L聲道信號以及R 聲道信號成為在波形上與各個單聲道信號相近似的信號,對于該第一變換后 的信號(第一變換信號),共享CELP編碼的驅(qū)動音源,且對各個聲道單獨地實 施第二變換,以使各個聲道對LPC合成信號的第一變換信號的編碼失真成為 最小。由此,能夠提高語音質(zhì)量。圖2是表示上述單聲道信號生成單元101內(nèi)部的主要結(jié)構(gòu)的方框圖。單聲道信號生成單元101從所輸入的L聲道信號Ll和R聲道信號Rl生 成具有兩種信號的中間特性的單聲道信號Ml ,并輸出到單聲道信號編碼單元 102。作為具體的例子,將L聲道信號L1和R聲道信號R1的平均設(shè)為單聲 道信號M1即可,在該情況下,如圖2所示,由加法器105求L聲道信號L1
和R聲道信號R1之和,由乘法器106將該相加信號的標(biāo)量乘以1/2,并作為 單聲道信號M1輸出。圖3是表示上述單聲道信號編碼單元102內(nèi)部的主要結(jié)構(gòu)的方框圖。單聲道信號編碼單元102包括LPC分析單元111、 LPC量化單元112、 LPC合成濾波器113、加法器114、聽覺加權(quán)單元115、失真最小化單元116、 自適應(yīng)代碼本117、乘法器118、固定代碼本119、乘法器120、增益代碼本 121以及加法器122,進行CELP編碼并輸出音源參數(shù)(自適應(yīng)代碼本索引、 固定代碼本索引和增益代碼本索引)和LPC量化索引。LPC分析單元111對單聲道信號Ml實施線性預(yù)測分析,將作為分析結(jié) 果的LPC參數(shù)輸出到LPC量化單元112以及聽覺加權(quán)單元115。 LPC量化單 元112對該LPC參數(shù)進行量化,并輸出用于確定所獲得的量化LPC參數(shù)的索 引(LPC量化索引)。該索引通常被輸出到本實施方式的可擴展編碼裝置的外 部。此外,LPC量化單元112將量化LPC參數(shù)輸出到LPC合成濾波器113。 LPC合成濾波器113使用從LPC量化單元112輸出的量化LPC參數(shù),將音源 向量作為驅(qū)動音源進行通過LPC合成濾波器的合成,該音源向量為使用后述 的自適應(yīng)代碼本117以及固定代碼本119而生成的音源向量。所獲得的合成 信號被輸出到加法器114。加法器114通過從單聲道信號M1中減去從LPC合成濾波器113輸出的 合成信號來計算誤差信號,并將該誤差信號輸出到聽覺加權(quán)單元115。該誤 差信號相當(dāng)于編碼失真。聽覺加權(quán)單元115使用基于從LPC分析單元111輸 出的LPC參數(shù)而構(gòu)成的聽覺加權(quán)濾波器,對編碼失真進行聽覺加權(quán),并將該 信號輸出到失真最小化單元116。失真最小化單元116對自適應(yīng)代碼本117、 固定代碼本119以及增益代碼本121指示要使用的索引,以使編碼失真成為 最小。自適應(yīng)代碼本117將過去生成的、送往LPC合成濾波器113的驅(qū)動音源 的音源向量存儲于內(nèi)部緩沖器,基于與從失真最小化單元116指示的索引對 應(yīng)的自適應(yīng)代碼本延遲,從該被存儲的音源向量生成相當(dāng)于一個子幀的音源 向量,并作為自適應(yīng)音源向量輸出到乘法器118。固定代碼本119將與從失真 最小化單元116指示的索引對應(yīng)的音源向量作為固定音源向量輸出到乘法器 120。增益代碼本121生成自適應(yīng)音源向量以及固定音源向量的各個增益。乘 法器118將從增益代碼本121輸出的自適應(yīng)音源增益乘以自適應(yīng)音源向量,
并輸出到加法器122。乘法器120將從增益代碼本121輸出的固定音源增益 乘以固定音源向量,并輸出到加法器122。加法器122將從乘法器118輸出 的自適應(yīng)音源向量和從乘法器120輸出的固定音源向量相加,并將相加后的 音源向量作為驅(qū)動音源輸出到LPC合成濾波器113。另外,加法器122將獲 得的驅(qū)動音源的音源向量反饋給自適應(yīng)代碼本117。如上所述,LPC合成濾波器113將從加法器122輸出的音源向量,即使 用自適應(yīng)代碼本117以及固定代碼本119所生成的音源向量作為驅(qū)動音源, 進行通過LPC合成濾波器的合成。這樣,使用由自適應(yīng)代碼本117以及固定代碼本119所生成的音源向量, 求編碼失真的一連串處理成為閉環(huán)(反饋環(huán)),失真最小化單元116對自適應(yīng) 代碼本U7、固定代碼本119以及增益代碼本121進行指示以使該編碼失真成 為最小。然后,失真最小化單元116將使編碼失真成為最小的各種音源參數(shù) 輸出。這些參數(shù)通常被輸出到本實施方式的可擴展編碼裝置的外部。圖4是表示上述第二層編碼器150內(nèi)部的主要結(jié)構(gòu)的方框圖。第二層編碼器150大致由處理立體聲語音信號的L聲道的L聲道處理系 統(tǒng)和處理立體聲語音信號的R聲道的R聲道處理系統(tǒng)構(gòu)成,兩個系統(tǒng)具有彼 此相同的結(jié)構(gòu)。因此,對兩個聲道的相互對應(yīng)的結(jié)構(gòu)賦予相同的標(biāo)號,還另 外對L聲道處理系統(tǒng)在連字符后面賦予分支號1,對R聲道處理系統(tǒng)在連字 符后面賦予分支號2。然后,僅說明L聲道處理系統(tǒng),省略對R聲道處理系 統(tǒng)的說明。另外,音源信號生成單元151為L聲道和R聲道共享。第二層編碼器150的L聲道處理系統(tǒng)包括音源信號生成單元151、第一 變換單元152-1、 LPC分析/量化單元153-1、 LPC合成濾波器154-1、第二變 換單元155-1以及失真最小化單元156-1。音源信號生成單元151使用從第一層編碼器IOO輸出的音源參數(shù)P1來生 成在L聲道以及R聲道中共享的音源信號M2。第一變換單元152-1從L聲道信號L1和單聲道信號M1中獲得表示L聲 道信號Ll和單聲道信號Ml的在波形上的特性差的第一變換系數(shù),使用該第 一變換系數(shù)對L聲道信號L1實施第一變換,并生成與單聲道信號M1相似的 第一變換信號Md。此外,第一變換單元152-1輸出確定第一變換系數(shù)的索 引Il(第一變換系數(shù)索引)。LPC分析/量化單元153-1對第一變換信號ML1實施線性預(yù)測分析,求頻 譜包絡(luò)信息的LPC參數(shù),并對該LPC參數(shù)進行量化,將所獲得的量化LPC 參數(shù)輸出到LPC合成濾波器154-1,同時輸出確定量化LPC參數(shù)的索引(LPC 量化索引)12。LPC合成濾波器154-1將從LPC分析/量化單元153-1輸出的量化LPC 參數(shù)作為濾波系數(shù),并將在音源信號生成單元151所生成的音源向量M2作 為驅(qū)動音源的濾波函數(shù),即使用LPC合成濾波器來生成L聲道的合成信號 ML2。該合成信號Mt2被輸出到第二變換單元155-1。第二變換單元155-1對合成信號ML2實施后述的第二變換,并將第二變 換信號輸出到失真最小化單元156-1。失真最小化單元156-1通過反饋信號F1來控制第二變換單元155-1中的 第二變換,以使第二變換信號Mt3的編碼失真成為最小,并輸出用于確定使 編碼失真最小的第二變換系數(shù)的索引(第二變換系數(shù)索引)D。第一變換系數(shù)索 引II、 LPC量化索引12以及第二變換系數(shù)索引13通常被輸出到本實施方式 的可擴展編碼裝置的外部。接著,更詳細地說明該第二層編碼器150內(nèi)部的各單元的動作。圖5是表示上述第一變換單元152-1內(nèi)部的主要結(jié)構(gòu)的方框圖。該第一 變換單元152-1包括分析單元131、量化單元132以及變換單元133。分析單元131通過對L聲道信號L1的波形和單聲道信號M1的波形進行 比較分析,來求表示L聲道信號Ll的波形相對于單聲道信號Ml的波形的差 的參數(shù)(波形差參數(shù))。量化單元132對該波形差參數(shù)實施量化,將所獲得的編 碼參數(shù),即第一變換系數(shù)索引Il輸出到本實施方式的可擴展編碼裝置的外部。 此外,量化單元132對第一變換系數(shù)索引II實施反量化,并將其輸出到變換 單元133。變換單元133通過從L聲道信號Ll中除去波形差參數(shù)(但是,有 時包含量化誤差),該波形差參數(shù)為從量化單元132輸出的被反量化的第一變 換系數(shù)索引,即由分析單元131所獲得的兩個聲道之間的波形差參數(shù),將L 聲道信號L1變換為與單聲道信號M1在波形上相似的信號ML1。這里,上述的波形差參數(shù)是表示L聲道信號和單聲道信號在波形上的特 性不同的參數(shù),具體而言是指,將單聲道信號設(shè)為參照信號,L聲道信號的 相對于單聲道信號的信號之間的振幅比(能量比)以^/或延遲時間差。一般地,即使是來自同一發(fā)生源的立體聲語音信號或立體聲音頻信號, 由于話筒的擺放位置,信號波形呈現(xiàn)出不同的特性。作為筒單的例子為,根
據(jù)距發(fā)生源的距離,立體聲信號的能量發(fā)生衰減,同時到達時間也發(fā)生延遲, 并由于語音的拾音位置而呈現(xiàn)出不同的波形頻譜。這樣,立體聲信號由于拾 音環(huán)境的空間因素而受到較大的影響。為了詳細地說明因該拾音環(huán)境的不同而產(chǎn)生的立體聲信號的特性,圖6 表示在不同的兩個位置對來自同一發(fā)生源的信號所獲得的信號(第一信號Wl和第二信號W2)的語音波形的一例。如該圖所示,可以看出第一信號以及第二信號分別呈現(xiàn)不同的特性。呈 現(xiàn)出該不同特性的現(xiàn)象能夠理解為,在原有的信號的波形上,加上因獲得位置而產(chǎn)生的不同的新空間特性(空間信息spatial information)后,通過話筒等 的拾音設(shè)備獲得信號的結(jié)果。在本申請中,呈現(xiàn)該特性的參數(shù)特別地稱為波 形差參數(shù)。例如,在圖6的例子中,將第1信號Wl僅延遲時長At后就成為 信號Wl,。接著,如果將信號Wl,的振幅按照一定的比例減小而能使振幅差A(yù)A消失,則因為信號wr為來自同一發(fā)生源的信號,所以理論上能夠期待與第二信號W2相一致。也就是說,通過實施對包含在語音信號或音頻信號 中的波形上的特性進行操作的處理,能夠使第 一信號以及第二信號的特性差 異消失,其結(jié)果,能夠使雙方的信號波形相似。圖5所示的第一變換單元152-1求L聲道信號Ll相對于單聲道信號Ml 的波形差參數(shù),并將它從L聲道信號L1中分離,從而獲得與單聲道信號M1 相似的第一變換信號ML1,同時還對波形差參it進行編碼。接著,使用算式詳細地說明上述的第一變換系數(shù)的具體的導(dǎo)出法。首先, 以使用兩個聲道之間的能量比以及延遲時間差作為上述波形差參數(shù)的情形為 例進行說明。分析單元131計算兩個聲道之間的以幀為單位的能量比。首先,按照下 面的式(1 )以及式(2 )求L聲道信號以及單聲道信號的一個幀內(nèi)的能量ELch 以及Em。<formula>formula see original document page 11</formula>其中,n為樣本號,F(xiàn)L為一個幀的樣本數(shù)(幀長度)。此外,(n) 以及Xm (n)分別表示L聲道信號以及單聲道信號的第n個樣本的振幅。
然后,分析單元131按照下面的式(3 )求L聲道信號以及單聲道信號的 能量比的平方根C。…(3)此外,如以下那樣,分析單元131求作為使兩個聲道的信號之間的相互相關(guān)成為最高值的延遲時間差,該延遲時間差為L聲道信號相對于單聲道信號在時間上的偏移量。具體而言,按照下面的式(4)求單聲道信號以及L聲道信號的相互相關(guān)函數(shù)①。少—)=z (") xM (" - w)"=。 ...(4)其中,將m設(shè)為取預(yù)先規(guī)定的從min一m至max—m為止的范圍的值,并 將①(m)成為最大時的m-M設(shè)為L聲道信號相對于單聲道信號的延遲時間 差。另外,上述的能量比以及延遲時間差也可以通過下面的式(5)來求。在 式(5)中,求使誤差D成為最小的能量比的平方根C以及延遲時間m,所 述誤差D為單聲道信號和對該單聲道信號除去了波形差參數(shù)的L聲道信號之 間的誤差。"=o …(5 )量化單元132以預(yù)先;^見定的比特數(shù)對上述C以及M進行量化,并將被量 化的C以及M分別設(shè)為CQ以及Mq。變換單元133按照下面的式(6)的變換式,從L聲道信號中除去L聲道信 號和單聲道信號之間的能量差以及延遲時間差。0) = ce'W"_Me) …(6 )(其中,"=0,.-.,尸丄-1 )另外,作為上述波形差參數(shù)的具體例子有以下的示例。例如,可以將兩個聲道之間的能量比以及延遲時間差這兩個參數(shù)作為波形差參數(shù)來使用。這些都是易于定量化的參數(shù)。另外,作為變化形式,也可以使用每個頻帶的傳播特性,例如相位差和振幅比等。此外,也可以不將兩個聲道之間(例如,L聲道信號和單聲道信號)的能量
比以及延遲時間差這兩個參數(shù)都設(shè)為波形差參數(shù),僅使用其中 一 方的參數(shù)作 為波形差參數(shù)。在將僅使用一個參數(shù)的情況與使用兩個參數(shù)的情形相比較, 雖然減少了提高兩個聲道的相似程度的效果,但反而有能夠進一步削減編碼 比特數(shù)的效果。例如,在僅使用兩個聲道之間的能量比作為波形差參數(shù)的情況下,使用Cq并按照下面的式(7 )進行L聲道信號的變換,該Cq為對通過上述的式(3 )求出的能量比的平方根C進行了量化的值。 0) = <^、(") …(7 )(其中,"二0,…,F(xiàn)丄-1 )例如,在僅使用兩個聲道之間的延遲時間差作為波形差參數(shù)的情況下, 使用Mq并按照下面的式(8)進行L聲道信號的變換,該Mq為對使通過上 述的式(4)求出的①(m)為最大的n^M進行了量化的值。0) = &""-^e) …(8 )(其中,"-0,…,F(xiàn)Z-l )圖7是表示上述音源信號生成單元151內(nèi)部的主要結(jié)構(gòu)的方框圖。自適應(yīng)代碼本161從自適應(yīng)代碼本索引中求對應(yīng)的自適應(yīng)代碼本滯后 (lag),該自適應(yīng)代碼本索引為從單聲道信號編碼單元102輸出的音源參數(shù) Pl中的自適應(yīng)代碼本索引,基于該自適應(yīng)代碼本滯后,從預(yù)先存儲的音源向 量生成一個子幀的音源向量,并將其作為自適應(yīng)音源向量輸出到乘法器162。固定代碼本163使用固定代碼本索引,將與該固定代碼本索引對應(yīng)的音 源向量作為固定音源向量輸出到乘法器164,該固定代碼本索引為從單聲道 信號編碼單元102輸出的音源參數(shù)P1中的固定代碼本索引。增益代碼本165使用增益代碼本索引,生成上述自適應(yīng)音源向量以及固 定音源向量的各個增益,該增益代碼本索引為從單聲道信號編碼單元102輸 出的音源參數(shù)P1中的增益代碼本索引。乘法器162將從增益代碼本165輸出的自適應(yīng)音源增益乘以自適應(yīng)音源 向量,并輸出到加法器166。同樣,乘法器164也將從增益代碼本165輸出 的固定音源增益乘以固定音源向量,并輸出到加法器166。加法器166將從乘法器162以及乘法器164輸出的各音源向量相加,并 將相加后的音源向量(音源信號)M2作為驅(qū)動音源輸出到LPC合成濾波器154-l(以及LPC合成濾波器154-2)。接著,詳細說明第二變換單元155-1的動作。在第二變換單元155-1,進 行下述的第二變換。第二變換單元155-1對從LPC合成濾波器154-1輸出的合成信號實施第 二變換。該第二變換是使從LPC合成濾波器154-1輸出的合成信號與從第一 變換單元152-1輸出的第一變換信號ML1相似的變換。也就是說,通過第二 變換,使第二變換后的信號成為與第一變換信號MJ相似的信號。在失真最 小化單元156-1的控制下,第二變換單元155-1通過閉環(huán)搜索,從在第二變換 單元155-1內(nèi)部預(yù)先準(zhǔn)備的變換系數(shù)的代碼本中求實現(xiàn)上述變換的變換系數(shù)。具體而言,按照下面的式(9)進行第二變換。"-m …(9 )(其中,《 = 0廣、肌-1 )這里,S(n-k)為從LPC合成濾波器154-1輸出的合成信號,SPj(n)為第二 變換后的信號。此外,ocj(k)(其中,k = - KB ~ KF )為第j個第二變 換系數(shù),將N"(其中,j = 0 N。b-,)個的系凄t^列作為代碼本預(yù)先準(zhǔn) 備。SFL為子幀長度。對這些組的每個組,進行上面的式(9)的計算。失真最小化單元156-1按照下面的式(IO),計算信號S(n)與SPj(n)(n=0~ SFL-1)之間的差值信號DFj(n)。D巧(")^(")-巧(") ...(1 0 )(其中,"=0,.--,肌-1 )這里,將對差值信號D F j(n)進行聽覺加權(quán)后的編碼失真設(shè)為本實施方式的可擴展編碼裝置的編碼失真。對第二變換系數(shù)((Xj(k))的所有的組進行該計算,從而決定使L聲道信號以及R聲道信號各自的編碼失真成為最小的第 二變換系數(shù)。求該信號的編碼失真的一連串的處理成為閉環(huán)(反饋環(huán)),并通過 使第二變換系數(shù)在一個子幀中作各種變化,從而輸出最終獲得的、用于表示 使編碼失真最小的第二變換系數(shù)的組的索引(第二變換系數(shù)索引)。圖8是表示上述失真最小化單元156-1內(nèi)部的主要結(jié)構(gòu)的方框圖。 加法器141將從第一變換信號MU減去第二變換信號ML3而計算誤差信 號,并將該誤差信號輸出到聽覺加權(quán)單元142。聽覺加權(quán)單元142使用聽覺加權(quán)濾波器,對從加法器141輸出的誤差信號實施聽覺加權(quán),并將其輸出到失真計算單元143。失真計算單元143通過對每個子幀使用反饋信號F1來控制第二變換單元 155-1,以使從聽覺加權(quán)單元142輸出的、已進行聽覺加權(quán)后的誤差信號求得 的編碼失真,即第二變換信號M^的編碼失真最小。然后,失真計算單元143 輸出使第二變換信號ML3的編碼失真最小的第二變換系數(shù)索引13。通常將該 參數(shù)作為編碼參數(shù)輸出到本實施方式的可擴展編碼裝置的外部。圖9是匯總上述L聲道處理系統(tǒng)的編碼處理的概要的圖。使用該圖說明 通過本實施方式的可擴展編碼方法可削減編碼率,而且提高編碼精度的原理。在L聲道的編碼中, 一般是將L聲道的原信號的信號Ll作為編碼對象。 但是,在上述的L聲道處理系統(tǒng)中,不直接使用信號Ll,而將信號L1變換 為與單聲道信號Ml相似的信號(羊聲道相似信號)MlI,并將該變換信號作為 編碼對象。這是因為,如果將信號M^作為編碼對象,則可使用對單聲道信 號進行編碼時的構(gòu)成進行編碼處理,即可通過以單聲道信號的編碼為基準(zhǔn)的 方法進行L聲道信號的編碼。具體而言,在L聲道處理系統(tǒng)中,對單聲道相似信號IVU使用單聲道信 號的音源M2來生成合成信號ML2,同時求使該合成信號的誤差最小的編碼 參數(shù)。此外,通過將第二層的L聲道處理系統(tǒng)的編碼對象作為單聲道相似信號 ML1,在本實施方式中,能夠有效利用在第一層已求得的結(jié)果(編碼參數(shù)、音 源信號等)而進行第二層的編碼。這是因為第一層的編碼對象為單聲道信號。具體而言,在第二層生成合成信號Mt2時,利用在第一層已預(yù)先生成(對 于單聲道信號)的音源。因此,由于在第一層和第二層共享音源,所以能夠削減編碼率。特別是,在本實施方式中,使用在第一層已求得的項目中的、在單聲道 信號編碼單元102生成的音源進行第二層的編碼。也就是說,僅利用音源信 息以及聲道信息中的、在第 一 層已求得的音源信息。例如,在3GPP標(biāo)準(zhǔn)的TS26.190 V5丄0 (2001-12)所公開的AMR-WB方 式(23.85kbit/s)中,音源信息的信息量約是聲道信息的信息量的7倍,音源信 息的編碼后的比特率也比聲道信息多。因此,與聲道信息相比,在第一層和 第二層共享音源信息時,編碼率的削減效果大。此外,共享音源信息而不是聲道信息的原因在于,立體聲語音信號所具
有的特性,其理由如下。立體聲信號原本是指對從特定的發(fā)生源來的聲音,例如用左右分開的兩 個話筒在相同的定時進行拾音而得到的聲音。因此,理想的情況為,各個聲 道信號具有共同的音源信息。實際上,如果聲音的發(fā)生源是單一的(或者即使 發(fā)生源是多個,但由于聚集在一起而能夠同等地視為單一的情況),則能夠?qū)?各個聲道的音源信息視為共通而進行處理。但是,聲音的發(fā)生源為多個并在彼此分離開的位置時,在各發(fā)生源所發(fā) 出的多個聲音在不同的定時到達各話筒(延遲時間不同),而且由于傳播路徑的 不同而引起衰減度也不同,所以在各話筒實際所拾音的聲音為各音源信息混 合成難以分離狀態(tài)的聲音。立體聲信號特有的上述現(xiàn)象能夠理解為由于拾音環(huán)境的不同而使聲音被賦予了新的空間特性的結(jié)果。于是,認為在立體聲語音信號的聲道信息和音 源信息中,由于拾音環(huán)境的不同,聲道信息受到大的影響,而音源信息不怎 么受到影響。這是因為如聲道信息也被稱為頻鐠包絡(luò)信息那樣,其主要是有 關(guān)語音頻鐠的波形的信息,而由于拾音環(huán)境的不同對聲音新賦予的空間特性 也是如振幅比、延遲時間等與波形有關(guān)的特性。因此,能夠期待即使在單聲道信號(第一層)和L聲道/R聲道信號(第二層) 共享音源信息也不會導(dǎo)致大的音質(zhì)惡化。也就是說,通過在第一層以及第二層共享音源信息,并在各個聲道對聲道信息進行處理的方式,從而能夠期待 編碼效率變高,并能夠削減編碼率。因此,在本實施方式中,有關(guān)音源信息,將在單聲道信號編碼單元102 所生成的音源輸入到L聲道用的LPC合成濾波器154-1和R聲道用的LPC 合成濾波器154-2。此外,有關(guān)聲道信息,分別對L聲道設(shè)置LPC分析/量 化單元153-1,對R聲道設(shè)置LPC分析/量化單元153-2,并對各個聲道獨立 地進行線性預(yù)測分析(參照圖4)。也就是說,將由于拾音環(huán)境的不同而被賦予 的空間特性作為包含于聲道信息的編碼參數(shù)的模型進行編碼。另一方面,由于采用上述結(jié)構(gòu),隨之發(fā)生新的問題。例如,著眼于L聲 道進行說明,在L聲道處理系統(tǒng)使用的音源M2為對單聲道信號所求得的。 因此,使用其進行L聲道的編碼后,由于在L聲道混入單聲道的信息,從而 使L聲道的編碼精度惡化。另外,由于上述第一變換為僅對原信號Ll的波 形進行數(shù)學(xué)性(通過加減乘除)的加工的變換,所以認為將單聲道相似信號MU
作為編碼對象不成為大問題。這是因為,例如,從變換后的信號Mil恢復(fù)原 來的信號Ll的逆變換是可行的,并且從編碼精度的觀點來看,認為將1VU1 作為編碼對象和將L1作為編碼對象實質(zhì)上是相同的。因此,在本實施方式中,進行使基于音源M2所生成的合成信號M^接近于MU的最佳化(第二變換)。由此,即使利用單聲道信號的音源,也能夠 提高L聲道的編碼精度。具體而言,L聲道處理系統(tǒng)對基于音源M2所生成的合成信號ML2實施 第二變換,并生成變換信號MJ。然后,將1VU作為基準(zhǔn)信號,調(diào)節(jié)第二變 換系數(shù)以使變換信號ML3接近于MLl。更加具體的是,第二變換以后的處理 構(gòu)成環(huán),L聲道處理系統(tǒng)通過對表示第二變換系數(shù)的索引逐次加一,計算所 有索引的ML1和ML3之間的誤差,并最終輸出使誤差最小的第二變換系數(shù)的 索引。圖10是表示匯總了 L聲道和R聲道在第二層的編碼處理的步驟的流程圖。第二層編碼器150對L聲道信號以及R聲道信號進行第一變換而將其變 換為與單聲道信號相似的信號(STIOIO),同時輸出第一變換系數(shù)(第一變換參 數(shù))(ST1020),并進行第一變換信號的LPC分析以及量化(ST1030)。另外, ST1020不一定在ST1010和ST1030之間。此外,第二層編碼器150基于在第一層所決定的音源參數(shù)(自適應(yīng)代碼本 索引、固定代碼本索引以及增益代碼本索引),進行音源信號的生成(STlllO), 并進行L聲道信號以及R聲道信號的LPC合成(ST1120)。然后,對這些合成 信號,使用預(yù)先決定的第二變換系數(shù)的組進行第二變換(ST1130),并從第二 變換信號和近似于單聲道信號的第一變換信號計算編碼失真(ST1140)。接著, 進行失真最小值判定(ST1150),確定使這些編碼失真成為最小的第二變換系 數(shù)。確定上述第二變換系數(shù)的環(huán)(ST1130-ST1150)為閉環(huán),進行所有的索引 的搜索,并在全部搜索結(jié)束的時刻結(jié)束環(huán)(ST1160)。所求得的第二變換系數(shù) 索引(第二變換參數(shù)索引)被輸出(ST1210)。在上述處理步驟中,以幀為單位進行從ST1010至ST1030為止的處理Pl, 以對幀進一步分割后的子幀為單位進行乂人ST1110至ST1160為止的處理P2。另外,用于決定該第二變換系數(shù)的處理以幀為單位,并將第二變換系數(shù) 以幀為單位輸出也可。
接著,說明與上述可擴展編碼裝置對應(yīng)的、本實施方式的可擴展解碼裝置。圖14是表示在本實施方式的可擴展解碼裝置中特別具特征的第二層解 碼器170內(nèi)部的主要結(jié)構(gòu)的方框圖。該第二層解碼器170為與本實施方式的 可擴展編碼裝置內(nèi)部的第二層編碼器150(參照圖4)對應(yīng)的結(jié)構(gòu)。對與第二層 編碼器150相同的結(jié)構(gòu)要素賦予相同的標(biāo)號,并省略對重復(fù)的動作的說明。第二層解碼器170與第二層編碼器150—樣,大致由L聲道處理系統(tǒng)和 R聲道處理系統(tǒng)構(gòu)成,這兩個系統(tǒng)具有彼此相同的結(jié)構(gòu)。因此,對L聲道處 理系統(tǒng)在標(biāo)號后面賦予分支號1,對R聲道處理系統(tǒng)賦予分支號2,并且僅說 明L聲道處理系統(tǒng),而省略R聲道處理系統(tǒng)的說明。另外,音源信號生成單 元151為L聲道和R聲道共享的結(jié)構(gòu)。第二層解碼器170的L聲道處理系統(tǒng)包括音源信號生成單元151、 LPC 合成濾波器154-1、第二變換單元155-1、 LPC解碼單元171-1、第一變換系 數(shù)解碼單元172-1以及逆第一變換單元173-1。將由本實施方式的可擴展編碼 裝置所生成的音源參數(shù)P1、第一變換系數(shù)索引II、 LPC量化索引12以及第 二變換系數(shù)索引13輸入到該L聲道處理系統(tǒng)。音源信號生成單元151使用所輸入的音源參數(shù)P1來生成為L聲道以及R 聲道共享的音源信號M2,并將其輸出到LPC合成濾波器154-1。LPC解碼單元171-1使用所輸入的LPC量化索引12來對量化LPC參數(shù) 進行解碼,并將其輸出到LPC合成濾波器154-1。LPC合成濾波器154-1將已被解碼的量化LPC參數(shù)作為濾波系數(shù),并生 成將音源向量M2作為驅(qū)動音源的濾波函數(shù),即,使用LPC合成濾波器來生 成L聲道的合成信號M^。將該合成信號1V^2輸出到第二變換單元155-1。第二變換單元155-1通過使用所輸入的第二變換系數(shù)索引13而對合成信 號實施第二變換,生成第二變換信號MJ,并輸出到逆第一變換單元 173-1。該第二變換與第二層編碼器150中的第二變換為相同的處理。第一變換系數(shù)解碼單元172-1使用所輸入的第一變換系數(shù)索引II來對第 一變換系數(shù)進行解碼,并將其輸出到逆第一變換單元173-1。逆第一變換單元173-1使用已被解碼的第一變換系數(shù)的倒數(shù),對第二變 換信號Ml 3實施(第二層編碼器150中的)第一變換的逆變換的逆第一變換, 并生成L聲道解碼信號。
這樣,第二層解碼器170的L聲道處理系統(tǒng)能夠解碼L聲道信號。同樣, 通過第二層解碼器170的R聲道處理系統(tǒng),R聲道信號也^f皮解碼。另外,通 過與本實施方式的可擴展編碼裝置內(nèi)部的單聲道信號編碼單元102(參照圖3) 對應(yīng)的結(jié)構(gòu)的單聲道信號解碼單元(未圖示),單聲道信號也被解碼。如以上說明,根據(jù)本實施方式,在各層共享驅(qū)動音源。也就是說,因為 使用各層共享的音源進行各層的編碼,所以不需要對各層設(shè)置自適應(yīng)代碼本、 固定代碼本以及增益代碼本的組。因此,能夠?qū)崿F(xiàn)低比特率的編碼,同時能 夠削減電路4見模。此外,在第二層,進行第一變換以使立體聲信號的各個聲 道信號成為在波形上與單聲道信號相近似的信號,并對所獲得的第一變換信 號進行使各個聲道的信號的編碼失真成為最小的第二變換。由此,能夠提高 語音質(zhì)量。也就是說,能夠防止解碼信號的音質(zhì)惡化,同時能夠削減編碼率 而削減電路規(guī)模。,另夕卜,在本實施方式中,以使用兩個信號之間的振幅比(能量比)以及延遲 時間差作為波形差參數(shù)的情況為例進行了說明,但是也可使用各個頻帶的信 號的傳播特性(相位差、振幅比)等來代替它們。此外,也可使用量化LPC參數(shù)對波形差參數(shù)進行過處理的L聲道信號以 及R聲道信號進行差分量化或預(yù)測量化等,該量化LPC參數(shù)為在LPC量化 單元進行量化時,對于單聲道信號已被量化的量化LPC參數(shù)。這是因為,由 于對波形差參數(shù)進行過處理的L聲道信號以及R聲道信號被變換為與單聲道 信號相近似的信號,且這些信號的LPC參數(shù)與單聲道信號的LPC參數(shù)的相關(guān) 高,所以能夠以更低比特率進行高效率的量化。此外,在本實施方式中,以使用CELP編碼作為編碼方式為例進行了說 明,但不一定是如CELP編碼那樣使用語音模型的編碼,也可以不是利用預(yù) 先記錄在代碼本中的音源的編碼方法。此外,在本實施方式中,以將在第一層的單聲道信號編碼單元102所生 成的音源參數(shù)輸入到第二層編碼器150的情況為例進行了說明,但是也可將 在單聲道信號編碼單元102內(nèi)部最終生成的驅(qū)動音源信號,即,使誤差最小 的驅(qū)動音源信號本身輸入到第二層編碼器150。在這種情況下,將該驅(qū)動音 源信號直接輸入到第二層編碼器150內(nèi)部的LPC合成濾波器154-1和154-2。 (實施方式2)本發(fā)明的實施方式2的可擴展編碼裝置的基本結(jié)構(gòu)與實施方式1所示的可
擴展編碼裝置相同。因此,以下說明與實施方式1不同的結(jié)構(gòu)的第二層編碼 器。圖11是表示本實施方式的第二層編碼器150a的主要結(jié)構(gòu)的方框圖。另 外,對與實施方式1所示的第二層編碼器150(圖4)相同的構(gòu)成要素賦予相同 的標(biāo)號,并省略其說明。與實施方式1不同的結(jié)構(gòu)是第二變換單元201以及 失真最小化單元202。圖12是表示第二變換單元201內(nèi)部的主要結(jié)構(gòu)的方框圖。第二變換單元201內(nèi)的L聲道處理單元221-1從預(yù)先記錄在第二變換系 數(shù)表(第二變換參數(shù)表)222中的第二變換系數(shù)中,按照來自失真最小化單元 202的反饋信號Fl,讀出適合的第二變換系數(shù),且使用它來對從LPC合成濾 波器154-1輸出的合成信號ML2實施第二變換并輸出(信號MJ,)。同樣,R 聲道處理單元221-2從預(yù)先記錄在第二變換系數(shù)表222中的第二變換系數(shù)中, 按照來自失真最小化單元202的反饋信號Fl,讀出適合的第二變換系數(shù),且使 用它來對從LPC合成濾波器154-2輸出的合成信號MR2實施第二變換并輸出 (信號MR3,)。通過這些處理,合成信號ML2、 MR2成為與從第一變換單元 152-1、 152-2輸出的第一變換信號M丄Mr1相似的信號IVU,、 Mr3,。逸里, 第二變換系數(shù)表222為L聲道和R聲道共享。按照下面的式(11)以及式(12)進行第二變換。<formula>formula see original document page 20</formula>(其中,"=0,-",肌-1 )...(1 2 )(其中<formula>formula see original document page 20</formula>其中,SLch(n-k)為從LPC合成濾波器154-1輸出的L聲道的合成信號, SRch(n-k)為從LPC合成濾波器154-2輸出的R聲道的合成信號,SP^j(n)為進 行了第二變換的L聲道信號,SPReh,j(n)為進行了第二變換的R聲道信號。此外,OlLch,j(k)為L聲道的第j個的第二變換系數(shù),(XRch,j(k)為R聲道的第j個的第二變換系數(shù),并預(yù)先準(zhǔn)備Ncb(其中,j-0 Ncw)個的成對的L聲道以及R 聲道的系數(shù)序列作為代碼本。此外,SFL為子幀長度。對這些成對的每個對,
進行上面的式(11)以及式(12)的計算。接著,說明失真最小化單元202。圖13是表示失真最小化單元202內(nèi)部 的主要結(jié)構(gòu)的方框圖。失真最小化單元202求第二變換系數(shù)表222的索引,該第二變換系數(shù)表 222的索引是使L聲道以及R聲道各自的第二變換信號的編碼失真的和成為 最小的索引。具體而言,加法器211-1通過從第一變換信號MU減去第二變 換信號MJ,來計算誤差信號El,并將該誤差信號El輸出到聽覺加權(quán)單元 212-1。聽覺加權(quán)單元212-1使用聽覺加權(quán)濾波器,對從加法器211-1輸出的 誤差信號E1實施聽覺加權(quán),并將其輸出到失真計算單元213-1。失真計算單 元213-1計算已被聽覺加權(quán)的誤差信號El的編碼失真,并將其輸出到加法器 214。加法器211-2、聽覺加權(quán)單元212-2以及失真計算單元213-2的動作與 上述相同,E2是從Mr1中減去MR3,后的誤差信號。加法器214將從失真計算單元213-1和213-2輸出的編碼失真相加,并輸 出相加的和。失真最小值判定單元215求4吏從失真計算單元213-1和213-2 輸出的編碼失真的和最小的第二變換系數(shù)表222的索引。求該編碼失真的一 連串處理成為閉環(huán)(反饋環(huán)),失真最小值判定單元215使用反饋信號F 1 ,對 第二變換單元201指示第二變換系數(shù)表222的索引,并使第二變換系數(shù)在一 個子幀內(nèi)作各種變化。然后,將表示使最終獲得的編碼失真最小的第二變換 系數(shù)的組的索引D,輸出。如上述說明,該索引被L聲道信號以及R聲道信號 共享。以下,使用算式說明失真最小化單元202中的處理。 失真最小化單元202按照下面的式(13),計算信號Skh(n)與SPLch,j(n)(其 中,n=0 ~ SFL-1)之間的差值信號DFLchJ(n)。<formula>formula see original document page 21</formula>此外,失真最小化單元202按照下面的式(14),計算信號SRch(n)與SPRch,j(n)(其中,n=0 ~ SFL-1)之間的差值信號<formula>formula see original document page 21</formula> 將對差值信號DFLehj(n)以及DFRehj(n)進行聽覺加權(quán)后的編碼失真設(shè)為本
實施方式的可擴展編碼裝置的編碼失真。對使第二的變換系數(shù)(C^hj(k"與(anch,j(k"成對的所有組進行該計算,并確定使L聲道信號以及R聲道信號的 編碼失真的和成為最小的第二變換系數(shù)。另夕卜,0^h(k)值的組以及aRch(k)值的組使用究全相同的組也可以。在這種 情況下,能夠?qū)⒌诙儞Q用的變換系數(shù)的表的大小減半。這樣,根據(jù)本實施方式,將在各個聲道的第二變換中使用的各個聲道的 第二變換系數(shù)預(yù)先設(shè)定為以兩個聲道為單位的組,并用一個索引來指定。也 就是說,在第二層的編碼中,對各個聲道的LPC合成信號進行第二變換時, 預(yù)先準(zhǔn)備以兩個聲道為單位的組作為第二變換系數(shù),并同時對兩個聲道進行 閉環(huán)搜索,從而決定使編碼失真最小的第二變換系數(shù)。這就是利用已被變換 為與單聲道信號相近似的信號的l聲道信號和r聲道信號之間存在的強相 關(guān)。由此,能夠削減編碼率。以上,iJt明了本發(fā)明的各個實施方式。本發(fā)明的可擴展編碼裝置以及可擴展編碼方法,不限定于上述各實施方 式,可對本發(fā)明進行各種變更來實施。本發(fā)明的可擴展編碼裝置,還能夠配置于移動通信系統(tǒng)的通信終端裝置 以及基站裝置,由此能夠提供具有與上述相同作用效果的通信終端裝置以及 基站裝置。此外,本發(fā)明的可擴展編碼裝置以及可擴展編碼方法也可以利用 于有線方式的通信系統(tǒng)。另外,雖然在此以通過硬件來實現(xiàn)本發(fā)明的情形為例進行了說明,但是 本發(fā)明還可以通過軟件來實現(xiàn)。比如,通過編程語言,對本發(fā)明的可擴展編 碼方法的處理算法進行記述,并在內(nèi)存中保存該程序并通過信息處理裝置來 實行,從而能夠?qū)崿F(xiàn)與本發(fā)明的可擴展編碼裝置相同的功能。另外,自適應(yīng)代碼本(adaptive codebook)有時也被稱為自適應(yīng)音源代碼 本,固定代碼本(fixed codebook)有時也被稱為固定音源代碼本。另外,在上述各實施方式的說明中使用的各功能塊典型地通過集成電路 的LSI來實現(xiàn)。這些既可以分別實行單芯片化,也可以包含其中一部分或者 是全部而實行單芯片化。另外,每個功能塊在此雖然稱做LSI,但根據(jù)集成度的不同也可以稱為 IC、系統(tǒng)LSI、超大LSI(SuperLSI)、或特大LSI(Ultra LSI)等。另外,集成電路化的技術(shù)不只限于LSI,也可以使用專用電路或通用處
理器來實現(xiàn)。也可以利用在LSI制造后能夠編程的FPGA( Field Programmable Gate Array,現(xiàn)場可編程門陣列),或可以利用可對LSI內(nèi)部的電路塊的連接 或i殳定進行重新構(gòu)置的可重構(gòu)置處理器(Reconfigurable Processor )。再有,如果隨著半導(dǎo)體技術(shù)的進步或者其他技術(shù)的派生,出現(xiàn)取代LSI 集成電路化的技術(shù),當(dāng)然也可以利用該技術(shù)來實現(xiàn)功能塊的集成化。也有適 用生物技術(shù)等的可能性。本說明書基于2005年2月1日申請的(日本)特愿2005-025123。其內(nèi)容全部包含于此。 產(chǎn)業(yè)上的可利用性本發(fā)明的可擴展編碼裝置以及可擴展編碼方法能夠適用于移動通信系統(tǒng) 的通信終端裝置、基站裝置等的用途。
權(quán)利要求
1、一種可擴展編碼裝置,包括單聲道信號生成單元,使用用于構(gòu)成立體聲信號的多個聲道信號來生成單聲道信號;第一編碼單元,對所述單聲道信號進行編碼而生成音源參數(shù);單聲道相似信號生成單元,使用所述聲道信號和所述單聲道信號來生成第一單聲道相似信號;合成單元,使用所述音源參數(shù)和所述第一單聲道相似信號來生成合成信號;以及第二編碼單元,使用所述合成信號和所述第一單聲道相似信號來生成失真最小化參數(shù)。
2、 如權(quán)利要求l所述的可擴展編碼裝置,其中,所述單聲道信號生成單 元將所述多個聲道信號的平均設(shè)為所述單聲道信號。
3、 如權(quán)利要求1所述的可擴展編碼裝置,其中,所述第一編碼單元對所 述單聲道信號進行CELP編碼而生成所述音源參數(shù)。
4、 如權(quán)利要求1所述的可擴展編碼裝置,其中,所述單聲道相似信號生 成單元求所述聲道信號與所述單聲道信號在波形上的差的信息。
5、 如權(quán)利要求4所述的可擴展編碼裝置,其中,所述波形上的差的信息 為與能量以及延遲時間的雙方或一方有關(guān)的信息。
6、 如權(quán)利要求4所述的可擴展編碼裝置,其中,所述單聲道相似信號生 成單元使用與所述波形上的差有關(guān)的信息,減少所述聲道信號的波形與所述 單聲道信號的波形之間的誤差。
7、 如權(quán)利要求1所述的可擴展編碼裝置,其中,所述合成單元使用所述 第一單聲道相似信號來計算濾波系數(shù),使用所述音源參數(shù)來生成驅(qū)動音源,并通過使用所述濾波系數(shù)和所述驅(qū)動音源進行LPC合成來生成合成信號。
8、 如權(quán)利要求1所述的可擴展編碼裝置,其中,所述合成單元對所述多 個聲道信號,共同地使用所述音源參數(shù)來生成與各個聲道信號對應(yīng)的合成信號
9、 如權(quán)利要求1所述的可擴展編碼裝置,其中,所述第二編碼單元使用 所述合成信號來生成第二單聲道相似信號,并生成使所述第 一單聲道相似信 號與所述第二單聲道相似信號之間的差成為最小的所述失真最小化參數(shù)。
10、 如權(quán)利要求1所述的可擴展編碼裝置,其中,所述第二編碼單元預(yù) 先存儲所述失真最小化參數(shù)的候選。
11、 如權(quán)利要求1所述的可擴展編碼裝置,其中,所述第二編碼單元在 所述多個聲道之間以組為單位預(yù)先存儲與所述多個聲道信號對應(yīng)的多個所述 失真最小化參數(shù)的候選。
12、 如權(quán)利要求11所述的可擴展編碼裝置,其中,所述第二編碼單元從 所述失真最小化參數(shù)的候選中,對各個聲道信號分別求所述合成信號與所述 單聲道相似信號之間的失真,并求使這些所述失真的總和為最小的所述失真 最小化參數(shù)的組。
13、 一種通信終端裝置,包括權(quán)利要求1所述的可擴展編碼裝置。
14、 一種基站裝置,包括權(quán)利要求1所述的可擴展編碼裝置。
15、 一種可擴展編碼方法,包括使用構(gòu)成立體聲信號的多個聲道信號來生成單聲道信號的步驟;對所述單聲道信號進行編碼而生成音源參數(shù)的步驟;使用所述聲道信號和所述單聲道信號來生成第 一單聲道相似信號的步驟;使用所述音源參數(shù)和所述第一單聲道相似信號來生成合成信號的步驟;以及使用所述合成信號和所述第一單聲道相似信號來生成失真最小化參數(shù)的 步驟。
全文摘要
公開了能夠防止解碼信號的音質(zhì)惡化,同時能夠削減編碼率,并能夠削減電路規(guī)模的可擴展編碼裝置。本發(fā)明的可擴展編碼裝置采用以下結(jié)構(gòu),包括第一層編碼器(100),使用用于構(gòu)成立體聲信號的多個聲道信號(L聲道信號和R聲道信號)來生成單聲道信號,并對所述單聲道信號進行編碼而生成音源參數(shù);以及第二層編碼器(150),使用所述聲道信號和所述單聲道信號來生成第一變換信號,使用所述音源參數(shù)和所述第一變換信號來生成合成信號,并使用所述合成信號和所述第一變換信號來生成第二變換系數(shù)索引。
文檔編號G10L19/14GK101111887SQ20068000381
公開日2008年1月23日 申請日期2006年1月30日 優(yōu)先權(quán)日2005年2月1日
發(fā)明者吉田幸司, 后藤道代 申請人:松下電器產(chǎn)業(yè)株式會社