專利名稱:碼激勵線性預測編碼裝置的制作方法
技術領域:
本發(fā)明涉及碼激勵線性預測編碼(CELP)裝置,特別是,涉及考慮了非聲音信號區(qū)間內的音響信號影響的裝置。
當對聲音進行編碼和解碼時,對聲音區(qū)間和聲音區(qū)間以外的無聲或噪聲區(qū)間進行了相同的處理。作為聲音的編碼方法例如有下述文獻中所公開的。
文獻PIEEE ICASSP,1990年,P.461-464,Gerson和Jasiuk著“Vector Sum Excited Linear Prediction(VSELP)Speech coding at8kbps[速率為8Kb/s時的矢量和激勵的線性預測(VSELP)語音編碼]”。
該文獻描述了作為當前北美數(shù)字移動通信用聲音編碼方式的標準而確定下來的VSELP方式。日本數(shù)字移動通信用聲音編碼方式也采用了同樣的方式。
但是,CELP系統(tǒng)編碼器的構成注重聲音區(qū)間的編碼特性,而在對噪聲編碼、解碼時,合成聲音變得不自然,影響聽覺。
在利用CELP系統(tǒng)編碼器編碼、以后又解碼了的合成聲音中的噪聲區(qū)間內用于激勵源的碼簿是對聲音部分最佳化的,由于從LPC分析(線性預測分析)得到的頻譜估計誤差每幀都不一樣等緣故,所以,變成為偏離了編碼前噪聲的不自然的聲音,從而變成為使通話質量劣化的原因了。
根據上述原因,要求提供特別是能夠降低對非聲音信號區(qū)間內的音響信號(噪聲、轉動聲和振動聲等)編碼輸出的影響、能夠良好地進行聲音再生的碼激勵線性預測編碼裝置。
因此,根據本發(fā)明的第一方面的碼激勵線性預測編碼裝置具有從輸入音響信號求出自相關信息(例如,自相關矩陣或自相關系數(shù)等)的“自相關分析裝置”;從上述自相關分析裝置的分析結果求出聲道預測系數(shù)的“聲道預測系數(shù)分析裝置”;從上述聲道預測系數(shù)求出預測增益系數(shù)的“預測增益系數(shù)分析裝置”;從上述輸入音響信號、上述聲道預測系數(shù)和上述預測增益系數(shù)檢出輸入音響信號的非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的上述自相關信息的“自相關調節(jié)裝置”;從上述調節(jié)后的自相關信息得到補償了非聲音信號區(qū)間內聲道預測系數(shù)的補償后聲道預測系數(shù)的“聲道預測系數(shù)補償裝置”;利用上述補償后聲道預測系數(shù)和自適應激勵信號、對輸入音響信號進行碼激勵線性預測編碼的“編碼裝置”,解決了上述課題。
再者,上述聲道預測系數(shù)分析裝置的聲道預測系數(shù)能夠利用例如LPC(線性分析編碼)求出。上述預測增益系數(shù)也能夠例如作為聲道反射系數(shù)求出。通過上述自相關調節(jié)裝置,能夠通過例如把以前判定為噪聲區(qū)間的自相關信息與當前幀的自相關信息組合起來,得到使噪聲降低那樣地調節(jié)了的自相關信息。
通過從該調節(jié)了的自相關信息求出非聲音信號區(qū)間內的聲道預測系數(shù),得到對非聲音信號區(qū)間音響信號(例如,噪聲)進行了補償?shù)难a償后聲道預測系數(shù)。通過利用自適應于該補償后聲道預測系數(shù)的碼薄的自適應激勵信號、對輸入音響信號進行碼激勵線性預測編碼,與過去相比,能夠特別適用于降低非聲音信號區(qū)間內編碼輸出的噪聲。
還有,根據本發(fā)明的第二方面的碼激勵線性預測編碼裝置具有從輸入音響信號求出自相關信息的“自相關分析裝置”;從上述自相關分析裝置的分析結果求出聲道預測系數(shù)的“聲道預測系數(shù)分析裝置”;從上述聲道預測系數(shù)求出預測增益系數(shù)的“預測增益系數(shù)分析裝置”;與從上述聲道預測系數(shù)求出LSP(線狀頻譜對)系數(shù)同時從上述輸入音響信號、上述聲道預測系數(shù)和上述預測增益系數(shù)檢出輸入音響信號的非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的上述LSP系數(shù)的“ LSP系數(shù)調節(jié)裝置”;從上述調節(jié)后的LSP系數(shù)得到補償了非聲音信號區(qū)間內的聲道預測系數(shù)的補償后聲道預測系數(shù)的“聲道預測系數(shù)補償裝置”;利用上述補償后聲道預測系數(shù)和自適應激勵信號、對輸入音響信號進行碼激勵線性預測編碼的“編碼裝置”,解決了上述課題。
再者,為了降低非聲音信號區(qū)間內音響信號的影響,從聲道預測系數(shù)變換成LSP系數(shù),通過在該LSP系數(shù)的階段中還參考以前幀的LSP系數(shù)來調節(jié)LSP系數(shù),容易得到對聲音區(qū)間內頻譜變動抑制了頻譜變動的LSP系數(shù),最后,從LSP系數(shù)變換成聲道預測系數(shù),通過利用自適應碼簿的自適應激勵信號等、對輸入音響信號進行碼激勵線性預測編碼,與過去相比,能夠特別適用于降低非聲音信號區(qū)間內編碼輸出的噪聲。
又,根據本發(fā)明的第三方面的碼激勵線性預測編碼裝置具有從輸入音響信號求出自相關矩陣或自相關系數(shù)的“自相關分析裝置”;從上述自相關分析裝置的分析結果求出聲道預測系數(shù)的“聲道預測系數(shù)分析裝置”;從上述聲道預測系數(shù)求出預測增益系數(shù)的“預測增益系數(shù)分析裝置”;從上述輸入音響信號、上述預測增益系數(shù)和上述聲道預測系數(shù)檢出非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的上述聲道預測系數(shù)、得到調節(jié)后聲道預測系數(shù)的“聲道系數(shù)調制裝置”;利用上述調節(jié)后聲道預測系數(shù)和自適應激勵信號對輸入音響信號進行碼激勵線性預測編碼的“編碼裝置”,解決了上述課題。
在這樣的構成中,因為是利用以前非聲音信號區(qū)間內的聲道預測系數(shù)直接求出非聲音信號區(qū)間內的上述聲道預測系數(shù)的,所以,以非常小的運算量就能夠降低非聲音信號區(qū)間內音響信號的影響那樣地進行編碼。
進而還有,根據本發(fā)明第四方面的碼激勵線性預測編碼裝置具有從輸入音響信號求出自相關信息的“自相關分析裝置”;從上述自相關分析裝置的分析結果求出聲道預測系數(shù)的“聲道預測系數(shù)分析裝置”;從上述聲道預測系數(shù)求出預測增益系數(shù)的“預測增益系數(shù)分析裝置”;從對上述輸入音響信號進行帶通處理以后得到的帶通處理信號和上述預測增益系數(shù)檢出非聲音信號區(qū)間、對該非聲音信號區(qū)間進行信號分析產生用來消除噪聲的濾波系數(shù)、利用上述濾波系數(shù)對上述輸入音響信號進行噪聲消除并產生用來產生合成聲音信號的目標信號的“噪聲消除裝置”;利用上述聲道預測系數(shù)產生上述合成聲音信號的“合成聲音發(fā)生裝置”;利用上述聲道預測系數(shù)和上述目標信號對輸入音響信號進行碼激勵線性預測編碼的“編碼裝置”,解決了上述課題。
再者,上述噪聲消除裝置由濾波器構成以便從輸入音響信號中把非聲音信號區(qū)間內的噪聲消除,通過利用聲道預測系數(shù)、預測增益系數(shù)和通帶處理信號求出該濾波器的濾波系數(shù),能夠得到已消除了噪聲的目標信號。從而,通過使用該消除了噪聲后的目標信號進行碼激勵線性預測編碼,能夠得到消除了非聲音信號區(qū)間內噪聲影響的編碼輸出。
圖1為本發(fā)明第一實施形態(tài)的CELP編碼裝置的功能構成圖;圖2為本發(fā)明第二實施形態(tài)的CELP編碼裝置的功能構成圖;圖3為本發(fā)明第三實施形態(tài)的CELP編碼裝置的功能構成圖;圖4為本發(fā)明第四實施形態(tài)的CELP編碼裝置的功能構成圖。
符號的說明100…輸入端子 101…幀功率計算單元102…自相關矩陣計算單元 103…LPC分析單元104…合成濾波器 105…自適應碼簿106…噪聲碼簿 107…增益碼簿108…加權距離計算單元 109…LSP量化器110…聲音或噪聲判定單元 111…自相關矩陣調節(jié)單元112…預測增益計算單元 113、114…乘法器115、116…加法器117…量化器下面,利用附圖,說明本發(fā)明適用的實施形態(tài)。
在本發(fā)明的實施形態(tài)中,首先,(1)構成為在判定幀是聲音還是噪聲的基礎上,利用自相關矩陣、或LSP系數(shù)、或直接預測系數(shù)來調節(jié)合成濾波系數(shù)從而削減在噪聲區(qū)間內不自然的異常聲音。
(2)進而構成為在判定幀是聲音還是噪聲的基礎上,對用于選擇最佳碼矢量的目標信號進行濾波處理從而降低噪聲。
第一實施形態(tài)(A)具體地講這樣來構成,在噪聲區(qū)間異常聲音抑制型的CELP系統(tǒng)聲音編碼器中,以幀為單位把輸入信號分成聲音和噪聲,通過把當前噪聲區(qū)間幀的自相關矩陣與相連的以前噪聲區(qū)間幀的自相關矩陣組合起來計算新的自相關矩陣,利用新的自相關矩陣進行LPC分析,求出合成的濾波系數(shù)進行量化并發(fā)送到解碼器上,利用上述合成濾波系數(shù)檢索最佳碼簿矢量。
其次,說明實現(xiàn)上述(A)的構成的詳細結構。圖1為CELP編碼裝置的功能構成圖。圖1中,CELP編碼裝置由幀功率計算單元101、自相關計算單元102、LPC分析單元103、合成濾波器104、自適應碼簿105、噪聲碼簿106、增益碼簿107、加權距離計算單元108、LSP量化器109、聲音或噪聲判定單元110、自相關矩陣調節(jié)單元111、預測增益計算單元112、乘法器113和114、加法器115、減法器116、量化器117、多路復用單元130構成。
圖1的構成中具有特征的部分是這樣的部分,這些部分特別地修正由自相關矩陣計算單元102、聲音或噪聲判定單元110、自相關矩陣調節(jié)單元111、LPC分析單元103得到的聲道系數(shù),從而消除過去通過對聲音區(qū)間以外的噪聲部分進行CELP編碼而再生出刺耳聲音的原因。
“幀功率計算單元101”一接受以幀為單位歸納的、作為原信號(原信號是作為矢量輸入的)矢量的輸入聲音數(shù)字信號(聲音矢量信號)S,就求出幀功率并將其作為幀功率信號P提供到多路復用單元130上。“自相關矩陣計算單元102”一接受上述以幀為單位的輸入聲音數(shù)字信號S,就求出用于求出聲道系數(shù)的自相關矩陣R,將其提供到LPC分析單元103和自相關矩陣調節(jié)單元111上。
“LPC分析單元103”從自相關矩陣R求出聲道預測系數(shù)a,將其提供到預測增益計算單元112上,同時,一接受來自自相關矩陣調節(jié)單元111的自相關矩陣Ra,就求出通過上述自相關矩陣Ra對上述聲道預測系數(shù)a進行了修正的最佳聲道預測系數(shù)aa,將其提供到合成濾波器104和LSP量化器109上。
“預測增益計算單元112”從上述聲道預測系數(shù)a變換成反射系數(shù),從該反射系數(shù)求出預測增益,將其作為預測增益信號Pg提供到聲音或噪聲判定單元110上。該“聲音或噪聲判定單元110”從自適應碼簿105接受間距系數(shù)信號Ptch,同時,還根據以幀為單位的上述輸入聲音數(shù)字信號S、上述聲道預測系數(shù)a和上述預測增益信號Pg,判定幀信號S是聲音信號還是聲音信號以外的噪聲信號,把聲音/噪聲判定信號r提供到自相關矩陣調節(jié)單元111上。
“自相關矩陣調節(jié)單元111”是特別重要的功能部分,在只當判定為噪聲時才進行的處理中,一接受上述自相關矩陣R、上述聲音/噪聲判定信號V和上述聲道預測系數(shù)a,就通過“以前判定為噪聲的區(qū)間自相關矩陣”與“當前噪聲幀的自相關矩陣”的組合,求出新的自相關矩陣Ra,提供到LPC分析單元103上。
“自適應碼簿105”是預先在其內部具有多個周期性的自適應激勵矢量的碼簿,在這些自適應激勵矢量上分別提供一個索引號Ip,通過從加權距離計算單元108指定的最佳索引號Ip輸出自適應激勵信號矢量ea,將其提供到乘法器113上,同時,輸出間距信號ptch(輸入聲音信號S與最佳自適應激勵矢量信號ea的歸一化互相關信號),將其提供到聲音或噪聲判定單元110上。還有,該自適應碼簿105內部的自適應激勵矢量信號通過來自加法器115的輸出激勵矢量信號ex中的最佳激勵矢量信號exop來更新。
“噪聲碼簿106”是預先在其內部具有多個噪聲性激勵矢量信號的碼簿,在這些噪聲性激勵矢量信號上分別提供一個索引號Is,通過由加權距離計算單元108指定的最佳索引號Is輸出噪聲性激勵矢量信號es,將其提供到乘法器114上。
“增益碼簿107”預先存儲著對上述自適應激勵矢量信號和噪聲性激勵矢量的增益(Gain)碼,在這些增益碼上分別提供一個索引號Ig,通過從加權距離計算單元108指定的最佳索引號Ig,對自適應激勵矢量信號輸出增益碼信號ga并將其提供到乘法器113上,對噪聲性激勵矢量信號輸出增益碼信號gs并將其提供到乘法器114上。
“自適應碼簿105一側的乘法器113”把上述自適應激勵矢量信號ea與增益碼信號ga相乘,作為最佳增益(大小)的自適應激勵矢量信號提供到加法器115上。“噪聲碼簿106一側的乘法器114”把噪聲激勵矢量信號es與增益碼信號gs相乘,作為最佳增益(大小)的噪聲性激勵矢量信號提供到加法器115上。“加法器115”把上述作為最佳增益的自適應激勵矢量信號與上述作為最佳增益的噪聲性激勵矢量信號相加,把激勵矢量信號ex提供到合成濾波器104上,同時,把利用加權距離計算單元108計算的使平方和E為最小的最佳激勵矢量信號exOP反饋到自適應碼簿105上,更新以后存儲起來。
“合成濾波器104”可由IIR(無限脈沖響應,循環(huán)型)型數(shù)字濾波電路構成,從上述修正后的最佳聲道預測系數(shù)aa和來自加法器115的激勵矢量(激勵信號)ex產生合成聲音矢量信號sw(合成聲音信號),將其提供到減法器116上。即,對于IIR型數(shù)字濾波器,把上述修正后的最佳聲道預測系數(shù)aa作為濾波(抽頭)系數(shù)、對激勵矢量信號ex進行濾波處理,得到合成聲音矢量信號sw。減法器116把輸入聲音數(shù)字信號S與合成聲音矢量信號sw相減,把該相減結果作為誤差矢量信號e提供到加權距離計算單元108上。
“加權距離計算單元108”一接受來自減法器116的誤差矢量信號e,就對該誤差矢量信號e進行頻率變換和加權。求出加權以后矢量信號的平方和,求出適合于自適應激勵矢量信號、噪聲激勵矢量信號和增益碼信號的最佳索引號Ia、Is、Ig,使得通過該平方和得到矢量信號E為最小,將其提供到自適應碼簿105、噪聲碼簿106和增益碼簿107上。
“增益碼用的量化器117”把增益碼信號ga和gs量化,將其作為增益碼量化信號提供到多路復用單元130上?!癓SP量化器109”通過噪聲消除處理,對最佳地修正了的聲道預測系數(shù)aa進行LSP量化,把聲道預測系數(shù)量化信號<aa>提供到多路復用單元130上。
“多路復用單元130”把上述幀功率信號P、增益碼量化信號、聲道預測系數(shù)量化信號<aa>、自適應激勵矢量選擇用的索引號Ip、增益碼選擇用的索引號Ig和噪聲性激勵矢量選擇用的索引號Is多路復用,把通過該多路復用得到的多路復用數(shù)據作為CELP編碼裝置的編碼數(shù)據輸出。
(操作)在幀功率計算單元101中,求出提供到輸入端子100上的輸入聲音數(shù)據信號S的以幀為單位的功率,將其作為幀功率信號P提供到多路復用單元130上。同時,把上述聲音數(shù)字信號S提供到自相關矩陣單元102上,求出自相關矩陣R,又把該自相關矩陣R提供到自相關矩陣調節(jié)單元111上。還把上述輸入聲音矢量信號S提供到聲音或噪聲判定單元110上,在這里,雖然是判定輸入聲音數(shù)字信號S是聲音還是聲音以外的噪聲,但是,在該判定中,還使用其它間距信號、聲道預測系數(shù)a、預測增益信號Pg等。
在LPC分析單元103中,從在自相關矩陣計算單元102中求出的自相關矩陣R求出聲道預測系數(shù)a,在預測增益計算單元112中,從該聲道預測系數(shù)a求出預測增益信號Pg,將其與聲道預測系數(shù)a一起提供到聲音或噪聲判定單元110上。使用從自適應碼簿105提供的間距信號ptch、聲道預測系數(shù)a、預測增益信號Pg和輸入數(shù)字信號S,在聲音或噪聲判定單元110中判定輸入聲音數(shù)字信號S是聲音信號還是噪聲信號,把聲音/噪聲判定信號V提供到自相關矩陣調節(jié)單元111上。
在自相關矩陣調節(jié)單元111中,通過以前判定為噪聲的區(qū)間的自相關矩陣與當前幀自相關矩陣的組合,從自相關矩陣R、聲道預測系數(shù)a、聲音/噪聲判定信號V求出新的自相關矩陣Ra。由此,最佳地修正了對變成為刺耳原因的噪聲部分的自相關矩陣。
把新的自相關矩陣Ra提供到LPC分析單元103上,在這里,求出新的最佳聲道預測系數(shù)aa,將其提供到合成濾波器104上。把新的最佳聲道預測系數(shù)aa作為對IIR型數(shù)字濾波器的濾波系數(shù)提供到合成濾波器104上,在這里,對激勵矢量信號ex進行濾波處理,得到合成聲音矢量信號sw。
在減法器中,求出該合成聲音矢量信號sw與輸入聲音數(shù)字信號S之差,把該差信號作為誤差矢量信號e提供到加權距離計算單元108上。在加權距離計算單元108中,對該誤差矢量信號e進行頻率變換和加權,求出使得平方和矢量信號E為最小那樣的最佳的自適應激勵矢量信號、噪聲激勵矢量信號和增益碼信號的最佳索引號Ia、Is、Ig。把這些最佳索引號Ia、Is、Ig提供到多路復用單元130上,同時,為了得到最佳激勵矢量ea、es和增益碼信號ga、gs,還把它們提供到自適應碼簿105、噪聲碼簿106、增益碼簿107上。
把利用上述最佳索引號Ia讀出的自適應激勵矢量信號ea乘以利用索引號Ig讀出的增益碼信號ga以后,提供到加法器115上,同時,把利用上述最佳索引號Is讀出的噪聲性激勵矢量信號es也乘以利用索引號Ig讀出的增益碼信號gs以后,提供到加法器115上。在加法器115中,把相乘后的兩個信號相加,將其提供到激勵矢量信號ex的合成濾波器104上,在這里,得到合成聲音矢量信號sw。
這樣,一直到合成聲音矢量信號sw與輸入聲音數(shù)字信號S的誤差不存在了,才使用了自適應碼簿105、噪聲碼簿106和增益碼簿107的聲音矢量信號sw,還有,在聲音以外的區(qū)間內,最佳地修正聲道預測系數(shù)aa,產生合成聲音矢量信號sw。
隨時把通過上述那樣的操作得到的幀功率信號P、增益碼量化信號、聲道預測系數(shù)量化信號<aa>、自適應激勵矢量選擇用的索引號Ip、增益碼選擇用的索引號Ig和噪聲性激勵矢量選擇用的索引號Is多路復用以后,作為編碼數(shù)據輸出。
(聲音或噪聲判定單元110的詳情)聲音或噪聲判定單元110“利用幀結構、分析參數(shù)等進行噪聲區(qū)間的檢出”。因此,首先,(1)把分析參數(shù)變換成反射系數(shù)r[i](i=i,…,NP,NP=濾波器的階數(shù))。再者,在這里,假定r[i]為-1.0<r[i]<1.0還有,(2)利用反射系數(shù)r[i],可以把預測增益RS表示為RS=∏(1.0-r[i]2) …(1)再者,在這里,i=1~NP。
反射系數(shù)r
表示分析幀信號頻譜的斜率,|r
|越接近于0,可以說頻譜越平。一般,噪聲頻譜比聲音頻譜的斜率小。還有,預測增益RS在有聲區(qū)間內為接近于0的值,在無聲或噪聲區(qū)間內為接近于1.0的值。
還有,CELP編碼裝置在手持自適應電話裝置等用途中,因為作為聲源的人的嘴與作為信號輸入單元的話筒之間的距離很近,所以,幀功率在聲音區(qū)間內大,而在無聲(噪聲)區(qū)間內小。
因此,在聲音或噪聲的判定中,求出D=Pow·|r
|/RS…(2)對該值用Dth(閾值)進行判斷,如果D>Dth,則判定為聲音;如果D<Dth,則判定為噪聲。
(自相關矩陣調節(jié)單元111的詳情)其次,在以前若干幀、即m個幀連續(xù)判定為噪聲時,才在上述自相關矩陣調節(jié)單元111中進行自相關矩陣尺的調節(jié)。假定,當前幀的自相關矩陣為R
,幾個幀之前的噪聲區(qū)間的自相關矩陣為R[n]時,則調節(jié)后噪聲區(qū)間的自相關矩陣Radj可用下式表示Radj=∑(Wi·R[i]) …(3)i=0~m-1、∑Wi=1.0、Wi≥Wi+1≥0自相關矩陣調節(jié)單元111進行對應于上述計算的處理。調節(jié)單元111把通過該處理得到的自相關矩陣Radj提供到LPC分析單元103上。
(第一實施形態(tài)的效果)如果根據上述第一實施形態(tài),在利用CELP系統(tǒng)編碼裝置把聲音以外的輸入信號編碼的情況下,把輸入信號以幀為單位分開,因受聲道分析(頻譜分析)的影響,分析結果與實際信號不同。還有,因為分析結果不同的程度每幀都有變動,所以,不但編碼再解碼以后的信號與原聲音的頻譜不同,而且,變成為刺耳的聲音了。通過把用于進行頻譜估計的自相關矩陣與以前噪聲幀的矩陣組合起來,抑制幀間分析結果不同的程度,使防止刺耳合成聲的產生成為可能。還有,因為人的聽覺對變動部分的噪聲比對恒定噪聲區(qū)間敏感,所以,能夠抑制噪聲幀之間的頻譜變動。
“第二實施形態(tài)”(B)在上述(A)的構成中進而構成為把噪聲區(qū)間合成濾波系數(shù)變換成LSP(線狀頻譜對,Line Spectrum Pair),求出合成濾波器的頻譜特性,通過把合成濾波器的頻譜特性與以前的噪聲區(qū)間合成濾波器的頻譜特性相對照,求出抑制了頻譜變動的新LSP系數(shù),把新的LSP系數(shù)變換成合成濾波系數(shù)并量化以后,發(fā)送到解碼器上,利用合成濾波系數(shù)檢索最佳碼簿矢量。
其次,說明實現(xiàn)上述(B)的構成的詳細結構。圖2為CELP編碼裝置的功能構成圖。圖2中,與上述圖1不同的構成是特別用虛線圍起來的部分。即,在“用虛線圍起來的部分中”具有自相關矩陣計算單元102、LPC分析單元103A、聲音或噪聲判定單元110、預測增益計算單元112、聲道系數(shù)/LSP變換單元119、LSP/聲道系數(shù)變換單元120、LSP系數(shù)調節(jié)單元121。
因為上述用虛線圍起來的部分以外為大致相同的構成,執(zhí)行同樣的操作,所以,“以上述用虛線圍起來的部分為中心,對修正聲道系數(shù)、消除過去因對聲音期間以外的時間的噪聲部分進行CELP編碼而再生出刺耳聲音的原因”進行描述。
因此,“聲道系數(shù)/LSP變換單元119”從聲道預測系數(shù)a變換成LSP系數(shù)I,將其提供到LSP系數(shù)調節(jié)單元121上?!癓SP系數(shù)調節(jié)單元121”根據來自聲音或噪聲判定單元110的聲音/噪聲判定信號V和來自聲道系數(shù)/LSP變換單元119的LSP系數(shù)I,進行LSP系數(shù)I的調節(jié),降低噪聲的影響,把已調節(jié)的LSP系數(shù)Ia提供到LSP/聲道系數(shù)變換單元120上。
“LSP/聲道系數(shù)變換單元120”把來自LSP系數(shù)調節(jié)單元121的“已調節(jié)的LSP系數(shù)Ia”變換成最佳聲道預測系數(shù)aa,作為數(shù)字濾波系數(shù)提供到合成濾波器104上。
(LSP系數(shù)調節(jié)單元121的詳情)在以前若干幀,即m個幀連續(xù)判定為噪聲時,才進行上述LSP系數(shù)的調節(jié)。在這里,假定,當前幀的LSP系數(shù)為LSP-O[i],n個幀以前的噪聲區(qū)間的LSP系數(shù)為LSP-n[i],并假定,i=1,…,NP,NP=濾波器的階數(shù)時,則調節(jié)后的LSP系數(shù)可用下式表示LSPadj[i]=∑WK·LSP-k[i] …(4)在這里,K=0~m-1、∑WK=1.0、i=0~NP-1、WK≥WK+1≥0。
上述LSP系數(shù)為余弦領域的系數(shù)。進行對應于這樣計算的處理。LSP系數(shù)調節(jié)單元121把通過該處理得到的LSP系數(shù)Ia提供到LSP/聲道系數(shù)變換單元120上。
(操作)說明直到求出最佳聲道預測系數(shù)aa的操作,有關依靠碼簿的最佳激勵矢量信號ex的產生,因為與上述第一實施形態(tài)相同,所以,省略其說明。因此,首先,把輸入聲音數(shù)字信號S提供到自相關矩陣單元102上,求出自相關矩陣R。把該自相關矩陣R提供到LRC分析單元103A上,求出聲道預測系數(shù)a。把該聲道預測系數(shù)a提供到預測增益計算單元112、聲道系數(shù)/LSP變換單元119和聲音或噪聲判定單元110上。
由此,在預測增益計算單元112中,求出預測增益信號Pg,將其提供到聲音或噪聲判定單元110上。在聲道系數(shù)/LSP變換單元119中,從聲道預測系數(shù)a求出LSP系數(shù)I,將其提供到LSP系數(shù)調節(jié)單元121上。另一方面,聲音或噪聲判定部分110一接受聲道預測系數(shù)a、輸入聲音矢量信號S、間距信號Ptch和預測增益信號Pg,就輸出聲音/噪聲判定信號V,將其提供到LSP系數(shù)調節(jié)單元121上。利用該LSP系數(shù)調節(jié)單元121進行LSP系數(shù)I的調節(jié),降低噪聲的影響,把已調節(jié)的LSP系數(shù)Ia提供到LSP/聲道系數(shù)變換單元120上。利用該LSP/聲道系數(shù)變換單元120,把LSP系數(shù)Ia變換成最佳聲道預測系數(shù)aa,將其提供到合成濾波器104上。
在這樣構成的裝置中,與過去相比,最佳地修正了噪聲區(qū)間的聲道預測系數(shù),使得不產生成為刺耳聲音源的編碼信號。
(第二實施形態(tài)的效果)如果根據上述第二實施形態(tài),通過調節(jié)與頻譜直接有關的LSP系數(shù),就能夠得到與上述第一實施形態(tài)相同的效果,同時,因為不需要進行兩次LPC分析,所以,可以減少運算量。
“第三實施形態(tài)”(c)在上述(A)的構成中進而構成為通過把噪聲區(qū)間合成濾波系數(shù)內插到以前的噪聲區(qū)間合成濾波系數(shù)中,直接求出當前噪聲區(qū)間內新的合成濾波系數(shù),把新的合成濾波系數(shù)量化以后,發(fā)送到解碼器上,利用新的合成濾波系數(shù)檢索最佳碼簿矢量。
其次,說明實現(xiàn)上述(C)的構成的詳細結構。圖3為CELP編碼裝置的功能構成圖。圖3中,與上述圖1不同的構成是特別用虛線圍起來的部分。即,在“用虛線圍起來的部分中”具有自相關矩陣計算單元102、LPC分析單元103A、聲音或噪聲判定單元110、預測增益計算單元112、聲道系數(shù)調節(jié)單元126。
“聲道系數(shù)調節(jié)單元126”從來自LPC分析單元103A的聲道預測系數(shù)a和來自聲音或噪聲判定單元110的聲音/噪聲判定信號V中對聲道預測系數(shù)進行調節(jié)使得能夠降低噪聲的影響,并把最佳的聲道預測系數(shù)aa提供到合成濾波器104上。即,通過把聲道預測系數(shù)a與以前噪聲區(qū)間的聲道預測系數(shù)組合起來,直接求出新的聲道預測系數(shù)aa。
具體地講,在以前若干幀,即m個幀連接判定為噪聲時,才進行上述聲道預測系數(shù)的調節(jié)。而且,假定,當前幀的合成濾波系數(shù)為a-0[i],n個幀以前的噪聲區(qū)間合成濾波系數(shù)為a-n[i],并假定,i=1,…,NP,NP=濾波器的階數(shù)時,則調節(jié)后的濾波系數(shù)可用下式表示aadj[i]=∑WK·(a-k)[i] …(5)再者,在這里,∑WK=1.0、WK=WK+1≥0、k=0~m-1、i=0~NP-1。
這時,必須確認利用了調節(jié)后系數(shù)的濾波器的穩(wěn)定性,當判斷為不穩(wěn)定時最好控制成不進行調節(jié)。
(操作)說明直到求出最佳聲道預測系數(shù)aa的操作,有關依靠碼簿的最佳激勵矢量信號ex的產生,因為與上述第一實施形態(tài)相同,所以,省略其說明。因此,首先,把輸入聲道矢量信號S提供到自相關矩陣單元102上,求出自相關矩陣R。把該自相關矩陣R提供到LPC分析單元103A上,求出聲道預測系數(shù)a。把該聲道預測系數(shù)a提供到預測增益計算單元112、聲道系數(shù)調節(jié)單元126和聲音或噪聲判定單元110上。
在預測增益計算單元112中,從聲道預測系數(shù)a求出預測增益系數(shù)Pg,將其提供到聲音或噪聲判定單元110上。在接受了輸入聲音數(shù)字信號S、預測增益系數(shù)Pg、聲道預測系數(shù)a和間距信號Ptch的聲音或噪聲判定單元110中,進行聲音/噪聲區(qū)間的判定,求出聲音/噪聲判定信號V,將其提供到聲道系數(shù)調節(jié)單元126上。在聲道系數(shù)調節(jié)單元126中,從聲音/噪聲判定信號V和聲道預測系數(shù)a求出使得噪聲影響降低那樣地調節(jié)了的最佳聲道預測系數(shù)aa,將其提供到合成濾波器104上。
在這樣構成的裝置中,與過去相比,最佳地修正了噪聲區(qū)間的聲道預測系數(shù),使得不產生成為刺耳聲音源的編碼信號。
(第三實施形態(tài)的效果)如果根據上述第三實施形態(tài),通過把聲道系數(shù)與緊接著的以前噪聲區(qū)間的聲道系數(shù)組合起來,就能夠得到與上述第一實施形態(tài)相同的效果,同時,因為是直接計算出濾波系數(shù)的,所以,可以削減運算量。
“第四實施形態(tài)”(D)對每個子幀進行聲音或噪聲的判定,基于這種判定確定噪聲減少量和噪聲減少法,按照確定了的噪聲減少法計算目標信號矢量,利用目標信號矢量來檢索最佳碼簿矢量,這樣構成噪聲減少型CELP系統(tǒng)的聲音編碼器。
其次,說明實現(xiàn)上述(D)的構成的詳細結構。圖4為CELP編碼裝置的功能構成圖。圖4中,與上述圖1不同的構成是用虛線圍起來的部分。即,在用虛線圍起來的部分中具有聲音或噪聲判定單元110B、降低噪聲濾波器122、預測增益計算單元112、濾波器組124、濾波器控制單元125。
“濾波器組124”由帶通濾波器a~n構成,各個濾波器的通帶為不同的頻帶,帶通濾波器a對輸入聲音數(shù)字信號S輸出通帶信號Sbp1、…、帶通濾波器n對輸入聲音數(shù)字信號S輸出通帶信號PbpN,將其提供到聲音或噪聲判定單元110B上。通過這樣的濾波器組構成,降低阻帶的噪聲,輸出信噪比增大了的通帶信號,使聲音或噪聲判定部分110B中的聲音區(qū)間或噪聲區(qū)間的判定能夠按每個通帶容易地進行。
預測增益計算單元112從來自LPC分析單元103A的聲道預測系數(shù)a求出預測增益系數(shù)Pg,將其提供到聲音或噪聲判定單元110B上。聲音或噪聲判定單元110B從來自濾波器組124的通帶信號Sbp1~SbpN、間距信號Ptch和預測增益系數(shù)Pg中計算各頻帶噪聲的評價函數(shù),輸出每個頻帶的聲音或噪聲判定信號V1~VN,將其提供到濾波器控制單元125上。
“濾波器控制單元125”從來自聲音或噪聲判定單元110B的聲音或噪聲判定信號V1~VN中,根據每個頻帶為聲音或無聲或噪聲的判定、調節(jié)降低噪聲的濾波系數(shù),把調節(jié)了的降低噪聲濾波系數(shù)nc提供到降低噪聲濾波器122上。降低噪聲濾波器122由IIR型或FIR型數(shù)字濾波器構成,設定來自濾波器控制單元125的降低噪聲濾波系數(shù)nc,通過該濾波系數(shù)對輸入聲音數(shù)字信號S進行最佳處理,輸出減小了噪聲的目標信號t,將其提供到減法器116上。
(操作)說明直到求出目標信號t的操作,有關依靠碼簿的最佳激勵矢量信號ex的產生,因為與上述第一實施形態(tài)相同,所以,省略其說明。因此,首先,把輸入聲音數(shù)字信號S提供到自相關矩陣單元102上,求出自相關矩陣R。把該自相關矩陣R提供到LPC分析單元103A上,求出聲道預測系數(shù)a。把該聲道預測系數(shù)a提供到預測增益計算單元112和合成濾波器104上,利用預測增益計算單元112求出預測增益系數(shù)Pg,將其提供到聲音或噪聲判定單元110B上。
另一方面,把輸入聲音數(shù)字信號S提供到濾波器組124上,在這里,通過各帶通濾波器a~n輸出帶通信號Sbp1~SbpN。把這些帶通信號Sbp1~SbpN、間距信號Ptch和預測增益系數(shù)Pg提供到聲音或噪聲判定單元110B上,求出每個頻帶的聲音或噪聲判定信號V1~VN。在濾波器控制部分125中利用這些聲音或噪聲判定信號V1~VN。調節(jié)降低噪聲濾波系數(shù),作為降低噪聲濾波系數(shù)nc提供到降低噪聲濾波器122上。
降低噪聲濾波器122可以根據該降低噪聲濾波系數(shù)nc最佳地設定數(shù)字濾波器的濾波系數(shù)以便能夠最佳地降低噪聲。通過該設定,在降低噪聲濾波器122中對輸入聲音數(shù)字信號S進行濾波處理,得到目標信號t。在減法器116中求出該目標信號t與來自合成濾波器104的合成聲音信號SW之差e,在加權距離計算單元108中以該誤差信號e為基礎進行對最佳索引的探索。
在這樣構成的裝置中,與過去相比,降低了噪聲區(qū)間的噪聲,使得不產生成為刺耳聲音源的編碼信號。
(第四實施形態(tài)的效果)如果根據上述第四實施形態(tài),在人類聽覺上,與只聽到聲音區(qū)間中的背景噪聲的情況相比,不愉快的程度降低了。因此,在編碼時,通過區(qū)分聲音區(qū)間、在噪聲區(qū)間和聲音區(qū)間中改變降低噪聲的方法、在聲音區(qū)間內不進行復雜的處理,可以提高聽覺上的音質。
還有,通過只對CELP編碼裝置的目標信號降低噪聲,可以以子幀為單位降低噪聲,當聲音或噪聲誤判定時,可以減小對聲音的影響,同時,可以減小伴隨著降低噪聲而引起的頻譜失真。
(其它實施形態(tài))(1)再者,在上述實施形態(tài)中,進而還可以構成為具有脈沖碼簿,把脈沖性激勵矢量作為波形碼矢量使用,產生合成聲音矢量。
(2)還有,雖然所描述的上述圖1的合成濾波器104是由IIR型數(shù)字濾波器構成的,但是,也可以由其它FIR(有限脈沖響應非循環(huán)型)型數(shù)字濾波器、IIR型和FIR型的混合型數(shù)字濾波器構成。
(3)又,在上述CELP編碼裝置中也可以使用統(tǒng)計碼簿進行CELP編碼。這樣的統(tǒng)計碼簿的構成和制作方法可以利用例如,文獻特開平6-130995號公報“統(tǒng)計コ-ドブツク及びその作成方法(統(tǒng)計碼簿及其制作方法)”中示出的構成和制作方法來實現(xiàn)。
(4)進而還有,在上述實施形態(tài)中,雖然說明了CELP編碼裝置的詳情,但是,解碼裝置利用例如,文獻特開平5-165497號公報“コ-ド”勵振線形予測符號化器及び復號化器(碼激勵線性預測編碼器和解碼器)中示出的構成進行解碼,也行。
(5)還有,在上述實施形態(tài)中,雖然示出了向CELP編碼裝置的應用,但是,此外,也能應用于VS(矢量和)ELP編碼裝置中。也能應用于LD(短延時)-CELP、CS(共軛結構)-CELP、PSI(間隔同步噪聲)-CELP中。
(6)又,上述實施形態(tài)的CELP編碼裝置應用于手持電話機等中是有效的,這種結構應用于例如,文獻特開平6-130998號公報“壓縮音聲復號化裝置(壓縮聲音解碼裝置)”中所示的TDMA發(fā)送裝置、接收裝置中也是有效的。還有,把本發(fā)明應用于依靠VSELP的TDMA發(fā)送機中,也是令人滿意的。
(7)進而還有,作為上述圖4中的降低噪聲濾波器122,除了利用IIR型、FIR型、IIR和FIR復合型的數(shù)字濾波器來實現(xiàn)以外,應用卡門(Karrnau)濾波器也是令人滿意的。這種卡門濾波器如果接受信號及噪聲的統(tǒng)計量,也能夠應用,在隨時間變化地接受信號及噪聲統(tǒng)計量的情況下,也具有能夠進行最佳操作的效果。
如果按照上述那樣地根據本發(fā)明的第一方面,通過具有從輸入音響信號求出自相關信息的自相關分析裝置;從自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從聲道預測系數(shù)求出預測增益系數(shù)的預測增益系數(shù)分析裝置;從輸入音響信號、聲道預測系數(shù)和預測增益系數(shù)檢出輸入音響信號的非聲音信號區(qū)間,調節(jié)該非聲音信號區(qū)間內的自相關信息的自相關調節(jié)裝置;從調節(jié)后的自相關信息得到補償了非聲音信號區(qū)間內的聲道預測系數(shù)的補償后聲道預測系數(shù)的聲道預測系數(shù)補償裝置;利用補償后聲道預測系數(shù)和自適應激勵信號、對輸入音響信號進行碼激勵線性預測編碼的編碼裝置,由此來調節(jié)非聲音信號區(qū)間音響信號的自相關信息,能夠減小非聲音信號區(qū)間音響信號的影響。
還有,如果根據本發(fā)明的第二方面,通過具有從輸入音響信號求出自相關信息的自相關分析裝置;從自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從聲道預測系數(shù)求出預測增益系數(shù)的預測增益系統(tǒng)分析裝置;與從聲道預測系數(shù)求出LSP系數(shù)的同時、從輸入音響信號、聲道預測系數(shù)和預測增益系數(shù)檢出輸入音響信號的非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的LSP系數(shù)的LSP系統(tǒng)調節(jié)裝置;從調節(jié)后的LSP系數(shù)得到補償了非聲音信號區(qū)間內的聲道預測系數(shù)的補償后聲道預測系數(shù)的聲道預測系數(shù)補償裝置;利用補償后聲道預測系數(shù)和自適應激勵信號、對輸入音響信號進行碼激勵線性預測編碼的編碼裝置,由此,因為在LSP系數(shù)的階段中抑制了非聲音信號區(qū)間內的頻譜變動,所以,能夠減小非聲音信號區(qū)間音響信號的影響。
又,如果根據本發(fā)明的第三方面,通過具有從輸入音響信號求出自相關信息的自相關分析裝置;從自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從聲道預測系數(shù)求出預測增益系數(shù)的預測增益系數(shù)分析裝置;從輸入音響信號、預測增益系數(shù)和聲道預測系數(shù)檢出非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的聲道預測系數(shù)、得到調節(jié)后聲道預測系數(shù)的聲道系數(shù)調節(jié)裝置;利用調節(jié)后聲道預測系數(shù)和自適應激勵信號、對輸入音響信號進行碼激勵線性預測編碼的編碼裝置,由此,因為能夠根據聲道預測系數(shù)直接調節(jié)非聲音信號區(qū)間的聲道預測系數(shù),所以,使運算量非常小,同時,能夠減小非聲音信號區(qū)間音響信號對編碼輸出的影響。
進而還有,如果根據本發(fā)明的第四方面,通過具有從輸入音響信號求出自相關信息的自相關分析裝置;從自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從聲道預測系數(shù)求出預測增益系數(shù)的預測增益系數(shù)分析裝置;從對輸入音響信號進行帶通處理以后得到的帶通處理信號和預測增益系數(shù)中檢出非聲音信號區(qū)間、對該非聲音信號區(qū)間進行信號分析、產生用來消除噪聲的濾波系數(shù)、利用濾波系數(shù)對輸入音響信號進行噪聲消除、產生用來生成合成聲音信號的目標信號的噪聲消除裝置;利用聲道預測系數(shù)產生合成聲音信號的合成聲音發(fā)生裝置;利用聲道預測系數(shù)和目標信號對輸入音響信號進行碼激勵線性預測編碼的編碼裝置,由此,因為能夠得到消除了噪聲的目標信號,所以,對非聲音信號區(qū)間的編碼輸出沒有噪聲的影響。
因而,能夠實現(xiàn)能夠減小非聲音信號區(qū)間內音響信號(噪聲、或轉動聲、或振動聲,等等)對編碼輸出的影響,進行良好聲音再生的碼激勵線性預測編碼裝置。
權利要求
1.一種碼激勵線性預測編碼裝置,其特征在于,具有從輸入音響信號求出自相關矩陣信息的自相關分析裝置;從所述自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從所述聲道預測系數(shù)求出預測增益系數(shù)的預測增益系數(shù)分析裝置;從所述輸入音響信號、所述聲道預測系數(shù)和所述預測增益系數(shù)檢出輸入音響信號的非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的所述自相關信息的自相關調節(jié)裝置;從所述調節(jié)后的自相關信息得到補償了非聲音信號區(qū)間內聲道預測系數(shù)的補償后聲道預測系數(shù)的聲道預測系數(shù)補償裝置;利用所述補償后聲道預測系數(shù)和自適應激勵信號對輸入音響信號進行碼激勵線性預測編碼的編碼裝置。
2.一種碼激勵線性預測編碼裝置,其特征在于,具有從輸入音響信號求出自相關信息的自相關分析裝置;從所述自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從所述聲道預測系數(shù)求出預測增益系數(shù)的預測增益系數(shù)分析裝置;與從所述聲道預測系數(shù)求出LSP系數(shù)的同時、從所述輸入音響信號、所述聲道預測系數(shù)和所述預測增益系數(shù)檢出輸入音響信號的非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的所述LSP系數(shù)的LSP系數(shù)調節(jié)裝置;從所述調節(jié)后的LSP系數(shù)得到補償了非聲音信號區(qū)間內聲道預測系數(shù)的補償后聲道預測系數(shù)的聲道預測系數(shù)補償裝置;利用所述補償后聲道預測系數(shù)和自適應激勵信號、對輸入音響信號進行碼激勵線性預測編碼的編碼裝置。
3.一種碼激勵線性預測編碼裝置,其特征在于,具有從輸入音響信號求出自相關信息的自相關分析裝置;從所述自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從所述聲道預測系數(shù)求出預測增益系數(shù)的預測增益系數(shù)分析裝置;從所述輸入音響信號、所述預測增益系數(shù)和所述聲道預測系數(shù)檢出非聲音信號區(qū)間、調節(jié)該非聲音信號區(qū)間內的所述聲道預測系數(shù),得到調節(jié)后聲道預測系數(shù)的聲道系數(shù)調節(jié)裝置;利用所述調節(jié)后聲道預測系數(shù)和自適應激勵信號對輸入音響信號進行碼激勵線性預測編碼的編碼裝置。
4.一種碼激勵線性預測編碼裝置,其特征在于,具有從輸入音響信號求出自相關信息的自相關分析裝置;從所述自相關分析裝置的分析結果求出聲道預測系數(shù)的聲道預測系數(shù)分析裝置;從所述聲道預測系數(shù)求出預測增益系數(shù)的預測增益系數(shù)分析裝置;從對所述輸入音響信號進行帶通處理以后得到的帶通處理信號和所述預測增益系數(shù)檢出非聲音信號區(qū)間、對該非聲音信號區(qū)間進行信號分析、產生用來消除噪聲的濾波系數(shù)、利用所述濾波系數(shù)對所述輸入音響信號進行噪聲消除,產生用來生成合成聲音信號的目標信號的噪聲消除裝置;利用所述聲道預測系數(shù)產生所述合成聲音信號的合成聲音發(fā)生裝置;利用所述聲道預測系數(shù)和所述目標信號對輸入音響信號進行碼激勵線性預測編碼的編碼裝置。
全文摘要
一種編碼裝置,減小了非聲音信號區(qū)間內音響信號對編碼輸出的影響,進行良好的聲音再生。調節(jié)單元111一接受自相關矩陣R、聲音/噪聲判定信號V、聲道預測系數(shù)a,就求出新的自相關矩陣Ra。分析單元103從自相關矩陣R求出聲道預測系數(shù)a,同時,一接受自相關矩陣Ra,就求出最佳聲道預測系數(shù)aa,將其提供到合成濾波器104上。
文檔編號G10L11/02GK1152164SQ9611148
公開日1997年6月18日 申請日期1996年8月23日 優(yōu)先權日1995年8月23日
發(fā)明者伊東克俊 申請人:沖電氣工業(yè)株式會社