語音編碼/解碼裝置及其方法

文檔序號：2822279閱讀：203來源：國知局

專利名稱：語音編碼/解碼裝置及其方法
技術領域：
本發(fā)明涉及對語音信號進行編碼來傳輸?shù)囊苿油ㄐ畔到y(tǒng)或語音錄音裝置等用途中所用的低比特率語音編碼裝置。
背景技術：
在數(shù)字移動通信或語音存儲領域，為了有效利用電波或記錄媒體，使用對語音信息進行壓縮、以低比特率進行編碼的語音編碼裝置。特別是，主要在語音信號的有聲區(qū)間中對語音信號進行編碼傳輸，而在無聲區(qū)間中則由專用的無聲區(qū)間的噪聲信號編碼器以比有聲區(qū)間低的比特率進行編碼傳輸。由此，能夠進一步降低傳輸?shù)谋忍芈省?br> 作為這種以低比特率進行編碼的現(xiàn)有技術，有ITU-T推薦的G.729 AnnexB(附錄B)(″A silence compression scheme for G.729 optimized for terminalsconforming to Recommendation V.70(最適于符合推薦V.70的終端的G.729無聲壓縮方案)″)的帶有DTX(Discontinuous Transmission，不連續(xù)傳輸)控制的CS-ACELP(conjugate-structure algebraic-code-excited linear-prediction，共軛結(jié)構(gòu)代數(shù)碼激勵線性預測)編碼方式。
現(xiàn)有技術的帶有DTX控制的CS-ACELP編碼方式的編碼裝置的結(jié)構(gòu)示于圖1。在該編碼裝置中，首先由有聲/無聲判定器1判定輸入信號是有聲區(qū)間還是無聲區(qū)間(只有背景噪聲的區(qū)間)。
然后，在有聲/無聲判定器1判定為有聲的情況下，由CS-ACELP語音編碼器2對輸入信號進行有聲區(qū)間的語音編碼。另一方面，在有聲/無聲判定器1判定為無聲的情況下，由無聲區(qū)間編碼器3對輸入信號進行無聲區(qū)間中的背景噪聲的編碼。
該無聲區(qū)間編碼器3根據(jù)輸入信號來計算與有聲區(qū)間的編碼同樣的LPC系數(shù)和輸入信號的LPC預測殘差能量，將它們作為無聲區(qū)間的編碼數(shù)據(jù)輸出到DTX控制及復用器4。
DTX控制及復用器4根據(jù)有聲/無聲判定器1、CS-ACELP語音編碼器2及無聲區(qū)間編碼器3的輸出，對要作為發(fā)送數(shù)據(jù)發(fā)送的數(shù)據(jù)進行控制、復用，并作為發(fā)送數(shù)據(jù)來輸出。
接著，圖2示出現(xiàn)有技術的解碼裝置的結(jié)構(gòu)。在該解碼裝置中，分離及DTX控制器11將編碼端對輸入信號進行編碼發(fā)送的發(fā)送數(shù)據(jù)作為接收數(shù)據(jù)來接收，將該接收數(shù)據(jù)分離為語音解碼及噪聲生成所需的語音編碼數(shù)據(jù)或噪聲編碼數(shù)據(jù)、和有聲/無聲判定標志。
接著，在上述有聲/無聲判定標志表示有聲區(qū)間的情況下，由CS-ACELP語音解碼器12根據(jù)上述語音編碼數(shù)據(jù)來進行語音解碼，將解碼語音輸出到輸出切換器14。另一方面，在上述有聲/無聲判定標志表示無聲區(qū)間的情況下，由噪聲信號生成器13根據(jù)上述噪聲編碼數(shù)據(jù)來進行噪聲信號的生成，將噪聲信號輸出到輸出切換器14。
然后，輸出切換器14按照有聲/無聲判定標志的結(jié)果來切換并輸出上述語音解碼器12的輸出和上述噪聲信號生成器13的輸出，作為輸出信號。即，在有聲區(qū)間中將語音解碼器12的輸出作為輸出信號，而在無聲區(qū)間中則將噪聲信號生成器13的輸出作為輸出信號。
在上述現(xiàn)有語音編碼裝置中，只有有聲區(qū)間由CS-ACELP語音編碼器進行編碼，而無聲區(qū)間(只有噪聲的區(qū)間)則由專用的無聲區(qū)間編碼器以比語音編碼器低的比特率進行編碼，從而使傳輸?shù)钠骄忍芈式档汀?br> 然而，在作為輸入信號輸入了疊加有周圍背景噪聲的語音信號的情況下，在有聲區(qū)間中，由于該疊加的背景噪聲的影響，解碼語音的品質(zhì)惡化。此外，由于在無聲區(qū)間中用與有聲區(qū)間不同的方法編碼過的數(shù)據(jù)來生成噪聲，所以有聲區(qū)間中的解碼語音中的背景噪聲和無聲區(qū)間中生成的背景噪聲的聽覺品質(zhì)不同，因而產(chǎn)生不自然感。在編碼的比特率是8kbit/s及其以下的低比特率時，這些傾向特別顯著。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種語音編碼裝置及解碼裝置，即使對疊加有背景噪聲的語音信號，也使解碼信號的品質(zhì)惡化少。
本發(fā)明的主題是不僅在無聲區(qū)間中、也在有聲區(qū)間中生成噪聲信號，在有聲區(qū)間中將該噪聲信號附加到解碼語音信號上并輸出，即使對疊加有背景噪聲的語音信號，也使解碼信號的品質(zhì)惡化少。

圖1是現(xiàn)有語音編碼裝置的結(jié)構(gòu)方框圖；圖2是現(xiàn)有語音解碼裝置的結(jié)構(gòu)方框圖；圖3是包括本發(fā)明實施例1的語音編碼/解碼裝置的無線通信裝置的結(jié)構(gòu)方框圖；圖4是本發(fā)明實施例1的語音編碼裝置的結(jié)構(gòu)方框圖；圖5是本發(fā)明實施例1的語音解碼裝置的結(jié)構(gòu)方框圖；圖6是本發(fā)明實施例1的語音編碼方法的處理流程圖；圖7是本發(fā)明實施例1的語音解碼方法的處理流程圖；圖8A是示意性表示現(xiàn)有語音解碼裝置得到的輸出信號的示例圖；圖8B是示意性表示本發(fā)明的語音解碼裝置得到的輸出信號的示例圖；而圖9是本發(fā)明實施例2的語音解碼裝置中的語音/噪聲信號加法器的結(jié)構(gòu)方框圖。
具體實施例方式
以下，參照附圖來詳細說明本發(fā)明的實施例。
(實施例1)圖3是包括本發(fā)明實施例1的語音編碼/解碼裝置的無線通信裝置的結(jié)構(gòu)方框圖。在該無線通信裝置中，在發(fā)送端，語音由話筒等語音輸入裝置101變換為電模擬信號，輸出到A/D變換器102。模擬語音信號由A/D變換器102變換為數(shù)字信號，輸出到語音編碼裝置103。
語音編碼裝置103對數(shù)字語音信號進行語音編碼處理，將編碼過的信息輸出到調(diào)制解調(diào)部104。調(diào)制解調(diào)部104對編碼過的語音信號進行數(shù)字調(diào)制，送至無線發(fā)送部105。無線發(fā)送部105對調(diào)制后的信號施加規(guī)定的無線發(fā)送處理。該信號經(jīng)天線106被發(fā)送。
另一方面，在無線通信裝置的接收端，天線107接收到的接收信號由無線接收部108施加規(guī)定的無線接收處理，送至調(diào)制解調(diào)部104。調(diào)制解調(diào)部104對接收信號進行解調(diào)處理，將解調(diào)后的信號輸出到語音解碼裝置109。語音解碼裝置109對解調(diào)后的信號進行語音解碼處理，得到數(shù)字解碼語音信號，將該數(shù)字解碼語音信號輸出到D/A變換器110。
D/A變換器110將從語音解碼裝置109輸出的數(shù)字解碼語音信號變換為模擬語音信號，輸出到揚聲器等語音輸出裝置111。最后，語音輸出裝置111將電模擬信號變?yōu)檎Z音并輸出。
圖3所示的語音編碼裝置103具有圖4所示的結(jié)構(gòu)。圖4是本發(fā)明實施例1的語音編碼裝置的結(jié)構(gòu)方框圖。有聲/無聲判定器201判定輸入語音信號是有聲區(qū)間還是無聲區(qū)間(只有噪聲的區(qū)間)，將其判定結(jié)果(區(qū)間判定信息)輸出到DTX及復用器204。
有聲/無聲判定器201可以是任意的，一般用輸入信號的功率、頻譜或音調(diào)周期等多個參數(shù)的瞬時量或變化量等來進行判定。
然后，在有聲/無聲判定器201的判定結(jié)果是有聲的情況下，由語音編碼器202對輸入語音信號進行語音編碼，將該編碼數(shù)據(jù)輸出到DTX及復用器204。該語音編碼器202是有聲區(qū)間編碼器，也可以是對語音高效率進行編碼的任意編碼器。
另一方面，在上述有聲/無聲判定器201的判定結(jié)果是無聲的情況下，由噪聲信號編碼器203在只含噪聲信號的無聲區(qū)間中對輸入信號進行噪聲信號的編碼，將噪聲編碼數(shù)據(jù)輸出到DTX及復用器204。該噪聲信號編碼器203可以是任意的，一般對表示噪聲信號頻譜的信息(例如，LPC參數(shù))及表示信號功率的信息進行編碼。
最后，DTX控制及復用器204用來自有聲/無聲判定器201、語音編碼器202及噪聲信號編碼器203的輸出進行要作為發(fā)送數(shù)據(jù)來發(fā)送的信息的控制和發(fā)送信息的復用，作為發(fā)送數(shù)據(jù)來輸出。
接著，說明語音解碼裝置109的結(jié)構(gòu)。圖3所示的語音解碼裝置109具有圖5所示的結(jié)構(gòu)。首先，分離及DTX控制器301將編碼端對輸入信號進行編碼而發(fā)送的發(fā)送數(shù)據(jù)作為接收數(shù)據(jù)來接收，分離為語音解碼或噪聲生成所需的語音編碼數(shù)據(jù)或噪聲編碼數(shù)據(jù)、和有聲/無聲判定標志。
接著，在有聲/無聲判定標志表示有聲區(qū)間的情況下，由語音解碼器302根據(jù)語音編碼數(shù)據(jù)來進行語音解碼，輸出解碼語音。此外，由噪聲信號生成器303根據(jù)噪聲編碼數(shù)據(jù)來進行噪聲信號的生成，輸出噪聲信號。噪聲信號生成例如如下實現(xiàn)在編碼端用頻譜和功率來表示噪聲信號，用LPC參數(shù)對頻譜進行編碼，用LPC殘差信號功率對功率進行了編碼的情況下，在接收端用對具有解碼過的LPC殘差信號功率的隨機驅(qū)動音源進行解碼所得的LPC參數(shù)來進行LPC合成。
也可以采用下述結(jié)構(gòu)通過DTX控制，在無聲區(qū)間中，按照一定周期間隔或需要來接收噪聲編碼數(shù)據(jù)并進行噪聲生成，在什么也沒有接收到的區(qū)間中輸出用過去接收到的噪聲編碼數(shù)據(jù)來生成的噪聲信號。
然后，語音/噪聲信號加法器304在無聲區(qū)間中原封不動地輸出噪聲信號生成器303輸出的生成噪聲信號，作為解碼信號輸出，而在有聲區(qū)間中，則將語音解碼器302輸出的解碼語音信號和噪聲信號生成器303輸出的生成噪聲信號相加，作為解碼信號輸出。
接著，說明具有上述結(jié)構(gòu)的語音編碼部及語音解碼部的工作情況。
圖6是本發(fā)明實施例1的語音編碼方法的處理流程圖。在本方法中，按一定的短區(qū)間(例如，10～50ms左右)的每幀來重復進行圖6所示的主處理。
首先，在步驟(以下簡稱ST)11中，輸入以幀為單位的輸入信號。接著，在ST12中，對輸入信號進行有聲/無聲判定(ST13)，輸出其判定結(jié)果。然后，在該判定結(jié)果是有聲的情況下，通過ST14對輸入語音信號進行語音編碼處理，輸出其編碼數(shù)據(jù)。
另一方面，在ST13的判定結(jié)果是無聲的情況下，在ST15中由噪聲信號編碼器對輸入信號進行噪聲信號編碼處理，輸出表現(xiàn)輸入噪聲信號的噪聲編碼數(shù)據(jù)。
然后，在ST16中，用有聲/無聲判定、語音編碼處理及噪聲信號編碼處理的結(jié)果所得到的輸出進行要作為發(fā)送數(shù)據(jù)來發(fā)送的信息的控制和發(fā)送信息的復用，最后在ST17中作為發(fā)送數(shù)據(jù)來輸出。
圖7是本發(fā)明實施例1的語音解碼方法的處理流程圖。在本方法中，按一定的短區(qū)間(例如，10～50ms左右)的每幀來重復進行圖7所示的主處理。
首先，在ST21中，輸入編碼端對輸入信號進行編碼而發(fā)送的發(fā)送數(shù)據(jù)。接著，在ST22中，分離語音解碼及噪聲生成所需的語音編碼數(shù)據(jù)或噪聲編碼數(shù)據(jù)、和有聲/無聲判定標志。
在ST23中，檢查有聲/無聲判定標志表示的有聲/無聲判定結(jié)果(ST24)，在有聲/無聲判定標志表示有聲區(qū)間的情況下，在ST25中，由語音編碼數(shù)據(jù)來進行語音解碼，輸出解碼語音。接著，在ST26中，由噪聲編碼數(shù)據(jù)來進行噪聲信號的生成，輸出生成噪聲信號。
然后，在ST27中，將ST25輸出的解碼語音信號、和ST26輸出的生成噪聲信號相加。但是，在無聲區(qū)間中，不加上解碼語音信號，只輸出生成噪聲信號。最后，在ST28中，將最終得到的輸出信號作為解碼器的輸出來輸出。
圖8示意性地示出在輸入了疊加有背景噪聲的語音信號的情況下，用現(xiàn)有語音解碼裝置得到的輸出信號及用本發(fā)明的語音解碼裝置得到的輸出信號的例子。
在現(xiàn)有技術的語音解碼裝置中，如圖8A所示，在有聲區(qū)間中，對疊加有背景噪聲的語音信號進行解碼所造成的解碼語音失真直接引起聽覺品質(zhì)惡化，并且有聲區(qū)間中的解碼語音中的背景噪聲和用與有聲區(qū)間不同的方法生成的無聲區(qū)間中的背景噪聲的聽覺品質(zhì)不同，因而產(chǎn)生不自然感。
與此相反，在本發(fā)明的語音解碼裝置中，如圖8B所示，不僅在無聲區(qū)間中、也在有聲區(qū)間中將噪聲信號生成器生成的生成噪聲信號附加到解碼語音信號上并輸出，從而有聲區(qū)間的背景噪聲造成的品質(zhì)惡化被掩蓋，減少惡化的影響，并且有聲區(qū)間中的解碼語音中的背景噪聲和無聲區(qū)間中生成的背景噪聲的聽覺品質(zhì)類似，從而不自然感減少。
于是，根據(jù)本實施例的語音編碼·解碼裝置及語音編碼·解碼方法，噪聲信號生成器不僅在無聲區(qū)間中、也在有聲區(qū)間中也生成噪聲信號，語音/噪聲信號加法器在有聲區(qū)間中對解碼語音信號附加生成噪聲信號并輸出，從而即使對疊加有背景噪聲的語音信號，也能用相加的生成噪聲信號來掩蓋有聲區(qū)間的背景噪聲，減少惡化的影響。此外，通過有聲區(qū)間中的解碼語音中的背景噪聲和無聲區(qū)間中生成的背景噪聲的聽覺品質(zhì)類似，從而不自然感減少，能夠進行改善了語音品質(zhì)的語音解碼。
(實施例2)圖9是本發(fā)明實施例2的語音解碼裝置中的語音/噪聲信號加法器的結(jié)構(gòu)方框圖。本發(fā)明實施例2的語音解碼裝置的整體結(jié)構(gòu)及其工作情況除了語音/噪聲信號加法器外與實施例1相同，所以省略其說明，用圖9只說明語音/噪聲信號加法器的工作情況。
在圖9中，相加噪聲特性控制器401按照生成噪聲信號的特性來自適應地控制相加到有聲區(qū)間中的噪聲的特性。特性控制后的生成噪聲信號被輸出到加法器402，與另外輸入到加法器402中的解碼語音信號相加，作為解碼輸出信號來輸出。在此情況下，相加噪聲特性控制器401根據(jù)有聲/無聲判定標志來切換相加的噪聲信號，輸出到加法器402。由此，能夠自適應地切換相加到有聲區(qū)間上的噪聲信號和相加到無聲區(qū)間上的噪聲信號，能夠得到在聽覺上進一步改善了語音品質(zhì)的解碼語音。
相加噪聲特性控制器401的控制具體如下所述在有聲區(qū)間中，作為一例，在輸入到相加噪聲特性控制器401中的生成噪聲信號具有非平穩(wěn)特性的情況下，抑制輸入的生成噪聲信號的電平，將抑制后的生成噪聲信號輸出到加法器402。
生成噪聲信號的非平穩(wěn)性例如可以如下判定分析接收到的噪聲編碼數(shù)據(jù)或生成噪聲信號的頻譜及功率的變動，在該變動大的情況下，判定為非平穩(wěn)?；蛘咭部梢栽诰幋a端將在無聲區(qū)間中的噪聲信號編碼中對輸入信號進行信號分析而得到的信號特性(例如，平穩(wěn)/非平穩(wěn))作為編碼信息來傳輸。此外，相加噪聲特性控制器401也可以不僅控制相加的生成噪聲的電平，而且控制其他特性(例如，頻譜形狀)。
于是，根據(jù)本實施例的語音解碼裝置，由于按照輸入信號上疊加的背景噪聲的特性來自適應地控制加到有聲區(qū)間中的生成噪聲的特性，所以能夠進行在聽覺上進一步改善了語音品質(zhì)的解碼。具體地說，作為一例，在判定無聲區(qū)間的噪聲信號的特性為非平穩(wěn)的情況下，通過減小附加到有聲區(qū)間中的生成噪聲信號的電平，能夠減少在有聲區(qū)間中附加生成噪聲而造成的不必要的噪聲感。
本發(fā)明能夠應用于數(shù)字無線通信系統(tǒng)中的無線基站裝置或通信終端裝置。由此，能夠進行聽覺上改善了的語音信號的發(fā)送接收。
本發(fā)明不限于上述實施例1、2，可以進行各種變更來實施。上述實施例1、2的語音編碼/解碼裝置是作為語音編碼/解碼裝置來說明的，但是也可以將這些語音編碼/解碼作為軟件來構(gòu)成。例如，也可以將上述語音編碼/解碼的程序保存到ROM上，使之根據(jù)該程序按照CPU的指示來工作。此外，也可以將語音編碼/解碼程序保存到計算機可讀的存儲媒體上，將該存儲媒體的語音編碼/解碼程序記錄到計算機的RAM上，使之根據(jù)程序來工作。在這種情況下，也呈現(xiàn)與上述實施例1、2同樣的作用、效果。
本發(fā)明的語音解碼裝置采用下述結(jié)構(gòu)，包括接收部，接收包含編碼端編碼過的語音編碼數(shù)據(jù)及噪聲編碼數(shù)據(jù)、以及區(qū)間判定信息的信號；語音解碼部，在上述區(qū)間判定信息表示有聲區(qū)間的情況下對上述語音編碼數(shù)據(jù)進行解碼；噪聲信號生成部，由上述噪聲編碼數(shù)據(jù)來生成噪聲信號；以及噪聲信號加法部，在上述有聲區(qū)間中，將上述語音解碼部解碼過的解碼語音信號與上述噪聲信號相加。
根據(jù)該結(jié)構(gòu)，由于噪聲信號生成部不僅在無聲區(qū)間中、也在有聲區(qū)間中生成噪聲信號，噪聲信號加法部在有聲區(qū)間中對解碼語音信號附加生成噪聲信號并輸出，所以即使對疊加有背景噪聲的語音信號，也能通過相加的生成噪聲信號來掩蓋有聲區(qū)間的背景噪聲造成的品質(zhì)惡化，減少惡化的影響。此外，通過使有聲區(qū)間中的解碼語音中的背景噪聲和無聲區(qū)間中生成的背景噪聲的聽覺品質(zhì)類似，從而不自然感減少，能夠進行改善了語音品質(zhì)的解碼。
本發(fā)明的語音解碼裝置在上述結(jié)構(gòu)中采用下述結(jié)構(gòu)噪聲信號加法部根據(jù)噪聲編碼數(shù)據(jù)或噪聲信號的特性來自適應地控制加到有聲區(qū)間中的噪聲信號的特性。
根據(jù)該結(jié)構(gòu)，按照輸入信號上疊加的背景噪聲的特性來自適應地控制加到有聲區(qū)間中的生成噪聲的特性，從而能夠進行在聽覺上進一步改善了語音品質(zhì)的解碼。
本發(fā)明的語音解碼裝置在上述結(jié)構(gòu)中采用下述結(jié)構(gòu)在區(qū)間判定信息為無聲區(qū)間情況下的噪聲信號的特性是非平穩(wěn)時，噪聲信號加法部減小加到有聲區(qū)間中的噪聲信號的電平。
根據(jù)該結(jié)構(gòu)，能夠減少在有聲區(qū)間中附加生成噪聲而造成的不必要的噪聲感。
本發(fā)明的語音編碼/解碼裝置采用下述結(jié)構(gòu)，包括語音編碼裝置和上述結(jié)構(gòu)的語音解碼裝置，該語音編碼裝置包括區(qū)間判定部，判定輸入語音信號是有聲區(qū)間還是無聲區(qū)間；語音編碼部，在上述區(qū)間判定部的判定結(jié)果是有聲的情況下，對上述輸入語音信號進行語音編碼；以及噪聲信號編碼部，在上述區(qū)間判定部的判定結(jié)果是無聲的情況下，對上述輸入語音信號進行噪聲信號的編碼。
根據(jù)該結(jié)構(gòu)，即使對于疊加有背景噪聲的語音信號，也能夠抑制解碼信號的品質(zhì)惡化來進行編碼·解碼。
本發(fā)明的基站裝置的特征在于包括上述結(jié)構(gòu)的語音解碼裝置、或上述結(jié)構(gòu)的語音編碼/解碼裝置。此外，本發(fā)明的通信終端裝置的特征在于包括上述結(jié)構(gòu)的語音解碼裝置、或上述結(jié)構(gòu)的語音編碼/解碼裝置。根據(jù)這些結(jié)構(gòu)，能夠進行聽覺上改善了的語音信號的發(fā)送接收。
本發(fā)明的語音解碼方法包括接收步驟，接收包含編碼端編碼過的語音編碼數(shù)據(jù)及噪聲編碼數(shù)據(jù)、以及區(qū)間判定信息的信號；語音解碼步驟，在上述區(qū)間判定信息表示有聲區(qū)間的情況下對上述語音編碼數(shù)據(jù)進行解碼；噪聲信號生成步驟，由上述噪聲編碼數(shù)據(jù)來生成噪聲信號；以及噪聲信號加法步驟，在上述有聲區(qū)間中，將上述語音解碼步驟解碼過的解碼語音信號與上述噪聲信號相加。
根據(jù)該方法，噪聲信號生成步驟不僅在無聲區(qū)間中、也在有聲區(qū)間中生成噪聲信號，噪聲信號加法步驟在有聲區(qū)間中對解碼語音信號附加生成噪聲信號并輸出，從而即使對疊加有背景噪聲的語音信號，也能通過相加的生成噪聲信號來掩蓋有聲區(qū)間的背景噪聲，減少惡化的影響。此外，有聲區(qū)間中的解碼語音中的背景噪聲和無聲區(qū)間中生成的背景噪聲的聽覺品質(zhì)類似，從而不自然感減少，能夠進行改善了語音品質(zhì)的解碼。
本發(fā)明的語音解碼方法在上述方法中，在噪聲信號加法步驟中，根據(jù)噪聲編碼數(shù)據(jù)或噪聲信號的特性來自適應地控制加到有聲區(qū)間中的噪聲信號的特性。
根據(jù)該方法，按照輸入信號上疊加的背景噪聲的特性來自適應地控制加到有聲區(qū)間中的生成噪聲的特性，從而能夠進行在聽覺上進一步改善了語音品質(zhì)的解碼。
本發(fā)明的語音解碼方法在上述方法中，在噪聲信號加法步驟中，在區(qū)間判定信息為無聲區(qū)間情況下的噪聲信號的特性是非平穩(wěn)時，減小相加到有聲區(qū)間中的噪聲信號的電平。
根據(jù)該方法，能夠減少在有聲區(qū)間中附加生成噪聲而造成的不必要的噪聲感。
本發(fā)明的語音解碼方法的特征在于，將編碼時相加的噪聲信號相加到有聲區(qū)間上。由此，通過該相加的生成噪聲信號來掩蓋有聲區(qū)間的背景噪聲造成的品質(zhì)惡化，減少惡化的影響。
本發(fā)明的語音編碼/解碼方法包括語音編碼步驟和上述語音解碼步驟，在該語音編碼步驟中，判定輸入語音信號是有聲區(qū)間還是無聲區(qū)間，在上述判定的結(jié)果是有聲的情況下，對上述輸入語音信號進行語音編碼，而在上述判定的結(jié)果是無聲的情況下，對上述輸入語音信號進行噪聲信號的編碼。
根據(jù)該方法，即使對于疊加有背景噪聲的語音信號，也能夠抑制解碼信號的品質(zhì)惡化來進行編碼·解碼。
本發(fā)明的記錄媒體是保存語音解碼程序、計算機可讀取的記錄媒體，上述語音解碼程序包括在包含編碼端編碼過的語音編碼數(shù)據(jù)及噪聲編碼數(shù)據(jù)、以及區(qū)間判定信息的信號的上述區(qū)間判定信息表示有聲區(qū)間的情況下對語音編碼數(shù)據(jù)進行解碼的步驟；由上述噪聲編碼數(shù)據(jù)來生成噪聲信號的步驟；在上述有聲區(qū)間中，將解碼過的解碼語音信號與上述噪聲信號相加的步驟。
如上所述，在本發(fā)明的語音編碼·解碼裝置中，噪聲信號生成器不僅在無聲區(qū)間中、也在有聲區(qū)間中生成噪聲信號，語音/噪聲信號加法器在有聲區(qū)間中對解碼語音信號附加生成噪聲信號并輸出。由此，即使對疊加有背景噪聲的語音信號，也能用相加的生成噪聲信號來掩蓋有聲區(qū)間的背景噪聲，減少惡化的影響，并且通過使有聲區(qū)間中的解碼語音中的背景噪聲和無聲區(qū)間中生成的背景噪聲的聽覺品質(zhì)類似，從而減少不自然感，能夠進行改善了語音品質(zhì)的語音解碼。
此外，在本發(fā)明的語音編碼·解碼裝置中，按照輸入信號上疊加的背景噪聲的特性來自適應地控制加到有聲區(qū)間中的生成噪聲的特性。由此，能夠進行在聽覺上進一步改善了語音品質(zhì)的解碼。具體地說，作為一例，在判定無聲區(qū)間的噪聲信號的特性為非平穩(wěn)的情況下，通過減小附加到有聲區(qū)間中的生成噪聲信號的電平，能夠減少在有聲區(qū)間中附加生成噪聲而造成的不必要的噪聲感。
本說明書基于2000年2月29日申請的(日本)2000-054108專利申請。其內(nèi)容全部包含于此。
產(chǎn)業(yè)上的可利用性本發(fā)明能夠應用于對語音信號進行編碼來傳輸?shù)囊苿油ㄐ畔到y(tǒng)或語音錄音裝置等用途中所用的低比特率語音編碼裝置。
權(quán)利要求
1.一種語音解碼裝置，包括接收部件，接收包含編碼端編碼過的語音編碼數(shù)據(jù)及噪聲編碼數(shù)據(jù)、以及區(qū)間判定信息的信號；語音解碼部件，在所述區(qū)間判定信息表示有聲區(qū)間的情況下，對所述語音編碼數(shù)據(jù)進行解碼；噪聲信號生成部件，由所述噪聲編碼數(shù)據(jù)來生成噪聲信號；以及噪聲信號加法部件，在所述有聲區(qū)間中，將所述語音解碼部件解碼過的解碼語音信號與所述噪聲信號相加。
2.如權(quán)利要求1所述的語音解碼裝置，其中，噪聲信號加法部件根據(jù)噪聲編碼數(shù)據(jù)或噪聲信號的特性來自適應地控制相加到有聲區(qū)間中的噪聲信號的特性。
3.如權(quán)利要求2所述的語音解碼裝置，其中，在區(qū)間判定信息為無聲區(qū)間情況下的噪聲信號的特性是非平穩(wěn)時，噪聲信號加法部件減小相加到有聲區(qū)間中的噪聲信號的電平。
4.一種語音編碼/解碼裝置，包括語音編碼裝置和權(quán)利要求1所述的語音解碼裝置，其中，該語音編碼裝置包括區(qū)間判定部件，判定輸入語音信號是有聲區(qū)間還是無聲區(qū)間；語音編碼部件，在所述區(qū)間判定部件的判定結(jié)果是有聲的情況下，對所述輸入語音信號進行語音編碼；以及噪聲信號編碼部件，在所述區(qū)間判定部件的判定結(jié)果是無聲的情況下，對所述輸入語音信號進行噪聲信號的編碼。
5.一種語音編碼裝置，包括區(qū)間判定部件，判定輸入語音信號是有聲區(qū)間還是無聲區(qū)間；語音編碼部件，在所述區(qū)間判定部件的判定結(jié)果是有聲的情況下，對所述輸入語音信號進行語音編碼；以及噪聲信號編碼部件，在所述區(qū)間判定部件的判定結(jié)果是無聲的情況下，對所述輸入語音信號進行噪聲信號的編碼。
6.一種語音解碼方法，包括接收步驟，接收包含編碼端編碼過的語音編碼數(shù)據(jù)及噪聲編碼數(shù)據(jù)、以及區(qū)間判定信息的信號；語音解碼步驟，在所述區(qū)間判定信息表示有聲區(qū)間的情況下，對所述語音編碼數(shù)據(jù)進行解碼；噪聲信號生成步驟，由所述噪聲編碼數(shù)據(jù)來生成噪聲信號；以及噪聲信號加法步驟，在所述有聲區(qū)間中，將所述語音解碼步驟解碼過的解碼語音信號與所述噪聲信號相加。
7.如權(quán)利要求6所述的語音解碼方法，其中，在噪聲信號加法步驟中，根據(jù)噪聲編碼數(shù)據(jù)或噪聲信號的特性來自適應地控制加到有聲區(qū)間中的噪聲信號的特性。
8.如權(quán)利要求7所述的語音解碼方法，其中，在噪聲信號加法步驟中，在區(qū)間判定信息為無聲區(qū)間情況下的噪聲信號的特性是非平穩(wěn)時，減小加到有聲區(qū)間中的噪聲信號的電平。
9.如權(quán)利要求6所述的語音解碼方法，其中，將編碼時加上的噪聲信號加到有聲區(qū)間上。
10.一種語音編碼/解碼方法，包括語音編碼步驟和權(quán)利要求6所述的語音解碼步驟，其中，在該語音編碼步驟中，判定輸入語音信號是有聲區(qū)間還是無聲區(qū)間，在所述判定的結(jié)果是有聲的情況下，對所述輸入語音信號進行語音編碼，而在所述判定的結(jié)果是無聲的情況下，對所述輸入語音信號進行噪聲信號的編碼。
11.一種計算機可讀的記錄媒體，保存語音解碼程序，其中，所述語音解碼程序包括在包含編碼端編碼過的語音編碼數(shù)據(jù)及噪聲編碼數(shù)據(jù)、以及區(qū)間判定信息的信號的所述區(qū)間判定信息表示有聲區(qū)間的情況下對語音編碼數(shù)據(jù)進行解碼的步驟；由所述噪聲編碼數(shù)據(jù)來生成噪聲信號的步驟；以及在所述有聲區(qū)間中，將解碼過的解碼語音信號與所述噪聲信號相加的步驟。
12.一種使計算機工作的語音解碼程序，其中，所述語音解碼程序包括在包含編碼端編碼過的語音編碼數(shù)據(jù)及噪聲編碼數(shù)據(jù)、以及區(qū)間判定信息的信號的所述區(qū)間判定信息表示有聲區(qū)間的情況下對語音編碼數(shù)據(jù)進行解碼的功能；由所述噪聲編碼數(shù)據(jù)來生成噪聲信號的功能；以及在所述有聲區(qū)間中，將解碼過的解碼語音信號與所述噪聲信號相加的功能。
全文摘要
分離及DTX控制器301將編碼端對輸入信號進行編碼發(fā)送的發(fā)送數(shù)據(jù)作為接收數(shù)據(jù)來接收,分離為語音解碼或噪聲生成所需的語音編碼數(shù)據(jù)或噪聲編碼數(shù)據(jù)、和有聲/無聲判定標志。在有聲/無聲判定標志表示有聲區(qū)間的情況下,由語音解碼器302根據(jù)語音編碼數(shù)據(jù)來進行語音解碼,輸出解碼語音。由噪聲信號生成器303根據(jù)噪聲編碼數(shù)據(jù)來進行噪聲信號的生成,輸出噪聲信號。語音/噪聲信號加法器304在無聲區(qū)間中原封不動地輸出噪聲信號生成器303輸出的生成噪聲信號,作為解碼信號輸出,而在有聲區(qū)間中,則將語音解碼器302輸出的解碼語音信號和噪聲信號生成器303輸出的生成噪聲信號相加,作為解碼信號輸出。
文檔編號G10L19/04GK1366658SQ01800859
公開日2002年8月28日申請日期2001年2月16日優(yōu)先權(quán)日2000年2月29日
發(fā)明者吉田幸司申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細技術資料下載