两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

可擴展性解碼裝置及可擴展性解碼方法

文檔序號:2832962閱讀:160來源:國知局
專利名稱:可擴展性解碼裝置及可擴展性解碼方法
技術領域
本發(fā)明涉及切換語音信號的頻帶的可擴展性解碼裝置及可擴展性解碼方法。
背景技術
一般來說,在被稱為可擴展性語音編碼、分層地對語音信號進行編碼的技術中,即使丟失了某一層(layer)的編碼數(shù)據(jù),也能夠從其它層的編碼數(shù)據(jù)而將語音信號解碼。在可擴展性編碼中,有被稱為頻帶可擴展性語音編碼的編碼方法。頻帶可擴展性語音編碼,使用對窄帶信號進行編碼、解碼的處理層,和使窄帶信號高質(zhì)量化、寬帶化而進行編碼、解碼的處理層。以下,將前者的處理層稱為核心層,后者的處理層稱為擴展層。將頻帶可擴展性語音編碼適用于,例如不保證傳送頻帶、且編碼數(shù)據(jù)會部分消失或延遲的通信網(wǎng)絡上的語音數(shù)據(jù)通信的情況下,接收端有時能夠接收核心層及擴展層雙方的編碼數(shù)據(jù)(核心層編碼數(shù)據(jù)及擴展層編碼數(shù)據(jù)),也有時只能夠接收核心層編碼數(shù)據(jù)。因此,設置在接收端的語音解碼裝置,需要對輸出的解碼語音信號,在僅由核心層編碼數(shù)據(jù)得到的窄帶的解碼語音信號和由核心層及擴展層雙方的編碼數(shù)據(jù)得到的寬帶的解碼語音信號之間進行切換。作為平穩(wěn)地切換窄帶解碼語音信號和寬帶解碼語音信號,以防止語音大小的不連續(xù)性和頻帶擴散感(頻帶感)的不連續(xù)性的方法,有例如專利文獻I記載的方法。該文獻記載的語音切換裝置,使兩信號(即窄帶解碼語音信號和寬帶解碼語音信號)的采樣頻率、 延遲及相位一致后,對兩信號進行加權加法。在加權加法中,讓兩信號的混合比以一定的程度(增加量或減少量)時間性地變化,同時將兩信號相加,接著,輸出的信號,在從窄帶解碼語音信號切換到寬帶解碼語音信號時,或者從寬帶解碼語音信號切換到窄帶解碼語音信號時,在窄帶解碼語音信號的輸出和寬帶解碼語音信號的輸出之間,進行加權加法信號的輸出。專利文獻I :日本專利公開公報2000-352999號

發(fā)明內(nèi)容
發(fā)明需要解決的問題然而,在上述以往的語音切換裝置中,由于兩信號的加權加法中所使用的混合比的變化程度是恒定的,因此解碼信號的收聽者會因為接收狀況而產(chǎn)生不協(xié)調(diào)感或波動感。 例如,如果在表示穩(wěn)定性背景噪音的信號包含于語音信號的區(qū)間內(nèi)頻繁地發(fā)生語音切換的話,則伴隨切換而產(chǎn)生的功率或頻帶感的變化容易被收聽者覺察出來。因此,對提高音質(zhì)有一定的限度。所以本發(fā)明的目的是,提供能夠提高解碼語音的音質(zhì)的語音切換裝置及語音切換方法。解決問題的方案本發(fā)明的語音切換裝置,在切換所輸出的語音信號的頻帶時,輸出混合了窄帶語音信號和寬帶語音信號的混合信號,該語音切換裝置包括混合單元,使所述窄帶語音信號和所述寬帶語音信號的混合比時間性地變化,同時將所述窄帶語音信號和所述寬帶語音信號混合,從而得到所述混合信號;以及設定單元,可變地設定所述混合比的時間性變化的程度。本發(fā)明的可擴展性解碼裝置,輸出混合了核心層解碼信號和擴展層解碼信號的混合信號,該可擴展性解碼裝置包括混合單元,使所述核心層解碼信號和所述擴展層解碼信號的混合比時間性變化地將所述核心層解碼信號和所述擴展層解碼信號混合,從而得到所述混合信號;檢測單元,通過檢測在核心層解碼的過程中得到的參數(shù)的變化,在可以得到所述核心層解碼信號或所述擴展層解碼信號的期間中,檢測特定的區(qū)間;以及設定單元,在檢測出所述特定的區(qū)間時增加所述混合比的時間性變化的程度,在未檢測出所述特定的區(qū)間時減小所述混合比的時間性變化的程度。本發(fā)明的可擴展性解碼方法,用于輸出混合了核心層解碼信號和擴展層解碼信號的混合信號,該可擴展性解碼方法包括混合步驟,使所述核心層解碼信號和所述擴展層解碼信號的混合比時間性變化地將所述核心層解碼信號和所述擴展層解碼信號混合,從而得到所述混合信號;檢測步驟,通過檢測在核心層解碼的過程中得到的參數(shù)的變化,在可以得到所述核心層解碼信號或所述擴展層解碼信號的期間中,檢測特定的區(qū)間;以及設定步驟, 在檢測出所述特定的區(qū)間時增加所述混合比的時間性變化的程度,在未檢測出所述特定的區(qū)間時減小所述混合比的時間性變化的程度。發(fā)明的有益效果根據(jù)本發(fā)明,能夠?qū)φ瓗Ы獯a語音和寬帶解碼語音信號進行平穩(wěn)地切換,因而能夠提高解碼語音的音質(zhì)。


圖I是表示本發(fā)明的一實施方式的語音解碼裝置的結(jié)構(gòu)的方框圖。圖2是表示本發(fā)明的一實施方式的加權加法單元的結(jié)構(gòu)的方框圖。圖3A 圖3C是用于說明本發(fā)明的一實施方式的擴展層增益的時間性變化的示例的圖。圖4A 圖4C是用于說明本發(fā)明的一實施方式的擴展層增益的時間性變化的其它示例的圖。圖5是表示本發(fā)明的一實施方式的容許區(qū)間檢測單元的內(nèi)部結(jié)構(gòu)的方框圖。圖6是表示本發(fā)明的一實施方式的無聲區(qū)間檢測單元的內(nèi)部結(jié)構(gòu)的方框圖。圖7是表示本發(fā)明的一實施方式的功率波動區(qū)間檢測單元的內(nèi)部結(jié)構(gòu)的方框圖。圖8是表示本發(fā)明的一實施方式的音質(zhì)變化區(qū)間檢測單元的內(nèi)部結(jié)構(gòu)的方框圖。圖9是表示本發(fā)明的一實施方式的擴展層功率微小區(qū)間檢測單元的內(nèi)部結(jié)構(gòu)的方框圖。
具體實施例方式以下,針對本發(fā)明的實施方式,參照附圖進行詳細說明。圖I是表示具有本發(fā)明的一實施方式的語音切換裝置的語音解碼裝置的結(jié)構(gòu)的方框圖。圖I的語音解碼裝置100包括核心層解碼單元102、核心層幀差錯檢測單元104、 擴展層幀差錯檢測單元106、擴展層解碼單元108、容許區(qū)間檢測單元110、信號調(diào)整單元 112、以及加權加法單元114。核心層幀差錯檢測單元104檢測核心層編碼數(shù)據(jù)是否能解碼。具體來說,核心層幀差錯檢測單元104對核心層幀差錯進行檢測。接著,在檢測出核心層幀差錯時,判斷為核心層編碼數(shù)據(jù)不能解碼。核心層幀差錯檢測的結(jié)果被輸出到核心層解碼單元102及容許區(qū)間檢測單元110。這里,核心層幀差錯是指,由核心層編碼數(shù)據(jù)的幀在發(fā)送途中受到的差錯,或分組通信中的分組丟失(例如,通信路徑上的分組丟棄、抖動(jitter)引起的分組未到達等) 等理由引起的核心層編碼數(shù)據(jù)的大部分或全部無法用于解碼的狀態(tài)。核心層幀差錯的檢測,例如通過核心層幀差錯檢測單元104實施以下的處理而得以實現(xiàn)。例如,核心層幀差錯檢測單元104除核心層編碼數(shù)據(jù)以外,另外地接收差錯信息。 或者,核心層巾貞差錯檢測單元104使用在核心層編碼數(shù)據(jù)上附加的CRC(Cyclic Redundancy Check)等差錯檢測碼來進行差錯檢測?;蛘撸诵膶訋铄e檢測單元104判斷出在解碼時間之前核心層編碼數(shù)據(jù)未達到?;蛘?,檢測分組丟失或未達到。或者,在核心層解碼單元102 的核心層編碼數(shù)據(jù)的解碼過程中,通過在核心層編碼數(shù)據(jù)中所包含的差錯檢測碼等檢測出重大的差錯時,核心層幀差錯檢測單元104從核心層解碼單元102獲取該現(xiàn)象的信息。核心層解碼單元102接收核心層編碼數(shù)據(jù),并將該核心層編碼數(shù)據(jù)解碼。通過該解碼而生成的核心層解碼語音信號被輸出到信號調(diào)整單元112。核心層解碼語音信號為窄帶的信號。另外,該核心層解碼語音信號,也可以直接作為最終輸出來使用。另外,核心層解碼單元102將核心層編碼數(shù)據(jù)的一部分或核心層LSP (Line Spectrum Pair ;線譜對)輸出到容許區(qū)間檢測單元110。核心層LSP為在核心層解碼過程中所得到的頻譜參數(shù)。這里, 以核心層解碼單元102向容許區(qū)間檢測單元110輸出核心層LSP的情況為例進行說明,不過也可以輸出在核心層解碼的過程中得到的其它頻譜參數(shù),甚至可以輸出在核心層解碼過程中所得到的非頻譜參數(shù)的其它參數(shù)。核心層解碼單元102,在由核心層幀差錯檢測單元104通知了核心層幀差錯時,或在核心層編碼數(shù)據(jù)的解碼過程中,由核心層編碼數(shù)據(jù)內(nèi)含有的差錯檢測碼等判斷出存在重大差錯時,使用過去的編碼信息等進行線性預測系數(shù)及音源的插值等。這樣,持續(xù)地生成并輸出核心層解碼語音信號。另外,在核心層編碼數(shù)據(jù)的解碼過程中,若由核心層編碼數(shù)據(jù)內(nèi)含有的差錯檢測碼等判斷出存在重大差錯時,核心層解碼單元102將該事宜的信息通知給核心層幀差錯檢測單元104。擴展層幀差錯檢測單元106檢測擴展層編碼數(shù)據(jù)是否能解碼。具體來說,擴展層幀差錯檢測單元106檢測擴展層幀差錯。接著,檢測出擴展層幀差錯時,判斷擴展層編碼數(shù)據(jù)不能解碼。擴展層幀差錯檢測結(jié)果被輸出到擴展層解碼單元108及加權加法單元114。這里,擴展層幀差錯是指由擴展層編碼數(shù)據(jù)的幀在發(fā)送途中受到的差錯,或在分組通信過程中分組丟失等理由引起的擴展層編碼數(shù)據(jù)的大部分或全部無法用于解碼的狀態(tài)。擴展層幀差錯的檢測,例如通過擴展層幀差錯檢測單元106實施以下的處理而得以實現(xiàn)。例如,擴展層幀差錯檢測單元106除擴展層編碼數(shù)據(jù)以外另外地接收差錯信息。 或者,擴展層幀差錯檢測單元106使用在擴展層編碼數(shù)據(jù)上附加的CRC等差錯檢測碼來進行差錯檢測?;蛘?,擴展層幀差錯檢測單元106,判斷出在解碼時間之前擴展層編碼數(shù)據(jù)未達到?;蛘?,擴展層幀差錯檢測單元106檢測分組丟失或未達到?;蛘?,在擴展層解碼單元108的擴展層編碼數(shù)據(jù)的解碼過程中,通過在擴展層編碼數(shù)據(jù)中所包含的差錯檢測碼等檢測出重大的差錯時,擴展層幀差錯檢測單元106從擴展層解碼單元108獲取該事宜的信息。或者,在擴展層的解碼中采用不可缺少核心層信息的可擴展性語音編碼方式的情況下, 檢測出核心層幀差錯時,擴展層幀差錯檢測單元106就判斷為檢測出擴展層幀差錯。這種情況下,擴展層幀差錯檢測單元106從核心層幀差錯檢測單元104接收核心層幀差錯檢測結(jié)果的輸入。擴展層解碼單元108接收擴展層編碼數(shù)據(jù),并將該擴展層編碼數(shù)據(jù)解碼。通過該解碼而生成的擴展層解碼語音信號被輸出到容許區(qū)間檢測單元Iio及加權加法單元114。 擴展層解碼語音信號為寬帶的信號。擴展層解碼單元108,在由擴展層幀差錯檢測單元106通知了擴展層幀差錯時,或在擴展層編碼數(shù)據(jù)的解碼過程中,由擴展層編碼數(shù)據(jù)內(nèi)含有的差錯檢測碼判斷出存在重大差錯時,使用過去的編碼信息等進行線性預測系數(shù)及音源的插值等。由此,根據(jù)需要,生成并輸出擴展層解碼語音信號。另外,在擴展層編碼數(shù)據(jù)的解碼過程中,若通過擴展層編碼數(shù)據(jù)內(nèi)含有的差錯檢測碼等判斷出存在重大差錯時,擴展層解碼單元108將該事宜的信息通知給擴展層幀差錯檢測單元106。信號調(diào)整單元112調(diào)整從核心層解碼單元102輸入的核心層解碼語音信號。具體來說,信號調(diào)整單元112對核心層解碼語音信號進行上采樣,與擴展層解碼語音信號的采樣頻率匹配。另外,為使延遲及相位與擴展層解碼語音信號匹配,信號調(diào)整單元112對核心層解碼語音信號的延遲及相位進行調(diào)整。實施了這些處理的核心層解碼語音信號被輸出到容許區(qū)間檢測單元Iio及加權加法單元114。容許區(qū)間檢測單元110,對從核心層幀差錯檢測單元104輸入的核心層幀差錯檢測結(jié)果、從信號調(diào)整單元112輸入的核心層解碼語音信號、從核心層解碼單元102輸入的核心層LSP、以及從擴展層解碼單元108輸入的擴展層解碼語音信號進行分析,并基于分析結(jié)果檢測容許區(qū)間。容許區(qū)間檢測結(jié)果輸出到加權加法單元114。由此,能夠?qū)⒑诵膶咏獯a語音信號及擴展層解碼語音信號的混合比時間性地變化的程度設定得較高的期間,僅限定在容許區(qū)間內(nèi),能夠?qū)ψ兏旌媳葧r間性變化的程度的定時進行控制。這里,容許區(qū)間是指即使輸出語音信號的頻帶發(fā)生變化也對聽覺上的影響較小的區(qū)間,即輸出語音信號的頻帶變化難以被收聽者覺察到的區(qū)間。相反的,生成核心層解碼語音信號及擴展層解碼語音信號的期間中,容許區(qū)間以外的區(qū)間就為輸出語音信號的頻帶變化容易被收聽者覺察到的區(qū)間。因此,容許區(qū)間為容許輸出信號的頻帶驟變的區(qū)間。容許區(qū)間檢測單元110將無聲區(qū)間、功率波動區(qū)間、音質(zhì)變化區(qū)間、擴展層功率微小區(qū)間等作為容許區(qū)間來檢測,并將檢測結(jié)果輸出到加權加法單元114。對容許區(qū)間檢測單元110的內(nèi)部結(jié)構(gòu)及容許區(qū)間的檢測處理的詳細內(nèi)容將在后面敘述。
作為語音切換裝置的加權加法單元114,切換輸出語音信號的頻帶。另外,加權加法單元114,在切換輸出語音信號的頻帶時,將混合了核心層解碼語音信號及擴展層解碼語音信號的混合信號作為輸出語音信號輸出?;旌闲盘?,通過對從信號調(diào)整單元112輸入的核心層解碼語音信號及從擴展層解碼單元108輸入的擴展層解碼語音信號進行加權加法而生成。也就是說,混合信號為核心層解碼語音信號及擴展層解碼語音信號的加權和。對于加權加法運算的詳細內(nèi)容將在后面敘述。圖5是表示容許區(qū)間檢測單元110的內(nèi)部結(jié)構(gòu)的方框圖。容許區(qū)間檢測單元110 包括核心層解碼語音信號功率計算單元501、無聲區(qū)間檢測單元502、功率波動區(qū)間檢測單元503、音質(zhì)變化區(qū)間檢測單元504、擴展層功率微小區(qū)間檢測單元505、以及容許區(qū)間判斷單元506。核心層解碼語音信號功率計算單元501,從核心層解碼單元102輸入核心層解碼語音信號,通過下式(I)計算核心層解碼語音信號功率Pc (t)。
權利要求
1.一種可擴展性解碼裝置,輸出混合了核心層解碼信號和擴展層解碼信號的混合信號,該可擴展性解碼裝置包括混合單元,使所述核心層解碼信號和所述擴展層解碼信號的混合比時間性變化地將所述核心層解碼信號和所述擴展層解碼信號混合,從而得到所述混合信號;檢測單元,通過檢測在核心層解碼的過程中得到的參數(shù)的變化,在可以得到所述核心層解碼信號或所述擴展層解碼信號的期間中,檢測特定的區(qū)間;以及設定單元,在檢測出所述特定的區(qū)間時增加所述混合比的時間性變化的程度,在未檢測出所述特定的區(qū)間時減小所述混合比的時間性變化的程度。
2.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將容許所述語音信號的頻帶的規(guī)定電平以上的驟變的區(qū)間、無聲區(qū)間、 以及所述核心層解碼信號的功率在規(guī)定電平以下的區(qū)間中的任一個區(qū)間作為所述特定的區(qū)間來檢測。
3.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將所述擴展層解碼信號的功率在規(guī)定電平以下的區(qū)間、所述擴展層解碼信號的功率相對于所述核心層解碼信號的功率的大小在規(guī)定電平以下的區(qū)間、所述核心層解碼信號的功率波動在規(guī)定電平以上的區(qū)間、或者所述擴展層解碼信號的功率波動在規(guī)定電平以上的區(qū)間作為所述特定的區(qū)間來檢測。
4.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將所述核心層解碼信號的上升作為所述特定的區(qū)間來檢測、或者檢測所述擴展層解碼信號的上升。
5.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將所述核心層解碼信號中含有的背景噪音信號的種類發(fā)生變化的區(qū)間、 所述擴展層解碼信號中含有的背景噪音信號的種類發(fā)生變化的區(qū)間、或者所述核心層解碼信號的頻譜參數(shù)的變化在規(guī)定電平以上的區(qū)間作為所述特定的區(qū)間來檢測。
6.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將所述擴展層解碼信號的頻譜參數(shù)的變化在規(guī)定電平以上的區(qū)間作為所述特定的區(qū)間來檢測。
7.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將對所述核心層解碼信號進行了插值處理后的區(qū)間作為所述特定的區(qū)間來檢測。
8.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將對所述擴展層解碼信號進行了插值處理后的區(qū)間作為所述特定的區(qū)間來檢測。
9.根據(jù)權利要求I至權利要求8中任一權利要求所述的可擴展性解碼裝置,所述設定單元將所述核心層解碼信號的增益固定,而可變地設定所述擴展層解碼信號的增益的時間性變化的程度。
10.根據(jù)權利要求I至權利要求8中任一權利要求所述的可擴展性解碼裝置, 所述設定單元變更所述混合信號的輸出時間。
11.根據(jù)權利要求I所述的可擴展性解碼裝置,所述檢測單元將過去的各要素和當前的各要素之間的距離的合計與規(guī)定的閾值進行比較,并將所述距離的合計在閾值以上的區(qū)間作為所述特定的區(qū)間來檢測。
12.一種通信終端裝置,具有權利要求I所述的可擴展性解碼裝置。
13.一種可擴展性解碼方法,用于輸出混合了核心層解碼信號和擴展層解碼信號的混合信號,該可擴展性解碼方法包括混合步驟,使所述核心層解碼信號和所述擴展層解碼信號的混合比時間性變化地將所述核心層解碼信號和所述擴展層解碼信號混合,從而得到所述混合信號;檢測步驟,通過檢測在核心層解碼的過程中得到的參數(shù)的變化,在可以得到所述核心層解碼信號或所述擴展層解碼信號的期間中,檢測特定的區(qū)間;以及設定步驟,在檢測出所述特定的區(qū)間時增加所述混合比的時間性變化的程度,在未檢測出所述特定的區(qū)間時減小所述混合比的時間性變化的程度。
全文摘要
本發(fā)明公開了能夠提高解碼信號的音質(zhì)的可擴展性解碼裝置。該裝置包括混合單元,使所述核心層解碼信號和所述擴展層解碼信號的混合比時間性變化地將所述核心層解碼信號和所述擴展層解碼信號混合,從而得到混合信號;檢測單元,通過檢測在核心層解碼的過程中得到的參數(shù)的變化,在可以得到所述核心層解碼信號或所述擴展層解碼信號的期間中,檢測特定的區(qū)間;以及設定單元,在檢測出所述特定的區(qū)間時增加所述混合比的時間性變化的程度,在未檢測出所述特定的區(qū)間時減小所述混合比的時間性變化的程度。
文檔編號G10L21/02GK102592604SQ20121002373
公開日2012年7月18日 申請日期2006年1月12日 優(yōu)先權日2005年1月14日
發(fā)明者江原宏幸, 河嶋拓也 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
武隆县| 马边| 三都| 胶南市| 东光县| 师宗县| 高邑县| 进贤县| 宿州市| 天等县| 洪雅县| 大关县| 皮山县| 新源县| 宣威市| 岑巩县| 兴城市| 阿克陶县| 无棣县| 兴化市| 芮城县| 垦利县| 大厂| 利津县| 铁岭市| 宜阳县| 文成县| 克什克腾旗| 新营市| 广东省| 黎川县| 抚远县| 壤塘县| 河池市| 钦州市| 民权县| 凤台县| 仪征市| 多伦县| 罗城| 钟山县|