專利名稱:有聲無聲判定裝置和有聲無聲判定方法
技術(shù)領(lǐng)域:
本發(fā)明涉及有聲無聲判定裝置和有聲無聲判定方法。
背景技術(shù):
在便攜電話和因特網(wǎng)電話中,以消減發(fā)送功率和有效利用傳送頻帶為目的的所謂間歇發(fā)送的技術(shù)得到利用。所謂間歇發(fā)送是指這樣的技術(shù)在有聲音的有聲區(qū)間內(nèi)發(fā)送對聲音編碼后的信息,另一方面,在沒有聲音的無聲區(qū)間內(nèi)發(fā)送比聲音信息少的信息量的信息,或者停止發(fā)送信息。為了進行這種間歇發(fā)送,利用有聲無聲判定裝置,判定輸入信號在包含聲音的有聲區(qū)間還是在不需要發(fā)送信息的無聲區(qū)間。
例如,下述專利文獻1中記載的有聲無聲判定裝置利用聲音信號是有周期性的特性,利用輸入信號的自相關(guān)值判定是有聲區(qū)間還是無聲區(qū)間。具體地說,有聲無聲判定裝置算出輸入信號的自相關(guān)值為最大的延遲,算出的延遲如果和聲音信號的周期一致,則判定為有聲區(qū)間,如果不一致,則判定為無聲區(qū)間。
下述非專利文獻1中記載的有聲無聲判定裝置根據(jù)輸入信號推定背景雜音,用推定的背景雜音和輸入信號的比(S/N比)判定是有聲區(qū)間還是無聲區(qū)間。更具體地說,有聲無聲判定裝置算出輸入信號的自相關(guān)值為最大的延遲以及帶加權(quán)的輸入信號的自相關(guān)值為最大的延遲,基于這些延遲的持續(xù)性(即延遲變動小的狀態(tài)是否持續(xù)一定時間),一邊改變背景雜音的推定方法,一邊推定背景雜音,如果推定的背景雜音和輸入信號的S/N比大于等于閾值(根據(jù)推定的背景雜音來決定),則判定為有聲區(qū)間,如果比閾值小,則判定為無聲區(qū)間。
專利文獻1特開2002-162982號公報非專利文獻13GPP TS 26.094 V3.0.0(http//www.3gpp.org/ftp/Specs/html-info/26094.htm)發(fā)明內(nèi)容但是,在上述現(xiàn)有的有聲無聲判定裝置中,有以下問題。即,上述技術(shù)的有聲無聲判定裝置用最大自相關(guān)值或自相關(guān)值為最大的延遲來判定有聲區(qū)間或無聲區(qū)間。因此,對于非周期分量多的信號和多個不同周期分量混雜的輸入信號,不能精確地判定有聲區(qū)間或無聲區(qū)間。
因此,本發(fā)明要解決上述問題,提供一種有聲無聲判定裝置和有聲無聲判定,即使對于非周期分量多的信號和多個不同周期分量混合的輸入信號,也能精確地判定有聲區(qū)間或無聲區(qū)間。
為了解決上述課題,本發(fā)明的有聲無聲判定裝置,其特征在于,包括自相關(guān)計算單元,計算輸入信號的自相關(guān)值;延遲計算單元,計算使上述自相關(guān)計算單元計算出的上述自相關(guān)值為極大的多個延遲;性質(zhì)判定單元,基于由上述延遲計算單元計算出的上述多個延遲來判定上述輸入信號的性質(zhì);以及有聲無聲判定單元,基于上述性質(zhì)判定單元的判定結(jié)果,判定上述輸入信號有聲還是無聲。
為了解決上述課題,本發(fā)明的有聲無聲判定方法,其特征在于,包括以下步驟自相關(guān)計算步驟,算出輸入信號的自相關(guān)值;延遲計算步驟,計算使在上述自相關(guān)計算步驟中計算出的上述自相關(guān)值為極大的多個延遲;性質(zhì)判定步驟,基于在上述延遲計算步驟中計算出的上述多個延遲來判定上述輸入信號的性質(zhì);以及有聲無聲判定步驟,基于上述性質(zhì)判定步驟中的判定結(jié)果,判定上述輸入信號有聲還是無聲。
算出輸入信號的自相關(guān)值為極大的多個延遲,基于這些多個延遲判定輸入信號有聲或無聲,從而能考慮輸入信號中包含的多個周期分量并判定有聲或無聲。
在本發(fā)明的有聲無聲判定裝置中,上述有聲無聲判定裝置的特征在于基于上述性質(zhì)判定裝置的判定結(jié)果和上述輸入信號判定上述輸入信號有聲或無聲。
同樣地,在本發(fā)明的有聲無聲判定方法中,上述有聲無聲判定步驟的特征在于基于上述性質(zhì)判定步驟中的判定結(jié)果和上述輸入信號判定上述輸入信號有聲或無聲。
在性質(zhì)判定裝置或性質(zhì)判定步驟中,除了判定結(jié)果外,還利用輸入信號判定有聲或無聲,從而,能嵌入更細致的判定過程。即,例如,在性質(zhì)判定裝置或性質(zhì)判定步驟中,判定為雜音的,還可以基于輸入信號的歷史判定為有聲。
在本發(fā)明的有聲無聲判定裝置中,還具有雜音推定單元,根據(jù)上述輸入信號來推定雜音;其中上述有聲無聲判定單元基于上述性質(zhì)判定單元的判定結(jié)果、上述輸入信號以及上述雜音推定單元推定的雜音來判定上述輸入信號有聲或無聲。
除了性質(zhì)判定裝置的判定結(jié)果以外,還利用輸入信號和雜音信號判定有聲或無聲,從而,能基于S/N比判定有聲無聲。
在本發(fā)明的有聲無聲判定裝置中,上述雜音推定裝置基于上述有聲無聲判定裝置的判定結(jié)果改變雜音的推定方法。
通過基于有聲無聲判定裝置的判定結(jié)果改變雜音的推定方法,能嵌入更細致的雜音推定過程。即,例如,在有聲無聲判定裝置持續(xù)判定為有聲時,則通過積極地降低由雜音推定裝置推定的雜音電平,相對于雜音,強調(diào)信號分量。
在本發(fā)明的有聲無聲判定裝置中,上述延遲計算裝置的特征在于,按照自相關(guān)值從大到小的順序算出上述多個延遲。
通過按自相關(guān)值從大到小的順序算出上述多個延遲,可以很容易地算出上述多個延遲。
在本發(fā)明的有聲無聲判定裝置中,上述延遲計算裝置的特征在于,將延遲觀測區(qū)間分割為多個區(qū)間,計算出在上述多個區(qū)間中的每個區(qū)間中自相關(guān)值為最大的延遲。
同樣地,在本發(fā)明的有聲無聲判定方法中,上述延遲計算步驟的特征在于,將延遲觀測區(qū)間分割為多個區(qū)間,在上述多個區(qū)間中的每個區(qū)間中算出自相關(guān)值為最大的延遲。
將延遲觀測區(qū)間分割為多個區(qū)間,算出每個區(qū)間內(nèi)自相關(guān)值為最大的延遲,從而,可以不偏向于例如依存于聲帶固有頻率及其整數(shù)倍波的延遲,一一算出依存于輸入信號中包含的種種周期分量的延遲。
在本發(fā)明的有聲無聲判定裝置中,上述多個區(qū)間將上述延遲觀測區(qū)間的起點作為min_t,用2i-1·min_t~2i·min_t(i是自然數(shù))來表示。
通過進行這種區(qū)間分割,對于具有周期性的信號,能更有效地檢測出與其2倍周期對應(yīng)的延遲,能精確度更高地進行有聲無聲判定。
本發(fā)明的有聲無聲判定裝置和有聲無聲判定方法算出輸入信號的自相關(guān)值為極大的多個延遲,基于這些多個延遲判定輸入信號是有聲還是無聲。因此,能考慮輸入信號中包含的多個周期分量地判定有聲或無聲。結(jié)果,即使對于非周期分量多的信號和多個不同周期分量混合的輸入信號,也能精確地判定有聲區(qū)間或無聲區(qū)間。
圖1是根據(jù)第一實施方式的有聲無聲判定裝置的結(jié)構(gòu)圖;圖2示出了延遲計算的具體例;圖3是根據(jù)第一實施方式的有聲無聲判定裝置的操作流程圖;圖4是根據(jù)第二實施方式的有聲無聲判定裝置的結(jié)構(gòu)圖;圖5是根據(jù)第二實施方式的有聲無聲判定裝置的操作流程圖;圖6是根據(jù)第三實施方式的有聲無聲判定裝置的結(jié)構(gòu)圖;圖7示出了延遲計算的具體例。
具體實施例方式
第一實施方式參考
根據(jù)本發(fā)明第一實施方式的有聲無聲判定裝置。
首先,說明根據(jù)本實施方式的有聲無聲判定裝置的結(jié)構(gòu)。圖1是根據(jù)本實施方式的有聲無聲判定裝置的結(jié)構(gòu)圖。
根據(jù)本實施方式的有聲無聲判定裝置1物理上作為計算機系統(tǒng)來構(gòu)成,具備CPU(中央處理器)、存儲器、鼠標或鍵盤等輸入裝置、顯示器等顯示裝置、硬盤等存儲裝置、通過無線和外部設(shè)備進行數(shù)據(jù)通信的無線通信單元等。在功能上,如圖1所示,有聲無聲判定裝置1具有自相關(guān)計算部11(自相關(guān)計算單元),延遲計算部12(延遲計算單元),雜音判定部13(性質(zhì)判定單元),有聲無聲判定部14(有聲無聲判定單元)。以下,詳細說明有聲無聲判定裝置1的各構(gòu)成要素。
自相關(guān)計算部11計算輸入信號的自相關(guān)值。具體地說,有聲無聲判定裝置1根據(jù)以下的式(1)算出輸入信號x(t)的自相關(guān)值c(t)。
c(t)=Σn=0N-1x(n)x(n-t)Σn=0N-1x2(n)Σn=0N-1x2(n-t)···(1)]]>這里,x(n)(n=0,1,...,N)是在經(jīng)過一定時間(例如20msec)后每隔一定時間間隔(例如1/8000sec)對x(t)采樣得到的第n個值。對于自相關(guān)值c(t),也是作為在一定時間(例如18msec)后每隔一定時間間隔(例如1/8000sec)的離散值而得到。
此外,自相關(guān)計算部11不一定嚴密地按上述式(1)算出自相關(guān)值。例如,自相關(guān)計算部11也可以基于廣泛用于聲音編碼過程中的帶聽覺加權(quán)的輸入信號而算出自相關(guān)值。自相關(guān)計算部11也可以對基于輸入信號算出的自相關(guān)值進行加權(quán),輸出帶加權(quán)的自相關(guān)值。
延遲計算部12算出使由自相關(guān)計算部11計算的自相關(guān)值為極大的多個延遲。具體地說,延遲計算部12掃描預(yù)定的延遲觀測區(qū)間內(nèi)的自相關(guān)值,按照從大到小的順序算出M個自相關(guān)值為極大的延遲。即,如圖2所示,在延遲觀測區(qū)間min_t~max_t(例如AMR時為18~143)內(nèi),依次算出使自相關(guān)值為極大的延遲中的自相關(guān)值最大的延遲t_max1,使自相關(guān)值為極大的延遲中自相關(guān)值第二大的延遲t_max2,使自相關(guān)值為極大的延遲中自相關(guān)值第三大的延遲t_max3(這里,以M=3進行說明)。
返回圖1,雜音判定部13基于延遲計算部12算出的多個延遲判定輸入信號是否為雜音(輸入信號的性質(zhì))。例如,雜音判定部13利用延遲計算部12算出的多個延遲t_maxi(1≤i≤M)的時間變動t_maxi(k)(1≤i≤M,1≤k≤K)判定輸入信號是否為雜音。這里,k是表示時間的從屬變量。更具體地說,在滿足式(2)所示條件的狀態(tài)持續(xù)一定時間的情況下(如果定性地說,是延遲變動小的狀態(tài)持續(xù)一定時間時),雜音判定部13判定輸入信號不是雜音。相反,在滿足式(2)所示條件的狀態(tài)不持續(xù)一定時間的情況下雜音判定部13判定輸入信號是雜音。
Mini=1~Mj=1~M{|t_maxi(k)-t_maxj(k-1)|}≤d···(2)]]>此外,式(2)中,d是預(yù)定的閾值。這里,雜音判定部13也可以以基于多個延遲判定輸入信號是否為雜音為條件,用上述過程以外的過程判定輸入信號是否為雜音。
有聲無聲判定部14基于雜音判定部13的判定結(jié)果和輸入信號判定輸入信號有聲或無聲。例如,有聲無聲判定部14用雜音判定部13的判定結(jié)果和輸入信號的分析結(jié)果(功率,譜包絡(luò),過零數(shù)等),判定輸入信號有聲還是無聲。這里,作為用雜音判定部13的判定結(jié)果和輸入信號的分析結(jié)果判定輸入信號有聲或無聲的方法,可以采用廣為人知的種種方法。這里,所謂“無聲”是指作為信息沒有意義的聲音,相當(dāng)于背景雜音等。另一方面,所謂“有聲”是指作為信息有意義的聲音,相當(dāng)于人聲和音樂等。
接著,說明根據(jù)本實施方式的有聲無聲判定裝置的操作以及根據(jù)本發(fā)明實施方式的有聲無聲判定方法。圖3是根據(jù)本實施方式的有聲無聲判定裝置的操作流程圖。
當(dāng)在有聲無聲判定裝置1中輸入輸入信號時,首先,通過自相關(guān)計算部11算出輸入信號的自相關(guān)值(S11)。具體地說,根據(jù)上述式(1),算出輸入信號x(t)的自相關(guān)值c(t)。
當(dāng)通過自相關(guān)計算部11算出輸入信號的自相關(guān)值時,通過延遲計算部12算出使自相關(guān)計算部11計算出的自相關(guān)值為極大的多個延遲(S12)。具體地說,掃描預(yù)定的延遲觀測區(qū)間內(nèi)的自相關(guān)值,按照從大到小的順序算出M個自相關(guān)值為極大的M個延遲(延遲t_max1~t_maxM)。
當(dāng)通過延遲計算部12算出多個延遲時,基于判定延遲計算部12算出的多個延遲,通過雜音判定部13判定輸入信號是否為雜音(輸入信號的性質(zhì))(S13)。具體地說,滿足上述式(2)所示條件的狀態(tài)持續(xù)一定時間時,判定為輸入信號不是雜音。相反,滿足式(2)所示條件的狀態(tài)不持續(xù)一定時間時,判定輸入信號是雜音。
當(dāng)雜音判定部13判定輸入信號是否為雜音時,基于雜音判定部13的判定結(jié)果和輸入信號,有聲無聲判定部14判定輸入信號是有聲或無聲(S14)。具體地說,例如,用雜音判定部13的判定結(jié)果和輸入信號的分析結(jié)果(功率,譜包絡(luò),過零數(shù)等),判定輸入信號是有聲還是無聲。
接著,說明根據(jù)本實施方式的有聲無聲判定裝置的作用和效果。根據(jù)本實施方式的有聲無聲判定裝置1的延遲計算部12算出自相關(guān)值為極大的多個延遲t_max1~t_maxM,雜音判定部13基于這多個延遲t_max1~t_maxM判定輸入信號是雜音還是非雜音,有聲無聲判定部14基于雜音判定部13的判定結(jié)果判定輸入信號是有聲還是無聲。因此,可以考慮輸入信號中包含的多個周期分量來判定有聲或無聲。結(jié)果,即使對于非周期分量多的信號和多個不同周期分量混合的輸入信號,也能精確地判定有聲區(qū)間或無聲區(qū)間。
本實施方式的有聲無聲判定裝置1的有聲無聲判定部14不僅利用雜音判定部13的判定結(jié)果、還利用輸入信號來判定該輸入信號是有聲還是無聲。因此,和僅利用雜音判定部13的判定結(jié)果判定輸入信號有聲或無聲的情況相比,可以嵌入更細致的判定過程。即,例如,可以嵌入雜音判定部13判定為雜音但輸入信號的歷史滿足一定條件時判定為有聲的判定過程。此外,有聲無聲判定部14在不用輸入信號的分析結(jié)果的情況下,僅用雜音判定部13的判定結(jié)果也可以判定輸入信號是有聲還是無聲。這時,雖然不能嵌入上述更細致的判定過程,但具有將有聲或無聲的判定過程變簡單的效果。
在根據(jù)本實施方式的有聲無聲判定裝置1中,當(dāng)延遲計算部12算出多個延遲時,按照自相關(guān)值從大到小的順序計算多個延遲。因此,和采用其他計算方法的情況相比,可以容易地算出多個延遲。
第二實施方式接著,參考
根據(jù)本發(fā)明第二實施方式的有聲無聲判定裝置。首先,說明根據(jù)本實施方式的有聲無聲判定裝置的構(gòu)成。圖4是根據(jù)本實施方式的有聲無聲判定裝置的構(gòu)成圖。根據(jù)本實施方式的有聲無聲判定裝置2和上述根據(jù)第一實施方式的有聲無聲判定裝置1的不同之處在于還具有從輸入信號中推定雜音的雜音推定部21(雜音推定裝置),有聲無聲判定部22利用該雜音推定部21推定的雜音判定輸入信號有聲或無聲。
在功能上,如圖4所示,有聲無聲判定裝置2具有自相關(guān)計算部11,延遲計算部12,雜音判定部13,雜音推定部21和有聲無聲判定部22。這里,自相關(guān)計算部11,延遲計算部12和雜音判定部13具有的功能分別和根據(jù)第一實施方式的有聲無聲判定裝置1中的自相關(guān)計算部11、延遲計算部12和雜音判定部13相同。
雜音推定部21從輸入信號中推定雜音。具體地說,雜音推定部21例如根據(jù)下述式(3)推定雜音。
noisem+1(n)=(1-α)·noisem(n)+α·inputm-1(n) ...(3)這里,noise是推定雜音,input是輸入信號,n是表示頻帶的指數(shù),m是表示時刻(幀)的指數(shù),α是系數(shù)。即,noisem(n)表示第n個頻帶內(nèi)時刻(幀)m的推定雜音。這里,雜音推定部21根據(jù)雜音判定部13的判定結(jié)果改變上述式(3)的系數(shù)α。即,雜音判定部13判定輸入信號不是雜音時,雜音推定部21使上述式(3)的系數(shù)α為0或者接近0的值α1,以便不增大推定雜音功率。另一方面,雜音判定部13判定輸入信號為雜音時,雜音推定部21使上述式(3)的系數(shù)α為1或者接近1的值α2(α2>α1),以便使推定雜音接近輸入信號。此外,雜音推定部21也可以用上述過程以外的過程從輸入信號中推定雜音。
有聲無聲判定部22基于雜音判定部13的判定結(jié)果、輸入信號以及雜音推定部21推定的雜音,判定輸入信號有聲或無聲。具體地說,例如,有聲無聲判定部22根據(jù)雜音推定部21推定的雜音和輸入信號算出S/N比(更準確地說是各頻帶的S/N比的累計值或平均值)。有聲無聲判定部22把算出的S/N比和預(yù)定的閾值相比較,S/N比大于閾值時,判定為輸入信號是有聲的,S/N比小于或等于閾值時,判定為輸入信號是無聲的。這里,上述閾值設(shè)定成隨雜音判定部13的判定結(jié)果的不同而不同。即,雜音判定部13判定為“非雜音”時的閾值設(shè)定得比雜音判定部13判定為“雜音”時的閾值低。這樣,雜音判定部13判定為“非雜音”時,S/N比小的信號(即埋在雜音中的信號)也作為“有聲”被提取出來的可能性高。此外,有聲無聲判定部22也可以用上述過程以外的過程判定有聲或無聲。即,例如,利用上述閾值,無論雜音判定部13的判定結(jié)果如何,有聲無聲判定部22一律基于輸入信號和雜音推定部21推定的雜音來判定輸入信號有聲或無聲。
接著,說明根據(jù)本實施方式的有聲無聲判定裝置的操作。圖5是根據(jù)本實施方式的有聲無聲判定裝置的操作流程圖。這里,自相關(guān)值的計算(S11)、延遲t_max1~t_maxM的計算(S12)和雜音、非雜音的判定(S13)與根據(jù)第一實施方式的有聲無聲判定裝置1的操作相同。
接著步驟S11~S13,通過雜音推定部21根據(jù)輸入信號推定雜音(S21)。具體地說,根據(jù)上述式(3),推定雜音。這里,上述式(3)的系數(shù)α隨雜音判定部13的判定結(jié)果來變化。即,雜音判定部13將輸入信號判定為不是雜音時,將上述式(3)的系數(shù)α設(shè)定為0或者接近0的值α1,以便不增加推定雜音功率。另一方面,雜音判定部13將輸入信號判定為雜音時,將上述式(3)的系數(shù)α設(shè)定為1或者接近1的值α2(α2>α1),以便使推定雜音接近輸入信號。此外,雜音的推定(S21)不限于步驟S11~S13結(jié)束后,和步驟S11~S13并行進行也可以。
當(dāng)通過雜音推定部21推定雜音時,有聲無聲判定部22基于雜音判定部13的判定結(jié)果、輸入信號以及雜音推定部21推定的雜音,判定輸入信號有聲或無聲(S22)。具體地說,例如,根據(jù)雜音推定部21推定的雜音和輸入信號算出S/N比,將算出的S/N比和預(yù)定的閾值相比較。這里,S/N比大于閾值時,判定為輸入信號是有聲的,S/N比小于或等于閾值時,判定為輸入信號是無聲的。
接著,說明根據(jù)本實施方式的有聲無聲判定裝置的效果。根據(jù)本實施方式的有聲無聲判定裝置2,除了具有根據(jù)上述實施方式的有聲無聲判定裝置1的效果之外,還具有以下效果。即,有聲無聲判定裝置2的雜音推定部21根據(jù)輸入信號推定雜音,有聲無聲判定部22基于雜音判定部13的判定結(jié)果、輸入信號以及雜音推定部21推定的雜音判定輸入信號是有聲還是無聲。因此,可以基于S/N比高精度地判定有聲無聲。雜音推定部21根據(jù)雜音判定部13的判定結(jié)果改變雜音推定式(上述式(3))的系數(shù)α,從而,能更高精度地判定有聲無聲。
第三實施方式接著,參考
根據(jù)本發(fā)明第三實施方式的有聲無聲判定裝置。圖6是根據(jù)本實施方式得有聲無聲判定裝置的構(gòu)成圖。根據(jù)本實施方式的有聲無聲判定裝置3和上述根據(jù)實施方式2的有聲無聲判定裝置2的不同之處在于雜音推定部31基于有聲無聲判定部22的判定結(jié)果來改變雜音的推定方法。
從功能上看,如圖6所示,有聲無聲判定裝置3包括自相關(guān)計算部11,延遲計算部12,雜音判定部13,雜音推定部31和有聲無聲判定部22。這里,自相關(guān)計算部11、延遲計算部12、雜音判定部13和有聲無聲判定部22具有的功能分別和根據(jù)第二實施方式的有聲無聲判定裝置2中的自相關(guān)計算部11、延遲計算部12、雜音判定部13和有聲無聲判定部22相同。
雜音推定部31和有聲無聲判定裝置2中的雜音推定部21一樣推定輸入信號的雜音。但是,特別地,雜音推定部31基于有聲無聲判定部22的判定結(jié)果改變雜音的推定方法。具體地說,雜音推定部31首先根據(jù)上述式(3)推定雜音。之后,雜音推定部31將根據(jù)式(3)算出的雜音乘上根據(jù)有聲無聲判定部22的判定結(jié)果履歷而決定的系數(shù)β后的值作為最終的雜音輸出。例如,雜音推定部31的有聲無聲判定部22連續(xù)輸出一定時間以上“有聲”的判定結(jié)果時,將上述系數(shù)β作為小于1的值,產(chǎn)生信號,此外的情況下,使系數(shù)β為1。此外,雜音推定部31也可以用上述過程以外的過程改變雜音的推定方法。
根據(jù)本實施方式的有聲無聲判定裝置3除了具有根據(jù)上述實施方式的有聲無聲判定裝置2的效果之外,還具有以下效果。即,有聲無聲判定裝置3基于有聲無聲判定部22的判定結(jié)果使雜音推定部31改變雜音的推定方法。因此,可以嵌入更細致的雜音推定過程。即,例如,有聲無聲判定部22連續(xù)判定為有聲時,通過積極地降低雜音推定部31推定的雜音電平,相對于雜音來強調(diào)信號分量。
上述有聲無聲判定裝置1、2和3的延遲計算部12可以按照以下過程算出多個延遲。即,延遲計算部12將延遲觀測區(qū)間分割為多個區(qū)間,在這些區(qū)間中分別算出自相關(guān)值最大的延遲。這時,例如,把上述延遲觀測區(qū)間的起點作為min_t,用2i-1·min_t~2i·min_t(i是自然數(shù))確定上述多個區(qū)間。
具體地說,如圖7所示,延遲計算部12首先依次按區(qū)間寬度成倍增長而分割為多個區(qū)間,使得延遲觀測區(qū)間min_t~max_t為min_t~2·min_t,2·min_t~4·min_t,4·min_t~8·min_t。之后,順次算出區(qū)間min_t~2·min_t內(nèi)自相關(guān)值為最大的延遲t_max1,區(qū)間2·min_t~4·min_t內(nèi)自相關(guān)值為最大的延遲t_max2,區(qū)間4·min_t~8·min_t內(nèi)自相關(guān)值為最大的延遲t_max3(這里,以M=3來說明)。例如,AMR時,根據(jù)min_t是18,求出[18,35]、[36,71]、[72,143]各區(qū)間內(nèi)自相關(guān)值為最大的延遲。
通過進行這樣的區(qū)間分割,對于有周期性的信號,可以更有效地檢測出與其2倍周期對應(yīng)的延遲,可以更高精度地進行有聲無聲判定。
本發(fā)明例如在便攜電話和因特網(wǎng)電話的通信中,用作有聲無聲判定裝置,判定輸入信號是包含聲音的有聲區(qū)間還是不需要發(fā)送信息得無聲區(qū)間。
當(dāng)然,以上說明的本發(fā)明的實施方式可以采用各種變形方式。這些變形方式不脫離本發(fā)明的主題和目的,下述請求范圍旨在包含所有上述變形方式的技術(shù)內(nèi)容。
權(quán)利要求
1.一種有聲無聲判定裝置,其特征在于,包括自相關(guān)計算單元,計算輸入信號的自相關(guān)值;延遲計算單元,計算使上述自相關(guān)計算單元計算出的上述自相關(guān)值為極大的多個延遲;性質(zhì)判定單元,基于由上述延遲計算單元計算出的上述多個延遲來判定上述輸入信號的性質(zhì);以及有聲無聲判定單元,基于上述性質(zhì)判定單元的判定結(jié)果,判定上述輸入信號有聲還是無聲。
2.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,上述有聲無聲判定單元基于上述性質(zhì)判定單元的判定結(jié)果和上述輸入信號來判定上述輸入信號有聲還是無聲。
3.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,還具有雜音推定單元,根據(jù)上述輸入信號來推定雜音;其中上述有聲無聲判定單元基于上述性質(zhì)判定單元的判定結(jié)果、上述輸入信號以及上述雜音推定單元推定的雜音來判定上述輸入信號有聲或無聲。
4.根據(jù)權(quán)利要求3所述的有聲無聲判定裝置,其特征在于,上述雜音推定單元基于上述有聲無聲判定單元的判定結(jié)果來改變雜音的推定方法。
5.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,上述延遲計算單元按照自相關(guān)值從大到小的順序來計算上述多個延遲。
6.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,上述延遲計算單元將延遲觀測區(qū)間分割為多個區(qū)間,計算出在上述各個區(qū)間中使自相關(guān)值為最大的延遲。
7.根據(jù)權(quán)利要求6所述的有聲無聲判定裝置,其特征在于,上述多個區(qū)間把上述延遲觀測區(qū)間的起點作為min_t,用2i-1·min_t~2i·min_t來表示,其中i是自然數(shù)。
8.一種有聲無聲判定方法,其特征在于,包括以下步驟自相關(guān)計算步驟,算出輸入信號的自相關(guān)值;延遲計算步驟,計算使在上述自相關(guān)計算步驟中計算出的上述自相關(guān)值為極大的多個延遲;性質(zhì)判定步驟,基于在上述延遲計算步驟中計算出的上述多個延遲來判定上述輸入信號的性質(zhì);以及有聲無聲判定步驟,基于上述性質(zhì)判定步驟中的判定結(jié)果,判定上述輸入信號有聲還是無聲。
全文摘要
本發(fā)明提供一種有聲無聲判定裝置和有聲無聲判定方法,其中有聲無聲判定裝置1包括計算輸入信號的自相關(guān)值的自相關(guān)計算部11;延遲計算部12,計算自相關(guān)計算部11算出的自相關(guān)值為極大的多個延遲;雜音判定部13,基于延遲計算部12算出的多個延遲判定輸入信號是否為雜音;有聲無聲判定部14,基于雜音判定部13的判定結(jié)果和輸入信號判定輸入信號有聲或無聲。
文檔編號H03M7/30GK1637856SQ20041008186
公開日2005年7月13日 申請日期2004年12月24日 優(yōu)先權(quán)日2003年12月25日
發(fā)明者仲信彥, 大矢智之 申請人:株式會社Ntt都科摩