两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于基于語音相關(guān)結(jié)構(gòu)的盲信道估計的方法和裝置的制作方法

文檔序號:2821015閱讀:218來源:國知局
專利名稱:用于基于語音相關(guān)結(jié)構(gòu)的盲信道估計的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于語音信號處理的方法和裝置,并特別涉及一種在語音系統(tǒng)中,例如在語音和說話者識別系統(tǒng)中去除信道畸變的方法和裝置。
背景技術(shù)
倒譜均值歸一化(CMN)是一種在自動語音識別系統(tǒng)中去除通信信道畸變的有效的技術(shù)。為了有效的工作,CMN系統(tǒng)中的語音處理窗口必須非常長,以保存語音信息。不幸的是,當(dāng)處理非平穩(wěn)信道時,最好使用更小的窗口,而更小的窗口卻不能在CMN系統(tǒng)中一樣有效的工作。而且,CMN技術(shù)是基于這樣一個假定語音均值不攜帶語音信息,或者其在處理窗口期間是常數(shù)。然而,當(dāng)使用短時窗口時,語音均值會攜帶重要的語音信息。
對影響語音信號的通信信道的估計問題屬于所熟知的盲系統(tǒng)辨識范疇。當(dāng)只獲得一種語音信號時(即“單麥克風(fēng)”的情況),估計問題沒有一般的解決方法??梢允褂贸蓸觼慝@得估計信道所必需的信息,但是如果只獲得一種語音信號并且沒有可能進(jìn)行超采樣,那么如果不對信號源做出假設(shè),就不可能解決估計問題的每個特例。例如,當(dāng)識別器不能使用數(shù)字轉(zhuǎn)換器時,如果不對信號源做出假設(shè),則不可能為電話語音識別進(jìn)行信道估計。

發(fā)明內(nèi)容
因此,本發(fā)明的一個構(gòu)造提供一種用于被通信信道損壞的語音信號的盲信道估計方法。該方法包括將含噪語音信號轉(zhuǎn)換為倒譜表示或者對數(shù)譜表示;估計該含噪語音信號表示的時間相關(guān);確定該含噪語音信號的平均值;根據(jù)最小化限制,利用干凈語音訓(xùn)練信號的相關(guān)結(jié)構(gòu)和含噪語音信號表示的相關(guān)以及該含噪語音信號的平均值來構(gòu)建和解算線性等式系統(tǒng);和選擇該線性等式系統(tǒng)解算式的符號,以估計在處理窗口上的平均干凈語音信號。
本發(fā)明的另一構(gòu)造提供一種用于被通信信道損壞的語音信號的盲信道估計裝置。該裝置被構(gòu)造使得將含噪語音信號轉(zhuǎn)換為倒譜表示或者對數(shù)譜表示;估計該含噪語音信號的表示的時間相關(guān);確定該含噪語音信號的平均值;根據(jù)最小化限制,利用干凈語音訓(xùn)練信號的相關(guān)結(jié)構(gòu)和含噪語音信號表示的相關(guān)以及該含噪語音信號的平均值來構(gòu)建和解算線性等式系統(tǒng);和選擇該線性等式系統(tǒng)解算式的符號,以估計在處理窗口上的平均干凈語音信號。
本發(fā)明還有一個構(gòu)造提供一種其上記錄有指令的機(jī)器可讀介質(zhì)或媒體,所配置的指令使得包括可編程處理器和數(shù)字信號處理器中至少一個的裝置進(jìn)行如下操作將含噪語音信號轉(zhuǎn)換為倒譜表示或者對數(shù)譜表示;估計該含噪語音信號的表示的時間相關(guān);確定該含噪語音信號的平均值;根據(jù)最小化限制,利用干凈語音訓(xùn)練信號的相關(guān)結(jié)構(gòu)和該含噪語音信號表示的相關(guān)以及該含噪語音信號的平均值來構(gòu)建和解算線性等式系統(tǒng);和選擇該線性等式系統(tǒng)解算式的符號,以估計在處理窗口上的平均干凈語音信號。
本發(fā)明的這些構(gòu)造提供有效并且高效的語音通信信道的估計,而不會刪除語音信息。
下文所提供的詳細(xì)描述,可以明顯看出本發(fā)明進(jìn)一步的應(yīng)用領(lǐng)域。應(yīng)該理解的是,雖然示出了本發(fā)明的優(yōu)選實(shí)施例,但是詳細(xì)描述和具體范例只是用于說明性的目的,而不意欲限制本發(fā)明的范圍。


通過下面的詳細(xì)描述和附圖可以對本發(fā)明更加全面的理解,其中圖1是本發(fā)明盲信道估計器的一種構(gòu)造的功能框圖;圖2是適合圖1的構(gòu)造使用的最大似然模塊的雙通實(shí)施方式的框圖;圖3是適合圖1的構(gòu)造使用的最大似然模塊的雙通GMM實(shí)施方式的框圖;
圖4是本發(fā)明的盲信道估計器的另一種構(gòu)造的功能框圖;圖5是本發(fā)明盲信道估計方法的的一種構(gòu)造的流程圖。
具體實(shí)施例方式
下面優(yōu)選實(shí)施例的描述實(shí)際上只是示范性的,并不意欲對本發(fā)明、其應(yīng)用或使用進(jìn)行限定。
這里所使用的“含噪語音信號”指的是被通信信道損壞和/或?yàn)V波的信號。還有這里所使用的“干凈語音信號”指的是沒有被通信信道濾波的語音信號,即通過具有平坦頻率響應(yīng)的系統(tǒng)傳送的語音信號,或者用來訓(xùn)練用于語音識別系統(tǒng)的聲學(xué)模型的語音信號?!捌骄蓛艉胝Z音信號”指的是從語音信號中去除了通信信道的損壞和/或?yàn)V波的估計的含噪語音信號的估計。
參照圖1,在本發(fā)明的盲信道估計器10的一種構(gòu)造中,利用存儲的語音相關(guān)結(jié)構(gòu) 14對語音通信信道12進(jìn)行估計和補(bǔ)償。如圖1所示,盲信道估計器10表示語音識別系統(tǒng)的一部分,其中信道12的輸出是含噪語音信號g(t)=s(t)*h(t),其中s(t)表示利用麥克風(fēng)或音頻處理器16的輸出、或通過具有平坦頻率響應(yīng)的濾波器得到的“干凈”語音信號,h(t)表示信道12的濾波器。g(t)所表示的信號通過倒譜分析模塊18(或通過對數(shù)譜分析模塊,未示出)轉(zhuǎn)換為倒譜(或?qū)?shù)譜)域中的信號Y(t)=S(t)+H(t)。
設(shè)S(t)為表示倒譜(或?qū)?shù)譜)域中的“干凈”語音信號。假設(shè)干凈語音信號的幀間時間相關(guān)是τ的遞減函數(shù)E[S(t)ST(t+τ)]=fτ(E[S(t)S(t)ST(t)]), (1)fτ通過時不變線性濾波器近似為fτ(E[S(t)S(t)ST(t)])=A(τ)E[S(t)ST(t)]。(2)通過執(zhí)行倒譜分析(即獲得倒譜域中的S(t)),然后執(zhí)行如下的相關(guān),可以從干凈語音訓(xùn)練信號中得到矩陣A(τ)的估計
E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,---(3)]]>將E[S(t)ST(t+τ)]與E[S(t)ST(t)](即τ延遲與零延遲的相關(guān))的比值進(jìn)行平均A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],---(4)]]>并在訓(xùn)練集上進(jìn)行積分A^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,---(5)]]>其中等式3中的積分在處理窗口的N個采樣值上進(jìn)行,并且等式5中的積分在整個訓(xùn)練集上進(jìn)行。等式3至5所描述的計算步驟是對在基本上沒有噪聲的環(huán)境中得到的干凈語音訓(xùn)練信號進(jìn)行的,從而可以得到基本上等于s(t)的信號。在使用含噪信道12對盲信道估計器10開始操作之前,將從該信號中得到的估計 存儲在相關(guān)結(jié)構(gòu)模塊14中。
對于信道估計而言,因?yàn)榈仁?中的假設(shè)校驗(yàn)完好,即相對誤差較小,最好使用短時延,但是時延不要太小使得該語音信號相關(guān)不能控制該通信信道相關(guān)。
在倒譜域(或?qū)?yīng)的對數(shù)譜域)中觀測倒譜分析模塊18(或?qū)?yīng)的對數(shù)譜分析模塊)所產(chǎn)生的含噪語音信號Y(t)。含噪語音信號Y(t)記作Y(t)=S(t)+H(t), (6)其中S(t)是原始的干凈語音信號s(t)的倒譜域表示,而H(t)是通信信道12的時變響應(yīng)h(t)的倒譜域表示。然后所觀測的信號Y(t)的相關(guān)通過相關(guān)估計器20確定。我們用信號Y(t)與具有時延τ的信號Y(t+τ)(或等價的Y(t-τ))表示為CY(τ),其中CY(τ)=E[Y(t)YT(t+τ)]。
線性系統(tǒng)解算器模塊22從相關(guān)估計器20產(chǎn)生的相關(guān)CY和存儲在相關(guān)結(jié)構(gòu)模塊14中的相關(guān)結(jié)構(gòu) 得出式子AA=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)).---(7)]]>同時,平均器模塊24根據(jù)倒譜分析模塊18的輸出Y(t)確定值b
b=E[Y(t)], (8)以及線性等式解算器22解算下面用于得到μs的等式系統(tǒng)μsμsT=bbT-A=B,]]>和 (9)μs+H=b。
(10)等式9和10的系統(tǒng)是超定的,意味著單個等式的數(shù)目超過了未知量的數(shù)目。因此,在盲信道估計器10中,這種等式系統(tǒng)作為最小化問題解算,比如作為最小均方誤差問題解算。等式10用于解算μs=S^,]]>其中μs是沒有信道損壞或在處理窗口上過濾的平均語音信號的平均值的估計,并利用線性系統(tǒng)解算器22最小化如下等式minμs||μsμsT-B||2.---(11)]]>(一種構(gòu)造中的估計 并不用于語音識別,是因?yàn)橛糜谛诺拦烙嫷奶幚泶翱?,比如?0-200ms,比用于語音識別的窗口,比如為10-20ms要更長。然而,在這種構(gòu)造中, 用來估計 其中H^=1TΣY(t)-μ^s,]]>其中求和運(yùn)算在該處理窗口(例如200ms)上進(jìn)行,然后S(t)用于在較短的處理窗口中識別,其中S^(t)=Y(t)-H^.)]]>在這種構(gòu)造中,S(t)表示在較短的處理窗口上的干凈語音,并且在此處稱之為“短窗干凈語音”。
在本發(fā)明的一種構(gòu)造中,線性系統(tǒng)解算器22通過設(shè)置下式來執(zhí)行有效的最小化μs=±λ1p1, (12)其中λ1是B的最大的特征值,p1是對應(yīng)的特征向量。在該構(gòu)造中,通過查找對應(yīng)于最大特征值(絕對值形式)的特征向量來得到等式12的解。這是用于解決非對稱實(shí)矩陣的對角化問題的子情況。雖然已知多種方法用于解決這種類型的問題,但這些方法的精度是由最大與最小特征值之間的比值決定的,也就是說,數(shù)值法更適合于較大特征值差的情況。通過實(shí)驗(yàn),發(fā)現(xiàn)在本發(fā)明的構(gòu)造中,最大和第二大的特征值的差別大約有一到兩個數(shù)量級。因此具有足夠的穩(wěn)定性,并且可以比較有把握地假定存在一個特征向量,該特征向量比其它任何特征向量能更好地最小化該代價函數(shù)。該特征向量提供一個在處理窗口上的平均干凈語音μs的估計。
因?yàn)樗玫降恼Z音估計都是模量,可以使用試探方式來得到正確的符號。在盲信道估計器10中,最大似然估計器26使用聲學(xué)模型來確定等式12的解的符號。例如,在兩個解碼通道中,或者使用語音和靜音高斯混合模型(GMM)來執(zhí)行最大似然估計。
參照圖2,在雙通最大似然估計器模塊26的一種構(gòu)造中,將Y(t)輸入兩個估計器模塊52、54。估計器模塊52也接收 作為輸入,并且估計器54模塊也接收 作為輸入。估計器模塊52的結(jié)果是 而估計器模塊54的結(jié)果是 這些結(jié)果分別輸入執(zhí)行語音識別的全解碼器56和58。全解碼器56和58的輸出被輸入到最大似然選擇器模塊60,其使用兼有解碼器56和58的語音識別輸出的似然信息來選擇從全解碼器56和58輸出的字作為結(jié)果。在圖2沒有示出的一種構(gòu)造中,最大似然選擇器模塊60的輸出 為 或 的輸出補(bǔ)充或者替代解碼器模塊56和58的解碼語音輸出,但 的輸出仍然取決于由模塊56和58所提供的似然信息。
在圖3中提供了一種雙通GMM最大似然解碼模塊26A的構(gòu)造,其可以替代圖2的雙通最大似然估計器模塊26。在這種構(gòu)造中,估計 和 分別輸入到語音和靜音GMM解碼器72和74,最大似然選擇器模塊76從GMM解碼器72和74的輸出中選擇,以確定該構(gòu)造的輸出 在如圖3所示的構(gòu)造中,最大似然選擇器模塊76的輸出輸入到全語音識別解碼模塊78,以產(chǎn)生解碼語音的最終輸出。
參照圖4,在本發(fā)明的盲信道估計器30的另一種構(gòu)造中,在線性系統(tǒng)解算器模塊22中使用相同的最小化,但是使用最小信道范數(shù)模塊32來確定該解的符號。在盲信道估計器30中,選擇使信道倒譜的范數(shù)‖H(t)‖2=‖Y-μs‖2最小化的μs=S^(t)]]>的符號作為解±μs的正確符號。該符號的解是基于這樣一種假設(shè)平均起來,信道倒譜的范數(shù)比語音倒譜的范數(shù)小,因此選擇使得‖H(t)‖2=‖Y-μs‖2最小化的±μs的符號作為語音信號 的符號。
倒譜域(或?qū)?shù)譜域)中的估計語音信號 適合在語音處理應(yīng)用,比如語音或說話者識別中用于進(jìn)一步分析。所估計的語音信號可以直接在倒譜域(或?qū)?shù)譜域)中使用,或者轉(zhuǎn)換成該應(yīng)用所要求的另一種(例如時域或頻域)表示。
參照圖5,在本發(fā)明的盲信道估計方法100的一種構(gòu)造中,提供了一種基于語音相關(guān)結(jié)構(gòu)的盲信道估計的方法。步驟102中,從干凈語音訓(xùn)練信號s(t)中獲得相關(guān)結(jié)構(gòu) 基于在基本上沒有噪聲的環(huán)境中得到的干凈語音訓(xùn)練信號,用處理器執(zhí)行等式3至5所描述的計算步驟,使得干凈語音信號基本上等于s(t)。
然后在步驟104,得到要處理的含噪語音信號g(t)并將其轉(zhuǎn)換成倒譜域(或?qū)?shù)譜域)表示的Y(t)。然后在步驟106,使用Y(t)估計相關(guān)CY(τ),并且在步驟108用Y(t)確定觀測信號Y(t)的平均值b。在步驟110,根據(jù)等式11的最小化限制構(gòu)建和解算線性等式9和10的系統(tǒng)。在步驟112利用最大似然方法或范數(shù)最小化方法來選擇或確定該解的符號,因此,在處理窗口上產(chǎn)生平均干凈語音信號的估計。
當(dāng)語音源和通信信道更加接近的滿足下面四個條件時,使用本發(fā)明的構(gòu)造可以得到更好的結(jié)果1、S(t)和H(t)是兩個獨(dú)立的隨機(jī)過程。
2、E[S(t+τ)]=E[S(t)],即S(t)是短時平穩(wěn)過程。
3、在處理窗口內(nèi)信道H(t)是常數(shù),從而H(t)=H,即為短時恒定應(yīng)用。
4、語音源的相關(guān)結(jié)構(gòu)滿足時不變線性濾波器模型,即E[S(t)ST(t+τ)]=A(τ)E[S(t)ST(t)]。
可以認(rèn)為這些條件足以滿足小的時延(短時結(jié)構(gòu))。然而當(dāng)使用下面的普通的期望值估計器,第二個條件并不嚴(yán)格的滿足E[S(t)ST(t+τ)]=1N-τΣi=1N-τS(i)ST(i+τ).---(13)]]>因此,本發(fā)明的一種構(gòu)造使用環(huán)形處理窗口E[S(t)ST(t+τ)]=1N-τΣi=1N-τS(i)ST(i+τ)+1τΣi=1τS(N-i)ST(i).---(14)]]>而且,在本方面的一種構(gòu)造中,為了更接近的滿足相關(guān)結(jié)構(gòu)條件,利用語音存在檢測器來確保在確定相關(guān)中忽略靜音幀,而只考慮語音幀。另外,利用短處理窗口更加接近的滿足短時恒定條件。因此,本發(fā)明的一種構(gòu)造提供了語音檢測器模塊19來區(qū)分語音信號的有無,并且相關(guān)估計器模塊20和平均器模塊24利用該信息來確保只考慮語音幀。
在本發(fā)明的一種構(gòu)造中,在倒譜域中應(yīng)用上述方法。在另一種構(gòu)造中,在對數(shù)譜域中應(yīng)用該方法。在一種構(gòu)造中,為了確保用來解算均方差問題所利用的對角化方法的精確性,使倒譜域或?qū)?shù)譜域中的系數(shù)的動態(tài)范圍是相等的。(通常有多個系數(shù),因?yàn)榈棺V或?qū)?shù)譜特征是矢量。)例如在一種構(gòu)造中,通過提取長時平均來歸一化倒譜系數(shù),并白噪聲化協(xié)方差矩陣。在另一種構(gòu)造中,使用對數(shù)譜系數(shù)而不是倒譜系數(shù)。
在本發(fā)明的一種構(gòu)造中,倒譜系數(shù)用于信道去除。在另一種構(gòu)造中,執(zhí)行對數(shù)譜信道去除。在某些應(yīng)用中可以進(jìn)行對數(shù)譜信道去除,因?yàn)樗陬l率上是局部的。
在本發(fā)明的一種構(gòu)造中,利用四幀(40ms)的時延來確定輸入信號的相關(guān)。已經(jīng)發(fā)現(xiàn)這種構(gòu)造是低語音相關(guān)與低固有假設(shè)誤差之間的一種有效折衷方案。更具體地,如果處理窗口過長,H(t)可以不是常數(shù),相反如果處理窗口過短,則不大可能得到好的相關(guān)估計。
利用一個或多個特殊用途的信號處理組件(即特別設(shè)計用于執(zhí)行上述處理的組件)、適當(dāng)?shù)某绦蚩刂葡碌钠胀ㄓ猛镜臄?shù)字信號處理器、適當(dāng)?shù)某绦蚩刂葡碌钠胀ㄓ猛镜奶幚砥骰駽PU、或它們的組合,以及在某些構(gòu)造中附加的支持硬件(例如存儲器),就可以物理上實(shí)現(xiàn)本發(fā)明的各種構(gòu)造。對于實(shí)時語音識別(例如車輛的語音控制或即說即打計算機(jī)系統(tǒng)),可以用麥克風(fēng)或相似的傳感器和音頻模數(shù)轉(zhuǎn)換器(ADC)輸入用戶的語音。用于控制普通用途的可編程處理器或CPU、和/或普通用途的數(shù)字信號處理器的指令可以以ROM固件的形式、以適當(dāng)存儲媒體或介質(zhì)上的機(jī)器可讀指令的形式,該介質(zhì)不必是可刪除的或可改變的(例如軟盤、CD-ROM、DVD、閃存或硬盤),或以從其他計算機(jī)接收到的信號(例如調(diào)制的電子載波信號)的形式提供。后一種情況的范例可以是通過網(wǎng)絡(luò)從遠(yuǎn)程計算機(jī)接收到的指令,該遠(yuǎn)程計算機(jī)自己可以存儲機(jī)器可讀形式的指令。
這里,進(jìn)一步描述這種構(gòu)造的數(shù)學(xué)分析。
在倒譜域(或?qū)?shù)譜域)中觀測的被通信信道損壞的語音信號如上面的等式6所描述的。在時間t具有時延τ的信號X的相關(guān)為CX(τ)=E[X(t)XT(t+τ)]。
(15)假定按照上文定義的無相關(guān)性、短時平穩(wěn)、短時恒定條件,觀測信號的相關(guān)可以記作CY(τ)=CS(τ)+μsHT+HμST+HHT,---(16)]]>其中μs=E[S(t)]。通過假定上文中的短時線性相關(guān)結(jié)構(gòu)條件,可以得出上面的等式7和8。
通過考慮下面N2范數(shù)中的最小化問題,可以得出有效的最小化minX||XXT-B||2,---(17)]]>其中X=[x1x2…xn]和B=(bi,j)i,j∈1,…,n。假設(shè)B可對角化,則我們可以記作B=PΛP*,其中Λ=diag{λ1…λn}是對角矩陣,P={p1,…,pn}是單位矩陣。假定特征值λ1…λn按照遞增順序λ1≥…≥λn排序??梢詫懽鱩inX||XXY-B||2~minY||YYT-Λ||2,---(18)]]>
其中,Y=PTX。也可以記作||YYT-Λ||2=Σin(yi2-λi)2+ΣiΣj≠i(yiyj)2.---(19)]]>通過進(jìn)行偏微分,我們得到∂||YYT-Λ||2∂yk=4yk(Σiyi2-λk).---(20)]]>通過將微分設(shè)定為零,我們得到4yk(Σiyi2-λk)=0,∀k=1...n.---(21)]]>由于已經(jīng)假定λ1≥…≥λn,根據(jù)前面的等式,它滿足系數(shù)y1…yn中至多一個系數(shù)不為零。通過矛盾法,假定∃i1≠i2:yi1≠0,yi2≠0,]]>然后我們得到Σiyi2=λi1,---(22)]]>Σiyi2=λi2,---(23)]]>并且λi1≠λi2,這是不可能的。而且,給定Y是非零向量,我們得到y(tǒng)i0=±λi0yi=0∀i≠ii0---(24)]]>因此,我們得到||YYT-Λ||2=Σi≠i0λi2,]]>并且使得‖YYT-Λ‖最小的解是i0=1。這也就意味著最小化問題有兩個解X=±λ1p1,其中λ1是B的最大特征值,并且p1是對應(yīng)的特征向量。
本發(fā)明的構(gòu)造提供了損壞語音信號的通信信道的有效估計。已經(jīng)發(fā)現(xiàn)使用此處所描述的方法和裝置的試驗(yàn)比標(biāo)準(zhǔn)倒譜均值歸一化技術(shù)更加有效,因?yàn)榈讓蛹俣ǜ菀昨?yàn)證。這些試驗(yàn)也表明,使用最小范數(shù)符號估計進(jìn)行信道補(bǔ)償,靜態(tài)倒譜特征相對于CMN具有顯著的改進(jìn)。對于最大似然符號估計,建議在聯(lián)合估計聲學(xué)模型的時候,將信道符號作為隱藏變量考慮,并且在進(jìn)行期望值最大(EM)算法時對其進(jìn)行優(yōu)化。
總之,對于完全使用倒譜域的本發(fā)明的構(gòu)造,也存在對應(yīng)的完全使用倒譜域的本發(fā)明的構(gòu)造。一旦做出設(shè)計選擇其中一個或另一個域,在整個構(gòu)造中應(yīng)該一致的使用這個域,以避免另外需要從一個域轉(zhuǎn)換到另一個域。
本發(fā)明的描述實(shí)際上只是示范性的,因此,不脫離本發(fā)明要點(diǎn)的變化都被認(rèn)為是處于本發(fā)明的范圍之中。這種改變并不被認(rèn)為是脫離本發(fā)明的精神和范圍。
權(quán)利要求
1.一種用于被通信信道損壞的語音信號的盲信道估計方法,所述方法包括將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號表示;估計該含噪語音信號表示的相關(guān);確定該含噪語音信號的平均值;根據(jù)最小化限制,利用干凈語音訓(xùn)練信號的相關(guān)結(jié)構(gòu)和含噪語音信號表示的相關(guān)以及含噪語音信號的平均值來構(gòu)建和解算線性等式系統(tǒng);和選擇該線性等式系統(tǒng)的解的符號,以估計在處理窗口上的平均干凈語音信號。
2.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括使用該平均干凈語音估計來確定在該處理窗口上的平均信道估計;和使用該平均信道估計來確定在更短的處理窗口上的干凈語音信號。
3.根據(jù)權(quán)利要求1所述的方法,其中所述選擇線性等式系統(tǒng)的解的符號包括利用最大似然準(zhǔn)則選擇符號。
4.根據(jù)權(quán)利要求1所述的方法,其中所述選擇線性等式系統(tǒng)的解的符號包括選擇使得所估計的信道噪聲的范數(shù)最小的符號。
5.根據(jù)權(quán)利要求1所述的方法,其中所述將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號表示包括將該含噪語音信號轉(zhuǎn)換為倒譜表示。
6.根據(jù)權(quán)利要求1所述的方法,其中所述將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號表示包括將該含噪語音信號轉(zhuǎn)換為對數(shù)譜表示。
7.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括在基本上沒有噪聲的環(huán)境中得到干凈語音訓(xùn)練信號,和利用所述干凈語音訓(xùn)練信號確定所述相關(guān)結(jié)構(gòu)。
8.根據(jù)權(quán)利要求1所述的方法,其中所述相關(guān)結(jié)構(gòu)記作 所述該含噪語音信號表示記作Y(t)=S(t)+H(t),其中Y(t)是該含噪語音信號表示,S(t)是該含噪語音信號的干凈語音表示,并且H(t)是通信信道的時變響應(yīng)表示;所述估計含噪語音信號表示的相關(guān)包括確定CY(τ),其中CY(τ)=E[YtYT(t+τ)];所述確定含噪語音信號的平均值包括確定b=E[Y(t)];所述構(gòu)建和解算線性等式系統(tǒng)包括解算記作如下的線性等式系統(tǒng)μsμsT=bbT-A=B,]]>和μs+H=b中的平均干凈語音信號的表示μs,其中A=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)),]]>和b=E[Y(t)]。
9.根據(jù)權(quán)利要求8所述的方法,其中所述構(gòu)建和解算線性等式系統(tǒng)包括根據(jù)如下的最小化限制來解算所述線性等式系統(tǒng)minμs||μsμsT-B||2.]]>
10.根據(jù)權(quán)利要求8所述的方法,其中所述構(gòu)建和解算線性等式系統(tǒng)包括確定μs為±λ1p1,其中λ1是B的最大特征值,并且p1是對應(yīng)的特征向量。
11.根據(jù)權(quán)利要求10所述的方法,進(jìn)一步包括利用最大似然準(zhǔn)則選擇μs的符號。
12.根據(jù)權(quán)利要求11所述的方法,進(jìn)一步包括選擇使信道倒譜的范數(shù)‖H(t)‖2=‖Y-μs‖2最小的μs的符號。
13.根據(jù)權(quán)利要求8所述的方法,進(jìn)一步包括估計記作s(t)的干凈語音訓(xùn)練信號的 為A^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,]]>其中A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],]]>E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,]]>并且S(t)是s(t)的倒譜或?qū)?shù)譜表示。
14.一種用于被通信信道損壞的語音信號的盲信道估計裝置,所述裝置被構(gòu)造成將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號表示;估計該含噪語音信號表示的相關(guān);確定該含噪語音信號的平均值;根據(jù)最小化限制,利用干凈語音訓(xùn)練信號的相關(guān)結(jié)構(gòu)和含噪語音信號表示的相關(guān)以及含噪語音信號的平均值來構(gòu)建和解算線性等式系統(tǒng);和選擇該線性等式系統(tǒng)的解的符號,以估計在處理窗口上的平均干凈語音信號。
15.根據(jù)權(quán)利要求14所述的裝置,進(jìn)一步被構(gòu)造成使用該平均干凈語音估計來確定在該處理窗口上的平均信道估計;和使用該平均信道估計來確定在更短的處理窗口上的干凈語音信號。
16.根據(jù)權(quán)利要求14所述的裝置,其中為選擇線性等式系統(tǒng)的解的符號,所述裝置被構(gòu)造成利用最大似然準(zhǔn)則選擇符號。
17.根據(jù)權(quán)利要求14所述的裝置,其中為選擇線性等式系統(tǒng)的解的符號,所述裝置被構(gòu)造成選擇使得所估計的信道噪聲的范數(shù)最小的符號。
18.根據(jù)權(quán)利要求14所述的裝置,其中為將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號表示,所述裝置被構(gòu)造成將該含噪語音信號轉(zhuǎn)換為倒譜表示。
19.根據(jù)權(quán)利要求14所述的裝置,其中為了將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號的表示,所述裝置被構(gòu)造成將該含噪語音信號轉(zhuǎn)換為對數(shù)譜表示。
20.根據(jù)權(quán)利要求14所述的裝置,進(jìn)一步被構(gòu)造成在基本上沒有噪聲的環(huán)境中得到干凈語音訓(xùn)練信號,和利用所述干凈語音訓(xùn)練信號確定所述相關(guān)結(jié)構(gòu)。
21.根據(jù)權(quán)利要求14所述的裝置,其中所述相關(guān)結(jié)構(gòu)記作 所述該含噪語音信號的表示記作Y(t)=S(t)+H(t),其中Y(t)是該含噪語音信號的表示,S(t)是該含噪語音信號的干凈語音表示,并且H(t)是通信信道的時變響應(yīng)表示;為估計該含噪語音信號表示的相關(guān),所述裝置被構(gòu)造成確定CY(τ),其中CY(τ)=E[YtYT(t+τ)];為確定該含噪語音信號的平均值,所述裝置被構(gòu)造成確定b=E[Y(t)];為構(gòu)建和解算線性等式,所述裝置被構(gòu)造成解算記作如下的線性等式系統(tǒng)μsμsT=bbT-A=B,]]>和μs+H=b中的平均干凈語音信號的表示μs,其中A=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)),]]>和b=E[Y(t)]。
22.根據(jù)權(quán)利要求21所述的裝置,其中為構(gòu)建和解算線性等式系統(tǒng),所述裝置被構(gòu)造成根據(jù)如下的最小化限制來解算所述線性等式系統(tǒng)minμs||μsμsT-B||2.]]>
23.根據(jù)權(quán)利要求21所述的裝置,其中為構(gòu)建和解算線性等式系統(tǒng),所述裝置被構(gòu)造成確定μs為±λ1p1,其中λ1是B的最大特征值,并且p1是對應(yīng)的特征向量。
24.根據(jù)權(quán)利要求23所述的裝置,進(jìn)一步被構(gòu)造成利用最大似然準(zhǔn)則選擇μs的符號。
25.根據(jù)權(quán)利要求24所述的裝置,進(jìn)一步被構(gòu)造成選擇使信道倒譜的范數(shù)‖H(t)‖2=‖Y-μs‖2最小的μs的符號。
26.根據(jù)權(quán)利要求21所述的裝置,進(jìn)一步被構(gòu)造成估計記作s(t)干凈語音訓(xùn)練信號的 為A^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,]]>其中A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],]]>E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,]]>并且S(t)是s(t)的倒譜或?qū)?shù)譜表示。
27.一種其上記錄有指令的機(jī)器可讀介質(zhì)或媒體,所配置的指令使得包括由可編程處理器和數(shù)字信號處理器組成的組中至少一個部件的裝置進(jìn)行如下操作將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號的表示;估計該含噪語音信號表示的相關(guān);確定該含噪語音信號的平均值;根據(jù)最小化限制,利用干凈語音訓(xùn)練信號的相關(guān)結(jié)構(gòu)和含噪語音信號表示的相關(guān)以及含噪語音信號的平均值來構(gòu)建和解算線性等式系統(tǒng);和選擇該線性等式系統(tǒng)的解的符號,以估計在處理窗口上的平均干凈語音信號。
28.根據(jù)權(quán)利要求27所述的介質(zhì)或媒體,其中所述指令包括進(jìn)行如下操作的指令使用該平均干凈語音估計來確定在該處理窗口上的平均信道估計;和使用該平均信道估計來確定在更短的處理窗口上的干凈語音信號。
29.根據(jù)權(quán)利要求27所述的介質(zhì)或媒體,其中為選擇線性等式系統(tǒng)的解的符號,所述記錄的指令包括利用最大似然準(zhǔn)則選擇符號的指令。
30.根據(jù)權(quán)利要求27所述的介質(zhì)或媒體,其中為選擇線性等式系統(tǒng)的解的符號,所述記錄的指令包括選擇使得所估計的信道噪聲的范數(shù)最小的符號的指令。
31.根據(jù)權(quán)利要求27所述的介質(zhì)或媒體,其中為將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號的表示,所述記錄的指令包括將該含噪語音信號轉(zhuǎn)換為倒譜表示的指令。
32.根據(jù)權(quán)利要求27所述的介質(zhì)或媒體,其中為了將含噪語音信號轉(zhuǎn)換為倒譜表示或?qū)?shù)譜表示的含噪語音信號的表示,所述記錄的指令包括將該含噪語音信號轉(zhuǎn)換為對數(shù)譜表示的指令。
33.根據(jù)權(quán)利要求27所述的介質(zhì)或媒體,所述記錄的指令進(jìn)一步包括在基本上沒有噪聲的環(huán)境中得到干凈語音訓(xùn)練信號,和利用所述干凈語音訓(xùn)練信號確定所述相關(guān)結(jié)構(gòu)的指令。
34.根據(jù)權(quán)利要求27所述的介質(zhì)或媒體,其中所述相關(guān)結(jié)構(gòu)記作 所述該含噪語音信號的表示記作Y(t)=S(t)+H(t),其中Y(t)是該含噪語音信號的表示,S(t)是該含噪語音信號的干凈語音表示,并且H(t)是通信信道的時變響應(yīng)表示;為估計該含噪語音信號表示的相關(guān),所述記錄的指令包括確定CY(τ),其中CY(τ)=E[YtYT(t+τ)]的指令;為確定該含噪語音信號的平均值,所述記錄的指令包括確定b=E[Y(t)]的指令;和為構(gòu)建和解算線性等式,所述記錄的指令包括解算記作如下的線性等式的指令μsμsT=bbT-A=B,]]>和μs+H=b中的平均干凈語音信號的表示μs,其中A=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)),]]>和b=E[Y(t)]。
35.根據(jù)權(quán)利要求34所述的介質(zhì)或媒體,其中為構(gòu)建和解算線性等式系統(tǒng),所述記錄的指令包括根據(jù)如下的最小化限制來解算所述線性等式系統(tǒng)的指令minμs||μsμsT-B||2.]]>
36.根據(jù)權(quán)利要求34所述的介質(zhì)或媒體,其中為構(gòu)建和解算線性等式系統(tǒng),所述記錄的指令包括確定μs為±λ1p1的指令,其中λ1是B的最大特征值,并且p1是對應(yīng)的特征向量。
37.根據(jù)權(quán)利要求36所述的介質(zhì)或媒體,所述記錄的指令進(jìn)一步包括利用最大似然準(zhǔn)則選擇μs的符號的指令。
38.根據(jù)權(quán)利要求37所述的介質(zhì)或媒體,其中所述記錄的指令進(jìn)一步包括選擇使信道倒譜的范數(shù)‖H(t)‖2=‖Y-μs‖2最小的μs的符號的指令。
39.根據(jù)權(quán)利要求34所述的裝置,所述記錄的指令進(jìn)一步包括估計記作s(t)干凈語音訓(xùn)練信號的 為下式的指令A(yù)^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,]]>其中A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],]]>E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,]]>并且S(t)是s(t)的倒譜或?qū)?shù)譜表示。
全文摘要
提供用于被通信信道損壞的語音信號的盲信道估計方法和裝置。一種方法包括將含噪語音信號轉(zhuǎn)換為倒譜表示(18)或者對數(shù)譜表示;估計該含噪語音信號表示的相關(guān)(20);確定該含噪語音信號的平均值(24);根據(jù)最小化限制,利用干凈語音訓(xùn)練信號的相關(guān)結(jié)構(gòu)(140)和含噪語音信號表示的相關(guān)(24)以及含噪語音信號的平均值來構(gòu)建和解算線性等式系統(tǒng);和選擇線性等式系統(tǒng)(22)的解的符號,以估計在處理窗口上的平均干凈語音信號。
文檔編號G10L15/02GK1698096SQ03805911
公開日2005年11月16日 申請日期2003年3月14日 優(yōu)先權(quán)日2002年3月15日
發(fā)明者尤奈斯·蘇爾密, 帕特里克·恩伽元, 盧克·雷茄杰洛, 讓-克勞德·容科 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
东莞市| 巴中市| 广宁县| 基隆市| 紫阳县| 郴州市| 苏尼特右旗| 宁远县| 多伦县| 新邵县| 南江县| 巫山县| 遵化市| 鸡东县| 永安市| 浮梁县| 佛学| 杂多县| 汉沽区| 堆龙德庆县| 喀喇沁旗| 武威市| 沙洋县| 尉犁县| 金堂县| 宣恩县| 白城市| 安西县| 鄂伦春自治旗| 安多县| 禹州市| 盘锦市| 龙川县| 庆安县| 抚州市| 随州市| 宁南县| 建瓯市| 登封市| 兴义市| 咸阳市|