聲源分離裝置、聲源分離方法、以及程序的制作方法

文檔序號：2832747閱讀：293來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：聲源分離裝置、聲源分離方法、以及程序的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種使用多個麥克風(fēng)從多個聲源所發(fā)出的多個聲音信號、各種環(huán)境噪聲等多個音響信號混雜的信號中分離出來自目標(biāo)聲源的聲源信號的聲源分離裝置、聲源分離方法、以及程序。
背景技術(shù)：
想要在各種環(huán)境下收錄特定的聲音信號等的情況下，由于周圍環(huán)境中存在有各種各樣的噪聲源，所以用麥克風(fēng)僅收錄作為目標(biāo)聲音的信號是比較困難的，需要進行一些噪聲降低處理或者聲源分離處理。作為尤其需要這些處理的實例，舉例有在汽車環(huán)境下。在汽車環(huán)境下，由于移動電話的普及，行駛中的使用移動電話的通話一般采用與車內(nèi)分開設(shè)置的麥克風(fēng)，從而使得通話品質(zhì)顯著變差。又，由于在汽車環(huán)境下在行駛中進行聲音識別的情況下也在相同的狀況下發(fā)聲，這成為使得聲音識別性能變差的原因。由于現(xiàn)在的聲音識別技術(shù)的進步，對于相對于穩(wěn)態(tài)噪聲的聲音識別率變差的問題，能夠恢復(fù)變差了的性能的相當(dāng)大的部分。但是，作為以現(xiàn)有的聲音識別技術(shù)難以對應(yīng)的問題，有多個發(fā)聲者同時發(fā)聲時的識別性能變差的問題。采用現(xiàn)有的聲音識別技術(shù)的話，由于識別同時發(fā)聲的二個人的混合音的技術(shù)較低，因此在聲音識別裝置使用時會限制發(fā)聲者以外的同乘者發(fā)聲，發(fā)生限制同乘者的行動的狀況。又，關(guān)于移動電話、或者能夠與移動電話連接進行免提通話的頭戴送受話器，在背景噪聲環(huán)境下進行通話時也同樣會發(fā)生通話品質(zhì)的變差。作為解決上述那樣的問題的方法，存在有具有多個麥克風(fēng)的聲源分離方法。例如，專利文獻I所記載的聲源分離裝置進行波束形成處理，以使得來自相對于連接兩個麥克風(fēng)的直線的垂線對稱的方向的聲源信號分別衰減，根據(jù)對波束形成輸出計算出的功率譜信息之間的差值提取目標(biāo)聲源的頻譜信息。通過采用專利文獻I所記載的聲源分離裝置，能夠?qū)崿F(xiàn)指向特性不受麥克風(fēng)元件的靈敏度影響的性質(zhì)，能夠不受麥克風(fēng)元件的靈敏度的差異的影響地從混合有多個聲源所發(fā)出的聲源信號的混合音之中分離來自目標(biāo)聲源的聲源信號。現(xiàn)有技術(shù)文獻專利文獻專利文獻1:日本專利第4225430號公報非專利文獻非專利文獻1:Y.Ephraim And D.Malah, 〃利用最小均方誤差短時譜幅度估計的語音增強算法(Speech enhancement using minimum mean-square error short-timespectral amplitude estimator) 〃，IEEE Trans Acoust., Speech, Signal Processing, ASSP-32, 6，pp.1109-1121，Dec.1984.
非專利文獻2:S.Gustafsson, P.Jax, And P.Vary, 〃保留背景噪聲特征的新型的基于心理聲學(xué)模型的音頻增強算法(A novel psychoacoustically motivated audioenhancement algorithm preserving background noise characteristics), ^IEEEInternational Conference On Acoustics, Speech And Signal Processing, ICASSP' 98, vol.1,ppt.397-400vol.1, 12_15May 1998.

發(fā)明內(nèi)容
發(fā)明要解決的課題然而，采用專利文獻I所記載的聲源分離裝置的話，在波束形成處理后所計算出的兩個功率譜信息的差值為規(guī)定的閾值以上的情況下，將該差值識別為目標(biāo)聲音就照原樣進行輸出，另一方面，在兩個功率譜信息的差值小于規(guī)定的閾值的情況下，該差值被識別為噪聲并將該頻帶的輸出設(shè)為O。因此，在存在例如如汽車的行駛噪聲那樣到來方向沒規(guī)定為特定的方向的擴散性噪聲的環(huán)境下，使得專利文獻I的聲源分離裝置動作時，特定的頻帶被大大地刪除，結(jié)果存在擴散性噪聲被不規(guī)則地分配給聲源分離結(jié)果而變成音樂噪聲的(音樂噪聲)的情況。另外，音樂噪聲是指噪聲的去除殘留，由于是在時間軸上以及頻率軸上孤立的成分，因此其作為不自然的刺耳的聲音而被聽到。又，在專利文獻I中，揭示了通過將后置濾波處理放在波束形成處理的前段，來降低擴散性噪聲、穩(wěn)態(tài)噪聲等，從而防止聲源分離后的音樂噪聲發(fā)生的技術(shù)。然而，在麥克風(fēng)分開配置的情況下、麥克風(fēng)被模鑄在移動電話、頭戴送受話器等的框體上的情況下，被輸入兩個麥克風(fēng)的噪聲的音量差、相位差變大。因此，如果將由其中一個麥克風(fēng)求得的增益就這樣適用于另一個麥克風(fēng)的話，目標(biāo)聲音在每個頻帶都被壓制、或者噪聲大大殘留。其結(jié)果，難以充分地防止音樂噪聲的發(fā)生。因此，本發(fā)明正是為了解決上述那樣的問題而做出的，其目的在于提供能夠不受麥克風(fēng)的配置的影響地使音樂噪聲的發(fā)生充分地降低的聲源分離裝置、聲源分離方法、以及程序。解決課題的手段為了解決上述課題，本發(fā)明的一個形態(tài)為從混合有多個聲源所發(fā)出的聲源信號的混合音中分離來自目標(biāo)聲源的聲源信號的聲源分離裝置，其特征在于，包括:第I波束形成處理部，其通過對來自由被輸入所述混合音的兩個麥克風(fēng)構(gòu)成的麥克風(fēng)對的各自的輸出信號進行使用了相互不同的第I系數(shù)的、在頻域的積和運算，以與連接所述兩個麥克風(fēng)的線段相交的平面為界限，使得從與包含所述目標(biāo)聲源的方向的區(qū)域相反的區(qū)域到來的聲源信號衰減；第2波束形成處理部，其通過對來自所述麥克風(fēng)對的各自的輸出信號乘以第2系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以所述平面為界限使得從包含所述目標(biāo)聲源的方向的區(qū)域到來的聲源信號衰減，所述第2系數(shù)與所述相互不同的第I系數(shù)在頻域為復(fù)共軛的關(guān)系；功率計算部，其根據(jù)通過所述第I波束形成處理部得到的信號計算具有每個頻率的功率值的第I頻譜信息，進一步地根據(jù)通過所述第2波束形成處理部得到的信號計算具有每個頻率的功率值的第2頻譜信息；加權(quán)系數(shù)算出部，其根據(jù)所述第I頻譜信息與所述第2頻譜信息的每個頻率的功率值的差值，計算用于與所述第I波束形成處理部所得到的信號相乘的每個頻率的加權(quán)系數(shù)，所述聲源分離裝置根據(jù)由所述第I波束形成處理部得到的信號與所述加權(quán)系數(shù)算出部所算出的所述加權(quán)系數(shù)的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
又，本發(fā)明的其他的形態(tài)為一種聲源分離方法，其由具有第I波束形成處理部、第2波束形成處理部、功率計算部、加權(quán)系數(shù)算出部和聲源分離部的聲源分離裝置所執(zhí)行，其特征在于，包括以下步驟第1步驟，在該步驟中，所述第I波束形成處理部通過對來自由被輸入混合音的兩個麥克風(fēng)構(gòu)成的麥克風(fēng)對的各自的輸出信號進行使用了相互不同的第I系數(shù)的、在頻域的積和運算，以與連接所述兩個麥克風(fēng)的線段相交的平面為界限，使得從與包含目標(biāo)聲源的方向的區(qū)域相反的區(qū)域到來的聲源信號衰減，所述混合音混合有多個聲源所發(fā)出的聲源信號；第2步驟，在該步驟中，所述第2波束形成處理部通過對來自所述麥克風(fēng)對的各自的輸出信號乘以第2系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以所述平面為界限使得從包含所述目標(biāo)聲源的方向的區(qū)域到來的聲源信號衰減，所述第2系數(shù)與所述相互不同的第I系數(shù)在頻域為復(fù)共軛的關(guān)系；第3步驟，在該步驟中，所述功率計算部根據(jù)通過所述第I步驟得到的信號計算具有每個頻率的功率值的第I頻譜信息，進一步地根據(jù)通過所述第2步驟得到的信號計算具有每個頻率的功率值的第2頻譜信息；第4步驟，在該步驟中，所述加權(quán)系數(shù)算出部根據(jù)所述第I頻譜信息與所述第2頻譜信息的每個頻率的功率值的差值，計算用于與所述第I步驟所得到的信號相乘的每個頻率的加權(quán)系數(shù)，所述聲源分離方法根據(jù)由所述第I步驟得到的信號與所述第4步驟所算出的所述加權(quán)系數(shù)的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。又，本發(fā)明的其他的形態(tài)為一種聲源分離程序，其特征在于，使得計算機執(zhí)行以下的步驟:第I處理步驟，在該步驟中，通過對來自被輸入混合音的兩個麥克風(fēng)構(gòu)成的麥克風(fēng)對的各自的輸出信號進行使用了相互不同的第I系數(shù)的、在頻域的積和運算，以與連接所述兩個麥克風(fēng)的線段相交的平面為界限，使得從與包含目標(biāo)聲源的方向的區(qū)域相反的區(qū)域到來的聲源信號衰減，所述混合音混合有多個聲源所發(fā)出的聲源信號；第2處理步驟，在該步驟中，通過對來自所述麥克風(fēng)對各自的輸出信號乘以第2系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以所述平面為界限使得從包含所述目標(biāo)聲源的方向的區(qū)域到來的聲源信號衰減，所述第2系數(shù)與所述相互不同的第I系數(shù)在頻域為復(fù)共軛的關(guān)系；第3處理步驟，在該步驟中，根據(jù)通過所述第I處理步驟得到的信號計算具有每個頻率的功率值的第I頻譜信息，進一步地根據(jù)通過所述第2處理步驟得到的信號計算具有每個頻率的功率值的第2頻譜信息；第4處理步驟，在該步驟中，根據(jù)所述第I頻譜信息與所述第2頻譜信息的每個頻率的功率值的差值，計算用于與所述第I步驟所得到的信號相乘的每個頻率的加權(quán)系數(shù)，所述聲源分離程序根據(jù)由所述第1處理步驟得到的信號與所述第4處理步驟所算出的所述加權(quán)系數(shù)的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。采用這樣的構(gòu)成，尤其是在存在擴散性噪聲的環(huán)境下也能夠抑制音樂噪聲的發(fā)生、且能夠從混合有多個聲源所發(fā)出的聲源信號的混合音當(dāng)中分離來自目標(biāo)聲源的聲源信號。發(fā)明的效果能夠維持專利文獻1的效果，且使得音樂噪聲的發(fā)生充分地降低。

圖1是示出第1實施形態(tài)所涉及的聲源分離系統(tǒng)的構(gòu)成的圖。圖2是示出第1實施形態(tài)所涉及的波束形成部的構(gòu)成的圖。圖3是示出功率計算部的構(gòu)成的圖。
圖4是示出相對于麥克風(fēng)輸入信號的、專利文獻I所涉及的聲源分離裝置和本發(fā)明的第I實施形態(tài)所涉及的聲源分離裝置中的處理結(jié)果的圖。圖5是示出圖4的處理結(jié)果的一部分的放大圖。圖6是示出噪聲推定部的構(gòu)成的圖。圖7是示出噪聲均衡部的構(gòu)成的圖。圖8是示出第I實施形態(tài)所涉及的聲源分離系統(tǒng)的另一構(gòu)成的圖。圖9是示出第2實施形態(tài)所涉及的聲源分離系統(tǒng)的構(gòu)成的圖。圖10是示出控制部的構(gòu)成的圖。圖11是示出第3實施形態(tài)所涉及的聲源分離系統(tǒng)的構(gòu)成的一例的圖。圖12是示出第3實施形態(tài)所涉及的聲源分離系統(tǒng)的構(gòu)成的一例的圖。圖13是示出第3實施形態(tài)所涉及的聲源分離系統(tǒng)的構(gòu)成的一例的圖。圖14是示出第4實施形態(tài)所涉及的聲源分離系統(tǒng)的構(gòu)成的圖。圖15是示出指向性控制部的構(gòu)成的圖。圖16是示出本發(fā)明的聲源分離裝置的指向特性的圖。圖17是示出指向性控制部的另一構(gòu)成的圖。圖18是示出設(shè)置有目標(biāo)聲音修正部的情況下本發(fā)明的聲源分離裝置的指向特性的圖。圖19是示出聲源分離系統(tǒng)的處理的一例的流程圖。圖20是示出噪聲推定部的處理的詳細(xì)情況的流程圖。圖21是示出噪聲均衡部的處理的詳細(xì)情況的流程圖。圖22是示出殘留噪聲壓制算出部的處理的詳細(xì)情況的流程圖。圖23是示出就波束形成器30的輸出值對鄰近聲音和遠(yuǎn)距離聲音的情況進行比較的圖表的圖(麥克風(fēng)間隔3cm)。圖24是示出就波束形成器30的輸出值對鄰近聲音和遠(yuǎn)距離聲音的情況進行比較的圖表的圖(麥克風(fēng)間隔1cm)。圖25是示出專利文獻I的聲源分離裝置的聲源分離的邊界面的圖。圖26是示出專利文獻I的聲源分離裝置的指向特性的圖。
具體實施例方式以下，參照附圖對本發(fā)明所涉及的實施形態(tài)進行說明。[第I實施形態(tài)]圖1是第I實施形態(tài)所涉及的聲源分離系統(tǒng)的基本的構(gòu)成的圖。該系統(tǒng)包括兩個麥克風(fēng)(以下稱為「麥克風(fēng)」)10、11，和聲源分離裝置I。以下，設(shè)麥克風(fēng)為兩個來對實施形態(tài)進行說明，但麥克風(fēng)的數(shù)量可以是至少兩個以上，并不限定于兩個。該聲源分離裝置I具有:包含未圖示的、對整體進行控制并執(zhí)行運算處理的CPU以及ROM、RAM、硬盤裝置等的存儲裝置的硬件；和包含存儲在存儲裝置中的程序、數(shù)據(jù)等的軟件。通過這些硬件以及軟件來實現(xiàn)聲源分離裝置I的各功能模塊。兩個麥克風(fēng)10、11在平面上相互分開地設(shè)置，接收從兩個聲源Rl、R2發(fā)出的信號。此時，使得這兩個聲源Rl、R2分別位于以與連接兩個麥克風(fēng)10、11的線段相交的平面(以下、設(shè)為分離面)為邊界而分割的兩個區(qū)域(以下稱為「分離面的左右」)，但未必需要存在于相對于分離面左右對稱的位置。另外，在本實施形態(tài)中，對將分離面設(shè)為與在面內(nèi)含有連接兩個麥克風(fēng)10、11的線段的平面垂直相交、且通過所述線段的中點的平面的實例進行說明。又,設(shè)從聲源Rl發(fā)出的聲音為應(yīng)取得的目標(biāo)聲音，從聲源R2發(fā)出的聲音為應(yīng)壓制的噪聲(本說明書通篇都是同樣的)。又，噪聲并不限定于一個，也可以是多個。不過，使得目標(biāo)聲音與噪聲的方向不同。在頻譜分析部20、21中，就每一個麥克風(fēng)輸出對由該麥克風(fēng)10、11得到的兩個聲源信號分別進行頻率分析，在波束形成部3中通過波束形成器30、31對這些被頻率分析了的信號進行過濾，該波束形成器30、31在分離面的左右形成了死角，在功率計算部40、41中計算其過濾輸出的功率進行計算。另外，波束形成器30、31優(yōu)選為，在分離面的左右相對于分離面對稱地形成死角。[波束形成部]首先，參照圖2對由波束形成器30、31形成的波束形成部3的構(gòu)成進行說明。將由頻譜分析部20、頻譜分析部21就每個頻率成分進行分解得到的信號X1 ( )、x2 ( )作為輸入，通過乘法器100a、100b、100c、IOOd,分別進行與濾波系數(shù)W1 ( co )、w2 ( to) ^w1* (W)、w； ( CO ) (*表示存在復(fù)共軛的關(guān)系)的乘法運算。而且，通過加法器100e、IOOf將兩個乘法結(jié)果相加，輸出濾波處理結(jié)果dsi (O)、ClS2 (CO)作為其輸出。設(shè)相對于目的方位91的增益為1，在其他方向02形成一個死角(增益0)的波束形成器30的濾波矢量(7 4卟夕卜卟)為W1 ( to，0 17 0 2) = [Wi ( O，Q1, 0 2), W2 ( W , Q1, 0 2)] T、觀測信號為 X ( W，Q1, 0 2) = [X1 ( O，Q1, 0 2)，X2 ( W，Q1, e2)] T的時候，波束形成器3 0的輸出dSl (CO)可以由下式求出。其中，T表示轉(zhuǎn)置操作，H表示共軛轉(zhuǎn)置操作。[數(shù)式I]Cls1(Co) = W1 ( Co , 0 1; 9 2) hX ( Co , 0 1; 0 2) (I)又，設(shè)波束形成器31的濾波矢量為W2 ( ，9 9 2) = [W1* (* ，9 9 2), W2*(O，0 1； 0 2)] T時,波束形成器31的輸出ds2 (W)可以由下式求出。[數(shù)式2]ds2(co) = W2 ( co , 0 17 0 2) hX (to , O1, 0 2) ⑵這樣，波束形成部3通過使用復(fù)共軛濾波系數(shù)，在相對于分離面對稱的位置形成死角。在此，《表示角頻率，相對于頻率存在f = 2 Jif的關(guān)系。[功率計算部]接著，參照圖3對功率計算部40、41進行說明。功率計算部40、41通過以下的計算式將來自波束形成器30、波束形成器31的輸出dSl ( co )、ds2 ( co )轉(zhuǎn)換為功率譜信息psi
(W )、PS2 ( W )。[數(shù)式3]PS1(W) = [Re (ds: (w)) ]2+ [Im(ds: (w)) ]2 (3)[數(shù)式4]ps2 (co) = [Re (ds2 (co)) ]2+[Im(ds2 (co)) ]2 (4)
[加權(quán)系數(shù)算出部]功率計算部40、41的輸出Ps1 ( co )、ps2 ( co )被用作加權(quán)系數(shù)算出部50的兩個輸入。加權(quán)系數(shù)算出部50將該兩個波束形成器30、31的輸出的功率譜信息作為輸入，輸出每個頻率的加權(quán)系數(shù)Gbsa ( o )。加權(quán)系數(shù)Gbsa ( o )是基于所述功率譜信息彼此間的差值的值，作為加權(quán)系數(shù)Gbsa( )的一例，考慮到有以以下的值作為定義域的單調(diào)增加函數(shù)的輸出值，其中作為該定義域的值是，對每個頻率計算PSi ( CO )與PS2 (W)的差值，在PSi (CO)的值比PS2 (CO)的值大的情況下表示PS1 (CO)與PS2 ( )的差值的平方根除以PS1 ( )的平方根所得到的值，在PS1 ( )的值為PS2 ( )以下的值的情況下表示0的值。用數(shù)式表示加權(quán)系數(shù)Gbsa( )時，如下所示。[數(shù)式5]
權(quán)利要求
1.種聲源分離裝置，其從混合有多個聲源所發(fā)出的聲源信號的混合音中分離來自目標(biāo)聲源的聲源信號，其特征在于，包括: 第I波束形成處理部，其通過對來自由被輸入所述混合音的兩個麥克風(fēng)構(gòu)成的麥克風(fēng)對的各自的輸出信號進行使用了相互不同的第I系數(shù)的、在頻域的積和運算，以與連接所述兩個麥克風(fēng)的線段相交的平面為界限，使得從與包含所述目標(biāo)聲源的方向的區(qū)域相反的區(qū)域到來的聲源信號衰減；第2波束形成處理部，其通過對來自所述麥克風(fēng)對的各自的輸出信號乘以第2系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以所述平面為界限使得從包含所述目標(biāo)聲源的方向的區(qū)域到來的聲源信號衰減，所述第2系數(shù)與所述相互不同的第I系數(shù)在頻域為復(fù)共軛的關(guān)系; 功率計算部，其根據(jù)通過所述第I波束形成處理部得到的信號計算具有每個頻率的功率值的第I頻譜信息，進一步地根據(jù)通過所述第2波束形成處理部得到的信號計算具有每個頻率的功率值的第2頻譜信息；以及加權(quán)系數(shù)算出部，其根據(jù)所述第I頻譜信息與所述第2頻譜信息的每個頻率的功率值的差值，計算用于與所述第I波束形成處理部所得到的信號相乘的每個頻率的加權(quán)系數(shù)；所述聲源分離裝置具有聲源分離部，其根據(jù)由所述第I波束形成處理部得到的信號與所述加權(quán)系數(shù)算出部所算出的所述加權(quán)系數(shù)的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
2.權(quán)利要求1所述的聲源分離裝置，其特征在于，還具有，使得由所述第I波束形成處理部得到的信號與所述加權(quán)系數(shù)算出部所算出的所述加權(quán)系數(shù)相乘的加權(quán)系數(shù)乘法部，所述聲源分離部根據(jù)以規(guī)定的比例對所述加權(quán)系數(shù)乘法部的輸出結(jié)果和從所述第I波束形成處理部得到的信號進行相加后的結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
3.權(quán)利要求2所述的聲源分離裝置，其特征在于，具有: 音樂噪聲降低部，其輸出以規(guī)定的比例對所述加權(quán)系數(shù)乘法部的輸出結(jié)果和從所述第I波束形成處理部得到的信號進行相加后的結(jié)果，噪聲推定部，其通過對來自所述麥克風(fēng)對中靠近所述目標(biāo)聲源的麥克風(fēng)的輸出信號應(yīng)用濾波系數(shù)可變的自適應(yīng)濾波器，計算出與來自所述麥克風(fēng)對中遠(yuǎn)離所述目標(biāo)聲源的麥克風(fēng)的輸出信號一致的模擬信號，根據(jù)來自遠(yuǎn)離所述目標(biāo)聲源的麥克風(fēng)的輸出信號與所述模擬信號的差值計算出噪聲成分；噪聲均衡部，其根據(jù)所述音樂噪聲降低部的輸出結(jié)果和所述噪聲推定部所算出的所述噪聲成分，計算出所述音樂噪聲降低部的輸出結(jié)果中所包含的噪聲成分；以及殘留噪聲壓制部，其根據(jù)所述音樂噪聲降低部的輸出結(jié)果和噪聲均衡部的輸出結(jié)果壓制所述音樂噪聲降低部的輸出結(jié)果中所包含的殘留噪聲，所述聲源分離部根據(jù)所述殘留噪聲壓制部的輸出結(jié)果從所述混合音中分離來自所述目標(biāo)聲源的聲源信號。
4.權(quán)利要求3所述的聲源分離裝置，其特征在于，具有控制部，所述控制部根據(jù)所述每個頻率的加權(quán)系數(shù)對所述噪聲推定部、所述噪聲均衡部、以及所述殘留噪聲抑制部中的至少一個進行控制。
5.權(quán)利要求1所述的聲源分離裝置，其特征在于，具有，音樂噪聲降低增益算出部，所述音樂噪聲降低增益算出部計算出用于以規(guī)定的比例對由所述第I波束形成處理部得到的聲源信號乘以所述加權(quán)系數(shù)后的乘法運算結(jié)果和由所述第I波束形成處理部得到的聲源信號進行相加的增益，所述聲源分離部根據(jù)所述音樂噪聲降低增益算出部所算出的增益與由所述第I波束形成處理部得到的聲源信號的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
6.權(quán)利要求5所述的聲源分離裝置，其特征在于，具有，噪聲推定部，其通過對來自所述麥克風(fēng)對中靠近所述目標(biāo)聲源的麥克風(fēng)的輸出信號應(yīng)用濾波系數(shù)可變的自適應(yīng)濾波器，計算出與來自所述麥克風(fēng)對中遠(yuǎn)離所述目標(biāo)聲源的麥克風(fēng)的輸出信號一致的模擬信號，根據(jù)來自遠(yuǎn)離所述目標(biāo)聲源的麥克風(fēng)的輸出信號與所述模擬信號的差值計算出噪聲成分；噪聲均衡部，其根據(jù)由所述第I波束形成處理部得到的聲源信號與在所述音樂噪聲降低增益算出部算出的增益相乘后的乘法運算結(jié)果、和所述噪聲推定部所算出的所述噪聲成分，計算出由所述第I波束形成處理部得到的聲源信號與在所述音樂噪聲降低增益算出部中被算出的增益相乘后的乘法運算結(jié)果中所包含的噪聲成分；以及殘留噪聲壓制增益算出部，其根據(jù)由所述音樂噪聲降低增益算出部算出的增益和由所述噪聲均衡部所算出的所述噪聲成分，計算出用于與由所述第I波束形成處理部得到的聲源信號相乘的增益，該增益是用于對由所述第I波束形成處理部得到的聲源信號與在所述音樂噪聲降低增益算出部中被算出的增益相乘后的乘法運算結(jié)果中所包含的殘留噪聲進行壓制的增益，所述聲源分離部根據(jù)由殘留噪聲壓制增益算出部所算出的增益與由所述第I波束形成處理部得到的聲源信號的乘法運算結(jié)果從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
7.權(quán)利要求6所述的聲源分離裝置，其特征在于，具有控制部，所述控制部根據(jù)所述每個頻率的加權(quán)系數(shù)對所述噪聲推定部、所述噪聲均衡部、以及所述殘留噪聲壓制增益算出部中的至少一個進行控制。
8.權(quán)利要求1至7中任一項所述的聲源分離裝置，其特征在于，具有基準(zhǔn)延遲量算出部和指向性控制部，所述基準(zhǔn)延遲量算出部對于每個頻率計算出基準(zhǔn)延遲量，所述基準(zhǔn)延遲量用于與來自所述麥克風(fēng)對的至少一方的麥克風(fēng)的輸出信號相乘以使得該麥克風(fēng)的位置假想地移動，所述指向性控制部就每個頻帶對來自所述麥克風(fēng)對的至少一方的麥克風(fēng)的輸出信號賦予延遲量，所述指向性控制部在基準(zhǔn)延遲量算出部所算出的所述基準(zhǔn)延遲量滿足空間采樣定理的頻帶中，將該基準(zhǔn)延遲量作為所述延遲量，在所述基準(zhǔn)延遲量不滿足空間采樣定理的頻帶中，將通過下述式子(30)求得的最佳延遲量T 0作為所述延遲量， [數(shù)I] ,.c % d 十 To * C =-CO
9.種聲源分離裝置，其從混合有多個聲源所發(fā)出的聲源信號的混合音中分離來自目標(biāo)聲源的聲源信號，其特征在于，包括: 第I波束形成處理單元，其通過對來自由被輸入所述混合音的兩個麥克風(fēng)構(gòu)成的麥克風(fēng)對的各自的輸出信號乘以不同的第I系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以與連接所述兩個麥克風(fēng)的線段相交的平面為界限，使得從與包含所述目標(biāo)聲源的方向的區(qū)域相反的區(qū)域到來的聲源信號衰減；第2波束形成處理單元，其通過對所述麥克風(fēng)對的各自的輸出信號乘以第2系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以所述平面為界限使得從包含所述目標(biāo)聲源的方向的區(qū)域到來的聲源信號衰減，所述第2系數(shù)與所述不同的第I系數(shù)在頻域為復(fù)共軛的關(guān)系；功率計算單元，其根據(jù)通過所述第I波束形成處理單元得到的信號計算具有每個頻率的功率值的第I頻譜信息，進一步地根據(jù)通過所述第2波束形成處理單元得到的信號計算具有每個頻率的功率值的第2頻譜信息；以及加權(quán)系數(shù)算出單元，其根據(jù)所述第I頻譜信息與所述第2頻譜信息的每個頻率的功率值的差值，計算用于與所述第I波束形成處理單元所得到的信號相乘的每個頻率的加權(quán)系數(shù)；所述聲源分離裝置具有聲源分離單元，其根據(jù)由所述第I波束形成處理單元得到的信號與所述加權(quán)系數(shù)算出單元所算出的所述加權(quán)系數(shù)的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
10.權(quán)利要求9所述的聲源分離裝置，其特征在于，還具有使得由所述第I波束形成處理單元得到的信號與所述加權(quán)系數(shù)算出單元所算出的所述加權(quán)系數(shù)相乘的加權(quán)系數(shù)乘法單元，所述聲源分離單元根據(jù)以規(guī)定的比例對所述加權(quán)系數(shù)乘法單元的輸出結(jié)果和從所述第I波束形成處理單元得到的信號進行相加后的結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
11.種聲源分離方法，其由具有第I波束形成處理部、第2波束形成處理部、功率計算部、加權(quán)系數(shù)算出部和聲源分離部的聲源分離裝置所執(zhí)行，其特征在于，包括以下步驟: 第I步驟，在該步驟中，所述第I波束形成處理部通過對來自由被輸入混合音的兩個麥克風(fēng)構(gòu)成的麥克風(fēng)對的各自的輸出信號進行使用了相互不同的第I系數(shù)的、在頻域的積和運算，以與連接所述兩個麥克風(fēng)的線段相交的平面為界限，使得從與包含目標(biāo)聲源的方向的區(qū)域相反的區(qū)域到來的聲源信號衰減，所述混合音混合有多個聲源所發(fā)出的聲源信號；第2步驟，在該步驟中，所述第2波束形成處理部通過對來自所述麥克風(fēng)對的各自的輸出信號乘以第2系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以所述平面為界限使得從包含所述目標(biāo)聲源的方向的區(qū)域到來的聲源信號衰減，所述第2系數(shù)與所述相互不同的第I系數(shù)在頻域為復(fù)共軛的關(guān)系；第3步驟，在該步驟中，所述功率計算部根據(jù)通過所述第I步驟得到的信號計算具有每個頻率的功率值的第I頻譜信息，進一步地根據(jù)通過所述第2步驟得到的信號計算具有每個頻率的功率值的第2頻譜信息；第4步驟，在該步驟中，所述加權(quán)系數(shù)算出部根據(jù)所述第I頻譜信息與所述第2頻譜信息的每個頻率的功率值的差值，計算用于與所述第I步驟所得到的信號相乘的每個頻率的加權(quán)系數(shù)；以及第5步驟，在該步驟中，所述聲源分離部根據(jù)由所述第I步驟得到的信號與所述第4步驟所算出的所述加權(quán)系數(shù)的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
12.種程序，其特征在于，使得計算機執(zhí)行以下的步驟: 第I處理步驟，在該步驟中，通過對來自被輸入混合音的兩個麥克風(fēng)構(gòu)成的麥克風(fēng)對的各自的輸出信號進行使用了相互不同的第I系數(shù)的、在頻域的積和運算，以與連接所述兩個麥克風(fēng)的線段相交的平面為界限，使得從與包含目標(biāo)聲源的方向的區(qū)域相反的區(qū)域到來的聲源信號衰減，所述混合音混合有多個聲源所發(fā)出的聲源信號；第2處理步驟，在該步驟中，通過對來自所述麥克風(fēng)對各自的輸出信號乘以第2系數(shù)，對所得到的結(jié)果在頻域進行積和運算，以所述平面為界限使得從包含所述目標(biāo)聲源的方向的區(qū)域到來的聲源信號衰減，所述第2系數(shù)與所述相互不同的第I系數(shù)在頻域為復(fù)共軛的關(guān)系; 第3處理步驟，在該步驟中，根據(jù)通過所述第I處理步驟得到的信號計算具有每個頻率的功率值的第I頻譜信息，進一步地根據(jù)通過所述第2處理步驟得到的信號計算具有每個頻率的功率值的第2頻譜信息；第4處理步驟，在該步驟中，根據(jù)所述第I頻譜信息與所述第2頻譜信息的每個頻率的功率值的差值，計算用于與所述第I步驟所得到的信號相乘的每個頻率的加權(quán)系數(shù)；以及第5處理步驟，在該步驟中，所述聲源分離部根據(jù)由所述第I處理步驟得到的信號與所述第4處理步驟所算出的所述加權(quán)系數(shù)的乘法運算結(jié)果，從所述混合音分離來自所述目標(biāo)聲源的聲源信號。
全文摘要
本發(fā)明提供聲源分離裝置、聲源分離方法、以及程序。采用現(xiàn)有的聲源分離裝置的話，在存在到來方向沒規(guī)定為特定的方向的擴散性噪聲的環(huán)境下，特定的頻帶被大大地刪除，結(jié)果存在擴散性噪聲被不規(guī)則地分配給聲源分離結(jié)果而變成音樂噪聲的情況。因此，本發(fā)明的一個形態(tài)中，聲源分離裝置(1)的波束形成部(3)通過對頻譜分析后的來自麥克風(fēng)(10、11)的輸出信號乘以存在復(fù)共軛的關(guān)系的加權(quán)系數(shù)，進行波束形成處理，以與連接兩個麥克風(fēng)(10、11)的線段相交的平面為界限，使得從包含目標(biāo)聲源的大致方向的區(qū)域以及與該區(qū)域相反的區(qū)域到來的各聲源信號衰減。加權(quán)系數(shù)算出部(50)根據(jù)由功率計算器(40、41)所計算出的功率頻譜信息之間的差值，計算加權(quán)系數(shù)。
文檔編號G10L21/02GK103098132SQ201180019738
公開日2013年5月8日申請日期2011年8月25日優(yōu)先權(quán)日2010年8月25日
發(fā)明者松井信也, 石川洋兒, 長濱克昌申請人:旭化成株式會社

完整全部詳細(xì)技術(shù)資料下載