一種基于一致聚焦變換最小二乘法的雙聲源定位方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及聲源定位領(lǐng)域,特別是一種基于一致聚焦變換最小二乘法的雙聲源定 位方法。
【背景技術(shù)】
[0002] 在陣列信號(hào)處理中,利用波達(dá)方向(Direction of Arrival,D0A)估計(jì)聲源位置 是一個(gè)新的研究方向,在聲吶探測(cè)(見(jiàn)文獻(xiàn):王燕,鄒男,梁國(guó)龍.強(qiáng)多途環(huán)境下水聽(tīng)器 陣列位置近場(chǎng)有源校正方法[J].物理學(xué)報(bào),2015, 64(2) :024304 1-10),語(yǔ)音識(shí)別與追 蹤(見(jiàn)文獻(xiàn):戚聿波,周士弘,張仁和,任云.一種基于β-warping變換算子的被動(dòng) 聲源距離估計(jì)方法[J].物理學(xué)報(bào),2015, 64(7) :074301 1-6),在未知環(huán)境中機(jī)器人的移 動(dòng)(見(jiàn)文獻(xiàn):居太亮.基于麥克風(fēng)陣列聲源定位算法研究[D].博士學(xué)位論文(成都:電 子科技大學(xué)),2006),以及下一代助聽(tīng)器等(見(jiàn)文獻(xiàn):蘇林,馬力,宋文化,郭圣明,鹿 力成.聲速剖面對(duì)不同深度聲源定位的影響[J].物理學(xué)報(bào),2015, 64(2) :024302 1-8) 領(lǐng)域中都成為研究的熱點(diǎn),精確的DOA估計(jì)在許多應(yīng)用中都是其中的關(guān)鍵要素之一(見(jiàn) 文獻(xiàn):時(shí)潔,楊德森,時(shí)勝國(guó).基于矢量陣的運(yùn)動(dòng)聲源柱面聚焦定位方法試驗(yàn)研究[J]. 物理學(xué)報(bào),2012, 61 (12) :124302 1-15)。其中,最常見(jiàn)的是在電話會(huì)議中,通過(guò)知曉說(shuō)話 者揚(yáng)聲器的位置信息來(lái)引導(dǎo)相機(jī),或者利用波束形成方法來(lái)增強(qiáng)捕獲到的源信號(hào),以避 免翻領(lǐng)式麥克風(fēng)帶來(lái)的不便(見(jiàn)文獻(xiàn):Despoina Pavlidi, Anthony Griffin, Matthieu Puigt,Athanasios Mouchtaris. Real-time multiple sound source localization and counting using a circular microphone array [J]. IEEE Transactions on Audio,Speech,and Language Processing,2013,21 (10):2193-2206.)〇
[0003] 在聲源定位的早期研究中,主要針對(duì)單個(gè)聲源進(jìn)行定位的(見(jiàn)文獻(xiàn):Ali Pourmohammad j Seyed Mohammad Ahadi. Real time high accuracy 3_D PHAT-based sound source localization using a simple 4-microphone arrangement[J]. IEEE Systems Joumal,2012,6(3):455-468)。很多方法都是基于不同麥克風(fēng)對(duì)間的到達(dá)時(shí)差(Time Difference of Arrival,TD0A)進(jìn)行單聲源定位的,其中廣義互相關(guān)變換(Generalized Cross-Correlation PHAse Transform,GCC-PHAT)的方法是應(yīng)用最為廣泛的(見(jiàn)文獻(xiàn): Qilian LiangjBaoju ZhangjChenglin ZhaojYiming Pi. TDOA for passive localization underwater versus terrestrial environment[J]. IEEE Transactions Parallel and Distributed Systems, 2013, 24(10):2100-2108)〇 文獻(xiàn)(Jingdong Chen,Jacob Benestyj Yiteng Huang. Time delay estimation in room acoustic environments: an overview[J]· EURASIP Journal on Applied Signal Processing,2006,26503:1-19)給 出了 ?)0Α方位估計(jì)技術(shù)的綜述;在單聲源中,由于存在噪聲、混響等的干擾,會(huì)影響麥克風(fēng) 對(duì)間采集的信號(hào),使定位估計(jì)結(jié)果精度下降,文獻(xiàn)(Francesco Nesta,Maurizio Omologo. Generalized state coherence transform for multidimensional TDOA estimation of multiple sources [J]. IEEE Transactions on Audio, Speech,and Language Processing, 2012, 20(1) :246-260.)給出了改進(jìn)的TDOA估計(jì)方法。進(jìn)一步研究發(fā)現(xiàn), 同時(shí)定位多個(gè)聲源是一個(gè)更困難的問(wèn)題。事實(shí)上,即使是一個(gè)短暫的聲音都會(huì)使采集 到的語(yǔ)音信號(hào)存在微小的重疊,可能會(huì)導(dǎo)致多個(gè)源信號(hào)的定位不精確(見(jiàn)文獻(xiàn):Jacek P. Dmochowski, Jacob Benesty, Sofiene Affes. Broadband MUSIC Opportunities and challenges for multiple source localization[C]. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2007:18-21)。對(duì)于多聲源定位問(wèn)題, 一種是傳統(tǒng)的多信號(hào)分類(lèi)(Multiple Signal Classification,MUSIC)方法,屬于經(jīng)典子 空間方法,該方法針對(duì)窄帶信號(hào),根據(jù)采集到信號(hào)的子空間協(xié)方差矩陣,進(jìn)行特征分解,進(jìn) 而估計(jì)源信號(hào)方位(見(jiàn)文獻(xiàn):Dumidu S. Talagala, Wen Zhang. Broadband DOA Estimation Using Sensor Arrays on Complex-Shaped Rigid Bodies[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2013, 21 (8) : 1573-1585.),由于語(yǔ)音信號(hào)的頻 率帶寬一般為[300Hz,3000Hz],經(jīng)典子空間方法只是針對(duì)窄帶信號(hào)的,會(huì)導(dǎo)致聲源定位結(jié) 果不準(zhǔn)確;另一種是基于獨(dú)立分量分析的源定位方法,該方法首先運(yùn)用盲源分離(Blind Source Separati〇n,BSS)方法獲得分離后單個(gè)信號(hào),然后再運(yùn)用對(duì)單個(gè)源信號(hào)進(jìn)行定位的 方'法進(jìn)定位估計(jì)(見(jiàn)文南犬:Anthony Lombard, Yuanhang Zheng, Herbert Buchner, Walter Kellermann. TDOA Estimation for Multiple Sound Sources in Noisy and Reverberant Environments Using Broadband Independent Component Analysis[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011,19 (6):1490-1503.),但 此類(lèi)源定位方法,由于將語(yǔ)音信號(hào)先分離再定位,會(huì)破壞源信號(hào)的完整性,會(huì)使定位結(jié)果不 穩(wěn)定、定位精確度不高。另外,隨著麥克風(fēng)個(gè)數(shù)的增加,波達(dá)方向(DOA)估計(jì)的定位精度也 會(huì)隨之提高,但在實(shí)際情況下,通常使用線性麥克風(fēng)陣列模型,會(huì)產(chǎn)生定位模糊問(wèn)題(無(wú)法 準(zhǔn)確區(qū)分聲源位于陣列的前方或者后方)。
[0004] 如何解決現(xiàn)有技術(shù)的不足已成為聲源定位領(lǐng)域亟待解決的一大難題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問(wèn)題是為了克服現(xiàn)有技術(shù)的不足,而提供一種基于一致聚 焦變換最小二乘法的雙聲源定位方法,本發(fā)明方法實(shí)時(shí)、有效地解決多聲源定位問(wèn)題,在一 定程度上降低了噪聲、混響等對(duì)語(yǔ)音信號(hào)的干擾,提高了定位的精度與穩(wěn)定性。
[0006] 本發(fā)明為解決上述技術(shù)問(wèn)題采用以下技術(shù)方案:
[0007] 根據(jù)本發(fā)明提出的一種基于一致聚焦變換最小二乘法的雙聲源定位方法,包括如 下步驟:
[0008] 步驟一:采用M個(gè)相同麥克風(fēng)等間距的排列成半徑為R的圓形麥克風(fēng)陣列;
[0009] 步驟二:根據(jù)麥克風(fēng)陣列采集到的語(yǔ)音信號(hào),得到信號(hào)的協(xié)方差矩陣,并在給定頻 率范圍內(nèi)定義中心頻率點(diǎn)k b;
[0010] 步驟三:根據(jù)預(yù)設(shè)的一定測(cè)量范圍內(nèi)的任意角度,存在一個(gè)不隨角度變化的一致 聚焦變換,定義一致聚焦變換矩陣,并通過(guò)最小二乘方法求得聚焦變換矩陣;
[0011] 步驟四:根據(jù)步驟二中定義的中心頻率點(diǎn),結(jié)合最小二乘法求得的一致聚焦變換 矩陣,采用MUSIC方法求得每個(gè)中心頻率點(diǎn)所對(duì)應(yīng)的信號(hào)空間譜,進(jìn)而求得信號(hào)空間譜的 均值函數(shù)h alTay(0);
[0012] 步驟五:采用頻率點(diǎn)均值和時(shí)間快拍估計(jì)的方法求得信號(hào)空間譜平均估計(jì)值,進(jìn) 而求得聲源估計(jì)角度。<