專利名稱:一種超聲波輔助麥克風(fēng)陣列語音增強裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音信號處理,尤其是涉及一種超聲波輔助麥克風(fēng)陣列語音增強
>J-U ρ α裝直。
背景技術(shù):
在語音識別、聲紋識別、視頻會議等語音采集處理系統(tǒng)中,由于受到混響和背景噪聲干擾,麥克風(fēng)接收到的信號通常為帶噪語音。這樣不僅影響語音的可懂度,而且影響語音 處理系統(tǒng)的整體性能。因此需要對帶噪語音進行增強處理。在復(fù)雜的聲學(xué)環(huán)境下,單麥克風(fēng)語音增強已無法滿足需求。麥克風(fēng)陣列可對不同方向上的信號形成不同響應(yīng),也即陣列的空間指向特性。當(dāng)語音和周圍環(huán)境信息被多個麥克風(fēng)聚集時,麥克風(fēng)陣列可以在期望的方向上有效地形成一個波束去拾取波束內(nèi)的信號,并消除波束外的噪聲,從而達到同時提取聲源和抑制噪聲的目的。傳統(tǒng)波束形成就是通過時間延遲補償,使注視方向與所需加強的語音信號的方向一致,由此實現(xiàn)對其它方向上干擾噪聲的消除,從而取得明顯的消噪效果。利用麥克風(fēng)陣列進行語音增強,是通過陣列在期望聲源方向形成波束來實現(xiàn)的,因此,獲取聲源的位置或者方位是麥克風(fēng)陣列語音增強技術(shù)的前提條件。基于麥克風(fēng)陣列的聲源定位和語音增強技術(shù)是密切相關(guān)的,位置估計是進行波束形成的依據(jù),是麥克風(fēng)陣列語音增強的基礎(chǔ),也直接影響其語音增強性能。常用的麥克風(fēng)陣列定位技術(shù)在實際應(yīng)用中存在種種問題,嚴重制約麥克風(fēng)陣列語音增強算法的性能。如基于到達時間差(time difference of arrival, TDOA)的定位技術(shù)在室內(nèi)嚴重混響條件下精度嚴重下降;基于高分辨率譜估計的定位方法由于需要在全空間進行解搜索運算量極大,且其處理方向性干擾的效果不佳。同時,由于需要先進行聲源定位運算,然后再進行麥克風(fēng)陣列語音增強處理,當(dāng)聲源處于運動狀態(tài)時,采用聲源定位算法進行麥克風(fēng)陣列語音增強的傳統(tǒng)處理方法將導(dǎo)致聲源定位滯后,從而造成語音增強效果不理
本巨
ο如麥克風(fēng)陣列語音增強中常用的“廣義旁瓣對消器”(GSC,Generalizedsidelobe canceller)(參見文獻L. J. Griffiths, C. W. Jim. An alternative approach tolinearly constrained adaptive beamforming. IEEE Transactions on Antennas andPropagation. January, 1982,30, 27-34)利用一個對準(zhǔn)聲源方向的固定波束通路和具有阻塞矩陣和對消器的自適應(yīng)通路實現(xiàn)信號中的干擾抵消,但其使用前提是必須首先獲取說話人的方位。中國專利ZL 200510105526. 7提出一種使用噪聲降低的多通道自適應(yīng)語音信號處理方法,該方法通過對GSC的固定波束通路增加一個自適應(yīng)處理器改善信號通道的信噪t匕。但該方法仍然需要借助頻域時延估計來補償各通道時延,以使得波束對準(zhǔn)聲源方向,這使得該方法在室內(nèi)混響條件影響時延估計精度的條件下性能將明顯下降。中國專利ZL 200510086876. 3提出一種小尺度麥克風(fēng)陣列語音增強系統(tǒng)和方法,該方法采用聲源位置自適應(yīng)處理通過調(diào)節(jié)麥克風(fēng)陣列的指向性獲得不同方向增益最大的接收信號,從而獲取聲源位置范圍使信號增強方向?qū)?zhǔn)聲源。但該方法由于需要通過調(diào)節(jié)陣列指向來進行波束對準(zhǔn),使得方位信息的獲取仍然存在一個滯后,對移動的聲源同樣無法獲得實時方位信息。中國專利ZL200410002739. 2提出一種結(jié)合定位技術(shù)的麥克風(fēng)陣列收音方法及其系統(tǒng),通過結(jié)合麥克風(fēng)陣列獲取的聲波信號和數(shù)碼攝像機獲取的目標(biāo)聲源畫面來技術(shù)聲源方位,由于還需借助圖像搜索算法判斷數(shù)碼攝像機獲得畫面中目標(biāo)音源的大小及方位來計算,系統(tǒng)定位處理的運算量大且性能將受光照條件等的影響。中國專利201110142759. X提出一種麥克風(fēng)陣列語音波束形成方法、語音信號處理裝置及系統(tǒng),采用先將各通道語音信號轉(zhuǎn)換到頻域,然后進行廣義相關(guān)分析獲取各通道相對時延,并據(jù)此進行各通道時延補償、加權(quán)疊加。由于采用的仍然是各通道語音信號間的頻域相關(guān),在存在嚴重混響等條件時時延估計精度將顯著下降,從而影響了時延補償加權(quán)疊加語音增強的性能
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種超聲波輔助麥克風(fēng)陣列語音增強裝置。本發(fā)明設(shè)有5元麥克風(fēng)組成的等間距線陣、前置放大電路、模數(shù)轉(zhuǎn)換電路、第I超聲波傳感器、第2超聲波傳感器、超聲波發(fā)射電路、超聲波接收電路、方位計算模塊、加權(quán)疊加模塊;5元麥克風(fēng)組成的等間距線陣用于進行語音信號多通道采集,5元麥克風(fēng)組成的等間距線陣采集的語音信號輸出端依次接前置放大電路、模數(shù)轉(zhuǎn)換電路、數(shù)據(jù)線和加權(quán)疊加模塊;第I超聲波傳感器和第2超聲波傳感器安裝在5元麥克風(fēng)組成的等間距線陣兩端延長線上,超聲波發(fā)射電路和超聲波接收電路利用第I超聲波傳感器和第2超聲波傳感器分別進行超聲波信號發(fā)射,并對接收到的超聲波信號經(jīng)過前置放大電路、模數(shù)轉(zhuǎn)換電路后通過數(shù)據(jù)線送入方位計算模塊;方位計算模塊獲取第I超聲波傳感器和第2超聲波傳感器的回波接收信號進行匹配濾波獲取目標(biāo)至第I超聲波傳感器和第2超聲波傳感器的超聲波渡越時間(T0F,time of flight)信息,獲取的聲源方位信息輸入至加權(quán)疊加模塊,根據(jù)超聲波獲得的聲源方位信息計算各通道時延補償值,并據(jù)此對麥克風(fēng)陣列各通道接收信號進行時延補償、疊加以增強聲源方向語音信號。采用本發(fā)明實現(xiàn)語音增強功能的方法包括超聲波發(fā)射接收、聲源方位估計、時延補償值計算、加權(quán)疊加等步驟。超聲波發(fā)射接收步驟利用與麥克風(fēng)陣列位置固定的超聲波傳感器組發(fā)射超聲波信號并接收回波;在聲源方位估計步驟通過接收超聲波回波信號并分別進行時延估計、確定說話人聲源方位;在時延補償值計算步驟獲得聲源方位后根據(jù)幾何關(guān)系計算麥克風(fēng)陣列信號各通道的時延補償值;加權(quán)疊加步驟根據(jù)各通道時延補償值對各通道進行時延補償后進行加權(quán)疊加處理以增強語音。本發(fā)明要解決的問題是提供一種方便、實時、帶超聲波輔助聲源定位功能的麥克風(fēng)陣列語音增強裝置。針對說話人識別、語音識別等麥克風(fēng)陣列語音增強的情況,本發(fā)明提出采用技術(shù)成熟、使用簡單方便的超聲波探測手段來獲取目標(biāo)聲源的方位信息,并將聲源方位信息用于麥克風(fēng)陣列語音增強算法實現(xiàn)語音增強。本發(fā)明實現(xiàn)超聲波輔助麥克風(fēng)陣列語音增強的具體思路為首先通過聲波傳感器發(fā)射檢測信號,并利用超聲波傳感器獲取說話人身上反射后返回的回波信號,據(jù)此計算聲源方位;在獲得聲源方位信息后可換算出每個通道的時延補償指并據(jù)此進行聲源方向的時延補償疊加,實現(xiàn)麥克風(fēng)陣列語音增強。與現(xiàn)有的麥克風(fēng)陣列定位與語音增強方法相比,本發(fā)明提出的超聲波輔助麥克風(fēng)陣列語音增強裝置有兩個突出的優(yōu)點第一,由于采用基于回波主動探測的聲源目標(biāo)方位估計,因此可優(yōu)化選擇采用具有高時寬帶寬積的寬帶信號作為發(fā)射信號進行超聲波探測,提高目標(biāo)方位估計精度;第二,由于采用超聲波回波主動探測方式而非依據(jù)語音信號的被動方位估計,對聲源的估計不依賴于麥克風(fēng)陣列接收的語音信號進行,因此聲源方位估計和語音增強算法可同時進行,從而可實現(xiàn)聲源方位的實時獲取,使得本方案對移動聲源也具有一定的跟蹤能力。
圖I為本發(fā)明實施例的結(jié)構(gòu)組成框圖。圖2為本發(fā)明實施例的超聲波發(fā)射及與微處理器連接電路圖。圖3為本發(fā)明實施例的超聲波接收電路、5元麥克風(fēng)陣列及與微處理器連接電路圖。圖4為本發(fā)明實施例的信號處理原理框圖。圖5為本發(fā)明實施例的超聲波輔助聲源方位計算、各通道時延補償值計算原理圖。
具體實施例方式為了使本發(fā)明的技術(shù)內(nèi)容、特征、優(yōu)點更加明顯易懂,下文以本發(fā)明超聲波輔助麥克風(fēng)陣列語音增強裝置實施例并結(jié)合附圖具體說明如下參見圖1,本發(fā)明實施例設(shè)有5元麥克風(fēng)組成的等間距線陣I、前置放大電路2、第I模數(shù)轉(zhuǎn)換電路3、第I超聲波傳感器4、第2超聲波傳感器5、第I超聲波發(fā)射電路6、第2超聲波發(fā)射電路7、超聲波接收電路8、方位計算模塊9、第2模數(shù)轉(zhuǎn)換電路10和加權(quán)疊加模塊11 ;5元麥克風(fēng)組成的等間距線陣I用于進行語音信號多通道采集,5元麥克風(fēng)組成的等間距線陣I采集的語音信號輸出端依次接前置放大電路2、第I模數(shù)轉(zhuǎn)換電路3、數(shù)據(jù)線和加權(quán)疊加模塊11 ;第I超聲波傳感器4和第2超聲波傳感器5安裝在5個麥克風(fēng)組成的等間距線陣I兩端延長線上,第I超聲波發(fā)射電路6、第2超聲波發(fā)射電路7和超聲波接收電路8利用第I超聲波傳感器4和第2超聲波傳感器5分別進行超聲波信號發(fā)射,并對接收到的超聲波信號經(jīng)過前置放大電路、第2模數(shù)轉(zhuǎn)換電路10后通過數(shù)據(jù)線送入方位計算模塊9 ;方位計算模塊9獲取第I超聲波傳感器4和第2超聲波傳感器5的回波接收信號進行匹配濾波獲取目標(biāo)至第I超聲波傳感器4和第2超聲波傳感器5的超聲波渡越時間(TOF,timeof flight)信息,獲取的聲源方位信息輸入至加權(quán)疊加模塊11,根據(jù)超聲波獲得的聲源方位信息計算各通道時延補償值,并據(jù)此對麥克風(fēng)陣列各通道接收信號進行時延補償、疊加以增強聲源方向語音信號。本發(fā)明實施例中麥克風(fēng)陣列由5個等間距排列的麥克風(fēng)(m0,m2,…m4))組成線陣,陣列中各麥克風(fēng)采集的語音信號進時延補償后加權(quán)疊加形成對準(zhǔn)聲源方向的增強的信號波束,而各通道時延補償值由圖中麥克風(fēng)線陣延長線兩端的兩個超聲波傳感器(Ul,u2)發(fā)射探測信號獲得回波、進行聲源方位估計處理后獲得。具體地,5元麥克風(fēng)線陣由體積小、結(jié)構(gòu)簡單、電聲性能好的壓強式駐極體麥克風(fēng)micO, - ,mic4組成,NJM2100運算放大器芯片構(gòu)成麥克風(fēng)線陣的前置放大電路,MAXl 18模數(shù)轉(zhuǎn)換芯片構(gòu)成模數(shù)轉(zhuǎn)換電路,在本實施例中麥克風(fēng)間距d = 0. lm。超聲波發(fā)射接收模塊由超聲波傳感器和發(fā)射、接收電路組成。本實施例中超聲波傳感器選用T/R40-16彎曲振動超聲波換能器,其中心頻率為40kHz。兩個超聲波傳感器Ul、u2發(fā)射脈沖寬度10ms、中心頻率40kHz、頻率范圍38 42kHz的線性調(diào)頻超聲波探測信號,以提高回波信號的檢測性能和時延估計精度(超聲波發(fā)射信號的信號脈寬過大導(dǎo)致超聲波回波探測有較大的探測盲區(qū),因此應(yīng)根據(jù)麥克風(fēng)陣列聲源的大概范圍適當(dāng)選擇,本實施例中超聲波發(fā)射脈沖寬度設(shè)為10ms)。同時,為了區(qū)分兩個超聲波傳感器發(fā)射信號在目標(biāo)反射 產(chǎn)生的回波,ul發(fā)射升調(diào)頻信號,u2發(fā)射降調(diào)頻信號,這樣可同時通過兩個超聲波換能器發(fā)射信號進行回波探測獲取其各自與說話人的距離。本實施例中超聲波發(fā)射電路由ARM9 S3C2440微處理器通過UDA1341音頻接口芯片控制壓控發(fā)射電路實現(xiàn)超聲波換能器ul、u2分別發(fā)射升、降調(diào)頻信號。具體地,如圖2所示分別使用S3C2440微處理器的GPB7、GPB8、GPB9端口來連接UDA1341芯片的L3M0DE、L3DATA、L3CL0CK端進行I2S總線控制,并分別在UDA1341芯片的VOUTL、VOUTR端口接出LINEOUT_L、LINEOUT_R信號輸出通道,用程序中啟動超聲波發(fā)射后同時輸出脈寬10ms,幅度從O至0. 3V的升斜變脈沖信號和幅度從0. 3V至O的降斜變脈沖信號,此升斜變脈沖信號和升斜變脈沖信號分別送入圖2所示由4046芯片構(gòu)成的壓控振蕩電路,由S3C2440的GPBlO端口輸出IOms低電平使能4046芯片輸出中心頻率40k Hz、頻率范圍38 42kHz的升調(diào)頻信號和降調(diào)頻信號,推動超聲波換能器ul,u2同時發(fā)射升調(diào)頻信號和降調(diào)頻信號超聲波脈沖。超聲波接收電路由運放NE5532前置放大電路和S3C2440微處理器的接口電路組成如圖3所示,接收的超聲波信號經(jīng)過兩級前置放大電路放大后輸入8通道模數(shù)轉(zhuǎn)換芯片MAX118,S3C2440微處理器通過IO 口 GPB2,3,4控制MAXl 18的輸入通道端A6、A7,通過定時器輸出腳TOUTO、TOUTl控制MAXl 18的讀出/寫入端口 WR、RD進行采樣頻率200ksps的模數(shù)轉(zhuǎn)換,通過數(shù)據(jù)線DATAO至DATA7進行8bit模數(shù)轉(zhuǎn)換結(jié)果到S3C2440微處理器的傳送。本實施例中方位計算模塊屬于數(shù)字信號處理模塊,采用ARM9 S3C2440微處理器進行軟件編程實現(xiàn),模數(shù)轉(zhuǎn)換后的超聲波接收信號在S3C2440微處理器中送入方位計算模塊進行時延估計、聲源方位計算。方位計算模塊獲取模數(shù)轉(zhuǎn)換后的超聲波回波信號后進行相關(guān)分析獲取超聲波信號從超聲波換能器到說話人的渡越時間(TOF,time of flight)。本實施例中對線性調(diào)頻回波信號信號采用相關(guān)分析進行高精度時延估計可采用本領(lǐng)域技術(shù)人員公知的方法。以下結(jié)合圖4對本實施例超聲波輔助麥克風(fēng)陣列語音增強裝置的信號處理原理進行說明如圖4所示,本實施例中發(fā)射電路驅(qū)動兩個超聲波換能器ul,u2發(fā)射超聲波信號后,兩個超聲波換能器ul,u2接收到在說話人a處反射返回的回波信號并通過接收電路進行放大,之后送入微處理器中利用升、降調(diào)頻信號的本地拷貝與接收回波信號進行相關(guān)分析,通過TOF估計分別獲取說話人至兩個超聲波換能器的渡越時間,乘空氣中聲速后可得到距離,根據(jù)這兩個距離參數(shù)結(jié)合幾何關(guān)系進行方位計算可計算出說話人方位;在獲得說話人方位后進行時延補償計算,根據(jù)時延補償計算結(jié)果獲得5個麥克風(fēng)陣列通道對應(yīng)的時延補償值并送入各通道進行時延補償;本實施例麥克風(fēng)陣列mO,ml, m2, m3, m4總共5個麥克風(fēng)接收到的信號經(jīng)過接收電路后,分別進行各通道的時延補償0,I, 2,3,4,然后通過加權(quán)疊加,最后形成對準(zhǔn)說話人的語音波束。在圖4中,根據(jù)獲得的說話人方位進行時延補償計算,然后對5個麥克風(fēng)通道進行時延補償、加權(quán)疊加和語音波束形成這部分功能被列為加權(quán)疊加模塊。
本實施例麥克風(fēng)陣列語音增強裝置中5元麥克風(fēng)線陣與微處理器的連接方式為(如圖3所示):5元麥克風(fēng)線陣中5個麥克風(fēng)輸出信號經(jīng)過運算放大器構(gòu)成的2級前置放大電路放大后輸入多通道模數(shù)轉(zhuǎn)換芯片MAXl 18,S3C2440微處理器通過IO 口 GPB2,3,4控制MAXl 18的輸入通道端A1、A2、A3、A4、A5,通過定時器輸出腳T0UT0、T0UT1控制MAX118的讀出/寫入端口 WR、RD進行采樣頻率16ksps的模數(shù)轉(zhuǎn)換,通過數(shù)據(jù)線DATAO至DATA7進行8bit模數(shù)轉(zhuǎn)換結(jié)果到S3C2440微處理器的傳送。本實施例中加權(quán)疊加模塊屬于數(shù)字信號處理模塊,采用ARM9 S3C2440微處理器進行軟件編程實現(xiàn),模數(shù)轉(zhuǎn)換后的多通道語音信號在S3C2440微處理器中送入加權(quán)疊加模塊進行波束形成處理語音增強。圖4的加權(quán)疊加模塊中時延補償計算的基本原理為根據(jù)方位計算模塊獲得的說話人方位和麥克風(fēng)陣列尺寸參數(shù)可計算出麥克風(fēng)陣列各通道的時延補償值,根據(jù)各通道時延補償值對麥克風(fēng)陣列信號進行時延補償、加權(quán)疊加,增強語音信號方向的波束。詳細描述在下面結(jié)合圖5給出。在實施例的上述技術(shù)方案中,通過超聲波換能器回波探測獲取聲源方位以及麥克風(fēng)陣列各通道時延補償值計算是本發(fā)明的關(guān)鍵內(nèi)容,下面結(jié)合圖5對此過程進行具體描述如圖5所示,在本發(fā)明實施例中以5元麥克風(fēng)線陣所在水平線為X軸,以線陣中間的麥克風(fēng)m2位置為坐標(biāo)原點建立定位坐標(biāo)系,線陣各陣元間距為d,超聲波換能器ul、u2距離原點的距離為L。則超聲波換能器ul,u2在坐標(biāo)系中的坐標(biāo)分別為(_L,0)和(L,0),ul和u2分別發(fā)射線性掃頻超聲波信號并接收經(jīng)說話人a處反射的回波信號,經(jīng)過相關(guān)分析后通過相關(guān)峰位置檢測可獲取a點至ul,u2的距離Daul,Dau2,并由此可獲得a點坐標(biāo)為x _ Daui AU2 v =++DAU2 ^2l -2[
a— 4L Ja——i2由于在本實施例麥克風(fēng)陣列語音增強中,可排除說話人位于麥克風(fēng)陣列后方的情況,因此在消除I坐標(biāo)的正負模糊后可得— Dlm -Dlvi 幾=~ 2 v其方位角=arctan —;由于麥克風(fēng)線陣在ul,u2的水平線上,且麥克風(fēng)線陣中點m2也就是ul,u2的中心點,所以在本實施例中得到的方位角a也就是a和麥克風(fēng)線陣的方位角。得到此方位角后,考慮到實施例中a處于遠場范圍,其發(fā)出的語音信號到達麥克風(fēng)線陣時可以認為是平面入射波,則以線陣的中心陣元麥克風(fēng)m2作為基準(zhǔn),即對m2接收的語音信號不作時延補償,對線陣中各個通道麥克風(fēng)接收的語音信號SiGO可根據(jù)方位角進行如下時延補償計算(如圖5所示)
權(quán)利要求
1.一種超聲波輔助麥克風(fēng)陣列語音增強裝置,其特征在于設(shè)有5元麥克風(fēng)組成的等間距線陣、前置放大電路、模數(shù)轉(zhuǎn)換電路、第I超聲波傳感器、第2超聲波傳感器、超聲波發(fā)射電路、超聲波接收電路、方位計算模塊、加權(quán)疊加模塊;5元麥克風(fēng)組成的等間距線陣用于進行語音信號多通道采集,5元麥克風(fēng)組成的等間距線陣采集的語音信號輸出端依次接前置放大電路、模數(shù)轉(zhuǎn)換電路、數(shù)據(jù)線和加權(quán)疊加模塊;第I超聲波傳感器和第2超聲波傳感器安裝在5元麥克風(fēng)組成的等間距線陣兩端延長線上,超聲波發(fā)射電路和超聲波接收電路利用第I超聲波傳感器和第2超聲波傳感器分別進行超聲波信號發(fā)射,并對接收到的超聲波信號經(jīng)過前置放大電路、模數(shù)轉(zhuǎn)換電路后通過數(shù)據(jù)線送入方位計算模塊;方位計算模塊獲取第I超聲波傳感器和第2超聲波傳感器的回波接收信號進行匹配濾波獲取目標(biāo)至第I超聲波傳感器和第2超聲波傳感器的超聲波渡越時間信息,獲取的聲源方位信息輸入至加 權(quán)疊加模塊,根據(jù)超聲波獲得的聲源方位信息計算各通道時延補償值,并據(jù)此對麥克風(fēng)陣列各通道接收信號進行時延補償、疊加以增強聲源方向語音信號。
全文摘要
一種超聲波輔助麥克風(fēng)陣列語音增強裝置,涉及一種語音信號處理。設(shè)有5元麥克風(fēng)組成的等間距線陣、前置放大電路、模數(shù)轉(zhuǎn)換電路、2個超聲波傳感器、發(fā)射電路、接收電路、方位計算模塊、加權(quán)疊加模塊;線陣輸出端依次接前置放大電路、模數(shù)轉(zhuǎn)換電路、數(shù)據(jù)線和加權(quán)疊加模塊;傳感器安裝在線陣兩端延長線上,發(fā)射、接收電路利用傳感器進行信號發(fā)射,并對接收到的信號經(jīng)前置放大、模數(shù)轉(zhuǎn)換后送入方位計算模塊;方位計算模塊獲取傳感器的回波接收信號進行匹配濾波獲取目標(biāo)至傳感器的超聲波渡越時間信息,獲取的聲源方位信息輸入至加權(quán)疊加模塊,再計算各通道時延補償值,對麥克風(fēng)陣列各通道接收信號進行時延補償、疊加以增強聲源方向語音信號。
文檔編號G10L21/02GK102800325SQ20121031921
公開日2012年11月28日 申請日期2012年8月31日 優(yōu)先權(quán)日2012年8月31日
發(fā)明者童峰, 洪青陽, 周躍海 申請人:廈門大學(xué)