車用陣列話筒的語音識別水平提升系統(tǒng)及其方法

文檔序號：2826133閱讀：355來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

車用陣列話筒的語音識別水平提升系統(tǒng)及其方法
【專利摘要】本發(fā)明提供一種車用陣列話筒的語音識別水平提升系統(tǒng)及其方法，其利用從多個話筒傳感器接收的音源信號，估算音源信號的發(fā)出地點，向覆蓋估算的發(fā)出地點的區(qū)域調(diào)整陣列話筒波束形成區(qū)，即使因用戶的多種身體特性或活動而發(fā)話地點出現(xiàn)變化，也可以主動調(diào)整波束形成區(qū)，從而提升陣列話筒系統(tǒng)的語音識別效率以及通話質(zhì)量。
【專利說明】車用陣列話筒的語音識別水平提升系統(tǒng)及其方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及車用陣列話筒系統(tǒng)，尤其是跟蹤發(fā)聲地點改變波束形成的車用陣列話筒的語音識別水平提升系統(tǒng)及其方法。
【背景技術(shù)】
[0002]陣列話筒系統(tǒng)是利用多重話筒使周邊雜音或干擾音的影響最小化的系統(tǒng)，適用于車用免提系統(tǒng)或語音識別系統(tǒng)。一般車輛等空間較窄的室內(nèi)使用兩個話筒陣列。
[0003]例如，傳統(tǒng)的免提系統(tǒng)用陣列話筒系統(tǒng)如圖1所示，其組成包括:由多重話筒組成采集音源信號的陣列話筒10、處理在陣列話筒10采集的音源信號只提取用戶的語音信號的處理器裝置20。
[0004]具有所述結(jié)構(gòu)的傳統(tǒng)的陣列話筒系統(tǒng)中提取用戶音源的運(yùn)行動作如下。
[0005]陣列話筒10是用戶的音源信號A和收音機(jī)廣播、散熱風(fēng)扇、發(fā)動機(jī)噪聲等周邊的各種雜音成分即接口音源信號B以及配套環(huán)境/電路上噪聲C等同時被提取施加于處理單元20。此時處理單元20實施估算輸入的各種信號參數(shù)的第一處理，實施從估算的參數(shù)分離出實際用戶的語音信號、周邊雜音即接口噪聲、配套環(huán)境/電路上噪聲的第二處理。
[0006]然后實施通過濾波清除周邊雜音即接口噪聲，只提取為用戶的語音信號和配套/電路上噪聲的第三處理，并實施對于經(jīng)過第三處理的信號實施濾波清除配套/電路上噪聲只提取純用戶語音信號的第四處理。
[0007]該處理單元20中的純用戶語音信號提取是利用輸入于各個話筒的音源信號(sound signal)之間發(fā)生的延時(time delay)實施固定音源流入方向的波束形成(beamforming)只提取從特定方向輸入的音源信號，從而使用戶語音對陣列話筒的流入方向被固定。
[0008]所述陣列話筒系統(tǒng)是波束形成區(qū)域的調(diào)諧完成后以調(diào)諧的條件固定住波束形成的區(qū)域和方向，而如圖2所示只從特定方向接收音源信號而限制說話者(用戶)發(fā)話位置的
自由度。
[0009]為解決所述自由度受限制的問題，傳統(tǒng)的陣列話筒系統(tǒng)將音源信號的流入方向即波束形成區(qū)域形成得較寬(Broad)，即使說話者發(fā)話位置改變也可以很好地接收。
[0010]但波束形成區(qū)域變寬時，如果從波束形成區(qū)域內(nèi)的特定方向發(fā)生噪聲或變大時，因不能適當(dāng)?shù)厍宄?，?dǎo)致最終提取的語音信號中含有噪聲，而且利用雙信道陣列話筒而使利用音源信號之間延時估算音源流入方向的準(zhǔn)確性下降。最終，不能提供可靠的免提功能而無法提供優(yōu)質(zhì)的通話服務(wù)。

【發(fā)明內(nèi)容】

[0011]本發(fā)明的目的在于提供一種車用陣列話筒的語音識別水平提升系統(tǒng)及其方法，估算用戶的語音發(fā)出地點，以向覆蓋估算的發(fā)話地點的區(qū)域主動調(diào)整陣列話筒的波束形成區(qū)域。[0012]為解決所述課題，本發(fā)明一方面涉及的車用陣列話筒的語音識別水平提升系統(tǒng)的組成包括:多個話筒傳感器，形成多個信道；音響本體，利用從所述多個話筒傳感器輸入的語音信號，估算所述語音信號的發(fā)出地點，向所述估算的發(fā)出地點移動所述多個話筒傳感器的波束形成區(qū)。所述音響本體是使所述波束形成區(qū)移動到包括多個區(qū)域的覆蓋已設(shè)定的波束區(qū)矩陣內(nèi)所述估算的發(fā)出地點所處區(qū)域的區(qū)。所述波束區(qū)矩陣由默認(rèn)區(qū)域和圍繞所述默認(rèn)區(qū)域的擴(kuò)展區(qū)域組成。
[0013]所述音響本體是所述估算的發(fā)出地點位于所述擴(kuò)展區(qū)域時，將覆蓋所述波束區(qū)域矩陣內(nèi)默認(rèn)區(qū)域的波束形成區(qū)域移動到覆蓋所述發(fā)出地點所在的擴(kuò)展區(qū)域的區(qū)。所述音響本體利用輸入于所述多個話筒傳感器的各個信道的語音信號的時間差，估算所述語音信號的發(fā)出地點。所述多個話筒傳感器至少是三個陣列話筒傳感器。
[0014]為解決所述課題，本發(fā)明另一方面涉及的車用陣列話筒的語音識別水平提升方法，該方法的實施步驟包括:接收從多個話筒傳感器輸入的語音信號；利用所述輸入的語音信號估算所述語音信號的發(fā)出地點；使所述多個話筒傳感器的波束形成區(qū)移動到所述估算的發(fā)出地點。
[0015]估算所述發(fā)出地點的步驟具體為利用輸入于所述多個話筒傳感器的各信道的語音信號之間的時間差，估算所述語音信號的發(fā)出地點。移動所述波束形成區(qū)的步驟具體為，在由默認(rèn)區(qū)域和圍繞所述默認(rèn)區(qū)域的擴(kuò)展區(qū)組成的已設(shè)定的波束區(qū)矩陣內(nèi)，所述發(fā)出地點位于所述擴(kuò)展區(qū)時，使覆蓋所述默認(rèn)區(qū)域的波束形成區(qū)移動到所述發(fā)出地點所處的擴(kuò)展區(qū)域。
[0016]本發(fā)明具有的優(yōu)點在于:
本發(fā)明是利用從多個話筒傳感器接收的音源信號估算音源信號的發(fā)話地點，以向覆蓋估算的發(fā)話地點的區(qū)域調(diào)整陣列話筒的波束形成區(qū)域，根據(jù)用戶的各種身體特性或者活動，即使發(fā)話地點出現(xiàn)變化，也可以主動調(diào)整波束形成區(qū)域，從而提高陣列話筒系統(tǒng)的語音識別效率和通話質(zhì)量。
【專利附圖】

【附圖說明】
[0017]圖1是傳統(tǒng)的陣列話筒系統(tǒng)結(jié)構(gòu)參照圖；
圖2是表示傳統(tǒng)的陣列話筒系統(tǒng)的波束形成區(qū)域的例示圖；
圖3是本發(fā)明一個實施例的車用陣列話筒的語音識別水平提升系統(tǒng)框圖；
圖4是表示本發(fā)明的虛擬波束形成矩陣的例示圖；
圖5是表示本發(fā)明的車內(nèi)虛擬波束區(qū)域矩陣位置的例示圖；
圖6是根據(jù)本發(fā)明的發(fā)話地點位置的各調(diào)整模式的波束形成區(qū)域例示圖；
圖7是本發(fā)明一個實施例的車用陣列話筒的語音識別水平提升方法的流程圖。
[0018]圖中:
100:話筒傳感器；200:音響本體；
210:估算部；220:存儲部；
230:調(diào)整部。
【具體實施方式】[0019]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚，下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實施例是本發(fā)明一部分實施例，而不是全部的實施例?；诒景l(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護(hù)的范圍。
[0020]圖3是本發(fā)明一個實施例的車用陣列話筒的語音識別水平提升系統(tǒng)框圖。如圖3所示，語音識別水平提升系統(tǒng)包括多個話筒傳感器100和音響本體200。
[0021]話筒傳感器100接收用戶語音的裝置，裝配在車內(nèi)既定位置。話筒傳感器100是至少由三個話筒陣列構(gòu)成的，優(yōu)選地，話筒傳感器100可以是由信道1-4組成的話筒。
[0022]音響本體200利用從話筒傳感器100輸入的音源信號，估算音源信號的發(fā)出地點，根據(jù)估算結(jié)果利用波束形成(beam forming)算法對輸入話筒傳感器100的音源信號的波束形成區(qū)域?qū)嵤┳兞空{(diào)整。波束形成(Beam Forming)是指形成具有方向性的波束,只接收從所需方向傳播過來的信號，從其它方向傳播過來的語音信號或噪聲則清除。
[0023]具體是，音響本體200包括估算部210、存儲部220以及調(diào)整部230。
[0024]估算部210分析從話筒傳感器100接收的音源信號，對低于基礎(chǔ)級別以下的信號作為噪聲清除。估算部210根據(jù)語音頻率特點，從被清除的信號中提取200Hz -3000Hz內(nèi)的信號，利用提取的音源信號估算音源信號的發(fā)出地點。
[0025]一般，利用從三個以上的話筒傳感器100接收的音源信號估算三維空間的音源發(fā)出地點。發(fā)出地點可以利用信道之間的時間差、強(qiáng)度差異及相位差異估算。
[0026]本發(fā)明中估算部210利用從話筒傳感器100輸入的音源信號的到達(dá)時間差(TimeDifference of Arrival，TD0A)估算音源信號的發(fā)出位置。利用音源信號的到達(dá)時間差估算語音發(fā)出位置的方法有多種算法。一般利用到達(dá)時間差的方法是利用相互相關(guān)函數(shù)的方法和利用自適應(yīng)過濾器的方法，利用到達(dá)時間差的算法已被廣為人知。
[0027]存儲部220是存儲數(shù)據(jù)的存儲器，可以使用閃存。存儲部220可以在音響本體200內(nèi)實現(xiàn)，也可以與音響本體200分別實現(xiàn)。該存儲部220如圖4所示，儲存波束區(qū)矩陣的虛擬坐標(biāo)值。該波束區(qū)矩陣如圖5所示，是對用戶的語音可能發(fā)出的位置的虛擬區(qū)矩陣。該波束區(qū)矩陣是由默認(rèn)區(qū)(A、B、C、D區(qū))和默認(rèn)區(qū)周邊的擴(kuò)展區(qū)((Weak area)組成的。存儲部220如下述還可以儲存優(yōu)化調(diào)諧算法，以調(diào)整各調(diào)整模式(圖6的(I) - (5))的各波束區(qū)，進(jìn)而調(diào)整波束區(qū)。
[0028]調(diào)整部230對估算部210估算的音源信號發(fā)出地點坐標(biāo)和存儲部220上儲存的矩陣坐標(biāo)進(jìn)行比較，根據(jù)比較結(jié)果利用存儲部220上儲存的波束形成調(diào)諧算法，利用五個模式中的一個模式調(diào)整波束形成區(qū)。具體是，調(diào)整部230平時如圖6的(5)在覆蓋默認(rèn)區(qū)的默認(rèn)模式狀態(tài)下，如估算部210估算的發(fā)出地點位于默認(rèn)區(qū)以外的擴(kuò)展區(qū)時，調(diào)整部230會用覆蓋估算的發(fā)出地點所處擴(kuò)展區(qū)的模式(圖6的(I) - (4)之一)調(diào)整波束形成區(qū)。
[0029]如圖7所示，是本發(fā)明一個實施例的車用陣列話筒的語音識別水平提升方法的流程圖。
[0030]首先，音響本體200在波束控制模式狀態(tài)下接收通過四個話筒傳感器100輸入的音源信號(步驟S100)。音響本體200對接收的四個音源信號進(jìn)行分析估算音源信號的發(fā)出位置(步驟S200)。具體是，音響本體200對從話筒傳感器100接收的音源信號進(jìn)行分析，對于基礎(chǔ)級別以下的信號作為噪聲清除。音響本體200根據(jù)語音的頻率特性，從清除的信號中提取200Ηζ-3000Ηζ內(nèi)的信號，利用提取的音源信號之間時間差估算音源信號的發(fā)出地點。
[0031]音響本體200是對在S200估算的音源信號的發(fā)出地點坐標(biāo)和已存儲的波束形成矩陣(見圖4圖示)的坐標(biāo)進(jìn)行比較(步驟S300)。音響本體200根據(jù)比較結(jié)果利用已儲存模式中的一個模式調(diào)諧算法調(diào)整波束形成區(qū)(步驟S400)。
[0032]具體是，估算的音源信號的發(fā)出地點位于圖4的波束形成矩陣的AA、NA、WA區(qū)內(nèi)時，音響本體200如圖6 (I)所示，用可覆蓋默認(rèn)區(qū)即A區(qū)和A區(qū)的擴(kuò)展區(qū)即AA、NA、WA區(qū)的A模式調(diào)整波束形成區(qū)。如上所述，音響本體200是發(fā)出地點位于BB、NB、EB區(qū)內(nèi)部時，將波束形成區(qū)如圖6 (2)所示用B模式調(diào)整。發(fā)出地點在CC、EC、WC區(qū)內(nèi)時，音響本體200將波束形成區(qū)如圖6 (3)所示用C模式調(diào)整。發(fā)出地點位于DD、SD、ED區(qū)內(nèi)時，音響本體200對于波束形成區(qū)如圖6 (4)所示用D模式調(diào)整。另一方面，估算的音源信號的發(fā)出地點位于A、B、C、D區(qū)內(nèi)時，音響本體200如圖6 (5)所示，用默認(rèn)模式調(diào)整波束形成區(qū)。
[0033]以上實施例僅用以說明本發(fā)明的技術(shù)方案，而非對其限制；盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所述的技術(shù)方案進(jìn)行修改，或者對其中部分技術(shù)特征進(jìn)行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例所述技術(shù)方案的范圍。本發(fā)明的保護(hù)范圍應(yīng)根據(jù)下述的權(quán)利要求范圍進(jìn)行解釋，而且在其同等范圍內(nèi)的所有技術(shù)方案應(yīng)都屬于本發(fā)明的權(quán)利要求范圍。
【權(quán)利要求】
1.一種車用陣列話筒的語音識別水平提升系統(tǒng)，其特征在于，包括: 多個話筒傳感器，形成多個信道；音響本體，利用從所述多個話筒傳感器輸入的語音信號，估算所述語音信號的發(fā)出地點，向所述估算的發(fā)出地點移動所述多個話筒傳感器的波束形成區(qū)。
2.根據(jù)權(quán)利要求1所述的車用陣列話筒的語音識別水平提升系統(tǒng)，其特征在于，所述音響本體使所述波束形成區(qū)移動到包括多個區(qū)域的覆蓋已設(shè)定的波束區(qū)矩陣內(nèi)所述估算的發(fā)出地點所處區(qū)域的區(qū)。
3.根據(jù)權(quán)利要求2所述的車用陣列話筒的語音識別水平提升系統(tǒng)，其特征在于，所述波束區(qū)矩陣由默認(rèn)區(qū)域和圍繞所述默認(rèn)區(qū)域的擴(kuò)展區(qū)域組成。
4.根據(jù)權(quán)利要求3所述的車用陣列話筒的語音識別水平提升系統(tǒng)，其特征在于，所述音響本體是所述估算的發(fā)出地點位于所述擴(kuò)展區(qū)域時，將覆蓋所述波束區(qū)域矩陣內(nèi)默認(rèn)區(qū)域的波束形成區(qū)域移動到覆蓋所述發(fā)出地點所在的擴(kuò)展區(qū)域的區(qū)。
5.根據(jù)權(quán)利要求1所述的車用陣列話筒的語音識別水平提升系統(tǒng)，其特征在于，所述音響本體利用輸入于所述多個話筒傳感器的各個信道的語音信號的時間差，估算所述語音信號的發(fā)出地點。
6.根據(jù)權(quán)利要求1所述的車用陣列話筒的語音識別水平提升系統(tǒng)，其特征在于，所述多個話筒傳感器為至少三個陣列話筒傳感器。
7.一種車用陣列話筒的語音識別水平提升方法，其特征在于，該方法的實施步驟包括: 接收從多個話筒傳感器輸入的語音信號；利用所述輸入的語音信號估算所述語音信號的發(fā)出地點；使所述多個話筒傳感器的波束形成區(qū)移動到所述估算的發(fā)出地點。
8.根據(jù)權(quán)利要求7所述的車用陣列話筒的語音識別水平提升方法，其特征在于，估算所述發(fā)出地點的步驟具體為利用輸入于所述多個話筒傳感器的各信道的語音信號之間的時間差，估算所述語音信號的發(fā)出地點。
9.根據(jù)權(quán)利要求7所述的車用陣列話筒的語音識別水平提升方法，其特征在于，所述使波束形成區(qū)移動的步驟具體為使所述波束形成區(qū)移動到包括多個區(qū)域的覆蓋已設(shè)定的波束區(qū)矩陣內(nèi)所述估算發(fā)出地點所在的區(qū)域的區(qū)。
10.根據(jù)權(quán)利要求7所述的車用陣列話筒的語音識別水平提升方法，其特征在于，移動所述波束形成區(qū)的步驟具體為，在由默認(rèn)區(qū)域和圍繞所述默認(rèn)區(qū)域的擴(kuò)展區(qū)組成的已設(shè)定的波束區(qū)矩陣內(nèi)，所述發(fā)出地點位于所述擴(kuò)展區(qū)時，使覆蓋所述默認(rèn)區(qū)域的波束形成區(qū)移動到所述發(fā)出地點所處的擴(kuò)展區(qū)域。
【文檔編號】G10L21/02GK103680512SQ201310349297
【公開日】2014年3月26日申請日期:2013年8月12日優(yōu)先權(quán)日:2012年9月3日
【發(fā)明者】金惠珍申請人:現(xiàn)代摩比斯株式會社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：金惠珍;
技術(shù)所有人：現(xiàn)代摩比斯株式會社;
我是此專利的發(fā)明人

上一篇：一種語音信號處理方法和裝置制造方法
上一篇：語音操控方法、移動終端裝置及語音操控系統(tǒng)的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

陣列話筒相關(guān)技術(shù)

陣列會議話筒相關(guān)技術(shù)

陣列式吸頂話筒相關(guān)技術(shù)

嵌入式陣列話筒相關(guān)技術(shù)

語音識別相關(guān)技術(shù)

百度語音識別相關(guān)技術(shù)

語音識別成文字相關(guān)技術(shù)

語音識別軟件相關(guān)技術(shù)