專利名稱:語音輸入裝置及其制造方法、信息處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音輸入裝置及其制造方法,以及信息處理系統(tǒng)。
背景技術(shù):
當(dāng)通過電話等進行通話或進行語音識別、語音錄音等時,最好僅接收目 的語音(用戶的語音)。但是,在語音輸入裝置的使用環(huán)境中,有時會存在 背景噪聲等除了目的語音以外的語音。因此,正在研發(fā)具有噪音去除功能的 語音輸入裝置。
作為在存在噪音的使用環(huán)境中去除噪音的技術(shù),公知的方法有使麥克風(fēng) 具有靈敏的指向性的方法,或者利用聲波的到達(dá)時刻差來識別聲波的到達(dá)方 向,并通過信號處理來去除噪音的方法。
另外,近年來,電子設(shè)備日趨小型化,實現(xiàn)語音輸入裝置的小型化的技
術(shù)變得重要。作為該領(lǐng)域的現(xiàn)有技術(shù),都有JP特開平7-312638號公報、JP 特開平9-331377號公報、JP特開2001-186241號公報。
發(fā)明內(nèi)容
要使麥克風(fēng)具有靈敏的指向性,則需要排列多個振動膜,所以難以實現(xiàn) 小型化。
另外,要利用聲波的到達(dá)時刻差來高精度地檢測出聲波的到達(dá)方向,則 需要以可聽聲波的數(shù)波長分之1左右的間隔設(shè)置多個振動膜,因此難以實現(xiàn) 小型化。
另外,若利用多個麥克風(fēng)所取得的聲波的差分信號,則在麥克風(fēng)的制造 過程中產(chǎn)生的延遲或增益的偏差有時會對噪音去除精度產(chǎn)生影響。
本發(fā)明多個實施方式的目的在于,提供一種具有噪音成分去除功能的語 音輸入裝置及其制造方法以及信息處理系統(tǒng)。
(1)本發(fā)明是一種語音輸入裝置,包括第一麥克風(fēng),其具有第一振
動膜,第二麥克風(fēng),其具有第二振動膜,
差分信號生成部,其根據(jù)所述第一麥克風(fēng)所取得的第一電壓信號和所述 第二麥克風(fēng)所取得的第二電壓信號,生成第一電壓信號和第二電壓信號的差
分信號;
其特征在于,
所述第一 以及第二振動膜被配置成噪音強度比小于輸入語音強度比,其 中,所述噪音強度比表示包含在所述差分信號中的噪音成分的強度相對包含 在所述第一或第二電壓信號中的所述噪音成分的強度的比例,所述輸入語音 強度比表示包含在所述差分信號中的輸入語音成分的強度相對包含在所述 第一或第二電壓信號中的所述輸入語音成分的強度的比例,
所述差分信號生成部包括
增益部,其對所述第一麥克風(fēng)所取得的第一電壓信號賦予規(guī)定的增益;
差分信號輸出部,其接收通過所述增益部賦予了規(guī)定增益的第一電壓信 號以及所述第二麥克風(fēng)所取得的第二電壓信號,生成并輸出賦予了規(guī)定增益 的第一 電壓信號和第二電壓信號的差分信號。
增益部具有對輸入信號賦予規(guī)定增益的功能,當(dāng)作為模擬信號進行處理 時,可以由模擬放大器電路構(gòu)成增益部,當(dāng)作為數(shù)字信號進行處理時,可以 由數(shù)字乘法器構(gòu)成增益部。
由于制造工序中的電氣或機械結(jié)構(gòu)的原因,在麥克風(fēng)的感度(增益)多 發(fā)生偏差。因此,有時會產(chǎn)生第一麥克風(fēng)和所述第二麥克風(fēng)所輸出的電壓信 號的振幅的偏差(麥克風(fēng)的增益的偏差),通常會產(chǎn)生土3dB左右的偏差。 通過實驗確認(rèn)到若存在該偏差,則這會成為差動麥克風(fēng)的遠(yuǎn)方噪聲抑制效 果降低的原因。
根據(jù)本發(fā)明,通過對第一電壓信號賦予規(guī)定的增益(可以是提高增益的 情況,也可以是降低增益的情況),能夠校正第一電壓信號以及第二電壓信 號的振幅的偏差(增益的偏差)。也可以校正為使相對于輸入聲壓的第一
電壓信號以及第二電壓信號的振幅相同,或者使第一電壓信號和第二電壓信 號的振幅差收斂在規(guī)定的范圍內(nèi)。由此,能夠防止因制造工序中產(chǎn)生的麥克 風(fēng)的個體差所引起的感度偏差而噪聲抑制效果降低。
根據(jù)該語音輸入裝置,第一以及第二麥克風(fēng)(第一以及第二振動膜)被配置成滿足規(guī)定的條件。由此,可以將表示第一以及第二麥克風(fēng)所取得的第 一以及第二電壓信號之差的差分信號視為噪音成分被去除的、表示輸入語音 的信號。因此,根據(jù)本發(fā)明,能夠提供一種只通過生成差分信號的簡單的結(jié) 構(gòu)就可實現(xiàn)噪音去除功能的語音輸入裝置。
此外,在該語音輸入裝置中,差分信號生成部無需對第一以及第二電壓 信號進行解析處理(傅立葉解析處理等),就能夠生成差分信號。因此,可 以減輕差分信號生成部的信號處理負(fù)擔(dān),或者,能夠通過非常簡單的電路來 實現(xiàn)差分信號生成部。
由此,根據(jù)本發(fā)明,能夠提供可實現(xiàn)小型化、且能夠?qū)崿F(xiàn)高精度的噪音 去除功能的語音輸入裝置。
此外,在該語音輸入裝置中,可以將第一以及第二振動膜配置成噪音 成分的相位差成分的強度比小于基于輸入語音成分的振幅的強度比。 (2)本發(fā)明的語音輸入裝置的特征在于,
所述差分信號生成部包括-
增益部,其根據(jù)施加在規(guī)定的端子上的電壓或在規(guī)定的端子上流過的電 流,改變放大率,
增益控制部,其對施加在所述規(guī)定的端子上的電壓或在規(guī)定的端子上流 過的電流進行控制;
所述增益控制部,包括串聯(lián)或并聯(lián)連接有多個電阻的電阻陣列,并切斷 構(gòu)成所述電阻陣列的電阻體或?qū)w的一部分,或者,包括至少一個電阻體, 并切斷該電阻體的一部分,由此能夠改變施加在增益部的規(guī)定的端子上的電 壓或在增益部的規(guī)定的端子上流過的電流。
可以通過激光來剪切構(gòu)成電阻陣列的電阻體或?qū)w的一部分,或者,通 過施加高電壓或者高電流來熔斷構(gòu)成電阻陣列的電阻體或?qū)w的一部分,由 此變更電阻值,也可以通過在一個電阻體的一部分上形成切痕來變更電阻 值。
檢查由在麥克風(fēng)的制造過程中產(chǎn)生的個體差引起的增益的偏差,并決定 第一電壓信號的放大率,以消除由該偏差產(chǎn)生的振幅差。而且,切斷構(gòu)成所 述電阻陣列的電阻體或?qū)w(例如,熔絲)的一部分,將增益控制部的電阻 值設(shè)定為適當(dāng)?shù)闹担沟媚軌蛳蛞?guī)定的端子供給用于實現(xiàn)所決定的放大率的
10電壓或電流。由此,能夠調(diào)整增益部的輸出和所述第二麥克風(fēng)所取得的第二 電壓信號之間的振幅平衡。
(3) 本發(fā)明的語音輸入裝置的特征在于, 所述差分信號生成部包括
振幅差檢測部,其接收被輸入至所述差分信號輸出部的第一電壓信號和 第二電壓信號,并根據(jù)接收到的第一電壓信號和第二電壓信號,檢測在生成 差分信號時的第一電壓信號和第二電壓信號之間的振幅差,根據(jù)檢測結(jié)果生 成振幅差信號并進行輸出;
增益控制部,其根據(jù)所述振幅差信號,進行使所述增益部中的放大率變 化的控制。
振幅差檢測部可以包括第一振幅檢測部,其用于檢測增益部的輸出信 號振幅;第二振幅檢測部,其用于檢測所述第二麥克風(fēng)所取得的第二電壓信 號的信號振幅;振幅差信號生成部,其用于檢測通過所述第一振幅檢測單元 來檢測出的振幅信號和通過所述第二振幅檢測單元來檢測出的振幅信號的 差分信號。
例如,作為增益調(diào)整用的聲源準(zhǔn)備測試用的聲源,將來自該聲源的聲音 設(shè)定為以相同的聲壓輸入至第一麥克風(fēng)和第二麥克風(fēng),監(jiān)測第一麥克風(fēng)和第 二麥克風(fēng)接收聲音并輸出的第一電壓信號和第二電壓信號的波形(例如,可 以利用示波器(Oscilloscope)等進行監(jiān)測),并變更放大率,以使兩者的振 幅一致或者振幅差在規(guī)定的范圍內(nèi)。
(4) 本發(fā)明的語音輸入裝置的特征在于,所述增益控制部控制增益部 的放大率,使所述增益部的輸出信號和所述第二麥克風(fēng)所取得的第二電壓信 號之間的振幅差相對其中任一信號的比例為規(guī)定的比例以下,或者得到規(guī)定 分貝的噪聲抑制效果。
例如,可以使振幅差相對于增益部的輸出信號或第二電壓信號在-3%以 上、+3%以下的范圍內(nèi),也可以使其在-6%以上、+6%以下的范圍內(nèi)。在前 者的情況下,對于lkHz的聲波,噪聲抑制效果為約IO分貝,在后者的情況 下,噪聲抑制效果為約6分貝,能夠發(fā)揮適當(dāng)?shù)囊种菩Ч?br>
或者,也可以對放大進行控制,使得能夠得到規(guī)定分貝(例如,約10 分別)的噪聲抑制效果。(5) 本發(fā)明的語音輸入裝置的特征在于,在權(quán)利要求3或4中,包括 聲源部,該聲源部設(shè)置在離所述第一麥克風(fēng)和所述第二麥克風(fēng)等距離的位 置,
所述差分信號生成部進行根據(jù)來自所述聲源部的聲音使所述增益部中 的放大率變化的控制。
所述差分信號生成部可以根據(jù)所述第一麥克風(fēng)以及所述第二麥克風(fēng)接 收到的來自聲源部的聲音來進行調(diào)整,使得增益部輸出和所述第二麥克風(fēng)所 取得的第二電壓信號的信號振幅變?yōu)橄嗤?br>
(6) 本發(fā)明的語音輸入裝置的特征在于, 包括-
第一麥克風(fēng),其具有第一振動膜, 第二麥克風(fēng),其具有第二振動膜,
差分信號生成部,其根據(jù)所述第一麥克風(fēng)所取得的第一 電壓信號和所述 第二麥克風(fēng)所取得的第二電壓信號,生成第一電壓信號和第二電壓信號的差 分信號,
聲源部,其設(shè)置在離所述第一麥克風(fēng)和所述第二麥克風(fēng)等距離的位置; 所述差分信號生成部包括
增益部,其對所述第一麥克風(fēng)所取得的第一電壓信號賦予規(guī)定的增益, 振幅差檢測部,其接收被輸入至所述差分信號輸出部的第一電壓信號和
第二電壓信號,并根據(jù)接收到的第一電壓信號和第二電壓信號,檢測在生成
差分信號時的第一電壓信號和第二電壓信號之間的振幅差,根據(jù)檢測結(jié)果生
成振幅差信號并進行輸出,
增益控制部,其根據(jù)所述振幅差信號,進行使所述增益部中的放大率變
化的控制;
根據(jù)來自所述聲源部的聲音,調(diào)整所述增益部中的放大率,使得所述第 一電壓信號和第二電壓信號的振幅變?yōu)橄嗤?br>
根據(jù)本發(fā)明,能夠調(diào)整根據(jù)使用時的狀況(環(huán)境或使用年限)等而變化 的麥克風(fēng)的增益偏差。
(7) 本發(fā)明的語音輸入裝置的特征在于,所述聲源部是用于發(fā)出單一 頻率的聲音的聲源。(8) 本發(fā)明的語音輸入裝置的特征在于,所述聲源部的頻率被設(shè)定為 可聽頻帶外的頻率。
若將所述聲源部的頻率設(shè)定為可聽頻帶外的頻率,則在用戶使用時也不 造成障礙的情況下,能夠利用聲源部來調(diào)整輸入信號的相位差或延遲差。根 據(jù)本發(fā)明,在使用時能夠動態(tài)地調(diào)整增益,因此能夠根據(jù)溫度變化等周圍環(huán) 境來進行增益調(diào)整。
(9) 本發(fā)明的語音輸入裝置的特征在于, 所述振幅差檢測部包括帶通濾波器,該帶通濾波器使被輸入至差分信號
輸出部的第一電壓信號和第二電壓信號的所述單一頻率附近的頻帶通過, 檢測通過所述帶通濾波器后的所述第一 電壓信號和所述第二電壓信號
的振幅差,根據(jù)檢測結(jié)果生成振幅差信號。
根據(jù)本發(fā)明,能夠選擇性地捕捉并調(diào)整聲源部的語音信號,因此能夠?qū)?br>
現(xiàn)高精度的調(diào)整。而且,能夠?qū)崟r或間歇地檢測并調(diào)整根據(jù)使用時的狀況(環(huán)
境或使用年限)等而變化的麥克風(fēng)的增益偏差。
(10) 本發(fā)明的語音輸入裝置的特征在于,所述差分信號生成部包括低 通濾波器部,該低通濾波器部用于去除所述差分信號的高頻成分。
差動麥克風(fēng)具有強調(diào)(提高增益)聲音的高頻成分的特性,聽覺上,高 頻的噪聲有時會成為刺耳的音質(zhì)。因此,利用低通濾波器使所述差分信號的 高頻成分衰減,由此能夠使頻率特性變得平坦,從而能夠防止產(chǎn)生聽覺上的 不協(xié)調(diào)感。
(11) 本發(fā)明的語音輸入裝置的特征在于,所述低通濾波器部是具有一 階遮斷特性的濾波器。
由于差分信號的高頻以一階特性(20dB/dec)上升,因此,若利用具有 該逆特性的一階低通濾波器使高頻衰減,則能夠使差分信號的頻率特性保持 平坦,從而能夠防止產(chǎn)生聽覺上的不協(xié)調(diào)感。
(12) 本發(fā)明的語音輸入裝置的特征在于,所述低通濾波器部的截止頻 率被設(shè)定為lkHz以上且5kHz以下的任意值。
若將低通濾波器部的截止頻率設(shè)定得低,則聲音會變得厚實,若設(shè)定得 高,則高頻噪聲會變得剌耳,因此,優(yōu)選地,根據(jù)麥克風(fēng)之間的距離,將截 止頻率設(shè)定為適當(dāng)?shù)闹怠W罴训慕刂诡l率會根據(jù)麥克風(fēng)之間的距離而變化,但是,例如,當(dāng)麥克風(fēng)之間的距離約為5mm左右時,優(yōu)選地,將低通濾波 器部的截止頻率設(shè)定為1.5kHz以上且2kHz以下。
(13) 本發(fā)明的語音輸入裝置的特征在于, 還包括
第一AD轉(zhuǎn)換單元,其對所述第一電壓信號進行模擬/數(shù)字轉(zhuǎn)換, 第二 AD轉(zhuǎn)換單元,其對所述第二電壓信號進行模擬/數(shù)字轉(zhuǎn)換; 所述差分信號生成部根據(jù)通過所述第一 AD轉(zhuǎn)換單元轉(zhuǎn)換成數(shù)字信號的 所述第一電壓信號以及通過所述第二 AD轉(zhuǎn)換單元轉(zhuǎn)換成數(shù)字信號的所述第 二電壓信號,生成第一電壓信號和第二電壓信號的差分信號。
(14) 本發(fā)明的語音輸入裝置的特征在于, 包括
第一麥克風(fēng),其具有第一振動膜, 第二麥克風(fēng),其具有第二振動膜,
差分信號生成部,其用于生成差分信號,該差分信號表示所述第一麥克 風(fēng)所取得的第一電壓信號和所述第二麥克風(fēng)所取得的第二電壓信號之差;
所述第一以及第二振動膜被配置成噪音強度比小于輸入語音強度比,其 中,所述噪音強度比表示包含在所述差分信號中的噪音成分的強度相對包含 在所述第一或第二電壓信號中的所述噪音成分的強度的比例,所述輸入語音 強度比表示包含在所述差分信號中的輸入語音成分的強度相對包含在所述 第一或第二電壓信號中的所述輸入語音成分的強度的比例。
根據(jù)該語音輸入裝置,第一以及第二麥克風(fēng)(第一以及第二振動膜)被 配置成滿足規(guī)定的條件。由此,能夠?qū)⒈硎镜谝灰约暗诙溈孙L(fēng)所取得的第 一以及第二電壓信號之差的差分信號視為噪音成分被去除的、表示輸入語音 的信號。因此,根據(jù)本發(fā)明,能夠提供一種只通過生成差分信號的簡單的結(jié) 構(gòu)就可以實現(xiàn)噪音去除功能的語音輸入裝置。
此外,在該語音輸入裝置中,差分信號生成部無需對第一以及第二電壓 信號進行解析處理(傅立葉解析處理等),就能夠生成差分信號。因此,能 夠減輕差分信號生成部的信號處理負(fù)擔(dān),或者,能夠通過非常簡單的電路實 現(xiàn)差分信號生成部。
由此,根據(jù)本發(fā)明,能夠提供可實現(xiàn)小型化且可實現(xiàn)高精度的噪音去除功能的語音輸入裝置。
此外,在該語音輸入裝置中,第一以及第二振動膜被配置成噪音成分 的相位差成分的強度比小于基于輸入語音成分的振幅的強度比。
(15) 本發(fā)明的語音輸入裝置的特征在于, 還包括基部,在該基部的主面上形成有凹部, 所述第一振動膜設(shè)置在所述凹部的底面上, 所述第二振動膜設(shè)置在所述主面上。
(16) 本發(fā)明的語音輸入裝置的特征在于,所述基部被設(shè)置成與所述凹 部連通的開口配置在比所述主面上的所述第二振動膜的形成區(qū)域更靠近所 述輸入語音的模型聲源的位置。
根據(jù)該語音輸入裝置,能夠減小向第一以及第二振動膜入射的輸入語音 的相位偏移。因此,能夠生成噪聲少的差分信號,從而能夠提供具有高精度 的噪音去除功能的語音輸入裝置。
(17) 本發(fā)明的語音輸入裝置的特征在于,所述凹部比所述開口和所述
第二振動膜的形成區(qū)域之間的間隔淺。
(18) 本發(fā)明的語音輸入裝置的特征在于,
還包括基部,在該基部的主面上形成有第一凹部和比所述第一凹部淺的 第二凹部,
所述第一振動膜設(shè)置在所述第一凹部的底面上, 所述第二振動膜設(shè)置在所述第二凹部的底面上。
(19) 本發(fā)明的語音輸入裝置的特征在于,所述基部被設(shè)置成與所述第 一凹部連通的第一開口配置在比與所述第二凹部連通的第二開口更靠近所 述輸入語音的模型聲源的位置。
根據(jù)該語音輸入裝置,能夠減小向第一以及第二振動膜入射的輸入語音 的相位偏移。因此,能夠生成噪聲少的差分信號,從而能夠提供具有高精度 的噪音去除功能的語音輸入裝置。
(20) 本發(fā)明的語音輸入裝置的特征在于,所述第一凹部和第二凹部的 深度差小于所述第一開口和第二開口之間的間隔。
(21) 本發(fā)明的語音輸入裝置的特征在于,所述基部被設(shè)置成使所述輸 入語音同時到達(dá)第一振動膜和第二振動膜。由此,能夠生成不包含輸入語音的相位偏移的差分信號,因此能夠提供 具有高精度的噪音去除功能的語音輸入裝置。
(22) 本發(fā)明的語音輸入裝置的特征在于,所述第一以及第二振動膜被 配置成兩者的法線相互平行。
(23) 本發(fā)明的語音輸入裝置的特征在于,所述第一以及第二振動膜被 配置成兩者的法線不在同一直線上。
(24) 本發(fā)明的語音輸入裝置的特征在于,所述第一以及第二麥克風(fēng)被 構(gòu)成為半導(dǎo)體器件。
例如,第一以及第二麥克風(fēng)可以是硅麥克風(fēng)(Si麥克風(fēng))。另外,第一 以及第二麥克風(fēng)可以形成在一個半導(dǎo)體襯底上。此時,第一以及第二麥克風(fēng) 和差分信號生成部可以形成在一個半導(dǎo)體襯底上。第一以及第二麥克風(fēng)和差 分信號生成部也可以被構(gòu)成為所謂的微電子機械系統(tǒng)(MEMS:Micro Electro Mechanical Systems)。另夕卜,振動膜可以采用無機壓電薄膜或有機壓電薄膜, 通過壓電效果來進行聲電變換。
(25) 本發(fā)明的語音輸入裝置的特征在于,所述第一振動膜和第二振動 膜的中心間距離為5.2mm以下。
此外,第一以及第二振動膜可以被配置成兩者的法線相互平行且法線之 間的間隔為5.2mm以下。
(26) 本發(fā)明是一種信息處理系統(tǒng),其特征在于,包括 上述任意技術(shù)方案中的語音輸入裝置;以及
解析處理部,其根據(jù)所述差分信號,對輸入至所述語音輸入裝置中的語 音信息進行解析處理。
若采用該信息處理系統(tǒng),則根據(jù)語音輸入裝置所取得的差分信號,對語 音信息進行解析處理,其中,在所述語音輸入裝置中,第一以及第二振動膜 被配置成滿足規(guī)定的條件。根據(jù)該語音輸入裝置,差分信號是表示噪音成分 被去除的語音成分的信號,因此,通過對該差分信號進行解析處理,能夠基 于輸入語音進行各種信息處理。
本發(fā)明的信息處理系統(tǒng)可以是進行語音識別處理、語音認(rèn)證處理或基于 語音的命令生成處理等的系統(tǒng)。
(27) 本發(fā)明是一種信息處理系統(tǒng),其特征在于,包括
上述任意技術(shù)方案中的語音輸入裝置;以及
主計算機,其根據(jù)所述差分信號,對輸入至所述語音輸入裝置中的語音
信息進行解析處理;
通過所述通信處理部,經(jīng)由網(wǎng)絡(luò)與所述主計算機進行通信處理。 若采用該信息處理系統(tǒng),則根據(jù)語音輸入裝置所取得的差分信號,對語 音信息進行解析處理,其中,在所述語音輸入裝置中,第一以及第二振動膜 被配置成滿足規(guī)定的條件。根據(jù)該語音輸入裝置,差分信號是表示噪音成分 被去除的語音成分的信號,因此,通過對該差分信號進行解析處理,能夠基 于輸入語音進行各種信息處理。
本發(fā)明的信息處理系統(tǒng)可以是進行語音識別處理、語音認(rèn)證處理或基于 語音的命令生成處理等的系統(tǒng)。
(28) 本發(fā)明是一種語音輸入裝置的制造方法,用于制造具有噪音成分 去除功能的語音輸入裝置,該語音輸入裝置包括
第一麥克風(fēng),其具有第一振動膜, 第二麥克風(fēng),其具有第二振動膜,
差分信號生成部,其用于生成差分信號,該差分信號表示所述第一麥克 風(fēng)所取得的第一電壓信號和所述第二麥克風(fēng)所取得的第二電壓信號之差; 其特征在于,包括-
準(zhǔn)備表示Ar/ i值和噪音強度比之間的對應(yīng)關(guān)系的數(shù)據(jù)的步驟,其中,所 述ArA值表示所述第一振動膜和第二振動膜的中心間距離Ar與噪音的波長 人的比例,所述噪音強度比表示包含在所述差分信號中的所述噪音成分的強 度相對包含在所述第一或第二電壓信號中的所述噪音成分的強度的比例;
根據(jù)所述數(shù)據(jù),設(shè)定所述ArA值的步驟;
根據(jù)所設(shè)定的所述Ar/X值以及所述噪音的波長,設(shè)定所述中心間距離的 步驟。
根據(jù)本發(fā)明,能夠提供可實現(xiàn)小型化、且具有高精度的噪音去除功能的 語音輸入裝置的制造方法。
(29) 本發(fā)明的語音輸入裝置的制造方法的特征在于,在設(shè)定所述AiA 值的步驟中,根據(jù)所述數(shù)據(jù),設(shè)定所述Ar/X值,使得所述噪音強度比小于輸入語音強度比,其中,所述輸入語音強度比表示包含在所述差分信號中的輸 入語音成分的強度相對包含在所述第一或第二電壓信號中的所述輸入語音 成分的強度的比例。
(30) 本發(fā)明的語音輸入裝置的制造方法的特征在于,所述輸入語音強 度比是所述輸入語音的振幅成分的強度比。
(31) 本發(fā)明的語音輸入裝置的制造方法的特征在于,所述噪音強度比 是基于所述噪音成分的相位差的強度比。
(32) 本發(fā)明的語音輸入裝置的制造方法的特征在于, 所述語音輸入裝置的差分信號生成部包括
增益部,其根據(jù)施加在規(guī)定的端子上的電壓或在規(guī)定的端子上流過的電 流,對所述第一麥克風(fēng)所取得的第一電壓信號賦予規(guī)定的增益,
增益控制部,其對施加在所述規(guī)定的端子上的電壓或在規(guī)定的端子上流 過的電流進行控制,
差分信號輸出部,其接收通過所述增益部賦予了規(guī)定增益的第一電壓信 號以及所述第二麥克風(fēng)所取得的第二電壓信號,生成賦予了規(guī)定增益的第一 電壓信號和第二電壓信號的差分信號并進行輸出;
所述語音輸入裝置的制造方法包括下述任一步驟
將所述增益控制部構(gòu)成為包括串聯(lián)或并聯(lián)連接有多個電阻的電阻陣列, 并切斷構(gòu)成所述電阻陣列的電阻體或?qū)w的一部分的步驟;
將所述增益控制部構(gòu)成為包括至少一個電阻體,并切斷該電阻體的一部 分的步驟。
(33) 本發(fā)明的語音輸入裝置的制造方法的特征在于, 在離所述第一麥克風(fēng)和所述第二麥克風(fēng)等距離的位置設(shè)置聲源, 根據(jù)來自所述聲源部的聲音,判斷第一麥克風(fēng)和所述第二麥克風(fēng)的振幅
差,并切斷構(gòu)成所述電阻陣列的電阻體或?qū)w的一部分,或者切斷所述至少 一個電阻體的一部分,使其變?yōu)槭乖撜穹钤谝?guī)定的范圍內(nèi)的電阻值。
圖l是語音輸入裝置的說明圖。 圖2是語音輸入裝置的說明圖。
18圖3是語音輸入裝置的說明圖。
圖4是語音輸入裝置的說明圖。
圖5是制造語音輸入裝置的方法的說明圖。
圖6是制造語音輸入裝置的方法的說明圖。
圖7是語音輸入裝置的說明圖。
圖8是語音輸入裝置的說明圖。
圖9是作為語音輸入裝置的一例示出了移動電話機的圖。
圖IO是作為語音輸入裝置的一例示出了麥克風(fēng)的圖。
圖11是作為語音輸入裝置的一例示出了遙控器的圖。
圖12是信息處理系統(tǒng)的概略圖。
圖13是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖14是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖15是延遲部和延遲控制部的具體結(jié)構(gòu)的一例的示意圖。
圖16A是靜態(tài)地控制群延遲濾波器的延遲量的結(jié)構(gòu)的一例。
圖16B是靜態(tài)地控制群延遲濾波器的延遲量的結(jié)構(gòu)的一例。
圖17是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖18是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖19是相位差檢測部的時序圖。
圖20是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖21是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖22A是差動麥克風(fēng)的指向性的說明圖。
圖22B是差動麥克風(fēng)的指向性的說明圖。
圖23是具有噪聲檢測單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 圖24是表示通過噪聲檢測來進行的信號切換動作的例子的流程圖。 圖25是通過噪聲檢測來進行揚聲器的音量控制的動作例的流程圖。 圖26是具有AD轉(zhuǎn)換單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 圖27是具有增益調(diào)整單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 圖28是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 圖29是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 圖30是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。圖31是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 圖32是增益部和增益控制部的具體結(jié)構(gòu)的一例的示意圖。 圖33A是靜態(tài)地控制增益部的放大率的結(jié)構(gòu)的一例。 圖33B是靜態(tài)地控制增益部的放大率的結(jié)構(gòu)的一例。
圖34是語音lr入裝置的結(jié)構(gòu)的一例的示意圖。
圖35是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖36是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖37是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖38是具有AD轉(zhuǎn)換單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖39是語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
圖40是通過激光微調(diào)(lasertrimming)來調(diào)整電阻值的例子的示意圖。
具體實施例方式
下面,參照附圖對應(yīng)用本發(fā)明的實施方式進行說明。但是,本發(fā)明并不 限定于以下實施方式。另外,本發(fā)明包括以下內(nèi)容的自由組合。
1.第一實施方式的語音輸入裝置的結(jié)構(gòu)
首先,參照圖1 圖3,對應(yīng)用本發(fā)明的實施方式的語音輸入裝置1的 結(jié)構(gòu)進行說明。此外,以下所說明的語音輸入裝置l是近講式的語音輸入裝 置,例如能夠應(yīng)用于移動電話機及無線電收發(fā)兩用機(transceiver)等語音通 信設(shè)備或利用了對所輸入的語音進行解析的技術(shù)的信息處理系統(tǒng)(語音認(rèn)證 系統(tǒng)、語音識別系統(tǒng)、命令生成系統(tǒng)、電子辭典、翻譯機、語音輸入方式的 遙控器等),或者能夠應(yīng)用于錄音設(shè)備、放大系統(tǒng)(喇叭)、麥克風(fēng)系統(tǒng)等。
本實施方式的語音輸入裝置包括具有第一振動膜12的第一麥克風(fēng)10以 及具有第二振動膜22的第二麥克風(fēng)20。在此,麥克風(fēng)是指將音響信號變換 為電信號的電聲變換器。第一以及第二麥克風(fēng)10、 20也可以分別是將第一 以及第二振動膜12、 22 (振動板)的振動輸出為電壓信號的變換器。
在本實施方式的語音輸入裝置中,第一麥克風(fēng)10生成第一電壓信號。 另外,第二麥克風(fēng)20生成第二電壓信號。即,可以分別將第一以及第二麥 克風(fēng)IO、 20所生成的電壓信號稱為第一以及第二電壓信號。關(guān)于第一以及第二麥克風(fēng)10、 20的機構(gòu)沒有特別的限定。在圖2中, 作為可適用于第一以及第二麥克風(fēng)10、 20的麥克風(fēng)的一例,示出了電容式 麥克風(fēng)100的結(jié)構(gòu)。電容式麥克風(fēng)100具有振動膜102。振動膜102是接收 聲波就振動的膜(薄膜),具有導(dǎo)電性,并形成電極的一端。電容式麥克風(fēng) 100還具有電極104。電極104配置成與振動膜102相對。由此,振動膜102 和電極104形成電容。當(dāng)聲波入射到電容式麥克風(fēng)100中時,振動膜102振 動以使振動膜102和電極104之間的間隔發(fā)生變化,從而使振動膜102和電 極104之間的靜電電容發(fā)生變化。通過將該靜電電容的變化例如輸出為電壓 變化,能夠?qū)⑾螂娙菔禁溈孙L(fēng)100入射的聲波變換為電信號。此外,在電容 式麥克風(fēng)100中,電極104也可以具有不受聲波影響的結(jié)構(gòu)。例如,電極104 也可以具有網(wǎng)狀(mesh)結(jié)構(gòu)。
但是,可適用于本發(fā)明的麥克風(fēng)并不限定于電容式麥克風(fēng),而可以應(yīng)用 已公知的任何麥克風(fēng)。例如,作為第一以及第二麥克風(fēng)IO、 20,也可以應(yīng)用 動態(tài)式(dynamic式)、電磁式(magnetic式)、壓電式(crystal式)等麥 克風(fēng)。
第一以及第二麥克風(fēng)10、 20也可以是由硅構(gòu)成第一以及第二振動膜12、 22的硅麥克風(fēng)(Si麥克風(fēng))。通過利用硅麥克風(fēng),能夠?qū)崿F(xiàn)第一以及第二麥 克風(fēng)IO、 20的小型化以及高性能化。此時,第一以及第二麥克風(fēng)IO、 20可 以構(gòu)成為一個集成電路裝置。g卩,第一以及第二麥克風(fēng)10、 20可以形成在 一個半導(dǎo)體襯底上。此時,也可以將后述的差分信號生成部30形成在同一 個半導(dǎo)體襯底上。即,第一以及第二麥克風(fēng)10、 20可以構(gòu)成為所謂的微電 子機械系統(tǒng)(MEMS:Micro Electro Mechanical Systems)。其中,也可以將第 一麥克風(fēng)10和第二麥克風(fēng)20構(gòu)成為各自獨立的硅麥克風(fēng)。
在本實施方式的語音輸入裝置中,如后所述,利用表示第一以及第二電 壓信號之差的差分信號,實現(xiàn)噪音成分去除功能。為了實現(xiàn)該功能,使第一 以及第二麥克風(fēng)(第一以及第二振動膜12、 22)的配置滿足一定的條件。關(guān) 于第一以及第二振動膜12、 22應(yīng)滿足的條件,將在后面敘述其細(xì)節(jié),但在 本實施方式中,第一以及第二振動膜12、 22 (第一以及第二麥克風(fēng)10、 20) 被配置成噪音強度比小于輸入語音強度比。由此,能夠?qū)⒉罘中盘栆暈楸硎?噪音成分被去除的語音成分的信號。第一以及第二振動膜12、 22例如也可
21以被配置成中心間距離為5.2mm以下。
此外,在本實施方式的語音輸入裝置中,并未特別限定第一以及第二振 動膜12、 22的朝向。第一以及第二振動膜12、 22可以被配置成兩者的法線 平行。此時,第一以及第二振動膜12、 22可以被配置成兩者的法線不在同 一直線上。例如,第一以及第二振動膜12、 22可以拉開間隔配置在未圖示 的基部(例如,電路基板)的表面上。或者,第一以及第二振動膜12、 22 也可以被配置成在法線方向上相互錯位。然而,第一以及第二振動膜12、 22 也可以被配置成兩者的法線不平行。第一以及第二振動膜12、 22也可以被 配置成兩者的法線垂直。
而且,本實施方式的語音輸入裝置具有差分信號生成部30。差分信號生 成部30生成差分信號,所述差分信號表示第一麥克風(fēng)10所取得的第一電壓 信號和第二麥克風(fēng)20所取得的第二電壓信號之差(電壓差)。在差分信號 生成部30中,無需對第一以及第二電壓信號進行例如傅立葉解析等解析處 理,就可進行用于生成在時間區(qū)域上表示兩者之差的差分信號的處理。差分 信號生成部30的功能可以通過專用的硬件電路(差分信號生成電路)來實 現(xiàn),也可以通過CPU等的信號處理來實現(xiàn)。
本實施方式的語音輸入裝置還可以包括增益部,該增益部用于放大(意 味著包括提高增益的情況和降低增益的情況)差分信號??梢酝ㄟ^一個控制 電路來實現(xiàn)差分信號生成部30和增益部。但是,本實施方式的語音輸入裝 置也可以形成為在內(nèi)部不具有增益部的結(jié)構(gòu)。
圖3示出了可實現(xiàn)差分信號生成部30和增益部的電路的一例。若采用 圖3所示的電路,則在接收第一以及第二電壓信號后,輸出將用于表示其差 的差分信號放大了 IO倍的信號。但是,用于實現(xiàn)差分信號生成部30以及增 益部的電路結(jié)構(gòu)并不限定于此。
本實施方式的語音輸入裝置還可以包括框體40。此時,語音輸入裝置的 外形可以由框體40構(gòu)成。可以對框體40設(shè)定基本姿勢,由此能夠限制輸入 語音的前進路徑。第一以及第二振動膜12、 22也可以形成在框體40的表面 上?;蛘?,第一以及第二振動膜12、 22也可以與形成在框體40上的開口 (語 音入射口)相對地配置在框體40的內(nèi)部。而且,第一以及第二振動膜12、 22也可以被配置成離聲源(入射語音的模型聲源)的距離互不相同。例如,如圖1所示,可以對框體40設(shè)定使輸入語音的前進路徑沿著框體40表面延 伸的基本姿勢。而且,可以沿著輸入語音的前進路徑配置第一以及第二振動 膜12、 22。而且,可以將配置在輸入語音的前進路徑的上游側(cè)的振動膜作為 第一振動膜12,將配置在下游側(cè)的振動膜作為第二振動膜22。
本實施方式的語音輸入裝置還可以包括運算處理部50。運算處理部50 基于差分信號生成部30所生成的差分信號,進行各種運算處理。運算處理 部50也可以對差分信號進行解析處理。運算處理部50也可以通過解析差分 信號來進行用于確定發(fā)出了輸入語音的人的處理(所謂的語音認(rèn)證處理)。 或者,運算處理部50也可以通過對差分信號進行解析處理來進行用于確定 輸入語音的內(nèi)容的處理(所謂的語音識別處理)。運算處理部50也可以基 于輸入語音來進行用于生成各種命令的處理。運算處理部50也可以進行用 于放大差分信號的處理。另外,運算處理部50也可以控制后述的通信處理 部60的動作。另外,運算處理部50也可以通過CPU、存儲器的信號處理來 實現(xiàn)上述各功能。
運算處理部50既可以配置在框體40的內(nèi)部,也可以配置在框體40的 外部。當(dāng)運算處理部50配置在框體40的外部時,運算處理部50可以通過 后述的通信處理部60來取得差分信號。
本實施方式的語音輸入裝置還可以包括通信處理部60。通信處理部60 用于控制語音輸入裝置和其它終端(移動電話終端、主計算機等)的通信。 通信處理部60可以具有通過網(wǎng)絡(luò)向其它終端發(fā)送信號(差分信號)的功能。 另外,通信處理部60也可以具有通過網(wǎng)絡(luò)從其它終端接收信號的功能。而 且,例如,也可以在主計算機中對通過通信處理部60來取得的差分信號進 行解析處理,以此進行語音識別處理或語音認(rèn)證處理、命令生成處理、數(shù)據(jù) 存儲處理等各種信息處理。即,語音輸入裝置可以通過與其它終端的協(xié)作來 構(gòu)成信息處理系統(tǒng)。換言之,可以將語音輸入裝置視為用于構(gòu)筑信息處理系 統(tǒng)的信息輸入終端。但是,語音輸入裝置也可以形成為不具有通信處理部60 的結(jié)構(gòu)。
本實施方式的語音輸入裝置還可以具有顯示面板等顯示裝置、揚聲器等 語音輸入裝置。另外,本實施方式的語音輸入裝置還可以包括用于輸入操作 信息的操作鍵。本實施方式的語音輸入裝置可以具有以上結(jié)構(gòu)。若采用該語音輸入裝 置,則通過輸出第一以及第二電壓信號之差的簡單的處理,能夠生成表示噪 音成分被去除的語音成分的信號(電壓信號)。因此,根據(jù)本發(fā)明,能夠提 供可實現(xiàn)小型化、且具有優(yōu)異的噪音去除功能的語音輸入裝置。此外,關(guān)于 其原理,在后面進行詳細(xì)的敘述。
2.噪音去除功能
下面,對本實施方式的語音輸入裝置所采用的語音去除原理以及用于實
現(xiàn)該原理的條件進行說明。 (1)噪音去除原理 首先,對本實施方式的語音輸入裝置的噪音去除原理進行說明。 聲波隨著在介質(zhì)中前進而衰減,而且其聲壓(聲波的強度/振幅)下降。
由于聲壓與離聲源的距離成反比,因此可以將聲壓P和離聲源的距離r之間
的關(guān)系表示成
尸=《丄 (1)
此外,在式(1)中,k是比例常數(shù)。圖4示出了表示式(1)的曲線圖,從 本圖可知,聲壓(聲波的振幅)在離聲源近的位置(曲線圖的左側(cè))急劇衰 減,而且越遠(yuǎn)離聲源越平穩(wěn)地衰減。在本實施方式的語音輸入裝置中,利用 該衰減特性來去除噪音成分。
艮P,在近講式的語音輸入裝置中,用戶在比噪音的聲源更接近第一以及 第二麥克風(fēng)IO、 20 (第一以及第二振動膜12、 22)的位置發(fā)出語音。因此, 在第一以及第二振動膜12、 22之間,用戶的語音大幅度衰減,所以在第一 以及第二電壓信號所包含的用戶語音的強度之間出現(xiàn)差異。相反地,噪音成 分與用戶的語音相比其聲源較遠(yuǎn),因此在第一以及第二振動膜12、 22之間 幾乎不發(fā)生衰減。因此,可以認(rèn)為在第一以及第二電壓信號所包含的噪音的 強度中不出現(xiàn)差異。從上述可知,若檢測出第一以及第二電壓信號之差,則 能夠消除噪音,因此能夠取得不含有噪音成分的、僅表示用戶的語音成分的 電壓信號(差分信號)。即,能夠?qū)⒉罘中盘栆暈楸硎驹胍舫煞直蝗コ挠脩粽Z音的信號。
其中,聲波具有相位成分。因此,要實現(xiàn)可靠性高的噪音去除功能,則 需要考慮在第一以及第二電壓信號中含有的語音成分以及噪音成分的相位 差。
下面,說明語音輸入裝置為了通過生成差分信號來實現(xiàn)噪音去除功能而 應(yīng)滿足的具體條件。
(2)語音輸入裝置應(yīng)滿足的具體條件
如前面所述,本實施方式的語音輸入裝置將表示第一以及第二電壓信號 的差分的差分信號視為不包含噪音的輸入語音信號。在采用該語音輸入裝置 的情況下,若包含在差分信號中的噪音成分小于包含在第一或第二電壓信號 中的噪音成分,則能夠評價為實現(xiàn)了噪音去除功能。詳細(xì)地說,若表示包含 在差分信號中的噪音成分的強度相對包含在第一或第二電壓信號中的噪音 成分的強度的比的噪音強度比,小于表示包含在差分信號中的語音成分的強 度相對包含在第一或第二電壓信號中的語音成分的強度的比的語音強度比, 則能夠評價為實現(xiàn)了該噪音去除功能。
下面,說明語音輸入裝置(第一以及第二振動膜12、 22)為了實現(xiàn)該噪 音去除功能而應(yīng)滿足的具體條件。
首先,研究向第一以及第二麥克風(fēng)10、 20 (第一以及第二振動膜12、 22)入射的語音的聲壓。設(shè)從輸入語音(用戶的語音)的聲源到第一振動膜 12的距離為R,而且忽略相位差,那么可以將第一以及第二麥克風(fēng)10、 20 可取得的輸入語音的聲壓(強度)P (Sl)以及P (S2)表示為
<formula>formula see original document page 25</formula>
因此,可以將語音強度比p (p)表示為,)-尸卿 =丄 (4)
所述語音強度比p (p)是指,表示包含在差分信號中的輸入語音成分的強度 相對忽略了輸入語音的相位差時的第一麥克風(fēng)10所取得的輸入語音成分的 強度的比例。
在此,本實施方式的語音輸入裝置是近講式的語音輸入裝置,可以認(rèn)為 Ar足夠小于R。
因此,可以將上述式(4)變形為
艮P,從上述可知,在忽略了輸入語音的相位差的情況下,能夠?qū)⒄Z音強 度比表示為式(A)。
然而,當(dāng)考慮輸入語音的相位差時,可以將用戶語音的聲壓Q (Sl)以 及Q (S2)表示為
2CS"l)-〖丄sin必/ (5)
2GS2)-^:~^~sin(W-a) (6) 、 及+ Ar
此外,在式中,a是相位差。
此時,語音強度比p (S)為:
順=
l,L
—sin欣--sin(欣一 or)
及
(7)
-sin欣
26當(dāng)考慮式(7)時,可以將語音強度比p (S)的大小表示為:
<formula>formula see original document page 27</formula>
在式(8)中,sincot-sin (cot-a)項表示相位成分的強度比,Ar/Rsinot 項表示振幅成分的強度比。即使是輸入語音成分,但相位差成分對于振幅成 分來說是噪聲,因此為了高精度地提取輸入語音(用戶語音),必須使相位 成分的強度比足夠小于振幅成分的強度比。即,sina)t-sin(cot-a)禾口Ar/Rsino)t 需要滿足如下關(guān)系
<formula>formula see original document page 27</formula>
其中,
<formula>formula see original document page 27</formula> (9)
因此,可以將上述式(B)表示為:<formula>formula see original document page 27</formula>
從上述可知,若考慮式(10)的振幅成分,則本實施方式的語音輸入裝 置需要滿足如下公式
<formula>formula see original document page 27</formula>此外,如上所述,可以認(rèn)為Ar足夠小于R,所以可以認(rèn)為sin (a/2)足 夠小,因此可以將其近似為
sin—(11) 2 2
因此,可以將式(C)變形為: 》 (D)
另外,若將作為相位差的a和Ar之間的關(guān)系表示為如下公式: 2* 罪
乂
則,可以將式(D)變形為:
—>2;r—>— (五) i 義 義
艮口,在本實施方式中,為了高精度地提取輸入語音(用戶語音),需要 將語音輸入裝置制造成滿足式(E)所示的關(guān)系。
接著,研究向第一以及第二麥克風(fēng)10、 20 (第一以及第二振動膜12、 22)入射的噪音的聲壓。
若將第一以及第二麥克風(fēng)所取得的噪音成分的振幅設(shè)為A、 A',則可將 考慮了相位差成分的噪音的聲壓Q (Nl)以及Q (N2)表示為
g(M)"sin欲 (13) g(iV2)"'sin(必卜c0 (14)
可以將噪音強度比P (N)表示為:<formula>formula see original document page 29</formula>所述噪音強度比p (N)是指,表示包含在差分信號中的噪音成分的強度相 對第一麥克風(fēng)IO所取得的噪音成分的強度的比例。
此外,如前面所述,第一以及第二麥克風(fēng)所取得的噪音成分的振幅(強 度)大致相同,所以可以視為A二A'。因此,可以將上述式(15)變形為
|sin W — sin(Grf — a〕 岸)=--^ (16)
sin欣l
max
而且,可以將噪音強度比的大小表示為:
|sin紐一 sin(欣一 a) zW丄
I I max
二 |sin紐—sin(crf — )|證 (17) 在此,若考慮上述式(9),則可以將式(17)變形為:
, a、 cos(紐- J)
.2sin三 2
=2sin^ (18) 2
然后,若考慮式(11),則可以將式(18)變形為:
/7(i\0 = or (19)
在此,若參照式(D),則可以將噪音強度比表示為:此外,如式(A)所示,Ar/R是輸入語音(用戶語音)的振幅成分的強度比。 從式(F)可知,在該語音輸入裝置中,噪音強度比小于輸入語音的強度比 Ai7R。
從上述可知,在設(shè)計成輸入語音的相位成分的強度比小于振幅成分的強 度比的語音輸入裝置(參照式(B))中,噪音強度比小于輸入語音強度比 (參照式(F))。相反地,若采用設(shè)計成噪音強度比小于輸入語音強度比 的語音輸入裝置,則能夠?qū)崿F(xiàn)精度高的噪音去除功能。
艮P,若采用將第一以及第二振動膜12、 22 (第一以及第二麥克風(fēng)10、 20)配置成噪音強度比小于輸入語音強度比的本實施方式的語音輸入裝置, 則能夠?qū)崿F(xiàn)精度高的噪音去除功能。
3.語音輸入裝置的制造方法
下面,對本實施方式的語音輸入裝置的制造方法進行說明。在本實施方 式中,利用表示Ar從的值和噪音強度比(噪音的相位成分的強度比)之間的 對應(yīng)關(guān)系的數(shù)據(jù)來制造語音輸入裝置,其中,所述Ar/X的值表示第一以及第 二振動膜12、 22的中心間距離Ar和噪音的波長X的比率。
可以將噪音的相位成分的強度比表示為上述式(18)。因此,可以將噪 音的相位成分的強度比的分貝值表示為
<formula>formula see original document page 30</formula>
而且,對式(20)的a代入各值,則能夠明確相位差a和噪音的相位成 分的強度比之間的對應(yīng)關(guān)系。圖5示出了表示橫軸取a/2Ti、縱軸取噪音的相 位成分的強度比(分貝值)時的相位差和強度比之間的對應(yīng)關(guān)系的數(shù)據(jù)的一 例。
此外,如式(12)所示,能夠利用距離Ar和波長X的比Ar/人的函數(shù)來 表示相位差a,所以可以將圖5的橫軸視為Ar從。SP,可以說圖5是用于表示噪音的相位成分的強度比和Ar從之間的對應(yīng)關(guān)系的數(shù)據(jù)。
在本實施方式中,利用該數(shù)據(jù)來制造語音輸入裝置。圖6是用于說明利
用該數(shù)據(jù)來制造語音輸入裝置的步驟的流程圖。
首先,準(zhǔn)備表示噪音的強度比(噪音的相位成分的強度比)和Ar從之間
的對應(yīng)關(guān)系的數(shù)據(jù)(參照圖5)(步驟SIO)。
接著,根據(jù)用途,設(shè)定噪音的強度比(步驟S12)。此外,在本實施方
式中,需要以使噪音的強度下降的方式設(shè)定噪音的強度比。因此,在本步驟
中,將噪音的強度比設(shè)定為0dB以下。
接著,根據(jù)該數(shù)據(jù),推導(dǎo)與噪音的強度比對應(yīng)的Ar/人的值(步驟S14)。 然后,通過對入代入主要噪音的波長,推導(dǎo)Ar從應(yīng)滿足的條件(步驟
S16)。
作為具體例,考慮制造如下的語音輸入裝置的情況在該語音輸入裝置 中,在主要噪音為lkHz、其波長為0.347m的環(huán)境下,噪音的強度下降20dB。
首先,作為必要條件,研究使噪音的強度比變?yōu)镺dB以下的條件。參照 圖5可知,要使噪音的強度比變?yōu)镺dB以下,則將Ar/人的值設(shè)為0.16以下 即可。即,將Ar值設(shè)為55.46mm以下即可,這就是該語音輸入裝置的必要 條件。
接著,考慮用于使lkHz的噪音的強度下降20dB的條件。參照圖5可知, 要使噪音的強度下降20dB,只要將A流的值設(shè)為0.015即可。而且,若設(shè) X=0.347m,則當(dāng)Ar的值為5.20mm以下時滿足該條件。艮卩,若將Ar設(shè)定為 約5.2mm以下,則能夠制造具有噪音去除功能的近講式的語音輸入裝置。
此外,本實施方式的語音輸入裝置是近講式的語音輸入裝置,而且用戶 語音的聲源和第一或第二振動膜12、 22之間的間隔通常為5cm以下。另外, 可以通過對框體40的設(shè)計,能夠控制用戶語音的聲源和第一以及第二振動 膜12、 22之間的間隔。因此,輸入語音(用戶語音)的強度比Ar從的值大 于O.l (噪音的強度比),所以能夠?qū)崿F(xiàn)噪音去除功能。
此外,通常,噪音并不限定于單一頻率。但是,頻率比設(shè)想為主要噪音 的噪音低的噪音,其波長比該主要噪音更長,因此AiA的值變小,所以能夠 被該語音輸入裝置去除。另外,聲波若頻率越高則能量的衰減就越快。因此, 頻率比設(shè)想為主要噪音的噪音高的噪音比該主要噪音更快速地衰減,因此能夠忽略對語音輸入裝置所帶來的影響。從上述可知,即使在存在頻率與設(shè)想 為主要噪音的噪音不同的噪音的環(huán)境下,本實施方式的語音輸入裝置也能夠 發(fā)揮優(yōu)異的噪音去除功能。
另外,在本實施方式中,從式(12)也可以知道,本實施方式的前提為, 噪音沿著連接第一以及第二振動膜12、 22的直線上方入射。該噪音是使第 一以及第二振動膜12、 22的外觀上的間隔變得最大的噪音,而且是在現(xiàn)實 的使用環(huán)境下使相位差變得最大的噪音。即,本實施方式的語音輸入裝置具 有能夠去除相位差最大的噪音的結(jié)構(gòu)。因此,若采用本實施方式的語音輸入 裝置,則能夠去除從所有方向入射的噪音。
4.效果
下面,對本實施方式的語音輸入裝置的效果進行說明。
如前面所述,若采用本實施方式的語音輸入裝置,則僅通過生成差分信 號就能夠取得噪音成分被去除的語音成分,所述差分信號表示第一以及第二 麥克風(fēng)10、 20所取得的電壓信號的差分。gp,在該語音輸入裝置中,無需 進行復(fù)雜的解析運算處理就能夠?qū)崿F(xiàn)噪音去除功能。因此,根據(jù)本實施方式, 能夠提供以簡單的結(jié)構(gòu)就能夠?qū)崿F(xiàn)精度高的噪音去除功能的語音輸入裝置。
另外,在該語音輸入裝置中,使基于相位差的噪音的強度比小于輸入語 音的強度比,由此實現(xiàn)噪音去除功能。然而,基于相位差的噪音強度比會根 據(jù)第一以及第二振動膜12、 22的排列方向和噪音的入射方向而變化。艮口, 相對于噪音的第一以及第二振動膜12、 22之間的間隔(外觀上的間隔)越 寬,則噪音的相位差就越大,使基于相位差的噪音強度比變大。然而,在本 實施方式中,從式(12)也可知,語音輸入裝置具有能夠去除使第一以及第 二振動膜12、 22的外觀上的間隔變得最寬的噪音的結(jié)構(gòu)。換言之,在本實 施方式中,將第一以及第二振動膜12、 22配置成能夠去除使基于相位差的 噪音強度比變得最大地入射的噪音。因此,若采用該語音輸入裝置,就能夠 去除從全方位入射的噪音。即,根據(jù)本發(fā)明,能夠提供可去除從全方位入射 的噪音的語音輸入裝置。
此外,若采用該語音輸入裝置,還能夠去除被墻壁等反射后入射到語音 輸入裝置中的用戶語音成分。詳細(xì)地說,可以認(rèn)為被墻壁等反射的用戶語音的聲源比通常的用戶語音的聲源遠(yuǎn),并且因反射而丟失了大量的能量,因此
與噪音成分同樣,聲壓不會在第一以及第二振動膜12、 22之間大幅度衰減。 因此,若采用該語音輸入裝置,則與噪音同樣地,被墻壁等反射后入射到語 音輸入裝置中的用戶語音成分(作為噪音的一種)也被去除。
而且,若利用該語音輸入裝置,就能夠取得不包含噪音的表示輸入語音 的信號。因此,通過利用該語音輸入裝置,能夠?qū)崿F(xiàn)精度高的語音識別、語 音認(rèn)證或命令生成處理。
另外,若將該語音輸入裝置適用于麥克風(fēng)系統(tǒng),則從揚聲器輸出的用戶 的聲音也作為噪音而被去除。因此,能夠提供不易發(fā)生振鳴(howling)的麥 克風(fēng)系統(tǒng)。
5.第二實施方式的語音輸入裝置
接著,參照圖7,對應(yīng)用了本發(fā)明的第二實施方式的語音輸入裝置進行 說明。
本實施方式的語音輸入裝置包括基部70。在基部70的主面72上形成有 凹部74。而且,在本實施方式的語音輸入裝置中,在凹部74的底面75上配 置有第一振動膜12 (第一麥克風(fēng)10),在基部70的主面72上配置有第二 振動膜22 (第二麥克風(fēng)20)。此外,凹部74可以與主面72垂直地延伸, 凹部74的底面75可以是與主面72平行的面。底面75也可以是與凹部74 垂直的面。另外,凹部74也可以具有與第一振動膜12相同的外形。
在本實施方式中,凹部74可以比區(qū)域76和開口 78之間的間隔更淺。 即,若將凹部74的深度設(shè)為d,將區(qū)域76和開口 78之間的間隔設(shè)為AG, 則基部70可以滿足d《AG?;?0也可以滿足2d:AG。此外,AG可以 是5.2mm以下?;蛘?,基部70也可以具有連接第一以及第二振動膜12、 22 的中心的直線距離為5.2mm以下的結(jié)構(gòu)。
基部70被設(shè)置成與凹部74連通的開口 78配置在比主面72上配置第 二振動膜22的區(qū)域76更靠近輸入語音的聲源的位置?;?0可以被設(shè)置 成輸入語音同時到達(dá)第一以及第二振動膜12、 22。例如,基部70可以被配 置成使輸入語音的聲源(模型聲源)和第一振動膜12之間的間隔與模型聲 源和第二振動膜22之間的間隔相同?;?0也可以被設(shè)置在設(shè)定有滿足上述條件的基本姿勢的框體內(nèi)。
若采用本實施方式的語音輸入裝置,則能夠減少向第一以及第二振動膜
12、 22入射的輸入語音(用戶語音)的入射時間之差。即,由于能夠以不包 含輸入語音的相位差成分的方式生成差分信號,所以能夠高精度地提取輸入 語音的振幅成分。
iCL5T,尸議住Uil都/4 K^M、" BX, 兇ifL尸議tfJ,i隅乂L丁/l、豕"g)C。兇卩L,
在該語音輸入裝置中,可以認(rèn)為使第一振動膜12振動的輸入語音的強度(振 幅)與開口 78處的輸入語音的強度相同。由此,即使在語音輸入裝置具有 使輸入語音同時到達(dá)第一以及第二振動膜12、 22的情況下,也會在使第一 以及第二振動膜12、 22振動的輸入語音的強度上出現(xiàn)差異。因此,通過取
得表示第一 以及第二電壓信號之差的差分信號,能夠提取輸入語音。
綜上所述,若采用該語音輸入裝置,則能夠以不包含輸入語音的相位差 成分的噪聲的方式取得輸入語音的振幅成分(差分信號)。因此,能夠?qū)崿F(xiàn) 精度高的噪音去除功能。
此外,通過將凹部74的深度設(shè)為AG以下(5.2mm以下),能夠?qū)?部74的共振頻率設(shè)定得較高,因此能夠防止在凹部74處產(chǎn)生共振噪聲。 圖8示出了本實施方式的語音輸入裝置的變形例。
本實施方式的語音輸入裝置包括基部80。在基部80的主面82上,形成 有第一凹部84以及比第一凹部84淺的第二凹部86。第一以及第二凹部84、 86的深度之差A(yù)d可以小于與第一凹部84連通的第一開口 85和與第二凹部 86連通的第二開口 87之間的間隔AG。而且,第一振動膜12配置在第一凹 部84的底面,第二振動膜22配置在第二凹部86的底面。
即使采用該語音輸入裝置,也可以發(fā)揮與上述同樣的效果,因此能夠?qū)?現(xiàn)高精度的噪音去除功能。
最后,在圖9 圖11中,作為本發(fā)明實施方式的語音輸入裝置的例子, 分別表示移動電話機300、麥克風(fēng)(麥克風(fēng)系統(tǒng))400以及遙控器500。另外, 圖12示出了包括作為信息輸入終端的語音輸入裝置602和主計算機604的 信息處理系統(tǒng)600的概略圖。
6.第三實施方式的語音輸入裝置的結(jié)構(gòu)圖13是第三實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 第三實施方式的語音輸入裝置700包括具有第一振動膜的第一麥克風(fēng)
710-1。另外,第三實施方式的語音輸入裝置700包括具有第二振動膜的第二
麥克風(fēng)710-2。
第一麥克風(fēng)710-1的第一振動膜以及第二麥克風(fēng)710-2的第一振動膜被 配置成噪音強度比小于輸入語音強度比,其中,所述噪音強度比表示包含在 差分信號742中的噪音成分的強度相對包含在所述第一或第二電壓信號 712-1、 712-2中的所述噪音成分的強度的比例,所述輸入語音強度比表示包 含在所述差分信號742中的輸入語音成分的強度相對包含在所述第一或第二 電壓信號中的所述輸入語音成分的強度的比例。
另外,具有第一振動膜的第一麥克風(fēng)710-1和具有第二振動膜的第二麥 克風(fēng)710-2,也可以具有如圖1 圖8所述的結(jié)構(gòu)。
第三實施方式的語音輸入裝置700包括差分信號生成部720,該差分信 號生成部720根據(jù)所述第一麥克風(fēng)710-1所取得的第一電壓信號712-1和所 述第二麥克風(fēng)所取得的第二電壓信號712-2,生成第一電壓信號712-1和第 二電壓信號712-2的差分信號742。
另外,差分信號生成部720包括延遲部730。延遲部730對在所述第一 麥克風(fēng)所取得的第一電壓信號712-1以及所述第二麥克風(fēng)所取得的第二電壓 信號712-2中的至少一個電壓信號賦予規(guī)定延遲后輸出。
另外,差分信號生成部720包括差分信號輸出部740。差分信號輸出部 740接收通過所述延遲部對在所述第一麥克風(fēng)所取得的第一電壓信號以及所 述第二麥克風(fēng)所取得的第二電壓信號中的至少一個電壓信號賦予了延遲的 信號,生成第一電壓信號和第二電壓信號的差分信號并進行輸出。
延遲部730可以設(shè)置對第一麥克風(fēng)所取得的第一電壓信號712-1賦予規(guī) 定延遲后輸出的第一延遲部732-1和對第二電壓信號712-2賦予規(guī)定延遲后 輸出的第二延遲部782-2中的某一個,使某一個電壓信號發(fā)生延遲,從而生 成差分信號。也可以設(shè)置第一延遲部732-1和第二延遲部732-2兩者,使第 一電壓信號712-1和第二電壓信號712-2兩者發(fā)生延遲,從而生成差分信號。 當(dāng)設(shè)置第一延遲部732-1和第二延遲部732-2的兩者時,可以將其中某一個 延遲部作為賦予固定延遲的延遲部,將另一個延遲部作為能夠可變地調(diào)整延遲的可變延遲部。
由此,通過對第一電壓信號712-1以及第二電壓信號712-2中的至少一 個電壓信號賦予規(guī)定延遲,能夠校正由制造麥克風(fēng)時的個體差引起的、第一 電壓信號以及第二電壓信號的延遲的偏差,因此能夠防止因第一電壓信號以 及第二電壓信號的延遲的偏差而導(dǎo)致的噪聲抑制效果下降。
図疋先二大鵬刀工、tm百百柳八農(nóng)且口、j殆T厶j口、j一'i那、j小思図。
本實施方式的差分信號生成部720可以包括延遲控制部734。延遲控制 部734進行使延遲部(在此為第一延遲部732-1)中的延遲量變化的控制。 也可以通過延遲控制部734動態(tài)或者靜態(tài)地控制延遲部(在此為第一延遲部 732-1)的延遲量,由此調(diào)整延遲部輸出Sl和所述第二麥克風(fēng)所取得的第二 電壓信號712-2之間的信號延遲平衡。
圖15是延遲部和延遲控制部的具體結(jié)構(gòu)的一例的示意圖。例如,可以 由群延遲濾波器等模擬濾波器構(gòu)成延遲部(在此為第一延遲部732-1)。例 如,延遲控制部734可以根據(jù)群延遲濾波器732-1的控制端子736-GND之間 的電壓或流過控制端子736-GND之間的電流量,動態(tài)或靜態(tài)地控制群延遲 濾波器的延遲量。
圖16A (圖16B)是靜態(tài)地控制群延遲濾波器的延遲量的結(jié)構(gòu)的一例。 例如,如圖16A所示,可以包括串聯(lián)連接有多個電阻體(r)的電阻陣 列,并通過該電阻陣列向延遲部的規(guī)定的端子(圖15的控制端子734)供給 規(guī)定大小的電流。在此,在制造過程中,可以根據(jù)規(guī)定電流的大小,禾l」用激 光來剪切構(gòu)成所述電阻陣列的電阻體(r)或?qū)w(738的F),或者,通過 施加高電壓或者高電流來熔斷構(gòu)成所述電阻陣列的電阻體(r)或?qū)w(738 的F)。
另外,例如,如圖16B所示,可以包括并聯(lián)連接有多個電阻體(r)的 電阻陣列,并通過該電阻陣列向延遲部的規(guī)定的端子(圖15的控制端子734) 供給規(guī)定大小的電流。在此,在制造過程中,可以根據(jù)規(guī)定電流的大小,利 用激光來剪切構(gòu)成所述電阻陣列的電阻體(r)或?qū)w(F),或者,通過施 加高電壓或者高電流來熔斷構(gòu)成所述電阻陣列的電阻體(r)或?qū)w(F)。
在此,根據(jù)在制造過程中產(chǎn)生的延遲的偏差,將流過延遲部的規(guī)定的端 子的電流的大小設(shè)定為能夠消除該偏差的值即可。如圖16A (圖16B)所示,通過利用串聯(lián)或并聯(lián)連接有多個電阻體(r)的電阻陣列,能夠制作成與在制 造過程中產(chǎn)生的延遲的偏差對應(yīng)的電阻值,發(fā)揮延遲控制部的功能,該延遲 控制部與規(guī)定的端子連接,供給用于控制所述延遲部的延遲量的電流。
此外,在上述實施方式中,舉例說明了多個電阻體(r)通過熔絲(F) 來連接在一起的結(jié)構(gòu),但是并不限定于此。也可以采用多個電阻(r)不通過
UV /,力 /"、T"TT X^r r4t Tr乂~P> TTiA 、U^V上"/丄丄A,l,-rr_L "rrT , 、 r I m .l、 人 r/rt
殆g 、u 11U且伎甲狀現(xiàn)升狀:i^伎tfJ5Bf厶j, jfl:n、j, Ki wvj斷王,一"r屯阻。
另外,也可以采用所謂的激光微調(diào)來調(diào)整電阻值的結(jié)構(gòu),例如,如圖40 所示,由一個電阻體構(gòu)成圖33的電阻R1或R2,并切斷電阻體的一部分的 結(jié)構(gòu)。
圖17是第三實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
差分信號生成部720可以包括相位差檢測部750。相位差檢測部750接 收成為差分信號輸出部740的輸入的第一電壓信號(Sl)和第二電壓信號 (S2),并根據(jù)接收到的第一電壓信號(Sl)和第二電壓信號(S2),檢測 生成差分信號742時的第一電壓信號(Sl)和第二電壓信號(S2)的相位差, 并根據(jù)檢測結(jié)果,生成并輸出相位差信號(FD)。
延遲控制部734根據(jù)相位差信號(FD),可以改變延遲部(在此為第一 延遲部732-1)中的延遲量。
另外,差分信號生成部720可以包括增益部760。增益部760對在第一 麥克風(fēng)710-1所取得的第一電壓信號以及所述第二麥克風(fēng)710-2所取得的第 二電壓信號中的至少一個電壓信號賦予規(guī)定增益后輸出。
差分信號輸出部740可以通過接收由增益部760對在第一麥克風(fēng)710-1 所取得的第一電壓信號以及所述第二麥克風(fēng)710-2所取得的第二電壓信號中 的至少一個電壓信號賦予了增益的信號(S2),生成并輸出第一電壓信號(S1) 和第二電壓信號(S2)的差分信號。
例如,相位差檢測部740可以對延遲部(在此為第一延遲部732-1)輸 出Sl和增益部輸出S2的相位差進行運算后輸出相位差信號FD,延遲控制 部734可以根據(jù)相位差信號FD的極性,使延遲部(在此為第一延遲部732-1 ) 的延遲量動態(tài)地發(fā)生變化。
第一延遲部732-1接收第一麥克風(fēng)710-1所取得的第一電壓信號712-1, 輸出根據(jù)延遲控制信號(例如,規(guī)定電流)735來賦予了規(guī)定的延遲的電壓信號Sl。增益部760接收第二麥克風(fēng)710-2所取得的第二電壓信號712-2, 輸出賦予了規(guī)定的增益的電壓信號S2。相位差信號輸出部754接收第一延遲 部732-1所輸出的電壓信號Sl和增益部760所輸出的電壓信號S2,輸出相 位差信號FD。延遲控制部734接收相位差信號輸出部754所輸出的相位差 信號FD,輸出延遲控制信號(例如,規(guī)定電流)735??梢酝ㄟ^該延遲控制 '舊7 、"'J3UJ, 7jAl疋fBWL乂 /:o木:T^帀'j鄰一処Jii部/jz畫i tf、j処J^i里,出KL"j鄰 一延遲部732-1的延遲量進行反饋控制。
圖18是第三實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
相位差檢測部720可以包括第一 2值化部752-1。第一 2值化部752-1 以規(guī)定電平(level)對接收到的所述第一電壓信號Sl進行2值化,從而轉(zhuǎn) 換為第一數(shù)字信號D1。
另外,相位差檢測部720可以包括第二2值化部752-2。第二 2值化部 752-2以規(guī)定電平對接收到的所述第二電壓信號S2進行2值化,從而轉(zhuǎn)換為 第二數(shù)字信號D2。
相位差檢測部720包括相位差信號輸出部754。相位差信號輸出部754 計算第一數(shù)字信號Dl和所述第二數(shù)字信號D2之間的相位差,從而輸出相 位差信號FD。
第一延遲部732-1接收第一麥克風(fēng)710-1所取得的第一電壓信號712-1, 并輸出根據(jù)延遲控制信號(例如,規(guī)定電流)735來賦予了規(guī)定的延遲的信 號S1。增益部760接收第二麥克風(fēng)710-2所取得的第二電壓信號712-2,并 輸出賦予了規(guī)定的增益的信號S2。第一 2值化部752-1接收第一延遲部732-1 所輸出的第一電壓信號Sl,并輸出以規(guī)定電平進行了 2值化的第一數(shù)字信號 Dl。第二 2值化部752-2接收增益部760所輸出的第二電壓信號S2,并輸出 以規(guī)定電平進行了 2值化的第二數(shù)字信號D2。相位差信號輸出部754接收 第一 2值化部752-1所輸出的第一數(shù)字信號Dl和第二 2值化部752-2所輸出 的第二數(shù)字信號D2,并輸出相位差信號FD。延遲控制部734接收相位差信 號輸出部754所輸出的相位差信號FD,輸出延遲控制信號(例如,規(guī)定電 流)735??梢酝ㄟ^該延遲控制信號(例如,規(guī)定電流)735來控制第一延遲 部732-1的延遲量,由此進行對第一延遲部732-1進行延遲量的反饋控制。
圖19是相位差檢測部的時序圖。Sl是第一延遲部732-1所輸出的電壓 信號,S2是增益部所輸出的電壓信號。電壓信號S2相對于電壓信號S1,相 位延遲了A())。
Dl是電壓信號Sl的2值化信號,D2是電壓信號S2的2值化信號。例 如,Dl或D2的信號是,在使電壓信號Sl或S2通過高通濾波器后,通過比 較器(comparator)電路進行2值化所得到的信號。
FD是根據(jù)2值化信號Dl和2值化信號D2所生成的相位差信號。例如, 如圖19所示,當(dāng)?shù)谝浑妷盒盘柕南辔槐鹊诙妷盒盘柕南辔怀皶r,可以 對各周期分別生成與超前相位差對應(yīng)的脈沖寬度的正脈沖P,當(dāng)?shù)谝浑妷盒?號的相位比第二電壓信號的相位滯后時,可以對各周期分別生成與滯后相位 差對應(yīng)的脈沖寬度的負(fù)脈沖。
圖21是第三實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
相位差檢測部750包括第一帶通濾波器756-1。第一帶通濾波器756-1 是,在輸入所接收到的第一電壓信號S1后,使規(guī)定的單一頻率的信號K1通 過的帶通濾波器。
相位差檢測部750包括第二帶通濾波器756-2。第二帶通濾波器756-2 是,在輸入所接收到的第二電壓信號S2后,使規(guī)定的單一頻率的信號K2通 過的帶通濾波器。
相位差檢測部750可以根據(jù)通過了第一帶通濾波器756-1以及第二帶通 濾波器756-2后的第一電壓信號Kl和第二電壓信號K2來檢測相位差。
例如,如圖20所示,將聲源部770配置在離第一麥克風(fēng)710-1和第二麥 克風(fēng)710-2等距離的位置,生成單一頻率的聲音并接收該聲音,在利用第一 帶通濾波器756-1和第二帶通濾波器756-2來切斷除了該單一頻率的聲音以 外的頻率的聲音之后,檢測相位差,由此能夠改善相位比較信號的SN比, 從而能夠高精度地檢測相位差或延遲量。
此外,即使在語音輸入裝置本身不具有聲源部770的情況下,也可以在 測試時將測試用聲源臨時設(shè)置在語音輸入裝置的附近,并將測試用聲源設(shè)定 為使聲音以相同相位輸入至第一麥克風(fēng)和第二麥克風(fēng),并通過第一麥克風(fēng)和 第二麥克風(fēng)接收聲音,對所輸出的第一電壓信號和第二電壓信號的波形進行監(jiān)測并變更延遲部的延遲量,使得第一電壓信號和第二電壓信號兩者的相位 一致。
第一延遲部732-1接收第一麥克風(fēng)710-1所取得的第一電壓信號712-1, 輸出按照延遲控制信號(例如,規(guī)定電流)735賦予了規(guī)定的延遲的信號Sl。 增益部760接收第二麥克風(fēng)710-2所取得的第二電壓信號712-2,輸出賦予 了規(guī)定的增益的信號S2。第一帶通濾波器756-1接收第一延遲部732-1所輸 出的第一電壓信號S1,輸出單一頻率的信號K1。第二帶通濾波器756-2接 收增益部760所輸出的第二電壓信號S2,輸出單一頻率的信號K2。第一2 值化部752-1接收第一帶通濾波器756-1所輸出的單一頻率的信號K1,輸出 以規(guī)定電平進行了 2值化的第一數(shù)字信號Dl 。第二 2值化部752-2接收第二 帶通濾波器756-2所輸出的單一頻率的信號K2,輸出以規(guī)定電平進行了 2 值化的第二數(shù)字信號D2。相位差信號輸出部754接收第一 2值化部752-1 所輸出的第一數(shù)字信號Dl和第二 2值化部752-2所輸出的第二數(shù)字信號D2, 輸出相位差信號FD。延遲控制部734接收相位差信號輸出部754所輸出的 相位差信號FD,輸出延遲控制信號(例如,規(guī)定電流)735。可以通過該延 遲控制信號(例如,規(guī)定電流)735來控制第一延遲部732-1的延遲量,由 此對第一延遲部732-1的延遲量進行反饋控制。
圖22A (圖22B)是差動麥克風(fēng)的指向性的說明圖。
圖22A表示在兩個麥克風(fēng)Ml、 M2的相位未發(fā)生偏移的狀態(tài)下的指向 特性。圓狀的區(qū)域810-1和810-2表示根據(jù)兩個麥克風(fēng)M1、 M2的輸出的差 分來得到的指向特性,該指向特性表示雙指向性,既,假設(shè)連接兩個麥克風(fēng) Ml、 M2的直線方向為0度、180度,與連接兩個麥克風(fēng)M1、 M2的直線方 向垂直的方向設(shè)為90度、270度,則在0度、180度方向上具有最大感度, 在90度、270度方向上不具有感度。
當(dāng)對兩個麥克風(fēng)M1、 M2所取得的信號中的一個信號賦予了延遲時,指 向特性發(fā)生變化。例如,當(dāng)對于麥克風(fēng)M1的輸出,賦予了相當(dāng)于將麥克風(fēng) 間隔d除以音速C而得的時間的延遲時,表示兩個麥克風(fēng)M1、 M2的指向 性的區(qū)域變成圖22B的820所示的心形。在這種情況下,能夠?qū)崿F(xiàn)對于0度 的說話者方向不具有感度(無效(null))的指向特性,所以能夠選擇性地 遮斷說話者的語音,從而能夠僅獲取周圍的聲音(周圍的噪音)。利用上述特性,能夠檢測周圍的噪音電平(level)的狀態(tài)。
圖23是具有噪聲檢測單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
本實施方式的語音輸入裝置包括噪聲檢測用延遲部780。噪聲檢測用延 遲部780對第二麥克風(fēng)710-2所取得的第二電壓信號712-2賦予噪聲檢測用 的延遲后將其輸出。
本實施方式的語音輸入裝置包括噪聲檢測用差分信號生成部782。噪聲 檢測用差分信號生成部782生成噪聲檢測用的差分信號783,該差分信號783 表示噪聲檢測用延遲部780賦予了噪聲檢測用的規(guī)定延遲的信號781和所述 第一麥克風(fēng)710-1所取得的第一電壓信號712-1之差。
本實施方式的語音輸入裝置包括噪聲檢測部784。噪聲檢測部784根據(jù) 噪聲檢測用的差分信號783來判斷噪聲的電平,并根據(jù)判斷結(jié)果來輸出噪聲 檢測信號785。噪聲檢測部784也可以計算出噪聲檢測用的差分信號的平均 電平,并根據(jù)平均電平來生成噪聲檢測用的差分信號785。
本實施方式的語音輸入裝置包括信號切換部786。信號切換部786接收 差分信號生成部720所輸出的差分信號742和所述第一麥克風(fēng)所取得的第一 電壓信號712-1,并根據(jù)所述噪聲檢測信號785來切換輸出第一電壓信號 712-1和所述差分信號742。信號切換部786可以在噪聲電平為規(guī)定電平以下 時,輸出所述第一麥克風(fēng)所取得的第一電壓信號,在所述平均電平大于規(guī)定 電平時輸出差分信號。這樣,在安靜的環(huán)境(噪聲電平為規(guī)定電平以下)下, 輸出SNR (Signal to Noise Ratio: SN比,信噪比)良好的單一麥克風(fēng)所獲取 的聲音。另外,在高噪音的環(huán)境(噪聲電平為規(guī)定電平以上)下,輸出噪音 去除性能良好的差動麥克風(fēng)所獲取的聲音。
在此,差分信號生成部可以具有在圖13、圖14、圖17、圖18、圖21 中說明的結(jié)構(gòu),也可以具有眾所周知的一般的差動麥克風(fēng)的結(jié)構(gòu)。另外,第 一麥克風(fēng)710-1的第一振動膜和第二麥克風(fēng)710-1的第二振動膜可以具有被 配置成噪音強度比小于輸入語音強度比的結(jié)構(gòu),但也可以具有沒有這樣的限 定的其他結(jié)構(gòu),其中,所述噪音強度比表示包含在所述差分信號742中的噪 音成分的強度相對包含在所述第一或第二電壓信號中的所述噪音成分的強 度的比例,所述輸入語音強度比表示包含在所述差分信號中的輸入語音成分 的強度相對包含在所述第一或第二電壓信號中的所述輸入語音成分的強度的比例。
另外,所述噪聲檢測用的延遲也可以不是將第一以及第二振動膜的中心
間距離(參照圖20中的d)除以音速所得的時間。即使在說話者的方向不是 0度方向的情況下,只要能夠?qū)⒅赶蛱匦缘牟痪哂懈卸鹊姆较?無效)設(shè)定 在說話者方向上,就能夠?qū)崿F(xiàn)適于具有遮斷說話者語音而拾取周圍噪音的指 向性的噪聲檢測的特性。例如,也可以將延遲設(shè)定為具有高心形 (hypercardioid)、超心形(supercardioid)的指向特性,從而遮斷說話者語 音
差分信號生成部720接收第一麥克風(fēng)710-1所取得的第一電壓信號712-1 和第二麥克風(fēng)710-2所取得的第二電壓信號712-2,生成并輸出差分信號742。
噪聲檢測用延遲部780接收第二麥克風(fēng)710-2所取得的第二電壓信號 712-2,并輸出賦予了噪聲檢測用的延遲的信號781。噪聲檢測用差分信號生 成部782生成并輸出噪聲檢測用的差分信號783,該差分信號783表示噪聲 檢測用延遲部780賦予了噪聲檢測用的規(guī)定延遲的信號781和所述第一麥克 風(fēng)710-1所取得的第一電壓信號712-1之差。噪聲檢測部784接收噪聲檢測 用的差分信號783,根據(jù)噪聲檢測用的差分信號783來判斷噪聲的電平,并 根據(jù)判斷結(jié)果來輸出噪聲檢測信號785。
信號切換部786接收差分信號生成部720所輸出的差分信號742、所述 第一麥克風(fēng)所取得的第一電壓信號712-1以及噪聲檢測信號785,并根據(jù)噪 聲檢測信號785來切換輸出第一電壓信號712-1和所述差分信號742。
圖24是表示通過噪聲檢測來進行的信號切換動作的例子的流程圖。
當(dāng)噪聲檢測部所輸出的噪聲檢測信號小于規(guī)定的閾值(LTH)時(步驟 S120),信號切換部輸出單一麥克風(fēng)的信號(步驟S112),當(dāng)噪聲檢測部所 輸出的噪聲檢測信號不小于規(guī)定的閾值(LTH)時(步驟SllO),信號切換 部輸出差動麥克風(fēng)的信號(步驟S114)。
此外,具有用于輸出聲音信息的揚聲器的語音輸入裝置,也可以包括根 據(jù)噪聲檢測信號來控制揚聲器的音量的音量控制部。
圖25是表示通過噪聲檢測來進行的揚聲器的音量控制動作的例子的流 程圖。
當(dāng)噪聲檢測部所輸出的噪聲檢測信號小于規(guī)定的閾值(LTH)時(步驟120),將揚聲器的音量設(shè)定為第一值(步驟S122),當(dāng)噪聲檢測部所輸出 的噪聲檢測信號不小于規(guī)定的閾值(LTH)時(步驟S120),將揚聲器的音 量設(shè)定為第二值,第二值的音量大于第一值的音量(步驟S124)。
另外,也可以當(dāng)噪聲檢測部所輸出的噪聲檢測信號小于規(guī)定的閾值 (LTH)時,降低揚聲器的音量,當(dāng)噪聲檢測部所輸出的噪聲檢測信號不小 于規(guī)定的閾值(LTH)時,提高揚聲器的音量。
圖26是具有AD轉(zhuǎn)換單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 本實施方式的語音輸入裝置可以包括第一 AD轉(zhuǎn)換單元790-1 。第一 AD 轉(zhuǎn)換單元790-1對第一麥克風(fēng)710-1所取得的第一電壓信號712-1進行模擬/ ,字轉(zhuǎn)換。
本實施方式的語音輸入裝置可以包括第二 AD轉(zhuǎn)換單元790-2。第二 AD 轉(zhuǎn)換單元7卯-2對第二麥克風(fēng)710-2所取得的第二電壓信號712-2進行模擬/ 數(shù)字轉(zhuǎn)換。
本實施方式的語音輸入裝置包括差分信號生成部720。差分信號生成部 720可以根據(jù)通過第一 AD轉(zhuǎn)換單元790-1轉(zhuǎn)換成數(shù)字信號的所述第一電壓 信號782-1以及通過所述第二 AD轉(zhuǎn)換單元790-2轉(zhuǎn)換成數(shù)字信號的所述第 二電壓信號782-2,生成第一電壓信號和第二電壓信號的差分信號742。
在此,差分信號生成部720可以采用在圖13、圖14、圖17、圖18、圖 21中說明的結(jié)構(gòu)??梢詫⒉罘中盘柹刹?20的延遲設(shè)定為第一 AD轉(zhuǎn)換單 元7卯-l或第二 AD轉(zhuǎn)換單元790-2的模擬/數(shù)字轉(zhuǎn)換的轉(zhuǎn)換周期的整數(shù)倍。 這樣,延遲部通過觸發(fā)器(flip-flop)以數(shù)字方式使輸入信號偏移1時鐘(clock) 或數(shù)時鐘,由此能夠?qū)崿F(xiàn)延遲。
另外,可以將第一麥克風(fēng)710-1的第一振動膜和第二麥克風(fēng)710-2的第 二振動膜的中心間距離設(shè)定為對模擬/數(shù)字轉(zhuǎn)換的轉(zhuǎn)換周期乘以音速所得到 的值或其整數(shù)倍。
這樣,在噪聲檢測用延遲部中,通過使輸入電壓信號偏移n時鐘(n為 整數(shù))的簡單的動作,能夠高精度地實現(xiàn)適于拾取周圍噪聲的指向特性(例 如,心形)。
例如,當(dāng)進行模擬/數(shù)字轉(zhuǎn)換時的采樣頻率為44.1kHz時,第一和第二振 動膜的中心間距離約為7.7mm左右,當(dāng)采樣頻率為16kHz時,第一和第二振動膜的中心間距離約為21mm左右。
圖27是具有增益調(diào)整單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 本實施方式的語音輸入裝置的差分信號生成部720包括增益控制部910。 增益控制部910進行使增益部760中的放大率(增益)發(fā)生變化的控制。在 增益控制部910中,可以根據(jù)振幅差檢測部所輸出的振幅差信號AD,動態(tài) 地控制增益部760的放大率,由此調(diào)整第一麥克風(fēng)710-1所取得的第一電壓 信號712-1和第二麥克風(fēng)710-2所取得的第二電壓信號712-2之間的振幅的 平衡。
差分信號生成部720包括第一振幅檢測單元920-1。第一振幅檢測單元 >920-1檢測第一延遲部732-1的輸出信號Sl的振幅,輸出第一振幅信號Al。
差分信號生成部720包括第二振幅檢測單元920-2。第二振幅檢測單元 920-2檢測增益部760的輸出信號S2的振幅,輸出第二振幅信號A2。
差分信號生成部720包括振幅差檢測部930。振幅差檢測部930接收第 一振幅檢測單元920-1所輸出的第一振幅信號Al以及第二振幅檢測單元 920-2所輸出的第二振幅信號A2,求出它們之間的振幅差后輸出振幅差信號 AD??梢愿鶕?jù)振幅差信號AD來控制增益部760的增益,由此對增益部760 的增益進行反饋控制。
7.第四實施方式的語音輸入裝置的結(jié)構(gòu)
圖28、圖29是第四實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 第四實施方式的語音輸入裝置700包括具有第一振動膜的第一麥克風(fēng)
710-1。另外,第四實施方式的語音輸入裝置700包括具有第二振動膜的第二
麥克風(fēng)710-2。
第一麥克風(fēng)710-1的第一振動膜以及第二麥克風(fēng)710-2的第一振動膜被 配置成噪音強度比小于輸入語音強度比,其中,所述噪音強度比表示包含在 差分信號742中的噪音成分的強度相對包含在所述第一或第二電壓信號 712-1、 712-2中的所述噪音成分的強度的比例,所述輸入語音強度比表示包 含在所述差分信號742中的輸入語音成分的強度相對包含在所述第一或第二 電壓信號中的所述輸入語音成分的強度的比例。
另外,具有第一振動膜的第一麥克風(fēng)710-1和具有第二振動膜的第二麥克風(fēng)710-2,可以具有在圖1 圖8中所說明的結(jié)構(gòu)。
第四實施方式的語音輸入裝置700包括差分信號生成部720,該差分信 號生成部720根據(jù)所述第一麥克風(fēng)710-1所取得的第一電壓信號712-1和所 述第二麥克風(fēng)所取得的第二電壓信號712-2,生成第一電壓信號712-1和第 二電壓信號712-2的差分信號742。
另外,差分信號生成部720包括增益部760。增益部760以規(guī)定的增益 放大并輸出第一麥克風(fēng)710-1所取得的第一電壓信號712-1。
另外,差分信號生成部720包括差分信號輸出部740。差分信號輸出部 740接收增益部760以規(guī)定的增益放大的第一電壓信號Sl和所述第二麥克風(fēng) 所取得的第二電壓信號,生成并輸出以規(guī)定的增益放大的第一電壓信號Sl 和第二電壓信號的差分信號。
通過以規(guī)定的增益放大第一電壓信號712-1 (意味著包括提高增益的情 況和降低增益的情況),能夠?qū)⑵湫U秊榈谝浑妷盒盘柡偷诙妷盒盘柕恼?幅差為零,因此能夠防止差動麥克風(fēng)的噪聲抑制效果由于因制造偏差等引起 的兩個麥克風(fēng)間的感度差而劣化。
圖30、圖31是第四實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
本實施方式的差分信號生成部720可以包括增益控制部910。增益控制 部910進行使增益部760中的增益發(fā)生變化的控制。在增益控制部910中, 可以通過動態(tài)或靜態(tài)地控制增益部760的增益,調(diào)整增益部輸出Sl和所述 第二麥克風(fēng)所取得的第二電壓信號712-2之間的振幅的平衡。
圖32是增益部和增益控制部的具體結(jié)構(gòu)的一例的示意圖。例如,當(dāng)對 模擬信號進行處理時,可以由運算放大器(op amp)(例如,如圖32所示 的非翻轉(zhuǎn)放大電路)等模擬電路構(gòu)成增益部760??梢酝ㄟ^變更電阻R1、 R2 的值,或者例如在制造時將電阻R1、 R2的值微調(diào)設(shè)定為規(guī)定的值,來動態(tài) 或靜態(tài)地控制施加在運算放大器的一端子上的電壓,由此控制運算放大器的 放大率。
圖33A (圖33B)是靜態(tài)地控制增益部的放大率的結(jié)構(gòu)的一例。 例如,圖32的電阻R1或R2包括如圖33A所示那樣串聯(lián)連接有多個電 阻的電阻陣列,可以經(jīng)由該電阻陣列對增益部的規(guī)定的端子(圖32的一端 子)施加規(guī)定大小的電壓??梢郧蟪鲞m當(dāng)?shù)姆糯舐?,并在制造過程中,通過激光來剪切構(gòu)成所述電阻陣列的電阻體(r)或?qū)w(912的F),或者,通 過施加高電壓或者高電流來熔斷構(gòu)成所述電阻陣列的電阻體(r)或?qū)w(912 的F),使得所述電阻R1或R2取用于實現(xiàn)該放大率的電阻值。
另外,例如,也可以將圖32的電阻R1或R2構(gòu)成為包括如圖33所示 地并聯(lián)連接有多個電阻的電阻陣列,并經(jīng)由該電阻陣列對增益部的規(guī)定的端 子(圖32的一端子)施加規(guī)定大小的電壓??梢郧蟪鲞m當(dāng)?shù)姆糯舐?,并?制造過程中,通過激光來剪切構(gòu)成所述電阻陣列的電阻體(r)或?qū)w(912 的F),或者,通過施加高電壓或者高電流來熔斷構(gòu)成所述電阻陣列的電阻 體(r)或?qū)w(912的F),使得所述電阻R1或R2取用于實現(xiàn)該放大率的 電阻值。
在此,將適當(dāng)?shù)姆糯笾翟O(shè)定為能夠消除在制造工序中產(chǎn)生的麥克風(fēng)的增 益平衡的值即可。通過利用如圖33A (圖33B)所示地串聯(lián)或并聯(lián)連接有多 個電阻的電阻陣列,能夠做成與在制造工序中產(chǎn)生的麥克風(fēng)的增益平衡對應(yīng) 的電阻值,從而能夠發(fā)揮增益控制部的功能,該增益控制部與規(guī)定的端子連 接,用于控制所述增益部的增益。
此外,在上述實施方式中,舉例說明了多個電阻體(r)通過熔絲(F) 連接在一起的結(jié)構(gòu),但并不限定于此。也可以采用多個電阻(r)不通過熔絲 (F)而直接串聯(lián)或并聯(lián)連接的結(jié)構(gòu),此時,可以切斷至少一個電阻。
另外,也可以采用所謂的激光微調(diào)來調(diào)整電阻值的結(jié)構(gòu),例如,如圖40 所示,由一個電阻體構(gòu)成圖33的電阻R1或R2,并切斷電阻體的一部分的 結(jié)構(gòu)。
圖34是第四實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 差分信號生成部720可以包括振幅差檢測部940。振幅差檢測部940接
收成為差分信號輸出部740的輸入的第一電壓信號(Sl)和第二電壓信號 (S2),并根據(jù)接收到的第一電壓信號(Sl)和第二電壓信號(S2),檢測
生成差分信號742時的第一電壓信號(Sl)和第二電壓信號(S2)的振幅差,
并根據(jù)檢測結(jié)果來生成并輸出振幅差信號942。
增益控制部910根據(jù)振幅差信號942,可以使增益部760中的增益發(fā)生變化。
振幅差檢測部940可以包括第一振幅檢測部,其用于檢測增益部760的輸出信號的振幅;第二振幅檢測部922-1,其用于檢測所述第二麥克風(fēng)所 取得的第二電壓信號的信號振幅;振幅差信號生成部930,其取得所述第一 振幅檢測部922-2所檢測的第一振幅信號922-1和第二振幅檢測部920-1所 檢測的第二振幅信號922-1的差分,生成振幅差信號942。
也可以是:第一振幅檢測單元920-1接收增益部760的輸出信號Sl并檢 測振幅,根據(jù)檢測結(jié)果輸出第一振幅信號922-1;第二振幅檢測單元920-2 接收第二麥克風(fēng)所取得的第二電壓信號912-2并檢測振幅,根據(jù)檢測結(jié)果輸 出第二振幅信號922-2;振幅差信號生成部930接收第一振幅檢測單元920-1 所輸出的第一振幅信號922-1和第二振幅信號922-2所輸出的第二振幅信號 922-2并取得差分,生成并輸出振幅差信號942。
增益控制部910接收振幅差信號輸出部930所輸出的振幅差信號942, 輸出增益控制信號(例如,規(guī)定電流)912??梢酝ㄟ^該增益控制信號(例 如,規(guī)定電流)912來控制增益部760的增益,由此對增益部760的增益進 行反饋控制。
根據(jù)本實施方式,能夠?qū)崟r地檢測并調(diào)整在使用時因各種原因而變化的 振幅差。
所述增益控制部可以將增益部的輸出信號Sl和所述第二麥克風(fēng)所取得 的第二電壓信號712-2 (S2)的振幅差調(diào)整為其相對任意信號(S1或S2)的 比例為規(guī)定的比例值以下?;蛘?,也可以調(diào)整增益部的放大率,取得規(guī)定的 噪聲抑制效果(例如,約10以上)。
例如,可以將信號Sl和S2的振幅差調(diào)整為相對于Sl或S2處于-3%以 上、+3%以下的范圍內(nèi),也可以將所述振幅差調(diào)整為處于-6%以上、+6%以 下的范圍內(nèi)。在前者的情況下,能夠?qū)⒃肼曇种萍s10分貝,在后者的情況 下,能夠?qū)⒃肼曇种萍s6分貝。
圖35、圖36、圖37是第四實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示 意圖。
差分信號生成部720可以包括低通濾波器部950。低通濾波器部950去 除差分信號的高頻成分。低通濾波器部950可以采用具有一階遮斷特性的濾 波器。另外,可以將低通濾波器部950的截止頻率設(shè)定為lkHz以上且5kHz 以下范圍內(nèi)的任意值K。例如,優(yōu)選地,將低通濾波器部950的截止頻率設(shè)定為1.5kHz以上且2kHz以下程度。
增益部760接收第一麥克風(fēng)710-1所取得的第一電壓信號712-1后以規(guī) 定的放大率(增益)進行放大,輸出以規(guī)定的增益放大過的第一電壓信號Sl。 差分信號輸出部740接收通過增益部760以規(guī)定的增益放大的第一電壓信號 Sl以及所述第二麥克風(fēng)710-2所取得的第二電壓信號S2,生成并輸出以規(guī) 定的增益放大的第一電壓信號Sl和第二電壓信號的差分信號742。低通濾波 器部950接收差分信號輸出部740所輸出的差分信號742,輸出使包含在差 分信號742中的高頻(K以上頻帶的頻率)衰減的差分信號952。
圖37是差動麥克風(fēng)的增益特性的說明圖。橫軸表示頻率,縱軸表示增 益。1020是表示單一麥克風(fēng)(singlemike)的頻率和增益之間的關(guān)系的曲線 圖。單一麥克風(fēng)具有平坦的頻率特性。1010是表示在差動麥克風(fēng)的說話者設(shè) 想位置處的頻率和增益之間的關(guān)系的曲線圖,例如,表示離第一麥克風(fēng)710-1 以及第二麥克風(fēng)710-2的中心相距50mm的位置處的頻率特性。即使第一麥 克風(fēng)710-1以及第二麥克風(fēng)710-2具有平坦的頻率特性,但由于差分信號的 高頻從約lkHz附近以一階特性(20dB/dec)上升,因此,若利用具有與此 相反特性的一階低通濾波器使高頻衰減,則能夠使差分信號的頻率特性變得 平坦,從而能夠防止產(chǎn)生聽覺上的不協(xié)調(diào)感。
因此,如圖36所示,使差分信號通過低通濾波器以校正其頻率特性, 由此能夠得到如1012所示的幾乎平坦的頻率特性。由此,能夠防止說話者 語音的高頻或噪聲的高頻被強調(diào)而成為刺耳的音質(zhì)。
圖38是具有AD轉(zhuǎn)換單元的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
本實施方式的語音輸入裝置可以包括第一 AD轉(zhuǎn)換單元790-1。第一 AD 轉(zhuǎn)換單元790-1對第一麥克風(fēng)710-1所取得的第一電壓信號712-1進行模擬/ 數(shù)字轉(zhuǎn)換。
本實施方式的語音輸入裝置可以包括第二 AD轉(zhuǎn)換單元790-2。第二 AD 轉(zhuǎn)換單元790-2對第二麥克風(fēng)710-2所取得的第二電壓信號712-2進行模擬/ 數(shù)字轉(zhuǎn)換。
本實施方式的語音輸入裝置包括差分信號生成部720。差分信號生成部 720可以根據(jù)通過第一 AD轉(zhuǎn)換單元790-1轉(zhuǎn)換成數(shù)字信號的所述第一電壓 信號782-1以及通過所述第二 AD轉(zhuǎn)換單元790-2轉(zhuǎn)換成數(shù)字信號的所述第二電壓信號782-2,均通過數(shù)字信號處理運算來進行增益平衡調(diào)整以及延遲 平衡調(diào)整,生成第一電壓信號和第二電壓信號的差分信號742。
在此,差分信號生成部720可以具有在圖29、圖31、圖34、圖36等中 說明的結(jié)構(gòu)。
8.第五實施方式的語音輸入裝置的結(jié)構(gòu)
圖20是第五實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。
本實施方式的語音輸入裝置可以包括設(shè)置在離第一麥克風(fēng)(的第一振動 膜711-1)以及所述第二麥克風(fēng)(的第二振動膜711-2)等距離的位置處的聲 源部770。聲源部770可以由振蕩器等構(gòu)成,可以在離第一麥克風(fēng)710-1的 第一振動膜(薄膜(diaphragm) ) 711-1的中心點Cl和第二麥克風(fēng)710-2 的第二振動膜(薄膜)711-2的中心點C2等距離的位置處設(shè)置聲源部770。
而且,可以根據(jù)來自聲源部770的聲音,將成為差分信號生成部740的 輸入的第一電壓信號Sl和第二電壓信號S2的相位差或者延遲差調(diào)整為零。
另外,也可以進行根據(jù)來自聲源部770的聲音使增益部760中的放大率 發(fā)生變化的控制。
而且,也可以根據(jù)來自聲源部770的聲音,將成為差分信號生成部740 的輸入的第一電壓信號Sl和第二電壓信號S2的振幅差調(diào)整為零。
在此,聲源部770可以使用發(fā)出單一頻率的聲音的聲源。例如,可以發(fā) 出lkHz的聲音。
另外,可以將聲源部770的頻率設(shè)定為可聽頻帶外的頻率。例如,若使 用比20kHz高的頻率(例如,30kHz)的聲音,則人的耳朵聽不到聲音。若 將聲源部770的頻率設(shè)定為可聽頻帶外的頻率,則在用戶使用時也不造成障 礙的情況下,能夠利用聲源部770來調(diào)整輸入信號的相位差或延遲差,以及 感度(增益)差。
例如,當(dāng)由模擬濾波器構(gòu)成延遲部時,延遲量可能會根據(jù)溫度特性而變 化,但若采用本實施方式,則能夠進行與溫度變化等周圍的環(huán)境變化對應(yīng)的 延遲調(diào)整。延遲調(diào)整,可以時常進行,也可以間歇地進行,也可以在接通電 源等時進行。9.第六實施方式的語音輸入裝置的結(jié)構(gòu) 圖39是第六實施方式的語音輸入裝置的結(jié)構(gòu)的一例的示意圖。 本實施方式的語音輸入裝置可以包括第一麥克風(fēng)710-1,其具有第一 振動膜;第二麥克風(fēng)710-2,其具有第二振動膜;以及未圖示的差分信號生 成部,其生成表示所述第一麥克風(fēng)所取得的第一電壓信號和所述第二麥克風(fēng) 所取得的第二電壓信號之差的差分信號,所述第一振動膜以及所述第二振動 膜中的至少一振動膜通過設(shè)置成與膜面垂直的筒狀的導(dǎo)音管1100來取得聲 波。
導(dǎo)音管1100可以設(shè)置在振動膜周圍的基板1110上,以使從筒的開口部 1102接收到的聲波經(jīng)由音響孔714-2不向外部泄漏地到達(dá)第二麥克風(fēng)710-2 的振動膜。這樣,進入導(dǎo)音管1100的聲音在不會衰減的情況下到達(dá)第二麥 克風(fēng)710-2的振動膜。根據(jù)本實施方式,通過在所述第一振動膜以及所述第 二振動膜中的至少一方設(shè)置導(dǎo)音管,能夠改變聲音到達(dá)振動膜為止的距離。 因此,根據(jù)延遲平衡的偏差來設(shè)置適當(dāng)長度(例如,數(shù)毫米)的導(dǎo)音管,由 此能夠消除延遲。
此外,本發(fā)明并不限定于上述實施方式,而可以進行各種變形。本發(fā)明 包括實質(zhì)上與實施方式中說明的結(jié)構(gòu)相同的結(jié)構(gòu)(例如,功能、方法以及結(jié) 果相同的結(jié)構(gòu),或者目的及效果相同的結(jié)構(gòu))。另外,本發(fā)明包括從實施方 式中說明的結(jié)構(gòu)中置換掉非本質(zhì)性的部分的結(jié)構(gòu)。另外,本發(fā)明包括發(fā)揮與 實施方式中說明的結(jié)構(gòu)相同的作用效果的結(jié)構(gòu)或能夠?qū)崿F(xiàn)相同目的的結(jié)構(gòu)。 另外,本發(fā)明包括在實施方式中說明的結(jié)構(gòu)的基礎(chǔ)上增加了公知技術(shù)的結(jié) 構(gòu)。
權(quán)利要求
1.一種語音輸入裝置,包括第一麥克風(fēng),其具有第一振動膜,第二麥克風(fēng),其具有第二振動膜,差分信號生成部,其根據(jù)所述第一麥克風(fēng)所取得的第一電壓信號和所述第二麥克風(fēng)所取得的第二電壓信號,生成第一電壓信號和第二電壓信號的差分信號;該語音輸入裝置的特征在于,所述第一以及第二振動膜被配置成噪音強度比小于輸入語音強度比的結(jié)構(gòu),其中,所述噪音強度比表示包含在所述差分信號中的噪音成分的強度相對于包含在所述第一或第二電壓信號中的所述噪音成分的強度的比例,所述輸入語音強度比表示包含在所述差分信號中的輸入語音成分的強度相對于包含在所述第一或第二電壓信號中的所述輸入語音成分的強度的比例,所述差分信號生成部包括增益部和差分信號輸出部,所述增益部對所述第一麥克風(fēng)所取得的第一電壓信號賦予規(guī)定的增益,所述差分信號輸出部接收通過所述增益部賦予了規(guī)定增益的第一電壓信號以及所述第二麥克風(fēng)所取得的第二電壓信號,生成并輸出賦予了規(guī)定的增益的第一電壓信號和第二電壓信號的差分信號。
2. 根據(jù)權(quán)利要求1所述的語音輸入裝置,其特征在于,所述差分信號生成部包括-增益部,其根據(jù)施加在規(guī)定的端子上的電壓或在規(guī)定的端子上流過的電流,改變放大率,增益控制部,其對施加在所述規(guī)定的端子上的電壓或在規(guī)定的端子上流過的電流進行控制;所述增益控制部,包括串聯(lián)或并聯(lián)連接有多個電阻的電阻陣列,并切斷構(gòu)成所述電阻陣列的電阻體或?qū)w的一部分,或者,包括至少一個電阻體并切斷該電阻體的一部分,由此能夠改變施加在增益部的規(guī)定的端子上的電壓或在增益部的規(guī)定的端子上流過的電流。
3. 根據(jù)權(quán)利要求1或2所述的語音輸入裝置,其特征在于,所述差分信號生成部包括振幅差檢測部,其接收被輸入至所述差分信號輸出部的第一電壓信號和第二電壓信號,并根據(jù)接收到的第一電壓信號和第二電壓信號,檢測在生成差分信號時的第一電壓信號和第二電壓信號之間的振幅差,根據(jù)檢測結(jié)果生成并輸出振幅差信號;增益控制部,其根據(jù)所述振幅差信號,進行使所述增益部中的放大率變化的控制。
4. 根據(jù)權(quán)利要求2或3所述的語音輸入裝置,其特征在于,所述增益控制部控制增益部的放大率,使所述增益部的輸出信號與所述第二麥克風(fēng)所取得的第二電壓信號之間的振幅差相對于其中任意一個信號的比例為規(guī)定的比例以下,或者得到規(guī)定分貝的噪聲抑制效果。
5. 根據(jù)權(quán)利要求3或4所述的語音輸入裝置,其特征在于,包括聲源部,該聲源部設(shè)置在離所述第一麥克風(fēng)和所述第二麥克風(fēng)等距離的位置,所述差分信號生成部進行根據(jù)來自所述聲源部的聲音而使所述增益部中的放大率變化的控制。
6. —種語音輸入裝置,其特征在于,包括第一麥克風(fēng),其具有第一振動膜,第二麥克風(fēng),其具有第二振動膜,差分信號生成部,其根據(jù)所述第一麥克風(fēng)所取得的第一電壓信號和所述第二麥克風(fēng)所取得的第二電壓信號,生成第一電壓信號和第二電壓信號的差分信號,聲源部,其設(shè)置在離所述第一麥克風(fēng)和所述第二麥克風(fēng)等距離的位置;所述差分信號生成部包括增益部、振幅差檢測部、增益控制部,所述增益部對所述第一麥克風(fēng)所取得的第一電壓信號賦予規(guī)定的增益,所述振幅差檢測部接收被輸入至所述差分信號輸出部的第一電壓信號和第二電壓信號,并根據(jù)接收到的第一電壓信號和第二電壓信號,檢測在生成差分信號時的第一電壓信號和第二電壓信號之間的振幅差,根據(jù)檢測結(jié)果生成并輸出振幅差信號,所述增益控制部根據(jù)所述振幅差信號,進行使所述增益部中的放大率變化的控制;根據(jù)來自所述聲源部的聲音,調(diào)整所述增益部中的放大率,使得所述第一電壓信號和第二電壓信號的振幅變?yōu)橄嗤?br>
7. 根據(jù)權(quán)利要求5或6所述的語音輸入裝置,其特征在于,所述聲源部是用于發(fā)出單一頻率的聲音的聲源。
8. 根據(jù)權(quán)利要求5至7中任一項所述的語音輸入裝置,其特征在于,所述聲源部的頻率被設(shè)定為可聽頻帶外的頻率。
9. 根據(jù)權(quán)利要求7或8所述的語音輸入裝置,其特征在于,所述振幅差檢測部包括帶通濾波器,該帶通濾波器使被輸入至差分信號輸出部的第一電壓信號和第二電壓信號的所述單一頻率附近的頻帶通過,檢測通過所述帶通濾波器后的所述第一電壓信號和所述第二電壓信號之間的振幅差,根據(jù)檢測結(jié)果生成振幅差信號。
10. 根據(jù)權(quán)利要求1至9中任一項所述的語音輸入裝置,其特征在于,所述差分信號生成部包括低通濾波器部,該低通濾波器部用于去除所述差分信號的高頻成分。
11. 根據(jù)權(quán)利要求10所述的語音輸入裝置,其特征在于,所述低通濾波器部是具有一階遮斷特性的濾波器。
12. 根據(jù)權(quán)利要求10或11所述的語音輸入裝置,其特征在于,所述低通濾波器部的截止頻率被設(shè)定為lkHz以上且5kHz以下的任意值。
13. 根據(jù)權(quán)利要求1至12中任一項所述的語音輸入裝置,其特征在于,還包括第一 AD轉(zhuǎn)換單元,其對所述第一電壓信號進行模擬/數(shù)字轉(zhuǎn)換,第二AD轉(zhuǎn)換單元,其對所述第二電壓信號進行模擬/數(shù)字轉(zhuǎn)換;所述差分信號生成部根據(jù)通過所述第一 AD轉(zhuǎn)換單元轉(zhuǎn)換成數(shù)字信號的所述第一電壓信號以及通過所述第二 AD轉(zhuǎn)換單元轉(zhuǎn)換成數(shù)字信號的所述第二電壓信號,生成第一電壓信號和第二電壓信號的差分信號。
14. 一種語音輸入裝置,其特征在于,包括第一麥克風(fēng),其具有第一振動膜,第二麥克風(fēng),其具有第二振動膜,差分信號生成部,其用于生成差分信號,該差分信號表示所述第一麥克風(fēng)所取得的第一電壓信號和所述第二麥克風(fēng)所取得的第二電壓信號之差;所述第一以及第二振動膜被配置成噪音強度比小于輸入語音強度比的 結(jié)構(gòu),其中,所述噪音強度比表示包含在所述差分信號中的噪音成分的強度 相對于包含在所述第一或第二電壓信號中的所述噪音成分的強度的比例,所 述輸入語音強度比表示包含在所述差分信號中的輸入語音成分的強度相對 于包含在所述第一或第二電壓信號中的所述輸入語音成分的強度的比例。
15. 根據(jù)權(quán)利要求1至14中任一項所述的語音輸入裝置,其特征在于, 還包括基部,在該基部的主面上形成有凹部, 所述第一振動膜設(shè)置在所述凹部的底面上, 所述第二振動膜設(shè)置在所述主面上。
16. 根據(jù)權(quán)利要求15所述的語音輸入裝置,其特征在于,所述基部被 設(shè)置成如下結(jié)構(gòu),該結(jié)構(gòu)為,與所述凹部連通的開口被配置為比所述主面上的所述第二振 動膜的形成區(qū)域更靠近所述輸入語音的模型聲源。
17. 根據(jù)權(quán)利要求1至16中任一項所述的語音輸入裝置,其特征在于, 所述凹部比所述開口和所述第二振動膜的形成區(qū)域之間的間隔淺。
18. 根據(jù)權(quán)利要求1至17中任一項所述的語音輸入裝置,其特征在于, 還包括基部,在該基部的主面上形成有第一凹部和比所述第一凹部淺的第二凹部,所述第一振動膜設(shè)置在所述第一凹部的底面上, 所述第二振動膜設(shè)置在所述第二凹部的底面上。
19. 根據(jù)權(quán)利要求18所述的語音輸入裝置,其特征在于,所述基部被 設(shè)置成如下結(jié)構(gòu)該結(jié)構(gòu)為,與所述第一凹部連通的第一開口被配置為比與所述第二凹部 連通的第二開口更靠近所述輸入語音的模型聲源。
20. 根據(jù)權(quán)利要求18或20所述的語音輸入裝置,其特征在于,所述第 一凹部和第二凹部的深度的差小于所述第一開口和第二開口之間的間隔。
21. 根據(jù)權(quán)利要求15至20中任一項所述的語音輸入裝置,其特征在于, 所述基部被設(shè)置成使所述輸入語音同時到達(dá)第一振動膜和第二振動膜的結(jié) 構(gòu)。
22. 根據(jù)權(quán)利要求15至21中任一項所述的語音輸入裝置,其特征在于,所述第一以及第二振動膜被配置成兩者的法線相互平行的結(jié)構(gòu)。
23. 根據(jù)權(quán)利要求15至22中任一項所述的語音輸入裝置,其特征在于, 所述第一以及第二振動膜被配置成兩者的法線不在同一直線上的結(jié)構(gòu)。
24. 根據(jù)權(quán)利要求15至23中任一項所述的語音輸入裝置,其特征在于, 所述第一以及第二麥克風(fēng)構(gòu)成為半導(dǎo)體器件。
25. 根據(jù)權(quán)利要求15至24中任一項所述的語音輸入裝置,其特征在于, 所述第一振動膜和第二振動膜的中心間距離為5.2mm以下。
26. —種信息處理系統(tǒng),其特征在于,包括 權(quán)利要求1至25中任一項所述的語音輸入裝置;解析處理部,其根據(jù)所述差分信號,對輸入至所述語音輸入裝置中的語 音信息進行解析處理。
27. —種信息處理系統(tǒng),其特征在于,包括 權(quán)利要求1至26中任一項所述的語音輸入裝置,主計算機,其根據(jù)所述差分信號,對輸入至所述語音輸入裝置中的語音 信息進行解析處理;通過所述通信處理部,經(jīng)由網(wǎng)絡(luò)與所述主計算機進行通信處理。
28. —種語音輸入裝置的制造方法,用于制造具有去除噪音成分的功能 的語音輸入裝置,該語音輸入裝置包括第一麥克風(fēng),其具有第一振動膜, 第二麥克風(fēng),其具有第二振動膜,差分信號生成部,其用于生成差分信號,該差分信號表示所述第一麥克 風(fēng)所取得的第一電壓信號和所述第二麥克風(fēng)所取得的第二電壓信號之差;該語音輸入裝置的制造方法的特征在于,包括以下步驟準(zhǔn)備表示Ar/ t值和噪音強度比之間的對應(yīng)關(guān)系的數(shù)據(jù)的步驟,其中,所 述Ar/X值表示所述第一振動膜和第二振動膜的中心間距離Ar與噪音的波長 X的比例,所述噪音強度比表示包含在所述差分信號中的所述噪音成分的強 度相對于包含在所述第一或第二電壓信號中的所述噪音成分的強度的比例,根據(jù)所述數(shù)據(jù),設(shè)定所述Ar/X值的步驟,根據(jù)所設(shè)定的所述Ar從值以及所述噪音的波長,設(shè)定所述中心間距離的
29. 根據(jù)權(quán)利要求28所述的語音輸入裝置的制造方法,其特征在于, 在設(shè)定所述Ar從值的步驟中,根據(jù)所述數(shù)據(jù)來設(shè)定所述Ar從值,使得所述噪音強度比小于輸入語音強度比,其中,所述輸入語音強度比表示包含 在所述差分信號中的輸入語音成分的強度相對于包含在所述第一或第二電 壓信號中的所述輸入語音成分的強度的比例。
30. 根據(jù)權(quán)利要求28或30所述的語音輸入裝置的制造方法,其特征在 于,所述輸入語音強度比是基于所述輸入語音的振幅成分的強度比。
31. 根據(jù)權(quán)利要求28至30中任一項所述的語音輸入裝置的制造方法, 其特征在于,所述噪音強度比是基于所述噪音成分的相位差的強度比。
32. 根據(jù)權(quán)利要求28至31中任一項所述的語音輸入裝置的制造方法, '其特征在于,所述語音輸入裝置的差分信號生成部包括增益部,其根據(jù)施加在規(guī)定的端子上的電壓或在規(guī)定的端子上流過的電 流,對所述第一麥克風(fēng)所取得的第一電壓信號賦予規(guī)定的增益,增益控制部,其對施加在所述規(guī)定的端子上的電壓或在規(guī)定的端子上流 過的電流進行控制,差分信號輸出部,其接收通過所述增益部賦予了規(guī)定的增益的第一電壓 信號以及所述第二麥克風(fēng)所取得的第二電壓信號,生成并輸出賦予了規(guī)定的 增益的第一電壓信號和第二電壓信號的差分信號;所述語音輸入裝置的制造方法包括下述步驟中的任意一個步驟-包括串聯(lián)或并聯(lián)連接有多個電阻的電阻陣列而構(gòu)成所述增益控制部,并 切斷構(gòu)成所述電阻陣列的電阻體或?qū)w的一部分的步驟,包括至少一個電阻體而構(gòu)成所述增益控制部,并切斷該電阻體的一部分 的步驟。
33. 根據(jù)權(quán)利要求32所述的語音輸入裝置的制造方法,其特征在于, 在所述增益設(shè)定步驟中,在離所述第一麥克風(fēng)和所述第二麥克風(fēng)等距離的位置設(shè)置聲源, 根據(jù)來自所述聲源部的聲音,判斷第一麥克風(fēng)和所述第二麥克風(fēng)之間的 振幅差,并切斷構(gòu)成所述電阻陣列的電阻體或?qū)w的一部分,或者切斷所述 至少一個電阻體的一部分,從而實現(xiàn)使該振幅差在規(guī)定的范圍內(nèi)的電阻值。
全文摘要
本發(fā)明提供語音輸入裝置及其制造方法,以及信息處理系統(tǒng)。該語音輸入裝置包括第一麥克風(fēng)(710-1),其具有第一振動膜;第二麥克風(fēng)(710-2),其具有第二振動膜;差分信號生成部(720),其生成第一電壓信號和第二電壓信號的差分信號;所述第一以及第二振動膜被配置成噪音強度比小于表示相對輸入語音成分的強度的比例的輸入語音強度比,差分信號生成部(720)包括增益部(760),其對第一電壓信號賦予規(guī)定的增益;差分信號輸出部(740),其生成通過增益部賦予了規(guī)定增益的第一電壓信號和第二電壓信號的差分信號并進行輸出。
文檔編號H04R3/00GK101543089SQ20078004343
公開日2009年9月23日 申請日期2007年11月21日 優(yōu)先權(quán)日2006年11月22日
發(fā)明者丁子英樹, 前田重雄, 堀邊隆介, 小野雅敏, 杉山精, 豬田岳司, 田中史記, 福岡敏美, 高野陸男 申請人:株式會社船井電機新應(yīng)用技術(shù)研究所;船井電機株式會社