專利名稱:語音處理器和通信終端設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于處理語音信號的語音處理器。本發(fā)明還涉及結(jié)合 了語音處理器的通信終端設(shè)備。
本申請要求日本專利申請No, 2007-182458的優(yōu)先權(quán),并通過引用 將其內(nèi)容結(jié)合與此。
背景技術(shù):
傳統(tǒng)地,已經(jīng)開發(fā)了各種諸如電話和便攜式電話那樣的通信終端 設(shè)備來整合語音處理器,它通過響應于配對通信終端的電話號碼而自 動切換接收的語音質(zhì)量來調(diào)節(jié)接收的語音使其處于易于聽見的狀態(tài)。 在各種文件中公開了這一技術(shù),例如專利文件1和專利文件2
專利文件1:日本未經(jīng)審査的專利申請公開No. 2005-136788。
專利文件2:日本未經(jīng)審查的專利申請No. 2001-86200。
在上述通信終端設(shè)備中,必需響應電話號碼而向存儲器注冊 (register)接收的語音的調(diào)節(jié)情況;因此, 一旦接收來自電話號碼未 知或未預先注冊的通信終端的呼叫時,就不可能調(diào)節(jié)接收的語音。也 就是說,公知的通信終端設(shè)備的缺陷是它們不是總能調(diào)節(jié)接收的語音 信號。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能夠適當調(diào)節(jié)和處理接收的語音信號的 語音處理器。
本發(fā)明的另一個目的是提供一種結(jié)合了語音處理器的通信終端設(shè) 備,其中通過該語音處理器來自動調(diào)節(jié)接收的語音質(zhì)量。
在本發(fā)明的第一方面,語音處理器包括用于從輸入語音中提取語 音特性數(shù)據(jù)(如聲紋數(shù)據(jù))的提取器,用于根據(jù)設(shè)置的信號處理參數(shù) 來處理所述輸入語音的處理器,用于存儲多個預置語音特性數(shù)據(jù),每 個預置語音特性數(shù)據(jù)對應于多組信號處理參數(shù)之一的存儲器,以及參 數(shù)設(shè)置設(shè)備,用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性的所述 預置語音特性數(shù)據(jù)之一,并且用于將與所述選擇的預置語音特性數(shù)據(jù) 對應的一組信號處理參數(shù)設(shè)置到所述處理器。
所述處理器包括,例如,高音補償器、增強器、動態(tài)范圍壓縮器 和均衡器。
所述語音處理器還包括用于接收來自相對通信終端的語音信號以 便于產(chǎn)生語音信號的語音通信器,以及用于根據(jù)用戶指令來編輯所述 信號處理參數(shù)的參數(shù)編輯器。其中,所述提取器從所述語音信號中提 取表示輸入語音的特性的語音特性數(shù)據(jù),以便所述存儲器存儲與編輯 后的信號處理參數(shù)有關(guān)的所提取的語音特性數(shù)據(jù)。
在本發(fā)明的第二方面,通信終端設(shè)備除了包括上述語音處理器之 外還包括語音通信器。所述語音通信器執(zhí)行與配對通信設(shè)備的通信, 以便于接收語音信號。
根據(jù)本發(fā)明,所述提取器提取與所提取的語音特性數(shù)據(jù)具有相似 性的預置語音特性數(shù)據(jù)之一,以便將相應的信號處理參數(shù)設(shè)置到處理 器,從而適當?shù)靥幚磔斎胝Z音信號。
參考附圖,將對本發(fā)明的這些和其他目的,方面以及實施例進行
更具體的描述,在附圖中
圖l是表示根據(jù)本發(fā)明優(yōu)選實施例的通信終端設(shè)備結(jié)構(gòu)的方框圖; 圖2是表示包含在圖1所示的通信終端設(shè)備內(nèi)的語音信號處理模
塊結(jié)構(gòu)的方框圖3是表示存儲在圖1所示的存儲器內(nèi)的聲紋數(shù)據(jù)與信號處理參
數(shù)之間關(guān)系的表格;
圖4A表示由圖2所示的高音補償器執(zhí)行的信號處理參數(shù)的實例;
圖4B表示由圖2所示的增強器執(zhí)行的信號處理參數(shù)的實例;
圖4C表示由圖2所示的動態(tài)范圍壓縮器執(zhí)行的信號處理參數(shù)的實
例;
圖4D表示由圖2所示的均衡器執(zhí)行的信號處理參數(shù)的實例; 圖5是表示由圖1所示的通信終端設(shè)備執(zhí)行的語音信號處理的流 程圖;以及
圖6是表示用于向存儲器注冊與信號處理參數(shù)有關(guān)的聲紋數(shù)據(jù)的 聲紋數(shù)據(jù)注冊處理的流程圖。
具體實施例方式
將參考附圖并借助于實例來更詳細地描述本發(fā)明。
圖1是表示根據(jù)本發(fā)明優(yōu)選實施例的通信終端設(shè)備(例如,便攜 式電話)的結(jié)構(gòu)的方框圖,其中它僅僅顯示了有關(guān)語音處理的部分, 因此,為了方便起見未顯示其他部分。
語音通信器1執(zhí)行與配對通信終端(未顯示)的通信,以便于接 收語音信號。語音編解碼器(即,語音編碼器-解碼器)2是將從語音 接收器1輸出的編碼語音信號轉(zhuǎn)換(或解碼)成線性音頻信號的模塊。 作為音頻信號的編碼方法,可以指定QCELP (Qualcomm碼激勵線性
預測)和AMR (高級多速率編解碼器)。
聲紋提取器3分析從語音編解碼器2輸出的線性語音信號,以便 于提取表示語音信號特性的聲紋數(shù)據(jù)(或語音特性數(shù)據(jù))。例如,通 過長期的譜分析方法來檢測聲紋數(shù)據(jù)。也就是說,在單位時間間隔內(nèi)
連續(xù)地對語音信號執(zhí)行使用了 FFT (即,快速傅里葉變換)的頻率分 析;然后,累積所檢測的頻率值。這在預定數(shù)目的時間間隔(或執(zhí)行 累積的預定次數(shù))內(nèi)連續(xù)地執(zhí)行;然后,根據(jù)預定的數(shù)目來劃分累積 的頻率值,從而產(chǎn)生聲紋數(shù)據(jù)。
存儲器4預先存儲預置的與信號處理參數(shù)(定義了由語音信號處 理模塊8執(zhí)行的處理的內(nèi)容)有關(guān)的聲紋數(shù)據(jù)(預置的語音特性數(shù)據(jù))。 相似性判定器5判定預置的聲紋數(shù)據(jù)與所提取的聲紋數(shù)據(jù)(由聲紋提 取器3提取)之間的相似性??梢允褂酶鞣N方法來判定相似性。例如, 執(zhí)行merkepstrum分析以便產(chǎn)生時間序列特性矢量、計算其距離以便判 定相似性。
參數(shù)指定器(或參數(shù)設(shè)置設(shè)備)6基于相似性判定器5的判定結(jié)果, 從存儲器4內(nèi)存儲的預置聲紋數(shù)據(jù)中選擇與所提取的聲紋數(shù)據(jù)(由聲 紋提取器3提取)高度相似的聲紋數(shù)據(jù),然后它從存儲器4中讀取信 號處理參數(shù),由此為語音信號處理模塊8指定(或設(shè)置)所選的聲紋 數(shù)據(jù)。參數(shù)編輯器7響應于用戶指令來編輯信號處理參數(shù),其中用戶 通過操作與在顯示器(未顯示)上工作的GUI (圖形用戶界面)相關(guān) 聯(lián)的通信終端設(shè)備(未顯示)的操作鍵來指定該用戶指令。參數(shù)編輯 器7不必整合到通信終端設(shè)備內(nèi),因此,還可以通過諸如個人計算機 那樣的外部設(shè)備來實現(xiàn)參數(shù)編輯器7的功能,該個人計算機經(jīng)由其接 口 (未顯示)而連接到通信終端設(shè)備。語音信號處理模塊8執(zhí)行處理, 其中由參數(shù)指定器6對于從語音編解碼器2輸出的語音信號來指定處 理的內(nèi)容。這提高了聲音質(zhì)量,而且使用戶容易聽到接收的語音。
麥克風9將語音轉(zhuǎn)換成模擬語音信號。A/D轉(zhuǎn)換器(或ADC) 10 將(從麥克風9輸出的)模擬語音信號轉(zhuǎn)換成數(shù)字語音信號。與聲紋提取器3相似,聲紋提取器11分析(從A/D轉(zhuǎn)換器IO輸出的)數(shù)字
語音信號,以便于從其中提取聲紋數(shù)據(jù)(或語音特性數(shù)據(jù))。在存儲
器4內(nèi)存儲所提取的聲紋數(shù)據(jù)(由聲紋提取器ll提取)以及由參數(shù)編 輯器7編輯的信號處理參數(shù)。揚聲器12基于語音信號處理模塊8所處 理的語音信號(或音頻信號)來產(chǎn)生語音(或聲音)。
圖2是表示語音信號處理模塊8的結(jié)構(gòu)的方框圖。高音補償器81 補償語音信號的高音,其中由于語音編解碼器2的頻帶限制而損失了 該高音。另外,高音補償器81執(zhí)行預先指定的處理,以便于減少(或 消除)語音的粗糙度。增強器82對于從高音補償器81輸出的語音信 號來增強高音泛音,從而創(chuàng)建生動的語音(換言之,使語音聽起來更 清楚)。
動態(tài)范圍壓縮器(DRC) 83對于從增強器82輸出的語音信號來 動態(tài)地衰減高信號電平(level)(超出了特定電平或閾值)。當輸入 語音的音量很高時,降低其音量,以便于在所有范圍內(nèi)提高音量,從 而在所有范圍內(nèi)實現(xiàn)均一的音量。即使在增強器82提高峰值音量時, 也有可能產(chǎn)生想要的語音,它具有足夠的音量而且不含有失真。均衡 器(EQ) 84在單位頻帶中校正語音信號的頻帶。參數(shù)指定器6為語音 信號處理模塊8內(nèi)的高音補償器81、增強器82、動態(tài)范圍壓縮器83 和均衡器84指定適當?shù)男盘柼幚韰?shù),從而實現(xiàn)了指定的信號處理。
圖3表示存儲在存儲器4內(nèi)的聲紋數(shù)據(jù)與信號處理參數(shù)之間的關(guān) 系。具體地說,聲紋數(shù)據(jù)300與定義了高音補償器81的處理的信號處 理參數(shù)310 (見圖4A)、定義了增強器82的處理的信號處理參數(shù)320 (見圖4B)、定義了動態(tài)范圍壓縮器83的處理的信號處理參數(shù)330(見 圖4C)和定義了均衡器84的處理的信號處理參數(shù)340 (見圖4D)相 對應。
例如,聲紋數(shù)據(jù)"類型A"與定義了信號處理參數(shù)310的語句
(statement) "DB—set A"(見圖4A)、定義了信號處理參數(shù)320的 語句"EH一setA"(見圖4B)、定義了信號處理參數(shù)330的語句"DR—set A"(見圖4C)和定義了信號處理參數(shù)340的語句"EQ—set A (見圖 4D)"相對應。
接下來,將參照圖5來描述在與配對通信終端的通信期間的語音 信號處理。當用戶操作通信終端設(shè)備以向配對通信終端發(fā)起撥號呼叫 時,或是在通信終端設(shè)備接收來自配對通信終端的撥號呼叫時,在通 信終端與配對通信終端之間建立通信。語音通信器1接收語音信號, 該語音信號被編碼,然后被轉(zhuǎn)發(fā)到語音編解碼器2。在步驟SIOO中, 語音編解碼器2將編碼的語音信號轉(zhuǎn)換成線性語音信號。在步驟SllO 中,聲紋提取器3從語音信號中提取聲紋數(shù)據(jù)。
相似性判定器5判定所提取的聲紋數(shù)據(jù)(由聲紋提取器3提取) 和預先存儲在存儲器4內(nèi)的預置的聲紋數(shù)據(jù)之間的相似性。在步驟S120 中,基于相似性判定器的結(jié)果,參數(shù)指定器6從存儲器4內(nèi)存儲的多 個預置的聲紋數(shù)據(jù)中檢索出與所提取的聲紋數(shù)據(jù)高度相似的聲紋數(shù) 據(jù);換言之,它檢索出與所提取的聲紋數(shù)據(jù)的相似性髙于預定閾值的 多個預置聲紋數(shù)據(jù)之一。
當參數(shù)指定器6成功地檢索到相似性高于預定閾值的聲紋數(shù)據(jù)時, 步驟S130的判定結(jié)果轉(zhuǎn)向"是",以便流程前進到步驟S140。當其無 法檢索到相似性高于預定閾值的聲紋數(shù)據(jù)時,步驟S130的判定結(jié)果轉(zhuǎn) 向"否",以便流程前進到步驟S170。
在步驟S140中,參數(shù)指定器6讀取與檢索出的聲紋數(shù)據(jù)有關(guān)的信 號處理參數(shù),該檢索出的聲紋數(shù)據(jù)與來自存儲器4的所提取的聲紋數(shù) 據(jù)具有最高的相似性。在步驟S170中,參數(shù)指定器6從存儲器4中讀
取預先準備的信號處理參數(shù)的默認值。在完成步驟si40或步驟sno
之后,流程前進到步驟S150,在步驟S150中參數(shù)指定器6為語音信號
處理模塊8指定所讀取的信號處理參數(shù)。
在通信結(jié)束之前,語音信號處理模塊8都保留(在步驟S140或步 驟S170中獲得的)信號處理參數(shù)??蛇x地,可以以這樣一種方式來對 圖5的流程圖進行部分地修改,S卩,該流程每預定時間就自動返回到 步驟SIOO,以便于即使在與配對通信終端的通信期間說話者發(fā)生了改 變也能確保易于聽見狀態(tài)(easy-to-hear state)的足夠的電平。在步驟 S160中,在通信結(jié)束時,通信終端設(shè)備停止接收語音信號。因此,結(jié) 束一系列有關(guān)語音信號處理的操作。
如上所述,從存儲器4內(nèi)存儲的多個預置的聲紋數(shù)據(jù)中檢索出與 從接收的語音信號(發(fā)自配對通信終端)中所提取的聲紋數(shù)據(jù)具有相 似性的聲紋數(shù)據(jù);然后,將與檢索出的聲紋數(shù)據(jù)有關(guān)的信號處理參數(shù) 設(shè)置到語音信號處理模塊8;因此,就有可能對于接收到的語音信號來 執(zhí)行適當?shù)恼Z音信號處理。即使是在通信終端設(shè)備接收來自未知通信 終端的第一呼叫時,如果存儲器4存儲了與從接收的語音信號中所提 取的聲紋數(shù)據(jù)具有相似性的聲紋數(shù)據(jù),也有可能對于接收的語音信號 執(zhí)行適當?shù)恼Z音處理。
本實施例被設(shè)計為向語音信號處理模塊8提供最佳信號處理參數(shù), 其中該最佳信號處理參數(shù)適合于使用配對通信終端進行呼叫的人員的 聲紋(或聲音特性),因此通信終端設(shè)備的用戶就有可能容易地聽到 接收的語音。也就是說,本實施例提供了顯著的效果,其中可以對音 量相對較低的接收到的語音進行增強音量,并在音調(diào)上對含混的語音 (thick voice)進行軟化(soften)。
接下來,將參照圖6描述用于向存儲器4注冊聲紋數(shù)據(jù)的聲紋數(shù) 據(jù)注冊處理。在步驟S200中,用戶改變通信終端設(shè)備的操作模式,從 而允許該通信終端設(shè)備向存儲器4注冊聲紋數(shù)據(jù)。接著,麥克風9獲 取輸入其中的語音,以便于產(chǎn)生模擬語音信號,然后將該模擬語音信號轉(zhuǎn)發(fā)到A/D轉(zhuǎn)換器10。A/D轉(zhuǎn)換器10將模擬語音信號轉(zhuǎn)換成數(shù)字語 音信號。在步驟S210中,聲紋提取器11分析數(shù)字語音信號,以便于 提取聲紋數(shù)據(jù)。在存儲器4內(nèi)存儲所提取的聲紋數(shù)據(jù)。
接著,用戶操作通信終端設(shè)備,以便于編輯信號處理參數(shù)。也就 是說,用戶利用GUI功能以便編輯信號處理參數(shù)以適合(與輸入語音 相對應的)所提取的聲紋數(shù)據(jù)。在步驟S220中,如上所述,參數(shù)編輯 器7編輯信號處理參數(shù)。在步驟S230中,參數(shù)編輯器7在存儲器4內(nèi) 存儲與聲紋數(shù)據(jù)有關(guān)的編輯后的信號處理參數(shù),其中該聲紋數(shù)據(jù)是由 聲紋提取器11所提取并然后被存儲在存儲器4內(nèi)。
當用戶打算繼續(xù)向存儲器4注冊聲紋數(shù)據(jù)時,換言之,當步驟S240 中的判定結(jié)果為"否"時,流程返回到步驟S210,以便于重復前述處 理。當用戶操作通信終端設(shè)置以停止向存儲器4注冊聲紋數(shù)據(jù)時,換 言之,當步驟S240的判定結(jié)果為"是"時,結(jié)束該聲紋數(shù)據(jù)注冊處理。
最后,本發(fā)明不必局限于本實施例,還可以在所附權(quán)利要求所限 定的本發(fā)明的范圍內(nèi)以各種方式對其進行修改。
權(quán)利要求
1.一種語音處理器,包括提取器,用于從輸入語音提取語音特性數(shù)據(jù);處理器,用于根據(jù)設(shè)置的信號處理參數(shù)來處理所述輸入語音;存儲器,用于存儲多個預置語音特性數(shù)據(jù),每個預置語音特性數(shù)據(jù)對應于多組信號處理參數(shù)之一;以及參數(shù)設(shè)置設(shè)備,用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性的所述多個預置語音特性數(shù)據(jù)之一,并且用于將與所述選擇的預置語音特性數(shù)據(jù)對應的一組信號處理參數(shù)設(shè)置到所述處理器。
2. 根據(jù)權(quán)利要求1的所述語音處理器,進一步包括用于接收輸入其中的語音信號以產(chǎn)生語音信號的語音通信器,以及用于根據(jù)用戶指 令來編輯所述信號處理參數(shù)的參數(shù)編輯器,其中所述提取器從所述語 音信號提取表示所述輸入語音特性的語音特性數(shù)據(jù),并且其中所述存 儲器存儲與編輯的信號處理參數(shù)有關(guān)的所述提取的語音特性數(shù)據(jù)。
3. —種通信終端設(shè)備,包括語音通信器,用于執(zhí)行與配對通信設(shè)備的通信以接收語音信號;以及語音處理器,它包括;提取器,用于從所述語音信號提取語音特性數(shù)據(jù); 處理器,用于根據(jù)設(shè)置的信號處理參數(shù)來處理所述語音信號; 存儲器,用于存儲多個預置語音特性數(shù)據(jù),每個預置語音特性數(shù) 據(jù)對應于多組信號處理參數(shù)之一;以及參數(shù)設(shè)置設(shè)備,用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性 的所述多個預置語音特性數(shù)據(jù)之一,并且用于將與所述選擇的預置語 音特性數(shù)據(jù)對應的一組信號處理參數(shù)設(shè)置到所述處理器。
4. 根據(jù)權(quán)利要求1的所述語音處理器,其中所述處理器包括高音補償器、增強器、動態(tài)范圍壓縮器和均衡器中的至少一個。
5. 根據(jù)權(quán)利要求4的所述語音處理器,其中所述信號處理參數(shù)定 義了關(guān)于所述高音補償器、所述增強器、所述動態(tài)范圍壓縮器和所述 均衡器之一的處理內(nèi)容。
6. 根據(jù)權(quán)利要求1的所述語音處理器,其中當所述存儲器沒有存 儲與所述提取的語音特性數(shù)據(jù)具有相似性的預置語音特性數(shù)據(jù)時,所 述參數(shù)設(shè)置設(shè)備將預先準備的所述信號處理參數(shù)的默認值設(shè)置到所述 處理器。
7. 根據(jù)權(quán)利要求1的所述語音處理器,其中所述語音特性數(shù)據(jù)是 聲紋數(shù)據(jù)。
8. 根據(jù)權(quán)利要求3的所述通信終端設(shè)備,其中所述語音特性數(shù)據(jù) 是聲紋數(shù)據(jù)。
全文摘要
在結(jié)合于通信終端設(shè)備內(nèi)的語音處理器中,提取器從向其輸入的語音信號中提取語音特性數(shù)據(jù)(如聲紋數(shù)據(jù));然后,語音信號處理模塊根據(jù)預先在存儲器內(nèi)存儲的與預置的語音特性數(shù)據(jù)有關(guān)的信號處理參數(shù)來處理輸入語音信號。參數(shù)設(shè)置設(shè)備選擇預置的語音特性數(shù)據(jù)中與所提取的語音特性數(shù)據(jù)具有相似性的一個語音特性數(shù)據(jù),以便于將存儲在存儲器內(nèi)的相應的信號處理參數(shù)設(shè)置到語音信號處理模塊。因此,通信終端設(shè)備能夠適當?shù)靥幚磔斎胝Z音信號,以便于增強特定范圍或調(diào)節(jié)輸入語音的音量。
文檔編號G10L21/00GK101345055SQ200810135658
公開日2009年1月14日 申請日期2008年7月9日 優(yōu)先權(quán)日2007年7月11日
發(fā)明者川島隆宏 申請人:雅馬哈株式會社