語音處理器和通信終端設(shè)備的制作方法

文檔序號：2830994閱讀：347來源：國知局

專利名稱：語音處理器和通信終端設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于處理語音信號的語音處理器。本發(fā)明還涉及結(jié)合了語音處理器的通信終端設(shè)備。
本申請要求日本專利申請No, 2007-182458的優(yōu)先權(quán)，并通過引用將其內(nèi)容結(jié)合與此。
背景技術(shù)：
傳統(tǒng)地，已經(jīng)開發(fā)了各種諸如電話和便攜式電話那樣的通信終端設(shè)備來整合語音處理器，它通過響應于配對通信終端的電話號碼而自動切換接收的語音質(zhì)量來調(diào)節(jié)接收的語音使其處于易于聽見的狀態(tài)。在各種文件中公開了這一技術(shù)，例如專利文件1和專利文件2
專利文件1:日本未經(jīng)審査的專利申請公開No. 2005-136788。
專利文件2:日本未經(jīng)審查的專利申請No. 2001-86200。
在上述通信終端設(shè)備中，必需響應電話號碼而向存儲器注冊 (register)接收的語音的調(diào)節(jié)情況；因此，一旦接收來自電話號碼未知或未預先注冊的通信終端的呼叫時，就不可能調(diào)節(jié)接收的語音。也就是說，公知的通信終端設(shè)備的缺陷是它們不是總能調(diào)節(jié)接收的語音信號。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能夠適當調(diào)節(jié)和處理接收的語音信號的語音處理器。
本發(fā)明的另一個目的是提供一種結(jié)合了語音處理器的通信終端設(shè) 備，其中通過該語音處理器來自動調(diào)節(jié)接收的語音質(zhì)量。
在本發(fā)明的第一方面，語音處理器包括用于從輸入語音中提取語音特性數(shù)據(jù)(如聲紋數(shù)據(jù))的提取器，用于根據(jù)設(shè)置的信號處理參數(shù) 來處理所述輸入語音的處理器，用于存儲多個預置語音特性數(shù)據(jù)，每個預置語音特性數(shù)據(jù)對應于多組信號處理參數(shù)之一的存儲器，以及參數(shù)設(shè)置設(shè)備，用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性的所述預置語音特性數(shù)據(jù)之一，并且用于將與所述選擇的預置語音特性數(shù)據(jù) 對應的一組信號處理參數(shù)設(shè)置到所述處理器。
所述處理器包括，例如，高音補償器、增強器、動態(tài)范圍壓縮器和均衡器。
所述語音處理器還包括用于接收來自相對通信終端的語音信號以便于產(chǎn)生語音信號的語音通信器，以及用于根據(jù)用戶指令來編輯所述信號處理參數(shù)的參數(shù)編輯器。其中，所述提取器從所述語音信號中提取表示輸入語音的特性的語音特性數(shù)據(jù)，以便所述存儲器存儲與編輯后的信號處理參數(shù)有關(guān)的所提取的語音特性數(shù)據(jù)。
在本發(fā)明的第二方面，通信終端設(shè)備除了包括上述語音處理器之外還包括語音通信器。所述語音通信器執(zhí)行與配對通信設(shè)備的通信，以便于接收語音信號。
根據(jù)本發(fā)明，所述提取器提取與所提取的語音特性數(shù)據(jù)具有相似性的預置語音特性數(shù)據(jù)之一，以便將相應的信號處理參數(shù)設(shè)置到處理器，從而適當?shù)靥幚磔斎胝Z音信號。

參考附圖，將對本發(fā)明的這些和其他目的，方面以及實施例進行
更具體的描述，在附圖中
圖l是表示根據(jù)本發(fā)明優(yōu)選實施例的通信終端設(shè)備結(jié)構(gòu)的方框圖；圖2是表示包含在圖1所示的通信終端設(shè)備內(nèi)的語音信號處理模
塊結(jié)構(gòu)的方框圖3是表示存儲在圖1所示的存儲器內(nèi)的聲紋數(shù)據(jù)與信號處理參
數(shù)之間關(guān)系的表格；
圖4A表示由圖2所示的高音補償器執(zhí)行的信號處理參數(shù)的實例；
圖4B表示由圖2所示的增強器執(zhí)行的信號處理參數(shù)的實例；
圖4C表示由圖2所示的動態(tài)范圍壓縮器執(zhí)行的信號處理參數(shù)的實
例；
圖4D表示由圖2所示的均衡器執(zhí)行的信號處理參數(shù)的實例；圖5是表示由圖1所示的通信終端設(shè)備執(zhí)行的語音信號處理的流程圖；以及
圖6是表示用于向存儲器注冊與信號處理參數(shù)有關(guān)的聲紋數(shù)據(jù)的聲紋數(shù)據(jù)注冊處理的流程圖。
具體實施例方式
將參考附圖并借助于實例來更詳細地描述本發(fā)明。
圖1是表示根據(jù)本發(fā)明優(yōu)選實施例的通信終端設(shè)備(例如，便攜式電話)的結(jié)構(gòu)的方框圖，其中它僅僅顯示了有關(guān)語音處理的部分，因此，為了方便起見未顯示其他部分。
語音通信器1執(zhí)行與配對通信終端(未顯示)的通信，以便于接收語音信號。語音編解碼器(即，語音編碼器-解碼器)2是將從語音接收器1輸出的編碼語音信號轉(zhuǎn)換(或解碼)成線性音頻信號的模塊。作為音頻信號的編碼方法，可以指定QCELP (Qualcomm碼激勵線性
預測)和AMR (高級多速率編解碼器)。
聲紋提取器3分析從語音編解碼器2輸出的線性語音信號，以便于提取表示語音信號特性的聲紋數(shù)據(jù)(或語音特性數(shù)據(jù))。例如，通過長期的譜分析方法來檢測聲紋數(shù)據(jù)。也就是說，在單位時間間隔內(nèi)
連續(xù)地對語音信號執(zhí)行使用了 FFT (即，快速傅里葉變換)的頻率分析；然后，累積所檢測的頻率值。這在預定數(shù)目的時間間隔(或執(zhí)行累積的預定次數(shù))內(nèi)連續(xù)地執(zhí)行；然后，根據(jù)預定的數(shù)目來劃分累積的頻率值，從而產(chǎn)生聲紋數(shù)據(jù)。
存儲器4預先存儲預置的與信號處理參數(shù)(定義了由語音信號處理模塊8執(zhí)行的處理的內(nèi)容)有關(guān)的聲紋數(shù)據(jù)(預置的語音特性數(shù)據(jù))。相似性判定器5判定預置的聲紋數(shù)據(jù)與所提取的聲紋數(shù)據(jù)(由聲紋提取器3提取)之間的相似性?？梢允褂酶鞣N方法來判定相似性。例如，執(zhí)行merkepstrum分析以便產(chǎn)生時間序列特性矢量、計算其距離以便判定相似性。
參數(shù)指定器(或參數(shù)設(shè)置設(shè)備)6基于相似性判定器5的判定結(jié)果，從存儲器4內(nèi)存儲的預置聲紋數(shù)據(jù)中選擇與所提取的聲紋數(shù)據(jù)(由聲紋提取器3提取)高度相似的聲紋數(shù)據(jù)，然后它從存儲器4中讀取信號處理參數(shù)，由此為語音信號處理模塊8指定(或設(shè)置)所選的聲紋數(shù)據(jù)。參數(shù)編輯器7響應于用戶指令來編輯信號處理參數(shù)，其中用戶通過操作與在顯示器(未顯示)上工作的GUI (圖形用戶界面)相關(guān) 聯(lián)的通信終端設(shè)備(未顯示)的操作鍵來指定該用戶指令。參數(shù)編輯器7不必整合到通信終端設(shè)備內(nèi)，因此，還可以通過諸如個人計算機那樣的外部設(shè)備來實現(xiàn)參數(shù)編輯器7的功能，該個人計算機經(jīng)由其接口 (未顯示)而連接到通信終端設(shè)備。語音信號處理模塊8執(zhí)行處理，其中由參數(shù)指定器6對于從語音編解碼器2輸出的語音信號來指定處理的內(nèi)容。這提高了聲音質(zhì)量，而且使用戶容易聽到接收的語音。
麥克風9將語音轉(zhuǎn)換成模擬語音信號。A/D轉(zhuǎn)換器(或ADC) 10 將(從麥克風9輸出的)模擬語音信號轉(zhuǎn)換成數(shù)字語音信號。與聲紋提取器3相似，聲紋提取器11分析(從A/D轉(zhuǎn)換器IO輸出的)數(shù)字
語音信號，以便于從其中提取聲紋數(shù)據(jù)(或語音特性數(shù)據(jù))。在存儲
器4內(nèi)存儲所提取的聲紋數(shù)據(jù)(由聲紋提取器ll提取)以及由參數(shù)編輯器7編輯的信號處理參數(shù)。揚聲器12基于語音信號處理模塊8所處理的語音信號(或音頻信號)來產(chǎn)生語音(或聲音)。
圖2是表示語音信號處理模塊8的結(jié)構(gòu)的方框圖。高音補償器81 補償語音信號的高音，其中由于語音編解碼器2的頻帶限制而損失了該高音。另外，高音補償器81執(zhí)行預先指定的處理，以便于減少(或消除)語音的粗糙度。增強器82對于從高音補償器81輸出的語音信號來增強高音泛音，從而創(chuàng)建生動的語音(換言之，使語音聽起來更清楚)。
動態(tài)范圍壓縮器(DRC) 83對于從增強器82輸出的語音信號來動態(tài)地衰減高信號電平(level)(超出了特定電平或閾值)。當輸入語音的音量很高時，降低其音量，以便于在所有范圍內(nèi)提高音量，從而在所有范圍內(nèi)實現(xiàn)均一的音量。即使在增強器82提高峰值音量時，也有可能產(chǎn)生想要的語音，它具有足夠的音量而且不含有失真。均衡器(EQ) 84在單位頻帶中校正語音信號的頻帶。參數(shù)指定器6為語音信號處理模塊8內(nèi)的高音補償器81、增強器82、動態(tài)范圍壓縮器83 和均衡器84指定適當?shù)男盘柼幚韰?shù)，從而實現(xiàn)了指定的信號處理。
圖3表示存儲在存儲器4內(nèi)的聲紋數(shù)據(jù)與信號處理參數(shù)之間的關(guān) 系。具體地說，聲紋數(shù)據(jù)300與定義了高音補償器81的處理的信號處理參數(shù)310 (見圖4A)、定義了增強器82的處理的信號處理參數(shù)320 (見圖4B)、定義了動態(tài)范圍壓縮器83的處理的信號處理參數(shù)330(見圖4C)和定義了均衡器84的處理的信號處理參數(shù)340 (見圖4D)相對應。
例如，聲紋數(shù)據(jù)"類型A"與定義了信號處理參數(shù)310的語句
(statement) "DB—set A"(見圖4A)、定義了信號處理參數(shù)320的語句"EH一setA"(見圖4B)、定義了信號處理參數(shù)330的語句"DR—set A"(見圖4C)和定義了信號處理參數(shù)340的語句"EQ—set A (見圖 4D)"相對應。
接下來，將參照圖5來描述在與配對通信終端的通信期間的語音信號處理。當用戶操作通信終端設(shè)備以向配對通信終端發(fā)起撥號呼叫時，或是在通信終端設(shè)備接收來自配對通信終端的撥號呼叫時，在通信終端與配對通信終端之間建立通信。語音通信器1接收語音信號，該語音信號被編碼，然后被轉(zhuǎn)發(fā)到語音編解碼器2。在步驟SIOO中，語音編解碼器2將編碼的語音信號轉(zhuǎn)換成線性語音信號。在步驟SllO 中，聲紋提取器3從語音信號中提取聲紋數(shù)據(jù)。
相似性判定器5判定所提取的聲紋數(shù)據(jù)(由聲紋提取器3提取) 和預先存儲在存儲器4內(nèi)的預置的聲紋數(shù)據(jù)之間的相似性。在步驟S120 中，基于相似性判定器的結(jié)果，參數(shù)指定器6從存儲器4內(nèi)存儲的多個預置的聲紋數(shù)據(jù)中檢索出與所提取的聲紋數(shù)據(jù)高度相似的聲紋數(shù) 據(jù)；換言之，它檢索出與所提取的聲紋數(shù)據(jù)的相似性髙于預定閾值的多個預置聲紋數(shù)據(jù)之一。
當參數(shù)指定器6成功地檢索到相似性高于預定閾值的聲紋數(shù)據(jù)時，步驟S130的判定結(jié)果轉(zhuǎn)向"是"，以便流程前進到步驟S140。當其無法檢索到相似性高于預定閾值的聲紋數(shù)據(jù)時，步驟S130的判定結(jié)果轉(zhuǎn) 向"否"，以便流程前進到步驟S170。
在步驟S140中，參數(shù)指定器6讀取與檢索出的聲紋數(shù)據(jù)有關(guān)的信號處理參數(shù)，該檢索出的聲紋數(shù)據(jù)與來自存儲器4的所提取的聲紋數(shù) 據(jù)具有最高的相似性。在步驟S170中，參數(shù)指定器6從存儲器4中讀
取預先準備的信號處理參數(shù)的默認值。在完成步驟si40或步驟sno
之后，流程前進到步驟S150，在步驟S150中參數(shù)指定器6為語音信號
處理模塊8指定所讀取的信號處理參數(shù)。
在通信結(jié)束之前，語音信號處理模塊8都保留(在步驟S140或步驟S170中獲得的)信號處理參數(shù)?？蛇x地，可以以這樣一種方式來對圖5的流程圖進行部分地修改，S卩，該流程每預定時間就自動返回到步驟SIOO，以便于即使在與配對通信終端的通信期間說話者發(fā)生了改變也能確保易于聽見狀態(tài)(easy-to-hear state)的足夠的電平。在步驟 S160中，在通信結(jié)束時，通信終端設(shè)備停止接收語音信號。因此，結(jié) 束一系列有關(guān)語音信號處理的操作。
如上所述，從存儲器4內(nèi)存儲的多個預置的聲紋數(shù)據(jù)中檢索出與從接收的語音信號(發(fā)自配對通信終端)中所提取的聲紋數(shù)據(jù)具有相似性的聲紋數(shù)據(jù)；然后，將與檢索出的聲紋數(shù)據(jù)有關(guān)的信號處理參數(shù) 設(shè)置到語音信號處理模塊8;因此，就有可能對于接收到的語音信號來執(zhí)行適當?shù)恼Z音信號處理。即使是在通信終端設(shè)備接收來自未知通信終端的第一呼叫時，如果存儲器4存儲了與從接收的語音信號中所提取的聲紋數(shù)據(jù)具有相似性的聲紋數(shù)據(jù)，也有可能對于接收的語音信號執(zhí)行適當?shù)恼Z音處理。
本實施例被設(shè)計為向語音信號處理模塊8提供最佳信號處理參數(shù)，其中該最佳信號處理參數(shù)適合于使用配對通信終端進行呼叫的人員的聲紋(或聲音特性)，因此通信終端設(shè)備的用戶就有可能容易地聽到接收的語音。也就是說，本實施例提供了顯著的效果，其中可以對音量相對較低的接收到的語音進行增強音量，并在音調(diào)上對含混的語音 (thick voice)進行軟化(soften)。
接下來，將參照圖6描述用于向存儲器4注冊聲紋數(shù)據(jù)的聲紋數(shù) 據(jù)注冊處理。在步驟S200中，用戶改變通信終端設(shè)備的操作模式，從而允許該通信終端設(shè)備向存儲器4注冊聲紋數(shù)據(jù)。接著，麥克風9獲取輸入其中的語音，以便于產(chǎn)生模擬語音信號，然后將該模擬語音信號轉(zhuǎn)發(fā)到A/D轉(zhuǎn)換器10。A/D轉(zhuǎn)換器10將模擬語音信號轉(zhuǎn)換成數(shù)字語音信號。在步驟S210中，聲紋提取器11分析數(shù)字語音信號，以便于提取聲紋數(shù)據(jù)。在存儲器4內(nèi)存儲所提取的聲紋數(shù)據(jù)。
接著，用戶操作通信終端設(shè)備，以便于編輯信號處理參數(shù)。也就是說，用戶利用GUI功能以便編輯信號處理參數(shù)以適合(與輸入語音相對應的)所提取的聲紋數(shù)據(jù)。在步驟S220中，如上所述，參數(shù)編輯器7編輯信號處理參數(shù)。在步驟S230中，參數(shù)編輯器7在存儲器4內(nèi) 存儲與聲紋數(shù)據(jù)有關(guān)的編輯后的信號處理參數(shù)，其中該聲紋數(shù)據(jù)是由聲紋提取器11所提取并然后被存儲在存儲器4內(nèi)。
當用戶打算繼續(xù)向存儲器4注冊聲紋數(shù)據(jù)時，換言之，當步驟S240 中的判定結(jié)果為"否"時，流程返回到步驟S210，以便于重復前述處理。當用戶操作通信終端設(shè)置以停止向存儲器4注冊聲紋數(shù)據(jù)時，換言之，當步驟S240的判定結(jié)果為"是"時，結(jié)束該聲紋數(shù)據(jù)注冊處理。
最后，本發(fā)明不必局限于本實施例，還可以在所附權(quán)利要求所限定的本發(fā)明的范圍內(nèi)以各種方式對其進行修改。
權(quán)利要求
1.一種語音處理器，包括提取器，用于從輸入語音提取語音特性數(shù)據(jù)；處理器，用于根據(jù)設(shè)置的信號處理參數(shù)來處理所述輸入語音；存儲器，用于存儲多個預置語音特性數(shù)據(jù)，每個預置語音特性數(shù)據(jù)對應于多組信號處理參數(shù)之一；以及參數(shù)設(shè)置設(shè)備，用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性的所述多個預置語音特性數(shù)據(jù)之一，并且用于將與所述選擇的預置語音特性數(shù)據(jù)對應的一組信號處理參數(shù)設(shè)置到所述處理器。
2. 根據(jù)權(quán)利要求1的所述語音處理器，進一步包括用于接收輸入其中的語音信號以產(chǎn)生語音信號的語音通信器，以及用于根據(jù)用戶指令來編輯所述信號處理參數(shù)的參數(shù)編輯器，其中所述提取器從所述語音信號提取表示所述輸入語音特性的語音特性數(shù)據(jù)，并且其中所述存儲器存儲與編輯的信號處理參數(shù)有關(guān)的所述提取的語音特性數(shù)據(jù)。
3. —種通信終端設(shè)備，包括語音通信器，用于執(zhí)行與配對通信設(shè)備的通信以接收語音信號；以及語音處理器，它包括；提取器，用于從所述語音信號提取語音特性數(shù)據(jù)；處理器，用于根據(jù)設(shè)置的信號處理參數(shù)來處理所述語音信號；存儲器，用于存儲多個預置語音特性數(shù)據(jù)，每個預置語音特性數(shù) 據(jù)對應于多組信號處理參數(shù)之一；以及參數(shù)設(shè)置設(shè)備，用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性的所述多個預置語音特性數(shù)據(jù)之一，并且用于將與所述選擇的預置語音特性數(shù)據(jù)對應的一組信號處理參數(shù)設(shè)置到所述處理器。
4. 根據(jù)權(quán)利要求1的所述語音處理器，其中所述處理器包括高音補償器、增強器、動態(tài)范圍壓縮器和均衡器中的至少一個。
5. 根據(jù)權(quán)利要求4的所述語音處理器，其中所述信號處理參數(shù)定義了關(guān)于所述高音補償器、所述增強器、所述動態(tài)范圍壓縮器和所述均衡器之一的處理內(nèi)容。
6. 根據(jù)權(quán)利要求1的所述語音處理器，其中當所述存儲器沒有存儲與所述提取的語音特性數(shù)據(jù)具有相似性的預置語音特性數(shù)據(jù)時，所述參數(shù)設(shè)置設(shè)備將預先準備的所述信號處理參數(shù)的默認值設(shè)置到所述處理器。
7. 根據(jù)權(quán)利要求1的所述語音處理器，其中所述語音特性數(shù)據(jù)是聲紋數(shù)據(jù)。
8. 根據(jù)權(quán)利要求3的所述通信終端設(shè)備，其中所述語音特性數(shù)據(jù) 是聲紋數(shù)據(jù)。
全文摘要
在結(jié)合于通信終端設(shè)備內(nèi)的語音處理器中，提取器從向其輸入的語音信號中提取語音特性數(shù)據(jù)(如聲紋數(shù)據(jù))；然后，語音信號處理模塊根據(jù)預先在存儲器內(nèi)存儲的與預置的語音特性數(shù)據(jù)有關(guān)的信號處理參數(shù)來處理輸入語音信號。參數(shù)設(shè)置設(shè)備選擇預置的語音特性數(shù)據(jù)中與所提取的語音特性數(shù)據(jù)具有相似性的一個語音特性數(shù)據(jù)，以便于將存儲在存儲器內(nèi)的相應的信號處理參數(shù)設(shè)置到語音信號處理模塊。因此，通信終端設(shè)備能夠適當?shù)靥幚磔斎胝Z音信號，以便于增強特定范圍或調(diào)節(jié)輸入語音的音量。
文檔編號G10L21/00GK101345055SQ200810135658
公開日2009年1月14日申請日期2008年7月9日優(yōu)先權(quán)日2007年7月11日
發(fā)明者川島隆宏申請人:雅馬哈株式會社

完整全部詳細技術(shù)資料下載