用于分離信號路徑的方法及用于改善電子喉語音的應(yīng)用的制作方法

文檔序號：2824739閱讀：414來源：國知局

專利名稱：用于分離信號路徑的方法及用于改善電子喉語音的應(yīng)用的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于提高電子喉(EL)說話者的語音質(zhì)量的方法，其中說話者的語音信號通過適當?shù)氖侄伪粩?shù)字化。在這里，適當?shù)氖侄卫缡蔷哂邢鄳?yīng)模數(shù)轉(zhuǎn)換器的傳聲器、電話或者利用電子設(shè)備的其他方法。
背景技術(shù)：
EL是一種用于例如為手術(shù)摘除了喉頭的患者形成人造的替代聲音的設(shè)備。其中 EL放置在下顎的底側(cè)；具有特定頻率的聲音發(fā)生器使口腔中的空氣經(jīng)由軟組織在下顎的底側(cè)振動。然后，這個振動被說話器官調(diào)制，從而說話成為了可能。因為聲音發(fā)生器大多以一頻率工作，所以聲音聽起來單調(diào)不自然或者“機械”。此外缺點還在于EL的振動干擾語音感知或甚至蓋過語音感知，因為一部分聲波在口腔中發(fā)音。直接由設(shè)備或在喉嚨會合點處出現(xiàn)的分量疊加到被發(fā)音的部分，并且降低了清晰度。尤其是對于在喉嚨區(qū)域中受到過放射線療法、因此組織結(jié)構(gòu)僵化的說話者是這樣的情況。因此開發(fā)了不同的應(yīng)當相對于干擾信號(即直達聲波或未調(diào)制的EL振動)放大有效信號(即被發(fā)音的振動)的方法。其中這些方法大多在以下情形中使用聽者不是直接接受所發(fā)射的聲音，而是使用電子裝置，例如在打電話時、在錄音時或一般性地在通過傳聲器和放大器說話時。在US6359988B1中，EL聲音信號經(jīng)過對數(shù)倒頻譜分析并且與正常說話者的語音疊加，由此可以使以EL發(fā)聲的音調(diào)變化更自然；同時，由此還抑制了信號中發(fā)射的直達聲波的分量。該方案的缺點主要在于對于EL說話者的每個發(fā)音，同時需要健康的(即在沒有 EL發(fā)音的情況下)說話者的相同發(fā)音，這實際上幾乎不能實現(xiàn)。US6975984B2展示了另一方案，其中介紹了用于改善電話通信中EL語音信號的方案。其中，在數(shù)字信號處理器中處理語音信號，使得EL嗡嗡的基本噪聲被識別出并且從語音信號中去除。為此，語音信號被劃分為有聲分量和無聲分量，并且被分開地處理。有聲部分被分塊地傅立葉變換、頻率過濾(基頻和諧波被進一步使用)、逆變換并且然后從整個原始信號中減去。原始信號的無聲分量剩下。替代地，也可以通過低通濾波器過濾有聲分量，在識別到說話間隔的情況下完全濾出有聲分量并且然后疊加無聲分量。Carol Y. Espy-Wilson 等人的文獻"Enhancement of Electrolaryngeal Speech by Adaptive Filtering” (JSLHR，41 :1253-1264，1988)介紹了一種提高 EL 說話者語音質(zhì)量的方法。其中，EL的基本噪聲借助于自適應(yīng)濾波而適配于被EL基本噪聲干擾的語音信號 (或發(fā)音為語言的EL基本噪聲)；在另一步驟中，這些信號被相互提取。誤差信號剩下，該誤差信號用于控制和適配過濾參數(shù)以便使該誤差信號最小化。在該方法中的誤差信號是從 EL基本噪聲釋放的語音信號。其中假設(shè)雖然語音信號中的干擾信號與EL基本噪聲相關(guān)，但是感興趣的語音信號與其他信號無關(guān)，那么產(chǎn)生干擾的基本噪聲和語音信號源自不同的來源。Hanjun Liu 等人白勺文獻"Enhancement of Electrolarynx Speech Based onAuditory Masking，， (IEEE Transactions on Biomedical Engineering,53(3) :865-874, 2006)介紹了尤其是相對于環(huán)境嘈雜對EL發(fā)音進行信號改善的減法算法。與預(yù)先規(guī)定減法參數(shù)的其他方法不同，在該算法中，減法參數(shù)基于聽覺掩蔽在頻率范圍中適配。其中源自于語音和背景噪聲是不相關(guān)的，并且因此背景噪聲可以被評估并且可以在頻率范圍中從信號中提取。這些方案公共地是使用基于模型的方法，即語音與干擾信號(例如環(huán)境噪聲，但是還有EL的基本噪聲)在統(tǒng)計上是無關(guān)的或不相關(guān)的。由于這些假設(shè)，所述方法以開銷非常大的方式實現(xiàn)。如果試圖以(自適應(yīng)的)陷波濾波器抑制直達聲波，由此還降低了語音信號的質(zhì)量，該語音信號于是聽起來如耳語一樣；語音信號和干擾噪聲處于相同諧波中。US2005/0004604A1介紹了一種喉方案，其中發(fā)聲器和傳聲器直接放置在使用者的嘴前，發(fā)聲器發(fā)出音強很小的聲音，并且用于進一步處理的信號通過傳聲器被接收。在進一步處理中，信號基本上被以梳形濾波器濾波，以便減小或去除信號的諧波。但是，語音信號的質(zhì)量也強烈地受到損害。W02006/099670A1中介紹了一種監(jiān)視呼吸道的設(shè)備，其中可聽頻率范圍中的聲波被引入到對象的呼吸道中，并且根據(jù)反射或處理后的聲波確定呼吸道的狀態(tài)。因此例如可以檢測呼吸道的移位。在該發(fā)明的一變體方案中，借助于FFT(快速傅立葉變化)檢查超過特定閾值，由此推斷所測量的信號的處理。

發(fā)明內(nèi)容
本發(fā)明的一個任務(wù)是克服現(xiàn)有技術(shù)的上述缺點以及提高在使用電子裝置(例如傳聲器)的情況下EL使用者的語音質(zhì)量。根據(jù)本發(fā)明，該任務(wù)以開頭提到的類型的一種方法通過以下步驟來實現(xiàn)a)通過從時域轉(zhuǎn)換為離散頻域，將單通道語音信號劃分為一系列頻道，b)在每個頻道中借助于高通濾波器或陷波濾波器濾出EL的調(diào)制頻率，和c)將濾波后的語音信號從頻域反變換到時域中，并且組合為一個單通道的輸出信號。本發(fā)明利用EL應(yīng)用的一種改進的模型，由此，被發(fā)音為語音信號的EL基本噪聲以及EL的干擾語音信號感知的未改變的分量來自共同的源，即EL。因為EL的產(chǎn)生干擾的未發(fā)音的基本噪聲在調(diào)制區(qū)域中能被識別為不隨時間變化的信號，所以可以通過適當?shù)姆绞饺菀椎貫V出。也就是說，不是由信號源、而是由傳播路徑(一個通過說話者的說話器官的傳播路徑，另一個從說話者喉嚨處使用位置直接到聽者耳朵或者到傳聲器或記錄裝置的傳播路徑)來進行分離。本領(lǐng)域技術(shù)人員已知多種可能性來將數(shù)字化的單通道信號轉(zhuǎn)換到頻域中并因此劃分為一系列頻道。在每個頻道中，EL的調(diào)制頻率通過適當?shù)臑V波器(例如應(yīng)用于數(shù)值的高通濾波器或陷波濾波器)而被抑制，并且因此被發(fā)音的信號分量的質(zhì)量被改善。現(xiàn)有技術(shù)中類似的方法將發(fā)音的分量以及未改變的分量看作為來自不同的源，并且選擇對應(yīng)于該模型的方式，例如借助于帶通濾波器進行濾波，帶通濾波器于是顯然也使語音信號衰減。
根據(jù)本發(fā)明的方法因此設(shè)計為提高EL使用者的語音的可理解性或使信號更適度和“人性”。目的是減少或消除在經(jīng)由電子手段(例如電話)進行交流時來自EL的直達聲波。根據(jù)本發(fā)明的方法的實現(xiàn)例如可以通過軟件插件作為硬布線方案或者也作為模擬電路來進行。從多種已知的用于將信號轉(zhuǎn)換到頻域中或進行相反轉(zhuǎn)換的方法中，根據(jù)本發(fā)明的方法的步驟a)中轉(zhuǎn)換有利地借助于傅立葉變換進行，步驟c)中的反變換有利地借助于傅立葉逆變換進行。轉(zhuǎn)換分塊地(例如20ms的塊)以短的間隔(例如每IOms進行刷新)地進行。在將信號轉(zhuǎn)換到頻域中時，將信號劃分為一系列頻道。在本發(fā)明的一種變體方案中，步驟a)中語音信號的轉(zhuǎn)換以及步驟c)中的反變換以相應(yīng)的濾波器組進行。如果在步驟b)中的濾波之前進行信號壓縮并且在步驟b)之后進行解壓縮，則根據(jù)本發(fā)明的方法的結(jié)果可以進一步改善。通過壓縮可以防止對于高振幅其改變占主導地位使得小振幅的改變不被考慮。因此，通過壓縮，相對改變對于濾波器而言可見性更好。在根據(jù)本發(fā)明的另一實施方式中，在步驟C)中的反變換之前進行對負的信號分量的檢波。

下面借助于附圖中所示的非限制性的實施例纖細描述本發(fā)明。附圖中圖1示意性地示出了 EL使用的一種簡化表示以及產(chǎn)生的信號路徑；圖2示意性地示出了根據(jù)本發(fā)明的方法能應(yīng)用于的情形的一種簡化表示；以及圖3示意性地示出了根據(jù)本發(fā)明的方法的框圖。
具體實施例方式在圖1中示出了 EL 1的信號的不同傳輸路徑。其中，EL 1設(shè)置在說話者2的喉嚨上。由EL 1產(chǎn)生的聲波一方面?zhèn)鞑ネㄟ^第一說話者2的正常說話通道(嘴和鼻)，并且在那里被發(fā)音為語音；這個第一信號3是顯著變化的或隨時間變化的。在聽者4的耳朵處，除了這個隨時間變化的信號3之外還有EL 1的直達聲波形式的第二信號6 (在圖1中以虛線示出)，這個信號4很大程度上是不變的并且因此認為是不隨時間變化的。總信號的第二部分6(即EL 1的基本噪聲)被聽者4感知為干擾信號，并且降低了說話者2的語音的清晰度。因此，借助于EL 1進行的原始激發(fā)經(jīng)由兩個不同的路徑被傳輸。當然本發(fā)明涉及在使用電子裝置的情況下而不是對于聽者提高EL說話者的語音質(zhì)量，因此信號例如以傳聲器被接收。但是為了說明初始狀態(tài)，處于更清楚地原因選擇這個一般性的模型。圖2示出了根據(jù)本發(fā)明的用于抑制進行干擾的第二信號6(參見圖1)的方法應(yīng)用于的情形的一種簡化模型圖示。能清楚地看出，根據(jù)本發(fā)明的方法不涉及信號源的分離，而是傳播路徑的分離。信號源7的源信號X(W)經(jīng)由兩個不同的信號路徑傳播。在第一信號路徑中，輸出信號被隨時間變化的濾波器H(w，t)調(diào)制為隨時間變化的信號X(w)H(w，t)。在第二信號路徑中，輸出信號只被不隨時間變化的濾波器F (w)改變?yōu)樾盘朮(W)F(W)。這兩個路徑的信號然后在接收者8 (例如聽者的耳朵、傳聲器等)中相加為供測量的信號S(w，t)。該信號于是由分量的加和構(gòu)成，S(w，t) =x(w)H(w, t)+χ(w)F(w)0現(xiàn)在，不隨時間變化的信號路徑的信號分量和隨時間變化的信號路徑的信號分量可以被分離，其中隨時間變化所有信號分量或隨時間變化保持不變的所有信號分量被衰減。因此例如只獲得隨時間變化的分量Sl (w，t) X(w)H(w，t)作為結(jié)果。在用于利用EL的語音的情況下，未發(fā)音的信號分量χ (w) F (w)(即EL的基本噪聲) 疊加到隨時間變化的語音信號X(w)H(w，t)，并且由此導致語音信號的可理解性損失。通過將隨時間變化的信號分量與不隨時間變化的信號分量分開，語音可理解性被改善。圖3示出了根據(jù)本發(fā)明的方法的一種可能轉(zhuǎn)化。其中，在輸入端是具有EL的說話者的任意數(shù)字語音信號9。在第一步驟10中，利用短期傅立葉變換，語音信號9被分塊地變換到頻域中，并且因此被劃分為一系列頻道。本領(lǐng)域技術(shù)人員在這里可以從建立的各種用于見信號從時域變換到頻域中的方法中進行選擇；除了傅立葉變換之外，例如還可以使用離散余弦變換，但是對于根據(jù)本發(fā)明的應(yīng)用的前提是該變換是可逆的。信號以特定的刷新速率(例如IOms)被劃分為例如20ms長的塊，這些塊分別展開到一系列頻道11中。原始的單通道語音信號9因此被分為多個隨著時間變化的頻率范圍。頻率信號是復(fù)數(shù)的，但是在后面只有絕對值被改變，相位15保持不變。在步驟10中，也可以使用濾波器組，其中信號的采樣率在濾波器組之后被減小。其中，采樣率的減小對應(yīng)于在應(yīng)用傅立葉變化的情況下的分塊。在另一功能框12中，現(xiàn)在每個頻道11被濾波，例如利用高通或陷波濾波器。這個濾波使得能夠濾出特定的頻率，在聲學技術(shù)中，利用陷波濾波器消除窄帶干擾。因為EL在特定頻率上振蕩(例如100Hz)，所以在頻域振幅中在IOOHz通道中以調(diào)制頻率OHz產(chǎn)生不被說話者的說話器官改變的干擾信號，即EL信號的振幅不變。干擾信號的特征在于其完全不隨時間變化。為了過濾EL的基本噪聲，使用陷波濾波器或高通濾波器。其中，EL的調(diào)制頻率用作為高通濾波器的極限頻率；陷波濾波器被選擇為使得其正好在調(diào)制頻率閉鎖EL。在實際轉(zhuǎn)化中，由于反射、折射、環(huán)境噪聲以及EL的構(gòu)造必要性，當然不能實現(xiàn)完美的隨時間的恒定性。但是因為濾波器也不限制到僅僅一個頻率，而是覆蓋一定頻率范圍，在本情形下是調(diào)制頻率范圍，所以確保了根據(jù)本發(fā)明的方法的功能。在最后的功能框13中進行信號到時域的反變換，例如借助于傅立葉逆變換，并且例如借助于交迭相加將頻道11組合回為一個通道。其中，交迭相加法是數(shù)字信號處理中本領(lǐng)域技術(shù)人員已知的一種方法。結(jié)果是單通道的輸出信號14，其中EL的干擾信號被濾出或者至少被衰減。輸出信號然后可以被進一步處理。在步驟10中使用濾波器組的情況下，信號的采樣率在步驟12中的濾波之后又被提高，然后如所述的那樣繼續(xù)處理?；旧?，這些實施方式只表示了根據(jù)本發(fā)明的方法的最重要的部分；在框12中的濾波之前可以壓縮信號，在濾波之后可以進行解壓縮。在反變化到時域中之前還進行檢波可以是有利的，因為在處理中可能產(chǎn)生不允許的負值。本發(fā)明例如可以用作為用于打電話的附件。對于傳統(tǒng)的模擬電話機，該附件可以容易地集成到聽筒中。對于集成有數(shù)字信號處理器的電話機，本發(fā)明的集成可以通過軟件插件來實現(xiàn)。也可以在硬布線方案的情況下(例如也在模擬電路中)實現(xiàn)。根據(jù)本發(fā)明的方法在使用EL的情況下也可以使用，其中可以在兩個或更多個頻率之間可以來回轉(zhuǎn)換，以便為語音提供更真實的聲音。這不僅適用于離散的跳頻，而且適用于基頻的連續(xù)變化，假設(shè)進行切換的頻率位于基本信號被劃分到的頻帶內(nèi)的話。其中，調(diào)制頻率濾波器的寬度確定頻率可以多快地變化。對于非常緩慢的連續(xù)變化，頻率在抑制生效的情況下在該頻帶的整個范圍上變化，起決定作用的不是大小，而是改變的速度。在對應(yīng)于快速變化的EL接通和關(guān)斷時，抑制只有在幾毫秒之后才發(fā)生，取決于陷波濾波器被選擇為多寬或高通濾波器的基頻位于哪里。其中當然，基頻的變化不允許過大。為了確保根據(jù)本發(fā)明的功能，例如信號被劃分到的頻帶必須被擴展，或者借助于高通濾波器進行的濾波必須設(shè)置在更高的頻率。
權(quán)利要求
1.一種用于提高電子喉(EL)說話者的語音質(zhì)量的方法，所述說話者的語音信號通過適當?shù)难b置被數(shù)字化，其特征在于包括以下步驟a)通過從時域轉(zhuǎn)換為離散頻域，將單通道語音信號劃分為一系列頻道，b)在每個頻道中借助于高通濾波器或陷波濾波器濾出所述電子喉的調(diào)制頻率，和c)將濾波后的語音信號從頻域反變換到時域中，并且組合為一個單通道的輸出信號。
2.如權(quán)利要求1所述的方法，其特征在于，步驟a)中語音信號的轉(zhuǎn)換借助于傅立葉變化進行，步驟c)中的反變換借助于傅立葉逆變換進行。
3.如權(quán)利要求1所述的方法，其特征在于，步驟a)中語音信號的轉(zhuǎn)換和步驟c)中頻道的組合由濾波器組進行。
4.如權(quán)利要求1至3之一所述的方法，其特征在于，在步驟b)中的濾波之前進行信號壓縮，在步驟b)之后進行解壓縮。
5.如權(quán)利要求1至4之一所述的方法，其特征在于，在步驟c)中反變換之前，對負的信號分量進行檢波。
全文摘要
為了提高電子喉(EL)說話者的語音質(zhì)量，該說話者的語音信號通過適當?shù)难b置被數(shù)字化，執(zhí)行以下步驟a)通過從時域轉(zhuǎn)換為離散頻域?qū)瓮ǖ勒Z音信號劃分為一系列頻道，b)在每個頻道中借助高通濾波器或陷波濾波器濾出EL的調(diào)制頻率，和c)將濾波后的語音信號從頻域反變換到時域中并且組合為一個單通道的輸出信號。
文檔編號G10L21/02GK102341853SQ201080010113
公開日2012年2月1日申請日期2010年2月1日優(yōu)先權(quán)日2009年2月4日
發(fā)明者G·庫賓, M·哈格姆勒申請人:海莫梅德海因澤有限及兩合公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：Ｍ·哈格姆勒
技術(shù)所有人：海莫梅德海因澤有限及兩合公司
我是此專利的發(fā)明人

上一篇：語音識別裝置的制作方法
上一篇：用于操縱包括暫態(tài)事件的音頻信號的裝置、方法和計算機程序的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

信號回流路徑相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于分離信號路徑的方法及用于改善電子喉語音的應(yīng)用的制作方法