專利名稱:聲處理系統(tǒng)、聲處理裝置、聲處理方法、聲處理程序及存儲(chǔ)媒體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲處理系統(tǒng)、聲處理裝置、聲處理方法、聲處理程序及存儲(chǔ)媒體,特別涉及抑制聲信號(hào)的回波分量、處理抑制了回波分量的聲信號(hào)的聲處理系統(tǒng)、聲處理裝置、聲處理方法、聲處理程序及存儲(chǔ)媒體。
背景技術(shù):
以往,作為這種聲處理裝置,已知有下述電視會(huì)議系統(tǒng)或免提通話系統(tǒng)等在從揚(yáng)聲器輸出遠(yuǎn)端話者的語(yǔ)音或音樂(lè)等聲音的環(huán)境下,用話筒拾取從揚(yáng)聲器輸出的聲音和近端話者的語(yǔ)音,將拾取的聲音作為近端話者的語(yǔ)音發(fā)送到遠(yuǎn)端話者。
在這種現(xiàn)有的聲處理裝置中,為了解決從揚(yáng)聲器輸出的聲音作為回聲混入到話筒中這一問(wèn)題,采用了回波消除器來(lái)抑制拾取的聲音中的回波分量。
所謂回波消除器,是利用從揚(yáng)聲器輸出的聲音是已知的這一事實(shí)、根據(jù)從揚(yáng)聲器輸出的已知聲音和輸入到話筒中的聲音用自適應(yīng)濾波器來(lái)估計(jì)輸入到話筒中的聲音中混入的的回波分量、抑制回波分量的裝置。采用了該回波消除器的聲處理裝置例如在(日本)電子情報(bào)通信學(xué)會(huì)(編)《音響システムとデイジタル処理》(pp.209-218,コロナ社,1995)或(日本)北脅信彥(編著)《デイジタル音聲·オ—デイオ技術(shù)》(オ—ム社,pp.221-257,1999)等中有詳細(xì)說(shuō)明。
此外,在包括語(yǔ)音識(shí)別部來(lái)識(shí)別話者語(yǔ)音的語(yǔ)音對(duì)話系統(tǒng)中,例如在汽車導(dǎo)航系統(tǒng)的語(yǔ)音對(duì)話部中,在從揚(yáng)聲器例如輸出了“您有什么事?”這一引導(dǎo)語(yǔ)音時(shí),為了不與“您有什么事?”這一引導(dǎo)語(yǔ)音混合來(lái)識(shí)別話者的語(yǔ)音“想去A游樂(lè)場(chǎng)?!?,也要求降低回波分量。
此外,在現(xiàn)有的語(yǔ)音對(duì)話系統(tǒng)中,有下述制約在輸出引導(dǎo)語(yǔ)音期間,不執(zhí)行話筒取入的聲音的語(yǔ)音識(shí)別,在未輸出引導(dǎo)語(yǔ)音期間執(zhí)行話筒取入的聲音的語(yǔ)音識(shí)別。
然而,等待引導(dǎo)語(yǔ)音結(jié)束容易使人煩躁。近來(lái),為了在輸出引導(dǎo)語(yǔ)音期間插入話者的語(yǔ)音,提出了稱為強(qiáng)插(Barge-in)的各種插入方法。(例如(日本)北脅信彥(編著)《音のコミユニケ—シヨン工學(xué)》(コロナ社,pp.128-130,1996))。
用語(yǔ)音對(duì)話系統(tǒng)來(lái)實(shí)現(xiàn)強(qiáng)插時(shí)的問(wèn)題是,如果包含引導(dǎo)語(yǔ)音作為回波分量,則對(duì)話者的語(yǔ)音的語(yǔ)音識(shí)別造成惡劣影響,容易誤識(shí)別,所以利用回波消除器來(lái)減少回波分量。然而,仍有殘留回波,難以減少回波分量。
例如,在(日本)特開平8-107375號(hào)公報(bào)(第4-5頁(yè),圖1)中記載的“聲信號(hào)記錄再生裝置”及(日本)特開平8-51385號(hào)公報(bào)(第3-4頁(yè),圖1)中記載的“信息處理裝置”中,如圖33所表示,包括聲信號(hào)輸入部件1、揚(yáng)聲器2、話筒3、回波消除器4、以及聲信號(hào)輸出部件5,回波抑制部件4減少回波分量。此外,在(日本)特開2001-94379號(hào)公報(bào)(第3-4頁(yè),圖1)中記載的“語(yǔ)音輸入方式”中,通過(guò)從回波消除器處理過(guò)的信號(hào)中只提取語(yǔ)音部分,再次從揚(yáng)聲器輸出,使話者確認(rèn)發(fā)聲內(nèi)容。然而,由于是在噪聲環(huán)境下、或者回波路徑隨時(shí)間變化等原因而使回波分量的估計(jì)精度降低,所以不能減少殘留回波。
此外,在(日本)特開2001-134275號(hào)公報(bào)(第3-4頁(yè),圖5)中記載的“語(yǔ)音識(shí)別裝置”中,如圖34所表示,包括聲信號(hào)輸入部件1、揚(yáng)聲器2、話筒3、回波消除器4、聲信號(hào)輸出部件5、以及語(yǔ)音區(qū)間檢測(cè)部件6,回波消除器4判定是否存在話者的語(yǔ)音,語(yǔ)音區(qū)間檢測(cè)部件6提取語(yǔ)音區(qū)間,但是提取存在話者的語(yǔ)音的區(qū)間產(chǎn)生時(shí)延,所以在話者結(jié)束發(fā)聲之前,不能對(duì)該發(fā)聲的語(yǔ)音開始語(yǔ)音識(shí)別。
此外,在(日本)特開平5-323993號(hào)公報(bào)(第3-4頁(yè),圖1)中記載的“語(yǔ)音對(duì)話系統(tǒng)”、(日本)特許第3229335號(hào)公報(bào)(第4頁(yè),圖2)中記載的“語(yǔ)音處理裝置及方法”、及(日本)特開平7-264103號(hào)公報(bào)(第4頁(yè),圖1)中記載的“語(yǔ)音的疊加檢測(cè)方法及裝置和利用該檢測(cè)裝置的語(yǔ)音輸入輸出裝置”中,都判斷在輸入的聲信號(hào)中是否包含話者發(fā)聲的語(yǔ)音,在判斷為包含時(shí),分別開始語(yǔ)音識(shí)別,或者結(jié)束自適應(yīng)濾波器的學(xué)習(xí),或者結(jié)束適合回波消除器的學(xué)習(xí)的數(shù)據(jù)的取得。
然而,在這種現(xiàn)有的聲處理裝置中有下述問(wèn)題將從開始輸入話者發(fā)聲的語(yǔ)音、到判斷為輸入了話者發(fā)聲的語(yǔ)音的時(shí)間中輸入的話者發(fā)聲的語(yǔ)音誤識(shí)別為背景噪聲或回聲分量等,其結(jié)果是回波分量的估計(jì)精度降低,不能減少殘留回波。
本發(fā)明就是為了解決這種問(wèn)題而提出的,其目的在于提供一種聲處理裝置,能夠縮短輸出抑制了回波的聲信號(hào)所需的延時(shí),而且降低殘留回波。
發(fā)明內(nèi)容
第1發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括揚(yáng)聲器,將第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,根據(jù)上述第1聲信號(hào)和上述第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便使上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件存儲(chǔ)的第3聲信號(hào)內(nèi)的、從上述語(yǔ)音檢測(cè)部件檢測(cè)出的上述話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
通過(guò)該結(jié)構(gòu),聲處理裝置的語(yǔ)音檢測(cè)部件檢測(cè)出話者的語(yǔ)音的始端后,控制部件將回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使聲信號(hào)存儲(chǔ)部件輸出第4聲信號(hào),所以從開始輸入話者發(fā)聲的語(yǔ)音、到判斷為輸入了話者發(fā)聲的語(yǔ)音的時(shí)間中輸入的話者發(fā)聲的語(yǔ)音也作為第4聲信號(hào)來(lái)輸出,從而能夠高精度地估計(jì)回波分量,減少殘留回波。此外,不等待話者的語(yǔ)音結(jié)束就開始輸出第4聲信號(hào),所以能夠縮短輸出抑制了回波的聲信號(hào)所需的延時(shí)。
第2發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述回波抑制部件包含自適應(yīng)濾波器,估計(jì)上述第2聲信號(hào)的回波分量,生成用于表示估計(jì)出的回波分量的偽回波信號(hào);以及減法器,生成用于表示上述聲信號(hào)生成部件生成的第2聲信號(hào)和上述自適應(yīng)濾波器生成的偽回波信號(hào)之差的差信號(hào);上述自適應(yīng)濾波器根據(jù)上述第1聲信號(hào)和上述差信號(hào)來(lái)生成偽回波信號(hào);上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
通過(guò)該結(jié)構(gòu),回波抑制部件能夠抑制聲信號(hào)生成部件生成的第2聲信號(hào)的回波分量。
第3發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述回波抑制部件包含自適應(yīng)濾波器,估計(jì)濾波器系數(shù);卷積處理部,根據(jù)上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)對(duì)上述第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部,判定上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在上述濾波器系數(shù)穩(wěn)定的情況下,向上述卷積處理部傳送上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù);以及減法器,生成用于表示上述聲信號(hào)生成部件生成的第2聲信號(hào)和上述卷積處理部生成的偽回波信號(hào)之差的差信號(hào);上述自適應(yīng)濾波器根據(jù)上述第1聲信號(hào)和上述差信號(hào)來(lái)估計(jì)濾波器系數(shù);上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
通過(guò)該結(jié)構(gòu),自適應(yīng)濾波器根據(jù)第1聲信號(hào)和第2聲信號(hào)來(lái)估計(jì)濾波器系數(shù),系數(shù)傳送部在濾波器系數(shù)穩(wěn)定的情況下向卷積處理部傳送濾波器系數(shù),所以回波抑制部件能夠用卷積處理部生成的偽回波信號(hào)來(lái)高精度地抑制回波分量。
第4發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述回波抑制部件包含自適應(yīng)濾波器,估計(jì)濾波器系數(shù);第1聲信號(hào)存儲(chǔ)部,按先入先出的順序來(lái)存儲(chǔ)上述第1聲信號(hào),以便向第1聲信號(hào)施加延遲并輸出;第2聲信號(hào)存儲(chǔ)部,按先入先出的順序來(lái)存儲(chǔ)上述第2聲信號(hào),以便向第2聲信號(hào)施加延遲并輸出;卷積處理部,根據(jù)上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)對(duì)上述第1聲信號(hào)存儲(chǔ)部輸出的第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部,判定上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在上述濾波器系數(shù)穩(wěn)定的情況下,向上述卷積處理部傳送上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù);以及減法器,生成用于表示上述第2聲信號(hào)存儲(chǔ)部輸出的第2聲信號(hào)和上述卷積處理部生成的偽回波信號(hào)之差的差信號(hào);上述自適應(yīng)濾波器根據(jù)上述第1聲信號(hào)和上述差信號(hào)來(lái)估計(jì)濾波器系數(shù);上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
通過(guò)該結(jié)構(gòu),卷積處理部等待自適應(yīng)濾波器系數(shù)收斂后生成偽回波信號(hào),所以回波抑制部件能夠高精度地抑制第2聲信號(hào)的回波分量。
第5發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述回波抑制部件包含第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部,將上述第1聲信號(hào)作為第1學(xué)習(xí)數(shù)據(jù)來(lái)存儲(chǔ);第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部,將上述聲信號(hào)生成部件生成的第2聲信號(hào)作為第2學(xué)習(xí)數(shù)據(jù)來(lái)存儲(chǔ);控制部,控制上述第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部和上述第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部,以便相對(duì)應(yīng)地存儲(chǔ)上述第1聲信號(hào)和上述第2聲信號(hào);自適應(yīng)濾波器,根據(jù)上述第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部中存儲(chǔ)的第1聲信號(hào)和上述第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部中存儲(chǔ)的第2聲信號(hào)來(lái)估計(jì)濾波器系數(shù);卷積處理部,根據(jù)上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)對(duì)上述第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部,判定上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在上述濾波器系數(shù)穩(wěn)定的情況下,向上述卷積處理部傳送上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù);以及減法器,生成用于表示上述聲信號(hào)生成部件生成的第2聲信號(hào)和上述卷積處理部生成的偽回波信號(hào)之差的差信號(hào);上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
通過(guò)該結(jié)構(gòu),回波抑制部件即使在不能得到足以使自適應(yīng)濾波器算出的濾波器系數(shù)收斂的數(shù)據(jù)的情況下,也通過(guò)重復(fù)使用為學(xué)習(xí)而保存的數(shù)據(jù)而使濾波器系數(shù)收斂,卷積處理部用收斂的濾波器系數(shù)來(lái)生成偽回波信號(hào),所以能夠高精度地抑制第2聲信號(hào)的回波分量。
第6發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括通信部件,與具有生成第1聲信號(hào)的聲信號(hào)生成部件的外部設(shè)備經(jīng)網(wǎng)絡(luò)進(jìn)行通信,從上述外部設(shè)備接收上述第1聲信號(hào);揚(yáng)聲器,將該通信部件接收到的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述聲信號(hào)生成部件生成的第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便使上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件存儲(chǔ)的第3聲信號(hào)內(nèi)的、從上述語(yǔ)音檢測(cè)部件檢測(cè)出的上述話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
通過(guò)該結(jié)構(gòu),聲處理裝置能夠構(gòu)成與外部設(shè)備經(jīng)網(wǎng)絡(luò)相連的聲處理系統(tǒng)。
第7發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括通信部件,與外部設(shè)備經(jīng)網(wǎng)絡(luò)進(jìn)行通信,為了使上述外部設(shè)備的揚(yáng)聲器輸出上述第1聲信號(hào)所表示的聲音而將上述第1聲信號(hào)發(fā)送到上述外部設(shè)備,接收上述外部設(shè)備的聲信號(hào)生成部件生成的第2聲信號(hào);該外部設(shè)備具有揚(yáng)聲器,將第1聲信號(hào)變換為聲音,輸出變換出的聲音;以及聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制該通信部件接收到的第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便使上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件存儲(chǔ)的第3聲信號(hào)內(nèi)的、從上述語(yǔ)音檢測(cè)部件檢測(cè)出的上述話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
通過(guò)該結(jié)構(gòu),聲處理裝置能夠構(gòu)成與外部設(shè)備經(jīng)網(wǎng)絡(luò)相連的聲處理系統(tǒng)。
第8發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第1聲信號(hào)的信號(hào)電平和上述第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)第1聲信號(hào)的信號(hào)電平、第3聲信號(hào)的信號(hào)電平、以及預(yù)先設(shè)定的閾值,來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第9發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第3聲信號(hào)的噪聲分量,按照計(jì)測(cè)到的噪聲分量來(lái)更新預(yù)先設(shè)定的閾值,比較上述第1聲信號(hào)的信號(hào)電平及上述第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件即使在第3聲信號(hào)中包含噪聲分量的情況下,也能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第10發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件判定上述揚(yáng)聲器是否輸出了語(yǔ)音,根據(jù)該判定來(lái)更新預(yù)先設(shè)定的閾值,比較上述第1聲信號(hào)的信號(hào)電平及上述第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)揚(yáng)聲器輸出的聲音來(lái)更新閾值,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第11發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述揚(yáng)聲器輸出的聲音的持續(xù)時(shí)間,根據(jù)上述持續(xù)時(shí)間來(lái)更新預(yù)先設(shè)定的閾值,比較上述第1聲信號(hào)的信號(hào)電平及上述第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件即使在從揚(yáng)聲器輸出的聲音的合計(jì)時(shí)間短時(shí),也能夠通過(guò)更新閾值,來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第12發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)算表示上述第1聲信號(hào)的功率的第1功率值和表示上述第3聲信號(hào)的功率的第3功率值,比較算出的第1功率值及第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)容易測(cè)定的信號(hào)的功率,來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第13發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件執(zhí)行上述第1聲信號(hào)及第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)第3聲信號(hào)的頻率分析的結(jié)果來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第14發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第2聲信號(hào)的信號(hào)電平和上述第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第2聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)第2聲信號(hào)的信號(hào)電平、第3聲信號(hào)的信號(hào)電平、以及預(yù)先設(shè)定的閾值,來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第15發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)算表示上述第2聲信號(hào)的功率的第2功率值和表示上述第3聲信號(hào)的功率的第3功率值,比較算出的第2功率值及第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)第2聲信號(hào)的功率、第3聲信號(hào)的功率、以及預(yù)先設(shè)定的閾值,來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第16發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件執(zhí)行上述第2聲信號(hào)及上述第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)第2聲信號(hào)及第3聲信號(hào)的頻率分析的結(jié)果來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第17發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第1聲信號(hào)至上述第3聲信號(hào)的各信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)至第3聲信號(hào)的各信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)第1聲信號(hào)至第3聲信號(hào)的各信號(hào)電平和預(yù)先設(shè)定的閾值,來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第18發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件計(jì)算分別表示上述第1聲信號(hào)至上述第3聲信號(hào)的各功率的第1功率值、第2功率值及第3功率值,比較算出的第1聲信號(hào)至第3聲信號(hào)的各功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)第1聲信號(hào)至第3聲信號(hào)的各功率和預(yù)先設(shè)定的閾值,來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第19發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述語(yǔ)音檢測(cè)部件執(zhí)行上述第1聲信號(hào)至上述第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)第1聲信號(hào)至第3聲信號(hào)的頻率分析來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第20發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括音量調(diào)整部件,調(diào)整上述第1聲信號(hào)的信號(hào)電平,調(diào)整上述揚(yáng)聲器輸出的聲音的音量;上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述音量調(diào)整部件調(diào)整過(guò)的第1聲信號(hào)的信號(hào)電平和上述回波抑制部件輸出的第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)音量調(diào)節(jié)部件調(diào)節(jié)過(guò)的第1聲信號(hào)的信號(hào)電平、第3聲信號(hào)的信號(hào)電平、以及預(yù)先設(shè)定的閾值來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第21發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括音量調(diào)整部件,調(diào)整上述第1聲信號(hào)的信號(hào)電平,調(diào)整上述揚(yáng)聲器輸出的聲音的音量;上述語(yǔ)音檢測(cè)部件計(jì)算表示上述音量調(diào)整部件調(diào)整過(guò)的第1聲信號(hào)的功率的第1功率值和表示上述回波抑制部件輸出的第3聲信號(hào)的功率的第3功率值,比較算出的第1功率值及第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)音量調(diào)節(jié)部件調(diào)節(jié)過(guò)信號(hào)電平的第1聲信號(hào)的功率、第3聲信號(hào)的功率、以及預(yù)先設(shè)定的閾值來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第22發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括音量調(diào)整部件,調(diào)整上述第1聲信號(hào)的信號(hào)電平,調(diào)整上述揚(yáng)聲器輸出的聲音的音量;上述語(yǔ)音檢測(cè)部件執(zhí)行上述音量調(diào)整部件調(diào)整過(guò)的第1聲信號(hào)及上述回波抑制部件輸出的第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)音量調(diào)節(jié)部件調(diào)節(jié)過(guò)信號(hào)電平的第1聲信號(hào)和第3聲信號(hào)的頻率分析的結(jié)果來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第23發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括觸發(fā)信號(hào)生成部件,生成與應(yīng)檢測(cè)上述話者的語(yǔ)音的始端的時(shí)刻相關(guān)聯(lián)的觸發(fā)信號(hào);上述語(yǔ)音檢測(cè)部件根據(jù)上述觸發(fā)信號(hào)生成部件生成的觸發(fā)信號(hào)從上述第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)觸發(fā)信號(hào)生成部件生成的觸發(fā)信號(hào),來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第24發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述觸發(fā)信號(hào)生成部件生成與應(yīng)檢測(cè)上述話者的語(yǔ)音的始端的時(shí)刻相關(guān)聯(lián)的觸發(fā)信號(hào);上述語(yǔ)音檢測(cè)部件根據(jù)上述觸發(fā)信號(hào)生成部件生成的觸發(fā)信號(hào)從上述第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件能夠根據(jù)觸發(fā)信號(hào)生成部件生成的觸發(fā)信號(hào),來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第25發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述聲信號(hào)生成部件包括多個(gè)話筒元件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,分別生成多個(gè)聲信號(hào),多個(gè)聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;以及聲信號(hào)合成部,合成上述多個(gè)話筒元件分別生成的多個(gè)聲信號(hào),生成第2聲信號(hào);上述聲信號(hào)生成部件將上述聲信號(hào)合成部生成的第2聲信號(hào)輸出到回波抑制部件;上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述聲信號(hào)合成部生成的第2聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第2聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),聲處理裝置能夠提高話者發(fā)聲的語(yǔ)音的信噪比,同時(shí)能夠降低從揚(yáng)聲器輸出、輸入到聲信號(hào)生成部件中的第2聲信號(hào)的回波分量,所以語(yǔ)音檢測(cè)部件能夠根據(jù)第2聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第26發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述聲信號(hào)生成部件包括多個(gè)話筒元件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,分別生成多個(gè)聲信號(hào),多個(gè)聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;以及聲信號(hào)合成部,合成上述多個(gè)話筒元件分別生成的多個(gè)聲信號(hào),生成第2聲信號(hào);上述聲信號(hào)生成部件將上述聲信號(hào)合成部生成的第2聲信號(hào)輸出到回波抑制部件;上述語(yǔ)音檢測(cè)部件計(jì)算表示上述聲信號(hào)合成部生成的第2聲信號(hào)的功率的第2功率值,比較算出的第2功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),聲處理裝置能夠提高話者發(fā)聲的語(yǔ)音的信噪比,同時(shí)能夠降低表示從揚(yáng)聲器輸出、輸入到聲信號(hào)生成部件中的聲音的第2聲信號(hào)的回波分量,所以語(yǔ)音檢測(cè)部件能夠根據(jù)第2聲信號(hào)的功率和預(yù)先設(shè)定的閾值來(lái)高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第27發(fā)明的聲處理裝置具有下述結(jié)構(gòu),上述聲信號(hào)生成部件包括多個(gè)話筒元件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,分別生成多個(gè)聲信號(hào),多個(gè)聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;以及聲信號(hào)合成部,合成上述多個(gè)話筒元件分別生成的多個(gè)聲信號(hào),生成第2聲信號(hào);上述聲信號(hào)生成部件將上述聲信號(hào)合成部生成的第2聲信號(hào)輸出到回波抑制部件;上述語(yǔ)音檢測(cè)部件執(zhí)行上述聲信號(hào)合成部生成的第2聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),聲處理裝置提高話者發(fā)聲的語(yǔ)音的信噪比,同時(shí)降低表示從揚(yáng)聲器輸出、輸入到聲信號(hào)生成部件中的聲音的第2聲信號(hào)的回波分量,根據(jù)第2聲信號(hào)的頻率分析來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第28發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括噪聲抑制部件,抑制上述回波抑制部件輸出的第3聲信號(hào)的噪聲分量;上述語(yǔ)音檢測(cè)部件計(jì)測(cè)抑制了上述噪聲分量的第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)噪聲抑制部件抑制了噪聲分量的第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第29發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括噪聲抑制部件,抑制上述回波抑制部件輸出的第3聲信號(hào)的噪聲分量;上述語(yǔ)音檢測(cè)部件計(jì)算表示抑制了上述噪聲分量的第3聲信號(hào)的功率的第3功率值,比較算出的第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)噪聲抑制部件抑制了噪聲分量的第3聲信號(hào)的功率和預(yù)先設(shè)定的閾值來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第30發(fā)明的聲處理裝置具有下述結(jié)構(gòu),包括噪聲抑制部件,抑制上述回波抑制部件輸出的第3聲信號(hào)的噪聲分量;上述語(yǔ)音檢測(cè)部件執(zhí)行抑制了上述噪聲分量的第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)噪聲抑制部件抑制了噪聲分量的第3聲信號(hào)的頻率分析的結(jié)果來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第31發(fā)明的聲處理裝置具有下述結(jié)構(gòu),在上述系數(shù)傳送部判定為上述濾波器系數(shù)穩(wěn)定時(shí),上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第2聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第2聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)高精度地抑制了回波分量的第2聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第32發(fā)明的聲處理裝置具有下述結(jié)構(gòu),在上述系數(shù)傳送部判定為上述濾波器系數(shù)穩(wěn)定時(shí),上述語(yǔ)音檢測(cè)部件計(jì)算表示上述第2聲信號(hào)的功率的第2功率值,比較算出的第2功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)高精度地抑制了回波分量的第2聲信號(hào)的功率和預(yù)先設(shè)定的閾值來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第33發(fā)明的聲處理裝置具有下述結(jié)構(gòu),在上述系數(shù)傳送部判定為上述濾波器系數(shù)穩(wěn)定時(shí),上述語(yǔ)音檢測(cè)部件執(zhí)行上述第2聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)部件根據(jù)高精度地抑制了回波分量的第2聲信號(hào)的頻率分析的結(jié)果來(lái)檢測(cè)話者的語(yǔ)音,所以能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端。
第34發(fā)明的聲處理系統(tǒng)具有下述結(jié)構(gòu),包括包含第1及第2聲處理裝置的至少2個(gè)聲處理裝置;第1聲處理裝置具有揚(yáng)聲器,將輸入的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;以及通信部件,將上述第1聲信號(hào)發(fā)送到上述第2聲處理裝置;第2聲處理裝置具有揚(yáng)聲器,將輸入的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;以及通信部件,將上述第1聲信號(hào)發(fā)送到上述第1聲處理裝置;在上述第1聲處理裝置的語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述第1聲處理裝置的控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述第1聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);在上述第2聲處理裝置的語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述第2聲處理裝置的控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述第2聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào)。
通過(guò)該結(jié)構(gòu),即使在第1聲處理裝置及第2聲處理裝置未直接連接的狀態(tài)下第1聲處理裝置及第2聲處理裝置的聲信號(hào)生成部件分別拾取雙方的聲處理裝置的揚(yáng)聲器輸出的聲音的情況下,雙方的第1聲信號(hào)也分別輸入到雙方的回波抑制部件,所以能夠?qū)崿F(xiàn)任一個(gè)聲處理裝置的回波處理部件都能夠分別抑制第2聲信號(hào)的回波分量的系統(tǒng)。
第35發(fā)明的聲處理系統(tǒng)具有下述結(jié)構(gòu),上述第1聲處理裝置的回波抑制部件根據(jù)輸入到上述第1聲處理裝置中的第1聲信號(hào)、上述第1聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)、以及從上述第2聲處理裝置接收到的第1聲信號(hào)來(lái)抑制上述第1聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)的回波分量;上述第2聲處理裝置的回波抑制部件根據(jù)輸入到上述第2聲處理裝置中的第1聲信號(hào)、上述第2聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)、以及從上述第1聲處理裝置接收到的第1聲信號(hào)來(lái)抑制上述第2聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)的回波分量。
通過(guò)該結(jié)構(gòu),即使在第1聲處理裝置及第2聲處理裝置的聲信號(hào)生成部件分別拾取雙方的聲處理裝置的揚(yáng)聲器輸出的聲音的情況下,雙方的第1聲信號(hào)也分別輸入到雙方的回波抑制部件,所以能夠?qū)崿F(xiàn)任一個(gè)聲處理裝置的回波處理部件都能夠分別抑制第2聲信號(hào)的回波分量的系統(tǒng)。
第36發(fā)明的聲處理系統(tǒng)具有下述結(jié)構(gòu),包括音頻裝置,生成第1聲信號(hào);以及聲處理裝置,具有揚(yáng)聲器,取得上述音頻裝置生成的第1聲信號(hào),將取得的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);包括聲信號(hào)記錄裝置,取得上述聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出的第4聲信號(hào),記錄取得的第4聲信號(hào)。
通過(guò)該結(jié)構(gòu),聲處理裝置即使在揚(yáng)聲器將音頻裝置生成的第1聲信號(hào)作為聲音來(lái)輸出、聲信號(hào)生成部件生成包含表示揚(yáng)聲器輸出的聲音的回波分量和表示話者語(yǔ)音的語(yǔ)音分量的第2聲信號(hào)的情況下,語(yǔ)音檢測(cè)部件也能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端,聲信號(hào)記錄裝置也能夠記錄聲處理裝置輸出的第4聲信號(hào)。
第37發(fā)明的聲處理系統(tǒng)具有下述結(jié)構(gòu),包括汽車導(dǎo)航裝置,具有導(dǎo)航信息生成部件,生成導(dǎo)航信息;以及聲信號(hào)生成部件,生成第1聲信號(hào)作為與導(dǎo)航有關(guān)的引導(dǎo)語(yǔ)音;以及聲處理裝置,具有揚(yáng)聲器,取得上述汽車導(dǎo)航裝置的聲信號(hào)生成部件生成的第1聲信號(hào),將取得的第1聲信號(hào)變換為聲音,將變換出的聲音作為上述汽車導(dǎo)航裝置的引導(dǎo)語(yǔ)音來(lái)輸出;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);上述汽車導(dǎo)航裝置還具有語(yǔ)音識(shí)別部件,為了判定話者是否響應(yīng)上述引導(dǎo)語(yǔ)音發(fā)出了特定的語(yǔ)音,而執(zhí)行上述聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出的第4聲信號(hào)的語(yǔ)音識(shí)別;在用上述汽車導(dǎo)航裝置的語(yǔ)音識(shí)別部件判定為上述話者發(fā)出了特定的語(yǔ)音時(shí),上述汽車導(dǎo)航裝置的導(dǎo)航信息生成部件生成與上述特定的語(yǔ)音相應(yīng)的導(dǎo)航信息。
通過(guò)該結(jié)構(gòu),聲處理裝置即使在揚(yáng)聲器將汽車導(dǎo)航裝置生成的第1聲信號(hào)作為聲音來(lái)輸出、聲信號(hào)生成部件生成包含表示揚(yáng)聲器輸出的聲音的回波分量和表示話者語(yǔ)音的語(yǔ)音分量的第2聲信號(hào)的情況下,語(yǔ)音檢測(cè)部件也能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端,導(dǎo)航裝置也能夠輸入聲處理裝置輸出的第4聲信號(hào)來(lái)執(zhí)行語(yǔ)音識(shí)別。
第38發(fā)明的聲處理系統(tǒng)具有下述結(jié)構(gòu),包括外部設(shè)備,具有聲信號(hào)生成部件,生成用于表示語(yǔ)音的第1聲信號(hào);以及聲處理裝置,具有揚(yáng)聲器,取得上述外部設(shè)備的聲信號(hào)生成部件生成的第1聲信號(hào),將取得的第1聲信號(hào)變換為聲音,將變換出的聲音作為上述外部設(shè)備的語(yǔ)音來(lái)輸出;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);上述外部設(shè)備還具有語(yǔ)音識(shí)別部件,為了判定話者是否響應(yīng)上述揚(yáng)聲器輸出的語(yǔ)音發(fā)出了語(yǔ)音,而執(zhí)行上述聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出的第4聲信號(hào)的語(yǔ)音識(shí)別;上述外部設(shè)備的聲信號(hào)生成部件根據(jù)上述語(yǔ)音識(shí)別部件的語(yǔ)音識(shí)別來(lái)生成用于表示響應(yīng)語(yǔ)音的第1聲信號(hào),以便響應(yīng)上述話者發(fā)出的語(yǔ)音。
通過(guò)該結(jié)構(gòu),聲處理系統(tǒng)即使在揚(yáng)聲器將外部設(shè)備生成的第1聲信號(hào)作為聲音來(lái)輸出、聲信號(hào)生成部件生成包含表示揚(yáng)聲器輸出的聲音的回波分量和表示話者語(yǔ)音的語(yǔ)音分量的第2聲信號(hào)的情況下,語(yǔ)音檢測(cè)部件也能夠高精度地檢測(cè)第3聲信號(hào)的話者的語(yǔ)音的始端,外部設(shè)備也能夠輸入聲處理裝置輸出的第4聲信號(hào)來(lái)執(zhí)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別的結(jié)果來(lái)生成用于表示響應(yīng)話者發(fā)出的語(yǔ)音的響應(yīng)語(yǔ)音的第1聲信號(hào)。
第39發(fā)明的聲處理方法具有下述結(jié)構(gòu),包括準(zhǔn)備步驟,準(zhǔn)備聲處理裝置,該聲處理裝置具有揚(yáng)聲器,將第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,根據(jù)上述第1聲信號(hào)和上述第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);回波抑制步驟,上述回波抑制部件根據(jù)第1聲信號(hào)和上述第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量;存儲(chǔ)步驟,上述聲信號(hào)存儲(chǔ)部件與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)第3聲信號(hào);語(yǔ)音檢測(cè)步驟,上述語(yǔ)音檢測(cè)部件從上述第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制步驟,上述控制部件控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述控制步驟中,在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào)。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)步驟檢測(cè)出話者的語(yǔ)音的始端后,控制部件將回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使聲信號(hào)存儲(chǔ)部件輸出第4聲信號(hào),所以能夠?qū)崿F(xiàn)一種聲處理方法,能夠不等待話者的發(fā)聲結(jié)束就開始輸出第4聲信號(hào),而且能夠?qū)拈_始輸入話者發(fā)聲的語(yǔ)音、到判斷為輸入了話者發(fā)聲的語(yǔ)音的時(shí)間中輸入的話者發(fā)聲的語(yǔ)音也作為第4聲信號(hào)來(lái)輸出。
第40發(fā)明的聲處理程序具有下述結(jié)構(gòu),能夠使計(jì)算機(jī)執(zhí)行,包括回波抑制步驟,根據(jù)第1聲信號(hào)和第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;存儲(chǔ)步驟,與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)步驟,從上述第3聲信號(hào)中檢測(cè)話者的語(yǔ)音;以及控制步驟,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述控制步驟中,在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào)。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)步驟檢測(cè)出話者的語(yǔ)音的始端,控制步驟將回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使聲信號(hào)存儲(chǔ)部件輸出第4聲信號(hào),所以能夠?qū)崿F(xiàn)一種聲處理程序,能夠不等待話者的發(fā)聲結(jié)束就開始輸出第4聲信號(hào),而且能夠?qū)拈_始輸入話者發(fā)聲的語(yǔ)音、到判斷為輸入了話者發(fā)聲的語(yǔ)音的時(shí)間中輸入的話者發(fā)聲的語(yǔ)音也作為第4聲信號(hào)來(lái)輸出。
第41發(fā)明的記錄媒體具有下述結(jié)構(gòu),記錄著計(jì)算機(jī)可執(zhí)行的聲處理程序,上述聲處理程序包括回波抑制步驟,根據(jù)第1聲信號(hào)和第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;存儲(chǔ)步驟,與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)步驟,從上述第3聲信號(hào)中檢測(cè)話者的語(yǔ)音;以及控制步驟,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述控制步驟中,在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào)。
通過(guò)該結(jié)構(gòu),語(yǔ)音檢測(cè)步驟檢測(cè)出話者的語(yǔ)音的始端,控制步驟將回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使聲信號(hào)存儲(chǔ)部件輸出第4聲信號(hào),所以能夠?qū)崿F(xiàn)一種存儲(chǔ)著聲處理程序的存儲(chǔ)媒體,能夠不等待話者的發(fā)聲結(jié)束就開始輸出第4聲信號(hào),而且能夠?qū)拈_始輸入話者發(fā)聲的語(yǔ)音、到判斷為輸入了話者發(fā)聲的語(yǔ)音的時(shí)間中輸入的話者發(fā)聲的語(yǔ)音也作為第4聲信號(hào)來(lái)輸出。
通過(guò)后面結(jié)合以下附圖進(jìn)行的描述,本發(fā)明的聲處理裝置的特征及優(yōu)點(diǎn)將會(huì)變得很明顯。
圖1是本發(fā)明第1實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖2是本發(fā)明第1實(shí)施方式的聲處理裝置的回波消除器的一例的方框圖。
圖3是本發(fā)明第1實(shí)施方式的聲處理裝置的回波消除器的一例的方框圖。
圖4是用于表示回波消除器的效果的時(shí)間信號(hào)波形的示例圖。
圖5是語(yǔ)音檢測(cè)部件的工作示例圖。
圖6是本發(fā)明第1實(shí)施方式第1其他形態(tài)的聲處理裝置的結(jié)構(gòu)的方框圖。
圖7是本發(fā)明第1實(shí)施方式第1其他形態(tài)的聲處理裝置的外形圖。
圖8是本發(fā)明第1實(shí)施方式第2其他形態(tài)的聲處理裝置的方框圖。
圖9是語(yǔ)音對(duì)話系統(tǒng)的示例圖。
圖10是語(yǔ)音對(duì)話系統(tǒng)的示例圖。
圖11是本發(fā)明第2實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖12是本發(fā)明第2實(shí)施方式的聲處理裝置的語(yǔ)音檢測(cè)部件設(shè)定閾值的閾值設(shè)定方法的示例圖。
圖13是對(duì)本發(fā)明第2實(shí)施方式的聲處理裝置輸出的聲信號(hào)進(jìn)行語(yǔ)音識(shí)別的情況下的語(yǔ)音識(shí)別率和對(duì)現(xiàn)有的聲處理裝置輸出的聲信號(hào)進(jìn)行語(yǔ)音識(shí)別的情況下的語(yǔ)音識(shí)別率之間進(jìn)行比較的比較圖。
圖14是本發(fā)明第3實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖15是本發(fā)明第4實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖16是本發(fā)明第5實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖17是本發(fā)明第6實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖18是本發(fā)明第7實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖19是本發(fā)明第8實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖20是本發(fā)明第9實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖21是本發(fā)明第10實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖22是本發(fā)明第11實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖23是本發(fā)明第12實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖24是本發(fā)明第13實(shí)施方式的聲處理裝置的結(jié)構(gòu)的方框圖。
圖25是本發(fā)明第14實(shí)施方式的聲處理系統(tǒng)的結(jié)構(gòu)的方框圖。
圖26是本發(fā)明第14實(shí)施方式的聲處理系統(tǒng)的回波消除器的結(jié)構(gòu)的方框圖。
圖27是本發(fā)明第14實(shí)施方式的聲處理系統(tǒng)的回波消除器的結(jié)構(gòu)的方框圖。
圖28是本發(fā)明第14實(shí)施方式的另一對(duì)應(yīng)的聲處理系統(tǒng)的結(jié)構(gòu)的方框圖。
圖29是將本發(fā)明的聲處理裝置應(yīng)用于電視操作系統(tǒng)的示例圖。
圖30是將本發(fā)明的聲處理裝置應(yīng)用于與機(jī)器人的語(yǔ)音對(duì)話系統(tǒng)的示例圖。
圖31是本發(fā)明第15實(shí)施方式的聲處理裝置的方框圖。
圖32是本發(fā)明第15實(shí)施方式的聲處理裝置的各步驟的流程圖。
圖33是現(xiàn)有的聲處理裝置的方框圖。
圖34是現(xiàn)有的聲處理裝置的方框圖。
具體實(shí)施例方式
以下參照?qǐng)D1至圖32來(lái)說(shuō)明本發(fā)明實(shí)施方式的聲處理裝置。
(第1實(shí)施方式)第1實(shí)施方式的聲處理裝置10如圖1所表示,包括聲信號(hào)輸入部件11,輸入表示聲音的第1聲信號(hào);揚(yáng)聲器12,將該聲信號(hào)輸入部件11輸入的第1聲信號(hào)變換為聲音,輸出變換出的聲音;以及話筒13,拾取該揚(yáng)聲器12輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào)。
這里,話筒13構(gòu)成聲信號(hào)生成部件。此外,第2聲信號(hào)包含表示話者語(yǔ)音的語(yǔ)音分量、通過(guò)拾取揚(yáng)聲器12輸出的聲音而生成的回波分量、以及從話筒13周邊的聲源生成的噪聲分量。
聲處理裝置10還包括回波消除器14,根據(jù)聲信號(hào)輸入部件11輸入的第1聲信號(hào)和話筒13生成的第2聲信號(hào)來(lái)抑制第2聲信號(hào)的回波分量,將抑制了回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件15,存儲(chǔ)回波消除器14輸出的第3聲信號(hào);語(yǔ)音檢測(cè)部件16,從回波消除器14輸出的第3聲信號(hào)中檢測(cè)話者的語(yǔ)音的始端;以及控制部件17,控制聲信號(hào)存儲(chǔ)部件15,以便使聲信號(hào)存儲(chǔ)部件15將聲信號(hào)存儲(chǔ)部件15存儲(chǔ)的第3聲信號(hào)內(nèi)的、從語(yǔ)音檢測(cè)部件16檢測(cè)出的話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
這里,回波消除器14構(gòu)成回波抑制部件。
回波消除器14如圖2所表示,包含自適應(yīng)濾波器19,估計(jì)第2聲信號(hào)的回波分量,生成用于表示估計(jì)出的回波分量的偽回波信號(hào);以及減法器20,生成用于表示話筒13生成的第2聲信號(hào)和自適應(yīng)濾波器19生成的偽回波信號(hào)之間的差分的差信號(hào);回波消除器14將減法器20生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。自適應(yīng)濾波器19根據(jù)第1聲信號(hào)和減法器20生成的差信號(hào)來(lái)生成偽回波信號(hào)。
這里,也可以將圖2所表示的本實(shí)施方式的回波消除器14置換為圖3所表示的回波消除器24?;夭ㄏ?4如圖3所表示,包含自適應(yīng)濾波器19,估計(jì)濾波器系數(shù);卷積處理部22,根據(jù)該自適應(yīng)濾波器19估計(jì)出的濾波器系數(shù)對(duì)第1聲信號(hào)進(jìn)行卷積處理,生成偽回波信號(hào);系數(shù)傳送部21,向卷積處理部22傳送自適應(yīng)濾波器19估計(jì)出的濾波器系數(shù);以及第1減法器23,生成用于表示話筒13生成的第2聲信號(hào)和卷積處理部22生成的偽回波信號(hào)之間的差分的差信號(hào);自適應(yīng)濾波器19根據(jù)第1聲信號(hào)和第1減法器23生成的差信號(hào)來(lái)估計(jì)濾波器系數(shù)。
此外,回波消除器24將第1減法器23生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。另一方面,自適應(yīng)濾波器19估計(jì)濾波器系數(shù),并且生成偽回波信號(hào)。
回波消除器24還包含第2減法器25,生成用于表示話筒13生成的第2聲信號(hào)和自適應(yīng)濾波器19生成的偽回波信號(hào)之間的差分的差信號(hào)。另一方面,自適應(yīng)濾波器19反饋第2減法器25生成的差信號(hào),更新濾波器系數(shù)。
系數(shù)傳送部21判定自適應(yīng)濾波器19估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在濾波器系數(shù)穩(wěn)定的情況下,向卷積處理部22傳送自適應(yīng)濾波器19估計(jì)出的濾波器系數(shù),更新卷積處理部22的濾波器系數(shù)。另一方面,卷積處理部22根據(jù)系數(shù)傳送部21更新過(guò)的濾波器系數(shù)來(lái)生成偽回波信號(hào)。
圖3所表示的回波消除器24例如記載于非專利文獻(xiàn)1《デユアルフイルタ構(gòu)成エコ—抑圧における係數(shù)転送方式について》(王、松井、寺田、中山著日本音響學(xué)會(huì)講演論文集,3-p-10,pp.491-492,Oct.1999)中。此外,對(duì)于圖3所表示的回波消除器24中的自適應(yīng)濾波器19的算法,在前述非專利文獻(xiàn)1或(日本)非專利文獻(xiàn)2《適応フイルタ入門》(S.ヘイキン著,武部干(譯)現(xiàn)代工學(xué)社,1987)中記載了各種手法,省略其詳細(xì)說(shuō)明。
此外,為了表示除揚(yáng)聲器12及話筒13以外的各部處理離散的時(shí)間序列信號(hào),第1聲信號(hào)及第2聲信號(hào)分別用標(biāo)號(hào)x(i)及d(i)來(lái)表示,i表示是離散的時(shí)間序列信號(hào)中的第i個(gè)信號(hào)。此外,假設(shè)第2聲信號(hào)的回波分量為y(i),第2聲信號(hào)的語(yǔ)音分量為s(i),第2聲信號(hào)的噪聲分量為n(i),則第2聲信號(hào)d(i)可表示為d(i)=s(i)+y(i)+n(i)。
這里,說(shuō)明下述情況例如在本實(shí)施方式的聲處理裝置10上連接汽車導(dǎo)航裝置,聲信號(hào)輸入部件11將表示該汽車導(dǎo)航裝置的引導(dǎo)語(yǔ)音的聲信號(hào)作為第1聲信號(hào)來(lái)接收,將接收到的第1聲信號(hào)輸出到揚(yáng)聲器12。
其中,圖4示出了話筒13生成的第2聲信號(hào)d(i)的回波分量y(i)、第2聲信號(hào)d(i)的語(yǔ)音分量s(i)、第2聲信號(hào)d(i)=y(tǒng)(i)+s(i)、回波消除器14生成的第3聲信號(hào)e(i)的時(shí)間波形的一例。此外,為了容易理解已抑制了回波分量,示出了可將背景噪聲n(i)看作零時(shí)的時(shí)間波形。
此外,對(duì)于回波消除器14輸出的第3聲信號(hào)e(i),比較了濾波器系數(shù)不穩(wěn)定時(shí)(濾波器系數(shù)的變動(dòng)未收斂時(shí))回波消除器14抑制了回波分量的情況下的第3聲信號(hào)e1(i)、和濾波器系數(shù)穩(wěn)定時(shí)(濾波器系數(shù)的變動(dòng)收斂時(shí))抑制了回波分量、從回波消除器14輸出的第3聲信號(hào)e2(i)。
如圖4(d)、(e)所表示,在濾波器系數(shù)不穩(wěn)定時(shí),未充分抑制回波分量,在第3聲信號(hào)e1中存在著殘留回波。另一方面,在濾波器系數(shù)穩(wěn)定時(shí),充分抑制了回波分量,在第3聲信號(hào)e2中不存在殘留回波。
語(yǔ)音檢測(cè)部件16計(jì)測(cè)第3聲信號(hào)e(i)的信號(hào)電平,比較計(jì)測(cè)到的第3聲信號(hào)e(i)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)話者的語(yǔ)音的始端,生成用于將是否是在第3聲信號(hào)中存在話者的語(yǔ)音的區(qū)間的判定結(jié)果通知給控制部件17的控制信號(hào)。
這里,語(yǔ)音檢測(cè)部件16也可以判定揚(yáng)聲器11是否輸出了聲音,根據(jù)該判定來(lái)更新預(yù)先設(shè)定的閾值,比較第3聲信號(hào)e(i)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)話者的語(yǔ)音的始端。
此外,語(yǔ)音檢測(cè)部件16也可以計(jì)測(cè)揚(yáng)聲器輸出的聲音的持續(xù)時(shí)間,根據(jù)該持續(xù)時(shí)間來(lái)更新預(yù)先設(shè)定的閾值,比較第3聲信號(hào)e(i)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)話者的語(yǔ)音的始端。
圖5比較示出了存在殘留回波及話者的語(yǔ)音的區(qū)間的第3聲信號(hào)e(i)和語(yǔ)音檢測(cè)部件16生成的控制信號(hào)。
語(yǔ)音檢測(cè)部件16生成的控制信號(hào),在語(yǔ)音檢測(cè)部件16未檢測(cè)出話者的語(yǔ)音的區(qū)間中生成用于表示OFF(“關(guān)”)狀態(tài)的控制信號(hào),從檢測(cè)出話者的語(yǔ)音的始端時(shí)起變化為ON(“開”)狀態(tài),在檢測(cè)出話者的語(yǔ)音的區(qū)間中生成用于表示ON狀態(tài)的控制信號(hào),輸出到控制部件17。
如圖5所表示,通常在比話者的發(fā)聲開始略晚的定時(shí)生成用于表示ON狀態(tài)的控制信號(hào)。因此,設(shè)發(fā)聲語(yǔ)音的檢測(cè)結(jié)果從OFF變?yōu)镺N的瞬間的時(shí)刻為Ton,聲信號(hào)存儲(chǔ)部件15由控制部件17控制,將從時(shí)刻Ton回溯了時(shí)間Tm的時(shí)刻Ts以后的信號(hào)e(i)作為第4聲信號(hào)來(lái)輸出。
因此,從聲信號(hào)存儲(chǔ)部件15中存儲(chǔ)的信號(hào)中減少回聲分量,通過(guò)聲信號(hào)輸出部件18來(lái)輸出包含用戶發(fā)聲的語(yǔ)音分量的信號(hào)。
接著,說(shuō)明本實(shí)施方式的聲處理裝置10的工作。
首先,例如將表示“您去哪兒?”這一引導(dǎo)語(yǔ)音的第1聲信號(hào)輸入到聲信號(hào)輸入部件11中。接著,將第1聲信號(hào)輸入到回波消除器14中,由揚(yáng)聲器12將引導(dǎo)語(yǔ)音輸出到空中。
在話者響應(yīng)引導(dǎo)語(yǔ)音、例如發(fā)出了“想去A游樂(lè)場(chǎng)。”時(shí),話筒13拾取話者的語(yǔ)音以及引導(dǎo)語(yǔ)音,生成包含表示話者語(yǔ)音的語(yǔ)音分量和表示作為回波而拾取的引導(dǎo)語(yǔ)音的回波分量的第2聲信號(hào)。該引導(dǎo)語(yǔ)音成為回聲,在對(duì)話者發(fā)聲的語(yǔ)音進(jìn)行語(yǔ)音處理的情況下成為干擾音,所以由回波消除器14進(jìn)行消除回聲的處理。
以下,以圖2為例來(lái)說(shuō)明回波消除器14進(jìn)行的回聲消除處理。
假設(shè)由聲信號(hào)輸入部件11輸入的引導(dǎo)語(yǔ)音的時(shí)間序列信號(hào)為x(i),該引導(dǎo)語(yǔ)音x(i)從揚(yáng)聲器12混入到話筒13中的信號(hào)、即回聲為y(i),用戶發(fā)聲的信號(hào)為s(i),背景噪聲信號(hào)為n(i),則輸入到話筒13中的信號(hào)d(i)可用d(i)=s(i)+y(i)+n(i)來(lái)表現(xiàn)。
此時(shí),自適應(yīng)濾波器19計(jì)算d(i)中包含的引導(dǎo)信號(hào)分量y(i)的估計(jì)值yd(i),作為回波消除器14的處理而進(jìn)行e(i)=d(i)-yd(i)。這樣得到消除了從話筒13輸入的信號(hào)d(i)中包含的引導(dǎo)語(yǔ)音分量的第3聲信號(hào)e(i),由聲信號(hào)存儲(chǔ)部件15來(lái)存儲(chǔ)。
將如前所述從回波消除器14輸出的第3聲信號(hào)e(i)臨時(shí)存儲(chǔ)到聲信號(hào)存儲(chǔ)部件15中。此時(shí),同時(shí)將來(lái)自回波消除器14的第3聲信號(hào)e(i)送至語(yǔ)音檢測(cè)部件16,進(jìn)行在第3聲信號(hào)e(i)中檢測(cè)用戶發(fā)聲的語(yǔ)音分量的檢測(cè)處理。該檢測(cè)處理例如根據(jù)信號(hào)的功率來(lái)進(jìn)行,觀測(cè)第3聲信號(hào)e(i)的平均功率P(i),在功率P(i)超過(guò)閾值TH時(shí)判斷為在e(i)中包含用戶發(fā)聲的語(yǔ)音分量。
接著,進(jìn)一步詳細(xì)說(shuō)明存在話者的語(yǔ)音的區(qū)間的提取。
如圖5所表示,回波消除器14輸出的第3聲信號(hào)e(i)表示引導(dǎo)語(yǔ)音的殘余即殘留回波、和該殘留回波之后接著的話者的語(yǔ)音。圖5示出了回波消除器14輸出的第3聲信號(hào)以及語(yǔ)音檢測(cè)部件16生成的控制信號(hào)。該控制信號(hào)取“H”電平和“L”電平這2個(gè)值,在檢測(cè)第3聲信號(hào)的話者的語(yǔ)音時(shí),將“H”電平與判定為存在話者的語(yǔ)音的區(qū)間相對(duì)應(yīng),將“L”電平與判定為不存在話者的語(yǔ)音的區(qū)間相對(duì)應(yīng)。因此,從“L”電平上升到“H”電平的時(shí)刻“Ton”是判定為存在話者的語(yǔ)音的區(qū)間的始端。
此外,如圖5所表示,在比話者的語(yǔ)音開始略晚的定時(shí),控制信號(hào)上升到“H”電平,所以控制部件17將回波消除器14輸出的第3聲信號(hào)存儲(chǔ)到聲信號(hào)存儲(chǔ)部件15中,將從控制信號(hào)上升的時(shí)刻“Ton”回溯了預(yù)先設(shè)定的時(shí)間“Tm”的時(shí)刻以后聲信號(hào)存儲(chǔ)部件15存儲(chǔ)的第3聲信號(hào)作為第4聲信號(hào)從聲信號(hào)存儲(chǔ)部件15輸出。
因此,控制部件17將只提取出存在話者的語(yǔ)音的區(qū)間的第4聲信號(hào)從聲信號(hào)存儲(chǔ)部件15輸出到聲信號(hào)輸出部件18,所以聲信號(hào)輸出部件18能夠向外部設(shè)備輸出減少了回波分量的第4聲信號(hào)。
如上所述,本實(shí)施方式的聲處理裝置10從檢測(cè)出存在話者的語(yǔ)音的區(qū)間的始端時(shí)起向外部設(shè)備輸出減少了回波分量的聲信號(hào),所以與檢測(cè)出存在話者的語(yǔ)音的區(qū)間的末端后向外部設(shè)備輸出減少了回波分量的聲信號(hào)的現(xiàn)有的聲處理裝置相比,能夠縮短回波抑制處理所需的時(shí)間。
此外,本實(shí)施方式的聲處理裝置10即使在不能充分抑制回波分量的環(huán)境下,也能夠在回波消除器輸出的第3聲信號(hào)中比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,作為第4聲信號(hào)輸出到外部設(shè)備。
此外,在組合使用本實(shí)施方式的聲處理裝置和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
接著,參照?qǐng)D6及圖7來(lái)說(shuō)明本實(shí)施方式第1另一方式的聲處理裝置30。
如圖6及圖7所表示,聲處理裝置30在與再生樂(lè)曲的音頻裝置31的組合中,執(zhí)行回波抑制處理,將從聲信號(hào)存儲(chǔ)部件15輸出的第4聲信號(hào)經(jīng)聲信號(hào)輸出部件18輸出到聲信號(hào)記錄裝置32。
通過(guò)該結(jié)構(gòu),在用戶按照從揚(yáng)聲器12輸出的樂(lè)曲將語(yǔ)音或歌聲錄音到聲信號(hào)記錄裝置32中時(shí),能夠從話筒13生成的聲信號(hào)中減少回波分量,將減少了回波分量的聲信號(hào)輸出到聲信號(hào)記錄裝置32。
接著,參照?qǐng)D8至圖10來(lái)說(shuō)明本實(shí)施方式第2另一形態(tài)的聲處理裝置40。
如圖8至圖10所表示,本實(shí)施方式第2另一形態(tài)的聲處理裝置40被包含在具有生成引導(dǎo)語(yǔ)音的聲信號(hào)生成部件41、和對(duì)從聲信號(hào)輸出部件18輸出的聲信號(hào)執(zhí)行語(yǔ)音識(shí)別的語(yǔ)音識(shí)別部件42的電子設(shè)備中,執(zhí)行回波抑制處理。
通過(guò)該結(jié)構(gòu),聲處理裝置執(zhí)行回波抑制處理,提取存在話者的語(yǔ)音的區(qū)間的聲信號(hào),所以語(yǔ)音識(shí)別部件能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
此外,如圖9及圖10所表示,通過(guò)在該電子設(shè)備的監(jiān)視器43上顯示動(dòng)畫角色,按照引導(dǎo)語(yǔ)音及話者的語(yǔ)音的識(shí)別結(jié)果來(lái)變化動(dòng)畫角色的表情,操作者能夠以人際對(duì)話的感覺(jué)與電子設(shè)備進(jìn)行對(duì)話,例如搜索或記錄信息。
(第2實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第2實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D11至圖13來(lái)說(shuō)明本發(fā)明第2實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置50如圖11所表示,包括聲信號(hào)輸入部件51;揚(yáng)聲器52;話筒53;回波消除器54;聲信號(hào)存儲(chǔ)部件55;聲信號(hào)輸出部件58;語(yǔ)音檢測(cè)部件56,響應(yīng)聲信號(hào)輸入部件51輸入的第1聲信號(hào)和回波消除器輸出的第3聲信號(hào)來(lái)檢測(cè)話者的語(yǔ)音的始端;以及控制部件57,控制聲信號(hào)存儲(chǔ)部件55,以便使聲信號(hào)存儲(chǔ)部件55將聲信號(hào)存儲(chǔ)部件55存儲(chǔ)的第3聲信號(hào)內(nèi)的、從語(yǔ)音檢測(cè)部件56檢測(cè)出的話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
語(yǔ)音檢測(cè)部件56計(jì)測(cè)第1聲信號(hào)的信號(hào)電平和第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平與預(yù)先設(shè)定的閾值,檢測(cè)話者的語(yǔ)音的始端。
在本實(shí)施方式的聲處理裝置50中,如上所述,語(yǔ)音檢測(cè)部件56計(jì)測(cè)第1聲信號(hào)的信號(hào)電平和第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平與預(yù)先設(shè)定的閾值,檢測(cè)話者的語(yǔ)音的始端;但是語(yǔ)音檢測(cè)部件也可以計(jì)算表示第1聲信號(hào)的功率的第1功率值和表示第3聲信號(hào)的功率的第3功率值,比較算出的第1功率值及第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)話者的語(yǔ)音的始端。此外,語(yǔ)音檢測(cè)部件也可以執(zhí)行第1聲信號(hào)及第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)話者的語(yǔ)音的始端。再者,語(yǔ)音檢測(cè)部件也可以計(jì)測(cè)第3聲信號(hào)的噪聲分量,按照計(jì)測(cè)到的噪聲分量來(lái)更新預(yù)先設(shè)定的閾值,比較第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)話者的語(yǔ)音的始端。
如上所述,語(yǔ)音檢測(cè)部件56根據(jù)聲信號(hào)輸入部件51輸入的第1聲信號(hào)和回波消除器54輸出的第3聲信號(hào)來(lái)判定是否是話者的語(yǔ)音,所以能夠以比較高的精度來(lái)檢測(cè)話者的語(yǔ)音的始端。
此外,語(yǔ)音檢測(cè)部件56在根據(jù)聲信號(hào)輸入部件51輸入的第1聲信號(hào)而判定為揚(yáng)聲器52輸出了聲音時(shí),將預(yù)先設(shè)定的閾值更新得略高,所以能夠以比較高的精度來(lái)檢測(cè)話者的語(yǔ)音的始端。
此外,語(yǔ)音檢測(cè)部件56對(duì)回波消除器54輸出的第3聲信號(hào)e(i)進(jìn)行平滑,計(jì)測(cè)平滑過(guò)的第3聲信號(hào)的信號(hào)電平Pe(i),將不存在話者的語(yǔ)音時(shí)的第3聲信號(hào)的信號(hào)電平作為背景噪聲的平滑值Pn(i)來(lái)記錄,逐幀計(jì)算平滑過(guò)的第3聲信號(hào)的信號(hào)電平Pe(i)和背景噪聲的平滑值Pn(i)之間的差分L(i)=Pe(i)-Pn(i),在算出的差分L(i)超過(guò)預(yù)先設(shè)定的閾值TH時(shí),判定為存在話者的語(yǔ)音。
此外,語(yǔ)音檢測(cè)部件56最好計(jì)測(cè)揚(yáng)聲器輸出的聲音的持續(xù)時(shí)間,根據(jù)該持續(xù)時(shí)間來(lái)更新預(yù)先設(shè)定的閾值,比較第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值。此外,語(yǔ)音檢測(cè)部件最好判定揚(yáng)聲器52是否輸出了聲音,根據(jù)該判定來(lái)來(lái)更新預(yù)先設(shè)定的閾值,比較第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值。此外,如圖12所表示,第3聲信號(hào)的語(yǔ)音分量的大小、或者第3聲信號(hào)的回波分量的消去量根據(jù)背景噪聲的大小來(lái)變化,所以語(yǔ)音檢測(cè)部件56最好也根據(jù)平滑過(guò)的第3聲信號(hào)的信號(hào)電平Pe(i)來(lái)更新閾值。
在圖12中,閾值設(shè)定方法1示出了不依賴于背景噪聲的平滑值Pn(i)、采用了恒定的閾值TH的一例。另一方面,閾值設(shè)定方法2示出了與背景噪聲的平滑值Pn(i)成正比來(lái)增加閾值TH的值的一例。此外,閾值設(shè)定方法3示出了閾值TH根據(jù)噪聲電平Pn(i)來(lái)增加、但是在某個(gè)Pn(i)的范圍內(nèi)閾值TH不變化的例子。圖12所表示的3種閾值設(shè)定方法只是一例,最好按照系統(tǒng)用最佳的方法來(lái)設(shè)定。
這里,補(bǔ)充說(shuō)明用于有效地進(jìn)行回波抑制處理的閾值TH的設(shè)定。首先通過(guò)根據(jù)背景噪聲電平來(lái)變化閾值TH,能夠有效地進(jìn)行回波抑制處理。例如,噪聲電平上升后,一般用戶的發(fā)聲電平也上升,所以在噪聲電平高時(shí),最好將發(fā)聲檢測(cè)的閾值TH設(shè)定得略高。
此外,也可以根據(jù)是否從揚(yáng)聲器52輸出了聲音來(lái)變化閾值TH,在從揚(yáng)聲器52輸出了聲音的情況下,如果將閾值TH設(shè)定得較小,則能夠有效地進(jìn)行回波抑制處理。
再者,也可以根據(jù)從揚(yáng)聲器52輸出的聲信號(hào)的合計(jì)時(shí)間來(lái)變化閾值TH。這是因?yàn)?,回波消除?4的性能往往是在從揚(yáng)聲器52輸出的聲信號(hào)的合計(jì)時(shí)間短時(shí)回波抑制處理不夠。因此,在從揚(yáng)聲器52輸出的聲信號(hào)的合計(jì)時(shí)間短時(shí),最好將閾值TH設(shè)定得略大。
如上所述,能夠設(shè)定閾值TH來(lái)檢測(cè)用戶的發(fā)聲,減小回聲信號(hào),來(lái)輸出包含用戶產(chǎn)生的聲信號(hào)的信號(hào)。
接著,描述在本實(shí)施方式的聲處理裝置50的聲信號(hào)輸出部件58上連接了語(yǔ)音識(shí)別部件42的情況下調(diào)查語(yǔ)音識(shí)別部件42的語(yǔ)音識(shí)別性能的實(shí)驗(yàn)結(jié)果。
圖13示出了汽車導(dǎo)航裝置進(jìn)行語(yǔ)音識(shí)別處理的情況下的性能評(píng)價(jià)結(jié)果。在該語(yǔ)音識(shí)別實(shí)驗(yàn)中,求出了在輸出引導(dǎo)語(yǔ)音的期間用戶發(fā)出設(shè)施名時(shí)的語(yǔ)音識(shí)別率。條件假定是非特定人型的單詞識(shí)別,詞典為2600個(gè)單詞的詞典,在與空載相當(dāng)?shù)腟N比為25dB的環(huán)境下使用。
圖13的橫軸是發(fā)聲的定時(shí),縱軸顯示了引導(dǎo)輸出開始時(shí)刻為0.5秒、用戶的發(fā)聲定時(shí)為U秒時(shí)的語(yǔ)音識(shí)別率。由該結(jié)果可知,與不用回波抑制來(lái)進(jìn)行語(yǔ)音識(shí)別時(shí)的識(shí)別率61相比,對(duì)從聲信號(hào)輸出部件58輸出的信號(hào)進(jìn)行語(yǔ)音識(shí)別時(shí)的識(shí)別率62的語(yǔ)音識(shí)別性能大幅度改善了。
接著,說(shuō)明本實(shí)施方式的聲處理裝置50的工作。其中,除了語(yǔ)音檢測(cè)部件56的工作,本實(shí)施方式的聲處理裝置50的工作與第1實(shí)施方式的聲處理裝置10的工作相同,這里,說(shuō)明語(yǔ)音檢測(cè)部件56的工作。
將聲信號(hào)輸入部件51輸入的第1聲信號(hào)和回波消除器54生成的第3聲信號(hào)輸入到語(yǔ)音檢測(cè)部件56中。語(yǔ)音檢測(cè)部件56根據(jù)第1聲信號(hào)和第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,將表示檢測(cè)出始端的意思的控制信號(hào)輸出到控制部件57。
接著,進(jìn)一步詳細(xì)說(shuō)明存在話者的語(yǔ)音的區(qū)間的檢測(cè)。
語(yǔ)音檢測(cè)部件56根據(jù)來(lái)自聲信號(hào)輸入部件51的輸入信號(hào)x(i)、和來(lái)自回波消除器54的輸出信號(hào)e(i)來(lái)檢測(cè)用戶的發(fā)聲。在本實(shí)施方式中,以用信號(hào)的平滑值來(lái)檢測(cè)發(fā)聲的方法為例。其中,所謂信號(hào)的平滑值,是指信號(hào)振幅的絕對(duì)值的時(shí)間平均值。
測(cè)定從回波消除器54得到的信號(hào)e(i)的平滑值Pe(i),將沒(méi)有用戶的發(fā)聲語(yǔ)音時(shí)的值作為背景噪聲的平滑值Pn(i)來(lái)記錄。然后,對(duì)根據(jù)預(yù)定的時(shí)間劃分的每個(gè)幀來(lái)連續(xù)測(cè)定L(i)=Pe(i)-Pn(i),在該L(i)超過(guò)閾值TH時(shí),認(rèn)為有用戶的發(fā)聲語(yǔ)音。
如上所述,本實(shí)施方式的聲處理裝置的語(yǔ)音檢測(cè)部件根據(jù)回波消除器輸出的第3聲信號(hào)和聲信號(hào)輸入部件輸入的第1聲信號(hào)來(lái)檢測(cè)話者的語(yǔ)音的始端,所以即使在不能充分抑制回波分量的環(huán)境下,也能夠在回波消除器輸出的第3聲信號(hào)中比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,作為第4聲信號(hào)輸出到外部設(shè)備。
此外,在組合使用本實(shí)施方式的聲處理裝置和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第3實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1及第2實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第3實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D14來(lái)說(shuō)明本發(fā)明第3實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置70如圖14所表示,包括聲信號(hào)輸入部件71;揚(yáng)聲器72;話筒73;回波消除器74;聲信號(hào)存儲(chǔ)部件75;聲信號(hào)輸出部件78;語(yǔ)音檢測(cè)部件76,根據(jù)話筒73生成的第2聲信號(hào)和回波消除器74生成的第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端;以及控制部件77。
此外,控制部件77將回波消除器74輸出的第3聲信號(hào)存儲(chǔ)到聲信號(hào)存儲(chǔ)部件75中,將從語(yǔ)音檢測(cè)部件76生成的控制信號(hào)上升的時(shí)刻“Ton”回溯了預(yù)先設(shè)定的時(shí)間“Tm”的時(shí)刻以后聲信號(hào)存儲(chǔ)部件75存儲(chǔ)的第3聲信號(hào)作為第4聲信號(hào)從聲信號(hào)存儲(chǔ)部件75輸出。此外,控制部件77控制聲信號(hào)存儲(chǔ)部件75,使得從控制信號(hào)上升的時(shí)刻“Ton”起開始輸出第4聲信號(hào)。
語(yǔ)音檢測(cè)部件76取得與聲信號(hào)輸入部件71輸入的第1聲信號(hào)的信號(hào)電平的變化、頻率特性、話者的語(yǔ)音有關(guān)的信息,所以能夠以比較高的精度來(lái)判定是否是話者的語(yǔ)音。例如,在聲信號(hào)輸入部件71輸入的第1聲信號(hào)中檢測(cè)語(yǔ)音分量,在能夠判斷為輸出了引導(dǎo)語(yǔ)音的情況下,將預(yù)先設(shè)定的閾值更新得略高,判定話者的語(yǔ)音分量是否超過(guò)更新過(guò)的閾值。
接著,說(shuō)明本實(shí)施方式的聲處理裝置70的工作。其中,除了語(yǔ)音檢測(cè)部件76的工作,本實(shí)施方式的聲處理裝置70的工作與第1實(shí)施方式的聲處理裝置10的工作相同,這里,說(shuō)明語(yǔ)音檢測(cè)部件76的工作。
將話筒73生成的第2聲信號(hào)和回波消除器74生成的第3聲信號(hào)輸入到語(yǔ)音檢測(cè)部件76中。語(yǔ)音檢測(cè)部件76根據(jù)第2聲信號(hào)和第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,將表示檢測(cè)出始端的意思的控制信號(hào)輸出到控制部件77。
如上所述,本實(shí)施方式的聲處理裝置的語(yǔ)音檢測(cè)部件根據(jù)話筒生成的第2聲信號(hào)和回波消除器輸出的第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間,所以回波消除器74能夠測(cè)定在多大程度上抑制了回波分量。
此外,本實(shí)施方式的聲處理裝置根據(jù)第2聲信號(hào)和第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,所以即使在不能充分抑制回波分量的環(huán)境下,也能夠在回波消除器輸出的第3聲信號(hào)中比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,作為第4聲信號(hào)輸出到外部設(shè)備。
語(yǔ)音檢測(cè)部件例如在輸入到回波消除器74中的第2聲信號(hào)的信號(hào)電平比較高、而且回波消除器74輸出的第3聲信號(hào)的信號(hào)電平也比較高的情況下,能夠判定為存在話者的語(yǔ)音,所以控制部件能夠向語(yǔ)音信號(hào)存儲(chǔ)部件中比較準(zhǔn)確地輸出存在語(yǔ)音的區(qū)間。
此外,在組合使用本實(shí)施方式的聲處理裝置和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第4實(shí)施方式)
作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第3實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第4實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D15來(lái)說(shuō)明本發(fā)明第4實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置80如圖15所表示,包括聲信號(hào)輸入部件81;揚(yáng)聲器82;話筒83;回波消除器84;聲信號(hào)存儲(chǔ)部件85;聲信號(hào)輸出部件88;語(yǔ)音檢測(cè)部件86,根據(jù)聲信號(hào)輸入部件81輸入的第1聲信號(hào)、話筒83生成的第2聲信號(hào)以及回波消除器生成的第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端;以及控制部件87。
此外,控制部件87將回波消除器84輸出的第3聲信號(hào)存儲(chǔ)到聲信號(hào)存儲(chǔ)部件85中,將從語(yǔ)音檢測(cè)部件86生成的控制信號(hào)上升的時(shí)刻“Ton”回溯了預(yù)先設(shè)定的時(shí)間“Tm”的時(shí)刻以后聲信號(hào)存儲(chǔ)部件85存儲(chǔ)的第3聲信號(hào)作為第4聲信號(hào)從聲信號(hào)存儲(chǔ)部件85輸出。
語(yǔ)音檢測(cè)部件86從聲信號(hào)輸入部件81輸入的第1聲信號(hào)中取得與信號(hào)電平的變化、頻率特性、發(fā)聲內(nèi)容有關(guān)的信息,所以能夠以比較高的精度來(lái)判定是否是話者的語(yǔ)音。例如,在聲信號(hào)輸入部件81輸入的第1聲信號(hào)中檢測(cè)出語(yǔ)音分量的情況下,判斷為輸出了引導(dǎo)語(yǔ)音,將預(yù)先設(shè)定的閾值更新得略高,判定話者的語(yǔ)音分量是否超過(guò)更新過(guò)的閾值。
接著,說(shuō)明本實(shí)施方式的聲處理裝置80的工作。其中,除了語(yǔ)音檢測(cè)部件86的工作,本實(shí)施方式的聲處理裝置80的工作與第3實(shí)施方式的聲處理裝置70的工作相同,這里,說(shuō)明語(yǔ)音檢測(cè)部件86的工作。
將聲信號(hào)輸入部件81輸入的第1聲信號(hào)、話筒83生成的第2聲信號(hào)以及回波消除器生成的第3聲信號(hào)輸入到語(yǔ)音檢測(cè)部件86中。語(yǔ)音檢測(cè)部件76根據(jù)第1聲信號(hào)、第2聲信號(hào)以及第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,將表示檢測(cè)出始端的時(shí)刻的控制信號(hào)輸出到控制部件87。
如上所述,本實(shí)施方式的聲處理裝置根據(jù)聲信號(hào)輸入部件81輸入的第1聲信號(hào)、話筒83生成的第2聲信號(hào)以及回波消除器生成的第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,所以即使在不能充分抑制回波分量的環(huán)境下,也能夠在回波消除器輸出的第3聲信號(hào)中比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,作為第4聲信號(hào)輸出到外部設(shè)備。
此外,在組合使用本實(shí)施方式的聲處理裝置和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第5實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第4實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第5實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D16來(lái)說(shuō)明本發(fā)明第5實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置90如圖16所表示,包括聲信號(hào)輸入部件91;揚(yáng)聲器92;話筒93;回波消除器94;聲信號(hào)存儲(chǔ)部件95;聲信號(hào)輸出部件98;音量調(diào)整部件99,為了調(diào)整揚(yáng)聲器92輸出的聲音的音量,而調(diào)整聲信號(hào)輸入部件91輸出到揚(yáng)聲器92的第1聲信號(hào)的信號(hào)電平;語(yǔ)音檢測(cè)部件96,根據(jù)音量調(diào)整部件99輸出的第1聲信號(hào)和回波消除器94生成的第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端;以及控制部件97。
此外,控制部件97將回波消除器94輸出的第3聲信號(hào)存儲(chǔ)到聲信號(hào)存儲(chǔ)部件95中,將從語(yǔ)音檢測(cè)部件96生成的控制信號(hào)上升的時(shí)刻“Ton”回溯了預(yù)先設(shè)定的時(shí)間“Tm”的時(shí)刻以后聲信號(hào)存儲(chǔ)部件95存儲(chǔ)的第3聲信號(hào)作為第4聲信號(hào)從聲信號(hào)存儲(chǔ)部件95輸出。
語(yǔ)音檢測(cè)部件96從聲信號(hào)輸入部件91輸入的第1聲信號(hào)中取得與信號(hào)電平的變化、頻率特性、發(fā)聲內(nèi)容有關(guān)的信息,所以能夠以比較高的精度來(lái)判定是否是話者的語(yǔ)音。例如,在聲信號(hào)輸入部件91輸入的第1聲信號(hào)中檢測(cè)出語(yǔ)音分量的情況下,將預(yù)先設(shè)定的閾值更新得略高,判定話者的語(yǔ)音分量是否超過(guò)更新過(guò)的閾值。
接著,說(shuō)明本實(shí)施方式的聲處理裝置90的工作。其中,除了語(yǔ)音檢測(cè)部件96及音量調(diào)整部件99的工作,本實(shí)施方式的聲處理裝置90的工作與第1實(shí)施方式的聲處理裝置10的工作相同,這里,只說(shuō)明語(yǔ)音檢測(cè)部件96及音量調(diào)整部件99的工作。
音量調(diào)整部件99調(diào)整從聲信號(hào)輸入部件91輸入的聲信號(hào)的輸出電平。因此,從揚(yáng)聲器92輸出的聲音的音量的輸出電平按照音量調(diào)整部件99的調(diào)整來(lái)增減,回聲分量也增減。
另一方面,語(yǔ)音檢測(cè)部件96根據(jù)從回波消除器94輸出的消除處理后的聲信號(hào)和音量調(diào)整部件99的調(diào)整信息的信號(hào)來(lái)進(jìn)行用戶發(fā)聲的語(yǔ)音分量的檢測(cè)處理。
如上所述,本實(shí)施方式的聲處理裝置的語(yǔ)音檢測(cè)部件根據(jù)音量調(diào)整部件99調(diào)整過(guò)信號(hào)電平的第1聲信號(hào)和回波消除器輸出的第3聲信號(hào)來(lái)檢測(cè)話者的語(yǔ)音的始端,所以即使在不能充分抑制回波分量的環(huán)境下,也能夠在回波消除器輸出的第3聲信號(hào)中比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,作為第4聲信號(hào)來(lái)輸出。
此外,在組合使用本實(shí)施方式的聲處理裝置和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第6實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第5實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第6實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D17來(lái)說(shuō)明本發(fā)明第6實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置100如圖17所表示,包括聲信號(hào)輸入部件101;揚(yáng)聲器102;話筒103;回波消除器104;聲信號(hào)存儲(chǔ)部件105;聲信號(hào)輸出部件108;發(fā)聲檢測(cè)輔助開關(guān)109,檢測(cè)話者發(fā)出語(yǔ)音的定時(shí),響應(yīng)檢測(cè)出的定時(shí)來(lái)生成觸發(fā)信號(hào);語(yǔ)音檢測(cè)部件106,根據(jù)該發(fā)聲檢測(cè)輔助開關(guān)109生成的觸發(fā)信號(hào)和回波消除器104生成的第3聲信號(hào)來(lái)判定第3聲信號(hào)的話者的語(yǔ)音分量是否超過(guò)預(yù)先設(shè)定的閾值;以及控制部件107,根據(jù)該語(yǔ)音檢測(cè)部件106判定出的判定結(jié)果來(lái)控制聲信號(hào)存儲(chǔ)部件105,使得聲信號(hào)存儲(chǔ)部件105輸出第3聲信號(hào)。
語(yǔ)音檢測(cè)部件106響應(yīng)發(fā)聲檢測(cè)輔助開關(guān)109生成的觸發(fā)信號(hào),所以能夠以比較高的精度來(lái)判定第3聲信號(hào)的信號(hào)電平是否增加了。
其中,發(fā)聲檢測(cè)輔助開關(guān)109構(gòu)成觸發(fā)信號(hào)生成部件。此外,作為發(fā)聲檢測(cè)輔助開關(guān)109的具體例,有按鈕開關(guān)、觸摸傳感器、用攝像機(jī)檢測(cè)嘴唇的運(yùn)動(dòng)的系統(tǒng)等。
接著,說(shuō)明本實(shí)施方式的聲處理裝置100的工作。其中,只說(shuō)明發(fā)聲檢測(cè)輔助開關(guān)109的工作。
發(fā)聲檢測(cè)輔助開關(guān)109在話者開始發(fā)聲時(shí)“開”,將該信號(hào)輸出到語(yǔ)音檢測(cè)部件106。語(yǔ)音檢測(cè)部件106通過(guò)從發(fā)聲檢測(cè)輔助開關(guān)109接收“開”信號(hào),來(lái)取得話者的發(fā)聲定時(shí)。
如上所述,本實(shí)施方式的聲處理裝置100即使在不能充分抑制回波分量的環(huán)境下,也能夠根據(jù)觸發(fā)信號(hào)生成部件109生成的觸發(fā)信號(hào)和回波消除器104輸出的第3聲信號(hào)來(lái)比較準(zhǔn)確地檢測(cè)話者的語(yǔ)音的始端。
此外,本實(shí)施方式的聲處理裝置100將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)來(lái)輸出,所以能夠排除殘留回波。
此外,在組合使用本實(shí)施方式的聲處理裝置100和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置100將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第7實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第6實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第7實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D18來(lái)說(shuō)明本發(fā)明第7實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置110如圖18所表示,包括聲信號(hào)輸入部件111;揚(yáng)聲器112;多個(gè)話筒元件113c至113n,拾取話者的語(yǔ)音,分別生成多個(gè)聲信號(hào);聲信號(hào)合成部件119,合成多個(gè)話筒元件113c至113n分別生成的多個(gè)聲信號(hào)以便增強(qiáng)話者的語(yǔ)音分量,生成第2聲信號(hào);回波消除器114,減少該聲信號(hào)合成部件119生成的第2聲信號(hào)的回波分量;聲信號(hào)存儲(chǔ)部件115;聲信號(hào)輸出部件118;語(yǔ)音檢測(cè)部件116,根據(jù)聲信號(hào)合成部件119生成的第2聲信號(hào)和回波消除器114生成的第3聲信號(hào)來(lái)判定第3聲信號(hào)的話者的語(yǔ)音分量是否超過(guò)預(yù)先設(shè)定的閾值;以及控制部件117,根據(jù)該語(yǔ)音檢測(cè)部件116判定出的判定結(jié)果來(lái)控制聲信號(hào)存儲(chǔ)部件115,使得聲信號(hào)存儲(chǔ)部件115輸出第3聲信號(hào)。這里,話筒元件113c至113n構(gòu)成話筒陣列113。
語(yǔ)音檢測(cè)部件116能夠根據(jù)聲信號(hào)合成部件119生成的第2聲信號(hào)和回波消除器114生成的第3聲信號(hào)用話者的語(yǔ)音以比較高的精度來(lái)判定第3聲信號(hào)的信號(hào)電平是否增加了。
此外,多個(gè)話筒元件113c至113n以預(yù)先設(shè)定的間隔來(lái)配置,所以聲信號(hào)合成部件119能夠增強(qiáng)第2聲信號(hào)的語(yǔ)音分量,減少第2聲信號(hào)的回波分量。
接著,說(shuō)明本實(shí)施方式的聲處理裝置110的工作。其中,只說(shuō)明話筒陣列113及聲信號(hào)合成部件119的工作。
話筒陣列113拾取話者的語(yǔ)音,將聲信號(hào)輸出到聲信號(hào)合成部件119。聲信號(hào)合成部件119增強(qiáng)話者的聲信號(hào),將增強(qiáng)了的聲信號(hào)輸出到語(yǔ)音檢測(cè)部件116。語(yǔ)音檢測(cè)部件116根據(jù)增強(qiáng)了的聲信號(hào)和回波抑制處理過(guò)的信號(hào)來(lái)進(jìn)行話者發(fā)聲的語(yǔ)音分量的檢測(cè)處理。
如上所述,本實(shí)施方式的聲處理裝置110即使在不能充分抑制回波分量的環(huán)境下,也能夠根據(jù)聲信號(hào)合成部件119生成的第2聲信號(hào)和回波消除器114輸出的第3聲信號(hào)來(lái)比較準(zhǔn)確地檢測(cè)話者的語(yǔ)音的始端。
此外,本實(shí)施方式的聲處理裝置110將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)來(lái)輸出,所以能夠排除殘留回波。
此外,在組合使用本實(shí)施方式的聲處理裝置110和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置110將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第8實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第7實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第8實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D19來(lái)說(shuō)明本發(fā)明第8實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置120如圖19所表示,包括聲信號(hào)輸入部件121;揚(yáng)聲器122;話筒123;回波消除器124;噪聲抑制部件129,抑制回波消除器124輸出的第3聲信號(hào)的噪聲分量;聲信號(hào)存儲(chǔ)部件125,存儲(chǔ)該噪聲抑制部件129抑制了噪聲分量的第3聲信號(hào);聲信號(hào)輸出部件128;語(yǔ)音檢測(cè)部件126,根據(jù)噪聲抑制部件129抑制了噪聲分量的第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端;以及控制部件127。
語(yǔ)音檢測(cè)部件126根據(jù)噪聲抑制部件129抑制了噪聲分量的第3聲信號(hào)來(lái)檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,所以能夠用話者的語(yǔ)音以比較高的精度來(lái)判定第3聲信號(hào)的信號(hào)電平是否增加了。
接著,說(shuō)明本實(shí)施方式的聲處理裝置120的工作。其中,只說(shuō)明噪聲抑制部件129的工作。
從回波消除器124輸出的第3聲信號(hào)的噪聲分量由噪聲抑制部件129來(lái)抑制。接著,抑制了噪聲分量的第3聲信號(hào)由聲信號(hào)存儲(chǔ)部件125來(lái)存儲(chǔ)。另一方面,從抑制了噪聲分量的第3聲信號(hào)中檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端。另一方面,從聲信號(hào)存儲(chǔ)部件125中存儲(chǔ)的第3聲信號(hào)內(nèi)的、從存在話者的語(yǔ)音的區(qū)間的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻的第3聲信號(hào)起依次輸出。
如上所述,本實(shí)施方式的聲處理裝置120即使在不能充分抑制回波分量的環(huán)境下,也能夠根據(jù)噪聲抑制部件129抑制了噪聲分量的第3聲信號(hào)來(lái)比較準(zhǔn)確地檢測(cè)話者的語(yǔ)音的始端。
此外,本實(shí)施方式的聲處理裝置120的語(yǔ)音檢測(cè)部件126從抑制了噪聲分量的第3聲信號(hào)中檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,控制部件將聲信號(hào)存儲(chǔ)部件中存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)來(lái)輸出,所以能夠排除殘留回波。
此外,在組合使用本實(shí)施方式的聲處理裝置120和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置120將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第9實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第8實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第9實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D20來(lái)說(shuō)明本發(fā)明第9實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置130如圖20所表示,包括通信部件132,為了接收表示遠(yuǎn)端的話者的語(yǔ)音的第1聲信號(hào),而經(jīng)通信網(wǎng)133與外部設(shè)備136進(jìn)行通信;聲信號(hào)輸入部件141,輸入該通信部件132接收到的第1聲信號(hào);揚(yáng)聲器142,將第1聲信號(hào)變換為表示遠(yuǎn)端的話者的語(yǔ)音的聲音,輸出變換出的聲音;話筒143,拾取近端的話者的語(yǔ)音,生成第2聲信號(hào);回波消除器144;噪聲抑制部件149,抑制回波消除器144輸出的第3聲信號(hào)的噪聲分量;聲信號(hào)存儲(chǔ)部件145;語(yǔ)音檢測(cè)部件146;控制部件147;以及聲信號(hào)輸出部件148。
通信部件132將聲信號(hào)輸出部件148輸出的第4聲信號(hào)經(jīng)通信網(wǎng)133發(fā)送到外部設(shè)備136。
此外,外部設(shè)備136包括通信部件134,發(fā)送第1聲信號(hào),并且為了從聲處理裝置130接收第4聲信號(hào)而與聲處理裝置130進(jìn)行通信;以及語(yǔ)音處理部件135,處理該通信部件134接收到的第4聲信號(hào)。
上述通信網(wǎng)133可以是電話線路或因特網(wǎng)(注冊(cè)商標(biāo))等有線通信網(wǎng)、或者電波或紅外線等無(wú)線通信網(wǎng)。
接著,說(shuō)明本實(shí)施方式的聲處理裝置130的工作。
聲信號(hào)輸入部件141經(jīng)通信網(wǎng)133從語(yǔ)音處理部件135輸入聲信號(hào)。另一方面,來(lái)自聲信號(hào)輸出部件148的信號(hào)經(jīng)通信網(wǎng)133輸出到語(yǔ)音處理部件135。通信部件132及通信部件134與通信網(wǎng)133進(jìn)行聲信號(hào)的發(fā)送接收的控制。
如上所述,本實(shí)施方式的聲處理裝置130即使在不能充分抑制回波分量的環(huán)境下,也能夠根據(jù)回波消除器144輸出的第3聲信號(hào)來(lái)比較準(zhǔn)確地檢測(cè)話者的語(yǔ)音的始端。
此外,本實(shí)施方式的聲處理裝置130將存在話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出,所以能夠排除殘留回波。
再者,本實(shí)施方式的聲處理裝置130包括與外部設(shè)備136進(jìn)行通信的通信部件132,所以能夠向外部設(shè)備輸出第4聲信號(hào)。
此外,在組合使用本實(shí)施方式的聲處理裝置130和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置130將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
(第10實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第9實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第10實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D21來(lái)說(shuō)明本發(fā)明第10實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置151如圖21所表示,包括聲信號(hào)輸入部件161,輸入第1聲信號(hào);以及通信部件154,為了將聲信號(hào)輸入部件161輸入的第1聲信號(hào)經(jīng)通信網(wǎng)153發(fā)送到外部設(shè)備156,而與外部設(shè)備156進(jìn)行通信。
外部設(shè)備156包括通信部件152,為了接收第1聲信號(hào),而與聲處理裝置151進(jìn)行通信;揚(yáng)聲器162,將該通信部件152接收到的第1聲信號(hào)變換為聲音,輸出變換出的聲音;以及話筒163,拾取話者的語(yǔ)音,生成第2聲信號(hào)。
外部設(shè)備的通信部件152將話筒163生成的第2聲信號(hào)發(fā)送到聲處理裝置151。另一方面,聲處理裝置151的通信部件154從外部設(shè)備156接收第2聲信號(hào)。
聲處理裝置151還包括回波消除器164,抑制通信部件154接收到的第2聲信號(hào)的回波分量;聲信號(hào)存儲(chǔ)部件165;語(yǔ)音檢測(cè)部件166;控制部件167;以及聲信號(hào)輸出部件168。
上述通信網(wǎng)153可以是電話線路或因特網(wǎng)(注冊(cè)商標(biāo))等有線通信網(wǎng)、或者電波或紅外線等無(wú)線通信網(wǎng)。
接著,說(shuō)明本實(shí)施方式的聲處理系統(tǒng)150的工作。
揚(yáng)聲器162經(jīng)通信網(wǎng)153從回波消除器164輸入聲信號(hào),輸出聲信號(hào)所表示的語(yǔ)音。另一方面,來(lái)自話筒163的聲信號(hào)經(jīng)通信網(wǎng)153輸出到回波消除器164。通信部件152及通信部件154與通信網(wǎng)153進(jìn)行聲信號(hào)的發(fā)送接收。
如上所述,本實(shí)施方式的聲處理裝置151即使在不能充分抑制回波分量的環(huán)境下,也能夠根據(jù)回波消除器164輸出的第3聲信號(hào)來(lái)比較準(zhǔn)確地檢測(cè)話者的語(yǔ)音的始端。
此外,本實(shí)施方式的聲處理裝置151包括與具有揚(yáng)聲器和話筒的外部設(shè)備進(jìn)行通信的通信部件,通信部件向外部設(shè)備發(fā)送第1聲信號(hào),使外部設(shè)備的揚(yáng)聲器輸出第1聲信號(hào)所表示的聲音,并且接收外部設(shè)備的話筒生成的第2聲信號(hào),所以能夠抑制接收到的第2聲信號(hào)的回波分量。
此外,在組合使用本實(shí)施方式的聲處理裝置151和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置151將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
再者,也能夠分離位于用戶附近的揚(yáng)聲器162及話筒163和回波消除器164,能夠?qū)崿F(xiàn)更便利的聲處理,例如能夠用具有揚(yáng)聲器162及話筒163的小型終端來(lái)實(shí)現(xiàn)能可靠地進(jìn)行回波抑制處理的聲處理裝置等。
(第11實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第10實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第11實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D22來(lái)說(shuō)明本發(fā)明第11實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置170如圖22所表示,包括聲信號(hào)輸入部件181;揚(yáng)聲器182;話筒183;自適應(yīng)濾波器189,生成第1偽回波信號(hào);以及第2減法器195,從話筒183生成的第2聲信號(hào)中減去自適應(yīng)濾波器189生成的第1偽回波信號(hào)。
此外,自適應(yīng)濾波器189根據(jù)聲信號(hào)輸入部件181輸入的第1聲信號(hào)和第2減法器195的減法結(jié)果來(lái)更新濾波器系數(shù),生成與更新過(guò)的濾波器系數(shù)相應(yīng)的第1偽回波信號(hào)。
本實(shí)施方式的聲處理裝置170包括第1聲信號(hào)存儲(chǔ)部171,為了輸出延遲了預(yù)先設(shè)定的延遲量的第1聲信號(hào),而存儲(chǔ)話筒183生成的第1聲信號(hào);第2聲信號(hào)存儲(chǔ)部172,為了輸出延遲了預(yù)先設(shè)定的延遲量的第2聲信號(hào),而存儲(chǔ)話筒183生成的第2聲信號(hào);卷積處理部192,為了生成第2偽回波信號(hào),而執(zhí)行卷積處理;第1減法器193,從第2聲信號(hào)存儲(chǔ)部172輸出的第2聲信號(hào)中減去卷積處理部192生成的第2偽回波信號(hào);以及系數(shù)傳送部191,判定自適應(yīng)濾波器189更新過(guò)的濾波器系數(shù)是否穩(wěn)定,在能夠判定為穩(wěn)定的情況下,將更新過(guò)的濾波器系數(shù)傳送到卷積處理部192。
此外,卷積處理部192執(zhí)行第1聲信號(hào)存儲(chǔ)部171輸出的第1聲信號(hào)和系數(shù)傳送部191傳送的濾波器系數(shù)之間的卷積處理,生成第2偽回波信號(hào)。
接著,說(shuō)明本實(shí)施方式的聲處理裝置170的工作。
回波消除器174通過(guò)設(shè)置第1聲信號(hào)存儲(chǔ)部171及第2聲信號(hào)存儲(chǔ)部172,等待自適應(yīng)濾波器189估計(jì)出的濾波器系數(shù)充分收斂,來(lái)進(jìn)行回波抑制處理。即,在向回波消除器174輸入信號(hào)后濾波器系數(shù)短時(shí)間內(nèi)未收斂的情況下,通過(guò)現(xiàn)有的回波抑制在輸出信號(hào)后短時(shí)間內(nèi)包含很多殘留回波,但是本實(shí)施方式的聲處理裝置170等待自適應(yīng)濾波器系數(shù)收斂后消除回波,所以能夠抑制殘留回波的產(chǎn)生。
如上所述,本實(shí)施方式的聲處理裝置170即使在不能充分抑制回波分量的環(huán)境下,也能夠根據(jù)回波消除器174輸出的第3聲信號(hào)來(lái)比較準(zhǔn)確地檢測(cè)話者的語(yǔ)音的始端。
此外,本實(shí)施方式的聲處理裝置170的回波消除器174包括第1聲信號(hào)存儲(chǔ)部171,為了輸出延遲了預(yù)先設(shè)定的延遲量的第1聲信號(hào),而存儲(chǔ)話筒183生成的第1聲信號(hào);以及第2聲信號(hào)存儲(chǔ)部172,為了輸出延遲了預(yù)先設(shè)定的延遲量的第2聲信號(hào),而存儲(chǔ)話筒183生成的第2聲信號(hào);所以能夠等待自適應(yīng)濾波器系數(shù)收斂后抑制回波分量,也能夠抑制殘留回波的產(chǎn)生。
此外,在組合使用本實(shí)施方式的聲處理裝置170和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置170將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
其中,通過(guò)將第1至第10實(shí)施方式的聲處理裝置的回波消除器14置換為本實(shí)施方式的聲處理裝置170的回波消除器174,能夠更可靠地抑制回波分量。
(第12實(shí)施方式)
作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第11實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第12實(shí)施方式的聲處理裝置。
以下,參照?qǐng)D23來(lái)說(shuō)明本發(fā)明第12實(shí)施方式的聲處理裝置。
本實(shí)施方式的聲處理裝置200如圖23所表示,包括聲信號(hào)輸入部件211;揚(yáng)聲器212;話筒213;自適應(yīng)濾波器219,生成第1偽回波信號(hào);第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部201,存儲(chǔ)第1聲信號(hào);第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部202,與第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部201存儲(chǔ)第1聲信號(hào)的定時(shí)同步來(lái)存儲(chǔ)第2聲信號(hào);控制部203,控制第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部201及第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部202的存儲(chǔ)工作,使得在檢測(cè)出適合自適應(yīng)濾波器219的學(xué)習(xí)的數(shù)據(jù)時(shí),將該數(shù)據(jù)以相同的定時(shí)保存或更新到第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部201及第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部202中;以及第2減法器225,從話筒213生成的第2聲信號(hào)中減去自適應(yīng)濾波器219生成的第1偽回波信號(hào)。
本實(shí)施方式的聲處理裝置200還包括第1聲信號(hào)存儲(chǔ)部231,為了輸出延遲了預(yù)先設(shè)定的延遲量的第1聲信號(hào),而存儲(chǔ)聲信號(hào)輸入部件211生成的第1聲信號(hào);第2聲信號(hào)存儲(chǔ)部232,為了輸出延遲了預(yù)先設(shè)定的延遲量的第2聲信號(hào),而存儲(chǔ)話筒213生成的第2聲信號(hào);卷積處理部222,為了生成第2偽回波信號(hào),而執(zhí)行卷積處理;第1減法器223,從第2聲信號(hào)存儲(chǔ)部232輸出的第2聲信號(hào)中減去卷積處理部222生成的第2偽回波信號(hào);以及系數(shù)傳送部221,判定自適應(yīng)濾波器219更新過(guò)的濾波器系數(shù)是否穩(wěn)定,在能夠判定為穩(wěn)定的情況下,將更新過(guò)的濾波器系數(shù)傳送到卷積處理部222。
此外,卷積處理部222執(zhí)行第1聲信號(hào)存儲(chǔ)部231輸出的第1聲信號(hào)和系數(shù)傳送部221傳送的濾波器系數(shù)之間的卷積處理,生成第2偽回波信號(hào)。
接著,說(shuō)明本實(shí)施方式的聲處理裝置200的工作。
控制部203進(jìn)行控制,使得在檢測(cè)出適合自適應(yīng)濾波器219的學(xué)習(xí)的數(shù)據(jù)時(shí),將該數(shù)據(jù)以相同的定時(shí)保存或更新到第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部201及第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部202中。自適應(yīng)濾波器219根據(jù)第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部201及第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部202中保存的數(shù)據(jù),來(lái)重復(fù)進(jìn)行估計(jì)濾波器系數(shù)的學(xué)習(xí)。由此,用很少的數(shù)據(jù)也能得到收斂了的濾波器系數(shù)。其中,用第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部201及第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部202中存儲(chǔ)的數(shù)據(jù)學(xué)習(xí)到的濾波器系數(shù)有效是在傳遞特性變化不大時(shí),所以最好用控制部203盡可能地更新學(xué)習(xí)所使用的數(shù)據(jù)。
如上所述,本實(shí)施方式的聲處理裝置200即使在不能充分抑制回波分量的環(huán)境下,也能夠根據(jù)回波消除器204輸出的第3聲信號(hào)來(lái)比較準(zhǔn)確地檢測(cè)話者的語(yǔ)音的始端。
此外,本實(shí)施方式的聲處理裝置200的回波消除器204包括第1聲信號(hào)存儲(chǔ)部231,為了輸出延遲了預(yù)先設(shè)定的延遲量的第1聲信號(hào),而存儲(chǔ)話筒213生成的第1聲信號(hào);以及第2聲信號(hào)存儲(chǔ)部232,為了輸出延遲了預(yù)先設(shè)定的延遲量的第2聲信號(hào),而存儲(chǔ)話筒213生成的第2聲信號(hào);所以能夠等待自適應(yīng)濾波器系數(shù)收斂后抑制回波分量,抑制殘留回波的產(chǎn)生。
此外,在組合使用本實(shí)施方式的聲處理裝置200和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置200將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
其中,通過(guò)將第1至第10實(shí)施方式的聲處理裝置的回波消除器14置換為本實(shí)施方式的聲處理裝置的回波消除器204,能夠更可靠地抑制回波分量。
(第13實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第12實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第13實(shí)施方式的聲處理系統(tǒng)。
以下,參照?qǐng)D24來(lái)說(shuō)明本發(fā)明第13實(shí)施方式的聲處理系統(tǒng)。
本實(shí)施方式的聲處理裝置240如圖24所表示,包括汽車導(dǎo)航裝置242,具有生成用于表示與導(dǎo)航有關(guān)的引導(dǎo)語(yǔ)音的第1聲信號(hào)的聲信號(hào)生成部件261;以及聲處理裝置241。
聲處理裝置241包含聲信號(hào)輸入部件251,從汽車導(dǎo)航裝置242的聲信號(hào)生成部件261取得第1聲信號(hào);揚(yáng)聲器252,將聲信號(hào)輸入部件251取得的第1聲信號(hào)變換為聲音,將變換出的聲音作為汽車導(dǎo)航裝置242的引導(dǎo)語(yǔ)音來(lái)輸出;話筒253,拾取揚(yáng)聲器252輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào);回波消除器254,抑制第2聲信號(hào)的回波分量,將抑制了回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件255,存儲(chǔ)第3聲信號(hào);語(yǔ)音檢測(cè)部件256,從回波消除器254輸出的第3聲信號(hào)中檢測(cè)話者的語(yǔ)音;控制部件257,控制聲信號(hào)存儲(chǔ)部件255,以便將聲信號(hào)存儲(chǔ)部件255存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出話者的語(yǔ)音的區(qū)間的第3聲信號(hào)從聲信號(hào)存儲(chǔ)部件255作為第4聲信號(hào)來(lái)輸出。
在語(yǔ)音檢測(cè)部件256檢測(cè)出存在話者的語(yǔ)音的區(qū)間的始端時(shí),控制部件257將從該始端的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后聲信號(hào)存儲(chǔ)部件255存儲(chǔ)的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。另一方面,汽車導(dǎo)航裝置242還具有為了判定話者是否響應(yīng)引導(dǎo)語(yǔ)音發(fā)出了特定的語(yǔ)音而執(zhí)行聲處理裝置241的聲信號(hào)存儲(chǔ)部件255輸出的第4聲信號(hào)的語(yǔ)音識(shí)別的語(yǔ)音識(shí)別部件262;在汽車導(dǎo)航裝置的語(yǔ)音識(shí)別部件262識(shí)別出話者的特定的語(yǔ)音時(shí),汽車導(dǎo)航裝置的未圖示的導(dǎo)航信息生成部件生成與特定的語(yǔ)音相應(yīng)的導(dǎo)航信息。
此外,語(yǔ)音檢測(cè)部件256根據(jù)回波消除器輸出的第3聲信號(hào)來(lái)生成用于表示存在話者的語(yǔ)音的區(qū)間的始端的時(shí)刻的控制信號(hào),輸出到控制部件257及語(yǔ)音識(shí)別部件262。
此外,在本實(shí)施方式的聲處理系統(tǒng)240的工作中,除了將語(yǔ)音檢測(cè)部件256的控制信號(hào)輸出到汽車導(dǎo)航裝置242的語(yǔ)音識(shí)別部件262,本實(shí)施方式的聲處理系統(tǒng)240的語(yǔ)音檢測(cè)部件256及控制部件257的工作與第1實(shí)施方式的語(yǔ)音檢測(cè)部件256及控制部件257的工作相同,省略本實(shí)施方式的聲處理系統(tǒng)240的工作的說(shuō)明。
如上所述,本實(shí)施方式的聲處理系統(tǒng)即使在不能充分抑制回波分量的環(huán)境下,語(yǔ)音檢測(cè)部件也能夠從回波消除器輸出的第3聲信號(hào)中檢測(cè)話者的語(yǔ)音的始端,在回波消除器輸出的第3聲信號(hào)中比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,作為第4聲信號(hào)來(lái)輸出。
此外,在像本實(shí)施方式的聲處理系統(tǒng)這樣組合使用聲處理裝置和具有語(yǔ)音識(shí)別部件的汽車導(dǎo)航裝置的情況下,聲處理裝置將第4聲信號(hào)輸出到汽車導(dǎo)航裝置,所以能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別,并且能夠提高語(yǔ)音識(shí)別性能。
(第14實(shí)施方式)首先,說(shuō)明本發(fā)明第14實(shí)施方式的聲處理系統(tǒng)的結(jié)構(gòu)。
作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第13實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第14實(shí)施方式的聲處理系統(tǒng)。
以下,參照?qǐng)D25來(lái)說(shuō)明本發(fā)明第14實(shí)施方式的聲處理系統(tǒng)。
本實(shí)施方式的聲處理系統(tǒng)300如圖25所表示,包括第1聲處理裝置310和第2聲處理裝置330。這些第1及第2聲處理裝置310及330除了回波消除器314及334,分別與第1實(shí)施方式的聲處理裝置10在結(jié)構(gòu)上相同。
第1聲處理裝置310包括聲信號(hào)輸入部件311、揚(yáng)聲器312、話筒313、回波消除器314、聲信號(hào)存儲(chǔ)部件315、語(yǔ)音檢測(cè)部件316、控制部件317、以及聲信號(hào)輸出部件318。另一方面,第2聲處理裝置330包括聲信號(hào)輸入部件331、揚(yáng)聲器332、話筒333、回波消除器334、聲信號(hào)存儲(chǔ)部件335、語(yǔ)音檢測(cè)部件336、控制部件337、以及聲信號(hào)輸出部件338。
第1聲處理裝置310的話筒313拾取第1聲處理裝置310的揚(yáng)聲器312輸出的聲音和第2聲處理裝置330的揚(yáng)聲器332輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào)。此外,第1聲處理裝置310的回波消除器314按照第1聲處理裝置310的聲信號(hào)輸入部件311輸入的第1聲信號(hào)和第2聲處理裝置330的聲信號(hào)輸入部件331輸入的第1聲信號(hào)來(lái)抑制第1聲處理裝置310的話筒313生成的第2聲信號(hào)的回波分量。
另一方面,第1聲處理裝置310的話筒333拾取第1聲處理裝置310的揚(yáng)聲器312輸出的聲音和第2聲處理裝置330的揚(yáng)聲器332輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào)。此外,第2聲處理裝置330的回波消除器334按照第1聲處理裝置310的聲信號(hào)輸入部件311輸入的第1聲信號(hào)和第2聲處理裝置330的聲信號(hào)輸入部件331輸入的第1聲信號(hào)來(lái)抑制第2聲處理裝置330的話筒333生成的第2聲信號(hào)的回波分量。
此外,聲處理系統(tǒng)300還包括第1及第2外部設(shè)備324及344。
第1外部設(shè)備324包含聲信號(hào)生成部件321,生成用于表示引導(dǎo)語(yǔ)音的第1聲信號(hào);以及語(yǔ)音識(shí)別部件322,執(zhí)行第1聲處理裝置310的聲信號(hào)輸出部件318輸出的第4聲信號(hào)的語(yǔ)音識(shí)別。此外,第1聲處理裝置310的聲信號(hào)輸入部件311從第1外部設(shè)備324的聲信號(hào)生成部件321取得第1聲信號(hào)。另一方面,第2外部設(shè)備344包含聲信號(hào)生成部件341,生成用于表示引導(dǎo)語(yǔ)音的第1聲信號(hào);以及語(yǔ)音識(shí)別部件342,執(zhí)行第2聲處理裝置330的聲信號(hào)輸出部件338輸出的第4聲信號(hào)的語(yǔ)音識(shí)別。此外,第2聲處理裝置330的聲信號(hào)輸入部件331從第2外部設(shè)備344的聲信號(hào)生成部件341取得第1聲信號(hào)。
第1聲處理裝置310的回波消除器314如圖26所表示,包含自適應(yīng)濾波器349,根據(jù)聲信號(hào)輸入部件311輸入的第1聲信號(hào)和話筒313生成的第2聲信號(hào)來(lái)估計(jì)話筒313生成的第2聲信號(hào)的回波分量,生成用于表示估計(jì)出的回波分量的偽回波信號(hào);第1減法器350,生成用于表示話筒313生成的第2聲信號(hào)和自適應(yīng)濾波器349生成的偽回波信號(hào)之差的差信號(hào);自適應(yīng)濾波器359,根據(jù)聲信號(hào)輸入部件311輸入的第1聲信號(hào)和話筒313生成的第2聲信號(hào)來(lái)估計(jì)話筒313生成的第2聲信號(hào)的回波分量,生成用于表示估計(jì)出的回波分量的偽回波信號(hào);第2減法器360,生成用于表示第1減法器350生成的差信號(hào)和自適應(yīng)濾波器359生成的偽回波信號(hào)之差的差信號(hào);第1聲處理裝置310的回波消除器314將第2減法器360生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
第2聲處理裝置330的回波消除器334也與第1聲處理裝置310的回波消除器314同樣,包含自適應(yīng)濾波器349、第1減法器350、自適應(yīng)濾波器359、以及第2減法器360,第2聲處理裝置330的回波消除器334將第2減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
接著,說(shuō)明本實(shí)施方式的聲處理系統(tǒng)300的工作。
在第1聲處理裝置310中,首先,第1外部設(shè)備324的聲信號(hào)生成部件321生成用于表示引導(dǎo)語(yǔ)音的第1聲信號(hào),從揚(yáng)聲器312輸出引導(dǎo)語(yǔ)音。此外,第2外部設(shè)備344的聲信號(hào)生成部件341生成用于表示引導(dǎo)語(yǔ)音的第1聲信號(hào),從揚(yáng)聲器332輸出引導(dǎo)語(yǔ)音。另一方面,話筒313生成第2聲信號(hào)。接著,回波消除器314抑制第2聲信號(hào)的回波分量,將抑制了回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出。聲信號(hào)存儲(chǔ)部件315逐次存儲(chǔ)第3聲信號(hào)。此外,語(yǔ)音檢測(cè)部件316從第3聲信號(hào)中檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端。將聲信號(hào)存儲(chǔ)部件315存儲(chǔ)的第3聲信號(hào)內(nèi)的、從該始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后聲信號(hào)存儲(chǔ)部件315存儲(chǔ)的第3聲信號(hào)依次作為第4聲信號(hào)來(lái)輸出。接著,第1外部設(shè)備324的語(yǔ)音識(shí)別部件322執(zhí)行第4聲信號(hào)的語(yǔ)音識(shí)別。
第2聲處理裝置330也與第1聲處理裝置310同樣,第2外部設(shè)備344的聲信號(hào)生成部件341生成用于表示引導(dǎo)語(yǔ)音的第1聲信號(hào),從揚(yáng)聲器332輸出引導(dǎo)語(yǔ)音。此外,第1外部設(shè)備324的聲信號(hào)生成部件321生成用于表示引導(dǎo)語(yǔ)音的第1聲信號(hào),從揚(yáng)聲器312輸出引導(dǎo)語(yǔ)音。另一方面,話筒333生成第2聲信號(hào)。接著,回波消除器334抑制第2聲信號(hào)的回波分量,將抑制了回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出。聲信號(hào)存儲(chǔ)部件335逐次存儲(chǔ)第3聲信號(hào)。此外,語(yǔ)音檢測(cè)部件336從第3聲信號(hào)中檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端。將聲信號(hào)存儲(chǔ)部件335存儲(chǔ)的第3聲信號(hào)內(nèi)的、從該始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后聲信號(hào)存儲(chǔ)部件335存儲(chǔ)的第3聲信號(hào)依次作為第4聲信號(hào)來(lái)輸出。接著,第2外部設(shè)備344的語(yǔ)音識(shí)別部件342執(zhí)行第4聲信號(hào)的語(yǔ)音識(shí)別。
接著,將本實(shí)施方式的另一形態(tài)的聲處理系統(tǒng)400示于圖28。聲處理系統(tǒng)400是部分變更了圖25所表示的聲處理系統(tǒng)300的結(jié)構(gòu)而成的。即,第1聲處理裝置401包括與第2聲處理裝置402進(jìn)行通信的通信部件412,執(zhí)行第1聲信號(hào)的接收及第2聲信號(hào)的發(fā)送。另一方面,第2聲處理裝置402包括與第1聲處理裝置401進(jìn)行通信的通信部件414,執(zhí)行第1聲信號(hào)的接收及第2聲信號(hào)的發(fā)送。因此,即使2個(gè)聲處理裝置未直接連接,也能夠有效地進(jìn)行回波抑制處理。
例如,可以如圖29所表示,將第1及第2聲處理裝置401及402中的一個(gè)包含在電視機(jī)中,將第1及第2聲處理裝置401及402中的另一個(gè)包含在遙控電視機(jī)的電視控制終端中。電視控制終端為了確認(rèn)操作者是否希望變更電視機(jī)的頻道,而執(zhí)行與操作者的會(huì)話,在操作者希望變更電視機(jī)的頻道的情況下,遙控電視機(jī)變更到操作者希望的頻道。
電視控制終端在執(zhí)行與操作者的會(huì)話時(shí),與話者的語(yǔ)音一起來(lái)拾取從電視機(jī)的揚(yáng)聲器312輸出的音樂(lè)415及電視控制終端的引導(dǎo)語(yǔ)音,所以抑制了話筒333生成的第2聲信號(hào)內(nèi)的、與從電視機(jī)的揚(yáng)聲器312輸出的音樂(lè)415及電視控制終端的引導(dǎo)語(yǔ)音有關(guān)的分量,只取出存在話者的語(yǔ)音的區(qū)間來(lái)執(zhí)行語(yǔ)音識(shí)別。
此外,如圖30所表示,也可以將聲處理系統(tǒng)400應(yīng)用于多個(gè)機(jī)器人分別與操作者進(jìn)行對(duì)話的對(duì)話系統(tǒng)。
如上所述,本實(shí)施方式的聲處理系統(tǒng)300即使在不能充分抑制回波分量的環(huán)境下,第1聲處理裝置310及第2聲處理裝置330的各回波消除器314及334也抑制揚(yáng)聲器312產(chǎn)生的回波分量和揚(yáng)聲器332產(chǎn)生的回波分量,各語(yǔ)音檢測(cè)部件316及336也檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端,所以能夠在第3聲信號(hào)中比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,作為第4聲信號(hào)來(lái)輸出。
此外,在組合使用本實(shí)施方式的聲處理裝置和語(yǔ)音識(shí)別裝置的情況下,聲處理裝置將存在話者的語(yǔ)音的區(qū)間作為第4聲信號(hào)輸出到語(yǔ)音識(shí)別裝置,所以語(yǔ)音識(shí)別裝置能夠高效率地執(zhí)行話者的語(yǔ)音的語(yǔ)音識(shí)別。
在本實(shí)施方式中,說(shuō)明了包括2個(gè)聲處理裝置的聲處理系統(tǒng),但是在包括3個(gè)以上的聲處理裝置的聲處理系統(tǒng)中,也能夠得到同樣的效果。
此外,在本實(shí)施方式的聲處理系統(tǒng)300中,第1聲處理裝置310及第2聲處理裝置330也可以具有圖27所表示的回波消除器364,來(lái)取代圖26所表示的回波消除器14。
也可以使得第1聲處理裝置310的回波消除器364如圖27所表示,包含自適應(yīng)濾波器369,根據(jù)聲信號(hào)輸入部件311輸入的第1聲信號(hào)和話筒313生成的第2聲信號(hào)來(lái)估計(jì)濾波器系數(shù);卷積處理部372,根據(jù)自適應(yīng)濾波器369估計(jì)出的濾波器系數(shù)對(duì)第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部371,判定自適應(yīng)濾波器369估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在濾波器系數(shù)穩(wěn)定的情況下,向卷積處理部372傳送自適應(yīng)濾波器369估計(jì)出的濾波器系數(shù);第1減法器373,生成用于表示話筒313生成的第2聲信號(hào)和卷積處理部372生成的偽回波信號(hào)之差的差信號(hào);自適應(yīng)濾波器379,根據(jù)聲信號(hào)輸入部件331輸入的第1聲信號(hào)和話筒313生成的第2聲信號(hào)來(lái)估計(jì)濾波器系數(shù);卷積處理部382,根據(jù)自適應(yīng)濾波器379估計(jì)出的濾波器系數(shù)對(duì)第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部381,判定自適應(yīng)濾波器379估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在濾波器系數(shù)穩(wěn)定的情況下,向卷積處理部382傳送自適應(yīng)濾波器369估計(jì)出的濾波器系數(shù);以及第2減法器383,生成用于表示第1減法器373生成的差信號(hào)和卷積處理部382生成的偽回波信號(hào)之差的差信號(hào);回波消除器364將第2減法器383生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
(第15實(shí)施方式)作為用于實(shí)施發(fā)明的最佳方式,說(shuō)明了第1至第14實(shí)施方式的聲處理裝置。然而,為了完成本申請(qǐng)的課題,也可以是第15實(shí)施方式的聲處理系統(tǒng)。
以下,參照?qǐng)D31來(lái)說(shuō)明本發(fā)明第15實(shí)施方式的聲處理系統(tǒng)。
本實(shí)施方式的聲處理系統(tǒng)420如圖31所表示,構(gòu)成筆記本型個(gè)人計(jì)算機(jī)421的一部分。該個(gè)人計(jì)算機(jī)421包括揚(yáng)聲器422、話筒423、監(jiān)視器433、未圖示的微處理器、半導(dǎo)體存儲(chǔ)器、硬盤,執(zhí)行作為應(yīng)用程序而預(yù)先安裝的聲處理程序。該聲處理程序被存儲(chǔ)在磁盤、光盤、半導(dǎo)體存儲(chǔ)器等存儲(chǔ)媒體432上。
聲處理程序包括第1聲信號(hào)生成步驟,生成第1聲信號(hào);第2聲信號(hào)取得步驟,從話筒423取得第2聲信號(hào);回波抑制步驟,根據(jù)第1聲信號(hào)和第2聲信號(hào)來(lái)抑制第2聲信號(hào)的回波分量,將抑制了回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)步驟,將第3聲信號(hào)存儲(chǔ)到硬盤上;語(yǔ)音檢測(cè)步驟,從回波抑制步驟輸出的第3聲信號(hào)中檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端;控制步驟,進(jìn)行控制,以便將硬盤上存儲(chǔ)的第3聲信號(hào)內(nèi)的、從存在話者的語(yǔ)音的區(qū)間的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)從硬盤輸出;以及語(yǔ)音識(shí)別步驟,執(zhí)行從硬盤輸出的第4聲信號(hào)的語(yǔ)音識(shí)別。
此外,回波抑制步驟包含偽回波信號(hào)生成步驟,根據(jù)第1聲信號(hào)和第2聲信號(hào)來(lái)估計(jì)第2聲信號(hào)的回波分量,生成用于表示估計(jì)出的回波分量的偽回波信號(hào);以及差信號(hào)生成步驟,生成用于表示第2聲信號(hào)取得步驟取得的第2聲信號(hào)和偽回波信號(hào)生成步驟生成的偽回波信號(hào)之差的差信號(hào)。
此外,在控制步驟中,將從存在話者的語(yǔ)音的區(qū)間的始端回溯了預(yù)先設(shè)定的時(shí)間“Tm”的時(shí)刻以后硬盤上存儲(chǔ)的第3聲信號(hào)作為第4聲信號(hào)從硬盤輸出。
語(yǔ)音檢測(cè)步驟從第1聲信號(hào)中取得與信號(hào)電平的變化、頻率特性、發(fā)聲內(nèi)容有關(guān)的信息,所以能夠以比較高的精度來(lái)判定是否是話者的語(yǔ)音。
接著,說(shuō)明本實(shí)施方式的聲處理系統(tǒng)420的工作。
如圖32所表示,首先,生成用于表示引導(dǎo)語(yǔ)音的第1聲信號(hào),從揚(yáng)聲器422輸出引導(dǎo)語(yǔ)音(步驟S11)。另一方面,話筒423生成包含表示話者語(yǔ)音的語(yǔ)音分量和表示引導(dǎo)語(yǔ)音的回波的回波分量的第2聲信號(hào)(步驟S12)。接著,從話筒423取得第2聲信號(hào),抑制第2聲信號(hào)的回波分量,將抑制了回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出(步驟S13)。逐次將第3聲信號(hào)存儲(chǔ)到硬盤上(步驟S14)。此外,從第3聲信號(hào)中檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端(步驟S15)。將硬盤上存儲(chǔ)的第3聲信號(hào)內(nèi)的、從該始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后硬盤上存儲(chǔ)的第3聲信號(hào)依次作為第4聲信號(hào)來(lái)輸出(步驟S16)。接著,開始從硬盤輸出的第4聲信號(hào)的語(yǔ)音識(shí)別(步驟S17)。
如上所述,在本實(shí)施方式的聲處理系統(tǒng)420中,個(gè)人計(jì)算機(jī)421執(zhí)行聲處理程序,所以能夠以低成本來(lái)實(shí)現(xiàn)效率比較高的聲處理裝置。
其中,本實(shí)施方式的聲處理系統(tǒng)420由個(gè)人計(jì)算機(jī)421來(lái)實(shí)現(xiàn)。然而,也可以由手機(jī)來(lái)實(shí)現(xiàn)。此外,在經(jīng)由網(wǎng)絡(luò)的多個(gè)個(gè)人計(jì)算機(jī)之間,也可以實(shí)現(xiàn)聲處理系統(tǒng)。
如上所述,本實(shí)施方式的聲處理系統(tǒng)即使在不能充分抑制回波分量的環(huán)境下,也能夠比較準(zhǔn)確地提取存在話者的語(yǔ)音的區(qū)間,所以能夠高效率地執(zhí)行提取出的區(qū)間的語(yǔ)音識(shí)別。
產(chǎn)業(yè)上的可利用性如上所述,本發(fā)明的聲處理裝置具有能夠縮短從回波消除器處理聲信號(hào)到輸出的時(shí)間這一效果,作為使用回波消除器的聲處理裝置、方法、程序及存儲(chǔ)媒體等很有用。
權(quán)利要求
1.一種聲處理裝置,其特征在于,包括揚(yáng)聲器,將第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,根據(jù)上述第1聲信號(hào)和上述第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便使上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件存儲(chǔ)的第3聲信號(hào)內(nèi)的、從上述語(yǔ)音檢測(cè)部件檢測(cè)出的上述話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
2.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述回波抑制部件包含自適應(yīng)濾波器,估計(jì)上述第2聲信號(hào)的回波分量,生成用于表示估計(jì)出的回波分量的偽回波信號(hào);以及減法器,生成用于表示上述聲信號(hào)生成部件生成的第2聲信號(hào)和上述自適應(yīng)濾波器生成的偽回波信號(hào)之差的差信號(hào);上述自適應(yīng)濾波器根據(jù)上述第1聲信號(hào)和上述差信號(hào)來(lái)生成偽回波信號(hào);上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
3.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述回波抑制部件包含自適應(yīng)濾波器,估計(jì)濾波器系數(shù);卷積處理部,根據(jù)上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)對(duì)上述第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部,判定上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在上述濾波器系數(shù)穩(wěn)定的情況下,向上述卷積處理部傳送上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù);以及減法器,生成用于表示上述聲信號(hào)生成部件生成的第2聲信號(hào)和上述卷積處理部生成的偽回波信號(hào)之差的差信號(hào),上述自適應(yīng)濾波器根據(jù)上述第1聲信號(hào)和上述差信號(hào)來(lái)估計(jì)濾波器系數(shù),上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
4.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述回波抑制部件包含自適應(yīng)濾波器,估計(jì)濾波器系數(shù);第1聲信號(hào)存儲(chǔ)部,按先入先出的順序來(lái)存儲(chǔ)上述第1聲信號(hào),以便向第1聲信號(hào)施加延遲并輸出;第2聲信號(hào)存儲(chǔ)部,按先入先出的順序來(lái)存儲(chǔ)上述第2聲信號(hào),以便向第2聲信號(hào)施加延遲并輸出;卷積處理部,根據(jù)上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)對(duì)上述第1聲信號(hào)存儲(chǔ)部輸出的第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部,判定上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在上述濾波器系數(shù)穩(wěn)定的情況下,向上述卷積處理部傳送上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù);以及減法器,生成用于表示上述第2聲信號(hào)存儲(chǔ)部輸出的第2聲信號(hào)和上述卷積處理部生成的偽回波信號(hào)之差的差信號(hào);上述自適應(yīng)濾波器根據(jù)上述第1聲信號(hào)和上述差信號(hào)來(lái)估計(jì)濾波器系數(shù);上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
5.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述回波抑制部件包含第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部,將上述第1聲信號(hào)作為第1學(xué)習(xí)數(shù)據(jù)來(lái)存儲(chǔ);第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部,將上述聲信號(hào)生成部件生成的第2聲信號(hào)作為第2學(xué)習(xí)數(shù)據(jù)來(lái)存儲(chǔ);控制部,控制上述第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部和上述第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部,以便相對(duì)應(yīng)地存儲(chǔ)上述第1聲信號(hào)和上述第2聲信號(hào);自適應(yīng)濾波器,根據(jù)上述第1學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部中存儲(chǔ)的第1聲信號(hào)和上述第2學(xué)習(xí)數(shù)據(jù)存儲(chǔ)部中存儲(chǔ)的第2聲信號(hào)來(lái)估計(jì)濾波器系數(shù);卷積處理部,根據(jù)上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)對(duì)上述第1聲信號(hào)實(shí)施卷積處理,生成偽回波信號(hào);系數(shù)傳送部,判定上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù)是否穩(wěn)定,在上述濾波器系數(shù)穩(wěn)定的情況下,向上述卷積處理部傳送上述自適應(yīng)濾波器估計(jì)出的濾波器系數(shù);以及減法器,生成用于表示上述聲信號(hào)生成部件生成的第2聲信號(hào)和上述卷積處理部生成的偽回波信號(hào)之差的差信號(hào);上述回波抑制部件將上述減法器生成的差信號(hào)作為第3聲信號(hào)來(lái)輸出。
6.一種聲處理裝置,其特征在于,包括通信部件,與具有生成第1聲信號(hào)的聲信號(hào)生成部件的外部設(shè)備經(jīng)網(wǎng)絡(luò)進(jìn)行通信,從上述外部設(shè)備接收上述第1聲信號(hào);揚(yáng)聲器,將該通信部件接收到的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述聲信號(hào)生成部件生成的第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便使上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件存儲(chǔ)的第3聲信號(hào)內(nèi)的、從上述語(yǔ)音檢測(cè)部件檢測(cè)出的上述話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
7.一種聲處理裝置,其特征在于,包括通信部件,與外部設(shè)備經(jīng)網(wǎng)絡(luò)進(jìn)行通信,為了使上述外部設(shè)備的揚(yáng)聲器輸出上述第1聲信號(hào)所表示的聲音而將上述第1聲信號(hào)發(fā)送到上述外部設(shè)備,接收上述外部設(shè)備的聲信號(hào)生成部件生成的第2聲信號(hào);該外部設(shè)備具有揚(yáng)聲器,將第1聲信號(hào)變換為聲音,輸出變換出的聲音;以及聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制該通信部件接收到的第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便使上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件存儲(chǔ)的第3聲信號(hào)內(nèi)的、從上述語(yǔ)音檢測(cè)部件檢測(cè)出的上述話者的語(yǔ)音的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
8.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第1聲信號(hào)的信號(hào)電平和上述第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
9.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第3聲信號(hào)的噪聲分量,按照計(jì)測(cè)到的噪聲分量來(lái)更新預(yù)先設(shè)定的閾值,比較上述第1聲信號(hào)的信號(hào)電平及上述第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
10.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件判定上述揚(yáng)聲器是否輸出了語(yǔ)音,根據(jù)該判定來(lái)更新預(yù)先設(shè)定的閾值,比較上述第1聲信號(hào)的信號(hào)電平及上述第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
11.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述揚(yáng)聲器輸出的聲音的持續(xù)時(shí)間,根據(jù)上述持續(xù)時(shí)間來(lái)更新預(yù)先設(shè)定的閾值,比較上述第1聲信號(hào)的信號(hào)電平及上述第3聲信號(hào)的信號(hào)電平和更新過(guò)的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
12.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)算表示上述第1聲信號(hào)的功率的第1功率值和表示上述第3聲信號(hào)的功率的第3功率值,比較算出的第1功率值及第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
13.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件執(zhí)行上述第1聲信號(hào)及第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
14.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第2聲信號(hào)的信號(hào)電平和上述第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第2聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
15.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)算表示上述第2聲信號(hào)的功率的第2功率值和表示上述第3聲信號(hào)的功率的第3功率值,比較算出的第2功率值及第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
16.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件執(zhí)行上述第2聲信號(hào)及上述第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
17.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第1聲信號(hào)至上述第3聲信號(hào)的各信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)至第3聲信號(hào)的各信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
18.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件計(jì)算分別表示上述第1聲信號(hào)至上述第3聲信號(hào)的各功率的第1功率值、第2功率值及第3功率值,比較算出的第1聲信號(hào)至第3聲信號(hào)的各功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
19.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述語(yǔ)音檢測(cè)部件執(zhí)行上述第1聲信號(hào)至上述第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
20.如權(quán)利要求1所述的聲處理裝置,其特征在于,包括音量調(diào)整部件,調(diào)整上述第1聲信號(hào)的信號(hào)電平,調(diào)整上述揚(yáng)聲器輸出的聲音的音量;上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述音量調(diào)整部件調(diào)整過(guò)的第1聲信號(hào)的信號(hào)電平和上述回波抑制部件輸出的第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第1聲信號(hào)的信號(hào)電平及第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
21.如權(quán)利要求1所述的聲處理裝置,其特征在于,包括音量調(diào)整部件,調(diào)整上述第1聲信號(hào)的信號(hào)電平,調(diào)整上述揚(yáng)聲器輸出的聲音的音量;上述語(yǔ)音檢測(cè)部件計(jì)算表示上述音量調(diào)整部件調(diào)整過(guò)的第1聲信號(hào)的功率的第1功率值和表示上述回波抑制部件輸出的第3聲信號(hào)的功率的第3功率值,比較算出的第1功率值及第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
22.如權(quán)利要求1所述的聲處理裝置,其特征在于,包括音量調(diào)整部件,調(diào)整上述第1聲信號(hào)的信號(hào)電平,調(diào)整上述揚(yáng)聲器輸出的聲音的音量;上述語(yǔ)音檢測(cè)部件執(zhí)行上述音量調(diào)整部件調(diào)整過(guò)的第1聲信號(hào)及上述回波抑制部件輸出的第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
23.如權(quán)利要求1所述的聲處理裝置,其特征在于,包括觸發(fā)信號(hào)生成部件,生成與應(yīng)檢測(cè)上述話者的語(yǔ)音的始端的時(shí)刻相關(guān)聯(lián)的觸發(fā)信號(hào);上述語(yǔ)音檢測(cè)部件根據(jù)上述觸發(fā)信號(hào)生成部件生成的觸發(fā)信號(hào)從上述第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端。
24.如權(quán)利要求23所述的聲處理裝置,其特征在于,上述觸發(fā)信號(hào)生成部件生成與應(yīng)檢測(cè)上述話者的語(yǔ)音的始端的時(shí)刻相關(guān)聯(lián)的觸發(fā)信號(hào);上述語(yǔ)音檢測(cè)部件根據(jù)上述觸發(fā)信號(hào)生成部件生成的觸發(fā)信號(hào)從上述第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音的始端。
25.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述聲信號(hào)生成部件包括多個(gè)話筒元件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,分別生成包含表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量的多個(gè)聲信號(hào);以及聲信號(hào)合成部,合成上述多個(gè)話筒元件分別生成的多個(gè)聲信號(hào),生成第2聲信號(hào),上述聲信號(hào)生成部件將上述聲信號(hào)合成部生成的第2聲信號(hào)輸出到回波抑制部件;上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述聲信號(hào)合成部生成的第2聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第2聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
26.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述聲信號(hào)生成部件包括多個(gè)話筒元件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,分別生成多個(gè)聲信號(hào),多個(gè)聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;以及聲信號(hào)合成部,合成上述多個(gè)話筒元件分別生成的多個(gè)聲信號(hào),生成第2聲信號(hào);上述聲信號(hào)生成部件將上述聲信號(hào)合成部生成的第2聲信號(hào)輸出到回波抑制部件;上述語(yǔ)音檢測(cè)部件計(jì)算表示上述聲信號(hào)合成部生成的第2聲信號(hào)的功率的第2功率值,比較算出的第2功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
27.如權(quán)利要求1所述的聲處理裝置,其特征在于,上述聲信號(hào)生成部件包括多個(gè)話筒元件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,分別生成多個(gè)聲信號(hào),多個(gè)聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;以及聲信號(hào)合成部,合成上述多個(gè)話筒元件分別生成的多個(gè)聲信號(hào),生成第2聲信號(hào);上述聲信號(hào)生成部件將上述聲信號(hào)合成部生成的第2聲信號(hào)輸出到回波抑制部件;上述語(yǔ)音檢測(cè)部件執(zhí)行上述聲信號(hào)合成部生成的第2聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
28.如權(quán)利要求1所述的聲處理裝置,其特征在于,包括噪聲抑制部件,抑制上述回波抑制部件輸出的第3聲信號(hào)的噪聲分量;上述語(yǔ)音檢測(cè)部件計(jì)測(cè)抑制了上述噪聲分量的第3聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第3聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
29.如權(quán)利要求1所述的聲處理裝置,其特征在于,包括噪聲抑制部件,抑制上述回波抑制部件輸出的第3聲信號(hào)的噪聲分量,上述語(yǔ)音檢測(cè)部件計(jì)算表示抑制了上述噪聲分量的第3聲信號(hào)的功率的第3功率值,比較算出的第3功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
30.如權(quán)利要求1所述的聲處理裝置,其特征在于,包括噪聲抑制部件,抑制上述回波抑制部件輸出的第3聲信號(hào)的噪聲分量,上述語(yǔ)音檢測(cè)部件執(zhí)行抑制了上述噪聲分量的第3聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
31.如權(quán)利要求3所述的聲處理裝置,其特征在于,在上述系數(shù)傳送部判定為上述濾波器系數(shù)穩(wěn)定時(shí),上述語(yǔ)音檢測(cè)部件計(jì)測(cè)上述第2聲信號(hào)的信號(hào)電平,比較計(jì)測(cè)到的第2聲信號(hào)的信號(hào)電平和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
32.如權(quán)利要求3所述的聲處理裝置,其特征在于,在上述系數(shù)傳送部判定為上述濾波器系數(shù)穩(wěn)定時(shí),上述語(yǔ)音檢測(cè)部件計(jì)算表示上述第2聲信號(hào)的功率的第2功率值,比較算出的第2功率值和預(yù)先設(shè)定的閾值,檢測(cè)上述話者的語(yǔ)音的始端。
33.如權(quán)利要求3所述的聲處理裝置,其特征在于,在上述系數(shù)傳送部判定為上述濾波器系數(shù)穩(wěn)定時(shí),上述語(yǔ)音檢測(cè)部件執(zhí)行上述第2聲信號(hào)的頻率分析,根據(jù)該頻率分析的結(jié)果來(lái)檢測(cè)上述話者的語(yǔ)音的始端。
34.一種聲處理系統(tǒng),其特征在于,包括具有第1及第2聲處理裝置的至少2個(gè)聲處理裝置;第1聲處理裝置具有揚(yáng)聲器,將輸入的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;以及通信部件,將上述第1聲信號(hào)發(fā)送到上述第2聲處理裝置;第2聲處理裝置具有揚(yáng)聲器,將輸入的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和上述話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;以及通信部件,將上述第1聲信號(hào)發(fā)送到上述第1聲處理裝置;在上述第1聲處理裝置的語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述第1聲處理裝置的控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述第2聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);在上述第2聲處理裝置的語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述第2聲處理裝置的控制部件進(jìn)行控制,以便使上述第1聲處理裝置的聲信號(hào)存儲(chǔ)部件將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端來(lái)輸出上述第4聲信號(hào)。
35.如權(quán)利要求34所述的聲處理系統(tǒng),其特征在于,上述第1聲處理裝置的回波抑制部件根據(jù)輸入到上述第1聲處理裝置中的第1聲信號(hào)、上述第1聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)、以及從上述第2聲處理裝置接收到的第1聲信號(hào)來(lái)抑制上述第1聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)的回波分量;上述第2聲處理裝置的回波抑制部件根據(jù)輸入到上述第2聲處理裝置中的第1聲信號(hào)、上述第2聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)、以及從上述第1聲處理裝置接收到的第1聲信號(hào)來(lái)抑制上述第2聲處理裝置的聲信號(hào)生成部件生成的第2聲信號(hào)的回波分量。
36.一種聲處理系統(tǒng),其特征在于,包括音頻裝置,生成第1聲信號(hào);以及聲處理裝置,具有揚(yáng)聲器,取得上述音頻裝置生成的第1聲信號(hào),將取得的第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);包括聲信號(hào)記錄裝置,取得上述聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出的第4聲信號(hào),記錄取得的第4聲信號(hào)。
37.一種聲處理系統(tǒng),其特征在于,包括汽車導(dǎo)航裝置,具有導(dǎo)航信息生成部件,生成導(dǎo)航信息;以及聲信號(hào)生成部件,生成第1聲信號(hào)作為與導(dǎo)航有關(guān)的引導(dǎo)語(yǔ)音;以及聲處理裝置,具有揚(yáng)聲器,取得上述汽車導(dǎo)航裝置的聲信號(hào)生成部件生成的第1聲信號(hào),將取得的第1聲信號(hào)變換為聲音,將變換出的聲音作為上述汽車導(dǎo)航裝置的引導(dǎo)語(yǔ)音來(lái)輸出;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);上述汽車導(dǎo)航裝置還具有語(yǔ)音識(shí)別部件,為了判定話者是否響應(yīng)上述引導(dǎo)語(yǔ)音發(fā)出了特定的語(yǔ)音,而執(zhí)行上述聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出的第4聲信號(hào)的語(yǔ)音識(shí)別;在用上述汽車導(dǎo)航裝置的語(yǔ)音識(shí)別部件判定為上述話者發(fā)出了特定的語(yǔ)音時(shí),上述汽車導(dǎo)航裝置的導(dǎo)航信息生成部件生成與上述特定的語(yǔ)音相應(yīng)的導(dǎo)航信息。
38.一種聲處理系統(tǒng),其特征在于,包括外部設(shè)備,具有聲信號(hào)生成部件,生成用于表示語(yǔ)音的第1聲信號(hào);以及聲處理裝置,具有揚(yáng)聲器,取得上述外部設(shè)備的聲信號(hào)生成部件生成的第1聲信號(hào),將取得的第1聲信號(hào)變換為聲音,將變換出的聲音作為上述外部設(shè)備的語(yǔ)音來(lái)輸出;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);上述外部設(shè)備還具有語(yǔ)音識(shí)別部件,為了判定話者是否響應(yīng)上述揚(yáng)聲器輸出的語(yǔ)音發(fā)出了語(yǔ)音,而執(zhí)行上述聲處理裝置的聲信號(hào)存儲(chǔ)部件輸出的第4聲信號(hào)的語(yǔ)音識(shí)別;上述外部設(shè)備的聲信號(hào)生成部件根據(jù)上述語(yǔ)音識(shí)別部件的語(yǔ)音識(shí)別來(lái)生成用于表示響應(yīng)語(yǔ)音的第1聲信號(hào),以便響應(yīng)上述話者發(fā)出的語(yǔ)音。
39.一種聲處理方法,其特征在于,包括準(zhǔn)備步驟,準(zhǔn)備聲處理裝置,該聲處理裝置具有揚(yáng)聲器,將第1聲信號(hào)變換為聲音,輸出變換出的聲音;聲信號(hào)生成部件,拾取上述揚(yáng)聲器輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào),該第2聲信號(hào)包含了表示上述揚(yáng)聲器輸出的聲音的回波分量和表示上述話者語(yǔ)音的語(yǔ)音分量;回波抑制部件,根據(jù)上述第1聲信號(hào)和上述第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件,與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)部件,從上述回波抑制部件輸出的第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制部件,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào);回波抑制步驟,上述回波抑制部件根據(jù)第1聲信號(hào)和上述第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量;存儲(chǔ)步驟,上述聲信號(hào)存儲(chǔ)部件與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)第3聲信號(hào);語(yǔ)音檢測(cè)步驟,上述語(yǔ)音檢測(cè)部件從上述第3聲信號(hào)中檢測(cè)上述話者的語(yǔ)音;以及控制步驟,上述控制部件控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述控制步驟中,在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào)。
40.一種聲處理程序,能夠使計(jì)算機(jī)執(zhí)行,其特征在于,包括回波抑制步驟,根據(jù)第1聲信號(hào)和第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;存儲(chǔ)步驟,與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)步驟,從上述第3聲信號(hào)中檢測(cè)話者的語(yǔ)音;以及控制步驟,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述控制步驟中,在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào)。
41.一種記錄媒體,記錄著計(jì)算機(jī)可執(zhí)行的聲處理程序,其特征在于,上述聲處理程序包括回波抑制步驟,根據(jù)第1聲信號(hào)和上述第2聲信號(hào)來(lái)抑制上述第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;存儲(chǔ)步驟,與時(shí)間信息相關(guān)聯(lián)來(lái)存儲(chǔ)上述第3聲信號(hào);語(yǔ)音檢測(cè)步驟,從上述第3聲信號(hào)中檢測(cè)話者的語(yǔ)音;以及控制步驟,控制上述聲信號(hào)存儲(chǔ)部件,以便上述聲信號(hào)存儲(chǔ)部件將上述聲信號(hào)存儲(chǔ)部件中存儲(chǔ)的第3聲信號(hào)內(nèi)的、檢測(cè)出上述話者的語(yǔ)音的區(qū)間的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出;在上述控制步驟中,在上述語(yǔ)音檢測(cè)部件檢測(cè)出上述話者的語(yǔ)音的始端時(shí),上述控制部件進(jìn)行控制,以便將從檢測(cè)出上述話者的語(yǔ)音的時(shí)刻回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻作為上述話者的語(yǔ)音的始端使上述聲信號(hào)存儲(chǔ)部件輸出上述第4聲信號(hào)。
全文摘要
本發(fā)明的聲處理裝置(10)包括揚(yáng)聲器(12),輸出第1聲信號(hào)所表示的聲音;聲信號(hào)生成部件(13),拾取揚(yáng)聲器(12)輸出的聲音和話者的語(yǔ)音,生成第2聲信號(hào);回波抑制部件(14),抑制第2聲信號(hào)的回波分量,將抑制了上述回波分量的第2聲信號(hào)作為第3聲信號(hào)來(lái)輸出;聲信號(hào)存儲(chǔ)部件(15),存儲(chǔ)第3聲信號(hào);語(yǔ)音檢測(cè)部件(16),從回波抑制部件(14)輸出的第3聲信號(hào)中檢測(cè)存在話者的語(yǔ)音的區(qū)間的始端;以及控制部件(17),控制聲信號(hào)存儲(chǔ)部件(15),以便聲信號(hào)存儲(chǔ)部件(15)將聲信號(hào)存儲(chǔ)部件(15)存儲(chǔ)的第3聲信號(hào)內(nèi)的、從上述語(yǔ)音檢測(cè)部件(16)檢測(cè)出的存在上述話者的語(yǔ)音的區(qū)間的始端回溯了預(yù)先設(shè)定的時(shí)間的時(shí)刻以后的第3聲信號(hào)作為第4聲信號(hào)來(lái)輸出。
文檔編號(hào)G10L11/02GK1717720SQ200480001508
公開日2006年1月4日 申請(qǐng)日期2004年8月27日 優(yōu)先權(quán)日2003年9月5日
發(fā)明者國(guó)枝伸行, 野村和也, 中村一啟 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社