基音估計(jì)的制作方法

文檔序號(hào)：2824804閱讀：236來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：基音估計(jì)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對(duì)信號(hào)的基音周期的估計(jì)，具體地，涉及用于這種估計(jì)的目標(biāo)候選。本發(fā)明可具體應(yīng)用于丟包隱藏方法中使用的對(duì)聲音信號(hào)的基音周期的估計(jì)。
背景技術(shù)：
無線和網(wǎng)絡(luò)語音協(xié)議(VoIP)通信經(jīng)受由不利連接條件所引起的數(shù)據(jù)包的頻繁劣化。劣化的數(shù)據(jù)包會(huì)丟失或被破壞(包括不可接受的高出錯(cuò)率)。這種劣化的數(shù)據(jù)包導(dǎo)致在連接的接收端處在輸出聲音信號(hào)中存在喀噠聲和爆裂聲或者其他雜音。這劣化了接收端處感知到的語音質(zhì)量，并且如果數(shù)據(jù)包劣化率足夠高則會(huì)使得語音不可識(shí)別。廣義地說，采用兩種方法來解決劣化數(shù)據(jù)包的問題。第一種方法為使用基于發(fā)射機(jī)的恢復(fù)技術(shù)。這種技術(shù)包括重新發(fā)射劣化數(shù)據(jù)包；使多個(gè)數(shù)據(jù)包的內(nèi)容交織，以分散數(shù)據(jù)包劣化的影響，并且向所發(fā)射的數(shù)據(jù)包添加糾錯(cuò)編碼位使得可以在接收機(jī)處重構(gòu)劣化數(shù)據(jù)包。為了限制這些技術(shù)所固有的增加的帶寬需求和延遲，通常使用這些技術(shù)以使得如果數(shù)據(jù)包劣化率較低則可以恢復(fù)劣化數(shù)據(jù)包，但是如果數(shù)據(jù)包劣化率較高則不能恢復(fù)所有的劣化數(shù)據(jù)包。此外，一些發(fā)射機(jī)可能不具有實(shí)施基于發(fā)射機(jī)的恢復(fù)技術(shù)的能力。所采用的解決劣化數(shù)據(jù)包問題的第二種方法為使用基于接收機(jī)的隱藏技術(shù)。除基于發(fā)射機(jī)的恢復(fù)技術(shù)之外，通常使用這種技術(shù)以隱藏在已經(jīng)采用基于發(fā)射機(jī)的恢復(fù)技術(shù)之后留下的任何剩余劣化。此外，如果發(fā)射機(jī)不能夠?qū)嵤┗诎l(fā)射機(jī)的恢復(fù)技術(shù)，則可以單獨(dú)地使用這些技術(shù)。使用低復(fù)雜性的基于接收機(jī)的隱藏技術(shù)，諸如用靜音、噪聲或先前數(shù)據(jù)包的重復(fù)填充劣化數(shù)據(jù)包，但是結(jié)果導(dǎo)致質(zhì)量差的輸出聲音信號(hào)。諸如基于模型的恢復(fù)(其中，劣化數(shù)據(jù)包任一側(cè)的語音被建模，以生成用于劣化數(shù)據(jù)包的語音)的基于再生的方案產(chǎn)生質(zhì)量非常高的輸出聲音信號(hào)，但是復(fù)雜性大、耗能高并且實(shí)施昂貴。在實(shí)際情況中，優(yōu)選使用基于內(nèi)插的技術(shù)。這些技術(shù)通過在劣化數(shù)據(jù)包的一側(cè)或兩側(cè)內(nèi)插來自數(shù)據(jù)包的參數(shù)來生成替換數(shù)據(jù)包。這些技術(shù)實(shí)施起來相對(duì)簡(jiǎn)單，并且產(chǎn)生適當(dāng)高質(zhì)量的輸出聲音信號(hào)?；诨?pitch)的波形替換是優(yōu)選的基于內(nèi)插的數(shù)據(jù)包劣化恢復(fù)技術(shù)。當(dāng)在短時(shí)間間隔上看時(shí)，聲音信號(hào)看起來由重復(fù)的片段組成。該片段以被稱為基音周期的時(shí)間周期而周期性地重復(fù)。在基于基音的波形替換中，對(duì)劣化數(shù)據(jù)包的一側(cè)或兩側(cè)的聲音數(shù)據(jù)包的基音周期進(jìn)行估計(jì)。然后，將估計(jì)基音周期或多個(gè)估計(jì)基音周期的波形用作(或者重復(fù)并用作)劣化數(shù)據(jù)包的替換。該技術(shù)是有效的，因?yàn)榱踊曇魯?shù)據(jù)包的基音周期通常與劣化數(shù)據(jù)包任一側(cè)上的聲音數(shù)據(jù)包的基音周期基本上相同。在基于基音的波形替換技術(shù)中，替換數(shù)據(jù)包和剩余信號(hào)之間的邊界處的不連續(xù)經(jīng)常被檢測(cè)到為輸出聲音信號(hào)中的雜音。使用了重疊相加功能的邊界任一側(cè)上的信號(hào)的同時(shí)淡入淡出被用于減小這種不連續(xù)。還提出了圖樣匹配方法。使用許多方法來估計(jì)聲音信號(hào)的基音周期。對(duì)于這些方法中的典型一種，估計(jì)基音周期所涉及的計(jì)算占用了基于基音的波形替換技術(shù)中的算法復(fù)雜度的90%以上。盡管計(jì)算的復(fù)雜等級(jí)較低，但其對(duì)于諸如藍(lán)牙的低功率平臺(tái)來說很顯著。為了正確地確定聲音信號(hào)的基音周期，基音周期值的寬預(yù)定范圍被分析，例如從2. 5ms (對(duì)于具有高聲音的人)到 16ms (對(duì)于具有低聲音的人)。對(duì)于大多數(shù)基音周期確定算法，使用的基音周期范圍越寬，計(jì)算復(fù)雜度越高。減小計(jì)算復(fù)雜度的一種方式是減少算法所計(jì)算的計(jì)算次數(shù)。ITU-T建議G. 711附錄I “一種利用G. 711的用于包丟失隱藏的高質(zhì)量低復(fù)雜度算法”(ITU-T Recommendation G. 711 Appendix I, “A high quality low-complexity algorithm for packet loss concealment with G. 711”)通過使用基音周期估計(jì)的兩階段方法來減少計(jì)算次數(shù)。在第一階段中，在基音周期的整個(gè)預(yù)定范圍上執(zhí)行粗略搜索，以確定基音周期的粗略估計(jì)。在第二階段中，在包括基音周期的粗略估計(jì)基音周期的精確范圍上執(zhí)行精確搜索。因此，可以確定基音周期的更加精確的精確估計(jì)。因此，與在基音周期的整個(gè)預(yù)定范圍上執(zhí)行精確搜索相比，減少了算法所計(jì)算的計(jì)算次數(shù)。美國(guó)專利申請(qǐng)第11/734824號(hào)提出了一種基音周期估計(jì)的兩階段方法，其進(jìn)一步減少了算法所計(jì)算的計(jì)算次數(shù)。在該申請(qǐng)中，在基音周期的整個(gè)預(yù)定范圍上，對(duì)抽選的信號(hào)執(zhí)行粗略搜索。在識(shí)別了基音周期的初始最佳候選時(shí)，以初始最佳候選為中心計(jì)算基音周期的精確范圍。分析初始最佳候選與精確范圍的端點(diǎn)之間的中點(diǎn)處的基音周期。如果初始最佳候選是優(yōu)選的，則這些中點(diǎn)基音周期中的一個(gè)被看作基音周期的精確最佳候選。可以執(zhí)行進(jìn)一步的平分搜索，以產(chǎn)生更多的基音周期的精確估計(jì)。因此，與在基音周期的整個(gè)精確范圍上執(zhí)行精細(xì)搜索的算法相比，減少了算法所計(jì)算的計(jì)算次數(shù)。盡管這些方法減少了算法所計(jì)算的計(jì)算次數(shù)，但與基音周期的估計(jì)相關(guān)聯(lián)的計(jì)算復(fù)雜度還存在問題，尤其是諸如藍(lán)牙的低功率平臺(tái)。此外，基音周期確定算法通常涉及對(duì)以落后值分離的信號(hào)的部分進(jìn)行比較。算法選擇與最類似部分相關(guān)的落后值作為基音周期的估計(jì)。然而，以基音周期的倍數(shù)分離的信號(hào)部分也非常相似。基音周期檢測(cè)算法的共同問題在于，基音周期的倍數(shù)被選擇作為基音周期的估計(jì)。Chu，Wai C.，語音編碼算法標(biāo)準(zhǔn)化編碼器的建立和演化，Wiley出版社， 2003 (Chu, Wai C.Speech coding algorithms !foundation and evolution of standardized coders (Wiley, 2003))公開了一種一旦使用自相關(guān)算法確定了基音周期的估計(jì)就檢查基音周期的倍數(shù)的方法。通過一個(gè)或多個(gè)整數(shù)來分割基音周期估計(jì)以形成檢查點(diǎn)。如果檢查點(diǎn)產(chǎn)生足夠高的自相關(guān)值，則其被用作基音周期的精確估計(jì)。期望使用諸如上面所述的倍數(shù)檢查算法的倍數(shù)檢查算法，以增加基音周期估計(jì)的精度。然而，這種檢查算法增加了與基音周期的估計(jì)相關(guān)聯(lián)的計(jì)算復(fù)雜度。因此，需要一種估計(jì)信號(hào)的基音周期的改進(jìn)方法，其通過減小估計(jì)為“真”基音周期的倍數(shù)的可能性來增加估計(jì)的精度，并且還減小與估計(jì)相關(guān)的計(jì)算復(fù)雜度。

發(fā)明內(nèi)容
根據(jù)本公開的第一方面，提供了一種估計(jì)信號(hào)的基音周期的方法，包括通過僅在潛在基音周期的第一范圍內(nèi)執(zhí)行搜索來識(shí)別第一候選基音周期；通過將第一候選基音周期除以整數(shù)來確定第二候選基音周期，第二候選基音周期在潛在基音周期的第一范圍之外；以及選擇候選基音周期中的較小者作為信號(hào)的基音周期的估計(jì)，該候選基音周期中的較小者使得以該候選基音周期分離的信號(hào)的部分被良好相關(guān)。適當(dāng)?shù)兀瑵撛诨糁芷诘牡谝环秶纳辖鐬樽畲鬂撛诨糁芷?。適當(dāng)?shù)?，潛在基音周期的第一范圍的下界為最大潛在基音周期的一半。適當(dāng)?shù)兀麛?shù)為使得第二候選基音周期大于最小潛在基音周期的整數(shù)。適當(dāng)?shù)?，該方法包括使用基音周期檢測(cè)算法來識(shí)別第一候選基音周期。適當(dāng)?shù)兀糁芷跈z測(cè)算法為歸一化互相關(guān)算法。適當(dāng)?shù)兀盘?hào)被采樣，第一候選基音周期為第一數(shù)量的采樣，第二候選基音周期為第二數(shù)量的采樣，其中，通過以下處理確定第二數(shù)量的采樣將第一數(shù)量的采樣除以整數(shù); 以及選擇與除法結(jié)果最接近的整數(shù)(whole number)作為第二數(shù)量的采樣。適當(dāng)?shù)?，該方法還包括使通過第一候選基音周期分離的信號(hào)的部分相關(guān)，以形成第一相關(guān)值，以及使通過第二候選基音周期分離的信號(hào)的部分相關(guān)，以形成第二相關(guān)值。適當(dāng)?shù)?，該方法包括如果第二相關(guān)值大于第一相關(guān)值的預(yù)定比例，則選擇第二候選基音周期作為信號(hào)的基音周期的估計(jì)。適當(dāng)?shù)?，該方法包括如果第二相關(guān)值小于第一相關(guān)值的預(yù)定比例，則選擇第一候選基音周期作為信號(hào)的基音周期的估計(jì)。適當(dāng)?shù)?，該方法包括選擇與較大相關(guān)值相關(guān)聯(lián)的候選基音周期作為信號(hào)的基音周期的估計(jì)。適當(dāng)?shù)?，該方法還包括在識(shí)別第一候選基音周期之前抽選信號(hào)。根據(jù)本公開的第二方面，提供了一種生成替換部分以替換信號(hào)的劣化部分的方法，包括以估計(jì)基音周期的倍數(shù)，來選擇劣化部分之前或之后的信號(hào)的采樣；以及從所選擇的采樣和在所選擇的采樣后面的采樣形成替換部分；其中，根據(jù)本公開的第一方面來確定該估計(jì)基音周期。適當(dāng)?shù)?，倍?shù)為I個(gè)或者大于I的整數(shù)。適當(dāng)?shù)?，該方法還包括在用替換部分替換劣化部分時(shí)，向替換部分和與替換部分相鄰的信號(hào)部分之間的邊界應(yīng)用重疊相加算法。適當(dāng)?shù)?，該方法還包括通過以下處理來使信號(hào)的基音周期的估計(jì)精確化對(duì)于包括估計(jì)基音周期和接近該估計(jì)基音周期的另一些候選基音周期的候選基音周期集合中的每一個(gè)候選基音周期，確定以該候選基音周期分離的信號(hào)的部分之間的幾何距離；以及選擇候選基音周期集合中的具有最小相關(guān)幾何距離的候選基音周期作為信號(hào)的基音周期的精確估計(jì)。根據(jù)本公開的第三方面，提供了一種生成替換部分以替換信號(hào)的劣化部分的方法，包括以精確化的估計(jì)基音周期的倍數(shù)，來選擇劣化部分之前或之后的信號(hào)的采樣；以及從所選擇的采樣和所選擇的采樣之后的采樣形成替換部分；其中，根據(jù)上述方法來確定該精確化的估計(jì)基首周期。適當(dāng)?shù)?，該方法包括?duì)于候選基音周期集合中的每一個(gè)候選基音周期，確定信號(hào)的第一部分和信號(hào)的第二部分之間的幾何距離，其中，第一部分接近劣化部分并在劣化部分之前或之后，而第二部分與第一部分的分離距離為該候選基音周期。適當(dāng)?shù)?，該方法包括?duì)于候選基音周期集合中的每一個(gè)候選基音周期，通過確定信號(hào)的第一部分和信號(hào)的第二部分之間的第一幾何距離來確定幾何距離，其中，第一部分
6接近劣化部分并在劣化部分之前，而第二部分以該候選基音周期與第一部分分離；確定信號(hào)的第三部分和信號(hào)的第四部分之間的第二幾何距離，其中，第三部分接近劣化部分并在劣化部分之后，而第四部分以該候選基音周期與第三部分分離；以及選擇第一幾何距離和第二幾何距離的平均作為幾何距離。適當(dāng)?shù)?，該方法包括使用基音周期檢測(cè)算法來識(shí)別第一候選基音周期，該算法比較信號(hào)的多個(gè)部分，每一個(gè)部分都由N個(gè)采樣組成；以及對(duì)于候選基音周期集合中的每一個(gè)候選基音周期，確定每一個(gè)都由L個(gè)采樣組成的信號(hào)部分之間的幾何距離，其中，L小于
N0適當(dāng)?shù)?，該方法還包括在用替換部分替換劣化部分時(shí)，向替換部分和與替換部分相鄰的信號(hào)的部分之間的邊界應(yīng)用重疊相加算法。根據(jù)本公開的第四方面，提供了一種基音周期估計(jì)裝置，包括候選基音周期識(shí)別模塊，被配置為通過僅在潛在基音周期的第一范圍上執(zhí)行搜索來識(shí)別信號(hào)的第一候選基音周期；處理模塊，被配置為通過將第一候選基音周期除以整數(shù)來確定信號(hào)的第二候選基音周期，第二候選基音周期在潛在基音周期的第一范圍之外；以及選擇模塊，被配置為選擇候選基音周期中的較小者作為信號(hào)的基音周期的估計(jì)，該候選基音周期中的較小者使得以該候選基音周期分離的信號(hào)部分被良好相關(guān)。

現(xiàn)在，將參照附圖通過實(shí)例的方式來描述本公開。在附圖中圖1是根據(jù)本公開的信號(hào)處理裝置的示意圖；圖2是示出通過圖1的裝置處理信號(hào)的方法的流程圖；圖3是用于估計(jì)信號(hào)的基音周期的方法的流程圖；圖4是示出互相關(guān)方法的典型聲音信號(hào)的示圖；圖5是包括劣化部分的典型聲音信號(hào)的示圖；以及圖6是適合于包括圖1的信號(hào)處理裝置的收發(fā)機(jī)的示意圖。
具體實(shí)施例方式圖1示出了信號(hào)處理裝置的一般配置的示意圖。在圖1中，在模塊處終止的實(shí)線箭頭表示控制信號(hào)。其他箭頭表示模塊之間信號(hào)的傳播方向。在線101上，數(shù)據(jù)流被輸入至信號(hào)處理裝置100。線101連接至劣化檢測(cè)器102的輸入端。劣化檢測(cè)器102的第一控制輸出端連接至開關(guān)104的輸入端。線101連接至開關(guān)104的另一個(gè)輸入端。開關(guān)104的輸出端連接至重疊相加模塊105的輸入端。在線106上，重疊相加模塊105的第一輸出端連接至信號(hào)處理裝置100的輸出端。信號(hào)處理裝置還包括劣化隱藏模塊107。在線108上，劣化檢測(cè)器102的第二控制輸出端連接至劣化隱藏模塊107的控制輸入端。劣化隱藏模塊107包括數(shù)據(jù)緩沖器109、基音周期估計(jì)模塊110和替換模塊111。重疊相加模塊105的第二輸出端連接至數(shù)據(jù)緩沖器109的輸入端。數(shù)據(jù)緩沖器109的第一輸出端連接至基音周期估計(jì)模塊110的輸入端。數(shù)據(jù)緩沖器109的第二輸出端連接至替換模塊111的第一輸入端?；糁芷诠烙?jì)模塊110的輸出端連接至替換模塊111的第二輸入端。替換模塊111的輸出端連接至開關(guān)104的第三輸入端。
在操作中，通過圖I的信號(hào)處理裝置以多個(gè)離散的時(shí)間上的部分來處理信號(hào)。以下描述是指對(duì)數(shù)據(jù)的數(shù)據(jù)包的處理，然而，描述等效地應(yīng)用于對(duì)數(shù)據(jù)的幀或者數(shù)據(jù)的任何其他適當(dāng)部分的處理。數(shù)據(jù)的這些部分的長(zhǎng)度通常為幾毫秒的級(jí)別。將參照?qǐng)D2的流程圖描述對(duì)輸入至裝置100的數(shù)據(jù)流進(jìn)行處理的方法。在圖2的步驟201中，在線101上，聲音信號(hào)的每一個(gè)數(shù)據(jù)包被順序輸入至信號(hào)處理裝置100。在步驟202中，每個(gè)數(shù)據(jù)包被輸入至劣化檢測(cè)器102。對(duì)于每一個(gè)數(shù)據(jù)包，劣化檢測(cè)器102確定數(shù)據(jù)包是否被劣化。在線108上，劣化檢測(cè)器102向劣化隱藏模塊107發(fā)送表明數(shù)據(jù)包是否被劣化的控制信號(hào)。如果確定數(shù)據(jù)包被劣化，則信號(hào)處理裝置丟棄該數(shù)據(jù)包，并使用劣化隱藏模塊107生成替換數(shù)據(jù)包。本文所描述的方法和裝置適合于藍(lán)牙設(shè)備中的實(shí)施。藍(lán)牙數(shù)據(jù)包包括在有效載荷部分之前的報(bào)頭部分。對(duì)數(shù)據(jù)包的報(bào)頭部分執(zhí)行報(bào)頭差錯(cuò)校驗(yàn)(HEC)。HEC為8位循環(huán)冗余校驗(yàn)(CRC)。如果HEC失敗，則劣化檢測(cè)器102確定數(shù)據(jù)包被劣化。如果數(shù)據(jù)包沒有劣化，則劣化檢測(cè)器102向開關(guān)104輸出控制信號(hào)，其控制開關(guān) 104將數(shù)據(jù)包傳送到重疊相加模塊105的輸入端。在步驟203中，如果數(shù)據(jù)包為劣化數(shù)據(jù)包之后的第一個(gè)好數(shù)據(jù)包，則重疊相加模塊105在級(jí)聯(lián)點(diǎn)(用于劣化數(shù)據(jù)包的替換數(shù)據(jù)包的結(jié)尾部分和好數(shù)據(jù)包的開始部分)處應(yīng)用重疊相加算法，以減少替換數(shù)據(jù)包和好數(shù)據(jù)包之間邊界處的任何不連續(xù)性。如果數(shù)據(jù)包不是劣化數(shù)據(jù)包之后的第一個(gè)好數(shù)據(jù)包，則該數(shù)據(jù)包沒有改變地從重疊相加模塊105輸出。在步驟207中，從重疊相加模塊105輸出的數(shù)據(jù)包被存儲(chǔ)在數(shù)據(jù)緩沖器109中。在線106上，從重疊相加模塊105輸出的數(shù)據(jù)包還從信號(hào)處理裝置100輸出。如果數(shù)據(jù)包被劣化，則劣化檢測(cè)器102在線108上向劣化隱藏模塊107輸出控制信號(hào)，控制劣化隱藏模塊107生成替換數(shù)據(jù)包。如果數(shù)據(jù)包被劣化，則劣化檢測(cè)器102不控制開關(guān)104來將劣化數(shù)據(jù)包連接至重疊相加模塊105。在這種情況下，劣化檢測(cè)器102控制開關(guān)104，以在線106上將劣化隱藏模塊107的輸出連接至信號(hào)處理裝置100的輸出。線108上被發(fā)送至劣化隱藏模塊107的控制信號(hào)控制劣化隱藏模塊107來執(zhí)行以下操作。數(shù)據(jù)緩沖器109被使能以向基音周期估計(jì)模塊110輸出一個(gè)數(shù)據(jù)包或多個(gè)數(shù)據(jù)包。由數(shù)據(jù)緩沖器109輸出的一個(gè)數(shù)據(jù)包或多個(gè)數(shù)據(jù)包接近劣化數(shù)據(jù)包。適當(dāng)?shù)?，由?shù)據(jù)緩沖器輸出的一個(gè)數(shù)據(jù)包或多個(gè)數(shù)據(jù)包是最近被解碼或者最近由數(shù)據(jù)包隱藏操作生成的那些數(shù)據(jù)包?？蛇x地，數(shù)據(jù)緩沖器可以在數(shù)據(jù)包被解碼之前存儲(chǔ)并輸出來自數(shù)據(jù)流的數(shù)據(jù)包。由數(shù)據(jù)緩沖器輸出的一個(gè)數(shù)據(jù)包或多個(gè)數(shù)據(jù)包可以在數(shù)據(jù)流中的劣化數(shù)據(jù)包之前或者在數(shù)據(jù)流中的劣化數(shù)據(jù)包之后。在步驟204中，基音周期估計(jì)模塊110估計(jì)其接收的一個(gè)數(shù)據(jù)包或多個(gè)數(shù)據(jù)包的基音周期。該估計(jì)被用作劣化數(shù)據(jù)包的基音周期的估計(jì)?；糁芷诠烙?jì)模塊110向替換模塊111輸出估計(jì)基音周期。在步驟205中，替換模塊111根據(jù)估計(jì)基音周期選擇來自數(shù)據(jù)緩沖器109的數(shù)據(jù)。所選擇的數(shù)據(jù)被用作劣化數(shù)據(jù)包的替換。適當(dāng)?shù)?，替換模塊111執(zhí)行基于基音的波形替換。適當(dāng)?shù)兀@涉及在由基音周期估計(jì)模塊111估計(jì)的基音周期中生成波形。波形被重復(fù)作為用于劣化數(shù)據(jù)包的替換。如果劣化數(shù)據(jù)包短于估計(jì)基音周期，則所生成的波形是估計(jì)基音周期長(zhǎng)度的一部分。適當(dāng)?shù)?，生成的波形稍微長(zhǎng)于劣化數(shù)據(jù)包，使其在劣化數(shù)據(jù)包的任一側(cè)上與數(shù)據(jù)包重疊。重疊相加模塊105有利地使用重疊來將劣化數(shù)據(jù)包的生成波形在任一側(cè)上漸漸融入所接收的信號(hào)中，從而實(shí)現(xiàn)平滑的級(jí)聯(lián)。替換模塊111使用順序存儲(chǔ)在數(shù)據(jù)緩沖器109中的數(shù)據(jù)生成波形。該數(shù)據(jù)包括好(未劣化)數(shù)據(jù)和由劣化隱藏模塊107生成的替換數(shù)據(jù)。有利地，數(shù)據(jù)緩沖器109具有為最大基音周期(在采樣中測(cè)量)的兩倍的較長(zhǎng)長(zhǎng)度(存儲(chǔ)更多的采樣)。替換模塊從數(shù)據(jù)緩沖器中最近接收的采樣開始順序地向后計(jì)數(shù)，計(jì)數(shù)量為等于估計(jì)基音周期的采樣數(shù)。替換模塊向后計(jì)數(shù)所到達(dá)的一個(gè)采樣被看作是所生成波形的第一個(gè)采樣。替換模塊111得到達(dá)到劣化數(shù)據(jù)包中的采樣數(shù)的順序采樣。所得到的所選采樣的集合被看作是生成的波形。例如，如果數(shù)據(jù)緩沖器具有200個(gè)采樣的長(zhǎng)度、估計(jì)基音周期被確定為具有50個(gè)采樣的長(zhǎng)度且劣化數(shù)據(jù)包具有30個(gè)采樣的長(zhǎng)度，則替換模塊111生成包含數(shù)據(jù)緩沖器的采樣151到180的波形。如果劣化數(shù)據(jù)包長(zhǎng)于估計(jì)基音周期，則選擇等于估計(jì)基音周期長(zhǎng)度的采樣的集合(在上面的實(shí)例中，可以為采樣151至200)。該采樣的集合被重復(fù)并被用作生成的波形來替換劣化數(shù)據(jù)包?？蛇x地，從數(shù)據(jù)緩沖器109中選擇等于劣化數(shù)據(jù)包長(zhǎng)度的采樣的集合。這通過在數(shù)據(jù)緩沖器中從最近接收的采樣開始向后順序計(jì)數(shù)(計(jì)數(shù)量為等于估計(jì)基音周期的倍數(shù)的采樣數(shù))來實(shí)現(xiàn)。選擇該倍數(shù)，使得向后計(jì)數(shù)的采樣數(shù)長(zhǎng)于或等于(不短于)劣化數(shù)據(jù)包的長(zhǎng)度。例如，倍數(shù)可以為1。典型地，倍數(shù)可以為估計(jì)基音周期的2或3倍。替換模塊向后計(jì)數(shù)所到達(dá)的一個(gè)采樣被看作所生成波形的第一個(gè)采樣。替換模塊111得到達(dá)到劣化數(shù)據(jù)包中的采樣數(shù)的順序采樣。所得到的所選采樣的集合被看作所生成的波形。例如，如果數(shù)據(jù)緩沖器具有200個(gè)采樣的長(zhǎng)度、估計(jì)基音周期被確定為具有50個(gè)采樣的長(zhǎng)度且劣化數(shù)據(jù)包具有60個(gè)采樣的長(zhǎng)度，則替換模塊111生成包含數(shù)據(jù)緩沖器的采樣101到160的波形。對(duì)采樣集合進(jìn)行太多次重復(fù)可能導(dǎo)致在輸出信號(hào)中存在顯而易見的雜音。例如，輸出信號(hào)可能聽起來是人造的或機(jī)器的。比較起來，使用等于信號(hào)的劣化部分的長(zhǎng)度的采樣集合引入了一些自然變化到輸出信號(hào)中。然而，如果劣化部分較長(zhǎng)，則使用等于信號(hào)的劣化部分長(zhǎng)度的采樣集合會(huì)在與剩余信號(hào)的邊界處導(dǎo)致更大的不連續(xù)性。這是因?yàn)?，僅當(dāng)在較短時(shí)間間隔上看時(shí)，聲音信號(hào)才可以認(rèn)為具有恒定的基音周期。在較長(zhǎng)時(shí)間間隔上，基音周期發(fā)生變化。因此，如果緩沖數(shù)據(jù)的長(zhǎng)片段被用于替換劣化部分，則會(huì)在與剩余信號(hào)的邊界處存在顯著的失配。重復(fù)采樣集合的第一方法和從數(shù)據(jù)緩沖器中選擇較長(zhǎng)采樣集合的第二方法之間的優(yōu)選選擇依賴于所討論的具體信號(hào)的形式。因此，可以使用混合方法，其動(dòng)態(tài)地選擇這兩種方法中的最佳方法。例如，可以選擇在與剩余信號(hào)的邊界處具有更低級(jí)聯(lián)損失的最佳方法。如果劣化部分非常長(zhǎng)，其可以認(rèn)為是較短劣化部分的序列，每一個(gè)較短的劣化部分如本文所描述的進(jìn)行評(píng)定?？蛇x地，替換模塊111可以使用利用估計(jì)基音周期的其他已知的基于基音的波形替換技術(shù)。替換模塊111向開關(guān)104輸出所生成的波形作為替換數(shù)據(jù)包。在劣化檢測(cè)器102的控制下，開關(guān)104被使能以向重疊相加模塊105輸出替換數(shù)據(jù)包。在步驟206中，重疊相加模塊105向級(jí)聯(lián)點(diǎn)處應(yīng)用重疊相加算法，以使替換數(shù)據(jù)包與其任一側(cè)上的數(shù)據(jù)包之間的邊界處的不連續(xù)性最小化。在步驟207中，替換數(shù)據(jù)包從重疊相加模塊105中輸出并存儲(chǔ)在數(shù)據(jù)緩沖器109 中。在步驟208中，從重疊相加模塊105輸出的替換數(shù)據(jù)包還在線106上從信號(hào)處理裝置 100輸出。在步驟204中，使用兩階段方法估計(jì)基音周期。在步驟205中，該方法可包括可選的第三階段，以使基音周期估計(jì)精確化?，F(xiàn)在，通過這三個(gè)階段的詳細(xì)實(shí)例的實(shí)施來描述該三個(gè)階段的概述。在第一階段中，基音周期檢測(cè)算法用于在潛在基音周期的窄范圍上進(jìn)行搜索。潛在基音周期是通常在人聲音信號(hào)中獲得的基音周期。選擇潛在基音周期的窄范圍，使其覆蓋通?？蓮娜苏Z音獲得的基音周期范圍的高端。典型地，人語音范圍的基音周期在 2. 5ms (對(duì)于具有高聲音的人)至16ms (對(duì)于具有低聲音的人)之間。這對(duì)應(yīng)于400Hz至 62.5Hz的基音頻率范圍。因此，針對(duì)第一階段選擇的潛在基音周期的窄范圍的適當(dāng)上界為 16ms。潛在基音周期的窄范圍的下界小于或等于上界的一半。這使得在該第一范圍上搜索的潛在基音周期的窄范圍中存在第二階段(參見下一段落)中確定的候選基音周期的至少一個(gè)倍數(shù)。適當(dāng)?shù)兀陆鐬樯辖绲囊话?。在該?shí)例中，適當(dāng)?shù)南陆缬纱藶?ms?；糁芷跈z測(cè)算法從搜索的潛在基音周期的窄范圍中選擇信號(hào)的基音周期的最可能的候選。該候選基音周期在下文被稱為第一候選基音周期。在第二階段中，使用在第一階段中識(shí)別的第一候選基音周期確定另一些候選基音周期。由于在第一階段中僅搜索潛在基音周期的總范圍(2. 5ms至16ms)的一部分(在以上實(shí)例中為8ms至16ms)，所以在第一階段中識(shí)別的候選基音周期可能為信號(hào)的“真”基音周期的倍數(shù)。第二階段從覆蓋期望用于人語音的基音周期范圍的低端的潛在基音周期范圍中確定另一些候選基音周期。針對(duì)第二階段選擇的潛在基音周期范圍的適當(dāng)下界由此為
2.5ms。適當(dāng)?shù)兀槍?duì)第二階段選擇的潛在基音周期的范圍排除針對(duì)第一階段選擇的窄范圍，但包括人語音的其他典型基音周期。因此，針對(duì)第二階段選擇的潛在基音周期范圍的適當(dāng)上界為針對(duì)第一階段選擇的窄范圍的下界。在給出的實(shí)例中，針對(duì)第二階段選擇的潛在基音周期范圍的適當(dāng)上界由此為8ms。在第二階段中確定的另一些候選基音周期為使得這些另一些候選基音周期的倍數(shù)給出了第一候選基音周期。使用基音周期檢測(cè)算法分析在第一階段中識(shí)別的第一候選基音周期以及在第二階段中識(shí)別的另一些候選基音周期中的一個(gè)或多個(gè)。由基音周期檢測(cè)算法識(shí)別的可能為信號(hào)的基音周期的最小候選基音周期被選擇作為信號(hào)的基音周期的估計(jì)。在步驟205中，基音周期估計(jì)方法可以包括可選的第三階段。第三階段使基音周期估計(jì)精確化，以減小在使用基音周期估計(jì)而選擇的替換數(shù)據(jù)包與替換數(shù)據(jù)包任一側(cè)上的信號(hào)的數(shù)據(jù)包之間的級(jí)聯(lián)邊界處的失真。選擇包含第二階段中所估計(jì)的基音周期的潛在基音周期的窄范圍。使用距離度量執(zhí)行潛在基音周期的該窄范圍上的精細(xì)搜索，以確定精確的基音周期估計(jì)。該距離度量使緊接在劣化部分之前(或之后)接收的信號(hào)的第一小部分與以特定時(shí)間間隔與第一小部分分離的信號(hào)部分相匹配。選擇這些時(shí)間間隔作為潛在基音周期的窄范圍(包含第二階段中的基音周期估計(jì))中的候選基音周期。與最佳匹配部分 (即，使距離度量最小的部分)相關(guān)聯(lián)的候選基音周期被選擇作為信號(hào)的基音周期的精確估計(jì)?，F(xiàn)在，將參照?qǐng)D3的流程圖描述實(shí)施這三個(gè)階段的示例性方法。第一階段在圖3的步驟301中，從潛在基音周期的第一范圍識(shí)別第一候選基音周期?；糁芷跈z測(cè)算法被用于在該范圍內(nèi)進(jìn)行搜索。存在許多本領(lǐng)域通用的可用于該方法的第一階段的已知基音周期檢測(cè)算法。這些算法使用的度量實(shí)例為歸一化交叉相關(guān)(NCC)、平方差的和(SSD)和平均幅值差分函數(shù)(AMDF)。利用這些度量的算法提供了類似的基音周期檢測(cè)性能。一種算法相對(duì)于另一種的選擇可以依賴于算法的效率，這又可以依賴于所使用的硬件平臺(tái)。為了示出本文所描述的方法，可以使用歸一化正交相關(guān)(NCC)度量。這種方法可以以數(shù)學(xué)方式表示為
權(quán)利要求
1.一種估計(jì)信號(hào)的基音周期的方法，包括通過僅在潛在基音周期的第一范圍上執(zhí)行搜索來識(shí)別第一候選基音周期；通過將所述第一候選基音周期除以一整數(shù)來確定第二候選基音周期，所述第二候選基音周期在所述潛在基音周期的第一范圍之外；以及選擇候選基音周期中的較小者作為信號(hào)的基音周期的估計(jì)，所述候選基音周期中的較小者使得以此候選基音周期分離的所述信號(hào)的部分被良好相關(guān)。
2.根據(jù)權(quán)利要求I所述的方法，其中，所述潛在基音周期的第一范圍的上界為最大潛在基音周期。
3.根據(jù)權(quán)利要求I所述的方法，其中，所述潛在基音周期的第一范圍的下界為最大潛在基音周期的一半。
4.根據(jù)權(quán)利要求I所述的方法，其中，所述整數(shù)為使得所述第二候選基音周期大于最小潛在基音周期的整數(shù)。
5.根據(jù)權(quán)利要求I所述的方法，包括使用基音周期檢測(cè)算法來識(shí)別第一候選基音周期。
6.根據(jù)權(quán)利要求5所述的方法，其中，所述基音周期檢測(cè)算法為歸一化互相關(guān)算法。
7.根據(jù)權(quán)利要求I所述的方法，其中，所述信號(hào)被采樣，所述第一候選基音周期為第一數(shù)量的采樣，并且所述第二候選基音周期為第二數(shù)量的采樣，其中，通過以下處理確定所述第二數(shù)量的采樣將所述第一數(shù)量的采樣除以一整數(shù)；以及選擇與除法結(jié)果最接近的整數(shù)作為所述第二數(shù)量的采樣。
8.根據(jù)權(quán)利要求I所述的方法，還包括使得以所述第一候選基音周期分離的所述信號(hào)的部分相關(guān)，以形成第一相關(guān)值，并且使得以所述第二候選基音周期分離的所述信號(hào)的部分相關(guān)，以形成第二相關(guān)值。
9.根據(jù)權(quán)利要求8所述的方法，包括如果所述第二相關(guān)值大于所述第一相關(guān)值的預(yù)定比例，則選擇所述第二候選基音周期作為所述信號(hào)的基音周期的估計(jì)。
10.根據(jù)權(quán)利要求8所述的方法，包括如果所述第二相關(guān)值小于所述第一相關(guān)值的預(yù)定比例，則選擇所述第一候選基音周期作為所述信號(hào)的基音周期的估計(jì)。
11.根據(jù)權(quán)利要求8所述的方法，包括選擇與相關(guān)值中的較大者相關(guān)的候選基音周期作為所述信號(hào)的基音周期的估計(jì)。
12.根據(jù)權(quán)利要求I所述的方法，還包括在識(shí)別所述第一候選基音周期之前抽選所述信號(hào)。
13.—種生成替換部分以替換信號(hào)的劣化部分的方法，包括以估計(jì)基音周期的倍數(shù)，選擇所述劣化部分之前或之后的信號(hào)的采樣；以及根據(jù)所選擇的采樣和所選擇的采樣后面的采樣來形成所述替換部分，其中，根據(jù)權(quán)利要求I所述的方法確定所述估計(jì)基音周期。
14.根據(jù)權(quán)利要求13所述的方法，其中，所述倍數(shù)為I或者大于I的整數(shù)。
15.根據(jù)權(quán)利要求13所述的方法，還包括在用所述替換部分替換所述劣化部分時(shí)，對(duì)所述替換部分和與所述替換部分相鄰的信號(hào)部分之間的邊界應(yīng)用重疊相加算法。
16.根據(jù)權(quán)利要求I所述的方法，還包括通過以下處理使得所述信號(hào)的基音周期的估計(jì)精確化對(duì)于包括估計(jì)基音周期和接近所述估計(jì)基音周期的另一些候選基音周期的候選基音周期集合中的每一個(gè)候選基音周期，確定以該候選基音周期分離的所述信號(hào)的部分之間的幾何距離；以及選擇所述候選基音周期集合中的具有最小相關(guān)幾何距離的候選基音周期作為所述信號(hào)的基音周期的精確估計(jì)。
17.—種生成替換部分以替換信號(hào)的劣化部分的方法，包括以精確化的估計(jì)基音周期的倍數(shù)，選擇所述劣化部分之前或之后的信號(hào)的采樣；以及根據(jù)所選擇的采樣和所選擇的采樣之后的采樣來形成所述替換部分，其中，根據(jù)權(quán)利要求16所述的方法來確定所述精確化的估計(jì)基音周期。
18.根據(jù)權(quán)利要求17所述的方法，包括對(duì)于所述候選基音周期集合中的每一個(gè)候選基音周期，確定所述信號(hào)的第一部分和所述信號(hào)的第二部分之間的幾何距離，其中，所述第一部分接近所述劣化部分并在所述劣化部分之前或之后，并且所述第二部分以該候選基音周期而與所述第一部分分離。
19.根據(jù)權(quán)利要求17所述的方法，包括對(duì)于所述候選基音周期集合中的每一個(gè)候選基音周期，通過以下處理確定幾何距離確定所述信號(hào)的第一部分和所述信號(hào)的第二部分之間的第一幾何距離，其中，所述第一部分接近所述劣化部分并在所述劣化部分之前，并且所述第二部分以該候選基音周期而與所述第一部分分離；確定所述信號(hào)的第三部分和所述信號(hào)的第四部分之間的第二幾何距離，其中，所述第三部分接近所述劣化部分并在所述劣化部分之后，并且所述第四部分以該候選基音周期而與所述第三部分分離；以及選擇所述第一幾何距離和所述第二幾何距離的平均，作為所述幾何距離。
20.根據(jù)權(quán)利要求16所述的方法，包括使用基音周期檢測(cè)算法來識(shí)別第一候選基音周期，所述基音周期檢測(cè)算法比較所述信號(hào)的多個(gè)部分，每一個(gè)部分均由N個(gè)采樣組成；以及對(duì)于所述候選基音周期集合中的每一個(gè)候選基音周期，確定每一個(gè)都由L個(gè)采樣組成的信號(hào)部分之間的幾何距離，其中，L小于N。
21.根據(jù)權(quán)利要求17所述的方法，還包括在用所述替換部分替換所述劣化部分時(shí)，對(duì)所述替換部分和與所述替換部分相鄰的信號(hào)部分之間的邊界應(yīng)用重疊相加算法。
22.—種基音周期估計(jì)裝置，包括候選基音周期識(shí)別模塊，被配置為通過僅在潛在基音周期的第一范圍上執(zhí)行搜索來識(shí)別所述信號(hào)的第一候選基音周期；處理模塊，被配置為通過將所述第一候選基音周期除以一整數(shù)來確定所述信號(hào)的第二候選基音周期，所述第二候選基音周期在所述潛在基音周期的第一范圍之外；以及選擇模塊，被配置為選擇候選基音周期中的較小者作為所述信號(hào)的基音周期的估計(jì)，所述候選基音周期中的較小者使得以該候選基音周期分離的所述信號(hào)的部分被良好相關(guān)。
全文摘要
一種用于估計(jì)信號(hào)的基音周期的方法和裝置。該方法包括通過僅在潛在基音周期的第一范圍上執(zhí)行搜索來識(shí)別第一候選基音周期。該方法還包括通過將第一候選基音周期除以整數(shù)來確定第二候選基音周期，其中，第二候選基音周期在潛在基音周期的第一范圍之外。該方法還包括選擇候選基音周期中的較小者作為信號(hào)的基音周期的估計(jì)，該候選基音周期中的較小者使得以此候選基音周期分離的信號(hào)部分被良好相關(guān)。
文檔編號(hào)G10L19/00GK102598119SQ201080021855
公開日2012年7月18日申請(qǐng)日期2010年4月7日優(yōu)先權(quán)日2009年4月21日
發(fā)明者薩默爾·加德爾申請(qǐng)人:劍橋硅無線電有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：薩默爾·加德爾
技術(shù)所有人：劍橋硅無線電有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

倒譜法估計(jì)基音周期相關(guān)技術(shù)

基音周期估計(jì)相關(guān)技術(shù)

基于導(dǎo)頻的信道估計(jì)相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基音估計(jì)的制作方法