两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于音頻信號的時標和/或間距修改的信號處理技術(shù)的制作方法

文檔序號:2821983閱讀:399來源:國知局
專利名稱:用于音頻信號的時標和/或間距修改的信號處理技術(shù)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)字信號的編碼和處理。尤其是,本發(fā)明涉及音頻信號的時標和/或間距(pitch)修改,但這不是排他的。同樣,這里所述的信號分析和再合成方法不限于音頻信號??稍O(shè)想,本發(fā)明可找到以這里所述的(類似于子波)方法對其它信號進行編碼的應(yīng)用。這樣的應(yīng)用的一個例子包括圖象壓縮。實質(zhì)上,本發(fā)明可應(yīng)用于希望以不同的時間/空間分辨率同時分析頻域不同區(qū)域的場合。
背景技術(shù)
在本領(lǐng)域內(nèi)有許多公知的用于音頻信號的時標/間距調(diào)制的現(xiàn)有技術(shù)。這些技術(shù)可大致如下分類。
(a)時域方法這些技術(shù)試圖通過檢測音頻信號中的周期性活動來估計音樂信號的基本周期。通過此過程,輸入信號被延遲且乘以未延遲的信號,然后在低通濾波器中對其積進行平滑,以提供自相關(guān)函數(shù)的近似測量。然后,使用自相關(guān)函數(shù)來檢測可能隱藏在噪聲中的一非周期性信號或一周期性差的信號。一旦找到音樂信號的基本周期,則重復此過程,并重疊信號經(jīng)分析的部分。這些技術(shù)一個明顯缺點是,大多數(shù)音頻信號沒有基本周期。例如,多音樂器、混響錄音和打擊聲都沒有可識別的基本周期。此外,在應(yīng)用這些方法時,音樂中的瞬變被重復。這導致音符具有多個開始和結(jié)尾。該技術(shù)的另一個問題在于音樂的延遲部分的重疊可能產(chǎn)生金屬、機械或表現(xiàn)出類似于回聲性質(zhì)的音頻效果。
(b)正弦曲線分析方法這些技術(shù)假定輸入信號由純粹的正弦曲線構(gòu)成。因此,這種方法的固有缺點是不言而喻的。
正弦曲線分析技術(shù)使用短時快速傅里葉變換(FFT)來估計組成正弦曲線的頻率。然后,以一組音頻發(fā)生器(tone generator)來合成得到的信號,以產(chǎn)生想要的輸出。短時傅里葉分析通過選中的窗函數(shù)來俘獲有關(guān)信號在一時間間隔內(nèi)的頻率內(nèi)容的信息。這種技術(shù)的一個明顯缺點是,把單個時域窗應(yīng)用于該信號的所有頻率內(nèi)容,因此,信號分析不能準確地對應(yīng)于人對信號內(nèi)容的感覺。此外,常規(guī)的正弦曲線分析方法使用幅度譜的局部最大值搜索來確定組成正弦曲線的頻率,包括考慮分析幀之間的相對相位變化。這一技術(shù)忽略了位于每一局部最大值附近的任何邊帶信息。其后果是把發(fā)生在單個分析幀內(nèi)的任何信號調(diào)制排除在外,導致聲音模糊不清(smearing)且?guī)缀跬耆珌G失瞬變。在音頻的情況下,這樣的瞬變的一個例子是吉它的彈撥。
(c)相位聲碼器(vocoder)方法這種類型的技術(shù)把快速傅里葉變換用作一大組濾波器,并分開地處理每個濾波器的輸出。使用輸入的兩個連續(xù)分析之間的相對相位變化來估計每一箱(bin)內(nèi)信號內(nèi)容的頻率。從此信息來合成獲得的頻域信號,把每個箱看作一個分開的信號。與正弦曲線分析技術(shù)不同,本方法保留了原始信號的頻譜能量分布。然而,它破壞了任何瞬變信息的相對相位。因此,獲得的聲音模糊不清且類似于回聲。
因此,針對現(xiàn)有技術(shù),希望如此分析和處理音頻信號,從而獲得的輸出保留原始信號的音調(diào)特性,并能準確地俘獲瞬變聲音,而不使輸出信號變得模糊不清或引入類似于回聲的性質(zhì)。
相應(yīng)地,本發(fā)明的一個目的是提供一種用于處理音頻信號的技術(shù),該技術(shù)實現(xiàn)了如上所述的目標,改善了已有技術(shù)中所固有的至少一些缺點,或至少給公眾提供了一個有用的選擇。此外,本發(fā)明的另一個目的是提供一種信號分析和合成方法,這一方法通常還可應(yīng)用于信號的編碼。

發(fā)明內(nèi)容
在本發(fā)明的一個方面,提供了一種用于對波形編碼和再合成的方法,該方法包括對此波形進行采樣以獲得一系列分立的樣本,并由它們構(gòu)成一系列幀,每個幀跨越多個樣本;把每個幀乘以一開窗(最好是升余弦)函數(shù),其中開窗函數(shù)的峰值基本上以每個幀的零點為中心;把快速傅里葉變換應(yīng)用于每個幀,從而產(chǎn)生一頻域波形;把獲得的頻域數(shù)據(jù)與可變核函數(shù)(其特性隨頻率而變化)進行卷積;對每個經(jīng)卷積的幀的幅度譜中的局部最大值和周圍的最小值進行定位,其中每個局部最大值及相關(guān)的最小值限定多個區(qū)域,每個區(qū)域?qū)?yīng)于該信號的一個頻率分量;以及通過把落在限定區(qū)域內(nèi)的復數(shù)頻率分量的各箱求和成一信號矢量來分開地分析頻域表象中的每個區(qū)域;其中可有用地改變可變核函數(shù),以在信號的頻率范圍內(nèi)實現(xiàn)頻率與時間分辨率之間的不同折衷。
在一較佳實施例中,此波形相應(yīng)于一數(shù)字化音頻頻率波形,其中可改變核函數(shù)以接近人耳的感覺特性。
在波形相應(yīng)于一音頻信號的情況下,最大值的位置相應(yīng)于可感覺到的頻率分量的間距。
該方法還可包括處理該信號同時把它表示為信號矢量的步驟。
此處理可采取修改間距或時標(音頻信號中)或進一步簡化(reduce)數(shù)據(jù)的形式,以適用于有效的信號存儲和/或發(fā)送。
在修改音頻信號的情況下,可根據(jù)需要移動被分析的信號矢量的頻率位置和相位,以實現(xiàn)時間和/或間距的定標。
可通過把一等效信號(其分量相應(yīng)于在分析原始信號中所確定的那些信號矢量)累積到頻域中來實現(xiàn)轉(zhuǎn)換回信號的經(jīng)采樣的時域表象。
最好,可應(yīng)用逆快速傅里葉變換,從而可給出可被適當開窗和累積來產(chǎn)生經(jīng)解碼的信號的時域信號。
最好,通過主觀地評價合成輸出的質(zhì)量,以經(jīng)驗來確定卷積函數(shù)的形式。
最好,把核函數(shù)對頻域數(shù)據(jù)的應(yīng)用實現(xiàn)為對所述數(shù)據(jù)的單極點(pole)低通濾波器操作,極點的位置隨頻率而變化。
最好,在分析音頻信號的情況下,可通過以下形式的控制函數(shù)s(f)來指定極點s(f)=0.4+0.26arctan(41n(0.1f)-18)這里,f是以赫茲為單位的頻率(周期/秒)。
可通過以下關(guān)系來指定頻域濾波器your(f)=[1-s(f)]yin(f)+s(f)yout(f-1)最好,為了處理音頻信號,分開地處理每個信號矢量;為了間距移動,把該分量的頻率乘以實部值(real value)間距因子;為了間距移動和時標修改,計算和應(yīng)用無低頻干擾(glitch)重建必要的相移。
最好,本方法包括以下進一步的步驟使頻域輸出陣列為零,對于每個被分析的頻率,把分量表示為被分析的信號矢量,把實部值頻率映射到兩個最近的整數(shù)值頻率箱;以及使被分析的信號矢量正比于1減去實部值頻率及各箱的位置在兩個箱之間分布。
在另一個方面,可按頻率來平移(translate)獲得的區(qū)域,從而對最大值的位置進行定標,同時平移周圍的區(qū)域。
對于具有最大值以及第一和第二相關(guān)最小值的每個區(qū)域,為了音頻信號的間距移動,以間距移動因子對幀中的每個最大值的位置進行定標,把第一和第二最小值之間的有關(guān)諧波信息平移到被定標的最大值周圍的各個位置。
為了對信號進行時間拉伸(stretch)或壓縮,使每個最大值保持頻域中的同一位置,同時拉伸或壓縮與最大值相關(guān)的頻域帶或諧波信息,從而拉伸諧波的幅度和頻率調(diào)制,同時保持輸入信號的間距。
此方法還可包括以下進一步的步驟對每一幀中的數(shù)據(jù)重新采樣成為多個箱;把每個箱映射到輸出幀中的一個實部值位置,在該位置處,對于最大值在頻率freqmax處的頻帶內(nèi)的箱x而言,輸出頻域中的實部值位置為y,其中y=feeqmax×shift+(x-freqmax)(scale)]]>這里,shift等于頻移,scale等于時間擴展比。
最好,y下舍入到小于或等于y的最接近的整數(shù)z,其中把輸出箱z和z+1相加,以正比于1減去y與這些箱的整數(shù)位置之差。
在另一個方面,本發(fā)明提供了適用于上述方法的軟件。
在又一個方面,本發(fā)明提供了適用于上述方法的硬件。
附圖概述現(xiàn)在將僅通過示例并參考附圖來描述本發(fā)明,其中

圖1示出本發(fā)明方法的一個實施例的簡化示意方框圖(分散于第28到30頁);圖2示出本發(fā)明另一個方法的一個實施例的簡化示意方框圖(分散于第31到33頁);圖3示出搜索最大值/最小值的過程的示意圖;圖5a和5b示出相對于兩個最大值的間距和時間拉伸。
本發(fā)明的較佳實施方式參考圖1,簡化的流程圖示出信號處理方法的一個實施例中的所有步驟。為了清楚,此示意圖分散于第15到17頁。
把一輸入的音頻信號數(shù)字化成為幀10。然后如下處理每個這樣的幀以(例如)寬的余弦函數(shù)30對每個幀10開窗(20),從而產(chǎn)生輸入信號幀10的經(jīng)時域調(diào)制的表象。然后,把快速傅里葉變換50應(yīng)用于該幀,從而產(chǎn)生輸入信號60的頻域表象60。
然后,以s(f)來確定參數(shù)的濾波函數(shù)71對頻域數(shù)據(jù)60進行濾波。也可把濾波函數(shù)看作本例中的一個低通單極點濾波器。函數(shù)s(f)70指定了濾波器的行為如何隨頻率而變化??赏ㄟ^以下的遞歸關(guān)系來描述濾波函數(shù)71yout(f)=[1-s(f)]yin(f)+s(f)yout(f-1)因而,s(f)控制濾波器71的‘劇烈程度(severity)’。因此,實際上,把不同的卷積核用于每個頻率箱。分開地卷積每個箱的實部和虛部。在本示例實施例中,濾波或卷積函數(shù)71具有使頻域信息“模糊(blur)”的效果,因此可把卷積函數(shù)叫做模糊函數(shù)。頻域數(shù)據(jù)的模糊或擴展相應(yīng)于時域幀中等效窗口的變窄。因此,有效地計算了快速傅里葉變換的每個頻率箱,就象在FFT操作前已應(yīng)用不同尺寸的時域窗口一樣。
濾波器的效果不一定是對數(shù)據(jù)進行模糊。例如,把時域樣本平移窗口尺寸的一半使得必須對頻域數(shù)據(jù)進行高通濾波,以在時域中實現(xiàn)等效的開窗。
按升序把頻域濾波器71應(yīng)用于每個箱子,然后按頻率箱的降序應(yīng)用。這保證了在頻域數(shù)據(jù)中不引入相移。
本發(fā)明的一個關(guān)鍵方面在于,在處理音頻頻率數(shù)據(jù)的情況下選擇控制函數(shù)s(f),從而接近位于人耳內(nèi)的耳底膜上的人體纖毛的刺激響應(yīng)。實際上,如此選擇函數(shù)s(f),從而接近人耳的時間/頻率響應(yīng)。
在本較佳實施例中,通過估量輸出或合成波形在變化環(huán)境下的質(zhì)量,以經(jīng)驗來確定控制函數(shù)s(f)的形式。雖然,這是一種主觀的過程,但已發(fā)現(xiàn)對合成聲音的質(zhì)量進行重復變化的評估產(chǎn)生了非常令人滿意的卷積函數(shù)。
控制函數(shù)s(f)的一個較佳形式是s(f)=0.4+0.26arctan(41n(0.1f)-18)這里,f是以赫茲為單位的頻率(周期/秒)。
實際上,上述步驟類似于通過一大組濾波器來處理信號的有效方法,其中每個濾波器的帶寬可獨立地由控制函數(shù)s(f)來控制。
一旦應(yīng)用濾波器71,則分析(90)經(jīng)卷積的頻域數(shù)據(jù)80,以確定局部最大值和相關(guān)局部最小值的位置。
為了執(zhí)行此步驟,已發(fā)現(xiàn),使用強度譜更有效。因此,對于每個頻率,如果I(f)>I(f-1)且I(f)>I(f+1),則該數(shù)據(jù)為局部最大值。如果I(f)<I(f-1)且I(f)<I(f+1),則存在局部最小值。這里,Mag(f)=real(f)2+im(f)2]]>,強度(f)=real(f)2+im(f)2。
參考圖2,使用每個最大值和相關(guān)的局部最小值來限定相應(yīng)于原始音頻頻率信號中可聽見的諧波的區(qū)域(由圖3中的陰影箭頭所示)。頻域中最大值的位置相應(yīng)于感覺到的諧波的間距,最大值周圍的頻域信息帶代表該諧波的任何相關(guān)幅度或頻率調(diào)制。由于重要的是不能丟失該信息,所以使用此峰值周圍整個頻帶的總和來給出信號矢量。這樣,分析樣本的時間分辨率將與所發(fā)生的任何調(diào)制的帶寬匹配。
依據(jù)以下技術(shù)分開地處理每個區(qū)域。確定每個最大值的位置的準確估計。參考圖3中下面的圖,大的箭頭a(300)為三個強度箭頭(max-1)中的最小強度與最大強度(max)之差。小的箭頭b(310)為最小(max-1)與中間強度(max+1)之差。使用這兩者之比來偏移整數(shù)最大值。
在圖1中由標號130示意地示出間距移動和時標修改。在該點處,通過數(shù)據(jù)簡化(133)或發(fā)送/存儲(134)步驟示出其它應(yīng)用。在圖1中示出這些可供選擇的選項。
依據(jù)以下方法再合成經(jīng)處理的數(shù)據(jù)對于第ⅰ個經(jīng)分析的頻率分量,矢量(ⅱ)在頻域輸出中有一實部值位置y。
把y下舍入到小于或等于y的最接近的整數(shù),并由z來表示。因而,z=Int(y)。
然后,正比于1減去y與此箱整數(shù)位置之差,把輸出箱z和z+1與矢量(ⅰ)相加。
Bin[z]=Bin[z]+[1-(y-z)]矢量(ⅰ)Bin[z+1]=Bin[z+1]+(y-z)矢量(ⅰ)這里對復數(shù)實行所有的操作。
為了修改被分析信號的時標或間距,必須補償任何相移,從而使合成的輸出一致(即,無低頻干擾)。為此,把任一幀中的輸出信號及時向前移動固定的樣本數(shù)。因此,對于給定的間距測量,可確定輸出相位應(yīng)變化多少,從而使輸出平滑地與先前合成的幀相接。
然而,輸入時間幀正移動一些其它的樣本數(shù)。因此,在分析窗口通過輸入數(shù)據(jù)時,被分析的相位值已改變。
因此,計算輸入相位的變化率與輸出相位的所需變化率之差。這些相位之差是多快地旋轉(zhuǎn)分析與合成之間的頻域數(shù)據(jù)的相位的量度。以上所限定的每個信號矢量都具有一頻率測量值。使用該測量值來計算多快地旋轉(zhuǎn)幅度為1的矢量,其中該矢量為復數(shù)表象。把該矢量乘以此信號矢量,以為合成提供必要的相移,而不影響每個區(qū)域的衰減(decay)特性或其它調(diào)制的定時。
由下式給出此相移(以弧度為單位) 這里,tr=樣本中的重建時間步長,ta=樣本中的分析時間步長,t2=樣本中的FFT尺寸。
由于頻率的測量值提供了一合成幀與下一合成幀之間相位差的量度,所以在合成進行時必須對這些差值累加。
把累積的和僅應(yīng)用于一個區(qū)域,因此,必須從一合成幀到下一合成幀對區(qū)域進行跟蹤。
已開發(fā)了方便的數(shù)據(jù)結(jié)構(gòu)從一個合成幀到下一合成幀對區(qū)域進行跟蹤,參照圖4a和4b對此數(shù)據(jù)結(jié)構(gòu)進行描述。一整數(shù)陣列包含在一區(qū)域內(nèi)對應(yīng)于該區(qū)域中所有箱的局部最大值的位置。一相應(yīng)的陣列包含用來旋轉(zhuǎn)該區(qū)域相位的最后一個相位值(以弧度為單位)。以與最大值的位置相同的索引在箱中存儲此相位值。
因此,在分析一個新的幀并檢測局部最大值時,使用最大值的位置來編索引至該整數(shù)陣列中。這樣提供了前一個幀中所存在的最大值的索引。然后,使用該索引來訪問該陣列,該陣列包含用于前一個合成幀中相應(yīng)區(qū)域的最后一個相位值。這在圖3a和b中示出,為此把分析幀n與最接近的最大值陣列和相位陣列一起示出??紤]第n+1個分析幀,第一頻率最大值為7。從前一個幀開始,最接近的最大值陣列的相應(yīng)第七個元為5。從前一個幀n開始,相位陣列幀的第五個元為12度。使用局部最大值的估計對此進行更新,然后用位置7存儲在下一幀的相位陣列中。對于第二個區(qū)域410,從前一個分析幀n開始,最接近的最大值陣列的第十三個元給出16。從前一個分析幀n的相位陣列,給出相位為57度。使用頻率估計來更新此相位值,并把它置于下一相位陣列的位置13中。
從已知的信號分量來構(gòu)成信號的頻域表象。對于每個信號矢量,把該矢量加到頻域輸出陣列。由于頻率位置是實部值,所以來自信號矢量的能量分布于最接近的兩個(整數(shù)值)箱的位置之間。然后,對頻域表象進行逆傅里葉變換(第16頁,圖1中的150),以提供合成信號的時域表象。由于在不同的頻率處以不同的時間分辨率來分析信號,所以合成的時域信號僅在等效于所使用的最高時間分辨率的區(qū)域中才有效。為此,在以重疊的方式加到(172)最后的合成信號(180)前,以(相對)小的正余弦窗(170)對合成時域信號開窗(160)。
處理信息以實現(xiàn)間距移動和時間拉伸的一個變化(但等效)方法如下。
另一種方法基本上類似于第一種方法,它們共享開窗(420)、傅里葉變換(450)、濾波(460)、最小值和最大值檢測(490)這些步驟。這兩種方法之間的主要區(qū)別在于以下這點。第一種方法將每個區(qū)域的內(nèi)容加成,而另一種方法明確地保留每個區(qū)域的內(nèi)容(510)。然后,分別依據(jù)間距移動和時間拉伸因子平移每個區(qū)域的內(nèi)容并進行定標(530)。對于間距移動操作,如此平移一區(qū)域的內(nèi)容,從而按頻率對最大值定標。對于時間拉伸操作,以時間拉伸因子對一區(qū)域的內(nèi)容定標,從而最大值的頻率不改變。
基本上如以上參考圖4a和4b所述來實行相移補償。為了合成輸出,從傅里葉變換步驟未改變的輸出拷貝待合成的頻域數(shù)據(jù),每次一個區(qū)域。以與第一方法相同的方式,把每個區(qū)域的內(nèi)容累積到輸出頻域緩沖器中。
在實現(xiàn)這兩種技術(shù)時有許多變化,這些變化對本領(lǐng)域內(nèi)的技術(shù)人員來說是清楚的。然而,本發(fā)明的關(guān)鍵特征在于使用控制函數(shù)s(f)以不同頻率改變頻域濾波器。這樣對隨頻率改變的等效時域數(shù)據(jù)產(chǎn)生了開窗的效果。在處理音頻頻率信號的情況下,選擇此控制函數(shù),以反映人體纖毛對音頻頻率范圍的響應(yīng)。雖然以經(jīng)驗來確定此曲線的形狀,但可證明其它曲線適用于其它處理技術(shù)和應(yīng)用。
本發(fā)明的進一步特征在于識別和定位最大值和相關(guān)的最小值。目前所揭示的技術(shù)在計算上是高效的,且允許對音頻信號進行快速的高質(zhì)量時間拉伸和間距移動。
實驗表明,本技術(shù)所產(chǎn)生的聲音的音調(diào)質(zhì)量明顯增強,相信這主要是通過保留局部頻率最大值的邊帶中的諧波信息而實現(xiàn)的。
就本發(fā)明的實際實現(xiàn)而言,可設(shè)想以軟件或硬件來實現(xiàn)該技術(shù)。在后者的情況下,硬件可形成諸如音頻放音機等音頻部件的一部分。本發(fā)明的潛在應(yīng)用包括聲音記錄行業(yè),在該行業(yè)中普遍需要音頻信號處理/合成,以滿足非常高的再現(xiàn)質(zhì)量標準。其它應(yīng)用包括在娛樂行業(yè)中的那些應(yīng)用,可預期,本技術(shù)可能在想要改變間距和時間的聲音再現(xiàn)/發(fā)送系統(tǒng)中有應(yīng)用。還可預期,這些應(yīng)用可能在普通的信號處理、數(shù)據(jù)簡化和/或數(shù)據(jù)發(fā)送和存儲中。在后一種情況下,可改變對特定卷積函數(shù)的選擇。
在以上描述中已參考具有公知等價物的元或整數(shù),包括這些等價物,就象它們被獨立提出一樣。
雖然通過舉例并參考特定實施例描述了本發(fā)明,但可理解,可進行修改和/或改進,而不背離所附權(quán)利要求書的范圍。
權(quán)利要求
1.一種對波形編碼和再合成的方法,該方法包括以下步驟對波形采樣以獲得一系列分立的樣本,從這些樣本構(gòu)成一系列幀,每個幀跨越多個樣本;把每個幀乘以一開窗函數(shù),其中此開窗函數(shù)的峰值基本上以每個幀的零點為中心;把快速傅里葉變換應(yīng)用于每個幀,從而產(chǎn)生一頻域波形;把獲得的頻域數(shù)據(jù)與可變核函數(shù)進行卷積,可變核函數(shù)的特性隨頻率而改變;在每個經(jīng)卷積的幀的幅度譜中定位局部最大值和周圍的最小值,其中每個局部最大值和相關(guān)的最小值限定多個區(qū)域,每個區(qū)域?qū)?yīng)于信號的一個頻率分量;以及通過將落在限定區(qū)域內(nèi)的復數(shù)頻率分量或箱求和成一信號矢量來分開地分析頻域表象中的每個區(qū)域,其中可有用地改變可變核函數(shù),以實現(xiàn)信號頻率范圍內(nèi)頻率與時間分辨率之間的不同折衷。
2.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于開窗函數(shù)為升余弦函數(shù)。
3.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于此波形相應(yīng)于一數(shù)字化頻率波形,其中改變核函數(shù),以接近人耳的感覺特性。
4.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于此波形相應(yīng)于一音頻信號,最大值的位置相應(yīng)于感覺到的頻率分量的間距。
5.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于還包括處理該信號同時把它表示為信號矢量的步驟。
6.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于所述處理采用適用于有效信號存儲和/或發(fā)送的修改間距或時標(音頻信號中)或進一步數(shù)據(jù)簡化的形式。
7.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于在修改音頻信號的情況下,依據(jù)預定量移動被分析的信號矢量的頻率位置和相位,以實現(xiàn)時間和/或間距的定標。
8.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于通過把一等效信號累積到頻域中來實現(xiàn)轉(zhuǎn)換回到信號的經(jīng)采樣時域表象,其中該等效信號的分量相應(yīng)于在分析原始信號中所確定的那些信號矢量。
9.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于應(yīng)用逆快速傅里葉變換,從而給出可被適當開窗和累積來產(chǎn)生經(jīng)解碼的信號的時域信號。
10.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于通過主觀地評價合成輸出的質(zhì)量,以經(jīng)驗來確定卷積函數(shù)的形式。
11.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于把核函數(shù)對頻域數(shù)據(jù)的應(yīng)用實現(xiàn)為對所述數(shù)據(jù)的單極點低通濾波器操作,極點的位置隨頻率而變化。
12.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于在分析音頻信號的情況下,通過以下形式的控制函數(shù)s(f)來指定極點s(f)=0.4+0.26arctan(41n(0.1f)-18)這里,f是以赫茲為單位的頻率(周期/秒)。
13.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于可通過以下關(guān)系來指定頻域濾波器yout(f)=[1-s(f)]yin(f)+s(f)yout(f-1)
14.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于為了處理音頻信號,分開地處理每個信號矢量;為了間距移動,把該分量的頻率乘以實部值間距因子;為了間距移動和時標修改,計算和應(yīng)用無低頻干擾重建必要的相移。
15.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于本方法包括以下進一步的步驟使頻域輸出陣列為零,對于每個被分析的頻率,把分量表示為被分析的信號矢量;把實部值頻率映射到兩個最近的整數(shù)值頻率箱;以及使被分析的信號矢量正比于1減去實部值頻率及各箱的位置在兩個箱之間分布。
16.如權(quán)利要求1所述的對波形編碼和再合成的方法,其特征在于把頻域中獲得的區(qū)域繞每個最大值平移到不同的頻率,最大值和獲得的信號的位置是最大值的頻率的倍數(shù),從而對最大值的位置進行定標,同時平移周圍的區(qū)域。
17.如權(quán)利要求16所述的對波形編碼和再合成的方法,其特征在于對于具有最大值以及第一和第二相關(guān)最小值的每個區(qū)域,為了音頻信號的間距移動,對幀中的每個最大值的位置定標,把第一和第二最小值與最大值之間的有關(guān)諧波信息平移到最大值周圍的各個位置。
18.如權(quán)利要求16或17所述的對波形編碼和再合成的方法,其特征在于為了對信號進行時間拉伸,使每個最大值保持頻域中的同一位置,同時壓縮與最大值相關(guān)的頻域帶或諧波信息,從而拉伸諧波的幅度和頻率調(diào)制,同時保持輸入信號的間距。
19.如權(quán)利要求所述的對波形編碼和再合成的方法,其特征在于還包括以下進一步的步驟對每一幀中的數(shù)據(jù)重新采樣成為多個箱;把每個箱映射到輸出幀中的一個實部值位置,在該位置處,對于最大值在頻率freqmax處的頻帶內(nèi)的箱x而言,輸出頻域中的實部值位置為y,其中y=freqmax×shift+(x-freqmax)(scale)]]>這里,shift等于頻移,scale等于時間擴展比。
20.如權(quán)利要求19所述的對波形編碼和再合成的方法,其特征在于y下舍入到小于或等于y的最接近的整數(shù)z,其中把輸出箱z和z+1相加,以正比于1減去y與這些箱的整數(shù)位置之差。
21.一種依據(jù)如權(quán)利要求1到20所述的方法進行操作的軟件。
22.一種構(gòu)成執(zhí)行依據(jù)如權(quán)利要求1到20所述的方法的裝置。
全文摘要
揭示了一種用于音頻信號的時標和/或間距修改的信號處理方法。該方法涉及對波形編碼和再合成,從而把波形采樣成為一系列幀,把每個幀乘以一開窗函數(shù),其中開窗函數(shù)的峰值近似于以每個幀的零點為中心。然后,使獲得的函數(shù)經(jīng)歷快速傅里葉變換,從而產(chǎn)生一頻域波形。把獲得的波形與一可變核函數(shù)卷積,此可變核函數(shù)的特性隨頻率而變化。定位每個經(jīng)卷積的幀的幅度譜中的最大值和相關(guān)的最小值,從而每個局部最大值和相關(guān)的最小值限定多個區(qū)域。每個區(qū)域相應(yīng)于該信號的頻率分量。通過對落在限定區(qū)域中的復數(shù)頻率分量或箱加成一信號矢量來分開地分析頻域表象中的每個區(qū)域。可有用地改變可變核函數(shù),以實現(xiàn)信號頻率范圍內(nèi)頻率與時間分辨率之間的不同折衷。
文檔編號G10L19/02GK1315033SQ99810151
公開日2001年9月26日 申請日期1999年8月27日 優(yōu)先權(quán)日1998年8月28日
發(fā)明者S·M·J·赫克 申請人:西格瑪音聲研究有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
金门县| 福贡县| 石首市| 社会| 民权县| 安福县| 吉木乃县| 靖江市| 奉贤区| 正定县| 汤原县| 布尔津县| 松滋市| 永城市| 景谷| 连江县| 大新县| 图片| 新蔡县| 保定市| 永寿县| 海兴县| 齐齐哈尔市| 镇雄县| 黔东| 张家川| 津南区| 遂溪县| 西和县| 浙江省| 昔阳县| 滨海县| 社会| 嘉鱼县| 大石桥市| 邵武市| 柯坪县| 柳州市| 南投市| 松阳县| 阜康市|