專利名稱:用于語(yǔ)音幀誤差降低的語(yǔ)音通信單元和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音編碼,以及用來在語(yǔ)音通信單元中提高語(yǔ)音編解碼器性能的方法。本發(fā)明可用于但不僅限于語(yǔ)音編解碼器中的誤差降低。
背景技術(shù):
現(xiàn)有的許多語(yǔ)音通信系統(tǒng)都使用語(yǔ)音處理單元對(duì)語(yǔ)音樣本進(jìn)行編碼和解碼,例如使用蜂窩電話標(biāo)準(zhǔn)的全球移動(dòng)通信系統(tǒng)(GSM)和私人移動(dòng)無線電用戶使用的陸地中繼無線系統(tǒng)(TETRA)。在此類的語(yǔ)音通信系統(tǒng)中,發(fā)送單元內(nèi)的編碼器將模擬語(yǔ)音樣本轉(zhuǎn)換為匹配的數(shù)字格式以供發(fā)送。接收單元內(nèi)的語(yǔ)音解碼器將接收到的數(shù)字語(yǔ)音信號(hào)轉(zhuǎn)換為人耳可聽到的模擬語(yǔ)音樣本。
由于這些無線語(yǔ)音通信系統(tǒng)中的頻譜是很昂貴的資源,為了使每個(gè)頻帶中的用戶數(shù)目盡可能多,大家都希望能夠限制這些語(yǔ)音信號(hào)使用的信道帶寬。因此,使用語(yǔ)音編碼技術(shù)的主要目標(biāo)就是在不損失逼真度的前提下,通過壓縮技術(shù)盡可能地降低語(yǔ)音樣本所占用的容量。
在語(yǔ)音和數(shù)據(jù)通信系統(tǒng)的情況下,另一種方法就是為語(yǔ)音信號(hào)提供比同類的數(shù)據(jù)信號(hào)更少的保護(hù)。這種方法會(huì)導(dǎo)致語(yǔ)音包比數(shù)據(jù)包產(chǎn)生較多的誤差,同時(shí)損失整個(gè)語(yǔ)音包的風(fēng)險(xiǎn)會(huì)增加。
在語(yǔ)音解碼器中,誤差降低技術(shù)通常用于提高語(yǔ)音通信單元的性能,例如如果發(fā)生以下情況(i)收到的語(yǔ)音幀中存在過多的比特誤差;或者(ii)基于網(wǎng)際協(xié)議(IP)的網(wǎng)絡(luò)中的數(shù)據(jù)包(其中可能包括語(yǔ)音信息)損失。
需要“壞幀”降低技術(shù)用來盡量減小收到的誤差幀,也就是包含誤差或損失的幀,對(duì)聽覺效果的影響。這些技術(shù)重現(xiàn)了丟失的語(yǔ)音幀的估計(jì),而不是向解碼后的語(yǔ)音插入靜音或噪音。這些技術(shù)通常要使用語(yǔ)音的統(tǒng)計(jì)靜態(tài)特性。存在誤差的單獨(dú)幀通常可以進(jìn)行充分地估計(jì),也就是使用來自前幀語(yǔ)音的能量、基音、頻譜和清濁音等類似的參數(shù)來替代它。然而,語(yǔ)音并不是真正穩(wěn)態(tài)的,例如語(yǔ)音的起始和爆破音是非常短暫的活動(dòng)。因此,這種簡(jiǎn)單的“替代”技術(shù)有時(shí)會(huì)導(dǎo)致不自然的、也是不希望有的人工噪音。
在理想環(huán)境中,我們希望可以從傳輸間斷的任意一端插入數(shù)據(jù),即從壞幀序列前后取走數(shù)據(jù),以及在其間插入。然而,由于會(huì)引入不需要的延遲,這種方法在語(yǔ)音通信系統(tǒng)中是無法接受的。
如果收到了幾個(gè)壞幀,那么通常在少數(shù)幾幀后語(yǔ)音信號(hào)的能量就會(huì)降低到零。通常應(yīng)包括“清濁音”參數(shù),因?yàn)樗梢愿鶕?jù)語(yǔ)音是清音還是濁音來改變重復(fù)的內(nèi)容。原則上,對(duì)于濁音語(yǔ)音,優(yōu)選方案就是重復(fù)周期性分量。相反地,對(duì)于清音語(yǔ)音,優(yōu)選方案是產(chǎn)生類似的聲譜和類似的能量,而不是周期性的。
本發(fā)明的發(fā)明人已經(jīng)發(fā)覺并認(rèn)識(shí)到使用“替代”幀機(jī)制作為壞幀降低策略的局限性。特別地,他們已經(jīng)意識(shí)到只有在極少數(shù)情況下,替代幀才會(huì)是真正合適的幀。此外,如果收到的大量幀存在誤差,這種情況可能頻繁出現(xiàn)在無線通信鏈路質(zhì)量較差的條件下,那么替代幀機(jī)制就會(huì)變得更加無法接受。
因此,當(dāng)使用這樣的語(yǔ)音編解碼器時(shí),為了至少減少上述的某些缺陷,需要提供一種改進(jìn)的誤差降低技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的第一部分中,根據(jù)權(quán)利要求1提供了一種語(yǔ)音通信單元。
本發(fā)明的第二部分中,根據(jù)權(quán)利要求13提供了一種語(yǔ)音通信單元。
本發(fā)明的第三部分中,根據(jù)權(quán)利要求15提供了一種在語(yǔ)音通信單元中降低壞幀誤差的方法。
本發(fā)明的第四部分中,根據(jù)權(quán)利要求16提供了一種語(yǔ)音通信單元。
本發(fā)明的第五部分中,根據(jù)權(quán)利要求17提供了一種無線通信系統(tǒng)。
本發(fā)明的其他部分在從屬權(quán)利要求中定義。
總而言之,本發(fā)明的目標(biāo)是提供一種通信單元,它包括語(yǔ)音編解碼器和降低壞幀誤差的方法,它至少可以減少上述的現(xiàn)有壞幀誤差降低技術(shù)存在的缺陷中的某幾種。如果傳輸路徑中接收到的語(yǔ)音幀存在誤差,那么通過在傳輸路徑上傳輸語(yǔ)音幀,以及使用在虛擬傳輸路徑中傳輸?shù)膮⒖?指針來給出語(yǔ)音解碼器使用的供選擇的替代語(yǔ)音幀的方法,就可以達(dá)到目標(biāo)。通過使用在理想情況下應(yīng)帶有不同誤差統(tǒng)計(jì)(例如分離FEC機(jī)制)的另外的虛擬傳輸路徑,參考/指針就不容易受到參考的語(yǔ)音幀的相同誤差的影響。此外,緩沖技術(shù)被用于編碼器中,從先前傳輸?shù)拇罅空Z(yǔ)音幀中選擇供選擇的語(yǔ)音幀,選中的供選擇的語(yǔ)音幀與要參考的語(yǔ)音幀表現(xiàn)出相似的特性。
現(xiàn)在通過參考附圖來描述示例的實(shí)施例,在圖中圖1示出了無線通信單元的框圖,它包括語(yǔ)音編碼器,適于支持本發(fā)明的優(yōu)選實(shí)施例的不同發(fā)明概念;圖2示出了碼本激勵(lì)線性預(yù)測(cè)語(yǔ)音編碼器的框圖,適于支持本發(fā)明的優(yōu)選實(shí)施例的不同發(fā)明概念;圖3示出了依照本發(fā)明的優(yōu)選實(shí)施例,由可供選擇的虛擬傳輸路徑給出的參考機(jī)制的使用,由此從大量的其他幀中選中替代幀;和圖4示出了依照本發(fā)明的優(yōu)選實(shí)施例,可供選擇的虛擬傳輸路徑的增強(qiáng)使用,它用來解決發(fā)生在主傳輸路徑中的多誤差。
具體實(shí)施例方式
現(xiàn)在參看圖1,示出了無線用戶單元的框圖,后文稱為移動(dòng)站(MS)100,適于支持本發(fā)明的優(yōu)選實(shí)施例的不同發(fā)明概念。MS 100包括天線102,優(yōu)選連接到在MS 100內(nèi)的接收器和發(fā)送器鏈之間提供隔離的雙工濾波器、天線轉(zhuǎn)換開關(guān)或循環(huán)器104。
如本領(lǐng)域所知,接收器鏈通常包括掃描接收器前端電路106(有效提供接收、濾波,以及中頻或基帶頻率轉(zhuǎn)換)。掃描前端電路與信號(hào)處理功能單元108串聯(lián)。信號(hào)處理功能單元的輸出提供給合適的輸出裝置110,例如經(jīng)由語(yǔ)音處理單元130的揚(yáng)聲器。
語(yǔ)音處理單元130包括語(yǔ)音編碼功能單元134,它將用戶語(yǔ)音編碼為適合傳輸媒介傳送的格式。語(yǔ)音處理單元130還包括語(yǔ)音編碼功能單元132,它將收到的語(yǔ)音解碼為適合經(jīng)由輸出裝置(揚(yáng)聲器)110輸出的格式。語(yǔ)音處理單元130經(jīng)由控制器114與存儲(chǔ)器單元116和計(jì)時(shí)器118相連接。特別地,語(yǔ)音處理單元130的操作適于支持本發(fā)明的優(yōu)選實(shí)施例的發(fā)明概念。特別地,語(yǔ)音處理單元130適于從大量先前傳輸?shù)恼Z(yǔ)音幀中選中替代語(yǔ)音幀。語(yǔ)音處理單元130或信號(hào)處理器108可以啟動(dòng)在可選擇的虛擬傳輸路徑到主傳輸路徑中的參考/指針信號(hào)(給出選中的替代語(yǔ)音幀)的傳輸。語(yǔ)音處理單元130的適用性將根據(jù)圖2進(jìn)一步說明。
出于完整性考慮,接收器鏈也包括接收信號(hào)強(qiáng)度指示器(RSSI)電路112(圖示中與掃描接收器前端106相連,盡管RSSI電路112可以位于接收器鏈中的其他任何位置)。RSSI電路與控制器114相連接,以維護(hù)全部的用戶單元控制??刂破?14也與掃描接收器前端電路106和信號(hào)處理功能單元108(通常通過DSP實(shí)現(xiàn))相連接。因此,控制器114可以從恢復(fù)信息中接收到誤比特率(BER)和誤幀率(FER)數(shù)據(jù)。控制器114與存儲(chǔ)器裝置116相連以儲(chǔ)存操作規(guī)則,例如解碼/編碼函數(shù)等等。計(jì)時(shí)器118通常與控制器114相連,以控制MS 100內(nèi)操作(時(shí)間相關(guān)信號(hào)的傳輸與接收)的定時(shí)。
在本發(fā)明的環(huán)境中,計(jì)時(shí)器118規(guī)定了發(fā)送(編碼)路徑和/或接收(解碼)路徑中的語(yǔ)音信號(hào)的定時(shí)。
關(guān)于發(fā)送鏈,它本質(zhì)上包括輸入裝置120,例如經(jīng)由語(yǔ)音編碼器134與發(fā)送器/調(diào)制電路122相串聯(lián)的麥克風(fēng)傳感器。此后,任何發(fā)送信號(hào)經(jīng)由功率放大器124從天線102發(fā)出。通過來自與雙工濾波器或循環(huán)器104相連的功率放大器的輸出,發(fā)送器/調(diào)制電路122和功率放大器124對(duì)控制器作出響應(yīng)。發(fā)送器/調(diào)制電路122和掃描接收器前端電路106中包括上變頻和下變頻功能單元(未示出)。
當(dāng)然,MS 100中的不同模塊可以按照任意合適的、能夠利用本發(fā)明的發(fā)明概念的功能拓?fù)溥M(jìn)行排列。此外,MS 100中的不同模塊可以實(shí)現(xiàn)為離散或集成的不同模塊形態(tài),因此其根本結(jié)構(gòu)只不過是任意的選擇。
本發(fā)明預(yù)期,語(yǔ)音信號(hào)優(yōu)選的緩沖或處理方法可以在軟件、固件或硬件中實(shí)現(xiàn),更適宜的方法是采用軟件處理器(或者數(shù)字信號(hào)處理器(DSP))來完成語(yǔ)音處理功能。
現(xiàn)在參看圖2,它依照本發(fā)明的優(yōu)選實(shí)施例示出了碼本激勵(lì)線性預(yù)測(cè)(CELP)語(yǔ)音編碼器134的框圖。待分析的聲音輸入信號(hào)施加于麥克風(fēng)202上的語(yǔ)音編碼器134。然后,輸入信號(hào)施加于濾波器204。濾波器204通常具有帶通濾波器的特性。然而,如果語(yǔ)音帶寬已經(jīng)足夠,那么濾波器204可能包含直接的線路連接。
如本領(lǐng)域所知,來自濾波器204的模擬語(yǔ)音信號(hào)接著被轉(zhuǎn)換為N脈沖抽樣序列,每個(gè)脈沖抽樣的幅度由模數(shù)(A/D)轉(zhuǎn)換器208中的數(shù)字代碼表示。抽樣率由抽樣時(shí)鐘(SC)決定。抽樣時(shí)鐘(SC)隨著幀時(shí)鐘(FC)一起產(chǎn)生。
用輸入語(yǔ)音向量s(n)表示的A/D 208的數(shù)字輸出,可以施加于系數(shù)分析器210。如本領(lǐng)域所知,輸入語(yǔ)音向量s(n)可以從分離的幀中重復(fù)獲得,也就是從由幀時(shí)鐘(FC)決定長(zhǎng)度的時(shí)間塊中獲得。
按照本發(fā)明的優(yōu)選實(shí)施例,對(duì)于每個(gè)語(yǔ)音塊,通過參數(shù)分析器210可以產(chǎn)生線性預(yù)測(cè)編碼(LPC)參數(shù)集。產(chǎn)生的語(yǔ)音編碼參數(shù)可能包括以下部分LPC參數(shù)、長(zhǎng)時(shí)預(yù)測(cè)(LTP)參數(shù)、激勵(lì)增益因子(G2)(連同最佳的隨機(jī)碼本激勵(lì)碼字I一起)。這些語(yǔ)音編碼參數(shù)應(yīng)用于復(fù)用器250,并通過信道發(fā)送給解碼器中的語(yǔ)音合成器使用。輸入語(yǔ)音向量s(n)還應(yīng)用于減法器230,其功能隨后說明。
圖2傳統(tǒng)的CELP編碼器中,為得到用來表示輸入語(yǔ)音樣本的求和選擇激勵(lì)向量中的最小加權(quán)誤差,碼本搜索控制器240從模塊216中的自適應(yīng)碼本與模塊214中的隨機(jī)碼本中選擇最佳索引和增益。隨機(jī)碼本214和自適應(yīng)碼本216的輸出分別輸入到增益功能單元222和218中。如本領(lǐng)域所知,增益調(diào)整后的輸出在加法器220中求和,然后輸入到LPC濾波器224中。
首先,計(jì)算自適應(yīng)碼本或長(zhǎng)時(shí)預(yù)測(cè)分量l(n)。其特征在于延遲和增益因子“G1”。
對(duì)于每個(gè)單獨(dú)的隨機(jī)碼本激勵(lì)矢量ui(n),比較輸入語(yǔ)音矢量s(n)產(chǎn)生重構(gòu)的語(yǔ)音矢量s’i(n)。增益模塊222縮放激勵(lì)增益因子“G2”,求和模塊220增加自適應(yīng)碼本分量。這樣的增益可以由系數(shù)分析器210預(yù)先計(jì)算并用于分析所有激勵(lì)矢量,或者可以與搜索最佳激勵(lì)碼字I進(jìn)行聯(lián)合優(yōu)化,最佳激勵(lì)碼字I是由碼本搜索控制器240產(chǎn)生的。
然后通過線性預(yù)測(cè)編碼濾波器224對(duì)縮放的激勵(lì)信號(hào)G1l(n)+G2ui(n)進(jìn)行濾波,濾波器224構(gòu)成了短時(shí)預(yù)測(cè)(STP)濾波器,用以產(chǎn)生重構(gòu)的語(yǔ)音矢量s’i(n)。用于第i個(gè)激勵(lì)碼矢量的重構(gòu)語(yǔ)音矢量s’i(n)與輸入語(yǔ)音矢量s(n)的相同塊進(jìn)行比較,這是通過在減法器230中對(duì)這兩個(gè)信號(hào)相減完成的。
差矢量ei(n)表示原始語(yǔ)音塊和重構(gòu)語(yǔ)音塊之間的差。差矢量通過加權(quán)濾波器232進(jìn)行感覺加權(quán),使用由系數(shù)分析器210產(chǎn)生的加權(quán)濾波器參數(shù)(WTP)。感覺加權(quán)加強(qiáng)了其中的誤差對(duì)人耳感覺上更重要的頻率,而減弱了其他的頻率。
碼本搜索控制器240內(nèi)的能量計(jì)算器功能單元計(jì)算加權(quán)差矢量e’i(n)的能量。碼本搜索控制器比較用于當(dāng)前激勵(lì)矢量ui(n)的第i個(gè)誤差信號(hào)與以前的誤差信號(hào),以確定產(chǎn)生最小誤差的激勵(lì)矢量。具有最小誤差的第i個(gè)激勵(lì)矢量的碼隨后在信道上輸出作為最佳激勵(lì)碼I。
縮放激勵(lì)G1l(n)+G2u1(n)的副本儲(chǔ)存在長(zhǎng)時(shí)預(yù)測(cè)存儲(chǔ)器216中備用。
另外,碼本搜索控制器240可以確定特定的碼字,該碼字提供具有某些預(yù)定標(biāo)準(zhǔn)的誤差信號(hào),諸如滿足預(yù)定的誤差門限。
典型語(yǔ)音編碼單元的更詳細(xì)的描述可從下面的文獻(xiàn)中找到A.M.Kondoz,“Digital speech coding for low-bit rate communications systems”,John Wiley,1994。
在本發(fā)明的優(yōu)選實(shí)施例中,誤差降低技術(shù)在復(fù)用器250之后應(yīng)用于語(yǔ)音幀。本發(fā)明利用了供選擇的(優(yōu)選為并行的)虛擬傳輸路徑282,其用于發(fā)送指向在主傳輸路徑281上從編碼器發(fā)送的以前編碼的語(yǔ)音幀的指針。
在本發(fā)明的環(huán)境中,術(shù)語(yǔ)“虛擬”定義為除了支持語(yǔ)音通信的主傳輸路徑之外的傳輸路徑,其假定為從編碼器到解碼器?!疤摂M”傳輸路徑可以位于相同的比特流內(nèi),或者在時(shí)分復(fù)用機(jī)制中的相同時(shí)間幀或者多幀內(nèi),或者經(jīng)由不同的通信路由,例如在VoIP系統(tǒng)中。通過利用附加的虛擬傳輸路徑,其理想地帶有不同的誤差統(tǒng)計(jì)(例如分離FEC機(jī)制),參考/指針將得到與其參考的語(yǔ)音幀相同的誤差。
與已知編碼配置的一個(gè)顯著不同是復(fù)用操作之后是第二最小化部分。這樣的電路估算緩沖內(nèi)的語(yǔ)音參數(shù)數(shù)據(jù)并選擇最接近當(dāng)前語(yǔ)音幀的一個(gè)。
在增強(qiáng)實(shí)施例中,并行虛擬傳輸路徑使用與語(yǔ)音編碼器在主傳輸路徑中使用的不同的前向誤差校正(FEC)保護(hù)。這樣,通過使用獨(dú)立的FEC路徑,語(yǔ)音數(shù)據(jù)包經(jīng)歷不同的誤差統(tǒng)計(jì)。主傳輸路徑和并行的虛擬傳輸路徑之間的差幫助改進(jìn)對(duì)誤差的魯棒性。
復(fù)用器250輸出數(shù)據(jù)包/幀到控制以前復(fù)用的幀的緩沖器260。解復(fù)用器270訪問緩沖器260中的復(fù)用信號(hào)的緩沖幀。此處,解復(fù)用器270將激勵(lì)參數(shù)274與LPC參數(shù)272分離。注意到,用于產(chǎn)生激勵(lì)參數(shù)的長(zhǎng)時(shí)預(yù)測(cè)器的存儲(chǔ)器必須與幀開始處的長(zhǎng)時(shí)預(yù)測(cè)器216相同。
對(duì)于每一復(fù)用語(yǔ)音塊,由此產(chǎn)生當(dāng)前幀和以前幀的線性預(yù)測(cè)編碼(LPC)參數(shù)集。在本發(fā)明的優(yōu)選實(shí)施例中,每個(gè)量化LPC參數(shù)和激勵(lì)參數(shù)的集合形成了用于緩沖數(shù)據(jù)的第j個(gè)前幀的重構(gòu)的語(yǔ)音矢量s’j(n)。其通過在減法器262中對(duì)這兩個(gè)信號(hào)相減來與前面緩沖的語(yǔ)音矢量s(n)進(jìn)行比較。
差矢量ej(n)表示原始和前面緩沖的語(yǔ)音塊之間的差。差矢量通過LPC加權(quán)濾波器264進(jìn)行感覺加權(quán)。如所指出的,感覺加權(quán)增強(qiáng)了那些對(duì)人耳感覺更重要的誤差的頻率,而衰減了其他的頻率。
碼本搜索控制器266內(nèi)的能量計(jì)算器功能單元計(jì)算加權(quán)差矢量e’j(n)的能量。碼本搜索控制器266比較用于當(dāng)前激勵(lì)矢量uj(n)的第j個(gè)誤差信號(hào)與前面的誤差信號(hào),以確定產(chǎn)生最小誤差的激勵(lì)矢量。碼本搜索控制器266隨后選擇“幀數(shù)據(jù)的最佳索引”,以提供最小加權(quán)誤差。編碼器隨后將指向前幀的“指針”傳送到解碼器,該前幀被確定為提供其自身與主傳輸路徑中的各個(gè)語(yǔ)音幀之間的最小加權(quán)誤差。
本質(zhì)上,參考的語(yǔ)音幀(理想地,在時(shí)間或幀數(shù)量上與當(dāng)前傳輸幀不同)構(gòu)成了特定移動(dòng)語(yǔ)音窗內(nèi)最類似于編碼器編碼的幀(在感覺加權(quán)誤差的意義上)的幀。因此,如果錯(cuò)誤接收了幀,它表示用于誤差降低步驟的當(dāng)前幀的最佳匹配(指針)。這個(gè)表示或指針將在下面結(jié)合圖3更詳細(xì)地進(jìn)行描述。
現(xiàn)在參看圖3,示出的緩沖定時(shí)圖300說明了本發(fā)明的優(yōu)選過程。定時(shí)圖說明幀-0 310已在語(yǔ)音解碼器被接收并被確定為錯(cuò)誤。解碼器然后接入供選擇的虛擬傳輸路徑以確定最適合的幀來替代幀-0 310。如圖3所示,供選擇的虛擬傳輸路徑包括到幀-4 320的指針,作為幀-0 310的優(yōu)選替代。通過用幀-4 320替代幀-0 310,在語(yǔ)音解碼過程中只對(duì)語(yǔ)音質(zhì)量產(chǎn)生了最小的影響。
本發(fā)明的發(fā)明人認(rèn)識(shí)到并且使用了這樣的事實(shí),即前面幾幀(通常)都是由相同講話者說的,即這些語(yǔ)音幀將表現(xiàn)相似的基音和共振峰位置。因此,很有可能找到與當(dāng)前語(yǔ)音幀相似的以前的語(yǔ)音幀。
根據(jù)本發(fā)明的優(yōu)選實(shí)施例,通過為每一緩沖幀評(píng)估加權(quán)分段信噪比(SEGSNR)或者平均加權(quán)SNR來找到最小感覺誤差,這里在存儲(chǔ)器內(nèi)給定用于每幀的參數(shù)集合。優(yōu)選地,在語(yǔ)音編解碼器子幀級(jí)別定義分段。
這個(gè)確定是在編碼器中完成的。在存在小基音錯(cuò)誤的情況下,預(yù)計(jì)可能得到相當(dāng)不同的SEGSNR值。這是因?yàn)椋凑Z(yǔ)音和緩沖信號(hào)可能快速移出相位。因此,在本發(fā)明的增強(qiáng)實(shí)施例中,建議在緩沖幀的基音周期附近搜索,例如+/-5%,使用子采樣(sub-sample)分解(通常是1/3或1/4采樣),選擇最大的SEGSNR值。
在本發(fā)明另一個(gè)增強(qiáng)中,如果錯(cuò)誤接收了該幀自身,則用于降低該幀壞接收的幀自身將是用于錯(cuò)誤接收的當(dāng)前幀的最佳的語(yǔ)音信息的源,如圖4所示。因此,圖4說明了指出怎樣處理多誤差的定時(shí)圖。來自幀-0 410的數(shù)據(jù)已知是錯(cuò)誤的。建議的降低誤差的過程使用了供選擇的虛擬傳輸路徑,其將數(shù)據(jù)幀-4 420指定為合適的替代。但是,數(shù)據(jù)幀-4 420也被確定為錯(cuò)誤的。在此情況下,指針將來自幀-6 430的數(shù)據(jù)指定為與惡化幀-4 420最相似的幀。因此,幀-6 430用于替代幀-4 420并且適用于替代幀-0 410。這樣,就可以處理多幀錯(cuò)誤,以克服存儲(chǔ)溢出(out-of-memory)參考的問題。
這可能導(dǎo)致參考(指針)最終有效地直通(lead out of)存儲(chǔ)窗。但是,如果窗內(nèi)的錯(cuò)誤值通過去除對(duì)多參考的需要而得到更新的話,這就不再是個(gè)問題。
總之,在供選擇的比特流到主比特流中,參考或指針傳輸?shù)浇獯a器。參考或指針指出了最佳地匹配了當(dāng)前傳輸幀的以前傳輸?shù)膸?。參考或指針?yōu)選在并行比特流中傳輸。如果在語(yǔ)音解碼器錯(cuò)誤接收了幀,就在幀替代誤差降低過程中使用參考或指針。因此,通過將已知的在先或后繼幀替代機(jī)制擴(kuò)展到多個(gè)幀中的任意幀來增強(qiáng)幀誤差的降低。在這點(diǎn)上,在過程中使用的幀的數(shù)量受到緩沖/存儲(chǔ)裝置和/或確定最小加權(quán)誤差幀所需的處理能力的限制。
如所指出的,語(yǔ)音編碼器的語(yǔ)音參數(shù)的緩沖/存儲(chǔ)處理是基于多個(gè)幀進(jìn)行的。例如,在GSM增強(qiáng)全速率(EFR)編解碼器(<12kb/秒)的情況中,三秒鐘語(yǔ)音的存儲(chǔ)量只有5K字節(jié)。因此,最難的任務(wù)是從150個(gè)可能的幀中識(shí)別最接近的幀匹配。因此,在本發(fā)明一個(gè)實(shí)施例中,前面提到的最小加權(quán)誤差選擇技術(shù)可用于參數(shù)子集或用于得自合成語(yǔ)音的參數(shù),而不是語(yǔ)音編碼器幀的所有參數(shù)。換句話說,可能參考(或指向)LPC濾波器參數(shù)(LSF)和合成語(yǔ)音幀的能量(得自在編碼器和解碼器中都計(jì)算的合成語(yǔ)音的語(yǔ)音參數(shù)),而不是精確編碼器參數(shù),從而節(jié)省了存儲(chǔ)和比較處理。
在這點(diǎn)上,由于語(yǔ)音幀包括許多參數(shù),建議的技術(shù)可在原理上應(yīng)用于任意數(shù)量的參數(shù)。在CELP編碼器中,這些參數(shù)的例子包括(i)線譜對(duì)(LSP),其表示LPC參數(shù);(ii)用于子幀-1的長(zhǎng)時(shí)預(yù)測(cè)(LTP)滯后;(iii)用于子幀-1的LTP增益;(iv)用于子幀-1的碼本索引;(v)用于子幀-1的碼本增益;(vi)用于子幀-2的長(zhǎng)時(shí)預(yù)測(cè)滯后;(vii)用于子幀-2的LTP增益;(viii)用于子幀-2的碼本索引;
(ix)用于子幀-2的碼本增益;(x)用于子幀-3的長(zhǎng)時(shí)預(yù)測(cè)滯后;(xi)用于子幀-3的LTP增益;(xii)用于子幀-3的碼本索引;(xiii)用于子幀-3的碼本增益;(xiv)用于子幀-4的長(zhǎng)時(shí)預(yù)測(cè)滯后;(xv)用于子幀-4的LTP增益;(xvi)用于子幀-4的碼本增益;或(xvii)用于子幀-4的碼本增益。
以下也在本發(fā)明的考慮范圍之內(nèi),可以參考來自前面幀的LSP集合發(fā)送指針,以匹配當(dāng)前幀的LSP,而不是整個(gè)參數(shù)集。另外,有可能使指針用于多個(gè)上述參數(shù)中的每一個(gè)。
在無線通信系統(tǒng)中,并行虛擬傳輸路徑優(yōu)選地包括在數(shù)據(jù)有效荷載的未受保護(hù)比特內(nèi)傳輸塊編碼參考字(此處7比特足以支持128幀緩沖,相當(dāng)于約2.5秒)。這可以通過15比特的BCH塊碼來編碼(具有75比特/秒的等效速率),提供多達(dá)2比特的誤差校正。
另外,可以預(yù)計(jì),供選擇的虛擬傳輸路徑可能提供誤差校正和誤差檢測(cè)功能的組合。誤差檢測(cè)將是有用的,因?yàn)閰⒖嫉牟涣冀邮湛蓪?dǎo)致壞的降低。如果不良地接收了參考字,該機(jī)制可以默認(rèn)到前幀接收。75比特/秒的信道速率將只把GSM全速率信道的粗比特率從22.8K比特/秒降低到22.725K比特/秒,這將導(dǎo)致靈敏度的無關(guān)緊要的損失。
在另外的實(shí)施例中,這如網(wǎng)際協(xié)議語(yǔ)音(VoIP)通信鏈路,供選擇的虛擬傳輸路徑可通過發(fā)送多包流來獲得。雖然在此情況下希望總的流量基本上不會(huì)增加,因?yàn)檫@可能會(huì)增加掉包率。
優(yōu)選機(jī)制是,只在發(fā)生轉(zhuǎn)變并且語(yǔ)音非穩(wěn)態(tài)的情況下,如上所述發(fā)送參考到前面的幀。當(dāng)語(yǔ)音穩(wěn)態(tài)時(shí),并且當(dāng)現(xiàn)有技術(shù)相對(duì)工作很好時(shí),不發(fā)送參考。這樣,分組網(wǎng)絡(luò)并不過度超載,但是獲得了大部分性能增益。語(yǔ)音信號(hào)變得靜態(tài)的程度可以被生成為一個(gè)變量,該變量可在丟包的情況下調(diào)整為改進(jìn)再現(xiàn)質(zhì)量。
解碼器功能基本上是編碼器功能的反面(不具有復(fù)用器后面的附加電路),因此在這里不再贅述。典型語(yǔ)音解碼單元的功能的描述可以在以下參考文獻(xiàn)中找到A.M.Kondoz,“Digital speech coding forlow-bit rate communications systems”,John Wiley,1994。在解碼器,解碼器遵循標(biāo)準(zhǔn)解碼過程,直到它確定壞幀。當(dāng)檢測(cè)到壞幀時(shí),解碼器評(píng)估供選擇的虛擬傳輸路徑以確定各個(gè)參考/指針?biāo)甘镜墓┻x擇的幀。解碼器隨后接收“相似”幀,如參考/指針傳輸中所指出的。以前指示的幀隨后用于替代接收的幀,以合成語(yǔ)音。
有利的是,在此描述的發(fā)明概念可通過從已構(gòu)造的FEC機(jī)制中竊取比特來對(duì)現(xiàn)有編解碼器進(jìn)行花樣翻新。
應(yīng)該理解,壞幀誤差降低機(jī)制如上所述,提供了至少下面的優(yōu)點(diǎn)(i)提供更準(zhǔn)確的替代幀機(jī)制,由此降低在恢復(fù)的語(yǔ)音幀中可聽得到的不想要的人工噪音的風(fēng)險(xiǎn)。
(ii)通過例如從已構(gòu)造的FEC機(jī)制中竊取比特,供選擇的虛擬傳輸路徑可對(duì)現(xiàn)有編解碼器進(jìn)行花樣翻新。
(iii)在只在發(fā)生轉(zhuǎn)變且語(yǔ)音非穩(wěn)態(tài)的情況下才發(fā)送到以前幀的參考時(shí),將使用現(xiàn)有壞幀誤差降低技術(shù),由此最少化本發(fā)明中所需的任何附加的數(shù)據(jù)。
(iv)通過交叉參考為特定幀接收的數(shù)據(jù)且在該機(jī)制中參考幀,可檢測(cè)到錯(cuò)誤接收的參數(shù)。
盡管優(yōu)選實(shí)施例討論了本發(fā)明對(duì)CELP編碼器的應(yīng)用,發(fā)明人可以預(yù)期,這里所述的發(fā)明概念可用于無線通信單元的其他語(yǔ)音處理單元,諸如通用移動(dòng)電信系統(tǒng)(UMTS)單元、全球移動(dòng)通信系統(tǒng)(GSM)、陸地中繼無線(TETRA)通信單元、信息和信令的數(shù)字交換標(biāo)準(zhǔn)(DIIS)或者網(wǎng)際協(xié)議語(yǔ)音(VoIP)。
裝置發(fā)明一種語(yǔ)音通信單元,包括能夠表示輸入語(yǔ)音信號(hào)的語(yǔ)音編碼器。該語(yǔ)音編碼器包括傳輸路徑,用于將多個(gè)語(yǔ)音幀傳輸?shù)秸Z(yǔ)音解碼器。該語(yǔ)音編碼器進(jìn)一步包括虛擬傳輸路徑,用于傳輸在傳輸路徑中傳輸?shù)亩鄠€(gè)語(yǔ)音幀的一個(gè)或多個(gè)參考。所述一個(gè)或多個(gè)參考涉及在傳輸路徑上傳輸?shù)亩鄠€(gè)語(yǔ)音幀內(nèi)的供選擇的語(yǔ)音幀,在壞幀時(shí)被用作替代幀。
一種語(yǔ)音通信單元,例如上述的具有語(yǔ)音編碼器的語(yǔ)音通信單元,包括語(yǔ)音解碼器,適于在傳輸路徑上接收多個(gè)語(yǔ)音幀以及在虛擬傳輸路徑上接收一個(gè)或多個(gè)供選擇的語(yǔ)音幀參考。所述一個(gè)或多個(gè)參考涉及在傳輸路徑上接收的多個(gè)語(yǔ)音幀內(nèi)的供選擇的語(yǔ)音幀,當(dāng)壞幀時(shí)用作替代幀。
方法發(fā)明一種在語(yǔ)音通信單元中降低壞幀誤差的方法,所述方法包括如下步驟通過語(yǔ)音通信單元中的語(yǔ)音編碼器來在傳輸路徑上將多個(gè)語(yǔ)音幀傳輸?shù)秸Z(yǔ)音解碼器。語(yǔ)音編碼器在虛擬傳輸路徑上傳輸在傳輸路徑中傳輸?shù)亩鄠€(gè)語(yǔ)音幀的一個(gè)或多個(gè)參考,其中所述一個(gè)或多個(gè)參考涉及在傳輸路徑上傳輸?shù)亩鄠€(gè)語(yǔ)音幀內(nèi)的供選擇的語(yǔ)音幀,當(dāng)壞幀時(shí)用作替代幀。
這樣,當(dāng)錯(cuò)誤接收語(yǔ)音幀時(shí),可以從多個(gè)語(yǔ)音幀選擇改進(jìn)替代幀。
因此,這里描述了壞幀誤差降低技術(shù)和相關(guān)語(yǔ)音通信單元及電路,基本上降低了已知誤差降低技術(shù)的上述缺點(diǎn)中的至少某些缺點(diǎn)。
權(quán)利要求
1.一種語(yǔ)音通信單元(100),包括能夠表示輸入語(yǔ)音信號(hào)的語(yǔ)音編碼器(134),該語(yǔ)音編碼器(134)包括傳輸路徑(281),用于將多個(gè)語(yǔ)音幀傳輸?shù)秸Z(yǔ)音解碼器,該語(yǔ)音編碼器(134)的特征在于虛擬傳輸路徑(282),用于傳輸在傳輸路徑(281)中傳輸?shù)亩鄠€(gè)語(yǔ)音幀的一個(gè)或多個(gè)參考,其中,所述一個(gè)或多個(gè)參考涉及在傳輸路徑(281)上傳輸?shù)亩鄠€(gè)語(yǔ)音幀內(nèi)的供選擇的語(yǔ)音幀,在誤差接收幀時(shí)被用作替代幀。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音通信單元(100),其中,語(yǔ)音編碼器(134)的進(jìn)一步的特征在于復(fù)用器(250),用于復(fù)用所述多個(gè)語(yǔ)音幀;緩沖器(260),有效連接到所述復(fù)用器(250),用以儲(chǔ)存復(fù)用的語(yǔ)音數(shù)據(jù);和處理器(130、270),有效連接到所述緩沖器(260),用于在所述緩沖器(260)中表征當(dāng)前語(yǔ)音幀,并選擇供選擇的語(yǔ)音幀,該供選擇的語(yǔ)音幀表現(xiàn)了與所述語(yǔ)音幀相似的特性,其中,用虛擬傳輸路徑(282)將到所述供選擇的語(yǔ)音幀的參考傳輸?shù)浇獯a器。
3.根據(jù)權(quán)利要求2所述的語(yǔ)音通信單元(100),其中,所述處理器包括解復(fù)用器功能(270),用于訪問緩沖器(260)中的一個(gè)或多個(gè)語(yǔ)音幀,處理器還從緩沖的語(yǔ)音幀的LPC參數(shù)(272)中分離激勵(lì)參數(shù)(274),用以選擇表現(xiàn)相似特性的語(yǔ)音幀。
4.根據(jù)任意前面權(quán)利要求所述的語(yǔ)音通信單元(100),其中,所述虛擬傳輸路徑(282)包含在傳輸路徑(281)的相同比特流內(nèi)。
5.根據(jù)任意前面權(quán)利要求所述的語(yǔ)音通信單元(100),其中,所述傳輸路徑(281)使用第一前向誤差校正保護(hù)機(jī)制,所述虛擬傳輸路徑(282)使用不同于在傳輸路徑(281)中使用的第二前向誤差校正保護(hù)。
6.根據(jù)前面權(quán)利要求2-5中任一項(xiàng)所述的語(yǔ)音通信單元(100),其中,所述處理器(130、266、270)選擇供選擇的替代幀,用以提供最小加權(quán)誤差。
7.根據(jù)權(quán)利要求6所述的語(yǔ)音通信單元(100),其中,所述處理器(130、266、270)通過為每一緩沖幀評(píng)估加權(quán)分段信噪比(SEGSNR)或平均加權(quán)SNR來確定最小加權(quán)誤差。
8.根據(jù)權(quán)利要求6或權(quán)利要求7所述的語(yǔ)音通信單元(100),其中,所述處理器(130、266、270)確定語(yǔ)音編碼參數(shù)子集的最小加權(quán)誤差。
9.根據(jù)權(quán)利要求6、權(quán)利要求7或權(quán)利要求8所述的語(yǔ)音通信單元(100),其中,所述處理器(130、266)基本上在所述緩沖語(yǔ)音幀的基音周期附近搜索,并選擇表現(xiàn)出最高SEGSNR值的幀。
10.根據(jù)任意前面權(quán)利要求所述的語(yǔ)音通信單元(100),其中,所述供選擇的語(yǔ)音幀(320)只在發(fā)生轉(zhuǎn)變以及語(yǔ)音非穩(wěn)態(tài)時(shí)用作所述當(dāng)前語(yǔ)音幀的參考。
11.根據(jù)任意前面權(quán)利要求所述的語(yǔ)音通信單元(100),其特征在于語(yǔ)音解碼器(132),適于在傳輸路徑(281)上接收多個(gè)語(yǔ)音幀以及在虛擬傳輸路徑(282)上接收一個(gè)或多個(gè)供選擇的語(yǔ)音幀(320)參考,其中,所述一個(gè)或多個(gè)參考涉及在傳輸路徑(281)上接收的多個(gè)語(yǔ)音幀內(nèi)的供選擇的語(yǔ)音幀(320),當(dāng)誤差接收幀時(shí)用作替代幀。
12.根據(jù)權(quán)利要求11所述的語(yǔ)音通信單元(100),其中,如果所述供選擇的語(yǔ)音幀(420)是誤差接收幀,則選擇幀(430)作為所述誤差接收的供選擇的幀(420)的供選擇的幀,用于替代當(dāng)前的誤差接收語(yǔ)音幀(410)和誤差接收的供選擇的語(yǔ)音幀(420)。
13.一種在語(yǔ)音通信單元(100)中降低壞幀誤差的方法,所述方法包括如下步驟通過語(yǔ)音通信單元(100)中的語(yǔ)音編碼器(134)來在傳輸路徑(281)上將多個(gè)語(yǔ)音幀傳輸?shù)秸Z(yǔ)音解碼器;所述方法的特征在于以下步驟在虛擬傳輸路徑(282)上傳輸在傳輸路徑(281)中傳輸?shù)亩鄠€(gè)語(yǔ)音幀的一個(gè)或多個(gè)參考,其中所述一個(gè)或多個(gè)參考涉及在傳輸路徑(281)上傳輸?shù)亩鄠€(gè)語(yǔ)音幀內(nèi)的供選擇的語(yǔ)音幀,當(dāng)誤差接收幀時(shí)用作替代幀。
14.一種適于實(shí)現(xiàn)根據(jù)權(quán)利要求13所述的方法步驟的語(yǔ)音通信單元(100)。
15.一種無線通信系統(tǒng),適于支持使用根據(jù)任意前面權(quán)利要求所述的傳輸路徑(281)和虛擬傳輸路徑(282)。
全文摘要
一種語(yǔ)音通信單元(100),包括語(yǔ)音編碼器(134),能夠表示輸入語(yǔ)音信號(hào),語(yǔ)音編碼器(134)包括傳輸路徑(281),用于將多個(gè)語(yǔ)音幀傳輸?shù)秸Z(yǔ)音解碼器,語(yǔ)音編碼器(134)的特征在于虛擬傳輸路徑(282),用于傳輸在傳輸路徑(281)中傳輸?shù)亩鄠€(gè)語(yǔ)音幀的一個(gè)或多個(gè)參考,其中,一個(gè)或多個(gè)參考涉及在傳輸路徑(281)上傳輸?shù)亩鄠€(gè)語(yǔ)音幀內(nèi)的供選擇的語(yǔ)音幀,供選擇的語(yǔ)音幀在錯(cuò)誤接收幀時(shí)用作替代幀。該語(yǔ)音通信單元至少提供這樣的優(yōu)點(diǎn)提供更準(zhǔn)確的替代幀機(jī)制,由此降低在恢復(fù)的語(yǔ)音幀中可以聽得到的不想要的人工噪音的風(fēng)險(xiǎn)。
文檔編號(hào)G10L19/005GK1672193SQ03818272
公開日2005年9月21日 申請(qǐng)日期2003年5月12日 優(yōu)先權(quán)日2002年7月31日
發(fā)明者喬納森·阿拉斯泰爾·吉布斯, 史蒂芬·阿夫泰拉克 申請(qǐng)人:摩托羅拉公司