專利名稱:基于噪聲整形的語音編解碼方法、編解碼裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音編解碼技術(shù)領(lǐng)域,尤其涉及一種基于噪聲整形的語音編解碼方法、編解碼裝置。
背景技術(shù):
用戶對高質(zhì)量語音服務(wù)需求的不斷提升,相應(yīng)地促進(jìn)了寬帶語音編解碼技術(shù)的發(fā)展。目前,大多數(shù)寬帶語音編解碼技術(shù)采用與窄帶語音編解碼技術(shù)相兼容的做法,在窄帶語音編碼碼流的基礎(chǔ)上增加寬帶語音編碼碼流,相應(yīng)地,在解碼端,通過解碼窄帶語音編碼碼流與寬帶語音編碼碼流,得到較清晰的語音。
由于傳統(tǒng)的窄帶語音編解碼過程通常會產(chǎn)生可感知的噪聲,為滿足高質(zhì)量語音服務(wù)需求,會對窄帶語音編碼作相應(yīng)的消除噪聲處理,如在不增加比特開銷的情況下,進(jìn)行噪聲整形;或,增加比特開銷,對原始窄帶語音信號和本地解碼窄帶語音信號的殘差信號進(jìn)行量化,且不使用噪聲整形;或,在增加比特開銷,對原始窄帶語音信號和本地解碼窄帶語音信號的差信號進(jìn)行量化的同時,進(jìn)行噪聲整形。
基于噪聲整形能夠在不增加比特開銷的情況下,達(dá)到一定的消除噪聲的效果,因此,現(xiàn)有技術(shù)中常采用噪聲整形來對窄帶語音編碼作消除噪聲的處理。噪聲整形去噪的基本原理包括根據(jù)窄帶語音編解碼器的編解碼特性,對窄帶語音編解碼過程中所產(chǎn)生的噪聲進(jìn)行如低通或高通等的濾波處理,并將濾波結(jié)果反饋到編碼輸入端,從而對原始語音信號進(jìn)行修正。
參見圖1,圖1是現(xiàn)有技術(shù)一中基于噪聲整形的窄帶編碼結(jié)構(gòu)示意圖。圖1所示的現(xiàn)有技術(shù)一的編碼方案的編碼過程簡要說明如下 原始語音信號與噪聲整形濾波器產(chǎn)生的反饋信號相加后所產(chǎn)生的語音信號被輸入核心(Core)編碼器;其中,初始狀態(tài)下,噪聲整形濾波器產(chǎn)生的反饋信號為零; 核心編碼器輸出的碼流被從編碼端輸出;核心編碼器輸出的碼流還被輸入核心解碼器,由核心解碼器重建語音信號; 將核心解碼器得到的解碼語音信號與原始語音信號相減,得到殘差信號; 殘差信號被輸入殘差增強(qiáng)編碼器;殘差增強(qiáng)編碼器對殘差信號進(jìn)行編碼后,將與殘差信號對應(yīng)的增強(qiáng)碼流從編碼端輸出; 殘差信號還被輸入噪聲整形濾波器;噪聲整形濾波器對殘差信號進(jìn)行濾波處理后,得到反饋信號,該反饋信號被用作對下一個輸入的原始語音信號進(jìn)行去噪處理。
現(xiàn)有技術(shù)一的編碼方案一定程度上可提高最終解碼得到的語音信號的語音質(zhì)量,但由于該編碼方案較簡單,采用殘差信號的編碼產(chǎn)生的增強(qiáng)碼流,對核心碼流作了補(bǔ)充,因此,語音質(zhì)量的提升不明顯,相應(yīng)地,編碼效率不高。
參見圖2,圖2是現(xiàn)有技術(shù)二中窄帶語音編碼結(jié)構(gòu)示意圖。與圖1所對應(yīng)的現(xiàn)有技術(shù)一相比,現(xiàn)有技術(shù)二中,采用對原始語音信號進(jìn)行線性預(yù)測分析,得到用于噪聲整形的濾波器的系數(shù)。經(jīng)過線性預(yù)測(LP)分析得到的噪聲整形濾波器能夠較好地抑制編解碼過程中產(chǎn)生的噪聲,從而可減少核心編碼器編碼過程中所產(chǎn)生的可感知的噪聲。但由于該方案需要對原始語音信號做線性預(yù)測分析,因此實(shí)現(xiàn)時所要進(jìn)行的運(yùn)算復(fù)雜度較高,并且,基于線性預(yù)測分析得出的噪聲整形濾波器,雖然具有較高的編碼效率,但在解碼端,難以對每一幀語音信號所對應(yīng)的碼流進(jìn)行獨(dú)立解碼,其幀間相關(guān)性較強(qiáng),因此,導(dǎo)致解碼結(jié)果不具有很好的健壯性(Robust),即解碼對丟包或語音部分混合(Partial Mixing)時語音信號不連續(xù)等情況較敏感,影響解碼得到的語音信號的語音質(zhì)量。
可見,現(xiàn)有基于噪聲整形的語音編解碼方案尚存在可改進(jìn)之處。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種基于噪聲整形的語音編碼方法,提高編碼效率,減少幀間相關(guān)性。
一種基于噪聲整形的語音編碼方法,包括 對核心編碼語音信號進(jìn)行編碼,得到核心碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號; 對所述核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到第一增強(qiáng)碼流; 對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流; 將所述第一增強(qiáng)碼流、所述第二增強(qiáng)碼流和所述核心碼流,作為編碼結(jié)果輸出。
本發(fā)明實(shí)施例提供一種編碼裝置,包括核心編碼語音信號生成單元、核心編碼單元、語音信號重建單元、殘差信號生成單元、殘差信號編碼單元、狀態(tài)信息編碼單元、噪聲整形濾波器和輸出單元;其中, 噪聲整形濾波器,用于產(chǎn)生對原始語音信號進(jìn)行噪聲修正的噪聲修正信號; 核心編碼語音信號生成單元,用于將噪聲整形濾波器產(chǎn)生的所述噪聲修正信號與原始語音信號進(jìn)行疊加處理,得到核心編碼語音信號; 核心編碼單元,用于對核心編碼語音信號進(jìn)行編碼,得到核心碼流;所述核心編碼語音信號是由所述噪聲修正信號對原始語音信號修正后得到的語音信號; 語音信號重建單元,用于在本地重建語音信號; 殘差信號生成單元,用于生成所述核心編碼語音信號與語音信號重建單元得出的所述本地重建語音信號之間的殘差信號; 殘差信號編碼單元,用于對所述殘差信號進(jìn)行編碼,得到第一增強(qiáng)碼流; 狀態(tài)信息編碼單元,用于對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流; 輸出單元,用于將所述核心編碼單元得到的所述核心碼流、所述殘差信號編碼單元得到的所述第一增強(qiáng)碼流,和所述狀態(tài)信息編碼單元得到的所述第二增強(qiáng)碼流,作為編碼結(jié)果輸出。
本發(fā)明實(shí)施例提供一種基于噪聲整形的語音解碼方法,包括 接收編碼端發(fā)送過來的編碼結(jié)果,所述編碼結(jié)果包括所述編碼端對核心編碼語音信號進(jìn)行編碼,得到的核心碼流;對所述核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到的第一增強(qiáng)碼流;對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到的第二增強(qiáng)碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號; 對應(yīng)于編碼端對所述核心編碼語音信號的編碼,解碼所述核心碼流,得到與所述核心編碼語音信號相對應(yīng)的解碼核心編碼語音信號; 對應(yīng)于編碼端對所述殘差信號的編碼,解碼所述第一增強(qiáng)碼流,得到與所述殘差信號相對應(yīng)的解碼殘差信號; 對應(yīng)于編碼端對所述狀態(tài)信息的編碼,解碼所述第二增強(qiáng)碼流,得到與所述狀態(tài)信息相對應(yīng)的解碼狀態(tài)信息;且根據(jù)所述解碼狀態(tài)信息,得出與所述噪聲修正信號相對應(yīng)的解碼噪聲修正信號; 將所述解碼核心編碼語音信號、所述解碼殘差信號和所述解碼噪聲修正信號相加,得到解碼語音信號。
本發(fā)明實(shí)施例還提供一種解碼裝置,包括接收單元、核心碼流解碼單元、第一增強(qiáng)碼流解碼單元、第二增強(qiáng)碼流解碼單元和合成單元;其中, 接收單元,用于接收編碼裝置發(fā)送過來的編碼結(jié)果,所述編碼結(jié)果包括所述編碼端對核心編碼語音信號進(jìn)行編碼,得到的核心碼流;對所述核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到的第一增強(qiáng)碼流;對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到的第二增強(qiáng)碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號; 核心碼流解碼單元,用于對應(yīng)于編碼端對所述核心編碼語音信號的編碼,解碼所述核心碼流,得到與所述核心編碼語音信號相對應(yīng)的解碼核心編碼語音信號; 第一增強(qiáng)碼流解碼單元,用于對應(yīng)于編碼端對所述殘差信號的編碼,解碼所述第一增強(qiáng)碼流,得到與所述殘差信號相對應(yīng)的解碼殘差信號; 第二增強(qiáng)碼流解碼單元,用于對應(yīng)于編碼端對所述狀態(tài)信息的編碼,解碼所述第二增強(qiáng)碼流,得到與所述狀態(tài)信息相對應(yīng)的解碼狀態(tài)信息;且根據(jù)所述解碼狀態(tài)信息,得出與所述噪聲修正信號相對應(yīng)的解碼噪聲修正信號; 合成單元,用于將所述核心碼流解碼單元得到的所述解碼核心編碼語音信號、所述第一增強(qiáng)碼流解碼單元得到的所述解碼殘差信號,和所述第二增強(qiáng)碼流解碼單元得到的所述解碼噪聲修正信號進(jìn)行合成,得到解碼語音信號。
本發(fā)明實(shí)施例提供的上述技術(shù)方案,從產(chǎn)生原始語音信號與本地重建語音信號之差的根源出發(fā),由于該根源不僅來自于對核心編碼語音信號的核心編碼所產(chǎn)生的噪聲,還來自于噪聲整形濾波器對核心編碼的噪聲整形所產(chǎn)生的噪聲,即噪聲整形濾波器的當(dāng)前狀態(tài)信息,因此,本發(fā)明實(shí)施例在編碼端不僅對殘差信號進(jìn)行編碼,還對噪聲整形濾波器的當(dāng)前狀態(tài)信息進(jìn)行編碼,從而在編碼端就能夠盡量減少編碼過程所產(chǎn)生的噪聲,因此,能夠有效提高編碼效率,進(jìn)而,在解碼端能夠解碼出語音質(zhì)量較高的解碼語音信號。并且,本發(fā)明實(shí)施例在編碼端就將噪聲整形濾波器的噪聲整形帶來的噪聲考慮進(jìn)來,即在編碼端對狀態(tài)信息進(jìn)行編碼。相應(yīng)地,解碼端在解碼時通過解碼第二增強(qiáng)碼流,得出相應(yīng)的噪聲修正信號,利用噪聲修正信號去除噪聲整形效應(yīng),而不需要利用幀間預(yù)測信息進(jìn)行解碼,可有效降低解碼端解碼的幀間相關(guān)性,提高對丟包、Partialmixing等事件的健壯性或不敏感性。
圖1是現(xiàn)有技術(shù)一中基于噪聲整形的窄帶編碼結(jié)構(gòu)示意圖; 圖2是現(xiàn)有技術(shù)二中窄帶語音編碼結(jié)構(gòu)示意圖; 圖3是本發(fā)明實(shí)施例中語音編碼框架示意圖; 圖4是本發(fā)明實(shí)施例中基于噪聲整形的語音編碼方法流程圖; 圖5是本發(fā)明實(shí)施例中編碼裝置的結(jié)構(gòu)示意圖; 圖6是本發(fā)明實(shí)施例一中語音編碼流程圖; 圖7是本發(fā)明實(shí)施例二中語音編碼流程圖; 圖8是本發(fā)明實(shí)施例中另一中語音編碼框架示意圖; 圖9是本發(fā)明實(shí)施例中基于噪聲整形的語音解碼方法的流程圖; 圖10是本發(fā)明實(shí)施例中基于噪聲整形的語音解碼框架示意圖; 圖11是本發(fā)明實(shí)施例中解碼裝置的結(jié)構(gòu)示意圖; 圖12是本發(fā)明實(shí)施例中語音解碼流程圖; 圖13是利用本發(fā)明實(shí)施例的語音編解碼技術(shù)方案與現(xiàn)有技術(shù)的語音編解碼方案對語音信號進(jìn)行編碼的得到語音信號頻譜對比示意圖。
具體實(shí)施例方式 下面將結(jié)合附圖對本發(fā)明實(shí)施例提供的技術(shù)方案作詳細(xì)說明。
參見圖3,圖3是本發(fā)明實(shí)施例中語音編碼框架示意圖。其中,當(dāng)前一幀原始語音信號經(jīng)過噪聲整形濾波器反饋的反饋信號修正后,被輸入核心編碼器進(jìn)行編碼。本發(fā)明實(shí)施例中,可稱核心編碼器的編碼對象為核心編碼語音信號,可稱該反饋信號為噪聲修正信號。核心編碼器對核心編碼語音信號編碼后,得到核心碼流,該核心碼流被從編碼端輸出。核心碼流還被輸入核心解碼器;由核心解碼器對核心碼流解碼,得到本地重建語音信號。算出本地重建語音信號與核心編碼語音信號之間的殘差信號。進(jìn)一步利用殘差編碼器對殘差信號進(jìn)行編碼,得到本發(fā)明實(shí)施例中的第一增強(qiáng)碼流。
實(shí)際應(yīng)用中,語音編碼是對原始語音信號的采樣得到的樣點(diǎn)值進(jìn)行編碼,從時序角度講,對原始語音信號的編碼實(shí)際是按時序,依次對原始語音信號中每個樣點(diǎn)值編碼。為方便實(shí)現(xiàn)編碼算法,常以幀為單位,將語音信號的樣點(diǎn)劃分為按時序排列的多個幀,每一幀可包含數(shù)量相同的樣點(diǎn)值。語音編碼即按幀的時序,依次對每一幀語音信號中的每個樣點(diǎn)值進(jìn)行編碼?;诒景l(fā)明實(shí)施例采用噪聲整形技術(shù)進(jìn)行語音編碼,每一幀殘差信號的每個樣點(diǎn)值會被送入噪聲整形濾波器由噪聲整形濾波器進(jìn)行噪聲整形或?yàn)V波,從噪聲整形濾波器輸出的信號即為組成噪聲修正信號的一個樣點(diǎn)值。當(dāng)前得到的噪聲修正信號的樣點(diǎn)值將用于修正原始語音信號的下一個樣點(diǎn)值;相應(yīng)地,用作對原始語音信號的當(dāng)前樣點(diǎn)值作修正的噪聲修正信號的樣點(diǎn)值,實(shí)際是對殘差信號的上一個樣點(diǎn)值經(jīng)過噪聲整形濾波器濾波后,得到的樣點(diǎn)值。具體來講,對當(dāng)前一幀原始語音信號的當(dāng)前樣點(diǎn)值進(jìn)行修正時,如果得到的當(dāng)前一幀殘差信號的當(dāng)前樣點(diǎn)值為該幀的初始樣點(diǎn)值,則將上一幀殘差信號的最后一個樣點(diǎn)值經(jīng)過濾波處理后,得到的上一幀噪聲修正信號的最后一個樣點(diǎn)值用于修正;如果得到的當(dāng)前一幀殘差信號的當(dāng)前樣點(diǎn)值不是該幀的初始樣點(diǎn)值,則將當(dāng)前一幀殘差信號的上一個樣點(diǎn)值經(jīng)過濾波處理得到的樣點(diǎn)值,用于修正。
噪聲整形是相對于核心編碼器對核心編碼語音信號的編碼來講的。由于在核心編解碼器在當(dāng)前編解碼過程中會產(chǎn)生噪聲,該噪聲可體現(xiàn)于上述殘差信號中,因此,基于噪聲整形技術(shù)的語音編碼技術(shù),并不是直接用核心編碼器對當(dāng)前一幀原始語音信號進(jìn)行編碼,而是利用殘差信號的上一個樣點(diǎn)值經(jīng)過噪聲整形濾波器濾波后,得到的樣點(diǎn)值,也即噪聲修正信號的樣點(diǎn)值,對原始語音信號的當(dāng)前樣點(diǎn)值進(jìn)行修正,進(jìn)而對修正后得到的核心編碼語音信號的樣點(diǎn)值進(jìn)行編碼。由于原始語音信號通常是連續(xù)的信號,因而,利用噪聲整形濾波器對殘差信號的上一個樣點(diǎn)值濾波后,得到的噪聲修正信號樣點(diǎn)值基本能夠體現(xiàn)基本語音特性。因此,可對原始語音信號的當(dāng)前樣點(diǎn)值作以上修正。進(jìn)一步,修正的作用在于,提前將核心編解碼器在編解碼過程中可能產(chǎn)生的噪聲疊加到原始語音信號上,從而基于核心編碼器的編碼會產(chǎn)生該噪聲的編碼特性,盡量減少該噪聲,如核心編碼器在編碼過程中會丟失一些信息,丟失的這些信息即為噪聲,則若在利用核心編碼器對核心編碼語音信號編碼之前,將丟失的這些信息先加入到核心編碼語音信號中,從而,核心編碼器對加入了易丟失的這些信息的核心編碼語音信號編碼過程中,可減少丟失的信息。由于低頻語音信號能夠較好地體現(xiàn)語音特性,因此,噪聲整形濾波器通常使用低通濾波器,以減少高頻語音信號帶來的噪聲。
本申請發(fā)明者進(jìn)一步研究發(fā)現(xiàn),原始語音信號與本地重建語音信號之間的差異主要來源于兩處,一處是核心編解碼器在編解碼過程中產(chǎn)生的噪聲,本發(fā)明實(shí)施例中,用上述殘差信號來體現(xiàn)該噪聲;另一處是噪聲整形帶來的噪聲。因此,本發(fā)明實(shí)施例中,為減少噪聲對編碼效果的影響,即為提高編碼效率,一方面對本發(fā)明實(shí)施例給出的圖3所示殘差信號進(jìn)行編碼;另一方面,噪聲整形產(chǎn)生的噪聲進(jìn)行編碼。因此,如果只將圖3所示核心碼流與第一增強(qiáng)碼流作為編碼結(jié)果,傳送給解碼端,則編碼端的編碼實(shí)際是盡量減少了由核心編解碼器在編解碼過程中產(chǎn)生的噪聲,而并沒有處理因噪聲整形帶來的噪聲,編碼效率相對較低。
本發(fā)明實(shí)施例提供的基于噪聲整形的編解碼方案,進(jìn)一步對因噪聲整形帶來的噪聲進(jìn)行了相應(yīng)地處理,主要做法就是提取能夠體現(xiàn)噪聲整形濾波器狀態(tài)特性的狀態(tài)信息,對該狀態(tài)信息進(jìn)行編碼,從而將噪聲整形帶來的噪聲考慮進(jìn)去,盡量減少編碼端在編碼過程中所產(chǎn)生的一切噪聲。如圖3所示,本發(fā)明實(shí)施例中,在編碼端,會進(jìn)一步利用噪聲整形狀態(tài)編碼器對從噪聲整形濾波器提取的當(dāng)前狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流。之后,將核心碼流、第一增強(qiáng)碼流與第二增強(qiáng)碼流作為編碼結(jié)果從編碼端輸出。所謂能夠體現(xiàn)噪聲整形濾波器狀態(tài)特性的狀態(tài)信息,實(shí)際體現(xiàn)造成噪聲整形所帶來的噪聲的原因,該狀態(tài)信息可分為輸入狀態(tài)值和輸出狀態(tài)值,其中,輸入狀態(tài)值由輸入濾波器的殘差信號來體現(xiàn),相對于當(dāng)前待編碼的原始語音信號的當(dāng)前樣點(diǎn)值而言,該輸入狀態(tài)值不是由將得到的殘差信號的當(dāng)前樣點(diǎn)值體現(xiàn),而是由殘差信號中已被輸入噪聲整形濾波器經(jīng)過噪聲整形的樣點(diǎn)值體現(xiàn);輸出狀態(tài)值與輸入狀態(tài)值相對應(yīng),即輸出狀態(tài)值由與體現(xiàn)輸入狀態(tài)值的殘差信號的樣點(diǎn)值相對應(yīng)的噪聲修正信號的樣點(diǎn)值體現(xiàn)。有關(guān)本發(fā)明實(shí)施例提出的狀態(tài)信息,將在后續(xù)實(shí)施例中作詳細(xì)說明。
下面對本發(fā)明實(shí)施例提供的語音編碼技術(shù)方案作詳細(xì)說明。
參見圖4,圖4是本發(fā)明實(shí)施例中基于噪聲整形的語音編碼方法流程圖。該流程可包括以下步驟 步驟401、在編碼端,對核心編碼語音信號進(jìn)行編碼,得到核心碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號。
步驟402、在編碼端,對核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到第一增強(qiáng)碼流。
步驟403、在編碼端,對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流。
步驟404、在編碼端,將所述第一增強(qiáng)碼流、所述第二增強(qiáng)碼流和所述核心碼流,作為編碼結(jié)果輸出。
對應(yīng)于圖4所示的方法流程,本發(fā)明實(shí)施例還提供一種編碼裝置。參見圖5,圖5是該編碼裝置的結(jié)構(gòu)示意圖。該編碼裝置可包括核心編碼單元、語音信號重建單元、殘差信號編碼單元、狀態(tài)信息編碼單元、噪聲整形濾波器和輸出單元;其中, 噪聲整形濾波器,用于產(chǎn)生對原始語音信號進(jìn)行噪聲修正的噪聲修正信號; 核心編碼單元,用于對核心編碼語音信號進(jìn)行編碼,得到核心碼流;所述核心編碼語音信號是由所述噪聲修正信號對原始語音信號修正后得到的語音信號;該單元可以是圖3所示核心編碼器; 語音信號重建單元,用于在本地重建語音信號;該單元可以是圖3所示核心解碼器; 殘差信號編碼單元,用于對核心編碼語音信號與語音信號重建單元得出的本地重建語音信號之間的殘差信號進(jìn)行編碼,得到第一增強(qiáng)碼流;該單元可以是圖3所示殘差編碼器; 狀態(tài)信息編碼單元,用于對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流;該單元可以是圖3所示噪聲整形狀態(tài)編碼器; 輸出單元,用于將所述核心編碼單元得到的所述核心碼流、所述殘差信號編碼單元得到的所述第一增強(qiáng)碼流,和所述狀態(tài)信息編碼單元得到的所述第二增強(qiáng)碼流,作為編碼結(jié)果輸出。
其中,狀態(tài)信息編碼單元可包括狀態(tài)信息獲取單元和編碼單元;其中, 狀態(tài)信息獲取單元,用于獲取所述狀態(tài)信息; 編碼單元,用于對狀態(tài)信息獲取單元獲取到的所述狀態(tài)信息進(jìn)行編碼。
下面結(jié)合具體的實(shí)施例對本發(fā)明實(shí)施例提供的上述語音編碼方案作詳細(xì)說明。
實(shí)施例一 本實(shí)施例一中,設(shè)原始語音信號一幀的樣點(diǎn)數(shù)是N個,標(biāo)記當(dāng)前一幀原始語音信號為s(i),當(dāng)前用于噪聲整形的噪聲修正信號是nout(i-1),其中,i=0,1,...,N-1,N為正整數(shù)。
參見圖6,圖6是本發(fā)明實(shí)施例一中語音編碼流程圖。該流程可包括以下步驟 步驟601、利用噪聲修正信號對當(dāng)前一幀原始語音信號進(jìn)行修正,得到當(dāng)前核心編碼語音信號。
該步驟601中,標(biāo)記當(dāng)前核心編碼語音信號為s′(i),則有 s′(i)=s(i)+nout(i-1)。
(6.1) 步驟602、利用核心編碼器對當(dāng)前核心編碼語音信號進(jìn)行編碼,得到核心碼流;利用核心解碼器對核心碼流進(jìn)行解碼,得到本地重建語音信號。該步驟602中,標(biāo)記本地重建語音信號為
步驟603、計(jì)算核心編碼語音信號與本地重建語音信號之間的殘差,得到當(dāng)前殘差信號。
該步驟603中,標(biāo)記當(dāng)前一幀殘差信號為e′(i),則有 步驟604、利用殘差編碼器對當(dāng)前殘差信號進(jìn)行量化,生成量化比特流,即第一增強(qiáng)碼流。
步驟605、將當(dāng)前一幀殘差信號e′(i)經(jīng)噪聲整形濾波器濾波,得到用于對原始語音信號的下一個樣點(diǎn)值作修正的噪聲修正信號的樣點(diǎn)值,將該噪聲修正信號的樣點(diǎn)值反饋到原始語音信號的輸入端。
該步驟605中,標(biāo)記用于對原始語音信號的下一個樣點(diǎn)值作修正的噪聲修正信號的樣點(diǎn)值為nout(i)。
本發(fā)明實(shí)施例中,設(shè)采用零極點(diǎn)濾波器作為噪聲整形濾波器,零極點(diǎn)濾波器的表達(dá)式如下 其中,與e′(i)相對應(yīng)的濾波器的系數(shù)為b,P為系數(shù)b的階數(shù),第r階系數(shù)為br,r=0,...,P,P是非負(fù)整數(shù);且與nout(i-1)相對應(yīng)的所述濾波器的系數(shù)為a,Q為系數(shù)a的階數(shù),第k階系數(shù)為ak,k=1,...,Q;Q為正整數(shù); 由上式(6.3),可得到步驟605中的nout(i)與步驟601中的nout(i-1)的表達(dá)式分別如下 實(shí)際應(yīng)用中,噪聲整形濾波器可以每幀采用不同的濾波器系數(shù),如每幀濾波器系數(shù)可由對語音信號進(jìn)行LP分析獲得。
步驟606、獲取噪聲整形濾波器的當(dāng)前狀態(tài)信息,包括輸入狀態(tài)值與輸出狀態(tài)值,對當(dāng)前狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流。
由于當(dāng)前幀與上一幀是相對而言的,因此,實(shí)際應(yīng)用中,可將所有被處理的幀作為當(dāng)前幀,提取當(dāng)前幀的第一個樣點(diǎn)值對應(yīng)的初始狀態(tài)信息,只對該初始狀態(tài)信息進(jìn)行編碼;相應(yīng)地,在解碼端,可基于該初始狀態(tài)信息對應(yīng)的碼流,結(jié)合上述式(6.5),算出nout(i-1),因此,只對初始狀態(tài)信息進(jìn)行編碼,可有效減少比特開銷。
則步驟606中取i=0,得到初始狀態(tài)信息中的輸入狀態(tài)值為 e′(-r-1),r=0,...,P; (6.6) 若系數(shù)b的階數(shù)P=0,則取輸入狀態(tài)值為e′(-1),表示可取輸入狀態(tài)值為上一幀殘差信號中的最后一個樣點(diǎn)值;若P≠0,則可取輸入狀態(tài)值為上一幀殘差信號中的多個樣點(diǎn)值,如P=1,則可取輸入狀態(tài)值為上一幀殘差信號中的最后一個樣點(diǎn)值和倒數(shù)第二個樣點(diǎn)值;也即,將上一幀殘差信號中最后P+1個樣點(diǎn)值作為初始狀態(tài)信息的輸入狀態(tài)值。
得到初始狀態(tài)信息中的輸出狀態(tài)值為 nout(-k-1),k=1,...,Q。
(6.7) 若系數(shù)a的階數(shù)Q=1,則取輸出狀態(tài)值為nout(-1),表示可取輸出狀態(tài)值為上一幀噪聲修正信號中的最后一個樣點(diǎn)值;若Q≠0,則可取輸出狀態(tài)值為上一幀噪聲修正信號中的多個樣點(diǎn)值,如Q=2,則可取輸出狀態(tài)值為上一幀噪聲修正信號中的最后一個樣點(diǎn)值和倒數(shù)第二個樣點(diǎn)值;也即,將上一幀噪聲修正信號中的最后Q個樣點(diǎn)值作為所述狀態(tài)信息的輸出狀態(tài)值。
噪聲整形狀態(tài)編碼器對狀態(tài)信息的編碼可以是,分別對e′(-r-1)與nout(-k-1);或可以是,對e′(-r-1)與br的乘積進(jìn)行編碼,對nout(-k-1)與ak的乘積進(jìn)行編碼。
實(shí)際應(yīng)用中,如何可供使用的比特?cái)?shù)足夠多,則從時序角度將在處理每一幀樣點(diǎn)值時,可基于初始狀態(tài)信息,提取該幀中多個當(dāng)前樣點(diǎn)處噪聲整形濾波器的狀態(tài)信息,對提取到的每個狀態(tài)信息進(jìn)行編碼。
結(jié)合圖3可得 進(jìn)而可得 另外,由于在編碼端就對狀態(tài)信息進(jìn)行編碼,通過解碼端去噪聲整形來減少殘差信號的編碼數(shù)據(jù),因而在實(shí)現(xiàn)高編碼效率的同時,避免了解碼的幀間相關(guān)性,增強(qiáng)了對丟包,partial mixing等不連續(xù)語音信號處理的健壯性。
步驟607、將上述編碼過程中得到的核心碼流、第一增強(qiáng)碼流和第二增強(qiáng)碼流作為編碼結(jié)果輸出,該編碼端的編碼流程可結(jié)束。
實(shí)施例二 在上述實(shí)施例一中,若步驟605中,噪聲整形濾波器的系數(shù)以及系數(shù)的階數(shù)具有以下特點(diǎn),即P+1=Q,且br=ar+1。則對當(dāng)前狀態(tài)信息的編碼可進(jìn)一步簡化。
參見圖7,圖7是本發(fā)明實(shí)施例二中語音編碼流程圖。該流程可包括以下步驟 步驟701可與上述關(guān)于步驟601的描述類似。
步驟702可與上述關(guān)于步驟602的描述類似。
步驟703可與上述關(guān)于步驟603的描述類似。
步驟704可與上述關(guān)于步驟604的描述類似。
步驟705可與上述關(guān)于步驟604的描述類似,并且,如之前提及的,該步驟705中,設(shè)P+1=Q,且br=ar+1。
步驟706、提取噪聲整形濾波器的初始狀態(tài)信息,包括輸入狀態(tài)值與輸出狀態(tài)值,對狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流。
該步驟706中,由于P+1=Q,且br=ar+1,則通過計(jì)算可得 因此,實(shí)際應(yīng)用中,可直接取上一幀原始語音信號的所有樣點(diǎn)值中最后P+1個樣點(diǎn)值,以及取上一幀核心編碼語音信號的所有樣點(diǎn)值中最后P+1個樣點(diǎn)值。計(jì)算
的差值,共P+1個差值,對每個差值進(jìn)行編碼。即,對初始狀態(tài)信息的編碼可等價(jià)于對原始語音信號與本地重建語音信號之差的編碼。因此,本實(shí)施例二中,只需對原始語音信號與本地重建語音信號之差進(jìn)行編碼,從而可進(jìn)一步提高編碼效率,進(jìn)而提高語音質(zhì)量。
參見圖8,圖8是本發(fā)明實(shí)施例中另一中語音編碼框架示意圖。圖8所示編碼框架與圖3所示編碼框架的不同之處就在于,圖3中,噪聲整形狀態(tài)編碼器對噪聲整形濾波器的輸入狀態(tài)值與輸出狀態(tài)值進(jìn)行編碼;而圖8所示編碼框架中,噪聲整形狀態(tài)編碼器對原始語音信號與本地重建語音信號之差進(jìn)行編碼。
步驟707可與上述關(guān)于步驟607的描述類似。
另外,上述實(shí)施例一與實(shí)施例二中,對狀態(tài)信息的量化可以是標(biāo)量量化或矢量量化,并可進(jìn)一步采用熵編碼技術(shù),壓縮量化后的狀態(tài)信息,減少比特開銷。
以上對本發(fā)明實(shí)施例提供的基于噪聲整形的語音編碼方案作了詳細(xì)說明。下面對本發(fā)明實(shí)施例提供的對應(yīng)于上述語音編碼方案的語音解碼方案作詳細(xì)說明。
本發(fā)明實(shí)施例提供一種基于噪聲整形的語音解碼方法。參見圖9,圖9是該方法的流程圖。參見圖10,圖10是本發(fā)明實(shí)施例中基于噪聲整形的語音解碼框架示意圖。圖9所示流程可包括以下步驟 步驟901、解碼端接收編碼端發(fā)送過來的編碼結(jié)果。
編碼結(jié)果可包括編碼端對核心編碼語音信號進(jìn)行編碼,得到的核心碼流;對核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到的第一增強(qiáng)碼流;對噪聲整形濾波器的當(dāng)前狀態(tài)信息進(jìn)行編碼,得到的第二增強(qiáng)碼流。
其中,核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號。
步驟902、解碼端對應(yīng)于編碼端對所述核心編碼語音信號的編碼,解碼所述核心碼流,得到與所述核心編碼語音信號相對應(yīng)的解碼核心編碼語音信號。
對應(yīng)地,圖10中核心解碼器對核心碼流進(jìn)行解碼。
步驟903、解碼端對應(yīng)于編碼端對所述殘差信號的編碼,解碼所述第一增強(qiáng)碼流,得到與所述殘差信號相對應(yīng)的解碼殘差信號。
對應(yīng)地,圖10中殘差解碼器對第一增強(qiáng)碼流進(jìn)行解碼。
步驟904、解碼端對應(yīng)于編碼端對所述狀態(tài)信息的編碼,解碼所述第二增強(qiáng)碼流,得到與所述狀態(tài)信息相對應(yīng)的解碼狀態(tài)信息;且根據(jù)所述解碼狀態(tài)信息,得出與所述噪聲修正信號相對應(yīng)的解碼噪聲修正信號。
對應(yīng)地,圖10中狀態(tài)信息解碼器對第二增強(qiáng)碼流進(jìn)行解碼。
步驟905、解碼端將所述解碼核心編碼語音信號、所述解碼殘差信號和所述解碼噪聲修正信號相加,得到解碼語音信號。
對應(yīng)地,圖10中,從核心解碼器輸出的核心編碼語音信號、從殘差解碼器輸出的解碼殘差信號,以及從狀態(tài)信息解碼器輸出的解碼狀態(tài)信息,被疊加后得到最終的解碼語音信號。
對應(yīng)于上述語音解碼方法,本發(fā)明實(shí)施例還提供一種解碼裝置。參見圖11,圖11是該解碼裝置的結(jié)構(gòu)示意圖。該解碼裝置可包括接收單元、核心碼流解碼單元、第一增強(qiáng)碼流解碼單元、第二增強(qiáng)碼流解碼單元和合成單元;其中, 接收單元,用于接收編碼裝置發(fā)送過來的編碼結(jié)果。該編碼結(jié)果包含核心碼流、第一增強(qiáng)碼流和第二增強(qiáng)碼流。
核心碼流解碼單元,用于對應(yīng)于編碼端對所述核心編碼語音信號的編碼,解碼所述核心碼流,得到解碼核心編碼語音信號;該單元可以是圖10所示的核心解碼器; 第一增強(qiáng)碼流解碼單元,用于對應(yīng)于編碼端對所述殘差信號的編碼,解碼所述第一增強(qiáng)碼流,得到解碼殘差信號;該單元可以是圖10所示的殘差解碼器; 第二增強(qiáng)碼流解碼單元,用于對應(yīng)于編碼端對所述狀態(tài)信息的編碼,解碼所述第二增強(qiáng)碼流,得到解碼狀態(tài)信息;該單元可以是圖10所示的狀態(tài)信息解碼器; 合成單元,用于將所述核心碼流解碼單元得到的解碼核心編碼語音信號、所述第一增強(qiáng)碼流解碼單元得到的解碼殘差信號,和第二增強(qiáng)碼流解碼單元得到的解碼狀態(tài)信息相加,得到解碼語音信號。
下面結(jié)合具體的實(shí)施例對本發(fā)明實(shí)施例中的語音解碼方案作詳細(xì)說明。
參見圖12,圖12是本發(fā)明實(shí)施例中語音解碼流程圖,該流程可包括以下步驟 步驟1201、對核心碼流進(jìn)行解碼得到解碼核心編碼語音信號。
該步驟1201中,對核心碼流的解碼過程,是編碼端對核心編碼語音信號編碼過程的逆過程。標(biāo)記解碼核心編碼語音信號為 步驟1202、對第一增強(qiáng)碼流進(jìn)行解碼,得到解碼殘差信號。
該步驟中,對第一增強(qiáng)碼流的解碼過程,是編碼端對殘差信號編碼過程的逆過程。標(biāo)記解碼殘差信號為
步驟1203、對第二增強(qiáng)碼流進(jìn)行解碼,反量化得到解碼所需的噪聲整形的解碼狀態(tài)信息。
該步驟中,若編碼端P+1≠Q(mào),則該處解碼可得到解碼輸入狀態(tài)值以及解碼輸出狀態(tài)值 若編碼端P+1=Q,且br=ar+1,則解碼狀態(tài)信息為
其中,S標(biāo)記最終可得到的解碼語音信號。
步驟1204、利用解碼狀態(tài)信息,計(jì)算解碼噪聲修正信號。
該步驟中,用
標(biāo)記解碼噪聲修正信號,若P+1≠Q(mào),則有 若P+1=Q,且br=ar+1,則有 步驟1205、將解碼核心編碼語音信號、解碼殘差信號,和解碼噪聲修正信號疊加,得到解碼語音信號,該流程可結(jié)束。
上述步驟1205中,若P+1≠Q(mào),則有 若P+1=Q,且br=ar+1,則有 在解碼端由于用解碼第二增強(qiáng)碼流得到的噪聲修正信號,去除噪聲整形效應(yīng),從而可獲得較高質(zhì)量的語音信號。同時,由于沒有利用幀間預(yù)測信息,各幀解碼相對獨(dú)立,因此,對丟包補(bǔ)償和partial mixing都有很強(qiáng)的健壯性。
參見圖13,圖13是利用本發(fā)明實(shí)施例的語音編解碼技術(shù)方案與現(xiàn)有技術(shù)的語音編解碼方案對語音信號進(jìn)行編碼得到的語音信號頻譜對比示意圖。其中,核心編解碼器均采用G.711給出的編解碼器,一幀樣點(diǎn)數(shù)N=40,所采用的零極點(diǎn)濾波器為1階低通濾波器。取P=0,Q=1,且br=ar+1=m,則該1階低通濾波器的表示式為 則本發(fā)明實(shí)施例在編碼端只需如下表示式對應(yīng)的狀態(tài)信息進(jìn)行編碼 本發(fā)明實(shí)施例在解碼端解碼語音信號的表示式為 參見圖13,圖13中,用“1”標(biāo)記的曲線是原始語音信號頻譜曲線;用“2”標(biāo)記的曲線是沒有采用噪聲整形技術(shù)得到的解碼語音信號頻譜曲線;用“3”標(biāo)記的曲線是采用現(xiàn)有技術(shù)二得到的解碼語音信號頻譜曲線;用“4”標(biāo)記的曲線是采用本發(fā)明實(shí)施例的技術(shù)方案得到的解碼語音信號頻譜曲線。從圖13所示編碼效果可見,采用現(xiàn)有噪聲整形技術(shù)可消除部分噪聲,但與原始語音信號頻譜還存在較大差異;采用本發(fā)明實(shí)施例的技術(shù),可消除更多噪聲,得到的解碼語音信號頻譜與原始語音信號頻譜較接近。
綜上所述,本發(fā)明實(shí)施例提供的基于噪聲整形的語音編解碼技術(shù)方案,從產(chǎn)生原始語音信號與本地重建語音信號之差的根源出發(fā),由于該根源不僅來自于對核心編碼語音信號的核心編碼所產(chǎn)生的噪聲,還來自于噪聲整形濾波器對核心編碼的噪聲整形所產(chǎn)生的噪聲,即噪聲整形濾波器的當(dāng)前狀態(tài)信息,因此,本發(fā)明實(shí)施例在編碼端不僅對殘差信號進(jìn)行編碼,還對噪聲整形濾波器的當(dāng)前狀態(tài)信息進(jìn)行編碼,從而在編碼端就能夠盡量減少編碼過程所產(chǎn)生的噪聲,因此,能夠有效提高編碼效率,進(jìn)而,在解碼端能夠解碼出語音質(zhì)量較高的解碼語音信號。并且,本發(fā)明實(shí)施例在編碼端對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,可有效降低解碼端解碼的幀間相關(guān)性,提高對丟包、Partial mixing等事件的健壯性或不敏感性。
另外,本發(fā)明實(shí)施例中,對相關(guān)語音信號的編碼,可采用現(xiàn)有的諸多編碼算法,本發(fā)明實(shí)施例的實(shí)現(xiàn)不受編碼算法的限制。
權(quán)利要求
1、一種基于噪聲整形的語音編碼方法,其特征在于,包括
對核心編碼語音信號進(jìn)行編碼,得到核心碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號;
對所述核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到第一增強(qiáng)碼流;
對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流;
將所述第一增強(qiáng)碼流、所述第二增強(qiáng)碼流和所述核心碼流,作為編碼結(jié)果輸出。
2、根據(jù)權(quán)利要求1所述的方法,其特征在于,對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼包括
獲取所述狀態(tài)信息,對該狀態(tài)信息進(jìn)行編碼。
3、根據(jù)權(quán)利要求2所述的方法,其特征在于,噪聲整形濾波器的狀態(tài)信息包括上一幀殘差信號和上一幀噪聲修正信號。
4、根據(jù)權(quán)利要求3所述的方法,其特征在于,設(shè)所述濾波器為零極點(diǎn)濾波器,設(shè)與所述上一幀殘差信號相對應(yīng)的所述濾波器的系數(shù)為b,P為系數(shù)b的階數(shù),第r階系數(shù)為br,r=0,...,P;且設(shè)與所述上一幀噪聲修正信號相對應(yīng)的所述濾波器的系數(shù)為a,Q為系數(shù)a的階數(shù),第k階系數(shù)為ak,k=1,...,Q;其中,P是非負(fù)整數(shù),Q為正整數(shù);
獲取所述狀態(tài)信息包括
獲取上一幀殘差信號的所有樣點(diǎn)值中的最后P+1個樣點(diǎn)值,將所述最后P+1個樣點(diǎn)值作為所述狀態(tài)信息的輸入狀態(tài)值;
獲取上一幀噪聲修正信號的所有樣點(diǎn)值中的最后Q個樣點(diǎn)值,將所述最后Q個樣點(diǎn)值作為所述狀態(tài)信息的輸出狀態(tài)值。
5、根據(jù)權(quán)利要求4所述的方法,其特征在于,對該狀態(tài)信息進(jìn)行編碼包括對所述輸入狀態(tài)值編碼,且對所述輸出狀態(tài)值編碼;或,
對所述輸入狀態(tài)值與對應(yīng)的所述濾波器的系數(shù)的乘積進(jìn)行編碼,且對所述輸出狀態(tài)值與對應(yīng)的所述濾波器的系數(shù)的乘積進(jìn)行編碼。
6、根據(jù)權(quán)利要求2所述的方法,其特征在于,設(shè)所述濾波器為零極點(diǎn)濾波器,設(shè)與所述上一幀殘差信號相對應(yīng)的所述濾波器的系數(shù)為b,P為系數(shù)b的階數(shù),第r階系數(shù)為br,r=0,...,P;且設(shè)與所述上一幀噪聲修正信號相對應(yīng)的所述濾波器的系數(shù)為a,Q為系數(shù)a的階數(shù),第k階系數(shù)為ak,k=1,...,Q;其中,P與Q均為正整數(shù);
若P+1=Q,且br=ar+1,則獲取所述狀態(tài)信息包括
獲取上一幀原始語音信號的所有樣點(diǎn)值中最后P+1個樣點(diǎn)值;
獲取上一幀核心編碼語音信號的所有樣點(diǎn)值中最后P+1個樣點(diǎn)值。
7、根據(jù)權(quán)利要求6所述的方法,其特征在于,對該狀態(tài)信息進(jìn)行編碼包括
計(jì)算獲取到的上一幀原始語音信號中的每個樣點(diǎn)值,和與該樣點(diǎn)值對應(yīng)的被獲取到的上一幀核心編碼語音信號的樣點(diǎn)值之間的差值;
對P+1個差值分別進(jìn)行編碼。
8、一種編碼裝置,其特征在于,包括核心編碼語音信號生成單元、核心編碼單元、語音信號重建單元、殘差信號生成單元、殘差信號編碼單元、狀態(tài)信息編碼單元、噪聲整形濾波器和輸出單元;其中,
噪聲整形濾波器,用于產(chǎn)生對原始語音信號進(jìn)行噪聲修正的噪聲修正信號;
核心編碼語音信號生成單元,用于將噪聲整形濾波器產(chǎn)生的所述噪聲修正信號與原始語音信號進(jìn)行疊加處理,得到核心編碼語音信號;
核心編碼單元,用于對核心編碼語音信號進(jìn)行編碼,得到核心碼流;所述核心編碼語音信號是由所述噪聲修正信號對原始語音信號修正后得到的語音信號;
語音信號重建單元,用于在本地重建語音信號;
殘差信號生成單元,用于生成所述核心編碼語音信號與語音信號重建單元得出的所述本地重建語音信號之間的殘差信號;
殘差信號編碼單元,用于對所述殘差信號進(jìn)行編碼,得到第一增強(qiáng)碼流;
狀態(tài)信息編碼單元,用于對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流;
輸出單元,用于將所述核心編碼單元得到的所述核心碼流、所述殘差信號編碼單元得到的所述第一增強(qiáng)碼流,和所述狀態(tài)信息編碼單元得到的所述第二增強(qiáng)碼流,作為編碼結(jié)果輸出。
9、根據(jù)權(quán)利要求8所述的編碼裝置,其特征在于,所述狀態(tài)信息編碼單元包括狀態(tài)信息獲取單元和編碼單元;其中,
狀態(tài)信息獲取單元,用于獲取所述狀態(tài)信息;
編碼單元,用于對狀態(tài)信息獲取單元獲取到的所述狀態(tài)信息進(jìn)行編碼。
10、一種基于噪聲整形的語音解碼方法,其特征在于,包括
接收編碼端發(fā)送過來的編碼結(jié)果,所述編碼結(jié)果包括所述編碼端對核心編碼語音信號進(jìn)行編碼,得到的核心碼流;對所述核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到的第一增強(qiáng)碼流;對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到的第二增強(qiáng)碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號;
對應(yīng)于編碼端對所述核心編碼語音信號的編碼,解碼所述核心碼流,得到與所述核心編碼語音信號相對應(yīng)的解碼核心編碼語音信號;
對應(yīng)于編碼端對所述殘差信號的編碼,解碼所述第一增強(qiáng)碼流,得到與所述殘差信號相對應(yīng)的解碼殘差信號;
對應(yīng)于編碼端對所述狀態(tài)信息的編碼,解碼所述第二增強(qiáng)碼流,得到與所述狀態(tài)信息相對應(yīng)的解碼狀態(tài)信息;且根據(jù)所述解碼狀態(tài)信息,得出與所述噪聲修正信號相對應(yīng)的解碼噪聲修正信號;
將所述解碼核心編碼語音信號、所述解碼殘差信號和所述解碼噪聲修正信號相加,得到解碼語音信號。
11、根據(jù)權(quán)利要求10所述的解碼方法,其特征在于,解碼所述第二增強(qiáng)碼流包括解碼得出上一幀原始語音信號中的每個樣點(diǎn)值,和與該樣點(diǎn)值對應(yīng)的上一幀核心編碼語音信號的樣點(diǎn)值之間的差值。
12、根據(jù)權(quán)利要求10所述的解碼方法,其特征在于,在編碼端,設(shè)所述濾波器為零極點(diǎn)濾波器,設(shè)與所述上一幀殘差信號相對應(yīng)的所述濾波器的系數(shù)為b,P為系數(shù)b的階數(shù),第r階系數(shù)為br,r=0,...,P;且設(shè)與所述上一幀噪聲修正信號相對應(yīng)的所述濾波器的系數(shù)為a,Q為系數(shù)a的階數(shù),第k階系數(shù)為ak,k=1,...,Q;其中,P是非負(fù)整數(shù),Q為正整數(shù);
解碼所述第二增強(qiáng)碼流包括解碼得出上一幀殘差信號的所有樣點(diǎn)值中的最后P+1個樣點(diǎn)值,和上一幀噪聲修正信號的所有樣點(diǎn)值中的最后Q個樣點(diǎn)值。
13、一種解碼裝置,其特征在于,包括接收單元、核心碼流解碼單元、第一增強(qiáng)碼流解碼單元、第二增強(qiáng)碼流解碼單元和合成單元;其中,
接收單元,用于接收編碼裝置發(fā)送過來的編碼結(jié)果,所述編碼結(jié)果包括所述編碼端對核心編碼語音信號進(jìn)行編碼,得到的核心碼流;對所述核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到的第一增強(qiáng)碼流;對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到的第二增強(qiáng)碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號;
核心碼流解碼單元,用于對應(yīng)于編碼端對所述核心編碼語音信號的編碼,解碼所述核心碼流,得到與所述核心編碼語音信號相對應(yīng)的解碼核心編碼語音信號;
第一增強(qiáng)碼流解碼單元,用于對應(yīng)于編碼端對所述殘差信號的編碼,解碼所述第一增強(qiáng)碼流,得到與所述殘差信號相對應(yīng)的解碼殘差信號;
第二增強(qiáng)碼流解碼單元,用于對應(yīng)于編碼端對所述狀態(tài)信息的編碼,解碼所述第二增強(qiáng)碼流,得到與所述狀態(tài)信息相對應(yīng)的解碼狀態(tài)信息;且根據(jù)所述解碼狀態(tài)信息,得出與所述噪聲修正信號相對應(yīng)的解碼噪聲修正信號;
合成單元,用于將所述核心碼流解碼單元得到的所述解碼核心編碼語音信號、所述第一增強(qiáng)碼流解碼單元得到的所述解碼殘差信號,和所述第二增強(qiáng)碼流解碼單元得到的所述解碼噪聲修正信號進(jìn)行合成,得到解碼語音信號。
全文摘要
本發(fā)明實(shí)施例提供一種基于噪聲整形的語音編碼方法,包括對核心編碼語音信號進(jìn)行編碼,得到核心碼流;所述核心編碼語音信號是由噪聲整形濾波器反饋的噪聲修正信號對原始語音信號修正后得到的語音信號;對所述核心編碼語音信號與本地重建語音信號之間的殘差信號進(jìn)行編碼,得到第一增強(qiáng)碼流;對噪聲整形濾波器的狀態(tài)信息進(jìn)行編碼,得到第二增強(qiáng)碼流;將所述第一增強(qiáng)碼流、所述第二增強(qiáng)碼流和所述核心碼流,作為編碼結(jié)果輸出。本發(fā)明實(shí)施例還提供相應(yīng)的編解碼裝置及基于噪聲整形的語音解碼方法。本發(fā)明實(shí)施例的技術(shù)方案可有效提高編碼效率,進(jìn)而,在解碼端能夠解碼出語音質(zhì)量較高的解碼語音信號。
文檔編號G10L19/14GK101388212SQ20071015395
公開日2009年3月18日 申請日期2007年9月15日 優(yōu)先權(quán)日2007年9月15日
發(fā)明者磊 苗, 齊峰巖, 晨 胡, 許劍峰, 清 張, 許麗凈, 杜正中, 偉 李, 毅 楊 申請人:華為技術(shù)有限公司