專(zhuān)利名稱(chēng):一種用于數(shù)字音頻信號(hào)壓縮的快速量化方法
技術(shù)領(lǐng)域:
本發(fā)明是一種量化編碼方法,特別涉及一種應(yīng)用于數(shù)字音頻壓縮編碼系統(tǒng)的快速 量化編碼方法,該方法能夠有效應(yīng)用于采用時(shí)-頻變換方法的基于頻域子帶模型的音頻編 碼算法中。
背景技術(shù):
隨著第三代移動(dòng)通信網(wǎng)和數(shù)字廣播技術(shù)的發(fā)展與普及,以音頻壓縮算法為核心的 音頻編碼技術(shù)在無(wú)線(xiàn)通信領(lǐng)域得到了廣泛的應(yīng)用。與傳統(tǒng)的基于光盤(pán)和互聯(lián)網(wǎng)數(shù)據(jù)包的變 速率編碼應(yīng)用不同,為有效利用信道,無(wú)線(xiàn)通信傳輸標(biāo)準(zhǔn)對(duì)音頻數(shù)據(jù)的編碼速率與長(zhǎng)度進(jìn) 行了嚴(yán)格定義。自適應(yīng)量化模塊在音頻編碼算法開(kāi)銷(xiāo)中占有較高比重。音頻編碼器中量化器模塊 的作用是對(duì)頻譜數(shù)據(jù)根據(jù)心理聲學(xué)特性進(jìn)行加權(quán)比特分配及量化,在盡量保證音質(zhì)的前提 下達(dá)到所要求的編碼比特?cái)?shù)。量化模塊通常采用內(nèi)外雙層迭代循環(huán)控制方式。量化算法的 內(nèi)外循環(huán)均為先設(shè)定量化參數(shù)初始值,再經(jīng)迭代搜索到最佳點(diǎn)的過(guò)程。每一次外層循環(huán)的 調(diào)用都會(huì)對(duì)此調(diào)用內(nèi)層循環(huán),同時(shí),現(xiàn)有音頻編碼器量化算法內(nèi)外層參數(shù)的初始化通常采 用固定的初始值,且迭代過(guò)程較慢,導(dǎo)致每一次量化過(guò)程都要經(jīng)過(guò)多次循環(huán)進(jìn)而導(dǎo)致整個(gè) 編碼器運(yùn)行速度下降。綜上所述,目前數(shù)字音頻信號(hào)量化編碼的算法存在計(jì)算量大、耗時(shí)長(zhǎng),浪費(fèi)計(jì)算資 源等問(wèn)題,在視頻通信伴音壓縮傳輸和電視電聲現(xiàn)場(chǎng)轉(zhuǎn)播等實(shí)時(shí)引用場(chǎng)景下,上述問(wèn)題成 為系統(tǒng)設(shè)計(jì)的關(guān)鍵因素。
發(fā)明內(nèi)容
本發(fā)明是一種應(yīng)用于數(shù)字音頻壓縮編碼系統(tǒng)中的快速量化編碼方法,該方法可以 減少計(jì)算量、提高量化器的計(jì)算效率,減少量化器的運(yùn)行時(shí)間。本發(fā)明采用的技術(shù)方案是基于比特估算數(shù)學(xué)模型,在量化編碼過(guò)程前可直接估算所消耗的比特?cái)?shù),即基于 數(shù)學(xué)模型并根據(jù)輸入信號(hào)特征估算量化器迭代初值,然后根據(jù)迭代誤差動(dòng)態(tài)調(diào)整迭代步 長(zhǎng)。具體包括以下6個(gè)步驟第一步計(jì)算每一幀待分配的比特?cái)?shù)B。根據(jù)設(shè)定的比特率、聲道數(shù)、幀長(zhǎng)、采樣率 計(jì)算待分配的比特?cái)?shù),若固定碼率為64千位每秒,采樣率為每秒48000樣本,單聲道,幀長(zhǎng) 為1024個(gè)樣本,則每一幀待分配比特?cái)?shù)為(64千位每秒/48000個(gè)樣本)*1024樣本。待分 配比特?cái)?shù)目判決,判斷計(jì)算出來(lái)的待分配比特?cái)?shù)是否為8的倍數(shù),若是則輸出,若不是,將 比特?cái)?shù)補(bǔ)齊。第二步,估算量化編碼當(dāng)前幀所需比特?cái)?shù)bitf。根據(jù)帶有品質(zhì)因子Qtl的初始能量 閾值下限Emin[sb],設(shè)k = QcZQ1,其中,量化外層循環(huán)參數(shù)的初始化Q1, Nsb為每一個(gè)子帶的 寬度,α sb為碼本效率,bitf表示估算得出估算量化編碼當(dāng)前幀所需比特?cái)?shù),采用如下公式估算量化編碼當(dāng)前幀所需比特?cái)?shù)。 其中δ為待定系數(shù),需要經(jīng)過(guò)大量的聽(tīng)覺(jué)實(shí)驗(yàn)來(lái)測(cè)定,δ的取值為 第三步計(jì)算量化外層循環(huán)參數(shù)的初始化值。根據(jù)估算量化編碼當(dāng)前幀所需比特 數(shù)bitf和每一幀待分配的比特?cái)?shù)B,根據(jù)量化外層循環(huán)判斷準(zhǔn)則bitf = B,計(jì)算得出量化外 層循環(huán)參數(shù)的初始值。設(shè)Cisb為碼本效率,Nsb為每一個(gè)子帶的寬度,采用以下公式來(lái)計(jì)算 量化外層循環(huán)參數(shù)的初始化Q1。
第四步根據(jù)量化外層循環(huán)參數(shù)的初始化值Q1計(jì)算能量閾值下限Xmin[sb]。根據(jù) 帶有品質(zhì)因子Qtl的初始能量閾值下限Emin[sb],采用以下公式,計(jì)算帶有品質(zhì)因子Q1的能量 閾值下限Xmin [sb]。 第五步計(jì)算量化內(nèi)層循環(huán)參數(shù)的初始化值。根據(jù)噪聲能量判斷準(zhǔn)則計(jì)算出內(nèi)層 循環(huán)參數(shù)的初始值。根據(jù)能量閾值下限Xmin[sb]計(jì)算內(nèi)層循環(huán)參數(shù)的初始化值。采用以下 公式計(jì)算內(nèi)層循環(huán)參數(shù)的初始化值。
第六步計(jì)算量化內(nèi)層循環(huán)參數(shù)的調(diào)整準(zhǔn)則。根據(jù)量化后實(shí)際的能量閾值函數(shù) 值EtJsb]和能量閾值函數(shù)下限Xmin[sb]的差值的符號(hào),判斷本次迭代是否進(jìn)入迭代搜索 的臨界區(qū)域,然后根據(jù)ECT[sb]成比例調(diào)整縮放系數(shù),判定依據(jù)為若兩次迭代能量差值的 正負(fù)性發(fā)生變化,則進(jìn)入臨界區(qū),否則未進(jìn)入臨界區(qū),設(shè)定義差值ECT[sb]和能量閾值下限 Xfflin[sb]的比值為Rsb,采用以下公式 若迭代進(jìn)入臨界區(qū),則將下次迭代的迭代步長(zhǎng)st印定為Rsb的-0. 5倍,即從正負(fù) 兩個(gè)方向且逐步減小迭代步長(zhǎng)來(lái)逼近最佳值,從而可以避免產(chǎn)生迭代振蕩影響收斂。若迭 代未進(jìn)入臨界區(qū),則將下次迭代的迭代步長(zhǎng)保持原來(lái)迭代步長(zhǎng)方向,且迭代步長(zhǎng)step = Rsb 從而加快收斂速度,保證盡快進(jìn)入臨界區(qū)域。第七步計(jì)算量化外層參數(shù)的調(diào)整準(zhǔn)則。根據(jù)每一幀量化編碼后實(shí)際所需比特?cái)?shù)和待分配平均比特?cái)?shù)的差值,調(diào)整外層循環(huán)參數(shù)的迭代步長(zhǎng);根據(jù)實(shí)際比特?cái)?shù)和可用比特 數(shù)差值成比例調(diào)節(jié)品質(zhì)因子Q值,設(shè)Q·為本次迭代的品質(zhì)因子,B表示每一幀待分配的比 特?cái)?shù),bitscur表示實(shí)際量化編碼當(dāng)前幀所用比特?cái)?shù)。采用以下公式來(lái)計(jì)算量化外層參數(shù)的 調(diào)整準(zhǔn)則。 本發(fā)明可以使用通用計(jì)算機(jī)系統(tǒng)通過(guò)軟件編程實(shí)施,也可以采用嵌入式計(jì)算機(jī)通 過(guò)軟件編程實(shí)施。本發(fā)明對(duì)于多種格式的音頻編碼標(biāo)準(zhǔn)的量化過(guò)程均可以有針對(duì)性的進(jìn)行 實(shí)施。本發(fā)明產(chǎn)生的有益效果是本發(fā)明在保證音質(zhì)不變的前提下,從減少計(jì)算量、突破單幀編碼的時(shí)間瓶頸出發(fā), 提出新的改進(jìn)算法,能夠有效減少量化器迭代次數(shù)和運(yùn)算量,并且在不同類(lèi)型的音頻曲目 與音頻幀之間的編碼時(shí)間相對(duì)穩(wěn)定。為滿(mǎn)足實(shí)時(shí)性需求,編碼器的實(shí)時(shí)性能將取決于單幀 編碼的最長(zhǎng)時(shí)間而不是統(tǒng)計(jì)意義上的性能。因此本發(fā)明更有利于提高編碼器的實(shí)時(shí)性能, 針對(duì)應(yīng)用于播出現(xiàn)場(chǎng)的編碼系統(tǒng)該發(fā)明具有一定的實(shí)施優(yōu)勢(shì)。
以下結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作一詳細(xì)的說(shuō)明。
圖1是本發(fā)明的原理框圖即根據(jù)當(dāng)前子帶的輸入數(shù)字音頻信號(hào)和設(shè)定的目標(biāo)比 特率快速搜索量化參數(shù)最佳值的流程圖。圖2是將圖1所示方法用于先進(jìn)音頻編碼(AAC)編碼器,以目前通用的開(kāi)源版本 音頻編碼器FAAC作為對(duì)比算法,對(duì)于等時(shí)長(zhǎng)的8種不同風(fēng)格曲目,在2種不同的目標(biāo)碼率 下,對(duì)最大單幀迭代次數(shù)的統(tǒng)計(jì)。圖3是將圖1所示方法用于先進(jìn)音頻編碼(AAC)編碼器,以目前通用的開(kāi)源版本 音頻編碼器FAAC作為對(duì)比算法,對(duì)于等時(shí)長(zhǎng)的8種不同風(fēng)格曲目,經(jīng)感知音頻質(zhì)量評(píng)價(jià)系 統(tǒng)PEAQ給出的本改進(jìn)算法和對(duì)比算法分別與無(wú)壓縮版本音頻對(duì)比后的客觀音質(zhì)損失評(píng)價(jià) (分?jǐn)?shù)越接近0越好)。圖中輸入數(shù)字音頻信號(hào)1,估算量化編碼當(dāng)前幀所需比特?cái)?shù)2,計(jì)算量化外層循 環(huán)參數(shù)的初始化值3,計(jì)算能量閾值下限4,計(jì)算內(nèi)層循環(huán)參數(shù)的初始化值5,譜線(xiàn)和能量閾 值判決6,量化后譜線(xiàn)變長(zhǎng)編碼7,計(jì)算量化內(nèi)層循環(huán)參數(shù)的調(diào)整準(zhǔn)則8,計(jì)算每一幀待分配 的比特?cái)?shù)9,待分配比特?cái)?shù)目判決10,將比特?cái)?shù)補(bǔ)齊11,實(shí)際比特?cái)?shù)是否和待分配比特?cái)?shù)判 決12,計(jì)算量化外層參數(shù)的調(diào)整準(zhǔn)則13,將比特?cái)?shù)補(bǔ)齊至待分配的比特?cái)?shù)14。
具體實(shí)施例方式本發(fā)明可以使用通用計(jì)算機(jī)系統(tǒng)通過(guò)軟件編程實(shí)施,也可以采用嵌入式計(jì)算機(jī)通 過(guò)軟件編程實(shí)施。本發(fā)明對(duì)于多種格式的音頻編碼標(biāo)準(zhǔn)的量化過(guò)程均可以有針對(duì)性的進(jìn)行實(shí)施。圖1所示為本發(fā)明的原理框圖即根據(jù)當(dāng)前子帶的輸入數(shù)字音頻信號(hào)和設(shè)定的目 標(biāo)比特率快速搜索量化參數(shù)最佳值的流程圖。具體包含以下步驟
步驟a)計(jì)算每一幀待分配的比特?cái)?shù)9。在本實(shí)施例中,根據(jù)設(shè)定的比特率、聲道數(shù)、幀長(zhǎng)、采樣率計(jì)算待分配的比特?cái)?shù),若 固定碼率為64千位每秒,采樣率為每秒48000樣本,單聲道,幀長(zhǎng)為1024個(gè)樣本。則每一 幀待分配比特?cái)?shù)為(64千位每秒/48000個(gè)樣本)*1024樣本。記為B,單位為比特。步驟b)待分配比特?cái)?shù)目判決10,判斷計(jì)算出來(lái)的待分配比特?cái)?shù)是否為8的倍數(shù), 若是,則執(zhí)行輸入給步驟k),否則則執(zhí)行步驟c)。步驟c):將比特?cái)?shù)補(bǔ)齊11,執(zhí)行輸入給步驟k)。
步驟d)估算量化編碼當(dāng)前幀所需比特?cái)?shù)bitf2。根據(jù)帶有品質(zhì)因子Qtl的初始能 量閾值下限Emin[sb],設(shè)k = QcZQ1,其中,量化外層循環(huán)參數(shù)的初始化Q1, Nsb為每一個(gè)子帶 的寬度,α sb為碼本效率,bitf表示估算得出估算量化編碼當(dāng)前幀所需比特?cái)?shù),采用如下公 式估算量化編碼當(dāng)前幀所需比特?cái)?shù)。 其中δ為待定系數(shù),需要經(jīng)過(guò)大量的聽(tīng)覺(jué)實(shí)驗(yàn)來(lái)測(cè)定,δ的取值為 步驟e)計(jì)算量化外層循環(huán)參數(shù)的初始化值3。本實(shí)施例中,根據(jù)估算量化編碼當(dāng)前幀所需比特?cái)?shù)bitf和每一幀待分配的比特?cái)?shù) B,根據(jù)量化外層循環(huán)判斷準(zhǔn)則bitf = B,計(jì)算得出量化外層循環(huán)參數(shù)的初始值。設(shè)Cisb為 碼本效率,Nsb為每一個(gè)子帶的寬度,采用以下公式來(lái)計(jì)算量化外層循環(huán)參數(shù)的初始化Qp 步驟f)根據(jù)量化外層循環(huán)參數(shù)的初始化值Q1計(jì)算能量閾值下限Xmin[sb] (4)。設(shè)Emin[sb]為品質(zhì)因子Qtl每一子帶的掩蔽閾值,采用以下公式,計(jì)算帶有品質(zhì)因子 (^的能量閾值下限Xmin[sb] (4)。Xmin[sb] = Q0/Q1*Emin[sb]步驟g)計(jì)算量化內(nèi)層循環(huán)參數(shù)的初始化值5。本實(shí)施例中,根據(jù)能量閾值下限Xmin[sb] (4)計(jì)算得出量化內(nèi)層循環(huán)參數(shù)的初始化 值。本實(shí)施采用以下公式來(lái)計(jì)算量化內(nèi)層循環(huán)參數(shù)的初始化。 步驟h)譜線(xiàn)和能量閾值判決6,判斷量化后的譜線(xiàn)能量是否大于等于能量閾值 的下限,若不是,則執(zhí)行步驟j),否則則執(zhí)行步驟i)。步驟i)量化后譜線(xiàn)變長(zhǎng)編碼7。步驟j)計(jì)算量化內(nèi)層循環(huán)參數(shù)的調(diào)整準(zhǔn)則8。
本實(shí)施例中,根據(jù)量化后實(shí)際的能量閾值函數(shù)值Eq[Sb]和能量閾值函數(shù)下限
Xfflin[sb] (4)的差值的符號(hào),判斷本次迭代是否進(jìn)入迭代搜索的臨界區(qū)域,判定依據(jù)為若兩
次迭代能量差值的正負(fù)性發(fā)生變化,則進(jìn)入臨界區(qū),否則未進(jìn)入臨界區(qū),然后根據(jù)量化后實(shí)
際的能量閾值函數(shù)值EJsb]和能量閾值函數(shù)下限Xmin[sb]的差值ECT[sb]成比例調(diào)整縮放
系數(shù),設(shè)定義差值Ect [sb]和能量閾值下限Xmin[sb]的比值為Rsb,本實(shí)施例采用以下公式
_2
(3 3 “ M Vs
YantCx/^"^1"1))2 若迭代進(jìn)入臨界區(qū),則將下次迭代的迭代步長(zhǎng)st印定為Rsb的-0. 5倍,即從正負(fù) 兩個(gè)方向且逐步減小迭代步長(zhǎng)來(lái)逼近最佳值,從而可以避免產(chǎn)生迭代振蕩影響收斂。若迭代未進(jìn)入臨界區(qū),則將下次迭代的迭代步長(zhǎng)保持原來(lái)迭代步長(zhǎng)方向,且迭代 步長(zhǎng)step = Rsb從而加快收斂速度,保證盡快進(jìn)入臨界區(qū)域。步驟j)實(shí)際比特?cái)?shù)是否和待分配比特?cái)?shù)判決12。判斷每一幀量化編碼后實(shí)際所 用比特?cái)?shù)是否大于每一幀待分配比特?cái)?shù),若不是則執(zhí)行步驟m),否則執(zhí)行步驟1)。步驟1)計(jì)算量化外層參數(shù)的調(diào)整準(zhǔn)則13。本實(shí)施例中,根據(jù)實(shí)際比特?cái)?shù)和每一幀待分配的比特?cái)?shù)B(IO)的差值成比例調(diào)節(jié) 品質(zhì)因子Q值,設(shè)Qcot為本次迭代的品質(zhì)因子,B(IO)表示每一幀待分配的比特?cái)?shù),bitscur 表示實(shí)際量化編碼當(dāng)前幀所用比特?cái)?shù)。本實(shí)施例采用以下公式來(lái)計(jì)算量化外層參數(shù)的調(diào)整 準(zhǔn)則。 步驟m)將比特?cái)?shù)補(bǔ)齊至待分配的比特?cái)?shù)14。將圖1所示方法用于先進(jìn)音頻編碼(AAC)編碼器,以目前通用的開(kāi)源版本音頻編 碼器FAAC軟件作為對(duì)比算法,采用X86平臺(tái),對(duì)等時(shí)長(zhǎng)的8種不同風(fēng)格曲目,在2種不同的 目標(biāo)碼率下,對(duì)總壓縮時(shí)間的統(tǒng)計(jì)如表1所示。從中可見(jiàn)本方法能夠有效降低壓縮時(shí)間。表1壓縮時(shí)間的比較(單位秒) 將圖1所示方法用于先進(jìn)音頻編碼(AAC)編碼器,以目前通用的開(kāi)源版本音頻編 碼器FAAC軟件作為對(duì)比算法,對(duì)于等時(shí)長(zhǎng)的8種不同風(fēng)格曲目,在2種不同的目標(biāo)碼率下, 對(duì)平均迭代次數(shù)的統(tǒng)計(jì)如表2所示。從中可見(jiàn)本方法能夠在統(tǒng)計(jì)意義上減少迭代測(cè)試,并 且編碼算法的執(zhí)行速度更加平穩(wěn)。表2單聲道目標(biāo)碼率48kbps、32kbps平均迭代次數(shù)的比較(單位次/幀) 圖2所示為將圖1所示方法用于先進(jìn)音頻編碼(AAC)編碼器,以目前通用的開(kāi)源 版本音頻編碼器FAAC軟件作為對(duì)比算法,對(duì)于等時(shí)長(zhǎng)的8種不同風(fēng)格曲目,在2種不同的 目標(biāo)碼率下,對(duì)最大單幀迭代次數(shù)的統(tǒng)計(jì)。由此可見(jiàn)本方法能夠在統(tǒng)計(jì)意義上減少迭代次 數(shù),并且編碼算法的執(zhí)行速度更加平穩(wěn)。圖3所示為將圖1所示方法用于先進(jìn)音頻編碼(AAC)編碼器,以目前通用的開(kāi)源 版本音頻編碼器FAAC軟件作為對(duì)比算法,對(duì)于等時(shí)長(zhǎng)的8種不同風(fēng)格曲目,經(jīng)感知音頻質(zhì) 量評(píng)價(jià)系統(tǒng)PEAQ給出的本改進(jìn)算法和對(duì)比算法分別與無(wú)壓縮版本音頻對(duì)比后的主觀音質(zhì) 損失評(píng)分(越接近0越好)。測(cè)試表明改進(jìn)算法與對(duì)比算法編碼后主觀質(zhì)量相比無(wú)明顯失真。
權(quán)利要求
一種用于數(shù)字音頻信號(hào)壓縮的快速量化方法,其特征在于所述方法包括a)計(jì)算每一幀待分配的比特?cái)?shù)(9);根據(jù)設(shè)定的比特率、聲道數(shù)、幀長(zhǎng)、采樣率計(jì)算待分配的比特?cái)?shù),進(jìn)行待分配比特?cái)?shù)目判決(10),判斷計(jì)算出來(lái)的待分配比特?cái)?shù)是否為8的倍數(shù),若不是,將比特?cái)?shù)補(bǔ)齊(11);b)根據(jù)輸入的數(shù)字音頻信號(hào)(1)計(jì)算量化外層循環(huán)參數(shù)的初始化值(3);利用步驟a)輸出的每一幀待分配比特?cái)?shù)和初始能量閾值下限,計(jì)算量化外層循環(huán)參數(shù)的初始化值(3);c)計(jì)算能量閾值下限(4);根據(jù)量化外層循環(huán)參數(shù)的初始化值(3)計(jì)算符合量化外層循環(huán)參數(shù)的初始化值(3)的能量閾值下限(4);d)計(jì)算內(nèi)層循環(huán)參數(shù)的初始化值(5);根據(jù)噪聲能量判斷準(zhǔn)則計(jì)算內(nèi)層循環(huán)參數(shù)的初始化值(5)。e)譜線(xiàn)和能量閾值判決(6),判斷量化后的譜線(xiàn)能量是否大于等于能量閾值的下限,若不是,計(jì)算量化內(nèi)層循環(huán)參數(shù)的調(diào)整準(zhǔn)則(8),調(diào)整量化內(nèi)層循環(huán)參數(shù)的迭代步長(zhǎng),否則則進(jìn)行量化后譜線(xiàn)變長(zhǎng)編碼(7);f)實(shí)際比特?cái)?shù)是否和待分配比特?cái)?shù)判決(11),判斷每一幀量化編碼后實(shí)際所用比特?cái)?shù)是否大于每一幀待分配比特?cái)?shù),若是,則計(jì)算量化外層參數(shù)的調(diào)整準(zhǔn)則(13)調(diào)整外層循環(huán)參數(shù)的迭代步長(zhǎng)。
2.根據(jù)權(quán)利要求2所述的確定量化外層循環(huán)參數(shù)初始值方法,其待分配平均比特?cái)?shù)估 算方法的特征在于根據(jù)設(shè)定的比特率、聲道數(shù)、幀長(zhǎng)、采樣率計(jì)算待分配的比特?cái)?shù),若固定 碼率為64千位每秒,采樣率為每秒48000樣本,單聲道,幀長(zhǎng)為1024個(gè)樣本,則每一幀待分 配比特?cái)?shù)為(64千位每秒/48000個(gè)樣本)*1024樣本,記為B,單位為比特,待分配比特?cái)?shù)目 判決(10),判斷計(jì)算出來(lái)的待分配比特?cái)?shù)是否為8的倍數(shù),若是則輸出,若不是,將比特?cái)?shù) 補(bǔ)齊(11)。
3.根據(jù)權(quán)利要求1所述的用于數(shù)字音頻信號(hào)壓縮的快速量化方法,其確定量化外層 循環(huán)參數(shù)初始值方法的特征在于根據(jù)輸入樣本及帶有品質(zhì)因子Qtl的初始能量閾值下限 Emin[sb]、每一幀待分配的比特?cái)?shù)B,基于比特估算數(shù)學(xué)模型和噪聲能量判斷準(zhǔn)則,根據(jù)量化 外層循環(huán)判斷準(zhǔn)則,計(jì)算量化外層循環(huán)參數(shù)的初始值。設(shè)碼本效率為α sb,子帶寬度為Nsb采 用以下公式來(lái)計(jì)算量化外層循環(huán)參數(shù)的初始化值(3); 其中δ為待定系數(shù),需要經(jīng)過(guò)大量的聽(tīng)覺(jué)實(shí)驗(yàn)來(lái)測(cè)定,δ的取值為
4.根據(jù)權(quán)利要求1所述的用于數(shù)字音頻信號(hào)壓縮的快速量化方法,其確定能量閾值下 限方法的特征在于根據(jù)量化外層循環(huán)參數(shù)的初始化值Q1計(jì)算能量閾值下限Xmin[sb] (4), 采用以下公式,根據(jù)帶有品質(zhì)因子Qtl的初始能量閾值下限Emin[sb],計(jì)算帶有品質(zhì)因子Q1的 能量閾值下限Xmin[sb]⑷。
5.根據(jù)權(quán)利要求1所述的用于數(shù)字音頻信號(hào)壓縮的快速量化方法,其確定量化內(nèi)層循 環(huán)參數(shù)初始值方法的特征在于根據(jù)噪聲能量判斷準(zhǔn)則計(jì)算出內(nèi)層循環(huán)參數(shù)的初始值;設(shè) 樣本為Xi,根據(jù)能量閾值下限xmin[sb] (4)計(jì)算內(nèi)層循環(huán)參數(shù)的初始化值(5),采用以下公式來(lái)計(jì)算內(nèi)層循環(huán)參數(shù)的初始化值(5)。
6.根據(jù)權(quán)利要求1所述的用于數(shù)字音頻信號(hào)壓縮的快速量化方法,其量化內(nèi)層循環(huán)參 數(shù)的調(diào)整準(zhǔn)則方法的特征在于根據(jù)量化后實(shí)際的能量閾值函數(shù)值EJsb]和能量閾值下限 Xfflin[sb] (4)的差值的符號(hào),判斷本次迭代是否進(jìn)入迭代搜索的臨界區(qū)域,然后根據(jù)艮彳讓] 成比例調(diào)整縮放系數(shù),判定依據(jù)為若兩次迭代能量差值的正負(fù)性發(fā)生變化,則進(jìn)入臨界 區(qū),否則未進(jìn)入臨界區(qū),設(shè)定義差值1[讓]和能量閾值下限Xmin[sb]的比值為Rsb,采用以 下公式 若迭代進(jìn)入臨界區(qū),則將下次迭代的迭代步長(zhǎng)step定為Rsb的-0. 5倍,即從正負(fù)兩個(gè) 方向且逐步減小迭代步長(zhǎng)來(lái)逼近最佳值,從而可以避免產(chǎn)生迭代振蕩影響收斂,若迭代未 進(jìn)入臨界區(qū),則將下次迭代的迭代步長(zhǎng)保持原來(lái)迭代步長(zhǎng)方向,且迭代步長(zhǎng)st印=Rsb從而 加快收斂速度,保證盡快進(jìn)入臨界區(qū)域。
7.根據(jù)權(quán)利要求1所述的用于數(shù)字音頻信號(hào)壓縮的快速量化方法,其量化外層循環(huán)參 數(shù)的調(diào)整準(zhǔn)則方法的特征在于根據(jù)每一幀量化編碼后實(shí)際所需比特?cái)?shù)和待分配平均比特 數(shù)的差值,調(diào)整外層循環(huán)參數(shù)的迭代步長(zhǎng);根據(jù)實(shí)際比特?cái)?shù)和可用比特?cái)?shù)差值成比例調(diào)節(jié) 品質(zhì)因子Q值。設(shè)Qcm為本次迭代的品質(zhì)因子,B表示每一幀待分配的比特?cái)?shù),bitSc;ur表示 實(shí)際量化編碼當(dāng)前幀所用比特?cái)?shù)。采用以下公式來(lái)計(jì)算量化外層參數(shù)的調(diào)整準(zhǔn)則。
8.根據(jù)權(quán)利要求3所述的確定量化外層循環(huán)參數(shù)初始值方法,其噪聲能量準(zhǔn)則的特征在于設(shè)樣本為Xi,子帶寬度為Nsb,采用以下公式,計(jì)算噪聲能量判斷準(zhǔn)則。
9.根據(jù)權(quán)利要求3所述的確定量化外層循環(huán)參數(shù)初始值方法,其量化編碼當(dāng)前幀所需 比特?cái)?shù)估算方法的特征在于利用量化后譜線(xiàn)能量的最小值,估算當(dāng)前子帶量化編碼所需 要的比特?cái)?shù),設(shè)k = QciA^bitf表示估算得出估算量化編碼當(dāng)前幀所需比特?cái)?shù),采用如下公式估算量化編碼當(dāng)前幀所需比特?cái)?shù)。 其中5為待定系數(shù),需要經(jīng)過(guò)大量的聽(tīng)覺(jué)實(shí)驗(yàn)來(lái)測(cè)定,δ的取值為
10.根據(jù)權(quán)利要求3所述的確定量化外層循環(huán)參數(shù)初始值方法,其量化外層循環(huán)判斷 準(zhǔn)則方法的特征在于量化實(shí)際所需要的比特?cái)?shù)等于每一幀待分配的比特?cái)?shù)B。具體公式 如下所示bitf = B
11.根據(jù)權(quán)利要求9所述的確定量化編碼當(dāng)前幀所需比特?cái)?shù)估算方法,其量化后譜線(xiàn) 能量最小值計(jì)算方法的特征在于根據(jù)帶有品質(zhì)因子Q的能量閾值下限,設(shè)經(jīng)過(guò)量化后譜 線(xiàn)的絕對(duì)值為Ai,采用如下公式計(jì)算量化后譜線(xiàn)能量的最小值。
全文摘要
本發(fā)明“一種用于數(shù)字音頻信號(hào)壓縮的快速量化方法”是一種用于數(shù)字音頻壓縮的比特分配方法及算法,該方法基于雙層循環(huán)迭代的比特分配模型,根據(jù)輸入數(shù)字音頻信號(hào)和待分配的比特?cái)?shù)目,采用比特估算的數(shù)學(xué)模型,不必經(jīng)量化編碼過(guò)程轉(zhuǎn)而直接估算各個(gè)音頻子帶所占用的比特?cái)?shù),計(jì)算量化器外層循環(huán)迭代初始化參數(shù),并根據(jù)量化后實(shí)際消耗比特?cái)?shù)目和待分配比特?cái)?shù)之差動(dòng)態(tài)調(diào)整外層循環(huán)參數(shù)迭代步長(zhǎng);根據(jù)基于子帶的噪聲能量判斷準(zhǔn)則,計(jì)算內(nèi)層循環(huán)參數(shù)迭代初始化參數(shù),根據(jù)量化后各個(gè)子帶的實(shí)際能量和閾值能量之差,動(dòng)態(tài)調(diào)整迭代步長(zhǎng),搜索最佳量化參數(shù)。本發(fā)明可以有效降低量化模塊的計(jì)算量,減少編碼器的運(yùn)行時(shí)間,且對(duì)于不同曲目風(fēng)格的音頻信號(hào)的編碼速度相對(duì)穩(wěn)定,能夠提高編碼器效率,有利于實(shí)現(xiàn)音頻信號(hào)的快速與實(shí)時(shí)壓縮。
文檔編號(hào)G10L19/02GK101847410SQ20101018682
公開(kāi)日2010年9月29日 申請(qǐng)日期2010年5月31日 優(yōu)先權(quán)日2010年5月31日
發(fā)明者侯亞輝, 呂銳, 張雪, 徐偉掌, 杜偉韜, 楊占昕, 沈向輝 申請(qǐng)人:中國(guó)傳媒大學(xué)廣播電視數(shù)字化教育部工程研究中心