專(zhuān)利名稱(chēng):圖像編碼裝置及圖像編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像編碼裝置、圖像編碼方法及程序,具體地涉及畫(huà)面內(nèi)的自適應(yīng)速率(rate)控制。
背景技術(shù):
已知H.264/MPEG-4AVC (下文中稱(chēng)為H.264)作為用于運(yùn)動(dòng)圖片壓縮記錄的編碼方法。(ITU-T H.264(03/2010)Advanced video coding for generic audiovisual services(針對(duì)通用視聽(tīng)服務(wù)的高級(jí)視頻編碼))根據(jù)H.264,以塊為單位來(lái)對(duì)圖像進(jìn)行編碼,但是針對(duì)各塊的量化值是可變的??刂屏炕狄愿淖兎峙浣o塊的速率可以允許圖像質(zhì)量控制。日本專(zhuān)利特開(kāi)平9-18872號(hào)公報(bào)是改變分配給塊的速率的傳統(tǒng)技術(shù)的示例。根據(jù)日本專(zhuān)利特開(kāi)平9-18872號(hào)公報(bào),塊的諸如亮度平均值、色差平均值、亮度分散值及運(yùn)動(dòng)矢量速率平均值的評(píng)價(jià)值被相乘以計(jì)算該塊的編碼難度,并且對(duì)該塊分配速率。根據(jù)分配的速率,控制量化值。然而,在根據(jù)日本專(zhuān)利特開(kāi)平9-18872號(hào)公報(bào)的控制方法中,用于確定量化值的函數(shù)的計(jì)算的復(fù)雜度較高,作為結(jié)果,這可能增加成本?;谌缦虑疤釋?shí)施根據(jù)日本專(zhuān)利特開(kāi)平9-18872號(hào)公報(bào)的控制方法,即,通過(guò)預(yù)先將多個(gè)評(píng)價(jià)值相乘來(lái)預(yù)先用數(shù)學(xué)公式表示被線性轉(zhuǎn)換為一維值的評(píng)價(jià)指標(biāo)與量化值之間的關(guān)系。因此,非線性地識(shí)別要從各種評(píng)價(jià)指標(biāo)編碼的塊的特性并且由此根據(jù)識(shí)別結(jié)果自適應(yīng)地實(shí)施詳細(xì)速率分配是很困難的。
發(fā)明內(nèi)容
本發(fā)明提供了一種圖像編碼裝置,所述圖像編碼裝置包括:編碼單元,其對(duì)輸入圖像以塊為單位編碼;計(jì)算單元,其針對(duì)所述塊計(jì)算多個(gè)評(píng)價(jià)值;識(shí)別單元,其通過(guò)將由所述計(jì)算單元計(jì)算出的多個(gè)評(píng)價(jià)值與多個(gè)閾值相比較來(lái)生成識(shí)別信息;以及控制器,其基于由所述識(shí)別單元識(shí)別的所述識(shí)別信息來(lái)控制量化參數(shù)。本發(fā)明允許根據(jù)基于多個(gè)評(píng)價(jià)值的視覺(jué)特性對(duì)量化值進(jìn)行精細(xì)控制,從而增強(qiáng)了主觀圖像質(zhì)量。根據(jù)以下參照附圖對(duì)示例性實(shí)施例的描述,本發(fā)明的其他特征將變得清楚。
圖1是例示根據(jù)第一實(shí)施例的圖像編碼裝置的框圖。圖2是根據(jù)第一實(shí)施例的幀編碼的流程圖。圖3是根據(jù)第一實(shí)施例的識(shí)別信息生成的流程圖。圖4是根據(jù)第二實(shí)施例的量化參數(shù)生成的流程圖。圖5是例示根據(jù)第三實(shí)施例的圖像編碼裝置的結(jié)構(gòu)的框圖。圖6是例示根據(jù)第四實(shí)施例的圖像編碼裝置的結(jié)構(gòu)的框圖。圖7例示了根據(jù)第一實(shí)施例的塊的識(shí)別。
圖8例示了對(duì)象與塊之間的關(guān)系。圖9例示了根據(jù)第一實(shí)施例的塊的識(shí)別。圖10例示了根據(jù)第五實(shí)施例的區(qū)域與評(píng)價(jià)值之間的關(guān)系。圖11是例示可應(yīng)用于本發(fā)明的圖像編碼裝置的計(jì)算機(jī)硬件結(jié)構(gòu)示例的框圖。
具體實(shí)施例方式第一實(shí)施例以下將參照附圖來(lái)描述本發(fā)明的第一實(shí)施例。圖1是例示根據(jù)該實(shí)施例的圖像編碼裝置的框圖。參照?qǐng)D1,評(píng)價(jià)值計(jì)算單元101計(jì)算輸入圖像的評(píng)價(jià)值。評(píng)價(jià)值計(jì)算單元101以塊為單位接收?qǐng)D像的輸入并且針對(duì)該塊計(jì)算多個(gè)評(píng)價(jià)值。塊識(shí)別單元102基于多個(gè)評(píng)價(jià)值生成識(shí)別信息??刂破?03基于該識(shí)別信息來(lái)確定針對(duì)塊的量化參數(shù)。編碼單元104對(duì)輸入圖像編碼。編碼單元104以塊為單位接收?qǐng)D像的輸入,并且基于由控制器生成的量化參數(shù)來(lái)對(duì)塊編碼,由此生成編碼流。將參照?qǐng)D2中的流程圖來(lái)詳細(xì)描述該實(shí)施例的圖像編碼裝置的操作。根據(jù)該實(shí)施例,以幀為單位輸入運(yùn)動(dòng)圖片數(shù)據(jù),該運(yùn)動(dòng)圖片數(shù)據(jù)被劃分為塊并且被按照光柵順序來(lái)處理。然而,本發(fā)明并不限于此,例如可以按照作為幀劃分結(jié)果的片(slice)來(lái)輸入圖像。根據(jù)該實(shí)施例的各塊的大小為16X16像素,但是本發(fā)明并不限于此。例如,各塊的大小可以為8X8像素或者32X32像素,或者可以是32X 16像素的不對(duì)稱(chēng)塊。在步驟S201中,評(píng)價(jià)值計(jì)算單元101針對(duì)輸入塊計(jì)算多個(gè)評(píng)價(jià)值。假設(shè)評(píng)價(jià)值與目標(biāo)塊被編碼時(shí)的圖像質(zhì)量指標(biāo)有關(guān)。例如,圖像質(zhì)量指標(biāo)是指塊編碼時(shí)發(fā)生的量化誤差對(duì)人類(lèi)視覺(jué)的影響程度,計(jì)算用于確定程度的評(píng)價(jià)值。根據(jù)該實(shí)施例,屬于塊的像素的亮度平均值以及亮度的復(fù)雜度被計(jì)算作為評(píng)價(jià)值。這里,亮度復(fù)雜度適用屬于塊的像素的亮度值與該塊的亮度平均值之差的大小(絕對(duì)值)的合計(jì)值。然而,本發(fā)明的圖像編碼裝置不限于此,可以?xún)H需要能夠確定對(duì)人類(lèi)視覺(jué)的影響程度的指標(biāo)。例如,亮度的活度(activity)和/或分布可以被計(jì)算作為評(píng)價(jià)值,或者色差的活度、平均值、復(fù)雜度和/或分布可以被計(jì)算。要計(jì)算的評(píng)價(jià)值的數(shù)量不限于兩種類(lèi)型,除了亮度平均值和復(fù)雜度以外,還可以計(jì)算色差的其他評(píng)價(jià)值的平均值。這里術(shù)語(yǔ)“活度”是指通過(guò)獲取進(jìn)一步劃分塊而得到的子塊的像素值的分散值并且選擇所獲取的多個(gè)分散值的最小值來(lái)確定的指標(biāo)。在步驟S202中,塊識(shí)別單元102基于評(píng)價(jià)值生成關(guān)于塊的識(shí)別信息。以下將詳細(xì)描述識(shí)別信息生成方法。在步驟S203中,控制器103基于識(shí)別信息生成對(duì)應(yīng)于塊的屬性的量化參數(shù)。量化參數(shù)生成方法的詳情并不特別限制。然而,例如通過(guò)表查找處理、以一對(duì)一的方式返回對(duì)應(yīng)于塊的識(shí)別結(jié)果的量化值的方法是可行的。在步驟S204中,編碼單元104基于量化參數(shù)對(duì)塊編碼以生成編碼流。在步驟S205中,確定是否幀內(nèi)的全部塊已被編碼。如果全部塊已被編碼(步驟S205中“是”),則幀編碼處理結(jié)束。如果并非全部塊均被編碼(步驟S205中“否”),則處理進(jìn)行到步驟S201,在步驟S201中對(duì)后續(xù)塊進(jìn)行編碼。接下來(lái),將描述根據(jù)該實(shí)施例的關(guān)于塊的識(shí)別信息的生成方法(步驟S202)。根據(jù)該實(shí)施例,使用塊的亮度平均值SI和亮度復(fù)雜度S2兩個(gè)評(píng)價(jià)值。分別針對(duì)評(píng)價(jià)值SI和S2定義閾值序列Tl和T2。針對(duì)η個(gè)評(píng)價(jià)值S1、S2、…、及Sn的組保持閾值序列Τη。圖7例示了當(dāng)亮度平均值及復(fù)雜度被用作評(píng)價(jià)值時(shí)塊的識(shí)別的示例。橫軸表示復(fù)雜度S2,縱軸表示亮度平均值SI,塊被劃分為總共72個(gè)區(qū)域。Tl和Τ2中的各個(gè)包括定義相應(yīng)區(qū)域的一組閾值。在圖 的示例中,Tl=ITl [1],Tl [2],Tl [3],Tl [4],Tl [5],Tl [6],Tl [7],Tl [8],Tl [9]},Τ2= {Τ2 [I],Τ2 [2],Τ2 [3],Τ2 [4],Τ2 [5],Τ2 [6],Τ2 [7],Τ2 [8]}。識(shí)別信息 M 是定義塊位于評(píng)價(jià)值中的哪個(gè)區(qū)域的一組閾值。例如,圖7中的陰影區(qū)域具有M= {Tl [6],Τ2 [5]}。將參照?qǐng)D3中的流程圖來(lái)詳細(xì)描述識(shí)別信息生成方法(步驟S202)。首先,在步驟S301中,將變量i初始化為I。在步驟S302中,將變量j初始化為I。接下來(lái),在步驟S303中,確定評(píng)價(jià)值Si是否屬于由閾值Ti [j]定義的區(qū)域內(nèi)。如果評(píng)價(jià)值Si屬于閾值Tn[i](步驟S303中“是”),則處理移動(dòng)到步驟S306。如果不屬于,則處理移動(dòng)到步驟S304。接下來(lái),在步驟S304中,將變量j增加I。接下來(lái),在步驟S305中,確定是否已經(jīng)將評(píng)價(jià)值Si與全部閾值(屬于閾值序列Ti的全部閾值)相比較。如果評(píng)價(jià)值Si已經(jīng)與全部閾值相比較(步驟S305中“是”),則處理移動(dòng)到步驟S306。如果否,則處理移動(dòng)到步驟S303。在步驟S306中,被確定為屬于評(píng)價(jià)值Si的閾值被代入評(píng)價(jià)值Si中的識(shí)別信息Mi (識(shí)別信息M的第i元素),然后處理移動(dòng)到步驟S307。在步驟S307中,將變量i增加I,處理移動(dòng)到步驟S308。在步驟S308中,確定變量i是否高于n,即是否已經(jīng)將全部η個(gè)評(píng)價(jià)值與閾值相比較。如果全部評(píng)價(jià)值已經(jīng)被比較(步驟S308中“是”),則處理移動(dòng)到步驟S309。如果否(步驟S308中“否”),則處理移動(dòng)到步驟S302。
在步驟S309中,被確定為屬于評(píng)價(jià)值的一組閾值被代入識(shí)別信息Μ,并且識(shí)別信息生成結(jié)束。由此生成的識(shí)別信息表示塊所位于的圖7中的格子區(qū)域的部分。塊的特性以及適合于該特性的量化值與識(shí)別信息相關(guān)聯(lián)以用于圖像質(zhì)量控制。根據(jù)該實(shí)施例,進(jìn)行識(shí)別信息生成從而確定目標(biāo)塊的圖像質(zhì)量劣化程度。例如,人的眼睛對(duì)低空間頻率的圖像上的圖像質(zhì)量劣化比高頻率空間的圖像更敏感。為此,如上所述的具有低復(fù)雜度的塊具有低空間頻率,并且由于量化誤差引起的圖像質(zhì)量劣化對(duì)于人類(lèi)視覺(jué)更易察覺(jué)。另一方面,具有高復(fù)雜度的塊具有高空間頻率,并且圖像質(zhì)量劣化不易察覺(jué)。同樣適用于亮度平均值。暗區(qū)域的圖像質(zhì)量劣化對(duì)于人類(lèi)視覺(jué)容易察覺(jué),亮區(qū)域的圖像質(zhì)量劣化不易察覺(jué)?;诙鄠€(gè)評(píng)價(jià)值并且由于例如圖7的左下區(qū)域的圖像質(zhì)量劣化容易察覺(jué),所以減小量化值以抑制圖像質(zhì)量劣化。同時(shí),增大圖像質(zhì)量劣化不易察覺(jué)的圖7中的右上區(qū)域的量化值以抑制整個(gè)速率的增加。這可以保持相等的比特率并且還提高了主觀圖像質(zhì)量。根據(jù)本實(shí)施例,使用亮度平均值和復(fù)雜度兩種類(lèi)型的評(píng)價(jià)值,以基于關(guān)于二維空間的位置信息來(lái)設(shè)置量化參數(shù)。然而,不言而喻,評(píng)價(jià)值的類(lèi)型的數(shù)量可以被增加至N種類(lèi)型(Ν>2)以擴(kuò)展至N維空間。第二實(shí)施例將描述根據(jù)本發(fā)明的第二實(shí)施例的圖像編碼裝置。該實(shí)施例的圖像編碼裝置的結(jié)構(gòu)與圖1所示的第一實(shí)施例的圖像編碼裝置的結(jié)構(gòu)相同。該實(shí)施例的圖像編碼裝置的操作也與圖2中的流程圖所示的第一實(shí)施例的操作相同。圖3中的流程圖所示的識(shí)別信息生成方法(步驟S202)與第一實(shí)施例的相同。因此,將省略描述。根據(jù)該實(shí)施例,量化參數(shù)生成方法(步驟S203)與第一實(shí)施例的不同在于,不僅使用塊識(shí)別信息而且還使用鄰接塊的復(fù)雜度來(lái)高精度地確定量化參數(shù)。參照?qǐng)D8,將描述鄰接塊的復(fù)雜度的使用效果。圖8例示了在白色背景中具有黑色對(duì)象的圖像。各個(gè)方塊代表16X 16像素塊。塊(白色塊)801是白色背景的一部分,并且因?yàn)閷儆谠搲K的像素的像素值都高,所以該塊的復(fù)雜度低。塊(黑色塊)803是黑色對(duì)象的一部分,并且因?yàn)閷儆谠搲K的像素的像素值都低,所以該塊的復(fù)雜度低。塊802位于白色塊與黑色塊之間的邊界處。塊802包含黑色像素和白色像素的混合。因?yàn)閴K的亮度平均值與像素的亮度之間的差值大并且復(fù)雜度高,所以塊802屬于在圖7的示例中量化參數(shù)被設(shè)置得高的區(qū)域。然而,位于邊界處的如塊802的塊通常呈現(xiàn)易察覺(jué)的圖像質(zhì)量劣化。因此,期望將量化參數(shù)設(shè)置得低。因?yàn)榕c塊802鄰接的塊801和塊803具有如上所述的低復(fù)雜度,所以塊801和塊803與塊802之間的復(fù)雜度差值大。以這種方式,參照鄰接塊的復(fù)雜度,可以確定給定塊是否是具有易察覺(jué)的圖像質(zhì)量劣化的邊界塊,從而使得能夠?qū)ζ湓O(shè)置較高的量化參數(shù)以避免圖像質(zhì)量劣化。將參照?qǐng)D4中的流程圖來(lái)詳細(xì)描述量化參數(shù)生成方法(步驟S203)。首先,在步驟S401中,控制器103基于通過(guò)圖2中的步驟S202中的處理獲取的識(shí)別信息M,參照表來(lái)確定量化參數(shù)。接下來(lái),在步驟S402中,控制器103確定由識(shí)別信息描述的區(qū)域是否是鄰接塊確定區(qū)域。鄰接塊確定區(qū)域是指當(dāng)設(shè)置量化參數(shù)時(shí)用于通過(guò)使用鄰接塊的評(píng)價(jià)值來(lái)校正量化參數(shù)的區(qū)域。為了避免錯(cuò)誤地將具有易察覺(jué)的主觀圖像質(zhì)量劣化的塊的量化參數(shù)設(shè)置得較高,參照鄰接塊的參數(shù)針對(duì)量化參數(shù)被設(shè)置得較高的區(qū)域高精度地確定量化參數(shù)。如果是鄰接塊確定區(qū)域(步驟S402中“是”),則處理移動(dòng)到步驟S403。如果否,則量化參數(shù)生成結(jié)束。接下來(lái),在步驟S403中,控制器103讀取在(稍后描述的)步驟S405中的處理中緩沖的鄰接塊的評(píng)價(jià)值。接下來(lái),在步驟S404中,計(jì)算鄰接塊與目標(biāo)塊的評(píng)價(jià)值之間的差值。接下來(lái),在步驟S405中,控制器103基于該差值來(lái)校正量化參數(shù)。根據(jù)該實(shí)施例,讀取鄰接塊的復(fù)雜度,并且提取差值。如果塊之間的差值高于預(yù)定閾值,則針對(duì)復(fù)雜度從高轉(zhuǎn)變?yōu)榈偷膲K,將量化參數(shù)設(shè)置得比鄰接塊低。這是由于復(fù)雜度轉(zhuǎn)變的塊很有可能是如上所述的對(duì)象的邊界塊,因此圖像質(zhì)量劣化在對(duì)象的邊界處易察覺(jué)。接下來(lái),在步驟S406中,目標(biāo)塊的評(píng)價(jià)值被緩沖。根據(jù)該實(shí)施例,通過(guò)該處理,可以確定目標(biāo)塊是否是圖像質(zhì)量劣化易察覺(jué)的邊界塊。由此,將量化參數(shù)設(shè)置得較高可以避免圖像質(zhì)量劣化。第三實(shí)施例將描述根據(jù)第三實(shí)施例的圖像編碼裝置。該實(shí)施例使用塊的亮度平均值、亮度復(fù)雜度以及預(yù)測(cè)信息三個(gè)評(píng)價(jià)值。術(shù)語(yǔ)“預(yù)測(cè)信息”是指諸如H.264編碼方法中的運(yùn)動(dòng)矢量信息和鄰接像素值信息的用于預(yù)測(cè)編碼的數(shù)據(jù)。圖5是例示該實(shí)施例的圖像編碼裝置的結(jié)構(gòu)的框圖。參照?qǐng)D5,預(yù)測(cè)單元501基于輸入圖像進(jìn)行用于預(yù)測(cè)編碼的預(yù)測(cè)處理,評(píng)價(jià)值計(jì)算單元502計(jì)算輸入圖像的評(píng)價(jià)值。評(píng)價(jià)值計(jì)算單元502以塊為單位接收?qǐng)D像的輸入,針對(duì)該塊計(jì)算多個(gè)評(píng)價(jià)值,并且計(jì)算與預(yù)測(cè)單元501的預(yù)測(cè)處理結(jié)果相關(guān)聯(lián)的預(yù)測(cè)信息。根據(jù)該實(shí)施例,運(yùn)動(dòng)矢量的大小被應(yīng)用作為從預(yù)測(cè)單元501獲取的信息。然而,本發(fā)明并不限于此。塊識(shí)別單元503基于多個(gè)評(píng)價(jià)值識(shí)別塊??刂破?04基于識(shí)別信息確定針對(duì)塊的量化參數(shù)。轉(zhuǎn)換/量化單元505對(duì)塊內(nèi)的像素?cái)?shù)據(jù)進(jìn)行頻率轉(zhuǎn)換處理,然后基于由控制器確定的量化參數(shù)來(lái)量化。熵編碼單元506對(duì)在轉(zhuǎn)換/量化單元505中獲取的量化數(shù)據(jù)進(jìn)行熵編碼以生成編碼流。將參照?qǐng)D2中的流程圖來(lái)詳細(xì)描述該實(shí)施例的圖像編碼裝置的操作。首先,在步驟S201中,評(píng)價(jià)值計(jì)算單元101針對(duì)輸入塊計(jì)算多個(gè)評(píng)價(jià)值。根據(jù)該實(shí)施例,除了第一實(shí)施例的評(píng)價(jià)值外,還使用由預(yù)測(cè)單元501獲取的運(yùn)動(dòng)矢量的大小(絕對(duì)值)。接下來(lái),將參照?qǐng)D3中的流程圖來(lái)詳細(xì)描述識(shí)別信息生成方法(步驟S202)。因?yàn)殛P(guān)于步驟S301和步驟S302的描述與第一實(shí)施例的相同,所以將省略描述。接下來(lái),在步驟S303中,塊識(shí)別單元503確定評(píng)價(jià)值Si是否屬于由閾值Ti[j]定義的區(qū)域。根據(jù)該實(shí)施例,與第一實(shí)施例相同,評(píng)價(jià)值SI是亮度平均值,評(píng)價(jià)值S2是亮度復(fù)雜度,并且評(píng)價(jià)值S3是運(yùn)動(dòng)矢量的大小。與第一實(shí)施例相同,閾值序列Tn分別保持對(duì)應(yīng)于評(píng)價(jià)值S1、S2、S3的T1、T2、T3。如果評(píng)價(jià)值Si屬于閾值Tn[i](步驟S303中“是”),則處理移動(dòng)到步驟S306。如果評(píng)價(jià)值Si不屬于閾值Tn [i],則處理移動(dòng)到步驟S304。因?yàn)椴襟ES304、步驟S305、步驟S306、步驟S307、步驟S308和步驟S309與第一實(shí)施例中的相同,所以將省略描述。因?yàn)閳D2中的處理與第二實(shí)施例中的相同,所以將省略描述。進(jìn)行該實(shí)施例中的識(shí)別信息生成以確定目標(biāo)塊的圖像質(zhì)量劣化程度。因?yàn)殛P(guān)于復(fù)雜度和亮度平均值的描述與第一實(shí)施例中的相同,所以將省略描述。該實(shí)施例利用以下事實(shí):人的眼睛可能不會(huì)很好跟隨具有較高運(yùn)動(dòng)矢量絕對(duì)值的區(qū)域,即對(duì)象正在劇烈運(yùn)動(dòng)并且圖像質(zhì)量劣化不易識(shí)別的區(qū)域?;诙鄠€(gè)評(píng)價(jià)值,減小圖像質(zhì)量劣化易察覺(jué)的區(qū)域的量化值以抑制圖像質(zhì)量劣化。同時(shí),增大圖像質(zhì)量劣化不易察覺(jué)的區(qū)域的量化值以抑制整個(gè)速率的增加。這可以保持相等的比特率并且還改善了主觀圖像質(zhì)量。第四實(shí)施例將描述根據(jù)第四實(shí)施例的圖像編碼裝置。圖6是例示本實(shí)施例的圖像編碼裝置的結(jié)構(gòu)的框圖。參照?qǐng)D6,預(yù)測(cè)單元601通過(guò)基于輸入圖像進(jìn)行用于預(yù)測(cè)編碼的預(yù)測(cè)處理而生成預(yù)測(cè)誤差。預(yù)測(cè)緩沖器607連接至預(yù)測(cè)單元601。預(yù)測(cè)緩沖器607存儲(chǔ)關(guān)于緊接需要預(yù)測(cè)處理之前的一列上的塊的預(yù)測(cè)信息。評(píng)價(jià)值計(jì)算單元602計(jì)算輸入圖像的評(píng)價(jià)值。評(píng)價(jià)值計(jì)算單元602以塊為單位接收?qǐng)D像的輸入,針對(duì)該塊計(jì)算多個(gè)評(píng)價(jià)值,并且計(jì)算與預(yù)測(cè)單元601的預(yù)測(cè)處理結(jié)果相關(guān)聯(lián)的評(píng)價(jià)值。塊識(shí)別單元603基于多個(gè)評(píng)價(jià)值識(shí)別塊。控制器604基于識(shí)別信息確定針對(duì)塊的量化參數(shù)。轉(zhuǎn)換/量化單元605對(duì)由預(yù)測(cè)單元601生成的預(yù)測(cè)誤差進(jìn)行頻率轉(zhuǎn)換處理,然后基于由控制器確定的量化參數(shù)來(lái)進(jìn)行量化。熵編碼單元606對(duì)從轉(zhuǎn)換/量化單元605獲取的量化后的數(shù)據(jù)進(jìn)行熵編碼,以生成編碼流。因?yàn)樵搶?shí)施例的圖像編碼裝置的操作、識(shí)別信息生成方法(圖2中的步驟S202)以及量化參數(shù)生成方法(圖2中的步驟S203)與第三實(shí)施例的相同,所以將省略描述。與第二實(shí)施例相同,為了使用關(guān)于目標(biāo)塊和鄰接塊的識(shí)別信息來(lái)進(jìn)行圖像質(zhì)量控制,可能需要直接緩沖關(guān)于過(guò)去識(shí)別的塊的識(shí)別結(jié)果或者塊的評(píng)價(jià)值。當(dāng)按照光柵順序處理塊時(shí),例如可能需要保持針對(duì)一個(gè)塊行的信息以使用關(guān)于目標(biāo)塊上方的鄰接塊的信息。這需要針對(duì)其的專(zhuān)用存儲(chǔ)器,因此增加了成本。根據(jù)該實(shí)施例,不用于幀內(nèi)編碼的幀間緩沖存儲(chǔ)器(預(yù)測(cè)緩沖器607)被用于幀內(nèi)編碼。結(jié)果,不需要存儲(chǔ)塊信息的單獨(dú)存儲(chǔ)器,即使在考慮到用于具有相對(duì)高的比特率的幀內(nèi)編碼的鄰接塊的特性的情況下也能夠進(jìn)行高精度圖像質(zhì)量控制,并且實(shí)現(xiàn)了高圖像質(zhì)量控制效果。為了進(jìn)行畫(huà)面間編碼,幀間緩沖存儲(chǔ)器可以存儲(chǔ)運(yùn)動(dòng)矢量及預(yù)測(cè)誤差中的至少一者。為了進(jìn)行畫(huà)面內(nèi)編碼,幀間緩沖存儲(chǔ)器可以存儲(chǔ)平均值、活度、復(fù)雜度和分布中的至少
一者O第五實(shí)施例將描述根據(jù)本發(fā)明的第五實(shí)施例的圖像編碼裝置。該實(shí)施例的圖像編碼裝置的結(jié)構(gòu)與圖1所示的根據(jù)本發(fā)明的第一實(shí)施例的圖像編碼裝置的結(jié)構(gòu)相同。因?yàn)樵搶?shí)施例的圖像編碼裝置的操作也與圖2中的流程圖所示的第一實(shí)施例的操作相同,所以將省略描述。根據(jù)該實(shí)施例,評(píng)價(jià)值SI和S2以及相應(yīng)的閾值序列Tl和T2也與第一實(shí)施例中的相同。然而,如圖9所示,該實(shí)施例與第一實(shí)施例的不同在于,由實(shí)線或虛線表示的作為塊的識(shí)別結(jié)果的區(qū)域的數(shù)量不是72而是13 {Rl, R2,...,R13}。換言之,第一實(shí)施例的多個(gè)區(qū)域被合并。針對(duì)圖9所示的區(qū)域,在圖2中的步驟S204的處理中,量化參數(shù)可以被不同地改變。在陰影區(qū)域中,根據(jù)基準(zhǔn)值來(lái)改變量化參數(shù)的加權(quán)。在非陰影區(qū)域(R9)中,不根據(jù)基準(zhǔn)值來(lái)改變量化參數(shù)。這里術(shù)語(yǔ)“基準(zhǔn)值”是指給予幀的默認(rèn)量化參數(shù)。陰影區(qū)域中被實(shí)線圍繞的區(qū)域是具有高復(fù)雜度的區(qū)域或亮區(qū)域。因?yàn)檫@些區(qū)域中的圖像質(zhì)量劣化不易察覺(jué),所以量化參數(shù)可以設(shè)置得比基準(zhǔn)值高以減小速率。另一方面,由虛線圍繞的區(qū)域是圖像質(zhì)量劣化易察覺(jué)的區(qū)域。因此,將量化參數(shù)設(shè)置得比基準(zhǔn)值低以改善圖像質(zhì)量。針對(duì)圖像質(zhì)量的詳細(xì)控制,圖像質(zhì)量劣化易察覺(jué)的區(qū)域被特別地精確劃分。簡(jiǎn)單通過(guò)與閾值的比較來(lái)確定塊的標(biāo)識(shí),這通常使得處理比第一實(shí)施例更簡(jiǎn)單。更具體地,雖然在第一實(shí)施例中需要最多72個(gè)比較處理用于識(shí)別72個(gè)區(qū)域,但是如圖10所示,需要最多13個(gè)比較處理以通過(guò)按照Rl、R2...、及R13的順序的區(qū)域的標(biāo)識(shí)來(lái)識(shí)別13個(gè)區(qū)域。根據(jù)該實(shí)施例,例如提供這13個(gè)劃分區(qū)域。然而,本發(fā)明并不限于此??梢栽黾觿澐謪^(qū)域的數(shù)量用于對(duì)圖像質(zhì)量的更精確的控制。第六實(shí)施例根據(jù)上述實(shí)施例通過(guò)硬件實(shí)現(xiàn)圖1、圖5和圖6中所示的處理區(qū)域。然而,要在圖1、圖5和圖6中所示的處理區(qū)域中實(shí)現(xiàn)的處理也可以由計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)。圖11是例示可應(yīng)用于根據(jù)上述實(shí)施例的任意一者的顯示器的計(jì)算機(jī)硬件結(jié)構(gòu)示例的框圖。CPUl 101通過(guò)使用RAMl 102和/或ROMl 103中存儲(chǔ)的計(jì)算機(jī)程序和/或數(shù)據(jù)來(lái)整體控制計(jì)算機(jī),并且執(zhí)行上述由根據(jù)上述實(shí)施例的圖像處理裝置執(zhí)行的處理相同的處理。換言之,CPU1101可以用作圖1、圖5和圖6中所示的處理區(qū)域。RAMl 102具有用于臨時(shí)存儲(chǔ)從外部存儲(chǔ)器1106加載的計(jì)算機(jī)程序和/或數(shù)據(jù)和/或通過(guò)I/F (接口)1107外部獲取的數(shù)據(jù)。RAM1102具有要被CPU1101用來(lái)執(zhí)行處理的工作區(qū)。換言之,RAMl 102可以例如被分配作為幀存儲(chǔ)器,或者可以根據(jù)需要提供其他區(qū)域。R0M1103存儲(chǔ)針對(duì)計(jì)算機(jī)的設(shè)置數(shù)據(jù)和/或引導(dǎo)程序。操作單元1104包括例如鍵盤(pán)和/或鼠標(biāo),并且可以由計(jì)算機(jī)的用戶(hù)操作以向CPU1101輸入指令。主顯示器1105顯示CPU1101的處理結(jié)果。主顯示器1105可以包括諸如液晶顯示器的顯示裝置。外部存儲(chǔ)器1106是諸如硬盤(pán)驅(qū)動(dòng)器的大容量信息存儲(chǔ)設(shè)備。外部存儲(chǔ)器1106存儲(chǔ)操作系統(tǒng)(OS)和/或用于使CPU1101實(shí)現(xiàn)圖1、圖5和圖6中所示的功能的計(jì)算機(jī)程序。外部存儲(chǔ)器1106可以存儲(chǔ)要處理的圖像數(shù)據(jù)。存儲(chǔ)在外部存儲(chǔ)器1106中的計(jì)算機(jī)程序或多個(gè)程序和/或數(shù)據(jù)根據(jù)需要在CPUl 101的控制下被加載到RAMl 102,并且被CPUl 101處理。諸如LAN和互聯(lián)網(wǎng)的網(wǎng)絡(luò)以及諸如投影儀和顯示裝置的其他裝置可以連接至I/F1107。計(jì)算機(jī)可以通過(guò)I/F1107獲取并發(fā)送各種信息??偩€1108連接這些部件。根據(jù)針對(duì)上述操作的流程圖由CPU1101集中控制這些部件的操作。其他實(shí)施例根據(jù)本發(fā)明,可以向系統(tǒng)提供記錄執(zhí)行上述功能的計(jì)算機(jī)程序的代碼的存儲(chǔ)介質(zhì),并且系統(tǒng)可以讀取并執(zhí)行計(jì)算機(jī)程序的代碼。在這種情況下,從存儲(chǔ)介質(zhì)讀取的計(jì)算機(jī)程序的代碼直接實(shí)現(xiàn)上述實(shí)施例的功能,存儲(chǔ)有計(jì)算機(jī)程序的代碼的存儲(chǔ)介質(zhì)被包括在本發(fā)明中。本發(fā)明包括計(jì)算機(jī)上運(yùn)行的操作系統(tǒng)(OS)基于來(lái)自程序代碼的指令進(jìn)行部分或全部實(shí)際處理并且該處理實(shí)現(xiàn)上述功能的情況??梢园凑杖缦聛?lái)實(shí)現(xiàn)本發(fā)明。即,從存儲(chǔ)介質(zhì)讀取的計(jì)算機(jī)程序代碼可以被寫(xiě)入插入到計(jì)算機(jī)的功能擴(kuò)展卡或連接至計(jì)算機(jī)的功能擴(kuò)展單元中設(shè)置的存儲(chǔ)器?;趤?lái)自計(jì)算機(jī)程序代碼的指令,例如設(shè)置在功能擴(kuò)展卡或功能擴(kuò)展單元中的CPU執(zhí)行部分或全部實(shí)際處理以實(shí)現(xiàn)上述功能。當(dāng)本發(fā)明應(yīng)用于存儲(chǔ)介質(zhì)時(shí),存儲(chǔ)介質(zhì)存儲(chǔ)對(duì)應(yīng)于上述流程圖的計(jì)算機(jī)程序代碼。雖然參照示例性實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,但是應(yīng)當(dāng)理解,本發(fā)明并不限于所公開(kāi)的示例性實(shí)施例。應(yīng)當(dāng)對(duì)所附權(quán)利要求的范圍給予最寬的解釋?zhuān)允蛊浜w所有這些變型例以及等同的結(jié)構(gòu)和功能。
權(quán)利要求
1.一種圖像編碼裝置,該圖像編碼裝置包括: 編碼單元,其對(duì)輸入圖像以塊為單位編碼; 計(jì)算單元,其針對(duì)所述塊計(jì)算多個(gè)評(píng)價(jià)值; 識(shí)別單元,其通過(guò)將由所述計(jì)算單元計(jì)算出的多個(gè)評(píng)價(jià)值與多個(gè)閾值相比較來(lái)生成識(shí)別信息;以及 控制器,其基于由所述識(shí)別單元識(shí)別的所述識(shí)別信息來(lái)控制量化參數(shù)。
2.根據(jù)權(quán)利要求1所述的圖像編碼裝置,其中,所述識(shí)別信息是關(guān)于N維空間的位置信肩、O
3.根據(jù)權(quán)利要求1所述的圖像編碼裝置,其中,所述控制器基于所述識(shí)別信息參照鄰接塊的評(píng)價(jià)值來(lái)控制量化參數(shù)。
4.根據(jù)權(quán)利要求1所述的圖像編碼裝置,其中,所述多個(gè)評(píng)價(jià)值是活度、復(fù)雜度、平均值、分布、運(yùn)動(dòng)矢量及預(yù)測(cè)誤差中的一者。
5.根據(jù)權(quán)利要求1所述的圖像編碼裝置,所述編碼裝置還包括: 存儲(chǔ)單元,其針對(duì)畫(huà)面間編碼存儲(chǔ)運(yùn)動(dòng)矢量及預(yù)測(cè)誤差中的至少一者,并且針對(duì)畫(huà)面內(nèi)編碼存儲(chǔ)平均值、活度、復(fù)雜度、分布中的至少一者。
6.一種圖像編碼裝置中的圖像編碼方法,所述圖像編碼方法包括: 編碼步驟,對(duì)輸入圖像以塊為單位編碼; 計(jì)算步驟,針對(duì)所述塊計(jì)算多個(gè)評(píng)價(jià)值; 識(shí)別步驟,通過(guò)將所述計(jì)算步驟計(jì)算出的多個(gè)評(píng)價(jià)值與多個(gè)閾值相比較來(lái)生成識(shí)別信息;以及 控制步驟,基于所述識(shí)別步驟識(shí)別的所述識(shí)別信息來(lái)控制量化參數(shù)。
全文摘要
本發(fā)明提供一種圖像編碼裝置及圖像編碼方法。所述圖像編碼裝置包括編碼單元,其對(duì)輸入圖像以塊為單位編碼;計(jì)算單元,其針對(duì)所述塊計(jì)算多個(gè)評(píng)價(jià)值;識(shí)別單元,其通過(guò)將由所述計(jì)算單元計(jì)算出的多個(gè)評(píng)價(jià)值與多個(gè)閾值相比較來(lái)生成識(shí)別信息;以及控制器,其基于由所述識(shí)別單元識(shí)別的所述識(shí)別信息來(lái)控制量化參數(shù)。
文檔編號(hào)H04N7/26GK103188493SQ20121058106
公開(kāi)日2013年7月3日 申請(qǐng)日期2012年12月27日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者大川浩司, 樋渡咲 申請(qǐng)人:佳能株式會(huì)社