專(zhuān)利名稱(chēng):視頻編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻編碼器以及為此的視頻編碼方法,具體但不是排他地來(lái)說(shuō),涉及根據(jù)H.264視頻編碼標(biāo)準(zhǔn)的視頻編碼。
背景技術(shù):
近年來(lái),視頻信號(hào)的數(shù)字存儲(chǔ)和分發(fā)的使用變得越來(lái)越流行。為了減少傳送數(shù)字視頻信號(hào)所需的帶寬,眾所周知的是采用包含視頻數(shù)據(jù)壓縮的有效數(shù)字視頻編碼,由此可實(shí)質(zhì)上降低數(shù)字視頻信號(hào)的數(shù)據(jù)率。
為了確?;ネㄐ裕曨l編碼標(biāo)準(zhǔn)在促進(jìn)許多專(zhuān)業(yè)的和消費(fèi)類(lèi)的應(yīng)用中采用數(shù)字視頻方面起了關(guān)鍵作用。大多數(shù)有影響的標(biāo)準(zhǔn)在傳統(tǒng)上由國(guó)際電信聯(lián)盟(ITU-T)或者ISO/IEC(國(guó)際標(biāo)準(zhǔn)化組織/國(guó)際電工委員會(huì))的MPEG(運(yùn)動(dòng)圖像專(zhuān)家組)委員會(huì)開(kāi)發(fā)。稱(chēng)作建議的ITU-T標(biāo)準(zhǔn)通常針對(duì)實(shí)時(shí)通信(例如電視會(huì)議),而大多數(shù)MPEG標(biāo)準(zhǔn)則對(duì)于存儲(chǔ)(例如對(duì)于數(shù)字通用盤(pán)(DVD))和廣播(例如對(duì)于數(shù)字視頻廣播(DVB)標(biāo)準(zhǔn))進(jìn)行了優(yōu)化。
目前,最廣泛使用的視頻壓縮技術(shù)之一稱(chēng)作MPEG-2(運(yùn)動(dòng)圖像專(zhuān)家組)標(biāo)準(zhǔn)。MPEG-2是基于塊的壓縮方案,其中,幀被分為多個(gè)塊,每個(gè)塊包含八個(gè)垂直和八個(gè)水平像素。對(duì)于亮度數(shù)據(jù)的壓縮,各塊采用離散余弦變換(DCT)單獨(dú)壓縮,然后是量化,它把已變換數(shù)據(jù)值的有效數(shù)量減少到零。對(duì)于色度數(shù)據(jù)的壓縮,色度數(shù)據(jù)的數(shù)量通常首先通過(guò)下降抽樣來(lái)減少,使得對(duì)于每四個(gè)亮度塊,兩個(gè)色度塊被獲取(4:2:0格式),它們類(lèi)似地采用DCT和量化來(lái)壓縮。僅基于幀內(nèi)壓縮的幀稱(chēng)作幀內(nèi)編碼幀(I幀)。
除了幀內(nèi)壓縮之外,MPEG-2還采用幀間壓縮進(jìn)一步降低數(shù)據(jù)率。幀間壓縮包括根據(jù)先前的I幀產(chǎn)生預(yù)測(cè)幀(P幀)。另外,I和P幀通常被插入雙向預(yù)測(cè)幀(B幀),其中,壓縮通過(guò)僅傳送B幀與周?chē)腎和P幀之間的差異來(lái)實(shí)現(xiàn)。另外,MPEG-2采用運(yùn)動(dòng)估算,其中,在不同位置在后續(xù)幀中找到的一幀的宏塊的圖像僅通過(guò)使用運(yùn)動(dòng)矢量來(lái)傳遞。
由于這些壓縮技術(shù),標(biāo)準(zhǔn)電視演播室廣播質(zhì)量等級(jí)的視頻信號(hào)能夠以大約2-4Mbps的數(shù)據(jù)率傳送。
最近,出現(xiàn)了稱(chēng)作H.26L的新ITU-T標(biāo)準(zhǔn)。H.26L因其與現(xiàn)有標(biāo)準(zhǔn)、如MPEG-2相比的優(yōu)越編碼效率而得到廣泛的認(rèn)可。雖然H.26L的增益一般與圖片大小成比例地降低,但它在大范圍應(yīng)用中運(yùn)用的潛力是毫無(wú)疑問(wèn)的。這種潛力通過(guò)負(fù)責(zé)最終確定H.26L作為新的聯(lián)合ITU-T/MPEG標(biāo)準(zhǔn)的聯(lián)合視頻組(JVT)論壇的成立而得到認(rèn)可。新標(biāo)準(zhǔn)稱(chēng)作H.264或MPEG-4AVC(高級(jí)視頻編碼)。此外,基于H.264的解決方案在其它標(biāo)準(zhǔn)化團(tuán)體、如DVB和DVD論壇中正被考慮。
H.264標(biāo)準(zhǔn)采用從已確立標(biāo)準(zhǔn)、如MPEG-2已知的基于塊的運(yùn)動(dòng)補(bǔ)償混合變換編碼的相同原理。因此,H.264語(yǔ)法被組織為諸如圖片、片和宏塊首標(biāo)之類(lèi)的首標(biāo)以及諸如運(yùn)動(dòng)矢量、塊變換系數(shù)、量化器標(biāo)度等的數(shù)據(jù)的常用分級(jí)結(jié)構(gòu)。但是,H.264標(biāo)準(zhǔn)分開(kāi)了表示視頻數(shù)據(jù)的內(nèi)容的視頻編碼層(VCL)和格式化數(shù)據(jù)并提供首標(biāo)信息的網(wǎng)絡(luò)適配層(NAL)。
此外,H264允許編碼參數(shù)的更為增多的選擇。例如,它允許對(duì)16×16宏塊的更精細(xì)劃分和處理,由此可對(duì)尺寸小到4×4的宏塊的分段執(zhí)行例如運(yùn)動(dòng)補(bǔ)償過(guò)程。樣本塊的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的選擇過(guò)程還可包括若干已存儲(chǔ)的先前解碼的圖片,而不只是相鄰圖片。甚至通過(guò)單幀中的幀內(nèi)編碼,能夠利用來(lái)自相同幀的先前解碼樣本來(lái)形成塊的預(yù)測(cè)。在運(yùn)動(dòng)補(bǔ)償之后所產(chǎn)生的預(yù)測(cè)差錯(cuò)還可根據(jù)4×4塊大小而不是傳統(tǒng)的8×8大小來(lái)變換和量化。
H.264標(biāo)準(zhǔn)可被認(rèn)為是MPEG-2視頻編碼語(yǔ)法的超集,因?yàn)樗褂靡曨l數(shù)據(jù)的相同全局結(jié)構(gòu),同時(shí)擴(kuò)展可能的編碼判定和參數(shù)的數(shù)量。具有各種編碼判定的結(jié)果是,可實(shí)現(xiàn)比特率與圖片質(zhì)量之間的良好折衷。但是,雖然大家普遍知道,盡管H.264標(biāo)準(zhǔn)可顯著降低基于塊的編碼的典型偽像,但它也會(huì)加重其它偽像。
因此,H.264允許各種編碼參數(shù)的可能值的數(shù)量增加的事實(shí)產(chǎn)生改進(jìn)編碼過(guò)程的提高的可能性,但也導(dǎo)致對(duì)視頻編碼參數(shù)的選擇的增加的敏感度。與其它標(biāo)準(zhǔn)相似,H.264不指定用于選擇視頻編碼參數(shù)的規(guī)范程序,而是通過(guò)參考實(shí)現(xiàn)來(lái)描述可用來(lái)選擇視頻編碼參數(shù)以便實(shí)現(xiàn)編碼效率、視頻質(zhì)量和實(shí)現(xiàn)的實(shí)用性之間適當(dāng)折衷的多個(gè)標(biāo)準(zhǔn)。
但是,所描述的標(biāo)準(zhǔn)可能不一定產(chǎn)生編碼參數(shù)的最佳或適當(dāng)選擇。例如,標(biāo)準(zhǔn)可能不會(huì)引起選擇對(duì)于視頻信號(hào)的特性是最佳或理想的視頻編碼參數(shù),或者標(biāo)準(zhǔn)可能基于獲得不適合當(dāng)前應(yīng)用的編碼信號(hào)的特性。例如,大家普遍知道,雖然H.264可顯著降低MPEG-2編碼的部分典型偽像,但它也會(huì)產(chǎn)生其它偽像。一種這樣的偽像是紋理的部分消除,導(dǎo)致部分圖片區(qū)的類(lèi)似塑膠或拖尾狀外觀。另一個(gè)是編碼偽像,在具有高平坦度的圖片區(qū)中建立編碼噪聲。這對(duì)于較大的圖片格式、如高清晰度電視尤為明顯。
因此,用于視頻編碼的改進(jìn)系統(tǒng)是有利的,具體來(lái)說(shuō),利用新興標(biāo)準(zhǔn)、如H264改進(jìn)視頻編碼的可能性的改進(jìn)視頻編碼系統(tǒng)是有利的。
發(fā)明概述因此,本發(fā)明設(shè)法單獨(dú)或以任何組合方式來(lái)減少、減輕或消除上述缺點(diǎn)的一個(gè)或多個(gè)。
根據(jù)本發(fā)明的第一方面,提供一種用于對(duì)視頻信號(hào)編碼的視頻編碼器,包括用于確定具有空間頻率特性的圖片區(qū)域的部件;用于響應(yīng)空間頻率特性來(lái)設(shè)置圖片區(qū)域的編碼塊大小的部件;以及用于采用圖片區(qū)域的編碼塊大小來(lái)對(duì)視頻信號(hào)編碼的部件。
本發(fā)明允許改進(jìn)的視頻編碼性能,具體來(lái)說(shuō),可實(shí)現(xiàn)改進(jìn)的視頻質(zhì)量和/或降低的編碼數(shù)據(jù)率。本發(fā)明人已經(jīng)認(rèn)識(shí)到,優(yōu)選編碼塊大小取決于空間頻率特性。本發(fā)明允許根據(jù)基于局部空間頻率特性的塊編碼大小的局部調(diào)整,對(duì)于圖片實(shí)現(xiàn)改進(jìn)的質(zhì)量和/或數(shù)據(jù)率??刹捎眠m合局部空間頻率特性的塊編碼大小的動(dòng)態(tài)和局部調(diào)整。塊編碼大小的局部?jī)?nèi)容相關(guān)限制可用來(lái)改進(jìn)視頻編碼的性能。明確地說(shuō),本發(fā)明允許編碼塊大小被設(shè)置,使得引起高紋理信息對(duì)于具有表明高紋理度的空間頻率特性的圖片區(qū)域被保存。這樣,本發(fā)明實(shí)現(xiàn)紋理信息的損失方面的顯著減小,因而減少包括例如H.264視頻編碼器在內(nèi)的許多視頻編碼器中遭遇的塑化或紋理拖尾效應(yīng)。作為替代和補(bǔ)充,本發(fā)明允許編碼塊大小被設(shè)置,使得對(duì)于具有表明高平坦度的空間頻率特性的圖片區(qū)域產(chǎn)生減少的基于塊編碼的偽像(例如分塊偽像)。這樣,本發(fā)明實(shí)現(xiàn)包括例如H.264視頻編碼器在內(nèi)的許多視頻編碼器中遭遇的編碼缺陷方面的顯著降低。
根據(jù)本發(fā)明的一個(gè)特征,編碼塊大小為運(yùn)動(dòng)估算塊大小。因此,本發(fā)明使運(yùn)動(dòng)估算塊大小的優(yōu)化能夠適合圖片區(qū)域的局部空間頻率特性。
根據(jù)本發(fā)明的另一個(gè)特征,用于確定圖片區(qū)域的部件可用于將圖片區(qū)域確定為空間頻率特性滿足空間頻率標(biāo)準(zhǔn)的一組像素。圖片區(qū)域可被確定,使得它具有相同或相似的空間頻率屬性,因而適合于相同的編碼塊大小??臻g頻率標(biāo)準(zhǔn)可直接與給定編碼塊大小關(guān)聯(lián)。例如,圖片區(qū)域可被確定為空間頻率特性滿足與預(yù)定編碼塊大小對(duì)應(yīng)的給定特性的一個(gè)或多個(gè)圖片區(qū)。
根據(jù)本發(fā)明的另一個(gè)特征,空間頻率標(biāo)準(zhǔn)是,空間頻率分布包括對(duì)于頻率門(mén)限以下的空間頻率高于能量門(mén)限的能量集中度。低頻分量的高集中度表示圖片的高平坦度。可以看出,與塊大小相關(guān)的編碼偽像、如分塊偽像往往在高平坦度的區(qū)域中出現(xiàn)。這可通過(guò)適當(dāng)選擇編碼塊大小來(lái)減輕。因此,可有助于和/或提高編碼偽像和缺陷的減輕。與空間頻率特性關(guān)聯(lián)的頻率屬性例如可通過(guò)頻率分析、如離散余弦變換(DCT)或者通過(guò)確定周?chē)袼氐姆讲疃攘縼?lái)進(jìn)行。
根據(jù)本發(fā)明的另一個(gè)特征,用于設(shè)置編碼塊大小的部件可用于將編碼塊大小設(shè)置為預(yù)定值。這允許簡(jiǎn)單便捷地實(shí)現(xiàn)設(shè)置編碼塊大小的方式。多個(gè)編碼塊大小值可預(yù)先確定并與特定空間頻率特性關(guān)聯(lián)。查找表例如可用于將空間頻率特性與預(yù)定編碼塊大小相關(guān)。
根據(jù)本發(fā)明的另一個(gè)特征,用于確定圖片區(qū)域的部件包括用于響應(yīng)圖片區(qū)域中的像素值的方差來(lái)確定空間頻率特性的部件。這提供了圖片區(qū)域的空間頻率特性仍然易于實(shí)現(xiàn)并且不要求任何變換的良好指示。
根據(jù)本發(fā)明的另一個(gè)特征,用于設(shè)置編碼塊大小的部件包括用于響應(yīng)空間頻率特性來(lái)產(chǎn)生可允許編碼塊大小的集合的部件;以及用于編碼的部件包括用于從可允許編碼塊大小集合中選取編碼塊大小的部件。視頻編碼可采用響應(yīng)許多參數(shù)(空間頻率特性是其中之一)所設(shè)置的編碼塊大小。明確地說(shuō),空間頻率特性可用于將可能的編碼塊大小限制為有限集合,可響應(yīng)其它參數(shù)從這個(gè)有限集合中選擇編碼塊大小。這允許編碼塊大小的靈活選擇以適合視頻編碼,還允許響應(yīng)空間頻率特性來(lái)控制視頻編碼器的性能。
根據(jù)本發(fā)明的另一個(gè)特征,視頻編碼器還包括用于確定具有第二空間頻率特性的第二圖片區(qū)域的部件;用于響應(yīng)第二空間頻率特性來(lái)設(shè)置第二圖片區(qū)域的第二編碼塊大小的部件;其中用于對(duì)視頻信號(hào)編碼的部件可用于采用第二圖片區(qū)域的第二編碼塊大小來(lái)對(duì)視頻信號(hào)編碼。用于處理第二圖片區(qū)域的部件可以是用于處理第一圖片區(qū)域的相同部件。圖片區(qū)域可例如在不同的功能模塊中并行處理,或者在相同的功能模塊中按順序處理。最好是確定多個(gè)圖片區(qū)域,以及對(duì)于各圖片區(qū)域?qū)⒕幋a塊大小設(shè)置為適合那個(gè)區(qū)域的空間頻率特性。這允許對(duì)于局部空間頻率特性并因而對(duì)于改進(jìn)的視頻編碼來(lái)優(yōu)化編碼塊大小。
根據(jù)本發(fā)明的另一個(gè)特征,空間頻率特性包括圖片區(qū)域中平坦度的指示,以及用于設(shè)置編碼塊大小的部件可用于為增加的平坦度增加編碼塊大小??梢钥吹剑哂懈咂教苟鹊膱D片區(qū)對(duì)于編碼缺陷、如基于塊的編碼的偽像敏感。基于塊的偽像可能例如是分塊偽像。本發(fā)明的發(fā)明人認(rèn)識(shí)到,這種效應(yīng)可通過(guò)增加編碼塊大小來(lái)減輕。因此,可獲得改進(jìn)的視頻編碼質(zhì)量。
根據(jù)本發(fā)明的另一個(gè)特征,空間頻率特性包括圖片區(qū)域中均勻度的指示,以及用于設(shè)置編碼塊大小的部件可用于為增加的均勻度增加編碼塊大小。可以看到,具有高均勻度的圖片區(qū)對(duì)于編碼缺陷、如紋理?yè)p失或拖尾敏感。本發(fā)明的發(fā)明人認(rèn)識(shí)到,這種效應(yīng)可通過(guò)增加編碼塊大小來(lái)減輕。因此,可實(shí)現(xiàn)減少的紋理?yè)p失或拖尾,因而可獲得改進(jìn)的視頻編碼質(zhì)量。
根據(jù)本發(fā)明的另一個(gè)特征,空間頻率特性包括能量向較低頻率集中的指示,以及用于設(shè)置編碼塊大小的部件可用于為增加的能量向較低頻率集中增加編碼塊大小。能量向低頻集中可表明高平坦度以及對(duì)視頻編碼中的編碼缺陷的敏感性,并且這可通過(guò)選取更大編碼塊大小來(lái)減輕。
根據(jù)本發(fā)明的另一個(gè)特征,視頻編碼器還包括用于響應(yīng)空間頻率特性來(lái)設(shè)置圖片區(qū)域的量化等級(jí)的部件;以及用于對(duì)視頻信號(hào)編碼的部件可用于采用圖片區(qū)域的量化等級(jí)。通過(guò)響應(yīng)空間頻率特性設(shè)置量化等級(jí)和編碼塊大小,可進(jìn)一步改進(jìn)視頻編碼器的性能。量化等級(jí)和編碼塊大小對(duì)于視頻編碼偽像、如紋理?yè)p失或基于塊的編碼的偽像的組合效應(yīng)顯著且非常相關(guān)。因此,性能可通過(guò)響應(yīng)圖片區(qū)域的空間頻率特性調(diào)整兩種參數(shù)來(lái)改進(jìn)。
根據(jù)本發(fā)明的另一個(gè)特征,視頻編碼器是符合國(guó)際電信聯(lián)盟定義的H.264建議的視頻編碼器。因此,本發(fā)明實(shí)現(xiàn)改進(jìn)的視頻編碼器,它可操作以工作并利用H.264標(biāo)準(zhǔn)的選項(xiàng)和限制。H.264由ITU-T(國(guó)際電信聯(lián)盟-電信標(biāo)準(zhǔn)化部門(mén))和ISO/IEC(國(guó)際標(biāo)準(zhǔn)化組織/國(guó)際電工委員會(huì))聯(lián)合開(kāi)發(fā)。ITU-T Rec.H.264相當(dāng)于ISO/IEC 14496-10AVC。
根據(jù)本發(fā)明的另一個(gè)特征,編碼塊大小從H.264標(biāo)準(zhǔn)所定義的幀間預(yù)測(cè)模式的一組運(yùn)動(dòng)估算塊大小中選取。因此,本發(fā)明實(shí)現(xiàn)改進(jìn)的H.264視頻編碼器,其中,標(biāo)準(zhǔn)編碼塊大小的選擇被控制,以便適合局部空間頻率特性。
根據(jù)本發(fā)明的第二方面,提供一種視頻編碼方法,所述方法包括以下步驟確定具有空間頻率特性的圖片區(qū)域;響應(yīng)空間頻率特性來(lái)設(shè)置圖片區(qū)域的編碼塊大小;以及采用圖片區(qū)域的編碼塊大小來(lái)對(duì)視頻信號(hào)編碼。
通過(guò)參照以下所述實(shí)施例進(jìn)行的說(shuō)明,本發(fā)明的這些方面及其它方面、特征和優(yōu)點(diǎn)將會(huì)非常明顯。
附圖簡(jiǎn)介現(xiàn)在僅作為實(shí)例、參照附圖來(lái)描述本發(fā)明的實(shí)施例,附圖中
圖1說(shuō)明根據(jù)H.264標(biāo)準(zhǔn)的宏塊到運(yùn)動(dòng)估算塊的可能劃分;圖2說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻編碼器的框圖;以及圖3說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻編碼方法的流程圖。
優(yōu)選實(shí)施例的描述以下描述集中在適用于根據(jù)H.26L、H.264或MPEG-4AVC視頻編碼標(biāo)準(zhǔn)的視頻編碼的本發(fā)明的一個(gè)實(shí)施例。但是,可以理解,本發(fā)明不限于這種應(yīng)用,而是可應(yīng)用于其它許多視頻編碼算法、規(guī)范或標(biāo)準(zhǔn)。
大多數(shù)已確立的視頻編碼標(biāo)準(zhǔn)(例如MPEG-2)固有地采用基于塊的運(yùn)動(dòng)補(bǔ)償作為利用視頻中連續(xù)圖片之間相關(guān)的實(shí)際方法。這種方法嘗試通過(guò)它在相鄰參考圖片中的“最佳匹配”來(lái)預(yù)測(cè)某個(gè)圖片中的各宏塊(16×16像素)。如果宏塊與其預(yù)測(cè)之間的像素式差異足夠小,則這個(gè)差異而不是宏塊本身被編碼。預(yù)測(cè)塊相對(duì)于實(shí)際宏塊的坐標(biāo)的相對(duì)位移由單獨(dú)編碼的運(yùn)動(dòng)矢量來(lái)表示。
諸如H.26L、H.264或MPEG-4AVC之類(lèi)的新視頻編碼標(biāo)準(zhǔn)從改進(jìn)的質(zhì)量對(duì)數(shù)據(jù)率的比率方面保證改進(jìn)的視頻編碼性能。這些標(biāo)準(zhǔn)所提供的許多數(shù)據(jù)率減小可歸功于運(yùn)動(dòng)補(bǔ)償?shù)母倪M(jìn)方法。這些方法主要擴(kuò)展了先前標(biāo)準(zhǔn)、如MPEG-2的基本原理。
一種相關(guān)擴(kuò)展是為預(yù)測(cè)使用多個(gè)參考圖片,由此,預(yù)測(cè)塊可來(lái)自更大距離(該距離當(dāng)前未限制)的將來(lái)或過(guò)去圖片。另一種甚至更有效的擴(kuò)展是將可變塊大小用于宏塊預(yù)測(cè)的可能性。因此,宏塊(仍然為16×16像素)可劃分為多個(gè)更小塊,這些子塊中的每個(gè)可分開(kāi)預(yù)測(cè)。因此,不同的子塊可具有不同的運(yùn)動(dòng)矢量,并且可從不同的參考圖片中取出。預(yù)測(cè)塊的數(shù)量、大小和取向由幀間預(yù)測(cè)模式的定義唯一確定,它描述宏塊到8×8塊的可能劃分以及每個(gè)8×8子塊的進(jìn)一步劃分。圖1說(shuō)明根據(jù)H.264標(biāo)準(zhǔn)的宏塊到運(yùn)動(dòng)估算塊的可能劃分。
采用根據(jù)H.264的視頻編碼的各種實(shí)驗(yàn)已經(jīng)證明,多個(gè)參考圖片以及尤其是較小預(yù)測(cè)塊的使用對(duì)于相同質(zhì)量等級(jí)可產(chǎn)生明顯的比特率減小。但是,還可以看出,雖然H.264可顯著降低MPEG-2視頻編碼的一些典型偽像,但是它也會(huì)導(dǎo)致其它偽像。一種這樣的偽像是紋理的部分消除,導(dǎo)致一些圖片區(qū)的紋理拖尾和類(lèi)似塑膠的外觀。另一個(gè)偽像是具有極少細(xì)節(jié)的靜態(tài)區(qū)中的噪聲。偽像在具有極少細(xì)節(jié)或變化的大區(qū)域中最顯著,并且對(duì)于較大的圖片格式、如高清晰度電視尤為顯著。
本發(fā)明的發(fā)明人認(rèn)識(shí)到,編碼偽像受到所使用的編碼塊大小的影響,并且可通過(guò)編碼塊大小的改進(jìn)選擇來(lái)減輕。
圖2說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻編碼器201的框圖。
視頻編碼器201耦合到外部視頻源203,從其中接收待編碼的視頻信號(hào)。視頻信號(hào)包含多個(gè)圖片或幀。
視頻編碼器201包括耦合到外部視頻源203的緩沖器205。緩沖器205接收來(lái)自外部視頻源203的視頻信號(hào),并存儲(chǔ)一個(gè)或多個(gè)圖片或幀,直到視頻編碼器201準(zhǔn)備對(duì)它們編碼。外部視頻源203還耦合到分段處理器207。分段處理器207可用于通過(guò)將圖片分為不同的圖片區(qū)域來(lái)確定圖片區(qū)域。圖片可根據(jù)任何適當(dāng)?shù)乃惴ɑ驑?biāo)準(zhǔn)分為兩個(gè)或兩個(gè)以上圖片區(qū)域,明確地說(shuō),圖片可通過(guò)選擇滿足給定標(biāo)準(zhǔn)的單個(gè)圖片區(qū)域來(lái)分為兩個(gè)圖片區(qū)域。
分段處理器207耦合到特性處理器209。特性處理器209可用于確定分段處理器207所確定的圖片區(qū)域的空間頻率特性??臻g頻率特性可例如表明所確定圖片區(qū)域的空間頻域能量分布。例如,空間頻率特性可表明低于給定頻率門(mén)限的能量集中度。
在其它實(shí)施例中,沒(méi)有特定的分段在分段處理器207中執(zhí)行。而是,待編碼的視頻信號(hào)饋送到預(yù)定圖片區(qū)域中的特性處理器209。明確地說(shuō),各個(gè)宏塊可從外部視頻源203或緩沖器205直接饋送到特性處理器209。在這個(gè)實(shí)施例中,圖片區(qū)域通過(guò)接收或取出單個(gè)宏塊并對(duì)它進(jìn)行處理來(lái)直接產(chǎn)生。
在優(yōu)選實(shí)施例中,空間頻率特性包括并表明所確定圖片區(qū)域的平坦度和/或均勻度。
圖片中的區(qū)域在缺少紋理/細(xì)節(jié)或者在包含靜止的紋理、即具有均勻變化時(shí)一般被認(rèn)為是均勻的。平坦區(qū)域一般被認(rèn)為是僅缺少紋理和/或細(xì)節(jié)、因而具有高頻內(nèi)容的較低集中度的區(qū)域。因此,典型的平坦區(qū)域在觀看者看來(lái)是平淡的。平坦區(qū)域的一個(gè)典型實(shí)例是卡通片中均勻色彩的區(qū)域。術(shù)語(yǔ)“均勻”一般被認(rèn)為比平坦更廣義,因而平坦區(qū)域通常也被認(rèn)為是平坦的(但反之則不一定成立)。
在具有低變化的區(qū)域、如均勻或平坦區(qū)域中,偏移更易于被注意到。因此,編碼缺陷和偽像在這些區(qū)域中可能特別不利。例如,平坦區(qū)存在的一個(gè)重要問(wèn)題是,它們的特征在于人眼更為敏感、因此也對(duì)偽像更為敏感的低頻內(nèi)容。此外,平坦區(qū)往往對(duì)應(yīng)于畫(huà)面中更靜態(tài)對(duì)象或背景(例如墻壁、天空等),其中人眼有更多時(shí)間進(jìn)行聚焦。
為了降低數(shù)據(jù)率,大部分視頻編碼器依靠人眼對(duì)高頻內(nèi)容不太敏感的屬性,因此視頻編碼器包括用于抑制視頻信號(hào)的頻譜中的較高頻率的機(jī)制。對(duì)于標(biāo)準(zhǔn)的基于塊的編碼器,這主要通過(guò)塊變換以及變換系數(shù)的加權(quán)和量化來(lái)實(shí)現(xiàn),它經(jīng)過(guò)設(shè)計(jì),使得低階系數(shù)以高階系數(shù)為代價(jià)來(lái)保存。
本發(fā)明人認(rèn)識(shí)到,在平坦區(qū)中,與基于塊的編碼相關(guān)的編碼偽像可能特別令人煩惱。這類(lèi)偽像因編碼塊大小的不一致選擇以及相應(yīng)的量化等級(jí)而可能在傳統(tǒng)編碼器中出現(xiàn)。
本發(fā)明人還認(rèn)識(shí)到,傳統(tǒng)編碼器中典型的部分紋理?yè)p失或拖尾受到編碼塊大小的選擇的影響。主要是高頻性質(zhì)的紋理消除的一種可能的解釋是在H.264中,16×16宏塊可采用4×4塊變換來(lái)進(jìn)行變換。相反,MPEG-2將8×8DCT變換用于相同目的。因此,通過(guò)采用更小的變換塊,H.264將信號(hào)能量壓縮為較大數(shù)量的低頻系數(shù),舍棄在連續(xù)視頻編碼過(guò)程中更易被抑制(例如由于系數(shù)加權(quán)或量化)的較小數(shù)量的高頻系數(shù)。由于紋理信息通常是較高頻率性質(zhì)的,因此產(chǎn)生紋理的損失。
在一個(gè)簡(jiǎn)單實(shí)施例中,空間頻率特性可以是表明是否滿足給定標(biāo)準(zhǔn)的單個(gè)二進(jìn)制參數(shù)。例如,如果假定60%以上的信號(hào)能量包含在最低20%的相關(guān)頻譜中,則空間頻率特性可設(shè)置為零,否則設(shè)置為一。在這種情況下,零的空間頻率特性值表明能量向較低頻率的高集中度。這是具有高平坦度的圖片區(qū)域的指示,因此表明圖片區(qū)域在被編碼時(shí)對(duì)編碼偽像具有高敏感性。
特性處理器209耦合到編碼控制器211。編碼控制器211可用于響應(yīng)空間頻率特性來(lái)設(shè)置圖片區(qū)域的編碼塊大小。在優(yōu)選實(shí)施例中,編碼塊大小是運(yùn)動(dòng)估算塊大小,明確地說(shuō),是H.264視頻編碼標(biāo)準(zhǔn)中定義的幀間預(yù)測(cè)模式所允許的預(yù)測(cè)塊大小。
在上述簡(jiǎn)單實(shí)施例中,如果空間頻率特性為零,則編碼塊大小可設(shè)置為第一塊大小,以及如果空間頻率特性為一,則設(shè)置為第二塊大小。因此,在一些實(shí)施例中,編碼控制器211可以只通過(guò)響應(yīng)空間頻率特性值與編碼塊大小之間的預(yù)定關(guān)聯(lián)選擇預(yù)定塊大小,來(lái)設(shè)置編碼塊大小。
編碼控制器211耦合到編碼處理器213,編碼處理器213還耦合到緩沖器205。編碼處理器213可用于采用由編碼控制器211對(duì)分段處理器207所確定的圖片區(qū)域設(shè)置的編碼塊大小來(lái)對(duì)緩沖器205中存儲(chǔ)的圖片進(jìn)行編碼。因此,視頻編碼將使得圖片區(qū)域的編碼塊大小特別調(diào)整到適合該圖片區(qū)域的空間頻率特性。例如,在所述簡(jiǎn)單實(shí)施例中,信號(hào)能量向低空間頻率的集中將導(dǎo)致第一較大的塊大小被使用。否則,較小的塊大小將被使用,或者至少被允許,從而允許改進(jìn)的編碼效率。因此,如果空間頻率特性包含高平坦度的指示(和因而對(duì)編碼偽像的敏感度),則使用較大的編碼塊大小,從而減輕或消除編碼缺陷。在優(yōu)選實(shí)施例中,編碼處理器213可用于根據(jù)H.264視頻編碼標(biāo)準(zhǔn)對(duì)視頻信號(hào)編碼。
特別適合簡(jiǎn)易實(shí)現(xiàn)的一個(gè)實(shí)施例是圖片區(qū)域?qū)?yīng)一個(gè)宏塊的情況。在這個(gè)實(shí)施例中,宏塊被直接饋送到特性處理器209,特性處理器209則確定那個(gè)宏塊的空間頻率特性。作出響應(yīng),編碼控制器211為該宏塊確定適當(dāng)編碼塊大小以及可能對(duì)多個(gè)相鄰宏塊進(jìn)行確定。
編碼處理器213接收來(lái)自緩沖器205的宏塊,并采用編碼控制器為宏塊選取的編碼塊大小對(duì)它進(jìn)行編碼。這實(shí)現(xiàn)硬件中并行的、因此更高效的執(zhí)行。
此外,特性處理器(209)可存儲(chǔ)從后續(xù)圖片中為宏塊所獲取的空間頻率特性。這將實(shí)現(xiàn)空間頻譜特性的時(shí)間連貫性的分析,這可進(jìn)一步用來(lái)優(yōu)化編碼參數(shù)的選擇。例如,它可幫助區(qū)分基礎(chǔ)圖片的紋理與源自視頻源的噪聲的紋理(例如影片中所謂的“膠片顆?!?。
圖3說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻編碼方法的流程圖。該方法適用于圖2的視頻編碼器201,并且將參照此圖進(jìn)行描述。
在步驟301,視頻編碼器201從外部視頻源接收待編碼的視頻信號(hào)。
步驟301之后是步驟303,其中分段處理器207確定圖片區(qū)域。圖片區(qū)域可根據(jù)任何適當(dāng)?shù)臉?biāo)準(zhǔn)或算法來(lái)確定。在一個(gè)簡(jiǎn)單實(shí)施例中,單個(gè)圖片區(qū)域可根據(jù)某個(gè)標(biāo)準(zhǔn)來(lái)選擇,以及圖片僅分為兩個(gè)圖片區(qū)域,即所選圖片區(qū)域以及包含圖片的其余部分的圖片區(qū)域。但是,在優(yōu)選實(shí)施例中,圖片分為若干圖片區(qū)域。
在優(yōu)選實(shí)施例中,圖片通過(guò)圖片的分段被分為若干圖片區(qū)域。在優(yōu)選實(shí)施例中,圖片分段包括基于公共屬性(例如色彩)的像素的空間分組的過(guò)程。存在圖片和視頻分段的若干方式,每個(gè)的效用一般取決于應(yīng)用??梢岳斫?,用于圖片分段的任何已知的方法或算法可以使用,而沒(méi)有背離本發(fā)明。圖片或視頻分段的介紹可見(jiàn)于例如E.Steinbach、P.Eisert、B.Girod的“利用三維畫(huà)面模型的圖像序列的基于運(yùn)動(dòng)的分析及分段”(信號(hào)處理特殊問(wèn)題基于內(nèi)容的處理和操縱的視頻序列分段,第66卷,第2號(hào),第233-248頁(yè),IEEE 1998)或者A.Bovik的“圖像和視頻處理手冊(cè)”(Academic Press.2000)。
在優(yōu)選實(shí)施例中,分段包括根據(jù)公共特性、如色彩或均勻度來(lái)檢測(cè)對(duì)象,以及隨后逐個(gè)圖片地跟蹤這個(gè)對(duì)象。這提供簡(jiǎn)化的分段,并且有助于識(shí)別適當(dāng)區(qū)域以采用相同編碼塊大小來(lái)編碼。舉例來(lái)說(shuō),初始圖片可被分段,以及所得到的段在后續(xù)圖片中被跟蹤,直到新的圖片獨(dú)立被分段,等等。段跟蹤最好是通過(guò)采用已知的運(yùn)動(dòng)估算技術(shù)來(lái)執(zhí)行。
在優(yōu)選實(shí)施例中,圖片區(qū)域可包括多個(gè)圖片區(qū),它們適合于視頻編碼參數(shù)、特別是編碼塊大小的類(lèi)似選擇。因此,圖片區(qū)域可由多個(gè)段的分組來(lái)形成。例如,如果視頻信號(hào)對(duì)應(yīng)于一場(chǎng)足球比賽,則具有主要是綠色的所有區(qū)域可分組在一起作為一個(gè)圖片區(qū)域。作為另一個(gè)實(shí)例,具有與球隊(duì)之一的襯衫顏色對(duì)應(yīng)的主要色彩的所有段可分組在一起作為一個(gè)圖片區(qū)域。圖片段不一定需要對(duì)應(yīng)于物理對(duì)象。例如,兩個(gè)相鄰段可代表不同的對(duì)象,但可能都是較多紋理的。在這種情況下,兩種段可適合于相同的編碼塊大小。
在一個(gè)特定實(shí)施例中,一個(gè)或多個(gè)圖片區(qū)域可響應(yīng)圖片的屬性或特性來(lái)明確地確定。明確地說(shuō),圖片區(qū)域可響應(yīng)空間頻率特性來(lái)確定。因此,分段處理器207可用于將圖片區(qū)域確定為空間頻率特性滿足空間頻率標(biāo)準(zhǔn)的一組像素。例如,圖片區(qū)域可通過(guò)對(duì)所有例如4×4像素塊進(jìn)行分組來(lái)確定,對(duì)于這些像素塊,50%的能量包含在對(duì)應(yīng)于最低空間頻率的三個(gè)DCT系數(shù)中。第二圖片區(qū)域可通過(guò)對(duì)所有其余的4×4像素塊進(jìn)行分組來(lái)確定,對(duì)于這些像素塊,50%的能量包含在對(duì)應(yīng)于最低空間頻率的六個(gè)DCT系數(shù)中。第三圖片區(qū)域可由其余的4×4像素塊來(lái)形成。
在其它實(shí)施例中,圖片可以只分為若干圖片區(qū)域,而沒(méi)有考慮圖片的屬性。例如,圖片可以只分為適當(dāng)大小的多個(gè)相鄰正方形。
在又一些實(shí)施例中,該方法不包括分段步驟301,或者分段步驟只是等效地包括檢索或接收?qǐng)D片區(qū)域、例如待編碼的塊,明確地說(shuō),可接收宏塊。
步驟303之后是步驟305,其中,圖片區(qū)域的空間頻率特性由特性處理器209來(lái)確定。在優(yōu)選實(shí)施例中,確定表示圖片區(qū)域的均勻性或平坦性的空間頻率特性。一種這樣的度量是空間頻率分布,其中,能量向較低頻率的集中表示增加的平坦性。在一個(gè)實(shí)施例中,空間頻率特性可通過(guò)對(duì)圖片區(qū)域中的一個(gè)或多個(gè)塊執(zhí)行離散余弦變換(DCT)來(lái)確定。例如,4×4DCT可對(duì)圖片區(qū)域中的所有4×4像素塊執(zhí)行??蔀閳D片區(qū)域中的所有塊對(duì)DCT系數(shù)值求平均,以及空間頻率特性可包括平均系數(shù)值或者不同系數(shù)值的相對(duì)幅度的指示。
確定平坦度的度量的另一種方法是通過(guò)確定圖片區(qū)域內(nèi)的像素值的方差來(lái)進(jìn)行。這個(gè)方差不僅可以是統(tǒng)計(jì)方差,而且也可以是圖片區(qū)域內(nèi)的像素值的方差或擴(kuò)散度的其它任何度量。方差或擴(kuò)散度可通過(guò)取某個(gè)像素與周?chē)袼氐钠骄?、并測(cè)量這些像素與平均值之間的差來(lái)計(jì)算。這特別適合其中各圖片區(qū)域?qū)?yīng)于一個(gè)或多個(gè)宏塊的實(shí)施例。
可以理解,步驟303和305的組合效應(yīng)是確定具有空間頻率特性的圖片區(qū)域。例如,這可通過(guò)根據(jù)給定標(biāo)準(zhǔn)來(lái)確定圖片區(qū)域以及隨后確定該區(qū)域的空間頻率特性來(lái)進(jìn)行。作為替代或補(bǔ)充,圖片區(qū)域可例如通過(guò)對(duì)具有給定空間頻率特性的圖片區(qū)或部分進(jìn)行分組來(lái)直接確定。在這種情況下,不需要圖片區(qū)域的特定分析來(lái)確定空間頻率特性,因?yàn)樗逃械赝ㄟ^(guò)圖片區(qū)域的確定來(lái)給定。
步驟307之后是步驟305,其中,編碼控制器211響應(yīng)空間頻率特性來(lái)設(shè)置圖片區(qū)域的編碼塊大小。
在一些實(shí)施例中,編碼塊大小設(shè)置為預(yù)定值。例如,空間頻率特性可以是低于給定頻率門(mén)限的能量集中度的單個(gè)度量。編碼控制器211可包括查找表,其中,如果能量集中度低于比如50%的第一值,則設(shè)置第一預(yù)定編碼塊大小,如果能量集中度低于比如75%的第二值,則設(shè)置第二預(yù)定編碼塊大小,否則設(shè)置第三預(yù)定編碼塊大小。
在優(yōu)選實(shí)施例中,空間頻率特性包括圖片區(qū)域中的平坦度或均勻度的指示,以及編碼控制器211可用于設(shè)置編碼塊大小,使得編碼塊大小對(duì)于增加的平坦度或均勻度而增加。在前面的實(shí)例中,第一預(yù)定編碼塊大小小于第二預(yù)定編碼塊大小,第二預(yù)定編碼塊大小又小于第三預(yù)定編碼塊大小。這可減小臨界圖片區(qū)的紋理消除或拖尾,因?yàn)檩^大的編碼塊大小比較小的編碼塊大小導(dǎo)致更少的紋理?yè)p失。
在一些實(shí)施例中,編碼塊大小可包括編碼塊大小的一組可允許值。因此,在一些情況下,可對(duì)于編碼塊大小選擇特定參數(shù)值,而在另一些實(shí)施例中,具有一系列可允許值的編碼塊大小可被選取。因此,編碼塊大小提供對(duì)后續(xù)視頻編碼的編碼參數(shù)的選擇的約束或限制。因此,在優(yōu)選實(shí)施例中,編碼控制器211控制或影響編碼處理器213的操作。這樣,不是單個(gè)編碼塊大小值由編碼控制器211來(lái)選取,而是一組可允許編碼塊大小可由編碼控制器211來(lái)選取或設(shè)置。編碼處理器213則可通過(guò)從編碼控制器211所確定的集合中選取編碼塊大小來(lái)對(duì)視頻信號(hào)編碼。因此,在一些實(shí)施例中,編碼控制器211可用于響應(yīng)空間頻率特性來(lái)產(chǎn)生可允許編碼塊大小的集合,以及編碼處理器213可用于從可允許編碼塊大小的集合中選擇編碼塊大小。
在其中各圖片區(qū)域?qū)?yīng)一個(gè)或多個(gè)宏塊的一些實(shí)施例中,編碼塊大小的選擇最好包括根據(jù)H.264標(biāo)準(zhǔn)將宏塊劃分為運(yùn)動(dòng)估算塊。
步驟307之后是步驟309,其中,在編碼處理器213中采用編碼控制器211所確定的編碼塊大小對(duì)視頻信號(hào)進(jìn)行編碼。在優(yōu)選實(shí)施例中,視頻編碼是按照H.264視頻編碼標(biāo)準(zhǔn)。
明確地說(shuō),一個(gè)優(yōu)選實(shí)施例的方法可由此減小采用運(yùn)動(dòng)補(bǔ)償?shù)念?lèi)似H.26L的技術(shù)、即在幀間預(yù)測(cè)過(guò)程中采用可變塊大小來(lái)編碼的圖片中的分塊偽像。此實(shí)施例的方法識(shí)別圖片中的平坦區(qū),并對(duì)那些區(qū)域中的編碼塊大小實(shí)施約束。特別是,強(qiáng)制使用較大預(yù)測(cè)塊?;谄淦教剐缘膮^(qū)域的所需區(qū)分可在編碼過(guò)程中執(zhí)行,但也可預(yù)先可用(例如在其它應(yīng)用需要時(shí))。這種分析的復(fù)雜度(在執(zhí)行圖片分段的情況下)在部分情況下可能是實(shí)時(shí)實(shí)現(xiàn)的限制因素。優(yōu)選實(shí)施例的方法特別但不是排他地適合非實(shí)時(shí)應(yīng)用,例如視頻流、廣播或出版。
在優(yōu)選實(shí)施例中,編碼控制器211還可用于響應(yīng)空間頻率特性來(lái)設(shè)置圖片區(qū)域的量化等級(jí);以及編碼處理器213可用于采用圖片區(qū)域的量化等級(jí)。例如,可設(shè)置量化門(mén)限,低于該門(mén)限,編碼DCT之后的所有系數(shù)被設(shè)置為零。較低的門(mén)限可產(chǎn)生降低的數(shù)據(jù)率,但也降低圖片質(zhì)量。紋理?yè)p失對(duì)于增加的門(mén)限被增加,因此,量化等級(jí)最好是根據(jù)被增加的編碼塊大小來(lái)降低,以便進(jìn)一步減輕紋理拖尾效應(yīng)。
在優(yōu)選實(shí)施例中,編碼塊大小集合是運(yùn)動(dòng)估算預(yù)測(cè)塊大小。但是,可以理解,其它編碼塊大小可響應(yīng)空間頻率特性來(lái)設(shè)置。例如,用于將視頻數(shù)據(jù)變換為空間頻率的變換大小可響應(yīng)空間頻率特性來(lái)設(shè)置。此外,一個(gè)以上的塊大小可響應(yīng)空間頻率特性來(lái)設(shè)置。例如,在一些實(shí)施例中,響應(yīng)空間頻率特性來(lái)設(shè)置預(yù)測(cè)塊大小以及變換塊大小、特別是將它們?cè)O(shè)置為相同塊大小可能是有利的。
此方法的步驟可對(duì)不同的圖片區(qū)域迭代進(jìn)行,或者不同的區(qū)域可在步驟的每一個(gè)中被處理。
本發(fā)明可通過(guò)任何適合的形式來(lái)實(shí)現(xiàn),其中包括硬件、軟件、固件或它們的任何組合。但是,本發(fā)明最好是作為在一個(gè)或多個(gè)數(shù)據(jù)處理器和/或數(shù)字信號(hào)處理器中運(yùn)行的計(jì)算機(jī)軟件來(lái)實(shí)現(xiàn)。本發(fā)明的一個(gè)實(shí)施例的元件和組件可通過(guò)任何適當(dāng)方式在物理、功能和邏輯上實(shí)現(xiàn)。實(shí)際上,功能性可在單個(gè)單元、多個(gè)單元中或者作為其它功能單元的組成部分來(lái)實(shí)現(xiàn)。因此,本發(fā)明可在單個(gè)單元中實(shí)現(xiàn),或者可在物理上和功能上分布在不同單元和處理器之間。
雖然已經(jīng)結(jié)合優(yōu)選實(shí)施例描述了本發(fā)明,但它不是意在被限制于本文闡述的特定形式。相反,本發(fā)明的范圍僅受所附權(quán)利要求的限制。在權(quán)利要求中,術(shù)語(yǔ)“包括”不排除存在其它元件或步驟的情況。此外,雖然單獨(dú)被列出,但多個(gè)部件、元件或方法步驟可通過(guò)例如單個(gè)單元或處理器來(lái)實(shí)現(xiàn)。另外,雖然各個(gè)特征可包含在不同的權(quán)利要求中,但它們可能被有利地結(jié)合,以及包含在不同權(quán)利要求中并不意味著特征的組合不是可行和/或有利的。另外,單數(shù)說(shuō)法不排除多個(gè)。因此,“一個(gè)”、“第一”、“第二”等說(shuō)法不排除復(fù)數(shù)。
權(quán)利要求
1.一種用于對(duì)視頻信號(hào)編碼的視頻編碼器(201),包括用于確定具有空間頻率特性的圖片區(qū)域的部件(207,209);用于響應(yīng)所述空間頻率特性來(lái)設(shè)置所述圖片區(qū)域的編碼塊大小的部件(211);以及用于采用所述圖片區(qū)域的所述編碼塊大小來(lái)對(duì)所述視頻信號(hào)編碼的部件(213)。
2.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,所述編碼塊大小為運(yùn)動(dòng)估算塊大小。
3.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,用于確定圖片區(qū)域的所述部件(207,209)可用于將圖片區(qū)域確定為所述空間頻率特性滿足空間頻率標(biāo)準(zhǔn)的一組像素。
4.如權(quán)利要求3所述的視頻編碼器(201),其特征在于,所述空間頻率標(biāo)準(zhǔn)是,空間頻率分布包括對(duì)于頻率門(mén)限以下的空間頻率、高于能量門(mén)限的能量集中度。
5.如權(quán)利要求3所述的視頻編碼器(201),其特征在于,用于設(shè)置編碼塊大小的所述部件(211)可用于將所述編碼塊大小設(shè)置為預(yù)定值。
6.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,用于確定圖片區(qū)域的所述部件(207,209)包括用于響應(yīng)圖片區(qū)域內(nèi)的像素值的方差來(lái)確定所述空間頻率特性的部件。
7.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,用于設(shè)置編碼塊大小的所述部件(211)包括用于響應(yīng)所述空間頻率特性來(lái)產(chǎn)生可允許編碼塊大小集合的部件;以及用于編碼的所述部件(213)包括用于從所述可允許編碼塊大小集合中選取編碼塊大小的部件。
8.如權(quán)利要求1所述的視頻編碼器(201),其特征在于還包括用于確定具有第二空間頻率特性的第二圖片區(qū)域的部件;用于響應(yīng)所述第二空間頻率特性來(lái)設(shè)置所述第二圖片區(qū)域的第二編碼塊大小的部件;以及其中用于對(duì)所述視頻信號(hào)編碼的所述部件(213)可用于采用所述第二圖片區(qū)域的所述第二編碼塊大小來(lái)對(duì)所述視頻信號(hào)編碼。
9.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,所述空間頻率特性包括圖片區(qū)域中的平坦度的指示,以及用于設(shè)置編碼塊大小的所述部件(211)可用于為增加的平坦度增加所述編碼塊大小。
10.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,所述空間頻率特性包括圖片區(qū)域中的均勻度的指示,以及用于設(shè)置編碼塊大小的所述部件(211)可用于為增加的均勻度增加所述編碼塊大小。
11.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,所述空間頻率特性包括能量向較低頻率集中的指示,以及用于設(shè)置編碼塊大小的所述部件(211)可用于為增加的能量向較低頻率的集中來(lái)增加編碼塊大小。
12.如權(quán)利要求1所述的視頻編碼器(201),其特征在于還包括用于響應(yīng)所述空間頻率特性來(lái)設(shè)置所述圖片區(qū)域的量化等級(jí)的部件;以及用于對(duì)視頻信號(hào)編碼的所述部件(213)可用于采用所述圖片區(qū)域的所述量化等級(jí)。
13.如權(quán)利要求1所述的視頻編碼器(201),其特征在于,所述視頻編碼器(201)是符合國(guó)際電信聯(lián)盟所定義的H.264建議的視頻編碼器。
14.如權(quán)利要求13所述的視頻編碼器(201),其特征在于,所述編碼塊大小從H.26L標(biāo)準(zhǔn)中定義的幀間預(yù)測(cè)模式的一組運(yùn)動(dòng)估算塊大小中選取。
15.一種視頻編碼方法(300),包括以下步驟確定(303,305)具有空間頻率特性的圖片區(qū)域;響應(yīng)所述空間頻率特性來(lái)設(shè)置(307)所述圖片區(qū)域的編碼塊大?。灰约安捎盟鰣D片區(qū)域的所述編碼塊大小來(lái)對(duì)所述視頻信號(hào)編碼(309)。
16.一種計(jì)算機(jī)程序,實(shí)現(xiàn)如權(quán)利要求15所述的方法的執(zhí)行。
17.一種記錄載體,包括如權(quán)利要求16所述的計(jì)算機(jī)程序。
全文摘要
本發(fā)明涉及一種用于對(duì)視頻信號(hào)編碼的視頻編碼器(201)。視頻編碼器包括分段處理器(207),它將圖片分為圖片區(qū)域。具有高平坦度或均勻度的圖片區(qū)域最好是以這種方式來(lái)確定。特性處理器(209)確定各圖片區(qū)域的空間頻率特性,編碼控制器(211)響應(yīng)空間頻率特性來(lái)選擇編碼塊大小,例如運(yùn)動(dòng)估算的預(yù)測(cè)塊大小。編碼處理器(213)利用所選編碼塊大小來(lái)對(duì)圖片編碼。明確地說(shuō),對(duì)于由空間頻率特性表示的增加的均勻度或平坦度選擇增加的塊大小。因此,高頻成分的增加比例以及編碼塊大小的一致選擇被保持,因而來(lái)自具有可變預(yù)測(cè)塊大小的許多編碼器的編碼偽像被減小。本發(fā)明特別適合H.264及類(lèi)似的編碼器。
文檔編號(hào)H04N7/26GK1757237SQ200480005674
公開(kāi)日2006年4月5日 申請(qǐng)日期2004年2月25日 優(yōu)先權(quán)日2003年3月3日
發(fā)明者D·魯拉澤羅維, G·J·M·維沃爾特 申請(qǐng)人:皇家飛利浦電子股份有限公司