两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

色度樣本定位信息的信令和使用的制作方法

文檔序號(hào):7936803閱讀:148來源:國知局

專利名稱::色度樣本定位信息的信令和使用的制作方法色度樣本定位信息的信令和使用概述總體而言,詳細(xì)描述針對(duì)編碼和解碼數(shù)字媒體數(shù)據(jù)的各方面,尤其針對(duì)在數(shù)字媒體編碼器和解碼器中編碼和解碼數(shù)字媒體。例如,描述了用于色度位置的信令和解釋的規(guī)則。一個(gè)稱為短規(guī)則的規(guī)則定義了15個(gè)離散的色度中心確定位置以及對(duì)應(yīng)的四位的句法元素。稱為擴(kuò)展規(guī)則的另一規(guī)則定義了81個(gè)離散的色度中心確定位置以及對(duì)應(yīng)的七位的句法元素。還描述了這些規(guī)則的變型和其它方面。一方面,一種方法包括在數(shù)字媒體編碼器處接收數(shù)字媒體數(shù)據(jù);確定所接收到的數(shù)字媒體數(shù)據(jù)的色度位置信息;在經(jīng)編碼的位流中用一個(gè)或多個(gè)句法元素來表示色度位置信息,其中該句法元素可用于將色度位置信息傳遞給數(shù)字媒體解碼器,并且其中該色度位置信息便于圖像旋轉(zhuǎn)或翻轉(zhuǎn);以及輸出經(jīng)編碼的位流。另一方面,色度位置信息被解碼。提供本概述以便以簡化的形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。本概述不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于限制所要求保護(hù)的主題的范圍。參考附圖閱讀以下詳細(xì)描述,上述和其它目的、特征以及優(yōu)點(diǎn)將變得更加顯而易見。附圖簡述圖1是在一個(gè)或多個(gè)所描述的實(shí)現(xiàn)中的用于實(shí)現(xiàn)色度位置信息的信令和使用的技術(shù)和工具的合適的計(jì)算環(huán)境的框圖。圖2是示出第一示例色度樣本位置規(guī)則的圖示。圖3是示出第二示例色度樣本位置規(guī)則的圖示。圖4是示出隔行數(shù)據(jù)的色度降采樣的圖示。圖5是基于塊變換的編解碼器的框圖。圖6是代表性編碼器的流程圖。圖7是代表性解碼器的流程圖。詳細(xì)描述本申請涉及用于高效地壓縮和解壓數(shù)字媒體數(shù)據(jù)的技術(shù)和工具。在各個(gè)所描述的實(shí)施例中,靜止圖像編碼器和/或解碼器包括用于壓縮和/或解壓圖像數(shù)據(jù)的技術(shù)。對(duì)此處所描述的實(shí)現(xiàn)的各種替換是可能的。例如,可以通過改變在流程圖中所示的各階段的次序、通過重復(fù)或省略某些階段等來更改參考各流程圖所描述的技術(shù)。作為另一示例,雖然參考特定的數(shù)字媒體格式描述某些實(shí)現(xiàn),但是也可以使用其它格式。各種技術(shù)和工具可以組合或單獨(dú)使用。不同的實(shí)施例實(shí)現(xiàn)所描述的技術(shù)和工具中的一個(gè)或多個(gè)。此處所描述的某些技術(shù)和工具可用于靜止圖像編碼器或解碼器,或者用于并不特別地限于靜止圖像編碼或解碼的某一其它系統(tǒng)。I.計(jì)算環(huán)境圖1示出了可在其中實(shí)現(xiàn)若干個(gè)所描述的實(shí)施例的合適的操作環(huán)境100的通用示例。計(jì)算環(huán)境IOO并不旨在對(duì)使用范圍或功能提出任何限制,因?yàn)樵摷夹g(shù)和工具可以在不同的通用或?qū)S糜?jì)算環(huán)境中實(shí)現(xiàn)。參考圖1,計(jì)算環(huán)境100包括至少一個(gè)處理單元110和存儲(chǔ)器120。在圖1中,這一最基本配置130包括在虛線中。處理單元110執(zhí)行計(jì)算機(jī)可執(zhí)行指令,并且可以是真實(shí)或虛擬處理器。在多處理系統(tǒng)中,多個(gè)處理單元執(zhí)行計(jì)算機(jī)可執(zhí)行指令以提高處理能力。存儲(chǔ)器120可以是易失性存儲(chǔ)器(例如寄存器、高速緩存、RAM)、非易失性存儲(chǔ)器(例如ROM、EEPROM、閃存等)或兩者的某一組合。存儲(chǔ)器120存儲(chǔ)使用所描述的技術(shù)或工具中的一個(gè)或多個(gè)來實(shí)現(xiàn)數(shù)字媒體編碼器或解碼器的軟件180。計(jì)算環(huán)境可以具有附加特征。例如,計(jì)算環(huán)境100包括存儲(chǔ)140、一個(gè)或多個(gè)輸入設(shè)備150、一個(gè)或多個(gè)輸出設(shè)備160以及一個(gè)或多個(gè)通信連接170。諸如總線、控制器或網(wǎng)絡(luò)等互連機(jī)制(未示出)將計(jì)算環(huán)境100的組件互連。通常,操作系統(tǒng)軟件(未示出)為在計(jì)算環(huán)境100中執(zhí)行的其它軟件提供操作環(huán)境,并協(xié)調(diào)計(jì)算環(huán)境100的組件的活動(dòng)。存儲(chǔ)140可以是可移動(dòng)的或不可移動(dòng)的,并且包括磁盤、磁帶或盒式磁帶、CD-ROM、DVD(包括高清晰度DVD)、或可用于存儲(chǔ)信息并可以在計(jì)算環(huán)境100中訪問的任何其它介質(zhì)。存儲(chǔ)140為實(shí)現(xiàn)數(shù)字媒體編碼器或解碼器的軟件180存儲(chǔ)指令。輸入設(shè)備150可以是諸如鍵盤、鼠標(biāo)、筆、或跟蹤球等觸摸式輸入設(shè)備、語音輸入設(shè)備、掃描設(shè)備、靜止圖像捕捉設(shè)備(例如數(shù)字照相機(jī))、或向計(jì)算環(huán)境100提供輸入的另一設(shè)備D對(duì)于音頻或視頻編碼,輸入設(shè)備150可以是聲卡、視頻卡、TV調(diào)諧卡、或接受模擬或數(shù)字形式的音頻或視頻輸入的類似設(shè)備、或?qū)⒁纛l或視頻樣本讀入到計(jì)算環(huán)境100中的CD-ROM或CD-RW。輸出設(shè)備160可以是顯示器、打印機(jī)、揚(yáng)聲器、CD或DVD刻錄機(jī)、或從計(jì)算環(huán)境IOO提供輸出的另一設(shè)備。通信連接170允許通過通信介質(zhì)到另一計(jì)算實(shí)體的通信。通信介質(zhì)傳達(dá)諸如已調(diào)制數(shù)據(jù)信號(hào)形式的計(jì)算機(jī)可執(zhí)行指令、數(shù)字媒體輸入或輸入、或其它數(shù)據(jù)等信息。已調(diào)制數(shù)據(jù)信號(hào)是其一個(gè)或多個(gè)特征以在信號(hào)中編碼信息的方式設(shè)置或改變的信號(hào)。作為示例而非限制,通信介質(zhì)包括使用電、光、RF、紅外、聲學(xué)或其它載波實(shí)現(xiàn)的有線或無線技術(shù)。該技術(shù)和工具可以在計(jì)算機(jī)可讀介質(zhì)的一般上下文中描述。計(jì)算機(jī)可讀介質(zhì)可以是可在計(jì)算環(huán)境內(nèi)訪問的任何可用介質(zhì)。作為示例而非限制,對(duì)于計(jì)算環(huán)境100,計(jì)算機(jī)可讀介質(zhì)包括存儲(chǔ)器120、存儲(chǔ)140、通信介質(zhì)以及上述任何的組合。該技術(shù)和工具可以在諸如程序模塊中所包括的在目標(biāo)真實(shí)或虛擬處理器上的計(jì)算環(huán)境中執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、庫、對(duì)象、類、組件、數(shù)據(jù)結(jié)構(gòu)等。程序模塊的功能可以如各實(shí)施例所需地組合或在程序模塊之間分離。用于程序模塊的計(jì)算機(jī)可執(zhí)行指令可以在本地或分布式計(jì)算環(huán)境中執(zhí)行。為了呈現(xiàn)起見,詳細(xì)描述使用如"選擇"和"接收"等術(shù)語來描述計(jì)算環(huán)境中的計(jì)算機(jī)操作。這些術(shù)語是對(duì)計(jì)算機(jī)所執(zhí)行的操作的高級(jí)抽象,并且不應(yīng)該與人類所執(zhí)行的動(dòng)作相混淆。對(duì)應(yīng)于這些術(shù)語的實(shí)際計(jì)算機(jī)操作取決于實(shí)現(xiàn)而不同。II.色度樣本位置信息的信令和使用所描述的實(shí)施例提供了高級(jí)靜止圖像編解碼器位流特征,包括對(duì)圖像執(zhí)行主旋轉(zhuǎn)和鏡像翻轉(zhuǎn)而無需完全解碼或重新編碼的能力。該特征可以由多個(gè)設(shè)計(jì)技術(shù)支持,包括1.重疊雙正交變換(LBT)——a.LBT的基函數(shù)的對(duì)稱性允許通過僅對(duì)奇對(duì)稱變換系數(shù)的符號(hào)求反來對(duì)變換塊內(nèi)的空間數(shù)據(jù)進(jìn)行鏡像翻轉(zhuǎn)。這對(duì)空間定向X和Y都是此。b.LBT的基函數(shù)的各向同性特性允許通過僅轉(zhuǎn)置變換系數(shù)來轉(zhuǎn)置變換塊內(nèi)的空間數(shù)據(jù)。主旋轉(zhuǎn)可以被實(shí)現(xiàn)為轉(zhuǎn)置和鏡像翻轉(zhuǎn)的組合。2.塊、宏塊和瓦塊(tile)空間分層結(jié)構(gòu)a.為了在數(shù)據(jù)的宏塊中實(shí)現(xiàn)鏡像翻轉(zhuǎn),經(jīng)修改的變換塊以橫向反轉(zhuǎn)的順序(根據(jù)需求在X和/或Y方向上)來掃描。同樣地,在瓦塊中,經(jīng)修改的宏塊以橫向反轉(zhuǎn)的順序來掃描,并且在圖像中,經(jīng)修改的瓦塊以橫向反轉(zhuǎn)的順序來掃描。b.為了實(shí)現(xiàn)轉(zhuǎn)置,經(jīng)修改的塊、宏塊和瓦塊被轉(zhuǎn)置。主旋轉(zhuǎn)可以被實(shí)現(xiàn)為轉(zhuǎn)置和鏡像翻轉(zhuǎn)的組合。3.擴(kuò)展的裁剪區(qū)域中的內(nèi)接區(qū)域的信令_一這允許自由地鏡像翻轉(zhuǎn)或旋轉(zhuǎn)非宏塊對(duì)齊的圖像并允許圖像從宏塊網(wǎng)格在任一方向,而非僅是向右和向下的非零偏移。4.色度樣本的位置的信令一_這通過準(zhǔn)許色度樣本的位置的獨(dú)立規(guī)范來允許旋轉(zhuǎn)諸如YUV4:2:0和YUV4:2:2等色度二次采樣的色彩格式。還允許用信號(hào)向解碼器通知亮度/色度樣本位置的相對(duì)對(duì)齊,以便可以選擇具有適當(dāng)相位的上采樣濾波器。以下詳細(xì)地包括了色度樣本的位置的信令。所描述的信令技術(shù)允許在不損失信息且不顯著改變壓縮大小的情況下在壓縮域內(nèi)旋轉(zhuǎn)圖像。這是合乎需要的位流特征并具有復(fù)雜性優(yōu)點(diǎn)。A.色度中心確定圖像包括多個(gè)數(shù)據(jù)平面。在主空間中,圖像通常由分別對(duì)應(yīng)于紅、綠和藍(lán)(R、G和B)通道的3個(gè)色彩平面組成。在最流行的編解碼器中使用的內(nèi)部色彩空間中,圖像由通常被稱為Y、U和V的3個(gè)經(jīng)轉(zhuǎn)換的色彩平面組成。Y分量被稱為亮度平面,它大致上對(duì)應(yīng)于圖像的灰度呈現(xiàn)。U和V分量被稱為色度或色差平面。這里在一般意義上使用術(shù)語Y、U、V,可以理解所描述的技術(shù)和工具適用于諸如YCbCr、YCoCg等各種"YUV類型"的色彩格式。稱為YUV4:4:4的色彩格式對(duì)于每一Y樣本有一個(gè)U和一個(gè)V樣本。人眼對(duì)亮度通道的強(qiáng)度變化和分辨率非常敏感。它對(duì)色度相對(duì)較不敏感。這允許通過二次采樣或降低色度(U和V)分量的分辨率來降低數(shù)據(jù)中的像素計(jì)數(shù)的簡單方法。兩種色度二次釆樣技術(shù)是流行的1.YUV4:2:2——此處,U和V在X方向的空間分辨率按因子2來減少(通常使用某種防圖形失真濾波器)。2.YUV4:2:0——此處,U和V在X和Y方向的空間分辨率都按因子2來減少。對(duì)于YUV4:2:2的情況,每個(gè)色度樣本對(duì)應(yīng)于兩個(gè)亮度樣本。同樣,對(duì)于YUV4:2:0的情況,每個(gè)色度樣本對(duì)應(yīng)于四個(gè)亮度樣本。色度二次采樣通常在使用防圖形失真濾波器對(duì)樣本進(jìn)行濾波之后執(zhí)行。該濾波器的相位確定色度和亮度樣本的相對(duì)位置。當(dāng)出于顯示或打印目的而從這些格式中的任一個(gè)轉(zhuǎn)換回YUV4:4:4時(shí),相對(duì)樣本位置的知識(shí)必須是可用的,以便可以使用適當(dāng)?shù)纳喜蓸訛V波器。對(duì)于該問題的一種方法是委托或用信號(hào)通知應(yīng)該使用的正確的上采樣濾波器。然而,這種方法對(duì)系統(tǒng)施加了額外的要求,并且可能與行業(yè)的其余部分不兼容。指示如何從二次采樣的版本重構(gòu)全分辨率數(shù)據(jù)的一種更簡單且更靈活的解決方案是通過用信號(hào)通知關(guān)于亮度和色度樣本的對(duì)齊的"位置"信息。雖然該方法沒有指定唯一的重構(gòu)規(guī)則(即唯一的上采樣濾波器),但是它具有足夠好的性能并且被廣泛接受。二次采樣的數(shù)據(jù)點(diǎn)的"位置"是該值在全分辨率網(wǎng)格中的位置或相位。位置信息被用于在符合相位限制的上采樣濾波器之間挑選。位置信息一般是二維的一一在水平和垂直方向上都指定移位。圖2和3示出了用于YUV4:2:0的兩個(gè)常見的色度位置規(guī)則的示例。在圖2中,相位=(0,0),而在圖3中,相位=(0.5,0.5),其中以亮度像素為單位。B.使用圖像旋轉(zhuǎn)/翻轉(zhuǎn)的色度中心確定圖2和圖3中所示的兩個(gè)示例是色度的YUV4:2:0二次采樣的最常見的情況。這兩種中心確定規(guī)則對(duì)于視頻數(shù)據(jù)通常是足夠的,但是對(duì)于圖像數(shù)據(jù)通常是不夠的。視頻和圖像之間的差異在于視頻是很少旋轉(zhuǎn)或鏡像翻轉(zhuǎn)的,而圖像則非常頻繁地旋轉(zhuǎn)和/或鏡像翻轉(zhuǎn)。為了查看為什么這兩種中心確定規(guī)則對(duì)于圖像數(shù)據(jù)通常是不夠的,考慮以下情況情況1:對(duì)于中心確定示例1,考慮沿著水平方向的鏡面翻轉(zhuǎn)?,F(xiàn)在色度樣本不與左上方的亮度樣本位于一個(gè)地方,而與右上方的色度樣本位于一個(gè)地方。色度的對(duì)應(yīng)相位是以亮度像素為單位的(l,O),它不是由圖2和3所示的規(guī)則所定義的。情況2:同樣,沿著具有示例1中示出的色度位置的圖像的垂直方向的鏡面翻轉(zhuǎn)產(chǎn)生具有以亮度像素為單位的(0,1)相位的色度位置,它不是由圖2和3所示的規(guī)則所定義的。以上情況示出了,當(dāng)圖像受到主旋轉(zhuǎn)和鏡像翻轉(zhuǎn)的基本操作時(shí),定義附加色度中心確定規(guī)則來作為對(duì)位流的輔助信息以協(xié)助正確的重構(gòu)過程的有用性。c.使用隔行數(shù)據(jù)的色度中心確定另一復(fù)雜性由隔行視頻引入。隔行視頻的幀包括兩個(gè)字段一一頂部字段和底部字段。視頻的字段能以其完整分辨率來存儲(chǔ)而沒有色度降采樣。更常見的,它是以色度降采樣的形式來傳送的,如其中色度在X方向上按因子2來降釆樣并且匹配Y方向上的亮度分辨率的YUV4:2:2。然而,在新近的視頻編解碼器中,隔行視頻的字段在YUV4:2:0空間中定義,這樣其色度在X和Y方向上都按因子2來將采樣。取決于其是頂部還是底字段數(shù)據(jù),該操作通常分別導(dǎo)致在垂直方向上具有0.25或0.75的相移(以亮度像素為單位)的色度中心確定。這一中心確定可用來確保以下情況1.幀中色度的交替行是通過交替各字段來生成的。色度中心確定是跨幀的連續(xù)行統(tǒng)一的。圖4中示出了隔行數(shù)據(jù)的色度降采樣。X軸降采樣可以具有任何相位,并且與本討論無關(guān)。因此,該附圖僅示出了Y軸中心確定和移位。D.色度位置記住上述內(nèi)容之后,定義色度位置的兩個(gè)規(guī)則。稱為/i規(guī)則的第一規(guī)則定義了15個(gè)色度中心確定相位。該規(guī)則在圖像位流中是使用4位的字來用信號(hào)通知的。表1枚舉了在一個(gè)實(shí)現(xiàn)中的句法元素CHROMA—CENTERING—SHORT(短色度中心確定)的值和對(duì)應(yīng)的相位。在表1所示的示例中,CHROMA—CENTERING—SHORT可以取0到15之間的值,但值14保留未使用。CHROMA—CENTERING—SHORT可以例如在圖像頭部或圖像平面頭部中用信號(hào)通知。CHROMACENTERINGSHORTX相位二0.5X相位二l10<table>tableseeoriginaldocumentpage11</column></row><table>表1:CHROMACENTERINGSHORT的值和對(duì)應(yīng)的相位的枚舉。還描述了被稱為^—展規(guī)則的第二且更全面的色度中心確定規(guī)則。該規(guī)則具有允許圖像被平移任何整數(shù)個(gè)像素而不損失數(shù)據(jù)的優(yōu)點(diǎn)。這是對(duì)旋轉(zhuǎn)和鏡面翻轉(zhuǎn)的補(bǔ)充。在一個(gè)實(shí)現(xiàn)中,擴(kuò)展規(guī)則在圖像位流內(nèi)是用7位的字(CHROMA—CENTERING—LONG(長色度中心確定))來用信號(hào)通知的,并且對(duì)應(yīng)于句法元素CHROMA_CENTERING_LONG的相位的枚舉如下。CHROMA_CENTERING_LONG=CHROMA_CENTERING_X+CHROMA_CENTERING_Y*9,其中CHROMA_CENTERING—X和CHROMA—CENTERING—Y是定義X和Y方向上的相位的句法元素,如表2中所示。CHROMA—CENTERING—X和CHROMA—CENTERING—Y取0至U8之間的值。因此,CHROMA—CENTERING—LONG可以取0到80之間的值。該范圍之外的值被保留。CHROMA—CENTERING—LONG、CHROMA—CENTERING—X禾口/或CHROMA—CENTERING_Y可以例如在圖像頭部或圖像平面頭部中用信號(hào)通知。<table>tableseeoriginaldocumentpage11</column></row><table>表2:CHROMA—CENTERING—X和CHROMA—CENTERING—Y的值以及對(duì)應(yīng)的相位的枚舉使用其它映射來代替表1和2是可能的。使用諸如可變長度碼等CHROMA_CENTERING元素的其它編碼也是可能的。m.基于塊變換的編碼變換編碼是在許多數(shù)字媒體(例如音頻、圖像和視頻)壓縮系統(tǒng)中使用的一種壓縮技術(shù)。未壓縮的數(shù)字圖像和視頻通常作為以二維(2D)網(wǎng)格排列的圖像或視頻幀中的各位置處的圖元或色彩的樣本來被表示或捕捉。這被稱為圖像或視頻的空間域表示。例如,圖像的典型格式是由排列成網(wǎng)格的24位的色彩圖元樣本流構(gòu)成的。每一樣本是表示諸如RGB或YIQ等色彩空間內(nèi)該網(wǎng)格中的一個(gè)像素位置處的色彩分量的數(shù)字。各種圖像和視頻系統(tǒng)可以使用各種不同的色彩、空間和時(shí)間分辨率的采樣。同樣地,數(shù)字視頻通常被表示為時(shí)間采樣的音頻信號(hào)流。例如典型的音頻格式由以有規(guī)律的時(shí)間間隔所取的16位音頻信號(hào)幅度樣本流構(gòu)成。未壓縮的數(shù)字音頻、圖像和視頻信號(hào)可以消耗大量的存儲(chǔ)和傳輸能力。變換編碼通過將信號(hào)的空間域表示變換成頻率域(或者其它相似的變換域)表示,并隨后降低該變換域表示的某些一般較不可感知的頻率分量的分辨率,從而減小了數(shù)字視頻、圖像和視頻的大小。與降低空間域中的圖像或視頻或時(shí)間域中的音頻的色彩或空間分辨率相比,這一般產(chǎn)生較不可感知的數(shù)字信號(hào)劣化。更具體地,圖5中所示的典型的基于塊變換的編碼器/解碼器系統(tǒng)500(也稱為"編解碼器")將未壓縮的數(shù)字圖像的像素劃分成固定大小的二維塊(X,,...Xn),每個(gè)塊可能與其它塊重疊。在編碼器510處,進(jìn)行空間-頻率分析的線性變換520-521被應(yīng)用于每個(gè)塊上,這將塊中的隔開的樣本轉(zhuǎn)換成一般表示塊間隔上相應(yīng)的頻帶中的數(shù)字信號(hào)的強(qiáng)度的一組頻率(或變換)系數(shù)。為了壓縮,變換系數(shù)可以被選擇性地量化530(即諸如通過丟棄系數(shù)值的最低有效位或者將較高分辨率數(shù)字集中的值映射到較低分辨率來降低分辨率),并且還被熵編碼或可變長度編碼530成壓縮數(shù)據(jù)流。在解碼時(shí),變換系數(shù)會(huì)進(jìn)行逆變換570-571,以便幾乎重構(gòu)原始的色彩/空間采樣圖像/視頻信號(hào)(重構(gòu)塊H)。塊變換520-521可以被定義為對(duì)大小為N的向量x的數(shù)學(xué)運(yùn)算。最常見的是,該運(yùn)算是線性乘法,從而產(chǎn)生變換域輸出y=Mx,M是變換矩陣。當(dāng)輸入數(shù)據(jù)是任意長度時(shí),它被分段成大小為N的向量,并且將塊變換應(yīng)用于每一段。為了進(jìn)行數(shù)據(jù)壓縮,選擇可逆塊變換。換而言之,矩陣M是可逆的。在多個(gè)維度中(例如對(duì)于圖像和視頻),塊變換通常被實(shí)現(xiàn)為可分運(yùn)算。矩陣乘法是沿著數(shù)據(jù)的每一維(即行和列)可分地應(yīng)用的。為了壓縮,變換系數(shù)(向量y的分量)可以被選擇性地量化(即諸如通過丟棄系數(shù)值的最低有效位或者將較高分辨率數(shù)字集中的值映射到較低分辨率來降低分辨率),并還可以被熵編碼或可變長度編碼成壓縮數(shù)據(jù)流。當(dāng)在解碼器550中解碼時(shí),如圖5中所示,在解碼器550側(cè)應(yīng)用這些運(yùn)算的逆過程(逆量化/熵解碼560以及逆塊變換570_571)。當(dāng)重構(gòu)數(shù)據(jù)時(shí),逆矩陣M'1(逆變換570—571)被作為乘數(shù)應(yīng)用于變換域數(shù)據(jù)。當(dāng)應(yīng)用于變換域數(shù)據(jù)時(shí),逆變換幾乎重構(gòu)原始時(shí)域或空間域數(shù)字媒體。在許多基于塊變換的編碼應(yīng)用中,變換理想地是可逆的以便取決于量化因子來同時(shí)支持有損和無損壓縮兩者。對(duì)于例如沒有量化(一般表示為量化因子1)的情況,使用可逆變換的編解碼器可以在解碼時(shí)精確地再現(xiàn)輸入數(shù)據(jù)。然而,這些應(yīng)用中的可逆性的要求約束了對(duì)用于設(shè)計(jì)編解碼器的變換的選擇。-諸如MPEG和WindowsMedia等許多圖像和視頻壓縮系統(tǒng)使用基于離散余弦變換(DCT)的變換。已知DCT具有得到近乎最優(yōu)的數(shù)據(jù)壓縮的良好能量壓縮特性。在這些壓縮系統(tǒng)中,在壓縮系統(tǒng)的編碼器和解碼器兩者中的重構(gòu)環(huán)路中都采用了逆DCT(IDCT)來重構(gòu)各個(gè)圖像塊。IV.示例性編碼器/解碼器實(shí)現(xiàn)圖6和7是在代表性2維(2D)數(shù)據(jù)編碼器600和解碼器700中采用的過程的一般化圖示。該圖示示出了可用于實(shí)現(xiàn)所描述的技術(shù)和工具的壓縮/解壓系統(tǒng)的一般化或簡化說明。在替換壓縮/解壓系統(tǒng)中,可以使用比該代表性編碼器和解碼器中示出的更多或更少的過程來進(jìn)行2D數(shù)據(jù)壓縮。例如,某些編碼器/解碼器還可以包括色彩轉(zhuǎn)換、色彩格式、可縮放編碼、無損編碼、宏塊模式等。取決于可基于從無損到有損變化的量化參數(shù)的量化,壓縮系統(tǒng)(編碼器和解碼器)可以提供對(duì)2D數(shù)據(jù)的無損和/或有損壓縮。2D數(shù)據(jù)編碼器600產(chǎn)生壓縮位流620,壓縮位流620是作為輸入提供給編碼器的2D數(shù)據(jù)610的更為緊湊的表示(對(duì)于典型輸入)。例如,2D數(shù)據(jù)輸入可以是圖像、視頻序列幀、或具有兩個(gè)維度的其它數(shù)據(jù)。2D數(shù)據(jù)編碼器將輸入數(shù)據(jù)幀劃分成各塊(一般地在圖6中示為分區(qū)630),它們在所示的實(shí)現(xiàn)中是13形成跨該幀的平面的規(guī)則圖案的非重疊4x4像素塊。這些塊被分組成稱為宏塊的群集,在該代表性編碼器中其大小為16x16像素。進(jìn)而,宏塊被分組成稱為瓦塊的規(guī)則結(jié)構(gòu)。瓦塊也可形成圖像上的規(guī)則圖案,使得水平行中的瓦塊是統(tǒng)一高度的且對(duì)齊的,而垂直列中的瓦塊是統(tǒng)一寬度的且對(duì)齊的。在該代表性編碼器中,瓦塊可以是在水平和/或垂直方向上是16的倍數(shù)的任意大小。替換編碼器實(shí)現(xiàn)可以將圖像劃分成塊、宏塊、瓦塊或其它大小和結(jié)構(gòu)的其它單元。對(duì)塊之間的每一邊緣應(yīng)用"前向重疊"算子640,之后使用塊變換650來變換每一4x4塊。該塊變換650可以是由Srinivasan在2004年12月17日提交的題為"ReversibleTransformForLossyAndLossless2-DDataCompression"(用于有損和無損2D數(shù)據(jù)壓縮的可逆變換)的美國專利申請第11/015,707號(hào)中所描述的可逆的、無縮放的2D變換。重疊算子640可以是由Tu等人在2004年12月17日提交的題為"ReversibleOverlapOperatorforEfficientLosslessDataCompression"(用于高效無損數(shù)據(jù)壓縮的可逆重疊算子)的美國專利申請第No.ll/015,148號(hào);以及Tu等人在2005年1月14日提交的題為"Reversible2-DimensionalPre-/Post-FilteringForLappedBiorthogonalTransform"(用于重疊雙正交變換的可逆2維前/后濾波)的美國專利申請第11/035,991號(hào)中所描述的可逆重疊算子。可選地,可以使用離散余弦變換或其它塊變換和重疊算子。在變換之后,令每一4x4變換塊的DC系數(shù)660經(jīng)受一類似的處理鏈(塊化、前向重疊、之后是4x4塊變換)。所得的DC變換系數(shù)和AC變換系數(shù)662被量化670、熵編碼680和分組化690。解碼器執(zhí)行逆過程。在解碼器側(cè),從其各自的分組中提取710變換系數(shù)位,從中系數(shù)自身被解碼720和解量化730。DC系數(shù)740通過應(yīng)用逆變換來重新生成,并且使用跨DC塊邊緣應(yīng)用的合適的平滑算子來"逆重疊"DC系數(shù)的平面。接著,通過將4x4逆變換750應(yīng)用于從位流解碼出的DC系數(shù)和AC系數(shù)742來重新生成整個(gè)數(shù)據(jù)。最終,對(duì)所得圖像平面中的塊邊緣進(jìn)行逆重疊濾波760。這產(chǎn)生重構(gòu)的2D數(shù)據(jù)輸出790。在示例性實(shí)現(xiàn)中,編碼器600(圖6)將輸入圖像壓縮成壓縮位流620(例如文件),而解碼器700(圖7)基于所采用的是無損還是有損編碼來重構(gòu)原始輸入或其近似。編碼過程涉及應(yīng)用下文討論的前向重疊變換(LT),這是用同樣在下文中更全面描述的可逆2維前/后濾波來實(shí)現(xiàn)的。解碼過程涉及應(yīng)用使用可逆2維前/后濾波的逆重疊變換(ILT)。所示的LT和ILT在確切的意義上是彼此的逆,并且因此可被統(tǒng)稱為可逆重疊變換。作為一種可逆變換,LT/ILT對(duì)可用于無損圖像壓縮。由所示編碼器600/解碼器700壓縮的輸入數(shù)據(jù)600可以是各種色彩格式(例如RGB/YUV4:4:4、YUV4:2:2或YUV4:2:0彩色圖像格式)的圖像。通常,輸入圖像總是具有亮度(Y)分量。如果它是RGB/YUV4:4:4、YUV4:2:2或YUV4:2:0圖像,則該圖像還具有諸如U分量和V分量等色度分量。圖像的這些分開的色彩平面或分量可以具有不同的空間分辨率。在輸入圖像是例如YUV4:2:0的色彩格式的情況下,U和V分量具有Y分量的一半的寬度和高度。如上所述,編碼器600將輸入圖像或圖片塊化成宏塊。在一示例性實(shí)現(xiàn)中,編碼器600將輸入圖像塊化成Y通道上的16x16像素區(qū)域(稱為"宏塊")(取決于色彩格式,可以是U和V通道中的16x16、16x8或8x8區(qū)域)。每一宏塊色彩平面被塊化成4x4的像素區(qū)或塊)。因此,對(duì)于該示例性編碼器實(shí)現(xiàn),宏塊按以下方式由各種色彩格式組成*對(duì)于灰度圖像,每一宏塊包含16個(gè)4x4的亮度(Y)塊。*對(duì)于YUV4:2:0格式彩色圖像,每一宏塊包含16個(gè)4><4的Y塊以及4個(gè)各自為4x4的色度(U和V)塊。*對(duì)于YUV4:2:2格式彩色圖像,每一宏塊包含16個(gè)"4的Y塊以及8個(gè)各自為4x4的色度(U和V)塊。*對(duì)于RGB或YUV4:4:4彩色圖像,每一宏塊對(duì)Y、U和V通道中的每一個(gè)包含16個(gè)塊。因此,在變換之后,該代表性編碼器600/解碼器700中的宏塊具有三個(gè)頻率子帶DC子帶(DC宏塊)、低通子帶(低通宏塊)以及高通子帶(高通宏塊)。在該代表性系統(tǒng)中,低通和/或高通子帶在位流中是可任選的一一這些子帶可以被完全丟棄。此外,壓縮數(shù)據(jù)可以按以下兩種次序之一被填塞到位流中空間次序和頻率次序。對(duì)于空間次序,瓦塊內(nèi)同一宏塊的不同子帶被排序在一起,并且所得的每一瓦塊的位流被寫入一個(gè)分組中。對(duì)于頻率次序,來自瓦塊內(nèi)的不同宏塊的同一子帶被分組在一起,并且因此瓦塊的位流被寫入以下三個(gè)分組中DC瓦塊分組、低通瓦塊分組以及高通瓦塊分組。此外,可以有其它數(shù)據(jù)層。由此,對(duì)于該代表性系統(tǒng),圖像按以下"維度"來組織*空間維度幀—瓦塊—宏塊;*頻率維度DCI低通I高通;以及*通道維度亮度|色度_0|色度—1...(例如如同Yiqv)。以上箭頭表示分層結(jié)構(gòu),而垂直條指示劃分。雖然該代表性系統(tǒng)以空間、頻率和通道維度來組織壓縮的數(shù)字媒體數(shù)據(jù),但是此處所描述的靈活量化方法可以應(yīng)用于沿著更少、更多或其它維度來組織其數(shù)據(jù)的替換編碼器/解碼器系統(tǒng)中。例如,該靈活量化方法可以應(yīng)用于使用更大數(shù)目的頻帶、其它格式的色彩通道(例如YIQ、RGB等)、附加圖像通道(例如,用于立體聲視覺或其它多照相機(jī)陣列)的編碼。參考各實(shí)施例描述和示出了本發(fā)明的原理之后,可以認(rèn)識(shí)到,可以在排列和細(xì)節(jié)上修改各實(shí)施例,而不脫離這些原理。應(yīng)當(dāng)理解,除非另外指明,否則此處所描述的程序、過程或方法不相關(guān)于或不限于任何特定類型的計(jì)算環(huán)境??梢勒沾颂幩枋龅慕虒?dǎo)來使用各種類型的通用或?qū)S糜?jì)算環(huán)境或執(zhí)行操作。以軟件示出的各實(shí)施例的元素可以用硬件來實(shí)現(xiàn),反之亦然。鑒于可應(yīng)用所公開的發(fā)明的原理的許多可能的實(shí)施例,應(yīng)該認(rèn)識(shí)到,所示的實(shí)施例僅是本發(fā)明的優(yōu)選示例,并且不應(yīng)該被認(rèn)為是對(duì)本發(fā)明的范圍的限制。相反,本發(fā)明的范圍由所附權(quán)利要求書來定義。因此,要求保護(hù)落入這些權(quán)利要求的范圍和精神之內(nèi)的所有內(nèi)容作為本發(fā)明。權(quán)利要求1.一種方法,包括接收圖像的數(shù)字圖像數(shù)據(jù),所述數(shù)字圖像數(shù)據(jù)包括降采樣的色度信息;根據(jù)將所述降采樣的色度信息的色度位置信息映射到X維度上的相位信息和Y維度上的相位信息的色度位置規(guī)則,確定所述色度位置信息,并且其中所述色度位置規(guī)則便于所述圖像的水平和垂直翻轉(zhuǎn)或旋轉(zhuǎn);用經(jīng)編碼的位流中的一個(gè)或多個(gè)句法元素來表示所述色度位置信息;以及輸出所述經(jīng)編碼的位流。2.如權(quán)利要求1所述的方法,其特征在于,所述色度信息在一個(gè)或多個(gè)維度上是按因子2來降采樣的。3.如權(quán)利要求l所述的方法,其特征在于,所述X維度上的相位信息包括半像素單位的相位信息。4.如權(quán)利要求l所述的方法,其特征在于,所述Y維度或X維度上的相位信息包括四分之一像素單位的相位信息。5.如權(quán)利要求l所述的方法,其特征在于,所述色度位置規(guī)則將所述色度位置信息映射到包括X相位位置O、0.5和1以及Y相位位置0、0.25、0.5、0.75和1的色度中心確定相位,其中所述相位位置是以像素為單位的。6.如權(quán)利要求1所述的方法,其特征在于,所述一個(gè)或多個(gè)句法元素包括表示所述X維度上的相位信息和所述Y維度上的相位信息兩者的單個(gè)句法元素。7.如權(quán)利要求l所述的方法,其特征在于,所述一個(gè)或多個(gè)句法元素包括表示所述X維度上的相位信息的第一句法元素和表示所述Y維度上的相位信息的第二句法元素。8.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)字圖像數(shù)據(jù)包括隔行數(shù)字圖像數(shù)據(jù)。9.如權(quán)利要求1所述的方法,其特征在于,所述色度位置規(guī)則將所述色度位置信息映射到包括相位位置-0.5、-0.25、0、0.25、0.5、0.75、1、1.25和1.5的色度中心確定相位,其中所述相位位置是以像素為單位的。10.如權(quán)利要求9所述的方法,其特征在于,所述色度位置規(guī)則還便于將所述圖像平移整數(shù)個(gè)像素。11.如權(quán)利要求1所述的方法,其特征在于,還包括使用所述色度位置信息來上采樣所述降采樣的色度信息。12.—種方法,包括接收圖像的經(jīng)編碼的數(shù)字圖像數(shù)據(jù),所述經(jīng)編碼的數(shù)字圖像數(shù)據(jù)包括色度信自.解碼降采樣的色度信息的色度位置信息,其中所述色度位置信息是根據(jù)色度位置規(guī)則來確定的,所述色度位置規(guī)則將所述色度位置信息映射到X維度上的相位信息和Y維度上的相位信息以便于所述圖像的水平和垂直翻轉(zhuǎn)或旋轉(zhuǎn);以及輸出經(jīng)解碼的位流。13.如權(quán)利要求12所述的方法,其特征在于,所述色度信息在一個(gè)或多個(gè)維度上是按因子2來降采樣的。14.如權(quán)利要求12所述的方法,其特征在于,所述X維度上的相位信息包括半像素單位的相位信息。15.如權(quán)利要求12所述的方法,其特征在于,所述Y維度或X維度上的相位信息包括四分之一像素單位的相位信息。16.如權(quán)利要求12所述的方法,其特征在于,所述色度位置信息的解碼包括解碼一個(gè)或多個(gè)句法元素,并且其中所述一個(gè)或多個(gè)句法元素包括表示所述X維度上的相位信息和所述Y維度上的相位信息兩者的單個(gè)句法元素。17.如權(quán)利要求12所述的方法,其特征在于,所述色度位置信息的解碼包括解碼一個(gè)或多個(gè)句法元素,并且其中所述一個(gè)或多個(gè)句法元素包括表示所述X維度上的相位信息的第一句法元素和表示所述Y維度上的相位信息的第二句法元素。18.如權(quán)利要求12所述的方法,其特征在于,還包括使用所述色度位置信息來上采樣所述降采樣的色度信息。19.一種方法,包括接收壓縮圖像的經(jīng)壓縮的數(shù)字圖像數(shù)據(jù),所述經(jīng)壓縮的數(shù)字圖像數(shù)據(jù)包括降采樣的圖像通道信息;根據(jù)多個(gè)可用位置規(guī)則中的第一位置規(guī)則來確定所述降采樣的圖像通道信息的圖像通道位置信息,所述多個(gè)可用位置規(guī)則中的每一個(gè)都用于將所述圖像通道位置信息映射到X維度上的相位信息和Y維度上的相位信息,以便于所述圖像的水平和垂直翻轉(zhuǎn)或旋轉(zhuǎn);以及使用所述圖像通道位置信息來執(zhí)行所述壓縮圖像的水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)或旋轉(zhuǎn)。20.如權(quán)利要求19所述的方法,其特征在于,所述降釆樣的圖像通道信息包括降采樣的色度信息,并且其中所述圖像通道位置信息包括色度位置信息。21.—種方法,包括接收圖像的經(jīng)編碼的數(shù)字圖像數(shù)據(jù),所述經(jīng)編碼的數(shù)字圖像數(shù)據(jù)包括色度信息5解碼降采樣的色度信息的色度位置信息;以及在變換下重新編碼所接收到的數(shù)字圖像數(shù)據(jù)的至少一部分,其中所述變換是水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)、旋轉(zhuǎn)或裁剪;其中所述重新編碼包括修改所述色度位置信息以反映所述變換。22.如權(quán)利要求21所述的方法,其特征在于,所述重新編碼包括無損編碼。23.如權(quán)利要求21所述的方法,其特征在于,所述重新編碼包括有損編碼。24.如權(quán)利要求21所述的方法,其特征在于,所述重新編碼包括變換域編碼。全文摘要描述了用于色度位置的信令和解釋的規(guī)則。一個(gè)稱為短規(guī)則的規(guī)則定義了15個(gè)離散的色度中心確定位置以及對(duì)應(yīng)的四位的句法元素。稱為擴(kuò)展規(guī)則的另一規(guī)則定義了81個(gè)離散的中心確定位置和對(duì)應(yīng)的七位的句法元素。一種所描述的方法包括在數(shù)字媒體編碼器處接收數(shù)字媒體數(shù)據(jù)、確定所接收到的數(shù)字媒體數(shù)據(jù)的色度位置信息、以及在經(jīng)編碼的位流中用一個(gè)或多個(gè)句法元素表示該色度位置信息。該一個(gè)或多個(gè)句法元素可用于將該色度位置信息傳遞給數(shù)字媒體解碼器。該色度位置信息便于圖像旋轉(zhuǎn)或翻轉(zhuǎn)。文檔編號(hào)H04N9/77GK101617540SQ200880005427公開日2009年12月30日申請日期2008年2月20日優(yōu)先權(quán)日2007年2月21日發(fā)明者C·圖,G·J·沙利文,S·斯里尼瓦杉,S·瑞古納薩恩申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
牡丹江市| 文安县| 古丈县| 抚州市| 海兴县| 龙口市| 平度市| 霍林郭勒市| 仪征市| 南京市| 论坛| 隆回县| 隆安县| 肥东县| 昭平县| 乳山市| 铁岭县| 厦门市| 广水市| 红原县| 长治市| 平乐县| 鹤岗市| 沁阳市| 芮城县| 平山县| 武宣县| 邢台县| 宁阳县| 花莲县| 海林市| 淳化县| 同仁县| 齐齐哈尔市| 武乡县| 永顺县| 三江| 曲水县| 望城县| 武夷山市| 武平县|