專利名稱:生成編碼畫面數(shù)據(jù)和對編碼畫面數(shù)據(jù)進行解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于生成編碼畫面數(shù)據(jù)、以及對編碼畫面數(shù)據(jù)進行解碼的方法和設(shè)備,從而在解碼器側(cè)執(zhí)行運動估計。
背景技術(shù):
運動補償時間預(yù)測是用于視頻信號壓縮中冗余降低的一種公知方法。傳輸當(dāng)前塊的預(yù)測誤差信號和運動向量,其中,描述了參考幀中預(yù)測器塊的位置。因此,針對編碼源像素而節(jié)約的部分?jǐn)?shù)據(jù)速率用于傳輸作為輔助(side)信息的運動向量數(shù)據(jù)。
發(fā)明內(nèi)容
本發(fā)明要解決的問題是,使用少量、或者不使用運動向量數(shù)據(jù)輔助信息,來對視頻信號進行編碼和解碼。在權(quán)利要求1和3中公開的方法解決了該問題。分別在權(quán)利要求2和4中公開了利用相應(yīng)方法的設(shè)備。
根據(jù)本發(fā)明,通過時間預(yù)測來實現(xiàn)壓縮質(zhì)量的提高和/或傳輸數(shù)據(jù)速率的降低,其中,所述時間預(yù)測較好地利用了編碼器和解碼器中可用的常識。
運動視頻通常展現(xiàn)了在多個連續(xù)的視頻幀、場、畫面或圖像中具有一致運動的對象。已知的運動補償以非?;镜姆绞嚼昧嗽撌聦?。編碼器執(zhí)行了在計算代價高的運動估計,而解碼器利用了從編碼器中接收的運動計算結(jié)果數(shù)據(jù)。然而,本發(fā)明使用了以更加復(fù)雜的方式在時間上始終如一地移動對象的知識,但是,本發(fā)明需要解碼器也執(zhí)行運動估計。在編碼器和解碼器處,對于相同組的視頻數(shù)據(jù),使用了公共基線運動估計過程,這導(dǎo)致了在編碼器和解碼器處生成相同的運動參數(shù)。這些公共運動參數(shù)用于在不需要將相關(guān)的運動參數(shù)明確地從編碼器傳輸至解碼器的情況下,生成“默認(rèn)”運動補償預(yù)測。
在兩個或多個幀或圖像之間執(zhí)行運動估計,其中,之前已經(jīng)對這些幀或圖像進行了壓縮,因而這些幀或圖像在編碼器或解碼器處均可用。對于當(dāng)前圖像的每個像素塊,執(zhí)行對相應(yīng)過去參考畫面中塊匹配的受限搜索,使得當(dāng)前的像素塊或宏塊位于由參考圖像中的匹配塊之間的運動參數(shù)定義的運動軌跡上。然后,將參考畫面中的最佳匹配塊中的一個或多個作為對于所述當(dāng)前像素塊的默認(rèn)預(yù)測器。
有利地,如果由編碼器來為像素的給定當(dāng)前塊或宏塊選擇默認(rèn)預(yù)測器(根據(jù)默認(rèn)運動補償預(yù)測),則不必要有相關(guān)運動向量的傳輸。
如果由于特定像素塊或宏塊的不充分的預(yù)測質(zhì)量而需要相關(guān)運動向量的傳輸,則仍然可以僅使用編碼器預(yù)測(用于計算非默認(rèn)預(yù)測器),以及特定像素塊或宏塊的運動向量數(shù)據(jù)的相關(guān)傳輸。
僅有的附加開銷是,要在解碼器側(cè)選擇默認(rèn)預(yù)測器還是非默認(rèn)預(yù)測器的數(shù)據(jù)信令。
作為每塊或宏塊發(fā)送該信息的信號的替代,還可以每個畫面發(fā)送信號,從而在這樣的情況下,對于畫面的所有塊或宏塊,本發(fā)明的運動估計/預(yù)測和基于運動的補償是基于不包括當(dāng)前畫面的參考畫面。
原理上,本發(fā)明的編碼方法適于生成使用運動估計和運動補償進行編碼的編碼畫面數(shù)據(jù),所述方法包括以下步驟-在時間預(yù)測模式中對當(dāng)前畫面的當(dāng)前像素塊或宏塊進行編碼的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面的重構(gòu)畫面信息,來計算相關(guān)的運動信息;-使用所述當(dāng)前像素塊或宏塊的計算的運動信息、以及來自所述參考畫面中的至少一個參考畫面的相應(yīng)畫面信息,來執(zhí)行所述運動補償;-對于所述當(dāng)前像素塊或宏塊、或者對于所述當(dāng)前畫面,在所述編碼畫面數(shù)據(jù)中,包括指示相應(yīng)類型的編碼的運動處理信息,但是不包括運動向量數(shù)據(jù)。
原理上,本發(fā)明的編碼設(shè)備適于生成使用運動估計和運動補償進行編碼的編碼畫面數(shù)據(jù),所述設(shè)備包括
-運動估計裝置,在時間預(yù)測模式中對當(dāng)前畫面的當(dāng)前像素塊或宏塊進行編碼的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面的重構(gòu)畫面信息,來計算相關(guān)的運動信息;-運動補償裝置,用于使用來自所述參考畫面中的至少一個參考畫面的相應(yīng)畫面信息,針對所述當(dāng)前像素塊或宏塊應(yīng)用計算的運動信息;-裝置,用于對于所述當(dāng)前像素塊或宏塊、或者對于所述當(dāng)前畫面,在所述編碼畫面數(shù)據(jù)中,包括指示相應(yīng)類型的編碼的運動處理信息,但是不包括運動向量數(shù)據(jù)。
原理上,本發(fā)明的解碼方法適于對使用運動估計和運動補償進行編碼的編碼畫面數(shù)據(jù)進行解碼,所述方法包括以下步驟-對于在時間預(yù)測模式中編碼的當(dāng)前像素塊或宏塊、或者當(dāng)前畫面,從所述編碼畫面數(shù)據(jù)中提取運動處理信息,所述運動處理信息指示,是否要使用在所述編碼畫面數(shù)據(jù)中所包括的運動向量數(shù)據(jù),來對所述當(dāng)前像素塊或宏塊、或者所述當(dāng)前畫面進行解碼,以及,對于所述當(dāng)前像素塊或宏塊(所述當(dāng)前像素塊或宏塊屬于當(dāng)前畫面),在將不會使用包括運動向量數(shù)據(jù)的編碼畫面數(shù)據(jù)的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面的重構(gòu)畫面信息,來計算相關(guān)的運動向量信息,其中,所述預(yù)定規(guī)則與在對所述當(dāng)前像素塊或宏塊進行編碼時應(yīng)用的預(yù)定規(guī)則相對應(yīng);-使用計算的運動向量信息、以及來自所述參考畫面的至少一個參考畫面的相應(yīng)畫面信息,來為所述當(dāng)前像素塊或宏塊執(zhí)行運動補償。
原理上,本發(fā)明的解碼設(shè)備適于對使用運動估計和運動補償進行編碼的編碼畫面數(shù)據(jù)進行解碼,所述設(shè)備包括-裝置,用于對于在時間預(yù)測模式中編碼的當(dāng)前像素塊或宏塊、或者當(dāng)前畫面,從所述編碼畫面數(shù)據(jù)中提取運動處理信息,所述運動處理信息指示,是否要使用在所述編碼畫面數(shù)據(jù)中所包括的運動向量數(shù)據(jù),來對所述當(dāng)前像素塊或宏塊、或者所述當(dāng)前畫面進行解碼,-裝置,用于對于所述當(dāng)前像素塊或宏塊(所述當(dāng)前像素塊或宏塊屬于當(dāng)前畫面),在將不會使用包括運動向量數(shù)據(jù)的編碼畫面數(shù)據(jù)的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面的重構(gòu)畫面信息,來計算相關(guān)的運動向量信息,其中,所述預(yù)定規(guī)則與在對所述當(dāng)前像素塊或宏塊進行編碼時應(yīng)用的預(yù)定規(guī)則相對應(yīng);-運動補償裝置,使用來自所述參考畫面的至少一個參考畫面的相應(yīng)畫面信息,針對所述當(dāng)前像素塊或宏塊應(yīng)用所述計算的運動向量信息。
在各個從屬權(quán)利要求中,公開了本發(fā)明有利的附加實施例。
參照附圖,對本發(fā)明的示例性實施例進行描述,其中圖1是使用兩個過去的參考幀的對當(dāng)前幀的線性運動預(yù)測;圖2是使用一個過去的參考幀和一個未來的參考幀對當(dāng)前幀的線性運動預(yù)測;圖3是使用多于兩個過去的參考幀對當(dāng)前幀的線性運動預(yù)測;圖4是使用三個過去的參考幀對當(dāng)前幀的非線性運動預(yù)測;圖5是本發(fā)明的編碼器;圖6是本發(fā)明的解碼器;圖7是P型參考畫面的子序列;圖8是B型非參考畫面的子序列。
具體實施例方式
在編碼器和解碼器中,以保證兩側(cè)具有相同結(jié)果的方式來執(zhí)行基線(baseline)運動估計過程。假設(shè)該基線運動估計過程由塊匹配組成,這需要定義運動搜索分辨率(例如,±1/2像素精度)、搜索范圍±RNG(例如,RNG=64像素)、以及搜索策略(例如,完全搜索或特定的精確定義分級搜索)的相同成本函數(shù)(例如,絕對幀像素差之和)。
基線運動估計過程是受限的,使得編碼器和解碼器共享參考幀與當(dāng)前幀Cur之間的相同運動假設(shè)(和計算)。例如,在使用線性運動假設(shè)和兩個參考幀R1和R2的情況下,對于當(dāng)前幀Cur中的每個當(dāng)前塊Bcur(X,Y)來說,這意味著,在參考幀R1和R2中的所搜索的塊Br1和Br2由規(guī)則或公式連接,其中,該規(guī)則或公式表示兩個參考幀與當(dāng)前幀之間的時間關(guān)系。
示例1當(dāng)前幀位于t=t0處。有兩個參考幀R1和R2,分別位于過去的t=t0-T和t=t0-2T處,因此,T是幀周期。如在圖1中示出的,對于一維的、vx,vy位于范圍[-RNG…RNG]的情況,在該情況下,使用塊Br1(X-vx,Y-vy)和Br2(X-2vx,Y-2vy),為Bcur(X,Y)估計運動向量(vx,vy)。
示例2當(dāng)前幀位于t=t0處。有兩個參考幀R1和R2,分別地,一個位于過去的t=t0-T處、以及一個位于未來的t0+T處。如在圖2中示出的,對于一維的、vx,vy位于范圍[-RNG…RNG]的情況,在該情況下,使用塊Br1(X-vx,Y-vy)和Br2(X+vx,Y+vy),為Bcur(X,Y)估計運動向量(vx,vy)。
多個最佳匹配對于給出的塊的基線運動估計過程,可以產(chǎn)生具有相同的最低代價函數(shù)值的多個候選運動向量。在該情況下,需要選擇最佳匹配的附加標(biāo)準(zhǔn)。附加標(biāo)準(zhǔn)使用的選擇是依據(jù)應(yīng)用于非默認(rèn)運動預(yù)測器的編碼類型,該非默認(rèn)運動預(yù)測器需要運動向量數(shù)據(jù)的傳輸,以便優(yōu)化運動向量數(shù)據(jù)壓縮效率。
例如,如果使用了運動向量預(yù)測,則選擇與運動向量預(yù)測器最類似的運動向量的匹配。否則,選擇最靠近原始塊(即,運動向量的最小絕對值)的匹配(或塊)。
默認(rèn)預(yù)測器塊的選擇對于所識別的最佳匹配運動向量,在兩個參考幀中的兩個塊均是當(dāng)前幀Cur中當(dāng)前塊Bcur的預(yù)測器候選。例如,當(dāng)前塊Bcur的實際預(yù)測器可以是這兩個最佳匹配塊之一、或者這兩個塊的逐像素平均、或者這兩個塊的任何其它加權(quán)的組合。如果兩個參考幀具有與當(dāng)前幀的不同的時間間距,則從較靠近當(dāng)前幀Cur的參考幀中選擇最佳匹配塊是有利的。如果兩個參考幀具有與當(dāng)前幀相同的時間間距(如以上的示例2),則選擇兩個最佳匹配塊的逐像素平均作為最佳匹配塊是有利的。
多個參考幀可以擴展基線運動估計過程,以在多于兩個的參考幀中進行搜索。在該情況下,例如,兩個參考幀中的每組或每對、以及當(dāng)前幀Cur受到以上描述的受限預(yù)測。在圖3中示出了在幀R1和R2之間的搜索、以及在幀R1和R3之間的搜索。應(yīng)用如上所述的關(guān)于多個最佳匹配的規(guī)則和預(yù)測器塊的選擇,從這些參考幀對的任一對中最佳匹配塊中選擇默認(rèn)預(yù)測器。
較高階運動模型假設(shè)如果使用了多于兩個的參考幀,而不使用如以上段落中的用于匹配的多對幀,則可以在假設(shè)線性加速度或減速度(即,非線性運動)的條件下搜索最佳匹配塊,在編碼器和解碼器之間共享較高階運動模型假設(shè)。
作為示例,等距的參考幀R1,R2和R3分別位于t0-T、t0-2T和t0-3T處,以及運動方程式是類型s=v0t+at2,其中,“s”是遍歷的距離,“v0”是初始速度、以及“a”是加速度?,F(xiàn)在,要確定的運動參數(shù)由運動向量(vx,vy)和加速度參數(shù)(ax,ay)組成。考慮到加速度的二次相關(guān)性,為當(dāng)前幀Cur的給出的塊Bcur來進行搜索的參考幀R1,R2和R3的各個塊Br1,Br2和Br3之間的必要限制變得明顯。對于當(dāng)前塊Bcur(X,Y),要對塊Br1(X-vx-ax,Y-vy-ay),Br2(X-2vx-2ax,Y-2vy-2ay)以及Br3(X-3vx-4ax,Y-3vy-4ay)進行比較。vx,vy,ax和ay可以在最大運動搜索范圍內(nèi)(例如,位于范圍[-RNG…RNG]內(nèi)的3vx+4ax和位于范圍[-RNG…RNG]內(nèi)的3vy+4ay)發(fā)生改變。圖4描述了在一維情況下的相應(yīng)預(yù)測。
通過使用將Br1與Br2之間的絕對值差之和相加,以及將此絕對值差之和與Br2與Br3之間的絕對值差之和相加的加法代價函數(shù),來確定最佳組運動參數(shù)(vx,vy)和(ax,ay)。在發(fā)現(xiàn)該組最佳匹配塊和相關(guān)運動參數(shù)之后,在這種情況下的默認(rèn)預(yù)測器塊是來自最靠近的參考幀R1中的最佳匹配塊。還可以使用非等距參考幀、或者部分位于過去和部分位于當(dāng)前幀的將來的參考幀,利用考慮了不同時間間距的受限的搜索塊的適當(dāng)修改,來執(zhí)行具有較高階運動假設(shè)的運動估計。
本發(fā)明并不受限于經(jīng)典地與視頻編碼(如,塊匹配)相關(guān)的運動估計算法,還可以有利地與時間遞歸運動估計算法組合,其中,時間遞歸運動估計算法已知用于對遠優(yōu)于塊匹配的真實運動(或者“光流(optical flow)”)進行重構(gòu)。遞歸運動估計算法可以生成每像素的運動信息,其中,該每像素的運動信息(由于最大數(shù)據(jù)速率限制)禁止在壓縮模式中進行傳輸。
然而,當(dāng)使用本發(fā)明時,這樣的運動信息的傳輸并不是必需的,因此本發(fā)明還可以用于使用像素運動向量分辨率的時間預(yù)測。
在圖5中,例如編碼器的視頻數(shù)據(jù)輸入信號IE包含包括用于編碼的亮度和色度像素塊的16*16宏塊。在要對視頻數(shù)據(jù)進行幀內(nèi)或場內(nèi)編碼(I模式)的情況下,這些視頻數(shù)據(jù)經(jīng)過未修改的減法器SUB。之后,在離散余弦變換裝置DCT和在量化裝置Q中處理例如16*16宏塊的8*8像素塊,并通過熵編碼器ECOD,饋送至輸出編碼器視頻數(shù)據(jù)輸出信號OE的多路復(fù)用器MUX。熵編碼器ECOD可以對量化的DCT系數(shù)來執(zhí)行霍夫曼編碼。在多路復(fù)用器MUX中,頭部信息和運動向量數(shù)據(jù)MV、以及可能的編碼音頻數(shù)據(jù)與編碼視頻數(shù)據(jù)進行組合。在要對視頻數(shù)據(jù)進行幀間或場間編碼(P或B模式,P指“預(yù)測的”、以及B指“雙向預(yù)測的”)的情況下,在塊的基礎(chǔ)上,從減法器SUB中的輸入信號IE中減去預(yù)測宏塊數(shù)據(jù)PMD,以及8*8塊差值數(shù)據(jù)通過變換裝置DCT和量化裝置Q,饋送入熵編碼器ECOD。還在相應(yīng)的反量化裝置QE-1中處理量化裝置Q的輸出信號,將反量化裝置QE-1的輸出信號以重構(gòu)塊或宏塊差值數(shù)據(jù)RMDD的形式,通過相應(yīng)的反離散余弦變換裝置DCTE-1饋至組合器ADDE。將ADDE的輸出信號緩沖存儲于運動補償裝置FS_MC_E中的畫面存儲器中,該運動補償裝置FS_MC_E執(zhí)行重構(gòu)宏塊數(shù)據(jù)的運動補償,以及將相應(yīng)的預(yù)測宏塊數(shù)據(jù)PMD輸出至SUB的相減輸入、以及至組合器ADDE的另一輸入。例如,由熵編碼器ECOD中的編碼緩沖器的占用等級(occupancy level)來控制量化裝置Q和反量化裝置QE-1的特性。運動估計器ME接收輸入信號IE,并向運動補償裝置FS_MC_E提供必要的運動信息,以及向多路復(fù)用器MUX提供運動向量數(shù)據(jù)MV,用于傳輸至相應(yīng)的解碼器,以及在相應(yīng)的解碼器中進行估計。QE-1,DCTE-1,ADDE和FS_MC_E構(gòu)成了接收機端解碼器的仿真,這將結(jié)合圖6進行描述。
運動估計器ME計算包括在兩個基本不同模式中的運動向量的運動信息,其中,在以上描述了第一模式。第二模式與本發(fā)明相關(guān)。在該第二模式中,ME不使用來自輸入信號IE的畫面數(shù)據(jù),而是使用來自運動補償裝置FS_MC_E提供的重構(gòu)畫面(幀或場)中的數(shù)據(jù)。FS_MC_E和ME包括存儲器,用于存儲上述所需參考畫面R1和R2、或者R1,R2和R3。在第二模式中,ME還提供了具有運動向量數(shù)據(jù)的運動補償器FS_MC_E,但是不將運動向量數(shù)據(jù)MV傳輸至多路復(fù)用器MUX。相反,通過內(nèi)部運動向量標(biāo)記IMVF,發(fā)送信號至多路復(fù)用器MUX(從而至接收機側(cè)的解碼器),其中,在接收機側(cè)的運動補償中使用內(nèi)部計算的運動向量數(shù)據(jù)MV(參見圖6)。內(nèi)部運動向量標(biāo)記IMVF可以是獨立的標(biāo)記、或者可以隱藏于運動向量數(shù)據(jù)或運動信息數(shù)據(jù)的特定碼字中。
在圖6中,通過多路分解器DEMUX、熵解碼器裝置EDEC、反量化裝置QD-1和反離散余弦變換裝置DCTD-1,將編碼視頻數(shù)據(jù)輸入信號ID饋入組合器ADDE,組合器ADDE輸出視頻數(shù)據(jù)輸出信號OD。例如,EDEC可以為霍夫曼編碼和量化的系數(shù)執(zhí)行霍夫曼解碼。多路分解器DEMUX相應(yīng)地分離比特流頭部信息、編碼視頻數(shù)據(jù)、視頻數(shù)據(jù)類型數(shù)據(jù)(I、P、B)和運動信息數(shù)據(jù)(類似于內(nèi)部運動向量標(biāo)記數(shù)據(jù)IMVF和運動向量數(shù)據(jù)MV)。
QD-1、DCTD-1和EDEC具有圖5編碼器中的Q,DCT和ECOD函數(shù)的相應(yīng)的反函數(shù),與相應(yīng)的宏塊和像素塊大小相關(guān)。ADDD的輸出信號中間地存儲于運動補償裝置FS_MC_D的畫面數(shù)據(jù)緩沖區(qū)中,F(xiàn)S_MC_D根據(jù)所傳輸?shù)倪\動向量數(shù)據(jù)MV、或者內(nèi)部生成的運動向量數(shù)據(jù)IMV,影響著對重構(gòu)宏塊數(shù)據(jù)的運動補償,以及在P或B模式的情況下,將相應(yīng)的預(yù)測塊或宏塊數(shù)據(jù)PMD輸出至加法器ADDD的另一輸入,其中,在加法器中,基于塊將預(yù)測數(shù)據(jù)與所接收的塊差值數(shù)據(jù)進行組合。在I模式的情況下,沒有預(yù)測畫面數(shù)據(jù)應(yīng)用于加法器ADDD的第二輸入。
IMVF的狀態(tài)確定運動補償裝置FS_MC_D是否使用所發(fā)送和接收的運動向量數(shù)據(jù)MV、或者在內(nèi)部估計器IME中內(nèi)部生成的運動向量數(shù)據(jù)IMV。FS_MC_D和IME包括存儲器,用于存儲上述所需的參考畫面R1和R2、或者R1,R2和R3。如以上所解釋的,編碼器中的ME和解碼器中的IME基于相同的參考畫面數(shù)據(jù),使用相同的運動估計處理來估計畫面內(nèi)容中的運動(即,塊或宏塊的畫面內(nèi)容的運動),因而導(dǎo)致了運動信息輸出數(shù)據(jù)的相同內(nèi)容。
作為編碼器中的裝置DCT,Q,QE-1,DCTE-1和ECOD,以及解碼器中的裝置DCOD,QE-1和DCTE-1的替代,可以使用包括了運動預(yù)測和補償?shù)娜魏纹渌愋偷木幋a/解碼環(huán)路。
本發(fā)明還可以用于以在圖7和圖8的連接中所示出的方式,對畫面序列進行編碼、傳輸或解碼,在圖7和圖8中,序列處于當(dāng)前畫面可用、或者不可用作后續(xù)畫面的參考畫面的交替方式。在圖7中,從I或P畫面處開始,畫面序列中的每秒畫面是準(zhǔn)P型畫面,即,用于編碼器和解碼器中作為時間預(yù)測或運動估計基礎(chǔ)、從而形成參考畫面子序列的參考畫面。在圖8中,畫面序列中的每秒畫面是準(zhǔn)B型的非參考畫面,每個準(zhǔn)B型非參考畫面在兩個準(zhǔn)P型畫面之間排列,即,將不用于編碼器和解碼器中的畫面作為時間預(yù)測或運動估計的參考。從兩個或多個相應(yīng)的參考畫面中(優(yōu)選地,從兩個相鄰的參考畫面中)預(yù)測準(zhǔn)B畫面。作為可選項,兩個或多個準(zhǔn)B畫面可以位于每個準(zhǔn)P畫面之間。
有利地,本發(fā)明可以用于實現(xiàn)一致的MPEG GOP(畫面組)結(jié)構(gòu)使用基于參考畫面的編碼器/解碼器預(yù)測來生成準(zhǔn)P畫面。之后,可以使用相對于已知的MPEG B畫面結(jié)構(gòu)中的那些運動向量場更加精細或改進了的運動向量場,來生成準(zhǔn)B畫面。
本發(fā)明的優(yōu)點是,無論場景內(nèi)的運動有多復(fù)雜,運動信息的開銷都保持非常低。
在臨時缺少帶寬的情況下,由于即使細節(jié)將會錯誤地開始,但至少保留了場景內(nèi)運動的良好軌跡,所以甚至可以使用一個比特來傳送編碼圖像,其中,該比特指示“使用每個塊的默認(rèn)預(yù)測器”,產(chǎn)生比當(dāng)前技術(shù)水平的“重復(fù)最后的畫面”更好的結(jié)果。
典型地,運動信息(運動向量、預(yù)測類型等)總計是使用最新技術(shù)發(fā)展水平的視頻編解碼的編碼數(shù)據(jù)的10-20%。依據(jù)所選擇的基線運動估計過程的質(zhì)量,可以節(jié)省該數(shù)據(jù)速率中的大部分,以及將該數(shù)據(jù)速率中的大部分用于預(yù)測誤差信號的改進后的傳輸。
權(quán)利要求
1.一種生成編碼畫面數(shù)據(jù)(OE)的方法,所述畫面數(shù)據(jù)使用運動估計(ME)和運動補償(FS_MC_E)進行編碼(SUB,DCT,Q,QE-1,DCTE-1,ECOD,ADDE),所述方法的特征在于以下步驟-在時間預(yù)測模式中,對當(dāng)前畫面(Cur)的當(dāng)前像素塊或宏塊(Bcur)進行編碼的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面(R1,R2,R3)的重構(gòu)畫面信息,來計算(ME)相關(guān)的運動信息;-使用所述當(dāng)前像素塊或宏塊的計算的運動信息、以及來自所述參考畫面中的至少一個參考畫面的相應(yīng)畫面信息,來執(zhí)行所述運動補償(FS_MC_E);-對于所述當(dāng)前像素塊或宏塊(Bcur)、或者對于所述當(dāng)前畫面,將指示相應(yīng)類型的編碼的(MUX)運動處理信息(IMVF)包括在所述編碼畫面數(shù)據(jù)(OE)中,而不將運動向量數(shù)據(jù)(MV)包括在所述編碼畫面數(shù)據(jù)(OE)中。
2.一種生成編碼畫面數(shù)據(jù)(OE)的設(shè)備,所述畫面數(shù)據(jù)使用運動估計(ME)和運動補償(FS_MC_E)進行編碼(SUB,DCT,Q,QE-1,DCTE-1,ECOD,ADDE),所述設(shè)備包括-運動估計裝置(ME),用于在時間預(yù)測模式中,對當(dāng)前畫面(Cur)的當(dāng)前像素塊或宏塊(Bcur)進行編碼的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面(R1,R2,R3)的重構(gòu)畫面信息,來計算相關(guān)的運動信息;-運動補償裝置(FS_MC_E),使用來自所述參考畫面中的至少一個參考畫面的相應(yīng)畫面信息,針對所述當(dāng)前像素塊或宏塊應(yīng)用計算的運動信息;-裝置(MUX),用于對于所述當(dāng)前像素塊或宏塊(Bcur)、或者對于所述當(dāng)前畫面,將指示相應(yīng)類型的編碼的運動處理信息(IMVF)包括在所述編碼畫面數(shù)據(jù)(OE)中,但是不將運動向量數(shù)據(jù)(MV)包括在所述編碼畫面數(shù)據(jù)(OE)中。
3.一種用于對編碼畫面數(shù)據(jù)(ID)進行解碼的方法,所述畫面數(shù)據(jù)使用運動估計(ME)和運動補償(FS_MC_E)進行編碼(SUB,DCT,Q,QE-1,DCTE-1,ECOD,ADDE),其特征在于以下步驟-對于在時間預(yù)測模式中編碼的當(dāng)前像素塊或宏塊(Bcur)、或者當(dāng)前畫面,從所述編碼畫面數(shù)據(jù)中提取(DEMUX)運動處理信息(IMVF),所述運動處理信息(IMVF)指示了是否要使用在所述編碼畫面數(shù)據(jù)中所包括的運動向量數(shù)據(jù)(MV)來對所述當(dāng)前像素塊或宏塊、或者所述當(dāng)前畫面進行解碼,以及,對于屬于當(dāng)前畫面(Cur)的所述當(dāng)前像素塊或宏塊(Bcur),在不會使用包括運動向量數(shù)據(jù)的編碼畫面數(shù)據(jù)的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面(R1,R2,R3)的重構(gòu)畫面信息,來計算相關(guān)的運動向量信息,其中,所述預(yù)定規(guī)則與在對所述當(dāng)前像素塊或宏塊進行編碼時應(yīng)用的預(yù)定規(guī)則相對應(yīng);-使用所述計算的運動向量信息、以及來自所述參考畫面的至少一個參考畫面的相應(yīng)畫面信息,來針對所述當(dāng)前像素塊或宏塊執(zhí)行運動補償(FS_MC_D)。
4.一種用于對編碼畫面數(shù)據(jù)(ID)進行解碼的設(shè)備,所述畫面數(shù)據(jù)使用運動估計(ME)和運動補償(FS_MC_E)進行編碼(SUB,DCT,Q,QE-1,DCTE-1,ECOD,ADDE),所述設(shè)備包括-裝置(DEMUX),用于對于在時間預(yù)測模式中編碼的當(dāng)前像素塊或宏塊(Bcur)、或者當(dāng)前畫面,從所述編碼畫面數(shù)據(jù)中提取運動處理信息(IMVF),所述運動處理信息(IMVF)指示了是否要使用在所述編碼畫面數(shù)據(jù)中所包括的運動向量數(shù)據(jù)(MV),來對所述當(dāng)前像素塊或宏塊、或者所述當(dāng)前畫面進行解碼,-裝置(IME),用于對于屬于當(dāng)前畫面(Cur)的所述當(dāng)前像素塊或宏塊(Bcur),在不會使用包括運動向量數(shù)據(jù)的編碼畫面數(shù)據(jù)的情況下,根據(jù)預(yù)定規(guī)則,使用來自不包括所述當(dāng)前畫面的至少兩個參考畫面(R1,R2,R3)的重構(gòu)畫面信息,來計算相關(guān)的運動向量信息,其中,所述預(yù)定規(guī)則與在對所述當(dāng)前像素塊或宏塊進行編碼時應(yīng)用的預(yù)定規(guī)則相對應(yīng);-運動補償裝置(FS_MC_D),用于使用來自所述參考畫面的至少一個參考畫面的相應(yīng)畫面信息,針對所述當(dāng)前像素塊或宏塊應(yīng)用所述計算的運動向量信息。
5.如權(quán)利要求1至4之一所述的方法或設(shè)備,其中,使用兩個參考畫面(R1,R2),所述兩個參考畫面(R1,R2)在時間上均位于所述當(dāng)前畫面(Cur)之前;或者所述兩個參考畫面(R1,R2)中的一個參考畫面在時間上位于所述當(dāng)前畫面之前,以及另一個參考畫面在時間上位于所述當(dāng)前畫面之后。
6.如權(quán)利要求1至5之一所述的方法或設(shè)備,其中,如果對于所述當(dāng)前像素塊或宏塊(Bcur)的運動向量,在所述參考畫面(R1,R2,R3)中發(fā)現(xiàn)具有相同最低代價函數(shù)值的兩個最佳匹配塊,以及相關(guān)的參考畫面具有與所述當(dāng)前畫面不同的時間間距,則為了預(yù)測所述當(dāng)前像素塊或宏塊,選擇在時間上較靠近所述當(dāng)前畫面(Cur)的相關(guān)參考畫面的那個最佳匹配塊,或者如果相關(guān)參考畫面具有與所述當(dāng)前畫面相同的時間間距,則為了預(yù)測所述當(dāng)前像素塊或宏塊,來使用兩個最佳匹配塊的逐像素平均。
7.如權(quán)利要求1至6之一所述的方法或設(shè)備,其中,多于兩個的參考畫面(R1,R2,R3)用于計算運動向量信息,以及在這些參考畫面的不同對中,搜索與所述當(dāng)前像素塊或宏塊(Bcur)相關(guān)的所述運動向量信息。
8.如權(quán)利要求7所述的方法或設(shè)備,其中,所述多于兩個的參考畫面(R1,R2,R3)用于計算包括非線性類型運動的運動向量信息。
9.如權(quán)利要求1至8之一所述的方法或設(shè)備,其中,所述運動估計(ME)是提供每像素的運動向量信息的遞歸運動估計。
10.一種包括編碼畫面數(shù)據(jù)的比特流,所述編碼畫面數(shù)據(jù)使用如權(quán)利要求1至9之一所述的方法進行編碼。
11.一種在其上記錄或存儲比特流的存儲介質(zhì),所述比特流包括編碼畫面數(shù)據(jù),所述編碼畫面數(shù)據(jù)使用如權(quán)利要求1和5至9之一所述的方法進行編碼。
12.一種代表畫面序列的信號,所述畫面序列使用如權(quán)利要求1和5至9之一所述的方法進行編碼,其中,序列是當(dāng)前畫面可用作后續(xù)畫面的參考畫面、或者不可用作后續(xù)畫面的參考畫面的交替方式。
全文摘要
運動補償時間預(yù)測已知用于視頻信號壓縮中的冗余降低。傳輸當(dāng)前塊的預(yù)測誤差信號和運動向量,這描述了參考畫面中預(yù)測器塊位置。本發(fā)明所解決的問題是使用很少的、或者不使用運動向量數(shù)據(jù)輔助信息,來對視頻信號進行編碼和解碼。這通過時間預(yù)測來實現(xiàn),其中,所述時間預(yù)測利用了編碼器和解碼器中可用的常識,需要解碼器也執(zhí)行運動估計。在編碼器和解碼器處,對于相同組的視頻數(shù)據(jù)使用了公共基線運動估計過程,這導(dǎo)致了在編碼器和解碼器處生成相同的運動參數(shù),其中,所述相同組視頻數(shù)據(jù)在之前已經(jīng)經(jīng)過壓縮,因而在編碼器和解碼器處均可用。這些公共運動參數(shù)用于在不需要將相關(guān)的運動參數(shù)從編碼器傳輸至解碼器的情況下,生成默認(rèn)時間預(yù)測。
文檔編號H04N7/36GK1977539SQ200580020600
公開日2007年6月6日 申請日期2005年5月23日 優(yōu)先權(quán)日2004年6月24日
發(fā)明者卡斯騰·赫佩爾, 海因茨·維爾納·基森 申請人:湯姆森許可貿(mào)易公司