專利名稱:視頻編碼方法以及相應(yīng)的設(shè)備和信號的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻壓縮領(lǐng)域,例如,涉及MPEG族(MPEG-1,MPEG-2,MPEG-4)和ITU-H.26X族(H.261,H.263及擴(kuò)展,H.26L)的視頻編碼標(biāo)準(zhǔn)。更具體地,本發(fā)明涉及一種被應(yīng)用到與被再劃分成接連的視頻對象面(VOP)的接連的情景相對應(yīng)的視頻序列的編碼方法,該方法為編碼所述情景的所有的視頻對象而生成由編碼的視頻數(shù)據(jù)構(gòu)成的編碼的比特流,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有的元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道進(jìn)行描述。
本發(fā)明還涉及相應(yīng)的編碼設(shè)備、由這樣的編碼設(shè)備生成的編碼的比特流組成的可發(fā)送的視頻信號、以及用于接收和譯碼包含這樣的編碼的比特流的視頻信號的設(shè)備。
在第一視頻編碼標(biāo)準(zhǔn)(直到MPEG-2和H.263)中,視頻被假設(shè)為矩形,以及要藉助于一個亮度信道和兩個色度信道進(jìn)行描述。對于MPEG-4,引入了其他的信道α信道(在MPEG-4技術(shù)中也稱為“任意形狀信道”),用于描述視頻對象的輪廓,以及在后來的MPEG-4的版本中,引入附加信道,它能夠傳輸像深度、差異度或透明度那樣的內(nèi)容。例如,深度信道可被使用于其中能夠進(jìn)行三維導(dǎo)航的應(yīng)用。差異度信道被使用于其中需要內(nèi)容的兩個視圖的應(yīng)用,這樣,所述內(nèi)容可被顯示在能夠進(jìn)行立體觀看的設(shè)備上。對于由可能重疊的、不同的對象組成的內(nèi)容,需要透明度信道(用于對象的透明度信道可以是不透光的,對象紋理結(jié)構(gòu)則重寫其他對象的紋理結(jié)構(gòu);或是半透明的,顯示器上的紋理結(jié)構(gòu)則是由于對象的紋理結(jié)構(gòu)的交融造成的)。
正如在MPEG-4文件w3056,”Information Technology-Codingof audio-visual objects-Part 2Visual(信息技術(shù)-視聽對象的編碼-部分2視覺)”,ISO/IEC/JTC1/SC29/WG11,Maui,USA,1999年12月,part 6.2.3 Video Object Layer中規(guī)定的,描述像序列的透明度或差異度或深度那樣的的附加信道的唯一方式(在MPEG-4中)是使用句法元素“Video_object_layer_shape_extension”。為了經(jīng)由所述元素支持附加信道的編碼,通過MPEG-4提供的句法和語義在文件w3056的第35-36和110-112頁中給出(a)“Video_object_layer_verid”在表6-11中規(guī)定的這個4比特碼標(biāo)識視頻對象層的版本號;(b)“Video_object_layer_shape”在表6-14中規(guī)定的這個2比特碼標(biāo)識視頻對象層的形狀類型;(c)“Video_object_layer_shape_extension”在表V2-1中規(guī)定的這個4比特碼標(biāo)識可被使用的輔助部件的數(shù)目(多到3)和類型(在所述表中僅僅規(guī)定有限數(shù)目的類型和組合,以及通過選擇USERDEFINED(用戶規(guī)定的)類型,可能有更多的應(yīng)用)。
這些句法和語義表明,只對具有一個形狀的對象提供對于附加信道的傳輸?shù)闹С帧T谙胍l(fā)送矩形對象的亮度和色度信道以及像差異度那樣的一個附加信道的情形下,確實可以根據(jù)編碼效率解釋為何MPEG-4是亞最佳的。在MPEG-4中,對矩形對象的說明(由于代碼“Video_object_layer_shape”等于00,知道它實際上是矩形)需要按寬度和高度發(fā)送矩形的尺寸。在視頻對象層句法中給出的這個說明(見該文件的第36頁的六行25到30),需要31比特。當(dāng)想要用MPEG-4句法發(fā)送矩形對象的像深度信道或差異度信道那樣的附加信道時,只有通過設(shè)置代碼“Video_object_layer_shape”為11(灰度)來聲稱這個對象為非矩形的,而沒有其他方法。
一旦對象被聲稱為灰度(雖然它是矩形),句法就迫使發(fā)送描述對象形狀的比特,這是按照在文件第52頁§6.2.6宏塊,表的第1到6行,和第56頁§6.2.6.1MB二進(jìn)制形狀編碼,表的第1到5行中給出的句法在宏塊的級別上完成的。正如在文件第128-129頁中表示的,bab_type是可變的長度代碼包括在1與7比特之間,以及被提供來表示用于16×16像素的二進(jìn)制α塊的編碼模式,以及7個bab_type被顯示于表6-26。這樣的描述,例如對于CIF圖像,導(dǎo)致每幀浪費(fèi)至少396比特(每個宏塊至少一比特)。對于25Hz的CIF序列,估計開銷為9.9Kbit/s。
因此,本發(fā)明的目的是提出一種視頻編碼方法,允許避免這種比特浪費(fèi),從而提高編碼效率。
為此,本發(fā)明涉及諸如在說明書的引言部分規(guī)定的方法以及其特征在于,所述句法包括特定的信息,該特定的信息以高的描述級別表示在比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
優(yōu)選地,所述特定的信息包含以下附加句法元素video_object_layer_shape 1比特number_of_video_object_layer_additional_channel_descriptions n比特video_object_layer_additional_channels[i] 1比特第一元素表示是否存在應(yīng)當(dāng)被譯碼的輪廓或形狀信道,第二元素代表在編碼的比特流中存在的附加信道句法元素的數(shù)目,以便描述所述比特流的內(nèi)容,以及第三元素表示是否存在由數(shù)值[i]尋址的信道,i取0與2n-1之間的數(shù)值。
在本發(fā)明的另一個實施例中,所述特定的信息包含以下的附加的句法元素video_object_layer_shape 1比特number_of_video_object_layer_additional_channel_presence n比特video_object_layer_additional_channels[i]1比特第一元素表示是否存在應(yīng)當(dāng)被譯碼的輪廓或形狀信道,第二元素代表在編碼的比特流中存在的附加信道的數(shù)目,以及第三元素表示是否存在由數(shù)值[i]尋址的信道,i取0與2n-1之間的數(shù)值。
在第三實施例中,所述特定的信息包含以下的附加的句法元素video_object_layer_shape 1比特video_object_layer_additional_channels[i]1比特,0≤i≤2n-1第一元素表示是否存在然后應(yīng)當(dāng)被譯碼的輪廓或形狀信道,以及第二元素表示是否存在由數(shù)值[i]尋址的信道,i取0與2n-1之間的數(shù)值。
對于這三個解決方案的任一項,在比特流中可能不再提供video_object_layer_shape句法元素。
本發(fā)明也涉及用于編碼與接連的情景相對應(yīng)的視頻序列的設(shè)備,該接連的情景被再劃分成接連的視頻對象面(VOP),所述設(shè)備包括用于將所述序列的每個情景構(gòu)建為視頻對象(VO)的合成的裝置,用于編碼每個所述VO的形狀、運(yùn)動和紋理結(jié)構(gòu)的裝置,以及用于把這樣得到的編碼基本流復(fù)接成由編碼的視頻數(shù)據(jù)組成的單個編碼比特流的裝置,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道描述,所述設(shè)備的特征還在于,它還包括用于把特定的信息引入到所述編碼的比特流的裝置,該特定的信息以高的描述級別表示在該編碼的比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
本發(fā)明也涉及可傳輸?shù)囊曨l信號,包含通過被應(yīng)用到與接連的情景相對應(yīng)的序列的編碼方法而生成的編碼的比特流,該接連的情景被再劃分成接連的視頻對象面(VOP),為編碼所述情景的所有的視頻對象而生成的所述編碼的比特流由編碼的視頻數(shù)據(jù)組成,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道進(jìn)行描述,所述信號的特征還在于,所述編碼的比特流還包括特定的信息,該特定的信息以高的描述級別表示在這個編碼的比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
本發(fā)明最后涉及用于接收和譯碼視頻信號的設(shè)備,該視頻信號包含通過被應(yīng)用到與接連的情景相對應(yīng)的序列的編碼方法而生成的編碼的比特流,該接連的情景被再劃分成接連的視頻對象面(VOP),為編碼所述情景的所有的視頻對象而生成的所述編碼的比特流由編碼的視頻數(shù)據(jù)組成,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道進(jìn)行描述,所述編碼的比特流還包括特定的信息,該特定的信息以高的描述級別表示在這個編碼的比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
現(xiàn)在參照附圖更詳細(xì)地描述本發(fā)明,其中
圖1顯示其中可以實施按照本發(fā)明的編碼方法的MPEG編碼設(shè)備的例子。
為了解決以上解釋的比特浪費(fèi)的問題,按照本發(fā)明建議把有關(guān)附加信道可能存在的指示引入到編碼的比特流中。這個指示包含按照本發(fā)明以至少等價于視頻對象層(VOL)MPEG-4級別的高的描述級別被引入的特定的信息。
舉例來說,這個附加描述步驟按現(xiàn)在描述的被實施。規(guī)定以下的句法元素(a)”video_object_layer_shape” 1比特(b)”number_of_video_object_layer_additional_channel_descriptions” n比特(c)”video_object_layer_additional_channel[i]” 1比特以及這些元素的語義為(a)video_object_layer_shape這個1比特標(biāo)志表示形狀(或輪廓)信道的存在(如果被設(shè)置為1,則輪廓信道存在和應(yīng)當(dāng)被譯碼,而如果未設(shè)置為1,則預(yù)期沒有形狀或輪廓的描述);(b)number_of_video_object_layer_additional_channel_descriptions這個n比特?zé)o符號的整數(shù)代表在編碼的比特流中存在的附加信道句法元素的數(shù)目;(c)additional_channel_number這個整數(shù)取0與number_of_video_object_layer_additional_channel_descriptions之間的數(shù)值;(d)video_object_layer_additional_channel[additional_channel_number]這個1比特標(biāo)志表示由additional_channel_number的數(shù)值[i]尋址的信道存在與否。
在video_object_layer_additional_channel[additional_channel_number]與相關(guān)的信道的句法之間的對應(yīng)關(guān)系在以下的表中給出,對于number_of_video_object_layer_additional_channel_descriptions的數(shù)值1到2n,在表中稱為NAC(在給定的例子中n=4)
因此,按照本發(fā)明的建議產(chǎn)生了用于Video_object_layer的句法的修正版本。在文件w3056的第36頁,加上以下的句法元素(行15和以下)
可以給出對于各種類型的對象的實施方案(信道存在描述+相應(yīng)的句法)的例子,只在比特流中表示亮度信道存在時才譯碼表示色度信道存在的句法元素(a)彩色的4:2:2矩形序列video_object_layer_shape 0number_of_video_object_layer_additional_channel_descriptions 1video_object_layer_lum 1video_object_layer_chrom 1(b)具有不透光的對象的黑白情景,該對象具有輪廓但沒有紋理結(jié)構(gòu)video_object_layer_shape 1number_of_video_object_layer_additional_channel_descriptions 0(c)具有不透光的形狀(或輪廓)的4:2:2的黑白對象video_object_layer_shape 1number_of_video_object_layer_additional_channel_descriptions 1video_object_layer_lum 1video_object_layer_chrom 1(d)具有透明的α面的彩色的4:2:2矩形對象video_object_layer_shape 0number_of_video_object_layer_additional_channel_descriptions 2video_object_layer_lum 1video_object_layer_chrom 1video_object_layer_transparency1(e)具有其深度的4:2:2矩形對象video_object_layer_shape 0number_of_video_object_layer_additional_channel_descriptions 5video_object_layer_lum 1video_object_layer_chrom 1video_object_layer_transparency 0
video_object_layer_disparity 0video_object_layer_texture 0video_object_layer_depth 1還可建議以下的兩個替換的句法
上述的視頻編碼方法例如可以在諸如例如圖1所示的編碼設(shè)備中實施,圖1顯示具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測的MPEG編碼器的例子。這個編碼器包括編碼和預(yù)測級。編碼級本身包括串聯(lián)的模式判決電路11(用于確定選擇如MPEG中規(guī)定的編碼模式I、P或B)、DCT電路12、量化電路13、可變長度編碼電路14和緩存器15、以反饋連接提供的速率控制電路16,該速率控制電路16允許控制量化電路13的量化步長尺寸。預(yù)測級包括運(yùn)動估值電路21、后面跟隨運(yùn)動補(bǔ)償電路22、以及還有串聯(lián)的逆量化電路23、逆DCT電路24和加法器25、減法器26,該減法器26允許向編碼級發(fā)送在編碼設(shè)備的輸入信號IS與在預(yù)測級的輸出端(即,在運(yùn)動補(bǔ)償電路22的輸出端)處可獲得的預(yù)測信號之間的差值。這個差值或殘差是被編碼的比特流。由運(yùn)動估值電路21確定的運(yùn)動矢量連同緩存器15的輸出信號一起被發(fā)送到復(fù)接器31,以便在復(fù)接器的輸出端處被復(fù)接成輸出的編碼比特流CB。所述比特流CB是編碼的比特流,按照本發(fā)明,它包括特定的信息,表示在所述編碼比特流中可遇到的描述比特流的內(nèi)容的各種附加信道存在與否。
本發(fā)明也涉及可傳輸?shù)囊曨l信號,包含通過這樣的視頻編碼設(shè)備生成的編碼的比特流。
互易地,按照相應(yīng)的譯碼方法,在編碼比特流內(nèi)被發(fā)送到譯碼側(cè)的附加句法元素被接收它們與實行所述譯碼方法的視頻譯碼器中的適當(dāng)?shù)难b置讀出。能夠識別和譯碼該編碼比特流的內(nèi)容的所有的分段的譯碼器讀取所述附加句法元素以及然后知道一個或幾個附加信道存在與否。這樣的譯碼器可以是如編碼設(shè)備一樣的任何MPEG型,以及它的基本元件例如是串聯(lián)的接收編碼的比特流的輸入緩存器、VLC譯碼器、逆量化電路和逆DCT電路。在編碼和譯碼設(shè)備中,提供控制器用來管理編碼和譯碼操作的步驟。
本發(fā)明的優(yōu)選實施例的上述說明是為了說明和描述而給出的。不打算是唯一的或把本發(fā)明限于所公開的精確的形式,以及顯然根據(jù)以上的教導(dǎo)作出修正和變化對本領(lǐng)域技術(shù)人員是顯而易見的,并打算把它們包括在本發(fā)明的范圍內(nèi)。
例如,可以理解,這里描述的編碼和譯碼設(shè)備可以以硬件、軟件、或硬件與軟件的組合實施,而不排除能夠?qū)崿F(xiàn)幾個功能的單個硬件項或軟件項,或?qū)崿F(xiàn)單一功能的硬件項和軟件項或二者的組件。上述的方法和設(shè)備可以以任何類型的計算機(jī)系統(tǒng)或其他適當(dāng)?shù)脑O(shè)備實施。硬件和軟件的典型組合可以是具有計算機(jī)程序的通用計算機(jī)系統(tǒng),當(dāng)該計算機(jī)程序被裝載和執(zhí)行時控制計算機(jī)系統(tǒng),以使得它實現(xiàn)這里描述的方法。替換地,可以利用包含專用硬件的專用計算機(jī),用于實現(xiàn)本發(fā)明的一個或多個功能性任務(wù)。
本發(fā)明可以嵌入在計算機(jī)程序產(chǎn)品中,它包括使能實施這里描述的方法和功能的所有的特征,以及當(dāng)被裝載在計算機(jī)系統(tǒng)時,能夠?qū)崿F(xiàn)這些方法和功能。計算機(jī)程序、軟件程序、程序、程序產(chǎn)品或軟件,在本上下文中意思是打算使得具有信息處理能力的系統(tǒng)直接地或在以下任一項或二者之后執(zhí)行特定的功能的以任何語言、代碼或表示法表示的指令組的任何表達(dá)式(a)變換到另一種語言、代碼或表示法;和/或(b)以不同的材料形式重現(xiàn)。
權(quán)利要求
1.一種被應(yīng)用到與接連的情景相對應(yīng)的視頻序列的編碼方法,該接連的情景被再劃分成接連的視頻對象面(VOP),該方法為編碼所述情景的所有的視頻對象而生成由編碼的視頻數(shù)據(jù)構(gòu)成的編碼的比特流,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道進(jìn)行描述,所述方法的特征還在于,所述句法包括特定的信息,該特定的信息以高的描述級別表示在所述編碼比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
2.按照權(quán)利要求1的方法,其中所述特定的信息包含以下附加句法元素video_object_layer_shape 1比特number_of_video_object_layer_additional_channel_descriptions n比特video_object_layer_additional_channels[i] 1比特第一元素表示是否存在然后應(yīng)當(dāng)被譯碼的輪廓或形狀信道,第二元素代表在編碼的比特流中存在的附加信道句法元素的數(shù)目,以便描述所述比特流的內(nèi)容,以及第三元素表示是否存在由數(shù)值[i]尋址的信道,i取0與2n-1之間的數(shù)值。
3.按照權(quán)利要求1的方法,其中所述特定的信息包含以下附加句法元素video_object_layer_shape 1比特number_of_video_object_layer_additional_channel_presence n比特video_object_layer_additional_channels[i] 1比特第一元素表示是否存在應(yīng)當(dāng)被譯碼的輪廓或形狀信道,第二元素代表在編碼的比特流中存在的附加信道的數(shù)目,以及第三元素表示是否存在由數(shù)值[i]尋址的信道,i取0與2n-1之間的數(shù)值。
4.按照權(quán)利要求1的方法,其中所述特定的信息包含以下附加句法元素video_object_layer_shape 1比特video_object_layer_additional_channels[i]1比特,0≤i≤2n-1第一元素表示是否存在然后應(yīng)當(dāng)被譯碼的輪廓或形狀信道,以及第二元素表示是否存在由數(shù)值[i]尋址的信道,i取0與2n-1之間的數(shù)值。
5.按照權(quán)利要求2到4的任一項的方法,其特征在于,在比特流中不提供video_object_layer_shape句法元素。
6.一種用于編碼與接連的情景相對應(yīng)的視頻序列的設(shè)備,該接連的情景被再劃分成接連的視頻對象面(VOP),所述設(shè)備包括用于將所述序列的每個情景構(gòu)建為視頻對象(VO)的合成的裝置,用于編碼每個所述VO的形狀、運(yùn)動和紋理結(jié)構(gòu)的裝置,以及用于把這樣得到的編碼基本流復(fù)接成由編碼的視頻數(shù)據(jù)組成的單個編碼比特流的裝置,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道進(jìn)行描述,所述設(shè)備的特征還在于,它還包括用于把特定的信息引入到所述編碼的比特流的裝置,該特定的信息以高的描述級別表示在所述編碼比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
7.一種可傳輸?shù)囊曨l信號,包含通過被應(yīng)用到與接連的情景相對應(yīng)的視頻序列的編碼方法而生成的編碼的比特流,該接連的情景被再劃分成接連的視頻對象面(VOP),為編碼所述情景的所有的視頻對象而生成的所述編碼的比特流由編碼的視頻數(shù)據(jù)組成,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道進(jìn)行描述,所述信號的特征還在于,所述編碼的比特流還包括特定的信息,該特定的信息以高的描述級別表示在所述編碼的比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
8.一種用于接收和譯碼視頻信號的設(shè)備,該視頻信號包含通過被應(yīng)用到與接連的情景相對應(yīng)的視頻序列的編碼方法而生成的編碼的比特流,該接連的情景被再劃分成接連的視頻對象面(VOP),為編碼所述情景的所有的視頻對象而生成的所述編碼的比特流由編碼的視頻數(shù)據(jù)組成,其中每個數(shù)據(jù)項通過一種允許識別和譯碼所述比特流的內(nèi)容的所有元素的比特流句法來進(jìn)行描述,所述內(nèi)容藉助于分開的信道進(jìn)行描述,所述編碼的比特流還包括特定的信息,該特定的信息以高的描述級別表示在所述編碼的比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。
全文摘要
本發(fā)明涉及被應(yīng)用到相應(yīng)于接連的情景的視頻序列的編碼方法,該方法生成編碼的比特流,其中每個數(shù)據(jù)項藉助于允許在譯碼側(cè)識別和譯碼所述編碼比特流的內(nèi)容的所有元素的比特流句法進(jìn)行描述。按照本發(fā)明,所述句法包括特定的信息,它以高的描述級別表示在所述比特流中是否存在可遇到的描述所述比特流的內(nèi)容的各種附加信道。給出了特定的信息的幾個例子。
文檔編號H03M7/30GK1647538SQ03807322
公開日2005年7月27日 申請日期2003年3月19日 優(yōu)先權(quán)日2002年3月29日
發(fā)明者C·迪福爾, G·馬昆特, S·瓦倫特 申請人:皇家飛利浦電子股份有限公司