两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

視頻數(shù)據(jù)編碼器和解碼器的制作方法

文檔序號:7570144閱讀:794來源:國知局
專利名稱:視頻數(shù)據(jù)編碼器和解碼器的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于執(zhí)行視頻數(shù)據(jù)的運動補償編碼的編碼器和一種對運動補償編碼的視頻數(shù)據(jù)進(jìn)行解碼的解碼器。本發(fā)明還涉及一種視頻數(shù)據(jù)的運動補償編碼方法和一種對運動補償編碼的視頻數(shù)據(jù)進(jìn)行解碼的方法。
運動補償視頻編碼器和解碼器是利用傳統(tǒng)的視頻順序的連續(xù)幀相互顯示出高度相似性的事實和連續(xù)幀之間的差別主要由場景中的運動產(chǎn)生的事實。由此,運動補償視頻編碼可以壓縮視頻數(shù)據(jù)量,例如可以由IEEE,卷73,No.4,P523-548,4月1994,H.Mussmann,P.Pirsch和H.Grallert“圖象編碼的發(fā)展”中可了解到。取代分別地壓縮視頻順序的每一幀I(x,y),MC視頻編碼器壓縮在必須被編碼的當(dāng)前視頻幀和在編碼器中計算的,被稱為預(yù)測幀的P(x,y)之間的差別,并根據(jù)一個或多個前面的視頻幀表示當(dāng)前視頻幀I(x,y)的估計值。視頻解碼器可以利用在當(dāng)前視頻幀I(x,y)和預(yù)測幀P(x,y)之間的差別,通過執(zhí)行與編碼器相似的幀預(yù)測和通過根據(jù)所接收的在預(yù)測幀P(x,y)和實際幀I(x,y)之間的差別來校正預(yù)測幀,來再建當(dāng)前視頻幀I(x,y)。
在視頻編碼領(lǐng)域,使用不同的編碼方式來對圖象的不同區(qū)域進(jìn)行編碼是普通的。這在諸如ITU H.261和H.263以及MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)的所有現(xiàn)代編解碼器中可見。例如,圖象的某些區(qū)域可以不須使用任何暫時的預(yù)測(被稱為中間塊(intrablock))而進(jìn)行編碼。因此,下面術(shù)語“frame”代表進(jìn)行運動補償編碼和解碼的幀的區(qū)域。應(yīng)注意的是,在運動補償編碼和解碼的上下文中,術(shù)語“frame”不限于不存在中間塊的特定情況。
編碼器和解碼器都是根據(jù)基于所估計的運動矢量的當(dāng)前幀I(x,y)的預(yù)測,所估計的運動矢量是在編碼器中通過運動估計來計算的。所估計的運動矢量在編碼器中被用于來構(gòu)建預(yù)測幀P(x,y),基于它,編碼器可計算預(yù)測誤差幀E(x,y),即在預(yù)測幀P(x,y)和實際幀I(x,y)之間的差別。此外,預(yù)測誤差幀E(x,y)和描述當(dāng)前幀I相對于參考幀R的估計像素位移的估計運動矢量被傳輸給解碼器用于基于運動矢量對當(dāng)前幀P的預(yù)測和基于所傳輸?shù)念A(yù)測誤差對預(yù)測幀的校正,從而構(gòu)建當(dāng)前幀I*(x,y)。
為了進(jìn)一步降低傳輸?shù)浇獯a器的數(shù)據(jù)量,編碼器對預(yù)測誤差進(jìn)行壓縮。作為對預(yù)測誤差壓縮和對壓縮的預(yù)測誤差解壓縮的結(jié)果,解壓縮的壓縮預(yù)測誤差幀E*(x,y)可能稍微不同于E(x,y)。編碼器考慮到由于所基于的運動估計以及預(yù)測幀P(x,y)的計算和預(yù)測誤差幀E(x,y)的計算不是基于前面的原始幀,而是基于解碼器以與解碼器進(jìn)行再建相似的方式再建的前面幀,所造成的稍微的差別。
對于運動估計,再建幀I*或原始幀I都可以采用。
預(yù)測誤差幀En(x,y)的壓縮通常是通過將整個幀分離為較少區(qū)域和通過為每個區(qū)域提供一個適當(dāng)?shù)膲嚎s方法來實現(xiàn)的。術(shù)語“area”是指在一幀中組成一個空間相鄰的二維塊的一些像素。預(yù)測誤差典型都只集中在很少的區(qū)域中,然而在剩余區(qū)域中,它非常小或為零。因此,壓縮預(yù)測誤差數(shù)據(jù)通常包括兩類信息,即指定被編碼的預(yù)測誤差幀的區(qū)域的尋址信息,和此外在這些區(qū)域中壓縮預(yù)測誤差的值。
從Proc.Of 1992 European Conference on Singnalling ProcessingEUSIPCO,P1357-1360,M.Moresco,F.Lavagetto和F.Cocurullo,“視頻編碼的運動自適應(yīng)矢量量化”中可以了解到一種用于運動自適應(yīng)視頻編碼的算法,根據(jù)它,視頻輸入幀被再分為固定大小的三維(時空的)塊,并根據(jù)在每一塊中的運動活動而被分割。根據(jù)運動的內(nèi)容,通過跳越一定數(shù)量的幀而在時間上對這些塊進(jìn)行再抽樣。還未跳越的塊的二維空間的片(slice)被矢量量化和編碼。在接收機(jī)處,每一已被傳輸?shù)膲K的空間片被解碼,其中間的片被線性內(nèi)插以再建整個塊。
本發(fā)明的目的是改進(jìn)視頻數(shù)據(jù)的編碼和解碼,以使得可以實現(xiàn)更高的編碼效率和可以進(jìn)一步降低編碼視頻數(shù)據(jù)的比特率。
根據(jù)本發(fā)明,可以通過一個根據(jù)權(quán)利要求1對視頻數(shù)據(jù)進(jìn)行運動補償編碼的編碼器和進(jìn)一步通過一個根據(jù)權(quán)利要求15對運動補償編碼的視頻數(shù)據(jù)進(jìn)行解碼的解碼器來實現(xiàn)本目的。此外,本目的還可以通過一個根據(jù)權(quán)利要求32對視頻數(shù)據(jù)進(jìn)行運動補償編碼的方法和通過一個根據(jù)權(quán)利要求33對運動補償編碼的視頻數(shù)據(jù)進(jìn)行解碼的方法來實現(xiàn)。本發(fā)明的實施例由從屬權(quán)利要求來限定。
根據(jù)本發(fā)明的第一方面,預(yù)測幀的特性和/或運動矢量的特性被用于減少編碼視頻數(shù)據(jù)的比特率,和用于改進(jìn)視頻數(shù)據(jù)的編碼效率。預(yù)測誤差集中在視頻場景中運動物體的輪廓邊沿。本發(fā)明是基于觀察到預(yù)測幀P(x,y)中的結(jié)構(gòu),即亮度圖案和/或色度像素值,如邊緣和類似物,與運動物體的這些輪廓的位置大致吻合。在本文件中,術(shù)語“圖象亮度的不連續(xù)性”表示這種預(yù)測幀的一般結(jié)構(gòu)。編碼器和解碼器依次知道預(yù)測幀P(x,y),同時運動矢量也被傳輸。因此,根據(jù)預(yù)測幀P(x,y),可以在編碼器和解碼器中判定在預(yù)測誤差幀中哪些區(qū)域是重要的,并將被分別編碼和解碼,而不須傳輸關(guān)于這些預(yù)測誤差幀中的區(qū)域包容在編碼視頻數(shù)據(jù)中地址數(shù)據(jù)。
本發(fā)明還基于認(rèn)識到預(yù)測誤差集中在高速運動動作的區(qū)域。因此,在編碼器和解碼器中都可以用的運動矢量可被用于判定將被編碼器編碼和將被解碼器解碼的預(yù)測誤差幀的重要區(qū)域,而不須在編碼視頻數(shù)據(jù)中包括關(guān)于這些預(yù)測誤差幀的重要區(qū)域的地址數(shù)據(jù)。
根據(jù)本發(fā)明的這一方面的一個優(yōu)選視頻數(shù)據(jù)編碼方案利用可用于編碼器和解碼器中的預(yù)測幀的結(jié)構(gòu)特征,和在編碼器中估計并傳輸?shù)浇獯a器的運動矢量的特性,以確定將被編碼器編碼的預(yù)測誤差幀的區(qū)域,和在解碼器中確定包容在編碼視頻數(shù)據(jù)中的預(yù)測幀的區(qū)域。
優(yōu)選的,為了對一幀視頻數(shù)據(jù)進(jìn)行編碼,預(yù)測誤差幀被分割為多個區(qū)域。預(yù)測幀以類似于預(yù)測誤差幀被分割的方式被分為一些區(qū)域,這樣對于預(yù)測誤差幀中的每一區(qū)域,在預(yù)測幀中都存在一個相應(yīng)的區(qū)域。解碼器以類似于編碼器的方式分割預(yù)測幀,并將來自所接收的編碼數(shù)據(jù)的預(yù)測誤差幀再存入包含在所接收的編碼數(shù)據(jù)中的預(yù)測誤差幀的每一個相應(yīng)區(qū)域。這些幀可被分割為預(yù)定大小和形狀的區(qū)域或被分割為大小和形狀可變的區(qū)域。將幀分割為區(qū)域可以自適應(yīng)地完成。每一個區(qū)域的大小和形狀可以根據(jù)局部運動動作和/或根據(jù)預(yù)測幀的局部結(jié)構(gòu)特征,如根據(jù)預(yù)測幀的局部不連續(xù)性的程度。
優(yōu)選的,在編碼器已經(jīng)以一種預(yù)定或自適應(yīng)的方式完成幀的分割之后,編碼器采用一種預(yù)定的順序規(guī)則(sequence rule)來確定必須被編碼的預(yù)測誤差幀的區(qū)域。作為這種順序規(guī)則的一個例子,對將被編碼的區(qū)域,編碼器逐行掃描這些由幀分割所得的區(qū)域的排列并對所有將被編碼的區(qū)域以它們被發(fā)現(xiàn)的順序進(jìn)行編碼。于是,解碼器可以根據(jù)預(yù)測幀的分割,根據(jù)由預(yù)測幀和/或預(yù)測誤差幀的區(qū)域所依據(jù)進(jìn)行編碼的運動矢量所提取的信息,以及根據(jù)所述順序規(guī)則來恢復(fù)來自所接收的預(yù)測誤差數(shù)據(jù)中的預(yù)測誤差幀的每一個相應(yīng)區(qū)域。
另外,根據(jù)本發(fā)明的第二方面,預(yù)測誤差幀的所有區(qū)域或所選區(qū)域采用自適應(yīng)編碼方案進(jìn)行編碼。所選區(qū)域可以是根據(jù)本發(fā)明的第一方面確定為重要的預(yù)測誤差幀的區(qū)域。自適應(yīng)編碼方案可考慮到將被編碼的各個預(yù)測誤差幀區(qū)域的不同特性種類。自適應(yīng)編碼方案的例子包括根據(jù)一些碼本的分類矢量量化方案,每一碼本是為一個所述特性種類設(shè)計的,正交變換,匹配追蹤技術(shù)(matching pursuit techniques)等,所有這些技術(shù)都是本技術(shù)領(lǐng)域所公知的。將分類矢量量化方案用于視頻數(shù)據(jù)的編碼例如在信號處理,Elsevier,卷26,1992,P265,H.-H.-Chen,Y.-S.Chen和W.-H.Hsu所著的“通過矢量量化的低速率順序圖象”或在IEEE關(guān)于圖象處理的國際會議ICIP 1994,卷2,P452,K.Zhang,M.Bober和J.Kittle所著的“用于順序壓縮的穩(wěn)定運動估計和多級矢量量化”和在IEEE關(guān)于聲學(xué)、語音、信號處理的國際會議ICASSP’94,卷5,P417,S.Liu所著的“塊大小可變的基于VQ的運動補償視頻編解碼的速率失真分析”中可以得知。根據(jù)本發(fā)明,當(dāng)將自適應(yīng)編碼方案,例如分類矢量量化,正交變換,匹配追蹤方案用于對預(yù)測誤差幀的區(qū)域進(jìn)行編碼時,可以通過由可用于編碼器和解碼器中的預(yù)測幀的特性提取出分類信息(例如編碼方案選擇信息)來實現(xiàn)比特率的減少,這樣編碼視頻數(shù)據(jù)不須包括分類信息。當(dāng)采用預(yù)測幀的區(qū)域的自適應(yīng)編碼時,兩者擇一的或除了可以由與將被編碼的預(yù)測誤差幀的區(qū)域相應(yīng)的預(yù)測幀的區(qū)域中提取出分類信息以外,運動矢量的特性可用于對預(yù)測誤差幀的每一編碼區(qū)域進(jìn)行分類,例如碼本選擇,而不須在編碼視頻數(shù)據(jù)中包括分類信息。
根據(jù)本發(fā)明的這一方面,所提取的分類信息可以指示一個用于對預(yù)測誤差幀的各個區(qū)域進(jìn)行編碼的特定編碼方法,或可以指示一組不同的編碼方法。根據(jù)本發(fā)明這一方面的一種有利實施,分類信息被用于為每一個將被編碼的區(qū)域在許多區(qū)域編碼器中選擇一個區(qū)域編碼器,每一個都適合于相應(yīng)特性種類的特殊特性。每一個區(qū)域編碼器順序地具有一組可用的不同編碼方法,視頻編碼器在這組方法中選擇最佳方法并將編碼方法選擇信息發(fā)送給視頻解碼器。如果編碼方法選擇信息被熵編碼(entropy encode),則發(fā)送給視頻解碼器的編碼方法選擇信息量可利用每一個區(qū)域編碼器的編碼方法選擇的非歸一化概率分布而保持很低。如果對于每一個特性種類,即對于每一個區(qū)域編碼器,一個或很少數(shù)量的編碼方法非??赡鼙贿x擇,則當(dāng)具有較少可能性的編碼方法的選擇可用較多數(shù)量比特指示給視頻解碼器時,這些一個或很少數(shù)量的編碼方法的選擇可以用較少數(shù)量比特指示給視頻解碼器。
在所選視頻編碼器中提供所有編碼方法中的一個特定編碼方法的選擇可以由視頻編碼器根據(jù)視頻解碼器不可用的信息,例如根據(jù)一個初始視頻數(shù)據(jù)幀輸入,根據(jù)在預(yù)測誤差幀的將被編碼的區(qū)域中的像素值的各個結(jié)構(gòu)等來實現(xiàn)。于是,視頻解碼器可用于根據(jù)可用于視頻解碼器的預(yù)測幀的特性和根據(jù)由視頻編碼器所傳輸?shù)木幋a方法選擇信息來選擇區(qū)域編碼器。
本發(fā)明的這一方面的實施是有利的,在根據(jù)預(yù)測幀的特性和/或運動矢量域的特性的分類留下一些關(guān)于預(yù)測誤差幀的各個將被編碼的區(qū)域的特性的不可靠性的情況下,它可以改善視頻編碼器和視頻解碼器的性能。利用本實施,甚至在這些情況下,在很大數(shù)量的不同編碼方法中的一個高自適應(yīng)性和精確的編碼方法也可以很少數(shù)量的選擇信息傳送給視頻解碼器。
在考慮每一個區(qū)域編碼器的編碼方法選擇概率分布之后,編碼選擇信息最好在發(fā)送給視頻解碼器之前進(jìn)行墑編碼。一個等效的修正在每一個區(qū)域編碼器的許多編碼方法中提供一個缺省編碼方法,而視頻編碼器檢查根據(jù)分類選擇的區(qū)域編碼器的缺省編碼器方法是否滿足于用于對預(yù)測誤差幀的各個區(qū)域進(jìn)行編碼的合適標(biāo)準(zhǔn)。如果所選區(qū)域編碼器的缺省編碼器方法被發(fā)現(xiàn)運作是滿意的,則視頻編碼器不傳輸編碼方法選擇信息給視頻解碼器,而視頻解碼器采用相應(yīng)于視頻編碼器所采用的缺省編碼方法的缺省解碼方法。否則,視頻編碼器無視該缺省編碼方法而選擇一個適合的編碼方法,并將相應(yīng)的選擇信息發(fā)送給視頻解碼器。
隨后,將參照


本發(fā)明的最佳實施例。
圖1為根據(jù)本發(fā)明的運動補償視頻編碼器的第一實施例的示意圖;圖2為根據(jù)本發(fā)明的預(yù)測誤差編碼器的一個實施例的詳細(xì)示意圖;圖3為預(yù)測誤差幀的一個區(qū)域的例子;圖4為預(yù)測幀區(qū)域的定向圖案的種類和子類的一些例子;圖5為為根據(jù)本發(fā)明的第二實施例的視頻編碼器的一個可選區(qū)域編碼器;圖6為像素群的例子;
圖7為用于計算像素運動范圍的子塊;圖8為為根據(jù)本發(fā)明的視頻解碼器的第一實施例;圖9為圖5所示的預(yù)測誤差解碼器的詳細(xì)示意圖;圖10a圖示說明了區(qū)域的一個排列;圖10b圖示說明了預(yù)測誤差數(shù)據(jù)的一個例子;圖11為為根據(jù)本發(fā)明的第二實施例的一個視頻解碼器的一個可選區(qū)域解碼器。
圖1為根據(jù)本發(fā)明的運動補償視頻編碼器的一個實施例的示意圖。在該圖中,參考標(biāo)記1表示用于由視頻幀輸入I(x,y)和預(yù)測幀P(x,y)之間的差別來計算預(yù)測誤差幀E(x,y)的裝置。參考標(biāo)記2表示預(yù)測誤差編碼塊,參考標(biāo)記3表示預(yù)測誤差解碼塊。參考標(biāo)記5代表用于由預(yù)測幀P(x,y)和解碼的預(yù)測誤差幀E*(x,y)來計算再建的視頻幀I*(x,y)的計算裝置。參考標(biāo)記6表示一個用于保存再生的視頻幀I*(x,y)和用于提供運動補償預(yù)測器7所用于計算預(yù)測幀的參考幀R(x,y)的幀存儲器。8表示用于估計運動矢量和提供運動矢量給MC預(yù)測塊7的運動估計器。4表示用于接收由預(yù)測誤差編碼器2所輸出的預(yù)測誤差數(shù)據(jù)和運動估計器8所輸出的運動矢量和用于多路復(fù)用預(yù)測誤差數(shù)據(jù)和運動矢量以傳輸給一個解碼器的多路復(fù)用器。
本發(fā)明的預(yù)測誤差編碼塊2不僅被用于接收裝置1所輸出的預(yù)測誤差幀E(x,y),還被用于接收預(yù)測幀P(x,y)和運動估計器8所估計的運動矢量。此外,預(yù)測誤差解碼塊3不僅接收預(yù)測誤差編碼塊2所輸出的預(yù)測誤差數(shù)據(jù),還接收預(yù)測幀P(x,y)和運動估計器8所估計的運動矢量。圖1的視頻編碼器運作如下。對于每一幀輸入的視頻數(shù)據(jù)I(x,y),編碼器都預(yù)測一個預(yù)測幀P(x,y),并比較預(yù)測幀P(x,y)和實際輸入的視頻幀I(x,y)。這一比較由計算裝置1來完成。于是,預(yù)測誤差幀E(x,y)被提供給塊2和經(jīng)過預(yù)測誤差編碼以產(chǎn)生壓縮的預(yù)測誤差數(shù)據(jù),并傳輸給解碼器。對預(yù)測誤差幀E(x,y)的壓縮可能導(dǎo)致一些信息的丟失。在考慮到視頻解碼器(圖1中未示)是由視頻編碼器接收壓縮的預(yù)測誤差數(shù)據(jù),而不是預(yù)測誤差幀E(x,y),則視頻解碼器將使對實際視頻幀的預(yù)測不是基于預(yù)測誤差幀E(x,y),而是基于由對壓縮預(yù)測誤差數(shù)據(jù)解碼而得的再生的預(yù)測誤差幀E*(x,y)。為了避免在編碼器和解碼器中的預(yù)測幀P(x,y)之間的偏差,視頻編碼器以與視頻解碼器獲得再生預(yù)測誤差幀E*(x,y)相同的方式對預(yù)測誤差編碼器2所輸出的預(yù)測誤差數(shù)據(jù)進(jìn)行編碼,并且預(yù)測不是基于實際視頻數(shù)據(jù)幀I(x,y),而是基于對應(yīng)于視頻數(shù)據(jù)幀的再建視頻數(shù)據(jù)幀I*(x,y)完成的,該視頻數(shù)據(jù)幀可以由視頻解碼器根據(jù)塊2所輸出的預(yù)測誤差數(shù)據(jù)再建。
運動估計器8分析來自輸入視頻數(shù)據(jù)I(x,y)的一個順序的場景運動,并估計描繪在后來的視頻幀中每一個像素的位移的運動矢量。這些估計的位移可被MC預(yù)測器7用于根據(jù)所估計的位移修正當(dāng)前再建視頻幀I*(x,y)以到達(dá)下一幀I(x,y)的預(yù)測幀P(x,y)。
預(yù)測誤差編碼和解碼以及根據(jù)運動估計產(chǎn)生一個預(yù)測幀是本技術(shù)領(lǐng)域所公知的。許多關(guān)于運動估計和運動補償?shù)奈墨I(xiàn)已被公布。這些主題的細(xì)節(jié)是很容易得知的,因此沒有必要詳細(xì)討論這些與本發(fā)明沒有直接聯(lián)系的問題。
預(yù)測誤差編碼器2通過將預(yù)測誤差幀分割為多個區(qū)域來對預(yù)測誤差幀E(x,y)進(jìn)行編碼。此外,預(yù)測誤差編碼器2接收和分析預(yù)測幀P(x,y),如圖1中各自的虛線所示。另外,預(yù)測誤差編碼器2接收關(guān)于由運動估計器8所估計的運動矢量的信息,如圖1中各自的虛線所示。由此,預(yù)測誤差編碼器2處于一個判定預(yù)測誤差幀E(x,y)的哪些區(qū)域必須被編碼,預(yù)測誤差幀的哪些區(qū)域不包含重要的信息和不須傳輸給解碼器的位置。預(yù)測誤差編碼器2根據(jù)對預(yù)測幀的特性的分析,和根據(jù)對所估計的運動矢量的分析來完成這一判定,預(yù)測幀和運動矢量在接收編碼視頻數(shù)據(jù)的解碼器中也都可用。本發(fā)明的預(yù)測誤差編碼器2利用在預(yù)測誤差幀E(x,y)中的重要信息集中在視頻場景中運動的物體的輪廓邊沿。當(dāng)解碼器不知道運動物體的精確輪廓時,可用于編碼器和解碼器中的預(yù)測幀P(x,y)的結(jié)構(gòu)特征,例如圖象亮度的不連續(xù)性、邊緣和類似物,與這些輪廓的位置大致吻合。因此,預(yù)測誤差編碼器可以由預(yù)測幀P(x,y)的結(jié)構(gòu)特征判定預(yù)測誤差幀的重要區(qū)域的大致位置。除了根據(jù)預(yù)測幀P(x,y)的結(jié)構(gòu)特征判定預(yù)測誤差幀的重要區(qū)域之外,預(yù)測誤差編碼器2的這一實施例逐幀地分析了描述由于在場景中的運動引起的每一像素位移的運動矢量的特性,以判定將被傳輸給解碼器的預(yù)測誤差幀的重要區(qū)域。如果重要區(qū)域的判定是基于預(yù)測幀的結(jié)構(gòu)特征,例如邊緣和不連續(xù)性,和基于運動矢量,則預(yù)測誤差幀的那些區(qū)域可以判定哪些描述了運動物體的輪廓的運動??蛇x地,預(yù)測誤差幀的重要區(qū)域的這些判定可以基于預(yù)測幀的結(jié)構(gòu)特征,或基于運動矢量。在這些較不優(yōu)選的例子中,仍可能判定預(yù)測誤差幀的一些不重要區(qū)域。
此外,本發(fā)明的預(yù)測誤差編碼器2還對預(yù)測誤差幀E(x,y)的每一區(qū)域采用一個自適應(yīng)編碼方案以判定是否重要。根據(jù)結(jié)構(gòu)特征的種類,例如預(yù)測幀P(x,y)的輪廓方向來為每一個區(qū)域選擇各自的編碼方案。因為預(yù)測幀P(x,y)在視頻編碼器和視頻解碼器中都可用,所以根據(jù)這些特性選擇一個適應(yīng)的編碼方案是有利的,即使在編碼預(yù)測誤差數(shù)據(jù)中未包含另外的選擇信息時,視頻解碼器仍能為每一個將被編碼的區(qū)域選擇一個與視頻編碼器所選擇的各自的編碼方案匹配的適當(dāng)?shù)慕獯a方案。
因此,本發(fā)明的預(yù)測誤差編碼器2通過使用用于判定預(yù)測誤差幀En(x,y)的將被編碼的重要區(qū)域和用于為預(yù)測誤差幀E(x,y)的每一重要區(qū)域選擇一個適應(yīng)的編碼方案的信息來利用了在視頻編碼器和視頻解碼器中的預(yù)測幀Pn(x,y)和運動矢量的可用性,而不須傳輸關(guān)于預(yù)測誤差幀E(x,y)的重要區(qū)域的位置的地址信息或關(guān)于所選擇的編碼方案的信息。圖1中的預(yù)測誤差解碼器3是有利的,但對于原理原因而言不是必需的。如果用于壓縮預(yù)測誤差幀E(x,y)的重要區(qū)域的編碼方案導(dǎo)致了一些信息丟失,通過使運動矢量的估計和視頻幀的預(yù)測不是基于實際輸入幀,而是基于由一個與視頻解碼器所執(zhí)行的解碼操作相同的解碼操作所得的再生視頻幀I*(x,y),這些丟失的信息的一部分可以再傳輸給視頻解碼器。這一原理是本技術(shù)領(lǐng)域所公知的,因此,這里將省略預(yù)測誤差解碼器3的重要性的進(jìn)一步討論。在看到圖1的預(yù)測誤差解碼器3與視頻解碼器中相應(yīng)的預(yù)測誤差塊的相似性,隨后在根據(jù)本發(fā)明的視頻解碼器的一個實施例的描述背景中將給出預(yù)測誤差解碼器3的結(jié)構(gòu)性解釋和運作細(xì)節(jié)。
多路復(fù)用器4是一個用于將由預(yù)測誤差編碼器2輸出的預(yù)測誤差編碼數(shù)據(jù)和由運動估計器8輸出的運動矢量數(shù)據(jù)多路復(fù)用的可選性部件。如果預(yù)測誤差數(shù)據(jù)和運動矢量的各自傳輸信道可用,則可以省略多路復(fù)用器4。
圖2為根據(jù)本發(fā)明的預(yù)測誤差編碼器的一個實施例的詳細(xì)示意圖。在圖2中,21表示一個用于將預(yù)測幀P(x,y)分割為多個區(qū)域的塊。22表示一個用于分析在預(yù)測幀P(x,y)的每一個區(qū)域中的空間不連續(xù)性的塊。在這個不限制本發(fā)明范圍的特定實施例中,該塊包括對由P(x,y)的幀分割所產(chǎn)生的每個區(qū)域進(jìn)行濾波操作的定向高通濾波器。用于實施塊22的另一個選擇包括邊緣檢測算法或?qū)D象亮度值賦值的算法。塊24被用于根據(jù)預(yù)測幀P(x,y)的分割將該預(yù)測誤差幀E(x,y)分割為多個區(qū)域。
塊25代表為由分割預(yù)測誤差幀En(x,y)所得的每個區(qū)域決定該區(qū)域是否重要區(qū)域和將被編碼,或該預(yù)測誤差幀E的區(qū)域是否不是重要區(qū)域和因此將不被編碼的判定裝置。為了判定每個區(qū)域的重要性,塊25接收塊22中的定向高通濾波器的輸出,此外還接收與將被判斷和確定重要性的各個區(qū)域相應(yīng)的運動矢量。塊25將每一塊中濾波器輸入的絕對值相加,并將所得的和與第一預(yù)定閾值相比較。由此,塊25可以判定預(yù)測幀P的各個區(qū)域是否具有不連續(xù)性的重要程度。此外,塊25計算各個區(qū)域的運動矢量的幅度,并將運動矢量的最大幅度與第二閾值相比較以判定在該幀的各個區(qū)域中的運動動作是否重要。如果發(fā)現(xiàn)不連續(xù)性程度和運動動作都為重要,則塊25判定該相應(yīng)區(qū)域為重要,如果如果發(fā)現(xiàn)不連續(xù)性程度不重要或運動動作不重要,則塊25判定該相應(yīng)區(qū)域為不重要。
此外,塊25將一個預(yù)定的順序規(guī)則(sequence rule)用于將預(yù)測誤差幀E的重要區(qū)域輸出給塊26,以進(jìn)行壓縮和傳送給視頻解碼器(本圖中未示)。特別地,在給特定實施例中,塊25將由塊21的分割操作所產(chǎn)生的所有區(qū)域排列為區(qū)域的一個排列,并逐行掃描這一排列以發(fā)現(xiàn)重要區(qū)域。然后,每個被發(fā)現(xiàn)的重要區(qū)域隨即被輸出到塊26。由此,視頻解碼器可以對所接收的預(yù)測誤差幀的區(qū)域定位,而不須接收關(guān)于相應(yīng)位置的信息,這在隨后將進(jìn)行解釋。預(yù)測幀P的幀分割是由塊21以與塊24分割預(yù)測誤差幀E相同的方式進(jìn)行的,這樣預(yù)測誤差幀E的每一個區(qū)域的重要性判定是基于該區(qū)域中預(yù)測幀的特性。換句話說,塊21和塊24所執(zhí)行的幀分割是以這樣一種方式進(jìn)行的,使得預(yù)測誤差幀和預(yù)測幀的相應(yīng)區(qū)域包括相同的一組像素坐標(biāo)(x,y)。該預(yù)測幀P和預(yù)測誤差幀E被分割為具有相同塊大小,例如4×4像素或8×8像素,的區(qū)域。應(yīng)注意的是,分割可以依照預(yù)定的圖案或可以基于分為不規(guī)則形狀區(qū)域的預(yù)定圖象的分裂(segmentation)。在這些編碼器提供描述當(dāng)前編碼幀分裂為任意形狀區(qū)域的信息給解碼器的方案中,前述的分割可以基于這一分裂。
參考標(biāo)記26表示一個用于對預(yù)測誤差幀E將被編碼的每個區(qū)域,即塊25判定為重要的每個區(qū)域,進(jìn)行壓縮和編碼。自適應(yīng)區(qū)域編碼器26包括一個分類塊23,在本特定實施例中不限制本發(fā)明范圍的該分類塊將預(yù)測幀的每個重要區(qū)域分類為一個種類無連續(xù)性;水平連續(xù)性;垂直連續(xù)性;左對角斜線連續(xù)性;右對角斜線連續(xù)性;不定向連續(xù)性。關(guān)于預(yù)測幀E的每個區(qū)域的分類是基于預(yù)測幀P的各個區(qū)域的定向特性而進(jìn)行的,這些特性在塊22中通過不連續(xù)性分析器進(jìn)行分析和提取。參考標(biāo)記28表示一個用于根據(jù)預(yù)測幀E的各個區(qū)域的分類選擇在許多可選區(qū)域編碼器271,…,27n中一個區(qū)域編碼器,用以對預(yù)測誤差幀E的各個區(qū)域進(jìn)行編碼。29表示用于選擇所選區(qū)域編碼器的輸出和用于將所選區(qū)域的輸出與視頻編碼器的輸出相連接以傳輸?shù)揭曨l解碼器的選擇器。
圖3顯示了預(yù)測幀Pn的一個區(qū)域,為了圖示說明圖2中定向高通濾波器的運作。圖3中所打點的每個塊代表在預(yù)測幀P的預(yù)測區(qū)域中的一個像素。P(x,y)代表像素坐標(biāo)為(x,y)的各個像素的亮度值。
圖2中的塊22在每個分割塊中通過對每個像素坐標(biāo)(x,y)將在預(yù)定方向,關(guān)于像素坐標(biāo)(x,y)彼此相對的相鄰像素的亮度值相減來提取出不連續(xù)性信息。特殊地,塊22包括為相應(yīng)區(qū)域的每個像素位置計算在位置(x,y+1)的一個垂直相鄰像素的亮度值P(x,y+1)與對于位置(x,y)與在位置(x,y+1)處的所述像素相對的另一個垂直相鄰像素位置(x,y-1)的亮度值P(x,y-1)之間的差別FH(x,y)的水平高通濾波器。此外,塊22包括為每個像素位置計算在位置(x+1,y)的一個水平相鄰像素的亮度值P(x+1,y)與,關(guān)于位置(x,y)與位置(x+1,y)處的所述像素相對的另一個水平相鄰像素位置(x-1,y)的亮度值P(x-1,y)之間的差別FV(x,y)的垂直高通濾波器。
所產(chǎn)生的水平和垂直差別FH(x,y)和FV(x,y)分別代表每個像素位置(x,y)在垂直和水平方向上的空間不連續(xù)性。
塊22將預(yù)測幀P的各個區(qū)域的每個像素的水平和垂直不連續(xù)性值FH(x,y)和FV(x,y)提供給塊25,塊25通過將相應(yīng)區(qū)域中所有FH(x,y)和FV(x,y)的絕對值相加以判斷在相應(yīng)區(qū)域中發(fā)現(xiàn)的不連續(xù)性的重要性。如果所得的和大于預(yù)定的閾值,則塊25判定預(yù)測幀P的相應(yīng)區(qū)域包含相當(dāng)顯著的不連續(xù)性,否則判定預(yù)測幀P的相應(yīng)區(qū)域未包含相當(dāng)顯著的不連續(xù)性。
圖2中的分類器23接收由定向高通濾波器22輸出的平和垂直不連續(xù)性值FH(x,y)和FV(x,y),并將這些值用于所討論的每個區(qū)域,以根據(jù)在該區(qū)域中不連續(xù)性的結(jié)構(gòu),將該區(qū)域分為六個不同類別中的一個類別。圖4顯示了類別a到f中每一種類別的典型代表。如果預(yù)測幀的一個區(qū)域未顯示出任何顯著的不連續(xù)性,則該預(yù)測幀的該區(qū)域被分類屬于類別a,因為在這一區(qū)域中,亮度值是逐漸變化的,或就沒有變化。一個類別b的典型代表是顯示有水平方向的不連續(xù)性的一個區(qū)域,例如一個水平邊緣。類別c代表顯示有垂直方向的不連續(xù)性的一個區(qū)域,例如垂直邊緣。類別d和e代表具有對角方向不連續(xù)性的區(qū)域,例如對角邊緣。類別d揭示了右對角斜線的不連續(xù)性,而類別e覆蓋了左對角斜線的不連續(xù)性。最后,類別f的典型代表是一個包含非定向連續(xù)性的預(yù)測幀的一個區(qū)域,例如紋理。
定向不連續(xù)性類別b到e中每一個都可以根據(jù)該區(qū)域中相應(yīng)不連續(xù)性的位置進(jìn)一步再分為一些子類別。舉類別b為例,第一子類別b1覆蓋了在該區(qū)域的上半部分中水平不連續(xù)性,而子類別b2覆蓋了在該區(qū)域的中間部分中水平不連續(xù)性。子類別b3覆蓋了位于該區(qū)域的下班部分中的水平不連續(xù)性。
相似的,對于類別c、d和e,這些類別的再分分別根據(jù)不連續(xù)性的垂直和對角位置,由圖4明顯可見。應(yīng)注意的是,類別數(shù)量當(dāng)然可以,例如根據(jù)可選區(qū)域編碼器271至27n和用于預(yù)測幀區(qū)域壓縮的相應(yīng)方法的數(shù)量而改變。同樣,許多不同的算法也可以用于根據(jù)在該區(qū)域的濾波器輸出值來對每一區(qū)域進(jìn)行分類。這些算法的例子例如可由M.K.Jain,Prentice Hall International 1989,pp.347-357的“數(shù)字圖象處理的基本原理”中可以得知。
根據(jù)圖2中塊25所判定的預(yù)測幀P每一區(qū)域的重要性的類別,于是,分類器23在可選區(qū)域編碼器271至27n中選擇一個適當(dāng)?shù)膮^(qū)域編碼器,例如一個適當(dāng)?shù)氖噶苛炕?,用于對預(yù)測誤差幀E的所討論區(qū)域進(jìn)行自適應(yīng)編碼。在此特殊的實施例中,對于每一個類別或子類別,提供了適應(yīng)于各個類別或子類別的成員的特定統(tǒng)計特性的專用矢量量化器。就此而言,矢量量化器對于具有一些信息損失的壓縮信號也是已有技術(shù)。矢量量化器VQ1…VQn中每一個矢量量化器用在屬于這個特定矢量量化器的碼本中所發(fā)現(xiàn)的最佳近似值來代替預(yù)測誤差幀En的一個區(qū)域。所述碼本是最可能在相應(yīng)類別或子類別中產(chǎn)生的一組很少代表,矢量量化器輸出一個系數(shù)給在屬于這個特定矢量量化器的碼本中的最佳匹配碼矢量是足夠的。
根據(jù)本發(fā)明,預(yù)測誤差幀的區(qū)域的分類是基于相應(yīng)的預(yù)測幀區(qū)域。該預(yù)測幀在視頻解碼器中也可用,這樣編碼視頻數(shù)據(jù)中不必包含分類信息。而是,該分類信息可以由視頻解碼器通過執(zhí)行與編碼器所執(zhí)行的分類操作相類似的分類操作來提取出。
這里應(yīng)注意的是,預(yù)測誤差幀區(qū)域的其他壓縮方法可以采用,例如正交變換技術(shù)(DCT,KLT)或匹配追蹤技術(shù)。
隨后將討論根據(jù)本發(fā)明的運動補償視頻編碼器的另一個實施例。本實施例與上述視頻編碼器的第一實施例相類似,除了下列部分。
圖5顯示了適用于根據(jù)本發(fā)明的視頻編碼器的第二實施例中的可選區(qū)域編碼器271至27n中的每一個的一個實施例。如圖5所示,根據(jù)本發(fā)明,可選區(qū)域編碼器271至27n中的每一個包括多個用于執(zhí)行多個不同編碼方法的編碼器531至53k??蛇x區(qū)域編碼器271至27n中的每一個另外還包括一個用于在多個相應(yīng)的編碼器531至53k中選擇一個根據(jù)一個適當(dāng)標(biāo)準(zhǔn)最適合的編碼器以對預(yù)測誤差幀的一個相應(yīng)區(qū)域進(jìn)行編碼。根據(jù)本特定實施例的選擇控制器51不限制本發(fā)明判定的范圍,其中可用于由分類器23所選的可選區(qū)域編碼器的編碼方法使的對預(yù)測誤差幀E的相應(yīng)區(qū)域可以最低編碼誤差進(jìn)行編碼。為此,選擇控制器51接收預(yù)測誤差幀E以便可以訪問由分類器23所選的可選區(qū)域編碼器的可用編碼器531至53k中每一個所引起的編碼誤差。如果選擇控制器51發(fā)現(xiàn)編碼器531至53k中有多于一個的編碼器表現(xiàn)滿意,選擇控制器51在這些編碼器中選擇以最低比特數(shù)量實現(xiàn)令人滿意的性能的編碼器。選擇控制器51輸出選擇信息給選擇器54以驅(qū)動所選的編碼器對預(yù)測誤差幀的將被編碼的相應(yīng)區(qū)域進(jìn)行編碼。此外,選擇控制器51輸出的選擇信息被提供給墑編碼器52,用于對選擇信息進(jìn)行墑編碼。此外,選擇信息控制選擇器55以將編碼器531至53k中所選的一個編碼器一多路復(fù)用器56的一個輸入端相連以將墑編碼的選擇信息和所選編碼器輸出的壓縮預(yù)測誤差數(shù)據(jù)多路復(fù)用。多路復(fù)用器56的輸出是可選區(qū)域編碼器271至27n的一個相應(yīng)編碼器的輸出。
在根據(jù)本發(fā)明的視頻編碼器的該實施例中,圖2所示的分類器23基于在預(yù)測幀的與將被編碼的預(yù)測誤差幀的各自區(qū)域相應(yīng)的每個區(qū)域中的圖象亮度的變化來對預(yù)測幀P的正方形區(qū)域進(jìn)行分類。在本特定實施例中,圖象亮度值的變化量由不連續(xù)性分析器22如下計算varb=Σi=0M-1Σj=0M-1[p(i,j)-q]2-----(1)]]>其中p(x,y)是在預(yù)測幀的各個區(qū)域的坐標(biāo)(i,j)處的像素的亮度值,M是在正方形區(qū)域的每行和每列的像素數(shù)量,而q是在各個預(yù)測幀區(qū)域中像素的亮度值的平均值。
于是,不連續(xù)性分析器22為在預(yù)測幀各個區(qū)域中的多個預(yù)定像素群計算一個群運動量(cluster activity measure)CAM。每個像素群對應(yīng)于一個特定的類別,該特定類別可由分類器23來區(qū)別。圖6以舉例的方式顯示了相應(yīng)于13個可由分類器23區(qū)別的不同特性類別的13個不同像素群。屬于群1至13的相應(yīng)群的像素在圖6中以陰影顯示。
在每一個群中,群運動量CAM在本特定實施例中計算如下對于在相應(yīng)區(qū)域中位置(i,j)處的每一個像素,通過分析四個包含像素(i,j)的2×2像素子塊來計算像素運動量pam(i,j)。圖7中顯示了對于像素(i,j)的這些子塊的位置。于是,計算在每個子塊中的像素值的變化。這些變化用varlu,varru,varll和varrl來代表。如果一個子塊像素在該相應(yīng)區(qū)域的外部,即當(dāng)位置(i,j)是該區(qū)域的邊界像素時,則該子塊的變化被認(rèn)為為0。則在該位置(i,j)的像素運動量為pam(i,j)=max(varlu,varll,vartu,varrl)(2)
對于每一群(a),該群運動量cam(a)可計算如下cam(a)=w(a)Σ(i,j)∈Capam(i,j)-----(3)]]>在該式中,Ca代表在群a中所有像素的像素運動量的和與群a的歸一化因子w(a)的乘積。對于圖6所示的群a=1至a=13,w(a)的值可以選擇如下
在本特定實施例中,分類器23區(qū)別14個類別,而每一個將被編碼的區(qū)域依照這14個類別中的一個,根據(jù)在預(yù)測幀的各個區(qū)域中的圖象亮度的主要不連續(xù)性的位置進(jìn)行分類。13個類別分別對應(yīng)于圖6所示的13個群中的一個。圖6中未顯示第14個類別,它是被分配給未包含任何顯著的不連續(xù)性的區(qū)域。
相應(yīng)于將被編碼的預(yù)測誤差幀的一個區(qū)域的預(yù)測幀的區(qū)域的分類的操作可以如下所述地進(jìn)行。如果根據(jù)式(1)計算的區(qū)域的變化小于預(yù)定閾值,則該區(qū)域被認(rèn)為不包含顯著的不連續(xù)性,而分類器23將類別14分配給該區(qū)域。另一方面,如果如果根據(jù)式(1)計算的區(qū)域的變化大于所述預(yù)定閾值,則群a被發(fā)現(xiàn),它的群運動量can(a)是最高的,指示主要不連續(xù)性在群a中,而分類器23將類別a分配給該區(qū)域。根據(jù)該分類,分類器23選擇可選區(qū)域編碼器271至27n中與該類別相應(yīng)的一個區(qū)域編碼器。
根據(jù)該特定實施例,可選區(qū)域編碼器271至27n中的每一個包括一組13個編碼器的一個子集編碼器531至53k,該13個編碼器中每一個適用于圖6所示的13個像素群。特殊地,該13個編碼器中每一個適用于在其相關(guān)的像素群上執(zhí)行二維離散余弦變換。每個可選區(qū)域編碼器271至27n的多個編碼器531至53k包括適用于相應(yīng)可選區(qū)域編碼器的類別的相應(yīng)編碼器,還包括適用于與相應(yīng)可選區(qū)域編碼器相關(guān)的類別的編碼器。對于每一類別,所有其他可選區(qū)域編碼器包括一組相同的編碼器531至53k。通常,對于一個特定類別,如果一個區(qū)域分入一個不同類別的概率大于分入相應(yīng)類別的概率,不可以忽略的,則該不同類別是相關(guān)的類別。在該特定實施例中,已發(fā)現(xiàn)與類別1相關(guān)的類別是類別7,9和13。與類別7相關(guān)的類別是類別1,4和13。與類別11相關(guān)的類別是類別11和13。與類別13相關(guān)的類別是其他所有類別。其他所有類別的相關(guān)類別直接的遵循對稱性考慮。
根據(jù)本發(fā)明的視頻編碼器的該實施例利用一個不是與由分類器23所確定類別相對應(yīng)的編碼器的編碼器比相應(yīng)于該類別的編碼器運作更好的概率非常低,同時相應(yīng)于該類別的編碼器運作性能最好的概率很高這一事實,這樣傳輸給視頻解碼器的編碼方法選擇信息量很低,并可以只用很少的比特數(shù)來表示。對該選擇信息進(jìn)行編碼是由墑編碼器52基于每個可選區(qū)域編碼器的相應(yīng)選擇概率以一種公知的方法執(zhí)行的。
一般地,在考慮到基于相應(yīng)預(yù)測幀區(qū)域的預(yù)測誤差幀的分類中所包含的不確定性后,選擇相關(guān)的類別。應(yīng)注意的是,當(dāng)在本實施例中,每個相關(guān)類別相應(yīng)于一個可選區(qū)域編碼器的類別時,存在提供其他相關(guān)類別的概率。例如,一個特定的類別可以具有與其他任何類別不同的相關(guān)類別。
圖8顯示了根據(jù)本發(fā)明的視頻解碼器的第一實施例。該視頻解碼器適用于以和視頻編碼器相同的方式產(chǎn)生一個預(yù)測幀P。此外,該視頻解碼器從由視頻編碼器所用來對預(yù)測誤差幀編碼的預(yù)測幀P中提取出相同的信息,并將該提取的信息用于對所接收的信息解碼和用于再生預(yù)測誤差幀E*。
特殊地,圖8的解碼器包括一個用于接收來自視頻編碼器的編碼視頻數(shù)據(jù)和用于對所接收的數(shù)據(jù)解復(fù)用為預(yù)測誤差數(shù)據(jù)和運動矢量的解復(fù)用器(demultiplexer)。塊32表示一個用于接收解復(fù)用的預(yù)測誤差數(shù)據(jù)和用于由所接收的編碼預(yù)測誤差數(shù)據(jù)再生預(yù)測誤差幀E*的預(yù)測誤差解碼器。33表示用于由預(yù)測幀P(x,y)和再生的預(yù)測誤差幀E*計算再生的視頻幀I*的計算裝置。該再生的視頻幀I*保存在幀存儲器34中,并進(jìn)而由視頻解碼器作為解碼視頻數(shù)據(jù)輸出。35表示用于由保存于幀存儲器34中用作參考幀R和基于所接收的來自視頻編碼器的,和描述在當(dāng)前幀I中的估計像素位移的運動矢量構(gòu)建預(yù)測幀P的運動補償預(yù)測器。MC預(yù)測器35使用參考幀R和這些估計的像素位移來獲得預(yù)測幀P(x,y)。
預(yù)測誤差解碼器32不僅接收編碼的由視頻編碼器發(fā)送的預(yù)測誤差數(shù)據(jù),還接收來自MC預(yù)測器35的預(yù)測幀P和由視頻編碼器發(fā)送的運動矢量,并基于預(yù)測幀P和基于運動矢量來執(zhí)行預(yù)測誤差的解碼。這可以由圖8中的虛線表示。
基于預(yù)測幀P和基于運動矢量,預(yù)測誤差解碼器32處于這樣一種位置,利用了在預(yù)測誤差幀E中的顯著的誤差大致集中處于運動動作明顯位置的預(yù)測幀的輪廓邊沿,并基于視頻編碼器的只有預(yù)測誤差幀的這種明顯區(qū)域被編碼的特性來判定預(yù)測誤差幀E的哪個區(qū)域由視頻編碼器傳輸。因為MC預(yù)測35所產(chǎn)生的預(yù)測幀P對應(yīng)于在視頻編碼器中由MC預(yù)測器7所產(chǎn)生預(yù)測幀P,根據(jù)本發(fā)明的這一實施例的該視頻解碼器可以執(zhí)行預(yù)測誤差解碼,而不須接收關(guān)于預(yù)測誤差幀的重要區(qū)域的位置的信息。額外地或可選擇地,預(yù)測誤差解碼器32可以執(zhí)行自適應(yīng)解碼,而不須提取出關(guān)于每個編碼的預(yù)測誤差幀的信息,因為解碼器可以以與視頻編碼器將預(yù)測幀P用于對預(yù)測誤差幀的將被編碼的區(qū)域進(jìn)行分類相同的方式從預(yù)測幀P中提取出這一信息。
圖9顯示圖8的預(yù)測誤差編碼器32的詳細(xì)示意圖。在圖9中,41表示一個用于將由MC預(yù)測器35所提供的預(yù)測幀P分割為多個區(qū)域的裝置。預(yù)測幀的分割以與在視頻編碼器中相同的方式進(jìn)行。換句話說,幀分割裝置41完全對應(yīng)于在圖1的預(yù)測誤差編碼器中的幀分割裝置21的功能。
參考標(biāo)記42表示一個不連續(xù)性分析器,其功能對應(yīng)于在視頻編碼器中提供的不連續(xù)性分析器22的功能,關(guān)于塊22的相應(yīng)的解釋也適合于塊42,因此這里就不在重復(fù)。圖9中的塊44表示用于判定預(yù)測誤差幀中的哪些區(qū)域已被視頻編碼器編碼并包含在壓縮的預(yù)測誤差數(shù)據(jù)中。為此,判定裝置44執(zhí)行一個類似于圖2中塊25所執(zhí)行的重要區(qū)域的判斷與決定的操作。如果視頻解碼器被設(shè)計用于與上述的視頻編碼器的第一實施例一起運作,則對于塊41所提供的預(yù)測幀Pn的每一區(qū)域的每一像素位置(x,y),塊44接收由不連續(xù)性分析器42輸出的水平和垂直差別FV(x,y)和FH(x,y),并通過將在各個區(qū)域的所有位置(x,y)處的FV(x,y)和FH(x,y)的絕對值相加來判斷在每個區(qū)域中所發(fā)現(xiàn)的不連續(xù)性的程度。根據(jù)圖2中的塊25所實施的判斷,如果所得的和大于與塊25所采用的預(yù)定閾值相對應(yīng)的預(yù)定閾值,塊44判定預(yù)測幀P的相應(yīng)區(qū)域包含顯著的不連續(xù)性。否則塊44判定該相應(yīng)區(qū)域未包含顯著的不連續(xù)性。
此外,塊44還接收視頻編碼器所傳輸運動矢量?;诖耍瑝K44通過計算相應(yīng)區(qū)域的運動矢量的幅度并將最大幅度與和圖2中的塊25對于相應(yīng)操作所采用的所述第二閾值相對應(yīng)的閾值相比較來判斷每個區(qū)域的運動動作量。塊25基于塊25所采用的相同的標(biāo)準(zhǔn)來判定該預(yù)測幀Pn的一個區(qū)域是否重要,即如果在該區(qū)域中不連續(xù)性的程度和運動動作量都被發(fā)現(xiàn)為顯著,則塊25判定該相應(yīng)的區(qū)域為重要。
塊44將一個預(yù)定的順序規(guī)則應(yīng)用于將所接收的預(yù)測誤差數(shù)據(jù)的各部分分配給相應(yīng)的區(qū)域,該規(guī)則對應(yīng)于在視頻編碼器中塊25所用于輸出預(yù)測誤差幀的重要區(qū)域的預(yù)定順序規(guī)則。特殊地是,在該特定實施例中,塊44以與在視頻編碼器中塊25排列區(qū)域相似的方式將塊425執(zhí)行的分割操作所得的所有區(qū)域排列為區(qū)域的一個組合,并逐行掃描該區(qū)域組合以尋找重要的區(qū)域。對應(yīng)于預(yù)測誤差幀的一個區(qū)域的每一個所接收的預(yù)測誤差數(shù)據(jù)的部分被分配給重要區(qū)域,所述區(qū)域排列中的順序?qū)?yīng)于接收相應(yīng)部分的順序。這種操作的一個例子如圖10a和10b所示。圖10a在視頻編碼器中塊21和在視頻解碼器中塊41所執(zhí)行的分割操作產(chǎn)生的區(qū)域的組合105。該組合包括四列0-3和四行0-3。該組合105中陰影部分代表重要區(qū)域,而非陰影部分為不重要區(qū)域。
圖10顯示了從視頻編碼器接收的一個預(yù)測誤差數(shù)據(jù)流。該數(shù)據(jù)流由部分101至104構(gòu)成,每一部分包括預(yù)測誤差幀的相應(yīng)區(qū)域的預(yù)測誤差數(shù)據(jù)。在本例子中,塊44在組合105上進(jìn)行的逐行掃描操作導(dǎo)致了重要組合的隨后的順序(0,1);(1,2);(2,3);(3,2)。該順序?qū)?yīng)于在預(yù)測誤差數(shù)據(jù)中的各部分的順序。基于這些相應(yīng)的順序,塊44可以將預(yù)測誤差數(shù)據(jù)的每個接收的部分101至104分配給它的相應(yīng)區(qū)域。T表示時間軸。
圖9中參考標(biāo)記43表示接收由塊42輸出的不連續(xù)性信息的分類器。在此實施例中,分類器43接收由定向高通濾波器42輸出的垂直和水平不連續(xù)性值FV(x,y)和FH(x,y)方法,并執(zhí)行與在視頻編碼器中所提供的分類器23所執(zhí)行的類似操作。因此,關(guān)于塊43以與塊23所執(zhí)行的分類操作類似的方式執(zhí)行的分類操作的解釋在此就不再重復(fù)。
參考標(biāo)記45表示一個由分類器43所控制的選擇器,用于根據(jù)分類器所判定的特性類別為由塊44輸出的壓縮預(yù)測誤差數(shù)據(jù)的每一部分選擇一個適當(dāng)?shù)慕獯a器。由此,自適應(yīng)區(qū)域解碼器48可以根據(jù)預(yù)測幀Pn的各個區(qū)域的類別執(zhí)行一個與在視頻編碼器中塊26所執(zhí)行的編碼操作相逆轉(zhuǎn)的操作。圖9中自適應(yīng)區(qū)域解碼器48的每個可選區(qū)域解碼器471至47n對應(yīng)于視頻編碼器中可選區(qū)域編碼器271至27n中的一個。如果采用矢量量化器,它包括一個適應(yīng)于將被每個區(qū)域解碼器471至47n解碼的區(qū)域類別的碼本,而每個區(qū)域解碼器471至47n適應(yīng)于在其輸入端接收一個給其碼本的索引(index),該碼本與相應(yīng)的區(qū)域編碼器所用的碼本是相同的,并由對應(yīng)于所接收索引的碼本讀出矢量。當(dāng)然,除了矢量量化或作為可選擇的,該預(yù)測誤差編碼器和解碼器可以合并其他的自適應(yīng)預(yù)測誤差編碼和解碼方案,例如正交變換(DCT,KLT)或匹配追蹤技術(shù)。
參考標(biāo)記46表示用于將所選擇的區(qū)域解碼器的輸出與預(yù)測誤差解碼器32的輸出相連。于是,每個解碼區(qū)域可在塊44判定各個區(qū)域為重要的位置處被寫入一個預(yù)測誤差幀存儲器(圖中為顯示),從而再保存預(yù)測誤差幀E*(x,y)。
圖11顯示了根據(jù)本發(fā)明的第二實施例的視頻解碼器的一個可選區(qū)域解碼器。根據(jù)第二實施例的視頻解碼器適應(yīng)于與上述根據(jù)第二實施例的視頻編碼器一起使用。根據(jù)第二實施例的該視頻解碼器與根據(jù)第一實施例的視頻解碼器類似,除了根據(jù)第二實施例的圖9中的不連續(xù)性分析器42和分類器43操作分別類似于根據(jù)第二實施例的視頻編碼器的不連續(xù)性分析器22和分類器23,這樣,這些決的結(jié)構(gòu)和操作的描述再次就不再作重復(fù)說明。此外,圖11所示的根據(jù)第二實施例的視頻解碼器中的可選區(qū)域解碼器471至47n不同于第一實施例中的可選區(qū)域解碼器。
如圖11所示,根據(jù)第二實施例的視頻解碼器中的每一個可選區(qū)域解碼器471至47n包括一個用于對接收的來自第二實施例的視頻編碼器的壓縮預(yù)測誤差數(shù)據(jù)進(jìn)行解復(fù)用為編碼預(yù)測誤差數(shù)據(jù)和熵編碼方法選擇信息。參考標(biāo)記62表示接收熵編碼方法選擇信息的熵解碼器。參考標(biāo)記631至63k表示其中每個都與在相應(yīng)于各個可選區(qū)域解碼器的可選區(qū)域編碼器中的編碼器531至53k中的一個相對應(yīng)的多個解碼器。參考標(biāo)記64和65表示由熵解碼器62的輸出控制的選擇器,用于提供編碼預(yù)測誤差數(shù)據(jù)給多個解碼器631至63k中的一個所選解碼器,和用于將所選解碼器的輸出與相應(yīng)的可選區(qū)域解碼器的輸出相連。
根據(jù)本發(fā)明的用于視頻數(shù)據(jù)的編碼器和解碼器和根據(jù)本發(fā)明的用于對視頻數(shù)據(jù)編碼和解碼的方法可以有利地用于各種廣泛的應(yīng)用領(lǐng)域。其中的一個應(yīng)用領(lǐng)域是一個用于傳輸視頻數(shù)據(jù)的系統(tǒng),該系統(tǒng)包括一個根據(jù)本發(fā)明的編碼器,用于傳輸編碼視頻數(shù)據(jù)的裝置,和一個根據(jù)本發(fā)明的用于接收所傳輸視頻數(shù)據(jù)并輸出解碼的視頻數(shù)據(jù)的解碼器。
另一個有利的應(yīng)用是一個用于保存視頻數(shù)據(jù),該系統(tǒng)包括根據(jù)本發(fā)明用于對視頻數(shù)據(jù)編碼的編碼器,用于保存編碼視頻數(shù)據(jù)的裝置,和用于從所述存儲裝置提取出編碼視頻數(shù)據(jù)和用于解碼和輸出所述提取出的視頻數(shù)據(jù)。
有利地,本發(fā)明也可與將被編碼的幀的不同區(qū)域的不同編碼方式合并使用。如果一幀的一些區(qū)域經(jīng)過幀內(nèi)編碼而該幀的其他區(qū)域經(jīng)過運動補償編碼,則本發(fā)明可用于這些運動補償編碼區(qū)域,和術(shù)語“一個視頻幀的運動補償編碼”不應(yīng)理解為限定為該幀的所有區(qū)域都是MC編碼的情況。
本技術(shù)領(lǐng)域的技術(shù)人員應(yīng)該清楚,本發(fā)明可以是在視頻編解碼器中的一個或更多編碼方式的基礎(chǔ),其中它可以與現(xiàn)有技術(shù)中的編碼方式一起使用。當(dāng)編碼區(qū)域和編碼方案的確定不產(chǎn)生所希望的結(jié)果時,編碼器可以決定使用一個現(xiàn)有技術(shù)的方式。例如,編碼器可以推翻編碼區(qū)域的選擇和編碼方案的選擇,并將此決定傳輸給該解碼器。這可能需要使用別的方式不需要的功能,但它可以判斷隨后發(fā)生的編碼決定是否明顯更好。
權(quán)利要求
1.一種用于對視頻數(shù)據(jù)進(jìn)行運動補償編碼的編碼器,包括-用于估計描述視頻幀像素的場景位移的運動矢量的裝置(8);-用于基于第一視頻數(shù)據(jù)幀(R)和所述運動矢量來預(yù)測一個視頻數(shù)據(jù)幀(P)的裝置(7);-用于基于所述預(yù)測的視頻數(shù)據(jù)幀(P)和第二視頻數(shù)據(jù)幀(I)來計算預(yù)測誤差幀(E)的裝置(1);-用于對所述預(yù)測誤差幀(E)編碼,并獲得預(yù)測誤差數(shù)據(jù)的裝置(2);-用于將所述運動矢量和所述預(yù)測誤差數(shù)據(jù)傳輸給解碼器的裝置(4);-所述用于對所述預(yù)測誤差幀(E)編碼的裝置(2)包括-用于將所述預(yù)測誤差幀分割為多個區(qū)域的裝置(24);和-用于執(zhí)行至少一個下列操作的判定裝置判定在所述預(yù)測誤差幀(E)中的區(qū)域?qū)⒈痪幋a和判定對于每個區(qū)域至少一種編碼方法被用于對所述預(yù)測誤差幀(E)編碼;和-用于根據(jù)所述判定裝置的至少一個判定操作對所述預(yù)測誤差幀(E)進(jìn)行編碼的區(qū)域編碼裝置(26);-其中所述判定裝置適用于分析所述預(yù)測視頻數(shù)據(jù)幀(p)的特性和基于所述分析執(zhí)行至少一個判定操作。
2.根據(jù)權(quán)利要求1的編碼器,其特征在于,-所述判定裝置包括用于對于所述預(yù)測誤差幀的每一區(qū)域分析在預(yù)測視頻數(shù)據(jù)幀(P)的相應(yīng)區(qū)域中圖象亮度的不連續(xù)性的裝置(22);和-所述判定裝置(2)適用于基于所述不連續(xù)性的分析執(zhí)行所述至少一個判定操作。
3.根據(jù)權(quán)利要求2的編碼器,其特征在于,所述不連續(xù)性分析裝置(22)包括-用于在預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域中計算在垂直方向的有限差別(FH)的線性濾波器和計算在水平方向的有限差別(FV)的線性濾波器;和-用于將在每一區(qū)域中的兩個濾波器的輸出的絕對值的和與第一預(yù)定閾值相比較的裝置;-所述判定裝置適用于判定預(yù)測誤差幀(E)的一個區(qū)域不被編碼,如果對所述預(yù)測視頻數(shù)據(jù)幀(P)的相應(yīng)區(qū)域計算絕對值的和未超出所述第一預(yù)定閾值。
4.根據(jù)前面任何一個權(quán)利要求的編碼器,其特征在于,-所述區(qū)域編碼裝置(26)包括用于對每個被判定將被編碼的區(qū)域分別從多個不同區(qū)域編碼器(271,…,27n)中選擇一個區(qū)域編碼器的選擇裝置(28,29)。
5.根據(jù)權(quán)利要求4的編碼器,其特征在于,-所述判定裝置包括用于根據(jù)所述預(yù)測視頻數(shù)據(jù)幀(P)的相應(yīng)區(qū)域的亮度不連續(xù)性,將一組特性類別中的一個類別分配給所述預(yù)測誤差幀(E)的每個將被編碼的區(qū)域的分類裝置(23);-所述選擇裝置(28,29)適用于根據(jù)各個區(qū)域所分配的類別,對每個將被編碼的區(qū)域選擇一個區(qū)域編碼器(271,…,27n)。
6.根據(jù)權(quán)利要求5的編碼器,其特征在于,所述分類裝置(23)適用于基于用于在與所述預(yù)測誤差幀(E)的將被編碼的區(qū)域相對應(yīng)的預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域中計算在垂直方向的有限差別(FH)和計算在水平方向的有限差別(FV)的線性濾波器(22)所提供的輸出值來進(jìn)行分類。
7.根據(jù)權(quán)利要求5的編碼器,其特征在于,所述分類裝置(23)適用于基于集中在該預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域的不同像素群中的相應(yīng)像素亮度不連續(xù)性來進(jìn)行分類,該該預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域?qū)?yīng)于所述預(yù)測誤差幀(E)的將被編碼的一個區(qū)域。
8.根據(jù)權(quán)利要求6或7的編碼器,其特征在于,-所述一組類別包括下列類別中的至少一個無不連續(xù)性;水平方向不連續(xù)性;垂直方向不連續(xù)性;左對角斜線方向不連續(xù)性;右對角斜線方向不連續(xù)性;非定向不連續(xù)性。
9.根據(jù)前面任何權(quán)利要求的編碼器,其特征在于,-所述區(qū)域編碼裝置(26)適用于通過所選擇的正交變換或矢量量化或匹配追蹤方案對所述預(yù)測誤差幀(E)的將被編碼的每一區(qū)域進(jìn)行編碼。
10.根據(jù)前面任何權(quán)利要求的編碼器,其特征在于,-每一個區(qū)域編碼器(271,…27n)適用于包括多個編碼方法(531至53k);-提供給每個區(qū)域編碼器(271,…27n)用于根據(jù)與編碼方法的性能有關(guān)的標(biāo)準(zhǔn)從相應(yīng)的多個編碼方法(531至53k)中選擇一個編碼方法的編碼方法選擇裝置(51,54,56);
11.根據(jù)權(quán)利要求11的編碼器,其特征在于,所述多個編碼方法(531至53k)對于不同區(qū)域編碼器(271,…27n)是不同的;
12.根據(jù)權(quán)利要求1至11中任何一個的編碼器,其特征在于,-用于對所述預(yù)測誤差幀(E)進(jìn)行解碼的預(yù)測誤差解碼器(3);和-用于基于所述預(yù)測視頻數(shù)據(jù)幀(P)和所述解碼預(yù)測誤差幀(E*)計算第一視頻數(shù)據(jù)幀的裝置(5)。
13.根據(jù)前面任何權(quán)利要求的編碼器,其特征在于,-所述判定裝置(25)包括為所述預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域計算幅度和/或?qū)?yīng)運動矢量的方向的裝置;-所述判定裝置(25)適用于基于所計算的幅度和/或所述運動矢量的方向來執(zhí)行所述判定。
14.根據(jù)權(quán)利要求13的編碼器,其特征在于,-所述判定裝置適用于判定預(yù)測誤差幀(E)的一個區(qū)域不被編碼,如果與該區(qū)域?qū)?yīng)的所述計算的運動矢量幅度未超過第二預(yù)定閾值。
15.用于對運動補償編碼視頻數(shù)據(jù)進(jìn)行解碼的解碼器,包括-用于保存一個視頻數(shù)據(jù)幀(R)的裝置(34);-用于基于所述視頻數(shù)據(jù)幀(R)和基于所接收的運動矢量數(shù)據(jù)來預(yù)測一個視頻數(shù)據(jù)幀(P)的裝置(35);-用于對所接收的預(yù)測誤差數(shù)據(jù)解碼和獲得一個預(yù)測誤差幀(E*)的裝置(32);和-用于基于所述視頻數(shù)據(jù)幀(P)和所述解碼的預(yù)測誤差幀(E*)來計算和輸出一個更新的視頻數(shù)據(jù)幀(I*),并將此更新的視頻數(shù)據(jù)幀(I*)保存在所述存儲裝置中的裝置(33);-用于對所述接收的預(yù)測誤差數(shù)據(jù)解碼的所述裝置(32)包括-用于執(zhí)行下列至少一項操作的判定裝置判定所述預(yù)測誤差幀(E)的已編碼并包含在所接收的預(yù)測誤差數(shù)據(jù)中的區(qū)域和對每個已編碼并包含在所接收的預(yù)測誤差數(shù)據(jù)中的區(qū)域判定至少一個解碼方案;和-用于根據(jù)所述判定裝置的至少一種判定操作對所述接收的預(yù)測誤差數(shù)據(jù)解碼以獲得預(yù)測誤差幀的區(qū)域解碼裝置(48);-其中所述判定裝置適用于分析所述預(yù)測視頻數(shù)據(jù)幀(p)的特性和基于所述分析執(zhí)行至少一個判定操作。
16.根據(jù)權(quán)利要求15的解碼器,其特征在于,所述判定裝置包括-用于將所述預(yù)測視頻數(shù)據(jù)幀(P)分割為多個預(yù)定區(qū)域的裝置(41)-用于對所述預(yù)測視頻數(shù)據(jù)幀的每個區(qū)域分析圖象亮度的不連續(xù)性的裝置。-所述判定裝置適用于基于在所述預(yù)測視頻數(shù)據(jù)幀(P)中相應(yīng)區(qū)域?qū)λ鲱A(yù)測誤差幀(E*)執(zhí)行所述至少一項判定操作。
17.根據(jù)權(quán)利要求16的解碼器,其特征在于,所述不連續(xù)性分析裝置包括-用于在預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域中計算在垂直方向的有限差別(FH)的線性濾波器(42)和計算在水平方向的有限差別(FV)的線性濾波器(42);和-用于將在每一區(qū)域中的兩個濾波器的輸出的絕對值的和與第三預(yù)定閾值相比較的裝置;-所述判定裝置(44)適用于判定預(yù)測誤差幀的一個區(qū)域未編碼并不包含在所述接收的預(yù)測誤差數(shù)據(jù)中,如果對所述預(yù)測視頻數(shù)據(jù)幀的相應(yīng)區(qū)域計算絕對值的和未超出所述所述第三預(yù)定閾值。
18.根據(jù)權(quán)利要求15至17中任何一個的解碼器,其特征在于,-所述區(qū)域解碼裝置(48)包括用于對所述預(yù)測誤差幀(E*)的每個已編碼并包含在所接收的預(yù)測誤差數(shù)據(jù)中的區(qū)域分別從多個不同區(qū)域解碼器(471,…,47n)中選擇一個區(qū)域解碼器的選擇裝置(45,46)。
19.根據(jù)權(quán)利要求18的解碼器,其特征在于,-所述判定裝置包括用于根據(jù)所述預(yù)測視頻數(shù)據(jù)幀(P)的相應(yīng)區(qū)域的亮度不連續(xù)性,將一組特性類別中的一個類別分配給所述預(yù)測誤差幀(E*)的每個將被編碼的區(qū)域的分類裝置(43);-所述選擇裝置(45,46)適用于根據(jù)各個區(qū)域所分配的類別,對所述預(yù)測誤差幀(E*)的每個將被編碼的區(qū)域選擇一個區(qū)域編碼器。
20.根據(jù)權(quán)利要求19的解碼器,其特征在于,所述分類裝置(43)適用于基于用于在與所述預(yù)測誤差幀(E*)的已編碼并包含在所述接收的預(yù)測誤差數(shù)據(jù)中的區(qū)域相對應(yīng)的預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域中計算在垂直方向的有限差別(FH)和計算在水平方向的有限差別(FV)的線性濾波器(42)所提供的輸出值來進(jìn)行分類。
21.根據(jù)權(quán)利要求19的解碼器,其特征在于,所述分類裝置(43)適用于基于集中在該預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域的不同像素群中的相應(yīng)像素亮度不連續(xù)性來進(jìn)行分類,該預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域與所述預(yù)測誤差幀(E*)的已編碼并包含在所述接收的預(yù)測誤差數(shù)據(jù)中的區(qū)域相對應(yīng)。
22.根據(jù)權(quán)利要求20或21的解碼器,其特征在于,-所述一組類別包括下列類別中的至少一個無不連續(xù)性;水平方向不連續(xù)性;垂直方向不連續(xù)性;左對角斜線方向不連續(xù)性;右對角斜線方向不連續(xù)性;非定向不連續(xù)性。
23.根據(jù)權(quán)利要求15至22的任何一個的編碼器,其特征在于,-所述區(qū)域解碼裝置(48)適用于通過所選擇的正交變換或矢量量化或匹配追蹤方案來對所述預(yù)測誤差幀(E*)的將被解碼的每一區(qū)域的所接收的誤差預(yù)測數(shù)據(jù)進(jìn)行解碼。
24.根據(jù)權(quán)利要求18至22的任何一個的解碼器,其特征在于,-每一個區(qū)域解碼器(471,…47n)適用于包括多個解碼方法(631至63k);-用于根據(jù)所接收的編碼方法選擇信息,從相應(yīng)的多個解碼方法(631至63k)中選擇一個解碼方法的解碼方法選擇裝置(62,64,65);
25.根據(jù)權(quán)利要求24的解碼器,其特征在于,所述多個解碼方法(631至63k)對于不同區(qū)域解碼器(471,…47n)是不同的;
26.根據(jù)權(quán)利要求15至25中任何一個的解碼器,其特征在于,-所述判定裝置包括為所述預(yù)測視頻數(shù)據(jù)幀(P)的每一區(qū)域計算幅度和/或相應(yīng)的運動矢量的方向的裝置(44);-所述判定裝置適用于基于所計算的幅度和/或所述運動矢量的方向來執(zhí)行所述判定。
27.根據(jù)權(quán)利要求26的編碼器,其特征在于,-所述判定裝置適用于判定預(yù)測誤差幀(E*)的一個區(qū)域未編碼并不包含在所接收的預(yù)測誤差數(shù)據(jù)中,如果與該區(qū)域?qū)?yīng)的所述計算的運動矢量幅度未超過第四預(yù)定閾值。
28.根據(jù)權(quán)利要求15至27中任何一個的解碼器,其特征在于,-所述用于對所述接收的預(yù)測誤差數(shù)據(jù)進(jìn)行解碼的裝置(32)適用于根據(jù)預(yù)定的空間分配規(guī)則順序地將所述預(yù)測誤差數(shù)據(jù)的所接收部分分配給由所述判定裝置(41,42,44)所判定的各個區(qū)域;-每個部分對應(yīng)于所述預(yù)測誤差幀的一個編碼區(qū)域。
29.根據(jù)權(quán)利要求28的解碼器,其特征在于,-所述判定分配規(guī)則定義了將所述預(yù)測誤差數(shù)據(jù)的所述順序接收部分以當(dāng)掃描所述預(yù)測誤差幀的所有區(qū)域時它們所呈現(xiàn)的順序和/或以它們由所述判定裝置所判定的順序來分配給所述各個區(qū)域。
30.用于傳輸視頻數(shù)據(jù)的系統(tǒng),包括根據(jù)權(quán)利要求1至14中任何一個的編碼器和包括根據(jù)權(quán)利要求15至29中任何一個的解碼器。
31.用于保存視頻數(shù)據(jù)的系統(tǒng),包括根據(jù)權(quán)利要求1至14中任何一個的編碼器,用于保存編碼的視頻數(shù)據(jù)的裝置,和根據(jù)權(quán)利要求15至29中任何一個的解碼器。
32.一種用于對視頻數(shù)據(jù)進(jìn)行運動補償編碼的方法,包括-估計描述視頻幀像素的場景位移的運動矢量;-基于第一視頻數(shù)據(jù)幀(R)和所述運動矢量來預(yù)測一個視頻數(shù)據(jù)幀(P);-基于所述預(yù)測的視頻數(shù)據(jù)幀(P)和第二視頻數(shù)據(jù)幀(I)來計算預(yù)測誤差幀(E);-對所述預(yù)測誤差幀(E)編碼,并獲得預(yù)測誤差數(shù)據(jù);-將所述運動矢量和所述預(yù)測誤差數(shù)據(jù)傳輸給解碼器;-所述用于對所述預(yù)測誤差幀(E)編碼的步驟包括-將所述預(yù)測誤差幀分割為多個區(qū)域;和-執(zhí)行至少一個下列操作判定在所述預(yù)測誤差幀(E)中的區(qū)域?qū)⒈痪幋a和判定對于每個區(qū)域至少一種編碼方法被用于對所述預(yù)測誤差幀(E)編碼;和-根據(jù)所述判定步驟的至少一個判定操作對所述預(yù)測誤差幀(E)進(jìn)行編碼;-其中所述至少一個判定操作是基于分析所述預(yù)測視頻數(shù)據(jù)幀(p)的特性。
33.用于對運動補償編碼視頻數(shù)據(jù)進(jìn)行解碼的方法,包括-保存一個視頻數(shù)據(jù)幀(R);-基于所述視頻數(shù)據(jù)幀(R)和基于所接收的運動矢量數(shù)據(jù)來預(yù)測一個視頻數(shù)據(jù)幀(P);-對所接收的預(yù)測誤差數(shù)據(jù)解碼和獲得一個預(yù)測誤差幀(E*);和-基于所述視頻數(shù)據(jù)幀(P)和所述解碼的預(yù)測誤差幀(E*)來計算和輸出一個更新的視頻數(shù)據(jù)幀(I*),并將此更新的視頻數(shù)據(jù)幀(I*)保存在所述存儲裝置中;-對所述接收的預(yù)測誤差數(shù)據(jù)解碼的步驟包括-執(zhí)行下列至少一項操作判定所述預(yù)測誤差幀(E)的已編碼并包含在所接收的預(yù)測誤差數(shù)據(jù)中的區(qū)域和對每個已編碼并包含在所接收的預(yù)測誤差數(shù)據(jù)中的區(qū)域判定至少一個解碼方案;和-根據(jù)所述判定裝置的至少一種判定操作對所述接收的預(yù)測誤差數(shù)據(jù)解碼以獲得預(yù)測誤差幀;-其中所述判定是基于分析所述預(yù)測視頻數(shù)據(jù)幀(p)的特性。
34.傳輸視頻數(shù)據(jù)的方法,包括根據(jù)權(quán)利要求32的方法的對所述視頻數(shù)據(jù)進(jìn)行編碼,經(jīng)由傳輸媒介傳輸編碼的視頻數(shù)據(jù),和根據(jù)權(quán)利要求33的方法對所傳輸?shù)囊曨l數(shù)據(jù)進(jìn)行解碼。
35.保存視頻數(shù)據(jù)的方法,包括根據(jù)權(quán)利要求32的方法的對所述視頻數(shù)據(jù)進(jìn)行編碼,將編碼的視頻數(shù)據(jù)保存在存儲裝置中,由所述存儲裝置提取出所保存的視頻數(shù)據(jù)和根據(jù)權(quán)利要求33的方法對所提取出的視頻數(shù)據(jù)進(jìn)行解碼。
全文摘要
本發(fā)明涉及在運動補償視頻編碼方案中對預(yù)測誤差的壓縮。預(yù)測幀和運動矢量被用于提取出關(guān)于預(yù)測誤差信號的有用信息,例如,它的位置,方向等。該信息不須被傳輸,因為所提出系統(tǒng)的解碼器包括用于提取信息的裝置。解碼器所提取出的信息被用于對預(yù)測誤差編碼進(jìn)行適應(yīng)化,這明顯地減少比特率。
文檔編號H04N7/50GK1217125SQ96180260
公開日1999年5月19日 申請日期1996年4月18日 優(yōu)先權(quán)日1996年4月18日
發(fā)明者J·尼維格羅斯基, M·A·蒂爾凱爾, O·卡勒沃, P·哈維斯托 申請人:諾基亞流動電話有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
巫溪县| 泰来县| 东乡县| 柘荣县| 兰坪| 丰镇市| 桓台县| 宁海县| 台南市| 台中市| 洞口县| 新闻| 克山县| 托克逊县| 德州市| 启东市| 乌兰浩特市| 上犹县| 琼结县| 马山县| 奎屯市| 英超| 荆门市| 虞城县| 桃江县| 佛学| 越西县| 会东县| 舟曲县| 水城县| 巫山县| 章丘市| 清水县| 江北区| 扎鲁特旗| 湖北省| 巴里| 洪雅县| 府谷县| 临夏县| 双牌县|