專利名稱:應(yīng)用于多媒體數(shù)據(jù)的編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種編碼方法,用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù),所述視頻流由被劃分成宏塊的連續(xù)幀組成,所述幀以至少I幀、或P幀、或B幀的形式被編碼,所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼,所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者在兩個(gè)P幀之間、并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)。
本發(fā)明還涉及對(duì)應(yīng)的計(jì)算機(jī)可執(zhí)行處理步驟,所述步驟被提供存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上并包括在所述編碼中定義的步驟,并且涉及通過根據(jù)這種編碼方法編碼的數(shù)字視頻數(shù)據(jù)產(chǎn)生的可傳輸編碼信號(hào)。
背景技術(shù):
現(xiàn)在有越來越多的數(shù)字廣播服務(wù)可用,并因此這顯得對(duì)于用戶能夠良好地開發(fā)多媒體信息資源來說有用,所述用戶一般都不是信息技術(shù)專家。所述多媒體信息一般由固有和合成音頻、視覺和對(duì)象數(shù)據(jù)構(gòu)成,其中視覺和對(duì)象數(shù)據(jù)用于鑒于諸如流送、壓縮和用戶交互這樣的操作被操縱,并且MPEG-4標(biāo)準(zhǔn)是提供許多允許執(zhí)行所述操作的功能的最一致的解決方案之一。MPEG-4最重要的方面是支持依據(jù)對(duì)象概念的交互性情景的對(duì)象被獨(dú)立編碼并同時(shí)以壓縮格式作為若干比特流被存儲(chǔ)或傳輸,所述比特流即所謂的基本流。
MPEG-4的規(guī)范包括對(duì)象描述架構(gòu),用于識(shí)別和描述這些基本流(音頻、視頻等等)以及將它們以適當(dāng)?shù)姆绞较嚓P(guān)聯(lián)以便獲得情景描述并向最終用戶構(gòu)建和呈現(xiàn)有意義的多媒體情景MPEG-4將多媒體數(shù)據(jù)作為對(duì)象的成分來建模,對(duì)象指明了音頻-可視情景的任何元素。但是,該標(biāo)準(zhǔn)的巨大成功有助于現(xiàn)在越來越多的信息可以數(shù)字形式可用的事實(shí)。對(duì)于人類用戶以及對(duì)用于任何特定目的的音頻-視覺數(shù)據(jù)進(jìn)行操作的自動(dòng)系統(tǒng)來說,尋找和選擇正確的信息因此變得更加困難,這兩者都需要與所述信息的內(nèi)容有關(guān)的信息,以便例如判定與所述內(nèi)容的關(guān)系。
MPEG-7標(biāo)準(zhǔn)的目標(biāo)(還未確定)將是描述所述內(nèi)容,即尋找描述各種不同多媒體材料,比如語音、音頻、視頻、靜態(tài)圖片、3D模型或其它多媒體材料的標(biāo)準(zhǔn)方式,以及描述這些元素如何被組成在多媒體文檔中的方式。MPEG-7因此用于定義多個(gè)標(biāo)準(zhǔn)化元素,被稱為描述符D(每個(gè)描述符能夠特征化內(nèi)容的特定特征,例如圖像的顏色、對(duì)象的運(yùn)動(dòng)、電影的標(biāo)題等等...)、描述方案DS(描述方案定義描述符的結(jié)構(gòu)和關(guān)系)、描述定義語言DDL(用于規(guī)定描述符和描述方案)、以及這些描述的編碼方案。圖1給出了這些MPEG-7標(biāo)準(zhǔn)化元素及其關(guān)系的圖像概觀。是否需要標(biāo)準(zhǔn)化描述符和描述方案仍然在MPEG中討論。但是,標(biāo)準(zhǔn)化至少一組最廣泛使用的是很可能的。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是提出一種新的描述符,旨在對(duì)于MPEG-7標(biāo)準(zhǔn)十分有用。
為此,本發(fā)明涉及如在說明書的介紹部分中定義的編碼方法,該編碼方法進(jìn)一步特征在于其包括以下步驟-結(jié)構(gòu)化步驟,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-計(jì)算步驟,用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析步驟,用于分析所述統(tǒng)計(jì),以便確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)步驟,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;-描述步驟,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;-編碼步驟,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
本發(fā)明的另一個(gè)目的是提供一組允許執(zhí)行所述方法的計(jì)算機(jī)可執(zhí)行處理步驟。
為此,為在一種編碼設(shè)備中使用,所述編碼設(shè)備用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù),所述視頻流由被劃分成宏塊的連續(xù)幀組成,所述幀以至少I幀、P幀和B幀的形式被編碼,所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼,所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者在兩個(gè)P幀之間、并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè),本發(fā)明涉及計(jì)算機(jī)可執(zhí)行處理步驟,該計(jì)算機(jī)可執(zhí)行處理步驟被提供存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上并包括步驟-結(jié)構(gòu)化步驟,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-計(jì)算步驟,用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析步驟,用于分析所述統(tǒng)計(jì),以便確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)步驟,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;-描述步驟,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;-編碼步驟,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
現(xiàn)在將通過舉例的方式,參考附圖來描述本發(fā)明,其中圖1給出了用于定義MPEG-7環(huán)境的MPEG-7標(biāo)準(zhǔn)化元素及其關(guān)系的圖形概觀,在MPEG-7環(huán)境中,用戶可接著部署其它的描述符(要么按照標(biāo)準(zhǔn),或者可能不按照);圖2和3說明了允許編碼和解碼多媒體數(shù)據(jù)的編碼和解碼方法。
具體實(shí)施例方式
如圖2所示的根據(jù)本發(fā)明的編碼多個(gè)多媒體數(shù)據(jù)的方法包括下列步驟采集步驟(CONV),用于將可用的多媒體數(shù)據(jù)轉(zhuǎn)換成一個(gè)或多個(gè)比特流,結(jié)構(gòu)化步驟(SEGM),用于借助分析和分段來捕獲所述比特流中不同層的信息,描述步驟,用于生成所獲得層的信息的描述數(shù)據(jù),和編碼步驟(COD),允許編碼如此獲得的描述數(shù)據(jù)。更精確的是,描述步驟包括定義子步驟(DEF),用于存儲(chǔ)與所述多個(gè)多媒體數(shù)據(jù)有關(guān)的一組描述符,以及描述子步驟(DESC),用于根據(jù)基于原始多媒體數(shù)據(jù)而在結(jié)構(gòu)化步驟中獲得的每一層信息來選擇要編碼的描述數(shù)據(jù)。編碼的數(shù)據(jù)接著被傳輸和/或被存儲(chǔ)。如圖3所示的對(duì)應(yīng)編碼方法包括解碼步驟(DECOD),其借助上述編碼方法編碼的信號(hào)、存儲(chǔ)(STOR)如此獲得的編碼信號(hào)、基于由用戶(USER)發(fā)送的搜索命令,在由所述解碼信號(hào)構(gòu)成的數(shù)據(jù)中進(jìn)行搜索(SEARCH),并且向所述用戶發(fā)送回在存儲(chǔ)數(shù)據(jù)中的所述搜索的檢索結(jié)果。
在與所有可能的多媒體內(nèi)容相關(guān)聯(lián)存儲(chǔ)的描述符中,根據(jù)本發(fā)明提出的一個(gè)基于的是將來的標(biāo)準(zhǔn)H.264/AVC,其預(yù)期在2003年由ITU-I正式批準(zhǔn)作為推薦H.264/AVC,以及由ISO/IEC批準(zhǔn)作為國(guó)際標(biāo)準(zhǔn)14496-10(MPEG-4部分10)先進(jìn)視頻編碼(AVC)。這個(gè)新標(biāo)準(zhǔn)應(yīng)用非常相同原理的基于塊的運(yùn)動(dòng)補(bǔ)償變換編碼,其可以從已確立的標(biāo)準(zhǔn),例如MPEG-2中得知。H.264語法因此被組織成頭部的通常層次(比如圖片-、片段-和宏塊頭部)和數(shù)據(jù)(比如運(yùn)動(dòng)矢量、塊變換系數(shù)、量化器刻度等等)。維持了與數(shù)據(jù)結(jié)構(gòu)化(例如I、P或B圖片、幀內(nèi)和幀間的宏塊)有關(guān)的大多數(shù)已知概念的同時(shí),在頭部和數(shù)據(jù)層也引入了一些新的概念,這被定義為有效地表示視頻數(shù)據(jù)的內(nèi)容,和網(wǎng)絡(luò)抽象層(NAL),其以適于由高層(傳輸)系統(tǒng)傳送的方式來格式化數(shù)據(jù)和提供頭部信息。
在數(shù)據(jù)層上的H.264/AVC的主要特性之一也是使用更多精細(xì)地分區(qū)和操縱16×16個(gè)宏塊(宏塊MB包括亮度的16×16個(gè)塊和相應(yīng)的色度的8×8個(gè)塊,但是許多操作例如運(yùn)動(dòng)估計(jì),實(shí)際上只采用亮度并且不能將結(jié)果投影到色度上)。因此,運(yùn)動(dòng)補(bǔ)償處理可形成在尺寸上有4×4那么小的MB的分段,使用達(dá)到四分之一的樣本格(samplegrid)的運(yùn)動(dòng)矢量精確度。并且,樣本塊的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的選擇處理可涉及多個(gè)先前存儲(chǔ)的解碼圖片,而不只是鄰近的解碼圖片。即使使用幀內(nèi)編碼,現(xiàn)在可能使用來自相鄰塊的先前解碼的樣本來形成對(duì)塊的預(yù)測(cè)(該基于空間的預(yù)測(cè)的規(guī)則是由所謂的幀內(nèi)預(yù)測(cè)模式描述的)。該方面尤其與這里定義的本發(fā)明有關(guān),并且之后在本說明中突出。在運(yùn)動(dòng)補(bǔ)償或基于空間的預(yù)測(cè)之后,通?;?×4的塊大小,而不是傳統(tǒng)8×8的大小來變換和量化所得的預(yù)測(cè)誤差。所述H.264/AVC標(biāo)準(zhǔn)仍然使用在其它編碼階段(例如熵編碼)的其它特定實(shí)現(xiàn),其大多數(shù)是固定的或者只可在圖片級(jí)或在圖片級(jí)之上才能改變。
因?yàn)槭抢孟惹皹?biāo)準(zhǔn)的情況,所以H.264/AVC允許圖像塊以幀內(nèi)模式被編碼,即不需要使用根據(jù)相鄰圖像的時(shí)間預(yù)測(cè)。H.264/AVC幀內(nèi)編碼的新穎性是使用空間預(yù)測(cè),允許通過在相同圖片中由先前編碼和重構(gòu)的樣本所形成的塊P來預(yù)測(cè)幀內(nèi)塊。在編碼之前,從實(shí)際圖像塊減去該預(yù)測(cè)塊P,這不同于現(xiàn)存的標(biāo)準(zhǔn)(例如MPEG-2、MPEG-4ASP),其中實(shí)際圖像塊被直接編碼。幀內(nèi)模式的選擇必須被信號(hào)通知給解碼器,為此目的,H.264定義有效的編碼過程(中心思想是通過應(yīng)用相鄰4×4個(gè)塊的模式通常將是高度相關(guān)的觀察來避免分開編碼4×4種模式)。
最近在計(jì)算、通信和數(shù)字?jǐn)?shù)據(jù)存儲(chǔ)中的進(jìn)展引導(dǎo)專業(yè)和消費(fèi)者環(huán)境向大的數(shù)字檔案的巨大增長(zhǎng),其特征是穩(wěn)定地增加了容量和內(nèi)部多樣性。尋找有效的方式來快速檢索存儲(chǔ)的感興趣信息因此是十分重要的。因?yàn)樵谇д鬃止?jié)的沒有組織存儲(chǔ)的數(shù)據(jù)中進(jìn)行手工搜索是乏味和費(fèi)時(shí)的。因此存在對(duì)傳輸信息搜索和檢索任務(wù)給自動(dòng)系統(tǒng)的增加的需要。在沒有結(jié)構(gòu)化的視頻內(nèi)容的大檔案中搜索和檢索通常是在已經(jīng)利用內(nèi)容分析技術(shù)對(duì)內(nèi)容進(jìn)行索引后執(zhí)行。這些技術(shù)包括旨在對(duì)于視頻內(nèi)容的描述來自動(dòng)創(chuàng)建視頻材料的注釋的算法(所述注釋從與諸如顏色和紋理的屬相有關(guān)的低級(jí)別信號(hào)變化到諸如面部表情和位置的高級(jí)別信息)。
一個(gè)重要的內(nèi)容描述符是所謂的單色,或“單顏色”幀指示符。如果幀完全用同一顏色填充(實(shí)際上,因?yàn)樾盘?hào)鏈的噪聲從產(chǎn)生到遞送,單色幀通常表示單個(gè)顏色,例如藍(lán)色、暗灰色、黑色的不可察覺的變化),那么將該幀認(rèn)為是單色的。在許多基于內(nèi)容的檢索應(yīng)用中,檢測(cè)單色幀的是重要的步驟。例如,如專利申請(qǐng)公開US2002/0186768中所描述的,商業(yè)檢測(cè)器和程序邊界檢測(cè)器依賴于對(duì)存在的單色幀的識(shí)別,單色幀通常是黑色,并且被插入廣播符(broadcaster)以將兩個(gè)連續(xù)的節(jié)目或來自商業(yè)廣告的節(jié)目分開。單色幀判定還用于從內(nèi)容視覺表中濾出無信息的關(guān)鍵幀。
因?yàn)榧磳淼降腍.246/MPEG-4AVC標(biāo)準(zhǔn)的較大應(yīng)用范圍,存在對(duì)有效解決H.246/AVC視頻內(nèi)容分析的不斷需求。在最近幾年,對(duì)于MPEG-2視頻,已經(jīng)證明了若干有效內(nèi)容分析算法和方法,其在壓縮域幾乎是排他地操作。大多數(shù)這些方法可擴(kuò)展到H.246/AVC,因?yàn)閺纳厦婵梢钥闯?,H.246/AVC以一種方式規(guī)定了MPEG-2語法的超集。但是,由于MPEG-2的限制,這些現(xiàn)有方法中的一些可能不給出適當(dāng)或可靠的性能,這是通過包括附加并且通常是昂貴的方法來解決的缺陷,所述方法在像素或音頻域中操作。
于2004年4月8日提交的歐洲專利申請(qǐng),官方提交號(hào)為04300189.0(PHFR040040),接著提出了一種用于避免所述缺陷的方法。更精確地,所述歐洲專利申請(qǐng)涉及檢測(cè)方法(和對(duì)應(yīng)的檢測(cè)設(shè)備),其應(yīng)用于以視頻流形式可用的數(shù)字編碼視頻數(shù)據(jù),所述視頻流包括被劃分成宏塊的連續(xù)幀,宏塊本身可子劃分成連續(xù)的塊,所述幀包括至少I幀、P幀和B幀,所述I幀獨(dú)立于其它幀被直接或者借助空間預(yù)測(cè)而被獨(dú)立編碼,所述空間預(yù)測(cè)根據(jù)在同一幀中至少一個(gè)由先前編碼或重構(gòu)的樣本而形成的塊進(jìn)行的,所述P幀被時(shí)間布置在所述I幀之間并且或根據(jù)至少先前的I或P幀被預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者兩個(gè)P幀之間,并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè),所述檢測(cè)方法還包括步驟-根據(jù)預(yù)定的幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的每個(gè)連續(xù)的塊確定它是否被編碼;-為當(dāng)前幀的所有連續(xù)的塊收集類似的信息,以便傳遞與所述預(yù)定的幀內(nèi)預(yù)測(cè)模式有關(guān)的統(tǒng)計(jì);-分析所述統(tǒng)計(jì),以確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)步驟,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案。
在所述歐洲專利申請(qǐng)中描述的技術(shù)方案的原理基于幀內(nèi)預(yù)測(cè)模式可方便地用于單色幀檢測(cè)的目的的事實(shí),其中所述幀內(nèi)預(yù)測(cè)模式是H.264/AVC的新穎編碼工具。主要思想是觀察構(gòu)成圖像的宏塊的幀內(nèi)預(yù)測(cè)模式的分布。當(dāng)大多數(shù)塊展示相同或類似的預(yù)測(cè)模式時(shí),單色圖像或子圖像被檢測(cè)這些塊的數(shù)量可例如與固定的閾值比較。當(dāng)根據(jù)特定幀內(nèi)預(yù)測(cè)模式來編碼圖像(或子圖像)中的多數(shù)塊時(shí),圖像(或子圖像)呈現(xiàn)非常低的空間變化,并且其要么是單色的,要么包含重復(fù)的圖案(對(duì)于早先提到的該算法對(duì)生成內(nèi)容表的應(yīng)用于或者對(duì)于關(guān)鍵幀的提取,兩種類型的圖像或子圖像——單色和具有重復(fù)圖案——必須被丟棄)。
根據(jù)MPEG-7標(biāo)準(zhǔn)草案ISO/IEC/ 1/SC 29 N 4242(2001年10月23日),規(guī)定了用于描述多媒體內(nèi)容、尤其是描述符D和描述方案DS的特征的工具。
那么,根據(jù)本發(fā)明的編碼方法的定義如下。要編碼的數(shù)字視頻數(shù)據(jù)以視頻流形式可用,所述視頻流包括被劃分成宏塊的連續(xù)幀,宏塊本身可被子劃分為相連的塊,并且所述幀以至少I幀、P幀和B幀的形式被編碼,所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼,所述P幀被時(shí)間布置在所述I幀之間并根據(jù)至少先前的I或P幀來預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者在兩個(gè)P幀之間,并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)。該編碼方法還可包括下列步驟-結(jié)構(gòu)化步驟,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-計(jì)算步驟,用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析步驟,用于分析所述統(tǒng)計(jì),并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)步驟,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;-描述步驟,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;-編碼步驟,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
這些步驟可根據(jù)本發(fā)明借助于編碼設(shè)備來實(shí)現(xiàn),所述編碼設(shè)備用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù),所述視頻流包括被劃分成宏塊的連續(xù)幀,宏塊本身可被子劃分為相連的塊,并且所述幀以至少I幀、P幀和B幀的形式被編碼,所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼,所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者在兩個(gè)P幀之間,并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)。所述編碼設(shè)備包括-結(jié)構(gòu)化裝置,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-計(jì)算步驟,用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析步驟,用于分析所述統(tǒng)計(jì),并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)步驟,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;-描述步驟,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;-編碼步驟,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
根據(jù)本發(fā)明的編碼方法的步驟還可借助計(jì)算機(jī)可執(zhí)行處理步驟來實(shí)現(xiàn),所述計(jì)算機(jī)可執(zhí)行處理步驟存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上并且類似地包括步驟-根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析所述統(tǒng)計(jì),以便確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;
-當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;這些步驟之后是描述步驟,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),以及關(guān)聯(lián)的編碼步驟,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
本發(fā)明還涉及可傳輸?shù)木幋a信號(hào),比如在所述編碼設(shè)備的輸出端可得的以及通過根據(jù)先前描述的編碼方法編碼數(shù)字視頻數(shù)據(jù)而產(chǎn)生的編碼信號(hào)。
在這里必須指出的是,本發(fā)明不限于前面提到的實(shí)施例,可作出變化和修改而不會(huì)偏離本發(fā)明在所附權(quán)利要求中所定義的精神和范圍。
例如可注意到,在說明書或權(quán)利要求中使用的詞語“宏塊”和“塊”不僅旨在如在諸如MPEG-2或MPEG-4的標(biāo)準(zhǔn)中使用的那樣來描述幀的矩形子區(qū)域的層次,而且描述幀的任何類型的任意形狀的子區(qū)域,如在基于不規(guī)則形狀的塊的編碼或解碼方案中遇到的。
還必須注意到,存在許多方式來借助硬件項(xiàng)或軟件項(xiàng)或兩者的方式實(shí)現(xiàn)功能。在這方面,附圖是非常概略的,并且當(dāng)附圖將不同功能顯示為不同模塊時(shí),這不意味著排除了單個(gè)硬件項(xiàng)或軟件項(xiàng)執(zhí)行若干功能。這也不排除硬件項(xiàng)或軟件項(xiàng)或兩者的組合執(zhí)行一個(gè)功能。
還指出,詞語“包括”不排除權(quán)利要求中所列出之外的其它元件或步驟的存在。元件或步驟前的詞語“一”或“一個(gè)”不排除多個(gè)這種元件或步驟的存在。
權(quán)利要求
1.一種編碼方法,用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù),所述視頻流包括被劃分成宏塊的連續(xù)幀,宏塊本身可被子劃分為相連的塊,并且所述幀以至少I幀、P幀和B幀的形式被編碼,所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼,所述P幀被時(shí)間布置在所述I幀之間并根據(jù)至少先前的I或P幀來預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者在兩個(gè)P幀之間,并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè),該編碼方法包括下列步驟-結(jié)構(gòu)化步驟,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-計(jì)算步驟,用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析步驟,用于分析所述統(tǒng)計(jì),并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)步驟,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;-描述步驟,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;-編碼步驟,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
2.一種編碼設(shè)備,用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù),所述視頻流包括被劃分成宏塊的連續(xù)幀,宏塊本身可被子劃分為相連的塊,并且所述幀以至少I幀、P幀和B幀的形式被編碼,所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼,所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者在兩個(gè)P幀之間,并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè),所述編碼設(shè)備包括-結(jié)構(gòu)化裝置,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-計(jì)算裝置,用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析裝置,用于分析所述統(tǒng)計(jì),并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)裝置,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;-描述裝置,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;-編碼裝置,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
3.為在一種編碼設(shè)備中使用,所述編碼設(shè)備用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù),所述視頻流包括被劃分成宏塊的連續(xù)幀,宏塊本身可被子劃分為相連的塊,并且所述幀以至少I幀、P幀和B幀的形式被編碼,所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼,所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè),所述B幀被時(shí)間布置在I幀和P幀之間,或者在兩個(gè)P幀之間,并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè),所述編碼設(shè)備包括-結(jié)構(gòu)化裝置,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼;-計(jì)算裝置,用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);-分析裝置,用于分析所述統(tǒng)計(jì),并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;-檢測(cè)裝置,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;-描述裝置,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;-編碼裝置,用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
4.一種用于數(shù)字視頻數(shù)據(jù)編碼設(shè)備的計(jì)算機(jī)程序產(chǎn)品,包括當(dāng)被加載到所述編碼設(shè)備中時(shí)使其執(zhí)行如權(quán)利要求3中所述的步驟的指令集。
5.由根據(jù)權(quán)利要求1所述的編碼方法的編碼數(shù)字視頻數(shù)據(jù)所產(chǎn)生的可傳輸?shù)木幋a信號(hào)。
全文摘要
本發(fā)明涉及一種編碼方法,用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù),所述視頻流包括被劃分成宏塊的連續(xù)幀,宏塊本身可被子劃分為相連的塊。這些幀以至少獨(dú)立編碼的I幀、根據(jù)至少先前的I或P幀預(yù)測(cè)的P幀、以及根據(jù)它們所被布置于其間的至少兩個(gè)幀被雙向預(yù)測(cè)的B幀的形式被編碼。根據(jù)本發(fā)明,該編碼方法包括下列步驟結(jié)構(gòu)化步驟,用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有宏塊捕獲有關(guān)的編碼參數(shù),所述編碼參數(shù)表征所述宏塊是否已經(jīng)被編碼;計(jì)算步驟,用于遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì);分析步驟,用于分析所述統(tǒng)計(jì),并確定展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量;檢測(cè)步驟,用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn),圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案;描述步驟,用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù),所述圖像或子圖像要么是單色要么具有重復(fù)的圖案;編碼步驟,用于編碼描述數(shù)據(jù)和原始數(shù)據(jù)。
文檔編號(hào)H04N5/14GK1943247SQ200580010867
公開日2007年4月4日 申請(qǐng)日期2005年4月4日 優(yōu)先權(quán)日2004年4月8日
發(fā)明者M·巴比里, D·布拉澤羅維克 申請(qǐng)人:皇家飛利浦電子股份有限公司