應(yīng)用于多媒體數(shù)據(jù)的編碼方法

文檔序號(hào)：7634550閱讀：255來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：應(yīng)用于多媒體數(shù)據(jù)的編碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種編碼方法，用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù)，所述視頻流由被劃分成宏塊的連續(xù)幀組成，所述幀以至少I幀、或P幀、或B幀的形式被編碼，所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼，所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者在兩個(gè)P幀之間、并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)。
本發(fā)明還涉及對(duì)應(yīng)的計(jì)算機(jī)可執(zhí)行處理步驟，所述步驟被提供存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上并包括在所述編碼中定義的步驟，并且涉及通過根據(jù)這種編碼方法編碼的數(shù)字視頻數(shù)據(jù)產(chǎn)生的可傳輸編碼信號(hào)。
背景技術(shù)：
現(xiàn)在有越來越多的數(shù)字廣播服務(wù)可用，并因此這顯得對(duì)于用戶能夠良好地開發(fā)多媒體信息資源來說有用，所述用戶一般都不是信息技術(shù)專家。所述多媒體信息一般由固有和合成音頻、視覺和對(duì)象數(shù)據(jù)構(gòu)成，其中視覺和對(duì)象數(shù)據(jù)用于鑒于諸如流送、壓縮和用戶交互這樣的操作被操縱，并且MPEG-4標(biāo)準(zhǔn)是提供許多允許執(zhí)行所述操作的功能的最一致的解決方案之一。MPEG-4最重要的方面是支持依據(jù)對(duì)象概念的交互性情景的對(duì)象被獨(dú)立編碼并同時(shí)以壓縮格式作為若干比特流被存儲(chǔ)或傳輸，所述比特流即所謂的基本流。
MPEG-4的規(guī)范包括對(duì)象描述架構(gòu)，用于識(shí)別和描述這些基本流(音頻、視頻等等)以及將它們以適當(dāng)?shù)姆绞较嚓P(guān)聯(lián)以便獲得情景描述并向最終用戶構(gòu)建和呈現(xiàn)有意義的多媒體情景MPEG-4將多媒體數(shù)據(jù)作為對(duì)象的成分來建模，對(duì)象指明了音頻-可視情景的任何元素。但是，該標(biāo)準(zhǔn)的巨大成功有助于現(xiàn)在越來越多的信息可以數(shù)字形式可用的事實(shí)。對(duì)于人類用戶以及對(duì)用于任何特定目的的音頻-視覺數(shù)據(jù)進(jìn)行操作的自動(dòng)系統(tǒng)來說，尋找和選擇正確的信息因此變得更加困難，這兩者都需要與所述信息的內(nèi)容有關(guān)的信息，以便例如判定與所述內(nèi)容的關(guān)系。
MPEG-7標(biāo)準(zhǔn)的目標(biāo)(還未確定)將是描述所述內(nèi)容，即尋找描述各種不同多媒體材料，比如語音、音頻、視頻、靜態(tài)圖片、3D模型或其它多媒體材料的標(biāo)準(zhǔn)方式，以及描述這些元素如何被組成在多媒體文檔中的方式。MPEG-7因此用于定義多個(gè)標(biāo)準(zhǔn)化元素，被稱為描述符D(每個(gè)描述符能夠特征化內(nèi)容的特定特征，例如圖像的顏色、對(duì)象的運(yùn)動(dòng)、電影的標(biāo)題等等...)、描述方案DS(描述方案定義描述符的結(jié)構(gòu)和關(guān)系)、描述定義語言DDL(用于規(guī)定描述符和描述方案)、以及這些描述的編碼方案。圖1給出了這些MPEG-7標(biāo)準(zhǔn)化元素及其關(guān)系的圖像概觀。是否需要標(biāo)準(zhǔn)化描述符和描述方案仍然在MPEG中討論。但是，標(biāo)準(zhǔn)化至少一組最廣泛使用的是很可能的。

發(fā)明內(nèi)容
因此，本發(fā)明的目的是提出一種新的描述符，旨在對(duì)于MPEG-7標(biāo)準(zhǔn)十分有用。
為此，本發(fā)明涉及如在說明書的介紹部分中定義的編碼方法，該編碼方法進(jìn)一步特征在于其包括以下步驟-結(jié)構(gòu)化步驟，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-計(jì)算步驟，用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析步驟，用于分析所述統(tǒng)計(jì)，以便確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)步驟，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；-描述步驟，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；-編碼步驟，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
本發(fā)明的另一個(gè)目的是提供一組允許執(zhí)行所述方法的計(jì)算機(jī)可執(zhí)行處理步驟。
為此，為在一種編碼設(shè)備中使用，所述編碼設(shè)備用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù)，所述視頻流由被劃分成宏塊的連續(xù)幀組成，所述幀以至少I幀、P幀和B幀的形式被編碼，所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼，所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者在兩個(gè)P幀之間、并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)，本發(fā)明涉及計(jì)算機(jī)可執(zhí)行處理步驟，該計(jì)算機(jī)可執(zhí)行處理步驟被提供存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上并包括步驟-結(jié)構(gòu)化步驟，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-計(jì)算步驟，用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析步驟，用于分析所述統(tǒng)計(jì)，以便確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)步驟，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；-描述步驟，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；-編碼步驟，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。

現(xiàn)在將通過舉例的方式，參考附圖來描述本發(fā)明，其中圖1給出了用于定義MPEG-7環(huán)境的MPEG-7標(biāo)準(zhǔn)化元素及其關(guān)系的圖形概觀，在MPEG-7環(huán)境中，用戶可接著部署其它的描述符(要么按照標(biāo)準(zhǔn)，或者可能不按照)；圖2和3說明了允許編碼和解碼多媒體數(shù)據(jù)的編碼和解碼方法。
具體實(shí)施例方式
如圖2所示的根據(jù)本發(fā)明的編碼多個(gè)多媒體數(shù)據(jù)的方法包括下列步驟采集步驟(CONV)，用于將可用的多媒體數(shù)據(jù)轉(zhuǎn)換成一個(gè)或多個(gè)比特流，結(jié)構(gòu)化步驟(SEGM)，用于借助分析和分段來捕獲所述比特流中不同層的信息，描述步驟，用于生成所獲得層的信息的描述數(shù)據(jù)，和編碼步驟(COD)，允許編碼如此獲得的描述數(shù)據(jù)。更精確的是，描述步驟包括定義子步驟(DEF)，用于存儲(chǔ)與所述多個(gè)多媒體數(shù)據(jù)有關(guān)的一組描述符，以及描述子步驟(DESC)，用于根據(jù)基于原始多媒體數(shù)據(jù)而在結(jié)構(gòu)化步驟中獲得的每一層信息來選擇要編碼的描述數(shù)據(jù)。編碼的數(shù)據(jù)接著被傳輸和/或被存儲(chǔ)。如圖3所示的對(duì)應(yīng)編碼方法包括解碼步驟(DECOD)，其借助上述編碼方法編碼的信號(hào)、存儲(chǔ)(STOR)如此獲得的編碼信號(hào)、基于由用戶(USER)發(fā)送的搜索命令，在由所述解碼信號(hào)構(gòu)成的數(shù)據(jù)中進(jìn)行搜索(SEARCH)，并且向所述用戶發(fā)送回在存儲(chǔ)數(shù)據(jù)中的所述搜索的檢索結(jié)果。
在與所有可能的多媒體內(nèi)容相關(guān)聯(lián)存儲(chǔ)的描述符中，根據(jù)本發(fā)明提出的一個(gè)基于的是將來的標(biāo)準(zhǔn)H.264/AVC，其預(yù)期在2003年由ITU-I正式批準(zhǔn)作為推薦H.264/AVC，以及由ISO/IEC批準(zhǔn)作為國(guó)際標(biāo)準(zhǔn)14496-10(MPEG-4部分10)先進(jìn)視頻編碼(AVC)。這個(gè)新標(biāo)準(zhǔn)應(yīng)用非常相同原理的基于塊的運(yùn)動(dòng)補(bǔ)償變換編碼，其可以從已確立的標(biāo)準(zhǔn)，例如MPEG-2中得知。H.264語法因此被組織成頭部的通常層次(比如圖片-、片段-和宏塊頭部)和數(shù)據(jù)(比如運(yùn)動(dòng)矢量、塊變換系數(shù)、量化器刻度等等)。維持了與數(shù)據(jù)結(jié)構(gòu)化(例如I、P或B圖片、幀內(nèi)和幀間的宏塊)有關(guān)的大多數(shù)已知概念的同時(shí)，在頭部和數(shù)據(jù)層也引入了一些新的概念，這被定義為有效地表示視頻數(shù)據(jù)的內(nèi)容，和網(wǎng)絡(luò)抽象層(NAL)，其以適于由高層(傳輸)系統(tǒng)傳送的方式來格式化數(shù)據(jù)和提供頭部信息。
在數(shù)據(jù)層上的H.264/AVC的主要特性之一也是使用更多精細(xì)地分區(qū)和操縱16×16個(gè)宏塊(宏塊MB包括亮度的16×16個(gè)塊和相應(yīng)的色度的8×8個(gè)塊，但是許多操作例如運(yùn)動(dòng)估計(jì)，實(shí)際上只采用亮度并且不能將結(jié)果投影到色度上)。因此，運(yùn)動(dòng)補(bǔ)償處理可形成在尺寸上有4×4那么小的MB的分段，使用達(dá)到四分之一的樣本格(samplegrid)的運(yùn)動(dòng)矢量精確度。并且，樣本塊的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的選擇處理可涉及多個(gè)先前存儲(chǔ)的解碼圖片，而不只是鄰近的解碼圖片。即使使用幀內(nèi)編碼，現(xiàn)在可能使用來自相鄰塊的先前解碼的樣本來形成對(duì)塊的預(yù)測(cè)(該基于空間的預(yù)測(cè)的規(guī)則是由所謂的幀內(nèi)預(yù)測(cè)模式描述的)。該方面尤其與這里定義的本發(fā)明有關(guān)，并且之后在本說明中突出。在運(yùn)動(dòng)補(bǔ)償或基于空間的預(yù)測(cè)之后，通?；?×4的塊大小，而不是傳統(tǒng)8×8的大小來變換和量化所得的預(yù)測(cè)誤差。所述H.264/AVC標(biāo)準(zhǔn)仍然使用在其它編碼階段(例如熵編碼)的其它特定實(shí)現(xiàn)，其大多數(shù)是固定的或者只可在圖片級(jí)或在圖片級(jí)之上才能改變。
因?yàn)槭抢孟惹皹?biāo)準(zhǔn)的情況，所以H.264/AVC允許圖像塊以幀內(nèi)模式被編碼，即不需要使用根據(jù)相鄰圖像的時(shí)間預(yù)測(cè)。H.264/AVC幀內(nèi)編碼的新穎性是使用空間預(yù)測(cè)，允許通過在相同圖片中由先前編碼和重構(gòu)的樣本所形成的塊P來預(yù)測(cè)幀內(nèi)塊。在編碼之前，從實(shí)際圖像塊減去該預(yù)測(cè)塊P，這不同于現(xiàn)存的標(biāo)準(zhǔn)(例如MPEG-2、MPEG-4ASP)，其中實(shí)際圖像塊被直接編碼。幀內(nèi)模式的選擇必須被信號(hào)通知給解碼器，為此目的，H.264定義有效的編碼過程(中心思想是通過應(yīng)用相鄰4×4個(gè)塊的模式通常將是高度相關(guān)的觀察來避免分開編碼4×4種模式)。
最近在計(jì)算、通信和數(shù)字?jǐn)?shù)據(jù)存儲(chǔ)中的進(jìn)展引導(dǎo)專業(yè)和消費(fèi)者環(huán)境向大的數(shù)字檔案的巨大增長(zhǎng)，其特征是穩(wěn)定地增加了容量和內(nèi)部多樣性。尋找有效的方式來快速檢索存儲(chǔ)的感興趣信息因此是十分重要的。因?yàn)樵谇д鬃止?jié)的沒有組織存儲(chǔ)的數(shù)據(jù)中進(jìn)行手工搜索是乏味和費(fèi)時(shí)的。因此存在對(duì)傳輸信息搜索和檢索任務(wù)給自動(dòng)系統(tǒng)的增加的需要。在沒有結(jié)構(gòu)化的視頻內(nèi)容的大檔案中搜索和檢索通常是在已經(jīng)利用內(nèi)容分析技術(shù)對(duì)內(nèi)容進(jìn)行索引后執(zhí)行。這些技術(shù)包括旨在對(duì)于視頻內(nèi)容的描述來自動(dòng)創(chuàng)建視頻材料的注釋的算法(所述注釋從與諸如顏色和紋理的屬相有關(guān)的低級(jí)別信號(hào)變化到諸如面部表情和位置的高級(jí)別信息)。
一個(gè)重要的內(nèi)容描述符是所謂的單色，或“單顏色”幀指示符。如果幀完全用同一顏色填充(實(shí)際上，因?yàn)樾盘?hào)鏈的噪聲從產(chǎn)生到遞送，單色幀通常表示單個(gè)顏色，例如藍(lán)色、暗灰色、黑色的不可察覺的變化)，那么將該幀認(rèn)為是單色的。在許多基于內(nèi)容的檢索應(yīng)用中，檢測(cè)單色幀的是重要的步驟。例如，如專利申請(qǐng)公開US2002/0186768中所描述的，商業(yè)檢測(cè)器和程序邊界檢測(cè)器依賴于對(duì)存在的單色幀的識(shí)別，單色幀通常是黑色，并且被插入廣播符(broadcaster)以將兩個(gè)連續(xù)的節(jié)目或來自商業(yè)廣告的節(jié)目分開。單色幀判定還用于從內(nèi)容視覺表中濾出無信息的關(guān)鍵幀。
因?yàn)榧磳淼降腍.246/MPEG-4AVC標(biāo)準(zhǔn)的較大應(yīng)用范圍，存在對(duì)有效解決H.246/AVC視頻內(nèi)容分析的不斷需求。在最近幾年，對(duì)于MPEG-2視頻，已經(jīng)證明了若干有效內(nèi)容分析算法和方法，其在壓縮域幾乎是排他地操作。大多數(shù)這些方法可擴(kuò)展到H.246/AVC，因?yàn)閺纳厦婵梢钥闯?，H.246/AVC以一種方式規(guī)定了MPEG-2語法的超集。但是，由于MPEG-2的限制，這些現(xiàn)有方法中的一些可能不給出適當(dāng)或可靠的性能，這是通過包括附加并且通常是昂貴的方法來解決的缺陷，所述方法在像素或音頻域中操作。
于2004年4月8日提交的歐洲專利申請(qǐng)，官方提交號(hào)為04300189.0(PHFR040040)，接著提出了一種用于避免所述缺陷的方法。更精確地，所述歐洲專利申請(qǐng)涉及檢測(cè)方法(和對(duì)應(yīng)的檢測(cè)設(shè)備)，其應(yīng)用于以視頻流形式可用的數(shù)字編碼視頻數(shù)據(jù)，所述視頻流包括被劃分成宏塊的連續(xù)幀，宏塊本身可子劃分成連續(xù)的塊，所述幀包括至少I幀、P幀和B幀，所述I幀獨(dú)立于其它幀被直接或者借助空間預(yù)測(cè)而被獨(dú)立編碼，所述空間預(yù)測(cè)根據(jù)在同一幀中至少一個(gè)由先前編碼或重構(gòu)的樣本而形成的塊進(jìn)行的，所述P幀被時(shí)間布置在所述I幀之間并且或根據(jù)至少先前的I或P幀被預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者兩個(gè)P幀之間，并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)，所述檢測(cè)方法還包括步驟-根據(jù)預(yù)定的幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的每個(gè)連續(xù)的塊確定它是否被編碼；-為當(dāng)前幀的所有連續(xù)的塊收集類似的信息，以便傳遞與所述預(yù)定的幀內(nèi)預(yù)測(cè)模式有關(guān)的統(tǒng)計(jì)；-分析所述統(tǒng)計(jì)，以確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)步驟，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案。
在所述歐洲專利申請(qǐng)中描述的技術(shù)方案的原理基于幀內(nèi)預(yù)測(cè)模式可方便地用于單色幀檢測(cè)的目的的事實(shí)，其中所述幀內(nèi)預(yù)測(cè)模式是H.264/AVC的新穎編碼工具。主要思想是觀察構(gòu)成圖像的宏塊的幀內(nèi)預(yù)測(cè)模式的分布。當(dāng)大多數(shù)塊展示相同或類似的預(yù)測(cè)模式時(shí)，單色圖像或子圖像被檢測(cè)這些塊的數(shù)量可例如與固定的閾值比較。當(dāng)根據(jù)特定幀內(nèi)預(yù)測(cè)模式來編碼圖像(或子圖像)中的多數(shù)塊時(shí)，圖像(或子圖像)呈現(xiàn)非常低的空間變化，并且其要么是單色的，要么包含重復(fù)的圖案(對(duì)于早先提到的該算法對(duì)生成內(nèi)容表的應(yīng)用于或者對(duì)于關(guān)鍵幀的提取，兩種類型的圖像或子圖像——單色和具有重復(fù)圖案——必須被丟棄)。
根據(jù)MPEG-7標(biāo)準(zhǔn)草案ISO/IEC/ 1/SC 29 N 4242(2001年10月23日)，規(guī)定了用于描述多媒體內(nèi)容、尤其是描述符D和描述方案DS的特征的工具。
那么，根據(jù)本發(fā)明的編碼方法的定義如下。要編碼的數(shù)字視頻數(shù)據(jù)以視頻流形式可用，所述視頻流包括被劃分成宏塊的連續(xù)幀，宏塊本身可被子劃分為相連的塊，并且所述幀以至少I幀、P幀和B幀的形式被編碼，所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼，所述P幀被時(shí)間布置在所述I幀之間并根據(jù)至少先前的I或P幀來預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者在兩個(gè)P幀之間，并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)。該編碼方法還可包括下列步驟-結(jié)構(gòu)化步驟，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-計(jì)算步驟，用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析步驟，用于分析所述統(tǒng)計(jì)，并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)步驟，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；-描述步驟，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；-編碼步驟，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
這些步驟可根據(jù)本發(fā)明借助于編碼設(shè)備來實(shí)現(xiàn)，所述編碼設(shè)備用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù)，所述視頻流包括被劃分成宏塊的連續(xù)幀，宏塊本身可被子劃分為相連的塊，并且所述幀以至少I幀、P幀和B幀的形式被編碼，所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼，所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者在兩個(gè)P幀之間，并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)。所述編碼設(shè)備包括-結(jié)構(gòu)化裝置，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-計(jì)算步驟，用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析步驟，用于分析所述統(tǒng)計(jì)，并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)步驟，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；-描述步驟，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；-編碼步驟，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
根據(jù)本發(fā)明的編碼方法的步驟還可借助計(jì)算機(jī)可執(zhí)行處理步驟來實(shí)現(xiàn)，所述計(jì)算機(jī)可執(zhí)行處理步驟存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上并且類似地包括步驟-根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析所述統(tǒng)計(jì)，以便確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；
-當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；這些步驟之后是描述步驟，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，以及關(guān)聯(lián)的編碼步驟，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
本發(fā)明還涉及可傳輸?shù)木幋a信號(hào)，比如在所述編碼設(shè)備的輸出端可得的以及通過根據(jù)先前描述的編碼方法編碼數(shù)字視頻數(shù)據(jù)而產(chǎn)生的編碼信號(hào)。
在這里必須指出的是，本發(fā)明不限于前面提到的實(shí)施例，可作出變化和修改而不會(huì)偏離本發(fā)明在所附權(quán)利要求中所定義的精神和范圍。
例如可注意到，在說明書或權(quán)利要求中使用的詞語“宏塊”和“塊”不僅旨在如在諸如MPEG-2或MPEG-4的標(biāo)準(zhǔn)中使用的那樣來描述幀的矩形子區(qū)域的層次，而且描述幀的任何類型的任意形狀的子區(qū)域，如在基于不規(guī)則形狀的塊的編碼或解碼方案中遇到的。
還必須注意到，存在許多方式來借助硬件項(xiàng)或軟件項(xiàng)或兩者的方式實(shí)現(xiàn)功能。在這方面，附圖是非常概略的，并且當(dāng)附圖將不同功能顯示為不同模塊時(shí)，這不意味著排除了單個(gè)硬件項(xiàng)或軟件項(xiàng)執(zhí)行若干功能。這也不排除硬件項(xiàng)或軟件項(xiàng)或兩者的組合執(zhí)行一個(gè)功能。
還指出，詞語“包括”不排除權(quán)利要求中所列出之外的其它元件或步驟的存在。元件或步驟前的詞語“一”或“一個(gè)”不排除多個(gè)這種元件或步驟的存在。
權(quán)利要求
1.一種編碼方法，用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù)，所述視頻流包括被劃分成宏塊的連續(xù)幀，宏塊本身可被子劃分為相連的塊，并且所述幀以至少I幀、P幀和B幀的形式被編碼，所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼，所述P幀被時(shí)間布置在所述I幀之間并根據(jù)至少先前的I或P幀來預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者在兩個(gè)P幀之間，并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)，該編碼方法包括下列步驟-結(jié)構(gòu)化步驟，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-計(jì)算步驟，用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析步驟，用于分析所述統(tǒng)計(jì)，并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)步驟，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；-描述步驟，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；-編碼步驟，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
2.一種編碼設(shè)備，用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù)，所述視頻流包括被劃分成宏塊的連續(xù)幀，宏塊本身可被子劃分為相連的塊，并且所述幀以至少I幀、P幀和B幀的形式被編碼，所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼，所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者在兩個(gè)P幀之間，并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)，所述編碼設(shè)備包括-結(jié)構(gòu)化裝置，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-計(jì)算裝置，用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析裝置，用于分析所述統(tǒng)計(jì)，并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)裝置，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；-描述裝置，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；-編碼裝置，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
3.為在一種編碼設(shè)備中使用，所述編碼設(shè)備用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù)，所述視頻流包括被劃分成宏塊的連續(xù)幀，宏塊本身可被子劃分為相連的塊，并且所述幀以至少I幀、P幀和B幀的形式被編碼，所述I幀根據(jù)所述幀內(nèi)編碼模式被獨(dú)立地編碼，所述P幀被時(shí)間布置在所述I幀之間并至少根據(jù)先前的I或P幀來預(yù)測(cè)，所述B幀被時(shí)間布置在I幀和P幀之間，或者在兩個(gè)P幀之間，并且根據(jù)它們所被布置于其間的至少這些兩個(gè)幀來被雙向預(yù)測(cè)，所述編碼設(shè)備包括-結(jié)構(gòu)化裝置，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有連續(xù)宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述連續(xù)宏塊是否已經(jīng)被編碼；-計(jì)算裝置，用于為所述當(dāng)前幀遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；-分析裝置，用于分析所述統(tǒng)計(jì)，并確定所述當(dāng)前幀中展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；-檢測(cè)裝置，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；-描述裝置，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；-編碼裝置，用于編碼如此獲得的描述數(shù)據(jù)以及原始的數(shù)字視頻數(shù)據(jù)。
4.一種用于數(shù)字視頻數(shù)據(jù)編碼設(shè)備的計(jì)算機(jī)程序產(chǎn)品，包括當(dāng)被加載到所述編碼設(shè)備中時(shí)使其執(zhí)行如權(quán)利要求3中所述的步驟的指令集。
5.由根據(jù)權(quán)利要求1所述的編碼方法的編碼數(shù)字視頻數(shù)據(jù)所產(chǎn)生的可傳輸?shù)木幋a信號(hào)。
全文摘要
本發(fā)明涉及一種編碼方法，用于編碼以視頻流形式可用的數(shù)字視頻數(shù)據(jù)，所述視頻流包括被劃分成宏塊的連續(xù)幀，宏塊本身可被子劃分為相連的塊。這些幀以至少獨(dú)立編碼的I幀、根據(jù)至少先前的I或P幀預(yù)測(cè)的P幀、以及根據(jù)它們所被布置于其間的至少兩個(gè)幀被雙向預(yù)測(cè)的B幀的形式被編碼。根據(jù)本發(fā)明，該編碼方法包括下列步驟結(jié)構(gòu)化步驟，用于根據(jù)預(yù)定幀內(nèi)預(yù)測(cè)模式來為當(dāng)前幀的所有宏塊捕獲有關(guān)的編碼參數(shù)，所述編碼參數(shù)表征所述宏塊是否已經(jīng)被編碼；計(jì)算步驟，用于遞送與所述參數(shù)有關(guān)的統(tǒng)計(jì)；分析步驟，用于分析所述統(tǒng)計(jì)，并確定展示或未展示所述幀內(nèi)預(yù)測(cè)模式的塊的數(shù)量；檢測(cè)步驟，用于當(dāng)每次所述數(shù)量大于給定閾值時(shí)檢測(cè)圖像或圖像的子區(qū)域的出現(xiàn)，圖像或圖像的子區(qū)域要么是單色要么具有重復(fù)的圖案；描述步驟，用于生成所述圖像或子圖像的出現(xiàn)的描述數(shù)據(jù)，所述圖像或子圖像要么是單色要么具有重復(fù)的圖案；編碼步驟，用于編碼描述數(shù)據(jù)和原始數(shù)據(jù)。
文檔編號(hào)H04N5/14GK1943247SQ200580010867
公開日2007年4月4日申請(qǐng)日期2005年4月4日優(yōu)先權(quán)日2004年4月8日
發(fā)明者M·巴比里, D·布拉澤羅維克申請(qǐng)人:皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：M.巴比里;D.布拉澤羅維克
技術(shù)所有人：皇家飛利浦電子股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

多媒體數(shù)據(jù)壓縮編碼相關(guān)技術(shù)

多媒體技術(shù)應(yīng)用于教育相關(guān)技術(shù)

多媒體技術(shù)主要應(yīng)用于相關(guān)技術(shù)

大數(shù)據(jù)應(yīng)用于企業(yè)運(yùn)營(yíng)相關(guān)技術(shù)

數(shù)據(jù)庫技術(shù)主要應(yīng)用于相關(guān)技術(shù)

將蜂窩數(shù)據(jù)應(yīng)用于沒了相關(guān)技術(shù)

矢量數(shù)據(jù)編碼方法相關(guān)技術(shù)

矢量數(shù)據(jù)的編碼方法相關(guān)技術(shù)

多媒體信息編碼相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

應(yīng)用于多媒體數(shù)據(jù)的編碼方法