專利名稱:多媒體目標(biāo)的可伸縮編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對多媒體目標(biāo)的編碼。
可伸縮壓縮,例如多媒體目標(biāo)之類的目標(biāo)的小顆粒的可伸縮壓縮具有很有用的特征,即編碼比特流可以在給定點(diǎn)被截短,而其余的數(shù)據(jù)流可以仍然被解碼(盡管以較低的目標(biāo)質(zhì)量)。這樣的可伸縮編碼的標(biāo)準(zhǔn),即MPEG-4小顆??缮炜s性編碼的標(biāo)準(zhǔn)被普遍定義,見ISO/IEC14496-2/AMD 4,2000年三月的文件ISO/IEC JTC1/SC29/WG11 N3315(還被稱為N3315),它在這里被引入作為參考。另一個可伸縮編碼方法在2000年3月23日提交的未預(yù)先公開的歐洲專利申請00201037.9(我們的參考編號PHNL000153)中被描述,它也在這里引入作為參考。
在編碼比特流適合某種給定比特率或存儲尺寸時(shí)通過典型地消除對緩沖控制方法的需要,這樣的可伸縮比特流的有效性相當(dāng)大地簡化了系統(tǒng)設(shè)計(jì)。尤其是,相同的信號比特流同時(shí)用作具有不同性能的不同信道,而不需要再編碼原始數(shù)據(jù)。因此,對改變的信道性能(應(yīng)用到互聯(lián)網(wǎng)或無線通信信道)的實(shí)時(shí)適應(yīng)被很大程度上簡化。
在小顆??缮炜s性出現(xiàn)之前,已經(jīng)有一些形式的有限的可伸縮性存在。比特流由幾個大層組成,即基礎(chǔ)層和例如一個或兩個增強(qiáng)層。這樣的可伸縮性在例如JPEG標(biāo)準(zhǔn)(分級編碼)以及MPEG2標(biāo)準(zhǔn)(SNR可伸縮性,空間可伸縮性,時(shí)間可伸縮性)中被定義。
本發(fā)明的一個目的是提供改進(jìn)的編碼。為此,本發(fā)明提供如獨(dú)立權(quán)利要求所定義的對多媒體目標(biāo)的編碼,控制比特流,傳輸比特流,接收比特流,多路復(fù)用器和網(wǎng)絡(luò)節(jié)點(diǎn),(可伸縮)比特流表示多媒體目標(biāo)、存儲介質(zhì)、計(jì)算機(jī)程序,并且一個信號承載一個計(jì)算機(jī)程序。改進(jìn)的實(shí)施例在從屬權(quán)利要求中被定義。
根據(jù)本發(fā)明的第一個方面,多媒體目標(biāo)被編碼以獲得比特流,并且質(zhì)量信息加入到比特流中,質(zhì)量信息表示與比特流中給定位置(或給定部分)相關(guān)的目標(biāo)質(zhì)量。通過在比特流中加入質(zhì)量信息,一起保存或傳輸多個編碼目標(biāo)能夠被優(yōu)化,因?yàn)槟繕?biāo)的質(zhì)量能夠容易地被考慮。本發(fā)明的這方面基于以下理解,即確定壓縮目標(biāo)的速率是容易的,但是對另一個重要參數(shù),質(zhì)量測量例如失真不容易被確定。實(shí)際上,當(dāng)全部源信息仍然可獲得時(shí),失真只能在編碼時(shí)被正確地獲得。根據(jù)本發(fā)明的這一方面,比特流體系通過加入質(zhì)量(失真)信息被增強(qiáng)。這能夠在比特率沒有增加或增加很小時(shí)完成并且對幾個編碼方案擴(kuò)展了應(yīng)用范圍。多媒體目標(biāo)可以是音頻和/或視頻目標(biāo)或任意其他可再現(xiàn)的目標(biāo),質(zhì)量是與這些目標(biāo)有關(guān)的。多媒體目標(biāo)也可以是圖片或圖片的序列比如節(jié)目。
最好,編碼是可伸縮編碼,這樣比特流就是可伸縮比特流。特別對可伸縮編碼方案,質(zhì)量信息是有優(yōu)勢的,因?yàn)檫@些比特流適于截短。對很多應(yīng)用來說,其中可伸縮比特流被截短,具有截短后產(chǎn)生的比特流的質(zhì)量指示是很重要的,這很容易通過包括在可伸縮比特流總的質(zhì)量信息來提供。
最好,質(zhì)量信息表示目標(biāo)再現(xiàn)質(zhì)量。目標(biāo)再現(xiàn)質(zhì)量與比特?cái)?shù)比較的信息則很容易確定。為了確定質(zhì)量,最好使用信噪比(SNR)或峰值信噪比(PSNR)。
盡管單個目標(biāo)的編碼流可以通過使它適合于可用帶寬/存儲空間來被最佳地截短,但是這不發(fā)生在同時(shí)處理多個物體的情況下。為了同時(shí)最佳地分配一定帶寬或存儲空間給多個目標(biāo),必須知道每個編碼目標(biāo)的不同的速率-失真曲線。盡管該曲線在一個目標(biāo)編碼期間(當(dāng)原始信號可獲得時(shí))相對容易獲得,但是當(dāng)只能用一種編碼比特流的截短樣式時(shí),在以后獲得(通過估計(jì))是重要的。在后面的時(shí)刻質(zhì)量的估計(jì)需要壓縮方法的詳細(xì)知識以及編碼比特流的至少部分解碼。
在特定的實(shí)施例中,當(dāng)比特流在與給定標(biāo)記相關(guān)的點(diǎn)上被截短時(shí),加入到可伸縮比特流中的質(zhì)量標(biāo)記表示編碼目標(biāo)的再現(xiàn)質(zhì)量。盡管質(zhì)量信息的加入可能需要一定的費(fèi)用,但是費(fèi)用可以保持得很小。一個重要的優(yōu)勢在于質(zhì)量信息很容易一起最優(yōu)化地截短多個目標(biāo)的比特流。這樣的多路截短問題發(fā)生在例如在2000年3月13日申請的未預(yù)先公開的歐洲專利申請00200890.2中描述的彈性存儲器中(我們的參考號是PHNL000110),它在這里引用作為參考。另一個申請是多路復(fù)用器或網(wǎng)絡(luò)節(jié)點(diǎn),其中輸出帶寬暫時(shí)低于輸入帶寬,因此輸入可伸縮壓縮的比特流需要被截短。
進(jìn)行壓縮時(shí),輸入數(shù)據(jù)通常被壓縮為多個單元(例如DCT塊部分,小波變換圖象或?qū)拥念l帶部分)。每個編碼部分通常包含一些具有各種參數(shù)或標(biāo)記的首部。在本發(fā)明的改進(jìn)的實(shí)施例中,當(dāng)目標(biāo)恰好在當(dāng)前編碼數(shù)據(jù)部分之后被截短時(shí),表示目標(biāo)質(zhì)量的參數(shù)被加入到這樣的首部中。質(zhì)量參數(shù)的一個例子將加入與再現(xiàn)的均方誤差(或PSNR或SNR)相關(guān)的數(shù);該數(shù)也可能表示視覺上加權(quán)的(P)SNR。質(zhì)量表示的類型(或多個類型)可能被標(biāo)準(zhǔn)化,所以所有的編碼器將使用相同或限制數(shù)量的不同質(zhì)量的指示符。質(zhì)量也可能是相對的(例如是百分?jǐn)?shù)),所以一個編碼器將不必公開它的質(zhì)量測量方式。則相對質(zhì)量對每個單獨(dú)目標(biāo)可能在從0到100%的范圍內(nèi),每個目標(biāo)有附加的范圍、加權(quán)參數(shù)使得各種目標(biāo)有不同的權(quán)值。
質(zhì)量標(biāo)記可能被放置在整個編碼流中近似相等的距離(比特?cái)?shù))上,或者當(dāng)比特率與質(zhì)量曲線快速變化時(shí),它們可以更高頻率地被使用。當(dāng)編碼比特流必須被截短時(shí),不對應(yīng)于一個標(biāo)記位置的每個截短點(diǎn)的質(zhì)量能夠通過質(zhì)量標(biāo)記值的內(nèi)插(線性或更復(fù)雜)來近似。
在本發(fā)明的實(shí)施例中,質(zhì)量信息使用已經(jīng)在標(biāo)準(zhǔn)中定義的標(biāo)記加入到MPEG-4 FGS的編碼比特流中,見上述參照號N3315。以這種方式,不必改變建議的標(biāo)準(zhǔn)質(zhì)量信息就能夠被加入,這則是巨大的進(jìn)步。
對解碼的多媒體目標(biāo)來說,質(zhì)量信息可以被用于自適應(yīng)后處理或可伸縮視頻處理運(yùn)算及其他不可伸縮壓縮方法。例如,對于MPEG壓縮視頻的后處理,質(zhì)量信息能夠有助于確定后處理需要的“強(qiáng)度”或數(shù)量或類型(模塊化人工制品/循環(huán)降低)。對于可伸縮視頻運(yùn)算,質(zhì)量信息能夠幫助更好地估計(jì)用某種選定的視頻處理運(yùn)算為獲得某種理想的處理質(zhì)量水平而需要的CPU循環(huán)的數(shù)量。
質(zhì)量信息可以被加入作為比特流的側(cè)信息,即不包括在比特流本身中的信息。
對于加密的比特流,質(zhì)量細(xì)想你未加密時(shí)有利的。比特流特定部分(例如層)的質(zhì)量則能夠不解密比特流就在解碼器中確定。
質(zhì)量信息也能夠被有利地用于信源編碼和信道編碼不同時(shí)和在同一位置執(zhí)行的情況。質(zhì)量信息則用在信道編碼中,例如來確定保護(hù)比率。
參照下文的實(shí)施例本發(fā)明的前述和其他方面將變得顯然并將被闡明。
圖1示出了根據(jù)本發(fā)明的實(shí)施例的一個系統(tǒng),以及圖2示出了本發(fā)明的更有利的實(shí)施例。
這些圖只示出了理解本發(fā)明所必要的那些部件。
圖1示出了根據(jù)本發(fā)明的實(shí)施例的一個系統(tǒng),該系統(tǒng)包括具有輸入單元或目標(biāo)產(chǎn)生單元110和編碼器的發(fā)射機(jī)11。編碼器12包括可伸縮編碼器120和質(zhì)量信息產(chǎn)生單元121。可伸縮編碼器120對從輸入單元110獲得的編碼目標(biāo)編碼以提供一個和多個可伸縮比特流。質(zhì)量信息產(chǎn)生單元121從輸入單元110獲得的信號以及由編碼器120提供的信號和/或參數(shù)中提取目標(biāo)質(zhì)量。來自產(chǎn)生單元的質(zhì)量信息提供給編碼器單元120,編碼器單元120產(chǎn)生質(zhì)量信息標(biāo)記并把它們插入到比特流中。該系統(tǒng)還包括用于截短一個或多個可伸縮比特流的截短器3和截短器控制單元4。截短器控制單元4從編碼器12提供的可伸縮比特流中提取質(zhì)量信息并根據(jù)接收到的質(zhì)量信息/標(biāo)記來控制截短器。在只有一個可伸縮比特流的情況下,當(dāng)已經(jīng)獲得理想質(zhì)量時(shí)可伸縮比特流被截短。截短器3和控制單元4可以一起組成多路復(fù)用器、比特率控制器、網(wǎng)絡(luò)節(jié)點(diǎn)等部分,并且可以出現(xiàn)在信道中,也可以在接收機(jī)中。單元5可以另外是再現(xiàn)單元和/或解碼器,根據(jù)本發(fā)明的實(shí)施例它與截短器3和控制單元4一起出現(xiàn)在接收機(jī)中。
在更有利的應(yīng)用中,如圖2所示,多路可伸縮比特流由發(fā)射機(jī)21、31、41提供,其中至少有一些可伸縮比特流具有包含在這些比特流中的質(zhì)量標(biāo)記。發(fā)射機(jī)21、31、41和它們的部件與圖1所示的發(fā)射機(jī)1類似。根據(jù)在信道和存儲介質(zhì)15中的可用帶寬和存儲容量并依賴于出現(xiàn)在可伸縮比特流中的質(zhì)量信息/標(biāo)記,可伸縮比特流被更多或更少地截短。這樣的多路截短能夠用在2000年3月13日申請的未預(yù)先公開的歐洲專利申請00200890.2(我們的參照號未PHNL000110)中描述的彈性存儲器的原理來完成,該文獻(xiàn)在這里被引用作為參考。多路復(fù)用器16合并來自發(fā)射機(jī)的數(shù)據(jù)流。截短器13和控制單元14一起組成多路復(fù)用器(例如16)、比特率控制單元、網(wǎng)絡(luò)節(jié)點(diǎn)等部分,并可以出現(xiàn)在信道以及接收機(jī)中。單元15可以另外是再現(xiàn)單元和/或解碼器,根據(jù)本發(fā)明的實(shí)施例它與截短器13和控制單元14一起出現(xiàn)在接收機(jī)中。
在下文中,給出了需要質(zhì)量信息的MPEG-4 FGS的一些應(yīng)用的例子。盡管以下的例子特別用于MPEG-4 FGS,但是本領(lǐng)域技術(shù)人員很清楚本發(fā)明能夠有利地用于任意的可伸縮編碼方案。從應(yīng)用的觀點(diǎn)來看,失真是MPEG-4 FGS方案的重要參數(shù)。如果不能獲得失真信息,則FGS的可用性受到限制,這通過給出需要該信息的各種應(yīng)用在下文中被證明。根據(jù)本發(fā)明的實(shí)施例,F(xiàn)GS比特流體系通過加入質(zhì)量(失真)信息被增強(qiáng)。這能夠在比特率有不可忽略或可忽略的增加時(shí)完成并且擴(kuò)大了FGS應(yīng)用的范圍。
本發(fā)明的第一種應(yīng)用是恒定質(zhì)量(可變比特率)輸出的編碼。這可以用來在適用于可變比特率的存儲介質(zhì)上以恒定的質(zhì)量記錄視頻數(shù)據(jù)。因?yàn)槭褂昧速|(zhì)量信息,最終比特流在初始編碼期間不需要被產(chǎn)生,但是它能夠在以后通過處理編碼數(shù)據(jù)流獲得。
出售不同質(zhì)量的同一內(nèi)容能夠用上述可伸縮(小顆?;蚍謱?壓縮方法隨后通過一層或多層的加密來完成很多可伸縮壓縮方法的特性在于當(dāng)最低可伸縮性稱能夠不存在時(shí),更高的可伸縮性層沒有用,即不能被用于增加質(zhì)量。當(dāng)可伸縮壓縮的內(nèi)容被加密時(shí),仍然有可能把它用于彈性存儲,即通過去掉一些增強(qiáng)層來降低存儲空間量。對于彈性介質(zhì),參照前述PHNL000110。為了確定要去掉多少數(shù)據(jù),應(yīng)當(dāng)可以獲得一些關(guān)于相關(guān)的質(zhì)量損失的信息,因?yàn)樵撔畔⒉荒軌蛟購奈唇饷艿膲嚎s比特流中獲得。在本發(fā)明的當(dāng)前實(shí)施例中,質(zhì)量信息作為未加密的信息例如側(cè)信息被發(fā)送。銷售不同質(zhì)量等級的同一內(nèi)容的商業(yè)模式與彈性存儲緊密相關(guān),因?yàn)橄嗤膬?nèi)容也用可伸縮編碼以多種質(zhì)量等級被存儲。這意味著當(dāng)彈性存儲裝置想降低某一內(nèi)容項(xiàng)目的質(zhì)量時(shí),能夠去掉最高的加密質(zhì)量層,而不需要將它解密。因?yàn)楦难b置不解密任何數(shù)據(jù),所以沒有安全和盜竊的風(fēng)險(xiǎn)。為了在從內(nèi)容擁有者和服務(wù)提供商到用戶的整個過程中保持安全,內(nèi)容最好由內(nèi)容提供商壓縮(使用可伸縮壓縮方法)并以想要的質(zhì)量等級加密,接著以加密的形式分配到彈性存儲裝置(直接發(fā)送或下載或間接經(jīng)中間存儲器到光盤上)。
在彈性存儲應(yīng)用中,用戶(或基于已知用戶的偏愛的裝置)可以任意選擇某一理想的最低質(zhì)量等級。即當(dāng)前可獲得的比用戶最低理想的質(zhì)量等級更高的質(zhì)量的內(nèi)容可以在質(zhì)量上被降低,從而給不同的內(nèi)容留出空間,直到達(dá)到用戶可接受的最低質(zhì)量為止。然而當(dāng)內(nèi)容仍然可以更高的質(zhì)量獲得時(shí),用戶也有購買更高質(zhì)量的選擇權(quán)。當(dāng)然用戶(或裝置)也可以對不同類型的內(nèi)容(比如體育、談話節(jié)目或電影)有不同的想要的最低質(zhì)量等級。
另外,也有可能讓服務(wù)提供商管理存儲空間并確定應(yīng)當(dāng)去掉哪一質(zhì)量等級(在該情況下,服務(wù)提供商保持質(zhì)量跟蹤并可以執(zhí)行彈性存儲功能)。這在內(nèi)容被服務(wù)提供商放到具有存儲功能(例如硬盤)的機(jī)頂盒中時(shí)可能有用。當(dāng)用戶不在某一時(shí)間觀看/購買內(nèi)容時(shí),保存在機(jī)頂盒中的質(zhì)量等級可以被降低以給不同的內(nèi)容留出空間。
質(zhì)量信息也允許信源編碼和信道編碼在不同的時(shí)刻和位置執(zhí)行。因?yàn)樵诰幋a時(shí)信道特性可能還不知道,所以這是有用的。而且,相同的編碼比特流可以為具有不同誤差特性的不同信道服務(wù)。最終,沒有存儲空間被浪費(fèi)來保存誤差校正額外消耗。當(dāng)需要時(shí)誤差校正可以產(chǎn)生,因?yàn)橘|(zhì)量字段給出加入信道編碼所需要的信息(使用不等誤差保護(hù))。
在多路編碼的FGS幀必須一起被處理的時(shí)候有應(yīng)用。這能夠發(fā)生在例如擁擠的網(wǎng)絡(luò)節(jié)點(diǎn)中,在那里存在暫時(shí)較少的帶寬。網(wǎng)絡(luò)節(jié)點(diǎn)則能夠使用質(zhì)量信息來以最低的質(zhì)量損耗來優(yōu)化截短比特流。因?yàn)榘鄠€目標(biāo),每個目標(biāo)都可能有非常不同的速率-失真曲線,所以截短不能在沒有質(zhì)量信息的情況下被滿意地完成。
另外,質(zhì)量信息能夠?yàn)榱鲃討?yīng)用提供具有好的工具的服務(wù)器來完成在發(fā)送時(shí)刻的速率控制,以及SNR和暫態(tài)增強(qiáng)(FGS對FGST,見N3315中的定義)之間的折中。
在MPEG-4 FGS中,需要的質(zhì)量信息實(shí)際上時(shí)對可伸縮增強(qiáng)層的速率-失真曲線。因?yàn)樗俾适秋@而易見的,所以只有失真信息必須加入。已經(jīng)提出了兩種不修改或最小修改當(dāng)前FGS比特流體系的情況下加入該信息的解決方案。
解決方案A。位平面的開始是加入質(zhì)量信息/字段的適宜點(diǎn),因?yàn)樵谠擖c(diǎn)上能夠容易地恢復(fù)信息并提供足夠的樣本來精確地描繪速率-失真曲線。“質(zhì)量代碼”將與當(dāng)前fgs_bp_start_code一樣,它的最后5比特表示位平面的ID。代替位平面ID,質(zhì)量信息能夠插入到這5比特中。在最佳實(shí)施例中,一比特被加入到序列中表示fgs_bp_start_code包含位平面ID還是質(zhì)量信息。
解決方案B。或者,新的代碼能夠被確定用于質(zhì)量信息并插入到fgs_bp_start_code后面。在這種情況下,質(zhì)量標(biāo)記能夠有8比特。
我們提出保存在質(zhì)量字段中的信息在隨著質(zhì)量字段完全解碼位平面后是失真。以這種方式,當(dāng)數(shù)據(jù)流在位平面中被截短時(shí),近似質(zhì)量可以通過內(nèi)插法獲得。這比外推法簡單,外推法將在質(zhì)量字段將在解碼當(dāng)前位平面之前含有關(guān)于失真的信息時(shí)被要求。例如,讓Q1是解碼位平面前的質(zhì)量,Q2是解碼位平面后的質(zhì)量(因?yàn)樯鲜黾僭O(shè),Q2已經(jīng)在位平面開始時(shí)被解碼器知道)。如果數(shù)據(jù)流在位平面中被截短,則知道真實(shí)質(zhì)量Q位于<Q1,Q2>中間。因此能夠簡單地近似為Q≌(Q1+Q2)/2。通過考慮解碼的DCT塊的數(shù)量能夠作出更精確的近似。例如,如果對當(dāng)前位平面的增強(qiáng)信息已經(jīng)被恢復(fù)為對一幀總共N塊的n輸出,則真實(shí)質(zhì)量能夠被近似為Q≌Q1+(Q2-Q1)×n/N。
在解決方案A的最佳實(shí)施例中,用于增強(qiáng)VOP第一質(zhì)量字段,即對于最重要(MSB)位平面的字段包含絕對質(zhì)量(失真),而附加字段包含相對于前一質(zhì)量的質(zhì)量改善(失真降低)。絕對質(zhì)量能夠被用于比較不同的目標(biāo)。當(dāng)絕對質(zhì)量將被使用時(shí),把質(zhì)量改善加入到附加字段中允許這些改善用更高的精確度表示。當(dāng)每個字段只有5比特時(shí)這尤其重要。
為了量化質(zhì)量,最好使用PSNR值。如上所述,第一質(zhì)量字段包含絕對質(zhì)量。我們提出在解碼第一(MSB)位平面后用5比特給PSNR,以1dB步長的18...49dB的范圍。該范圍覆蓋所有實(shí)際上相關(guān)的PSNR值當(dāng)PSNR大約49dB時(shí),基本層已經(jīng)包含目標(biāo)的接近無損失的表示。低于18dB的PSNR將表示基本層提供了非常低的質(zhì)量,這是很不希望獲得的。當(dāng)范圍之外的值發(fā)生時(shí),它們將根據(jù)它們是低于還是高于允許的范圍而被分為18或49dB。
下一個質(zhì)量字段則將包含相對于解碼在前的位平面后的質(zhì)量對完全解碼隨后的位平面的質(zhì)量改善。最好,這5比特被用于給出這些質(zhì)量改善以0...6.2dB的范圍,0.2dB的步長。因?yàn)閱蝹€比特被加入,改善不能超過6.02dB,所以這一范圍足夠了。
對解決方案B,當(dāng)8比特被用于質(zhì)量標(biāo)記時(shí),質(zhì)量值(絕對值和微分值)能夠用更細(xì)的微粒表示。但是,解決方案B也將允許我們簡單地只使用絕對(即未微分)質(zhì)量值。質(zhì)量范圍將是18...60.5dB,步長為1/6≈0.167dB(或者18...49.875dB,步長為0.125dB)。
MPEG-4的各種應(yīng)用以將在以上公開,該應(yīng)用需要質(zhì)量信息。因?yàn)橹挥性谠季幋a發(fā)生時(shí),該信息完全可獲得,所以它加入到比特流中使得它在以后的使用中可獲得。這能夠以沒有或很小比特率增加的情況下完成,該比特率具有當(dāng)前比特流體系的最小修改。兩個詳細(xì)的解決方案已經(jīng)被表示為加入PSNR質(zhì)量值。使用絕對質(zhì)量值的解決方案B更好。
本發(fā)明應(yīng)用于多路可伸縮壓縮多媒體目標(biāo)必須一起被保存或發(fā)送并且這些目標(biāo)中有一些已經(jīng)用與本發(fā)明結(jié)合的MPEG-4 FGS壓縮。典型的應(yīng)用是彈性存儲器應(yīng)用以及處理多目標(biāo)/用戶的發(fā)送信道或網(wǎng)絡(luò)。當(dāng)存儲器/信道/網(wǎng)絡(luò)必須由幾個目標(biāo)/用戶來分享時(shí),他們能獲得高質(zhì)量。改質(zhì)量自動降低以適應(yīng)目標(biāo)/用戶。由于根據(jù)本發(fā)明的實(shí)施例質(zhì)量標(biāo)記的存在,這能夠被有效地完成,即以低的額外消耗完成。
本發(fā)明也能夠有利地應(yīng)用于信源編碼和信道編碼在同時(shí)或在同一位置執(zhí)行的情況下。質(zhì)量標(biāo)記則給出加入信道編碼所需要的信息(不等誤差保護(hù),例如對表示更高質(zhì)量的比特流部分以更多的保護(hù),或給位比率的數(shù)量有高質(zhì)量的比特流部分以更多的保護(hù))。
本發(fā)明也可以被有利地用于諸如JPEG2000的可伸縮圖象處理方案的情況下,見2000年3月16日的文件ISO/IEC JTC1/SC 29/WG 1N1646,它在這里引入作為參考。質(zhì)量信息可以方便地包含在JPEG2000中,因?yàn)樽⑨尯蛿U(kuò)展標(biāo)記(CME)已經(jīng)被定義(見文件N1646的52頁),這允許在首部中有開放的數(shù)據(jù)。質(zhì)量信息被有利地包括在特定的CME中。例如二進(jìn)制數(shù)據(jù)能夠被包含(Rcme=0)。而且,根據(jù)本發(fā)明的一個實(shí)施例,分離的Rcme類型被定義為質(zhì)量標(biāo)記。
應(yīng)當(dāng)注意到,上述實(shí)施例描述了而非限制了本發(fā)明,本領(lǐng)域技術(shù)人員將能夠在不脫離隨附的權(quán)利要求的范圍的條件下設(shè)計(jì)很多其他的實(shí)施例。在權(quán)利要求中,任何放置在括號內(nèi)的附圖標(biāo)記都將不解釋為對權(quán)利要求的限制。詞語“包括”不排除超出權(quán)利要求中列出的那些元件和步驟的存在。本發(fā)明能夠通過包括幾個不同部件的硬件,或通過適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了幾個裝置的設(shè)備權(quán)利要求中,這些裝置中的幾個能夠用一個或相同功能的硬件來實(shí)現(xiàn)。某些措施在在彼此不同的獨(dú)立權(quán)利要求中列出這一事實(shí)比表示這些措施的組合不能被用來取得優(yōu)勢。
權(quán)利要求
1.一種編碼多媒體目標(biāo)的方法,該方法包括步驟編碼目標(biāo)以獲得比特流,以及向比特流中加入質(zhì)量信息,該質(zhì)量信息表示與比特流中特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量。
2.權(quán)利要求1所請求保護(hù)的方法,其中編碼步驟是用于獲得可伸縮比特流的可伸縮編碼步驟。
3.權(quán)利要求1或2所請求保護(hù)的方法,其中質(zhì)量信息與目標(biāo)再現(xiàn)質(zhì)量相關(guān)。
4.權(quán)利要求3所請求保護(hù)的方法,其中質(zhì)量信息基于信噪比的值。
5.上述權(quán)利要求中任一個所請求保護(hù)的方法,其中質(zhì)量標(biāo)記被加在比特流中的特定位置,當(dāng)比特流恰好在比特流中的特定位置之后(或恰好在它之前)被截短時(shí)它表示目標(biāo)質(zhì)量。
6.權(quán)利要求1所請求保護(hù)的方法,其中質(zhì)量信息被插入到特定可伸縮編碼標(biāo)準(zhǔn)的擴(kuò)展字段。
7.權(quán)利要求2所請求保護(hù)的方法,其中可伸縮比特流包括多個層并且其中各個層包括各個質(zhì)量信息。
8.權(quán)利要求1所請求保護(hù)的方法,其中比特流被加密并且質(zhì)量信息不被加密。
9.控制表示已經(jīng)加入比特流質(zhì)量信息的多媒體目標(biāo)的至少一個比特流的方法,質(zhì)量信息表示與比特流的特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量,該方法包括以下步驟接收至少一個比特流,從比特流中提取質(zhì)量信息,在至少一個比特流的比特率和質(zhì)量的理想組合與至少一個接收到的比特流的比特率和質(zhì)量的當(dāng)前組合不同的情況下,譯碼和截短至少一個比特流,以理想的比特率和質(zhì)量的組合提供至少一個比特流。
10.發(fā)送至少一個多媒體目標(biāo)的方法,該方法包括步驟編碼目標(biāo)以獲得比特流,以及向比特流中加入質(zhì)量信息,該質(zhì)量信息表示與比特流中特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量,發(fā)送質(zhì)量信息已經(jīng)加入到其中的比特流。
11.接收表示質(zhì)量信息已經(jīng)加入其中的多媒體目標(biāo)的至少一個比特流的方法,質(zhì)量信息表示與比特流的特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量,該方法包括以下步驟從比特流中提取質(zhì)量信息,在至少一個比特流的比特率和質(zhì)量的理想組合與至少一個接收到的比特流的比特率和質(zhì)量的當(dāng)前組合不同的情況下,譯碼和截短至少一個比特流,以理想的比特率和質(zhì)量的組合提供至少一個比特流,以理想的比特率和質(zhì)量的組合解碼至少一個比特流。
12.接收表示質(zhì)量信息已經(jīng)加入其中的多媒體目標(biāo)的至少一個比特流的方法,質(zhì)量信息表示與比特流的特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量,該方法包括以下步驟從比特流中提取質(zhì)量信息;解碼比特流以獲得解碼的多媒體目標(biāo);以及根據(jù)提取的質(zhì)量處理多媒體目標(biāo)。
13.編碼多媒體目標(biāo)的裝置,該裝置包括用于編碼目標(biāo)以獲得比特流的裝置,以及用于向比特流中加入質(zhì)量信息的裝置,該質(zhì)量信息表示與比特流中特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量。
14.包括權(quán)利要求13所請求保護(hù)的裝置的發(fā)射機(jī)。
15.用于控制表示已經(jīng)加入比特流質(zhì)量信息的多媒體目標(biāo)的至少一個比特流的控制器,質(zhì)量信息表示與比特流的特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量,該控制器包括用于接收至少一個比特流的裝置,用于從比特流中提取質(zhì)量信息的裝置,在至少一個比特流的比特率和質(zhì)量的理想組合與至少一個接收到的比特流的比特率和質(zhì)量的當(dāng)前組合不同的情況下,用于截短至少一個比特流的裝置,用于以理想的比特率和質(zhì)量的組合提供至少一個比特流的裝置。
16.包括權(quán)利要求15所請求保護(hù)的控制器的接收機(jī)。
17.用于接收表示質(zhì)量信息已經(jīng)加入其中的多媒體目標(biāo)的至少一個比特流的接收機(jī),質(zhì)量信息表示與比特流的特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量,該接收機(jī)包括用于從比特流中提取質(zhì)量信息的裝置;用于解碼比特流以獲得解碼的多媒體目標(biāo)的裝置;以及用于根據(jù)提取的質(zhì)量處理多媒體目標(biāo)的裝置。
18.包括權(quán)利要求15所請求保護(hù)的控制器的多路復(fù)用器或網(wǎng)絡(luò)。
19.表示比特流質(zhì)量信息已經(jīng)加入到其中的多媒體目標(biāo)的比特流,質(zhì)量信息表示與比特流的特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量。
20.如權(quán)利要求19請求保護(hù)的信號已經(jīng)被保存的存儲介質(zhì)。
全文摘要
多媒體目標(biāo)被編碼以獲得比特流時(shí)提供的編碼,并且質(zhì)量信息加入到比特流中,質(zhì)量信息表示與比特流的特定位置(或特定部分)相關(guān)的目標(biāo)的質(zhì)量。通過向比特流中加入質(zhì)量信息,由于目標(biāo)的質(zhì)量能夠容易地被考慮,所以共同保存或發(fā)送多個編碼目標(biāo)能夠被優(yōu)化。
文檔編號H04N7/08GK1398489SQ01804772
公開日2003年2月19日 申請日期2001年10月4日 優(yōu)先權(quán)日2000年10月11日
發(fā)明者R·J·范德弗洛伊滕, M·范德沙爾 申請人:皇家菲利浦電子有限公司