專(zhuān)利名稱(chēng):多層視頻的特征點(diǎn)信息(cpi)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總的來(lái)說(shuō)涉及視頻編碼,并尤其涉及多層視頻編碼。
多層編碼視頻為便攜式存儲(chǔ)器提供了很多好處。在具有小屏幕和低功率的設(shè)備中,只檢索和顯示基層。對(duì)于具有較大屏幕和較高功率的設(shè)備,基層和一個(gè)或多個(gè)增強(qiáng)層都能夠被檢索和顯示。盡管多層方案對(duì)于諸如小尺寸(small-form-factor)光盤(pán)(“SFFO”)之類(lèi)的便攜式設(shè)備最有效,但是它也能夠用在固定設(shè)備中以實(shí)現(xiàn)靈活的存儲(chǔ)方案。
以下的描述特別考慮了按照MPEG標(biāo)準(zhǔn)(對(duì)于MPEG-1的ISO/IEC11172和對(duì)于MPEG-2的ISO/IEC13818)工作的音頻/視頻(“A/V”)設(shè)備,盡管本領(lǐng)域技術(shù)人員知道也能夠應(yīng)用不符合MPEG標(biāo)準(zhǔn)的其他A/V編碼方案。
剪輯指可以進(jìn)行復(fù)用的音頻/視頻(A/V)文件或流等的全部或一部分。(剪輯文件更一般地可以稱(chēng)為內(nèi)容文件。)作為一部分的復(fù)用流符合其定義的所有方面的規(guī)范,例如,在MPEG-2復(fù)用流的情況下,它遵守MPEG-2節(jié)目流或傳輸流規(guī)范。復(fù)用中一些基本流的解碼可能需要在剪輯中后面的地址開(kāi)始,因?yàn)椴糠执嫒卧赡艹霈F(xiàn)在剪輯的開(kāi)頭和結(jié)尾。顯示可能需要在甚至更后面的顯示單元開(kāi)始。
每個(gè)剪輯存儲(chǔ)在其自己的實(shí)時(shí)文件中。盤(pán)上的實(shí)時(shí)文件的物理分配確保用于讀和寫(xiě)的數(shù)據(jù)的連續(xù)供給。剪輯中的數(shù)據(jù)的各部分可以通過(guò)使用在文件系統(tǒng)中定義的數(shù)據(jù)共享機(jī)構(gòu)而在兩個(gè)或多個(gè)剪輯之間被共享。通常,初始記錄被制成單個(gè)剪輯,同時(shí)剪輯的數(shù)量隨著進(jìn)行編輯操作而增長(zhǎng)。
特征點(diǎn)信息(CPI)通常指用于表示剪輯或信息文件中的特征點(diǎn)的信息。特征點(diǎn)對(duì)應(yīng)于剪輯文件中特定數(shù)據(jù)元的位置,例如,認(rèn)為是由于特定原因而感興趣的點(diǎn)。例如,對(duì)于包含視頻流數(shù)據(jù)的剪輯,特征點(diǎn)用于表示某些視頻存取單元的開(kāi)頭或結(jié)尾。CPI通常用于在不需要讀出和分析剪輯本身的情況下,確定剪輯中相關(guān)數(shù)據(jù)元的位置。因此,CPI對(duì)于幾種不同的系統(tǒng)操作是很重要的。
這樣的操作的一些例子包括特技播放(trickplay)操作、交互重放和快速編輯類(lèi)操作。在特技播放操作期間不完全讀出并解碼數(shù)據(jù)流,所述操作比如是包含視頻流數(shù)據(jù)的剪輯快進(jìn)和快退播放。相反,只讀出和解碼所選擇的數(shù)據(jù)流部分。這些部分的選擇基于CPI。為此,CPI包括例如表示圖像數(shù)據(jù)的位置的特征點(diǎn)信息。
在交互重放的情況下,用戶(hù)可能需要重放以在剪輯中的某個(gè)特定時(shí)間位置開(kāi)始,而不是在剪輯的開(kāi)頭開(kāi)始。在這種情況下,CPI用來(lái)找到用于讀出和解碼匹配這個(gè)時(shí)間位置的剪輯中的位置的數(shù)據(jù)位置。為此,CPI可以包括例如針對(duì)相關(guān)音頻和視頻存取單元的時(shí)間標(biāo)記值。
包含剪輯截?cái)嗟目焖倬庉嬵?lèi)操作的重要特性是它們?cè)诓粚?shí)際接觸到剪輯本身中的任何數(shù)據(jù)的情況下產(chǎn)生剪輯的截?cái)嗪蟮陌姹尽R话銇?lái)說(shuō),這些種類(lèi)的操作利用剪輯參考來(lái)產(chǎn)生參照這樣的剪輯的截?cái)喟姹镜男录糨嫛?赡艿睦邮前鸭糨嫹譃楦〉募糨?,借助于非無(wú)縫編輯連接等產(chǎn)生新的剪輯。在所有這些情況下,CPI可以用于確定剪輯的截?cái)喟姹緫?yīng)當(dāng)在哪里開(kāi)始和/或結(jié)束。對(duì)于數(shù)據(jù)流的特征點(diǎn)的規(guī)范通常取決于數(shù)據(jù)流的類(lèi)型和內(nèi)容。
在諸如HDD之類(lèi)的視頻記錄系統(tǒng)和非多層上下文關(guān)系中,CPI從介質(zhì)中被提取并存儲(chǔ)(例如在RAM中)以提供內(nèi)容的顯示時(shí)間和內(nèi)容在盤(pán)上的位置之間的映射。CPI存儲(chǔ)在文件中,與實(shí)際的音頻/視頻(“A/V”)內(nèi)容分離。一般來(lái)說(shuō),CPI用于指向MPEG-2中的I幀,但通常CPI用于指向內(nèi)容中的感興趣點(diǎn),例如,進(jìn)入點(diǎn)或其他關(guān)鍵點(diǎn)。在沒(méi)有多層視頻的現(xiàn)有系統(tǒng)中,CPI文件中的入口典型地定義點(diǎn)的類(lèi)型,比如進(jìn)入點(diǎn)(“I幀”)、顯示時(shí)間(“PTS”)和A/V文件內(nèi)的偏移或A/V文件中點(diǎn)的絕對(duì)地址。
傳統(tǒng)的多層編碼視頻包括一個(gè)基層和一個(gè)或多個(gè)增強(qiáng)層。一般來(lái)說(shuō),基層獨(dú)立編碼,并且增強(qiáng)層中編碼的數(shù)據(jù)補(bǔ)充基層數(shù)據(jù)。因此,基層可以單獨(dú)被解碼和利用。但是,為了使用增強(qiáng)層,基層和增強(qiáng)層必須一起被解碼和利用。通常,較小或較舊的設(shè)備播放剪輯時(shí)可能只使用基層,而較大和/或較新的設(shè)備(具有改進(jìn)的處理和/或分辨率)播放剪輯時(shí)將使用基層和一個(gè)或多個(gè)增強(qiáng)層,同時(shí)圖像質(zhì)量得到相應(yīng)的改善。所利用的增強(qiáng)層的數(shù)量取決于重放時(shí)使用的設(shè)備。
有這樣一種需要,就是具有用于多層方案的低質(zhì)量和高質(zhì)量編碼的CPI。因此,需要擴(kuò)展的CPI方案以考慮多層視頻。
因此,提供一種用于產(chǎn)生多層編碼的音頻/視頻數(shù)據(jù)的特征點(diǎn)信息(CPI)的方法。在一個(gè)方面中,該方法包括產(chǎn)生CPI文件。該CPI文件包括對(duì)應(yīng)于剪輯中至少一個(gè)點(diǎn)的至少一個(gè)點(diǎn)類(lèi)型,對(duì)應(yīng)于剪輯中該點(diǎn)的顯示時(shí)間和對(duì)應(yīng)于剪輯的基層和一個(gè)或多個(gè)增強(qiáng)層中該點(diǎn)的一個(gè)或多個(gè)偏移點(diǎn)。由剪輯的基層和增強(qiáng)層中的偏移識(shí)別的點(diǎn)全部對(duì)應(yīng)于剪輯中的相同點(diǎn)(最容易概念化為相同的顯示時(shí)間)。可替換地,也可以包括對(duì)應(yīng)于剪輯的基層和一個(gè)或多個(gè)增強(qiáng)層中的點(diǎn)的實(shí)際顯示時(shí)間(或絕對(duì)存儲(chǔ)位置)。
在另一方面中的本方法包括產(chǎn)生針對(duì)基層和每個(gè)增強(qiáng)層的單獨(dú)的CPI文件。針對(duì)基層的CPI文件包括關(guān)于基層中的點(diǎn)的信息,同樣,針對(duì)增強(qiáng)層的CPI文件包括關(guān)于對(duì)應(yīng)的增強(qiáng)層中的點(diǎn)的信息。針對(duì)增強(qiáng)層的CPI文件可能只包括偏移信息,并可能使用基層CPI文件中的對(duì)應(yīng)點(diǎn)的點(diǎn)類(lèi)型和顯示時(shí)間。
仍然在另一個(gè)方面中,該方法包括產(chǎn)生CPI文件以包括關(guān)于基層的信息,并產(chǎn)生單獨(dú)的附CPI文件以包括關(guān)于每個(gè)增強(qiáng)層的信息。對(duì)應(yīng)于特定增強(qiáng)層的CPI文件可以例如包括對(duì)于增強(qiáng)層和所有較低層以及基層的指針。
本領(lǐng)域技術(shù)人員從以下的與附圖結(jié)合在一起的詳細(xì)描述中將明白本發(fā)明的這些和其他特征,其中相同的附圖標(biāo)記指的是相同的部分。
圖1是說(shuō)明一個(gè)實(shí)施例中的CPI方案的示意圖。
圖2說(shuō)明在對(duì)應(yīng)于每層的一個(gè)實(shí)施例中的CPI文件。
圖3說(shuō)明在一個(gè)實(shí)施例中具有針對(duì)所有增強(qiáng)層的單獨(dú)CPI文件的CPI結(jié)構(gòu)。
圖1是說(shuō)明在一個(gè)實(shí)施例中的CPI方案的示意圖。簡(jiǎn)要地說(shuō),對(duì)于每個(gè)剪輯或A/V文件,存在包含對(duì)于剪輯文件中的特征點(diǎn)的信息的伴隨CPI文件。剪輯文件中的特征點(diǎn)(或“點(diǎn)”)具有在包括至少一個(gè)點(diǎn)類(lèi)型(或者如果只有一個(gè)點(diǎn)類(lèi)型可能,則它是隱含的)、PTS和文件內(nèi)的偏移的CPI表結(jié)構(gòu)中的入口。
因此,對(duì)于每個(gè)特征點(diǎn),使用幾個(gè)參數(shù)。因此,CPI文件102中的每個(gè)入口104可以包括點(diǎn)類(lèi)型、PTS和一個(gè)或多個(gè)偏移。點(diǎn)類(lèi)型可以表示例如點(diǎn)對(duì)應(yīng)于I幀的起始位置。點(diǎn)類(lèi)型中的點(diǎn)也可以是成對(duì)的,例如I幀的開(kāi)始和結(jié)束點(diǎn)。單個(gè)點(diǎn)可以包含起始和結(jié)束指針,或者同樣可以看作兩個(gè)點(diǎn)。如果所有的特征點(diǎn)包括起始和結(jié)束點(diǎn),則對(duì)于每個(gè)點(diǎn)合并起始和結(jié)束指針為單個(gè)點(diǎn)是有效的。如果不是所有點(diǎn)都包括起始和結(jié)束指針,則可以接受由某些點(diǎn)使用起始和結(jié)束指針。
PTS是用于CPI中的入口的數(shù)據(jù)參數(shù)。這種情況下PTS表示MPEG中熟知的顯示時(shí)間。例如,PTS可以是代表I幀的顯示時(shí)間的32比特時(shí)間標(biāo)記值。該參數(shù)通常代表與該點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)區(qū)。數(shù)據(jù)區(qū)的準(zhǔn)確的語(yǔ)法和語(yǔ)義取決于點(diǎn)的類(lèi)型并為每種類(lèi)型單獨(dú)指定。因此,點(diǎn)類(lèi)型和點(diǎn)數(shù)據(jù)參數(shù)彼此對(duì)應(yīng)。
此外,在CPI文件的入口中包括的偏移對(duì)應(yīng)于相應(yīng)視頻層中的位置。特別是,偏移B識(shí)別對(duì)應(yīng)于基層106中的入口104的點(diǎn)的位置,偏移1識(shí)別增強(qiáng)層1108a中的入口104的點(diǎn)的位置等。在每層的入口中包括的偏移值給出對(duì)應(yīng)于入口點(diǎn)的層的文件內(nèi)的偏移。如本領(lǐng)域已知的,偏移確定從已知起始點(diǎn)開(kāi)始在文件內(nèi)向前移動(dòng)多遠(yuǎn)。在這種情況下,從已知起始點(diǎn)開(kāi)始并在層文件中向前移動(dòng)該偏移造成移動(dòng)到在入口中所考慮的點(diǎn)。偏移一般用在一個(gè)應(yīng)用中,并隨后當(dāng)存取存儲(chǔ)介質(zhì)(比如盤(pán))中的數(shù)據(jù)時(shí)被轉(zhuǎn)換為絕對(duì)地址。
這樣,在每個(gè)入口中包括的偏移提供對(duì)應(yīng)于入口特征點(diǎn)的基層和增強(qiáng)層的文件中的相應(yīng)位置??商鎿Q地,每個(gè)層的對(duì)應(yīng)位置的絕對(duì)地址可以用于入口而不是偏移。這允許點(diǎn)的基層和任意增強(qiáng)層使用CPI文件中的點(diǎn)的入口來(lái)被存取。
為了釋放盤(pán)上的空間,用戶(hù)可以刪除最高級(jí)別的增強(qiáng)層,例如圖1中的108n。在這種情況下,CPI文件內(nèi)的一些偏移可能不再有效,因?yàn)樗鼈兛赡苤傅氖潜粍h除的文件。因此,CPI文件可能也包括有效的層的指示(對(duì)于圖1的入口中的有效層由存在的檢驗(yàn)標(biāo)記來(lái)表示)。因?yàn)镃PI文件中的層數(shù)取決于記錄時(shí)存在的層數(shù),而這可能在每次記錄時(shí)改變,所以CPI文件結(jié)構(gòu)也可能包括所涉及的層數(shù)的指示。
圖1的CPI文件102的入口104可以進(jìn)一步以水平方式有效地配置。例如,每個(gè)入口的PTS可以包括絕對(duì)時(shí)間值。可替換地,對(duì)于每第n個(gè)入口的PTS可以是絕對(duì)值,并且針對(duì)CPI文件中的隨后的入口的PTS可以相對(duì)于最后的絕對(duì)值(稱(chēng)為“水平偏移”)。例如,PTS可以是每第10個(gè)入口的絕對(duì)值。對(duì)于跟隨著最后的絕對(duì)PTS入口的CPI文件中的9個(gè)入口,PTS可以作為相對(duì)最后的絕對(duì)PTS的水平偏移給出。
CPI文件的入口中的其他參數(shù)可以類(lèi)似的方式配置。例如,偏移B可以是每第10個(gè)入口的CPI文件中的絕對(duì)偏移值。對(duì)于跟隨著偏移B的最后絕對(duì)偏移值的CPI文件中的9個(gè)入口,偏移B可能作為相對(duì)于絕對(duì)偏移B的水平偏移給出。例如,CPI文件102中的入口n可能包括偏移B的絕對(duì)值1000,并且入口n+10包括偏移B的下一個(gè)絕對(duì)值1100。中間的入口n+1、n+2、…、n+9具有偏移B的水平偏移值10、20、…、90,而不是偏移B的絕對(duì)值1110、1120、…、1190。因此,當(dāng)應(yīng)用程序讀出入口n+2的偏移B的參數(shù)時(shí),例如,它根據(jù)入口n中偏移B的絕對(duì)偏移值從入口檢索水平偏移20并確定偏移B為1120。接著,1120的偏移B用作存取對(duì)于入口n+2的基層106中對(duì)應(yīng)位置的偏移。
這樣的在CPI文件中的入口之間的水平結(jié)構(gòu)可以同樣用于其他參數(shù)并進(jìn)一步降低所需的存儲(chǔ),而不會(huì)大幅度降低性能。但是,應(yīng)當(dāng)注意到,因?yàn)榛鶎雍驮鰪?qiáng)層文件具有不同的長(zhǎng)度,用于一個(gè)參數(shù)的CPI入口之間的水平偏移不能用于另一個(gè)參數(shù)。例如,入口n+2的偏移B的水平偏移(在以上例子中為20)通常不能用作入口n+2的偏移1的水平偏移,因?yàn)榛鶎雍偷谝辉鰪?qiáng)層文件將具有不同的長(zhǎng)度。
返回到如圖1所示的“偏移”的焦點(diǎn),也就是如指向?qū)?yīng)于入口點(diǎn)的基層和增強(qiáng)層中的位置,圖1的CPI文件結(jié)構(gòu)是一般的并可以應(yīng)用于其他現(xiàn)有的CPI方案,例如,使用命名方案的那些。例如,在某些系統(tǒng)中,CPI和A/V內(nèi)容之間的關(guān)聯(lián)基于文件名,或尤其是文件名擴(kuò)展。例如,file.clpi可以表示文件剪輯信息,而file.m2ts可以表示文件MPEG-2傳輸流。對(duì)于多層視頻,該方案可以被增強(qiáng)為例如包括用于文件剪輯信息的file.clpi、用于文件基層A/V數(shù)據(jù)的file.av、用于文件增強(qiáng)1A/V數(shù)據(jù)的file1.av和用于文件增強(qiáng)2A/V數(shù)據(jù)的file2.av等。在這樣的多層應(yīng)用中,file.clpi將進(jìn)行修改以包括對(duì)每個(gè)入口的層偏移,如圖1所示。因此,file.clpi中每個(gè)特征點(diǎn)入口將包括對(duì)應(yīng)于file.av的基層偏移(偏移B)、對(duì)應(yīng)于file1.av的第一增強(qiáng)層偏移(偏移1)等。
此外,上述描述假定每個(gè)增強(qiáng)層在相同的時(shí)間位置處具有特征點(diǎn),其可以全部存儲(chǔ)在CPI入口中。一些偏移參數(shù)可以對(duì)于更高級(jí)的層的入口省略,從而減小CPI文件的大小。例如,對(duì)于第一增強(qiáng)層的偏移可以只包括在每第二個(gè)入口或第三個(gè)入口中。但是,這將限制能夠用于某些功能如高質(zhì)量特技播放中的特征點(diǎn)。
在另一方面,CPI可以為每一層單獨(dú)存在盤(pán)上,所以對(duì)于分層編碼的每個(gè)文件將有對(duì)應(yīng)的CPI文件。圖2說(shuō)明對(duì)應(yīng)于每一層的一個(gè)實(shí)施例中的CPI文件。基文件206具有對(duì)應(yīng)的CPI文件(CPI FileB 202),它與增強(qiáng)層208a、208b分離。第一增強(qiáng)層Enh1文件208a具有它自己的CPI文件(CPI File1 204),如第N個(gè)增強(qiáng)層Enh N 208b文件其對(duì)應(yīng)的CPI文件表示為CPI FileN 210一樣。
對(duì)于分層編碼的每個(gè)文件使用單獨(dú)的CPI文件有許多優(yōu)點(diǎn)。不需要記錄其他層的CPI文件中的刪除,增強(qiáng)文件就能夠被刪除。此外,不需讀出沒(méi)有利用的增強(qiáng)層的CPI文件。具有對(duì)應(yīng)于每一層的單獨(dú)的CPI文件消除了可能的問(wèn)題和/或在刪除一個(gè)或多個(gè)增強(qiáng)時(shí)CPI文件的調(diào)整。例如,當(dāng)刪除一個(gè)或多個(gè)增強(qiáng)時(shí),如圖1所示的合成CPI文件接著將包括一個(gè)或多個(gè)用于現(xiàn)在已經(jīng)刪除的增強(qiáng)層的入口中的無(wú)效參數(shù)。(如上所述,無(wú)效層的指示將接著包括在CPI中。)而且,如果所有的CPI都包含在一個(gè)CPI文件中,則即使在只播放基層時(shí)也可能必需讀出整個(gè)CPI文件。
在一個(gè)方面,可以使用以上例子中描述的類(lèi)似的文件命名慣例。例如,file.clpi可以用作基文件的CPI文件(圖2的202),用于文件增強(qiáng)1剪輯信息的file1.clpi(圖2的204),用于文件增強(qiáng)N剪輯信息的fileN.clpi(圖2的210),用于基層A/V數(shù)據(jù)的file.av(圖2的206),用于文件增強(qiáng)1A/V數(shù)據(jù)的file1.av(圖2的208a)以及用于文件增強(qiáng)N A/V數(shù)據(jù)的fileN.av(圖2的208b)。
在圖2的實(shí)施例的一種情況下,點(diǎn)類(lèi)型和PTS為每個(gè)CPI文件202、204、210復(fù)制。(每個(gè)CPI文件也包括相應(yīng)層的偏移值。)在另一方面,可以避免復(fù)制每個(gè)CPI文件中的點(diǎn)類(lèi)型和PTS。因此,基層CPI 202可以包括點(diǎn)類(lèi)型、PTS、偏移B(用于基層),并且對(duì)于每個(gè)增強(qiáng)層,對(duì)應(yīng)的CPI文件可以具有包括層的偏移的入口。在這種情況下,應(yīng)理解,基本CPI文件中的入口n對(duì)應(yīng)于增強(qiáng)CPI文件中每一個(gè)的入口n。此外,基本CPI文件中入口n的點(diǎn)類(lèi)型和PTS應(yīng)用于每個(gè)增強(qiáng)CPI文件中的入口n。以這種方式,點(diǎn)類(lèi)型和PTS不需要為每個(gè)CPI文件(即對(duì)于CPI File1-CPI FileN)復(fù)制。
即使點(diǎn)的所有參數(shù)不包括在單個(gè)CPI文件中的單個(gè)入口中(如圖1的實(shí)施例),一旦單獨(dú)的CPI文件被裝入到存儲(chǔ)器中,則對(duì)于利用單獨(dú)的CPI結(jié)構(gòu)沒(méi)有性能損失,例如如圖2所示。一經(jīng)裝載,在各種CPI文件中對(duì)應(yīng)的入口就可以對(duì)于相同點(diǎn)被容易地存取,其中存儲(chǔ)器中單獨(dú)的CPI文件的裝載包括CPI文件的順序合并。例如,如果有M個(gè)CPI入口,基層CPI具有針對(duì)特征點(diǎn)信息的入口尺寸A,并且第一增強(qiáng)層CPI具有針對(duì)特征點(diǎn)信息的入口尺寸B,接著從在存儲(chǔ)器中的地址S開(kāi)始的組合CPI中接入特定點(diǎn)x的入口,可以執(zhí)行以下的操作x.點(diǎn)類(lèi)型=(S+A*x).點(diǎn)類(lèi)型x.PTS=(S+A*x).PTSx.基本偏移=(S+A*x).基本偏移x.Enh偏移=(S+A*M+B*x).Enh偏移同樣,多個(gè)增強(qiáng)層的CPI文件的入口可以用類(lèi)似的簡(jiǎn)單計(jì)算接入。因而,通過(guò)如上所述在盤(pán)(或其他介質(zhì))上存儲(chǔ)單獨(dú)的CPI文件而不犧牲性能。此外,在上述CPI入口之間使用的水平偏移同樣很好地應(yīng)用于每層的單獨(dú)的CPI文件的情況。
注意到,上述操作假定CPI文件裝入到存儲(chǔ)器中,從而增強(qiáng)CPI文件直接跟隨著基本CPI文件。但是,如果不跟隨著,則表示文件之間的存儲(chǔ)器距離的新的偏移可以包括在計(jì)算中。
以上結(jié)構(gòu)暗示基層和增強(qiáng)層中的入口數(shù)量都等于M。但是增強(qiáng)層可以包括較少數(shù)量的特征點(diǎn),例如基層中每2或3個(gè)點(diǎn)一個(gè)特征點(diǎn)(對(duì)應(yīng)于子采樣的頻率)。在這種情況下,如果增強(qiáng)層的CPI入口數(shù)量是M,則增強(qiáng)層中每?jī)蓚€(gè)或三個(gè)點(diǎn)可以相同。這就不必要使用存儲(chǔ)器。但是,用以上結(jié)構(gòu)仍有可能(通過(guò)消除增強(qiáng)層中相鄰的冗余2或3個(gè)點(diǎn))使增強(qiáng)層的入口比基層的入口少,只要子采樣的頻率已知并在以上操作的修改中進(jìn)行考慮。
在另一個(gè)方面中,CPI文件可以包括增強(qiáng)層的所有更低層點(diǎn)。這意味著每個(gè)CPI文件是獨(dú)立的,并且包括當(dāng)前層和所有更低層的指針。這給出了增強(qiáng)層比基層包括更多的CPI中的特征點(diǎn)入口的可能性,這將在以下進(jìn)一步描述。圖3說(shuō)明在一個(gè)實(shí)施例中的這一方案。CPI文件302用于基文件306。CPI文件302中的入口304包括關(guān)于基文件306中的點(diǎn)的信息。在利用增強(qiáng)層1308a時(shí)使用單獨(dú)的CPI文件310。該CPI文件310中的入口312包括關(guān)于基層306和Enh 1 308a的信息。同樣包含的CPI文件將存在于更高級(jí)別的增強(qiáng)層中。
通常,為了解碼增強(qiáng)層,需要對(duì)應(yīng)的基層數(shù)據(jù),因?yàn)樵跊](méi)有基層的對(duì)應(yīng)指針的情況下增強(qiáng)層的額外指針沒(méi)有用。使用圖3中所示的實(shí)施例,基層CPI 302可以很小,例如,只是每幾秒有一個(gè)點(diǎn)的入口。這對(duì)隨機(jī)存取和低品質(zhì)特技播放是足夠的,因?yàn)榛鶎油ǔS迷诰哂袊?yán)格的功率限制的小便攜式設(shè)備中。而且,具有小CPI減少了對(duì)存儲(chǔ)CPI入口所需的存儲(chǔ)。在這種情況下,包括基層的偏移的CPI 302被檢索并使用。對(duì)于基層加增強(qiáng),更多的點(diǎn)可以用于在具有更大的屏幕和更大的功率的設(shè)備上播放時(shí)確保高品質(zhì)特技播放,從而產(chǎn)生具有更多入口(以及每個(gè)入口有更多的參數(shù))的CPI文件。例如,當(dāng)設(shè)備利用第一增強(qiáng)層時(shí),CPI 310被檢索并利用,從而為基層和第一增強(qiáng)層提供CPI數(shù)據(jù)。
在圖3的實(shí)施例中,對(duì)應(yīng)于CPI 310的內(nèi)容文件可替換地是基層306和308a的復(fù)合編碼。因此,單獨(dú)的內(nèi)容文件可以存在于基層、基層加第一增強(qiáng)層、基層加第一和第二增強(qiáng)層等。當(dāng)只利用基層時(shí),解碼文件306。如果利用第一增強(qiáng)層,則解碼和利用復(fù)合編碼的基文件和Enh1文件。每個(gè)這種內(nèi)容文件可以具有單獨(dú)的CPI文件,它包括點(diǎn)類(lèi)型、PTS和特定的基層文件或復(fù)合基層和增強(qiáng)層文件的偏移。
盡管本發(fā)明已經(jīng)參照幾個(gè)實(shí)施例進(jìn)行了說(shuō)明,但是本領(lǐng)域技術(shù)人員將理解本發(fā)明不限于示出和描述的特定形式。因此,在不脫離如由所附權(quán)利要求定義的本發(fā)明的精神和范圍的情況下可以在其中作出形式和細(xì)節(jié)的各種改變。
權(quán)利要求
1.一種記錄介質(zhì),其包括若干包含一個(gè)基層(106)和一個(gè)或多個(gè)增強(qiáng)層(108a,108n)的內(nèi)容文件,該介質(zhì)進(jìn)一步包括用于基層(106)和一個(gè)或多個(gè)增強(qiáng)層(108a,108n)的特征點(diǎn)信息(CPI)文件(102)。
2.如權(quán)利要求1所述的記錄介質(zhì),其中CP I文件(102)包括一系列入口(104),每個(gè)入口對(duì)應(yīng)于基層(106)和一個(gè)或多個(gè)增強(qiáng)層(108a,108n)中的特征點(diǎn),每個(gè)特征點(diǎn)的入口(104)包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和對(duì)于基層(106)和至少一個(gè)增強(qiáng)層(108a,108n)中的每一個(gè)的單獨(dú)的偏移。
3.如權(quán)利要求2所述的記錄介質(zhì),其中對(duì)于每個(gè)入口(104),基層(106)的偏移確定用于入口(104)的特征點(diǎn)的基層(106)中的存儲(chǔ)器位置,并且每個(gè)增強(qiáng)層(108a,108n)的偏移確定用于入口(104)的特征點(diǎn)的相應(yīng)增強(qiáng)層(108a,108n)中的存儲(chǔ)器位置。
4.如權(quán)利要求3所述的記錄介質(zhì),其中用于入口(104)的特征點(diǎn)的基層(106)中的存儲(chǔ)器位置和用于入口(104)的特征點(diǎn)的每個(gè)增強(qiáng)層(108a,108n)中的存儲(chǔ)器位置對(duì)應(yīng)于入口(104)的顯示時(shí)間。
5.如權(quán)利要求3所述的記錄介質(zhì),其中對(duì)于CPI文件(102)中的至少若干入口(104),基層(106)和增強(qiáng)層(108a,108n)中的至少一個(gè)的偏移是用于入口(104)的特征點(diǎn)的相應(yīng)層中的絕對(duì)存儲(chǔ)器地址。
6.如權(quán)利要求3所述的記錄介質(zhì),其中對(duì)于CPI文件(102)中的至少若干入口(104),基層(106)和增強(qiáng)層(108a,108n)中的至少一個(gè)的偏移是從相應(yīng)層文件內(nèi)的已知開(kāi)始點(diǎn)的量度,該量度提供用于入口(104)的特征點(diǎn)的相應(yīng)層文件中的存儲(chǔ)器地址。
7.如權(quán)利要求1所述的記錄介質(zhì),其中CPI文件(102)包括一個(gè)或多個(gè)增強(qiáng)層(108a,108n)被從記錄介質(zhì)中刪除的標(biāo)記。
8.一種記錄介質(zhì),其包括若干包含一個(gè)基層(206)和一個(gè)或多個(gè)增強(qiáng)層(208a,208b)的內(nèi)容文件,該介質(zhì)進(jìn)一步包括對(duì)應(yīng)于基層(206)和一個(gè)或多個(gè)增強(qiáng)層(208a,208b)中的每一個(gè)的單獨(dú)的特征點(diǎn)信息(CPI)文件(202,204,210)。
9.如權(quán)利要求8所述的記錄介質(zhì),其中對(duì)應(yīng)于基層(206)的CPI文件(202)包括一系列入口,每個(gè)入口對(duì)應(yīng)于基層(206)中的特征點(diǎn),每個(gè)特征點(diǎn)的入口包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和基層(206)的偏移。
10.如權(quán)利要求9所述的記錄介質(zhì),其中對(duì)應(yīng)于一個(gè)或多個(gè)增強(qiáng)層(208a,108b)中的每一個(gè)的CPI文件(204,210)包括一系列入口,所述入口對(duì)應(yīng)于相應(yīng)增強(qiáng)層(208a,208b)中的特征點(diǎn),每個(gè)特征點(diǎn)的入口包括相應(yīng)增強(qiáng)層(208a,208b)的偏移。
11.如權(quán)利要求10所述的記錄介質(zhì),其中對(duì)于對(duì)應(yīng)于一個(gè)或多個(gè)增強(qiáng)層(208a,208b)中每一個(gè)的CPI文件中的特定特征點(diǎn)的每個(gè)入口對(duì)應(yīng)于CPI文件中特定特征點(diǎn)的入口,該CPI文件對(duì)應(yīng)于基層(206)。
12.一種記錄介質(zhì),其具有包括一個(gè)基層(306)和第一增強(qiáng)層(308a)的兩個(gè)內(nèi)容文件,該介質(zhì)還包括兩個(gè)特征點(diǎn)信息(CPI)文件(302,310),所述兩個(gè)CPI文件(302,310)包括對(duì)應(yīng)于基層(306)的基本CPI文件(302)和對(duì)應(yīng)于基層(306)和第一增強(qiáng)層(308a)的第一CPI文件(310)。
13.如權(quán)利要求12所述的記錄介質(zhì),其中基本CPI文件(302)包括一系列入口,每個(gè)入口對(duì)應(yīng)于基層(306)中的特征點(diǎn),每個(gè)特征點(diǎn)的入口包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和基層(306)的偏移。
14.如權(quán)利要求12所述的記錄介質(zhì),其中第一CPI文件(310)包括一系列入口,每個(gè)入口對(duì)應(yīng)于基層(306)和第一增強(qiáng)層(308a)中的特征點(diǎn),每個(gè)特征點(diǎn)的入口包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和基層(306)與第一增強(qiáng)層(308a)中的每一個(gè)的單獨(dú)的偏移。
15.如權(quán)利要求12所述的記錄介質(zhì),其中記錄介質(zhì)包括一個(gè)或多個(gè)較高級(jí)別的增強(qiáng)層,該介質(zhì)還包括對(duì)應(yīng)于一個(gè)或多個(gè)較高級(jí)別的增強(qiáng)層中的每一個(gè)的附加CPI文件,每個(gè)較高級(jí)別的增強(qiáng)層的CPI文件對(duì)應(yīng)于基層(306)和直到包括所對(duì)應(yīng)的較高級(jí)別的增強(qiáng)層的所有增強(qiáng)層級(jí)別(308a…)。
16.一種用于記錄多層編碼音頻/視頻數(shù)據(jù)的方法,其包括產(chǎn)生CPI文件(102),該CPI文件(102)包括一系列入口(104),每個(gè)入口對(duì)應(yīng)于特征點(diǎn),每個(gè)入口(104)包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和對(duì)應(yīng)于一個(gè)基層(106)和一個(gè)或多個(gè)增強(qiáng)層(108a,108n)中的特征點(diǎn)的一個(gè)或多個(gè)偏移。
17.一種用于記錄多層編碼音頻/視頻數(shù)據(jù)的方法,其包括產(chǎn)生對(duì)應(yīng)于基層文件(206)并包括每個(gè)入口對(duì)應(yīng)于一個(gè)特征點(diǎn)的一系列入口的基本CPI文件(202),每個(gè)入口包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和對(duì)應(yīng)于基層(206)中的特征點(diǎn)的偏移;以及產(chǎn)生對(duì)應(yīng)于包含增強(qiáng)層音頻/視頻數(shù)據(jù)的相應(yīng)的一個(gè)或多個(gè)增強(qiáng)層文件(208a,208b)的一個(gè)或多個(gè)附加CPI文件(204,210),每個(gè)附加CPI文件(204,210)對(duì)應(yīng)于增強(qiáng)層文件(208a,208b),該增強(qiáng)層文件包括一系列入口,該入口包括至少對(duì)應(yīng)于相應(yīng)的增強(qiáng)層音頻/視頻數(shù)據(jù)中的位置的偏移。
18.如權(quán)利要求17所述的方法,其中增強(qiáng)層文件(208a,208b)的每個(gè)附加CPI文件(204,210)中的每個(gè)入口對(duì)應(yīng)于特征點(diǎn)的基本CPI文件(202)中的一個(gè)入口。
19.如權(quán)利要求18所述的方法,還包括以下步驟存取基層CPI文件(202)中的特征點(diǎn)的入口,并使用入口中的偏移來(lái)存取對(duì)應(yīng)于基層文件(206)中的特征點(diǎn)的位置,以及存取增強(qiáng)層(208a,208b)的至少一個(gè)附加CPI文件(204,210)中的特征點(diǎn)的對(duì)應(yīng)入口,并使用對(duì)應(yīng)的入口中的偏移來(lái)存取對(duì)應(yīng)于相應(yīng)的增強(qiáng)層(208a,208b)中的特征點(diǎn)的位置。
20.如權(quán)利要求17的方法,還包括以下步驟在存儲(chǔ)器中順次存儲(chǔ)基本CPI文件(202)和一個(gè)和多個(gè)附加CPI文件(204,210),以及基于所存儲(chǔ)的序列,應(yīng)用操作來(lái)存取基本CPI文件(202)中的入口和一個(gè)或多個(gè)附加CPI文件(204,210)中的對(duì)應(yīng)入口。
21.一種用于記錄多層編碼音頻/視頻數(shù)據(jù)的方法,其包括產(chǎn)生基本CPI文件(302),該基本CPI文件(302)對(duì)應(yīng)于基層文件(306)并包括一系列入口,每個(gè)入口對(duì)應(yīng)于一個(gè)特征點(diǎn),每個(gè)入口包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和對(duì)應(yīng)于基層(306)中的特征點(diǎn)的偏移;以及產(chǎn)生一個(gè)或多個(gè)附加CPI文件(310),該附加CPI文件(310)對(duì)應(yīng)于包含增強(qiáng)層音頻/視頻數(shù)據(jù)的相應(yīng)的一個(gè)或多個(gè)增強(qiáng)層文件(308a),每個(gè)附加CPI文件(310)對(duì)應(yīng)于增強(qiáng)層文件(308a),該增強(qiáng)層文件(308a)包括一系列入口,每個(gè)入口對(duì)應(yīng)于一個(gè)特征點(diǎn),每個(gè)入口包括點(diǎn)類(lèi)型、顯示時(shí)間(PTS)和對(duì)應(yīng)于基層(306)和級(jí)別直到包括對(duì)應(yīng)的增強(qiáng)層文件的所有增強(qiáng)層文件(308a)中的特征點(diǎn)的位置的偏移。
22.一種用于識(shí)別多層編碼音頻/視頻數(shù)據(jù)的信息結(jié)構(gòu),其包括CPI(102,204,210,310),該CPI包括至少一個(gè)對(duì)應(yīng)于剪輯上的點(diǎn)的點(diǎn)類(lèi)型、對(duì)應(yīng)于剪輯中的點(diǎn)的顯示時(shí)間和一個(gè)或多個(gè)對(duì)應(yīng)于剪輯的一個(gè)或多個(gè)增強(qiáng)層(108a,108n,208a,208b,308a)中的點(diǎn)的偏移點(diǎn)。
全文摘要
一種用于產(chǎn)生多層編碼音頻/視頻數(shù)據(jù)的特征點(diǎn)信息(CPI)的方法包括產(chǎn)生CPI文件。該CPI文件包括至少一個(gè)對(duì)應(yīng)于剪輯中的至少一個(gè)點(diǎn)的點(diǎn)類(lèi)型、對(duì)應(yīng)于剪輯中的點(diǎn)的顯示時(shí)間和一個(gè)或多個(gè)對(duì)應(yīng)于剪輯的基層和一個(gè)或多個(gè)增強(qiáng)層中的點(diǎn)的偏移點(diǎn)。由剪輯的基層和增強(qiáng)層中的偏移識(shí)別的點(diǎn)全部對(duì)應(yīng)于剪輯中相同的點(diǎn)。
文檔編號(hào)G11B27/034GK1830033SQ200380106715
公開(kāi)日2006年9月6日 申請(qǐng)日期2003年12月10日 優(yōu)先權(quán)日2002年12月19日
發(fā)明者迪克蘭·帕特里克·凱利, 簡(jiǎn)·弗里索·R·布萊克奎爾 申請(qǐng)人:皇家飛利浦電子股份有限公司