專利名稱:使用非逐行掃描偽預測圖像的特技模式的制作方法
技術領域:
本發(fā)明的方案一般涉及一種視頻系統(tǒng),更具體來講涉及記錄或者播放數(shù)字編碼視頻序列的視頻系統(tǒng)。
背景技術:
在今天的家電市場中,數(shù)字電視(DTV)和高清晰度電視(HDTV)正漸漸受歡迎起來。為了觀看先前記錄的節(jié)目或者記錄他們中意的節(jié)目,這種電視的許多購買者還購買了數(shù)字錄像機或者播放器,例如數(shù)字影碟(DVD)錄像機或者播放器。特別是,DTV(或者HDTV)和數(shù)字視頻數(shù)字錄像機或者播放器的組合可能是家庭影院娛樂系統(tǒng)的不可分割的部分。
數(shù)字錄像機或者播放器通常包含運動圖像專家組(MPEG)解碼器,用來對存儲在錄像機或者播放器所播放的盤上的數(shù)字編碼多媒體數(shù)據(jù)進行解碼。如果數(shù)字錄像機或者播放器與傳統(tǒng)的(非DTV或者非HDTV)電視連接,則在被顯示在傳統(tǒng)電視上之前,由數(shù)字錄像機或者播放器的MPEG解碼器對數(shù)字編碼信號進行解碼。然而,相當多的DTV包含它們自己的MPEG解碼器。因此,如果數(shù)字錄相機或者播放器與DTV相連,那么將利用DTV的解碼器遠程解碼從所述盤讀取的視頻信號。此結構可以被稱之為遠程解碼器結構。
然而,利用遠程DTV解碼器來解碼數(shù)字編碼信號存在重大的缺陷。也就是說,按照此類配置很難執(zhí)行特技模式(trick modes)。所述特技模式可以是沒有以正常速度或者沒有按正方向進行播放的任何一種視頻播放操作。通常,特技模式包括諸如在慢運動或者凍結特技模式期間重復視頻信號中的多個圖像。由于數(shù)字錄相機或者播放器與DTV之間的帶寬是受限的,因此在正傳送給DTV的信號中重復圖像可能引起所述信號超過傳輸通道的最大比特率限制。如果所述圖像是幀內(nèi)(I)圖像或者預測(P)圖像,那么所述問題將更加尖銳,這是由于這些圖像利用了相對大量的比特來進行編碼。
除比特率問題外,遠程解碼視頻信號還存在其它缺點如果重復的圖像包含運動對象,那么這種配置下非逐行掃描圖像的重復顯示可能引起在顯示過程中出現(xiàn)擺動效應。為解釋此缺點,有理由對隔行掃描作一簡短說明。
許多電視機采用隔行掃描技術。在此格式之下,通常將視頻信號分為預定數(shù)量的水平行。在每個場周期期間內(nèi),只掃描這些行的二分之一;通常,在第一場周期期間掃描奇數(shù)行,而在下一場周期期間掃描偶數(shù)行。每一掃描稱為一場,并且當合并時,兩個場形成一個完整的圖像或者幀。對于NTSC系統(tǒng)來說,每秒顯示60場,因而產(chǎn)生了每秒30幀的速率。
當運動對象在隔行掃描電視中移動穿過屏幕時,每個場將只顯示該運動對象的一部分。所述局部顯示是因為一個場只是每隔整個圖像的一個水平行來顯示。例如,對于特定的場n來說,只掃描奇數(shù)水平行,并且將在場n中顯示的運動對象的部分是在掃描場n奇數(shù)水平行期間所掃描的部分。在1/60秒以后,創(chuàng)建下一場、即場n+1,并且將顯示該圖像的偶數(shù)水平行。由此,在場n+1中顯示的運動對象部分是在掃描場n+1偶數(shù)水平行期間被掃描的部分。雖然每個場暫時不同,但是由于場的顯示速度,因而人眼感覺場的連續(xù)顯示像是平滑運動。
如果觀看者激活特技模式,那么特技模式視頻信號可以包含重復的圖像,所述圖像是根據(jù)隔行掃描格式記錄的。例如,如果觀看者對特定的圖像啟動凍結特技模式,那么可以將該圖像重復地發(fā)送到包含遠程解碼器的DTV,并且在所述DTV上被解碼和顯示。然而,重復圖像的顯示是與非逐行掃描圖像的正常顯示一致的,即,交替地顯示組成非逐行掃描圖像的場。
如果運動對象出現(xiàn)在以隔行掃描格式記錄的圖像中,那么每個場將在一個特定位置中顯示運動對象。由此,由于在凍結特技模式期間交替地顯示這些場,所以顯示器中的運動對象快速地從顯示器中的一個位置移動到另一個位置;實際上,所述運動對象看起來像是擺動的。產(chǎn)生此擺動的原因是因為隔行掃描場是暫時不同的,并且運動對象出現(xiàn)在每個場的不同位置中。
此問題也存在于包括去隔行掃描器(deinterlacer)的DTV中。如現(xiàn)有技術中所公知的那樣,去隔行掃描器可以從隔行掃描場構造完整的幀,由此,去隔行掃描器可以構造缺少場的包括重復非逐行掃描幀的完整的幀。不過,根據(jù)隔行掃描場構造的這些完整的幀也將以交替的方式進行顯示,由此產(chǎn)生了擺動假象的可能性。此外,此擺動效應不僅出現(xiàn)在凍結特技模式中,而且還存在于其中重復非逐行掃描圖像的任何其它特技模式中。由此,人們需要在沒有提高系統(tǒng)開銷或增加系統(tǒng)復雜性的情況下,消除比特率問題和擺動假象。
發(fā)明內(nèi)容
本發(fā)明涉及一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的方法。本發(fā)明包括以下步驟接收特技模式命令,以及利用基于場的預測和基于幀的預測當中的至少一個預測方案,將至少一個偽預測圖像有選擇地插入到視頻信號中。有選擇地插入步驟將視頻信號轉換為特技模式視頻信號。在一種配置中,有選擇地插入步驟可以包括以下步驟利用基于場的預測來有選擇地將至少一第一偽預測圖像插入到視頻信號中,并且利用基于幀的預測有選擇地將隨后的偽預測圖像插入到特技模式視頻信號中。
在另一種配置中,所述方法還可以包括根據(jù)與參考圖像相關的單個場來預測至少一第一偽預測圖像的步驟。此參考圖像可以是幀內(nèi)圖像或者是預測圖像。另外,該參考圖像可以是非逐行掃描圖像、逐行掃描圖像或者場圖像。
在本發(fā)明的一個方面中,多個原始圖像可以被包含在圖像組中,并且用于預測至少一個第一偽預測圖像的參考圖像可以是該組圖像的最后一個原始圖像,如此使得沒有別的原始圖像可以根據(jù)所插入的偽預測圖像被預測。在另一個方面中,多個原始圖像可以被包含在一個所述圖像組中,并且所述方法還可以包括以下步驟在有選擇地插入步驟之后,跳過最后插入的偽預測圖像之后的任一剩余原始圖像,從而使該組圖像中的最后一個圖像是最后插入的偽預測圖像。另一方面,在不包含偽預測圖像或者重復的原始圖像的原始圖像組中具有多個原始圖像,并且所述方法還可以包括以下步驟在有選擇地插入步驟之后,傳輸原始的GOP以便解碼。
此外,特技模式命令可以是凍結或者慢運動特技模式命令,并且所述方法還可以包括利用遠程解碼器解碼至少一部分特技模式視頻信號的步驟。所述偽預測圖像還可以是非逐行掃描預測圖像。
本發(fā)明涉及另一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的方法。此方法包括以下步驟接收特技模式命令;響應特技模式命令,有選擇地重復至少一個原始圖像,其中有選擇地重復步驟將視頻信號轉換為特技模式視頻信號,并且使用基于場的預測或者基于幀的預測當中的至少一個預測方案有選擇地將至少一個偽預測圖像插入到特技模式視頻信號中。此方法還可以包括以下步驟監(jiān)視特技模式視頻信號,其中,如果特技模式視頻信號的比特率超過預定閾值,就執(zhí)行有選擇地插入步驟。
在一種配置中,多個原始圖像的每一個都包含顯示指示符,并且所述方法還可以包括以下步驟有選擇地修改多個原始圖像的至少一部分的顯示指示符,以便當重復原始圖像或者當將偽預測圖像插入到特技模式視頻信號中時,反映預定的顯示順序。所述顯示指示符可以是臨時參考字段。每個臨時參考字段可以具有整數(shù)值,并且有選擇地修改多個原始圖像的至少一部分的臨時參考字段的步驟可以包括以下步驟每當重復原始圖像或者當將偽預測圖像插入到特技模式視頻信號中時,將臨時參考字段的整數(shù)值逐漸地加1。以此方法,偽預測圖像可以是非逐行掃描偽預測圖像。
本發(fā)明還涉及一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的系統(tǒng)。所述系統(tǒng)包括控制器和處理器,所述控制器用于從存儲介質(zhì)中讀數(shù)據(jù)并輸出包含多個原始圖像的視頻信號。所述處理器被編程以用于接收特技模式命令,并且有選擇地利用基于場的預測或者基于幀的預測、將至少一個偽預測圖像插入到特技模式視頻信號中。有選擇地插入步驟將視頻信號轉換為特技模式視頻信號。所述系統(tǒng)還包括適當?shù)能浖碗娐罚詫崿F(xiàn)如上所述的方法。
圖1是依照此處本發(fā)明結構的可利用偽預測圖像執(zhí)行特技模式的系統(tǒng)框圖。
圖2是舉例說明了依照本發(fā)明結構的用于利用偽預測圖像執(zhí)行特技模式的操作的流程圖。
圖3A舉例說明了依照本發(fā)明結構的具有非逐行掃描圖像的典型圖像組。
圖3B舉例說明了本發(fā)明結構的包括所插入的偽預測圖像的圖像組的一部分和預測方案的例子。
圖3C舉例說明了依照本發(fā)明結構的包括所插入的偽預測圖像的圖像組的一部分和另一個預測方案的例子。
圖3D舉例說明了依照本發(fā)明結構的包含非逐行掃描圖像的一組圖像的一部分,其中已經(jīng)修改了圖像的顯示指示符。
圖4是舉例說明依照本發(fā)明結構的用于利用偽預測圖像執(zhí)行特技模式的另一方法的另一流程圖。
圖5是舉例說明依照本發(fā)明結構的用于利用偽預測圖像執(zhí)行特技模式的又一個操作的又一個流程圖。
圖6舉例說明了依照本發(fā)明結構的包括所插入的偽預測圖像的一組圖像的一部分和另一個預測方案的例子。
具體實施例方式
在圖1中以框圖的形成示出了依照本發(fā)明配置用于實現(xiàn)不同改進的操作特征的系統(tǒng)100。然而,本發(fā)明不局限于圖1舉例說明的特定系統(tǒng),而是可以使用能夠接收數(shù)字編碼信號并將該信號傳輸給顯示設備的任何其它系統(tǒng)來實現(xiàn)本發(fā)明。此外,系統(tǒng)100也不局限于從/向特定類型的存儲介質(zhì)讀/寫數(shù)據(jù),能夠存儲數(shù)字編碼數(shù)據(jù)的任何存儲介質(zhì)都可以用于系統(tǒng)100。
系統(tǒng)100可以包括控制器110,用于從/向存儲介質(zhì)112讀/寫數(shù)據(jù)。系統(tǒng)100還可以具有搜索引擎114、微處理器116、傳輸緩沖存儲器117和顯示裝置118。搜索引擎114可以包含適當?shù)能浖碗娐?,以便在從存儲介質(zhì)112讀取的視頻信號中定位一個或多個特定類型的圖像。還可以提供控制和數(shù)據(jù)接口,以便允許微處理器116控制所述控制器110和搜索引擎114的操作。對于由微處理器116執(zhí)行的傳統(tǒng)操作來說,可以在存儲器中提供適當?shù)能浖蛘吖碳?。此外,依照本發(fā)明的結構,可以為微處理器116提供例行程序。
應該理解的是,在本發(fā)明的意圖內(nèi),搜索引擎114和微處理器116的全部或者部分可以是處理器。此外,在本發(fā)明的意圖內(nèi),控制器110、搜索引擎114、微處理器116和傳輸緩沖存儲器117的全部或者部分可以是比特流源122。在一種結構中,顯示裝置118可以包含其自身的解碼器119,用于解碼從存儲介質(zhì)112讀取的全部或者部分視頻信號,并經(jīng)由比特流源122處理。在此特定的結構中,比特流源122中的解碼器(未示出)通常不對從存儲介質(zhì)112讀取的視頻信號進行解碼??梢詫⒋颂囟ǖ膶嵤├Q為遠程解碼器結構。然而,應當指出,本發(fā)明不局限于此結構,本發(fā)明能夠以其它適當?shù)南到y(tǒng)實現(xiàn)。
在操作過程中,控制器110可以從存儲介質(zhì)112中讀取包含多個原始圖像的視頻信號。這些原始圖像可以是非逐行掃描圖像、逐行掃描圖像或者場圖像。在一種結構中,如果微處理器116接收諸如慢運動或者凍結命令之類的特技模式命令,那么微處理器116可以有選擇地重復至少一個原始圖像,以便將視頻信號轉換為特技模式視頻信號。由此,特技模式視頻信號可以包含原始圖像以及一個或多個原始圖像的副本或者重復。
此外,在特技模式命令期間,微處理器116可以通知搜索引擎114在特技模式視頻信號中定位一個或多個適當?shù)脑紙D像。一旦適當?shù)脑紙D像被定位,搜索引擎114就通知微處理器116,并且微處理器116可以生成相應的偽預測(P)圖像。偽P圖像是可以根據(jù)確定的圖像預測的P圖像,其中將偽P圖像的運動矢量設置為零,并將其剩余信號設置為零或不編碼。對本發(fā)明來說,偽P圖像可以是非逐行掃描偽P圖像;然而,本發(fā)明不局限于此,所述偽P圖像可以是諸如逐行掃描或者場圖像的任何其它適當?shù)膱D像類型。
微處理器116能因此有選擇地插入至少一個相應的偽P圖像,如此使得除了重復的原始圖像之外,將偽P圖像發(fā)送到傳輸緩沖存儲器117并且發(fā)送到顯示裝置118和解碼器119上。由于偽P圖像包含相對少量的編碼數(shù)據(jù),所以在特技模式視頻信號中插入偽P圖像可以使信號的整體比特率減小。
將以這樣的方式來生成偽P圖像,即,當微處理器116接收特技模式命令時生成偽P圖像,稱為“運行時”生成偽P圖像。作為選擇,微處理器116可以在啟動特技模式命令之前生成偽P圖像,其中可以將一個或多個偽P圖像存儲在存儲器(未示出)中。一旦微處理器116接收特技模式命令,微處理器116就可以從存儲器檢索一個或多個偽P圖像,并且將它們插入到特技模式視頻信號中。在任何一種結構中,所述偽P圖像可以代替一個或多個重復的原始圖像,從而將偽P圖像發(fā)送到顯示裝置118并且對其進行顯示,而不是顯示重復的原始圖像。
在本發(fā)明的另一方面中,一旦微處理器116接收了特技模式命令,微處理器116就可以監(jiān)視特技模式視頻信號的比特率。如果特技模式視頻信號的比特率超過預定閾值,那么微處理器116、連同搜索引擎114一起可以執(zhí)行上述的有選擇地插入步驟,其中可以將至少一個偽P圖像插入到特技模式視頻信號中。
在本發(fā)明的一個特定實施例中,微處理器116僅僅可以將偽P圖像插入到從存儲介質(zhì)112讀取的視頻信號中,以便形成特技模式視頻信號。作為一個例子,如果接收了凍結或者暫停特技模式命令,那么在所述命令的工作期間,微處理器116可以插入視頻信號偽P圖像,其中可以根據(jù)啟動凍結特技模式的原始圖像來預測第一偽P圖像。然而,應該理解的是,此過程不局限于凍結特技模式,此特定的實施例還可以利用慢運動特技模式來實現(xiàn)。
為防止擺動圖像問題,當啟動諸如凍結特技模式的特技模式命令時,搜索引擎114可以定位特定的原始圖像。在一種結構中,此原始圖像可以是一組圖像(GOP)中的最后一個圖像。微處理器116能夠將一個或多個非逐行掃描偽P圖像插入到視頻信號中,其中所述視頻信號包含原始圖像,在所述原始圖像中,可以根據(jù)最后一個原始圖像的單個場來預測第一偽P圖像。如果啟動了凍結特技模式的原始圖像不是GOP中的最后一個原始圖像,那么微處理器116可以延遲特技模式的開始,從而根據(jù)GOP中的最后一個原始圖像來預測第一偽預測圖像。
作為選擇,所述搜索引擎114可以定位不是GOP中最后一個圖像的原始圖像,并且所述微處理器116可以跳過或者刪除最后一個偽P圖像之后的所有原始圖像,以便將其插入到視頻信號中(在此替代的實施例中,第一偽P圖像可以根據(jù)原始圖像的單個場來預測,其中所述原始圖像也是根據(jù)該場預測的)。如下面將解釋的,此單個場的預測方案可以幫助消除擺動圖像假象。此外,確保GOP中的最后一個圖像是最后插入的偽預測圖像,以便不會根據(jù)所述偽預測圖像預測其它圖像,由此可以維護視頻信號的顯示質(zhì)量。
在另一種結構中,微處理器116可以修改多個原始圖像的一個或多個內(nèi)包含的信息的確定部分,其中所述原始圖像包含在特技模式視頻信號中,以反映預定的顯示順序。無論是重復原始圖像、還是將偽P圖像插入到視頻信號,都可以執(zhí)行此修改步驟。下面將更加詳細地討論本發(fā)明的整體操作。
利用非逐行掃描偽預測圖像的特技模式參見圖2,舉例說明了用于示范執(zhí)行利用偽P圖像的特技模式的一種方式的方法200。在一個實施例中,本發(fā)明能夠以遠程解碼器結構的方式來實現(xiàn)。對本發(fā)明來說,遠程解碼器結構可以是任何系統(tǒng),其中視頻信號中至少部分圖像可以由解碼器解碼,其中所述解碼器在比特流源極外部,并且不受所述比特流源極的控制,其中所述比特流源極向解碼器提供圖像。
作為一個例子,所述比特流源極可以是光存儲介質(zhì)播放器或者記錄器,用于從光存儲介質(zhì)中讀取多媒體數(shù)據(jù),并且經(jīng)由傳輸通道將此數(shù)據(jù)傳輸?shù)綌?shù)字電視,所述數(shù)字電視包含其自身的解碼器。然而,應該理解的是,本發(fā)明不局限于此例子,并且更不局限于遠程解碼器結構,本發(fā)明能夠以任何其它適當?shù)南到y(tǒng)或者結構來實現(xiàn)。
在步驟210,可以讀取包含多個原始圖像的視頻信號。在一種結構中,這些原始圖像可以是非逐行掃描圖像、逐行掃描圖像或者場圖像。在步驟212,可以接收特技模式命令。對本發(fā)明來說,所述特技模式命令可以是任何命令,在所述命令中,往往需要重復的一個或多個原始圖像包括暫?;蛘邇鼋Y命令或者慢運動命令。
響應所述特技模式命令,在步驟214,可以重復至少一個原始圖像,以便將所述視頻信號轉換為特技模式視頻信號。不過沒有意思以任何方式來限制本發(fā)明的訪問,此方法200將示范重復GOP中的原始B圖像以形成特技模式視頻信號,并且將偽P圖像插入到該特技模式視頻信號中,其中根據(jù)GOP中包含的原始I和P圖像來預測偽P圖像。
參見圖3A,依照顯示順序示出了包含非逐行掃描圖像的GOP 300。下標編號表示每個圖像相對于GOP中另一個圖像、以正常播放速度進行顯示的時間。小寫字母“t”可以表示頂端場,而小寫字母“b”可以表示底部場。此GOP 300可以是視頻信號中多個GOP的其中一個。雖然本發(fā)明不局限于此特定的GOP結構,但是所述GOP 300將足以說明利用非逐行掃描偽P圖像的慢運動特技模式是如何執(zhí)行的。
返回參見圖2,在步驟216,可以利用基于場的或者基于幀的預測來有選擇地將一個或多個偽P圖像插入到特技模式視頻信號中。這些偽P圖像可以是非逐行掃描、逐行掃描或者場圖像。如先前所述,偽P圖像是可以根據(jù)確定的圖像來預測的P圖像,在所述確定的圖像中,將偽P圖像的運動矢量設置為零,并且將其剩余信號設置為零或非編碼的。例如,在MPEG信號中,可以將偽P圖像的離散余弦變換(DCT)系數(shù)設置為零或非編碼的。照此,偽P圖像包含極少的信息。偽P圖像的主要意圖在于復制或者重復圖像、或者圖像的場,由此其可以利用少數(shù)比特來進行預測。由此,偽P圖像適合于替換特技模式視頻信號中的一個或多個重復的原始圖像,并且特技模式視頻信號可以包含重復的原始圖像和/或偽P圖像。
可以將這些偽P圖像、而非重復的原始圖像發(fā)送到遠程解碼器。因此隨著這種信號的比特率趨向于升高,當這些原始圖像的大多數(shù)、包括具有大量比特的那些編碼往往在特技模式命令期間被重復時,此過程可以將特技模式視頻信號的比特率維持在可管理的水平上。在下面將描述利用偽P圖像的幾個預測方案的例子。
例如,返回參見圖3A,如果將要執(zhí)行具有1/3X(1X表示正常播放速度)的播放速度的慢運動特技模式命令,那么GOP 300中的每個B圖像都可以被重復兩次。因為B圖像包含相對少量的比特,因此重復B圖像將不會導致特技模式視頻信號的比特率太高,至少相對于I和P圖像是這樣的。在作為參考圖像的每個原始圖像之后(以顯示順序),可以插入兩個偽P圖像。對本發(fā)明來說,參考圖像可以是任何圖像,根據(jù)所述圖像可以預測其它圖像,所述圖像諸如是I或者P圖像。這些參考圖像還可以是非逐行掃描圖像、逐行掃描圖像乃至場圖像。
在圖3B中舉例說明了上述過程的部分例子,其中示出了在圖像I2之后插入兩個偽預測圖像。這里,第一偽P圖像Pd1的第一場Pd1t可以根據(jù)圖像I2的第一場I2t來預測(其中“d”表示圖像是虛圖像而“d”之后的數(shù)字表示偽P圖像相對于所有其它偽P圖像的顯示順序,在此實例中,所述數(shù)字是“1”)。
此外,第一偽P圖像Pd1的第二場Pd1b可以根據(jù)圖像I2的第二場I2b預測。作為選擇,第一偽P圖像的場可以根據(jù)具有反奇偶性的圖像I2的場來預測。隨后的偽P圖像Pd2的場Pd2t和Pd2b可以依照這些例子的任何一個、根據(jù)場Pd1t和Pd1b來預測,并且任何一個過程可以被重復以便預測隨后的偽P圖像。在圖3B中示出了相對于第二偽P圖像Pd2具有相同奇偶性的基于場的預測。上述的兩個結構都表示基于場的預測方案的例子。
參見圖3C,示出了基于場的預測的替代方式。作為一個例子,第一偽P圖像Pd1的場Pd1t和Pd1b可以利用基于幀的預測、根據(jù)圖像I2來預測。此外,每個隨后的偽P圖像可以利用基于幀的預測、根據(jù)先前的偽P圖像來預測。在另一個結構中,可以利用基于場的預測來預測偽P圖像的一部分,并且利用基于幀的預測來預測另一部分。
必須指出,不能將本發(fā)明就涉及步驟214和216的評述進行限制,也可以其它的過程來創(chuàng)建特技模式視頻信號,并且其它預測方案也是可利用的。例如,由于僅僅執(zhí)行了插入根據(jù)GOP中參考圖像預測的偽P圖像,所以不必重復所有原始圖像來創(chuàng)建特技模式視頻信號。在此例子中,可以插入足夠的偽P圖像以實現(xiàn)所要求的播放速度(這樣做可以補償重復原始圖像的缺乏)。
返回參見圖2,在另一個實施例中,多個原始圖像的每個都可以包含顯示指示符。如在判定框218處確定的,如果圖像的顯示指示符將被有選擇地修改,那么多個原始圖像的至少一部分的顯示指示符在原始圖像的重復或者偽P圖像的插入之后、被有選擇地修改,如步驟220所示。
值得注意的是,當重復原始圖像或者將偽P圖像插入到特技模式視頻信號中時,修改這些顯示指示符可以反映多個原始圖像的預定的顯示順序。然而,應該理解的是,無論在特技模式期間是否插入偽P圖像,都要執(zhí)行此過程。由此,在僅僅重復圖像而不將偽P圖像插入到視頻信號的傳統(tǒng)特技模式期間,可以執(zhí)行修改顯示指示符的步驟。返回參見方法200,如果所述顯示指示符是不允許修改的,那么在判定框222可以繼續(xù)方法200。
在一種結構中,所述顯示指示符可以是臨時參考字段。所述臨時參考字段通常是位于數(shù)字編碼圖像的圖像首部的十位字段。當相對于其它視頻信號中的圖像來顯示視頻信號中的特定圖像時,一些解碼器依賴所述臨時參考字段來確定。此字段通常具有整數(shù)值。
作為一個例子,再一次參考圖3A,GOP 300包含十五個圖像。GOP 300中的圖像的下標編號可以對應于每個相應圖像的臨時參考字段的整數(shù)值。舉例來說,圖像B0的臨時參考字段,即GOP 300中的第一圖像可以具有整數(shù)值0。作為將要顯示的下一個圖像的圖像B1的臨時參考字段可以具有整數(shù)值1。由此,要被顯示的每個隨后圖像的臨時參考字段的整數(shù)值能夠以1為單位來遞增,一直到圖像P14,圖像P14的臨時參考字段可以具有整數(shù)值14。為了方便起見,還可以將短語“臨時參考字段的整數(shù)值”稱為“整數(shù)值”。
當重復原始圖像或者將偽P圖像插入到特技模式視頻信號中時,依照原始圖像的臨時參考字段的顯示順序不再有效。據(jù)此,可以修改位于所插入的偽P圖像之后的原始圖像的臨時參考字段的整數(shù)值,以便呈現(xiàn)適當?shù)娘@示順序。
例如,如果將GOP 300中的圖像I2發(fā)送到顯示裝置,并且同時發(fā)送三個對應的偽P圖像(此操作依照1/4X慢運動播放),那么圖像I2的臨時參考字段的整數(shù)值(假定其是將要顯示的GOP中的第三個圖像)可以保持為2,可以將第一偽P圖像的臨時參考字段設置為整數(shù)值3,可以將第二偽P圖像的臨時參考字段設置為整數(shù)值4,并且將第三偽P圖像的臨時參考字段設置為整數(shù)值5。此外,待顯示的下一個原始圖像的臨時參考字段、即B3可以從其原始整數(shù)值3修改為整數(shù)值6(B6)。此例子的最終結果在圖3D中示出。
可以繼續(xù)逐漸地提高原始圖像的臨時參考字段的整數(shù)值的此步驟,直到取消所述特技模式,以及修改最后一個特技模式GOP(受特技模式影響的最后一個GOP)中的最后一個圖像的臨時參考字段。一旦達到下一個GOP,新的GOP中的第一顯示圖像的臨時參考字段的整數(shù)值可以是0。由此,每當將偽P圖像插入到特技模式視頻信號中時,跟隨插入的偽P圖像之后的每個原始圖像的臨時參考字段的整數(shù)值、可以經(jīng)由所述特技模式GOP而被逐漸地增加1,以便反映預定的顯示順序。
臨時參考字段的整數(shù)值可以具有最大值1,023。如果組成特技模式GOP的圖像的臨時參考字段的整數(shù)值(原始圖像加偽P圖像)達到此值,那么臨時參考字段只可以繞回并且以0從頭開始。作為一個例子,如果啟動凍結特技模式,那么其中一個偽P圖像或者其中一個原始圖像的整數(shù)值可以最終達到1,023。一旦發(fā)生,待顯示的下一個直接的偽P或者原始圖像的臨時參考字段的整數(shù)值可以設置為零。
當然,應該注意的是,在上述的任何一個實施例中,本發(fā)明不局限于使用臨時參考字段,而是可以對所有其它適當?shù)娘@示指示符進行修改,以反映預定的顯示順序。此外,所述繞回值決不限于1,023,而是可以使用其它適當?shù)闹?。返回參見圖2,在判定框222,無論所述特技模式是否繼續(xù),都可以進行確定。如果是這樣的話,在步驟214可以繼續(xù)方法200。不然的話,在步驟224可以恢復正常播放。
轉向圖4,方法400舉例說明了在特技模式期間利用偽P圖像的另一種方式。在步驟410,可以讀取包含多個原始圖像的視頻信號。類似于方法200,這些原始圖像可以是非逐行掃描圖像、逐行掃描圖像或者場圖像。此方法400可以按照遠程解碼器結構來實現(xiàn),但是不局限于此。在步驟412,可以接收諸如凍結特技模式命令或者慢運動特技模式命令的特技模式命令。在步驟414,可以有選擇地重復至少一個原始圖像,以便將視頻信號轉換為特技模式視頻信號。在步驟416和418,如果要求的話,至少部分原始圖像的顯示指示符可以依照涉及方法200的步驟218和220的評述來修改。
在特技模式命令期間,可以監(jiān)視特技模式視頻信號的比特率,如步驟420所示。在特技模式期間、監(jiān)視比特率是必須的,這是由于視頻信號中的幾個原始圖像也許會被重復一次或多次,由此導致比特率提高。在某些情況下,這種提高的比特率可能會超過用于運輸特技模式視頻信號的傳輸通道的最大容許的比特率。對本發(fā)明來說,可以將傳輸通道的該最大容許的比特率稱為預定閾值。
在判定框422,可以確定特技模式視頻信號的比特率是否超過此預定閾值。如果比特率沒有達到預定閾值、并且特技模式在判定框426處繼續(xù),那么方法400在判定框414繼續(xù)。返回參見判定框422,如果比特率已經(jīng)超過預定閾值,那么可以利用基于場的預測或者基于幀的預測、將一個或多個偽P圖像插入到特技模式視頻信號中,如步驟424所示。此外,這些偽P圖像可以是非逐行掃描、逐行掃描或者場圖像。
此插入步驟可以依照涉及方法200的步驟216的評述來進行。此外,如果原始圖像是B圖像,那么不必替換原始圖像的副本或者重復。跟隨步驟424,方法400可以在判定框416處繼續(xù),其中如果需要的話,偽P圖像隨后的原始圖像顯示指示符可以被修改。如果當在判定框426處確定時、特技模式將停止,然后可以恢復正常播放,如步驟428所示。然而,應該理解的是,可以在方法400中的任何其它適當?shù)牟襟E處取消特技模式。
參見圖5,示出了用于當將偽P圖像插入到視頻信號中時幫助消除擺動圖像假象的方法500。像方法200和400一樣,方法500可以依照遠程解碼器結構來實現(xiàn),但是方法500還可以利用其它適當?shù)南到y(tǒng)來實現(xiàn)。在步驟510,可以讀取包含多個原始圖像的視頻信號,并且在步驟512,可以接收特技模式命令。作為一個例子,特技模式命令可以是凍結特技模式命令。在步驟514,可以將一個或多個偽P圖像插入到視頻信號中,其中或者利用基于場的或者利用基于幀的預測來預測偽P圖像。這些偽P圖像可以是非逐行掃描、逐行掃描或者場圖像。插入這些偽P圖像可以將視頻信號轉換為特技模式視頻信號。
在一種結構中,插入視頻信號中的第一偽P圖像可以利用基于場的預測、根據(jù)參考圖像來預測,并且可以利用基于幀的預測來預測隨后的偽P圖像。具體來講,可以根據(jù)與參考圖像相關聯(lián)的單個場來預測第一偽P圖像。如下面將解釋的那樣,此特定的預測方案可以幫助控制擺動假象。參見圖6,舉例說明了諸如過程的例子。
在圖6中,按照顯示順序示出了包含幾個非逐行掃描圖像和偽P圖像的凍結特技模式GOP 600的部分。GOP 600中的圖像上的下標編號反映圖像的預定顯示順序。例如,如果接收了凍結特技模式命令,那么可以對諸如I2的參考圖像執(zhí)行凍結,其中I2可以包括場I2t和I2b。當然,可以對GOP中的所有其它適當?shù)膮⒖紙D像執(zhí)行特技模式,所述圖像包括任何P圖像。所述參考圖像可以是非逐行掃描、逐行掃描或者是場圖像。
如果偽P圖像是框圖,即,偽P圖像包含至少兩個場,那么組成第一偽P框圖的場可以根據(jù)參考圖像的單個場來預測,所述參考圖像在此實例中是圖像I2。由此,如圖6所示,第一偽P框圖P3d的場——Pd3t和Pd3b可以根據(jù)圖像I2的單個場來預測,諸如底部場I2b。在另一個結構中,場Pd3t和Pd3b可以根據(jù)頂端場I2t預測。
隨后的偽P圖像、從圖像Pd4到圖像Pdn(其中n表示給予最后插入的偽P圖像的顯示順序編號),可以利用基于幀的預測進行預測。也就是說,跟隨第一偽P框圖的每個相繼的偽P框圖,可以利用基于幀的預測、根據(jù)先前的偽P框圖來預測。例如,按照第一偽P框圖的基于場的預測,第二偽P框圖Pd4的場Pd4t和Pd4b可以利用基于幀的預測、根據(jù)第一偽P框圖來預測。
然而,應該理解的是,隨后的偽P圖像也可以利用基于場的預測、根據(jù)先前的偽P圖像來預測。此基于場的預測包括基于單個場的預測——像涉及第一偽P圖像所描述的過程那樣——以及結合圖3B舉例說明的基于場的預測方案。盡管如此,因為第一偽P框圖利用單個場預測進行預測,所以第二偽P框圖的場以及所有隨后的偽P圖像可以是場的副本,其中第一偽P框圖根據(jù)所述場進行預測。
不過本發(fā)明決不局限于此特定的預測方案?;趩蝹€場的預測可以幫助控制擺動圖像假象,并且還有助于將特技模式視頻信號的比特率保持在可接受的程度。具體來講,當在特技模式期間使用偽P框圖、根據(jù)參考圖像的單個場來預測第一偽P框圖的場,可以生成一顯示,其中運動對象出現(xiàn)在將要顯示的偽P框圖的每個場的一個特定位置中。
也就是說,如果運動對象出現(xiàn)在用于預測第一偽P框圖的參考圖像中、并且第一偽P框圖的場根據(jù)此參考圖像的單個場進行預測的話,那么隨后的偽P框圖的每個場都將在相同的位置中包括運動對象,就像其位于單個參考場中那樣。據(jù)此,當在特技模式期間顯示偽P框圖之時,運動對象看起來不會擺動。
返回參見圖5的方法500,在判定框516,它可以確定用于預測第一偽P圖像的參考圖像是否是GOP中的最后一個原始圖像。如果是,那么方法500可以在步驟522結束。返回參見圖6,圖像P14是GOP中最后一個原始圖像的例子。再一次回到圖5,如果參考圖像不是GOP中最后一個原始圖像,那么可以跳過最后插入的偽P圖像之后的所有剩余原始圖像,如步驟518所示。
因為第一偽P圖像可以根據(jù)參考圖像的單個場來預測,所以第一偽P圖像和每個隨后的偽P圖像將根據(jù)不完整的原始圖像來預測。如果根據(jù)最后插入的偽P圖像預測到有原始圖像的話,那么原始圖像可能具有劣質(zhì)的顯示質(zhì)量。然而,不根據(jù)最后插入的偽P圖像預測所有原始圖像的話,一旦恢復正常播放,視頻信號的顯示質(zhì)量不會遭受基于單個場的預測的影響。
作為一個例子,如圖6所示,最后插入的偽P圖像Pdn之后的所有原始圖像都可以跳過。在此例子中,原始圖像B3(此刻標記為圖像B(n+1))至P14(此刻標記為P(n+12))可以跳過,并且在下一個GOP恢復視頻信號的正常播放。如果對GOP 600中的最后一個原始圖像啟動凍結特技模式,那么往往不需要跳過過程,其通??赡苁窃糋OP(在圖3中被重現(xiàn)的例子)中的圖像P14(此刻標記為圖像P(n+12))。
作為步驟518的替代,如果將對GOP中不是最后一個原始圖像的參考圖像啟動特技模式,那么可以延遲特技模式的啟動,從而對GOP中的最后一個原始圖像開始操作。例如,如果最初意欲從圖6中GOP 600的參考圖像I2開始凍結特技模式,那么可以延遲特技模式的啟動,以便它將起始于作為GOP600中的最后一個原始圖像的圖像P14(或者P(n+12))。
在步驟518的又一個替代方式中(其中對原始GOP中不是最后一個原始圖像的參考圖像啟動特技模式),一旦停止特技模式并且恢復正常播放,原始的GOP就可以被傳輸以便以正常播放速度解碼并且顯示。術語“原始的GOP”可以指的是包含原始圖像而非偽P圖像、重復的原始圖像或者跳過的原始圖像的GOP。
返回參見圖3A,GOP 300可以是原始的GOP??紤]以下例子假定對GOP300的參考圖像P8啟動凍結特技模式,并且使用基于單個場的預測來預測第一插入偽P圖像。鑒于單個場預測并且如早先解釋的那樣,最后一個插入的偽P圖像之后的原始圖像可能遇到預測問題。
依照本發(fā)明的結構,一旦停止凍結特技模式,可以向解碼器傳輸GOP 300(原始的GOP)以便解碼并且最終顯示。也就是說,跟隨凍結特技模式的結束,GOP 300中的每個原始圖像(而不是插入的偽P圖像)可以被傳輸、解碼并且顯示。本發(fā)明不局限于此特定的例子,而是可以采用其它適當?shù)奶丶寄J?,并且可以對GOP 300中的所有其它適當?shù)膮⒖紙D像啟動特技模式。返回參見圖5,方法500可以在步驟522結束。
雖然已經(jīng)結合在此公開的實施例描述了本發(fā)明,但是應該理解的是,上述描述是用來舉例說明的,而非限制本發(fā)明的范圍,本發(fā)明的范圍由權利要求書定義。
權利要求
1.一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的方法,包括以下步驟接收特技模式命令;以及利用基于場的預測和基于幀的預測當中的至少一個預測方案,將至少一個偽預測圖像有選擇地插入視頻信號中,其中所述有選擇地插入步驟將視頻信號轉換為特技模式視頻信號。
2.如權利要求1所述的方法,其中,所述有選擇地插入步驟包括以下步驟利用基于場的預測、將至少一第一偽預測圖像插入視頻信號中,并且利用基于幀的預測、將隨后的偽預測圖像插入特技模式視頻信號中。
3.如權利要求2所述的方法,還包括以下步驟根據(jù)與參考圖像相關聯(lián)的單個場來預測至少一第一偽預測圖像。
4.如權利要求3所述的方法,其中,參考圖像是從包括幀內(nèi)圖像和預測圖像的組中被選擇出來的圖像。
5.如權利要求3所述的方法,其中,參考圖像是從包括非逐行掃描圖像、逐行掃描圖像和場圖像的組中被選擇出來的圖像。
6.如權利要求3所述的方法,其中,在圖像組中包含有多個原始圖像,并且,其中用于預測至少一第一偽預測圖像的參考圖像是該組圖像的最后一個原始圖像,如此使得沒有別的原始圖像可以根據(jù)所插入的偽預測圖像被預測。
7.如權利要求6所述的方法,還包括以下步驟延遲所述有選擇地插入步驟,以允許第一偽預測圖像可以根據(jù)參考圖像被預測,其中所述參考圖像是該組圖像中的最后一個原始圖像。
8.如權利要求1所述的方法,其中,所述特技模式命令包括凍結特技模式命令。
9.如權利要求1所述的方法,其中,所述特技模式命令包括慢運動特技模式命令。
10.如權利要求1所述的方法,還包括以下步驟利用遠程解碼器解碼至少部分特技模式視頻信號。
11.如權利要求1所述的方法,其中,圖像組中具有多個原始圖像,并且所述方法還包括以下步驟跟隨所述有選擇地插入步驟之后,跳過最后插入的偽預測圖像之后的所有剩余原始圖像,以便圖像組中的最后一個圖像是最后插入的偽預測圖像。
12.如權利要求1所述的方法,其中,所述偽預測圖像包括非逐行掃描偽預測圖像。
13.如權利要求1所述的方法,其中,在不包含偽預測圖像或者重復的原始圖像的原始圖像組中具有多個原始圖像,并且所述方法還包括以下步驟在跟隨有選擇地插入步驟之后,傳輸原始的GOP以便解碼。
14.一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的方法,包括以下步驟接收特技模式命令;響應特技模式命令,有選擇地重復至少一個原始圖像,其中,所述有選擇地重復步驟將視頻信號轉換為特技模式視頻信號;以及利用基于場的預測和基于幀的預測當中的至少一個預測方案,有選擇地將至少一個偽預測圖像插入特技模式視頻信號中。
15.如權利要求14所述的方法,還包括步驟監(jiān)視特技模式視頻信號,其中,如果特技模式視頻信號的比特率超過預定閾值,就執(zhí)行所述有選擇地插入步驟。
16.如權利要求14所述的方法,其中,多個原始圖像的每一個都包含顯示指示符,并且所述方法還包括以下步驟有選擇地修改多個原始圖像的至少一部分的顯示指示符,以便當重復原始圖像或者當將偽預測圖像插入特技模式視頻信號中時,反映預定的顯示順序。
17.如權利要求16所述的方法,其中,顯示指示符是臨時參考字段。
18.如權利要求17所述的方法,其中,每個臨時參考字段可以具有整數(shù)值,并且有選擇地修改多個原始圖像的至少部分的臨時參考字段的步驟包括以下步驟每當重復原始圖像或者當將偽預測圖像插入特技模式視頻信號中時,將臨時參考字段的整數(shù)值逐漸地加1。
19.如權利要求14所述的方法,其中,所述偽預測圖像是非逐行掃描偽預測圖像。
20.一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的系統(tǒng),包括控制器,用于從存儲介質(zhì)讀數(shù)據(jù),并輸出包含多個原始圖像的視頻信號;以及處理器,其中所述處理器被編程以用來接收特技模式命令;以及利用基于場的預測和基于幀的預測中的至少一個、將至少一個偽預測圖像有選擇地插入特技模式視頻信號中,其中所述有選擇地插入步驟將視頻信號轉換為特技模式視頻信號。
21.如權利要求20所述的系統(tǒng),其中,所述處理器還被編程以便利用基于場的預測、將至少一第一偽預測圖像插入特技模式視頻信號中,并且利用基于幀的預測、將隨后的偽預測圖像插入特技模式視頻信號中。
22.如權利要求21所述的系統(tǒng),其中,所述處理器還被編程以用于根據(jù)與參考圖像相關聯(lián)的單個場來預測至少一第一偽預測圖像。
23.如權利要求22所述的系統(tǒng),其中,參考圖像是從包括幀內(nèi)圖像和預測圖像的組中被選擇出來的圖像。
24.如權利要求22所述的系統(tǒng),其中,參考圖像是從包括非逐行掃描圖像、逐行掃描圖像或者場圖像的組中被選擇出來的圖像。
25.如權利要求22所述的系統(tǒng),其中在圖像組中包含有多個原始圖像,并且用于預測至少一第一偽預測圖像的參考圖像是該組圖像中的最后一個原始圖像,如此使得沒有別的原始圖像可以根據(jù)所插入的偽預測圖像被預測。
26.如權利要求25所述的系統(tǒng),其中,所述處理器還被編程以用于延遲偽預測圖像的插入,以允許根據(jù)作為圖像組中最后一個原始圖像的參考圖像來預測第一偽預測圖像。
27.如權利要求20所述的系統(tǒng),其中所述特技模式命令是凍結特技模式命令。
28.如權利要求20所述的系統(tǒng),其中所述特技模式命令是慢運動特技模式命令。
29.如權利要求20所述的系統(tǒng),還包括遠程解碼器,用于解碼至少部分特技模式視頻信號。
30.如權利要求20所述的系統(tǒng),其中,圖像組中具有多個原始圖像,并且處理器被被編程以便跟隨有選擇地偽預測圖像的插入、跳過最后插入的偽預測圖像之后的所有剩余原始圖像,以便使圖像組中的最后一個圖像是最后插入的偽預測圖像。
31.如權利要求20所述的系統(tǒng),其中,所述偽預測圖像是非逐行掃描偽預測圖像。
32.如權利要求20所述的系統(tǒng),其中,在不包含偽預測圖像或者重復的原始圖像的原始圖像組中具有多個原始圖像,并且所述處理器還被編程以便在插入偽預測圖像之后,傳輸原始的GOP以便解碼。
33.一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的系統(tǒng),包括控制器,用于從存儲介質(zhì)讀數(shù)據(jù),并輸出包含多個原始圖像的視頻信號;以及處理器,其中,所述處理器被編程以用來接收特技模式命令;響應特技模式命令,有選擇地重復至少一個原始圖像,其中所述有選擇地重復步驟將視頻信號轉換為特技模式視頻信號;以及利用基于場的預測和基于幀的預測當中的至少一個預測方案,有選擇地將至少一個偽預測圖像插入特技模式視頻信號中。
34.如權利要求33所述的系統(tǒng),其中,所述處理器還被編程以用于監(jiān)視特技模式視頻信號,并且如果特技模式視頻信號的比特率超過預定閾值,就有選擇地插入偽預測圖像。
35.如權利要求33所述的系統(tǒng),其中,多個原始圖像的每個都包含顯示指示符,并且所述處理器還被編程以用于有選擇地修改多個原始圖像的至少部分的顯示指示符,以便當重復原始圖像或者當將偽預測圖像插入特技模式視頻信號中時,反映預定的顯示順序。
36.如權利要求35所述的系統(tǒng),其中,所述顯示指示符是臨時參考字段。
37.如權利要求36所述的系統(tǒng),其中,每個臨時參考字段可以具有整數(shù)值,并且所述處理器還被編程以用于每當重復原始圖像或者當將偽預測圖像插入特技模式視頻信號中時,將臨時參考字段的整數(shù)值逐漸地加1。
38.如權利要求33所述的系統(tǒng),其中,所述偽預測圖像是非逐行掃描偽預測圖像。
全文摘要
本發(fā)明涉及一種用于對包含多個原始圖像的視頻信號執(zhí)行特技模式的方法(200)和系統(tǒng)(100)。所述方法包括以下步驟接收(212)特技模式命令,并且利用基于場的預測和基于幀的預測當中的至少一個預測方案、有選擇地將至少一個偽預測圖像插入(216)特技模式視頻信號中。在一種結構中,所述有選擇地插入步驟可以包括以下步驟利用基于場的預測、將至少一第一偽預測圖像插入視頻信號中,并且利用基于幀的預測、將隨后的偽預測圖像插入特技模式視頻信號中。
文檔編號H04N5/85GK1575591SQ02820963
公開日2005年2月2日 申請日期2002年10月22日 優(yōu)先權日2001年10月23日
發(fā)明者林書, 唐納德·H·威利斯 申請人:湯姆森特許公司