視頻譯碼中的非正方形變換單元和預(yù)測(cè)單元的制作方法
【專利摘要】本發(fā)明提出用于幀內(nèi)預(yù)測(cè)視頻譯碼過(guò)程中的變換分割的技術(shù)。在一個(gè)實(shí)例中,對(duì)于給定經(jīng)幀內(nèi)預(yù)測(cè)塊,基于某些條件,允許減少數(shù)目的變換單元分區(qū)選項(xiàng)。在另一實(shí)例中,使變換單元從用于經(jīng)幀內(nèi)預(yù)測(cè)塊的預(yù)測(cè)單元去耦。對(duì)于給定預(yù)測(cè)單元,可應(yīng)用與所述預(yù)測(cè)單元不同大小和形狀的變換。在另一實(shí)例中,對(duì)于具有非方形狀的預(yù)測(cè)單元,允許減少數(shù)目的幀內(nèi)預(yù)測(cè)模式。
【專利說(shuō)明】視頻譯碼中的非正方形變換單元和預(yù)測(cè)單元
[0001]本申請(qǐng)案主張2011年9月12日申請(qǐng)的第61/533,703號(hào)美國(guó)臨時(shí)申請(qǐng)案、2011年9月19日申請(qǐng)的第61/536,414號(hào)美國(guó)臨時(shí)申請(qǐng)案以及2011年10月27日申請(qǐng)的第61/552,216號(hào)美國(guó)臨時(shí)申請(qǐng)案的權(quán)益,所述臨時(shí)申請(qǐng)案中的每一者的整個(gè)內(nèi)容以引用的方式并入本文中。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及視頻譯碼,且更明確地說(shuō),涉及在譯碼視頻數(shù)據(jù)時(shí)為經(jīng)幀內(nèi)預(yù)測(cè)塊選擇和信令變換單元和預(yù)測(cè)單元分區(qū)的技術(shù)。
【背景技術(shù)】
[0003]數(shù)字視頻能力可并入到較寬范圍的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無(wú)線廣播系統(tǒng)、個(gè)人數(shù)字助理(PDA)、膝上型或桌上型計(jì)算機(jī)、數(shù)字相機(jī)、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺(tái)、蜂窩式或衛(wèi)星無(wú)線電電話、視頻電話會(huì)議裝置等。數(shù)字視頻裝置實(shí)施視頻壓縮技術(shù),例如由MPEG-2、MPEG-4、ITU-T H.263,ITU-T H.264/MPEG-4,第10部分,高級(jí)視頻譯碼(AVC)界定的標(biāo)準(zhǔn),或目前正在開發(fā)的高效視頻譯碼(HEVC)標(biāo)準(zhǔn)或此些標(biāo)準(zhǔn)的擴(kuò)展中所描述的那些技術(shù),以更高效地發(fā)射、接收和存儲(chǔ)數(shù)字視頻信息。
[0004]視頻壓縮技術(shù)包含空間預(yù)測(cè)和/或時(shí)間預(yù)測(cè)以減少或去除視頻序列中固有的冗余。對(duì)于基于塊的視頻譯碼,可將一視頻幀或切片分割成若干塊。可進(jìn)一步分割每一塊。相對(duì)于經(jīng)幀內(nèi)譯碼(I)幀或片中的相鄰塊中的參考樣本,使用空間預(yù)測(cè)來(lái)編碼同一幀或片中的塊。經(jīng)幀間譯碼(P或B)幀或片中的塊可相對(duì)于同一幀或片中的相鄰塊中的參考樣本使用空間預(yù)測(cè),或相對(duì)于其它參考幀中的參考樣本使用時(shí)間預(yù)測(cè)??臻g或時(shí)間預(yù)測(cè)得出待譯碼的塊的預(yù)測(cè)塊。殘差數(shù)據(jù)表示待譯碼的原始?jí)K與預(yù)測(cè)塊之間的像素差。
[0005]根據(jù)指向形成所述預(yù)測(cè)塊的參考樣本塊的運(yùn)動(dòng)向量以及指示經(jīng)譯碼塊與預(yù)測(cè)塊之間的差的殘差數(shù)據(jù)來(lái)編碼經(jīng)幀間譯碼的塊。根據(jù)幀內(nèi)譯碼模式和殘差數(shù)據(jù)來(lái)編碼經(jīng)幀內(nèi)譯碼的塊。為了進(jìn)一步壓縮,可將殘差數(shù)據(jù)從像素域變換到變換域,從而得出接著可量化的殘差變換系數(shù)??梢蕴囟ù涡驋呙杞?jīng)量化變換系數(shù)(初始布置成二維陣列),以產(chǎn)生變換系數(shù)的一維向量用于熵譯碼。
【發(fā)明內(nèi)容】
[0006]一般來(lái)說(shuō),本發(fā)明描述用于譯碼視頻數(shù)據(jù)的技術(shù)。本發(fā)明描述用于在允許非正方形變換分區(qū)的視頻編碼過(guò)程中選擇和信令變換分區(qū)的技術(shù)。在一些實(shí)例中,基于幀內(nèi)預(yù)測(cè)譯碼模式選擇變換分區(qū)。在其它實(shí)例中,變換分區(qū)不取決于預(yù)測(cè)單元的大小和形狀,而是可獨(dú)立地選自對(duì)預(yù)測(cè)殘差的測(cè)試。另外,本發(fā)明描述用于通過(guò)減少可用于短距幀內(nèi)預(yù)測(cè)(SDIP)分區(qū)的幀內(nèi)模式集合的數(shù)目來(lái)減小經(jīng)編碼視頻位速率且降低編碼器復(fù)雜性的技術(shù)。
[0007]在本發(fā)明的一個(gè)實(shí)例中,一種視頻編碼器可經(jīng)配置以從視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)中確定一預(yù)測(cè)單元分區(qū),且基于所確定的預(yù)測(cè)單元分區(qū)確定一組幀內(nèi)預(yù)測(cè)模式。在一個(gè)實(shí)例中,所確定的預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。在另一實(shí)例中,所確定的預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
[0008]在本發(fā)明的另一實(shí)例中,一種視頻編碼器可進(jìn)一步經(jīng)配置以從視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式確定一幀內(nèi)預(yù)測(cè)模式,基于所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū),且使用所確定的變換單元分區(qū)來(lái)編碼視頻數(shù)據(jù)塊。
[0009]在本發(fā)明的另一實(shí)例中,視頻編碼器可經(jīng)配置以基于幀內(nèi)預(yù)測(cè)模式從一組變換單元分區(qū)確定所述變換單元分區(qū)。在一個(gè)實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。在另一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。在又一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
[0010]在本發(fā)明的另一實(shí)例中,一種視頻解碼器可經(jīng)配置以接收來(lái)自視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)中的一預(yù)測(cè)單元分區(qū)的指示,且基于所述預(yù)測(cè)單元分區(qū)確定一組幀內(nèi)預(yù)測(cè)模式。在一個(gè)實(shí)例中,所述預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。在另一實(shí)例中,所述預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
[0011]在本發(fā)明的另一實(shí)例中,一種視頻解碼器可進(jìn)一步經(jīng)配置以接收來(lái)自視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式的一幀內(nèi)預(yù)測(cè)模式的指示,基于所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū),且使用所確定的變換單元分區(qū)來(lái)解碼視頻數(shù)據(jù)塊。
[0012]在本發(fā)明的另一實(shí)例中,視頻編碼器可經(jīng)配置以基于幀內(nèi)預(yù)測(cè)模式從一組變換單元分區(qū)確定所述變換單元分區(qū)。在一個(gè)實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。在另一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。在又一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
[0013]還將在方法、設(shè)備、裝置和計(jì)算機(jī)可讀存儲(chǔ)媒體的方面描述本發(fā)明的實(shí)例。
[0014]在附圖及下文描述中陳述一個(gè)或一個(gè)以上實(shí)例的細(xì)節(jié)。將從描述和圖式且從所附權(quán)利要求書明白其它特征、目標(biāo)和優(yōu)點(diǎn)。
【專利附圖】
【附圖說(shuō)明】
[0015]圖1是說(shuō)明根據(jù)本發(fā)明的實(shí)例而操作的實(shí)例視頻編碼和解碼系統(tǒng)的框圖。
[0016]圖2是說(shuō)明實(shí)例幀內(nèi)預(yù)測(cè)模式方向的概念圖。
[0017]圖3是實(shí)例四叉樹塊結(jié)構(gòu)的概念圖。
[0018]圖4A是實(shí)例垂直定向非正方形變換和預(yù)測(cè)分區(qū)的概念圖。
[0019]圖4B是實(shí)例水平定向非正方形變換和預(yù)測(cè)分區(qū)的概念圖。
[0020]圖5A是經(jīng)幀內(nèi)預(yù)測(cè)塊的實(shí)例正方形變換單元分區(qū)的概念圖。
[0021]圖5B是經(jīng)幀內(nèi)預(yù)測(cè)塊的實(shí)例非正方形變換單元分區(qū)的概念圖。[0022]圖6是用于幀內(nèi)預(yù)測(cè)的實(shí)例預(yù)測(cè)單元的概念圖。
[0023]圖7是說(shuō)明根據(jù)本發(fā)明的實(shí)例而操作的實(shí)例視頻編碼器的框圖。
[0024]圖8是說(shuō)明根據(jù)本發(fā)明的實(shí)例而操作的實(shí)例視頻解碼器的框圖。
[0025]圖9是描繪根據(jù)本發(fā)明實(shí)例的實(shí)例視頻編碼方法的流程圖。
[0026]圖10是描繪根據(jù)本發(fā)明實(shí)例的實(shí)例視頻解碼方法的流程圖。
【具體實(shí)施方式】
[0027]—般來(lái)說(shuō),本發(fā)明描述用于譯碼視頻數(shù)據(jù)的技術(shù)。本發(fā)明描述用于在視頻譯碼過(guò)程中選擇和信令變換單元(TU)分區(qū)和/或預(yù)測(cè)單元(PU)分區(qū)的技術(shù)。明確地說(shuō),本發(fā)明的實(shí)例技術(shù)允許使用非正方形TU分區(qū)和/或非正方形I3U變換。
[0028]對(duì)于經(jīng)幀內(nèi)預(yù)測(cè)的塊,由于TU與耦合在一起(即,其具有相同大小和/或形狀),因此檢查塊內(nèi)的TU分區(qū)的不同選項(xiàng)可涉及執(zhí)行多次預(yù)測(cè)和重構(gòu),因?yàn)槊恳晃ㄒ?TU分區(qū)與一唯一 PU分區(qū)匹配。因此,在正檢查和信令額外非正方形分區(qū)的情況下,編碼復(fù)雜性變得相當(dāng)高。此高編碼器復(fù)雜性可使得在一些情形中除正方形變換之外使用非正方形變換來(lái)譯碼經(jīng)幀內(nèi)預(yù)測(cè)塊不切實(shí)際。鑒于這些缺點(diǎn),本發(fā)明旨在以降低的復(fù)雜性實(shí)現(xiàn)經(jīng)幀內(nèi)預(yù)測(cè)塊的非正方形TU分區(qū),同時(shí)保留譯碼效率。
[0029]本發(fā)明呈現(xiàn)用于解決這些缺點(diǎn)的若干技術(shù)。作為一個(gè)實(shí)例,對(duì)于給定經(jīng)幀內(nèi)預(yù)測(cè)塊,基于某些條件,允許減少數(shù)目的TU分區(qū)選項(xiàng)。在另一實(shí)例中,本發(fā)明提出將TU從經(jīng)幀內(nèi)預(yù)測(cè)塊的I3U去耦。對(duì)于給定PU,可應(yīng)用與對(duì)應(yīng)I3U不同大小和形狀的TU。在此情況下,用以變換特定PU的殘差數(shù)據(jù)的至少一些TU可具有與此些不同的大小和/或形狀。因此,檢查不同TU分區(qū)將不要求單獨(dú)獲得所述塊的對(duì)應(yīng)預(yù)測(cè),因?yàn)榭蓪⒉煌琓U形狀應(yīng)用于從一個(gè)PU大小和形狀獲得的預(yù)測(cè)。
[0030]當(dāng)例如結(jié)合短距幀內(nèi)預(yù)測(cè)(SDIP)使用非正方形I3U時(shí),每一 PU可使用多個(gè)幀內(nèi)預(yù)測(cè)模式/方向(例如,圖2的35種模式)中的一者。此布置存在若干缺點(diǎn)。首先,為了將選定模式用信號(hào)通知給每一 PU的解碼器,在經(jīng)編碼視頻位流中信令選定模式的索引。由于將使用哪一幀內(nèi)預(yù)測(cè)的不確定性較高(即,可存在35種模式),因此使用相對(duì)較大數(shù)目的位來(lái)編碼所述索引,這增加了經(jīng)壓縮視頻的位速率。第二,編碼器可能必須檢查每個(gè)模式來(lái)確定最佳模式來(lái)使用,或至少識(shí)別滿足要求(例如速率失真閾值)的模式。對(duì)于每一 PU可能的所有幀內(nèi)預(yù)測(cè)模式/方向,此檢查過(guò)程增加編碼器處的計(jì)算負(fù)擔(dān)。
[0031]本發(fā)明提出用于通過(guò)減少用于正方形和非正方形SDIP分區(qū)的可能幀內(nèi)預(yù)測(cè)模式的數(shù)目來(lái)減小經(jīng)編碼視頻位速率且降低編碼器復(fù)雜性的技術(shù)??赡軒瑑?nèi)預(yù)測(cè)模式的數(shù)目的此減少是基于以下觀察:對(duì)于經(jīng)垂直分區(qū)的CU(例如,hNX2N TO),較可能選擇垂直或幾乎垂直的幀內(nèi)預(yù)測(cè)模式(例如,模式1、22、23...)作為最佳模式。類似地,對(duì)于經(jīng)水平分區(qū)的⑶(例如,2NxhN I3U),較可能選擇水平或幾乎水平幀內(nèi)預(yù)測(cè)模式(例如,模式2、30、31...)作為最佳模式。就是說(shuō),將可能選擇此些模式,因?yàn)槠溽槍?duì)給定分區(qū)類型較可能產(chǎn)生較有利的速率失真結(jié)果。
[0032]圖1是說(shuō)明根據(jù)本發(fā)明實(shí)例的可經(jīng)配置以利用幀內(nèi)預(yù)測(cè)譯碼技術(shù)的實(shí)例視頻編碼和解碼系統(tǒng)10的框圖。如圖1中所示,系統(tǒng)10包含源裝置12,其經(jīng)由通信信道16將經(jīng)編碼的視頻發(fā)射到目的地裝置14。經(jīng)編碼視頻數(shù)據(jù)還可存儲(chǔ)在存儲(chǔ)媒體34或文件服務(wù)器36上,且可由目的地裝置14在需要時(shí)存取。當(dāng)存儲(chǔ)到存儲(chǔ)媒體或文件服務(wù)器時(shí),視頻編碼器20可將經(jīng)譯碼視頻數(shù)據(jù)提供給另一裝置,例如用于將經(jīng)譯碼視頻數(shù)據(jù)存儲(chǔ)到存儲(chǔ)媒體的網(wǎng)絡(luò)接口、壓縮光盤(CD)、藍(lán)光或數(shù)字視頻光盤(DVD)燒錄器或沖壓設(shè)施裝置,或其它裝置。同樣地,與視頻解碼器30分開的裝置,例如網(wǎng)絡(luò)接口、CD或DVD讀取器等,可從存儲(chǔ)媒體檢索經(jīng)譯碼視頻數(shù)據(jù),并將檢索到的數(shù)據(jù)提供給視頻解碼器30。
[0033]源裝置12和目的地裝置14可包括各種各樣的裝置中的任一者,包含桌上型計(jì)算機(jī)、筆記本型(即,膝上型)計(jì)算機(jī)、平板計(jì)算機(jī)、機(jī)頂盒、電話手持機(jī)(例如所謂的智能電話)、電視機(jī)、相機(jī)、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺(tái)等。在許多情況下,此些裝置可為無(wú)線通信而配備。因此,通信信道16可包括適合傳輸經(jīng)編碼視頻數(shù)據(jù)的無(wú)線信道、有線信道或無(wú)線與有線信道的組合。類似地,目的地裝置14可經(jīng)由任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)接入文件服務(wù)器36。這可包含無(wú)線信道(例如,W1-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器等),或兩者的組合,其適合存取存儲(chǔ)在文件服務(wù)器上的經(jīng)編碼視頻數(shù)據(jù)。
[0034]根據(jù)本發(fā)明的實(shí)例,幀內(nèi)預(yù)測(cè)譯碼技術(shù)可應(yīng)用于支持多種多媒體應(yīng)用(例如空中電視廣播、有線電視發(fā)射、衛(wèi)星電視發(fā)射、流式視頻發(fā)射(例如經(jīng)由因特網(wǎng)))中的任一者的視頻譯碼,編碼數(shù)字視頻以供存儲(chǔ)在數(shù)據(jù)存儲(chǔ)媒體上、解碼存儲(chǔ)在數(shù)據(jù)存儲(chǔ)媒體上的數(shù)字視頻,或其它應(yīng)用。在一些實(shí)例中,源裝置10可經(jīng)配置以支持單向或雙向視頻發(fā)射以支持例如視頻流式傳輸、視頻重放、視頻廣播和/或視頻電話等應(yīng)用。
[0035]在圖1的實(shí)例中,源裝置12包含視頻源18、視頻編碼器20、調(diào)制器/解調(diào)器22以及發(fā)射器24。在源裝置12中,視頻源18可包含例如視頻捕獲裝置等來(lái)源,例如視頻相機(jī)、含有先前所捕獲視頻的視頻存檔、用以接收來(lái)自視頻內(nèi)容提供者的視頻的視頻饋送接口,和/或用于產(chǎn)生計(jì)算機(jī)圖形數(shù)據(jù)作為源視頻的計(jì)算機(jī)圖形系統(tǒng),或此些來(lái)源的組合。作為一個(gè)實(shí)例,如果視頻源18為視頻相機(jī),那么源裝置12及目的地裝置14可形成所謂的相機(jī)電話或視頻電話。然而,本發(fā)明中所描述的技術(shù)可適用于一般視頻譯碼,且可應(yīng)用于無(wú)線和/或有線應(yīng)用,或其中將經(jīng)編碼視頻數(shù)據(jù)存儲(chǔ)在本地磁盤上的應(yīng)用。
[0036]所捕獲、預(yù)捕獲或計(jì)算機(jī)產(chǎn)生的視頻可由視頻編碼器20編碼。經(jīng)編碼的視頻信息可由調(diào)制解調(diào)器22根據(jù)通信標(biāo)準(zhǔn)(例如無(wú)線通信協(xié)議)來(lái)調(diào)制,且經(jīng)由發(fā)射器24發(fā)射到目的地裝置14。調(diào)制解調(diào)器22可包含經(jīng)設(shè)計(jì)以用于信號(hào)調(diào)制的各種混頻器、濾波器、放大器或其它組件。發(fā)射器24可包含經(jīng)設(shè)計(jì)以用于發(fā)射數(shù)據(jù)的電路,包含放大器、濾波器及一個(gè)或一個(gè)以上天線。
[0037]由視頻編碼器20編碼的所捕獲、預(yù)捕獲或計(jì)算機(jī)產(chǎn)生的視頻還可存儲(chǔ)到存儲(chǔ)媒體34或文件服務(wù)器36上以供以后消耗。存儲(chǔ)媒體34可包含藍(lán)光光盤、DVD、⑶-ROM、快閃存儲(chǔ)器,或任何其它用于存儲(chǔ)經(jīng)編碼視頻的合適數(shù)字存儲(chǔ)媒體。存儲(chǔ)在存儲(chǔ)媒體34上的經(jīng)編碼視頻可接著由目的地裝置14存取,以用于解碼和重放。
[0038]文件服務(wù)器36可為能夠存儲(chǔ)經(jīng)編碼視頻且將所述經(jīng)編碼視頻發(fā)射到目的地裝置14的任何類型的服務(wù)器。實(shí)例文件服務(wù)器包含網(wǎng)絡(luò)服務(wù)器(例如,用于網(wǎng)站)、FTP服務(wù)器、網(wǎng)絡(luò)附接存儲(chǔ)(NAS)裝置、本地磁盤驅(qū)動(dòng)器,或能夠存儲(chǔ)經(jīng)編碼視頻數(shù)據(jù)并將其發(fā)射到目的地裝置的任何其它類型的裝置。經(jīng)編碼視頻數(shù)據(jù)從文件服務(wù)器36的發(fā)射可為流式發(fā)射、下載發(fā)射或兩者的組合。目的地裝置14可經(jīng)由任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)接入文件服務(wù)器36。這可包含無(wú)線信道(例如,W1-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器、以太網(wǎng)、USB等),或兩者的組合,其適合存取存儲(chǔ)在文件服務(wù)器上的經(jīng)編碼視頻數(shù)據(jù)。
[0039]在圖1的實(shí)例中,目的地裝置14包含接收器26、調(diào)制解調(diào)器28、視頻解碼器30以及顯示裝置32。目的地裝置14的接收器26經(jīng)由信道16接收信息,且調(diào)制解調(diào)器28解調(diào)所述信息以為視頻解碼器30產(chǎn)生經(jīng)解調(diào)位流。經(jīng)由信道16傳送的信息可包含由視頻編碼器20產(chǎn)生的多種語(yǔ)法信息,以供視頻解碼器30在解碼視頻數(shù)據(jù)時(shí)使用。此語(yǔ)法還可與存儲(chǔ)在存儲(chǔ)媒體34或文件服務(wù)器36上的經(jīng)編碼視頻數(shù)據(jù)包含在一起。視頻編碼器20和視頻解碼器30中的每一者可形成能夠編碼或解碼視頻數(shù)據(jù)的相應(yīng)編碼器-解碼器(CODEC)的部分。
[0040]顯示裝置32可與目的地裝置14集成或可在目的地裝置14外部。在一些實(shí)例中,目的地裝置14可包含集成顯示裝置,且還可經(jīng)配置以與外部顯示裝置交互。在其它實(shí)例中,目的地裝置14可為顯示裝置。一般來(lái)說(shuō),顯示裝置32向用戶顯示經(jīng)解碼的視頻數(shù)據(jù),且可包括多種顯示裝置中的任一者,例如液晶顯示器(LCD)、等離子體顯示器、有機(jī)發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。
[0041]在圖1的實(shí)例中,通信信道16可包含任何無(wú)線或有線通信媒體,例如,射頻(RF)頻譜或一個(gè)或一個(gè)以上物理傳輸線、或無(wú)線和有線媒體的任一組合。通信信道16可形成例如局域網(wǎng)、廣域網(wǎng)或例如因特網(wǎng)等全局網(wǎng)絡(luò)的基于包的網(wǎng)絡(luò)的部分。通信信道16 —般表示用于將視頻數(shù)據(jù)從源裝置12發(fā)射到目的地裝置14的任何合適的通信媒體或不同通信媒體的集合,包括有線或無(wú)線媒體的任何合適組合。通信信道16可包含可用于促進(jìn)從源裝置12到目的裝置14的通信的路由器、交換器、基站或任何其它設(shè)備。
[0042]視頻編碼器20和視頻解碼器30可根據(jù)視頻壓縮標(biāo)準(zhǔn)來(lái)操作,例如目前在開發(fā)的高效視頻譯碼(HEVC)標(biāo)準(zhǔn),且可符合HEVC測(cè)試模型(HM)?;蛘?,視頻編碼器20和視頻解碼器30可根據(jù)其它專有或行業(yè)標(biāo)準(zhǔn)來(lái)操作,例如ITU-T H.264標(biāo)準(zhǔn),或者稱為MPEG-4,部分10,高級(jí)視頻譯碼(AVC),或此些標(biāo)準(zhǔn)的擴(kuò)展。然而,本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn)。其它實(shí)例包括MPEG-2和ITU-T H.263。
[0043]盡管圖1中未展示,但在一些方面中,視頻編碼器20和視頻解碼器30可各自與音頻編碼器和解碼器集成,且可包含適當(dāng)?shù)亩嗦窂?fù)用器-多路分用器(MUX-DEMUX)單元或其它硬件及軟件,以處置對(duì)共同數(shù)據(jù)流或單獨(dú)數(shù)據(jù)流中的音頻與視頻兩者的編碼。在一些實(shí)例中,如果適用,MUX-DEMUX單元可符合ITU H.223多路復(fù)用器協(xié)議或例如用戶數(shù)據(jù)報(bào)協(xié)議(UDP)等其它協(xié)議。
[0044]視頻編碼器20和視頻解碼器30各自可經(jīng)實(shí)施為例如一個(gè)或一個(gè)以上微處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合的多種合適編碼器電路中的任一者。當(dāng)所述技術(shù)部分以軟件來(lái)實(shí)施時(shí),裝置可將用于所述軟件的指令存儲(chǔ)在合適的非暫時(shí)計(jì)算機(jī)可讀媒體中,且使用一個(gè)或一個(gè)以上處理器來(lái)在硬件中執(zhí)行所述指令以實(shí)施本發(fā)明的技術(shù)。視頻編碼器20和視頻解碼器30中的每一者可包含在一個(gè)或一個(gè)以上編碼器或解碼器中,其中的任一者可集成為相應(yīng)裝置中的組合式視頻編碼器/解碼器(CODEC)的部分。
[0045]視頻編碼器20可實(shí)施本發(fā)明的用于視頻編碼過(guò)程中的幀內(nèi)預(yù)測(cè)譯碼的技術(shù)中的任一者或全部。同樣地,視頻解碼器30可實(shí)施用于視頻譯碼過(guò)程中的幀內(nèi)預(yù)測(cè)譯碼的這些技術(shù)中的任一者或全部。如本發(fā)明中所描述,視頻譯碼器可指代視頻編碼器或視頻解碼器。類似地,視頻譯碼單元可指代視頻編碼器或視頻解碼器。同樣地,視頻譯碼可指代視頻編碼或視頻解碼。
[0046]根據(jù)下文進(jìn)一步詳細(xì)論述的本發(fā)明的實(shí)例,視頻編碼器20可經(jīng)配置以從視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)中確定一預(yù)測(cè)單元分區(qū),且基于所確定的預(yù)測(cè)單元分區(qū)確定一組幀內(nèi)預(yù)測(cè)模式。在一個(gè)實(shí)例中,所確定的預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。在另一實(shí)例中,所確定的預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
[0047]在本發(fā)明的另一實(shí)例中,視頻編碼器20可進(jìn)一步經(jīng)配置以從視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式確定一幀內(nèi)預(yù)測(cè)模式,基于所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū),且使用所確定的變換單元分區(qū)來(lái)編碼視頻數(shù)據(jù)塊。
[0048]在本發(fā)明的另一實(shí)例中,視頻編碼器20可經(jīng)配置以基于幀內(nèi)預(yù)測(cè)模式從一組變換單元分區(qū)確定所述變換單元分區(qū)。在一個(gè)實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。在另一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。在又一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
[0049]在本發(fā)明的另一實(shí)例中,視頻解碼器30可經(jīng)配置以接收來(lái)自視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)中的一預(yù)測(cè)單元分區(qū)的指示,且基于所述預(yù)測(cè)單元分區(qū)確定一組幀內(nèi)預(yù)測(cè)模式。在一個(gè)實(shí)例中,所述預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。在另一實(shí)例中,所述預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
[0050]在本發(fā)明的另一實(shí)例中,視頻解碼器30可進(jìn)一步經(jīng)配置以接收來(lái)自視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式的一幀內(nèi)預(yù)測(cè)模式的指示,基于所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū),且使用所確定的變換單元分區(qū)來(lái)解碼視頻數(shù)據(jù)塊。
[0051]在本發(fā)明的另一實(shí)例中,視頻解碼器30可經(jīng)配置以基于幀內(nèi)預(yù)測(cè)模式從一組變換單元分區(qū)確定所述變換單元分區(qū)。在一個(gè)實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。在另一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。在又一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
[0052]數(shù)字視頻裝置實(shí)施視頻壓縮技術(shù)來(lái)較高效地編碼和解碼數(shù)字視頻信息。視頻壓縮可應(yīng)用空間(幀內(nèi))預(yù)測(cè)和/或時(shí)間(幀間)預(yù)測(cè)技術(shù)以減少或去除視頻序列中固有的冗余。
[0053]典型的視頻編碼器將原始視頻序列的每一幀分區(qū)成稱為“塊”或“譯碼單元”的連續(xù)矩形區(qū)。在“幀內(nèi)模式”(I模式)下或在“幀間模式”(P模式或B模式)下編碼這些塊。
[0054]對(duì)于P模式,編碼器首先搜索與由Fref表示的“參考幀”中正編碼的塊類似的塊。搜索通常受限于不多于從待編碼塊的某一空間位移。當(dāng)已識(shí)別到最佳匹配或“預(yù)測(cè)”時(shí),其以二維(2D)運(yùn)動(dòng)向量(ΛΧ、Ay)的形式表達(dá),其中Λ X為水平位移,且Ay為垂直位移。遠(yuǎn)動(dòng)向量與參考幀一起用以構(gòu)造預(yù)測(cè)性塊Fpral,如下:
[0055]Fpred (X,y) = Fref (χ+Δχ, y+Δ y)
[0056]像素在幀內(nèi)的位置由(X,y)表示。對(duì)于在I模式下編碼的塊,使用來(lái)自同一幀內(nèi)的先前經(jīng)編碼相鄰塊的空間預(yù)測(cè)來(lái)形成預(yù)測(cè)性塊。對(duì)于I模式和P或B模式兩者,預(yù)測(cè)誤差(即,正編碼的塊中的像素值與預(yù)測(cè)性塊中的像素值之間的差)表示為某一離散變換(例如離散余弦變換(DCT))的一組經(jīng)加權(quán)基礎(chǔ)函數(shù)??苫诓煌笮〉膲K(例如4X4、8X8或16X16以及更大)執(zhí)行變換。變換塊的形狀不總是正方形的。還可使用例如具有16x4、32X8等變換塊大小的矩形形狀變換塊。
[0057]隨后量化權(quán)重(即,變換系數(shù))。量化引入信息損失,且由此,經(jīng)量化系數(shù)具有比原始變換系數(shù)低的精度??蓡为?dú)地預(yù)測(cè)、量化和變換像素的亮度和色度分量。就是說(shuō),可將譯碼過(guò)程應(yīng)用于像素的亮度分量塊,以及應(yīng)用于像素的一個(gè)或一個(gè)以上色度分量的塊。
[0058]經(jīng)量化變換系數(shù)和運(yùn)動(dòng)向量是“語(yǔ)法元素”的實(shí)例。這些語(yǔ)法元素加上一些控制信息形成視頻序列的經(jīng)譯碼表示。還可對(duì)語(yǔ)法元素進(jìn)行熵譯碼,從而進(jìn)一步減少其表示所需的位的數(shù)目。熵譯碼是旨在通過(guò)利用其分布的特性(一些符號(hào)比其它服務(wù)出現(xiàn)得頻繁)來(lái)最小化表示所發(fā)射或所存儲(chǔ)符號(hào)(在我們的情況下為語(yǔ)法元素)所需的位的數(shù)目的無(wú)損操作。
[0059]在解碼器中,通過(guò)首先以與編碼器中相同的方式構(gòu)造其預(yù)測(cè),且通過(guò)將經(jīng)壓縮預(yù)測(cè)誤差添加到所述預(yù)測(cè)來(lái)獲得當(dāng)前幀中的塊。通過(guò)使用經(jīng)量化系數(shù)對(duì)變換基礎(chǔ)函數(shù)進(jìn)行加權(quán)以產(chǎn)生像素差值來(lái)找到經(jīng)壓縮預(yù)測(cè)誤差。所重構(gòu)的幀與原始幀之間的差稱為重構(gòu)誤差。
[0060]可通過(guò)調(diào)整量化變換系數(shù)時(shí)所使用的量化參數(shù)(QP)的值來(lái)控制壓縮比,即用來(lái)表示原始序列和經(jīng)壓縮序列的位數(shù)目的比率。壓縮比可取決于所使用的熵譯碼的方法。[0061 ] 存在新的視頻譯碼標(biāo)準(zhǔn),即正由ITU-T視頻譯碼專家組(VCEG)和ISO-1EC運(yùn)動(dòng)圖片專家組(MPEG)的視頻譯碼聯(lián)合協(xié)作團(tuán)隊(duì)(JCT-VC)開發(fā)的高效視頻譯碼(HEVC)。布羅斯等人在文獻(xiàn)JCTVC-11003,“高效視頻譯碼(HEVC)文本規(guī)范草案7”(ITU-T SG16WP3和IS0/IEC JTC1/SC29/WG11的視頻譯碼聯(lián)合協(xié)作團(tuán)隊(duì)(JCT-VC)第9次會(huì)議)中描述HEVC標(biāo)準(zhǔn)的最新草案,稱為“HEVC工作草案7”或“WD7”:日內(nèi)瓦,CH,2012年4月27日至5月7日,截止 2012 年 8 月 21 日為止,其可從 http://phenix.1nt-evry.fr/jet/doc_end_user/documents/9_Geneva/wgll/JCTVC-11003-v6.zip 下載。
[0062]作為一個(gè)實(shí)例,對(duì)于根據(jù)目前正由JCT-VC開發(fā)的HEVC標(biāo)準(zhǔn)的視頻譯碼,可將視頻幀分區(qū)為若干譯碼單元。譯碼單元(CU)通常指代充當(dāng)對(duì)其應(yīng)用各種譯碼工具以進(jìn)行視頻壓縮的基礎(chǔ)單元的圖像區(qū)。CU通常具有亮度分量,表示為Y,以及兩個(gè)色度分量,表示為U和V。取決于視頻取樣格式,在樣本數(shù)目方面,U和V分量的大小可與Y分量的大小相同或不同。CU通常是正方形的,且可被視為類似于所謂的宏塊,例如根據(jù)其它視頻譯碼標(biāo)準(zhǔn),例如 ITU-T H.264。
[0063]為了實(shí)現(xiàn)較佳譯碼效率,譯碼單元可取決于視頻內(nèi)容具有可變大小。另外,可將CU分裂成較小的塊以進(jìn)行預(yù)測(cè)或變換。明確地說(shuō),每一 CU可進(jìn)一步被分區(qū)成預(yù)測(cè)單元(PU)和變換單元(TU)。根據(jù)其它視頻譯碼標(biāo)準(zhǔn)(例如H.264),可將PU視為類似于所謂的分區(qū)。變換單元(TU)指代可對(duì)其應(yīng)用變換以產(chǎn)生變換系數(shù)的殘差數(shù)據(jù)塊。
[0064]出于說(shuō)明的目的,本申請(qǐng)案中將描述根據(jù)正開發(fā)的HEVC標(biāo)準(zhǔn)的當(dāng)前所提出方面中的一些方面的譯碼。然而,本發(fā)明中所描述的技術(shù)可對(duì)其它視頻譯碼過(guò)程有用,例如根據(jù)ITU-T H.264或其它標(biāo)準(zhǔn)所定義的過(guò)程或?qū)S幸曨l譯碼過(guò)程。
[0065]HEVC標(biāo)準(zhǔn)化努力是基于視頻譯碼裝置的稱為HEVC測(cè)試模型(HM)的模型。HM假定視頻譯碼裝置有優(yōu)于根據(jù)例如ITU-T H.264/AVC的裝置的若干能力。舉例來(lái)說(shuō),H.264提供九種幀內(nèi)預(yù)測(cè)編碼模式,而HM提供多達(dá)三十五種幀內(nèi)預(yù)測(cè)編碼模式。
[0066]HEVC中的三十五種幀內(nèi)預(yù)測(cè)模式包含一種DC模式、一種平面模式以及33種不同的定向預(yù)測(cè)模式。對(duì)于定向預(yù)測(cè)模式,沿所述模式所指示的某一方向基于相鄰塊經(jīng)重構(gòu)像素執(zhí)行預(yù)測(cè)。圖2中展示與不同預(yù)測(cè)模式相關(guān)聯(lián)的方向(O到34)。
[0067]根據(jù)HM,⑶可包含一個(gè)或一個(gè)以上PU和/或一個(gè)或一個(gè)以上TU。位流中的語(yǔ)法數(shù)據(jù)可界定最大譯碼單元(IXU),其為依據(jù)像素?cái)?shù)目的最大⑶。一般來(lái)說(shuō),⑶具有與H.264的宏塊類似的目的,只是⑶不具有大小差別。因此,⑶可分裂為若干子⑶。一般來(lái)說(shuō),本發(fā)明中對(duì)CU的參考可指代圖片的最大譯碼單元或LCU的子CU??蓪CU分裂為若干子CU,且每一子CU可進(jìn)一步分裂為若干子CU。用于位流的語(yǔ)法數(shù)據(jù)可界定LCU可分裂的最大次數(shù),稱為CU深度。因此,位流還可界定最小譯碼單元(SCU)。本發(fā)明還使用術(shù)語(yǔ)“塊”、“分區(qū)”或“部分”來(lái)指代⑶、PU或TU中的任一者。一般來(lái)說(shuō),“部分”可指代視頻幀的任一子集。
[0068]IXU可與四叉樹數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)。一般來(lái)說(shuō),四叉樹數(shù)據(jù)結(jié)構(gòu)每⑶包含一個(gè)節(jié)點(diǎn),其中根節(jié)點(diǎn)對(duì)應(yīng)于IXU。如果⑶分裂為四個(gè)子⑶,那么對(duì)應(yīng)于⑶的節(jié)點(diǎn)包含四個(gè)葉節(jié)點(diǎn),其各自對(duì)應(yīng)于子CU中的一者。四叉樹數(shù)據(jù)結(jié)構(gòu)的每一節(jié)點(diǎn)可提供用于對(duì)應(yīng)CU的語(yǔ)法數(shù)據(jù)。舉例來(lái)說(shuō),四分?jǐn)?shù)中的節(jié)點(diǎn)可包含分裂旗標(biāo),指示對(duì)應(yīng)于所述節(jié)點(diǎn)的CU是否被分裂為子CU。CU的語(yǔ)法元素可遞歸地界定,且可取決于CU是否分裂為子CU。如果不進(jìn)一步分裂⑶,那么將其稱為葉⑶。
[0069]此外,葉⑶的TU還可與相應(yīng)的四叉樹數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)。就是說(shuō),葉⑶可包含指示如何將葉CU分割為TU的四叉樹。本發(fā)明將指示如何分割LCU的四叉樹稱為CU四叉樹,且將指示如何將葉CU分割為TU的四叉樹稱為TU四叉樹。TU四叉樹的根節(jié)點(diǎn)通常對(duì)應(yīng)于葉CU,而CU四叉樹的根節(jié)點(diǎn)通常對(duì)應(yīng)于LCU。TU四叉樹的不再分裂的TU稱為葉TU。
[0070]葉⑶可包含一個(gè)或一個(gè)以上預(yù)測(cè)單元(PU)。一般來(lái)說(shuō),I3U表示對(duì)應(yīng)⑶的全部或一部分,且可包含用于檢索PU的參考樣本的數(shù)據(jù)。舉例來(lái)說(shuō),當(dāng)I3U經(jīng)幀間模式編碼時(shí),PU可包含描述PU的運(yùn)動(dòng)向量的數(shù)據(jù)。界定運(yùn)動(dòng)向量的數(shù)據(jù)可描述(例如)運(yùn)動(dòng)向量的水平分量、運(yùn)動(dòng)向量的垂直分量、運(yùn)動(dòng)向量的分辨率(例如,整數(shù)像素精度、四分之一像素精度或八分之一像素精度)、運(yùn)動(dòng)向量指向的參考幀,和/或運(yùn)動(dòng)向量的參考列表(例如,列表O或列表I)。界定I3U的葉CU的數(shù)據(jù)還可描述(例如)將CU分割為一個(gè)或一個(gè)以上ro。分割模式可依據(jù)CU未經(jīng)預(yù)測(cè)性譯碼、經(jīng)幀內(nèi)預(yù)測(cè)模式編碼還是經(jīng)幀間預(yù)測(cè)模式編碼而不同。對(duì)于幀內(nèi)譯碼,可將PU視為與下文所述的葉變換單元相同。
[0071]HEVC還允許四叉樹型變換單元分區(qū)結(jié)構(gòu)。如圖3中所示,例如,外部塊為原始⑶。內(nèi)部塊表示根據(jù)四叉樹結(jié)構(gòu)的變換塊分解的結(jié)果。當(dāng)然,此結(jié)果只是許多可能分解之一。在圖3的實(shí)例中,存在三個(gè)等級(jí)的變換分解。對(duì)于等級(jí)I分解,將整個(gè)變換塊分裂成四個(gè)四分之一大小的塊。接著,在等級(jí)2處,進(jìn)一步將第二四分之一大小的變換塊(在右上)分裂成四個(gè)1/16大小的變換塊。接著,在等級(jí)3處,進(jìn)一步將第四個(gè)1/16大小的變換塊分裂成四個(gè)更小的變換塊。等級(jí)O處的變換單元意味著將整個(gè)譯碼單元一起變換,而無(wú)進(jìn)一步分裂。在此情況下,變換單元具有譯碼單元的相同大小。實(shí)際上,基于速率失真優(yōu)化來(lái)確定是否進(jìn)一步分裂變換單元。
[0072]在針對(duì)HEVC的一個(gè)提議中,除正方形變換單元(例如圖3中所示的那些單元)之夕卜,還可使用非正方形形TU。圖4A的塊I是實(shí)例垂直定向非正方形變換分區(qū)的概念圖。舉例來(lái)說(shuō),對(duì)于大小為2NX2N的經(jīng)幀間預(yù)測(cè)塊,可使用大小為0.5NX2N的四個(gè)變換塊(其也可稱為變換單元),如塊I中所示。此些變換可結(jié)合2NX2N 分區(qū)使用,或在PU分區(qū)呈塊
2、3或4的形式時(shí)使用。塊2為分成兩個(gè)分區(qū)的2NX2N PU,每一分區(qū)具有為原始?jí)K大小的一半的大小。塊2中的分區(qū)有時(shí)稱為NX2N分區(qū)。將塊3和4的PU分成分別具有原始?jí)K大小的1/4和3/4的大小的兩個(gè)分區(qū)。塊3的左分區(qū)有時(shí)稱為0.5Nx2N分區(qū),而塊3的右分區(qū)有時(shí)稱為1.5Nx2N分區(qū)。同樣地,塊4的左分區(qū)有時(shí)稱為1.5NX2N分區(qū),而塊4的右分區(qū)有時(shí)稱為0.5X2N分區(qū)。
[0073]在圖4A中,PU的分區(qū)垂直定向。如圖4B中所示,當(dāng)PU的分區(qū)水平定向時(shí),可使用類似的TU分割。圖4B的塊5是實(shí)例水平定向非正方形變換分區(qū)的概念圖。舉例來(lái)說(shuō),對(duì)于大小為2NX2N的經(jīng)幀間預(yù)測(cè)塊,可使用大小為2NX0.5N的四個(gè)變換塊(其也可稱為變換單元),如塊5中所示。此些變換可結(jié)合2NX2N I3U分區(qū)使用,或在PU分區(qū)呈塊6、7或8的形式時(shí)使用。塊6為分成兩個(gè)分區(qū)的2NX2N PU,每一分區(qū)具有為原始?jí)K大小的一半的大小。塊6中的分區(qū)有時(shí)稱為2NXN分區(qū)。將塊7和8的PU分成分別具有原始?jí)K大小的1/4和3/4的大小的兩個(gè)分區(qū)。塊7的上分區(qū)有時(shí)稱為2Nx0.5N分區(qū),而塊7的下分區(qū)有時(shí)稱為2NX1.5N分區(qū)。同樣地,塊8的上分區(qū)有時(shí)稱為2Nxl.5N分區(qū),而塊8的下分區(qū)有時(shí)稱為2X0.5N分區(qū)。
[0074]可看出,根據(jù)經(jīng)幀間預(yù)測(cè)塊的HEVC,取決于當(dāng)前塊的分區(qū)模式,使用非正方形變換。如果以垂直定向方式對(duì)PU進(jìn)行分區(qū),如圖4A的塊2、3和4中所示,那么可使用垂直定向的變換塊。如果以水平定向方式對(duì)PU進(jìn)行分區(qū),如圖4B的塊6、7和8中所示,那么可使用水平定向的變換塊。
[0075]與經(jīng)幀間預(yù)測(cè)塊形成對(duì)比,針對(duì)HEVC的先前提議僅允許經(jīng)幀內(nèi)預(yù)測(cè)塊的正方形TU0另外,使TU的形狀的大小與用于經(jīng)幀內(nèi)預(yù)測(cè)塊的PU的形狀和大小對(duì)準(zhǔn)。圖5A中展示經(jīng)幀內(nèi)預(yù)測(cè)塊的實(shí)例TU和PU。將塊11分區(qū)為四個(gè)四分之一大小的分區(qū)。在塊13中,進(jìn)一步將第二四分之一大小的分區(qū)(在右上)分區(qū)為具有原始?jí)K大小的1/16的大小的四個(gè)較小分區(qū)。基于針對(duì)HEVC的較早提議,單獨(dú)地預(yù)測(cè)、變換和重構(gòu)圖5A中所示的每一塊。在每一情況下,TU大小與PU大小相同。
[0076]HEVC中的最新提議要求在經(jīng)幀內(nèi)預(yù)測(cè)塊中使用非正方形變換。圖5B描繪可用于經(jīng)幀內(nèi)預(yù)測(cè)塊的非正方形TU和PU的實(shí)例。在圖5B的實(shí)例中,I3U還可具有矩形形狀。并且,TU與PU對(duì)準(zhǔn),且具有相同的大小和形狀。塊15展示具有垂直定向矩形形狀的TU和PU,且塊17展示具有水平定向矩形形狀的TU和PU。一個(gè)接一個(gè),從經(jīng)重構(gòu)像素的相鄰塊預(yù)測(cè)(即,使用幀內(nèi)預(yù)測(cè)來(lái)預(yù)測(cè))每一分區(qū),其中使用與用于預(yù)測(cè)的PU相同大小的TU來(lái)變換預(yù)測(cè)殘差。[0077]除圖5A的正方形TU和PU之外,可使用圖5B中所示的實(shí)例非正方形TU和PU。換句話說(shuō),對(duì)于給定塊,允許圖5A和5B中所例示的情況。舉例來(lái)說(shuō),在四叉樹分解等級(jí)I處,可選擇塊11中所示的變換分區(qū)。在另一情況下,可選擇塊15或17中所示的變換分區(qū)。在編碼器側(cè),測(cè)試所有可允許PU和TU分區(qū)(包含圖5A和5B中所示的那些分區(qū)),以確定展現(xiàn)最佳速率失真度量(或滿足規(guī)定的速率失真閾值)的分區(qū)模式,并在經(jīng)編碼位流中用信號(hào)通知最佳分區(qū)模式。測(cè)試已顯示,實(shí)現(xiàn)除正方形變換之外的非正方形形變換可改進(jìn)經(jīng)幀內(nèi)預(yù)測(cè)塊的譯碼效率。
[0078]對(duì)于經(jīng)幀內(nèi)預(yù)測(cè)的塊,由于TU與PU耦合在一起,因此檢查塊內(nèi)的TU分區(qū)的不同選項(xiàng)可涉及執(zhí)行多次預(yù)測(cè)和重構(gòu),因?yàn)槊恳晃ㄒ?TU分區(qū)與一唯一 分區(qū)匹配。因此,在正檢查和信令額外非正方形分區(qū)的情況下,編碼復(fù)雜性變得相當(dāng)高。此高編碼器復(fù)雜性可使得在一些情形中除正方形變換之外使用非正方形變換來(lái)譯碼經(jīng)幀內(nèi)預(yù)測(cè)塊不切實(shí)際。鑒于這些缺點(diǎn),本發(fā)明提出用于以降低的復(fù)雜性實(shí)現(xiàn)經(jīng)幀內(nèi)預(yù)測(cè)塊的非正方形變換同時(shí)保留譯碼效率的技術(shù)。
[0079]本發(fā)明呈現(xiàn)用于解決這些缺點(diǎn)的若干技術(shù)。作為一個(gè)實(shí)例,對(duì)于給定經(jīng)幀內(nèi)預(yù)測(cè)塊,基于某些條件,允許減少數(shù)目的變換單元分區(qū)選項(xiàng)。在另一實(shí)例中,本發(fā)明提出將TU大小和形狀從經(jīng)幀內(nèi)預(yù)測(cè)的塊的PU大小和形狀去耦。就是說(shuō),對(duì)于給定PU,可應(yīng)用與不同大小和形狀的TU。因此,檢查不同TU分區(qū)可不需要在所有情況下單獨(dú)地獲得所述塊的對(duì)應(yīng)預(yù)測(cè)。
[0080]根據(jù)本發(fā)明的一個(gè)實(shí)例,對(duì)于經(jīng)幀內(nèi)預(yù)測(cè)的塊,基于用于對(duì)應(yīng)的幀內(nèi)預(yù)測(cè)方向(或幀內(nèi)預(yù)測(cè)模式),允許減少數(shù)目個(gè)TU分區(qū)選項(xiàng)。舉例來(lái)說(shuō),如果當(dāng)前的幀內(nèi)預(yù)測(cè)模式指示從垂直方向預(yù)測(cè)PU,例如幀內(nèi)預(yù)測(cè)模式0,那么僅允許垂直定向非正方形變換(例如,圖5B中的塊15中的TU分區(qū))。對(duì)于使用垂直定向幀內(nèi)預(yù)測(cè)模式預(yù)測(cè)的PU,不允許正方形變換。另外,也不允許水平定向的非正方形TU (例如,圖5B中的塊17中的TU分區(qū))。一般來(lái)說(shuō),可將此約束應(yīng)用于主要垂直定向的所有幀內(nèi)預(yù)測(cè)方向,例如模式0、21、22、11和
12。模式0、21、22、11和12僅為實(shí)例垂直定向幀內(nèi)預(yù)測(cè)模式。在其它實(shí)例中,可將額外幀內(nèi)預(yù)測(cè)模式分類為垂直定向。
[0081]類似地,根據(jù)本發(fā)明的另一實(shí)例,如果當(dāng)前的幀內(nèi)預(yù)測(cè)模式指示從水平方向預(yù)測(cè)PU,例如幀內(nèi)預(yù)測(cè)模式1,那么僅允許水平定向非正方形TU(例如,圖5Β中的塊17中的TU分區(qū))。對(duì)于使用水平定向幀內(nèi)預(yù)測(cè)模式預(yù)測(cè)的PU,不允許正方形變換。另外,也不允許垂直定向的非正方形TU (例如,圖5Β中的塊15中的TU分區(qū))。一般來(lái)說(shuō),可將此約束應(yīng)用于主要水平定向的所有幀內(nèi)預(yù)測(cè)方向,例如模式1、29、30、15和16。模式1、29、30、15和16僅為實(shí)例水平定向幀內(nèi)預(yù)測(cè)模式。在其它實(shí)例中,可將額外幀內(nèi)預(yù)測(cè)模式分類為水平定向。
[0082]在本發(fā)明的另一實(shí)例中,如果用于當(dāng)前的幀內(nèi)預(yù)測(cè)模式不具有任何明顯方向偏好,例如DC模式2或平面模式34,對(duì)于所述塊僅允許正方形TU。一般來(lái)說(shuō),可將此約束應(yīng)用于既不水平也不垂直定向的所有幀內(nèi)預(yù)測(cè)方向。舉例來(lái)說(shuō),對(duì)正方形TU的約束也可應(yīng)用于主要對(duì)角線定向的那些幀內(nèi)預(yù)測(cè)方向,例如模式3、18和26。模式3、18和26僅為實(shí)例對(duì)角線定向的幀內(nèi)預(yù)測(cè)模式。在其它實(shí)例中,可將額外幀內(nèi)預(yù)測(cè)模式分類為對(duì)角線定向。
[0083]上文未具體提到的例如圖2中所示的其它幀內(nèi)預(yù)測(cè)模式可對(duì)可允許的TU分區(qū)的類型無(wú)約束。舉例來(lái)說(shuō),可允許正方形TU分區(qū)、非正方形垂直定向TU分區(qū)以及非正方形水平定向TU分區(qū)。
[0084]上文所述的基于幀內(nèi)預(yù)測(cè)模式的TU分區(qū)約束(即,某些TU分區(qū)對(duì)每一幀內(nèi)預(yù)測(cè)模式的約束)可在模式?jīng)Q策級(jí)(即,選擇幀內(nèi)預(yù)測(cè)模式時(shí))進(jìn)行,且可用于整個(gè)編碼過(guò)程(即,在模式?jīng)Q策級(jí)和熵譯碼級(jí))。
[0085]模式?jīng)Q策級(jí)(例如,圖7的模式選擇單元40)指代編碼器測(cè)試可能TU分區(qū)且基于位速率/失真標(biāo)準(zhǔn)選擇一個(gè)分區(qū)的級(jí)。如果僅在模式?jīng)Q策級(jí)處應(yīng)用TU約束,那么視頻編碼器20僅測(cè)試選定幀內(nèi)預(yù)測(cè)模式允許的選定TU(其可為所有可用TU的子集)。在熵譯碼級(jí)(例如,圖7的熵編碼單元56)處,視頻編碼器20考慮所有可能TU,不僅是選定幀內(nèi)預(yù)測(cè)所允許的子集,如可用于信令。舉例來(lái)說(shuō),假設(shè)存在總共三個(gè)可能TU分區(qū)(例如,垂直定向(分區(qū)A)、水平定向(分區(qū)B)和正方形(分區(qū)C))。假設(shè)對(duì)于幀內(nèi)模式k,在模式?jīng)Q策級(jí),僅允許考慮變換A。然而,在熵譯碼級(jí),視頻編碼器20假定所有分區(qū)A、B和C可用,且因此,考慮到所有這些可能性而用信號(hào)通知分區(qū)A的選擇。舉例來(lái)說(shuō),視頻編碼器20可用信號(hào)通知square_tranform_f lag = I以指不選擇分區(qū)C,或可用信號(hào)通知square_transform_flag = O以指示非正方形變換(即,A或B),以及transform_dir_flag = I (或O)以指示選擇變換A或B中的哪一者。語(yǔ)法元素transform_dir_flag = I可對(duì)應(yīng)于水平定向的TU,而transform_dir_flag = O可對(duì)應(yīng)于垂直定向的TU,且反之亦然。
[0086]將TU分區(qū)約束應(yīng)用于整個(gè)編碼過(guò)程意味著將可用變換的約束應(yīng)用于模式?jīng)Q策級(jí)(如上文所述)且應(yīng)用于熵譯碼級(jí)。在熵譯碼級(jí)中,當(dāng)用信號(hào)通知TU分區(qū)選擇時(shí),僅考慮選定幀內(nèi)預(yù)測(cè)模式所允許的變換。舉例來(lái)說(shuō),如果對(duì)于幀內(nèi)模式k,僅允許變換A和C(不允許B),那么視頻編碼器20用信號(hào)通知一個(gè)旗標(biāo)(旗標(biāo)=1,選擇A;旗標(biāo)=0,選擇C)。在另一實(shí)例中,如果對(duì)于模式k,僅允許變換A,那么視頻編碼器20將無(wú)需發(fā)送任何旗標(biāo),因?yàn)榭稍诮獯a器處從幀內(nèi)模式推斷所述變換。
[0087]根據(jù)本發(fā)明的一個(gè)實(shí)例,可供使用的TU分區(qū)取決于為在視頻編碼器20處使用而選擇的幀內(nèi)預(yù)測(cè)模式。在此實(shí)例中,對(duì)于每一幀內(nèi)預(yù)測(cè)模式,僅指定一個(gè)TU分區(qū)??捎玫腡U分區(qū)的類型可包含正方形TU分區(qū)、垂直定向非正方形TU分區(qū)以及水平定向非正方形TU分區(qū)。
[0088]可使幀內(nèi)預(yù)測(cè)模式與TU分區(qū)之間的依賴性例如以存儲(chǔ)在存儲(chǔ)器中的映射表的形式或作為一組所實(shí)施公式或規(guī)則在視頻編碼器20和視頻解碼器30處可用。因此,在此實(shí)例中,不需要將所使用的TU分區(qū)的類型從編碼器用信號(hào)通知給解碼器。代替地,在視頻解碼器30處,一旦解碼塊或的幀內(nèi)預(yù)測(cè)模式,就可以如編碼器處相同的方式,即從基于幀內(nèi)預(yù)測(cè)模式的映射表或規(guī)則,確定其從屬TU分區(qū)。
[0089]根據(jù)本發(fā)明的另一實(shí)例,所選擇的TU分區(qū)仍取決于當(dāng)前塊/PU的選定幀內(nèi)預(yù)測(cè)模式,然而,對(duì)于每一預(yù)測(cè)方向,可存在所指定且允許的一個(gè)或一個(gè)以上TU分區(qū)。當(dāng)存在為某一幀內(nèi)預(yù)測(cè)模式指定的一個(gè)以上TU分區(qū)時(shí),除在經(jīng)編碼視頻位流中用信號(hào)通知選定幀內(nèi)預(yù)測(cè)模式之外,還用信號(hào)通知額外位或旗標(biāo),以指示將使用為選定幀內(nèi)預(yù)測(cè)模式指定的哪一 TU分區(qū)。舉例來(lái)說(shuō),對(duì)于垂直預(yù)測(cè)方向(例如,模式O),可使用垂直定向的非正方形TU分區(qū)或正方形TU分區(qū)。對(duì)于水平定向的預(yù)測(cè)方向(例如,模式I),可使用水平定向的非正方形TU分區(qū)或正方形TU分區(qū)。
[0090]在此上下文中,在經(jīng)編碼位流中用信號(hào)通知TU分區(qū)不要求將此些元素從編碼器實(shí)時(shí)發(fā)射到解碼器,而是意味著將此些語(yǔ)法元素編碼到位流中,并使其可被解碼器以任何形式存取。這可包含實(shí)時(shí)發(fā)射(例如,在視頻會(huì)議中)以及將經(jīng)編碼位流存儲(chǔ)在計(jì)算機(jī)可讀媒體上,以供解碼器將來(lái)使用(例如,在流式傳輸、下載、磁盤存取、卡存取、DVD、藍(lán)光等中)。
[0091]如果對(duì)于幀內(nèi)預(yù)測(cè)模式,僅存在一個(gè)所指定TU分區(qū),那么當(dāng)使用此幀內(nèi)預(yù)測(cè)模式時(shí),不需要用信號(hào)通知額外位或旗標(biāo),以將TU分區(qū)從編碼器向解碼器指示。代替地,可在編碼器和解碼器兩者處推斷相關(guān)聯(lián)的TU分區(qū)。舉例來(lái)說(shuō),在DC模式或平面模式下,可僅使正方形TU分區(qū)可供使用。并且,可使幀內(nèi)預(yù)測(cè)模式、所允許的TU分區(qū)的數(shù)目以及所允許的TU分區(qū)的類型之間的依賴性例如以存儲(chǔ)在存儲(chǔ)器中的映射表的形式或作為一組所實(shí)施的公式或規(guī)則,在編碼器和解碼器兩者處可用。
[0092]根據(jù)本發(fā)明的又一實(shí)例,所選擇的TU分區(qū)仍取決于當(dāng)前塊的幀內(nèi)預(yù)測(cè)模式,然而,對(duì)于每一幀內(nèi)預(yù)測(cè)方向,可存在相同數(shù)目的所指定且允許的TU分區(qū)。舉例來(lái)說(shuō),對(duì)于每一預(yù)測(cè)模式,存在兩個(gè)所指定且允許的TU分區(qū)。
[0093]這樣做的動(dòng)機(jī)是為了在使用例如CABAC等熵譯碼器時(shí)避免與第二實(shí)例的方案相關(guān)聯(lián)的剖析問(wèn)題。根據(jù)上文所述的第二實(shí)例,依據(jù)幀內(nèi)預(yù)測(cè)模式,可需要或可不需要發(fā)送指示變換分區(qū)的額外位或旗標(biāo)。在視頻解碼器30處,為了知曉是否為當(dāng)前塊剖析額外一個(gè)位或旗標(biāo),必須完整地解碼所述塊的幀內(nèi)預(yù)測(cè)模式。這在使用例如CABAC等熵譯碼器時(shí)可引發(fā)解碼器處的問(wèn)題。
[0094]在其中每個(gè)幀內(nèi)預(yù)測(cè)模式具有相同數(shù)目的所指定TU分區(qū)(例如,兩個(gè)TU分區(qū))的實(shí)例中,與選擇哪一幀內(nèi)預(yù)測(cè)模式無(wú)關(guān),用信號(hào)通知一個(gè)額外位或旗標(biāo)以指示用于所述塊/PU的TU分區(qū)。因此,在解碼器側(cè)剖析此額外位或旗標(biāo)不取決于塊的實(shí)際幀內(nèi)預(yù)測(cè)模式,因?yàn)閷⒖偸前l(fā)送旗標(biāo)的額外位。
[0095]根據(jù)本發(fā)明的另一實(shí)例,對(duì)于經(jīng)幀內(nèi)預(yù)測(cè)的塊,在大小和/或形狀方面,TU不再與PU耦合。換句話說(shuō),TU可具有與對(duì)應(yīng)PU不同的大小和/或形狀。舉例來(lái)說(shuō),如圖6中所示,具有2NX2N分區(qū)模式的經(jīng)幀內(nèi)預(yù)測(cè)塊的PU19可具有與⑶相同的大小。具有NXN分割模式的經(jīng)幀內(nèi)預(yù)測(cè)塊的TO21的每一分區(qū)可具有為CU大小的四分之一的大小。
[0096]對(duì)于每一 PU,首先使用經(jīng)重構(gòu)像素的相鄰塊來(lái)執(zhí)行幀內(nèi)預(yù)測(cè),與什么TU分區(qū)將用于PU無(wú)關(guān)。一旦預(yù)測(cè)殘差可用于ro,就可進(jìn)一步確定和用信號(hào)通知PU內(nèi)的TU分區(qū)。
[0097]對(duì)于此技術(shù),由于TU和PU不再耦合在一起,預(yù)測(cè)殘差保持不變,與什么TU分區(qū)用于特定PU無(wú)關(guān)。因此,在編碼器側(cè),可測(cè)試不同TU分區(qū),而不每次重新計(jì)算預(yù)測(cè)和預(yù)測(cè)殘差。由此,可降低編碼器復(fù)雜性。
[0098]舉例來(lái)說(shuō),當(dāng)使用圖6的PU19的分割時(shí),首先獲得整個(gè)CU的預(yù)測(cè)方向。在那之后,為整個(gè)⑶計(jì)算殘差。接著,基于預(yù)測(cè)殘差,可測(cè)試如圖4A和4B中所示的不同TU分區(qū),且在經(jīng)編碼視頻位流中用信號(hào)通知最佳TU分區(qū)。
[0099]根據(jù)本發(fā)明的又一實(shí)例,對(duì)于經(jīng)幀內(nèi)預(yù)測(cè)塊,TU不與PU耦合。換句話說(shuō),TU可具有與對(duì)應(yīng)不同的大小或形狀。然而,取決于所選擇的幀內(nèi)預(yù)測(cè)模式,可允許減少數(shù)目的TU分區(qū)。
[0100]舉例來(lái)說(shuō),對(duì)于給定幀內(nèi)預(yù)測(cè)模式,某些TU分區(qū)可極不可能得出最佳速率失真度量。在此情況下,通過(guò)為給定幀內(nèi)預(yù)測(cè)模式排除不可能使用的TU分區(qū)來(lái)減少所允許的PTU分區(qū)的數(shù)目可減少TU分區(qū)的信令開銷,且改進(jìn)譯碼效率。
[0101]當(dāng)存在可用于給定幀內(nèi)預(yù)測(cè)模式的TU分區(qū)的一個(gè)以上選項(xiàng)時(shí),在經(jīng)編碼視頻位流中用信號(hào)通知當(dāng)前塊/PU的最佳TU分區(qū)的索引。舉例來(lái)說(shuō),當(dāng)存在可用于特定幀內(nèi)預(yù)測(cè)模式的TU分區(qū)的三個(gè)選項(xiàng)時(shí),可用信號(hào)通知索引值O、I或2,以分別指示為塊/PU選擇哪一TU分區(qū)。
[0102]為了改進(jìn)用信號(hào)通知此索引值中的譯碼效率,可將當(dāng)前塊的幀內(nèi)預(yù)測(cè)模式用作上下文。取決于幀內(nèi)預(yù)測(cè)模式,在用信號(hào)通知TU分區(qū)的索引值時(shí)可使用自適應(yīng)譯碼(例如,CABAC)中所使用的不同概率模型。就是說(shuō),對(duì)于給定幀內(nèi)預(yù)測(cè)模式,將使用具有考慮此較高可能性的概率模型的CABAC來(lái)譯碼已展示有較高可能性具有最佳速率失真度量的TU分區(qū)。根據(jù)本發(fā)明的另一實(shí)例,可將用于當(dāng)前塊的相鄰塊的TU分區(qū)的索引值用作譯碼當(dāng)前塊的變換單元分區(qū)的索引值是的上下文。
[0103]根據(jù)本發(fā)明的其它實(shí)例,描述用于用信號(hào)通知非正方形的技術(shù)。明確地說(shuō),本發(fā)明描述用于通過(guò)減少用于非正方形短距幀內(nèi)預(yù)測(cè)分區(qū)的幀內(nèi)模式集合來(lái)減小經(jīng)編碼視頻位速率且降低編碼器復(fù)雜性的技術(shù)。
[0104]如上文所論述,HEVC、H.264以及其它視頻譯碼標(biāo)準(zhǔn)中的基于先前塊的幀內(nèi)譯碼使用一個(gè)NXN正方形塊作為重構(gòu)單元和預(yù)測(cè)單元。可從相鄰經(jīng)重構(gòu)塊的邊界預(yù)測(cè)正方形塊內(nèi)部的像素。這可導(dǎo)致與序列的一些區(qū)中的其它像素相比,正方形塊的右下部分上的像素的不是最佳的預(yù)測(cè)。為了更好地利用空間相關(guān)性,最近已提出了短距幀內(nèi)預(yù)測(cè)(SDIP)譯碼方案,以供HEVC標(biāo)準(zhǔn)中使用。SDIP技術(shù)包含將一個(gè)NXN正方形塊分割成具有矩形形狀的若干行或非正方形塊。在所述塊中,逐行或逐矩形預(yù)測(cè)和重構(gòu)像素。因此,縮短了預(yù)測(cè)距離。
[0105]在SDIP的一個(gè)實(shí)例中,將小于32X32的一個(gè)NXN正方形塊分成具有非正方形矩形形狀的若干個(gè)像素行或非正方形塊。在所述塊中,逐行或逐矩形預(yù)測(cè)和重構(gòu)像素。
[0106]在SDIP的另一實(shí)例中,可將小于64x64的一個(gè)⑶分區(qū)為具有矩形形狀的行或非正方形塊。舉例來(lái)說(shuō),可將32X32⑶分區(qū)為四`個(gè)8X32PU或四個(gè)32X8PU。在另一實(shí)例中,16X16CU可不僅劃分成四個(gè)8X8PU,而且劃分成四個(gè)4xl6/16x4PU,且4X16/16X4PU可進(jìn)一步分裂成四個(gè)1X16/16X1分區(qū)。類似地,還可將一個(gè)8x8⑶劃分成四個(gè)2X8/8X2PU,且可將每個(gè)4x4PU進(jìn)一步劃分成四個(gè)I X 4/4 X I分區(qū)。
[0107]更一般地說(shuō),對(duì)于大小為2NX 2N的幀內(nèi)⑶,存在先前用于HEVC中的兩個(gè)PU大小。2NX2N和NXN(當(dāng)前在最小CU等級(jí)下僅允許NXN)。圖5中展示實(shí)例2NX20PNXN*區(qū)。對(duì)于2NX2N分區(qū)19,整個(gè)⑶僅具有一個(gè)PU(大小為2NX2N)。通過(guò)引入SDIPd^W兩個(gè)新的預(yù)測(cè)單元:2NxhN和hNX2N。對(duì)于2NXhN分區(qū),CU具有42NXhN I3U個(gè),且對(duì)于hNX2N,⑶具有4個(gè)hNX2N PU。每一 I3U具有其自己的幀內(nèi)預(yù)測(cè)模式(即,如圖2中所示的35種模式中的一者)。圖4B的塊17展示實(shí)例2NXhN PU分區(qū)。圖4B的塊15展示實(shí)例hNX2N PU 分區(qū)。
[0108]當(dāng)例如結(jié)合SDIP使用非正方形I3U時(shí),每一 I3U可使用多個(gè)幀內(nèi)預(yù)測(cè)模式/方向(例如,圖2的35種模式)中的一者。此布置存在若干缺點(diǎn)。首先,為了將選定模式用信號(hào)通知給每一 PU的解碼器,在經(jīng)編碼視頻位流中信令選定模式的索引。由于選擇哪一幀內(nèi)預(yù)測(cè)的不確定性較高(即,可存在35種模式),因此使用相對(duì)較大數(shù)目的位來(lái)編碼所述索引,這增加了經(jīng)壓縮視頻的位速率。第二,編碼器可能必須檢查每個(gè)模式來(lái)確定最佳模式來(lái)使用,或至少識(shí)別滿足要求(例如速率失真閾值)的模式。每一PU所允許的所有幀內(nèi)預(yù)測(cè)模式/方向,此檢查過(guò)程增加編碼器處的計(jì)算負(fù)擔(dān)。
[0109]本發(fā)明提出用于通過(guò)減少用于正方形和非正方形SDIP分區(qū)的可能幀內(nèi)預(yù)測(cè)模式的數(shù)目來(lái)減小經(jīng)編碼視頻位速率且降低編碼器復(fù)雜性的技術(shù)。可能幀內(nèi)預(yù)測(cè)模式的數(shù)目的此減少是基于以下觀察:對(duì)于經(jīng)垂直分區(qū)的CU(例如,hNX2N TO),較可能選擇垂直或幾乎垂直的幀內(nèi)預(yù)測(cè)模式(例如,模式1、22、23…)作為最佳模式。類似地,對(duì)于經(jīng)水平分區(qū)的CU(例如,2NxhN I3U),較可能選擇水平或幾乎水平幀內(nèi)預(yù)測(cè)模式(例如,模式2、30、31...)作為最佳模式。
[0110]在本發(fā)明中,提出依賴于SDIP分區(qū)的幀內(nèi)預(yù)測(cè)模式。SDIP PU分區(qū)(例如,2NXhN和hHX2N分區(qū))的幀內(nèi)預(yù)測(cè)模式集合可不同于用于正方形I3U分區(qū)(例如,2NX2N和NXxN分區(qū))的幀內(nèi)預(yù)測(cè)模式集合。舉例來(lái)說(shuō),SDIP 分區(qū)的幀內(nèi)預(yù)測(cè)模式集合可為可用于正方形PU分區(qū)的模式總數(shù)(例如,圖2的35種模式)。換句話說(shuō),SDIP PU分區(qū)的幀內(nèi)預(yù)測(cè)模式集合可包含比用于正方形PU分區(qū)的幀內(nèi)預(yù)測(cè)模式集合少的模式。此外,幀內(nèi)預(yù)測(cè)模式集合可取決于SDIP分區(qū)方向。舉例來(lái)說(shuō),經(jīng)垂直分區(qū)的hNX2N分區(qū)以及經(jīng)水平分區(qū)的2NXhN分區(qū)可具有不同的幀內(nèi)預(yù)測(cè)模式集合。
[0111]通過(guò)減少某些SDIP分區(qū)的給定集合中的幀內(nèi)預(yù)測(cè)模式的量,用來(lái)編碼選定幀內(nèi)預(yù)測(cè)模式的碼字可較短,且因此可保留位且可降低位速率。另外,由于為SDIP分區(qū)檢查較少幀內(nèi)預(yù)測(cè)模式,因此編碼過(guò)程上的計(jì)算負(fù)擔(dān)可減少,且編碼可加速。通過(guò)使幀內(nèi)預(yù)測(cè)模式集合取決于SDIP分區(qū)方向,預(yù)期35種幀內(nèi)預(yù)測(cè)模式的完整補(bǔ)充所提供的大多數(shù)編碼增益可用選定幀內(nèi)預(yù)測(cè)模式候選者(即,減小的幀內(nèi)預(yù)測(cè)模式集合)保持。
[0112]在本發(fā)明的一個(gè)實(shí)例中,對(duì)于hNX2N 分區(qū),幀內(nèi)預(yù)測(cè)模式集合可包含那些垂直或幾乎垂直的幀內(nèi)預(yù)測(cè)模式,包含幀內(nèi)預(yù)測(cè)模式0、21、22、11和12,但排除其它幀內(nèi)預(yù)測(cè)模式(例如,水平或幾乎水平模 式、DC模式、平面模式以及其它有角度模式)。對(duì)于2NXhNPU,幀內(nèi)預(yù)測(cè)模式集合可包含那些水平或幾乎水平的幀內(nèi)預(yù)測(cè)模式,包含模式1、29、30、15和16,但排除其它幀內(nèi)預(yù)測(cè)模式(例如,垂直或幾乎垂直模式、DC模式、平面模式以及其它有角度模式)。
[0113]在本發(fā)明的另一實(shí)例中,對(duì)于hN X 2N PU分區(qū),幀內(nèi)預(yù)測(cè)模式集合可包含那些垂直或幾乎垂直的幀內(nèi)預(yù)測(cè)模式以及不具有較強(qiáng)方向性的其它模式(例如,DC模式和/或平面模式),但排除其它幀內(nèi)預(yù)測(cè)模式(例如,水平或幾乎水平模式以及其它有角度模式)。具有較強(qiáng)方向性的模式是垂直或幾乎垂直的那些模式以及水平或幾乎水平的模式。對(duì)于2NXhNPU分區(qū),幀內(nèi)預(yù)測(cè)模式集合可包含那些水平或幾乎水平的幀內(nèi)預(yù)測(cè)模式以及不具有較強(qiáng)方向性的其它模式(例如,DC模式和/或平面模式),但排除其它幀內(nèi)預(yù)測(cè)模式(例如,垂直或幾乎垂直模式以及其它有角度模式)。
[0114]在本發(fā)明的另一實(shí)例中,對(duì)于hN X 2N PU分區(qū),幀內(nèi)預(yù)測(cè)模式集合可包含那些垂直或幾乎垂直的幀內(nèi)模式,不具有較強(qiáng)方向性的其它模式(例如,DC模式和/或平面模式),以及一些水平或幾乎水平的模式(例如,模式2)。此幀內(nèi)模式集合中的模式總數(shù)可小于用于正方形分區(qū)的模式總數(shù)(例如,所有35種模式)。對(duì)于2NxhN 分區(qū),幀內(nèi)預(yù)測(cè)模式集合可包含那些水平或幾乎水平的幀內(nèi)模式,不具有較強(qiáng)方向性的其它模式(例如,DC模式和/或平面模式),以及一些垂直或幾乎垂直的模式(例如,模式I)。此幀內(nèi)模式集合中的模式總數(shù)可小于用于正方形分區(qū)的模式總數(shù)(例如,小于包含所有35種模式的集合)。
[0115]本發(fā)明還提出用于使特定分區(qū)的可用幀內(nèi)預(yù)測(cè)模式集合也取決于CU大小的技術(shù)。舉例來(lái)說(shuō),具有hNX2N SDIP PU分區(qū)的32x32CU可具有與具有hNX 2N SDIP PU分區(qū)的16xl6CU不同的幀內(nèi)模式集合。在此實(shí)例中,對(duì)于32x32CU(具有hNX2N SDIPPU分區(qū)),幀內(nèi)模式集合包含模式0、21和22;對(duì)于16xl6CU (具有hNX2N SDIP I3U分區(qū)),幀內(nèi)模式集合包含模式0、21、22、11、12、20和23。并且,幀內(nèi)預(yù)測(cè)模式集合還可取決于其它邊信息,如圖片類型。舉例來(lái)說(shuō),對(duì)于幀內(nèi)片段/圖片,具有hNX2N SDIPPU分區(qū)的CU的幀內(nèi)預(yù)測(cè)模式集合包含模式0、21、22、11、12、20和23。對(duì)于P或B片,具有hNX 2N SDIP I3U分區(qū)的CU的幀內(nèi)預(yù)測(cè)模式集合包含所有35種模式。
[0116]在一些實(shí)例中,用于SDIP分區(qū)的幀內(nèi)預(yù)測(cè)模式集合可為固定集合,且可存儲(chǔ)在視頻編碼器20和視頻解碼器30兩者處。在其它實(shí)例中,還可使用某一高級(jí)語(yǔ)法在經(jīng)編碼位流中用信號(hào)通知幀內(nèi)預(yù)測(cè)模式集合。舉例來(lái)說(shuō),可在SPS(序列參數(shù)集合)和/或PPS(圖片參數(shù)集合)中用信號(hào)通知此語(yǔ)法。
[0117]在本發(fā)明的另一實(shí)例中,可對(duì)SDIP幀內(nèi)預(yù)測(cè)模式集合中的模式進(jìn)行重新編號(hào)(例如,連續(xù)地從O開始),使得熵譯碼可較簡(jiǎn)單且較高效。舉例來(lái)說(shuō),假設(shè)用于hNX 2N分區(qū)的幀內(nèi)預(yù)測(cè)模式集合包含3種模式:0、21和22 (如圖2中所示)??蓪⒛J?、21和22重新編號(hào)為0、1和2(例如,O- > 0、21_ > 1、22_ > 2),以進(jìn)行熵譯碼。在視頻解碼器30處,可將經(jīng)重新編號(hào)的幀內(nèi)預(yù)測(cè)模式重新映射到原始模式編號(hào)(在此實(shí)例中為0、21和22),使得可執(zhí)行具有正確方向的幀內(nèi)預(yù)測(cè)。
[0118]使用最可能模式(MPM)來(lái)用信號(hào)通知幀內(nèi)預(yù)測(cè)模式。在HM軟件的一個(gè)版本中,存在兩種MPM。一種MPM為頂部PU( S卩,在當(dāng)前PU正上方的PU)的模式,且另一 MPM為左側(cè)I3U( S卩,直接在當(dāng)前PU左側(cè)的PU)的模式。如果當(dāng)前I3U的模式與MPM I3U中的一者的模式相同,那么在經(jīng)編碼視頻位流中用信號(hào)通知旗標(biāo)。如果旗標(biāo)為真,那么將在經(jīng)編碼視頻位流中用信號(hào)通知另一旗標(biāo),以指示當(dāng)前I3U的模式與哪一 MPM匹配。使用MPM信令技術(shù)減少了用信號(hào)通知PU的選定幀內(nèi)預(yù)測(cè)模式所需的位的量。
[0119]如本發(fā)明中所提出,兩個(gè)SDIP PU(即,hNX2N和2NxhN)以及正方形I3U可具有不同的幀內(nèi)預(yù)測(cè)模式集合。這可導(dǎo)致基于MPM的幀內(nèi)預(yù)測(cè)模式信令中的一些問(wèn)題和/或低效。舉例來(lái)說(shuō),如果左側(cè)PU和頂部PU具有與當(dāng)前的幀內(nèi)預(yù)測(cè)模式集合不同的幀內(nèi)預(yù)測(cè)模式集合,那么從左側(cè)和頂部得出的MPM有可能不同于可用于當(dāng)前的任何幀內(nèi)預(yù)測(cè)模式,且因此MPM譯碼變得沒(méi)用。
[0120]鑒于此缺點(diǎn),本發(fā)明進(jìn)一步提出在用于TO A和B的幀內(nèi)預(yù)測(cè)模式集合為不同的情況下,當(dāng)將I3U(A)的模式用作另一 I3U(B)的MPM時(shí),執(zhí)行模式映射/量化。將S (A)界定為PU(A)的幀內(nèi)預(yù)測(cè)模式集合,且將m(A)界定為用于TO(A)的模式。類似地,將S(B)界定為PU(B)的幀內(nèi)預(yù)測(cè)模式集合,且將m(B)界定為用于⑶的模式。可執(zhí)行映射以將m㈧映射到S(B)中的模式Y(jié),且將Y用作用于編碼m(B)的MPM。視頻編碼器20可執(zhí)行此正向映射。另外,視頻解碼器30也可執(zhí)行正向映射以獲得原始幀內(nèi)預(yù)測(cè)模式。
[0121]在一個(gè)實(shí)例中,將Y界定為具有與m(A)最類似的方向的S(B)中的模式。在另一實(shí)例中,S(A)中的模式到S(B)中的模式的映射是固定的,且在編碼器和解碼器兩者處可用。在另一實(shí)例中,S(A)中的模式到S(B)中的模式的映射是編碼器界定的,且使用某一高級(jí)語(yǔ)法(例如,在SPS或PPS中)發(fā)射。就是說(shuō),根據(jù)映射算法在編碼器處執(zhí)行映射,且在經(jīng)編碼視頻位流中用信號(hào)通知用以執(zhí)行映射的算法(或所述算法的索引)。在另一實(shí)例中,S(A)中的模式到S(B)中的模式的映射取決于邊信息(例如,CU/PU大小、圖片類型等)。
[0122]圖7是說(shuō)明可使用如本文中所述的用于TU和選擇和信令的技術(shù)的視頻編碼器20的實(shí)例的框圖。出于說(shuō)明的目的,將在HEVC譯碼的上下文中描述視頻編碼器20,但就可能需要變換系數(shù)的譯碼的其它譯碼標(biāo)準(zhǔn)或方法而論不限制本發(fā)明。視頻編碼器20可執(zhí)行視頻幀內(nèi)的CU的幀內(nèi)和幀間譯碼。幀內(nèi)譯碼依靠空間預(yù)測(cè)來(lái)減少或去除給定視頻幀內(nèi)的視頻數(shù)據(jù)中的空間冗余。幀間譯碼依靠時(shí)間預(yù)測(cè)來(lái)減少或去除視頻序列的當(dāng)前幀與先前譯碼幀之間的時(shí)間冗余。幀內(nèi)模式(I模式)可涉及若干基于空間的視頻壓縮模式中的任一者。例如單向預(yù)測(cè)(P模式)或雙向預(yù)測(cè)(B模式)等幀間模式可指代若干基于時(shí)間的視頻壓縮模式中的任一者。
[0123]如圖7中所示,視頻編碼器20接收待編碼視頻幀內(nèi)的當(dāng)前視頻塊。在圖7的實(shí)例中,視頻編碼器20包含運(yùn)動(dòng)補(bǔ)償單元44、運(yùn)動(dòng)估計(jì)單元42、幀內(nèi)預(yù)測(cè)模塊46、參考幀緩沖器64、求和器50、變換模塊52、量化單元54以及熵編碼單元56。對(duì)于視頻塊重構(gòu),視頻編碼器20還包含逆量化單元58、逆變換模塊60以及求和器62。還可包含解塊濾波器或其它環(huán)路內(nèi)濾波器(圖7中未展示)以對(duì)塊邊界進(jìn)行濾波,以從經(jīng)重構(gòu)的視頻去除成塊性假影。在需要時(shí),解塊濾波器將通常對(duì)求和器62的輸出進(jìn)行濾波。
[0124]模式選擇單元40可例如基于每一模式的速率失真分析來(lái)選擇譯碼模式中的一者(幀內(nèi)或幀間),且將所得經(jīng)幀內(nèi)預(yù)測(cè)或幀間預(yù)測(cè)的塊(例如,預(yù)測(cè)單元(PU))提供給求和器50以產(chǎn)生殘差塊數(shù)據(jù),且提供給求和器62以重構(gòu)經(jīng)編碼塊以用于參考幀中。求和器62將所預(yù)測(cè)的塊與來(lái)自用于所述塊的逆變換模塊60的經(jīng)逆量化、逆變換數(shù)據(jù)進(jìn)行組合,以重構(gòu)經(jīng)編碼塊,如下文更詳細(xì)地描述??蓪⒁恍┮曨l幀指定為I幀,其中I幀中的所有塊均以幀內(nèi)預(yù)測(cè)模式編碼。在一些情況下,幀內(nèi)預(yù)測(cè)模塊46可執(zhí)行P或B幀中的塊的幀內(nèi)預(yù)測(cè)編碼,例如當(dāng)運(yùn)動(dòng)估計(jì)單元42所執(zhí)行的運(yùn)動(dòng)搜索未得出所述塊的充足預(yù)測(cè)時(shí)。
[0125]在編碼過(guò)程期間,視頻編碼器20接收待譯碼的視頻幀或切片。可將幀或切片分為多個(gè)視頻塊(例如,最大譯碼單元(LCU))。運(yùn)動(dòng)估計(jì)單元42和運(yùn)動(dòng)補(bǔ)償單元44相對(duì)于一個(gè)或一個(gè)以上參考幀中的一個(gè)或一個(gè)以上塊執(zhí)行對(duì)所接收的視頻塊的幀間預(yù)測(cè)譯碼以提供時(shí)間壓縮。巾貞內(nèi)預(yù)測(cè)模塊46可相對(duì)于與待譯碼的塊在同一巾貞或切片中的一個(gè)或一個(gè)以上相鄰塊執(zhí)行所接收視頻塊的幀內(nèi)預(yù)測(cè)譯碼,以提供空間壓縮。
[0126]運(yùn)動(dòng)估計(jì)單元42與運(yùn)動(dòng)補(bǔ)償單元44可高度集成,但出于概念上的目的而分開予以說(shuō)明。運(yùn)動(dòng)估計(jì)(或運(yùn)動(dòng)搜索)是產(chǎn)生估計(jì)視頻塊的運(yùn)動(dòng)的運(yùn)動(dòng)向量的過(guò)程。舉例來(lái)說(shuō),運(yùn)動(dòng)向量可指示當(dāng)前巾貞中的預(yù)測(cè)單元相對(duì)于參考巾貞的參考樣本的移位。運(yùn)動(dòng)估計(jì)單元42通過(guò)將預(yù)測(cè)單元與存儲(chǔ)在參考幀緩沖器64中的參考幀的參考樣本進(jìn)行比較來(lái)計(jì)算經(jīng)幀間譯碼的幀的預(yù)測(cè)單元的運(yùn)動(dòng)向量。參考樣本可為發(fā)現(xiàn)與CU的包含正依據(jù)像素差譯碼的的部分密切匹配的塊,其可由絕對(duì)差和(SAD)、平方差和(SSD)或其它差度量確定。參考樣本可出現(xiàn)在參考幀或參考片內(nèi)的任何地方,且不一定在參考幀或片的塊(例如,譯碼單元)邊界處。在一些實(shí)例中,參考樣本可出現(xiàn)在分?jǐn)?shù)像素位置處。
[0127]運(yùn)動(dòng)估計(jì)單元42將所計(jì)算的運(yùn)動(dòng)向量發(fā)送到熵編碼單元56和運(yùn)動(dòng)補(bǔ)償單元44。由運(yùn)動(dòng)向量識(shí)別的參考幀的部分可稱為參考樣本。運(yùn)動(dòng)補(bǔ)償單元44可例如通過(guò)檢索由的運(yùn)動(dòng)向量識(shí)別的參考樣本來(lái)計(jì)算當(dāng)前CU的預(yù)測(cè)單元的預(yù)測(cè)值。
[0128]作為運(yùn)動(dòng)估計(jì)單元42和運(yùn)動(dòng)補(bǔ)償單元44所執(zhí)行的幀間預(yù)測(cè)的替代方案,幀內(nèi)預(yù)測(cè)模塊46可對(duì)接收到的塊執(zhí)行幀內(nèi)預(yù)測(cè)。在假定塊的從左到右、從上到下編碼次序的情況下,幀內(nèi)預(yù)測(cè)模塊46可相對(duì)于相鄰的先前經(jīng)譯碼塊(例如在當(dāng)前塊上方、上方且右側(cè)、上方且左側(cè)或左側(cè)的塊)預(yù)測(cè)接收到的塊。幀內(nèi)預(yù)測(cè)模塊46可經(jīng)配置以根據(jù)多種不同幀內(nèi)預(yù)測(cè)模式中的一者執(zhí)行幀內(nèi)預(yù)測(cè)。舉例來(lái)說(shuō),幀內(nèi)預(yù)測(cè)模塊46 了基于正編碼的CU的大小配置有某一數(shù)目的定向預(yù)測(cè)模式,例如三十五種定向預(yù)測(cè)模式。
[0129]幀內(nèi)預(yù)測(cè)模塊46可通過(guò)例如為各種幀內(nèi)預(yù)測(cè)模式計(jì)算誤差值且選擇得出最低誤差值的模式來(lái)選擇幀內(nèi)預(yù)測(cè)模式。定向預(yù)測(cè)模式可包含用于組合空間上相鄰像素的值且將組合值應(yīng)用于PU中的一個(gè)或一個(gè)以上像素位置的功能。一旦已計(jì)算PU中的所有像素位置的值,幀內(nèi)預(yù)測(cè)單元46可基于PU與待編碼當(dāng)前塊之間的像素差來(lái)計(jì)算所述預(yù)測(cè)模式的誤差值。幀內(nèi)預(yù)測(cè)模塊46可繼續(xù)測(cè)試幀內(nèi)預(yù)測(cè)模式,直到發(fā)現(xiàn)得出可接受誤差值的幀內(nèi)預(yù)測(cè)模式為止。幀內(nèi)預(yù)測(cè)模塊46可接著將預(yù)測(cè)性塊發(fā)送到求和器50。
[0130]視頻編碼器20通過(guò)將運(yùn)動(dòng)補(bǔ)償單元44或幀內(nèi)預(yù)測(cè)模塊46所計(jì)算的預(yù)測(cè)數(shù)據(jù)從正譯碼的原始視頻塊減去來(lái)形成殘差塊。求和器50表示執(zhí)行此減法運(yùn)算的組件。殘差塊可對(duì)應(yīng)于像素差值的二維矩陣,其中殘差塊中的值的數(shù)目與對(duì)應(yīng)于所述殘差塊的預(yù)測(cè)性塊中的像素的數(shù)目。殘差塊中的值可對(duì)應(yīng)于預(yù)測(cè)性塊中與待譯碼的原始?jí)K中位于同一位置的像素的值之間的差,即誤差。所述差可為取決于被譯碼塊的類型的色度和亮度差。
[0131]變換模塊52可從殘差塊形成一個(gè)或一個(gè)以上TU。變換模塊52從多個(gè)變換之中選擇變換??苫谝粋€(gè)或一個(gè)以上譯碼特性(例如,塊大小、譯碼模式等)來(lái)選擇變換。變換模塊52接著將選定變換應(yīng)用于TU,從而產(chǎn)生包括變換系數(shù)的二維陣列的視頻塊。變換模塊52可根據(jù)上文所述的本發(fā)明的技術(shù)選擇變換分區(qū)。另外,變換模塊52可用信號(hào)通知經(jīng)編碼視頻位流中的選定變換分區(qū)。
[0132]變換模塊52可將所得變換系數(shù)發(fā)送到量化單元54。量化單元54可接著量化變換系數(shù)。熵編碼單元56可接著根據(jù)掃描模式執(zhí)行矩陣中的經(jīng)量化變換系數(shù)的掃描。本發(fā)明將熵編碼單元56描述為執(zhí)行所述掃描。然而,應(yīng)理解,在其它實(shí)例中,其它處理單元(例如量化單元54)可執(zhí)行所述掃描。
[0133]一旦將變換系數(shù)掃描到一維陣列中,熵編碼單元56就可對(duì)所述系數(shù)應(yīng)用熵譯碼,例如CAVLC、CABAC、基于語(yǔ)法的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(SBAC)或另一熵譯碼方法。
[0134]為了執(zhí)行CAVLC,熵編碼單元56可為待發(fā)射的符號(hào)選擇可變長(zhǎng)度代碼??蓸?gòu)造VLC中的碼字,使得相對(duì)較短的代碼對(duì)應(yīng)于概率較大的符號(hào),而較長(zhǎng)的代碼對(duì)應(yīng)于概率較小的符號(hào)。以此方式,與例如對(duì)待發(fā)射的每一符號(hào)使用等長(zhǎng)碼字相比,VLC的使用可實(shí)現(xiàn)位節(jié)省。
[0135]為了執(zhí)行CABAC,熵編碼單元56可選擇上下文模型來(lái)應(yīng)用于某一上下文以編碼待發(fā)射的符號(hào)。所述上下文可與例如相鄰值是非零還是零有關(guān)。熵編碼單元56還可對(duì)語(yǔ)法元素(例如代表選定變換的信號(hào))進(jìn)行熵編碼。根據(jù)本發(fā)明的技術(shù),熵編碼單元56可基于(例如)幀內(nèi)預(yù)測(cè)模式的幀內(nèi)預(yù)測(cè)方向、對(duì)應(yīng)于語(yǔ)法元素的系數(shù)的掃描位置、塊類型和/或變換類型以及用于上下文模型選擇的其它因素選擇用以編碼這些語(yǔ)法元素的上下文模型。
[0136]在熵譯碼單元56進(jìn)行的熵譯碼之后,可將所得經(jīng)編碼視頻發(fā)射到另一裝置(例如視頻解碼器30)或加以存檔以用于稍后發(fā)射或檢索。
[0137]在一些情況下,熵編碼單元56或視頻編碼器20的另一單元可經(jīng)配置以執(zhí)行除熵譯碼之外的其它譯碼功能。舉例來(lái)說(shuō),熵編碼單元56可經(jīng)配置以確定⑶和的經(jīng)譯碼塊模式(CBP)值。并且,在一些情況下,熵編碼單元56可執(zhí)行系數(shù)的游程長(zhǎng)度譯碼。
[0138]逆量化單元58和逆變換模塊60分別應(yīng)用逆量化和逆變換,以在像素域中重構(gòu)殘差塊,例如以供稍后用作參考幀的參考?jí)K。運(yùn)動(dòng)補(bǔ)償單元44可通過(guò)將殘差塊與參考幀存儲(chǔ)器64的幀中的一者的預(yù)測(cè)塊相加來(lái)計(jì)算參考?jí)K。運(yùn)動(dòng)補(bǔ)償單元44還可將一個(gè)或一個(gè)以上內(nèi)插濾波器應(yīng)用于經(jīng)重構(gòu)的殘差塊,以計(jì)算用于運(yùn)動(dòng)估計(jì)中的子整數(shù)像素值。求和器62將經(jīng)重構(gòu)殘差塊加到由運(yùn)動(dòng)補(bǔ)償單元44所產(chǎn)生的經(jīng)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)塊以產(chǎn)生經(jīng)重構(gòu)視頻塊以供存儲(chǔ)于參考幀緩沖器64中。參考幀緩沖器64有時(shí)稱為經(jīng)解碼圖片緩沖器(DPB)。經(jīng)重構(gòu)視頻塊可由運(yùn)動(dòng)估計(jì)單元42和運(yùn)動(dòng)補(bǔ)償單元44用作參考?jí)K以對(duì)后續(xù)視頻幀中的塊進(jìn)行幀間預(yù)測(cè)。
[0139]圖8是說(shuō)明對(duì)經(jīng)編碼視頻序列進(jìn)行解碼的視頻解碼器30的實(shí)例的框圖。在圖8的實(shí)例中,視頻解碼器30包含熵解碼單元70、運(yùn)動(dòng)補(bǔ)償單元72、幀內(nèi)預(yù)測(cè)模塊74、逆量化單元76、逆變換單元78、參考幀緩沖器82以及求和器80。視頻解碼器30在一些實(shí)例中可執(zhí)行一般與關(guān)于視頻編碼器20(見(jiàn)圖7)所描述的編碼遍次互逆的解碼遍次。
[0140]熵解碼單元70對(duì)經(jīng)編碼位流執(zhí)行熵解碼過(guò)程,以檢索變換系數(shù)的一維陣列。所使用的熵解碼過(guò)程取決于視頻編碼器20所使用的熵譯碼(例如,CABAC、CAVLC等)??稍诮?jīng)編碼位流中用信號(hào)通知編碼器所使用的熵譯碼過(guò)程,或其可為預(yù)定義過(guò)程。
[0141]在一些實(shí)例中,熵解碼單元70 (或逆量化單元76)可使用反映視頻編碼器20的熵編碼單元56 (或量化單元54)所使用的掃描模式的掃描來(lái)掃描接收到的值。盡管可在逆量化單元76中執(zhí)行系數(shù)的掃描,但將出于說(shuō)明的目的,將掃描描述為由熵解碼單元70執(zhí)行。另外,盡管為了便于說(shuō)明展示為單獨(dú)的功能單元,但視頻解碼器30的熵解碼單元70、逆量化單元76以及其它單元的結(jié)構(gòu)和功能性可彼此高度集成。
[0142]逆量化單元76將提供于位流中且由熵解碼單元70解碼的經(jīng)量化的變換系數(shù)逆量化(即,去量化)。逆量化過(guò)程可包括(例如)類似于為HEVC所提出或由H.264解碼標(biāo)準(zhǔn)界定的過(guò)程的常規(guī)過(guò)程。逆量化過(guò)程還包含針對(duì)CU使用由視頻編碼器20計(jì)算的量化參數(shù)QP來(lái)確定量化程度以及同樣的應(yīng)應(yīng)用逆量化的程度。在將系數(shù)從一維陣列轉(zhuǎn)換為二維陣列之前或之后,逆量化單元76可對(duì)變換系數(shù)進(jìn)行逆量化。
[0143]逆變換單元78將逆變換應(yīng)用于經(jīng)逆量化的變換系數(shù)。在一些實(shí)例中,逆變換單元78可基于來(lái)自視頻編碼器20的信令或通過(guò)從例如塊大小、譯碼模式等一個(gè)或一個(gè)以上譯碼特性推斷變換來(lái)確定逆變換。在一些實(shí)例中,逆變換單元78可基于包含當(dāng)前塊的LCU的四叉樹的根節(jié)點(diǎn)處的用信號(hào)通知的變換,確定要應(yīng)用于當(dāng)前塊的變換?;蛘?,可在LCU四叉樹中的葉節(jié)點(diǎn)CU的TU四叉樹的根部用信號(hào)通知變換。在一些實(shí)例中,逆變換單元78可應(yīng)用級(jí)聯(lián)逆變換,其中逆變換單元78將兩個(gè)或兩個(gè)以上逆變換應(yīng)用于正解碼的當(dāng)前塊的變換系數(shù)。
[0144]另外,逆變換模塊74可根據(jù)上文所述的本發(fā)明的技術(shù)應(yīng)用逆變換來(lái)產(chǎn)生變換單元分區(qū)。就是說(shuō),逆變換模塊74可將變換應(yīng)用于如根據(jù)本發(fā)明的技術(shù)用信號(hào)通知的正方形或非正方形TU分區(qū)。[0145]幀內(nèi)預(yù)測(cè)模塊74可基于用信號(hào)通知的幀內(nèi)預(yù)測(cè)模式以及來(lái)自當(dāng)前幀的先前經(jīng)解碼塊的數(shù)據(jù)為當(dāng)前幀的當(dāng)前塊產(chǎn)生預(yù)測(cè)數(shù)據(jù)。
[0146]基于檢索到的運(yùn)動(dòng)預(yù)測(cè)方向、參考幀索引以及所計(jì)算的當(dāng)前運(yùn)動(dòng)向量,運(yùn)動(dòng)補(bǔ)償單元產(chǎn)生當(dāng)前部分的經(jīng)運(yùn)動(dòng)補(bǔ)償?shù)膲K。這些經(jīng)運(yùn)動(dòng)補(bǔ)償?shù)膲K本質(zhì)上重新創(chuàng)建用以產(chǎn)生殘差數(shù)據(jù)的預(yù)測(cè)性塊。
[0147]運(yùn)動(dòng)補(bǔ)償單元72可產(chǎn)生經(jīng)運(yùn)動(dòng)補(bǔ)償?shù)膲K,從而可能執(zhí)行基于內(nèi)插濾波器的內(nèi)插。待用于具有子像素精度的運(yùn)動(dòng)補(bǔ)償?shù)膬?nèi)插濾波器的識(shí)別符可包含于語(yǔ)法元素中。運(yùn)動(dòng)補(bǔ)償單元72可使用如由視頻編碼器20在視頻塊的編碼期間所使用的內(nèi)插濾波器來(lái)計(jì)算參考?jí)K的子整數(shù)像素的經(jīng)內(nèi)插值。運(yùn)動(dòng)補(bǔ)償單元72可根據(jù)所接收的語(yǔ)法元素來(lái)確定視頻編碼器20所使用的內(nèi)插濾波器,且使用內(nèi)插濾波器來(lái)產(chǎn)生預(yù)測(cè)塊。
[0148]另外,在HEVC實(shí)例中,運(yùn)動(dòng)補(bǔ)償單元72和幀內(nèi)預(yù)測(cè)模塊74可使用語(yǔ)法信息(例如由四叉樹提供)中的一些來(lái)確定用以編碼經(jīng)編碼視頻序列的幀的LCU的大小。運(yùn)動(dòng)補(bǔ)償單元72和幀內(nèi)預(yù)測(cè)模塊74還可使用語(yǔ)法信息來(lái)確定描述如何分裂經(jīng)編碼視頻序列的幀的每一⑶(且同樣地,如何分裂子⑶)的分裂信息。明確地說(shuō),幀內(nèi)預(yù)測(cè)模塊74可使用減少數(shù)目的幀內(nèi)預(yù)測(cè)模式來(lái)對(duì)非正方形SDIP 分區(qū)執(zhí)行幀內(nèi)預(yù)測(cè),如本發(fā)明在上文所述。語(yǔ)法信息還可包含指示如何編碼每一分裂的模式(例如,幀內(nèi)或幀間預(yù)測(cè),且用于幀內(nèi)預(yù)測(cè)編碼模式的幀內(nèi)預(yù)測(cè))、每一經(jīng)幀間編碼PU的一個(gè)或一個(gè)以上參考幀(和/或含有參考幀的指示符的參考列表),以及用以解碼經(jīng)編碼視頻序列的其它信息。
[0149]求和器80對(duì)殘差塊與由運(yùn)動(dòng)補(bǔ)償單元72或幀內(nèi)預(yù)測(cè)模塊74產(chǎn)生的對(duì)應(yīng)預(yù)測(cè)塊進(jìn)行組合以形成經(jīng)解碼塊。如果需要的話,還可應(yīng)用解塊濾波器來(lái)對(duì)經(jīng)解碼塊進(jìn)行濾波,以便去除成塊假象。接著將經(jīng)解碼的視頻塊存儲(chǔ)在參考幀緩沖器82中,參考幀緩沖器82提供用于后續(xù)運(yùn)動(dòng)補(bǔ)償?shù)膮⒖級(jí)K且還產(chǎn)生用于在顯示裝置(例如,圖1的顯示裝置32)上呈現(xiàn)的經(jīng)解碼視頻。
[0150]圖9是描繪根據(jù)本發(fā)明實(shí)例的實(shí)例視頻編碼方法的流程圖。圖9的方法可由視頻編碼器20的一個(gè)或一個(gè)以上結(jié)構(gòu)執(zhí)行。
[0151]最初,作為任選步驟,視頻編碼器20可經(jīng)配置以從視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元(PU)分區(qū)中確定一預(yù)測(cè)單元分區(qū)(920),且基于所確定的預(yù)測(cè)單元分區(qū)確定一組幀內(nèi)預(yù)測(cè)模式(922)。
[0152]在一個(gè)實(shí)例中,所確定的預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。在另一實(shí)例中,所確定的預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
[0153]視頻編碼器20可進(jìn)一步經(jīng)配置以從視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式確定一幀內(nèi)預(yù)測(cè)模式(924),基于所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元(TU)分區(qū)(926),且使用所確定的變換單元分區(qū)來(lái)編碼視頻數(shù)據(jù)塊(928)。視頻編碼器20可接著經(jīng)配置以在經(jīng)編碼視頻位流中用信號(hào)通知所確定的變換分區(qū)(930)。
[0154]在一個(gè)實(shí)例中,所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且預(yù)測(cè)單元分區(qū)具有與所述所確定的變換單元分區(qū)相同的大小和形狀。在另一實(shí)例中,所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且預(yù)測(cè)單元分區(qū)具有與所確定的變換單元不同的大小和形狀。[0155]在本發(fā)明的另一實(shí)例中,視頻編碼器20可經(jīng)配置以基于幀內(nèi)預(yù)測(cè)模式從一組變換單元分區(qū)確定所述變換單元分區(qū)。在一個(gè)實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。在另一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。在又一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
[0156]變換單元分區(qū)集合可具有不同數(shù)目的分區(qū)。在一個(gè)實(shí)例中,變換單元分區(qū)集合每幀內(nèi)預(yù)測(cè)模式僅包含一個(gè)變換單元分區(qū)。在另一實(shí)例中,多個(gè)幀內(nèi)預(yù)測(cè)模式中的每一者的每一組變換單元分區(qū)中存在相等數(shù)目的變換單元分區(qū)。
[0157]在本發(fā)明的另一實(shí)例中,確定變換單元分區(qū)(926)可包含:根據(jù)所確定的幀內(nèi)預(yù)測(cè)模式對(duì)視頻數(shù)據(jù)塊執(zhí)行幀內(nèi)預(yù)測(cè)以產(chǎn)生預(yù)測(cè)殘差;根據(jù)預(yù)測(cè)殘差測(cè)試多個(gè)變換分區(qū);以及基于所述測(cè)試選擇所述多個(gè)變換分區(qū)中的一者。
[0158]圖10是描繪根據(jù)本發(fā)明實(shí)例的實(shí)例視頻解碼方法的流程圖。圖10的方法可由視頻解碼器30的一個(gè)或一個(gè)以上結(jié)構(gòu)執(zhí)行。
[0159]最初,作為任選步驟,視頻解碼器30可經(jīng)配置以接收來(lái)自視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元(PU)分區(qū)中的一預(yù)測(cè)單元分區(qū)的指示(1020),且基于所述預(yù)測(cè)單元分區(qū)確定一組幀內(nèi)預(yù)測(cè)模式(1022)。
[0160]在一個(gè)實(shí)例中,所述預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。在另一實(shí)例中,所述預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
[0161]視頻解碼器30可進(jìn)一步經(jīng)配置以接收來(lái)自視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式的一幀內(nèi)預(yù)測(cè)模式的指示(1024),基于所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū)(1026),且使用所確定的變換單元分區(qū)來(lái)解碼視頻數(shù)據(jù)塊(1028)。
[0162]在一個(gè)實(shí)例中,所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且預(yù)測(cè)單元分區(qū)具有與所述所確定的變換單元分區(qū)相同的大小和形狀。在另一實(shí)例中,所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且預(yù)測(cè)單元分區(qū)具有與所確定的變換單元不同的大小和形狀。
[0163]在本發(fā)明的另一實(shí)例中,視頻解碼器30可經(jīng)配置以基于幀內(nèi)預(yù)測(cè)模式從一組變換單元分區(qū)確定所述變換單元分區(qū)。在一個(gè)實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。在另一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。在又一實(shí)例中,所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
[0164]變換單元分區(qū)集合可具有不同數(shù)目的分區(qū)。在一個(gè)實(shí)例中,變換單元分區(qū)集合每幀內(nèi)預(yù)測(cè)模式僅包含一個(gè)變換單元分區(qū)。在另一實(shí)例中,多個(gè)幀內(nèi)預(yù)測(cè)模式中的每一者的每一組變換單元分區(qū)中存在相等數(shù)目的變換單元分區(qū)。
[0165]在一個(gè)或一個(gè)以上實(shí)例中,所描述的功能可以硬件、軟件、固件或其任何組合來(lái)實(shí)施。如果以軟件來(lái)實(shí)施,那么所述功能可作為一個(gè)或一個(gè)以上指令或代碼存儲(chǔ)在計(jì)算機(jī)可讀媒體上或經(jīng)由計(jì)算機(jī)可讀媒體而傳輸,且由基于硬件的處理單元執(zhí)行。計(jì)算機(jī)可讀媒體可包含計(jì)算機(jī)可讀存儲(chǔ)媒體,其對(duì)應(yīng)于例如數(shù)據(jù)存儲(chǔ)媒體等有形媒體,或包含例如根據(jù)通信協(xié)議促進(jìn)計(jì)算機(jī)程序從一處到另一處的傳送的任何媒體的通信媒體。以此方式,計(jì)算機(jī)可讀媒體通常可對(duì)應(yīng)于(I)非暫時(shí)性的有形計(jì)算機(jī)可讀存儲(chǔ)媒體,或(2)例如信號(hào)或載波的通信媒體。數(shù)據(jù)存儲(chǔ)媒體可為可由一個(gè)或一個(gè)以上計(jì)算機(jī)或一個(gè)或一個(gè)以上處理器存取以檢索指令、代碼和/或數(shù)據(jù)結(jié)構(gòu)以供實(shí)施本發(fā)明中所描述的技術(shù)的任何可用媒體。計(jì)算機(jī)程序產(chǎn)品可包含計(jì)算機(jī)可讀媒體。
[0166]作為實(shí)例(而非限制),所述計(jì)算機(jī)可讀存儲(chǔ)媒體可包括RAM、ROM、EEPROM、CD-R0M或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)裝置,或其它磁性存儲(chǔ)裝置,快閃存儲(chǔ)器,或可用于存儲(chǔ)呈指令或數(shù)據(jù)結(jié)構(gòu)的形式的所要程序代碼且可由計(jì)算機(jī)存取的任何其它媒體。同樣,可恰當(dāng)?shù)貙⑷魏芜B接稱作計(jì)算機(jī)可讀媒體。舉例來(lái)說(shuō),如果使用同軸電纜、光纖纜線、雙絞線、數(shù)字訂戶線(DSL)或例如紅外線、無(wú)線電及微波等無(wú)線技術(shù)從網(wǎng)站、服務(wù)器或其它遠(yuǎn)程源傳輸指令,那么同軸電纜、光纖纜線、雙絞線、DSL或例如紅外線、無(wú)線電及微波等無(wú)線技術(shù)包含于媒體的定義中。然而,應(yīng)理解,計(jì)算機(jī)可讀存儲(chǔ)媒體和數(shù)據(jù)存儲(chǔ)媒體不包含連接、載波、信號(hào)或其它瞬態(tài)媒體,而是針對(duì)非瞬態(tài)有形存儲(chǔ)媒體。如本文中所使用,磁盤及光盤包括緊密光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟磁盤及藍(lán)光光盤,其中磁盤通常磁性地復(fù)制數(shù)據(jù),而光盤使用激光光學(xué)地復(fù)制數(shù)據(jù)。上文的組合也應(yīng)包括在計(jì)算機(jī)可讀媒體的范圍內(nèi)。
[0167]指令可由一個(gè)或一個(gè)以上處理器執(zhí)行,例如一個(gè)或一個(gè)以上數(shù)字信號(hào)處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程邏輯陣列(FPGA),或其它等效集成或離散邏輯電路。因此,如本文中所使用的術(shù)語(yǔ)“處理器”可指上述結(jié)構(gòu)或適合于實(shí)施本文中所描述的技術(shù)的任一其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文所述的功能性可提供于經(jīng)配置以用于編碼和解碼的專用硬件和/或軟件模塊內(nèi),或并入在組合式編解碼器中。并且,可將所述技術(shù)完全實(shí)施于一個(gè)或一個(gè)以上電路或邏輯元件中。
[0168]本發(fā)明的技術(shù)可在各種各樣的裝置或設(shè)備中實(shí)施,包含無(wú)線手持機(jī)、集成電路(IC)或一組IC(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元,以強(qiáng)調(diào)經(jīng)配置以執(zhí)行所揭示技術(shù)的裝置的功能方面,但不一定要求由不同硬件單元來(lái)實(shí)現(xiàn)。相反,如上文所述,各種單元可組合在編解碼器硬件單元中,或由互操作硬件單元的集合提供,包含如上文所述的一個(gè)或一個(gè)以上處理器,結(jié)合合適的軟件和/或固件。
[0169]已描述了各種實(shí)例。這些和其它實(shí)例在所附權(quán)利要求書的范圍內(nèi)。
【權(quán)利要求】
1.一種視頻編碼方法,其包括: 從視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式確定一幀內(nèi)預(yù)測(cè)模式; 基于所述所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū);以及 使用所述所確定的變換單元分區(qū)來(lái)編碼所述視頻數(shù)據(jù)塊。
2.根據(jù)權(quán)利要求1所述的視頻編碼方法, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)單元的分區(qū)具有與所述所確定的變換單元分區(qū)相同的大小和形狀。
3.根據(jù)權(quán)利要求1所述的視頻編碼方法,所述方法進(jìn)一步包括: 基于所述所確定的幀內(nèi)預(yù)測(cè)模式確定一組變換單元分區(qū),其中確定所述視頻數(shù)據(jù)塊的所述變換單元分區(qū)包括從所述組變換單元分區(qū)確定所述變換單元分區(qū)。
4.根據(jù)權(quán)利要求3所述的視頻編碼方法,其中所述所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。
5.根據(jù)權(quán)利要求3所述的視頻編碼方法,其中所述所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。
6.根據(jù)權(quán)利要求3所述的視頻編碼方法,其中所述所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且其中所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
7.根據(jù)權(quán)利要求3所述的視頻編碼方法,其中所述組變換單元分區(qū)每幀內(nèi)預(yù)測(cè)模式僅包含一個(gè)變換單元分區(qū)。
8.根據(jù)權(quán)利要求3所述的視頻編碼方法,其中所述多個(gè)幀內(nèi)預(yù)測(cè)模式中的每一者的每一組變換單元分區(qū)中存在相等數(shù)目的變換單元分區(qū)。
9.根據(jù)權(quán)利要求1所述的視頻編碼方法, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)的分區(qū)具有與所述所確定的變換單元分區(qū)不同的大小和形狀。
10.根據(jù)權(quán)利要求1所述的視頻編碼方法,其進(jìn)一步包括: 根據(jù)所述所確定的幀內(nèi)預(yù)測(cè)模式對(duì)所述視頻數(shù)據(jù)塊執(zhí)行幀內(nèi)預(yù)測(cè)以產(chǎn)生預(yù)測(cè)殘差, 其中確定所述變換單元分區(qū)包括: 根據(jù)所述預(yù)測(cè)殘差測(cè)試多個(gè)變換分區(qū);以及 基于所述測(cè)試選擇所述多個(gè)變換分區(qū)中的一者作為所述所確定變換分區(qū)。
11.根據(jù)權(quán)利要求1所述的視頻編碼方法,其進(jìn)一步包括: 在經(jīng)編碼視頻位流中用信號(hào)通知所述所確定變換分區(qū)。
12.根據(jù)權(quán)利要求1所述的視頻編碼方法,其進(jìn)一步包括: 從所述視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)中確定一預(yù)測(cè)單元分區(qū);以及 基于所述所確定的預(yù)測(cè)單元分區(qū)確定所述組幀內(nèi)預(yù)測(cè)模式。
13.根據(jù)權(quán)利要求12所述的視頻編碼方法,其中所述所確定的預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。
14.根據(jù)權(quán)利要求12所述的視頻編碼方法,其中所述所確定的預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
15.一種視頻解碼方法,其包括: 接收來(lái)自視頻數(shù)據(jù)塊的多個(gè)幀內(nèi)預(yù)測(cè)模式中的一幀內(nèi)預(yù)測(cè)模式的指示;基于所述所接收到的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū);以及 使用所述所確定的變換單元分區(qū)來(lái)解碼所述視頻數(shù)據(jù)塊。
16.根據(jù)權(quán)利要求15所述的視頻解碼方法, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)單元的分區(qū)具有與所述所確定的變換單元分區(qū)相同的大小和形狀。
17.根據(jù)權(quán)利要求15所述的視頻解碼方法,所述方法進(jìn)一步包括: 基于所述幀內(nèi)預(yù)測(cè)模式確定一組變換單元分區(qū),其中確定所述視頻數(shù)據(jù)塊的所述變換單元分區(qū)包括從所述組變換單元分區(qū)確定所述變換單元分區(qū)。
18.根據(jù)權(quán)利要求17所述的視頻解碼方法,其中所述幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且其中所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。
19.根據(jù)權(quán)利要求17所述的視頻解碼方法,其中所述幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且其中所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。
20.根據(jù)權(quán)利要求17所述的視頻解碼方法,其中所述幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且其中所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
21.根據(jù)權(quán)利要求17所述的視頻解碼方法,其中所述組變換單元分區(qū)每幀內(nèi)預(yù)測(cè)模式僅包含一個(gè)變換單元分區(qū)。
22.根據(jù)權(quán)利要求17所述的視頻解碼方法,其中所述多個(gè)幀內(nèi)預(yù)測(cè)模式中的每一者的每一組變換單元分區(qū)中存在相`等數(shù)目的變換單元分區(qū)。
23.根據(jù)權(quán)利要求15所述的視頻解碼方法, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)單元的分區(qū)具有與所述所確定的變換單元分區(qū)不同的大小和形狀。
24.根據(jù)權(quán)利要求15所述的視頻解碼方法,其進(jìn)一步包括: 接收來(lái)自所述視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)的一預(yù)測(cè)單元分區(qū)的指示;以及基于所述預(yù)測(cè)單元分區(qū)確定所述組幀內(nèi)預(yù)測(cè)模式。
25.根據(jù)權(quán)利要求24所述的視頻解碼方法,其中所述預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。
26.根據(jù)權(quán)利要求24所述的視頻解碼方法,其中所述預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
27.一種視頻編碼設(shè)備,其包括: 視頻編碼器,其經(jīng)配置以: 從視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式確定一幀內(nèi)預(yù)測(cè)模式; 基于所述所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū);以及 使用所述所確定的變換單元分區(qū)來(lái)編碼所述視頻數(shù)據(jù)塊。
28.根據(jù)權(quán)利要求27所述的視頻編碼設(shè)備, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)單元的分區(qū)具有與所述所確定的變換單元分區(qū)相同的大小和形狀。
29.根據(jù)權(quán)利要求27所述的視頻編碼設(shè)備,其中所述視頻編碼器進(jìn)一步經(jīng)配置以: 基于所述所確定的幀內(nèi)預(yù)測(cè)模式確定一組變換單元分區(qū),其中確定所述視頻數(shù)據(jù)塊的所述變換單元分區(qū)包括從所述組變換單元分區(qū)確定所述變換單元分區(qū)。
30.根據(jù)權(quán)利要求29所述的視頻編碼設(shè)備,其中所述所確定的幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。
31.根據(jù)權(quán)利要求29所述的視頻編碼設(shè)備,其中所述所確定的幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。
32.根據(jù)權(quán)利要求29所述的視頻編碼設(shè)備,其中所述所確定的幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且其中所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
33.根據(jù)權(quán)利要求29所述的視頻編碼設(shè)備,其中所述組變換單元分區(qū)每幀內(nèi)預(yù)測(cè)模式僅包含一個(gè)變換單元分區(qū)。
34.根據(jù)權(quán)利要求29所述的視頻編碼設(shè)備,其中所述多個(gè)幀內(nèi)預(yù)測(cè)模式中的每一者的每一組變換單元分區(qū)中存在相等數(shù)目的變換單元分區(qū)。
35.根據(jù)權(quán)利要求27所述的視頻編碼設(shè)備, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)單元的分區(qū)具有與所述所確定的變換單元分區(qū)不同的大小和形狀。
36.根據(jù)權(quán)利要求27所述的視頻編碼設(shè)備,其中所述視頻編碼器進(jìn)一步經(jīng)配置以: 根據(jù)所述所確定的幀內(nèi)預(yù)測(cè)模式對(duì)所述視頻數(shù)據(jù)塊執(zhí)行幀內(nèi)預(yù)測(cè)以產(chǎn)生預(yù)測(cè)殘差; 根據(jù)所述預(yù)測(cè)殘差測(cè)試多個(gè)變換分區(qū);以及 基于所述測(cè)試選擇所述 多個(gè)變換分區(qū)中的一者作為所述所確定變換分區(qū)。
37.根據(jù)權(quán)利要求27所述的視頻編碼設(shè)備,其中所述視頻編碼器進(jìn)一步經(jīng)配置以: 在經(jīng)編碼視頻位流中用信號(hào)通知所述所確定變換分區(qū)。
38.根據(jù)權(quán)利要求27所述的視頻編碼設(shè)備,其中所述視頻編碼器進(jìn)一步經(jīng)配置以: 從所述視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)中確定一預(yù)測(cè)單元分區(qū);以及 基于所述所確定的預(yù)測(cè)單元分區(qū)確定所述組幀內(nèi)預(yù)測(cè)模式。
39.根據(jù)權(quán)利要求38所述的視頻編碼設(shè)備,其中所述所確定的預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。
40.根據(jù)權(quán)利要求38所述的視頻編碼設(shè)備,其中所述所確定的預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
41.一種視頻解碼設(shè)備,其包括: 視頻解碼器,其經(jīng)配置以: 接收來(lái)自視頻數(shù)據(jù)塊的多個(gè)幀內(nèi)預(yù)測(cè)模式中的一幀內(nèi)預(yù)測(cè)模式的指示; 基于所述所接收到的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū);以及 使用所述所確定的變換單元分區(qū)來(lái)解碼所述視頻數(shù)據(jù)塊。
42.根據(jù)權(quán)利要求41所述的視頻解碼設(shè)備, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)單元的分區(qū)具有與所述所確定的變換單元分區(qū)相同的大小和形狀。
43.根據(jù)權(quán)利要求41所述的視頻解碼設(shè)備,其中所述視頻解碼器進(jìn)一步經(jīng)配置以: 基于所述幀內(nèi)預(yù)測(cè)模式確定一組變換單元分區(qū),其中確定所述視頻數(shù)據(jù)塊的所述變換單元分區(qū)包括從所述組變換單元分區(qū)確定所述變換單元分區(qū)。
44.根據(jù)權(quán)利要求43所述的視頻解碼設(shè)備,其中所述幀內(nèi)預(yù)測(cè)模式為垂直定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含垂直定向的非正方形變換單元分區(qū)。
45.根據(jù)權(quán)利要求43所述的視頻解碼設(shè)備,其中所述幀內(nèi)預(yù)測(cè)模式為水平定向的幀內(nèi)預(yù)測(cè)模式,且所述組變換單元分區(qū)包含水平定向的非正方形變換單元分區(qū)。
46.根據(jù)權(quán)利要求43所述的視頻解碼設(shè)備,其中所述幀內(nèi)預(yù)測(cè)模式為DC模式、平面模式或?qū)蔷€模式,且其中所述組變換單元分區(qū)包含正方形變換單元分區(qū)。
47.根據(jù)權(quán)利要求43所述的視頻解碼設(shè)備,其中所述組變換單元分區(qū)每幀內(nèi)預(yù)測(cè)模式僅包含一個(gè)變換單元分區(qū)。
48.根據(jù)權(quán)利要求43所述的視頻解碼設(shè)備,其中所述多個(gè)幀內(nèi)預(yù)測(cè)模式中的每一者的每一組變換單元分區(qū)中存在相等數(shù)目的變換單元分區(qū)。
49.根據(jù)權(quán)利要求41所述的視頻解碼設(shè)備, 其中所述視頻數(shù)據(jù)塊為預(yù)測(cè)單元,且其中所述預(yù)測(cè)單元的預(yù)測(cè)分區(qū)具有與所述所確定的變換單元分區(qū)不同的大小和形狀。
50.根據(jù)權(quán)利要求41所述的視頻解碼設(shè)備,其中所述視頻解碼器進(jìn)一步經(jīng)配置以: 接收來(lái)自所述視頻數(shù)據(jù)塊的多個(gè)預(yù)測(cè)單元分區(qū)的一預(yù)測(cè)單元分區(qū)的指示;以及 基于所述預(yù)測(cè)單元分區(qū)確定所述組幀內(nèi)預(yù)測(cè)模式。
51.根據(jù)權(quán)利要求50所述的視頻解碼設(shè)備,其中所述預(yù)測(cè)單元分區(qū)為垂直定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含垂直定向的幀內(nèi)預(yù)測(cè)模式。
52.根據(jù)權(quán)利要求50所述的視頻解碼設(shè)備,其中所述預(yù)測(cè)單元分區(qū)為水平定向的非正方形預(yù)測(cè)單元分區(qū),且其中所述組幀內(nèi)預(yù)測(cè)模式包含水平定向的幀內(nèi)預(yù)測(cè)模式。
53.一種視頻編碼設(shè)備,其包括: 用于從視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式確定一幀內(nèi)預(yù)測(cè)模式的裝置; 用于基于所述所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū)的裝置;以及 用于使用所述所確定的變換單元分區(qū)來(lái)編碼所述視頻數(shù)據(jù)塊的裝置。
54.一種視頻解碼設(shè)備,其包括: 用于接收來(lái)自視頻數(shù)據(jù)塊的多個(gè)幀內(nèi)預(yù)測(cè)模式中的一幀內(nèi)預(yù)測(cè)模式的指示的裝置; 用于基于所述所接收到的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū)的裝置;以及 用于使用所述所確定的變換單元分區(qū)來(lái)解碼所述視頻數(shù)據(jù)塊的裝置。
55.一種存儲(chǔ)指令的計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令在被執(zhí)行時(shí)致使經(jīng)配置以編碼視頻數(shù)據(jù)的一個(gè)或一個(gè)以上處理器: 從視頻數(shù)據(jù)塊的一組幀內(nèi)預(yù)測(cè)模式確定一幀內(nèi)預(yù)測(cè)模式; 基于所述所確定的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū);以及 使用所述所確定的變換單元分區(qū)來(lái)編碼所述視頻數(shù)據(jù)塊。
56.一種存儲(chǔ)指令的計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令在被執(zhí)行時(shí)致使經(jīng)配置以解碼視頻數(shù)據(jù)的一個(gè)或一個(gè)以上處理器: 接收來(lái)自視頻數(shù)據(jù)塊的多個(gè)幀內(nèi)預(yù)測(cè)模式中的一幀內(nèi)預(yù)測(cè)模式的指示; 基于所述所接收到的幀內(nèi)預(yù)測(cè)模式確定所述視頻數(shù)據(jù)塊的變換單元分區(qū);以及使用所述所確定的變換單元分區(qū)來(lái)解碼所述視頻數(shù)據(jù)塊。
【文檔編號(hào)】H04N19/122GK103797801SQ201280044246
【公開日】2014年5月14日 申請(qǐng)日期:2012年9月11日 優(yōu)先權(quán)日:2011年9月12日
【發(fā)明者】翔林·王, 馬爾塔·卡切維奇, 郭立威 申請(qǐng)人:高通股份有限公司