两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

H.265視頻編碼中變換與反變換的快速實施方法

文檔序號:7823191閱讀:349來源:國知局
H.265視頻編碼中變換與反變換的快速實施方法
【專利摘要】本發(fā)明公開了一種H.265視頻編碼中變換與反變換的快速實施方法,源數(shù)據(jù)正變換A1),將系數(shù)矩陣T轉(zhuǎn)置得到T’,將源數(shù)據(jù)X左乘于轉(zhuǎn)置后的系數(shù)矩陣T’,得到中間結(jié)果XT’;A2),將中間結(jié)果XT’右乘于系數(shù)矩陣T,得到變換域數(shù)據(jù)Y=TXT’;變換域數(shù)據(jù)反變換,B1),將系數(shù)矩陣T轉(zhuǎn)置得到T’,將變換域數(shù)據(jù)Y右乘于轉(zhuǎn)置后的系數(shù)矩陣T’,得到中間結(jié)果T’Y;B2),將中間結(jié)果T’Y左乘于系數(shù)矩陣T,得到源數(shù)據(jù)X=T’YT。本發(fā)明將數(shù)據(jù)級并行與系數(shù)級并行相結(jié)合的SIMD實施方法,避免運算過程中所需的兩次轉(zhuǎn)置,降低了運算的復(fù)雜度,提升了執(zhí)行效率,具有良好的應(yīng)用前景。
【專利說明】Η.265視頻編碼中變換與反變換的快速實施方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種Η.265視頻編碼中變換與反變換的快速實施方法,屬于視頻編碼【技術(shù)領(lǐng)域】。

【背景技術(shù)】
[0002]網(wǎng)絡(luò)視頻是互聯(lián)網(wǎng)最主要的應(yīng)用之一,高清視頻將是廣電領(lǐng)域的必然走向,移動視頻目前的發(fā)展態(tài)勢也呈現(xiàn)出井噴之勢??梢灶A(yù)見,視頻應(yīng)用在今后若干年都將是數(shù)字多媒體領(lǐng)域的最大熱點。
[0003]由于網(wǎng)絡(luò)帶寬、延時等因素的限制,視頻應(yīng)用中面臨的首要難點就是視頻編解碼問題,視頻編解碼系統(tǒng)是視頻應(yīng)用領(lǐng)域的核心,它決定著媒體服務(wù)的質(zhì)量,它直接影響網(wǎng)絡(luò)帶寬需求、用戶體驗質(zhì)量、解碼設(shè)備需求、直播延遲等關(guān)鍵問題。因此高效的視頻編解碼系統(tǒng)一直是廣電、互聯(lián)網(wǎng)視頻、視頻協(xié)作廠商等競相追逐的重點對象。Η.265視頻編碼是國際標準化組織MPEG和ITU-TVCEG繼H.264之后聯(lián)合制定的新一代視頻編碼標準。H.265沿用了前代視頻編碼標準所慣用的基于塊的預(yù)測變換混合編碼框架,并且在預(yù)測、變換、熵編碼、環(huán)路濾波等核心模塊進行了一系列重要的創(chuàng)新和改進,如更加靈活的四叉樹編碼結(jié)構(gòu),更加復(fù)雜和精確的幀內(nèi)和幀間預(yù)測方法、更加先進的環(huán)路濾波技術(shù),使得壓縮性能相比H.264提升了一倍。
[0004]H.265視頻編碼標準的有效地提高了視頻壓縮性能,但是,同時也為視頻編碼過程帶來了更多的計算負擔,新的編碼工具集為編碼過程提供了更多的選擇,要達到最優(yōu)編碼性能,需要在這個工具集中尋找最優(yōu)組合,這個搜索過程的復(fù)雜度是相當高的。最顯著地,
H.265相比H.264編碼和預(yù)測塊的劃分形式更加靈活,它首先把編碼的基本單位抽象為編碼單元⑶、預(yù)測單元PU和變換單元TU三個層次,從64x64到4x4,每一層⑶都可以支持2Nx2N,NxN,2NxN,Nx2N 四種對稱 PU 劃分方式和和 2Nx0.5U,2Nx0.5D,0.5Lx2N,0.5Rx2N 四種非對稱TO劃分方式。理論上,編碼器要獲得最優(yōu)編碼性能需要通過遞歸遍歷的方式檢查所有可能的CU和PU劃分組合,這個過程的運算復(fù)雜度是極高的。根據(jù)測試結(jié)果,HM參考編碼器(H.265標準的參考軟件)的編碼速度是視頻序列時間長度的數(shù)百倍到數(shù)千倍之間。但是,在實時視頻通信應(yīng)用領(lǐng)域,例如視頻會議、視頻直播、視頻電話等場合,需要對視頻進行實時編碼,對所有編碼模式和工具做遍歷擇優(yōu)的做法是極不現(xiàn)實的。
[0005]上述介紹可知,H.265視頻編碼在4x4,8x8的基礎(chǔ)上增加16x16,32x32大小的變換,使變換/反變換的運算復(fù)雜度大幅提升,采用X86或者ARM處理器提供的單指令多數(shù)據(jù)指令集(single instruct1n mult1-data,SIMD),常規(guī)的做法是對多個數(shù)據(jù)做數(shù)據(jù)級的并行處理,以提高速度,數(shù)據(jù)級數(shù)據(jù)并行處理要求數(shù)據(jù)矩陣右乘于系數(shù)矩陣,不可避免地需要伴隨兩次矩陣的轉(zhuǎn)置運算,正變換是在兩次矩陣相乘之前對數(shù)據(jù)各做一次轉(zhuǎn)置,反變換是在兩次矩陣相乘之后對數(shù)據(jù)各做一次轉(zhuǎn)置,具體介紹如下,
[0006]正變換的運算如下,Y = TXT’,’表示轉(zhuǎn)置運算符,采用數(shù)據(jù)級并行,首先對輸入X轉(zhuǎn)置得到X’,右乘于系數(shù)矩陣得到中間結(jié)果TX’,然后對中間結(jié)果轉(zhuǎn)置得到(TX’)’ = XT’,再右乘于系數(shù)矩陣得到Y(jié) = TXT’ ;
[0007]反變換的運算如下:X = T’ YT,采用數(shù)據(jù)級并行,首先計算第一次矩陣相乘T’ Y,對結(jié)果轉(zhuǎn)置得到(T’ Y) ’ = Y’ T,將其右乘于T’做第二次矩陣相乘得到T’ V T,再轉(zhuǎn)置得到最終結(jié)果(τ,Y’ T) ’ = T,YTo
[0008]對于眾多數(shù)據(jù)的變換,轉(zhuǎn)置本身的復(fù)雜度相當可觀,如何有效地實施加快變換運算的速度,是當前急需解決的冋題。


【發(fā)明內(nèi)容】

[0009]本發(fā)明的目的克服現(xiàn)有的Η.265視頻編碼的變換運算的高復(fù)雜度,運算時間長的問題。本發(fā)明的Η.265視頻編碼中變換與反變換的快速實施方法,將數(shù)據(jù)級并行與系數(shù)級并行相結(jié)合的SIMD實施方法,避免運算過程中所需的兩次轉(zhuǎn)置,有效地降低了變換/反變換運算的復(fù)雜度,提升了執(zhí)行效率,且不影響計算處理的精確度,具有良好的應(yīng)用前景。
[0010]為了達到上述目的,本發(fā)明所采用的技術(shù)方案是:
[0011]一種Η.265視頻編碼中變換與反變換的快速實施方法,其特征在于:通過系數(shù)級并行與數(shù)據(jù)級并行結(jié)合的方式執(zhí)行變換與反變換,
[0012]源數(shù)據(jù)正變換包括以下步驟,
[0013]步驟(Α1),將系數(shù)矩陣Τ轉(zhuǎn)置得到Τ’,將源數(shù)據(jù)X左乘于轉(zhuǎn)置后的系數(shù)矩陣Τ’,采用系數(shù)級并行,執(zhí)行第一次矩陣相乘,得到中間結(jié)果XT’ ;
[0014]步驟(A2),將中間結(jié)果XT’右乘于系數(shù)矩陣T,采用數(shù)據(jù)級并行,執(zhí)行第二次矩陣相乘,得到變換域數(shù)據(jù)Y = TXT’ ;
[0015]變換域數(shù)據(jù)反變換包括以下步驟,
[0016]步驟(B1),將系數(shù)矩陣T轉(zhuǎn)置得到T’,將變換域數(shù)據(jù)Y右乘于轉(zhuǎn)置后的系數(shù)矩陣T’,采用數(shù)據(jù)級并行,執(zhí)行第一次矩陣相乘,得到中間結(jié)果T’ Y ;
[0017]步驟(B2),將中間結(jié)果Τ’ Y左乘于系數(shù)矩陣T,采用系數(shù)級并行,執(zhí)行第二次矩陣相乘,得到源數(shù)據(jù)x = T’YT。
[0018]前述的一種Η.265視頻編碼中變換與反變換的快速實施方法,其特征在于:在步驟(Α1)、步驟(Β2)左乘于轉(zhuǎn)置后的系數(shù)矩陣Τ’或左乘于系數(shù)矩陣Τ時,每一行數(shù)據(jù)做一次并行處理,每次得到一行處理結(jié)果。
[0019]前述的一種Η.265視頻編碼中變換與反變換的快速實施方法,其特征在于:在步驟(Α2)、步驟(Β1)右乘于系數(shù)矩陣Τ或右乘于轉(zhuǎn)置后的系數(shù)矩陣Τ’時,在不同數(shù)據(jù)行之間做并行處理,同時得到多行處理結(jié)果。
[0020]前述的一種Η.265視頻編碼中變換與反變換的快速實施方法,其特征在于:在步驟(Α1)、步驟(Β1)中第一次矩陣相乘中,對于4x4,8x8,16x16,32x32矩陣變換時,各矩陣元素多右移1,2,3,4位;在步驟(Α2)、步驟(Β2)中第二次矩陣相乘中,對于4x4,8x8,16x16,32x32矩陣變換時,各矩陣元素少右移1,2,3,4位。
[0021]前述的一種Η.265視頻編碼中變換與反變換的快速實施方法,其特征在于:步驟(Α1)、步驟(Β2)所述系數(shù)級并行表示為數(shù)據(jù)矩陣左乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)不同的系數(shù),但同一行系數(shù)對應(yīng)相同數(shù)據(jù),并行在同一數(shù)據(jù)行內(nèi)部展開。
[0022]前述的一種Η.265視頻編碼中變換與反變換的快速實施方法,其特征在于:步驟(A2)、步驟(B1)所述數(shù)據(jù)級并行表示為數(shù)據(jù)矩陣右乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)相同的系數(shù)。
[0023]本發(fā)明的有益效果是:本發(fā)明的H.265視頻編碼中變換與反變換的快速實施方法,將數(shù)據(jù)級并行與系數(shù)級并行相結(jié)合的SIMD實施方法,避免運算過程中所需的兩次轉(zhuǎn)置,有效地降低了變換/反變換運算的復(fù)雜度,提升了執(zhí)行效率,且不影響計算處理的精確度,具有良好的應(yīng)用前景。

【專利附圖】

【附圖說明】
[0024]圖1是本發(fā)明的H.265視頻編碼中變換與反變換的快速實施方法的流程圖。

【具體實施方式】
[0025]下面將結(jié)合說明書附圖,以下實施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,而不能以此來限制本發(fā)明的保護范圍。
[0026]本發(fā)明的H.265視頻編碼中變換與反變換的快速實施方法,將數(shù)據(jù)級并行與系數(shù)級并行相結(jié)合的SIMD實施方法,避免運算過程中所需的兩次轉(zhuǎn)置,有效地降低了變換/反變換運算的復(fù)雜度,提升了執(zhí)行效率,且不影響計算處理的精確度,具體包括以下步驟,
[0027]源數(shù)據(jù)正變換包括以下步驟,
[0028]步驟(A1),將系數(shù)矩陣T轉(zhuǎn)置得到T’,將源數(shù)據(jù)X左乘于轉(zhuǎn)置后的系數(shù)矩陣T’,采用系數(shù)級并行,執(zhí)行第一次矩陣相乘,得到中間結(jié)果XT’ ;
[0029]步驟(A2),將中間結(jié)果XT’右乘于系數(shù)矩陣T,采用數(shù)據(jù)級并行,執(zhí)行第二次矩陣相乘,得到變換域數(shù)據(jù)Y = TXT’ ;
[0030]變換域數(shù)據(jù)反變換包括以下步驟,
[0031]步驟(B1),將系數(shù)矩陣T轉(zhuǎn)置得到T’,將變換域數(shù)據(jù)Y右乘于轉(zhuǎn)置后的系數(shù)矩陣T’,采用數(shù)據(jù)級并行,執(zhí)行第一次矩陣相乘,得到中間結(jié)果T’ Y ;
[0032]步驟(B2),將中間結(jié)果Τ’ Y左乘于系數(shù)矩陣T,采用系數(shù)級并行,執(zhí)行第二次矩陣相乘,得到源數(shù)據(jù)x = T’YT。
[0033]其中,在步驟(Α1)、步驟(Β2)左乘于轉(zhuǎn)置后的系數(shù)矩陣Τ’或左乘于系數(shù)矩陣Τ時,每一行數(shù)據(jù)做一次并行處理,每次得到一行處理結(jié)果,在步驟(Α2)、步驟(Β1)右乘于系數(shù)矩陣Τ或右乘于轉(zhuǎn)置后的系數(shù)矩陣Τ’時,在不同數(shù)據(jù)行之間做并行處理,同時得到多行處理結(jié)果,采用數(shù)據(jù)級并行與系數(shù)級并行結(jié)合的方式,其中,步驟(Α1)、步驟(Β2)系數(shù)級并行表示為數(shù)據(jù)矩陣左乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)不同的系數(shù),但同一行系數(shù)對應(yīng)相同數(shù)據(jù),并行在同一數(shù)據(jù)行內(nèi)部展開;步驟(Α2)、步驟(Β1)所述數(shù)據(jù)級并行表示為數(shù)據(jù)矩陣右乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)相同的系數(shù),數(shù)據(jù)級并行在正變換的第二次矩陣相乘以及反變換的第一次矩陣相乘時執(zhí)行,實施數(shù)據(jù)級并行時,數(shù)據(jù)矩陣右乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)相同的系數(shù)。以DCT8x8的odd部分為例,
[0034]yn= t 1(3*ο07ι+?η*ο16ι+?12*ο25ι+?13*ο34ι
[0035]y3i= t 30*ο07ι+?31*ο16ι+?32*ο25ι+?33*ο34ι
[0036]y5i= t 5(3*ο07ι+?51*ο16ι+?52*ο25ι+?53*ο34ι
[0037]y7i= t 7(3*ο07ι+?71*ο16ι+?72*ο25ι+?73*ο34ι
[0038]在ARM體系結(jié)構(gòu)下,采用并行乘法和乘加指令,并行計算如下:
[0039]{t10*o070, 1^*007” t1(l*o072,t10*o073}
[0040]+
[0041]{t30*o070, 130*007^ t3(l*o072,t30*o073}
[0042]在x86體系結(jié)構(gòu)下,采用pmaddwd并行乘加指令,并行計算如下:
[0043]{t^^oOTo+tn^olBo, tn^oC^+tn*。]^,t1(l*o072+tn*ol62,t1(l*o073+tn*ol63}
[0044]實施系數(shù)級并行時,數(shù)據(jù)矩陣左乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)不同的系數(shù),但同一行系數(shù)對應(yīng)相同數(shù)據(jù)。并行在同一數(shù)據(jù)行內(nèi)部展開。
[0045]在ARM體系結(jié)構(gòu)下,采用并行乘法和乘加指令,并行計算如下:
[0046]{t10*o070, t30*o070, t50*o070, t70*o070}
[0047]+
[0048]{tn*ol60, t31*ol60, t51*ol60, t71*ol60}
[0049]在x86體系結(jié)構(gòu)下,采用pmaddwd并行乘加指令,并行計算如下:
[0050]{t^^oOTo+tn^olBo, t30*o070+t31*ol60, tgo^oOTo+tg^olBo, t7(l*o07Q+t71*ol60}。
[0051]為保證步驟(A2)、步驟(B2)的矩陣乘法能夠?qū)嵤?6位整數(shù)乘法操作,對步驟(A1)、步驟(B1)中第一次矩陣相乘各元素的右移位數(shù),采用與H.265參考軟件HM不同的精度,具體實施為在步驟(A1)、步驟(B1)中第一次矩陣相乘中,對于4x4,8x8,16x16,32x32矩陣變換時,各矩陣元素多右移1,2,3,4位或更多;在步驟(A2)、步驟(B2)中第二次矩陣相乘中,對于4x4,8x8,16x16,32x32矩陣變換時,各矩陣元素少右移1,2,3,4位或更多。
[0052]以上顯示和描述了本發(fā)明的基本原理、主要特征及優(yōu)點。本行業(yè)的技術(shù)人員應(yīng)該了解,本發(fā)明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會有各種變化和改進,這些變化和改進都落入要求保護的本發(fā)明范圍內(nèi)。本發(fā)明要求保護范圍由所附的權(quán)利要求書及其等效物界定。
【權(quán)利要求】
1.一種H.265視頻編碼中變換與反變換的快速實施方法,其特征在于:通過系數(shù)級并行與數(shù)據(jù)級并行結(jié)合的方式執(zhí)行變換與反變換, 源數(shù)據(jù)正變換包括以下步驟, 步驟(Al),將系數(shù)矩陣T轉(zhuǎn)置得到T’,將源數(shù)據(jù)X左乘于轉(zhuǎn)置后的系數(shù)矩陣T’,采用系數(shù)級并行,執(zhí)行第一次矩陣相乘,得到中間結(jié)果XT’ ; 步驟(A2),將中間結(jié)果XT’右乘于系數(shù)矩陣T,采用數(shù)據(jù)級并行,執(zhí)行第二次矩陣相乘,得到變換域數(shù)據(jù)Y = TXT’ ; 變換域數(shù)據(jù)反變換包括以下步驟, 步驟(BI),將系數(shù)矩陣T轉(zhuǎn)置得到T’,將變換域數(shù)據(jù)Y右乘于轉(zhuǎn)置后的系數(shù)矩陣T’,采用數(shù)據(jù)級并行,執(zhí)行第一次矩陣相乘,得到中間結(jié)果T’ Y ; 步驟(B2),將中間結(jié)果T’Y左乘于系數(shù)矩陣T,采用系數(shù)級并行,執(zhí)行第二次矩陣相乘,得到源數(shù)據(jù)X = Τ’ ΥΤ。
2.根據(jù)權(quán)利要求1所述的一種H.265視頻編碼中變換與反變換的快速實施方法,其特征在于:在步驟(Al)、步驟(Β2)左乘于轉(zhuǎn)置后的系數(shù)矩陣Τ’或左乘于系數(shù)矩陣T時,每一行數(shù)據(jù)做一次并行處理,每次得到一行處理結(jié)果。
3.根據(jù)權(quán)利要求1所述的一種H.265視頻編碼中變換與反變換的快速實施方法,其特征在于:在步驟(Α2)、步驟(BI)右乘于系數(shù)矩陣T或右乘于轉(zhuǎn)置后的系數(shù)矩陣Τ’時,在不同數(shù)據(jù)行之間做并行處理,同時得到多行處理結(jié)果。
4.根據(jù)權(quán)利要求1所述的一種H.265視頻編碼中變換與反變換的快速實施方法,其特征在于:在步驟(Al)、步驟(BI)中第一次矩陣相乘中,對于4χ4,8χ8,16x16,32x32矩陣變換時,各矩陣元素多右移1,2,3,4位;在步驟(Α2)、步驟(Β2)中第二次矩陣相乘中,對于4x4,8x8,16x16,32x32矩陣變換時,各矩陣元素少右移1,2,3,4位。
5.根據(jù)權(quán)利要求1所述的一種H.265視頻編碼中變換與反變換的快速實施方法,其特征在于:步驟(Al)、步驟(Β2)所述系數(shù)級并行表示為數(shù)據(jù)矩陣左乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)不同的系數(shù),但同一行系數(shù)對應(yīng)相同數(shù)據(jù),并行在同一數(shù)據(jù)行內(nèi)部展開。
6.根據(jù)權(quán)利要求1所述的一種H.265視頻編碼中變換與反變換的快速實施方法,其特征在于:步驟(Α2)、步驟(BI)所述數(shù)據(jù)級并行表示為數(shù)據(jù)矩陣右乘于系數(shù)矩陣,同一行數(shù)據(jù)對應(yīng)相同的系數(shù)。
【文檔編號】H04N19/122GK104486629SQ201410783840
【公開日】2015年4月1日 申請日期:2014年12月16日 優(yōu)先權(quán)日:2014年12月16日
【發(fā)明者】朱政, 王悅, 彭斌, 金星, 林松, 丁丹丹 申請人:南京仟壹視訊信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
星子县| 林口县| 内黄县| 化德县| 榆树市| 南安市| 江阴市| 高淳县| 丹巴县| 常宁市| 胶南市| 榆树市| 五台县| 浦东新区| 松原市| 阜平县| 东光县| 新晃| 安龙县| 陆丰市| 纳雍县| 平南县| 阳谷县| 乾安县| 红原县| 崇阳县| 中山市| 浠水县| 泗洪县| 阿拉尔市| 双流县| 通州市| 泽普县| 高州市| 静安区| 黎平县| 芜湖市| 甘泉县| 杭州市| 奉新县| 咸阳市|