两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法

文檔序號:7979924閱讀:299來源:國知局
專利名稱:一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法
技術(shù)領(lǐng)域
本發(fā)明屬于視頻壓縮傳輸技術(shù)技術(shù)領(lǐng)域,具體涉及一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法。
背景技術(shù)
高清視頻編碼最常用的編碼格式有MPEG-2-TS,MPEG-4,VC-I和H. ^4/AVC等。這些標(biāo)準(zhǔn)共有的特點(diǎn)是良好的網(wǎng)絡(luò)親和性和高效的編碼質(zhì)量,以及易于硬件實(shí)現(xiàn)等,因此在視頻壓縮方面得到廣泛的應(yīng)用。在視頻編碼器的硬件結(jié)構(gòu)中,幀間運(yùn)動估計(jì)模塊的計(jì)算復(fù)雜度和存儲帶寬消耗占50% 90%,因此,幀間運(yùn)動估計(jì)模塊的性能直接決定了編碼器的性能。幀間編碼的主要過程是首先將原始圖像劃塊,以塊為單位進(jìn)行運(yùn)動估計(jì),為了提高精度,通常將這些塊進(jìn)行再分割,以不同的尺寸塊進(jìn)行匹配搜索,目前主流編碼標(biāo)準(zhǔn)是將原始圖像劃分為16X16的宏塊MB (micro block),然后將該宏塊劃分為16X16,16X8, 8X16,8X8,8X4,4X8,4X4這7種分割,共41個當(dāng)前塊,在這種分割模式下,通過當(dāng)前塊的已編碼的相鄰塊的運(yùn)動信息即運(yùn)動矢量MV(motion ventor),在其參考幀圖像中得出一個預(yù)測塊,再以這個塊為中心,向外擴(kuò)m個像素,得出運(yùn)動估計(jì)的搜索窗口,含k個像素,k = (m*2+16)*(m*2+16)。然后讓這7種分割的41個子塊在這個搜索區(qū)域中進(jìn)行匹配搜索,再通過比較其代價(jià)的大小確定運(yùn)動矢量MV。運(yùn)動估計(jì)的硬件實(shí)現(xiàn)的主要關(guān)鍵技術(shù)高度數(shù)據(jù)利用率,低失真度和不同塊尺寸的代價(jià)關(guān)系。運(yùn)動估計(jì)的硬件實(shí)現(xiàn)的數(shù)據(jù)重用技術(shù),能有效的減少訪存次數(shù),從而有效的降低硬件資源消耗和系統(tǒng)功耗。目前,一種高度數(shù)據(jù)重用的硬件實(shí)現(xiàn)方法已成為研究熱點(diǎn)。已有文獻(xiàn)中規(guī)定了數(shù)據(jù)重用度的分級,A級機(jī)制重復(fù)使用一個當(dāng)前塊的相鄰參考塊中的重疊參考像素。B級機(jī)制重復(fù)使用一個當(dāng)前塊的相鄰參考條帶的重疊參考像素。C級機(jī)制重復(fù)使用相鄰的當(dāng)前塊的搜索窗口的重疊區(qū)域。D級機(jī)制重復(fù)使用連續(xù)的當(dāng)前塊的整個搜索窗口中的像素。A級機(jī)制有最小的存儲面積但需要最多的訪存次數(shù),D級機(jī)制訪存次數(shù)最小但是消耗最大的片上存儲空間。根據(jù)不同的需求,需要采用不同的數(shù)據(jù)重用機(jī)制來平衡存儲空間和存儲訪問之間的矛盾。目前的C級數(shù)據(jù)重用在目前的存儲帶寬限制下最為高效,因此最目前大多數(shù)設(shè)計(jì)采用C數(shù)據(jù)重用。搜索算法是運(yùn)動估計(jì)中的另一個關(guān)鍵,主要包括全搜索算法和快速搜索算法兩種方式。全搜索算法是將參考窗口中的所有位置逐次遍歷,這種方法具有最高的保真度,但是相對而言又有最大的硬件消耗。目前有很多快速搜索算法,但全部都是以失真為代價(jià)的,因此在系統(tǒng)允許的前提下,應(yīng)該盡量選擇失真度最小的搜索算法。可變塊尺寸的運(yùn)動估計(jì)算法,提高了精度,但是也帶來了很大的計(jì)算復(fù)雜度。更小的分割尺寸能將編碼的失真降到最小,因此而帶來的計(jì)算復(fù)雜度,可以通過其不同尺寸塊之間代價(jià)組合得出,有效的降低了計(jì)算復(fù)雜度。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法,有效的降低了存儲訪問的次數(shù),編碼速度完全能滿足高清視頻實(shí)時(shí)編碼的要求。本發(fā)明所采用的技術(shù)方案是,一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法, 其特征在于,具體步驟如下步驟1、根據(jù)用戶需求合理配置并行處理的PE單元個數(shù);步驟2、在PE單元內(nèi)部,計(jì)算基本塊代價(jià);步驟3、基于不同尺寸塊的代價(jià)相關(guān)性,得出各種分割模式下的不同塊的代價(jià);步驟4、逐行讀完全部參考數(shù)據(jù),將各個PE得到的最終代價(jià)進(jìn)行比較,取最小代價(jià)確定為運(yùn)動矢量MV。步驟2的具體方法為步驟2. 1、從片上存儲器中逐行讀出參考數(shù)據(jù)將該行數(shù)據(jù)與當(dāng)前宏塊MB的各行的每個像素求差模,其中,片上存儲器大小為(m*2+a)*(m*2+a)pixels,宏塊大小為a*a pixels, (-m, +m)為搜索范圍;步驟2. 2、將分屬a2/b個Mb塊的3 個差模進(jìn)行加和作為部分代價(jià),其中,b為最小分割塊的大?。徊襟E2. 3、根據(jù)不同的遍歷位置,確定部分代價(jià)的有效性,從而得出部分代價(jià)并產(chǎn)生其有效信號。步驟3的具體方法為步驟3. 1、設(shè)置存儲Mb塊代價(jià)的寄存器,并分配存儲空間;步驟3. 2、在每個存儲空間中設(shè)置計(jì)數(shù)器,得出判斷部分代價(jià)是否累加完整的信號 full ;步驟3. 3、判斷輸入步驟2. 3得到的部分代價(jià)的有效信號,將其對應(yīng)有效的部分代價(jià)按不同位置累加進(jìn)入已分配好的存儲空間;步驟3. 4、判斷full是否有效,將完整代價(jià)送出,同時(shí)送出的還有由該寄存器標(biāo)號得出的位置信息;步驟3. 5、返回步驟3. 2,直至得到a個3 塊Mb子塊的完整代價(jià),利用不同塊之間代價(jià)相關(guān)性,拼接得出各種分割模式的全部代價(jià);同時(shí),比較當(dāng)前送出的完整代價(jià)與前一位置的完整代價(jià),選擇失真小的位置的代價(jià)信息存儲,并將當(dāng)前代價(jià)也存儲做其他匹配模式使用。本發(fā)明一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法,充分的利用了參考數(shù)據(jù)空間上的相關(guān)性,在不降低編碼精度的前提下減少了訪存次數(shù),在配置與橫向列位置相等個數(shù)個PE單元的情況下,從片上存儲器上讀出的數(shù)據(jù)使用率達(dá)到100%,再次讀取率降到 0。本發(fā)明方法使得搜索范圍、I/O個數(shù)、編碼速度和硬件消耗等多項(xiàng)參數(shù)實(shí)現(xiàn)可配置,滿足了不同用戶的不同需求,其編碼速度完全能滿足高清視頻實(shí)時(shí)編碼的要求。


圖1是本發(fā)明中宏塊分割模式示意圖2是運(yùn)動估計(jì)中塊匹配示意圖;圖3是本發(fā)明中參考數(shù)據(jù)空間相關(guān)性示意圖;圖4是本發(fā)明中不同尺寸塊的代價(jià)的組合關(guān)系示意圖;圖5是本發(fā)明中差模有效信號與數(shù)據(jù)的關(guān)系;圖6是本發(fā)明中部分代價(jià)和在寄存器中的累加過程示意圖。
具體實(shí)施例方式如圖2所示,運(yùn)動估計(jì)的過程是通過已編碼宏塊的運(yùn)功矢量預(yù)測出當(dāng)前宏塊的在參考塊中的位置,再以預(yù)測位置為中心的搜索范圍范圍內(nèi)遍歷,通過判斷其殘差代價(jià),確定
運(yùn)動矢量。本實(shí)施例采取如下配置搜索范圍(-32,+32),配置5個PE,宏塊大小選擇16*16, 最小分割 4*4,塊分割 7 種模式(16 X 16,16 X 8,8 X 16,8 X 8,8 X 4,4X 8,4X 4),計(jì) 41 個小塊。本發(fā)明一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法,具體步驟如下步驟1、根據(jù)用戶需求合理配置并行處理的PE單元個數(shù)為5個。根據(jù)用戶對I/O資源,實(shí)時(shí)處理速度,硬件消耗等方面的要求,確定PE的個數(shù),橫向的位置由配置好的PE串行處理。步驟2、在PE單元內(nèi)部,計(jì)算基本塊代價(jià)。步驟2. 1、從片上存儲器中逐行讀出參考數(shù)據(jù)將該行數(shù)據(jù)與當(dāng)前宏塊MB的各行的每個像素求差模,其中,片上存儲器大小為80*80pixels,宏塊大小為16*16pixelS,(-32,
+32)為搜索范圍。有65*65個位置需要遍歷,分別是Pxlyl,Pxly2, Pxly3......Pxly65,Px2yl,
Px2y2.......Px65y64, Px65y65。當(dāng)配置5個PE時(shí),如圖3所示,第一個PE (即PEl)處理的是Pxlyi (i
=1,2,3,......,65),Px6yi (i = 1,2,3,......,65),并行的第二個 PE (即 PE2)處理的是
Px2yi (i = 1,2,3,......,65),Px7yi (i = 1,2,3,......,65)。從片上存儲器中讀出第一行參考數(shù)據(jù)時(shí),PEl取第一個位置的1行16個像素,分別與當(dāng)前宏塊的16行像素進(jìn)行求差模運(yùn)算,得到256個差模結(jié)果。步驟2. 2、將分屬64個4*4塊的16*16個差模進(jìn)行加和作為部分代價(jià),其中,b為最小分割塊的大小。結(jié)合圖1和圖4所示,可知得出4*4塊的代價(jià)值就能通過合并的方法的到其他不同分割模式的代價(jià)值,因此將這256個差模以所屬的4*4塊為基本單位進(jìn)行加和,得到64 個4*1塊的部分代價(jià)。其中,代價(jià)計(jì)算公式是J(s,c (m)) = SAD(s,c(m)),
M NSAD(s, c(m)) = Σ Σ | 彳χ,y)~c(yx~m^y-my )|
χ=1 y=l,其中,J是代價(jià)函數(shù),s是當(dāng)前進(jìn)行編碼的原始數(shù)據(jù),而c是已經(jīng)編碼重建的用于進(jìn)行運(yùn)動補(bǔ)償?shù)膮⒖紟臄?shù)據(jù)。M,N是矩陣求和符號的Σ的參數(shù),即分別為被求和矩陣的行數(shù)和列數(shù),對于4*1塊的部分代價(jià),M = 4,N= I0步驟2. 3、根據(jù)不同的遍歷位置,確定部分代價(jià)的有效性,從而得出部分代價(jià)并產(chǎn)生其有效信號。具體如下由全搜索的遍歷方式可知,參考窗口的第一行數(shù)據(jù)只與Pxlyi有相關(guān)性,而第二行數(shù)據(jù)與pxlyi,Px2yi有相關(guān)性,以此類推,第十六行數(shù)據(jù)與pxlyi,Px2yi,……Pxl6yi有相關(guān)性,由此可以確定步驟2. 2得出的結(jié)果是否有效,于是有如圖5所示的類似于平行四邊形的部分代價(jià)有效性。可知讀取從16行開始的參考數(shù)據(jù)所產(chǎn)生的64個部分代價(jià)都是有效的,它們分別屬于不同的位置。步驟3、基于不同尺寸塊的代價(jià)相關(guān)性,得出各種分割模式下的不同塊的代價(jià)。本步驟是采用“蓄水”原理計(jì)算最佳運(yùn)動信息MV。步驟3. 1、設(shè)置存儲4*4塊代價(jià)的寄存器16個,并分配存儲空間;步驟3. 2、在每個存儲空間中設(shè)置計(jì)數(shù)器,得出判斷部分代價(jià)是否累加完整的信號 full ;步驟3. 3、判斷輸入步驟2. 3得到的部分代價(jià)的有效信號,將其對應(yīng)有效的部分代價(jià)按不同位置累加進(jìn)入已分配好的存儲空間。具體如下如圖6所示是代價(jià)寄存器的數(shù)據(jù)累加記錄,第一列是代價(jià)寄存器的標(biāo)號,而標(biāo)號其后的一行是接收的部分代價(jià)數(shù)據(jù),圖中的大寫字母A P是當(dāng)前宏塊的16行,而表中的數(shù)字表示從片上存儲器中讀取的參考像素的行號,以1號寄存器為例,第一個周期存入 Al (當(dāng)前宏塊的第一行和參考數(shù)據(jù)第一行的部分代價(jià)),第二個周期將B2累加進(jìn)入1號寄存器,之后是C3,D4,此時(shí),1號寄存器中累加的A1B2C3D4就是Pxlyl的第一排4*4塊的完整代價(jià),因此,模塊中的full (full即蓄水池滿信號)信號置位,第五個周期的E5存入并覆蓋 1號寄存器,接著E5F6G7H8累加完成后將full置位,可知此時(shí)送出的是Pxlyl的第二排4*4 塊的完整代價(jià),按照這個原理,1號寄存器每4個cycle送出一個完整4*4代價(jià),16個cycle 即可完成一個點(diǎn)的遍歷,并能開始接收存儲第17個位置的數(shù)據(jù)。下面的15個寄存器原理和上述一致。步驟3. 4、判斷full是否有效,將完整代價(jià)送出,同時(shí)送出的還有由該寄存器標(biāo)號得出的位置信息。步驟3. 5、返回步驟3. 2,直至得到16個16*16塊的4*4子塊的完整代價(jià),利用不同塊之間代價(jià)相關(guān)性,拼接得出7中分割模式的全部代價(jià);同時(shí),比較當(dāng)前送出的完整代價(jià)與前一位置的完整代價(jià),選擇失真小的位置的代價(jià)信息存儲,并將當(dāng)前代價(jià)也存儲做其他匹配模式使用,即16X16,16X8,8X16,8X8, 8X4,4X8的匹配模式。步驟4、逐行讀完全部參考數(shù)據(jù),將各個PE得到的最終代價(jià)進(jìn)行比較,取7種分割模式的41個小塊的最小代價(jià)確定最佳運(yùn)動信息MV,從而實(shí)現(xiàn)了運(yùn)動估計(jì)。本發(fā)明方法選取以下參數(shù)時(shí)搜索范圍(-32,+32),配置65個PE,宏塊大小選擇16*16,最小分割4*4,塊分割7種模式41個小塊(16X 16,16X8,8X 16,8X8,8X4, 4X8,4X4),需要80個周期完成當(dāng)前宏塊的匹配;配置5個PE時(shí),需要1040個周期完成當(dāng)前宏塊的匹配,二者在SMIC0. 13 μ m CMOS工藝庫的支持下,分別能達(dá)到的處理速度是 1920X1080@36fps和1920X 1080@462fps,滿足了高清視頻實(shí)時(shí)編碼的需求。以現(xiàn)在高清視頻編碼的速率30幀每秒作為最低實(shí)現(xiàn)標(biāo)準(zhǔn),配置5個PE單元進(jìn)行處理,在SMIC(中芯)0. 13 μ m CMOS工藝庫支持下,電路性能參數(shù)如下表所示
權(quán)利要求
1.一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法,其特征在于,具體步驟如下步驟1、根據(jù)用戶需求合理配置并行處理的PE單元個數(shù);步驟2、在PE單元內(nèi)部,計(jì)算基本塊代價(jià);步驟3、基于不同尺寸塊的代價(jià)相關(guān)性,得出各種分割模式下的不同塊的代價(jià);步驟4、逐行讀完全部參考數(shù)據(jù),將各個PE得到的最終代價(jià)進(jìn)行比較,取最小代價(jià)確定為運(yùn)動矢量MV。
2.按照權(quán)利要求1所述的視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法,其特征在于, 步驟2的具體方法為步驟2. 1、從片上存儲器中逐行讀出參考數(shù)據(jù)將該行數(shù)據(jù)與當(dāng)前宏塊MB的各行的每個像素求差模,其中,片上存儲器大小為(m*2+a)*(m*2+a)pixels,宏塊大小為a*a pixels, (-m, +m)為搜索范圍;步驟2. 2、將分屬a2/b個Mb塊的3 個差模進(jìn)行加和作為部分代價(jià),其中,b為最小分割塊的大?。徊襟E2. 3、根據(jù)不同的遍歷位置,確定部分代價(jià)的有效性,從而得出部分代價(jià)并產(chǎn)生其有效信號。
3.按照權(quán)利要求2所述的視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法,其特征在于, 步驟3的具體方法為步驟3. 1、設(shè)置存儲Mb塊代價(jià)的寄存器,并分配存儲空間;步驟3. 2、在每個存儲空間中設(shè)置計(jì)數(shù)器,得出判斷部分代價(jià)是否累加完整的信號 full ;步驟3. 3、判斷輸入步驟2. 3得到的部分代價(jià)的有效信號,將其對應(yīng)有效的部分代價(jià)按不同位置累加進(jìn)入已分配好的存儲空間;步驟3. 4、判斷full是否有效,將完整代價(jià)送出,同時(shí)送出的還有由該寄存器標(biāo)號得出的位置信息;步驟3. 5、返回步驟3. 2,直至得到a個3 塊Mb子塊的完整代價(jià),利用不同塊之間代價(jià)相關(guān)性,拼接得出各種分割模式的全部代價(jià);同時(shí),比較當(dāng)前送出的完整代價(jià)與前一位置的完整代價(jià),選擇失真小的位置的代價(jià)信息存儲,并將當(dāng)前代價(jià)也存儲做其他匹配模式使用。
全文摘要
本發(fā)明公開了一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法,具體步驟如下根據(jù)用戶需求合理配置并行處理的PE單元個數(shù);在PE單元內(nèi)部,計(jì)算基本塊代價(jià);基于不同尺寸塊的代價(jià)相關(guān)性,得出各種分割模式下的不同塊的代價(jià);逐行讀完全部參考數(shù)據(jù),將各個PE得到的最終代價(jià)進(jìn)行比較,取最小代價(jià)確定最佳運(yùn)動信息MV。本發(fā)明有效的降低了存儲訪問的次數(shù),編碼速度完全能滿足高清視頻實(shí)時(shí)編碼的要求。
文檔編號H04N7/26GK102413329SQ201110371098
公開日2012年4月11日 申請日期2011年11月21日 優(yōu)先權(quán)日2011年11月21日
發(fā)明者余寧梅, 賈文華, 顧梅花 申請人:西安理工大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
咸阳市| 泊头市| 滦南县| 马龙县| 佛山市| 呈贡县| 昌乐县| 东兰县| 石棉县| 会宁县| 县级市| 綦江县| 西丰县| 锡林郭勒盟| 涪陵区| 平乡县| 长武县| 上思县| 黄浦区| 阳春市| 恭城| 慈利县| 客服| 潮安县| 武宣县| 清新县| 大邑县| 德钦县| 莱芜市| 西林县| 罗甸县| 新营市| 甘泉县| 新密市| 宜城市| 保靖县| 光山县| 琼海市| 连平县| 淮安市| 林口县|