一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法

文檔序號：7979924閱讀：299來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法
技術(shù)領(lǐng)域：
本發(fā)明屬于視頻壓縮傳輸技術(shù)技術(shù)領(lǐng)域，具體涉及一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法。
背景技術(shù)：
高清視頻編碼最常用的編碼格式有MPEG-2-TS，MPEG-4，VC-I和H. ^4/AVC等。這些標(biāo)準(zhǔn)共有的特點(diǎn)是良好的網(wǎng)絡(luò)親和性和高效的編碼質(zhì)量，以及易于硬件實(shí)現(xiàn)等，因此在視頻壓縮方面得到廣泛的應(yīng)用。在視頻編碼器的硬件結(jié)構(gòu)中，幀間運(yùn)動估計(jì)模塊的計(jì)算復(fù)雜度和存儲帶寬消耗占50% 90%，因此，幀間運(yùn)動估計(jì)模塊的性能直接決定了編碼器的性能。幀間編碼的主要過程是首先將原始圖像劃塊，以塊為單位進(jìn)行運(yùn)動估計(jì)，為了提高精度，通常將這些塊進(jìn)行再分割，以不同的尺寸塊進(jìn)行匹配搜索，目前主流編碼標(biāo)準(zhǔn)是將原始圖像劃分為16X16的宏塊MB (micro block)，然后將該宏塊劃分為16X16,16X8， 8X16，8X8，8X4，4X8，4X4這7種分割，共41個當(dāng)前塊，在這種分割模式下，通過當(dāng)前塊的已編碼的相鄰塊的運(yùn)動信息即運(yùn)動矢量MV(motion ventor)，在其參考幀圖像中得出一個預(yù)測塊，再以這個塊為中心，向外擴(kuò)m個像素，得出運(yùn)動估計(jì)的搜索窗口，含k個像素，k = (m*2+16)*(m*2+16)。然后讓這7種分割的41個子塊在這個搜索區(qū)域中進(jìn)行匹配搜索，再通過比較其代價(jià)的大小確定運(yùn)動矢量MV。運(yùn)動估計(jì)的硬件實(shí)現(xiàn)的主要關(guān)鍵技術(shù)高度數(shù)據(jù)利用率，低失真度和不同塊尺寸的代價(jià)關(guān)系。運(yùn)動估計(jì)的硬件實(shí)現(xiàn)的數(shù)據(jù)重用技術(shù)，能有效的減少訪存次數(shù)，從而有效的降低硬件資源消耗和系統(tǒng)功耗。目前，一種高度數(shù)據(jù)重用的硬件實(shí)現(xiàn)方法已成為研究熱點(diǎn)。已有文獻(xiàn)中規(guī)定了數(shù)據(jù)重用度的分級，A級機(jī)制重復(fù)使用一個當(dāng)前塊的相鄰參考塊中的重疊參考像素。B級機(jī)制重復(fù)使用一個當(dāng)前塊的相鄰參考條帶的重疊參考像素。C級機(jī)制重復(fù)使用相鄰的當(dāng)前塊的搜索窗口的重疊區(qū)域。D級機(jī)制重復(fù)使用連續(xù)的當(dāng)前塊的整個搜索窗口中的像素。A級機(jī)制有最小的存儲面積但需要最多的訪存次數(shù)，D級機(jī)制訪存次數(shù)最小但是消耗最大的片上存儲空間。根據(jù)不同的需求，需要采用不同的數(shù)據(jù)重用機(jī)制來平衡存儲空間和存儲訪問之間的矛盾。目前的C級數(shù)據(jù)重用在目前的存儲帶寬限制下最為高效，因此最目前大多數(shù)設(shè)計(jì)采用C數(shù)據(jù)重用。搜索算法是運(yùn)動估計(jì)中的另一個關(guān)鍵，主要包括全搜索算法和快速搜索算法兩種方式。全搜索算法是將參考窗口中的所有位置逐次遍歷，這種方法具有最高的保真度，但是相對而言又有最大的硬件消耗。目前有很多快速搜索算法，但全部都是以失真為代價(jià)的，因此在系統(tǒng)允許的前提下，應(yīng)該盡量選擇失真度最小的搜索算法。可變塊尺寸的運(yùn)動估計(jì)算法，提高了精度，但是也帶來了很大的計(jì)算復(fù)雜度。更小的分割尺寸能將編碼的失真降到最小，因此而帶來的計(jì)算復(fù)雜度，可以通過其不同尺寸塊之間代價(jià)組合得出，有效的降低了計(jì)算復(fù)雜度。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，有效的降低了存儲訪問的次數(shù)，編碼速度完全能滿足高清視頻實(shí)時(shí)編碼的要求。本發(fā)明所采用的技術(shù)方案是，一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，其特征在于，具體步驟如下步驟1、根據(jù)用戶需求合理配置并行處理的PE單元個數(shù)；步驟2、在PE單元內(nèi)部，計(jì)算基本塊代價(jià)；步驟3、基于不同尺寸塊的代價(jià)相關(guān)性，得出各種分割模式下的不同塊的代價(jià)；步驟4、逐行讀完全部參考數(shù)據(jù)，將各個PE得到的最終代價(jià)進(jìn)行比較，取最小代價(jià)確定為運(yùn)動矢量MV。步驟2的具體方法為步驟2. 1、從片上存儲器中逐行讀出參考數(shù)據(jù)將該行數(shù)據(jù)與當(dāng)前宏塊MB的各行的每個像素求差模，其中，片上存儲器大小為(m*2+a)*(m*2+a)pixels，宏塊大小為a*a pixels, (-m, +m)為搜索范圍；步驟2. 2、將分屬a2/b個Mb塊的3 個差模進(jìn)行加和作為部分代價(jià)，其中，b為最小分割塊的大?。徊襟E2. 3、根據(jù)不同的遍歷位置，確定部分代價(jià)的有效性，從而得出部分代價(jià)并產(chǎn)生其有效信號。步驟3的具體方法為步驟3. 1、設(shè)置存儲Mb塊代價(jià)的寄存器，并分配存儲空間；步驟3. 2、在每個存儲空間中設(shè)置計(jì)數(shù)器，得出判斷部分代價(jià)是否累加完整的信號 full ；步驟3. 3、判斷輸入步驟2. 3得到的部分代價(jià)的有效信號，將其對應(yīng)有效的部分代價(jià)按不同位置累加進(jìn)入已分配好的存儲空間；步驟3. 4、判斷full是否有效，將完整代價(jià)送出，同時(shí)送出的還有由該寄存器標(biāo)號得出的位置信息；步驟3. 5、返回步驟3. 2，直至得到a個3 塊Mb子塊的完整代價(jià)，利用不同塊之間代價(jià)相關(guān)性，拼接得出各種分割模式的全部代價(jià)；同時(shí)，比較當(dāng)前送出的完整代價(jià)與前一位置的完整代價(jià)，選擇失真小的位置的代價(jià)信息存儲，并將當(dāng)前代價(jià)也存儲做其他匹配模式使用。本發(fā)明一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，充分的利用了參考數(shù)據(jù)空間上的相關(guān)性，在不降低編碼精度的前提下減少了訪存次數(shù)，在配置與橫向列位置相等個數(shù)個PE單元的情況下，從片上存儲器上讀出的數(shù)據(jù)使用率達(dá)到100%，再次讀取率降到 0。本發(fā)明方法使得搜索范圍、I/O個數(shù)、編碼速度和硬件消耗等多項(xiàng)參數(shù)實(shí)現(xiàn)可配置，滿足了不同用戶的不同需求，其編碼速度完全能滿足高清視頻實(shí)時(shí)編碼的要求。

圖1是本發(fā)明中宏塊分割模式示意圖2是運(yùn)動估計(jì)中塊匹配示意圖；圖3是本發(fā)明中參考數(shù)據(jù)空間相關(guān)性示意圖；圖4是本發(fā)明中不同尺寸塊的代價(jià)的組合關(guān)系示意圖；圖5是本發(fā)明中差模有效信號與數(shù)據(jù)的關(guān)系；圖6是本發(fā)明中部分代價(jià)和在寄存器中的累加過程示意圖。
具體實(shí)施例方式如圖2所示，運(yùn)動估計(jì)的過程是通過已編碼宏塊的運(yùn)功矢量預(yù)測出當(dāng)前宏塊的在參考塊中的位置，再以預(yù)測位置為中心的搜索范圍范圍內(nèi)遍歷，通過判斷其殘差代價(jià)，確定
運(yùn)動矢量。本實(shí)施例采取如下配置搜索范圍(-32，+32)，配置5個PE，宏塊大小選擇16*16，最小分割 4*4，塊分割 7 種模式(16 X 16，16 X 8，8 X 16，8 X 8，8 X 4，4X 8，4X 4)，計(jì) 41 個小塊。本發(fā)明一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，具體步驟如下步驟1、根據(jù)用戶需求合理配置并行處理的PE單元個數(shù)為5個。根據(jù)用戶對I/O資源，實(shí)時(shí)處理速度，硬件消耗等方面的要求，確定PE的個數(shù)，橫向的位置由配置好的PE串行處理。步驟2、在PE單元內(nèi)部，計(jì)算基本塊代價(jià)。步驟2. 1、從片上存儲器中逐行讀出參考數(shù)據(jù)將該行數(shù)據(jù)與當(dāng)前宏塊MB的各行的每個像素求差模，其中，片上存儲器大小為80*80pixels，宏塊大小為16*16pixelS，(-32，
+32)為搜索范圍。有65*65個位置需要遍歷，分別是Pxlyl，Pxly2, Pxly3......Pxly65，Px2yl,
Px2y2.......Px65y64, Px65y65。當(dāng)配置5個PE時(shí)，如圖3所示，第一個PE (即PEl)處理的是Pxlyi (i
=1,2,3,......，65)，Px6yi (i = 1,2,3,......，65)，并行的第二個 PE (即 PE2)處理的是
Px2yi (i = 1,2,3,......，65)，Px7yi (i = 1,2,3,......，65)。從片上存儲器中讀出第一行參考數(shù)據(jù)時(shí)，PEl取第一個位置的1行16個像素，分別與當(dāng)前宏塊的16行像素進(jìn)行求差模運(yùn)算，得到256個差模結(jié)果。步驟2. 2、將分屬64個4*4塊的16*16個差模進(jìn)行加和作為部分代價(jià)，其中，b為最小分割塊的大小。結(jié)合圖1和圖4所示，可知得出4*4塊的代價(jià)值就能通過合并的方法的到其他不同分割模式的代價(jià)值，因此將這256個差模以所屬的4*4塊為基本單位進(jìn)行加和，得到64 個4*1塊的部分代價(jià)。其中，代價(jià)計(jì)算公式是J(s，c (m)) = SAD(s,c(m)),
M NSAD(s, c(m)) = Σ Σ | 彳χ，y)~c(yx~m^y-my )|
χ=1 y=l，其中，J是代價(jià)函數(shù)，s是當(dāng)前進(jìn)行編碼的原始數(shù)據(jù)，而c是已經(jīng)編碼重建的用于進(jìn)行運(yùn)動補(bǔ)償?shù)膮⒖紟臄?shù)據(jù)。M，N是矩陣求和符號的Σ的參數(shù)，即分別為被求和矩陣的行數(shù)和列數(shù)，對于4*1塊的部分代價(jià)，M = 4,N= I0步驟2. 3、根據(jù)不同的遍歷位置，確定部分代價(jià)的有效性，從而得出部分代價(jià)并產(chǎn)生其有效信號。具體如下由全搜索的遍歷方式可知，參考窗口的第一行數(shù)據(jù)只與Pxlyi有相關(guān)性，而第二行數(shù)據(jù)與pxlyi，Px2yi有相關(guān)性，以此類推，第十六行數(shù)據(jù)與pxlyi，Px2yi,……Pxl6yi有相關(guān)性，由此可以確定步驟2. 2得出的結(jié)果是否有效，于是有如圖5所示的類似于平行四邊形的部分代價(jià)有效性。可知讀取從16行開始的參考數(shù)據(jù)所產(chǎn)生的64個部分代價(jià)都是有效的，它們分別屬于不同的位置。步驟3、基于不同尺寸塊的代價(jià)相關(guān)性，得出各種分割模式下的不同塊的代價(jià)。本步驟是采用“蓄水”原理計(jì)算最佳運(yùn)動信息MV。步驟3. 1、設(shè)置存儲4*4塊代價(jià)的寄存器16個，并分配存儲空間；步驟3. 2、在每個存儲空間中設(shè)置計(jì)數(shù)器，得出判斷部分代價(jià)是否累加完整的信號 full ；步驟3. 3、判斷輸入步驟2. 3得到的部分代價(jià)的有效信號，將其對應(yīng)有效的部分代價(jià)按不同位置累加進(jìn)入已分配好的存儲空間。具體如下如圖6所示是代價(jià)寄存器的數(shù)據(jù)累加記錄，第一列是代價(jià)寄存器的標(biāo)號，而標(biāo)號其后的一行是接收的部分代價(jià)數(shù)據(jù)，圖中的大寫字母A P是當(dāng)前宏塊的16行，而表中的數(shù)字表示從片上存儲器中讀取的參考像素的行號，以1號寄存器為例，第一個周期存入 Al (當(dāng)前宏塊的第一行和參考數(shù)據(jù)第一行的部分代價(jià))，第二個周期將B2累加進(jìn)入1號寄存器，之后是C3，D4，此時(shí)，1號寄存器中累加的A1B2C3D4就是Pxlyl的第一排4*4塊的完整代價(jià)，因此，模塊中的full (full即蓄水池滿信號)信號置位，第五個周期的E5存入并覆蓋 1號寄存器，接著E5F6G7H8累加完成后將full置位，可知此時(shí)送出的是Pxlyl的第二排4*4 塊的完整代價(jià)，按照這個原理，1號寄存器每4個cycle送出一個完整4*4代價(jià)，16個cycle 即可完成一個點(diǎn)的遍歷，并能開始接收存儲第17個位置的數(shù)據(jù)。下面的15個寄存器原理和上述一致。步驟3. 4、判斷full是否有效，將完整代價(jià)送出，同時(shí)送出的還有由該寄存器標(biāo)號得出的位置信息。步驟3. 5、返回步驟3. 2，直至得到16個16*16塊的4*4子塊的完整代價(jià)，利用不同塊之間代價(jià)相關(guān)性，拼接得出7中分割模式的全部代價(jià)；同時(shí)，比較當(dāng)前送出的完整代價(jià)與前一位置的完整代價(jià)，選擇失真小的位置的代價(jià)信息存儲，并將當(dāng)前代價(jià)也存儲做其他匹配模式使用，即16X16，16X8,8X16,8X8， 8X4,4X8的匹配模式。步驟4、逐行讀完全部參考數(shù)據(jù)，將各個PE得到的最終代價(jià)進(jìn)行比較，取7種分割模式的41個小塊的最小代價(jià)確定最佳運(yùn)動信息MV，從而實(shí)現(xiàn)了運(yùn)動估計(jì)。本發(fā)明方法選取以下參數(shù)時(shí)搜索范圍(-32，+32)，配置65個PE，宏塊大小選擇16*16，最小分割4*4，塊分割7種模式41個小塊(16X 16，16X8，8X 16，8X8，8X4， 4X8，4X4)，需要80個周期完成當(dāng)前宏塊的匹配；配置5個PE時(shí)，需要1040個周期完成當(dāng)前宏塊的匹配，二者在SMIC0. 13 μ m CMOS工藝庫的支持下，分別能達(dá)到的處理速度是 1920X1080@36fps和1920X 1080@462fps，滿足了高清視頻實(shí)時(shí)編碼的需求。以現(xiàn)在高清視頻編碼的速率30幀每秒作為最低實(shí)現(xiàn)標(biāo)準(zhǔn)，配置5個PE單元進(jìn)行處理，在SMIC(中芯)0. 13 μ m CMOS工藝庫支持下，電路性能參數(shù)如下表所示
權(quán)利要求
1.一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，其特征在于，具體步驟如下步驟1、根據(jù)用戶需求合理配置并行處理的PE單元個數(shù)；步驟2、在PE單元內(nèi)部，計(jì)算基本塊代價(jià)；步驟3、基于不同尺寸塊的代價(jià)相關(guān)性，得出各種分割模式下的不同塊的代價(jià)；步驟4、逐行讀完全部參考數(shù)據(jù)，將各個PE得到的最終代價(jià)進(jìn)行比較，取最小代價(jià)確定為運(yùn)動矢量MV。
2.按照權(quán)利要求1所述的視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，其特征在于，步驟2的具體方法為步驟2. 1、從片上存儲器中逐行讀出參考數(shù)據(jù)將該行數(shù)據(jù)與當(dāng)前宏塊MB的各行的每個像素求差模，其中，片上存儲器大小為(m*2+a)*(m*2+a)pixels，宏塊大小為a*a pixels, (-m, +m)為搜索范圍；步驟2. 2、將分屬a2/b個Mb塊的3 個差模進(jìn)行加和作為部分代價(jià)，其中，b為最小分割塊的大?。徊襟E2. 3、根據(jù)不同的遍歷位置，確定部分代價(jià)的有效性，從而得出部分代價(jià)并產(chǎn)生其有效信號。
3.按照權(quán)利要求2所述的視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，其特征在于，步驟3的具體方法為步驟3. 1、設(shè)置存儲Mb塊代價(jià)的寄存器，并分配存儲空間；步驟3. 2、在每個存儲空間中設(shè)置計(jì)數(shù)器，得出判斷部分代價(jià)是否累加完整的信號 full ；步驟3. 3、判斷輸入步驟2. 3得到的部分代價(jià)的有效信號，將其對應(yīng)有效的部分代價(jià)按不同位置累加進(jìn)入已分配好的存儲空間；步驟3. 4、判斷full是否有效，將完整代價(jià)送出，同時(shí)送出的還有由該寄存器標(biāo)號得出的位置信息；步驟3. 5、返回步驟3. 2，直至得到a個3 塊Mb子塊的完整代價(jià)，利用不同塊之間代價(jià)相關(guān)性，拼接得出各種分割模式的全部代價(jià)；同時(shí)，比較當(dāng)前送出的完整代價(jià)與前一位置的完整代價(jià)，選擇失真小的位置的代價(jià)信息存儲，并將當(dāng)前代價(jià)也存儲做其他匹配模式使用。
全文摘要
本發(fā)明公開了一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法，具體步驟如下根據(jù)用戶需求合理配置并行處理的PE單元個數(shù)；在PE單元內(nèi)部，計(jì)算基本塊代價(jià)；基于不同尺寸塊的代價(jià)相關(guān)性，得出各種分割模式下的不同塊的代價(jià)；逐行讀完全部參考數(shù)據(jù)，將各個PE得到的最終代價(jià)進(jìn)行比較，取最小代價(jià)確定最佳運(yùn)動信息MV。本發(fā)明有效的降低了存儲訪問的次數(shù)，編碼速度完全能滿足高清視頻實(shí)時(shí)編碼的要求。
文檔編號H04N7/26GK102413329SQ201110371098
公開日2012年4月11日申請日期2011年11月21日優(yōu)先權(quán)日2011年11月21日
發(fā)明者余寧梅, 賈文華, 顧梅花申請人:西安理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：余寧梅;賈文華;顧梅花
技術(shù)所有人：西安理工大學(xué)
我是此專利的發(fā)明人

上一篇：手機(jī)和報(bào)警方法
上一篇：多媒體智能芯片的電源管理控制方法及電源管理系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

視頻壓縮相關(guān)技術(shù)

視頻壓縮軟件相關(guān)技術(shù)

視頻壓縮工具相關(guān)技術(shù)

在線視頻壓縮相關(guān)技術(shù)

微信視頻壓縮相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種視頻壓縮中可配置速度的運(yùn)動估計(jì)實(shí)現(xiàn)方法