專利名稱:當前塊與參考塊進行匹配運算的方法及運動估計方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字視頻處理領(lǐng)域,尤其涉及一種當前塊與參考塊進行匹配運算的方法以及采用上述方法進行運動估計的方法。
背景技術(shù):
現(xiàn)在,運動估計技術(shù)已被廣泛應(yīng)用于視頻壓縮編碼以及數(shù)字視頻格式轉(zhuǎn)換等領(lǐng)域,為了盡可能減少傳輸給定圖像質(zhì)量的數(shù)字視頻數(shù)據(jù)所需要的帶寬,多種不同的視頻壓縮算法已經(jīng)被開發(fā)用于壓縮視頻數(shù)據(jù)。幾個多媒體技術(shù)規(guī)范委員會已經(jīng)建立并提出用于編碼/壓縮音頻和視頻數(shù)據(jù)的標準。
視頻編碼方法主要包括幀內(nèi)壓縮和幀間壓縮,其中幀間壓縮是其壓縮比的主要來源,因此現(xiàn)有的視頻壓縮標準(MPEG1/2/4、H.261/3等),大多采用基于運動估計的幀間壓縮方案。其運動估計方法的原理是先將當前幀分成若干大小相同塊(所述塊稱之為當前塊),然后對每個當前塊在參考幀中設(shè)定大小的窗口內(nèi)(所述窗口稱之為參考窗)搜索與之最匹配的塊。當前塊和最匹配塊的位置差稱為運動矢量,像素差稱為殘差塊。由于殘差塊中接近0的像素很多,通過DCT變換、量化等處理,可以大幅度提高壓縮比,進而消除幀與幀之間的時間冗余。
請參閱圖1,其為運動估計方法的原理流程圖,所述運動估計方法用以實現(xiàn)當前塊從參考窗中找到最匹配的塊,包括以下步驟首先進行步驟S110處理器(如DSP)獲得當前幀中當前塊的各個像素的數(shù)據(jù),并確定采用的搜索算法及參考幀中參考窗的搜索范圍;
然后進行步驟S120處理器按照所述搜索算法從參考窗中確定參考塊;隨后進行步驟S130處理器將所述當前塊各個像素的數(shù)據(jù)和參考塊各個對應(yīng)像素的數(shù)據(jù)按照匹配準則進行運算,獲得運算值;隨后進行步驟S140判斷按照所述搜索算法在所述參考窗中是否已遍歷完所有的參考塊,若是,則進行步驟S150,否則,進行步驟S120;最后進行步驟S150從所有運算值中找到最小值,然后將所述最小運算值所對應(yīng)的參考塊做為與當前塊最匹配的塊。
很顯然,根據(jù)搜索算法在參考窗中確定若干個(比如Q個)參考塊,則處理器需要當前塊分別與Q個參考塊進行匹配運算。而且,上述步驟僅找到當前幀中一個當前塊最匹配的塊,而當前幀中當前塊的個數(shù)是不止一個的,也就是說處理運動估計的處理器的處理量很大,同時造成處理器進行運動估計時處理時間較長。
請參閱圖2,其為現(xiàn)有技術(shù)中當前塊與參考塊之間進行匹配運算的方法。它包括首先進行步驟S210處理器分別計算參考塊各個像素所在的存儲地址與參考窗首地址的偏移量,所述參考窗首地址為處理器能訪問參考窗數(shù)據(jù)的起始地址;隨后進行步驟S220處理器根據(jù)所述偏移量從存儲空間中取出所述參考塊中各個像素的數(shù)據(jù),并分別與當前塊中對應(yīng)的像素的數(shù)據(jù)按照匹配準則進行計算,進而保存計算值。
以下以獲得參考塊中的亮度值為例,來詳細分析當前塊與參考塊之間進行匹配運算的過程。
假設(shè)當前塊為3*3個像素所組成(請參閱圖3),參考窗由5*5個像素點所組成,并且圖中標上1~9(其中1~9為所述像素點的標識符)的像素點所組成的塊為本次匹配運算的參考塊(請參閱圖4),而且圖3和圖4中當前塊和參考塊中標識符相同的像素點,互為相互對應(yīng)的像素。另外,假設(shè)采用的搜索算法為全搜索算法(FS),匹配準則為絕對誤差準則(SAD)。
當前塊各個像素的亮度值為bk(m,n),bk(m,n)表示為橫坐標為m,縱坐標為n的像素的亮度值,其中m=1~3,n=1~3。參考窗的各個像素的亮度值為bk-1(p,q),bk-1(p,q)表示為橫坐標為p,縱坐標為q的像素的亮度值,其中p=1~5,q=1~5。
以圖4的參考窗為例,在存儲器中參考窗中各個像素的亮度值是順序存儲,如依次存儲[1,1]、[1,2]、[1,3]、[1,4]、[1,5]、[2,1]、[2,2]、[2,3]...[5,4]、[5,5]的亮度值,其中[m,n]表示橫坐標為m,縱坐標為n的像素。但是參考塊的各個像素亮度值存儲器中存儲的地址是不連續(xù)的。因此,若處理器想從存儲器中獲得參考塊的9個像素的亮度值,就需要先計算出這9個像素的存儲地址與5*5參考窗在存儲器中的起始地址(也叫首地址)的偏移量offsetk(k為1~9);然后按照所述偏移量,再將各個像素對應(yīng)的亮度值分別從存儲器中讀出。
按照P[k]=5*(m-1)+(n-1)計算各個參考點的偏移量,其中,P[k]為k像素與參考窗首地址的偏移量,m為k像素所在的橫坐標,n為k像素所在的縱坐標。
很顯然,需要計算9個像素的偏移量offset,處理器要進行9次乘法和9次加法的運算。而且,組成當前塊的像素個數(shù)越多,處理器需要進行的運算次數(shù)也越多,從而導(dǎo)致處理器在匹配計算過程中效率不高,并且匹配計算的效率也不高。
采用上述當前塊與參考塊進行匹配運算的運動估計方法,由于當前塊需要與參考窗中所述搜索算法確定的各個參考塊都需進行匹配運算,并且需要通過匹配運算找到最匹配塊的當前塊的個數(shù)不止一個,因此處理器進行匹配計算的次數(shù)更多,從而導(dǎo)致處理器的處理效率低,進而影響整個運動估計的速度,由此影響了圖像的壓縮等處理速度。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種當前塊與參考塊進行匹配運算的方法,以解決現(xiàn)有技術(shù)中由于參考窗中的參考塊各個像素在存儲器中存儲地址是不連續(xù),從而導(dǎo)致處理器需要計算各個像素點對于參考窗在存儲器的首地址的偏移量,進而影響匹配計算的速度及處理器處理的效率的技術(shù)問題。
本發(fā)明還提供了一種采用上述匹配方法進行運動估計的方法。
為解決上述問題,本發(fā)明公開了一種當前塊與參考塊進行匹配運算的方法,以實現(xiàn)處理器將當前塊中各個點的數(shù)據(jù)與參考塊各個點的數(shù)據(jù)進行匹配運算,包括(1)處理器將存儲在片外存儲器的當前塊的各個點的數(shù)據(jù)預(yù)先搬移至片內(nèi)存儲器中;(2)處理器將存儲在片外存儲器中不連續(xù)存儲地址內(nèi)的參考塊各個點的數(shù)據(jù)搬移至片內(nèi)存儲器,使得所述數(shù)據(jù)在片內(nèi)存儲器中的存儲地址連續(xù);(3)將所述當前塊各個點的數(shù)據(jù)與參考點各個點的數(shù)據(jù)依次進行匹配運算,進而獲得運算值。
處理器利用DMA方式將所述參考塊各個點的數(shù)據(jù)和/或當前塊各個點的數(shù)據(jù)搬移至所述片內(nèi)存儲器。
片內(nèi)存儲器中用以存儲參考塊數(shù)據(jù)的存儲容量可以根據(jù)當前塊占用的存儲容量預(yù)先分配。
所述處理器為DSP。
本發(fā)明還公開了一種運動估計方法,包括(1)處理器將存儲在片外存儲器的當前塊各個像素的數(shù)據(jù)預(yù)先搬移至片內(nèi)存儲器中,并確定采用的搜索算法及參考幀中參考窗的搜索范圍;(2)處理器按照所述搜索算法從參考窗中確定參考塊;(3)處理器將所述當前塊各個像素的數(shù)據(jù)和參考塊各個對應(yīng)像素的數(shù)據(jù)按照匹配準則進行運算,獲得運算值,具體包括(31)處理器將存儲在片外存儲器中不連續(xù)存儲地址內(nèi)的參考塊各個像素的數(shù)據(jù)搬移至片內(nèi)存儲器,使得所述數(shù)據(jù)在片內(nèi)存儲器中的存儲地址連續(xù);(32)將所述當前塊各個像素的數(shù)據(jù)與參考點各個像素的數(shù)據(jù)依次進行匹配運算,進而獲得運算值;(4)判斷按照所述搜索算法在所述參考窗中是否已遍歷完所有的參考塊,若是,進行步驟(5),否則,進行步驟(2);(5)從所有運算值中找到最小值,然后將所述最小運算值所對應(yīng)的參考塊做為與當前塊最匹配的塊。
處理器利用DMA方式將所述參考塊中各個像素的數(shù)據(jù)和/或當前塊中各個像素的數(shù)據(jù)搬移至所述片內(nèi)存儲器。
片內(nèi)存儲器中用以存儲參考塊數(shù)據(jù)的存儲容量可以根據(jù)當前塊占用的存儲容量預(yù)先分配。
所述搜索算法包括全搜索算法、菱形搜索算法及二維對搜索算法,所述匹配準則包括絕對誤差準則。
所述數(shù)據(jù)包括像素的亮度值。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點本發(fā)明將當前塊的各個點的數(shù)據(jù)與參考塊中各個點的數(shù)據(jù)進行匹配運算時,處理器首先將參考塊中各個點的數(shù)據(jù)從一個不連續(xù)的存儲空間中搬移動一片內(nèi)存儲器,使得數(shù)據(jù)存儲的地址連續(xù),然后再進行匹配運算,避免了參考塊各個點計算本點與參考窗首地址的偏移量,由此提高了匹配的速率,進而提高處理器的處理效率。而且,本發(fā)明事先將數(shù)據(jù)從片外存儲器搬移至片內(nèi)存儲器,CPU對片內(nèi)存儲器數(shù)據(jù)的讀取時間大大小于對片外存儲器數(shù)據(jù)的讀取時間由此提高處理器處理數(shù)據(jù)的速率。
另外,本發(fā)明還采用DMA方式搬移數(shù)據(jù),通過DMA方式搬移數(shù)據(jù)可以進行后臺操作,由此減少處理器在匹配時的耗時,進一步提高處理器處理效率。
當上述匹配運算過程適用在運動估計方法中,由于運動估計方法中當前塊需和不止一個參考塊進行映射運算,因此當匹配效率提高時,整個運動估計方法的處理效率將得到大幅提高。并且,在進行塊匹配過程中,CPU可以只進行匹配運算,而數(shù)據(jù)搬運可以由DMA控制器在后臺完成,也就是說每次CPU進行匹配運算的同時,DMA控制器搬運下一參考塊的數(shù)據(jù)至片內(nèi)存儲器,由此避免了CPU既要運算又要搬運數(shù)據(jù)的步驟,CPU只需進行匹配運算,由此大大提高CPU的處理效率。
圖1為運動估計方法的原理流程圖;圖2為現(xiàn)有技術(shù)中當前塊與參考塊之間進行匹配運算的方法的流程圖;圖3為3*3個像素所組成的當前塊;圖4為5*5個像素所組成的參考窗;圖5為本發(fā)明當前塊與參考塊進行匹配運算的方法的流程圖;圖6為本發(fā)明的一種運動估計方法的流程圖。
具體實施例方式
以下結(jié)合附圖,具體說明本發(fā)明。
請參閱圖5,其為本發(fā)明當前塊與參考塊進行匹配運算的方法的流程圖。所述方法用以實現(xiàn)處理器將當前塊中各個點的數(shù)據(jù)與參考窗中參考塊的各個點的數(shù)據(jù)進行匹配運算,包括首先進行步驟S310處理器將存儲在片外存儲器的當前塊的各個點的數(shù)據(jù)預(yù)先搬移至片內(nèi)存儲器中;然后進行步驟S320處理器將存儲在片外存儲器中不連續(xù)存儲地址內(nèi)的參考塊各個點的數(shù)據(jù)搬移至片內(nèi)存儲器,使得所述數(shù)據(jù)在片內(nèi)存儲器中的存儲地址連續(xù);片內(nèi)存儲器中用以存儲參考塊數(shù)據(jù)的存儲容量可以根據(jù)當前塊占用的存儲容量預(yù)先分配。片內(nèi)存儲器通常情況下,片內(nèi)存儲器中用以存儲參考塊數(shù)據(jù)的存儲容量是預(yù)先分配的,并且應(yīng)片內(nèi)存儲器等于或大于等于當前塊占用的存儲容量。還有,在搬移過程中,處理器應(yīng)考慮參考塊各個點的數(shù)據(jù)存儲特點依次進行搬移。比如該參考塊的各個點的數(shù)據(jù)在存儲器中分別位于3段連續(xù)存儲空間,則處理器可以依順序分別從這3段連續(xù)存儲空間中獲得所述參考塊的各個點存儲在存儲空間中的數(shù)據(jù);然后進行步驟S320將所述當前塊各個點的數(shù)據(jù)與參考點各個點的數(shù)據(jù)依次進行匹配運算,進而獲得運算值。
在上述方法中,由于參考塊各個點的數(shù)據(jù)搬移至片內(nèi)存儲器中,使得各個數(shù)據(jù)存儲在片內(nèi)存儲器的存儲地址是連續(xù)的,因此在進行匹配運算時無需計算各個像素對于參考窗的首地址的偏移量,直接將當前塊的各個點的數(shù)據(jù)與參考塊各個點的數(shù)據(jù)依次進行匹配運算即可,由此節(jié)省了地址運算所耗費的時間,進而提高了處理器的處理效率,同時也提高了匹配運算的效率。
本發(fā)明人在步驟S310中處理器利用DMA方式將所述當前塊中各個像素的數(shù)據(jù)搬移至所述片內(nèi)存儲器。處理器還可以利用DMA方式將參考塊中各個像素的數(shù)據(jù)搬移至所述片內(nèi)存儲器。DMA搬移可以進行后臺操作,由此減少數(shù)據(jù)搬移在處理器上的耗時。
上述參考塊與當前塊的匹配方法可以適用于很多場所,只要是在存儲單元中獲得部分不連續(xù)存儲的數(shù)據(jù),并對所述數(shù)據(jù)依次與參考塊中的各個點的數(shù)據(jù)進行對照、計算等操作,進而完成某一任務(wù),即可采用上述參考塊與當前塊的匹配方法。
以下以采用當前塊與參考塊的匹配過程進行運動估計方法為例,來具體說明上述的當前塊與參考塊的匹配過程。請參閱圖5,其為一種運動估計方法的流程圖。它包括以下步驟步驟S410處理器將存儲在片外存儲器的當前塊的各個點的數(shù)據(jù)預(yù)先搬移至片內(nèi)存儲器中,并并確定采用的搜索算法及參考幀中參考窗的搜索范圍。本發(fā)明采用的搜索算法可以包括全搜索法、菱形搜索算法及二維對搜索算法等現(xiàn)有技術(shù)中應(yīng)用在運動估計中的所有搜索算法;步驟S420處理器按照所述搜索算法從參考窗中確定參考塊;
步驟S430處理器將所述當前塊各個像素的數(shù)據(jù)和參考塊各個對應(yīng)像素的數(shù)據(jù)按照匹配準則進行運算,獲得運算值,具體包括S510處理器將存儲在片外存儲器中不連續(xù)存儲地址內(nèi)的參考塊各個點的數(shù)據(jù)搬移至片內(nèi)存儲器,使得所述數(shù)據(jù)在片內(nèi)存儲器中的存儲地址連續(xù);;S520將所述當前塊各個點的數(shù)據(jù)與參考點各個點的數(shù)據(jù)依次進行匹配運算,進而獲得運算值。處理器利用DMA方式將所述參考塊中各個像素的數(shù)據(jù)搬移至所述片內(nèi)存儲器;S440判斷按照所述搜索算法在所述參考窗中是否已遍歷完所有的參考塊,若是,進行步驟S450,否則,進行步驟S420;S450從所有運算值中找到最小值,然后將所述最小運算值所對應(yīng)的參考塊做為與當前塊最匹配的塊。
步驟S510采用DMA控制器通過DMA方式將參考塊各個點的數(shù)據(jù)搬移至所述片內(nèi)存儲器。步驟S520中CPU進行匹配運算的同時,步驟S510中DMA控制器進行搬運下一參考塊各個點的數(shù)據(jù)工作,以提高CPU的處理效率。即在進行塊匹配過程中,CPU可以只進行匹配運算,而數(shù)據(jù)搬運可以由DMA控制器在后臺完成,由此避免了CPU既要運算又要搬運數(shù)據(jù)的步驟,CPU只需進行匹配運算,由此大大提高CPU的處理效率。
以下以采用全搜索塊匹配運動估計方法為例,說明具體的運動估計方法。
首先,根據(jù)所采用的全搜索算法確定參考窗的大小,即在參考幀的(M+2dM)×(N+2dM)的搜索范圍內(nèi)找到當前塊的最佳匹配塊,其中M,N分別為當前塊的水平和垂直的像素數(shù),dM為當前塊最大可能平移的水平和垂直像素數(shù);
然后,處理器在確定的參考窗中搜索與當前塊“最匹配”的塊,本實施例所采用的匹配準則是絕對誤差準則(SAD),即SAD(i,j)=Σm=1NΣn=1N|bk(m,n)-bk-1(m+i,n+j)|]]>上式中的bk(m,n)和bk-1(m,n)分別代表當前幀和參考幀像素點(m,n)的亮度值,(i,j)是偏移量,取值范圍是[-dM,dM],M、N為子塊的水平和垂直像素數(shù),dM為最大可能平移的水平和垂直像素數(shù).當左邊取值SAD(i,j)最小時,表示兩個子塊匹配,此時的(i,j)被認為是當前塊與最匹配塊的位移值。
根據(jù)搜索算法先將參考窗中與當前塊對應(yīng)的子塊作為參考塊,進行匹配運算,然后沿水平和垂直方向逐個像素移動,設(shè)置不同的子塊作為參考塊,進行與當前塊的匹配運算,即每移動一次需計算一次SAD,然后將所有的SAD進行比較,找到最小的SAD所對的(i,j)即為當前塊與最匹配塊的位移值。
即在(M+2dM)×(N+2dM)的搜索范圍內(nèi),總的移動次數(shù)為(2dM+1)2,而按照現(xiàn)有的匹配方法,處理器需要進行所有偏移量的計算次數(shù)為(2dM+1)2*r,r為當前塊所包含的像素的總的個數(shù)。而采用本發(fā)明的估計方法,無需上述次數(shù)的偏移量計算,由此提高處理器的處理速率。
對于每一個遍歷點(當前塊與一個參考塊進行匹配計算),現(xiàn)有技術(shù)比本發(fā)明多進行M*N次乘法和M*N次加法。dM為最大可能平移的水平和垂直像素數(shù)。那么參考窗大小為(M+2dM)×(N+2dM)。則全搜索算法遍歷點個數(shù)為(2dm+1)2。即在全搜索條件下,現(xiàn)有技術(shù)比本發(fā)明多進行(2dm+1)2*M*N次乘法和(2dm+1)2*M*N次加法。從上面可以看出,本發(fā)明大大提高了處理器在進行運動估計時的效率。
接下來還是以圖4和圖3為例,即將5*5參考窗中參考塊的各個像素亮度值,與當前塊的各個像素的亮度值進行匹配運算,并據(jù)此獲得所述當前塊的最匹配的塊。
首先處理器通過DMA方式將當前塊各個像素的數(shù)據(jù)搬移到一個3*3的連續(xù)片內(nèi)存儲器中,設(shè)該連續(xù)存儲區(qū)的首地址為address2。由于地址空間是連續(xù)的,不必再像現(xiàn)有技術(shù)中那樣對每個點進行偏移量的運算,而想得到參考塊的亮度值bk-1(p,q),直接從存儲區(qū)中讀取即可。
我們來比較應(yīng)用本發(fā)明的匹配方法與現(xiàn)有技術(shù)的匹配方法,對于每一個遍歷點(即當前塊與一個參考塊進行匹配運算),現(xiàn)有技術(shù)比本發(fā)明多進行9次乘法和9次加法。若采用全搜索算法,則遍歷點個數(shù)為9,即現(xiàn)有技術(shù)比本發(fā)明多進行9*9=81次乘法和9*9=81次加法。若處理器采用C6204芯片的DSP,則每一乘法指令耗時2個時鐘周期,每一加法指令耗時1個時鐘周期,則現(xiàn)有技術(shù)比本發(fā)明要多耗時2*81+81=243個時鐘周期。
以上公開的僅為本發(fā)明的幾個具體實施例,但本領(lǐng)域的技術(shù)人員能思之的變化,都應(yīng)落在本發(fā)明的保護范圍內(nèi),本領(lǐng)域的技術(shù)人員能思之的變化,都應(yīng)落在本發(fā)明的保護范圍內(nèi)。
權(quán)利要求
1.一種當前塊與參考塊進行匹配運算的方法,以實現(xiàn)處理器將當前塊中各個點的數(shù)據(jù)與參考塊各個點的數(shù)據(jù)進行匹配運算,其特征在于,包括(1)處理器將存儲在片外存儲器的當前塊的各個點的數(shù)據(jù)預(yù)先搬移至片內(nèi)存儲器中;(2)處理器將存儲在片外存儲器中不連續(xù)存儲地址內(nèi)的參考塊各個點的數(shù)據(jù)搬移至片內(nèi)存儲器,使得所述數(shù)據(jù)在片內(nèi)存儲器中的存儲地址連續(xù);(3)將所述當前塊各個點的數(shù)據(jù)與參考點各個點的數(shù)據(jù)依次進行匹配運算,進而獲得運算值。
2.如權(quán)利要求1所述的當前塊與參考塊進行匹配運算的方法,其特征在于,步驟(1)和步驟(2)中采用DMA控制器通過DMA方式將所述參考塊各個點的數(shù)據(jù)和/或當前塊各個點的數(shù)據(jù)搬移至所述片內(nèi)存儲器,步驟(3)通過CPU進行匹配運算。
3.如權(quán)利要求1或2所述的當前塊與參考塊進行匹配運算的方法,其特征在于,片內(nèi)存儲器中用以存儲參考塊數(shù)據(jù)的存儲容量可以根據(jù)當前塊占用的存儲容量預(yù)先分配。
4.如權(quán)利要求1或2所述的當前塊與參考塊進行匹配運算的方法,其特征在于,所述處理器為DSP。
5.一種運動估計方法,其特征在于,包括(1)處理器將存儲在片外存儲器的當前塊各個像素的數(shù)據(jù)預(yù)先搬移至片內(nèi)存儲器中,并確定采用的搜索算法及參考幀中參考窗的搜索范圍;(2)處理器按照所述搜索算法從參考窗中確定參考塊;(3)將所述當前塊各個像素的數(shù)據(jù)和參考塊各個對應(yīng)像素的數(shù)據(jù)按照匹配準則進行運算,獲得運算值,具體包括(31)處理器將存儲在片外存儲器中不連續(xù)存儲地址內(nèi)的參考塊各個像素的數(shù)據(jù)搬移至片內(nèi)存儲器,使得所述數(shù)據(jù)在片內(nèi)存儲器中的存儲地址連續(xù);(32)將所述當前塊各個像素的數(shù)據(jù)與參考點各個像素的數(shù)據(jù)依次進行匹配運算,進而獲得運算值;(4)判斷按照所述搜索算法在所述參考窗中是否已遍歷完所有的參考塊,若是,進行步驟(5),否則,進行步驟(2);(5)從所有運算值中找到最小值,然后將所述最小運算值所對應(yīng)的參考塊做為與當前塊最匹配的塊。
6.如權(quán)利要求5所述的運動估計方法,其特征在于,步驟(1)中采用DMA控制器通過DMA方式將當前塊各個點的數(shù)據(jù)搬移至片內(nèi)存儲器;步驟(31)采用DMA控制器通過DMA方式將參考塊各個點的數(shù)據(jù)搬移至所述片內(nèi)存儲器。
7.如權(quán)利要求6所述的運動估計方法,其特征在于,步驟(32)中CPU進行匹配運算的同時,步驟(31)DMA控制器進行搬運下一參考塊各個點的數(shù)據(jù)工作,以使提高CPU的處理效率。
8.如權(quán)利要求5或7所述的運動估計方法,其特征在于,片內(nèi)存儲器中用以存儲參考塊數(shù)據(jù)的存儲容量可以根據(jù)當前塊占用的存儲容量預(yù)先分配。
9.如權(quán)利要求5或7所述的運動估計方法,其特征在于,所述搜索算法包括全搜索算法、菱形搜索算法及二維對搜索算法,所述匹配準則包括絕對誤差準則。
10.如權(quán)利要求5或7所述的運動估計方法,其特征在于,所述數(shù)據(jù)包括像素的亮度值。
全文摘要
本發(fā)明公開了一種當前塊與參考塊進行匹配運算的方法,以實現(xiàn)處理器將當前塊中各個點的數(shù)據(jù)與參考塊各個點的數(shù)據(jù)進行匹配運算,包括(1)處理器將存儲在片外存儲器的當前塊的各個點的數(shù)據(jù)預(yù)先搬移至片內(nèi)存儲器中;(2)處理器將存儲在片外存儲器中不連續(xù)存儲地址內(nèi)的參考塊各個點的數(shù)據(jù)搬移至片內(nèi)存儲器,使得所述數(shù)據(jù)在片內(nèi)存儲器中的存儲地址連續(xù);(3)將所述當前塊各個點的數(shù)據(jù)與參考點各個點的數(shù)據(jù)依次進行匹配運算,進而獲得運算值。并且,處理器可以利用DMA方式將所述參考塊中各個點的數(shù)據(jù)搬移至所述本發(fā)明避免參考塊各個點計算本點與參考窗首地址的偏移量,由此提高了匹配的速率,進而提高處理器的處理效率。另外,本發(fā)明還提供了一種包括上述映射過程的運動估計方法,以提高處理器的處理效率。
文檔編號H04N7/26GK1615023SQ200410096678
公開日2005年5月11日 申請日期2004年12月3日 優(yōu)先權(quán)日2004年12月3日
發(fā)明者陳小敬, 安向陽, 柴鑫剛 申請人:大唐微電子技術(shù)有限公司