專利名稱:基于六邊形搜索及五幀背景對(duì)齊的動(dòng)背景視頻對(duì)象提取的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視頻分割中的處理方法,特別涉及一種基于六邊形網(wǎng)格整像素運(yùn)動(dòng)估計(jì)及五幀背景對(duì)齊的動(dòng)背景下視頻對(duì)象提取方法。
背景技術(shù):
對(duì)于動(dòng)態(tài)視頻序列中運(yùn)動(dòng)對(duì)象的提取,由于攝像機(jī)產(chǎn)生的全局運(yùn)動(dòng)使得在靜背景下的分割方法,如幀差或者背景差分等方法不適用于動(dòng)背景下的分割,即不能夠準(zhǔn)確地將運(yùn)動(dòng)對(duì)象提取出來,因此針對(duì)動(dòng)背景下的分割問題必須首先消除攝像機(jī)運(yùn)動(dòng)所造成的全局運(yùn)動(dòng)的影響,通過全局運(yùn)動(dòng)估計(jì)和補(bǔ)償技術(shù),將問題轉(zhuǎn)化成靜背景下的分割問題,進(jìn)而應(yīng)用·靜背景下廣泛的分割方法實(shí)現(xiàn)動(dòng)背景下的準(zhǔn)確、有效分割。全局運(yùn)動(dòng)估計(jì)是指估計(jì)由攝像機(jī)運(yùn)動(dòng)引起的序列背景區(qū)域的運(yùn)動(dòng)規(guī)律,求解出相應(yīng)數(shù)學(xué)運(yùn)動(dòng)模型中的多個(gè)參數(shù)。全局運(yùn)動(dòng)補(bǔ)償是在根據(jù)運(yùn)動(dòng)估計(jì)所得到的全局運(yùn)動(dòng)參數(shù),在當(dāng)前幀和前一幀之間作一個(gè)相應(yīng)的背景對(duì)齊的映射變換。這樣在準(zhǔn)確的補(bǔ)償之后就可以采用幀差或背景差等方法消除背景區(qū)域,突出感興趣的具有局部運(yùn)動(dòng)的前景區(qū)域(參見楊文明.時(shí)空融合的視頻對(duì)象分割[D].浙江浙江大學(xué),2006)。對(duì)于動(dòng)背景下的運(yùn)動(dòng)對(duì)象分割問題,目前國際上已有相當(dāng)多的學(xué)者做了大量的研究工作。如利用改進(jìn)的分水嶺算法將運(yùn)動(dòng)補(bǔ)償后的視頻幀分割成不同的灰度區(qū)域,通過光流計(jì)算得到序列的運(yùn)動(dòng)信息,最后,將運(yùn)動(dòng)信息和分割的區(qū)域按一定的準(zhǔn)則綜合得到對(duì)象模板,達(dá)到對(duì)視頻對(duì)象的準(zhǔn)確定位(參見張慶利.一種基于運(yùn)動(dòng)背景的視頻對(duì)象分割算法.上海大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,11(2):111-115.)。如建立四參數(shù)運(yùn)動(dòng)放射模型來描述全局運(yùn)動(dòng),采用塊匹配方法進(jìn)行參數(shù)估計(jì),結(jié)合Horn-Schunck算法檢測(cè)出運(yùn)動(dòng)目標(biāo)并應(yīng)用卡爾曼濾波對(duì)運(yùn)動(dòng)目標(biāo)的質(zhì)心位置等信息進(jìn)行跟蹤,實(shí)現(xiàn)了動(dòng)態(tài)場(chǎng)景中運(yùn)動(dòng)對(duì)象的檢測(cè)與跟蹤。(參見施家棟.動(dòng)態(tài)場(chǎng)景中運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤.北京理工大學(xué)學(xué)報(bào),2009,29(10) :858-876.)。另一種采用非參數(shù)核密度估計(jì)的方法,首先采用匹配加權(quán)的全局運(yùn)動(dòng)估計(jì)補(bǔ)償算法消除動(dòng)態(tài)場(chǎng)景下背景運(yùn)動(dòng)的影響,然后估計(jì)各像素屬于前景與背景的概率密度并結(jié)合形態(tài)學(xué)等算法進(jìn)行處理,實(shí)現(xiàn)了動(dòng)背景下運(yùn)動(dòng)對(duì)象的準(zhǔn)確、有效分割。(參見馬志強(qiáng).一種動(dòng)態(tài)場(chǎng)景下運(yùn)動(dòng)對(duì)象分割新算法.計(jì)算機(jī)工程與科學(xué),2012,34(4) :43-46.)。為了解決動(dòng)背景下的分割問題,本發(fā)明方法實(shí)現(xiàn)了一種采用宏塊預(yù)判斷、塊匹配、攝像機(jī)六參數(shù)仿射模型、最小二乘法等全局運(yùn)動(dòng)估計(jì)及補(bǔ)償方法,并通過五幀背景對(duì)齊結(jié)合邊緣信息等實(shí)現(xiàn)動(dòng)背景分割。實(shí)驗(yàn)證明,該方法實(shí)現(xiàn)了動(dòng)背景視頻序列中視頻對(duì)象的提取,并且提取精度得到明顯提高。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是如何減少塊匹配的運(yùn)算時(shí)間,如何實(shí)現(xiàn)動(dòng)背景下視頻對(duì)象的準(zhǔn)確提取。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是一種基于六邊形網(wǎng)格整像素運(yùn)動(dòng)估計(jì)及五幀背景對(duì)齊的動(dòng)背景下視頻對(duì)象提取方法,包括以下步驟(I)將第K-2幀、第K-I幀、參考幀K幀、第K+1幀與第K+2幀分別分成8X8宏塊,根據(jù)紋理信息對(duì)該五幀中所有宏塊進(jìn)行預(yù)判斷、篩選;(2)對(duì)上述篩選后的宏塊采用SAD準(zhǔn)則、六邊形網(wǎng)格整像素搜索策略進(jìn)行塊匹配,分別以第K-2幀、第K-I幀、第K+1幀與第K+2幀作為當(dāng)前幀,以第K幀作為參考幀,得到該四幀相對(duì)于參考幀K幀的運(yùn)動(dòng)矢量場(chǎng),并通過最小二乘法計(jì)算全局運(yùn)動(dòng)參數(shù),獲得攝像機(jī)六參數(shù)模型;
(3)對(duì)第K-2幀進(jìn)行運(yùn)動(dòng)補(bǔ)償,使第K-2幀與第K幀背景對(duì)齊,得到重建幀K_2’,按照同樣的方法對(duì)第K-I幀、第K+1幀與第K+2幀進(jìn)行運(yùn)動(dòng)補(bǔ)償,使第K-I幀、第K+1幀及第K+2幀分別與第K幀背景對(duì)齊,并得到重建幀K-1’、重建幀K+1’及重建幀K+2’ ;(4)對(duì)重建幀K-2’、K-1’、K+1’、K+2’及參考幀K幀分別采用Sobel算子提取邊緣信息,并分別計(jì)算其相對(duì)于參考幀K邊緣的幀差屯、d2、d3、d4,采用最大方差閾值方法進(jìn)行二值化;(5)分別對(duì)連續(xù)五幀前兩幀和后兩幀得到的幀差二值化結(jié)果進(jìn)行與運(yùn)算;對(duì)得到的與運(yùn)算結(jié)果采用或運(yùn)算及形態(tài)學(xué)、中值濾波等進(jìn)行后處理,實(shí)現(xiàn)動(dòng)背景下視頻對(duì)象的快速有效分割。所述步驟(I)中對(duì)于當(dāng)前第K-2幀、第K-I幀、第K+1幀、第K+2幀與參考幀K幀中分成的8X8宏塊進(jìn)行預(yù)判斷及篩選,具體步驟如下由于在下述步驟中應(yīng)用最小二乘法計(jì)算全局運(yùn)動(dòng)參數(shù)的時(shí)候,很多誤差大的宏塊被直接刪除,如果能夠在最小二乘法運(yùn)算之前將誤差大的宏塊剔除,將顯著的提高運(yùn)算速度,并降低運(yùn)算量。而決定宏塊誤差大小、影響計(jì)算準(zhǔn)確性的重要因素便是宏塊的紋理信息,也就是梯度信息。本部分提出的宏塊預(yù)判斷及篩選的方法正是從宏塊的梯度信息出發(fā),根據(jù)設(shè)定的閾值對(duì)于宏塊進(jìn)行篩選抑或保留,當(dāng)宏塊的信息量小于該閾值時(shí),對(duì)該宏塊進(jìn)行篩選,不作為下述步驟中參與塊匹配的宏塊;當(dāng)信息量大于該閾值時(shí),則對(duì)宏塊進(jìn)行保留,作為有效特征塊參與進(jìn)行下述的運(yùn)動(dòng)估計(jì)等運(yùn)算。其主要步驟如下第一步將每一幀分成8X8子塊,經(jīng)試驗(yàn)證明,若采用分成16X16子塊的形式則計(jì)算量過大,若分成4x4子塊則塊匹配等方法不夠精確,故采用8X8子塊的形式;第二步采用Sobel算子得到每一幀的梯度圖,將梯度信息作為宏塊剔除的判斷依據(jù);
_ 8] |V/(.t, j)| = mag(Vf(x, y)) = +Gv2其中|V/(x,_v)|表示該點(diǎn)的梯度信息,Gx、Gy分別表示偏導(dǎo)數(shù)。第三步計(jì)算每一個(gè)宏塊的梯度量;以8x8子塊為例,其梯度信息量為
I-S J=S |V/(x,>08xS| = EEIV/(x,>,)l
^=I ./=1第四步確定宏塊預(yù)斷的閾值,一般保留所有宏塊的40%,根據(jù)這個(gè)確定的值,對(duì)所有宏塊的梯度量進(jìn)行排序,確定保留40%下宏塊篩選的最佳閾值T ;
第五步完成對(duì)于宏塊的篩選,若其梯度信息量>T,則對(duì)宏塊進(jìn)行保留,作為有效特征塊參與進(jìn)行下述的運(yùn)動(dòng)估計(jì)等運(yùn)算;若其梯度信息量〈T,對(duì)該宏塊進(jìn)行篩選,不作為下述步驟中參與塊匹配的宏塊。所述步驟(2)中的分別以K-2巾貞、K-I巾貞、K+1巾貞、K+2幀作為當(dāng)前幀,以K幀作為參考幀,對(duì)篩選后的宏塊采用SAD準(zhǔn)則、六邊形網(wǎng)格整像素搜索策略進(jìn)行塊匹配,并將塊匹配求得的運(yùn)動(dòng)矢量場(chǎng)利用最小二乘法獲得攝像機(jī)六參數(shù)模型,其具體步驟如下(i)塊匹配準(zhǔn)則SAD本部分采用SAD塊匹配準(zhǔn)則,該準(zhǔn)則不僅能夠找到最佳匹配點(diǎn),并且計(jì)算量小、耗時(shí)短。
權(quán)利要求
1.應(yīng)用于一種基于六邊形網(wǎng)格整像素運(yùn)動(dòng)估計(jì)及五幀背景對(duì)齊的動(dòng)背景下視頻對(duì)象提取方法,其特征在于包括以下步驟 (1)將第K-2幀、第K-I幀、參考幀K幀、第K+1幀與第K+2幀分別分成8X 8宏塊,根據(jù)紋理信息對(duì)該五幀中所有宏塊進(jìn)行預(yù)判斷、篩選; (2)對(duì)上述篩選后的宏塊采用SAD準(zhǔn)則、六邊形網(wǎng)格整像素搜索策略進(jìn)行塊匹配,分別以第K-2幀、第K-I幀、第K+1幀與第K+2幀作為當(dāng)前幀,以第K幀作為參考幀,得到該四幀相對(duì)于參考幀K幀的運(yùn)動(dòng)矢量場(chǎng),并通過最小二乘法計(jì)算全局運(yùn)動(dòng)參數(shù),獲得攝像機(jī)六參數(shù)模型; (3)對(duì)第K-2幀進(jìn)行運(yùn)動(dòng)補(bǔ)償,使第K-2幀與第K幀背景對(duì)齊,得到重建幀K-2’,按照同樣的方法對(duì)第K-I幀、第K+1幀與第K+2幀進(jìn)行運(yùn)動(dòng)補(bǔ)償,使第K-I幀、第K+1幀及第K+2幀分別與第K幀背景對(duì)齊,并得到重建幀K-1’、重建幀K+1’及重建幀K+2’ ; (4)對(duì)重建幀K-2’、K-1’、K+1’、K+2’及參考幀K幀分別采用Sobel算子提取邊緣信息,并分別計(jì)算其相對(duì)于參考幀K邊緣的幀差屯、d2、d3、d4,采用最大方差閾值方法進(jìn)行二值化; (5)分別對(duì)連續(xù)五幀前兩幀和后兩幀得到的幀差二值化結(jié)果進(jìn)行與運(yùn)算;對(duì)得到的與運(yùn)算結(jié)果采用或運(yùn)算及形態(tài)學(xué)、中值濾波等進(jìn)行后處理,實(shí)現(xiàn)動(dòng)背景下視頻對(duì)象的快速有效分割。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于所述步驟(I)的對(duì)于當(dāng)前第K-2幀、第K-I幀、第K+1幀、第K+2幀與參考幀K幀中分成的8X8宏塊進(jìn)行預(yù)判斷及篩選,具體步驟如下 由于在下述步驟中應(yīng)用最小二乘法計(jì)算全局運(yùn)動(dòng)參數(shù)的時(shí)候,很多誤差大的宏塊被直接刪除,如果能夠在最小二乘法運(yùn)算之前將誤差大的宏塊剔除,將顯著的提高運(yùn)算速度,并降低運(yùn)算量。而決定宏塊誤差大小、影響計(jì)算準(zhǔn)確性的重要因素便是宏塊的紋理信息,也就是梯度信息。本部分提出的宏塊預(yù)判斷及篩選的方法正是從宏塊的梯度信息出發(fā),根據(jù)設(shè)定的閾值對(duì)于宏塊進(jìn)行篩選抑或保留,當(dāng)宏塊的信息量小于該閾值時(shí),對(duì)該宏塊進(jìn)行篩選,不作為下述步驟中參與塊匹配的宏塊;當(dāng)信息量大于該閾值時(shí),則對(duì)宏塊進(jìn)行保留,作為有效特征塊參與進(jìn)行下述的運(yùn)動(dòng)估計(jì)等運(yùn)算。
其主要步驟如下 第一步將每一幀分成8x8子塊,經(jīng)試驗(yàn)證明,若采用分成16 X 16子塊的形式則計(jì)算量過大,若分成4x4子塊則塊匹配等方法不夠精確,故采用8X8子塊的形式; 第二步采用Sobel算子得到每一幀的梯度圖,將梯度信息作為宏塊剔除的判斷依據(jù); |V/(U)| = magiVf^y))=機(jī)2 +G'2 其中|Y/'(x,>,)|表示該點(diǎn)的梯度信息,Gx、Gy分別表示偏導(dǎo)數(shù)。
第三步計(jì)算每一個(gè)宏塊的梯度量;以8x8子塊為例,其梯度信息量為第四步確定宏塊預(yù)斷的閾值,一般保留所有宏塊的40%,根據(jù)這個(gè)確定的值,對(duì)所有宏塊的梯度量進(jìn)行排序,確定保留40%下宏塊篩選的最佳閾值T ;第五步完成對(duì)于宏塊的篩選,若其梯度信息量〉T,則對(duì)宏塊進(jìn)行保留,作為有效特征塊參與進(jìn)行下述的運(yùn)動(dòng)估計(jì)等運(yùn)算;若其梯度信息量〈T,對(duì)該宏塊進(jìn)行篩選,不作為下述步驟中參與塊匹配的宏塊。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于所述步驟(2)的分別以K-2幀、K-I幀、K+1幀、K+2幀作為當(dāng)前幀,以K幀作為參考幀,對(duì)篩選后的宏塊采用SAD準(zhǔn)則、六邊形網(wǎng)格整像素搜索策略進(jìn)行塊匹配,并將塊匹配求得的運(yùn)動(dòng)矢量場(chǎng)利用最小二乘法獲得攝像機(jī)六參數(shù)模型,其具體步驟如下 (i)塊匹配準(zhǔn)則SAD 本部分采用SAD塊匹配準(zhǔn)則,該準(zhǔn)則不僅能夠找到最佳匹配點(diǎn),并且計(jì)算量小、耗時(shí)短。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于所述步驟(3)的通過運(yùn)動(dòng)補(bǔ)償分別獲得當(dāng)前幀K-2幀、K-I幀、K+1幀及K+2幀的重建幀K-2’、K-1’、K+1’、K+2’,其具體內(nèi)容如下 對(duì)于當(dāng)前幀K-2幀、K-I幀、K+1幀及K+2幀中的每一個(gè)點(diǎn)根據(jù)上述獲取的攝像機(jī)模型,計(jì)算其分別在參考幀K中的對(duì)應(yīng)位置并對(duì)其進(jìn)行賦值,從而實(shí)現(xiàn)對(duì)于K-2幀、K-I幀、K+1幀及K+2幀的全局運(yùn)動(dòng)補(bǔ)償,使補(bǔ)償后的重建幀K-2’、K-1’、K+1’、K+2’與參考幀K的背景對(duì)齊,從而實(shí)現(xiàn)下述結(jié)合邊緣信息、自適應(yīng)最大方差閾值的基于六邊形網(wǎng)格整像素運(yùn)動(dòng)估計(jì)及五幀背景對(duì)齊的動(dòng)背景下視頻分割方法。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于所述步驟(4)的采用Sobel算子提取邊緣信息,并分別與參考幀K邊緣進(jìn)行差分,采用最大方差閾值進(jìn)行二值化,其具體步驟如下 (i)Sobel算子提取邊緣信息,并與參考幀K邊緣進(jìn)行差分 邊緣檢測(cè)算子種類很多,基于Sobel算子對(duì)于邊緣定位效果不錯(cuò)并且對(duì)于噪聲具有魯棒性的特點(diǎn)考慮,選擇Sobel邊緣檢測(cè)算子對(duì)于重建幀K-2’、K-1’、K+1’、K+2’及參考幀K幀進(jìn)行邊緣特征提取。
Sobel算子可以用模板卷積來實(shí)現(xiàn)
6.根據(jù)權(quán)利要求I所述的方法,其特征在于所述步驟(5)的對(duì)連續(xù)五幀前兩幀和后兩幀得到的幀差二值化結(jié)果分別進(jìn)行與運(yùn)算,并經(jīng)過或運(yùn)算及濾波等后處理 對(duì)上述二值化結(jié)果OtusBuf I、OtusBuf2、OtusBuf3、OtusBuf4進(jìn)行與運(yùn)算,與運(yùn)算的結(jié)果如下
全文摘要
本發(fā)明公開了一種基于六邊形網(wǎng)格整像素運(yùn)動(dòng)估計(jì)及五幀背景對(duì)齊的動(dòng)背景下視頻對(duì)象提取方法,包括如下步驟首先將K-2幀、K-1幀、參考幀K、K+1幀與K+2幀分成8×8宏塊,根據(jù)宏塊判斷準(zhǔn)則對(duì)宏塊進(jìn)行篩選;對(duì)篩選后的宏塊采用六邊形網(wǎng)格整像素運(yùn)動(dòng)估計(jì)方法進(jìn)行塊匹配,分別得到上述四幀相對(duì)于參考幀的運(yùn)動(dòng)矢量場(chǎng),并通過最小二乘法計(jì)算全局運(yùn)動(dòng)參數(shù);對(duì)第K-2幀、K-1幀、K+1幀與K+2幀分別進(jìn)行運(yùn)動(dòng)補(bǔ)償,使該四幀與參考幀背景對(duì)齊,并得到四幀的重建幀;對(duì)重建幀K-2'、K-1'、K+1'、K+2'及參考幀分別采用Sobel算子提取邊緣信息,計(jì)算相對(duì)于參考幀邊緣的幀差,最大方差閾值二值化;分別對(duì)連續(xù)五幀前兩幀和后兩幀得到的幀差進(jìn)行與運(yùn)算;最后進(jìn)行或運(yùn)算并做后處理,實(shí)現(xiàn)動(dòng)背景下視頻對(duì)象的快速有效分割。
文檔編號(hào)G06T7/20GK102970527SQ201210398169
公開日2013年3月13日 申請(qǐng)日期2012年10月18日 優(yōu)先權(quán)日2012年10月18日
發(fā)明者祝世平, 郭智超 申請(qǐng)人:北京航空航天大學(xué)