復(fù)雜視頻監(jiān)控場(chǎng)景中光流特征自適應(yīng)量化方法
【專利摘要】一種數(shù)字圖像處理【技術(shù)領(lǐng)域】的復(fù)雜視頻監(jiān)控場(chǎng)景中光流特征自適應(yīng)量化方法,通過對(duì)視頻空間進(jìn)行基于光流特征的概率去噪后計(jì)算局部統(tǒng)計(jì)特征,然后進(jìn)行視頻空間位置的自適應(yīng)量化,并將視頻空間分割為若干個(gè)微型塊區(qū)域;最后采用運(yùn)動(dòng)復(fù)雜度閾值過濾每一個(gè)微型塊區(qū)域并判斷量化數(shù)量,生成視覺字典,實(shí)現(xiàn)自適應(yīng)量化。本發(fā)明基于光流的局部統(tǒng)計(jì)特征,描述視頻監(jiān)控場(chǎng)景中運(yùn)動(dòng)的有效性和多樣性。融合有效像素比和運(yùn)動(dòng)復(fù)雜度特征,描述局部運(yùn)動(dòng)的活躍度,實(shí)現(xiàn)光流特征位置的自適應(yīng)量化。基于運(yùn)動(dòng)復(fù)雜度特征,描述局部運(yùn)動(dòng)的多樣性,實(shí)現(xiàn)光流特征方向的自適應(yīng)量化。光流特征的自適應(yīng)量化使其在下一步的基于詞袋模型的場(chǎng)景分析中能發(fā)揮更好辨別力。
【專利說明】復(fù)雜視頻監(jiān)控場(chǎng)景中光流特征自適應(yīng)量化方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及的是一種數(shù)字圖像處理【技術(shù)領(lǐng)域】的方法,具體是一種復(fù)雜視頻監(jiān)控場(chǎng)景中光流特征自適應(yīng)量化方法。
【背景技術(shù)】
[0002]在智能視頻監(jiān)控中計(jì)算機(jī)視覺技術(shù)變得越來越重要,比如交通流量監(jiān)控、事件檢測(cè)或者擁堵檢測(cè)等。在計(jì)算機(jī)視覺應(yīng)用中行為分析是一項(xiàng)基本任務(wù)。但是鑒于環(huán)境條件的復(fù)雜性,如光照和天氣變化、擁擠等,行為分析仍舊面臨一些挑戰(zhàn)。目前關(guān)于行為分析的研究主要分為兩大類。一類是基于目標(biāo)跟蹤特征的方法。但是在復(fù)雜的場(chǎng)景下,仍舊缺乏可靠的多目標(biāo)跟蹤算法。此外,跟蹤算法很難適應(yīng)突然改變的運(yùn)動(dòng)在復(fù)雜的場(chǎng)景下,仍舊缺乏可靠的多目標(biāo)跟蹤算法。此外,跟蹤算法很難適應(yīng)突然改變的運(yùn)動(dòng)。因此另一類直接基于底層運(yùn)動(dòng)特征的方法更適合復(fù)雜監(jiān)控場(chǎng)景分析。其中使用最多的一種特征是光流(opticalflow),包含了大量的局部運(yùn)動(dòng)信息。
[0003]經(jīng)對(duì)現(xiàn)有技術(shù)文獻(xiàn)檢索發(fā)現(xiàn),一般通過對(duì)光流特征進(jìn)行位置和方向的固定量化,如文獻(xiàn) Wang X,Ma X, Grimson WEL.“Unsupervised activity perception in crowdedand complicated scenes using hierarchical bayesian models,,([J].Pattern Analysisand Machine Intelligence, IEEE Transactions on, 2009, 31 (3): 539 -555.),將視頻片段采用詞袋方式表示,其中光流方向均勻量化成4個(gè),位置量化通過對(duì)視頻監(jiān)控場(chǎng)景網(wǎng)格化實(shí)現(xiàn),每個(gè)塊區(qū)域尺寸為10X10。
[0004]這種固定量化方式使得其面臨如下三個(gè)問題:1)降低量化精度會(huì)造成空間位置和方向分辨率的損失;2)提高量化精度會(huì)降低損失,但是會(huì)造成數(shù)據(jù)量增加;3)采用統(tǒng)一的量化精度,未考慮視頻監(jiān)控場(chǎng)景中實(shí)際的運(yùn)動(dòng)分布特征。
【發(fā)明內(nèi)容】
[0005]本發(fā)明針對(duì)現(xiàn)有技術(shù)存在的上述不足,提出一種復(fù)雜視頻監(jiān)控場(chǎng)景中光流特征自適應(yīng)量化方法,基于光流的局部統(tǒng)計(jì)特征,描述視頻監(jiān)控場(chǎng)景中運(yùn)動(dòng)的有效性和多樣性。融合有效像素比和運(yùn)動(dòng)復(fù)雜度特征,描述局部運(yùn)動(dòng)的活躍度,實(shí)現(xiàn)光流特征位置的自適應(yīng)量化。基于運(yùn)動(dòng)復(fù)雜度特征,描述局部運(yùn)動(dòng)的多樣性,實(shí)現(xiàn)光流特征方向的自適應(yīng)量化。光流特征的自適應(yīng)量化使其在下一步的基于詞袋模型的場(chǎng)景分析中能發(fā)揮更好辨別力。
[0006]本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明包括以下步驟:
[0007]第一步:對(duì)視頻空間進(jìn)行基于光流特征的概率去噪,具體步驟為:
[0008]1.1)對(duì)視頻空間中每個(gè)空間點(diǎn)(X,y)上產(chǎn)生的光流特征數(shù)進(jìn)行統(tǒng)計(jì),并進(jìn)行歸一.V
化處理
【權(quán)利要求】
1.一種復(fù)雜視頻監(jiān)控場(chǎng)景中光流特征自適應(yīng)量化方法,其特征在于,包括以下步驟: 第一步:對(duì)視頻空間進(jìn)行基于光流特征的概率去噪; 第二步:對(duì)去噪后的視頻空間計(jì)算局部統(tǒng)計(jì)特征,進(jìn)行視頻空間位置的自適應(yīng)量化,并將視頻空間分割為若干個(gè)微型塊區(qū)域; 第三步:采用運(yùn)動(dòng)復(fù)雜度閾值過濾每一個(gè)微型塊區(qū)域并判斷量化數(shù)量,生成視覺字典,實(shí)現(xiàn)自適應(yīng)量化。
2.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的第一步具體包括以下步驟: 1.1)對(duì)視頻空間中每個(gè)空間點(diǎn)(x,y)上產(chǎn)生的光流特征數(shù)進(jìn)行統(tǒng)計(jì),并進(jìn)行歸一化處理:n
3.根據(jù)權(quán)利要求2所述的方法,其特征是,所述的噪聲動(dòng)態(tài)區(qū)域是指:對(duì)于給定最大閾值Thrmax,當(dāng)P(x, y)>Thrmax,則空間點(diǎn)(x, y)屬于噪聲動(dòng)態(tài)區(qū)域;所述的靜態(tài)區(qū)域是指:對(duì)于給定最小閾值Thrmin,當(dāng)P (X,y) <Thrmin,則空間位置(x, y)屬于。
4.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的第二步具體包括以下步驟: 2.1)將視頻空間位置網(wǎng)格化,每個(gè)塊區(qū)域大小為HXH,2 < HS 64,且H為整數(shù); 2.2)對(duì)于視頻空間中的塊區(qū)域,計(jì)算有效像素比VPP以及運(yùn)動(dòng)復(fù)雜度MCD ; 2.3)根據(jù)有效像素比和運(yùn)動(dòng)復(fù)雜度,得到塊區(qū)域活躍度ADzyVPP+d-1OMCD,其中:μ表示混合參數(shù),O ^ μ ^ I ;然后對(duì)活躍的塊區(qū)域進(jìn)一步分割; 2.4)重復(fù)上述步驟2.2)和2.3),直至塊區(qū)域無法進(jìn)一步分割,即所有的塊區(qū)域均為不活躍,并得以將整個(gè)視頻空間分割成L個(gè)微型塊區(qū)域,對(duì)每個(gè)微型塊區(qū)域從I到L進(jìn)行編號(hào)。
5.根據(jù)權(quán)利要求4所述的方法,其特征是,所述的有效像素比
6.根據(jù)權(quán)利要求4所述的方法,其特征是,所述的分割是指:對(duì)于給定的活躍度閾值Thrffl,當(dāng)AD≤Thrffl,且當(dāng)前塊區(qū)域的尺寸沒有達(dá)到最小值LX L,2≤L≤10,L〈H,且L為正整數(shù),則將當(dāng)前塊區(qū)域空間上分割成四個(gè)大小相等的塊區(qū)域;當(dāng)AD〈ThrAD,則表示當(dāng)前塊區(qū)域不活躍,不再進(jìn)行分割。
7.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的過濾是指:當(dāng)?shù)趇個(gè)微型塊區(qū)域的運(yùn)動(dòng)復(fù)雜度MCDi ^ ThrMCD, Thrra為運(yùn)動(dòng)復(fù)雜度閾值則將發(fā)生在該微型塊區(qū)域內(nèi)的光流特征的方向量化成8個(gè),否則量化成4個(gè)。
8.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的視覺字典是指:每個(gè)視覺單詞編碼形式為:A.R.D,其中:A表示微型塊區(qū)域的編號(hào)且I;R表示方向量化的精度且R=4或者R=8 ;D表示方向編號(hào)且I≤D≤8 ;該視覺字典中包含的視覺單詞總數(shù)為:(:.=Σ尺.其
i中=Csize表示字典的規(guī)模;民表示第i個(gè)塊區(qū)域內(nèi)方向量化的精度。
【文檔編號(hào)】G06T7/20GK103871080SQ201410114805
【公開日】2014年6月18日 申請(qǐng)日期:2014年3月25日 優(yōu)先權(quán)日:2014年3月25日
【發(fā)明者】樊亞文, 鄭世寶, 吳雙 申請(qǐng)人:上海交通大學(xué)