一種基于頻域的視頻流模糊檢測(cè)方法
【專利摘要】一種基于頻域的視頻流模糊檢測(cè)方法,包括如下步驟:對(duì)輸入視頻流按照?qǐng)鼍安煌M(jìn)行分割,計(jì)算運(yùn)動(dòng)矢量;計(jì)算視頻塊的DCT系數(shù),并統(tǒng)計(jì)出整幀各個(gè)頻率分量的非零DCT系數(shù)個(gè)數(shù)矩陣A1;計(jì)算視頻塊的主導(dǎo)方向角度;計(jì)算視頻塊主導(dǎo)方向的后驗(yàn)概率密度;計(jì)算出權(quán)重值,構(gòu)造初始權(quán)重矩陣,對(duì)初始權(quán)重矩陣中的各個(gè)參數(shù)作對(duì)應(yīng)調(diào)整,得到權(quán)重矩陣;計(jì)算幀清晰指數(shù)和塊清晰指數(shù),并對(duì)和作歸一化;由和歸一化后的清晰指數(shù)求出模糊指數(shù),確定整個(gè)場(chǎng)景的全局模糊閥值,判斷出全局模糊幀和局部模糊幀。本發(fā)明大大減少了算法運(yùn)算復(fù)雜度與所需內(nèi)存空間,能準(zhǔn)確檢測(cè)出全局模糊幀和局部模糊幀并定量判斷模糊程度;適用于各種視頻流尤其是體育運(yùn)動(dòng)視頻流的模糊檢測(cè)。
【專利說(shuō)明】一種基于頻域的視頻流模糊檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)軟件算法領(lǐng)域,涉及視頻圖像處理技術(shù),特別是一種基于頻域 的視頻流模糊檢測(cè)方法。
【背景技術(shù)】
[0002] 隨著三網(wǎng)融合的最主要應(yīng)用--"泛視頻"產(chǎn)業(yè)的蓬勃發(fā)展,大量非專業(yè)攝影視頻 數(shù)據(jù)如泉水般突涌出來(lái),并被廣泛地應(yīng)用于手機(jī)視頻、CMMB (中國(guó)移動(dòng)多媒體廣播)手機(jī)電 視、IPTV (Internet Protocol Television)和互聯(lián)網(wǎng)視頻業(yè)務(wù)。然而由于普通攝影器材 的局限性以及廣大攝影愛好者拍攝技術(shù)的參差不齊,使得非專業(yè)攝影采集到的視頻流質(zhì)量 差異巨大,難于只經(jīng)過簡(jiǎn)單的常規(guī)后期處理就直接應(yīng)用于節(jié)目制作、壓縮存儲(chǔ)、視頻傳輸和 視頻搜索等業(yè)務(wù)。
[0003] 模糊,尤其運(yùn)動(dòng)模糊是泛視頻中最常見最頭痛的問題;競(jìng)技體育視頻中,運(yùn)動(dòng)模糊 更是最普遍的現(xiàn)象。因此作為視頻預(yù)處理技術(shù)之一的自動(dòng)模糊檢測(cè)技術(shù)倍受關(guān)注。該技術(shù) 能為視頻編輯、視頻搜索和視頻壓縮等技術(shù)的實(shí)施帶來(lái)方便,并為上述技術(shù)改進(jìn)提供素材、 開辟創(chuàng)新觀點(diǎn)。視頻模糊檢測(cè)是一項(xiàng)判斷視頻幀是否模糊、模糊程度是多少的技術(shù)。在視 頻非線性編輯領(lǐng)域模糊檢測(cè)技術(shù)能協(xié)助視頻預(yù)處理人員丟棄模糊程度大的視頻幀,提高編 輯效率;在視頻搜索領(lǐng)域模糊檢測(cè)技術(shù)能提高關(guān)鍵幀和重要區(qū)域檢測(cè)與提取效能,從而大 大改進(jìn)搜索技術(shù)的準(zhǔn)確性和實(shí)時(shí)性;在視頻壓縮領(lǐng)域模糊檢測(cè)技術(shù)能檢測(cè)出模糊幀與模糊 區(qū)域,針對(duì)模糊幀和模糊區(qū)域的特殊編碼模式(如:模糊幀不能作為參考幀編碼、模糊區(qū)域 采用大量化步長(zhǎng))能進(jìn)一步推動(dòng)基于視頻內(nèi)容的智能壓縮技術(shù)的深化改革與日趨成熟;在 視頻傳輸領(lǐng)域模糊檢測(cè)能協(xié)助預(yù)測(cè)編碼后的碼率,從而為實(shí)現(xiàn)泛視頻在通信網(wǎng)絡(luò)和數(shù)字終 端的智能高效傳輸添磚加瓦。
[0004] 現(xiàn)有的視頻模糊檢測(cè)技術(shù)大多是基于視頻幀像素的統(tǒng)計(jì)參數(shù)判斷,比如像素的自 相關(guān)函數(shù)、熵、灰度值變化情況、梯度值、能量、密度函數(shù)。其中Stefan Roth和Zhu提出的 用整幀圖像的灰度梯度呈現(xiàn)出的重尾分布(如圖1所示,大量灰度梯度值集中于小值區(qū)域 形成比后重的拖尾,少量灰度梯度值具有顯著的大值形成尖峰。當(dāng)圖像清晰時(shí)灰度梯度分 布會(huì)呈現(xiàn)出后重寬大的拖尾,圖像越模糊拖尾越窄越?。┻M(jìn)行模糊檢測(cè)能有效地判斷出兩 個(gè)視頻幀誰(shuí)更具有全局模糊,用視頻幀中各物體部分的灰度梯度的重尾分布進(jìn)行模糊檢測(cè) 能有效地判斷出兩個(gè)視頻幀中相同物體部分誰(shuí)更具局部模糊。該方案首先對(duì)同一場(chǎng)景的視 頻流進(jìn)行背景建模,然后提取運(yùn)動(dòng)目標(biāo),當(dāng)運(yùn)動(dòng)目標(biāo)區(qū)域比例s (s=前景物體區(qū)域大小/視 頻幀大?。┬∮陂y值?;時(shí)認(rèn)為該視頻幀沒有運(yùn)動(dòng)目標(biāo)而結(jié)束模糊檢測(cè);當(dāng)s大于?\時(shí)認(rèn)為 整個(gè)視頻幀都是運(yùn)動(dòng)目標(biāo),從而用整幀圖像灰度梯度的重尾分布確定該視頻幀是否具有全 局模糊;當(dāng)s小于?\大于?;時(shí)認(rèn)為該視頻幀有部分運(yùn)動(dòng)目標(biāo),從而用部分運(yùn)動(dòng)目標(biāo)的重尾 分布確定該視頻幀是否具有局部模糊。
[0005] 在頻域進(jìn)行模糊檢測(cè)的方法中Karl S. Ni和Hanghang Tong提出的方法具有代 表性,該方案通過哈爾小波變換來(lái)分析整幅視頻圖像的邊緣類型和尖銳程度,并與清晰的 參考圖像進(jìn)行比較從而判斷被檢測(cè)視頻圖像是否模糊,及模糊程度如何。
[0006] Stefan Roth和Zhu提出的灰度梯度重尾分布方案有如下缺點(diǎn):1.運(yùn)算復(fù)雜耗時(shí) 對(duì)同一場(chǎng)景的視頻流進(jìn)行背景建模需要幾十到上百幅視頻幀進(jìn)行大量的迭代運(yùn)算,有時(shí)算 法會(huì)不收斂從而得不到該場(chǎng)景的背景圖像,最終導(dǎo)致檢測(cè)方案失敗。2.所需內(nèi)存大、成本 高背景重構(gòu)和運(yùn)動(dòng)目標(biāo)提取工作需要將幾十至上百幅未壓縮的視頻幀放入內(nèi)存進(jìn)行處 理,以CIF大小(352X288)的視頻為例所需存儲(chǔ)空間100MB,而普通高清視頻(1920X1080) 則需要1.6GB的存儲(chǔ)空間。3.檢測(cè)準(zhǔn)確度不夠高不同內(nèi)容不同清晰度的視頻幀可能會(huì)有 近似的灰度梯度分布4.僅適用于固定攝像頭的監(jiān)測(cè)視頻的模糊檢測(cè),不適用于普通視頻尤 其是體育競(jìng)技視頻的模糊檢測(cè)。
[0007] Karl S. Ni和Hanghang Tong提出的哈爾小波變換分析方案有如下缺點(diǎn):1.只 能檢測(cè)視頻幀的全局模糊,不能檢測(cè)出視頻幀的局部模糊。2.需要清晰的內(nèi)容相同或相近 的視頻巾貞作為參考判斷。
【發(fā)明內(nèi)容】
[0008] 為克服現(xiàn)有視頻圖像模糊檢測(cè)方法運(yùn)算量大,所需占用硬件存儲(chǔ)設(shè)備容量巨大, 需要清晰參考幀的技術(shù)缺陷,本發(fā)明公開了一種基于頻域的視頻流模糊檢測(cè)方法。
[0009] 本發(fā)明所述基于頻域的視頻流模糊檢測(cè)方法一種基于頻域的視頻流模糊檢測(cè)方 法,包括如下步驟: 51. 對(duì)輸入視頻流按照?qǐng)鼍安煌M(jìn)行分割,對(duì)同一場(chǎng)景的視頻幀按照從左到右、從上 到下的順序分為若干BxXB y大小的視頻塊,Bx、By分別表示水平和垂直方向視頻塊中像素點(diǎn) 個(gè)數(shù),計(jì)算視頻塊的DCT系數(shù),并統(tǒng)計(jì)出整幀各個(gè)頻率分量的非零DCT系數(shù)個(gè)數(shù)矩陣A1 ;按 照(1)式,計(jì)算視頻塊的主導(dǎo)方向特征,并取與(1)式計(jì)算值最接近的劃分角度作為主導(dǎo)方 向角度;
【權(quán)利要求】
1. 一種基于頻域的視頻流模糊檢測(cè)方法,其特征在于,包括如下步驟:
51. 對(duì)輸入視頻流按照?qǐng)鼍安煌M(jìn)行分割,對(duì)同一場(chǎng)景的視頻幀按照從左到右、從上 到下的順序分為若干BxXB y大小的視頻塊,Bx、By分別表示水平和垂直方向視頻塊中像素點(diǎn) 個(gè)數(shù),計(jì)算視頻塊的DCT系數(shù),并統(tǒng)計(jì)出整幀各個(gè)頻率分量的非零DCT系數(shù)個(gè)數(shù)矩陣A1 ;按 照(1)式,計(jì)算視頻塊的主導(dǎo)方向特征,并取與(1)式計(jì)算值最接近的劃分角度作為主導(dǎo)方 向角度;
其中F(0, j)與F(i,0)為DCT系數(shù),所述劃分角度為: 0,1*360° /B,2* 360° /B,…(B-l)*360° /B;B 為角度劃分參數(shù);
52. 按照(2)式計(jì)算視頻塊主導(dǎo)方向的后驗(yàn)概率密度;
其中
為針對(duì)內(nèi)容content的概率,
為該主導(dǎo)方向角度〃的概率;根據(jù) Α-- ?.?ι按內(nèi)容和主導(dǎo)角度對(duì)視頻幀的每個(gè)塊進(jìn)行分類,統(tǒng)計(jì)得到各種分類各個(gè)頻率 分量下的非零DCT系數(shù)個(gè)數(shù)矩陣Α2 ; 按照(3)式對(duì)同一場(chǎng)景不同視頻幀的分塊進(jìn)行運(yùn)動(dòng)矢量計(jì)算找出同一場(chǎng)景視頻幀中各 類塊的匹配塊;
(3) 其中s表示當(dāng)前視頻幀的像素值,c表示參考視頻幀的像素值,MVX、MVy分別表示水平 或垂直運(yùn)動(dòng)矢量,Bx、By分別表示水平和垂直方向視頻塊中像素點(diǎn)個(gè)數(shù),SAD ()表示對(duì)括 號(hào)內(nèi)的內(nèi)容計(jì)算絕對(duì)誤差和;min ()表示取最小值;
53. 按照(4)式計(jì)算出權(quán)重值,
(4) 其中奮+*|·為權(quán)重調(diào)整函數(shù); 構(gòu)造B階矩陣作為初始權(quán)重矩陣,將根據(jù)(4)式得到的權(quán)重值對(duì)初始權(quán)重矩陣中的各 個(gè)參數(shù)作對(duì)應(yīng)調(diào)整,得到最終權(quán)重矩陣;
54. 用步驟S1統(tǒng)計(jì)出的整幀各個(gè)頻率分量的非零DCT系數(shù)個(gè)數(shù)矩陣A1乘以該幀的權(quán) 重矩陣得到幀清晰指數(shù)用步驟S2統(tǒng)計(jì)出的各類視頻塊各個(gè)頻率分量下的非零DCT系 數(shù)個(gè)數(shù)矩陣A2乘以其相應(yīng)的權(quán)重矩陣得到各視頻塊的塊清晰指數(shù),并對(duì)元^.和作 歸一化;
55. 由匕和+?...歸一化后的清晰指數(shù)求出模糊指數(shù),根據(jù)模糊指數(shù)分布將場(chǎng)景中的 各個(gè)幀分為清晰幀與非清晰幀兩類,以非清晰幀中的最大模糊指數(shù)作為該整個(gè)場(chǎng)景的全局 模糊閥值DTA ; 再根據(jù)各類匹配塊的模糊指數(shù)分布分為清晰塊和非清晰塊,以非清晰塊中的最大模糊 指數(shù)作為該類視頻塊的局部模糊閥值DTP ; 對(duì)每一個(gè)視頻幀的模糊指數(shù)與全局模糊閥值DTA進(jìn)行比較,超過DTA閥值則視為全局 模糊幀,模糊指數(shù)與模糊閥值的比值計(jì)為全局模糊程度;對(duì)每一類視頻塊的模糊指數(shù)與該 類的局部模糊閥值DTP進(jìn)行比較,超過DTP閥值視為模糊塊,當(dāng)模糊塊的個(gè)數(shù)超過占整個(gè)視 頻幀總塊數(shù)的C%時(shí),視該幀為局部模糊幀,所述C為預(yù)設(shè)的局部模糊幀比例判斷閥值,各塊 模糊指數(shù)與對(duì)應(yīng)的局部模糊閥值比值的平均值計(jì)為局部模糊程度。
2. 如權(quán)利要求1所述的基于頻域的視頻流模糊檢測(cè)方法,其特征在于,所述步驟S1、S3 中角度劃分參數(shù)B=8,所述劃分角度為0°、45°、90°、135°、180°、225°、270°、315° ; 所述(4)式為:
3. 如權(quán)利要求1所述的基于頻域的視頻流模糊檢測(cè)方法,其特征在于,所述步驟S2中 根據(jù)按內(nèi)容和主導(dǎo)角度對(duì)視頻幀的每個(gè)塊進(jìn)行分類。
4. 如權(quán)利要求1所述的基于頻域的視頻流模糊檢測(cè)方法,其特征在于,所述步驟S5中 將清晰幀與非清晰幀、清晰塊與非清晰塊的模糊指數(shù)分成兩類的方法為K-中心點(diǎn)聚類法。
5. 如權(quán)利要求1所述的基于頻域的視頻流模糊檢測(cè)方法,其特征在于,所述C=15至 40。
【文檔編號(hào)】H04N17/00GK104301722SQ201410607582
【公開日】2015年1月21日 申請(qǐng)日期:2014年11月3日 優(yōu)先權(quán)日:2014年11月3日
【發(fā)明者】鄔震宇, 沈曉峰, 萬(wàn)群, 馮健, 周代英 申請(qǐng)人:電子科技大學(xué)