專利名稱:視頻編碼處理方法、系統(tǒng)及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明實施例涉及3見頻處理領(lǐng)域,尤其涉及一種^L頻編碼處理方法、系 統(tǒng)及裝置。
背景技術(shù):
隨著科學(xué)技術(shù)的迅速發(fā)展,機(jī)關(guān)單位、公共場所以及各種保密機(jī)構(gòu)對于 安全性的要求也越來越高。視頻監(jiān)控技術(shù)作為 一種滿足安全性要求的安全監(jiān) 控手段,并普遍應(yīng)用于監(jiān)控系統(tǒng)。由于視頻監(jiān)控技術(shù)的普及以及監(jiān)控系統(tǒng)的 大規(guī)模部署,使得通信網(wǎng)絡(luò)上承載的視頻數(shù)據(jù)量大大增加,從而造成傳輸帶 寬的消耗非常嚴(yán)重;同時,由于從監(jiān)控系統(tǒng)中實時采集的大量視頻數(shù)據(jù)需要 存檔,因此,存儲和管理這些視頻數(shù)據(jù)所需要的存儲設(shè)備的存儲空間非常大, 假設(shè)一個小型城市有1000個監(jiān)控采集點,每個采集點傳送的視頻帶寬為 768kbps,每天24小時采集存儲,由于歷史數(shù)據(jù)需要至少保存6個月,因此, 至少需要的存儲空間為1390457Gbyte,可見存儲視頻數(shù)據(jù)的存儲空間非常大, 從而造成存儲設(shè)備的開銷費用成本非常高。
針對上述大量視頻數(shù)據(jù)的傳輸和存儲問題,現(xiàn)有技術(shù)主要采用視頻編碼 方法對采集到的視頻數(shù)據(jù)進(jìn)行壓縮,同時通過固定地降低比特率進(jìn)一步降低 視頻數(shù)據(jù)量,即對于監(jiān)控系統(tǒng)采集的所有視頻數(shù)據(jù),不管該時刻出現(xiàn)的視頻 數(shù)據(jù)是有價值的還是無價值的,均采用相同的比特率來對視頻數(shù)據(jù)進(jìn)行編碼。 此外,現(xiàn)有技術(shù)還存在兩種辦法用于解決大量視頻數(shù)據(jù)的傳輸問題, 一是鋪 設(shè)專網(wǎng),二是利用現(xiàn)有的電信網(wǎng)絡(luò)傳輸。
發(fā)明人在實現(xiàn)本發(fā)明的過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下缺陷現(xiàn)有技術(shù)的第 一種方法是對視頻數(shù)據(jù)進(jìn)行視頻編碼,可以在一定程度上降低視頻 數(shù)據(jù)量,但當(dāng)比特率降低的幅度比較大時,獲得的視頻圖像的質(zhì)量大大降低, 尤其對于有價值的視頻圖像,即包含有用信息的視頻圖像,使得視頻圖像中
有用信息部分包含的信息量大大減少,圖像細(xì)節(jié)部分丟失,嚴(yán)重影響視頻監(jiān)
控效果;當(dāng)比特率降低的幅度比較小時,對解決大量視頻數(shù)據(jù)的傳輸和存儲 問題沒有任何效果?,F(xiàn)有技術(shù)的后兩種方法的成本很高,而且龐大的視頻數(shù) 據(jù)量對電信網(wǎng)絡(luò)中其它數(shù)據(jù)造成嚴(yán)重沖擊和影響,干擾其它電信業(yè)務(wù)。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種視頻編碼處理方法、系統(tǒng)及裝置,以克服上述 現(xiàn)有技術(shù)的缺陷,通過對視頻信息進(jìn)行識別后再進(jìn)行分層編碼,從而減小由 大量視頻數(shù)據(jù)帶來的對存儲空間和傳輸帶寬的壓力。
本發(fā)明實施例提供了一種視頻編碼處理方法,包括對獲得的視頻信息進(jìn) 行信息識別,具體包括
提取所述視頻信息中的信息特征量;
判斷所述信息特征量是否滿足預(yù)設(shè)的門限;
如果滿足,則將所述視頻信息與預(yù)設(shè)的有用信息級別進(jìn)行匹配以獲取所 述^f見頻信息所屬的有用信息級別,并標(biāo)識所述^L頻信息所屬的有用信息級別, 否則,標(biāo)識所述^L頻信息為無用信息;
根據(jù)所述信息識別結(jié)果對所述視頻信息進(jìn)行分層編碼。
本發(fā)明實施例提供了一種視頻編碼處理系統(tǒng),包括識別模塊,用于對獲 得的視頻信息進(jìn)行信息識別;還包括
提取模塊,用于提取所述視頻信息中的信息特征量;
判斷模塊,用于判斷所述提取模塊提取的所述信息特征量是否滿足預(yù)設(shè) 的門限;
匹配模塊,用于當(dāng)判斷所述信息特征量滿足所述預(yù)設(shè)門限時,將所述視頻信息與預(yù)設(shè)的有用信息級別進(jìn)行匹配以獲取所述視頻信息所屬的有用信息
級別;
標(biāo)識模塊,用于當(dāng)判斷所述信息特征量不滿足所述預(yù)設(shè)門限時對所述視 頻信息進(jìn)行標(biāo)識及根據(jù)所述匹配模塊的匹配結(jié)果對所述視頻信息進(jìn)行標(biāo)識; 及
分層編碼模塊,用于根據(jù)所述識別模塊的信息識別結(jié)果對所述視頻信息 進(jìn)行分層編碼。
本發(fā)明實施例還提供了一種視頻編碼處理裝置,包括 第 一模塊,用于對獲得的視頻信息進(jìn)行信息識別; 第二模塊,用于預(yù)設(shè)比特率階梯;
第三模塊,用于根據(jù)所述第一模塊所獲得的信息識別結(jié)果和所述第二模 塊所預(yù)設(shè)比特率階梯對所述視頻信息進(jìn)行分層編碼。
本發(fā)明實施例通過首先識別視頻信息的有用程度,根據(jù)有用程度對視頻 信息進(jìn)行分層編碼,使得視頻信息的編碼比特率按照視頻信息的有用程度降 低,減少了待傳輸和存儲的視頻數(shù)據(jù)量,降低了大量視頻數(shù)據(jù)對監(jiān)控系統(tǒng)中 存儲空間的消耗,同時減小了大量視頻數(shù)據(jù)所占用的通信網(wǎng)絡(luò)的傳輸帶寬。
圖l為本發(fā)明視頻編碼處理方法實施例的流程圖2為本發(fā)明視頻編碼處理方法實施例中信息識別的流程圖3為本發(fā)明視頻編碼處理系統(tǒng)實施例的結(jié)構(gòu)圖4為本發(fā)明視頻編碼處理系統(tǒng)實施例中識別模塊的結(jié)構(gòu)圖;
圖5為本發(fā)明視頻編碼處理裝置實施例的結(jié)構(gòu)圖。
具體實施例方式
下面通過附圖和實施例,
對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。圖1為本發(fā)明i見頻編碼處理方法實施例的流程圖。如圖1所示,該方法 具體包括如下步驟
步驟101,對獲取的視頻信息進(jìn)行信息識別。 首先,提取當(dāng)前視頻信息中的信息特征量。
獲取視頻信息后,對視頻信息進(jìn)行處理,具體為首先提取視頻信息中 的信息特征量。信息特征量具體根據(jù)信息識別方法而定,不同的識別方法, 信息特征量不同。例如采用變化檢測的方法進(jìn)行信息識別時,由于該方法是 通過監(jiān)控視頻幀與幀之間的變化檢測來發(fā)現(xiàn)對象是否變化的,如水位上升, 此時信息特征量具體指視頻信息中的水位。
其次,判斷信息特征量是否滿足預(yù)設(shè)的門限。
判斷信息特征量與預(yù)設(shè)的門限之間的大小關(guān)系,該過程為對當(dāng)前視頻信 息進(jìn)行信息識別的過程。從監(jiān)控設(shè)備中獲取的視頻信息中包括有價值的信息, 也包括無價值的信息,例如,監(jiān)控環(huán)境為夜晚的工廠倉庫,正常情況下晚上 倉庫應(yīng)該沒有人出入,在對該監(jiān)控環(huán)境進(jìn)行監(jiān)控的過程中,若監(jiān)控畫面中出 現(xiàn)人或出現(xiàn)煙霧等的狀況,則該時刻的視頻信息存在價值,即為有用信息, 否則為無用信息。不同的監(jiān)控環(huán)境,有用信息的定義不同。有用信息識別的 方法可以為人工識別方法,可以為自動識別方法,還可以為混合識別方法, 混合識別方法就是將人工識別和自動識別同時進(jìn)行,對識別結(jié)果進(jìn)行信息融 合(information fus ion )得到最終的識別結(jié)果。采用的識別方法不同,信 息特征量不同,但各方法都需要預(yù)先設(shè)定一個門限來判斷視頻信息是否為有 用信息。
人工識別方法是最簡單、識別深度最深的一種識別方法,是基于人工指 令確認(rèn)的信息識別方法,即通過人眼檢查視頻圖像中的是否包含有用信息, 該方法中預(yù)設(shè)的門限是通過人的主觀感覺設(shè)定的,人工識別方法容易實現(xiàn), 但是效率較低,而且對于大規(guī)模的監(jiān)控系統(tǒng)的信息識別非常困難。自動識別 方法包括基于變化檢測的識別方法和基于深度內(nèi)容的識別方法,其中基于變化檢測的識別是一種識別層次比較淺的方法,在后面的具體實施例方式中將 對該方法進(jìn)行進(jìn)一步解釋?;谏疃葍?nèi)容的識別是在更深層次上對信息進(jìn)行 識別的方法,主要有基于特定場景的識別方法、基于圖像中文字內(nèi)容的識別 方法和基于人臉的識別方法。其中,基于特定場景的識別方法是將原來作為 一個由多個幀組成的視頻序列分割成不同場景組成的場景序列,通過識別每 個場景中的第一幀來分割場景,判斷該場景是否為有用場景,該方法通過對 場景中的第 一幀設(shè)置門限來對視頻信息進(jìn)行識別?;趫D像中文字內(nèi)容的識
別是采用光學(xué)文字識別(Optical Character Recognition, OCR)模塊對經(jīng) 過處理的圖像進(jìn)行識別,并把識別結(jié)果和數(shù)據(jù)庫進(jìn)行匹配,如果和數(shù)據(jù)庫中 的有用信息判斷條件匹配成功,則判定存在有用信息?;谌四樀淖R別方法 是用已有的人臉識別模塊對圖像進(jìn)行識別,然后與已有的數(shù)據(jù)庫進(jìn)行匹配, 若匹配成功,則判定存在有用信息。其中保存在已有數(shù)據(jù)庫中的數(shù)據(jù)為該方 法預(yù)設(shè)的門限。
再次,如果信息特征量滿足預(yù)設(shè)的門限,則將視頻信息與預(yù)設(shè)的N個有 用信息級別進(jìn)行匹配以獲取視頻信息所屬的有用信息級別。若獲取到視頻信 息所屬的有用信息級別,則標(biāo)識視頻信息所屬的有用信息級別;否則,標(biāo)識 當(dāng)前^L頻信息為無用信息。
如果當(dāng)前視頻信息所攜帶的信息特征量滿足預(yù)設(shè)的門限,則當(dāng)前視頻信 息為有用信息,否則為無用信息。本發(fā)明實施例采用包括上述介紹的識別方 法在內(nèi)的任一種識別方法均可以實現(xiàn)對有用信息的識別,同時還可以多種方 法同時使用,識別不同層面的有用信息。無論哪種識別方法,得到的識別結(jié) 果形式是一致的,并且是二值化(binary)的YES或者1表示信息有用; NO或者0表示信息沒用。通過識別判定當(dāng)前視頻信息為有用信息或無用信息, 對于有用信息,其信息有用的程度存在區(qū)別,因此還需要進(jìn)一步標(biāo)識該視頻 信息所屬的有用信息級別;對于無用信息,有用程度為0,則無需再對其進(jìn) 行有用信息級別的標(biāo)識。有用信息可以用多個級別來描述信息有用或者重要的程度,比如o表示
完全無用,M表示有用程度指標(biāo)的最高級,中間的某個值k表示一定的有用 程度。可以根據(jù)監(jiān)控環(huán)境、監(jiān)控信息的具體情況在進(jìn)行信息識別之前對該監(jiān) 控系統(tǒng)的有用信息進(jìn)行分級,共分為N個有用信息級別,并將預(yù)設(shè)的N個有 用信息級別存儲在一個信息級別數(shù)據(jù)庫中。當(dāng)標(biāo)識當(dāng)前^L頻信息的有用信息 級別時,則將當(dāng)前視頻信息與信息級別數(shù)據(jù)庫中存儲的各個級別分別進(jìn)行比 對,即根據(jù)一定條件,將當(dāng)前視頻信息歸為信息級別數(shù)據(jù)庫中存儲的N個有 用信息級別中的某一級別,假設(shè)當(dāng)前視頻信息與信息級別數(shù)據(jù)庫中的第m個 級別的信息的有用程度匹配,則將當(dāng)前視頻信息的有用程度標(biāo)識為第m級。 步驟102,根據(jù)信息識別結(jié)果對視頻信息進(jìn)行分層編碼。 分層纟見頻編碼(layered video coding)是一種4巴纟見頻lt據(jù)流進(jìn)行分層 壓縮編碼的方法,主要思想是輸出多個編碼層,最主要的部分是基本層(base layer),基本層之上有多個增強(qiáng)層(enhancement layer),基本層和增強(qiáng) 層可以分開發(fā)送。在接收端,基本層可以獨立解碼重構(gòu)出基本層視頻,但是 增強(qiáng)層必須依賴于基本層和/或其下面的增強(qiáng)層,才能解碼重構(gòu)出各自對應(yīng)的 視頻。在接收端,解碼重構(gòu)出來的基本層和各個增強(qiáng)層視頻碼流按照由具體 分層編碼方法規(guī)定的規(guī)則進(jìn)行疊加,從而得到總的視頻碼流。
本步驟中的視頻信息是指經(jīng)過信息識別后獲得的視頻信息,可能是標(biāo) 識有某一級別的有用信息,也可能是無用信息,針對識別結(jié)果的不同,分 層編碼時的具體方法也不同,在下述的具體實施方式
中將對此進(jìn)行詳細(xì)的 解釋,此處不再贅述。
進(jìn)一步地,在步驟101之前,還包括如下步驟 首先,根據(jù)統(tǒng)計模型獲取預(yù)設(shè)的各級別有用信息出現(xiàn)的先驗概率。 本步驟中獲取先驗概率的方法可以為通過建立新的監(jiān)控系統(tǒng)的統(tǒng)計模型 來計算,也可以通過已知的監(jiān)控系統(tǒng)的統(tǒng)計模型來設(shè)定。當(dāng)監(jiān)控系統(tǒng)的統(tǒng)計 模型為已知時,根據(jù)該模型中的歷史數(shù)據(jù),人類經(jīng)驗等知識設(shè)定N個有用信息級別的有用信息出現(xiàn)的先驗概率;當(dāng)監(jiān)控系統(tǒng)的統(tǒng)計模型未知時,先 建立該監(jiān)控系統(tǒng)的統(tǒng)計模型,具體地,對每個監(jiān)控系統(tǒng)進(jìn)行大量統(tǒng)計,包 括監(jiān)控場景、監(jiān)控對象、監(jiān)控時間等,根據(jù)大量的統(tǒng)計數(shù)據(jù)以及一些經(jīng)驗 值建立一個統(tǒng)計模型,由該統(tǒng)計模型計算在一般情況下每個預(yù)設(shè)有用信息 級別的有用信息出現(xiàn)的先驗概率。此處所指的預(yù)設(shè)有用信息級別是指存儲 在信息級別數(shù)據(jù)庫中的各有用信息級別。需要指出的是,每個監(jiān)控系統(tǒng)的 統(tǒng)計模型在一般條件下是穩(wěn)定的,因此,各預(yù)設(shè)有用信息級別的有用信息 出現(xiàn)的先驗概率是近似不變的,但也包含有特殊情況,需要根據(jù)特定的監(jiān) 控的地點、場景和時間對特定級別有用信息出現(xiàn)的概率進(jìn)行調(diào)整。
其次,根據(jù)統(tǒng)計模型獲取的各級有用信息出現(xiàn)的先驗概率制定比特率階梯。
制定比特率階梯,即各預(yù)設(shè)有用信息級別對應(yīng)的目標(biāo)比特率,目標(biāo)比特 率越高,表示該級別有用信息包含的信息量越大,該級別有用信息的有用程 度越高,具體步驟為計算各目標(biāo)比特率的取值范圍,具體滿足如下兩個關(guān) 系式
(Ai ,+尸2及2+…+ PwWw)『^5 CD
其中,《、i ,., i-l,2…N,分別為各預(yù)設(shè)有用信息級別的有用信息出現(xiàn)的 先驗概率和各預(yù)設(shè)有用信息級別的目標(biāo)比特率,W為監(jiān)控系統(tǒng)包含的信息采 集點數(shù)目,B為監(jiān)控系統(tǒng)通信網(wǎng)絡(luò)的最大總帶寬,T為視頻信息在監(jiān)控系統(tǒng)中 需要保存的時間,S為監(jiān)控系統(tǒng)的最大存儲容量,-為存儲容量的最高允許占 用比例。
進(jìn)一步地,在本實施例中,對于各預(yù)設(shè)有用信息級別的有用信息來說, 各相鄰有用信息級別的目標(biāo)比特率之間的數(shù)量關(guān)系可以為比值恒定,即各預(yù) 設(shè)有用信息級別的目標(biāo)比特率數(shù)值形成一個等比數(shù)列,假設(shè)公比為k,則有<formula>formula see original document page 12</formula>
根據(jù)關(guān)系式(3),關(guān)系式(1)和(2)便可以分別簡化為
<formula>formula see original document page 12</formula>4)
<formula>formula see original document page 12</formula>(5) 由關(guān)系式(4)和(5)很容易可以得到目標(biāo)比特率i ,的取值范圍為
<formula>formula see original document page 12</formula>根據(jù)這個范圍確定^的值,再由關(guān)系式(3)
<formula>formula see original document page 12</formula>
確定目標(biāo)比特率及2 ~ ^的值,因此得到對應(yīng)的比特率階梯。
此外,在本實施例中,對于各預(yù)設(shè)有用信息級別的有用信息來說,各相 鄰有用信息級別的目標(biāo)比特率之間的數(shù)量關(guān)系也可以為差值恒定,即各預(yù)設(shè)
有用信息級別的目標(biāo)比特率數(shù)值形成一個等差數(shù)列,假設(shè)公差為d,則有<formula>formula see original document page 12</formula>(6) 根據(jù)關(guān)系式(6),關(guān)系式(1)和(2)便可以分別簡化為
<formula>formula see original document page 12</formula>( 8 )
由關(guān)系式(7)和(8)很容易可以得到目標(biāo)比特率^的取值范圍為 (O,min(A — rf(P2 + 2尸3 +…+ (;V — ),^- rfCP2 + 2尸3 +…+ (iV -1)^》才艮據(jù)這個范圍確
『 r 定^的值,再由式(6)確定目標(biāo)比特率A i^的值,因此得到對應(yīng)的比特率階梯。
具體地,本實施例中的步驟102在執(zhí)行時分為下述兩種情況 (1)當(dāng)信息特征量滿足預(yù)設(shè)的門限時,根據(jù)標(biāo)識的當(dāng)前視頻信息所屬 的有用信息級別設(shè)置增強(qiáng)層的層數(shù);設(shè)定基本層的目標(biāo)比特率為A,設(shè)定 增強(qiáng)層i的目標(biāo)比特率為/ ,.+1-A.,并利用視頻編碼的比特率控制方法,依 據(jù)設(shè)定的目標(biāo)比特率,對視頻信息的基本層和增強(qiáng)層進(jìn)行編碼。
例如,當(dāng)前視頻信息經(jīng)過信息識別,判斷定為有用信息,且有用信息級別標(biāo)識為m,其中m為2到N之間的正整數(shù),則對當(dāng)前視頻信息進(jìn)行分 層編碼時,其增強(qiáng)層的層數(shù)設(shè)置為m-l,即編碼一個基本層和m-l個增強(qiáng) 層將當(dāng)前視頻信息發(fā)送出去。根據(jù)上述制定的比特率階梯,確定基本層的 目標(biāo)比特率為i ,,增強(qiáng)層1的目標(biāo)比特率為及2-i ,,...,增強(qiáng)層m-l的目 標(biāo)比特率為^-i ^,,然后利用^f見頻編碼的比特率控制方法,4艮據(jù)i殳定的 各層目標(biāo)比特率完成對當(dāng)前視頻信息的視頻編碼過程。
(2 )當(dāng)信息特征量不滿足預(yù)設(shè)的門限時,對無用信息的基本層進(jìn)行編碼。 當(dāng)前視頻信息被判定為無用信息時,則只對當(dāng)前視頻信息編碼一個基本 層發(fā)送即可,根據(jù)上述制定的比特率階梯,確定基本層的目標(biāo)比特率為i ,, 并利用視頻編碼的比特率控制方法,依據(jù)設(shè)定的目標(biāo)比特率,完成對無用 信息的^f見頻編碼。
通過對不同級別的有用信息編碼不同數(shù)量的增強(qiáng)層,實現(xiàn)了對視頻數(shù) 據(jù)編碼比特率的調(diào)整,所編碼的增強(qiáng)層越多,總的比特率越高,信息量越 豐富,而對于無用信息只編碼一個比特率最低的基本層。這樣,在視頻監(jiān) 控過程中,如果在95%的時間內(nèi)未出現(xiàn)有用信息,便可以采用很低的帶寬 來傳送視頻數(shù)據(jù)。
需要指出的是,在確定各層目標(biāo)比特率之后,對視頻信息進(jìn)行視頻編 碼時,本實施例可以選擇任意一種分層編碼的方法,具體可以為時間分層 編碼,可以為信噪比(Signal to Noise Ratio, SNR)分層編碼,可以為 空間分層編碼,還可以為精細(xì)粒度分層編碼。在編碼過程中通過比特率控 制技術(shù),設(shè)定各層的比特率近似等于所確定的目標(biāo)比特率即可,其中比特 率控制技術(shù)可以通過控制編碼過程中的量化參數(shù),進(jìn)而控制壓縮倍數(shù)來具
過程類似,此處不再贅述。
本實施例通過提供一種視頻編碼處理方法,首先識別出視頻信息中的 有用信息和無用信息,再按照有用信息的有用程度對視頻信息進(jìn)行分級,并制定比特率階梯,最后利用比特率階梯對視頻信息進(jìn)行分層編碼,本方 法根據(jù)信息識別的結(jié)果編碼出不同比特率的視頻碼流,解決了視頻編碼比 特率不能"智能"地降低的問題,使得比特率根據(jù)信息的有用程度分級別 地降低,進(jìn)一步減少了視頻數(shù)據(jù)量,解決了大量視頻數(shù)據(jù)對監(jiān)控系統(tǒng)中存 儲空間的消耗,同時進(jìn)一 步降低了大量視頻數(shù)據(jù)占用傳輸帶寬給通信網(wǎng)絡(luò) 帶來的巨大壓力,使得視頻監(jiān)控的大規(guī)模部署成為可能。
圖2為本發(fā)明視頻編碼處理方法實施例中信息識別的流程圖。如圖2所 示,上述實施例中信息識別的過程還可以通過對變化;險測進(jìn)行非線性映射的 方法來實現(xiàn),該方法具體包括如下步驟
步驟2 01,檢測視頻信息的變化。
檢測視頻信息的變化這一過程主要通過監(jiān)控視頻信息中幀與幀之間的變 化檢測(Change Detection)來發(fā)現(xiàn)監(jiān)控對象是否發(fā)生變化,是否有人或動 物非法進(jìn)入等,以及其它運動物體的運動等。
步驟202,選擇反映變化量的量化指標(biāo),量化^f見頻信息的變化。
通過檢測如果發(fā)現(xiàn)有變化,并且這些變化可以量化,選擇反映變化量的 量化指標(biāo),比如運動物體占整幀圖像面積的比例、運動矢量大小等等,通過 量化指標(biāo)來具體量化^f見頻信息的變化。
步驟203,根據(jù)量化的結(jié)果,計算視頻信息的有用程度指標(biāo),具體按照
如下公式進(jìn)行計算
<formula>formula see original document page 14</formula>
其中r-4^i, %min"^7max , s為視頻信息的有用程度指標(biāo),x為反映 一 +i
變化量的量化指標(biāo),t為中間變量,M表示有用程度指標(biāo)的最大值,[.]表 示取整函數(shù)。
預(yù)先設(shè)置一個變化量的門限,如果量化指標(biāo)代表的變化量超過預(yù)設(shè)的門限,就判定為有用信息,否則判定為無用信息。當(dāng)輸出的有用信息識別結(jié)果
包含多個級別,比如有用信息按照有用程度分為G-N級,將量化指標(biāo)和0-N 級進(jìn)行映射對應(yīng)。
的線性映射方法而提出的,變化檢測的線性映射方法的特點是變化量和有用 程度各個級別之間的關(guān)系為線性,具體用如下面公式所示
-M] (10)
"max a ni…
其中各參數(shù)含義與變化檢測的非線性映射方法中各參數(shù)一致。對比關(guān)系式(9 ) 和(10)可以看出,非線性映射方法將線性映射方法中信息的有用程度與變 化量之間的直線性關(guān)系改變?yōu)榉蔷鶆虻?、S型曲線關(guān)系,更加方便了有用信 息的識別。
別,提高了信息識別的效率,進(jìn)一步降低了待編碼的視頻數(shù)據(jù)量。
圖3為本發(fā)明視頻編碼處理系統(tǒng)實施例的結(jié)構(gòu)圖。如圖3所示,本發(fā) 明提供的視頻編碼處理系統(tǒng)包括識別模塊1和分層編碼模塊2,識別模塊1 用于對視頻監(jiān)控獲得的視頻信息進(jìn)行信息識別,分層編碼模塊2用于根據(jù)識 別模塊1的識別結(jié)果對視頻信息進(jìn)行分層編碼。
其中,識別模塊l可以位于監(jiān)控系統(tǒng)的監(jiān)控信息采集側(cè),其中包括融合 在壓縮編碼模塊內(nèi)部的情況,也可以位于監(jiān)控系統(tǒng)的監(jiān)控控制中心側(cè)?;?原則是把信息識別層次淺、計算簡單的識別功能放在監(jiān)控信息采集側(cè)實現(xiàn), 把信息識別層次深,計算復(fù)雜的識別功能放在監(jiān)控控制中心側(cè)實現(xiàn)。因此, 可以在一個監(jiān)控系統(tǒng)中存在多個識別模塊1,并且將多個識別模塊1的識別 結(jié)果和人工操作者的識別結(jié)果進(jìn)行融合之后,再反饋給分層編碼模塊2。
具體地,識別模塊1包括提取模塊11、判斷模塊12、匹配模塊13和 標(biāo)識模塊14,提取模塊11用于提取視頻信息中的信息特征量,判斷模塊12用于判斷提取模塊11提取的信息特征量是否滿足預(yù)設(shè)的門限,匹配模塊13 用于當(dāng)判斷信息特征量滿足預(yù)設(shè)門限時,將視頻信息與預(yù)設(shè)的各個有用信息 級別進(jìn)行匹配以獲取視頻信息所屬的有用信息級別,標(biāo)識模塊14用于當(dāng)判斷 信息特征量不滿足預(yù)設(shè)門限時對視頻信息進(jìn)行標(biāo)識及根據(jù)匹配模塊13的匹 配結(jié)果對^L頻信息進(jìn)行標(biāo)識。
進(jìn)一步地,視頻編碼處理系統(tǒng)還包括預(yù)設(shè)模塊3,預(yù)設(shè)模塊3用于預(yù)設(shè) 比特率階梯。預(yù)設(shè)模塊3包括獲取模塊31和制定模塊32,獲取模塊31用于 獲取監(jiān)控系統(tǒng)的統(tǒng)計模型,根據(jù)統(tǒng)計模型獲取預(yù)設(shè)的各個有用信息級別的有 用信息出現(xiàn)的先驗概率,制定模塊32用于根據(jù)獲取模塊31獲取的先驗概率 制定比特率階梯,分層編碼模塊2用于根據(jù)預(yù)設(shè)模塊3制定的比特率階梯對 視頻信息進(jìn)行分層編碼。
具體地,制定模塊32包括第一計算模塊322,第一計算模塊322用于根 據(jù)獲取模塊31獲取的各個有用信息級別的有用信息出現(xiàn)的先驗概率計算各 預(yù)設(shè)有用信息級別的目標(biāo)比特率的取值范圍,具體滿足關(guān)系式(7)和(8), 即計算得到比特率階梯。進(jìn)一步地,制定模塊還可以包括存儲模塊321,存 儲模塊321用于存儲各預(yù)設(shè)有用信息級別的有用信息出現(xiàn)的先驗概率f 、各
預(yù)設(shè)有用信息級別的目標(biāo)比特率i ,.、監(jiān)控系統(tǒng)包含的信息采集點數(shù)目W、監(jiān) 控系統(tǒng)通信網(wǎng)絡(luò)的最大總帶寬B、視頻信息在監(jiān)控系統(tǒng)中需要保存的時間T、 監(jiān)控系統(tǒng)的最大存儲容量S、存儲容量的最高允許占用比例p;第一計算模塊 322用于根據(jù)存儲模塊321中存儲的各個信息計算各預(yù)設(shè)有用信息級別的目 標(biāo)比特率的取值范圍,即計算得到比特率階梯。
具體地,分層編碼模塊2具體包括設(shè)置模塊21、設(shè)定模塊22和編碼模 塊23,設(shè)置模塊21用于當(dāng)信息特征量滿足預(yù)設(shè)的門限時,根據(jù)標(biāo)識的視頻 信息所屬的有用信息級別設(shè)置增強(qiáng)層的層數(shù),設(shè)定模塊22用于設(shè)定基本層 和增強(qiáng)層的目標(biāo)比特率,編碼模塊23用于對視頻信息的基本層和增強(qiáng)層 進(jìn)行編碼。本實施例提供的視頻編碼處理系統(tǒng)的信息處理過程具體為首先,獲得 視頻信息,輸入到識別模塊1中;識別模塊1中的提取模塊11提取視頻信息 中的信息特征量;判斷模塊12判斷信息特征量是否滿足預(yù)設(shè)的門限;匹配模 塊13將視頻信息與預(yù)設(shè)的各個有用信息級別進(jìn)行匹配以獲取視頻信息所屬 的有用信息級別,并標(biāo)識所視頻信息所屬的有用信息級別;如果該;見頻信息 的信息特征量滿足預(yù)設(shè)的門限,則標(biāo)識模塊14根據(jù)匹配模塊13的匹配結(jié)果 對當(dāng)前^f見頻信息的有用信息級別進(jìn)行標(biāo)識;若不滿足預(yù)設(shè)的門限,則標(biāo)識才莫 塊1標(biāo)識當(dāng)前視頻信息為無用信息。其次,將識別模塊1的識別結(jié)果輸出 到分層編碼模塊2;分層編碼模塊2中的設(shè)置模塊21根據(jù)識別結(jié)果設(shè)置編碼 的增強(qiáng)層層數(shù);分層編碼模塊2再根據(jù)制定模塊制定的比特率階梯設(shè)定當(dāng)前 視頻信息的基本層和增強(qiáng)層的目標(biāo)比特率,完成對當(dāng)前視頻信息的視頻編 碼。
圖4為本發(fā)明視頻編碼處理系統(tǒng)實施例中識別模塊的結(jié)構(gòu)圖。如圖4所 示,當(dāng)對變化檢測采用非線性映射方法作為信息識別方法時,本實施例中識 別模塊1具體包括檢測模塊111、量化模塊112和第二計算模塊113,檢測模 塊111用于檢測提取模塊11所獲取的視頻信息的變化,量化模塊112用于選 擇反映變化量的量化指標(biāo),量化檢測模塊111檢測到的視頻信息的變化,第 一計算模塊113用于根據(jù)量化模塊112的量化結(jié)果以及視頻信息的有用程度 指標(biāo)的最大值,計算視頻信息的有用程度指標(biāo),具體按照上述關(guān)系式(9)進(jìn) 行計算。
本實施例通過提供一種視頻編碼處理系統(tǒng),其中識別模塊對視頻信息 進(jìn)行識別,分層編碼模塊利用比特率階梯對視頻信息進(jìn)行分層編碼,根據(jù) 信息的有用程度來設(shè)定分層編碼的各層比特率,大大減少了大量視頻數(shù)據(jù) 對監(jiān)控系統(tǒng)中存儲空間和通信網(wǎng)絡(luò)中傳輸帶寬的消耗,使得視頻監(jiān)控的大 規(guī)模部署成為可能。
圖5為本發(fā)明視頻編碼處理裝置的結(jié)構(gòu)圖。如圖5所示,視頻編碼處理裝置包括第一模塊51、第二模塊52和第三模塊53,其中第一模塊51 用于對視頻監(jiān)控獲得的視頻信息進(jìn)行信息識別;第二模塊52用于預(yù)設(shè)比特 率階梯;第三模塊53用于根據(jù)第一模塊51所獲得的信息識別結(jié)果和第二模 塊52所預(yù)設(shè)比特率階梯對所述視頻信息進(jìn)行分層編碼。
本實施例通過提供一種視頻編碼處理裝置,其中第三模塊5 3利用第一 模塊51對視頻信息進(jìn)行識別,再根據(jù)第二模塊52預(yù)設(shè)的比特率階梯對視 頻信息進(jìn)行分層編碼,根據(jù)信息的有用程度來設(shè)定分層編碼的各層比特 率,大大減少了大量視頻數(shù)據(jù)對監(jiān)控系統(tǒng)中存儲空間和通信網(wǎng)絡(luò)中傳輸帶 寬的消耗,使得視頻監(jiān)控的大規(guī)模部署成為可能。
最后應(yīng)說明的是以上實施例僅用以說明本發(fā)明的技術(shù)方案而非對其進(jìn) 行限制,盡管參照較佳實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技 術(shù)人員應(yīng)當(dāng)理解其依然可以對本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換, 而這些修改或者等同替換亦不能使修改后的技術(shù)方案脫離本發(fā)明技術(shù)方案的 精神和范圍。
權(quán)利要求
1、一種視頻編碼處理方法,其特征在于,包括對獲得的視頻信息進(jìn)行信息識別,具體為提取所述視頻信息中的信息特征量;判斷所述信息特征量是否滿足預(yù)設(shè)的門限;如果滿足,則將所述視頻信息與預(yù)設(shè)的有用信息級別進(jìn)行匹配以獲取所述視頻信息所屬的有用信息級別,并標(biāo)識所述視頻信息所屬的所述有用信息級別;如果不滿足,則標(biāo)識所述視頻信息為無用信息;根據(jù)所述信息識別結(jié)果對所述視頻信息進(jìn)行分層編碼。
2、 根據(jù)權(quán)利要求1所述的視頻編碼處理方法,其特征在于,在所述對獲 得的視頻信息進(jìn)行信息識別之前,還包括根據(jù)統(tǒng)計模型獲取各個所述預(yù)設(shè)的有用信息級別的所述有用信息出現(xiàn)的 先驗概率;根據(jù)所述先驗概率制定比特率階梯。
3、 根據(jù)權(quán)利要求2所述的視頻編碼處理方法,其特征在于,所述比特率 階梯中各相鄰預(yù)設(shè)有用信息級別的目標(biāo)比特率之間的數(shù)量關(guān)系為比值恒定或 差值恒定。
4、 根據(jù)權(quán)利要求3所述的視頻編碼處理方法,其特征在于,所述制定比 特率階梯具體包括計算各個預(yù)設(shè)有用信息級別的所述目標(biāo)比特率的取值范 圍。
5、 根據(jù)權(quán)利要求4所述的視頻編碼處理方法,其特征在于,所述根據(jù)信 息識別結(jié)果對所述^L頻信息進(jìn)行分層編碼具體包括當(dāng)所述信息特征量滿足預(yù)設(shè)的門限時,根據(jù)標(biāo)識的所述視頻信息所屬的 有用信息級別設(shè)置增強(qiáng)層的層數(shù);設(shè)定基本層的所述目標(biāo)比特率為^,設(shè)定所述增強(qiáng)層i的所述目標(biāo)比 特率為- ,利用視頻編碼的比特率控制方法,依據(jù)所述的目標(biāo)比特率,對所述基本層和所述增強(qiáng)層進(jìn)行編碼;當(dāng)所述信息特征量不滿足預(yù)設(shè)的門限時,設(shè)定所述基本層的所述目標(biāo)比 特率為及,,利用視頻編碼的比特率控制方法,依據(jù)所述的目標(biāo)比特率對所 述基本層進(jìn)行編碼。
6、 根據(jù)權(quán)利要求5所述的視頻編碼處理方法,其特征在于,所述信息識 別通過對變化檢測進(jìn)行非線性映射的方法實現(xiàn),具體包括檢測所述視頻信息的變化;選擇反映變化量的量化指標(biāo),量化所述視頻信息的變化; 根據(jù)量化的結(jié)果以及視頻信息的有用程度指標(biāo)的最大值計算所述視頻信 息的有用程度指標(biāo)。
7、 一種視頻編碼處理系統(tǒng),其特征在于,包括 識別模塊,用于對獲得的視頻信息進(jìn)行信息識別,還包括 提取模塊,用于提取所述視頻信息中的信息特征量;判斷模塊,用于判斷所述提取模塊提取的所述信息特征量是否滿足預(yù)設(shè) 的門限;匹配模塊,用于當(dāng)判斷所述信息特征量滿足所述預(yù)設(shè)門限時,將所述視 頻信息與預(yù)設(shè)的有用信息級別進(jìn)行匹配以獲取所述視頻信息所屬的有用信息 級別;標(biāo)識才莫塊,用于當(dāng)判斷所述信息特征量不滿足所述預(yù)設(shè)門限時對所述3見頻 信息進(jìn)行標(biāo)識及根據(jù)所述匹配模塊的匹配結(jié)果對所述視頻信息進(jìn)行標(biāo)識;及分層編碼模塊,用于根據(jù)所述視頻信息的信息識別結(jié)果對所述視頻信息 進(jìn)行分層編碼。
8、 根據(jù)權(quán)利要求7所述的視頻編碼處理系統(tǒng),其特征在于,所述識別模塊 位于監(jiān)控系統(tǒng)的監(jiān)控信息采集側(cè),或者位于所述監(jiān)控系統(tǒng)的監(jiān)控控制中心側(cè)。
9、 根據(jù)權(quán)利要求7所述的視頻編碼處理系統(tǒng),其特征在于,還包括預(yù)設(shè) 模塊,用于預(yù)設(shè)比特率階梯,所述預(yù)設(shè)模塊包括獲取模塊,用于獲取各個所述預(yù)設(shè)的有用信息級別的所述有用信息出現(xiàn)的先-驗概率;制定模塊,用于根據(jù)所述獲取模塊獲取的所述先驗概率制定比特率階梯; 所述分層編碼模塊還用于根據(jù)所述預(yù)設(shè)模塊預(yù)設(shè)的所述比特率階梯對所 述視頻信息進(jìn)行分層編碼。
10、 根據(jù)權(quán)利要求9所述的視頻編碼處理系統(tǒng),其特征在于,所述制定 模塊具體包括第一計算模塊,用于計算各所述預(yù)設(shè)有用信息級別的所述目 標(biāo)比特率的取值范圍。
11、 根據(jù)權(quán)利要求10所述的視頻編碼處理系統(tǒng),其特征在于,所述分層 編碼模塊具體包括設(shè)置模塊,用于當(dāng)所述信息特征量滿足所述預(yù)設(shè)的門限時,根據(jù)標(biāo)識的 所述視頻信息所屬的有用信息級別設(shè)置增強(qiáng)層的層數(shù);設(shè)定模塊,用于設(shè)定基本層和所述增強(qiáng)層的所述目標(biāo)比特率; 編碼模塊,用于對所述基本層和所述增強(qiáng)層進(jìn)行編碼。
12、 根據(jù)權(quán)利要求7所述的視頻編碼處理系統(tǒng),其特征在于,所述識別 模塊包括檢測模塊,用于檢測所述視頻信息的變化;量化模塊,用于選擇反映變化量的量化指標(biāo),量化所述檢測模塊檢測到 的所述視頻信息的變化;第二計算模塊,用于根據(jù)所述量化模塊的量化結(jié)果以及視頻信息的有用程度指標(biāo)的最大值計算所述^f見頻信息的有用程度指標(biāo)。
13、 一種視頻編碼處理裝置,其特征在于,包括 第 一模塊,用于對獲得的視頻信息進(jìn)行信息識別; 第二模塊,用于預(yù)設(shè)比特率階梯;第三模塊,用于根據(jù)所述第一模塊所獲得的信息識別結(jié)果和所述第二模 塊所預(yù)設(shè)比特率階梯對所述視頻信息進(jìn)行分層編碼。
全文摘要
本發(fā)明實施例公開了一種視頻編碼處理方法、系統(tǒng)及裝置,視頻編碼處理方法包括對獲得的視頻信息進(jìn)行信息識別,具體包括提取視頻信息中的信息特征量;判斷信息特征量是否滿足預(yù)設(shè)的門限;根據(jù)信息識別結(jié)果對視頻信息進(jìn)行分層編碼。視頻編碼處理系統(tǒng)包括識別模塊,用于對獲得的視頻信息進(jìn)行信息識別,分層編碼模塊,用于對視頻信息進(jìn)行分層編碼。視頻編碼處理裝置包括第一模塊,用于對獲得的視頻信息進(jìn)行信息識別;第二模塊,用于預(yù)設(shè)比特率階梯;第三模塊,用于對視頻信息進(jìn)行分層編碼。本發(fā)明實施例通過對識別后的視頻信息進(jìn)行分層編碼,降低了視頻數(shù)據(jù)量,減小了龐大的視頻數(shù)據(jù)量對存儲空間和網(wǎng)絡(luò)傳輸帶寬的壓力。
文檔編號H04N7/26GK101557510SQ20081010361
公開日2009年10月14日 申請日期2008年4月9日 優(yōu)先權(quán)日2008年4月9日
發(fā)明者忠 羅 申請人:華為技術(shù)有限公司