專利名稱:一種基于人臉檢測的視頻壓縮容錯方法及編解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻壓縮技術(shù)領(lǐng)域,尤其涉及一種基于人臉檢測的視頻壓縮 容錯方法及編解碼方法。
背景技術(shù):
視頻壓縮編碼技術(shù)使視頻數(shù)據(jù)獲得了極高的壓縮效率,但壓縮后的碼流 在傳輸過程中,尤其是無線信道上的傳輸中,仍然存在著一些棘手的問題,其中比較突出的是 一方面,這些壓縮后的碼流對信道比特誤碼非常敏感; 另一方面,無線信道由于多徑反射和衰落引入了大量的隨機誤碼和突發(fā)誤 碼,影響了碼流的正常傳輸。尤其是當采用了變長編碼(Variable Length Coding, VLC)技術(shù)后,碼流更加容易受到誤碼的影響,導(dǎo)致解碼時遇到下 一個同步碼字之前無法對VLC碼字進行正確的解碼,使數(shù)據(jù)在解碼端失去 與編碼端的同步;同時預(yù)測編碼技術(shù)會將錯誤擴散到整個視頻序列中,極大 地降低重建圖像的質(zhì)量。因此,為了實現(xiàn)良好質(zhì)量的視頻傳輸,必須結(jié)合實 際應(yīng)用信道的傳輸特性,采取一定的容錯措施。容錯算法主要可分為基于編碼器的容錯算法、基于解碼器的容錯算法和 基于反饋信道的容錯算法。其中(1 )基于編碼器的容錯算法,是指通過在編碼比特流中添加冗余信息。 這些冗余信息被添加在信源或信道編碼器中,降低編碼的效率,增加實現(xiàn)的 復(fù)雜度,以換取編碼的容錯性能,大致包括分層編碼、多描述編碼、獨立 分段編碼、再同步編碼和前向糾錯編碼(Forward Error Correction, FEC )等。(2)基于解碼器的容錯算法,是指利用被損壞的宏塊與其相鄰的宏塊 之間的相關(guān)性來完成恢復(fù)工作,包括錯誤檢測和錯誤恢復(fù)。對于錯誤檢測, 一般采用針對語法的檢錯和嵌入數(shù)據(jù)的檢錯;對于錯誤恢復(fù),可采用時域和臺aa^^-;旦瞎^古法
(3)基于反饋信道的容錯算法,是指利用解碼器獲得誤碼信息,并通 過反饋信道,傳送給編碼器進行誤碼處理的一種方式。主要包括誤碼跟蹤, 有條件的ARQ ( Automatic Repeat R叫uest,自動請求重傳),幀內(nèi)/幀間編 碼模式選擇和參考圖像選擇模式等。
具有人臉檢測功能的視頻采集產(chǎn)品已經(jīng)有很多實用產(chǎn)品,目前在IP (Internet Protocol,互聯(lián)網(wǎng)協(xié)議)信道和無線信道中經(jīng)常出現(xiàn)網(wǎng)絡(luò)擁塞和錯 誤丟包導(dǎo)致實時的視頻傳輸?shù)囊曈X效果較差的問題,為了實現(xiàn)可靠傳輸可通 過錯誤重傳的機制來實現(xiàn)的。這種機制雖然可以保證可靠的端到端通信,但 是在網(wǎng)絡(luò)負載嚴重的情況下會帶來更糟的結(jié)果,所以需要一種視頻壓縮容錯 方法,使圖像數(shù)據(jù)具有較強的容錯能力,使視頻數(shù)據(jù)在網(wǎng)絡(luò)負載嚴重的情況 下傳輸,也可以在解碼端得到使用者能夠接收的圖像效果。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種基于人臉檢測的視頻壓縮容錯方 法及編解碼方法,使視頻圖像數(shù)據(jù)在網(wǎng)絡(luò)負載嚴重的情況下傳輸也具有較強 的容錯能力。
為了解決上述技術(shù)問題,本發(fā)明提供了 一種基于人臉檢測的視頻壓縮容 4昔方法,包括
編碼端對視頻圖像數(shù)據(jù)進行編碼后得到圖像壓縮數(shù)據(jù)并向解碼端發(fā)送, 所述編碼端對視頻圖像進行人臉檢測,確定人臉區(qū)域和人臉區(qū)域位置信息, 將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余數(shù)據(jù)向 解碼端發(fā)送;
所述解碼端對收到的圖像壓縮數(shù)據(jù)進行解碼,正常解碼時,根據(jù)解碼后 的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯誤且冗余數(shù)據(jù)正確時,將收到的所述 冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù)據(jù) 與保存的背景圖像數(shù)據(jù)對應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
進一步地,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視頻圖像對應(yīng)的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮 數(shù)據(jù)出現(xiàn)解碼錯誤時,進一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯誤后,向編碼端發(fā)送 冗余數(shù)據(jù)重傳請求,編碼端收到所述冗余數(shù)據(jù)傳送請求后,將下一幀視頻圖 像對應(yīng)的冗余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
進一步地,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指編碼端對當前幀視頻圖 像進行編碼后得到的圖像壓縮數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的壓縮數(shù)據(jù)。
進一步地,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對當前 幀視頻圖像進行編碼時的量化步長確定人臉區(qū)域量化步長后,采用所述人臉 區(qū)域量化步長對人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進行編碼得到的人臉區(qū)域壓縮數(shù)
據(jù);
所述解碼端采用人臉區(qū)域量化步長對所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進行解碼。
進一步地,所述人臉區(qū)域量化步長是對視頻圖像數(shù)據(jù)編碼時采用的量化 步長與加權(quán)系數(shù)的乘積,所述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于l的實數(shù)。
進一步地,所述解碼端對收到的圖像壓縮數(shù)據(jù)解碼正確后,進一步判斷 是否收到冗余數(shù)據(jù),若收到,在解碼后的圖像數(shù)據(jù)中將冗余數(shù)據(jù)的人臉區(qū)域 位置信息表示的人臉區(qū)域位置之外的數(shù)據(jù)保存為背景圖像數(shù)據(jù);若沒收到, 則將解碼后的圖像數(shù)據(jù)作為背景圖像數(shù)據(jù)。
進一步地,所述解碼端在以下情況之一時認為冗余數(shù)據(jù)出現(xiàn)錯誤人臉 區(qū)域量化步長超出系統(tǒng)設(shè)定的范圍內(nèi);人臉區(qū)域位置信息中人臉區(qū)域的長度 大于原視頻圖象的長度或人臉區(qū)域的寬度大于原視頻圖象的寬度;在解碼過 程中解碼出的人臉區(qū)域圖像數(shù)據(jù)出現(xiàn)不符合編解碼方法的數(shù)據(jù);在解碼過程 中解碼出的人臉區(qū)域圖像數(shù)據(jù)大小與人臉區(qū)域位置信息對應(yīng)的數(shù)據(jù)大小不 一致。
為了解決上述技術(shù)問題,本發(fā)明還提供了一種基于人臉檢測的視頻編解 碼方法,包括以下步驟
編碼時,編碼端對視頻圖像數(shù)據(jù)進行編碼后得到圖像壓縮數(shù)據(jù)并向解碼端發(fā)送,所述編碼端對#見頻圖<象進行人臉才企測,確定人臉區(qū)域和人臉區(qū)域位 置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余
數(shù)據(jù)向解碼端發(fā)送;
解碼時,所述解碼端對收到的圖像壓縮數(shù)據(jù)進行解碼,正常解碼時,根 據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯誤且冗余數(shù)據(jù)正確時,將收 到的所述冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域 圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
進一步地,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視 頻圖像對應(yīng)的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮 數(shù)據(jù)出現(xiàn)解碼錯誤時,進一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯誤后,向編碼端發(fā)送 兀余數(shù)據(jù)重傳請求,編瑪端收到所迷冗余數(shù)揚傳送請水后,將下一幀^L頻圖 像對應(yīng)的冗余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
進一步地,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對當前 幀視頻圖像進行編碼時的量化步長確定人臉區(qū)域量化步長后,采用所述人臉 區(qū)域量化步長對人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進行編碼得到的人臉區(qū)域壓縮數(shù) 據(jù);所述人臉區(qū)域量化步長是對視頻圖像編碼時采用的量化步長與加權(quán)系數(shù) 的乘積,所述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實數(shù);
所述解碼端采用人臉區(qū)域量化步長對所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進行解碼。
采用本發(fā)明的方法,使圖像數(shù)據(jù)具有較強的容錯能力,視頻數(shù)據(jù)在網(wǎng)絡(luò) 負載嚴重的情況下傳輸,也可以在解碼端得到使用者能夠接收的圖像效果。
圖l是現(xiàn)有技術(shù)中視頻壓縮的流程示意圖; 圖2是本發(fā)明中視頻壓縮容錯方法的流程示意圖; 圖3是本發(fā)明中視頻壓縮編碼部分的流程圖; 圖4是本發(fā)明中視頻壓縮解碼部分的流程圖。
具體實施例方式
如圖1所示,視頻壓縮編碼的過程包括,對原視頻圖像依次進行預(yù)測、 變換、量化、編碼處理后,得到編碼后的碼流數(shù)據(jù)。其中量化環(huán)節(jié)對壓縮碼 流的大小起著重要作用,量化時變換輸出的變換系數(shù)需除以量化步長,量化 步長越大輸出的量化后的系數(shù)就越小,視頻圖像壓縮效率越高,壓縮后的碼 流越小。
本發(fā)明的核心思想是利用現(xiàn)有攝像裝置中已實現(xiàn)的人臉檢測功能,進 行量化步長調(diào)整確定人臉區(qū)域量化步長后,采用人臉區(qū)域量化步長對圖像中 人臉區(qū)域的數(shù)據(jù)進行壓縮后作為冗余信息和原圖像壓縮數(shù)據(jù)一同傳輸;解碼 時根據(jù)解碼的圖像構(gòu)建背景信息,在發(fā)生解碼錯誤時利用冗余信息和實時更 新的背景信息進行解碼錯誤恢復(fù)并顯示,使視頻壓縮數(shù)據(jù)能夠在惡劣的無線 環(huán)境下傳輸,并在接收端得到質(zhì)量較好的視頻。本發(fā)明的方法主要針對實時 視頻會話在IP信道和無線信道傳輸中的錯誤修正,這種情況下圖像中檢測 到的人臉具有更高的容錯要求。
如圖2所示,視頻壓縮容錯方法包括
步驟201,編碼端對視頻圖像數(shù)據(jù)進行編碼后得到圖像壓縮數(shù)據(jù)并向解 碼端發(fā)送,編碼端對視頻圖像進行人臉檢測,確定人臉區(qū)域和人臉區(qū)域位置 信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和人臉區(qū)域位置信息作為冗余數(shù)據(jù)向 解碼端發(fā)送;
步驟202,解碼端對收到的圖像壓縮數(shù)據(jù)進行解碼,正常解碼時,根據(jù) 解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯誤且冗余數(shù)據(jù)正確時,將收到 的冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù) 據(jù)與保存的背景圖像數(shù)據(jù)對應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
如圖3所示,對于每幀圖像數(shù)據(jù),基于人臉檢測的視頻壓縮容錯方法的 編碼方法包括以下步驟步驟301,編碼端對原始視頻圖像進行壓縮編碼,得到圖像編碼數(shù)據(jù);
步驟302,編碼端對原始視頻圖像進行人臉檢測,判斷是否檢測到人臉, 如果是,執(zhí)行下一步;否則,轉(zhuǎn)到步驟307;
步驟303 ,編碼端根據(jù)檢測到的人臉確定人臉區(qū)域和人臉區(qū)域位置信息;
編碼端將包含人臉的矩形區(qū)域或沿人臉邊緣包含人臉的不規(guī)則區(qū)域確 定為人臉區(qū)域,并用人臉區(qū)域位置信息表示此人臉區(qū)域的位置。例如,人臉 區(qū)域為矩形區(qū)域時,人臉區(qū)域位置信息為相應(yīng)矩形的四個頂點坐標或者兩個 對角頂點的坐標。
步驟304,編碼端根據(jù)量化步長確定人臉區(qū)域量化步長;
編碼端根據(jù)原始視頻圖像進行壓縮編碼時所用的量化步長Q進行調(diào)整 得到人臉區(qū)域量化步長Q,,調(diào)整時通常將原量化步長Q放大,例如將原量 化步長乘以一個加權(quán)系數(shù),上述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實數(shù);其中, 加權(quán)系數(shù)的值由系統(tǒng)設(shè)定或者根據(jù)圖像質(zhì)量通過算法得到。
步驟305,編碼端采用人臉區(qū)域量化步長對人臉區(qū)域的圖像數(shù)據(jù)進行編 碼,將得到的人臉區(qū)域編碼數(shù)據(jù)連同人臉區(qū)域量化步長Q,和人臉區(qū)域位置 信息構(gòu)成冗余數(shù)據(jù);
用人臉區(qū)域量化步長Q,作為量化參數(shù)對人臉區(qū)域數(shù)據(jù)進行壓縮,比用 量化步長Q作為量化參數(shù)對人臉區(qū)域凄t據(jù)進行壓縮得到的壓縮效率更高, 壓縮后的碼流數(shù)據(jù)更小,所以冗余數(shù)據(jù)遠小于圖像的壓縮數(shù)據(jù),在進行傳輸 時的可靠性較高。
步驟306,編碼端將圖像編碼數(shù)據(jù)和冗余數(shù)據(jù)作為一幀視頻壓縮數(shù)據(jù)發(fā) 送,流程結(jié)束。
步驟307,編碼端將圖像編碼數(shù)據(jù)作為一幀視頻壓縮數(shù)據(jù)發(fā)送;流程結(jié)束。
如圖4所示,對于每幀圖像數(shù)據(jù),基于人臉檢測的視頻壓縮容錯方法的 解碼方法包括以下步驟
步驟401, 解碼端對接收到的視頻壓縮數(shù)據(jù)進行解碼;步驟402,判斷是否出現(xiàn)圖像數(shù)據(jù)解碼錯誤,如果是,執(zhí)行步驟407, 否則,執(zhí)行步驟403;步驟403,判斷當前幀壓縮數(shù)據(jù)中是否包含冗余數(shù)據(jù),如果是,進行下 一步,否則,轉(zhuǎn)到步驟405;步驟404,解碼端根據(jù)冗余數(shù)據(jù)中包含的人臉區(qū)域量化步長,對人臉區(qū) 域數(shù)據(jù)進行解碼,并進行背景更新,轉(zhuǎn)到步驟406;解碼端根據(jù)冗余數(shù)據(jù)中的人臉區(qū)域量化步長,對冗余數(shù)據(jù)中的人臉區(qū)域 的壓縮數(shù)據(jù)進行解碼,得到人臉區(qū)域的圖像數(shù)據(jù)。將解碼后圖像中人臉區(qū)域位置信息表示的人臉區(qū)域位置之外的數(shù)據(jù)信 息對應(yīng)保存為背景信息,背景信息中人臉區(qū)域處對應(yīng)的數(shù)據(jù)設(shè)置為相同數(shù)值 的數(shù)據(jù)。解碼端在對圖像壓縮數(shù)據(jù)解碼的過程中對背景信息進行實時更新。 上述步驟中,解碼端還可以參考當前幀之前的多幀解碼圖像數(shù)據(jù)進行背景更 新,當人臉移動幅度較大時,可通過多幀的更新獲得完整的背景圖像信息; 若人臉移動幅度比較小,則背景中人臉區(qū)域中沒有圖像數(shù)據(jù),然而此部分更 容易在圖像恢復(fù)時被新的人臉遮擋,參考當前幀之前的多幀解碼圖像數(shù)據(jù)進 行背景更新的方法需要在解碼端保存多幀先前圖像數(shù)據(jù),且背景更新的運算 量較大。步驟405, 把此幀圖像數(shù)據(jù)做為背景數(shù)據(jù);步驟406, 顯示解碼后的圖像數(shù)據(jù),流程結(jié)束;步驟407,判斷冗余數(shù)據(jù)是否出現(xiàn)錯誤,如果是,執(zhí)行下一步;否則, 轉(zhuǎn)到步驟409;冗余數(shù)據(jù)包含三部分人臉區(qū)域量化步長Q,、人臉區(qū)域位置信息(人 臉區(qū)域通常是矩形)和人臉區(qū)域編碼數(shù)據(jù)。當出現(xiàn)以下情況之一時,認為冗 余數(shù)據(jù)出現(xiàn)錯誤(1)人臉區(qū)域量化步長不在系統(tǒng)設(shè)定的范圍內(nèi);(2 )人臉區(qū)域位置信息中人臉區(qū)域的長度大于原視頻圖象的長度或人 臉區(qū)域的寬度大于原視頻圖象的寬度;(3 )在解碼過程中解碼出的人臉區(qū)域圖像數(shù)據(jù)出現(xiàn)不符合編解碼方法ii的數(shù)據(jù);(4 )在解碼過程中解碼出的人臉區(qū)域圖像數(shù)據(jù)大小與人臉區(qū)域位置信 息對應(yīng)的數(shù)據(jù)大小不 一致。步驟408,向編碼端發(fā)送冗余數(shù)據(jù)重傳消息;流程結(jié)束;步驟409,解碼端對解碼圖像進行錯誤恢復(fù);解碼端將冗余數(shù)據(jù)中人臉區(qū)域數(shù)據(jù)進行解碼后得到人臉區(qū)域的圖像數(shù) 據(jù),并根據(jù)冗余數(shù)據(jù)中人臉區(qū)域位置信息將此人臉區(qū)域的圖像數(shù)據(jù)和已保存 的背景信息進行相應(yīng)疊加,做為錯誤恢復(fù)后的當前幀圖像數(shù)據(jù)。步驟410,顯示錯誤碼恢復(fù)后的圖像數(shù)據(jù);流程結(jié)束。在其它實施例中,解碼端檢測到圖像數(shù)據(jù)解碼錯誤時,向編碼端發(fā)送冗 余數(shù)據(jù)傳送請求,編碼端收到所述冗余數(shù)據(jù)傳送請求后,將冗余數(shù)據(jù)與下一 幀視頻壓縮數(shù)據(jù)一起發(fā)送,解碼端收到冗余數(shù)據(jù)后進行圖像恢復(fù),這樣可不 必如上述方法中在每幀數(shù)據(jù)傳輸中都要傳輸冗余數(shù)據(jù),減少數(shù)據(jù)傳輸量。上述方法還可以作為一種^L頻編解碼方法,與上述方法同理,此處不再贅述。本發(fā)明還可有其他多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情況 些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護范圍。
權(quán)利要求
1、一種基于人臉檢測的視頻壓縮容錯方法,其特征在于,包括編碼端對視頻圖像數(shù)據(jù)進行編碼后得到圖像壓縮數(shù)據(jù)并向解碼端發(fā)送,所述編碼端對視頻圖像進行人臉檢測,確定人臉區(qū)域和人臉區(qū)域位置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余數(shù)據(jù)向解碼端發(fā)送;所述解碼端對收到的圖像壓縮數(shù)據(jù)進行解碼,正常解碼時,根據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯誤且冗余數(shù)據(jù)正確時,將收到的所述冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
2、 如權(quán)利要求l所述的方法,其特征在于,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視頻圖像對應(yīng) 的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮數(shù)據(jù)出現(xiàn)解 碼錯誤時,進一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯誤后,向編碼端發(fā)送冗余數(shù)據(jù)重 傳請求,編碼端收到所述冗余數(shù)據(jù)傳送請求后,將下一幀視頻圖像對應(yīng)的冗 余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
3、 如權(quán)利要求2所述的方法,其特征在于,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指編碼端對當前幀視頻圖像進行編 碼后得到的圖像壓縮數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的壓縮數(shù)據(jù)。
4、 如權(quán)利要求2所述的方法,其特征在于,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對當前幀視頻圖 像進行編碼時的量化步長確定人臉區(qū)域量化步長后,采用所述人臉區(qū)域量化 步長對人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進行編碼得到的人臉區(qū)域壓縮數(shù)據(jù);所述解碼端采用人臉區(qū)域量化步長對所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進行解碼。
5、 如權(quán)利要求4所述的方法,其特征在于,所述人臉區(qū)域量化步長是對視頻圖像數(shù)據(jù)編碼時采用的量化步長與加 權(quán)系數(shù)的乘積,所述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實數(shù)。
6、 如權(quán)利要求3或4所述的方法,其特征在于,所述解碼端對收到的圖像壓縮數(shù)據(jù)解碼正確后,進一步判斷是否收到冗 余數(shù)據(jù),若收到,在解碼后的圖像數(shù)據(jù)中將冗余數(shù)據(jù)的人臉區(qū)域位置信息表 示的人臉區(qū)域位置之外的數(shù)據(jù)保存為背景圖像數(shù)據(jù);若沒收到,則將解碼后 的圖像數(shù)據(jù)作為背景圖像數(shù)據(jù)。
7、 如權(quán)利要求2所述的方法,其特征在于,所述解碼端在以下情況之一時認為冗余數(shù)據(jù)出現(xiàn)錯誤人臉區(qū)域量化步 長超出系統(tǒng)設(shè)定的范圍內(nèi);人臉區(qū)域位置信息中人臉區(qū)域的長度大于原視頻 圖象的長度或人臉區(qū)域的寬度大于原視頻圖象的寬度;在解碼過程中解碼出 的人臉區(qū)域圖像數(shù)據(jù)出現(xiàn)不符合編解碼方法的數(shù)據(jù);在解碼過程中解碼出的 人臉區(qū)域圖像數(shù)據(jù)大小與人臉區(qū)域位置信息對應(yīng)的數(shù)據(jù)大小不一致。
8、 一種基于人臉檢測的視頻編解碼方法,其特征在于,包括以下步驟編碼時,編碼端對視頻圖像數(shù)據(jù)進行編碼后得到圖像壓縮數(shù)據(jù)并向解碼 端發(fā)送,所述編碼端對視頻圖像進行人臉檢測,確定人臉區(qū)域和人臉區(qū)域位 置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余 數(shù)據(jù)向解碼端發(fā)送;解碼時,所述解碼端對收到的圖像壓縮數(shù)據(jù)進行解碼,正常解碼時,根 據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯誤且冗余數(shù)據(jù)正確時,將收 到的所述冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域 圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
9、 如權(quán)利要求8所述的視頻編解碼方法,其特征在于,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視頻圖像對應(yīng) 的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮數(shù)據(jù)出現(xiàn)解 碼錯誤時,進一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯誤后,向編碼端發(fā)送冗余數(shù)據(jù)重 傳請求,編碼端收到所述冗余數(shù)據(jù)傳送請求后,將下一幀視頻圖像對應(yīng)的冗余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
10、如權(quán)利要求9所述的^L頻編解碼方法,其特征在于,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對當前幀視頻圖 像進行編碼時的量化步長確定人臉區(qū)域量化步長后,采用所述人臉區(qū)域量化 步長對人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進行編碼得到的人臉區(qū)域壓縮數(shù)據(jù);所述人 臉區(qū)域量化步長是對視頻圖像編碼時采用的量化步長與加權(quán)系數(shù)的乘積,所 述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實數(shù);所述解碼端采用人臉區(qū)域量化步長對所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進行解碼。
全文摘要
本發(fā)明公開了一種基于人臉檢測的視頻壓縮容錯方法及編解碼方法編碼端對視頻圖像數(shù)據(jù)進行編碼后得到圖像壓縮數(shù)據(jù)向解碼端發(fā)送,編碼端對視頻圖像進行人臉檢測,確定人臉區(qū)域和人臉區(qū)域位置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和人臉區(qū)域位置信息作為冗余數(shù)據(jù)向解碼端發(fā)送;解碼端對收到的圖像壓縮數(shù)據(jù)進行解碼,正常解碼時,根據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯誤且冗余數(shù)據(jù)正確時,將收到的冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。本方法使圖像數(shù)據(jù)具有較強的容錯能力,在網(wǎng)絡(luò)負載嚴重時也可以在解碼端得到使用者能夠接收的圖像效果。
文檔編號H04N7/66GK101257635SQ20081010251
公開日2008年9月3日 申請日期2008年3月21日 優(yōu)先權(quán)日2008年3月21日
發(fā)明者飛 高 申請人:北京中星微電子有限公司