專利名稱:一種圖像編碼方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計算機圖像處理領(lǐng)域,提出了一種圖像編碼方法。
背景技術(shù):
數(shù)字圖像處理過程中經(jīng)常要產(chǎn)生包含圖像數(shù)據(jù)的大型文件,而這些文件經(jīng)常需要在用戶和系統(tǒng)之間相互交換,這就要有一種有效的方法來存儲和傳遞這些數(shù)字圖像文件。因此,圖像編解碼的主要目的是在保證圖像質(zhì)量的同時,盡可能的減少圖像占用的空間,從而方便存儲或網(wǎng)絡(luò)傳輸。具體來說,圖像壓縮(編碼)可以分為無損壓縮和有損壓縮。無損壓縮一般采用基于統(tǒng)計的方法,如哈夫曼編碼等,它可以完整的重構(gòu)原始圖像,但是壓縮率較低,往往不能達到人們的要求。有損壓縮不能完整的重構(gòu)原始圖像,但它可以提供很高的壓縮比率,而且能很好的保證圖像的主觀質(zhì)量。它主要是利用了人的心理視覺冗余特性。研究表明,人眼感覺到的區(qū)域亮度不僅僅取決于該區(qū)域的反射光,還取決于其他一些因素。例如,在亮度不變的區(qū)域中同樣可以感覺到亮度的變化(馬赫帶)。產(chǎn)生這種現(xiàn)象的原因是出于眼睛所有視覺信息感受到的靈敏度不同。在正常的視覺處理過程中各種信息的相對重要程度不同。那些不十分重要的信息稱作心理視覺冗余。這些心理視覺冗余在不會削弱圖像感知質(zhì)量的情況下可以消除。變換編碼是一種比較常見的有損編碼方式,其中最重要也應(yīng)用最廣的是小波變換。所述的小波變換不直接在圖像的空間域?qū)D像進行處理,而是首先將該圖像變換到頻率域,利用高頻系數(shù)和原始圖像細節(jié)信息的對應(yīng)關(guān)系,可以對不太重要的系數(shù)進行量化,這也是實現(xiàn)高壓縮比的基本原理。有損壓縮方法都會導(dǎo)致一定數(shù)量的視覺信息的丟失,可能會因此失去重要的信息,所以迫切需要一種可重復(fù)或可再生的對于丟失信息的性質(zhì)和范圍定量的方法。作為這種評估基礎(chǔ)的兩類準則分別是客觀準則和主觀準則,客觀準則用恢復(fù)圖像與原始圖像的均方根誤差來表示,而主觀準則則是靠人主觀判定恢復(fù)圖像與原始圖像的差別大小。傳統(tǒng)的有損壓縮方法沒有考慮圖像內(nèi)容,如JPEG2000是一種通用的壓縮方法,對圖像的內(nèi)容不進行分析,在實現(xiàn)高壓縮比的情況下可能會丟失重要的視覺信息。在壓縮率較高的情況下,圖像的內(nèi)容失真會很嚴重,這樣用戶就無法分辨圖像的內(nèi)容究竟是什么,這也是傳統(tǒng)通用壓縮方法都有的一個缺點。但如果把一部分相對不重要的背景系數(shù)所占的空間用來更好的記錄感興趣區(qū)域的系數(shù),用戶在整體壓縮率很高的情況下依然能分辨出圖像中最重要的區(qū)域,這也是本發(fā)明的出發(fā)點。
發(fā)明內(nèi)容
本發(fā)明針對傳統(tǒng)SPIHT方法沒有考慮圖像內(nèi)容的局限性,對其進行了改進,提出了一種支持感興趣區(qū)域編碼的圖像編碼方法。本發(fā)明的圖像編碼方法,具體包括以下步驟步驟I :標定圖片中的感興趣區(qū)域,可以人工標記,也可以通過一些自動檢測方法,如人臉識別Adaboost算法。步驟2 :對原圖像進行小波變換,得到小波系數(shù)矩陣。步驟3 :計算感興趣區(qū)域掩碼,即找到感興趣區(qū)域像素在變換后對應(yīng)的小波系數(shù)。步驟4:對背景區(qū)域和感興趣區(qū)域采用不同的量化標準進行量化,具體是通過對背景區(qū)域的系數(shù)進行右移位操作實現(xiàn),使的感興趣區(qū)域的系數(shù)處于更高的位平面上。步驟5 :采用閾值法對小波系數(shù)矩陣進行量化。步驟6 :對量化后的小波系數(shù)矩陣用改進的SPIHT方法進行編碼。本發(fā)明的優(yōu)點和積極效果在于(I)在本發(fā)明方法中加入了圖像內(nèi)容分析的步驟,具體是計算感興趣區(qū)域掩碼、設(shè)置不同的量化機制,使得對用戶感興趣的區(qū)域和背景區(qū)域達到不一樣的壓縮效果,既保證了高壓縮率,又可以保證用戶感興趣區(qū)域的顯示質(zhì)量。(2)本發(fā)明方法中最終產(chǎn)生的編碼位流自動按重要性進行排列,從區(qū)域性的角度看,感興趣區(qū)域的碼流在前面,背景區(qū)域的碼流相對靠后。從整體位流來看,由于本發(fā)明方法是按照位平面進行編碼,前面的碼流代表較高的系數(shù)平面,后面的代表相對較低的系數(shù)平面,這樣,碼流按照系數(shù)的重要程度進行排序。此外,由于本發(fā)明方法從SPIHT繼承來的漸進傳輸型,用戶可以在任意點截斷編碼位流,在速率比較低的無線網(wǎng)傳輸或瀏覽圖片時,這種方法會有很大的優(yōu)勢,因為最先解碼的是圖像中最重要的信息,這樣用戶可以很快得知整幅圖像的內(nèi)容,以決定是否需要繼續(xù)圖片的傳輸過程。(3)可以靈活控制感興趣區(qū)域和背景區(qū)域的質(zhì)量比,使顯示質(zhì)量和壓縮比都能達到一種比較好的平衡,滿足各種用戶的需求。
圖I為本發(fā)明的圖像編碼方法的整體步驟流程圖;圖2為本發(fā)明步驟六的流程圖; 圖3為SPIHT方法中的空間樹結(jié)構(gòu);圖4為示例圖片一及其采用Adaboost方法進行自動人臉識別檢測的結(jié)果;圖5為示例圖片二及其采用Adaboost方法進行自動人臉識別檢測的結(jié)果;圖6為示例圖片三及其采用Adaboost方法進行自動人臉識別檢測的結(jié)果;圖7為示例圖片四及其采用Adaboost方法進行自動人臉識別檢測的結(jié)果;圖8為示例圖片一在壓縮率分別為0. 4bpp和0. 6bpp下的SPIHT和MSP重構(gòu)結(jié)果;圖9為示例圖片二在壓縮率分別為0. 4bpp和0. 6bpp下的SPIHT和MSP重構(gòu)結(jié)果;圖10為示例圖片三在壓縮率分別為0. 4bpp和0. 6bpp下的SPIHT和MSP重構(gòu)結(jié)果;圖11為示例圖片四在壓縮率分別為0. 4bpp和0. 6bpp下的SPIHT和MSP重構(gòu)結(jié)果;圖12為示例圖片一在不同壓縮比下本發(fā)明方法與傳統(tǒng)SPIHT的PSNR值對比圖;圖13為示例圖片二在不同壓縮比下本發(fā)明方法與傳統(tǒng)SPIHT的PSNR值對比圖14為示例圖片三在不同壓縮比下本發(fā)明方法與傳統(tǒng)SPIHT的PSNR值對比圖;圖15為示例圖片四在不同壓縮比下本發(fā)明方法與傳統(tǒng)SPIHT的PSNR值對比圖; 圖16為像素坐標(r,c)存在的9種狀態(tài)的示意圖。
具體實施例方式下面將結(jié)合附圖和實例對本發(fā)明作進一步的詳細說明。本發(fā)明提出的圖像編碼方法考慮了圖像內(nèi)容,并具有高壓縮比,較好地顯示質(zhì)量以及漸進傳輸特性,這使得本發(fā)明方法能夠適用于多種場合,尤其是隨著智能手機的普及和移動互聯(lián)網(wǎng)的不斷發(fā)展,越來越多的家庭照片在不同的人之間分享和傳遞,而由于無線網(wǎng)絡(luò)速度的限制,又必須要求圖像具有高壓縮比,但這樣可能會影響圖片的顯示質(zhì)量,給用戶造成不好影響。如果采用本發(fā)明的方法,在保證高壓縮比的同時,也能兼顧用戶感興趣區(qū)域的顯示質(zhì)量,可以比較好地解決這個問題。本發(fā)明中的圖像編碼方法基于小波變換,對變換后的系數(shù)進行編碼,并在其中加入了人臉識別的技術(shù)手段,達到用戶感興趣區(qū)域和背景區(qū)域區(qū)別對待的效果,如圖I所示,本發(fā)明圖像編碼方法具體實現(xiàn)步驟如下步驟I :標定圖片中的感興趣區(qū)域,可以人工標記,也可以通過一些自動檢測方法,如以人臉區(qū)域作為感興趣區(qū)域的圖片可以用成熟的人臉識別方法進行自動檢測,省去了人工標記的低效率操作。本發(fā)明實施例中采用現(xiàn)有技術(shù)中的Adaboost方法進行自動人臉識別,輸入一張包含人臉的圖片,輸出人臉區(qū)域坐標,如圖4-圖7所示,為采用Adaboost方法進行自動人臉識別檢測的結(jié)果,實驗表明,采用的Adaboost方法識別率非常高,并且識別速度很快。步驟2:對原圖像進行小波變換,得到小波系數(shù)矩陣。小波變換是繼傅立葉(Fourier)變換后又一有效的視頻分析方法,與Fourier變換相比,小波變換是一個時間和頻域的局域變換,因而能有效地從信號中提取信息,通過伸縮和平移等運算功能對函數(shù)或信號進行多尺度細化分析(Multiscale Analysis),解決了 Fourier變換不能解決的許多困難問題(參考文獻Ingrid Daubechies, Ten Lectures on Wavelets, Society forindustrial and Applied Mathematics, 1992, ISBN 0-89871-274-2)。對圖像進行小波變換,可以將圖像的高頻系數(shù)信息和低頻系數(shù)信息分離開來,由于低頻系數(shù)代表圖像中的大部分內(nèi)容信息,相對比較重要,而高頻系數(shù)代表的是一些細節(jié)信息,相對不太重要,這樣就可以用很少的碼流來記錄高頻系數(shù)信息,從而實現(xiàn)圖像的壓縮。步驟3 :確定感興趣區(qū)域掩碼,即找到感興趣區(qū)域像素在變換后對應(yīng)的小波系數(shù)。原則上,感興趣區(qū)域可以是任意形狀,根據(jù)原圖像中的感興趣區(qū)域輪廓,每一層小波變換后都能對應(yīng)計算出原始感興趣區(qū)域輪廓在經(jīng)過小波變換得到的子圖中對應(yīng)的區(qū)域輪廓。但對于不規(guī)則的區(qū)域,需要記錄感興趣區(qū)域的完整輪廓信息,影響整體的壓縮效率。所以,本發(fā)明采用規(guī)則的矩形區(qū)域作為感興趣區(qū)域,如果感興趣區(qū)域形狀不是標準矩形,則將該區(qū)域擴大,選取包含該區(qū)域的一個外接矩形作為感興趣區(qū)域。如圖4-圖7所示,實驗部分以人臉作為感興趣區(qū)域,雖然人臉的形狀是不規(guī)則的,但可以選取一個矩形區(qū)域,使人臉區(qū)域包含在其中。
小波變換將圖像分為四個頻帶的子圖,分別包括低頻信息、水平細節(jié)信息、垂直細節(jié)信息和對角線細節(jié)信息,雖然每一個子圖都包含原圖不同頻域的信息,但從空間域看來,每一個子圖都是原圖的一個縮略圖,這也為感興趣區(qū)域掩碼的計算提供了可能性。如圖3所示,一幅圖像經(jīng)過n級小波分解后形成了 3n+l個子帶,小波系數(shù)的分布特點是越往低頻子帶系數(shù)值越大,包含的圖像信息越多,而越往高頻子帶系數(shù)值越小,包含的信息也越少。用LL (n)代表n層小波分解的低頻子圖,HL (I),HL (2),... HL (n)代表水平方向子圖,LH(I),LH (2), LH (n)代表垂直方向子圖,HH(I),HH (2), HH (n)代表對角方向子圖。為了計算感興趣區(qū)域掩碼,需要找到感興趣區(qū)域在各層子圖中對應(yīng)的區(qū)域,本發(fā)明實施例以矩形區(qū)域為例說明感興趣區(qū)域掩碼的確定,也可以將其擴展為圓形,橢圓,多邊形等規(guī)則形狀,根據(jù)圖形結(jié)構(gòu)對應(yīng)計算其對應(yīng)坐標即可。為記錄矩形感興趣區(qū)域,需要首先確定其在原圖中的左上角點坐標(x,y)以及寬width和高height,只需記錄4個值,相對于圖像的大小可以忽略不計,因此不會影響到圖 像的壓縮率。圖像經(jīng)過小波分解后,被分成很多不同分辨率的子圖像,利用矩形的性質(zhì)可以計算出感興趣區(qū)域?qū)?yīng)的小波系數(shù)區(qū)域,下面分別討論在各級子圖中確立感興趣區(qū)域的計算公式。在n層小波分解的低頻子圖LL (n)中,子圖相當于原始圖像n次抽樣后的結(jié)果,其對應(yīng)感興趣區(qū)域的左上角點坐標及寬和高分別記為nLLx,nLLy,nLLWidth,nLLHeight,其他區(qū)域類似,由小波變換次數(shù)n可得
權(quán)利要求
1.一種圖像編碼方法,其特征在于,具體包括如下步驟 步驟一、標定圖片中的感興趣區(qū)域; 步驟二、對原圖像進行小波變換,得到小波系數(shù)矩陣; 步驟三、找到感興趣區(qū)域像素在變換后對應(yīng)的小波系數(shù); 步驟四、對背景區(qū)域的系數(shù)進行右移位操作,并對背景區(qū)域和感興趣區(qū)域采用不同的量化標準進行量化,使感興趣區(qū)域的系數(shù)處于更高的位平面上; 步驟五、采樣閾值法對小波系數(shù)矩陣進行量化; 步驟六、對量化后的小波系數(shù)矩陣進行基于SPIHT方法的編碼。
2.根據(jù)權(quán)利要求I所述的一種圖像編解碼方法,其特征在于,所述的步驟一具體通過人工標定圖片中感興趣區(qū)域,或者采用Adaboost算法進行自動人臉識別標定圖片中感興趣區(qū)域。
3.根據(jù)權(quán)利要求2所述的一種圖像編碼方法,其特征在于,所述感興趣區(qū)域為規(guī)則的圖形區(qū)域,如果標定的感興趣區(qū)域的形狀不是規(guī)則的圖形區(qū)域,則將該標定的區(qū)域擴大,選取包含該標定的區(qū)域的一個外接規(guī)則圖形區(qū)域作為感興趣區(qū)域。
4.根據(jù)權(quán)利要求2所述的一種圖像編碼方法,其特征在于,所述感興趣區(qū)域為矩形區(qū)域。
5.根據(jù)權(quán)利要求I所述的一種圖像編碼方法,其特征在于,所述的步驟三具體是 (1)首先確定感興趣區(qū)域在原圖中的左上角點坐標(X,y)以及寬width和高height ;所述感興趣區(qū)域為矩形區(qū)域; (2)然后確定在n層小波分解的低頻子圖LL(n)中對應(yīng)感興趣區(qū)域的左上角點坐標(nLLx, nLLy)、寬 nLLWidth 和高 nLLHeight T T _ xy T T TTT. ,, width T T TT . , height nLLx— — ,nLLy— — ; nLLWidth= ~ ,nLLHeight= ~~ ; n層小波分解的水平方向子圖HL(n)相對于LL(n)向右平移了 nLLWidth個像素,則在HL (n)中對應(yīng)感興趣區(qū)域的左上角點坐標(nHLx, nHLy)、寬nHLWidth和高nHLHeight為 nHLx= — +nLLWidth nHLy= — ; nHLWidth= “她 nHLHeight=匕郵扮 2n 2n 2n 2n n層小波分解的垂直方向子圖LH(n)相對于LL (n)向下平移了 nLLHeight個像素,則在LH(n)中對應(yīng)感興趣區(qū)域的左上角點坐標(nLHx, nLHy)、寬nLHWidth和高nLHHeight為 nLHx=爹,nLHy= +nLLHeight ; nLHWidth= w^1 ^nLHHeight= n層小波分解的對角方向子圖HH(n)相對于LL(n)向右平移了 nLLWidth個像素,向下平移了 nLLHeight個像素,則得到HH(n)子圖中對應(yīng)感興趣區(qū)域的左上角點坐標(nHHx,nHHy)、寬 nHHWidth 和高 nHHHeight 為 nHHx=爹 +nLLWidth,nHHy= +nLLHeight ; nHHWidth= ,nHHHeight= 在得到感興趣區(qū)域在變換后的小波系數(shù)子區(qū)域中對應(yīng)的系數(shù)區(qū)域后,進一步可求得圖像整體的感興趣區(qū)域掩碼。
6.根據(jù)權(quán)利要求I所述的一種圖像編碼方法,其特征在于,所述的步驟四中,對背景區(qū)域的系數(shù)進行右移兩位處理。
7.根據(jù)權(quán)利要求I所述的一種圖像編碼方法,其特征在于,步驟五中所述的閾值法中,閾值設(shè)置為20。
8.根據(jù)權(quán)利要求I所述的一種圖像編碼方法,其特征在于,所述的步驟六具體包括如下步驟 步驟6. I :初始化首先初始化重要系數(shù)表LSP為空,將集合H中的所有元素添加到不重要系數(shù)表LIP中,并將屬于H集合且有后代的元素添加到不重要子集表LIS中、且所添加的元素均為D類型,然后確定初始閾值2n,n根據(jù)下式確定n=[log2(maxrc{|crc|})_ 其中,r,c分別表示小波系數(shù)矩陣中的行號和列號,(^。代表小波系數(shù)矩陣中坐標位置為(r,c)的小波系數(shù)值,cr, J代表對(^。求絕對值;所述H集合是n層小波分解的低頻子圖LL(n)、水平方向子圖HL(n)、垂直方向子圖LH(n)和對角方向子圖HH(n)中所有系數(shù)的坐標構(gòu)成的集合,表LSP、表LIP和表LIS的每個表項都使用坐標(r,c)來表示,所述的D類型是指表項(r,c)的所有子孫的集合D (r,c); 步驟6. 2:排序掃描,具體是 步驟6. 2. I :掃描表LIP,對表LIP中的每個表項(r,0),得到一個511(1',c)的輸出SnOut (r, c),如果SnOut (r, c) = I,則向排序位流Sn輸出I和小波系數(shù)矩陣中位置坐標為Cr, c)的系數(shù)的符號位,0表示正,I表示負;如果Sn0ut(r, c) = 0,則向排序位流Sn輸出·0 ;所述的Sn (r,c)根據(jù)函數(shù)Sn (X)的定義確定輸出值,X代表節(jié)點元素的集合,函數(shù)Sn (X)定義如下若Max{|Cr,c|} >= 2n,則函數(shù)Sn⑴的輸出SnOut(X) = I,否則,SnOut (X)=·0 ; 步驟6. 2. 2 :掃描表LIS,判斷表LIS中的每個表項(r,c)是D型表項還是L型表項,所述的L型表項是指表項(r,c)的所有非直系子孫的集合L (r,c),設(shè)表項(r,c)的直接后代集合為 0 (r, c),則 0 (r, c) = {(2*r_l, 2*c_l), (2*r, 2*c_l), (2*r_l, 2*c), (2*r, 2*c)},L(r, c) = D(r, c)-0(r, c),; A、若表項(r,c)是D型表項,輸出SnOut(D (r, c)),根據(jù)SnOut (D (r, c))的值進行如下操作 a、如果SnOut(D(r, c)) = I,則向排序位流Sn輸出1,并對(r,c)的每個孩子(r0, c0),根據(jù)SnOut (r0, c0)的值來進行如下操作如果SnOut (r0, c0) = I,則向排序位流Sn輸出I和小波系數(shù)矩陣坐標為(r0,c0)的系數(shù)的符號位,并將(r0,c0)添加到表LSP的隊尾,如果SnOutCrO, c0) = 0,則向排序位流Sn輸出0,將(r0, c0)添加到表LIP的隊尾; 然后判斷L (r,c)是否為空集,如L (r,c)為非空集,則將(r,c)作為L型表項添加到表LIS的尾部,如果L (r,c)為空集,則將D型表項(r,c)從表LIS中刪除; b、如果SnOut(D (r, c)) = 0,則向排序位流Sn輸出0 ; B、若表項(r,c)是L型表項,輸出SnOut (L(r, c)):如果SnOut (L(r, c)) = I,則向排序位流Sn輸出1,然后將(r,c)的4個孩子(r0,c0)作為D型表項依次添加到表LIS的隊尾,并將L型表項(r,c)從表LIS中刪除;如果SnOut (L(r,c)) = 0,則向排序位流Sn輸出·0 ; 步驟6. 3 :精細掃描,具體是將上一級掃描后的表LSP記為LSP_01d,對于LSP_01d中的每一個元素(r,c),將系數(shù)Cr,c的絕對值轉(zhuǎn)換為二進制表示Br,C,輸出Br,c中對應(yīng)于2n權(quán)位處的符號I或O到精細位流Rn ; 步驟6. 4更新閾值系數(shù)將閾值指數(shù)n減去1,判斷得到的閾值指數(shù)n是否等于要求的精度值,若是,結(jié)束本方法,若否,返回步驟6. 2繼續(xù)下一級編碼掃描。
9.根據(jù)權(quán)利要求8所述的一種圖像編碼方法,其特征在于,步驟6. I中所述的表LSP、表LIP和表LIS采用順序二維表結(jié)構(gòu)進行存儲,表的大小與存儲原圖像的數(shù)據(jù)大小相同。
全文摘要
本發(fā)明提出一種圖像編碼方法,應(yīng)用于計算機圖像處理領(lǐng)域。該方法首先通過標定圖片中的感興趣區(qū)域,對原圖像進行小波變換,在小波系數(shù)矩陣中找到感興趣區(qū)域像素在變換后對應(yīng)的小波系數(shù),然后對背景區(qū)域和感興趣區(qū)域采用不同的量化標準進行量化,使感興趣區(qū)域的系數(shù)處于更高的位平面上,最近對小波系數(shù)矩陣進行閾值量化,采用基于SPIHT方法進行編碼。本發(fā)明方法既保證了高壓縮率,又可以保證用戶感興趣區(qū)域的顯示質(zhì)量,在速率比較低的無線網(wǎng)傳輸或瀏覽圖片時,能夠是用戶很快得知圖像中最重要的信息。
文檔編號G06T9/00GK102637302SQ20111032634
公開日2012年8月15日 申請日期2011年10月24日 優(yōu)先權(quán)日2011年10月24日
發(fā)明者周成玉, 牛建偉, 童超 申請人:北京航空航天大學(xué)