一種復合圖像的壓縮方法及裝置制造方法
【專利摘要】本發(fā)明適用于圖像處理【技術領域】,提供了一種復合圖像的壓縮方法及裝置,所述方法包括:S1、根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域;S2、分別采用對應的編碼方式對所述若干個分割區(qū)域進行壓縮。本發(fā)明,根據(jù)復合圖像包括的不同特性的信息,將復合圖像分割為進行分割文本/圖形分割區(qū)域和自然圖像分割區(qū)域,以便于對不同分割區(qū)域采用對應的壓縮方法,保證了較高的壓縮比,同時也使文本/圖形區(qū)域重建后的清晰可讀。
【專利說明】一種復合圖像的壓縮方法及裝置
【技術領域】
[0001]本發(fā)明屬于圖像處理【技術領域】,尤其涉及一種復合圖像的壓縮方法及裝置。
【背景技術】
[0002]隨著計算機網(wǎng)絡的迅速發(fā)展,人們越來越關注實時的桌面圖像傳輸技術,目前,圖像傳輸技術廣泛應用于遠程教學、遠程辦公、網(wǎng)絡多媒體會議和產(chǎn)品演示等領域。同時,基于網(wǎng)絡的語音、文本和視頻已經(jīng)不能滿足人們的需求,人們開始用網(wǎng)絡去實現(xiàn)遠程控制與監(jiān)視等,利用這種圖像傳輸技術,不但可以在當前的數(shù)字設備上與遠程的其它計算機進行交互,而且還可以操控遠程的計算機來解決當前資源無法解決的問題。
[0003]由于這種多屏互動的實現(xiàn)需要進行大量包含了文本、圖形和自然圖像的復合圖像的傳輸,傳輸數(shù)據(jù)量很龐大,利用網(wǎng)絡傳輸會引起堵塞或延時,因此進行多屏互動共享之前必須進行壓縮。然而,對于復合圖像不做任何處理直接進行壓縮時,如果采用游程編碼、赫夫曼Huffman編碼和字典壓縮編碼等無損壓縮編碼方法,其自然圖像區(qū)域壓縮效率會非常有限;若采用聯(lián)合圖像專家小組(Joint Photographic Experts Group,JPEG)系列、動態(tài)圖像專家組(Moving Pictures Experts Group/Mot in Pictures Experts Group、MPEG)等傳統(tǒng)的有損壓縮編碼方法,又會在復合圖像中的文本和圖形區(qū)域引起文本模糊和振鈴效應。因此,現(xiàn)有圖像處理技術對復合圖像的自然圖像區(qū)域壓縮效率非常有限,或者是根據(jù)壓縮圖像重建圖像的文本和圖形區(qū)域存在文本模糊和振鈴效應。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實施例提供了一種復合圖像的壓縮方法及裝置,旨在解決現(xiàn)有技術中圖像壓縮效率不高的技術問題。
[0005]一方面,提供一種復合圖像的壓縮方法,所述方法包括:
[0006]S1、根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域;
[0007]S2、分別采用對應的編碼方式對所述若干個分割區(qū)域進行壓縮。
[0008]另一方面,提供一種復合圖像的壓縮裝置,所述裝置包括:
[0009]圖像分割單元,用于根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域;
[0010]壓縮單元,用于分別采用對應的編碼方式對所述若干個分割區(qū)域進行壓縮。
[0011]在本發(fā)明實施例,根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域;分別采用對應的編碼方式對所述若干個分割區(qū)域進行壓縮,本發(fā)明,根據(jù)復合圖像包括的不同特性的信息,將復合圖像分割為進行分割文本/圖形分割區(qū)域和自然圖像分割區(qū)域,以便于對不同分割區(qū)域采用對應的壓縮方法,保證了較高的壓縮比,同時也使文本/圖形區(qū)域重建后的清晰可讀?!緦@綀D】
【附圖說明】
[0012]圖1是本發(fā)明實施例一提供的復合圖像的壓縮方法的實現(xiàn)流程圖;
[0013]圖2a是本發(fā)明實施例一提供的文本/圖形塊的梯度直方圖統(tǒng)計圖;
[0014]圖2b是本發(fā)明實施例一提供的圖像塊的梯度直方圖統(tǒng)計圖;
[0015]圖2c是本發(fā)明實施例一提供的混合塊的梯度直方圖統(tǒng)計圖;
[0016]圖3a是本發(fā)明實施例一提供的網(wǎng)頁web I的一部分和它的文本/圖形塊;
[0017]圖3b是本發(fā)明實施例一提供的壁紙的一部分和它的圖像塊;
[0018]圖4a是本發(fā)明實施例一提供的平滑塊的灰度直方圖特征示意圖;
[0019]圖4b是本發(fā)明實施例一提供的文本塊的灰度直方圖特征示意圖;
[0020]圖4c是本發(fā)明實施例一提供的圖形塊的灰度直方圖特征示意圖;
[0021]圖4d是本發(fā)明實施例一提供的圖形塊的灰度直方圖特征示意圖;
[0022]圖5a是本發(fā)明實施例一提供的壁紙示意圖;
[0023]圖5b是本發(fā)明實施例一提供的壁紙中的文本/圖形塊圖;
[0024]圖5c是本發(fā)明實施例一提供的壁紙中的自然圖像區(qū)域圖;
[0025]圖5d是本發(fā)明實施例一提供的重建之后壁紙示意圖;
[0026]圖6是本發(fā)明實施例二提供的復合圖像的壓縮裝置的結構框圖。
【具體實施方式】
[0027]為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0028]在本發(fā)明實施例中,根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域;分別采用對應的編碼方式對所述若干個分割區(qū)域進行壓縮。
[0029]以下結合具體實施例對本發(fā)明的實現(xiàn)進行詳細描述:
[0030]實施例一
[0031]圖1示出了本發(fā)明實施例一提供的復合圖像的壓縮方法的實現(xiàn)流程,詳述如下:
[0032]在步驟SI中,根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域。
[0033]在本實施例中,所述圖像特征包括顏色和灰度。所述復合圖像是包括了文本、圖形和自然圖像信息的一類混合圖像,如桌面圖像、web頁面。所述子塊是包括若干個像素點的復合圖像的子塊。具體地,所述復合圖像分為16*16個子塊。一張連續(xù)色調(diào)的圖像在其一小塊區(qū)域內(nèi)有大量的顏色數(shù)量,然而在文本/圖形在一大塊區(qū)域內(nèi)只有少量的顏色數(shù)量,所以,可以根據(jù)子塊內(nèi)的顏色種類的不同和各像素的梯度值的不同特點分為三類:文本/圖形塊、圖像塊和混合塊。
[0034]具體的,所述步驟SI具體包括:
[0035]步驟S11、將所述復合圖像分成若干個子塊,
[0036]具體地,用預設模板將所述復合圖像分成若干個子塊,其中所述預設模板可根據(jù)需要而設,本實施例中,作為優(yōu)選,所述預設模板為16*16的區(qū)域塊,即將所述復合圖像分成若干個所述預設模板。將采集到的復合圖像分為若干個子塊,有利于精確地區(qū)分出復合圖像的文本/圖形區(qū)域和圖像區(qū)域,為壓縮編碼提供有效的信息,同時,基于“塊”的圖像分類編碼比基于“對象”的分類編碼和基于“層”的分類編碼更加簡單。
[0037]步驟S12,根據(jù)顏色特征對分塊后的復合圖像進行劃分,得到文本/圖像塊及第一混合塊。
[0038]其中所述第一混合塊包括至少兩個以上所述子塊,所述文本/圖形塊包括至少一個所述子塊。本步驟是對子塊根據(jù)顏色進行的粗略分類時。
[0039]本實施例中,具體地,所述步驟S12具體包括:
[0040]步驟S121、分析計算所述若干個子塊中的每一個子塊對應的像素的顏色種類數(shù)量;
[0041]步驟S122、將顏色種類數(shù)量小于或等于第一閾值的子塊歸類為文本/圖形塊,將大于第一閾值的子塊歸類為第一混合塊。
[0042]具體地,所述第一閾值可根據(jù)實際情況而設,本實施例中,優(yōu)選地,所述第一閾值為32。顏色種類數(shù)量N小于或等于32,則劃分為文本/圖形塊,顏色種類數(shù)量N大于32,則為第一混合塊,對于顏色種類數(shù)量N大于32的第一混合塊進行步驟12。圖3a示出了第一閾值為32時,web頁面的一部分和它的文本/圖形塊,圖3b示出了第一閾值為32時,桌面的一部分和它的圖像塊。
[0043]步驟S13,基于像素梯度將所述第一混合塊進行分類,得到圖像塊及第二混合塊。
[0044]具體地,所述第一混合塊包括至少兩個以上所述子塊,根據(jù)像素梯度的不同,可將第一混合塊劃分為圖像塊、文本/圖像塊及第二混合塊。由于文本/圖形像素的色彩簡單,紋理變化劇烈,而圖像像素的色彩豐富,紋理變化較平緩,因此可根據(jù)顏色特征先將顏色減淡及紋理變化劇烈的文本/圖像塊區(qū)分出來,如圖2a所示,文本/圖形塊的顏色種類較少,像素梯度值較大,如圖2b所示,圖像塊的顏色種類豐富,像素梯度值較小,而混合塊包含了文本/圖形塊和圖像塊,如圖2c所示,其顏色種類豐富,且部分梯度值較大。因此,根據(jù)所述像素梯度可以將所述第一混合塊分塊為圖像塊及第二混合塊。
[0045]其中,所述步驟S13具體包括:
[0046]步驟121、計算所述第一混合塊中的每一個子塊對應的像素梯度值;
[0047]步驟122、將小于或等于第二閾值的像素梯度值所對應的子塊歸類為圖像塊,將大于所述第二閾值的像素梯度值對應的子塊歸類為第二混合塊。
[0048]具體地,第二閾值是圖像塊與混合塊梯度值的分界值,優(yōu)選的,所述第二閾值為128,若第一混合塊內(nèi)每一個像素梯度值小于128,則該第一混合塊分塊為圖像塊,否則,該第一混合塊分塊為第二混合塊。其中,計算梯度值有兩種方法:
[0049]第一種方式,根據(jù)所述第一混合塊中像素的顯示坐標(i,j),和圖像像素值s (i,j ),計算所述第一混合塊的每一個子塊的像素梯度值T,其中,
[0050]T=dx (i, j) *i+dy (i, j) * j ;
[0051]dx(i, j)=s(i+l, j)_s(i, j);
[0052]dy(i, j)=s(i, j+l)-s(i, j);
[0053]具體地,s (i,j)是圖像像素值,1、j為像素的顯示坐標。[0054]第二種方式,調(diào)用基于發(fā)行的跨平臺計算機視覺庫OpenCV中void cvSobel (constCvArr*src, CvArr*dst, int xorder, int yorder, int aperture_size=3)來獲取像素梯度值T,其中src:輸入圖像;dst輸出圖像;xorder:x方向上的差分階數(shù);yorder:y方向上的差分階數(shù),aperture_size擴展Sobel核的大小,必須是1,3,5或7。
[0055]步驟S14,利用灰度直方圖對所述第二混合塊進行分解,得到文本/圖形快及圖像塊。
[0056]在本實施例中,所述灰度化是指去掉彩色圖像中的彩色信息,只留下亮度信息,彩色圖像中的每個像素的顏色由紅(R)、綠(G)、藍(B)三個分量決定,而每個分量有255個值可取,這樣一個像素點可以有1600多萬(255*255*255)的顏色變化范圍。其中O最暗,255最亮,而在RGB色彩模型中,如果R=G=B,則顏色就表示灰度色。所述強度值是指灰度直方圖中局部最大值的灰度值。
[0057]其中,所述步驟S14具體包括:
[0058]步驟S141,根據(jù)預設灰度算法對將所述第二混合塊灰度化,獲得所述第二混合塊的灰度直方圖;
[0059]具體地,所述預設灰度算法為加權平均法、平均值法、最大值法和庫函數(shù)法中的任一項。其中,加權平均法具體是根據(jù)R、G、B三個分量的重要性及其指標,將三個分量以不同的權值進行加權平均。平均值法具體是獲得每個像素點的R、G、B三個分量的平均值。最大值法具體是取R、G、B三個分量中的最大值。庫函數(shù)法具體是調(diào)用基于發(fā)行的跨平臺計算機視覺庫中 cvCvtColor (const CvArr*src, CvArr*dst, int code)函數(shù)來實現(xiàn),其中 src 為原彩色圖像,dst為處理后圖像,code為色彩空間轉換方式。
[0060]步驟S142,分析所述灰度直方圖,將所述灰度直方圖中強度值數(shù)量小于或等于預設值,并且該強度值周圍的累計概率大于第三閾值對應的子塊劃分為文本/圖形塊,否則劃分為圖像塊。
[0061]由于每一種灰度直方圖中有多個不同的強度值,因此可計算出每一種灰度直方圖中的強度值的數(shù)量,以此來作為劃分的基準之一;而所述強度值周圍的累計概率指的是強度值波動范圍對應的累計概率。具體地,所述預設值是預設的區(qū)分文本/圖形塊和圖像塊中強度值的數(shù)量。所述第三閾值是預設的區(qū)分文本/圖形塊和圖像塊中強度值的累計概率。優(yōu)選的,第三閾值為0.95。由于不同塊的不同特性,其灰度直方圖的特性不同,如圖3所示,其中3a示出了平滑塊的灰度直方圖特征,平滑塊為文本塊的一種,3b示出了文本塊的灰度直方圖特征,3c示出了圖形塊的灰度直方圖特征,3d示出了自然圖像塊的灰度直方圖特征。根據(jù)上述四種灰度直方圖的特征可知,平滑塊和文本塊的灰度直方圖有一種或兩種模式,而圖形塊的直方圖的模式會小于4,這樣,就從第二混合塊中分離出了文本/圖形和圖像塊,平滑塊和文本塊的提取相對來說是顯而易見的,平滑塊和文本塊的直方圖有一個或兩個強度值,當子塊的尺寸足夠小得時候,即當強度值周圍的累計概率大于第三閾值時,圖形塊出現(xiàn)四種不同強度值的可能性就很小,所以當強度值的數(shù)量不大于4,并且累計概率大于0.95為第二文本/圖形塊,否則,則為第二圖像塊。
[0062]其中,所述步驟S142具體包括:
[0063]步驟S1421,分析灰度直方圖,獲得強度值數(shù)量η和強度值叫,…,mn,并且分別計算強度值的概率Pi,本實施例中[0064]Pi=freq(i)/B2,
[0065]其中,i為灰度值,i的取值范圍0-255,freq(i)為灰度值i的像素數(shù)量,B是指每一個子塊的大??;
[0066]步驟S1422,計算強度值周圍的累計概率:
[0067]
【權利要求】
1.一種復合圖像的壓縮方法,其特征在于,所述方法包括: 51、根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域; 52、分別采用對應的編碼方式對所述若干個分割區(qū)域進行壓縮。
2.如權利要求1所述的方法,其特征在于,所述步驟SI具體包括: 511、將所述復合圖像分成若干個子塊; 512、基于顏色特征對所述若干個子塊進行區(qū)分,得到文本/圖形塊及第一混合塊; 513、基于像素梯度對所述第一混合塊進行分類,得到圖像塊及第二混合塊; 514、利用灰度直方圖對所述第二混合塊進行分解,得到文本/圖形塊及圖像塊。
3.如權利要求2所述的方法,其特征在于,所述步驟S12具體為: 5121、分析計算所述若干個子塊中的每一個子塊對應的像素的顏色種類數(shù)量; 5122、將顏色種類數(shù)量小于或等于第一閾值的子塊歸類為文本/圖形塊,將大于第一閾值的子塊歸類為第一混合塊。
4.如權利要求2所 述的方法,其特征在于,所述步驟S13具體為: 5131、計算所述第一混合塊中的每一個子塊對應的像素梯度值; 5132、將小于或等于第二閾值的像素梯度值所對應的子塊歸類為圖像塊,將大于所述第二閾值的像素梯度值對應的子塊歸類為第二混合塊。
5.如權利要求4所述的方法,其特征在于,所述步驟S131中計算像素梯度值具體為: 根據(jù)所述第一混合塊中像素的顯示坐標(i,j),和圖像像素值s (i, j),計算所述第一混合塊的像素梯度值T,其中,
T=dx(i, j)*i+dy (i, j)*j ;
dx(i, j)=s(i+l, j)-s(i, j);
dy (i, j)=s(i, j+l)-s(i, j); 具體地,s (i, j)是圖像像素值,1、j為像素的顯示坐標。
6.如權利要求2所述的方法,其特征在于,所述步驟S14具體包括: 5141、根據(jù)預設灰度算法對將所述第二混合塊灰度化,獲得所述第二混合塊的灰度直方圖; 5142、分析所述灰度直方圖,將所述灰度直方圖中強度值數(shù)量小于或等于預設值,并且該強度值周圍的累計概率大于第三閾值對應的子塊劃分為文本/圖形塊,否則劃分為圖像塊。
7.如權利要求2至6任意一項所述的方法,其特征在于,所述步驟S2具體為: 分別對文本/圖形塊采用無損算法及對圖像塊采用有損算法進行壓縮。
8.一種復合圖像的壓縮裝置,其特征在于,所述裝置包括: 圖像分割單元,用于根據(jù)圖像特征將復合圖像進行分割,得到若干個分割區(qū)域,所述圖像特征包括顏色和灰度,所述分割區(qū)域包括文本/圖形區(qū)域及圖像區(qū)域; 壓縮單元,用于分別采用對應的編碼方式對所述若干個分割區(qū)域進行壓縮。
9.如權利要求1所述的壓縮裝置,其特征在于,所述圖像分割單元具體包括: 圖像分塊子單元,用于將所述復合圖像分成若干個子塊; 第一分類子單元,用于基于顏色特征對所述若干個子塊進行區(qū)分,得到文本/圖形塊及第一混合塊; 第二分類子單元,用于基于像素梯度對所述第一混合塊進行分類,得到圖像塊及第二混合塊; 第三分類子單元,用于利用灰度直方圖對所述第二混合塊進行分解,得到文本/圖形塊及圖像塊。
10.如權利要求9所述的壓縮裝置,其特征在于,所述第一分類子單元具體用于分析計算所述若干個子塊中的每一個子塊對應的像素的顏色種類數(shù)量;將顏色種類數(shù)量小于或等于第一閾值的子塊歸類為文本/圖形塊,將大于第一閾值的子塊歸類為第一混合塊。
11.如權利要求9所述的壓縮裝置,其特征在于,所述第二分類子單元具體用于計算所述第一混合塊中的每一個子塊對應的像素梯度值;將小于或等于第二閾值的像素梯度值所對應的子塊歸類為圖像塊,將大于所述第二閾值的像素梯度值對應的子塊歸類為第二混合塊。
12.如權利要求9所述的壓縮裝置,其特征在于,所述第三分類子單元具體用于根據(jù)預設灰度算法對將所述第二混合塊灰度化,獲得所述第二混合塊的灰度直方圖;分析所述灰度直方圖,將所述灰度直方圖中強度值數(shù)量小于或等于預設值,并且該強度值周圍的累計概率大于第三閾值對應的子塊劃分為`文本/圖形塊,否則劃分為圖像塊。
【文檔編號】G06T9/00GK103700121SQ201310745863
【公開日】2014年4月2日 申請日期:2013年12月30日 優(yōu)先權日:2013年12月30日
【發(fā)明者】張艷 申請人:Tcl集團股份有限公司