一種基于顯式混合調(diào)和擴(kuò)散的卡通圖像壓縮方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及圖像處理應(yīng)用,特別是設(shè)及一種基于顯式混合調(diào)和擴(kuò)散的卡通圖像壓 縮方法。
【背景技術(shù)】
[0002] 隨著移動互聯(lián)網(wǎng)的發(fā)展,圖像的傳輸越來越頻繁。由于位圖是W像素為單位存儲 的點(diǎn)陣圖,容量較大,受網(wǎng)絡(luò)帶寬的限制,圖像的傳輸使得網(wǎng)絡(luò)負(fù)擔(dān)大,并且加載的耗時(shí)嚴(yán) 重影響了交互的實(shí)時(shí)性。在注重單位流量業(yè)務(wù)價(jià)值的移動互聯(lián)環(huán)境,如何有效地壓縮圖像 而又不影響圖像質(zhì)量,顯得尤為重要。
[0003] 傳統(tǒng)上,大部分的圖像壓縮方法(第一代壓縮方法)都依賴于基于經(jīng)典信息理論 的相關(guān)技術(shù),采用先變換后賭編碼的架構(gòu),利用圖像中存在的統(tǒng)計(jì)冗余達(dá)到對圖像數(shù)據(jù)的 壓縮,典型的代表如JPEG200〇w。然而,經(jīng)過20多年的發(fā)展,運(yùn)樣的架構(gòu)已經(jīng)趨于成熟,壓 縮性能難W進(jìn)一步提升。
[0004] 在圖像中,除了統(tǒng)計(jì)冗余之外,還存在著視覺冗余,即人的視覺系統(tǒng)對圖像不同區(qū) 域的損失的感知敏感程度是有區(qū)別的。近年來,研究人員更多的關(guān)注于如何利用圖像中存 在的視覺冗余W進(jìn)一步提高壓縮率,提出了一系列壓縮方法,統(tǒng)稱為第二代圖像壓縮方法 ?。運(yùn)些方法在壓縮機(jī)制的設(shè)計(jì)過程中融合了人類視覺系統(tǒng),試圖通過消除視覺冗余的方 式W進(jìn)一步提高編碼效率,同時(shí)又保持較好的視覺質(zhì)量。有損圖像壓縮的本質(zhì)可歸結(jié)為離 散數(shù)據(jù)的插值問題,第一代方法大都采用諸如離散余弦變換或離散小波變換之類的方法。 盡管也是一種經(jīng)典的插值方法,偏微分方程傳統(tǒng)上更多的被用于前/后處理階段W改進(jìn)圖 像視覺質(zhì)量近年來,一些研究者開始嘗試將之用做一種編解碼的核屯、工具,提出了各 基于圖像修復(fù)(inpainting)或者熱擴(kuò)散(difTusion)的壓縮方法K'w。此外,他們注意到 人的視覺系統(tǒng)對輪廓、邊緣的特殊敏感性和方向感知特性提出了各種邊緣保持的壓縮方法 W最大程度減少壓縮所帶來的視覺質(zhì)量下降。需要指出的是,已提出的幾種基于偏微 分方程的方法大都采用二階偏微分方程,通過求解泊松方程進(jìn)行離散數(shù)據(jù)插值。然而運(yùn)些 方法能較好的捕捉顏色急劇變化的區(qū)域情況,對于一些顏色變化比較平滑的區(qū)域則效果比 較差。相較而言,四階偏微分方程(雙調(diào)和方程)可W更好的模擬運(yùn)種光滑變換的情況,因 而也受到了研究人員的關(guān)注,然而目前的研究更多的集中在于矢量圖形的表示?'^。最后, 運(yùn)些方法在解碼的時(shí)候,需要求解一個(gè)龐大的線性系統(tǒng),整個(gè)過程較為緩慢,難W滿足實(shí)時(shí) 解碼的要求。
[0005] 參考文獻(xiàn):
[0006] [IjDavid Taubman and Michael MarcelI in, JPEG2000:Image Compression Fundamentals, Standards and Practice. Boston:Springer,2001.
[0007] [2]M. M. Reid, R. J. MiIlar, and N. D. Black, "Second-generation image coding:an overview, "ACM Comput. Surv.,vol. 29, no. 1,pp. 3 - 29, 1997.
[0008] [3]Ivan Kopilovic and T.Szirdnyi, , "Artifact 民eduction with Diffusion Preprocessing for Image Compression,,,Opt. Eng.,vol. 44, no. 2, pp. I - 14, 2005.
[0009] [4]F. Alter, S. Durand, and J. Froment, "Adapted total variation for ar-tifact free decompression of JPEG images,,,J. Math. Imaging Vis.,vol. 23, no. 2, pp. 199 - 211,2005.
[0010] [5]Zhiwei Xiong, Xiaoyan Sun, and Feng Wu, "Block-Based Image Compression With Parameter-Assistant Inpainting,,,IEEE Trans. Image Process.,vol. 19, no. 6, pp. 1651 - 1657, 2010.
[0011] [6] Irena Galic, Joachim Weickert, Martin Welk, Andres Bruhn, Alexander Belyaev,and Hans-Peter Seidel, "Image Compression with Anisotropic Diffusion, " J. Ma化? Imaging Vis.,vol. 31,pp. 255 - 269, 2008.
[0012] [7]Dong Liu, Xiaoyan Sun, Feng Wu, Shipeng Li, and Yaqin Zhang, "Image compression with edge-based inpainting,,,IEEE Trans. Circuits, Syst. Video Techno I. , vol. 17, no. 10, pp. 1273 - 1287, 2007.
[0013] [8]Markus Mainberger, Andres Bruhna, Joachim Weickerta, and S0r'ert Forchhammer, "Edge-based compression of cartoon-like images with homogeneous diffusion, "Pattern 民ecognition.,vol. 44, no. 9, pp. 1859 - 1873, 2011.
[0014] [9]Mark Finch, John Snyder, and Hugues Hoppe, "Freeform vector graphics with controlled thin-plate splines, "ACM Trans. Graph.,vol. 30, no. 6, p. Article No. 166, 2011.
[0015] [10] Peter Ilbery, Luke Kendal 1,Cyri I Concolato, and Michael McCosker, "Biharmonic diffusion curve images from boundary elements, "ACM Trans. Graph.,vol. 32, no. 6, p. Article No. 219, 2013.
【發(fā)明內(nèi)容】
[0016] 本發(fā)明的目的在于針對現(xiàn)有基于偏微分方程的第二代圖像壓縮算法存在的色彩 表現(xiàn)能力有限,解碼時(shí)間冗長等問題而導(dǎo)致的實(shí)用性比較化等問題,提供算法明確、效果顯 著,實(shí)時(shí)性強(qiáng)、結(jié)果魯棒,在產(chǎn)業(yè)化后可^極大提高手機(jī)動漫產(chǎn)業(yè)單位流量的業(yè)務(wù)價(jià)值,改 善用戶體驗(yàn),促進(jìn)產(chǎn)業(yè)蓬勃發(fā)展的一種基于顯式纔合調(diào)和擴(kuò)散的卡通圖像壓縮方法。
[0017] 本發(fā)明包括W下步驟:
[0018] 1)特征線條提?。簩斎雸D像計(jì)算其控普控斯圖像和雙控普控斯圖像,再分別對 它們應(yīng)用非極大值抑制方法識別特征像素并將它們連接成特征線條;
[0019] 2)特征線條歸類:對控普控斯圖像上抽取出來的每條特征線條引入一個(gè)控普控 斯計(jì)數(shù),對特征線條進(jìn)行采樣,在每個(gè)采樣點(diǎn)沿曲線法向向兩邊步進(jìn)至局部控普控斯極小 值點(diǎn),若距離小于給定閥值則給該曲線的控普控斯計(jì)數(shù)增加1,當(dāng)控普控斯計(jì)數(shù)值大于采樣 點(diǎn)數(shù)的一半時(shí),則判定該線條為控普控斯線條,其余線條為雙控普控斯線條;
[0020] 3)特征線條位置編碼:將所有特征線條像素構(gòu)成的圖像視為一張二值圖像,并采 用JBIG標(biāo)準(zhǔn)進(jìn)行編碼;
[0021] 4)圖像顏色編碼:將圖像其余部分的顏色表示為調(diào)和擴(kuò)散的結(jié)果,并用格林函數(shù) 進(jìn)行逼近,最終通過求解一個(gè)線性系統(tǒng)得到對調(diào)和擴(kuò)散的最優(yōu)格林逼近,并將求解得到的 每條特征線條的格林參數(shù)存儲;
[0022] 5)特征線條位置解碼:對JBIG編碼的線條信息進(jìn)行解碼,恢復(fù)為二值圖像后加載 到解碼圖像上;
[0023] 6)圖像顏色解碼:將編碼過程中得到的調(diào)和擴(kuò)散的格林逼近在圖像域上進(jìn)行積 分得到每個(gè)像素的顏色值。
[0024] 在步驟1)中,所述特征線條提取是在拉普拉斯域和雙拉普拉斯域同時(shí)提取特征 線條,對輸入圖像U計(jì)算拉普拉斯圖像A U和雙拉普拉斯圖像A 2u,然后從它們分別應(yīng)用非 極大值抑制算法進(jìn)行特征像素的識別,最后把特征像素連接起來構(gòu)成特征線條,再與常用 的Cannny算法和Steger算法相比。
[0025] 在步驟2)中,所述特征線條歸類可采用一種投票的方法來確定特征線條是拉普 拉斯曲線還是雙拉普拉斯曲線,對于拉普拉斯圖像取出的每條特征曲線上的每個(gè)點(diǎn),沿著 曲線左側(cè)法向方向n步進(jìn)直到拉普拉斯絕對值最小的點(diǎn);若該步進(jìn)距離小于給定的歸類閥 值,將曲線的拉普拉斯計(jì)數(shù)加1,否則將雙拉普拉斯計(jì)數(shù)加1,在曲線右側(cè)重復(fù)該過程;最后 當(dāng)且僅當(dāng)拉普拉斯計(jì)數(shù)和雙拉普拉斯計(jì)數(shù)的比值大于0. 5時(shí),將該曲線歸類為拉普拉斯曲 線;剔除雙拉普拉斯圖像抽取的曲線中與識別出的拉普拉斯曲線重合的曲線,將剩下的曲 線歸類為雙拉普拉斯曲線;所述其余線條包括雙拉普拉斯圖像上的特征線條。
[0026] 在步驟4)中,所述圖像顏色編碼,可用雙拉普拉斯過程來編碼圖像非特征區(qū)域的 顏色分布。
[0027] 在步驟5)中,所述特征線條位置解碼在對圖像進(jìn)行重構(gòu)時(shí),對步驟4)得到的格林 逼近的調(diào)和函數(shù)U (X)在圖像的方形域R = Ix G (X。,Xi),y G (y。,yj }上進(jìn)行積分,該積分 可W進(jìn)一步標(biāo)識表示為格林函數(shù)核在R上的積分:
[0030] 本發(fā)明針對現(xiàn)有基于偏微分方程的第二代圖像壓縮算法存在的色彩表現(xiàn)能力有 限,解碼時(shí)間冗長等問題而導(dǎo)致的實(shí)用性比較低等問題,提出了一種基于顯式混合調(diào)和擴(kuò) 散的卡通圖像壓縮方法,通過同時(shí)采用調(diào)和及雙調(diào)和擴(kuò)散能夠更好的編碼圖像中存在的豐 富顏色變化,避免了在解碼時(shí)求解龐大線性系統(tǒng),從而實(shí)現(xiàn)實(shí)時(shí)解碼。通過采用格林函數(shù)對 雙調(diào)和過程進(jìn)行顯式逼近,大幅提高了解碼速度。本發(fā)明算法明確、效果顯著,實(shí)時(shí)性強(qiáng)、結(jié) 果魯棒,該方法在產(chǎn)業(yè)化后可W極大的提高手機(jī)動漫產(chǎn)業(yè)單位流量的業(yè)務(wù)價(jià)值,改善用戶 體驗(yàn),促進(jìn)產(chǎn)業(yè)的蓬勃發(fā)展。
【附圖說明】
[0031] 圖1為本發(fā)明的整體方案流程圖;
[0032] 圖2為圖I中特征線條提取過程圖;
[0033] 圖3為壓縮文件格式圖。
【具體實(shí)施方式】