專利名稱:分割圖像和/或接收表示分割的圖像的信號(hào)的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在圖像編碼和/或解碼系統(tǒng)中分割圖像和/或接收分割的 圖像的設(shè)備和方法,更具體地講,涉及這樣一種設(shè)備和方法,該設(shè)備和方法 將圖像劃分成塊,通過使用代價(jià)最優(yōu)分割和連接分量分類來定義各個(gè)塊以產(chǎn) 生分割圖像,并在基于混合光柵內(nèi)容的編碼和/或解碼系統(tǒng)中接收用于表示分 割的圖像的信號(hào)。
背景技術(shù):
在ITU-TT.44中定義的混合光柵內(nèi)容(MRC )是一種與傳統(tǒng)有損圖像壓 縮算法相比可顯著提高壓縮/質(zhì)量權(quán)衡的有效文檔壓縮的標(biāo)準(zhǔn)。MRC將圖像 表示為一組層。在MRC的最基本^f莫式下,將具有文本和畫面的混合文檔分 離成三層二值蒙斗反(binary mask)層、前景層和背景層。二值蒙板層表示 對(duì)每一像素,將前景分配為T或?qū)⒈尘胺峙錇?0"。根據(jù)ITU-TT.44,推 薦將文本和素描(lineart)歸類為前景層,并將畫面歸類為背景。創(chuàng)建二值蒙板層的過程被稱為分割。在分割之后,可由合適的編碼器對(duì) 每一層進(jìn)行壓縮,以創(chuàng)建MRC文檔。例如,可通過4吏用JPEG或JPEG 2000 來對(duì)前景層和背景層壓縮,而可通過使用JBIG或JBIG2對(duì)二值蒙板層編碼。分割是MRC編碼以區(qū)分圖像中的文本和圖形區(qū)域的處理,并且創(chuàng)建上 述的二值蒙板層。通常,前景層包含文本的顏色,背景層包含圖像和圖形, 二值蒙板層用于表示文本字體的細(xì)節(jié)。因?yàn)槎得砂鍖佣x字符的形狀,并 且因?yàn)椴徽_的分割可導(dǎo)致解碼圖像的失真,所以解碼圖像的質(zhì)量嚴(yán)重依賴 于分割算法。盡管分割是MRC編碼中的關(guān)鍵步驟,但是標(biāo)準(zhǔn)ITU-T T.44沒有定義分 割方法。相反,標(biāo)準(zhǔn)ITU-T T.44只定義了 MRC文檔解碼器的結(jié)構(gòu),所以可 以獨(dú)立地將任何分割算法進(jìn)行優(yōu)化以獲得最佳性能。對(duì)于在文檔壓縮中使用的分割,有多種期望的屬性。為了示出的目的, 解釋二值分割,但是還可將多層分割應(yīng)用于文檔壓縮。根據(jù)應(yīng)用的需要,所述屬性可以重要或不太重要。以下將列出所述期望的屬性。所述屬性之一是沿文本和圖形邊界的分割邊緣——種好的分割將包含文 本和圖形邊緣位置處的過渡。因?yàn)槠谕麥p小編碼的文檔的每一像素的總比特, 所以即使當(dāng)以低分辨率和低質(zhì)量對(duì)前景層和背景層編碼時(shí),分割中的邊緣也 考慮精確和高分辨率的文本邊緣的編碼。另 一屬性是空間平滑分割 一 因?yàn)閮煞N原因?qū)λ龇指钸M(jìn)行空間平滑。首 先,可通過二進(jìn)制圖像編碼器來更有效地對(duì)平滑分割進(jìn)行編碼,從而減小編 碼的文檔中每一像素的總比特。其次,因?yàn)榍熬皥D像和背景圖像在它們接合 在一起的位置之間的不一致,所以分割中的偽邊緣可導(dǎo)致最終解碼文檔中的 缺陷。另 一 屬性是被可靠地歸類為背景層的圖像區(qū)域 一 因?yàn)橥ǔ?duì)于自然圖像 的壓縮來優(yōu)化背景層的子采樣、數(shù)據(jù)填充和編碼,所以上述屬性對(duì)于一致地 將圖像區(qū)域歸類為背景層是有用的。另一屬性是被可靠地歸類為前景層的文本區(qū)域一因?yàn)橥ǔ?duì)于文本字體 填充色的壓縮來優(yōu)化前景層的子采樣、數(shù)據(jù)填充和編碼,所以上述屬性對(duì)于 一致地將文本區(qū)域歸類為前景層是有用的。另一屬性是文本和/或圖形內(nèi)容的準(zhǔn)確表示。在一些應(yīng)用中,使用分割層 來分析文檔的內(nèi)容。在這些情況下,分割準(zhǔn)確表示文檔的文本和/或圖形內(nèi)容 是有用的。對(duì)于許多MRC應(yīng)用,由于在一些應(yīng)用中,適當(dāng)?shù)貙⑽谋緲?biāo)記為前景和 只將文本標(biāo)記為前景提高解碼文檔的質(zhì)量并減小比特率(即,編碼文檔的每 一像素的比特?cái)?shù)),所以重要的是,分割在前景平面(即,被標(biāo)記為"1"的 蒙板像素)中僅包含文本,并且文檔的所有其他區(qū)域應(yīng)該在背景平面(即, 被標(biāo)記為"0"的蒙板像素)中。然而,傳統(tǒng)分割方法產(chǎn)生錯(cuò)誤。這些錯(cuò)誤可 有兩種形式。例如,可能將文本錯(cuò)誤地分割成背景,以及可能將背景錯(cuò)誤地 分割成前景。圖1是示出作為二值蒙板的錯(cuò)誤分類的示例的傳統(tǒng)圖像編碼設(shè)備中二值 蒙板中的錯(cuò)誤的示圖。黑色區(qū)域表示標(biāo)記"1",白色區(qū)域表示標(biāo)記"0"。在 該示例中,大多數(shù)文本區(qū)域被適當(dāng)?shù)胤指畛汕熬埃驗(yàn)檫^度靈敏的邊緣檢 測(cè)導(dǎo)致在畫面區(qū)域中所含的一些邊緣也被分割成前景。注意,可通過一組連 接分量來描述分割的前景部分,每個(gè)連接分量表示在都被標(biāo)記為前景(即,'T,)的蒙板中的一組相鄰像素。通過使用這種特性, 一種減小二值蒙板中 的錯(cuò)誤的方法是去除被錯(cuò)誤地歸類為前景的連接分量。發(fā)明內(nèi)容本發(fā)明總體構(gòu)思提供了 一種在圖像編碼和/或解碼系統(tǒng)中分割圖像的設(shè) 備和方法。本發(fā)明總體構(gòu)思還提供了 一種在基于混合光柵內(nèi)容的編碼和/或解碼系 統(tǒng)中分割圖像的設(shè)備和方法。本發(fā)明總體構(gòu)思還提供了 一種在圖像編碼和/或解碼系統(tǒng)中使用代價(jià)最 優(yōu)函數(shù)和/或連接分量分類分割圖像的設(shè)備和方法。本發(fā)明總體構(gòu)思還提供了 一種在基于混合光柵內(nèi)容的圖像編碼和/或解 碼系統(tǒng)中將圖像劃分成塊并定義各個(gè)塊的設(shè)備和方法。本發(fā)明總體構(gòu)思還提供了 一種在基于混合光柵內(nèi)容的圖像編碼和/或解 碼系統(tǒng)中將圖像劃分成塊并通過使用連接分量分類定義各個(gè)塊的設(shè)備和方 法。本發(fā)明總體構(gòu)思還提供了 一種圖像編碼和/或解碼系統(tǒng),所述系統(tǒng)通過使 用混合光柵內(nèi)容以及代價(jià)最優(yōu)函數(shù)和連接分量分類中的至少 一個(gè)來分割圖像 和/或接收表示分割的圖像的信號(hào)。本發(fā)明總體構(gòu)思還提供了 一種在圖像編碼和/或解碼系統(tǒng)中減小二值蒙 板中的誤差的方法和設(shè)備。本發(fā)明總體構(gòu)思還提供了 一種在圖像編碼和/或解碼系統(tǒng)中將二值蒙板 層的像素可靠地分類成前景和背景的方法和設(shè)備。本發(fā)明總體構(gòu)思還提供了 一種在圖像編碼和/或解碼系統(tǒng)中從二值蒙板 層可靠地提取文本區(qū)域的方法和設(shè)備。本發(fā)明總體構(gòu)思還提供了 一種在圖像編碼和/或解碼系統(tǒng)中增加提取文 本區(qū)域的效率并減小檢測(cè)文本區(qū)域和非文本區(qū)域的錯(cuò)誤的方法和設(shè)備。本發(fā)明總體構(gòu)思的其他方面和/或優(yōu)點(diǎn)將在下面的描述中#皮部分地闡述, 部分地從描述中將是明顯的,或可通過實(shí)施本發(fā)明總體構(gòu)思而了解。可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面,所述設(shè)備包括分割單元,將圖像劃分成一個(gè)或 多個(gè)塊,并根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將圖像的塊分割成前景和背景的二值蒙板層,以產(chǎn)生分割圖像。分割單元可包括劃分器,將圖像劃分成一個(gè)或多個(gè)塊,所述一個(gè)或多 個(gè)塊被彼此相鄰布置,以在第一和第二方向中的至少一個(gè)上彼此重疊。分割單元可包括劃分器,將圖像劃分成一個(gè)或多個(gè)塊,并且所述一個(gè)或多個(gè)塊中的每一塊包括在第一和第二方向的至少一個(gè)上與相鄰塊有一個(gè)或 多個(gè)重疊區(qū)域的相同像素。分割單元可包括代價(jià)最優(yōu)分割(COS)單元,將各個(gè)塊定義為分割候 選,并根據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選。COS單元可包括第一分割單元,根據(jù)塊的分類將各個(gè)塊定義為分割候 選;和第二分割單元,根據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選。代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于圖像的特征和相鄰塊之間的分割的 一致性。
代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于塊的屬性,并且塊的屬性包括沿文本和圖形邊界 的分割邊緣、空間平滑分割、被分類為背景層的圖像區(qū)域、被分類為前景層 的文本區(qū)域、文本和/或圖形內(nèi)容的準(zhǔn)確表示中的一個(gè)。代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于在相鄰塊的重疊區(qū)域中的像素之間的誤匹配的個(gè)數(shù)。代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于相鄰塊的重疊區(qū)域中的像素的方差。 代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于相鄰塊的恒定性。分割單元可根據(jù)代價(jià)最優(yōu)函數(shù)修改塊,以控制分割圖像的圖像質(zhì)量和壓 縮率。分割單元可包括連接分量分類(CCC)單元,根據(jù)最初分割圖像的特 征向量修改最初分割圖像,以產(chǎn)生分割圖像。CCC單元可提取相鄰塊的連接分量,并根據(jù)連接分量計(jì)算各個(gè)塊的特征 向量。CCC單元可根據(jù)特征向量對(duì)圖像的塊的像素?cái)?shù)據(jù)進(jìn)行分類,以修改塊的 像素?cái)?shù)據(jù),從而根據(jù)修改的像素?cái)?shù)據(jù)產(chǎn)生分割圖像。CCC單元可將特征向量與參考向量進(jìn)行比較,以修改圖像的塊的像素?cái)?shù)據(jù)。ccc單元可根據(jù)最初分割圖像的相鄰區(qū)域的特征向量將最初分割圖像的區(qū)域分類為文本區(qū)域和非文本區(qū)域,其中,最初分割圖像是根據(jù)代價(jià)最優(yōu) 函數(shù)而被分割的。特征向量包括文本符號(hào)向量和非文本符號(hào)向量。分割單元還可根據(jù)特征向量修改根據(jù)代價(jià)最優(yōu)函數(shù)而分割的各個(gè)塊,以 根據(jù)修改的塊輸出分割圖像。分割單元可根據(jù)特征向量修改塊,以控制分割圖像的錯(cuò)誤警告概率和正 確檢測(cè)概率。所述設(shè)備還可包括掃描單元,掃描文檔,以產(chǎn)生與圖像相應(yīng)的信號(hào)。 所述設(shè)備還可包括打印單元,打印與輸出圖像相應(yīng)的信號(hào)。 還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總 體構(gòu)思的以上和/或其他方面,所述設(shè)備包括分割單元,將圖像劃分成一個(gè) 或多個(gè)塊,根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層,以根據(jù) 分割的塊產(chǎn)生輸出圖像。還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總 體構(gòu)思的以上和/或其他方面,所述設(shè)備包括分割單元,將圖像劃分成一個(gè) 或多個(gè)塊,并根據(jù)特征向量將塊分割成一個(gè)或多個(gè)前景和以及一個(gè)或多個(gè)背 景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總 體構(gòu)思的以上和/或其他方面,所述設(shè)備包括解碼單元,對(duì)從根據(jù)代價(jià)函數(shù) 和特征向量的分割圖像編碼的圖像信號(hào)解碼,以產(chǎn)生解碼的圖像。所述設(shè)備還可包括打印單元,在打印介質(zhì)上打印解碼的圖像。還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面,所述設(shè)備包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,并根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成一個(gè)或多個(gè)前景和一個(gè)或多個(gè)背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像;和解碼單元, 對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊形成的分割圖像相應(yīng)的信號(hào)解碼,以產(chǎn)生解碼的圖像。所述設(shè)備還可包括打印單元,在打印介質(zhì)上打印解碼的圖像。 所述設(shè)備還可包括掃描單元,掃描文檔,以產(chǎn)生與圖像相應(yīng)的信號(hào)。 還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià) 最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的 以上和/或其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)特征 向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的 以上和/或其他方面,所述方法包括對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割圖 像編碼的圖像信號(hào)解碼,以產(chǎn)生解碼的圖像;和在打印介質(zhì)上打印解碼的圖 像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的 以上和/或其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià) 最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊 產(chǎn)生分割圖像;和對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割圖像相應(yīng) 的信號(hào)解碼,以產(chǎn)生解碼的圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系 統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或 其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù) 和特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割 圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系 統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或 其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù) 將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系 統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或 其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)特征向量將塊 分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系 統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面,所述方法包括對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割 圖像編碼的圖像信號(hào)解碼,以產(chǎn)生解碼的圖像;和在打印介質(zhì)上打印解碼的圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系 統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或 其他方面,所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù) 和各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊 產(chǎn)生分割圖像;對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割圖像相應(yīng)的 信號(hào)解碼,以產(chǎn)生解碼的圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體 構(gòu)思的以上和/或其他方面,所述設(shè)備包括分割單元,將圖像劃分成一個(gè)或 多個(gè)塊,根據(jù)相鄰塊的誤匹配個(gè)數(shù)將塊的相鄰像素?cái)?shù)據(jù)分割成前景和背景的 二值蒙板層,并對(duì)塊的像素?cái)?shù)據(jù)進(jìn)行調(diào)整,以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體 構(gòu)思的以上和/或其他方面,所述設(shè)備包括分割單元,將圖像劃分成一個(gè)或 多個(gè)塊,并根據(jù)各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層,以 根據(jù)分割的塊產(chǎn)生分割圖像。
從下面結(jié)合附圖對(duì)實(shí)施例的描述,本發(fā)明總體構(gòu)思的以上和/或其他方面 和優(yōu)點(diǎn)將變得清楚,并更容易理解,其中圖1是示出傳統(tǒng)圖像編碼設(shè)備中二值蒙板中的錯(cuò)誤的示圖;圖2是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的框圖;圖3是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖2的圖像編碼和/或解碼系 統(tǒng)的分割單元的框圖;圖4是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分 割單元的方法的流程圖;圖5是示出原始圖像和圖2以及圖3的圖像編碼和/或解碼系統(tǒng)的分割的 圖像的示圖;圖6是根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分割單元的框圖;圖7是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分 割單元的方法的流程圖;圖8是示出圖2和圖6的圖像編碼和/或解碼系統(tǒng)的分割單元的特征向量 圖示的示圖;和圖9是示出原始圖像、在圖2和圖6的圖像編碼和/或解碼系統(tǒng)的分割單 元中形成的最初分割和CCC分割的示圖。
具體實(shí)施方式
現(xiàn)在將詳細(xì)闡述本發(fā)明總體構(gòu)思的實(shí)施例,其示例在附圖中示出,其中, 相同的標(biāo)號(hào)始終表示相同的部件。圖2是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的框 圖。參照?qǐng)D2,所述圖像編碼和/或解碼系統(tǒng)可以是使用在ITU-T T.44中定義 的混合光柵內(nèi)容(MRC)以產(chǎn)生壓縮的圖像或文檔的設(shè)備。在MRC編碼中, 圖像被表示為一組層,例如,二值蒙板層、前景層和背景層。二值蒙板層包 括一個(gè)或多個(gè)前景和一個(gè)或多個(gè)背景,例如,像素值1和0分別表示前景和 背景。當(dāng)前實(shí)施例根據(jù)稍后將描述的代價(jià)最優(yōu)分割(COS)和連接分量分類 (CCC)對(duì)二值蒙板層執(zhí)行分割,以改變或調(diào)整二值蒙板層的塊的像素值。 二值蒙板層的每一像素可具有表示前景像素或背景像素的值,以形成二值蒙 板層??赏ㄟ^前景層來表示二值蒙板層的前景像素,并可通過背景層來表示 二值蒙板層的背景像素。圖像編碼和/解碼系統(tǒng)可包括編碼設(shè)備210和解碼設(shè)備270。編碼設(shè)備 210可包括掃描單元220、分割單元230、編碼單元240以及發(fā)送單元250 和/或接收單元260。解碼設(shè)備270可包括發(fā)送和/或接收單元260、解碼單 元271和打印單元272。發(fā)送單元和/或接收單元250以及260通過線280 (例 如,電路、有線網(wǎng)絡(luò)或無(wú)線網(wǎng)絡(luò))被連接。分割單元230可包括劃分器231、 代價(jià)最優(yōu)分割(COS )單元232和連接分量分類(CCC )單元233。在分割單 元230中可選4奪性地使用COS單元232和CCC單元233。分割單元230可從掃描單元220或外部裝置接收?qǐng)D像數(shù)據(jù),以分割圖像 數(shù)據(jù)。圖像數(shù)據(jù)可表示頁(yè)圖像或頁(yè)圖像的一部分。掃描單元220可包括用于 進(jìn)給文檔的文檔進(jìn)給器和用于掃描所進(jìn)給的文檔以產(chǎn)生信號(hào)(例如,圖像數(shù)據(jù))的掃描儀。劃分器231可將具有多個(gè)像素的圖像劃分成一個(gè)或多個(gè)塊,每一塊具有預(yù)定數(shù)量的像素。相鄰塊可彼此重疊,以具有相同的像素。即,圖像數(shù)據(jù)的 相同像素可被包括在相鄰塊中。每一像素可具有表示前景或背景像素的值, 以形成二值蒙板層。COS單元232根據(jù)代價(jià)最優(yōu)分割(COS)來分割圖像數(shù)據(jù)的塊。COS單 元232可將各個(gè)塊定義為用于分割的分割候選,例如,四個(gè)分割候選,然后 根據(jù)全局代價(jià)最小化(例如,代價(jià)最優(yōu)分割)來將分割候選確定為最終分割。 將各個(gè)塊的像素分割成前景像素和背景像素,例如,值1或0。分割可以是 原始、反轉(zhuǎn)、全前景和全背景??筛鶕?jù)分割將各個(gè)塊的像素從前景像素改變 為背景像素,或?qū)⒏鱾€(gè)塊的像素從背景像素改變?yōu)榍熬跋袼?,例如,O到l, 或者從1到0。當(dāng)分別將各個(gè)塊設(shè)置為全前景或全背景時(shí),可將各個(gè)塊的所 有像素設(shè)置為前景像素或背景像素。COS單元232產(chǎn)生從具有調(diào)整的像素的 分割的塊形成的分割圖像CCC單元233根據(jù)連接分量分類(CCC)處理分割圖像或圖像數(shù)據(jù)的分 割的塊。CCC單元233可從分割圖像或分割的塊中提取一個(gè)或多個(gè)連接分量, 根據(jù)表示各個(gè)連接分量的一個(gè)或多個(gè)屬性的特征向量提取連接分量作為文本 或非文本,并調(diào)整COS單元232的分割圖像,從而可根據(jù)特征向量來調(diào)整分 割圖像的像素。可從被形成為分割圖像的圖像的相鄰塊或相鄰區(qū)域中提取連 接分量。可在劃分器231和CCC單元233之間連接傳統(tǒng)的分割單元或與COS 單元232不同的另一分割單元,以產(chǎn)生分割的圖像,從而CCC單元從所述傳 統(tǒng)的分割單元接收分割圖像,并對(duì)分割圖像執(zhí)行CCC。可從COS單元232和/或CCC單元233形成最終分割圖像。即,可從像 素值被調(diào)整或改變的塊的分割圖像形成最終分割圖像。由于相鄰塊共享像素, 所以可不同地改變相鄰塊共享的像素,調(diào)整相鄰塊的被不同改變的像素,從 而組合相鄰塊,以形成表示最終分割圖像的圖像。編碼單元240通過使用相應(yīng)的編碼算法對(duì)從COS單元232和/或CCC單 元233形成的最終分割圖像編碼,并對(duì)背景層和前景層編碼,并通過發(fā)送和/ 或接收單元250以及線280將表示二值蒙板層的最終分割圖像、背景層和前 景層的編碼的信號(hào)輸出到解碼設(shè)備270或外部裝置。解碼單元271從編碼設(shè)備210或外部裝置接收編碼的信號(hào),并對(duì)表示二值蒙板層、背景層和前景層的信號(hào)解碼,以再現(xiàn)解碼的圖像??稍诖蛴卧?72中在打印介質(zhì)上打印再現(xiàn)的圖像,并可將再現(xiàn)的圖像輸出到另一外部裝 置。打印單元272可以是打印機(jī)、傳真機(jī)、多功能設(shè)備等。圖2的圖像編碼和/或解碼系統(tǒng)的方法可包括將圖像劃分成多個(gè)塊,并 對(duì)所述多個(gè)塊執(zhí)行COS,以產(chǎn)生根據(jù)分割的塊而形成的分割圖像。所述方法 可包括對(duì)分割圖像執(zhí)行CCC,以產(chǎn)生另一最終圖像作為二值蒙板層,對(duì)包 括二值蒙板層以及背景層和前景層的信號(hào)編碼,發(fā)送編碼的信號(hào),接收編碼 的信號(hào),對(duì)接收的信號(hào)解碼以再現(xiàn)圖像,和/或在打印介質(zhì)上打印再現(xiàn)的圖像。圖3是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖2的圖像編碼和/或解碼系 統(tǒng)200的編碼設(shè)備210的分割單元230的框圖。參照?qǐng)D2和圖3,分割單元 230可包括劃分器231和COS單元232,所述COS單元232包括第一 COS 單元232a和第二 COS單元232b。在分割單元230中使用分割算法,以執(zhí)行COS來分割圖像數(shù)據(jù)的塊,并 為代價(jià)函數(shù)的最優(yōu)化闡述分割算法,以執(zhí)行COS??蓪⒎指钏惴ù鎯?chǔ)在分割 單元230、或者分割單元230或編碼設(shè)備210的存儲(chǔ)器中,可將代價(jià)函數(shù)存 儲(chǔ)在分割單元230或編碼設(shè)備210的控制單元中,并將代價(jià)函數(shù)應(yīng)用于COS 單元232的第二COS單元232b。在劃分器231中將輸入圖像劃分成多個(gè)塊, 并在第一 COS單元232a中為各個(gè)塊定義用于分割的四個(gè)可能候選作為最初 分割。然后,通過使用全局代價(jià)最小化步驟為與輸入圖像數(shù)據(jù)相應(yīng)的整個(gè)圖 像確定各個(gè)塊的最終分割。所述全局代價(jià)最小化步驟表示為支持具有期望屬 性的分割的代價(jià)函數(shù)的最小化。將代價(jià)函數(shù)應(yīng)用于第二 COS單元232b,以對(duì) 各個(gè)塊執(zhí)行COS。由于當(dāng)將圖像劃分成多個(gè)塊時(shí),相鄰塊共享像素,所以當(dāng)將所述塊組成 為表示最終分割圖像的圖像時(shí),根據(jù)COS將所述像素的值從前景改變?yōu)楸尘埃?或從背景改變?yōu)榍熬?。例如,可同時(shí)改變相鄰塊共享的像素以具有相同的值, 并將具有同時(shí)改變的共享像素值的相鄰塊組合成圖像作為二值蒙板層。圖4是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分 割單元的方法的流程圖。參照?qǐng)D2至圖4,所述方法在不降低編碼設(shè)備210 編碼的圖像信號(hào)的質(zhì)量的情況下,通過使用用于減小壓縮率的代價(jià)函數(shù)對(duì)具 有相應(yīng)分割候選的各個(gè)塊執(zhí)行COS。根據(jù)代價(jià)最優(yōu)分割(COS)算法來執(zhí)行COS,首先在操作410將圖像數(shù)據(jù)劃分成重疊的塊。在每一塊中,將像素分割成前景("1")或背景("0") 像素。通過使用多種不同方法中的任何一種方法獨(dú)立分割每一塊,從而基于 局部顏色或邊緣特征來分離像素。在操作420,為各個(gè)塊定義幾個(gè)分割類(即,分割候選)。例如,各個(gè)塊 的類可以是作為原始二值分割的"原始"、"反轉(zhuǎn)"、"全前景"和"全背景"。 如果塊類是"原始",則保持塊的原始二值分割。如果塊類是"反轉(zhuǎn)",則將塊中的每一像素的類反轉(zhuǎn)(即,從'T'改變?yōu)?0",或從"0"改變?yōu)?T,)。 如果將塊類設(shè)置為"全前景"或"全背景",則分別將塊中的像素設(shè)置為全l 或全0。 一旦確定了每一塊的類,則通過將每一分割的塊的結(jié)果接合在一起 來確定最終分割。在最終分割中,在操作430,基于全局代價(jià)函數(shù)的最小化來選擇每一塊 的類。代價(jià)函數(shù)可依據(jù)圖像的特性和相鄰塊之間的分割的一致性。通常,設(shè) 計(jì)代價(jià)函數(shù),以使當(dāng)分割具有期望屬性(例如,如在傳統(tǒng)的成像系統(tǒng)中所描 述的,沿文本和圖形邊界的分割邊緣、空間平滑分割、被可靠地分類為背景 層的圖像區(qū)域、被可靠地分類為前景層的文本區(qū)域和文本和/或圖形內(nèi)容的準(zhǔn) 確表示)時(shí),代價(jià)減小。代價(jià)函數(shù)的特定設(shè)計(jì)可依據(jù)特定的應(yīng)用和分割中的 期望屬性。 一旦設(shè)計(jì)了代價(jià)函數(shù),則可使用諸如動(dòng)態(tài)規(guī)劃(dynamic programming)的方法來查找近似或精確地使代價(jià)函數(shù)最小化的塊類。在操作 440,通過使用最終分割的塊來輸出分割的圖像。分割的圖像可以是從具有像素的分割的塊形成的圖像。分割的圖像可包 括從分割的塊的組合形成的文本區(qū)域和/或非文本區(qū)域。分割的圖像和分割圖 像可被稱為分割圖像。由于根據(jù)COS算法對(duì)塊進(jìn)行處理,所以可增加分割的 圖像的壓縮率。COS算法的優(yōu)點(diǎn)在于,由于對(duì)輸入圖像沒有設(shè)置假定或約束,所以可增 強(qiáng)在各種圖像條件(例如,漸層(gradation)或細(xì)線(fme line))下的魯棒性。 另 一優(yōu)點(diǎn)是用于未來改善的代價(jià)函數(shù)的靈活性。根據(jù)當(dāng)前實(shí)施例,以上描述的設(shè)備和方法闡述了根據(jù)代價(jià)函數(shù)的最優(yōu)化 的最終分割。設(shè)計(jì)代價(jià)函數(shù),以使當(dāng)分割具有期望屬性時(shí),代價(jià)被減小。編 碼設(shè)備或圖像編碼和/或解碼系統(tǒng)的制造商可根據(jù)期望的層分離來定義代價(jià) 函數(shù)。由于可通過向原始代價(jià)函數(shù)公式添加新的項(xiàng)或改變系數(shù)來修改代價(jià)函 數(shù),所以可定制分割算法來控制圖像數(shù)據(jù)的質(zhì)量和壓縮率。根據(jù)當(dāng)前實(shí)施例,可通過代價(jià)函數(shù)的參數(shù)的系統(tǒng)最優(yōu)化對(duì)特定應(yīng)用調(diào)整分割的特性。對(duì)于最優(yōu)化,分割算法首先提出每一塊的幾個(gè)分割候選。通過只選擇使 代價(jià)函數(shù)最優(yōu)的一個(gè)候選來確定最終分割。還可根據(jù)期望的層分離的規(guī)定或 其他標(biāo)準(zhǔn)來定義分割候選。例如,對(duì)于多層分割,可提出更多個(gè)分割候選。 可根據(jù)分割的最佳選擇中的 一個(gè)使用例如動(dòng)態(tài)規(guī)劃的動(dòng)態(tài)最優(yōu)化處理。如上所述,代價(jià)最優(yōu)分割(COS)方法提出了一種有效計(jì)算的方法,以在圖像編碼和/或解碼系統(tǒng)中對(duì)圖像數(shù)據(jù)的MRC編碼處理的復(fù)雜文檔進(jìn)行準(zhǔn) 確分割。另外,COS方法分別通過代價(jià)函數(shù)和最優(yōu)化方法的選擇使得分割的 質(zhì)量和計(jì)算速度被分開控制。更準(zhǔn)確的分割為較大的MRC文檔提供了更好 的質(zhì)量和壓縮率。這又使得多功能打印機(jī)用較少的比特存儲(chǔ)和傳輸較大的文檔。以下將描述特定的代價(jià)函數(shù)和相關(guān)的最優(yōu)化過程的示例。作為分割的第 一處理,將輸入圖像劃分成重疊塊序列0g,其中,i=l...M, j=l...N。假定 每一塊0U是原始RGB或其他顏色軸值的m x m陣列,并選擇在水平和垂直 方向重疊m/2像素的塊。如果輸入圖像的高和寬不能被m除,則執(zhí)行零填充。在構(gòu)造塊序列之后,對(duì)每一塊Og選擇具有最大方差的顏色分量并對(duì)每一塊渲染灰度圖像。通過使用聚類方法將每一塊分割成兩類。聚類方法通過使 用閾值來對(duì)0id中的每一像素進(jìn)行分類,并選擇所述閾值以使總子類方差Y 、 最小化,其中,通過下面的公式來定義Y、。<formula>formula see original document page 18</formula>其中,N。,g是分類為0的像素個(gè)數(shù),Nuj是分類為1的像素個(gè)數(shù),0"/力和cr/力是每組內(nèi)的方差。由向塊中的每一像'素分配二進(jìn)制值的C,, e{0,l}'"xmi 示結(jié)果。從修改的塊分類選擇最終分割6,,,.。例如,可對(duì)每一塊的修改定義四種可能的選擇,這四種可能的選擇由類Sg來指定。類0是原始?jí)K,類l是反轉(zhuǎn)版本。如下所示,類2和類3指定塊是全背景或全前景。<formula>formula see original document page 18</formula>通過使代價(jià)函數(shù)最小化來選擇最佳類。示例性的代價(jià)函數(shù)如下所示。該示例性的代價(jià)函數(shù)包含4項(xiàng)。<formula>formula see original document page 19</formula>其中,v' 表示在水平相鄰的兩塊之間的重疊區(qū)域中的像素之間誤匹配的 個(gè)數(shù)。類似地,v^表示在垂直相鄰的兩塊之間的重疊區(qū)域中的像素之間的誤 匹配的個(gè)數(shù)。通過使這些項(xiàng)最小,可使每一塊的分割與相鄰塊最一致。下面是用于計(jì)算和VS項(xiàng)的特定項(xiàng)。H,j-在CliM的右重疊區(qū)域和Cg的左重疊區(qū)域中的像素之間的誤匹配的個(gè)數(shù)c數(shù)cV,,產(chǎn)在Cw,,的下重疊區(qū)域和C,,i的上重疊區(qū)域中的像素之間的誤匹配的個(gè)R,f在C,j的右重疊區(qū)域中的1的個(gè)數(shù)。 kT在dj的左重疊區(qū)域中的1的個(gè)數(shù)。 T,廣在Cg的上重疊區(qū)域中的1的個(gè)數(shù)。 Bg二在Q,」的下重疊區(qū)域中的1的個(gè)數(shù)。 S人f在與Ci,相應(yīng)的塊中灰度級(jí)的方差,<formula>formula see original document page 19</formula>200810008757.X說明書第14/16頁(yè)通過下面的等式給出函數(shù)MSE,,j (Sy)的值y,2,' if s,' / = 0 or ;.=1 MS*£ ,.,.) = <{義60",;,. if,. = 2其中,a、是塊的總方差,入是小于l的正常數(shù),Yu如先前在聚類方法 中所定義。類2(背景)的MSE的減小的值用于當(dāng)我們想要向背景分配更多 的畫面區(qū)域時(shí)的情況。V(4)id表示被分類為前景的像素的個(gè)數(shù)。這種代價(jià)對(duì)向前景分配太多像素 的分割進(jìn)行排版(panelize)。入p入2、入3、入4、入5和人6的值可被選擇為實(shí)現(xiàn)特定應(yīng)用的最好結(jié)果的自由參數(shù)。我們發(fā)現(xiàn),值入產(chǎn)l、入2=1、入3=20、入4=1、入5=1和入6=0.25情況很好??赏ㄟ^使用先前描述的動(dòng)態(tài)規(guī)劃來求解代價(jià)函數(shù)的最小化??芍鹦袌?zhí)行 代價(jià)最優(yōu)化。在當(dāng)前行i中,我們假定,已經(jīng)計(jì)算了直到先前行i-l的所有代 價(jià)。對(duì)每一塊記錄了最佳代價(jià)和選擇的類。 一旦我們達(dá)到行的末尾,則可從 記錄路徑跟蹤在該行中的類的最佳順序??蛇x擇的執(zhí)行可能使塊的多行最優(yōu) 化,或者可能正好或迭代地使2維的實(shí)際代價(jià)函數(shù)最小化。因?yàn)橛捎趬K重疊導(dǎo)致每一像素的最終輸出類不明確,所以通過每一塊的 中心區(qū)域來指定最終輸出類。 一旦獲得二值蒙板,就可將圖像分成多層,從 而編碼器可對(duì)每一層進(jìn)行數(shù)據(jù)填充,或者編碼器可適當(dāng)?shù)貙?duì)每一層進(jìn)行修改。圖5是示出原始圖像和通過COS算法的分割結(jié)果的示圖。在分割結(jié)果中, 黑色區(qū)域指示標(biāo)記"1"(前景),白色區(qū)域指示標(biāo)記"0"(背景)。在顏色背 景上很好地檢測(cè)到大的文本和小的文本。另外,將文本區(qū)域可靠地分類為前 景層,將圖像區(qū)域可靠地分類為背景層。圖6是根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)200的編 碼設(shè)備210的分割單元230的CCC單元233的框圖。參照?qǐng)D2、圖3和圖6, CCC單元233包括提耳又單元610、計(jì)算單元 620、分類單元630和輸出單元640。根據(jù)當(dāng)前實(shí)施例,CCC (連接分量分類) 提高分割的準(zhǔn)確度,以使分割可在前景區(qū)域(即,被標(biāo)記為'T,的蒙板像素) 中僅包含文本,并且文檔的所有其他區(qū)域都在背景(即,被標(biāo)記為"0"的蒙 板像素)中。20提取單元610從COS單元232提取最初分割或最終分割圖像,并在最初 分割或最終分割圖像中提取每個(gè)連接分量。計(jì)算單元620計(jì)算或提取每個(gè)連 接分量的特征向量,然后分類單元630根據(jù)特征向量將每個(gè)連接分量的數(shù)據(jù) 分類為文本分量或非文本分量。文本分量仍然被標(biāo)記為'T',并且非文本分 量被改變?yōu)?0",從而根據(jù)分類的數(shù)據(jù)形成圖像分割,并從輸出單元640輸 出圖像分割。最初分割可以是分割的塊或從分割的塊形成的分割的圖像的分 割??蓮腃OS單元232輸出最初分割。當(dāng)分割單元230中不包括COS單元 232時(shí),還可從外部裝置輸出最初分割或最終分割圖像。提取單元610還可 從執(zhí)行另 一分割算法的另 一單元接收最初分割或最終分割圖像。圖7是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分 割單元的方法的流程圖。參照?qǐng)D6和圖7,在操作710,從最初分割提取連接分量。在操作720, 從各個(gè)塊或各個(gè)區(qū)域(即,背景區(qū)域和前景區(qū)域)的連接分量來計(jì)算特征向 量。在操作730,根據(jù)特征向量將連接分量的數(shù)據(jù)分類為文本分量或非文本 分量。所述數(shù)據(jù)可以是各個(gè)塊(或最初分割的塊或最初分割的圖像)的各個(gè) 像素的值。在操作740,形成分割輸出,并將該分割輸出輸出到圖2的編碼 設(shè)備210的編碼單元240。根據(jù)當(dāng)前實(shí)施例,CCC單元233通過向來自最初分割的每個(gè)連接分量分 配特征向量來提高分割的準(zhǔn)確度。與傳統(tǒng)的單獨(dú)基于塊執(zhí)行分割的算法相比, 當(dāng)前實(shí)施例的CCC單元233利用連接分量的屬性。因此,以上連接分量分類 方法可結(jié)合各種分割算法使用以提高結(jié)果分割的準(zhǔn)確度。根據(jù)當(dāng)前實(shí)施例,CCC單元233的方法提高了在MRC文檔編碼中的文 檔分割算法和應(yīng)用的準(zhǔn)確度。還可將連接分量分類方法用于增加適當(dāng)檢測(cè)文 本的可能性,并用于減小誤檢測(cè)非文本的可能性。文本的更準(zhǔn)確的分割提高 了 MRC編碼文檔的質(zhì)量和壓縮率,從而使得用較少的比特存儲(chǔ)和傳輸較大 的文檔。連接分量分類的另一優(yōu)點(diǎn)是可以與其他分割算法一起使用,并/或被 應(yīng)用于任何MRC文檔分割算法的結(jié)果。為了執(zhí)行連接分量分類,需要定義N維特征向量。特征向量包含表示連 接分量的一個(gè)或多個(gè)屬性的計(jì)算值。特征向量的屬性需要提供足夠信息,以 對(duì)連接分量準(zhǔn)確分類。例如,沿每個(gè)連接分量的邊界的邊緣深度的均值和方 差是特征向量分量的可能選擇。因?yàn)槲谋痉?hào)通常具有明顯和一致的邊界,所以這些分量有助于識(shí)別文本。一旦對(duì)每個(gè)連接分量計(jì)算了特征向量,則將特征向量分類為文本或非文 本,并將相應(yīng)的連接分量標(biāo)記為文本或非文本。特征向量分類方法的優(yōu)點(diǎn)在 于,可通過分類器(即,分類的特征向量作為文本和非文本)控制錯(cuò)誤警告概率和正確檢測(cè)概率,所述分類器直接影響結(jié)果MRC編碼的質(zhì)量和壓縮率。圖8是示出圖2和圖6的圖像編碼和/或解碼系統(tǒng)的分割單元的特征向量 圖示的示圖。參照?qǐng)D8,圖示中的每一點(diǎn)對(duì)應(yīng)于一組測(cè)試圖像的最初分割中 的連接分量。該特征向量可僅包括二維,即,(1)沿每個(gè)連接分量的邊界的 邊緣深度的均值,(2)沿每個(gè)連接分量的邊界的邊緣深度的方差。紅色的圖 示(示出為灰色區(qū)域)表示文本,藍(lán)色圖示(示出為暗黑色區(qū)域)表示畫面 分量。根據(jù)這些圖示(區(qū)域),特征向量在視覺上是可分離的。圖9是示出原始圖像、在根據(jù)CCC (連接分量分類)的圖2和圖6的圖 像編碼和/或解碼系統(tǒng)的分割單元中形成的最初分割和CCC分割。根據(jù)當(dāng)前 實(shí)施例,從最初分割僅提取文本區(qū)域(即,黑色)。特征向量可以是10維, 并且可通過使用具有高斯混合模型的最大似然(ML)分類將特征向量分類。如上所述,圖像編碼和/或解碼系統(tǒng)根據(jù)代價(jià)最優(yōu)分割和連接分量分類增 加分割圖像的壓縮率和準(zhǔn)確度。如上所述,圖像編碼和/或解碼系統(tǒng)可選擇性地使用COS單元或傳統(tǒng)的 分割單元,以向CCC單元提供分割圖像。當(dāng)輸入圖像僅包括文本時(shí),在圖像 編碼和/或解碼系統(tǒng)中可以不使用CCC單元。盡管已經(jīng)顯示和描述了本發(fā)明總體構(gòu)思的一些實(shí)施例,但是本領(lǐng)域的技 術(shù)人員應(yīng)該理解,在不脫離本發(fā)明總體構(gòu)思的原理和精神的情況下,可對(duì)這 些實(shí)施例進(jìn)行修改,本發(fā)明總體構(gòu)思的范圍在權(quán)利要求及其等同物中限定。
權(quán)利要求
1、一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備,包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,并根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將圖像的塊分割成前景和背景的二值蒙板層,以產(chǎn)生分割圖像。
2、 如權(quán)利要求l所述的設(shè)備,其中,分割單元包括劃分器,將圖像劃 分成一個(gè)或多個(gè)塊,所述一個(gè)或多個(gè)塊被彼此相鄰布置,以在第一和第二方 向中的至少一個(gè)上4皮此重疊。
3、 如權(quán)利要求l所述的設(shè)備,其中,分割單元包括劃分器,將圖像劃 分成一個(gè)或多個(gè)塊,并且所述一個(gè)或多個(gè)塊中的每一塊包括在第一和第二方 向的至少一個(gè)上與相鄰塊有一個(gè)或多個(gè)重疊區(qū)域的相同像素。
4、 如權(quán)利要求1所述的設(shè)備,其中,分割單元包括代價(jià)最優(yōu)分割單元, 將各個(gè)塊定義為分割候選,并根據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選,以產(chǎn)生分割 的塊,從而形成分割圖像。
5、 如權(quán)利要求4所述的設(shè)備,其中,代價(jià)最優(yōu)分割單元包括 第一分割單元,根據(jù)塊的分類將各個(gè)塊定義為分割候選;和 第二分割單元,才艮據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選。
6、 如權(quán)利要求l所述的設(shè)備,其中,代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于圖像的特征和 相鄰塊之間的分割的一致性。
7、 如權(quán)利要求l所述的設(shè)備,其中,代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于塊的屬性,并 且塊的屬性包括沿文本和圖形邊界的分割邊緣、空間平滑分割、被分類為背 景層的圖像區(qū)域、被分類為前景層的文本區(qū)域、文本和/或圖形內(nèi)容的準(zhǔn)確表 示中的一個(gè)。
8、 如權(quán)利要求l所述的設(shè)備,其中,代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于在相鄰塊的重 疊區(qū)域中的像素之間的誤匹配的個(gè)數(shù)。
9、 如權(quán)利要求l所述的設(shè)備,其中,代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于相鄰塊的重疊 區(qū)域中的像素的方差。
10、 如權(quán)利要求1所述的設(shè)備,其中,代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于相鄰塊的恒 定性。
11、 如權(quán)利要求1所述的設(shè)備,其中,分割單元根據(jù)代價(jià)最優(yōu)函數(shù)修改 塊,以控制分割圖像的圖像質(zhì)量和壓縮率。
12、 如權(quán)利要求l所述的設(shè)備,其中,分割單元包括連接分量分類單 元,根據(jù)最初分割圖像的特征向量修改圖像的塊的最初分割圖像,以產(chǎn)生分 割圖像。
13、 如權(quán)利要求12所述的設(shè)備,其中,連接分量分類單元提取相鄰塊的 連接分量,并根據(jù)連接分量計(jì)算各個(gè)塊的特征向量。
14、 如權(quán)利要求13所述的設(shè)備,其中,特征向量分類單元根據(jù)特征向量 對(duì)圖像的塊的像素?cái)?shù)據(jù)進(jìn)行分類,以修改塊的像素?cái)?shù)據(jù),從而根據(jù)修改的像 素?cái)?shù)據(jù)產(chǎn)生分割圖像。
15、 如權(quán)利要求14所述的設(shè)備,其中,特征向量分類單元將特征向量與 參考向量進(jìn)行比較,以修改圖像的塊的像素?cái)?shù)據(jù)。
16、 如權(quán)利要求12所述的設(shè)備,其中,特征向量分類單元根據(jù)最初分割 圖像的相鄰區(qū)域的特征向量將最初分割圖像的區(qū)域分類為文本區(qū)域和非文本 區(qū)域,其中,最初分割圖像是根據(jù)代價(jià)最優(yōu)函數(shù)而被分割的。
17、 如權(quán)利要求1所述的設(shè)備,其中,特征向量包括文本符號(hào)向量和非 文本符號(hào)向量。
18、 如權(quán)利要求1所述的設(shè)備,其中,分割單元還根據(jù)特征向量修改根 據(jù)代價(jià)最優(yōu)函數(shù)而分割的各個(gè)塊,以根據(jù)修改的塊輸出分割圖像。
19、 如權(quán)利要求l所述的設(shè)備,其中,分割單元根據(jù)特征向量修改塊, 以控制分割圖像的錯(cuò)誤警告概率和正確檢測(cè)概率。
20、 如權(quán)利要求1所述的設(shè)備,還包括 掃描單元,掃描文檔,以產(chǎn)生與圖像相應(yīng)的信號(hào)。
21、 如權(quán)利要求l所述的設(shè)備,還包括 打印單元,打印與分割圖^象相應(yīng)的信號(hào)。
22、 一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備,包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成 前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。
23、 一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備,包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,并根據(jù)各個(gè)塊的特征向量將塊 分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。
24、 一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備,包括解碼單元,對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割圖像編碼的圖像信號(hào)解碼,以產(chǎn)生解碼的圖像。
25、 如權(quán)利要求24所述的設(shè)備,還包括 打印單元,在一張紙上打印解碼的圖像。
26、 一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備,包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,并根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊 的特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割 圖像;和解碼單元,對(duì)與根據(jù)代價(jià)函數(shù)和圖像的塊的特征向量形成的分割圖像相 應(yīng)的信號(hào)解碼,以產(chǎn)生解碼的圖像。
27、 如權(quán)利要求26所述的設(shè)備,還包括打印單元,在打印介質(zhì)上打印解碼的圖像。
28、 如權(quán)利要求26所述的設(shè)備,還包括 掃描單元,掃描文檔,以產(chǎn)生與圖像相應(yīng)的信號(hào)。
29、 一種圖^J扁碼和解碼系統(tǒng)的方法,包括 將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層,以 根據(jù)分割的塊產(chǎn)生分割圖像。
30、 一種圖像編碼和解碼系統(tǒng)的方法,包括 將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的 塊產(chǎn)生分割圖像作為最終二值蒙板層。
31、 一種圖像編碼和解碼系統(tǒng)的方法,包括 將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分 割的塊產(chǎn)生分割圖像作為最終二值蒙板層。
32、 一種圖^J扁碼和解碼系統(tǒng)的方法,包括對(duì)從根據(jù)代價(jià)函數(shù)和從圖像劃分的塊的特征向量的分割圖像編碼的圖像 信號(hào)解碼,以產(chǎn)生解碼的圖像;和 在一張紙上打印解碼的圖像。
33、 一種圖像編碼和解碼系統(tǒng)的方法,包括 將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像;和對(duì)與根據(jù)代價(jià)函數(shù)和從圖像劃分的塊的特征向量的分割的塊的分割圖像 相應(yīng)的信號(hào)解碼,以產(chǎn)生解碼的圖像。
34、 一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖^象編碼和解碼系統(tǒng)的方法 的程序的計(jì)算^L可讀記錄介質(zhì),所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙 板層,以根據(jù)分割的塊產(chǎn)生分割圖像。
35、 一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法 的程序的計(jì)算^/L可讀記錄介質(zhì),所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的 塊產(chǎn)生分割圖像。
36、 一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法 的程序的計(jì)算機(jī)可讀記錄介質(zhì),所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn) 生分割圖像。
37、 一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法 的程序的計(jì)算機(jī)可讀記錄介質(zhì),所述方法包括對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割圖像編碼的圖像信號(hào)解 碼,以產(chǎn)生解碼的圖像;和在一張紙上打印解碼的圖像。
38、 一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法 的程序的計(jì)算機(jī)可讀記錄介質(zhì),所述方法包括將圖像劃分成一個(gè)或多個(gè)塊;根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙 板層,以根據(jù)分割的塊產(chǎn)生分割圖像;對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊形成的分割圖像相應(yīng)的信號(hào)解碼,以產(chǎn)生解碼的圖^^。
39、 一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備,包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,才艮據(jù)相鄰塊的誤匹配個(gè)數(shù)將塊 的相鄰像素?cái)?shù)據(jù)分割成前景和背景的二值蒙板層,并對(duì)塊的像素?cái)?shù)據(jù)進(jìn)行調(diào) 整,以根據(jù)分割的塊產(chǎn)生分割圖像。
40、 一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備,包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,并根據(jù)各個(gè)塊的特征向量將塊 分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。
全文摘要
提供了一種分割圖像和/或接收表示分割的圖像的信號(hào)的設(shè)備和方法。一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備,所述設(shè)備包括分割單元,將圖像劃分成一個(gè)或多個(gè)塊,并根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層,以根據(jù)分割的塊產(chǎn)生分割圖像。
文檔編號(hào)G06K9/20GK101231698SQ20081000875
公開日2008年7月30日 申請(qǐng)日期2008年1月23日 優(yōu)先權(quán)日2007年1月24日
發(fā)明者李鐘賢, 查爾斯·A·鮑曼, 根田惠里, 玉炯洙 申請(qǐng)人:三星電子株式會(huì)社;波爾多研究基金會(huì)