分割圖像和/或接收表示分割的圖像的信號(hào)的設(shè)備和方法

文檔序號(hào)：6458207閱讀：144來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：分割圖像和/或接收表示分割的圖像的信號(hào)的設(shè)備和方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種在圖像編碼和/或解碼系統(tǒng)中分割圖像和/或接收分割的圖像的設(shè)備和方法，更具體地講，涉及這樣一種設(shè)備和方法，該設(shè)備和方法將圖像劃分成塊，通過使用代價(jià)最優(yōu)分割和連接分量分類來定義各個(gè)塊以產(chǎn) 生分割圖像，并在基于混合光柵內(nèi)容的編碼和/或解碼系統(tǒng)中接收用于表示分割的圖像的信號(hào)。
背景技術(shù)：
在ITU-TT.44中定義的混合光柵內(nèi)容(MRC )是一種與傳統(tǒng)有損圖像壓縮算法相比可顯著提高壓縮/質(zhì)量權(quán)衡的有效文檔壓縮的標(biāo)準(zhǔn)。MRC將圖像表示為一組層。在MRC的最基本^f莫式下，將具有文本和畫面的混合文檔分離成三層二值蒙斗反(binary mask)層、前景層和背景層。二值蒙板層表示對(duì)每一像素，將前景分配為T或?qū)⒈尘胺峙錇?0"。根據(jù)ITU-TT.44,推薦將文本和素描(lineart)歸類為前景層，并將畫面歸類為背景。創(chuàng)建二值蒙板層的過程被稱為分割。在分割之后，可由合適的編碼器對(duì) 每一層進(jìn)行壓縮，以創(chuàng)建MRC文檔。例如，可通過4吏用JPEG或JPEG 2000 來對(duì)前景層和背景層壓縮，而可通過使用JBIG或JBIG2對(duì)二值蒙板層編碼。分割是MRC編碼以區(qū)分圖像中的文本和圖形區(qū)域的處理，并且創(chuàng)建上述的二值蒙板層。通常，前景層包含文本的顏色，背景層包含圖像和圖形，二值蒙板層用于表示文本字體的細(xì)節(jié)。因?yàn)槎得砂鍖佣x字符的形狀，并且因?yàn)椴徽_的分割可導(dǎo)致解碼圖像的失真，所以解碼圖像的質(zhì)量嚴(yán)重依賴于分割算法。盡管分割是MRC編碼中的關(guān)鍵步驟，但是標(biāo)準(zhǔn)ITU-T T.44沒有定義分割方法。相反，標(biāo)準(zhǔn)ITU-T T.44只定義了 MRC文檔解碼器的結(jié)構(gòu)，所以可以獨(dú)立地將任何分割算法進(jìn)行優(yōu)化以獲得最佳性能。對(duì)于在文檔壓縮中使用的分割，有多種期望的屬性。為了示出的目的，解釋二值分割，但是還可將多層分割應(yīng)用于文檔壓縮。根據(jù)應(yīng)用的需要，所述屬性可以重要或不太重要。以下將列出所述期望的屬性。所述屬性之一是沿文本和圖形邊界的分割邊緣——種好的分割將包含文本和圖形邊緣位置處的過渡。因?yàn)槠谕麥p小編碼的文檔的每一像素的總比特，所以即使當(dāng)以低分辨率和低質(zhì)量對(duì)前景層和背景層編碼時(shí)，分割中的邊緣也考慮精確和高分辨率的文本邊緣的編碼。另一屬性是空間平滑分割一因?yàn)閮煞N原因?qū)λ龇指钸M(jìn)行空間平滑。首先，可通過二進(jìn)制圖像編碼器來更有效地對(duì)平滑分割進(jìn)行編碼，從而減小編碼的文檔中每一像素的總比特。其次，因?yàn)榍熬皥D像和背景圖像在它們接合在一起的位置之間的不一致，所以分割中的偽邊緣可導(dǎo)致最終解碼文檔中的缺陷。另一屬性是被可靠地歸類為背景層的圖像區(qū)域一因?yàn)橥ǔ?duì)于自然圖像的壓縮來優(yōu)化背景層的子采樣、數(shù)據(jù)填充和編碼，所以上述屬性對(duì)于一致地將圖像區(qū)域歸類為背景層是有用的。另一屬性是被可靠地歸類為前景層的文本區(qū)域一因?yàn)橥ǔ?duì)于文本字體填充色的壓縮來優(yōu)化前景層的子采樣、數(shù)據(jù)填充和編碼，所以上述屬性對(duì)于一致地將文本區(qū)域歸類為前景層是有用的。另一屬性是文本和/或圖形內(nèi)容的準(zhǔn)確表示。在一些應(yīng)用中，使用分割層來分析文檔的內(nèi)容。在這些情況下，分割準(zhǔn)確表示文檔的文本和/或圖形內(nèi)容是有用的。對(duì)于許多MRC應(yīng)用，由于在一些應(yīng)用中，適當(dāng)?shù)貙⑽谋緲?biāo)記為前景和只將文本標(biāo)記為前景提高解碼文檔的質(zhì)量并減小比特率(即，編碼文檔的每一像素的比特?cái)?shù))，所以重要的是，分割在前景平面(即，被標(biāo)記為"1"的蒙板像素)中僅包含文本，并且文檔的所有其他區(qū)域應(yīng)該在背景平面(即，被標(biāo)記為"0"的蒙板像素)中。然而，傳統(tǒng)分割方法產(chǎn)生錯(cuò)誤。這些錯(cuò)誤可有兩種形式。例如，可能將文本錯(cuò)誤地分割成背景，以及可能將背景錯(cuò)誤地分割成前景。圖1是示出作為二值蒙板的錯(cuò)誤分類的示例的傳統(tǒng)圖像編碼設(shè)備中二值蒙板中的錯(cuò)誤的示圖。黑色區(qū)域表示標(biāo)記"1"，白色區(qū)域表示標(biāo)記"0"。在該示例中，大多數(shù)文本區(qū)域被適當(dāng)?shù)胤指畛汕熬埃驗(yàn)檫^度靈敏的邊緣檢測(cè)導(dǎo)致在畫面區(qū)域中所含的一些邊緣也被分割成前景。注意，可通過一組連接分量來描述分割的前景部分，每個(gè)連接分量表示在都被標(biāo)記為前景(即，'T，)的蒙板中的一組相鄰像素。通過使用這種特性，一種減小二值蒙板中的錯(cuò)誤的方法是去除被錯(cuò)誤地歸類為前景的連接分量。發(fā)明內(nèi)容本發(fā)明總體構(gòu)思提供了一種在圖像編碼和/或解碼系統(tǒng)中分割圖像的設(shè) 備和方法。本發(fā)明總體構(gòu)思還提供了一種在基于混合光柵內(nèi)容的編碼和/或解碼系統(tǒng)中分割圖像的設(shè)備和方法。本發(fā)明總體構(gòu)思還提供了一種在圖像編碼和/或解碼系統(tǒng)中使用代價(jià)最優(yōu)函數(shù)和/或連接分量分類分割圖像的設(shè)備和方法。本發(fā)明總體構(gòu)思還提供了一種在基于混合光柵內(nèi)容的圖像編碼和/或解碼系統(tǒng)中將圖像劃分成塊并定義各個(gè)塊的設(shè)備和方法。本發(fā)明總體構(gòu)思還提供了一種在基于混合光柵內(nèi)容的圖像編碼和/或解碼系統(tǒng)中將圖像劃分成塊并通過使用連接分量分類定義各個(gè)塊的設(shè)備和方法。本發(fā)明總體構(gòu)思還提供了一種圖像編碼和/或解碼系統(tǒng)，所述系統(tǒng)通過使用混合光柵內(nèi)容以及代價(jià)最優(yōu)函數(shù)和連接分量分類中的至少一個(gè)來分割圖像和/或接收表示分割的圖像的信號(hào)。本發(fā)明總體構(gòu)思還提供了一種在圖像編碼和/或解碼系統(tǒng)中減小二值蒙板中的誤差的方法和設(shè)備。本發(fā)明總體構(gòu)思還提供了一種在圖像編碼和/或解碼系統(tǒng)中將二值蒙板層的像素可靠地分類成前景和背景的方法和設(shè)備。本發(fā)明總體構(gòu)思還提供了一種在圖像編碼和/或解碼系統(tǒng)中從二值蒙板層可靠地提取文本區(qū)域的方法和設(shè)備。本發(fā)明總體構(gòu)思還提供了一種在圖像編碼和/或解碼系統(tǒng)中增加提取文本區(qū)域的效率并減小檢測(cè)文本區(qū)域和非文本區(qū)域的錯(cuò)誤的方法和設(shè)備。本發(fā)明總體構(gòu)思的其他方面和/或優(yōu)點(diǎn)將在下面的描述中#皮部分地闡述，部分地從描述中將是明顯的，或可通過實(shí)施本發(fā)明總體構(gòu)思而了解。可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述設(shè)備包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將圖像的塊分割成前景和背景的二值蒙板層，以產(chǎn)生分割圖像。分割單元可包括劃分器，將圖像劃分成一個(gè)或多個(gè)塊，所述一個(gè)或多個(gè)塊被彼此相鄰布置，以在第一和第二方向中的至少一個(gè)上彼此重疊。分割單元可包括劃分器，將圖像劃分成一個(gè)或多個(gè)塊，并且所述一個(gè)或多個(gè)塊中的每一塊包括在第一和第二方向的至少一個(gè)上與相鄰塊有一個(gè)或多個(gè)重疊區(qū)域的相同像素。分割單元可包括代價(jià)最優(yōu)分割(COS)單元，將各個(gè)塊定義為分割候選，并根據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選。COS單元可包括第一分割單元，根據(jù)塊的分類將各個(gè)塊定義為分割候選；和第二分割單元，根據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選。代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于圖像的特征和相鄰塊之間的分割的一致性。
代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于塊的屬性，并且塊的屬性包括沿文本和圖形邊界的分割邊緣、空間平滑分割、被分類為背景層的圖像區(qū)域、被分類為前景層的文本區(qū)域、文本和/或圖形內(nèi)容的準(zhǔn)確表示中的一個(gè)。代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于在相鄰塊的重疊區(qū)域中的像素之間的誤匹配的個(gè)數(shù)。代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于相鄰塊的重疊區(qū)域中的像素的方差。代價(jià)最優(yōu)函數(shù)可對(duì)應(yīng)于相鄰塊的恒定性。分割單元可根據(jù)代價(jià)最優(yōu)函數(shù)修改塊，以控制分割圖像的圖像質(zhì)量和壓縮率。分割單元可包括連接分量分類(CCC)單元，根據(jù)最初分割圖像的特征向量修改最初分割圖像，以產(chǎn)生分割圖像。CCC單元可提取相鄰塊的連接分量，并根據(jù)連接分量計(jì)算各個(gè)塊的特征向量。CCC單元可根據(jù)特征向量對(duì)圖像的塊的像素?cái)?shù)據(jù)進(jìn)行分類，以修改塊的像素?cái)?shù)據(jù)，從而根據(jù)修改的像素?cái)?shù)據(jù)產(chǎn)生分割圖像。CCC單元可將特征向量與參考向量進(jìn)行比較，以修改圖像的塊的像素?cái)?shù)據(jù)。ccc單元可根據(jù)最初分割圖像的相鄰區(qū)域的特征向量將最初分割圖像的區(qū)域分類為文本區(qū)域和非文本區(qū)域，其中，最初分割圖像是根據(jù)代價(jià)最優(yōu) 函數(shù)而被分割的。特征向量包括文本符號(hào)向量和非文本符號(hào)向量。分割單元還可根據(jù)特征向量修改根據(jù)代價(jià)最優(yōu)函數(shù)而分割的各個(gè)塊，以根據(jù)修改的塊輸出分割圖像。分割單元可根據(jù)特征向量修改塊，以控制分割圖像的錯(cuò)誤警告概率和正確檢測(cè)概率。所述設(shè)備還可包括掃描單元，掃描文檔，以產(chǎn)生與圖像相應(yīng)的信號(hào)。所述設(shè)備還可包括打印單元，打印與輸出圖像相應(yīng)的信號(hào)。還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述設(shè)備包括分割單元，將圖像劃分成一個(gè) 或多個(gè)塊，根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層，以根據(jù) 分割的塊產(chǎn)生輸出圖像。還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述設(shè)備包括分割單元，將圖像劃分成一個(gè) 或多個(gè)塊，并根據(jù)特征向量將塊分割成一個(gè)或多個(gè)前景和以及一個(gè)或多個(gè)背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述設(shè)備包括解碼單元，對(duì)從根據(jù)代價(jià)函數(shù) 和特征向量的分割圖像編碼的圖像信號(hào)解碼，以產(chǎn)生解碼的圖像。所述設(shè)備還可包括打印單元，在打印介質(zhì)上打印解碼的圖像。還可通過提供一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述設(shè)備包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成一個(gè)或多個(gè)前景和一個(gè)或多個(gè)背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像；和解碼單元，對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊形成的分割圖像相應(yīng)的信號(hào)解碼，以產(chǎn)生解碼的圖像。所述設(shè)備還可包括打印單元，在打印介質(zhì)上打印解碼的圖像。所述設(shè)備還可包括掃描單元，掃描文檔，以產(chǎn)生與圖像相應(yīng)的信號(hào)。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià) 最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割圖像編碼的圖像信號(hào)解碼，以產(chǎn)生解碼的圖像；和在打印介質(zhì)上打印解碼的圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)的方法來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià) 最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像；和對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割圖像相應(yīng) 的信號(hào)解碼，以產(chǎn)生解碼的圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù) 和特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù) 將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割圖像編碼的圖像信號(hào)解碼，以產(chǎn)生解碼的圖像；和在打印介質(zhì)上打印解碼的圖像。還可通過提供一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù) 和各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像；對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割圖像相應(yīng)的信號(hào)解碼，以產(chǎn)生解碼的圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述設(shè)備包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，根據(jù)相鄰塊的誤匹配個(gè)數(shù)將塊的相鄰像素?cái)?shù)據(jù)分割成前景和背景的二值蒙板層，并對(duì)塊的像素?cái)?shù)據(jù)進(jìn)行調(diào)整，以根據(jù)分割的塊產(chǎn)生分割圖像。還可通過提供一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備來實(shí)現(xiàn)本發(fā)明總體構(gòu)思的以上和/或其他方面，所述設(shè)備包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。

從下面結(jié)合附圖對(duì)實(shí)施例的描述，本發(fā)明總體構(gòu)思的以上和/或其他方面和優(yōu)點(diǎn)將變得清楚，并更容易理解，其中圖1是示出傳統(tǒng)圖像編碼設(shè)備中二值蒙板中的錯(cuò)誤的示圖；圖2是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的框圖；圖3是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖2的圖像編碼和/或解碼系統(tǒng)的分割單元的框圖；圖4是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分割單元的方法的流程圖；圖5是示出原始圖像和圖2以及圖3的圖像編碼和/或解碼系統(tǒng)的分割的圖像的示圖；圖6是根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分割單元的框圖；圖7是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分割單元的方法的流程圖；圖8是示出圖2和圖6的圖像編碼和/或解碼系統(tǒng)的分割單元的特征向量圖示的示圖；和圖9是示出原始圖像、在圖2和圖6的圖像編碼和/或解碼系統(tǒng)的分割單元中形成的最初分割和CCC分割的示圖。
具體實(shí)施方式
現(xiàn)在將詳細(xì)闡述本發(fā)明總體構(gòu)思的實(shí)施例，其示例在附圖中示出，其中，相同的標(biāo)號(hào)始終表示相同的部件。圖2是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的框圖。參照?qǐng)D2，所述圖像編碼和/或解碼系統(tǒng)可以是使用在ITU-T T.44中定義的混合光柵內(nèi)容(MRC)以產(chǎn)生壓縮的圖像或文檔的設(shè)備。在MRC編碼中，圖像被表示為一組層，例如，二值蒙板層、前景層和背景層。二值蒙板層包括一個(gè)或多個(gè)前景和一個(gè)或多個(gè)背景，例如，像素值1和0分別表示前景和背景。當(dāng)前實(shí)施例根據(jù)稍后將描述的代價(jià)最優(yōu)分割(COS)和連接分量分類 (CCC)對(duì)二值蒙板層執(zhí)行分割，以改變或調(diào)整二值蒙板層的塊的像素值。二值蒙板層的每一像素可具有表示前景像素或背景像素的值，以形成二值蒙板層?？赏ㄟ^前景層來表示二值蒙板層的前景像素，并可通過背景層來表示二值蒙板層的背景像素。圖像編碼和/解碼系統(tǒng)可包括編碼設(shè)備210和解碼設(shè)備270。編碼設(shè)備 210可包括掃描單元220、分割單元230、編碼單元240以及發(fā)送單元250 和/或接收單元260。解碼設(shè)備270可包括發(fā)送和/或接收單元260、解碼單元271和打印單元272。發(fā)送單元和/或接收單元250以及260通過線280 (例如，電路、有線網(wǎng)絡(luò)或無(wú)線網(wǎng)絡(luò))被連接。分割單元230可包括劃分器231、代價(jià)最優(yōu)分割(COS )單元232和連接分量分類(CCC )單元233。在分割單元230中可選4奪性地使用COS單元232和CCC單元233。分割單元230可從掃描單元220或外部裝置接收?qǐng)D像數(shù)據(jù)，以分割圖像數(shù)據(jù)。圖像數(shù)據(jù)可表示頁(yè)圖像或頁(yè)圖像的一部分。掃描單元220可包括用于進(jìn)給文檔的文檔進(jìn)給器和用于掃描所進(jìn)給的文檔以產(chǎn)生信號(hào)(例如，圖像數(shù)據(jù))的掃描儀。劃分器231可將具有多個(gè)像素的圖像劃分成一個(gè)或多個(gè)塊，每一塊具有預(yù)定數(shù)量的像素。相鄰塊可彼此重疊，以具有相同的像素。即，圖像數(shù)據(jù)的相同像素可被包括在相鄰塊中。每一像素可具有表示前景或背景像素的值，以形成二值蒙板層。COS單元232根據(jù)代價(jià)最優(yōu)分割(COS)來分割圖像數(shù)據(jù)的塊。COS單元232可將各個(gè)塊定義為用于分割的分割候選，例如，四個(gè)分割候選，然后根據(jù)全局代價(jià)最小化(例如，代價(jià)最優(yōu)分割)來將分割候選確定為最終分割。將各個(gè)塊的像素分割成前景像素和背景像素，例如，值1或0。分割可以是原始、反轉(zhuǎn)、全前景和全背景?？筛鶕?jù)分割將各個(gè)塊的像素從前景像素改變為背景像素，或?qū)⒏鱾€(gè)塊的像素從背景像素改變?yōu)榍熬跋袼?，例如，O到l, 或者從1到0。當(dāng)分別將各個(gè)塊設(shè)置為全前景或全背景時(shí)，可將各個(gè)塊的所有像素設(shè)置為前景像素或背景像素。COS單元232產(chǎn)生從具有調(diào)整的像素的分割的塊形成的分割圖像CCC單元233根據(jù)連接分量分類(CCC)處理分割圖像或圖像數(shù)據(jù)的分割的塊。CCC單元233可從分割圖像或分割的塊中提取一個(gè)或多個(gè)連接分量，根據(jù)表示各個(gè)連接分量的一個(gè)或多個(gè)屬性的特征向量提取連接分量作為文本或非文本，并調(diào)整COS單元232的分割圖像，從而可根據(jù)特征向量來調(diào)整分割圖像的像素。可從被形成為分割圖像的圖像的相鄰塊或相鄰區(qū)域中提取連接分量。可在劃分器231和CCC單元233之間連接傳統(tǒng)的分割單元或與COS 單元232不同的另一分割單元，以產(chǎn)生分割的圖像，從而CCC單元從所述傳統(tǒng)的分割單元接收分割圖像，并對(duì)分割圖像執(zhí)行CCC。可從COS單元232和/或CCC單元233形成最終分割圖像。即，可從像素值被調(diào)整或改變的塊的分割圖像形成最終分割圖像。由于相鄰塊共享像素，所以可不同地改變相鄰塊共享的像素，調(diào)整相鄰塊的被不同改變的像素，從而組合相鄰塊，以形成表示最終分割圖像的圖像。編碼單元240通過使用相應(yīng)的編碼算法對(duì)從COS單元232和/或CCC單元233形成的最終分割圖像編碼，并對(duì)背景層和前景層編碼，并通過發(fā)送和/ 或接收單元250以及線280將表示二值蒙板層的最終分割圖像、背景層和前景層的編碼的信號(hào)輸出到解碼設(shè)備270或外部裝置。解碼單元271從編碼設(shè)備210或外部裝置接收編碼的信號(hào)，并對(duì)表示二值蒙板層、背景層和前景層的信號(hào)解碼，以再現(xiàn)解碼的圖像?？稍诖蛴卧?72中在打印介質(zhì)上打印再現(xiàn)的圖像，并可將再現(xiàn)的圖像輸出到另一外部裝置。打印單元272可以是打印機(jī)、傳真機(jī)、多功能設(shè)備等。圖2的圖像編碼和/或解碼系統(tǒng)的方法可包括將圖像劃分成多個(gè)塊，并對(duì)所述多個(gè)塊執(zhí)行COS，以產(chǎn)生根據(jù)分割的塊而形成的分割圖像。所述方法可包括對(duì)分割圖像執(zhí)行CCC，以產(chǎn)生另一最終圖像作為二值蒙板層，對(duì)包括二值蒙板層以及背景層和前景層的信號(hào)編碼，發(fā)送編碼的信號(hào)，接收編碼的信號(hào)，對(duì)接收的信號(hào)解碼以再現(xiàn)圖像，和/或在打印介質(zhì)上打印再現(xiàn)的圖像。圖3是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖2的圖像編碼和/或解碼系統(tǒng)200的編碼設(shè)備210的分割單元230的框圖。參照?qǐng)D2和圖3,分割單元 230可包括劃分器231和COS單元232，所述COS單元232包括第一 COS 單元232a和第二 COS單元232b。在分割單元230中使用分割算法，以執(zhí)行COS來分割圖像數(shù)據(jù)的塊，并為代價(jià)函數(shù)的最優(yōu)化闡述分割算法，以執(zhí)行COS?？蓪⒎指钏惴ù鎯?chǔ)在分割單元230、或者分割單元230或編碼設(shè)備210的存儲(chǔ)器中，可將代價(jià)函數(shù)存儲(chǔ)在分割單元230或編碼設(shè)備210的控制單元中，并將代價(jià)函數(shù)應(yīng)用于COS 單元232的第二COS單元232b。在劃分器231中將輸入圖像劃分成多個(gè)塊，并在第一 COS單元232a中為各個(gè)塊定義用于分割的四個(gè)可能候選作為最初分割。然后，通過使用全局代價(jià)最小化步驟為與輸入圖像數(shù)據(jù)相應(yīng)的整個(gè)圖像確定各個(gè)塊的最終分割。所述全局代價(jià)最小化步驟表示為支持具有期望屬性的分割的代價(jià)函數(shù)的最小化。將代價(jià)函數(shù)應(yīng)用于第二 COS單元232b,以對(duì) 各個(gè)塊執(zhí)行COS。由于當(dāng)將圖像劃分成多個(gè)塊時(shí)，相鄰塊共享像素，所以當(dāng)將所述塊組成為表示最終分割圖像的圖像時(shí)，根據(jù)COS將所述像素的值從前景改變?yōu)楸尘埃?或從背景改變?yōu)榍熬?。例如，可同時(shí)改變相鄰塊共享的像素以具有相同的值，并將具有同時(shí)改變的共享像素值的相鄰塊組合成圖像作為二值蒙板層。圖4是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分割單元的方法的流程圖。參照?qǐng)D2至圖4,所述方法在不降低編碼設(shè)備210 編碼的圖像信號(hào)的質(zhì)量的情況下，通過使用用于減小壓縮率的代價(jià)函數(shù)對(duì)具有相應(yīng)分割候選的各個(gè)塊執(zhí)行COS。根據(jù)代價(jià)最優(yōu)分割(COS)算法來執(zhí)行COS，首先在操作410將圖像數(shù)據(jù)劃分成重疊的塊。在每一塊中，將像素分割成前景("1")或背景("0") 像素。通過使用多種不同方法中的任何一種方法獨(dú)立分割每一塊，從而基于局部顏色或邊緣特征來分離像素。在操作420，為各個(gè)塊定義幾個(gè)分割類(即，分割候選)。例如，各個(gè)塊的類可以是作為原始二值分割的"原始"、"反轉(zhuǎn)"、"全前景"和"全背景"。如果塊類是"原始"，則保持塊的原始二值分割。如果塊類是"反轉(zhuǎn)"，則將塊中的每一像素的類反轉(zhuǎn)(即，從'T'改變?yōu)?0"，或從"0"改變?yōu)?T，)。如果將塊類設(shè)置為"全前景"或"全背景"，則分別將塊中的像素設(shè)置為全l 或全0。一旦確定了每一塊的類，則通過將每一分割的塊的結(jié)果接合在一起來確定最終分割。在最終分割中，在操作430，基于全局代價(jià)函數(shù)的最小化來選擇每一塊的類。代價(jià)函數(shù)可依據(jù)圖像的特性和相鄰塊之間的分割的一致性。通常，設(shè) 計(jì)代價(jià)函數(shù)，以使當(dāng)分割具有期望屬性(例如，如在傳統(tǒng)的成像系統(tǒng)中所描述的，沿文本和圖形邊界的分割邊緣、空間平滑分割、被可靠地分類為背景層的圖像區(qū)域、被可靠地分類為前景層的文本區(qū)域和文本和/或圖形內(nèi)容的準(zhǔn) 確表示)時(shí)，代價(jià)減小。代價(jià)函數(shù)的特定設(shè)計(jì)可依據(jù)特定的應(yīng)用和分割中的期望屬性。一旦設(shè)計(jì)了代價(jià)函數(shù)，則可使用諸如動(dòng)態(tài)規(guī)劃(dynamic programming)的方法來查找近似或精確地使代價(jià)函數(shù)最小化的塊類。在操作 440,通過使用最終分割的塊來輸出分割的圖像。分割的圖像可以是從具有像素的分割的塊形成的圖像。分割的圖像可包括從分割的塊的組合形成的文本區(qū)域和/或非文本區(qū)域。分割的圖像和分割圖像可被稱為分割圖像。由于根據(jù)COS算法對(duì)塊進(jìn)行處理，所以可增加分割的圖像的壓縮率。COS算法的優(yōu)點(diǎn)在于，由于對(duì)輸入圖像沒有設(shè)置假定或約束，所以可增強(qiáng)在各種圖像條件(例如，漸層(gradation)或細(xì)線(fme line))下的魯棒性。另一優(yōu)點(diǎn)是用于未來改善的代價(jià)函數(shù)的靈活性。根據(jù)當(dāng)前實(shí)施例，以上描述的設(shè)備和方法闡述了根據(jù)代價(jià)函數(shù)的最優(yōu)化的最終分割。設(shè)計(jì)代價(jià)函數(shù)，以使當(dāng)分割具有期望屬性時(shí)，代價(jià)被減小。編碼設(shè)備或圖像編碼和/或解碼系統(tǒng)的制造商可根據(jù)期望的層分離來定義代價(jià) 函數(shù)。由于可通過向原始代價(jià)函數(shù)公式添加新的項(xiàng)或改變系數(shù)來修改代價(jià)函數(shù)，所以可定制分割算法來控制圖像數(shù)據(jù)的質(zhì)量和壓縮率。根據(jù)當(dāng)前實(shí)施例，可通過代價(jià)函數(shù)的參數(shù)的系統(tǒng)最優(yōu)化對(duì)特定應(yīng)用調(diào)整分割的特性。對(duì)于最優(yōu)化，分割算法首先提出每一塊的幾個(gè)分割候選。通過只選擇使代價(jià)函數(shù)最優(yōu)的一個(gè)候選來確定最終分割。還可根據(jù)期望的層分離的規(guī)定或其他標(biāo)準(zhǔn)來定義分割候選。例如，對(duì)于多層分割，可提出更多個(gè)分割候選。可根據(jù)分割的最佳選擇中的一個(gè)使用例如動(dòng)態(tài)規(guī)劃的動(dòng)態(tài)最優(yōu)化處理。如上所述，代價(jià)最優(yōu)分割(COS)方法提出了一種有效計(jì)算的方法，以在圖像編碼和/或解碼系統(tǒng)中對(duì)圖像數(shù)據(jù)的MRC編碼處理的復(fù)雜文檔進(jìn)行準(zhǔn) 確分割。另外，COS方法分別通過代價(jià)函數(shù)和最優(yōu)化方法的選擇使得分割的質(zhì)量和計(jì)算速度被分開控制。更準(zhǔn)確的分割為較大的MRC文檔提供了更好的質(zhì)量和壓縮率。這又使得多功能打印機(jī)用較少的比特存儲(chǔ)和傳輸較大的文檔。以下將描述特定的代價(jià)函數(shù)和相關(guān)的最優(yōu)化過程的示例。作為分割的第一處理，將輸入圖像劃分成重疊塊序列0g，其中，i=l...M, j=l...N。假定每一塊0U是原始RGB或其他顏色軸值的m x m陣列，并選擇在水平和垂直方向重疊m/2像素的塊。如果輸入圖像的高和寬不能被m除，則執(zhí)行零填充。在構(gòu)造塊序列之后，對(duì)每一塊Og選擇具有最大方差的顏色分量并對(duì)每一塊渲染灰度圖像。通過使用聚類方法將每一塊分割成兩類。聚類方法通過使用閾值來對(duì)0id中的每一像素進(jìn)行分類，并選擇所述閾值以使總子類方差Y 、最小化，其中，通過下面的公式來定義Y、。<formula>formula see original document page 18</formula>其中，N。,g是分類為0的像素個(gè)數(shù)，Nuj是分類為1的像素個(gè)數(shù)，0"/力和cr/力是每組內(nèi)的方差。由向塊中的每一像'素分配二進(jìn)制值的C,, e{0,l}'"xmi 示結(jié)果。從修改的塊分類選擇最終分割6,，,.。例如，可對(duì)每一塊的修改定義四種可能的選擇，這四種可能的選擇由類Sg來指定。類0是原始?jí)K，類l是反轉(zhuǎn)版本。如下所示，類2和類3指定塊是全背景或全前景。<formula>formula see original document page 18</formula>通過使代價(jià)函數(shù)最小化來選擇最佳類。示例性的代價(jià)函數(shù)如下所示。該示例性的代價(jià)函數(shù)包含4項(xiàng)。<formula>formula see original document page 19</formula>其中，v' 表示在水平相鄰的兩塊之間的重疊區(qū)域中的像素之間誤匹配的個(gè)數(shù)。類似地，v^表示在垂直相鄰的兩塊之間的重疊區(qū)域中的像素之間的誤匹配的個(gè)數(shù)。通過使這些項(xiàng)最小，可使每一塊的分割與相鄰塊最一致。下面是用于計(jì)算和VS項(xiàng)的特定項(xiàng)。H,j-在CliM的右重疊區(qū)域和Cg的左重疊區(qū)域中的像素之間的誤匹配的個(gè)數(shù)c數(shù)cV,，產(chǎn)在Cw,,的下重疊區(qū)域和C,，i的上重疊區(qū)域中的像素之間的誤匹配的個(gè)R,f在C,j的右重疊區(qū)域中的1的個(gè)數(shù)。 kT在dj的左重疊區(qū)域中的1的個(gè)數(shù)。 T,廣在Cg的上重疊區(qū)域中的1的個(gè)數(shù)。 Bg二在Q,」的下重疊區(qū)域中的1的個(gè)數(shù)。 S人f在與Ci,相應(yīng)的塊中灰度級(jí)的方差,<formula>formula see original document page 19</formula>200810008757.X說明書第14/16頁(yè)通過下面的等式給出函數(shù)MSE,，j (Sy)的值y,2,' if s,' / = 0 or ；.=1 MS*￡ ,.,.) = <{義60",;,. if,. = 2其中，a、是塊的總方差，入是小于l的正常數(shù)，Yu如先前在聚類方法中所定義。類2(背景)的MSE的減小的值用于當(dāng)我們想要向背景分配更多的畫面區(qū)域時(shí)的情況。V(4)id表示被分類為前景的像素的個(gè)數(shù)。這種代價(jià)對(duì)向前景分配太多像素的分割進(jìn)行排版(panelize)。入p入2、入3、入4、入5和人6的值可被選擇為實(shí)現(xiàn)特定應(yīng)用的最好結(jié)果的自由參數(shù)。我們發(fā)現(xiàn)，值入產(chǎn)l、入2=1、入3=20、入4=1、入5=1和入6=0.25情況很好?？赏ㄟ^使用先前描述的動(dòng)態(tài)規(guī)劃來求解代價(jià)函數(shù)的最小化?？芍鹦袌?zhí)行代價(jià)最優(yōu)化。在當(dāng)前行i中，我們假定，已經(jīng)計(jì)算了直到先前行i-l的所有代價(jià)。對(duì)每一塊記錄了最佳代價(jià)和選擇的類。一旦我們達(dá)到行的末尾，則可從記錄路徑跟蹤在該行中的類的最佳順序?？蛇x擇的執(zhí)行可能使塊的多行最優(yōu) 化，或者可能正好或迭代地使2維的實(shí)際代價(jià)函數(shù)最小化。因?yàn)橛捎趬K重疊導(dǎo)致每一像素的最終輸出類不明確，所以通過每一塊的中心區(qū)域來指定最終輸出類。一旦獲得二值蒙板，就可將圖像分成多層，從而編碼器可對(duì)每一層進(jìn)行數(shù)據(jù)填充，或者編碼器可適當(dāng)?shù)貙?duì)每一層進(jìn)行修改。圖5是示出原始圖像和通過COS算法的分割結(jié)果的示圖。在分割結(jié)果中，黑色區(qū)域指示標(biāo)記"1"(前景)，白色區(qū)域指示標(biāo)記"0"(背景)。在顏色背景上很好地檢測(cè)到大的文本和小的文本。另外，將文本區(qū)域可靠地分類為前景層，將圖像區(qū)域可靠地分類為背景層。圖6是根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)200的編碼設(shè)備210的分割單元230的CCC單元233的框圖。參照?qǐng)D2、圖3和圖6, CCC單元233包括提耳又單元610、計(jì)算單元 620、分類單元630和輸出單元640。根據(jù)當(dāng)前實(shí)施例，CCC (連接分量分類) 提高分割的準(zhǔn)確度，以使分割可在前景區(qū)域(即，被標(biāo)記為'T，的蒙板像素) 中僅包含文本，并且文檔的所有其他區(qū)域都在背景(即，被標(biāo)記為"0"的蒙板像素)中。20提取單元610從COS單元232提取最初分割或最終分割圖像，并在最初分割或最終分割圖像中提取每個(gè)連接分量。計(jì)算單元620計(jì)算或提取每個(gè)連接分量的特征向量，然后分類單元630根據(jù)特征向量將每個(gè)連接分量的數(shù)據(jù) 分類為文本分量或非文本分量。文本分量仍然被標(biāo)記為'T'，并且非文本分量被改變?yōu)?0",從而根據(jù)分類的數(shù)據(jù)形成圖像分割，并從輸出單元640輸出圖像分割。最初分割可以是分割的塊或從分割的塊形成的分割的圖像的分割?？蓮腃OS單元232輸出最初分割。當(dāng)分割單元230中不包括COS單元 232時(shí)，還可從外部裝置輸出最初分割或最終分割圖像。提取單元610還可從執(zhí)行另一分割算法的另一單元接收最初分割或最終分割圖像。圖7是示出根據(jù)本發(fā)明總體構(gòu)思的實(shí)施例的圖像編碼和/或解碼系統(tǒng)的分割單元的方法的流程圖。參照?qǐng)D6和圖7，在操作710,從最初分割提取連接分量。在操作720, 從各個(gè)塊或各個(gè)區(qū)域(即，背景區(qū)域和前景區(qū)域)的連接分量來計(jì)算特征向量。在操作730,根據(jù)特征向量將連接分量的數(shù)據(jù)分類為文本分量或非文本分量。所述數(shù)據(jù)可以是各個(gè)塊(或最初分割的塊或最初分割的圖像)的各個(gè) 像素的值。在操作740,形成分割輸出，并將該分割輸出輸出到圖2的編碼設(shè)備210的編碼單元240。根據(jù)當(dāng)前實(shí)施例，CCC單元233通過向來自最初分割的每個(gè)連接分量分配特征向量來提高分割的準(zhǔn)確度。與傳統(tǒng)的單獨(dú)基于塊執(zhí)行分割的算法相比，當(dāng)前實(shí)施例的CCC單元233利用連接分量的屬性。因此，以上連接分量分類方法可結(jié)合各種分割算法使用以提高結(jié)果分割的準(zhǔn)確度。根據(jù)當(dāng)前實(shí)施例，CCC單元233的方法提高了在MRC文檔編碼中的文檔分割算法和應(yīng)用的準(zhǔn)確度。還可將連接分量分類方法用于增加適當(dāng)檢測(cè)文本的可能性，并用于減小誤檢測(cè)非文本的可能性。文本的更準(zhǔn)確的分割提高了 MRC編碼文檔的質(zhì)量和壓縮率，從而使得用較少的比特存儲(chǔ)和傳輸較大的文檔。連接分量分類的另一優(yōu)點(diǎn)是可以與其他分割算法一起使用，并/或被應(yīng)用于任何MRC文檔分割算法的結(jié)果。為了執(zhí)行連接分量分類，需要定義N維特征向量。特征向量包含表示連接分量的一個(gè)或多個(gè)屬性的計(jì)算值。特征向量的屬性需要提供足夠信息，以對(duì)連接分量準(zhǔn)確分類。例如，沿每個(gè)連接分量的邊界的邊緣深度的均值和方差是特征向量分量的可能選擇。因?yàn)槲谋痉?hào)通常具有明顯和一致的邊界，所以這些分量有助于識(shí)別文本。一旦對(duì)每個(gè)連接分量計(jì)算了特征向量，則將特征向量分類為文本或非文本，并將相應(yīng)的連接分量標(biāo)記為文本或非文本。特征向量分類方法的優(yōu)點(diǎn)在于，可通過分類器(即，分類的特征向量作為文本和非文本)控制錯(cuò)誤警告概率和正確檢測(cè)概率，所述分類器直接影響結(jié)果MRC編碼的質(zhì)量和壓縮率。圖8是示出圖2和圖6的圖像編碼和/或解碼系統(tǒng)的分割單元的特征向量圖示的示圖。參照?qǐng)D8,圖示中的每一點(diǎn)對(duì)應(yīng)于一組測(cè)試圖像的最初分割中的連接分量。該特征向量可僅包括二維，即，(1)沿每個(gè)連接分量的邊界的邊緣深度的均值，(2)沿每個(gè)連接分量的邊界的邊緣深度的方差。紅色的圖示(示出為灰色區(qū)域)表示文本，藍(lán)色圖示(示出為暗黑色區(qū)域)表示畫面分量。根據(jù)這些圖示(區(qū)域)，特征向量在視覺上是可分離的。圖9是示出原始圖像、在根據(jù)CCC (連接分量分類)的圖2和圖6的圖像編碼和/或解碼系統(tǒng)的分割單元中形成的最初分割和CCC分割。根據(jù)當(dāng)前實(shí)施例，從最初分割僅提取文本區(qū)域(即，黑色)。特征向量可以是10維，并且可通過使用具有高斯混合模型的最大似然(ML)分類將特征向量分類。如上所述，圖像編碼和/或解碼系統(tǒng)根據(jù)代價(jià)最優(yōu)分割和連接分量分類增加分割圖像的壓縮率和準(zhǔn)確度。如上所述，圖像編碼和/或解碼系統(tǒng)可選擇性地使用COS單元或傳統(tǒng)的分割單元，以向CCC單元提供分割圖像。當(dāng)輸入圖像僅包括文本時(shí)，在圖像編碼和/或解碼系統(tǒng)中可以不使用CCC單元。盡管已經(jīng)顯示和描述了本發(fā)明總體構(gòu)思的一些實(shí)施例，但是本領(lǐng)域的技術(shù)人員應(yīng)該理解，在不脫離本發(fā)明總體構(gòu)思的原理和精神的情況下，可對(duì)這些實(shí)施例進(jìn)行修改，本發(fā)明總體構(gòu)思的范圍在權(quán)利要求及其等同物中限定。
權(quán)利要求
1、一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備，包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將圖像的塊分割成前景和背景的二值蒙板層，以產(chǎn)生分割圖像。
2、如權(quán)利要求l所述的設(shè)備，其中，分割單元包括劃分器，將圖像劃分成一個(gè)或多個(gè)塊，所述一個(gè)或多個(gè)塊被彼此相鄰布置，以在第一和第二方向中的至少一個(gè)上4皮此重疊。
3、如權(quán)利要求l所述的設(shè)備，其中，分割單元包括劃分器，將圖像劃分成一個(gè)或多個(gè)塊，并且所述一個(gè)或多個(gè)塊中的每一塊包括在第一和第二方向的至少一個(gè)上與相鄰塊有一個(gè)或多個(gè)重疊區(qū)域的相同像素。
4、如權(quán)利要求1所述的設(shè)備，其中，分割單元包括代價(jià)最優(yōu)分割單元，將各個(gè)塊定義為分割候選，并根據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選，以產(chǎn)生分割的塊，從而形成分割圖像。
5、如權(quán)利要求4所述的設(shè)備，其中，代價(jià)最優(yōu)分割單元包括第一分割單元，根據(jù)塊的分類將各個(gè)塊定義為分割候選；和第二分割單元，才艮據(jù)代價(jià)最優(yōu)函數(shù)修改分割候選。
6、如權(quán)利要求l所述的設(shè)備，其中，代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于圖像的特征和相鄰塊之間的分割的一致性。
7、如權(quán)利要求l所述的設(shè)備，其中，代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于塊的屬性，并且塊的屬性包括沿文本和圖形邊界的分割邊緣、空間平滑分割、被分類為背景層的圖像區(qū)域、被分類為前景層的文本區(qū)域、文本和/或圖形內(nèi)容的準(zhǔn)確表示中的一個(gè)。
8、如權(quán)利要求l所述的設(shè)備，其中，代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于在相鄰塊的重疊區(qū)域中的像素之間的誤匹配的個(gè)數(shù)。
9、如權(quán)利要求l所述的設(shè)備，其中，代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于相鄰塊的重疊區(qū)域中的像素的方差。
10、如權(quán)利要求1所述的設(shè)備，其中，代價(jià)最優(yōu)函數(shù)對(duì)應(yīng)于相鄰塊的恒定性。
11、如權(quán)利要求1所述的設(shè)備，其中，分割單元根據(jù)代價(jià)最優(yōu)函數(shù)修改塊，以控制分割圖像的圖像質(zhì)量和壓縮率。
12、如權(quán)利要求l所述的設(shè)備，其中，分割單元包括連接分量分類單元，根據(jù)最初分割圖像的特征向量修改圖像的塊的最初分割圖像，以產(chǎn)生分割圖像。
13、如權(quán)利要求12所述的設(shè)備，其中，連接分量分類單元提取相鄰塊的連接分量，并根據(jù)連接分量計(jì)算各個(gè)塊的特征向量。
14、如權(quán)利要求13所述的設(shè)備，其中，特征向量分類單元根據(jù)特征向量對(duì)圖像的塊的像素?cái)?shù)據(jù)進(jìn)行分類，以修改塊的像素?cái)?shù)據(jù)，從而根據(jù)修改的像素?cái)?shù)據(jù)產(chǎn)生分割圖像。
15、如權(quán)利要求14所述的設(shè)備，其中，特征向量分類單元將特征向量與參考向量進(jìn)行比較，以修改圖像的塊的像素?cái)?shù)據(jù)。
16、如權(quán)利要求12所述的設(shè)備，其中，特征向量分類單元根據(jù)最初分割圖像的相鄰區(qū)域的特征向量將最初分割圖像的區(qū)域分類為文本區(qū)域和非文本區(qū)域，其中，最初分割圖像是根據(jù)代價(jià)最優(yōu)函數(shù)而被分割的。
17、如權(quán)利要求1所述的設(shè)備，其中，特征向量包括文本符號(hào)向量和非文本符號(hào)向量。
18、如權(quán)利要求1所述的設(shè)備，其中，分割單元還根據(jù)特征向量修改根據(jù)代價(jià)最優(yōu)函數(shù)而分割的各個(gè)塊，以根據(jù)修改的塊輸出分割圖像。
19、如權(quán)利要求l所述的設(shè)備，其中，分割單元根據(jù)特征向量修改塊，以控制分割圖像的錯(cuò)誤警告概率和正確檢測(cè)概率。
20、如權(quán)利要求1所述的設(shè)備，還包括掃描單元，掃描文檔，以產(chǎn)生與圖像相應(yīng)的信號(hào)。
21、如權(quán)利要求l所述的設(shè)備，還包括打印單元，打印與分割圖^象相應(yīng)的信號(hào)。
22、一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備，包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。
23、一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備，包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。
24、一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備，包括解碼單元，對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割圖像編碼的圖像信號(hào)解碼，以產(chǎn)生解碼的圖像。
25、如權(quán)利要求24所述的設(shè)備，還包括打印單元，在一張紙上打印解碼的圖像。
26、一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備，包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像；和解碼單元，對(duì)與根據(jù)代價(jià)函數(shù)和圖像的塊的特征向量形成的分割圖像相應(yīng)的信號(hào)解碼，以產(chǎn)生解碼的圖像。
27、如權(quán)利要求26所述的設(shè)備，還包括打印單元，在打印介質(zhì)上打印解碼的圖像。
28、如權(quán)利要求26所述的設(shè)備，還包括掃描單元，掃描文檔，以產(chǎn)生與圖像相應(yīng)的信號(hào)。
29、一種圖^J扁碼和解碼系統(tǒng)的方法，包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。
30、一種圖像編碼和解碼系統(tǒng)的方法，包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像作為最終二值蒙板層。
31、一種圖像編碼和解碼系統(tǒng)的方法，包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像作為最終二值蒙板層。
32、一種圖^J扁碼和解碼系統(tǒng)的方法，包括對(duì)從根據(jù)代價(jià)函數(shù)和從圖像劃分的塊的特征向量的分割圖像編碼的圖像信號(hào)解碼，以產(chǎn)生解碼的圖像；和在一張紙上打印解碼的圖像。
33、一種圖像編碼和解碼系統(tǒng)的方法，包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像；和對(duì)與根據(jù)代價(jià)函數(shù)和從圖像劃分的塊的特征向量的分割的塊的分割圖像相應(yīng)的信號(hào)解碼，以產(chǎn)生解碼的圖像。
34、一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖^象編碼和解碼系統(tǒng)的方法的程序的計(jì)算^L可讀記錄介質(zhì)，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。
35、一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算^/L可讀記錄介質(zhì)，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù)將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。
36、一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn) 生分割圖像。
37、一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)，所述方法包括對(duì)從根據(jù)代價(jià)函數(shù)和特征向量的分割的塊的分割圖像編碼的圖像信號(hào)解碼，以產(chǎn)生解碼的圖像；和在一張紙上打印解碼的圖像。
38、一種包含計(jì)算機(jī)可讀代碼作為用于執(zhí)行圖像編碼和解碼系統(tǒng)的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)，所述方法包括將圖像劃分成一個(gè)或多個(gè)塊；根據(jù)代價(jià)最優(yōu)函數(shù)和各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像；對(duì)與根據(jù)代價(jià)函數(shù)和特征向量的分割的塊形成的分割圖像相應(yīng)的信號(hào)解碼，以產(chǎn)生解碼的圖^^。
39、一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備，包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，才艮據(jù)相鄰塊的誤匹配個(gè)數(shù)將塊的相鄰像素?cái)?shù)據(jù)分割成前景和背景的二值蒙板層，并對(duì)塊的像素?cái)?shù)據(jù)進(jìn)行調(diào) 整，以根據(jù)分割的塊產(chǎn)生分割圖像。
40、一種圖像編碼和解碼系統(tǒng)中使用的設(shè)備，包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)各個(gè)塊的特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。
全文摘要
提供了一種分割圖像和/或接收表示分割的圖像的信號(hào)的設(shè)備和方法。一種在圖像編碼和解碼系統(tǒng)中使用的設(shè)備，所述設(shè)備包括分割單元，將圖像劃分成一個(gè)或多個(gè)塊，并根據(jù)代價(jià)最優(yōu)函數(shù)和特征向量將塊分割成前景和背景的二值蒙板層，以根據(jù)分割的塊產(chǎn)生分割圖像。
文檔編號(hào)G06K9/20GK101231698SQ20081000875
公開日2008年7月30日申請(qǐng)日期2008年1月23日優(yōu)先權(quán)日2007年1月24日
發(fā)明者李鐘賢, 查爾斯·A·鮑曼, 根田惠里, 玉炯洙申請(qǐng)人:三星電子株式會(huì)社;波爾多研究基金會(huì)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：玉炯洙;李鐘賢;查爾斯.A.鮑曼;根田惠里
技術(shù)所有人：三星電子株式會(huì)社;波爾多研究基金會(huì)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像分割相關(guān)技術(shù)

圖像分割算法相關(guān)技術(shù)

彩色圖像分割相關(guān)技術(shù)

圖像分割方法相關(guān)技術(shù)

opencv圖像分割相關(guān)技術(shù)

opencv圖像分割算法相關(guān)技術(shù)

醫(yī)學(xué)圖像分割相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

分割圖像和/或接收表示分割的圖像的信號(hào)的設(shè)備和方法