專利名稱:下劃線刪除裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及業(yè)務(wù)文件處理裝置,例如涉及用于刪除與業(yè)務(wù)文件中的字符串接觸的 下劃線的技術(shù)。
背景技術(shù):
近年來,對(duì)于在機(jī)關(guān)內(nèi)積累的大量的紙質(zhì)業(yè)務(wù)文件,通過掃描以及OCR進(jìn)行字符 識(shí)別,通過文件管理系統(tǒng)管理文件數(shù)據(jù),由此來實(shí)現(xiàn)檢索性的提高、紙質(zhì)文件的安全保管、 以及知識(shí)的共享。目前的OCR針對(duì)沒有噪音(noise)的文件的字符串識(shí)別精度高,但是在與字符串 接觸地畫出下劃線時(shí),存在很多時(shí)候無法正確識(shí)別該部分的字符的問題。OCR在進(jìn)行字符 識(shí)別時(shí),進(jìn)行將字符一個(gè)一個(gè)地剪切,然后判定剪切出的字符相當(dāng)于哪個(gè)字符的處理,但是 在對(duì)字符附加了下劃線時(shí),很多時(shí)候字符的剪切失敗,或者將下劃線識(shí)別為字符的一部分 而進(jìn)行了錯(cuò)誤的判斷。當(dāng)進(jìn)行誤識(shí)別時(shí),并不僅是無法取得該部分的字符信息,并且沒有意 義的字符信息作為噪音殘留下來,成為檢索時(shí)的障礙。此外,在存在于業(yè)務(wù)文件中的字符串 中,畫出下劃線的字符串多是文件的標(biāo)題、客戶名稱、各種管理編號(hào)等在確定該文件方面不 可欠缺的信息。因此,當(dāng)無法正確識(shí)別這些信息時(shí),在檢索時(shí)無法縮小該文件的檢索范圍, 此時(shí),產(chǎn)生檢查全部登錄的文件數(shù)據(jù)的負(fù)擔(dān)。因此,在應(yīng)用OCR時(shí),在下劃線與字符串接觸 時(shí)也需要高精度對(duì)該字符串進(jìn)行字符識(shí)別。在對(duì)字符串畫出下劃線時(shí),作為提高OCR的識(shí)別精度的方法,提出了從文件中的 畫有下劃線的字符串中提取并刪除下劃線的方法。例如,在非專利文獻(xiàn)1中提出了刪除對(duì) 于表格圖像上存在的字符串畫出的下劃線的技術(shù)。此外,在非專利文獻(xiàn)2中提出了將與字 符串接觸的下劃線也作為刪除對(duì)象的技術(shù)。但是,非專利文獻(xiàn)1的技術(shù)是假設(shè)下劃線沒有與字符串接觸的情況的技術(shù)。因此, 在下劃線與字符串接觸時(shí)無法刪除下劃線。此外,非專利文獻(xiàn)2的技術(shù)假設(shè)僅包含字符和 下劃線的文件。因此,在應(yīng)用于業(yè)務(wù)文件那樣的大多包含表的文件時(shí),可能產(chǎn)生將構(gòu)成表的 表格線刪除的弊端。專利文獻(xiàn)1特開2002-358482號(hào)公報(bào)非專利文獻(xiàn)1嶋好博、他3名,“帳票畫像6O下線抽出O —手法”, FIT2002 (科學(xué)技術(shù) 7 才一,A ),1-85, pp. 169-170,2002. 09與巨專禾lj文■ 2Zhen_long Bai, Qiang Huo, "Underline Detection andRemoval in a Document Image Using Multiple Strategies,,,icpr, pp. 578-581, 17thInternational Conference on Pattern Recognition(ICPR' 04)-Volume 2,200
發(fā)明內(nèi)容
本發(fā)明是鑒于上述情況而提出的,其目的在于提供一種即使在業(yè)務(wù)文件內(nèi)包含 表,或者下劃線與字符串接觸的情況下,也能夠刪除下劃線的技術(shù)。
3
為了解決上述課題,本發(fā)明的下劃線刪除裝置大致進(jìn)行以下兩個(gè)處理。在第一處理中,從二值圖像數(shù)據(jù)中提取下劃線區(qū)域的下劃線位置坐標(biāo)。該下劃線 位置坐標(biāo),是按每個(gè)預(yù)定長(zhǎng)度提取具有某寬度和長(zhǎng)度的下劃線區(qū)域中包含的坐標(biāo)而得到的 坐標(biāo),用于決定下劃線區(qū)域的框架。具體地說,在二值圖像數(shù)據(jù)上設(shè)置具有一定面積的長(zhǎng)方 形的線樣板(line template),通過在該線樣板內(nèi)追蹤(trace)滿足預(yù)定值的像素,來對(duì)每 個(gè)線樣板提取下劃線位置坐標(biāo)。在第二處理中,刪除通過求出下劃線區(qū)域和背景的邊界坐標(biāo)、以及下劃線區(qū)域和 字符串的邊界坐標(biāo)來確定的下劃線區(qū)域。具體地說,沿著連結(jié)提取出的下劃線位置坐標(biāo)而 得到的折線(polyline),在相對(duì)于折線垂直方向上進(jìn)行像素探索,由此求出邊界坐標(biāo)。詳細(xì) 地說,當(dāng)在預(yù)定范圍中不存在滿足預(yù)定像素?cái)?shù)量的像素時(shí),判定為下劃線區(qū)域和背景的邊 界,求出邊界坐標(biāo)。另一方面,當(dāng)超過預(yù)定范圍存在滿足預(yù)定像素?cái)?shù)量的像素時(shí),判定為字 符串與下劃線區(qū)域接觸,對(duì)邊界坐標(biāo)進(jìn)行插補(bǔ)。從二值圖像數(shù)據(jù)中刪除通過求出的邊界坐 標(biāo)而確定的下劃線區(qū)域。具體地說,通過背景像素置換由求出的邊界坐標(biāo)包圍的下劃線區(qū) 域。S卩,本發(fā)明的下劃線刪除裝置,是從包含與字符串接觸的下劃線區(qū)域的二值圖像 數(shù)據(jù)中刪除所述下劃線區(qū)域的下劃線刪除裝置,其特征為具有下劃線探索處理部,其以所 述二值圖像數(shù)據(jù)上的一點(diǎn)為起點(diǎn)設(shè)置長(zhǎng)方形的線樣板,通過追蹤該線樣板中包含的像素, 進(jìn)行提取表示下劃線位置坐標(biāo)的折線的線樣板匹配處理;以及下劃線刪除部,其進(jìn)行根據(jù) 所述折線求出所述下劃線區(qū)域和背景區(qū)域的背景邊界坐標(biāo)、以及對(duì)所述下劃線區(qū)域中的與 所述字符串接觸的部分進(jìn)行插補(bǔ)處理而得到的所述下劃線區(qū)域和所述字符串的字符邊界 坐標(biāo)的處理,并進(jìn)行通過所述背景區(qū)域的像素的顏色置換由所述背景邊界坐標(biāo)以及字符邊 界坐標(biāo)包圍的區(qū)域的處理。根據(jù)以下的本發(fā)明的最佳實(shí)施方式以及附圖,本發(fā)明的其他的特征將會(huì)變得清
林 疋。根據(jù)本發(fā)明,能夠從包含與字符串接觸的下劃線區(qū)域的二值圖像數(shù)據(jù)中刪除該下 劃線。由此,針對(duì)文件內(nèi)的字符的OCR精度提高,業(yè)務(wù)文件的檢索性提高。
圖1是概要地表示本發(fā)明的實(shí)施方式的業(yè)務(wù)文件處理裝置的結(jié)構(gòu)的功能框圖。圖2表示在圖1所示的存儲(chǔ)裝置內(nèi)存儲(chǔ)的掃描圖像數(shù)據(jù)的例子。圖3表示在圖1所示的數(shù)據(jù)存儲(chǔ)器內(nèi)存儲(chǔ)的二值圖像數(shù)據(jù)的例子。圖4表示對(duì)于圖3所示的二值圖像數(shù)據(jù)應(yīng)用了 OCR的結(jié)果的例子。圖5表示對(duì)于圖3所示的二值圖像數(shù)據(jù)應(yīng)用了本發(fā)明的結(jié)果的例子。圖6是用于說明下劃線刪除程序中的預(yù)處理部的流程圖。圖7是用于說明下劃線刪除程序中的下劃線探索處理部的流程圖。圖8是用于說明下劃線探索處理部中的線樣板匹配處理的流程圖。圖9是用于說明下劃線刪除程序中的下劃線刪除處理部的流程圖。圖10A是下劃線探索處理部中的下劃線推定處理的說明圖。圖10B是下劃線探索處理部中的下劃線推定處理的說明圖。
圖11是下劃線探索處理部中的線樣板匹配處理的說明圖。圖12A是下劃線探索處理部中的線樣板匹配處理的說明圖。圖12B是下劃線探索處理部中的線樣板匹配處理的說明圖。圖12C是下劃線探索處理部中的線樣板匹配處理的說明圖。圖12D是下劃線探索處理部中的線樣板匹配處理的說明圖。圖12E是下劃線探索處理部中的線樣板匹配處理的說明圖。圖12F是下劃線探索處理部中的線樣板匹配處理的說明圖。圖12G是下劃線探索處理部中的線樣板匹配處理的說明圖。圖13是下劃線探索處理部中的探索開始點(diǎn)的跳過處理的說明圖。圖14是下劃線刪除處理部中的處理的說明圖。圖15表示下劃線刪除處理的結(jié)果的確認(rèn)畫面的例子。符號(hào)說明10中央處理裝置、20數(shù)據(jù)存儲(chǔ)器、21 二值圖像數(shù)據(jù)、22下劃線位置數(shù)據(jù)、30輸入輸 出裝置、31鍵盤、32顯示裝置、33指點(diǎn)設(shè)備、34掃描儀、40下劃線刪除處理程序、41畫面顯 示處理部、42預(yù)處理部、43下劃線探索處理部、44下劃線刪除處理部、50存儲(chǔ)裝置、51掃描 圖像數(shù)據(jù)、52下劃線刪除圖像數(shù)據(jù)
具體實(shí)施例方式以下參照附圖,詳細(xì)說明用于實(shí)施本發(fā)明的下劃線刪除裝置的最佳實(shí)施方式。圖 1 圖15舉例表示了本發(fā)明的實(shí)施方式。在這些圖中,附加了相同符號(hào)的部分表示同一物, 基本的結(jié)構(gòu)以及動(dòng)作相同。此外,應(yīng)該注意的是本實(shí)施方式僅是用于實(shí)現(xiàn)本發(fā)明的一個(gè)例 子,并不限定本發(fā)明的技術(shù)的范圍。(下劃線刪除裝置的結(jié)構(gòu))圖1是表示本發(fā)明實(shí)施方式的下劃線刪除裝置的概要結(jié)構(gòu)的功能框圖。該下劃線 刪除裝置具備進(jìn)行所需要的運(yùn)算處理以及控制處理等的中央處理裝置10、存儲(chǔ)中央處理 裝置10的處理中所需要的數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)器20、用于進(jìn)行數(shù)據(jù)的輸入輸出的輸入輸出裝 置30、存儲(chǔ)中央處理裝置10的處理所需要的程序的程序存儲(chǔ)器40、存儲(chǔ)成為中央處理裝置 10的處理對(duì)象的數(shù)據(jù)或處理后的數(shù)據(jù)的存儲(chǔ)裝置50。數(shù)據(jù)存儲(chǔ)器20具備從掃描圖像數(shù)據(jù)通過二值化而得到的二值圖像數(shù)據(jù)21、以及 存儲(chǔ)從二值圖像數(shù)據(jù)中探索下劃線而得到的下劃線位置的下劃線位置數(shù)據(jù)22。輸入輸出裝置30具備由用于顯示數(shù)據(jù)的顯示裝置32、打印機(jī)(未圖示)等構(gòu)成 的輸出部;以及由用于對(duì)于顯示的數(shù)據(jù)進(jìn)行選擇菜單等操作的鍵盤31、鼠標(biāo)等指點(diǎn)設(shè)備33 或用于取得文件的掃描儀34等構(gòu)成的輸入部。程序存儲(chǔ)器40具備作為接受畫面顯示或用戶的輸入操作的接口的畫面顯示處 理部41、進(jìn)行針對(duì)掃描圖像的預(yù)處理(從彩色圖像向黑白圖像的轉(zhuǎn)換,噪音消除等)的預(yù)處 理部42、從文件內(nèi)探索下劃線并取得下劃線的位置的下劃線探索處理部43、刪除提取出的 下劃線的下劃線刪除處理部44。各個(gè)處理部作為程序代碼而存儲(chǔ)在程序存儲(chǔ)器40中,由中 央處理裝置10執(zhí)行各個(gè)程序代碼來實(shí)現(xiàn)各處理部。存儲(chǔ)裝置50具備掃描圖像數(shù)據(jù)51和下劃線刪除圖像數(shù)據(jù)52,所述掃描圖像數(shù)
5據(jù)51是從掃描儀等取得的業(yè)務(wù)文件的掃描圖像,所述下劃線刪除圖像數(shù)據(jù)52是根據(jù)該掃 描圖像執(zhí)行各種處理,刪除了字符串上的下劃線的圖像。圖2表示存儲(chǔ)裝置50中包含的掃描圖像數(shù)據(jù)51的例子。在文件內(nèi)包含與字符接 觸的下劃線、記載有物件名稱和數(shù)量等的表、以及表內(nèi)的收訖章等。圖3表示數(shù)據(jù)存儲(chǔ)器20中包含的二值圖像數(shù)據(jù)21的例子。該數(shù)據(jù)是對(duì)掃描圖像 數(shù)據(jù)51進(jìn)行了印記的消除以及亮度的二值化后所得到的圖像數(shù)據(jù)。在圖像上部的由虛線 包圍的區(qū)域中存在附加了下劃線的字符串。圖4是表示對(duì)圖3的二值圖像數(shù)據(jù)21直接應(yīng)用OCR,進(jìn)行字符識(shí)別的結(jié)果的圖像。 在圖3的二值圖像數(shù)據(jù)21中,恰當(dāng)?shù)刈R(shí)別了圖像上部的沒有下劃線的字符串和圖像下部的 表格線以及表內(nèi)部。另一方面,錯(cuò)誤地識(shí)別了圖3的由虛線包圍的區(qū)域中存在的帶有下劃 線的字符串。圖5表示對(duì)圖3的二值圖像數(shù)據(jù)21應(yīng)用了本發(fā)明的下劃線刪除裝置,從而刪除了 與字符串接觸的下劃線的下劃線刪除圖像數(shù)據(jù)52的例子。將該圖像數(shù)據(jù)存儲(chǔ)在存儲(chǔ)裝置 50中。(下劃線刪除裝置中的處理)接下來,說明在具有上述結(jié)構(gòu)的下劃線刪除裝置中進(jìn)行的處理。首先,中央處理裝 置10通過畫面顯示處理部41顯示由掃描儀34輸入的掃描圖像數(shù)據(jù)51。然后,當(dāng)接收到 執(zhí)行處理的命令時(shí),按順序執(zhí)行預(yù)處理部42、下劃線探索處理部43、下劃線刪除處理部44。 在預(yù)處理部42中,進(jìn)行圖像上存在的印記等噪音的消除、向二值圖像的轉(zhuǎn)換處理。把此時(shí) 生成的二值圖像作為二值圖像數(shù)據(jù)21存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器20中。在下劃線探索處理部43 中,從二值圖像數(shù)據(jù)21中探索對(duì)字符串附加的下劃線,將下劃線的坐標(biāo)數(shù)據(jù)作為下劃線位 置數(shù)據(jù)22存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器20中。在下劃線刪除處理部44中,根據(jù)下劃線位置數(shù)據(jù)22, 從二值圖像數(shù)據(jù)21中刪除下劃線。然后,將刪除下劃線后的圖像數(shù)據(jù)作為下劃線刪除圖像 數(shù)據(jù)52,存儲(chǔ)在存儲(chǔ)裝置50中。關(guān)于各個(gè)處理,以下進(jìn)行詳細(xì)的說明。(預(yù)處理)圖6是表示預(yù)處理的概要的流程圖。在預(yù)處理中,作為下劃線探索處理的預(yù)處理, 對(duì)圖2所示的掃描圖像進(jìn)行二值化處理。在此的動(dòng)作主體是預(yù)處理部42。在步驟S601中,讀入掃描業(yè)務(wù)文件而得到的掃描圖像數(shù)據(jù)。在步驟S602中,為了除去文件中存在的公章或職務(wù)章等的印記,進(jìn)行顏色丟棄 (color drop-out)處理。顏色丟棄處理,是指從使用掃描儀讀取表格等文件所得到的圖像 中,利用顏色信息的特征除去記入的字符、印記、標(biāo)記等特定對(duì)象的技術(shù)(例如,參照專利 文獻(xiàn)1)。根據(jù)該技術(shù),可以除去在從文件內(nèi)進(jìn)行OCR讀取時(shí)成為噪音的對(duì)象。在步驟S603中進(jìn)行二值化處理,將顏色丟棄后的圖像轉(zhuǎn)換為黑白二值的圖像。在 決定二值化的閾值時(shí),可以使用各種公知的技術(shù)。例如,判別分析法,是在通過某個(gè)值ft將 整個(gè)圖像的亮度的直方圖(histogram)劃分為兩個(gè)種類(級(jí))時(shí),把級(jí)間方差+ (種類1的 級(jí)內(nèi)方差+種類2的級(jí)內(nèi)方差)的計(jì)算結(jié)果達(dá)到最大時(shí)的ft決定為閾值的方法。一般的 業(yè)務(wù)文件,因?yàn)樵诎咨谋尘吧贤ㄟ^黑色的字符進(jìn)行記載,所以可以容易地決定二值化時(shí) 的閾值。把二值化處理后生成的圖像數(shù)據(jù)作為二值圖像數(shù)據(jù)21存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器20中。(下劃線探索處理)
圖7是表示下劃線探索處理的概要的流程圖。在下劃線探索處理中,從圖3所示 的二值圖像數(shù)據(jù)21中探索下劃線,輸出下劃線的位置坐標(biāo)。在此的動(dòng)作主體為下劃線探索 處理部43。在步驟S701中,從數(shù)據(jù)存儲(chǔ)器20讀取二值圖像數(shù)據(jù)21,進(jìn)行下劃線位置推定。圖 10A以及B是下劃線位置推定處理的說明圖。首先,根據(jù)作為對(duì)象的文件,決定探索對(duì)象區(qū)域。探索對(duì)象區(qū)域是指在后述的線樣 板匹配處理(步驟S702中)中成為處理對(duì)象的區(qū)域。通過縮小處理對(duì)象的范圍,處理速度 提高。例如,營(yíng)業(yè)憑證大多對(duì)標(biāo)題、顧客名稱、訂貨編號(hào)等重要信息畫出了下劃線,此外大多 記載在文件的上部。因此。在圖10A所示的例子中,將文件的上部作為探索對(duì)象區(qū)域。然后,更詳細(xì)地推定下劃線位置。具體地說,如圖10B所示,求出在二值圖像數(shù)據(jù) 21上的探索對(duì)象區(qū)域內(nèi)的各Y坐標(biāo)的黑像素(表示字符、表格線、下劃線的像素)的像素 數(shù)量,把像素?cái)?shù)量達(dá)到閾值以上的Y坐標(biāo)上的區(qū)域推定為存在下劃線的區(qū)域(詳細(xì)探索區(qū) 域)。在以后的處理中,僅對(duì)詳細(xì)探索區(qū)域探索下劃線的位置。由此,可以省去無用的處理。在步驟S702中,進(jìn)行線樣板匹配處理。在此,從二值圖像數(shù)據(jù)中提取下劃線區(qū)域 的下劃線位置坐標(biāo)。該下劃線位置坐標(biāo),是按照每個(gè)預(yù)定長(zhǎng)度,提取具有某寬度和長(zhǎng)度的下 劃線區(qū)域中包含的坐標(biāo)而得到的坐標(biāo),用于決定下劃線區(qū)域的框架。具體地說,在二值圖像 數(shù)據(jù)上設(shè)置具有一定面積的長(zhǎng)方形的線樣板,通過在該線樣板內(nèi)追蹤滿足預(yù)定值的像素, 對(duì)于每個(gè)線樣板提取表示下劃線位置坐標(biāo)的折線。由此確定下劃線的位置坐標(biāo)。將在后面 詳細(xì)說明本處理。在步驟703中,在線樣板匹配結(jié)束后,檢查提取出的折線的長(zhǎng)度(圖12G)。這是為 了從長(zhǎng)度的觀點(diǎn)來判定提取出的折線是否為下劃線。如果比預(yù)先規(guī)定的閾值短,則提取出 的折線不是下劃線,考慮是“土”或“上”等字符的一部分。此時(shí),從下劃線位置數(shù)據(jù)中刪除 該折線。在步驟S704中,在長(zhǎng)度的檢查后,進(jìn)一步檢查折線是否為構(gòu)成表的一部分的表格 線(圖12G)。這是為了防止錯(cuò)誤地將表的表格線刪除。在表中,在線段的兩端或者一端存 在構(gòu)成表的縱向延伸的表格線,但是在對(duì)字符附加的下劃線中不存在這樣的縱線,所以利 用該特征將表與下劃線相區(qū)別。具體地說,在折線的兩端點(diǎn),檢測(cè)相對(duì)于線段方向垂直的方 向的像素。如果是構(gòu)成表的一部分的表格線,則認(rèn)為至少存在一條在端點(diǎn)沿縱向延伸的表 格線。由此,在折線的兩端的垂直方向上進(jìn)行一定像素的檢查,如果存在一定以上的黑像素 的方向至少具有一個(gè),則將該折線判定為構(gòu)成表的表格線的一部分,從下劃線位置數(shù)據(jù)中 刪除該折線。在步驟S705中,把在長(zhǎng)度檢查處理(步驟S703)、表檢查處理(步驟S704)的任何 一個(gè)處理中都沒有被刪除而剩余的折線作為最終的下劃線位置數(shù)據(jù),記錄在數(shù)據(jù)存儲(chǔ)器20 中。(線樣板匹配處理)說明在步驟702中進(jìn)行的、用于確定下劃線的位置坐標(biāo)的線樣板匹配處理。圖 11 圖13是線樣板匹配的說明圖。此外,圖8是下劃線探索處理中的線樣板匹配處理的流 程圖。以下,按照該流程圖進(jìn)行詳細(xì)的說明。在步驟S801中,在步驟S701中決定的詳細(xì)探索區(qū)域中設(shè)定探索開始點(diǎn)。具體地
7說,如圖11(a)那樣,將探索對(duì)象區(qū)域劃分為格狀,在其中把詳細(xì)探索區(qū)域內(nèi)的格點(diǎn)作為探 索開始點(diǎn)。此時(shí),關(guān)于格點(diǎn),X坐標(biāo)間隔變寬,Y坐標(biāo)間隔變窄。這是因?yàn)橄聞澗€在X軸方向 上延伸。以下,以各探索開始點(diǎn)作為起點(diǎn),進(jìn)行線樣板匹配。在步驟S802中,把從探索開始點(diǎn)中選擇的未處理的坐標(biāo)之一設(shè)定為起點(diǎn)。以下, 從起點(diǎn)開始追蹤構(gòu)成下劃線的黑像素,求出表示下劃線位置的折線(以連續(xù)的線段構(gòu)成的 對(duì)象)。然后,對(duì)于各探索開始點(diǎn)進(jìn)行該一連串的處理。在步驟S803中,首先從在步驟S802中設(shè)定的起點(diǎn)開始,在X軸的正或者負(fù)方向上 設(shè)置線樣本。圖11(b)表示線樣本。線樣本是在X軸方向上較長(zhǎng)的長(zhǎng)方形的對(duì)象。然后, 追蹤線樣本內(nèi)的黑像素?!吀淖兘嵌纫贿呥M(jìn)行線樣本的設(shè)置。具體地說,以探索開始點(diǎn)為旋轉(zhuǎn)中心,朝向 包含最多的黑像素的方向設(shè)置線樣本。如此,通過一邊改變角度一邊進(jìn)行追蹤,即使在掃描 時(shí)文件傾斜的情況下,也能夠穩(wěn)定地追蹤下劃線部分。關(guān)于追蹤,線樣本內(nèi)的黑像素越多視為匹配度越高,向匹配度最高的方向進(jìn)行追 蹤。如此,因?yàn)楦鶕?jù)線樣本內(nèi)的黑像素?cái)?shù)量判定匹配度,所以即使在下劃線中具有凹凸的情 況下,也能夠穩(wěn)健地探索下劃線的位置。圖12B表示對(duì)于圖12A的帶有下劃線的字符串進(jìn)行線樣本匹配的情形(為了說明 方便,簡(jiǎn)單地用輪廓線表示)。在圖12B中,從探索開始點(diǎn)開始,在X軸的正方向上設(shè)置了線 樣本。此外,將線樣本的角度設(shè)置為匹配度最高的方向,即向右上傾斜的方向。在步驟S804中,判定是否存在匹配度成為閾值以上的方向。即,與判定下劃線區(qū) 域是否連續(xù)為相同的意義。當(dāng)存在匹配度成為閾值以上的方向時(shí),進(jìn)入步驟S805。在不存 在閾值以上的方向時(shí),進(jìn)入步驟S808。閾值是預(yù)先決定的常數(shù)。如圖12B所示,當(dāng)存在匹配 度成為閾值以上的向右上傾斜的方向時(shí),進(jìn)入步驟S805。在步驟S805中,當(dāng)在步驟S804的判定中存在匹配度成為閾值以上的方向時(shí),即下 劃線區(qū)域連續(xù)時(shí),判定是否需要修正線樣本的終點(diǎn)。所謂需要修正終點(diǎn)的情況,是指如圖 12C那樣,下劃線區(qū)域雖然連續(xù),但線樣本越過下劃線區(qū)域到達(dá)了背景區(qū)域的情況。在步驟S806中,當(dāng)在步驟S805的判定中需要進(jìn)行修正時(shí),從最初的線樣本的終點(diǎn) (暫定終點(diǎn)),將終點(diǎn)修正到下劃線區(qū)域和背景區(qū)域的邊界上。通過進(jìn)行該處理,可以正確 地提取表示下劃線位置的折線。在圖12C中,從成為暫定終點(diǎn)的線樣本的最端部開始,向成 為修正終點(diǎn)的下劃線區(qū)域和背景區(qū)域的邊界修正線樣本的終點(diǎn)。另一方面,在不需要修正 終點(diǎn)的位置時(shí),不改變終點(diǎn)的位置地前進(jìn)到步驟S807。在步驟S807中,把終點(diǎn)的坐標(biāo)設(shè)為新的起點(diǎn),更新探索時(shí)的起點(diǎn)。然后,再次進(jìn)行 從步驟S803開始的循環(huán),繼續(xù)進(jìn)行下劃線的追蹤。在步驟S804中判斷為不存在匹配度成 為閾值以上的方向之前(在下劃線的末端之前),繼續(xù)進(jìn)行追蹤。在圖12D中,以圖12C的 修正終點(diǎn)為新的起點(diǎn),再次設(shè)置線樣本,繼續(xù)進(jìn)行追蹤。此外,在圖12E中,在匹配度成為閾 值以上的方向消失的下劃線區(qū)域的末端之前,繼續(xù)進(jìn)行追蹤。在步驟S808中,當(dāng)在步驟S804中判定為不存在匹配度成為閾值以上的方向時(shí),即 直到下劃線區(qū)域的末端為止已經(jīng)進(jìn)行了追蹤時(shí),判定是否以在步驟S802中設(shè)定的探索開 始點(diǎn)為起點(diǎn),在向X軸正方向的追蹤和向負(fù)方向的追蹤的兩個(gè)方向上進(jìn)行了探索。在步驟S809中,當(dāng)在步驟S808中判定為僅在單向上進(jìn)行了追蹤時(shí),從在步驟S802中設(shè)定的起點(diǎn)開始,向著與步驟S803相反的方向進(jìn)行追蹤。在圖12F中,以探索開始點(diǎn)為 起點(diǎn),向X的軸負(fù)方向再次設(shè)置線樣本,向負(fù)方向繼續(xù)進(jìn)行追蹤。在步驟S810中,當(dāng)在步驟S808中判定為已經(jīng)對(duì)兩方向進(jìn)行了追蹤時(shí),在下劃線位 置數(shù)據(jù)22中記錄構(gòu)成表示提取出的下劃線位置的折線的坐標(biāo)值。在步驟S811中,在設(shè)定用于提取新的下劃線的探索開始點(diǎn)之前,設(shè)定跳過的探索 開始點(diǎn)(不需要追蹤的探索開始點(diǎn))。圖13是該處理的說明圖。作為從當(dāng)前時(shí)刻的探索 開始點(diǎn)A開始對(duì)下劃線進(jìn)行追蹤的結(jié)果,直到探索開始點(diǎn)B、C附近為止,追蹤完成。如圖 11(a)所示,在相同的Y坐標(biāo)上,沿著X軸方向空開一定間隔地存在探索開始點(diǎn),所以在從探 索開始點(diǎn)A開始下劃線的追蹤結(jié)束時(shí),不需要從探索開始點(diǎn)B以及C開始對(duì)下劃線進(jìn)行追 蹤。此時(shí),具有與當(dāng)前時(shí)刻的探索開始點(diǎn)A相同的Y坐標(biāo),把追蹤重復(fù)的范圍中包含的探索 開始點(diǎn)設(shè)定為跳過的探索開始點(diǎn)。由此,可以實(shí)現(xiàn)處理的高效化以及高速化。在步驟S812中,如果存在未處理的探索開始點(diǎn),則返回步驟S802,如果不存在,則 結(jié)束線樣本匹配處理。通過以上的線樣本匹配處理,作為對(duì)詳細(xì)探索區(qū)域內(nèi)的各探索開始點(diǎn)進(jìn)行下劃線 追蹤的結(jié)果,向數(shù)據(jù)存儲(chǔ)器20記錄表示提取出的下劃線位置的折線的坐標(biāo)。(下劃線刪除處理)圖9是表示下劃線刪除處理的概要的流程圖。此外,圖14是下劃線刪除處理的說 明圖。在下劃線刪除處理中,根據(jù)在下劃線探索處理中提取出的下劃線位置數(shù)據(jù),從二值 圖像數(shù)據(jù)中刪除下劃線。在此的動(dòng)作主體為下劃線刪除處理部44。在步驟S901中,如圖 14(a)所示,在二值圖像數(shù)據(jù)中,從下劃線位置數(shù)據(jù)中的折線上的Y坐標(biāo)開始探索Y軸方向, 求出下劃線(黑像素)和背景(白像素)的邊界坐標(biāo)。此時(shí),在一定以上的黑像素在Y軸 方向上連續(xù)時(shí),認(rèn)為該區(qū)域是與字符的接觸部分,所以不取得該部分的Y坐標(biāo)。對(duì)于折線上 的全部的X坐標(biāo)進(jìn)行該處理,取得邊界坐標(biāo)。在步驟S902中,在下劃線和字符的接觸部分,進(jìn)行對(duì)下劃線和字符的邊界坐標(biāo)進(jìn) 行插補(bǔ)的處理。具體地說,取得接觸部分的兩端點(diǎn)的坐標(biāo)的加權(quán)平均。圖14(b)是其說 明圖。在將左側(cè)的端點(diǎn)設(shè)為1\(&,\),將右側(cè)的端點(diǎn)設(shè)為PK(XK,YK),將進(jìn)行插補(bǔ)的點(diǎn)設(shè)為 P (XM, Ym)時(shí),通過式(1)求出Ym。 通過該處理,可以恰當(dāng)?shù)胤蛛x字符和下劃線的接觸部分。在步驟S903中,如圖14(c)所示,根據(jù)在步驟S901、902中得到的邊界坐標(biāo)確定各 個(gè)折線的上下的下劃線邊界。通過白像素涂覆由該下劃線邊界包圍的區(qū)域。由此,從二值 圖像數(shù)據(jù)中刪除下劃線。在步驟S904中,顯示圖15所示的確認(rèn)畫面。用戶可以確認(rèn)在刪除下劃線后的二值 圖像數(shù)據(jù)上是否恰當(dāng)?shù)貏h除了下劃線。如果沒有問題,則可以通過在確認(rèn)畫面中按下“是” 來指示認(rèn)可。此時(shí),將刪除下劃線后的二值圖像數(shù)據(jù)作為下劃線刪除圖像數(shù)據(jù)52,存儲(chǔ)在存 儲(chǔ)裝置50中。在沒有得到用戶的認(rèn)可時(shí),通過在確認(rèn)畫面中按下“否“,可以取消處理。(總結(jié))在本發(fā)明的實(shí)施方式中,主要在以下的兩個(gè)處理中具有特征。一個(gè)是下劃線探索 處理,另一個(gè)是下劃線刪除處理。
在下劃線探索處理中,從二值圖像數(shù)據(jù)中提取下劃線區(qū)域的下劃線位置坐標(biāo)。該 下劃線位置坐標(biāo)是按每個(gè)預(yù)定長(zhǎng)度提取具有某寬度和長(zhǎng)度的下劃線區(qū)域中包含的坐標(biāo)而 得到的坐標(biāo),用于決定下劃線區(qū)域的框架。具體地說,在二值圖像數(shù)據(jù)上設(shè)置具有一定面積 的長(zhǎng)方形的線樣板,通過在該線樣板內(nèi)追蹤滿足預(yù)定值的像素,來對(duì)每個(gè)線樣板提取下劃 線位置坐標(biāo)。連結(jié)在本處理中提取出的下劃線位置坐標(biāo)的折線成為下劃線區(qū)域的框架。在本處理中,為了使處理高效化,可以預(yù)先縮小為根據(jù)二值圖像數(shù)據(jù)推定出下劃 線區(qū)域的詳細(xì)探索區(qū)域來執(zhí)行處理。此外,可以檢查提取出的折線是否不是字符的一部分, 或者不是表的一部分。在下劃線刪除處理中,刪除通過求出下劃線區(qū)域和背景的邊界坐標(biāo)、以及下劃線 區(qū)域和字符串的邊界坐標(biāo)來確定的下劃線區(qū)域。具體地說,沿著折線,在相對(duì)于折線垂直方 向上進(jìn)行像素探索,來求出邊界坐標(biāo)。詳細(xì)地說,當(dāng)在預(yù)定范圍中不存在滿足預(yù)定像素?cái)?shù)量 的像素時(shí),判定為下劃線區(qū)域和背景的邊界,求出邊界坐標(biāo)。另一方面,當(dāng)超過預(yù)定范圍存 在滿足預(yù)定像素?cái)?shù)量的像素時(shí),判定為字符串與下劃線區(qū)域接觸,對(duì)邊界坐標(biāo)進(jìn)行插補(bǔ)。從 二值圖像數(shù)據(jù)中刪除通過求出的邊界坐標(biāo)所確定的下劃線區(qū)域。具體地說,通過背景像素 置換由求出的邊界坐標(biāo)包圍的下劃線區(qū)域。通過以上的處理,能夠從包含與字符串接觸的下劃線區(qū)域的二值圖像數(shù)據(jù)中刪除 下劃線區(qū)域。此外,即使在掃描時(shí)文件傾斜,或者在下劃線上具有凹凸的情況下,也能夠刪 除下劃線。并且,可以將該下劃線區(qū)域與字符的一部分或構(gòu)成表的表格線相區(qū)別,自動(dòng)地進(jìn) 行刪除。結(jié)果,在對(duì)刪除下劃線后的圖像數(shù)據(jù)通過OCR執(zhí)行了字符識(shí)別時(shí),可以高精度地 識(shí)別字符。本發(fā)明還可以通過實(shí)現(xiàn)實(shí)施方式的功能的軟件的程序代碼來實(shí)現(xiàn)。此時(shí),向系統(tǒng) 或裝置提供記錄有程序代碼的存儲(chǔ)介質(zhì),該系統(tǒng)或裝置的計(jì)算機(jī)(或CPU或MPU)讀出在存 儲(chǔ)介質(zhì)中存儲(chǔ)的程序代碼。此時(shí),從存儲(chǔ)介質(zhì)讀出的程序代碼自身實(shí)現(xiàn)上述實(shí)施方式的功 能,該程序代碼自身以及存儲(chǔ)它的存儲(chǔ)介質(zhì)構(gòu)成本發(fā)明。作為用于提供這樣的程序代碼的 存儲(chǔ)介質(zhì),例如可以使用軟盤、CD-ROM、DVD-ROM、硬盤、關(guān)盤、光磁盤、CD-R、磁帶、非易失性 的存儲(chǔ)卡、ROM等。此外,可以根據(jù)程序代碼的指示,由在計(jì)算機(jī)上運(yùn)行的OS (操作系統(tǒng))等進(jìn)行實(shí)際 的處理的一部分或全部,通過該處理實(shí)現(xiàn)上述實(shí)施方式的功能。并且,可以在把從存儲(chǔ)介 質(zhì)讀出的程序代碼寫入計(jì)算機(jī)上的存儲(chǔ)器中之后,根據(jù)該程序代碼的指示,由計(jì)算機(jī)的CPU 等進(jìn)行實(shí)際的處理的一部分或者全部,通過該處理實(shí)現(xiàn)上述實(shí)施方式的功能。此外,可以經(jīng)由網(wǎng)絡(luò)分發(fā)用于實(shí)現(xiàn)實(shí)施方式的功能的軟件的程序代碼,或者可以 將其存儲(chǔ)在系統(tǒng)或裝置的硬盤或存儲(chǔ)器等存儲(chǔ)單元或CD-RW、CD-R等存儲(chǔ)介質(zhì)中,在使用 時(shí)由該系統(tǒng)或裝置的計(jì)算機(jī)(或CPU或MPU)讀出存儲(chǔ)在該存儲(chǔ)單元或該存儲(chǔ)介質(zhì)中的程 序代碼來執(zhí)行。
權(quán)利要求
一種下劃線刪除裝置,其從包含與字符串接觸的下劃線區(qū)域的二值圖像數(shù)據(jù)中刪除所述下劃線區(qū)域,其特征在于,具有下劃線探索處理部,其以所述二值圖像數(shù)據(jù)上的一點(diǎn)為起點(diǎn)設(shè)置長(zhǎng)方形的線樣板,通過追蹤該線樣板中包含的像素,進(jìn)行提取表示下劃線位置坐標(biāo)的折線的線樣板匹配處理;以及下劃線刪除部,其進(jìn)行根據(jù)所述折線求出所述下劃線區(qū)域和背景區(qū)域的背景邊界坐標(biāo)、以及對(duì)所述下劃線區(qū)域中的與所述字符串接觸的部分進(jìn)行插補(bǔ)處理而得到的所述下劃線區(qū)域和所述字符串的字符邊界坐標(biāo)的處理,并進(jìn)行從所述二值圖像數(shù)據(jù)中刪除由所述背景邊界坐標(biāo)以及字符邊界坐標(biāo)包圍的區(qū)域的處理。
2.根據(jù)權(quán)利要求1所述的下劃線刪除裝置,其特征在于,所述下劃線探索處理部追蹤所述線樣本內(nèi)的所述像素中的、滿足預(yù)定的像素?cái)?shù)量的像素o
3.根據(jù)權(quán)利要求1所述的下劃線刪除裝置,其特征在于,所述下劃線探索處理部還進(jìn)行以下的處理從所述折線在垂直方向上追蹤像素,當(dāng)在 預(yù)定范圍以上存在滿足預(yù)定的像素?cái)?shù)量的像素時(shí),判定所述折線為構(gòu)成表的表格線。
4.根據(jù)權(quán)利要求1所述的下劃線刪除裝置,其特征在于,所述下劃線刪除處理部還進(jìn)行以下的處理從所述折線在垂直方向上追蹤像素,當(dāng)在 預(yù)定范圍以上存在滿足預(yù)定的像素?cái)?shù)量的像素時(shí),判定所述字符串與所述下劃線區(qū)域接 觸。
5.根據(jù)權(quán)利要求1所述的下劃線刪除裝置,其特征在于,所述下劃線刪除處理部進(jìn)行以下的處理使用所述背景區(qū)域的像素的顏色置換由所述 背景邊界坐標(biāo)以及字符邊界坐標(biāo)包圍的區(qū)域,由此刪除所述下劃線區(qū)域。
6.一種程序,其特征在于,使計(jì)算機(jī)作為權(quán)利要求1至5的任意一項(xiàng)所述的下劃線刪除裝置來工作。
全文摘要
本發(fā)明的下劃線刪除裝置,從包含與字符串接觸的下劃線區(qū)域的二值圖像數(shù)據(jù)中刪除所述下劃線區(qū)域,其特征為具有下劃線探索處理部,其以所述二值圖像數(shù)據(jù)上的一點(diǎn)為起點(diǎn),設(shè)置長(zhǎng)方形的線樣板,通過追蹤該線樣板中包含的像素,進(jìn)行提取表示下劃線位置坐標(biāo)的折線的線樣板匹配處理;以及下劃線刪除部,其進(jìn)行根據(jù)所述折線求出所述下劃線區(qū)域和背景區(qū)域的背景邊界坐標(biāo)、以及對(duì)所述下劃線區(qū)域中的與所述字符串接觸的部分進(jìn)行插補(bǔ)處理而得到的所述下劃線區(qū)域和所述字符串的字符邊界坐標(biāo)的處理,并進(jìn)行通過所述背景區(qū)域的像素的顏色置換由所述背景邊界坐標(biāo)以及字符邊界坐標(biāo)包圍的區(qū)域的處理。
文檔編號(hào)G06K9/20GK101859379SQ20101013623
公開日2010年10月13日 申請(qǐng)日期2010年3月11日 優(yōu)先權(quán)日2009年4月13日
發(fā)明者大峽光晴 申請(qǐng)人:日立軟件工程株式會(huì)社