專利名稱:信息處理裝置和信息處理方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及信息處理裝置和信息處理方法。
背景技術(shù):
在用于掃描紙張上的表格并且對于該表格的每一項進行0CR(光學 字符識別)處 理的系統(tǒng)中,需要系統(tǒng)精確地獲取前述表格的每個字段的位置信息。因此,通常,用戶在顯 示單元的屏幕上顯示表格的圖像,并且指示每個字段的位置,從而將該表格的字段位置信 息注冊到前述系統(tǒng)中。然而,這樣的操作耗費時間。日本專利No. 3586911和日本專利No. 3001950公開 了通過對于表格的圖像使用圖像處理來搜索矩形信息的方法??梢曰趫D像數(shù)據(jù)實現(xiàn)自 動地提取每個矩形(表格的每個字段)。另一方面,在日本專利No. 3586911和日本專利 No. 3001950中公開的發(fā)明中存在問題。例如,由于每個矩形矩形是基于圖像數(shù)據(jù)提取的, 所以存在以下錯誤將字母誤讀為結(jié)束線,或者反過來將結(jié)束線誤讀為表格中的字母。在表 格的背景中嵌入背景圖像數(shù)據(jù)和淺色色版的情況下,存在將背景圖像和淺色背景誤讀為結(jié) 束線的問題。由此,這些問題可能降低矩形提取精度。此外,在使用虛線繪制結(jié)束線的情況 下,對于圖像處理來說很將虛線識別為單線的線段。由此,圖像處理可能不能提取由虛線繪 制的矩形。此外,由于表格是由圖像的像素單元成像的,該成像處理是離散的。在由某個離 散的參數(shù)創(chuàng)建的離散空間和另一個離散空間之間可能存在差別。即,在對表格進行成像的 條件下和另一個條件下(在以不同的分辨率從掃描、傳真等接收的圖像中)的矩形矩形的 坐標之間存在差別,并且很難總是正確地讀取表格??偟膩碚f,通過使用例如Microsoft Word和Excel,Adobe Acrobat等應(yīng)用軟
件來初始創(chuàng)建表格。關(guān)于字母和結(jié)束線的位置的信息在表格的電子文件中被保持為矢量信 息。在電子文件中結(jié)束線信息和字母信息顯著不同。即使在任何處理環(huán)境下生成圖像,也 可以通過使用離散參數(shù)分散矢量信息而不發(fā)生錯誤,以及讀取矩形而不發(fā)生錯誤。日本公開專利申請No. 2005-190439公開了從電子文檔中包括的矢量信息中提取 線段并且進行區(qū)域指示。電子文檔中的矢量信息被分解為垂直線段和水平線段,并且通過 在屏幕上使用這些線段來指示區(qū)域。在日本公開專利申請No. 2005-190439中,通過提取線段來指示區(qū)域或提取矩形。 僅可以處理簡單的線段和矩形。由此,對于關(guān)于矢量信息的特殊情況,不可能正確地指示區(qū) 域或提取矩形。例如,在實際的電子文件中,特殊情況是在屏幕上被看做線段的對象實際上 被描述為矢量信息中的矩形繪制指令的情況,或者反過來,在屏幕上被看做矩形的對象實 際上被描述為線段繪制指令。此外,在特殊情況下被提取的線段信息發(fā)生錯誤,并且可以確 定不存在連接。作為矢量信息的結(jié)果可能發(fā)生這些問題。為了實現(xiàn)更準確的區(qū)域提取,必 須解決上述問題。
發(fā)明內(nèi)容
在本申請的一個方面,提供了信息處理裝置和信息處理方法,其通過使用原始電 子文件中包含的矢量信息對于表格提取高精度的矩形區(qū)域,并且允許用戶恰當?shù)貙τ诒砀?的字段指示矩形區(qū)域。在本申請的實例性實施例中,提供一種信息處理裝置,包括用于輸入包含矢量信 息的電子文件的輸入單元,該信息處理裝置包括讀取部,用于讀取在該電子文件中包含的 矢量信息;第一線段提取部,用于從由該讀取部讀取的矢量信息中提取線對象的線段參數(shù) 信息;第二線段提取部,用于從由該讀取部讀取的矢量信息中提取多邊形對象的多邊形參 數(shù)信息并且從所提取的多邊形參數(shù)信息中提取形成該多邊形對象的線段的線段參數(shù)信息; 矩形提取部,用于基于由該第一線段提取部和該第二線段提取部提取的線段參數(shù)提取矩形 參數(shù)信息;最小矩形確定部,用于確定基于由該矩形提取部提取的矩形參數(shù)信息形成的矩 形是否是不能容納其它矩形的最小矩形;以及最小矩形輸出部,用于輸出由該最小矩形確 定部確定的最小矩形。信息處理裝置可以進一步包括梯度獲取部,用于獲取由該第一線段提取部和該第 二線段提取部提取的線段關(guān)于參考線的梯度,其中該矩形提取部基于與該線段相對應(yīng)的線段 參數(shù)信息和梯度來提取由彼此垂直的線段形成的矩形的矩形參數(shù)信息,其中該線段參數(shù)信息 是由該第一線段提取部和該第二線段提取部提取的,并且梯度是由該梯度獲取部獲取的。信息處理裝置可以包括梯度獲取部,用于基于由該第一線段提取部和該第二線段 提取部提取的線段參數(shù)信息來獲取線段的梯度;以及第三線段提取部,用于基于與該線段 相對應(yīng)的線段參數(shù)信息和梯度,來連接具有相同梯度并彼此重疊的兩個線段并且獲取被相 互連接的兩個線段的線段參數(shù)信息,其中,該線段參數(shù)信息是由該第一線段提取部和該第 二線段提取部提取的,并且該梯度是由該梯度獲取部獲取的,其中,該矩形提取部基于排除 了由該第三線段提取部連接的兩個線段的線段參數(shù)信息的線段參數(shù)信息來提取矩形參數(shù) 信息,并且,將由該第三線段提取部通過連接兩個線段形成的單個線段的線段參數(shù)信息加 入到該第一線段提取部和該第二線段提取部提取的線段參數(shù)信息中。在信息處理裝置中,當兩個線段的梯度相同并且兩個線段之間的距離小于預定長 度時,該第三線段提取部連接兩個線段。在本發(fā)明的另一個實例實施例中,提供信息處理裝置中的一種信息處理方法,該 信息處理裝置包括用于輸入包含矢量信息的電子文件的輸入單元,該信息處理方法包括 讀取步驟,讀取在該電子文件中包含的矢量信息;第一線段提取步驟,從在該讀取步驟中讀 取的該矢量信息中提取線對象的線段參數(shù)信息;第二線段提取步驟,從從該電子文件中讀 取的該矢量信息中提取多邊形對象的多邊形參數(shù)信息,并且從該提取的多邊形參數(shù)信息中 提取形成該多邊形對象的線段的線段參數(shù)信息;矩形提取步驟,基于在該第一線段提取步 驟和該第二線段提取步驟中提取的線段參數(shù)來提取矩形參數(shù)信息;最小矩形確定步驟,確 定基于在矩形提取步驟中提取的該矩形參數(shù)信息形成的矩形是否是不能容納其它矩形的 最小矩形;以及最小矩形輸出步驟,輸出在最小矩形確定步驟中確定的該最小矩形。在本發(fā)明的另一個實例性實施例中,可以提供方法、裝置、系統(tǒng)、計算機程序、計算 機可讀記錄介質(zhì)等,其中應(yīng)用了要素、表示或其組合。
當結(jié)合附圖讀取下面的具體實施方式
時,本發(fā)明的其它目的、特征和優(yōu)勢將變得 更加清楚,其中圖1是表示表格的圖表;圖2是表示矢量信息的圖表;圖3是表示將圖形描述為矢量信息的圖案的圖表;圖4是表示信息處理裝置的配置的圖表;圖5是表示信息處理裝置的功能配置的框圖;圖6是表示基于矢量信息中的參數(shù)描述的矩形的圖表;圖7是表示梯度獲取的圖表;圖8是用于說明由矩形搜索部進行的處理的流程圖;圖9是用于說明連接兩個線段的處理的圖表;圖10是表示對線段進行分類的組的圖表;圖11是表示具有交叉點的線段的圖表;圖12是表示一個矩形的圖表,該矩形容納(connote)另一個矩形;圖13是表示從確定最小矩形得到的結(jié)果的圖表;圖14是表示表格設(shè)置窗口的圖表;以及圖15是表示關(guān)于表格中的線段和矩形的處理的圖表。
具體實施例方式在下面的具體實施方式
中將參考附圖描述本發(fā)明的實施例。矢量信息在本發(fā)明中,從電子文件中包括的矢量信息中提取或指示高精度的矩形區(qū)域。在矢量信息中,由包括指定類型、最遠點的坐標、半徑等代碼的參數(shù)字符串描述類 似于線性多邊形狀的劃線(ruled line)以及例如圓形的幾何結(jié)構(gòu)。由例如Microsoft Word和Excel、Adobe Acrobat等通用編輯器創(chuàng)建的每個電子文件(電子表格)包括 文檔信息作為矢量信息。電子文件中的矢量信息進一步包括關(guān)于結(jié)束線和劃線的圖形信 息,以及描述文檔中的字母串的字符信息,并且包括關(guān)于文檔的背景圖像和淺色色版(tint block)的信息。圖1是表示由PDF(可移植文檔格式)創(chuàng)建的表格的圖表。在圖1中示出的表格 對應(yīng)于在PC終端顯示表格的電子文件的情況或者在紙上打印出的情況。值得注意的是例 如線段和矩形等圖形等可以被表示為PDF格式的電子文件中的矢量格式。圖2中將示出在PDF格式的電子文件中包括的矢量信息。圖2表示由PDF格式創(chuàng) 建的電子文件中的矢量信息描述圖形等的例子。矢量信息包括由BT201表示的文本對象 (字符信息),由矩形202和線段203表示的圖形對象,以及用于BT201、矩形202和線段203 的參數(shù)。在這個例子中,如果圖形對象是PDF格式的數(shù)據(jù),圖形對象是由例如“re (矩形),, 和“1(線段)”的路徑構(gòu)造運算符(operator)表示的對象的信息。基于PDF格式的電子文 件中包括的矢量信息來描述圖1中示出的線段和矩形。下面將描述要由矢量表示的圖形特有的問題。在圖1中,表格由兩個矩形和兩個線段可視地形成。另一方面,在矢量信息中,存在各種方法來由矢量表示這些矩形和線段。通過使用圖3所示的多邊形例子來描述各種方法。圖3是圖表表示實例,其中通過多種表 示方法來表示相同的多邊形30。圖3所示的多邊形30可以由矢量信息中的A、B、C和D四 種模式的表示方法的任一種來表示。在模式A的表示方法中,由兩個矩形組(側(cè)邊部分重 疊)表示多邊形30。在模式B的表示方法中,僅由線段形成多邊形30。此外,在模式C的 表示方法中,被看作線段的部分實際上是由小的細長矩形形成的。當提取形成多邊形30的 元素時,在模式A提取兩個矩形,在模式B提取六個線段,并且在模式C提取六個矩形。在 模式D的表示方法中,由三個矩形形成多邊形30。在模式A、B、C和D中的每個構(gòu)成被轉(zhuǎn)換 為圖像之后,表示方法之間的差異并不是視覺可區(qū)別的。當將多邊形30處理在電子文檔中 保護的矢量信息時必須注意這一點。即,即使多邊形30在視覺上是相同的,可以由不同矢 量信息中的不同元素形成多邊形30。在本實施例中將通過PDF格式的文件的例子來描述本發(fā)明。然而,本發(fā)明可以類 似地應(yīng)用于可以處理矢量信息的任意電子文件格式。信息處理裝置下面將參考圖4描述根據(jù)本發(fā)明的信息處理裝置401。信息處理裝置401是例如 通用PC (個人計算機)等的通用計算機,并且包括CPU (中央處理單元)402、存儲器403、存 儲單元(HDD) 404、操作單元405、顯示單元406、輸入單元407、網(wǎng)絡(luò)適配器408等。信息處 理裝置404可以從外部記錄介質(zhì)或通過網(wǎng)絡(luò)讀取電子文件。此外,將識別根據(jù)本發(fā)明的處 理的程序存儲在存儲單元404中,并且在將該程序存儲到存儲器403之后由CPU 402進行 執(zhí)行。功能描述下面將參考圖5描述在信息處理裝置401中執(zhí)行的根據(jù)本發(fā)明的功能。圖5是表 示信息處理裝置401中執(zhí)行的功能的框圖。作為根據(jù)本發(fā)明的功能,信息處理裝置401包 括讀取部501、線段提取部502、線段轉(zhuǎn)換部503、梯度獲取部504、矩形搜索部505、最小矩 形確定部506以及最小矩形輸出部507。首先,根據(jù)本發(fā)明的信息處理裝置讀取作為主體 的電子文件(PDF文件等),并且提取記錄在該電子文件中的矢量信息(例如圖2)。隨后, 從從電子文件中讀取的矢量信息中提取線段信息。信息處理裝置401在將多邊形轉(zhuǎn)換為線 段之后提取線段信息。如下所述,為了避免矢量信息特有的問題,將多邊形分解為線段。然 后,信息處理裝置401提取可以通過組合所提取的線段而形成的矩形。然后,信息處理裝置 401獲取和輸出來自提取的矩形的最小矩形。通過處理部501到507來進行這些處理。下面將詳細描述讀取部501、線段提取部502、線段轉(zhuǎn)換部503、梯度獲取部504、矩 形搜索部505、最小矩形確定部506以及最小矩形輸出部507。讀取部首先,讀取部501讀取從輸入單元407輸入的要作為主體的電子文件(PDF文件 等),并且提取在電子文件中記錄的矢量信息。上面參考圖3描述了矢量信息。線段提取部然后,線段提取部502從由讀取部501讀取的矢量信息中提取關(guān)于來自矢量信息 的線段對象的線段參數(shù)信息。將參考附圖2描述細節(jié)。線段203是關(guān)于矢量信息中的一個 線段的信息。關(guān)于對象的“運算符”是“1(線段)”。“1(線段)”表示對象是線段。“參數(shù)”包括關(guān)于線段的信息。線段203包括關(guān)于在PDF文件的坐標空間中線段的起始點和結(jié)束點的X坐標和Y坐標的信息。從參數(shù)中可以指定一個線段是由起始點(10,200)和結(jié)束點 (110,200)形成的。線段提取部502提取“運算符”中的“1(線段)”對象的參數(shù)(線段參
數(shù)信息)。線段轉(zhuǎn)換部線段轉(zhuǎn)換部503從由讀取部501提取的矢量信息中提取多邊形對象的參數(shù),并且 提取形成多邊形的線段的參數(shù)信息作為線段參數(shù)信息。在由讀取部501讀取的多邊形對象 中,混合了多邊形(包括矩形)和曲線的多種圖形。由此,將各種圖形分解為作為最小單元 的線段,并且從每個線段提取線段參數(shù)信息。為了克服矢量信息特有的上述問題,首先,將 多邊形分解為線段。下面將參考圖3所示的多邊形30詳細描述該分解處理。圖3示例的多邊形看起 來由模式D所示的三個矩形形成。考慮如何通過使用矢量信息來表示多邊形30,假設(shè)多邊 形30是由模式B所示的六個線段形成的。即使多邊形30看起來是由模式D形成的,但是 實際上,矢量信息并沒有將多邊形30表示為模式D。即,在這個例子中試圖基于矢量信息提 取矩形的情況下,確定在矢量信息中沒有矩形,并且不能提取矩形。由此,為了通過使用矢 量信息來提取矩形,需要將矩形分解為線段并且通過線段重新形成矩形。下面將描述分解處理。在圖2中,由矩形對象“re”指定矩形202。矩形202的參 數(shù)表示值“10”(X坐標)、值“50”(y坐標),值“100”(寬度)以及值“50”(高度)。在圖 6中,通過使用參數(shù)在坐標系中表示矩形202。從形成矩形202的四個邊(頂邊、底邊、左邊 和右邊)提取四個線段。作為提取結(jié)果,對于四個線段的每一個獲取線段參數(shù)信息。對于 矩形202的底邊,以線參數(shù)信息定義運算符“1”,其指示起始點的χ坐標是“10”,起始點的 y坐標是“50”,結(jié)束點的χ坐標是“110”,以及結(jié)束點的y坐標是“50”。如上所述,線段轉(zhuǎn) 換部503將多邊形30轉(zhuǎn)換為線段。梯度獲取部梯度獲取部504基于由線段提取部502和線段轉(zhuǎn)換部503提取的線段參數(shù)信息獲 取每個線段關(guān)于參考線的梯度。參考線是在PDF文件的坐標系中要成為參考的χ坐標軸等。 梯度獲取部504獲取線段關(guān)于參考線的梯度。參考線不局限于χ坐標軸,其可以是能夠被 用作參考以確定線段的梯度的任意線?;诿總€線段的線段參數(shù)信息,梯度獲取部504獲 取對應(yīng)于每個線段的梯度。圖7是表示通過使用χ坐標軸作為參考線來獲取線段“a”和線 段“b”的梯度的例子的圖表。線段“a”是關(guān)于χ坐標軸處于45度,并且線段“b”是關(guān)于χ 坐標軸處于150度。由此,梯度獲取部504對于線段“a”和“b”獲取45度的梯度和150度 的梯度。下面將描述獲取這些梯度的目的。矩形搜索部下面將描述矩形搜索部。矩形搜索部505基于由線段提取部502和線段轉(zhuǎn)換部 503提取的線段參數(shù)信息搜索矩形。通過合并線段,進行矩形搜索處理以形成矩形。下面將 參考圖8的流程圖來描述矩形搜索處理。首先,在步驟S801中,在搜索矩形之前,將線段分類為平行于χ坐標軸的線段的組 A和平行于y坐標軸的線段的組B。圖10表示平行于χ坐標軸的線段的組A,以及平行于y 坐標軸的線段的組B。組A和組B不局限于平行于χ坐標軸和y坐標軸的線段組,并且還可以是具有某個傾斜角的一組線段以及正交于被分類為一組的線段的另一組線段。在這個實 施例中,因為以通常形式表示的圖形是通過組合平行于X坐標軸的線和平行于y坐標軸的 線形成的四邊形(矩形),所以對于平行于χ坐標軸的線段定義組A以及對平行于y坐標軸 的線段定義組B,從而有效地提取四邊形(矩形)。此外,由在頂點上彼此垂直的四個線段 形成矩形。由此,進行矩形提取處理以從彼此正交的線段提取矩形,并且通過消除不必要的 線段組合來有效地進行矩形搜索處理。此外,在步驟S802中,從一個組(組A或組B)中提取(彼此平行的)任意兩個線 段。如果這兩個線段是重疊的,則通過連接這兩個線段來創(chuàng)建新的線段,并且使用新線段來 替換這兩個線段。可以減少線段的數(shù)量并且有效地進行矩形搜索處理。圖9是表示線段的 連接例子的圖表。線段“a”是具有起始點(15,20)和結(jié)束點(25,20)的線段。線段“a”和 “b”均平行于χ坐標軸,并且被分類為組B,并且在xy坐標系具有重疊部分。由此,可以連 接這些線段“a”和“b”以形成單個線段。通過連接線段“a”和線段“b”來形成線段“C”。 將線段“C”添加到組B并且刪除線段“a”和“b”。此外,將說明線段“d”。線段“d”平行于線段“a”,但是與線段“a”不具有重疊的 部分。然而,在這兩個線段“a”和“d”之間距離為“1”(該距離是從y坐標軸計算的)。即 使基于矢量信息線段“a”和“d”之間不存在彼此重疊的部分,線段“a”和“d”在顯示屏幕 或在打印的紙張上視覺上也彼此重疊。如果距離是“0.5”或“0.01”(例如單位是毫米), 遠小于兩個線段“a”和“d”,則線段“a”和“d”可以被顯著地看作一個線段。即,即使在基 于矢量信息線段不具有重疊部分的情況下,如果兩個線段之間的距離短于預定長度,則這 兩個線段可以被視覺地看作一個線段(兩個線段彼此重疊)。由此,也可以連接這兩個線段 以形成單個線段。由此,連接線段“a”和線段“d”以形成線段“C”。在這種情況下的距離是 通過繪制垂直于由線段“C”和線段“e”表示的兩個線段的線而測量的最短距離。因為不存 在由線段“f”到線段“C”垂直的線測量的距離,所以不連接線段“f”。如上所述,除了減少 要被處理的線段的數(shù)目之外,也通過連接基于矢量信息不具有重疊部分但是實質(zhì)上(視覺 上)具有重疊部分的線段,可以靈活地搜索對應(yīng)于表格上的項目字段的矩形。下面開始矩形搜索處理。在步驟S803中,從平行于χ坐標軸的線段的組A和平行 于y坐標軸的線段的組B的每一組提取兩個線段,檢查四個線段的所有組合。如果在步驟 S804從四個線段形成四個交叉點,獲得具有四個交叉點的矩形(作為矩形參數(shù)信息),并且 在步驟S805中將該矩形添加到矩形組R中。矩形組R被設(shè)置以存儲由矩形搜索部505提 取的矩形。圖10表示將線段分類到平行于χ坐標軸的線段的組A和平行于y坐標軸的線段的組B中去的例子。從組A和組B的每一個中提取兩個線段。如圖11所示,如果在坐標系 中形成四個交叉點,獲得具有這四個交叉點的矩形(作為矩形參數(shù)信息)。在步驟S806,當 處理四個線段的所有組合時,終止矩形搜索處理。為了有效地進行矩形搜索處理,僅提取平行于χ坐標軸或y坐標軸的線段,并且將其分類到組A和組B的各個中。然而,不局限于提取具有平行于χ坐標軸和y坐標軸的線 段的矩形。因為通常形式的圖形是四邊形(矩形),僅搜索具有平行于χ坐標軸和y坐標軸 的邊的矩形??蛇x地,線段可以被分類到用于角度的組X,并且合并從組X中提取的線段。 在這種情況下,矩形搜索處理不局限于四邊形的角。即,不僅可以提取矩形的圖形,還可以提取菱形等的圖形(四個角不是90度的四邊形)。此外,替代獲取梯度,可以處理通過組合 線段可能形成的所有類型的四邊形。此外,根據(jù)應(yīng)用環(huán)境等,恰當?shù)貦z查η個線段的組合, 并且提取具有η個邊的η邊形。最小矩形確定部下面將描述最小矩形確定部506。對于矩形組R中存儲的要被處理的矩形執(zhí)行最 小矩形的確定。通過檢查該矩形是否能夠容納其它矩形來確定基于矩形搜索部505獲取的 矩形參數(shù)信息形成的矩形是否是最小矩形。最小矩形是 在該矩形的區(qū)域內(nèi)不能容納其它矩 形的矩形。如果該矩形不能容納其它矩形,對于該矩形額外地提供指示最小矩形的信息。否 貝U,對于該矩形額外地提供指示該矩形不是最小矩形的信息。如下執(zhí)行是否容納其它矩形的檢查。圖12表示矩形A容納矩形B的情況。由(χη, Y11)和(x12,y12)表示的矩形A的兩個頂點的坐標分別與由(x21,y21)和(x22,y22)表示的矩 形B的兩個頂點的坐標比較。如果X11 < x21, yn < y21, x12 > X22,以及y12 > y22,矩形A容 納矩形B。因為矩形A容納矩形B,矩形A不是最小矩形。因為在矩形B中不存在容納的矩 形,矩形B是最小矩形。在圖13中被示出為表格的矩形組R包括項目“χ坐標”、“y坐標”、“寬度”、“高度” 以及“最小矩形標志”,并且存儲由從組A和B提取的線段的組合形成的每個矩形的矩形參
數(shù)信息。對于被確定為最小矩形的矩形,例如,如圖13所示,指示“真”的標志被設(shè)置為最 小矩形標志。另一方面,如圖13所示,對于不是最小矩形的矩形,指示“假”的標志被設(shè)置 為最小矩形標志。最小矩形輸出部最小矩形輸出部507在顯示單元406上輸出和顯示由最小矩形確定部506確定為 最小矩形的矩形。圖14表示“表格設(shè)置窗口的顯示例子”。因為矩形被設(shè)置為最小矩形,所 以顯示了關(guān)于“四邊形1”和“四邊形2”的矩形。沒有顯示其它矩形,因為這些矩形沒有被 確定為最小矩形。最小矩形輸出部507在表格的圖像上添加最小矩形信息,并且在屏幕上為用戶顯 示以從表格設(shè)置字段位置信息。從矩形組R中提取指示“真”的最小矩形標志的矩形參數(shù) 信息作為最小矩形信息。由此,用戶可以通過使用最小矩形信息而容易地創(chuàng)建表格的設(shè)置??梢詫⒃趫D13中被確定為最小矩形的矩形的矩形參數(shù)信息添加到PDF格式的電 子文件的矢量信息中。在圖2的矢量信息中,“re”被添加作為“運算符”,并且最小矩形的 矩形參數(shù)信息被添加作為“參數(shù)”。因為通過該添加至矢量信息而指定了最小矩形,所以不 需要再次進行上述處理。對例外的線段和矩形的處理首先將說明對例外的線段的處理。在矢量信息中的線段參數(shù)信息包括指示“線寬” 的參數(shù)。例如,如果“線寬”的值是相當大的值,例如“20”,將該線段視覺上考慮成矩形是恰 當?shù)?。由此,如果線段的“線寬”大于預定值,該對象被處理為矩形而不是線段??梢栽诰€ 段提取部502進行該處理,或者可以在矩形搜索部505中的矩形搜索處理之前進行該處理。 “線寬”的預定值可以是在電子文件中定義的初始線寬的值,合作和可以由用戶設(shè)定。然后將說明對例外的矩形的處理。例如,如果“高度”值是相當小的值,例如“1”或“0.5”(例如以毫米為單位),將該矩形視覺上考慮為線段是恰當?shù)?。由此,如果矩形的“高度”小于預定值,該對象可以被處理為線段而不是矩形??梢栽诰€段轉(zhuǎn)換部503中進行 該處理,或者可以在矩形搜索部505中的矩形搜索處理之前進行該處理?!案叨取钡念A定值 可以是在電子文件中定義的初始高度的值,或者可以由用戶設(shè)定。圖形字符的處理將描述圖形字符的處理。圖形字符是表示例如“□”、“ ”、“〇”等的圖形的字符, 其通常被用作表格中的檢驗欄。因為圖形字符是字符類型的,圖形字符被表示為矢量信息 中的文本對象。由此,當處理圖形字符時,在“參數(shù)”中包括其中“BT”(文本對象)被設(shè)置 為“運算符”的矢量信息和圖形字符。從矢量信息中獲得的圖形字符被處理作為最小矩形。 例如,因為圖形字符“□”不能容納其它矩形,圖形字符“□”可以被確定為最小矩形??梢?提供圖形字符提取部并且用于進行該處理。對于用戶可以指示示出圖形字符的區(qū)域作為矩 形。處理細節(jié)在本實施例中,將參考圖15描述上述處理細節(jié)。在圖15(a)中示出了電子文件的 表格50。在表格50中示出圖形51、字符52 (不包括圖形字符)以及字符串53。如圖15(b) 所示,圖形51是由一個矩形和三個線段組成。首先,線段提取部502對于三個線段的每一個提取線段信息。線段轉(zhuǎn)換部503將 圖形51轉(zhuǎn)化為四個線段。作為結(jié)果,如圖15(c)所示,獲取七個線段。然后,梯度獲取部504獲取七個線段的梯度?;讷@取的梯度,這七個線段被分類 為平行于χ坐標軸(組A)的三個線段和平行于y坐標軸(組B)的四個線段。因為沒有彼 此平行和重疊的線段,不連接七個線段的任一個。矩形搜索部505合并四個線段,這四個線段中兩個線段是從組A提取的,另兩個線 段是從組B提取的。作為搜索結(jié)果,如圖15(d)所示形成了五個矩形。實際上,矩形具有四 個交叉點。為了表示分離的線段的原因,圖15(d)中沒有示出交叉點。然后,最小矩形確定部506確定在圖15(d)中形成的五個矩形的每一個包括其它 矩形。作為確定結(jié)果,不包括其它矩形的矩形el、e2和e3被確定為圖15(e)所示的最小矩 形。在圖15(f)中示出的其它矩形沒有被確定為最小矩形。最小矩形輸出部507在圖15(g)所示的“表格設(shè)置窗口”上輸出和顯示被確定為 最小矩形的三個矩形。由此,用戶指示在“表格設(shè)置窗口,,上成像的表格上的區(qū)域。根據(jù)本發(fā)明,通過使用原始電子文件中包括的矢量信息可以對表格提取高精度的 矩形區(qū)域,并且用戶可以對表格的字段恰當?shù)鼐匦蔚膮^(qū)域。本發(fā)明不局限于具體公開的實施例,并且可以進行變形和修改而不偏離本發(fā)明的 范圍。本申請是基于2007年11月9日申請的日本優(yōu)先權(quán)申請No. 2007-292311,其全部 內(nèi)容結(jié)合于此作為參考。
權(quán)利要求
一種信息處理裝置,所述信息處理裝置包括用于輸入電子文件的輸入單元,所述電子文件包含矢量信息,所述信息處理裝置包括讀取部,用于讀取在所述電子文件中包含的所述矢量信息;第一線段提取部,用于從由所述讀取部讀取的所述矢量信息中提取線對象的線段參數(shù)信息;第二線段提取部,用于從由所述讀取部讀取的所述矢量信息中提取多邊形對象的多邊形參數(shù)信息,并且從所提取的多邊形參數(shù)信息中提取形成所述多邊形對象的線段的線段參數(shù)信息;矩形提取部,用于基于由所述第一線段提取部和所述第二線段提取部提取的線段參數(shù)提取矩形參數(shù)信息;最小矩形確定部,用于確定基于由所述矩形提取部提取的矩形參數(shù)信息形成的矩形是否是不能容納其它矩形的最小矩形;以及最小矩形輸出部,用于輸出由所述最小矩形確定部確定的所述最小矩形。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,進一步包括梯度獲取部,用于獲取由所述第 一線段提取部和所述第二線段提取部提取的線段關(guān)于參考線的梯度,其中,所述矩形提取部基于與所述線段相對應(yīng)的線段參數(shù)信息和所述梯度來提取由彼 此垂直的線段形成的矩形的矩形參數(shù)信息,其中所述線段參數(shù)信息是由所述第一線段提取 部和所述第二線段提取部提取的,并且所述梯度是由所述梯度獲取部獲取的。
3.根據(jù)權(quán)利要求1所述的信息處理裝置,還包括梯度獲取部,用于基于由所述第一線段提取部和所述第二線段提取部提取的線段參數(shù) 信息來獲取線段的梯度;以及第三線段提取部,用于基于與所述線段相對應(yīng)的所述線段參數(shù)信息和所述梯度,來連 接具有相同梯度并彼此重疊的兩個線段并且獲取被相互連接的所述兩個線段的線段參數(shù) 信息,其中,所述線段參數(shù)信息是由所述第一線段提取部和所述第二線段提取部提取的,并 且所述梯度是由所述梯度獲取部獲取的,其中,所述矩形提取部基于排除了由所述第三線段提取部連接的所述兩個線段的線段 參數(shù)信息的線段參數(shù)信息來提取矩形參數(shù)信息,并且,將由所述第三線段提取部通過連接 所述兩個線段形成的單個線段的線段參數(shù)信息加入到所述第一線段提取部和所述第二線 段提取部提取的線段參數(shù)信息中。
4.根據(jù)權(quán)利要求3所述的信息處理裝置,其中當所述兩個線段的梯度相同并且所述兩 個線段之間的距離小于預定長度時,所述第三線段提取部連接所述兩個線段。
5.根據(jù)權(quán)利要求1所述的信息處理裝置,還包括圖形字符提取部,用于從由所述讀取 部讀取的所述矢量信息中提取文本對象的圖形字符信息,其中,基于由所述圖形字符提取部提取的圖形字符信息形成圖形字符。
6.根據(jù)權(quán)利要求5所述的信息處理裝置,其中,所述圖形字符是“□”、“ ”或“〇”。
7.根據(jù)權(quán)利要求1所述的信息處理裝置,還包括添加部,用于添加由所述最小矩形確 定部確定的所述最小矩形的最小矩形參數(shù)信息。
8.一種信息處理裝置中的信息處理方法,所述信息處理裝置包括用于輸入電子文件的 輸入單元,所述電子文件包含矢量信息,所述信息處理方法包括讀取步驟,讀取在所述電子文件中包含的所述矢量信息;第一線段提取步驟,從在所述讀取步驟中讀取的所述矢量信息中提取線對象的線段參 數(shù)信息;第二線段提取步驟,從從所述電子文件中讀取的所述矢量信息中提取多邊形對象的多 邊形參數(shù)信息,并且從所提取的多邊形參數(shù)信息中提取形成所述多邊形對象的線段的線段 參數(shù)信息;矩形提取步驟,基于在所述第一線段提取步驟和所述第二線段提取步驟中提取的線段 參數(shù)來提取矩形參數(shù)信息;最小矩形確定步驟,確定基于在矩形提取步驟中提取的所述矩形參數(shù)信息形成的矩形 是否是不能容納其它矩形的最小矩形;以及最小矩形輸出步驟,輸出在最小矩形確定步驟中確定的所述最小矩形。
9.根據(jù)權(quán)利要求8所述的信息處理方法,進一步包括梯度獲取步驟,獲取在所述第一線段提取步驟和所述第二線段提取步驟中提取的所述 線段關(guān)于參考線的梯度,其中,基于與所述線段相對應(yīng)的線段參數(shù)信息和所述梯度來提取由彼此垂直的線段形 成的矩形的矩形參數(shù)信息,其中所述線段參數(shù)信息是在所述第一線段提取步驟和所述第二 線段提取步驟中提取的,并且所述梯度是在所述梯度獲取步驟中獲取的。
10.根據(jù)權(quán)利要求8所述的信息處理方法,還包括梯度獲取步驟,基于在所述第一線段提取步驟和所述第二線段提取步驟中提取的線段 參數(shù)信息來獲取線段的梯度;以及第三線段提取步驟,基于與所述線段相對應(yīng)的所述線段參數(shù)信息和所述梯度來連接 具有相同梯度并彼此重疊的兩個線段,并且獲取被相互連接的所述兩個線段的線段參數(shù)信 息,其中,所述線段參數(shù)信息是在所述第一線段提取步驟和所述第二線段提取步驟中提取 的,并且所述梯度是在所述梯度獲取步驟中獲取的,其中在矩形提取步驟中,基于排除了在所述第三線段提取步驟中連接的所述兩個線段 的線段參數(shù)信息的線段參數(shù)信息來提取矩形參數(shù)信息,并且,將在所述第三線段提取步驟 中通過連接所述兩個線段形成的單個線段的線段參數(shù)信息添加到在所述第一線段提取步 驟和所述第二線段提取步驟中提取的線段參數(shù)信息中。
11.根據(jù)權(quán)利要求10所述的信息處理方法,其中當所述兩個線段的梯度相同并且所述 兩個線段之間的距離小于預定長度時,在所述第三線段提取步驟中,所述兩個線段被互相 連接。
12.根據(jù)權(quán)利要求8所述的信息處理方法,還包括圖形字符信息提取步驟,從在所述讀取步驟中讀取的所述矢量信息中提取文本對象的 圖形字符信息,其中,基于在所述圖形字符信息提取步驟中提取的圖形字符信息形成圖形字符。
13.根據(jù)權(quán)利要求12所述的信息處理方法,其中,所述圖形字符是“□”、“ ”或“〇”。
14.根據(jù)權(quán)利要求8所述的信息處理方法,還包括添加步驟,添加在所述最小矩形確定步驟中確定的所述最小矩形的最小矩形參數(shù)信肩、ο
15. 一種計算機可讀編碼介質(zhì),所述計算機可讀編碼介質(zhì)記錄有矩形提取程序,所述矩 形提取程序包括代碼以用于進行讀取步驟,讀取在所述電子文件中包含的所述矢量信息;第一線段提取步驟,從在所述讀取步驟中讀取的所述矢量信息中提取線對象的線段參 數(shù)信息;第二線段提取步驟,從從所述電子文件中讀取的所述矢量信息中提取多邊形對象的多 邊形參數(shù)信息,并且從所提取的多邊形參數(shù)信息中提取形成所述多邊形對象的線段的線段 參數(shù)信息;矩形提取步驟,基于在所述第一線段提取步驟和所述第二線段提取步驟中提取的線段 參數(shù)來提取矩形參數(shù)信息;最小矩形確定步驟,確定基于在矩形提取步驟中提取的所述矩形參數(shù)信息形成的矩形 是否是不能容納其它矩形的最小矩形;以及最小矩形輸出步驟,輸出在最小矩形確定步驟中確定的所述最小矩形。
全文摘要
本發(fā)明公開了一種信息處理裝置,包括讀取部,讀取電子文件中包括的矢量信息;第一線段提取部,從矢量信息中提取線對象的線段參數(shù)信息;第二線段提取部,從矢量信息中提取多邊形對象的多邊形參數(shù)信息并且從提取的多邊形參數(shù)信息中提取形成多邊形對象的線段的線段參數(shù)信息;矩形提取部,基于線段參數(shù)提取矩形參數(shù)信息;最小矩形確定部,確定基于矩形參數(shù)信息形成的矩形是否是不能容納其它矩形的最小矩形;以及最小矩形輸出部,輸出該最小矩形。
文檔編號G06T7/60GK101821752SQ20088010076
公開日2010年9月1日 申請日期2008年11月5日 優(yōu)先權(quán)日2007年11月9日
發(fā)明者沖田邦夫 申請人:株式會社理光