專利名稱::圖像處理設(shè)備及圖像處理方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種從紙文檔或者電子文檔數(shù)據(jù)生成包括雙向鏈接信息的電子文檔數(shù)據(jù)的圖像處理設(shè)備及圖像處理方法。
背景技術(shù):
:通常,紙文檔和電子文檔包括字符、圖形等。例如,存在包括圖16A所示的“對象”(區(qū)域1614)、“伴隨對象的錨表述(anchorexpression)(例如諸如“圖號”、“附圖1”或者“圖1”的表述)”(區(qū)域1612)以及“包括錨表述的文本”(區(qū)域1613)的紙文檔、電子文檔等。具體地說,這種文檔的示例包括學(xué)術(shù)論文、專利文獻(xiàn)、安裝手冊以及產(chǎn)品目錄。這里,本說明書中的“對象”是指包括在文檔中的“圖”、“照片”、“圖示(illustration)”等的區(qū)域。“包括錨表述的文本”是指包括描述或者說明“對象”的句子的文本?!板^表述”是指例如像區(qū)域1611中包括的“圖1”那樣用于識別對象的字符(例如圖號)。在下面的描述中,將“包括錨表述的文本”稱為“對象的描述文本”。如上所述,當(dāng)文檔包括“對象”時(shí),文檔的閱讀者需要考慮“對象”與“對象的描述文本”之間的雙向?qū)?yīng)關(guān)系來閱讀文檔。然而,當(dāng)閱讀者難以掌握文檔中的“對象”與“對象的描述文本”之間的對應(yīng)關(guān)系時(shí),閱讀者需要大量時(shí)間閱讀它以便正確地理解。閱讀者需要額外的時(shí)間來理解文檔的內(nèi)容。這里,作為難以掌握“對象”與“對象的描述文本”之間的對應(yīng)關(guān)系的紙文檔的示例,對圖16B的示例進(jìn)行說明。圖16B示出了由N頁(即頁1到N(N為整數(shù)))構(gòu)成的紙文檔的示例,其單獨(dú)具有“對象”頁和“對象的描述文本”頁。區(qū)域1604是“對象”,區(qū)域1605是“伴隨對象的注釋”,區(qū)域1606是“注釋中的錨表述”,區(qū)域1602是“文本中的錨表述”。區(qū)域1601是“包括錨表述的文本”,即“對象的描述文本”,區(qū)域1603是其它文本。通常,當(dāng)文檔的閱讀者閱讀頁1上的區(qū)域1601內(nèi)的文本時(shí),閱讀者在包括由區(qū)域1602中的“文本中的錨表述”(圖16B所示的“圖1”)表示的對象的其它頁中進(jìn)行搜索。接著,閱讀者在頁N上的區(qū)域1606中進(jìn)行搜索,并在閱讀區(qū)域1604和1605之后,閱讀者返回頁1,閱讀區(qū)域1602之后的文本中的句子。相反,當(dāng)閱讀者首先看到頁N時(shí),閱讀者搜索包括如區(qū)域1606的“注釋中的錨表述”(這里為“圖1”)的文本的部分。如上所述,閱讀者在頁1上的區(qū)域1602中進(jìn)行搜索,閱讀包括作為錨表述的“圖1”的文本,之后返回頁N。如上所述,當(dāng)使用難以掌握“對象”與“對象的描述文本”之間的對應(yīng)關(guān)系的紙文檔時(shí),閱讀者手動地將頁翻到相應(yīng)頁,并搜索描述“對象”或者“對象的描述文本”的位置(哪頁、哪段以及哪行)。這花費(fèi)大量時(shí)間。然后,閱讀在搜索到的位置描述的內(nèi)容、之后返回到起始頁的起始位置耗費(fèi)時(shí)間。另一方面,當(dāng)使用電子文檔時(shí),需要使用個人計(jì)算機(jī)(以下稱為PC)中的應(yīng)用的頁面滾動功能和搜索功能來搜索描述有“對象”或者“對象的描述文本”的位置,這也是耗費(fèi)時(shí)間的操作。此外,閱讀其內(nèi)容、之后返回到起始頁的起始位置也耗費(fèi)時(shí)間。圖16B所示的示例表示在由N頁(即頁1到N)構(gòu)成的文檔中,在N頁中的每一頁中存在一個“對象”和一個“對象的描述文本”。不用說,隨著頁數(shù)、“對象”的數(shù)量以及“對象的描述文本”的數(shù)量的增加,變得更為耗時(shí)。在圖16C中示出了難以掌握“對象”與“對象的描述文本”之間的對應(yīng)關(guān)系的文檔的其它示例。在圖16C中,盡管“對象”和“對象的描述文本”在同一頁上,但是它們的位置相互分離。如上所述,在難以掌握“對象”與“對象的描述文本”之間的對應(yīng)關(guān)系的文檔中,該文檔的閱讀者不利地花費(fèi)大量時(shí)間來閱讀它,并且還花費(fèi)額外的時(shí)間來理解文檔的內(nèi)容。為了克服該問題,日本特開平11-066196(1999)號公報(bào)公開了一種發(fā)明,其中,對紙文檔進(jìn)行光學(xué)讀取,并且能夠生成可以在與利用目的相對應(yīng)的各種計(jì)算機(jī)中利用的文檔。具體地說,通過對圖及圖號產(chǎn)生超文本來生成電子文檔。接著,使用鼠標(biāo)等點(diǎn)擊文本中的“圖號”,由此能夠在畫面上顯示與“圖號”相對應(yīng)的圖。然而,在日本特開平11-066196(1999)號公報(bào)中,生成了從“文本中的錨表述”到“對象”的鏈接信息,而未生成在相反方向上從“對象”到“文本中的錨表述”或者到“對象的描述文本”的鏈接信息。因此,從“對象”搜索“對象的描述文本”耗費(fèi)時(shí)間。對于閱讀者來說,首先閱讀“對象的描述文本”并參照“文本中的錨表述”來尋找“對象”,之后返回先前剛剛閱讀的“對象的描述文本”,也耗費(fèi)時(shí)間。換句話說,搜索“對象的描述文本”的位置(哪頁、哪段以及哪行)耗費(fèi)時(shí)間。
發(fā)明內(nèi)容為了克服上述問題,根據(jù)本發(fā)明的圖像處理設(shè)備包括輸入單元,其被配置為輸入文檔圖像數(shù)據(jù);區(qū)域劃分單元,其被配置為根據(jù)屬性將所述文檔圖像數(shù)據(jù)劃分為多個區(qū)域,所劃分的區(qū)域包括文本區(qū)域、注釋區(qū)域以及由所述注釋區(qū)域伴隨的對象區(qū)域;字符識別單元,其被配置為通過對所述區(qū)域劃分單元劃分的所述文本區(qū)域和所述注釋區(qū)域中的各個內(nèi)的各個字符執(zhí)行字符識別處理來獲得字符信息;錨表述提取單元,其被配置為從所述注釋區(qū)域中的字符信息中提取包括識別所述對象區(qū)域的預(yù)定字符串的錨表述;文本搜索單元,其被配置為從所述文本區(qū)域中的字符信息中搜索由所述錨表述提取單元提取的所述錨表述;鏈接信息生成單元,其被配置為生成將錨表述周邊區(qū)域與圖像周邊區(qū)域相互關(guān)聯(lián)的雙向鏈接信息,所述錨表述周邊區(qū)域是包括所述文本搜索單元在所述文本區(qū)域中搜索的所述錨表述的區(qū)域,所述圖像周邊區(qū)域是包括所述對象區(qū)域的區(qū)域;以及格式轉(zhuǎn)換單元,其被配置為生成包括文檔圖像數(shù)據(jù)和雙向鏈接信息的電子文檔數(shù)據(jù)。在本發(fā)明中,在“對象”與“對象的描述文本”之間,自動生成作為本發(fā)明的特征并且包括雙向鏈接信息的電子文檔數(shù)據(jù),由此能夠獲得以下效果。當(dāng)閱讀者閱讀“包括錨表述的文本”(即“對象的描述文本”),并搜索相應(yīng)的“對象”時(shí),能夠通過簡單的操作顯示“對^fe”家。從以下對示例性實(shí)施例的描述(參照附圖),本發(fā)明的其它特征將變得清楚。圖1是示出本發(fā)明的圖像處理系統(tǒng)的框圖;圖2是示出MFP100的配置的示例的框圖;圖3是示出數(shù)據(jù)處理部218的配置的示例的框圖;圖4是示出鏈接處理部304的配置的示例的框圖;圖5A示出了圖像數(shù)據(jù)的示例;圖5B示出了由數(shù)據(jù)處理部生成的各種數(shù)據(jù);圖5C示出了對應(yīng)表;圖6示出了在本發(fā)明中使用的輸入圖像數(shù)據(jù)上的電子文檔數(shù)據(jù)的示例;圖7示出了第一實(shí)施例中的總體處理的流程圖;圖8示出了第一實(shí)施例中的鏈接處理的流程圖;圖9A示出了第一實(shí)施例中的圖像數(shù)據(jù)的示例;圖9B示出了第一實(shí)施例中的由數(shù)據(jù)處理部生成的各種數(shù)據(jù);圖9C示出了第一實(shí)施例中的鏈接信息;圖9D示出了第一實(shí)施例中的電子文檔的示例;圖10A-10C是示出第一實(shí)施例中的應(yīng)用進(jìn)行的顯示示例的圖;圖IlA和IlB是示出第一實(shí)施例中的圖形數(shù)據(jù)的圖;圖12A示出了第二實(shí)施例中的圖像數(shù)據(jù)的示例;圖12B示出了第二實(shí)施例中的由數(shù)據(jù)處理部生成的各種數(shù)據(jù);圖12C示出了第二實(shí)施例中的鏈接信息以及候選對象顯示信息;圖13示出了第二實(shí)施例中的鏈接處理的流程圖;圖14A示出了第二實(shí)施例中的點(diǎn)擊錨表述周邊區(qū)域時(shí)的流程圖;圖14B示出了第二實(shí)施例中的點(diǎn)擊圖像周邊區(qū)域時(shí)的流程圖;圖15A-15G示出了圖示第二實(shí)施例中的應(yīng)用進(jìn)行的顯示示例的圖;圖16A示出了文檔的示例;圖16B示出了由N頁構(gòu)成的文檔的示例;以及圖16C示出了在同一頁上對象與對象的描述文本的位置相互分離的情況的示例。具體實(shí)施例方式下面,參照本發(fā)明的優(yōu)選實(shí)施例。(第一實(shí)施例)圖1是示出本實(shí)施例的圖像處理系統(tǒng)的配置的框圖。在圖1中,作為具有多個功能(復(fù)印功能、打印功能、發(fā)送功能等)的復(fù)合機(jī)的MFP(多功能外圍設(shè)備)100連接到辦公室A中構(gòu)建的LAN102。LAN102還通過代理服務(wù)器103連接到網(wǎng)絡(luò)104。客戶端PC101通過LAN102接收來自MFP100的發(fā)送數(shù)據(jù),并能夠利用MFP100的功能。例如,客戶端PC101向MFP100發(fā)送打印數(shù)據(jù),由此能夠使用MFP100基于打印數(shù)據(jù)打印打印物。圖1的配置是示例,具有與辦公室A相同的構(gòu)成元素的多個辦公室可以連接到網(wǎng)絡(luò)104。網(wǎng)絡(luò)104是由互聯(lián)網(wǎng)、LAN、WAN、電話線路、專用數(shù)字線路、ATM(異步傳送模式,AsynchronousTransferMode)、幀中繼線路、通信衛(wèi)星頻道、有線電視線路、數(shù)據(jù)廣播無線電頻道等實(shí)現(xiàn)的典型通信網(wǎng)絡(luò)??梢允褂萌我饩W(wǎng)絡(luò),只要其能夠發(fā)送、接收數(shù)據(jù)即可??蛻舳薖C101和代理服務(wù)器103各種終端具有在通用計(jì)算機(jī)中安裝的標(biāo)準(zhǔn)構(gòu)成元素。例如,它們具有CPU、RAM、R0M、硬盤、外部存儲設(shè)備、網(wǎng)絡(luò)接口、顯示器、鍵盤、鼠標(biāo)等。圖2是示出作為本實(shí)施例的圖像處理機(jī)的MFP100的詳細(xì)配置的圖。圖2所示的MFP100具有作為圖像輸入設(shè)備的掃描器部201、作為圖像輸出設(shè)備的打印機(jī)部202、包括CPU205等的控制單元204、作為用戶接口等的操作部203??刂茊卧?04連接到掃描器部201、打印機(jī)部202以及操作部203;另一方面,控制單元204是當(dāng)連接到LAN219以及作為公用電話線路的公共線路(WAN)220時(shí)輸入、輸出圖像信息和設(shè)備信息的控制器。CPU205控制包括在控制單元204中的單元。RAM206是用于操作CPU205的系統(tǒng)工作存儲器,并且還是用于臨時(shí)存儲圖像數(shù)據(jù)的圖像存儲器。ROM210是存儲諸如系統(tǒng)的引導(dǎo)程序的程序的引導(dǎo)ROM。存儲部211是存儲系統(tǒng)控制軟件和圖像數(shù)據(jù)的硬盤驅(qū)動器。操作部I/F207是到操作部(UI)203的接口部,其向操作部203輸出要在操作部203上顯示的圖像數(shù)據(jù)。操作部I/F207還用來向CPU205發(fā)送圖像處理設(shè)備的用戶使用操作部203輸入的信息。網(wǎng)絡(luò)I/F208將圖像處理設(shè)備連接到LAN219,并輸入、輸出包(packet)格式的信息。調(diào)制解調(diào)器209將圖像處理設(shè)備連接到WAN220,并對數(shù)據(jù)進(jìn)行解調(diào)和調(diào)制,以輸入、輸出信息。上述設(shè)備布置在系統(tǒng)總線221上。圖像總線I/F212是將系統(tǒng)總線221與以高速傳送圖像數(shù)據(jù)的圖像總線222連接并改變數(shù)據(jù)結(jié)構(gòu)的總線橋。圖像總線222由例如PCI總線或者IEEE1394總線構(gòu)成。在圖像總線222上布置有以下設(shè)備。光柵圖像處理器(RIP)213分析PDL(頁面描述語言)代碼,并將它擴(kuò)展為具有指定分辨率的位像,即實(shí)現(xiàn)所謂的繪制(rendering)處理。當(dāng)進(jìn)行該擴(kuò)展時(shí),以像素為單位或者以區(qū)域?yàn)閱挝惶砑訉傩孕畔?。這被稱為圖像區(qū)域確定處理。進(jìn)行圖像區(qū)域確定處理,以針對各個像素或者各個區(qū)域添加表示對象(例如字符(文本)以及線、圖形以及圖像)的屬性信息。例如,根據(jù)PDL代碼內(nèi)的PDL描述的對象類型從RIP213輸出圖像區(qū)域信號,并將與由其信號值表示的屬性相對應(yīng)的屬性信息與對應(yīng)于對象的像素或者區(qū)域相關(guān)聯(lián)地存儲。因此,圖像數(shù)據(jù)包括相關(guān)聯(lián)的屬性信息。設(shè)備I/F214通過信號線223將作為圖像輸入設(shè)備的掃描器部201連接到控制單元204,并且通過信號線224將作為圖像輸出設(shè)備的打印機(jī)部202連接到控制單元204,由此改變圖像數(shù)據(jù)的同步系統(tǒng)/異步系統(tǒng)。掃描器圖像處理部215對輸入圖像數(shù)據(jù)進(jìn)行校正、處理和編輯。打印機(jī)圖像處理部216對需要輸出到打印機(jī)部202的打印輸出圖像數(shù)據(jù)進(jìn)行與打印機(jī)部202相對應(yīng)的校正、分辨率改變等。圖像翻轉(zhuǎn)部217對輸入的圖像數(shù)據(jù)進(jìn)行翻轉(zhuǎn)以使圖像數(shù)據(jù)豎立,并將其輸出。稍后將描述數(shù)據(jù)處理部218?,F(xiàn)在,參照圖3描述圖2所示的數(shù)據(jù)處理部218的配置和操作。數(shù)據(jù)處理部218包括區(qū)域劃分部301、屬性信息添加部302、字符識別部303、鏈接處理部304以及格式轉(zhuǎn)換部305。例如,當(dāng)接收到由掃描器部201掃描的圖像數(shù)據(jù)300時(shí),數(shù)據(jù)處理部218在各個處理部301至305進(jìn)行處理,以生成并輸出電子文檔數(shù)據(jù)310。將圖2所示的掃描器部201掃描的圖像數(shù)據(jù)或者存儲在存儲部211中的圖像數(shù)據(jù)(文檔圖像)輸入到區(qū)域劃分部301中。接著,區(qū)域劃分部301將輸入圖像數(shù)據(jù)劃分為各個區(qū)域(例如布置在頁內(nèi)的字符、照片、圖以及表)。在這種情況下,可以使用已知方法作為區(qū)域劃分方法。將說明其示例。首先,將輸入圖像二值化以生成二值圖像,并降低二值圖像的分辨率以生成稀疏(thirmed-out)圖像(縮小圖像)。例如,當(dāng)生成1/(MXN)的稀疏圖像時(shí),針對每MXN個像素劃分二值圖像,如果在MXN個像素內(nèi)存在黑色像素,則將縮小后的相應(yīng)像素設(shè)置為黑色像素,而如果不存在黑色像素,則將相應(yīng)像素設(shè)置為白色像素,由此生成稀疏圖像。接著,在稀疏圖像中,提取耦合到黑色像素的部分(耦合黑色像素),以生成外接耦合黑色像素的矩形。當(dāng)接近字符圖像大小的矩形(一個字符的矩形)并排布置時(shí),或者當(dāng)縱向矩形或橫向矩形是接近字符圖像大小的矩形(連接幾個字符的耦合黑色像素的矩形),并且類似的矩形布置在短邊的附近時(shí),其很可能是構(gòu)成一個字符串的字符圖像。在這種情況下,矩形相互耦合,由此獲得表示一個字符串的矩形。由于表示一個字符串的、短邊長度大體相同并且在列方向上以大體相等的間距布置的矩形組很可能是文本部分,因此將它們耦合并提取文本區(qū)域。使用大小大于字符圖像的耦合黑色像素來提取照片區(qū)域、圖區(qū)域以及表區(qū)域。結(jié)果,將其劃分為例如圖5A所示的區(qū)域501至506。如稍后所描述的,基于其大小、縱橫比、黑色像素密度、通過跟蹤耦合黑色像素中包括的白色像素的輪廓而獲得的結(jié)果等來確定各個區(qū)域的屬性。將劃分的區(qū)域作為區(qū)域信息存儲在存儲部211中。屬性信息添加部302向由區(qū)域劃分部301進(jìn)行劃分而獲得的各個區(qū)域添加屬性?,F(xiàn)在,使用圖5A所示的輸入圖像數(shù)據(jù)500作為示例說明屬性信息添加部302的處理操作。由于區(qū)域506由連續(xù)字符串構(gòu)成,使得其在頁內(nèi)具有特定數(shù)量的字符和行以及一定數(shù)量的字符和行、段落等的形式,因此屬性信息添加部302向區(qū)域506添加“文本”屬性。首先確定剩余區(qū)域是否包括接近字符圖像大小的矩形。尤其,由于字符圖像的矩形周期性地出現(xiàn)在包括字符圖像的區(qū)域內(nèi),因此能夠確定在該區(qū)域中是否包括字符。結(jié)果,屬性信息添加部302將區(qū)域501、504以及505視為包括字符的區(qū)域,并向這些區(qū)域添加“字符”屬性。由于這些區(qū)域不具有一定數(shù)量的字符和行、段落等的形式,因此它們與文本區(qū)域不同。另一方面,當(dāng)其它區(qū)域的大小非常小時(shí),屬性信息添加部302確定這些區(qū)域?yàn)椤霸肼暋?。?dāng)屬性信息添加部302對像素密度小的耦合黑色像素的內(nèi)部進(jìn)行白色像素輪廓跟蹤,并且外接白色像素輪廓的矩形規(guī)則地布置時(shí),屬性信息添加部302確定這些區(qū)域?yàn)椤氨怼保?dāng)它們未規(guī)則地布置時(shí),確定這些區(qū)域?yàn)椤熬€圖(圖)”。將像素密度高的其它區(qū)域確定為圖片或照片,并向其添加“照片”屬性。添加了“表”、“線圖”以及“照片”屬性的區(qū)域與上述“對象”相對應(yīng),其特征在于它們具有字符以外的屬性。此外,當(dāng)在添加了“表”、“線圖”以及“照片”屬性的區(qū)域的附近(例如區(qū)域的上面或者下面)存在被確定為不是文本的字符區(qū)域時(shí),屬性信息添加部302確定其為描述“表”、“線圖”以及“照片”的區(qū)域的字符區(qū)域。接著,屬性信息添加部302向該區(qū)域添加“注釋”屬性。將添加了“注釋”屬性的區(qū)域與伴隨“注釋”的區(qū)域彼此相關(guān)聯(lián)地存儲在添加了“注釋”屬性的區(qū)域中,以便識別伴隨“注釋”的區(qū)域(對象“表”、“線圖”以及“照片”)。具體地說,如圖5B所示,在區(qū)域505(注釋區(qū)域)中,將“伴隨注釋的區(qū)域”的項(xiàng)目與“區(qū)域503”相關(guān)聯(lián)。屬性信息添加部302向布置在與文本部分的欄不同的位置的、大于文本部分的字符圖像的區(qū)域添加“標(biāo)題”屬性。屬性信息添加部302向位于文本區(qū)域的欄的上部的、大于文本區(qū)域的字符圖像的區(qū)域添加“小標(biāo)題”屬性。此外,屬性信息添加部302向位于由大小比文本區(qū)域的字符圖像小的字符圖像構(gòu)成并構(gòu)成圖像數(shù)據(jù)的頁的下端部和上端部的區(qū)域,添加“頁”(或者“頁眉”或“頁腳”)屬性。屬性信息添加部302向被確定為字符區(qū)域、但不與“文本”、“標(biāo)題”、“小標(biāo)題”、“注釋”以及“頁”中的任意一個相對應(yīng)的區(qū)域,添加“字符”屬性。當(dāng)進(jìn)行上述屬性信息添加處理時(shí),在圖5A所示的圖像數(shù)據(jù)中,向區(qū)域501添加“標(biāo)題”屬性,向區(qū)域502添加“表”屬性,向區(qū)域503添加“照片”屬性,向區(qū)域504添加“字符”屬性,向區(qū)域505添加“注釋”屬性,并且向區(qū)域506添加“文本”屬性。由于向區(qū)域505添加了“注釋”屬性,因此將區(qū)域503作為伴隨“注釋”的區(qū)域與區(qū)域505相關(guān)聯(lián)。添加了“照片”屬性的區(qū)域503適用于本實(shí)施例中的“對象”,并且由于區(qū)域506包括作為錨表述的“圖1”,因此添加了“文本”屬性的區(qū)域506適用于先前描述的“對象的描述文本”。屬性信息添加部302進(jìn)行的屬性的添加表示例如,如在圖5B所示的數(shù)據(jù)表中,將確定的屬性與通過區(qū)域劃分部301進(jìn)行的劃分而獲得的各個區(qū)域相關(guān)聯(lián),并存儲在存儲部211等中。字符識別部303對包括字符圖像的區(qū)域(即屬性為“字符”、“文本”、“標(biāo)題”、“小標(biāo)題”以及“注釋”等的區(qū)域),進(jìn)行已知的字符識別處理,并且將結(jié)果作為字符信息與關(guān)注區(qū)域相關(guān)聯(lián),并將其存儲在存儲部211中。例如,如圖5B所示,在區(qū)域501以及504至506中,“字符信息”的項(xiàng)目與作為字符識別處理的結(jié)果的字符信息相關(guān)聯(lián)。如上所述,針對各個區(qū)域,將由區(qū)域劃分部301、屬性信息添加部302以及字符識別部303提取的關(guān)于位置、大小和區(qū)域?qū)傩缘男畔?、關(guān)于頁的信息、關(guān)于字符識別結(jié)果的字符信息(字符代碼信息)等相關(guān)聯(lián),并將這些信息存儲在存儲部211中。例如,當(dāng)處理圖5A所示的輸入圖像數(shù)據(jù)示例時(shí),圖5B中示出了存儲在存儲部211中的數(shù)據(jù)表的示例。盡管在圖5A和圖5B中,省略了詳細(xì)說明,但是優(yōu)選對屬性為“表”的區(qū)域中的字符圖像的區(qū)域給予“表中的字符”的屬性,對其進(jìn)行字符識別處理,并將處理的結(jié)果作為字符信息進(jìn)行存儲。如圖5B所示,由于區(qū)域504是關(guān)于包括在照片或者圖中的字符圖像的區(qū)域,因此添加“503的照片內(nèi)”的屬性。鏈接處理部304生成屬性信息添加部302檢測到的伴隨注釋的區(qū)域(屬性為“照片”、“線圖”、“表”、“圖示”等的區(qū)域)與“包括錨表述的文本”之間的鏈接信息。接著,鏈接處理部304將生成的鏈接信息存儲在存儲部211中。稍后說明鏈接處理部304的細(xì)節(jié)。格式轉(zhuǎn)換部305使用從區(qū)域劃分部301、屬性信息添加部302、字符識別部303以及鏈接處理部304獲得的信息,將輸入圖像數(shù)據(jù)300轉(zhuǎn)換為電子文檔數(shù)據(jù)310。電子文檔數(shù)據(jù)310的示例包括諸如SVG、XPS(XML紙張規(guī)范,XMLPaperSpecification)、PDF(可移植文PortableDocumentFormat)L^l^OfficeOpenXML(njJfMfeidIg-WExtensibleMarkupLanguage)的文件格式。將轉(zhuǎn)換后的電子文檔數(shù)據(jù)310存儲在存儲部211中,或者通過LAN102發(fā)送到客戶端PC101。文檔的用戶使用安裝在客戶端PC101中的應(yīng)用(例如InternetExplorer,AdobeReader或者M(jìn)SOffice)來閱讀電子文檔數(shù)據(jù)310。稍后將詳細(xì)描述使用應(yīng)用對電子文檔數(shù)據(jù)310的閱讀。電子文檔數(shù)據(jù)310包括使用圖形等的頁顯示信息(例如用于顯示的圖像)以及使用字符等的語義描述的內(nèi)容信息(例如元數(shù)據(jù))。在格式轉(zhuǎn)換部305中進(jìn)行的處理主要是兩個。一個是對各個區(qū)域進(jìn)行平坦和平滑、邊緣增強(qiáng)、顏色量化、二值化等,以進(jìn)行轉(zhuǎn)換為指定格式的處理并使得能夠存儲在電子文檔數(shù)據(jù)310中。對例如屬性為“字符”、“線圖”或者“表”的區(qū)域,進(jìn)行向矢量路徑描述的圖形數(shù)據(jù)(矢量數(shù)據(jù))或者向位圖描述的圖形數(shù)據(jù)(JPEG數(shù)據(jù))的轉(zhuǎn)換。作為向矢量數(shù)據(jù)的轉(zhuǎn)換的技術(shù),可以使用已知的矢量化技術(shù)。使存儲在存儲部211中的區(qū)域信息(位置、大小以及屬性)、區(qū)域內(nèi)的字符信息以及鏈接信息與它們相對應(yīng),并進(jìn)行向電子文檔數(shù)據(jù)310的轉(zhuǎn)換。在格式轉(zhuǎn)換部305中,對各個區(qū)域進(jìn)行的轉(zhuǎn)換處理方法根據(jù)區(qū)域?qū)傩远煌@?,矢量轉(zhuǎn)換處理適用于顏色由黑白或者幾種顏色構(gòu)成的圖形(例如字符和線圖),而矢量轉(zhuǎn)換處理不適用于具有灰階(gradation)的圖像區(qū)域(例如照片)。為了根據(jù)各個區(qū)域的屬性如上所述進(jìn)行適當(dāng)?shù)霓D(zhuǎn)換,預(yù)先設(shè)置圖5C所示的對應(yīng)表,并基于該對應(yīng)表進(jìn)行轉(zhuǎn)換處理。例如,根據(jù)圖5C所示的對應(yīng)表,對屬性是“字符”、“線圖”以及“表”的區(qū)域進(jìn)行矢量轉(zhuǎn)換處理,而對具有“照片”屬性的區(qū)域進(jìn)行圖像剪切(clipping)處理。在圖5C所示的對應(yīng)表中,與各個屬性相關(guān)聯(lián)地存儲表示是否存在用于從圖像數(shù)據(jù)300中擦除區(qū)域的圖像信息的處理的數(shù)據(jù)。例如,當(dāng)根據(jù)圖5C所示的對應(yīng)表將“字符”屬性的區(qū)域轉(zhuǎn)換為矢量路徑描述數(shù)據(jù)時(shí),指示存在擦除處理。因此,對圖像數(shù)據(jù)300進(jìn)行使用周圍顏色涂覆與由轉(zhuǎn)換后的矢量路徑覆蓋的部分相對應(yīng)的像素的處理。同樣,當(dāng)作為矩形圖像部分剪切“照片”屬性的區(qū)域時(shí),對圖像數(shù)據(jù)300進(jìn)行使用周圍顏色等涂覆與剪切的區(qū)域相對應(yīng)的區(qū)域范圍的處理。進(jìn)行上述擦除處理的目的是,可以利用對各個區(qū)域的處理完成后(涂覆處理完成之后)的圖像數(shù)據(jù)300作為“背景”的圖像的部分?jǐn)?shù)據(jù)。在該用于背景的圖像數(shù)據(jù)(背景圖像)中,剩余通過區(qū)域劃分處理的劃分而獲得的區(qū)域以外的部分(例如與圖像數(shù)據(jù)300內(nèi)的基底相對應(yīng)的像素)。當(dāng)描述電子文檔數(shù)據(jù)310時(shí),通過將通過矢量轉(zhuǎn)換處理或圖像剪切處理獲得的圖形數(shù)據(jù)(前景圖像)疊加在背景圖像部分?jǐn)?shù)據(jù)(背景圖像)上并顯示它來進(jìn)行描述。以這種方式,能夠防止背景圖像(基底的顏色)的信息缺失,并且能夠形成無冗余的圖形數(shù)據(jù)。因此,盡管對“字符”屬性的區(qū)域(字符區(qū)域)進(jìn)行使用二值化的圖像剪切處理以及從圖像數(shù)據(jù)300的圖像擦除處理,但是不能對其它屬性的區(qū)域進(jìn)行矢量化處理和圖像剪切處理。換句話說,在背景圖像部分?jǐn)?shù)據(jù)內(nèi)剩余未進(jìn)行處理的像素(屬性為“照片”、“線圖”或“表”的區(qū)域內(nèi)的像素信息),并以將“字符”的圖像部分疊加在背景圖像上的方式描述它們。預(yù)先準(zhǔn)備多個圖5C所示的對應(yīng)表,可以根據(jù)作為輸出的電子文檔數(shù)據(jù)310的用途以及電子文檔的內(nèi)容來進(jìn)行選擇。例如,基于圖5C所示的對應(yīng)表的輸出適合圖形編輯器等的再利用用途,因?yàn)榇蟛糠謱ο蟊晦D(zhuǎn)換為矢量路徑描述,從而在放大或縮小時(shí)圖像質(zhì)量良好。在其它對應(yīng)表中,以各種字符顏色為基礎(chǔ)作為各個二值圖像生成字符圖像,并進(jìn)行可逆壓縮,因此能夠再現(xiàn)高質(zhì)量的字符圖像部分,將其它部分作為背景圖像進(jìn)行JPEG壓縮,因此能夠提高數(shù)據(jù)大小的壓縮率。該方法適合提高壓縮率以及生成容易閱讀字符圖像的數(shù)據(jù)。通過如上所述的可選擇使用,能夠使生成的電子文檔數(shù)據(jù)合適。在圖6中示出了生成的電子文檔數(shù)據(jù)310的示例。在圖6所示的示例中,示出了通過在處理圖5A所示的圖像數(shù)據(jù)500時(shí)基于存儲在存儲部211中的數(shù)據(jù)表(圖5B)進(jìn)行SVG(可縮放矢量圖形,scalablevectorgraphics)格式的描述而獲得的示例。盡管這里使用SVG格式作為示例給出了描述,但是格式不限于SVG格式。可以使用PDF、XPS、0fficeOpenXML、基于其它PDL的數(shù)據(jù)格式等代替。圖6的描述601至606分別是對圖5A所示的區(qū)域501至506的圖形描述。這里,描述601、604、605和606是與字符代碼相對應(yīng)的字符描繪描述的示例;描述602是矢量轉(zhuǎn)換表的框的矢量路徑描述的示例;描述603是指示附加了進(jìn)行了剪切處理的照片圖像的描述的示例。在圖5B和圖6的示例中,在使用諸如坐標(biāo)值Xl和Yl的符號描述的部分中實(shí)際描述值。描述607是對鏈接信息的描述的示例。描述607由描述608和609構(gòu)成。描述608是從“與注釋相關(guān)聯(lián)的區(qū)域(以下稱為對象)”到“對象的描述文本”的鏈接信息。描述610是鏈接標(biāo)識符,并與由描述603指示的對象以及由描述611指示的圖形數(shù)據(jù)相關(guān)聯(lián)。這里,圖形數(shù)據(jù)是指,例如當(dāng)在正在使用應(yīng)用閱讀在本實(shí)施例的輸入圖像中生成的電子文檔的同時(shí),使用鼠標(biāo)點(diǎn)擊文本區(qū)域中的錨表述時(shí)顯示的描繪信息。描述612是關(guān)于操作的信息。換句話說,描述612是關(guān)于當(dāng)文檔的閱讀者使用應(yīng)用閱讀電子文檔數(shù)據(jù)310時(shí)由描述611指示的圖像數(shù)據(jù)的信息。作為另選方案,描述612是關(guān)于當(dāng)按下(或者選擇)由與由描述610指示的鏈接標(biāo)識符相關(guān)聯(lián)的描述603指示的對象時(shí)在應(yīng)用側(cè)的操作的信息。描述609是從“對象的描述文本”到“對象”的鏈接信息。描述613至615與描述610至612相同。圖4是示出鏈接處理部304的配置的示例的框圖。下面說明由鏈接處理部304進(jìn)行的處理的內(nèi)容。鏈接信息提供目標(biāo)選擇部401對輸入的圖像數(shù)據(jù)選擇鏈接信息生成的目標(biāo)對象。錨表述提取部402對伴隨由鏈接信息提供目標(biāo)選擇部401選擇的對象的注釋區(qū)域中的字符信息進(jìn)行分析,并從分析的字符信息中提取錨表述。當(dāng)找到錨表述時(shí),錨表述提取部402從字符信息中提取相應(yīng)的部分作為錨表述,并提取其它部分作為注釋表述。錨表述提取部402還具有使用字符代碼的特性、詞典等去除無用的字符串(例如無意義的符號串)的功能。這是因?yàn)?,錨表述提取部402應(yīng)對字符識別的錯誤識別等,在該錯誤識別中,將出現(xiàn)在文檔的文本部分的邊界的修飾(decoration)、分隔線以及圖像解釋為字符。為了提取錨表述,在詞典中存儲諸如圖號的多語言字符串模式以及相應(yīng)的字符識別的錯誤識別模式,因此能夠提高錨表述的提取精度并進(jìn)行錨表述的字符校正。可以以如上所述相同的方式處理注釋表述。換句話說,可以進(jìn)行使用自然語言處理的分析、字符識別的錯誤識別校正等,并且還可以給出以下功能校正出現(xiàn)在錨表述的邊界以及錨表述的前后的符號、字符修飾等并且將它們?nèi)コ?。文本搜索?03使用由錨表述提取部402提取的錨表述來搜索文檔的各個文本區(qū)域中的字符信息,并檢測相同的錨表述。文本搜索部403在包括提取的錨表述并描述對象的文本中的描述表述(即“對象的描述文本”)中指定相應(yīng)的區(qū)域。這里,能夠生成用于實(shí)現(xiàn)高速搜索的搜索索引(作為生成索引的技術(shù)以及利用它來實(shí)現(xiàn)高速搜索的技術(shù),可以使用已知的索引生成/搜索技術(shù))。而且,通過使用大量錨表述的批量搜索,也能夠?qū)崿F(xiàn)高速搜索。通過對“對象的描述文本”存儲和利用諸如圖號的多語言字符串模式以及相應(yīng)的字符識別的錯誤識別模式,能夠提供提高搜索精度以及進(jìn)行校正的功能。鏈接信息生成部404生成將由鏈接信息提供目標(biāo)選擇部401選擇的對象與由文本搜索部403搜索并提取的“對象的描述文本”相關(guān)聯(lián)的鏈接信息。具體地說,鏈接信息生成部404根據(jù)選擇的“對象”生成指示指定的“對象的描述文本”的鏈接信息。同時(shí),鏈接信息生成部404根據(jù)“對象的描述文本”(主要是文本中的錨表述)生成反方向的鏈接信息,即指示“對象”的鏈接信息。將生成的鏈接信息作為鏈接信息413存儲在存儲部211中。在本實(shí)施例中,將與一個方向相關(guān)聯(lián)的鏈接信息稱為單向鏈接信息,而將與兩個方向相關(guān)聯(lián)的鏈接信息稱為雙向鏈接信息。鏈接信息收集/輸出部405使用由鏈接信息生成部404生成的鏈接信息413,將它轉(zhuǎn)換為格式轉(zhuǎn)換部305能夠處理的格式,并將其輸出。因此,格式轉(zhuǎn)換部305生成電子文檔數(shù)據(jù)310。鏈接處理控制部406總體控制鏈接處理部304。鏈接處理控制部406主要將圖像數(shù)據(jù)300的各個區(qū)域,與存儲在圖2的存儲部211中的區(qū)域信息411(關(guān)于與各個區(qū)域相關(guān)聯(lián)的位置、大小以及屬性的信息)以及區(qū)域內(nèi)的字符信息412—起,分配給適當(dāng)?shù)奶幚聿?01至405。鏈接處理控制部406還進(jìn)行將從處理部401至405輸出的信息給送到適當(dāng)?shù)奶幚聿康目刂啤H鐖D5B所示,區(qū)域信息411和字符信息412以與由區(qū)域劃分部301對圖像數(shù)據(jù)300進(jìn)行劃分而獲得的各個區(qū)域相關(guān)聯(lián)的數(shù)據(jù)表的格式,存儲在存儲部211中使用實(shí)際進(jìn)行處理的示例,再次更詳細(xì)地說明鏈接處理部304的各個部分的操作?,F(xiàn)在,參照圖7的流程圖,說明第一實(shí)施例的圖像處理系統(tǒng)進(jìn)行的總體處理的概要。假定圖7所示的流程圖由圖2的數(shù)據(jù)處理部218(圖3的處理部301至305)進(jìn)行。在本實(shí)施例中,CPU205讀取并執(zhí)行存儲在存儲部211(計(jì)算機(jī)可讀存儲介質(zhì))中的計(jì)算機(jī)程序,由此用作數(shù)據(jù)處理部218(圖3的處理部301至305)。然而,應(yīng)當(dāng)注意,本發(fā)明不限于此。例如,數(shù)據(jù)處理部218(圖3的處理部301至305)可以通過諸如電子電路的硬件來實(shí)現(xiàn)。圖7是示出對由圖1的MFP100輸入的由多頁構(gòu)成的圖像數(shù)據(jù)進(jìn)行處理并將它轉(zhuǎn)換為由多頁構(gòu)成的電子文檔數(shù)據(jù)的過程的流程圖。在第一實(shí)施例中,參照圖9A所示的圖像數(shù)據(jù)描述多頁的圖像數(shù)據(jù)。下面描述圖7的流程圖的各個步驟。在步驟S701中,區(qū)域劃分部301將輸入圖像數(shù)據(jù)的一頁劃分為區(qū)域,以提取區(qū)域。例如,從圖9A所示的圖像數(shù)據(jù)901(頁1)中提取區(qū)域908。此外,在步驟S701中,如圖9B所示,區(qū)域劃分部301確定關(guān)于區(qū)域908的“坐標(biāo)X”、“坐標(biāo)Y”、“寬度W”、“高度H”以及“頁”,并將其存儲在存儲部211中。在步驟S702中,屬性信息添加部302根據(jù)在步驟S701中劃分的區(qū)域的類型,向各個區(qū)域添加屬性。例如,在圖9A所示的頁1中,向區(qū)域908添加“文本”屬性。在圖9A所示的頁3的示例中,向區(qū)域911添加“照片”屬性,而向區(qū)域912添加“注釋”屬性。還向區(qū)域912添加了指示區(qū)域911伴隨區(qū)域912的信息。換句話說,區(qū)域911是上述的“對象”。添加了“照片”屬性的照片區(qū)域911是本實(shí)施例中的“對象”,由于包括稍后描述的錨表述,因此添加了“文本”屬性的文本區(qū)域908是“對象的描述文本”。屬性信息添加部302將“屬性”和“伴隨注釋的區(qū)域”與相應(yīng)的各個區(qū)域相關(guān)聯(lián),并將其存儲在存儲部211中。在步驟S703中,字符識別部303對在步驟S702中添加了字符屬性(例如文本、注釋、標(biāo)題或小標(biāo)題)的區(qū)域進(jìn)行字符識別處理,將結(jié)果作為字符信息與該區(qū)域相關(guān)聯(lián),并將其存儲在存儲部211中。例如,在步驟S703中,將圖9B所示的“字符信息”作為字符識別處理的結(jié)果存儲在存儲部211中。在步驟S704中,數(shù)據(jù)處理部218確定是否對所有頁進(jìn)行了步驟S701至S703的處理。如果對所有頁進(jìn)行了處理(步驟S704中的“是”),則處理進(jìn)入步驟S705。如果存在未處理的頁(步驟S704中的“否”),則處理返回步驟S701。如上所述,對圖9A所示的四頁圖像數(shù)據(jù)901至904,進(jìn)行步驟S701至S704的處理。接著,在步驟S705中,鏈接處理部304進(jìn)行用于錨表述的提取、圖形數(shù)據(jù)的生成以及鏈接信息的生成的鏈接處理。稍后參照圖8的流程圖,描述在步驟S705中由鏈接處理部304進(jìn)行的鏈接處理的細(xì)節(jié)。在鏈接處理完成之后,處理進(jìn)入步驟S706。在步驟S706中,格式轉(zhuǎn)換部305基于如圖9B和9C所示的存儲在存儲部211中的信息,將圖像數(shù)據(jù)300轉(zhuǎn)換為電子文檔數(shù)據(jù)310。如圖4所述,格式轉(zhuǎn)換部305根據(jù)指示需要對各個區(qū)域進(jìn)行的轉(zhuǎn)換處理方法的對應(yīng)表,對圖像數(shù)據(jù)300內(nèi)的區(qū)域進(jìn)行轉(zhuǎn)換處理。這里,假定使用圖5C所示的對應(yīng)表進(jìn)行轉(zhuǎn)換。至此,對圖7的說明完成?,F(xiàn)在,參照圖8的流程圖描述圖7的步驟S705中的鏈接處理的細(xì)節(jié)。在步驟S801中,鏈接信息提供目標(biāo)選擇部401參照存儲在存儲部211中的區(qū)域信息411,并從指示“對象”的區(qū)域(諸如圖、照片以及圖示的區(qū)域)中選擇未進(jìn)行鏈接信息生成處理的區(qū)域中的一個。換句話說,如果存在未處理的對象,則選擇未處理的對象作為要處理的對象,接著處理進(jìn)入步驟S802。如果不存在對象,或者已處理了所有對象,則處理進(jìn)入步驟S812。例如,從圖9A所示的四頁的圖像數(shù)據(jù)901至904中,首先選擇照片區(qū)域911。在步驟S802中,針對鏈接信息提供目標(biāo)選擇部401選擇的對象,錨表述提取部402從伴隨對象的注釋區(qū)域中的字符信息中,提取錨表述和注釋表述。這里,錨表述是指用于識別對象的字符信息(字符串),注釋表述是指用于描述對象的字符信息(字符串)。在包括在伴隨對象的注釋區(qū)域中的字符信息中,可能存在以下情況其中僅描述了錨表述的情況;其中僅描述了注釋表述的情況;其中描述了兩種表述的情況;以及其中未描述這些表述的情況。例如,錨表述經(jīng)常被表述為諸如“附圖”或“圖”的特定字符串與編號或符號的組合。因此,預(yù)先準(zhǔn)備登記了那些特定字符串的錨字符串詞典,通過將注釋表述與詞典進(jìn)行比較,能夠識別錨表述(即錨字符串+編號/符號)。在注釋區(qū)域中的字符串中,將錨表述以外的字符串確定為注釋表述。換句話說,對于注釋區(qū)域912中的字符信息“圖1AAA”來說,錨表述是“圖1”,注釋表述是“AAA”。具體地說,如圖9B所示,由于將注釋區(qū)域912作為伴隨照片區(qū)域911的注釋而相關(guān)聯(lián),因此錨表述提取部402從注釋區(qū)域912中的字符信息中,提取錨表述“圖1”。接著,如圖9B所示,錨表述提取部402將注釋區(qū)域912與錨表述“圖1”相關(guān)聯(lián),并將其存儲在存儲部211中。如果在步驟S802中,在選擇的對象中不存在注釋區(qū)域,或者在與注釋區(qū)域相對應(yīng)的字符信息中不包括錨表述,則不提取錨表述。在步驟S803中,鏈接處理控制部406確定在步驟S802中是否從注釋區(qū)域中提取了錨表述。如果提取了錨表述(步驟S803中的“是”),則處理進(jìn)入步驟S804,而如果未提取錨表述(步驟S803中的“否”),則處理返回步驟S801。由于在圖9A所示的圖像數(shù)據(jù)中,從與對象911相關(guān)的注釋區(qū)域912中提取了錨表述,因此處理進(jìn)入步驟S804。在步驟S804中,文本搜索部403在存儲在存儲部211中的文本區(qū)域中的字符信息中,搜索與由錨表述提取部402提取的錨表述相同的錨表述。例如,文本搜索部403在圖9B所示的文本區(qū)域908、910和913中的字符信息中,搜索與從注釋區(qū)域912中提取的相同錨表述。這里,由于在與文本區(qū)域908相對應(yīng)的字符信息中包括“圖1”,因此文本搜索部403從文本區(qū)域908中的字符信息中提取該錨表述。在步驟S805中,文本搜索部403確定在步驟S804中是否從文本區(qū)域中的字符信息中檢測到了錨表述。如果檢測到了錨表述(步驟S805中的“是”),則處理進(jìn)入步驟S806,而如果未檢測到錨表述(步驟S805中的“否”),則處理返回到步驟S801。如果在步驟S805中從文本區(qū)域中檢測到了錨表述,則將該文本區(qū)域與錨表述相關(guān)聯(lián),并將其存儲在存儲部中。例如,如圖9B所示,將文本區(qū)域908與錨表述“圖1”相關(guān)聯(lián),并將其存儲在存儲部211中。以下,在步驟S806和S807中,進(jìn)行對在步驟S801中選擇的對象的處理。此外,在步驟S808和S809中,進(jìn)行對在步驟S804中檢測到了錨表述的文本區(qū)域的處理。在步驟S806中,鏈接信息生成部404生成關(guān)于對象的鏈接標(biāo)識符,將其與由鏈接信息提供目標(biāo)選擇部401選擇的對象相關(guān)聯(lián),并將其存儲在存儲部211中。例如,如圖9B所示,鏈接信息生成部404生成鏈接標(biāo)識符“imageJU”,將鏈接標(biāo)識符與對象的照片區(qū)域911相關(guān)聯(lián)。如果存在M個與對象相對應(yīng)的區(qū)域,則鏈接信息生成部404作為鏈接標(biāo)識符“image_01"至“image_M”生成M個鏈接標(biāo)識符,并將其與相應(yīng)的區(qū)域相關(guān)聯(lián)。在步驟S807中,鏈接信息生成部404生成關(guān)于對象的圖形數(shù)據(jù),將圖形數(shù)據(jù)與在步驟S806中生成的鏈接標(biāo)識符相關(guān)聯(lián),并將其存儲在存儲部211中。這里,在步驟S807中生成的圖形數(shù)據(jù)指示至少包括對象內(nèi)的圖、表等的圖像周邊區(qū)域。例如,如圖9C所示,圖形數(shù)據(jù)是由“坐標(biāo)X”、“坐標(biāo)Y”、“寬度W”和“高度H”構(gòu)成的數(shù)據(jù)。在圖9C的示例中,與鏈接標(biāo)識符“imageJU”相關(guān)聯(lián)的圖形數(shù)據(jù)(“坐標(biāo)X”、“坐標(biāo)Y”、“寬度W”和“高度H”)=(“X15”、“Y15”、“W15”和“H15”),指示圖IlA所示的圖像周邊區(qū)域1102。換句話說,在坐標(biāo)X(X15)、坐標(biāo)Y(Y15)的位置,區(qū)域是寬度W為“W15”并且高度H為“Η15”的區(qū)域。與圖9C的915所示的鏈接標(biāo)識符“imageJU”相關(guān)聯(lián)的顏色,指示當(dāng)稍后描述的應(yīng)用作為矩形線段表示圖像周邊區(qū)域1102時(shí)的線段的顏色。該顏色可以設(shè)置為任意顏色。盡管在本實(shí)施例中,將基于圖形數(shù)據(jù)的圖形描述為矩形,但是圖形不限于矩形,可以使用任意形狀。在步驟S808中,鏈接信息生成部404生成關(guān)于文本區(qū)域的鏈接標(biāo)識符,將其與具有由文本搜索部403檢測到的“錨表述”的文本區(qū)域相關(guān)聯(lián),并將其存儲在存儲部211中。例如,如圖9B所示,鏈接信息生成部404生成鏈接標(biāo)識符“text_01”,并將該鏈接標(biāo)識符與文本區(qū)域908相關(guān)聯(lián)。如果存在N個具有相同錨表述的文本區(qū)域,則鏈接信息生成部404作為鏈接標(biāo)識符“textJU”至“text_N”生成N個鏈接標(biāo)識符,并將其與相應(yīng)的區(qū)域相關(guān)聯(lián)。接著,在步驟S809中,鏈接信息生成部404生成圖形數(shù)據(jù),將圖形數(shù)據(jù)與在步驟S808中生成的鏈接標(biāo)識符相關(guān)聯(lián),并將其存儲在存儲部211中。這里,在步驟S809中生成的圖形數(shù)據(jù)指示至少包括在步驟S804中提取的錨表述的錨表述周邊區(qū)域。例如,圖9C所示的與鏈接標(biāo)識符“textJU”相關(guān)聯(lián)的圖形數(shù)據(jù)(“坐標(biāo)X”、“坐標(biāo)Y”、“寬度W”和“高度H”)=(“X14”、“Y14”、“W14”和“H14”),指示錨表述周邊區(qū)域1101。換句話說,在坐標(biāo)X(X14)、坐標(biāo)Y(Y14)的位置,區(qū)域是寬度W為“W14”并且高度H為“Η14”的區(qū)域;如圖IlA所示,該區(qū)域至少包括錨表述“圖1”。如同圖IlB所示的錨表述周邊區(qū)域1103那樣,該區(qū)域的范圍不僅僅是錨表述“圖1”的周邊,該范圍可以是包括錨表述的整個文本區(qū)域。盡管在本實(shí)施例中,將由圖形數(shù)據(jù)指示的錨表述周邊區(qū)域以及圖像周邊區(qū)域描述為矩形,但是其不限于矩形,可以使用任意形狀、線等,只要其是突出顯示的描繪信息以便應(yīng)用的閱讀者容易地理解即可。在步驟S810中,鏈接信息生成部404生成從“對象”到“對象的描述文本”的鏈接。生成的鏈接信息包括指示當(dāng)本實(shí)施例中的電子文檔的閱讀者對對象采取任意動作時(shí)的響應(yīng)操作的信息。響應(yīng)操作是指例如當(dāng)閱讀者用鼠標(biāo)等點(diǎn)擊正在閱讀的電子文檔內(nèi)的對象時(shí)、移動到存在針對對象的描述表述的頁的操作,以及使用指定顏色突出顯示與鏈接目的地相對應(yīng)的圖形數(shù)據(jù)部分的操作。這里,步驟S810中的鏈接的生成與圖9C所示的鏈接信息915中的“閱讀者的動作”以及“應(yīng)用的動作”相關(guān)。圖9C所示的“閱讀者的動作”與關(guān)于閱讀者對對象進(jìn)行的操作的信息相關(guān)聯(lián)。這里,就使用鼠標(biāo)等點(diǎn)擊對象而言,鏈接信息915中的“閱讀者的動作”與“點(diǎn)擊”相關(guān)聯(lián)。當(dāng)檢測到進(jìn)行了由“閱讀者的動作”指定的操作時(shí),將指示應(yīng)用如何進(jìn)行響應(yīng)操作的信息存儲在“應(yīng)用的動作”中。例如,就作為應(yīng)用的操作的移動到鏈接目的地而言,圖9C所示的鏈接信息915中的“應(yīng)用的動作”與“移動到鏈接目的地(text_01)”相關(guān)聯(lián)。這里“(text_01)”是在步驟S808中生成的鏈接標(biāo)識符。在步驟S810中,將關(guān)于“閱讀者的動作”、“應(yīng)用的動作”以及“顏色”的信息與鏈接標(biāo)識符相關(guān)聯(lián),將其作為鏈接信息915存儲在存儲部211中。盡管上面的描述討論了針對各個鏈接標(biāo)識符單獨(dú)指定關(guān)于顏色的信息的示例,但是可以進(jìn)行默認(rèn)指定,以便一次指定相同的顏色。現(xiàn)在,下面使用具體示例描述圖9C所示的鏈接信息915。例如,當(dāng)閱讀者點(diǎn)擊與鏈接標(biāo)識符(image_01)相關(guān)聯(lián)的照片區(qū)域911(“對象”)時(shí),閱讀者移動到包括與鏈接標(biāo)識符(teXt_01)相關(guān)聯(lián)的文本區(qū)域908(“對象的描述文本”)的頁。接著,用紅色(指定顏色)顯示基于與鏈接標(biāo)識符“teXt_01”相關(guān)聯(lián)的圖形數(shù)據(jù)(“坐標(biāo)X”、“坐標(biāo)Y”、“寬度W”和“高度H,,)=(“X14”、“Y14”、“W14”和“H14”)的矩形。在步驟S811中,鏈接信息生成部404針對“對象的描述文本”生成到對象的鏈接。生成的鏈接包括指示當(dāng)本實(shí)施例中的電子文檔的閱讀者對“對象的描述文本”(主要是指示文本中的錨表述的附近的圖形數(shù)據(jù)的區(qū)域)采取任意動作時(shí)的響應(yīng)操作的信息。這里,步驟S811中的鏈接的生成與圖9C所示的鏈接信息914中的“閱讀者的動作”以及“應(yīng)用的動作”相關(guān)。例如,就閱讀者使用鼠標(biāo)等點(diǎn)擊與閱讀的電子文檔內(nèi)的文本中的錨表述相對應(yīng)的部分而言,鏈接信息914中的“閱讀者的動作”與“點(diǎn)擊”相關(guān)聯(lián)。就作為應(yīng)用的操作的移動到鏈接目的地而言,鏈接信息914中的“應(yīng)用的動作”與“移動到鏈接目的地(imageJU)”相關(guān)聯(lián)。這里,“(imageJU)”是在步驟S806中生成的鏈接標(biāo)識符。在步驟S811中,將關(guān)于“閱讀者的動作”、“應(yīng)用的動作”以及“顏色”的信息與鏈接標(biāo)識符相關(guān)聯(lián),將其作為鏈接信息914存儲在存儲部211中?,F(xiàn)在,下面使用具體示例來說明圖9C所示的鏈接信息914。閱讀者首先點(diǎn)擊對應(yīng)于與鏈接標(biāo)識符(text_01)相關(guān)聯(lián)的圖形數(shù)據(jù)的部分區(qū)域(文本區(qū)域908(即“對象的描述文本”))。當(dāng)點(diǎn)擊它時(shí),閱讀者移動到包括與鏈接標(biāo)識符(image_01)相關(guān)聯(lián)的照片區(qū)域911(“對象”)的頁。接著,用紅色(指定顏色)顯示基于與鏈接標(biāo)識符“imageJU”相關(guān)聯(lián)的圖形數(shù)據(jù)(“坐標(biāo)X”、“坐標(biāo)Y”、“寬度W”和“高度H”)=(“X15”、“Y15”、“W15”和“H15”)的矩形。如上所述,在步驟S810和S811中,生成從“對象”到“對象的描述文本”的鏈接信息以及從“對象的描述文本”(主要是文本中的錨表述)到“對象”的反方向的鏈接信息。在本實(shí)施例中生成的鏈接信息是雙向的鏈接信息,即雙向鏈接信息。之后,對所有對象進(jìn)行步驟S802至S811的處理,如果在步驟S801中,確定不存在未處理的對象,則處理進(jìn)入步驟S812。在步驟S812中,收集在步驟S802至S811中存儲在存儲部211中的圖9B和9C所示的信息。接著,格式轉(zhuǎn)換部305以在步驟S706中能夠接收的格式輸出信息,并且處理完成。如果在步驟S801中確定不存在對象(步驟S801中的“否”),則不進(jìn)行處理。接著,處理完成。如上所述,對圖8的說明完成?,F(xiàn)在,參照圖IOA至10C,描述當(dāng)文檔的閱讀者使用應(yīng)用閱讀在本實(shí)施例中生成的電子文檔數(shù)據(jù)時(shí)進(jìn)行的操作。圖IOA至IOC是作為用于閱讀包括鏈接信息的電子文檔數(shù)據(jù)的應(yīng)用的由圖1的客戶端PC101、其它客戶端PC等執(zhí)行的虛擬GUI軟件的顯示畫面的示例。這種應(yīng)用的實(shí)際示例包括AdobeReader。此外,它可以是可以由MFP100的操作部203顯示并操作的應(yīng)用。當(dāng)應(yīng)用是AdobeReader時(shí),圖6所示的上述電子文檔數(shù)據(jù)的格式需要為PDF。圖IOA示出了用于閱讀通過圖7和圖8的處理而生成的電子數(shù)據(jù)的應(yīng)用1001的示例。圖IOA示出了作為電子文檔的示例,如何在應(yīng)用1001上顯示圖9A所示的圖像數(shù)據(jù)(已生成了本實(shí)施例中的鏈接信息)中的頁1。頁滾動按鈕1002是閱讀者使用鼠標(biāo)等在畫面上按下以顯示前頁或后續(xù)頁的按鈕。窗口1004是輸入搜索關(guān)鍵詞的輸入?yún)^(qū)域;搜索執(zhí)行按鈕1003是在輸入要搜索的關(guān)鍵詞之后用來開始進(jìn)行搜索的按鈕。狀態(tài)欄1005示出了當(dāng)前顯示的頁的頁編號。在傳統(tǒng)技術(shù)中,當(dāng)閱讀者閱讀電子文檔數(shù)據(jù),并搜索由包括在錨表述周邊區(qū)域1006中的錨表述(例如“圖1”)指示的對象時(shí),通常使用通過按下頁滾動按鈕1002來搜索它的方法。通常還使用通過輸入“圖1”作為搜索關(guān)鍵詞來搜索它的另一方法。接著,閱讀者閱讀錨表述指示的對象,之后按下頁滾動按鈕1002以返回到頁1,并閱讀后續(xù)句子。另一方面,在本發(fā)明中,當(dāng)閱讀者閱讀包括上述鏈接信息的電子文檔數(shù)據(jù)時(shí),閱讀者點(diǎn)擊包括圖IOA所示的錨表述的錨表述周邊區(qū)域1006。當(dāng)進(jìn)行點(diǎn)擊時(shí),如圖IOB所示,根據(jù)圖9C所示的鏈接信息914,在應(yīng)用的畫面上顯示包括圖像周邊區(qū)域1007的頁。換句話說,顯示包括由錨表述“圖1”指示的對象的頁4,由此閱讀者能夠容易地找到由錨表述指示的對象。根據(jù)鏈接信息914,用紅色顯示圖像周邊區(qū)域1007的外周的線段。接著,當(dāng)閱讀者使用鼠標(biāo)在應(yīng)用1001的畫面上,點(diǎn)擊圖像周邊區(qū)域1007時(shí),如圖IOC所示,根據(jù)鏈接信息915顯示包括錨表述周邊區(qū)域1006的頁。此時(shí),根據(jù)鏈接信息915,用紅色顯示錨表述周邊區(qū)域1006的外周的線段。當(dāng)作為電子文檔的示例,閱讀圖9D所示的圖像數(shù)據(jù)(已生成了本實(shí)施例中的鏈接信息)時(shí),應(yīng)用的操作與操作的示例相同。在這種情況下,由于在應(yīng)用中在頁1上顯示圖,因此閱讀者開始使用鼠標(biāo)點(diǎn)擊對象的操作,以搜索用于描述圖的描述表述。省略了對應(yīng)用的后續(xù)操作的描述。如上所述,在本實(shí)施例中,在包括“對象”和“對象的描述文本”的紙文檔中,自動生成包括“對象”與“對象的描述文本”之間的雙向鏈接信息的電子文檔數(shù)據(jù),由此獲得以下效果。當(dāng)閱讀者閱讀“包括錨表述的文本”(即“對象的描述文本”),并搜索相應(yīng)的“對象”時(shí),能夠通過簡單的操作顯示“對象”。而且,通過利用突出“對象”的描繪信息(圖形數(shù)據(jù)),能夠使“對象”的位置清晰。還能夠通過簡單的操作返回到“對象的描述文本”。此夕卜,在返回到“對象的描述文本”時(shí),能夠使先前剛剛閱讀的位置(哪頁、哪段以及哪行)清晰。同樣,即使首先閱讀“對象”時(shí),也能夠通過簡單的操作顯示“對象的描述文本”。在本實(shí)施例中,主要對以下情況進(jìn)行了說明在具有多頁的文檔中,將具有“對象”的頁和具有“對象的描述文本”的頁相互分離。然而,本發(fā)明不限于此;即使在難以理解“對象”與“對象的描述文本”之間的對應(yīng)的紙文檔中,也能夠獲得相同的效果。一個示例是具有“對象”的頁和具有“對象的描述文本”的頁相同,但其位置相互遠(yuǎn)離的紙文檔。另一示例是將“對象”以及“對象的描述文本”中的至少一個作為小描述(包括小字符)進(jìn)行描述的紙文檔。此外,另一示例是具有復(fù)雜布局的文檔。(第二實(shí)施例)第一實(shí)施例處理如圖9A所示的、在文本中存在一個“對象”的一個錨表述的情況。在第二實(shí)施例中,參照圖12A至15G,描述在文本中預(yù)先設(shè)置與“對象”相對應(yīng)的多個錨表述的情況。不再重復(fù)對與圖9A至圖9C相同部分的描述。圖12A示出了由標(biāo)號1201至1204指示的四頁構(gòu)成的圖像數(shù)據(jù);區(qū)域1211指示“對象”,區(qū)域1208和1213指示“對象的描述文本”。區(qū)域1209、1214和1215是包括在“對象的描述文本”中的錨表述周邊區(qū)域。對圖12A所示的圖像數(shù)據(jù)進(jìn)行與第一實(shí)施例中的圖7和圖8所示的流程圖相同的處理,由此生成包括雙向鏈接信息的電子文檔數(shù)據(jù)。然而,在圖8所示的步驟S810中,進(jìn)行與圖13所示的流程圖相對應(yīng)的處理,由此生成從對象到“對象的描述文本”的鏈接。圖13是示出在先前描述的圖8所示的步驟S810中的鏈接生成中生成關(guān)于“應(yīng)用的動作”的信息的處理的流程圖。生成關(guān)于“閱讀者的動作”的信息的處理與第一實(shí)施例中的處理相同,因此省略其描述。在步驟S1301中,鏈接信息生成部404確定在步驟S804中從文本中提取的錨表述的數(shù)量是否是兩個或更多個。如果是一個(步驟S1301中的“否”),則處理進(jìn)入步驟S1302,而如果是兩個或更多個(步驟S1301中的“是”),則處理進(jìn)入步驟S1303。在步驟S1302中,鏈接信息生成部404針對“應(yīng)用的動作”,生成指示用于移動到鏈接目的地的指令的信息。接著,鏈接信息生成部404將生成的信息與鏈接標(biāo)識符相關(guān)聯(lián),并將其存儲在存儲部211中。在步驟S1303中,鏈接信息生成部404作為“應(yīng)用的動作”的信息,生成指示用于顯示列表的指令的信息,將其與候選對象顯示信息相關(guān)聯(lián),并將其存儲在存儲部211中。顯示列表是用于給出用于顯示目的地的選擇的列表的指令的信息,從而由于文本中的針對一個“對象”的錨表述的數(shù)量是兩個或更多個,因此閱讀者能夠選擇閱讀者移動到錨表述的哪一個位置。該關(guān)于顯示列表的信息包括關(guān)于與提取的錨表述相關(guān)聯(lián)的鏈接標(biāo)識符的信息。在第二實(shí)施例中,將用于給出用于移動到鏈接目的地的指令的信息稱為鏈接信息,將用于給出用于顯示列表的指令的信息稱為候選對象顯示信息,并將它們相互區(qū)分。換句話說,重要的是,如果針對一個“對象”的錨表述的數(shù)量是一個,則生成鏈接信息,而如果存在多個錨表述,則生成候選對象顯示信息?,F(xiàn)在,描述根據(jù)第二實(shí)施例的由圖像處理設(shè)備進(jìn)行的處理的結(jié)果。通過進(jìn)行根據(jù)第二實(shí)施例的處理,從圖12A所示的頁1上的文本區(qū)域1208中,提取了兩個錨表述“圖1”。因此,如圖12B所示,將文本區(qū)域1208與兩個鏈接標(biāo)識符“text_01”和“text_02”相關(guān)聯(lián)。當(dāng)如上所述,通過在文本區(qū)域中進(jìn)行搜索而獲得了多個錨表述時(shí),將一個文本區(qū)域與多個鏈接標(biāo)識符相關(guān)聯(lián)。由于從圖12A所示的頁4上的文本區(qū)域1213中也提取了錨表述“圖1”,因此將文本區(qū)域1213與一個鏈接標(biāo)識符“text_03”相關(guān)聯(lián)。接著,如同第一實(shí)施例中那樣,進(jìn)行步驟S808、S809以及S811中的處理,由此將鏈接標(biāo)識符“text_01”至“text_03”與圖12C所示的鏈接信息1216至1218相關(guān)聯(lián)。換句話說,將“圖形數(shù)據(jù)”、“閱讀者的動作”、“應(yīng)用的動作”以及“顏色”相關(guān)聯(lián)。這里,假定“應(yīng)用的動作”包括用于“移動到鏈接目的地(image_01)”的指令,應(yīng)用還包括用于“臨時(shí)存儲關(guān)于點(diǎn)擊的錨表述的周邊區(qū)域的信息”的指令。另一方面,通過步驟S806中的處理將對象1211與鏈接標(biāo)識符“(image_01)”相關(guān)聯(lián),還通過步驟S807中的處理將對象1211與對應(yīng)于鏈接標(biāo)識符“(image_01)”的圖形數(shù)據(jù)相關(guān)聯(lián)。接著,由于從文本中提取了多個錨表述,因此在圖13的流程圖的步驟S1303中,將“顯示列表”作為“應(yīng)用的動作”相關(guān)聯(lián),并且“顏色”變成“_”(不使用顏色的意思)。與候選對象顯示信息1219相關(guān)聯(lián)的“列表顯示”包括關(guān)于鏈接標(biāo)識符“(text_01)”至“(text_03)”的信息?,F(xiàn)在,參照圖12A_C、14A、14B以及15A-G,描述當(dāng)文檔的閱讀者使用應(yīng)用閱讀第二實(shí)施例的電子文檔數(shù)據(jù)時(shí)進(jìn)行的操作。圖14A和14B是示出應(yīng)用根據(jù)在第二實(shí)施例中生成的電子文檔數(shù)據(jù)的描述進(jìn)行的過程的流程圖。圖14A示出了當(dāng)點(diǎn)擊文本中的錨表述周邊區(qū)域時(shí)進(jìn)行的處理;圖14B示出了當(dāng)點(diǎn)擊圖像周邊區(qū)域時(shí)進(jìn)行的處理。首先,描述圖14A所示的流程圖。在步驟S1401中,當(dāng)閱讀者在應(yīng)用上點(diǎn)擊錨表述周邊區(qū)域時(shí),應(yīng)用根據(jù)鏈接信息,顯示包括與由“移動到鏈接目的地”指示的標(biāo)識符相關(guān)聯(lián)的區(qū)域的頁。具體地說,根據(jù)圖12C所示的鏈接信息1216至1218中的關(guān)于“應(yīng)用的動作”的信息,即用于“移動到鏈接目的地”的指令,來進(jìn)行操作。接著,根據(jù)圖12C所示的鏈接信息1216至1218中的關(guān)于“顏色”的信息,用紅色圖形一起突出圖像周邊區(qū)域的外周的線段。更具體地說,在圖15A中示出了通過點(diǎn)擊錨表述周邊區(qū)域1209、1214和1215而獲得的結(jié)果。圖15A示出了不管點(diǎn)擊哪個錨表述周邊區(qū)域,閱讀者如何移動到頁3,并且使用紅色顯示圖像周邊區(qū)域1501的外周的線段。在步驟S1402中,應(yīng)用臨時(shí)保持閱讀者在步驟S1401中選擇的錨表述周邊區(qū)域的位置信息。換句話說,在步驟S1401中顯示的圖像周邊區(qū)域保持位置信息,以使得能夠識別閱讀者選擇并顯示了錨表述周邊區(qū)域1216至1218中的哪一個。具體地說,位置信息是關(guān)于點(diǎn)擊的錨表述周邊區(qū)域的信息(指示錨表述周邊區(qū)域的位置的位置信息、用于識別錨表述周邊區(qū)域的識別信息或者與錨表述周邊區(qū)域相對應(yīng)的鏈接標(biāo)識符)。在當(dāng)點(diǎn)擊圖14B所示的圖像周邊區(qū)域時(shí)進(jìn)行的處理中,使用臨時(shí)保持的位置信息。現(xiàn)在,說明圖14B所示的流程圖。在步驟S1403中,當(dāng)閱讀者點(diǎn)擊圖像周邊區(qū)域時(shí),應(yīng)用進(jìn)行參照,以檢查是否保持了位置信息。如果保持了位置信息,則這指示閱讀者通過之前剛剛對錨表述周邊區(qū)域中的任意一個的選擇,來顯示圖像周邊區(qū)域。在步驟S1404中,應(yīng)用基于在步驟S1403中參照的位置信息,來確定是否根據(jù)鏈接信息顯示圖像周邊區(qū)域。如果存在位置信息,則確定要根據(jù)鏈接信息從錨表述周邊區(qū)域顯示圖像周邊區(qū)域,接著處理進(jìn)入步驟S1408。如果不存在位置信息,則處理進(jìn)入步驟S1405。在步驟S1408中,應(yīng)用基于位置信息,來參照在顯示圖像周邊區(qū)域之前、閱讀者選擇的錨表述周邊區(qū)域的位置,并顯示與該位置相對應(yīng)的錨表述周邊區(qū)域。對通過點(diǎn)擊例如圖12A所示的錨表述周邊區(qū)域1215來顯示圖15A所示的圖像周邊區(qū)域1501的情況給出描述。當(dāng)點(diǎn)擊該圖像周邊區(qū)域1501時(shí),如圖15B所示,顯示包括在顯示移動之前點(diǎn)擊的錨表述周邊區(qū)域1502的圖像。接著,在步驟S1405中,應(yīng)用確定關(guān)于與對應(yīng)于閱讀者點(diǎn)擊的圖像周邊區(qū)域的鏈接標(biāo)識符相關(guān)聯(lián)的“應(yīng)用的動作”的信息,是“移動到鏈接目的地”還是“顯示列表”。如上所述,作為對電子文檔數(shù)據(jù)的描述,“應(yīng)用的動作”包括如下描述如果錨表述的數(shù)量是一個,則進(jìn)行“移動到鏈接目的地”,而如果錨表述的數(shù)量是兩個或者更多個,則描述“顯示列表”。如果進(jìn)行“移動到鏈接目的地”(步驟S1405;移動到鏈接目的地),則處理進(jìn)入步驟S1406,而如果進(jìn)行“顯示列表”(步驟S1405;顯示列表),則處理進(jìn)入步驟S1407。在步驟S1406中,應(yīng)用顯示包括與由“移動到鏈接目的地”指示的鏈接標(biāo)識符相關(guān)聯(lián)的錨表述周邊區(qū)域的文本區(qū)域,并用紅色突出它,以使得能夠識別錨表述周邊區(qū)域。由于移動到鏈接目的地與在第一實(shí)施例中相同,因此不再重復(fù)其描述。在步驟S1407中,應(yīng)用參照包括在關(guān)于“顯示列表”的信息中的鏈接標(biāo)識符,并且根據(jù)與鏈接標(biāo)識符相關(guān)聯(lián)的文本區(qū)域上的字符信息,作為列表來顯示各個錨表述前后的字符信息。例如,當(dāng)閱讀者點(diǎn)擊圖15C所示的圖像周邊區(qū)域1501時(shí),如圖15D所示,顯示作為目的地的候選對象的錨表述前后的字符信息1503至1505。文檔1503包括與鏈接標(biāo)識符“text_01”相關(guān)聯(lián)的文本區(qū)域1208上的字符信息中的、錨表述前后的字符信息。文檔1504包括與鏈接標(biāo)識符“text_02”相關(guān)聯(lián)的文本區(qū)域1208上的字符信息中的、錨表述前后的字符信息。文檔1505包括與鏈接標(biāo)識符“text_03”相關(guān)聯(lián)的文本區(qū)域1213上的字符信息中的、錨表述前后的字符信息。列表的顯示不限于文檔,其可以是諸如縮略圖的圖像。在步驟S1409中,應(yīng)用確定閱讀者是否從在步驟S1407中顯示的列表顯示中選擇了文檔。如果選擇了文檔,則處理進(jìn)入步驟S1410,而如果未選擇文檔,則處理完成。例如,如果選擇了圖15D所示的文檔1503,則如圖15E所示,顯示包括與相應(yīng)的鏈接標(biāo)識符相關(guān)聯(lián)的錨表述的頁1,并且用紅色突出相應(yīng)的錨表述周邊區(qū)域1506的外周的線段。如果選擇了圖15D所示的文檔1504,則如圖15F所示,顯示包括與相應(yīng)的鏈接標(biāo)識符相關(guān)聯(lián)的錨表述的頁1,并且用紅色突出相應(yīng)的錨表述周邊區(qū)域1507的外周的線段。如果選擇了圖15D所示的文檔1505,則如圖15E所示,顯示包括與相應(yīng)的鏈接標(biāo)識符相關(guān)聯(lián)的錨表述的頁4,并且用紅色突出相應(yīng)的錨表述周邊區(qū)域1508的外周的線段。盡管在上述第二實(shí)施例中,按步驟S1404和S1405的順序說明了步驟S1404和S1405,但是可以將順序顛倒(首先進(jìn)行步驟S1405中的確定,如果在步驟S1405中確定為“顯示列表”,則進(jìn)行步驟S1404中的處理)。對圖14A-14B以及15A-15G的說明完成。如上所述,根據(jù)錨表述的數(shù)量是一個、還是兩個或更多個,來生成不同類型的鏈接信息,由此能夠獲得以下效果。即使當(dāng)針對“對象”的錨表述的數(shù)量是兩個或更多個時(shí),閱讀者也能夠通過簡單的操作,從具有“對象”的頁移動到閱讀者期望并且具有“對象的描述文本”的頁。此外,由于以列表的形式提交各個錨表述前后的字符信息,因此閱讀者能夠容易地確定和選擇閱讀者移動哪一頁。此外,即使當(dāng)從“對象的描述文本”的頁移動到“對象”的頁時(shí),也能夠通過簡單的操作返回到先前剛剛看過的“對象的描述文本”的頁。(其它實(shí)施例)第一和第二實(shí)施例處理以下情況掃描器將包括“對象”和“對象的描述文本”的紙文檔掃描成圖像數(shù)據(jù),輸入該圖像數(shù)據(jù),并生成具有雙向鏈接信息的電子文檔數(shù)據(jù)。然而,輸入的文檔不限于紙文檔;可以是電子文檔。換句話說,輸入不包括雙向鏈接信息的諸如SVG、XPS、PDF或OfficeOpenXML的電子文檔,可以生成具有雙向鏈接信息的電子文檔數(shù)據(jù)。此外,當(dāng)輸入的電子文檔已經(jīng)具有區(qū)域信息(位置、大小和屬性)以及字符信息時(shí),省略在區(qū)域劃分部301、屬性信息添加部302以及字符識別部303中進(jìn)行的處理,由此能夠提高處理的效率。盡管在第二實(shí)施例中,候選對象顯示信息的示例是“顯示列表”,但是不限于列表形式的顯示。例如,可以使用指示目的地的多個選擇的“消息顯示”或“錯誤顯示”。本發(fā)明的各方面還能夠通過讀出并執(zhí)行記錄在存儲裝置上的用于執(zhí)行上述實(shí)施例的功能的程序的系統(tǒng)或設(shè)備的計(jì)算機(jī)(或諸如CPU或MPU的裝置)、以及由系統(tǒng)或設(shè)備的計(jì)算機(jī)例如讀出并執(zhí)行記錄在存儲裝置上的用于執(zhí)行上述實(shí)施例的功能的程序來執(zhí)行步驟的方法來實(shí)現(xiàn)。鑒于此,例如經(jīng)由網(wǎng)絡(luò)或者從用作存儲裝置的各種類型的記錄介質(zhì)(例如計(jì)算機(jī)可讀介質(zhì))向計(jì)算機(jī)提供程序。雖然參照示例性實(shí)施例對本發(fā)明進(jìn)行了說明,但是應(yīng)當(dāng)理解,本發(fā)明不限于所公開的示例性實(shí)施例。所附權(quán)利要求的范圍符合最寬的解釋,以使其涵蓋所有這種變型、等同結(jié)構(gòu)及功能。權(quán)利要求1.一種圖像處理設(shè)備,所述圖像處理設(shè)備包括輸入單元,其被配置為輸入文檔圖像數(shù)據(jù);區(qū)域劃分單元,其被配置為根據(jù)屬性將所述文檔圖像數(shù)據(jù)劃分為多個區(qū)域,所劃分的區(qū)域包括文本區(qū)域、注釋區(qū)域以及由所述注釋區(qū)域伴隨的對象區(qū)域;字符識別單元,其被配置為通過對由所述區(qū)域劃分單元劃分的所述文本區(qū)域和所述注釋區(qū)域中的各個內(nèi)的各個字符執(zhí)行字符識別處理,來獲得字符信息;錨表述提取單元,其被配置為從所述注釋區(qū)域中的字符信息中,提取包括識別所述對象區(qū)域的預(yù)定字符串的錨表述;文本搜索單元,其被配置為從所述文本區(qū)域中的字符信息中,搜索由所述錨表述提取單元提取的所述錨表述;鏈接信息生成單元,其被配置為生成將錨表述周邊區(qū)域與圖像周邊區(qū)域彼此相關(guān)聯(lián)的雙向鏈接信息,所述錨表述周邊區(qū)域是包括所述文本搜索單元在所述文本區(qū)域中搜索到的所述錨表述的區(qū)域,所述圖像周邊區(qū)域是包括所述對象區(qū)域的區(qū)域;以及格式轉(zhuǎn)換單元,其被配置為生成包括所述文檔圖像數(shù)據(jù)和所述雙向鏈接信息的電子文檔數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,當(dāng)所述文本搜索單元找到多個所述錨表述時(shí),所述鏈接信息生成單元生成將所述圖像周邊區(qū)域與作為包括所找到的多個所述錨表述的區(qū)域的多個所述錨表述周邊區(qū)域相關(guān)聯(lián)的所述雙向鏈接信息,其中,所述雙向鏈接信息包括候選對象顯示信息,所述候選對象顯示信息用于顯示關(guān)于所述多個所述錨表述周邊區(qū)域的信息,作為從所述圖像周邊區(qū)域的鏈接目的地的多個候選對象;并且所述格式轉(zhuǎn)換單元生成包括所述文檔圖像數(shù)據(jù)以及所述雙向鏈接信息的所述電子文檔數(shù)據(jù),所述雙向鏈接信息包括所述候選對象顯示信息。3.根據(jù)權(quán)利要求2所述的圖像處理設(shè)備,其中,當(dāng)所述文本搜索單元找到所述多個所述錨表述時(shí),所述鏈接信息生成單元生成的所述雙向鏈接信息還包括用于顯示指示存在所述多個所述錨表述的消息的信息。4.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所述對象區(qū)域包括表、線圖以及照片的區(qū)域中的至少一個。5.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所述錨表述提取單元提取圖號的字符串作為所述錨表述。6.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所述電子文檔數(shù)據(jù)的文件格式是關(guān)于SVG、XPS、PDF以及OfficeOpenXML的文件格式。7.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所述雙向鏈接信息包括從所述圖像周邊區(qū)域到所述錨表述周邊區(qū)域的第一鏈接以及從所述錨表述周邊區(qū)域到所述圖像周邊區(qū)域的第二鏈接,所述第一鏈接包括用于當(dāng)所述電子文檔數(shù)據(jù)的閱讀者對所述圖像周邊區(qū)域采取預(yù)定動作時(shí)、顯示相關(guān)聯(lián)的錨表述周邊區(qū)域的信息,并且所述第二鏈接包括用于當(dāng)所述電子文檔數(shù)據(jù)的閱讀者對所述錨表述周邊區(qū)域采取預(yù)定動作時(shí)、顯示相關(guān)聯(lián)的圖像周邊區(qū)域的信息。8.根據(jù)權(quán)利要求2所述的圖像處理設(shè)備,其中,所述候選對象顯示信息是如下信息,所述信息用于當(dāng)所述電子文檔數(shù)據(jù)的閱讀者對所述圖像周邊區(qū)域采取預(yù)定動作時(shí),顯示關(guān)于所述多個所述錨表述周邊區(qū)域的列表,作為從所述圖像周邊區(qū)域的鏈接目的地的所述多個候選對象,以使得所述閱讀者能夠選擇顯示所述錨表述周邊區(qū)域中的哪一個。9.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所生成的電子文檔數(shù)據(jù)中包括的所述文檔圖像數(shù)據(jù)是通過執(zhí)行矢量轉(zhuǎn)換處理和圖像壓縮處理中的至少一個處理而獲得的數(shù)據(jù)。10.一種電子文檔顯示設(shè)備,其顯示由圖像處理設(shè)備生成的電子文檔數(shù)據(jù),其中,所述圖像處理設(shè)備包括輸入單元,其被配置為輸入文檔圖像數(shù)據(jù);區(qū)域劃分單元,其被配置為根據(jù)屬性將所述文檔圖像數(shù)據(jù)劃分為多個區(qū)域,所劃分的區(qū)域包括文本區(qū)域、注釋區(qū)域以及由所述注釋區(qū)域伴隨的對象區(qū)域;字符識別單元,其被配置為通過對由所述區(qū)域劃分單元劃分的所述文本區(qū)域和所述注釋區(qū)域中的各個內(nèi)的各個字符執(zhí)行字符識別處理,來獲得字符信息;錨表述提取單元,其被配置為從所述注釋區(qū)域中的字符信息中,提取包括識別所述對象區(qū)域的預(yù)定字符串的錨表述;文本搜索單元,其被配置為從所述文本區(qū)域中的字符信息中,搜索由所述錨表述提取單元提取的所述錨表述;鏈接信息生成單元,其被配置為當(dāng)所述文本搜索單元在所述文本區(qū)域中找到多個所述錨表述時(shí),生成將圖像周邊區(qū)域與多個錨表述周邊區(qū)域相關(guān)聯(lián)的雙向鏈接信息,所述錨表述周邊區(qū)域是包括所述文本搜索單元在所述文本區(qū)域中找到的所述錨表述中的各個的區(qū)域,所述圖像周邊區(qū)域是包括所述對象區(qū)域的區(qū)域,其中,所述雙向鏈接信息包括候選對象顯示信息,所述候選對象顯示信息用于顯示關(guān)于所述多個所述錨表述周邊區(qū)域的信息,作為從所述圖像周邊區(qū)域的鏈接目的地的多個候選對象;以及格式轉(zhuǎn)換單元,其被配置為生成包括所述文檔圖像數(shù)據(jù)以及所述雙向鏈接信息的所述電子文檔數(shù)據(jù),所述雙向鏈接信息包括所述候選對象顯示信息,所述電子文檔顯示設(shè)備包括位置信息保持單元,其被配置為當(dāng)用戶選擇了所述錨表述周邊區(qū)域中的一個時(shí),保持所選擇的錨表述周邊區(qū)域的位置作為位置信息;以及顯示單元,其被配置為當(dāng)所述用戶選擇了所述圖像周邊區(qū)域時(shí),確定所述位置信息保持單元是否保持了所述位置信息,當(dāng)保持了所述位置信息時(shí),基于由所述位置信息指示的所述錨表述周邊區(qū)域的位置來顯示所述錨表述周邊區(qū)域,而當(dāng)未保持所述位置信息時(shí),基于所述候選對象顯示信息來顯示所述鏈接目的地的多個候選對象。11.一種圖像處理方法,所述圖像處理方法包括輸入步驟,輸入文檔圖像數(shù)據(jù);區(qū)域劃分步驟,根據(jù)屬性將所述文檔圖像數(shù)據(jù)劃分為多個區(qū)域,所劃分的區(qū)域包括文本區(qū)域、注釋區(qū)域以及由所述注釋區(qū)域伴隨的對象區(qū)域;字符識別步驟,通過對在所述區(qū)域劃分步驟中劃分的所述文本區(qū)域和所述注釋區(qū)域中的各個內(nèi)的各個字符執(zhí)行字符識別處理,來獲得字符信息;錨表述提取步驟,從所述注釋區(qū)域中的字符信息中,提取包括識別所述對象區(qū)域的預(yù)定字符串的錨表述;文本搜索步驟,從所述文本區(qū)域中的字符信息中,搜索在所述錨表述提取步驟中提取的所述錨表述;鏈接信息生成步驟,生成將錨表述周邊區(qū)域與圖像周邊區(qū)域彼此相關(guān)聯(lián)的雙向鏈接信息,所述錨表述周邊區(qū)域是包括所述文本搜索步驟在所述文本區(qū)域中搜索到的所述錨表述的區(qū)域,所述圖像周邊區(qū)域是包括所述對象區(qū)域的區(qū)域;以及格式轉(zhuǎn)換步驟,生成包括所述文檔圖像數(shù)據(jù)和所述雙向鏈接信息的電子文檔數(shù)據(jù)全文摘要本發(fā)明提供一種圖像處理設(shè)備及圖像處理方法。區(qū)域劃分部從基于紙文檔和電子文檔的圖像數(shù)據(jù)中,提取“對象”、“伴隨對象的錨表述”以及“包括錨表述的文本”。鏈接處理部生成將“對象”、“包括在文本中的錨表述”或者“包括錨表述的文本”彼此雙向關(guān)聯(lián)的鏈接信息。接著,格式轉(zhuǎn)換部將鏈接信息轉(zhuǎn)換為包括雙向鏈接信息的電子文檔數(shù)據(jù)。當(dāng)通過應(yīng)用顯示該電子文檔數(shù)據(jù),并選擇了“對象”以及“包括在文本中的錨表述”中的一個時(shí),能夠根據(jù)鏈接信息顯示另一個。文檔編號G06F17/30GK102222079SQ201110083039公開日2011年10月19日申請日期2011年4月1日優(yōu)先權(quán)日2010年4月7日發(fā)明者三沢玲司,小坂亮,相馬英智,金津知俊申請人:佳能株式會社