專利名稱:圖像處理裝置及圖像處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理裝置以及圖像處理方法。
背景技術(shù):
存在對文檔圖像中的字符圖像執(zhí)行字符識別然后將其翻譯成不 同語言的技術(shù)。
還存在基于已經(jīng)對文檔作出的書寫標(biāo)記來處理文檔的技術(shù)。 例如,日本專利No.3636490描述了與此相關(guān)的技術(shù)中的 一種。 日本專利No.3636490的目的在于提供一種圖像處理裝置,該圖像處 理裝置能夠響應(yīng)于輸入原始文檔圖像的簡單操作將基于一種語言的 字符圖像翻譯成另一種語言并以一定的頁面布局打印該字符圖像或 者將其分配給同一記錄介質(zhì)的兩個(gè)表面以執(zhí)行雙面打印。日本專利 No.3636490描述了 一種包括原始文檔輸入裝置、分離裝置、識別裝 置、翻譯裝置、數(shù)據(jù)生成裝置和打印裝置的圖像處理裝置。原始文檔 輸入裝置輸入包含基于第一種語言的第一字符和圖像的原始文檔的 圖像。分離裝置分析從原始文檔輸入裝置輸入的原始文檔圖像數(shù)據(jù)以 將其分離成文檔數(shù)據(jù)區(qū)域和圖像數(shù)據(jù)區(qū)域。識別裝置從由分離裝置分 離的文檔數(shù)據(jù)區(qū)域中截取出字符圖像并識別第一種字符。翻譯裝置將 與由識別裝置識別的第一種字符對應(yīng)的字符數(shù)據(jù)翻譯成基于第二種 語言的第二種字符的數(shù)據(jù)。數(shù)據(jù)生成裝置基于由分離裝置分離成的文 檔數(shù)據(jù)區(qū)域的信息和第二種字符的數(shù)據(jù)生成展開的打印數(shù)據(jù)。打印裝 置基于由數(shù)據(jù)生成裝置生成的打印數(shù)據(jù),將第二種字符的數(shù)據(jù)和原始 文檔圖像數(shù)據(jù)分配給記錄介質(zhì)的相應(yīng)表面,并對這些數(shù)據(jù)執(zhí)行雙面打 印。
此外,例如,JP平成2-253377 A描述了一種圖像編輯裝置,該 圖像編輯裝置能夠?qū)嵤┯脕砝脴?biāo)記指定原始文檔的區(qū)域處理(例如對區(qū)域進(jìn)行提取、刪除或翻轉(zhuǎn))以及組合要對其執(zhí)行區(qū)域處理的多個(gè) 原始文檔的圖像。該圖像編輯裝置包括讀取裝置、指定裝置、生成裝 置、處理裝置、多個(gè)存儲(chǔ)裝置、控制裝置和組合裝置。讀取裝置讀取 原始文檔圖像并生成圖像信息。指定裝置利用標(biāo)記指定原始文檔的所 需區(qū)域。生成裝置根據(jù)指定裝置的區(qū)域指定生成表示所需區(qū)域的區(qū)域 信號。處理裝置根據(jù)由生成裝置生成的區(qū)域信號處理由讀取裝置生成 的圖像信息。多個(gè)存儲(chǔ)裝置可以存儲(chǔ)多項(xiàng)圖像信息。控制裝置控制多 個(gè)存儲(chǔ)裝置的寫入和讀出。組合裝置組合從多個(gè)存儲(chǔ)裝置讀取出的各 項(xiàng)圖像信息。在該圖像編輯裝置中,讀取多個(gè)原始文檔圖像,指定裝 置在多個(gè)原始文檔的每一個(gè)中指定所需區(qū)域,處理裝置根據(jù)由區(qū)域生 成裝置獲得的區(qū)域信號處理所生成的圖像信息,將經(jīng)過處理的圖像信 息存儲(chǔ)在多個(gè)存儲(chǔ)裝置中,從存儲(chǔ)經(jīng)處理的圖像信息的存儲(chǔ)裝置中讀 取多項(xiàng)經(jīng)處理的圖像信息,并且組合裝置組合并輸出各項(xiàng)被讀取的圖 像信息。
發(fā)明內(nèi)容
本發(fā)明提供一種圖像處理裝置和一種圖像處理方法,該圖像處理 裝置和該圖像處理方法對圖像執(zhí)行字符識別,翻譯字符識別結(jié)果并進(jìn) 一步生成翻譯結(jié)果的圖像,并且當(dāng)己經(jīng)在原始圖像中作出書寫標(biāo)記時(shí), 該裝置和該方法在區(qū)分書寫標(biāo)記的圖像部分與未作出書寫標(biāo)記的圖像 部分的情況下,將書寫標(biāo)記的圖像部分反映到翻譯結(jié)果的圖像中。
一種圖像處理裝置包括圖像接收單元、書寫標(biāo)記檢測單元、 字符位置檢測單元、字符識別單元、關(guān)聯(lián)單元、翻譯單元、譯文圖像 生成單元和譯文圖像輸出單元。所述圖像接收單元接收包含書寫標(biāo)記
的圖像。所述書寫標(biāo)記檢測單元檢測由所述圖像接收單元接收到的圖 像中的書寫標(biāo)記的位置。所述字符位置檢測單元檢測由所述圖像接收 單元接收到的圖像中的字符圖像的位置。所述字符識別單元對由所述 字符位置檢測單元檢測到的字符圖像執(zhí)行字符識別。所述關(guān)聯(lián)單元將 由所述書寫標(biāo)記檢測單元檢測到的書寫標(biāo)記的位置與由所述字符位置 檢測單元檢測到的字符圖像的位置作比較,以將所述書寫標(biāo)記與由所
5述字符識別單元執(zhí)行的字符識別的結(jié)果相關(guān)聯(lián)。所述翻譯單元翻譯由 所述字符識別單元執(zhí)行的字符識別的結(jié)果,以便將所述結(jié)果識別為通 過所述關(guān)聯(lián)單元而與所述書寫標(biāo)記相關(guān)聯(lián)的字符識別的結(jié)果的譯文。 所述譯文圖像生成單元生成與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖 像,以便以下述格式輸出所述圖像,所述格式不同于不與所述書寫標(biāo) 記相關(guān)聯(lián)的翻譯結(jié)果的圖像的格式。所述譯文圖像輸出單元輸出由所 述譯文圖像生成單元生成的圖像。
根據(jù)這種構(gòu)造,當(dāng)對圖像執(zhí)行字符識別時(shí),翻譯字符識別的結(jié)果 并生成翻譯結(jié)果的圖像,并且當(dāng)已經(jīng)在原始圖像中作出書寫標(biāo)記時(shí), 可以在區(qū)分書寫標(biāo)記的圖像部分與未作出書寫標(biāo)記的圖像部分的情況 下,將書寫標(biāo)記的圖像部分反映到翻譯結(jié)果的圖像中。第[l]項(xiàng)所描述的圖像處理裝置還可以包括原始圖像轉(zhuǎn)換單元 和組合單元。在所述翻譯單元執(zhí)行翻譯之后,所述原始圖像轉(zhuǎn)換單元 基于由所述書寫標(biāo)記檢測單元檢測到的書寫標(biāo)記的位置來轉(zhuǎn)換由所述 圖像接收單元接收到的圖像中的字符圖像。所述組合單元將由所述原
始圖像轉(zhuǎn)換單元轉(zhuǎn)換的圖像和由所述譯文圖像生成單元生成的圖像進(jìn) 行組合。
根據(jù)這種構(gòu)造,在翻譯已經(jīng)作出書寫標(biāo)記的圖像部分之后,可以 同時(shí)呈現(xiàn)原始圖像轉(zhuǎn)換成的圖像和譯文圖像。在第[2]項(xiàng)所描述的圖像處理裝置中,所述原始圖像轉(zhuǎn)換單元
可以基于由所述書寫標(biāo)記檢測單元檢測到的書寫標(biāo)記的位置來將所述 字符圖像轉(zhuǎn)換成隱藏所述字符圖像的圖像。
根據(jù)這種構(gòu)造,可以隱藏原始圖像的書寫標(biāo)記部分。在第[1]項(xiàng)至第[3]項(xiàng)中任一項(xiàng)所描述的圖像處理裝置中,所述 譯文圖像生成單元可以生成隱藏與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的 圖像。
根據(jù)這種構(gòu)造,可以在抑制要隱藏的己經(jīng)作出書寫標(biāo)記的圖像部 分的翻譯質(zhì)量下降的同時(shí)隱藏與書寫標(biāo)記對應(yīng)的翻譯結(jié)果。在第[1]項(xiàng)至第[4]項(xiàng)中任一項(xiàng)所描述的圖像處理裝置中,所述 書寫標(biāo)記檢測單元還可以檢測所述書寫標(biāo)記的類型。所述譯文圖像生成單元可以基于由所述書寫標(biāo)記檢測單元檢測到的所述書寫標(biāo)記的類型來生成與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像。
根據(jù)這種構(gòu)造,可以呈現(xiàn)與書寫標(biāo)記的類型相符的譯文圖像。在第[1]項(xiàng)或第[2]項(xiàng)所描述的圖像處理裝置中,所述書寫標(biāo)記檢測單元還可以檢測所述書寫標(biāo)記的類型。所述譯文圖像生成單元可以將類型與由所述書寫標(biāo)記檢測單元檢測到的所述書寫標(biāo)記的類型相同的書寫標(biāo)記添加在與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像中。
根據(jù)這種構(gòu)造,可以將類型與原始圖像相同的書寫標(biāo)記添加在相應(yīng)的譯文圖像中。 —種圖像處理方法包括接收包含書寫標(biāo)記的圖像;檢測接收到的圖像中的書寫標(biāo)記的位置;檢測接收到的圖像中的字符圖像的位置;對檢測到的字符圖像執(zhí)行字符識別;將檢測到的書寫標(biāo)記的位置與檢測到的字符圖像的位置作比較,以將所述書寫標(biāo)記與字符識別的結(jié)果相關(guān)聯(lián);翻譯字符識別的結(jié)果,以便將所述結(jié)果識別為與所述書寫標(biāo)記相關(guān)聯(lián)的字符識別的結(jié)果的譯文;生成與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像,以便以下述格式輸出所述圖像,所述格式不同于不與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像的格式;以及輸出與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像。
根據(jù)這種方法,當(dāng)對圖像執(zhí)行字符識別時(shí),翻譯字符識別的結(jié)果并生成翻譯結(jié)果的圖像,并且當(dāng)己經(jīng)在原始圖像中作出書寫標(biāo)記時(shí),可以在區(qū)分書寫標(biāo)記的圖像部分與未作出書寫標(biāo)記的圖像部分的情況下,將書寫標(biāo)記的圖像部分反映到翻譯結(jié)果的圖像中。
基于下列附圖,對本發(fā)明的示例性實(shí)施例進(jìn)行詳細(xì)說明,其中
圖1是根據(jù)本發(fā)明示例性實(shí)施例的結(jié)構(gòu)實(shí)例的概念模塊框圖2是示出根據(jù)本發(fā)明示例性實(shí)施例的處理實(shí)例1的流程圖3是示出被指定部分表的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的說明圖4是示出字符位置表的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的說明圖5A和5B是示出根據(jù)本發(fā)明示例性實(shí)施例的處理實(shí)例1-1的圖6A和6B是示出根據(jù)本發(fā)明示例性實(shí)施例的處理實(shí)例1-2的說明圖7是示出根據(jù)本發(fā)明示例性實(shí)施例的處理實(shí)例2的流程圖;圖8A和8B是示出根據(jù)本發(fā)明示例性實(shí)施例的處理實(shí)例2-1的說明圖9A和9B是示出根據(jù)本發(fā)明示例性實(shí)施例的處理實(shí)例2-2的說明圖;以及
圖IO是示出實(shí)現(xiàn)本發(fā)明示例性實(shí)施例的計(jì)算機(jī)的硬件結(jié)構(gòu)的實(shí)例的框圖。
具體實(shí)施例方式
在下文中,將參照附圖對本發(fā)明的示例性實(shí)施例進(jìn)行說明。圖1是根據(jù)本示例性實(shí)施例的結(jié)構(gòu)實(shí)例的概念模塊框圖。模塊通常是指例如軟件(計(jì)算機(jī)程序)或硬件等在邏輯上可分離的部分。因此,本示例性實(shí)施例中的模塊不僅指計(jì)算機(jī)程序中的模塊而且指硬件結(jié)構(gòu)中的模塊。因此,本示例性實(shí)施例的說明也是對計(jì)算機(jī)程序、系統(tǒng)和方法的說明。這里,為了方便說明,使用了"存儲(chǔ)"、"被存儲(chǔ)"以及與此等同的詞語,當(dāng)本示例性實(shí)施例是計(jì)算機(jī)程序時(shí),這些詞語是指將一些內(nèi)容存儲(chǔ)在存儲(chǔ)器中或者進(jìn)行控制以便使一些內(nèi)容被存儲(chǔ)在存儲(chǔ)器中。當(dāng)各種模塊在基本上一對一的基礎(chǔ)上與各種功能對應(yīng)時(shí),在實(shí)施過程中, 一個(gè)模塊可以由一個(gè)程序組成,多個(gè)模塊可以由一個(gè)程序組成,或者一個(gè)模塊可以由多個(gè)程序組成。此外,多個(gè)模塊可以由一臺(tái)計(jì)算機(jī)執(zhí)行,或者一個(gè)模塊可以由多臺(tái)計(jì)算機(jī)在
分布式或并行環(huán)境下執(zhí)行。 一個(gè)模塊也可以包含另一個(gè)模塊。此外,在下文中,"連接"用來表示邏輯連接(數(shù)據(jù)發(fā)送與接收、指令、數(shù)據(jù)項(xiàng)之間的引用關(guān)系)以及物理連接。
此外,系統(tǒng)或裝置由通過例如網(wǎng)絡(luò)等通信裝置(包括一一對應(yīng)的通信連接)連接的多臺(tái)計(jì)算機(jī)、硬件、裝置等構(gòu)成。當(dāng)本發(fā)明由一臺(tái)計(jì)算機(jī)來實(shí)現(xiàn)時(shí),本發(fā)明也包括硬件、裝置等。"裝置"和"系統(tǒng)"用作彼此同義的詞語。"預(yù)定"是指在所關(guān)注的處理之前,并用來具有如下含義,所述含義不僅包括在開始本示例性實(shí)施例的處理之前確定,而且包括根據(jù)當(dāng)時(shí)的狀況或條件或者根據(jù)在開始本示例性實(shí)施例的處理之后甚至一直到當(dāng)時(shí)的狀況或條件來確定。
如圖1所示,本示例性實(shí)施例包括圖像接收模塊110、提取/識
別處理模塊120、關(guān)聯(lián)模塊130、翻譯模塊140、圖像生成模塊150和輸出模塊160。
圖像接收模塊110與提取/識別處理模塊120連接、接收圖像并將圖像發(fā)送到提取/識別處理模塊120。接收圖像包括用掃描儀讀取圖像、通過傳真接收圖像以及從圖像數(shù)據(jù)庫等讀取圖像。所述圖像包括由用戶作出的書寫標(biāo)記以及字符圖像。圖像的數(shù)目可以是一個(gè)或多于一個(gè)。圖像的內(nèi)容可以是商業(yè)文件、廣告宣傳冊等。該圖像是要翻譯的圖像。具體來說,例如,圖像中包含的書寫標(biāo)記是指當(dāng)文檔向公眾公開時(shí)添加用來表示應(yīng)當(dāng)隱藏該文檔中描述的信息的部分的圖像以及添加用來表示文檔中描述的信息中的重要部分并且引起注意的圖像。所述書寫標(biāo)記包括下劃線或用色筆繪制的方框或用半透明的標(biāo)記符(突顯符等)填充的部分,而與所述書寫標(biāo)記是否為手寫體無關(guān)。當(dāng)要涂抹圖像中的字符圖像時(shí),涂抹字符圖像到能夠讀取字符圖像的程度(到可以進(jìn)行字符識別的程度)。
提取/識別處理模塊120與圖像接收模塊110和關(guān)聯(lián)模塊130連接,并具有書寫標(biāo)記檢測模塊121和字符處理模塊122。提取/識別處理模塊120從圖像接收模塊110接收圖像、檢測圖像中書寫標(biāo)記的位置、檢測字符圖像的位置并識別字符圖像。然后,提取/識別處理模塊120將檢測結(jié)果和字符識別結(jié)果發(fā)送到關(guān)聯(lián)模塊130。
書寫標(biāo)記檢測模塊121檢測由圖像接收模塊110接收到的圖像中用戶的書寫標(biāo)記的位置。為了檢測書寫標(biāo)記的位置,例如,對接收到的圖像進(jìn)行色調(diào)分離,從而提取具有預(yù)定顏色的圖像并檢測所提取圖像的坐標(biāo)。作為選擇,可以識別例如下劃線等線性圖像,并且可以檢測所識別的線性圖像的坐標(biāo)。然后,書寫標(biāo)記檢測模塊121將檢測的結(jié)果發(fā)送到關(guān)聯(lián)模塊130。此外,書寫標(biāo)記檢測模塊121可以檢測書寫標(biāo)記的類型。書寫標(biāo)記的類型的實(shí)例包括書寫標(biāo)記的顏色、書寫標(biāo)記的形狀(線條、區(qū)域等)以及書寫標(biāo)記和字符之間的關(guān)系(包含字符的區(qū)域、繪制在字符下面的下劃線等)。檢測處理可以包括對色調(diào)分離之后的顏色的分析、對高寬比的分析、對由頁面布局檢測模塊123檢測到的書寫標(biāo)記和字符之間的位置關(guān)系的分析等。
圖3是示出表示由書寫標(biāo)記檢測模塊121檢測到的書寫標(biāo)記的被指定部分表300的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的說明圖。被指定部分表300包括ID欄310、顏色欄320和位置信息欄330。 ID欄310存儲(chǔ)用于唯一地識別書寫標(biāo)記的識別符。顏色欄320存儲(chǔ)作為書寫標(biāo)記的類型的顏色。位置信息欄330存儲(chǔ)書寫標(biāo)記的位置,并包括x坐標(biāo)欄331、y坐標(biāo)欄332、寬度欄333和高度欄334。 x坐標(biāo)欄331和y坐標(biāo)欄332存儲(chǔ)存在書寫標(biāo)記的區(qū)域(例如矩形)的左上角位置的坐標(biāo),寬度欄333存儲(chǔ)該區(qū)域的寬度,并且高度欄334存儲(chǔ)該區(qū)域的高度。上述坐標(biāo)可以是圖像中的絕對坐標(biāo)(圖像的左上角位置定義為原點(diǎn),向右的方向?qū)?yīng)于x軸,并且向下的方向?qū)?yīng)于y軸)或者是相對坐標(biāo)。
字符處理模塊122從圖像接收模塊110接收圖像、檢測包括存在于圖像中的字符圖像的位置的頁面布局并識別字符圖像。然后,字符處理模塊122將字符圖像的位置和字符識別的結(jié)果發(fā)送到關(guān)聯(lián)模塊130。字符處理模塊122包括頁面布局檢測模塊123和字符識別模塊124。
頁面布局檢測模塊123檢測由圖像接收模塊110接收到的圖像中字符圖像的位置。為了檢測字符圖像位置,可以采用字符識別技術(shù)中通常已知的字符圖像提取方法。例如,生成圖像中橫向或豎向上的黑色像素的頻率分布圖(黑色像素的頻率分布),通過提取頻率等于或高于預(yù)定閾值的區(qū)域來提取一行,并且生成該行中豎向或橫向上的黑色像素的頻率分布圖,從而提取字符圖像。作為選擇,可以利用空白區(qū)域的尺寸和預(yù)定的字符圖像來提取字符圖像。還作為選擇,可以利用提取圖像中的頁面布局的技術(shù)來檢測字符圖像的位置。在這種情況下,不僅可以對由字符圖像構(gòu)成的文本區(qū)域執(zhí)行上述方法,而且可以對圖形、表格等執(zhí)行上述處理。然后,頁面布局檢測模塊123將作為檢測結(jié)果的字符圖像的位置發(fā)送到字符識別模塊124。
字符識別模塊124對由頁面布局檢測模塊123檢測到的字符圖
像執(zhí)行字符識別。對于字符識別方法來說,可以采用通常己知的字符識別技術(shù)。例如,可以執(zhí)行字符識別以提取字符圖像的特征(線數(shù)等),將特征空間中的位置與字典中的字符作比較并執(zhí)行字符識別(與字符
代碼相關(guān)聯(lián))。然后,字符識別模塊124將字符圖像的位置與字符識別結(jié)果相關(guān)聯(lián),并將字符圖像的位置和字符識別結(jié)果發(fā)送到關(guān)聯(lián)模塊130。
圖4是示出作為由字符處理模塊122執(zhí)行的處理的結(jié)果的字符位置表400的數(shù)據(jù)結(jié)構(gòu)的實(shí)例的說明圖。字符位置表400包括文本區(qū)域ID欄410、文本區(qū)域位置欄420、字符ID欄430、字符代碼欄440和字符位置欄450。文本區(qū)域ID欄410存儲(chǔ)用于唯一地識別圖像中的文本區(qū)域的識別符。文本區(qū)域位置欄420存儲(chǔ)文本區(qū)域的位置,并包括x坐標(biāo)欄421、 y坐標(biāo)欄422、寬度欄423和高度欄424。 x坐標(biāo)欄421和y坐標(biāo)欄422存儲(chǔ)文本區(qū)域(例如矩形)的左上角位置的坐標(biāo),寬度欄423存儲(chǔ)該文本區(qū)域的寬度,而高度欄424存儲(chǔ)該文本區(qū)域的高度。字符ID欄430存儲(chǔ)用于唯一地識別存在于文本區(qū)域中的字符圖像的識別符。字符代碼欄440將由字符識別模塊124執(zhí)行的字符識別的結(jié)果(字符代碼)與字符圖像對應(yīng)地存儲(chǔ)。字符位置欄450存儲(chǔ)字符圖像的位置,并包括x坐標(biāo)欄451、 y坐標(biāo)欄452、寬度欄453和高度欄454。 x坐標(biāo)欄451和y坐標(biāo)欄452存儲(chǔ)字符圖像(例如矩形)的左上角位置的坐標(biāo),寬度欄453存儲(chǔ)該字符圖像的寬度,并且高度欄454存儲(chǔ)該字符圖像的髙度。文本區(qū)域ID欄410、文本區(qū)域位置欄420、字符ID欄430和字符位置欄450中的內(nèi)容主要由頁面布局檢測模塊123生成,并且字符代碼欄440的內(nèi)容主要由字符識別模塊124生成。此外,可以根據(jù)由字符識別模塊124執(zhí)行的字符識別的結(jié)果,通過重新提取字符圖像來修改字符位置欄450中的內(nèi)容。
關(guān)聯(lián)模塊130與提取/識別處理模塊120和翻譯模塊140連接。關(guān)聯(lián)模塊130將由書寫標(biāo)記檢測模塊121檢測到的書寫標(biāo)記的位置與
11由頁面布局檢測模塊123檢測到的字符的位置作比較,并將該書寫標(biāo)
記與由字符識別模塊124執(zhí)行的字符識別的結(jié)果相關(guān)聯(lián)。然后,關(guān)聯(lián)模塊130將字符識別結(jié)果和關(guān)聯(lián)結(jié)果發(fā)送到翻譯模塊140。
也就是說,關(guān)聯(lián)模塊130查找與書寫標(biāo)記的位置對應(yīng)的字符的位置。當(dāng)書寫標(biāo)記區(qū)域和字符區(qū)域彼此重疊時(shí),這種查找處理不僅包括查找與書寫標(biāo)記的位置一致的字符的位置,而且包括查找在書寫標(biāo)記的位置附近的字符的位置。"附近"包括目標(biāo)書寫標(biāo)記的位置周圍,具體來說,在與目標(biāo)書寫標(biāo)記的位置相距預(yù)定距離的范圍內(nèi)。例如,可以基于從書寫標(biāo)記的中心到字符的中心的距離、從書寫標(biāo)記的周圍到字符的周圍的距離(其間的最短距離)等來測量上述距離。
然后,提取與字符的位置對應(yīng)的字符識別結(jié)果(作出書寫標(biāo)記的字符)。例如,具體來說,當(dāng)字符識別結(jié)果以例如HTML (超文本標(biāo)記語言)等描述語言來表達(dá)時(shí),作出書寫標(biāo)記的字符可以被標(biāo)簽(表示作出書寫標(biāo)記的保留字)包圍。當(dāng)采用像圖4的實(shí)例中所示的字符位置表400那樣的表格格式時(shí),可以設(shè)置表示字符是否為作出書寫標(biāo)記的字符的欄。
此外,可以判斷作出書寫標(biāo)記的字符是否構(gòu)成在該語言中具有意義的字符串。具有意義的字符串的實(shí)例包括字詞、短語和句子。此外,例如,可以根據(jù)字符是否被存儲(chǔ)在預(yù)先準(zhǔn)備好的字典中或者是否可以通過語法分析等手段提取字符來進(jìn)行上述判斷。當(dāng)判定字符不構(gòu)成具有意義的字符串時(shí),可以這樣執(zhí)行,即增加或刪除在前或在后的字符,直到獲得具有意義的字符串,并且將其視作作出書寫標(biāo)記的字符。當(dāng)修改作出書寫標(biāo)記的字符時(shí),同樣可以根據(jù)該字符的修改來修改書寫標(biāo)記檢測模塊121的檢測結(jié)果。
翻譯模塊140與關(guān)聯(lián)模塊130和圖像生成模塊150連接。翻譯模塊140翻譯由字符識別模塊124執(zhí)行的字符識別的結(jié)果,以便使翻譯結(jié)果可以被識別為通過關(guān)聯(lián)模塊130而與書寫標(biāo)記相關(guān)聯(lián)的字符識別的結(jié)果的譯文。然后,翻譯模塊140將翻譯結(jié)果發(fā)送到圖像生成模塊150。
也就是說,翻譯模塊140翻譯從關(guān)聯(lián)模塊130傳送來的字符識別的結(jié)果。對于翻譯處理來說,可以采用通常已知的(機(jī)器)翻譯技 術(shù)。例如,對字符識別的結(jié)果進(jìn)行語法分析,并且利用第一種語言中 的字詞和第二種語言中的字詞彼此相關(guān)聯(lián)的字典將字符識別的結(jié)果 翻譯成第二種語言。
在翻譯時(shí),從關(guān)聯(lián)模塊130傳送來的關(guān)聯(lián)結(jié)果也反映在翻譯結(jié)
果中。例如,具體來說,當(dāng)翻譯結(jié)果以例如HTML等描述語言來表 達(dá)時(shí),作出書寫標(biāo)記的字符的翻譯結(jié)果可以被標(biāo)簽(表示作出書寫標(biāo) 記的保留字)包圍。
圖像生成模塊150與翻譯模塊140和輸出模塊160連接,并包 括原始圖像轉(zhuǎn)換模塊151、譯文圖像生成模塊152和組合模塊153。 圖像生成模塊150從翻譯模塊140接收翻譯結(jié)果、生成包括翻譯結(jié)果 的圖像并將其發(fā)送到輸出模塊160。由圖像生成模塊150生成的圖像
可以是以頁面描述語言等記述的文件。
原始圖像轉(zhuǎn)換模塊151與組合模塊153連接,并且在翻譯模塊 140執(zhí)行翻譯之后,原始圖像轉(zhuǎn)換模塊151基于由書寫標(biāo)記檢測模塊 121檢測到的書寫標(biāo)記的位置來轉(zhuǎn)換由圖像接收模塊IIO接收到的圖 像中的字符圖像。例如,具體來說,原始圖像轉(zhuǎn)換模塊151可以基于 由書寫標(biāo)記檢測模塊121檢測到的書寫標(biāo)記的位置來將字符圖像轉(zhuǎn) 換成隱藏作出書寫標(biāo)記的字符圖像的圖像。更具體來說,這種轉(zhuǎn)換包 括用黑色涂抹字符圖像(稱為消密)或?qū)⒆址麍D像轉(zhuǎn)換成準(zhǔn)備作為該 字符圖像的替代物的預(yù)定字符圖像。然后,原始圖像轉(zhuǎn)換模塊151 將經(jīng)轉(zhuǎn)換的圖像發(fā)送到組合模塊153。
譯文圖像生成模塊152與組合模塊153連接,并且生成與書寫 標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像,以便以下述格式輸出與書寫標(biāo)記相關(guān) 聯(lián)的翻譯結(jié)果的圖像,所述格式不同于不與書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié) 果的圖像的格式。然后,譯文圖像生成模塊152將所生成的圖像發(fā)送 到組合模塊153。例如,具體來說,譯文圖像生成模塊152可以生成 隱藏與書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像。這適用于想要在保證翻譯 結(jié)果的質(zhì)量的同時(shí)隱藏譯文圖像的情況。例如,如果隱藏原始圖像的 字符,則從處理對象中排除該字符,從而當(dāng)執(zhí)行字符識別和翻譯時(shí),翻譯結(jié)果的質(zhì)量會(huì)下降。然而,在本示例性實(shí)施例中,還對要隱藏原 始圖像的部分執(zhí)行字符識別和翻譯,并且隱藏翻譯結(jié)果的與要隱藏的 部分對應(yīng)的部分。
此外,譯文圖像生成模塊152可以基于由書寫標(biāo)記檢測模塊121 檢測到的書寫標(biāo)記的類型來生成與書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖 像。例如,具體來說,當(dāng)書寫標(biāo)記是紅色時(shí),用黑色涂抹與書寫標(biāo)記 相關(guān)聯(lián)的翻譯結(jié)果,并且當(dāng)書寫標(biāo)記是藍(lán)色時(shí),用預(yù)定字符代替與書 寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果。
此外,譯文圖像生成模塊152可以將類型與由書寫標(biāo)記檢測模 塊121檢測到的書寫標(biāo)記的類型相同的書寫標(biāo)記添加在與書寫標(biāo)記 相關(guān)聯(lián)的翻譯結(jié)果的圖像中。例如,具體來說,當(dāng)用紅色標(biāo)記符作出 書寫標(biāo)記時(shí),將用相同的紅色標(biāo)記符涂抹的圖像添加在與書寫標(biāo)記相 關(guān)聯(lián)的翻譯結(jié)果中。同樣地,當(dāng)書寫標(biāo)記是藍(lán)色下劃線時(shí),將相同的 下劃線添加在與書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果中。當(dāng)需要澄清原始圖像 和譯文圖像之間的關(guān)聯(lián)關(guān)系時(shí)執(zhí)行這種處理。
組合模塊153與原始圖像轉(zhuǎn)換模塊151和譯文圖像生成模塊152 連接,并且組合由原始圖像轉(zhuǎn)換模塊151轉(zhuǎn)換的圖像和由譯文圖像生 成模塊152生成的圖像。組合模塊153將組合成的圖像發(fā)送到輸出模 塊160。
當(dāng)僅僅輸出譯文圖像時(shí),不需要原始圖像轉(zhuǎn)換模塊151和組合 模塊153。在這種情況下,由譯文圖像生成模塊152生成的圖像被發(fā) 送到輸出模塊160。
輸出模塊160與圖像生成模塊150連接。輸出模塊160從圖像 生成模塊150接收圖像并輸出該圖像。輸出圖像包括用例如打印機(jī)等 印刷機(jī)打印圖像、將其顯示在顯示器上、用例如傳真機(jī)等圖像發(fā)送裝 置發(fā)送圖像以及將其寫入例如圖像數(shù)據(jù)庫等圖像存儲(chǔ)器中。
圖2是示出根據(jù)本示例性實(shí)施例的處理實(shí)例1的流程圖。該處 理實(shí)例1的對象是用于隱藏的己經(jīng)作出書寫標(biāo)記的圖像,并且處理實(shí) 例1隱藏譯文圖像中相應(yīng)的字符圖像。例如,這適用于當(dāng)文檔以不同 的語言向公眾公開時(shí)隱藏該文檔中描述的信息項(xiàng)的情況。在步驟S202中,書寫標(biāo)記檢測模塊121對由圖像接收模塊110 接收到的圖像執(zhí)行色調(diào)分離,從而提取包含作為用戶作出的書寫標(biāo)記 的標(biāo)記符的位置的標(biāo)記符信息。除標(biāo)記符的位置之外,標(biāo)記符信息還 可以包括標(biāo)記符的顏色。
在步驟S204中,頁面布局檢測模塊123從由圖像接收模塊110 接收到的圖像中提取文本區(qū)域并提取字符圖像的位置。然后,字符識 別模塊124對位于字符圖像的位置處的字符圖像執(zhí)行字符識別處理。
在步驟S206中,關(guān)聯(lián)模塊130將在步驟S204中被識別為字符 的字符圖像的位置信息與在步驟S202中提取的標(biāo)記符信息中包含的 位置信息作比較。
在步驟S208中,關(guān)聯(lián)模塊130存儲(chǔ)位置與標(biāo)記符的位置重疊的 字符作為被指定字符。例如,更具體來說,以標(biāo)簽包圍用標(biāo)記符涂抹 的字符,并且以HTML記述字符識別結(jié)果。
在步驟S210中,翻譯模塊140執(zhí)行機(jī)器翻譯。在這里,翻譯模 塊140將機(jī)器翻譯的結(jié)果以下述格式發(fā)送到下一個(gè)處理,所述格式可 以被清楚地識別為用標(biāo)記符涂抹的字符的翻譯結(jié)果。例如,更具體來 說,以標(biāo)簽包圍用標(biāo)記符涂抹的字符的翻譯結(jié)果,并且以HTML記 述翻譯結(jié)果。
在步驟S212中,圖像生成模塊150判斷選擇(i)替換翻譯(不 保留原始圖像的字符圖像而是用翻譯結(jié)果重寫的輸出,見圖5B)和 (ii)旁注標(biāo)記風(fēng)格(Ruby-style)翻譯(原樣保留原始圖像的字符圖 像并使翻譯結(jié)果像旁注標(biāo)記字符那樣相關(guān)聯(lián),見圖6B)中的哪一種 作為輸出格式。在本示例性實(shí)施例中,根據(jù)用戶的操作或預(yù)定輸出格 式來進(jìn)行該判斷。
在步驟S214中,原始圖像轉(zhuǎn)換模塊151利用在步驟S202中提 取的標(biāo)記符信息從由圖像接收模塊110接收到的圖像中去除具有標(biāo) 記符的顏色的區(qū)域。
在步驟S216中,原始圖像轉(zhuǎn)換模塊151進(jìn)一步從該圖像中去除 字符部分。也就是說,通過步驟S214和S216的處理從該圖像中去 除字符圖像部分。從而,將除字符圖像之外的圖像(例如圖形和照片圖像)保留在該圖像中。
在步驟S218中,原始圖像轉(zhuǎn)換模塊151利用在步驟S202中提 取的標(biāo)記符信息用黑色等顏色涂抹由圖像接收模塊110接收到的圖 像中位于標(biāo)記符位置處的字符圖像。也就是說,由于存在同樣輸出原 始圖像的情況,所以隱藏用標(biāo)記符涂抹的字符。應(yīng)當(dāng)注意到,這包括 用預(yù)定字符串的圖像代替用標(biāo)記符涂抹的字符而不是用黑色將其涂 抹。
在步驟S220中,譯文圖像生成模塊152布置翻譯結(jié)果的字符圖 像以便使其與原始圖像的文本區(qū)域?qū)?yīng)。在這樣做時(shí),在輸出格式是 替換翻譯的情況下,譯文圖像生成模塊152將翻譯結(jié)果的字符圖像布 置在與翻譯結(jié)果的語言相符的文本區(qū)域中。在輸出格式是旁注標(biāo)記風(fēng) 格翻譯的情況下,由于原始字符圖像存在于文本區(qū)域中,所以譯文圖 像生成模塊152將翻譯結(jié)果的字符圖像布置在各行之間。
在步驟S222中,譯文圖像生成模塊152給用標(biāo)記符表示的譯文 字符串(即用標(biāo)記符涂抹的字符的翻譯結(jié)果)提供指定效果。這里, 指定效果是隱藏與標(biāo)記符的類型相符的譯文字符串,其實(shí)例包括用黑 色涂抹譯文字符串以及用預(yù)定字符串的圖像代替譯文字符串。
在步驟S224中,組合模塊153組合在步驟S216中生成的背景 圖像(從中去除字符圖像的圖像)或在步驟S218中生成的圖像(從 中去除用標(biāo)記符涂抹的字符圖像的圖像)以及在步驟S222中生成的 圖像(譯文圖像)。然后,輸出模塊160輸出組合成的圖像。
圖5A和5B是示出根據(jù)本示例性實(shí)施例的處理實(shí)例1-1的說明 圖。具體來說,圖5A和5B示出當(dāng)在圖2的實(shí)例中所示的流程圖的 步驟S212中選擇替換翻譯時(shí)的處理實(shí)例。圖5A的實(shí)例中所示的原 始圖像510是由本示例性實(shí)施例的圖像接收模塊IIO接收到的圖像, 并且圖5B的實(shí)例中所示的譯文圖像520是由本示例性實(shí)施例的輸出 模塊160輸出的圖像。應(yīng)當(dāng)注意到,由于圖5B示出了將圖5A所示 日文文檔翻譯成英文的結(jié)果,所以在圖5A中有意地保留了日文字符。
圖5A的實(shí)例中所示的原始圖像510包括標(biāo)記符區(qū)域511和標(biāo)記 符區(qū)域512。也就是說,用標(biāo)記符涂抹用戶不想公開的字符串"私f二^力S目指卞t。"511 (意思是我們所關(guān)注的目標(biāo))禾P"私fe^W大切 t二卞3 二 t "512 (意思是我們注重)??梢约俣?biāo)記符區(qū)域511和標(biāo) 記符區(qū)域512是用具有不同顏色的標(biāo)記符作出的書寫標(biāo)記。
圖5B的實(shí)例中所示在字符識別之后翻譯原始圖像510得到的譯 文圖像520包括掩蓋區(qū)域521以及掩蓋區(qū)域522A和522B。在掩蓋 區(qū)域521中,根據(jù)標(biāo)記符區(qū)域511的顏色用黑色隱藏標(biāo)記符區(qū)域511 的譯文部分,并且在掩蓋區(qū)域522A和522B中,通過用與標(biāo)記符區(qū) 域511的顏色相關(guān)聯(lián)的"詞語A"代替標(biāo)記符區(qū)域512的譯文部分來隱 藏該譯文部分。
圖6A和6B是示出根據(jù)本示例性實(shí)施例的處理實(shí)例1-2的說明 圖。圖6A和6B示出當(dāng)在圖2的實(shí)例中所示的流程圖的步驟S212中 選擇旁注標(biāo)記風(fēng)格翻譯時(shí)的處理實(shí)例。圖6A的實(shí)例中所示的原始圖 像610是由本示例性實(shí)施例的圖像接收模塊IIO接收到的圖像,并且 圖6 B的實(shí)例中所示的譯文圖像620是由本示例性實(shí)施例的輸出模塊 160輸出的圖像。應(yīng)當(dāng)注意到,由于圖6B示出了將圖6A所示日文 文檔翻譯成英文的結(jié)果,所以在圖6A和6B中有意地保留了日文字 符。
原始圖像610包括標(biāo)記符區(qū)域611和標(biāo)記符區(qū)域612。這些標(biāo)記 符區(qū)域與圖5A的實(shí)例中所示的原始圖像510的標(biāo)記符區(qū)域相同。
在字符識別后翻譯原始圖像610得到的譯文圖像620中,將譯 文示出在原始圖像610中各行字符串之間。譯文圖像620包括掩蓋區(qū) 域621、掩蓋區(qū)域622A和622B、掩蓋區(qū)域631和掩蓋區(qū)域632。也 就是說,掩蓋區(qū)域631和掩蓋區(qū)域632隱藏原始圖像610的標(biāo)記符區(qū) 域612和標(biāo)記符區(qū)域611,并且掩蓋區(qū)域621以及掩蓋區(qū)域622A和 622B隱藏標(biāo)記符區(qū)域612的譯文部分和標(biāo)記符區(qū)域611的譯文部分。 根據(jù)標(biāo)記符區(qū)域612和標(biāo)記符區(qū)域611的顏色,使掩蓋區(qū)域621以及 掩蓋區(qū)域622A和622B的格式彼此不同。
圖7是示出根據(jù)本示例性實(shí)施例的處理實(shí)例2的流程圖。該處 理實(shí)例2的對象是為了表明該部分是重要的并引起注意等而作出書 寫標(biāo)記的圖像,并且處理實(shí)例2將相應(yīng)的字符圖像顯示在譯文圖像中,并使之與未作出書寫標(biāo)記的字符圖像不同。例如,該處理實(shí)例2 適用于當(dāng)翻譯文檔時(shí)使該文檔與翻譯過的文檔相關(guān)聯(lián)地示出的情況。
將圖7的實(shí)例中所示的流程圖與圖2的實(shí)例中所示的流程圖作 比較,步驟S702至S716的處理與步驟S202至S216的處理相似, 步驟S718至S722的處理與步驟S220至S224的處理相似,而不存 在與步驟S218對應(yīng)的處理。這是由于在圖7所示處理實(shí)例2中,原 樣保留用標(biāo)記符對原始圖像作出書寫標(biāo)記的部分,而圖2所示處理實(shí) 例l是要隱藏書寫標(biāo)記部分并且處理實(shí)例l需要隱藏用標(biāo)記符對原始 圖像作出書寫標(biāo)記的部分。
當(dāng)在步驟S712中判定選擇旁注標(biāo)記風(fēng)格翻譯時(shí),由于處理轉(zhuǎn)入 步驟S718,即由于不需要與步驟S218對應(yīng)的處理,所以不需要由原 始圖像轉(zhuǎn)換模塊151執(zhí)行的處理。
圖8A和8B是示出根據(jù)本示例性實(shí)施例的處理實(shí)例2-1的說明 圖。這是當(dāng)在圖7的實(shí)例中所示的流程圖的步驟S712中選擇替換翻 譯時(shí)的處理實(shí)例。圖8A的實(shí)例中所示的原始圖像810是由本示例性 實(shí)施例的圖像接收模塊IIO接收到的圖像,并且圖8B的實(shí)例中所示 的譯文圖像820是由本示例性實(shí)施例的輸出模塊160輸出的圖像。應(yīng) 當(dāng)注意到,由于圖8B示出了將圖8A所示日文文檔翻譯成英文的結(jié) 果,所以在圖8A中有意地保留了日文字符。
圖8A的實(shí)例中所示的原始圖像810包括標(biāo)記符區(qū)域811和標(biāo)記 符區(qū)域812。這些標(biāo)記符區(qū)域與圖5A的實(shí)例中所示的原始圖像510 的標(biāo)記符區(qū)域相同。也就是說,用戶用標(biāo)記符對字符串"私t 6力;目 指ttO"811 (意思是我們所關(guān)注的目標(biāo))和"私亡6力;大切(t 6 二 & "812 (意思是我們注重)中的每一個(gè)作出書寫標(biāo)記。標(biāo)記符區(qū)域 811和標(biāo)記符區(qū)域812是用具有不同顏色的標(biāo)記符作出的書寫標(biāo)記。 這些字符串不是要被隱藏的對象而是要被識別為重要或應(yīng)當(dāng)引起注 意的對象。
圖8B的實(shí)例中所示在字符識別之后翻譯原始圖像810得到的譯 文圖像820包括字符修飾821以及字符修飾822A和822B。在字符 修飾821中,根據(jù)標(biāo)記符區(qū)域812的顏色添加書寫標(biāo)記的圖像,即顏色與標(biāo)記符區(qū)域812的顏色相同的區(qū)域。在字符修飾822A和822B 中,根據(jù)標(biāo)記符區(qū)域811的顏色添加與該顏色相關(guān)聯(lián)的下劃線的書寫 標(biāo)記圖像。
圖9A和9B是示出根據(jù)本示例性實(shí)施例的處理實(shí)例2-2的說明 圖。這是當(dāng)在圖7的實(shí)例中所示的流程圖的步驟S712中選擇旁注標(biāo) 記風(fēng)格翻譯時(shí)的處理實(shí)例。圖9A的實(shí)例中所示的原始圖像910是由 本示例性實(shí)施例的圖像接收模塊110接收到的圖像,并且圖9B的實(shí) 例中所示的譯文圖像920是由本示例性實(shí)施例的輸出模塊160輸出的 圖像。應(yīng)當(dāng)注意到,由于圖9B示出了將圖9A所示日文文檔翻譯成 英文的結(jié)果,所以在圖9A和9B中有意地保留了日文字符。
圖9A的實(shí)例中所示的原始圖像910包括標(biāo)記符區(qū)域911和標(biāo)記 符區(qū)域912。這些標(biāo)記符區(qū)域與圖8A的實(shí)例中所示的原始圖像810 的標(biāo)記符區(qū)域相同。
在圖9B的實(shí)例中所示在字符識別之后翻譯原始圖像910得到的 譯文圖像920中,將譯文示出在原始圖像910中各行字符串之間。譯 文圖像920包括字符修飾921、字符修飾922A和922B、字符修飾 931和字符修飾932。也就是說,字符修飾931和字符修飾932分別 就是原始圖像910的標(biāo)記符區(qū)域911和標(biāo)記符區(qū)域912原樣,并且字 符修飾921以及字符修飾922A和922B存在于相應(yīng)的譯文部分中。 根據(jù)標(biāo)記符區(qū)域912和標(biāo)記符區(qū)域911的顏色,使字符修飾921以及 字符修飾922A和922B的格式不同。
參照圖10,對本示例性實(shí)施例的硬件結(jié)構(gòu)的實(shí)例進(jìn)行說明。圖 10所示的結(jié)構(gòu)由例如個(gè)人計(jì)算機(jī)(PC)構(gòu)成,并且示出了包括例如 掃描儀等數(shù)據(jù)讀取部分1017和例如打印機(jī)等數(shù)據(jù)輸出部分1018的硬 件結(jié)構(gòu)的實(shí)例。
CPU (中央處理單元)1001是根據(jù)計(jì)算機(jī)程序來執(zhí)行處理的控 制部分,所述計(jì)算機(jī)程序記述上述實(shí)施例中所描述的各種模塊的執(zhí)行 序列,所述各種模塊即為提取/識別處理模塊120、關(guān)聯(lián)模塊130、翻 譯模塊140和圖像生成模塊150等模塊。
ROM (只讀存儲(chǔ)器)1002存儲(chǔ)CPU 1001所使用的程序或運(yùn)算參數(shù)等。RAM (隨機(jī)存取存儲(chǔ)器)1003存儲(chǔ)CPU 1001的執(zhí)行中所 使用的程序和在其執(zhí)行中適當(dāng)?shù)刈兓膮?shù)等。這些部件通過由CPU 總線等構(gòu)成的主機(jī)總線1004相互連接。
主機(jī)總線1004通過橋接器1005與例如PCI (周邊部件互連/接 口)總線等外部總線1006連接。
鍵盤1008和例如鼠標(biāo)等指點(diǎn)裝置1009是由操作人員來操作的 輸入裝置。其實(shí)例包括液晶顯示器和CRT (陰極射線管)的顯示器 1010將各項(xiàng)信息顯示為文本以及圖像信息。
HDD (硬盤驅(qū)動(dòng)器)1011包含硬盤并驅(qū)動(dòng)硬盤來記錄或再現(xiàn)由 CPU 1001執(zhí)行的程序和信息。硬盤存儲(chǔ)由圖像接收模塊110接收到 的圖像、翻譯模塊140的翻譯結(jié)果等。此外,硬盤還存儲(chǔ)其它各種數(shù) 據(jù)處理程序以及各種計(jì)算機(jī)程序。
驅(qū)動(dòng)器1012讀取記錄在例如安裝的磁盤、光盤、光電磁盤或半 導(dǎo)體存儲(chǔ)器等可移動(dòng)記錄介質(zhì)1013中的數(shù)據(jù)或程序,以便將該數(shù)據(jù) 或程序提供給通過接口 1007、外部總線1006、橋接器1005以及主機(jī) 總線1004連接的RAM 1003??梢苿?dòng)記錄介質(zhì)1013也可以用作類似 于硬盤的數(shù)據(jù)記錄區(qū)域。
連接端口 1014用于連接外部連接裝置1015,并包括例如USB 和IEEE 1394等連接部分。連接端口 1014通過接口 1007、外部總線 1006、橋接器1005以及主機(jī)總線1004等與CPU 1001等連接。通信 部分1016與網(wǎng)絡(luò)連接并執(zhí)行與外部的數(shù)據(jù)通信處理。數(shù)據(jù)讀取部分 1017例如是掃描儀并執(zhí)行文檔讀取處理。數(shù)據(jù)輸出部分1018例如是 打印機(jī)并執(zhí)行文檔數(shù)據(jù)輸出處理。
圖IO所示的硬件結(jié)構(gòu)是一個(gè)結(jié)構(gòu)實(shí)例,并且本示例性實(shí)施例不 限于圖IO所示的結(jié)構(gòu),而是可以采用能夠執(zhí)行本示例性實(shí)施例中所 描述的模塊的任何硬件結(jié)構(gòu)。例如, 一些模塊可以由例如ASIC (專 用集成電路)等專用硬件組成, 一些模塊可以存在于外部系統(tǒng)中并由 通信線路連接,此外,圖IO所示的多個(gè)系統(tǒng)可以用通信線路相互連 接以便彼此配合工作。此外,本示例性實(shí)施例可以包含在復(fù)印機(jī)、傳 真機(jī)、掃描儀、打印機(jī)、多功能機(jī)(具有掃描儀、打印機(jī)、復(fù)印機(jī)和傳真機(jī)等兩種或更多種功能的圖像處理裝置)等中。
可以通過將程序存儲(chǔ)在記錄介質(zhì)中來提供上述程序,或者可以 通過通信裝置來提供程序。在這種情況下,可以將上述程序作為"記 錄程序的計(jì)算機(jī)可讀記錄介質(zhì)"的發(fā)明。
所述"記錄程序的計(jì)算機(jī)可讀記錄介質(zhì)"是指用于安裝和執(zhí)行程 序、發(fā)布程序等的記錄程序的計(jì)算機(jī)可讀記錄介質(zhì)。
記錄介質(zhì)的實(shí)例包括數(shù)字通用盤(DVD),例如作為DVD論 壇中建立的標(biāo)準(zhǔn)的"DVD-R、 DVD-RW、 DVD-RAM"、作為DVD+RW 所建立的標(biāo)準(zhǔn)的"DVD+R、 DD+RW";壓密盤(CD),例如只讀存 儲(chǔ)器CD (CD-ROM)、可記錄CD (CD-R)和可重寫CD (CD-RW); 藍(lán)光盤;光電磁盤(MO);軟盤(FD);磁帶;硬盤;只讀存儲(chǔ)器 (ROM);電可擦除可重寫只讀存儲(chǔ)器(EEPROM);閃速存儲(chǔ)器; 以及隨機(jī)存取存儲(chǔ)器(RAM)。
上述程序或其一部分可以在被記錄在記錄介質(zhì)中的狀態(tài)下被存 儲(chǔ)或被發(fā)布。此夕卜,可以利用例如用于局域網(wǎng)(LAN)、城域網(wǎng)(MAN)、 廣域網(wǎng)(WAN)、因特網(wǎng)、內(nèi)聯(lián)網(wǎng)和外聯(lián)網(wǎng)的有線網(wǎng)絡(luò)、無線通信 網(wǎng)絡(luò)或其組合等傳輸介質(zhì)通過通信來發(fā)送程序,或者可以借助于載波 來傳送程序。
此外,上述程序可以是其它程序的一部分或者可以與另一個(gè)程 序一起記錄在記錄介質(zhì)中。此外,上述程序可以在被分割的狀態(tài)下記 錄在多個(gè)記錄介質(zhì)中。此外,只要上述程序是可恢復(fù)的,該程序就可 以以例如壓縮形式或編碼形式等任何形式來記錄。
權(quán)利要求
1.一種圖像處理裝置,包括圖像接收單元,其接收包含書寫標(biāo)記的圖像;書寫標(biāo)記檢測單元,其檢測由所述圖像接收單元接收到的圖像中的書寫標(biāo)記的位置;字符位置檢測單元,其檢測由所述圖像接收單元接收到的圖像中的字符圖像的位置;字符識別單元,其對由所述字符位置檢測單元檢測到的字符圖像執(zhí)行字符識別;關(guān)聯(lián)單元,其將由所述書寫標(biāo)記檢測單元檢測到的書寫標(biāo)記的位置與由所述字符位置檢測單元檢測到的字符圖像的位置作比較,以將所述書寫標(biāo)記與由所述字符識別單元執(zhí)行的字符識別的結(jié)果相關(guān)聯(lián);翻譯單元,其翻譯由所述字符識別單元執(zhí)行的字符識別的結(jié)果,以便將所述結(jié)果識別為通過所述關(guān)聯(lián)單元而與所述書寫標(biāo)記相關(guān)聯(lián)的字符識別的結(jié)果的譯文;譯文圖像生成單元,其生成與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像,以便以下述格式輸出所述圖像,所述格式不同于不與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像的格式;以及譯文圖像輸出單元,其輸出由所述譯文圖像生成單元生成的圖像。
2. 根據(jù)權(quán)利要求1所述的圖像處理裝置,還包括 原始圖像轉(zhuǎn)換單元,在所述翻譯單元執(zhí)行翻譯之后,所述原始圖像轉(zhuǎn)換單元基于由所述書寫標(biāo)記檢測單元檢測到的書寫標(biāo)記的位置來 轉(zhuǎn)換由所述圖像接收單元接收到的圖像中的字符圖像;以及組合單元,其將由所述原始圖像轉(zhuǎn)換單元轉(zhuǎn)換的圖像和由所述譯 文圖像生成單元生成的圖像進(jìn)行組合。
3. 根據(jù)權(quán)利要求2所述的圖像處理裝置,其中,所述原始圖像轉(zhuǎn)換單元基于由所述書寫標(biāo)記檢測單元檢測到的書寫標(biāo)記的位置來將所述字符圖像轉(zhuǎn)換成隱藏所述字符圖像的圖像。
4. 根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的圖像處理裝置,其中,所述譯文圖像生成單元生成隱藏與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié) 果的圖像。
5. 根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的圖像處理裝置,其中, 所述書寫標(biāo)記檢測單元還檢測所述書寫標(biāo)記的類型,并且 所述譯文圖像生成單元基于由所述書寫標(biāo)記檢測單元檢測到的所述書寫標(biāo)記的類型來生成與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像。
6. 根據(jù)權(quán)利要求1或2所述的圖像處理裝置,其中, 所述書寫標(biāo)記檢測單元還檢測所述書寫標(biāo)記的類型,并且 所述譯文圖像生成單元將類型與由所述書寫標(biāo)記檢測單元檢測到的所述書寫標(biāo)記的類型相同的書寫標(biāo)記添加在與所述書寫標(biāo)記相關(guān)聯(lián) 的翻譯結(jié)果的圖像中。
7. —種圖像處理方法,包括 接收包含書寫標(biāo)記的圖像; 檢測接收到的圖像中的書寫標(biāo)記的位置; 檢測接收到的圖像中的字符圖像的位置; 對檢測到的字符圖像執(zhí)行字符識另IJ;將檢測到的書寫標(biāo)記的位置與檢測到的字符圖像的位置作比較, 以將所述書寫標(biāo)記與字符識別的結(jié)果相關(guān)聯(lián);翻譯字符識別的結(jié)果,以便將所述結(jié)果識別為與所述書寫標(biāo)記相 關(guān)聯(lián)的字符識別的結(jié)果的譯文;生成與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像,以便以下述格式 輸出所述圖像,所述格式不同于不與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果 的圖像的格式;以及輸出與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像。
全文摘要
本發(fā)明公開了一種圖像處理裝置及圖像處理方法。所述圖像處理方法包括接收包含書寫標(biāo)記的圖像;檢測接收到的圖像中的書寫標(biāo)記的位置;檢測接收到的圖像中的字符圖像的位置;對檢測到的字符圖像執(zhí)行字符識別;將檢測到的書寫標(biāo)記的位置與檢測到的字符圖像的位置作比較,以將所述書寫標(biāo)記與字符識別的結(jié)果相關(guān)聯(lián);翻譯字符識別的結(jié)果,以便將所述結(jié)果識別為與所述書寫標(biāo)記相關(guān)聯(lián)的字符識別的結(jié)果的譯文;生成與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像,以便以下述格式輸出所述圖像,所述格式不同于不與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像的格式;以及輸出與所述書寫標(biāo)記相關(guān)聯(lián)的翻譯結(jié)果的圖像。
文檔編號G06F17/28GK101661465SQ200910129438
公開日2010年3月3日 申請日期2009年3月18日 優(yōu)先權(quán)日2008年8月28日
發(fā)明者今野裕也 申請人:富士施樂株式會(huì)社