專利名稱:文檔處理裝置和文檔處理方法
技術(shù)領(lǐng)域:
本申請涉及一種提高識別通過光學(xué)讀取文檔獲得的圖像數(shù)據(jù)中的字符的識別精度的技術(shù)。
背景技術(shù):
用于識別通過光學(xué)讀取文檔獲得的圖像數(shù)據(jù)中的字符的技術(shù)的OCR(光學(xué)字符識別)被很普遍地使用。已經(jīng)在OCR領(lǐng)域提出了各種技術(shù)來提高字符識別的精度。
已知提供有一種根據(jù)用戶的修正操作更新識別字典(dictionary)來提高識別精度的技術(shù)。利用這種技術(shù),不能被識別或被不正確識別的字符通過用戶進行的修正操作來進行糾正,從而登記在用于修正字符的特征向量數(shù)據(jù)庫中的字符形狀的特征向量被更新,以在識別修正的字符時反映該字符形狀的特征向量。
已知提供有一種通過在執(zhí)行語法分析之后更新識別字典來提高識別精度的技術(shù)。根據(jù)這種技術(shù),對識別結(jié)果進行語法分析,指定要修正成的、語法正確的字符,并更新識別字典以便能夠不進行語法分析就能識別語法正確的字符。
已知提供有一種在借助語法分析來修正識別結(jié)果時使用字的出現(xiàn)頻率進行修正而提高識別精度的技術(shù)。根據(jù)該技術(shù),如果在對識別結(jié)果進行語法分析期間,識別結(jié)果的字符串中的多個字是可能的候選,那么根據(jù)識別結(jié)果中的各個字的出現(xiàn)頻率來選擇一個字。
在打印文檔的OCR中,可以通過對字符識別使用特征向量數(shù)據(jù)庫來增加識別精度,所述特征向量數(shù)據(jù)庫適合于打印的字體。例如,在有限環(huán)境(例如公司或部門)中使用的字體數(shù)量是有限的,從而能夠制備足以適用于打印的字體的特征向量數(shù)據(jù)庫。如果使用了這種特征向量數(shù)據(jù)庫,那么將會提高這種有限環(huán)境中的文檔識別精度。
此外,在手寫文檔的OCR中,通過對字符識別使用適用于那些文檔的作者的字符識別特征向量數(shù)據(jù)庫則可能增加識別精度。例如,在上述有限環(huán)境中準備手寫文檔的人的數(shù)量是有限的,從而能夠準備足以適用于那些文檔的作者的特征向量數(shù)據(jù)庫。如果使用了這樣一種特征向量數(shù)據(jù)庫,那么將會提高在這種有限環(huán)境下的文檔識別精度。
此外,同上述技術(shù)一樣,如果加入語法分析,那么就可通過執(zhí)行適合于上述有限環(huán)境的語法分析來提高識別精度。例如,如果將在所述有限環(huán)境中使用的不常用字登記在語法分析字典中,那么就能夠減少未知字(未登記字)的數(shù)量(所述未知字是降低語法分析的精度的原因),從而增加了識別精度。例如,也可通過在語法分析字典中登記在上述有限環(huán)境中所使用的各個字的使用頻率,并根據(jù)這些使用頻率進行語法分析來提高識別精度。
因此,能夠針對被OCR的文檔的特性進行識別處理來提高識別精度。然而,在這些情況中的任何一種情況下,需要在用于識別的字典中預(yù)先登記針對被OCR的文檔的特性的信息。此外,為了獲得足以適用于所述有限環(huán)境的字典,必須預(yù)先收集適合于在所述有限環(huán)境下被OCR的文檔的特性的大量信息。迄今為止,還沒有用于有效收集這種信息的技術(shù)。
發(fā)明內(nèi)容
本發(fā)明就是鑒于上述情形做出的,并且提供了一種有效地收集在估計圖像數(shù)據(jù)中的字符時可用于提高估計精度的數(shù)據(jù)的技術(shù),所述圖像數(shù)據(jù)是通過對有限環(huán)境中的文檔進行光學(xué)讀取獲得的。
本發(fā)明提供一種文檔處理裝置,包括一普通特征向量存儲器,用于存儲多個字符中的每一個字符的形狀的特征向量;一輸入單元,用于光學(xué)讀入一文檔;一提取單元,用于根據(jù)由輸入單元讀入的文檔中的字符的形狀提取特征向量;一普通形狀識別單元,用于根據(jù)由提取單元提取的特征向量和存儲在普通特征向量存儲器中的內(nèi)容來估計其形狀的特征向量已由所述提取單元提取的字符;和一特殊特征向量存儲器,用于與所述普通形狀識別單元的估計結(jié)果相關(guān)聯(lián)地存儲由提取單元提取的特征向量。
利用這種文檔處理裝置,當(dāng)光學(xué)讀取一個文檔并打印該文檔時,根據(jù)所讀取的文檔中的字符的形狀來提取特征向量,使用這些所提取的特征向量來估計字符,并將特征向量與這些字符相關(guān)聯(lián)地存儲。
下面將根據(jù)附圖詳細說明本發(fā)明的實施例,其中圖1為表示根據(jù)本發(fā)明一實施例的文檔處理裝置2的結(jié)構(gòu)的方框圖;圖2為表示輸入到文檔處理裝置2的文檔的一個例子的示意圖;圖3為表示由文檔處理裝置2執(zhí)行的登記處理的流程圖;圖4為表示登記處理中的估計結(jié)果的例子的示圖;圖5是表示所述登記處理的估計結(jié)果的準確性的例子的摘錄的示意圖;圖6為表示文檔處理裝置2中的特殊特征向量數(shù)據(jù)庫D23的內(nèi)容的例子的示意圖;圖7為表示文檔處理裝置2中的特殊字字典D24的內(nèi)容的一個示例的示意圖;圖8為表示輸入給文檔處理裝置2的文檔的一個示例的示圖;圖9為由文檔處理裝置2執(zhí)行的OCR處理的流程圖;圖10為表示OCR處理中間的估計結(jié)果的一個示例的示圖;圖11是表示OCR處理中間的估計結(jié)果的準確性的例子的摘錄的示意圖;圖12是表示OCR處理中間的估計結(jié)果的準確性的例子的摘錄的示意圖;圖13為表示OCR處理中間的估計結(jié)果的一個例子的示圖;圖14為表示OCR處理的最終估計結(jié)果的一個示例的示圖。
具體實施例方式
下面將參照
根據(jù)本發(fā)明的實施例。
結(jié)構(gòu)圖1為表示根據(jù)本發(fā)明一實施例的文檔處理裝置2的結(jié)構(gòu)的方框圖。
文檔處理裝置2被安裝在一個公司中,被公司職員所共享,其具有操作單元21,職員通過操作將指令輸入到所述操作單元;掃描儀22,其中放置在文檔處理裝置2的文檔保持架(未示出)上的文檔被光學(xué)讀取并作為圖像數(shù)據(jù)輸入;RAM23,用于在其中臨時存儲圖像數(shù)據(jù);打印單元24,其根據(jù)存儲在RAM23中的圖像數(shù)據(jù),在紙上形成圖像并從文檔處理裝置2彈出所述紙張作為文檔;非易失性存儲器25,用于在其中存儲數(shù)據(jù);通信單元26,其通過通信路徑(未示出)與圖中未示出的外部裝置交換數(shù)據(jù);和用于控制各個單元的CPU27。
非易失性存儲器25可在電源(圖中未示出)未提供電力的情況下保存數(shù)據(jù),并存儲CPU27控制每個單元時所使用的控制程序P21;用于使文檔處理裝置2執(zhí)行如下所述的復(fù)制和登記處理的復(fù)制和登記程序P22;用于使文檔處理裝置2執(zhí)行如下所述的OCR處理的OCR執(zhí)行程序P23;用于OCR的普通特征向量數(shù)據(jù)庫D21;和用于OCR的普通字字典D22。在所述普通特征向量數(shù)據(jù)庫D21中,使普通文檔中使用的所有字符和這些字符形狀的特征向量相關(guān)聯(lián)。在普通字字典D22中,在普通文檔中使用的字被登記。
非易失性存儲器25還存儲一特殊特征向量數(shù)據(jù)庫D23和特殊字字典D24。在所述特殊特征向量數(shù)據(jù)庫D23中,在上述公司中所復(fù)制的文檔內(nèi)出現(xiàn)的字符與字符形狀的特征向量相關(guān)聯(lián)。在特殊字字典D24中,對于未知字,使字符串和出現(xiàn)頻率相關(guān)聯(lián)并將其登記,這些未知字是在上述公司中復(fù)制的文檔內(nèi)出現(xiàn)的但未被登記在普通字字典D22中的字。字的出現(xiàn)頻率為字在輸入給文檔處理裝置2的文檔中出現(xiàn)的次數(shù)。注意,在其初始狀態(tài)下所述特殊特征向量數(shù)據(jù)庫D23和特殊字字典D24中什么都沒登記。
當(dāng)被電源(圖中未示出)提供了電力時,CPU27從非易失性存儲器25中讀取控制程序P21并執(zhí)行它。這使得CPU27能夠控制文檔處理裝置2的各個單元。當(dāng)使用操作單元21輸入復(fù)制指令時,CPU27從非易失性存儲器25讀取復(fù)制和登記程序P22并執(zhí)行它。利用該程序,文檔處理裝置2執(zhí)行復(fù)制和登記處理。當(dāng)在上面的狀態(tài)下使用操作單元21將OCR處理指令輸入到CPU27中時,CPU27從非易失性存儲器25讀取OCR執(zhí)行程序P23并執(zhí)行它。由此,文檔處理裝置2執(zhí)行OCR處理。將與文檔處理裝置2的操作相結(jié)合地說明這些處理。當(dāng)CPU27處于這樣的狀態(tài)并通過通信單元26接收預(yù)定的請求時,CPU從非易失性存儲器25中的預(yù)定區(qū)域讀取OCR處理的結(jié)果并將它們發(fā)送給發(fā)出請求的地方。
操作下面說明具有上述構(gòu)成的文檔處理裝置2的操作。
首先,職員No.1在文檔保持架上放置一表示圖2的日語文檔。日語單詞“本願”(Hongan)和“本題”(hondai)為在普通字字典D22中未登記的僅在文檔中出現(xiàn)的單詞。這些單詞中的每一個都在所述文檔中出現(xiàn)兩次。此外,在所述文檔頂部(首先被讀取的部分)的字符要大于在其它部分中出現(xiàn)的字符。
接著,所述職員使用操作單元21輸入一復(fù)制指令。由此,CPU27執(zhí)行復(fù)制和登記處理。
在復(fù)制和登記處理中,CPU27通過掃描儀22光學(xué)讀取設(shè)置在文檔保持架上的文檔,作為圖像數(shù)據(jù)輸入,將該圖像數(shù)據(jù)寫入RAM23,并使用打印單元24根據(jù)所述圖像數(shù)據(jù)在紙上形成圖像并從文檔處理裝置2彈出所述紙張。文檔以這種方式被復(fù)制。
CPU27與該復(fù)制并行地執(zhí)行圖3中所示的登記處理。
首先,使用普通特征向量數(shù)據(jù)庫D21進行字符識別(步驟SC1)。具體地,存儲在RAM23中的圖像數(shù)據(jù)被分割成單個的字符單元。對所有分割出的圖像數(shù)據(jù),進行從圖像數(shù)據(jù)中提取字符形狀的特征向量的處理,并將所提取的特征向量與存儲在普通特征向量數(shù)據(jù)庫D21中的特征向量進行比較并估計字符的處理。估計的準確性也被計算。以這種方式,對于圖2中所示的文檔就獲得了圖4中所示的估計結(jié)果和圖5中所示的準確性。從附圖可以清楚地看出,對于較大字符的估計結(jié)果的準確性是相對較高的。
接著,準確性足夠高的估計結(jié)果(字符)與在估計期間提取的特征向量相關(guān)聯(lián)并登記在特殊特征向量數(shù)據(jù)庫D23中(步驟SC2)。確定準確性是否足夠高是通過這樣的過程實現(xiàn)的即將估計結(jié)果(字符)的準確性與一預(yù)定基準登記準確性(對于文檔處理裝置2為95%)進行比較并確定所獲得的估計結(jié)果的準確性是否等于或高于所述基準登記準確性。從所述說明可以清楚地看出,例如“本”(hon)被登記了四次。然而,在第一次登記“本”(hon)之后的登記中,只將特征向量寫入到非易失性存儲器25中。以這種方式,如圖6所示,字符“(”、“1”、“)”、“本”(hon)、“願”(gan)、“で”(de)、“の”(no)、和“題”(dai)與它們的特征向量相關(guān)聯(lián)地登記在特殊特征向量數(shù)據(jù)庫D23中。
接著,對估計結(jié)果中的字符串進行形態(tài)分析(morphologicalanalysis)(步驟SC3)。其將估計結(jié)果中的字符串分割成字。接著,使用普通字字典D22從所述形態(tài)分析獲得的字中提取未知字,準確性足夠高的未知字的字符串被登記在特殊字字典D24中,并終止登記處理。
確定一個字是否為準確性足夠高的未知字是通過確定構(gòu)成所述未知字的所有字符的估計結(jié)果的準確性是否都等于或高于基準登記準確性來實現(xiàn)的。例如,在圖2中的文檔的末尾部分出現(xiàn)的“本願”(Hongan)和在開始部分出現(xiàn)的“本願”(Hongan)和“本題”(hondai)被確定是準確性足夠高的未知字,同時在末尾部分出現(xiàn)的“本題”(hondai)未被確定為是準確性足夠高的未知字。
登記到特殊字字典D24的操作取決于將被登記的字符串是否已被登記在特殊字字典D24中。如果將被登記的字符串未被登記在特殊字字典D24中,那么CPU27將所述字符串與出現(xiàn)頻率“1”相關(guān)聯(lián)并將它登記在特殊字字典D24中。如果已經(jīng)被登記,則將與該字符串相關(guān)聯(lián)并被登記在特殊字字典D24中的出現(xiàn)頻率加1。如圖7所示,作為這種登記方式的結(jié)果,字符串“本願”(Hongan)和出現(xiàn)頻率“2”相關(guān)地登記在特殊字字典D24中,字符串“本題”(hondai)和出現(xiàn)頻率“1”相關(guān)地登記在特殊字字典D24中。
接著,職員No.2在文檔保持架上放置一如圖8中所示的日語文檔。在該文檔中,“(1)hongan”出現(xiàn)在開始部分中,而“本願”(Hongan)和“本題では”(hondai de wa)出現(xiàn)在末尾部分中。然后,該職員使用操作單元21輸入一OCR指令。接著,CPU27就執(zhí)行OCR處理。
在OCR處理中,CPU27通過掃描儀22光學(xué)讀取設(shè)置在文檔保持架中的文檔作為圖像數(shù)據(jù)輸入并將該圖像數(shù)據(jù)寫入到RAM23(步驟SD1)。接著,使用普通特征向量數(shù)據(jù)庫D21對該圖像數(shù)據(jù)進行字符識別(步驟SD2)。所述字符識別的內(nèi)容與圖3的步驟SC1中的相同。因此對圖8所示的文檔獲得了如圖10中所示的估計結(jié)果和如圖11中的摘錄所示的準確性。從附圖可以清楚地看出,在該階段發(fā)生了錯誤估計。更具體地說,所述文檔中的“1”的估計結(jié)果是“I”,字符“願”(gan)的估計結(jié)果是字符“題”(dai)或“頸”(kei)。
接著,執(zhí)行這樣一個處理,其中如果估計結(jié)果中的每個字符的估計準確性足夠高,則當(dāng)前的估計結(jié)果(使用普通特征向量的估計結(jié)果)就被采用,但如果所述估計準確性不是足夠高,則利用特殊特征向量數(shù)據(jù)庫D23進行字符識別;并且進一步如果這種字符識別的估計結(jié)果的準確性高于使用普通特征向量數(shù)據(jù)庫D21的估計結(jié)果的準確性,那么就使用利用特殊特征向量數(shù)據(jù)庫D23的估計結(jié)果,但如果并未高于使用普通特征向量數(shù)據(jù)庫D21的估計結(jié)果的準確性,則使用利用普通特征向量數(shù)據(jù)庫D21的估計結(jié)果(步驟SD3-SD9)。
確定估計準確性是否足夠高是通過將使用普通特征向量數(shù)據(jù)庫D21的估計準確性與一預(yù)定的基準確認準確性(對于文檔處理裝置2為90%)相比較并確定所獲得的估計結(jié)果的準確性是否等于或高于基準確認準確性來實現(xiàn)的。例如,在圖11中只有三個字符“本”(hon)的估計準確性足夠高。對于這三個字符“本”(hon)之外的其它字符進行使用特殊特征向量數(shù)據(jù)庫D23的字符識別。估計結(jié)果和以這種方式獲得的準確性如圖12中的摘錄所示。
圖12中的“(”、“1”、“)”、第一個“願”(gan)、第二個“願”(gan)和“題”(dai)分別對應(yīng)于圖11中的“(”、“I”、“)”、第一個“題”(dai)、第二個“題”(dai)和“頸”(kei)。在該對應(yīng)關(guān)系中,對于圖12中的“1”、第一個“願”(gan)、第二個“願”(gan)來說,圖12中的準確性高于圖11中的準確性。因此,所采用的估計結(jié)果如圖13所示。從附圖可以清楚地看出,在此階段只有一個錯誤估計(“頸”(kei))出現(xiàn)。
接著,對所采用的估計結(jié)果中的字符串進行形態(tài)分析(步驟SD10)。然后,使用形態(tài)分析的結(jié)果利用語法分析來獲得最終的估計結(jié)果(步驟SD11)。接著,將最終估計結(jié)果寫入非易失性存儲器25中的預(yù)定區(qū)域(步驟SD12)并終止OCR處理。下面說明在步驟SD11中進行的語法分析。
CPU27在語法分析中使用普通字字典D22和特殊字字典D24。如圖7所示,“本願”(Hongan)和“本題”(hondai)被登記在特殊字字典D24中,所以CPU27不需要將這些字符串處理為未知字。在該分析中,CPU27在估計結(jié)果中找出導(dǎo)致語法錯誤的字,檢查找出的字是否為可靠字,如果它們不是,那么就確定是否存在不會產(chǎn)生語法錯誤的字作為所述字的替代選項,如果這樣的字存在,那么就從替代選項中選擇最佳字,并使用它們來替代導(dǎo)致語法錯誤的字。
圖13中的“本頸”(honkei)是語法錯誤的一個例子。在該情況下,CPU27將“本頸”(honkei)檢測為產(chǎn)生語法錯誤的詞?!氨绢i”(honkei)中的“本”(hon)的準確性等于或高于基準確認準確性,但“頸”(kei)的準確性低于基準確認準確性。因此,因為“本頸”(honkei)包括有問題的字符,所以它不是可靠字。此外,雖然在所述說明中沒有包括,但當(dāng)“頸”(kei)變成估計結(jié)果時,其在使用特殊特征向量數(shù)據(jù)庫D23進行的字符識別之后的準確性為31%,而“願”(gan)的準確性為29%。這些準確性都等于或高于預(yù)定的基準替代準確性(對于文檔處理裝置2來說為25%),并且因為“本願”(Hongan)和“本題”(hondai)都不會產(chǎn)生語法錯誤,所以“本願”(Hongan)和“本題”(hondai)作為替代選項存在。這些替代選項中只能有一項被選擇,并且選擇的標準是每個選項的準確性和出現(xiàn)頻率。如上所述,在每項的準確性之間不存在大的差別,但如圖7所示,在出現(xiàn)頻率之間存在大的差別(兩倍)。因此,具有較高出現(xiàn)頻率的“本願”(Hongan)被選擇,并被替代“本頸”(honkei)使用。因此,最終的估計結(jié)果如圖14所示。
在OCR處理之后,職員No.2使用能夠與文檔處理裝置2進行通信的計算機來向文檔處理裝置2發(fā)送預(yù)定的請求。由CPU27通過通信單元26來獲得該請求。相應(yīng)地,CPU27從非易失性存儲器25的預(yù)定區(qū)域讀取最終的估計結(jié)果并將它們發(fā)送給發(fā)出請求的計算機。以這種方式,OCR處理的結(jié)果就被傳送給職員No.2。
結(jié)論如上所述,用戶僅通過使文檔處理裝置2進行光學(xué)讀取和打印文檔就能將數(shù)據(jù)存儲在文檔處理裝置2中,所述文檔處理裝置2用于在估計通過光學(xué)讀取一公司中的文檔獲得的圖像數(shù)據(jù)中的字符時提高估計準確性。另外,該存儲是在用戶沒有感知它的情況下進行的。此外,因為文檔處理裝置2由職員共享,所以能夠有效地進行數(shù)據(jù)積累。
用戶通過使文檔處理裝置2使用積累的數(shù)據(jù)執(zhí)行OCR處理就可獲得具有足夠高精度的識別結(jié)果。
此外,只在字符和/或字符串是以足夠高的準確性估計的時候,文檔處理裝置2才積累上述數(shù)據(jù)。因此,能夠無錯誤地避免積累不正確的數(shù)據(jù)以及識別精度降低。
上面的實施例也可如下所述地變化。
例如,可在OCR處理中不使用特殊特征向量數(shù)據(jù)庫D23,還可不使用特殊字字典D24。還可不在特殊字字典D24中登記出現(xiàn)頻率,而且也可將在OCR處理中登記在特殊字字典D24中的字符串處理為未知字。
還可響應(yīng)來自其它裝置的請求將特殊特征向量數(shù)據(jù)庫D23和特殊字字典D24發(fā)送給該裝置。
當(dāng)然,也能夠?qū)⒈景l(fā)明應(yīng)用于在任何文檔中進行的字符識別,包括日語之外的自然語言書寫的文檔和計算機程序表。
如上所述,本發(fā)明提供了一種文檔處理裝置,包括一普通特征向量存儲器,用于存儲多個字符中的每個字符的形狀的特征向量;一輸入單元,用于光學(xué)讀入一個文檔;一提取單元,用于根據(jù)由輸入單元讀入的文檔中的字符的形狀提取特征向量;一普通形狀識別單元,用于根據(jù)由提取單元提取的特征向量和存儲在普通特征向量存儲器中的內(nèi)容來估計其形狀的特征向量已由所述提取單元提取的字符;和一特殊特征向量存儲器,用于與所述普通形狀識別單元的估計結(jié)果相關(guān)聯(lián)地存儲由提取單元提取的特征向量。
按照該文檔處理裝置,當(dāng)光學(xué)讀取一個文檔并打印該文檔時,根據(jù)所讀取文檔中的字符的形狀來提取特征向量,使用這些提取的特征向量來估計字符,并將特征向量與這些字符相關(guān)聯(lián)地存儲。
此外,本發(fā)明提供了一種文檔處理裝置,包括一普通字存儲器,用于存儲字;一輸入單元,用于光學(xué)讀入一個文檔;一識別單元,用于根據(jù)由所述輸入單元讀入的文檔中的字符的形狀來估計構(gòu)成該文檔的字符串;一未知字檢測單元,用于根據(jù)所述識別單元的估計結(jié)果提取未存儲在所述普通字存儲器中的字;和一特殊字存儲器,用于存儲由所述未知字檢測單元提取的字。
根據(jù)該文檔處理裝置,當(dāng)光學(xué)讀取一個文檔并打印該文檔時,根據(jù)所讀取的文檔中的字符的形狀估計構(gòu)成所述文檔的字符,并根據(jù)該估計結(jié)果提取未存儲在普通字存儲單元中的字并將其存儲在特定字存儲單元中。
此外,本發(fā)明提供一種文檔處理裝置,包括一頻率存儲器,用于存儲多個字中的每一個字的出現(xiàn)頻率;一輸入單元,用于光學(xué)讀入一個文檔;一識別單元,用于根據(jù)由所述輸入單元讀入的文檔中的字符的形狀估計構(gòu)成該文檔的字符串;和一更新單元,用于根據(jù)識別單元的估計結(jié)果更新存儲在頻率存儲器中的頻率。
根據(jù)該文檔處理裝置,當(dāng)光學(xué)讀取一個文檔并打印該文檔時,根據(jù)所讀取的文檔中的字符的形狀估計所述文檔的字符,并根據(jù)該估計結(jié)果更新存儲在頻率存儲單元中的字的出現(xiàn)頻率。
上述文檔處理裝置僅通過使該文檔處理裝置讀入和打印文檔就能夠進行數(shù)據(jù)收集,所述數(shù)據(jù)用于在估計通過光學(xué)讀取一有限環(huán)境內(nèi)的文檔獲得的圖像數(shù)據(jù)中的字符時提高估計準確性,所述有限環(huán)境例如設(shè)置有該文檔處理裝置的公司或部門。此外,用這些文檔處理裝置光學(xué)讀入和打印文檔的用戶越多,執(zhí)行數(shù)據(jù)收集的效率越高。
此外,本發(fā)明提供了一種由預(yù)定用戶共享的文檔處理裝置執(zhí)行的文檔處理方法,其包括接收文檔和指令,根據(jù)接收的指令對接收的文檔進行處理,并輸出處理過的文檔,同時對所接收的文檔上的字符進行識別,并獲得和存儲反映字符識別準確性的信息;以及接收文檔并根據(jù)存儲的信息對所接收的文檔上的字符進行識別。
該文檔處理方法僅通過使該文檔處理裝置讀入和打印文檔就能夠進行數(shù)據(jù)收集,所述數(shù)據(jù)用于在估計通過光學(xué)讀取一有限環(huán)境內(nèi)的文檔獲得的圖像數(shù)據(jù)中的字符時提高估計的準確性,所述有限環(huán)境例如設(shè)置有該文檔處理裝置的公司或部門。此外,用這些文檔處理裝置光學(xué)讀入和打印文檔的用戶越多,執(zhí)行數(shù)據(jù)收集的效率越高。另外,所收集的數(shù)據(jù)用于在執(zhí)行步驟中進行字符識別,從而能夠以足夠高的精度識別字符。
為了解釋和說明的目的,前面已經(jīng)給出了本發(fā)明的實施例的說明。但其并不是窮舉性的,也不旨在將本發(fā)明限制于所公開的確切形式。很明顯,許多修改和變化對于本領(lǐng)域技術(shù)人員將是顯而易見的。所述各實施例被選擇說明以最好地解釋本發(fā)明的原理及其實際應(yīng)用,以便由此能夠使本領(lǐng)域技術(shù)人員理解本發(fā)明的各個實施例及其各種修改,以適合于特定的預(yù)期應(yīng)用。本發(fā)明的范圍由下述的權(quán)利要求及其等價內(nèi)容定義。
本申請要求于2004年5月25日提交的日本專利申請第2004-154970號的優(yōu)先權(quán),其全部內(nèi)容通過引用而被并入本文中。
權(quán)利要求
1.一種文檔處理裝置,包括一普通特征向量存儲器,用于存儲多個字符中的每個字符的形狀的特征向量;一輸入單元,用于光學(xué)讀入一文檔;一提取單元,用于根據(jù)所述輸入單元讀入的文檔中的字符的形狀提取特征向量;一普通形狀識別單元,用于根據(jù)所述提取單元提取的特征向量和存儲在普通特征向量存儲器中的內(nèi)容估計其形狀的特征向量已由所述提取單元提取的字符;和一特殊特征向量存儲器,用于與所述普通形狀識別單元的估計結(jié)果相關(guān)聯(lián)地存儲由提取單元提取的特征向量。
2.根據(jù)權(quán)利要求1所述的文檔處理裝置,其中所述特殊特征向量存儲器只在所述普通形狀識別單元獲得的估計準確性足夠高時,才存儲普通形狀識別單元的估計結(jié)果和由所述提取單元提取的特征向量。
3.根據(jù)權(quán)利要求1所述的文檔處理裝置,進一步包括一特殊形狀識別單元,用于根據(jù)由提取單元提取的特征向量和存儲在特殊特征向量存儲器中的內(nèi)容估計其形狀的特征向量已由所述提取單元進行提取了的特殊字符;和一形狀識別存儲器,如果由普通形狀識別單元獲得的估計準確性不是足夠高并且由特殊形狀識別單元獲得的估計準確性比普通形狀識別單元獲得的估計準確性高,則存儲特殊形狀識別單元的估計結(jié)果,否則存儲普通形狀識別單元的估計結(jié)果。
4.一種文檔處理裝置,包括一普通字存儲器,用于存儲字;一輸入單元,用于光學(xué)讀入一個文檔;一識別單元,用于根據(jù)所述輸入單元讀入的文檔中的字符的形狀估計構(gòu)成該文檔的字符串;一未知字檢測單元,用于根據(jù)所述識別單元的估計結(jié)果提取未存儲在普通字存儲器中的字;和一特殊字存儲器,用于存儲由所述未知字檢測單元提取的字。
5.根據(jù)權(quán)利要求4所述的文檔處理裝置,其中所述特殊字存儲器只在所述識別單元獲得的估計準確性足夠高時,才存儲由所述未知字檢測單元提取的字。
6.根據(jù)權(quán)利要求4所述的文檔處理裝置,還包括一字識別存儲器,用于存儲所述識別單元的估計結(jié)果;其中所述識別單元包括一形狀識別單元,用于根據(jù)輸入單元讀入的文檔中的字符的形狀來估計這些字符;和一字分析單元,用于根據(jù)存儲在普通字存儲器中的內(nèi)容和存儲在特殊字存儲器中的內(nèi)容,對由形狀識別單元的估計結(jié)果形成的字符串進行語法分析,以修正那些字符串并將修正后的字符串作為估計結(jié)果。
7.一種文檔處理裝置,包括一頻率存儲器,用于存儲多個字中的每個字的出現(xiàn)頻率;一輸入單元,用于光學(xué)讀入一個文檔;一識別單元,用于根據(jù)所述輸入單元讀入的文檔中的字符的形狀估計構(gòu)成該文檔的字符串;和一更新單元,用于根據(jù)所述識別單元的估計結(jié)果更新存儲在頻率存儲器中的頻率。
8.根據(jù)權(quán)利要求7所述的文檔處理裝置,還包括一頻率識別存儲器,用于存儲識別單元的估計結(jié)果;其中所述識別單元包括一形狀識別單元,用于根據(jù)由輸入單元讀入的文檔中的字符的形狀估計這些字符;和一字頻率單元,用于根據(jù)存儲在頻率存儲器中的內(nèi)容對由形狀識別單元的估計結(jié)果形成的字符串進行語法分析,以修正所述字符串并將修正后的字符串作為估計結(jié)果。
9.根據(jù)權(quán)利要求1所述的文檔處理裝置,還包括一能由用戶進行操作的操作單元;其中當(dāng)使用操作單元輸入一預(yù)定指令時,所述輸入單元光學(xué)讀取一文檔。
10.一種由預(yù)定用戶共享的文檔處理裝置執(zhí)行的文檔處理方法,包括接收文檔和指令,根據(jù)接收的指令對接收的文檔進行處理,并輸出處理過的文檔,同時對接收的文檔上的字符進行識別,并獲得和存儲反映字符識別準確性的信息;和接收文檔并根據(jù)存儲的信息對所接收的文檔上的字符進行識別。
全文摘要
文檔處理裝置和文檔處理方法。本發(fā)明所提供的文檔處理裝置包括一普通特征向量存儲器,用于存儲多個字符中的每個字符的形狀的特征向量;一輸入單元,用于光學(xué)讀入一個文檔;一提取單元,用于根據(jù)輸入單元讀入的文檔中的字符的形狀提取特征向量;一普通形狀識別單元,用于根據(jù)由提取單元提取的特征向量和存儲在普通特征向量存儲器中的內(nèi)容估計其形狀的特征向量由所述提取單元提取的字符;和一特殊特征向量存儲器,用于與所述普通形狀識別單元的估計結(jié)果相關(guān)聯(lián)地存儲由提取單元提取的特征向量。
文檔編號G06K9/00GK1702682SQ20051005541
公開日2005年11月30日 申請日期2005年3月17日 優(yōu)先權(quán)日2004年5月25日
發(fā)明者田代潔, 田川昌俊, 增市博, 伊藤篤, 石川恭輔, 劉紹明, 田宗道弘, 佐藤直子 申請人:富士施樂株式會社