光學字符識別裝置以及光學字符識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種即使在讀取對象的票據(jù)(日語:帳票)等上產(chǎn)生字符的打印錯位、票據(jù)裁剪偏差的情況下也能夠確保字符識別精度的光學字符識別裝置以及光學字符識別方法。
【背景技術(shù)】
[0002]—般來說,以光學方式識別在規(guī)定布局的票據(jù)上記載或打印的字符的光學字符識別裝置構(gòu)成為:將用于寫入在票據(jù)等的規(guī)定位置處打印的字符的字符寫入框(讀取區(qū))信息、打印字符字體形式存儲為格式定義參數(shù),按照該字符寫入框信息來識別票據(jù)的定義位置的字符。作為該格式定義參數(shù),可以列舉出票據(jù)尺寸、該票據(jù)中的讀取區(qū)在票據(jù)內(nèi)的垂直和水平讀取開始位置及結(jié)束位置的坐標、打印字符字體形式、讀取對象字符類型(英文和數(shù)字、假名、片假名、漢字、其它外國字符)。
[0003]然而,關(guān)于該票據(jù),有時會變更票據(jù)印刷商或使用自己公司內(nèi)的通用打印機來打印,在這種情況下,根據(jù)票據(jù)外形尺寸的差異、紙張裁剪偏差、打印機的打印精度,存在字符寫入框(讀取區(qū))、條形碼與預(yù)先設(shè)定的內(nèi)容不同的情況,在這種情況下,存在以下問題:票據(jù)外形尺寸、讀取區(qū)位置、讀取區(qū)內(nèi)的字符類型、字符字體形式、位數(shù)等的設(shè)定與預(yù)先決定的格式定義參數(shù)的定義不同,讀取精度降低。
[0004]作為記載了防止讀取精度降低的字符識別裝置技術(shù)的文獻,可以列舉出下述的專利文獻1,該專利文獻1中記載了如下技術(shù):設(shè)置有適當分辨率判定部和適當分辨率決定部,該適當分辨率判定部基于光學字符識別處理后的字符代碼判定是否以適當?shù)妮斎敕直媛蔬M行了圖像輸入,該適當分辨率決定部對輸入圖像決定適當?shù)妮斎敕直媛?,其中,在通過適當分辨率判定部視為在輸入分辨率的設(shè)定上存在問題的情況下,發(fā)出警報,促使以上述適當輸入分辨率再次進行圖像輸入,或者通過圖像處理部將輸入圖像的分辨率轉(zhuǎn)換為適當輸入分辨率,由此,高效地得到適當?shù)姆直媛实膱D像,即使在進行圖像輸入時沒有設(shè)定適當?shù)妮斎敕直媛实那闆r下,也防止讀取精度的降低。
[0005]專利文獻1:日本特開2008-244545號公報
【發(fā)明內(nèi)容】
_6] 發(fā)明要解決的問題
[0007]上述的專利文獻中記載的技術(shù)即使在沒有對輸入圖像設(shè)定適當?shù)妮斎敕直媛实那闆r下也能夠防止讀取精度的降低,但是存在以下問題:在上述的由于票據(jù)外形尺寸的差異、紙張裁剪偏差、打印機的打印精度而字符寫入框(讀取區(qū))位置與預(yù)先設(shè)定的位置不同的情況下,僅控制輸入分辨率是無法防止讀取精度的降低的。
[0008]本發(fā)明的目的在于想要解決上述以往技術(shù)的問題,提供一種即使在格式定義參數(shù)所定義的票據(jù)外形尺寸、讀取區(qū)位置等不同的情況下也能夠確保字符識別精度的光學字符識別裝置以及光學字符識別方法。
[0009]用于解決問題的方案
[0010]為了達到上述目的,第1方案所記載的發(fā)明是一種光學字符識別裝置,具備中央運算部,該中央運算部使用包括票據(jù)外形尺寸、用于從字符行圖像切取字符行的讀取區(qū)坐標、識別字體類型、條形碼類型以及規(guī)定讀取率的閾值的格式定義參數(shù),以光學方式讀取票據(jù)的字符行成分圖像,從讀取出的字符行成分圖像提取字符行圖像,從提取出的該字符行圖像逐個字符地切取字符來進行字符識別并顯示在顯示終端部上,該光學字符識別裝置的特征在于,中央運算部包括以下模塊:第一模塊,在判定為字符識別率低于規(guī)定識別率的閾值時,在顯示終端部上顯示用于警告字符識別率的降低的警告顯示畫面;第二模塊,顯示作為上述字符識別率的降低原因的基于讀取區(qū)坐標的票據(jù)尺寸、切取位置、識別字體類型、條形碼類型以及讀取率的各項目信息;第三模塊,在通過該第二模塊顯示的票據(jù)尺寸、切取位置、識別字體類型、條形碼類型以及讀取率中的某一個項目被選擇時,顯示上述各項目信息的所選擇的某一個項目和對于該項目的格式定義參數(shù)的變更方案;以及第四模塊,在判定為要反映通過該第三模塊顯示的變更方案時,基于該變更方案來變更格式定義參數(shù),第2方案所記載的發(fā)明的特征在于,上述中央運算部在判定為上述字符識別率的降低原因為讀取區(qū)坐標的差異時,使基于在上述格式定義參數(shù)中定義的讀取區(qū)坐標的切取區(qū)域位置以預(yù)先決定的單位向上、下、左、右、左斜上、左斜下、右斜上、右斜下移動,基于在移動后的切取區(qū)域位置處切取出的字符行圖像來進行字符識別,判定是否能夠進行字符識別,選定能夠進行字符識別的切取區(qū)域。
[0011]另外,第3方案所記載的發(fā)明是一種光學字符識別裝置的光學字符識別方法,該光學字符識別裝置具備中央運算部,該中央運算部使用包括票據(jù)外形尺寸、用于從字符行圖像切取字符行的讀取區(qū)坐標、識別字體類型、條形碼類型以及規(guī)定讀取率的閾值的格式定義參數(shù),以光學方式讀取票據(jù)的字符行成分圖像,從讀取出的字符行成分圖像提取字符行圖像,從提取出的該字符行圖像逐個字符地切取字符來進行字符識別并顯示在顯示終端部上,該光學字符識別方法的特征在于,包括以下步驟:第一步驟,中央運算部在判定為字符識別率低于規(guī)定識別率的閾值時,在顯示終端部上顯示用于警告字符識別率的降低的警告顯示畫面;第二步驟,接著該第一步驟,中央運算部顯示成為上述字符識別率的降低原因的基于讀取區(qū)坐標的票據(jù)尺寸、切取位置、識別字體類型、條形碼類型以及讀取率的各項目信息;第三步驟,在通過該第二步驟顯示的票據(jù)尺寸、切取位置、識別字體類型、條形碼類型以及讀取率中的某一個項目被選擇時,中央運算部顯示上述各項目信息的所選擇的某一個項目和對于該項目的格式定義參數(shù)的變更方案;以及第四步驟,中央運算部在判定為要反映通過該第三步驟顯示的變更方案時,基于該變更方案來變更格式定義參數(shù),第4方案所記載的發(fā)明的特征在于,上述中央運算部在判定為上述字符識別率的降低原因為讀取區(qū)坐標的差異時,使基于在上述格式定義參數(shù)中定義的讀取區(qū)坐標的切取區(qū)域位置以預(yù)先決定的單位向上、下、左、右、左斜上、左斜下、右斜上、右斜下移動,基于在移動后的切取區(qū)域位置處切取出的字符行圖像來進行字符識別,判定是否能夠進行字符識別,選定能夠進行字符識別的切取區(qū)域。
_2] 發(fā)明的效果
[0013]本發(fā)明的光學字符識別裝置以及光學字符識別方法在判定為字符識別率低于規(guī)定識別率的閾值時,顯示用于警告字符識別率的降低的警告顯示畫面,并且顯示成為字符識別率的降低原因的基于讀取區(qū)坐標的票據(jù)尺寸、切取位置、識別字體類型、條形碼類型以及讀取率的各項目信息,當所顯示的該項目信息的某一個項目被選擇時,顯示上述各項目信息的所選擇的某一個項目和對于該項目的格式定義參數(shù)的變更方案,在判定為要反映所顯示的該變更方案時,基于該變更方案來變更格式定義參數(shù),由此即使在格式定義參數(shù)中定義的票據(jù)外形尺寸、讀取區(qū)位置等不同的情況下也能夠確保字符識別精度。
【附圖說明】
[0014]圖1是表示基于本發(fā)明的實施方式的光學字符識別裝置的基本結(jié)構(gòu)的圖。
[0015]圖2是表示基于本實施方式的光學字符識別裝置的基本動作流程的圖。
[0016]圖3是表示基于本實施方式的光學字符識別裝置的偏斜處理流程的圖。
[0017]圖4是表示基于本實施方式的光學字符識別裝置的建議處理流程的圖。
[0018]圖5是表示基于本實施方式的讀取區(qū)以及建議顯示的圖。
[0019]圖6是表不基于本實施方式的多個建議顯不例的圖。
[0020]圖7是表示基于本實施方式的讀取區(qū)位置的搜索動作的圖。
[0021]附圖標iP,說曰月
[0022]10:圖像拍攝部;11:操作終端部;12:顯示終端部;13:分揀(sorter)部;14:夕卜部存儲部;15:存儲器;16:中央運算部;17:通信部。
【具體實施方式】
[0023]下面,參照附圖來詳細說明實現(xiàn)基于本發(fā)明的光學字符識別方法的光學字符識別裝置的一個實施方式。
[0024][結(jié)構(gòu)]
[0025]如圖1所示,基于本實施方式的光學字符識別裝置具備:分揀部13,其將層疊的票據(jù)逐張地抽出并輸送;圖像拍攝部10,其以光學方式讀取由該分揀部13輸送的票據(jù)的字符;存儲器15,其臨時保存該圖像拍攝部10所讀取出的票據(jù)圖像等;外部存儲部14,其保存格式定義參數(shù)、票據(jù)圖像、字符圖像以及識別字符等;中央運算部16,其對字符圖像的字符識別、基于本實施方式的建議(suggest)功能進行控制;顯示終端部12,其顯示字符圖像、識別字符、畫面等;操作終端部11,其用于由操作者觀察該顯示終端部12所顯示的畫面來進行操作;以及通信部17,其將識別字符等發(fā)送到其它計算機,其中,該光學字符識別裝置構(gòu)成為:通過該中央運算部16的控制,圖像拍攝部10讀取由分揀部13輸送的票據(jù)上打印的字符,進行字符識別并保存到外部存儲部14。
[0026]上述格式定義參數(shù)包括票據(jù)外形尺寸、用于從字符行圖像切取字符行的讀取區(qū)坐標(切取位置)、識別字體類型、條形碼類型以及規(guī)定讀取率的閾值,用于以下用途:中央運算部16使用這些信息從字符行成分圖像(包括僅由多個字符組成的字符行圖像在內(nèi)的廣范圍的圖像)切取字符行圖像,從所切取出的該字符行圖像逐個字符地切取字符來進行字符識別。
[0027]這樣構(gòu)成的光學字符識別裝置的基本動作如圖2所示,通過一張票據(jù)處理的開始來執(zhí)行以下步驟,由此進行動作以識別所輸送的票據(jù)字符:步驟S21,中央運算部16接收外部存儲部14中保存的格式定義參數(shù);步驟S22,通過未圖示的傳感器來檢測由分揀部13輸送的票據(jù)的前端和后端;步驟S23,檢測票據(jù)的左右端,切取記載有字符的字符區(qū)域圖像;步驟S24,從通過該步驟S23切取出的字符區(qū)域圖像提取字符行成分圖像;步驟S25,為了從通過該步驟S24提取出的字符行成分圖像切取字符行圖像,在上下上對行進行分配;步驟S26,從通過該步驟S25在上下上分配后的字符行圖像按每個字符在左右上進行分配;步驟S27,將字符切取為每一個字符的字符圖像;步驟