專利名稱:一種基于驗鈔機的紙幣號碼識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于自動識別技術(shù)領(lǐng)域,涉及一種基于驗鈔機的紙幣號碼識別方法。
背景技術(shù):
紙幣作為一種重要的票證,都印有流水號碼,其號碼具有唯一性,因此可用作區(qū)分 紙幣的一種標(biāo)識。由于當(dāng)前假鈔的制作越來越精細(xì),但由于其號碼固定,所以通過紙幣號碼 來識別假鈔也是未來驗鈔機的一個發(fā)展方向。在科技發(fā)達的今天,號碼自動檢測所需要的 理論知識和技術(shù)以及硬件技術(shù)已經(jīng)十分成熟。紙幣號碼識別技術(shù)尤其在英、日、德等西方發(fā) 達國家已經(jīng)比較成熟,相應(yīng)的產(chǎn)品在銀行業(yè)務(wù)中已經(jīng)得到廣泛的應(yīng)用。但是對于普通驗鈔 機,通過號碼識別來區(qū)分假鈔尚未得到應(yīng)用,其主要原因是現(xiàn)有號碼識別方法中的算法復(fù) 雜,整個系統(tǒng)成本高,不適應(yīng)于面向大眾的小型驗鈔機。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于驗鈔機的紙幣號碼識別方法,解決現(xiàn)有技術(shù)中的識 別算法復(fù)雜,整個系統(tǒng)成本高的問題。本發(fā)明采用的技術(shù)方案是,一種基于驗鈔機的紙幣號碼識別方法,先將C0MS傳感 器安裝于驗鈔機上,再將C0MS傳感器與控制系統(tǒng)連接,然后按照以下步驟實施
步驟1、紙幣號碼區(qū)域的初定位
1. 1)C0MS傳感器采集的紙幣原始圖像為480*640像素,對紙幣原始圖像中可能的號碼 區(qū)域進行每隔10行以水平方向進行掃描;
1. 2)在每條掃描線上,若相鄰點的灰度差大于60,則記錄跳變點的當(dāng)前位置,如果某行 有連續(xù)十個以上跳變點,記錄下該行的位置與起始位置和終止點位置;
1. 3)如果連續(xù)幾行存在這樣的跳變點,就認(rèn)為該區(qū)域是紙幣號碼預(yù)選區(qū)域; 步驟2、紙幣號碼分割
對上一步得到的紙幣號碼預(yù)選區(qū)域,選取閾值范圍0. 2-0. 4,對號碼預(yù)選區(qū)域進行二值 化處理,同時去除孤立點得到二值化圖像,該二值化圖像中只含有十個字符; 步驟3、字符識別
針對26個字母A-Z與十個阿拉伯?dāng)?shù)字0-9進行識別,根據(jù)各個字符像素位置分布的不 同,采用改進的矩陣模板匹配識別方法,完成了整個紙幣號碼在線自動識別。本發(fā)明的有益效果是,針對2005版人民幣,提出的一種更簡單、高效、準(zhǔn)確的號碼 識別計算方法,其中包含26個字母A-Z和十個數(shù)字0-9的識別;以計算機視覺檢測為重要 技術(shù)手段,運用數(shù)字圖像處理技術(shù),集圖像采集、預(yù)處理、號碼定位、號碼識別為一體,實現(xiàn) 紙幣號碼的在線自動識別,適應(yīng)于面向大眾的小型驗鈔機。
圖1是本發(fā)明方法中所采集的原始圖像;圖2是本發(fā)明方法中的號碼區(qū)域的初定位圖; 圖3是本發(fā)明方法中的號碼區(qū)域的二值化圖; 圖4是本發(fā)明方法中的字符初步分割圖5是本發(fā)明方法中的字符精確分割且統(tǒng)一縮放為30*20的像素圖; 圖6是本發(fā)明方法中的字符識別結(jié)果圖。
具體實施例方式下面結(jié)合附圖和具體實施方式
對本發(fā)明進行詳細(xì)說明。本發(fā)明方法的實施準(zhǔn)備工作是,在驗鈔機開啟時同時進行紙幣在線采集圖像,在 此針對紙幣朝向一致,采集到的均為紙幣左下角部位,同時控制系統(tǒng)及時對采集到的圖像 進行處理,完成號碼在線自動識別,具體實施步驟如下
步驟1、紙幣上號碼區(qū)域的初定位
如圖1,可以看出,紙幣上的號碼區(qū)域只占整個紙幣上非常小的一部分,而其余部分都 是非相關(guān)信息,因而為減少系統(tǒng)識別的時間開銷,最好在對紙幣的原始圖像進行二值化處 理前,先對號碼區(qū)域進行初步定位。觀察到紙幣號碼區(qū)域內(nèi)字符與背景顏色對照大,背景是灰白色,前景是深黑色,前 景與背景存在明顯的灰度差,通過對大量紙幣圖像的灰度值矩陣的分析,統(tǒng)計得到了號碼 區(qū)域前景與背景灰度值的差至少為60。根據(jù)號碼區(qū)域前景與背景存在明顯的灰度差的特點,當(dāng)用一條水平線穿過號碼區(qū) 域時,直線上點的灰度會在水平方向較小的區(qū)域內(nèi)呈現(xiàn)這種有規(guī)律的變化。根據(jù)這一現(xiàn)象,實施步驟如下
1. 1、C0MS傳感器采集的紙幣原始圖像為480*640像素,對紙幣原始圖像中可能的號碼 區(qū)域進行每隔10行(采集的圖像為480*640像素)以水平方向進行掃描;
1.2、在每條掃描線上,若相鄰點的灰度差大于60,則記錄跳變點的當(dāng)前位置,如果某行 有連續(xù)十個跳變點以上,記錄下該行的位置與起始位置和終止點位置;
1. 3、如果連續(xù)幾行存在這樣的跳變點,就認(rèn)為該區(qū)域是號碼預(yù)選區(qū)域。經(jīng)初定位后的 圖片如圖2所示。步驟2、紙幣號碼分割
經(jīng)過上一步的實現(xiàn),得到初步的號碼區(qū)域,選取適當(dāng)?shù)拈撝?范圍是0. 2-0. 4,此處選 0. 36),對分割出的號碼區(qū)域進行二值化處理,同時去除孤立點,以此得到的二值化圖像的 圖中只含有十個字符,如圖3所示。(2.1)初步分割十個字符
尋找十個字符的右側(cè)位置,根據(jù)這十個位置將其粗略的分割開。經(jīng)過上步的處理,得到 的號碼區(qū)域圖像中每個字符都具有一定的連續(xù)性,且相鄰兩字符間是不連通的,在字符所 占位置的列上,其相鄰兩列的像素值不全為1 (白),而在字符右側(cè),緊鄰字符的一列像素,其 像素值全為1 (白),因此通過列掃描尋找像素值的方法,用這三個相鄰列的像素值的條件來 確定每個字符的右側(cè)位置, 具體步驟是
對分割出的號碼區(qū)域進行列掃描,若第j列與j_l列像素值不全為1 (白),同時j+1列像素值全為1 (白),則記錄下j列位置,依次掃描下去,得到十個滿足此條件的位置,以此位 置對十個字符進行初步的分割,就得到分割出的十個字符,如圖4所示。(2.2)精確分割十個字符
字符分割的精確度會直接影響到字符識別的準(zhǔn)確性,因此,在經(jīng)過初步分割后,必須進 一步精確的對其進行分割。由圖4看出,上一步分割出的每個字符的上、下以及左側(cè)位置都 有空白區(qū)域,因此分別對每個分割出的字符進行行掃描與列掃描,在行掃描線上,記錄下最 先和最后出現(xiàn)像素為0 (黑)的行位置,在列掃描線上,記錄下最先出現(xiàn)像素為0 (黑)的列 位置,根據(jù)得到的這三個位置,再精確的分割這十個字符。(2. 3)字符縮放
如圖2所示,本發(fā)明是針對2005版人民幣,其號碼區(qū)域上十個字符的大小是不一樣的, 如果將上一步分割好的字符直接進行識別,會增加識別的難度,并且會影響字符識別的準(zhǔn) 確性。因此,根據(jù)此特征,在字符分割后,將其縮放為統(tǒng)一大小,而當(dāng)圖像的大小發(fā)生變化 時,圖像的像素會發(fā)生變化,這時要根據(jù)原圖像進行插值運算得到縮放后的圖像。具體步驟 是
在此將分割好的十個字符統(tǒng)一縮放為30*20像素,同時運用插值算法來保證圖像的像 素,而最鄰近插值的算法最快,且通過實驗得出采用最鄰近插值算法不影響字符識別的準(zhǔn) 確性,所以采用最近鄰插值法進行縮放,得到大小一致的十個字符,如圖5所示。步驟3、字符識別
針對26個字母(A-Z)與十個數(shù)字(0-9)進行識別,根據(jù)各個字符像素位置分布的不同, 采用一種改進的矩陣模板匹配識別方法,具體步驟是
(3.1)對分割好的字符,以網(wǎng)格特征對其劃分,統(tǒng)計網(wǎng)格中0 (黑)像素值的總數(shù)。各 個字符雖然寫法不同,像素分布有差異,但在劃分網(wǎng)格時,如果劃分的網(wǎng)格數(shù)太少,會使其 統(tǒng)計的像素數(shù)相似性增大,降低識別的準(zhǔn)確性,如果劃分的網(wǎng)格數(shù)太多,則會降低識別的效 率,根據(jù)實驗檢驗效果,在此將分割好的字符劃分為6*5網(wǎng)格狀,而每個字符都是30*20像 素,因此,每個網(wǎng)格中有20個像素。統(tǒng)計每個網(wǎng)格中0 (黑)像素值的總數(shù),將統(tǒng)計出的數(shù) 據(jù)按其相應(yīng)的網(wǎng)格位置形成一個新的6*5矩陣,稱其為網(wǎng)格特征矩陣。(3. 2)運用以上算法,使用大量的2005版人民幣做實驗,統(tǒng)計A_Z的26個字母與 0-9的十個數(shù)字的網(wǎng)格特征矩陣。對于每個字符,通過大量的紙幣可以得到大量的網(wǎng)格特征 矩陣,在此,每個字符都搜集50個網(wǎng)格特征矩陣,然后求其均值,得到一個網(wǎng)格特征均值矩 陣,運用同樣的方法得到全部36個字符的網(wǎng)格特征均值矩陣,以此作為36個字符的模板矩 陣。(3. 3)運用矩陣模板匹配識別法識別字符。對于2005版人民幣,十個字符中前兩 個字符均為大寫英文字母,后8個字符均為阿拉伯?dāng)?shù)字,因此可以根據(jù)位置不同這一特征, 分別進行識別,先將前兩個字符與26個字母的模板矩陣進行匹配,再將后8個字符與十個 數(shù)字的模板矩陣進行匹配,具體步驟如下
將采集到的圖像根據(jù)以上步驟完成一系列的處理算法,得到十個字符的網(wǎng)格特征矩 陣,按字符位置依次進行識別,首先是前兩位英文字母,分別用得到的前兩個網(wǎng)格特征矩陣 與26個字母的模板矩陣做差平方,這時兩個字母字符都得到26個誤差值,對比這26個誤 差值的大小,誤差最小的即認(rèn)為待識別字符為這一模板字符;同理,剩余的8個數(shù)字字符也按這一方法進行識別,得出所有的10個字符的識別結(jié)果,就完成了整個紙幣號碼在線自動 識別,識別結(jié)果如圖6所示。
權(quán)利要求
一種基于驗鈔機的紙幣號碼識別方法,其特征在于先將COMS傳感器安裝于驗鈔機上,再將COMS傳感器與控制系統(tǒng)連接,然后按照以下步驟實施步驟1、紙幣號碼區(qū)域的初定位1.1)COMS傳感器采集的紙幣原始圖像為480*640像素,對紙幣原始圖像中可能的號碼區(qū)域進行每隔10行以水平方向進行掃描;1.2)在每條掃描線上,若相鄰點的灰度差大于60,則記錄跳變點的當(dāng)前位置,如果某行有連續(xù)十個以上跳變點,記錄下該行的位置與起始位置和終止點位置;1.3)如果連續(xù)幾行存在這樣的跳變點,就認(rèn)為該區(qū)域是紙幣號碼預(yù)選區(qū)域;步驟2、紙幣號碼分割對上一步得到的紙幣號碼預(yù)選區(qū)域,選取閾值范圍0.2 0.4,對號碼預(yù)選區(qū)域進行二值化處理,同時去除孤立點得到二值化圖像,該二值化圖像中只含有十個字符;步驟3、字符識別針對26個字母A Z與十個阿拉伯?dāng)?shù)字0 9進行識別,根據(jù)各個字符像素位置分布的不同,采用改進的矩陣模板匹配識別方法,完成了整個紙幣號碼在線自動識別。
2.根據(jù)權(quán)利要求1所述的基于驗鈔機的紙幣號碼識別方法,其特征在于所述的步驟 2中閾值優(yōu)選0. 36。
3.根據(jù)權(quán)利要求1所述的基于驗鈔機的紙幣號碼識別方法,其特征在于所述的步驟 2的具體步驟是·2. 1)初步分割十個字符尋找十個字符的右側(cè)位置,根據(jù)這十個位置將其粗略的分割 開,經(jīng)過上步的處理,得到的號碼區(qū)域圖像中每個字符都具有一定的連續(xù)性,且相鄰兩字符 間是不連通的,在字符所占位置的列上,其相鄰列的像素值不全為1,1是白的標(biāo)記,而在字 符右側(cè),緊鄰字符的一列像素,其像素值全為1,通過列掃描尋找像素值的方法,來確定每個 字符的右側(cè)位置,具體包括對分割出的號碼區(qū)域進行列掃描,若第j列與j_l列像素值不全為1,同時j+1列像素 值全為1,則記錄下j列位置,依次掃描下去,得到十個滿足此條件的位置,以此位置對十個 字符進行初步分割,得到分割出的十個字符;·2. 2)精確分割十個字符上一步分割出的每個字符的上、下以及左側(cè)位置都有空白區(qū) 域,因此分別對每個分割出的字符進行行掃描與列掃描,在行掃描線上,記錄下最先和最后 出現(xiàn)像素為0的行位置,0是黑的標(biāo)記,在列掃描線上,記錄下最先出現(xiàn)像素為0的列位置, 根據(jù)得到的這三個位置,精確的分割這十個字符;·2.3)字符縮放針對2005版人民幣,其號碼區(qū)域上十個字符的大小是不一樣的,根據(jù) 此特征,在字符分割后,將其縮放為統(tǒng)一大小,而當(dāng)圖像的大小發(fā)生變化時,圖像的像素會 發(fā)生變化,這時要根據(jù)原圖像進行插值運算得到縮放后的圖像,具體步驟是將上步分割好 的十個字符統(tǒng)一縮放為30*20像素,采用最近鄰插值法進行縮放,得到大小一致的十個字 符。
4.根據(jù)權(quán)利要求1所述的基于驗鈔機的紙幣號碼識別方法,其特征在于所述的步驟 3的具體步驟是具體步驟如下·3.1)對分割好的字符,以網(wǎng)格特征對其劃分,統(tǒng)計網(wǎng)格中0像素值的總數(shù),將分割好的字符劃分為6*5網(wǎng)格狀,而每個字符都是30*20像素,因此,每個網(wǎng)格中有20個像素,統(tǒng)計 每個網(wǎng)格中0像素值的總數(shù),將統(tǒng)計出的數(shù)據(jù)按其相應(yīng)的網(wǎng)格位置形成一個新的6*5矩陣, 稱其為網(wǎng)格特征矩陣;3. 2)運用以上算法,使用大量的2005版人民幣做實驗,統(tǒng)計A-Z的26個字母與0_9的 十個數(shù)字的網(wǎng)格特征矩陣,運用統(tǒng)計方法得到一個網(wǎng)格特征均值矩陣,得到全部36個字符 的網(wǎng)格特征均值矩陣,以此作為36個字符的模板矩陣;3. 3)運用矩陣模板匹配識別法識別字符,對于2005版人民幣,十個字符中前兩個字符 均為大寫英文字母,后8個字符均為阿拉伯?dāng)?shù)字,因此根據(jù)位置不同這一特征,分別進行識 別,先將前兩個字符的網(wǎng)格特征矩陣與上步得到的26個字母的模板矩陣進行匹配,再將后 8個字符的網(wǎng)格特征矩陣與上步得到的十個數(shù)字的模板矩陣進行匹配,具體步驟是將前述得到的十個字符的網(wǎng)格特征矩陣,按字符位置依次進行識別,首先是前兩位英 文字母,分別用得到的前兩個網(wǎng)格特征矩陣與26個字母的模板矩陣做差平方,這時兩個字 母字符都得到26個誤差值,對比這26個誤差值的大小,誤差最小的即認(rèn)為待識別字符為這 一模板字符;同理,剩余的8個數(shù)字字符也按這一方法進行識別,得出所有的10個字符的識 別結(jié)果。
全文摘要
本發(fā)明公開了一種基于驗鈔機的紙幣號碼識別方法,先將COMS傳感器安裝于驗鈔機上,COMS傳感器與控制系統(tǒng)連接,然后按照以下步驟實施步驟1、紙幣上號碼區(qū)域的初定位;步驟2、紙幣號碼分割,包括初步分割十個字符、精確分割十個字符、字符縮放;步驟3、字符識別,包括對分割好的字符求其網(wǎng)格特征矩陣、制作模板矩陣、運用矩陣模板匹配識別法識別字符。本發(fā)明的方法主要針對2005版人民幣,以計算機視覺檢測為重要技術(shù)手段,運用數(shù)字圖像處理技術(shù),集圖像采集、號碼定位、號碼分割以及字符識別為一體,最終完成對26個字母A-Z和十個數(shù)字0-9的識別,實現(xiàn)紙幣號碼的在線自動識別。
文檔編號G06K9/64GK101923741SQ20101025015
公開日2010年12月22日 申請日期2010年8月11日 優(yōu)先權(quán)日2010年8月11日
發(fā)明者徐宏偉, 李淵, 范婷婷, 高倩 申請人:西安理工大學(xué)