两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法及應(yīng)用的制作方法

文檔序號(hào):6650037閱讀:193來源:國知局
專利名稱:一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法及應(yīng)用的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)字局部特征編碼及模式識(shí)別,是一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法及應(yīng)用,屬于自動(dòng)化領(lǐng)域。
背景技術(shù)
隨著自動(dòng)化、數(shù)字化程度的不斷提高,有大量手寫數(shù)碼需要機(jī)器識(shí)別讀取,如郵政編碼、支票金額、商品標(biāo)價(jià)、速遞業(yè)務(wù)標(biāo)簽等。如果這些數(shù)字是在集中條件下書寫,人們自然會(huì)采用機(jī)打條形碼的方法。但郵政編碼、支票金額等通常需要在分散的環(huán)境下書寫,廣泛分布及簡單的書寫環(huán)境不適于采用條形碼。而目前的自由書寫難以實(shí)現(xiàn)機(jī)器的準(zhǔn)確識(shí)別。
手寫體數(shù)字識(shí)別的復(fù)雜性來源于手寫數(shù)字的不規(guī)范性。人們在書寫字符過程中的任意性以及因人而異的書寫方式造成手寫體數(shù)字的各種變形,導(dǎo)致同一數(shù)碼字符的變形種類繁多。致使手寫數(shù)字自動(dòng)識(shí)別困難重重,機(jī)器識(shí)別準(zhǔn)確率難以達(dá)到理想的程度。目前國內(nèi)外已經(jīng)研究開發(fā)出了多種手寫碼識(shí)別技術(shù),采用各種復(fù)雜算法和昂貴的識(shí)別設(shè)備。但是由于任何算法都無法對(duì)手寫數(shù)碼枚舉窮盡、全部囊括,機(jī)器識(shí)別準(zhǔn)確率仍不理想。
現(xiàn)有的手寫數(shù)碼機(jī)器識(shí)別讀取設(shè)備復(fù)雜、龐大、昂貴,其識(shí)讀的正確率也不理想。以中國郵政分揀業(yè)務(wù)目前采用的高性能信函自動(dòng)分揀機(jī)——OVCS信函自動(dòng)分揀機(jī)為例,在采用OCR方式時(shí),入格處理率只有70%左右。(國產(chǎn)的OVCS信函自動(dòng)分揀機(jī)2000年報(bào)價(jià)為每臺(tái)800萬元,國外同類設(shè)備報(bào)價(jià)還要高一到兩倍)。
由于阿拉伯?dāng)?shù)碼只有0~9十個(gè)符號(hào),比較簡單,易于規(guī)范。采用有約束的數(shù)碼手寫方式,可以大大簡化機(jī)器識(shí)讀,起到四量撥千斤的功效。本發(fā)明就是嘗試通過簡單約束數(shù)碼書寫,實(shí)現(xiàn)依靠簡單設(shè)備完成數(shù)碼的機(jī)讀工作。建立一種類似條形碼的簡便而準(zhǔn)確的手寫數(shù)碼機(jī)器識(shí)讀方法。

發(fā)明內(nèi)容
本發(fā)明提供一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法及應(yīng)用。針對(duì)阿拉伯?dāng)?shù)碼只有0~9十個(gè)符號(hào),比較簡單易于規(guī)范的特點(diǎn),采用有約束手寫數(shù)碼的方式,極大地降低了機(jī)器識(shí)別讀取的難度。這種約束是簡單易行,易于廣泛理解和普遍接受的。我們提出的有約束手寫借用七段數(shù)碼顯示的原理,依照日字形設(shè)置七個(gè)書寫筆畫段進(jìn)行書寫約束。在規(guī)定的書寫位置(如信封的郵政編碼書寫位置)預(yù)制模板,在需要的時(shí)候還可以提供數(shù)碼字樣。這樣任何會(huì)寫阿拉伯?dāng)?shù)碼的人都能夠輕松完成有約束數(shù)碼的書寫工作。通過約束規(guī)范了數(shù)碼的書寫后,為機(jī)器識(shí)讀打下了非常好的基礎(chǔ),使機(jī)器識(shí)別讀取變得輕松容易,用簡單的手持式掃描器就能完成。只要手寫時(shí)符合約束要求,機(jī)器識(shí)讀的正確率可以達(dá)到100%。
本發(fā)明解決其技術(shù)問題所采用的方案步驟有步驟1設(shè)置日字形七個(gè)筆畫段的書寫約束,在規(guī)定的書寫位置預(yù)制模板,引導(dǎo)書寫者在模板的筆畫虛線框內(nèi)書寫數(shù)碼;步驟2識(shí)別時(shí)在日字形模板上設(shè)定七個(gè)書寫筆跡識(shí)別區(qū),供后面讀取筆跡信息使用;步驟3定位,以設(shè)定的定位點(diǎn)(如在數(shù)字模板的兩端)為基準(zhǔn),或以模板下面給出的樣例為基準(zhǔn),進(jìn)行光電掃描區(qū)域定位;
步驟4對(duì)經(jīng)過模板約束的手寫數(shù)碼的識(shí)別原理是在各個(gè)特征提取位置運(yùn)用黑白象素光電識(shí)別方法提取書寫筆跡,并通過對(duì)七個(gè)筆畫段表征的數(shù)字譯碼確定本位所寫的數(shù)值;步驟5提取特征位置黑白象素,手寫數(shù)字限制模板特征提取位置為光電識(shí)別的掃描區(qū)域,通過光電掃描獲取各段上有無用戶筆跡的信息,識(shí)別的對(duì)象是0、1二值化后的黑白圖象,有筆跡信息,視為1,無筆跡信息,視為0;步驟6掃描過程,整個(gè)識(shí)別過程需要經(jīng)由兩組掃描,檢查數(shù)碼字符的每個(gè)象素,第一組掃描從上到下檢查每個(gè)數(shù)碼字符的縱向輪廓,提取特征位置a、g、d上有無用戶筆跡的信息,第二組掃描從左到右檢查每組數(shù)碼字符的橫向輪廓,提取特征位置f、b、e、c上有無用戶筆跡的信息;步驟7多位數(shù)碼的確定,仿照上述一位七段碼譯碼方法進(jìn)行。在一次讀取多位手寫數(shù)碼時(shí),按照下標(biāo)確定相應(yīng)的位置,逐位譯碼即可。
有約束手寫數(shù)碼書寫規(guī)范設(shè)計(jì)原理模式識(shí)別領(lǐng)域中對(duì)手寫數(shù)字進(jìn)行預(yù)處理主要有兩種渠道一種是通過各種特定的映射對(duì)手寫數(shù)字進(jìn)行變換增大各目標(biāo)類之間的距離,減少識(shí)別對(duì)象的離散性,便于數(shù)字特征提取;另一種是在用戶能夠接受的范圍內(nèi)用一個(gè)簡單的模板對(duì)用戶輸入進(jìn)行一定的約束,使其手寫數(shù)字能夠達(dá)到一定程度的規(guī)范。
本發(fā)明就是依照后一種思路。提出日字形模板將任一可能出現(xiàn)的數(shù)碼約束在七個(gè)筆畫段之中,即這七個(gè)筆畫段的組合可以形成0~9不同的數(shù)字,如b段和c段組成1,a、b、g、e、d段組成2,等等。
(1)模板描述我們設(shè)計(jì)出手寫數(shù)字的限制模板如圖1和圖2所示。圖1為空模板,圖2在模板中寫入了數(shù)字8。約定數(shù)字的書寫范圍只能在每個(gè)日字模板限定的范圍之內(nèi)。
日字模板對(duì)用戶輸入起到一個(gè)限制和誘導(dǎo)的作用,通過模板實(shí)現(xiàn)用戶的書寫規(guī)范。通過這種措施,使手寫數(shù)字的筆畫應(yīng)盡量與日字模板的筆畫虛線框重合,這樣就可以使手寫數(shù)字的主要提取特征限制在規(guī)定的區(qū)域,為機(jī)器識(shí)讀打下基礎(chǔ)。
(2)提取約定按照我們設(shè)計(jì)的手寫數(shù)字局部特征編碼的思想,識(shí)別時(shí)只需提取特征約定位置中的筆跡信息,就足以完成識(shí)別任務(wù)。如圖3所示,圖中橢圓圈入部分為特征提取位置。顯而易見,手寫數(shù)碼時(shí)稍有約束的提示,自然會(huì)寫到橢圓圈的內(nèi)部。而橢圓圈有黑色筆跡,就不會(huì)出現(xiàn)漏讀信息。
(3)數(shù)碼0~9模板及手寫樣例數(shù)碼模板及0~9書寫標(biāo)準(zhǔn)樣例,如圖4所示。
采集的部分基于模板的手寫0~9數(shù)碼,如圖5所示。
本發(fā)明的效果為可以簡化手寫數(shù)碼機(jī)器識(shí)別的工作程序,用簡單設(shè)備就可以完成手寫數(shù)碼機(jī)器讀取的任務(wù)。非常方便實(shí)用,可以取得類似條碼的識(shí)別效果。與此同時(shí),有約束手寫機(jī)讀碼還有比條碼優(yōu)越的可讀性,在需要人工識(shí)讀比對(duì)時(shí),工作人員可以直接讀取,而條碼無法人工直接識(shí)別。有約束手寫機(jī)讀碼具有極其廣泛的應(yīng)用前景。
本發(fā)明的優(yōu)點(diǎn)為提出日字形七個(gè)書寫筆畫段的有約束手寫數(shù)字模板及書寫方法,其特征是書寫過程簡單,寫出的數(shù)字規(guī)范,不需要任何特殊設(shè)備就可以在極度分散的書寫環(huán)境下得到相對(duì)規(guī)范的手寫數(shù)碼。
提出在日字形手寫數(shù)字模板上設(shè)定七個(gè)識(shí)別區(qū)域,并通過檢測判斷區(qū)域內(nèi)是否有書寫筆跡信息。(1)使識(shí)別工作變得簡單、輕松,只要關(guān)注7個(gè)識(shí)別點(diǎn)即可;(2)即便書寫不夠規(guī)范,也能保證識(shí)別的準(zhǔn)確性。
在數(shù)字識(shí)別中使用七段碼代表數(shù)字對(duì)照譯碼方法,譯碼方便,有簡便、成熟的技術(shù)支持。
提出對(duì)約束模板上的信息的掃描方法,掃描過程簡單,對(duì)設(shè)備要求低,易于實(shí)現(xiàn)。
以郵政編碼識(shí)別為例,目前的識(shí)別設(shè)備非常昂貴,無法在眾多小的市縣普及。采用有約束的手寫郵政編碼,只要簡單的設(shè)備就可以完成識(shí)別工作,大大降低對(duì)設(shè)備的要求,同時(shí)使識(shí)別的過程大大簡化,便于自動(dòng)化技術(shù)在郵政業(yè)中的普及發(fā)展。


圖1手寫數(shù)字的限制模板(空模板);圖2在模板中寫入了數(shù)字8;圖3手寫數(shù)字限制模板特征提取位置;圖4數(shù)字模板及0~9書寫樣例;圖5部分手寫0~9數(shù)碼樣例;圖6掃描過程示意圖;圖7普通信封郵政編碼約束及提示。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步說明。
實(shí)施例1本發(fā)明解決其技術(shù)問題所采用的方案步驟是步驟1設(shè)置日字形七個(gè)筆畫段的書寫約束,在規(guī)定的書寫位置(如信封的郵政編碼書寫位置)預(yù)制模板,引導(dǎo)書寫者在模板的筆畫虛線框內(nèi)書寫數(shù)碼,在需要的時(shí)候可以提供數(shù)碼字樣(如在信封郵政編碼書寫區(qū)的下方);步驟2識(shí)別時(shí)在日字形模板上設(shè)定七個(gè)書寫筆跡識(shí)別區(qū),供后面讀取筆跡信息使用,如圖3所示;步驟3定位,以專門設(shè)定的定位點(diǎn)(如在數(shù)字模板的兩端)為基準(zhǔn),或以模板下面給出的樣例為基準(zhǔn),進(jìn)行光電掃描區(qū)域定位;步驟4對(duì)經(jīng)過模板約束的手寫數(shù)碼的識(shí)別原理是在各個(gè)特征提取位置(如圖3所示)運(yùn)用黑白象素光電識(shí)別提取書寫筆跡,并通過對(duì)七個(gè)筆畫段表征的數(shù)字譯碼確定本位所寫的數(shù)值;步驟5特征提取位置黑白象素,手寫數(shù)字限制模板特征提取位置為光電識(shí)別的掃描區(qū)域,通過光電掃描獲取各段上有無用戶筆跡的信息,識(shí)別的對(duì)象是0、1二值化后的黑白圖象。若有書寫筆跡,用1表示,若無,用0表示。采用一個(gè)設(shè)定的閥值判別決定取舍(閥值的確定要根據(jù)具體的使用條件通過多次實(shí)驗(yàn)來確定);步驟6掃描過程,整個(gè)識(shí)別過程需要經(jīng)由兩組掃描過程,每組掃描檢查數(shù)碼字符的每個(gè)象素(掃過特征提取位置)。第一組掃描從上到下檢查每個(gè)數(shù)碼字符的縱向輪廓,提取特征位置a、g、d上有無用戶筆跡的信息。第二組掃描從左到右檢查每組數(shù)碼字符的橫向輪廓,提取特征位置f、b、e、c上有無用戶筆跡的信息。有筆跡信息,視為1,無筆跡信息,視為0;步驟7多位七段碼的確定,仿照上述一位七段碼譯碼方法進(jìn)行。在一次讀取多位七段碼時(shí),只要對(duì)其加注下標(biāo)說明a1,a2,a3,…,g1,g2,g3,這樣a1,…,g1代表第一位數(shù)字,a2,…,g2代表第二位數(shù)字,按照下標(biāo)確定相應(yīng)的位置,逐位參照表1譯碼即可。
實(shí)施例2有約束手寫數(shù)碼識(shí)別原理與方法。對(duì)有模板約束的手寫規(guī)范數(shù)碼的識(shí)別原理是在日字形的七個(gè)筆畫段中設(shè)定每個(gè)筆畫的特征提取位置,如圖3所示。再從各個(gè)特征提取位置中運(yùn)用黑白象素光電識(shí)別技術(shù)檢查其中是否存在書寫筆跡,最后通過對(duì)七段表征筆畫進(jìn)行譯碼確定該數(shù)碼的具體數(shù)值。
(1)定位以特定的定位標(biāo)志(如模板下面給出的樣例)為基準(zhǔn),進(jìn)行光電掃描區(qū)域定位。
(2)提取特征位置的筆記信息以圖3中手寫數(shù)字限制模板特征提取位置為光電識(shí)別的掃描區(qū)域,通過光電掃描得到各段上有無用戶筆跡的信息,識(shí)別的對(duì)象是0、1二值化后的黑白圖象。若有筆跡,用1表示,若無筆跡,用0表示。采用一個(gè)設(shè)定的閥值判別決定取舍。
(3)掃描過程整個(gè)識(shí)別過程需要經(jīng)由兩組掃描過程,每組掃描檢查數(shù)碼字符的每個(gè)象素。第一組掃描從上到下逐位檢查每個(gè)數(shù)碼字符的縱向輪廓,提取特征位置a、g、d上有無用戶筆跡的信息。第二組掃描從左到右分兩行檢查每組數(shù)碼字符的橫向輪廓,提取特征位置f、b、e、c上有無用戶筆跡的信息。
(4)一位日字形模板上數(shù)碼的譯碼確定根據(jù)七段碼的編碼原理,通過對(duì)七個(gè)筆畫段各段上黑色象素的掃描統(tǒng)計(jì),構(gòu)成代表數(shù)字結(jié)構(gòu)的七維特征向量。在讀出a、b、c、d、e、f、g七段取值后,依照表1可以確定其代表的相應(yīng)數(shù)字。
表1七段碼代表數(shù)字對(duì)照表

(5)多位日字形模板上數(shù)碼的確定仿照上述一位七段碼譯碼方法,在一次讀取多位日字形模板時(shí),只要對(duì)其上面的7個(gè)筆劃段加注下標(biāo)說明a1,a2,a3,…,g1,g2,g3,然后按照下標(biāo)確定相應(yīng)的位置,逐位依照表1譯碼即可。
實(shí)施例3一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法的應(yīng)用,信封郵政編碼有約束的手寫及識(shí)別。
郵政系統(tǒng)中數(shù)量最大的普通平信上的郵政編碼是最典型的分散書寫集中識(shí)別的例子。對(duì)目前使用的標(biāo)準(zhǔn)信封左上角六位郵政編碼紅框稍加改進(jìn),用淺黃色或淺綠色印制約束線框。印制約束框使用較淡顏色,與正常書寫用的黑色或藍(lán)色有較大的色差,保證其處在光電識(shí)別的有效色譜之外。如圖7所示,印上我們設(shè)計(jì)的日字形約束框,并在其下方給出數(shù)字0~9的有約束書寫樣例,就可以簡單地完成手寫郵政編碼的規(guī)范工作。
寄信者在書寫郵政編碼時(shí),會(huì)看到約束框下面的書寫樣例,提示其將數(shù)碼的筆畫寫在約束框內(nèi)。實(shí)際上,在機(jī)器識(shí)讀時(shí),只要我們設(shè)定的特征提取位置(如圖3所示)中有筆跡信息,就將該筆畫段判定為1,因此,即便是書寫者的筆跡沒有完全準(zhǔn)確地與約束框重合,只要特征提取位置的橢圓區(qū)域內(nèi)有筆跡信息,就不會(huì)出現(xiàn)識(shí)別錯(cuò)誤。
按照我們前面介紹的原理和方法,可以簡便、高效、準(zhǔn)確地完成郵政編碼識(shí)別工作,為信件自動(dòng)分揀打下良好的基礎(chǔ)。
實(shí)施例4一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法的應(yīng)用,支票金額書寫及識(shí)別。
大量需要分散書寫集中識(shí)別的支票是本發(fā)明適用的另一個(gè)地方。分散開出的支票送到銀行后,需要識(shí)讀。在支票上印制按照有約束書寫的要求的約束框后,書寫的金額可以方便、準(zhǔn)確地讀取。方法與前述郵政編碼識(shí)別類似,不再贅述。
權(quán)利要求
1.一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法,其特征是含有以下步驟步驟1設(shè)置日字形七個(gè)筆畫段的書寫約束,在規(guī)定的書寫位置預(yù)制模板,引導(dǎo)書寫者在模板的筆畫虛線框內(nèi)書寫數(shù)碼;步驟2在日字形模板上設(shè)定七個(gè)書寫筆跡識(shí)別區(qū),供識(shí)別時(shí)讀取筆跡信息使用;步驟3定位,以設(shè)定的定位點(diǎn)為基準(zhǔn),或以模板下面給出的樣例為基準(zhǔn),進(jìn)行光電掃描區(qū)域定位;步驟4對(duì)經(jīng)過模板約束的手寫數(shù)碼的識(shí)別原理是在各個(gè)特征提取位置運(yùn)用黑白象素光電識(shí)別提取書寫筆跡,并通過對(duì)七個(gè)筆畫段表征的數(shù)字譯碼確定本位所寫的數(shù)值;步驟5提取特征位置黑白象素,手寫數(shù)字限制模板特征提取位置為光電識(shí)別的掃描區(qū)域,通過光電掃描得到各段上有無用戶筆跡的信息,識(shí)別的對(duì)象是0、1二值化后的黑白圖象;步驟6掃描過程,整個(gè)識(shí)別過程需要經(jīng)由兩組掃描,檢查數(shù)碼字符的每個(gè)象素,第一組掃描從上到下檢查每個(gè)數(shù)碼字符的縱向輪廓,提取特征位置a、g、d上有無用戶筆跡的信息,第二組掃描從左到右檢查每組數(shù)碼字符的橫向輪廓,提取特征位置f、b、e、c上有無用戶筆跡的信息,有筆跡信息,視為1,無筆跡信息,視為0;步驟7多位七段碼的確定,仿照上述一位七段碼譯碼方法進(jìn)行。在一次讀取多位七段碼時(shí),按照下標(biāo)確定相應(yīng)的位置,逐位譯碼即可。
2.根據(jù)權(quán)利要求1所述的一種有約束手寫機(jī)讀數(shù)碼的書寫識(shí)別方法,其特征是上述的步驟5采用一個(gè)閥值判別決定取舍,閥值的確定要根據(jù)具體的使用條件通過實(shí)驗(yàn)來確定。
3.根據(jù)權(quán)利要求1或2所述的一種有約束手寫機(jī)讀數(shù)碼的書寫識(shí)別方法,其特征是步驟1的書寫位置為信封的郵政編碼書寫位置。
4.一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法的應(yīng)用,其特征是;在信封左上角六位郵政編碼紅框用淺黃色或淺綠色印制約束線框,印制約束框使用較淡顏色,印上日字形約束框,并在其下方給出數(shù)字0~9的有約束書寫樣例或在支票上印制約束框。
全文摘要
一種有約束手寫機(jī)讀數(shù)碼的書寫和識(shí)別方法及應(yīng)用。由于阿拉伯?dāng)?shù)碼只有0~9十個(gè)符號(hào)易于規(guī)范,依照日字形設(shè)置七個(gè)書寫筆畫段進(jìn)行手寫數(shù)碼的書寫約束。在規(guī)定的書寫位置預(yù)制模板,引導(dǎo)書寫者在模板的筆畫虛線框內(nèi)書寫數(shù)碼。在手寫模板對(duì)應(yīng)區(qū)域上劃定七個(gè)特征提取位置,采用光電讀取方法,識(shí)讀每個(gè)特征提取位置內(nèi)是否有筆跡信息,有筆跡讀出1,無筆跡讀出0。再逆向運(yùn)用七段碼顯示原理,進(jìn)行筆跡信息的譯碼,即可完成機(jī)器識(shí)讀工作。這種方法不增加書寫的難度,寫出的數(shù)字比較規(guī)范,使機(jī)器識(shí)別讀取手寫數(shù)碼變得輕松容易,用簡單的手持式掃描器就能完成。只要手寫時(shí)符合約束要求,機(jī)器識(shí)讀的正確率可以達(dá)到100%。可在信封和支票上使用。
文檔編號(hào)G06K9/00GK1763766SQ20051011519
公開日2006年4月26日 申請(qǐng)日期2005年11月16日 優(yōu)先權(quán)日2005年11月16日
發(fā)明者徐維祥, 劉旭敏 申請(qǐng)人:北京交通大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
和田市| 平邑县| 曲沃县| 永仁县| 库尔勒市| 宜宾市| 丹东市| 平泉县| 明星| 油尖旺区| 富裕县| 嘉禾县| 通城县| 封开县| 长寿区| 长汀县| 平陆县| 靖宇县| 合川市| 原平市| 平舆县| 普兰县| 三河市| 白朗县| 舟山市| 满洲里市| 剑川县| 姚安县| 新营市| 铜川市| 汝南县| 乌鲁木齐县| 朝阳区| 新蔡县| 靖边县| 清水河县| 聂荣县| 扎兰屯市| 精河县| 乾安县| 故城县|