两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

聯(lián)機手寫字符識別裝置的制作方法

文檔序號:6405569閱讀:376來源:國知局
專利名稱:聯(lián)機手寫字符識別裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及聯(lián)機手寫字符的識別裝置。
本發(fā)明的聯(lián)機手寫字符識別裝置中,求出輸入筆劃與預(yù)先定義的字符基本結(jié)構(gòu)元素的近似度,并以這近似度作為特征矢量的成分,據(jù)此用模糊性評價輸入字符,提高其識別的各種特性。
先有技術(shù)聯(lián)機手寫字符的識別方法如圖6所示,1.用輸入筆跡上取樣點P0,P1,…Pn及其時間序列信息構(gòu)成的折線(圖6B)去近似手寫的一筆劃的輸入筆跡。(圖6A)2.將預(yù)先定義的筆跡的基本形狀、即“基本筆劃類型”與第1項的折線比較進行“筆劃識別”。
3.根據(jù)第2項的結(jié)果,將輸入的筆劃變換為最接近的基本筆劃類型的代碼號。
4.對一個字符的所有筆劃,重復(fù)1-3項。
5.參照詞典,將按筆劃順序持有第3項代碼號的字符判斷為被輸入的字符。
上述方法一直被廣泛使用著。
如果使用這種方法,由于用一種基本筆化類型置換輸入的筆劃,在基本輸入筆跡取樣點P0,P1,…Pn信息中,除了以后識別過程所必需的數(shù)據(jù),幾乎都可舍去,因此即使存儲容量較小的裝置也可能用作字符識別。又,由于詞典的基本筆劃類型的代碼號按各字符筆劃順序排列,用它與輸入字符的基本筆劃類型的代碼號順序作比較,可進行輸入字符的識別,因此,既可使詞典小型化,又可縮短比較所需要的時間。
文獻“日經(jīng)”1983年12月5日號但是,在使用這種方法的場合下,由于輸入噪聲、手寫者輸入缺點使輸入筆跡的基本形發(fā)生變化乃至變形時,在第2項筆劃識別中就會產(chǎn)生差錯,其結(jié)果使識別精度大幅度下降。例如,書寫“一”或一橫時,如圖7A中○內(nèi)所表示,如有“起筆處”,則其基本筆劃類型會被識別成圖7B所示。
為此,以前用“筆劃s的代號碼C1、C2、…Cn”那樣的并行描述來處理詞典中那些“易于誤識別的筆劃類型”代碼。
但是,如果這樣做,既增大了詞典尺寸,又延長了檢索時間。而且用戶要在詞典中追加未登錄的字符時,由于不能只從輸入筆劃來確定登錄所必需的筆劃類型代碼,所以實現(xiàn)這樣的追加登錄是非常困難的。
本發(fā)明的目的是解決如上的問題。
為此,在本發(fā)明中,求出輸入的筆劃信息與預(yù)先定義的字符基本結(jié)構(gòu)元素的近似度,變換以該近似度構(gòu)成特征矢量的信息里,輸入的筆劃信息,根據(jù)評價中的限定語改變評價度。
用模糊性進行字符識別,不會降低識別率,可實現(xiàn)詞典尺寸的小型化和檢索高速化等。
首先,就本發(fā)明及其實施例的概要加以說明。
即在本發(fā)明中1.準(zhǔn)備妥例如圖2所示的模板式樣(基本筆劃類型)T1-T26;
2.將手寫輸入的每個字符中第ⅰ個筆劃信息Si與模板T1-T26順序比較,并算出與各模板Tj(j=1-26)的近似度Eij。
例如,如果輸入字符為片假名“
”,那么它的第一筆劃s為“丿”,由于與模板T1,T2,T3等的近似度較高,與模板T7等的近似度較低,所以得到E101=90%,E102=80%,E103=95%,…E107=0%,…E126=0%。同樣地,由于第二筆劃S為“丶”,所以得到E201=5%,E202=0%,E203=0%,…E207=95%,…E226=0%,(數(shù)值是為說明而假定的大小)。
3、對于各字符,在各個筆劃Si上,將第2項的結(jié)果作為特征矢量Vi,Vi=(Ei01,Ei02,…Ei26)存儲起來。
如在上例“
”的情形下,特征矢量為V=(90,80,95,…,0,…0)V=(5,0,0,…,95,…,0)。
4、當(dāng)片假名“
”字符書寫正確時,其第一筆劃S1與模板T3“大體”一致,第二筆劃S2與模板T7“確實”一致。
因此,詞典里如果字符“
”,則“
”的日本工業(yè)標(biāo)準(zhǔn)代碼(JIS)描述其字符的代碼為T3=大體,T7=確定。
即,對每一個字符,描述該字符代碼號、與該字符第i筆化Si最接近的模板號Tj以及表示這種近似(一致)程度的限定語。又,該模板號Tj及限定語,僅僅按筆劃順序描述其筆劃數(shù)。
再根據(jù)每一個字符的總筆劃數(shù)將這些字符分類。
5、再準(zhǔn)備好如圖3所示的具有模糊性的函數(shù)圖表。
6、根據(jù)第4項的字符數(shù)據(jù)內(nèi),從輸入字符的總筆劃數(shù)項中取出第一項字符的字符數(shù)據(jù)。
在上例中,“
”字符的總筆劃數(shù)為2,所以從2筆劃項中取出第一項字符數(shù)據(jù)。
7、為簡單起見,第6項中取得的字符數(shù)據(jù)為“
”字符的字符數(shù)據(jù)的話,由于第1筆劃S1的T3=“大體”,那么隨著選擇圖3中“大體”的函數(shù)曲線,就可從第3項求出的特征矢量V1的近似度里,取出相對于模板T3的近似度95%(=E103)。
然后,根據(jù)圖3中“大體”的函數(shù)曲線,變化該近似度95%為合格率G1,例如G1=96%。
同樣,由于第二筆劃S2,T7=“確定”,所以隨著選擇圖3中“確定”的函數(shù)曲線,就可從特征矢量V2的近似度里,取出相對于模板T7的近似度95%(=E207),將其變換為合格率G2,例如,G2=98%。
即,在第6項取出字符數(shù)據(jù)的同時,既要對每一筆劃Si選擇圖4的函數(shù)曲線,又要將特征矢量Vi對應(yīng)的近似值Eij變換為由所選的函數(shù)曲線限定的合格度Gi。
8、將第7項求得的合格度Gi內(nèi)的最小合格率作為該字符數(shù)據(jù)所表示代碼號的字符合格度Gm。
在上例中,由于G1=96%,G2=98%,所以相對于輸入字符“
”字的合格度Gm為96%(=G1)。
9、其后,對符合筆劃數(shù)的所有字符數(shù)據(jù),重復(fù)執(zhí)行7、8項。
10、如果第9項執(zhí)行結(jié)束,在所得到的合格度Gm(這只得到字符數(shù)據(jù)的個數(shù))里,將其中給予合格度G最高的字符作為輸入字符的第一候選,輸出其代碼號。
接著,模板式樣T1-T26是考慮以下幾點確定的,即1、漢字的結(jié)構(gòu)元素有“橫筆劃”,“豎筆劃”,“撇”,“彎”等,其種類有限定。
2、即使看似相同的筆劃,也會由于運筆的不同出現(xiàn)“撇”“彎”等變形的寫法的差異。又,對“撇”等筆劃,由于沒有規(guī)定原來的長度和角度,在可能產(chǎn)生不同變形的筆劃中,例如模板式樣T1-T3,僅僅是為區(qū)分變形類型而準(zhǔn)備的另一些模板。
3、由于非常復(fù)雜的基本形狀在所有漢字中出現(xiàn)頻率極低,所以不定義模板,而用其它識別方法來處理。
還有,模板式樣T1-T26中用點線表示的筆劃部分在求近似度Eij時,表示可減少或忽略它們的評價。
下面說明本發(fā)明的一個結(jié)構(gòu)實例。


圖1是本發(fā)明的一個實施例的系統(tǒng)圖。
圖2至圖7是其說明圖。
在圖1中,(1)表示圖形輸入板等的座標(biāo)輸入手段,由這個輸入手段(1)輸入一個筆劃部分的座標(biāo)充序列Po-Pn,將這個座標(biāo)序列Po-Pn送到折線壓縮電路(2),對折線信息及其端點信息的序列進行壓縮變換。即,例如,如果輸入的筆劃(座標(biāo)序列)預(yù)處理呈圖4B所示的折線#1-#4的話,那么該筆劃,其每條折線#1-#4既如圖4A所示的角度(方向)按8個方向數(shù)量化,又對該折線#1-#4的長度和各始點及終點的座標(biāo)值進行變換,得到如圖4C所示那樣的數(shù)據(jù)。
而且,該數(shù)據(jù)的一個筆劃部分通過緩沖存儲器(3),送至近似度計算電路(401)-(426),計算模板式樣T1-T26的近似度Eij。(前述第2項)再,進行該近似度Eij計算是根據(jù)規(guī)則存儲電路(501-(526)中所描述的算法,獨立而且并行地對各模板式樣Tj計算求得的。
然后,將算出的近似度Eij送至特征矢量緩沖存儲器(6)。圖中,模型地表示了該緩沖存儲器(6)的結(jié)構(gòu),既有與模板式樣T1-T26對應(yīng)行方向的26個存儲區(qū),又有與識別字符最大筆劃數(shù)K對應(yīng)列方向的K個存儲區(qū)。因此,在這個緩沖存儲器(6)中,就一個字符來說其各筆劃S的特征矢量Vi,存儲在每一個筆劃Si里。(前述第3項)。
而且,該一個字符的特征矢量Vi和來自特征詞典(7)的字符代碼(前述第4項)在評價電路(8)中按前述第5-10項進行處理,將對于輸入字符合格度最高代碼號加以輸出。
圖5表示在近似度計算電路(401)中,計算輸入筆劃Si對模板T1的近似度Ei01的規(guī)則實例。
即,在圖5A中,夸張表示了“右”、“五”等字中所含的“丿”,對于這個筆劃“丿”,在模板T1的時刻,如圖5B所示,是通過測量長度L1-L4,Lh,Lw,計算出來的。
Eiol=(aLh-bLw-cL1+dL4+eL3)/L2但是,當(dāng)Ei01>1時 Ei01=1當(dāng)Ei01<0時 Ei01=0a-e為求出的常數(shù),(在這里用小數(shù)表示近似值Ei01)。
而且,這時在模板T1中,由于點線筆劃部分的權(quán)為0乃至小于0,所以對于值L3,L4的常數(shù)e,d,比其它常數(shù)a-c小。
又,在計算電路(402)-(426)中,也按對應(yīng)模塊T2-T26的近似度Ei02-Ei26的計算公式,將各自定義的近似度計算出來。
若根據(jù)如上的本發(fā)明,進行聯(lián)機手寫字符的識別,這時,特別是如果根據(jù)本發(fā)明,求出輸入筆劃Si和預(yù)先定義好的模板T1-T26的近似度Eij,并以該近似度Eij及限定語為基礎(chǔ)進行字符識別,那么對筆跡的自然變化乃至變形的識別率都不會降低。由于模板Tj象T1-T3那樣的處理,即對部分變形也作了處理,從而提高了識別率,加強了對筆跡變化乃至變形的識別能力。
又,由于詞典(7)可以基本上只有1組與筆劃Si對應(yīng)的代表性的模板Tj及其限定語,那么,既可使詞典(7)小型化,又可使詞典(7)的檢索高速化。
又可用這樣一種方法實現(xiàn)未定義字符的登錄,即由用戶每輸入一個筆劃,一方面由圖象表示近似度最高的模板的形狀,同時可用會話形式確認(rèn)該模板是否為正確的形狀。
權(quán)利要求
1.一種聯(lián)機手寫字符識別裝置,其特征在于它包含有字符基本結(jié)構(gòu)元素即預(yù)先定義好的多個模板信息,分別計算出輸入筆劃信息與上述多個模板信息的近似度的電路,存有每一個字符中對其各筆劃限定語的特征詞典存儲器,評價時,用所述限定語限定所述近似度,并且改變字符判定程度來進行評價的評價電路。
全文摘要
本發(fā)明用于聯(lián)機手寫字符的識別并且具有較好的識別精度。聯(lián)機手寫字符識別裝置包含有字符基本結(jié)構(gòu)元素即預(yù)先定義好的多個模板信息,可分別計算出輸入筆劃信息與所述模板信息的近似度的電路,存有每個字符中對各筆劃的限定語的特征詞典存儲器和評價時,用所述限定語限定所述近似度并且改變字符判定程度來進行評價的評價電路。
文檔編號G06K9/62GK1040447SQ89106539
公開日1990年3月14日 申請日期1989年8月17日 優(yōu)先權(quán)日1988年8月17日
發(fā)明者吉田公義, 田守寬文, 板野秋夫, 茶谷公之 申請人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
保定市| 运城市| 余江县| 东海县| 崇义县| 绩溪县| 林西县| 横山县| 新闻| 六盘水市| 邓州市| 禄丰县| 阳城县| 清河县| 黄冈市| 德江县| 盱眙县| 烟台市| 改则县| 长武县| 高碑店市| 怀仁县| 文化| 合水县| 凤冈县| 英吉沙县| 襄樊市| 云阳县| 正宁县| 社旗县| 嘉定区| 根河市| 闸北区| 忻州市| 洛扎县| 玛沁县| 曲沃县| 盱眙县| 富锦市| 基隆市| 冷水江市|