两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于識別手寫字符的方法、裝置和計算機程序的制作方法

文檔序號:6353289閱讀:159來源:國知局
專利名稱:用于識別手寫字符的方法、裝置和計算機程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于識別手寫字符的方法。
背景技術(shù)
對于識別手寫字符的需要不斷增加。便攜數(shù)據(jù)處理裝置例如PDA(個人數(shù)字助理)、移動電話機或者便攜式計算機越來越流行。為了向這些便攜裝置中輸入數(shù)據(jù),需要一種文本插入單元。
以前的文本插入單元作為鍵盤來實現(xiàn)。不過這使便攜裝置的最小尺寸受到限制,因此,需要用于向便攜裝置插入文本的不同的方法,以便使裝置能夠具有更小的尺寸。
現(xiàn)在鍵盤正在被某種手寫文本的識別取代。一種通常的解決辦法是設(shè)置一個壓敏區(qū),用戶可以在所述壓敏區(qū)上書寫字符。然后所述字符被解釋,并由便攜裝置進行處理。當然,取代常規(guī)的臺式計算機的鍵盤也是感興趣的。
因而,手寫字符的識別在便攜裝置中是一個重要的任務(wù)。所述識別一般通過比較手寫字符和存儲在便攜裝置的數(shù)據(jù)庫中的參考字符來進行。一種這樣的方法在US 4,284,975中披露了。
所述識別應(yīng)當是快速的,以便避免使用戶煩惱的延遲。這個要求對于語標書寫系統(tǒng)例如漢字尤其難于實現(xiàn)。漢字書寫系統(tǒng)由多達20000個字符構(gòu)成。因為在進行漢字識別時手寫字符必須和海量的參考字符比較,識別速度是慢的。
按照US4,284,975,計算手寫字符上的點和參考字符上的點之間的坐標差。這些差用于計算點之間的距離測度。
目前,所述的差至少用兩步計算。確定一個點的兩個特征可被存儲在不同的區(qū)域內(nèi),以便通過參考存儲一個特征的寄存器容易訪問該特征的值。然后用兩個減法進行兩個點之間的差的比較,以便比較該點的兩個特征。在這些減法中,保存特征的值的寄存器應(yīng)當被直接地訪問。不過,這意味著需要大量的存儲器,因為兩個特征要分別存儲。可選地,壓縮兩個特征的值以對每個點單獨存儲。這意味著需要較少的存儲器,但是在進行特征的差的計算之前,點的特征必須被解壓縮。這給出了一種較慢的方法。
發(fā)明概述本發(fā)明的目的在于提供一種較快的用于識別手寫字符的方法。
本發(fā)明的目的由一種用于識別手寫字符的方法達到。所述方法包括以下步驟確定定義所述手寫字符的多個位置特征;以及比較手寫字符和在數(shù)據(jù)庫中存儲的參考字符,以便找到最接近的匹配參考字符。所述比較步驟包括以下步驟計算手寫字符的多個位置特征之一和參考字符之一的位置特征之間的差值;并通過查找預(yù)定的表,根據(jù)計算的差值確定一個距離測度。所述比較步驟還包括以下步驟對手寫字符的多個位置特征中的每個位置特征,重復所述計算差值的步驟和確定距離測度的步驟;并根據(jù)確定的距離測度計算代價函數(shù)。
本發(fā)明的方法基于這樣的理解一種用于識別手寫字符的較快的方法要求在手寫字符和大量的參考字符之間進行的比較是快的。如果比較步驟的速度加快,則整個識別方法被大大加快。比較字符的步驟包括比較字符的多個位置特征的步驟。按照本發(fā)明,位置特征的比較被非常快地進行。比較手寫字符的位置特征和參考字符的位置特征的步驟包括查表確定在所述位置特征之間的距離測度。這種查表處理比實際計算距離測度快。因而,手寫字符和參考字符的每次比較便快得多,而比較位置特征的速度小的增加便導致一種用于識別手寫字符的相當快的方法。
換句話說,因為在特征點之間的離散的距離被測量,只能獲得少量的不同的距離測度。本發(fā)明基于這樣的理解這可以用于快速識別。因而,按照本發(fā)明,這些不同的距離測度被存儲在一個表中,用于根據(jù)計算的差值快速地查找距離測度。因而,距離測度不需要通過計算確定,而代之以查表給出距離測度,借以使距離測度的確定被加快。
位置特征的可能的值可以在識別開始之前得知,這是因為在識別期間用于確定位置特征的方式是已知的。因而,在位置特征之間的可能的距離測度也可以是已知的,借以可以計算出所述的表,并在識別開始之前被存儲。
位置特征定義一個手寫字符。優(yōu)選地,位置特征是手寫字符中的一些點與/或矢量。例如,所述的矢量可以描述字符上的兩點之間的直線,或者描述字符的點的導數(shù)。當然,手寫字符也可以用點和矢量的任何組合來定義。
距離測度是手寫字符的位置特征和參考字符的位置特征之間的差的函數(shù)。這個函數(shù)不必是非常復雜的;無論如何,通過查表確定距離測度比通過實際計算快。在本發(fā)明的上下文中,字符這個術(shù)語被定義為任何可寫的符號。在一些情況下,字符可以是這種符號的一部分,或者是這種符號的組合結(jié)構(gòu)。
優(yōu)選地,每個位置特征由至少兩個特性確定。計算手寫字符和參考字符的位置特征之間的差的步驟包括計算手寫字符的位置特征的每個特性和參考字符的位置特征的相應(yīng)特性之間的差。確定位置特征一般需要兩個特性,例如一個點的x坐標和y坐標,或者一個矢量的x方向和y方向。在確定距離測度時,為了比較位置特征,需要兩個特性的差,因而兩個特性影響距離測度。
按照本發(fā)明的優(yōu)選實施例,對于每個特性計算差值的步驟利用一個操作進行。按照本發(fā)明的方法通過在一個記錄中存儲每個位置特征的各特性來計算特性的差,并使用在所述記錄中的哪些位代表每個特性的知識來計算所述的差。因而,位置特征可以被存儲在一個小的存儲空間內(nèi),并且,除了用于確定距離測度的步驟速度快之外,計算差值的步驟也非???,這是因為在計算位置特征的差時,只需要一個機器碼操作。
優(yōu)選地,確定位置特征的步驟包括在一個網(wǎng)格中確定位置特征的位置的步驟。借以使手寫字符的位置特征能夠容易地和參考字符的相應(yīng)的位置特征匹配。
在優(yōu)選實施例中,手寫字符和參考字符的位置特征包括比較點的坐標。因而,手寫字符的某些比較點可以和參考字符的預(yù)定的比較點比較,以便找到匹配的參考字符。
優(yōu)選地,確定位置特征的步驟包括在網(wǎng)格中確定比較點的x坐標和y坐標的步驟。借以使得比較點的位置能夠容易地用兩個特性來描述。
在優(yōu)選實施例中,網(wǎng)格的尺寸是16×16個位置,并且一個比較點的坐標用一個數(shù)據(jù)字節(jié)表示。所述網(wǎng)格的尺寸對于明確地表示漢字和對于在少量的存儲器空間中存儲一個比較點的位置是最佳的。
優(yōu)選地,由在預(yù)定的表中查表得到的距離測度是在手寫字符的比較點和參考字符的比較點之間的歐幾里德距離的函數(shù)。所述歐幾里德距離給出沿x方向和y方向的差的相等加權(quán)的測度。所述函數(shù)可以是歐幾里德距離平方,如果輸入的差是整數(shù),其將給出一個整數(shù)結(jié)果。
在另一個實施例中,手寫字符和參考字符的位置特性包括比較矢量的位置和方向。比較矢量也可以和比較點組合來定義字符。當位置特征包括比較矢量時,手寫字符的筆畫的方向和限定參考字符的筆畫的方向的參考字符的相應(yīng)的比較矢量比較。
在這個實施例中,通過在預(yù)定的表中查表得到的距離測度是手寫字符和參考字符的曲率之間的差的函數(shù)。這意味著比較筆畫的導數(shù)。
優(yōu)選地,本發(fā)明的方法還包括在確定手寫字符的位置特征的步驟之前在網(wǎng)格中使手寫字符居中的步驟。結(jié)果,解決了手寫字符的位置的平移,使所述位置適應(yīng)于參考字符的位置。借以使手寫字符能夠在檢測書寫有效的任意位置書寫。
有利地,所述方法還包括在進行確定手寫字符的位置特征的步驟之前,按照參考字符的大小將手寫字符縮放到規(guī)格化的尺寸的步驟。這樣,使得手寫字符的大小對于識別無關(guān)緊要。
在優(yōu)選實施例中,所述方法還包括確定構(gòu)成手寫字符的筆畫的數(shù)量的步驟。這是一種對字符分類從而避免使手寫字符和每一個參考字符比較的方法。
優(yōu)選地,比較手寫字符和參考字符的步驟包括首先比較手寫字符和由相同數(shù)量的筆畫構(gòu)成的參考字符的步驟。結(jié)果使得手寫字符首先和最可能是最接近匹配的參考字符的參考字符比較。
此外,比較步驟優(yōu)選地還包括比較手寫字符和由比手寫字符稍少的筆畫構(gòu)成的參考字符的步驟,從而考慮到筆畫的錯誤的合并。兩個筆畫的合并是通常的,因為書寫者有時應(yīng)當抬筆時而不抬筆。這種方案意味著即使書寫者錯誤地合并兩個筆畫,也應(yīng)當能夠找到正確的最接近的匹配參考字符。
此外,比較步驟最好還包括比較手寫字符和由比手寫字符稍多筆畫構(gòu)成的參考字符的步驟,從而考慮到錯誤的抬筆。這個方案意味著即使書寫者在一個筆畫中錯誤地抬筆,也應(yīng)當能夠找到參考字符。
在另一個優(yōu)選實施例中,使手寫字符的筆畫和參考字符的相應(yīng)的筆畫比較,其中相應(yīng)的筆畫按照手寫字符的筆畫的書寫順序確定。因而,使得參考字符的相應(yīng)的位置特征容易地和相應(yīng)的手寫字符的位置特征相關(guān)。這對于漢字是尤其有用的,因為漢字筆畫的書寫順序安排是特定的。這意味著,一個熟練的漢字書寫者極少按錯誤的筆畫順序書寫漢字。
優(yōu)選地,所述方法還包括識別手寫字符的筆畫的順序的步驟,從而考慮到用錯誤的筆畫順序書寫字符。這種方案使得即使書寫者按錯誤的筆畫順序手寫字符,也能找到正確的最接近的匹配參考字符。
在優(yōu)選實施例中,所述方法還包括計算手寫字符的仿射變換,以便補償手寫字符的可能的傾斜,并接著比較變換的字符和數(shù)據(jù)庫中的參考字符的步驟。這個方案使得即使書寫者書寫傾斜的字符也能找到正確的最接近的參考字符。
本發(fā)明的目的還可以利用一種用于識別手寫字符并用于將所述字符轉(zhuǎn)換成數(shù)字形式的裝置來達到。所述裝置包括用于確定定義所述手寫字符的多個位置特征的裝置;包括參考字符的數(shù)據(jù)庫;以及用于比較所述手寫字符和所述數(shù)據(jù)庫中的參考字符,以便找到最接近的匹配參考字符的裝置。所述用于比較的裝置包括用于計算所述手寫字符的多個位置特征之一和參考字符之一的位置特征的裝置,以及預(yù)先確定的表,其根據(jù)位置特征的差確定距離測度。所述用于比較的裝置還包括用于通過查找所述預(yù)定的表確定距離測度的裝置,以及用于根據(jù)所述確定的距離測度計算代價函數(shù)的裝置。
這種裝置可以用于對數(shù)據(jù)處理裝置進行文本輸入,從而代替鍵盤或者作為鍵盤的補充。按照本發(fā)明的查表處理使得手寫字符的識別非??焖?。因而可以消除煩人的等待時間。
本發(fā)明的目的還通過如權(quán)利要求2所述的計算機程序來達到。


下面以舉例方式參照附圖詳細說明本發(fā)明,其中圖1表示手寫字符和匹配參考字符;圖2表示用戶和實施按照本發(fā)明的方法的裝置的相互作用的流程圖;圖3是在進行實際識別之前手寫字符的預(yù)處理的流程圖;圖4是比較手寫字符和參考字符的過程流程圖;圖5是說明手寫字符和參考字符比較的次序的流程圖;圖6是比較手寫字符的仿射變換和參考字符的過程流程圖;以及圖7表示實施本發(fā)明的方法的裝置。
本發(fā)明的優(yōu)選實施例的詳細說明在圖1中,手寫字符1(粗的灰線)和參考字符2(細的黑線)被表示在網(wǎng)格3中。手寫字符1由多個筆畫4構(gòu)成。每個筆畫4的開始點5和結(jié)束點6在網(wǎng)格3中的布置被標記。筆畫3的開始點5和結(jié)束點6被優(yōu)選地用作手寫字符1的位置特征。它們在網(wǎng)格3中的x,y坐標確定所述位置特征。當然,也可以使用其它的坐標系統(tǒng),例如極坐標系統(tǒng)。手寫字符1的另外的位置特征可以是從每個筆畫4的開始點5到結(jié)束點6的矢量,或者是筆畫4上在開始點5和結(jié)束點6之間的其它點。通過比較手寫字符1的位置特征和參考字符2的位置特征來使手寫字符1和參考字符2進行比較,下面將要進行詳細說明。
參見圖2-6,現(xiàn)在說明識別手寫字符的一種優(yōu)選方法。下面的說明將參照在壓敏區(qū)域上的手寫字符進行說明,在所述區(qū)域上進行即時的字符識別。不過,如后所述,所述方法也可以應(yīng)用于寫在紙上的手寫字符,其隨后被掃描而成為數(shù)字形式。
參見圖2說明用戶通過手寫輸入字符的操作。在步10,字符被手寫在壓敏區(qū)域上,以便進行識別和轉(zhuǎn)換成數(shù)字形式。壓敏區(qū)域是一種與數(shù)據(jù)處理裝置例如計算機、PDA、或移動電話機相連的輸入單元。用戶利用以下稱為筆的尖的物體在壓敏區(qū)域上書寫,以便在所述區(qū)域上施加壓力。一個字符由至少一個筆畫構(gòu)成,所述筆畫是不抬筆而寫出的一條線。用戶書寫構(gòu)成字符的各筆畫。當整個字符已被輸入時,在步12,用戶向數(shù)據(jù)處理裝置表示輸入了整個字符,然后該裝置便比較手寫字符和參考字符,以便找到最接近的匹配字符。還有其它方法使數(shù)據(jù)處理裝置得知整個字符已被輸入,例如,在一段時間內(nèi)沒有用戶的操作便可以表示已經(jīng)輸入了一個完整的字符。然后將向用戶顯示最接近的匹配字符,在步14,用戶將回答是否顯示了正確的字符。用戶在步16可以接受或者在步18可以拒絕被建議的字符。
下面參照圖3詳細說明對手寫字符進行的數(shù)據(jù)處理。當在步20手寫字符被輸入時,在步22,手寫字符上的點被采樣,以便確定手寫字符。這些點優(yōu)選地由在一個網(wǎng)格中所述點的x,y坐標確定。這些點稍后用于比較手寫字符和參考字符。在步22的采樣步驟之后,對輸入的手寫字符進行預(yù)處理,以便校正手寫字符的錯誤的位置或尺寸。
所述的預(yù)處理包括在步24使手寫字符在網(wǎng)格中居中的步驟,以及在步26使手寫字符縮放成為標準尺寸的步驟。所述步驟24-26按照下述進行。首先,確定所有采樣點的x,y坐標的平均值。然后,從采樣點的坐標中減去所述的x,y坐標平均值,這樣把手寫字符的重心置于原點。于是,從采樣點到重心的距離的標準偏差被規(guī)格化。這個尺寸相應(yīng)于參考字符的尺寸。最后,把手寫字符移動到網(wǎng)格的中心。采樣點最好利用比在手寫字符和參考字符比較期間使用的分辨率更高的分辨率進行確定。然后,字符的縮放可以包括改變分辨率,這意味著利用所述分辨率之間的比例來除x,y坐標值。
手寫字符由作為不抬筆而寫出的線的筆畫構(gòu)成。每個筆畫被采樣,并確定位置特征。采樣可以以特定的間隔檢測位置特征,而在那時筆的位置確定位置特征??蛇x地,可以確定筆畫的開始和結(jié)束位置。通過計算在筆畫上的最偏離開始和結(jié)束位置之間的直線的點,確定附加的位置??梢杂孟嗤姆绞酱_定更多的附加位置。手寫字符的位置特征可以是采樣點的坐標。位置特征也可以是兩個相鄰的采樣點之間的方向矢量,或者是用于確定兩個相鄰的方向矢量之間的方向的差的曲率矢量。
筆畫按照其書寫的順序被列表。然后,手寫字符的第一個筆畫和參考字符的第一個筆畫比較,依此類推。這對于漢字尤其有用,這是因為其筆畫順序是明確的。不過,如果筆畫按照錯誤的順序書寫,這可以通過改組筆畫的順序解決??梢酝ㄟ^比較手寫字符的每個筆畫和參考字符的每個筆畫,并確定與手寫字符的每個筆畫最匹配的筆畫進行改組。
手寫字符由多個位置特征表示,這些位置特征可以包括采樣點的坐標、方向矢量、曲率矢量或者它們的任意組合。手寫字符的位置特征和參考字符的位置特征比較,以便找到最接近的匹配參考字符。參考字符的位置特征被預(yù)先確定,并表示與從手寫字符提取的位置特征相同的特征。不過,不必對于手寫字符的每個位置特征都具有相應(yīng)的位置特征。參考字符的一個位置特征可用于和手寫字符的兩個或更多位置特征比較,反之亦然。筆畫需要可變數(shù)量的位置特征被適當確定。因而,手寫字符的3個位置特征可以和參考字符的4個位置特征比較。在這種情況下,需要確定參考字符的哪些位置特征相應(yīng)于手寫字符的位置特征。這意味著,可以選擇和手寫字符的位置特征差別最小的參考字符的3個位置特征作為參考字符的相應(yīng)的位置特征??蛇x地,手寫字符的一個位置特征可被分配兩個相應(yīng)的位置特征,并對這個位置特征計算兩個距離測度。
在優(yōu)選實施例中,位置特征包括字符的比較點。在網(wǎng)格中的比較點的位置由其x,y坐標確定。網(wǎng)格最好由16×16個正方形構(gòu)成,這樣,比較點可以用一個字節(jié)的數(shù)據(jù)表示,因為x、y坐標各需要4位。
下面參照圖4詳細說明手寫字符和參考字符的比較。參考字符作為其相應(yīng)的位置特征的信息被存儲在數(shù)據(jù)處理裝置的數(shù)據(jù)庫中。手寫字符的每個比較點與參考字符的相應(yīng)的比較點比較。這通過在步30計算在比較點之間的差來實現(xiàn),即從手寫字符的比較點的x,y坐標值中減去參考字符的相應(yīng)的比較點的x,y坐標值。然后在步32使用所得差值作為輸入,在預(yù)定的表中查找距離測度??梢允褂眯问綖閒(xa-xb)+g(ya-yb)的任何函數(shù)作為距離測度,其中f和g是函數(shù),(xa,ya)是手寫字符的比較點,(xb,yb)是參考字符的相應(yīng)的比較點。作為替代,特征(xa,ya)和(xb,yb)可自然地表示方向矢量或曲率矢量。
在優(yōu)選實施例中,所述的表將距離測度定義為點之間的歐幾里德距離平方,即,所述的表給出(xa-xb)2+(ya-yb)2的結(jié)果。
這對于所有的距離都給出一個正值,并且如果兩個差值都是整數(shù),則進一步給出整數(shù)結(jié)果。
比較點的坐標(xa,ya)以一個字節(jié)的數(shù)據(jù)被存儲。x坐標以第一半字節(jié)被存儲,即第一個4位,y坐標以隨后的半字節(jié)被存儲。然后可以在一次操作中同時計算差值(xa-xb)和(ya-yb),因為x,y值的存儲位置是已知的。差值(xa-xb)和(ya-yb)被表示為9位,并被用作預(yù)定表的輸入。第一個半字節(jié),即第一個4位,表示差值(xa-xb),隨后的半字節(jié)表示差值(ya-yb)。第9位是進位位,其表示y坐標的差值是否是負的。對于x坐標,假定不會出現(xiàn)大于8個x點(tick)的差值。因此,第一個半字節(jié)被解釋為表示間隔[-7,8]。通過從(xa,ya)中簡單地減去8位的(xb,yb),進行所述的減法運算。如果在4個最低有效位中的差值即(xa-xb)是負的,其將影響差值(ya-yb)。此時在4個隨后的位中的結(jié)果將是(ya-yb)-1,并且這在預(yù)定表中解決。當然,可以在x和y坐標之間設(shè)置一個空位,此時其可以是對于負值的(xa-xb)的進位位。不過,按照優(yōu)選實施例,在(ya-yb)中產(chǎn)生的誤差在出現(xiàn)大于8個x點時被假定為是不重要的。如果發(fā)生大于8個x點的差,則被比較的字符是如此不同,以致于參考字符不會被解釋為最接近的匹配字符。預(yù)定的表由16×32=512個單元構(gòu)成??蛇x地,y坐標的進位位也可以被忽略。在這種情況下,所述的表將只由256個單元構(gòu)成。
如果使用16×16的網(wǎng)格,不能保證所有的點彼此相距最多8個x點。不過,漢字的筆畫主要是從左到右,或者從上到下,因此混淆的可能性極小??蛇x地,可以使用8×8的網(wǎng)格,這意味著,表示每個坐標只需使用3位。不過,這將導致對漢字太粗糙的分辨率,但是可以用于其它的應(yīng)用。
查表獲得距離測度的結(jié)果。在步34,對于手寫字符的所有位置特征,重復步30和32的距離測度的確定。然后在步36計算代價函數(shù),確定參考字符和手寫字符的相似性。所述代價函數(shù)可以是所有的確定的測度的和。在步38,檢查參考字符的代價函數(shù)的結(jié)果,確定至此其是否是比較的參考字符的最低的結(jié)果,如果是,則該結(jié)果被存儲,并且在步40該參考字符被確定為至此最接近的匹配參考字符。
如果在對于所述參考字符的所有距離測度被確定之前,確定的參考字符的距離測度超過至此最接近的匹配參考字符的和,則比較可被中斷。在這種情況下,在所有距離測度被確定之前,拒絕該參考字符,因為距離測度的和已經(jīng)太大。
對所有的參考字符重復比較步驟30-38。在手寫字符和所有參考字符完成比較時至此作為最接近的匹配參考字符存儲的參考字符被認為是最接近的匹配參考字符。然后可以顯示最接近的匹配參考字符,并且用戶可以檢查手寫字符是否被正確地識別,如上面結(jié)合圖2所述。
下面參照圖5詳細說明智能選擇最可能是正確的字符的參考字符的一種方法。在數(shù)據(jù)庫中的參考字符根據(jù)其筆畫的數(shù)量被分成組。然后,在步50手寫字符和那些與其筆畫數(shù)相同的參考字符比較,這樣,首先確定一小部分參考字符作為最可能是最接近的匹配字符。
不過,當用戶書寫手寫字符時,兩個筆畫可能被錯誤地合并在一起,或者若用戶在書寫一個筆畫中間抬筆則可能使一個筆畫被分成兩個筆畫。這意味著,手寫字符應(yīng)當和筆畫數(shù)略微不同的參考字符比較。考查在手寫字符中的筆畫的位置。在步52,一對筆畫當中的一個筆畫的結(jié)束位置接近另一個筆畫的開始位置的成對筆畫被合并,然后在步54,手寫字符和筆畫數(shù)相應(yīng)于手寫字符新的筆畫數(shù)的參考字符比較。不同地合并筆畫的組合和具有相應(yīng)的筆畫數(shù)的參考字符比較。
此外,在步56,通過設(shè)置一個間斷點,并確定一個筆畫在間斷點兩側(cè)的兩部分為兩個單獨的筆畫,可以使筆畫被分割。然后,在步58,手寫字符和筆畫數(shù)相應(yīng)于手寫字符新的筆畫數(shù)的參考字符比較。可以用不同的組合重復幾次筆畫的合并和分割,以便找到正確的書寫字符。
這樣,大部分的參考字符不會和手寫字符比較,因為這些參考字符的筆畫數(shù)和手寫字符的筆畫數(shù)相差太遠。
參見圖6,手寫字符還可能具有錯誤的傾斜。此時,在步60,通過手寫字符的仿射變換可以找到合適的匹配參考字符。在步62,計算手寫字符的仿射變換的不變量。所述不變量用于比較手寫字符和參考字符。在步64,計算所述不變量和參考字符之間的矢量積。如果字符相同,它們跨過相同的空間,因此內(nèi)部矢量積為0。在不變量和參考字符之間的矢量積通過查表確定。
由上述可見,必須進行大量的比較。手寫字符應(yīng)當和許多不同的參考字符比較。此外,手寫字符可能是以略微錯誤的方式寫出的。為了對此進行補償,需要對手寫字符一些許多變換(筆畫的合并、筆畫的分割、仿射變換),并且由這些變換獲得的新的字符必須和參考字符比較。因此,如果字符之間能夠快速地比較,則具有很大的優(yōu)點。這通過查表來實現(xiàn),以便按照本發(fā)明確定距離測度。
上面主要根據(jù)被書寫在一個顯示裝置上并在書寫的同時被檢測的字符進行了說明。另一種方案是,在字符被寫在紙上之后,所述字符被檢測,例如被掃描。這涉及手寫字符以及用打字機打出的字符。因而,所述檢測包括,代替識別顯示裝置上書寫的字符的操作,從紙上讀取(掃描)字符的操作。這樣,讀取的字符的位置特征被檢測,并且可以按照上述方法進行識別。
下面參照圖7說明按照本發(fā)明的裝置。數(shù)據(jù)處理裝置100例如計算機、PDA、移動電話機、掃描儀等,包括文本輸入單元102,用于以手寫的方式輸入文本。數(shù)據(jù)處理裝置100包括用于檢測輸入的文本的裝置104。所述用于檢測的裝置104確定手寫字符的位置特征。
數(shù)據(jù)處理裝置100包括數(shù)據(jù)庫106,或者至少可訪問一個數(shù)據(jù)庫。所述數(shù)據(jù)庫包括參考字符及其外部特征表示。數(shù)據(jù)處理裝置100還包括用于按照上述的方法比較檢測到的手寫字符和數(shù)據(jù)庫中的參考字符的裝置108。
用于比較的裝置108可以與手寫/輸入字符同時開始比較手寫字符??蛇x地,通過用戶表示整個字符已輸入來啟動比較操作。
用于比較的裝置108返回與手寫字符最接近匹配的參考字符。數(shù)據(jù)處理裝置100在顯示器110上顯示這個最接近匹配的字符,并準備識別一個新的字符。
當顯示出最接近的匹配字符時,可以要求用戶檢查手寫字符是否已被正確地識別。如果用戶拒絕所述最接近的匹配字符,則數(shù)據(jù)處理裝置100可以顯示第二個最好的匹配字符??蛇x地,可以要求用戶把字符再輸入一次。
作為另外一種替代方案,數(shù)據(jù)處理裝置100可以不要求用戶接受/拒絕而識別字符。此時檢查輸入的文本的拼寫和語法是否正確,并可向用戶顯示發(fā)生的錯誤。然后用戶可以校對所述文本,并糾正被曲解的字符。
應(yīng)當強調(diào),本說明所述的優(yōu)選實施例決不限制本發(fā)明,在所附權(quán)利要求限定的保護范圍內(nèi),可以作出許多其它的實施例。例如,所述網(wǎng)格可以具有其它的尺寸,例如8×8或者32×32,或者甚至不對稱的尺寸,例如16×8。不過,網(wǎng)格的尺寸是2的冪是適當?shù)?,因為x,y坐標用二進制表示。因而,可以使用例如3位或者5位表示一個坐標。
權(quán)利要求
1.一種用于識別手寫字符的方法,所述方法包括以下步驟確定定義所述手寫字符的多個位置特征,以及比較所述手寫字符和在數(shù)據(jù)庫中存儲的參考字符,以便找到最接近的匹配參考字符,所述比較步驟包括以下步驟計算所述手寫字符的多個位置特征之一和參考字符之一的一個位置特征之間的差值,根據(jù)計算的差值通過查找預(yù)定的表,確定一個距離測度,對所述手寫字符的多個位置特征中的每個位置特征,重復所述計算差值的步驟和確定距離測度的步驟,以及根據(jù)確定的距離測度計算代價函數(shù)。
2.按照權(quán)利要求1所述的方法,其特征在于,其中每個位置特征由至少兩個特性確定,并且其中計算手寫字符和參考字符的位置特征之間的差的步驟包括計算手寫字符的位置特征的每個特性和參考字符的位置特征的相應(yīng)特性之間的差。
3.按照權(quán)利要求2所述的方法,其特征在于,其中對于每個特性計算差值的步驟利用一次操作進行。
4.按照前面任何一個權(quán)利要求所述的方法,其特征在于,確定位置特征的步驟包括在一個網(wǎng)格中確定位置特征的位置的步驟。
5.按照前面任何一個權(quán)利要求所述的方法,其特征在于,其中手寫字符和參考字符的位置特征包括比較點的坐標。
6.按照權(quán)利要求5所述的方法,其特征在于,其中確定位置特征的步驟包括在網(wǎng)格中確定比較點的x坐標和y坐標的步驟。
7.按照權(quán)利要求6所述的方法,其特征在于,其中所述網(wǎng)格的尺寸是16×16個位置,并且一個比較點的坐標用一個數(shù)據(jù)字節(jié)表示。
8.按照權(quán)利要求5-7中任何一個所述的方法,其特征在于,其中由在預(yù)定的表中查表得到的距離測度是在手寫字符的比較點和參考字符的比較點之間的歐幾里德距離的函數(shù)。
9.按照前面任何一個權(quán)利要求所述的方法,其特征在于,其中所述手寫字符和參考字符的位置特性包括比較矢量的位置和方向。
10.按照權(quán)利要求9所述的方法,其特征在于,其中通過在預(yù)定的表中查表得到的距離測度是手寫字符和參考字符的曲率之間的差的函數(shù)。
11.按照權(quán)利要求4-10中任何一個所述的方法,其特征在于,還包括在確定手寫字符的位置特征的步驟之前在網(wǎng)格中使手寫字符居中的步驟。
12.按照前面任何一個權(quán)利要求所述的方法,其特征在于,還包括在進行確定手寫字符的位置特征的步驟之前,按照參考字符的大小將手寫字符縮放到規(guī)格化的尺寸的步驟。
13.按照前面任何一個權(quán)利要求所述的方法,其特征在于,還包括確定構(gòu)成手寫字符的筆畫的數(shù)量的步驟。
14.按照權(quán)利要求13所述的方法,其特征在于,其中比較手寫字符和參考字符的步驟包括首先比較手寫字符和由相同數(shù)量的筆畫構(gòu)成的參考字符的步驟。
15.按照權(quán)利要求13或14所述的方法,其特征在于,其中比較步驟還包括比較手寫字符和由比手寫字符稍少的筆畫構(gòu)成的參考字符的步驟。
16.按照權(quán)利要求13-15中任何一個所述的方法,其特征在于,其中比較步驟還包括比較手寫字符和由比手寫字符稍多的筆畫構(gòu)成的參考字符的步驟。
17.按照權(quán)利要求13-16中任何一個所述的方法,其特征在于,其中手寫字符的筆畫和參考字符的相應(yīng)的筆畫比較,其中所述相應(yīng)的筆畫按照手寫字符的筆畫的書寫順序確定。
18.按照權(quán)利要求17所述的方法,其特征在于,所述方法還包括識別手寫字符的筆畫的順序的步驟。
19.一種用于識別手寫字符并用于將所述字符轉(zhuǎn)換成數(shù)字形式的裝置,所述裝置包括用于確定定義所述手寫字符的多個位置特征的裝置,包括參考字符的數(shù)據(jù)庫,用于比較所述手寫字符和所述數(shù)據(jù)庫中的參考字符,以便找到最接近的匹配參考字符的裝置,所述用于比較的裝置包括用于計算所述手寫字符的多個位置特征之一和參考字符之一的一個位置特征之間的差值的裝置,預(yù)先確定的表,其根據(jù)位置特征的差值確定距離測度,用于通過查找所述預(yù)定的表來確定距離測度的裝置,以及用于根據(jù)確定的距離測度計算代價函數(shù)的裝置。
20.按照權(quán)利要求19所述的裝置,其中一個位置特征包括定義所述位置特征的兩個特性,并且所述兩個特性被存儲在數(shù)據(jù)庫中的一個數(shù)據(jù)寄存器中。
21.一種用于數(shù)據(jù)處理的手持裝置,包括壓敏區(qū)域,所述壓敏區(qū)域被設(shè)置用于手寫字符;以及按照權(quán)利要求19所述的裝置,用于識別在所述壓敏區(qū)域內(nèi)書寫的字符,并用于把所述字符轉(zhuǎn)換成數(shù)字形式。
22.一種用于識別手寫字符的計算機程序,包括用于確定定義所述手寫字符的多個位置特征的代碼,以及用于比較所述手寫字符和存儲在數(shù)據(jù)庫中的參考字符以便找到最接近的匹配參考字符的代碼,所述用于比較的代碼包括用于計算所述手寫字符的多個位置特征之一和參考字符之一的位置特征之間的差值的代碼,用于根據(jù)計算的差值通過查找預(yù)先確定的表來確定距離測度的代碼,用于對所述手寫字符的多個位置特征中每個位置特征重復計算差值和確定距離測度的步驟的代碼,以及用于根據(jù)確定的距離測度計算代價函數(shù)的代碼。
全文摘要
一種用于識別手寫字符的方法,所述方法包括以下步驟確定定義所述手寫字符的多個位置特征,以及比較所述手寫字符和在數(shù)據(jù)庫中存儲的參考字符,以便找到最接近的匹配參考字符。所述比較步驟包括以下步驟計算所述手寫字符的多個位置特征之一和參考字符之一的一個相應(yīng)位置特征之間的差值;通過查找預(yù)定的表,根據(jù)計算的差值確定一個距離測度,并對手寫字符的多個位置特征中的每個位置特征,確定距離測度;以及根據(jù)確定的距離測度計算代價函數(shù)。還披露了一種用于執(zhí)行所述方法的裝置和計算機程序。
文檔編號G06K9/22GK1488120SQ0280367
公開日2004年4月7日 申請日期2002年1月11日 優(yōu)先權(quán)日2001年1月15日
發(fā)明者安德森·霍爾茨貝里, 安德森 霍爾茨貝里 申請人:德庫瑪股份公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
青铜峡市| 洞口县| 宁都县| 锡林浩特市| 扎囊县| 启东市| 和龙市| 松江区| 永吉县| 宽城| 桐庐县| 阿鲁科尔沁旗| 特克斯县| 新余市| 昆山市| 阿拉善盟| 三台县| 孙吴县| 墨竹工卡县| 甘肃省| 阜阳市| 故城县| 和硕县| 漾濞| 商洛市| 永吉县| 拜城县| 马边| 青冈县| 襄城县| 尼木县| 长宁区| 鸡西市| 嫩江县| 渝北区| 柳江县| 晴隆县| 枝江市| 乌恰县| 昌宁县| 南江县|