两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

識別手寫字符的方法和設(shè)備的制作方法

文檔序號:6409138閱讀:170來源:國知局
專利名稱:識別手寫字符的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種識別手寫字符的方法及設(shè)備,更具體一點講,一種識別手寫朝鮮文字(一種朝鮮語手寫體)的方法和設(shè)備。
光字符識別(OCR)是指一種通過掃描器識別對應(yīng)于一個文件圖象輸入中字符區(qū)域內(nèi)容的技術(shù)。光字符識別技術(shù)的研究和開發(fā)可看成圍繞下列兩種情形中的一種進行識別印刷字符和識別手寫字符。識別印刷字符的技術(shù)已有顯著發(fā)展。然而,由于若干非特定寫作者和一已知寫作者的特定書寫的不規(guī)則變化導(dǎo)致手寫字符的無數(shù)變動,因而很難制成一種識別手寫字符的設(shè)備。
幾種有代表性的識別手寫字符的方法包括模板匹配法、近鄰分類(NNC)法、結(jié)構(gòu)法、人造神經(jīng)網(wǎng)絡(luò)法和應(yīng)用隱藏馬爾可夫模型。然而,由于上述方法中的大多數(shù)只是針對數(shù)字或英文字母,而它們所含的需要識別的特定字符較少,因而很難將這樣的方法直接應(yīng)用到朝鮮文。因而,目前正趨熱門的關(guān)于識別手寫中文字符和/或阿拉伯數(shù)字的研究便采用多種方法并用的方式進行。參閱1983年版英文書《模式識別》第26卷第2期第205至225頁中由T.H.Hildebrandt和W Liu寫的“手寫漢字的光識別1980年以來的進展”一文,以及1991年由世界科學(xué)出版公司(World Scientific PublishingCompany)出版并由P.S.P.Wang編輯的《字符和手寫體識別擴展領(lǐng)域前沿》第221至264頁中的由E.Cohen,J.J.Hull及S.N.Srihari撰寫的“理解結(jié)構(gòu)環(huán)境中的手寫體文本由地地來確定郵政編碼”一文。
近鄰分類(NNC)法是一種模式識別方法,即在隨意獲取有限個識別目標字符中的若干個代表值后,對應(yīng)于與自輸入字符模式中選取的特性值最接近的那個代表值的字符或字符群現(xiàn)在識別輸入字符模式時被找出。一般說來,由于近鄰分類法易實現(xiàn)、適應(yīng)性強且就處理速度來講表現(xiàn)卓越,因而該方法可有效地應(yīng)用于由許多目標識別字符組成的朝鮮文或漢字的識別。
到目前為止,大多數(shù)已知用來識別朝鮮文的設(shè)備和方法只局限于一完整的印刷字符集成或字符組分分開的字符,即起始、中間和未音分開寫(和讀)而無任何關(guān)聯(lián),或“篩姆”(Saem-mul)字符,即起始和中間音與末音在垂直方向上分開。另外,由于并非所有朝鮮標準字符集中的字符(2350個字)被用作識別目標而只有100到1000個常用字符被選作識別目標,因而在通常情況下難以應(yīng)用傳統(tǒng)方法和設(shè)備。
由于通用朝文字符的數(shù)目(2350)太大且各人所寫的字的外表各有不同,因而應(yīng)用傳統(tǒng)方法很難制成一種可靠的識別設(shè)備。因此,一種新的識別方法便成為必要。
為了解決上述問題,本發(fā)明的一個目標便是提供一種識別性能優(yōu)異的識別手寫朝文的方法和設(shè)備。
為實現(xiàn)上述目標,本發(fā)明特提供一種方法,其步驟有將字符圖象作為一I×J尺寸塊接收;應(yīng)用統(tǒng)計方法計算一個由有限個坐標構(gòu)成的特性矢,以此作為對應(yīng)于輸入字符圖象的一個特征;在對應(yīng)于識別目標字符的代表矢集中尋找一個與所算得的特性矢最相似的代表矢;獲得一個對應(yīng)于所找的代表矢的字符和一與此字符相關(guān)的候選字符群;和經(jīng)一神經(jīng)網(wǎng)絡(luò)將所得到的候選字符群中的一個字符作為最后的識別結(jié)果輸出,而其中的神經(jīng)網(wǎng)絡(luò)是通過使用由有限個坐標構(gòu)成且對應(yīng)于候選字符群的字符圖形的特性矢排列而成的。
本發(fā)明所述的設(shè)備包括一個將手寫文件圖象數(shù)字化為二進制圖象的輸入部分;一個將所輸入的二進制圖象分割以及以一個字符為單位輸出的預(yù)處理部分;一個存儲候選字符群的候選字符群存儲器,其中每一個字符群代表一識別目標字符且由包括該識別目標字符在內(nèi)的若干候選字符組成;一個存儲所有對應(yīng)于所有識別目標字符的代表矢存儲器;一個粗分類部分,用來獲取經(jīng)預(yù)處理部分輸入的字符圖形的特性矢,尋找與來自代表矢存儲器的所得到的特性矢最接近的代表矢,及尋找對應(yīng)于所找到的代表矢的識別目標字符和來自候選字符群存儲器的含該識別目標字符的相關(guān)候選字符群;一個由所有神經(jīng)網(wǎng)絡(luò)組成的神經(jīng)網(wǎng)絡(luò)存儲器,其中每一神經(jīng)網(wǎng)絡(luò)對應(yīng)著存儲在候選字符群存儲器中的每一候選字符群;和一細分類部分,用來從通過存儲在神經(jīng)網(wǎng)絡(luò)存儲器中的相應(yīng)神經(jīng)網(wǎng)絡(luò)在粗分類部分中找到的候選字符群中識別一個字符,并用來向預(yù)處理部分施加一個控制信號以提供擬以同樣方式加以識別的下一個字符。
根據(jù)本發(fā)明,由于其方法包括用模權(quán)匹配法從輸入手寫字符圖形中構(gòu)造一個較小的識別目標字符集,即候選字符群,及經(jīng)已知對小識別目標字符集表現(xiàn)出優(yōu)異性能的神經(jīng)網(wǎng)絡(luò)將所尋找的候選字符群的一個字符作為最后識別結(jié)果輸出,因而有可能對不受限制的手寫朝文加以完整識別。
上述本發(fā)明的目標和優(yōu)點將在詳細描述一優(yōu)選實施例并參照附圖的變得顯而易見,附圖中

圖1系根據(jù)本發(fā)明所述的手寫字符識別系統(tǒng)的方框圖;圖2A和2C系說明在圖1的粗分類部分中進行的自輸入字符圖象中抽取特性這一過程的示意圖;圖3系說明圖1的粗分類部分和細分類部分兩者都涉及到的識別目標字符的候選字符群的建造的示意圖;圖4系說明在細分類部分中進行的自輸入字符圖象中抽取水平和垂直方向上的特征這一過程的示意圖;圖5系說明神經(jīng)網(wǎng)絡(luò)存儲器中的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的示意圖;而圖6則系說明根據(jù)本發(fā)明的一優(yōu)選實施例所述的手寫字符識別的結(jié)果的一個例子的示意圖。
根據(jù)本發(fā)明的方法,先輸入一具有I行和J列的I×J字符圖象;作為一個對應(yīng)于輸入字符圖象中的圖形的特性,一個由有限個坐標構(gòu)成的特性矢隨后通過應(yīng)用統(tǒng)計方法算出;接著在對應(yīng)于識別目標字符的代表矢集內(nèi)尋代一個與所計算的特性矢最接近的代表矢;再接著獲得一對應(yīng)于所找代表矢的識別目標字符和一與該字符相關(guān)的候選字符群;最后,在所得到的候選字符群中將一個字符經(jīng)由對應(yīng)于候選字符群的神經(jīng)網(wǎng)絡(luò)作為最后識別結(jié)果輸出。
圖1便是根據(jù)本發(fā)明所述的手寫字符識別設(shè)備的方框圖。
圖1中的設(shè)備包括一個通過經(jīng)一個掃描器將手寫文件圖象數(shù)字代為二進制圖象來接收該手寫文件圖象的輸入部分10;一個將經(jīng)輸入部分10輸入的二進制圖象分割以該以一個字符為單位輸出的預(yù)處理部分20;一個存儲與識別用標字符有關(guān)的候選字符群的候選字符群存儲器30;一個存儲對應(yīng)于單個識別目標字符的單個代表特性矢的代表矢存儲器40;一個粗分類部分50,用來獲取經(jīng)預(yù)處理部分20輸入的字符圖形的特性矢,尋找與來自代表矢存儲器40的所得特性矢最接近的代表矢,及尋找對應(yīng)于所尋找的代表矢的識別目標字符和與來自候選字符群存儲器30的識別目標字符相關(guān)的候選字符群;一個由所有對應(yīng)于存儲在候選字符群存儲器30加的所有候選字符群的神經(jīng)網(wǎng)絡(luò)組成的神經(jīng)網(wǎng)絡(luò)存儲器60;和一細分類部分,用來從通過存儲在神經(jīng)網(wǎng)絡(luò)存儲器60中的相應(yīng)神經(jīng)網(wǎng)絡(luò)在粗分類部分50中找到的候選字符群中識別一個字符,和向預(yù)處理部分20施中一個控制信號以提供擬以同樣方式加以識別的下一個字符。這個過程不斷重復(fù)直到所輸入的文件中的所有字符都得到了識別。
輸入部分10由一象圖象掃描儀或計算和控制顯示攝像機(CCDCamera)這樣的圖象待取設(shè)備組成,并通過將圖象轉(zhuǎn)化成二進制圖象中計算機可讀的數(shù)字圖形來接收手寫文件的圖象,其中字符區(qū)被數(shù)字化成黑點而背影則被數(shù)字化成白點。
預(yù)處理部分20將由輸入部分10產(chǎn)生的輸入圖形中的干擾組分除去,以后只有字符圖形留下并分開每一“漢哥”字符以便以一個字符為單位輸出。為了簡化預(yù)處理部分的建造,希望一幅畫或說明書中不含手寫字符的那部分區(qū)域使用不會被輸入部分10的圖象待取設(shè)備檢測到的漏失(drop—out)顏色來印刷。
粗分類部分50通過下述方法計算由預(yù)處理部分20輸入的輸入字符圖形的特性矢。
作為與字符圖形有關(guān)的粗分類的一個特性,一個由有限個坐標構(gòu)成的矢量通過統(tǒng)計方法算出。為了得到特性矢,一個含I行和J列的I×J輸入圖象被劃分成M×N個小格(其中,I≥M,J≥N,且I,J,M和N為自然數(shù))。這里,一個非線性方法被用來解決由不同寫作者引起的字符外觀變動問題(參閱1983年版《圖形識別通信》第一卷第475至479頁中由Y.Yamashita,K.Higuchi,Y.Yamada和Y.Haga撰寫的“手印漢字字根據(jù)結(jié)構(gòu)區(qū)段匹配法的分類”一文)。也就是說,輸入圖象被分成M個垂直的條。這里,每一個條內(nèi)的黑色素的數(shù)目相等。因此,當輸入圖象再分成N個水平的條時,便得到M×N個小格子。每格里的兩個特性值,即一個垂直分量值Fv和一個水平分量值FH由下式放得Fv=Bv/BP和FH=BH/BP,式中,BP是輸入圖象內(nèi)黑色素數(shù),Bv是每格內(nèi)屬于垂直方向分量的黑色素數(shù),而BH則是每格內(nèi)屬水平方向分量的黑色素數(shù)。
這里,垂直和水平方向分量由運行(run)群組成,每一運行群含若干個這樣的運行(一行掃描線中連續(xù)的黑色素),即在若干垂直和水平方向的運行中其長度均大于一閾值T的那些運行閾值T根據(jù)一給定字符中的筆劃的厚度W來予以動態(tài)地設(shè)定。例如,閾值T可設(shè)為字符筆劃厚度的2.5倍。字符筆劃厚度W用多式W=BP/(BP—WP)來計算,其中BP為輸入圖象內(nèi)黑色素的數(shù)目,而WP則是下述黑色素的數(shù)目,即其在一與色素列成一行的2×2窗口內(nèi)的三個鄰近色素也是黑色的。一個根據(jù)本發(fā)明所述的自輸入字符圖象中獲取2MN個特性值的優(yōu)選實例在圖2A至2C中得到說明。還有,對于旋轉(zhuǎn)了45°的輸入圖象圖形,新的2MN個特性值可應(yīng)用與上述相同的方法計算出。從旋轉(zhuǎn)了的圖象中抽取的水平和垂直分量對應(yīng)于原圖象的對角線上的分量。結(jié)果,便需計算含4Mn個值的特性值。
代表矢存儲器40存儲單個識別目標字符的代表特性矢,這樣的字符對于手寫朝文來說共有2350個,而這些代表特性矢中的每一個是通過對一識別目標字符的樣品圖形的所有特性矢取平均得到的。所列樣品越多,通過上述平均所得到的代表矢也就越可靠。
粗分類部分50在存儲在代表矢存儲器40里的代表矢集中尋找一與自輸入字符所得的特性矢最相似的代表矢。自輸入字符圖形中抽取的一個特性矢V與代表矢集中的一個代表矢Mi之間的相似性Si用在分布有這些特性值的空間中的距離來度里,并可表述為SiΣj1n|vj-mi|j]]>式中V=(V1,V2,V3,…,Vn),Mi=(mi1,mi2,Mi3,…min),n=4MN,而1≤i≤2350。由此可見,Si較小時兩矢量的相似性較大?;诖耸聦崳色@得具有最高相似性的代表矢。
候選字符群存儲器30存儲識別目標字符的候選字符群,而候選字符群則根據(jù)下述方法確定。為了確定候選字符群,可使用由于與練習(xí)樣品的模板匹配而產(chǎn)生的混同矩陣。假設(shè)一字符Cj而不是Ci偶爾被包括進由模板匹配識別為特定字符Ci的若干字符出中。如圖3所示,由于字符“亻卜“和“ス卜”的某些練習(xí)樣品的與字符“フ”的代表矢的相似性比起與對應(yīng)于每個字符(“亻卜“和“ス卜”)的代表矢要高,因而這些字符會被錯誤地識別為“フ卜”。有關(guān)該錯識字符的信息由每個字符收集,然后,這些字符被按照頻率順序排列,并在錯識字符當中選出一些具有較高頻率的字符,以便Ci的候選字符群可以建造出來。結(jié)果,先前建造的候選字符群便被存儲在候選字符群存儲器30中。根據(jù)本發(fā)明的一個優(yōu)選實施例,正確識別率,即對于一給定樣品字符圖形的識別目標字符被裝在由模板匹配發(fā)現(xiàn)的候選字符群中的概率在99%以上,而每一字符群的大小則被限制在20個字符或少一些。
如上所述,粗分類部分50獲得一個輸入字符圖形的特性矢并在代表矢存儲器40中尋找與所得特性矢最相似的代表矢。再有,可利用候選字符群存儲器30完成尋找對應(yīng)于所選代表矢的字符及含比字符的相關(guān)候選字符群。
神經(jīng)網(wǎng)絡(luò)存儲器60存儲從由粗分類部分找到的候選字符群中最后尋找一個字符的若干神經(jīng)網(wǎng)絡(luò),且每一神經(jīng)網(wǎng)絡(luò)以如下方式建造。
首先,由有限個坐標構(gòu)成的矢量作為神經(jīng)網(wǎng)絡(luò)的與字符圖形有關(guān)的一個特性被用統(tǒng)計方法計算出。為了抽取在神經(jīng)網(wǎng)絡(luò)中所用的特性,象在粗分類部分50中的特性矢的情形那樣,字符圖形沿水平和垂直方向被非線性地分成N×M個格子。此后,對每一色素獲得水平黑色素運行與垂直黑色素運行的比質(zhì)以該計算格子特性值。抽取在神經(jīng)網(wǎng)絡(luò)中所用的特性的優(yōu)選實施例在圖4中有說明。首先,字符圖形沿水平和垂直方向被非線性地分成N×M個格子,從而得到穿過黑色素Px,y的水平和垂直運行的長度RLHx,y和RLVx,y(o≤x≤w和o≤y≤H,其中w為字符圖形的寬度,H為字符圖形的高度)。然后,顯示在Px,y處沿水平和垂直方向的貢獻程度的DCHx,y和DCVx,y由下式算得DCHxyRLHxyRLHxy′RLVxy]]>DCVxyRLVxyRLHxy′RLVxy]]>
最后,一個2(N×M)維特性矢可由相對于在外線性分成的N×M個格中存在的所有黑色素的DCHx,y和DCVx,y的平均值計算出。此外,新的2(N×M)維特性矢可通過應(yīng)用上述方法于白色素算出,從而獲得一個4(N×M)維特性矢。
在本發(fā)明中所采用的神經(jīng)網(wǎng)絡(luò)的構(gòu)造如圖5所示。這里,輸入節(jié)點數(shù)為4(N×M),對應(yīng)于自輸入字符圖象中抽取的特性值的數(shù)目。而且,一輸出層由與識別目標字符數(shù)一樣多的節(jié)點組成,且中間節(jié)點數(shù)為輸出節(jié)點數(shù)的兩部另加1。這里,一個改錯節(jié)點用于輸出和中間層的每一個。一個使用圖5的神經(jīng)網(wǎng)絡(luò)識別手寫朝文字符的優(yōu)選實施例如圖6所示。
神經(jīng)網(wǎng)絡(luò)存儲器60由上述神經(jīng)網(wǎng)絡(luò)組成。這里,神經(jīng)網(wǎng)絡(luò)存儲器中的神經(jīng)網(wǎng)絡(luò)的數(shù)目與候選字符群存儲器內(nèi)的候選字符群的數(shù)目相同,因而也與識別目標字符數(shù)相同。神經(jīng)網(wǎng)絡(luò)可以通過與屬于相關(guān)候選字符群的樣品一起學(xué)習(xí)來增加識別程度。
細分類部分70自對應(yīng)于在粗分類部分50中找到的輸入字符圖形的候選字符群中最后找出一個字符,從而識別手寫字符。識別完后,一個控制信號被提供給預(yù)處理部分20,以便下一個擬被識別的字符圖形被提供至粗分類部分50。
根據(jù)本發(fā)明,對應(yīng)于一完整的含2350個朝文字符集或其P分集的手寫字符被用作一個識別目標。為了測驗本發(fā)明的方法和設(shè)備的效能,可建一個將990個最常用朝文字符用作受驗對象的識別系統(tǒng)。該系統(tǒng)的組成部發(fā)包括990個7×7×4維代表矢、990個候選字符群(其中的每一個平均由5.7個候選字符組成)、990個平均尺寸為(7×7×4)×12.4×5.7的神經(jīng)網(wǎng)絡(luò)、輸入部分、預(yù)處理部分、粗處理部分和細處理部分。作為一個實驗,在這個建造的系統(tǒng)適應(yīng)了69300個字符,即對應(yīng)著一共99000個手寫字符數(shù)據(jù)字符的70%之后(參見刊載在1993年版《第二屆文件分析和識別目標會議會刊》(日本Tsukuba)第470至473頁上的由D.H.Kin和S.Y.Bang撰寫的“手寫朝鮮語字符圖象數(shù)據(jù)庫PE92”一文),余下的29700個字符被決定由該系統(tǒng)來識別。結(jié)果,發(fā)現(xiàn)正確識別率為90%。
根據(jù)本發(fā)明的識別手寫朝文字符的方法和設(shè)備,用任何書寫工具寫在任何表面上的朝文字符可以自動得以識別。因此,大量書寫的信息可被自動輸進計算機或大量郵件可被自動分類。因此,依賴手工操作的工作,如將現(xiàn)存文件的內(nèi)容和新信息輸進計算機,可實現(xiàn)自動化,從而可在時間、勞力和財力方面創(chuàng)造巨大效益。
權(quán)利要求
1.一種由下述步驟組成的識別手寫字符的方法,包括下列步驟將一個字符圖象作為大小為I×J的尺寸塊或來接收;應(yīng)用統(tǒng)計方法計算一個由有限個坐標構(gòu)成的特性矢,作為對應(yīng)于所述輸入字符圖象中的圖形的一個特性;在對應(yīng)于識別目標字符的代表矢集內(nèi)尋找一個與所述計算出的特性矢最相似的代表矢;獲得一個對應(yīng)于所述尋找到的代表矢的字符及與該字符相關(guān)的候選字符群;和通過神經(jīng)網(wǎng)絡(luò)將所述獲得的候選字符群中的一個字符作為最后識別結(jié)果輸出,而其中的神經(jīng)網(wǎng)是通過使用由有限個坐標構(gòu)成的對應(yīng)于所述候選字符群的字符圖形的特性矢排列而成的。
2.一種根據(jù)權(quán)利要求1所述的識別手寫字符的方法,其中所述計算所述特性矢的步驟包括下述步驟(a)將會I行和J列的I×J輸入圖象分成M個垂直條和N個水平條,從而形成N×M個非線性分出的格子,其中I≥M,J≥N,并I,J,M和N均為自然數(shù);(b)對每一個分出的格子應(yīng)用下列方程Fv=Bv/BP和FH=BH/BP來計算垂直方向分量值Fv和水平方向分量值FH的總線為2MN的特性值,式中,BP為輸入圖象內(nèi)的黑色素數(shù),Bv為每一格子內(nèi)屬于垂直方向分量的黑色素數(shù),而BH則為每格內(nèi)屬于水平方向分量的黑色素數(shù);(c)通過將所述步驟(a)和(b)應(yīng)用于一個旋轉(zhuǎn)了45°的輸入圖象圖形可計算2MN個新特性矢;和(d)將與所述垂直、水平和對角線有關(guān)的4MN個特性矢作為輸入字符圖形的特性矢來提供。
3.一種根據(jù)權(quán)利要求2所述的識別手寫字符的方法,其中所述垂直和水平方向分量為由在若干垂直和水平方向的黑色素運行中其長度比閾值T為大的那些運行所組成的運行。
4.一種根據(jù)權(quán)利要求3所述的識別手寫字符的方法,其中所述閾值T是根據(jù)一個W的因子來動態(tài)地獲得的,這里W為要識別的字符的筆劃厚度。
5.一種根據(jù)權(quán)利要求4所述的識別手寫字符的方法,其中所述字符筆劃厚度W由式W=BP/(BP—WP)來計算,式中BP為輸入圖象內(nèi)的黑色素數(shù),WP為其在一個與色素排成釘?shù)?×2窗口中的三個鄰近色素也為黑色的黑色素的數(shù)目。
6.一種根據(jù)權(quán)利要求1所述的識別手寫字符的方法,其中所述候選字符群通過下述步驟來構(gòu)造收集有關(guān)識為字符Ci的錯識字符Cj的信息,其中的錯誤是由于Cj的特性矢與Ci的代表矢之間的距離小于Cj的特性矢與Cj的代表矢之間的距離造成的;將錯識字符按頻率順序排列;并在錯識字符中確定出一些高頻率的字符作為Ci的候選字符群。
7.一種根據(jù)權(quán)利要求1所述的識別手寫字符的方法,其中計算所述神經(jīng)網(wǎng)絡(luò)的輸出的特性矢是通過下列步驟來計算的(a)將字符圖象劃分成N×M個沿水平和垂直方向的格子;(b)獲得穿過黑色素Px,y的水平和垂直運行的長度RLHx,y和RLVx,y,其中o≤x≤W,o≤y≤H,這里,W為字符圖象的寬度而H則為其高度;(c)應(yīng)用下列公式計算表示在Px,y處理水平和垂直方向的貢獻程度的DCHx,y和DCVx,yDCHxyRLHxyRLHxy′RLVxy]]>DCVxyRLVxyRLHxy′RLVxy;]]>(d)根據(jù)相對于落在經(jīng)非線性分開的N×M個格子內(nèi)的所有黑色素的DCHx,y和DCVx,y的平均值計算2(N×M)維特性矢;和(e)通過將所述步驟(a)到(d)應(yīng)用于白色素計算出新的2(N×M)維特性矢,從而獲得一個4(N×M)維特性矢。
8.一種識別手寫字符的設(shè)備,包括一個將手寫文件圖象數(shù)字化為二進制圖象的輸入部分;一個分割所輸入的二進制圖象以便以一個字符為單位來輸出的預(yù)處理部分;一個存儲候選字符群的候選字符群存儲器,其中每一個候選字符群代表每一個識別目標字符且由包括識別目標字符在內(nèi)的若干候選字符構(gòu)成;一個存儲所有對應(yīng)于所有識別目標字符的特性矢的代表矢存儲器;一個粗分類部分,用來獲得經(jīng)由所述預(yù)處理部分輸入的字符圖形的特性矢,尋找與來自所述代表矢存儲器的所得到的特性矢最相似的代表矢,及尋找對應(yīng)于所找到的代表矢的識別目標字符和來自所述候選字符群存儲器的含該識別目標字符的相關(guān)候選字符群;一個由所有神經(jīng)網(wǎng)絡(luò)組成的神經(jīng)網(wǎng)絡(luò)存儲器,其中每一神經(jīng)網(wǎng)絡(luò)對應(yīng)著存儲在所述候選字符群存儲器中的每一候選字符群;和一個細分類部分,用來從通過存儲在所述神經(jīng)網(wǎng)絡(luò)存儲器中的相應(yīng)神經(jīng)網(wǎng)絡(luò)在所述粗分類部分中所找到的候選字符群中識別一個字符,并用來向所述預(yù)處理部分施中一個控制信號以提供下一個要識別的字符直到輸入文件圖象中的所有字符都得到了識別。
全文摘要
一種識別手寫朝鮮文字符的方法包括下列步驟將一個字符圖像作為一個I×J的尺寸塊來接收;應(yīng)用統(tǒng)計方法并根據(jù)輸入字符圖像計算一個由有限個坐標構(gòu)成的特性矢;在對應(yīng)于識別目標字符的代表矢集內(nèi)尋代一個與所算得的特性矢量相似的代表矢;獲得一個對應(yīng)于所找到的代表矢的字符及與該字符相關(guān)的候選字符群;和通過神經(jīng)網(wǎng)絡(luò)將所得的候選字符群中的一個字符作為最后識別結(jié)果輸出。
文檔編號G06K9/66GK1118902SQ9510777
公開日1996年3月20日 申請日期1995年6月28日 優(yōu)先權(quán)日1994年8月17日
發(fā)明者金壽衡, 都鼎仁, 金俊鎬, 李相奎 申請人:三星電子株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
贵溪市| 安远县| 陇西县| 青岛市| 安达市| 股票| 宜丰县| 平武县| 崇仁县| 江北区| 元朗区| 文安县| 颍上县| 东方市| 十堰市| 新乡市| 九龙坡区| 孝昌县| 兴国县| 花垣县| 宜宾县| 新巴尔虎右旗| 临邑县| 襄汾县| 大宁县| 龙山县| 杨浦区| 临城县| 黑山县| 武邑县| 新宾| 塔河县| 盐源县| 闻喜县| 夹江县| 京山县| 博野县| 虹口区| 大竹县| 定襄县| 阿巴嘎旗|