两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

灰度字符的精確分割裝置及方法

文檔序號:6516088閱讀:208來源:國知局
專利名稱:灰度字符的精確分割裝置及方法
技術領域
本發(fā)明涉及一種灰度字符的分割裝置及方法,具體地,涉及在經(jīng)過粗略分割的低分辨率灰度文本行圖像中對單個字符進行精確分割的方法和裝置。
背景技術
字符分割是字符識別的在先步驟之一,現(xiàn)在已有許多與該技術相關的論文和專利。比如Y.Lu,“Machine Printed Character Segmentation-An Overview”.Pattern Recognition,Vol.28,no.1,pp.67-80,Jan,1995;S.W.Lee,D.J.Lee,H.S.Park,“A New Methodology for Gray-ScaleCharacter Segmentation and Recognition”.IEEE transaction on patternanalysis and machine intelligence,Vol.18,no.10,pp.1045-1050,Oct,1996;Kamitani的美國專利No.6,327,385“Character segmentation deviceand character segmentation system”;Hanson的美國專利No.5,692,069“Apparatus for performingcharacter segmentation using slant histograms”;以及Tan的美國專利No.5,172,422“Fast character segmentation ofskewed text lines for optical character recognition”等。
以上論文和專利講的都是如何處理互相接觸的字符,其中許多方法都應用二值的字符圖像,這些方法應用在低分辨率圖像中會引起很多分割誤差。目前,沒有一篇論文或一項專利涉及低分辨率灰度字符的分割。
低分辨率字符的識別相當困難,而灰度特征法是可能的解決方法之一。但是如果字符未經(jīng)過精確分割,那么從圖像中提取的特征的效果會很差。所以,對低分辨率字符進行精確分割是成功提取灰度特征的必要步驟。
低分辨率字符的圖像尺寸一般小于20*20象素,且字符的真實邊界往往位于一個象素點以內(nèi)。因此,對真實字符的邊界進行精確定位對于之后的特征提取模塊至關重要。很顯然,需要一種能夠?qū)Φ头直媛实幕叶茸址麍D像進行精確分割的方法和裝置。

發(fā)明內(nèi)容
本發(fā)明鑒于現(xiàn)有技術的上述缺點產(chǎn)生,目的是提供一種灰度字符的精確分割裝置及方法。
根據(jù)本發(fā)明的一個方面,本發(fā)明提供了一種灰度字符精確分割裝置,包括調(diào)整分割單元,用于對輸入的經(jīng)粗略分割的低分辨率灰度文本行圖像中的單個字符圖像進行調(diào)整分割,從而產(chǎn)生經(jīng)調(diào)整分割的字符圖像;字符圖像二值化單元,用于根據(jù)輸入的所述經(jīng)調(diào)整分割的字符圖像生成二值字符圖像;消噪單元,用于消除所述字符圖像二值化單元生成的二值字符圖像中的噪聲信息;最終字符圖像分割單元,用于根據(jù)被消除了噪聲信息的所述二值字符圖像產(chǎn)生精確分割的字符圖像。
優(yōu)選地,還包括放大單元,設置在所述調(diào)整分割單元和所述字符圖像二值化單元之間,用于在所述調(diào)整分割單元產(chǎn)生的經(jīng)調(diào)整分割的字符圖像輸入所述字符圖像二值化單元之前,放大所述經(jīng)調(diào)整分割的字符圖像。
優(yōu)選地,還包括字符圖像增強單元,設置在所述調(diào)整分割單元和所述字符圖像二值化單元之間,用于在所述調(diào)整分割單元產(chǎn)生的經(jīng)調(diào)整分割的字符圖像輸入所述字符圖像二值化單元之前,對所述經(jīng)調(diào)整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
優(yōu)選地,還包括字符圖像增強單元,設置在所述放大單元和所述字符圖像二值化單元之間,用于在被所述放大單元放大了的所述經(jīng)調(diào)整分割的字符圖像輸入所述字符圖像二值化單元之前,對被放大了的所述經(jīng)調(diào)整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
優(yōu)選地,所述調(diào)整分割單元包括文本行方向檢測單元,用于檢測所述文本行圖像中文本行的方向;字符圖像大小計算單元,用于計算字符圖像的大??;字符圖像調(diào)整單元,根據(jù)所述文本行方向檢測單元的檢測結(jié)果和所述字符圖像大小計算單元的計算結(jié)果,對字符圖像進行調(diào)整,使字符圖像包括字符的全部筆畫。
優(yōu)選地,所述字符圖像增強單元包括背景象素值估算單元,用于估算所述字符圖像的背景象素值;背景消除單元,用于根據(jù)所述背景象素值估算單元的估算結(jié)果消除所述字符圖像的背景;象素值增強單元,用于增強消除背景之后的字符圖像的象素值。
優(yōu)選地,所述背景象素值估算單元使用直方圖法估算背景象素值。
優(yōu)選地,所述象素值增強單元使用S型函數(shù)增強消除背景之后的字符圖像的象素值。
優(yōu)選地,所述消噪單元包括連接組件分析單元,用于對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件的個數(shù);噪聲連接組件判斷單元,用于判斷一連接組件是否為噪聲連接組件;噪聲連接組件消除單元,用于消除所述二值字符圖像中的被所述噪聲連接組件判斷單元判斷為噪聲連接組件的連接組件。
優(yōu)選地,所述噪聲連接組件判斷單元根據(jù)以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度;連接組件的邊界距所述二值字符圖像邊界的距離<閾值;如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
優(yōu)選地,所述比例尺度為3或4。
根據(jù)本發(fā)明的另一方面,還提供了一種對經(jīng)粗略分割的文本行圖像中的單個灰度字符進行精確分割的方法,包括以下步驟調(diào)整分割步驟,用于對輸入的經(jīng)粗略分割的低分辨率灰度文本行圖像中的單個字符圖像進行調(diào)整分割,從而產(chǎn)生經(jīng)調(diào)整分割的字符圖像;字符圖像二值化步驟,用于對所述調(diào)整分割步驟處理過的字符圖像進行二值化;消噪步驟,用于消除經(jīng)所述二值化步驟生成的二值字符圖像中的噪聲信息;最終字符圖像分割步驟,用于從被消除了噪聲信息的所述二值字符圖像中產(chǎn)生精確分割的字符圖像。
優(yōu)選地,包括放大步驟,用于放大所述分割調(diào)整步驟產(chǎn)生的經(jīng)調(diào)整分割的字符圖像。
優(yōu)選地,包括字符圖像增強步驟,用于對經(jīng)所述放大步驟放大了的所述經(jīng)調(diào)整的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
其中,所述調(diào)整分割步驟包括文本行方向檢測步驟,用于檢測文本行的方向;字符圖像大小計算步驟,用于計算字符圖像的大??;字符圖像調(diào)整步驟,根據(jù)所述文本行方向檢測步驟的檢測結(jié)果和所述字符圖像大小計算步驟的計算結(jié)果,對字符圖像進行調(diào)整,使字符圖像包括字符的全部筆畫。
其中,所述字符圖像增強步驟包括背景象素值估算步驟,用于估算字符圖像的背景象素值;背景消除步驟,用于根據(jù)所述背景象素值估算步驟的估算結(jié)果消除所述字符圖像的背景;象素值增強步驟,用于增強消除背景之后的字符圖像的象素值。
其中,在所述背景象素值估算步驟中使用直方圖法估算背景象素值。
其中,在所述象素值增強步驟中使用S型函數(shù)來增強消除背景之后的字符圖像的象素值。
其中,所述消噪步驟包括連接組件分析步驟,用于對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件中的個數(shù);噪聲連接組件判斷步驟,用于判斷一連接組件是否為噪聲連接組件;消除步驟,消除所述二值字符圖像中被所述噪聲連接組件判斷步驟判斷為噪聲連接組件的連接組件。
其中,在所述噪聲連接組件判斷步驟中根據(jù)以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度;連接組件的邊界距所述二值字符圖像邊界的距離<閾值;如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
本發(fā)明能夠精確得到低分辨率字符圖像中字符的邊界,從而可以有效地進行字符圖像的分割,為有效進行字符識別的后續(xù)步驟(例如字符特征提取)提供保證。


圖1是本發(fā)明的灰度字符精確分割裝置的示意方框圖;圖2是圖1中的調(diào)整分割放大單元的工作流程圖;圖3是圖1中的字符圖像增強及二值化單元的工作流程圖;圖4是圖1中的消噪單元的詳細工作流程圖;圖5是最終字符圖像分割單元的詳細工作流程圖;圖6-1示出了所輸入的粗略分割的字符圖像;圖6-2是粗略分割調(diào)整的結(jié)果;圖6-3是消除背景象素的結(jié)果;圖6-4是二值化的結(jié)果;圖6-5是消噪后的結(jié)果;圖6-6是最終經(jīng)過分割的字符圖像結(jié)果。
具體實施例方式
下面結(jié)合附圖詳細說明本發(fā)明的原理和優(yōu)選實施例。
本發(fā)明用于在已知一幅低分辨率的文本行圖像以及該文本行圖像中各個字符的粗略分割結(jié)果后,對各個字符進行精確的分割。經(jīng)過這樣分割的字符可以用于字符識別中的特征提取。粗略分割可以由手工大致框定字符的邊界來完成,也可以利用圖像的二值化結(jié)果來自動得到。這個框定的邊界有可能包含很多背景區(qū)域,也可能把一個字符的部分邊界分割開來。精確分割就是精確找到一個字符的上下左右邊界。
圖1是本發(fā)明的灰度字符精確分割裝置的示意方框圖。如圖1所示,根據(jù)本發(fā)明的灰度字符精確分割裝置包括調(diào)整分割放大單元102、字符圖像增強及二值化單元103、消噪單元104、最終字符圖像分割單元105。其輸入為經(jīng)粗略分割的低分辨率灰度文本行圖像101,其輸出為經(jīng)過精確分割的字符圖像106。應該注意到,上述的單元只是示例性的,不是對本發(fā)明的限制,調(diào)整分割放大單元102可進一步細分為調(diào)整分割單元以及放大單元,而字符圖像增強及二值化單元103也可進一步細分為字符圖像增強單元和字符圖像二值化單元,并且,字符圖像增強單元還可進一步細分為背景象素值估算單元、背景象素值消除單元和象素值增強單元。另外,調(diào)整分割放大單元可由文本行方向檢測單元、字符大小計算單元、字符圖像調(diào)整單元等構(gòu)成。消噪單元可進一步分成連接組件分析單元、噪聲連接組件判斷單元和噪聲連接組件消除單元。
如上所述,字符圖像的粗略分割可以通過手工或者利用現(xiàn)有技術通過對二值化后的圖像自動分割得到。隨后調(diào)整分割放大單元102對所輸入的低分辨率文本行圖像的粗略分割的結(jié)果進行調(diào)整,然后由字符圖像增強及二值化單元103進行字符圖像增強及二值化,并由消噪單元104進行消噪,以生成無噪聲的二值字符圖像。最后,由最終字符圖像分割單元105進行最終字符圖像分割,找出在消噪單元104中生成的二值字符圖像的字符的邊界,在放大的灰度圖像中顯示出真正的字符邊界,并進行提取。最終字符圖像分割單元105的輸出結(jié)果即是經(jīng)過精確分割的字符圖像106。
下面結(jié)合圖2到圖5詳細說明上述各單元102-105中的操作。
在調(diào)整分割放大單元102中,首先利用所輸入的文本行圖像中各個字符的前后字符的粗略分割結(jié)果(參見圖6-1),對該字符的邊界范圍進行調(diào)整,然后對經(jīng)過調(diào)整的圖像內(nèi)容進行提取(分割)和放大,從而真實字符的圖像全部落在輸出的已放大的灰度字符圖像中。
圖2示出了圖1中的調(diào)整分割放大單元102的具體工作流程。該調(diào)整分割放大單元的輸入是經(jīng)粗略分割的低分辨率灰度文本行圖像101。具體地,包括經(jīng)粗略分割的當前字符圖像之前的字符圖像S201、當前字符圖像S202和當前字符圖像S202之后的字符圖像S203。由于一個字符圖像的邊界調(diào)整涉及到其前一個字符圖像和后一個字符圖像的邊界,因而首先由調(diào)整放大單元102的文本行方向檢測單元(未示出)進行文本行方向檢測(步驟S204)。如果是橫向的文本行,在調(diào)整字符圖像的左右邊界時,調(diào)整以后的邊界不應該過多超過其左右字符圖像的邊界范圍。如果是縱向的文本行,在調(diào)整上下邊界時,調(diào)整以后的邊界不應該過多超過上下字符圖像的邊界范圍。文本行方向檢測的檢測方法為1)利用所述文本行(例如上述三個字符)的粗略分割結(jié)果確定該文本行的邊界框。上述的粗略分割的結(jié)果就是各字符圖像的邊界框(可參見圖6-1),由一個矩形的框來代表,寬度就是矩形的寬度,高度就是矩形的高度??梢岳矛F(xiàn)有的技術,通過找出這些字符(例如該三個字符)的邊界框的最左、最右、最上、最下的坐標,而限定新的邊界框。該邊界框就是文本行邊界框。
2)計算文本行邊界框的寬度和高度。
3)如果寬度>高度,則該文本行為水平文本行,反之為垂直文本行。
在判斷出文本行圖像中的文本行的方向之后,在優(yōu)選實施例中,隨即確定文本行的調(diào)整順序。如果文本行方向為水平方向,即輸入的是水平文本行,則先進行左右順序的字符邊界調(diào)整,然后進行上下順序的字符調(diào)整。如果文本行方向不是水平方向,即輸入的是垂直文本行,則先進行上下順序的字符邊界調(diào)整,再進行左右順序的字符調(diào)整。應該注意到,上述的調(diào)整順序是可以改變的。
接著由調(diào)整分割放大單元的字符圖像大小計算單元(未示出)計算字符圖像的大小。設當前字符圖像之前的字符圖像經(jīng)粗略分割的左、右、上、下邊界為xs_p,xe_p,ys_p,ye_p,當前字符圖像經(jīng)粗略分割的左、右、上、下邊界為xs_c,xe_c,ys_c,ye_c,當前字符圖像之后的字符圖像經(jīng)粗略分割的左、右、上、下邊界為xs_n,xe_n,ys_n,ye_n.;當前字符圖像經(jīng)粗略分割的寬和高分別為width_c,height_c,當前字符的尺寸為size_c(即imagesize)。則如果width_c>height_c則size_c=width_c否則size_c=height_c隨后由調(diào)整分割放大單元102的字符圖像調(diào)整單元對字符圖像的邊界進行調(diào)整。此處再假定當前字符圖像經(jīng)過邊界調(diào)整的左、右、上、下邊界為xs_cl,xe_cl,ys_cl,ye_cl。
調(diào)整的原則是對于水平文本行,將一個字符圖像的左邊界和右邊界進行擴大,但不能過多包括其左右兩側(cè)的字符。上下邊界的范圍也要放寬一定程度以防止粗略分割把一個字符切成了2部分。放寬的程度根據(jù)字符尺寸size_c的一定比例決定。對于垂直文本行,將一個字符圖像的上下邊界進行擴大,但也不要過多包括其上下兩側(cè)的字符圖像,并且其左右邊界的范圍也要放寬一定程度以防止粗略分割把一個字符切成了2部分。最后要求的效果是,即使粗略分割把一個字符的一部分誤分在粗分割的范圍之外,經(jīng)過調(diào)整以后的分割結(jié)果也能夠完整地包含該字符的所有部分。
如果文本行經(jīng)檢測為水平文本行,則進行字符左邊界調(diào)整(步驟S206)、字符右邊界調(diào)整(步驟S207)、字符上邊界調(diào)整(步驟S208)和下字符邊界調(diào)整(步驟S209)對當前字符的左、右、上、下邊界進行調(diào)整。在下面的描述中,假設圖像的左上角是坐標的原點,y的方向是沿坐標原點向下的方向,x的方向是沿坐標原點向右的方向。
步驟S206的字符圖像左邊界的調(diào)整規(guī)則為如果xe_p<=xs_c則xs_cl=xe_p否則xs_cl=xs_c步驟S207的字符圖像右邊界的調(diào)整規(guī)則為如果xe_c<xs_n則xe_cl=xs_n否則xe_cl=xe_c步驟S208的字符圖像上邊界的調(diào)整規(guī)則為如果ys_c-r*size_c>=0則ys_cl=y(tǒng)s_c-r*size_c否則
ys_cl=0S209單元的字符圖像下邊界的調(diào)整規(guī)則為如果ye_c+r*size_c<=文本行的高度則ye_cl=y(tǒng)e_c+r*size_c否則ye_cl=文本行的高度在S208和S209單元中,r是控制調(diào)整的參數(shù)。比如r可以取值為0.2。
類似地,如果文本行經(jīng)檢測為豎直文本行,則進行字符上邊界調(diào)整(步驟S210)、字符下邊界調(diào)整(步驟S211)、字符左邊界調(diào)整單元(步驟S212)和字符右邊界調(diào)整(步驟S213)對當前字符的上、下、左、右邊界進行調(diào)整。
步驟S210的調(diào)整規(guī)則為如果ye_p<ys_c則ys_cl=y(tǒng)e_p否則ys_cl=y(tǒng)s_c步驟S211的調(diào)整規(guī)則為如果ye_c<ys_n則ye_cl=y(tǒng)s_n否則ye_cl=y(tǒng)e_c步驟S212的調(diào)整規(guī)則為如果xs_c-r*size_c>0則xs_cl=xs_c-r*size_c否則xs_cl=0步驟S213的調(diào)整規(guī)則為如果xe_c+r*size_c<文本行寬度則xe_cl=xe_c+r*size_c否則xe_cl=文本行寬度在步驟S212和S213中,r是控制調(diào)整的參數(shù)。比如r可以取值為0.2。
經(jīng)過調(diào)整之后,由xs_cl,xe_cl,ys_cl和ye_cl所界定的字符圖像的圖像內(nèi)容被從文本行中切割出來(步驟S214)。這4個值確定了一個矩形的左右上下邊界,文本圖像中用這個矩形定義的邊界就是所需要的部分,把這個部分的內(nèi)容拷貝下來就是切割的過程。然后切割出來的字符圖像將被放大到原尺寸的N倍(步驟S215)。圖像放大算法可以參見岡薩雷斯,《數(shù)字圖像處理(第二版)》,阮秋琦,阮宇智等譯。電子工業(yè)出版社,2003年3月第一版,第50頁。例如,N可以取值為4。調(diào)整分割放大的輸出就是經(jīng)過放大的灰度字符圖像S216(可參見圖6-3)。
應該注意上述的調(diào)整方法只是示例性的,也可以采用本領域技術人員所知的其它調(diào)整方法,只要這些方法可以使字符的真正邊界全部落入調(diào)整以后的字符邊界框內(nèi)部。
圖3是圖1中的字符圖像增強及二值化單元的工作流程圖。字符圖像增強的目的是為了讓字符圖像中的低分辨率下模糊的字符筆畫變得清晰,如果不進行字符圖像增強,后續(xù)的識別效果不好。如圖3所示,在字符圖像增強和二值化單元中,首先由背景象素值估算單元來估算背景象素值(S301)。這可以使用經(jīng)過放大的字符圖像S216的灰度直方圖來獲得。圖像中灰度直方圖的計算方法可以參照章毓晉編著,“圖像處理和分析”,清華大學出版社,1991年3月。該直方圖中的最大值對應的象素值就作為背景象素值。然后在步驟S302中由背景消除單元來消除背景。如果假設字符象素點的理想象素值是255的話,消除背景就是找出所有的背景象素點,并把背景象素點的象素值設置成0。具體地,假設該背景象素值為Vbk,例如在背景色較亮的情況下,檢查輸入的圖像中的所有的象素點,如果一個象素點的灰度值大于Vbk,那么把該象素點的灰度值設置為Vbk,如果一個象素點的灰度值小于Vbk,那么該點的灰度值不變。前面假設的情況是字符的象素值低于背景的象素值,如果背景象素點的象素值低于字符象素點的象素值,即在背景色較暗的情況下,也可采用類似的處理,將灰度值小于Vbk的象素點的灰度值設置為Vbk,而保留灰度值大于Vbk的象素點,從而消除背景(S302)(參見圖6-3)。之后,通過一個S型函數(shù)來增強消除了背景的灰度圖像的象素值(S303),增強的算法如下1、假設一個象素點的灰度值是g,首先對一幅圖像中的每一個象素點的灰度進行如下的變換f(g)=(exp((g-off)/t)-1)/(exp((g-off)/t)+1);其中off和t是變換的參數(shù),比如可以取off=0,t=96。
由于這個函數(shù)的形狀是S形,因此又叫作S型函數(shù)。
2、找出經(jīng)過變換以后的函數(shù)值的最大值和最小值max,min。
3、對每一個點的函數(shù)值進行如下操作g1=(f(g)-min)*255/(max-min);然后取g1的整數(shù)值,這個整數(shù)值就是經(jīng)過圖像增強以后的新的圖像中該點的灰度值。
在字符增強之后,根據(jù)一個給定的閾值Th,將被增強的灰度圖像二值化(步驟S304)。首先產(chǎn)生一幅新的圖像,該圖像的大小和原灰度圖像是一致的,新圖像象素點的取值由如下規(guī)則決定對經(jīng)過增強以后的圖像中的每一個象素點的灰度值進行判斷,如果灰度值大于Th,把新圖像中對應點的灰度值設置為255,反之設置為0。由于新圖像象素點的取值只可能有2種選擇0或者255,因此這個過程叫做二值化。二值化的結(jié)果是得出一幅二值字符圖像S305(參見圖6-4)。
通常,二值字符圖像在字符邊界附近會存在一些噪聲部分,它們可能是背景象素,或者是因不精確的前后字符粗略分割而誤劃進來的字符筆畫。本發(fā)明的方法要進行消噪處理,將這些噪聲消除。也就是說,經(jīng)過分割調(diào)整以后,雖然字符本身完全被包含在了調(diào)整的邊界以內(nèi),但是這個邊界內(nèi)可能還包含相鄰字符的部分筆畫。這些筆畫是噪聲信息,因此需要消去噪聲。
圖4是圖1中消噪單元104的消噪處理的詳細流程圖。如圖4所示,首先由消噪單元的連接組件分析單元對輸入的二值字符圖像(S305)的連接組件(CC)進行分析。找出每個連接組件包含的象素點,得到連接組件的總數(shù)(S401)。連接組件就是一幅二值圖像中彼此相連的象素的集合,比如“二”字里面有2個連接組件。圖像中連接組件分析算法可以參見岡薩雷斯,《數(shù)字圖像處理(第二版)》,第435頁,阮秋琦,阮宇智等譯。電子工業(yè)出版社,2003年3月第一版。
隨后由噪聲連接組件判斷單元對各連接組件是否為噪聲連接組件進行判斷。在進行是否為噪聲連接組件的判斷時,首先要計算連接組件的尺寸及其與字符邊界的距離。具體地,首先設置i=0(S402),其中i表示圖像中連接組件的索引號,i=0代表從第1個連接組件開始。然后從該第一個連接組件開始,獲得各個連接組件的外邊界框。連接組件中所有象素點的上下左右邊界就是連接組件的外邊界框。然后估計連接組件的尺寸Size,即取該連接組件的外邊界框的寬度值和高度值中的較大者(S403)。并得到第i個連接組件(ith CC)的外邊界框與字符圖像邊界(即xs_cl,xe_cl,ys_cl和ye_cl)之間的距離,將其規(guī)定為Distance(S404)。另外,假定字符圖像的大小為imagesize,即上文的字符圖像的尺寸,也就是字符圖像的寬度值和高度值中的較大者。然后對該連接組件進行是否為噪聲連接組件的判斷(S405),并在被判斷為噪聲連接組件的情況下,消除該連接組件(S406)。即如果一個連接組件滿足了如下兩個條件,那么該連接組件就被認為是一個噪聲連接組件,將被從二值字符圖像中消除。
兩個條件如下1、Size<imagesize/N12、Distance<N2其中,N1是一個比例尺度,比如N1=3,N2是距離的一個閾值。即如果一個連接組件尺度很小(例如小于字符圖像尺寸的1/3),本身距離字符邊界的距離小于一定的閾值,那么這個組件就是噪聲連接組件。
由噪聲連接組件消除單元來消除噪聲連接組件,消除噪聲連接組件的方法如下1、創(chuàng)建一個新的和原來二值圖像一樣大小的圖像,把新圖像中所有象素點的值都設置為0。
2、對于原來二值圖像中的非噪聲連接組件(包括尚未判斷的連接組件)中的每一個象素點,把新的圖像中對應象素點的灰度值設置為255。
新的圖像就是消除了該噪聲連接組件的字符圖像。
二值字符圖像中所有的連接組件都要進行上述的尺寸計算、距離估算、噪聲連接組件判斷并在被判斷為噪聲連接組件時進行消除等步驟,最終輸出二值化的無噪聲字符圖像S409(參見圖6-5)。
具體地,噪聲連接組件的判斷和噪聲連接組件的消除的步驟為在步驟S403中估算連接組件的尺寸,在步驟S404中估算該連接組件與邊界的距離,然后在步驟S405中對連接組件是否滿足上述兩個條件進行判斷,如果不滿足這兩個條件,則過程進入步驟S407,通過將i值加1來指定下一連接組件,并進入步驟S408。如果滿足了這兩個條件,則判斷這個連接組件為噪聲連接組件,并在步驟S406中將其消除,隨后再進入步驟S407,指定下一連接組件,并進入步驟S408。在步驟S408中,判斷是否已分析完所有的連接組件(圖中的nCC表示組件總數(shù)),如果未分析完,則進入步驟S403,從步驟S403開始進行所指定的連接組件的分析,如果分析完了所有的連接組件,則輸出經(jīng)過消噪的二值字符圖像(S409)。
圖5示出了最終字符圖像分割單元105的詳細工作流程圖。首先輸入經(jīng)過消噪的二值字符圖像(S409),并設置i=0(S501),其中i表示圖像中連接組件的索引號,i=0代表從第1個連接組件開始。然后求出該連接組件的外邊界框(S502),即找出該連接組件的所有象素點的最上,最左,最右和最下邊界。隨后判斷i是否等于0(步驟S503),如果等于0(步驟S503中的是),則將該連接組件的外邊界框設置為暫定字符邊界框(步驟S504)。否則(步驟S503中的否),在步驟S505中將該連接組件的邊界框與暫定字符邊界框進行合并。也就是說,最初始的暫定字符邊界框就是第一個連接組件的外邊界框,從第二個連接組件開始,進行的操作是合并2個邊界框,一個是當前的所有組件的外邊界框(從第一個到當前連接組件的前一個的組合,即暫定字符邊界框),一個是當前連接組件的外邊界框,從而得到新的暫定字符邊界框。合并步驟是找到2個邊界框的最上,最下,最左,和最右邊界。就是合并以后的外邊界框。然后在步驟S506中,通過將i值加1來指定下一連接組件,并在步驟S507中,判斷是否已處理完所有的連接組件,如為處理完,則過程返回步驟S502,重復以上步驟,直至處理完所有的連接組件,這時得到的暫定字符邊界框即所需的字符邊界框。然后,在已放大的灰度字符圖像S216中,提取出由該字符邊界框所框定的灰度內(nèi)容(S508),即用該字符邊界框定義的范圍從放大灰度圖像中把框定的圖像拷貝出來。即經(jīng)過精確分割的字符圖像,這就是本發(fā)明的最終輸出(參見圖6-6)。
圖6-1~6-6顯示出以上各單元的輸出結(jié)果圖6-1示出了所輸入的粗略分割;圖6-2是調(diào)整分割放大之后的結(jié)果;圖6-3是消除背景象素之后的結(jié)果;圖6-4是二值化之后的結(jié)果;圖6-5消噪之后的結(jié)果;圖6-6是最終經(jīng)過分割的字符圖像。
本發(fā)明能夠精確得到低分辨率圖像中字符的邊界,從而有效進行字符的分割,為字符識別的后續(xù)步驟,比如字符特征提取的有效性提供保證。
本領域的技術人員應明白,在不脫離本發(fā)明的精神和范圍的情況下,可以對本發(fā)明進行各種修改和變化。因而本發(fā)明覆蓋了落入所附的權利要求及其等同范圍內(nèi)的對本發(fā)明的所有修改和變化。
權利要求
1.一種灰度字符精確分割裝置,其特征在于,包括調(diào)整分割單元,用于對輸入的經(jīng)粗略分割的低分辨率灰度文本行圖像中的單個字符圖像進行調(diào)整分割,從而產(chǎn)生經(jīng)調(diào)整分割的字符圖像;字符圖像二值化單元,用于根據(jù)輸入的所述經(jīng)調(diào)整分割的字符圖像生成二值字符圖像;消噪單元,用于消除所述字符圖像二值化單元生成的二值字符圖像中的噪聲信息;最終字符圖像分割單元,用于根據(jù)被消除了噪聲信息的所述二值字符圖像產(chǎn)生精確分割的字符圖像。
2.根據(jù)權利要求1所述的灰度字符精確分割裝置,其中,還包括放大單元,設置在所述調(diào)整分割單元和所述字符圖像二值化單元之間,用于在所述調(diào)整分割單元產(chǎn)生的經(jīng)調(diào)整分割的字符圖像輸入所述字符圖像二值化單元之前,放大所述經(jīng)調(diào)整分割的字符圖像。
3.根據(jù)權利要求1所述的灰度字符精確分割裝置,其中,還包括字符圖像增強單元,設置在所述調(diào)整分割單元和所述字符圖像二值化單元之間,用于在所述調(diào)整分割單元產(chǎn)生的經(jīng)調(diào)整分割的字符圖像輸入所述字符圖像二值化單元之前,對所述經(jīng)調(diào)整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
4.根據(jù)權利要求2所述的灰度字符精確分割裝置,其中,還包括字符圖像增強單元,設置在所述放大單元和所述字符圖像二值化單元之間,用于在被所述放大單元放大了的所述經(jīng)調(diào)整分割的字符圖像輸入所述字符圖像二值化單元之前,對被放大了的所述經(jīng)調(diào)整分割的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
5.根據(jù)權利要求1到4任一項所述的灰度字符精確分割裝置,其中,所述調(diào)整分割單元包括文本行方向檢測單元,用于檢測所述文本行圖像中文本行的方向;字符圖像大小計算單元,用于計算字符圖像的大??;字符圖像調(diào)整單元,根據(jù)所述文本行方向檢測單元的檢測結(jié)果和所述字符圖像大小計算單元的計算結(jié)果,對字符圖像進行調(diào)整,使所述經(jīng)調(diào)整分割的字符圖像中包括字符的全部筆畫。
6.根據(jù)權利要求3或4所述的灰度字符精確分割裝置,其中,所述字符圖像增強單元包括背景象素值估算單元,用于估算所輸入字符圖像的背景象素值;背景消除單元,用于根據(jù)背景象素值估算單元估算出的背景象素值來消除背景;象素值增強單元,用于增強消除背景之后的字符圖像的象素值。
7.根據(jù)權利要求6所述的灰度字符精確分割裝置,其中,所述背景象素值估算單元使用直方圖法估算所述背景象素值。
8.根據(jù)權利要求6所述的灰度字符精確分割裝置,其中,所述象素值增強單元使用S型函數(shù)增強所述象素值。
9.根據(jù)權利要求1到4任一項所述的灰度字符精確分割裝置,其中,所述消噪單元包括連接組件分析單元,用于對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件的個數(shù);噪聲連接組件判斷單元,用于判斷一連接組件是否為噪聲連接組件;噪聲連接組件消除單元,用于消除所述二值字符圖像中被所述噪聲連接組件判斷單元判斷為噪聲連接組件的連接組件。
10.根據(jù)權利要求9所述的灰度字符精確分割裝置,其中,所述噪聲連接組件判斷單元根據(jù)以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度連接組件的邊界距所述二值字符圖像邊界的距離<閾值如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
11.根據(jù)權利要求10所述的灰度字符精確分割裝置,其中,所述比例尺度為3或4。
12.一種對經(jīng)粗略分割的文本行圖像中的單個灰度字符進行精確分割的方法,包括以下步驟調(diào)整分割步驟,用于對輸入的經(jīng)粗略分割的低分辨率灰度文本行圖像中的單個字符圖像進行調(diào)整分割,從而產(chǎn)生經(jīng)調(diào)整分割的字符圖像;字符圖像二值化步驟,用于對所述調(diào)整分割步驟處理過的字符圖像進行二值化;消噪步驟,用于消除經(jīng)所述二值化步驟生成的二值字符圖像中的噪聲信息;最終字符圖像分割步驟,用于從被消除了噪聲信息的所述二值字符圖像中產(chǎn)生精確分割的字符圖像。
13.根據(jù)權利要求12所述的方法,還包括放大步驟,用于在所述調(diào)整分割步驟產(chǎn)生的經(jīng)調(diào)整分割的字符圖像進行所述字符圖像二值化步驟之前,放大所述經(jīng)調(diào)整分割的字符圖像。
14.根據(jù)權利要求13所述的方法,還包括字符圖像增強步驟,在所述字符圖像二值化步驟之前,用于對經(jīng)所述放大步驟放大了的所述經(jīng)調(diào)整的字符圖像進行字符圖像增強,使所述字符圖像中的字符的筆畫更加清晰。
15.根據(jù)權利要求12所述的方法,其中,所述調(diào)整分割的步驟包括文本行方向檢測步驟,用于檢測文本行的方向;字符圖像大小計算步驟,用于計算字符圖像的大??;字符圖像調(diào)整步驟,根據(jù)所述文本行方向檢測步驟的判斷結(jié)果和所述字符圖像大小計算步驟的計算結(jié)果,對字符圖像進行調(diào)整,使字符圖像包括字符的全部筆畫。
16.根據(jù)權利要求14所述的方法,其中,所述字符圖像增強步驟包括背景象素值估算步驟,用于估算字符圖像的背景象素值;背景消除步驟,用于根據(jù)背景象素值估算步驟估算出的背景象素值來消除背景;象素值增強步驟,用于增強消除背景之后的字符圖像的象素值。
17.根據(jù)權利要求16所述的方法,其中,在所述背景象素值估算步驟中使用直方圖法估算所述背景象素值。
18.根據(jù)權利要求16所述的方法,其中,在所述象素值增強步驟中使用S型函數(shù)來增強消除背景之后的字符圖像的象素值。
19.根據(jù)權利要求12到18中任一項所述的方法,其中,所述消噪的步驟包括連接組件分析步驟,用于對所述二值字符圖像中的連接組件進行分析,找出每個連接組件包含的象素點,計算所述二值字符圖像中的連接組件的個數(shù);噪聲連接組件判斷步驟,用于判斷一連接組件是否為噪聲連接組件;噪聲連接組件消除步驟,用于消除所述二值字符圖像中被所述噪聲連接組件判斷步驟判斷為噪聲連接組件的連接組件。
20.根據(jù)權利要求19所述的方法,其中,在所述噪聲連接組件判斷步驟中根據(jù)以下條件判斷一連接組件是否為噪聲連接組件連接組件的尺寸<所述二值字符圖像的尺寸/比例尺度連接組件的邊界距所述二值字符圖像邊界的距離<閾值如果所述連接組件同時滿足這兩個條件,則判斷該連接組件是噪聲連接組件。
全文摘要
灰度字符精確分割裝置及方法?;叶茸址_分割裝置包括調(diào)整分割單元,用于對輸入的經(jīng)粗略分割的低分辨率文本行圖像進行調(diào)整分割,從而產(chǎn)生經(jīng)調(diào)整的字符圖像;字符圖像二值化單元,用于根據(jù)輸入于其中的字符圖像生成二值字符圖像;消噪單元,用于消除所述二值化單元生成的二值字符圖像中的噪聲信息;最終字符圖像分割單元,用于從被消除了噪聲的所述二值字符圖像中產(chǎn)生精確分割的字符圖像。
文檔編號G06K9/34GK1822027SQ20051000851
公開日2006年8月23日 申請日期2005年2月18日 優(yōu)先權日2005年2月18日
發(fā)明者孫俊, 堀田悅伸, 勝山裕, 直井聰 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
昭平县| 宕昌县| 威远县| 澄迈县| 白沙| 忻州市| 正定县| 山丹县| 文山县| 霍城县| 明光市| 娱乐| 揭西县| 进贤县| 汝州市| 信阳市| 八宿县| 柞水县| 大同县| 保定市| 蓝山县| 砚山县| 滕州市| 德安县| 辽阳县| 丹东市| 新绛县| 镇宁| 九龙县| 石棉县| 南昌县| 大理市| 封开县| 马关县| 青州市| 纳雍县| 合作市| 清原| 潜江市| 天门市| 通榆县|