两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種筆畫寬度提取方法、裝置及一種文字識(shí)別方法、系統(tǒng)的制作方法

文檔序號(hào):6485582閱讀:124來源:國知局
一種筆畫寬度提取方法、裝置及一種文字識(shí)別方法、系統(tǒng)的制作方法
【專利摘要】本申請(qǐng)?zhí)峁┝艘环N筆畫寬度提取方法、裝置及一種文字識(shí)別方法、系統(tǒng),以解決筆畫提取準(zhǔn)確性的問題。所述方法包括:提取筆畫的原始連通分量并對(duì)應(yīng)一候選筆畫寬度;對(duì)所述原始連通分量進(jìn)行腐蝕計(jì)算,并計(jì)算每次腐蝕前的連通分量的輪廓周長(zhǎng),組成周長(zhǎng)直方圖;每次腐蝕計(jì)算后得到的連通分量對(duì)應(yīng)一候選筆畫寬度,對(duì)所述周長(zhǎng)直方圖進(jìn)行差分計(jì)算,得到各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度;將各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度組成筆畫寬度直方圖;依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域,如果是文字區(qū)域,則依據(jù)極大值確定該文字區(qū)域的筆畫寬度。本申請(qǐng)?zhí)岣吡斯P畫寬度提取的準(zhǔn)確性,而且還提高了計(jì)算速度。
【專利說明】一種筆畫寬度提取方法、裝置及一種文字識(shí)別方法、系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及文字識(shí)別【技術(shù)領(lǐng)域】,特別是涉及一種筆畫寬度提取方法及提取裝置,以及,一種文字識(shí)別方法及識(shí)別系統(tǒng)。
【背景技術(shù)】
[0002]圖像中的文字識(shí)別技術(shù)有著廣泛的應(yīng)用,如掃描文檔的內(nèi)容識(shí)別、自動(dòng)郵政編碼識(shí)別等。隨著數(shù)碼相機(jī)的推廣和互聯(lián)網(wǎng)技術(shù)的發(fā)展,自然場(chǎng)景下的拍攝圖像和人工編輯生成的圖像越來越多。這些圖像有復(fù)雜的背景圖片,多變的前景顏色和紋理,其中的文字也有多語種、多字體、非線性排列等干擾。為了識(shí)別這些復(fù)雜圖像中的文字,首先需要進(jìn)行文字區(qū)域定位和切割。
[0003]筆畫是文字的重要特征,筆畫寬度是區(qū)分文字區(qū)域和非文字區(qū)域的重要特征,筆畫寬度提取的準(zhǔn)確度對(duì)于最終文字區(qū)域定位的準(zhǔn)確度有著很大的影響。
[0004]目前較常使用的一種筆畫寬度的提取方法是基于邊緣掃描的方法。該方法首先對(duì)圖像進(jìn)行邊緣提取,保留那些封閉的邊緣。然后對(duì)邊緣上的每一個(gè)點(diǎn),沿著邊緣的法向進(jìn)行掃描,直到抵達(dá)另一條邊緣,如果這兩條邊緣的法向方向相反,則掃描線的長(zhǎng)度即為筆畫的可能寬度。最后統(tǒng)計(jì)可能寬度的分布,占比最高的寬度就是筆畫寬度。
[0005]上述基于邊緣掃描的方法依賴于邊緣提取的準(zhǔn)確度,如果提取的邊緣出現(xiàn)了斷裂、過分割等情況,就無法被保留。同時(shí),微小的邊緣變化會(huì)極大地改變邊緣的法向方向,從而影響筆畫寬度的提取。實(shí)驗(yàn)結(jié)果顯示在復(fù)雜背景、強(qiáng)噪聲、低分辨率等情況下,該類方法無法準(zhǔn)確提取筆畫寬度信息。

【發(fā)明內(nèi)容】

[0006]本申請(qǐng)?zhí)峁┝艘环N筆畫寬度提取方法、裝置,以解決筆畫提取準(zhǔn)確性的問題。
[0007]相應(yīng)的,本申請(qǐng)還提供了 一種文字識(shí)別方法、系統(tǒng),以解決文字識(shí)別準(zhǔn)確性的問題。
[0008]為了解決上述問題,本申請(qǐng)公開了一種筆畫寬度提取方法,包括:
[0009]提取筆畫的原始連通分量并對(duì)應(yīng)一候選筆畫寬度;
[0010]對(duì)所述原始連通分量進(jìn)行腐蝕計(jì)算,并計(jì)算每次腐蝕前的連通分量的輪廓周長(zhǎng),組成周長(zhǎng)直方圖;
[0011]每次腐蝕計(jì)算后得到的連通分量對(duì)應(yīng)一候選筆畫寬度,對(duì)所述周長(zhǎng)直方圖進(jìn)行差分計(jì)算,得到各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度;
[0012]將各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度組成筆畫寬度直方圖;
[0013]依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域,如果是文字區(qū)域,則依據(jù)極大值確定該文字區(qū)域的筆畫寬度。
[0014]優(yōu)選地,所述對(duì)所述周長(zhǎng)直方圖進(jìn)行差分計(jì)算,得到各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度,包括:將所述周長(zhǎng)直方圖中第η次腐蝕前的連通分量的輪廓周長(zhǎng)減去第n+1次腐蝕前的連通分量的輪廓周長(zhǎng),得到第η個(gè)候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度;其中,η為正整數(shù)。
[0015]優(yōu)選地,所述依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域,包括:尋找筆畫寬度直方圖中縱坐標(biāo)表示的筆畫長(zhǎng)度的極大值,所述筆畫寬度直方圖中的橫坐標(biāo)表示筆畫寬度,所述極大值對(duì)應(yīng)的筆畫寬度為峰值寬度;從所述極大值中選出最大值和次大值;如果所述最大值和次大值之和占筆畫寬度直方圖中筆畫長(zhǎng)度總長(zhǎng)度的比例小于第一閾值,或者,最大峰值寬度與最大寬度之差超過第二閾值,則所述原始連通分量為非文字區(qū)域;否則,為文字區(qū)域。
[0016]優(yōu)選地,如果極大值為一個(gè),或者次大值小于最大值的X則舍棄次大值;其中,X為預(yù)設(shè)值。
[0017]優(yōu)選地,所述依據(jù)極大值確定該文字區(qū)域的筆畫寬度,包括:確定筆畫寬度直方圖中極大值對(duì)應(yīng)的峰值寬度為m,m為正整數(shù);計(jì)算2m或2m-l并作為該文字區(qū)域的筆畫寬度;其中,如果極大值為一個(gè),則該文字區(qū)域得到一個(gè)筆畫寬度;如果極大值有兩個(gè),則該文字區(qū)域得到兩個(gè)筆畫寬度。
[0018]優(yōu)選地,所述依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域之前,還包括:對(duì)所述筆畫寬度直方圖按照以下公式進(jìn)行平滑操作:
[0019]
【權(quán)利要求】
1.一種筆畫寬度提取方法,其特征在于,包括: 提取筆畫的原始連通分量并對(duì)應(yīng)一候選筆畫寬度; 對(duì)所述原始連通分量進(jìn)行腐蝕計(jì)算,并計(jì)算每次腐蝕前的連通分量的輪廓周長(zhǎng),組成周長(zhǎng)直方圖; 每次腐蝕計(jì)算后得到的連通分量對(duì)應(yīng)一候選筆畫寬度,對(duì)所述周長(zhǎng)直方圖進(jìn)行差分計(jì)算,得到各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度; 將各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度組成筆畫寬度直方圖; 依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域,如果是文字區(qū)域,則依據(jù)極大值確定該文字區(qū)域的筆畫寬度。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述周長(zhǎng)直方圖進(jìn)行差分計(jì)算,得到各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度,包括: 將所述周長(zhǎng)直方圖中第η次腐蝕前的連通分量的輪廓周長(zhǎng)減去第n+1次腐蝕前的連通分量的輪廓周長(zhǎng),得到第η個(gè)候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度;其中,η為正整數(shù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域,包括: 尋找筆畫寬度直方圖中縱坐標(biāo)表示的筆畫長(zhǎng)度的極大值,所述筆畫寬度直方圖中的橫坐標(biāo)表示筆畫寬度,所述極大值對(duì)應(yīng)的筆畫寬度為峰值寬度; 從所述極大值中選出最大值和次大值; 如果所述最大值和次大值之和占筆畫寬度直方圖中筆畫長(zhǎng)度總長(zhǎng)度的比例小于第一閾值,或者,最大峰值寬度與最大寬度之差超過第二閾值,則所述原始連通分量為非文字區(qū)域;否則,為文字區(qū)域。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于: 如果極大值為一個(gè),或者次大值小于最大值的x%,則舍棄次大值;其中,X為預(yù)設(shè)值。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述依據(jù)極大值確定該文字區(qū)域的筆畫覽度,包括: 確定筆畫寬度直方圖中極大值對(duì)應(yīng)的峰值寬度為m,m為正整數(shù); 計(jì)算2m或2m-l并作為該文字區(qū)域的筆畫寬度; 其中,如果極大值為一個(gè),則該文字區(qū)域得到一個(gè)筆畫寬度;如果極大值有兩個(gè),則該文字區(qū)域得到兩個(gè)筆畫寬度。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域之前,還包括: 對(duì)所述筆畫寬度直方圖按照以下公式進(jìn)行平滑操作:
I ' n = W1 1n-l+W(1ln+Wlln+1 其中,r n表示平滑后的筆畫長(zhǎng)度,、+、、丨^均表示平滑前的筆畫長(zhǎng)度’^和^表示平滑權(quán)值。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述原始連通分量進(jìn)行腐蝕計(jì)算,并計(jì)算每次腐蝕前的連通分量的輪廓周長(zhǎng),包括: 選取原始連通分量的輪廓上的點(diǎn)作為初始點(diǎn)集; 從初始點(diǎn)集開始,對(duì)原始連通分量中的每個(gè)點(diǎn)進(jìn)行廣度遍歷,獲得每個(gè)點(diǎn)距離所述初始點(diǎn)集的最短路徑長(zhǎng)度,并將所述最短路徑長(zhǎng)度作為該點(diǎn)的腐蝕次數(shù); 統(tǒng)計(jì)具有相同腐蝕次數(shù)η的點(diǎn)的個(gè)數(shù),作為第η次腐蝕前的連通分量的輪廓周長(zhǎng),η為正整數(shù)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于: 對(duì)原始連通分量中的每個(gè)點(diǎn)進(jìn)行4鄰接的廣度遍歷。
9.一種筆畫寬度提取裝置,其特征在于,包括: 連通分量提取模塊,用于提取筆畫的原始連通分量并對(duì)應(yīng)一候選筆畫寬度; 腐蝕和輪廓周長(zhǎng)提取模塊,用于對(duì)所述原始連通分量進(jìn)行腐蝕計(jì)算,并計(jì)算每次腐蝕前的連通分量的輪廓周長(zhǎng),組成周長(zhǎng)直方圖; 差分計(jì)算模塊,用于每次腐蝕計(jì)算后得到的連通分量對(duì)應(yīng)一候選筆畫寬度,對(duì)所述周長(zhǎng)直方圖進(jìn)行差分計(jì)算,得到各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度; 直方圖生成模塊 ,用于將各候選筆畫寬度對(duì)應(yīng)的筆畫長(zhǎng)度組成筆畫寬度直方圖; 筆畫寬度提取模塊,用于依據(jù)所述筆畫寬度直方圖中的極大值確定所述原始連通分量是否為文字區(qū)域,如果是文字區(qū)域,則依據(jù)極大值確定該文字區(qū)域的筆畫寬度。
10.一種文字識(shí)別方法,其特征在于,根據(jù)權(quán)利要求1至8任一權(quán)利要求所述的筆畫寬度提取方法提取筆畫寬度,得到筆畫,然后進(jìn)行文字識(shí)別。
11.一種文字識(shí)別系統(tǒng),其特征在于,包括權(quán)利要求9所述的筆畫寬度提取裝置,用于提取筆畫寬度,還包括: 文字識(shí)別裝置,用于根據(jù)提取的筆畫寬度,得到筆畫,然后進(jìn)行文字識(shí)別。
【文檔編號(hào)】G06K9/20GK103455816SQ201210169811
【公開日】2013年12月18日 申請(qǐng)日期:2012年5月28日 優(yōu)先權(quán)日:2012年5月28日
【發(fā)明者】鄭琪, 王永攀 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
江油市| 乌审旗| 张家界市| 青阳县| 内江市| 专栏| 通辽市| 凯里市| 贞丰县| 宣化县| 乌拉特前旗| 河西区| 屯门区| 来凤县| 双柏县| 滨海县| 霞浦县| 越西县| 西华县| 绥棱县| 吉隆县| 诸城市| 铜山县| 白银市| 葵青区| 湾仔区| 东兰县| 凤山县| 肥西县| 曲沃县| 芦溪县| 南和县| 江华| 鄂托克前旗| 揭东县| 普宁市| 耒阳市| 盐边县| 交口县| 邵阳市| 思茅市|