一種基于筆畫(huà)寬度圖的圖像中文字?jǐn)?shù)據(jù)提取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理與計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,尤其是涉及一種基于筆畫(huà)寬度圖的 圖像中文字?jǐn)?shù)據(jù)提取方法。
【背景技術(shù)】
[0002] 圖像中文字對(duì)于理解圖像內(nèi)容起著重要作用,圖像中文字提取的準(zhǔn)確與否直接影 響著文字自動(dòng)處理系統(tǒng)的后續(xù)處理結(jié)果。近年來(lái)圖像中的文字提取取得了很大的進(jìn)展,然 而圖像中的文字提取在走向?qū)嵱没倪^(guò)程中,卻遇到了很多問(wèn)題,如圖像模糊不清楚、光照 不均勻、背景復(fù)雜等等,這都是制約圖像中文字自動(dòng)提取技術(shù)實(shí)際應(yīng)用的瓶頸,又是圖像中 文字自動(dòng)提取技術(shù)研究中的熱點(diǎn)和難點(diǎn)。
[0003] 近幾十年國(guó)內(nèi)外許多研究者開(kāi)始對(duì)圖像中文字自動(dòng)提取技術(shù)進(jìn)行研究,這些方法 可分為兩類:第一類是基于閾值分割的文字提取方法,即通過(guò)求取閾值對(duì)圖像進(jìn)行二值化 處理從而得到文字前景圖像,常用閾值求取方法有基于全局閾值方法和局部閾值方法,這 方法處理質(zhì)量較好的圖像會(huì)得到比較好的結(jié)果,對(duì)于低質(zhì)量圖像和具有復(fù)雜背景的圖像常 常表現(xiàn)得無(wú)能為力;第二類是基于區(qū)域分析的文字提取方法,通過(guò)提取一些區(qū)域前景,并判 斷這些區(qū)域是否滿足文字特點(diǎn)從而排除非文字區(qū)域,常用的文字特點(diǎn)有:文字區(qū)域內(nèi)容通 常具有一致的顏色、文字區(qū)域具有相同的筆畫(huà)寬度等等,這種方法比較靈活,并且可以處理 各種各樣復(fù)雜情況下的圖像中文字提取?;趨^(qū)域分析的文字提取方法,可進(jìn)一步分成基 于顏色聚類的文字提取方法和基于筆畫(huà)寬度信息的文字提取方法。
[0004] 基于顏色聚類的文字提取方法是利用聚類算法對(duì)圖像中的顏色進(jìn)行聚類從而形 成一些區(qū)域,然后再利用文字屬性特點(diǎn)評(píng)價(jià)這些區(qū)域,進(jìn)而得到文字區(qū)域。常用的聚類算法 有k均值聚類算法、Isodata算法等等。顏色空間的選取可根據(jù)圖像質(zhì)量進(jìn)行選取,常用的 顏色空間有RGB、HIS等。
[0005] 基于筆畫(huà)寬度信息的文字提取方法充分利用了文字的一個(gè)重要特點(diǎn),文字區(qū)域通 常具有相似筆畫(huà)寬度,筆畫(huà)之間的寬度不會(huì)相異很多。大多數(shù)提取筆畫(huà)寬度信息的方法是 分別在水平和垂直方向上對(duì)圖像進(jìn)行掃描,如果出現(xiàn)成對(duì)的顏色值突變,就可計(jì)算這對(duì)顏 色值突變像素點(diǎn)之間的聚類作為筆畫(huà)寬度信息,這種方法處理復(fù)雜情況下的文字提取,具 有不穩(wěn)定性,常常會(huì)出現(xiàn)誤提或漏提現(xiàn)象。另外一種方法是利用筆畫(huà)寬度轉(zhuǎn)化算子檢測(cè)圖 像中的文字,即通過(guò)每個(gè)筆畫(huà)邊緣點(diǎn)沿梯度方向發(fā)射射線尋找此點(diǎn)的筆畫(huà)寬度,這種方法 無(wú)法準(zhǔn)確地計(jì)算出筆畫(huà)拐角處筆畫(huà)寬度信息,只能提取到大致的筆畫(huà)寬度信息,很難提取 到真實(shí)的筆畫(huà)寬度信息。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種基于筆畫(huà)寬度 圖的圖像中文字?jǐn)?shù)據(jù)提取方法。
[0007] 本發(fā)明的目的可以通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn):一種基于筆畫(huà)寬度圖的圖像中文字 數(shù)據(jù)提取方法,其特征在于,包括以下步驟:
[0008] S1、讀入彩色圖像I,利用均值聚類算法對(duì)顏色進(jìn)行聚類,在聚類后的圖像中提取 連通域,并得到所有連通域?qū)?yīng)的二值圖像,形成第一二值圖像序列&,= 1,. . .,,其 中,%為連通域個(gè)數(shù);
[0009] S2、讀入彩色圖像I,利用邊緣檢測(cè)算法和形態(tài)學(xué)連通域分析方法,對(duì)彩色圖像進(jìn) 行邊緣提取,在邊緣提取后的圖像中提取連通域,并得到所有連通域?qū)?yīng)的二值圖像,形成 第二二值圖像序列/i e,= 1,. . .,ne,其中,ne為連通域個(gè)數(shù);
[0010] S3、將第一二值圖像序列和第二二值圖像序列合并,利用幾何濾波器對(duì)合并后的 二值圖像序列進(jìn)行非文字連通域的第一次濾除,將經(jīng)過(guò)第一次濾除后的二值圖像序列更新 為第三二值圖像序列^,= 1,. . .,ng,其中,Hg為第一次濾除后的連通域個(gè)數(shù);
[0011] S4、計(jì)算第三二值圖像序列中每個(gè)二值圖像對(duì)應(yīng)的筆畫(huà)寬度圖·Sle,根據(jù)筆畫(huà)寬度 圖&#對(duì)第三二值圖像序列進(jìn)行非文字連通域的第二次濾除,得到第四二值圖像序列is =I, . . . , ns,其中,ns為第二次濾除后的連通域個(gè)數(shù);
[0012] S5、將第四二值圖像序列中所有的二值圖像疊加成一幅新的二值圖像Is,二值圖 像Is的前景即為提取到的文字結(jié)果。
[0013] 步驟Sl所述的利用均值聚類算法對(duì)顏色進(jìn)行聚類具體步驟如下,
[0014] 11)提取彩色圖像I在HSL顏色空間的亮度通道L上對(duì)應(yīng)的圖像為Ii,預(yù)設(shè)亮度 閾值tr。,基于歐式距離顏色聚類的聚類數(shù)目k E,基于余弦相似性顏色聚類的聚類數(shù)目k。;
[0015] 12)判斷是否I1 > tr。,是則采用余弦相似性在RGB顏色空間對(duì)彩色圖像I進(jìn)行k 均值聚類,把聚類后的每一類視為前景圖像,得到kc個(gè)二值圖像;否則采用歐式距離在RGB 顏色空間對(duì)彩色圖像I進(jìn)行k均值聚類,得到kE個(gè)二值圖像。
[0016] 實(shí)施步驟S2具體步驟如下,
[0017] 21)利用加權(quán)平均值法將彩色圖像I灰度化,得到灰度圖像Ig ;
[0018] 22)利用邊緣檢測(cè)算子對(duì)灰度圖像Ig進(jìn)行邊緣檢測(cè)得到邊緣二值圖像Iel ;
[0019] 23)對(duì)邊緣二值圖像Iel中斷了的筆畫(huà)在鄰域內(nèi)進(jìn)行連接,即利用二值圖像形態(tài)學(xué) 8鄰域像素連接操作對(duì)邊緣圖像I el進(jìn)行斷點(diǎn)連接,得到邊緣二值圖像Ie2 ;
[0020] 24)提取邊緣二值圖像I62中的連通域,若連通域是閉合區(qū)域,則對(duì)其進(jìn)行填充成 實(shí)心連通域,視每個(gè)連通域?yàn)榍熬皥D像,得到每個(gè)連通域?qū)?yīng)的二值圖像,形成第二二值圖 像序列Ii e ?
[0021] 步驟21)所述的利用加權(quán)平均值法將彩色圖像I灰度化,得到灰度圖像Ig,彩色圖 像I中每點(diǎn)的灰度值計(jì)算公式為:
[0022] Gray = 0. 2989 X IE+0. 587 X IG+0. 114 X IB,
[0023] 式中,IK、Ie、Ib分別為該點(diǎn)在彩色圖像I中的三通道像素值,Gray為該點(diǎn)灰度化 后的灰度值。
[0024] 步驟22)所述的邊緣檢測(cè)算子為Canny邊緣檢測(cè)算子。
[0025] 步驟S3所述的利用幾何濾波器對(duì)合并后的二值圖像序列進(jìn)行非文字連通域的第 一次濾除具體步驟如下,
[0026] 31)設(shè)定圖像I的尺寸sIhX sIw,二值圖像的連通域的外接矩形尺寸下限shX sw、最 大尺寸比例Γι、長(zhǎng)寬比下限r(nóng)b、長(zhǎng)寬比上限r(nóng) t以及連通域內(nèi)含洞數(shù)下限nhta ;
[0027] 32)判斷合并后每一個(gè)二值圖像是否滿足任意一項(xiàng)幾何濾波器規(guī)則,是則將當(dāng)前 二值圖像從合并后的二值圖像序列中刪除,所述的幾何濾波器由四項(xiàng)規(guī)則構(gòu)成:
[0028] RL排除過(guò)小的連通域,如果當(dāng)前二值圖像Ii的連通域的最小外接矩形尺寸小于 連通域尺寸下限ShX Sw,則認(rèn)為此連通域?yàn)榉俏淖謪^(qū)域;
[0029] R2.排除過(guò)大的連通域,如果當(dāng)前二值圖像Ii的連通域的最小外接矩形尺寸大于 圖像I的尺寸A X SlhX Slw,則認(rèn)為此連通域?yàn)榉俏淖謪^(qū)域:
[0030] R3.排除過(guò)長(zhǎng)或過(guò)窄的連通域,如果當(dāng)前二值圖像Ii的連通域的最小外接矩形長(zhǎng) 寬比小于rb或大于r t,則認(rèn)為此連通域?yàn)榉俏淖謪^(qū)域;
[0031] R4.排除含有過(guò)多空洞的連通域,如果當(dāng)前二值圖像Ii的連通域內(nèi)所含空洞個(gè)數(shù) 大于nto,則認(rèn)為此連通域?yàn)榉俏淖謪^(qū)域。
[0032