两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種文本圖像校正的方法及裝置的制造方法

文檔序號(hào):9645975閱讀:466來(lái)源:國(guó)知局
一種文本圖像校正的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像技術(shù)領(lǐng)域,特別涉及一種文本圖像校正的方法及裝置。
【背景技術(shù)】
[0002]目前,人們對(duì)移動(dòng)端閱讀的需求越來(lái)越高,雖然文字掃描等文本圖像化技術(shù)已有極大提升,但是所得到的文本圖像依然很難滿足人們的閱讀需要。其中一個(gè)很重要的問(wèn)題就是所得到的文本圖像是傾斜的。因此,將得到的傾斜文本圖像進(jìn)行校正,就成為了文本分析預(yù)處理的重要環(huán)節(jié)。
[0003]現(xiàn)有技術(shù)中,文本圖像校正的主要思想是檢測(cè)文本圖像傾斜角,檢測(cè)方法主要包括基于Hough變換的方法、基于Fourier變換的方法和基于交叉相關(guān)性的方法等。這些方法都計(jì)算量較大,算法復(fù)雜。

【發(fā)明內(nèi)容】

[0004]本發(fā)明實(shí)施例的目的在于提供一種文本圖像校正的方法及裝置,以實(shí)現(xiàn)對(duì)傾斜的文本圖像進(jìn)行快速校正,減少計(jì)算量。
[0005]為了達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種文本圖像校正的方法,所述方法包括:
[0006]A.獲得白底黑字的待校正文本圖像;
[0007]B.對(duì)所述待校正文本圖像進(jìn)行預(yù)處理,獲得二值化的黑底白字的第一文本圖像;
[0008]C.對(duì)所述第一文本圖像按預(yù)設(shè)規(guī)則沿順時(shí)針?lè)较蚝湍鏁r(shí)針?lè)较蜻M(jìn)行多次旋轉(zhuǎn),每旋轉(zhuǎn)一次對(duì)旋轉(zhuǎn)后的第一文本圖像的像素值進(jìn)行計(jì)算,獲得每次旋轉(zhuǎn)后第一文本圖像的像素空白行數(shù)目;將像素空白行數(shù)目最大的旋轉(zhuǎn)角度確定為校正旋轉(zhuǎn)角;
[0009]D.將所述待校正文本圖像旋轉(zhuǎn)所述校正旋轉(zhuǎn)角,獲得校正后的文本圖像。
[0010]較佳的,所述步驟C,包括:
[0011]C1.將所述第一文本圖像沿順時(shí)針?lè)较蛐D(zhuǎn)第一角度low,獲得第二文本圖像;將所述第一文本圖像沿逆時(shí)針?lè)较蛐D(zhuǎn)第二角度high,獲得第三文本圖像;所述low和high的初始值是預(yù)設(shè)值;
[0012]C2.分別對(duì)所述第二文本圖像和第三文本圖像的像素值進(jìn)行計(jì)算,獲得所述第二文本圖像的像素空白行數(shù)目numlow,和第三文本圖像的像素空白行數(shù)目numhigh;
[0013]C3.將所述第二文本圖像的像素空白行數(shù)目numlow,與第三文本圖像的像素空白行數(shù)目numhigh進(jìn)行比較;若所述numlow小于所述numhigh,則將所述第一角度low更新為(low+high)/2 ;若所述numlow不小于所述numhigh,則將所述第二角度high更新為(low+high)/2 ;
[0014]C4.判斷所述第一角度low與第二角度high的差的絕對(duì)值是否小于預(yù)設(shè)的第一閾值,如果是,則所述的(low+high)/2為像素空白行數(shù)目最大的旋轉(zhuǎn)角度,將所述的(low+high)/2確定為所述第一文本圖像的校正旋轉(zhuǎn)角,執(zhí)行步驟D ;如果否,則返回所述步驟CL.
[0015]較佳的,所述對(duì)所述待校正文本圖像進(jìn)行預(yù)處理,獲得二值化的黑底白字的第一文本圖像,包括:
[0016]對(duì)所述待校正文本圖像進(jìn)行二值化圖像處理后,進(jìn)行黑底白字的反色處理,獲得黑底白字的第一文本圖像。
[0017]較佳的,所述對(duì)所述待校正文本圖像進(jìn)行二值化圖像處理,包括:
[0018]對(duì)白底黑字的待校正文本圖像進(jìn)行灰度化處理,得到一維灰度矩陣圖像;
[0019]采用大津算法計(jì)算第二閾值;所述第二閾值為使得黑色字體和白色背景兩類之間的方差最大的閾值;
[0020]用所述第二閾值對(duì)所述一維灰度矩陣圖像進(jìn)行二值化處理,得到二值化圖像。
[0021]較佳的,在對(duì)所述待校正文本圖像進(jìn)行二值化圖像處理后,進(jìn)行黑底白字的反色處理前,還包括:
[0022]采用中值濾波算法對(duì)得到的二值化圖像進(jìn)行濾波,得到平滑的二值化圖像;
[0023]所述進(jìn)行黑底白字的反色處理,為:對(duì)平滑的二值化圖像進(jìn)行反色處理,獲得黑底白字的第一文本圖像。
[0024]較佳的,所述第一角度low和第二角度high的初始值,為:預(yù)設(shè)的一個(gè)正值和一個(gè)負(fù)值;且絕對(duì)值在10度?45度之間。
[0025]較佳的,所述分別對(duì)所述第二文本圖像和第三文本圖像的像素值進(jìn)行計(jì)算,獲得所述第二文本圖像的像素空白行數(shù)目numlow,和第三文本圖像的像素空白行數(shù)目numhigh,包括:
[0026]對(duì)所述第二文本圖像和第三文本圖像分別以像素為單位進(jìn)行掃描,獲得各個(gè)像素的像素值;
[0027]將所述像素值逐行進(jìn)行求和,分別獲得所述第二文本圖像和第三文本圖像每行的像素值的和值;
[0028]統(tǒng)計(jì)所述像素值的和值為零的像素行的行數(shù),分別得到所述第二文本圖像和第三文本圖像的像素空白行數(shù)目numlow和numhigh。
[0029]為了達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種文本圖像校正的裝置,所述裝置包括:
[0030]文本圖像獲得模塊,用于獲得白底黑字的待校正文本圖像;
[0031]文本圖像預(yù)處理模塊,用于對(duì)所述待校正文本圖像進(jìn)行預(yù)處理,獲得二值化的黑底白字的第一文本圖像;
[0032]校正旋轉(zhuǎn)角確定模塊,用于對(duì)所述第一文本圖像按預(yù)設(shè)規(guī)則沿順時(shí)針?lè)较蚝湍鏁r(shí)針?lè)较蜻M(jìn)行多次旋轉(zhuǎn),每旋轉(zhuǎn)一次對(duì)旋轉(zhuǎn)后的第一文本圖像的像素值進(jìn)行計(jì)算,獲得每次旋轉(zhuǎn)后第一文本圖像的像素空白行數(shù)目;將像素空白行數(shù)目最大的旋轉(zhuǎn)角度確定為校正旋轉(zhuǎn)角;
[0033]文本圖像校正模塊,用于將所述待校正文本圖像旋轉(zhuǎn)所述校正旋轉(zhuǎn)角,獲得校正后的文本圖像。
[0034]較佳的,所述校正旋轉(zhuǎn)角確定模塊,包括:旋轉(zhuǎn)子模塊、計(jì)算子模塊、比較子模塊和判斷子模塊;
[0035]所述旋轉(zhuǎn)子模塊,用于將所述第一文本圖像沿順時(shí)針?lè)较蛐D(zhuǎn)第一角度low,獲得第二文本圖像;將所述第一文本圖像沿逆時(shí)針?lè)较蛐D(zhuǎn)第二角度high,獲得第三文本圖像;所述low和high的初始值是預(yù)設(shè)值;
[0036]所述計(jì)算子模塊,用于分別對(duì)所述第二文本圖像和第三文本圖像的像素值進(jìn)行計(jì)算,獲得所述第二文本圖像的像素空白行數(shù)目numlow,和第三文本圖像的像素空白行數(shù)目numhigh ;
[0037]所述比較子模塊,用于將所述第二文本圖像的像素空白行數(shù)目numlow,與第三文本圖像的像素空白行數(shù)目numhigh進(jìn)行比較;若所述numlow小于所述numhigh,則將所述第一角度low更新為(low+high)/2 ;若所述numlow不小于所述numhigh,則將所述第二角度 high 更新為(low+high)/2 ;
[0038]所述判斷子模塊,用于判斷所述第一角度low與第二角度high的差的絕對(duì)值是否小于預(yù)設(shè)閾值,如果是,則所述的(low+high)/2為像素空白行數(shù)目最大的旋轉(zhuǎn)角度,將所述的(low+high)/2確定為所述第一文本圖像的校正旋轉(zhuǎn)角,觸發(fā)所述文本圖像校正模塊進(jìn)行文本圖像校正;如果否,則觸發(fā)所述旋轉(zhuǎn)子模塊,進(jìn)入下一個(gè)循環(huán)。
[0039]較佳的,所述文本圖像預(yù)處理模塊包括:二值化子模塊和反色子模塊;
[0040]所述二值化子模塊,用于對(duì)所述待校正文本圖像進(jìn)行二值化圖像處理;
[0041]所述反色子模塊,用于對(duì)所述待校正文本圖像進(jìn)行二值化圖像處理后,進(jìn)行黑底白字的反色處理,獲得黑底白字的第一文本圖像。
[0042]較佳的,所述二值化子模塊包括:灰度處理子模塊、第二閾值計(jì)算子模塊和二值化處理子模塊;
[0043]灰度處理子模塊,用于對(duì)白底黑字的待校正文本圖像進(jìn)行灰度化處理,得到一維灰度矩陣圖像;
[0044]第二閾值計(jì)算子模塊,用于采用大津算法計(jì)算第二閾值;所述第二閾值為使得黑色字體和白色背景兩類之間的方差最大的閾值;
[0045]二值化處理子模塊,用于用所述第二閾值對(duì)所述一維灰度矩陣圖像進(jìn)行二值化處理,得到二值化圖像。
[0046]較佳的,所述文本圖像預(yù)處理模塊,還包括:平滑子模塊;
[0047]所述平滑子模塊,用于在對(duì)所述待校正文本圖像進(jìn)行二值化圖像處理后,進(jìn)行黑底白字的反色處理前,采用中值濾波算法對(duì)得到的二值化圖像進(jìn)行濾波,得到平滑的二值化圖像;
[0048]所述反色子模塊,具體用于:對(duì)平滑的二值化圖像進(jìn)行黑底白字的反色處理,獲得黑底白字的第一文本圖像。
[0049]較佳的,所述第一角度low和第二角度high的初始值,為:預(yù)設(shè)的一個(gè)正值和一個(gè)負(fù)值;且絕對(duì)值在10度?45度之間。
[0050]較佳的,所述計(jì)算子模塊包括:掃描子模塊、求和子模塊和統(tǒng)計(jì)子模塊;
[0051]所述掃描子模塊,用于對(duì)所述第二文本圖像和第三文本圖像分別以像素為單位進(jìn)行掃描,獲得各個(gè)像素的像素值;
[0052]所述求和子模塊,用于將所述像素值逐行進(jìn)行求和,分別獲得所述第二文本圖像和第三文本圖像每行的像素值的和值;
[0053]所述統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)所述像素值的和值為零的像素行的行數(shù),分別得到所述第二文本圖像和第三文本圖像的像素空白行數(shù)目numlow和numhigh。
[0054]由上述技術(shù)方案可見(jiàn),本發(fā)明實(shí)施例首先對(duì)待校正文本圖像進(jìn)行預(yù)處理,獲得二值化的黑底白字的第一文本圖像,然后對(duì)所述第一文本圖像按預(yù)設(shè)規(guī)則沿順時(shí)針?lè)较蚝湍鏁r(shí)針?lè)较蜻M(jìn)行多次旋轉(zhuǎn),每旋轉(zhuǎn)一次對(duì)旋轉(zhuǎn)后的第一文本圖像的像素值進(jìn)行計(jì)算,獲得每次旋轉(zhuǎn)后第
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
桂东县| 天台县| 腾冲县| 惠州市| 开封市| 荥阳市| 定南县| 江油市| 夏津县| 铅山县| 枣强县| 阳朔县| 锡林浩特市| 黄浦区| 西城区| 井研县| 葫芦岛市| 武宁县| 霍州市| 永吉县| 浙江省| 新乡县| 新建县| 微山县| 平遥县| 苗栗县| 屯门区| 青阳县| 武义县| 辽中县| 黄陵县| 丁青县| 聂荣县| 平谷区| 三门峡市| 惠东县| 运城市| 高雄县| 天峻县| 松潘县| 五河县|