去除圖文并茂文檔中底色的方法
【專利摘要】本發(fā)明公開了一種去除圖文并茂文檔中底色的方法,包括以下步驟:A、獲取視頻一幀圖片或者靜態(tài)圖片;B、定義同大小灰度圖,將原圖的一個顏色分量拷貝給灰度圖;C、求灰度圖的閾值;D、求閾值矯正系數(shù);E、定義同大小標記空間,對應(yīng)灰度圖,根據(jù)閾值和閾值矯正系數(shù)標記標記空間;F、識別灰度圖中圖像區(qū)域,修正標記空間;G、參照標記空間標記,對A步驟中原圖進行保留或置白處理。本發(fā)明具有能保持圖像區(qū)清楚的同時能有效去除干擾背景的優(yōu)點。
【專利說明】去除圖文并茂文檔中底色的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理技術(shù)和機器視覺領(lǐng)域,尤其是涉及一種對含文檔(票據(jù)、證件、名片)的圖片或視頻的處理,本方法能保留原始圖文混合文檔的拍攝圖片中所需要文字和圖片信息,同時有效去除干擾的背景(底色)。
【背景技術(shù)】
[0002]隨著計算機技術(shù)的高速發(fā)展、國家對節(jié)能環(huán)保的重視,無紙化成為社會發(fā)展的趨勢。無紙化辦公既是通過視頻和拍照方式,替代傳統(tǒng)的打印、復印,進行各種業(yè)務(wù)以及事務(wù)處理。無紙化辦公必然涉及到對文檔的處理,辦公人員迫切需要一種能快速、準確、穩(wěn)定的方法保留原始圖片中所需要文字和圖片信息,保留原始色彩和效果,同時有效去除干擾的背景的技術(shù)。
[0003]現(xiàn)有的圖文并茂的圖片或視頻在進行去底色處理時,會對整體的圖片或視頻巾貞進行閾值處理,但由于圖片圖像區(qū)域內(nèi)容不確定性,可能會把圖片內(nèi)容當做普通文字或背景處理,造成原有圖片內(nèi)容嚴重失真,甚至一片模糊。
【發(fā)明內(nèi)容】
[0004]為解決上述問題,本發(fā)明的目的在于提供一種能保持圖像區(qū)清楚的同時能有效去除干擾背景的去除圖文并茂文檔中底色的方法。
[0005]本發(fā)明通過以下技術(shù)措施實現(xiàn)的,一種去除圖文并茂文檔中底色的方法,包括以下步驟:
[0006]A、獲取視頻一幀圖片或者靜態(tài)圖片;
[0007]B、定義同大小灰度圖,將原圖的一個顏色分量拷貝給灰度圖;
[0008]C、求灰度圖的閾值;
[0009]D、求閾值矯正系數(shù);
[0010]E、定義同大小標記空間,對應(yīng)灰度圖,根據(jù)閾值和閾值矯正系數(shù)標記標記空間;
[0011]F、識別灰度圖中圖像區(qū)域,修正標記空間;
[0012]G、參照標記空間標記,對A步驟中原圖進行保留或置白處理。
[0013]作為一種優(yōu)選方式,所述步驟B為:獲取視頻的一幀圖片或靜態(tài)圖片的數(shù)據(jù)為I (M,N),定義灰度圖G (M,N);如果I(M,N)為灰度圖,I (M, N)直接拷貝給同大小的灰度圖G (M, N);如果I (M, N)為RGB彩色圖,提取I (M, N)圖的G分量,拷貝給G (M, N);
[0014]其中,I (M, N)為圖像像素值集,圖像的寬為M,高度為N,RGB色彩空間表示:圖像中每一個色彩,都由紅、綠、藍三原色組成,三原色數(shù)值分別儲存在RGB的R分量、G分量和B分量;R分量為紅色分量,G分量為綠色分量,B分量為藍色分量。
[0015]作為一種優(yōu)選方式,所述步驟C中的灰度圖G(M,N)閾值由大津法求G(M,N)得閾值 THRESH。
[0016]作為一種優(yōu)選方式,所述步驟D為:先求閾值矯正系數(shù)K,求圖中任一像素的坐標點(x,y)到圖像中心位置(M/2,N/2)距離為S,代入到方程式F,求得每個坐標點的矯正系數(shù) K,K = F (S) = F (X,y) = 1-a* ((χ-Μ/2)2+ (y-N/2)2) / (M/2)2+ (N/2)2 ;其中,以圖像左上角為坐標原點,原點向右為χ方向,原點向下為y方向,a = 0.4。
[0017]作為一種優(yōu)選方式,所述步驟E為:定義標記空間MARK(M,N),MARK(M,N)與G (Μ, N)相同大?。?br>
[0018]遍歷G(M,N),比較灰度G(x,y)值與K*THRESH大小,大于則置標記MARK(x,y)為0,否則為I。
[0019]作為一種優(yōu)選方式,所述步驟F為:求G (M,N)連通域,遍歷所有連通域,當連通域區(qū)域面積S大于M*N/100,此連通域內(nèi)所有點在MARK (x,y)中標記為0,為最終所需標記空間。
[0020]作為一種優(yōu)選方式,所述步驟G為:定義標記空間MARK(M,N),MARK(M,N)與G (Μ, N)相同大??;遍歷I (Μ, N),當對應(yīng)MARK (X,y)為O時候,置I (M, N)為255,即將此像素點置為白色,否則保留為A步驟中的原圖片值。
[0021]本發(fā)明的方法能將對給定的數(shù)字圖像,快速有效去除文檔中淺色無效(背景)區(qū)域,本發(fā)明兼容處理純文檔和圖文并茂文檔的圖片,對純文檔有效去除非文字內(nèi)容,對圖文并茂文檔100%保留圖像,去除非文字和圖像內(nèi)容。本發(fā)明能保留原始圖片中所需要文字和圖像信息,保留圖像的原始色彩和效果,同時有效去除干擾的背景。能方便閱讀、儲存、裝訂成冊、打印等。
【專利附圖】
【附圖說明】
[0022]圖1為本發(fā)明實施例的待處理原圖;
[0023]圖2為本發(fā)明實施例的分離的G(綠色通道)分量;
[0024]圖3為本發(fā)明實施例的圖像坐標定義;
[0025]圖4為本發(fā)明實施例的閾值處理;
[0026]圖5為本發(fā)明實施例的查找并標記的連通區(qū)域;
[0027]圖6為本發(fā)明實施例的篩選出來的保護的區(qū)域;
[0028]圖7為本發(fā)明實施例的閾值加連通保護域標記圖;
[0029]圖8為本發(fā)明實施例的最后效果圖。
【具體實施方式】
[0030]下面結(jié)合實施例并對照附圖對本發(fā)明作進一步詳細說明。
[0031]本實施例的一種去除圖文并茂文檔中底色的方法,請參考圖1,包括以下步驟:
[0032]A、獲取視頻一幀圖片或者靜態(tài)圖片;
[0033]參考圖1,為拍攝或掃描得到一張圖文并茂的靜態(tài)圖片。
[0034]B、定義同大小灰度圖,將原圖的一個顏色分量拷貝給灰度圖;
[0035]參考圖2,獲取該靜態(tài)圖片的數(shù)據(jù)為I (M,N),定義灰度圖G (M,N);如果I(M,N)為灰度圖,I(M,N)直接拷貝給同大小的灰度圖G(M,N);如果I(M,N)為RGB彩色圖,提取I (M, N)圖的G分量,拷貝給G(M,N);圖2中為RGB彩色圖,提取I (M,N)圖的綠色分量拷貝給G(M,N),形成一介于白和黑及中間灰的256種灰度圖片;
[0036]其中,I(M,N)為圖像像素值集,圖像的寬為M,高度為N,RGB色彩空間表示:圖像中每一個色彩,都由紅、綠、藍三原色組成,三原色數(shù)值分別儲存在RGB的R分量、G分量和B分量;R分量為紅色分量,G分量為綠色分量,B分量為藍色分量;對大多數(shù)情況,綠色分量反映圖像層次相對清楚一點,有利于去底色,在本實施例中,提取的是綠色分量。在其它實施例中也可提取其它的顏色分量,如紅色分量或藍色分量。
[0037]C、求灰度圖的閾值;
[0038]灰度圖G (M, N)閾值由大津法求G (M, N)得閾值THRESH ;大津法為求圖像閾值的一種典型算法,1979年,由日本學者大津于提出,簡稱0TSU,是一種自適應(yīng)的閾值確定的方法,根據(jù)假設(shè)的閾值,計算背景和前景的類間方差,使類間方差最大的閾值為所求閾值,當然,也可以采用任何其它的現(xiàn)有求閾值的算法。
[0039]D、求閾值矯正系數(shù);
[0040]參考圖3,先求閾值矯正系數(shù)K,求圖中任一像素的坐標點(x,y)到圖像中心位置(M/2, N/2)距離為S,代入到方程式F,求得每個坐標點的矯正系數(shù)K,K = F(S) = F(x, y)=1-a* ((x-M/2)2+ (y-N/2)2) / (M/2)2+ (N/2)2 ;其中,以圖像左上角為坐標原點,原點向右為χ方向,原點向下為y方向,a = 0.4.
[0041]E、定義同大小標記空間,對應(yīng)灰度圖,根據(jù)閾值和閾值矯正系數(shù)標記標記空間;定義標記空間MARK (Μ, N),MARK (Μ, N)與G (Μ, N)相同大??;
[0042]參考圖4,遍歷G(M,N),比較灰度G(x,y)值與K*THRESH大小,大于則置標記MARK(x, y)為 0,否則為 I。
[0043]F、識別灰度圖中圖像區(qū)域,修正標記空間;
[0044]參考圖5,求G (M,N)連通域,遍歷所有連通域,參考圖6,當連通域區(qū)域面積S大于M*N/100,此連通域內(nèi)所有點在MARK(x,y)中標記為O ;參考圖7,為最終所需標記空間。
[0045]G、參照標記空間標記,對A步驟中原圖進行保留或置白處理;
[0046]參考圖8,遍歷I (M, N),當對應(yīng)MARK (X,y)為O時候,置I (M, N)為255,即將此像素點置為白色,否則保留為A步驟中的原圖片值。
[0047]本方法能將對給定的數(shù)字圖像,快速有效去除文檔中淺色無效(背景)區(qū)域,本方法兼容處理純文檔和圖文并茂文檔的圖片,對純文檔有效去除非文字內(nèi)容,對圖文并茂文檔100%保留圖像,去除非文字和圖像內(nèi)容。本方法保留原始圖片中所需要文字和圖像信息,保留圖像的原始色彩和效果,同時有效去除干擾的背景。能方便閱讀、儲存、裝訂成冊、打印等。
[0048]以上是對本發(fā)明去除圖文并茂文檔中底色的方法進行了闡述,用于幫助理解本發(fā)明,但本發(fā)明的實施方式并不受上述實施例的限制,任何未背離本發(fā)明原理下所作的改變、修飾、替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護范圍的內(nèi)。
【權(quán)利要求】
1.一種去除圖文并茂文檔中底色的方法,其特征在于:包括以下步驟: A、獲取視頻一幀圖片或者靜態(tài)圖片; B、定義同大小灰度圖,將原圖的一個顏色分量拷貝給灰度圖; C、求灰度圖的閾值; D、求閾值矯正系數(shù); E、定義同大小標記空間,對應(yīng)灰度圖,根據(jù)閾值和閾值矯正系數(shù)標記標記空間; F、識別灰度圖中圖像區(qū)域,修正標記空間; G、參照標記空間標記,對A步驟中原圖進行保留或置白處理。
2.根據(jù)權(quán)利要求1所述的去除圖文并茂文檔中底色的方法,其特征在于:所述步驟B為:獲取視頻的一幀圖片或靜態(tài)圖片的數(shù)據(jù)為I (M,N),定義灰度圖G(M,N);如果I(M,N)為灰度圖,I(M,N)直接拷貝給同大小的灰度圖G(M,N);如果I(M,N)為RGB彩色圖,提取I (M, N)圖的G分量,拷貝給G (M, N); 其中,I (M, N)為圖像像素值集,圖像的寬為M,高度為N,RGB色彩空間表示:圖像中每一個色彩,都由紅、綠、藍三原色組成,三原色數(shù)值分別儲存在RGB的R分量、G分量和B分量;R分量為紅色分量,G分量為綠色分量,B分量為藍色分量。
3.根據(jù)權(quán)利要求2所述的去除圖文并茂文檔中底色的方法,其特征在于:所述步驟C中的灰度圖G (M, N)閾值由大津法求G (M, N)得閾值THRESH。
4.根據(jù)權(quán)利要求3所述的去除圖文并茂文檔中底色的方法,其特征在于:所述步驟D為:先求閾值矯正系數(shù)K,求圖中任一像素的坐標點(x,y)到圖像中心位置(M/2,N/2)距離為S,代入到方程式F,求得每個坐標點的矯正系數(shù)K, K = F (S) =F (χ, y)=1-a* ((x-M/2)2+ (y-N/2)2) / (M/2)2+ (N/2)2 ;其中,以圖像左上角為坐標原點,原點向右為χ方向,原點向下為y方向,a = 0.4。
5.根據(jù)權(quán)利要求2所述的去除圖文并茂文檔中底色的方法,其特征在于:所述步驟E為:定義標記空間MARK(M, N),MARK (Μ, N)與G (Μ, N)相同大?。? 遍歷G(M, N),比較灰度G(χ, y)值與K*THRESH大小,大于則置標記MARK(x, y)為O,否則為I。
6.根據(jù)權(quán)利要求5所述的去除圖文并茂文檔中底色的方法,其特征在于:所述步驟F為:求G(M,N)連通域,遍歷所有連通域,當連通域區(qū)域面積S大于M*N/100,此連通域內(nèi)所有點在MARK (x,y)中標記為O,為最終所需標記空間。
7.根據(jù)權(quán)利要求2所述的去除圖文并茂文檔中底色的方法,其特征在于:所述步驟G為:定義標記空間MARK(M, N),MARK (Μ, N)與G (Μ, N)相同大??;遍歷I (Μ, N),當對應(yīng)MARK(x, y)為O時候,置I (Μ, N)為255,即將此像素點置為白色,否則保留為A步驟中的原圖片值。
【文檔編號】G06T7/00GK104200462SQ201410380219
【公開日】2014年12月10日 申請日期:2014年8月4日 優(yōu)先權(quán)日:2014年8月4日
【發(fā)明者】耿紫穆 申請人:深圳市新良田科技有限公司