两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

文件圖像處理方法和設(shè)備的制作方法

文檔序號:6607956閱讀:153來源:國知局
專利名稱:文件圖像處理方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,特別涉及一種文件圖像處理方法和設(shè)備。
背景技術(shù)
文本行提取是文件圖像處理中的關(guān)鍵步驟。存在兩種主要的傳統(tǒng)方法來從圖像中獲得文本行。第一種類型的方法是使用布局分析將文本段落與圖像分開并提取文本行。 另一種類型的方法則使用了從自然景觀圖像中進行文本提取的思想。相關(guān)的技術(shù)文件可參見 E Shafait, D. Keysers, T. Breuel, "Performance evaluation and benchmarking of six page segmentation algorithms". IEEE Trans. On Pattern Analysis and Machine Intelligence. v30, n6, pp941_954,November, 30, 2007 (以下稱為技術(shù)文件 1)和 Ε. Kim, et Al,"Scene text extraction using focus of mobile camera,,·Proceedings of the 10th International conference on Document Analysis and Recognition,pl66 170, 2009. 7. 26 29,Barcelona(以下稱為技術(shù)文件2),這兩個技術(shù)文件的整體內(nèi)容通過引用結(jié)合于此。文本提取的目的是要通過對提取的文本行的字符識別來決定掃描的頁面的取向。 文本提取的關(guān)鍵需求包括1.從圖像中提取全部文本行是不必要的。2.速度應當盡可能地快。傳統(tǒng)的方法對于上述兩個需求而言是存在問題的。基于布局分析的方法不能滿足速度需求。而且,基于布局分析的方法會分析整個文件圖像。如果圖像的結(jié)構(gòu)非常復雜,則文本行提取通常會失敗。第二種類型的方法(參見技術(shù)文件幻非常快速,但是它主要用于從戶外自然景觀文本中進行水平文本行提取。當?shù)诙N類型的方法應用于掃描的文件圖像時,在掃描的文件包括水平文本行、垂直文本行和圖像的情況下,一個很大的問題是如何找到文本行的正確方向。本發(fā)明的目的就是要從掃描的文件圖像中進行快速而可靠的文本行提取。

發(fā)明內(nèi)容
在下文中給出了關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。但是,應當理解,這個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖用來確定本發(fā)明的關(guān)鍵性部分或重要部分,也不是意圖用來限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出關(guān)于本發(fā)明的某些概念,以此作為稍后給出的更詳細描述的前序。鑒于現(xiàn)有技術(shù)的上述情形,本發(fā)明的目的是提供一種文件圖像處理方法和設(shè)備, 其能夠從掃描的文件圖像中進行快速而可靠的文本行提取,尤其適用于布局分析失敗的情況下的復雜文件圖像。為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一方面,提供了一種文件圖像處理方法,其包括如下步驟對所述文件圖像進行水平文本行提取,以獲得水平文本行,其中所述水平文本行的行數(shù)用Nh來表示;對所述文件圖像進行垂直文本行提取,以獲得垂直文本行,其中所述垂直文本行的列數(shù)用Nv來表示;設(shè)置具有Nh行Nv列的重疊矩陣M0,所述重疊矩陣MO的第i行第j列的元素M0(i,j)的值指示了第i行的水平文本行和第j列的垂直文本行之間的重疊關(guān)系,其中1彡i彡Nh并且1彡j彡Nv ;在垂直方向上對所述重疊矩陣MO進行合并,使得如果一列垂直文本行同時與多行水平文本行重疊,則將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;在水平方向上對所述重疊矩陣MO進行合并,使得如果一行水平文本行同時與多列垂直文本行重疊,則將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;基于合并后的所述重疊矩陣MO的元素的值, 確定所述文件圖像中的一個或多個文本重疊區(qū)域;在所述一個或多個文本重疊區(qū)域中的一個內(nèi),分別對水平文本行和垂直文本行的筆畫或像素點總數(shù)進行計數(shù);以及如果水平文本行的筆畫或像素點總數(shù)大于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是水平取向,并且如果水平文本行的筆畫或像素點總數(shù)小于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是垂直取向。根據(jù)本發(fā)明的另一方面,還提供了一種文件圖像處理設(shè)備,其包括水平文本行提取單元,用于對所述文件圖像進行水平文本行提取,以獲得水平文本行,其中所述水平文本行的行數(shù)用Nh來表示;垂直文本行提取單元,用于對所述文件圖像進行垂直文本行提取, 以獲得垂直文本行,其中所述垂直文本行的列數(shù)用Nv來表示;重疊矩陣設(shè)置單元,用于設(shè)置具有Nh行Nv列的重疊矩陣M0,所述重疊矩陣MO的第i行第j列的元素MO (i,j)的值指示了第i行的水平文本行和第j列的垂直文本行之間的重疊關(guān)系,其中1 < i < Nh并且 1 ^ j ^ Nv ;垂直合并單元,用于在垂直方向上對所述重疊矩陣MO進行合并,使得如果一列垂直文本行同時與多行水平文本行重疊,則將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;水平合并單元, 用于在水平方向上對所述重疊矩陣MO進行合并,使得如果一行水平文本行同時與多列垂直文本行重疊,則將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;文本重疊區(qū)域確定單元,用于基于所述垂直合并單元和水平合并單元合并后的所述重疊矩陣MO的元素的值,確定所述文件圖像中的一個或多個文本重疊區(qū)域;計數(shù)單元,用于在所述文本重疊區(qū)域確定單元確定的一個或多個文本重疊區(qū)域中的一個內(nèi),分別對水平文本行和垂直文本行的筆畫或像素點總數(shù)進行計數(shù);以及文本取向確定單元,用于如果所述計數(shù)單元計數(shù)的水平文本行的筆畫或像素點總數(shù)大于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是水平取向,并且如果所述計數(shù)單元計數(shù)的水平文本行的筆畫或像素點總數(shù)小于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是垂直取向。根據(jù)本發(fā)明的另一方面,還提供了用于實現(xiàn)上述文件圖像處理方法的計算機程序
女口
廣 PFt O根據(jù)本發(fā)明的另一方面,還提供了計算機可讀介質(zhì),其上記錄有用于實現(xiàn)上述文件圖像處理方法的計算機程序代碼。
6
在本發(fā)明的上述技術(shù)方案中,對文件圖像既進行水平文本行提取又進行垂直文本行提取,基于水平文本行和垂直文本行的重疊關(guān)系確定文件圖像中的一個或多個文本重疊區(qū)域,并且基于筆畫或像素點總數(shù)來確定文本重疊區(qū)域的取向。因此,能夠從掃描的文件圖像中進行快速而可靠的文本行提取,尤其適用于布局分析失敗的情況下的復雜文件圖像。


本發(fā)明可以通過參考下文中結(jié)合附圖所給出的詳細描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標記來表示相同或者相似的部件。所述附圖連同下面的詳細說明一起包含在本說明書中并形成說明書的一部分,用來進一步舉例說明本發(fā)明的優(yōu)選實施例和解釋本發(fā)明的原理和優(yōu)點。在附圖中圖1是示出根據(jù)本發(fā)明實施例的文件圖像處理方法的流程圖;圖2是示出作為根據(jù)本發(fā)明實施例的具體例子的進行水平文本行提取的示圖;圖3是示出作為根據(jù)本發(fā)明實施例的具體例子的進行垂直文本行提取的示圖;以及圖4是示出根據(jù)本發(fā)明實施例的文件圖像處理設(shè)備的框圖。本領(lǐng)域技術(shù)人員應當理解,附圖中的元件僅僅是為了簡單和清楚起見而示出的, 而且不一定是按比例繪制的。例如,附圖中某些元件的尺寸可能相對于其它元件放大了,以便有助于提高對本發(fā)明實施例的理解。
具體實施例方式在下文中將結(jié)合附圖對本發(fā)明的示范性實施例進行描述。為了清楚和簡明起見, 在說明書中并未描述實際實施方式的所有特征。然而,應該了解,在開發(fā)任何這種實際實施例的過程中必須做出很多特定于實施方式的決定,以便實現(xiàn)開發(fā)人員的具體目標,例如,符合與系統(tǒng)及業(yè)務相關(guān)的那些限制條件,并且這些限制條件可能會隨著實施方式的不同而有所改變。此外,還應該了解,雖然開發(fā)工作有可能是非常復雜和費時的,但對得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務。在此,還需要說明的一點是,為了避免因不必要的細節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其它細節(jié)。下面參照附圖詳細描述根據(jù)本發(fā)明實施例的文件圖像處理方法。圖1是示出根據(jù)本發(fā)明實施例的文件圖像處理方法的流程圖。首先,在步驟SllO中,對文件圖像進行水平文本行提取。在復雜的文件圖像中,可以包括文本和圖像,其中文本既包括水平文本行又包括垂直文本行。通過在步驟SllO中對文件圖像進行水平文本行提取之后,可以獲得文件圖像中的水平文本行。這里,水平文本行的行數(shù)用Nh來表示。下一步,在步驟S120中,對文件圖像進行垂直文本行提取。通過執(zhí)行步驟S120可以獲得文件圖像中的垂直文本行。這里,垂直文本行的列數(shù)用Nv來表示。由此就獲得了 Nh行的水平文本行和Nv列的垂直文本行。關(guān)于具體的(水平或垂直)文本行提取,存在許多方法。相關(guān)的技術(shù)文件可參見上MiIilJ2 Ι^ ,^Ν. Ezaki,et. Al,"Text detection from natural scene images towards a system for visually impaired persons".International Conference on Pattern Recognition. P683-686, 2004 (以下稱為技術(shù)文件;3),該技術(shù)文件3的整體內(nèi)容同樣通過引用結(jié)合于此。下一步,在步驟S130中,設(shè)置重疊矩陣M0。重疊矩陣MO具有Nh行和Nv列,以與在步驟SllO中獲得的水平文本行的行數(shù)和在步驟S120中獲得的垂直文本行的列數(shù)相對應。重疊矩陣MO的第i行第j列的元素M0(i,j) 的值指示了第i行的水平文本行和第j列的垂直文本行之間的重疊關(guān)系,其中1 < i < Nh 并且1彡j彡Nv。換言之,設(shè)置重疊矩陣MO的目的,就是要表達在步驟SllO中獲得的水平文本行中的每一行和在步驟S120中獲得的垂直文本行中的每一列之間的重疊關(guān)系。這種重疊關(guān)系有助于確定復雜文件圖像中的一個或多個文本重疊區(qū)域。根據(jù)本發(fā)明的優(yōu)選實施例,MO(i, j) = 0指示第i行的水平文本行和第j列的垂直文本行之間沒有重疊,并且M0(i,j) = i指示第i行的水平文本行和第j列的垂直文本行之間發(fā)生重疊。當然,MO(i, j)也可以取其它值來指示第i行的水平文本行和第j列的垂直文本行之間的重疊關(guān)系。下一步,在步驟S140中,在垂直方向上對重疊矩陣MO進行合并。如果一列垂直文本行同時與多行水平文本行重疊,則將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的重疊矩陣MO的元素的值設(shè)置為相同值。 通過這種合并,使得重疊矩陣MO中的元素的值的多樣性減少。最終,可以依據(jù)重疊矩陣MO 中的值相同的元素的分布情況來確定復雜文件圖像中的一個或多個文本重疊區(qū)域。根據(jù)本發(fā)明的優(yōu)選實施例,如果一列垂直文本行同時與多行水平文本行重疊,則將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的重疊矩陣MO 的元素的值設(shè)置為它們中的最小值(或者最大值等等)。下一步,在步驟S150中,在水平方向上對重疊矩陣MO進行合并。如果一行水平文本行同時與多列垂直文本行重疊,則將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的重疊矩陣MO的元素的值設(shè)置為相同值。 通過這種合并,進一步使得重疊矩陣MO中的元素的值的多樣性減少。根據(jù)本發(fā)明的優(yōu)選實施例,如果一行水平文本行同時與多列垂直文本行重疊,則將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的重疊矩陣MO 的元素的值設(shè)置為它們中的最小值(或者最大值等等)。在文件圖像布局簡單的情況下,在執(zhí)行步驟S140和S150之后即可執(zhí)行下一個步驟。在文件圖像布局復雜的情況下,可以反復執(zhí)行步驟S140和S150,重復在垂直方向上和水平方向上對重疊矩陣MO進行合并,直到重疊矩陣MO的元素的值不再發(fā)生變化為止。下一步,在步驟S160中,基于合并后的重疊矩陣MO的元素的值,確定文件圖像中的一個或多個文本重疊區(qū)域。在合并后的重疊矩陣MO中,具有各自不同的相同值的元素分布在不同的區(qū)域。按照該相同值的分布,即可確定文件圖像中的一個或多個文本重疊區(qū)域。下一步,在步驟S170中,在一個或多個文本重疊區(qū)域中的一個內(nèi),分別對水平文本行和垂直文本行的筆畫或像素點總數(shù)進行計數(shù)。
對于每一個文本重疊區(qū)域而言,在正確取向的文本行中總是會聚集比較多的筆畫或像素點總數(shù),而在錯誤取向的文本行中則會聚集比較少的筆畫或像素點總數(shù)。最后,在步驟S180中,確定一個或多個文本重疊區(qū)域中的一個的取向。如果水平文本行的筆畫或像素點總數(shù)大于垂直文本行的筆畫或像素點總數(shù),則確定該文本重疊區(qū)域的取向是水平取向。如果水平文本行的筆畫或像素點總數(shù)小于垂直文本行的筆畫或像素點總數(shù),則確定該文本重疊區(qū)域的取向是垂直取向。另外需要說明的是,如果水平文本行的筆畫或像素點總數(shù)剛好等于垂直文本行的筆畫或像素點總數(shù),則無法確定該文本重疊區(qū)域的取向是水平取向還是垂直取向。在這種特殊情況下,不對這個文本重疊區(qū)域的取向進行判斷。采用根據(jù)本發(fā)明的上述文件圖像處理方法,可以從掃描的文件圖像中快速確定一個或多個文本重疊區(qū)域及其正確的取向,這尤其適用于布局分析失敗的情況下的復雜文件圖像。在確定了文件圖像中的文本重疊區(qū)域的取向的情況下,如果確定一個或多個文本重疊區(qū)域中的每一個的取向是水平取向,則確定文件圖像是水平取向;如果確定一個或多個文本重疊區(qū)域中的每一個的取向是垂直取向,則確定文件圖像是垂直取向;而如果確定一個或多個文本重疊區(qū)域的取向既包括水平取向又包括垂直取向,則確定文件圖像是混合取向。在下文中,參考圖2和3來具體地描述根據(jù)本發(fā)明的文件圖像處理方法。圖2是示出作為根據(jù)本發(fā)明實施例的具體例子的進行水平文本行提取的示圖。如圖2所示,在對文件圖像進行水平文本行提取之后,獲得了 5行水平文本行,分別用H-1、 H-2、H-3、H-4 和 H-5 來表示。圖3是示出作為根據(jù)本發(fā)明實施例的具體例子的進行垂直文本行提取的示圖。如圖3所示,在對文件圖像進行垂直文本行提取之后,獲得了 7列垂直文本行,分別用V-1、 V-2、V-3、V-4、V-5、V-6 和 V-7 來表示。根據(jù)獲得的5行水平文本行和7列垂直文本行之間的重疊關(guān)系,可以設(shè)置如表1 所示的5行7列的重疊矩陣M0。表 1
V-IV-2V-3V-4V-5V-6V-7H-I1000000H-22200000H- 33300000H-44000000H- 50055555 如表1所示,重疊矩陣MO的第i行第j列的元素M0(i,j)的值指示了第i行的水
9平文本行和第j列的垂直文本行之間的重疊關(guān)系。當?shù)趇行的水平文本行和第j列的垂直文本行之間沒有重疊時,M0(i,j) =0。當?shù)趇行的水平文本行和第j列的垂直文本行之間發(fā)生重疊時,M0(i,j) = i。然后,在垂直方向上對如表1所示的重疊矩陣MO進行合并。首先對第V-I列進行合并。第V-I列垂直文本行同時與第H-1、H-2、H_3和H_4行水平文本行重疊。掃描得到M0(1,1)、M0(2,1)、M0(3,1) ^P MO(4,1)中的最小值為1。所以, ^M0(1,1)>M0(2,1)>M0(3,1) ^P MO(4,1)的值全都設(shè)置為 1,得到表 2。表 權(quán)利要求
1.一種文件圖像處理方法,包括對所述文件圖像進行水平文本行提取,以獲得水平文本行,其中所述水平文本行的行數(shù)用Nh來表示;對所述文件圖像進行垂直文本行提取,以獲得垂直文本行,其中所述垂直文本行的列數(shù)用Nv來表示;設(shè)置具有Nh行Nv列的重疊矩陣M0,所述重疊矩陣MO的第i行第j列的元素MO (i,j) 的值指示了第i行的水平文本行和第j列的垂直文本行之間的重疊關(guān)系,其中1 < i < Nh 并且1彡j彡Nv ;在垂直方向上對所述重疊矩陣MO進行合并,使得如果一列垂直文本行同時與多行水平文本行重疊,則將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;在水平方向上對所述重疊矩陣MO進行合并,使得如果一行水平文本行同時與多列垂直文本行重疊,則將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;基于合并后的所述重疊矩陣MO的元素的值,確定所述文件圖像中的一個或多個文本重疊區(qū)域;在所述一個或多個文本重疊區(qū)域中的一個內(nèi),分別對水平文本行和垂直文本行的筆畫或像素點總數(shù)進行計數(shù);以及如果水平文本行的筆畫或像素點總數(shù)大于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是水平取向,并且如果水平文本行的筆畫或像素點總數(shù)小于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是垂直取向。
2.根據(jù)權(quán)利要求1所述的方法,進一步包括在確定所述文件圖像中的一個或多個文本重疊區(qū)域之前,重復在垂直方向上和水平方向上對所述重疊矩陣MO進行合并,直到所述重疊矩陣MO的元素的值不再發(fā)生變化為止。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,MO(i, j) = 0指示第i行的水平文本行和第j列的垂直文本行之間沒有重疊;MO(i, j) = i指示第i行的水平文本行和第j列的垂直文本行之間發(fā)生重疊;如果一列垂直文本行同時與多行水平文本行重疊,則將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為它們中的最小值;并且如果一行水平文本行同時與多列垂直文本行重疊,則將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為它們中的最小值。
4.根據(jù)權(quán)利要求1所述的方法,進一步包括如果確定所述一個或多個文本重疊區(qū)域中的每一個的取向是水平取向,則確定所述文件圖像是水平取向;如果確定所述一個或多個文本重疊區(qū)域中的每一個的取向是垂直取向,則確定所述文件圖像是垂直取向;以及如果確定所述一個或多個文本重疊區(qū)域的取向既包括水平取向又包括垂直取向,則確定所述文件圖像是混合取向。
5.一種文件圖像處理設(shè)備,包括水平文本行提取單元,用于對所述文件圖像進行水平文本行提取,以獲得水平文本行, 其中所述水平文本行的行數(shù)用Nh來表示;垂直文本行提取單元,用于對所述文件圖像進行垂直文本行提取,以獲得垂直文本行, 其中所述垂直文本行的列數(shù)用Nv來表示;重疊矩陣設(shè)置單元,用于設(shè)置具有Nh行Nv列的重疊矩陣M0,所述重疊矩陣MO的第i 行第j列的元素M0(i,j)的值指示了第i行的水平文本行和第j列的垂直文本行之間的重疊關(guān)系,其中1彡i彡Nh并且1彡j彡Nv ;垂直合并單元,用于在垂直方向上對所述重疊矩陣MO進行合并,使得如果一列垂直文本行同時與多行水平文本行重疊,則將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;水平合并單元,用于在水平方向上對所述重疊矩陣MO進行合并,使得如果一行水平文本行同時與多列垂直文本行重疊,則將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為相同值;文本重疊區(qū)域確定單元,用于基于所述垂直合并單元和水平合并單元合并后的所述重疊矩陣MO的元素的值,確定所述文件圖像中的一個或多個文本重疊區(qū)域;計數(shù)單元,用于在所述文本重疊區(qū)域確定單元確定的一個或多個文本重疊區(qū)域中的一個內(nèi),分別對水平文本行和垂直文本行的筆畫或像素點總數(shù)進行計數(shù);以及文本取向確定單元,用于如果所述計數(shù)單元計數(shù)的水平文本行的筆畫或像素點總數(shù)大于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是水平取向,并且如果所述計數(shù)單元計數(shù)的水平文本行的筆畫或像素點總數(shù)小于垂直文本行的筆畫或像素點總數(shù),則確定所述一個或多個文本重疊區(qū)域中的所述一個的取向是垂直取向。
6.根據(jù)權(quán)利要求5所述的設(shè)備,其中,在所述文本重疊區(qū)域確定單元確定所述文件圖像中的一個或多個文本重疊區(qū)域之前,所述垂直合并單元和所述水平合并單元重復在垂直方向上和水平方向上對所述重疊矩陣MO進行合并,直到所述重疊矩陣MO的元素的值不再發(fā)生變化為止。
7.根據(jù)權(quán)利要求5或6所述的設(shè)備,其中,MO(i, j) = 0指示第i行的水平文本行和第j列的垂直文本行之間沒有重疊; MO(i, j) = i指示第i行的水平文本行和第j列的垂直文本行之間發(fā)生重疊; 如果一列垂直文本行同時與多行水平文本行重疊,則所述垂直合并單元將指示該列垂直文本行和所述多行水平文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為它們中的最小值;并且如果一行水平文本行同時與多列垂直文本行重疊,則所述水平合并單元將指示該行水平文本行和所述多列垂直文本行中的每一個之間的重疊關(guān)系的所述重疊矩陣MO的元素的值設(shè)置為它們中的最小值。
8.根據(jù)權(quán)利要求5所述的設(shè)備,進一步包括圖像取向確定單元,該圖像取向確定單元用于如果所述文本取向確定單元確定所述一個或多個文本重疊區(qū)域中的每一個的取向是水平取向,則確定所述文件圖像是水平取向;如果所述文本取向確定單元確定所述一個或多個文本重疊區(qū)域中的每一個的取向是垂直取向,則確定所述文件圖像是垂直取向;以及如果所述文本取向確定單元確定所述一個或多個文本重疊區(qū)域的取向既包括水平取向又包括垂直取向,則確定所述文件圖像是混合取向。
全文摘要
本發(fā)明公開了一種文件圖像處理方法和設(shè)備,其中文件圖像處理方法包括對文件圖像進行水平文本行提??;對文件圖像進行垂直文本行提取;設(shè)置重疊矩陣,所述重疊矩陣的元素的值指示了水平文本行和垂直文本行之間的重疊關(guān)系;在垂直方向上對重疊矩陣進行合并;在水平方向上對重疊矩陣進行合并;基于合并后的重疊矩陣的元素的值,確定文件圖像中的一個或多個文本重疊區(qū)域;在一個或多個文本重疊區(qū)域中的一個內(nèi),分別對水平文本行和垂直文本行的筆畫或像素點總數(shù)進行計數(shù);以及如果水平文本行的筆畫或像素點總數(shù)大于垂直文本行的筆畫或像素點總數(shù),則確定該文本重疊區(qū)域的取向是水平取向,反之則確定該文本重疊區(qū)域的取向是垂直取向。
文檔編號G06K9/46GK102375988SQ201010257650
公開日2012年3月14日 申請日期2010年8月17日 優(yōu)先權(quán)日2010年8月17日
發(fā)明者于浩, 堀田悅伸, 孫俊, 直井聰 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
甘洛县| 乳山市| 大连市| 漳平市| 灵武市| 隆化县| 赞皇县| 宣化县| 梓潼县| 始兴县| 铜山县| 泽州县| 晋州市| 新野县| 屯昌县| 富宁县| 天峻县| 云霄县| 太保市| 隆子县| 个旧市| 东乌珠穆沁旗| 桃源县| 通化市| 廉江市| 阿拉尔市| 赣榆县| 东海县| 喜德县| 白城市| 玉环县| 姜堰市| 甘南县| 秭归县| 台南市| 崇礼县| 酒泉市| 吴桥县| 亳州市| 遂平县| 芦溪县|