两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

文本版心識(shí)別方法、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程

文檔序號(hào):11251404閱讀:486來(lái)源:國(guó)知局
文本版心識(shí)別方法、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程

本發(fā)明涉及軟件領(lǐng)域,具體涉及一種文本版心識(shí)別方法、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)。



背景技術(shù):

隨著網(wǎng)絡(luò)和移動(dòng)終端設(shè)備的發(fā)展,電子書(shū)與傳統(tǒng)的紙質(zhì)書(shū)相比,從閱讀方式、攜帶等各方面而言,都更加便利。因此,越來(lái)越多的用戶選擇閱讀電子書(shū)。電子書(shū)的文本有時(shí)會(huì)比較錯(cuò)亂,需要對(duì)其文本進(jìn)行再排版等操作。在執(zhí)行這些操作時(shí),首先需要獲取文本的版心。版心即文本每個(gè)頁(yè)面中主要內(nèi)容所在的區(qū)域,位于每個(gè)頁(yè)面版面正中的位置,包括了頁(yè)面中正文的部分。

現(xiàn)有技術(shù)在獲取文本的版心時(shí),一般采用如下方法:通過(guò)photoshop等圖像處理工具對(duì)版心位置進(jìn)行定位,但這種方法需要人工操作,其處理速度慢且獲取的版心準(zhǔn)確度較低;還可以通過(guò)預(yù)設(shè)的模塊對(duì)整個(gè)版心進(jìn)行識(shí)別,這種方法雖然較前一種方法速度稍快,但對(duì)整個(gè)版心識(shí)別的準(zhǔn)確度較低,有時(shí)還需要人工再進(jìn)行調(diào)整。

因此,需要一種效率高且準(zhǔn)確度高的文本版心識(shí)別方法。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的文本版心識(shí)別方法、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)。

根據(jù)本發(fā)明的一個(gè)方面,提供了一種文本版心識(shí)別方法,其包括:

從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;

分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;

針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;

根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象;

根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,包括:處理器、存儲(chǔ)器、通信接口和通信總線,所述處理器、所述存儲(chǔ)器和所述通信接口通過(guò)所述通信總線完成相互間的通信;

所述存儲(chǔ)器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行以下操作:

從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;

分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;

針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;

根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象;

根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

根據(jù)本發(fā)明的又一方面,提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行以下操作:

從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;

分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;

針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;

根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象;

根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

根據(jù)本發(fā)明提供的文本版心識(shí)別方法、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì),從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組。分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到其中每行文字對(duì)應(yīng)的矩形文本對(duì)象;在針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行處理:對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象。根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。通過(guò)對(duì)擇取的每個(gè)頁(yè)面以行為單位識(shí)別出的矩形文本對(duì)象,并將頁(yè)面組的頁(yè)面完全重疊設(shè)置后進(jìn)行投影、合并等處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。對(duì)投影頁(yè)面中的矩形文本對(duì)象進(jìn)一步過(guò)濾,得到有效矩形文本對(duì)象,從而可以準(zhǔn)確的確定頁(yè)面組的版心。與現(xiàn)有技術(shù)相比,本發(fā)明以行為單位依次進(jìn)行處理,得到的版心的準(zhǔn)確度更精確,且整個(gè)完全不需要人工的參與,更快速高效。

上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。

附圖說(shuō)明

通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:

圖1示出了根據(jù)本發(fā)明實(shí)施例一的文本版心識(shí)別方法的流程圖;

圖2示出了根據(jù)本發(fā)明實(shí)施例二的文本版心識(shí)別方法的流程圖;

圖3示出了本發(fā)明實(shí)施例二中過(guò)濾處理的流程圖;

圖4示出了本發(fā)明實(shí)施例二中在頁(yè)面建立x軸和y軸的示意圖;

圖5示出了根據(jù)本發(fā)明實(shí)施例四的一種電子設(shè)備的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

實(shí)施例一

圖1示出了根據(jù)本發(fā)明實(shí)施例一的文本版心識(shí)別方法的流程圖,如圖1所示,文本版心識(shí)別方法具體包括如下步驟:

步驟s101,從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組。

在從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面時(shí),預(yù)設(shè)頁(yè)面的數(shù)量可以根據(jù)文本自身的頁(yè)數(shù)多少來(lái)設(shè)置。再將擇取的頁(yè)面按照各個(gè)頁(yè)面上的頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組兩組頁(yè)面。如擇取了頁(yè)碼為11-20共10頁(yè)頁(yè)面,按照頁(yè)碼分為11、13、15、17、19奇數(shù)頁(yè)面組和12、14、16、18、20偶數(shù)頁(yè)面組。

為使版心識(shí)別的準(zhǔn)確度和識(shí)別效率更高,優(yōu)選的可設(shè)置預(yù)設(shè)頁(yè)數(shù)為20頁(yè),以便擇取多個(gè)不同頁(yè)面進(jìn)行版心識(shí)別,同時(shí)也控制頁(yè)面數(shù)量也不會(huì)過(guò)多以造成版心識(shí)別時(shí)間較長(zhǎng)等問(wèn)題。在從文本中擇取頁(yè)面時(shí),擇取的位置不作限定,可以從文本的開(kāi)頭部分、中間部分或結(jié)尾部分等進(jìn)行擇取。

步驟s102,分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象。

分別將奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,將每行文字識(shí)別為一個(gè)對(duì)象,得到奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面中該每行文字對(duì)應(yīng)的一個(gè)矩形文本對(duì)象。該矩形文本對(duì)象包括了其中每行的文字信息、矩形所在的位置數(shù)據(jù)如四個(gè)角的坐標(biāo)數(shù)據(jù)、矩形尺寸數(shù)據(jù)如矩形的高度和寬度數(shù)據(jù)等。

在得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象后,針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,均依次執(zhí)行步驟s103-s105,對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組所做的處理相同。執(zhí)行時(shí)可以先選擇其中任一頁(yè)面組進(jìn)行處理,對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的處理先后順序不做限定。

步驟s103,對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。

將該頁(yè)面組中的多個(gè)頁(yè)面進(jìn)行完全重疊設(shè)置,即頁(yè)面的四邊完全對(duì)齊重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)ν耆丿B設(shè)置的該頁(yè)面組進(jìn)行投影處理,即對(duì)多個(gè)完全重疊設(shè)置的頁(yè)面進(jìn)行投影,使多個(gè)頁(yè)面的矩形文本對(duì)象都投影到一個(gè)頁(yè)面中。在投影處理后,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理。合并處理時(shí),將多個(gè)頁(yè)面在投影方向上具有相交區(qū)域的多個(gè)矩形文本對(duì)象按照能夠包括該多個(gè)矩形文本對(duì)象的最小范圍進(jìn)行合并,得到一個(gè)合并后的矩形文本對(duì)象,從而得到該頁(yè)面組的投影頁(yè)面。其中,投影頁(yè)面包含了該頁(yè)面組多個(gè)頁(yè)面進(jìn)行投影處理及合并處理后的矩形文本對(duì)象。

步驟s104,根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象。

對(duì)投影頁(yè)面中的矩形文本對(duì)象進(jìn)行過(guò)濾處理時(shí),根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)、矩形文本對(duì)象的文字信息等數(shù)據(jù)或信息進(jìn)行過(guò)濾,過(guò)濾掉不屬于版心所包含的矩形文本對(duì)象,如過(guò)濾掉頁(yè)眉、頁(yè)腳、頁(yè)碼等對(duì)應(yīng)的矩形文本對(duì)象,從而得到該頁(yè)面組的投影頁(yè)面的上下左右各邊的有效矩形文本對(duì)象。

步驟s105,根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象的矩形位置數(shù)據(jù),得到該頁(yè)面的版心的各個(gè)位置數(shù)據(jù),從而確定該頁(yè)面組的版心。

由于奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組均進(jìn)行了步驟s103-s105的處理,因此,分別得到奇數(shù)頁(yè)面組的版心和偶數(shù)頁(yè)面組的版心。

根據(jù)本發(fā)明提供的文本版心識(shí)別方法,通過(guò)對(duì)擇取的每個(gè)頁(yè)面以行為單位識(shí)別出的矩形文本對(duì)象,并將頁(yè)面組的頁(yè)面完全重疊設(shè)置后進(jìn)行投影、合并等處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。對(duì)投影頁(yè)面中的矩形文本對(duì)象進(jìn)一步過(guò)濾,得到有效矩形文本對(duì)象,從而可以準(zhǔn)確的確定頁(yè)面組的版心。與現(xiàn)有技術(shù)相比,本發(fā)明以行為單位依次進(jìn)行處理,得到的版心的準(zhǔn)確度更精確,且整個(gè)完全不需要人工的參與,更快速高效。

實(shí)施例二

圖2示出了根據(jù)本發(fā)明實(shí)施例二的文本版心識(shí)別方法的流程圖,如圖2所示,文本版心識(shí)別方法包括如下步驟:

步驟s201,從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,根據(jù)各頁(yè)面中文字的字體和/或字號(hào)判斷頁(yè)面是否為包含正文的頁(yè)面。

從文本中擇取到預(yù)設(shè)頁(yè)數(shù)的頁(yè)面后,先對(duì)各個(gè)頁(yè)面中的文字的字體、字號(hào)進(jìn)行識(shí)別。根據(jù)各頁(yè)面中文字的字體、字號(hào)進(jìn)行判斷,該頁(yè)面是否為包含正文的頁(yè)面,若該頁(yè)面為不包含正文的頁(yè)面,如該頁(yè)面為文本封面、文本目錄頁(yè)等,即該頁(yè)面不是正文頁(yè)面,不適合對(duì)該頁(yè)面進(jìn)行版心識(shí)別,則執(zhí)行步驟s202。若該頁(yè)面為包含正文的頁(yè)面,執(zhí)行步驟s203。

步驟s202,去除該頁(yè)面。

將該頁(yè)面從擇取的頁(yè)面中去除,不再對(duì)該頁(yè)面進(jìn)行后續(xù)的處理。

步驟s203,將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組。

將頁(yè)面按照每個(gè)頁(yè)面的頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組,兩個(gè)頁(yè)面組中的頁(yè)面數(shù)量可能相同,也可能不同。如在擇取了頁(yè)碼為11-20共10頁(yè)頁(yè)面后,由于判斷第13頁(yè)為不包含正文的頁(yè)面,去除了該頁(yè)面。分組后,奇數(shù)頁(yè)面組包括頁(yè)碼為11、15、17、19頁(yè)面,偶數(shù)頁(yè)面組包括頁(yè)碼為12、14、16、18、20頁(yè)面。

步驟s204,分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象。

分別將奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,將每行文字識(shí)別為一個(gè)對(duì)象,得到奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面中該每行文字對(duì)應(yīng)的一個(gè)矩形文本對(duì)象。該矩形文本對(duì)象包括了其中每行的文字信息、矩形所在的位置數(shù)據(jù)如四個(gè)角的坐標(biāo)數(shù)據(jù)、矩形尺寸數(shù)據(jù)如矩形的高度和寬度數(shù)據(jù)等。

在得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象后,針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,均依次執(zhí)行步驟s205-s207,對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組所做的處理相同。執(zhí)行時(shí)可以先選擇其中任一頁(yè)面組進(jìn)行處理,對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的處理先后順序不做限定。

步驟s205,對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象按照包括這些矩形文本對(duì)象的最小范圍進(jìn)行合并處理,得到包含合并處理后合的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。

將該頁(yè)面組中的多個(gè)頁(yè)面進(jìn)行完全重疊設(shè)置,即頁(yè)面的四邊完全對(duì)齊重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)ν耆丿B設(shè)置的該頁(yè)面組進(jìn)行投影處理,即對(duì)多個(gè)完全重疊設(shè)置的頁(yè)面進(jìn)行投影,使多個(gè)頁(yè)面的矩形文本對(duì)象都投影到一個(gè)頁(yè)面中。在投影處理后,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理。合并處理時(shí),將多個(gè)頁(yè)面在投影方向上具有相交區(qū)域的多個(gè)矩形文本對(duì)象按照能夠包括該多個(gè)矩形文本對(duì)象的最小范圍進(jìn)行合并,得到一個(gè)合并后的矩形文本對(duì)象,從而得到該頁(yè)面組的投影頁(yè)面。其中,投影頁(yè)面包含了該頁(yè)面組多個(gè)頁(yè)面進(jìn)行投影處理及合并處理后的矩形文本對(duì)象。

步驟s206,根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象。

在對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理時(shí),具體如圖3所示,執(zhí)行如下步驟:

步驟s2061,以該頁(yè)面組的投影頁(yè)面的左下角為原點(diǎn),設(shè)置頁(yè)面橫向?yàn)閤軸,頁(yè)面縱向?yàn)閥軸。

建立的x軸和y軸如圖4所示,以投影頁(yè)面的左下角為原點(diǎn)(0,0),x軸從頁(yè)面的左下角(0,0)開(kāi)始橫向向右,y軸從頁(yè)面的左下角(0,0)開(kāi)始縱向向上。

步驟s2062,按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第一有效矩形文本對(duì)象。

按照各個(gè)矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,將多個(gè)排序后的多個(gè)矩形文本對(duì)象按照排序依次進(jìn)行y軸過(guò)濾處理。在排序時(shí),僅根據(jù)各個(gè)矩形文本對(duì)象上邊距在y軸方向上的投影值進(jìn)行排序。具體的,y軸過(guò)濾處理包括以下幾種過(guò)濾處理:

判斷矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率。矩形文本對(duì)象的文字信息是一個(gè)集合,集合中的每一條文字信息為該頁(yè)面組的一個(gè)頁(yè)面中與該矩形文本對(duì)象對(duì)應(yīng)的所在行的一行文字內(nèi)容。在判斷文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率時(shí),是以集合中一條文字信息為單位即一行文字內(nèi)容為單位,計(jì)算一行文字內(nèi)容整體的重復(fù)率。當(dāng)矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率較高時(shí),說(shuō)明矩形文本對(duì)象的文字信息可能是一行同樣的文字內(nèi)容,其極大可能為頁(yè)眉或頁(yè)腳,不屬于版心所包含的內(nèi)容。因此,當(dāng)矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率達(dá)到預(yù)設(shè)重復(fù)率時(shí),過(guò)濾掉矩形文本對(duì)象。預(yù)設(shè)重復(fù)率可根據(jù)實(shí)際文本進(jìn)行設(shè)置,在此不做限定。

或者,判斷矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字。矩形文本對(duì)象的文字信息中包含的文字內(nèi)容均為數(shù)字的情況下,其極大可能為頁(yè)碼,不屬于版心所包含的內(nèi)容。因此,矩形文本對(duì)象的文字信息中包含的文字內(nèi)容均為數(shù)字時(shí),過(guò)濾掉矩形文本對(duì)象。

或者,判斷矩形文本對(duì)象的矩形高度是否小于預(yù)設(shè)高度。預(yù)設(shè)高度可以根據(jù)文本中正文字體的高度進(jìn)行設(shè)置,如設(shè)置為正文字體高度的一半。當(dāng)矩形文本對(duì)象的矩形高度小于預(yù)設(shè)高度時(shí),矩形文本對(duì)象中的文字不是正文字體,不屬于版心所包含的內(nèi)容,過(guò)濾掉矩形文本對(duì)象。

或者,判斷矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度。預(yù)設(shè)寬度可以根據(jù)多個(gè)矩形文本對(duì)象的矩形寬度的平均值進(jìn)行設(shè)置,如設(shè)置為平均值的一半。當(dāng)矩形文本對(duì)象的矩形寬度小于預(yù)設(shè)寬度時(shí),過(guò)濾掉矩形文本對(duì)象。

以上幾種過(guò)濾方式僅為舉例說(shuō)明,在進(jìn)行y軸過(guò)濾處理時(shí),可根據(jù)實(shí)際情況選擇合適的過(guò)濾方式,選擇時(shí)可以選擇一項(xiàng)或多項(xiàng)過(guò)濾方式進(jìn)行過(guò)濾。

被過(guò)濾的矩形文本對(duì)象均為無(wú)效矩形文本對(duì)象,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第一有效矩形文本對(duì)象。在選取第一有效矩形文本對(duì)象后,不再對(duì)其他矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理。

步驟s2063,按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第二有效矩形文本對(duì)象。

按照各個(gè)矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,將多個(gè)排序后的多個(gè)矩形文本對(duì)象按照排序依次進(jìn)行y軸過(guò)濾處理。在排序時(shí),僅根據(jù)各個(gè)矩形文本對(duì)象下邊距在y軸方向上的投影值進(jìn)行排序。具體的,y軸過(guò)濾處理參照步驟s2502的描述,在此不再贅述。

被過(guò)濾的矩形文本對(duì)象均為無(wú)效矩形文本對(duì)象,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第二有效矩形文本對(duì)象。在選取第二有效矩形文本對(duì)象后,不再對(duì)其他矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理。

步驟s2064,按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第三有效矩形文本對(duì)象。

按照各個(gè)矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,將多個(gè)排序后的多個(gè)矩形文本對(duì)象按照排序依次進(jìn)行x軸過(guò)濾處理。在排序時(shí),僅根據(jù)各個(gè)矩形文本對(duì)象左邊距在x軸方向上的投影值進(jìn)行排序。具體的,x軸過(guò)濾處理包括以下幾種過(guò)濾處理:

判斷矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率。矩形文本對(duì)象的文字信息是一個(gè)集合,集合中的每一條文字信息為該頁(yè)面組的一個(gè)頁(yè)面中與該矩形文本對(duì)象對(duì)應(yīng)的所在行的一行文字內(nèi)容。在判斷文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率時(shí),是以集合中一條文字信息為單位即一行文字內(nèi)容為單位,計(jì)算一行文字內(nèi)容整體的重復(fù)率。當(dāng)矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率較高時(shí),說(shuō)明矩形文本對(duì)象的文字信息可能是一行同樣的文字內(nèi)容,其極大可能為頁(yè)眉或頁(yè)腳,不屬于版心所包含的內(nèi)容。因此,當(dāng)矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率達(dá)到預(yù)設(shè)重復(fù)率時(shí),過(guò)濾掉矩形文本對(duì)象。預(yù)設(shè)重復(fù)率可根據(jù)實(shí)際文本進(jìn)行設(shè)置,在此不做限定。

或者,判斷矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字。矩形文本對(duì)象的文字信息中包含的文字內(nèi)容均為數(shù)字的情況下,其極大可能為頁(yè)碼,不屬于版心所包含的內(nèi)容。因此,矩形文本對(duì)象的文字信息中包含的文字內(nèi)容均為數(shù)字時(shí),過(guò)濾掉矩形文本對(duì)象。

或者,判斷矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度。預(yù)設(shè)寬度可以根據(jù)多個(gè)矩形文本對(duì)象的矩形寬度的平均值進(jìn)行設(shè)置,如設(shè)置為平均值的一半。當(dāng)矩形文本對(duì)象的矩形寬度小于預(yù)設(shè)寬度時(shí),過(guò)濾掉矩形文本對(duì)象。

以上幾種過(guò)濾方式僅為舉例說(shuō)明,在進(jìn)行x軸過(guò)濾處理時(shí),可根據(jù)實(shí)際情況選擇合適的過(guò)濾方式,選擇時(shí)可以選擇一項(xiàng)或多項(xiàng)過(guò)濾方式進(jìn)行過(guò)濾。

被過(guò)濾的矩形文本對(duì)象均為無(wú)效矩形文本對(duì)象,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第三有效矩形文本對(duì)象。在選取第三有效矩形文本對(duì)象后,不再對(duì)其他矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理。

步驟s2065,按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第四有效矩形文本對(duì)象。

按照各個(gè)矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,將多個(gè)排序后的多個(gè)矩形文本對(duì)象按照排序依次進(jìn)行x軸過(guò)濾處理。在排序時(shí),僅根據(jù)各個(gè)矩形文本對(duì)象右邊距在x軸方向上的投影值進(jìn)行排序。具體的,x軸過(guò)濾處理參照步驟s2064的描述,在此不再贅述。

被過(guò)濾的矩形文本對(duì)象均為無(wú)效矩形文本對(duì)象,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第四有效矩形文本對(duì)象。在選取第四有效矩形文本對(duì)象后,不再對(duì)其他矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理。

步驟s2062-步驟s2065中任一步驟均可先執(zhí)行,此處不限定步驟s2062-步驟s2065的執(zhí)行先后順序。

進(jìn)一步,在選取到第一有效矩形文本對(duì)象、第二有效矩形文本對(duì)象、第三有效矩形文本對(duì)象和第四有效矩形文本對(duì)象后,可以分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的有效邊距值y11、y12、x11、x12、y21、y22、x21和x22。其中,y11為奇數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y21為偶數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值。

步驟s207,根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

根據(jù)選取到的有效矩形文本對(duì)象,可以確定頁(yè)面組對(duì)應(yīng)的版心。其中,y11、y12、x11和x12確定奇數(shù)頁(yè)面組的有效版心。y11為奇數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值,y12為奇數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值,x11為奇數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值,x12為奇數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值。y21、y22、x21和x22確定偶數(shù)頁(yè)面組的有效版心。y21為偶數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值,y22為偶數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值,x21為偶數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值,x22為偶數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值。

步驟s208,將奇數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值與偶數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值分別進(jìn)行比較,分別得到最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值。

步驟s209,根據(jù)最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值調(diào)整奇數(shù)頁(yè)面組的有效版心與偶數(shù)頁(yè)面組的有效版心的四邊邊距對(duì)應(yīng)的投影值。

在將奇數(shù)頁(yè)面組的有效版心與偶數(shù)頁(yè)面組的有效版心的上下左右四邊邊距對(duì)應(yīng)的投影值分別進(jìn)行比較之前,還需要確定奇數(shù)頁(yè)面組的無(wú)效版心和偶數(shù)頁(yè)面組的無(wú)效版心。

對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組進(jìn)行以下處理,以便確定該頁(yè)面組的無(wú)效版心:

在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第一無(wú)效矩形文本對(duì)象。

在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第二無(wú)效矩形文本對(duì)象。

在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第三無(wú)效矩形文本對(duì)象。

在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第四無(wú)效矩形文本對(duì)象。

在選取到第一無(wú)效矩形文本對(duì)象、第二無(wú)效矩形文本對(duì)象、第三無(wú)效矩形文本對(duì)象和第四無(wú)效矩形文本對(duì)象后,分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的無(wú)效邊距值y13、y14、x13、x14、y23、y24、x23和x24。其中,y13為奇數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y23為偶數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值。

其中,y13、y14、x13和x14確定奇數(shù)頁(yè)面組的無(wú)效版心。y13為奇數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值,y14為奇數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值,x13為奇數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值,x14為奇數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值。y23、y24、x23和x24確定偶數(shù)頁(yè)面組的無(wú)效版心,y23為偶數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值,y24為偶數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值,x23為偶數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值。

在將奇數(shù)頁(yè)面組的有效版心與偶數(shù)頁(yè)面組的有效版心的上下左右四邊邊距對(duì)應(yīng)的投影值分別進(jìn)行比較時(shí),具體如下:

將y11和y21中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,若y11和y21中的數(shù)值較大者小于數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,將y11和y21中的數(shù)值較大者設(shè)定為最大上邊距數(shù)值較小者(將y11和y21中的數(shù)值較小者的數(shù)值調(diào)整為數(shù)值較大者的數(shù)值)。以一具體實(shí)施例進(jìn)行說(shuō)明如獲取到的奇數(shù)頁(yè)面組的y11的數(shù)值為95,y13的數(shù)值為98,偶數(shù)頁(yè)面組的y21的數(shù)值為97,y23的數(shù)值為100。y11和y21進(jìn)行比較,其中的數(shù)值較大者為y21,數(shù)值為97。將y21再和y11對(duì)應(yīng)的奇數(shù)頁(yè)面組無(wú)效版心上邊距在y軸方向上的投影值y13進(jìn)行比較。由于y21小于y13,將y11調(diào)整為97。

將y12和y22中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值相比,若y12和y22中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值,將y12和y22中的數(shù)值較小者設(shè)定為最大下邊距的投影值(將y12和y22中的數(shù)值較大者的數(shù)值調(diào)整為數(shù)值較小值的數(shù)值)。以一具體實(shí)施例進(jìn)行說(shuō)明如獲取到的奇數(shù)頁(yè)面組的y12的數(shù)值為5,y14的數(shù)值為2,偶數(shù)頁(yè)面組的y22的數(shù)值為6,y24的數(shù)值為3。y12和y22進(jìn)行比較,其中的數(shù)值較小者為y12,數(shù)值為5。將y12再和y22對(duì)應(yīng)的偶數(shù)頁(yè)面組無(wú)效版心下邊距在y軸方向上的投影值y24進(jìn)行比較。由于y12大于y24,將y22調(diào)整為5。

獲取奇數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x15,分別計(jì)算x11和x12到x15的距離值,獲取其中最大的距離值。根據(jù)最大的距離值重新設(shè)定奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的奇數(shù)頁(yè)面組的有效版心;經(jīng)修正的奇數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x11'和x12',x11'和x12'到x15的距離值均為x11和x12到x15中的最大的距離值。以一具體實(shí)施例進(jìn)行說(shuō)明如奇數(shù)頁(yè)面組的投影頁(yè)面寬度為40,奇數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x15為20,奇數(shù)頁(yè)面組的x11的數(shù)值為4,x12的數(shù)值為35,分別計(jì)算x11和x12到x15的距離值為16和15,獲取其中最大的距離值16。根據(jù)最大的距離值16重新設(shè)定奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,分別為4和36。將4和36分別與x13和x14比較,以保障重新設(shè)定的有效版心在無(wú)效版心范圍內(nèi)。x13的投影值為2,x14的投影值為38,由于4大于x13,36小于x14,因此,x11'設(shè)為4,和x12'設(shè)為36,x11'和x12'到x15的距離值均為16。x11'大于x13,x12'小于x14。即經(jīng)修正的奇數(shù)頁(yè)面組的有效版心在奇數(shù)頁(yè)面組的無(wú)效版心的范圍內(nèi)。

獲取偶數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x25,分別計(jì)算x21和x22到x25的距離值,獲取其中最大的距離值。根據(jù)最大的距離值重新設(shè)定偶數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的偶數(shù)頁(yè)面組的有效版心;經(jīng)修正的偶數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x21'和x22',x21'和x22'到x25的距離值均為x21和x22到x25中的最大的距離值。偶數(shù)頁(yè)面組的處理與奇數(shù)頁(yè)面組上述的處理相同。如偶數(shù)頁(yè)面組的投影頁(yè)面寬度為40,x25為20,偶數(shù)頁(yè)面組的x21的數(shù)值為6,x22的數(shù)值為37,分別計(jì)算x21和x22到x25的距離值為14和17,獲取其中最大的距離值17。根據(jù)最大的距離值17重新設(shè)定奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,分別為3和37。將3和37分別與x23和x24比較,x23的投影值為2,x24的投影值為39,由于3大于x23,37小于x24,因此,x21'設(shè)為3,和x22'設(shè)為37,x21'和x22'到x25的距離值均為17。x21'大于x23,x22'小于x24。即經(jīng)修正的偶數(shù)頁(yè)面組的有效版心在偶數(shù)頁(yè)面組的無(wú)效版心的范圍內(nèi)。

將x11'和x21'中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值相比,若x11'和x21'中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值,將x11'和x21'中的數(shù)值較小者設(shè)定為最大左邊距的投影值(將x11'和x21'中的數(shù)值較大者的數(shù)值調(diào)整為數(shù)值較小值的數(shù)值)。以一具體實(shí)施例進(jìn)行說(shuō)明如奇數(shù)頁(yè)面組的x11'的數(shù)值為4,x13的數(shù)值為2,偶數(shù)頁(yè)面組的x21'的數(shù)值為3,x23的數(shù)值為2.5。x11'和x21'進(jìn)行比較,其中的數(shù)值較小者為x21'。將x21'再和x11'對(duì)應(yīng)的奇數(shù)頁(yè)面組無(wú)效版心左邊距在x軸方向上的投影值x13進(jìn)行比較。由于x21'大于x13,將x11'調(diào)整為3。

將x12'和x22'中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值相比,若x12'和x22'中的數(shù)值較大者小于數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值,將x12'和x22'中的數(shù)值較大者設(shè)定為最大右邊距的投影值(將x12'和x22'中的數(shù)值較小者的數(shù)值調(diào)整為數(shù)值較大者的數(shù)值)。以一具體實(shí)施例進(jìn)行說(shuō)明如奇數(shù)頁(yè)面組的x12'的數(shù)值為36,x14的數(shù)值為38,偶數(shù)頁(yè)面組的x22'的數(shù)值為37,x24的數(shù)值為39。x12'和x22'進(jìn)行比較,其中的數(shù)值較大者為x22'。將x22'再和x12'對(duì)應(yīng)的奇數(shù)頁(yè)面組無(wú)效版心右邊距在x軸方向上的投影值x14進(jìn)行比較。由于x22'小于x14,將x12'調(diào)整為37。

根據(jù)上述得到的最大上邊距的投影值、最大下邊距的投影值、最大左邊距的投影值和最大右邊距的投影值,來(lái)調(diào)整步驟s207得到的奇數(shù)頁(yè)面組的有效版心與偶數(shù)頁(yè)面組的有效版心的四邊邊距。使用最大上邊距的投影值、最大下邊距的投影值、最大左邊距的投影值和最大右邊距的投影值重新確定奇數(shù)頁(yè)面組的有效版心與偶數(shù)頁(yè)面組的有效版心。

需要注意的是,在分別比較上下左右四邊邊距的投影值時(shí),若某一邊距不符合對(duì)應(yīng)的判斷條件時(shí),則奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組均保持原有的該邊距不變,對(duì)得到最大邊距的其他邊進(jìn)行調(diào)整。

根據(jù)本發(fā)明提供的文本版心識(shí)別方法,通過(guò)對(duì)擇取的每個(gè)頁(yè)面以行為單位識(shí)別出的矩形文本對(duì)象,并將頁(yè)面組的頁(yè)面完全重疊設(shè)置后進(jìn)行投影、合并等處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。對(duì)投影頁(yè)面中的矩形文本對(duì)象進(jìn)一步過(guò)濾,得到有效矩形文本對(duì)象,從而可以準(zhǔn)確的確定頁(yè)面組的版心。進(jìn)一步,還可以將奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組獲取的有效版心進(jìn)行比較,以獲取其中最大的各邊邊距的投影值,并根據(jù)最大邊距的投影值去重新調(diào)整奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的有效版心。使得當(dāng)出現(xiàn)某一頁(yè)面組的有效版心較小時(shí),可以通過(guò)將兩個(gè)有效版心比較將版心合理的擴(kuò)展,以保障使用調(diào)整后的版心時(shí)可以準(zhǔn)確的獲取到文本的正文。與現(xiàn)有技術(shù)相比,本發(fā)明以行為單位依次進(jìn)行處理,得到的版心的準(zhǔn)確度更精確,且整個(gè)完全不需要人工的參與,更快速高效。

實(shí)施例三

本申請(qǐng)實(shí)施例三提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有至少一可執(zhí)行指令,該計(jì)算機(jī)可執(zhí)行指令可執(zhí)行上述任意方法實(shí)施例中的文本版心識(shí)別方法。

可執(zhí)行指令具體可以用于使得處理器執(zhí)行以下操作:從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象;根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:根據(jù)各頁(yè)面中文字的字體和/或字號(hào)判斷頁(yè)面是否為包含正文的頁(yè)面,若否,則去除該頁(yè)面。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象按照包括這些矩形文本對(duì)象的最小范圍進(jìn)行合并處理,得到包含合并處理后合的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:以該頁(yè)面組的投影頁(yè)面的左下角為原點(diǎn),設(shè)置頁(yè)面橫向?yàn)閤軸,頁(yè)面縱向?yàn)閥軸;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第一有效矩形文本對(duì)象;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第二有效矩形文本對(duì)象;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第三有效矩形文本對(duì)象;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第四有效矩形文本對(duì)象。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:判斷矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的矩形高度是否小于預(yù)設(shè)高度,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾矩形文本對(duì)象。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:判斷矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾矩形文本對(duì)象。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的有效邊距值y11、y12、x11、x12、y21、y22、x21和x22;其中,y11為奇數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y21為偶數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y11、y12、x11和x12確定奇數(shù)頁(yè)面組的有效版心;y11為奇數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值;y21、y22、x21和x22確定偶數(shù)頁(yè)面組的有效版心;y21為偶數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第一無(wú)效矩形文本對(duì)象;在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第二無(wú)效矩形文本對(duì)象;在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第三無(wú)效矩形文本對(duì)象;在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第四無(wú)效矩形文本對(duì)象。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的無(wú)效邊距值y13、y14、x13、x14、y23、y24、x23和x24;其中,y13為奇數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y23為偶數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y13、y14、x13和x14確定奇數(shù)頁(yè)面組的無(wú)效版心;y13為奇數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值;y23、y24、x23和x24確定偶數(shù)頁(yè)面組的無(wú)效版心;y23為偶數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:將奇數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值與偶數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值分別進(jìn)行比較,分別得到最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值;根據(jù)最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值調(diào)整奇數(shù)頁(yè)面組的有效版心與偶數(shù)頁(yè)面組的有效版心的四邊邊距對(duì)應(yīng)的投影值。

在一種可選的實(shí)施方式中,可執(zhí)行指令進(jìn)一步使處理器執(zhí)行以下操作:將y11和y21中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,若y11和y21中的數(shù)值較大者小于數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,將y11和y21中的數(shù)值較大者設(shè)定為最大上邊距的投影值;將y12和y22中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值相比,若y12和y22中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值,將y12和y22中的數(shù)值較小者設(shè)定為最大下邊距的投影值;獲取奇數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x15,分別計(jì)算x11和x12到x15的距離值,獲取其中最大的距離值;根據(jù)最大的距離值重新設(shè)定奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的奇數(shù)頁(yè)面組的有效版心;經(jīng)修正的奇數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x11'和x12',x11'和x12'到x15的距離值均為x11和x12到x15中的最大的距離值;獲取偶數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x25,分別計(jì)算x21和x22到x25的距離值,獲取其中最大的距離值;根據(jù)最大的距離值重新設(shè)定偶數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的偶數(shù)頁(yè)面組的有效版心;經(jīng)修正的偶數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x21'和x22',x21'和x22'到x25的距離值均為x21和x22到x25中的最大的距離值;將x11'和x21'中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值相比,若x11'和x21'中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值,將x11'和x21'中的數(shù)值較小者設(shè)定為最大左邊距的投影值;將x12'和x22'中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值相比,若x12'和x22'中的數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值在x軸方向上的投影值,將x12'和x22'中的數(shù)值較大者設(shè)定為最大右邊距的投影值。

實(shí)施例四

圖5示出了根據(jù)本發(fā)明實(shí)施例四的一種電子設(shè)備的結(jié)構(gòu)示意圖,本發(fā)明具體實(shí)施例并不對(duì)電子設(shè)備的具體實(shí)現(xiàn)做限定。

如圖5所示,該電子設(shè)備可以包括:處理器(processor)502、通信接口(communicationsinterface)504、存儲(chǔ)器(memory)506、以及通信總線508。

其中:

處理器502、通信接口504、以及存儲(chǔ)器506通過(guò)通信總線508完成相互間的通信。

通信接口504,用于與其它設(shè)備比如客戶端或其它服務(wù)器等的網(wǎng)元通信。

處理器502,用于執(zhí)行程序510,具體可以執(zhí)行上述文本版心識(shí)別方法實(shí)施例中的相關(guān)步驟。

具體地,程序510可以包括程序代碼,該程序代碼包括計(jì)算機(jī)操作指令。

處理器502可能是中央處理器cpu,或者是特定集成電路asic(applicationspecificintegratedcircuit),或者是被配置成實(shí)施本發(fā)明實(shí)施例的一個(gè)或多個(gè)集成電路。電子設(shè)備包括的一個(gè)或多個(gè)處理器,可以是同一類型的處理器,如一個(gè)或多個(gè)cpu;也可以是不同類型的處理器,如一個(gè)或多個(gè)cpu以及一個(gè)或多個(gè)asic。

存儲(chǔ)器506,用于存放程序510。存儲(chǔ)器506可能包含高速ram存儲(chǔ)器,也可能還包括非易失性存儲(chǔ)器(non-volatilememory),例如至少一個(gè)磁盤存儲(chǔ)器。

程序510具體可以用于使得處理器502執(zhí)行以下操作:

在一種可選的實(shí)施方式中,程序510用于使得處理器502從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;根據(jù)該頁(yè)面組的投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象;根據(jù)該頁(yè)面組的投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

在一種可選的實(shí)施方式中,程序510用于使得處理器502根據(jù)各頁(yè)面中文字的字體和/或字號(hào)判斷頁(yè)面是否為包含正文的頁(yè)面,若否,則去除該頁(yè)面。

在一種可選的實(shí)施方式中,程序510用于使得處理器502對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象按照包括這些矩形文本對(duì)象的最小范圍進(jìn)行合并處理,得到包含合并處理后合的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。

在一種可選的實(shí)施方式中,程序510用于使得處理器502以該頁(yè)面組的投影頁(yè)面的左下角為原點(diǎn),設(shè)置頁(yè)面橫向?yàn)閤軸,頁(yè)面縱向?yàn)閥軸;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第一有效矩形文本對(duì)象;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第二有效矩形文本對(duì)象;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第三有效矩形文本對(duì)象;按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第四有效矩形文本對(duì)象。

在一種可選的實(shí)施方式中,程序510用于使得處理器502判斷矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的矩形高度是否小于預(yù)設(shè)高度,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾矩形文本對(duì)象。

在一種可選的實(shí)施方式中,程序510用于使得處理器502判斷矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾矩形文本對(duì)象;和/或,判斷矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾矩形文本對(duì)象。

在一種可選的實(shí)施方式中,程序510用于使得處理器502分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的有效邊距值y11、y12、x11、x12、y21、y22、x21和x22;其中,y11為奇數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y21為偶數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y11、y12、x11和x12確定奇數(shù)頁(yè)面組的有效版心;y11為奇數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值;y21、y22、x21和x22確定偶數(shù)頁(yè)面組的有效版心;y21為偶數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值。

在一種可選的實(shí)施方式中,程序510用于使得處理器502在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第一無(wú)效矩形文本對(duì)象;在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在y軸方向的第二無(wú)效矩形文本對(duì)象;在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第三無(wú)效矩形文本對(duì)象;在按照矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的投影頁(yè)面在x軸方向的第四無(wú)效矩形文本對(duì)象。

在一種可選的實(shí)施方式中,程序510用于使得處理器502分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的無(wú)效邊距值y13、y14、x13、x14、y23、y24、x23和x24;其中,y13為奇數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y23為偶數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y13、y14、x13和x14確定奇數(shù)頁(yè)面組的無(wú)效版心;y13為奇數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值;y23、y24、x23和x24確定偶數(shù)頁(yè)面組的無(wú)效版心;y23為偶數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值。

在一種可選的實(shí)施方式中,程序510用于使得處理器502將奇數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值與偶數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值分別進(jìn)行比較,分別得到最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值;根據(jù)最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值調(diào)整奇數(shù)頁(yè)面組的有效版心與偶數(shù)頁(yè)面組的有效版心的四邊邊距對(duì)應(yīng)的投影值。

在一種可選的實(shí)施方式中,程序510用于使得處理器502將y11和y21中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,若y11和y21中的數(shù)值較大者小于數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,將y11和y21中的數(shù)值較大者設(shè)定為最大上邊距的投影值;將y12和y22中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值相比,若y12和y22中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值,將y12和y22中的數(shù)值較小者設(shè)定為最大下邊距的投影值;獲取奇數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x15,分別計(jì)算x11和x12到x15的距離值,獲取其中最大的距離值;根據(jù)最大的距離值重新設(shè)定奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的奇數(shù)頁(yè)面組的有效版心;經(jīng)修正的奇數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x11'和x12',x11'和x12'到x15的距離值均為x11和x12到x15中的最大的距離值;獲取偶數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x25,分別計(jì)算x21和x22到x25的距離值,獲取其中最大的距離值;根據(jù)最大的距離值重新設(shè)定偶數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的偶數(shù)頁(yè)面組的有效版心;經(jīng)修正的偶數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x21'和x22',x21'和x22'到x25的距離值均為x21和x22到x25中的最大的距離值;將x11'和x21'中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值相比,若x11'和x21'中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值,將x11'和x21'中的數(shù)值較小者設(shè)定為最大左邊距的投影值;將x12'和x22'中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值相比,若x12'和x22'中的數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值在x軸方向上的投影值,將x12'和x22'中的數(shù)值較大者設(shè)定為最大右邊距的投影值。

程序510中各步驟的具體實(shí)現(xiàn)可以參見(jiàn)上述文本版心識(shí)別實(shí)施例中的相應(yīng)步驟中對(duì)應(yīng)的描述,在此不贅述。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的設(shè)備和模塊的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程描述,在此不再贅述。

通過(guò)本實(shí)施例提供的方案,通過(guò)對(duì)擇取的每個(gè)頁(yè)面以行為單位識(shí)別出的矩形文本對(duì)象,并將頁(yè)面組的頁(yè)面完全重疊設(shè)置后進(jìn)行投影、合并等處理,得到包含合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。對(duì)投影頁(yè)面中的矩形文本對(duì)象進(jìn)一步過(guò)濾,得到有效矩形文本對(duì)象,從而可以準(zhǔn)確的確定頁(yè)面組的版心。與現(xiàn)有技術(shù)相比,本發(fā)明以行為單位依次進(jìn)行處理,得到的版心的準(zhǔn)確度更精確,且整個(gè)完全不需要人工的參與,更快速高效。

在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。

在此處所提供的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書(shū)的理解。

類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書(shū)所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書(shū)由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。

本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。

此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。

應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。

本發(fā)明公開(kāi)了:

a1.一種文本版心識(shí)別方法,其包括:

從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將所述預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;

分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;

針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含所述合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;

根據(jù)該頁(yè)面組的所述投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)所述矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象;

根據(jù)該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

a2.根據(jù)a1所述的方法,其中,在所述從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面之后,所述將預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組之前,所述方法進(jìn)一步包括:

根據(jù)各頁(yè)面中文字的字體和/或字號(hào)判斷頁(yè)面是否為包含正文的頁(yè)面,若否,則去除該頁(yè)面。

a3.根據(jù)a1所述的方法,其中,所述對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含所述合并處理后合的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面進(jìn)一步包括:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象按照包括這些矩形文本對(duì)象的最小范圍進(jìn)行合并處理,得到包含所述合并處理后合的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。

a4.根據(jù)a1所述的方法,其中,所述根據(jù)該頁(yè)面組的所述投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)所述矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象進(jìn)一步包括:

以該頁(yè)面組的所述投影頁(yè)面的左下角為原點(diǎn),設(shè)置頁(yè)面橫向?yàn)閤軸,頁(yè)面縱向?yàn)閥軸;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第一有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第二有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第三有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第四有效矩形文本對(duì)象。

a5.根據(jù)a4所述的方法,其中,所述依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理進(jìn)一步包括:

判斷所述矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形高度是否小于預(yù)設(shè)高度,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾所述矩形文本對(duì)象。

a6.根據(jù)a4所述的方法,其中,所述依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理進(jìn)一步包括:

判斷所述矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾所述矩形文本對(duì)象。

a7.根據(jù)a4所述的方法,其中,在所述得到該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象之后,所述方法還包括:

分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的有效邊距值y11、y12、x11、x12、y21、y22、x21和x22;其中,y11為奇數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y21為偶數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;

y11、y12、x11和x12確定奇數(shù)頁(yè)面組的有效版心;y11為奇數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值;

y21、y22、x21和x22確定偶數(shù)頁(yè)面組的有效版心;y21為偶數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值。

a8.根據(jù)a7所述的方法,其中:

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),所述方法還包括:選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第一無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),所述方法還包括:選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第二無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),所述方法還包括:選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第三無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),所述方法還包括:選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第四無(wú)效矩形文本對(duì)象。

a9.根據(jù)a8所述的方法,其中,所述方法還包括:

分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的無(wú)效邊距值y13、y14、x13、x14、y23、y24、x23和x24;其中,y13為奇數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y23為偶數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;

y13、y14、x13和x14確定奇數(shù)頁(yè)面組的無(wú)效版心;y13為奇數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值;

y23、y24、x23和x24確定偶數(shù)頁(yè)面組的無(wú)效版心;y23為偶數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值。

a10.根據(jù)a9所述的方法,其中,所述方法還包括:

將所述奇數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值與所述偶數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值分別進(jìn)行比較,分別得到最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值;

根據(jù)所述最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值調(diào)整所述奇數(shù)頁(yè)面組的有效版心與所述偶數(shù)頁(yè)面組的有效版心的四邊邊距對(duì)應(yīng)的投影值。

a11.根據(jù)a10所述的方法,其中,所述將所述奇數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值與所述偶數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值分別進(jìn)行比較,分別得到最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值進(jìn)一步包括:

將y11和y21中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,若y11和y21中的數(shù)值較大者小于數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,將所述y11和y21中的數(shù)值較大者設(shè)定為最大上邊距的投影值;

將y12和y22中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值相比,若y12和y22中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值,將所述y12和y22中的數(shù)值較小者設(shè)定為最大下邊距的投影值;

獲取所述奇數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x15,分別計(jì)算x11和x12到x15的距離值,獲取其中最大的距離值;根據(jù)所述最大的距離值重新設(shè)定所述奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的所述奇數(shù)頁(yè)面組的有效版心;所述經(jīng)修正的所述奇數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x11'和x12',所述x11'和x12'到x15的距離值均為所述x11和x12到x15中的最大的距離值;

獲取所述偶數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x25,分別計(jì)算x21和x22到x25的距離值,獲取其中最大的距離值;根據(jù)所述最大的距離值重新設(shè)定所述偶數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的所述偶數(shù)頁(yè)面組的有效版心;所述經(jīng)修正的所述偶數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x21'和x22',所述x21'和x22'到x25的距離值均為所述x21和x22到x25中的最大的距離值;

將x11'和x21'中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值相比,若x11'和x21'中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值,將所述x11'和x21'中的數(shù)值較小者設(shè)定為最大左邊距的投影值;

將x12'和x22'中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值相比,若x12'和x22'中的數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值在x軸方向上的投影值,將所述x12'和x22'中的數(shù)值較大者設(shè)定為最大右邊距的投影值。

本發(fā)明還公開(kāi)了:

b12.一種電子設(shè)備,包括:處理器、存儲(chǔ)器、通信接口和通信總線,所述處理器、所述存儲(chǔ)器和所述通信接口通過(guò)所述通信總線完成相互間的通信;

所述存儲(chǔ)器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行以下操作:

從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將所述預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;

分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;

針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含所述合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;

根據(jù)該頁(yè)面組的所述投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)所述矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象;

根據(jù)該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

b13.根據(jù)b12所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

根據(jù)各頁(yè)面中文字的字體和/或字號(hào)判斷頁(yè)面是否為包含正文的頁(yè)面,若否,則去除該頁(yè)面。

b14.根據(jù)b12所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象按照包括這些矩形文本對(duì)象的最小范圍進(jìn)行合并處理,得到包含所述合并處理后合的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。

b15.根據(jù)b12所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

以該頁(yè)面組的所述投影頁(yè)面的左下角為原點(diǎn),設(shè)置頁(yè)面橫向?yàn)閤軸,頁(yè)面縱向?yàn)閥軸;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第一有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第二有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第三有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第四有效矩形文本對(duì)象。

b16.根據(jù)b15所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

判斷所述矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形高度是否小于預(yù)設(shè)高度,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾所述矩形文本對(duì)象。

b17.根據(jù)b15所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

判斷所述矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾所述矩形文本對(duì)象。

b18.根據(jù)b15所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的有效邊距值y11、y12、x11、x12、y21、y22、x21和x22;其中,y11為奇數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y21為偶數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;

y11、y12、x11和x12確定奇數(shù)頁(yè)面組的有效版心;y11為奇數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值;

y21、y22、x21和x22確定偶數(shù)頁(yè)面組的有效版心;y21為偶數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值。

b19.根據(jù)b18所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第一無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第二無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第三無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第四無(wú)效矩形文本對(duì)象。

b20.根據(jù)b19所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的無(wú)效邊距值y13、y14、x13、x14、y23、y24、x23和x24;其中,y13為奇數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y23為偶數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;

y13、y14、x13和x14確定奇數(shù)頁(yè)面組的無(wú)效版心;y13為奇數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值;

y23、y24、x23和x24確定偶數(shù)頁(yè)面組的無(wú)效版心;y23為偶數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值。

b21.根據(jù)b20所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

將所述奇數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值與所述偶數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值分別進(jìn)行比較,分別得到最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值;

根據(jù)所述最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值調(diào)整所述奇數(shù)頁(yè)面組的有效版心與所述偶數(shù)頁(yè)面組的有效版心的四邊邊距對(duì)應(yīng)的投影值。

b22.根據(jù)b21所述的電子設(shè)備,所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

將y11和y21中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,若y11和y21中的數(shù)值較大者小于數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,將所述y11和y21中的數(shù)值較大者設(shè)定為最大上邊距的投影值;

將y12和y22中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值相比,若y12和y22中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值,將所述y12和y22中的數(shù)值較小者設(shè)定為最大下邊距的投影值;

獲取所述奇數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x15,分別計(jì)算x11和x12到x15的距離值,獲取其中最大的距離值;根據(jù)所述最大的距離值重新設(shè)定所述奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的所述奇數(shù)頁(yè)面組的有效版心;所述經(jīng)修正的所述奇數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x11'和x12',所述x11'和x12'到x15的距離值均為所述x11和x12到x15中的最大的距離值;

獲取所述偶數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x25,分別計(jì)算x21和x22到x25的距離值,獲取其中最大的距離值;根據(jù)所述最大的距離值重新設(shè)定所述偶數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的所述偶數(shù)頁(yè)面組的有效版心;所述經(jīng)修正的所述偶數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x21'和x22',所述x21'和x22'到x25的距離值均為所述x21和x22到x25中的最大的距離值;

將x11'和x21'中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值相比,若x11'和x21'中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值,將所述x11'和x21'中的數(shù)值較小者設(shè)定為最大左邊距的投影值;

將x12'和x22'中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值相比,若x12'和x22'中的數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值在x軸方向上的投影值,將所述x12'和x22'中的數(shù)值較大者設(shè)定為最大右邊距的投影值。

本發(fā)明還公開(kāi)了:

c23.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行以下操作:

從文本中擇取預(yù)設(shè)頁(yè)數(shù)的頁(yè)面,將所述預(yù)設(shè)頁(yè)數(shù)的頁(yè)面按照頁(yè)碼分為奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組;

分別對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中每個(gè)頁(yè)面的文字以行為單位進(jìn)行識(shí)別,得到每個(gè)頁(yè)面中每行文字對(duì)應(yīng)的矩形文本對(duì)象;

針對(duì)奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組中的每一頁(yè)面組,進(jìn)行如下處理:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象進(jìn)行合并處理,得到包含所述合并處理后的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面;

根據(jù)該頁(yè)面組的所述投影頁(yè)面中矩形文本對(duì)象的矩形位置數(shù)據(jù)、矩形尺寸數(shù)據(jù)和/或矩形文本對(duì)象的文字信息,對(duì)所述矩形文本對(duì)象進(jìn)行過(guò)濾處理,得到該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象;

根據(jù)該頁(yè)面組的所述投影頁(yè)面的有效矩形文本對(duì)象,確定該頁(yè)面組的版心。

c24.根據(jù)c23所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

根據(jù)各頁(yè)面中文字的字體和/或字號(hào)判斷頁(yè)面是否為包含正文的頁(yè)面,若否,則去除該頁(yè)面。

c25.根據(jù)c23所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

對(duì)該頁(yè)面組的頁(yè)面進(jìn)行完全重疊設(shè)置,以垂直于頁(yè)面的方向?yàn)橥队胺较驅(qū)υ擁?yè)面組進(jìn)行投影處理,將在投影方向上具有相交區(qū)域的矩形文本對(duì)象按照包括這些矩形文本對(duì)象的最小范圍進(jìn)行合并處理,得到包含所述合并處理后合的矩形文本對(duì)象的該頁(yè)面組的投影頁(yè)面。

c26.根據(jù)c23所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

以該頁(yè)面組的所述投影頁(yè)面的左下角為原點(diǎn),設(shè)置頁(yè)面橫向?yàn)閤軸,頁(yè)面縱向?yàn)閥軸;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第一有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第二有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第三有效矩形文本對(duì)象;

按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理,選取最先未被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第四有效矩形文本對(duì)象。

c27.根據(jù)c26所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

判斷所述矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形高度是否小于預(yù)設(shè)高度,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾所述矩形文本對(duì)象。

c28.根據(jù)c26所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

判斷所述矩形文本對(duì)象的文字信息中包含重復(fù)文字內(nèi)容的重復(fù)率是否達(dá)到預(yù)設(shè)重復(fù)率,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的文字信息中包含的文字內(nèi)容是否均為數(shù)字,若是,則過(guò)濾所述矩形文本對(duì)象;

和/或,判斷所述矩形文本對(duì)象的矩形寬度是否小于預(yù)設(shè)寬度,若是,則過(guò)濾所述矩形文本對(duì)象。

c29.根據(jù)c26所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的有效邊距值y11、y12、x11、x12、y21、y22、x21和x22;其中,y11為奇數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;y21為偶數(shù)頁(yè)面組的投影頁(yè)面的第一有效矩形文本對(duì)象的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的投影頁(yè)面的第二有效矩形文本對(duì)象的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的投影頁(yè)面的第三有效矩形文本對(duì)象的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的投影頁(yè)面的第四有效矩形文本對(duì)象的右邊距在x軸方向上的投影值;

y11、y12、x11和x12確定奇數(shù)頁(yè)面組的有效版心;y11為奇數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y12為奇數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x11為奇數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x12為奇數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值;

y21、y22、x21和x22確定偶數(shù)頁(yè)面組的有效版心;y21為偶數(shù)頁(yè)面組的有效版心的上邊距在y軸方向上的投影值;y22為偶數(shù)頁(yè)面組的有效版心的下邊距在y軸方向上的投影值;x21為偶數(shù)頁(yè)面組的有效版心的左邊距在x軸方向上的投影值;x22為偶數(shù)頁(yè)面組的有效版心的右邊距在x軸方向上的投影值。

c30.根據(jù)c29所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第一無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在y軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行y軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在y軸方向的第二無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由小到大排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第三無(wú)效矩形文本對(duì)象;

在按照所述矩形文本對(duì)象的矩形位置數(shù)據(jù)在x軸方向上投影值由大到小排序,依照排序依次對(duì)矩形文本對(duì)象進(jìn)行x軸過(guò)濾處理時(shí),選取最后被過(guò)濾的矩形文本對(duì)象作為該頁(yè)面組的所述投影頁(yè)面在x軸方向的第四無(wú)效矩形文本對(duì)象。

c31.根據(jù)c30所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

分別獲取奇數(shù)頁(yè)面組和偶數(shù)頁(yè)面組的投影頁(yè)面的無(wú)效邊距值y13、y14、x13、x14、y23、y24、x23和x24;其中,y13為奇數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;y23為偶數(shù)頁(yè)面組的投影頁(yè)面的第一無(wú)效矩形文本對(duì)象的下邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的投影頁(yè)面的第二無(wú)效矩形文本對(duì)象的上邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的投影頁(yè)面的第三無(wú)效矩形文本對(duì)象的右邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的投影頁(yè)面的第四無(wú)效矩形文本對(duì)象的左邊距在x軸方向上的投影值;

y13、y14、x13和x14確定奇數(shù)頁(yè)面組的無(wú)效版心;y13為奇數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y14為奇數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x13為奇數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x14為奇數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值;

y23、y24、x23和x24確定偶數(shù)頁(yè)面組的無(wú)效版心;y23為偶數(shù)頁(yè)面組的無(wú)效版心的上邊距在y軸方向上的投影值;y24為偶數(shù)頁(yè)面組的無(wú)效版心的下邊距在y軸方向上的投影值;x23為偶數(shù)頁(yè)面組的無(wú)效版心的左邊距在x軸方向上的投影值;x24為偶數(shù)頁(yè)面組的無(wú)效版心的右邊距在x軸方向上的投影值。

c32.根據(jù)c31所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

將所述奇數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值與所述偶數(shù)頁(yè)面組的有效版心的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值分別進(jìn)行比較,分別得到最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值;

根據(jù)所述最大的上邊距和下邊距在y軸方向上的投影值、左邊距和右邊距在x軸方向上的投影值調(diào)整所述奇數(shù)頁(yè)面組的有效版心與所述偶數(shù)頁(yè)面組的有效版心的四邊邊距對(duì)應(yīng)的投影值。

c33.根據(jù)c32所述的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述可執(zhí)行指令進(jìn)一步使所述處理器執(zhí)行以下操作:

將y11和y21中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,若y11和y21中的數(shù)值較大者小于數(shù)值較小者對(duì)應(yīng)的無(wú)效版心上邊距在y軸方向上的投影值相比,將所述y11和y21中的數(shù)值較大者設(shè)定為最大上邊距的投影值;

將y12和y22中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值相比,若y12和y22中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心下邊距在y軸方向上的投影值,將所述y12和y22中的數(shù)值較小者設(shè)定為最大下邊距的投影值;

獲取所述奇數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x15,分別計(jì)算x11和x12到x15的距離值,獲取其中最大的距離值;根據(jù)所述最大的距離值重新設(shè)定所述奇數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的所述奇數(shù)頁(yè)面組的有效版心;所述經(jīng)修正的所述奇數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x11'和x12',所述x11'和x12'到x15的距離值均為所述x11和x12到x15中的最大的距離值;

獲取所述偶數(shù)頁(yè)面組的投影頁(yè)面的中軸在x軸方向上的投影值x25,分別計(jì)算x21和x22到x25的距離值,獲取其中最大的距離值;根據(jù)所述最大的距離值重新設(shè)定所述偶數(shù)頁(yè)面組的有效版心的左邊距對(duì)應(yīng)的投影值和右邊距對(duì)應(yīng)的投影值,得到經(jīng)修正的所述偶數(shù)頁(yè)面組的有效版心;所述經(jīng)修正的所述偶數(shù)頁(yè)面組的有效版心的左邊距和右邊距在x軸方向上的投影值分別為x21'和x22',所述x21'和x22'到x25的距離值均為所述x21和x22到x25中的最大的距離值;

將x11'和x21'中的數(shù)值較小者與數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值相比,若x11'和x21'中的數(shù)值較小者大于數(shù)值較大者對(duì)應(yīng)的無(wú)效版心左邊距在x軸方向上的投影值,將所述x11'和x21'中的數(shù)值較小者設(shè)定為最大左邊距的投影值;

將x12'和x22'中的數(shù)值較大者與數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值相比,若x12'和x22'中的數(shù)值較小者對(duì)應(yīng)的無(wú)效版心右邊距在x軸方向上的投影值在x軸方向上的投影值,將所述x12'和x22'中的數(shù)值較大者設(shè)定為最大右邊距的投影值。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
册亨县| 团风县| 夏津县| 克山县| 渭源县| 新源县| 朝阳县| 嵊泗县| 阜宁县| 开化县| 龙游县| 辉南县| 丽江市| 泗洪县| 衡阳市| 浪卡子县| 洪泽县| 岳西县| 土默特右旗| 敦煌市| 股票| 凌海市| 通州市| 胶南市| 北宁市| 宜川县| 米泉市| 太仆寺旗| 民权县| 大石桥市| 紫阳县| 嘉鱼县| 塔城市| 潮州市| 双鸭山市| 南通市| 儋州市| 长乐市| 乾安县| 凉城县| 小金县|