两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

圖片文檔的處理方法及裝置的制作方法

文檔序號(hào):6444149閱讀:207來(lái)源:國(guó)知局
專利名稱:圖片文檔的處理方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖片處理領(lǐng)域,具體而言,涉及一種圖片文檔的處理方法及裝置。
背景技術(shù)
現(xiàn)有技術(shù)的用于支持版面重排的閱讀工具主要針對(duì)版式文檔,如PDF,CEBX, EPUB等。這類文件本身包含了基于內(nèi)容的信息,如文字的編碼、文字的位置、文字的字號(hào)字體、插圖位置、圖形的表達(dá)式等等。這些都為根據(jù)不同的分辨率重新排列顯示形式提供了便利。但針對(duì)經(jīng)過(guò)掃描后的圖片格式文檔,使用上述現(xiàn)有技術(shù)進(jìn)行重排之前,需要先通過(guò)OCR識(shí)別等技術(shù)進(jìn)行識(shí)別,而OCR識(shí)別技術(shù)本身還存在著錯(cuò)誤率、兼容性等問(wèn)題。而且對(duì)于漫畫圖像或者掃描版的PDF等,由于沒(méi)有相關(guān)的頁(yè)面與OCR信息,所以無(wú)法直接進(jìn)行重排。為了解決該問(wèn)題,可以采用借助版式文檔的重排工具,但必須先將掃描圖像后的圖片格式文件轉(zhuǎn)換成相應(yīng)的版式文檔,該方式需要大量的處理時(shí)間,而且轉(zhuǎn)換后的內(nèi)容在識(shí)別過(guò)程中會(huì)出現(xiàn)許多錯(cuò)誤,影響重排結(jié)果,另外,由于閱讀工具必須支持多種文件格式,增加了開發(fā)成本,不具有通用性。針對(duì)掃描后的圖片文件,如BMP,JPEG格式文件,或者無(wú)版式信息的掃描版PDF文件,目前可以采用如下處理方式為用戶提供閱讀通過(guò)對(duì)圖片文件做切白邊的處理,得到只顯示圖片中間的有效內(nèi)容,可有效利用顯示面積;或者按照閱讀順序切換顯示焦點(diǎn),如從上到下,從左到右,這種方式僅進(jìn)行了局部顯示,即對(duì)圖片格式文件的局部?jī)?nèi)容放大后顯示。上述方式存在如下問(wèn)題使用切白邊對(duì)于大文檔,如A4,在顯示屏幕小的設(shè)備(如手機(jī))上,顯示仍然很小,無(wú)法直接閱讀。而使用焦點(diǎn)轉(zhuǎn)移的方式閱讀還是很不方便,不符合人的閱讀習(xí)慣。目前針對(duì)相關(guān)技術(shù)的在閱讀圖片文檔的過(guò)程中,現(xiàn)有的閱讀工具存在閱讀效率低、易出錯(cuò),且開發(fā)成本高的問(wèn)題,目前尚未提出有效的解決方案。

發(fā)明內(nèi)容
針對(duì)相關(guān)技術(shù)的在閱讀圖片文檔的過(guò)程中,現(xiàn)有的閱讀工具存在閱讀效率低、易出錯(cuò),且開發(fā)成本高的問(wèn)題,目前尚未提出有效的問(wèn)題而提出本發(fā)明,為此,本發(fā)明的主要目的在于提供一種圖片文檔的處理方法及裝置,以解決上述問(wèn)題。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種圖片文檔的處理方法,該方法包括對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像;將基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型;根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù);在顯示區(qū)域中顯示圖片區(qū)塊的顯示數(shù)據(jù)。進(jìn)一步地,圖片區(qū)塊的類型包括以下一種或多種類型文字區(qū)塊、圖像區(qū)塊、表格區(qū)塊,其中,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型包括檢測(cè)圖片區(qū)塊的文檔內(nèi)容屬性,其中,當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差在預(yù)定范圍之內(nèi)時(shí),確定圖片區(qū)塊為文字區(qū)塊;當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差大在預(yù)定范圍之外時(shí),確定圖片區(qū)塊為圖像區(qū)塊;當(dāng)檢測(cè)到圖片區(qū)塊中包括一條或多條表格線時(shí),確定圖片區(qū)塊為表格區(qū)塊。進(jìn)一步地,在圖片區(qū)塊為文字區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的字符顯示特征,字符顯示特征包括字符大小、字符間距和字符行距;根據(jù)字符顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目;依次讀取文字區(qū)塊中所有的字符,并按照顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目將字符縮放后進(jìn)行依次排序,得到文字區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。進(jìn)一步地,在依次讀取文字區(qū)塊中所有的字符之前,方法還包括讀取文字區(qū)塊中的所有字符連通域;計(jì)算得到字符連通域的高度參考值,根據(jù)高度參考值來(lái)遍歷所有字符連通域以對(duì)文字區(qū)塊中的字塊分行;根據(jù)字符的結(jié)構(gòu)特征,對(duì)每行中的字符塊進(jìn)行單字切分和處理,以得到文字區(qū)塊中所有的字符,其中,當(dāng)字符為漢字的情況下,對(duì)每行中的字符塊進(jìn)行單字切分包括將縱向坐標(biāo)中上下關(guān)聯(lián)的連通域合并為一個(gè)字符塊,并將橫向坐標(biāo)中左右相鄰距離小于等于預(yù)定值的連通域合并為一個(gè)字符塊。進(jìn)一步地,在圖片區(qū)塊為表格區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括提取表格區(qū)塊中的表格線,并根據(jù)表格線對(duì)表格進(jìn)行劃分,得到一個(gè)或多個(gè)具有行列坐標(biāo)的單元格;根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的單元格顯示特征,單元格顯示特征包括單元格大小、單元格間距和單元格行距;根據(jù)單元格顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目;依次讀取表格區(qū)塊中所有的單元格,并按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將單元格縮放后進(jìn)行依次排序,得到表格區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。進(jìn)一步地,依次讀取表格區(qū)塊中所有的單元格,并按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將單元格縮放后進(jìn)行依次排序,得到表格區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)包括提取表格區(qū)塊中的所有表頭單元格;按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)表頭單元格在顯示區(qū)域中的表頭坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到顯示區(qū)域中已經(jīng)確定的表頭坐標(biāo)位置;讀取表格區(qū)塊中的字符單元格;根據(jù)已經(jīng)確定的表頭坐標(biāo)位置和顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)字符單元格的字符坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到顯示區(qū)域中已經(jīng)確定的字符坐標(biāo)位置;其中,在各個(gè)表頭單元格的表頭坐標(biāo)位置確定之后,在每一個(gè)顯示區(qū)域中的相同坐標(biāo)位置復(fù)制相同的表頭單元格。進(jìn)一步地,在圖片區(qū)塊為圖像區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的圖像顯示特征,圖像顯示特征包括圖像大小、圖像間距和圖像行距;根據(jù)圖像顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目;依次提取圖像區(qū)塊中的一個(gè)或多個(gè)子圖像,并按照顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目將子圖像縮放后進(jìn)行依次排序,得到圖像區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。進(jìn)一步地,在提取圖像區(qū)塊中的一個(gè)或多個(gè)子圖像之后,方法還包括通過(guò)直方圖均衡算法對(duì)各個(gè)子圖像進(jìn)行處理,以獲取對(duì)比度超過(guò)預(yù)定值的子圖像。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種圖片文檔的處理裝置,該裝置包括預(yù)處理模塊,用于對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像;切分模塊,用于將基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型;重排模塊,用于根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù);顯示模塊,用于在顯示區(qū)域中顯示圖片區(qū)塊的顯示數(shù)據(jù)。進(jìn)一步地,圖片區(qū)塊的類型包括以下一種或多種類型文字區(qū)塊、圖像區(qū)塊、表格區(qū)塊,其中,切分模塊包括檢測(cè)模塊,用于檢測(cè)圖片區(qū)塊的文檔內(nèi)容屬性;第一獲取模塊,用于當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差在預(yù)定范圍之內(nèi)時(shí),確定圖片區(qū)塊為文字區(qū)塊;第二獲取模塊,用于當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差大在預(yù)定范圍之外時(shí),確定圖片區(qū)塊為圖像區(qū)塊;第二獲取模塊,用于當(dāng)檢測(cè)到圖片區(qū)塊中包括一條或多條表格線時(shí),確定圖片區(qū)塊為表格區(qū)塊。進(jìn)一步地,在圖片區(qū)塊為文字區(qū)塊的情況下,重排模塊包括設(shè)置模塊,用于根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的字符顯示特征,字符顯示特征包括字符大小、字符間距和字符行距;計(jì)算模塊,用于根據(jù)字符顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目;排序模塊,用于依次讀取文字區(qū)塊中所有的字符,并按照顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目將字符縮放后進(jìn)行依次排序,得到文字區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。進(jìn)一步地,在圖片區(qū)塊為表格區(qū)塊的情況下,重排模塊包括處理模塊,用于提取表格區(qū)塊中的表格線,并根據(jù)表格線對(duì)表格進(jìn)行劃分,得到一個(gè)或多個(gè)具有行列坐標(biāo)的單元格;設(shè)置模塊,用于根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的單元格顯示特征,單元格顯示特征包括單元格大小、單元格間距和單元格行距;計(jì)算模塊,用于根據(jù)單元格顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目;排序模塊,用于依次讀取表格區(qū)塊中所有的單元格,并按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將單元格縮放后進(jìn)行依次排序,得到表格區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。進(jìn)一步地,在圖片區(qū)塊為圖像區(qū)塊的情況下,重排模塊包括設(shè)置模塊,用于根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的圖像顯示特征,圖像顯示特征包括圖像大小、圖像間距和圖像行距;計(jì)算模塊,用于根據(jù)圖像顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目;排序模塊,用于依次提取圖像區(qū)塊中的一個(gè)或多個(gè)子圖像,并按照顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目將子圖像縮放后進(jìn)行依次排序,得到圖像區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。通過(guò)本發(fā)明,采用對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像;將基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型;根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù);在顯示區(qū)域中顯示圖片區(qū)塊的顯示數(shù)據(jù),解決了相關(guān)現(xiàn)有技術(shù)的在閱讀圖片文檔的過(guò)程中,現(xiàn)有的閱讀工具存在閱讀效率低、易出錯(cuò),且開發(fā)成本高的問(wèn)題,進(jìn)而實(shí)現(xiàn)直接在圖片文檔的圖像層面上將版面重排,無(wú)需使用閱讀工具,提高了閱讀效率,避免了閱讀工具轉(zhuǎn)換過(guò)程中存在的轉(zhuǎn)換錯(cuò)誤,同時(shí)也降低了開發(fā)成本的效果。


此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中圖1是根據(jù)本發(fā)明實(shí)施例的圖片文檔的處理裝置的結(jié)構(gòu)示意圖;圖是根據(jù)圖1所示實(shí)施例的對(duì)圖片文檔進(jìn)行預(yù)處理的結(jié)果示意圖;圖3是根據(jù)圖1所示實(shí)施例的對(duì)圖片文檔進(jìn)行區(qū)塊分割的結(jié)果示意圖;圖4是根據(jù)圖3所示實(shí)施例的對(duì)文字區(qū)塊進(jìn)行字塊分行處理的結(jié)果示意圖;圖5是根據(jù)圖4所示實(shí)施例的對(duì)文字區(qū)塊進(jìn)行單字切分處理的結(jié)果示意圖;圖6是根據(jù)圖5所示實(shí)施例的對(duì)文字區(qū)塊進(jìn)行重排處理的結(jié)果示意圖;圖7a_7c是根據(jù)圖3所示實(shí)施例的對(duì)表格區(qū)塊進(jìn)行重排處理的結(jié)果示意圖;圖8a_8b是根據(jù)圖3所示實(shí)施例的對(duì)圖像區(qū)塊進(jìn)行重排處理的結(jié)果示意圖;圖9是根據(jù)本發(fā)明實(shí)施例的圖片文檔的處理方法的流程圖;圖10是根據(jù)圖9所示實(shí)施例的圖片文檔的處理方法的詳細(xì)流程圖;圖Ila-Ilb是根據(jù)圖9所示實(shí)施例的圖塊的切分方法流程圖;圖12是根據(jù)圖9所示實(shí)施例的文字區(qū)塊的處理方法流程圖;圖13是根據(jù)圖9所示實(shí)施例的表格區(qū)塊的處理方法流程圖;圖14是根據(jù)圖9所示實(shí)施例的閱讀順序的分析流程圖。
具體實(shí)施例方式需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。圖1是根據(jù)本發(fā)明實(shí)施例的圖片文檔的處理裝置的結(jié)構(gòu)示意圖;圖是根據(jù)圖1所示實(shí)施例的對(duì)圖片文檔進(jìn)行預(yù)處理的結(jié)果示意圖;圖3是根據(jù)圖1所示實(shí)施例的對(duì)圖片文檔進(jìn)行區(qū)塊分割的結(jié)果示意圖;圖4是根據(jù)圖3所示實(shí)施例的對(duì)文字區(qū)塊進(jìn)行字塊分行處理的結(jié)果示意圖;圖5是根據(jù)圖4所示實(shí)施例的對(duì)文字區(qū)塊進(jìn)行單字切分處理的結(jié)果示意圖;圖6是根據(jù)圖5所示實(shí)施例的對(duì)文字區(qū)塊進(jìn)行重排處理的結(jié)果示意圖;圖7a-7c是根據(jù)圖3所示實(shí)施例的對(duì)表格區(qū)塊進(jìn)行重排處理的結(jié)果示意圖;圖8a-8b是根據(jù)圖3所示實(shí)施例的對(duì)圖像區(qū)塊進(jìn)行重排處理的結(jié)果示意圖。如圖1所示,該圖片文檔的處理裝置包括預(yù)處理模塊10,用于對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像;切分模塊30,用于將基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型;重排模塊50,用于根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù);顯示模塊70,用于在顯示區(qū)域中顯示圖片區(qū)塊的顯示數(shù)據(jù)。本申請(qǐng)上述實(shí)施例通過(guò)對(duì)進(jìn)行預(yù)處理后的圖片文檔進(jìn)行切分,并將各種切分后圖像字塊縮放后按新的顯示要求貼圖到顯示區(qū)域的指定位置上。由于該實(shí)施例中直接利用圖像處理技術(shù)對(duì)圖片文檔進(jìn)行了預(yù)處理和分析,因此無(wú)需采用OCR技術(shù)進(jìn)行閱讀,提高了閱讀效率,避免了使用閱讀工具轉(zhuǎn)換圖片文件過(guò)程中存在的轉(zhuǎn)換錯(cuò)誤,同時(shí)也降低了開發(fā)成本的效果。該技術(shù)尤其適合目前的手持設(shè)備,如智能手機(jī)、電子書、平板電腦。當(dāng)前的這些設(shè)備中,使得對(duì)于掃描版的圖片文檔(例如BMP圖片、JPEG圖片、掃描版PDF或漫畫)的處理不僅僅是切除白邊和按注意區(qū)域轉(zhuǎn)移顯示,可以進(jìn)一步滿足用戶的閱讀需求,提供更好的用戶體驗(yàn)。具體的,如圖所示,上述實(shí)施利中對(duì)如圖加所示的圖片文檔(原始灰度圖)進(jìn)行預(yù)處理,可以實(shí)現(xiàn)根據(jù)圖像質(zhì)量和類型進(jìn)行包括以下的一種或幾種處理降噪,灰度校正,幾何校正,傾斜矯正,去黑邊,二值化,連通域生成與合并等。例如,首先對(duì)圖加進(jìn)行二值化處理得到圖2b,可以采用閾值分割算法OTSU將原始灰度圖像轉(zhuǎn)換成二值圖像;然后,在如圖2b所示的二值圖像的基礎(chǔ)上進(jìn)行連通域分析得到圖2c,例如采用查找代表文字的黑像素的方式得到初始連通域,可以通過(guò)以一個(gè)黑像素點(diǎn)為開始,搜尋其周圍8鄰域的像素點(diǎn),如果鄰域上的像素點(diǎn)也為黑像素點(diǎn)則認(rèn)為它們是一個(gè)連通域內(nèi)的像素點(diǎn),接著依次再計(jì)算鄰域上黑像素點(diǎn)的鄰域,最終找出一片相連的黑像素點(diǎn)區(qū)域,這個(gè)就是一個(gè)連通域。查找圖像中其他沒(méi)有計(jì)算過(guò)的位置,重復(fù)上述步驟,即可找出所有的連通域。對(duì)于每個(gè)連通域,其中每個(gè)像素點(diǎn)的X,y坐標(biāo),在一個(gè)連通域中所有的像素點(diǎn)計(jì)算最小和最大的X,y,即可得到該連通域的上下左右的邊界坐標(biāo),即計(jì)算出了最小的外接矩形四個(gè)頂點(diǎn),坐標(biāo)分別為(xmin, ymin)、(xmin, ymax)、(xmax, ymin)、(xmax, ymax);在得至Il 圖片文檔的初始連通域圖2c之后,對(duì)圖2c進(jìn)行連通域合并得到圖2d和加,例如,例如圖加中,由于漢字字符的筆畫及偏旁,需要對(duì)初始連通域中的包含和相交的矩形進(jìn)行合并,以提高后續(xù)的處理準(zhǔn)確率。本申請(qǐng)上述實(shí)施例中的圖片區(qū)塊的類型可以包括以下一種或多種類型文字區(qū)塊、圖像區(qū)塊、表格區(qū)塊,其中,切分模塊30包括檢測(cè)模塊,用于檢測(cè)圖片區(qū)塊的文檔內(nèi)容屬性;第一獲取模塊,用于當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差在預(yù)定范圍之內(nèi)時(shí),確定圖片區(qū)塊為文字區(qū)塊;第二獲取模塊,用于當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差大在預(yù)定范圍之外時(shí),確定圖片區(qū)塊為圖像區(qū)塊;第二獲取模塊,用于當(dāng)檢測(cè)到圖片區(qū)塊中包括一條或多條表格線時(shí),確定圖片區(qū)塊為表格區(qū)塊。該實(shí)施例提供了將整個(gè)圖片文檔中不同屬性的區(qū)塊區(qū)分開,以便于使用不同的方式進(jìn)行重排處理。上述實(shí)施例中針對(duì)區(qū)塊的切分模塊30具體可以實(shí)現(xiàn),將圖片文檔版面中的元素按內(nèi)容的屬性分成各類區(qū)塊。具體的,可以利用空白間隙查找的方法將連通域分割成許多大塊;或者直接計(jì)算圖像中各個(gè)像素點(diǎn)的鄰域特征,利用不同的特征數(shù)值將版面分割成一些區(qū)塊。例如,如果確定在圖片文檔中分隔出多幅圖像漫畫,則可以利用子圖間的間隙以及子圖內(nèi)的連通域,將整圖切分成幾個(gè)小圖。具體的如圖3所示,在以連通域?yàn)榛A(chǔ)的圖2e中,可以利用自底向上的合并算法或自上向下的空白區(qū)域分隔算法將文檔圖像分成很多區(qū)塊。在分割成很多區(qū)塊后,可以按照區(qū)塊中的屬性特征判斷區(qū)塊的具體類型,以便后續(xù)進(jìn)一步處理,例如,需要判斷每個(gè)區(qū)塊是文字還是插圖??梢岳脠D像的屬性,比如文字區(qū)塊中連通域的矩形大小一般比較均勻;而插圖中可能大小不一;表格中會(huì)有各種相交的表格線。在切分得到多個(gè)區(qū)塊之后,區(qū)塊類型包括文字區(qū)塊、插像區(qū)塊、插形區(qū)塊(線條圖)、表格區(qū)塊、公式區(qū)塊等等。所能利用的文檔內(nèi)容屬性的特征包括但不限于一下特征連通域的尺寸、連通域的空間分布周期性、尺寸的不均衡性、黑像素密度、黑游程長(zhǎng)度及其統(tǒng)計(jì)特征、灰度分布特征、游程統(tǒng)計(jì)特征、頻域特征、直方圖分布特征、梯度分布特征、分型特征、各種紋理特征等;而判斷方法可以采用根據(jù)各種特征設(shè)定閾值,然后決策樹判斷,也可使用樣本集訓(xùn)練的方式,如神經(jīng)網(wǎng)絡(luò)、支撐向量機(jī)等。具體的,可以對(duì)各種文檔內(nèi)容屬性的特征設(shè)定閾值,由決策樹進(jìn)行判斷,例如采用連通域的長(zhǎng)寬的統(tǒng)計(jì)分布作為特征,則文字區(qū)域長(zhǎng)寬較為均一,即方差較?。粓D像區(qū)域的連通域長(zhǎng)寬的方差較小。根據(jù)閾值的大小即可區(qū)分;也可使用樣本集訓(xùn)練的方式,如神經(jīng)網(wǎng)絡(luò)、支撐向量機(jī)等。本申請(qǐng)上述實(shí)施例中,在圖片區(qū)塊為文字區(qū)塊的情況下,重排模塊50可以包括設(shè)置模塊501,用于根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的字符顯示特征,字符顯示特征包括字符大小、字符間距和字符行距;計(jì)算模塊502,用于根據(jù)字符顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目;排序模塊503,用于依次讀取文字區(qū)塊中所有的字符,并按照顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目將字符縮放后進(jìn)行依次排序,得到文字區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。上述實(shí)施利通過(guò)對(duì)文字區(qū)塊的處理為文字區(qū)塊的重排操作做預(yù)備,具體的,可以對(duì)對(duì)文字區(qū)塊中的字符進(jìn)行如下處理成行(列),單字切分,字符分類(標(biāo)點(diǎn)不能出現(xiàn)在行頭,英文單詞、拼音、數(shù)字不能在行尾出現(xiàn)斷續(xù)),公式區(qū)域判斷(當(dāng)成圖像直接摳圖),文字屬性分析(大小、粗細(xì)(參考dpi))。在得到所有字符進(jìn)行處理之后,可以根據(jù)設(shè)定的字體大小、字間距(可計(jì)算并保留原始值)、行間距(可計(jì)算并保留原始值)、原始dpi和目標(biāo)顯示分辨率,計(jì)算單字塊、大區(qū)塊的映射位置,同時(shí)在對(duì)每個(gè)字符進(jìn)行縮放之后,將各個(gè)字符塊拷貝到目標(biāo)顯示區(qū)域。具體的,首先,需要根據(jù)目標(biāo)屏幕的大小,通過(guò)用戶設(shè)定的在目標(biāo)顯示區(qū)域中的期望字符大小、字間距、行距,計(jì)算每個(gè)屏幕上顯示區(qū)域的字行數(shù)和每行中的字?jǐn)?shù),并將字符的矩形區(qū)域圖像貼到目標(biāo)區(qū)域上的相應(yīng)位置即可。在對(duì)文字區(qū)塊的處理過(guò)程中還需要考慮字符類型和排版習(xí)慣,如標(biāo)點(diǎn)不能出現(xiàn)在行頭,英文單詞、拼音、數(shù)字不能在行尾出現(xiàn)斷續(xù)。具體的,可以判斷每個(gè)字符的屬性是否是標(biāo)點(diǎn),在,版面重排的時(shí)候,由于閱讀習(xí)慣中,標(biāo)點(diǎn)是不能放在一行的最前的,正常對(duì)于一行的寬度和要放置的字符寬度、間隔,需要計(jì)算出這一行能放多少個(gè)字符。如果檢測(cè)到下一行的開始是一個(gè)標(biāo)點(diǎn),那么在在上一行可以細(xì)微調(diào)整字間距,將標(biāo)點(diǎn)放置在這一行末。優(yōu)選地,在依次讀取文字區(qū)塊中所有的字符之前,可以讀取文字區(qū)塊中的所有字符連通域;計(jì)算得到字符連通域的高度參考值,根據(jù)高度參考值來(lái)遍歷所有字符連通域以對(duì)文字區(qū)塊中的字塊分行;根據(jù)字符的結(jié)構(gòu)特征,對(duì)每行中的字符塊進(jìn)行單字切分和處理,以得到文字區(qū)塊中所有的字符,其中,當(dāng)字符為漢字的情況下,對(duì)每行中的字符塊進(jìn)行單字切分包括將縱向坐標(biāo)中上下關(guān)聯(lián)的連通域合并為一個(gè)字符塊,并將橫向坐標(biāo)中左右相鄰距離小于等于預(yù)定值的連通域合并為一個(gè)字符塊。同時(shí),可以對(duì)合并后的字塊進(jìn)行判斷,只有在合并后的字符寬高滿足預(yù)定范圍時(shí),則對(duì)連通域進(jìn)行合并。具體的,如圖4所示,上述實(shí)施利具體實(shí)現(xiàn)方式如下首先對(duì)文字區(qū)塊中的字符進(jìn)行字塊分行處理,在字塊的處理中,將字符連通域進(jìn)行成行處理,有助于字塊分析、單字切分。這也是版面分析中的一個(gè)常用步驟;另外,還可使用如下方式首先統(tǒng)計(jì)字塊中的所有連通域的高度,計(jì)算概率最大的高度值,以此作為行高的參考值。通過(guò)上述處理方式遍歷所有的連通域,如果該連通域不屬于任何行,則新建一個(gè)行,以當(dāng)前連通域外接矩形的中心上下半個(gè)行高做兩條水平線(橫排版),凡是中心點(diǎn)位于這兩條線中間的連通域均屬于這個(gè)新行,直至處理所有的連通域。然后,在字塊分行處理完成后,如圖5所示,對(duì)文字區(qū)塊字塊進(jìn)行分行處理使得頁(yè)面成行之后,由于漢字有上下結(jié)構(gòu),對(duì)字塊進(jìn)行單字切分處理,即合并行內(nèi)上下關(guān)系的連通域?yàn)橐粋€(gè)字符。同時(shí)漢字是方塊字,挑選出不接近正方形的外接矩形,如果這些連通域有左右很近的,合并后的字符寬高是否符合大多數(shù)字符的寬高特征,如果符合則合并,如果不符合則保持分離。最后,以圖5中所示的文字區(qū)塊為例,在目標(biāo)顯示區(qū)域?yàn)槊總€(gè)字長(zhǎng)寬均為50個(gè)像素,屏幕寬500像素,高600像素,字間距10,行間距20,如圖6所示,每頁(yè)只能排布8行,每行8個(gè)字符。因?yàn)?0*8+9*10 = 490 < 500,50*8+腫20 = 580 < 600。圖6為第一頁(yè)顯示區(qū)域,圖5中的文字以上述方式依次以圖6所示的布局進(jìn)行顯示。本申請(qǐng)上述實(shí)施例中,在圖片區(qū)塊為表格區(qū)塊的情況下,重排模塊50根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括處理模塊,用于提取表格區(qū)塊中的表格線,并根據(jù)表格線對(duì)表格進(jìn)行劃分,得到一個(gè)或多個(gè)具有行列坐標(biāo)的單元格;設(shè)置模塊501,用于根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的單元格顯示特征,單元格顯示特征包括單元格大小、單元格間距和單元格行距;計(jì)算模塊502,用于根據(jù)單元格顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目;排序模塊503,用于依次讀取表格區(qū)塊中所有的單元格,并按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將單元格縮放后進(jìn)行依次排序,得到表格區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。表格區(qū)塊處理模塊上述實(shí)施例通過(guò)可將整個(gè)表格區(qū)塊當(dāng)做圖像顯示,首先通過(guò)提取表格區(qū)塊中的表格線來(lái)將表格區(qū)塊切分成多個(gè)單元格,然后對(duì)單元格進(jìn)行排列分析,同時(shí)提取字符塊,通過(guò)計(jì)算行、列數(shù)確定每個(gè)單元格在顯示頁(yè)面中的具體位置以及縮放的大小。在經(jīng)過(guò)上述針對(duì)單元格的分析之后,可實(shí)現(xiàn)設(shè)置按多行顯示或多列顯示,或定位行列區(qū)域顯示。具體的,如圖7a_7c所示,利用表格線,以及文字成行的方法,可以將圖7a所示的表格分成具有行列坐標(biāo)的單元格。同上文字區(qū)塊中的文字排布方式,可以根據(jù)目標(biāo)屏幕大小及單元格大小,將每個(gè)單元格縮放后貼到顯示區(qū)域的相應(yīng)位置。為了方便閱讀,可以在每頁(yè)均復(fù)制貼上表頭(及第一行)信息。優(yōu)選地,上述實(shí)施利中,依次讀取表格區(qū)塊中所有的單元格,并按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將單元格縮放后進(jìn)行依次排序,得到表格區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)的步驟可以包括提取表格區(qū)塊中的所有表頭單元格;按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)表頭單元格在顯示區(qū)域中的表頭坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到顯示區(qū)域中已經(jīng)確定的表頭坐標(biāo)位置;讀取表格區(qū)塊中的字符單元格;根據(jù)已經(jīng)確定的表頭坐標(biāo)位置和顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)字符單元格的字符坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到顯示區(qū)域中已經(jīng)確定的字符坐標(biāo)位置;其中,在各個(gè)表頭單元格的表頭坐標(biāo)位置確定之后,在每一個(gè)顯示區(qū)域中的相同坐標(biāo)位置復(fù)制相同的表頭單元格。本申請(qǐng)上述實(shí)施例中,在圖片區(qū)塊為圖像區(qū)塊的情況下,重排模塊50包括設(shè)置模塊501,用于根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的圖像顯示特征,圖像顯示特征包括圖像大小、圖像間距和圖像行距;計(jì)算模塊502,用于根據(jù)圖像顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目;排序模塊503,用于依次提取圖像區(qū)塊中的一個(gè)或多個(gè)子圖像,并按照顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目將子圖像縮放后進(jìn)行依次排序,得到圖像區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。本申請(qǐng)上述實(shí)施例通過(guò)對(duì)圖像區(qū)塊進(jìn)行處理,例如進(jìn)行灰度調(diào)整,從而增強(qiáng)對(duì)比度或亮度;以及對(duì)圖像區(qū)塊進(jìn)行二值化處理,使得顯示更清晰,并將處理后的圖像按照目標(biāo)顯示區(qū)域的大小進(jìn)行放縮顯示。具體的,如圖8a_8b所示,將圖8a所示的圖像區(qū)塊進(jìn)行直方圖均衡處理得到圖8b。例如,對(duì)于對(duì)比度不高的圖像可以進(jìn)行對(duì)比度增強(qiáng),這里使用圖像處理算法中常用的直方圖均衡。對(duì)于文字區(qū)塊,可以使用灰度圖,也可以使用二值圖。如果是二值圖,則不需調(diào)整。該處理改善了視覺效果,提高了用戶體驗(yàn)。由上對(duì)各個(gè)區(qū)塊的版面重排操作,使得各類區(qū)塊在目標(biāo)顯示區(qū)域得到預(yù)定的顯示效果。在版面重排后,可實(shí)現(xiàn)如下的調(diào)整設(shè)置按多行顯示或多列顯示,或定位行列區(qū)域顯示;對(duì)于漫畫文檔可按照設(shè)定順序顯示,如從上到下從左到右;可通過(guò)縮放各個(gè)單字塊或大的圖像、表格區(qū)塊,以及調(diào)整文字筆畫粗細(xì)或濃淡程度重排效果進(jìn)行調(diào)整;通過(guò)對(duì)字體的二值化分割和區(qū)域標(biāo)定,利用填充算法,調(diào)整字符與背景的顏色。本申請(qǐng)上述實(shí)施例實(shí)現(xiàn)了在不利用OCR技術(shù)的情況下,對(duì)圖片文檔的頁(yè)面圖像進(jìn)行切分。判斷頁(yè)面中區(qū)塊的屬性。如果是圖像,可直接將區(qū)域摳出,顯示時(shí)使用縮放技術(shù);如果是文字塊,進(jìn)行行切分和字切分,在重排時(shí)按字塊圖像,回帖到合適位置。且利用基本的排版特征,如縮進(jìn)、分欄等,可以獲得段落和閱讀順序;如果是表格,利用線段檢測(cè)和單元格分析,可以按列或按行或按塊重新組織顯示,也可將整個(gè)表格塊作為插圖處理。對(duì)于多格漫畫,可利用其邊框和插圖聯(lián)通情況,將原本一頁(yè)的分多頁(yè)顯示。該技術(shù)尤其適合目前的手持設(shè)備,如智能手機(jī)、電子書、平板電腦。。圖9是根據(jù)本發(fā)明實(shí)施例的圖片文檔的處理方法的流程圖;圖10是根據(jù)圖9所示實(shí)施例的圖片文檔的處理方法的詳細(xì)流程圖;圖Ila-Ilb是根據(jù)圖9所示實(shí)施例的圖塊的切分方法流程圖;圖12是根據(jù)圖9所示實(shí)施例的文字區(qū)塊的處理方法流程圖;圖13是根據(jù)圖9所示實(shí)施例的表格區(qū)塊的處理方法流程圖;圖14是根據(jù)圖9所示實(shí)施例的閱讀順序的分析流程圖。如圖9所示該方法包括如下步驟步驟S102,通過(guò)圖1中的預(yù)處理模塊10對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像。步驟S104,通過(guò)圖1中的切分模塊30執(zhí)行將基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型。步驟S106,通過(guò)圖1中的重排模塊50來(lái)實(shí)現(xiàn)根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)。步驟S108,通過(guò)圖1中的顯示模塊70在顯示區(qū)域中顯示圖片區(qū)塊的顯示數(shù)據(jù)。本申請(qǐng)上述實(shí)施例通過(guò)對(duì)進(jìn)行預(yù)處理后的圖片文檔進(jìn)行切分,并將各種切分后圖像字塊縮放后按新的顯示要求貼圖到顯示區(qū)域的指定位置上。由于該實(shí)施例中直接利用圖像處理技術(shù)對(duì)圖片文檔進(jìn)行了預(yù)處理和分析,因此無(wú)需采用OCR技術(shù)進(jìn)行閱讀,提高了閱讀效率,避免了使用閱讀工具轉(zhuǎn)換圖片文件過(guò)程中存在的轉(zhuǎn)換錯(cuò)誤,同時(shí)也降低了開發(fā)成本的效果。本申請(qǐng)上述實(shí)施例中,圖片區(qū)塊的類型包括以下一種或多種類型文字區(qū)塊、圖像區(qū)塊、表格區(qū)塊,其中,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型可以包括檢測(cè)圖片區(qū)塊的文檔內(nèi)容屬性,其中,當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差在預(yù)定范圍之內(nèi)時(shí),確定圖片區(qū)塊為文字區(qū)塊;當(dāng)檢測(cè)到圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差大在預(yù)定范圍之外時(shí),確定圖片區(qū)塊為圖像區(qū)塊;當(dāng)檢測(cè)到圖片區(qū)塊中包括一條或多條表格線時(shí),確定圖片區(qū)塊為表格區(qū)塊。該實(shí)施例提供了將整個(gè)圖片文檔中不同屬性的區(qū)塊區(qū)分開,以便于使用不同的方式進(jìn)行重排處理。上述實(shí)施例中針對(duì)區(qū)塊的切分模塊30具體可以實(shí)現(xiàn),將圖片文檔版面中的元素按內(nèi)容的屬性分成各類區(qū)塊。具體的,如圖Ila和lib所示,可以利用空白間隙查找的方法將連通域分割成許多大塊;或者直接計(jì)算圖像中各個(gè)像素點(diǎn)的鄰域特征,利用不同的特征數(shù)值將版面分割成一些區(qū)塊。如圖例如,如果確定在圖片文檔中分隔出多幅圖像漫畫,則可以利用子圖間的間隙以及子圖內(nèi)的連通域,將整圖切分成幾個(gè)小圖。而且,如圖10所示,在切分得到多個(gè)區(qū)塊之后,可以通過(guò)區(qū)塊屬性進(jìn)行判斷,可以按照區(qū)塊中的特征判斷區(qū)塊的具體類型,以便后續(xù)進(jìn)一步處理。區(qū)塊類型包括文字區(qū)塊、插像區(qū)塊、插形區(qū)塊(線條圖)、表格區(qū)塊、公式區(qū)塊等等。所能利用的文檔內(nèi)容屬性的特征包括但不限于一下特征連通域的尺寸、連通域的空間分布周期性、尺寸的不均衡性、黑像素密度、游程統(tǒng)計(jì)特征、頻域特征、直方圖分布特征、梯度分布特征、分型特征、各種紋理特征等;而判斷方法可以采用根據(jù)各種特征設(shè)定閾值,然后決策樹判斷,也可使用樣本集訓(xùn)練的方式,如神經(jīng)網(wǎng)絡(luò)、支撐向量機(jī)等。具體的,在對(duì)每種區(qū)塊中的內(nèi)容基于目標(biāo)顯示區(qū)域的標(biāo)準(zhǔn)進(jìn)行處理后,可以進(jìn)行閱讀順序的分析,并在顯示區(qū)域進(jìn)行對(duì)應(yīng)的重排并根據(jù)用戶體驗(yàn)進(jìn)行效果調(diào)整。本申請(qǐng)上述實(shí)施例中,在圖片區(qū)塊為文字區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的字符顯示特征,字符顯示特征包括字符大小、字符間距和字符行距;根據(jù)字符顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目;依次讀取文字區(qū)塊中所有的字符,并按照顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目將字符縮放后進(jìn)行依次排序,得到文字區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。該實(shí)施例中,在執(zhí)行重排操作之前,需要根據(jù)目標(biāo)屏幕的大小,通過(guò)用戶設(shè)定的在目標(biāo)顯示區(qū)域中的期望字符大小、字間距、行距,計(jì)算每個(gè)屏幕上顯示區(qū)域的字行數(shù)和每行中的字?jǐn)?shù),并將字符的矩形區(qū)域圖像貼到目標(biāo)區(qū)域上的相應(yīng)位置即可。具體的,上述實(shí)施利通過(guò)對(duì)文字區(qū)塊的處理為文字區(qū)塊的重排操作做預(yù)備,具體的,可以對(duì)對(duì)文字區(qū)塊中的字符進(jìn)行如下處理成行(列),單字切分,字符分類(標(biāo)點(diǎn)不能出現(xiàn)在行頭,英文單詞、拼音、數(shù)字不能在行尾出現(xiàn)斷續(xù)),公式區(qū)域判斷(當(dāng)成圖像直接摳圖),文字屬性分析(大小、粗細(xì)(參考dpi))。在得到所有字符進(jìn)行處理之后,可以根據(jù)設(shè)定的字體大小、字間距(可計(jì)算并保留原始值)、行間距(可計(jì)算并保留原始值)、原始dpi和目標(biāo)顯示分辨率,計(jì)算單字塊、大區(qū)塊的映射位置,同時(shí)在對(duì)每個(gè)字符進(jìn)行縮放之后,將各個(gè)字符塊拷貝到目標(biāo)顯示區(qū)域。考慮字符類型和排版習(xí)慣,如標(biāo)點(diǎn)不能出現(xiàn)在行頭,英文單詞、拼音、數(shù)字不能在行尾出現(xiàn)斷續(xù)。
優(yōu)選地,在依次讀取文字區(qū)塊中所有的字符之前,方法還可以包括讀取文字區(qū)塊中的所有字符連通域;計(jì)算得到字符連通域的高度參考值,根據(jù)高度參考值來(lái)遍歷所有字符連通域以對(duì)文字區(qū)塊中的字塊分行;根據(jù)字符的結(jié)構(gòu)特征,對(duì)每行中的字符塊進(jìn)行單字切分和處理,以得到文字區(qū)塊中所有的字符,其中,當(dāng)字符為漢字的情況下,對(duì)每行中的字符塊進(jìn)行單字切分包括將縱向坐標(biāo)中上下關(guān)聯(lián)的連通域合并為一個(gè)字符塊,并將橫向坐標(biāo)中左右相鄰距離小于等于預(yù)定值的連通域合并為一個(gè)字符塊。上述實(shí)施例如圖12所示,在對(duì)文字區(qū)塊中的各個(gè)字符進(jìn)行一系列處理之后得到字符塊,便于后續(xù)字符重排的操作。由上分析可知,本申請(qǐng)中對(duì)于文字區(qū)塊的處理首先對(duì)文字區(qū)塊中的字符進(jìn)行字塊分行處理,在遍歷所有的連通域得到分行處理后的文字區(qū)塊;然后,在字塊分行處理完成后,對(duì)文字區(qū)塊字塊進(jìn)行分行處理使得頁(yè)面成行之后,由于漢字有上下結(jié)構(gòu),對(duì)字塊進(jìn)行單字切分處理;最后,以圖5中所示的文字區(qū)塊為例,在目標(biāo)顯示區(qū)域?yàn)槊總€(gè)字長(zhǎng)寬均為50個(gè)像素,屏幕寬500像素,高600像素,字間距10,行間距20,如圖6所示,每頁(yè)只能排布8行,每行8個(gè)字符。因?yàn)?0*8+9*10 = 490 < 500,50*8+腫20 = 580 < 600。圖6為第一頁(yè)顯示區(qū)域,圖5中的文字以上述方式依次以圖6所示的布局進(jìn)行顯示。本申請(qǐng)上述實(shí)施例中,在圖片區(qū)塊為表格區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟可以包括提取表格區(qū)塊中的表格線,并根據(jù)表格線對(duì)表格進(jìn)行劃分,得到一個(gè)或多個(gè)具有行列坐標(biāo)的單元格;根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的單元格顯示特征,單元格顯示特征包括單元格大小、單元格間距和單元格行距;根據(jù)單元格顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目;依次讀取表格區(qū)塊中所有的單元格,并按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將單元格縮放后進(jìn)行依次排序,得到表格區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。上述實(shí)施例通過(guò)可將整個(gè)表格區(qū)塊當(dāng)做圖像顯示,具體的,如圖13所示,首先通過(guò)提取表格區(qū)塊中的表格線來(lái)將表格區(qū)塊切分成多個(gè)單元格,然后對(duì)單元格進(jìn)行排列分析,同時(shí)提取字符塊,通過(guò)計(jì)算行、列數(shù)確定每個(gè)單元格在顯示頁(yè)面中的具體位置以及縮放的大小。在經(jīng)過(guò)上述針對(duì)單元格的分析之后,可實(shí)現(xiàn)設(shè)置按多行顯示或多列顯示,或定位行列區(qū)域顯示。如果是漫畫文檔,按照設(shè)定順序顯示,如從上到下從左到右。優(yōu)選地,依次讀取表格區(qū)塊中所有的單元格,并按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將單元格縮放后進(jìn)行依次排序,得到表格區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)的步驟可以包括提取表格區(qū)塊中的所有表頭單元格;按照顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)表頭單元格在顯示區(qū)域中的表頭坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到顯示區(qū)域中已經(jīng)確定的表頭坐標(biāo)位置;讀取表格區(qū)塊中的字符單元格;根據(jù)已經(jīng)確定的表頭坐標(biāo)位置和顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)字符單元格的字符坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到顯示區(qū)域中已經(jīng)確定的字符坐標(biāo)位置;其中,在各個(gè)表頭單元格的表頭坐標(biāo)位置確定之后,在每一個(gè)顯示區(qū)域中的相同坐標(biāo)位置復(fù)制相同的表頭單元格。本申請(qǐng)上述實(shí)施例中,在圖片區(qū)塊為圖像區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟可以包括根據(jù)需求設(shè)置對(duì)應(yīng)顯示區(qū)域的圖像顯示特征,圖像顯示特征包括圖像大小、圖像間距和圖像行距;根據(jù)圖像顯示特征計(jì)算得到對(duì)應(yīng)顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目;依次提取圖像區(qū)塊中的一個(gè)或多個(gè)子圖像,并按照顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目將子圖像縮放后進(jìn)行依次排序,得到圖像區(qū)塊對(duì)應(yīng)顯示區(qū)域的顯示數(shù)據(jù)。優(yōu)選地,在提取圖像區(qū)塊中的一個(gè)或多個(gè)子圖像之后,方法還包括通過(guò)直方圖均衡算法對(duì)各個(gè)子圖像進(jìn)行處理,以獲取對(duì)比度超過(guò)預(yù)定值的子圖像。本申請(qǐng)上述實(shí)施例通過(guò)對(duì)圖像區(qū)塊進(jìn)行處理,例如進(jìn)行灰度調(diào)整,從而增強(qiáng)對(duì)比度或亮度;以及對(duì)圖像區(qū)塊進(jìn)行二值化處理,使得顯示更清晰。并將處理后的圖像按照目標(biāo)顯示區(qū)域的大小進(jìn)行防縮顯示。本申請(qǐng)上述實(shí)施例實(shí)現(xiàn)了在不利用OCR技術(shù)的情況下,對(duì)圖片文檔的頁(yè)面圖像進(jìn)行切分。判斷頁(yè)面中區(qū)塊的屬性。如果是圖像,可直接將區(qū)域摳出,顯示時(shí)使用縮放技術(shù);如果是文字塊,進(jìn)行行切分和字切分,在重排時(shí)按字塊圖像,回帖到合適位置。且利用基本的排版特征,如縮進(jìn)、分欄等,可以獲得段落和閱讀順序;如果是表格,利用線段檢測(cè)和單元格分析,可以按列或按行或按塊重新組織顯示,也可將整個(gè)表格塊作為插圖處理。對(duì)于多格漫畫,可利用其邊框和插圖聯(lián)通情況,將原本一頁(yè)的分多頁(yè)顯示。該技術(shù)尤其適合目前的手持設(shè)備,如智能手機(jī)、電子書、平板電腦。需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。本申請(qǐng)上述實(shí)施例為了優(yōu)化用戶的閱讀習(xí)慣,如圖14所示,在重排過(guò)程中還可以采用閱讀順序分析模塊對(duì)排版類型自動(dòng)分析(或手工輸入),利用版面基礎(chǔ)先驗(yàn)知識(shí)(段落縮進(jìn),段后空白,標(biāo)題、章節(jié)位置,分欄情況,)判斷閱讀順序?yàn)橹嘏盘峁┮罁?jù)。同時(shí),也可以采用顯示效果調(diào)整模塊縮放各個(gè)單字塊或大的圖像、表格區(qū)塊。調(diào)整文字筆畫粗細(xì)或濃淡程度以達(dá)到最佳閱讀效果。另外,通過(guò)對(duì)字體的二值化分割和區(qū)域標(biāo)定,利用填充算法,還可實(shí)現(xiàn)設(shè)置字符與背景顏色的功能。手工輸入即指在操作界面上提供一個(gè)設(shè)置工具,比如采用鼠標(biāo)點(diǎn)擊單選框,選中要處理的頁(yè)面是“橫排版”還是“豎排版”。自動(dòng)處理就是指算法自動(dòng)根據(jù)文字行、列方向排布方式、間隔、周期等計(jì)算出是“橫排版”還是“豎排版”。從以上的描述中,可以看出,本發(fā)明實(shí)現(xiàn)了如下技術(shù)效果直接利用圖像處理技術(shù)進(jìn)行分析,無(wú)需OCR技術(shù)進(jìn)行預(yù)先識(shí)別,將各種切分后圖像字塊縮放后按新的顯示要求貼圖到指定位置。該技術(shù)尤其適合目前的手持設(shè)備,如智能手機(jī)、電子書、平板電腦。利用上述技術(shù)的各種設(shè)備,針對(duì)掃描版的PDF或漫畫的處理不僅僅處理是切除白邊和按注意區(qū)域轉(zhuǎn)移顯示,滿足了用戶更多的閱讀需求。顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種圖片文檔的處理方法,其特征在于,包括對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像;將所述基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)所述圖片區(qū)塊的文檔內(nèi)容屬性確定所述圖片區(qū)塊的類型;根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù);在所述顯示區(qū)域中顯示所述圖片區(qū)塊的顯示數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述圖片區(qū)塊的類型包括以下一種或多種類型文字區(qū)塊、圖像區(qū)塊、表格區(qū)塊,其中,根據(jù)所述圖片區(qū)塊的文檔內(nèi)容屬性確定所述圖片區(qū)塊的類型包括檢測(cè)所述圖片區(qū)塊的文檔內(nèi)容屬性,其中,當(dāng)檢測(cè)到所述圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差在預(yù)定范圍之內(nèi)時(shí),確定所述圖片區(qū)塊為文字區(qū)塊;當(dāng)檢測(cè)到所述圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差大在預(yù)定范圍之外時(shí),確定所述圖片區(qū)塊為圖像區(qū)塊;當(dāng)檢測(cè)到所述圖片區(qū)塊中包括一條或多條表格線時(shí),確定所述圖片區(qū)塊為表格區(qū)塊。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述圖片區(qū)塊為文字區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括根據(jù)需求設(shè)置對(duì)應(yīng)所述顯示區(qū)域的字符顯示特征,所述字符顯示特征包括字符大小、字符間距和字符行距;根據(jù)所述字符顯示特征計(jì)算得到對(duì)應(yīng)所述顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目;依次讀取所述文字區(qū)塊中所有的字符,并按照所述顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目將所述字符縮放后進(jìn)行依次排序,得到所述文字區(qū)塊對(duì)應(yīng)所述顯示區(qū)域的顯示數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在依次讀取所述文字區(qū)塊中所有的字符之前,所述方法還包括讀取所述文字區(qū)塊中的所有字符連通域;計(jì)算得到字符連通域的高度參考值,根據(jù)所述高度參考值來(lái)遍歷所有字符連通域以對(duì)所述文字區(qū)塊中的字塊分行;根據(jù)字符的結(jié)構(gòu)特征,對(duì)每行中的字符塊進(jìn)行單字切分和處理,以得到所述文字區(qū)塊中所有的字符,其中,當(dāng)所述字符為漢字的情況下,對(duì)每行中的字符塊進(jìn)行單字切分包括將縱向坐標(biāo)中上下關(guān)聯(lián)的連通域合并為一個(gè)字符塊,并將橫向坐標(biāo)中左右相鄰距離小于等于預(yù)定值的連通域合并為一個(gè)字符塊。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述圖片區(qū)塊為表格區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括提取所述表格區(qū)塊中的表格線,并根據(jù)所述表格線對(duì)表格進(jìn)行劃分,得到一個(gè)或多個(gè)具有行列坐標(biāo)的單元格;根據(jù)需求設(shè)置對(duì)應(yīng)所述顯示區(qū)域的單元格顯示特征,所述單元格顯示特征包括單元格大小、單元格間距和單元格行距;根據(jù)所述單元格顯示特征計(jì)算得到對(duì)應(yīng)所述顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目;依次讀取所述表格區(qū)塊中所有的單元格,并按照所述顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將所述單元格縮放后進(jìn)行依次排序,得到所述表格區(qū)塊對(duì)應(yīng)所述顯示區(qū)域的顯示數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,依次讀取所述表格區(qū)塊中所有的單元格,并按照所述顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將所述單元格縮放后進(jìn)行依次排序,得到所述表格區(qū)塊對(duì)應(yīng)所述顯示區(qū)域的顯示數(shù)據(jù)包括提取所述表格區(qū)塊中的所有表頭單元格;按照所述顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)表頭單元格在所述顯示區(qū)域中的表頭坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到所述顯示區(qū)域中已經(jīng)確定的表頭坐標(biāo)位置;讀取所述表格區(qū)塊中的字符單元格;根據(jù)已經(jīng)確定的表頭坐標(biāo)位置和所述顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目,確定每一個(gè)字符單元格的字符坐標(biāo)位置;將各個(gè)表頭單元格縮放后復(fù)制到所述顯示區(qū)域中已經(jīng)確定的字符坐標(biāo)位置;其中,在各個(gè)所述表頭單元格的表頭坐標(biāo)位置確定之后,在每一個(gè)顯示區(qū)域中的相同坐標(biāo)位置復(fù)制相同的表頭單元格。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述圖片區(qū)塊為圖像區(qū)塊的情況下,根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù)的步驟包括根據(jù)需求設(shè)置對(duì)應(yīng)所述顯示區(qū)域的圖像顯示特征,所述圖像顯示特征包括圖像大小、圖像間距和圖像行距;根據(jù)所述圖像顯示特征計(jì)算得到對(duì)應(yīng)所述顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目;依次提取所述圖像區(qū)塊中的一個(gè)或多個(gè)子圖像,并按照所述顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目將所述子圖像縮放后進(jìn)行依次排序,得到所述圖像區(qū)塊對(duì)應(yīng)所述顯示區(qū)域的顯示數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,在提取所述圖像區(qū)塊中的一個(gè)或多個(gè)子圖像之后,所述方法還包括通過(guò)直方圖均衡算法對(duì)各個(gè)子圖像進(jìn)行處理,以獲取對(duì)比度超過(guò)預(yù)定值的圖形。
9.一種圖片文檔的處理裝置,其特征在于,包括預(yù)處理模塊,用于對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像;切分模塊,用于將所述基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)所述圖片區(qū)塊的文檔內(nèi)容屬性確定所述圖片區(qū)塊的類型;重排模塊,用于根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù);顯示模塊,用于在所述顯示區(qū)域中顯示所述圖片區(qū)塊的顯示數(shù)據(jù)。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述圖片區(qū)塊的類型包括以下一種或多種類型文字區(qū)塊、圖像區(qū)塊、表格區(qū)塊,其中,所述切分模塊包括檢測(cè)模塊,用于檢測(cè)所述圖片區(qū)塊的文檔內(nèi)容屬性;第一獲取模塊,用于當(dāng)檢測(cè)到所述圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差在預(yù)定范圍之內(nèi)時(shí),確定所述圖片區(qū)塊為文字區(qū)塊;第二獲取模塊,用于當(dāng)檢測(cè)到所述圖片區(qū)塊中各個(gè)合并連通域的矩形大小之差大在預(yù)定范圍之外時(shí),確定所述圖片區(qū)塊為圖像區(qū)塊;第二獲取模塊,用于當(dāng)檢測(cè)到所述圖片區(qū)塊中包括一條或多條表格線時(shí),確定所述圖片區(qū)塊為表格區(qū)塊。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,在所述圖片區(qū)塊為文字區(qū)塊的情況下,所述重排模塊包括設(shè)置模塊,用于根據(jù)需求設(shè)置對(duì)應(yīng)所述顯示區(qū)域的字符顯示特征,所述字符顯示特征包括字符大小、字符間距和字符行距;計(jì)算模塊,用于根據(jù)所述字符顯示特征計(jì)算得到對(duì)應(yīng)所述顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目;排序模塊,用于依次讀取所述文字區(qū)塊中所有的字符,并按照所述顯示區(qū)域的字符行數(shù)和每行中的字符數(shù)目將所述字符縮放后進(jìn)行依次排序,得到所述文字區(qū)塊對(duì)應(yīng)所述顯示區(qū)域的顯示數(shù)據(jù)。
12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,在所述圖片區(qū)塊為表格區(qū)塊的情況下,所述重排模塊包括處理模塊,用于提取所述表格區(qū)塊中的表格線,并根據(jù)所述表格線對(duì)表格進(jìn)行劃分,得到一個(gè)或多個(gè)具有行列坐標(biāo)的單元格;設(shè)置模塊,用于根據(jù)需求設(shè)置對(duì)應(yīng)所述顯示區(qū)域的單元格顯示特征,所述單元格顯示特征包括單元格大小、單元格間距和單元格行距;計(jì)算模塊,用于根據(jù)所述單元格顯示特征計(jì)算得到對(duì)應(yīng)所述顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目;排序模塊,用于依次讀取所述表格區(qū)塊中所有的單元格,并按照所述顯示區(qū)域的單元格行數(shù)和每行中的單元格數(shù)目將所述單元格縮放后進(jìn)行依次排序,得到所述表格區(qū)塊對(duì)應(yīng)所述顯示區(qū)域的顯示數(shù)據(jù)。
13.根據(jù)權(quán)利要求10所述的裝置,其特征在于,在所述圖片區(qū)塊為圖像區(qū)塊的情況下,所述重排模塊包括設(shè)置模塊,用于根據(jù)需求設(shè)置對(duì)應(yīng)所述顯示區(qū)域的圖像顯示特征,所述圖像顯示特征包括圖像大小、圖像間距和圖像行距;計(jì)算模塊,用于根據(jù)所述圖像顯示特征計(jì)算得到對(duì)應(yīng)所述顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目;排序模塊,用于依次提取所述圖像區(qū)塊中的一個(gè)或多個(gè)子圖像,并按照所述顯示區(qū)域的圖像行數(shù)和每行中的圖像數(shù)目將所述子圖像縮放后進(jìn)行依次排序,得到所述圖像區(qū)塊對(duì)應(yīng)所述顯示區(qū)域的顯示數(shù)據(jù)。
全文摘要
本發(fā)明公開了一種圖片文檔的處理方法及裝置。其中,該方法包括對(duì)圖片文檔進(jìn)行預(yù)處理,以獲取基于連通域的頁(yè)面圖像;將基于連通域的頁(yè)面圖像進(jìn)行切分,得到一個(gè)或多個(gè)圖片區(qū)塊,根據(jù)圖片區(qū)塊的文檔內(nèi)容屬性確定圖片區(qū)塊的類型;根據(jù)顯示區(qū)域的大小對(duì)任意一種或多種類型的圖片區(qū)塊進(jìn)行對(duì)應(yīng)的重排處理,以獲取每一種圖片區(qū)塊的顯示數(shù)據(jù);在顯示區(qū)域中顯示圖片區(qū)塊的顯示數(shù)據(jù)。通過(guò)本發(fā)明,能夠?qū)崿F(xiàn)直接在圖片文檔的圖像層面上將版面重排,無(wú)需使用閱讀工具,提高了閱讀效率,避免了閱讀工具轉(zhuǎn)換過(guò)程中存在的轉(zhuǎn)換錯(cuò)誤,同時(shí)也降低了開發(fā)成本。
文檔編號(hào)G06F17/24GK102567300SQ20111045108
公開日2012年7月11日 申請(qǐng)日期2011年12月29日 優(yōu)先權(quán)日2011年12月29日
發(fā)明者胡希馳 申請(qǐng)人:方正國(guó)際軟件(北京)有限公司, 方正國(guó)際軟件有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
靖远县| 驻马店市| 阳谷县| 承德县| 额济纳旗| 灌云县| 济南市| 饶阳县| 井研县| 武城县| 涡阳县| 福海县| 武乡县| 荆州市| 子洲县| 兰考县| 龙山县| 开远市| 伊宁县| 巴马| 华池县| 镇宁| 中超| 涞水县| 乐业县| 惠州市| 安丘市| 鲁甸县| 大同县| 遵义市| 蓝山县| 甘洛县| 白玉县| 海口市| 石首市| 大宁县| 获嘉县| 临夏市| 洮南市| 庆阳市| 志丹县|