基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)的制作方法【專利摘要】本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng),對所述頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域;將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一的第一格式圖像并存儲;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜的第二格式圖像并存儲;這樣通過對文檔頁面內(nèi)容從類型上進(jìn)行劃分,不同類型的頁面內(nèi)容轉(zhuǎn)換成相應(yīng)格式的圖像,保證文檔頁面內(nèi)容中的文字和圖像信息的顯示效果?!緦@f明】基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)【
技術(shù)領(lǐng)域:
】[0001]本發(fā)明涉及信息處理領(lǐng)域,具體是一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)。【
背景技術(shù):
】[0002]版式文檔,是版面呈現(xiàn)效果固定的電子文檔格式,比如PDF或者CAJ格式的文檔,版式文檔的呈現(xiàn)與設(shè)備無關(guān),在各種設(shè)備上閱讀、打印或印刷時,其版面的呈現(xiàn)結(jié)果都是一致的;因此能夠很好地展示豐富的頁面效果,但是閱讀版式文檔時需要有一些相應(yīng)模塊來對其進(jìn)行解析、展示,即需要一個閱讀器,大大限制了版式文檔的使用。尤其是在網(wǎng)絡(luò)閱讀中,不能要求用戶都安裝閱讀器或ActiveX插件,因此,只能將版式文檔的內(nèi)容直接轉(zhuǎn)換為圖像,以圖像的方式進(jìn)行統(tǒng)一展示。[0003]版式文檔支持非常豐富的版面元素,包含大量圖片和文字,從而導(dǎo)致用單一的圖像格式不能對這些版面元素提供很好的展示效果。比如,使用JPG圖像格式對版式文檔進(jìn)行轉(zhuǎn)換時,由于JPG壓縮方案不能很好地處理顏色較少的區(qū)域或處理純色區(qū)域,會導(dǎo)致版式文檔中的文字部分顯示效果不佳;同樣,使用PNG對版式文檔進(jìn)行轉(zhuǎn)換時,一般會首先進(jìn)行顏色取樣,然后再進(jìn)行無損壓縮,在顏色取樣的過程中,為減少數(shù)據(jù)量,會損失相當(dāng)數(shù)量的顏色值,導(dǎo)致最終解壓后的包含豐富顏色的圖像顯示失真?!?br/>發(fā)明內(nèi)容】[0004]為此,本發(fā)明所要解決的是現(xiàn)有將版式文檔轉(zhuǎn)換成單一的圖像文件帶來的顯示效果失真的技術(shù)問題,提供一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)。[0005]為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案如下:[0006]-種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,包括如下步驟:[0007]區(qū)域劃分:對所述頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域;[0008]將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像;[0009]將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像。[0010]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,所述區(qū)域劃分步驟具體包括:[0011]將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;[0012]將頁面元素為圖像類型的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0013]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,所述區(qū)域劃分步驟具體包括:[0014]將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;[0015]將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0016]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,所述頁面元素所在的區(qū)域根據(jù)所述頁面元素的位置、大小和縮放信息確定。[0017]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,所述第一格式圖像為PNG圖像。[0018]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,所述第二格式圖像為JPG圖像。[0019]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,所述存儲按照以下步驟進(jìn)行:[0020]將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;[0021]將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;[0022]在每個圖像的開始存儲的位置建立索引信息;[0023]將同一文檔頁面對應(yīng)的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中。[0024]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,還包括以下瀏覽器顯示的步驟:[0025]從所述數(shù)據(jù)文件中讀取每一個所述第一格式圖像和第二格式圖像的位置;[0026]根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構(gòu)建動態(tài)網(wǎng)頁信息;讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構(gòu)建的所述動態(tài)網(wǎng)頁的對應(yīng)位置上。[0027]同時提供一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),包括:[0028]區(qū)域劃分模塊,對所述頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域;[0029]圖像轉(zhuǎn)換模塊,將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像并存儲;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像并存儲。[0030]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),所述區(qū)域劃分模塊具體包括:[0031]顏色單一區(qū)域劃分子模塊:用于將文字類型的所述頁面元素所在的區(qū)域劃分為顏色單一區(qū)域;[0032]顏色復(fù)雜區(qū)域劃分子模塊:用于將圖像類型的所述頁面元素所在的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0033]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),所述區(qū)域劃分模塊具體包括:[0034]顏色單一區(qū)域獲取子模塊,用于將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;[0035]顏色復(fù)雜區(qū)域獲取子模塊,用于將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0036]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),還包括根據(jù)所述頁面元素的位置、大小和縮放信息確定所述頁面元素所在的區(qū)域的子模塊。[0037]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),所述圖像轉(zhuǎn)換模塊中的所述第一格式圖像為PNG圖像。[0038]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),所述圖像轉(zhuǎn)換模塊中的所述第二格式圖像為JPG圖像。[0039]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),所述圖像轉(zhuǎn)換模塊具體包括存儲子模塊,所述存儲子模塊具體包括:[0040]第一存儲子模塊,用于將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;[0041]第二存儲子模塊,用于將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;[0042]索引模塊,用于在每個圖像的開始存儲的位置建立索引信息;[0043]第三存儲子模塊,用于將將同一文檔頁面對應(yīng)的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中。[0044]所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),還包括瀏覽器顯示模塊,所述瀏覽器顯示模塊具體包括:[0045]位置讀取子模塊,用于從所述數(shù)據(jù)文件中讀取每一個所述第一格式圖像和第二格式圖像的位置;[0046]動態(tài)網(wǎng)頁構(gòu)建子模塊,用于根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構(gòu)建動態(tài)網(wǎng)頁信息;[0047]顯示子模塊,用于讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)并顯示在構(gòu)建的所述動態(tài)網(wǎng)頁的對應(yīng)位置上。[0048]本發(fā)明的上述技術(shù)方案相比現(xiàn)有技術(shù)具有以下優(yōu)點:[0049](1)本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng),對所述頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域,將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像并存儲;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像并存儲;這樣通過對文檔頁面內(nèi)容從顏色是否復(fù)雜進(jìn)行劃分,不同的頁面內(nèi)容轉(zhuǎn)換成相應(yīng)格式的圖像,保證文檔頁面內(nèi)容中的文字和圖像信息的顯示效果。[0050](2)本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)中,根據(jù)所述文檔頁面的元數(shù)據(jù)信息進(jìn)行區(qū)域劃分,具體是根據(jù)類型是文字還是圖像進(jìn)行區(qū)域劃分,能更進(jìn)一步簡化區(qū)域劃分的步驟,減少區(qū)域劃分的工作量,方便實施。[0051](3)本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)中,所述第一格式圖像為PNG圖像,這樣能保證文字的顯示效果,同時,能夠達(dá)到較大的壓縮率,減少圖像數(shù)據(jù)的存儲空間和在網(wǎng)絡(luò)上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉(zhuǎn)換的性能。[0052](3)本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)中,所述第二格式圖像為JPG圖像,一方面,選用JPG格式能保證圖像的顯示效果,同時,能夠達(dá)到較大的壓縮率,大大減少圖像數(shù)據(jù)的存儲空間和在網(wǎng)絡(luò)上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉(zhuǎn)換的性能。[0053](4)本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)中,將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應(yīng)的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中??紤]不同信息的特殊性,針對確定的規(guī)則信息選用定長方式存儲,針對變量信息采用不定長方式存儲,方便實用;而且,通過索引信息的建立,提供高效的圖數(shù)據(jù)讀取方式;通過將不同的圖像存儲在一個數(shù)據(jù)文件中,便于緩存,也避免一個圖像存儲成一個文件產(chǎn)生的大量零散小文件,影響后續(xù)文件讀取的性能,以及可能造成文件的丟失。[0054](5)本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法及系統(tǒng)中,根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構(gòu)建動態(tài)網(wǎng)頁信息;讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構(gòu)建的所述動態(tài)網(wǎng)頁的對應(yīng)位置上?!緦@綀D】【附圖說明】[0055]為了使本發(fā)明的內(nèi)容更容易被清楚的理解,下面根據(jù)本發(fā)明的具體實施例并結(jié)合附圖,對本發(fā)明作進(jìn)一步詳細(xì)的說明,其中[0056]圖1為本發(fā)明一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法的方法流程圖;[0057]圖2為本發(fā)明另一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法的方法流程圖;[0058]圖3為本發(fā)明一個版式文檔的頁面示意圖;[0059]圖4為圖3使用本發(fā)明一個實施例的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法轉(zhuǎn)換后的區(qū)域示意圖;[0060]圖5為本發(fā)明一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng)的結(jié)構(gòu)框圖;[0061]圖6為本發(fā)明另一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng)的結(jié)構(gòu)框圖?!揪唧w實施方式】[0062]實施例1[0063]參見圖1所示,為本發(fā)明一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,包括如下步驟:[0064]區(qū)域劃分:對頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域。[0065]將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像并存儲。將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像并存儲。[0066]本發(fā)明中,適于壓縮指適于壓縮顯示,解壓縮后內(nèi)容的顯示基本不失真。[0067]本實施例的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,對頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域,將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像并存儲;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像并存儲;這樣通過對文檔頁面內(nèi)容從顏色是否復(fù)雜進(jìn)行劃分,不同的頁面內(nèi)容轉(zhuǎn)換成相應(yīng)格式的圖像,保證文檔頁面內(nèi)容中的文字和圖像信息的顯示效果。[0068]實施例2[0069]參見圖2所示,作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,在實施例1的基礎(chǔ)上,區(qū)域劃分步驟具體包括:[0070]獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的類型、位置、大小和縮放信息,頁面元素的類型包括文字(其中表格中的文字也歸為文字類型)和圖像。本實施例中,文檔為版式文檔,當(dāng)然,其他格式的文檔只要包括必要的元數(shù)據(jù)信息,也可使用本發(fā)明的圖像轉(zhuǎn)換方法進(jìn)行處理,同樣能實現(xiàn)本發(fā)明的目的。[0071]根據(jù)元數(shù)據(jù)信息提取文檔頁面的頁面元素的類型。[0072]根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域,即頁面元素所在的區(qū)域。[0073]將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;將頁面元素為圖像類型的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0074]本實施例中,根據(jù)文檔頁面的元數(shù)據(jù)信息進(jìn)行區(qū)域劃分,具體是根據(jù)類型是文字還是圖像進(jìn)行區(qū)域劃分,能更進(jìn)一步簡化區(qū)域劃分的步驟,減少區(qū)域劃分的工作量,方便實施。[0075]實施例3[0076]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,在實施例1的基礎(chǔ)上,區(qū)域劃分步驟具體包括:[0077]獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的顏色值、位置、大小和縮放信息。[0078]根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域,即確定每個頁面元素的區(qū)域。[0079]將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為為顏色單一區(qū)域;將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0080]優(yōu)選地,可以將多個直接相鄰的顏色單一或者復(fù)雜的區(qū)域合并生成一個大的顏色單一或者復(fù)雜的區(qū)域,這樣可以減少壓縮操作的次數(shù),提高整個文檔頁面的轉(zhuǎn)換效率。[0081]本實施例中區(qū)域劃分通過統(tǒng)計區(qū)域內(nèi)的頁面元素的顏色值獲取,如果區(qū)域內(nèi)的內(nèi)容的顏色值不超過256種,則判定該頁面元素所在區(qū)域為顏色單一區(qū)域;反之,如果區(qū)域內(nèi)的內(nèi)容的顏色值超過256種,則判定為顏色復(fù)雜區(qū)域。通過統(tǒng)計預(yù)定范圍內(nèi)的內(nèi)容的顏色值的方法進(jìn)行區(qū)域劃分統(tǒng)計顏色值的工作量較大,操作起來相對繁瑣,但是更準(zhǔn)確,通用性更強(qiáng)。[0082]實施例4[0083]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,在上述任一實施例的基礎(chǔ)上,第一格式圖像為PNG圖像,其中PNG的全稱為PortableNetworkGraphicFormat,意思為可移植網(wǎng)絡(luò)圖形格式。優(yōu)選地,第一格式圖像為8BitPNG圖像,這樣,用SBit對取樣后的顏色值進(jìn)行存儲,最多存儲256中顏色,能達(dá)到更大的壓縮率,減少數(shù)據(jù)量。作為本發(fā)明其他實施例的第一格式圖像也可為Gif格式或者Tiff格式的圖像,同樣能實現(xiàn)本發(fā)明保證文字清晰顯示的模塊,而且還具有一定的壓縮率優(yōu)勢。[0084]第一格式圖像為PNG圖像,這樣能保證文字的顯示效果,同時,能夠達(dá)到較大的壓縮率,減少圖像數(shù)據(jù)的存儲空間和在網(wǎng)絡(luò)上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉(zhuǎn)換的性能。[0085]實施例5[0086]作為本發(fā)明其他的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,在上述任意一個實施例的基礎(chǔ)上,第二格式圖像為JPG圖像。JPG全名是JPEG,全稱為JointPhotographicExpertsGROUP,是由國際標(biāo)準(zhǔn)組織(ISO:InternationalStandardizationOrganization)和國際電話電報咨詢委員會(CCITT:ConsultationCommiteeoftheInternationalTelephoneandTelegraph)為靜態(tài)圖像所建立的第一個國際數(shù)字圖像壓縮標(biāo)準(zhǔn),也是至今一直在使用的、應(yīng)用最廣的圖像壓縮標(biāo)準(zhǔn)。JPEG格式可在10:1到20:1的比率下輕松地壓縮文件,而圖片質(zhì)量不會下降。JPEG壓縮可以很好地處理寫實攝影作品。[0087]第二格式圖像為JPG圖像,一方面,選用JPG格式能保證圖像的顯示效果,同時,能夠達(dá)到較大的壓縮率,大大減少圖像數(shù)據(jù)的存儲空間和在網(wǎng)絡(luò)上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉(zhuǎn)換的性能。[0088]實施例6[0089]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,在上述任一實施例的基礎(chǔ)上,存儲按照以下步驟進(jìn)行:[0090]將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;[0091]將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;[0092]在每個圖像的開始存儲的位置建立索引信息;[0093]將同一文檔頁面對應(yīng)的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中。[0094]將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應(yīng)的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中。考慮不同信息的特殊性,針對確定的規(guī)則信息選用定長方式存儲,針對變量信息采用不定長方式存儲,方便實用;而且,通過索引信息的建立,提供高效的圖數(shù)據(jù)讀取方式;通過將不同的圖像存儲在一個數(shù)據(jù)文件中,便于緩存,也避免一個圖像存儲成一個文件產(chǎn)生的大量零散小文件影響后續(xù)文件讀取的性能,以及可能造成文件的丟失。[0095]實施例7[0096]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,在上述實施例6的基礎(chǔ)上,還包括以下瀏覽器顯示的步驟:[0097]從數(shù)據(jù)文件中讀取每一個第一格式圖像和第二格式圖像的位置;[0098]根據(jù)每一個第一格式圖像和第二格式圖像的位置構(gòu)建動態(tài)網(wǎng)頁信息;讀取每一個第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構(gòu)建的動態(tài)網(wǎng)頁的對應(yīng)位置上。[0099]根據(jù)每一個第一格式圖像和第二格式圖像的位置構(gòu)建動態(tài)網(wǎng)頁信息;讀取每一個第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構(gòu)建的動態(tài)網(wǎng)頁的對應(yīng)位置上。[0100]實施例8[0101]參見圖5所示,為本發(fā)明一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),包括:[0102]區(qū)域劃分模塊,對頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域;[0103]圖像轉(zhuǎn)換模塊,將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像并存儲;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像并存儲。[0104]本實施例的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),對頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域,將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像并存儲;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像并存儲;這樣通過對文檔頁面內(nèi)容從顏色是否復(fù)雜進(jìn)行劃分,不同的頁面內(nèi)容轉(zhuǎn)換成相應(yīng)格式的圖像,保證文檔頁面內(nèi)容中的文字和圖像信息的顯示效果。[0105]實施例9[0106]參見圖6所示,為本發(fā)明一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),在實施例8的基礎(chǔ)上,區(qū)域劃分模塊具體包括:[0107]元數(shù)據(jù)信息獲取子模塊,用于獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的類型、位置、大小和縮放信息,頁面元素的類型包括文字和圖像。[0108]區(qū)域確定子模塊,用于根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域。[0109]區(qū)域劃分子模塊,用于根據(jù)區(qū)域?qū)⑽臋n頁面包括的不同類型的頁面元素劃分為多個區(qū)域;區(qū)域劃分子模塊具體包括:顏色單一區(qū)域劃分子模塊和顏色復(fù)雜區(qū)域劃分子模塊:其中,顏色單一區(qū)域劃分子模塊:用于將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;顏色復(fù)雜區(qū)域劃分子模塊,用于將頁面元素為圖像類型的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0110]本實施例中,根據(jù)文檔頁面的元數(shù)據(jù)信息進(jìn)行區(qū)域劃分,具體是根據(jù)類型是文字還是圖像進(jìn)行區(qū)域劃分,能更進(jìn)一步簡化區(qū)域劃分的步驟,減少區(qū)域劃分的工作量,方便實施。[0111]實施例10[0112]作為本發(fā)明一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),在實施例8的基礎(chǔ)上,區(qū)域劃分模塊具體包括:[0113]元數(shù)據(jù)信息獲得子模塊,用于獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的顏色值、位置、大小和縮放信息;[0114]區(qū)域界定子模塊,用于根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域;[0115]區(qū)域獲取子模塊,具體包括顏色單一區(qū)域獲取子模塊和顏色復(fù)雜區(qū)域獲取子模塊,其中,顏色單一區(qū)域獲取子模塊,用于將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;顏色復(fù)雜區(qū)域獲取子模塊,用于將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復(fù)雜區(qū)域。[0116]本實施例中區(qū)域劃分通過統(tǒng)計區(qū)域內(nèi)的頁面元素的顏色值獲取,如果區(qū)域內(nèi)的內(nèi)容的顏色值不超過256種,則判定頁面元素所在的區(qū)域為顏色單一區(qū)域;反之,如果區(qū)域內(nèi)的內(nèi)容的顏色值超過256種,則判定為顏色復(fù)雜區(qū)域。通過統(tǒng)計預(yù)定范圍內(nèi)的內(nèi)容的顏色值的方法進(jìn)行區(qū)域劃分統(tǒng)計顏色值的工作量較大,操作起來相對繁瑣,但是更準(zhǔn)確,通用性更強(qiáng)。[0117]實施例11[0118]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),在上述任一實施例的基礎(chǔ)上,圖像轉(zhuǎn)換模塊中的第一格式圖像為PNG圖像。[0119]第一格式圖像為PNG圖像,這樣能保證文字的顯示效果,同時,能夠達(dá)到較大的壓縮率,減少圖像數(shù)據(jù)的存儲空間和在網(wǎng)絡(luò)上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉(zhuǎn)換的性能。[0120]實施例12[0121]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),在上述任意一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng)的基礎(chǔ)上,圖像轉(zhuǎn)換模塊中的第二格式圖像為JPG圖像。[0122]第二格式圖像為JPG圖像,一方面,選用JPG格式能保證圖像的顯示效果,同時,能夠達(dá)到較大的壓縮率,大大減少圖像數(shù)據(jù)的存儲空間和在網(wǎng)絡(luò)上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉(zhuǎn)換的性能。[0123]實施例13[0124]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),在上述任意一個實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng)的基礎(chǔ)上,圖像轉(zhuǎn)換模塊具體包括存儲子模塊,存儲子模塊具體包括:[0125]第一存儲子模塊,用于將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲。[0126]第二存儲子模塊,用于將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲。[0127]索引模塊,用于在每個圖像的開始存儲的位置建立索引信息。[0128]第三存儲子模塊,用于將將同一文檔頁面對應(yīng)的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中。[0129]本實施例中,將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應(yīng)的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中??紤]不同信息的特殊性,針對確定的規(guī)則信息選用定長方式存儲,針對變量信息采用不定長方式存儲,方便實用;而且,通過索引信息的建立,提供高效的圖數(shù)據(jù)讀取方式;通過將不同的圖像存儲在一個數(shù)據(jù)文件中,便于緩存,也避免一個圖像存儲成一個文件產(chǎn)生的大量零散小文件影響后續(xù)文件讀取的性能,以及可能造成文件的丟失。[0130]實施例14[0131]作為本發(fā)明其他實施例的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),在上述實施例13的基礎(chǔ)上,還包括瀏覽器顯示子模塊,瀏覽器顯示子模塊具體包括:[0132]位置讀取子模塊,用于從數(shù)據(jù)文件中讀取每一個第一格式圖像和第二格式圖像的位置;[0133]動態(tài)網(wǎng)頁構(gòu)建子模塊,用于根據(jù)每一個第一格式圖像和第二格式圖像的位置構(gòu)建動態(tài)網(wǎng)頁信息;[0134]顯示子模塊,用于讀取每一個第一格式圖像和第二格式圖像的數(shù)據(jù)并顯示在構(gòu)建的動態(tài)網(wǎng)頁的對應(yīng)位置上。[0135]下面結(jié)合圖3和圖4所示的版式頁面示例,對本發(fā)明的基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法和系統(tǒng)進(jìn)行具體說明:[0136]以圖3中所示的文檔頁面為例,該頁面根據(jù)元數(shù)據(jù)的不同被劃分為四個部分:文字部分1、圖像部分2、文字部分3和文字部分4,每部分被最終轉(zhuǎn)換成一張圖像,其中圖像部分2被轉(zhuǎn)換成適于顏色單一的的PNG圖像,其他三部分被轉(zhuǎn)換成適于壓縮顏色復(fù)雜的JPG圖像,各張圖像的詳細(xì)信息如下表所示:[0137]【權(quán)利要求】1.一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,包括如下步驟:區(qū)域劃分:對所述頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域;將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像。2.根據(jù)權(quán)利要求1所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,所述區(qū)域劃分步驟具體包括:將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;將頁面元素為圖像類型的區(qū)域劃分為顏色復(fù)雜區(qū)域。3.根據(jù)權(quán)利要求1所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,所述區(qū)域劃分步驟具體包括:將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復(fù)雜區(qū)域。4.根據(jù)權(quán)利要求2或3所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,所述頁面元素所在的區(qū)域根據(jù)所述頁面元素的位置、大小和縮放信息確定。5.根據(jù)權(quán)利要求1-4任一所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,所述第一格式圖像為PNG圖像。6.根據(jù)權(quán)利要求1-5任一所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,所述第二格式圖像為JPG圖像。7.根據(jù)權(quán)利要求1-6任一所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,所述存儲按照W下步驟進(jìn)行:將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉(zhuǎn)換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應(yīng)的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中。8.根據(jù)權(quán)利要求7所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換方法,其特征在于,還包括W下瀏覽器顯示的步驟:從所述數(shù)據(jù)文件中讀取每一個所述第一格式圖像和第二格式圖像的位置;根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構(gòu)建動態(tài)網(wǎng)頁信息;讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構(gòu)建的所述動態(tài)網(wǎng)頁的對應(yīng)位置上。9.一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),其特征在于,包括:區(qū)域劃分模塊,對所述頁面文檔內(nèi)容進(jìn)行劃分,得到顏色單一區(qū)域和顏色復(fù)雜區(qū)域;圖像轉(zhuǎn)換模塊,將顏色單一區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色單一內(nèi)容的第一格式圖像并存儲;將顏色復(fù)雜區(qū)域內(nèi)的頁面內(nèi)容轉(zhuǎn)換成適于壓縮顏色復(fù)雜內(nèi)容的第二格式圖像并存儲。10.根據(jù)權(quán)利要求9所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),其特征在于,所述區(qū)域劃分模塊具體包括:顏色單一區(qū)域劃分子模塊:用于將文字類型的所述頁面元素所在的區(qū)域劃分為顏色單一區(qū)域;顏色復(fù)雜區(qū)域劃分子模塊:用于將圖像類型的所述頁面元素所在的區(qū)域劃分為顏色復(fù)雜區(qū)域。11.根據(jù)權(quán)利要求9所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),其特征在于,所述區(qū)域劃分模塊具體包括:顏色單一區(qū)域獲取子模塊,用于將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;顏色復(fù)雜區(qū)域獲取子模塊,用于將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復(fù)雜區(qū)域。12.根據(jù)權(quán)利要求10或11所述的一種基于文檔頁面內(nèi)容的圖像轉(zhuǎn)換系統(tǒng),其特征在于,還包括根據(jù)所述頁面元素的位置、大小和縮放信息確定所述頁面元素所在的區(qū)域的子模塊?!疚臋n編號】G06T9/00GK104462159SQ201310450959【公開日】2015年3月25日申請日期:2013年9月25日優(yōu)先權(quán)日:2013年9月25日【發(fā)明者】童征宇,董寧,徐劍波申請人:北大方正集團(tuán)有限公司,北京方正阿帕比技術(shù)有限公司