文檔壓縮系統(tǒng)及方法

文檔序號：6587439閱讀：227來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：文檔壓縮系統(tǒng)及方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種數(shù)據(jù)處理系統(tǒng)及方法，尤其涉及一種文檔壓縮系統(tǒng)及方法。
背景技術(shù)：
傳統(tǒng)的文檔壓縮方法采用同一種壓縮算法對整個文檔進(jìn)行壓縮，但是，如果需要壓縮的文檔中包含有圖片，這種壓縮方法存在以下兩個缺點(1)如果使用圖片壓縮算法，則文檔中的文本內(nèi)容(包括文字和空格等)就不能獲得很好的壓縮效果，以致壓縮后的文檔容量過大；(2)如果使用文本壓縮算法，雖然文檔中的文檔內(nèi)容能夠獲得很好的壓縮效果，但會將文檔中的圖片強(qiáng)制轉(zhuǎn)換為二值化圖片(黑白圖片)，導(dǎo)致文檔中的圖片清晰度變差。

發(fā)明內(nèi)容
鑒于以上內(nèi)容，有必要提供一種文檔壓縮系統(tǒng)，其可根據(jù)待壓縮文檔中不同區(qū)塊的類型，選用不同的壓縮算法進(jìn)行壓縮。鑒于以上內(nèi)容，還有必要提供一種文檔壓縮方法，其可根據(jù)待壓縮文檔中不同區(qū) 塊的類型，選用不同的壓縮算法進(jìn)行壓縮?！N文檔壓縮系統(tǒng)，該系統(tǒng)包括獲取模塊，用于從存儲體中獲取待壓縮的文檔；分割模塊，用于將該文檔分割成不同類型的區(qū)塊，該區(qū)塊的類型包括圖片和文本；判斷模塊，用于依次判斷每個區(qū)塊的類型；壓縮模塊，用于當(dāng)一個區(qū)塊的類型為圖片時，根據(jù)圖片壓縮算法壓縮該區(qū)塊；所述壓縮模塊，還用于當(dāng)一個區(qū)塊的類型為文本時，根據(jù)文本壓縮算法壓縮該區(qū)塊；合并模塊，用于將所有壓縮后的區(qū)塊合并在一起，生成壓縮后的文檔。一種文檔壓縮方法，該方法包括如下步驟從存儲體中獲取待壓縮的文檔；將該文檔分割成不同類型的區(qū)塊，該區(qū)塊的類型包括圖片和文本；依次判斷該文檔中每個區(qū)塊的類型；如果一個區(qū)塊的類型為圖片，根據(jù)圖片壓縮算法壓縮該區(qū)塊；如果一個區(qū)塊的類型為文本，根據(jù)文本壓縮算法壓縮該區(qū)塊；將所有壓縮后的區(qū)塊合并在一起，生成壓縮后的文檔。相較于現(xiàn)有技術(shù)，所述的文檔壓縮系統(tǒng)及方法，其可根據(jù)待壓縮文檔中不同區(qū)塊的類型，選用不同的壓縮算法進(jìn)行壓縮，使壓縮后的文檔中圖片的清晰度保持高品質(zhì)，同時整個文檔壓縮后容量較小。

圖1是本發(fā)明文檔壓縮系統(tǒng)較佳實施例的系統(tǒng)架構(gòu)圖。圖2是本發(fā)明文檔壓縮方法較佳實施例的流程圖。圖3是本發(fā)明將待壓縮文檔分割成不同區(qū)塊的示意圖。
具體實施例方式如圖1所示，是本發(fā)明文檔壓縮系統(tǒng)較佳實施例的系統(tǒng)架構(gòu)圖。該文檔壓縮系統(tǒng) 21運行于主機(jī)2中，所述主機(jī)2與顯示設(shè)備1、文檔生成系統(tǒng)3和輸入設(shè)備4相連。該主機(jī) 2包括存儲體20和中央處理器(Central Processing Unit，CPU) 23。其中，所述文檔生成系統(tǒng)3用于生成待壓縮的文檔(如PDF文檔)。該文檔生成系統(tǒng)3可運行于主機(jī)2中，或運行于一個外接設(shè)備中。所述存儲體20可以是主機(jī)2中的硬盤等，用于存儲文檔生成系統(tǒng)3生成的文檔資料22。所述中央處理器23用于控制文檔壓縮系統(tǒng)21的執(zhí)行。所述主機(jī)2連接有顯示設(shè)備1，用于顯示文檔生成系統(tǒng)3生成的文檔資料22，該文檔資料22包括待壓縮的文檔。所述輸入設(shè)備4可以是鍵盤和鼠標(biāo)等，用于進(jìn)行數(shù)據(jù)輸入。所述文檔壓縮系統(tǒng)21用于從存儲體20中獲取待壓縮的文檔，并根據(jù)不同的壓縮算法對該文檔進(jìn)行壓縮。其中，該文檔壓縮系統(tǒng)21包括獲取模塊210、分割模塊211、判斷模塊212、壓縮模塊213和合并模塊214。本發(fā)明所稱的模塊是完成一特定功能的計算機(jī)程序段，比程序更適合于描述軟件在計算機(jī)中的執(zhí)行過程，因此在本發(fā)明以下對軟件描述都以模塊描述。所述獲取模塊210用于從存儲體20中獲取待壓縮的文檔。所述分割模塊211用于將該文檔分割成不同類型的區(qū)塊。在本實施例中，區(qū)塊的類型包括圖片和文本。如圖3所示，文檔5為待壓縮的文檔，該文檔5被分割成區(qū)塊bl、b2、 b3、b4、b5。其中，bl、b3、b5為圖片區(qū)塊，b2、b4為文本區(qū)塊。所述判斷模塊212用于依次判斷每個區(qū)塊的類型。舉例而言，如果一個區(qū)塊的彩色像素點數(shù)大于或等于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為圖片，如果該區(qū) 塊的彩色像素點數(shù)小于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為文本。所述壓縮模塊213用于當(dāng)一個區(qū)塊的類型為圖片時，根據(jù)圖片壓縮算法壓縮該區(qū)塊，如圖3中的5b。在本實施例中，所述圖片壓縮算法采用JPEG(Joint Photographic ExpertsGroup，聯(lián)合圖像專家組)壓縮算法。經(jīng)過JPEG壓縮算法壓縮后的區(qū)塊能保持原來區(qū)塊的清晰度，顏色不會失真。所述壓縮模塊213還用于當(dāng)一個區(qū)塊的類型為文本時，根據(jù)文本壓縮算法壓縮該區(qū)塊，如圖3中的5a。在本實施例中，所述文本壓縮算法采用TIFF (Tagged Image File Format，標(biāo)簽圖像文件格式)壓縮算法，如TIFF Fax4。經(jīng)過TIFF壓縮算法壓縮后的區(qū)塊將變成二值化的圖片。具體而言，本領(lǐng)域的技術(shù)人員一般將白色的灰度值定義為255，黑色灰度值定義為0，而由黑到白之間的明暗度均勻地劃分為256個等級，壓縮模塊213以該區(qū)塊的平均灰度值作為二值化處理的分界值，將該區(qū)塊轉(zhuǎn)換為只有兩個灰度值(例如0和255) 的圖片。例如，將所有灰度值大于該區(qū)塊平均灰度值的像素點轉(zhuǎn)換為黑色，將所有灰度值小于等于該區(qū)塊平均灰度值的像素點轉(zhuǎn)換為白色。所述合并模塊214用于將所有壓縮后的區(qū)塊合并在一起，生成壓縮后的文檔。如圖2所示，是本發(fā)明文檔壓縮方法較佳實施例的流程圖。步驟Si，獲取模塊210從存儲體20中獲取待壓縮的文檔。步驟S2，分割模塊211將該文檔分割成不同類型的區(qū)塊。在本實施例中，區(qū)塊的類型包括圖片和文本。如圖3所示，文檔5為待壓縮的文檔，該文檔5被分割成區(qū)塊bl、b2、b3、b4、b5。其中，bl、b3、b5為圖片區(qū)塊，b2、b4為文本區(qū)塊。步驟S3，判斷模塊212依次判斷每個區(qū)塊的類型，如果一個區(qū)塊的類型為圖片，則執(zhí)行步驟S4,如果一個區(qū)塊的類型為文本，則執(zhí)行步驟S5。其中，判斷一個區(qū)塊的類型包括如果該區(qū)塊的彩色像素點數(shù)大于或等于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為圖片，如果該區(qū)塊的彩色像素點數(shù)小于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為文本。步驟S4,壓縮模塊213根據(jù)圖片壓縮算法壓縮該區(qū)塊，如圖3中的5b。在本實施例中，所述圖片壓縮算法采用JPEG(Joint Photographic Experts Group，聯(lián)合圖像專家組) 壓縮算法。經(jīng)過JPEG壓縮算法壓縮后的區(qū)塊能保持原來區(qū)塊的清晰度，顏色不會失真。步驟S5，壓縮模塊213根據(jù)文本壓縮算法壓縮該區(qū)塊，如圖3中的5a。在本實施例中，所述文本壓縮算法采用TIFF (Tagged Image File Format，標(biāo)簽圖像文件格式)壓縮算法。經(jīng)過TIFF壓縮算法壓縮后的區(qū)塊將變成二值化的圖片。具體而言，本領(lǐng)域的技術(shù)人員一般將白色的灰度值定義為255，黑色灰度值定義為0，而由黑到白之間的明暗度均勻地劃分為256個等級，壓縮模塊213以該區(qū)塊的平均灰度值作為二值化處理的分界值，將該區(qū)塊轉(zhuǎn)換為只有兩個灰度值(例如O和255)的圖片。例如，將所有灰度值大于該區(qū)塊平均灰度值的像素點轉(zhuǎn)換為黑色，將所有灰度值小于等于該區(qū)塊平均灰度值的像素點轉(zhuǎn)換為白色。步驟S6，合并模塊214將所有壓縮后的區(qū)塊合并在一起，生成壓縮后的文檔。最后應(yīng)說明的是，以上實施例僅用以說明本發(fā)明的技術(shù)方案而非限制，盡管參照較佳實施例對本發(fā)明進(jìn)行了詳細(xì)說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解，可以對本發(fā)明的技術(shù)方案進(jìn)行修改或等同替換，而不脫離本發(fā)明技術(shù)方案的精神和范圍。
權(quán)利要求
1.一種文檔壓縮方法，其特征在于，該方法包括如下步驟從存儲體中獲取待壓縮的文檔；將該文檔分割成不同類型的區(qū)塊，該區(qū)塊的類型包括圖片和文本；依次判斷該文檔中每個區(qū)塊的類型；如果一個區(qū)塊的類型為圖片，根據(jù)圖片壓縮算法壓縮該區(qū)塊；如果一個區(qū)塊的類型為文本，根據(jù)文本壓縮算法壓縮該區(qū)塊；及將所有壓縮后的區(qū)塊合并在一起，生成壓縮后的文檔。
2.如權(quán)利要求1所述的文檔壓縮方法，其特征在于，所述步驟判斷每個區(qū)塊的類型包括如果一個區(qū)塊的彩色像素點數(shù)大于或等于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為圖片；及如果一個區(qū)塊的彩色像素點數(shù)小于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為文本。
3.如權(quán)利要求1所述的文檔壓縮方法，其特征在于，所述圖片壓縮算法為JPEGCJoint Photographic Experts Group，聯(lián)合圖像專家組)壓縮算法。
4.如權(quán)利要求1所述的文檔壓縮方法，其特征在于，所述文本壓縮算法為TIFF(Tagged Image File Format，標(biāo)簽圖像文件格式)壓縮算法。
5.如權(quán)利要求4所述的文檔壓縮方法，其特征在于，經(jīng)過TIFF壓縮算法壓縮后的區(qū)塊為二值化的圖片。
6.一種文檔壓縮系統(tǒng)，其特征在于，該系統(tǒng)包括獲取模塊，用于從存儲體中獲取待壓縮的文檔；分割模塊，用于將該文檔分割成不同類型的區(qū)塊，該區(qū)塊的類型包括圖片和文本；判斷模塊，用于依次判斷每個區(qū)塊的類型；壓縮模塊，用于當(dāng)一個區(qū)塊的類型為圖片時，根據(jù)圖片壓縮算法壓縮該區(qū)塊；所述壓縮模塊，還用于當(dāng)一個區(qū)塊的類型為文本時，根據(jù)文本壓縮算法壓縮該區(qū)塊；及合并模塊，用于將所有壓縮后的區(qū)塊合并在一起，生成壓縮后的文檔。
7.如權(quán)利要求6所述的文檔壓縮系統(tǒng)，其特征在于，所述判斷模塊判斷每個區(qū)塊的類型包括如果一個區(qū)塊的彩色像素點數(shù)大于或等于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為圖片；及如果一個區(qū)塊的彩色像素點數(shù)小于該區(qū)塊總像素點數(shù)的一半，則判定該區(qū)塊的類型為文本。
8.如權(quán)利要求6所述的文檔壓縮系統(tǒng)，其特征在于，所述圖片壓縮算法為JPEGCJoint Photographic Experts Group，聯(lián)合圖像專家組)壓縮算法。
9.如權(quán)利要求6所述的文檔壓縮系統(tǒng)，其特征在于，所述文本壓縮算法為TIFF(Tagged Image File Format，標(biāo)簽圖像文件格式)壓縮算法。
10.如權(quán)利要求9所述的文檔壓縮系統(tǒng)，其特征在于，經(jīng)過TIFF壓縮算法壓縮后的區(qū)塊為二值化的圖片。
全文摘要
一種文檔壓縮方法，該方法包括如下步驟從存儲體中獲取待壓縮的文檔；將該文檔分割成不同類型的區(qū)塊，該區(qū)塊的類型包括圖片和文本；依次判斷該文檔中每個區(qū)塊的類型；如果一個區(qū)塊的類型為圖片，根據(jù)圖片壓縮算法壓縮該區(qū)塊；如果一個區(qū)塊的類型為文本，根據(jù)文本壓縮算法壓縮該區(qū)塊；將所有壓縮后的區(qū)塊合并在一起，生成壓縮后的文檔。利用本發(fā)明可以根據(jù)待壓縮文檔中不同區(qū)塊的類型，選用不同的壓縮算法進(jìn)行壓縮。
文檔編號G06F17/30GK101996227SQ20091030557
公開日2011年3月30日申請日期2009年8月13日優(yōu)先權(quán)日2009年8月13日
發(fā)明者葉建發(fā), 李忠一, 鄭山川申請人:鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李忠一;葉建發(fā);鄭山川
技術(shù)所有人：鴻富錦精密工業(yè)（深圳）有限公司;鴻海精密工業(yè)股份有限公司
我是此專利的發(fā)明人

上一篇：便攜式電子裝置的制作方法
上一篇：溫度自動量測系統(tǒng)及量測方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

文檔壓縮系統(tǒng)及方法