數(shù)字文檔保護(hù)方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種用于創(chuàng)建受保護(hù)的數(shù)字文檔的方法,包括:對該數(shù)字文檔進(jìn)行解析;將該數(shù)字文檔從原始格式轉(zhuǎn)化成TIFF圖像文件;在該TIFF圖像文件的第一圖像文件目錄IFD中定義第一自定義標(biāo)簽;將原始格式數(shù)字文檔保存在該第一自定義標(biāo)簽中;以及在該TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印。
【專利說明】數(shù)字文檔保護(hù)方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文檔處理,尤其涉及數(shù)字文檔保護(hù)方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著數(shù)字時代的到來,文檔內(nèi)容逐漸由紙質(zhì)形式向數(shù)字形式轉(zhuǎn)變,而數(shù)字文檔信息內(nèi)容和介質(zhì)無關(guān),復(fù)制非常簡單,并且內(nèi)容傳輸需要的帶寬較低。這些特點(diǎn)使得數(shù)字文檔的存儲、復(fù)制與傳播變得非常方便,但是由此引發(fā)的對于文檔內(nèi)容中敏感信息未經(jīng)授權(quán)的篡改和重用也成為文檔發(fā)布者日益關(guān)心的問題。
[0003]當(dāng)前,對于常用的Word、Excel、PowerPoint等電子文檔,MS Office辦公軟件提供了對相關(guān)文件的信息權(quán)限管理方法,也可以將這些文檔導(dǎo)出為PDF格式文件發(fā)布。這些方法可以幫助防止文檔敏感信息由于意外或粗心擴(kuò)散到錯誤的人員手中。但這些方法只能針對MS Office文檔格式進(jìn)行保護(hù)處理,存在文檔處理格式的局限性。而且,一般經(jīng)過保護(hù)處理的數(shù)字文檔中不包含被保護(hù)文檔的原始文檔,這對于需要掌控全部文檔使用權(quán)限的用戶來說,反而較為不便。
[0004]因此,本領(lǐng)域亟需一種通用、靈活的數(shù)字文檔的保護(hù)方案。
【發(fā)明內(nèi)容】
[0005]以下給出一個或多個方面的簡要概述以提供對這些方面的基本理解。此概述不是所有構(gòu)想到的方面的詳盡綜覽,并且既非旨在指認(rèn)出所有方面的關(guān)鍵性或決定性要素亦非試圖界定任何或所有方面的范圍。其唯一的目的是要以簡化形式給出一個或多個方面的一些概念以為稍后給出的更加詳細(xì)的描述之序。
[0006]根據(jù)本發(fā)明的一方面,提供一種用于創(chuàng)建受保護(hù)的數(shù)字文檔的方法,包括:對該數(shù)字文檔進(jìn)行解析;將該數(shù)字文檔從原始格式轉(zhuǎn)化成TIFF圖像文件;在該TIFF圖像文件的第一圖像文件目錄IFD中定義第一自定義標(biāo)簽;將原始格式數(shù)字文檔保存在該第一自定義標(biāo)簽中;以及在該TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印。
[0007]在一實(shí)例中,該數(shù)字文檔的原始格式為Word、Excel、PowerPoint、HTML網(wǎng)頁、文本文件格式中的一者。
[0008]在一實(shí)例中,將該數(shù)字文檔存儲在該第一自定義標(biāo)簽中包括:對該原始格式數(shù)字文檔執(zhí)行壓縮;對壓縮后的原始格式數(shù)字文檔進(jìn)行加密;以及將加密后的原始格式數(shù)字文檔存儲在該第一自定義標(biāo)簽中。
[0009]在一實(shí)例中,該方法還包括:在該TIFF圖像文件中的該第一 IFD中定義第二自定義標(biāo)簽;以及將該數(shù)字文檔的分類信息保存在該第二自定義標(biāo)簽中。
[0010]在一實(shí)例中,在該TIFF圖像文件的該圖像數(shù)據(jù)中嵌入該水印包括:對該水印執(zhí)行加密和置亂處理;對該圖像數(shù)據(jù)執(zhí)行DCT變換;根據(jù)水印嵌入策略在該圖像數(shù)據(jù)的頻域中嵌入經(jīng)加密和置亂的水印;以及對嵌入水印后的該圖像數(shù)據(jù)執(zhí)行IDCT變換。
[0011]根據(jù)本發(fā)明的另一方面,提供了一種用于瀏覽受保護(hù)的數(shù)字文檔的方法,該數(shù)字文檔被包括在TIFF圖像文件中,該方法包括:從該TIFF圖像文件的圖像數(shù)據(jù)中恢復(fù)水?。或?yàn)證所恢復(fù)的水?。蝗趄?yàn)證成功,則播放該TIFF圖像文件的圖像;以及若驗(yàn)證失敗,則從該TIFF圖像文件的第一圖像文件目錄IFD中的第一自定義標(biāo)簽中讀取原始格式數(shù)字文檔。
[0012]在一實(shí)例中,從該TIFF圖像文件的第一自定義標(biāo)簽中提取該原始格式數(shù)字文檔包括:對該原始格式數(shù)字文檔進(jìn)行解密;以及對解密后的原始格式數(shù)字文檔執(zhí)行解壓縮以獲得原始的數(shù)字文檔。
[0013]在一實(shí)例中,從該TIFF圖像文件的該圖像數(shù)據(jù)中恢復(fù)該水印包括:對該圖像數(shù)據(jù)執(zhí)行DCT變換;根據(jù)水印提取策略從該圖像數(shù)據(jù)的頻域中提取該水?。灰约皩λ崛〕龅乃?zhí)行解密和反置亂處理以恢復(fù)水印。
[0014]在一實(shí)例中,驗(yàn)證所恢復(fù)的水印包括:將所恢復(fù)出的水印與原始水印進(jìn)行比較;若兩者一致,則驗(yàn)證成功,否則驗(yàn)證失敗。
[0015]在一實(shí)例中,該方法還包括:從該TIFF圖像文件的該第一 IFD中的第二自定義標(biāo)簽中讀取該數(shù)字文檔的分類信息。
[0016]根據(jù)本發(fā)明的又一方面,提供了一種用于創(chuàng)建受保護(hù)的數(shù)字文檔的服務(wù)端,包括:文檔解析器,用以對該數(shù)字文檔進(jìn)行解析;格式轉(zhuǎn)換器,用以將該數(shù)字文檔從原始格式轉(zhuǎn)化成TIFF圖像文件;自定義標(biāo)簽寫入器,用以在該TIFF圖像文件的第一圖像文件目錄IFD中定義第一自定義標(biāo)簽,并將該數(shù)字文檔保存在該第一自定義標(biāo)簽中;以及水印嵌入器,用以在該TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印。
[0017]在一實(shí)例中,該數(shù)字文檔的原始格式為Word、Excel、PowerPoint、HTML網(wǎng)頁、文本文件格式中的一者。
[0018]在一實(shí)例中,該服務(wù)端還包括壓縮及加密器,用以對該數(shù)字文檔執(zhí)行壓縮并對壓縮后的數(shù)字文檔進(jìn)行加密,其中該自定義標(biāo)簽寫入器將該數(shù)字文檔保存在該第一自定義標(biāo)簽中包括將加密后的數(shù)字文檔存儲在該第一自定義標(biāo)簽中。
[0019]在一實(shí)例中,自定義標(biāo)簽寫入器還在該TIFF圖像文件的該第一 IFD中定義第二自定義標(biāo)簽,并將該數(shù)字文檔的分類信息保存在該第二自定義標(biāo)簽中。
[0020]在一實(shí)例中,該水印嵌入器嵌入水印包括:對該水印執(zhí)行加密和置亂處理;對該圖像數(shù)據(jù)執(zhí)行DCT變換;根據(jù)水印嵌入策略在該圖像數(shù)據(jù)的頻域中嵌入經(jīng)加密和置亂的水印;以及對嵌入水印后的該圖像數(shù)據(jù)執(zhí)行IDCT變換。
[0021]根據(jù)本發(fā)明的再一方面,提供了一種用于瀏覽受保護(hù)的數(shù)字文檔的客戶端,該數(shù)字文檔被包括在TIFF圖像文件中,該客戶端包括:水印檢測器,用以從該TIFF圖像文件的圖像數(shù)據(jù)中恢復(fù)水印,并驗(yàn)證所恢復(fù)的水印;以及圖像瀏覽器,用以在水印驗(yàn)證成功時播放該TIFF圖像文件的圖像;以及自定義標(biāo)簽讀取器,用以從該TIFF圖像文件的第一圖像文件目錄IFD中的第一自定義標(biāo)簽中讀取原始格式數(shù)字文檔。
[0022]在一實(shí)例中,該客戶端還包括解壓縮及解密器,用以對該原始格式數(shù)字文檔進(jìn)行解密,以及對解密后的原始格式數(shù)字文檔執(zhí)行解壓縮以獲得原始的數(shù)字文檔。
[0023]在一實(shí)例中,該水印檢測器恢復(fù)水印包括:對該圖像數(shù)據(jù)執(zhí)行DCT變換;根據(jù)水印提取策略從該圖像數(shù)據(jù)的頻域中提取該水?。灰约皩λ崛〕龅乃?zhí)行解密和反置亂處理以恢復(fù)水印。
[0024]在一實(shí)例中,該水印檢測器驗(yàn)證所恢復(fù)的水印包括:將所恢復(fù)出的水印與原始水印進(jìn)行比較;若兩者一致,則驗(yàn)證成功,否則驗(yàn)證失敗。
[0025]在一實(shí)例中,該自定義標(biāo)簽讀取器還從該TIFF圖像文件的該第一 IFD中的第二自定義標(biāo)簽中讀取該數(shù)字文檔的分類信息。
【專利附圖】
【附圖說明】
[0026]在結(jié)合以下附圖閱讀本公開的實(shí)施例的詳細(xì)描述之后,能夠更好地理解本發(fā)明的上述特征和優(yōu)點(diǎn)。在附圖中,各組件不一定是按比例繪制,并且具有類似的相關(guān)特性或特征的組件可能具有相同或相近的附圖標(biāo)記。
[0027]圖1是示出了 TIFF格式圖像文件的文件結(jié)構(gòu)的示意圖;
[0028]圖2是示出了根據(jù)本發(fā)明的一方面的數(shù)字水印系統(tǒng)的示意圖。
[0029]圖3是示出了根據(jù)本發(fā)明的一方面的文檔保護(hù)系統(tǒng)的服務(wù)端所執(zhí)行的方法的流程圖。
[0030]圖4是示出了根據(jù)本發(fā)明的一方面的文檔保護(hù)系統(tǒng)的客戶端所執(zhí)行的方法的流程圖。
[0031]圖5是示出了根據(jù)本發(fā)明的一方面的文檔保護(hù)系統(tǒng)的服務(wù)端和客戶端的框圖。
【具體實(shí)施方式】
[0032]以下結(jié)合附圖和具體實(shí)施例對本發(fā)明作詳細(xì)描述。注意,以下結(jié)合附圖和具體實(shí)施例描述的諸方面僅是示例性的,而不應(yīng)被理解為對本發(fā)明的保護(hù)范圍進(jìn)行任何限制。
[0033]TIFF (標(biāo)簽圖像文件格式)是基于標(biāo)記的文件格式,被廣泛地應(yīng)用于對圖像質(zhì)量要求較高的圖像的存儲與轉(zhuǎn)換。TIFF圖像文件格式最早是為了存儲掃描儀圖像而設(shè)計的,可以處理黑白、灰度和彩色圖像,在存儲真彩色圖像時和BMP格式一樣,直接存儲RGB三原色的顏色值而不使用調(diào)色板。由于它的結(jié)構(gòu)靈活和包容性大,它已成為圖像文件格式的一種標(biāo)準(zhǔn),絕大多數(shù)圖像系統(tǒng)都支持這種格式。TIFF格式的圖像文件首先是方便查看,支持windows操作系統(tǒng)自帶的“照片查看器”查看圖像內(nèi)容。TIFF格式的圖像文件的最大色深為32位,可表現(xiàn)非常細(xì)膩的圖像色彩。TIFF格式的圖像文件還有兩個重要特點(diǎn),一是支持多頁圖像,二是TIFF圖像格式的最大特點(diǎn)是擴(kuò)展性好,文件結(jié)構(gòu)支持標(biāo)簽域的自定義和讀取。正是基于TIFF圖像格式的這兩個特點(diǎn),本發(fā)明提出了一種通用、靈活的數(shù)字文檔的保護(hù)方案。
[0034]圖1示出了 TIFF格式圖像文件的文件結(jié)構(gòu)的示意圖。TIFF格式圖像文件一般包括三個要素,即圖像文件頭(IFH)、圖像文件目錄(IFD)和目錄項(DE)、以及圖像數(shù)據(jù),如圖所示。每個TIFF圖像文件以8字節(jié)的IR!開始,IFH是TIFF文件中的第一個數(shù)據(jù)結(jié)構(gòu),處于圖像文件體系結(jié)構(gòu)的最高層。這個結(jié)構(gòu)在一個TIFF文件中是惟一的,有固定的位置。IFH包含了正確解釋TIFF文件的其他部分所需的必要信息,例如IFH具有指向第一個IFD的指針,如圖所示。IFD包含了圖像的各種信息,同時也包含一個指向?qū)嶋H圖像數(shù)據(jù)的指針。如圖所示,每個IFD包括多個DE,每個DE對應(yīng)一標(biāo)簽,這些DE標(biāo)識了 TIFF圖像的大小、分辨率、顏色深度等各種屬性。類似地,每個DE可以有一指針(例如,偏移量)以指向相關(guān)數(shù)據(jù)字段在文件中的開始位置,并且給出數(shù)據(jù)類型及長度,如圖所示。這種文件結(jié)構(gòu)允許數(shù)據(jù)字段定位在文件的任何地方,且可以是任意長度,因此文件格式十分靈活。除了 TIFF圖像文件規(guī)范定義的標(biāo)準(zhǔn)標(biāo)簽屬性外,也可以根據(jù)需要自定義標(biāo)簽用于標(biāo)識特殊的圖像屬性。由于一個IFD只標(biāo)識一個圖像的所有標(biāo)簽屬性,一個TIFF文件中可以有多個圖像,所以,一個TIFF文件中有幾頁圖像,就會對應(yīng)有幾個IFD。
[0035]鑒于TIFF格式圖像文件的上述特點(diǎn),根據(jù)本發(fā)明的一方面,可以將電子文檔文件的每一頁錄制為一幅TIFF圖像,對應(yīng)為一個IFD。由于電子文檔的內(nèi)容被轉(zhuǎn)換成圖像顯示,從而有效防止了對可編輯文檔內(nèi)容的復(fù)制和重用。另外,可以在一 IFD (例如第一 IFD)中定義第一自定義標(biāo)簽,并對原始的電子文檔進(jìn)行壓縮和加密,然后存儲在該第一自定義標(biāo)簽中。由此,在有權(quán)限的用戶存在對原始文件的查閱或編輯的需要時,能夠提取原始文件。根據(jù)本發(fā)明的另一方面,還可以在該IFD中定義第二自定義標(biāo)簽,并將關(guān)于該電子文檔內(nèi)容的分類信息保存在該第二自定義標(biāo)簽中。眾所周知,對于圖像內(nèi)容的檢索和分類異常困難,因此該電子文檔在轉(zhuǎn)換成TIFF圖像文件之后,對于該文檔的直接檢索和分類變得幾乎不可行。在本發(fā)明中,通過將文檔的分類信息保存在自定義標(biāo)簽中,用戶在檢索文檔時可以讀取該自定義標(biāo)簽中存儲的分類信息,從而輕松地實(shí)現(xiàn)對文檔的檢索和分類。
[0036]數(shù)字水印是在數(shù)字媒體信息(如圖像、聲音、視頻等)中添加某些數(shù)字信息,以便保護(hù)數(shù)字媒體的版權(quán),證明產(chǎn)品的真實(shí)可靠性,跟蹤盜版或者提供產(chǎn)品的附加信息。水印信息嵌入在載體文件中,不影響原始文件的感觀和完整性。根據(jù)數(shù)字水印對攻擊的抵抗能力,數(shù)字水印可分為:魯棒性水印、易脆性水印、半易脆性水印。魯棒性水印主要應(yīng)用于數(shù)字圖像的知識產(chǎn)權(quán)保護(hù),防止非法獲取圖像文件,對修改具有較強(qiáng)的魯棒性;易脆性水印則主要應(yīng)用在圖像內(nèi)容的完整性和可信性驗(yàn)證,對修改具有較強(qiáng)的敏感性;半易脆性水印則可以區(qū)分偶然修改和惡意篡改,只對惡意篡改較為敏感。
[0037]根據(jù)本發(fā)明的另一方面,可以在轉(zhuǎn)換得到的TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印,例如易脆性水印。由此,如果TIFF圖像文件中的圖像被修改,通過檢測嵌入其中的易脆性水印,可以對圖像內(nèi)容的完整性和可信性進(jìn)行驗(yàn)證。當(dāng)檢測出TIFF圖像文件中的圖像被篡改時,擁有適當(dāng)權(quán)限的用戶可以獲取被保護(hù)文檔的原始文檔文件進(jìn)行查閱和編輯處理。
[0038]圖2示出了根據(jù)本發(fā)明的一方面的數(shù)字水印系統(tǒng)的示意圖。如圖2所示,水印系統(tǒng)包括水印嵌入器210和水印檢測器220。在一實(shí)施例中,水印嵌入器210可以包括在用于創(chuàng)建受保護(hù)的電子文檔的服務(wù)端中,而水印檢測器220可以包括在用于瀏覽受保護(hù)的電子文檔的客戶端中。水印嵌入器210可包括預(yù)處理模塊212。預(yù)處理模塊212可采用Arnold置亂處理和Logistic混沌加密處理算法,對待嵌入的水印圖像進(jìn)行加密和置亂處理,以增強(qiáng)水印圖像的安全性。經(jīng)過加密和置亂的水印被輸入到嵌入模塊214。嵌入模塊214還接收宿主圖像,例如TIFF圖像文件的圖像數(shù)據(jù),并可對圖像數(shù)據(jù)進(jìn)行DCT變換處理,以將圖像數(shù)據(jù)從空域變換到頻域。隨后,嵌入模塊214可根據(jù)水印嵌入策略在圖像數(shù)據(jù)的頻域中嵌入經(jīng)加密和置亂的水印,并對嵌入水印后的圖像數(shù)據(jù)執(zhí)行IDCT變換,由此得到含水印的圖像。
[0039]含水印的圖像可能受到各種攻擊,例如圖像的篡改。因此,接收方用戶可以通過對水印的檢測來對圖像內(nèi)容的完整性和可行性進(jìn)行驗(yàn)證。水印檢測器220中的提取模塊224可首先對圖像數(shù)據(jù)執(zhí)行DCT變換,以將圖像數(shù)據(jù)從空域變換到頻域,然后可根據(jù)水印提取策略從圖像數(shù)據(jù)的頻域中提取出水印。提取出的水印可被輸入到反預(yù)處理模塊222,該反預(yù)處理模塊222可采用Arnold反置亂處理和Logistic反混沌加密處理算法對提取的水印信號進(jìn)行解密和反置亂處理,以恢復(fù)水印。盡管未在圖中示出,水印檢測器220還可包括將恢復(fù)出的水印與原始水印進(jìn)行比較的模塊,以對恢復(fù)出的水印進(jìn)行驗(yàn)證。如果兩者一致,則驗(yàn)證成功,表示圖像數(shù)據(jù)未被篡改,否則驗(yàn)證失敗,圖像數(shù)據(jù)可能被篡改。
[0040]圖3示出了根據(jù)本發(fā)明的一方面的文檔保護(hù)系統(tǒng)的服務(wù)端所執(zhí)行的方法的流程圖。在步驟302,對數(shù)字文檔進(jìn)行解析。待處理的文件作為輸入提供給文檔保護(hù)系統(tǒng)的服務(wù)端,服務(wù)端根據(jù)輸入文件的后綴名識別數(shù)字文檔的文件類型,并調(diào)用相應(yīng)的組件解析文檔數(shù)據(jù),為后續(xù)的格式轉(zhuǎn)換做好準(zhǔn)備工作。根據(jù)本發(fā)明的文檔保護(hù)系統(tǒng)可以將多種格式的文檔文件轉(zhuǎn)化為多頁TIFF圖像文件,主要包括常見的Word、Excel、PowerPoint及HTML網(wǎng)頁和文本格式的數(shù)字文檔等等。對于新增文檔格式的處理可添加相應(yīng)的處理組件,以使得文檔保護(hù)系統(tǒng)在可處理的文檔格式方面具備良好的擴(kuò)展性。
[0041]在步驟304,將該數(shù)字文檔從原始格式轉(zhuǎn)化成TIFF圖像文件。由此,原始數(shù)字文檔的可編輯的敏感信息作為TIFF圖像文件的各頁圖像上的圖像內(nèi)容被顯示。相對于轉(zhuǎn)換前的文檔格式,由于圖像文件不便于對敏感信息進(jìn)行編輯,可以阻止對文檔中敏感信息的直接篡改和重用。在一些實(shí)例中,格式轉(zhuǎn)換還可包括首先將解析后的數(shù)據(jù)按照所設(shè)定的格式顯示出來,每個頁面的顯示內(nèi)容對應(yīng)于TIFF圖像文件中的一頁圖像。由此,用戶可以通過格式設(shè)定來調(diào)整文檔的頁面顯示內(nèi)容,從而例如,在用戶瀏覽所顯示的文檔時,可通過抓屏當(dāng)前頁面而將當(dāng)前的頁面顯示內(nèi)容轉(zhuǎn)換成TIFF圖像文件中的一頁圖像,也可通過將文檔頁面進(jìn)行批量抓屏而將整個文檔的內(nèi)容轉(zhuǎn)換成TIFF圖像文件中的多頁圖像。以此方式,轉(zhuǎn)換后的TIFF圖像文件的每頁圖像可對應(yīng)于按照所設(shè)定格式顯示的文檔的相應(yīng)頁面顯示內(nèi)容。本發(fā)明的格式轉(zhuǎn)換包括但不限于上述格式轉(zhuǎn)換方式,本領(lǐng)域技術(shù)人員能夠領(lǐng)會,可采用任何已知的文檔格式轉(zhuǎn)換方式將解析后的文檔數(shù)據(jù)轉(zhuǎn)換成TIFF圖像文件格式。
[0042]在步驟306,在得到的TIFF圖像文件中定義和寫入自定義標(biāo)簽。在一實(shí)施例中,可以在該TIFF圖像文件的特定IFD中定義第一自定義標(biāo)簽,并且可將原始格式的該數(shù)字文檔保存在該第一自定義標(biāo)簽中。具體地,可以在TIFF圖像文件的第一 IFD中定義一個標(biāo)簽號例如為42222且存儲類型為byte數(shù)組的自定義標(biāo)簽。為了便于安全有效地備份存儲文檔文件的原稿,較優(yōu)地,還可在存儲原始格式數(shù)字文檔之前,對數(shù)字文檔進(jìn)行壓縮以減少TIFF圖像自定義標(biāo)簽中存儲備份文件的尺寸,例如,可采用LZW編碼和哈夫曼編碼相結(jié)合的高效無損壓縮算法對文檔文件進(jìn)行壓縮。隨后,可對壓縮后的文檔進(jìn)行加密,例如,對壓縮后的文檔采用3DES對稱加密算法進(jìn)行加密處理。最后,將加密后的原始格式的數(shù)字文檔保存在上述自定義標(biāo)簽中。在另一實(shí)施例中,還可以在該TIFF圖像文件的特定IFD中定義第二自定義標(biāo)簽,并且可將該數(shù)字文檔的分類信息保存在該第二自定義標(biāo)簽中。具體地,可以在TIFF圖像文件的第一 IFD中定義一個標(biāo)簽號例如為42220且存儲類型為文本類型的自定義標(biāo)簽,將該分類彳目息保存在該自定乂標(biāo)簽中。
[0043]在步驟308,在該TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印。例如,該水印可以是易脆性水印。易脆性水印對圖像內(nèi)容的修改具有較強(qiáng)的敏感性,可以用于圖像內(nèi)容的完整性和可信性的驗(yàn)證。具體地,可以首先對水印執(zhí)行加密和置亂處理,再對該圖像數(shù)據(jù)執(zhí)行DCT變換以將其變換到頻域,然后根據(jù)水印嵌入策略在圖像數(shù)據(jù)的頻域中嵌入經(jīng)加密和置亂的水印,最后再對嵌入了水印的圖像數(shù)據(jù)執(zhí)行IDCT變換以將其變換回空域。
[0044]由此,創(chuàng)建了受保護(hù)的數(shù)字文檔,在該受保護(hù)的數(shù)字文檔中,原始文檔文件的敏感信息以圖像內(nèi)容為用戶可見,在有效傳播信息內(nèi)容的同時,由于圖像內(nèi)容不便于編輯,阻止了對敏感信息的直接篡改和重用。另外,在圖像數(shù)據(jù)被篡改的情況下,可以通過水印的檢測發(fā)現(xiàn)圖像數(shù)據(jù)的篡改,有權(quán)限的用戶仍然可以通過對TIFF圖像文件中自定義標(biāo)簽的讀取來獲得原始文檔文件。
[0045]圖4示出了根據(jù)本發(fā)明的一方面的文檔保護(hù)系統(tǒng)的客戶端所執(zhí)行的方法的流程圖。在步驟402,從TIFF圖像文件的圖像數(shù)據(jù)中恢復(fù)水印。具體地,可以首先對該圖像數(shù)據(jù)執(zhí)行DCT變換以將其從空域變換到頻域,然后根據(jù)水印提取策略從該圖像數(shù)據(jù)的頻域中提取水印,再對所提取出的水印執(zhí)行解密和反置亂處理以恢復(fù)水印。在步驟404,可對所恢復(fù)的水印進(jìn)行驗(yàn)證。具體地,可將所恢復(fù)出的水印與原始水印進(jìn)行比較,若兩者一致,則驗(yàn)證成功,否則驗(yàn)證失敗。
[0046]若驗(yàn)證成功,則方法行進(jìn)到步驟406,其中可播放該TIFF圖像文件的圖像。如上所述,易脆性水印對于篡改具有較強(qiáng)的敏感性,因此,在易脆性水印未被破壞的情況下,可以認(rèn)為TIFF圖像文件中的圖像內(nèi)容真實(shí)可信,因而可以播放該TIFF圖像文件的圖像以供用戶瀏覽。若驗(yàn)證失敗,則方法行進(jìn)至步驟408。易脆性水印的驗(yàn)證失敗表明圖像內(nèi)容被篡改,由此TIFF圖像文件的當(dāng)前圖像不可信。在一實(shí)例中,還可以給出圖像可能被篡改的提示。因此,有權(quán)限的用戶可以從TIFF圖像文件的特定IFD中的自定義標(biāo)簽中讀取原始數(shù)字文檔。具體地,可以從該TIFF圖像文件的第一圖像文件目錄IFD中的第一自定義標(biāo)簽中讀取原始格式數(shù)字文檔。例如可以從第一 IFD中的標(biāo)簽號為42222的自定義標(biāo)簽中讀取byte數(shù)組類型的原始格式數(shù)字文檔。權(quán)限的判斷可以通過要求用戶提供密碼來實(shí)現(xiàn)。較優(yōu)地,該原始格式數(shù)字文檔是被壓縮和加密的。在此情形中,可對提取的原始格式數(shù)字文檔進(jìn)行解密,再對解密后的文檔執(zhí)行解壓縮以獲得原始的數(shù)字文檔。在另一實(shí)施例中,還可以從該TIFF圖像文件的第一圖像文件目錄IFD中的第二自定義標(biāo)簽中讀取該數(shù)字文檔的分類信息。由于原始文檔在轉(zhuǎn)換成TIFF圖像文件之后,用戶對TIFF圖像內(nèi)容的檢索較為不便,因此有權(quán)限的用戶可通過提取自定義標(biāo)簽中的分類信息實(shí)現(xiàn)文檔內(nèi)容的檢索。
[0047]圖5示出了根據(jù)本發(fā)明的一方面的文檔保護(hù)系統(tǒng)的服務(wù)端和客戶端的框圖。如圖所示,文檔保護(hù)系統(tǒng)500包括服務(wù)端510和客戶端520。服務(wù)端510可執(zhí)行圖3中所描述的流程,以及客戶端520可執(zhí)行圖4中所描述的流程。服務(wù)端510可包括文檔解析器511,以用于執(zhí)行數(shù)字文檔的解析。該文檔解析器511可采用組件方式設(shè)計,以方便地擴(kuò)展需要支持的文件格式。格式轉(zhuǎn)換器512可將解析后的文檔數(shù)據(jù)轉(zhuǎn)換成TIFF圖像文件格式。在一些實(shí)例中,格式轉(zhuǎn)換器512還可以將解析后的數(shù)據(jù)按照所設(shè)定的格式顯示出來,然后通過抓屏當(dāng)前頁面而將當(dāng)前的頁面顯示內(nèi)容轉(zhuǎn)換成TIFF圖像文件中的一頁圖像,也可通過將文檔頁面進(jìn)行批量抓屏而將整個文檔的內(nèi)容轉(zhuǎn)換成TIFF圖像文件中的多頁圖像。格式轉(zhuǎn)換器512可采用任何已知的文檔格式轉(zhuǎn)換方式將解析后的文檔數(shù)據(jù)轉(zhuǎn)換成TIFF圖像文件格式。自定義標(biāo)簽寫入器514可在TIFF圖像文件中定義和寫入自定義標(biāo)簽。例如,自定義標(biāo)簽寫入器514可在TIFF圖像文件的第一 IFD中定義一個標(biāo)簽號例如為42222且存儲類型為byte數(shù)組的自定義標(biāo)簽,隨后將原始格式的數(shù)字文檔寫入在該自定義標(biāo)簽中。服務(wù)器510還可包括壓縮及加密器513,以用于對原始格式數(shù)字文檔執(zhí)行壓縮和加密,例如可采用LZW編碼和哈夫曼編碼相結(jié)合的高效無損壓縮算法對文檔文件進(jìn)行壓縮,并對壓縮后的文檔采用3DES對稱加密算法進(jìn)行加密處理。在此情形中,自定義標(biāo)簽寫入器可在上述自定義標(biāo)簽中寫入經(jīng)壓縮和加密的原始格式數(shù)字文檔。服務(wù)端510還可包括水印嵌入器515。水印嵌入器515可在TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印,例如嵌入易脆性水印。具體地,水印嵌入器515可首先對水印執(zhí)行加密和置亂處理,再對該圖像數(shù)據(jù)執(zhí)行DCT變換以將其變換到頻域,然后根據(jù)水印嵌入策略在圖像數(shù)據(jù)的頻域中嵌入經(jīng)加密和置亂的水印,最后再對嵌入了水印的圖像數(shù)據(jù)執(zhí)行IDCT變換以將其變換回空域。水印嵌入器515的具體組成已在上文結(jié)合圖2進(jìn)行了詳細(xì)描述。
[0048]客戶端520可包括水印檢測器521,以用于從TIFF圖像文件的圖像數(shù)據(jù)中恢復(fù)出水印并對其進(jìn)行驗(yàn)證。具體地,水印檢測器521可以首先對該圖像數(shù)據(jù)執(zhí)行DCT變換以將其從空域變換到頻域,然后根據(jù)水印提取策略從該圖像數(shù)據(jù)的頻域中提取水印,再對所提取出的水印執(zhí)行解密和反置亂處理以恢復(fù)水印。水印檢測器521還可將所恢復(fù)出的水印與原始水印進(jìn)行比較,若兩者一致,則驗(yàn)證成功,否則驗(yàn)證失敗。水印檢測器521的具體組成已在上文結(jié)合圖2進(jìn)行了詳細(xì)描述。
[0049]客戶端520還可包括圖像瀏覽器522以播放TIFF圖像文件的圖像。例如,圖像瀏覽器522可以在水印驗(yàn)證成功的情況下播放TIFF圖像文件的圖像。用戶可通過瀏覽TIFF圖像來查閱數(shù)字文檔的內(nèi)容,該圖像瀏覽器522支持TIFF圖像序列的順序播放和隨機(jī)選擇播放,支持對圖像視圖的放大縮小及移動操作??蛻舳诉€可包括自定義標(biāo)簽讀取器523以用于讀取自定義標(biāo)簽。例如,在用戶輸入密碼通過權(quán)限驗(yàn)證時,自定義標(biāo)簽讀取器523可從TIFF圖像文件的第一 IFD中的第一自定義標(biāo)簽中讀取原始格式數(shù)字文檔。該原始格式數(shù)字文檔可能是被壓縮和加密的,解壓縮及解密器524可對該原始格式數(shù)字文檔進(jìn)行解密和解壓縮,以得到原始的文檔文件。自定義標(biāo)簽讀取器523還可從TIFF圖像文件的第一 IFD中的第二自定義標(biāo)簽中讀取該數(shù)字文檔的分類信息,以便于對文檔內(nèi)容進(jìn)行檢索。
[0050]盡管為使解釋簡單化將上述方法圖示并描述為一系列動作,但是應(yīng)理解并領(lǐng)會,這些方法不受動作的次序所限,因?yàn)楦鶕?jù)一個或多個實(shí)施例,一些動作可按不同次序發(fā)生和/或與來自本文中圖示和描述或本文中未圖示和描述但本領(lǐng)域技術(shù)人員可以理解的其他動作并發(fā)地發(fā)生。
[0051]提供對本公開的先前描述是為使得本領(lǐng)域任何技術(shù)人員皆能夠制作或使用本公開。對本公開的各種修改對本領(lǐng)域技術(shù)人員來說都將是顯而易見的,且本文中所定義的普適原理可被應(yīng)用到其他變體而不會脫離本公開的精神或范圍。由此,本公開并非旨在被限定于本文中所描述的示例和設(shè)計,而是應(yīng)被授予與本文中所公開的原理和新穎性特征相一致的最廣范圍。
【權(quán)利要求】
1.一種用于創(chuàng)建受保護(hù)的數(shù)字文檔的方法,包括: 對所述數(shù)字文檔進(jìn)行解析; 將所述數(shù)字文檔從原始格式轉(zhuǎn)化成TIFF圖像文件; 在所述TIFF圖像文件的第一圖像文件目錄IFD中定義第一自定義標(biāo)簽; 將原始格式數(shù)字文檔保存在所述第一自定義標(biāo)簽中;以及 在所述TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印。
2.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)字文檔的原始格式為Word、Excel,PowerPoint、HTML網(wǎng)頁、文本文件格式中的一者。
3.如權(quán)利要求1所述的方法,其特征在于,將所述數(shù)字文檔存儲在所述第一自定義標(biāo)簽中包括: 對所述原始格式數(shù)字文檔執(zhí)行壓縮; 對壓縮后的原始格式數(shù)字文檔進(jìn)行加密;以及 將加密后的原始格式數(shù)字文檔存儲在所述第一自定義標(biāo)簽中。
4.如權(quán)利要求1所述的方法,其特征在于,還包括: 在所述TIFF圖像文件中的所述第一 IFD中定義第二自定義標(biāo)簽;以及 將所述數(shù)字文檔的分類信息保存在所述第二自定義標(biāo)簽中。
5.如權(quán)利要求1所述的方法,其特征在于,在所述TIFF圖像文件的所述圖像數(shù)據(jù)中嵌入所述水印包括: 對所述水印執(zhí)行加密和置亂處理; 對所述圖像數(shù)據(jù)執(zhí)行DCT變換; 根據(jù)水印嵌入策略在所述圖像數(shù)據(jù)的頻域中嵌入經(jīng)加密和置亂的水??;以及 對嵌入水印后的所述圖像數(shù)據(jù)執(zhí)行IDCT變換。
6.一種用于瀏覽受保護(hù)的數(shù)字文檔的方法,所述數(shù)字文檔被包括在TIFF圖像文件中,所述方法包括: 從所述TIFF圖像文件的圖像數(shù)據(jù)中恢復(fù)水??; 驗(yàn)證所恢復(fù)的水印; 若驗(yàn)證成功,則播放所述TIFF圖像文件的圖像;以及 若驗(yàn)證失敗,則從所述TIFF圖像文件的第一圖像文件目錄IFD中的第一自定義標(biāo)簽中讀取原始格式數(shù)字文檔。
7.如權(quán)利要求6所述的方法,其特征在于,從所述TIFF圖像文件的第一自定義標(biāo)簽中提取所述原始格式數(shù)字文檔包括: 對所述原始格式數(shù)字文檔進(jìn)行解密;以及 對解密后的原始格式數(shù)字文檔執(zhí)行解壓縮以獲得原始的數(shù)字文檔。
8.如權(quán)利要求6所述的方法,其特征在于,從所述TIFF圖像文件的所述圖像數(shù)據(jù)中恢復(fù)所述水印包括: 對所述圖像數(shù)據(jù)執(zhí)行DCT變換; 根據(jù)水印提取策略從所述圖像數(shù)據(jù)的頻域中提取所述水印;以及 對所提取出的水印執(zhí)行解密和反置亂處理以恢復(fù)水印。
9.如權(quán)利要求8所述的方法,其特征在于,驗(yàn)證所恢復(fù)的水印包括: 將所恢復(fù)出的水印與原始水印進(jìn)行比較; 若兩者一致,則驗(yàn)證成功,否則驗(yàn)證失敗。
10.如權(quán)利要求6所述的方法,其特征在于,還包括: 從所述TIFF圖像文件的所述第一 IFD中的第二自定義標(biāo)簽中讀取所述數(shù)字文檔的分類信息。
11.一種用于創(chuàng)建受保護(hù)的數(shù)字文檔的服務(wù)端,包括: 文檔解析器,用以對所述數(shù)字文檔進(jìn)行解析; 格式轉(zhuǎn)換器,用以將所述數(shù)字文檔從原始格式轉(zhuǎn)化成TIFF圖像文件; 自定義標(biāo)簽寫入器,用以在所述TIFF圖像文件的第一圖像文件目錄IFD中定義第一自定義標(biāo)簽,并將所述數(shù)字文檔保存在所述第一自定義標(biāo)簽中;以及水印嵌入器,用以在所述TIFF圖像文件的圖像數(shù)據(jù)中嵌入水印。
12.如權(quán)利要求11所述的服務(wù)端,其特征在于,所述數(shù)字文檔的原始格式為Word、Excel、PowerPoint、HTML網(wǎng)頁、文本文件格式中的一者。
13.如權(quán)利要求11所述的服務(wù)端,其特征在于,還包括壓縮及加密器,用以對所述數(shù)字文檔執(zhí)行壓縮并對壓縮后的數(shù)字文檔進(jìn)行加密,其中所述自定義標(biāo)簽寫入器將所述數(shù)字文檔保存在所述第一自定義標(biāo)簽中包括: 將加密后的數(shù)字文檔存儲在所述第一自定義標(biāo)簽中。
14.如權(quán)利要求11所述的服務(wù)端,其特征在于,自定義標(biāo)簽寫入器還在所述TIFF圖像文件的所述第一 IFD中定義第二自定義標(biāo)簽,并將所述數(shù)字文檔的分類信息保存在所述第二自定義標(biāo)簽中。
15.如權(quán)利要求11所述的服務(wù)端,其特征在于,所述水印嵌入器嵌入水印包括: 對所述水印執(zhí)行加密和置亂處理; 對所述圖像數(shù)據(jù)執(zhí)行DCT變換; 根據(jù)水印嵌入策略在所述圖像數(shù)據(jù)的頻域中嵌入經(jīng)加密和置亂的水?。灰约? 對嵌入水印后的所述圖像數(shù)據(jù)執(zhí)行IDCT變換。
16.一種用于瀏覽受保護(hù)的數(shù)字文檔的客戶端,所述數(shù)字文檔被包括在TIFF圖像文件中,所述客戶端包括: 水印檢測器,用以從所述TIFF圖像文件的圖像數(shù)據(jù)中恢復(fù)水印,并驗(yàn)證所恢復(fù)的水??;以及 圖像瀏覽器,用以在水印驗(yàn)證成功時播放所述TIFF圖像文件的圖像;以及自定義標(biāo)簽讀取器,用以從所述TIFF圖像文件的第一圖像文件目錄IFD中的第一自定義標(biāo)簽中讀取原始格式數(shù)字文檔。
17.如權(quán)利要求16所述的客戶端,其特征在于,還包括解壓縮及解密器,用以對所述原始格式數(shù)字文檔進(jìn)行解密,以及對解密后的原始格式數(shù)字文檔執(zhí)行解壓縮以獲得原始的數(shù)字文檔。
18.如權(quán)利要求16所述的客戶端,其特征在于,所述水印檢測器恢復(fù)水印包括: 對所述圖像數(shù)據(jù)執(zhí)行DCT變換; 根據(jù)水印提取策略從所述圖像數(shù)據(jù)的頻域中提取所述水??;以及 對所提取出的水印執(zhí)行解密和反置亂處理以恢復(fù)水印。
19.如權(quán)利要求18所述的客戶端,其特征在于,所述水印檢測器驗(yàn)證所恢復(fù)的水印包括: 將所恢復(fù)出的水印與原始水印進(jìn)行比較; 若兩者一致,則驗(yàn)證成功,否則驗(yàn)證失敗。
20.如權(quán)利要求16所述的客戶端,其特征在于,所述自定義標(biāo)簽讀取器還從所述TIFF圖像文件的所述第一 IFD中的第二自定義標(biāo)簽中讀取所述數(shù)字文檔的分類信息。
【文檔編號】G06T1/00GK104517045SQ201310447489
【公開日】2015年4月15日 申請日期:2013年9月26日 優(yōu)先權(quán)日:2013年9月26日
【發(fā)明者】步彤, 楊小林, 武勇, 劉焱 申請人:上海中移通信技術(shù)工程有限公司