一種面向版權保護的數(shù)據(jù)庫水印方法
【專利摘要】本發(fā)明公開了一種面向版權保護的數(shù)據(jù)庫水印方法。該方法基于Unicode的數(shù)據(jù)庫文本數(shù)據(jù)進行數(shù)字水印的嵌入和檢測算法,包括如下步驟:步驟一:選取種子數(shù)生成無意義的二值水印序列,同時存儲版權信息和水印序列;步驟二:建立不可見字符集與二值水印序列的映射關系;步驟三:將水印序列映射為不可見字符組合,嵌入數(shù)據(jù)庫中并更新數(shù)據(jù);步驟四:檢測時,提取數(shù)據(jù)庫中屬于不可見字符集中的字符;步驟五:根據(jù)映射關系,將不可見字符映射為水印信息。步驟六:根據(jù)水印信息恢復二值水印序列,比較并計算相關系數(shù),據(jù)此判斷版權信息。本發(fā)明的方法充分利用了不可見字符的特性,解決了數(shù)據(jù)庫中文本數(shù)據(jù)的水印無損嵌入和水印同步問題。
【專利說明】一種面向版權保護的數(shù)據(jù)庫水印方法
【技術領域】
[0001]本發(fā)明屬于信息版權保護領域,具體涉及一種利用Unicode不可見字符作為水印載體和水印定位信息,針對數(shù)據(jù)庫文本數(shù)據(jù)的數(shù)字水印嵌入與檢測方法,以實現(xiàn)數(shù)據(jù)庫文本數(shù)據(jù)的來源鑒定和版權保護。
【背景技術】
[0002]數(shù)據(jù)庫是用來高效地組織、管理數(shù)據(jù)的系統(tǒng),解決了海量多樣化的數(shù)據(jù)存儲、操作、傳輸?shù)葐栴},數(shù)據(jù)庫中的數(shù)據(jù)是從全局觀點出發(fā)建立的,按一定的數(shù)據(jù)模型進行組織、描述和存儲。其結構基于數(shù)據(jù)間的自然聯(lián)系,從而可提供一切必要的存取路徑,且數(shù)據(jù)不再針對某一應用,而是面向全組織,具有整體的結構化特征。數(shù)據(jù)庫向應用系統(tǒng)提供數(shù)據(jù)查詢、數(shù)據(jù)更新、數(shù)據(jù)插入、數(shù)據(jù)刪除等服務,是當前大型軟件系統(tǒng)或者數(shù)據(jù)處理系統(tǒng)的重要組成部分,在實際應用中起到了重要作用。例如,國家在統(tǒng)計人口數(shù)據(jù)時需要將人口的基本信息如姓名、年齡、住址等存入數(shù)據(jù)庫中,而在財務管理、倉庫管理、職工管理等方面數(shù)據(jù)庫均承擔著重要的數(shù)據(jù)存儲和管理任務。
[0003]近年來,隨著數(shù)字化、網(wǎng)絡化、移動化時代的飛速發(fā)展,數(shù)據(jù)庫數(shù)據(jù)的傳輸、獲取等都變得非常方便快捷。而數(shù)據(jù)庫數(shù)據(jù)的非法拷貝和復制,不僅會造成數(shù)據(jù)庫所有者蒙受巨大的經(jīng)濟損失,侵害其經(jīng)濟利益,涉密數(shù)據(jù)的泄露和偷竊更會危及國家安全、國防安全等,從泄露的數(shù)據(jù)中也無法追查出數(shù)據(jù)泄露的源頭。這使得擁有了數(shù)據(jù)庫版權的數(shù)據(jù)擁有者對于自己所擁有的數(shù)據(jù)的不愿輕易共享,或者采取各種費時費力的手段對涉密數(shù)據(jù)進行保護。這種版權的過度保護行為一方面影響了數(shù)據(jù)的共享性質,另一面也導致敏感數(shù)據(jù)的版權保護成本過高。因此,如何保護數(shù)據(jù)庫數(shù)據(jù)的安全與知識產(chǎn)權已成為迫在眉睫的問題。
[0004]數(shù)字水印技術作為一種嶄新的信息安全技術,為數(shù)據(jù)庫的安全保護提供了一種切實可行的解決途徑,同時對于加強責任心、震懾非法行為、有據(jù)可查等方面具有重要作用。數(shù)字水印技術在圖像、圖形、視頻、音頻等領域的安全保護方面取得了許多的應用,近幾年在數(shù)據(jù)庫相關方面也取得了一定的研究和實驗成果。
[0005]對于數(shù)據(jù)庫的數(shù)字水印技術,國內(nèi)外均有相當數(shù)量的研究。Rakesh Agrawal首次提出了關系型數(shù)據(jù)庫數(shù)值型的數(shù)字水印算法(Agrawal R, Kiernan J.Watermarkingrelational databases[C].Proceedings of the28th international conference onVery Large Data Bases.VLDB Endowment,2002:155-166),之后也有學者對此算法進行改進(Gupta Gj Pieprzyk J.Database relation watermarking resilient againstsecondary watermarking attacks[M].1nformation Systems Security.SpringerBerlin Heidelberg, 2009:222-236),與圖像的數(shù)字水印原理類似,均通過對數(shù)值型數(shù)據(jù)的修改實現(xiàn)水印信息的嵌入。而文本數(shù)據(jù)適用的非數(shù)值型數(shù)據(jù)庫水印研究相對較少,Radu Sion提出了同類詞替換的方法證明數(shù)據(jù)的版權所有者(Sion R.Provingownership over categorical data[C].Data Engineering, 2004.Proceedings.20thInternational Conference on.1EEE,2004:584-595),Agusti Solanas 將該方法應用到非數(shù)值型的數(shù)據(jù)庫水印中(Solanas A, Domingo-Ferrer J.Watermarking non-numericaldatabases[Μ].Modeling Decisions for Artificial Intelligence.Springer BerlinHeidelberg, 2006:239-250),董曉梅等利用統(tǒng)計特征控制算法進行了進一步的改進(董曉梅,田躍萍,李曉華,于戈.非數(shù)值型數(shù)據(jù)的數(shù)據(jù)庫水印算法研究[J].武漢大學學報,2008,33 (10): 1026-1028),Ali Al-Haj利用英文字符特有的空格嵌入水印信息(Ali Al-Haj, Ashraf Odeh.Robust and Blind Watermarking of Relational DatabaseSystems [J].Journal of Computer Science, 2008,4 (12): 1024-1029),對于數(shù)據(jù)庫非數(shù)值型數(shù)字水印的模型,也有部分學者進行了研究(Bedi, Rajneeshkaur, Anita Thengade, andVi j ay M.ffadha1.A New Watermarking Approach for Non-numeric RelationalDatabase[J].1nternational Journal of Computer Applications, 2011,13(7):37-40)。但是他們所提出的水印模型或者算法,存在如下的問題:
[0006]I)影響數(shù)據(jù)的可用性:同義詞、語法重構等方式會改變原始屬性數(shù)據(jù),雖然意義相等,但是屬性數(shù)據(jù)例如中人名、單位名稱等往往不允許任何的數(shù)據(jù)改變,此種水印嵌入方式會破壞數(shù)據(jù)的完整性,造成嵌入水印后的數(shù)據(jù)不可用。
[0007]2)語言的適用性:英語中含有大量的空格等冗余信息可以用來實現(xiàn)水印的嵌入,故有學者提出此種水印嵌入方式,但是中文信息中無法找到如此多的空格,無法適用。 [0008]3)不考慮嵌入的具體細節(jié):較多的文獻著重于模型和算法,而不考慮具體以怎樣的數(shù)據(jù)形式嵌入水印、提取水印,缺乏實用價值。
【發(fā)明內(nèi)容】
[0009]本發(fā)明的目的在于:針對目前數(shù)據(jù)庫文本數(shù)據(jù)水印技術無法保證數(shù)據(jù)的完整性、一致性和可用性,算法不適用等問題,提出一種基于Unicode不可見字符的數(shù)據(jù)庫文本數(shù)據(jù)水印方法。該算法在抵抗特定的數(shù)據(jù)庫操作如增加元組、刪除元組、刪除主鍵、刪除列、修改表結構等攻擊方式下具有好的魯棒性,同時保證文本數(shù)據(jù)在嵌入水印之后仍然能夠被SQL查詢、第三方應用等正常使用。
[0010]為了實現(xiàn)上述發(fā)明目的,本發(fā)明所采取的技術方案為:
[0011]一種面向版權保護的數(shù)據(jù)庫水印方法,其特征在于包括以下過程:
[0012](一)水印信息生成
[0013]步驟一:從預置的種子數(shù)據(jù)庫中任意取出一個水印種子數(shù)WMSeed,種子數(shù)據(jù)庫中水印種子數(shù)均不重復,具有唯一性;
[0014]步驟二:使用混沌隨機序列發(fā)生器作為無意義水印生成方法,將取出的水印種子數(shù)WMSeed作為輸入生成一個“0”、“1”隨機均勻分布的二值序列W ;
[0015]步驟三:在版權數(shù)據(jù)庫中記錄W及有意義的版權信息;
[0016](二)水印信息映射
[0017]步驟一:將(一)中的無意義水印信息W轉換為二值數(shù)組wm[i] = {0, 1},i=l, 2,…,N,其中N為水印信息序列長度;
[0018]步驟二:遍歷wm[i],記錄每個i的值和相應的wm[i]的值,分別表示為Index和Value ;
[0019]步驟三:選取不可見字符集共L個,設為Char [m] (m=0,1,...,L_l),計算
【權利要求】
1.一種面向版權保護的數(shù)據(jù)庫水印方法,其特征在于包括以下過程: (一)水印信息生成 步驟一:從預置的種子數(shù)據(jù)庫中任意取出一個水印種子數(shù)WMSeed,種子數(shù)據(jù)庫中水印種子數(shù)均不重復,具有唯一性; 步驟二:使用混沌隨機序列發(fā)生器作為無意義水印生成方法,將取出的水印種子數(shù)WMSeed作為輸入生成一個“0”、“1”隨機均勻分布的二值序列W ; 步驟三:在版權數(shù)據(jù)庫中記錄W及有意義的版權信息; (二)水印信息映射 步驟一:將(一沖的無意義水印信息W轉換為二值數(shù)組wm[i] = {O, 1},i=l, 2,...,N,其中N為水印信息序列長度; 步驟二:遍歷wm[i],記錄每個i的值和相應的wm[i]的值,分別表示為Index和Value ; 步驟三:選取不可見字符集共L個,設為Char [m] (m=0, I,..., L_l),計算n =[tog/.lndex\ *其中“|J w符號為向下取整運算,每個Index和Value按照如下公式表示:
【文檔編號】G06F21/16GK103646195SQ201310624375
【公開日】2014年3月19日 申請日期:2013年11月27日 優(yōu)先權日:2013年11月27日
【發(fā)明者】朱長青, 佟德宇, 任娜 申請人:南京師范大學