專利名稱:基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法
技術(shù)領(lǐng)域:
本發(fā)明所述的基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法是一種將灰度圖像(或彩色圖像)嵌入到原始數(shù)字音頻作品的新數(shù)字水印方法,屬于信息安全、多媒體信息處理領(lǐng)域。
背景技術(shù):
作為數(shù)字音頻作品(例如MP3音樂、MIDI音樂等)知識產(chǎn)權(quán)保護的一種有效手段,數(shù)字音頻水印(Digital Audio Watermarking)技術(shù)得到了廣泛關(guān)注,并已成為國際學術(shù)界的一個研究熱點。所謂數(shù)字音頻水印技術(shù),就是將一種特殊標志信息(偽隨機序列或可識別圖案文字)嵌入到原始數(shù)字音頻作品中,用以辨識音頻作品的版權(quán)、合法使用者,從而認證或控制音頻數(shù)據(jù)的使用。數(shù)字音頻水印技術(shù)是一門綜合的高新技術(shù),它是信號處理技術(shù)、通信技術(shù)、信息安全技術(shù)、計算機技術(shù)、音頻處理技術(shù)等相關(guān)學科綜合發(fā)展的產(chǎn)物。目前,數(shù)字音頻水印嵌入方法主要可以劃分為兩種不同類型,即空間域水印嵌入方法和變換域水印嵌入方法。
(1)空間域數(shù)字音頻水印嵌入方法這是最早也是最簡單的數(shù)字音頻水印嵌入方法,其原理就是通過在空間域內(nèi)直接修改音頻信號的選定采樣數(shù)據(jù)值來加入數(shù)字水印信息,再通過記錄提取這些信息來檢測水印??傮w來說,空間域數(shù)字音頻水印方法普遍具有算法簡單、速度快、容易實現(xiàn)的特點,而且它幾乎可以無損地恢復水印信息,這對于某些應(yīng)用是必要的。但因其基本原理限制,它抵抗加噪、壓縮、濾波等攻擊的能力較差,而且可嵌入的水印容量也受到了限制。
(2)變換域數(shù)字音頻水印嵌入方法所謂變換域數(shù)字音頻水印嵌入方法,就是首先對音頻信號的采樣數(shù)據(jù)進行適當變換(全局變換或者分段局部變換),然后將數(shù)字水印信息嵌入到變換域選定的系數(shù)上,最后再通過相應(yīng)的反變換恢復出含有水印的數(shù)字音頻信號。其中,所采用的變換包括傅里葉變換(DFT或FFT)、離散余弦變換(DCT)及小波變換(WT)等等。變換域數(shù)字音頻水印嵌入方法具有如下優(yōu)點(1)在變換域中嵌入的水印的信號能量可以分布到所有的音頻采樣值上,有利于保證水印的透明性;(2)在變換域中,可以利用人類聽覺系統(tǒng)(Human Auditory System)的某些特性,更方便、更有效地進行水印的編碼;(3)變換域的方法可與國際數(shù)據(jù)壓縮標準兼容,從而實現(xiàn)在壓縮域內(nèi)的水印編碼。但由于變換和反變換過程有損且計算量較大,故對于一些精確應(yīng)用場合或需要快速應(yīng)用的場合不太合適。
相關(guān)文獻如下1.C.I.Podichuk,E.J.Delp.Digital watermarkingAlgorithms and applications[J].IEEE Signal Processing Magazine,2001,18(4)33-46.
2.I.J.Cox,Matt L.Miller.The first 50 years of electronic watermarking[J].Journal of Applied Signal Processing,2002,(2)126-132.
3.C.S.Lu,H.Y.M.Liao.Multipurpose watermarking for image authenticationand protection[J].IEEE Trans.on image processing,2001,10(10)1579-1592.
4.Emilia Gomez,Pedro Cano,et al. Mixed watermarking-fingerprintingapproach for integrity verification of audio recordings[A]. InternationalTelecommunications Symposium-ITS2002,Natal,Brazil,2002.
近年來,數(shù)字音頻水印嵌入方法的研究取得了很大進展,陸續(xù)提出了諸如空間域、變換域等多種數(shù)字水印算法。其中,基于小波理論的變換域數(shù)字音頻水印嵌入方法因其具有良好的多分辨率表示、時頻局部分析等特性,且易于兼容MPEG-4壓縮標準等特點,引起了人們的高度重視。然而,理論分析和實驗結(jié)果表明,現(xiàn)有小波域數(shù)字音頻水印嵌入方法普遍存在如下不足1、提取水印信息時直接或間接需要原始音頻載體;2、被嵌入的水印信息一般是偽隨機序列(或二值標志圖像),數(shù)字水印容量太小;3、未能充分考慮人類聽覺系統(tǒng)(HAS)的感知特性,數(shù)字水印的透明性與魯棒性有待進一步提高;4、多采用快速小波變換(即Mallat算法),不僅計算繁雜、所需內(nèi)存空間較大,不利于硬件實現(xiàn),而且存在較為嚴重的舍入誤差(因為浮點運算)。
顯然,克服現(xiàn)有音頻水印技術(shù)之不足而設(shè)計一種全新的數(shù)字音頻水印方法(并應(yīng)用于音頻作品版權(quán)保護)是十分必要的。
發(fā)明內(nèi)容
鑒于上述現(xiàn)有技術(shù)所存在的問題,本發(fā)明設(shè)計了一種全新的數(shù)字音頻水印嵌入與檢測方法,本發(fā)明以整型提升小波變換、靜態(tài)圖像壓縮編碼、人類聽覺系統(tǒng)(HAS)為基礎(chǔ),提出了將灰度圖像(或彩色圖像)嵌入到原始數(shù)字音頻作品的新水印嵌入與檢測方法。該方法具有以下特點(1)應(yīng)用靜態(tài)圖像壓縮編碼技術(shù),實現(xiàn)了以灰度圖像(或彩色圖像)作為水印信號的數(shù)字音頻水印方法;(2)充分利用人類聽覺系統(tǒng)(HAS)的掩蔽特性,實現(xiàn)了水印嵌入位置的自適應(yīng)確定,增強了算法的透明性和魯棒性;(3)采納了基于人類聽覺系統(tǒng)的自適應(yīng)量化策略,克服了現(xiàn)有技術(shù)存在的量化規(guī)則不完善及檢測率較低等缺點,實現(xiàn)了水印嵌入深度的智能調(diào)節(jié);(4)灰度水印圖像(或彩色水印圖像)的提取不需要原始音頻信號;(5)采用整型提升小波變換,有效克服了現(xiàn)有小波域數(shù)字音頻水印嵌入方法普遍存在的舍入誤差問題。
本發(fā)明所述的基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法,包括如下具體步驟
設(shè)原始數(shù)字音頻信號為A={a(i),0≤i<N}。其中,N為數(shù)據(jù)個數(shù),a(i)∈{0,1,2,Λ,(2p-1)}是第i個音頻數(shù)據(jù)的幅度值,p為表示每個數(shù)據(jù)所使用的比特數(shù)。
設(shè)數(shù)字水印為256級灰度圖像(或24位真彩色圖像)W={w(i,j),0≤i<P,0≤j<Q},其中,w(i,j)代表數(shù)字水印圖像的第i行、第j列象素的灰度值(或顏色值);數(shù)字水印的嵌入過程為(1)數(shù)字水印圖像的壓縮編碼與置亂加密當數(shù)字水印為256級灰度圖像時,數(shù)字水印圖像的壓縮編碼與置亂加密過程為本發(fā)明首先采用DCT(離散余弦變換)靜態(tài)圖像壓縮技術(shù),將數(shù)字水印圖像W編碼為一維的二進制序列V。工作步驟為(a)將數(shù)字水印圖像(灰度圖像)W劃分成8×8的圖像子塊;(b)對每個圖像子塊進行DCT變換,并量化所得到的DCT系數(shù)。量化矩陣根據(jù)如下規(guī)則設(shè)計1)系數(shù)選擇按照JPEG標準所采納的Zig-Zag順序,僅選取保留前10個DCT系數(shù)(即1個DC分量和9個低頻AC分量),其余舍棄;2)量化在保留下來的系數(shù)中,只有DC分量和前4個低頻AC分量量化成8位,其余5個AC分量量化成4位。
于是,可得到壓縮編碼后的一維二進制序列V={v(k),0≤k<Nw,v(k)∈{0,1},Nw=15(P×Q)16};]]>其中,Nw=P×Q8×8×((1+4)×8+5×4)=15(P×Q)16.]]>為了進一步消除數(shù)字水印圖像的象素空間相關(guān)性,提高數(shù)字水印算法的魯棒性,確保含水印音頻信號某一部分受到破壞后仍能全部或部分地恢復水印,宜對上面得到的一維二進制序列V進行置亂加密(例如可采用隨機置亂加密方法,由密鑰K生成由1到Nw的隨機排列,然后根據(jù)隨機排列重新調(diào)整V中向量元素的位置),以得到由V轉(zhuǎn)換而來的新一維二進制序列X={x(k),0≤k<Nw,x(k)∈{0,1}}。
注當數(shù)字水印為24位真彩色圖像時,數(shù)字水印圖像的壓縮編碼與置亂加密過程為(a)將彩色水印圖像W分解為R、G、B三個彩色分量;(b)將彩色分量R劃分成8×8的子塊;(c)對每個子塊進行DCT變換,并量化所得到的DCT系數(shù)。量化矩陣根據(jù)如下規(guī)則設(shè)計
1)系數(shù)選擇按照JPEG標準所采納的Zig-Zag順序,僅選取保留前10個DCT系數(shù)(即1個DC分量和9個低頻AC分量),其余舍棄;2)量化在保留下來的系數(shù)中,只有DC分量和前4個低頻AC分量量化成8位,其余5個AC分量量化成4位。
于是,可得到壓縮編碼后的一維二進制序列VR={vR(K),0≤k<Nw′,vR(k)∈{0,1},Nw′=15(P×Q)16};]]>這里,Nw′=P×Q8×8×((1+4)×8+5×4)=15(P×Q)16.]]>(d)對于彩色分量G、B實施步驟(b)和(c)的相同操作,即可得到彩色水印圖像W的壓縮編碼后一維二進制序列V={v(k),0≤k<Nw,Nw=3Nw′v(k)∈{0,1}}。
另外,為了進一步消除數(shù)字水印圖像的象素空間相關(guān)性,提高數(shù)字水印算法的魯棒性,確保含水印音頻信號某一部分受到破壞后仍能全部或部分地恢復水印,宜對上面得到的一維二進制序列V進行置亂加密(例如可采用隨機置亂加密方法,由密鑰K生成由1到Nw的隨機排列,然后根據(jù)隨機排列重新調(diào)整V中向量元素的位置),以得到由V轉(zhuǎn)換而來的新一維二進制序列X={x(k),0≤k<Nw,x(k)∈{0,1}}。
(2)音頻信號的分段處理及重要音頻段的自適應(yīng)選取本發(fā)明將采用對數(shù)字音頻信號進行分段的方法嵌入水印信息,即首先將整個音頻信號劃分為若干個音頻數(shù)據(jù)段,進而依據(jù)人類聽覺系統(tǒng)(HAS)自適應(yīng)選取重要音頻數(shù)據(jù)段用于嵌入水印(每個音頻段僅嵌入1個比特的水印信息)。
設(shè)每個音頻段含有L個數(shù)據(jù)(為了保證數(shù)字水印的透明性與魯棒性,音頻段長度L的取值以大于等于8為宜),則可將整個音頻信號劃分成 個音頻段,即A={A(K),0≤k</LN},]]>A(k)={a(kL+i),0≤i<L}為了提高數(shù)字水印的透明性和魯棒性,本發(fā)明僅在每個音頻段嵌入1個比特的水印信息,因此需充分結(jié)合人類聽覺系統(tǒng)(HAS)選取Nw個聽覺重要音頻段Ae={Ae(k),0≤k<Nw}用于水印嵌入。
由人類聽覺系統(tǒng)(HAS)模型知,人的聽覺具有掩蔽效應(yīng),即一種頻率聲音阻礙聽覺系統(tǒng)感受另一種頻率聲音的現(xiàn)象,聽覺掩蔽可分成時域掩蔽和頻域掩蔽。其中,時域掩蔽是指高能量信號前后短時間發(fā)生的少量畸變難以被察覺,且超前掩蔽區(qū)(Pre-masking)持續(xù)時間較短(大約5~20ms),而滯后掩蔽區(qū)(Post-masking)持續(xù)時間較長(大約50~200ms)。頻域掩蔽是指頻域中大幅度頻率分量兩側(cè)的成分不易被感知,在高頻側(cè)尤其如此??梢?,應(yīng)根據(jù)聽覺時域掩蔽特性,結(jié)合音頻信號內(nèi)容選取能量較大的音頻段作為水印嵌入的候選段。頻域掩蔽特性將在后面選取小波系數(shù)被利用。
下面給出基于內(nèi)容的聽覺重要音頻段自適應(yīng)選取方法。
首先,計算每個音頻段的樣本能量E(k)(0≤k<N/L)E(k)=Σi=0L-1a2(kL+i)]]>然后,對所求取的N/L個音頻段樣本能量值進行降序排序,并選擇能量較大的前Nw個音頻段Ae={Ae(k),0≤k<Nw}作為水印嵌入的候選段。
(3)整型提升小波變換及小波系數(shù)的選取對所選取的每個音頻數(shù)據(jù)段Ae(k)(0≤k<Nw)分別進行3級整型提升小波變換(ILWT)CDe(k)=ILWT3(Ae(k))={Ce(k)(3),De(k)(3),De(k)(2),De(k)(1)}式中,Ce(k)(3)為第k音頻段Ae(k)3級小波變換后的逼近信號,而{De(k)(3),De(k)(2),De(k)(1)}為第k音頻段Ae(k)3級小波變換后的細節(jié)信號。
由于細節(jié)系數(shù)對應(yīng)于音頻信號的高頻分量(不易被察覺),逼近系數(shù)對應(yīng)于音頻信號的低頻分量,因此在細節(jié)系數(shù)中嵌入水印信息有利于保證透明性,而嵌入在逼近系數(shù)中有利于提高魯棒性。考慮到人類聽覺系統(tǒng)(HAS)的頻域掩蔽特性,本算法從第k音頻段Ae(k)3級小波變換細節(jié)信號De(k)(3)中選取絕對值大的小波系數(shù)(聽覺重要系數(shù))C(k)用于水印序列元素x(k)的嵌入。
(4)數(shù)字水印的嵌入水印嵌入是通過對所選擇的小波系數(shù)C(k)進行特殊量化完成的。設(shè)C(k)表示待量化小波系數(shù),C′(k)表示量化處理后的小波系數(shù),x(k)為待嵌入水印比特,Δ表示量化間隔。與現(xiàn)有數(shù)字音頻水印嵌入方法普遍采用均勻量化(Δ為常數(shù))不同,本發(fā)明將量化間隔選取為基于人類聽覺系統(tǒng)而計算出的可感知噪聲閾值(JND),即Δ=JND(C(k)),以便于進一步提高數(shù)字水印的透明性與魯棒性。則量化修改系數(shù)嵌入數(shù)字水印過程(步驟)如下首先定義量化規(guī)則。本文將量化函數(shù)定義為用量化間隔JND(C(k))對待量化小波系數(shù)C(k)進行二次取模求余運算,即Q(C(k))=[C(k)mod(JND(C(k))]mod(2)其量化規(guī)則為如果C(k)mod(JND(C(k))為奇數(shù),則Q(C(k))取1,即C(k)歸于1類;如果C(k)mod(JND(C(k))為偶數(shù),則Q(C(k))取0,即C(k)歸于0類。
然后量化系數(shù)嵌入水印信息,即對所選小波系數(shù)C(k)進行適當修改并賦予二值信息的過程。本發(fā)明所采用的量化嵌入方案為如果Q(C(k))不等于x(k),則如果x(k)=0,則
否則 否則不對C(k)做任何處理;其中, (5)整型提升小波逆變換及音頻段的重新組合為了得到含水印的數(shù)字音頻信號,要對含有水印信息的小波系數(shù)進行3級整型提升小波逆變換,即用含有水印信息的小波系數(shù)C′(k)代替C(k)并對小波系數(shù)CD′e進行3級整型提升小波逆變換(Inverse Integer Lifting Wavelet Transform,IILWT),即Ae′=IILWT3(CDe′)將A′e代替Ae,再結(jié)合未被選用(嵌入水印)的音頻數(shù)據(jù)段,即可最終得到含有水印的數(shù)字音頻信號A′。
值得注意的是,本發(fā)明在嵌入數(shù)字水印過程中生成了抽取數(shù)字水印的密鑰,即用于嵌入數(shù)字水印的候選音頻段位置信息及小波系數(shù)位置信息。
本發(fā)明所提出的數(shù)字音頻水印檢測算法屬于目標檢測算法,即在檢測數(shù)字水印圖像時不需要原始的音頻信號。
數(shù)字水印的檢測過程如下(1)將待檢測數(shù)字音頻信號A′劃分成 個音頻段(每個音頻段含有L個數(shù)據(jù)),根據(jù)水印嵌入過程所生成的候選段位置信息選擇聽覺重要音頻數(shù)據(jù)段Ae′={Ae′(k),0≤k<Nw}并對其分別進行3級整型提升小波變換(采納嵌入過程所使用的小波基)。
(2)根據(jù)嵌入水印過程中所生成的用于嵌入水印的小波系數(shù)位置信息,確定出含有水印序列元素x′(k)信息的小波系數(shù)C′(k)(k=0,1,Λ,Nw-1),并利用前面所定義的量化規(guī)則提取水印。即 (3)按照數(shù)字水印嵌入算法的相反操作,利用密鑰K對數(shù)字水印信息X′進行逆置亂加密,以得到原始水印的一維二進制序列V′={v′(k),0≤k<Nw,v′(k)∈{0,1}}。
(4)對所得到的一維二進制序列V′進行解壓縮,便可恢復嵌入的數(shù)字水印圖像W′={w′(i,j),0≤i<P,0≤j<Q}。
此外,為了消除觀測者的經(jīng)驗、身體條件、實驗條件和設(shè)備等主、客觀因素的影響,需采用歸一化相關(guān)系數(shù)(Normalized Cross-Correlation,NC)對抽取的水印和原始水印的相似性進行定量評價,其定義為NC(W′,W)=Σi=0P-1Σj=0Q-1w(i,j)·w′(i,j)Σi=0P-1Σj=0Q-1w2(i,j)Σi=0P-1Σj=0Q-1w′2(i,j)]]>其中,W′是待判決的數(shù)字水印,W是嵌入的原始數(shù)字水印。如果該歸一化相關(guān)系數(shù)NC超過某一閾值T,我們就判定數(shù)字音頻信號中存在此數(shù)字水印圖像(閾值T是用戶根據(jù)數(shù)字水印的具體應(yīng)用背景而確定的)。
本發(fā)明所述的基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法與現(xiàn)有數(shù)字音頻水印方法比較具有以下優(yōu)點(1)應(yīng)用靜態(tài)圖像壓縮編碼技術(shù),實現(xiàn)了以灰度圖像(或彩色圖像)作為水印信號的數(shù)字音頻水印嵌入方法;(2)充分利用人類聽覺系統(tǒng)(Human Auditory System)的掩蔽特性,實現(xiàn)了水印嵌入位置的自適應(yīng)確定,增強了算法的透明性和魯棒性;(3)采納了基于人類聽覺系統(tǒng)的自適應(yīng)量化策略,克服了現(xiàn)有技術(shù)存在的量化規(guī)則不完善及檢測率較低等缺點,實現(xiàn)了水印嵌入深度的智能調(diào)節(jié);(4)灰度水印圖像(或彩色水印圖像)的提取不需要原始音頻信號;(5)采用整型提升小波變換,有效克服了現(xiàn)有小波域數(shù)字音頻水印嵌入方法普遍存在的舍入誤差問題。
本發(fā)明可使各種形式的數(shù)字音頻作品獲得保護。
本發(fā)明共有三張附圖其中,圖1基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入方法原理框2基于聽覺特性與整型提升小波的數(shù)字音頻水印檢測方法原理框3(a)原始數(shù)字音頻信號波形圖(流行音樂)圖3(b)嵌入水印后的數(shù)字音頻信號波形圖(信噪比SNR=45.7dB)圖3(c)原始灰度水印圖像圖3(d)壓縮編碼后的水印圖像圖3(e)提取出的數(shù)字水印圖像(未受到任何攻擊)具體實施方式
本發(fā)明所述的基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法的具體實施方式
如附圖1、附圖2所示,本發(fā)明所述的基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法,包括如下具體步驟設(shè)原始數(shù)字音頻信號為A={a(i),0≤i<N}。其中,N為數(shù)據(jù)個數(shù),a(i)∈{0,1,2,Λ,(2p-1)}是第i個音頻數(shù)據(jù)的幅度值,p為表示每個數(shù)據(jù)所使用的比特數(shù)。
設(shè)數(shù)字水印為256級灰度圖像(或24位彩色圖像)W={w(i,j),0≤i<P,0≤j<Q},其中,w(i,j)代表數(shù)字水印圖像的第i行、第j列象素的灰度值(或顏色值);數(shù)字水印的嵌入過程為(1)數(shù)字水印圖像的壓縮編碼與置亂加密當數(shù)字水印為256級灰度圖像時,數(shù)字水印圖像的壓縮編碼與置亂加密過程為本發(fā)明首先采用DCT(離散余弦變換)靜態(tài)圖像壓縮技術(shù),將數(shù)字水印圖像W編碼為一維的二進制序列V。工作步驟為(a)將數(shù)字水印圖像(灰度圖像)W劃分成8×8的圖像子塊;(b)對每個圖像子塊進行DCT變換,并量化所得到的DCT系數(shù)。量化矩陣根據(jù)如下規(guī)則設(shè)計1)系數(shù)選擇按照JPEG標準所采納的Zig-Zag順序,僅選取保留前10個DCT系數(shù)(即1個DC分量和9個低頻AC分量),其余舍棄;2)量化在保留下來的系數(shù)中,只有DC分量和前4個低頻AC分量量化成8位,其余5個AC分量量化成4位。
于是,可得到壓縮編碼后的一維二進制序列V={v(k),0≤k<Nw,v(k)∈{0,1},Nw=15(P×Q)16};]]>其中,Nw=P×Q8×8×((1+4)×8+5×4)=15(P×Q)16.]]>為了進一步消除數(shù)字水印圖像的象素空間相關(guān)性,提高數(shù)字水印算法的魯棒性,確保含水印音頻信號某一部分受到破壞后仍能全部或部分地恢復水印,宜對上面得到的一維二進制序列V進行置亂加密(例如可采用隨機置亂加密方法,由密鑰K生成由1到Nw的隨機排列,然后根據(jù)隨機排列重新調(diào)整V中向量元素的位置),以得到由V轉(zhuǎn)換而來的新一維二進制序列X={x(k),0≤k<Nw,x(k)∈{0,1}}。
注當數(shù)字水印為24位真彩色圖像時,數(shù)字水印圖像的壓縮編碼與置亂加密過程為(a)將彩色水印圖像W分解為R、G、B三個彩色分量;(b)將彩色分量R劃分成8×8的子塊;(c)對每個子塊進行DCT變換,并量化所得到的DCT系數(shù)。量化矩陣根據(jù)如下規(guī)則設(shè)計1)系數(shù)選擇按照JPEG標準所采納的Zig-Zag順序,僅選取保留前10個DCT系數(shù)(即1個DC分量和9個低頻AC分量),其余舍棄;2)量化在保留下來的系數(shù)中,只有DC分量和前4個低頻AC分量量化成8位,其余5個AC分量量化成4位。
于是,可得到壓縮編碼后的一維二進制序列VR={vR(k),0≤k<Nw′vR(k)∈{0,1},Nw′=15(P×Q)16}.]]>這里,Nw′=P×Q8×8×((1+4)×8+5×4)=15(P×Q)16.]]>(d)對于彩色分量G、B實施步驟(b)和(c)的相同操作,即可得到彩色水印圖像W的壓縮編碼后一維二進制序列V={v(k),0≤k<Nw,Nw=3Nw′v(k)∈{0,1}}。
另外,為了進一步消除數(shù)字水印圖像的象素空間相關(guān)性,提高數(shù)字水印算法的魯棒性,確保含水印音頻信號某一部分受到破壞后仍能全部或部分地恢復水印,宜對上面得到的一維二進制序列V進行置亂加密(例如可采用隨機置亂加密方法,由密鑰K生成由1到3Nw的隨機排列,然后根據(jù)隨機排列重新調(diào)整V中向量元素的位置),以得到由V轉(zhuǎn)換而來的新一維二進制序列X={x(k),0≤k<Nw,x(k)∈{0,1}}。
(2)音頻信號的分段處理及重要音頻段的自適應(yīng)選取本發(fā)明將采用對數(shù)字音頻信號進行分段的方法嵌入水印信息,即首先將整個音頻信號劃分為若干個音頻數(shù)據(jù)段,進而依據(jù)人類聽覺系統(tǒng)(HAS)自適應(yīng)選取重要音頻數(shù)據(jù)段用于嵌入水印(每個音頻段僅嵌入1個比特的水印信息)。
設(shè)每個音頻段含有L個數(shù)據(jù)(為了保證數(shù)字水印的透明性與魯棒性,音頻段長度L的取值以大于等于8為宜),則可將整個音頻信號劃分成 個音頻段,即A={A(k),0≤k</LN},]]>A(k)={a(kL+i),0≤i<L}為了提高數(shù)字水印的透明性和魯棒性,本發(fā)明僅在每個音頻段嵌入1個比特的水印信息,因此需充分結(jié)合人類聽覺系統(tǒng)(HAS)選取Nw個聽覺重要音頻段Ae={Ae(k),0≤k<Nw}用于水印嵌入。
由人類聽覺系統(tǒng)(HAS)模型知,人的聽覺具有掩蔽效應(yīng),即一種頻率聲音阻礙聽覺系統(tǒng)感受另一種頻率聲音的現(xiàn)象,聽覺掩蔽可分成時域掩蔽和頻域掩蔽。其中,時域掩蔽是指高能量信號前后短時間發(fā)生的少量畸變難以被察覺,且超前掩蔽區(qū)(Pre-masking)持續(xù)時間較短(大約5~20ms),而滯后掩蔽區(qū)(Post-masking)持續(xù)時間較長(大約50~200ms)。頻域掩蔽是指頻域中大幅度頻率分量兩側(cè)的成分不易被感知,在高頻側(cè)尤其如此??梢?,應(yīng)根據(jù)聽覺時域掩蔽特性,結(jié)合音頻信號內(nèi)容選取能量較大的音頻段作為水印嵌入的候選段。頻域掩蔽特性將在后面選取小波系數(shù)被利用。
下面給出基于內(nèi)容的聽覺重要音頻段自適應(yīng)選取方法。
首先,計算每個音頻段的樣本能量E(k)(0≤k<N/L)E(k)=Σi=0L-1a2(kL+i)]]>
然后,對所求取的N/L個音頻段樣本能量值進行降序排序,并選擇能量較大的前Nw個音頻段Ae={Ae(k),0≤k<Nw}作為水印嵌入的候選段。
(3)整型提升小波變換及小波系數(shù)的選取對所選取的每個音頻數(shù)據(jù)段Ae(k)(0≤k<Nw)分別進行3級整型提升小波變換(ILWT)CDe(k)=ILWT3(Ae(k))={Ce(k)(3),De(k)(3),De(k)(2),De(k)(1)}式中,Ce(k)(3)為第k音頻段Ae(k)3級小波變換后的逼近信號,而{De(k)(3),De(k)(2),De(k)(1)}為第k音頻段Ae(k)3級小波變換后的細節(jié)信號。
由于細節(jié)系數(shù)對應(yīng)于音頻信號的高頻分量(不易被察覺),逼近系數(shù)對應(yīng)于音頻信號的低頻分量,因此在細節(jié)系數(shù)中嵌入水印信息有利于保證透明性,而嵌入在逼近系數(shù)中有利于提高魯棒性??紤]到人類聽覺系統(tǒng)(HAS)的頻域掩蔽特性,本算法從第k音頻段Ae(k)3級小波變換細節(jié)信號De(k)(3)中選取絕對值大的小波系數(shù)(聽覺重要系數(shù))C(k)用于水印序列元素x(k)的嵌入。
(4)數(shù)字水印的嵌入水印嵌入是通過對所選擇的小波系數(shù)C(k)進行特殊量化完成的。設(shè)C(k)表示待量化小波系數(shù),C′(k)表示量化處理后的小波系數(shù),x(k)為待嵌入水印比特,Δ表示量化間隔。與現(xiàn)有數(shù)字音頻水印嵌入方法[1-4]普遍采用均勻量化(Δ為常數(shù))不同,本發(fā)明將量化間隔選取為基于人類聽覺系統(tǒng)而計算出的可感知噪聲閾值(JND),即Δ=JND(C(k)),以便于進一步提高數(shù)字水印的透明性與魯棒性。則量化修改系數(shù)嵌入數(shù)字水印過程(步驟)如下首先定義量化規(guī)則。本文將量化函數(shù)定義為用量化間隔JND(C(k))對待量化小波系數(shù)C(k)進行二次取模求余運算,即Q(C(k))=[C(k)mod(JND(C(k))]mod(2)其量化規(guī)則為如果C(k)mod(JND(C(k))為奇數(shù),則Q(C(k))取1,即C(k)歸于1類;如果C(k)mod(JND(C(k))為偶數(shù),則Q(C(k))取0,即C(k)歸于0類。
然后量化系數(shù)嵌入水印信息,即對所選小波系數(shù)C(k)進行適當修改并賦予二值信息的過程。本發(fā)明所采用的量化嵌入方案為如果Q(C(k))不等于x(k),則如果x(k)=0,則 否則 否則不對C(k)做任何處理;
其中, (5)整型提升小波逆變換及音頻段的重新組合為了得到含水印的數(shù)字音頻信號,要對含有水印信息的小波系數(shù)進行3級整型提升小波逆變換,即用含有水印信息的小波系數(shù)C′(k)代替C(k)并對小波系數(shù)CD′e進行3級整型提升小波逆變換(Inverse Integer Lifting Wavelet Transform,IILWT),即Ae′=IILWT3(CDe′)將Ae′代替Ae,再結(jié)合未被選用(嵌入水印)的音頻數(shù)據(jù)段,即可最終得到含有水印的數(shù)字音頻信號A′。
值得注意的是,本發(fā)明在嵌入數(shù)字水印過程中生成了抽取數(shù)字水印的密鑰,即用于嵌入數(shù)字水印的候選音頻段位置信息及小波系數(shù)位置信息。
本發(fā)明所提出的數(shù)字音頻水印檢測算法屬于目標檢測算法,即在檢測數(shù)字水印圖像時不需要原始的音頻信號。
數(shù)字水印的檢測過程如下(1)將待檢測數(shù)字音頻信號A′劃分成 個音頻段(每個音頻段含有L個數(shù)據(jù)),根據(jù)水印嵌入過程所生成的候選段位置信息選擇聽覺重要音頻數(shù)據(jù)段Ae′={Ae′(k),0≤k<Nw}并對其分別進行3級整型提升小波變換(采納嵌入過程所使用的小波基)。
(2)根據(jù)嵌入水印過程中所生成的用于嵌入水印的小波系數(shù)位置信息,確定出含有水印序列元素x′(k)信息的小波系數(shù)C′(k)(k=0,1,Λ,Nw-1),并利用前面所定義的量化規(guī)則提取水印。即 (3)按照數(shù)字水印嵌入算法的相反操作,利用密鑰K對數(shù)字水印信息X′進行逆置亂加密,以得到原始水印的一維二進制序列V′={v′(k),0≤k<Nw,v′(k)∈{0,1}}。
(4)對所得到的一維二進制序列V′進行解壓縮,便可恢復嵌入的數(shù)字水印圖像W′={w′(i,j),0≤i<P,0≤j<Q}。
此外,為了消除觀測者的經(jīng)驗、身體條件、實驗條件和設(shè)備等主、客觀因素的影響,需采用歸一化相關(guān)系數(shù)(Normalized Cross-Correlation,NC)對抽取的水印和原始水印的相似性進行定量評價,其定義為NC(W′,W)=Σi=0P-1Σj=0Q-1w(i,j)·w′(i,j)Σi=0P-1Σj=0Q-1w2(i,j)Σi=0P-1Σj=0Q-1w′2(i,j)]]>
其中,W′是待判決的數(shù)字水印,W是嵌入的原始數(shù)字水印。如果該歸一化相關(guān)系數(shù)NC超過某一閾值T,我們就判定數(shù)字音頻信號中存在此數(shù)字水印圖像(閾值T是用戶根據(jù)數(shù)字水印的具體應(yīng)用背景而確定的)。
以下我們結(jié)合實驗數(shù)據(jù)說明本發(fā)明帶來的積極效果。
仿真實驗選取了藍調(diào)、流行、古典、鄉(xiāng)村、民歌等5種普遍存在的音樂形式進行測試,這5種不同類型的音樂形式具有不同的頻譜特性,它能夠有效地測試本發(fā)明的有效性。每一段測試音樂(即原始數(shù)字音頻信號)都是單聲道,采樣頻率為44.1kHz,分辨率為16比特,取400000個采樣點,數(shù)字水印選用了64×64的256級灰度圖像Cat。整型提升小波變換采用了常見的Haar小波基。由于采用的水印在感覺上是可視的,所以提取的水印信息很容易辨別。另外,仿真實驗還采用歸一化相關(guān)系數(shù)(NC)定量分析了提取水印與原始水印的相似度,采用信噪比(SNR)評價了原始數(shù)字音頻信號與含水印數(shù)字音頻信號之間的差別,并與Emilia Gomez和Pedro Cano所提出的數(shù)字音頻水印方法(文[4]法)進行了對比。
(1)數(shù)字音頻的主觀質(zhì)量度量數(shù)字音頻的主觀質(zhì)量度量采納了主觀平均判分方法(Mean Opinion Score,MOS),即召集若干個實驗者,由他們對數(shù)字音頻質(zhì)量的好壞進行評分,再求出平均值作為對數(shù)字音頻質(zhì)量的評價。目前,對數(shù)字音頻主觀質(zhì)量度量比較通用的標準是5分制,各檔次的評分標準見表1。
仿真實驗中,共挑選了10名具有不同音樂背景的實驗者(其中,4名實驗者為專業(yè)音樂人士,5名實驗者具有一定音樂背景),他們要仔細傾聽原始音樂作品和含水印音樂作品并指出二者之間是否存在差異。測試時,首先將10名實驗者安置在音樂實驗室內(nèi)并佩帶高質(zhì)量耳機,再分別播放原始音樂作品和含水印音樂作品(進行聽力測試),然后分別給出音樂質(zhì)量的主觀評分,最后將10名實驗者的平均得分作為對音樂作品的主觀質(zhì)量評價。表2給出了5種音樂作品(藍調(diào)音樂、流行音樂、古典音樂、鄉(xiāng)村音樂、民歌)的主觀質(zhì)量度量結(jié)果。
表1 數(shù)字音頻質(zhì)量的評分標準表2 音頻作品的主觀質(zhì)量度量分數(shù) 質(zhì)量等級失真級別音頻作品 本發(fā)明 文[4]法5.0 優(yōu) 無察覺 藍調(diào)音樂 4.944.564.0 良 (剛)察覺但不討厭流行音樂 4.964.383.0 中 (察覺)有點討厭 古典音樂 4.914.612.0 差 討厭但不反感鄉(xiāng)村音樂 4.954.331.0 劣 極討厭(令人反感)民歌 4.964.40
水印后的數(shù)字音頻信號波形圖(信噪比SNR=45.7dB)、原始灰度水印圖像、壓縮編碼后的水印圖像和提取出的數(shù)字水印圖像(NC=0.9990)(未受到任何攻擊)。
(3)抗攻擊能力測試通常,對含水印數(shù)字音頻信號的攻擊方式主要包括低通濾波、疊加噪聲、重新采樣、重新量化、有損壓縮等。為了檢測本發(fā)明之數(shù)字音頻水印嵌入方法的魯棒性,仿真實驗對含水印音頻信號分別進行了以上處理,表3給出了本發(fā)明及文獻[4]方法對常見信號處理與攻擊的抵抗能力(歸一化相關(guān)系數(shù))。其中(1)低通濾波。采用長度為6階,截止頻率為22.05kHz的巴特沃茲低通濾波器。
(2)疊加噪聲。對數(shù)字音頻信號在時域中加入高斯白噪聲。
(3)重新采樣。將音頻信號采樣頻率提升為48kHz,再還原為原采樣頻率44.1kHz。
(4)重新量化。先將音頻信號從16比特量化為8比特,再量化為16比特。
(5)有損壓縮。先對音頻信號進行壓縮(壓縮比為12∶1),再解壓縮。
表3 數(shù)字水印對常見攻擊的抵抗能力歸一化相關(guān)系數(shù)攻擊方式 藍調(diào)音樂 流行音樂 古典音樂 鄉(xiāng)村音樂 民歌本發(fā)明 文[4]法 本發(fā)明 文[4]法 本發(fā)明 文[4]法 本發(fā)明 文[4]法 本發(fā)明文[4]法低通濾波 0.89500.8105 0.9015 0.8087 0.9018 0.8123 0.9001 0.80980.90100.8129疊加噪聲 0.90270.7981 0.8984 0.7869 0.8858 0.7873 0.8854 0.77970.89580.7814重新采樣 0.78340.7056 0.7801 0.7113 0.7986 0.7136 0.7985 0.70820.80050.7089重新量化 0.89030.7513 0.8928 0.7640 0.9070 0.7604 0.9009 0.76130.90340.7673有損壓縮 0.85200.8014 0.8524 0.7997 0.8506 0.8040 0.8770 0.79830.85950.7948以上仿真實驗結(jié)果表明本發(fā)明所提出的數(shù)字音頻水印嵌入與檢測方法不僅具有較好的透明性,而且對諸如疊加噪聲、有損壓縮、低通濾波、重新采樣、重新量化等攻擊均具有較好的魯棒性,整體性能優(yōu)于現(xiàn)有數(shù)字音頻水印方法。
權(quán)利要求
1.一種基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法,其特征在于包括如下具體步驟設(shè)原始數(shù)字音頻信號為A={a(i),0≤i<N},其中,N為數(shù)據(jù)個數(shù),a(i)∈{0,1,2,Λ,(2p-1)}是第i個音頻數(shù)據(jù)的幅度值,p為表示每個數(shù)據(jù)所使用的比特數(shù);設(shè)數(shù)字水印為256級灰度圖像(或24位真彩色圖像)W={w(i,j),0≤i<P,0 ≤j<Q},其中,w(i,j)代表數(shù)字水印圖像的第i行、第j列象素的灰度值(或顏色值);數(shù)字水印的嵌入過程為(1)數(shù)字水印圖像的壓縮編碼與置亂加密當數(shù)字水印為256級灰度圖像時,數(shù)字水印圖像的壓縮編碼與置亂加密過程為首先采用DCT(離散余弦變換)靜態(tài)圖像壓縮技術(shù),將數(shù)字水印圖像W編碼為一維的二進制序列V,工作步驟為(a)將數(shù)字水印圖像(灰度圖像)W劃分成8×8的圖像子塊;(b)對每個圖像子塊進行DCT變換,并量化所得到的DCT系數(shù);于是,可得到壓縮編碼后的一維二進制序列V={v(k),0≤k<Nw,v(k)∈{0,1},Nw=15(P×Q)16};]]>其中Nw=P×Q8×8((1+4)×8+5×4)=15(P×Q)16;]]>然后對上面得到的一維二進制序列V進行置亂加密,得到新的一維二進制序列X={x(k),0≤k<Nw,x(k)∈{0,1}};注當數(shù)字水印為24位真彩色圖像時,數(shù)字水印圖像的壓縮編碼與置亂加密過程為(a)將彩色水印圖像W分解為R、G、B三個彩色分量;(b)將彩色分量R劃分成8×8的子塊;(c)對每個子塊進行DCT變換,并量化所得到的DCT系數(shù);于是,可得到壓縮編碼后的一維二進制序列VR={vR(k),0≤k<Nw′,vR(k)∈{0,1},Nw′=15(P×Q)16};]]>這里,Nw′=P×Q8×8×((1+4)×8+5×4)=15(P×Q)16;]]>(d)對于彩色分量G、B實施步驟(b)和(c)的相同操作,即可得到彩色水印圖像W的壓縮編碼后一維二進制序列V={v(k),0≤k<Nw,Nw=3Nw′,v(k)∈{0,1}};]]>對上面得到的一維二進制序列V進行置亂加密,得到新的一維二進制序列X={x(k),0 ≤k<Nw,x(k)∈{0,1}};(2)音頻信號的分段處理及重要音頻段的自適應(yīng)選取采用對數(shù)字音頻信號進行分段的方法嵌入水印信息,即首先將整個音頻信號劃分為若干個音頻數(shù)據(jù)段,進而依據(jù)人類聽覺系統(tǒng)(HAS)自適應(yīng)選取重要音頻數(shù)據(jù)段用于嵌入水印,每個音頻段僅嵌入1個比特的水印信息;設(shè)每個音頻段含有L個數(shù)據(jù),為了保證數(shù)字水印的透明性與魯棒性,音頻段長度L的取值以大于等于8為宜,則可將整個音頻信號劃分成 個音頻段,即A={A(k),0≤k<N/L},]]>A(k)={α(kL+i),0≤i<L};根據(jù)聽覺時域掩蔽特性,結(jié)合音頻信號內(nèi)容選取能量較大的音頻段作為水印嵌入的候選段;下面給出基于內(nèi)容的聽覺重要音頻段自適應(yīng)選取方法;首先,計算每個音頻段的樣本能量E(k)(0≤k<N/L)E(k)=Σl=0L-1a2(kL+i)]]>然后,對所求取的N/L個音頻段樣本能量值進行降序排序,并選擇能量較大的前Nw個音頻段Ae={Ae(k),0≤k<Nw}作為水印嵌入的候選段;(3)整型提升小波變換及小波系數(shù)的選取對所選取的每個音頻數(shù)據(jù)段Ae(k)(0≤k<Nw)分別進行3級整型提升小波變換(ILWT)CDe(k)=ILWT3(Ae(k))={Ce(k)(3),De(k)(3),De(k)(2),De(k)(1)}式中,Ce(k)(3)為第k音頻段Ae(k)3級小波變換后的逼近信號,而{De(k)(3),De(k)(2),De(k)(1)}為第k音頻段Ae(k)3級小波變換后的細節(jié)信號;根據(jù)人類聽覺系統(tǒng)(HAS)的頻域掩蔽特性,本算法從第k音頻段Ae(k)3級小波變換細節(jié)信號De(k)(3)中選取絕對值大的小波系數(shù)(聽覺重要系數(shù))C(k)用于水印序列元素x(k)的嵌入;(4)數(shù)字水印的嵌入水印嵌入是通過對所選擇的小波系數(shù)C(k)進行特殊量化完成的;設(shè)C(k)表示待量化小波系數(shù),C′(k)表示量化處理后的小波系數(shù),x(k)為待嵌入水印比特,Δ表示量化間隔;將量化間隔選取為基于人類聽覺系統(tǒng)而計算出的可感知噪聲閾值(JND),即Δ=JND(C(k));則量化修改系數(shù)嵌入數(shù)字水印過程(步驟)如下首先定義量化規(guī)則,將量化函數(shù)定義為用量化間隔JND(C(k))對待量化小波系數(shù)C(k)進行二次取模求余運算,即Q(C(k))=[C(k)mod(JND(C(k))]mod(2)其量化規(guī)則為如果C(k)mod(JND(C(k))為奇數(shù),則Q(C(k))取1,即C(k)歸于1類;如果C(k)mod(JND(C(k))為偶數(shù),則Q(C(k))取0,即C(k)歸于0類;然后量化系數(shù)嵌入水印信息,即對所選小波系數(shù)C(k)進行適當修改并賦予二值信息的過程,所采用的量化嵌入方案為如果Q(C(k))不等于x(k),則如果x(k)=0,則 否則 否則不對C(k)做任何處理;其中, (5)整型提升小波逆變換及音頻段的重新組合為了得到含水印的數(shù)字音頻信號,要對含有水印信息的小波系數(shù)進行3級整型提升小波逆變換,即用含有水印信息的小波系數(shù)C′(k)代替C(k)并對小波系數(shù)CDe′進行3級整型提升小波逆變換(Inverse Integer Lifting Wavelet Transform,IILWT),即Ae′=IILWT3(CDe′)]]>將Ae′代替Ae,再結(jié)合未被選用(嵌入水印)的音頻數(shù)據(jù)段,即可最終得到含有水印的數(shù)字音頻信號A′;數(shù)字水印的檢測過程如下(1)將待檢測數(shù)字音頻信號A′劃分成 個音頻段(每個音頻段含有L個數(shù)據(jù)),根據(jù)水印嵌入過程所生成的候選段位置信息選擇聽覺重要音頻數(shù)據(jù)段Ae′={Ae′(k),0≤k<Nw}]]>并對其分別進行3級整型提升小波變換(采納嵌入過程所使用的小波基);(2)根據(jù)嵌入水印過程中所生成的用于嵌入水印的小波系數(shù)位置信息,確定出含有水印序列元素x′(k)信息的小波系數(shù)C′(k)(k=0,1,Λ,Nw-1),并利用前面所定義的量化規(guī)則提取水印,即 (3)按照數(shù)字水印嵌入算法的相反操作,對數(shù)字水印信息X′進行逆置亂加密,以得到原始水印的一維二進制序列V′={v′(k),0≤k<Nw,v′(k)∈{0,1}};(4)對所得到的一維二進制序列V′進行解壓縮,便可恢復嵌入的數(shù)字水印圖像W′={w′(i,j),0≤i<P,0≤j<Q}。
全文摘要
本發(fā)明所述的基于聽覺特性與整型提升小波的數(shù)字音頻水印嵌入與檢測方法是一種將灰度圖像(或彩色圖像)嵌入到原始數(shù)字音頻作品的新數(shù)字水印方法,屬于信息安全、多媒體信息處理領(lǐng)域。本發(fā)明首先利用靜態(tài)圖像壓縮編碼技術(shù),將水印圖像(灰度圖像或彩色圖像)編碼成一維二進制序列并進行置亂加密;然后對數(shù)字音頻信號進行分段處理,并依據(jù)人類聽覺系統(tǒng)的時域掩蔽特性自適應(yīng)選擇音頻段做整型提升小波變換;再依據(jù)人類聽覺系統(tǒng)的頻域掩蔽特性自適應(yīng)確定小波系數(shù),并通過量化處理過程將水印信息嵌入到小波變換后的聽覺重要系數(shù)中;最后通過逆整型提升小波變換及音頻數(shù)據(jù)段重新組合得到嵌入水印信息的數(shù)字音頻作品;并利用嵌入過程的逆過程進行數(shù)字水印檢測。
文檔編號H04N5/911GK1529246SQ03143370
公開日2004年9月15日 申請日期2003年9月28日 優(yōu)先權(quán)日2003年9月28日
發(fā)明者王向陽 申請人:王向陽