專利名稱:語音感知哈希認(rèn)證的感知哈希值提取方法及認(rèn)證方法
技術(shù)領(lǐng)域:
本發(fā)明屬于多媒體信息安全領(lǐng)域,具體涉及一種基于線性預(yù)測分析(Linear Prediction Coefficients , LPC)的語音感知哈希特征提取與認(rèn)證方法,可用于語音通信通話過程中語音信號的內(nèi)容認(rèn)證、說話人認(rèn)證。
背景技術(shù):
語音是人類最重要的交流工具,它自然方便,準(zhǔn)確高效。隨著現(xiàn)代網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的快速發(fā)展,人們從網(wǎng)絡(luò)上獲得的多媒體信息的數(shù)量越來越多。語音信息作為人類交流信息最自然、最有效、最方便的手段,使地球上任意地區(qū)的人都可以隨時隨地通電話,人們的相互聯(lián)系越來越緊密。語音的存在形式也由聲波擴(kuò)展到了模擬信號和數(shù)字信號,使得可以無線傳播和保存。但是在方便人類生活的同時,隨之而來的是海量的語音信 息處理、信息安全、社會安全問題。由于語音通信的開放性、便利性和準(zhǔn)確性,語音每天都會產(chǎn)生海量的語音信息,因此怎樣保證語音信息的安全成為近年來的熱點(diǎn)問題。語音內(nèi)容認(rèn)證技術(shù)就是一個實(shí)現(xiàn)對語音數(shù)據(jù)完整性、真實(shí)性進(jìn)行保護(hù)的有效技術(shù)手段,它可以檢測出接收到的語音數(shù)據(jù)在傳送過程中沒有經(jīng)過第三方的惡意編輯和篡改。由于語音的特殊性,傳統(tǒng)的簽名認(rèn)證算法無法滿足語音的認(rèn)證要求,一是因?yàn)轸敯粜缘囊?,語音在傳輸過程中經(jīng)常會受到各種干擾,而語音信息并不會因?yàn)閮?nèi)容保持操作而影響整體的聽覺理解,因此認(rèn)證過程中,就應(yīng)該將內(nèi)容保持操作歸納到認(rèn)證的范圍內(nèi),這就對語音認(rèn)證算法的魯棒性提出了很高的要求。另一方面,語音傳輸?shù)膶?shí)時性和語音移動終端的資源問題,使得語音認(rèn)證算法對運(yùn)算效率又有著很高的要求。而傳統(tǒng)的摘要認(rèn)證算法是將所有的數(shù)據(jù)都看成比特流,因此原始數(shù)據(jù)的微小改動,都會使產(chǎn)生的摘要發(fā)生變化,魯棒性太差,不適用于語音認(rèn)證,并且對資源要求很高,計算量較大,不適用于語音移動終端。感知哈希函數(shù)可以應(yīng)用于驗(yàn)證信息來源的真實(shí)性和信息的完整性。它可以將任意長度的信息,通過單向映射的方式,壓縮成一定長度的數(shù)據(jù)摘要,在設(shè)計哈希函數(shù)時,需要根據(jù)應(yīng)用中的實(shí)際需求,選擇壓縮率、安全性和運(yùn)算效率的折中,見文獻(xiàn)“M. Schmucker, H.Zhang. D. WVL. 11 Benchmarking Metrics and Concepts for Perceptual Hashing[R].ECRYPT European Network of Excellence in Cryptology, 19 October 2006 ”。哈希函數(shù)的原理非常簡單,在設(shè)計哈希函數(shù)時,自由度是比較大的。到目前為止,哈希函數(shù)的算法設(shè)計可以分為三個大類標(biāo)準(zhǔn)型、基于分組加密型、基于模運(yùn)算型,見文獻(xiàn)“Yuhua Jiao,Liping Ji, Xiamu Niu. Perceptual Speech Hashing and Performance Evaluation[J],International Journal of Innovative Computing, Information and Control, 2010,6 (3 (B)) : 1447-1458”。隨機(jī)的哈希函數(shù)區(qū)分性和壓縮性要比它的安全性要好,因此安全性還可以依靠密鑰的設(shè)置來保障,這些性質(zhì)使得哈希函數(shù)非常適合應(yīng)用于信息安全領(lǐng)域,尤其是語音認(rèn)證領(lǐng)域。構(gòu)造語音感知哈希重要的一項(xiàng)內(nèi)容就是對語音信號特征值提取,特征值是原始語音信號的表達(dá)形式,提取出的是能代表原始信號的數(shù)據(jù)。因此,提取出的特征值水平怎么樣,嚴(yán)重影響語音感知哈希構(gòu)造的水平。通常語音特征值提取可以分為時域分析和變換域分析,其中時域分析方法最簡單、最直觀,它直接對語音信號的時域波形進(jìn)行分析,提取的特征參數(shù)主要有語音短時能量、語音短時平均幅度、短時平均過零率和短時自相關(guān)函數(shù)等。語音特征的提取有兩種方法一種是提取聽覺感知特征如音調(diào)、響度 ’另一種是計算非感知特征,也就是物理特征,如對數(shù)倒譜系數(shù)、線性預(yù)測系數(shù)、線性譜頻率(見文獻(xiàn)“ Yuhua Jiao, Liping Ji, Xiamu Niu. Robust Speech Hashing for ContentAuthentication [J], IEEE Signal Processing Letters, 2009, 16 (9) : 818-821 ”)、梅爾倒頻系數(shù)(見文獻(xiàn) “Gaikwad. S·,Gawal i, B. , Yannawar, P. , Mehrotra, S. . Featureextraction using fusion MFCC for continuous marathi speech recognition[C],India Conference (INDICON), 2011 Annual IEEE,16-18 Dec. 2011: I - 5”等)。文獻(xiàn)“Xugang Lu, Shigeki Matsuda, Masashi Unoki. Temporal modulation normalizationfor robust speech feature extraction and recognition[J], Multimedia Tools andApplications, 2011, I (52) : 187-199” 和“Hui Yin, Volker Hofmann, Climent Nedeu.Acoustic Features for Speech Recognition Based on Gammatione Filterbank andInstantaneous Frequency [J], Speech Communication, 2011,5 (53) : 707-715” 分別使用了時空調(diào)制歸一化(Temporal modulation normalization)方法和 Gammatone 濾波器對語音信息調(diào)制進(jìn)行降噪,該算法可以降低噪聲對語音信號的干擾,結(jié)合傳統(tǒng)降噪方法,可以進(jìn)一步降低噪聲的效果,提高特征提取的魯棒性和準(zhǔn)確性。但上述方法構(gòu)成感知哈希值的效率不是很高,不能夠滿足目前移動終端對語音認(rèn)證實(shí)時性的需求。作為在估計基本的語音參數(shù),以及用低速率傳輸或儲存語音等方面的核心技術(shù),線性預(yù)測(Linear Prediction)可用很少的參數(shù),有效而又正確地表現(xiàn)語音波形及其頻譜的性質(zhì),而且計算效率高,在應(yīng)用上靈活方便。但是單純的LPC方法雖然計算效率高,但魯棒性較差,對語音信號在傳輸過程中受到的內(nèi)容保持操作攻擊不具有魯棒性。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于線性預(yù)測分析的語音感知哈希認(rèn)證的感知哈希值提取方法及認(rèn)證方法。本發(fā)明是語音感知哈希認(rèn)證的感知哈希值提取方法及認(rèn)證方法,語音感知哈希認(rèn)證的感知哈希值提取方法,其步驟為
(1)對語音信號A進(jìn)行分幀,使用漢明窗進(jìn)行加窗,幀長為20ms,幀移為IOms;
(2)計算語音信號每幀的線性預(yù)測系數(shù)R和每幀的短時平均能量E;
(3)用每幀的短時平均能量E替換每幀線性預(yù)測系數(shù)的第一個線性預(yù)測系數(shù);
(4)對短時平均能量與線性預(yù)測系數(shù)構(gòu)成的矩陣進(jìn)行分塊處理;
(5)對分塊處理后的Am分別進(jìn)行奇異值分解,形成U、S和V三個矩陣;
(6)使用奇異值分解后的U、V系數(shù)重構(gòu)矩陣,構(gòu)成W=UV矩陣;
權(quán)利要求
1.語音感知哈希認(rèn)證的感知哈希值提取方法,其步驟為 (1)對語音信號A進(jìn)行分幀,使用漢明窗進(jìn)行加窗,幀長為20ms,幀移為IOms; (2)計算語音信號每幀的線性預(yù)測系數(shù)R和每幀的短時平均能量E; (3)用每幀的短時平均能量E替換每幀線性預(yù)測系數(shù)的第一個線性預(yù)測系數(shù); (4)對短時平均能量與線性預(yù)測系數(shù)構(gòu)成的矩陣進(jìn)行分塊處理; (5)對分塊處理后的Am分別進(jìn)行奇異值分解,形成U、S和V三個矩陣; (6)使用奇異值分解后的U、V系數(shù)重構(gòu)矩陣,構(gòu)成W=UV矩陣;
2.根據(jù)權(quán)利要求I所述的語音感知哈希認(rèn)證的感知哈希值提取方法,其特征在于根據(jù)權(quán)利要求I中步驟(2)所述的計算原始語音信號每幀的線性預(yù)測系數(shù)R和每幀的短時平均能量E,按如下步驟進(jìn)行 (1)語音信號經(jīng)過加窗分幀處理后,得到的第N幀的語音信號為八,(111),則4,(111)滿足
3.根據(jù)權(quán)利要求I所述的語音感知哈希認(rèn)證的感知哈希值提取方法,其特征在于根據(jù)權(quán)利要求I中的步驟(3)所述的用每幀的短時平均能量E替換每幀線性預(yù)測系數(shù)的第一個預(yù)測函數(shù)R,按如下步驟進(jìn)行 (1)求出的線性預(yù)測函數(shù),得到的線性預(yù)測系數(shù)首位為I; (2)首位的I在進(jìn)行后續(xù)奇異值分解時,會對分解后的矩陣產(chǎn)生影響,使得分解后的特征值區(qū)分性變差,將第一行去掉,產(chǎn)生新的預(yù)測系數(shù)矩陣;
4.根據(jù)權(quán)利要求I所述的語音感知哈希認(rèn)證的感知哈希值提取方法,其特征在于根據(jù)權(quán)利要求I中的步驟(4)所述的對短時平均能量與線性預(yù)測系數(shù)構(gòu)成的矩陣進(jìn)行分塊處理,按如下步驟進(jìn)行 (I)矩陣分為m個p*p小矩陣
5.根據(jù)權(quán)利要求I所述的語音感知哈希認(rèn)證的感知哈希值提取方法,其特征在于根據(jù)權(quán)利要求I中的步驟(5)所述的對分塊處理后的Am分別進(jìn)行奇異值分解,形成U、S和V三個矩陣
6.根據(jù)權(quán)利要求I所述的語音感知哈希認(rèn)證的感知哈希值提取方法,其特征在于根據(jù)權(quán)利要求I中的步驟(6)所述的使用奇異值分解后的U、V系數(shù)重構(gòu)矩陣,構(gòu)成W=UV矩陣
7.根據(jù)權(quán)利要求I所述的語音感知哈希認(rèn)證的感知哈希值提取方法,其特征在于根據(jù)權(quán)利要求I中的步驟(7)所述的計算重構(gòu)矩陣的列的和s (i);按如下步驟進(jìn)行 (1)對重構(gòu)矩陣的每一列進(jìn)行求和運(yùn)算,得到每一列特征值的總和; (2)重復(fù)(I),直到求出所有分塊矩陣的每一列的特征值總和。
8.根據(jù)權(quán)利要求I所述的語音感知哈希認(rèn)證的感知哈希值提取方法,其特征在于根據(jù)權(quán)利要求I中的步驟(8)所述的對矩陣進(jìn)行量化處理,形成感知哈希序列,按如下步驟進(jìn)行 (1)將所有的特征值拼接起來,根據(jù)語音幀的順序進(jìn)行拼接,得到一個特征值序列; (2)對集合起來的序列求特征值的中值S; (3)用每一個特征值與中值進(jìn)行對比,大于中值的特征值量化為1,小于或者等于中值的特征值量化為O ; (4)重復(fù)(3),直到求出所有的量化值; (5)形成的0、1序列即為所要求的語音感知哈希值。
9.語音感知哈希認(rèn)證的認(rèn)證方法,其步驟為 (1)對認(rèn)證的兩個語音的感知哈希值進(jìn)行異或運(yùn)算,XhashXor Yhash (2)對步驟(I)得到異或值進(jìn)行求和運(yùn)算,XorYii3sb (3)用步驟(2)得到的和除以感知哈希值總長度,得到歸一化的哈希距離,使用歸一化的哈希距離來判斷兩段語音內(nèi)容的匹配程度。
全文摘要
語音感知哈希認(rèn)證的感知哈希值提取方法及認(rèn)證方法,根據(jù)LPC的特點(diǎn),對LPC方法進(jìn)行優(yōu)化,并對LPC系數(shù)優(yōu)化、分塊、分塊后進(jìn)行參數(shù)的矩陣分解三個步驟,來提高LPC方法的魯棒性,通過優(yōu)化后的LPC系數(shù)具有較強(qiáng)的魯棒性和計算效率,構(gòu)成的感知哈希序列也提高了魯棒性。本發(fā)明使用優(yōu)化后的LPC系數(shù)計算出的感知哈希值不但保持了單純LPC方法實(shí)時性好的優(yōu)點(diǎn),還對語音在傳輸過程中的攻擊,具有很好的魯棒性。
文檔編號G10L19/087GK102881291SQ20121040938
公開日2013年1月16日 申請日期2012年10月24日 優(yōu)先權(quán)日2012年10月24日
發(fā)明者張秋余, 黃羿博, 邸燕君, 劉揚(yáng)威, 楊仲平, 省鵬飛 申請人:蘭州理工大學(xué)