一種基于水印的音頻審計(jì)方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明設(shè)及信息安全領(lǐng)域,具體地說,設(shè)及一種對嵌有水印的音頻文件進(jìn)行內(nèi)容 審計(jì)的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 當(dāng)前,確保網(wǎng)絡(luò)安全、建設(shè)網(wǎng)絡(luò)強(qiáng)國、提升信息化水平、推進(jìn)傳統(tǒng)媒體與新興媒體 融合已成為重大國家戰(zhàn)略,構(gòu)建能夠?qū)σ纛l進(jìn)行集中存儲、管理和共享的云計(jì)算平臺是響 應(yīng)此戰(zhàn)略的重要舉措,云安全是此類音頻云建設(shè)的一個(gè)重要關(guān)注點(diǎn)。音頻云是W音頻為核 屯、的數(shù)據(jù)共享平臺,因而需要W音頻為保護(hù)核屯、,通過用戶層和平臺層安全防護(hù)來構(gòu)建全 面的安全管控體系。針對用戶層安全防護(hù),一方面需要對用戶的身份和權(quán)限進(jìn)行統(tǒng)一管理, 確保用戶的合法接入和合法訪問;另一方面需要實(shí)時(shí)地對用戶操作音頻的行為進(jìn)行審計(jì), 及時(shí)發(fā)現(xiàn)違規(guī)現(xiàn)象。針對平臺層安全防護(hù),一方面需要部署傳統(tǒng)的安全設(shè)備(如防火墻、IPS (Intrusion Prevention System,入侵防御系統(tǒng))、WAF(Web Application Firewall,Web應(yīng) 用防火墻)等)和制定相關(guān)安全策略,另一方面需要通過實(shí)時(shí)監(jiān)控和深入分析音頻的流轉(zhuǎn)過 程來深度挖掘云平臺的安全隱患,W提高安全事故預(yù)防能力,提高事故響應(yīng)、處理、恢復(fù)的 速度,提高事后審查和恢復(fù)能力。因此,不論是用戶層還是平臺層,對音頻進(jìn)行安全審計(jì)都 是其中的重要關(guān)注點(diǎn)。
[0003] -般來說,音頻云中承載著多個(gè)應(yīng)用,各類電臺、專業(yè)或商業(yè)機(jī)構(gòu)、團(tuán)體或個(gè)人等 海量用戶通過互聯(lián)網(wǎng)接入音頻云中,音頻的訪問情況十分復(fù)雜。在音頻云中,音頻一般通過 交換機(jī)流入或流出音頻文件服務(wù)器,為了實(shí)現(xiàn)對音頻的全面安全審計(jì),不僅要運(yùn)用基于網(wǎng) 絡(luò)旁路抓包的審計(jì)技術(shù),捕獲并分析流入或流出音頻文件服務(wù)器的所有數(shù)據(jù)包,獲取相關(guān) 網(wǎng)絡(luò)傳輸信息,實(shí)時(shí)記錄音頻在網(wǎng)絡(luò)中的流轉(zhuǎn)路徑;還要能夠?qū)σ纛l的關(guān)鍵內(nèi)容進(jìn)行快速 審計(jì),并獲取訪問者的身份信息,從而實(shí)時(shí)記錄哪些用戶訪問了哪些類型、什么內(nèi)容的音 頻,W便于及時(shí)發(fā)現(xiàn)違規(guī)訪問行為。
[0004] 現(xiàn)有的網(wǎng)絡(luò)安全審計(jì)技術(shù)不適用于音頻云環(huán)境,主要體現(xiàn)在W下兩個(gè)方面:
[0005] (1)現(xiàn)有的網(wǎng)絡(luò)安全審計(jì)技術(shù)大多對網(wǎng)絡(luò)操作行為進(jìn)行審計(jì),而無法進(jìn)行內(nèi)容審 計(jì)。少數(shù)可進(jìn)行內(nèi)容審計(jì)的技術(shù)采用的是基于關(guān)鍵詞匹配的方法,需要將一個(gè)文件對應(yīng)的 數(shù)據(jù)包完全捕獲并做完整拼接之后才能審計(jì),效率很低。當(dāng)其應(yīng)用于內(nèi)容不能直接獲取的 音頻的審計(jì)時(shí),還需要在得到完整的音頻文件后,進(jìn)行音頻和文本之間的轉(zhuǎn)換,然后再基于 關(guān)鍵詞匹配對文本內(nèi)容進(jìn)行審計(jì),效率極低。
[0006] (2)現(xiàn)有的網(wǎng)絡(luò)安全審計(jì)技術(shù)只能獲取網(wǎng)絡(luò)傳輸?shù)南嚓P(guān)信息,將訪問行為、訪問對 象與某個(gè)IP相關(guān)聯(lián),而不能與訪問者的身份信息相關(guān)聯(lián),無法形成用戶訪問音頻的完整審 計(jì)鏈。
[0007] 在音頻云中,為了進(jìn)行版權(quán)保護(hù)和安全控制,在存儲音頻之前,可在音頻中嵌入水 印,來指代ID、版權(quán)、安全級別等音頻關(guān)鍵內(nèi)容信息。音頻水印技術(shù)是指用信號處理的方法 在數(shù)字化的音頻數(shù)據(jù)中嵌入隱蔽的標(biāo)記,運(yùn)種標(biāo)記通常是人耳不可感知的,只有通過專用 的檢測器或閱讀器才能提取。音頻水印一般具有W下兩個(gè)特點(diǎn):
[0008] (1)音頻水印的長度是固定的(例如64bit),其中的比特位與音頻的關(guān)鍵內(nèi)容信息 之間有明確的對應(yīng)關(guān)系。
[0009] (2)為便于進(jìn)行水印解析,且防止水印信息被完全篡改或破壞,音頻水印不只是被 嵌入在音頻頭或是音頻的某個(gè)位置,而是被循環(huán)嵌入到音頻中,因此只需要獲取不少于特 定長度(例如12s)的連續(xù)的音頻數(shù)據(jù),即可解析出完整的音頻水印信息。
[0010] 另外,為了進(jìn)行身份管理和訪問控制,音頻云中一般部署有身份認(rèn)證系統(tǒng),該系統(tǒng) 通常會將所有用戶的登錄、下線行為記錄到日志信息中。
[0011] 因此,可設(shè)計(jì)一種基于水印的音頻審計(jì)方法,通過網(wǎng)絡(luò)協(xié)議解析得到IP、端口號等 網(wǎng)絡(luò)傳輸信息,通過水印解析得到音頻的關(guān)鍵內(nèi)容信息,通過與相關(guān)的身份認(rèn)證系統(tǒng)對接 得到訪問者的身份信息,最終實(shí)現(xiàn)對音頻的全面內(nèi)容審計(jì)。
【發(fā)明內(nèi)容】
[0012] 針對現(xiàn)有的網(wǎng)絡(luò)安全審計(jì)技術(shù)應(yīng)用于音頻云環(huán)境的不足和缺陷,本發(fā)明提出一種 基于水印的音頻審計(jì)方法和系統(tǒng),能夠?qū)η队兴〉囊纛l文件進(jìn)行實(shí)時(shí)的、全面的內(nèi)容審 計(jì),構(gòu)建包含訪問者、訪問行為和訪問對象的完整審計(jì)鏈。
[0013] 本發(fā)明提出了一種基于水印的音頻審計(jì)方法,捕獲流入或流出音頻文件服務(wù)器的 所有數(shù)據(jù)包,解析其網(wǎng)絡(luò)傳輸信息,解析音頻中嵌有的水印信息,且將網(wǎng)絡(luò)傳輸信息和訪問 者身份信息相關(guān)聯(lián),構(gòu)建包含訪問者、訪問行為、訪問對象的完整審計(jì)鏈。其步驟如圖1所 示,包括:
[0014] 1)實(shí)時(shí)捕獲流入或流出音頻文件服務(wù)器的所有數(shù)據(jù)包,并將捕獲到的數(shù)據(jù)包寫入 文件存儲起來;
[0015] 2)讀取存有數(shù)據(jù)包的文件,進(jìn)行網(wǎng)絡(luò)層IP協(xié)議和傳輸層TCP協(xié)議的解析,得到相關(guān) 的網(wǎng)絡(luò)傳輸信息;再進(jìn)行TCP重組,得到有序的TCP數(shù)據(jù)包;
[0016] 3)依據(jù)^5、(:伴5、冊1?、。1?協(xié)議的報(bào)文格式規(guī)定,判斷1'〔?重組后的數(shù)據(jù)包對應(yīng)哪 種應(yīng)用層協(xié)議,然后進(jìn)行應(yīng)用層協(xié)議解析,得到相應(yīng)的有效音頻數(shù)據(jù)及相關(guān)信息;
[0017] 4)接收應(yīng)用層協(xié)議解析后得到的有效音頻數(shù)據(jù)及相關(guān)信息,對不同的音頻文件, 開辟不同的緩沖區(qū)進(jìn)行音頻數(shù)據(jù)累積,直到整個(gè)音頻文件接收完畢或者音頻數(shù)據(jù)量達(dá)到預(yù) 置大小,即得到該文件對應(yīng)的有效音頻片段,放入共享文件夾中存儲;
[0018] 5)讀取共享文件夾中的有效音頻片段,解析出其中的水印信息,并經(jīng)過進(jìn)一步分 析后得出水印信息對應(yīng)的音頻關(guān)鍵內(nèi)容信息;
[0019] 6)與相關(guān)的身份認(rèn)證系統(tǒng)對接,將已經(jīng)獲取到的網(wǎng)絡(luò)傳輸信息與身份認(rèn)證系統(tǒng)中 的用戶登錄日志相關(guān)聯(lián),獲取對應(yīng)的音頻訪問者的身份信息;
[0020] 7)將網(wǎng)絡(luò)傳輸信息、音頻關(guān)鍵內(nèi)容信息、音頻訪問者的身份信息合為一條完整的 審計(jì)信息,寫入數(shù)據(jù)庫中,并對數(shù)據(jù)庫中的審計(jì)信息進(jìn)行全方位展示。
[0021 ]更進(jìn)一步,步驟1)通過下述方法實(shí)現(xiàn)對數(shù)據(jù)包的捕獲和存儲:
[0022] 1)基于萬兆網(wǎng)卡進(jìn)行鏈路層的數(shù)據(jù)包捕獲,通過零拷貝技術(shù)實(shí)現(xiàn)對數(shù)據(jù)包的高速 捕獲;
[0023] 2)對于捕獲到的數(shù)據(jù)包,采用內(nèi)存映射文件的技術(shù),多線程存儲到多個(gè)文件中。
[0024]更進(jìn)一步,步驟2)進(jìn)行網(wǎng)絡(luò)層IP協(xié)議解析得到的網(wǎng)絡(luò)傳輸信息包括源IP、目的IP 等,進(jìn)行傳輸層TCP協(xié)議解析得到的網(wǎng)絡(luò)傳輸信息包括源端口號、目的端口號等。
[00巧]更進(jìn)一步,步驟3)通過下述方法實(shí)現(xiàn)對NFS、CIFS、HTTP、FTP協(xié)議的解析:
[00%] 1)NFS(化twork File System,網(wǎng)絡(luò)文件系統(tǒng))協(xié)議是一種C/S架構(gòu)的文件共享協(xié) 議,通過RPC(Remote Procedure Call,遠(yuǎn)程過程調(diào)用)報(bào)文進(jìn)行應(yīng)答,TCP重組后的數(shù)據(jù)報(bào) 文遵循RP巧良文格式,因此通過對RP巧良文進(jìn)行分析得到有效音頻數(shù)據(jù)。
[0027] 2)CIFS(Common Internet File System,通用Internet文件系統(tǒng))協(xié)議有通用的 報(bào)文格式,W'〇xFF' 'S' 'M' 'B'作為引導(dǎo)字符。上傳文件使用寫命令SMB_COM_WRnE_ANDX, 下載文件使用讀命令SMB_COM_READ_ANDX。每次讀寫請求所能傳輸?shù)淖畲箝y值為一個(gè)確定 值,如32768字節(jié)。因此需要先分多次進(jìn)行數(shù)據(jù)報(bào)文解析,W偏移量Off set標(biāo)注,然后進(jìn)行組 裝。
[0028] 3)HTTP協(xié)議化ypedext Transfer Protocol,超文本傳輸協(xié)議)存在很多種應(yīng)用 報(bào)文類型,此處主要關(guān)注下載與上傳文件報(bào)文。下載文件使