基于可信度的網(wǎng)絡(luò)惡意行為檢測(cè)方法與流程

文檔序號(hào)：12729791閱讀：712來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明屬于計(jì)算機(jī)防病毒技術(shù)領(lǐng)域。

背景技術(shù)：

網(wǎng)絡(luò)中惡意代碼數(shù)量在爆發(fā)式增長(zhǎng)，2015年AV-Test的統(tǒng)計(jì)數(shù)據(jù)顯示，平均每天新發(fā)現(xiàn)的惡意樣本數(shù)量已經(jīng)超過(guò)30萬(wàn)個(gè)。面對(duì)海量的惡意樣本，機(jī)器學(xué)習(xí)已經(jīng)成為惡意行為檢測(cè)領(lǐng)域的主流技術(shù)。但是，攻擊者為了躲避檢測(cè)，在不斷地升級(jí)惡意行為。目前機(jī)器學(xué)習(xí)模型存在退化問(wèn)題，固定的閾值在初始階段檢測(cè)率高，隨著攻擊行為躲避技術(shù)的改進(jìn)和變化，檢測(cè)率不斷的退化。所以需要一種不需要設(shè)定固定閾值的檢測(cè)方法，能夠根據(jù)用戶可接受的錯(cuò)誤概率，給出分析結(jié)果，應(yīng)對(duì)惡意行為的不斷變異。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明目的是解決現(xiàn)有技術(shù)中存在的檢測(cè)模型識(shí)別率隨時(shí)間快速退化的問(wèn)題，提供一種基于可信度的網(wǎng)絡(luò)惡意行為檢測(cè)方法。該方法在不需要設(shè)定固定閾值的情況下，根據(jù)用戶可接受的錯(cuò)誤概率，通過(guò)統(tǒng)計(jì)分析網(wǎng)絡(luò)行為的可信度，實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)惡意行為的檢測(cè)。

本發(fā)明的技術(shù)方案

基于可信度的網(wǎng)絡(luò)惡意行為檢測(cè)方法，包括如下步驟：

第1步、本發(fā)明涉及的一些基本概念：

(1)網(wǎng)絡(luò)惡意行為：本發(fā)明中的網(wǎng)絡(luò)惡意行為是指，以數(shù)據(jù)包為載體的，在未明確提示用戶或未經(jīng)用戶許可的情況下，通過(guò)網(wǎng)絡(luò)對(duì)用戶計(jì)算機(jī)或其他終端進(jìn)行的、侵犯用戶合法權(quán)益的惡意行為；大量的網(wǎng)絡(luò)惡意行為的集合為網(wǎng)絡(luò)惡意行為集合。

(2)不一致性度量函數(shù)：描述一個(gè)測(cè)試樣本與一組樣本的不一致性，輸入是一組樣本和一個(gè)測(cè)試樣本，輸出是一個(gè)數(shù)值，也叫做不一致性得分。不同測(cè)試樣本與同一組樣本的不一致性得分之間可以進(jìn)行比較。得分越高，說(shuō)明樣本與該組樣本越不一致，得分越低，說(shuō)明樣本與該組樣本越一致。

(3)統(tǒng)計(jì)量p-value：描述一個(gè)樣本的不一致性得分在一組樣本中的百分位，取值范圍在0到1之間，從統(tǒng)計(jì)的角度刻畫(huà)一個(gè)樣本與一組樣本的相似性。

第2步、網(wǎng)絡(luò)行為特征的提取

第2.1、確定網(wǎng)絡(luò)行為的表示粒度，其中包括：數(shù)據(jù)包級(jí)粒度，每個(gè)數(shù)據(jù)包表示一個(gè)網(wǎng)絡(luò)行為；NetFlow級(jí)粒度，一個(gè)網(wǎng)絡(luò)連接過(guò)程的所有網(wǎng)絡(luò)數(shù)據(jù)表示一個(gè)網(wǎng)絡(luò)行為；應(yīng)用級(jí)粒度，一個(gè)應(yīng)用過(guò)程的所有數(shù)據(jù)包表示一個(gè)網(wǎng)絡(luò)行為。

第2.2、選擇網(wǎng)絡(luò)行為的特征點(diǎn)f；根據(jù)不同的數(shù)據(jù)集，可以選擇不同的網(wǎng)絡(luò)行為特征點(diǎn)f，例如，與時(shí)間相關(guān)的特征點(diǎn)包括：時(shí)間戳、持續(xù)時(shí)間、間隔時(shí)間、周期和頻率等；與體積相關(guān)的特征點(diǎn)包括：發(fā)送數(shù)據(jù)包數(shù)、接收數(shù)據(jù)包數(shù)、發(fā)送字節(jié)數(shù)、接收字節(jié)數(shù)和數(shù)據(jù)熵等；與協(xié)議相關(guān)的特征點(diǎn)包括：TCP、UDP、HTTP、DNS和SSH等；與拓?fù)浣Y(jié)構(gòu)相關(guān)的特征點(diǎn)包括：源IP地址、目的IP地址、源端口號(hào)、目的端口號(hào)、端口號(hào)的分布和端口號(hào)集合的熵等。

第2.3、提取特征點(diǎn)，將網(wǎng)絡(luò)行為抽象成特征向量V；在可選網(wǎng)絡(luò)行為特征點(diǎn)中，選擇n個(gè)特征點(diǎn)組成特征向量V(f₁,f₂,...f_n)，使用所選的n個(gè)特征點(diǎn)作為網(wǎng)絡(luò)行為的抽象表示，將二進(jìn)制的網(wǎng)絡(luò)數(shù)據(jù)映射成特征點(diǎn)組成的特征向量V(f₁,f₂,...f_n)；

第2.4、網(wǎng)絡(luò)惡意行為集合的特征矩陣表示；網(wǎng)絡(luò)惡意行為集合中包含了N個(gè)網(wǎng)絡(luò)惡意行為，每個(gè)網(wǎng)絡(luò)惡意行為都使用第2.3步中相同結(jié)構(gòu)的特征向量表示，結(jié)構(gòu)相同的特征向量組合成網(wǎng)絡(luò)惡意行為特征矩陣C；特征矩陣的每一列表示一個(gè)特征點(diǎn)、每一行表示一個(gè)網(wǎng)絡(luò)惡意行為的特征向量；

第3步、網(wǎng)絡(luò)行為與網(wǎng)絡(luò)惡意行為一致性度量

第3.1、確定不一致性度量函數(shù)A(V,C)；不一致性度量函數(shù)的輸入是網(wǎng)絡(luò)行為特征向量V和網(wǎng)絡(luò)惡意行為特征矩陣C，返回值是V與C的不一致得分s。不一致性度量函數(shù)A可以是任何可以表示不一致性的函數(shù)，例如常見(jiàn)的距離函數(shù)，計(jì)算特征向量V與網(wǎng)絡(luò)惡意行為特征矩陣C的距離作為不一致得分；

第3.2、計(jì)算網(wǎng)絡(luò)行為特征向量V和網(wǎng)絡(luò)惡意行為特征矩陣C中向量的不一致性得分；將被檢測(cè)的網(wǎng)絡(luò)行為特征向量V放入網(wǎng)絡(luò)惡意行為特征矩陣C中作為最后一個(gè)向量，組成新的特征矩陣C'；依次從C'中取出特征向量V_i，使用不一致性度量函數(shù)計(jì)算特征向量V_i與取出V_i后的特征矩陣的不一致性得分s_i(i＝1,2,……，n+1)；最后，所有的N+1個(gè)向量都計(jì)算出不一致性得分；

第3.3、計(jì)算網(wǎng)絡(luò)行為特征向量V相對(duì)于網(wǎng)絡(luò)惡意行為特征矩陣C的統(tǒng)計(jì)量p-value。在第3.2步的計(jì)算中，網(wǎng)絡(luò)行為特征向量V與網(wǎng)絡(luò)惡意行為特征矩陣C的不一致性得分為s_n+1。統(tǒng)計(jì)所有不一致性得分大于等于s_n+1的特征向量的個(gè)數(shù)，并除以總向量個(gè)數(shù)N+1，得到網(wǎng)絡(luò)行為特征向量V相對(duì)于網(wǎng)絡(luò)惡意行為特征矩陣C的統(tǒng)計(jì)量p-value；

第4步、基于可信度的網(wǎng)絡(luò)惡意行為檢測(cè)

第4.1、用戶給出可接受的可信度Conf；用戶只接受準(zhǔn)確率在Conf之上的檢測(cè)結(jié)果；

第4.2、計(jì)算可接受的最大錯(cuò)誤率1-Conf；

第4.3、如果網(wǎng)絡(luò)行為特征向量V的p-value大于等于1-Conf，則預(yù)測(cè)該網(wǎng)絡(luò)行為是網(wǎng)絡(luò)惡意行為，這一預(yù)測(cè)的可信度為Conf；否則，報(bào)告該網(wǎng)絡(luò)行為不是惡意行為。

本發(fā)明的優(yōu)點(diǎn)和積極效果：

本發(fā)明不需要設(shè)定固定的檢測(cè)閾值，用戶只需輸入可接受的檢測(cè)準(zhǔn)確率或者最高檢測(cè)錯(cuò)誤率。該方法可以根據(jù)惡意行為特征向量矩陣和被檢測(cè)網(wǎng)絡(luò)行為特征向量的統(tǒng)計(jì)規(guī)律，給出滿足用戶可信度的預(yù)測(cè)結(jié)果，可以有效緩解檢測(cè)模型的退化，更好的應(yīng)對(duì)網(wǎng)絡(luò)惡意行為的變異、演變。

【附圖說(shuō)明】

圖1基于可信度的網(wǎng)絡(luò)惡意行為檢測(cè)方法流程圖。

圖2是Rbot僵尸網(wǎng)絡(luò)的NetFlow級(jí)行為數(shù)據(jù)。

圖3是“持續(xù)時(shí)間平均值”特征。

圖4是“時(shí)間間隔平均值”特征。

圖5是“發(fā)送字節(jié)數(shù)平均值”特征。

圖6是“接收字節(jié)數(shù)平均值”特征。

圖7是“fft值”特征。

【具體實(shí)施方式】

本發(fā)明以檢測(cè)僵尸網(wǎng)絡(luò)為例進(jìn)行具體說(shuō)明。

1、網(wǎng)絡(luò)惡意行為

1.1公開(kāi)數(shù)據(jù)集CTU-13

(http://mcfp.weebly.com/the-ctu-13-dataset-a-labeled-dataset-with-botnet-normal-and-backgro und-traffic.html)共包含13個(gè)真實(shí)環(huán)境下所采集的數(shù)據(jù)，每一個(gè)監(jiān)控環(huán)境中執(zhí)行不同的惡意軟件。RBot家族的惡意軟件是目前最活躍的Bot程序軟件，可以造成IRC攻擊、DDos等多種惡意行為。本實(shí)驗(yàn)采用執(zhí)行Rbot僵尸網(wǎng)絡(luò)家族的惡意軟件、被感染主機(jī)數(shù)目為10的環(huán)境下所采集的20個(gè)網(wǎng)絡(luò)惡意行為的數(shù)據(jù)。

2、網(wǎng)絡(luò)行為特征的提取方法

2.1、從1.1中的網(wǎng)絡(luò)惡意行為中隨機(jī)選取一個(gè)作為網(wǎng)絡(luò)行為樣本S。S的具體數(shù)據(jù)如圖2所示。網(wǎng)絡(luò)行為的表示粒度為NetFlow級(jí)。

2.2、根據(jù)數(shù)據(jù)集，選擇五個(gè)不同的網(wǎng)絡(luò)行為特征點(diǎn)f，分別為持續(xù)時(shí)間平均值、時(shí)間間隔平均值、發(fā)送字節(jié)數(shù)平均值、接收字節(jié)數(shù)平均值和fft值。

2.3、提取選擇特征點(diǎn)，使用所選的5個(gè)選擇的網(wǎng)絡(luò)行為特征點(diǎn)作為網(wǎng)絡(luò)行為的抽象表示，將二進(jìn)制的網(wǎng)絡(luò)數(shù)據(jù)映射成特征點(diǎn)組成的特征向量V。經(jīng)計(jì)算，V(f₁,f₂,...f₅)＝(580.5,409.293106,58070449.67,0,105.6363636)。

2.4、其余19個(gè)網(wǎng)絡(luò)惡意行為構(gòu)成網(wǎng)絡(luò)惡意行為集合，個(gè)數(shù)N＝19。每個(gè)網(wǎng)絡(luò)惡意行為都使用第2.3步中相同結(jié)構(gòu)的特征向量表示，結(jié)構(gòu)相同的特征向量組合成特征矩陣C。經(jīng)計(jì)算，得到C＝

網(wǎng)絡(luò)惡意行為在五個(gè)特征上的分布情況如圖3～圖7所示。

3、網(wǎng)絡(luò)行為與網(wǎng)絡(luò)惡意行為一致性度量

3.1、選擇BotFinder(http://www.cs.ucsb.edu/～vigna//publications/2012_CoNEXT_BotFinder.pdf)的度量函數(shù)作為不一致性度量函數(shù)A(V,C)，將2.3中的網(wǎng)絡(luò)行為特征向量V和2.4中的網(wǎng)絡(luò)惡意行為特征矩陣C作為輸入。由于BotFinder計(jì)算的是向量與矩陣之間的相似程度，所以返回的不一致性得分s實(shí)際為相似性得分，得分越高，說(shuō)明越一致，得分越低，說(shuō)明越不一致。

3.2、計(jì)算網(wǎng)絡(luò)行為特征向量V和網(wǎng)絡(luò)惡意行為特征矩陣C中向量的不一致性得分；將被檢測(cè)的網(wǎng)絡(luò)行為特征向量V放入網(wǎng)絡(luò)惡意行為特征矩陣C中作為最后一個(gè)向量，組成新的特征矩陣C'，經(jīng)計(jì)算，C'＝

依次從C'中取出特征向量V_i，使用不一致性函數(shù)計(jì)算向量V_i與取出V_i后的特征矩陣的不一致性得分s_i(i＝1,2,……,20)。經(jīng)計(jì)算，(s₁,s₂,……s₂₀₎＝(1.3151,2.1346,1.3221,2.1347,1.8376,2.1346,1.3462,2.1345,1.3589,2.1346,1.3585,2.1346,1.3342,2.1346,1.3307,2.1346,1.8228,2.1346,1.1014,2.0066)。

3.3、計(jì)算網(wǎng)絡(luò)行為特征向量V相對(duì)于網(wǎng)絡(luò)惡意行為特征矩陣C的統(tǒng)計(jì)量p-value。在第3.2步的計(jì)算中，特征向量V與特征矩陣C的不一致性得分為s₂₀＝2.0066。由于BotFinder返回的是相似性得分，所以統(tǒng)計(jì)的是小于等于s₂₀的特征向量的個(gè)數(shù)，個(gè)數(shù)為10。除以總向量個(gè)數(shù)20，得到特征向量V相對(duì)于特征矩陣C的統(tǒng)計(jì)量p-value為0.5。

4、基于可信度的網(wǎng)絡(luò)惡意行為檢測(cè)

4.1、假設(shè)用戶給出可接受的可信度Conf為80％。

4.2、計(jì)算可接受的最大錯(cuò)誤率是＝1-Conf＝0.2.

4.3、因?yàn)榫W(wǎng)絡(luò)行為特征向量V的p-value大于等于4.2中1-Conf的值，所以預(yù)測(cè)該網(wǎng)絡(luò)行為是惡意網(wǎng)絡(luò)行為，這一預(yù)測(cè)的可信度為80％。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王志;田美琦;秦枚林;賈春福
技術(shù)所有人：南開(kāi)大學(xué);天津云安科技發(fā)展有限公司
我是此專利的發(fā)明人

上一篇：柏子養(yǎng)心丸的制作方法與工藝
上一篇：云視頻協(xié)作信令控方法與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

網(wǎng)絡(luò)信號(hào)的檢測(cè)方法相關(guān)技術(shù)

艾滋病檢測(cè)方法相關(guān)技術(shù)

dna甲基化檢測(cè)方法相關(guān)技術(shù)

成都空氣甲醛檢測(cè)方法相關(guān)技術(shù)

細(xì)胞增殖的檢測(cè)方法相關(guān)技術(shù)

甲醛檢測(cè)方法相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于可信度的網(wǎng)絡(luò)惡意行為檢測(cè)方法與流程