本發(fā)明涉及網(wǎng)絡(luò)安全,尤其涉及一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法。
背景技術(shù):
1、現(xiàn)代電力系統(tǒng)在數(shù)字化、智能化和電氣化的深度融合過程中,面臨著多重網(wǎng)絡(luò)安全挑戰(zhàn),包括應(yīng)對高級持續(xù)性威脅攻擊者極為豐富的攻擊工具和技術(shù)手段,這些工具可能包括自定義惡意軟件、零日漏洞利用、精心設(shè)計(jì)的后門程序等直接影響電力的生產(chǎn)、傳輸和分配。傳統(tǒng)的被動(dòng)防御措施如防火墻、入侵檢測系統(tǒng)等難以完全應(yīng)對,為此安全專家提出了蜜罐這種主動(dòng)防御策略。
2、蜜罐通過模擬真實(shí)系統(tǒng)的漏洞和資源,吸引攻擊者的注意,進(jìn)而監(jiān)控攻擊行為、分析攻擊手段、獲取攻擊模式,從而增強(qiáng)對潛在威脅的洞察能力,提升網(wǎng)絡(luò)防御的有效性。蜜罐的主要目的不是直接保護(hù)系統(tǒng),而是間接地欺騙攻擊者攻擊仿真系統(tǒng),并提前采取相應(yīng)的防御措施,避免對真實(shí)系統(tǒng)造成安全威脅。蜜陣是由多個(gè)蜜罐組成的網(wǎng)絡(luò),通過模擬一個(gè)更為復(fù)雜、分布式的情景式仿真環(huán)境,以吸引和迷惑更高級的攻擊者。蜜陣不是多個(gè)蜜罐的簡單組合,它需要協(xié)調(diào)多個(gè)蜜罐,創(chuàng)建一個(gè)完整的虛擬網(wǎng)絡(luò)環(huán)境,以更全面地分析攻擊者的行為和意圖。電力系統(tǒng)中信息繁雜,網(wǎng)絡(luò)接口眾多且難以定位和溯源,攻擊者通過長時(shí)間收集攻擊目標(biāo)的詳細(xì)信息定制或使用專門的網(wǎng)絡(luò)武器,進(jìn)行針對性的精準(zhǔn)攻擊。傳統(tǒng)的蜜陣靜態(tài)部署方法由于信息采集和動(dòng)態(tài)變化能力不足,無法捕捉到攻擊者復(fù)雜的行為和策略。
3、因此,本發(fā)明亟需提供一種方案改善上述問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,能夠解決傳統(tǒng)的蜜陣靜態(tài)部署方法信息采集能力和動(dòng)態(tài)變化不足,難以有效抵御電力系統(tǒng)受到的安全攻擊的問題。
2、本發(fā)明提供的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,包括以下步驟:
3、s1、在電力系統(tǒng)中部署由多個(gè)蜜罐組成的蜜陣;
4、s2、基于消息傳遞神經(jīng)網(wǎng)絡(luò)獲取并聚合每一個(gè)蜜罐的局部領(lǐng)域信息;
5、s3、將聚合后的信息與當(dāng)前蜜罐的狀態(tài)信息結(jié)合,提取蜜罐的特征表示;
6、s4、當(dāng)特征表示異常時(shí)將對電力系統(tǒng)進(jìn)行攻擊的攻擊者重定向到仿真電力系統(tǒng)中;
7、s5、根據(jù)深度確定性策略梯度算法模型基于所述特征表示更新蜜罐配置;
8、s6、更新蜜罐配置后得到一組算法樣本數(shù)據(jù),將所述樣本數(shù)據(jù)存入經(jīng)驗(yàn)回放池中,基于經(jīng)驗(yàn)回放池更新深度確定性策略梯度算法模型的參數(shù);
9、s7、重復(fù)步驟s2-s6不斷更新蜜罐的配置,實(shí)現(xiàn)動(dòng)態(tài)部署蜜陣。
10、本發(fā)明提供的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,基于消息傳遞神經(jīng)網(wǎng)絡(luò)與攻擊者進(jìn)行智能化交互提高安全威脅感知能力,并根據(jù)深度確定性策略梯度算法建立蜜陣動(dòng)態(tài)部署機(jī)制增強(qiáng)仿真系統(tǒng)的欺騙性,從而提升網(wǎng)絡(luò)防御系統(tǒng)的智能化水平和整體防御能力。
11、可選地,在電力系統(tǒng)中部署由多個(gè)蜜罐組成的蜜陣,所述蜜陣由節(jié)點(diǎn)和邊構(gòu)成,蜜陣中的每一個(gè)蜜罐代表一個(gè)節(jié)點(diǎn),兩個(gè)蜜罐之間的路徑代表一條邊。
12、可選地,基于消息傳遞神經(jīng)網(wǎng)絡(luò)獲取并聚合每一個(gè)蜜罐的局部鄰域信息時(shí),所述局部領(lǐng)域信息包括蜜罐收集的實(shí)時(shí)攻擊者行為數(shù)據(jù)日志文件和攻擊者進(jìn)入蜜罐攻擊路徑上的流量特征。
13、可選地,基于消息傳遞神經(jīng)網(wǎng)絡(luò)獲取并聚合每一個(gè)蜜罐的局部鄰域信息時(shí),在消息獲取階段重復(fù)次,在每次迭代過程中,通過消息函數(shù)來完成局部鄰域信息的更新,公式定義如下:,
14、其中,是節(jié)點(diǎn)在輪的迭代信息,?是更新函數(shù),為當(dāng)前節(jié)點(diǎn)在的隱藏狀態(tài)信息,?為鄰居節(jié)點(diǎn)在的隱藏狀態(tài)信息,?為鄰居節(jié)點(diǎn)集合。
15、可選地,基于消息傳遞神經(jīng)網(wǎng)絡(luò)獲取并聚合每一個(gè)蜜罐的局部鄰域信息時(shí),通過聚合函數(shù)聚合所獲取的局部鄰域信息,定義公式如下,,
16、其中,是節(jié)點(diǎn)在輪的迭代聚合信息。
17、可選地,當(dāng)特征表示異常時(shí)將對電力系統(tǒng)進(jìn)行攻擊的攻擊者重定向到仿真電力系統(tǒng)中,所述仿真電力系統(tǒng)由專門的蜜罐設(shè)備模擬真實(shí)系統(tǒng)服務(wù)、模擬管理賬號、虛擬化文件系統(tǒng)構(gòu)成。
18、可選地,根據(jù)深度確定性策略梯度算法模型基于所述特征表示更新蜜罐配置時(shí),將深度確定性策略梯度算法模型中的價(jià)值網(wǎng)絡(luò)模型的狀態(tài)空間定義為,
19、,
20、其中,;表示狀態(tài)空間,表示當(dāng)前時(shí)刻狀態(tài)空間的信息,、、分別表示當(dāng)前時(shí)刻蜜罐的內(nèi)網(wǎng)地址、網(wǎng)絡(luò)端口、系統(tǒng)服務(wù)id,表示當(dāng)前時(shí)刻行為攻擊模式類型,、、、分別表示當(dāng)前時(shí)刻網(wǎng)絡(luò)環(huán)境信息的吞吐量、往返時(shí)延、脈沖信號強(qiáng)度以及攻擊頻率。
21、可選地,根據(jù)深度確定性策略梯度算法模型基于所述特征表示更新蜜罐配置時(shí),將深度確定性策略梯度算法模型中的策略網(wǎng)絡(luò)模型的動(dòng)作向量定義為,其中,
22、,
23、表示動(dòng)作向量矩陣,表示更改蜜罐的ip地址,表示調(diào)整開放端口,為指示函數(shù),當(dāng)為1,表示當(dāng)前系統(tǒng)服務(wù)id被選中,開啟服務(wù)否則關(guān)閉當(dāng)前服務(wù)。
24、可選地,根據(jù)深度確定性策略梯度算法模型基于所述特征表示更新蜜罐配置時(shí),將深度確定性策略梯度算法模型中的獎(jiǎng)勵(lì)定義為,
25、,
26、其中,表示當(dāng)前時(shí)刻t攻擊者被引誘進(jìn)蜜罐并進(jìn)行交互的獎(jiǎng)勵(lì)值;表示當(dāng)前時(shí)刻t攻擊者在蜜罐中持續(xù)活動(dòng),?,?為持續(xù)交互時(shí)間,為動(dòng)態(tài)調(diào)節(jié)參數(shù),?,為當(dāng)前時(shí)刻t無效蜜罐數(shù)量,?為無效蜜罐的持續(xù)時(shí)間,、、分別是、、的權(quán)重系數(shù),三者相加和為1。
27、可選地,基于經(jīng)驗(yàn)回放池更新深度確定性策略梯度算法模型的參數(shù)時(shí),使用最小化均方誤差的算法更新價(jià)值網(wǎng)絡(luò)模型參數(shù),基于策略梯度法更新策略網(wǎng)絡(luò)模型參數(shù),基于軟更新算法更新目標(biāo)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)權(quán)重。
1.一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,在電力系統(tǒng)中部署由多個(gè)蜜罐組成的蜜陣,所述蜜陣由節(jié)點(diǎn)和邊構(gòu)成,蜜陣中的每一個(gè)蜜罐代表一個(gè)節(jié)點(diǎn),兩個(gè)蜜罐之間的路徑代表一條邊。
3.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,基于消息傳遞神經(jīng)網(wǎng)絡(luò)獲取并聚合每一個(gè)蜜罐的局部鄰域信息時(shí),所述局部領(lǐng)域信息包括蜜罐收集的實(shí)時(shí)攻擊者行為數(shù)據(jù)日志文件和攻擊者進(jìn)入蜜罐攻擊路徑上的流量特征。
4.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,基于消息傳遞神經(jīng)網(wǎng)絡(luò)獲取并聚合每一個(gè)蜜罐的局部鄰域信息時(shí),在消息獲取階段重復(fù)次,在每次迭代過程中,通過消息函數(shù)來完成局部鄰域信息的更新,公式定義如下:,其中,是節(jié)點(diǎn)在輪的迭代信息,?是更新函數(shù),為當(dāng)前節(jié)點(diǎn)在的隱藏狀態(tài)信息,為鄰居節(jié)點(diǎn)在的隱藏狀態(tài)信息,?為鄰居節(jié)點(diǎn)集合。
5.根據(jù)權(quán)利要求4所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,基于消息傳遞神經(jīng)網(wǎng)絡(luò)獲取并聚合每一個(gè)蜜罐的局部鄰域信息時(shí),通過聚合函數(shù)聚合所獲取的局部鄰域信息,定義公式如下,,其中,是節(jié)點(diǎn)在輪的迭代聚合信息。
6.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,當(dāng)特征表示異常時(shí)將對電力系統(tǒng)進(jìn)行攻擊的攻擊者重定向到仿真電力系統(tǒng)中,所述仿真電力系統(tǒng)由專門的蜜罐設(shè)備模擬真實(shí)系統(tǒng)服務(wù)、模擬管理賬號、虛擬化文件系統(tǒng)構(gòu)成。
7.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,根據(jù)深度確定性策略梯度算法模型基于所述特征表示更新蜜罐配置時(shí),將深度確定性策略梯度算法模型中的價(jià)值網(wǎng)絡(luò)模型的狀態(tài)空間定義為,
8.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,根據(jù)深度確定性策略梯度算法模型基于所述特征表示更新蜜罐配置時(shí),將深度確定性策略梯度算法模型中的策略網(wǎng)絡(luò)模型的動(dòng)作向量定義為,其中,
9.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,根據(jù)深度確定性策略梯度算法模型基于所述特征表示更新蜜罐配置時(shí),將深度確定性策略梯度算法模型中的獎(jiǎng)勵(lì)定義為,
10.根據(jù)權(quán)利要求1所述的一種基于學(xué)習(xí)感知的電力系統(tǒng)蜜陣動(dòng)態(tài)部署防御方法,其特征在于,基于經(jīng)驗(yàn)回放池更新深度確定性策略梯度算法模型的參數(shù)時(shí),使用最小化均方誤差的算法更新價(jià)值網(wǎng)絡(luò)模型參數(shù),基于策略梯度法更新策略網(wǎng)絡(luò)模型參數(shù),基于軟更新算法更新目標(biāo)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)權(quán)重。