本發(fā)明涉及一種通信時序數(shù)據(jù)異常檢測方法,尤其涉及一種基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法。
背景技術(shù):
1、在航空通信領(lǐng)域,會產(chǎn)生大量的通信時序數(shù)據(jù),而針對時序數(shù)據(jù)的異常檢測,則是保障航空安全的一個重要技術(shù)手段。通過對時序數(shù)據(jù)的異常檢測,可以實時發(fā)現(xiàn)異常,發(fā)出預(yù)警。傳統(tǒng)的異常檢測技術(shù)主要基于規(guī)則和閾值來識別異常情況,例如,當(dāng)飛機的速度、高度或航向突破預(yù)設(shè)的安全參數(shù)時,系統(tǒng)會發(fā)出警報。這種傳統(tǒng)的檢測技術(shù)不能使用現(xiàn)在快速積累的大量數(shù)據(jù)和復(fù)雜環(huán)境。
2、隨著技術(shù)的發(fā)展,人們開始使用機器學(xué)習(xí)的方法進行時序數(shù)據(jù)的異常檢測,如中國專利文獻號cn117932519a公開了一種新能源汽車充電站監(jiān)控系統(tǒng)中提到的,安全預(yù)警模塊結(jié)合支持向量機、決策樹和孤立森林算法,提升系統(tǒng)安全性。定價優(yōu)化方面,利用arima模型和q學(xué)習(xí)算法根據(jù)電網(wǎng)負荷和用戶需求調(diào)整充電價格,提高公平性和市場響應(yīng)。但是基于挖掘算法的計算,不能對長序列的數(shù)據(jù)進行處理,序列長度受到了限制。
3、隨著深度學(xué)習(xí)技術(shù)的發(fā)展,人們開始嘗試使用神經(jīng)網(wǎng)絡(luò)的方法進行異常檢測,如中國專利文獻號cn117909178a公開了一種基于lstm的集成式在線日志異常檢測模型中的方法,將深度學(xué)習(xí)模型lstm作為弱學(xué)習(xí)器模型,通過遷移學(xué)習(xí)的方式訓(xùn)練得到弱學(xué)習(xí)器,可以更好地學(xué)習(xí)日志的數(shù)據(jù)特征。再將弱學(xué)習(xí)器集成為強學(xué)習(xí)器對將要到來的日志進行實時異常檢測。這種模型對長序列數(shù)據(jù)有了比較好的適應(yīng)。但是lstm的架構(gòu)沒有考慮到時間趨勢,如arima模型中的時間趨勢、數(shù)據(jù)特征、周期特征等三個方面的特征,沒法添加到lstm架構(gòu)中。
技術(shù)實現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是提供一種基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,能夠結(jié)合深度學(xué)習(xí)和傳統(tǒng)數(shù)據(jù)挖掘模型,融合距離計算,可以根據(jù)實際情況進行動態(tài)調(diào)整,以達到精確的異常檢測效果。
2、本發(fā)明為解決上述技術(shù)問題而采用的技術(shù)方案是提供一種基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,包括如下步驟:s1)對原始時序數(shù)據(jù)和一階差分時序數(shù)據(jù)分別進行建模預(yù)測,一階差分的預(yù)測結(jié)果作為原始時序數(shù)據(jù)預(yù)測結(jié)果的修正因子;s2)修改原始transformer架構(gòu)中位置編碼相加的策略,在相對時間編碼中引入1+半衰期算法的指數(shù)衰減策略,把絕對時間編碼和相對時間編碼相乘來融合時間編碼特征;s3)利用dtw來計算transformer端到端預(yù)測出的時間序列數(shù)據(jù)和實際時序數(shù)據(jù)的距離。
3、進一步地,所述步驟s1把時序數(shù)據(jù)和一階插值作為序列數(shù)據(jù),分別輸入到transformer框架中去除時序數(shù)據(jù)中的趨勢特征,提取出時序數(shù)據(jù)的本質(zhì)特征;時序數(shù)據(jù)的一階差分為:
4、δyt=y(tǒng)t-yt-1;
5、δyt表示在時間t的一階差分值。
6、進一步地,所述步驟s2將transformer中原始的位置編碼修改為時間編碼,所述時間編碼分為絕對時間編碼和相對時間編碼;
7、對于每個時間步t,絕對時間編碼計算如下:
8、te(t,2i)=sin(t/100002i/d)
9、te(t,2i+1)=cos(t/100002i/d)
10、其中d是模型的維度,i是維度的索引;
11、對于每個時間步t,相對時間編碼計算如下:
12、
13、其中λ是衰減常數(shù),i是維度的索引。
14、進一步地,k為測試半衰期的時刻點。
15、進一步地,k的取值為250-350。
16、進一步地,k的取值為300。
17、進一步地,假設(shè)有兩個時間序列a和b,長度分別為m和n,所述步驟s3包括:s31)初始化距離矩陣:創(chuàng)建一個大小為(m+1)×(n+1)的矩陣d,其中d[i][j]表示序列a的前i個元素和序列b的前j個元素之間的最小累計距離;初始化d[0][0]=0,其他d[i][0]和d[0][j]為無窮大;s32)計算每個元素的累計距離:對于i從1到m,j從1到n,按照以下方式填充矩陣:d[i][j]=cos?t(a[i],b[j])+min(d[i-1][j],d[i][j-1],d[i-1][j-1])其中,cost(a[i],b[j])是a[i]和b[j]之間的歐式距離;s33)尋找最佳路徑:累計距離d[m][n]是從a[1]到a[m]和從b[1]到b[n]的最小累計距離。
18、本發(fā)明對比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明提供的基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,采用transformer架構(gòu)做端到端的預(yù)測,來預(yù)測下一個信號值,然后根據(jù)dtw距離計算,結(jié)合預(yù)測值與真實值之間的差異。該方法不但可以根據(jù)嵌入到高維空間的距離計算,也結(jié)合了現(xiàn)實空間的低維距離特征;融合距離計算,設(shè)置動態(tài)閾值,動態(tài)調(diào)整以達到精確的異常檢測效果。此外,本發(fā)明在transformer的架構(gòu)中引入了時間編碼的相關(guān)技術(shù),從而考慮到信息周期性和長距離的信息衰減性。
1.一種基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,其特征在于,包括如下步驟:
2.如權(quán)利要求1所述的基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,其特征在于,所述步驟s1把時序數(shù)據(jù)和一階插值作為序列數(shù)據(jù),分別輸入到transformer框架中去除時序數(shù)據(jù)中的趨勢特征,提取出時序數(shù)據(jù)的本質(zhì)特征;時序數(shù)據(jù)的一階差分為:
3.如權(quán)利要求1所述的基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,其特征在于,所述步驟s2將transformer中原始的位置編碼修改為時間編碼,所述時間編碼分為絕對時間編碼和相對時間編碼;
4.如權(quán)利要求3所述的基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,其特征在于,k為測試半衰期的時刻點。
5.如權(quán)利要求4所述的基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,其特征在于,k的取值為250-350。
6.如權(quán)利要求5所述的基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,其特征在于,k的取值為300。
7.如權(quán)利要求1所述的基于transformer架構(gòu)的通信時序數(shù)據(jù)異常檢測方法,其特征在于,假設(shè)有兩個時間序列a和b,長度分別為m和n,所述步驟s3包括: