本發(fā)明涉及新型配電網(wǎng)異常檢測,尤其涉及一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測及替換方法及系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提供了與本發(fā)明相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
2、隨著光伏、電動汽車等新型源荷設備的高比例接入,新型配電網(wǎng)中已經(jīng)呈現(xiàn)出負荷多樣化和智能化趨勢,大量的電力電子設備加大了電網(wǎng)中電能流動的復雜性和隨機性,獲取可靠的電量數(shù)據(jù)是保證配電網(wǎng)透明化的重要環(huán)節(jié)。
3、配電網(wǎng)離線電量數(shù)據(jù)主要包括三相電壓、三相電流和功率數(shù)據(jù)等,當前配電網(wǎng)電量數(shù)據(jù)的質(zhì)量受到多方面因素的威脅。首先,部分新能源設備受到日照、天氣等因素的影響,電動汽車等設備的數(shù)據(jù)受到用戶使用習慣的影響,部分電器負荷受到季節(jié)影響,這些因素都會造成配電網(wǎng)中電量數(shù)據(jù)的偶然性增加。此外,大量的電量數(shù)據(jù)也會加大數(shù)據(jù)在采集、傳輸過程中的面臨的壓力,造成突變、缺失、長時間波動等異?,F(xiàn)象。因此,對于電量數(shù)據(jù)的異常檢測和替換,是電力系統(tǒng)中狀態(tài)估計和電力調(diào)度安排的重要功能之一,能夠保證對配電網(wǎng)運行狀態(tài)的準確辨識。
4、電力系統(tǒng)中,測量數(shù)據(jù)主要由測量值和測量誤差組成。異常數(shù)據(jù)指的是那些偏離正常測量范圍的數(shù)據(jù),可能由于測量設備故障或數(shù)據(jù)傳輸問題等多種原因產(chǎn)生。
5、基于均值、標準差等的傳統(tǒng)異常檢測方法,收到數(shù)據(jù)處理能力或效率的影響,往往會忽視冗余信息的重要性,集中于單一特征或簡單統(tǒng)計量。因此,基于統(tǒng)計分析的傳統(tǒng)異常檢測方法對于冗余信息的利用明顯不足,難以應對殘差污染、殘差淹沒等問題。
6、在數(shù)據(jù)的預測和替換方面,目前大多采用諸如拉格朗日插值替換、樣條插值法等的差值方法,但是這些方法計算量大,對于內(nèi)存的要求較高,計算速度較慢。
7、現(xiàn)有技術(shù)也公開了采用機器學習的方法(比如隨機森林和支持向量機等)對電量數(shù)據(jù)進行預測,然后對異常數(shù)據(jù)進行替換;但是,采用隨機森林的方法不適用于數(shù)據(jù)較多的情況,采用支持向量機的方法也存在著超參數(shù)確定難、易出現(xiàn)欠擬合或過擬合等的通?。粚е聦?shù)據(jù)的泛化能力差,預測精度不足。
技術(shù)實現(xiàn)思路
1、為了解決上述問題,本發(fā)明提出了一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測及替換方法及系統(tǒng),采用改進極限梯度提升算法(xgboost)的時序預測模型對區(qū)域用電量序列數(shù)據(jù)進行逐時刻預測,通過改進決策樹的確定過程,引入步長因子來改進目標函數(shù)的計算方法,避免了傳統(tǒng)方法在制定決策樹過程中的局限性,同時避免了過擬合現(xiàn)象。最后,基于預測和真實值的殘差利用密度聚類算法(dbscan)進行聚類,重構(gòu)了殘差數(shù)據(jù)輸入到聚類算法前的形式,檢測并替換出異常數(shù)據(jù)。
2、在一些實施方式中,采用如下技術(shù)方案:
3、一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測及替換方法,包括:
4、獲取歷史時間段配電網(wǎng)離線電量數(shù)據(jù)并進行預處理,預處理后的數(shù)據(jù)輸入至訓練好的數(shù)據(jù)時序預測模型,得到待測時間段內(nèi)各個時刻的配電網(wǎng)離線電量預測數(shù)據(jù);
5、獲取待測時間段的配電網(wǎng)離線電量真實數(shù)據(jù),計算每個時刻真實數(shù)據(jù)與預測數(shù)據(jù)的殘差項,對得到的殘差項進行聚類,識別出異常數(shù)據(jù)點;
6、利用對應時刻的電量預測數(shù)據(jù)對異常數(shù)據(jù)點進行替換;
7、其中,所述數(shù)據(jù)時序預測模型采用改進的xgboost算法構(gòu)建,所述改進的xgboost算法在決策樹的每一層之間引入了步長因子。
8、進一步地,所述配電網(wǎng)離線電量數(shù)據(jù)為電壓、電流或有功功率。
9、進一步地,所述改進的xgboost算法中每一顆決策樹的目標函數(shù)為損失函數(shù)和正則項的加和,在每次迭代中都進行正則化。
10、進一步地,所述改進的xgboost算法中每一顆決策樹的目標函數(shù)為以葉子節(jié)點數(shù)值wj為變量的二次函數(shù),對wj求取偏導后尋找目標函數(shù)極值,能夠得到最簡后的目標函數(shù)和對應的最佳權(quán)重形成權(quán)重向量w。
11、進一步地,每一顆決策樹最簡后的目標函數(shù)obj(t)*和最佳權(quán)重具體為:
12、
13、其中,gj和hj均為定值,t表示經(jīng)過經(jīng)過t次迭代后的樹的葉子節(jié)點數(shù)目,λ表示葉子節(jié)點數(shù)值的懲罰參數(shù)。
14、進一步地,以每三層為一個優(yōu)化單位,對每一層的收益進行加權(quán)求和,確定改進的xgboost算法中決策樹的分裂收益;
15、從樹的深度為0開始,不斷對葉子節(jié)點進行劃分,當達到k層時,若分裂收益滿足設定要求,則將此時的決策樹作為最佳決策樹,得到葉子節(jié)點個數(shù)t和葉子節(jié)點的數(shù)值。
16、進一步地,所述對得到的殘差項進行聚類,具體為:
17、利用dbscan聚類算法對殘差項r進行聚類分析,將這些數(shù)據(jù)劃分成若干個簇和離群點,這些簇就是由正常的殘差項數(shù)據(jù)所聚合而成,而被劃分成離群點的就是dbscan聚類算法所識別出的異常數(shù)據(jù)。
18、在另一些實施方式中,采用如下技術(shù)方案:
19、一種配電網(wǎng)離線電量數(shù)據(jù)的異常檢測及替換系統(tǒng),包括:
20、電量數(shù)據(jù)預測模塊,用于獲取歷史時間段配電網(wǎng)離線電量數(shù)據(jù)并進行預處理,預處理后的數(shù)據(jù)輸入至訓練好的數(shù)據(jù)時序預測模型,得到待測時間段內(nèi)各個時刻的配電網(wǎng)離線電量預測數(shù)據(jù);
21、異常數(shù)據(jù)識別模塊,用于獲取待測時間段的配電網(wǎng)離線電量真實數(shù)據(jù),計算每個時刻真實數(shù)據(jù)與預測數(shù)據(jù)的殘差項,對得到的殘差項進行聚類,識別出異常數(shù)據(jù)點;
22、異常數(shù)據(jù)替換模塊,用于利用對應時刻的電量預測數(shù)據(jù)對異常數(shù)據(jù)點進行替換;
23、其中,所述數(shù)據(jù)時序預測模型采用改進的xgboost算法構(gòu)建,所述改進的xgboost算法在決策樹的每一層之間引入了步長因子。
24、在另一些實施方式中,采用如下技術(shù)方案:
25、一種終端設備,其包括處理器和存儲器,處理器用于實現(xiàn)指令;存儲器用于存儲多條指令,所述指令適于由處理器加載并執(zhí)行上述的配電網(wǎng)離線電量數(shù)據(jù)的異常檢測及替換方法。
26、在另一些實施方式中,采用如下技術(shù)方案:
27、一種計算機可讀存儲介質(zhì),其中存儲有多條指令,所述指令適于由終端設備的處理器加載并執(zhí)行上述的配電網(wǎng)離線電量數(shù)據(jù)的異常檢測及替換方法。
28、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
29、(1)本發(fā)明基于前三個月訓練得到的預測模型,預測三個月后的時序數(shù)據(jù),構(gòu)成預測序列。利用每個時刻真實值和對應時刻的預測值相減,得到每個時刻的殘差項。利用改進dbscan聚類密度算法對真實值和預測值的殘差項進行聚類分析,檢測出異常值,然后將對應的預測值對異常值進行替換;本發(fā)明方法重塑了殘差數(shù)據(jù)的輸入形式,能夠有效檢測和替換出異常數(shù)據(jù)。
30、(2)本發(fā)明基于改進的xgboost算法構(gòu)建數(shù)據(jù)時序預測模型,改進的xgboost算法在決策樹的每一層之間引入了步長因子,避免了傳統(tǒng)方法在制定決策樹過程中的局限性,同時避免了過擬合現(xiàn)象;對損失函數(shù)進行二階泰勒展開,同時將決策樹函數(shù)f定義為關(guān)于葉子節(jié)點數(shù)值w的函數(shù),可以對目標函數(shù)進行簡化,減少計算量,可以適用于不同的誤差函數(shù),提高計算效率。
31、(3)本發(fā)明改進了對分裂收益的計算方式,以三層為一個單位,對于不同層的收益進行加權(quán)求和,確定分裂收益,避免因為偶然性導致的局部收益過大。
32、本發(fā)明的其他特征和附加方面的優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本方面的實踐了解到。