本發(fā)明屬于風(fēng)電場數(shù)據(jù)監(jiān)測,具體涉及一種基于高維空間異常辨識的風(fēng)電場數(shù)據(jù)質(zhì)量評估方法。
背景技術(shù):
1、隨著能源結(jié)構(gòu)的轉(zhuǎn)型升級,我國風(fēng)電裝機(jī)容量快速增長,大型風(fēng)電場普遍安裝了scada系統(tǒng)監(jiān)測風(fēng)機(jī)狀態(tài),但惡劣環(huán)境會導(dǎo)致采集數(shù)據(jù)質(zhì)量下降,因此準(zhǔn)確識別和處理風(fēng)電場監(jiān)測數(shù)據(jù)中的異常數(shù)據(jù)至關(guān)重要。在傳統(tǒng)研究方法中,異常點(diǎn)與偽異常點(diǎn)都被歸為廣義的異常數(shù)據(jù),經(jīng)過算法處理后兩類數(shù)據(jù)點(diǎn)都將被剔除。這會使得研究人員無法區(qū)分是何種原因?qū)е碌谋O(jiān)測數(shù)據(jù)異常,不能夠有針對性地解決風(fēng)電場遇到的問題,風(fēng)電場的運(yùn)行效率和經(jīng)濟(jì)效益無法進(jìn)一步提高。因此,有必要提出一種基于高維空間聚類的風(fēng)電場異常監(jiān)測數(shù)據(jù)及其成因識別方法,在避免偽異常點(diǎn)干擾的情況下,準(zhǔn)確識別出異常數(shù)據(jù),以確保風(fēng)機(jī)安全、高效運(yùn)行。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是為了解決現(xiàn)有異常點(diǎn)識別方法無法區(qū)分異常點(diǎn)類型,導(dǎo)致風(fēng)電場的運(yùn)行效率和經(jīng)濟(jì)效益低的問題,提出了一種基于高維空間異常辨識的風(fēng)電場數(shù)據(jù)質(zhì)量評估方法。
2、本發(fā)明的技術(shù)方案為:一種基于高維空間異常辨識的風(fēng)電場數(shù)據(jù)質(zhì)量評估方法,包括以下步驟:
3、s1.根據(jù)scada系統(tǒng)監(jiān)測的風(fēng)電場多維參數(shù)構(gòu)建高維空間;
4、s2.利用spearman相關(guān)性分析方法對風(fēng)電場多維參數(shù)進(jìn)行關(guān)聯(lián)分析,得到相關(guān)性分析結(jié)果;
5、s3.根據(jù)相關(guān)性分析結(jié)果,判斷風(fēng)電場多維參數(shù)的組合為弱相關(guān)性參數(shù)組合還是強(qiáng)相關(guān)性參數(shù)組合,若為強(qiáng)相關(guān)性參數(shù)組合,執(zhí)行步驟s4;若為弱相關(guān)性參數(shù)組合,執(zhí)行步驟s6;
6、s4.對強(qiáng)相關(guān)性參數(shù)組合,在高維空間中構(gòu)建基于關(guān)聯(lián)分析的三維子空間;
7、s5.基于自適應(yīng)聚類分析方法,在三維子空間中識別風(fēng)電場異常數(shù)據(jù),得到第一異常數(shù)據(jù)集合,并執(zhí)行步驟s7;
8、s6.對弱相關(guān)性參數(shù)組合,計(jì)算弱相關(guān)性參數(shù)對應(yīng)時間序列下的歐氏距離,得到第二異常數(shù)據(jù)集合,并執(zhí)行步驟s7;
9、s7.對異常數(shù)據(jù)集合進(jìn)行異常原因識別,并輸出異常數(shù)據(jù)集合及其對應(yīng)異常成因,完成風(fēng)電場數(shù)據(jù)質(zhì)量評估。
10、本發(fā)明的有益效果是:
11、1、本發(fā)明基于多維參數(shù)間的關(guān)聯(lián)關(guān)系,在高維空間中構(gòu)建子空間進(jìn)行多次聚類處理,高效利用scada系統(tǒng)采集的監(jiān)測參數(shù)數(shù)據(jù),提高了異常數(shù)據(jù)識別的準(zhǔn)確性,增強(qiáng)了風(fēng)電場情況把握的全面性。
12、2、本發(fā)明在識別異常數(shù)據(jù)的過程中,能夠準(zhǔn)確識別出因通訊故障、測量設(shè)備故障導(dǎo)致的異常點(diǎn),同時避免了偽異常點(diǎn)的影響。不同于傳統(tǒng)方法將兩類異常點(diǎn)一起剔除,本發(fā)明方法能有效區(qū)分異常數(shù)據(jù)點(diǎn)產(chǎn)生原因,為運(yùn)維人員提供風(fēng)電場運(yùn)行狀態(tài)的有效參考。
13、作為優(yōu)選,步驟s1中所述高維空間的表述公式為:
14、
15、其中,xi表示i時刻下風(fēng)機(jī)狀態(tài)的高維空間坐標(biāo)點(diǎn),vi表示i時刻下的風(fēng)速,ti表示i時刻下的繞組溫度,ii表示i時刻下的繞組電流,pi表示i時刻下的功率,ni表示i時刻下的發(fā)電機(jī)轉(zhuǎn)速,oi表示i時刻下的齒輪箱油溫,n表示scada系統(tǒng)采集數(shù)據(jù)的時刻數(shù),s表示整個采集時段中所有時刻構(gòu)建的高維空間。
16、上述優(yōu)選方案的有益效果是:
17、scada系統(tǒng)監(jiān)測的風(fēng)電場多維參數(shù)共同反映了一個風(fēng)電場的整體狀態(tài),基于scada系統(tǒng)監(jiān)測的風(fēng)電場多維參數(shù)構(gòu)建高維空間,可以更好地把握風(fēng)電場情況,及時發(fā)現(xiàn)其中存在的異常問題。
18、作為優(yōu)選,所述步驟s2具體包括以下分步驟:
19、s21.將風(fēng)電場多維參數(shù)的數(shù)據(jù)按照大小排序,并為每個數(shù)值分配相應(yīng)的秩次;
20、s22.對各風(fēng)電場多維參數(shù)組合中對應(yīng)的數(shù)據(jù)點(diǎn),計(jì)算兩個參數(shù)的秩次差;
21、s23.根據(jù)秩次差計(jì)算得到spearman相關(guān)系數(shù)rs;
22、s24.通過假設(shè)檢驗(yàn)對spearman相關(guān)系數(shù)rs進(jìn)行分析解釋,得到相關(guān)性分析結(jié)果。
23、作為優(yōu)選,步驟s23中所述spearman相關(guān)系數(shù)的計(jì)算公式為:
24、
25、其中,x和y表示兩個待分析的數(shù)據(jù)變量,xl表示數(shù)據(jù)變量x中的第l個值,yl表示數(shù)據(jù)變量y中的第l個值,r(xl)表示xl在x中的大小排名,r(yl)表示yl在y中的大小排名,表示x名次均值,表示y名次均值,m表示數(shù)據(jù)對個數(shù),dl表示第l個數(shù)據(jù)對的秩次差。
26、上述優(yōu)選方案的有益效果是:
27、通過spearman相關(guān)性分析方法對風(fēng)電場多維參數(shù)進(jìn)行關(guān)聯(lián)分析,能夠準(zhǔn)確衡量風(fēng)電場不同維度參數(shù)之間的單調(diào)關(guān)系,并且不易受異常值的影響,有助于三維子空間的構(gòu)建。
28、作為優(yōu)選,步驟s3中所述強(qiáng)相關(guān)性參數(shù)組合為spearman相關(guān)系數(shù)rs≥0.9的參數(shù)組合;所述弱相關(guān)性參數(shù)組合為spearman相關(guān)系數(shù)rs<0.9的參數(shù)組合。
29、上述優(yōu)選方案的有益效果是:
30、基于spearman相關(guān)系數(shù)劃分將參數(shù)組合分為強(qiáng)相關(guān)性參數(shù)組合和弱相關(guān)性參數(shù)組合,能夠準(zhǔn)確識別異常數(shù)據(jù)的成因。
31、作為優(yōu)選,步驟s4中所述三維子空間的表述公式為:
32、
33、其中,yi表示i時刻下風(fēng)機(jī)狀態(tài)的子空間坐標(biāo)點(diǎn),vi表示i時刻下的風(fēng)速,ei表示i時刻下的電氣參數(shù),ci表示i時刻下的物理參數(shù),n表示scada系統(tǒng)采集數(shù)據(jù)的時刻數(shù),s表示整個采集時段中所有時刻構(gòu)建的子空間。
34、作為優(yōu)選,所述步驟s5具體包括以下分步驟:
35、s51.在三維子空間中,根據(jù)強(qiáng)相關(guān)性參數(shù)組合的總樣本數(shù)量及數(shù)據(jù)范圍設(shè)置p個半徑r和q個最小樣本數(shù)min_sample取值,將兩組參數(shù)進(jìn)行全組合操作,得到完整的聚類參數(shù)組合;
36、s52.將聚類參數(shù)組合依次輸入到dbscan算法中進(jìn)行聚類,并在計(jì)算異常數(shù)據(jù)識別準(zhǔn)確率,根據(jù)最高的準(zhǔn)確率數(shù)值找到全局最優(yōu)參數(shù)組合;
37、s53.根據(jù)全局最優(yōu)參數(shù)組合,得到自適應(yīng)dbscan聚類算法;
38、s54.通過自適應(yīng)dbscan聚類算法,識別三維子空間內(nèi)的數(shù)據(jù)點(diǎn),得到第一異常數(shù)據(jù)集合。
39、作為優(yōu)選,步驟s52中所述dbscan算法包括以下步驟:
40、a1.隨機(jī)選擇一個未被訪問的數(shù)據(jù)點(diǎn)作為起始點(diǎn),計(jì)算其鄰域內(nèi)的所有數(shù)據(jù)點(diǎn),若鄰域內(nèi)的數(shù)據(jù)點(diǎn)數(shù)量大于等于最小樣本點(diǎn)數(shù)min_sample,則該點(diǎn)被標(biāo)記為核心點(diǎn),并將其鄰域內(nèi)的數(shù)據(jù)點(diǎn)添加到同一簇m中,若鄰域內(nèi)的數(shù)據(jù)點(diǎn)數(shù)量小于最小樣本點(diǎn)數(shù)min_sample,但其鄰域內(nèi)存在核心點(diǎn),則將該點(diǎn)標(biāo)記為邊界點(diǎn),若鄰域內(nèi)不存在核心點(diǎn),則將該點(diǎn)標(biāo)記為噪聲點(diǎn);
41、a2.對待加入簇m的數(shù)據(jù)點(diǎn)進(jìn)行密度可達(dá)性查詢,將滿足條件的數(shù)據(jù)點(diǎn)加入簇m中,直到無法再找到新的核心點(diǎn),并執(zhí)行步驟a3;
42、a3.以下一個未被訪問的數(shù)據(jù)點(diǎn)作為新的核心點(diǎn),若某個數(shù)據(jù)點(diǎn)既不是核心點(diǎn)也不是邊界點(diǎn),則將其標(biāo)記為噪聲點(diǎn),并執(zhí)行步驟a4;
43、a4.重復(fù)步驟a1至步驟a3,直至所有數(shù)據(jù)點(diǎn)都被訪問過,且每個數(shù)據(jù)點(diǎn)都被分配到某一個簇中或被標(biāo)記為噪聲點(diǎn)為止。
44、上述優(yōu)選方案的有益效果是:
45、上述優(yōu)選方案在識別異常數(shù)據(jù)的過程中,采用自適應(yīng)算法設(shè)置半徑、最小樣本數(shù)等dbscan聚類的關(guān)鍵參數(shù),避免了主觀設(shè)置的隨機(jī)參數(shù)對異常數(shù)據(jù)識別效果的影響,克服了人工干預(yù)的缺點(diǎn)。
46、作為優(yōu)選,所述步驟s6中得到第二異常數(shù)據(jù)集合的具體方法為:對弱相關(guān)性參數(shù)組合,逐點(diǎn)計(jì)算兩個參數(shù)對應(yīng)時間序列下的歐氏距離,繪制得到兩個參數(shù)間歐氏距離隨時間變化的曲線;篩選出曲線中數(shù)據(jù)突變?yōu)?或曲線中存在恒定不變的一段對應(yīng)的數(shù)據(jù),得到第二異常數(shù)據(jù)集合。
47、上述優(yōu)選方案的有益效果是:
48、對弱相關(guān)性參數(shù)組合,通過計(jì)算兩個參數(shù)之間的歐氏距離,并繪制歐氏距離隨時間變化的曲線,能夠直觀有效的識別出異常數(shù)據(jù)。
49、作為優(yōu)選,所述步驟s7中,第一異常數(shù)據(jù)集合的異常成因?yàn)椋簻y量裝置故障;第二異常數(shù)據(jù)集合的異常成因?yàn)椋和ㄓ嵲O(shè)備故障。