本發(fā)明涉及計(jì)算機(jī),更具體的說是涉及一種工業(yè)故障分類方法、系統(tǒng)、裝置及可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在現(xiàn)代工業(yè)中,信息化和大數(shù)據(jù)技術(shù)的迅速發(fā)展使得工業(yè)過程的監(jiān)測(cè)與管理越來越智能化和自動(dòng)化。然而,工業(yè)過程的復(fù)雜性和多樣性不可避免地會(huì)產(chǎn)生故障問題,依然是影響生產(chǎn)效率和質(zhì)量的關(guān)鍵因素之一。隨著傳感器技術(shù)的普及和數(shù)據(jù)采集能力的提升,企業(yè)能夠?qū)崟r(shí)獲取大量的運(yùn)行數(shù)據(jù)。這些數(shù)據(jù)中包含了豐富的故障信息,為故障檢測(cè)和分類提供了可能。然而,傳統(tǒng)的故障分類方法往往依賴于人工經(jīng)驗(yàn),難以適應(yīng)日益復(fù)雜的工業(yè)環(huán)境。此外,許多現(xiàn)有技術(shù)在處理高維數(shù)據(jù)時(shí)效率低下,導(dǎo)致響應(yīng)時(shí)間過長(zhǎng),無法滿足實(shí)時(shí)監(jiān)測(cè)的需求。
2、具體來說,傳統(tǒng)的故障分類方法主要依靠基于規(guī)則的方法,這種方法往往受限于專家知識(shí),因?yàn)槠湟?guī)則的指定需要專業(yè)背景,難以自動(dòng)化生成,并且在面臨新的故障模式或是環(huán)境變化時(shí),規(guī)則可能不再有效,需要不斷更新,增加維護(hù)成本。隨著工業(yè)過程中數(shù)據(jù)的不斷積累和新技術(shù)的不斷更迭,基于大數(shù)據(jù)分析和人工智能技術(shù)的方法變得越發(fā)成熟。通過在海量的工業(yè)數(shù)據(jù)中提取潛在的關(guān)聯(lián)性和規(guī)律,為故障分類提供了更加可靠的依據(jù)。然而在故障分類問題中,數(shù)據(jù)不平衡是十分嚴(yán)重的,故障數(shù)據(jù)量要遠(yuǎn)小于正常數(shù)據(jù)量,使得模型訓(xùn)練結(jié)果往往是次優(yōu)的。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)以上問題,本發(fā)明的目的在于提供一種工業(yè)故障分類方法、系統(tǒng)、裝置及可讀存儲(chǔ)介質(zhì),通過使用時(shí)間序列生成對(duì)抗網(wǎng)絡(luò),可以生成額外的故障樣本,緩解樣本不足帶來的問題,從而提高故障模型的泛化能力和魯棒性,提高故障分類的準(zhǔn)確性。
2、本發(fā)明為實(shí)現(xiàn)上述目的,通過以下技術(shù)方案實(shí)現(xiàn):
3、第一方面,本發(fā)明公開了一種工業(yè)故障分類方法,包括:
4、從時(shí)序數(shù)據(jù)庫(kù)中獲取電廠設(shè)備的故障數(shù)據(jù);
5、對(duì)所述故障數(shù)據(jù)進(jìn)行序列化處理,以獲得固定窗口大小的時(shí)序故障數(shù)據(jù),并對(duì)所述時(shí)序數(shù)據(jù)進(jìn)行歸一化處理;
6、使用基于時(shí)間序列生成對(duì)抗網(wǎng)絡(luò)的時(shí)序生成算法對(duì)歸一化后的時(shí)序故障數(shù)據(jù)進(jìn)行建模,生成合成故障數(shù)據(jù);
7、對(duì)所述合成故障數(shù)據(jù)進(jìn)行反歸一化處理,并將反歸一化后的合成故障數(shù)據(jù)與原始故障數(shù)據(jù)融合,生成融合故障數(shù)據(jù);
8、對(duì)融合故障數(shù)據(jù)進(jìn)行時(shí)序數(shù)據(jù)截?cái)嗷蛱畛涮幚?,以生成模型?xùn)練數(shù)據(jù);
9、基于transformer網(wǎng)絡(luò)構(gòu)建故障分類模型,使用處理后的模型訓(xùn)練數(shù)據(jù)對(duì)故障分類模型進(jìn)行訓(xùn)練;
10、利用訓(xùn)練好的故障分類模型對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行故障識(shí)別。
11、進(jìn)一步,所述從時(shí)序數(shù)據(jù)庫(kù)中獲取電廠設(shè)備的故障數(shù)據(jù),包括:
12、從時(shí)序數(shù)據(jù)庫(kù)pi系統(tǒng)提取電廠任一機(jī)組下設(shè)備歷史1年的故障數(shù)據(jù),數(shù)據(jù)采集的時(shí)間間隔為1分鐘;
13、將獲取的時(shí)序數(shù)據(jù)分為訓(xùn)練樣本和測(cè)試樣本,將訓(xùn)練樣本中的故障數(shù)據(jù)提取出來。
14、進(jìn)一步,所述對(duì)所述故障數(shù)據(jù)進(jìn)行序列化處理,以獲得固定窗口大小的時(shí)序故障數(shù)據(jù),并對(duì)所述時(shí)序故障數(shù)據(jù)進(jìn)行歸一化處理,包括:
15、指定固定窗口大小,對(duì)故障數(shù)據(jù)進(jìn)行遍歷,獲取固定窗口大小的時(shí)序故障數(shù)據(jù),記為;
16、通過查詢識(shí)別出故障數(shù)據(jù)的最大值和最小值;
17、對(duì)每一組時(shí)序故障數(shù)據(jù)進(jìn)行最大最小值歸一化計(jì)算生成歸一化的時(shí)序故障數(shù)據(jù),公式如下:
18、
19、其中,為時(shí)序故障數(shù)據(jù)的狀態(tài)變量。
20、進(jìn)一步,所述使用基于時(shí)間序列生成對(duì)抗網(wǎng)絡(luò)的時(shí)序生成算法對(duì)歸一化后的時(shí)序故障數(shù)據(jù)進(jìn)行建模,生成合成故障數(shù)據(jù),包括:
21、基于時(shí)間序列生成對(duì)抗網(wǎng)絡(luò)利用嵌入模塊將原始特征空間映射到包含靜態(tài)特征和動(dòng)態(tài)特征的隱藏空間,映射過程如下所示:
22、
23、其中,和分別表示靜態(tài)特征數(shù)據(jù)和動(dòng)態(tài)時(shí)序特征,和分別表示靜態(tài)特征和動(dòng)態(tài)特征數(shù)據(jù)到隱藏空間的映射函數(shù),和分別對(duì)應(yīng)和在隱藏空間的低維映射;
24、通過訓(xùn)練逆映射完成數(shù)據(jù)的特征維度恢復(fù),逆映射過程如下:
25、
26、其中:和分別表示經(jīng)過逆映射后的靜態(tài)特征和動(dòng)態(tài)特征;
27、使用重構(gòu)損失訓(xùn)練自編碼中的嵌入網(wǎng)絡(luò)和重構(gòu)網(wǎng)絡(luò),重構(gòu)損失為:
28、
29、其中,為時(shí)間序列的長(zhǎng)度,為數(shù)據(jù)的分布;
30、將基于時(shí)間序列生成對(duì)抗網(wǎng)絡(luò)的生成函數(shù)定義為:
31、
32、其中,和表示隨機(jī)靜態(tài)特征和動(dòng)態(tài)隨機(jī)特征,和則表示隱藏空間中合成靜態(tài)特征和合成動(dòng)態(tài)特征;
33、引入有監(jiān)督誤差損失函數(shù)并定義無監(jiān)督的對(duì)抗損失函數(shù),以提高生成器對(duì)真實(shí)數(shù)據(jù)時(shí)序相關(guān)性的學(xué)習(xí)能力;
34、有監(jiān)督誤差損失函數(shù)為:
35、
36、無監(jiān)督的對(duì)抗損失函數(shù)為:
37、
38、其中,和表示真實(shí)序列靜態(tài)和動(dòng)態(tài)特征的標(biāo)簽;,表示合成序列靜態(tài)特征標(biāo)簽,表示rnn特征提取函數(shù),表示合成動(dòng)態(tài)特征標(biāo)簽;
39、利用基于時(shí)間序列生成對(duì)抗網(wǎng)絡(luò),基于歸一化后的時(shí)序故障數(shù)據(jù)完成對(duì)嵌入空間下序列相關(guān)性的學(xué)習(xí),生成合成故障數(shù)據(jù)。
40、進(jìn)一步,所述對(duì)所述合成故障數(shù)據(jù)進(jìn)行反歸一化處理,并將反歸一化后的合成故障數(shù)據(jù)與原始故障數(shù)據(jù)融合,生成融合故障數(shù)據(jù),包括:
41、基于故障數(shù)據(jù)的最大值和最小值,通過反歸一化公式將合成故障數(shù)據(jù)進(jìn)行反歸一化,生成融合故障數(shù)據(jù);
42、反歸一化的公式為:
43、
44、其中,為合成故障數(shù)據(jù)。
45、進(jìn)一步,所述對(duì)融合故障數(shù)據(jù)進(jìn)行時(shí)序數(shù)據(jù)截?cái)嗷蛱畛涮幚?,以生成模型?xùn)練數(shù)據(jù),包括:
46、基于融合故障數(shù)據(jù),將其中的最長(zhǎng)時(shí)序數(shù)據(jù)長(zhǎng)度記為,并生成一條長(zhǎng)度為的掩碼向量,其向量值全部設(shè)為1;
47、針對(duì)其它的融合故障數(shù)據(jù),通過填充任意值進(jìn)行延長(zhǎng)處理,將其的數(shù)據(jù)長(zhǎng)度延長(zhǎng)至
48、基于延長(zhǎng)處理后的融合故障數(shù)據(jù),生成對(duì)應(yīng)的掩碼向量;將填充位置的向量值設(shè)為0,其余位置的向量值設(shè)為1,作為模型訓(xùn)練數(shù)據(jù)。
49、進(jìn)一步,所述基于transformer網(wǎng)絡(luò)構(gòu)建故障分類模型,包括:
50、將transformer網(wǎng)絡(luò)的自注意力的輸出設(shè)定為:
51、
52、其中,為注意力掩碼,為輸入特征維度,為查詢向量,為鍵向量,為值向量。
53、第二方面,本發(fā)明還公開了一種工業(yè)故障分類系統(tǒng),包括:
54、數(shù)據(jù)獲取模塊,用于從時(shí)序數(shù)據(jù)庫(kù)中獲取電廠設(shè)備的故障數(shù)據(jù);
55、數(shù)據(jù)處理模塊,用于對(duì)所述故障數(shù)據(jù)進(jìn)行序列化處理,以獲得固定窗口大小的時(shí)序故障數(shù)據(jù),并對(duì)所述時(shí)序數(shù)據(jù)進(jìn)行歸一化處理;
56、數(shù)據(jù)合成模塊,用于使用基于時(shí)間序列生成對(duì)抗網(wǎng)絡(luò)的時(shí)序生成算法對(duì)歸一化后的時(shí)序故障數(shù)據(jù)進(jìn)行建模,生成合成故障數(shù)據(jù);
57、數(shù)據(jù)融合模塊,用于對(duì)所述合成故障數(shù)據(jù)進(jìn)行反歸一化處理,并將反歸一化后的合成故障數(shù)據(jù)與原始故障數(shù)據(jù)融合,生成融合故障數(shù)據(jù);
58、訓(xùn)練數(shù)據(jù)生成模塊,用于對(duì)融合故障數(shù)據(jù)進(jìn)行時(shí)序數(shù)據(jù)截?cái)嗷蛱畛涮幚?,以生成模型?xùn)練數(shù)據(jù);
59、模型構(gòu)建訓(xùn)練模塊,用于基于transformer網(wǎng)絡(luò)構(gòu)建故障分類模型,使用處理后的模型訓(xùn)練數(shù)據(jù)對(duì)故障分類模型進(jìn)行訓(xùn)練;
60、識(shí)別模塊,用于利用訓(xùn)練好的故障分類模型對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行故障識(shí)別。
61、第三方面,本發(fā)明還公開了一種工業(yè)故障分類裝置,包括:
62、存儲(chǔ)器,用于存儲(chǔ)工業(yè)故障分類程序;
63、處理器,用于執(zhí)行所述工業(yè)故障分類程序時(shí)實(shí)現(xiàn)如上文任一項(xiàng)所述工業(yè)故障分類方法的步驟。
64、第四方面,本發(fā)明還公開了一種可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有工業(yè)故障分類程序,所述工業(yè)故障分類程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文任一項(xiàng)所述工業(yè)故障分類方法的步驟。
65、對(duì)比現(xiàn)有技術(shù),本發(fā)明有益效果在于:本發(fā)明公開了一種工業(yè)故障分類方法、系統(tǒng)、裝置及可讀存儲(chǔ)介質(zhì),首先對(duì)故障數(shù)據(jù)序列化,然后利于基于timegan的時(shí)序生成算法對(duì)數(shù)據(jù)進(jìn)行建模,生成故障的時(shí)序數(shù)據(jù),實(shí)現(xiàn)故障數(shù)據(jù)擴(kuò)充。最后使用時(shí)序分類算法對(duì)擴(kuò)充的數(shù)據(jù)進(jìn)行分類建模,實(shí)現(xiàn)故障的分類。本發(fā)明能夠幫助提高故障分類的準(zhǔn)確性和魯棒性,克服因數(shù)據(jù)稀缺而導(dǎo)致的分類性能下降問題,增強(qiáng)模型在復(fù)雜和多變的工業(yè)環(huán)境中的適應(yīng)能力。此外,通過數(shù)據(jù)生成的方式,可以豐富訓(xùn)練數(shù)據(jù)集,促進(jìn)深度學(xué)習(xí)模型的有效學(xué)習(xí),進(jìn)而提升工業(yè)故障監(jiān)測(cè)和管理的智能化水平。
66、本發(fā)明通過使用timegan,可以生成額外的故障樣本,緩解樣本不足帶來的問題,從而提高模型的泛化能力和魯棒性。
67、本發(fā)明提出的故障數(shù)據(jù)合成的方法可以用于模型的訓(xùn)練、驗(yàn)證和測(cè)試,幫助研究人員更好地理解模型的行為,優(yōu)化模型參數(shù),并在不同故障情況下評(píng)估模型的性能,提高整體的故障檢測(cè)和分類能力。
68、本發(fā)明使用timegan能夠模擬多種故障模式和變化趨勢(shì),使得生成的數(shù)據(jù)不僅包括簡(jiǎn)單的故障實(shí)例,還能覆蓋更復(fù)雜的故障情況。這種多樣性有助于訓(xùn)練出更加全面的模型,使其在面對(duì)真實(shí)世界中未見過的故障時(shí)仍能有效識(shí)別。
69、由此可見,本發(fā)明與現(xiàn)有技術(shù)相比,具有突出的實(shí)質(zhì)性特點(diǎn)和顯著的進(jìn)步,其實(shí)施的有益效果也是顯而易見的。