基于局部鄰域標(biāo)準(zhǔn)化和貝葉斯推斷的ica-pca多工況故障診斷方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于工業(yè)過程監(jiān)測(cè)領(lǐng)域,尤其涉及一種基于局部鄰域標(biāo)準(zhǔn)化和貝葉斯推斷 的ICA-PCA多工況故障診斷方法。
【背景技術(shù)】
[0002] 現(xiàn)代復(fù)雜工業(yè)過程中往往包含非線性、非高斯、動(dòng)態(tài)性等特點(diǎn)的不同工況,而且多 工況下數(shù)據(jù)服從不同分布。然而大多數(shù)多元統(tǒng)計(jì)過程監(jiān)測(cè)方法如主成分分析(PCA)、偏最小 二乘(PLS)都假設(shè)數(shù)據(jù)服從單一高斯分布,因此這些方法應(yīng)用在多工況過程中其監(jiān)測(cè)效果 有較大的局限。
[0003] 近年來,為了能夠有效地解決多工況過程的在線監(jiān)測(cè)問題,一些學(xué)者提出了多模 型的監(jiān)測(cè)策略,高斯混合模型(GMM)、PCA混合模型等方法通過應(yīng)用多個(gè)高斯成分表征過程 數(shù)據(jù),不同工況下的數(shù)據(jù)通過對(duì)應(yīng)的高斯成分特征提取,從而在多工況過程中獲得了良好 的監(jiān)測(cè)性能。然而在離線建模階段,如何將歷史數(shù)據(jù)分類到對(duì)應(yīng)子模型的先驗(yàn)知識(shí)是很難 獲得的,而且在線監(jiān)控階段新數(shù)據(jù)所屬的模型不易確定,不同的子模型都有各自的監(jiān)測(cè)圖, 不方便操作人員觀察判斷。
[0004] 所以就需要一種既能簡(jiǎn)化處理既簡(jiǎn)化處理過程,提高監(jiān)測(cè)性能,而且方便操作人 員觀察,利于工業(yè)過程的運(yùn)行管理的故障診斷方法。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對(duì)多工況工業(yè)過程的非線性、動(dòng)態(tài)性、多分布的特點(diǎn)提供一種基于局部 鄰域標(biāo)準(zhǔn)化和貝葉斯推斷的ICA-PCA多工況故障診斷方法。
[0006] 本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的:
[0007] -種基于局部鄰域標(biāo)準(zhǔn)化和貝葉斯推斷的ICA-PCA多工況故障診斷方法,所述方 法包括以下過程:
[0008] 首先收集不同工況下正常數(shù)據(jù)組成訓(xùn)練集,用局部鄰域標(biāo)準(zhǔn)化方法對(duì)訓(xùn)練集進(jìn)行 預(yù)處理,并采用ICA-PCA算法建立模型,獲得3個(gè)統(tǒng)計(jì)量,然后應(yīng)用貝葉斯推斷將所述統(tǒng)計(jì) 量組合成為一個(gè)統(tǒng)計(jì)量,并確定相應(yīng)控制限。
[0009] 當(dāng)新的數(shù)據(jù)點(diǎn)到來時(shí),將其放入歷史訓(xùn)練集中利用局部鄰域標(biāo)準(zhǔn)化方法進(jìn)行預(yù)處 理,然后再將該數(shù)據(jù)點(diǎn)移除,通過所述ICA-PCA模型獲得相應(yīng)統(tǒng)計(jì)量。
[0010] 通過貝葉斯推斷將所述統(tǒng)計(jì)量組合成一個(gè)統(tǒng)計(jì)量,通過比較在線統(tǒng)計(jì)量與控制限 的大小來對(duì)是否出現(xiàn)故障做出決策。
[0011] 需要對(duì)當(dāng)前工況監(jiān)測(cè)時(shí),不需要知道當(dāng)前是哪一個(gè)工況,而且只需要觀察一個(gè)監(jiān) 測(cè)變量圖。
[0012] 本發(fā)明的具體步驟如下:
[0013]步驟1 :收集工業(yè)過程中各個(gè)工況正常運(yùn)行的數(shù)據(jù)組成訓(xùn)練樣本集;
[0014] 步驟2:利用局部鄰域標(biāo)準(zhǔn)化方法對(duì)訓(xùn)練樣本進(jìn)行預(yù)處理,使得多工況數(shù)據(jù)可以 由單一模型來表不;
[0015] 所述局部鄰域標(biāo)準(zhǔn)化算法為:
[0016] 假設(shè)樣本集XeRmXn,其中,m是過程變量的數(shù)目,n是樣本數(shù)據(jù)的大??;樣本 XieR?xi(i =H'n)的局部鄰域Nk(Xi)表示樣本在X中由歐氏距離確定的k個(gè)最近 鄰,其中=彳乂,#,…,#};然后利用每個(gè)樣本的第一個(gè)鄰居的鄰域均值和鄰域標(biāo)準(zhǔn) 差進(jìn)行標(biāo)準(zhǔn)化處理:如式(1)
[0017]
[0018] 其中,Zi表示經(jīng)過局部鄰域標(biāo)準(zhǔn)化處理后的Xy?<.%(<))和·KiVjO)分別表示樣 本^的第一個(gè)鄰居的4的鄰域均值和鄰域標(biāo)準(zhǔn)差,s表示求標(biāo)準(zhǔn)差;
[0019] 步驟3:根據(jù)步驟2獲得的預(yù)處理樣本集,應(yīng)用ICA-PCA算法分析處理獲得離線建 模模型;
[0020] 假設(shè)m維的樣本x(k) = [xjk),x2(k),…,xm(k)]T可以由r維的未知獨(dú)立成分 [Sl,s2,…,sJT的線性組合來表示,其中r彡m,他們之間的關(guān)系如式⑵所示:
[0021] X=A·S+E
[0022] (2)
[0023] X=[Xi, x2,…,Xn] e RmXn代表訓(xùn)練數(shù)據(jù)矩陣,A=[a a2,…,aj e RW代表混 合系數(shù)矩陣,Se[Sl,S2,…,SJe!TXn代表獨(dú)立成分矩陣,Ee以~代表殘差矩陣;對(duì)于獲 得的殘差矩陣E通過協(xié)方差矩陣奇異值分解獲得PCA模型,假設(shè)PCA模型有q個(gè)主成分,E 可以通過奇異值分
[0024] 解為如式(3):
[0025]Ετ=ΤΡτ+Ε'
[0026] (3)
[0027] 式中,TeRnx,ppe 分別代表主成分子空間的得分矩陣和載荷矩陣,Ε'是 PCA模型中的殘差矩陣;
[0028] 其ICA-PCA算法步驟為:
[0029]Stepl:求樣本x(k)的協(xié)方差矩陣Rx=E(x(k)xT(k)),E表示求期望,并進(jìn)行特征 值分解:得式⑷
[0030]Rx=UAUT
[0031] (4)
[0032] 其中U表示Rx的特征向量組成的矩陣,Λ為特征值組成的對(duì)角矩陣;
[0033]Step2:對(duì)樣本進(jìn)行白化處理:得式(5)
[0034]z(k) =Qx(k) =QAs(k) =Bs(k)
[0035] (5)
[0036]z(k)表示經(jīng)過白化處理后的x(k),其中Q=Λ1/2UT;根據(jù)X=A·S+E,其中, XeRmXn,AeRmXf,seRfXn,EeRmXn,當(dāng)r =m 時(shí),X=A.S,這里我們考慮r=m的情 況;因此,X(k) =As(k),B是一個(gè)正交矩陣;
[0037] Step3 :選擇獨(dú)立成分的個(gè)數(shù)r,設(shè)置i= 1 ;這里的i用來作為Step3_Step8迭代 過程的下標(biāo)及結(jié)束迭代條件;
[0038] Step4 :隨機(jī)選取一個(gè)單位方差的初始化向量b1;
[0039]Step5 :令1^=E{zg(biTz)}-E{g'(b/zMbi,其中z是經(jīng)過白化處理后的訓(xùn)練樣本 向量,g和g'分別代表式(6)中3個(gè)非二次函數(shù)中任意一個(gè)函數(shù)的一階和二階導(dǎo)數(shù):
[0040]
[0041] G2(u)=exp(-a2u2/2)
[0042] G3(u)=u4
[0043] 其中1彡a# 2,a產(chǎn)1,本文選擇G1;
[0044] St印6 :然后將h按照式(7)和式(8)進(jìn)行標(biāo)準(zhǔn)正交化:
[0045]
[0046] W
[0047] St印7 :假如匕沒有收斂,返回St印3 ;
[0048] Step8 :假如bi收斂,輸出bi;如果i<m,那么i=i+Ι并返回Step2 ;
[0049]Step9:根據(jù)迭代結(jié)束后獲得的正交陣B和所述Q矩陣求得獨(dú)立成分矩陣:如式 (9)
[0050] S=BTQX
[0051] (9)
[0052] St印10 :根據(jù)式(2)求得殘差矩陣E,并應(yīng)用協(xié)方差矩陣奇異值分解獲得PCA模 型,然后分別獲得屬于非高斯空間的統(tǒng)計(jì)量I2(k) = (BTQx(k))T(BTQx(k))和高斯空間的統(tǒng) 計(jì)量SPE(k) =e(k)Te(k) =x(k)T(I-PqPqT)x(k),T2(k) =t(k)TAΗ(1〇 ;其中,e(k)是殘 差矩陣的第k個(gè)樣本向量,Pq代表PCA模型載荷矩陣的前q個(gè)向量組成的矩陣,I表示單位 矩陣,t(k)表示得分矩陣的第k個(gè)樣本向量,Λ1是特征值對(duì)角矩陣的逆矩陣形式;
[0053] 步驟4 :根據(jù)步驟3獲得ICA-PCA模型的統(tǒng)計(jì)量應(yīng)用核密度(KDE)方法分別計(jì)算 出各自的控制限,KDE算法為:給出一個(gè)η個(gè)樣本的數(shù)據(jù)集X,則X的分布密度可以計(jì)算為式 (10) :
[0054]
[0055]其中,h表示帶寬,Κ表示核函數(shù),選擇高斯核函f
?,然后求得 X均值的置信水平為99%的置信上限作為控制限;
[0056] 步驟5:在線監(jiān)控階段,對(duì)于每一個(gè)新的采樣點(diǎn)x_,尋找其在訓(xùn)練集X中的最近鄰 ,并利用的鄰域均值(< ))和鄰域標(biāo)準(zhǔn)差W))對(duì)新樣本進(jìn)行標(biāo)準(zhǔn)化處 理,然后根據(jù)步驟3中的St印10分別計(jì)算出統(tǒng)計(jì)量/_,SPEnew,71 ;
[0057] 步驟6 :通過貝葉斯推斷的方法將上述3個(gè)統(tǒng)計(jì)量組合成為一個(gè)統(tǒng)計(jì)量,非高斯空 間XKA發(fā)生故障的概率表示為式(11):
[0058]
[0059] Ρ表示一種概率,巧表示已知在非高斯空間心沖,發(fā)生故障的概率, 表示已知發(fā)生故障,故障出現(xiàn)在非高斯空間的概率,表示非高斯空間發(fā)生故障 的概率,表示在非高斯空間的概率。
[0060] 其中,
[0061]
[0062] Χιω表示當(dāng)前樣本X的非高斯空間,N表示正常情況,F(xiàn)表示故障情況,6.、表示非 高斯空間正常的概率,戶_表示非高斯空間發(fā)生故障的概率;々^和^5#分別設(shè)置為α和 1-α,α為置信水平;
[0063] 和可以由(13)和(14)計(jì)算:
[0064]
[0065]
[0066] 其中,&為非高斯空間的控制限,表示在非高斯空間的統(tǒng)計(jì)量;
[0067] 高斯空間心^的計(jì)量監(jiān)測(cè)發(fā)生故障的概率表示為式(15):
[0068]
[0069]其中,
[0070]
[0071]XrcA表示當(dāng)前樣本X的高斯空間,N表示正常情況,F(xiàn)表示故障情況,巧表示 已知在高斯空間心》中,統(tǒng)計(jì)量監(jiān)測(cè)發(fā)生故障的概率^(AVe^表示已知發(fā)生故障,故 障出現(xiàn)在高斯空間的統(tǒng)計(jì)量的概率,昇:,表示正常情況下高斯空間統(tǒng)計(jì)量 監(jiān)測(cè)的概率,表示在高斯空間的統(tǒng)計(jì)量Γ2λ_的概率,&>表示高斯空間的統(tǒng)計(jì)量 Τ2χΡ"監(jiān)測(cè)發(fā)生故障的概率,表示高斯空間的統(tǒng)計(jì)量尸^,監(jiān)測(cè)正常的概率, 分別設(shè)置為α和1-α,α為置信水平;
當(dāng)前第1頁(yè)
1 
2 
3