本發(fā)明屬于旋轉(zhuǎn)機(jī)械故障診斷領(lǐng)域,具體涉及一種基于拉普拉斯分值和自適應(yīng)模糊C均值聚類(lèi)的滾動(dòng)軸承故障診斷方法。
背景技術(shù):
滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械的關(guān)鍵零部件,其工作狀態(tài)的好壞將直接影響到整臺(tái)機(jī)械設(shè)備的工作狀態(tài)。滾動(dòng)軸承故障是導(dǎo)致旋轉(zhuǎn)機(jī)械設(shè)備發(fā)生故障的主要原因之一,嚴(yán)重時(shí)甚至可能導(dǎo)致重大財(cái)產(chǎn)損失。因此,為了避免由軸承導(dǎo)致的機(jī)械故障,減少經(jīng)濟(jì)損失,對(duì)軸承進(jìn)行狀態(tài)監(jiān)測(cè)及故障診斷從而保證其正常運(yùn)行非常有必要。
目前,針對(duì)滾動(dòng)軸承故障診斷,最常用的方法是基于振動(dòng)信號(hào)分析。它主要包括三個(gè)步驟:數(shù)據(jù)采集與預(yù)處理,特征提取,模式識(shí)別。其中,特征選擇和提取是故障診斷的關(guān)鍵,模式識(shí)別則是核心。只有選擇合適的特征參量和有效的模式識(shí)別方法,才能保證故障診斷的可靠性。
故障可以根據(jù)不同特征來(lái)識(shí)別,但是不同特征對(duì)故障的敏感程度卻不一樣。有些特征與故障密切相關(guān),另一些可能是冗余甚至無(wú)關(guān)的特征。因此,在將特征輸入分類(lèi)器之前,保留對(duì)故障敏感度高的特征,剔除對(duì)故障敏感度低的特征,有利于減少計(jì)算量,避免維數(shù)災(zāi)難,提高分類(lèi)的準(zhǔn)確性。
拉普拉斯分值利用局部保持能力來(lái)衡量特征,通過(guò)直接對(duì)特征集進(jìn)行學(xué)習(xí)提取數(shù)據(jù)內(nèi)在的信息結(jié)構(gòu),將復(fù)雜的高維特征空間轉(zhuǎn)化為簡(jiǎn)單的低維特征空間,在特征空間中選取分值較小的特征,極大程度地保留了故障信號(hào)特征集合中內(nèi)含的整體幾何結(jié)構(gòu)信息,從而利于滾動(dòng)軸承故障判別與診斷。
聚類(lèi)分析可根據(jù)數(shù)據(jù)間的相似性來(lái)實(shí)現(xiàn)數(shù)據(jù)區(qū)分。傳統(tǒng)的聚類(lèi)分析是一種硬劃分,它把每個(gè)待識(shí)別的對(duì)象嚴(yán)格地劃分到某個(gè)類(lèi)中,具有非此即彼的性質(zhì),這種分類(lèi)的類(lèi)別界限是分明的。顯然,這種分類(lèi)不適用于具有模糊性的問(wèn)題,即那些并沒(méi)有嚴(yán)格的屬性的對(duì)象,它們?cè)谛螒B(tài)和類(lèi)屬方面存在著中介性,適合進(jìn)行軟劃分。模糊集理論為這種軟劃分提供了有力的分析工具,這種采用模糊的方法來(lái)處理聚類(lèi)問(wèn)題稱(chēng)為模糊聚類(lèi)分析。模糊C均值聚類(lèi)(FCM)算法可以有效進(jìn)行聚類(lèi)分析,但需要事先設(shè)定聚類(lèi)數(shù),這樣給出的聚類(lèi)是否合理就需要進(jìn)行有效性驗(yàn)證。如果聚類(lèi)數(shù)選取的不合適,會(huì)使劃分結(jié)果與數(shù)據(jù)集的真正結(jié)構(gòu)不相符,從而導(dǎo)致分類(lèi)失敗。因此,只有選擇了正確的聚類(lèi)數(shù)才能獲得較好的分類(lèi)結(jié)果。自適應(yīng)模糊C均值聚類(lèi)算法可以根據(jù)數(shù)據(jù)集自動(dòng)給出最佳的聚類(lèi)數(shù),從而準(zhǔn)確實(shí)現(xiàn)故障類(lèi)型劃分。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)故障軸承振動(dòng)信號(hào)的非平穩(wěn)性及高維特征選擇問(wèn)題,本發(fā)明公開(kāi)了一種基于拉普拉斯分值和自適應(yīng)模糊C均值聚類(lèi)的滾動(dòng)軸承早期微弱故障診斷方法。
本發(fā)明包括以下步驟:
步驟一、獲取滾動(dòng)軸承在正常、內(nèi)圈故障、外圈故障以及滾動(dòng)體故障狀態(tài)下的振動(dòng)加速度信號(hào),得到時(shí)域信號(hào)樣本集;
步驟二、計(jì)算樣本集中每個(gè)樣本的若干個(gè)典型時(shí)域統(tǒng)計(jì)參數(shù),構(gòu)成初始特征集;
步驟三、計(jì)算初始特征集中每個(gè)特征的拉普拉斯分值,按從小到大排列,選取排在最前的若干個(gè)特征組成故障特征矩陣;
具體進(jìn)行如下處理:
步驟3.1:構(gòu)造一個(gè)具有m個(gè)樣本點(diǎn)的臨近圖G,第i個(gè)節(jié)點(diǎn)對(duì)應(yīng)xi,第j個(gè)節(jié)點(diǎn)對(duì)應(yīng)xj;如果xi和xj足夠近,則有邊連接,否則沒(méi)有邊連接。
步驟3.2:如果節(jié)點(diǎn)i和j是連通的,則令其中,i,j=1,…,m,其中t是一個(gè)合適的常數(shù);否則令Sij=0;
步驟3.3:對(duì)于第r個(gè)特征,定義
fr=[fr1,fr2,…,frm]T,D=SI,I=[1,…,1]T,L=D-S
D為對(duì)角陣,矩陣L稱(chēng)為圖G的拉普拉斯矩陣,fri表示第i個(gè)樣本的第r個(gè)特征,I為單元矩陣,fr為各fri的特征元素集合,i=1,…,m;
步驟3.4:對(duì)各個(gè)特征進(jìn)行去均值化處理,得到去均值化處理后的各fri的特征元素集合
步驟3.5:計(jì)算第r個(gè)特征的拉普拉斯分值
Lr表示第r個(gè)特征的拉普拉斯分值;
步驟四、采用自適應(yīng)模糊C均值聚類(lèi)方法對(duì)故障特征矩陣進(jìn)行聚類(lèi)分析,獲得最佳聚類(lèi)數(shù)和聚類(lèi)中心,聚類(lèi)數(shù)即樣本集包含的故障類(lèi)型數(shù);
設(shè)xi表示數(shù)據(jù)集,n表示數(shù)據(jù)集中元素的個(gè)數(shù),c表示聚類(lèi)中心(1<c<n),dij=||xi-vi||表示樣本xj和聚類(lèi)中心vi的歐氏距離,uij表示第j個(gè)樣本到第i個(gè)聚類(lèi)中心的隸屬度,U=[uij]c×n表示關(guān)系矩陣,V=[vij]s×c表示聚類(lèi)中心矩陣。
總體樣本的中心向量為
下面給出聚類(lèi)數(shù)c的自適應(yīng)函數(shù)
在不做特殊要求下可取m=2,k表示迭代次數(shù)(取大于或等于1的整數(shù)),具體進(jìn)行如下處理:步驟4.1:給出迭代標(biāo)準(zhǔn)ε=0.001,聚類(lèi)數(shù)c=2,聚類(lèi)數(shù)為1的自適應(yīng)函數(shù)L(c)=0,初始分類(lèi)矩陣V(0),k=0;
步驟4.2:用下面公式計(jì)算U(k)
如果存在j,r,使得則令且對(duì)i≠r,
步驟4.3:用下面公式計(jì)算V(k+1),
比較V(k+1)和V(k),若||V(k+1)-V(k)||≤ε,則停止迭代,否則,置k=k+1,轉(zhuǎn)向步驟4.1;
步驟4.4:計(jì)算L(c),在c>2且c<n的情況下,若L(c-1)>L(c-2)且L(c-1)>L(c),則聚類(lèi)過(guò)程結(jié)束,否則,置c=c+1,轉(zhuǎn)向步驟4.1;
步驟五、計(jì)算未知樣本和已知樣本集的聚類(lèi)中心之間的貼近度,根據(jù)貼近度的大小確定未知樣本的故障類(lèi)型。
本發(fā)明的優(yōu)點(diǎn)與積極效果在于:
(1)計(jì)算量小,可有效避免維數(shù)災(zāi)難
基于拉普拉斯分值的特征選擇通過(guò)直接對(duì)特征集進(jìn)行學(xué)習(xí)提取數(shù)據(jù)內(nèi)在的信息結(jié)構(gòu),將復(fù)雜的高維特征空間轉(zhuǎn)化為簡(jiǎn)單的低維特征空間,在特征空間中選取分值較小的特征,極大程度地保留了故障信號(hào)特征集合中內(nèi)含的整體幾何結(jié)構(gòu)信息。由于只保留了與故障聯(lián)系密切的少量典型特征,所以使得特征分類(lèi)時(shí)的計(jì)算量大大減少,也可有效避免特征數(shù)過(guò)高而導(dǎo)致的維數(shù)災(zāi)難。
(2)自適應(yīng)給出最佳分類(lèi)數(shù),不需人為設(shè)定
傳統(tǒng)的模糊C均值聚類(lèi)(FCM)算法可以有效進(jìn)行聚類(lèi)分析,但需要事先設(shè)定聚類(lèi)數(shù),這樣給出的聚類(lèi)是否合理就需要進(jìn)行有效性驗(yàn)證。如果聚類(lèi)數(shù)選取的不合適,會(huì)使劃分結(jié)果與數(shù)據(jù)集的真正結(jié)構(gòu)不相符,從而導(dǎo)致分類(lèi)失敗。自適應(yīng)模糊C均值聚類(lèi)算法則不存在此問(wèn)題,它可以根據(jù)數(shù)據(jù)集自動(dòng)給出最佳的聚類(lèi)數(shù),從而準(zhǔn)確實(shí)現(xiàn)故障類(lèi)型劃分。
(3)模式識(shí)別方便有效
有了基于拉普拉斯分值選擇的典型特征及自適應(yīng)模糊C均值聚類(lèi)算法得到的最佳聚類(lèi)中心,只需根據(jù)未知樣本和已知樣本之間的海明貼近度大小,即可判別未知樣本的故障類(lèi)型。
附圖說(shuō)明
圖1是本發(fā)明的滾動(dòng)軸承故障診斷方法整體步驟流程圖;
圖2是本發(fā)明的FCM算法聚類(lèi)數(shù)c的自適應(yīng)過(guò)程流程圖;
圖3是本發(fā)明實(shí)例中故障分類(lèi)結(jié)果圖。
具體實(shí)施方式
本發(fā)明是一種軸承故障診斷算法,下面將結(jié)合附圖,對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。
以美國(guó)凱斯西儲(chǔ)大學(xué)軸承振動(dòng)數(shù)據(jù)庫(kù)的部分實(shí)驗(yàn)數(shù)據(jù)中SKF的6205-2RS深溝球軸承為例。
本發(fā)明公開(kāi)的滾動(dòng)軸承故障診斷方法的整體步驟流程圖如圖1所示,具體步驟如下:
1、選取振動(dòng)信號(hào)及獲得初始特征集
針對(duì)正常軸承,3種不同程度(0.1778毫米,0.3556毫米,0.5332毫米)的單點(diǎn)內(nèi)圈故障,0.1778毫米的單點(diǎn)外圈故障,0.1778毫米的單點(diǎn)滾動(dòng)體故障,這6種狀態(tài)進(jìn)行分析,每種狀態(tài)選取7組數(shù)據(jù)(其中5組作為訓(xùn)練樣本,2組作為測(cè)試樣本),共42組數(shù)據(jù)。滾動(dòng)軸承的振動(dòng)信號(hào)是典型的時(shí)域信號(hào),其時(shí)域統(tǒng)計(jì)特征參數(shù)能夠很好地反映振動(dòng)強(qiáng)度、信號(hào)能量、沖擊時(shí)域等信息,因此本發(fā)明以9個(gè)典型的時(shí)域統(tǒng)計(jì)特征參數(shù)為例,構(gòu)成初始特集。這9個(gè)統(tǒng)計(jì)參數(shù)分別為平均值(Xave),有效值(Xrms),最大值(Xmax),峭度(Xkur),標(biāo)準(zhǔn)差(Xstd),偏度(Xske),形狀因子(Sf),峰值因子(Cf),沖擊因子(I),其計(jì)算公式分別如下:Xmax=max{x1,x2,…,xn},其中n為采樣點(diǎn)數(shù),x1,x2,…,xn表示n個(gè)采樣點(diǎn)。30組訓(xùn)練樣本的9個(gè)時(shí)域特征參數(shù)如表1所示。
2、利用拉普拉斯分值選擇特征及獲得故障特征矩陣
拉普拉斯分值的基本思想是:利用特征的局部保持能力來(lái)衡量特征,在特征空間中選取分值較小的特征,不僅極大地保留了故障信號(hào)特征信息,而且將復(fù)雜的高維特征空間轉(zhuǎn)化為簡(jiǎn)單的低維特征空間,從而利于滾動(dòng)軸承故障判別與診斷。
設(shè)Lr表示第r個(gè)特征的拉普拉斯分值,fri表示第i個(gè)樣本的第r個(gè)特征(i=1,…,m),那么特征的拉普拉斯分值計(jì)算步驟如下:
(1)構(gòu)造一個(gè)具有m個(gè)樣本點(diǎn)的臨近圖G,第i個(gè)節(jié)點(diǎn)對(duì)應(yīng)xi,如果xi和xj足夠近,則有邊連接,否則沒(méi)有邊連接。當(dāng)節(jié)點(diǎn)的標(biāo)號(hào)已知時(shí),可以在同一標(biāo)號(hào)的兩節(jié)點(diǎn)之間連接一條邊。
(2)如果節(jié)點(diǎn)i和j是連通的,則令其中t是一個(gè)合適常數(shù);否則令Sij=0。加權(quán)矩陣S稱(chēng)為圖G的相似矩陣,它用來(lái)衡量近鄰樣本點(diǎn)之間的相似性,描述了數(shù)據(jù)空間的固有局部幾何結(jié)構(gòu);S中元素的值越大,表明兩個(gè)樣本越相近,越有可能屬于同一類(lèi),反之,則越有可能屬于不同類(lèi)。
(3)對(duì)于第r個(gè)特征,定義
fr=[fr1,fr2,…,frm]T,D=SI,I=[1,…,1]T,L=D-S
D為對(duì)角陣,矩陣L稱(chēng)為圖G的拉普拉斯矩陣。為了避免發(fā)生某些維度數(shù)據(jù)差異很大而主導(dǎo)近鄰圖的構(gòu)造的現(xiàn)象,對(duì)各個(gè)特征進(jìn)行去均值化處理,得到
(4)第r個(gè)特征的拉普拉斯分值計(jì)算如下:
分子越小表示近鄰的樣本在該特征上的差異越小,即該特征的局部信息保持能力越強(qiáng);分母越大表示樣本在該特征上差異越大,即該特征的區(qū)分能力越強(qiáng)。因此,特征重要性與得分成反比,即得分越低,特征越重要。所以,拉普拉斯分值特征選擇法選取Lr值最小的幾個(gè)特征作為特征選擇結(jié)果。
(5)計(jì)算30組訓(xùn)練樣本的9個(gè)時(shí)域特征的拉普拉斯分值,結(jié)果如表2所示。從小到大對(duì)這些特征得分進(jìn)行排序,選擇排在前若干個(gè)特征作為最終的特征選擇結(jié)果,本發(fā)明以前兩個(gè)特征為例,從表2可以看出,選擇的2個(gè)特征分別為I和Xmax,將9維特征降到2維,不僅極大地保留了故障特征信息,而且還減少了對(duì)特征分類(lèi)時(shí)的計(jì)算量,有利于故障判別與診斷。所以,故障特征矩陣就是由30行樣本和2列特征值構(gòu)成的30×2的矩陣。
表1訓(xùn)練樣本的9個(gè)時(shí)域統(tǒng)計(jì)參數(shù)
表2訓(xùn)練樣本的9個(gè)時(shí)域統(tǒng)計(jì)參數(shù)的拉普拉斯分值
3、利用自適應(yīng)模糊C均值聚類(lèi)對(duì)樣本分類(lèi)
聚類(lèi)的目的就是將數(shù)據(jù)分類(lèi)并盡量使不同類(lèi)的數(shù)據(jù)點(diǎn)距離盡可能的大而同類(lèi)的數(shù)據(jù)點(diǎn)距離盡可能的小。FCM算法可以有效進(jìn)行聚類(lèi)分析,但聚類(lèi)數(shù)需要事先人為給出,這樣給出的聚類(lèi)是否合理就需要進(jìn)行有效性驗(yàn)證。
設(shè)xi表示數(shù)據(jù)集,n表示數(shù)據(jù)集中元素的個(gè)數(shù),c表示聚類(lèi)中心(1<c<n),dij=||xj-vi||表示樣本xj和聚類(lèi)中心vi的歐氏距離,uij表示第j個(gè)樣本到第i個(gè)聚類(lèi)中心的隸屬度,U=[uij]c×n表示關(guān)系矩陣,V=[vij]s×c表示聚類(lèi)中心矩陣。
下面給出聚類(lèi)數(shù)c的自適應(yīng)函數(shù)。
總體樣本的中心向量為
關(guān)系矩陣U(k)為
聚類(lèi)中心矩陣V(k+1)為
聚類(lèi)數(shù)c的自適應(yīng)函數(shù)為
分子表征不同類(lèi)數(shù)據(jù)點(diǎn)之間的距離,分母表征同類(lèi)的數(shù)據(jù)點(diǎn)與該類(lèi)中心之間的距離,因此,L(c)的值越大,說(shuō)明分類(lèi)越合理,對(duì)應(yīng)L(c)值最大的c為最佳分類(lèi)值。
在不做特殊要求下可取m=2,k表示迭代次數(shù)(取大于或等于1的整數(shù)),針對(duì)上面給出的聚類(lèi)數(shù)c的自適應(yīng)函數(shù),有下面的FCM算法聚類(lèi)數(shù)c的自適應(yīng)過(guò)程,對(duì)應(yīng)流程圖如圖2所示:
(1)給出迭代標(biāo)準(zhǔn)ε=0.001,聚類(lèi)數(shù)c=2,聚類(lèi)數(shù)為1的自適應(yīng)函數(shù)L(c)=0,初始分類(lèi)矩陣V(0),k=0;
(2)計(jì)算U(k),如果存在j,r,使得則令且對(duì)i≠r,
(3)計(jì)算V(k+1),并計(jì)較V(k+1)和V(k),若||V(k+1)-V(k)||≤ε,則停止迭代,否則,置k=k+1,轉(zhuǎn)向(1);
(4)計(jì)算L(c),在c>2且c<n的情況下,若L(c-1)>L(c-2)且L(c-1)>L(c),則聚類(lèi)過(guò)程結(jié)束,否則,置c=c+1,轉(zhuǎn)向(1);
(5)30×2的故障特征矩陣的自適應(yīng)模糊C均值聚類(lèi)的結(jié)果如表3,表4及圖3所示。根據(jù)圖3,可以清楚的看到30組樣本被分為6類(lèi),并且從表3可以得出最佳聚類(lèi)數(shù)c=6,樣本中6類(lèi)故障被正確區(qū)分開(kāi)。
表3故障特征矩陣的自適應(yīng)模糊C均值聚類(lèi)的目標(biāo)函數(shù)L(c)
表4訓(xùn)練樣本的自適應(yīng)模糊C均值聚類(lèi)的聚類(lèi)中心矩陣
4.利用貼近度實(shí)現(xiàn)故障類(lèi)型識(shí)別
模糊診斷中常采用貼近度進(jìn)行模式識(shí)別,本發(fā)明以海明貼近度為例,其計(jì)算公式如下:
式中A為標(biāo)準(zhǔn)模糊模式,B為待識(shí)別模糊對(duì)象,k=1,2,…,n。貼近度N(A,B)越大,表明兩個(gè)模糊子集越相似,反之則越差。模糊診斷中,首先通過(guò)模糊C均值聚類(lèi)算法對(duì)已知故障樣本進(jìn)行聚類(lèi)得到各聚類(lèi)中心,然后計(jì)算待測(cè)故障樣本與聚類(lèi)中心的貼近度,從而確定待測(cè)故障樣本的類(lèi)別。
訓(xùn)練樣本中6類(lèi)故障的聚類(lèi)中心如表4所示,表中N表示正常狀態(tài),B表示0.1778毫米的單點(diǎn)滾動(dòng)體故障,O表示0.1778毫米的單點(diǎn)外圈故障,I-1,I-2,I-3分別表示0.1778毫米,0.3556毫米,0.5332毫米的單點(diǎn)內(nèi)圈故障。12組待測(cè)樣本與已知訓(xùn)練樣本的貼近結(jié)果如表5所示。根據(jù)表5,可以看出已知樣本和未知樣本的最大貼極度達(dá)100%,因此,可以確定該未知樣本的狀態(tài)和該已知樣本的狀態(tài)一致,并得到的結(jié)果與實(shí)際相符。
表5待測(cè)樣本和已知樣本的海明貼近度及診斷結(jié)果
通過(guò)以上滾動(dòng)軸承故障分類(lèi)及識(shí)別方法的詳細(xì)描述,可見(jiàn)本發(fā)明的基于拉普拉斯分值和自適應(yīng)模糊C均值聚類(lèi)的滾動(dòng)軸承故障診斷方法具有明顯的優(yōu)勢(shì):
1、基于拉普拉斯分值的特征選擇在極大程度地保留故障信號(hào)特征集合中內(nèi)含的整體幾何結(jié)構(gòu)信息的基礎(chǔ)上,只選擇少量幾個(gè)局部信息保持能力強(qiáng)的特征,從而將復(fù)雜的高維特征空間轉(zhuǎn)化為簡(jiǎn)單的低維特征空間,極大地縮減了故障分類(lèi)時(shí)的計(jì)算量,有利于故障分類(lèi)與識(shí)別。
2、基于自適應(yīng)模糊C均值聚類(lèi)的故障分類(lèi)算法克服了傳統(tǒng)的模糊C均值聚類(lèi)算法需要事先人為設(shè)定聚類(lèi)數(shù)的缺陷,它可以根據(jù)數(shù)據(jù)集自動(dòng)給出最佳聚類(lèi)數(shù),從而準(zhǔn)確實(shí)現(xiàn)故障類(lèi)型劃分。
3、有了基于拉普拉斯分值選擇的典型特征及自適應(yīng)模糊C均值聚類(lèi)算法得到的最佳聚類(lèi)中心,只需根據(jù)未知樣本和已知樣本之間的貼近度大小,即可判別未知樣本的故障類(lèi)型,簡(jiǎn)單有效而且精度高。