本發(fā)明涉及機械產(chǎn)品加工制造過程質(zhì)量診斷技術(shù)領(lǐng)域,具體涉及一種改進的基于決策樹的制造過程多元質(zhì)量診斷分類器。
背景技術(shù):
現(xiàn)代制造過程是多變量高度相關(guān)的,對這類生產(chǎn)過程的過程監(jiān)控稱為多元質(zhì)量控制(mqc)或者多元統(tǒng)計過程控制(mspc)。尋找失控原因的過程被稱為mspc診斷或異常識別。主要有兩類方法:一是統(tǒng)計分解技術(shù);二是基于機器學(xué)習(xí)的技術(shù)。主流分解技術(shù)包括了主成分分析(pca),特征空間比較法,mty方法、步降方法、多向核主成分分析方法。然而,這些方法通常都包含了復(fù)雜統(tǒng)計過程,不利于應(yīng)用。隨著計算機技術(shù)的發(fā)展,機器學(xué)習(xí)成為這一領(lǐng)域的研究熱點。人工神經(jīng)網(wǎng)絡(luò)(ann)和決策樹(dt)算法已經(jīng)被應(yīng)用于mspc領(lǐng)域。由于產(chǎn)品質(zhì)量在現(xiàn)代工業(yè)中的重要地位,統(tǒng)計過程控制(spc)在機械、紡織、電子產(chǎn)品、汽車燈離散制造業(yè)中取得了很大成功,并逐漸向造紙、煉油、化工、食品等間歇工業(yè)和連續(xù)制造業(yè)滲透。在實際的制造過程中,被加工零部件或產(chǎn)品往往具有多個質(zhì)量特性,且這些質(zhì)量特性之間存在一定的相關(guān)性,如何確定該過程的過程能力指數(shù)以及對過程質(zhì)量進行診斷,是迫切需要解決的問題,該問題的研究不僅對多元制造過程能力分析研究具有重要的意義,而且對多元制造過程的質(zhì)量進行監(jiān)控和診斷均具有一定的理論意義和實用價值?;谏鲜鲂枨?,本發(fā)明提供了改進的基于決策樹的制造過程多元質(zhì)量診斷分類器。
技術(shù)實現(xiàn)要素:
針對多元控制圖在多元過程監(jiān)控和異常診斷中的不足,本發(fā)明提供了改進的基于決策樹的制造過程多元質(zhì)量診斷分類器。
為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
步驟1:收集制造過程中質(zhì)量特性的原始數(shù)據(jù),并對該數(shù)據(jù)進行必要的整理、簡化及計算。
步驟2:對關(guān)鍵工序的多元質(zhì)量特性進行過程分析;
步驟3:把觀測到的數(shù)據(jù)記錄到己經(jīng)畫好控制限的控制圖上,根據(jù)判穩(wěn)規(guī)則判斷過程是否出現(xiàn)異常現(xiàn)象;
步驟4:根據(jù)識別結(jié)果,應(yīng)用改進的決策樹方法查找出過程異常源所在;
步驟5:相關(guān)人員針對質(zhì)量問題提出并實施改善的措施,解決過程異常情況;
步驟6:在改善實施后,維續(xù)使用控制圖對過程質(zhì)量進行驗證確認(rèn),觀測是否仍有異常,若有則返問至(3),若無則繼續(xù)利用控制圖對制造過程進行監(jiān)控。
本發(fā)明有益效果是:
1、過程能力系數(shù)條件更嚴(yán)謹(jǐn),判定狀態(tài)結(jié)果更加準(zhǔn)確。
2、算法復(fù)雜度低,處理的時間短,得到了較好的結(jié)果準(zhǔn)確度。
3、為后續(xù)制造過程診斷技術(shù)奠定了較好的基礎(chǔ)。
4、考慮了質(zhì)量間的多元特性,算法適應(yīng)性更強,更符合實際的應(yīng)用。
5、參數(shù)因子處理的更加規(guī)范合理,得到的值更符合經(jīng)驗判定的結(jié)果。
6、考慮了誤判因子、又結(jié)合主成分分析方法,結(jié)果準(zhǔn)確度得到的進一步提升。
7、數(shù)據(jù)處理更完善,減低了誤判的概率。
8、解決了數(shù)據(jù)的偏置、單位不統(tǒng)一的問題。
9、可以實現(xiàn)異常診斷技術(shù)。
10、異常態(tài)的判定規(guī)則更加簡便明朗。
附圖說明
圖1制造過程控制與診斷技術(shù)的結(jié)構(gòu)流程圖
圖2本發(fā)明車間數(shù)據(jù)采集方案圖
圖3二維過程修正的規(guī)格區(qū)域與實際分布區(qū)域示例圖
圖4決策樹的多元過程監(jiān)控模型示意圖
具體實施方式
為了解決傳統(tǒng)車間質(zhì)量控制方面存在的問題,結(jié)合圖1-圖4對本發(fā)明進行了詳細(xì)說明,其具體實施步驟如下:
步驟1:收集制造過程中質(zhì)量特性的原始數(shù)據(jù),并對該數(shù)據(jù)進行必要的整理、簡化及計算,其具體計算過程如下:
在生產(chǎn)過程中,當(dāng)工序不存在系統(tǒng)性誤差時,產(chǎn)品的質(zhì)量特性值x符合正態(tài)分布;由于多元質(zhì)量特性值得單位不統(tǒng)一,數(shù)值大小差距也較大,需對數(shù)據(jù)做進一步處理;
生產(chǎn)過程正常運行收集的數(shù)據(jù)矩陣為xn×m,n為樣本的個數(shù),m為樣本質(zhì)量屬性個數(shù)。
上式xn×i為第n個樣本第i種質(zhì)量屬性值,μi為第i種質(zhì)量屬性均值,σi第i種質(zhì)量屬性標(biāo)準(zhǔn)差。
對預(yù)處理后的數(shù)據(jù)x′n×i,進行比重計算如下:
假設(shè)m維正態(tài)分布nm(μ,∑),即xm~nm(μ,∑),其中μ為總體均值向量,∑為協(xié)方差矩陣,由于∑m×m為對稱矩陣,因此存在對稱矩陣p,使得
其中λ1,λ2,…,λm為協(xié)方差矩陣的特征值,其滿足(λ1,λ2,…,λm)>0,即m維多元質(zhì)量的權(quán)重分配可以表示為下式:
取前k個主元的累計貢獻率達(dá)到80%以上,即貢獻率為w:
則主元模型為
步驟2:對關(guān)鍵工序的多元質(zhì)量特性進行過程分析,其具體計算過程如下:
這里主要對步驟1中e的計算和估計;
x∈n(μ,σ2),其中x是質(zhì)量特性值,μ是總體均值,σ2是總體方差。當(dāng)質(zhì)量特性值服從正態(tài)分布時,其均值
p(μ-3σ<x<μ+3σ)=99.73%
即,無論μ和σ取何值,x落在之間的概率是99.73%,也就是說,落在這個分布范圍之外的概率只有0.27%。
對于過程修正的規(guī)格區(qū)域是一個橢球體,其體積計算公式為:
ui、li分別為控制圖上第i元質(zhì)量因子的上下限。
多元過程在(1-α)置信度下實際分布區(qū)域的橢球體為:
|∑|為多元質(zhì)量因子的協(xié)方差行列式。
設(shè)其修正系數(shù)為k;
ε=[(m1-μ1)2+(m2-μ2)2+…+(mt-μt)2]1/2
mi、μi分別為規(guī)格圖、和實際過程的均值位置,ε為t維均值差值。
另一影響因子為
即
綜上所述,表征過程能力函數(shù)如下:
為了完善上式的結(jié)果,這里整合下面的方法,具體過程如下:
錯判誤差的概率分為兩類,一是受控狀態(tài)判為失控狀態(tài),概率即為p1,二是失控狀態(tài)判為受控狀態(tài),概率即為p2。
樣本x,當(dāng)處于受控狀態(tài)時。設(shè)其分布為正態(tài)分布x∈n(μ,σ2);過程處于失控狀態(tài)時,其分布發(fā)生了變化,變化后的分布函數(shù)為f(x)。
記控制圖的上、下控制限分別為u、l;
p1=2(1-φ(λ))
p2=f(u)-f(l)
總誤差概率為p1+p2
上式φ(λ)為標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)在點λ處的值,λ為控制圖中實際參數(shù),這個具體情況可以具體確定。
一元修正系數(shù)k′:
β1、β2分別為中心距離差值|λ-μ|、誤判概率的權(quán)重分配值,這里β1+β2=1,(β1,β2)>0。
表征過程能力函數(shù)cp:
cp=min(cpu,cpl)
多元表征過程能力函數(shù)mc′p:
表征e
e=|mcp-mc′p|
根據(jù)x′主模型即可提取制造過程質(zhì)量異常的主特征。
步驟3:把觀測到的數(shù)據(jù)記錄到己經(jīng)畫好控制限的控制圖上,根據(jù)判穩(wěn)規(guī)則判斷過程是否出現(xiàn)異?,F(xiàn)象,其具體計算過程如下:
如果過程處于非統(tǒng)計過程受控狀態(tài)時用樣本點建立的控制圖控制后續(xù)的生產(chǎn)過程,不僅起不到良好的控制效果,反而會給企業(yè)帶來錯誤的預(yù)報,給企業(yè)造成損失。
判穩(wěn)規(guī)則:
ε′、ε1、ε2分別為預(yù)先設(shè)定好的參數(shù)。
只有同時滿足上三式才能判定當(dāng)前狀態(tài)是否處于受控狀態(tài),有一規(guī)則不滿足則判定為異常態(tài)。
步驟4:根據(jù)識別結(jié)果,應(yīng)用改進的決策樹方法查找出過程異常源所在,其具體計算過程如下:
根據(jù)訓(xùn)練數(shù)據(jù)集確定屬性的影響程度,每個質(zhì)量屬性都對應(yīng)若干個分量;
這里質(zhì)量屬性的確定見下式:
上式s′i為質(zhì)量屬性重要度函數(shù),j∈(1,2,…,l)為質(zhì)量屬性的分量因子,總共有l(wèi)個分量,ni為質(zhì)量屬性i的樣本數(shù),nij′為質(zhì)量屬性i對應(yīng)分量為j的樣本數(shù),p(j/z)為j分量屬于受控態(tài)的概率,p(j/y)為j分量屬于異常態(tài)的概率。
si′從小到大確定質(zhì)量屬性的重要度,s′i越大,對應(yīng)的質(zhì)量屬性越不重要,根據(jù)步驟3判定異常態(tài),再通過上式比較各個分量值,確定異常分量,即異常源。
步驟5:相關(guān)人員針對質(zhì)量問題提出并實施改善的措施,解決過程異常情況;
步驟6:在改善實施后,維續(xù)使用控制圖對過程質(zhì)量進行驗證確認(rèn),觀測是否仍有異常,若有則返問至(3),若無則繼續(xù)利用控制圖對制造過程進行監(jiān)控。