本發(fā)明屬于安全監(jiān)控技術(shù)領(lǐng)域,特別涉及一種基于數(shù)據(jù)驅(qū)動(dòng)的報(bào)警根源尋找方法。
背景技術(shù):
由于對(duì)工業(yè)系統(tǒng)安全性和可靠性要求的不斷提高,在線、實(shí)時(shí)地對(duì)系統(tǒng)運(yùn)行過(guò)程進(jìn)行監(jiān)控成為現(xiàn)代工業(yè)系統(tǒng)中必不可少的關(guān)鍵環(huán)節(jié)??紤]到難以獲取系統(tǒng)精確的數(shù)學(xué)模型和先驗(yàn)知識(shí)以及工業(yè)系統(tǒng)產(chǎn)生大量歷史運(yùn)行數(shù)據(jù)等情況,基于數(shù)據(jù)驅(qū)動(dòng)的過(guò)程監(jiān)控成為現(xiàn)代工業(yè)安全監(jiān)控的主流技術(shù)。在故障發(fā)生后發(fā)出警報(bào)能幫助工作人員及時(shí)判斷系統(tǒng)運(yùn)行情況,但該方法不能確定警報(bào)發(fā)生原因。報(bào)警根源尋找方法就能夠在警報(bào)發(fā)生時(shí)明確報(bào)警原因,因而受到了普遍重視。
報(bào)警根源尋找方法通過(guò)一系列措施準(zhǔn)確定位故障,輔助工作人員及時(shí)隔離并排除故障。經(jīng)過(guò)多年的發(fā)展,人們已經(jīng)提出了多種報(bào)警根源尋找技術(shù),主要分為三大類:
1)符號(hào)有向圖方法,依賴于系統(tǒng)的物理模型和先驗(yàn)知識(shí);
2)Granger因果分析方法,是基于預(yù)測(cè)的因果關(guān)系;
3)轉(zhuǎn)變熵(transfer entropy,TE)方法。
前兩種方法都只適用于線性系統(tǒng),通過(guò)構(gòu)建模型來(lái)獲取變量之間的關(guān)系,并不適用于大型復(fù)雜系統(tǒng)。最后一種方法主要通過(guò)計(jì)算過(guò)程變量的概率密度函數(shù)來(lái)獲取變量之間的因果關(guān)系,能夠應(yīng)用于復(fù)雜的非線性系統(tǒng),實(shí)用性更強(qiáng)。該類方法的不足在于對(duì)建模數(shù)據(jù)的數(shù)量具有較高的要求,而現(xiàn)代工業(yè)系統(tǒng)產(chǎn)生海量數(shù)據(jù)的特點(diǎn)正好彌補(bǔ)這一不足。
因此,本發(fā)明人考慮利用轉(zhuǎn)變熵方法確定變量間的因果關(guān)系,為尋找報(bào)警根源奠定堅(jiān)實(shí)的基礎(chǔ)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種基于數(shù)據(jù)驅(qū)動(dòng)的報(bào)警根源尋找方法,不依賴于系統(tǒng)物理模型和先驗(yàn)知識(shí),僅依靠過(guò)程測(cè)量變量就能獲得因果關(guān)系,就可在報(bào)警發(fā)出初期就能尋找根源,以便及時(shí)隔離和排除故障,減少甚至避免事故發(fā)生,提高系統(tǒng)運(yùn)行的安全性和可靠性。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
一種基于數(shù)據(jù)驅(qū)動(dòng)的報(bào)警根源尋找方法,包括以下步驟:
步驟一:檢測(cè)工業(yè)系統(tǒng)的工作數(shù)據(jù)并獲得觀測(cè)變量,并將d個(gè)觀測(cè)變量存儲(chǔ)到數(shù)據(jù)矩陣X中,檢查數(shù)據(jù)的時(shí)間平穩(wěn)性并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;
所述的工作數(shù)據(jù)包括反應(yīng)系統(tǒng)運(yùn)行情況的參數(shù);
步驟二:對(duì)模型參數(shù)進(jìn)行初始化,并利用Cao準(zhǔn)則或者Ragwitz準(zhǔn)則優(yōu)化模型參數(shù);
步驟三:計(jì)算轉(zhuǎn)變熵矩陣P,包括:
A、選取變量:從數(shù)據(jù)矩陣X中任取兩個(gè)變量,標(biāo)記為x、y,共d(d-1)/2種組合;
B、計(jì)算兩個(gè)變量間的轉(zhuǎn)變熵:
其中,是聯(lián)合概率密度函數(shù),f(·|·)是條件概率密度函數(shù),w是隨機(jī)向量假設(shè)w的元素是w1,w2,…,ws,∫(·)dw是和分別是x和y歷史測(cè)量值的嵌入向量,k1和l1分別是y和x的嵌入維數(shù),h1是預(yù)測(cè)范圍;
C、計(jì)算標(biāo)準(zhǔn)轉(zhuǎn)變熵:
其中,H表示熵,是條件熵;且Tx→y≠Ty→x;
如果大于規(guī)定閾值,則判定兩個(gè)變量x、y具有因果關(guān)系;
D、重復(fù)步驟B、C直至計(jì)算d(d-1),將d(d-1)/2種組合的變量標(biāo)準(zhǔn)轉(zhuǎn)變熵計(jì)算出來(lái),存入矩陣P中,然后將具有因果關(guān)系的變量用流向圖表示;
步驟四:基于信息流向圖中變量因果關(guān)系計(jì)算標(biāo)準(zhǔn)直接轉(zhuǎn)變熵:
從矩陣P任取x、y、z3個(gè)具有因果關(guān)系的變量,其中z是中間變量,判斷x和y的直接因果關(guān)系,包括:
1)、計(jì)算直接轉(zhuǎn)變熵:
其中,v表示隨機(jī)向量預(yù)測(cè)范圍h=max(h1,h3),嵌入向量是z的歷史值,能夠?yàn)閕+h時(shí)刻的預(yù)測(cè)y提供有效信息,是x的歷史值,若h=h1,則若h=h3,則且計(jì)算Tx→z時(shí),l2和m1是x和z的嵌入維數(shù),h2是預(yù)測(cè)范圍,τ2是時(shí)間間隔;計(jì)算Tz→y時(shí),k2和m2是y和z的嵌入維數(shù),h3是預(yù)測(cè)范圍,τ3是時(shí)間間隔;
2)、計(jì)算標(biāo)準(zhǔn)直接轉(zhuǎn)變熵:
如果大于規(guī)定閾值,則說(shuō)明x和y有直接的因果關(guān)系;
對(duì)步驟三信息流向圖中的變量進(jìn)行上述1)和2)兩步計(jì)算,驗(yàn)證變量因果關(guān)系的真假性;
步驟五,根據(jù)步驟四的驗(yàn)證結(jié)果建立變量直接因果關(guān)系圖。
步驟一中,用增廣的富勒檢驗(yàn)方法對(duì)數(shù)據(jù)進(jìn)行時(shí)間平穩(wěn)性檢查。
所述步驟一對(duì)數(shù)據(jù)進(jìn)行預(yù)處理包括:利用濾波等方法處理數(shù)據(jù)噪聲。
步驟四中,從矩陣P任取x、y、z3個(gè)具有因果關(guān)系的變量,其中變量z可以為空,x、y為相鄰變量。
采用上述方案后,本發(fā)明具有以下優(yōu)點(diǎn):僅利用反映系統(tǒng)運(yùn)行的海量數(shù)據(jù)建立模型,不依賴于系統(tǒng)的物理模型和先驗(yàn)知識(shí),限制條件少,適用性強(qiáng);此外,在報(bào)警初期進(jìn)行故障定位,能夠快速排出故障,減少重大事故發(fā)生,提高系統(tǒng)的安全性和可靠性,提高經(jīng)濟(jì)效益。
下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的說(shuō)明。
附圖說(shuō)明
圖1為本發(fā)明基于數(shù)據(jù)驅(qū)動(dòng)的報(bào)警根源尋找方法的流程圖。
圖2為變量x、y和z的關(guān)系圖。
圖3為變量x、y和z的信息流向圖,其中z到y(tǒng)有直接的因果關(guān)系。
圖4為變量x、y和z的信息流向圖,其中z到y(tǒng)沒(méi)有因果關(guān)系。
圖5為基于標(biāo)準(zhǔn)轉(zhuǎn)變熵的信息流向圖。
圖6為標(biāo)準(zhǔn)直接轉(zhuǎn)變熵的計(jì)算步驟。
圖7為基于標(biāo)準(zhǔn)直接轉(zhuǎn)變熵的信息流向圖。
具體實(shí)施方式
實(shí)施例一
結(jié)合圖1說(shuō)明本具體實(shí)施方式,本發(fā)明實(shí)施例一揭示的一種基于數(shù)據(jù)驅(qū)動(dòng)的報(bào)警根源尋找方法,是按以下步驟進(jìn)行的:
步驟一:檢測(cè)工業(yè)系統(tǒng)的工作數(shù)據(jù)并獲得觀測(cè)變量,并將d個(gè)觀測(cè)變量存儲(chǔ)到數(shù)據(jù)矩陣X中,此實(shí)施例利用了增廣的富勒檢驗(yàn)方法檢查數(shù)據(jù)的時(shí)間平穩(wěn)性,并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理包括利用濾波等方法處理數(shù)據(jù)噪聲;其中工作數(shù)據(jù)包括反應(yīng)系統(tǒng)運(yùn)行情況的參數(shù),例如溫度、壓力、水位等;
步驟二:對(duì)模型參數(shù)進(jìn)行初始化,并利用Cao準(zhǔn)則優(yōu)化模型參數(shù);模型是指建立變量因果關(guān)系的模型,模型參數(shù)就是建立模型需要的一些設(shè)置參數(shù),預(yù)處理后的工作數(shù)據(jù)是模型的輸入;
步驟三:計(jì)算轉(zhuǎn)變熵矩陣P:
A、從數(shù)據(jù)矩陣X中取3個(gè)變量,標(biāo)記為x、y、z,計(jì)算任意兩個(gè)變量間的標(biāo)準(zhǔn)轉(zhuǎn)變熵值(normalized TE,NTE),共d(d-1)/2種組合;
以這3個(gè)變量為例說(shuō)明標(biāo)準(zhǔn)直接轉(zhuǎn)變熵的計(jì)算方法;
B、計(jì)算x到y(tǒng)的TE值:
其中,是聯(lián)合概率密度函數(shù),f(·|·)是條件概率密度函數(shù),w是隨機(jī)向量假設(shè)w的元素是w1,w2,...,ws,∫(·)dw是和分別是x和y歷史測(cè)量值的嵌入向量,k1和l1分別是y和x的維數(shù),h1是預(yù)測(cè)范圍;
如果Tx→y=0,說(shuō)明x和y沒(méi)有因果關(guān)系;
C、計(jì)算x到y(tǒng)的NTE:
其中,是條件熵;
H表示熵;
D、計(jì)算x到z的TE值:
其中,和是時(shí)間間隔τ2的嵌入向量,η是隨機(jī)向量h2是預(yù)測(cè)范圍;
如果Tx→z=0,說(shuō)明x和z沒(méi)有因果關(guān)系;
E、計(jì)算x到z的NTE值:
F、計(jì)算z到y(tǒng)的TE值:
其中,和是時(shí)間間隔τ3的嵌入向量,是隨機(jī)向量h3是預(yù)測(cè)范圍;
如果Tz→y=0,說(shuō)明z和y沒(méi)有因果關(guān)系;
G、計(jì)算z到y(tǒng)的NTE值:
對(duì)數(shù)據(jù)矩陣X的任意兩個(gè)變量都進(jìn)行TE值的計(jì)算,并將該TE值存儲(chǔ)到d×d的矩陣P中;
矩陣P的對(duì)角線元素是變量本身的轉(zhuǎn)變熵,其值為NA;
當(dāng)NTE值大于規(guī)定的閾值時(shí),判定兩個(gè)變量具有因果關(guān)系,描述基于NTE的信息流向圖;
需要說(shuō)明的是,通常利用高斯核函數(shù)估計(jì)概率密度函數(shù)
對(duì)單變量概率密度函數(shù)可以用下列公式計(jì)算
其中,N是樣本數(shù),γ是減少概率密度函數(shù)估計(jì)的帶寬,c=(4/3)1/5≈1.06;
對(duì)d維多變量情形,概率密度函數(shù)估計(jì)可以用下列公式計(jì)算
其中,s=1,…,d;
步驟四:計(jì)算標(biāo)準(zhǔn)直接轉(zhuǎn)變熵值(normalized direct TE,NDTE):
A:計(jì)算直接轉(zhuǎn)變熵(direct TE,DTE):
如圖2所示,x引起z和y的變化,為了判斷x和y是否具有直接因果關(guān)系,定義DTE:
其中,v表示隨機(jī)向量預(yù)測(cè)范圍h=max(h1,h3),嵌入向量是z的歷史值,能夠?yàn)閕+h時(shí)刻的預(yù)測(cè)y提供有效信息,是x的歷史值,若h=h1,則若h=h3,則
B、計(jì)算NDTE:
如果DTEx→y=0,則x和y沒(méi)有直接的因果關(guān)系;
如果大于規(guī)定閾值,則x和y有直接的因果關(guān)系;
接下來(lái)需要判斷z到y(tǒng)因果關(guān)系的真假性;
z到y(tǒng)的DTE值計(jì)算為:
其中,υ表示隨機(jī)向量預(yù)測(cè)范圍h=max(h1,h3),嵌入向量是z的歷史值,能夠?yàn)閕+h時(shí)刻的預(yù)測(cè)y提供有效信息,是x的歷史值,若h=h1,則若h=h3,則
z到y(tǒng)的NDTE值計(jì)算為
如果NDTEz→y大于規(guī)定閾值,表示z到y(tǒng)具有因果關(guān)系,如圖3所示;否則,z到y(tǒng)不具有因果關(guān)系,如圖4所示;
步驟五:對(duì)確認(rèn)有因果關(guān)系的變量進(jìn)行NDTE的計(jì)算,驗(yàn)證兩個(gè)變量之間的直接因果關(guān)系,篩選出直接因果關(guān)系的變量,以建立直接因果關(guān)系圖,即確定信息流向圖。
實(shí)施例二:本實(shí)施方式與具體實(shí)施方式一不同的是:步驟二采用Ragwitz準(zhǔn)則優(yōu)化參數(shù)。
具體實(shí)施例:本具體實(shí)施例的基于數(shù)據(jù)驅(qū)動(dòng)的報(bào)警根源尋找方法,用于一家石油公司的煙氣脫硫過(guò)程(flue gas desulfurization,F(xiàn)GD)變量因果關(guān)系進(jìn)行仿真,具體步驟如下;
步驟一,以FDG過(guò)程為例,選取反應(yīng)池、水槽1和水槽2的液位以及泵2和3的流速為變量,分別記為y1、y2、y3y4、y5,采集3544組數(shù)據(jù),數(shù)據(jù)具有時(shí)間平穩(wěn)性,并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;
步驟二,模型參數(shù)初始化,并利用Cao準(zhǔn)則對(duì)參數(shù)進(jìn)行優(yōu)化;
步驟三,計(jì)算變量間的TE值和NTE值,見表1;
表1
選取0.02作為閾值,基于標(biāo)準(zhǔn)轉(zhuǎn)變熵的信息流向路徑如圖5所示;
步驟四,計(jì)算FDG部分過(guò)程的DTE和NDTE值,見表2;
表2
如果NDTE值過(guò)小,則判定變量沒(méi)有直接因果關(guān)系,根據(jù)直接轉(zhuǎn)變熵計(jì)算結(jié)果獲取信息流向圖的步驟如圖6所示;
步驟五,得到FDG過(guò)程的信息流向圖如圖7所示。
上述說(shuō)明示出并描述了本發(fā)明的優(yōu)選實(shí)施例,應(yīng)當(dāng)理解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對(duì)其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文發(fā)明構(gòu)想范圍內(nèi),通過(guò)上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù)范圍內(nèi)。