專利名稱:帶噪聲的監(jiān)控器檢測和間歇故障隔離的制作方法
技術領域:
本發(fā)明總體上涉及數(shù)據(jù)處理系統(tǒng)和方法,且更具體地涉及從具有間歇系統(tǒng)故障的 帶噪聲的監(jiān)控器辨別偽故障。
背景技術:
間歇故障可能在數(shù)據(jù)處理系統(tǒng)內(nèi)在沒有進行任何動作比如對系統(tǒng)配置的維修和 更換的情況下出現(xiàn)或消失。故障可從其感測信號的間歇現(xiàn)象檢測。這種檢測可轉(zhuǎn)換為診斷 監(jiān)控,其中“O”指示未檢測到故障(解除)而“1”指示檢測到故障(指示)。然而,已知系統(tǒng)在 辨別由帶噪聲的監(jiān)控器或來自可能成為永久故障的間歇故障的瞬態(tài)環(huán)境狀況生成的暫時 異常傳感器值時是無效的,從而導致例如錯誤的信息或連接器問題。從可能導致永久故障 的間歇故障辨別這些暫時異常傳感器值是有利的。間歇故障的實時檢測和診斷已經(jīng)成為系統(tǒng)診斷的挑戰(zhàn)。一方面涉及故障自身的間 歇性。同間歇性關聯(lián)的兩個主要挑戰(zhàn)是1)不可預測的發(fā)生故障的頻率,這使得檢測變得困 難,和2)故障的起因,其不僅取決于所研究系統(tǒng)的潛在故障,而且還取決于不可預測的瞬態(tài) 環(huán)境狀況。另一方面涉及用于檢測故障的傳感器/監(jiān)控器。待檢測的系統(tǒng)沒有故障,但是 傳感器/監(jiān)控器本身因為它們自身的故障而有噪聲,這是很有可能的。使實時檢測和診斷變得困難的是對事件的采樣。故障的不可預測性使得難以確定 在可能推斷出檢測到的故障是系統(tǒng)的真實故障、監(jiān)控器是帶噪聲的、還是存在需要進一步 監(jiān)控的情況之前,事件應該被監(jiān)控多長時間。因此,期望提供一種從間歇系統(tǒng)故障中辨別出偽故障的方法和系統(tǒng),該偽故障例 如可能由產(chǎn)生暫時異常傳感器值的瞬態(tài)環(huán)境狀況或帶噪聲的監(jiān)控器造成。此外,本發(fā)明的 其他期望特征和特性將從隨后的詳細說明和所附權利要求,連同附圖和前述的技術領域和 背景技術變得顯而易見。
發(fā)明內(nèi)容
—種檢測和診斷系統(tǒng)故障的方法,包括在操作期間檢測監(jiān)控器的帶噪聲的狀態(tài)并 且結(jié)合量化的監(jiān)控器不確定性等級以支持故障隔離推理。另一種檢測和診斷系統(tǒng)故障的方法,包括采集數(shù)據(jù)且執(zhí)行數(shù)據(jù)的監(jiān)控器評價以確 定該監(jiān)控器是否是帶噪聲的。如果監(jiān)控器不是帶噪聲的,則確定故障隔離。如果不能確定 監(jiān)控器不是帶噪聲的,則采集附加數(shù)據(jù)。對監(jiān)控器是否是帶噪聲的或是否存在間歇故障進 行評價。如果不能進行評價,則確定監(jiān)控器的不確定性。
在下文中,將連同下列附圖描述本發(fā)明,其中相似的數(shù)字表示相似的元件,且 圖1是適于在實施優(yōu)選實施例中使用的計算機系統(tǒng)的框圖2-6是圖示監(jiān)控器值的五個觀察情景的圖表; 圖7是圖示序列概率比測試的圖表; 圖8是圖2-6中五種情景的觀察值表; 圖9是圖8中五種情景的觀察值的圖表; 圖10是不確定性隨概率的變化圖表; 圖11是對于圖2情境的不確定性計算值的表; 圖12是對于圖6情境的不確定性計算值的表;以及 圖13是監(jiān)控器推理架構(gòu)的流程圖。
具體實施例方式下面對發(fā)明的詳細說明實際上只是示例性的,并且不意圖限制本發(fā)明或本發(fā)明的 應用和使用。此外,不意圖被前述的技術領域、背景技術、發(fā)明內(nèi)容、或以下的詳細說明所給 出的任何理論所限制。本文描述的示例性實施例使用序列概率比測試(SPRT)來統(tǒng)計測試監(jiān)控器的帶噪 聲的狀態(tài)。SPRT是貝葉斯統(tǒng)計過程,其要求在執(zhí)行數(shù)據(jù)采集之前,詳細描述模型的結(jié)果期 望。如果在數(shù)據(jù)采集期間滿足某些條件,則將就繼續(xù)數(shù)據(jù)采集和所收集的數(shù)據(jù)的解釋作出 判定。當數(shù)據(jù)被采集時,計算對數(shù)似然比的和。如果該和大于第一預先限定的閾值,則接受 第一預先限定的假設,或者如果該和小于第二閾值,則接受第二預先限定的假設。在數(shù)據(jù)正 在被采集時對該數(shù)據(jù)進行分析允許比經(jīng)典假設測試得到更早的結(jié)論。香農(nóng)熵理論被用于量化監(jiān)控器的不確定性等級以支持監(jiān)控器值在故障隔離中的 使用。在信息論(數(shù)據(jù)處理)中,熵是對同隨機變量有關的不確定性的測量。香農(nóng)熵是對信 息期望值的測量,通常用比特表示。更具體地,當隨機變量未知時,香農(nóng)熵理論是對平均信 息內(nèi)容的測量。例如,如果兩個事件是均等可能的,則熵為1 (比特),或者如果事件之一絕 對會發(fā)生,則熵為0。因此隨機事件的熵值X為0彡X彡1。香農(nóng)熵常規(guī)上已被用于測量 包含在消息中、與可預測的消息部分相反的信息,例如涉及字母或單詞重復的出現(xiàn)頻率的 語言結(jié)構(gòu)或統(tǒng)計屬性中的冗余度?;谒鞯呐卸ǎ诠收显\斷推理中可能考慮或可能不考慮監(jiān)控器。如果基于上述 算法,沒有檢測到帶噪聲的監(jiān)控器,且故障間歇超出了預期值,那么宣布故障是間歇性的。參考圖1,可被用來實施本文描述的示例性實施例的數(shù)據(jù)處理設備100的框圖可 以被配置為通用計算裝置,例如計算機102。數(shù)據(jù)處理設備100通常包括處理器104,存儲 器106,和在操作中將各種系統(tǒng)元件耦合到處理器104的系統(tǒng)總線108。處理器104可能包 括,例如單一中央處理器(CPU)或并行處理環(huán)境。數(shù)據(jù)處理設備100進一步包括一個或多個用于存儲和讀取程序和其他數(shù)據(jù)的數(shù) 據(jù)存儲設備,例如盤驅(qū)動器110。盤驅(qū)動器110可以包括例如硬盤驅(qū)動器,磁盤驅(qū)動器,或者 光盤驅(qū)動器(未顯示)中的一個或多個,且通過盤驅(qū)動器接口 112耦合到系統(tǒng)總線108。這 些盤驅(qū)動器110和與它們關聯(lián)的計算機可讀介質(zhì)提供了計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和數(shù)據(jù)處理設備100所使用的其他數(shù)據(jù)的非易失性存儲。監(jiān)控器120通過適配器114 或其他接口耦合到系統(tǒng)總線108。另外,數(shù)據(jù)處理設備100可能包括其他外圍輸出裝置(未 顯示),其包括例如揚聲器和打印機。要指出,本文公開的示例性實施例可以在主機操作系統(tǒng)和一個或多個模塊的背景 下實施。在計算機編程現(xiàn)有技術中,軟件模塊可通常被實施為執(zhí)行特定任務或?qū)嵤┨囟ǔ?象數(shù)據(jù)類型的例程和/或數(shù)據(jù)結(jié)構(gòu)的集合。軟件模塊通常包括可存儲于數(shù)據(jù)處理設備的存儲器位置內(nèi)的指令介質(zhì),且通常包 括兩個部分。第一,軟件模塊可能列出可以被其他模塊或例程訪問的常量、數(shù)據(jù)類型、變量、 例程等等。第二,軟件模塊可以被配置為實施方式,其可以是專用的(或許僅可由模塊訪 問),且包含實際上實施模塊基于的例程或子例程的源代碼。本文所使用的術語模塊因此可 以指代軟件模塊(dule)或其實施方式。這樣的模塊可單獨使用或一起使用以形成可以通 過信號承載介質(zhì)實施的程序產(chǎn)品,所述信號承載介質(zhì)包括傳輸介質(zhì)和可記錄介質(zhì)。要重點指出的是,盡管在全功能數(shù)據(jù)處理設備100例如計算機的背景中描述了實 施例,但是本領域技術人員將意識到本發(fā)明的機制能夠被分配為各種形式的程序產(chǎn)品,且 意識到所描述的示例性實施例同等地應用,而不管實際用來實行分配的信號承載介質(zhì)的特 定類型。信號承載介質(zhì)的示例包括,但是不限于,可記錄型介質(zhì)(例如軟盤或CD ROM)和傳 輸型介質(zhì)(例如模擬或數(shù)字通信鏈路)??梢越Y(jié)合實施例來使用可以存儲數(shù)據(jù)(所述數(shù)據(jù)可由計算機訪問)的任何類型的 計算機可讀介質(zhì),例如磁帶,閃存卡,數(shù)字多功能光盤(DVD),伯努利盒式磁帶(bernoulli cartridge),隨機存取存儲器(RAM)和只讀存儲器。數(shù)據(jù)處理設備100可以使用到一個或多個遠程計算機(未顯示)的邏輯連接而在聯(lián) 網(wǎng)環(huán)境中操作。使用耦合到數(shù)據(jù)處理設備或與數(shù)據(jù)處理設備集成的通信裝置來實施這些邏 輯連接。要被分析的數(shù)據(jù)序列可以存在于聯(lián)網(wǎng)環(huán)境中的遠程計算機上。遠程計算機可以是 另一臺計算機、服務器、路由器、網(wǎng)絡PC、客戶端,或者對等裝置或者其他公用網(wǎng)絡節(jié)點。邏 輯連接通過網(wǎng)絡接口 1 同數(shù)據(jù)處理設備100對接。這樣的聯(lián)網(wǎng)環(huán)境在辦公網(wǎng)絡、企業(yè)廣 域計算機網(wǎng)絡、內(nèi)聯(lián)網(wǎng)和互聯(lián)網(wǎng)中是常見的。本領域技術人員將意識到所示的網(wǎng)絡連接通 過舉例的方式提供,并且可以使用用于在計算機之間建立通信鏈路的通信裝置和其其他裝 置。示例性實施例的算法對如下各項加以區(qū)別1)歸因于帶噪聲的監(jiān)控器的偽故障,2) 歸因于不可預測環(huán)境/操作狀況的瞬態(tài)故障,和3)待檢測的可能導致永久故障的系統(tǒng)的真 正間歇故障。算法還將間歇的不確定性等級結(jié)合到故障隔離中。監(jiān)控系統(tǒng)的監(jiān)控器(算法)提供指示符,當檢測到故障(指示)時,所述指示符取值 為1,當無故障(解除)時,其取值為0。監(jiān)控器可能是來自待檢測系統(tǒng)的直接信號(例如心 跳),或來自與故障有關現(xiàn)象的導出指示符(例如振動頻率)。監(jiān)控器可被用于指示一個或多 個故障,且故障可觸發(fā)一個或多個監(jiān)控器。提供了代表上面討論的典型間歇情況的五種情景。要指出在下面討論的圖中,數(shù) 據(jù)的記錄開始于監(jiān)控器的值第一次發(fā)生變?yōu)椤?”(指示)時。還要指出在運行時間期間只 要數(shù)據(jù)以連續(xù)字符串到達,數(shù)據(jù)就不必為周期的。盡管僅示出一個監(jiān)控器,但也可以使用多 個監(jiān)控器和多個故障。
第一種情景(非間歇)是當監(jiān)控器被觸發(fā),且它的值保持為M = 1時。這指示永久 故障(非間歇),因此M = 1可被用于設計以用作故障隔離的證據(jù)(圖2)。第二種情景代表當監(jiān)控器被觸發(fā)短暫的時間段,并且然后返回到解除的情形(圖 3)。這種類型的故障典型地由暫時操作/環(huán)境狀況造成,因此當異常狀況停止時指示報告 消失。檢測這種間歇的常規(guī)方法每預先限定的時間段延遲報告指示狀態(tài)。盡管這種常規(guī)方 法可能消除一些間歇問題,卻有一個根本缺陷,就是間歇的頻率難以預測,從而導致預先限 定延遲周期變得非常主觀。第三種情景(瞬態(tài)故障/狀況)代表監(jiān)控器值在1和0之間來回切換(圖4)的情 況。盡管僅示出了幾個循環(huán),應該理解可能發(fā)生許多更多循環(huán)。監(jiān)控器的值最終被固定在 M=O (解除)處,指示檢測到的故障是瞬態(tài)的。這種間歇可能是由于間歇故障或系統(tǒng)在時間 段期間頻繁經(jīng)歷的瞬態(tài)異常狀況。在第四種情景(間歇故障到永久故障)中,監(jiān)控器觀察指示(圖5)故障起初是間歇 的,然后被轉(zhuǎn)變?yōu)橛谰霉收?。間歇周期可能比所示的長得多。在第五種情景(帶噪聲的監(jiān)控器或間歇故障)中,在系統(tǒng)的操作期間,監(jiān)控器值既 不固定在0處,也不固定在1處(圖6)。這可能是由于帶噪聲的監(jiān)控器或連續(xù)間歇故障。判 定這是由于帶噪聲的監(jiān)控器還是由于間歇故障要求附加信息(數(shù)據(jù))。這將在隨后更詳細地 討論。可以自動區(qū)分上述間歇情景,然后使用間歇信息來引導故障隔離的算法在故障診 斷中是非常期望的。為了區(qū)分間隙檢測,統(tǒng)計順序概率比(SPRT)測試方法被使用。靜態(tài)運算參數(shù)被限定為ρ彡Pl (不帶噪聲的),以及P彡p2(帶噪聲的),其中pi 和P2是用戶基于系統(tǒng)對噪聲的容限等級限定的(例如pl=0. 1和p2=0.4)。當真實監(jiān)控器 值為0,但是LRUI記錄成1時,誤差小于α。當真實監(jiān)控器值為1,但是LRUI記錄成0時, 誤差小于β。再次,α和β是用戶基于系統(tǒng)的誤差容限限定的(例如α = 1%和β = 1%)。 對于每個周期性監(jiān)控的動態(tài)觀察參數(shù)包括1)監(jiān)控報告的總次數(shù)(從第一次監(jiān)控器報告值1 開始)為N_m,和2)監(jiān)控器已將其狀態(tài)從0切換到1的總次數(shù)(包括初始的1)為N_s。SPRT主要優(yōu)點在于它不需要預先限定的樣本大小,但是樣本大小可以在操作期間 累積直到作出判定為止,而不管備擇假設(alternative hypothesis)是否正確。這是一個 具有吸引力的特征應用于對由于間歇特征發(fā)生的時間段不可預測性引起的間歇故障的檢 測,且不需要預先限定的延遲周期。在檢測到任何故障之前,假設系統(tǒng)工作正常。因此,零假設(null hypothesis)為 M=O (解除,即無故障),并且其對照M=I (指示,即檢測到故障)的備擇假設測試。基于M的 觀察值,這種方法可能導致三個結(jié)果1)統(tǒng)計地M=O (接受零,并且拒絕備擇假設);2)統(tǒng)計 地M=I (拒絕零,并且接受備擇假設);和3)未定的(利用現(xiàn)有數(shù)據(jù),無法做出判定)。要指出, 在這三種情況的任一種中,在給定時間監(jiān)控器值可以是0或1,并且判定基于累積數(shù)據(jù)的統(tǒng) 計顯著性。因此,監(jiān)控器值的間歇在任何一種情況下都是允許的。對于1)和2),結(jié)論是監(jiān) 控器是不帶噪聲的,且為故障隔離設置監(jiān)控器值。對于3),或者監(jiān)控器是帶噪聲的,或者存 在連續(xù)間歇故障,且需要其他信息來對情況進行區(qū)分。為了闡明測試,當傳感器第一次從0變?yōu)? (第一次指示)時,采集數(shù)據(jù)用于間歇分 析,如圖4-8和上述討論所示的那樣,且在給定時間采集到的全部數(shù)據(jù)點作為N_m被計數(shù)。在該時間期間,N_m被計數(shù),當M=I時數(shù)據(jù)點的總數(shù)也被計數(shù)為N_s。于是在該周期期間M=I 的概率為p=N_s/N_m。較低的概率被限定為p_low (例如1096,即0. 1),而較高的概率被限定*p_high (例如9096,即0.9),以致于當ρ <= p_low時,接受零假設,其中假的負誤差為α (例如, M=I但是被測得為M=O的機率為0. 001,即0. 1%),且當ρ >= p_high時,接受備擇假設,其中 假的正誤差為β (例如,M=O但是被測得為M=I的機率為0. 001,即0. 1%)。當p_low<p<p_ high時,如果M=O或M=I則無法進行判定。給定所觀察的監(jiān)控器值為“ 1 ”的概率,即P,和在樣本N_m中M=I的N_s數(shù),獲得如 所觀察的樣本的概率為
權利要求
1.一種檢測和診斷系統(tǒng)故障的方法,包括在操作期間嘗試確定監(jiān)控器是否是帶噪聲的;以及如果不能確定帶噪聲的狀態(tài),則結(jié)合量化的監(jiān)控器不確定性等級以支持故障隔離推理。
2.根據(jù)權利要求1所述的方法,其中該嘗試步驟包括設置第一閾值; 設置第二閾值; 采集數(shù)據(jù);當所述數(shù)據(jù)被采集時,計算對數(shù)似然比的和;以及如果所述和超過第一閾值,則接受第一假設,或者如果所述和小于第二閾值,則接受第 二假設。
3.根據(jù)權利要求1所述的方法,進一步包括 將對帶噪聲的狀態(tài)的檢測轉(zhuǎn)換為診斷監(jiān)控。
4.根據(jù)權利要求1所述的方法,其中嘗試步驟包括區(qū)分歸因于帶噪聲監(jiān)控器的偽故障、歸因于不可預測狀況的瞬態(tài)故障和間歇故障。
5.一種檢測和診斷系統(tǒng)故障的方法,包括a)采集數(shù)據(jù);b)執(zhí)行對所述數(shù)據(jù)的監(jiān)控器的第一評價以確定所述監(jiān)控器是否是帶噪聲的;c)如果所述監(jiān)控器不是帶噪聲的,則確定故障隔離;d)如果不能確定所述監(jiān)控器是帶噪聲的,則采集附加數(shù)據(jù);e)執(zhí)行所述監(jiān)控器是否是帶噪聲的或是否存在間歇故障的第二評價; f )如果不能執(zhí)行所述第二評價,則確定不確定性。
6.根據(jù)權利要求5所述的方法,其中所述確定步驟包括 使用香農(nóng)熵理論。
7.根據(jù)權利要求5所述的方法,其中所述步驟b-e包括 使用序列概率比統(tǒng)計測試。
8.根據(jù)權利要求7所述的方法,其中所述確定步驟包括 使用香農(nóng)熵理論。
9.根據(jù)權利要求5所述的方法,進一步包括 將對帶噪聲的狀態(tài)的檢測轉(zhuǎn)換為診斷監(jiān)控。
10.根據(jù)權利要求5所述的方法,其中所述步驟b-e包括區(qū)分歸因于帶噪聲監(jiān)控器的偽故障、歸因于不可預測狀況的瞬態(tài)故障和間歇故障。
全文摘要
本發(fā)明涉及帶噪聲的監(jiān)控器檢測和間歇故障隔離。一種檢測和診斷系統(tǒng)故障的方法,包括在操作期間嘗試檢測監(jiān)控器的帶噪聲的狀態(tài),且結(jié)合量化的監(jiān)控器不確定性等級以支持故障隔離推理。序列概率比統(tǒng)計測試被用于統(tǒng)計地測試監(jiān)控器的帶噪聲的狀態(tài),且香農(nóng)熵理論被用于量化監(jiān)控器的不確定性等級以支持監(jiān)控器值在故障隔離中的使用。
文檔編號G06F11/22GK102141948SQ20101056131
公開日2011年8月3日 申請日期2010年11月26日 優(yōu)先權日2010年1月29日
發(fā)明者B·J·巴頓, D·M·科爾貝, D·米勒, Q·G·邵, R·R·芒努松 申請人:霍尼韋爾國際公司