本發(fā)明涉及一種基于貝葉斯元知識提取與嵌入的小樣本診斷能力增強方法,屬于電數(shù)據處理。
背景技術:
1、在故障診斷模型開發(fā)中,來自工程實際中的監(jiān)測數(shù)據集,往往由大量正常狀態(tài)數(shù)據和少量故障數(shù)據組成,且故障類別間也存在著顯著的不平衡。這種非理想的數(shù)據條件,將同時對診斷模型的特征提取能力和分類能力造成不利影響,使得絕大部分深度學習模型無法發(fā)揮數(shù)據驅動的優(yōu)勢。此種數(shù)據條件下,必須從當前數(shù)據集提供的信息之外引入有效的知識,才能實現(xiàn)診斷模型能力的可信提升。領域先驗和相似任務信息就是兩種較為容易獲取的知識來源。兩種傳統(tǒng)的解決方案,一是在歷史任務上以監(jiān)督學習方式進行預訓練加微調,二是利用歷史任務的模型進行遷移。然而,這兩種方法對特征提取網絡的訓練,容易朝著區(qū)分訓練數(shù)據中的樣本類別間差異的方向過度優(yōu)化,這對于在未見的類別上的泛化并不是更優(yōu)的。
2、自監(jiān)督學習(self-supervised?learning,ssl)是一種通過設置不同的前置任務(pretext?tasks,也稱代理任務),從而利用無標簽數(shù)據學習到有效表征的一種學習方法。它可作為下游任務的特征提取網絡,或者作為輔助任務進行訓練,從而提升主任務的性能。同時,為了應對數(shù)據稀缺、工況復雜、建模耗時,可以將元學習方法應用于小樣本故障診斷領域。
3、在無標簽數(shù)據中進行自監(jiān)督學習時,不平衡的數(shù)據類別可能會造成自監(jiān)督學習到的表征缺乏對少類樣本的捕捉,從而進一步影響下游的診斷任務。直推式學習(transductive?learning)與傳統(tǒng)的歸納式學習(inductive?learning)的核心區(qū)別是,直推式學習方式在模型訓練時,允許模型直接訪問到無標簽的測試數(shù)據。這種方式能夠從無標簽的測試數(shù)據分布中獲取額外的信息,因而在小樣本分類問題上具有天然的優(yōu)勢。這種設定方式不符合在線故障診斷的應用場景,但適用于對大量無標簽的歷史數(shù)據進行標注的任務。大部分直推式學習方法都基于各種特征空間中的距離度量和標簽傳播,可以很好的與基于度量的元學習方法結合。一種簡單高效的直推式元學習方式是將soft?k-means算法與原型網絡(prototypical?network)結合,以半監(jiān)督學習的方式推導類原型。但這種方法忽視了不同任務間,數(shù)據域的分布不確定性,造成域偏離的任務上,其無標簽樣本的置信度過高,降低了類原型的泛化能力。
4、傳統(tǒng)元學習通常選擇線性分類器。受制于當前診斷任務上極其有限的有標簽樣本,分類器常常面臨樣本特征維數(shù)大于可用于訓練的有標簽樣本數(shù)的場景,因而極易產生過擬合。然而,在跨任務小樣本診斷任務間存在的廣泛的數(shù)據域偏離,決定了不論何種方法,其特征的表達能力的上限肯定低于大樣本的單數(shù)據域,造成使用單純的線性分類器,擬合能力存在不足,無法取得更好的精度。
技術實現(xiàn)思路
1、為克服現(xiàn)有技術的缺點,本發(fā)明的發(fā)明目的是提供一種基于貝葉斯元知識提取與嵌入的小樣本診斷能力增強方法,通過貝葉斯元學習的方式,引入共軛先驗,進行后驗推斷,使貝葉斯二次分類器能夠獲取跨任務的知識,增強擬合能力的同時,避免過擬合。
2、為實現(xiàn)所述發(fā)明目的,本發(fā)明提供一種基于貝葉斯元知識提取與嵌入的小樣本診斷能力增強方法,其包括如下步驟:
3、步驟1:通過特征提取網絡?提取機電產品目標任務的有標簽數(shù)據集dtarget的內在結構特征向量,其中,為特征提取網絡的最優(yōu)參數(shù),?;
4、步驟2:通過貝葉斯元學習多元正態(tài)分布n的均值和協(xié)方差矩陣的共軛先驗,選擇正態(tài)-逆-威希特分布作為均值和協(xié)方差矩陣的先驗,獲取貝葉斯二次分類器參數(shù)的后驗概率,式中,分別為正態(tài)-逆-威希特分布的四個參數(shù);和分別為目標任務的有標簽數(shù)據集向量dtarget的均值和協(xié)方差矩陣;
5、步驟3:利用后驗概率,對貝葉斯二次分類器進行實例化輸出最終的診斷模型。
6、與現(xiàn)有技術相比,本發(fā)明提供的基于貝葉斯元知識提取與嵌入的小樣本診斷能力增強方法具有如下有益效果:通過貝葉斯元學習的方式,引入共軛先驗,進行后驗推斷,使貝葉斯二次分類器能夠獲取跨任務的知識,增強擬合能力的同時,避免過擬合。
1.一種基于貝葉斯元知識提取與嵌入的小樣本診斷能力增強方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的方法,其特征在于,對特征提取網絡進行訓練,訓練過程包括:
3.根據權利要求2所述的方法,其特征在于,對特征提取網絡進行訓,訓練過程還包括:
4.根據權利要求3所述的方法,其特征在于,對特征提取網絡進行訓練,訓練過程還包括:
5.根據權利要求4所述的方法,其特征在于,還包括對貝葉斯二次分類器進行訓練,訓練過程包括:
6.根據權利要求4所述的基于貝葉斯元知識提取與嵌入的小樣本診斷能力增強方法,其特征在于,
7.根據權利要求6所述的方法,其特征在于,