一種基于高斯過程的近紅外光譜煤揮發(fā)分快速檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及煤碳工業(yè)化驗領(lǐng)域以及近紅外光譜技術(shù)分析領(lǐng)域,具體涉及一種基于 高斯過程的近紅外光譜煤揮發(fā)分快速檢測方法。
【背景技術(shù)】
[0002] 揮發(fā)分是煤分類的重要指標(biāo),根據(jù)揮發(fā)分可以大致判斷煤的變質(zhì)程度,也可用于 判斷熱值高低。煤的揮發(fā)分是指煤在規(guī)定條件下隔絕空氣加熱進行水分校正后的質(zhì)量損 失。揮發(fā)分不是煤中原有的揮發(fā)性物質(zhì),而是煤在嚴(yán)格規(guī)定條件下,加熱時的分解產(chǎn)物。揮 發(fā)分包括水分、碳氫氧化物和碳氫化合物,其中,物理吸附水和礦物質(zhì)產(chǎn)生的二氧化碳不包 含在內(nèi)。
[0003] 煤的揮發(fā)分檢測是一項規(guī)范性很強的試驗,結(jié)果完全取決于試驗條件,其中樣本 數(shù)量、加熱溫度、加熱時間、加熱速度等均會對揮發(fā)分產(chǎn)生影響。首先,稱取一定量的空氣干 燥煤樣,放在帶蓋的坩鍋中,在(900±10)°C溫度下隔絕空氣加熱7分鐘,以減少的質(zhì)量占煤 樣質(zhì)量的百分數(shù)減去煤樣水分含量作為該煤樣的揮發(fā)分。揮發(fā)分的檢測對操作人員的要求 非常高,且這種檢測方法從采樣到化驗結(jié)束操作過程復(fù)雜繁瑣,需要消耗大量的人力物力, 獲得一個樣本的各煤質(zhì)參數(shù)分析值需要很長時間。另外,現(xiàn)有的基于X射線熒光中子活化的 分析方法雖然能夠?qū)崿F(xiàn)在線分析的目的,但需要用到放射源,這在使用與管理中都具有一 定的安全風(fēng)險,不易實際推廣應(yīng)用。近紅外光譜的分析可以實現(xiàn)全自動,在線,安全,快捷的 多參數(shù)在線實時分析。
[0004] 可用于近紅外光譜建模分析的方法有多種,如偏最小二乘回歸(PLSR)、多元線性 回歸等線性回歸算法,以及人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(SVM)等非線性回歸算法。前者 對于建模對象的線性要求比較高,在解決一些非線性問題時效果不夠理想;后者則存在模 型復(fù)雜、計算成本高、需要比較繁瑣的調(diào)參過程等不足。高斯過程作為非參數(shù)學(xué)習(xí)方法,理 論上能夠?qū)θ我廨斎氲暮瘮?shù)進行逼近,因此具有泛化能力強等特點,并且能夠同時適應(yīng)線 性和非線性預(yù)測的要求,非常適合小樣本、高維度特征數(shù)據(jù)的建模。同時,基于高斯過程可 以預(yù)測未知樣本的概率分布,能夠?qū)︻A(yù)測值的非確定性進行量化。這在煤質(zhì)成分預(yù)測及指 標(biāo)控制方面非常有實用價值。本發(fā)明意在利用近紅外光譜數(shù)據(jù)并基于高斯過程建模,實現(xiàn) 對精煤揮發(fā)分的安全、在線、快速的檢測。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明主要是解決現(xiàn)有煤揮發(fā)分檢測方法過程繁瑣、實時性差、存在安全風(fēng)險等 技術(shù)問題,通過自動采樣、預(yù)處理煤樣本并用近紅外光譜儀進行實時光譜數(shù)據(jù)獲取,光譜數(shù) 據(jù)傳入計算機經(jīng)過基于高斯過程的模型計算得到具體的煤揮發(fā)分參數(shù)。
[0006] 本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:一種基于高斯過程的近紅外光譜煤揮發(fā)分快 速檢測方法,包括用于實時采集分析樣本的煤樣采樣模塊,用于處理原始煤樣本至符合近 紅外光譜分析條件的煤樣預(yù)處理模塊,用于獲取煤樣光譜數(shù)據(jù)的光譜采集模塊以及進行煤 樣揮發(fā)分值預(yù)測分析的建模分析模塊。
[0007] 所述的采樣模塊主要包括采樣設(shè)備,由機械化采樣系統(tǒng)構(gòu)成,可以是二級采樣或 者三級采樣設(shè)備,實現(xiàn)定時采樣和縮分。固定時間間隔地從煤碳生產(chǎn)線或運輸線上上采集 煤樣并進行充分混合與縮分,采樣設(shè)備的采樣時間間隔與采樣量可進行調(diào)整,保證檢測傳 送帶上的煤樣不間斷。
[0008] 所述的煤樣預(yù)處理模塊主要包括破碎設(shè)備、傳送帶裝置和勻料器。破碎設(shè)備由不 同的破碎機組成,可以是不同級別的破碎機組成多級破碎,將由采樣機得到的縮分煤樣進 行充分破碎至合適的顆粒大小。傳送帶裝置由傳送帶和驅(qū)動傳送帶運行的電機組成的,破 碎得到的煤樣落入傳送帶中,要求能夠平穩(wěn)慢速地運輸,保證光譜采集時穩(wěn)定不振動。傳送 帶采用皮帶式,通過驅(qū)動電機帶動,將傳送帶維持在運行狀態(tài),要求傳送帶能夠低速平穩(wěn)運 行,可以配以合適的差速器和變頻器來對電機進行速度控制。勻料器由若干平板葉片輪與 驅(qū)動葉輪的電機組成,葉輪安裝于傳送帶上方,破碎設(shè)備出料口后方,通過旋轉(zhuǎn)把煤樣表面 攤平,保證在光譜采集時表面煤樣本表面較為平整。同時要求葉輪高度可調(diào),以得到適于光 譜掃描分析的煤層厚度。
[0009] 所述的光譜采集模塊為近紅外光譜儀,其光源位于傳送帶上方,勻料器后方,對攤 平的煤樣進行從上到下的垂直式照射,得到實時的近紅外光譜并將數(shù)據(jù)傳輸至計算機。近 紅外光譜儀可采用分光式或者傅利葉式漫反射光譜儀,可調(diào)整掃描時間和掃描次數(shù),以獲 得更具代表性的光譜數(shù)據(jù)。
[0010] 所述的建模分析模塊包括可用于對煤揮發(fā)分值進行建模預(yù)測分析的計算機。所用 模型主要基于高斯過程,并可進行相關(guān)的優(yōu)化拓展。本發(fā)明中使用的基于高斯過程的建模 分析方法有兩種:方法一為基本的高斯過程(GP)預(yù)測模型;方法二為由主成分分析(PCA)和 高斯過程融合的PCA-GP預(yù)測模型。
[0011] 本發(fā)明中,光譜數(shù)據(jù)的掃描獲取方法包括以下步驟:
[0012] (1)固定時間間隔地從煤碳生產(chǎn)線或運輸線上采集煤樣并進行充分混合與縮分得 到適量一級煤樣,進入破碎設(shè)備;
[0013] (2)將步驟(1)中所得一級煤樣經(jīng)由破碎設(shè)備充分破碎至合適的顆粒大小,得到的 二級煤樣進入傳送帶中。作為優(yōu)選,所述的二級煤樣的顆粒直徑在6_以下;
[0014] (3)調(diào)整傳送帶速度,使其能夠低速平穩(wěn)運行,運行速度可調(diào),將步驟(2)中所得二 級煤樣運至勾料器處。作為優(yōu)選,所述的傳送帶的運行速度不宜超過lm/min;
[0015] (4)調(diào)整勻料器葉輪高度,步驟(3)中的煤樣經(jīng)勻料器旋轉(zhuǎn)使其表面攤平,進而得 到厚度適于后續(xù)光譜掃描的、表面較為平整的煤層(三級煤樣),后經(jīng)傳送帶運送至光譜儀。 作為優(yōu)選,所述的三級煤樣的煤層厚度在為宜。
[0016] (5)調(diào)整近紅外光譜儀的光源位置及掃描時間、掃描次數(shù)來調(diào)整其掃描面積,對步 驟(4)中所得的三級煤樣進行掃描,并通過求平均光譜的方法確保得到光譜能夠代表整個 樣本。作為優(yōu)選,所述的光譜掃描的譜段為l〇〇〇_2500nm,每條譜掃描平均60次,每個煤樣以 5秒間隔共采譜15次,取15條光譜的最終平均光譜作為該樣本光譜數(shù)據(jù)。
[0017] 本發(fā)明中,利用近紅外光譜數(shù)據(jù)并基于高斯過程進行煤揮發(fā)分建模預(yù)測分析的方 法包括以下步驟:
[0018] (1)通過前述光譜掃描方法掃描煤樣得到每個樣本的光譜數(shù)據(jù),以之作為樣本的 原始光譜so用于算法的后續(xù)步驟。對于建模樣本,還需用化驗法測得其揮發(fā)分值作為標(biāo)定 值Y0;
[0019] (2)對于步驟(1)中所述的原始光譜通過有效波長識別、光譜變換處理、離群點檢 測等方法進行提取優(yōu)化,得到處理后的光譜S1。作為優(yōu)選,在對煤揮發(fā)分建模時,所述的光 譜S1經(jīng)由如下預(yù)處理得到:提取有效波段范圍在1350nm-2400nm區(qū)間的光譜;基于GP模型, 根據(jù)對每個單獨樣本點給出的預(yù)測值和方差,進行離群點檢測剔除;
[0020] (3)對于標(biāo)準(zhǔn)的高斯過程模型,確定高斯過程核函數(shù),也即該高斯過程的協(xié)方差函 數(shù)。作為優(yōu)選,取平方指數(shù)協(xié)方差函數(shù)作為煤樣光譜分析模型的高斯過程內(nèi)核,平方指數(shù)協(xié) 方差函數(shù)(SE)表示為:
[0022]其中,和1為高斯內(nèi)核中的參數(shù);
[0023] (4)對于步驟(3)中確定內(nèi)核的高斯過程,基于步驟(2)中所得的預(yù)處理后光譜S1 和定標(biāo)值Υ0進行核函數(shù)參數(shù)尋優(yōu)計算,進而得到相應(yīng)的高斯過程模型GP。作為優(yōu)選,參數(shù)尋 優(yōu)的方法采取兩輪網(wǎng)格搜索;
[0024] (5)對于步驟(4)中所得的高斯過程模型GP,在進行實際未知煤樣預(yù)測分析之前, 還需對模型進行評價驗證。作為優(yōu)選,模型的評價指標(biāo)選取校正均方根誤差(RMSEC)、預(yù)測 均方根誤差(RMSEP)、Pear S〇n相關(guān)系數(shù)R以及變異系數(shù)CV。在樣本較少的情況下,又可用留 一法交叉驗證均方根誤差(RMSECV)代替RMSEP。
[0025] 校正均方根誤差(RMSEC)可表示為:
[0027]其中:η為訓(xùn)練樣本數(shù),_v,為模型對訓(xùn)練集數(shù)據(jù)樣本i的預(yù)測值(校驗值),yi為訓(xùn)練 集數(shù)據(jù)樣本i的標(biāo)定值,標(biāo)定值通過化驗方法得到。
[0028] 預(yù)測均方根誤差(RMSEP)可表示為:
[0030] 其中:m為測試集預(yù)測樣本數(shù),yh為模型對測試集數(shù)據(jù)樣本i的預(yù)測值,71為測試集 數(shù)據(jù)樣本i的標(biāo)定值。
[0031] 交叉驗證均方根誤差(RMSECV)可表示為:
[0033]其中:η為總共的樣本數(shù),7#為留一法交叉驗證時模型對外部樣本i的預(yù)測結(jié)果,yi 為外部樣本i的標(biāo)定值。
[0034] Pearson相關(guān)系數(shù)R可表示為:
[0036]其中:Cov(yi,y*i)為預(yù)測值與標(biāo)定值的協(xié)方差,Var(yi)和Var(y*i)分別為標(biāo)定值 與預(yù)測值的方差,y#為模型對樣本i的預(yù)測值,為樣本i的標(biāo)定值。
[0037]變異系數(shù)CV可表示為:
[0039]其中:RMSE為均方根誤差(考察模型對內(nèi)部樣本預(yù)測效果時使用RMSEC,考察對外 部樣本預(yù)測效果時使用RMSECV),Mean為所有樣本標(biāo)定值的均值;
[0040] (6)對于步驟(4)中所得模型,經(jīng)步驟(5)進行各參數(shù)評價驗證之后,若滿足實際預(yù) 測要求,則確定為最終揮發(fā)分預(yù)測模型VMGP,用于未知樣本的揮發(fā)分參數(shù)預(yù)測。若不滿足要 求,則返回步驟(2)調(diào)整相關(guān)參數(shù),直至步驟(5)的驗證結(jié)果達標(biāo);
[0041] (7)對于新進未知煤樣,通過前述光譜掃描方法掃描煤樣得到該樣本的光譜數(shù)據(jù), 并進行與建模過程中相同的預(yù)處理,得到未知煤樣最終光譜S;
[0042] (8)將步驟(7)中所得的未知煤樣最終光譜S作為步驟(6)中所得最終揮發(fā)分預(yù)測 模型VMCP的輸入,即可通過模型計算得到未知煤樣的揮發(fā)分參數(shù)。
[0043] (9)步驟(1)~(8)為基于基本高斯過程(GP)的方法一的具體步驟。對于方法二中 由主成分分析(PCA)和高斯過程融合的PCA-GP預(yù)測模型,在進行步驟(3)之前還需對S1進行 PCA降維處理,得到S2。并以S2代替S1用于步驟(3)~(6),此時得到的最終揮發(fā)分預(yù)測模型 為VMPCA- CP。相應(yīng)地,在預(yù)測時,步驟(7)所述的未知煤樣最終光譜S也應(yīng)由與此時建模過程相 同的處理得到,并在步驟(8)中以VM PCA-GP代替VMgp來計算得到未知煤樣的揮發(fā)分參數(shù)。作為 優(yōu)選,在用PCA降維時選用基于貢獻率并在一定范圍內(nèi)的搜索結(jié)合RMSECV來確定最優(yōu)主成 分數(shù)。
[0044] 本發(fā)明的有益效果是:通過機械電氣設(shè)備完成煤的自動采樣、制樣,實現(xiàn)煤樣光譜 的不間斷采集,結(jié)合基于高斯過程的