本發(fā)明涉及產(chǎn)品質(zhì)量檢測領(lǐng)域,更具體地,涉及一種加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測方法。
背景技術(shù):
加氫裂化流程是石化企業(yè)極為重要的一個(gè)二次加工工藝流程,即在加熱、高氫壓和催化劑的條件下,使重質(zhì)油發(fā)生裂化反應(yīng),轉(zhuǎn)化成石腦油、汽油、航煤、柴油等輕質(zhì)、高質(zhì)量的油品。加氫裂化流程具有加工原料范圍寬、原料適應(yīng)性強(qiáng)、生產(chǎn)靈活性大、碳丟失率低、產(chǎn)品質(zhì)量好、液體產(chǎn)品收率高等優(yōu)點(diǎn),是大型煉廠和石化企業(yè)最重要、最可靠、最靈活和最有效的加工手段之一,并且其產(chǎn)品也被廣泛用于汽車、航空、船舶、重型機(jī)械、潤滑油生產(chǎn)等方面。
然而,由于原料油屬性變化、催化劑活性降低、裝置性能退化、生產(chǎn)方案及操作參數(shù)變化等原因,加氫裂化流程產(chǎn)品質(zhì)量也在發(fā)生變化,并且,產(chǎn)品的質(zhì)量不僅代表該流程的運(yùn)行狀況好壞,也會對下游的石化流程起到至關(guān)重要的作用。因此,對加氫裂化流程產(chǎn)品質(zhì)量進(jìn)行檢測并根據(jù)產(chǎn)品質(zhì)量對過程進(jìn)行評估、調(diào)整尤為重要。
目前,實(shí)際的加氫裂化流程產(chǎn)品質(zhì)量檢測大都采用人工離線化驗(yàn),這種檢測方式存在嚴(yán)重滯后,很可能導(dǎo)致操作人員不能及時(shí)調(diào)整過程變量而生產(chǎn)出不合格的產(chǎn)品油。為了及時(shí)評估加氫裂化流程的全局運(yùn)行狀況、并做出相應(yīng)的調(diào)整,在線的產(chǎn)品質(zhì)量檢測則顯得尤為關(guān)鍵。然而,考慮到安全性和可操作性,像餾點(diǎn)、硫含量、閃點(diǎn)、水含量等產(chǎn)品質(zhì)量指標(biāo)是無法通過在線化驗(yàn)方式進(jìn)行檢測的。因此,使用軟測量技術(shù)來實(shí)現(xiàn)加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測成為了學(xué)者們研究的熱點(diǎn)問題。
軟測量技術(shù)是以可測或易測的過程變量(或輔助變量)為基礎(chǔ),利用輔助變量和難測或待測過程變量(或主導(dǎo)變量)之間的數(shù)學(xué)關(guān)系(即軟測量模型),通過各種數(shù)學(xué)計(jì)算和估計(jì)實(shí)現(xiàn)對主導(dǎo)變量的測量。廣義的軟測量技術(shù)其實(shí)主要由數(shù)據(jù)采集、數(shù)據(jù)處理、軟測量模型和軟測量數(shù)據(jù)存儲、顯示與輸出4個(gè)部分組成。
目前,根據(jù)軟測量模型建立的方式,加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測方法分為基于機(jī)理的和數(shù)據(jù)驅(qū)動的兩種。基于機(jī)理的加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測是建立在對加氫裂化流程工藝和機(jī)理有深刻認(rèn)識的基礎(chǔ)上,通過對加氫裂化流程產(chǎn)品質(zhì)量的機(jī)理分析,找出其他實(shí)時(shí)可測輔助變量和不可測產(chǎn)品質(zhì)量指標(biāo)之間的關(guān)系,例如結(jié)合主要的過程變量和輕石腦油干點(diǎn)的關(guān)聯(lián)公式,建立加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測模型。但這種方法只能適用于機(jī)理明確的化工過程,并且針對每種產(chǎn)品質(zhì)量指標(biāo)都需要建立特定的模型,建模過程復(fù)雜。
基于數(shù)據(jù)驅(qū)動的加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測是通過多元線性回歸(MLR)、主元分析(PCR)、部分最小二乘(PLS)等統(tǒng)計(jì)分析方法和人工神經(jīng)網(wǎng)絡(luò)(ANN)、模糊技術(shù)、支持向量機(jī)(SVM)等智能算法,利用實(shí)際加氫裂化流程生產(chǎn)數(shù)據(jù)建立實(shí)時(shí)可測輔助變量和不可測產(chǎn)品質(zhì)量指標(biāo)之間的回歸模型,從而實(shí)現(xiàn)產(chǎn)品質(zhì)量的在線預(yù)測。這種方法非常適合變量多、非線性的復(fù)雜系統(tǒng),泛化性能好,簡單實(shí)用,具有較高的應(yīng)用價(jià)值。然而,目前來說,該類方法研究仍存在以下問題:第一,并沒有充分利用加氫裂化全流程過程變量,所建立的產(chǎn)品質(zhì)量在線預(yù)測模型基本都是只考慮分餾系統(tǒng)這一部分的過程變量,不利于加氫裂化流程全局運(yùn)行狀況評估;第二,加氫裂化流程過程變量多,目前主要依靠機(jī)理分析和工廠經(jīng)驗(yàn)選取輔助變量,主觀因素大;第三,加氫裂化流程是個(gè)大時(shí)滯系統(tǒng),即使是分餾系統(tǒng)也有近1.5小時(shí)的時(shí)滯,在外部條件發(fā)生變化時(shí),該過程存在穩(wěn)態(tài)和非穩(wěn)態(tài)情況,不同模態(tài)下所建立的質(zhì)量在線預(yù)測模型也是不同的,需要區(qū)分。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明針對現(xiàn)有加氫裂化產(chǎn)品質(zhì)量預(yù)測的數(shù)據(jù)驅(qū)動建模存在的問題,提供一種加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測方法,所述方法包括:
S1.基于產(chǎn)品質(zhì)量離線化驗(yàn)時(shí)間前一個(gè)所述加氫裂化流程時(shí)滯時(shí)間窗口內(nèi)的產(chǎn)品敏感參數(shù),利用多項(xiàng)式最小二乘法擬合得到所述每個(gè)敏感參數(shù)的穩(wěn)態(tài)指數(shù);
S2.基于所述每個(gè)敏感參數(shù)的穩(wěn)態(tài)指數(shù)和所述每個(gè)敏感參數(shù)對所述流程的影響程度,利用Dempster規(guī)則構(gòu)建系統(tǒng)穩(wěn)態(tài)指數(shù);根據(jù)系統(tǒng)穩(wěn)態(tài)指數(shù),獲得產(chǎn)品質(zhì)量離線化驗(yàn)時(shí)間前一個(gè)所述加氫裂化流程時(shí)滯時(shí)間窗口內(nèi)系統(tǒng)處于穩(wěn)態(tài)的穩(wěn)態(tài)數(shù)據(jù);
S3.基于所述穩(wěn)態(tài)數(shù)據(jù)中各敏感參數(shù)在所述加氫裂化流程時(shí)滯時(shí)間窗口內(nèi)的數(shù)據(jù)均值,利用隨機(jī)森林產(chǎn)品質(zhì)量在線預(yù)測模型實(shí)現(xiàn)所述產(chǎn)品的質(zhì)量在線預(yù)測。
與現(xiàn)有的方法相比,本發(fā)明提出的加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測方法具有以下效果:
充分利用加氫裂化全流程過程變量使得預(yù)測得到的質(zhì)量能夠反映全局運(yùn)行狀況;基于Spearman相關(guān)分析的部分逐步回歸法引入了敏感變量因子SVF,從多類型、多分布和多關(guān)聯(lián)海量數(shù)據(jù)中提取反映當(dāng)前運(yùn)行狀況、與產(chǎn)品質(zhì)量密切相關(guān)的敏感變量;基于主成分分析(PCA)對敏感變量進(jìn)行降維,得到敏感參數(shù),對高維的特征進(jìn)行降維、降低計(jì)算復(fù)雜度、加快處理速度,而且它還可以處理高耦合性特征,以使敏感參數(shù)盡量互不相關(guān)從而完全表現(xiàn)出系統(tǒng)的特征;基于主成分分析(PCA)中的單個(gè)主元貢獻(xiàn)率引入了穩(wěn)態(tài)權(quán)重因子SSWF,從而消除了以往在構(gòu)建系統(tǒng)穩(wěn)態(tài)指數(shù)SSSI時(shí)采用經(jīng)驗(yàn)賦值的主觀因素影響;充分考慮系統(tǒng)的穩(wěn)態(tài)和非穩(wěn)態(tài)的情況,基于穩(wěn)態(tài)數(shù)據(jù)建立加氫裂化流程柴油產(chǎn)品質(zhì)量在線預(yù)測模型,科學(xué)嚴(yán)謹(jǐn);使用的隨機(jī)森林回歸算法(RFR)相對于其他機(jī)器學(xué)習(xí)算法來說,具有預(yù)測精度高、泛化能力好、收斂速度快等優(yōu)點(diǎn),可有效避免“過擬合”現(xiàn)象的發(fā)生,適合各種高維數(shù)據(jù)集。
附圖說明
圖1為根據(jù)本發(fā)明實(shí)施例中加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測方法的總體流程圖;
圖2為根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例中加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測方法的總體流程圖;
圖3為根據(jù)本發(fā)明實(shí)施例1中基于主成分分析法的敏感參數(shù)及其穩(wěn)態(tài)權(quán)重因子獲取的流程圖;
圖4為根據(jù)本發(fā)明實(shí)施例1中多項(xiàng)式最小二乘法擬合對敏感參數(shù)的采樣區(qū)間數(shù)據(jù)進(jìn)行滑動窗口回歸示意圖;
圖5為根據(jù)本發(fā)明實(shí)施例1中隨機(jī)森林回歸算法單棵決策樹算法簡圖;
圖6為根據(jù)本發(fā)明實(shí)施例1中隨機(jī)森林回歸算法簡圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例,對本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
本發(fā)明的加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測方法,包括:
S1.基于產(chǎn)品質(zhì)量離線化驗(yàn)時(shí)間前一個(gè)所述加氫裂化流程時(shí)滯時(shí)間窗口內(nèi)的產(chǎn)品敏感參數(shù),利用多項(xiàng)式最小二乘法擬合得到所述每個(gè)敏感參數(shù)的穩(wěn)態(tài)指數(shù);
S2.基于所述每個(gè)敏感參數(shù)的穩(wěn)態(tài)指數(shù)和所述每個(gè)敏感參數(shù)對所述流程的影響程度,利用Dempster規(guī)則構(gòu)建系統(tǒng)穩(wěn)態(tài)指數(shù);根據(jù)系統(tǒng)穩(wěn)態(tài)指數(shù),獲得產(chǎn)品質(zhì)量離線化驗(yàn)時(shí)間前一個(gè)所述加氫裂化流程時(shí)滯時(shí)間窗口內(nèi)系統(tǒng)處于穩(wěn)態(tài)的穩(wěn)態(tài)數(shù)據(jù);
S3.基于所述穩(wěn)態(tài)數(shù)據(jù)中各敏感參數(shù)在所述加氫裂化流程時(shí)滯時(shí)間窗口內(nèi)的數(shù)據(jù)均值,利用隨機(jī)森林產(chǎn)品質(zhì)量在線預(yù)測模型實(shí)現(xiàn)所述產(chǎn)品的質(zhì)量在線預(yù)測。
本發(fā)明的方法充分利用加氫裂化全流程過程變量,使得預(yù)測得到的質(zhì)量能夠反映全局運(yùn)行狀況。
在本發(fā)明的一個(gè)實(shí)施例中,為了更好的去噪,在S1中使用多項(xiàng)式最小二乘法擬合對每個(gè)所述敏感參數(shù)的采樣區(qū)間數(shù)據(jù)進(jìn)行滑動窗口H回歸,得到敏感參數(shù)在各個(gè)采樣點(diǎn)的回歸值,用回歸值代替原測量值可以更好地去噪。
同時(shí),多項(xiàng)式最小二乘法擬合含有所述敏感參數(shù)的回歸值的變化信息,求一階導(dǎo),得到敏感參數(shù)的穩(wěn)態(tài)指數(shù)。即多項(xiàng)式最小二乘法擬合含有敏感參數(shù)的變化信息,其在采樣點(diǎn)的一階導(dǎo)數(shù)即為該敏感參數(shù)在該采樣點(diǎn)的變化快慢,并將共定義為該敏感參數(shù)的穩(wěn)態(tài)指數(shù)SSI,根據(jù)敏感參數(shù)的穩(wěn)態(tài)指數(shù)可以檢測該敏感參數(shù)信號的穩(wěn)態(tài)和非穩(wěn)態(tài)。
在一個(gè)優(yōu)選實(shí)施例中,多項(xiàng)式最小二乘法擬合的具體步驟為:
對某個(gè)敏感參數(shù)在采樣區(qū)間的序列x(j)進(jìn)行多項(xiàng)式最小二乘法擬合時(shí),首先定義一個(gè)長度為奇數(shù)的H長窗口,H=2h+1,h為正整數(shù)。設(shè)在某一時(shí)刻,窗口內(nèi)的信號樣本為x(j-h),…,x(j),…,x(j+h),其中x(j)為位于窗口中心的該敏感參數(shù)樣本值。
令窗口內(nèi)的信號樣本x(j-h),…,x(j),…,x(j+h)為x′(1),…,x′(h+1),…,x′(2h+1),其中x′(h+1)為位于窗口中心的該敏感參數(shù)樣本值,對應(yīng)的采樣時(shí)刻t分別為1,2…,2h+1,則窗口內(nèi)的擬合信號則可以表示為時(shí)間t的函數(shù),即:
其中,a=[a0a1,…,an]T,n<2h+1為多項(xiàng)式最小二乘法擬合模型參數(shù)向量,r(t)=[1,t,t2,…,tn]T為回歸變量。應(yīng)用最小二乘法就可以得到參數(shù)a的最優(yōu)估計(jì):
式中:
則經(jīng)過多項(xiàng)式最小二乘法擬合后的擬合信號為
則敏感參數(shù)在各個(gè)采樣點(diǎn)x(j)的回歸值為:
用回歸值代替原測量值可以去噪。采用滑動窗口方法即可得到該敏感參數(shù)在采樣區(qū)間的多項(xiàng)式最小二乘法擬合回歸值序列。
在一個(gè)優(yōu)選實(shí)施例中,為了減少隨外部條件變化而波動變化不大的相關(guān)變量以及波動無規(guī)則的相關(guān)變量,本發(fā)明方法中敏感參數(shù)的獲取包括以下步驟:
1)從生產(chǎn)數(shù)據(jù)庫中提取加氫裂化全流程中過程變量;
2)基于所述過程變量在外部條件發(fā)生變化時(shí)的波動趨勢,篩選出主要過程變量;
3)使用帶滑窗的中值濾波對所述主要過程變量的實(shí)際歷史運(yùn)行數(shù)據(jù)進(jìn)行濾波去噪,得到所述敏感參數(shù)。
在所述步驟1)中,從煉油工廠數(shù)據(jù)庫中提取加氫裂化全流程可測過程變量及其歷史數(shù)據(jù),根據(jù)工藝和機(jī)理,初步提取與產(chǎn)品質(zhì)量相關(guān)過程變量。
在所述步驟2)中,分析當(dāng)外部條件發(fā)生變化時(shí)各個(gè)相關(guān)變量的趨勢波動情況,篩選出主要過程變量。目的是為了排除無波動、平穩(wěn)的相關(guān)變量,即隨外部條件變化而波動變化不大的相關(guān)變量,并排除波動無規(guī)則的相關(guān)變量,即與外部條件變化無關(guān)的變化劇烈的相關(guān)變量。
在所述步驟3)中,采用滑動窗口為L的中值濾波對主要變量的實(shí)際歷史運(yùn)行數(shù)據(jù)進(jìn)行濾波去噪,從而消除加氫裂化流程儀表檢測時(shí)、數(shù)據(jù)傳輸過程中受到的干擾。
其中,所述步驟3)中采用滑動窗口為L的中值濾波的具體步驟為本領(lǐng)域中常用的中值濾波法,在本發(fā)明的方法中優(yōu)選的步驟為:
對某個(gè)主要變量在采樣區(qū)間的序列x(j)進(jìn)行濾波處理時(shí),首先定義一個(gè)長度為奇數(shù)的L長窗口,L=2N+1,N為正整數(shù)。設(shè)在某一時(shí)刻,窗口內(nèi)的信號樣本為
x(j-N),…,x(j),…,x(j+N)
其中,x(j)為位于窗口中心的該主要變量樣本值。
對L個(gè)該主要變量樣本值按從小到大的順序排列后,其中排序在j處的樣本值便定義為中值濾波的輸出值,表達(dá)式為:
y(j)=Med[x(j-N),…,x(j),…,x(j+N)]
采用滑動窗口方法即可得到該主要變量在采樣區(qū)間的中值濾波序列。
為了減少選取變量的冗余信息,大大降低計(jì)算量,所述敏感參數(shù)的獲取還包括:
在去噪后,基于濾波去噪后的主要過程變量,利用Spearman相關(guān)性分析的部分逐步回歸法定義敏感變量因子并進(jìn)行敏感變量優(yōu)選,得到所述敏感參數(shù)。
即根據(jù)外部變化的條件(如進(jìn)料總流量)與主要過程變量的Spearman相關(guān)性系數(shù),定義敏感變量因子SVF,設(shè)定閾值為ε∈[0,1],篩選出敏感變量因子大于ε的主要過程變量,得到敏感變量,并部分逐步引入非敏感變量或剔除敏感變量,根據(jù)預(yù)測偏差Δe來驗(yàn)證所選取的敏感變量正確性。
在本發(fā)明的一個(gè)實(shí)施例中,利用Spearman相關(guān)系統(tǒng)確定敏感變量因子,并結(jié)合逐步回歸法的優(yōu)點(diǎn)來驗(yàn)證篩選出的敏感變量是否正確。
其中,基于Spearman相關(guān)性分析的部分逐步回歸法的具體步驟包括:
根據(jù)Spearman相關(guān)性系數(shù)分析外部變化的條件(如原料總?cè)肟诹髁?與主要過程變量的相關(guān)性,計(jì)算公式為:
K為主要變量個(gè)數(shù),x1為加氫裂化流程進(jìn)料泵出口流量的采樣數(shù)據(jù),xi為其他主要變量的采樣數(shù)據(jù)。
定義第i變量的敏感變量因子為:SVFi=ρi,設(shè)定閾值為ε∈[0,1],篩選出敏感變量因子大于ε的主要過程變量,得到敏感變量。并部分逐步引入非敏感變量或剔除敏感變量,根據(jù)預(yù)測偏差Δe來驗(yàn)證所選取的敏感變量正確性,判別公式為:
Δe=e′-e≤(0.05~0.1)e
e為所選取的敏感變量時(shí)的預(yù)測結(jié)果,e′為在敏感變量的基礎(chǔ)上引入或剔除變量時(shí)的預(yù)測結(jié)果。
在一個(gè)優(yōu)選實(shí)施例中,為了對高維的特征進(jìn)行降維、降低計(jì)算復(fù)雜度、加快處理速度,在使用多項(xiàng)式最小二乘法之前還包括將所述敏感參數(shù)經(jīng)過PCA歸一化和正規(guī)化特征向量矩陣變化處理。
其中,基于主成分分析法(PCA)對敏感參數(shù)進(jìn)行降維,當(dāng)前n個(gè)成分累計(jì)貢獻(xiàn)大于或等于ξ時(shí),取其為主成分并將其作為降維后敏感參數(shù),并將每個(gè)敏感參數(shù)的單個(gè)貢獻(xiàn)率(或相關(guān)系數(shù)矩陣特征值)定義為穩(wěn)態(tài)權(quán)重因子SSWF,穩(wěn)態(tài)權(quán)重因子是指每個(gè)敏感參數(shù)對多變量系統(tǒng)的影響程度。
使用PCA的目的是其不僅可以對高維的特征進(jìn)行降維、降低計(jì)算復(fù)雜度、加快處理速度,而且它還可以處理高耦合性特征,以使敏感參數(shù)盡量互不相關(guān)從而完全表現(xiàn)出系統(tǒng)的特征。
所述基于主成分分析法的敏感參數(shù)獲取的具體步驟包括:
1)對敏感變量的采樣數(shù)據(jù)進(jìn)行歸一化:
由于不同敏感變量的量綱不同,為了處理方便,應(yīng)先對原始數(shù)據(jù)進(jìn)行歸一化,記敏感變量的采樣數(shù)據(jù)中共有M個(gè)樣本,每個(gè)樣本有N個(gè)敏感變量,則共有N個(gè)敏感變量向量,分別記為Ci(i=1,2,…,N),而Cji(j=1,2,…,M;i=1,2,…,N)為第j樣本的第i個(gè)敏感變量樣本值。
歸一化計(jì)算公式為:
其中,E(Ci)指Ci的均值,Var(Ci)指Ci的標(biāo)準(zhǔn)差。
2)求敏感變量間的相關(guān)系數(shù)矩陣:
經(jīng)過歸一化后的敏感變量向量為Gi(i=1,2,…,N),N個(gè)敏感變量的相關(guān)系數(shù)可以構(gòu)成一個(gè)N×N的相關(guān)系數(shù)矩陣R,R中的每個(gè)元素記為Rij(i=1,2,…,N;j=1,2,…,N),每個(gè)元素的值為:
式中Conv(Gi,Gj)表示Gi和Gj的協(xié)方差,D(Gi)和D(Gj)分別表示Gi和Gj的方差??梢园l(fā)現(xiàn)相關(guān)系數(shù)矩陣R是個(gè)對稱矩陣。
3)求敏感變量正規(guī)化單位特征向量。對于N×N的相關(guān)系數(shù)矩陣R,共可求得N個(gè)特征值,記為λi,根據(jù)由大到小依次排序?yàn)棣?sub>1、λ2、…、λN,再求出每個(gè)特征值所對應(yīng)的正規(guī)化單位特征向量,記為Li=[l1i l2i…lNi]T。
4)根據(jù)特征值的累計(jì)貢獻(xiàn)率確定主成分,即敏感參數(shù)。
累計(jì)貢獻(xiàn)率是由特征值的大小所決定的,則前n成分的累計(jì)貢獻(xiàn)率CRn計(jì)算公式如下:
當(dāng)累計(jì)貢獻(xiàn)率CRn≥ξ,其中ξ為控制值,這時(shí)的n為敏感參數(shù)個(gè)數(shù),新的敏感參數(shù)正規(guī)化單位特征向量矩陣為步驟3)中前n個(gè)正規(guī)化單位特征向量L1、L2、…、Ln組成的矩陣L′,新的敏感參數(shù)的樣本數(shù)據(jù)矩陣為Y=D×L′,新的敏感參數(shù)即為Y的列屬性。
其中,敏感參數(shù)穩(wěn)態(tài)權(quán)重因子SSWF為敏感參數(shù)的單個(gè)貢獻(xiàn)率(或相關(guān)系數(shù)矩陣特征值),即每個(gè)敏感參數(shù)穩(wěn)態(tài)權(quán)重因子為:
它反映每個(gè)敏感參數(shù)對多變量系統(tǒng)的影響程度。
在本發(fā)明一個(gè)優(yōu)選實(shí)施例中,S2中基于所述每個(gè)敏感參數(shù)的穩(wěn)態(tài)指數(shù)和所述每個(gè)敏感參數(shù)對所述流程的影響程度,利用Dempster規(guī)則構(gòu)建系統(tǒng)穩(wěn)態(tài)指數(shù);其中,所述每個(gè)敏感參數(shù)對所述系統(tǒng)的影響程度也稱穩(wěn)態(tài)權(quán)重因子,可以為當(dāng)敏感參數(shù)經(jīng)過主成分分析法后進(jìn)行降維處理時(shí)每個(gè)敏感參數(shù)的單個(gè)貢獻(xiàn)率,也可以用其它方法測定。
其中,S2中Dempster規(guī)則構(gòu)建系統(tǒng)穩(wěn)態(tài)指數(shù)的公式為:
其中,SSSI表示系統(tǒng)穩(wěn)態(tài)指數(shù),SSI和SSWF分別指的是各敏感參數(shù)的穩(wěn)態(tài)指數(shù)和穩(wěn)態(tài)權(quán)重因子,i為敏感參數(shù)序號。
設(shè)定閾值μ,根據(jù)檢測精度來取值,一般取值為0.6~1,從而判斷加氫裂化流程系統(tǒng)是否處于穩(wěn)態(tài),其中,當(dāng)SSSI大于閾值μ,則認(rèn)為系統(tǒng)瞬時(shí)穩(wěn)態(tài)。
在本發(fā)明一個(gè)優(yōu)選實(shí)施例中,S3中隨機(jī)森林產(chǎn)品質(zhì)量在線預(yù)測模型的構(gòu)建為:
基于煉油工廠數(shù)據(jù)庫中的敏感參數(shù),遍歷S1和S2,得到穩(wěn)態(tài)數(shù)據(jù);
將所述穩(wěn)態(tài)數(shù)據(jù)中各敏感參數(shù)在所述流程時(shí)滯時(shí)間窗口內(nèi)的數(shù)據(jù)均值作為所述敏感參數(shù)的特征值,與該離線化驗(yàn)時(shí)間的產(chǎn)品質(zhì)量組成訓(xùn)練集的一個(gè)樣本元素;
使用隨機(jī)森林回歸算法訓(xùn)練所建立的訓(xùn)練集,構(gòu)建所述模型
在一個(gè)優(yōu)選實(shí)施例中,所述隨機(jī)森林回歸算法具體為:
S31.假定RF算法中需建立的決策樹數(shù)量為k,對于每棵決策樹,采用自助法重采樣方法有放回地從總訓(xùn)練集T中隨機(jī)抽取和T樣本容量相同的訓(xùn)練集Ti(i=1,…,k),并分別作為k棵決策樹的訓(xùn)練集;
S32.對于第i棵決策樹的每個(gè)分支節(jié)點(diǎn),采用不放回的采樣方法從所述敏感參數(shù)特征集M中隨機(jī)抽取m個(gè)特征變量作為特征子集Mij(i=1,…,k,j=1,2,…),j表示該決策樹使用特征子集的個(gè)數(shù);每個(gè)分支節(jié)點(diǎn)的特征子集Mij的特征變量數(shù)m為總特征變量M維度的開方,即則
S33.對每棵決策樹,以Ti為訓(xùn)練樣本,Mi為特征子集集合進(jìn)行訓(xùn)練,從Mij中選擇一個(gè)最具有分類能力的變量對該節(jié)點(diǎn)進(jìn)行分裂,得到一個(gè)隨機(jī)森林回歸模型{RF(Ti,Mi),i=1,…,k,},其中,RF(Ti,Mi)為每棵決策樹分類結(jié)果;
S34.輸入敏感參數(shù)特征值向量X,通過收集各個(gè)決策樹的預(yù)測值,并對其加權(quán)均值作為產(chǎn)品質(zhì)量預(yù)測結(jié)果,即:
實(shí)施例1:
一種加氫裂化流程柴油產(chǎn)品質(zhì)量在線預(yù)測方法,流程圖如圖2所示,包括以下步驟:
步驟(1)、從煉油工廠數(shù)據(jù)庫中提取1700多個(gè)加氫裂化全流程可測過程變量及其歷史數(shù)據(jù),根據(jù)工藝和機(jī)理,初步提取與柴油產(chǎn)品質(zhì)量相關(guān)的162個(gè)過程變量;
步驟(2)、分析當(dāng)加氫裂化流程進(jìn)料總流量發(fā)生變化時(shí),各個(gè)相關(guān)變量的趨勢波動情況,篩選出68個(gè)主要過程變量。目的是為了排除無波動、平穩(wěn)的相關(guān)變量,即隨進(jìn)料總流量變化而波動變化不大的相關(guān)變量,并排除波動無規(guī)則的相關(guān)變量,即與進(jìn)料總流量變化無關(guān)的變化劇烈的相關(guān)變量。
步驟(3)、采用滑動窗口為L=215(加氫裂化流程的時(shí)滯)的中值濾波對主要變量的實(shí)際歷史運(yùn)行數(shù)據(jù)進(jìn)行濾波去噪,從而消除加氫裂化流程儀表檢測時(shí)、數(shù)據(jù)在傳輸過程中受到的干擾。其中滑動窗口為L=215的中值濾波的具體步驟包括:對某個(gè)主要變量在采樣區(qū)間的序列x(j)進(jìn)行濾波處理時(shí),首先定義一個(gè)長度為奇數(shù)的L長窗口,L=2N+1,N為正整數(shù)。設(shè)在某一時(shí)刻,窗口內(nèi)的信號樣本為x(j-N),…,x(j),…,x(j+N),其中x(j)為位于窗口中心的該主要變量樣本值。對L個(gè)該主要變量樣本值按從小到大的順序排列后,其中排序在j處的樣本值便定義為中值濾波的輸出值,表達(dá)式為:
y(j)=Med[x(j-N),…,x(j),…,x(j+N)]
采用滑動窗口方法即可得到該主要變量在采樣區(qū)間的中值濾波序列。
步驟(4)、提出基于Spearman相關(guān)性分析的部分逐步回歸法定義敏感變量因子SVF并進(jìn)行敏感變量優(yōu)選,即根據(jù)進(jìn)料總流量與主要過程變量的Spearman相關(guān)性系數(shù),計(jì)算公式為:
K為主要變量個(gè)數(shù),x1為加氫裂化流程進(jìn)料泵出口流量的采樣數(shù)據(jù),xi為其他主要變量的采樣數(shù)據(jù),定義第i變量的敏感變量因子為:SVFi=ρi,設(shè)定閾值為ε=0.6,篩選出敏感變量因子大于ε的主要過程變量,得到42個(gè)敏感變量(如表1所示),并部分逐步引入非敏感變量或剔除敏感變量,根據(jù)預(yù)測偏差Δe來驗(yàn)證所選取的敏感變量正確性,判別公式為:
Δe=e′-e≤(0.05~0.1)e
e為所選取的敏感變量時(shí)的預(yù)測結(jié)果,e′為在敏感變量的基礎(chǔ)上引入或剔除變量時(shí)的預(yù)測結(jié)果。目的是減少選取變量的冗余信息,并大大降低計(jì)算量。
表1本實(shí)施例基于敏感變量因子篩選出的敏感變量列表
步驟(5)、基于主成分分析法(PCA)對敏感變量進(jìn)行降維,當(dāng)前n個(gè)成分累計(jì)貢獻(xiàn)大于或等于ξ=95%時(shí),取其為主成分(下面稱為敏感參數(shù)),并將每個(gè)敏感參數(shù)的單個(gè)貢獻(xiàn)率(或相關(guān)系數(shù)矩陣特征值)定義為穩(wěn)態(tài)權(quán)重因子SSWF,即每個(gè)敏感參數(shù)對多變量系統(tǒng)的影響程度。使用PCA的目的是其不僅可以對高維的特征進(jìn)行降維、降低計(jì)算復(fù)雜度、加快處理速度,而且它還可以處理高耦合性特征,以使敏感參數(shù)盡量互不相關(guān)從而完全表現(xiàn)出系統(tǒng)的特征。其中基于主元分析法(PCA)(如圖3所示)的敏感參數(shù)獲取的具體步驟包括:
1)對敏感變量的采樣數(shù)據(jù)進(jìn)行歸一化。由于不同敏感變量的量綱不同,為了處理方便,應(yīng)先對原始數(shù)據(jù)進(jìn)行歸一化,記敏感變量的采樣數(shù)據(jù)中共有M個(gè)樣本,每個(gè)樣本有N個(gè)敏感變量,則共有N個(gè)敏感變量向量,分別記為Ci(i=1,2,…,N),而cji(j=1,2,…,M;i=1,2,…,N)為第j樣本的第i個(gè)敏感變量樣本值。歸一化計(jì)算公式為:
其中,E(Ci)指Ci的均值,Var(Ci)指Ci的標(biāo)準(zhǔn)差。
2)求敏感變量間的相關(guān)系數(shù)矩陣。經(jīng)過歸一化后的敏感變量向量為Gi(i=1,2,…,N),N個(gè)敏感變量的相關(guān)系數(shù)可以構(gòu)成一個(gè)N×N的相關(guān)系數(shù)矩陣R,R中的每個(gè)元素記為Rij(i=1,2,…,N;j=1,2,…,N),每個(gè)元素的值為:
式中Conv(Gi,Gj)表示Gi和Gj的協(xié)方差,D(Gi)和D(Gj)分別表示Gi和Gj的方差。可以發(fā)現(xiàn)相關(guān)系數(shù)矩陣R是個(gè)對稱矩陣。
3)求敏感變量正規(guī)化單位特征向量。對于N×N的相關(guān)系數(shù)矩陣R共可求得N個(gè)特征值,記為λi,根據(jù)由大到小依次排序?yàn)棣?sub>1、λ2、…、λN,再求出每個(gè)特征值所對應(yīng)的正規(guī)化單位特征向量,記為Li=[l1i l2i…lNi]T。
4)根據(jù)特征值的累計(jì)貢獻(xiàn)率確定主成分,即敏感參數(shù)。累計(jì)貢獻(xiàn)率是由特征值的大小所決定的,則前n成分的累計(jì)貢獻(xiàn)率CRn計(jì)算公式如下:
當(dāng)累計(jì)貢獻(xiàn)率CRn≥ξ=95%,其中ξ為控制值,這時(shí)的n為敏感參數(shù)個(gè)數(shù),新的敏感參數(shù)正規(guī)化單位特征向量矩陣為步驟3)中前n個(gè)正規(guī)化單位特征向量L1、L2、…、Ln組成的矩陣L′,新的敏感參數(shù)的樣本數(shù)據(jù)矩陣為Y=D×L′,新的敏感參數(shù)即為Y的列屬性。
其中,穩(wěn)態(tài)權(quán)重因子SSWF為每個(gè)敏感參數(shù)的單個(gè)貢獻(xiàn)率(或相關(guān)系數(shù)矩陣特征值),即每個(gè)敏感參數(shù)穩(wěn)態(tài)權(quán)重因子為:
步驟(6)、使用多項(xiàng)式最小二乘法擬合對每個(gè)敏感參數(shù)的采樣區(qū)間數(shù)據(jù)進(jìn)行滑動窗口H回歸(示意圖如圖4所示),得到敏感參數(shù)在各個(gè)采樣點(diǎn)的回歸值,用回歸值代替原測量值可以去噪,而且多項(xiàng)式最小二乘法擬合含有敏感參數(shù)的變化信息,其在采樣點(diǎn)的一階導(dǎo)數(shù)即為該敏感參數(shù)在該采樣點(diǎn)的變化快慢,并定義其為敏感參數(shù)的穩(wěn)態(tài)指數(shù)SSI,根據(jù)敏感參數(shù)的穩(wěn)態(tài)指數(shù)可以檢測信號的穩(wěn)態(tài)和非穩(wěn)態(tài)。其中多項(xiàng)式最小二乘法擬合的具體步驟包括:對某個(gè)敏感參數(shù)在采樣區(qū)間的序列x(j)進(jìn)行多項(xiàng)式最小二乘法擬合時(shí),首先定義一個(gè)長度為奇數(shù)的H長窗口,H=2h+1,h為正整數(shù)。設(shè)在某一時(shí)刻,窗口內(nèi)的信號樣本為x(j-h),…,x(j),…,x(j+h),其中x(j)為位于窗口中心的該敏感參數(shù)樣本值。令窗口內(nèi)的信號樣本x(j-h),…,x(j),…,x(j+h)x′(1),…,x′(h+1),…,x′(2h+1),其中x′(h+1)為位于窗口中心的該敏感參數(shù)樣本值,對應(yīng)的采樣時(shí)刻t分別為1,2…,2h+1,則窗口內(nèi)的擬合信號則可以表示為時(shí)間t的函數(shù),即:
其中,a=[a0 a1,…,an]T,n<2h+1為多項(xiàng)式最小二乘法擬合模型參數(shù)向量,r(t)=[1,t,t2,…,tn]T為回歸變量。應(yīng)用最小二乘法就可以得到參數(shù)a的最優(yōu)估計(jì):
式中:
則經(jīng)過多項(xiàng)式最小二乘法擬合后的擬合信號為
則敏感參數(shù)在各個(gè)采樣點(diǎn)x(j)的回歸值為:
其中敏感參數(shù)的穩(wěn)態(tài)指數(shù)SSI為多項(xiàng)式最小二乘法擬合在采樣點(diǎn)的一階導(dǎo)數(shù),即為該敏感參數(shù)在該采樣點(diǎn)的變化快慢:
根據(jù)敏感參數(shù)的穩(wěn)態(tài)指數(shù)就可以檢測信號的穩(wěn)態(tài)和非穩(wěn)態(tài)。
步驟(7)、利用Dempster規(guī)則由各敏感參數(shù)的穩(wěn)態(tài)權(quán)重因子SSWF和穩(wěn)態(tài)指數(shù)SSI構(gòu)建系統(tǒng)穩(wěn)態(tài)指數(shù)SSSI,計(jì)算公式為:
設(shè)定閾值μ,根據(jù)檢測精度來取值,一般取值為0.6~1,這里取μ=0.7,從而判斷加氫裂化流程系統(tǒng)是否處于穩(wěn)態(tài)。
步驟(8)、為了消除系統(tǒng)大時(shí)滯性,根據(jù)系統(tǒng)穩(wěn)態(tài)指數(shù),獲得產(chǎn)品質(zhì)量離線化驗(yàn)時(shí)間前一個(gè)流程時(shí)滯時(shí)間窗口內(nèi)系統(tǒng)基本處于穩(wěn)態(tài)的穩(wěn)態(tài)數(shù)據(jù),并將流程時(shí)滯時(shí)間窗口內(nèi)各敏感參數(shù)在采樣點(diǎn)的數(shù)據(jù)的均值作為該敏感參數(shù)的特征值X,與該離線化驗(yàn)時(shí)間的產(chǎn)品質(zhì)量Q組成訓(xùn)練集T的一個(gè)樣本元素。
步驟(9)、使用隨機(jī)森林回歸算法(RFR)訓(xùn)練所建立的訓(xùn)練集T,建立一個(gè)穩(wěn)態(tài)的加氫裂化流程產(chǎn)品質(zhì)量在線預(yù)測模型。隨機(jī)森林回歸算法(RFR)的核心就是算法由多棵決策樹組成,如圖5所示,每棵樹就是從根節(jié)點(diǎn)到葉節(jié)點(diǎn)根據(jù)特征變量不斷分支的過程。具體步驟(簡圖如6所示)包括:
1)假定RF算法中需建立的決策樹數(shù)量為100,對于每棵決策樹,采用自助法(bootstrap)重采樣方法有放回地從總訓(xùn)練集T中隨機(jī)抽取和T樣本容量相同的訓(xùn)練集Ti(i=1,…,100),并分別作為100棵決策樹的訓(xùn)練集;
2)對于第i棵決策樹的每個(gè)分支節(jié)點(diǎn),采用不放回的采樣方法從總特征變量M(本文中即為敏感參數(shù)特征集)中隨機(jī)抽取m個(gè)特征變量作為特征子集Mij(i=1,…,100,j=1,2,…)(j表示該決策樹使用特征子集的個(gè)數(shù))。通常情況下,每個(gè)分支節(jié)點(diǎn)的特征子集Mij的特征變量數(shù)m為總特征變量M維度的開方,即則
3)對每棵決策樹,以Ti為訓(xùn)練樣本,Mi為特征子集集合進(jìn)行訓(xùn)練,從Mij中選擇一個(gè)最具有分類能力的變量對該節(jié)點(diǎn)進(jìn)行分裂,每個(gè)決策樹都得到最大限度的生產(chǎn),而不進(jìn)行剪枝。這樣我們就可以得到一個(gè)隨機(jī)森林回歸模型{RF(Ti,Mi),i=1,…,100},其中,RF(Ti,Mi)為每棵決策樹分類結(jié)果。
步驟(10)、將當(dāng)前煉油工廠數(shù)據(jù)庫中前一個(gè)流程時(shí)滯時(shí)間窗口內(nèi)的敏感變量數(shù)據(jù)經(jīng)過中值濾波、步驟(6)中PCA歸一化和正規(guī)化特征向量矩陣變化處理后得到敏感參數(shù)數(shù)據(jù),再通過多項(xiàng)式最小二乘法擬合、系統(tǒng)穩(wěn)態(tài)檢測,判斷系統(tǒng)處于基本穩(wěn)態(tài)后將敏感參數(shù)在流程時(shí)滯時(shí)間窗口內(nèi)的數(shù)據(jù)均值作為該敏感參數(shù)的特征值,將敏感參數(shù)特征值向量X輸入到訓(xùn)練好的隨機(jī)森林產(chǎn)品質(zhì)量在線預(yù)測模型,通過收集各個(gè)決策樹的預(yù)測值,并對其加權(quán)均值作為產(chǎn)品質(zhì)量預(yù)測結(jié)果,完成該時(shí)刻的產(chǎn)品質(zhì)量Q檢測,即:
最后,本申請的方法僅為較佳的實(shí)施方案,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。