專利名稱:基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法
技術(shù)領(lǐng)域:
本發(fā)明涉及帶鋼熱連軋精軋終軋溫度模型建立過程中的關(guān)鍵特征變量提取方法, 特別涉及基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法。
背景技術(shù):
在熱軋帶鋼生產(chǎn)中,精軋機組終軋溫度的控制精度對最終產(chǎn)品的組織性能有直接 影響。精軋帶鋼全長終軋溫度控制一直是熱軋生產(chǎn)中的重要研究課題,也是難點之一。第 一,影響精軋終軋溫度的過程變量眾多;第二,精軋區(qū)內(nèi)有效測溫點少,只有粗軋出口和精 軋出口的兩個點測溫條件最可靠;第三,原有的溫度相關(guān)工藝模型精度有限,達不到實時控 制的要求;第四,用來控制全長終軋溫度的常用手段包括控制帶鋼運行加速度和機架間噴 淋的水量和水壓,它們對終軋溫度的影響都有很大的滯后,很難用常規(guī)的無模型控制方法 實現(xiàn)有效控制。綜合分析以上問題,可以得出結(jié)論,建立可靠的終軋溫度控制模型是對精軋終軋 溫度進行有效控制的前提。建立有效的溫度模型,就可以克服精軋生產(chǎn)線缺少有效測溫點 的困難,也可以彌補原有工藝模型精度低不能用于實時控制的缺點,更可以進行有效的溫 度預(yù)報,從而解決水量和速度對溫度的控制滯后問題。而建立可靠的終軋溫度控制模型的 前提,就是從眾多的精軋過程變量中提取出對精軋終軋溫度有決定性影響的若干關(guān)鍵特征 變量。為建立終軋溫度預(yù)報模型和修正精軋溫度工藝模型奠定基礎(chǔ)。
發(fā)明內(nèi)容
基于以上原因,本專利提出一種基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方 法。這種方法能從精軋海量過程數(shù)據(jù)中,最終提取到精軋溫控過程中的具有決定性作用的 關(guān)鍵特征變量,為建立終軋溫度預(yù)報模型和修正精軋溫度工藝模型奠定基礎(chǔ)。本發(fā)明的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,包括如下步驟a)對精軋過程數(shù)據(jù)進行預(yù)處理,將以帶鋼號為索引的過程數(shù)據(jù)轉(zhuǎn)化為以精軋溫度 為目標屬性的決策屬性向量;b)對精軋終軋溫度進行非線性離散化;c)計算以精軋終軋溫度為目標屬性的決策屬性向量中每個離散或連續(xù)值決策屬 性的信息增益率,生成以精軋終軋溫度為目標屬性的決策樹;d)根據(jù)信息增益率判定各個離散或連續(xù)值決策屬性對精軋終軋溫度影響的大小, 并按照決策樹的結(jié)點順序?qū)Q策屬性向量重新排序;e)提取影響精軋終軋溫度的關(guān)鍵特征變量。所述步驟a)對精軋過程數(shù)據(jù)進行預(yù)處理,包括去噪和數(shù)據(jù)整理。從現(xiàn)場采集的海量過程數(shù)據(jù),是按帶鋼號索引并由幾百個字段數(shù)據(jù)組成。首先,數(shù) 據(jù)采集過程中必然有一些偶然因素,所以要把超限幅噪聲數(shù)據(jù)濾掉,避免它們給信息熵和 信息增益率的計算帶來不利影響;其次,過程數(shù)據(jù)的索引排列形式也不符合對終軋溫度進行決策的物理意義要求,因此要對數(shù)據(jù)進行去噪和整理。所述的去噪為首先根據(jù)工藝和設(shè)備條件給出精軋過程數(shù)據(jù)的各個字段值的上下 限幅值,然后按照限幅值對相應(yīng)字段的所有數(shù)據(jù),用限幅濾波法濾掉所有的該字段數(shù)據(jù)超 過限幅值的過程數(shù)據(jù)向量。在給出精軋過程數(shù)據(jù)的各個字段值的上下限幅值時需要按照精 軋工藝和設(shè)備情況進行確定。所述的數(shù)據(jù)整理是將精軋過程數(shù)據(jù)的所有索引變量去掉,再將一條帶鋼的一個分 段號對應(yīng)的所有數(shù)據(jù)整理為一個數(shù)據(jù)向量,然后以精軋終軋溫度為目標屬性,將數(shù)據(jù)向量 中的各個數(shù)據(jù)字段對應(yīng)作為向量的各個決策屬性,從而將過程數(shù)據(jù)轉(zhuǎn)化為以精軋終軋溫度 為目標屬性的決策屬性向量。由帶鋼號索引的精軋過程數(shù)據(jù)是按照帶鋼號、帶鋼分段號和機架號分別采集的。 具體的過程數(shù)據(jù)分類形式為數(shù)據(jù)系列1 : {帶鋼號,字段n,字段12,字段13,......}數(shù)據(jù)系列2 {帶鋼號,字段21,字段22,字段23,......}數(shù)據(jù)系列3 {帶鋼號,分段號i,字段3il,字段3i2,......}數(shù)據(jù)系列4 {帶鋼號,分段號i,機架號j,字段4ijl,字段4ij2,……}其中,i e {1,2,3},是帶鋼分段的索引號;j e {1,2,...,7},是精軋機架的索引號;舉例說明字段下標含義“字段12”表示一條帶鋼的第1個數(shù)據(jù)系列的第2個字段, “字段22”表示同一帶鋼的第2個數(shù)據(jù)系列的第2個字段,“字段3i2”表示同一帶鋼的第3個 數(shù)據(jù)系列的對應(yīng)第i個帶鋼分段的第2個字段,“字段4U2”表示同一帶鋼的第4個數(shù)據(jù)系列 的對應(yīng)第i個帶鋼分段的、第j個機架的第2個字段。這種過程數(shù)據(jù)組合形式,不符合溫控過程建模的物理意義,因此需要重新整理,去 掉所有索引變量,包括帶鋼號、段號、和機架號,將一條帶鋼的某一分段號對應(yīng)的所有數(shù)據(jù) 整理為一個數(shù)據(jù)向量,以終軋溫度為目標屬性,數(shù)據(jù)向量中的各個數(shù)據(jù)字段對應(yīng)作為向量 的各個決策屬性,從而將過程數(shù)據(jù)轉(zhuǎn)化為以精軋溫度為目標屬性的決策屬性向量。整理之后,對應(yīng)某一條帶鋼的第i個分段的屬性數(shù)據(jù)向量形式為目標屬性^{字段 ,字段12,字段13,......,字段21’字段22’字段23,......字段3il,字段3,2,……字段4m ,字段4n2 .......,字段4/21 ‘字段4,.22,......,字段4,.71,字段4/72 .......}(1)其中,目標屬性是該帶鋼的第i個分段的精軋終軋溫度。大括號內(nèi)的所有字段構(gòu)成與目標屬性相對應(yīng)的屬性向量,各字段對應(yīng)為各個決策 屬性。通過以上方法,可以把現(xiàn)場采集的過程數(shù)據(jù)向量,轉(zhuǎn)化為用于構(gòu)造決策樹的決策屬性向量。所述步驟b)對精軋終軋溫度進行非線性離散化,是以精軋終軋目標溫度為中心 將精軋終軋溫度定義為對稱分布的五個區(qū)域,五個區(qū)域?qū)?yīng)目標屬性的五個離散值。由于決策樹生成過程中,需要對目標屬性值離散分類,才能進行信息熵和信息增 益率的計算,因此需要對精軋終軋溫度進行非線性離散化。根據(jù)精軋過程的工藝特點和實際過程數(shù)據(jù)中終軋溫度的實際分布情況,定義以精 軋終軋目標溫度為中心的對稱分布的五個區(qū)域,從而實現(xiàn)作為目標屬性終軋溫度的非線性 離散化。具體離散化方式可見
圖1。其中,T0是終軋目標溫度,a是溫度變化量,其大小根據(jù)精軋工藝具體確定。以目 標溫度Ttl為中心,對稱分布的五個區(qū)域被劃分為表1目標屬性的非線性離散化
權(quán)利要求
1.基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征在于包括如下步驟a)對精軋過程數(shù)據(jù)進行預(yù)處理,將以帶鋼號為索引的過程數(shù)據(jù)轉(zhuǎn)化為以精軋溫度為目 標屬性的決策屬性向量;b)對精軋終軋溫度進行非線性離散化;c)計算以精軋終軋溫度為目標屬性的決策屬性向量中每個離散或連續(xù)值決策屬性的 信息增益率,生成以精軋終軋溫度為目標屬性的決策樹;d)根據(jù)信息增益率判定各個離散或連續(xù)值決策屬性對精軋終軋溫度影響的大小,并按 照決策樹的結(jié)點順序?qū)Q策屬性向量重新排序;e)提取影響精軋終軋溫度的關(guān)鍵特征變量。
2.根據(jù)權(quán)利要求1所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述步驟a)對精軋過程數(shù)據(jù)進行預(yù)處理,包括去噪和數(shù)據(jù)整理。
3.根據(jù)權(quán)利要求2所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述的去噪為首先根據(jù)工藝和設(shè)備條件給出精軋過程數(shù)據(jù)的各個字段值的上下限幅 值,然后按照限幅值對相應(yīng)字段的所有數(shù)據(jù),用限幅濾波法濾掉所有的該字段數(shù)據(jù)超過限 幅值的過程數(shù)據(jù)向量;所述數(shù)據(jù)整理是將精軋過程數(shù)據(jù)的所有索引變量去掉,再將一條帶 鋼的一個分段號對應(yīng)的所有數(shù)據(jù)整理為一個數(shù)據(jù)向量,然后以精軋終軋溫度為目標屬性, 將數(shù)據(jù)向量中的各個數(shù)據(jù)字段對應(yīng)作為向量的各個決策屬性,從而將過程數(shù)據(jù)轉(zhuǎn)化為以精 軋終軋溫度為目標屬性的決策屬性向量。
4.根據(jù)權(quán)利要求1所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述步驟b)對精軋終軋溫度進行非線性離散化,是以精軋終軋目標溫度為中心將精 軋終軋溫度定義為對稱分布的五個區(qū)域,五個區(qū)域分別對應(yīng)目標屬性的五個離散值。
5.根據(jù)權(quán)利要求1所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述步驟c)的具體步驟如下對未成為決策結(jié)點的所有決策屬性進行如下操作,1)對連續(xù)值決策屬性進行離散分割;2)對離散決策屬性和離散分割后的連續(xù)值決策屬性進行信息增益和信息增益率的計算;3)對比所有決策屬性的信息增益率值,取信息增益率最大的屬性作為決策樹當(dāng)前的決策結(jié)點ο4)反復(fù)執(zhí)行1)-3)步驟,直至所有決策屬性被遍歷,生成決策樹。
6.根據(jù)權(quán)利要求5所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述對連續(xù)值決策屬性進行離散分割的方法為找出連續(xù)值決策屬性的取值范圍[a,b],在區(qū)間[a,b]內(nèi)插入η個數(shù)值 (i = 1,2,1, η),將[a, b]等分為n+1個小區(qū)間;比較用= 1,2, L, η)劃分連續(xù)值決策屬性[a,b]的信息增益率,找出具有最大信 息增益率的分割點%,用%作為離散分割閾值,將連續(xù)值決策屬性離散化。
7.根據(jù)權(quán)利要求6所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述用%劃分連續(xù)值決策屬性,計算信息增益率的方法為A、設(shè)某連續(xù)值決策屬性為A;B、設(shè)全部決策屬性向量構(gòu)成的集合為S,集合中的數(shù)據(jù)向量按照目標屬性劃分為五個類,S相對于這5個類的信息熵為
8.根據(jù)權(quán)利要求7所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述2)步驟中進行信息增益和信息增益率的計算,計算方法與用%劃分連續(xù)值決策 屬性,計算信息增益率的方法相同。
9.根據(jù)權(quán)利要求1所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特征 在于所述步驟d)具體為根據(jù)c步驟決策樹生成過程中計算的每個決策屬性信息增益率的 大小,判斷該屬性字段對應(yīng)的特征變量對終軋溫度影響的大小,并按照決策樹中的結(jié)點排 序?qū)λ袑傩宰侄闻判?,生成新的以精軋終軋溫度為目標屬性的屬性向量。
10.根據(jù)權(quán)利要求1所述的基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法,其特 征在于所述步驟e)提取影響精軋終軋溫度的關(guān)鍵特征變量,根據(jù)溫度預(yù)報精度要求,提取 d)步驟中獲得的新的屬性向量中的前面若干個屬性作為精軋終軋溫度的關(guān)鍵特征變量,并 結(jié)合精軋實際工藝特點進行篩選和調(diào)整。
全文摘要
本發(fā)明涉及一種基于決策樹的精軋溫控過程關(guān)鍵特征變量提取方法。該方法首先對精軋過程數(shù)據(jù)進行預(yù)處理,將以帶鋼號為索引的過程數(shù)據(jù)轉(zhuǎn)化為以精軋終軋溫度為目標屬性的決策屬性向量,并對精軋終軋溫度進行非線性離散化;然后用決策樹方法,計算每個離散或連續(xù)值決策屬性的信息增益率;最后根據(jù)信息增益率判定各個屬性對精軋終軋溫度影響的大小,并對決策屬性向量按照增益率的值重新排序,再結(jié)合精軋工藝機理和模型精度要求,提取對精軋終軋溫度有決定性影響的關(guān)鍵特征變量。該方法可以根據(jù)實際現(xiàn)場過程數(shù)據(jù),判定對精軋終軋溫度有決定性影響作用的關(guān)鍵變量,為建立終軋溫度預(yù)報模型和修正精軋溫度工藝模型奠定基礎(chǔ)。
文檔編號B21B37/74GK102049420SQ200910272628
公開日2011年5月11日 申請日期2009年11月5日 優(yōu)先權(quán)日2009年11月5日
發(fā)明者劉斌, 勞兆利, 單旭沂, 葉紅衛(wèi), 張尉, 方康玲, 梁開, 董暉, 蔣崢 申請人:劉斌, 勞兆利, 單旭沂, 葉紅衛(wèi), 張尉, 方康玲, 梁開, 董暉, 蔣崢