專利名稱:基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法
技術(shù)領(lǐng)域:
本發(fā)明屬于短期氣候預(yù)測領(lǐng)域,涉及一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候 時(shí)序預(yù)測方法。運(yùn)用經(jīng)驗(yàn)?zāi)B(tài)分解算法進(jìn)行氣候時(shí)間序列的平穩(wěn)化分解,再結(jié)合支持向量 機(jī)算法進(jìn)行時(shí)間序列的預(yù)測,提高氣候時(shí)間序列預(yù)測的準(zhǔn)確性,適合處理逐年降水或溫度 變化的氣候時(shí)間序列。
背景技術(shù):
氣候系統(tǒng)是一種耗散的高階非線性系統(tǒng),在針對氣候時(shí)間序列的預(yù)測方法中,人 工神經(jīng)網(wǎng)絡(luò)等技術(shù)由于具有較強(qiáng)的處理非線性問題的能力,從而比一般的線性預(yù)報(bào)方法具 有更好的預(yù)測能力,目前已得到了一定的應(yīng)用。例如,張迎春[1]等采用基于時(shí)間序列的BP 神經(jīng)網(wǎng)絡(luò)方法,以克拉瑪依沙漠700hPa月平均氣溫(1958. 1 1996. 4)為例,進(jìn)行氣象時(shí) 間序列預(yù)測。金龍[2]等在BP神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上,采用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的連接 權(quán)和網(wǎng)絡(luò)結(jié)構(gòu),以廣西全區(qū)4月份平均降水作為預(yù)報(bào)量及前期500hPa月平均高度場,海溫 場高相關(guān)區(qū)作為預(yù)報(bào)因子,建立基于遺傳算法的神經(jīng)網(wǎng)絡(luò)短期氣候預(yù)測模型,并與傳統(tǒng)的 逐步回歸方法進(jìn)行對比分析。陳永義[3_4]等首次將支持向量機(jī)分類和回歸方法應(yīng)用于到氣 象預(yù)報(bào)中,利用1990 2000年4 9月ECMWF北半球500hPa高度、850hPa高度、地面氣壓 的00 =OOUTC分析場資料建立四川盆地分區(qū)面雨量是否大于15mm的支持向量機(jī)分類模型, 以及四川盆地內(nèi)單站氣溫的支持向量機(jī)回歸模型,證實(shí)支持向量機(jī)模型具有良好的預(yù)報(bào)能 力。同時(shí),氣候時(shí)間序列也具有典型的非平穩(wěn)特征,如果借助信號(hào)處理中的方法進(jìn)行 平穩(wěn)化處理,可以提高預(yù)測的精度。目前,對非平穩(wěn)信號(hào)的平穩(wěn)化方法已經(jīng)在短期氣候分析 中得到了一定的應(yīng)用,如邵曉梅[5]等通過小波變化對黃河流域近40年來降水的季節(jié)變化 和年際變化時(shí)間序列進(jìn)行分析,揭示了黃河流域降水變化的多時(shí)間尺度的復(fù)雜結(jié)構(gòu),林振 山M等首先將經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)[7]算法應(yīng)用于氣候序 列分析,并從中預(yù)測變化趨勢。不過,這些研究都是通過平穩(wěn)化處理進(jìn)行氣候的分析,尚未 涉及對氣候時(shí)間序列的預(yù)測。參考文獻(xiàn)[1]張迎春,肖東榮,趙遠(yuǎn)東.基于時(shí)間序列神經(jīng)網(wǎng)絡(luò)的氣象預(yù)測研究.武漢理工 大學(xué)學(xué)報(bào),2003,27 (2) 237-240.[2]金龍,吳建生,林開平,等.基于遺傳算法的神經(jīng)網(wǎng)絡(luò)短期氣候預(yù)測模型.高原 氣象,2005,24 (6) 981-987.[3]陳永義,俞小鼎,高學(xué)浩,等.處理非線性分類和回歸問題的一種新方法 (I)-支持向量機(jī)方法簡介.應(yīng)用氣象學(xué)報(bào),2004,15 (3) =345-354.[4]馮漢中,陳永義.處理非線性分類和回歸問題的一種新方法(II)-支持向量機(jī) 方法在天氣預(yù)報(bào)中的應(yīng)用.應(yīng)用氣象學(xué)報(bào),2004,15 (3) 355-365.[5]邵曉梅,許月卿,嚴(yán)昌榮.黃河流域降水序列變化的小波分析.北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,1(1) 1-7.[6]林振山,汪曙光.近四百年北半球氣溫變化的分析EMD方法的應(yīng)用.熱帶氣 象學(xué)報(bào),2004,24 (01) 90-96.[7]HUANG D J,ZHA0 J P,SU J L. On the end extending in the Hilbert-Huang Transform. CHIO B H. Progress in Coastal Engineering and Oceanography, Vol. 1, Coastal Oceanographyof Asian Seas. Korean Society of Coastal and Ocean Engineers,1999 :81_92.
發(fā)明內(nèi)容
技術(shù)問題 本發(fā)明目的是針對現(xiàn)有技術(shù)存在的氣候時(shí)間序列預(yù)測技術(shù)中沒有考慮到時(shí)間序 列的非平穩(wěn)特性,提供一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,對時(shí)間 序列進(jìn)行平穩(wěn)化處理,再結(jié)合支持向量機(jī)回歸技術(shù)進(jìn)行氣候時(shí)間序列預(yù)測,以提高復(fù)雜氣 候時(shí)間序列的預(yù)測準(zhǔn)確率。技術(shù)方案本發(fā)明為實(shí)現(xiàn)上述目的,采用如下技術(shù)方案本發(fā)明基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,包括以下步驟1)將輸入的氣候時(shí)間序列,通過經(jīng)驗(yàn)?zāi)B(tài)分解算法進(jìn)行多時(shí)間尺度分解,得到η 個(gè)本征模態(tài)函數(shù)分量和一個(gè)趨勢分量,其中η為大于1的自然數(shù);2)根據(jù)時(shí)間序列預(yù)測方法,對步驟1)所述的各分量進(jìn)行相空間重構(gòu),將一維的時(shí) 間序列轉(zhuǎn)化成矩陣形式,構(gòu)成訓(xùn)練樣本集;3)采用步驟2)所述的各分量訓(xùn)練樣本集,建立與之對應(yīng)的支持向量機(jī)回歸預(yù)測 模型;對每個(gè)模型進(jìn)行時(shí)間序列預(yù)測,得到各個(gè)分量的時(shí)間序列預(yù)測結(jié)果;4)將步驟3)所述的各分量預(yù)測結(jié)果,通過線性組合的方式得到原氣候時(shí)間序列 的預(yù)測結(jié)果。其中,步驟1)所述的氣候時(shí)間序列,在進(jìn)行多時(shí)間尺度分解之前采用Z-SCORE標(biāo) 準(zhǔn)化方法進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化處理。其中,步驟1)所述的經(jīng)驗(yàn)?zāi)B(tài)分解算法,在分解的篩選過程中,采用設(shè)置兩個(gè)連 續(xù)的迭代結(jié)果之間的標(biāo)準(zhǔn)差SD的大小在0. 2到0. 3之間,且最大迭代次數(shù)為200作為追加 的停止條件,采用極值延拓法來擬合序列的端點(diǎn)極值。其中,步驟2)所述的相空間重構(gòu)需要確定時(shí)間延遲量和嵌入空間的維數(shù)兩個(gè)參 數(shù),對于兩個(gè)參數(shù)的選取分別采用自相關(guān)函數(shù)法和虛假近鄰法。其中,步驟3)所述的支持向量機(jī)回歸模型采用最小二乘支持向量機(jī)回歸模型,核 函數(shù)采用徑向基核函數(shù),參數(shù)的選取通過基于網(wǎng)格搜索的交叉驗(yàn)證方法。有益效果本發(fā)明針對氣候時(shí)間序列的非線性、非平穩(wěn)特性,利用支持向量機(jī)算法在處理非 線性問題中的優(yōu)越性和經(jīng)驗(yàn)?zāi)B(tài)分解算法在處理非平穩(wěn)信號(hào)中的優(yōu)勢,基于經(jīng)驗(yàn)?zāi)B(tài)分解 和支持向量機(jī)的氣候時(shí)間序列預(yù)測方法,根據(jù)氣候時(shí)間序列的非線性、非平穩(wěn)特性,首先利 用經(jīng)驗(yàn)?zāi)B(tài)分解技術(shù)對時(shí)間序列進(jìn)行平穩(wěn)化處理,在保留時(shí)間序列本身特征的基礎(chǔ)上減少序列間的干擾或耦合信息,再利用相空間重構(gòu)和支持向量機(jī)回歸技術(shù)進(jìn)行時(shí)間序列預(yù)測。 相對于單一使用支持向量機(jī)回歸預(yù)測的方法,可以有效提高預(yù)測準(zhǔn)確度,特別適合處理逐 年降水或溫度變化的非平穩(wěn)氣候時(shí)間序列。
圖1是基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法的方法流程圖;圖2是廣西全區(qū)88個(gè)氣象觀測站1957-2005年6_8月逐年降水量的距平百分率 序列;圖3是對氣候時(shí)間序列進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解的具體處理流程;圖4是對氣候時(shí)間序列r68進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解的結(jié)果圖,包括4個(gè)IMF分量和一 個(gè)趨勢分量;圖5是使用單一支持向量機(jī)預(yù)測方法與使用經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)結(jié)合方 法進(jìn)行預(yù)測的相對誤差比較;圖6是使用單一支持向量機(jī)預(yù)測方法與使用經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)結(jié)合方 法進(jìn)行預(yù)測結(jié)果的比較。
具體實(shí)施例方式下面將結(jié)合附圖及具體實(shí)施例對本發(fā)明所述的基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī) 的氣候時(shí)序預(yù)測方法作進(jìn)一步地詳細(xì)描述。本實(shí)施例采用如圖2所示的廣西全區(qū)88個(gè)氣象觀測站1957-2005年6_8月逐年 降水量的距平百分率序列(以下簡稱r68),共49個(gè)數(shù)據(jù)。將經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical ModeDecomposition, EMD)算法禾口最小二乘支持向量機(jī)(Least Squares Support Vector Machines,LS-SVM)回歸算法相結(jié)合進(jìn)行氣候時(shí)間序列的預(yù)測。如圖1所示,本方法包括如 下步驟步驟10將輸入的氣候時(shí)間序列,通過經(jīng)驗(yàn)?zāi)B(tài)分解算法進(jìn)行多時(shí)間尺度分解,得 到若干個(gè)本征模態(tài)函數(shù)分量(Intrinsic Mode Function, IMF)和一個(gè)趨勢分量。不同分量 代表了序列在不同時(shí)間周期上的波動(dòng)規(guī)律,更能準(zhǔn)確反映原序列的變化,并保留時(shí)間序列 本身特征;如圖3所示,提供了對r68時(shí)間序列進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解的處理流程,具體包括以下 步驟步驟101用序列X (t)代表氣候時(shí)間序列r68,并對其進(jìn)行Z-SCORE標(biāo)準(zhǔn)化處理,得 到序列S(t)。步驟IOla判斷S (t)的極值數(shù)是否大于2。如果是則說明序列有平穩(wěn)化的必要,執(zhí) 行步驟102,否則說明序列是平穩(wěn)的,無須分解或者分解已經(jīng)結(jié)束,執(zhí)行步驟108。步驟102令H (t) = S(t),開始在H(t)中進(jìn)行提取IMF分量的迭代操作。步驟103找出序列H(t)中所有的局部極大值點(diǎn)和極小值點(diǎn)。步驟104對所有的極大值和極小值點(diǎn),通過三次樣條插值法形成上包絡(luò)線Hmax (t) 和下包絡(luò)線Hmin(t),使H(t)滿足Hmin(t)彡H(t) ^ Hfflax(t)0其中對于邊界點(diǎn)極值的擬合問 題采用端點(diǎn)的極值延拓法解決。
步驟105計(jì)算上下包絡(luò)線的算術(shù)平均值講⑴=^^^^,并從H(t)中減 去,即 H(t) = H(t)-m(t)。步驟105a判斷H(t)是否已滿足成為IMF分量的判定條件,包括以下三點(diǎn)①極值點(diǎn)數(shù)和過零點(diǎn)數(shù)一致或者至多相差一個(gè);②上下包絡(luò)線的算術(shù)平均值接近于0 ;③限制兩次連續(xù)的處理結(jié)果之間的標(biāo)準(zhǔn)差SD的值進(jìn)行約束
其中,Hari) (t)和Hk⑴是在步驟103至步驟105中連續(xù)兩次的處理結(jié)果,k代表 這一過程的處理次數(shù)。SD的取值范圍通常限制在0. 2 0. 3之間。若同時(shí)滿足上述三個(gè)條件,執(zhí)行步驟106,否則返回繼續(xù)執(zhí)行步驟103。步驟106成功提取一個(gè)IMF分量,即IMFi (t) = Hk (t)。步驟107從S⑴中減去提取的IMF分量,即S (t) = S (t)-IMF1⑴,并執(zhí)行步驟 IOla判斷S (t)的極值數(shù)。步驟108此時(shí)所有的IMF分量都被提取出,剩余的S (t)則表現(xiàn)為一個(gè)單調(diào)或近似 單調(diào)的趨勢項(xiàng),稱為趨勢分量Rn (t)。步驟109時(shí)間序列X (t)實(shí)現(xiàn)經(jīng)驗(yàn)?zāi)B(tài)分解,即 分解的結(jié)果如圖4所示,包括4個(gè)IMF分量和一個(gè)趨勢分量。步驟20根據(jù)時(shí)間序列預(yù)測方法,對步驟10所述的各分量進(jìn)行相空間重構(gòu),將一維 的時(shí)間序列轉(zhuǎn)化成矩陣形式,構(gòu)成訓(xùn)練樣本集;為了對比結(jié)果,將X(t)時(shí)間序列的前40個(gè)進(jìn)行相空間重構(gòu),選取時(shí)間延遲量為1, 嵌入空間的維數(shù)為30,構(gòu)成訓(xùn)練樣本集{(Xi,Yi) i = 1,2,... 10},包括10組訓(xùn)練樣本 / = 1,2,...,10步驟30采用步驟20所述的訓(xùn)練樣本集,建立與之對應(yīng)的支持向量機(jī)回歸預(yù)測模 型。對每個(gè)模型預(yù)測后9個(gè)時(shí)間的數(shù)值,得到各個(gè)分量的時(shí)間序列預(yù)測結(jié)果;其中,所述的支持向量機(jī)回歸模型采用最小二乘支持向量機(jī)回歸模型,核函數(shù)采 用徑向基核函數(shù),通過基于網(wǎng)格搜索的交叉驗(yàn)證方法分別選出合適的徑向基核寬度與正則 化參數(shù)。步驟40將步驟30所述的各分量預(yù)測結(jié)果,通過線性組合的方式得到原氣候時(shí)間 序列的預(yù)測結(jié)果。如圖5、圖6所示,預(yù)測結(jié)果與直接采用最小二乘支持向量機(jī)回歸模型預(yù) 測的結(jié)果相比相對誤差更小,更接近原序列。
權(quán)利要求
一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,其特征在于,包括以下步驟1)將輸入的氣候時(shí)間序列,通過經(jīng)驗(yàn)?zāi)B(tài)分解算法進(jìn)行多時(shí)間尺度分解,得到n個(gè)本征模態(tài)函數(shù)分量和一個(gè)趨勢分量,其中n為大于1的自然數(shù);2)根據(jù)時(shí)間序列預(yù)測方法,對步驟1)所述的各分量進(jìn)行相空間重構(gòu),將一維的時(shí)間序列轉(zhuǎn)化成矩陣形式,構(gòu)成訓(xùn)練樣本集;3)采用步驟2)所述的各分量訓(xùn)練樣本集,建立與之對應(yīng)的支持向量機(jī)回歸預(yù)測模型;對每個(gè)模型進(jìn)行時(shí)間序列預(yù)測,得到各個(gè)分量的時(shí)間序列預(yù)測結(jié)果;4)將步驟3)所述的各分量預(yù)測結(jié)果,通過線性組合的方式得到原氣候時(shí)間序列的預(yù)測結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,其特 征在于,步驟1)所述的氣候時(shí)間序列,在進(jìn)行多時(shí)間尺度分解之前采用Z-SCORE標(biāo)準(zhǔn)化方 法進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化處理。
3.根據(jù)權(quán)利要求1所述的基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,其特 征在于,步驟1)所述的經(jīng)驗(yàn)?zāi)B(tài)分解算法,在分解的篩選過程中,采用設(shè)置兩個(gè)連續(xù)的迭 代結(jié)果之間的標(biāo)準(zhǔn)差SD的大小在0. 2到0. 3之間,且最大迭代次數(shù)為200作為追加的停止 條件,采用極值延拓法來擬合序列的端點(diǎn)極值。
4.根據(jù)權(quán)利要求1所述的基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,其特 征在于,步驟2)所述的相空間重構(gòu)需要確定時(shí)間延遲量和嵌入空間的維數(shù)兩個(gè)參數(shù),對于 兩個(gè)參數(shù)的選取分別采用自相關(guān)函數(shù)法和虛假近鄰法。
5.根據(jù)權(quán)利要求1所述的基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,其特 征在于,步驟3)所述的支持向量機(jī)回歸模型采用最小二乘支持向量機(jī)回歸模型,核函數(shù)采 用徑向基核函數(shù),參數(shù)的選取通過基于網(wǎng)格搜索的交叉驗(yàn)證方法。
全文摘要
本發(fā)明公布了一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的氣候時(shí)序預(yù)測方法,屬于短期氣候預(yù)測領(lǐng)域。本發(fā)明首先通過經(jīng)驗(yàn)?zāi)B(tài)分解算法進(jìn)行時(shí)間序列的預(yù)處理,分解成若干個(gè)本征模態(tài)函數(shù)分量和一個(gè)趨勢分量,這些分量更能準(zhǔn)確反映原序列的變化,并保留時(shí)間序列本身特征;接下來通過時(shí)間序列預(yù)測方法對每個(gè)分量進(jìn)行相空間重構(gòu),再分別構(gòu)建不同的支持向量機(jī)回歸模型進(jìn)行預(yù)測,將各分量預(yù)測的結(jié)果線性組合成原序列的預(yù)測結(jié)果。本發(fā)明的優(yōu)點(diǎn)在于借助經(jīng)驗(yàn)?zāi)B(tài)分解算法進(jìn)行時(shí)間序列的平穩(wěn)化處理,在保留時(shí)間序列本身特征的基礎(chǔ)上減少序列間的干擾或耦合信息,使得預(yù)測的準(zhǔn)確率更高,特別適合處理逐年降水或溫度變化的非平穩(wěn)氣候時(shí)間序列。
文檔編號(hào)G06N99/00GK101846753SQ201010159898
公開日2010年9月29日 申請日期2010年4月29日 優(yōu)先權(quán)日2010年4月29日
發(fā)明者徐寅, 畢碩本, 王必強(qiáng), 董學(xué)士, 陳譞 申請人:南京信息工程大學(xué)