專利名稱:一種生態(tài)系統(tǒng)碳交換影響因素提取方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)挖掘及模糊粗糙集技術(shù)領(lǐng)域,尤其涉及一種生態(tài)系統(tǒng)碳交換影響因素提取方法及系統(tǒng)。
背景技術(shù):
對(duì)大氣二氧化碳的研究關(guān)系到人類可持續(xù)發(fā)展和對(duì)生態(tài)系統(tǒng)間規(guī)律的認(rèn)識(shí),目前國(guó)內(nèi)外通過在各生態(tài)系統(tǒng)設(shè)立觀測(cè)站、建立碳塔來獲取碳通量數(shù)據(jù)。然而,由于碳塔造價(jià)不菲、容易受到環(huán)境和儀器故障等影響不能夠得廣泛推廣。并且,只有從碳通量觀測(cè)站數(shù)據(jù)和遙感數(shù)據(jù)中,挖掘各環(huán)境和氣象等因素與碳通量的關(guān)系,才有可能利用遙感圖像和地面氣象站等數(shù)據(jù),研究區(qū)域的乃至全球的碳通量的時(shí)空模式。在數(shù)據(jù)分析上,國(guó)內(nèi)外大多依靠統(tǒng)計(jì)學(xué)方法對(duì)生態(tài)學(xué)家認(rèn)為重要的環(huán)境因子進(jìn)行回歸分析或統(tǒng)計(jì)分析,其缺陷是依靠經(jīng)驗(yàn)對(duì)個(gè)別屬性進(jìn)行分析,缺乏全面性和容易忽視重要規(guī)律;雖然,近年來,已經(jīng)有一些學(xué)者通過人工智能方法對(duì)碳通量的規(guī)律及模式進(jìn)行研究,但側(cè)重在對(duì)碳通量進(jìn)行預(yù)測(cè)上,并未從影響碳通量環(huán)境因子的角度對(duì)其進(jìn)行深入分析,其結(jié)果是導(dǎo)致預(yù)測(cè)模型復(fù)雜,且難以發(fā)現(xiàn)內(nèi)在規(guī)律;另外,無法對(duì)不同生態(tài)系統(tǒng)的碳通量屬性數(shù)據(jù)進(jìn)行統(tǒng)一分析,發(fā)現(xiàn)各自的異同點(diǎn)也是現(xiàn)階段存在的不足。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能縮小研究與碳通量相關(guān)的生態(tài)因子范圍,降低分析難度,降低預(yù)測(cè)模型復(fù)雜度的生態(tài)系統(tǒng)碳交換影響因素提取方法。本發(fā)明的另一目的在于提供一種方便實(shí)用的生態(tài)系統(tǒng)碳交換影響因素提取方法所用的系統(tǒng)。為解決上述問題,本發(fā)明提出了一種生態(tài)系統(tǒng)碳交換影響因素提取方法,其包括以下步驟
1)從碳通量數(shù)據(jù)觀測(cè)站中獲取碳通量樣本的屬性數(shù)據(jù);
2)輸入由步驟1)獲得的碳通量樣本的屬性數(shù)據(jù),確定屬性數(shù)據(jù)的隸屬函數(shù)并計(jì)算各個(gè)屬性隸屬度,提取環(huán)境因子集重要度,獲得與碳通量相關(guān)的環(huán)境因子集;
3)將步驟2)獲得的環(huán)境因子集中的各個(gè)環(huán)境因子分別運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模仿真,得出碳通量環(huán)境因子提取率。所述碳通量屬性數(shù)據(jù)的數(shù)據(jù)類型包括連續(xù)的、缺失的、標(biāo)稱值的、離散的、序數(shù)的、數(shù)值型、字符型數(shù)據(jù)。所述步驟2)具體包括以下步驟
21)根據(jù)獲取的碳通量數(shù)據(jù)樣本的屬性數(shù)據(jù),對(duì)碳通量數(shù)據(jù)樣本進(jìn)行數(shù)據(jù)預(yù)處理;
22)設(shè)置相關(guān)系數(shù)閾值,相關(guān)系數(shù)閾值范圍為W.9,0.95];
23)分別計(jì)算各個(gè)屬性間相關(guān)系數(shù)值;將計(jì)算后的各個(gè)屬性間的相關(guān)系數(shù)值與步驟 22)設(shè)置的相關(guān)系數(shù)閾值進(jìn)行比較判定,如果屬性間相關(guān)系數(shù)值大于相關(guān)系數(shù)閾值時(shí),則將該環(huán)境因子剔除,小于相關(guān)系數(shù)閾值時(shí)則保留該環(huán)境因子,獲得環(huán)境因子集;
24)將步驟23)保留獲得的環(huán)境因子集通過隸屬度函數(shù)進(jìn)行映射,求出各屬性數(shù)據(jù)的模糊上近似集、模糊下近似集和模糊粗糙集正域值,通過模糊粗糙集正域計(jì)算出條件屬性子集對(duì)決策屬性重要度;
25)通過一種提出的基于混合蛙跳的模糊粗糙集約簡(jiǎn)算法或基于重要度的模糊粗糙集快速約簡(jiǎn)算法,對(duì)屬性進(jìn)行組合,通過評(píng)價(jià)函數(shù)計(jì)算組合后的屬性適應(yīng)度,當(dāng)屬性適應(yīng)度達(dá)到最大時(shí),使其滿足停止搜索條件,輸出保留的環(huán)境因子。 所述步驟25)的基于混合蛙跳算法的模糊粗糙集約簡(jiǎn)優(yōu)化算法,該方法是結(jié)合了基于模因進(jìn)化的模因演算法和基于群體行為的粒子群算法兩種種群智能優(yōu)化算法的優(yōu)點(diǎn), 仿照青蛙覓食跳躍過程,通過種群青蛙的跳躍找到食物較多的地方,該算法具有概念簡(jiǎn)單, 調(diào)整的參數(shù)少,計(jì)算速度快,全局搜索尋優(yōu)能力強(qiáng),易于實(shí)現(xiàn)的特點(diǎn)。具體實(shí)現(xiàn)所屬步驟如下
2511)隨機(jī)初始化種群,每個(gè)青蛙表示一個(gè)不同條件屬性子集,并對(duì)個(gè)體按適應(yīng)值由大到小排序;
2512)通過青蛙子群中最好個(gè)體和最差個(gè)體的運(yùn)算獲得新個(gè)體,計(jì)算新個(gè)體的屬性個(gè)數(shù)JV5和模糊粗糙集重要度γ,從
而獲得目標(biāo)函數(shù)的適應(yīng)度 ;
權(quán)利要求
1.一種生態(tài)系統(tǒng)碳交換影響因素提取方法,其特征在于包括以下步驟1)從碳通量數(shù)據(jù)觀測(cè)站中獲取碳通量樣本的屬性數(shù)據(jù);2)輸入由步驟1)獲得的碳通量樣本的屬性數(shù)據(jù),確定屬性數(shù)據(jù)的隸屬函數(shù)并計(jì)算各個(gè)屬性隸屬度,提取環(huán)境因子集重要度,獲得與碳通量相關(guān)的環(huán)境因子集;3)將步驟2)獲得的環(huán)境因子集中的各個(gè)環(huán)境因子分別運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模仿真,得出碳通量環(huán)境因子提取率。
2.根據(jù)權(quán)利要求1所述生態(tài)系統(tǒng)碳交換影響因素提取方法,其特征在于所述碳通量屬性數(shù)據(jù)的數(shù)據(jù)類型包括連續(xù)的、缺失的、標(biāo)稱值的、離散的、序數(shù)的、數(shù)值型、字符型數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述生態(tài)系統(tǒng)碳交換影響因素提取方法,其特征在于所述步驟2)具體包括21)根據(jù)獲取的碳通量數(shù)據(jù)樣本的屬性數(shù)據(jù),對(duì)碳通量數(shù)據(jù)樣本進(jìn)行數(shù)據(jù)預(yù)處理;22)設(shè)置相關(guān)系數(shù)閾值,相關(guān)系數(shù)閾值范圍為W.9,0.95];23)分別計(jì)算各個(gè)屬性間相關(guān)系數(shù)值;將計(jì)算后的各個(gè)屬性間的相關(guān)系數(shù)值與步驟 22)設(shè)置的相關(guān)系數(shù)閾值進(jìn)行比較判定,如果屬性間相關(guān)系數(shù)值大于相關(guān)系數(shù)閾值時(shí),則將該環(huán)境因子剔除,小于相關(guān)系數(shù)閾值時(shí)則保留該環(huán)境因子,獲得環(huán)境因子集;24)將步驟23)保留獲得的環(huán)境因子集通過隸屬度函數(shù)進(jìn)行映射,求出各屬性數(shù)據(jù)的模糊上近似集、模糊下近似集和模糊粗糙集正域值,通過模糊粗糙集正域計(jì)算出條件屬性子集對(duì)決策屬性重要度;25)通過基于混合蛙跳的模糊粗糙集約簡(jiǎn)算法或基于重要度的模糊粗糙集快速約簡(jiǎn)算法,對(duì)屬性進(jìn)行組合,通過適應(yīng)度函數(shù),計(jì)算屬性組合的適應(yīng)度,當(dāng)屬性適應(yīng)度達(dá)到最大時(shí), 滿足停止搜索條件,輸出保留的環(huán)境因子。
4.根據(jù)權(quán)利要求3所述生態(tài)系統(tǒng)碳交換影響因素提取方法,其特征在于所述步驟25) 的基于混合蛙跳的模糊粗糙集約簡(jiǎn)算法具體實(shí)現(xiàn)如下,如果,Λ^ ,則更新條件屬性子集;直至遍歷所有條件屬性組合后,f腳小于或等于/ ^時(shí),則f 為步驟25)所述的最大屬性適應(yīng)度 是指更新的條件屬性子集適應(yīng)度 是指更新之前條件屬性子集適應(yīng)度; 其中 ;式中“、 為取值(0,1)的系數(shù),Nc為條件屬性個(gè)數(shù),ATj為約簡(jiǎn)后屬性個(gè)數(shù),y為約簡(jiǎn)后條件屬性子集對(duì)決策屬性重要度;所述步驟25)的基于重要度的快速模糊粗糙集約簡(jiǎn)算法的實(shí)現(xiàn)步驟包括251)通過單屬性分析出各個(gè)屬性重要度,統(tǒng)計(jì)屬性個(gè)數(shù),將屬性按照條件屬性對(duì)決策屬性重要度由大到小排列;取其中條件屬性個(gè)數(shù)的前1/3作為第一次嘗試約簡(jiǎn)集C83,;計(jì)算約簡(jiǎn)隼t 決策屬性的重要度,記錄為/〔; 252)計(jì)算所有條件屬性對(duì)決策屬性的重要度;K1df,判斷與,的關(guān)系,如果γ'ctry等于γ 'all則剔除ctry中重要度最小的條件屬性,直至滿足γ'all-γ'ctry<0 01 ,則停止剔除ctry中的條件屬性;253)如果γ'cty不等于γ'all則需要添加條件屬性到Ctry中,重新計(jì)算添加了條件屬性的重要度γ‘cadd直至滿足
5.根據(jù)權(quán)利要求1所述生態(tài)系統(tǒng)碳交換影響因素提取方法,其特征在于所述步驟3)具體包括31)輸入約簡(jiǎn)后碳通量樣本的屬性數(shù)據(jù);32)輸入約簡(jiǎn)前碳通量樣本的屬性數(shù)據(jù);33)分別計(jì)算約簡(jiǎn)前碳通量樣本的屬性數(shù)據(jù)樣本預(yù)測(cè)值、約簡(jiǎn)后碳通量樣本的屬性數(shù)據(jù)樣本預(yù)測(cè)值與碳通量屬性數(shù)據(jù)實(shí)測(cè)值的相關(guān)性;34)通過約簡(jiǎn)前所有條件屬性相對(duì)于決策屬性重要度γαll和約簡(jiǎn)后條件屬性集相對(duì)于決策屬性的重要度γreduce的比值,求得信息保留率;γ函數(shù)為
6.根據(jù)權(quán)利要求5所述生態(tài)系統(tǒng)碳交換影響因素提取方法,其特征在于,所述步驟33) 是利用神經(jīng)網(wǎng)絡(luò)來建立仿真模型,計(jì)算訓(xùn)練集和測(cè)試集的相關(guān)度、均方根誤差、訓(xùn)練集和測(cè)試集平均絕對(duì)誤差。
7.—種生態(tài)系統(tǒng)碳交換影響因素提取方法所用的系統(tǒng),其特征在于包括數(shù)據(jù)導(dǎo)入模塊(1),用于從各碳通量觀測(cè)網(wǎng)站中獲取生態(tài)系統(tǒng)的碳通量樣本的屬性數(shù)據(jù);因素提取模塊(2),用于對(duì)所述生態(tài)系統(tǒng)的碳通量樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得與碳通量相關(guān)的環(huán)境因子集;輸入模塊(3),用于輸入約簡(jiǎn)前碳通量樣本的屬性數(shù)據(jù)與約簡(jiǎn)后碳通量樣本的屬性數(shù)據(jù);評(píng)價(jià)模塊(4),用于計(jì)算與碳通量相關(guān)的環(huán)境因子提取前和提取后的信息保留率和碳通量環(huán)境因子提取率。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于所述碳通量屬性數(shù)據(jù)的數(shù)據(jù)類型包括連續(xù)的、缺失的、標(biāo)稱值的、離散的、序數(shù)的、數(shù)值型、字符型數(shù)據(jù)。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于所述因素提取模塊(2)包括數(shù)據(jù)預(yù)處理單元(21),用于對(duì)獲取的生態(tài)系統(tǒng)的碳通量樣本的屬性數(shù)據(jù)進(jìn)行屬性填補(bǔ)、屬性數(shù)據(jù)標(biāo)準(zhǔn)化;輸入單元(22),用于設(shè)定相關(guān)系數(shù)閾值及模糊粗糙集屬性約簡(jiǎn)算法參數(shù); 數(shù)據(jù)挖掘單元(23),用于挖掘?qū)μ剂坑兄饕绊懙淖顑?yōu)條件屬性子集,輸出約簡(jiǎn)結(jié)果, 得到與碳通量數(shù)據(jù)相關(guān)環(huán)境因子集。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于所述評(píng)價(jià)模塊(4)包括 模型仿真單元(41),用于對(duì)輸入的數(shù)據(jù)進(jìn)行建模仿真;模型計(jì)算單元(42),用于計(jì)算訓(xùn)練集和測(cè)試集的相關(guān)度、均方根誤差、訓(xùn)練集和測(cè)試集平均絕對(duì)誤差;效率評(píng)價(jià)單元(43),用于計(jì)算約簡(jiǎn)后屬性和約簡(jiǎn)前屬性的碳通量環(huán)境因子提取率。
全文摘要
本發(fā)明公開一種生態(tài)系統(tǒng)碳交換影響因素提取方法及系統(tǒng),本發(fā)明提取方法包括以下步驟1)從碳通量數(shù)據(jù)觀測(cè)站中獲取碳通量樣本的屬性數(shù)據(jù);2)輸入由步驟1)獲得的碳通量樣本的屬性數(shù)據(jù),通過提出的混合蛙跳的模糊粗糙集約簡(jiǎn)算法或基于重要度的快速模糊粗糙集約簡(jiǎn)算法,選取最佳組合,找出與碳通量關(guān)系最密切的環(huán)境因子集;3)將步驟2)獲得的環(huán)境因子集中的各個(gè)環(huán)境因子分別運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模仿真,得出碳通量環(huán)境因子提取率。本發(fā)明提供的提取系統(tǒng)包括數(shù)據(jù)導(dǎo)入模塊、因素提取模塊、輸入模塊、評(píng)價(jià)模塊。本發(fā)明能夠有效縮小研究生態(tài)環(huán)境中與碳通量相關(guān)因子的范圍,提高研究效率和發(fā)現(xiàn)環(huán)境因子間的內(nèi)在規(guī)律。
文檔編號(hào)G06F17/50GK102495919SQ20111036789
公開日2012年6月13日 申請(qǐng)日期2011年11月18日 優(yōu)先權(quán)日2011年11月18日
發(fā)明者王楷, 薛月菊, 陳漢鳴 申請(qǐng)人:華南農(nóng)業(yè)大學(xué)