提高生態(tài)位模型時間轉(zhuǎn)移能力的方法
【專利摘要】本發(fā)明提供一種提高生態(tài)位模型時間轉(zhuǎn)移能力的方法,包括:根據(jù)目標區(qū)域的物種分布數(shù)據(jù)與全部環(huán)境因子數(shù)據(jù),構(gòu)建初始生態(tài)位模型,所述初始生態(tài)位模型包括:初始前期模型和初始后期模型;利用預(yù)設(shè)方法,對所述初始生態(tài)位模型進行改進,以提高所述初始生態(tài)位模型的時間轉(zhuǎn)移能力;其中,所述時間轉(zhuǎn)移能力,包括:追溯能力和預(yù)測能力。該方法能夠有效提高生態(tài)位模型的時間轉(zhuǎn)移能力,并提高模擬的準確性。
【專利說明】
提高生態(tài)位模型時間轉(zhuǎn)移能力的方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及生態(tài)位模型的構(gòu)建技術(shù)領(lǐng)域,尤其涉及一種提高生態(tài)位模型時間轉(zhuǎn)移 能力的方法。
【背景技術(shù)】
[0002] 利用生態(tài)位模型預(yù)測物種潛在分布,在生態(tài)學、生物地理學和進化生物學研究中 越來越重要。在生態(tài)位保守性前提下,生態(tài)位模型的時間轉(zhuǎn)移能力,體現(xiàn)在運用物種本土分 布范圍構(gòu)建模型,將其轉(zhuǎn)移至不同時間的同一地理區(qū)域,去判斷物種潛在分布的能力。生態(tài) 位模型的時間轉(zhuǎn)移能力,是檢驗?zāi)P皖A(yù)測效果的重要指標,時間轉(zhuǎn)移能力的高低會影響模 擬的準確性。
[0003]經(jīng)典生態(tài)位模型精度驗證方法是采用卡帕系數(shù)(Kappa)、真實技巧統(tǒng)計值(true skill statistic,簡稱TSS)及受試工作者特征曲線下部面積(area under receiver operating characteristic curve,簡稱AUC)。其中,利用AUC來判斷環(huán)境變量與模擬的物 種地理分布之間的相關(guān)性,得到了較為廣泛的應(yīng)用;AUC值域為[0-1],AUC值越大表示相關(guān) 性越大,AUOO . 8時,表明模型模擬效果較好。但AUC側(cè)重于評價模型的自適應(yīng)效果,即模型 模擬效果與實際情況的吻合程度,而無法準確評價模型的時間轉(zhuǎn)移能力。
[0004] 鑒于此,如何提高生態(tài)位模型的轉(zhuǎn)移能力且提高模擬的準確性成為目前需要解決 的技術(shù)問題。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種提高生態(tài)位模型時間轉(zhuǎn)移能力的方法, 能夠有效提高生態(tài)位模型的時間轉(zhuǎn)移能力,并提高模擬的準確性。
[0006] 第一方面,本發(fā)明提供一種提高生態(tài)位模型時間轉(zhuǎn)移能力的方法,包括:
[0007] 根據(jù)目標區(qū)域的物種分布數(shù)據(jù)與全部環(huán)境因子數(shù)據(jù),構(gòu)建初始生態(tài)位模型,所述 初始生態(tài)位模型包括:初始前期模型和初始后期模型;
[0008] 利用預(yù)設(shè)方法,對所述初始生態(tài)位模型進行改進,以提高所述初始生態(tài)位模型的 時間轉(zhuǎn)移能力;
[0009] 其中,所述時間轉(zhuǎn)移能力,包括:追溯能力和預(yù)測能力。
[0010] 可選地,所述初始生態(tài)位模型,包括:最大熵模型MaxEnt。
[0011] 可選地,所述預(yù)設(shè)方法,包括:環(huán)境變量篩選方法、和/或模型參數(shù)Regularization Multiplier調(diào)節(jié)方法;
[0012] 所述環(huán)境變量篩選方法為:基于斯皮爾曼秩Spearman's rho相關(guān)性系數(shù)的環(huán)境變 量篩選方法、或者基于方差膨脹因子VIF的環(huán)境變量篩選方法。
[0013] 可選地,所述基于斯皮爾曼秩Spearman's rho相關(guān)性系數(shù)的環(huán)境變量篩選方法, 包括:
[0014] S1、將前期的環(huán)境變量進行兩兩組合,并將后期的環(huán)境變量進行兩兩組合,得到前 期的多組變量組合和后期的多組變量組合;
[0015] S2、計算得到的變量組合中每組的兩個環(huán)境變量之間的Spearman's rho相關(guān)系數(shù) r I ;
[0016] S3、按照|r I的大小排序,選取|r I最大的一組變量組合,如果選取的該組變量組合 的I r I大于等于預(yù)設(shè)第一閾值,則基于變量的生態(tài)學意義或通過對比兩個環(huán)境變量在初始 前期模型或初始后期模型中的貢獻率,篩選出該組變量組合中的一個與物種分布最相關(guān)的 環(huán)境變量,將該組變量組合中的另外一個環(huán)境變量剔除;
[0017] S4、將剔除后余下的前期的環(huán)境變量進行兩兩組合或?qū)⑻蕹笥嘞碌暮笃诘沫h(huán)境 變量進行兩兩組合,返回步驟S2,直至余下全部環(huán)境變量的|r I小于預(yù)設(shè)第一閾值時,環(huán)境 變量的篩選結(jié)束。
[0018] 可選地,所述基于方差膨脹因子VIF的環(huán)境變量篩選方法,包括:
[0019] P1、針對初始前期模型和初始后期模型,建立以任意常量作為因變量,以環(huán)境變量 作為自變量的線性方程,并計算該線性方程中每個自變量的IVIFI值;
[0020] P2、刪除自變量的IviFl值最大的環(huán)境變量;
[0021] P3、將余下的環(huán)境變量重新作為自變量與任意常量建立線性方程,并計算該線性 方程中每個自變量的IVIFI值,再次刪除IVIFI值最大的環(huán)境變量;
[0022] P4、重復(fù)步驟P3,直至余下的環(huán)境變量重新作為自變量與任意常量建立線性方程 中每個自變量的IVIFI值I均小于預(yù)設(shè)第二閾值時,環(huán)境變量的篩選結(jié)束。
[0023] 可選地,所述模型參數(shù)Regularization Multiplier調(diào)節(jié)方法,包括:
[0024] 所述初始生態(tài)位模型包括:Regularization Mu Itiplier參數(shù),通過將 Regularization Multipl ier的值依次增加為預(yù)設(shè)值,將增加后的Regularization Multiplier的值分別應(yīng)用在初始前期模型和初始后期模型中,來選擇最優(yōu)Regularization Multiplier 參數(shù)。
[0025] 可選地,所述方法還包括:
[0026]計算所述初始生態(tài)位模型的時間轉(zhuǎn)移能力;
[0027]計算利用預(yù)設(shè)方法對所述初始生態(tài)位模型進行改進后得到的生態(tài)位模型的時間 轉(zhuǎn)移能力;
[0028]將改進后得到的生態(tài)位模型的時間轉(zhuǎn)移能力與初始生態(tài)位模型的時間轉(zhuǎn)移能力 進行比較,以驗證所述預(yù)設(shè)方法對所述初始生態(tài)位模型的時間轉(zhuǎn)移能力的提高有效性。 [0029]可選地,所述計算所述初始生態(tài)位模型的時間轉(zhuǎn)移能力,包括:
[0030]計算所述初始生態(tài)位模型的追溯能力;
[0031] 計算所述初始生態(tài)位模型的預(yù)測能力。
[0032] 可選地,所述計算所述初始生態(tài)位模型的追溯能力,包括:
[0033] 將初始后期模型投影至前期環(huán)境中,重新估算物種的前期分布概率;
[0034] 計算重新估算的物種的前期分布概率與初始前期模型估算的物種的分布概率之 間的斯皮爾曼秩Spearman' s rho相關(guān)系數(shù),并根據(jù)該Spearman' s rho相關(guān)系數(shù)確定所述初 始生態(tài)位模型的追溯能力。
[0035]可選地,所述計算所述初始生態(tài)位模型的預(yù)測能力,包括:
[0036]將初始前期模型投影至后期環(huán)境中,重新估算物種的后期分布概率;
[0037] 計算重新估算的物種的后期分布概率與初始后期模型估算的物種的分布概率之 間的斯皮爾曼秩Spearman' s rho相關(guān)系數(shù),并根據(jù)該Spearman' s rho相關(guān)系數(shù)確定所述初 始生態(tài)位模型的預(yù)測能力。
[0038] 由上述技術(shù)方案可知,本發(fā)明的提高生態(tài)位模型時間轉(zhuǎn)移能力的方法,能夠有效 提高生態(tài)位模型的時間轉(zhuǎn)移能力,并提高模擬的準確性。
【附圖說明】
[0039] 圖1為本發(fā)明一實施例提供的提高生態(tài)位模型時間轉(zhuǎn)移能力的方法的流程示意 圖;
[0040] 圖2為本發(fā)明實施例所利用的基于斯皮爾曼秩Spearman's rho相關(guān)性系數(shù)的環(huán)境 變量篩選方法的一種流程示意圖;
[0041]圖3為本發(fā)明實施例利用圖2所示的基于斯皮爾曼秩Spearman's rho相關(guān)性系數(shù) 的環(huán)境變量篩選方法改進后的生態(tài)位模型的時間轉(zhuǎn)移能力的示意圖;
[0042] 圖4為本發(fā)明實施例所利用的基于方差膨脹因子VIF的環(huán)境變量篩選方法的一種 流程示意圖;
[0043] 圖5為本發(fā)明實施例利用圖4所示的基于方差膨脹因子VIF的環(huán)境變量篩選方法改 進后的生態(tài)位模型的時間轉(zhuǎn)移能力的示意圖;
[0044]圖6為本發(fā)明實施例利用圖2或圖4所示方法后再利用模型參數(shù)Regularization Mul t ip I i er調(diào)節(jié)方法改進后的生態(tài)位模型的時間轉(zhuǎn)移能力的示意圖。
【具體實施方式】
[0045] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例,基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有做出創(chuàng)造性勞動的前提下所獲取的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0046] 圖1示出了本發(fā)明一實施例提供的提高生態(tài)位模型時間轉(zhuǎn)移能力的方法的流程示 意圖,如圖1所示,本實施例的提高生態(tài)位模型時間轉(zhuǎn)移能力的方法,包括:
[0047] 101、根據(jù)目標區(qū)域的物種分布數(shù)據(jù)與全部環(huán)境因子數(shù)據(jù),構(gòu)建初始生態(tài)位模型, 所述初始生態(tài)位模型包括:初始前期模型和初始后期模型。
[0048]在具體應(yīng)用中,所述初始生態(tài)位模型,可以包括:最大熵模型MaxEnt等。
[0049] 102、利用預(yù)設(shè)方法,對所述初始生態(tài)位模型進行改進,以提高所述初始生態(tài)位模 型的時間轉(zhuǎn)移能力;
[0050] 其中,所述時間轉(zhuǎn)移能力,包括:追溯能力和預(yù)測能力。
[0051] 在具體應(yīng)用中,所述預(yù)設(shè)方法,包括:環(huán)境變量篩選方法、和/或模型參數(shù) Regularization Multiplier調(diào)節(jié)方法;
[0052]所述環(huán)境變量篩選方法為:基于斯皮爾曼秩Spearmant s rho相關(guān)性系數(shù)的環(huán)境變 量篩選方法、或者基于方差膨脹因子VIF的環(huán)境變量篩選方法。
[0053]進一步地,所述基于斯皮爾曼秩Spearman's rho相關(guān)性系數(shù)的環(huán)境變量篩選方 法,可包括:
[0054] S1、將前期的環(huán)境變量進行兩兩組合,并將后期的環(huán)境變量進行兩兩組合,得到前 期的多組變量組合和后期的多組變量組合。
[0055] S2、計算得到的變量組合中每組的兩個環(huán)境變量之間的Spearman's rho相關(guān)系數(shù) r I 〇
[0056] 舉例來說,可利用IBM SPSS Statistic 20軟件計算得到的變量組合中每組的兩 個環(huán)境變量之間的Spearman's rho相關(guān)系數(shù)|r I。
[0057] S3、按照|r I的大小排序,選取|r I最大的一組變量組合,如果選取的該組變量組合 的I r I大于等于預(yù)設(shè)第一閾值,則基于變量的生態(tài)學意義或通過對比兩個環(huán)境變量在初始 前期模型或初始后期模型中的貢獻率,篩選出該組變量組合中的一個與物種分布最相關(guān)的 環(huán)境變量,將該組變量組合中的另外一個環(huán)境變量剔除。
[0058] S4、將剔除后余下的前期的環(huán)境變量進行兩兩組合或?qū)⑻蕹笥嘞碌暮笃诘沫h(huán)境 變量進行兩兩組合,返回步驟S2,直至余下全部環(huán)境變量的|r I小于預(yù)設(shè)第一閾值時,環(huán)境 變量的篩選結(jié)束。
[0059]其中,所述預(yù)設(shè)第一閾值可優(yōu)選為0.7。
[0060] 進一步地,所述基于方差膨脹因子(Variance Inflation Factor,簡稱VIF)的環(huán) 境變量篩選方法,可包括:
[0061] Pl、針對初始前期模型和初始后期模型,建立以任意常量作為因變量,以環(huán)境變量 作為自變量的線性方程,并計算該線性方程中每個自變量的IVIFI值。
[0062] P2、刪除自變量的IVIF I值最大的環(huán)境變量。
[0063] P3、將余下的環(huán)境變量重新作為自變量與任意常量建立線性方程,并計算該線性 方程中每個自變量的IVIFI值,再次刪除IVIFI值最大的環(huán)境變量。
[0064] P4、重復(fù)步驟P3,直至余下的環(huán)境變量重新作為自變量與任意常量建立線性方程 中每個自變量的IVIFI值I均小于預(yù)設(shè)第二閾值時,環(huán)境變量的篩選結(jié)束。
[0065]其中,所述預(yù)設(shè)第二閾值可優(yōu)選為10。
[0066] 舉例來說,所述基于方差膨脹因子VIF的環(huán)境變量篩選方法中,可利用IBM SPSS Statistic 20軟件來建立線性方程。
[0067] 進一步地,所述模型參數(shù)Regularization Multiplier調(diào)節(jié)方法,包括:
[0068] 所述初始生態(tài)位模型包括:Regularization Mu Itiplier參數(shù),通過將 Regularization Multipl ier的值依次增加為預(yù)設(shè)值,將增加后的Regularization Multiplier的值分別應(yīng)用在初始前期模型和初始后期模型中,來選擇最優(yōu)Regularization Multiplier 參數(shù)。
[0069] 其中,所述預(yù)設(shè)值可優(yōu)選為1、2·5、5、10和20。
[0070] 可理解的是,MaxEnt模型軟件參數(shù)"Regularization Multiplier",用于調(diào)節(jié)模型 的擬合程度,軟件默認為1,當值小于1時,會導(dǎo)致對構(gòu)建模型使用的分布點的預(yù)測值過大, 稱為過度擬合;當值大于1時,可簡化模型復(fù)雜度,但預(yù)測的分布結(jié)果會更加分散,模型預(yù)測 的分布概率對于環(huán)境變量的反應(yīng)曲線也漸漸趨于平滑。將增加后的Regularization Multipl ier的值分別應(yīng)用在初始前期模型和初始后期模型中,可以反映增加后的 Regularization Multiplier的值對于初始前期模型和初始后期模型的時間轉(zhuǎn)移能力的影 響,以選擇最優(yōu)Regularization Multiplier參數(shù)。
[0071]在具體應(yīng)用中,本實施例所述方法還可以包括圖中未示出的步驟T1-T3:
[0072] Tl、計算所述初始生態(tài)位模型的時間轉(zhuǎn)移能力。
[0073] 在具體應(yīng)用中,所述步驟Tl,可以包括圖中未示出的步驟Al和A2:
[0074] Al、計算所述初始生態(tài)位模型的追溯能力。
[0075]在具體應(yīng)用中,所述步驟Al,可以包括:
[0076] 將初始后期模型投影至前期環(huán)境中,重新估算物種的前期分布概率;
[0077] 計算重新估算的物種的前期分布概率與初始前期模型估算的物種的分布概率之 間的斯皮爾曼秩Spearman' s rho相關(guān)系數(shù),并根據(jù)該Spearman' s rho相關(guān)系數(shù)確定所述初 始生態(tài)位模型的追溯能力。
[0078]可理解的是,本實施例的投影指的是利用物種已知的分布數(shù)據(jù)和相關(guān)環(huán)境變量建 立生態(tài)位模型,然后將模型投射至不同的空間和時間環(huán)境中來預(yù)測物種的潛在分布;追溯 能力是指將模型投影至"前一時期"(簡稱"前期")的同一地理環(huán)境中,估算物種分布的能 力。
[0079]應(yīng)說明的是,在步驟Al中計算得到的Spearman's rho相關(guān)系數(shù)越高,所述初始生 態(tài)位模型的追溯能力越強。
[0080] A2、計算所述初始生態(tài)位模型的預(yù)測能力。
[0081] 在具體應(yīng)用中,所述步驟A2,可以包括:
[0082] 將初始前期模型投影至后期環(huán)境中,重新估算物種的后期分布概率;
[0083]計算重新估算的物種的后期分布概率與初始后期模型估算的物種的分布概率之 間的斯皮爾曼秩Spearman' s rho相關(guān)系數(shù),并根據(jù)該Spearman' s rho相關(guān)系數(shù)確定所述初 始生態(tài)位模型的預(yù)測能力。
[0084] 可理解的是,本實施例的預(yù)測能力是指將模型投影至"后一時期"(簡稱"后期")的 同一地理環(huán)境中,估算物種分布的能力。
[0085] T2、計算利用預(yù)設(shè)方法對所述初始生態(tài)位模型進行改進后得到的生態(tài)位模型的時 間轉(zhuǎn)移能力。
[0086]可理解的是,步驟T2計算改進后得到的生態(tài)位模型的時間轉(zhuǎn)移能力的原理與上述 步驟T1類似,在此處不再贅述。
[0087] T3、將改進后得到的生態(tài)位模型的時間轉(zhuǎn)移能力與初始生態(tài)位模型的時間轉(zhuǎn)移能 力進行比較,以驗證所述預(yù)設(shè)方法對所述初始生態(tài)位模型的時間轉(zhuǎn)移能力的提高有效性。
[0088] 在具體應(yīng)用中,以美國阿肯色流域瀕危鯉魚(簡稱NG)的分布數(shù)據(jù)與環(huán)境數(shù)據(jù)建立 初始前期模型和初始后期模型為例,其中,阿肯色河流域位于美國中部大平原,流域面積約 417,000km 2。研究發(fā)現(xiàn),自1990年以后NG的分布數(shù)量驟減,故以1990年為分界時間點,將 1950-1989年作為"前期"時間段,將1990-2010年作為"后期"時間段。發(fā)明中沿用了 Worthington等基于大量文獻數(shù)據(jù)庫收集的NG分布點數(shù)據(jù),"前期"為164個記錄,"后期"為 47個記錄。兩個時期的地理空間數(shù)據(jù),均采用基于美國地質(zhì)調(diào)查局國家水文數(shù)據(jù)庫下載的 阿肯色河流域52,617個河段?;谧畲箪乩碚摰腗axEnt模型軟件,分別采用24個相關(guān)環(huán)境 變量在"前期"和"后期"的數(shù)據(jù),包括19個生物氣候變量、土地利用類型、地質(zhì)類型、河流等 級、最大高程和坡度,創(chuàng)建初始"前期模型"和初始"后期模型";
[0089] 上述步驟Al在計算所述初始生態(tài)位模型的追溯能力的過程中,計算后期模型投影 后重新估算的物種的前期分布概率與初始前期模型估算的物種的分布概率之間的斯皮爾 曼秩Spearman's rho相關(guān)系數(shù)rb的公式如下:
[0090]
[0091]式中,i為研究區(qū)域所有河段總數(shù)舊^少化^為"前期"模型估算的如在各河段的 "前期"分布概率;為"前期"模型估算的各河段分布概率平均值;Pb1為投影后重新估算的 NG在各河段的"前期"分布概率;^為投影后重新估算的"前期"分布概率平均值。
[0092]上述步驟A2在計算所述初始生態(tài)位模型的預(yù)測能力的過程中,計算重新估算的物 種的后期分布概率與初始后期模型估算的物種的分布概率之間的斯皮爾曼秩Spearman's rho相關(guān)系數(shù)rf的公式如下:
[0093;
[0094]式中,i為研究區(qū)域所有河段總數(shù)^[!,私陽為"后期"模型估算的如在各河段的 "后期"分布概率;為"后期"模型估算的"后期"分布概率平均值;Pf:為投影后重新估算的 NG在各河段的"后期"分布概率;為投影后重新估算的"后期"分布概率平均值。
[0095] 以美國阿肯色流域瀕危鯉魚的分布數(shù)據(jù)與環(huán)境數(shù)據(jù)建立初始前期模型和初始后 期模型為例,本實施例的提高生態(tài)位模型時間轉(zhuǎn)移能力的方法,可以具體包括:
[0096] Bl、以美國阿肯色流域瀕危鯉魚的分布數(shù)據(jù)與環(huán)境數(shù)據(jù),構(gòu)建初始生態(tài)位模型 (MaxEnt模型),所述初始生態(tài)位模型包括:初始前期模型和初始后期模型。
[0097] Β2、利用預(yù)設(shè)方法,對所述初始生態(tài)位模型進行改進,以提高所述初始生態(tài)位模型 的時間轉(zhuǎn)移能力。
[0098] 其中,所述時間轉(zhuǎn)移能力,包括:追溯能力和預(yù)測能力;
[00"]所述預(yù)設(shè)方法,包括:環(huán)境變量篩選方法、和/或模型參數(shù)ReguIari ζat ion Multiplier調(diào)節(jié)方法;
[0100]所述環(huán)境變量篩選方法為:基于斯皮爾曼秩Spearmant s rho相關(guān)性系數(shù)的環(huán)境變 量篩選方法、或者基于方差膨脹因子VIF的環(huán)境變量篩選方法。
[0101]在具體應(yīng)用中,步驟B2所利用的基于斯皮爾曼秩Spearman's rho相關(guān)性系數(shù)的環(huán) 境變量篩選方法(可參考圖2),可以包括:
[0102] Cl、將前期的24個環(huán)境變量進行兩兩組合并將后期的24個環(huán)境變量進行兩兩組 合,得到前期的多組變量組合和后期的多組變量組合。
[0103] C2、利用IBM SPSS Statistic 20軟件計算得到的變量組合中每組的兩個環(huán)境變 量之間的Spearman's rho相關(guān)系數(shù)|r I,計算公式如下:
[0104]
[0105] 其中,i為研究區(qū)域所有河段總數(shù)16[1,幻^1和71分別為一組變量在第1個河段的 值;孓和5為變量的平均值。
[0106] C3、按照|r I的大小排序,選取|r I最大的一組變量組合,如果選取的該組變量組合 的I r 0.7,則基于變量的生態(tài)學意義或通過對比兩個環(huán)境變量在初始前期模型初始后期 模型中的貢獻率,篩選出該組變量組合中的一個與物種分布最相關(guān)的環(huán)境變量,將該組變 量組合中的另外一個環(huán)境變量剔除。
[0107] C4、將剔除后余下的前期的環(huán)境變量進行兩兩組合并將剔除后余下的后期的環(huán)境 變量進行兩兩組合,返回步驟S2,直至余下全部環(huán)境變量的I r I〈0.7時,環(huán)境變量的篩選結(jié) 束。
[0108]通過對步驟B2利用基于斯皮爾曼秩Spearman'S rho相關(guān)性系數(shù)的環(huán)境變量篩選 方法對所述初始生態(tài)位模型進行改進的結(jié)果進行分析可知:
[0109] 在兩個時期內(nèi),19個生物氣候變量之間,及各生物氣候變量與最大高程變量之前 的相關(guān)性均較強。變量在兩個時期被剔除的順序不同,但篩選后兩個模型中被保留下來的 變量相同,兩個初始模型均由24個變量縮減到9個;如圖3所示,隨著模型變量數(shù)量的減少, "前期"模型的預(yù)測能力系數(shù)I η I和I后期模型的追溯能力系數(shù)I η I整體不斷提高。個別變量 篩選后會有下降的情況,如當變量個數(shù)下降為22或19時,|n I和|n I的值均有所下降,主要 原因在于變量篩選過程中,考慮到變量的生態(tài)學意義,保留了相關(guān)性較強的變量。當篩選過 程結(jié)束,兩個模型的變量數(shù)量為9時,I rb I和I rf I分別提高到了0.66和0.70。說明此時模型轉(zhuǎn) 移前后的預(yù)測結(jié)果中度相關(guān),模型的時間轉(zhuǎn)移能力有所提高。環(huán)境變量篩選后,"前期"模型 和"后期"模型的AUC值仍為0.96和0.98,說明變量減少并未影響模型的自適應(yīng)性。
[0110] 在具體應(yīng)用中,步驟B2所利用的基于方差膨脹因子VIF的環(huán)境變量篩選方法(可參 考圖4),可以包括:
[0111] Dl、針對初始前期模型和初始后期模型,利用IBM SPSS Statistic 20軟件建立以 任意常量作為因變量,以環(huán)境變量作為自變量的線性方程,并計算該線性方程中每個自變 量的IVIFI值,以其中第k個自變量的IVIFI的計算過程為例,,該計算過程如下:
[0112] = αιΧι+α2Χ2Η-----Kik-iXk-l+αk+lXk+l^-----KiNXN+co+e,
[0113] 貝丨J yII7 =J^r; 'i
[0114] 其中,CX^a2 Vak-^akA…、aN為回歸系數(shù),Co為常數(shù)項,e為誤差項,Ri為自變量Xi 的線性方程中的決定系數(shù),。
[0115] D2、刪除自變量的IVIF I值最大的環(huán)境變量,并將其刪除。
[0116] D3、將余下的環(huán)境變量重新作為自變量與任意常量建立線性方程,并計算該線性 方程中每個自變量的IVIFI值,再次刪除IVIFI值最大的環(huán)境變量。
[0117] D4、重復(fù)步驟P3,直至余下的環(huán)境變量重新作為自變量與任意常量建立線性方程 中每個自變量的IVIFI值I均小于10時,環(huán)境變量的篩選結(jié)束。
[0118] 通過對步驟B2利用基于方差膨脹因子VIF的環(huán)境變量篩選方法對所述初始生態(tài)位 模型進行改進的結(jié)果進行分析可知:
[0119] 方差膨脹因子I VIF I同樣顯示出19個生物氣候變量及最大高程變量的相關(guān)性較 強。篩選后兩個模型中的變量個數(shù)均由24個變量縮減到9個;如圖5所示,環(huán)境變量篩選過程 中,隨著變量數(shù)量的減少,追溯和預(yù)測系數(shù)曲線呈現(xiàn)更加明顯地上升趨勢,篩選過程結(jié)束 時,I rb I和I rf I分別提高到了0.76和0.75,提高幅度較大。環(huán)境變量篩選后,"前期"模型和 "后期"模型的AUC值仍為0.96和0.98,說明模型的自適應(yīng)效果仍較好。
[0120] 在具體應(yīng)用中,步驟B2所利用的模型參數(shù)Regularization Multiplier調(diào)節(jié)方法, 可以包括:
[0121 ] 所述初始生態(tài)位模型(MaxEnt模型)包括:Regularization Multiplier參數(shù),通過 將Regularization Multiplier的值依次增加為1、2.5、5、10和20,將增加后的 Regularization Multiplier的值分別應(yīng)用在初始前期模型和初始后期模型中,來選擇最 優(yōu)Regularization Multiplier參數(shù)。
[0122] 通過對步驟B2利用模型參數(shù)Regularization Multiplier調(diào)節(jié)方法對所述初始生 態(tài)位模型進行改進的結(jié)果進行分析可知:
[0123] 對初始"前期"和"后期"模型,及基于兩種方法進行變量篩選后的模型,增加參數(shù) "Regulari zation Multipi ier"值,曲線均呈現(xiàn)單調(diào)遞增的趨勢,如附圖6所示,當 "Regularization Multiplier" 為20時,初始模型的 I rf I 和 I rb I 分別提高到了0· 89和0.91, 說明轉(zhuǎn)移前后的模型達到高度相關(guān)。對于基于Spearman's rho相關(guān)系數(shù)的環(huán)境變量篩選后 的模型,當"Regularization Multiplier"值增加到10和20時,I rf I和I rb I的提高程度優(yōu)于 初始模型;對于基于方差膨脹因子VIF的環(huán)境變量篩選后的模型,"Regularization Multiplier"的所有值對I η I和I η I的提高程度均優(yōu)于初始模型。說明通過增大參數(shù)簡化模 型有助于時間轉(zhuǎn)移能力的提高,增加 "Regularization Multiplier"值和VIF方法相結(jié)合, 對模型轉(zhuǎn)移能力的提高程度較為顯著。
[0124] 但隨著"Regularization Multiplier"的增大,模型預(yù)測的物種適生概率與各環(huán) 境變量的關(guān)系反應(yīng)曲線會趨于平滑。因此,"Regularization Multiplier"的增大是有限度 的,在增大模型轉(zhuǎn)移能力的同時,要兼顧模型的自適應(yīng)性。當"R e g u I a r i z a t i ο η Multiplier" < 5時,曲線基本能夠反應(yīng)變量與適生概率的關(guān)系。
[0125] 本實施例的提高生態(tài)位模型時間轉(zhuǎn)移能力的方法,能夠有效提高生態(tài)位模型的時 間轉(zhuǎn)移能力,并提高模擬的準確性。
[0126] 本實施例提出了通過降低環(huán)境變量維數(shù)和模型復(fù)雜程度來提高模型的時間轉(zhuǎn)移 能力的方法,為模型轉(zhuǎn)移能力的提高提供重要參考;本實施例證明了降低模型維度和模型 復(fù)雜程度,能夠有效地提高生態(tài)位模型的追溯能力和預(yù)測能力,且彌補了現(xiàn)階段模型時間 轉(zhuǎn)移能力研究較少的不足。
[0127] 最后需要說明的是:以上所述僅為本發(fā)明的較佳實施例,僅適用于說明本發(fā)明的 技術(shù)方案,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)所做的任何修 改、等同替換、改進等,均包含在本發(fā)明的保護范圍內(nèi)。
【主權(quán)項】
1. 一種提高生態(tài)位模型時間轉(zhuǎn)移能力的方法,其特征在于,包括: 根據(jù)目標區(qū)域的物種分布數(shù)據(jù)與全部環(huán)境因子數(shù)據(jù),構(gòu)建初始生態(tài)位模型,所述初始 生態(tài)位模型包括:初始前期模型和初始后期模型; 利用預(yù)設(shè)方法,對所述初始生態(tài)位模型進行改進,以提高所述初始生態(tài)位模型的時間 轉(zhuǎn)移能力; 其中,所述時間轉(zhuǎn)移能力,包括:追溯能力和預(yù)測能力。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始生態(tài)位模型,包括:最大熵模型 MaxEnt 〇3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述預(yù)設(shè)方法,包括:環(huán)境變量篩選方法、 和/或模型參數(shù)Regularization Multiplier調(diào)節(jié)方法; 所述環(huán)境變量篩選方法為:基于斯皮爾曼秩Spearman's rho相關(guān)性系數(shù)的環(huán)境變量篩 選方法、或者基于方差膨脹因子VIF的環(huán)境變量篩選方法。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于斯皮爾曼秩Spearman ' s rho相關(guān) 性系數(shù)的環(huán)境變量篩選方法,包括: 51、 將前期的環(huán)境變量進行兩兩組合,并將后期的環(huán)境變量進行兩兩組合,得到前期的 多組變量組合和后期的多組變量組合; 52、 計算得到的變量組合中每組的兩個環(huán)境變量之間的Spearman's rho相關(guān)系數(shù)|r| ; 53、 按照| r |的大小排序,選取| r |最大的一組變量組合,如果選取的該組變量組合的| r 大于等于預(yù)設(shè)第一閾值,則基于變量的生態(tài)學意義或通過對比兩個環(huán)境變量在初始前期 模型或初始后期模型中的貢獻率,篩選出該組變量組合中的一個與物種分布最相關(guān)的環(huán)境 變量,將該組變量組合中的另外一個環(huán)境變量剔除; 54、 將剔除后余下的前期的環(huán)境變量進行兩兩組合或?qū)⑻蕹笥嘞碌暮笃诘沫h(huán)境變量 進行兩兩組合,返回步驟S2,直至余下全部環(huán)境變量的|r|小于預(yù)設(shè)第一閾值時,環(huán)境變量 的篩選結(jié)束。5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于方差膨脹因子VIF的環(huán)境變量篩 選方法,包括: P1、針對初始前期模型和初始后期模型,建立以任意常量作為因變量,以環(huán)境變量作為 自變量的線性方程,并計算該線性方程中每個自變量的IVIFI值; P2、刪除自變量的| VIF |值最大的環(huán)境變量; P3、將余下的環(huán)境變量重新作為自變量與任意常量建立線性方程,并計算該線性方程 中每個自變量的IVIF |值,再次刪除| VIF |值最大的環(huán)境變量; P4、重復(fù)步驟P3,直至余下的環(huán)境變量重新作為自變量與任意常量建立線性方程中每 個自變量的IVIF |值|均小于預(yù)設(shè)第二閾值時,環(huán)境變量的篩選結(jié)束。6. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述模型參數(shù)R e g u 1 a r i z a t i ο η 11111:丨口1丨61'調(diào)節(jié)方法,包括: 所述初始生態(tài)位模型包括:Regularization Multiplier參數(shù),通過將Regularization Multiplier的值依次增加為預(yù)設(shè)值,將增加后的Regularization Multiplier的值分別應(yīng) 用在初始前期模型和初始后期模型中,來選擇最優(yōu)Regularization Multiplier參數(shù)。7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 計算所述初始生態(tài)位模型的時間轉(zhuǎn)移能力; 計算利用預(yù)設(shè)方法對所述初始生態(tài)位模型進行改進后得到的生態(tài)位模型的時間轉(zhuǎn)移 能力; 將改進后得到的生態(tài)位模型的時間轉(zhuǎn)移能力與初始生態(tài)位模型的時間轉(zhuǎn)移能力進行 比較,以驗證所述預(yù)設(shè)方法對所述初始生態(tài)位模型的時間轉(zhuǎn)移能力的提高有效性。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述計算所述初始生態(tài)位模型的時間轉(zhuǎn)移 能力,包括: 計算所述初始生態(tài)位模型的追溯能力; 計算所述初始生態(tài)位模型的預(yù)測能力。9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述計算所述初始生態(tài)位模型的追溯能 力,包括: 將初始后期模型投影至前期環(huán)境中,重新估算物種的前期分布概率; 計算重新估算的物種的前期分布概率與初始前期模型估算的物種的分布概率之間的 斯皮爾曼秩Spearman ' s rho相關(guān)系數(shù),并根據(jù)該Spearman ' s rho相關(guān)系數(shù)確定所述初始生 態(tài)位模型的追溯能力。10. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述計算所述初始生態(tài)位模型的預(yù)測能 力,包括: 將初始前期模型投影至后期環(huán)境中,重新估算物種的后期分布概率; 計算重新估算的物種的后期分布概率與初始后期模型估算的物種的分布概率之間的 斯皮爾曼秩Spearman ' s rho相關(guān)系數(shù),并根據(jù)該Spearman ' s rho相關(guān)系數(shù)確定所述初始生 態(tài)位模型的預(yù)測能力。
【文檔編號】G06F17/50GK105844005SQ201610162530
【公開日】2016年8月10日
【申請日】2016年3月21日
【發(fā)明人】劉剛, 張?zhí)祢?
【申請人】中國農(nóng)業(yè)大學