基于金屬定量構(gòu)效關(guān)系的海水急性基準預測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及海水水質(zhì)基準模型領(lǐng)域,尤其設(shè)及基于金屬定量構(gòu)效關(guān)系的海水急性 基準預測方法。
【背景技術(shù)】
[0002] 人類的生存與發(fā)展都依賴于海洋,但隨著沿海區(qū)域經(jīng)濟的快速發(fā)展,我國近岸海 域正遭遇著日益嚴重的陸源重金屬污染,海洋生物多樣性和生態(tài)系統(tǒng)的平衡也正經(jīng)受著嚴 重的考驗。如浙江溫州的樂清灣沿海區(qū)域,化工產(chǎn)業(yè)W及電子拆解行業(yè)的高速發(fā)展使得浙 江省6500公里長的海岸線上超過80%的海岸帶受到污染,表層沉積物銅的超標率達到 50% ,2011年7月還出現(xiàn)了水生生物大規(guī)模死亡,如何建立切實可行的保護海洋生物的金屬 海水水質(zhì)基準已成為我國海洋環(huán)境管理中亟待解決的關(guān)鍵問題。
[0003] 自上世紀屯十年代初,USEPA就開展了金屬污染物的海水水質(zhì)基準的研究,《清潔 水法》頒布了儒,銅,隸,儀,銀、儘等6種優(yōu)控及非優(yōu)控金屬的基準值,W保護魚和其他海洋 生物的繁殖和生存。近四十年來,美國環(huán)保局根據(jù)最新科學進展對水質(zhì)基準不斷進行更新, 相繼頒布基準文件共6次。在最新的基準文件中,15種金屬或類金屬被列入優(yōu)控污染物和非 優(yōu)控污染物名錄,其中10種(神,儒,銘,銅,鉛,隸,儀,砸,銀,鋒)給出了海水水質(zhì)基準最大 濃度值。另外一些發(fā)達國家和地區(qū),如歐盟、加拿大、澳大利亞、新西蘭等也根據(jù)其海洋水環(huán) 境污染狀況,從保護水生生態(tài)系統(tǒng)的角度出發(fā),結(jié)合毒理實驗數(shù)據(jù)和現(xiàn)場環(huán)境調(diào)查資料,相 繼制訂了金屬類污染物保護海洋生態(tài)系統(tǒng)的水質(zhì)基準值,并且形成了較為系統(tǒng)的水質(zhì)基準 研究體系。而我國的海洋環(huán)境質(zhì)量基準研究尚處于起步階段,正在國外水質(zhì)基準研究方法 的基礎(chǔ)上摸索前進,目前僅有一些零星的關(guān)于金屬海水水質(zhì)基準的研究,究其原因主要是 社會對海洋生態(tài)系統(tǒng)重視不夠,對海洋物種的實驗室培養(yǎng)繁殖技術(shù)、毒性測試標準方法的 研究也相對較少,海洋生物的實驗數(shù)據(jù),尤其是脊椎動物的毒性數(shù)據(jù)嚴重匿乏,相對于淡水 生態(tài)系統(tǒng),海洋生態(tài)系統(tǒng)擁有更豐富的生物種類,很多種類的生物,如棘皮類,只能在海洋 環(huán)境中存活,但就目前已有的研究成果,海洋生物的毒性數(shù)據(jù)要遠遠少于淡水生物,運些都 給我國海水水質(zhì)基準的制訂帶來了極大的困難。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供一種基于金屬定量構(gòu)效關(guān)系的海水急性基準預測方法,用 W克服上述的技術(shù)問題。
[0005] 為實現(xiàn)所述的目的,本發(fā)明提供一種基于金屬定量構(gòu)效關(guān)系的海水急性基準預測 方法,根據(jù)金屬離子的結(jié)構(gòu)特征與海洋生物急性毒性效應(yīng)的定量關(guān)系預測未知金屬的毒性 終點,結(jié)合不同物種的敏感度分布分析推導保護不同比例的海洋生物的危險濃度;
[0006] 該具體過程為:
[0007] 步驟a,建模毒性數(shù)據(jù)采集,篩選,運算和匯總;
[000引步驟b,五口八科海洋模式生物篩選;
[0009] 步驟c,構(gòu)建金屬離子結(jié)構(gòu)描述符數(shù)據(jù)集,w各金屬對應(yīng)的結(jié)構(gòu)參數(shù)為自變量進行 線性相關(guān)性分析,通過相關(guān)系數(shù)排序,獲得最佳的結(jié)構(gòu)描述符;
[0010] 步驟d,構(gòu)建毒性預測模型及穩(wěn)健性檢驗;建立一元回歸方程,對參數(shù)進行估計,采 用F統(tǒng)計量對應(yīng)的P值進行檢驗;
[0011] 步驟e,QSAR模型的內(nèi)部驗證,包括交叉驗證和y隨機化驗證,分別用e 1和e2表示;
[0012] 步驟f,QSAR模型的外部驗證;
[0013] 步驟g,模型適用范圍計算;經(jīng)過校驗的模型,W杠桿值h為橫坐標,W各數(shù)據(jù)點的 標準殘差為縱坐標,繪制Williams圖;
[0014] 步驟h,基于獲得的毒性預測值,利用物種敏感度分布法對未知金屬的毒性和基準 預測值進行快速篩選與預測。
[0015] 進一步地,在所述的步驟C中,W單物種的毒性終點為因變量,各金屬對應(yīng)的結(jié)構(gòu) 參數(shù)為自變量進行線性相關(guān)性分析,根據(jù)下述公式(1)計算相關(guān)系數(shù)r;
[0016]
[0017] 式中,i,歹分別表示各結(jié)構(gòu)參數(shù)和毒性值的平均值,Χι和yi分別表示第i種金屬 對應(yīng)的結(jié)構(gòu)參數(shù)和毒性值;
[0018] 相關(guān)系數(shù)r〉0.8為顯著相關(guān)參數(shù)。
[0019] 進一步地,在所述的步驟C中,構(gòu)建金屬離子結(jié)構(gòu)描述符集合,包括軟指數(shù)σρ、最大 配合物穩(wěn)定常數(shù)log-βη、鮑林(Pauling)電負性Xm、共價指數(shù)Xm 2r、原子電離勢ΑΝ/ΔΙΡ、第一 水解常數(shù)llogKoHl、電化學勢ΔΕο、原子大小AR/AW、極化力參數(shù)2作、2/^2 2/^、似極化力參 數(shù)Z/AR、Z/AR2。
[0020] 進一步地,所述的步驟d的過程為:
[0021] 步驟dl,一元回歸方程的構(gòu)建與參數(shù)估計;
[0022] W所述的步驟C中確定的最佳結(jié)構(gòu)參數(shù)為自變量X,金屬活性值為因變量Y,利用一 元線性回歸分析方法構(gòu)建各模式生物的QICAR方程Y = XB+E,請參閱下述公式(2),其中:
[0023]
[0024] η為觀測值個數(shù)。
[0025] 采用最小二乘法對方程中參數(shù)進行估計,公為X的轉(zhuǎn)置矩陣:
[0026]
[0027] 步驟d2,擬合優(yōu)度檢驗和回歸方程的顯著性檢驗,采用F檢驗;
[0028] 模型的擬合優(yōu)度檢驗指標為:決定系數(shù)R2和自由度校正的決定系數(shù)廬,標準偏差 RM沈;
[0029] F檢驗的指標為單因子方差分析(AN0VA)計算得到的F值和相關(guān)概率P (Significance F);采用F統(tǒng)計量對應(yīng)的P值進行檢驗;
[0030] 步驟d3,判別標準:根據(jù)毒性數(shù)據(jù)獲取途徑,體外實驗R2 > 0.81,體內(nèi)試驗R2 > 0.64;顯著水平為α,當ρ<α時,回歸方程顯著。
[0031] 進一步地,所述的步驟d3按照下述公式計算,
[0036] 式中,R2表示決定系數(shù),夢表示自由度校正的決定系數(shù),MSE表示標準偏差。
[0037] 進一步地,所述的步驟e中,el的具體過程為:
[0038] 步驟el_l,在給定的建模樣本中,選取大部分樣本進行建模型,留小部分樣本用建 立的模型進行預測,并計算運小部分樣本的預測誤差;
[0039] 步驟el_2,記錄每個方程中預測誤差的平方加和,直到所有的樣本都被預報了一 次而且僅被預報一次;
[0040] 步驟el_3,計算交叉驗證相關(guān)系數(shù)Q2ev和交叉驗證均方根誤差RMSECV,判別依據(jù): Q2cv〉0.6,R2-Q2cv<0.3。
[0041] 進一步地,所述的步驟el_3采用的計算公式為:
[0044] 式中,.V嚴s表示第i個化合物毒性的實測值,代表第i個化合物毒性的預測 值,?""代表訓練集毒性的平均值,η表示訓練集中化合物數(shù)。
[0045] 進一步地,所述的步驟e中,e2的具體過程為:
[0046] 步驟e2_l,在給定的樣本中,將原始的因變量(建模海洋生物的急性毒性觀測值) 隨機打亂順序,同時保持自變量順序不變,組成新的數(shù)據(jù)組;
[0047] 步驟e2_2,用新樣本構(gòu)建QSAR模型,并計算其標準偏差RMSE和交叉驗證的均方根 誤差RM沈CV;
[004引步驟e2_3,所述的步驟e2_l、e2_2重復進行50次,WRMSE為橫坐標、RMSECV為縱坐 標作圖,比較y隨機化后的QSAR模型的RMSECV和RMSE是否顯著增加。
[0049]進一步地,所述的步驟e2_2采用的計算公式為:
[0化2]式中,表示新的QSAR模型中第i個化合物毒性的實測值,y/wv代表第i個化合 物毒性的預測值,j/'"'"'表示新的QSAR模型進行留一法交叉驗證時第i個化合物毒性的預 測值,η表示訓練集中化合物數(shù)。
[0053] 進一步地,所述的步驟f的具體過程為:
[0054] 步驟η,將樣本劃分為訓練集和驗證集,劃分方法為:將樣本按毒性從小到大順序 排列,驗證集數(shù)據(jù)均勻地分布在訓練集數(shù)據(jù)范圍內(nèi),且驗證集數(shù)據(jù)不少于總樣本的20% ;
[0055] 步驟f 2,用訓練集數(shù)據(jù)構(gòu)建QSAR模型;
[0056] 步驟巧,計算驗證集數(shù)據(jù)預測值與觀測值之間的交互驗證系數(shù)Qext2和一致性相關(guān) 系數(shù) CCC,判別依據(jù):Qext2〉0.6,CCC〉0.85。
[0057] 進一步地,所述的步驟巧采用的計算公式為:
[0061]式中,yi表示觀測值;y',·表示預測值;J表示觀測值的均值;方表示訓練集觀測值 的均值;^表示預測值的均值;next表示驗證集的樣本數(shù)。
[0062] 進一步地,所述的步驟g中,杠桿值hi的計算公式為:
[0063] 1π = χΛχΤχ)-?χι (14)
[0064] 式中,xi代表第i個金屬的結(jié)構(gòu)參數(shù)組成的列向量;對于單參數(shù)模型:
;χΤ表示矩陣X的轉(zhuǎn)置矩陣,(χΤχ尸表示對χΤχ矩陣的逆矩陣。
[0065] 進一步地,所述的步驟f中,臨界值h*的計算公式為:
[0066]
(15)
[