專利名稱:一種基于分子結構和環(huán)境溫度預測化學物質與臭氧氧化反應速率常數的方法
技術領域:
本發(fā)明涉及不同環(huán)境溫度下臭氧與有機化學物質氧化反應速率常數(k03)的快速預測方法,屬于面向環(huán)境風險評價的定量結構與活性關系OiSAR)技術領域。背景介紹大多數的工業(yè)化學品具有一定的生化穩(wěn)定性,由光所引發(fā)的直接降解以及自由基反應是其在環(huán)境中轉化的主要途徑。在大氣層中有機污染物的持久性(半衰期)可以通過與羥基自由基、硝基自由基和臭氧進行化學反應的速率常數等信息進行計算。大氣對流層中的有機污染物,日間主要是通過羥基自由基和臭氧降解來去除,夜間主要是通過硝基自由基反應降解。其中,化合物與臭氧反應的降解速率常數(kj是表征化學品在環(huán)境中持久性的關鍵參數。目前對于化學品環(huán)境持久性評價多基于實驗測試,如光解活性和活性氧物種 (ROS)氧化活性測試等,但完全依靠實驗測試來獲得化學品的環(huán)境持久性數據,具有巨大的財政壓力。同時,新合成的日常使用有機化學品正以每年500 1000種的速度增加,對這些化學品一一進行實驗測試,無法滿足環(huán)境管理的要求,亟需發(fā)展成本低且快速的化學品環(huán)境持久性評估方法?;诙拷Y構與活性關系OiSAR),可以從化學品的分子結構出發(fā),預測化學品與臭氧反應的速率常數,彌補基礎數據的缺失,用于評估化學品的光穩(wěn)定性。已報導關于的QSAR模型,但這些模型在實用性、預測能力與穩(wěn)健性、應用域
Fatemi · (Fatemi, M. H. Prediction of ozone tropospheric degradation rate constant of organic compounds by using artificial neural networks. Analytica Chimica Acta. 2006,556 :355-363)建立了基于人工神經網絡 (ANN)的137種化合物與臭氧反應的QSAR模型,該模型采用非線性的方法,主要用于預測^SK條件下有機化合物與臭氧反應的1^,模型的透明度不強,不能預測不同溫度下的 k03。Pompe 禾口 Veber (Pompe,Μ.,Veber, Μ.,Prediction of rate constants for the reaction of O3 with different organic compounds. Atmospheric Environment. 2001, 35(22) :3781-3788)建立了基于多元線性回歸(MLR)的117種不同種類化合物與臭氧反應的QSAR模型,不能預測多個溫度下的kQ3。Jiang等(Jiang,J. L.,Yue, Χ. Α.,Chen, Q. F. Determination of ozonization reaction rate constants of aromatic pollutants and QSAR study. Bulletin of Environmental Contamination and Toxicology. 2010,85 568-72)建立了基于密度泛函理論(DFT)的39種芳香族化合物與臭氧反應的QSAR模型,該模型選擇的化合物種類單一,應用域偏小,需擴大應用域的范圍。構建實用性強且算法簡單透明的溫度依附性預測模型,并對其預測能力和穩(wěn)健性進行評價,在此基礎上對應用域范圍進行表征,對有機化學品的生態(tài)風險評價與監(jiān)管工作具有重要意義
發(fā)明內容
本發(fā)明要解決的技術問題是提供一種不同環(huán)境溫度下有機化合物與臭氧反應速率常數的簡便、快速、低成本、應用范圍廣的預測方法。為解決以上技術問題本發(fā)明采用的技術方案如下(1)為了保證用于建立模型的數據準確性,對從文獻收集的實驗測定值進行評估和分析,刪除離群點。首先,對同一化合物的多個實驗測定值進行統(tǒng)計學評估,刪除偏離平均值的數據點;其次,對同一化合物在不同溫度下的Iogkffi對1/T作圖分析,刪除偏離線性的數據點。最終得到1 種有機化合物共264個Iogkffi數據,溫度范圍從178K到364K。根據化合物與臭氧反應的機理分析,計算26個量子化學描述符、1481個Dragon描述符和12 個分子結構碎片,加入1/T溫度描述符?;衔锇▎蜗N、二烯烴及多烯烴、鹵代烯烴、環(huán)狀化合物、芳香族化合物、含氧化合物、含氮化合物等。以4 1的比例隨機劃分訓練集和驗證集。(2)聯(lián)合應用逐步回歸和PLS回歸篩選訓練集的描述符組合,構建預測的QSAR 模型,具體步驟如下第一步,采用逐步回歸方法進行初篩變量,在多元線性回歸(MLR)模型中,膨脹因子(VIF)小于10 ;第二步,基于PLS回歸,篩選變量的過程如下先建立包含所有初篩得到的變量的 PLS模型,選擇模型相關系數的平方(R2)和累計交叉驗證系數(Q2oti)為參考值,R2和Q2am 是由Simca6. 0軟件計算得出;分別去除每個描述符一次,以R2和Q2aa數值升高最大的模型為基準模型,重復上述步驟直至R2和Q2oti不再升高為止。若有幾個方程的R2和Q2oti數值相近,則比較經自由度調整后的決定系數(R2adj),選擇R2adj最大的模型為最優(yōu)模型。最優(yōu)模型的表達式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66 971Xnc = c-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn =
CHE-1. 7438Xnffl^O. 4576Xn = CK2-1. 1235XnBM+0. 28542XnCIKCLE (1)其中,1/T表示溫度的倒數;Ehqmq表示最高占據分子軌道能;electrophility表示親電性;η。=。表示碳碳雙鍵的個數;qCmax表示碳原子最大正電荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的個數;nra2表示氨基的個數;H = Oi2表示=CR2的個數;nBM表示苯環(huán)上甲基的個數;如_表示脂肪環(huán)的個數。經內部驗證和外部驗證證實kQ3預測模型的穩(wěn)健性和預測能力。模型的擬合能力由R2adj和均方根誤差(RMSE)來表征,R2adj = 0. 849, RMSE = 0. 562,表明模型具有較好的擬合能力。穩(wěn)健性用內部驗證的交叉驗證系數評價,交叉驗證系數Q2cum = 0. 838,表明該QSAR 模型具有較好的穩(wěn)健性。模型的預測能力采用未參與建模的50個外部數據評價,由外部預測相關系數的平方(Q2rat)來表征,Q2ext = 0.878,表明模型具有較好的預測能力。其中, R2adj, RMSE, Q2ext由下列公式得出
權利要求
1.一種基于分子結構和環(huán)境溫度預測化學物質與臭氧氧化反應速率常數的方法,其特征在于,(1)首先,對同一化合物的多個實驗測定值進行統(tǒng)計學評估,刪除偏離平均值的數據點;其次,對同一化合物在不同溫度下的Iogkffi對1/T作圖分析,刪除偏離線性的數據點; 最終得到1 種有機化合物共264個Iogkra數據,溫度范圍從178K到364K ;根據化合物與臭氧反應的機理分析,計算26個量子化學描述符、1481個Dragon描述符和12個分子結構碎片,加入1/T溫度描述符;(2)聯(lián)合應用逐步回歸和PLS回歸篩選描述符組合,構建預測1 的QSAR模型;具體步驟如下第一步,采用逐步回歸方法進行初篩變量,在多元線性回歸(MLR)模型中,膨脹因子 (VIF)小于 10 ;第二步,基于PLS回歸,篩選變量的過程如下先建立包含所有初篩得到的變量的PLS 模型,選擇模型相關系數的平方(R2)和累計交叉驗證系數(Q2cJ為參考值,分別去除每個描述符一次,以R2和Q2cm數值升高最大的模型為基準模型,重復上述步驟直至R2y和Q2oti不再升高為止;若有幾個方程的R2和Q2cum數值相近,則比較訓練集的經自由度調整后的決定系數(R2atu),選擇R2atu最大的模型為最優(yōu)模型;最優(yōu)模型的表達式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66971Xnc = G-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn = CHE-1. 7438XnNH2+0. 4576Xn = CE2-l. 1235XnBM+0. 28542XnCIECLE (1)其中,1/T表示溫度的倒數;Ehqmq表示最高占據分子軌道能;electrophility表示親電性;η。=。表示碳碳雙鍵的個數;qCmax表示碳原子最大正電荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的個數;nra2表示氨基的個數;H = Oi2表示=CR2的個數;nBM表示苯環(huán)上甲基的個數;如_表示脂肪環(huán)的個數。
2.根據權利要求1所述的的方法,其特征在于,所述的化合物包括單烯烴、二烯烴及多烯烴、商代烯烴、環(huán)狀化合物、芳香族化合物、含氧化合物、含氮化合物。
全文摘要
本發(fā)明公開了一種基于分子結構和環(huán)境溫度預測化學品與臭氧反應速率常數(kO3)的方法,屬面向化學品環(huán)境監(jiān)管的定量結構-活性關系(QSAR)技術領域。kO3影響化學品在大氣中滯留時間(半衰期),是評估化學品的環(huán)境持久性的重要參數。本發(fā)明采用了量子化學描述符、Dragon計算的描述符、分子結構碎片表征化合物的分子結構特征,構建了預測kO3的QSAR模型。所構建的不同環(huán)境溫度下kO3的QSAR模型,經內部驗證和外部驗證證實了其有良好的穩(wěn)健性和預測能力,并基于Williams圖法表征了QSAR模型的應用域,明確了模型的應用范圍。
文檔編號G01N25/00GK102507630SQ201110392788
公開日2012年6月20日 申請日期2011年11月30日 優(yōu)先權日2011年11月30日
發(fā)明者喬顯亮, 姜菁秋, 李晶, 李雪花, 蔡喜運, 趙文星, 陳景文 申請人:大連理工大學