專利名稱:蛋白質三維結構的預測方法及預測裝置的制作方法
技術領域:
本發(fā)明涉及蛋白質結構預測技術領域,尤其涉及一種蛋白質三維結構的預測方法及預測裝置。
背景技術:
生物學研究表明,蛋白質是由特定的氨基酸序列構成的。正常情況下,蛋白質并不是以完全伸展的多肽鏈結構存在,而是以緊密折疊的三維結構存在,并且一個特定蛋白質行使其功能的能力通常由其三維結構決定。因此,確定蛋白質的三維結構,或稱其構象,是生物領域的一項重要課題。目前,采用X射線衍射和核磁共振等分析化學的方法已經實現(xiàn)了對部分蛋白質三維結構的分析,但是,這些分析技術需要花費大量的時間和費用,不能滿足蛋白質結構分析的需要,而結合信息技術發(fā)展起來的蛋白質結構預測方法由于具有快速的優(yōu)點成為研究熱
;ο現(xiàn)有預測蛋白質結構的方法主要有兩種比較建模法和從頭預測法。比較建模法是通過比較目標蛋白質與另外一種已知結構、其氨基酸序列與目標蛋白質聯(lián)系密切的蛋白質進行預測,比較建模法需要以結構已知、且其氨基酸序列與目標蛋白質相似的蛋白質為基礎,如果不存在與目標蛋白質氨基酸序列相似的蛋白質,則無法進行預測。而從頭預測是假設折疊后的蛋白質取能量最低的構象,通過計算得到蛋白質每一部分不同的卷曲狀態(tài)對應的結構,直到發(fā)現(xiàn)最低能量狀態(tài)。從頭預測蛋白結構有兩個關鍵問題一是找到一個能嚴格區(qū)分蛋白質的天然構象和非天然構象的能量函數(shù);二是選擇適當?shù)乃阉魉惴ǎ催x擇有效的優(yōu)化算法?,F(xiàn)有技術公開了使用遺傳算法、模擬退火算法等算法對蛋白質三維結構進行預測,但是,使用這些算法進行預測的精度較低。
發(fā)明內容
有鑒于此,本發(fā)明所要解決的技術問題在于提供一種蛋白質三維結構的預測方法及預測裝置,本發(fā)明提供的預測方法能夠實現(xiàn)對蛋白質三維結構的從頭預測,預測精度較
尚ο本發(fā)明提供了一種蛋白質三維結構的預測方法,包括a、選擇目標蟻群,初始化蟻群算法參數(shù);b、初始化蛋白質構象,建立蛋白質構象與片段庫的映射關系;C、以所述蛋白質構象上的任一位置為起點,所述目標蟻群在信息素的指引下對所述蛋白質構象進行優(yōu)化,利用能量函數(shù)對優(yōu)化后的蛋白質構象進行能量計算,選擇能量最小的蛋白質構象;d、對所述能量最小的蛋白質構象進行局部優(yōu)化,利用能量函數(shù)對局部優(yōu)化后的蛋白質構象進行能量計算,根據(jù)所述計算結果更新信息素矩陣,并將所述局部優(yōu)化后的蛋白質構象的能量與所述能量最小的蛋白質構象的能量進行比較,選擇能量小的蛋白質構象;
e、重復步驟c d,直至滿足終止條件,得到較優(yōu)蛋白質構象;f、對所述較優(yōu)蛋白質構象進行Loop重建,得到最優(yōu)蛋白質構象。優(yōu)選的,選擇ρ個目標蟻群,初始化蟻群算法參數(shù)時,使P個目標蟻群共享同一個信息素矩陣。優(yōu)選的,所述ρ個目標蟻群在信息素的指引下并行對所述蛋白質構象進行優(yōu)化, 利用η個能量函數(shù)對優(yōu)化后的蛋白質構象進行能量計算,所述1 < η < ρ。優(yōu)選的,還包括g、將所述最優(yōu)蛋白質構象進行交叉,得到交叉蛋白質構象,所述交叉蛋白質構象和所述最優(yōu)蛋白質構象共同構成蛋白質構象decoys集。優(yōu)選的,所述步驟c包括Cl、隨機選擇片段庫F;c2、隨機選擇片段位置i,從所述片段庫F中確定第i組片段集合Fi ;c3、目標蟻群在信息素的指引下從片段集合Fi中選擇片段。,并根據(jù)蛋白質構象與片段庫的映射關系,用&替換所述初始蛋白質構象中對應位置的片段;c4、重復步驟Cl c3,使所述初始蛋白質構象上的所有片段至少被替換一次,得到優(yōu)化的蛋白質構象;c5、重復步驟Cl c4,直至滿足預定次數(shù)w,得到w個優(yōu)化的蛋白質構象;c6、利用能量函數(shù)分別對所述w個優(yōu)化的蛋白質構象進行能量計算,選擇能量最小的蛋白質構象。優(yōu)選的,所述步驟d包括dl、隨機選擇片段庫F;d2、隨機選擇位置i,從所述片段庫F中確定第i組片段集合Fi ;(13、從&中選擇p-pt個啟發(fā)值η υ最高的片段{fj};d4、根據(jù)蛋白質構象與片段庫的映射關系,用{fj中的片段替換步驟c中得到的能量最小蛋白質構象中對應位置的片段,計算替換后的蛋白質構象與替換前的蛋白質構象的能量差Δ E,并判斷是否接受替換如果ΔΕ<0,則接受替換,如果ΔΕ>0,則根據(jù) Metropolis規(guī)則判斷是否接受替換;d5、重復步驟d4,直至{fj}中的p-pt個片段均至少經過一次替換;d6、重復步驟dl d5,直至滿足預定次數(shù)Q,得到局部優(yōu)化的蛋白質構象;d7、利用能量函數(shù)對所述局部優(yōu)化的蛋白質構象進行能量計算,根據(jù)所述計算結果更新所述信息素矩陣,并將所述局部優(yōu)化后的蛋白質構象的能量與所述能量最小的蛋白質構象的能量進行比較,選擇能量小的蛋白質構象。本發(fā)明還提供可一種蛋白質三維結構的預測裝置,包括蟻群選擇單元,用于選擇目標蟻群;初始化單元,用于初始化蟻群算法參數(shù)和蛋白質構象,并建立蛋白質構象和片段庫的映射關系;片段選擇單元,用于選擇蛋白質構象片段;蟻群控制單元,用于控制所述目標蟻群在信息素的指引下對所述初始蛋白質構象進行優(yōu)化;
第一能量計算單元,用于對優(yōu)化后的蛋白質構象進行能量計算,并選擇能量最小的蛋白質構象;蛋白質構象局部優(yōu)化單元,用于對所述能量最小的蛋白質構象進行局部優(yōu)化;第二能量計算單元,用于對所述局部優(yōu)化后的蛋白質構象進行能量計算;信息素矩陣更新單元,用于根據(jù)第二能量計算單元的計算結果更新信息素矩陣;比較單元,用于對所述局部優(yōu)化后的蛋白質構象的能量與所述能量最小的蛋白質構象的能量進行比較,并選擇能量小的蛋白質構象;循環(huán)控制單元,用于控制對蛋白質構象進行優(yōu)化和局部優(yōu)化操作的循環(huán);判斷單元,用于判斷循環(huán)是否滿足終止條件,如果否,則通知所述蟻群控制單元繼續(xù)進行控制所述目標蟻群在信息素的指引下對所述蛋白質構象進行優(yōu)化;如果是,則確定較優(yōu)蛋白質構象;Loop重建單元,用于對所述較優(yōu)蛋白質構象進行Loop重建,得到最優(yōu)蛋白質構象。優(yōu)選的,還包括交叉控制單元,用于將所述最優(yōu)蛋白質構象進行交叉。與現(xiàn)有技術相比,本發(fā)明采用并行蟻群算法對蛋白質三維結構進行從頭預測,主要采用并行蟻群算法對蛋白質構象進行優(yōu)化,并采用貪婪模擬退火相結合的方法對所述優(yōu)化后的蛋白質構象進行局部優(yōu)化,在局部優(yōu)化的過程中選擇迭代最好解更新并行蟻群共享的信息素矩陣,從而使隨機搜索成為在信息素指引下進行的搜索,提高了搜索的質量,從而提高了預測的精度。另外,本發(fā)明融合了不同的能量函數(shù)對優(yōu)化和局部優(yōu)化后的蛋白質構象進行評價,使預測得到的蛋白質結構能夠融合不同能量函數(shù)的評價標準,減少單一能量函數(shù)的偏好,從而更接近于蛋白質的實際結構。實驗表明,采用本發(fā)明提供的預測方法對第8屆關于蛋白質結構預測技術評估(the 8th Critical Assessment of Techniques for Protein Structure Prediction, CASP8)的全社會實驗所公布的13個從頭預測類案例進行預測,將得到的結果與CASP8比賽結果的實際排名進行對照,其中有2個案例的預測結果超過CASP8中最好的結果,7個位列前10名,取得了較好的預測效果。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。圖1為本發(fā)明實施例一提供的蛋白質三維結構的預測方法的流程圖;圖2為本發(fā)明實施例一利用蟻群算法對蛋白質構象進行優(yōu)化的流程圖;圖3為本發(fā)明實施例一對蛋白質構象進行局部優(yōu)化的流程圖;圖4為本發(fā)明實施例二提供的蛋白質三維結構的預測方法的流程圖;圖5為本發(fā)明實施例三提供的蛋白質三維結構的預測方法的流程圖;圖6為本發(fā)明實施例提供的蛋白質三維結構的預測裝置的結構示意圖。
具體實施例方式下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明公開了一種蛋白質三維結構的預測方法和預測裝置,通過共享信息素矩陣的并行蟻群算法對所述蛋白質構象進行優(yōu)化,然后采用貪婪模擬退火相結合的方法對所述優(yōu)化后的蛋白質構象進行局部優(yōu)化,并在局部優(yōu)化的過程中選擇迭代最好解更新并行蟻群共享的信息素矩陣,最后對局部優(yōu)化后的蛋白質構象進行Loop重建,得到最優(yōu)蛋白質構象。本發(fā)明在并行預測過程中,融合不同的能量函數(shù)對優(yōu)化、局部優(yōu)化和Loop重建后的蛋白質構象進行評價,從而使預測得到的蛋白質構象能夠融合不同能量函數(shù)的評價標準,減少單一能量函數(shù)的偏好,從而更接近于蛋白質的實際結構。下面結合實施例對本發(fā)明提供的蛋白質三維結構的預測方法和預測裝置進行詳細描述。實施例一參見圖1,圖1為本發(fā)明實施例一提供的蛋白質三維結構的預測方法的流程圖。步驟S101,選擇目標蟻群,并初始化蟻群算法參數(shù)。執(zhí)行步驟S101,選擇目標蟻群,即確定目標蟻群的數(shù)目,本實施例中確定蟻群數(shù)目為1,即進行基于單蟻群算法的預測。初始化蟻群算法參數(shù),所述蟻群算法參數(shù)包括概率參數(shù)^ ;在本發(fā)明中,概率參數(shù)Cil的取值范圍為W,1],本實施例中將其設置為 0.8 ;信息素τ,本實施例中將其初值設置為10 ;信息素揮發(fā)系數(shù)P,在本發(fā)明中,信息素揮發(fā)系數(shù)P的取值范圍為W,l),本實施例中將其設置為0. 001 ;用于確定循環(huán)次數(shù)的比例因子p-ac,本實施例中將其設置為0.6 ;用于確定循環(huán)次數(shù)的比例因子p-cc,本實施例中將其設置為6 ;螞蟻個數(shù)m,本發(fā)明實施例中將其設置為50。步驟S102、初始化蛋白質構象,并建立蛋白質構象與片段庫的映射關系。由于蛋白質構象具有豐富的自由度而且各自由度基于連續(xù)的變化空間,為便于處理,采用片段庫對搜索空間進行離散化。在本發(fā)明提供的預測方法中,是以任意一個初始的蛋白質構象為起點,通過在信息素指導下從片段庫中選擇片段來裝配蛋白質結構,從而得到蛋白質構象。因此,需要對蛋白質構象進行初始化,確定片段庫,并建立蛋白質構象與片段庫的映射關系。在本實施例中,將各殘基的Φ、少和ω分別賦值-150、150和180即可得到近似直鏈的蛋白質構象。對于片段庫來說,本發(fā)明同時采用3殘基片段庫和9殘基片段庫兩個片段庫,因此,需要對3殘基片段庫和9殘基片段庫分別建立映射關系,即使各片段庫和蛋白質構象具有對應的位置,以便實現(xiàn)后續(xù)優(yōu)化和局部優(yōu)化。
步驟S103、以所述蛋白質構象上的任一位置為起點,所述目標蟻群在信息素的指引下對所述蛋白質構象進行優(yōu)化,利用能量函數(shù)對優(yōu)化后的蛋白質構象進行能量計算,選擇能量最小的蛋白質構象。將蟻群和蛋白質構象初始化后,開始利用蟻群算法對蛋白質構象進行優(yōu)化,參見圖2,圖2為本發(fā)明實施例一利用蟻群算法對蛋白質構象進行優(yōu)化的流程圖。步驟S1031、隨機選擇片段庫F。本發(fā)明同時采用3殘基片段庫和9殘基片段庫兩個片段庫,因此,在進行優(yōu)化時, 需要在兩個片段庫之間進行選擇。本實施例中按照公式I進行選擇
權利要求
1.一種蛋白質三維結構的預測方法,包括a、選擇目標蟻群,初始化蟻群算法參數(shù);b、初始化蛋白質構象,建立蛋白質構象與片段庫的映射關系;c、以所述蛋白質構象上的任一位置為起點,所述目標蟻群在信息素的指引下對所述蛋白質構象進行優(yōu)化,利用能量函數(shù)對優(yōu)化后的蛋白質構象進行能量計算,選擇能量最小的蛋白質構象;d、對所述能量最小的蛋白質構象進行局部優(yōu)化,利用能量函數(shù)對局部優(yōu)化后的蛋白質構象進行能量計算,根據(jù)所述計算結果更新信息素矩陣,并將所述局部優(yōu)化后的蛋白質構象的能量與所述能量最小的蛋白質構象的能量進行比較,選擇能量小的蛋白質構象;e、重復步驟c d,直至滿足終止條件,得到較優(yōu)蛋白質構象;f、對所述較優(yōu)蛋白質構象進行Loop重建,得到最優(yōu)蛋白質構象。
2.根據(jù)權利要求1所述的預測方法,其特征在于,選擇P個目標蟻群,初始化蟻群算法參數(shù)時,使P個目標蟻群共享同一個信息素矩陣。
3.根據(jù)權利要求2所述的預測方法,其特征在于,所述ρ個目標蟻群在信息素的指引下并行對所述蛋白質構象進行優(yōu)化,利用η個能量函數(shù)對優(yōu)化后的蛋白質構象進行能量計算,所述1< η彡ρ。
4.根據(jù)權利要求3所述的預測方法,其特征在于,還包括g、將所述最優(yōu)蛋白質構象進行交叉,得到交叉蛋白質構象,所述交叉蛋白質構象和所述最優(yōu)蛋白質構象共同構成蛋白質構象decoys集。
5.根據(jù)權利要求1 4任意一項所述的預測方法,其特征在于,所述步驟c包括 Cl、隨機選擇片段庫F;c2、隨機選擇片段位置i,從所述片段庫F中確定第i組片段集合Fi ; c3、目標蟻群在信息素的指引下從片段集合Fi中選擇片段。,并根據(jù)蛋白質構象與片段庫的映射關系,用A替換所述初始蛋白質構象中對應位置的片段;c4、重復步驟cl c3,使所述初始蛋白質構象上的所有片段至少被替換一次,得到優(yōu)化的蛋白質構象;c5、重復步驟cl c4,直至滿足預定次數(shù)w,得到w個優(yōu)化的蛋白質構象; c6、利用能量函數(shù)分別對所述w個優(yōu)化的蛋白質構象進行能量計算,選擇能量最小的蛋白質構象。
6.根據(jù)權利要求1 4任意一項所述的預測方法,其特征在于,所述步驟d包括 dl、選擇片段庫F;d2、隨機選擇位置i,從所述片段庫F中確定第i組片段集合Fi ; (13、從Fi中選擇p-pt個啟發(fā)值最高的片段{fj};d4、根據(jù)蛋白質構象與片段庫的映射關系,用{fj中的片段替換步驟c中得到的能量最小蛋白質構象中對應位置的片段,計算替換后的蛋白質構象與替換前的蛋白質構象的能量差ΔΕ,并判斷是否接受替換如果ΔΕ<0,則接受替換,如果ΔΕ>0,則根據(jù) Metropolis規(guī)則判斷是否接受替換;d5、重復步驟d4,直至{。}中的p-pt個片段均至少經過一次替換; d6、重復步驟dl d5,直至滿足預定次數(shù)Q,得到局部優(yōu)化的蛋白質構象;d7、利用能量函數(shù)對所述局部優(yōu)化的蛋白質構象進行能量計算,根據(jù)所述計算結果更新所述信息素矩陣,并將所述局部優(yōu)化后的蛋白質構象的能量與所述能量最小的蛋白質構象的能量進行比較,選擇能量小的蛋白質構象。
7.一種蛋白質三維結構的預測裝置,其特征在于,包括 蟻群選擇單元,用于選擇目標蟻群;初始化單元,用于初始化蟻群算法參數(shù)和蛋白質構象,并建立蛋白質構象和片段庫的映射關系;片段選擇單元,用于選擇蛋白質構象片段;蟻群控制單元,用于控制所述目標蟻群在信息素的指引下對所述初始蛋白質構象進行優(yōu)化;第一能量計算單元,用于對優(yōu)化后的蛋白質構象進行能量計算,并選擇能量最小的蛋白質構象;蛋白質構象局部優(yōu)化單元,用于對所述能量最小的蛋白質構象進行局部優(yōu)化; 第二能量計算單元,用于對所述局部優(yōu)化后的蛋白質構象進行能量計算; 信息素矩陣更新單元,用于根據(jù)第二能量計算單元的計算結果更新信息素矩陣; 比較單元,用于對所述局部優(yōu)化后的蛋白質構象的能量與所述能量最小的蛋白質構象的能量進行比較,并選擇能量小的蛋白質構象;循環(huán)控制單元,用于控制對蛋白質構象進行優(yōu)化和局部優(yōu)化操作的循環(huán); 判斷單元,用于判斷循環(huán)是否滿足終止條件,如果否,則通知所述蟻群控制單元繼續(xù)進行控制所述目標蟻群在信息素的指引下對所述蛋白質構象進行優(yōu)化;如果是,則確定較優(yōu)蛋白質構象;Loop重建單元,用于對所述較優(yōu)蛋白質構象進行Loop重建,得到最優(yōu)蛋白質構象。
8.根據(jù)權利要求7所述的預測裝置,其特征在于,還包括 交叉控制單元,用于將所述最優(yōu)蛋白質構象進行交叉。
全文摘要
本發(fā)明提供了一種蛋白質三維結構的預測方法,包括a、選擇目標蟻群,初始化蟻群算法參數(shù);b、初始化蛋白質構象,建立蛋白質構象與片段庫的映射關系;c、以蛋白質構象上的任一位置為起點,目標蟻群在信息素的指引下進行優(yōu)化,對優(yōu)化后的蛋白質構象進行能量計算,選擇能量最小的蛋白質構象;d、對能量最小的蛋白質構象進行局部優(yōu)化,并進行能量計算,根據(jù)計算結果更新信息素矩陣,并將局部優(yōu)化后的蛋白質構象的能量與能量最小的蛋白質構象的能量進行比較,選擇能量小的蛋白質構象;e、重復步驟c~d,得到較優(yōu)蛋白質構象;f、對較優(yōu)蛋白質構象進行Loop重建,得到最優(yōu)蛋白質構象。本發(fā)明還提供了一種蛋白質三維結構的預測裝置。
文檔編號G06F19/14GK102402649SQ20101028770
公開日2012年4月4日 申請日期2010年9月17日 優(yōu)先權日2010年9月17日
發(fā)明者呂強 申請人:蘇州大學