本申請涉及生物信息學(xué),尤其涉及一種計算結(jié)合自由能的技術(shù)。
背景技術(shù):
1、準(zhǔn)確計算結(jié)合自由能(binding?free?energy)是分子模擬領(lǐng)域的一個重要問題。初態(tài)(反應(yīng)物)與終態(tài)(產(chǎn)物)之間的自由能變化決定著生物過程進(jìn)行的程度。經(jīng)典的計算結(jié)合自由能的方法包括自由能微擾(fep,free?energy?perturbation)與熱力學(xué)積分(ti,thermodynamic?integration)。這兩種方法是計算結(jié)果比較準(zhǔn)確的成熟方法,但需要采集大量的數(shù)據(jù),實際應(yīng)用會有計算資源和體系大小的限制。分子力學(xué)泊松玻爾茲曼表面積(mm-pbsa,molecular?mechanics-poisson?bolzmann?surface?area)是通過對分子動力學(xué)模擬的軌跡進(jìn)行后處理以估計結(jié)合自由能的方法。盡管mm-pbsa方法的準(zhǔn)確度不如fep和ti,但這種方法的計算量小,在分子識別,區(qū)分結(jié)合的強(qiáng)弱方面是一種有效的方法,并已經(jīng)成功地用于許多結(jié)合自由能的計算。目前,利用mm-pbsa方法計算結(jié)合自由能一般是人工選取一些特殊幀進(jìn)行計算,或者對全部或按設(shè)定間隔抽取的部分幀進(jìn)行計算。前者受人為影響且選取數(shù)量有限,計算準(zhǔn)確度不高;而后者計算量大、對計算資源有要求、計算速度較慢。
技術(shù)實現(xiàn)思路
1、本申請的一個目的是提供一種計算結(jié)合自由能的方法、設(shè)備、介質(zhì)及程序產(chǎn)品。
2、根據(jù)本申請的一個方面,提供了一種計算結(jié)合自由能的方法,該方法包括:
3、基于分子動力學(xué)模擬的軌跡文件,確定所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息,所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息包括距離分布信息;
4、基于所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息,確定一個或者多個數(shù)據(jù)聚類;
5、基于所述一個或者多個數(shù)據(jù)聚類,確定相應(yīng)的結(jié)合自由能。
6、根據(jù)本申請的一個方面,提供了一種計算結(jié)合自由能的計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序以實現(xiàn)如上所述任一方法的步驟。
7、根據(jù)本申請的一個方面,提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,該計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如上所述任一方法的步驟。
8、根據(jù)本申請的一個方面,提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,該計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如上所述任一方法的步驟。
9、根據(jù)本申請的一個方面,提供了一種計算結(jié)合自由能的設(shè)備,該設(shè)備包括:
10、一一模塊,用于基于分子動力學(xué)模擬的軌跡文件,確定所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息,所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息包括距離分布信息;
11、一二模塊,用于基于所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息,確定一個或者多個數(shù)據(jù)聚類;
12、一三模塊,用于基于所述一個或者多個數(shù)據(jù)聚類,確定相應(yīng)的結(jié)合自由能。
13、與現(xiàn)有技術(shù)相比,本申請基于分子動力學(xué)模擬的軌跡文件,確定所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息,所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息包括距離分布信息;基于所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息,確定一個或者多個數(shù)據(jù)聚類;基于所述一個或者多個數(shù)據(jù)聚類,確定相應(yīng)的結(jié)合自由能。通過對軌跡文件每一幀進(jìn)行聚類,基于聚類結(jié)果進(jìn)行結(jié)合自由能的計算,在保障計算準(zhǔn)確性的同時節(jié)省大量計算資源、提升計算效率。
1.一種計算結(jié)合自由能的方法,其中,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述距離分布信息包括目標(biāo)原子對距離信息;
3.根據(jù)權(quán)利要求2所述的方法,其中,所述預(yù)設(shè)篩選條件包括以下至少任一項:
4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其中,所述基于所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息,確定一個或者多個數(shù)據(jù)聚類包括:
5.根據(jù)權(quán)利要求4所述的方法,其中,所述對所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息進(jìn)行降維處理,獲取降維后的數(shù)據(jù)信息包括:
6.根據(jù)權(quán)利要求5所述的方法,其中,所述基于原始高維空間中的條件概率分布與低維空間中的條件概率分布,迭代優(yōu)化所述初始化信息,以獲得相應(yīng)的降維后的數(shù)據(jù)信息包括:
7.根據(jù)權(quán)利要求5或6所述的方法,其中,所述確定所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息在低維空間中的初始化信息包括:
8.根據(jù)權(quán)利要求1至7中任一項所述的方法,其中,所述基于所述一個或者多個數(shù)據(jù)聚類,確定相應(yīng)的結(jié)合自由能包括:
9.根據(jù)權(quán)利要求8所述的方法,其中,所述目標(biāo)幀信息包括每個數(shù)據(jù)聚類對應(yīng)的目標(biāo)幀,所述目標(biāo)幀在所述數(shù)據(jù)聚類中距離聚類中心最近。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述目標(biāo)幀信息還包括所述目標(biāo)幀對應(yīng)的權(quán)重信息;
11.根據(jù)權(quán)利要求1至10中任一項所述的方法,其中,所述軌跡文件中每一幀對應(yīng)的數(shù)據(jù)信息還包括蛋白質(zhì)結(jié)構(gòu)的均方根偏差與溶劑可及表面積。
12.一種計算結(jié)合自由能的計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序以實現(xiàn)如權(quán)利要求1至11中任一項所述方法的步驟。
13.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序/指令,其特征在于,該計算機(jī)程序/指令被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至11中任一項所述方法的步驟。
14.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,該計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至11中任一項所述方法的步驟。