本發(fā)明涉及計算機,尤其涉及一種虛擬化資源分配方法及裝置。
背景技術(shù):
1、虛擬化是一種資源管理技術(shù),將計算機中各種物理資源抽象化后重新組合成多個配置環(huán)境的“新計算機”,實現(xiàn)了物理設(shè)備的切割。gpu虛擬化技術(shù),即通過切割物理gpu,使得計算機中每個gpu都被分解成一個或多個“子gpu”,在滿足不同用戶不同大小的gpu資源需求的同時,大幅度提高了gpu資源利用效率,在智算中心面向云計算、邊緣計算、云游戲等領(lǐng)域中廣泛運用。
2、相關(guān)技術(shù)中的gpu虛擬化方案包括:gpu直通、gpu?sriov、gpu半虛擬化及gpu全虛擬化等,對應(yīng)的實際應(yīng)用包含云桌面、云游戲、工程應(yīng)用程序等。不同的終端應(yīng)用對gpu資源的需求相差較大,有的僅需要較小的gpu資源(幾十分之一單物理gpu資源),而有的則需要較大的gpu資源(大于或等于一整個物理gpu資源),常規(guī)分配方式會導(dǎo)致服務(wù)器中剩余的虛擬化資源過小導(dǎo)致無法再匹配任何用戶的需求,被擱置永遠無法得到利用,造成資源浪費。
3、因此,如何合理分配gpu資源,減少資源浪費成為亟需解決的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種虛擬化資源分配方法及裝置,用以解決現(xiàn)有技術(shù)中虛擬化資源分配會導(dǎo)致資源浪費的缺陷,實現(xiàn)合理分配gpu資源,減少資源浪費。
2、本發(fā)明提供一種虛擬化資源分配方法,包括:
3、確定待分配的虛擬化資源需求,所述虛擬化資源需求包括個gpu虛擬化資源;
4、基于所述虛擬化資源需求,多臺服務(wù)器中各臺服務(wù)器的gpu虛擬化資源使用量,和單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),確定所述多臺服務(wù)器分別對應(yīng)的完全使用概率,其中,所述服務(wù)器對應(yīng)的完全使用概率用于表征:所述服務(wù)器分配所述個gpu虛擬化資源后,未來會被完全使用的概率;
5、基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個gpu虛擬化資源。
6、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)基于以下步驟生成:
7、生成樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括多臺服務(wù)器中各臺服務(wù)器上的用戶數(shù)量和各臺服務(wù)器中g(shù)pu虛擬化資源使用量,其中,各臺服務(wù)器中g(shù)pu虛擬化資源被最大程度使用;
8、基于所述樣本數(shù)據(jù),確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)。
9、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述生成樣本數(shù)據(jù),包括:
10、采集多臺服務(wù)器的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括各臺服務(wù)器上的用戶數(shù)量和各臺服務(wù)器中g(shù)pu虛擬化資源使用量;
11、調(diào)整所述各臺服務(wù)器中g(shù)pu虛擬化資源使用量,以使所述歷史數(shù)據(jù)中各臺服務(wù)器中g(shù)pu虛擬化資源被最大程度使用;
12、基于調(diào)整后的歷史數(shù)據(jù),生成樣本數(shù)據(jù),其中,為所述多臺服務(wù)器的數(shù)量。
13、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述基于所述樣本數(shù)據(jù),確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),包括:
14、基于所述樣本數(shù)據(jù),確定個gpu虛擬化資源對應(yīng)的用戶數(shù)量服從參數(shù)為的泊松分布,其中,所述個gpu虛擬化資源為單臺服務(wù)器上已被個用戶使用的gpu虛擬化資源,,為所述多臺服務(wù)器的數(shù)量,;
15、基于所述個gpu虛擬化資源對應(yīng)的用戶數(shù)量服從參數(shù)為的泊松分布,確定個用戶的gpu虛擬化資源使用量服從伽瑪分布;
16、基于所述個用戶的gpu虛擬化資源使用量服從伽瑪分布,確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)為:
17、;
18、其中,。
19、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述方法還包括:
20、周期性更新所述樣本數(shù)據(jù),并基于所述更新后的樣本數(shù)據(jù),更新所述單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)。
21、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個gpu虛擬化資源,包括:
22、從多臺服務(wù)器中確定至少一項候選服務(wù)器,所述候選服務(wù)器對應(yīng)的完全使用概率大于概率閾值;
23、從所述至少一項候選服務(wù)器中確定剩余gpu虛擬化資源最少的服務(wù)器,作為所述目標(biāo)服務(wù)器。
24、根據(jù)本發(fā)明提供的一種虛擬化資源分配方法,所述概率閾值基于預(yù)先設(shè)置確定;或者
25、所述概率閾值基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率確定。
26、本發(fā)明還提供一種虛擬化資源分配裝置,包括:
27、第一確定模塊,用于確定待分配的虛擬化資源需求,所述虛擬化資源需求包括個gpu虛擬化資源;
28、第二確定模塊,用于基于所述虛擬化資源需求,和單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),確定多臺服務(wù)器分別對應(yīng)的完全使用概率,其中,所述服務(wù)器對應(yīng)的完全使用概率用于表征:所述服務(wù)器分配所述個gpu虛擬化資源后,未來會被完全使用的概率;其中,%表示模運算,用于取余數(shù),為每臺服務(wù)器所擁有的最大gpu個數(shù);
29、第三確定模塊,用于基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個gpu虛擬化資源。
30、本發(fā)明還提供一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如上述任一種所述虛擬化資源分配方法。
31、本發(fā)明還提供一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上述任一種所述虛擬化資源分配方法。
32、本發(fā)明還提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上述任一種所述虛擬化資源分配方法。
33、本發(fā)明提供的虛擬化資源分配方法及裝置,通過引入單臺服務(wù)器的gpu虛擬化資源使用量的概率密度,計算出各臺服務(wù)器分別對應(yīng)的完全使用概率,確定各臺服務(wù)器若在分配所述個gpu虛擬化資源后,未來會被完全使用的概率,并基于該完全使用概率,確定由目標(biāo)服務(wù)器分配gpu虛擬化資源,可以提高各臺服務(wù)器的gpu虛擬資源被充分利用的概率,合理分配gpu資源,減少資源浪費。
1.一種虛擬化資源分配方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的虛擬化資源分配方法,其特征在于,所述單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù)基于以下步驟生成:
3.根據(jù)權(quán)利要求2所述的虛擬化資源分配方法,其特征在于,所述生成樣本數(shù)據(jù),包括:
4.根據(jù)權(quán)利要求2所述的虛擬化資源分配方法,其特征在于,所述基于所述樣本數(shù)據(jù),確定單臺服務(wù)器的gpu虛擬化資源使用量的概率密度函數(shù),包括:
5.根據(jù)權(quán)利要求2-4任一項所述的虛擬化資源分配方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求1-4任一項所述的虛擬化資源分配方法,其特征在于,所述基于所述多臺服務(wù)器分別對應(yīng)的完全使用概率,確定由目標(biāo)服務(wù)器分配所述個gpu虛擬化資源,包括:
7.根據(jù)權(quán)利要求6所述的虛擬化資源分配方法,其特征在于,所述概率閾值基于預(yù)先設(shè)置確定;或者
8.一種虛擬化資源分配裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1至7任一項所述虛擬化資源分配方法。
10.一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7任一項所述虛擬化資源分配方法。