本發(fā)明涉及云計(jì)算領(lǐng)域。
背景技術(shù):
云計(jì)算是繼分布式計(jì)算、并行計(jì)算、網(wǎng)格計(jì)算之后一種新的計(jì)算模式,已經(jīng)成為學(xué)術(shù)界和工業(yè)界關(guān)注。目前云計(jì)算環(huán)境下任務(wù)調(diào)度的目標(biāo)是將用戶需求合理的部署,提高運(yùn)營商的經(jīng)濟(jì)效益。具體體現(xiàn)在以下幾個目標(biāo):最優(yōu)時間跨度、負(fù)載均衡、服務(wù)質(zhì)量、經(jīng)濟(jì)原則。
現(xiàn)有的調(diào)度策略研究中,經(jīng)典的調(diào)度算法在特定的調(diào)度目標(biāo)上有較好的性能。負(fù)載均衡方面的經(jīng)典調(diào)度算法有隨機(jī)負(fù)載均衡算法(Opportunistic Load Balancing),該算法很好地解決網(wǎng)格環(huán)境下由于負(fù)載不均衡帶來的調(diào)度問題。最小執(zhí)行時間算法(Minimum Execution Time)、貪心算法、最小完成時間算法(Minimum Completion Time)、Min-Min算法和Max-Min算法等都是以實(shí)現(xiàn)任務(wù)調(diào)度的最優(yōu)時間跨度為目標(biāo)的調(diào)度算法。
此外,云計(jì)算的經(jīng)濟(jì)原則主要在于減少能耗。有學(xué)者提出了減少能耗的動態(tài)調(diào)度算法,Chase等人提出了一種通過空閑服務(wù)器轉(zhuǎn)成節(jié)能模式來減少能耗,該算法適用于數(shù)據(jù)中心層次上的節(jié)能調(diào)度。P.B.Si提出了一種針對移動云計(jì)算資源調(diào)度算法,該算法適用于密集型任務(wù)調(diào)度,很大程度上減少了能耗。J.W.Lin提出了一種多維度QoS支持策略,實(shí)現(xiàn)了集成QoS服務(wù)。N.Kumar基于QoS實(shí)現(xiàn)了云計(jì)算環(huán)境下資源分配和合理調(diào)度,很好地解決了云計(jì)算環(huán)境下資源的占用問題,提高了云計(jì)算的服務(wù)質(zhì)量。由于云調(diào)度的最優(yōu)策略問題是一個NP問題,也是一個重要問題,智能算法也被很多學(xué)者用來求解一個近似的最優(yōu)解?,F(xiàn)有的調(diào)度策略在最優(yōu)時間跨度(makespan)、負(fù)載均衡、服務(wù)質(zhì)量、經(jīng)濟(jì)原則四個方面已經(jīng)有了較為深入的研究,為云計(jì)算的發(fā)展做出了重要的貢獻(xiàn)。
由于云計(jì)算中各個節(jié)點(diǎn)處理能力不同,每個任務(wù)占用資源也不同,針對任務(wù)所占資源并且臨時動態(tài)創(chuàng)建與之匹配的虛擬機(jī)是困難的,需要耗費(fèi)更多的時間。但是,如果提前創(chuàng)建虛擬機(jī),調(diào)度將面臨以下兩個問題:1)當(dāng)一個較大任務(wù)被分配到處理能力較弱的虛擬機(jī)節(jié)點(diǎn)上時,節(jié)點(diǎn)處理時間較長甚至無法完成,導(dǎo)致整個任務(wù)序列中斷;2)當(dāng)一個較小的任務(wù)被分配到處理能力較強(qiáng)的虛擬機(jī)節(jié)點(diǎn)上時,由于在處理小任務(wù)時大任務(wù)處于等待狀態(tài),使得整個云系統(tǒng)吞吐率降低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是實(shí)現(xiàn)一種能夠有效提高調(diào)度性能,實(shí)現(xiàn)云資源合理利用的虛擬機(jī)調(diào)度方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:應(yīng)用于云計(jì)算環(huán)境的虛擬機(jī)調(diào)度方法:
1)虛擬機(jī)建模:預(yù)先創(chuàng)建多個虛擬機(jī);
2)新任務(wù)調(diào)度:當(dāng)云任務(wù)需要執(zhí)行調(diào)度時,根據(jù)任務(wù)的大小在預(yù)先創(chuàng)建的虛擬機(jī)中尋找處理能力與任務(wù)匹配的虛擬機(jī);
3)新任務(wù)處理:將任務(wù)由尋找到的虛擬機(jī)處理。
所述虛擬機(jī)建模步驟中,根據(jù)任務(wù)數(shù)據(jù)的CPU資源ticpu、內(nèi)存資源timem、網(wǎng)絡(luò)帶寬tinet、硬盤存儲資源tistor、任務(wù)截止時間tif,通過貝葉斯分類器將任務(wù)劃分成若干個等級,針對每個等級任務(wù)分別創(chuàng)建處理能力與該等級任務(wù)相匹配的虛擬機(jī)。
所述新任務(wù)調(diào)度步驟包括:
a)獲取任務(wù)ti的信息,包括CPU資源ticpu、內(nèi)存資源timem、網(wǎng)絡(luò)帶寬tinet、硬盤存儲資源tistor、任務(wù)截止時間tif,再通過貝葉斯分類器獲取任務(wù)等級,根據(jù)任務(wù)等級查詢與當(dāng)前任務(wù)ti匹配的虛擬機(jī)狀態(tài)信息;
b)如果存在與當(dāng)前任務(wù)匹配的虛擬機(jī)類型,將任務(wù)ti安排至就緒隊(duì)列,如果不存在與當(dāng)前任務(wù)匹配的虛擬機(jī)類型,將任務(wù)ti安排至等待隊(duì)列;
c)針對就緒隊(duì)列任務(wù),搜索該類型虛擬機(jī)中是否有空閑虛擬機(jī),若存在空閑虛擬機(jī),直接部署任務(wù)ti在該空閑虛擬機(jī)上,若不存在空閑虛擬機(jī),將任務(wù)狀態(tài)切換成等待狀態(tài),掛載至等待隊(duì)列隊(duì)尾;
d)當(dāng)?shù)却?duì)列非空時,新創(chuàng)建能夠與等待隊(duì)列中任務(wù)相匹配的虛擬機(jī),當(dāng)虛擬機(jī)創(chuàng)建完成后,將任務(wù)分配至所創(chuàng)建的虛擬機(jī)。
所述新任務(wù)調(diào)度步驟中,若存在任務(wù)因任務(wù)匹配超出任務(wù)執(zhí)行截止期,則撤銷任務(wù)。
所述的貝葉斯分類器的分類方法:
設(shè)樣本空間為U,訓(xùn)練樣本Ti類的先驗(yàn)概率為P(Ti);
其中i取值為整數(shù),|U|是樣本總數(shù);
當(dāng)產(chǎn)生一個新樣本ω,且屬于Ti類的后驗(yàn)概率;
P(Ti|ω)=P(ω|Ti)·P(Ti);
其中P(ω|Ti)表示新樣本屬于Ti類的條件概率;
設(shè)當(dāng)前有某個虛擬機(jī)節(jié)點(diǎn)類型Vj,對于任務(wù)ti假設(shè)任務(wù)間各個特征屬性相互獨(dú)立,可得:
貝葉斯分類器對任務(wù)的決策函數(shù)為:
arg max{P(tiVj)P(Vj)},其中(i=1,2,3,……,n;j=1,2,3,……,m);
當(dāng)ti可以在任務(wù)的截止期內(nèi)完成,且ti任務(wù)屬于Vj的概率p=arg max{P(ti|Vj)P(Vj)},稱ti是Vj類型的任務(wù),在調(diào)度時就將其部署在Vj類型的虛擬機(jī)對列中。
基于虛擬機(jī)調(diào)度方法的云計(jì)算系統(tǒng),包括用戶端、調(diào)度器和主機(jī),所述調(diào)度器將用戶端任務(wù)輸送至主機(jī)內(nèi)的虛擬機(jī)處理;
所述調(diào)度器包括:
實(shí)現(xiàn)任務(wù)調(diào)度、任務(wù)的狀態(tài)轉(zhuǎn)換的調(diào)度器;
計(jì)算出提交的任務(wù)類型的貝葉斯分類器;
進(jìn)行任務(wù)與虛擬機(jī)的匹配的虛擬機(jī)匹配器;
用于虛擬機(jī)創(chuàng)建、虛擬機(jī)的狀態(tài)信息收集、任務(wù)信息收集的虛擬機(jī)控制器。
所述調(diào)度器還包括存放匹配后立馬被執(zhí)行任務(wù)的就緒序列,以及存放匹配后需要等待的任務(wù)的等待序列。
本發(fā)明實(shí)現(xiàn)虛擬機(jī)與任務(wù)之間的匹配,實(shí)現(xiàn)云資源的合理利用,提高云計(jì)算的服務(wù)質(zhì)量。
附圖說明
下面對本發(fā)明說明書中每幅附圖表達(dá)的內(nèi)容作簡要說明:
圖1為基于虛擬機(jī)調(diào)度方法的云計(jì)算系統(tǒng)框圖;
圖2為基于兩階段策略的任務(wù)ti的調(diào)度過程;
圖3為調(diào)度所需的最優(yōu)跨度時間圖示;
圖4為調(diào)度所需的任務(wù)平均等待時間圖示;
圖5為調(diào)度任務(wù)失效率圖示;
圖6為虛擬機(jī)使用率圖示。
具體實(shí)施方式
本發(fā)明針對云計(jì)算環(huán)境下任務(wù)分配不合理而降低虛擬機(jī)調(diào)度性能的問題,提出一種基于任務(wù)類型分析的兩階段策略的虛擬機(jī)調(diào)度方法。包括三個步驟:1)虛擬機(jī)建模:預(yù)先創(chuàng)建多個虛擬機(jī),該方法基于歷史任務(wù)調(diào)度數(shù)據(jù),采用貝葉斯分類器對任務(wù)進(jìn)行分類,并根據(jù)分類結(jié)果,預(yù)先創(chuàng)建一定數(shù)量的不同級別處理能力的虛擬機(jī)節(jié)點(diǎn),以節(jié)省任務(wù)調(diào)度時臨時創(chuàng)建虛擬機(jī)的時間耗費(fèi);2)新任務(wù)調(diào)度:當(dāng)云任務(wù)需要執(zhí)行調(diào)度時,根據(jù)任務(wù)的大小在預(yù)先創(chuàng)建的虛擬機(jī)中尋找合適的虛擬機(jī)節(jié)點(diǎn),并將任務(wù)與該虛擬機(jī)節(jié)點(diǎn)進(jìn)行匹配;3)新任務(wù)處理:將任務(wù)由尋找到的虛擬機(jī)處理。通過上述方法可以實(shí)現(xiàn)云任務(wù)的合理調(diào)度和減少調(diào)度時間。
針對上述三個步驟具體分析如下:
假設(shè)云系統(tǒng)中有m個不同類型的虛擬機(jī),有n個用戶提供的任務(wù)。使用v表示虛擬機(jī)集合v={v1,v2,v3,……,vm}。由于每個虛擬機(jī)的計(jì)算能力是不同的,虛擬主機(jī)在不同維度上的資源容量可以用資源向量vj=<rjcpu,rjmem,rjnet,rjstor>表示,其中,j∈[1,m],rjcpu、rjmem、rjnet與rjstor分別表示第j個虛擬機(jī)的cpu資源、內(nèi)存資源、網(wǎng)絡(luò)帶寬與硬盤存儲資源。
用T表示n個用戶提供的任務(wù)集合,T={t1,t2,t3……,tn},其中,任務(wù)ti進(jìn)一步描述為一個向量ti=<tiid,tidm,tif>,其中,i∈[1,n]。符號解釋如下。
(1)tiid是任務(wù)ti的標(biāo)識符,表示由第i個用戶提交的唯一id的任務(wù)。
(2)tidm=<ticpu,timem,tinet,tistor>表示任務(wù)ti對虛擬機(jī)資源的需求。如果一個虛擬機(jī)滿足不了任務(wù)的任意一個維度的需求,那么任務(wù)在這個虛擬機(jī)上執(zhí)行需要中斷,并可能導(dǎo)致任務(wù)最終無法執(zhí)行結(jié)束。
(3)tif表示用戶提交的任務(wù)最后完成的截止時間,超過這個時間完成,任務(wù)就失效。
云計(jì)算中不同級別的任務(wù)盡可能運(yùn)行在與之級別相匹配的虛擬機(jī)節(jié)點(diǎn)上運(yùn)行,能實(shí)現(xiàn)資源的合理應(yīng)用,在任務(wù)調(diào)度階段,根據(jù)任務(wù)的五個維度(CPU資源ticpu、內(nèi)存資源timem、網(wǎng)絡(luò)帶寬tinet、硬盤存儲資源tistor、任務(wù)截止時間tif),通過貝葉斯分類器將任務(wù)劃分成若干個等級,再根據(jù)計(jì)算任務(wù)的級別來創(chuàng)建虛擬機(jī)。最后將任務(wù)部署與之相匹配的虛擬機(jī)上,以實(shí)現(xiàn)任務(wù)和資源的合理分配,提高整個云計(jì)算系統(tǒng)的性能。本發(fā)明所研究的云計(jì)算中心可以描述為由虛擬機(jī)集群組成的有限集V={H1,H2,H3,……,Hk}其中主機(jī)H1={VM1,VM2,……,VMm},其中VMm表示第m個虛擬機(jī),物理主機(jī)通過虛擬化的方式產(chǎn)生虛擬云平臺。
新任務(wù)調(diào)度步驟中,當(dāng)新的任務(wù)集到達(dá)時,如圖2所示,執(zhí)行以下步驟實(shí)現(xiàn)調(diào)度:
1.任務(wù)到達(dá)貝葉斯分類器時,貝葉斯分類器將根據(jù)任務(wù)的相關(guān)信息計(jì)算出執(zhí)行任務(wù)所需要的虛擬機(jī)級別,并將各任務(wù)的tiid,tidm,tif提交給虛擬機(jī)控制器。虛擬機(jī)根據(jù)貝葉斯分類器提供的信息,去查詢與當(dāng)前任務(wù)匹配的虛擬機(jī)狀態(tài)信息。
2.如果存在與當(dāng)前任務(wù)匹配的虛擬機(jī)類型,將任務(wù)ti安排至就緒隊(duì)列;
如果不存在與當(dāng)前任務(wù)匹配的虛擬機(jī)類型,將任務(wù)ti安排至等待隊(duì)列。
3.當(dāng)調(diào)度器將就緒隊(duì)列中任務(wù)提交給虛擬機(jī)匹配時,虛擬機(jī)匹配搜索該類型中是否有空閑虛擬機(jī);
若存在空閑虛擬機(jī),直接部署任務(wù)ti在該空閑虛擬機(jī)上。
若不存在空閑虛擬機(jī):將任務(wù)狀態(tài)切換成等待狀態(tài),掛載至等待隊(duì)列隊(duì)尾。
4.當(dāng)?shù)却?duì)列非空時,由虛擬機(jī)控制器創(chuàng)建合適的虛擬機(jī),當(dāng)虛擬機(jī)創(chuàng)建完成后。調(diào)度器將當(dāng)前任務(wù)提交給虛擬機(jī)匹配進(jìn)行調(diào)度部署。
5.更新云計(jì)算中心的信息,包括云計(jì)算中心的空閑虛擬機(jī)信息、任務(wù)剩余時間等。若存在任務(wù)因任務(wù)匹配超出任務(wù)執(zhí)行截止期。撤銷任務(wù),并將其tiid放入調(diào)度失敗隊(duì)列。
6.若調(diào)度成功,返回調(diào)度成功標(biāo)識;否則返回調(diào)度失敗隊(duì)列;
上述調(diào)度方法,使得云任務(wù)得到有效且合理的分配,提高云調(diào)度性能和云資源利用率。
本發(fā)明利用貝葉斯分類器進(jìn)行分類,利用云計(jì)算中心任務(wù)規(guī)模的歷史數(shù)據(jù)創(chuàng)建一定數(shù)量、不同級別處理能力的虛擬機(jī)節(jié)點(diǎn),貝葉斯分類器是在貝葉斯定理的基礎(chǔ)上,結(jié)合先驗(yàn)概率與條件概率,該分類匹配方法,簡單、有效和實(shí)用,在云計(jì)算環(huán)境下選擇基于貝葉斯分類器的任務(wù)分類方法可以很大程度上節(jié)約開銷。此外,該方法可以和MapReduce并行處理機(jī)制組合,迅速有效地獲得匹配結(jié)果,減少云計(jì)算中心的負(fù)載。
利用貝葉斯分類器的分類算法如下:
設(shè)樣本空間為U,訓(xùn)練樣本Ti類的先驗(yàn)概率為P(Ti)如式(1)所示。
式(1)中,i取值為整數(shù),|U|是樣本總數(shù)。當(dāng)產(chǎn)生一個新樣本ω,根據(jù)貝葉斯定理,可知屬于Ti類的后驗(yàn)概率,如式(2)所示。
P(Ti|ω)=P(ω|Ti)·P(Ti) (2)
式(2)中,P(ω|Ti)表示新樣本屬于Ti類的條件概率。
設(shè)當(dāng)前有某個虛擬機(jī)節(jié)點(diǎn)類型Vj,(由上可知Vj=<rjcpu,rjmem,rjnet,rjstor>),對于任務(wù)ti,(由上可知ti=<ticpu,timem,tinet,tistor>),假設(shè)任務(wù)間各個特征屬性相互獨(dú)立,可得:
根據(jù)貝葉斯分類方法,分類器對任務(wù)的決策函數(shù)為:
arg max{P(ti|Vj)P(Vj)},其中(i=1,2,3,……,n;j=1,2,3,……,m)
當(dāng)ti可以在任務(wù)的截止期內(nèi)完成,且ti任務(wù)屬于Vj的概率p=arg max{P(ti|Vj)P(Vj)},稱ti是Vj類型的任務(wù),在調(diào)度時就將其部署在Vj類型的虛擬機(jī)對列中。
當(dāng)ti在Vj上順利執(zhí)行,將任務(wù)ti添加到Vj里,從而擴(kuò)大樣本容量,提高先驗(yàn)概率的準(zhǔn)確性。
如圖1所示,基于虛擬機(jī)調(diào)度方法的云計(jì)算系統(tǒng),包括用戶端、調(diào)度器和主機(jī),調(diào)度器將用戶端任務(wù)輸送至主機(jī)內(nèi)的虛擬機(jī)處理;實(shí)現(xiàn)任務(wù)調(diào)度、任務(wù)的狀態(tài)轉(zhuǎn)換,并將用戶提交的任務(wù)提交到合適的虛擬機(jī)上,以實(shí)現(xiàn)優(yōu)化調(diào)度。調(diào)度器包括:
(1)貝葉斯分類器:通過貝葉斯算法計(jì)算出提交的任務(wù)類型;
(2)虛擬機(jī)匹配:在貝葉斯分類器的實(shí)現(xiàn)的任務(wù)分類結(jié)果基礎(chǔ)上,進(jìn)行任務(wù)與虛擬機(jī)的匹配;
(3)虛擬機(jī)控制器:虛擬機(jī)創(chuàng)建、虛擬機(jī)的狀態(tài)信息收集、任務(wù)信息的收集等;
(4)就緒序列:有空閑的、滿足條件的虛擬機(jī),任務(wù)立馬被執(zhí)行;
(5)等待序列:沒有空閑的或滿足條件的虛擬機(jī),任務(wù)需要等待。
下面以Min-Min為例,與本發(fā)明虛擬機(jī)調(diào)度方法(BSP-ACS)進(jìn)行比較,
其中,Min-min算法是將任務(wù)優(yōu)先分配給能夠最早執(zhí)行任務(wù)并能夠在最短的時間內(nèi)完成任務(wù)的節(jié)點(diǎn)。算法需要提前計(jì)算得出最先執(zhí)行任務(wù)的節(jié)點(diǎn)和執(zhí)行任務(wù)速度最快的節(jié)點(diǎn),然后將任務(wù)依次按照“最先最短”的原則進(jìn)行任務(wù)分配。進(jìn)行了10組對比實(shí)驗(yàn),統(tǒng)計(jì)并求出平均值,分別記錄了調(diào)度所需的最優(yōu)跨度時間、任務(wù)平均等待時間以及任務(wù)失效率等。
(1)時間跨度是云系統(tǒng)處理用戶提交的任務(wù)集合需要消耗的總時間,時間跨度越小,則云系統(tǒng)的交互性和服務(wù)質(zhì)量越好。
(2)任務(wù)平均等待時間是用戶提交的任務(wù)等待時間的均值,也是云系統(tǒng)整體處理能力與吞吐量的表現(xiàn)。
從圖3可知,Min-min算法與BSP–ACS算法調(diào)度所需的最優(yōu)跨度時間。
從圖4可知,隨著任務(wù)的級別升高,BSP-ACS算法與Min-Min算法的任務(wù)平均等待時間也相應(yīng)提高。由圖可知,BSP-ACS算法的任務(wù)等待時間相對穩(wěn)定,并且總是優(yōu)于Min-Min算法。這一優(yōu)勢在任務(wù)量增大時更為明顯。
從圖5可知,隨著任務(wù)的級別升高,BSP-ACS與Min-Min的任務(wù)失效率也相應(yīng)提高,但BSP-ACS算法在任務(wù)失效率方面具有顯著的優(yōu)勢,而Min-Min算法隨著任務(wù)級別的升高,任務(wù)失效率明顯提高。隨著任務(wù)規(guī)模的增大,這一優(yōu)勢將明顯增大。
從圖6可知,BSP-ACS的各個類型的虛擬機(jī)使用率較為穩(wěn)定。BSP-ACS算法在負(fù)載均衡方面具有顯著的優(yōu)勢,而Min-Min算法存的劣勢是性能高的虛擬機(jī)使用率高,性能低的虛擬機(jī)使用率低。隨著任務(wù)規(guī)模的增大,負(fù)載不均衡,這種劣勢也越來越明顯。
通過仿真實(shí)驗(yàn)表明,對不同級別的任務(wù)進(jìn)行調(diào)度,對比可知,BSP-ACS具有明顯的性能優(yōu)勢,隨著任務(wù)數(shù)量和任務(wù)規(guī)模的增加,最優(yōu)跨度時間、任務(wù)平均等待時間也隨之增加,但失效率趨于穩(wěn)定。此外,BSP-ACS的各個類型的虛擬機(jī)使用率較為穩(wěn)定。
上面結(jié)合附圖對本發(fā)明進(jìn)行了示例性描述,顯然本發(fā)明具體實(shí)現(xiàn)并不受上述方式的限制,只要采用了本發(fā)明的方法構(gòu)思和技術(shù)方案進(jìn)行的各種非實(shí)質(zhì)性的改進(jìn),或未經(jīng)改進(jìn)將本發(fā)明的構(gòu)思和技術(shù)方案直接應(yīng)用于其它場合的,均在本發(fā)明的保護(hù)范圍之內(nèi)。