两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器及其調(diào)度方法

文檔序號:6585035閱讀:226來源:國知局
專利名稱:面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器及其調(diào)度方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種多核或眾核平臺調(diào)度技術(shù),具體來說是面向多核平臺的虛擬機(jī)監(jiān)
控器非對稱調(diào)度器及其調(diào)度方法,屬于計(jì)算機(jī)操作系統(tǒng)和虛擬化技術(shù)領(lǐng)域。
背景技術(shù)
系統(tǒng)虛擬化技術(shù)是指利用虛擬機(jī)監(jiān)視器(Virtual Machine Monitor,簡稱VMM)這個(gè)系統(tǒng)軟件層,管理系統(tǒng)平臺的處理器外設(shè)等資源,為客戶操作系統(tǒng)提供一個(gè)虛擬硬件執(zhí)行環(huán)境,這些虛擬的硬件執(zhí)行環(huán)境成為一個(gè)虛擬機(jī)(Virtual Machine,簡稱VM)。每個(gè)虛擬機(jī)(VM),都包含處理器、存儲器及設(shè)備等虛擬硬件資源,而同一臺物理主機(jī)上可以支持多個(gè)VM同時(shí)運(yùn)行。該技術(shù)起源于20世紀(jì)60年代,IBM公司最早在360系列計(jì)算機(jī)系統(tǒng)中使用了虛擬化技術(shù),其目的是讓用戶可以共享計(jì)算資源,而在隨后的三十年間,大型機(jī)上的虛擬化技術(shù)不斷趨于完善,并且一直是高效利用大型機(jī)強(qiáng)大計(jì)算資源的基礎(chǔ)技術(shù)。到了二十世紀(jì)90年代,隨著x86處理器性能的不斷提高, 一些基于x86處理器中低檔服務(wù)器甚至PC機(jī)的計(jì)算能力越來越強(qiáng),大量的數(shù)據(jù)中心和PC機(jī)都出現(xiàn)了系統(tǒng)資源利用率低,計(jì)算資源嚴(yán)重浪費(fèi)的問題。在這種背景下,以前主要用于大型機(jī)的系統(tǒng)虛擬化技術(shù)受到工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注,基于x86處理器的虛擬化技術(shù)得到了長足的發(fā)展,并在世界各地的數(shù)據(jù)中心,PC機(jī)用戶上得到了廣泛的應(yīng)用。虛擬化技術(shù)不僅可以提高系統(tǒng)資源的利用率,減少了數(shù)據(jù)中心的裝機(jī)量和相應(yīng)的電源成本,并且為一些傳統(tǒng)需求提供了新的簡單的實(shí)現(xiàn)手段,比如基于系統(tǒng)遷移技術(shù)的負(fù)載平衡,容錯(cuò)備份。除此之外,虛擬化技術(shù)也為PC機(jī)用戶提供了更方便的使用多樣性操作系統(tǒng)的方法,為許多操作系統(tǒng)等系統(tǒng)軟件開發(fā)和測試人員提供了前所未有的便利。 和本發(fā)明密切相關(guān)另外一個(gè)背景技術(shù)是近年來多核技術(shù)的持續(xù)發(fā)展。傳統(tǒng)的多路服務(wù)器是直接在一個(gè)主板上支持多個(gè)物理處理器插槽,也就是對稱多處理器系統(tǒng)。而隨著SMT(Simultaneous Multi-Threading,艮卩同時(shí)多線程)、CMP(Chip multiprocessors,即片上多處理器核)的發(fā)展,單個(gè)芯片上集成的處理器核會越來越多,2007年在Intel實(shí)驗(yàn)室中已經(jīng)研制成功了集成80個(gè)核的單個(gè)芯片。在未來一段時(shí)間內(nèi),四核、八核處理器等都會漸漸被廣泛使用,硬件平臺正在進(jìn)入多核時(shí)代。與之相應(yīng)的是,軟件的發(fā)展,尤其是系統(tǒng)軟件的發(fā)展和硬件平臺的發(fā)展相比,顯得有些滯后,很多情況下都是硬件的處理能力提高了,或者提供了新的功能,但是軟件棧的革新速度較為緩慢,使得許多新的硬件特性無法被廣泛使用,造成了計(jì)算資源、電源等的大量浪費(fèi)。隨著多核平臺的發(fā)展,操作系統(tǒng)以及應(yīng)用程序迫切需要快速革新,適應(yīng)新的強(qiáng)大的計(jì)算平臺。除此之外,異構(gòu)處理器核在中低端服務(wù)器和PC機(jī)上也會被大量使用,最典型的例子是現(xiàn)在已經(jīng)很流行的圖形處理器GPU(GraphicProcessing Unit),網(wǎng)絡(luò)處理器NP (Network Processor,簡稱NP),甚至不日將會上市的Intel的GPU Larrabee。 新一輪的虛擬化技術(shù)最初是因?yàn)楦咝褂孟到y(tǒng)過剩的計(jì)算資源而迅速發(fā)展起來,而現(xiàn)在隨著單一硬件平臺上集成的處理器核持續(xù)增多,系統(tǒng)虛擬化技術(shù)將得到持續(xù)的關(guān)注
5和發(fā)展,虛擬化技術(shù)將會在充分使用平臺提供的強(qiáng)大計(jì)算能力發(fā)揮更加重要的作用。目前已經(jīng)有服務(wù)器廠商將虛擬化放在BIOS中,為系統(tǒng)軟件提供了更加透明的虛擬化平臺,類似于大型機(jī)上的分區(qū)技術(shù),虛擬化技術(shù)最典型的用處就是對大量處理器核進(jìn)行分區(qū),而每個(gè)分區(qū)中都可以安裝傳統(tǒng)的操作系統(tǒng),這樣既可以充分使用了較新的硬件平臺,又充分利用了更新周期較長的操作系統(tǒng)和應(yīng)用程序,為計(jì)算機(jī)系統(tǒng)平臺的持續(xù)發(fā)展提供了可行的解決方案??傊到y(tǒng)虛擬化技術(shù)的發(fā)展和多核技術(shù)的發(fā)展是目前硬件和系統(tǒng)軟件發(fā)展中最顯著的兩樣技術(shù),同時(shí)這兩樣技術(shù)在互相影響,互相促進(jìn),多核的設(shè)計(jì)和實(shí)現(xiàn)中會考慮系統(tǒng)虛擬化技術(shù)對平臺的使用,而系統(tǒng)虛擬化技術(shù)也必然隨著多核的發(fā)展而不斷革新,最有效的使用平臺上集成的更多的同構(gòu)處理器核以及各種異構(gòu)處理器核。 系統(tǒng)虛擬化技術(shù)研究如何把處理器、內(nèi)存、外設(shè)等資源分配給客戶機(jī)使用,它是虛擬化技術(shù)的一種,所抽象的對象是整個(gè)計(jì)算機(jī)。系統(tǒng)虛擬化技術(shù)對處理器的抽象,以及對虛擬處理器的調(diào)度是虛擬化技術(shù)中的重要組成部分,目前的虛擬機(jī)監(jiān)控器VMM從處理器虛擬化的技術(shù)上劃分主要有三種方式,一種是二進(jìn)制翻譯,這種主要情況下,客戶操作系統(tǒng)中的特權(quán)指令是通過解釋執(zhí)行的;第二種是類虛擬化,即修改客戶操作系統(tǒng)把客戶操作系統(tǒng)中需要執(zhí)行的特權(quán)指令修改成對虛擬機(jī)監(jiān)控器的調(diào)用,當(dāng)然這種技術(shù)一般和客戶操作系統(tǒng)執(zhí)行特權(quán)指令導(dǎo)致異常然后陷入到VMM中從而由V匪接管執(zhí)行相結(jié)合;第三種就是硬件輔助的完全虛擬化技術(shù),使用帶有硬件虛擬化支持的處理器,比如Intel VT-x或者AMD的SVM,客戶操作系統(tǒng)執(zhí)行所有的敏感指令和特權(quán)指令時(shí)都會陷入到VMM中,VMM代為處理完畢后,會返回到客戶操作系統(tǒng)中。以上幾種方法各有利弊,其中第三種硬件輔助虛擬化方法目前的性能并不好,原因是客戶機(jī)因?yàn)閳?zhí)行特權(quán)指令而導(dǎo)致的VM exit(虛擬機(jī)退出)數(shù)量過多,而且VMM中處理這些退出的時(shí)間長,導(dǎo)致HVM(硬件虛擬機(jī))Domain (域)的性能不高。此外目前的VMM實(shí)現(xiàn)中對多核的支持基本都是延續(xù)了傳統(tǒng)上Li皿x對SMP平臺的支持方式,對vcpu(虛擬處理器)的調(diào)度也是采用對稱調(diào)度的方法,即調(diào)度器并不區(qū)分處于不同封裝上的處理器核心,也不支持專門用于某種特殊需求的VMM任務(wù)和處理器核的綁定。

發(fā)明內(nèi)容
本發(fā)明針對目前多核平臺VMM中對稱調(diào)度方法不能充分使用多核處理能力,并且不能為不同的客戶機(jī)提供靈活的定制性的服務(wù)的問題,提出了一種面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器及其調(diào)度方法。 本發(fā)明設(shè)計(jì)的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器,其在結(jié)構(gòu)上除了包括VMM中已有的通用調(diào)度模塊外,還包括以下新添加的模塊管理域中的服務(wù)核請求解析模塊;V匪中的Domain特定服務(wù)核配置模塊、系統(tǒng)頂級調(diào)度器模塊、服務(wù)調(diào)度器模塊、共享內(nèi)存機(jī)制模塊及請求查詢模塊,其中系統(tǒng)頂級調(diào)度器模塊中包含平臺處理器核拓?fù)渥R別和分析子模塊以及服務(wù)核分配和回收子模塊;HVM Domain中的混合虛擬化模塊。V匪運(yùn)行在多核或眾核系統(tǒng)平臺上,向下管理著底層的硬件平臺,向上支撐運(yùn)行著管理域和HVMDomain。
服務(wù)核請求解析模塊,用于HVM Domain創(chuàng)建時(shí)服務(wù)核的配置,負(fù)責(zé)將HVM Domain也就是客戶機(jī)創(chuàng)建時(shí)的配置文件中指明的服務(wù)核的類型和數(shù)量解析,向V匪發(fā)出服務(wù)核的創(chuàng)建請求; Domain特定服務(wù)核配置模塊則負(fù)責(zé)初步解析服務(wù)核請求解析模塊發(fā)過的HVMDomain的服務(wù)核創(chuàng)建請求然后發(fā)送給系統(tǒng)頂級調(diào)度器模塊,并在整個(gè)HVM Domain的生命周期內(nèi)管理其服務(wù)核相關(guān)的信息; 系統(tǒng)頂級調(diào)度器模塊主要用來管理計(jì)算機(jī)平臺中能用的處理器核,并在全局范圍內(nèi)對通用調(diào)度器模塊和服務(wù)調(diào)度器模塊的能用處理器核資源位圖進(jìn)行調(diào)整,負(fù)責(zé)完成來自Domain特定服務(wù)核配置模塊中的請求,根據(jù)平臺處理器核拓?fù)渥R別和分析子模塊中的拓?fù)湫畔?,使用服?wù)核分配和回收子模塊創(chuàng)建服務(wù)核或者回收服務(wù)核;平臺處理器核拓?fù)渥R別和分析子模塊負(fù)責(zé)對系統(tǒng)中擁有的處理器核資源進(jìn)行識別,處理器核在被識別之后加入頂級調(diào)度器使用和管理的能用處理器核資源位圖中,初始化之后頂級調(diào)度器開始在這些處理器核上運(yùn)行;服務(wù)核分配和回收子模塊負(fù)責(zé)服務(wù)核的創(chuàng)建或者回收,從系統(tǒng)能用處理器核資源位圖中區(qū)分出服務(wù)核,并添入服務(wù)調(diào)度器模塊的能用處理器核資源位圖中,或者從服務(wù)調(diào)度器模塊的能用處理器核資源位圖中刪除服務(wù)核;
服務(wù)調(diào)度器模塊負(fù)責(zé)服務(wù)核的管理和調(diào)度; 共享內(nèi)存機(jī)制模塊負(fù)責(zé)響應(yīng)HVM Domain的映射請求,并在共享內(nèi)存建立之后,觸發(fā)請求查詢模塊; 混合虛擬化模塊首先向VMM請求映射共享內(nèi)存,共享內(nèi)存機(jī)制模塊響應(yīng)HVMDomain的映射請求,在VMM中建立共享內(nèi)存區(qū)域;在共享內(nèi)存建立之后,混合虛擬化模塊發(fā)出HVMDomain對服務(wù)核的服務(wù)請求,這些請求被寫在共享內(nèi)存區(qū)域內(nèi);
請求查詢模塊負(fù)責(zé)查詢HVM Domain所屬的共享內(nèi)存區(qū)域內(nèi)的對服務(wù)核的服務(wù)請求,并把這些請求發(fā)送到服務(wù)調(diào)度器模塊。 所述系統(tǒng)頂級調(diào)度器模塊在系統(tǒng)初始化、HVM Domain創(chuàng)建、服務(wù)核創(chuàng)建請求、服務(wù)核回收、HVM Domain銷毀、通用核和服務(wù)核比例調(diào)整、全局范圍內(nèi)的負(fù)載調(diào)整等場合才會被觸發(fā)。 本發(fā)明設(shè)計(jì)的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法,具體步驟包括
步驟l,客戶機(jī)創(chuàng)建啟動(dòng)和服務(wù)核的創(chuàng)建請求發(fā)出; HVM Domain客戶機(jī)創(chuàng)建時(shí),在管理域中會有一個(gè)對應(yīng)的客戶機(jī)的創(chuàng)建配置文件,該文件中會指明客戶機(jī)使用的vcpu的數(shù)量,以及與物理處理器核的綁定信息,同時(shí)該配置文件中也會指明所需的服務(wù)核的類型和數(shù)量,具體的類型由不同的實(shí)施例中特殊指定和實(shí)現(xiàn);管理域中的服務(wù)核請求解析模塊將該配置文件中的服務(wù)核的類型和數(shù)量解析,并將創(chuàng)建需求轉(zhuǎn)變成對VMM的超調(diào)用Hypercall,并將該超調(diào)用傳輸給VMM中的Domain特定服務(wù)核配置模塊,而Domain特定服務(wù)核配置模塊在接管超調(diào)用Hypercall后,采用一個(gè)結(jié)構(gòu)體管理新創(chuàng)建的HVM Domain的所有信息,包括服務(wù)核的配置信息,并初步解析超調(diào)用Hypercall,然后觸發(fā)VMM中的系統(tǒng)頂級調(diào)度器模塊運(yùn)行;其中vcpu代表虛擬處理器,Hypercall代表超級調(diào)用; 步驟2,處理器核拓?fù)渥R別和分析以及服務(wù)核的分配; 系統(tǒng)頂級調(diào)度器模塊中的處理器核拓?fù)渥R別和分析子模塊會對系統(tǒng)中擁有的處理器核資源進(jìn)行識別,處理器核在被識別之后加入系統(tǒng)頂級調(diào)度器模塊使用和管理的能用處理器核資源位圖中,初始化之后系統(tǒng)頂級調(diào)度器模塊開始在這些處理器核上運(yùn)行,直到這些處理器核被劃分給VMM中的通用調(diào)度器模塊或者被分配成服務(wù)核接受VMM中的服務(wù)調(diào)度器模塊的調(diào)度;
系統(tǒng)初始化時(shí),系統(tǒng)頂級調(diào)度器模塊被初始化,系統(tǒng)頂級調(diào)度器模塊接到創(chuàng)建服務(wù)核的請求后,首先根據(jù)平臺處理器核拓?fù)浜头治鲎幽K得到平臺處理器核的拓?fù)湫畔ⅲ捎镁徒瓌t選擇和HVM Domain的vcpu綁定的物理處理器核相鄰的處理器核,如果vcpu沒有設(shè)定需要綁定物理處理器核,則按照系統(tǒng)的整體策略,是性能優(yōu)先還是節(jié)能優(yōu)先的預(yù)定策略進(jìn)行選擇,性能優(yōu)先時(shí),優(yōu)先選擇空閑的處理器核作為服務(wù)核,而節(jié)能優(yōu)先時(shí)則優(yōu)先選擇超線程或者同一封裝內(nèi)的處理器核作為服務(wù)核; 服務(wù)核選定之后,由系統(tǒng)頂級調(diào)度器模塊中的服務(wù)核分配和回收子模塊負(fù)責(zé)服務(wù)核的最終創(chuàng)建過程,服務(wù)核分配和回收子模塊從系統(tǒng)能用處理器核資源位圖中區(qū)分出服務(wù)核,并添入服務(wù)調(diào)度器模塊的能用處理器核資源位圖中,然后通過處理器間中斷IPI喚醒服務(wù)核,并使它從指定的函數(shù)開始執(zhí)行;服務(wù)核被創(chuàng)建并開始執(zhí)行時(shí),并未真正開始提供服務(wù),直到HVMDomain申請創(chuàng)建共享內(nèi)存區(qū)域之后,服務(wù)核才會被真正激活,主動(dòng)到共享內(nèi)存區(qū)域輪詢?nèi)蝿?wù),或者被服務(wù)調(diào)度器模塊調(diào)度時(shí)才被激活提供服務(wù);服務(wù)核的回收是在服務(wù)核所屬的HVMDomain被銷毀時(shí)觸發(fā)的,與創(chuàng)建的過程類似,系統(tǒng)頂級調(diào)度器模塊調(diào)用服務(wù)核分配和回收子模塊進(jìn)行回收,并將回收的服務(wù)核進(jìn)行重新分配,根據(jù)系統(tǒng)的配置策略,將空閑的服務(wù)核,加入到通用調(diào)度器模塊的能用處理器核資源位圖中,或加入到系統(tǒng)空閑資源中; 步驟3,兩級調(diào)度器對通用核和服務(wù)核調(diào)度; VMM啟動(dòng)初期,計(jì)算機(jī)平臺內(nèi)的所有處理器核都是由系統(tǒng)頂級處理器模塊管理和調(diào)度的,隨著HVM Domain以及對應(yīng)的vcpu的創(chuàng)建,通用調(diào)度器模塊有了調(diào)度對象,被初始化并在所管理的通用核上運(yùn)行; 服務(wù)核創(chuàng)建之后,服務(wù)調(diào)度器模塊開始對服務(wù)核進(jìn)行調(diào)度,它會輪詢各個(gè)HVM
Domain與VMM的共享內(nèi)存區(qū)域的服務(wù)請求,調(diào)用請求查詢模塊獲得新的服務(wù)任務(wù)發(fā)送到服
務(wù)調(diào)度器模塊,服務(wù)調(diào)度器模塊根據(jù)任務(wù)所屬的服務(wù)核,將任務(wù)插入到該服務(wù)核的任務(wù)隊(duì)
列,并觸發(fā)服務(wù)核的運(yùn)行;如果服務(wù)核創(chuàng)建時(shí)被指定為直接輪詢模式,則不需要服務(wù)調(diào)度器
模塊將任務(wù)派發(fā)給服務(wù)核,服務(wù)核直接輪詢共享內(nèi)存區(qū)域獲得服務(wù)請求; 步驟4,客戶機(jī)發(fā)出服務(wù)請求及對應(yīng)服務(wù)核響應(yīng)客戶機(jī)的請求; HVM Domain被創(chuàng)建并啟動(dòng)后,裝載HVM Domain中的混合虛擬化模塊,混合虛擬化
模塊向VMM發(fā)出映射共享內(nèi)存的請求,VMM中的共享內(nèi)存機(jī)制模塊響應(yīng)請求,在VMM的空間
中映射共享內(nèi)存區(qū)域,并將共享內(nèi)存區(qū)域的起始地址以及大小信息寫入Domain特定服務(wù)
核配置模塊管理的信息結(jié)構(gòu)體中,共享內(nèi)存映射成功后對應(yīng)的服務(wù)核上的服務(wù)代碼開始運(yùn)
行; 混合虛擬化模塊通過寫共享內(nèi)存的方式發(fā)送服務(wù)請求,服務(wù)請求也能夠由運(yùn)行在用戶態(tài)的特定應(yīng)用程序發(fā)出,通過將現(xiàn)有操作系統(tǒng)用戶態(tài)、內(nèi)核態(tài)模塊數(shù)據(jù)和控制方法交由混合虛擬化模塊代理發(fā)送,服務(wù)請求發(fā)送后,VMM中的請求查詢模塊將會按照一定頻率查詢這些請求,并把這些請求交由服務(wù)調(diào)度器模塊派發(fā)到對應(yīng)的服務(wù)核,服務(wù)核會根據(jù)服務(wù)調(diào)度器模塊中的調(diào)度策略執(zhí)行自己的任務(wù)隊(duì)列,也能夠采用一種服務(wù)核直接輪詢對應(yīng)的共享內(nèi)存區(qū)域的方式, 一旦有請求,直接執(zhí)行,這種情況適用于實(shí)時(shí)性要求比較高的服務(wù),或者頻繁執(zhí)行并決定著系統(tǒng)整體性能的關(guān)鍵服務(wù);當(dāng)服務(wù)核將服務(wù)請求執(zhí)行完畢后,把處理結(jié)果通過共享內(nèi)存機(jī)制模塊寫回共享內(nèi)存,混合虛擬化模塊或者HVM Domain中的其他內(nèi)核模塊就能讀到返回的服務(wù)執(zhí)行結(jié)果。 所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法,其特征在于,所述步驟2 中處理器核拓?fù)渥R別和分析子模塊會對平臺中擁有的處理器核資源進(jìn)行識別,識別的主要 根據(jù)為,是否在一個(gè)封裝內(nèi),是否共享二級緩存,是否是同一個(gè)核上的超線程。
所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法,其特征在于,步驟2中所 述服務(wù)核的分配采用就近原則,具體為如果vcpu是一個(gè)超線程,則服務(wù)核從最鄰近的超 線程優(yōu)先選擇,如果vcpu綁定到了一個(gè)處理器核,則服務(wù)核優(yōu)先從同處于一個(gè)封裝內(nèi)的其 它處理器核分配,更進(jìn)一步,如果同一封裝內(nèi)有些處理器核和vcpu綁定的處理器核共享二 級緩存,另一些不共享,則優(yōu)先選擇共享二級緩存的處理器核。 所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法,其特征在于,所述步驟4 中HVMDomain與V匪之間建立的共享內(nèi)存,在V匪中有統(tǒng)一的地址空間,在HVM Domain系 統(tǒng)內(nèi)部也有自己的映射空間,VMM中對這些共享內(nèi)存中的請求區(qū)域是統(tǒng)一管理的,對請求的 管理采用輪詢的同步通訊方式,或采用消息傳遞的方式。 本發(fā)明提出的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器及其調(diào)度方法,具有下 述技術(shù)優(yōu)點(diǎn)和效果 (1)服務(wù)核的存在滿足了客戶操作系統(tǒng)特殊的需求 目前的大多數(shù)虛擬機(jī)監(jiān)控器的性能瓶頸都在IO,原因主要就是V匪的架構(gòu)不能適
應(yīng)多個(gè)客戶操作系統(tǒng)并發(fā)訪問io設(shè)備的需求,服務(wù)核的存在就可以為客戶操作系統(tǒng)提供
特定IO訪問的加速。另外,客戶操作系統(tǒng)的特殊需求不僅體現(xiàn)在某些性能需求上,還體現(xiàn) 在某些功能性需求上,比如某個(gè)客戶操作系統(tǒng)屬于硬件輔助虛擬機(jī),但是想采用混合虛擬 化方法,加速某些驅(qū)動(dòng),而服務(wù)核也可以輔助客戶操作系統(tǒng)完成這些任務(wù)??傊?wù)核是一 種使用虛擬化架構(gòu)的一種機(jī)制,而這種機(jī)制的存在為虛擬化環(huán)境提供了新的客戶操作系統(tǒng) 到V匪之間的交互方式,通過這種請求和服務(wù)模式的模型,可以滿足很多種客戶操作系統(tǒng) 和VMM的交互需求。 (2)服務(wù)核的分配適應(yīng)平臺的處理器拓?fù)浣Y(jié)構(gòu) 傳統(tǒng)的針對SMP系統(tǒng)的調(diào)度器已經(jīng)不能適應(yīng)日益復(fù)雜的基于x86處理器的平臺, 而現(xiàn)在流行的虛擬機(jī)監(jiān)控器軟件主要是面向流行的處理器配置,也沒有充分考慮到平臺的 眾多處理器核的拓?fù)浣Y(jié)構(gòu)。本發(fā)明中的非對稱調(diào)度器在分配服務(wù)核時(shí)充分考慮了服務(wù)核以 及所服務(wù)的客戶操作系統(tǒng)虛擬處理器vcpu所運(yùn)行的物理處理器核的拓?fù)潢P(guān)系,對于目前 的計(jì)算機(jī)平臺已經(jīng)顯示出一些優(yōu)勢,比如能夠減少cache缺失率,提高了系統(tǒng)的整體性能, 對于未來眾核平臺和存在大量異構(gòu)核的平臺,這種服務(wù)核分配模式會表現(xiàn)出更明顯的優(yōu) 勢,比如圖形處理器GPU適合進(jìn)行矩陣運(yùn)算,可以為需要密集矩陣運(yùn)算的客戶操作系統(tǒng)提 供GPU作為服務(wù)核。 (3)非對稱的兩級調(diào)度器模型為整個(gè)系統(tǒng)提供了靈活性和可配置性 本發(fā)明中使用的兩級的非對稱調(diào)度器,不僅為客戶操作系統(tǒng)的特殊需求提供了更
為靈活的服務(wù),同時(shí)也方便對多核或者未來眾核平臺中的豐富的處理器核資源進(jìn)行利用。
以非對稱的兩級調(diào)度器為中心,對上適應(yīng)客戶操作系統(tǒng)的個(gè)性化需求,對下充分利用平臺
的計(jì)算資源,并可以方便地?cái)U(kuò)展進(jìn)行異構(gòu)處理器核的調(diào)度使用。通用調(diào)度器兼容現(xiàn)有的大
多虛擬機(jī)監(jiān)控器采用的對稱調(diào)度模型,而服務(wù)調(diào)度器為客戶操作系統(tǒng)的各種特殊需求提供了可用的方便的支持。二者協(xié)同起來,并由頂級調(diào)度器做全局的分配以及運(yùn)行時(shí)的動(dòng)態(tài)調(diào) 整,大大提高了整個(gè)系統(tǒng)的靈活性。 可配置性的提高主要是因?yàn)榉?wù)核的提供可以由管理域基于單個(gè)虛擬機(jī)配置,并 且服務(wù)核的分配過程也是根據(jù)平臺的拓?fù)浣Y(jié)構(gòu)優(yōu)化分配。除此之外頂級調(diào)度器的動(dòng)態(tài)調(diào)整 策略也是可以由管理域指定,比如按照性能優(yōu)先或者節(jié)能優(yōu)先策略分別配置時(shí),頂級調(diào)度 器對通用調(diào)度器和服務(wù)調(diào)度器的可用處理器核位圖的調(diào)整就是不同的。節(jié)能優(yōu)先時(shí),不用 的服務(wù)核會進(jìn)入低能耗狀態(tài),性能優(yōu)先時(shí),回收的服務(wù)核會被頂級調(diào)度器加入到通用調(diào)度 器的可用處理器資源位圖中,被通用調(diào)度器用來調(diào)度客戶操作系統(tǒng)的vcpu。本發(fā)明中對靈 活性和可配置性的改善也適合正在不斷革新中的硬件平臺的新趨勢。


圖1是面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器的模塊結(jié)構(gòu)示意圖;
圖2是面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法的步驟流程圖。
具體實(shí)施例方式
在下述具體實(shí)施示例中,結(jié)合附圖對本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)說明。
如圖1所示,VMM 10運(yùn)行在多核或眾核系統(tǒng)平臺上,向下管理著底層的硬件平臺 12,向上支撐運(yùn)行著管理域9和HVM Domainll。本發(fā)明設(shè)計(jì)的面向多核平臺的虛擬機(jī)監(jiān)控 器非對稱調(diào)度器,其在結(jié)構(gòu)上除了包括V匪10中已有的通用調(diào)度模塊4夕卜,還包括以下新 添加的模塊管理域9中的服務(wù)核請求解析模塊1 ;V匪10中的Domain特定服務(wù)核配置模塊 2、系統(tǒng)頂級調(diào)度器模塊3、服務(wù)調(diào)度器模塊5、共享內(nèi)存機(jī)制模塊7及請求查詢模塊8,其中 系統(tǒng)頂級調(diào)度器模塊3中包含平臺處理器核拓?fù)渥R別和分析子模塊301以及服務(wù)核分配和 回收子模塊302 ;HVM Domainll中的混合虛擬化模塊6。 HVM Domainl 1是承載計(jì)算任務(wù)的Domain,管理域9根據(jù)V匪IO提供的機(jī)制對HVM Domainll進(jìn)行控制。管理域9中服務(wù)核請求解析模塊1負(fù)責(zé)將客戶機(jī)創(chuàng)建時(shí)的配置文件 中指明的服務(wù)核的類型和數(shù)量解析,向V匪IO發(fā)出服務(wù)核的創(chuàng)建請求。V匪IO中的Domain 特定服務(wù)核配置模塊2則負(fù)責(zé)初步解析請求解析模塊1發(fā)來的服務(wù)核創(chuàng)建請求然后發(fā)送 給系統(tǒng)頂級調(diào)度器模塊3,并在整個(gè)HVM Domainll的生命周期內(nèi)管理其服務(wù)核相關(guān)的信 息。系統(tǒng)頂級調(diào)度器模塊3主要用來管理系統(tǒng)中的可用的處理器核,并在全局范圍內(nèi)對通 用調(diào)度器模塊4和服務(wù)調(diào)度器模塊5的能用處理器核資源位圖進(jìn)行調(diào)整,負(fù)責(zé)具體完成來 自Domain特定服務(wù)核配置模塊2中的請求,根據(jù)平臺處理器核拓?fù)渥R別和分析子模塊301 中的拓?fù)湫畔ⅲ褂梅?wù)核分配和回收子模塊302創(chuàng)建服務(wù)核或者回收服務(wù)核;平臺處理 器核拓?fù)渥R別和分析子模塊301負(fù)責(zé)對系統(tǒng)中擁有的處理器核資源進(jìn)行識別,服務(wù)核分配 和回收子模塊302負(fù)責(zé)服務(wù)核的創(chuàng)建或者回收,從系統(tǒng)能用處理器核資源位圖中區(qū)分出服 務(wù)核,并添入服務(wù)調(diào)度器模塊5的能用處理器核資源位圖中,或者從服務(wù)調(diào)度器模塊5的能 用處理器核資源位圖中刪除服務(wù)核。主要是正常運(yùn)行狀態(tài)下的系統(tǒng),通用調(diào)度器模塊4負(fù) 責(zé)HVMDomainll的虛擬處理器vcpu在通用核上的調(diào)度,而服務(wù)調(diào)度器模塊5負(fù)責(zé)服務(wù)核的 管理和調(diào)度。 共享內(nèi)存機(jī)制模塊7負(fù)責(zé)響應(yīng)HVM Domain的映射請求,并在共享內(nèi)存建立之后,觸發(fā)請求查詢模塊8。 HVM Domainll中的混合虛擬化模塊6負(fù)責(zé)向V匪IO請求映射共享內(nèi)存,而V匪IO 中的共享內(nèi)存機(jī)制模塊7負(fù)責(zé)響應(yīng)HVM Domainll的映射請求;在共享內(nèi)存建立之后,HVM Domainll對服務(wù)核的服務(wù)請求通過混合虛擬化模塊6發(fā)出,同時(shí)共享內(nèi)存機(jī)制模塊7觸發(fā) 請求查詢模塊8。 請求查詢模塊8負(fù)責(zé)查詢HVM Domainll所屬的共享內(nèi)存區(qū)域內(nèi)的對服務(wù)核的服 務(wù)請求,并把這些請求發(fā)送到服務(wù)調(diào)度器模塊5,由服務(wù)調(diào)度器模塊5負(fù)責(zé)服務(wù)的調(diào)度。
面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器包括系統(tǒng)頂級調(diào)度器模塊3及其下 屬的通用核調(diào)度器模塊4和服務(wù)核調(diào)度器模塊5兩級,系統(tǒng)頂級調(diào)度器模塊3負(fù)責(zé)處理器 核的角色劃分,服務(wù)核的創(chuàng)建和回收,根據(jù)運(yùn)行負(fù)載的變化,調(diào)整通用調(diào)度器模塊4所管理 的通用核以及服務(wù)調(diào)度器模塊5管理的服務(wù)核的數(shù)量,實(shí)現(xiàn)計(jì)算機(jī)處理器核作為通用核和 作為服務(wù)核的角色轉(zhuǎn)換。 本發(fā)明提出的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器,它與現(xiàn)有的調(diào)度器的 區(qū)別的主要表現(xiàn)在非對稱性調(diào)度上首先,對計(jì)算機(jī)平臺的處理器核不使用傳統(tǒng)的對稱調(diào) 度方法,而是采用了將某些核作為服務(wù)核,運(yùn)行專門的VMM服務(wù);其次,服務(wù)核的分配既考 慮上層HVM Domainll的需求,也對計(jì)算機(jī)平臺的處理器核拓?fù)浣Y(jié)構(gòu)有所考慮,系統(tǒng)頂級調(diào) 度器模塊3根據(jù)創(chuàng)建HVM Domainll的配置文件中的vcpu綁定信息和服務(wù)核的類型數(shù)量等 信息,采用就近原則分配服務(wù)核,如果vcpu沒有設(shè)定需要綁定物理處理器核,則按照系統(tǒng) 的整體策略,是性能優(yōu)先還是節(jié)能優(yōu)先的預(yù)定策略進(jìn)行選擇,性能優(yōu)先時(shí),優(yōu)先選擇空閑的 處理器核作為服務(wù)核,而節(jié)能優(yōu)先時(shí)則優(yōu)先選擇超線程或者同一封裝內(nèi)的處理器核作為服 務(wù)核。 本發(fā)明提出的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法在系統(tǒng)實(shí)施中主要
分為4個(gè)步驟,即客戶機(jī)創(chuàng)建啟動(dòng)和服務(wù)核的創(chuàng)建請求發(fā)出、處理器核拓?fù)渥R別和分析以
及服務(wù)核的分配、兩級調(diào)度器對通用核和服務(wù)核調(diào)度以及客戶機(jī)發(fā)出服務(wù)請求及對應(yīng)服務(wù)
核響應(yīng)客戶機(jī)的請求。結(jié)合附2,具體步驟如下 步驟1 :客戶機(jī)創(chuàng)建啟動(dòng)和服務(wù)核的創(chuàng)建請求發(fā)出; HVM Domainll創(chuàng)建時(shí),在管理域9中會有一個(gè)對應(yīng)的客戶機(jī)的創(chuàng)建配置文件,該 文件中會指明客戶機(jī)使用的vcpu的數(shù)量,以及與物理處理器核的綁定信息,同時(shí)該配置文 件中也會指明所需的服務(wù)核的類型和數(shù)量(比如文件系統(tǒng)服務(wù)、調(diào)試服務(wù)、IO服務(wù),或者 像頁表遍歷這樣的具體操作的加速請求),具體的類型可以由不同的實(shí)施例中特殊指定和 實(shí)現(xiàn)。管理域9中的服務(wù)核請求解析模塊1將該配置文件中的服務(wù)核的類型和數(shù)量解析, 并將創(chuàng)建需求轉(zhuǎn)變成對V匪IO的超調(diào)用Hypercall,并將該超調(diào)用傳輸給Domain特定服 務(wù)核配置模塊2,而Domain特定服務(wù)核配置模塊2在接管超調(diào)用Hypercall后,采用一個(gè) 結(jié)構(gòu)體管理新創(chuàng)建的HVM Domain的所有信息,包括服務(wù)核的配置信息,并初步解析超調(diào)用 Hypercall,然后觸發(fā)系統(tǒng)頂級調(diào)度器模塊3運(yùn)行。
步驟2,處理器核拓?fù)渥R別和分析以及服務(wù)核的分配; 處理器核拓?fù)渥R別和分析子模塊301會對系統(tǒng)中擁有的處理器核資源進(jìn)行識別, 主要根據(jù)是否在一個(gè)封裝內(nèi),是否共享二級緩存,是否是同一個(gè)核上的超線程,處理器核在 被識別之后加入系統(tǒng)頂級調(diào)度器模塊3使用和管理的能用處理器核資源位圖中;初始化之
11后系統(tǒng)頂級調(diào)度器模塊3開始在這些處理器核上運(yùn)行,直到這些處理器核被劃分給通用調(diào) 度器模塊4或者被分配成服務(wù)核接受服務(wù)調(diào)度器模塊5的調(diào)度。 系統(tǒng)初始化時(shí),V匪IO中的系統(tǒng)頂級調(diào)度器模塊3被初始化,系統(tǒng)頂級調(diào)度器模塊 3在接受請求分配服務(wù)核時(shí),從系統(tǒng)可用的處理器核資源中找到合適的處理器核,并對這個(gè) 處理器核初始化使之成為運(yùn)行HVM Domain需要的功能(比如文件系統(tǒng)服務(wù),10設(shè)備服務(wù), 調(diào)試服務(wù)服務(wù),IO仿真服務(wù))的服務(wù)核,然后服務(wù)核被創(chuàng)建。系統(tǒng)頂級調(diào)度器模塊3接到 創(chuàng)建服務(wù)核的請求后,首先根據(jù)平臺處理器核拓?fù)浜头治鲎幽K301得到平臺處理器核的 拓?fù)湫畔ⅲx擇和HVM Domainll的vcpu綁定的物理處理器核相鄰的處理器核,具體為系 統(tǒng)頂級調(diào)度器模塊3根據(jù)創(chuàng)建HVM Domainll的配置文件中的vcpu綁定信息和服務(wù)核的類 型數(shù)量等信息,采用就近原則分配服務(wù)核,比如如果vcpu是一個(gè)超線程,則服務(wù)核從最鄰 近的超線程優(yōu)先選擇,如果vcpu綁定到了一個(gè)處理器核,則服務(wù)核優(yōu)先從同處于一個(gè)封裝 內(nèi)的其它核分配,更進(jìn)一步,如果同一封裝內(nèi)有些處理器核和vcpu綁定的處理器核共享二 級緩存,另一些不共享,則優(yōu)先選擇共享二級緩存的處理器核。如果vcpu沒有設(shè)定需要綁 定物理處理器核,則按照系統(tǒng)的整體策略,是性能優(yōu)先還是節(jié)能優(yōu)先的預(yù)定策略進(jìn)行選擇, 性能優(yōu)先時(shí),優(yōu)先選擇空閑的處理器核作為服務(wù)核,而節(jié)能優(yōu)先時(shí)則優(yōu)先選擇超線程或者 同一封裝內(nèi)的處理器核作為服務(wù)核。 服務(wù)核選定之后,由服務(wù)核分配和回收子模塊302負(fù)責(zé)服務(wù)核的最終創(chuàng)建過程。 服務(wù)核分配和回收子模塊302主要是從系統(tǒng)能用處理器核資源位圖中區(qū)分出服務(wù)核,并 添入服務(wù)調(diào)度器模塊5的能用處理器核資源位圖中,然后通過處理器間中斷IPI (inter processor interrupt)喚醒服務(wù)核,并使它從指定的函數(shù)開始執(zhí)行。服務(wù)核被創(chuàng)建并開始執(zhí) 行時(shí),并未真正開始提供服務(wù),直到HVM Domainll申請創(chuàng)建共享內(nèi)存區(qū)域之后,服務(wù)核才會 被真正激活,主動(dòng)到共享內(nèi)存區(qū)域輪詢?nèi)蝿?wù),或者被服務(wù)調(diào)度器模塊5調(diào)度時(shí)才被激活提 供服務(wù)。 服務(wù)核的回收是在服務(wù)核所屬的HVM Domainll被銷毀時(shí)觸發(fā)的,與創(chuàng)建的過程類 似,系統(tǒng)頂級調(diào)度器模塊3調(diào)用服務(wù)核分配和回收子模塊302進(jìn)行回收,并將回收的服務(wù)核 進(jìn)行重新分配,根據(jù)系統(tǒng)的配置策略,將空閑的服務(wù)核,可以加入到通用調(diào)度器模塊4的能 用處理器核資源位圖中,也可以加入到系統(tǒng)空閑資源中。
步驟3 :兩級調(diào)度器對通用核和服務(wù)核調(diào)度; V匪10啟動(dòng)初期,平臺內(nèi)的所有處理器核都是由系統(tǒng)頂級處理器模塊3管理和調(diào) 度的,隨著HVM Domainll以及對應(yīng)的vcpu的創(chuàng)建,通用調(diào)度器模塊4有了調(diào)度對象,被初 始化并在所管理的通用核上運(yùn)行。 服務(wù)核創(chuàng)建之后,服務(wù)調(diào)度器模塊5開始對服務(wù)核進(jìn)行調(diào)度,傳統(tǒng)的vcpu的調(diào)度 則由通用核調(diào)度器模塊4負(fù)責(zé)。通用調(diào)度器模塊4具有調(diào)度vcpu以及平衡所屬的處理器 核之間負(fù)載的功能,其能用處理器核資源位圖中的每個(gè)處理器核上都會像傳統(tǒng)調(diào)度器一樣 周期性的運(yùn)行通用調(diào)度器模塊4的代碼。服務(wù)調(diào)度器模塊5會輪詢各個(gè)HVM Domainll與 VMM10的共享內(nèi)存區(qū)域的服務(wù)請求,即調(diào)用請求查詢模塊8獲得新的服務(wù)任務(wù)發(fā)送到服務(wù) 調(diào)度器模塊5,服務(wù)調(diào)度器模塊5根據(jù)任務(wù)所屬的服務(wù)核,將任務(wù)插入到該服務(wù)核的任務(wù)隊(duì) 列,并觸發(fā)服務(wù)核的運(yùn)行。如果服務(wù)核創(chuàng)建時(shí)被指定為直接輪詢模式,則不需要服務(wù)調(diào)度器 模塊5將任務(wù)派發(fā)給服務(wù)核,服務(wù)核直接輪詢共享內(nèi)存區(qū)域獲得服務(wù)請求。
步驟4 :客戶機(jī)發(fā)出服務(wù)請求及對應(yīng)服務(wù)核響應(yīng)客戶機(jī)的請求; 步驟1和步驟2完成了對服務(wù)核的創(chuàng)建,以及對服務(wù)核的初始化,并能夠使服務(wù)核 通過兩級的調(diào)度器進(jìn)行調(diào)度。當(dāng)HVM Domainll被創(chuàng)建并啟動(dòng)起來后,這時(shí)它所屬的服務(wù)核 也就已經(jīng)就緒了,此時(shí)服務(wù)核處于等待狀態(tài),等待服務(wù)調(diào)度器模塊5接到請求后調(diào)度服務(wù) 核執(zhí)行。服務(wù)核真正投入運(yùn)行是在HVM Domainll中的混合虛擬化模塊6對服務(wù)核發(fā)出服 務(wù)請求后。HVM Domainll被創(chuàng)建并啟動(dòng)后,裝載混合虛擬化模塊6,混合虛擬化模塊6向 V匪10發(fā)出映射共享內(nèi)存的請求,V匪10中的共享內(nèi)存機(jī)制模塊7在V匪10的空間中映射共 享內(nèi)存,并將共享區(qū)域的起始地址以及大小等信息寫入Domain特定服務(wù)核配置模塊2管理
的信息結(jié)構(gòu),共享內(nèi)存映射成功后對應(yīng)的服務(wù)核上的服務(wù)代碼開始運(yùn)行。 HVM Domainll中的混合虛擬化模塊6通過寫共享內(nèi)存的方式發(fā)送服務(wù)請求,服務(wù)
請求也可以由運(yùn)行在用戶態(tài)的特定應(yīng)用程序發(fā)出,通過將現(xiàn)有操作系統(tǒng)用戶態(tài)、內(nèi)核態(tài)模
塊數(shù)據(jù)和控制方法交由混合虛擬化模塊6代理發(fā)送。服務(wù)請求發(fā)送后,V匪10中的請求查詢
模塊8將會按照一定頻率查詢這些請求,并把這些請求交由服務(wù)調(diào)度器模塊5派發(fā)到對應(yīng)
的服務(wù)核。服務(wù)核會根據(jù)服務(wù)調(diào)度器模塊5中的調(diào)度策略執(zhí)行自己的任務(wù)隊(duì)列,當(dāng)服務(wù)核
將服務(wù)請求執(zhí)行完畢后,把處理結(jié)果通過共享內(nèi)存機(jī)制模塊7寫回共享內(nèi)存。HVM Domain 11
中的混合虛擬化模塊6或者其他內(nèi)核模塊就可以讀到返回的服務(wù)執(zhí)行結(jié)果。 客戶機(jī)為了使用V匪10的服務(wù)核提供的服務(wù),首先需要與V匪10之間建立共享內(nèi)
存。位于HVM Domainll中的混合虛擬化模塊6向VMM10發(fā)送共享內(nèi)存映射的請求,V匪10
處理請求,并且建立了 V匪10與服務(wù)核共享的一塊內(nèi)存區(qū)域。 客戶機(jī)的請求和數(shù)據(jù)都是通過共享內(nèi)存機(jī)制傳遞給V匪10的,在共享內(nèi)存被創(chuàng)
建之前,服務(wù)核處于就緒狀態(tài),并不真正開始提供服務(wù),而一旦共享內(nèi)存創(chuàng)建成功,服務(wù)調(diào)
度器就會通過服務(wù)請求查詢模塊查詢新到的請求,同時(shí)會把合適的請求派發(fā)到服務(wù)核上。
HVMDomainll中的混合虛擬化模塊6不僅負(fù)責(zé)映射共享內(nèi)存,而且也負(fù)責(zé)發(fā)送實(shí)際的服務(wù)
請求,HVM Domainll中可以擴(kuò)展該機(jī)制,即HVM Domainll的用戶態(tài)程序可以和安裝在內(nèi)核
態(tài)的混合虛擬化模塊6交互,使混合虛擬化模塊6代為執(zhí)行來自用戶態(tài)的特殊服務(wù)請求。
HVM Domainll與V匪10之間建立的共享內(nèi)存,在VMM 10中有統(tǒng)一的地址空間,在客戶機(jī)各
自操作系統(tǒng)內(nèi)部也有自己的映射空間,V匪IO中對這些共享內(nèi)存中的請求區(qū)域是統(tǒng)一管理
的,本發(fā)明中是采用了輪詢的同步通訊方式,也可以采用消息傳遞的方式。 HVM Domainll通過共享內(nèi)存發(fā)出服務(wù)請求后,服務(wù)調(diào)度器模塊5會通過請求查詢
模塊8對各個(gè)共享內(nèi)存區(qū)域的請求進(jìn)行查詢,并按照請求所屬的區(qū)域和類型派發(fā)到合適的
服務(wù)核,于是服務(wù)請求會被對應(yīng)的服務(wù)核執(zhí)行。大多數(shù)情況下,請求是由服務(wù)調(diào)度器模塊5
向服務(wù)核調(diào)度派發(fā)的,但是本發(fā)明實(shí)踐中也可以采用一種服務(wù)核直接輪詢對應(yīng)的共享內(nèi)存
區(qū)域, 一旦有請求,直接執(zhí)行,這種情況適用于實(shí)時(shí)性要求比較高的服務(wù),或者頻繁執(zhí)行并
決定著系統(tǒng)整體性能的關(guān)鍵服務(wù)。
權(quán)利要求
面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器,包括VMM中的通用調(diào)度器模塊,其特征在于,還包括管理域中的服務(wù)核請求解析模塊,VMM中的Domain特定服務(wù)核配置模塊、系統(tǒng)頂級調(diào)度器模塊、服務(wù)調(diào)度器模塊、共享內(nèi)存機(jī)制模塊及請求查詢模塊,HVMDomain中的混合虛擬化模塊,其中系統(tǒng)頂級調(diào)度器模塊中又包含平臺處理器核拓?fù)渥R別和分析子模塊以及服務(wù)核分配和回收子模塊;服務(wù)核請求解析模塊,用于HVM Domain創(chuàng)建時(shí)服務(wù)核的配置,負(fù)責(zé)將HVM Domain也就是客戶機(jī)創(chuàng)建時(shí)的配置文件中指明的服務(wù)核的類型和數(shù)量解析,向VMM發(fā)出服務(wù)核的創(chuàng)建請求;Domain特定服務(wù)核配置模塊則負(fù)責(zé)初步解析服務(wù)核請求解析模塊發(fā)來的HVMDomain的服務(wù)核創(chuàng)建請求然后發(fā)送給系統(tǒng)頂級調(diào)度器模塊,并在整個(gè)HVM Domain的生命周期內(nèi)管理其服務(wù)核相關(guān)的信息;系統(tǒng)頂級調(diào)度器模塊主要用來管理計(jì)算機(jī)平臺中能用的處理器核,并在全局范圍內(nèi)對通用調(diào)度器模塊和服務(wù)調(diào)度器模塊的能用處理器核資源位圖進(jìn)行調(diào)整,負(fù)責(zé)完成來自Domain特定服務(wù)核配置模塊中的請求,根據(jù)平臺處理器核拓?fù)渥R別和分析子模塊中的拓?fù)湫畔?,使用服?wù)核分配和回收子模塊創(chuàng)建服務(wù)核或者回收服務(wù)核;平臺處理器核拓?fù)渥R別和分析子模塊負(fù)責(zé)對系統(tǒng)中擁有的處理器核資源進(jìn)行識別,處理器核在被識別之后加入頂級調(diào)度器使用和管理的能用處理器核資源位圖中,初始化之后頂級調(diào)度器開始在這些處理器核上運(yùn)行;服務(wù)核分配和回收子模塊負(fù)責(zé)服務(wù)核的創(chuàng)建或者回收,從系統(tǒng)能用處理器核資源位圖中區(qū)分出服務(wù)核,并添入服務(wù)調(diào)度器模塊的能用處理器核資源位圖中,或者從服務(wù)調(diào)度器模塊的能用處理器核資源位圖中刪除服務(wù)核;服務(wù)調(diào)度器模塊負(fù)責(zé)服務(wù)核的管理和調(diào)度;共享內(nèi)存機(jī)制模塊負(fù)責(zé)響應(yīng)HVM Domain的映射請求,并在共享內(nèi)存建立之后,觸發(fā)請求查詢模塊;混合虛擬化模塊首先向VMM請求映射共享內(nèi)存,共享內(nèi)存機(jī)制模塊響應(yīng)HVM Domain的映射請求,在VMM中建立共享內(nèi)存區(qū)域;在共享內(nèi)存建立之后,混合虛擬化模塊發(fā)出HVMDomain對服務(wù)核的服務(wù)請求,這些請求被寫在共享內(nèi)存區(qū)域內(nèi);請求查詢模塊負(fù)責(zé)查詢HVM Domain所屬的共享內(nèi)存區(qū)域內(nèi)的對服務(wù)核的服務(wù)請求,并把這些請求發(fā)送到服務(wù)調(diào)度器模塊;其中,VMM代表虛擬監(jiān)控器,HVM代表硬件虛擬管理器,Domain代表域。
2. 根據(jù)權(quán)利要求1所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器,其特征在于, 所述系統(tǒng)頂級調(diào)度器模塊在系統(tǒng)初始化、HVM Domain創(chuàng)建、服務(wù)核創(chuàng)建請求、服務(wù)核回收、 HVM Domain銷毀、通用核和服務(wù)核比例調(diào)整、全局范圍內(nèi)的負(fù)載調(diào)整場合時(shí)被觸發(fā)。
3. 應(yīng)用權(quán)利要求1所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器的調(diào)度方法,其 特征在于,包括如下步驟步驟l,客戶機(jī)創(chuàng)建啟動(dòng)和服務(wù)核的創(chuàng)建請求發(fā)出;HVM Domain客戶機(jī)創(chuàng)建時(shí),在管理域中會有一個(gè)對應(yīng)的客戶機(jī)的創(chuàng)建配置文件,該文 件中會指明客戶機(jī)使用的vcpu的數(shù)量,以及與物理處理器核的綁定信息,同時(shí)該配置文件 中也會指明所需的服務(wù)核的類型和數(shù)量,具體的類型由不同的實(shí)施例中特殊指定和實(shí)現(xiàn); 管理域中的服務(wù)核請求解析模塊將該配置文件中的服務(wù)核的類型和數(shù)量解析,并將創(chuàng)建需求轉(zhuǎn)變成對VMM的超調(diào)用Hypercall,并將該超調(diào)用傳輸給VMM中的Domain特定服務(wù)核配 置模塊,而Domain特定服務(wù)核配置模塊在接管超調(diào)用Hypercall后,采用一個(gè)結(jié)構(gòu)體管理 新創(chuàng)建的HVM Domain的所有信息,包括服務(wù)核的配置信息,并初步解析超調(diào)用Hypercall, 然后觸發(fā)VMM中的系統(tǒng)頂級調(diào)度器模塊運(yùn)行;其中vcpu代表虛擬處理器,Hypercall代表 超級調(diào)用;步驟2,處理器核拓?fù)渥R別和分析以及服務(wù)核的分配;系統(tǒng)頂級調(diào)度器模塊中的處理器核拓?fù)渥R別和分析子模塊會對系統(tǒng)中擁有的處理器 核資源進(jìn)行識別,處理器核在被識別之后加入系統(tǒng)頂級調(diào)度器模塊使用和管理的能用處理 器核資源位圖中,初始化之后系統(tǒng)頂級調(diào)度器模塊開始在這些處理器核上運(yùn)行,直到這些 處理器核被劃分給VMM中的通用調(diào)度器模塊或者被分配成服務(wù)核接受VMM中的服務(wù)調(diào)度器 模塊的調(diào)度;系統(tǒng)初始化時(shí),系統(tǒng)頂級調(diào)度器模塊被初始化,系統(tǒng)頂級調(diào)度器模塊接到創(chuàng)建服務(wù)核 的請求后,首先根據(jù)平臺處理器核拓?fù)浜头治鲎幽K得到平臺處理器核的拓?fù)湫畔ⅲ捎?就近原則選擇和HVM Domain的vcpu綁定的物理處理器核相鄰的處理器核,如果vcpu沒有 設(shè)定需要綁定物理處理器核,則按照系統(tǒng)的整體策略,是性能優(yōu)先還是節(jié)能優(yōu)先的預(yù)定策 略進(jìn)行選擇,性能優(yōu)先時(shí),優(yōu)先選擇空閑的處理器核作為服務(wù)核,而節(jié)能優(yōu)先時(shí)則優(yōu)先選擇 超線程或者同一封裝內(nèi)的處理器核作為服務(wù)核;服務(wù)核選定之后,由系統(tǒng)頂級調(diào)度器模塊中的服務(wù)核分配和回收子模塊負(fù)責(zé)服務(wù)核的 最終創(chuàng)建過程,服務(wù)核分配和回收子模塊從系統(tǒng)能用處理器核資源位圖中區(qū)分出服務(wù)核, 并添入服務(wù)調(diào)度器模塊的能用處理器核資源位圖中,然后通過處理器間中斷IPI喚醒服務(wù) 核,并使它從指定的函數(shù)開始執(zhí)行;服務(wù)核被創(chuàng)建并開始執(zhí)行時(shí),并未真正開始提供服務(wù), 直到HVMDomain申請創(chuàng)建共享內(nèi)存區(qū)域之后,服務(wù)核才會被真正激活,主動(dòng)到共享內(nèi)存區(qū) 域輪詢?nèi)蝿?wù),或者被服務(wù)調(diào)度器模塊調(diào)度時(shí)才被激活提供服務(wù);服務(wù)核的回收是在服務(wù)核 所屬的HVMDomain被銷毀時(shí)觸發(fā)的,與創(chuàng)建的過程類似,系統(tǒng)頂級調(diào)度器模塊調(diào)用服務(wù)核 分配和回收子模塊進(jìn)行回收,并將回收的服務(wù)核進(jìn)行重新分配,根據(jù)系統(tǒng)的配置策略,將空 閑的服務(wù)核,加入到通用調(diào)度器模塊的能用處理器核資源位圖中,或加入到系統(tǒng)空閑資源 中;步驟3,兩級調(diào)度器對通用核和服務(wù)核調(diào)度;VMM啟動(dòng)初期,計(jì)算機(jī)平臺內(nèi)的所有處理器核都是由系統(tǒng)頂級處理器模塊管理和調(diào)度 的,隨著HVM Domain以及對應(yīng)的vcpu的創(chuàng)建,通用調(diào)度器模塊有了調(diào)度對象,被初始化并 在所管理的通用核上運(yùn)行;服務(wù)核創(chuàng)建之后,服務(wù)調(diào)度器模塊開始對服務(wù)核進(jìn)行調(diào)度,它會輪詢各個(gè)HVM Domain 與VMM的共享內(nèi)存區(qū)域的服務(wù)請求,調(diào)用請求查詢模塊獲得新的服務(wù)任務(wù)發(fā)送到服務(wù)調(diào)度 器模塊,服務(wù)調(diào)度器模塊根據(jù)任務(wù)所屬的服務(wù)核,將任務(wù)插入到該服務(wù)核的任務(wù)隊(duì)列,并觸 發(fā)服務(wù)核的運(yùn)行;如果服務(wù)核創(chuàng)建時(shí)被指定為直接輪詢模式,則不需要服務(wù)調(diào)度器模塊將 任務(wù)派發(fā)給服務(wù)核,服務(wù)核直接輪詢共享內(nèi)存區(qū)域獲得服務(wù)請求;步驟4,客戶機(jī)發(fā)出服務(wù)請求及對應(yīng)服務(wù)核響應(yīng)客戶機(jī)的請求;HVM Domain被創(chuàng)建并啟動(dòng)后,裝載HVM Domain中的混合虛擬化模塊,混合虛擬化模塊 向VMM發(fā)出映射共享內(nèi)存的請求,VMM中的共享內(nèi)存機(jī)制模塊響應(yīng)請求,在VMM的空間中映射共享內(nèi)存區(qū)域,并將共享內(nèi)存區(qū)域的起始地址以及大小信息寫入Domain特定服務(wù)核配 置模塊管理的信息結(jié)構(gòu)體中,共享內(nèi)存映射成功后對應(yīng)的服務(wù)核上的服務(wù)代碼開始運(yùn)行;混合虛擬化模塊通過寫共享內(nèi)存的方式發(fā)送服務(wù)請求,服務(wù)請求也能夠由運(yùn)行在用戶 態(tài)的特定應(yīng)用程序發(fā)出,通過將現(xiàn)有操作系統(tǒng)用戶態(tài)、內(nèi)核態(tài)模塊數(shù)據(jù)和控制方法交由混 合虛擬化模塊代理發(fā)送,服務(wù)請求發(fā)送后,VMM中的請求查詢模塊將會按照一定頻率查詢這 些請求,并把這些請求交由服務(wù)調(diào)度器模塊派發(fā)到對應(yīng)的服務(wù)核,服務(wù)核會根據(jù)服務(wù)調(diào)度 器模塊中的調(diào)度策略執(zhí)行自己的任務(wù)隊(duì)列,也能夠采用一種服務(wù)核直接輪詢對應(yīng)的共享內(nèi) 存區(qū)域的方式, 一旦有請求,直接執(zhí)行,這種情況適用于實(shí)時(shí)性要求比較高的服務(wù),或者頻 繁執(zhí)行并決定著系統(tǒng)整體性能的關(guān)鍵服務(wù);當(dāng)服務(wù)核將服務(wù)請求執(zhí)行完畢后,把處理結(jié)果 通過共享內(nèi)存機(jī)制模塊寫回共享內(nèi)存,混合虛擬化模塊或者HVM Domain中的其他內(nèi)核模塊 就能讀到返回的服務(wù)執(zhí)行結(jié)果。
4. 根據(jù)權(quán)利要求3中所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法,其特征在 于,所述步驟2中處理器核拓?fù)渥R別和分析子模塊會對平臺中擁有的處理器核資源進(jìn)行識 別,識別的主要根據(jù)為,是否在一個(gè)封裝內(nèi),是否共享二級緩存,是否是同一個(gè)核上的超線 程。
5. 根據(jù)權(quán)利要求3中所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法,其特征在 于,步驟2中所述服務(wù)核的分配采用就近原則,具體為如果vcpu是一個(gè)超線程,則服務(wù)核 從最鄰近的超線程優(yōu)先選擇,如果vcpu綁定到了一個(gè)處理器核,則服務(wù)核優(yōu)先從同處于一 個(gè)封裝內(nèi)的其它處理器核分配,更進(jìn)一步,如果同一封裝內(nèi)有些處理器核和vcpu綁定的處 理器核共享二級緩存,另一些不共享,則優(yōu)先選擇共享二級緩存的處理器核。
6. 根據(jù)權(quán)利要求3中所述的面向多核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度方法,其特征在 于,所述步驟4中HVM Domain與V匪之間建立的共享內(nèi)存,在VMM中有統(tǒng)一的地址空間,在 HVM Domain系統(tǒng)內(nèi)部也有自己的映射空間,VMM中對這些共享內(nèi)存中的請求區(qū)域是統(tǒng)一管 理的,對請求的管理采用輪詢的同步通訊方式,或采用消息傳遞的方式。
全文摘要
本發(fā)明公開了一種面向多核或眾核平臺的虛擬機(jī)監(jiān)控器非對稱調(diào)度器及其調(diào)度方法,基于現(xiàn)有的虛擬機(jī)監(jiān)控器VMM,為客戶操作系統(tǒng)提供了滿足特殊高性能需求的專門的服務(wù)核。本發(fā)明包括管理域中的服務(wù)核請求解析模塊,VMM中的Domain特定服務(wù)核配置模塊、系統(tǒng)頂級調(diào)度器模塊、服務(wù)調(diào)度器模塊、共享內(nèi)存機(jī)制模塊及請求查詢模塊,HVM Domain中的混合虛擬化模塊。本發(fā)明中的非對稱調(diào)度器不僅可以針對上層Domain的需求提供不同的服務(wù)核,而且在服務(wù)核的分配時(shí)考慮到物理平臺的拓?fù)浣Y(jié)構(gòu),比傳統(tǒng)的調(diào)度器提供了更強(qiáng)的靈活性和可擴(kuò)展性,同時(shí)為客戶操作系統(tǒng)提供了特定應(yīng)用類型的加速機(jī)制,改善了整個(gè)平臺的使用效率。
文檔編號G06F9/455GK101727351SQ20091024183
公開日2010年6月9日 申請日期2009年12月14日 優(yōu)先權(quán)日2009年12月14日
發(fā)明者張炯, 文成建, 白躍斌, 賀俊, 高小鵬, 龍翔 申請人:北京航空航天大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
久治县| 连平县| 石楼县| 三原县| 石门县| 株洲县| 应城市| 宁阳县| 商河县| 吉林市| 泸定县| 田阳县| 开平市| 恩施市| 交城县| 邢台县| 菏泽市| 搜索| 绥滨县| 万载县| 石阡县| 荔波县| 九龙县| 东城区| 伊宁县| 呼和浩特市| 洪雅县| 晋中市| 饶河县| 宁津县| 明水县| 司法| 庆阳市| 隆安县| 张家口市| 辉南县| 淮北市| 鸡泽县| 沙湾县| 莱西市| 阿尔山市|