本發(fā)明涉及一種用于部署儲(chǔ)存系統(tǒng)資源的方法,特別是涉及一種通過對(duì)執(zhí)行中工作負(fù)載的學(xué)習(xí)而部署儲(chǔ)存系統(tǒng)資源的方法。
背景技術(shù):
傳統(tǒng)上,儲(chǔ)存系統(tǒng)的管理人員一直被一個(gè)問題困擾:即如何部署“足夠的”資源給所有在儲(chǔ)存系統(tǒng)中運(yùn)作的工作負(fù)載。儲(chǔ)存系統(tǒng)可以用于私有網(wǎng)絡(luò)或云端服務(wù)中。舉例來說,如果一個(gè)系統(tǒng)存取儲(chǔ)存設(shè)備資源用來執(zhí)行電子郵件服務(wù)與erp(enterpriseresourceplanning,企業(yè)資源計(jì)劃)服務(wù)的工作負(fù)載,一個(gè)控制服務(wù)器必須妥善部署所有儲(chǔ)存設(shè)備與其它資源,諸如cpu(centralprocessingunit,中央處理單元)使用率與ssd(solidstatedisk,固態(tài)硬盤)緩存大小,以便當(dāng)工作負(fù)載加載時(shí),工作性能,例如每秒輸入輸出操作次數(shù)(input/outputpersecond,iops)是可被接受的。實(shí)作上,工作負(fù)載性能接受度的需求都是由系統(tǒng)的服務(wù)層級(jí)協(xié)議(servicelevelagreement,sla)制定的。一旦觀測(cè)到的性能小于服務(wù)層級(jí)協(xié)議中所要求的水平,那么管理人員需要調(diào)整資源分布,以便該性能將很快地達(dá)到要求的水平。為了達(dá)到服務(wù)層級(jí)協(xié)議的標(biāo)準(zhǔn),即使很少發(fā)生大量的工作負(fù)載要求,管理人員仍可能永久地指定過多額外的資源,以免臨時(shí)措手不及。這些額外的資源通常處于待機(jī)狀況,不單是資源的浪費(fèi),也很少有系統(tǒng)能負(fù)擔(dān)這么多的資源浪費(fèi)。因此有必要提出一種有效且實(shí)時(shí)的資源部署。一種傳統(tǒng)的資源布設(shè)儲(chǔ)存系統(tǒng)架構(gòu)如圖1所示。資源布設(shè)儲(chǔ)存系統(tǒng)由控制服務(wù)器1來操作??刂品?wù)器1具有許多用來執(zhí)行資源部署的模塊。舉例來說,控制服務(wù)器1可具有資源分析模塊11,用來偵測(cè)不同工作負(fù)載的需求,并分析對(duì)于該工作負(fù)載的最佳資源布設(shè)??刂品?wù)器1可進(jìn)一步具有規(guī)則引擎12,用來提供資源分析模塊11相關(guān)規(guī)則,以及儲(chǔ)存設(shè)備資源管理模塊13,用來執(zhí)行來自資源分析模塊11的布設(shè)指示。每一個(gè)布設(shè)指示可能有不同的 儲(chǔ)存設(shè)備資源2(例如hdd、ssd與緩存ssd使用的數(shù)量)部署、計(jì)算資源3(例如cpu使用率),與網(wǎng)絡(luò)資源4(例如執(zhí)行優(yōu)先次序)。通常來說,資源布設(shè)儲(chǔ)存系統(tǒng)是集中式控管的并具有其它輔助服務(wù)器來分散來自控制服務(wù)器1的工作量。
該儲(chǔ)存系統(tǒng)在運(yùn)作中遇到很多問題。首先,單一控制服務(wù)器1的工作量通常隨著工作負(fù)載增加而變重。儲(chǔ)存系統(tǒng)可能無法及時(shí)提供最佳的資源部署。即便輔助服務(wù)器協(xié)同運(yùn)作來操作儲(chǔ)存系統(tǒng),它們可以處理的是位于不同位置或網(wǎng)絡(luò)中分散群的資源;但服務(wù)器協(xié)同運(yùn)作不是簡(jiǎn)單的工作,卸除工作到其它服務(wù)器可能無法如預(yù)期般及時(shí)完成。繁重的工作量對(duì)服務(wù)器來說是不好的且可能浪費(fèi)更多資源。其次,基于不同應(yīng)用的工作負(fù)載,管理人員需要在規(guī)則引擎12中設(shè)立不同的規(guī)則或政策供資源分析模塊11遵循。這工作需要嫻熟的管理人員。即便如此,也常常發(fā)生特殊情況,管理人員必須要立即調(diào)整規(guī)則或政策以讓儲(chǔ)存系統(tǒng)平順運(yùn)作。重要的是控制服務(wù)器1并不具有人工智能也無法學(xué)習(xí)如何自適應(yīng),只能依靠管理人員的指示。
為了解決上述問題,需要一種通過對(duì)執(zhí)行中工作負(fù)載的學(xué)習(xí)而部署儲(chǔ)存系統(tǒng)資源的方法。
技術(shù)實(shí)現(xiàn)要素:
本段文字提取和編譯本發(fā)明的某些特點(diǎn)。其他特點(diǎn)將在后續(xù)的段落中被揭露。其目的在于在不脫離本發(fā)明構(gòu)思的前提下,各種的修改及類似的排列均在本發(fā)明的保護(hù)范圍內(nèi)。
為了解決上述問題,本發(fā)明提供一種通過對(duì)執(zhí)行中工作負(fù)載的學(xué)習(xí)而部署儲(chǔ)存系統(tǒng)資源的方法。該方法包括:
a、設(shè)定在特定場(chǎng)景與資源調(diào)整下用于儲(chǔ)存系統(tǒng)的性能參數(shù)與工作負(fù)載的服務(wù)層級(jí)協(xié)議間的偏離百分比的狀態(tài)-動(dòng)作模糊規(guī)則,及用于資源調(diào)整與獎(jiǎng)勵(lì)值的動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則,其中所述場(chǎng)景為所述性能參數(shù)的偏離方向與對(duì)應(yīng)的資源變化間的特定關(guān)系;
b、提供經(jīng)驗(yàn)矩陣,所述經(jīng)驗(yàn)矩陣的任一列中的字段都對(duì)應(yīng)到在特定狀態(tài)下 的獎(jiǎng)勵(lì)值,且任一行的字段都對(duì)應(yīng)到對(duì)于至少一個(gè)資源的調(diào)整的獎(jiǎng)勵(lì)值,其中所述經(jīng)驗(yàn)矩陣的所有字段數(shù)值初始值歸零,該所述初始值歸零的狀態(tài)是性能參數(shù)偏離百分比的特定組合;
c、搜集來自其中一個(gè)工作負(fù)載的目前性能參數(shù)偏離百分比,并為所述工作負(fù)載提供多個(gè)之后時(shí)間點(diǎn)上的預(yù)測(cè)性能參數(shù)偏離百分比;
d、隨機(jī)選擇一個(gè)場(chǎng)景,并將搜集到的所述工作負(fù)載的目前性能參數(shù)偏離百分比輸入到選擇的場(chǎng)景的狀態(tài)-動(dòng)作模糊規(guī)則的隸屬函數(shù)中,進(jìn)行模糊化、模糊推理,與結(jié)果匯總,得到第一動(dòng)作區(qū)間;
e、對(duì)所述第一動(dòng)作區(qū)間解模糊化以得到對(duì)至少一個(gè)資源的調(diào)整量;
f、在所述儲(chǔ)存系統(tǒng)中對(duì)所述工作負(fù)載執(zhí)行所述該調(diào)整量;
g、將提供的前述所述工作負(fù)載的預(yù)測(cè)性能參數(shù)偏離百分比輸入到動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則的隸屬函數(shù)中,進(jìn)行模糊化、模糊推理,與結(jié)果匯總,得到獎(jiǎng)勵(lì)區(qū)間;
h、對(duì)所述獎(jiǎng)勵(lì)區(qū)間解模糊化以得到偏離獎(jiǎng)勵(lì)值;
i、在所述經(jīng)驗(yàn)矩陣中與所述預(yù)測(cè)性能參數(shù)偏離百分比的狀態(tài)對(duì)應(yīng)的列中,尋找每一列中的最大值;
j、將所述偏離獎(jiǎng)勵(lì)值與來自步驟i中在先前時(shí)間上的選擇值進(jìn)行累加得到更新獎(jiǎng)勵(lì)值,并將所述更新獎(jiǎng)勵(lì)值取代該所述經(jīng)驗(yàn)矩陣中在所述性能參數(shù)偏離百分比的狀態(tài)與先前時(shí)間點(diǎn)動(dòng)作量下的字段的值;
k、重復(fù)步驟c到步驟j,直到每一字段滿足收斂條件,其中步驟d所使用的工作負(fù)載是對(duì)所有工作負(fù)載依序輪流選定執(zhí)行;及
l、選擇所述經(jīng)驗(yàn)矩陣中與觀測(cè)到的性能參數(shù)偏離百分比對(duì)應(yīng)的一列,并在所述儲(chǔ)存系統(tǒng)中執(zhí)行對(duì)應(yīng)的列中最大值字段的特定資源的調(diào)整。
在其中一個(gè)實(shí)施例中,其中如果步驟i中沒有所述先前時(shí)間點(diǎn),則所述更新獎(jiǎng)勵(lì)值設(shè)為0。
在其中一個(gè)實(shí)施例中,所述性能參數(shù)包含延遲時(shí)間、流通量、cpu負(fù)載、內(nèi)存使用狀況、或每秒輸入輸出操作次數(shù)。
在其中一個(gè)實(shí)施例中,所述資源包含ssd讀取緩存大小、ssd寫入緩存大小、cpu使用率、ram大小、塊狀輸入輸出帶寬、虛擬機(jī)數(shù)量、或配置儲(chǔ)存設(shè)備的數(shù)量。
在其中一個(gè)實(shí)施例中,時(shí)間點(diǎn)的數(shù)量為4或5。
在其中一個(gè)實(shí)施例中,所述收斂條件為對(duì)所有字段經(jīng)過學(xué)習(xí)階段后,獎(jiǎng)勵(lì)值保持不變,或在有限區(qū)間內(nèi)變動(dòng),而所述區(qū)間維持不變或隨時(shí)間縮減。
在其中一個(gè)實(shí)施例中,所述學(xué)習(xí)階段長(zhǎng)于5小時(shí)。
在其中一個(gè)實(shí)施例中,如果每一字段中的獎(jiǎng)勵(lì)值不隨時(shí)間維持不變,則用在上限與下限間的平均值與相同列中的其它獎(jiǎng)勵(lì)值進(jìn)行比較,以找出最大值用于所述資源的調(diào)整。
在其中一個(gè)實(shí)施例中,在步驟e之后包括步驟e1:如果所述資源的調(diào)整量超過所述資源的剩余量時(shí),則維持所述資源的量并發(fā)出警訊。
在其中一個(gè)實(shí)施例中,如果動(dòng)作導(dǎo)致資源的調(diào)整量落在所述資源的兩個(gè)連續(xù)調(diào)整值之間,則選擇較近的一個(gè)調(diào)整值。
在其中一個(gè)實(shí)施例中,步驟a中的設(shè)定狀態(tài)-動(dòng)作模糊規(guī)則由以下子步驟而獲得:
定義用于每一性能參數(shù)的語言值;
構(gòu)建描述所有所述語言值的程度的隸屬函數(shù);及
根據(jù)所述隸屬函數(shù)建構(gòu)所述狀態(tài)-動(dòng)作模糊規(guī)則。
在其中一個(gè)實(shí)施例中,步驟a中的動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則由以下子步驟而獲得:
定義用于資源變化百分比的每個(gè)區(qū)間、性能參數(shù)的每個(gè)變化百分比,與每一獎(jiǎng)勵(lì)值的量的語言值;
構(gòu)建描述所有性能參數(shù)偏離百分比、資源調(diào)整、與獎(jiǎng)勵(lì)值區(qū)間的程度的隸屬函數(shù);及
根據(jù)所述隸屬函數(shù)建構(gòu)所述動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則。
在其中一個(gè)實(shí)施例中,在步驟f中,如果一定數(shù)量的至少一個(gè)資源從所述工作負(fù)載中釋放,則給予較高的偏離獎(jiǎng)勵(lì)值。
在其中一個(gè)實(shí)施例中,在步驟j中在所述偏離獎(jiǎng)勵(lì)值累加前,每一獎(jiǎng)勵(lì)值均乘上具調(diào)校功能的伽馬值。
在其中一個(gè)實(shí)施例中,所述伽馬值位于0與1之間。
本發(fā)明的有益效果包括:
上述通過對(duì)執(zhí)行中工作負(fù)載的學(xué)習(xí)而部署儲(chǔ)存系統(tǒng)資源的方法,應(yīng)用于儲(chǔ)存系統(tǒng),利用狀態(tài)-動(dòng)作模糊規(guī)則與動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則,學(xué)習(xí)工作負(fù)載的性能參數(shù)從而得到資源的最佳動(dòng)態(tài)部署,無須人力介入操作。減輕了儲(chǔ)存系統(tǒng)管理員的工作量,并加強(qiáng)了該儲(chǔ)存系統(tǒng)的性能。
附圖說明
圖1為一個(gè)實(shí)施例中的傳統(tǒng)的資源布設(shè)儲(chǔ)存系統(tǒng)架構(gòu)的示意圖;
圖2為一個(gè)實(shí)施例中的通過對(duì)執(zhí)行中工作負(fù)載的學(xué)習(xí)而部署儲(chǔ)存系統(tǒng)資源的方法的流程示意圖;
圖3為一個(gè)實(shí)施例中的兩個(gè)工作負(fù)載的每秒輸入輸出操作次數(shù)的偏離百分比隨時(shí)間變化的示意圖;
圖4為一個(gè)實(shí)施例中的兩個(gè)工作負(fù)載的延遲時(shí)間偏離百分比隨時(shí)間變化的示意圖;
圖5為一個(gè)實(shí)施例中的系統(tǒng)的所有場(chǎng)景的列表;
圖6為一個(gè)實(shí)施例中的場(chǎng)景6中的所有狀態(tài)-動(dòng)作模糊規(guī)則的列表;
圖7為一個(gè)實(shí)施例中的每秒輸入輸出操作次數(shù)偏離百分比的隸屬函數(shù)示意圖;
圖8為一個(gè)實(shí)施例中的延遲時(shí)間偏離百分比的隸屬函數(shù)示意圖;
圖9為一個(gè)實(shí)施例中的所有動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則的列表;
圖10為一個(gè)實(shí)施例中的ssd讀取緩存大小的隸屬函數(shù)示意圖;
圖11為一個(gè)實(shí)施例中的cpu核心數(shù)的隸屬函數(shù)示意圖;
圖12為一個(gè)實(shí)施例中的變化的每秒輸入輸出操作次數(shù)的隸屬函數(shù)示意圖;
圖13為一個(gè)實(shí)施例中的變化的延遲時(shí)間的隸屬函數(shù)示意圖;
圖14為一個(gè)實(shí)施例中的獎(jiǎng)勵(lì)值的隸屬函數(shù)示意圖;
圖15為一個(gè)實(shí)施例中的經(jīng)驗(yàn)矩陣的示意圖;
圖16為一個(gè)實(shí)施例中的狀態(tài)列表;
圖17為一個(gè)實(shí)施例中的動(dòng)作列表;
圖18為一個(gè)實(shí)施例中的系統(tǒng)操作列表;
圖19為一個(gè)實(shí)施例中的在學(xué)習(xí)階段完成后的經(jīng)驗(yàn)矩陣示意圖。
具體實(shí)施方式
本發(fā)明將參照下述的實(shí)施方式而更具體地描述。
本發(fā)明的概念是在儲(chǔ)存系統(tǒng)內(nèi),依據(jù)執(zhí)行中多個(gè)工作負(fù)載的資源要求,觀測(cè)到及預(yù)測(cè)的性能參數(shù)偏離百分比從而找出對(duì)工作負(fù)載的最佳資源部署。在一個(gè)學(xué)習(xí)階段之后,儲(chǔ)存系統(tǒng)將知道如何隨時(shí)動(dòng)態(tài)安排“足夠的”資源給每一工作負(fù)載,以便所有的工作負(fù)載都不致違反服務(wù)層級(jí)協(xié)議(servicelevelagreement,sla)的要求。該學(xué)習(xí)階段為在一個(gè)預(yù)設(shè)的時(shí)間內(nèi),學(xué)習(xí)工作負(fù)載的要求以對(duì)該儲(chǔ)存系統(tǒng)作最佳資源調(diào)配。優(yōu)選的,該學(xué)習(xí)階段要大于5小時(shí),以便獲得足夠的學(xué)習(xí)數(shù)據(jù),資源浪費(fèi)可以被減少到最低程度。其中,性能參數(shù)指的是延遲時(shí)間、流通量、cpu(centralprocessingunit,中央處理單元)負(fù)載、內(nèi)存使用狀況、或每秒輸入輸出操作次數(shù)(input/outputpersecond,iops)。資源是任何用于服務(wù)層級(jí)協(xié)議中的性能參數(shù)要求的硬件。舉例來說,資源可以是ssd(solidstatedisk,固態(tài)硬盤)讀取緩存大小、ssd寫入緩存大小、cpu使用率、ram(randomaccessmemory,隨機(jī)存取存儲(chǔ)器)大小、塊狀輸入輸出帶寬、虛擬機(jī)(virtualmachine,vm)數(shù)量、或配置儲(chǔ)存設(shè)備,如hdd與ssd的數(shù)量。工作負(fù)載是該儲(chǔ)存系統(tǒng)所提供的一種服務(wù)。舉例來說,前述的電子郵件與erp服務(wù)、視頻串流、遠(yuǎn)程計(jì)算、云端儲(chǔ)存設(shè)備服務(wù)等等。當(dāng)用戶在線使用相關(guān)的服務(wù)時(shí),每一個(gè)工作負(fù)載具有一種隨時(shí)間變化的循環(huán)模式,例如erp服務(wù)為一家工廠的員工每周從周一上午8點(diǎn)到周五下午5點(diǎn)所使用,并在其它時(shí)段維持監(jiān)視功能。因?yàn)椴煌潭鹊臄?shù)據(jù)存取或計(jì)算,其表現(xiàn)的性能參數(shù)將隨資 源變化而增加或減少。一旦該系統(tǒng)掌握了所有工作負(fù)載的節(jié)奏,它便能自動(dòng)部署資源而無須管理人員干預(yù)。只要沒有其它的工作負(fù)載部署到該系統(tǒng)中且工作負(fù)載服務(wù)的用戶數(shù)量穩(wěn)定在一定的范圍內(nèi),該系統(tǒng)便無需再進(jìn)行學(xué)習(xí)階段,就能自動(dòng)持續(xù)部署下去。
如圖2所示,該圖為通過對(duì)執(zhí)行中工作負(fù)載的學(xué)習(xí)而部署儲(chǔ)存系統(tǒng)資源的方法的流程示意圖。在進(jìn)一步說明該方法前,要說明使用本發(fā)明的儲(chǔ)存系統(tǒng)的應(yīng)用場(chǎng)景及工作負(fù)載。本實(shí)施例中有兩個(gè)工作負(fù)載在此儲(chǔ)存系統(tǒng)中執(zhí)行。根據(jù)本發(fā)明的精神,并不限制工作負(fù)載的數(shù)量,只要儲(chǔ)存系統(tǒng)的容量能支撐該些工作負(fù)載。圖3所示為兩個(gè)工作負(fù)載(即工作負(fù)載a與工作負(fù)載b)每秒輸入輸出操作次數(shù)的偏離百分比隨時(shí)間的改變??v軸是每秒輸入輸出操作次數(shù)與服務(wù)層級(jí)協(xié)議中需求的偏離百分比。對(duì)每一工作負(fù)載而言,在服務(wù)層級(jí)協(xié)議中的每秒輸入輸出操作次數(shù)需求可能與其它的工作負(fù)載不同。然而,每秒輸入輸出操作次數(shù)偏離百分比可被用來隨時(shí)表示部署的資源距實(shí)際需求有多遠(yuǎn),而非使用“每秒輸入輸出操作次數(shù)”。對(duì)每一工作負(fù)載而言,不同的每秒輸入輸出操作次數(shù)的值代表1種狀態(tài)。橫軸顯示觀測(cè)到或預(yù)測(cè)的每秒輸入輸出操作次數(shù)偏離百分比所在時(shí)間?!?”意味過去的時(shí)間。舉例來說,-20是距現(xiàn)在20秒之前。正值的時(shí)間指的是未來的時(shí)間。因?yàn)闆]人能準(zhǔn)確知道未來的每秒輸入輸出操作次數(shù)偏離百分比,此時(shí)需要一種可靠的預(yù)測(cè)方法。任何能夠提供這樣服務(wù)的合適的方法、算法,或模塊都能使用。最好使用由相同發(fā)明人在美國(guó)專利申請(qǐng)案第14/290,533號(hào)中所提供的一種儲(chǔ)存設(shè)備流量模型來預(yù)測(cè)未來每秒輸入輸出操作次數(shù)偏離百分比。
依照本發(fā)明的精神,服務(wù)層級(jí)協(xié)議規(guī)定的性能參數(shù)的種類數(shù)量不限于一個(gè)。多于一種的性能參數(shù)可被用來決定儲(chǔ)存設(shè)備資源的部署。在本實(shí)施例中,第二性能參數(shù)為延遲時(shí)間。參見圖4。圖4顯示工作負(fù)載延遲時(shí)間偏離百分比隨時(shí)間的改變。相似地,“偏離百分比”的觀念也適用于延遲時(shí)間。延遲時(shí)間偏離百分比也能通過歷史資料預(yù)測(cè)。本發(fā)明可以結(jié)合目前與未來的每秒輸入輸出操作次數(shù)偏離百分比進(jìn)行實(shí)施。
本發(fā)明的步驟s01是設(shè)定狀態(tài)-動(dòng)作模糊規(guī)則與動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則。狀態(tài)-動(dòng)作模糊規(guī)則是為在特定場(chǎng)景與資源調(diào)整下用于儲(chǔ)存系統(tǒng)的性能參數(shù)偏離百分比(即每秒輸入輸出操作次數(shù)與延遲時(shí)間)與工作負(fù)載的服務(wù)層級(jí)協(xié)議而設(shè)定。動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則是為資源調(diào)整與獎(jiǎng)勵(lì)值而設(shè)定。事實(shí)上,幾乎所有提及到為工作負(fù)載而分配的資源,都或多或少影響每秒輸入輸出操作次數(shù)與延遲時(shí)間性能。為了簡(jiǎn)化說明并提供讀者全面的理解,僅在實(shí)施例中使用兩個(gè)資源:ssd讀取緩存大小(%)與cpu使用率(以核心數(shù)表示)。要強(qiáng)調(diào)的是可供工作負(fù)載調(diào)整的資源可能超過兩個(gè)。
此處,場(chǎng)景是性能參數(shù)的偏離方向與對(duì)應(yīng)的資源變化間的特定關(guān)系。參見圖5,圖5顯示系統(tǒng)中所有的場(chǎng)景。根據(jù)資源與性能參數(shù)的組合,有8個(gè)場(chǎng)景(“x”指的是沒影響;“+”指的是增加;“-”指的是減少)。對(duì)每一個(gè)工作負(fù)載來說,當(dāng)ssd讀取緩存大小及/或cpu核心數(shù)(資源)變化到某個(gè)程度,每秒輸入輸出操作次數(shù)與延遲時(shí)間也將會(huì)改變。同時(shí),假設(shè)一個(gè)資源僅影響特定性能參數(shù)的偏離方向。舉例來說,在場(chǎng)景1中,cpu核心數(shù)的數(shù)量?jī)H影響每秒輸入輸出操作次數(shù),ssd讀取緩存大小僅影響延遲時(shí)間。也就是說,cpu核心數(shù)的增減導(dǎo)致每秒輸入輸出操作次數(shù)的增減,而讀取緩存大小的增減導(dǎo)致延遲時(shí)間的增減。
依照本發(fā)明,資源的調(diào)整是定量化的而非連續(xù)的。調(diào)整量(增加或減少)應(yīng)該是定量化的。舉例來說,ssd讀取緩存大小的調(diào)整可以是1%、2%、3%、4%、5%,或6%(比目前多),或-1%、-2%、-3%、-4%、-5%,或-6%(比目前少)。不存在中間值,諸如1.52%。這是為了簡(jiǎn)化模糊化的操作。相似地,cpu使用率的調(diào)整可以是增加1、2,或3個(gè)cpu核心數(shù),它也可以是減少1、2,或3個(gè)使用的cpu核心數(shù)。
依照模糊邏輯,給儲(chǔ)存系統(tǒng)性能參數(shù)偏離百分比的狀態(tài)-動(dòng)作模糊規(guī)則的設(shè)定可通過以下子步驟而獲得。首先,定義每一性能參數(shù)的語言值(linguisticvalue)。以本實(shí)施例的場(chǎng)景6為例,圖6的列表顯示場(chǎng)景6所有狀態(tài)-動(dòng)作模糊規(guī)則。如果延遲時(shí)間偏離百分比是正值,它意味著目前工作負(fù)載的延遲時(shí)間比服務(wù)層級(jí)協(xié)議中要求的更快。相反地,如果延遲時(shí)間偏離百分比是負(fù)值,則指目 前工作負(fù)載的延遲時(shí)間比服務(wù)層級(jí)協(xié)議中要求的更慢?!爸行浴币馕堆舆t時(shí)間偏離百分比是0,目前工作負(fù)載的延遲時(shí)間和服務(wù)層級(jí)協(xié)議要求的相同。相似地,如果每秒輸入輸出操作次數(shù)偏離百分比是正值,它意味著目前工作負(fù)載的每秒輸入輸出操作次數(shù)比服務(wù)層級(jí)協(xié)議中要求的較高。相反地,如果每秒輸入輸出操作次數(shù)偏離百分比是負(fù)值,則指目前工作負(fù)載的每秒輸入輸出操作次數(shù)比服務(wù)層級(jí)協(xié)議中要求的較低?!爸行浴币馕睹棵胼斎胼敵霾僮鞔螖?shù)偏離百分比為0,目前工作負(fù)載的每秒輸入輸出操作次數(shù)和服務(wù)層級(jí)協(xié)議要求的相同。更快、更慢、較高、較低,與中性是所謂的語言值。
接著,下一個(gè)子步驟是構(gòu)建描述所有語言值的程度的隸屬函數(shù)。參見圖7與圖8。圖7顯示用于每秒輸入輸出操作次數(shù)偏離百分比的隸屬函數(shù),圖8顯示用于延遲時(shí)間偏離百分比的隸屬函數(shù)。隸屬函數(shù)的程度可能對(duì)某些每秒輸入輸出操作次數(shù)偏離百分比有不同的值。這些每秒輸入輸出操作次數(shù)偏離百分比可被視作多語言值。舉例來說,每秒輸入輸出操作次數(shù)的程度介于-10%與-30%間可屬于較低或中性且有不同的程度值,ssd讀取緩存大小與cpu核心數(shù)可在這種情況下變化。要注意的是,雖然狀態(tài)-動(dòng)作模糊規(guī)則可能在所有場(chǎng)景中是不同的,但隸屬函數(shù)仍是一致的。圖7與圖8僅是本發(fā)明隸屬函數(shù)的一種實(shí)施例,它們不是用來限制隸屬函數(shù)的應(yīng)用。當(dāng)然,隸屬函數(shù)的變化不一定是線性的,也可以包含部分的曲線段。
最后一個(gè)子步驟是根據(jù)隸屬函數(shù)構(gòu)建狀態(tài)-動(dòng)作模糊規(guī)則。狀態(tài)-動(dòng)作模糊規(guī)則應(yīng)提供讀取緩存大小與cpu核心數(shù)的調(diào)整。在圖6中的單個(gè)方格中顯示的動(dòng)作處于個(gè)別的每秒輸入輸出操作次數(shù)偏離百分比與延遲時(shí)間偏離百分比的情況下,構(gòu)成了用于場(chǎng)景6的狀態(tài)-動(dòng)作模糊規(guī)則。舉例來說,括號(hào)a3字段指的是一種狀態(tài)-動(dòng)作模糊規(guī)則:如果延遲時(shí)間偏離百分比較快且每秒輸入輸出操作次數(shù)偏離百分比較低,則移除(一部分)ssd讀取緩存大小與cpu核心數(shù)。隸屬函數(shù)能依照儲(chǔ)存系統(tǒng)管理人員的經(jīng)驗(yàn)與歷史數(shù)據(jù)而設(shè)定。隸屬函數(shù)的細(xì)部設(shè)計(jì)在此不詳細(xì)的說明。
相似地,動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則可以由以下的子步驟而獲得。首先,定義用于 資源變化百分比的每個(gè)區(qū)間、性能參數(shù)的每個(gè)變化百分比,與每一獎(jiǎng)勵(lì)值的量的語言值。狀態(tài)-動(dòng)作模糊規(guī)則中對(duì)相同資源的性能參數(shù)偏離百分比所使用的語言值可以被繼承,也可以使用重新定義的語言值。圖9是所有動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則的列表。再一次強(qiáng)調(diào),增加、中性、移除、更遠(yuǎn)、不變、更近、低、高、非常低,及非常高都是各自標(biāo)的語言值。規(guī)則1到規(guī)則9顯示使用較多的資源,給予較少的獎(jiǎng)勵(lì)值。規(guī)則10到規(guī)則12及規(guī)則13到規(guī)則15顯示較近于服務(wù)層級(jí)協(xié)議要求的每秒輸入輸出操作次數(shù),給予較高的獎(jiǎng)勵(lì)值。
接著,構(gòu)建描述所有性能參數(shù)偏離百分比、資源調(diào)整,與獎(jiǎng)勵(lì)值區(qū)間的程度的隸屬函數(shù)。請(qǐng)見圖10到圖14,它們各自表示用于描述ssd讀取緩存大小調(diào)整、cpu核心數(shù)調(diào)整、每秒輸入輸出操作次數(shù)的變化,延遲時(shí)間的變化,與獎(jiǎng)勵(lì)值的隸屬函數(shù)。隸屬函數(shù)可由儲(chǔ)存系統(tǒng)的管理人員,依照個(gè)人經(jīng)驗(yàn)與歷史數(shù)據(jù)來定義。最后,動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則根據(jù)這些隸屬函數(shù)而構(gòu)建。
本發(fā)明的步驟s02提供的是一個(gè)經(jīng)驗(yàn)矩陣。該經(jīng)驗(yàn)矩陣可儲(chǔ)存于該儲(chǔ)存系統(tǒng)的內(nèi)存或較小的儲(chǔ)存設(shè)備中,它的內(nèi)容能夠被更新從而為儲(chǔ)存系統(tǒng)來學(xué)習(xí)資源的部署。任一列中的字段都對(duì)應(yīng)到在特定狀態(tài)下的獎(jiǎng)勵(lì)值,且任一行的字段都對(duì)應(yīng)到對(duì)于至少一個(gè)資源的調(diào)整的獎(jiǎng)勵(lì)值。此處,狀態(tài)指的是性能參數(shù)偏離百分比的特定組合,例如每秒輸入輸出操作次數(shù)偏離20%及延遲時(shí)間偏離-10%。在學(xué)習(xí)運(yùn)作的開始狀態(tài)下,經(jīng)驗(yàn)矩陣所有字段數(shù)值初始值歸零。經(jīng)驗(yàn)矩陣的一個(gè)實(shí)施例在圖15中顯示。經(jīng)驗(yàn)矩陣由“0”字段所構(gòu)成。要注意的是每一字段可能會(huì)在稍后更新。因此,字段中的分?jǐn)?shù)是由累加所有時(shí)間點(diǎn)的獎(jiǎng)勵(lì)值而計(jì)算獲得。參見圖16,該圖表示該實(shí)施例中所有可能的狀態(tài)。每一狀態(tài)代表性能參數(shù)偏離百分比的一種特定組合。性能參數(shù)的偏離百分比可以是一個(gè)固定值或介于一個(gè)范圍內(nèi)的數(shù)值。在這實(shí)施例中是介于一個(gè)范圍內(nèi)的數(shù)值。舉例來說,狀態(tài)s14包含一個(gè)范圍的每秒輸入輸出操作次數(shù)偏離百分比,由-25%到0,及一個(gè)范圍的延遲時(shí)間偏離百分比,由-50%到-25%。參見圖17,圖17示出了該實(shí)施例中的動(dòng)作。每一操作表示ssd讀取緩存及cpu核心數(shù)的改變量。舉例來說,a15移除0到15%的ssd讀取緩存并維持cpu核心數(shù)不變。
接著,本發(fā)明的步驟s03是搜集來自其中一個(gè)工作負(fù)載(工作負(fù)載a與工作負(fù)載b中的一個(gè))的目前性能參數(shù)偏離百分比,并為前述工作負(fù)載提供多個(gè)之后時(shí)間點(diǎn)上的預(yù)測(cè)性能參數(shù)偏離百分比。本發(fā)明描述中使用的“時(shí)間點(diǎn)”指的是特定的時(shí)間,包含未來與現(xiàn)在。參見圖18,圖18是該系統(tǒng)操作的一個(gè)實(shí)施例,而關(guān)于細(xì)節(jié)會(huì)在稍后步驟中詳細(xì)說明。時(shí)間點(diǎn)分別是0秒、10秒、20秒、30秒,與40秒。在0秒,即目前時(shí)間,所有性能參數(shù)值是由觀察工作負(fù)載而搜集的。其余未來的時(shí)間點(diǎn)則是根據(jù)以往搜集的真實(shí)數(shù)據(jù)預(yù)測(cè)出來的。未來數(shù)據(jù)預(yù)測(cè)的方式已在前面敘述過,此處不再重復(fù)。實(shí)際操作中,用于預(yù)測(cè)性能參數(shù)的未來時(shí)間點(diǎn)的數(shù)量可以是4或5個(gè)。
讓儲(chǔ)存系統(tǒng)學(xué)習(xí)資源的部署的想法是使用某一時(shí)間點(diǎn)上來自工作負(fù)載的性能參數(shù)偏離百分比以及預(yù)測(cè)值以從中取得獎(jiǎng)勵(lì)值。每一工作負(fù)載的觀測(cè)到及預(yù)測(cè)的性能參數(shù)偏離百分比將交替使用以在連續(xù)時(shí)間點(diǎn)上計(jì)算。此處,該實(shí)施例在服務(wù)層級(jí)協(xié)議設(shè)定的每秒輸入輸出操作次數(shù)與延遲時(shí)間對(duì)工作負(fù)載a來說是5000與250,對(duì)工作負(fù)載b來說是4000與200。在時(shí)間0秒(目前),工作負(fù)載a的性能參數(shù)偏離百分比已搜集,工作負(fù)載a性能參數(shù)預(yù)測(cè)偏離百分比也已提供。此時(shí),每秒輸入輸出操作次數(shù)是3000且延遲時(shí)間150。每秒輸入輸出操作次數(shù)偏離百分比與延遲時(shí)間偏離百分比各自為-40%與-40%。預(yù)測(cè)的每秒輸入輸出操作次數(shù)、延遲時(shí)間偏離百分比(在括號(hào)內(nèi)成對(duì)顯示)在未來10秒、20秒、30秒與40秒分別是(-20%,-30%)、(0%,-5%)、(20%,15%)、與(10%,-5%)。
本發(fā)明的步驟s04是隨機(jī)選擇一個(gè)場(chǎng)景,并將搜集到的工作負(fù)載a的性能參數(shù)偏離百分比輸入到選擇的場(chǎng)景的狀態(tài)-動(dòng)作模糊規(guī)則的隸屬函數(shù)中,進(jìn)行模糊化、模糊推理,與結(jié)果匯總,得到第一動(dòng)作區(qū)間。在0秒,選擇了場(chǎng)景8,應(yīng)用場(chǎng)景8的狀態(tài)-動(dòng)作模糊規(guī)則。接著,步驟s05,對(duì)第一動(dòng)作區(qū)間解模糊化(defuzzify)以得到對(duì)至少一個(gè)資源的調(diào)整量。有很多的方法可用于解模糊化,本發(fā)明并未限定使用哪一種,它可以依照觀測(cè)的系統(tǒng)操作或基于管理人員的經(jīng)驗(yàn)而選擇。根據(jù)上述的計(jì)算ssd讀取緩存的變化量是增加20%,cpu核心數(shù)變化量是-2。cpu核心數(shù)最小是1。增加的20%ssd讀取緩存與減少的2個(gè)cpu核心數(shù)就是 調(diào)整量。接著,步驟s06,在該儲(chǔ)存系統(tǒng)中對(duì)工作負(fù)載a執(zhí)行該調(diào)整量。如果一動(dòng)作導(dǎo)致資源的調(diào)整量落在該資源的兩個(gè)連續(xù)調(diào)整值之間,則選擇較近的調(diào)整值。
下一步,步驟s07,通過將提供的工作負(fù)載a的預(yù)測(cè)性能參數(shù)偏離百分比輸入到動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則的隸屬函數(shù)中,進(jìn)行模糊化、模糊推理,與結(jié)果匯總,得到獎(jiǎng)勵(lì)區(qū)間。即輸入(-20%,-30%)、(0%,-5%)、(20%,15%),與(10%,-5%)到動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則的隸屬函數(shù)中。步驟s08,接著對(duì)該獎(jiǎng)勵(lì)區(qū)間解模糊化以得到偏離獎(jiǎng)勵(lì)值。依照本發(fā)明的精神,該偏離獎(jiǎng)勵(lì)值將會(huì)在下一個(gè)時(shí)間點(diǎn)(10秒)獲得。步驟s09,在該經(jīng)驗(yàn)矩陣中與這些預(yù)測(cè)性能參數(shù)偏離百分比的狀態(tài)對(duì)應(yīng)的列中,尋找每一列中的最大值。對(duì)于(-20%,-30%)、(0%,-5%)、(20%,15%),與(10%,-5%)的每秒輸入輸出操作次數(shù)及延遲時(shí)間,對(duì)應(yīng)的狀態(tài)各為s14、s15、s22,與s21。在第15圖中的經(jīng)驗(yàn)矩陣,最大值分別是0、0、0,與0(開始狀態(tài))。
接著,步驟s10,將偏離獎(jiǎng)勵(lì)值與來自步驟s09中在先前時(shí)間上的選擇值進(jìn)行累加得到更新獎(jiǎng)勵(lì)值,并將該更新獎(jiǎng)勵(lì)值取代該經(jīng)驗(yàn)矩陣中在該些性能參數(shù)偏離百分比的狀態(tài)與先前時(shí)間點(diǎn)動(dòng)作量下的字段的值。步驟s11,重復(fù)步驟s03到步驟s10直到每一字段滿足收斂條件。步驟s04所使用的工作負(fù)載是對(duì)所有工作負(fù)載依序輪流選定執(zhí)行,也就是第一輪的學(xué)習(xí)是基于工作負(fù)載a的數(shù)據(jù),第二輪的學(xué)習(xí)是基于工作負(fù)載b的數(shù)據(jù)。接著,第三輪的學(xué)習(xí)是基于工作負(fù)載a的數(shù)據(jù),而第四輪的學(xué)習(xí)是基于工作負(fù)載b的數(shù)據(jù)等等。目前是處于第一輪。對(duì)步驟s09來說沒有先前時(shí)間點(diǎn),更新獎(jiǎng)勵(lì)值在一開始時(shí)設(shè)為0。
在時(shí)間10秒,對(duì)工作負(fù)載b來說,每秒輸入輸出操作次數(shù)偏離百分比是0%,延遲時(shí)間偏離百分比是15%。預(yù)測(cè)每秒輸入輸出操作次數(shù)與延遲時(shí)間的偏離百分比在未來20秒、30秒、40秒與50秒分別是(-10%,15%)、(10%,-5%)、(20%,-30%),與(10%,-50%)。它們分屬s16、s22、s20,與s19。以這些數(shù)據(jù)再次重復(fù)步驟s03到s11。計(jì)算得到在0秒的更新獎(jiǎng)勵(lì)值為146。因此,經(jīng)驗(yàn)矩陣的字段(s8,a11)更新為146。在20秒時(shí),回歸到工作負(fù)載a。每秒輸入輸出操作次數(shù) 偏離百分比為-28%,延遲時(shí)間偏離百分比為-8%。預(yù)測(cè)每秒輸入輸出操作次數(shù)與延遲時(shí)間的偏離百分比在未來30秒、40秒、50秒,與60秒分別是(20%,15%)、(10%,-5%)、(-5%,-22%),與(-18%,-35%)。它們分屬s22、s21、s15,與s14。以這些數(shù)據(jù)再次重復(fù)步驟s03到s11,計(jì)算得到在10秒的更新獎(jiǎng)勵(lì)值為-59。這些步驟一直持續(xù)下去。如上所述,這些步驟或?qū)W習(xí)階段應(yīng)在每一字段滿足收斂條件時(shí)停止。收斂條件是對(duì)所有字段來說,獎(jiǎng)勵(lì)值保持不變,或在經(jīng)過學(xué)習(xí)階段后在有限區(qū)間內(nèi)變動(dòng)。該區(qū)間可能維持不變或隨時(shí)間縮減。舉例來說,字段可能具有一個(gè)固定的最終累計(jì)獎(jiǎng)勵(lì)值,例如588,它也可以在563到607(區(qū)間)之間變動(dòng)。
本發(fā)明的最后一個(gè)步驟s12,選擇經(jīng)驗(yàn)矩陣中與觀測(cè)到的性能參數(shù)偏離百分比對(duì)應(yīng)的一列,并在該儲(chǔ)存系統(tǒng)中執(zhí)行對(duì)應(yīng)的列中最大值字段的特定資源的調(diào)整。為了有較好的理解,請(qǐng)參見圖19。圖19是學(xué)習(xí)階段后的經(jīng)驗(yàn)矩陣。當(dāng)它應(yīng)用到系統(tǒng)中時(shí),第一步驟是決定觀測(cè)到的性能參數(shù)偏離百分比。如果觀測(cè)到的每秒輸入輸出操作次數(shù)與延遲時(shí)間偏離百分比分別是26%與35%,此時(shí)就處于s29。只要找出s29中的最大值(277)并執(zhí)行對(duì)應(yīng)的動(dòng)作(a28)即可。系統(tǒng)中資源的部署可由圖19的經(jīng)驗(yàn)矩陣自動(dòng)執(zhí)行。
在步驟s10中,在對(duì)偏離獎(jiǎng)勵(lì)值累加前,每一選擇的值可進(jìn)一步乘以具有調(diào)校功能的伽馬值。該伽馬值位于0與1之間。如果伽馬值接近0,表示傾向考慮實(shí)時(shí)的獎(jiǎng)勵(lì)值。如果伽馬值接近1,表示傾向考慮未來的獎(jiǎng)勵(lì)值。如果每一字段中的獎(jiǎng)勵(lì)值不隨時(shí)間維持不變,則用在上限與下限間的平均值與相同列中的其它獎(jiǎng)勵(lì)值進(jìn)行比較,以找出最大值用于該資源的調(diào)整。
本發(fā)明的一個(gè)特點(diǎn)是給予獎(jiǎng)勵(lì)值的方式。儲(chǔ)存系統(tǒng)不是獨(dú)立地監(jiān)視及學(xué)習(xí)工作負(fù)載的模式。相反地,當(dāng)儲(chǔ)存系統(tǒng)對(duì)一個(gè)工作負(fù)載部署資源時(shí),它將考慮未來其它工作負(fù)載的需求。如果目前儲(chǔ)存系統(tǒng)進(jìn)行的工作負(fù)載使用的資源在未來會(huì)超過其實(shí)際所需,超過的部分會(huì)被釋放。舉例來說,如果工作負(fù)載a使用3個(gè)cpu核心數(shù)來運(yùn)作但實(shí)際上只需要2個(gè),多的一個(gè)就可以保留給工作負(fù)載b因工作負(fù)載b在未來數(shù)分鐘內(nèi)需要進(jìn)行更多的運(yùn)算。一個(gè)具體的實(shí)現(xiàn)方式是給予較高 的偏離獎(jiǎng)勵(lì)值如果至少一個(gè)資源的部分?jǐn)?shù)量在步驟s06中由一個(gè)工作負(fù)載中釋放出來。
在一個(gè)實(shí)施例中,本發(fā)明在步驟s05之后步驟s06之前進(jìn)一步包含:如果資源的調(diào)整量超過該資源的剩余量時(shí),則維持該資源的量并發(fā)出警訊。這能預(yù)防儲(chǔ)存系統(tǒng)免于供應(yīng)超過其本身的資源量。同時(shí),警示管理人員(通過顯示在其屏幕上的一段訊息來警示)以便他可以開始為該工作負(fù)載安裝新的資源。
本發(fā)明利用狀態(tài)-動(dòng)作模糊規(guī)則與動(dòng)作-獎(jiǎng)勵(lì)模糊規(guī)則供儲(chǔ)存系統(tǒng)學(xué)習(xí)如何部署資源。當(dāng)這套方法為一個(gè)系統(tǒng)管理人員所使用時(shí),他僅需開始時(shí)設(shè)立模糊規(guī)則與相關(guān)的隸屬函數(shù)。儲(chǔ)存系統(tǒng)將找出用于工作負(fù)載的最佳資源布署,本方法起始后便不需人為干涉。雖然對(duì)工作負(fù)載的資源部署可能無法完全解決目前工作負(fù)載所遭遇的問題,因?yàn)椴渴鹗莿?dòng)態(tài)的調(diào)整,該工作負(fù)載會(huì)在未來某個(gè)時(shí)間獲得補(bǔ)償。整體來看,所有工作負(fù)載的性能參數(shù)滿足及達(dá)到服務(wù)層級(jí)協(xié)議所要求的水平。然而,如果工作負(fù)載內(nèi)容已被修改或新的工作負(fù)載加到儲(chǔ)存系統(tǒng)中運(yùn)作,該方法就應(yīng)重新執(zhí)行一次以獲得新的經(jīng)驗(yàn)矩陣來使用。如果需要,該些模糊規(guī)則與相關(guān)的隸屬函數(shù)也要重設(shè)。
如上所述,集中式控管的儲(chǔ)存系統(tǒng)通常遭遇沉重的工作負(fù)載,而更多的資源或服務(wù)器需要用來解決這問題。本發(fā)明以一種分散但合作的代理人方式,提出解決該問題的方法。每一個(gè)工作負(fù)載能由儲(chǔ)存系統(tǒng)中的獨(dú)立模塊所追蹤及預(yù)測(cè),該獨(dú)立模塊比如是控制服務(wù)器中安裝的硬件或軟件。該些模塊扮演搜集網(wǎng)絡(luò)流量與來自特定資源的需求的代理人角色。它們分散地搜集數(shù)據(jù),然而,當(dāng)儲(chǔ)存系統(tǒng)需要對(duì)未來資源部署做出決定時(shí),搜集到的數(shù)據(jù)就可以分享(以經(jīng)驗(yàn)矩陣的形式),而推薦的數(shù)據(jù)可以交替使用。每一模塊也能從其它模塊上學(xué)習(xí)經(jīng)驗(yàn)。就這點(diǎn)來說,模塊間是相互合作的。因此,本發(fā)明避免集中式控管儲(chǔ)存系統(tǒng)的缺點(diǎn),并為應(yīng)用本發(fā)明提供的方法的儲(chǔ)存系統(tǒng)強(qiáng)化性能。
以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改 進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
符號(hào)說明:
1控制服務(wù)器;2儲(chǔ)存設(shè)備資源;3計(jì)算資源;4網(wǎng)絡(luò)資源;11資源分析模塊;12規(guī)則引擎;13儲(chǔ)存設(shè)備資源管理模塊。