用于在云網(wǎng)絡(luò)中進(jìn)行快速災(zāi)難恢復(fù)準(zhǔn)備的方法和設(shè)備的制作方法
【專利摘要】各種實(shí)施方式提供了一種用于在云網(wǎng)絡(luò)中提供快速災(zāi)難恢復(fù)準(zhǔn)備的方法和設(shè)備,所述方法和設(shè)備主動(dòng)檢測(cè)災(zāi)難事件并快速分配云資源??焖贋?zāi)難恢復(fù)準(zhǔn)備可以通過(guò)在恢復(fù)業(yè)務(wù)的激增沖擊恢復(fù)應(yīng)用/資源之前主動(dòng)增加恢復(fù)應(yīng)用/資源的性能來(lái)縮短恢復(fù)時(shí)間目標(biāo)(RTO)。而且,快速災(zāi)難恢復(fù)準(zhǔn)備可以通過(guò)比在“正常操作”期間更快地增加性能來(lái)縮短RTO,在“正常操作”中在負(fù)載超過(guò)使用閾值后通過(guò)一段時(shí)間的適度增加來(lái)提高性能。
【專利說(shuō)明】用于在云網(wǎng)絡(luò)中進(jìn)行快速災(zāi)難恢復(fù)準(zhǔn)備的方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明總體上涉及一種用于提供云網(wǎng)絡(luò)中的災(zāi)難恢復(fù)的方法和設(shè)備。
【背景技術(shù)】
[0002] 本部分介紹有助于促進(jìn)對(duì)本發(fā)明更好地理解的方面。因此,要從這個(gè)角度閱讀本 部分的描述,而不應(yīng)該將本部分的描述理解為承認(rèn)什么是現(xiàn)有技術(shù),什么不是現(xiàn)有技術(shù)。對(duì) 地理冗余數(shù)據(jù)中心的服務(wù)恢復(fù)可以保證使主數(shù)據(jù)中心站點(diǎn)對(duì)服務(wù)不可用的不可抗力或?yàn)?zāi) 難事件后的業(yè)務(wù)連續(xù)性。在一些已知的云網(wǎng)絡(luò)災(zāi)難恢復(fù)方案中,用于應(yīng)用的云資源基于傳 統(tǒng)的資源分配方案被分配。這些方案通常增大和縮小分配的應(yīng)用資源以響應(yīng)由災(zāi)難事件造 成的新模式的進(jìn)入的應(yīng)用請(qǐng)求。
[0003] 在一些其他的已知的災(zāi)難恢復(fù)方案中,系統(tǒng)的某些部分可以包括過(guò)剩的資源,從 而滿足預(yù)計(jì)的災(zāi)難恢復(fù)資源需求。
【發(fā)明內(nèi)容】
[0004] 各種實(shí)施方式提供了一種用于在云網(wǎng)絡(luò)中提供快速災(zāi)難恢復(fù)準(zhǔn)備的方法和設(shè)備, 所述方法和設(shè)備主動(dòng)檢測(cè)災(zāi)難事件并快速分配云資源??焖贋?zāi)難恢復(fù)準(zhǔn)備可以通過(guò)在恢復(fù) 業(yè)務(wù)的激增沖擊恢復(fù)應(yīng)用/資源之前主動(dòng)增加恢復(fù)應(yīng)用/資源的性能來(lái)縮短恢復(fù)時(shí)間目標(biāo) (RT0)--需要在災(zāi)難事件之后還原恢復(fù)數(shù)據(jù)中心中的用戶服務(wù)的時(shí)間。而且,快速災(zāi)難恢 復(fù)準(zhǔn)備可以通過(guò)比在"正常操作"期間更快地增加性能來(lái)縮短RT0,在"正常操作"中在負(fù) 載超過(guò)使用閾值后通過(guò)一段時(shí)間的適度增加來(lái)提高性能。有利地,檢測(cè)災(zāi)難事件并安排快 速擴(kuò)大云網(wǎng)絡(luò)資源到恢復(fù)站點(diǎn)降低了網(wǎng)絡(luò)阻塞、飽和或超載的風(fēng)險(xiǎn)而不需要保留過(guò)剩的資 源,從而加速了對(duì)受影響用戶的服務(wù)恢復(fù)。
[0005] 在一個(gè)實(shí)施方式中,提供了一種用于提供快速災(zāi)難恢復(fù)準(zhǔn)備的設(shè)備。該設(shè)備包括 數(shù)據(jù)存儲(chǔ)器和通信耦合到所述數(shù)據(jù)存儲(chǔ)器的處理器。所述處理器被配置成監(jiān)測(cè)來(lái)自第一網(wǎng) 絡(luò)資源的網(wǎng)絡(luò)度量,基于接收的網(wǎng)絡(luò)度量確定已經(jīng)發(fā)生了影響第二網(wǎng)絡(luò)資源的可用性的災(zāi) 難條件,并發(fā)送災(zāi)害預(yù)警警報(bào)消息到第三網(wǎng)絡(luò)資源。其中第一、第二和第三網(wǎng)絡(luò)資源是不同 的資源。
[0006] 在上述一些實(shí)施方式中,監(jiān)測(cè)的網(wǎng)絡(luò)度量包括監(jiān)測(cè)的業(yè)務(wù)流量。監(jiān)測(cè)的業(yè)務(wù)流量 包括一個(gè)或多個(gè)流量值。
[0007] 在上述一些實(shí)施方式中,對(duì)災(zāi)難條件發(fā)生的所述確定是基于檢測(cè)到監(jiān)測(cè)的業(yè)務(wù)流 量被中斷而做出的。
[0008] 在上述一些實(shí)施方式中,對(duì)災(zāi)難條件發(fā)生的所述確定是基于檢測(cè)到監(jiān)測(cè)的業(yè)務(wù)流 量具有異常的流量模式而做出的。
[0009] 在上述一些實(shí)施方式中,監(jiān)測(cè)的網(wǎng)絡(luò)度量包括預(yù)警機(jī)制信息。
[0010] 在上述一些實(shí)施方式中,所述預(yù)警機(jī)制信息為外部的傳感器信息。
[0011] 在上述一些實(shí)施方式中,對(duì)災(zāi)難條件發(fā)生的所述確定是基于置信水平而做出的。
[0012] 在上述一些實(shí)施方式中,對(duì)災(zāi)難條件發(fā)生的所述確定還包括處理器被編程以確定 災(zāi)難嚴(yán)重等級(jí)。
[0013] 在上述一些實(shí)施方式中,處理器還被編程以:分析多個(gè)網(wǎng)絡(luò)資源,基于多個(gè)網(wǎng)絡(luò)資 源確定災(zāi)難恢復(fù)建議,和基于災(zāi)難恢復(fù)建議選擇第三網(wǎng)絡(luò)資源。
[0014] 在上述一些實(shí)施方式中,處理器還被編程以基于災(zāi)難恢復(fù)建議選擇第三網(wǎng)絡(luò)資 源。
[0015] 在上述一些實(shí)施方式中,處理器還被編程以基于災(zāi)難恢復(fù)建議創(chuàng)建災(zāi)難預(yù)警警報(bào) 消息。
[0016] 在第二實(shí)施方式中,提供了一種用于提供快速災(zāi)難恢復(fù)準(zhǔn)備的設(shè)備。該設(shè)備包括 數(shù)據(jù)存儲(chǔ)器和通信耦合到所述數(shù)據(jù)存儲(chǔ)器的處理器。所述處理器被編程以:接收災(zāi)難預(yù)警 警報(bào)消息和執(zhí)行快速?gòu)椥栽黾硬僮?,所述快速?gòu)椥栽黾硬僮靼ǎ涸诔^(guò)使用閾值之前增 加網(wǎng)絡(luò)資源。
[0017] 在上述一些實(shí)施方式中,所述快速?gòu)椥栽黾硬僮鬟€包括當(dāng)超過(guò)使用閾值時(shí)大于分 配的資源的正常增加速率的兩倍的增加速率。
[0018] 在上述一些實(shí)施方式中,所述快速?gòu)椥栽黾硬僮鬟€包括基于接收的災(zāi)難預(yù)警警報(bào) 消息的增加速率。
[0019] 在上述一些實(shí)施方式中,處理器還被編程以:監(jiān)測(cè)業(yè)務(wù)負(fù)載,基于監(jiān)測(cè)的業(yè)務(wù)負(fù)載 確定災(zāi)難條件不存在,以及響應(yīng)于災(zāi)難條件不存在的確定,而執(zhí)行彈性縮小操作,所述彈性 縮小操作釋放至少一部分網(wǎng)絡(luò)資源的增加。
[0020] 在第三實(shí)施方式中,提供了一種用于提供快速災(zāi)難恢復(fù)準(zhǔn)備的系統(tǒng)。該系統(tǒng)包括: 至少一個(gè)網(wǎng)絡(luò)資源,多個(gè)數(shù)據(jù)中心,和通信耦合到所述至少一個(gè)網(wǎng)絡(luò)資源和所述多個(gè)數(shù)據(jù) 中心的資源監(jiān)視器。所述多個(gè)數(shù)據(jù)中心包括災(zāi)難影響的數(shù)據(jù)中心和恢復(fù)數(shù)據(jù)中心。資源監(jiān) 視器被編程為:從至少一個(gè)網(wǎng)絡(luò)資源接收網(wǎng)絡(luò)度量,基于接收的網(wǎng)絡(luò)度量確定發(fā)生了影響 災(zāi)難影響的數(shù)據(jù)中心的可用性的災(zāi)難條件,并發(fā)送災(zāi)害預(yù)警警報(bào)消息到恢復(fù)數(shù)據(jù)中心。所 述恢復(fù)數(shù)據(jù)中心被編程為:接收所述災(zāi)難預(yù)警警報(bào)消息并執(zhí)行快速?gòu)椥栽黾硬僮?,所述?速?gòu)椥栽黾硬僮靼ǎ涸诔^(guò)使用閾值之前增加網(wǎng)絡(luò)資源。
[0021] 在上述一些實(shí)施方式中,所述快速?gòu)椥栽黾硬僮鬟€包括當(dāng)超過(guò)使用閾值時(shí)大于分 配的資源的正常增加速率的兩倍的增加速率。
[0022] 在上述一些實(shí)施方式中,所述快速?gòu)椥栽黾硬僮鬟€包括基于接收的災(zāi)難預(yù)警警報(bào) 消息的增加速率。
[0023] 在第四實(shí)施方式中,提供了一種用于提供快速災(zāi)難恢復(fù)準(zhǔn)備的方法。該方法包括: 從第一網(wǎng)絡(luò)資源接收網(wǎng)絡(luò)度量,基于接收的網(wǎng)絡(luò)度量確定發(fā)生了影響第二網(wǎng)絡(luò)資源的可用 性的災(zāi)難條件,并發(fā)送災(zāi)害預(yù)警警報(bào)消息到第三網(wǎng)絡(luò)資源。其中第一、第二和第三網(wǎng)絡(luò)資源 是不同的資源。
[0024] 在上述一些實(shí)施方式中,所述接收的網(wǎng)絡(luò)度量包括監(jiān)測(cè)的業(yè)務(wù)流量,所述監(jiān)測(cè)的 業(yè)務(wù)流量包括一個(gè)或多個(gè)流量值。
[0025] 在上述一些實(shí)施方式中,對(duì)災(zāi)難條件發(fā)生的確定步驟是基于檢測(cè)到監(jiān)測(cè)的業(yè)務(wù)流 量被中斷而做出的。
[0026] 在上述一些實(shí)施方式中,對(duì)災(zāi)難條件發(fā)生的確定步驟是基于置信水平而做出的。
[0027] 在上述一些實(shí)施方式中,該方法還包括:接收災(zāi)難預(yù)警警報(bào)消息并執(zhí)行快速?gòu)椥?增加操作,所述快速?gòu)椥栽黾硬僮靼ǎ涸诔^(guò)使用閾值之前增加網(wǎng)絡(luò)資源。
【專利附圖】
【附圖說(shuō)明】
[0028] 附圖中示出了各種實(shí)施方式,其中:
[0029] 圖1示出了包括快速災(zāi)難恢復(fù)準(zhǔn)備架構(gòu)110的云網(wǎng)絡(luò);
[0030] 圖2描繪了示出用于在云網(wǎng)絡(luò)中提供快速災(zāi)難恢復(fù)準(zhǔn)備的方法200的實(shí)施方式的 流程圖;
[0031] 圖3描繪了示出如圖2的步驟230所示的用于資源監(jiān)視器(例如,圖1的資源監(jiān) 視器150)基于云網(wǎng)絡(luò)度量檢測(cè)災(zāi)難的方法300的實(shí)施方式的流程圖;
[0032] 圖4描繪了示出如圖2的步驟240所示用于恢復(fù)資源(例如,圖1的數(shù)據(jù)中心180 中的應(yīng)用或網(wǎng)絡(luò)130中的資源)執(zhí)行快速災(zāi)難恢復(fù)準(zhǔn)備的方法400的實(shí)施方式的流程圖; 以及
[0033] 圖5圖示了諸如圖1的資源監(jiān)視器150、圖1的數(shù)據(jù)中心180的一個(gè)數(shù)據(jù)中心或網(wǎng) 絡(luò)130的資源中的一個(gè)資源的虛擬機(jī)的各種設(shè)備500的實(shí)施方式。
[0034] 為了便于理解,相同的參考標(biāo)記用于指示具有基本相同或相似結(jié)構(gòu)或基本相同或 相似功能的元件。
【具體實(shí)施方式】
[0035] 說(shuō)明書(shū)和附圖僅示出本發(fā)明的原理。從而可以理解,本領(lǐng)域的技術(shù)人員能夠想出 雖然在此沒(méi)有明確地描述或者顯示但是可以實(shí)現(xiàn)本發(fā)明的原理并包括在本發(fā)明的范圍內(nèi) 的各種安排。而且,在此列出的所有示例主要旨在僅特別用于教導(dǎo)的目的,以幫助讀者理解 本發(fā)明的原理和發(fā)明人所貢獻(xiàn)的用來(lái)促進(jìn)本領(lǐng)域的概念,并應(yīng)解釋為不限于這些具體引用 的示例和條件。另外,這里使用的術(shù)語(yǔ)"或"除非另有說(shuō)明,否則指的是非排他的或。而且, 這里所述的各種實(shí)施方式不必要互相排斥,因?yàn)橐恍?shí)施方式可以與一個(gè)或多個(gè)其他實(shí)施 方式結(jié)合起來(lái)形成新的實(shí)施方式。
[0036] 各種實(shí)施方式提供了一種在云網(wǎng)絡(luò)中提供快速災(zāi)難恢復(fù)準(zhǔn)備的方法和設(shè)備,所述 方法和設(shè)備主動(dòng)檢測(cè)災(zāi)難事件并快速分配云資源??焖贋?zāi)難恢復(fù)準(zhǔn)備可以通過(guò)在恢復(fù)業(yè)務(wù) 的激增沖擊恢復(fù)應(yīng)用/資源之前主動(dòng)增加恢復(fù)應(yīng)用/資源上的性能來(lái)縮短RT0。而且,快 速災(zāi)難恢復(fù)準(zhǔn)備可以通過(guò)比在"正常操作"期間更快地增加性能來(lái)縮短RT0,在"正常操作" 中在負(fù)載超過(guò)使用閾值后通過(guò)一段時(shí)間的適度增加來(lái)提高性能。
[0037] 圖1示出了云網(wǎng)絡(luò)100,該云網(wǎng)絡(luò)100包括快速災(zāi)難恢復(fù)準(zhǔn)備架構(gòu)的一個(gè)實(shí)施方 式。云網(wǎng)絡(luò)100包括一個(gè)或多個(gè)客戶端120-a - 120-c(統(tǒng)稱為客戶端120),該客戶端經(jīng)由 通信路徑向數(shù)據(jù)中心180-a - 180-c (統(tǒng)稱為數(shù)據(jù)中心180)中的應(yīng)用發(fā)送應(yīng)用請(qǐng)求。通信路 徑可以包括客戶通信信道125-a、125-b和125-c (統(tǒng)稱為客戶端通信信道125)中的一者、 網(wǎng)絡(luò)130、和數(shù)據(jù)中心通信信道185-a、185-b和185-c (統(tǒng)稱為數(shù)據(jù)中心通信信道185)中的 一者。云網(wǎng)絡(luò)100還包括資源監(jiān)視器150,該資源監(jiān)視器150監(jiān)測(cè)云網(wǎng)絡(luò)資源,并通過(guò)資源 監(jiān)測(cè)通信信道155發(fā)送災(zāi)難預(yù)警警報(bào)消息。
[0038] 這里所用的術(shù)語(yǔ)"云網(wǎng)絡(luò)"應(yīng)該被理解為廣泛地包括任何分配的資源。例如,云網(wǎng) 絡(luò)資源可以包括設(shè)備(例如,路由器和無(wú)線基站)或設(shè)施(例如,光纖和同軸電纜)。
[0039] 客戶端120可以為任何類型或任何數(shù)量的發(fā)起專用于在數(shù)據(jù)中心180上實(shí)例化的 一個(gè)應(yīng)用實(shí)例的應(yīng)用請(qǐng)求的客戶機(jī)。例如,客戶端可以為:服務(wù)器、移動(dòng)電話、平板電腦、計(jì) 算機(jī)、個(gè)人數(shù)字助理(PDA)、電子閱讀器、網(wǎng)絡(luò)設(shè)備(如交換機(jī)或路由器)等等。
[0040] 通信信道125和185可以支持在一個(gè)或多個(gè)通信信道上獲取或響應(yīng)應(yīng)用請(qǐng)求,所 述通信信道諸如:無(wú)線通信(例如,LTE、GSM、CDMA、藍(lán)牙);毫微微蜂窩基站通信(例如, WiFi);分組網(wǎng)絡(luò)的通信(例如,IP);寬帶通信(例如,DOCSIS和DSL);存儲(chǔ)通信(例如,光 纖信道、iSCSI)等等。應(yīng)該理解,雖然示出為單個(gè)連接,但是通信信道125和185可以為任 何數(shù)量的支持客戶端120與在數(shù)據(jù)中心180上實(shí)例化的應(yīng)用實(shí)例之間的通信的通信信道或 其組合。
[0041] 網(wǎng)絡(luò)130可以為任何合適的便于在客戶端120與在數(shù)據(jù)中心180上實(shí)例化的應(yīng) 用實(shí)例之間的通信的網(wǎng)絡(luò)。例如,網(wǎng)絡(luò)130可以為以下的結(jié)合:局域網(wǎng)(LAN)、無(wú)線局域網(wǎng) (WLAN)、廣域網(wǎng)(WAN)、城域網(wǎng)(MAN)等等。
[0042] 資源監(jiān)視器150監(jiān)測(cè)云網(wǎng)絡(luò)資源或預(yù)警機(jī)制。特別地,當(dāng)資源監(jiān)視器150檢測(cè)到 指示影響數(shù)據(jù)中心(例如,數(shù)據(jù)中心180-a)的災(zāi)難的條件時(shí),資源監(jiān)視器150發(fā)送災(zāi)難預(yù) 警警報(bào)消息到恢復(fù)應(yīng)用/資源(例如,在數(shù)據(jù)中心180-b上實(shí)例化的應(yīng)用實(shí)例或網(wǎng)絡(luò)130 中的路由器)。應(yīng)該理解,雖然資源監(jiān)視器150畫在網(wǎng)絡(luò)130的外部,但是資源監(jiān)視器150 也可以位于網(wǎng)絡(luò)130內(nèi)。
[0043] 資源監(jiān)測(cè)通信信道155可以支持通過(guò)一個(gè)或多個(gè)通信信道接收消息或向客戶端 120、網(wǎng)絡(luò)130的資源(未示出)或數(shù)據(jù)中心180中的應(yīng)用傳送消息,所述通信信道諸如: 無(wú)線通信(例如,LTE、GSM、CDMA、藍(lán)牙);毫微微蜂窩基站通信(例如,WiFi);分組網(wǎng)絡(luò)的 通信(例如,IP);寬帶通信(例如,DOCSIS和DSL);存儲(chǔ)通信(例如,光纖信道、iSCSI)等 等。應(yīng)該理解,雖然示出為單個(gè)連接,但是資源監(jiān)測(cè)通信信道155可以為任何數(shù)量的支持資 源監(jiān)視器150與客戶端120、網(wǎng)絡(luò)130的資源(未示出)或數(shù)據(jù)中心180上的應(yīng)用之間的通 信的通信信道或其組合。
[0044] 數(shù)據(jù)中心180在地理上分散,并可以具有任何配置。數(shù)據(jù)中心180包括具有被創(chuàng) 建以便為來(lái)自客戶端120的應(yīng)用請(qǐng)求提供服務(wù)的虛擬機(jī)運(yùn)行的應(yīng)用的資源。特別地,數(shù)據(jù) 中心180中的至少一個(gè)應(yīng)用被配置為從資源監(jiān)視器150接收災(zāi)難預(yù)警警報(bào)消息。響應(yīng)于接 收的災(zāi)難預(yù)警警報(bào)消息,數(shù)據(jù)中心180主動(dòng)分配恢復(fù)應(yīng)用/資源,以加速受影響客戶端120 的服務(wù)恢復(fù)。
[0045] 應(yīng)該理解,通過(guò)主動(dòng)和快速分配恢復(fù)應(yīng)用/資源,在大多數(shù)需要恢復(fù)的客戶端120 啟動(dòng)恢復(fù)動(dòng)作之前性能的彈性激增在線。例如,災(zāi)難事件可能使得大量的客戶端120嘗試 恢復(fù)到簡(jiǎn)要窗口中的恢復(fù)站點(diǎn)(例如,連接、登錄和被驗(yàn)證、和創(chuàng)建會(huì)話),這可能會(huì)使恢復(fù) 數(shù)據(jù)中心超載。從而,可以有效為快速增加的負(fù)載服務(wù),而不需要用擁塞控制觸發(fā)超載(這 可能降低客戶服務(wù)質(zhì)量)。
[0046] 在資源監(jiān)視器150的一些實(shí)施方式中,指示災(zāi)難的條件(S卩,災(zāi)難條件)可以包括 業(yè)務(wù)流量的顯著改變、異常的業(yè)務(wù)模式或明確的警報(bào)/故障指示(如信號(hào)丟失指示符)。在 進(jìn)一步的實(shí)施方式中,資源監(jiān)視器150在接收到閾值數(shù)的信號(hào)丟失指示符后將確定存在災(zāi) 難條件。應(yīng)該理解,多個(gè)信號(hào)丟失指示符可以指示傳輸介質(zhì)(諸如光纖)的損壞。
[0047] 在資源監(jiān)視器150的一些實(shí)施方式中,警報(bào)機(jī)制可以包括外部的傳感器或來(lái)自監(jiān) 測(cè)數(shù)據(jù)饋送的輸入。在這些實(shí)施方式中的一些實(shí)施方式中,外部的傳感器是地震儀監(jiān)視器。 在這些實(shí)施方式中的一些實(shí)施方式中,監(jiān)測(cè)數(shù)據(jù)饋送是到國(guó)內(nèi)/國(guó)際海嘯或其他災(zāi)難預(yù)警 機(jī)構(gòu)的互聯(lián)網(wǎng)連接。
[0048] 在一些實(shí)施方式中,數(shù)據(jù)中心180可以包括諸如處理器/CPU核心、網(wǎng)絡(luò)接口、存儲(chǔ) 器裝置或數(shù)據(jù)存儲(chǔ)裝置的資源。而且,數(shù)據(jù)中心180可以為任何合適的物理硬件配置,諸 如:一個(gè)或多個(gè)服務(wù)器、包括諸如處理器的組件的刀片、存儲(chǔ)器、網(wǎng)絡(luò)接口或存儲(chǔ)裝置。在這 些實(shí)施方式中的一些實(shí)施方式中,數(shù)據(jù)中心可以包括彼此遠(yuǎn)離的云網(wǎng)絡(luò)資源。應(yīng)該理解,通 過(guò)分配諸如處理器、網(wǎng)絡(luò)接口、存儲(chǔ)設(shè)備或數(shù)據(jù)存儲(chǔ)器的資源,數(shù)據(jù)中心可以調(diào)整(scale) 應(yīng)用實(shí)例或虛擬機(jī)的處理、帶寬、RAM和永久存儲(chǔ)性能。
[0049] 圖2描繪了示出用于在云網(wǎng)絡(luò)中提供快速災(zāi)難恢復(fù)準(zhǔn)備的方法200的實(shí)施方式的 流程圖。
[0050] 在方法200中,步驟220包括監(jiān)測(cè)來(lái)自云網(wǎng)絡(luò)資源(例如通過(guò)圖1的網(wǎng)絡(luò)130的 資源(未示出)或圖1的數(shù)據(jù)中心180中的應(yīng)用)或預(yù)警機(jī)構(gòu)的云網(wǎng)絡(luò)度量。云網(wǎng)絡(luò)度量 可以為任何合適的可以用來(lái)確定災(zāi)難條件的存在或用來(lái)確定便于從災(zāi)難條件恢復(fù)的網(wǎng)絡(luò) 條件的度量。例如,云網(wǎng)絡(luò)度量可以包括:業(yè)務(wù)流量值、負(fù)載/性能值、網(wǎng)絡(luò)配置、健康消息 (例如,心跳消息)、網(wǎng)絡(luò)警報(bào)(如,多個(gè)斷纖)、外部的警報(bào)、數(shù)據(jù)饋送等等。
[0051] 在方法200中,步驟230包括基于云網(wǎng)絡(luò)度量(例如通過(guò)圖1的資源監(jiān)視器150) 檢測(cè)災(zāi)難條件。特別地,分析云網(wǎng)絡(luò)度量以確定收集到的云網(wǎng)絡(luò)指示符的特征是否指示災(zāi) 難條件已經(jīng)發(fā)生。如果已經(jīng)發(fā)生了災(zāi)難條件,則執(zhí)行方法的設(shè)備發(fā)送災(zāi)難預(yù)警警報(bào)消息到 恢復(fù)應(yīng)用/資源,并進(jìn)行到步驟240,否則,設(shè)備返回步驟220。應(yīng)該理解,對(duì)災(zāi)難條件的檢 測(cè)不需要實(shí)際災(zāi)難已經(jīng)或?qū)⒁l(fā)生。而是,災(zāi)難條件檢測(cè)僅指示監(jiān)測(cè)的云網(wǎng)絡(luò)度量指示可 能發(fā)生了災(zāi)難。有利地,通過(guò)在完全確定災(zāi)難之前發(fā)送災(zāi)難預(yù)警警報(bào)消息,可以給恢復(fù)應(yīng)用 /資源提供增加的時(shí)間間隔以在潛在的恢復(fù)業(yè)務(wù)激增之前完成恢復(fù)準(zhǔn)備。
[0052] 在方法200中,步驟240包括執(zhí)行快速災(zāi)難恢復(fù)準(zhǔn)備(例如,通過(guò)圖1的網(wǎng)絡(luò)130 的資源(未示出)或在圖1的數(shù)據(jù)中心180上執(zhí)行的應(yīng)用實(shí)例)。特別地,恢復(fù)應(yīng)用/資源 接收災(zāi)難預(yù)警警報(bào)消息并主動(dòng)分配云網(wǎng)絡(luò)資源,從而處理預(yù)計(jì)的恢復(fù)業(yè)務(wù)的激增,所述恢 復(fù)業(yè)務(wù)預(yù)計(jì)從災(zāi)難影響的應(yīng)用/資源轉(zhuǎn)移。
[0053] 在一些實(shí)施方式中,通過(guò)圖1的資源監(jiān)視器150執(zhí)行步驟220。
[0054] 圖3描繪了示出如圖2的步驟230所示的用于資源監(jiān)視器(例如,圖1的資源監(jiān) 視器150)基于云網(wǎng)絡(luò)度量檢測(cè)災(zāi)難的方法300的實(shí)施方式的流程圖。該方法包括監(jiān)測(cè)諸 如在圖2的步驟220期間捕獲的云網(wǎng)絡(luò)度量(步驟320)。執(zhí)行該方法的設(shè)備然后確定接 收的云網(wǎng)絡(luò)度量是否指示災(zāi)難事件(步驟330),如果是,則可選擇地確定緩解策略(步驟 340),并創(chuàng)建(步驟350)和發(fā)送一個(gè)或多個(gè)災(zāi)難預(yù)警警報(bào)消息(步驟360)到諸如圖2和 圖4的步驟240中所述的恢復(fù)應(yīng)用/資源。
[0055] 在方法300中,步驟320包括(例如,通過(guò)資源監(jiān)測(cè)通信信道155或直接從資源監(jiān) 視器150)監(jiān)測(cè)來(lái)自一個(gè)或多個(gè)資源的一個(gè)或多個(gè)云網(wǎng)絡(luò)度量。在一些實(shí)施方式中,資源監(jiān) 視器可以選擇或提供要被監(jiān)視的云網(wǎng)絡(luò)度量。例如,資源監(jiān)視器可以監(jiān)測(cè)到一個(gè)或多個(gè)數(shù) 據(jù)中心或來(lái)自一個(gè)或多個(gè)數(shù)據(jù)中心(例如,圖1的數(shù)據(jù)中心180)的業(yè)務(wù)流量。
[0056] 在方法300中,步驟330包括基于接收的云度量檢測(cè)災(zāi)難。特別地,分析云網(wǎng)絡(luò)度 量以確定搜集的云網(wǎng)絡(luò)度量的特征是否指示發(fā)生了災(zāi)難條件。
[0057] 方法300可選擇地包括步驟340。步驟340包括確定緩解策略。特別地,資源監(jiān)視 器可以了解網(wǎng)絡(luò)配置、狀態(tài)、性能、或云網(wǎng)絡(luò)資源(例如,網(wǎng)絡(luò)130或圖1的數(shù)據(jù)中心180中 的應(yīng)用)的損害?;谠摿私?,資源管理器可以做出災(zāi)難恢復(fù)建議。
[0058] 在方法300中,步驟350包括創(chuàng)建災(zāi)難預(yù)警警報(bào)消息。特別地,所述消息包括表明 災(zāi)難條件被檢測(cè)到的指示符或提供恢復(fù)配置信息。
[0059] 在方法300中,步驟360包括向恢復(fù)應(yīng)用/資源發(fā)送一個(gè)或多個(gè)災(zāi)難預(yù)警警報(bào)消 息。特別地,一個(gè)或多個(gè)災(zāi)難預(yù)警警報(bào)消息將針對(duì)執(zhí)行該方法的設(shè)備確定將會(huì)使用災(zāi)難預(yù) 警警報(bào)消息執(zhí)行快速災(zāi)難恢復(fù)準(zhǔn)備的如圖2和圖4的步驟240中所述的恢復(fù)應(yīng)用/資源。
[0060] 方法300可選擇地包括步驟370。步驟370包括發(fā)送災(zāi)難釋放消息。特別地,在災(zāi) 難預(yù)警或事件結(jié)束后,向恢復(fù)應(yīng)用/資源發(fā)送消息以釋放被保留用來(lái)處理簽字的災(zāi)難的恢 復(fù)云網(wǎng)絡(luò)資源。
[0061] 在一些實(shí)施方式中,步驟320包括資源監(jiān)視器(例如,圖1的資源監(jiān)視器150)從 自身采集云網(wǎng)絡(luò)度量。例如,如果資源監(jiān)視器被定位為網(wǎng)絡(luò)運(yùn)營(yíng)商的網(wǎng)絡(luò)和數(shù)據(jù)中心之間 的路由器/IP網(wǎng)絡(luò)連接。
[0062] 在一些實(shí)施方式中,步驟320包括監(jiān)測(cè)從網(wǎng)絡(luò)中的資源(例如,是圖1的網(wǎng)絡(luò)130 的一部分的網(wǎng)絡(luò)運(yùn)營(yíng)商的網(wǎng)絡(luò)(未示出)中的路由器)到數(shù)據(jù)中心(例如,圖1的數(shù)據(jù)中 心180-b)的IP網(wǎng)絡(luò)連接。在這些實(shí)施方式中的一些實(shí)施方式中,步驟330包括當(dāng)IP業(yè)務(wù) 流量立即下降或到數(shù)據(jù)中心的訪問(wèn)連接故障或中斷時(shí)檢測(cè)到所監(jiān)測(cè)的數(shù)據(jù)中心可能正經(jīng) 歷災(zāi)難。應(yīng)該理解,可以監(jiān)測(cè)任何業(yè)務(wù)流量,而不只是IP業(yè)務(wù)流量。
[0063] 在一些實(shí)施方式中,步驟330包括,采集多個(gè)云網(wǎng)絡(luò)度量以確定災(zāi)難條件是否存 在。
[0064] 在一些事實(shí)方式中,步驟330包括,基于災(zāi)難發(fā)生的"置信水平"確定災(zāi)難條件存 在。在這些實(shí)施方式中的一些實(shí)施方式中,置信水平可能是積極的(aggressive)。例如,當(dāng) 實(shí)際災(zāi)難的"置信水平"小于等于百分之五十(50%)時(shí)可以觸發(fā)災(zāi)難條件。應(yīng)該理解,月艮 務(wù)供應(yīng)商可能比起誤報(bào)(false positive)(即,為從來(lái)未發(fā)生的災(zāi)難做準(zhǔn)備)更關(guān)心的是 漏報(bào)(false negative)(即,沒(méi)有為實(shí)際災(zāi)難積極做準(zhǔn)備)。
[0065] 在步驟330的第一實(shí)施方式中,使用基于規(guī)則的模型檢測(cè)在步驟320中接收到的 云網(wǎng)絡(luò)度量是否指示災(zāi)難事件。例如,如果被監(jiān)測(cè)的業(yè)務(wù)流量的通信水平在一段時(shí)間閾值 期間降到或低于業(yè)務(wù)閾值(例如,持續(xù)一分鐘業(yè)務(wù)流量降到〇),則檢測(cè)到災(zāi)難。
[0066] 在步驟330的第二實(shí)施方式中,使用傳統(tǒng)的預(yù)測(cè)分析程序檢測(cè)在步驟320中接收 到的云網(wǎng)絡(luò)度量是否指示災(zāi)難事件。例如,如果被監(jiān)測(cè)的業(yè)務(wù)流量可以輸入到傳統(tǒng)的預(yù)測(cè) 分析程序。然后該預(yù)測(cè)分析程序可以相對(duì)于存儲(chǔ)的培訓(xùn)業(yè)務(wù)流量模式對(duì)輸入的業(yè)務(wù)流量模 式進(jìn)行分類,以確定是否檢測(cè)到災(zāi)難。在這些實(shí)施方式中的一些實(shí)施方式中,可以將預(yù)測(cè)分 析程序訓(xùn)練為基于置信水平做出災(zāi)難檢測(cè)分類。
[0067] 在一些實(shí)施方式中,步驟340包括基于網(wǎng)絡(luò)狀態(tài)/性能/損害信息確定緩解策略。 在這些實(shí)施方式中的一些實(shí)施方式中,緩解策略的確定包括以下一個(gè)或多個(gè)步驟:
[0068] 1)推導(dǎo)哪個(gè)或哪些數(shù)據(jù)中心(S)/應(yīng)用實(shí)例⑶可能會(huì)受到影響(例如,圣何塞的 地震可能會(huì)影響硅谷地區(qū)的數(shù)據(jù)中心);
[0069] 2)確定災(zāi)難預(yù)警警報(bào)消息要指向的恢復(fù)應(yīng)用/資源(例如,網(wǎng)絡(luò)130中的路由器 或圖1的數(shù)據(jù)中心180-b中的應(yīng)用);
[0070] 3)確定恢復(fù)準(zhǔn)備,諸如使恢復(fù)資源或恢復(fù)策略激增,從而在確定的恢復(fù)應(yīng)用/資 源處準(zhǔn)備有效恢復(fù)受影響用戶的服務(wù)(例如,改變網(wǎng)絡(luò)130的路由器的QoS策略或激增圖 1的數(shù)據(jù)中心180-b中的應(yīng)用的資源)。
[0071] 在一些實(shí)施方式中,步驟340包括建立多個(gè)災(zāi)難嚴(yán)重等級(jí)。在這些實(shí)施方式中的 一些實(shí)施方式中,災(zāi)難嚴(yán)重等級(jí)基于災(zāi)難條件的置信水平。在這些實(shí)施方式中的一些實(shí)施 方式中,災(zāi)難嚴(yán)重等級(jí)基于災(zāi)難的潛在影響。例如,斷纖可能只影響一個(gè)數(shù)據(jù)中心,而地震 或海嘯可能影響包括多個(gè)數(shù)據(jù)中心的整個(gè)地區(qū)。應(yīng)該理解,對(duì)影響一個(gè)數(shù)據(jù)中心的災(zāi)難的 響應(yīng)跟對(duì)影響多個(gè)數(shù)據(jù)中心的災(zāi)難的響應(yīng)相比可以不同。例如,可以應(yīng)用不同的QoS策略 或可以將資源在分配給不重要的消費(fèi)者服務(wù)之前分配給緊急服務(wù)。在這些實(shí)施方式中的一 些實(shí)施方式中,災(zāi)難預(yù)警警報(bào)消息將基于災(zāi)難嚴(yán)重等級(jí)。
[0072] 在一些實(shí)施方式中,步驟340包括建立多個(gè)對(duì)對(duì)應(yīng)的多個(gè)災(zāi)難嚴(yán)重等級(jí)的災(zāi)難響 應(yīng)。例如,如果創(chuàng)建紅色、黃色、和綠色的災(zāi)難嚴(yán)重等級(jí),則針對(duì)每個(gè)災(zāi)難級(jí)要應(yīng)用的QoS策 略或要保留的資源數(shù)量的建議可以不同。
[0073] 在一些實(shí)施方式中,步驟340包括確定用于恢復(fù)應(yīng)用/資源的地理信息,和進(jìn)一步 將緩解策略基于地理信息。例如,如果確定在地理區(qū)域檢測(cè)到了受災(zāi)難影響的數(shù)據(jù)中心的 閾值,則資源監(jiān)視器可以選擇在受影響的地理區(qū)域外的恢復(fù)數(shù)據(jù)中心。
[0074] 在步驟340的一些實(shí)施方式中,緩解策略包括確定將恢復(fù)負(fù)載分布到恢復(fù)應(yīng)用/ 資源。例如,來(lái)自受影響的數(shù)據(jù)中心(例如,圖1的數(shù)據(jù)中心180-a)的負(fù)載將被分布到恢 復(fù)數(shù)據(jù)中心(例如,圖1的數(shù)據(jù)中心180-a和180-b)并進(jìn)行負(fù)載平衡。
[0075] 在一些實(shí)施方式中,步驟340包括將消息與一個(gè)或多個(gè)云網(wǎng)絡(luò)資源(例如,圖1的 數(shù)據(jù)中心180的一個(gè)或多個(gè)應(yīng)用或網(wǎng)絡(luò)130的一個(gè)或多個(gè)資源(未示出))交換。例如,資 源監(jiān)視器(例如,圖1的資源監(jiān)視器150)可以發(fā)送消息到潛在的恢復(fù)數(shù)據(jù)中心(例如,數(shù) 據(jù)中心180-b)上的應(yīng)用,要么推薦資源能力要么請(qǐng)求恢復(fù)數(shù)據(jù)中心是否可以處理包含在 消息請(qǐng)求中的指定的資源能力。在這些實(shí)施方式中,緩解策略建議可以基于該消息交換。
[0076] 在一些實(shí)施方式中,步驟340包括自動(dòng)將業(yè)務(wù)重新定向(例如,自動(dòng)改變DNS來(lái)使 業(yè)務(wù)離開(kāi)受災(zāi)難影響的數(shù)據(jù)中心并轉(zhuǎn)移到恢復(fù)數(shù)據(jù)中心)。
[0077] 在一些實(shí)施方式中,步驟340包括采集運(yùn)行在受災(zāi)難影響的數(shù)據(jù)中心上的應(yīng)用的 需求。特別地,可以采集應(yīng)用的需求和應(yīng)用的各種資源的布局,包括諸如存在多少虛擬機(jī)、 虛擬機(jī)如何連接、應(yīng)用的數(shù)據(jù)訪問(wèn)模式和應(yīng)用的服務(wù)需求的信息。例如,如果資源監(jiān)視器 150知道在檢測(cè)到災(zāi)難之前就使用數(shù)據(jù)中心180-a的資源,則資源監(jiān)視器150可以基于至 少所述需求的子集建立恢復(fù)建議(例如,預(yù)計(jì)的負(fù)載值)并將其傳到恢復(fù)數(shù)據(jù)中心(例如, 180-b)。
[0078] 在步驟340的一些實(shí)施方式中,可以確定對(duì)于一個(gè)或多個(gè)恢復(fù)應(yīng)用/資源的恢復(fù) 建議。在這些實(shí)施方式的進(jìn)一步的實(shí)施方式中,災(zāi)難預(yù)警警報(bào)消息包括災(zāi)難恢復(fù)建議。
[0079] 在步驟340的一些實(shí)施方式中,恢復(fù)建議可以包括:資源分配建議、資源需求或恢 復(fù)參數(shù)(例如,預(yù)計(jì)的負(fù)載或RT0需求)。
[0080] 在一些實(shí)施方式中,步驟350包括基于網(wǎng)絡(luò)狀態(tài)/性能/損壞/建議信息或來(lái)自 步驟340的應(yīng)用需求在一個(gè)或多個(gè)災(zāi)難預(yù)警警報(bào)消息中合并信息。
[0081] 在一些實(shí)施方式中,步驟370包括基于隨后接收的云網(wǎng)絡(luò)度量確定災(zāi)難預(yù)警或事 件到期。例如,如果基于監(jiān)測(cè)的來(lái)自數(shù)據(jù)中心(例如,數(shù)據(jù)中心180-a)的下降的業(yè)務(wù)流量確 定災(zāi)難預(yù)警,如果隨后接收的云網(wǎng)絡(luò)度量指示監(jiān)測(cè)的業(yè)務(wù)流量復(fù)原則災(zāi)難預(yù)警可以到期。
[0082] 在一些實(shí)施方式中,步驟370包括基于時(shí)間閾值確定災(zāi)難預(yù)警或時(shí)間到期。例如, 如果在三十(30)分鐘內(nèi)未記錄到實(shí)際災(zāi)難,則系統(tǒng)可以使災(zāi)難預(yù)警到期。
[0083] 在進(jìn)一步的實(shí)施方式中,步驟370可以包括修改步驟330的災(zāi)難條件確定。例如, 如果系統(tǒng)基于監(jiān)測(cè)的在11:30PM下降的業(yè)務(wù)流量反復(fù)發(fā)送災(zāi)難預(yù)警,但當(dāng)業(yè)務(wù)恢復(fù)時(shí)災(zāi)難 預(yù)警在12:00PM永遠(yuǎn)到期,可以修改步驟330來(lái)嘗試減輕這些誤報(bào)。在另一個(gè)示例中,如果 基于時(shí)間閾值的到期災(zāi)難預(yù)警到期,則可以將步驟330修改為包括更嚴(yán)格的確定特性,以 免在災(zāi)害預(yù)警到期后迅速觸發(fā)其他報(bào)警。
[0084] 在步驟350中,應(yīng)該理解,基于來(lái)自任何其他方法步驟的信息創(chuàng)建災(zāi)難預(yù)警消息 可以包括以任何形式包含信息,并不需要"復(fù)制"災(zāi)害預(yù)警警報(bào)消息中的信息。
[0085] 圖4描繪了示出如圖2的步驟240所示用于恢復(fù)資源(例如,圖1的數(shù)據(jù)中心 180中的應(yīng)用或網(wǎng)絡(luò)130中的資源)執(zhí)行快速災(zāi)難恢復(fù)準(zhǔn)備的方法400的實(shí)施方式的流程 圖。方法包括接收一個(gè)或多個(gè)災(zāi)難預(yù)警警報(bào)消息(步驟420),諸如在圖3中的步驟360期 間發(fā)送的災(zāi)難預(yù)警警報(bào)消息。然后執(zhí)行該方法的設(shè)備解析接收的災(zāi)難預(yù)警警報(bào)消息(步 驟430),并然后:(i)快速執(zhí)行彈性(步驟440) ; (ii)對(duì)操作恢復(fù)策略進(jìn)行預(yù)處理(步驟 450);或(iii)對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)處理(步驟460)。最后,方法包括使設(shè)備回到正常操作(步 驟 470)。
[0086] 在方法400中,步驟420包括(例如,通過(guò)數(shù)據(jù)中心通信信道185、通過(guò)網(wǎng)絡(luò)130中 的通信信道(未示出)或直接由自己)接收一個(gè)或多個(gè)災(zāi)難預(yù)警警報(bào)消息。
[0087] 在方法400中,步驟430包括解析接收到的災(zāi)難預(yù)警警報(bào)消息。特別地,解析災(zāi)難 預(yù)警警報(bào)消息以確定是否應(yīng)該執(zhí)行步驟440、450或460中的任何步驟。應(yīng)該理解,設(shè)備可 以只執(zhí)行一個(gè)步驟(例如,步驟440),以及災(zāi)難預(yù)警警報(bào)消息可以簡(jiǎn)化為災(zāi)難預(yù)警指示符。
[0088] 方法400可選地包括步驟440。步驟440包括執(zhí)行快速?gòu)椥?。特別地,執(zhí)行該方法 的設(shè)備基于接收災(zāi)難預(yù)警警報(bào)消息啟動(dòng)快速?gòu)椥栽黾?,即使設(shè)備沒(méi)有檢測(cè)到擁塞條件。快 速?gòu)椥栽黾优c正常彈性增加不同。在正常彈性增加中,負(fù)載超過(guò)使用閾值一段時(shí)間期間后 性能以穩(wěn)定狀態(tài)增加。在快速?gòu)椥栽黾又?,為預(yù)測(cè)的業(yè)務(wù)激增做準(zhǔn)備來(lái)增加性能(即,不基 于負(fù)載超過(guò)使用閾值的確定)。
[0089] 方法400可選地包括步驟450。步驟450包括對(duì)恢復(fù)策略進(jìn)行預(yù)處理。特別地, 執(zhí)行該方法的設(shè)備可以基于災(zāi)難預(yù)警警報(bào)消息的接收針對(duì)一個(gè)或多個(gè)其云網(wǎng)絡(luò)資源修改 其操作策略。修改操作策略可以包括:(1)對(duì)服務(wù)參數(shù)的質(zhì)量進(jìn)行配置;(ii)使低優(yōu)先級(jí)/ 離線任務(wù)推遲;或(iii)其他。
[0090] 方法400可選地包括步驟460。步驟460包括對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)處理。特別地,執(zhí)行該 方法的設(shè)備可以對(duì)業(yè)務(wù)流量進(jìn)行預(yù)配置,增加恢復(fù)應(yīng)用/資源的帶寬等等。
[0091] 方法400可選地包括步驟470。步驟470包括使設(shè)備回到正常模式的操作。特別 地,步驟440、450和460中做的準(zhǔn)備可以"回退(roll back) "。
[0092] 在一些實(shí)施方式中,步驟440包括大量的彈性增加。大量的彈性增加是比常規(guī)增 加2倍大的恢復(fù)云網(wǎng)絡(luò)資源的增加。在這些實(shí)施方式中的一些實(shí)施方式中,大量的彈性增 加是正常增加的10倍大。
[0093] 在一些實(shí)施方式中,步驟440基于存儲(chǔ)的值啟動(dòng)彈性增加操作。例如,存儲(chǔ)的值可 以指示恢復(fù)數(shù)據(jù)中心上的應(yīng)用為恢復(fù)關(guān)鍵路徑上的元件(諸如,認(rèn)證服務(wù)器)增加100%或 更多的能力。在進(jìn)一步的實(shí)施方式中,可以基于諸如時(shí)間或日期、一周中的日期等等的動(dòng)態(tài) 信息存儲(chǔ)多個(gè)值。
[0094] 在一些實(shí)施方式中,步驟440包括基于設(shè)備可用的信息啟動(dòng)彈性增加操作。特別 地,設(shè)備可以分配足夠的資源/啟動(dòng)足夠的應(yīng)用實(shí)例,以滿足一個(gè)或多個(gè)單獨(dú)的應(yīng)用程序 的預(yù)期負(fù)載或RT0需求。例如,如果信息指定15分鐘RT0用于應(yīng)用,托管用戶證書(shū)的恢復(fù) 設(shè)備上的認(rèn)證數(shù)據(jù)庫(kù)可以基于在小于15分鐘的時(shí)間幀內(nèi)為每個(gè)用戶(例如,圖1中的客戶 端120)驗(yàn)證證書(shū)的能力來(lái)進(jìn)行彈性增加操作。應(yīng)該理解,彈性增加操作可以比正常操作所 需的更積極地增加能力,從而適應(yīng)用戶對(duì)災(zāi)難事件后的恢復(fù)數(shù)據(jù)中心的認(rèn)證請(qǐng)求的激增。
[0095] 在一些實(shí)施方式中,步驟440包括基于災(zāi)難預(yù)警警報(bào)消息中包括的信息來(lái)啟動(dòng)彈 性增加操作。災(zāi)難預(yù)警警報(bào)消息可以包括任何合適的信息,以基于諸如以下各項(xiàng)進(jìn)行彈性 增加操作:(i)預(yù)計(jì)要承受的負(fù)載;(ii) RT0需求;(iii) QoS策略;(iv)網(wǎng)絡(luò)配置;或(v) 其他。預(yù)計(jì)的負(fù)載可以包括任何合適的信息,以基于諸如以下各項(xiàng)進(jìn)行彈性增加操作:負(fù) 載、資源需求、受影響的用戶數(shù)量或任何其他相關(guān)的次要信息,所述次要信息諸如受影響的 數(shù)據(jù)中心的大小。例如,如果災(zāi)難預(yù)警警報(bào)消息包括關(guān)于受災(zāi)難影響的數(shù)據(jù)中心的大小的 信息,則恢復(fù)數(shù)據(jù)中心中(例如,圖1的數(shù)據(jù)中心180-b)的應(yīng)用可以為小的受災(zāi)難影響的 數(shù)據(jù)中心增加百分之五十(50%)的資源,和為大的受災(zāi)難影響的數(shù)據(jù)中心增加百分之百 (100% )資源。
[0096] 在一些實(shí)施方式中,步驟440包括啟動(dòng)"剛好的"彈性增加操作。"剛好的"彈性增 加操作使性能激增到大約到預(yù)計(jì)的瞬時(shí)業(yè)務(wù)增加。例如,如果災(zāi)難預(yù)警警報(bào)消息包括對(duì)要 傳輸?shù)呢?fù)載的估計(jì),執(zhí)行該方法的設(shè)備可以使能力充分激增以處理預(yù)測(cè)的負(fù)載。在這些實(shí) 施方式的進(jìn)一步的實(shí)施方式中,應(yīng)用可以使得能力激增到預(yù)測(cè)的負(fù)載之上,以提供緩沖區(qū)。 在一些實(shí)施方式中,安全區(qū)可以小于等于百分之十(10%)。
[0097] 在一些實(shí)施方式中,步驟450包括修改操作策略。在這些實(shí)施方式的進(jìn)一步的實(shí) 施方式中,執(zhí)行該方法的設(shè)備可以使低優(yōu)先級(jí)或離線任務(wù)推遲。在這些實(shí)施方式的進(jìn)一步 的實(shí)施方式中,執(zhí)行該方法的設(shè)備可以修改QoS以使更多的資源可用于服務(wù)受影響的用 戶。
[0098] 在一些實(shí)施方式中,步驟450包括基于災(zāi)難預(yù)警警報(bào)消息中包含的信息設(shè)置自適 應(yīng)比特率(例如,使用HTTP自適應(yīng)比特率流)。例如,可以向諸如視頻傳輸設(shè)備的恢復(fù)資源 發(fā)送帶有建議在某時(shí)間期間減少視頻的比特率的信息的災(zāi)難預(yù)警警報(bào)消息。該視頻帶寬的 減少可以使系統(tǒng)在災(zāi)難后迅速處理業(yè)務(wù)(例如,認(rèn)證業(yè)務(wù))激增。
[0099] 在一些實(shí)施方式中,步驟450包括設(shè)置QoS業(yè)務(wù)管理策略。在一個(gè)進(jìn)一步的實(shí)施 方式中,可以向諸如路由器的恢復(fù)資源發(fā)送帶有建議在時(shí)間期間將排隊(duì)策略設(shè)置為嚴(yán)格的 優(yōu)先級(jí)隊(duì)列的信息的災(zāi)難預(yù)警警報(bào)消息。例如,為了幫助便于傳輸高優(yōu)先級(jí)分組或?qū)崟r(shí)分 組--以犧牲其他分組類型為代價(jià)。在第二個(gè)進(jìn)一步的實(shí)施方式中,可以向諸如路由器的 恢復(fù)資源發(fā)送帶有建議減少某類型的分組(例如,視頻)的信息的災(zāi)難預(yù)警警報(bào)消息。在 第三個(gè)進(jìn)一步的實(shí)施方式中,可以向諸如數(shù)據(jù)中心中的應(yīng)用的恢復(fù)應(yīng)用發(fā)送帶有建議在時(shí) 間期間減緩備份策略以減緩處理開(kāi)銷或強(qiáng)制進(jìn)行即時(shí)備份(例如,如果資源監(jiān)視器確定數(shù) 據(jù)中心在危險(xiǎn)區(qū)域中,可以強(qiáng)制進(jìn)行到遠(yuǎn)程位置的備份,以保護(hù)數(shù)據(jù)存儲(chǔ)的完整性)的信 息的災(zāi)難預(yù)警警報(bào)消息。
[0100] 在一些實(shí)施方式中,步驟470包括如果在時(shí)間間隔期間不產(chǎn)生業(yè)務(wù)高峰則進(jìn)行回 退。在一些實(shí)施方式中,回退間隔可以小于等于30分鐘。在這些實(shí)施方式的進(jìn)一步的實(shí)施 方式中,回退間隔基于如何對(duì)作為基礎(chǔ)設(shè)施的服務(wù)進(jìn)行收費(fèi)。例如,可以按小時(shí)對(duì)服務(wù)提供 商對(duì)服務(wù)提供商用于其應(yīng)用的資源量進(jìn)行收費(fèi)。在該示例中,服務(wù)提供商可以按小時(shí)設(shè)置 回退間隔。
[0101] 在一些實(shí)施方式中,步驟470包括如果設(shè)備接收隨后的"清除所有(all clear)" 則回退。例如,資源監(jiān)視器(例如,圖10的資源監(jiān)視器150)可以確定由于誤報(bào)的條件或由 于災(zāi)難已過(guò)去而災(zāi)難條件過(guò)期。在該實(shí)施方式中,資源監(jiān)視器可以發(fā)送隨后的消息到設(shè)備, 通知設(shè)備災(zāi)難條件過(guò)期。
[0102] 雖然主要以特定順序進(jìn)行了描述和繪示,但是應(yīng)當(dāng)理解的是,方法200中、300和 400中所示的步驟可以以任何適當(dāng)?shù)捻樞騺?lái)執(zhí)行。而且,由一個(gè)步驟識(shí)別的步驟可以按順序 在一個(gè)或多個(gè)其他步驟中執(zhí)行,或者可以只一次就執(zhí)行多個(gè)步驟的普通操作。
[0103] 應(yīng)該理解,可以有可編程計(jì)算機(jī)執(zhí)行各種上述方法的步驟。這里,一些實(shí)施方式還 旨在覆蓋程序存儲(chǔ)裝置,例如數(shù)據(jù)存儲(chǔ)介質(zhì),該數(shù)據(jù)存儲(chǔ)介質(zhì)為機(jī)器或計(jì)算機(jī)可讀的,并對(duì) 機(jī)器可執(zhí)行或計(jì)算機(jī)可執(zhí)行的指令程序進(jìn)行編碼,其中所述指令執(zhí)行上述方法的步驟中的 一些或所有步驟。程序存儲(chǔ)裝置例如可以為數(shù)字存儲(chǔ)器、磁存儲(chǔ)介質(zhì)(諸如磁盤和磁帶)、 硬盤驅(qū)動(dòng)器或光可讀數(shù)據(jù)存儲(chǔ)介質(zhì)。實(shí)施方式還旨在覆蓋被編程為執(zhí)行上述方法的所述步 驟的計(jì)算機(jī)。
[0104] 圖5圖示了諸如圖1的資源監(jiān)視器150、圖1的數(shù)據(jù)中心180的數(shù)據(jù)中心180中的 一個(gè)數(shù)據(jù)中心的虛擬機(jī)或網(wǎng)絡(luò)130的資源中的一個(gè)資源的各種設(shè)備500的實(shí)施方式。設(shè)備 500包括處理器、數(shù)據(jù)存儲(chǔ)器511和I/O接口 530。
[0105] 處理器510控制設(shè)備500的操作。處理器510與數(shù)據(jù)存儲(chǔ)器511相配合。
[0106] 數(shù)據(jù)存儲(chǔ)器511可以視情況而存儲(chǔ)諸如云網(wǎng)絡(luò)度量(例如,來(lái)自圖3的步驟320) 的程序數(shù)據(jù)、采集的云網(wǎng)絡(luò)資源特征(例如,來(lái)自圖3的步驟340)、Q 〇S需求(例如,來(lái)自圖 4的步驟450)、或新的數(shù)據(jù)(例如,來(lái)自圖3的步驟460)。數(shù)據(jù)存儲(chǔ)511還存儲(chǔ)處理器510 可執(zhí)行的程序520。
[0107] 處理器可執(zhí)行的程序520可以包括I/O接口程序521、災(zāi)難條件檢測(cè)程序523、或 快速災(zāi)難恢復(fù)準(zhǔn)備程序525。處理器510與處理器可執(zhí)行程序520相配合。
[0108] I/O接口 530與處理器510和I/O接口程序521相配合,以支持如上所述的通過(guò)圖 1的通信信道125U55或185的通信(例如,在圖3的步驟320中監(jiān)測(cè)云網(wǎng)絡(luò)度量、在圖3 的步驟360中發(fā)送災(zāi)難預(yù)警警報(bào)消息和在圖4的步驟420中接收災(zāi)難預(yù)警警報(bào)消息的過(guò)程 中)。
[0109] 災(zāi)難條件檢測(cè)程序523執(zhí)行如上所述的圖2的步驟230和圖3的方法300的步驟。
[0110] 快速災(zāi)難恢復(fù)準(zhǔn)備程序525執(zhí)行如上所述的圖2的步驟240和圖4的方法400的 步驟。
[0111] 在一些實(shí)施方式中,設(shè)備500可以為虛擬機(jī)。在這些實(shí)施方式的一些實(shí)施方式中, 虛擬機(jī)可以包括來(lái)自不同機(jī)器的組件,或者可以在地理上分散。例如,數(shù)據(jù)存儲(chǔ)器511和處 理器510可以在兩個(gè)不同的物理機(jī)中。
[0112] 當(dāng)在處理器510上實(shí)施處理器可執(zhí)行的程序520時(shí),程序代碼段與處理器結(jié)合以 提供和特定邏輯電路進(jìn)行類似操作的獨(dú)特裝置。
[0113] 雖然關(guān)于實(shí)施方式在此進(jìn)行了繪示和描述,其中,例如在數(shù)據(jù)存儲(chǔ)器和存儲(chǔ)器中 存儲(chǔ)的程序和邏輯通信連接到處理器,應(yīng)該理解,可以以任何其他合適的方式(例如使用 合適數(shù)目的存儲(chǔ)器、存儲(chǔ)單元或數(shù)據(jù)庫(kù)),使用通信耦合到任何合適布置的裝置的任何合適 布置的存儲(chǔ)器、存儲(chǔ)單元或數(shù)據(jù)庫(kù);將信息存儲(chǔ)在存儲(chǔ)器、存儲(chǔ)單元或內(nèi)部或外部數(shù)據(jù)庫(kù)的 任何合適的組合中;或使用任何合適數(shù)量的可訪問(wèn)外部存儲(chǔ)器、存儲(chǔ)單元或數(shù)據(jù)庫(kù)來(lái)存儲(chǔ) 該信息。這樣,這里提到的術(shù)語(yǔ)數(shù)據(jù)存儲(chǔ)指的是包括存儲(chǔ)器、存儲(chǔ)單元和數(shù)據(jù)庫(kù)的所有合適 的組合。
[0114] 說(shuō)明書(shū)和附圖僅示出了本發(fā)明的原理。從而可以理解,雖然這里沒(méi)有明確說(shuō)明和 示出,但是本領(lǐng)域的技術(shù)人員能夠做出各種實(shí)施本發(fā)明的原理的安排,這些安排可以包括 在本發(fā)明的實(shí)質(zhì)和范圍內(nèi)。而且,這里所述的所有示例主要旨在為了教導(dǎo)的目的,以幫助讀 者理解本發(fā)明的原理和發(fā)明人貢獻(xiàn)的用于促進(jìn)本領(lǐng)域技術(shù)的概念,應(yīng)該被解釋為不限制于 這些特別引用的示例和條件。而且,這里說(shuō)明本發(fā)明的原理、方面和實(shí)施方式的所有陳述及 其特定示例旨在包括其等價(jià)變化方式。
[0115] 可以通過(guò)使用專用硬件和能夠執(zhí)行與合適的軟件相關(guān)的軟件的硬件來(lái)提供圖中 所述的各種元件的功能,包括標(biāo)為"處理器"的任何功能塊。當(dāng)由處理器提供功能時(shí),該功 能可以由單個(gè)專用處理器、單個(gè)共享處理器或多個(gè)單獨(dú)個(gè)處理器(其中一些處理器可以共 享)提供。而且,明確使用的術(shù)語(yǔ)"處理器"或"控制器"應(yīng)該被解釋為僅指的是能夠執(zhí)行 軟件的硬件,并且可以暗中包括但不限于數(shù)字信號(hào)處理器(DSP)硬件、網(wǎng)絡(luò)處理器、專用集 成電路(ASIC)、場(chǎng)可編程門陣列(FPGA)、存儲(chǔ)軟件的只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器 (RAM)和非易失性存儲(chǔ)單元。也可以包括其他傳統(tǒng)或定制的硬件。類似的,如圖中所述的任 何開(kāi)關(guān)僅是概念性的??梢酝ㄟ^(guò)程序邏輯的操作,通過(guò)專用邏輯、通過(guò)程序控制和專用邏輯 的交互或甚至手動(dòng)來(lái)執(zhí)行其功能,可以由實(shí)施者根據(jù)更具體地理解上下文來(lái)選擇特定的技 術(shù)。
[0116] 應(yīng)該理解,這里的任何框圖表示實(shí)現(xiàn)本發(fā)明原理的示例電路的概念視圖。類似的, 應(yīng)該理解,任何流程表、流程圖、狀態(tài)轉(zhuǎn)換圖、偽碼等表示實(shí)質(zhì)上可以在計(jì)算機(jī)可讀介質(zhì)上 表示從而由計(jì)算機(jī)或處理器執(zhí)行(無(wú)論是否明確示出該計(jì)算機(jī)或處理器)的各種過(guò)程。
【權(quán)利要求】
1. 一種用于提供快速災(zāi)難恢復(fù)準(zhǔn)備的設(shè)備,該設(shè)備包括: 數(shù)據(jù)存儲(chǔ)器;以及 通信耦合到所述數(shù)據(jù)存儲(chǔ)器的處理器,該處理器被配置成: 監(jiān)測(cè)來(lái)自第一網(wǎng)絡(luò)資源的網(wǎng)絡(luò)度量; 基于接收到的網(wǎng)絡(luò)度量確定已經(jīng)發(fā)生了影響第二網(wǎng)絡(luò)資源的可用性的災(zāi)難條件;以及 發(fā)送災(zāi)害預(yù)警警報(bào)消息到第三網(wǎng)絡(luò)資源; 其中所述第一網(wǎng)絡(luò)資源、第二網(wǎng)絡(luò)資源和第三網(wǎng)絡(luò)資源是不同的資源。
2. 根據(jù)權(quán)利要求1所述的設(shè)備,其中監(jiān)測(cè)的網(wǎng)絡(luò)度量包括監(jiān)測(cè)的業(yè)務(wù)流量,所監(jiān)測(cè)的 業(yè)務(wù)流量包括一個(gè)或多個(gè)流量值;并且其中對(duì)災(zāi)難條件已經(jīng)發(fā)生的確定是基于以下至少一 者做出的:檢測(cè)到所監(jiān)測(cè)的業(yè)務(wù)流量已經(jīng)被中斷、或者檢測(cè)到所監(jiān)測(cè)的業(yè)務(wù)流量具有異常 的流量模式。
3. 根據(jù)權(quán)利要求1所述的設(shè)備,其中所監(jiān)測(cè)的網(wǎng)絡(luò)度量包括外部的傳感器信息。
4. 根據(jù)權(quán)利要求1所述的設(shè)備,其中對(duì)災(zāi)難條件發(fā)生的確定是基于置信水平作出的。
5. 根據(jù)權(quán)利要求1所述的設(shè)備,其中所述處理器還被配置成: 分析多個(gè)網(wǎng)絡(luò)資源; 基于所述多個(gè)網(wǎng)絡(luò)資源確定災(zāi)難恢復(fù)建議;以及 基于所述災(zāi)難恢復(fù)建議選擇第三網(wǎng)絡(luò)資源。
6. -種用于提供快速災(zāi)難恢復(fù)準(zhǔn)備的設(shè)備,該設(shè)備包括: 數(shù)據(jù)存儲(chǔ)器;以及 通信耦合到所述數(shù)據(jù)存儲(chǔ)器的處理器,所述處理器被配置成: 接收災(zāi)難預(yù)警警報(bào)消息;以及 執(zhí)行快速?gòu)椥栽黾硬僮?,所述快速?gòu)椥栽黾硬僮靼ǎ涸诔^(guò)使 用閾值之前增加網(wǎng)絡(luò)資源。
7. 根據(jù)權(quán)利要求6所述的設(shè)備,其中所述快速?gòu)椥栽黾硬僮鬟€包括基于所接收到的災(zāi) 難預(yù)警警報(bào)消息的增加速率。
8. 根據(jù)權(quán)利要求6所述的設(shè)備,其中所述處理器還被配置成: 監(jiān)測(cè)業(yè)務(wù)負(fù)載; 基于所監(jiān)測(cè)的業(yè)務(wù)負(fù)載確定災(zāi)難條件不存在;以及 響應(yīng)于確定災(zāi)難條件不存在,而執(zhí)行彈性縮小操作,所述彈性縮小操作釋放至少一部 分網(wǎng)絡(luò)資源的增加。
9. 一種用于提供快速災(zāi)難恢復(fù)準(zhǔn)備的方法,該方法包括: 在通信耦合到數(shù)據(jù)存儲(chǔ)器的處理器上,從第一網(wǎng)絡(luò)資源接收網(wǎng)絡(luò)度量; 通過(guò)與所述數(shù)據(jù)存儲(chǔ)器合作的所述處理器,基于所接收到的網(wǎng)絡(luò)度量確定已經(jīng)發(fā)生了 影響第二網(wǎng)絡(luò)資源的可用性的災(zāi)難條件;以及 通過(guò)與所述數(shù)據(jù)存儲(chǔ)器合作的所述處理器,發(fā)送災(zāi)害預(yù)警警報(bào)消息到第三網(wǎng)絡(luò)資源; 其中所述第一網(wǎng)絡(luò)資源、第二網(wǎng)絡(luò)資源和第三網(wǎng)絡(luò)資源是不同的資源。
10. 根據(jù)權(quán)利要求9所述的方法,該方法還包括: 通過(guò)所述第三網(wǎng)絡(luò)資源,接收災(zāi)難預(yù)警警報(bào)消息;以及 通過(guò)所述第三網(wǎng)絡(luò)資源,執(zhí)行快速?gòu)椥栽黾硬僮?,所述快速?gòu)椥栽黾硬僮靼ǎ涸诔^(guò) 使用閾值之前增加網(wǎng)絡(luò)資源。
【文檔編號(hào)】H04L12/26GK104126285SQ201380009523
【公開(kāi)日】2014年10月29日 申請(qǐng)日期:2013年2月1日 優(yōu)先權(quán)日:2012年2月14日
【發(fā)明者】E·J·鮑爾, R·S·亞當(dāng)斯, D·W·尤斯塔斯 申請(qǐng)人:阿爾卡特朗訊公司