一種適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的請(qǐng)求多副本任務(wù)執(zhí)行方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及云計(jì)算的在線(xiàn)數(shù)據(jù)密集型應(yīng)用,更特別地說(shuō),是指一種適用于在線(xiàn)數(shù) 據(jù)密集型應(yīng)用中,且具有面向低響應(yīng)時(shí)延應(yīng)用的、能夠節(jié)省計(jì)算資源的請(qǐng)求多副本調(diào)度方 法。
【背景技術(shù)】
[0002] 云計(jì)算(Cloud Computing)是網(wǎng)絡(luò)計(jì)算(Grid Computing)、分布式計(jì)算 (Distributed Computing)、并行計(jì)算(Parallel ComPuting)、效用計(jì)算(Utility ComPuting)、網(wǎng)絡(luò)存儲(chǔ)(Network Storage Technologies)、虛擬化(Virtualization)、負(fù)載 均衡(Load Balance)等傳統(tǒng)計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)發(fā)展融合的產(chǎn)物。它旨在通過(guò)網(wǎng)絡(luò)把多 個(gè)成本相對(duì)較低的計(jì)算實(shí)體整合成一個(gè)具有強(qiáng)大計(jì)算能力的完美系統(tǒng),并借助SaaS、PaaS、 IaaS、MSP等先進(jìn)的商業(yè)模式把這強(qiáng)大的計(jì)算能力分布到終端用戶(hù)手中。
[0003] 云計(jì)算的基本原理是:在大量的分布式計(jì)算機(jī)集群上,通過(guò)虛擬技術(shù)使這些硬件 基礎(chǔ)設(shè)施形成集群,實(shí)現(xiàn)不同的資源池(如存儲(chǔ)資源池、網(wǎng)絡(luò)資源池、計(jì)算機(jī)資源池、數(shù)據(jù) 資源池和軟件資源池),對(duì)這些資源池實(shí)現(xiàn)自動(dòng)管理,部署成不同的服務(wù)(Service)供用戶(hù) (User)使用。
[0004] 由于云計(jì)算分為SaaS、PaaS和IaaS三種類(lèi)型,目前各個(gè)廠商還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn), 不同的廠商又提供了不同的解決方案,直接導(dǎo)致了用戶(hù)(User)在選擇解決方案時(shí)的困惑。 2013年8月第1版《云計(jì)算應(yīng)用技術(shù)》,作者萬(wàn)川梅,第9頁(yè)和第10頁(yè)介紹了云計(jì)算的構(gòu)成, 如圖1所示。圖中的"任務(wù)執(zhí)行(Task Execution)"是為了響應(yīng)用戶(hù)(User)的需求。
[0005] 近年來(lái),在線(xiàn)數(shù)據(jù)密集型(On Line Data Intensive,0LDI)應(yīng)用成為云計(jì)算研宄 中的熱話(huà)題。應(yīng)用(Application)對(duì)于訪(fǎng)問(wèn)延遲和吞吐量等性能參數(shù)有很高的要求,所述 應(yīng)用(Application)如社交網(wǎng)絡(luò)、信息檢索和電子商務(wù)等。
[0006] 在線(xiàn)數(shù)據(jù)密集型應(yīng)用的發(fā)展十分迅速,"在線(xiàn)"表示應(yīng)用(Application)需要與用 戶(hù)(User)進(jìn)行大量交互,"數(shù)據(jù)密集"意味著應(yīng)用(Application)的單次請(qǐng)求往往牽涉到成 百上千臺(tái)服務(wù)器以及TB級(jí)的數(shù)據(jù)量。這類(lèi)應(yīng)用(Application)通常要求單次請(qǐng)求的響應(yīng) 時(shí)間(Response time)為秒級(jí)甚至毫秒級(jí),過(guò)長(zhǎng)的響應(yīng)時(shí)間不僅影響了用戶(hù)(User)體驗(yàn), 更損害了服務(wù)提供商的收益。例如對(duì)于搜索服務(wù)bing,其響應(yīng)時(shí)間每超過(guò)500毫秒就會(huì)導(dǎo) 致其收益降低1. 2% ;而電子商務(wù)則對(duì)響應(yīng)時(shí)間更為敏感,來(lái)自amazon的數(shù)據(jù)顯示,響應(yīng)時(shí) 間每超過(guò)100毫秒將導(dǎo)致商品銷(xiāo)售量下滑1 %。因此,保障這類(lèi)延遲受限類(lèi)應(yīng)用的服務(wù)質(zhì)量 (Quality of service)具有重要的商業(yè)價(jià)值。
[0007] 目前,在線(xiàn)數(shù)據(jù)密集型(On Line Data Intensive,0LDI)應(yīng)用采用從后端從節(jié) 點(diǎn)的角度徹底解決任務(wù)運(yùn)行時(shí)間的不確定性,然而這種不確定性的影響因素是來(lái)自多方 面的,包括網(wǎng)絡(luò)擁塞,后端從節(jié)點(diǎn)內(nèi)其它后臺(tái)進(jìn)程的干擾、調(diào)度策略、能耗管控等等。這些 因素很難得到徹底解決,而且由于應(yīng)用(Application)的多樣性,尋求一種具有普適性的 解決方案也并不現(xiàn)實(shí)。因此,目前的研宄主要集中于提高后端主節(jié)點(diǎn)對(duì)后端從節(jié)點(diǎn)不穩(wěn) 定性的容忍程度,典型的方法為多副本執(zhí)行,但這種方法實(shí)質(zhì)上是通過(guò)占用大量物理資源 (Physical Resources)實(shí)現(xiàn)的,而事實(shí)上,這些物理資源(Physical Resources)并不都是 必需的。此外,當(dāng)系統(tǒng)負(fù)載(Load)較高時(shí),盲目的多副本執(zhí)行會(huì)加重后端從節(jié)點(diǎn)的負(fù)載,反 而使任務(wù)運(yùn)行時(shí)間的不確定性更為嚴(yán)重,進(jìn)而影響到應(yīng)用的服務(wù)質(zhì)量。
【發(fā)明內(nèi)容】
[0008] 為了克服在線(xiàn)數(shù)據(jù)密集型應(yīng)用中傳統(tǒng)多副本執(zhí)行方法存在的物理資源(Physical Resources)浪費(fèi)、以及無(wú)法滿(mǎn)足高負(fù)載(Load)下應(yīng)用的服務(wù)質(zhì)量(Quality of service) 的缺陷,本發(fā)明提出一種適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的請(qǐng)求多副本任務(wù)執(zhí)行方法。
[0009] 本發(fā)明技術(shù)方案是:將在線(xiàn)數(shù)據(jù)密集型應(yīng)用(On Line Data Intensive Application,0LDIA)如何根據(jù)后端從節(jié)點(diǎn)(Back-end slave node)的運(yùn)行狀態(tài)(Running Status)、任務(wù)運(yùn)行特征(Task Running Characteristics)以及應(yīng)用的實(shí)時(shí)負(fù)載 (Application Realtime Load)來(lái)動(dòng)態(tài)調(diào)節(jié)多副本(Multi Replica)的任務(wù)執(zhí)行,從而合理 分配物理資源(Physical Resources),提高了應(yīng)用的服務(wù)質(zhì)量(Quality of service)。與 傳統(tǒng)的多副本任務(wù)執(zhí)行策略相比,對(duì)于保障相同服務(wù)質(zhì)量目標(biāo),使用的物理資源更少,同時(shí) 在應(yīng)用負(fù)載較高時(shí),各后端從節(jié)點(diǎn)能夠自適應(yīng)地調(diào)節(jié)任務(wù)的多副本執(zhí)行比例。
[0010] 本發(fā)明公開(kāi)了一種適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的請(qǐng)求多副本任務(wù)執(zhí)行方法,該方 法包括有設(shè)置執(zhí)行任務(wù)系統(tǒng)所需的初始量和參考量的步驟,記錄副本的各個(gè)時(shí)間特性的步 驟,判斷時(shí)延的步驟和檢查、更新后端從節(jié)點(diǎn)狀態(tài)參考量的步驟。
[0011] 本發(fā)明提出了一種適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的請(qǐng)求多副本任務(wù)執(zhí)行方法,所要 解決的是如何減少多副本執(zhí)行在保障"在線(xiàn)數(shù)據(jù)密集型應(yīng)用"服務(wù)質(zhì)量時(shí)占用的額外資源 的技術(shù)問(wèn)題,該方法通過(guò)利用滑動(dòng)窗口提取副本特征,并對(duì)后端從節(jié)點(diǎn)進(jìn)行性能預(yù)測(cè),動(dòng)態(tài) 調(diào)節(jié)任務(wù)的多副本比例,使"在線(xiàn)數(shù)據(jù)密集型應(yīng)用"系統(tǒng)能夠有效地適應(yīng)負(fù)載水平的動(dòng)態(tài)波 動(dòng);從而提高了"在線(xiàn)數(shù)據(jù)密集型應(yīng)用"系統(tǒng)資源的使用效率的技術(shù)效果。
[0012] 本發(fā)明提出的一種適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的請(qǐng)求多副本任務(wù)執(zhí)行方法的優(yōu) 點(diǎn)在于:
[0013] ①與傳統(tǒng)的多副本執(zhí)行方法相比,對(duì)于保障相同服務(wù)質(zhì)量目標(biāo),本發(fā)明方法使用 了更少的計(jì)算資源。運(yùn)行于在線(xiàn)數(shù)據(jù)密集型應(yīng)用中,能夠提高在線(xiàn)數(shù)據(jù)密集型應(yīng)用的響應(yīng)。
[0014] ②面對(duì)較高的負(fù)載水平,本發(fā)明方法能夠始終保持在線(xiàn)數(shù)據(jù)密集型應(yīng)用的服務(wù)質(zhì) 量目標(biāo),更有效地適應(yīng)負(fù)載水平的動(dòng)態(tài)波動(dòng)。
[0015] ③本發(fā)明方法不改變傳統(tǒng)在線(xiàn)數(shù)據(jù)密集型應(yīng)用的架構(gòu),具有廣泛的適應(yīng)性;以及 在置入現(xiàn)有的在線(xiàn)數(shù)據(jù)密集型應(yīng)用時(shí),接口設(shè)置簡(jiǎn)單。
【附圖說(shuō)明】
[0016] 圖1是云計(jì)算的結(jié)構(gòu)框圖。
[0017] 圖2是傳統(tǒng)在線(xiàn)數(shù)據(jù)密集型應(yīng)用的架構(gòu)框圖。
[0018] 圖3是本發(fā)明后端從節(jié)點(diǎn)的狀態(tài)轉(zhuǎn)移框圖。
[0019] 圖4是本發(fā)明適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的請(qǐng)求多副本任務(wù)執(zhí)行的原理圖。
[0020] 圖5為本發(fā)明適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的請(qǐng)求多副本任務(wù)執(zhí)行的流程圖。
[0021] 圖6是本發(fā)明后端從節(jié)點(diǎn)運(yùn)行副本的時(shí)間關(guān)系示意圖。
[0022]
【具體實(shí)施方式】
[0023] 下面將結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的詳細(xì)說(shuō)明。
[0024] 在圖1所示的云計(jì)算體系中,"任務(wù)執(zhí)行(Task Execution) "是為了響應(yīng)用戶(hù) (User)的需求。而"任務(wù)執(zhí)行"的服務(wù)質(zhì)量通常采用響應(yīng)時(shí)延(或稱(chēng)響應(yīng)時(shí)間)來(lái)評(píng)價(jià)。
[0025] 針對(duì)在線(xiàn)數(shù)據(jù)密集型(On Line Data Intensive,0LDI)應(yīng)用普遍采用了主從 架構(gòu),如圖2所示,首先,前端節(jié)點(diǎn)(Front-end node)向后端主節(jié)點(diǎn)(Back-end master node)發(fā)送請(qǐng)求(Request),后端主節(jié)點(diǎn)將請(qǐng)求解析為一組并行的副本(Replica),并將副 本(Replica)發(fā)送至相應(yīng)后端從節(jié)點(diǎn)(Back-end slave node)上。這種方式可以有效降低 請(qǐng)求的響應(yīng)時(shí)間(Response time),但請(qǐng)求的響應(yīng)時(shí)間(Response time)取決于同組中運(yùn)行 時(shí)間(Run time)最長(zhǎng)的副本(Replica)。
[0026] 本發(fā)明方法的技術(shù)方案為:后端主節(jié)點(diǎn)將所有副本(Multi Replica)同時(shí)發(fā)送至 多個(gè)后端從節(jié)點(diǎn)(即后端A從節(jié)點(diǎn)、后端B從節(jié)點(diǎn)、后端N從節(jié)點(diǎn))上,然后采用運(yùn)行時(shí)間 最短的返回結(jié)果;各后端從節(jié)點(diǎn)可以根據(jù)自身狀態(tài),在副本(Replica)開(kāi)始前就對(duì)副本運(yùn) 行時(shí)間(Run time)能否符合服務(wù)質(zhì)量要求做出判斷,若不符合,則該副本不必再占用該后 端從節(jié)點(diǎn)的物理資源。
[0027] 為了克服在線(xiàn)數(shù)據(jù)密集型應(yīng)用中傳統(tǒng)多副本執(zhí)行方法存在的物理資源(Physical Resources)浪費(fèi)、以及無(wú)法滿(mǎn)足高負(fù)載(Load)下應(yīng)用的服務(wù)質(zhì)量(Quality of service) 的缺陷,本發(fā)明提出一種適用于在線(xiàn)數(shù)據(jù)密集型應(yīng)用的面向低響應(yīng)時(shí)延應(yīng)用且節(jié)省計(jì)算資 源的請(qǐng)求多副本執(zhí)行方法。
[0028] 在本發(fā)明中,后端主節(jié)點(diǎn)的標(biāo)識(shí)號(hào)記為bm。后端從節(jié)點(diǎn)的標(biāo)識(shí)號(hào)記為bs,設(shè)置后 端從節(jié)點(diǎn)的個(gè)數(shù)為N個(gè),在線(xiàn)數(shù)據(jù)密集型應(yīng)用的系統(tǒng)中,如圖2所示后端A從節(jié)點(diǎn)記為bsA, 后端B從節(jié)點(diǎn)記為bsB,后端N從節(jié)點(diǎn)記為bsN,也稱(chēng)為任意一個(gè)后端從節(jié)點(diǎn)bsN。
[0029] 在本發(fā)明中,任意一后端從節(jié)點(diǎn)bsN在滑動(dòng)窗口 Windows時(shí)間內(nèi),統(tǒng)計(jì)接收到的所 有副本(Multi Replica)運(yùn)行于在線(xiàn)數(shù)據(jù)密集型應(yīng)用系統(tǒng)中的服務(wù)