本發(fā)明涉及數(shù)據(jù)容災(zāi)技術(shù)領(lǐng)域,特別是涉及一種獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法及裝置。
背景技術(shù):
一般集群監(jiān)控信息的收集,都采用單獨的數(shù)據(jù)收集服務(wù)器,對各個集群節(jié)點的監(jiān)控信息進(jìn)行收集,然后額外增加備份設(shè)備?;蛘卟捎脧V播方式在每個集群節(jié)點上收集所有節(jié)點監(jiān)控信息,再由單獨的數(shù)據(jù)收集服務(wù)器對單一節(jié)點進(jìn)行監(jiān)控信息讀取,最后由管理軟件到數(shù)據(jù)收集服務(wù)器進(jìn)行數(shù)據(jù)獲取。
讓每個節(jié)點都收集所有節(jié)點監(jiān)控信息的方式,在時間消耗上投入較大。而將監(jiān)控信息放入數(shù)據(jù)庫,對數(shù)據(jù)庫進(jìn)行容災(zāi)保護的方式,則對容災(zāi)投入消耗較大。而一對一的管理軟件獲取監(jiān)控數(shù)據(jù)的方式也增加了容災(zāi)時用戶等待數(shù)據(jù)切換的成本。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法及裝置,目的在于在保證監(jiān)控信息容災(zāi)可靠性的前提下,減少系統(tǒng)帶寬消耗,減少數(shù)據(jù)容災(zāi)成本。
為解決上述技術(shù)問題,本發(fā)明提供一種獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法,包括:
每個集群節(jié)點收集本機監(jiān)控信息,并獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息;
通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù);
當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點,通過所述當(dāng)前集群主節(jié)點獲取監(jiān)控數(shù)據(jù)。
可選地,所述通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù)包括:
通過telnet根據(jù)設(shè)置的集群主節(jié)點IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
可選地,所述當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點包括:
當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,通過telnet根據(jù)指定的當(dāng)前集群主節(jié)點的IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
可選地,所述獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息包括:
通過預(yù)先配置的所有集群節(jié)點廣播路徑,獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息。
可選地,在所述獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息之后還包括:
將獲取到的所有監(jiān)控信息保存至本節(jié)點數(shù)據(jù)庫中。
本發(fā)明還提供了一種獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置,包括:
收集模塊,用于每個集群節(jié)點收集本機監(jiān)控信息,并獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息;
獲取模塊,用于通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù);
容災(zāi)模塊,用于當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點,通過所述當(dāng)前集群主節(jié)點獲取監(jiān)控數(shù)據(jù)。
可選地,所述獲取模塊具體用于:
通過telnet根據(jù)設(shè)置的集群主節(jié)點IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
可選地,所述容災(zāi)模塊具體用于:
當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,通過telnet根據(jù)指定的當(dāng)前集群主節(jié)點的IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
可選地,所述收集模塊具體用于
通過預(yù)先配置的所有集群節(jié)點廣播路徑,獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息。
可選地,還包括:
存儲模塊,用于在獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息之后,將獲取到的所有監(jiān)控信息保存至本節(jié)點數(shù)據(jù)庫中。
本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法及裝置,每個集群節(jié)點收集本機監(jiān)控信息,并獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息;通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù);當(dāng)檢測到集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點,通過當(dāng)前集群主節(jié)點獲取監(jiān)控數(shù)據(jù)。本發(fā)明打破了原有低效、缺乏容災(zāi)方案或等待容災(zāi)時間過長的管理軟件獲取監(jiān)控信息的方式,考慮了集群環(huán)境的特殊性,將監(jiān)控信息的收集、容災(zāi)方案變?yōu)?+N的模式,將管理軟件獲取數(shù)據(jù)的容災(zāi)等待時間省略??梢栽诒WC監(jiān)控信息安全的同時,節(jié)省了監(jiān)控信息收集時間以及帶寬資源的消耗,并達(dá)到無縫切換數(shù)據(jù)獲取對象的目的。
附圖說明
為了更清楚的說明本發(fā)明實施例或現(xiàn)有技術(shù)的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法的一種具體實施方式的流程圖;
圖2為本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)容災(zāi)方法的另一種實施方式中集群初始狀態(tài)的示意圖;
圖3為本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)容災(zāi)方法的另一種實施方式中節(jié)點監(jiān)控信息廣播發(fā)送、監(jiān)控數(shù)據(jù)保存的過程示意圖:
圖4為本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)容災(zāi)方法的另一種實施方式中管理軟件獲取集群監(jiān)控數(shù)據(jù)的過程示意圖;
圖5為本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)容災(zāi)方法的另一種實施方式中災(zāi)備過程示意圖;
圖6為本發(fā)明實施例提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置的結(jié)構(gòu)框圖。
具體實施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和具體實施方式對本發(fā)明作進(jìn)一步的詳細(xì)說明。顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法的一種具體實施方式的流程圖如圖1所示,該方法包括:
步驟S101:每個集群節(jié)點收集本機監(jiān)控信息,并獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息;
步驟S102:通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù);
步驟S103:當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點,通過所述當(dāng)前集群主節(jié)點獲取監(jiān)控數(shù)據(jù)。
本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法,每個集群節(jié)點收集本機監(jiān)控信息,并獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息;通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù);當(dāng)檢測到集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點,通過當(dāng)前集群主節(jié)點獲取監(jiān)控數(shù)據(jù)。本發(fā)明打破了原有低效、缺乏容災(zāi)方案或等待容災(zāi)時間過長的管理軟件獲取監(jiān)控信息的方式,考慮了集群環(huán)境的特殊性,將監(jiān)控信息的收集、容災(zāi)方案變?yōu)?+N的模式,將管理軟件獲取數(shù)據(jù)的容災(zāi)等待時間省略??梢栽诒WC監(jiān)控信息安全的同時,節(jié)省了監(jiān)控信息收集時間以及帶寬資源的消耗,并達(dá)到無縫切換數(shù)據(jù)獲取對象的目的。
在上述實施例的基礎(chǔ)上,本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法中,通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù)的過程可以具體包括:
通過telnet根據(jù)設(shè)置的集群主節(jié)點IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
進(jìn)一步地,當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點的過程可以具體為:
當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,通過telnet根據(jù)指定的當(dāng)前集群主節(jié)點的IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
在上述任一實施例的基礎(chǔ)上,本申請中各節(jié)點獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息的過程為:
通過預(yù)先配置的所有集群節(jié)點廣播路徑,獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息。
作為一種具體實施方式,在上述獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息之后還可以進(jìn)一步包括:
將獲取到的所有監(jiān)控信息保存至本節(jié)點數(shù)據(jù)庫中。
具體地,本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法可通過集群健康監(jiān)測、IP配置模塊、監(jiān)控廣播配置模塊以及監(jiān)控數(shù)據(jù)代理模塊實現(xiàn)。
本申請硬件環(huán)境是處在集群環(huán)境中,因此,在集群環(huán)境搭建完成后,由監(jiān)控廣播配置模塊配置所有集群節(jié)點廣播路徑。在集群所有節(jié)點上初始監(jiān)控信息數(shù)據(jù)庫到同一狀態(tài)。監(jiān)控廣播配置模塊配置其他節(jié)點廣播路徑。每個集群節(jié)點將只單獨收集本機監(jiān)控信息,然后通過廣播方式將監(jiān)控信息發(fā)送到其他所有節(jié)點上,然后由每個子節(jié)點的監(jiān)控數(shù)據(jù)代理模塊將所有監(jiān)控信息保存到本節(jié)點的數(shù)據(jù)庫中。
由集群健康監(jiān)測和IP配置模塊指定某一集群節(jié)點為集群主節(jié)點,并設(shè)置管理軟件獲取監(jiān)控數(shù)據(jù)的主集群節(jié)點IP,管理軟件將通過telnet等方式獲取主集群節(jié)點上數(shù)據(jù)庫中的監(jiān)控數(shù)據(jù)。當(dāng)主節(jié)點發(fā)生宕機時,由集群健康監(jiān)測和IP配置模塊重新選擇其他節(jié)點提升為主集群節(jié)點,并設(shè)置管理軟件獲取監(jiān)控數(shù)據(jù)的節(jié)點IP,轉(zhuǎn)換管理軟件獲取監(jiān)控數(shù)據(jù)的節(jié)點對象。
下面結(jié)合附圖對本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)容災(zāi)方法的另一種實施方式的實施過程進(jìn)行進(jìn)一步詳細(xì)描述。請參照圖2至圖5,圖2為集群初始狀態(tài)的示意圖,圖3為節(jié)點監(jiān)控信息廣播發(fā)送、監(jiān)控數(shù)據(jù)保存的過程示意圖,圖4為管理軟件獲取集群監(jiān)控數(shù)據(jù)過程示意圖;圖5為災(zāi)備過程示意圖。
如圖2所示,集群節(jié)點1為主節(jié)點,各個節(jié)點收集本機監(jiān)控信息。
如圖3所示,所有集群節(jié)點廣播發(fā)送本機監(jiān)控信息到其他所有節(jié)點,監(jiān)控數(shù)據(jù)代理模塊將整個集群所有監(jiān)控信息保存到本節(jié)點數(shù)據(jù)庫。
如圖4所示,管理軟件通過telnet等方法,根據(jù)集群健康監(jiān)測和IP配置模塊指定的主節(jié)點IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
如圖5所示,當(dāng)主節(jié)點宕機后,集群健康監(jiān)測和IP配置模塊從集群其他節(jié)點選擇一個提升為主節(jié)點。管理軟件通過telnet根據(jù)集群健康監(jiān)測和IP配置模塊指定的新的主節(jié)點IP進(jìn)行監(jiān)控數(shù)據(jù)獲取,達(dá)到無縫切換。
下面對本發(fā)明實施例提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置進(jìn)行介紹,下文描述的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置與上文描述的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法可相互對應(yīng)參照。
圖6為本發(fā)明實施例提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置的結(jié)構(gòu)框圖,參照圖6獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置可以包括:
收集模塊100,用于每個集群節(jié)點收集本機監(jiān)控信息,并獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息;
獲取模塊200,用于通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù);
容災(zāi)模塊300,用于當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點,通過所述當(dāng)前集群主節(jié)點獲取監(jiān)控數(shù)據(jù)。
在上述實施例的基礎(chǔ)上,本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置中,上述獲取模塊200具體用于:
通過telnet根據(jù)設(shè)置的集群主節(jié)點IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
進(jìn)一步地,上述容災(zāi)模塊300可以具體用于:
當(dāng)檢測到所述集群主節(jié)點發(fā)生宕機時,通過telnet根據(jù)指定的當(dāng)前集群主節(jié)點的IP進(jìn)行監(jiān)控數(shù)據(jù)獲取。
在上述任一實施例的基礎(chǔ)上,本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置中,收集模塊100可以具體用于:
通過預(yù)先配置的所有集群節(jié)點廣播路徑,獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息。
此外,本申請所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置還可以進(jìn)一步包括:
存儲模塊,用于在獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息之后,將獲取到的所有監(jiān)控信息保存至本節(jié)點數(shù)據(jù)庫中。
本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)裝置,每個集群節(jié)點收集本機監(jiān)控信息,并獲取集群內(nèi)其他所有節(jié)點的監(jiān)控信息;通過設(shè)置的集群主節(jié)點獲取集群的監(jiān)控數(shù)據(jù);當(dāng)檢測到集群主節(jié)點發(fā)生宕機時,重新選擇其他節(jié)點作為當(dāng)前集群主節(jié)點,通過當(dāng)前集群主節(jié)點獲取監(jiān)控數(shù)據(jù)。本發(fā)明打破了原有低效、缺乏容災(zāi)方案或等待容災(zāi)時間過長的管理軟件獲取監(jiān)控信息的方式,考慮了集群環(huán)境的特殊性,將監(jiān)控信息的收集、容災(zāi)方案變?yōu)?+N的模式,將管理軟件獲取數(shù)據(jù)的容災(zāi)等待時間省略??梢栽诒WC監(jiān)控信息安全的同時,節(jié)省了監(jiān)控信息收集時間以及帶寬資源的消耗,并達(dá)到無縫切換數(shù)據(jù)獲取對象的目的。
本說明書中各個實施例采用遞進(jìn)的方式描述,每個實施例重點說明的都是與其它實施例的不同之處,各個實施例之間相同或相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
專業(yè)人員還可以進(jìn)一步意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(RAM)、內(nèi)存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
以上對本發(fā)明所提供的獲取集群監(jiān)控數(shù)據(jù)的容災(zāi)方法以及裝置進(jìn)行了詳細(xì)介紹。本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進(jìn)行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對本發(fā)明進(jìn)行若干改進(jìn)和修飾,這些改進(jìn)和修飾也落入本發(fā)明權(quán)利要求的保護范圍內(nèi)。