两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法與流程

文檔序號:12729333閱讀:243來源:國知局

本發(fā)明屬于云計算技術領域;具體涉及一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法。



背景技術:

云資源監(jiān)控系統(tǒng)是保證云平臺正常運轉的關鍵,旨在收集資源負載信息,是作業(yè)調度、負載均衡、事件預測、故障檢測及恢復等的前提。

對云平臺上動態(tài)、復雜的虛擬資源進行實時、有效的監(jiān)控和管理是保證云平臺可用性的關鍵。

現(xiàn)有云監(jiān)控系統(tǒng)中,為實時反映云平臺中的資源負載情況,監(jiān)控組件需要大量收集資源負載信息,監(jiān)控組件與被監(jiān)控資源間存在頻繁的數(shù)據(jù)傳輸,造成較大的通信開銷,容易導致網(wǎng)絡擁堵,很難做到監(jiān)控信息的實時同步和監(jiān)控系統(tǒng)的穩(wěn)定可靠,并對云平臺的運轉造成干擾,影響云平臺的正常使用,降低服務質量。此為現(xiàn)有技術的不足之處。

因此,針對現(xiàn)有技術中的上述缺陷,提供設計一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法;以解決上述技術問題,是非常有必要的。



技術實現(xiàn)要素:

本發(fā)明的目的在于,針對上述現(xiàn)有技術存在的缺陷,提供設計一種高可用的云監(jiān)控系統(tǒng)及監(jiān)控方法,以解決上述技術問題。

為實現(xiàn)上述目的,本發(fā)明給出以下技術方案:

一種高可用的云監(jiān)控系統(tǒng),它包括設置于各個待檢測節(jié)點的agent模塊;其特征在于,各agent模塊將采集到的待檢測節(jié)點的狀態(tài)信息發(fā)送到agentCluster節(jié)點,agentCluster節(jié)點將采集到的數(shù)據(jù)發(fā)送至SERVER服務端;

所述的待檢測節(jié)點包括物理主機和虛擬機。

優(yōu)選地,各agent模塊之間定期相互發(fā)送心跳信息。

本發(fā)明還給出一種高可用的云監(jiān)控方法,包括以下步驟:

步驟1):在待監(jiān)控主機中設置智能agent模塊,并通過Server服務端以文件的形式將監(jiān)控任務發(fā)送到待監(jiān)控主機中;待監(jiān)控主機包括物理主機以及虛擬機;

步驟2):將監(jiān)控腳本(BAT或是SHELL形式)通過Server服務端傳送到待監(jiān)控物理主機以及虛擬機中;腳本傳輸完結束后向agent模塊傳送監(jiān)控命令,agent模塊收到命令后運行對應的腳本文件,采集監(jiān)控數(shù)據(jù);

步驟3):以物理主機中的agent模塊作為agentCluster節(jié)點,虛擬機中的agent作為Cluster群集合的成員;Cluster群集合成員中的各agent模塊之間以固定時間Theartbeating發(fā)送心跳數(shù)據(jù)報文,作為各agent模塊存活的標志;

步驟4):各agent模塊依據(jù)任務列表讀取任務腳本,發(fā)送采集到的數(shù)據(jù)給agentCluster節(jié)點;初始監(jiān)控周期為default_monitor_time(i),同時設置監(jiān)控周期變化步長,采樣的時間間隔的調整大小為原子時間atomic_time(i)的整數(shù)倍;

步驟5):agent分別為不同的監(jiān)控指標建立對應的存儲隊列,并計算數(shù)據(jù)緩沖隊列中的數(shù)據(jù)的偏差情況,其計算使用如下模型:

其中δ表示樣本數(shù)據(jù)的標準差,Xi為采集到的第i個數(shù)據(jù)的狀態(tài)信息;

步驟6):在步驟5)的基礎上,定義第i個監(jiān)控指標的數(shù)據(jù)偏差的上限為threshold(i);如果采集到的數(shù)據(jù)的變化趨勢較為平穩(wěn)即δ<threshold(i),則增大數(shù)據(jù)監(jiān)控采樣周期,如果監(jiān)控采集到的數(shù)據(jù)的變化趨勢較大,即δ>=threshold(i),則縮小數(shù)據(jù)監(jiān)控采樣周期的大??;

步驟7):agentCluster節(jié)點接收到數(shù)據(jù)之后,將監(jiān)控數(shù)據(jù)通過消息隊列發(fā)送給監(jiān)控平臺的Server服務端。

作為優(yōu)選,所述步驟1)中,監(jiān)控任務包括監(jiān)控指標(cpu,內存,存儲等)以及監(jiān)控腳本的存放路徑。

作為優(yōu)選,所述步驟3)中還包括以下步驟:

當agent超過時間Theartbeating,沒有發(fā)送心跳數(shù)據(jù),則認為該agent已關閉;agentCluster節(jié)點負責定時報告成員agent的運行狀態(tài);當cluster群集合成員發(fā)現(xiàn)agentCluster關閉,則啟動分布式選舉算法Paxos,重新選擇agentCluster節(jié)點。

作為優(yōu)選,所述步驟6)中,增大數(shù)據(jù)監(jiān)控采樣周期的計算模型為:

monitor_time(i)=default_monitor_time(i)①

monitor_time(i)=monitor_time(i)+atomic_time(i)*f(δ,threshold(i))②

其中公式①表示監(jiān)控指標i的采樣周期的初始化設置;公式②表示監(jiān)控指標i的采樣周期的動態(tài)調整,其中f(δ,threshold(i))表示數(shù)據(jù)偏差值δ與閾值threshold(i)的對應函數(shù)關系;

縮小數(shù)據(jù)監(jiān)控采樣周期的計算模型為:

monitor_time(i)=max(monitor_time(i)/2,atomic_time(i))。

本發(fā)明的有益效果在于,動態(tài)調整agent采集數(shù)據(jù)的周期,減少監(jiān)控系統(tǒng)冗余數(shù)據(jù)的傳輸,保證云監(jiān)控系統(tǒng)的高效穩(wěn)定。同時節(jié)點定時報告自己的運行狀態(tài),并通過選舉算法避免了單節(jié)點失效問題的發(fā)生。此外,本發(fā)明設計原理可靠,結構簡單,具有非常廣泛的應用前景。

由此可見,本發(fā)明與現(xiàn)有技術相比,具有突出的實質性特點和顯著地進步,其實施的有益效果也是顯而易見的。

附圖說明

圖1是本發(fā)明提供的一種高可用的云監(jiān)控系統(tǒng)的原理框圖。

其中,1-agent模塊,2-agentCluster,3-虛擬機,4-物理主機,5-Server服務端,6-消息隊列。

具體實施方式

下面結合附圖并通過具體實施例對本發(fā)明進行詳細闡述,以下實施例是對本發(fā)明的解釋,而本發(fā)明并不局限于以下實施方式。

如圖1所示,本發(fā)明提供的一種高可用的云監(jiān)控系統(tǒng),它包括設置于各個待檢測節(jié)點的agent模塊;其特征在于,各agent模塊將采集到的待檢測節(jié)點的狀態(tài)信息發(fā)送到agentCluster節(jié)點,agentCluster節(jié)點將采集到的數(shù)據(jù)發(fā)送至Server服務端;

所述的待檢測節(jié)點包括物理主機和虛擬機。

本實施例中,各agent模塊之間定期相互發(fā)送心跳信息。

本發(fā)明還給出一種高可用的云監(jiān)控方法,包括以下步驟:

步驟1):在待監(jiān)控主機中設置智能agent模塊,并通過Server服務端以文件的形式將監(jiān)控任務發(fā)送到待監(jiān)控主機中;待監(jiān)控主機包括物理主機以及虛擬機;

步驟2):將監(jiān)控腳本(BAT或是SHELL形式)通過Server服務端傳送到待監(jiān)控物理主機以及虛擬機中;腳本傳輸完結束后向agent模塊傳送監(jiān)控命令,agent模塊收到命令后運行對應的腳本文件,采集監(jiān)控數(shù)據(jù);

步驟3):以物理主機中的agent模塊作為agentCluster節(jié)點,虛擬機中的agent作為Cluster群集合的成員;Cluster群集合成員中的各agent模塊之間以固定時間Theartbeating發(fā)送心跳數(shù)據(jù)報文,作為各agent模塊存活的標志;

步驟4):各agent模塊依據(jù)任務列表讀取任務腳本,發(fā)送采集到的數(shù)據(jù)給agentCluster節(jié)點;初始監(jiān)控周期為default_monitor_time(i),同時設置監(jiān)控周期變化步長,采樣的時間間隔的調整大小為原子時間atomic_time(i)的整數(shù)倍;

步驟5):agent分別為不同的監(jiān)控指標建立對應的存儲隊列,并計算數(shù)據(jù)緩沖隊列中的數(shù)據(jù)的偏差情況,其計算使用如下模型:

其中δ表示樣本數(shù)據(jù)的標準差,Xi為采集到的第i個數(shù)據(jù)的狀態(tài)信息;

步驟6):在步驟5)的基礎上,定義第i個監(jiān)控指標的數(shù)據(jù)偏差的上限為threshold(i);如果采集到的數(shù)據(jù)的變化趨勢較為平穩(wěn)即δ<threshold(i),則增大數(shù)據(jù)監(jiān)控采樣周期,如果監(jiān)控采集到的數(shù)據(jù)的變化趨勢較大,即δ>=threshold(i),則縮小數(shù)據(jù)監(jiān)控采樣周期的大?。?/p>

步驟7):agentCluster節(jié)點接收到數(shù)據(jù)之后,將監(jiān)控數(shù)據(jù)通過消息隊列發(fā)送給監(jiān)控平臺的SERVER服務端。

本實施例中,所述步驟1)中,監(jiān)控任務包括監(jiān)控指標(cpu,內存,存儲等)以及監(jiān)控腳本的存放路徑。

所述步驟3)中還包括以下步驟:

當agent超過時間Theartbeating,沒有發(fā)送心跳數(shù)據(jù),則認為該agent已關閉;agentCluster節(jié)點負責定時報告成員agent的運行狀態(tài);當cluster群集合成員發(fā)現(xiàn)agentCluster關閉,則啟動分布式選舉算法Paxos,重新選擇agentCluster節(jié)點。

所述步驟6)中,增大數(shù)據(jù)監(jiān)控采樣周期的計算模型為:

monitor_time(i)=default_monitor_time(i) ①

monitor_time(i)=monitor_time(i)+atomic_time(i)*f(δ,threshold(i)) ②

其中公式①表示監(jiān)控指標i的采樣周期的初始化設置;公式②表示監(jiān)控指標i的采樣周期的動態(tài)調整,其中f(δ,threshold(i))表示數(shù)據(jù)偏差值δ與閾值threshold(i)的對應函數(shù)關系;

縮小數(shù)據(jù)監(jiān)控采樣周期的計算模型為:

monitor_time(i)=max(monitor_time(i)/2,atomic_time(i))。

以上公開的僅為本發(fā)明的優(yōu)選實施方式,但本發(fā)明并非局限于此,任何本領域的技術人員能思之的沒有創(chuàng)造性的變化,以及在不脫離本發(fā)明原理前提下所作的若干改進和潤飾,都應落在本發(fā)明的保護范圍內。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
中江县| 佛冈县| 临西县| 邵阳市| 昭觉县| 中方县| 广饶县| 峨眉山市| 固阳县| 梁河县| 忻州市| 静海县| 如东县| 乐至县| 黑龙江省| 饶河县| 鲁山县| 井研县| 大宁县| 二连浩特市| 福泉市| 鹤岗市| 天祝| 吐鲁番市| 岳西县| 都安| 吴忠市| 南宁市| 横峰县| 荥阳市| 永丰县| 竹北市| 晋城| 宁安市| 象山县| 彰武县| 梁山县| 吴旗县| 抚远县| 新乡县| 巴塘县|