用于在存儲區(qū)域網(wǎng)絡(luò)中處置事件的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本公開內(nèi)容涉及事件處置。特別地,其涉及存儲區(qū)域網(wǎng)絡(luò)環(huán)境內(nèi)的智能事件處置。
【背景技術(shù)】
[0002]存儲區(qū)域網(wǎng)絡(luò)(SAN)能夠包括連接到主機系統(tǒng)和存儲設(shè)備的高速光纖通道網(wǎng)絡(luò)。在SAN中,主機系統(tǒng)能夠跨越網(wǎng)絡(luò)而連接到存儲設(shè)備。這些連接能夠通過諸如路由器和交換機的單元來實現(xiàn)并且能夠由一個或多個存儲控制器來控制。包含這些路由器和交換機的該網(wǎng)絡(luò)的區(qū)域能夠是該網(wǎng)絡(luò)的結(jié)構(gòu)的一部分。
【發(fā)明內(nèi)容】
[0003]在本公開內(nèi)容的某些實施例中,一種存儲區(qū)域網(wǎng)絡(luò)(SAN)被配置為通過對遍及該SAN的不同組件而分布的模塊的使用來提供事件處置。
[0004]各種實施例針對一種用于處置與存儲區(qū)域網(wǎng)絡(luò)有關(guān)的錯誤事件的計算機實施的方法。該方法包括:在該存儲區(qū)域網(wǎng)絡(luò)的第一硬件組件處接收錯誤事件。響應(yīng)于該錯誤事件,在該第一硬件組件上操作的第一事件處置模塊被用來:訪問包含錯誤事件數(shù)據(jù)與錯誤的潛在來源之間的關(guān)聯(lián)的數(shù)據(jù)庫;基于該數(shù)據(jù)庫中的這些關(guān)聯(lián)與該錯誤事件中所包含的錯誤事件數(shù)據(jù)之間的相似性,來識別多個硬件組件;生成針對該多個硬件組件的排名;基于該排名,從該多個硬件組件中選擇特定的硬件組件;將錯誤通知傳輸給該多個硬件組件中的該特定硬件組件的第二事件處置模塊;監(jiān)測該第二事件處置模塊對該錯誤通知的響應(yīng);以及基于該響應(yīng)來執(zhí)行錯誤處置過程。
[0005]各種實施例針對一種具有至少一個存儲區(qū)域網(wǎng)絡(luò)(SAN)組件的系統(tǒng),該至少一個存儲區(qū)域網(wǎng)絡(luò)組件具有被配置為提供第一事件處置模塊的處理器,該第一事件處置模塊被配置為:在該存儲區(qū)域網(wǎng)絡(luò)的第一硬件組件處接收錯誤事件;訪問包含錯誤事件數(shù)據(jù)與錯誤的潛在來源之間的關(guān)聯(lián)的數(shù)據(jù)庫;基于該數(shù)據(jù)庫中的這些關(guān)聯(lián)與該錯誤事件中所包含的錯誤事件數(shù)據(jù)之間的相似性,來識別多個硬件組件;生成針對該多個硬件組件的排名;基于該排名,從該多個硬件組件中選擇特定的硬件組件;將錯誤通知傳輸給該多個硬件組件中的該特定硬件組件的第二事件處置模塊;監(jiān)測該第二事件處置模塊對該錯誤通知的響應(yīng);以及基于該響應(yīng)來執(zhí)行錯誤處置過程。
[0006]各實施例針對一種用于處置與存儲區(qū)域網(wǎng)絡(luò)有關(guān)的錯誤事件的計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)具有利用其而被具體化的程序代碼,該程序代碼由計算機可讀取/可執(zhí)行為:在該存儲區(qū)域網(wǎng)絡(luò)的第一硬件組件處接收錯誤事件;響應(yīng)于該錯誤事件,使用在該第一硬件組件上操作的第一事件處置模塊來:訪問包含錯誤事件數(shù)據(jù)與錯誤的潛在來源之間的關(guān)聯(lián)的數(shù)據(jù)庫;基于該數(shù)據(jù)庫中的這些關(guān)聯(lián)與該錯誤事件中所包含的錯誤事件數(shù)據(jù)之間的相似性,來識別多個硬件組件;生成針對該多個硬件組件的排名;基于該排名,從該多個硬件組件中選擇特定的硬件組件;將錯誤通知傳輸給該多個硬件組件中的該特定硬件組件的第二事件處置模塊;監(jiān)測該第二事件處置模塊對該錯誤通知的響應(yīng);以及基于該響應(yīng)來執(zhí)行錯誤處置過程。
[0007]上面的概述不意圖為描述本公開內(nèi)容的每個舉例說明的實施例或者每種實施方式。
【附圖說明】
[0008]包括在本申請中的附圖被并入本說明書中并且形成本說明書的一部分。它們圖示了本公開內(nèi)容的實施例,并且與本描述一起,用來解釋本公開內(nèi)容的原理。這些附圖僅圖示了本發(fā)明的某些實施例并且不限制本公開內(nèi)容。
[0009]圖1描繪了符合于本公開內(nèi)容的實施例的用于在SAN環(huán)境內(nèi)提供事件處置的系統(tǒng)的框圖;
[0010]圖2描繪了符合于本公開內(nèi)容的實施例的用于SAN組件的層級布置的框圖;
[0011]圖3描繪了符合于本公開內(nèi)容的實施例的用于處置SAN事件和錯誤的流程圖;
[0012]圖4示出了符合于本公開內(nèi)容的實施例的用于提供模塊的同步和更新的特定錯誤事件處置解決方案的部分流程圖;
[0013]圖5示出了符合于本公開內(nèi)容的實施例的用于選擇附加的SAN組件和目標事件處置模塊的流程圖;
[0014]圖6描繪了符合于本公開內(nèi)容的實施例的用于使用一個或多個配置具有事件處置數(shù)據(jù)庫模塊的計算機處理器的流程圖,該事件處置數(shù)據(jù)庫模塊能夠生成并且維持錯誤代碼與SAN組件之間的關(guān)聯(lián)的數(shù)據(jù)庫;以及
[0015]圖7描繪了用于實施各種實施例的計算機系統(tǒng)的高層級框圖。
[0016]盡管本發(fā)明可修正為各種修改和替換形式,但是它的細節(jié)已經(jīng)通過示例的方式在附圖中示出并且將被詳細描述。然而,應(yīng)該理解,意圖是不將本發(fā)明限制于所描述的特定實施例。相反地,意圖是覆蓋落入本發(fā)明的精神和范圍之內(nèi)的所有修改、等價物和替換物。
【具體實施方式】
[0017]本公開內(nèi)容的各方面涉及存儲區(qū)域網(wǎng)絡(luò)中的事件處置,更特別的方面涉及自動識別存儲區(qū)域網(wǎng)絡(luò)內(nèi)的問題的來源。盡管本發(fā)明不必然限制于這樣的應(yīng)用,但是可以通過討論使用這種上下文的各種示例來理解本發(fā)明的各種方面。
[0018]本公開內(nèi)容的各實施例針對一種系統(tǒng),該系統(tǒng)被配置為在存儲區(qū)域網(wǎng)絡(luò)(SAN)環(huán)境中執(zhí)行智能問題分析和問題處置。當系統(tǒng)組件檢測到事件或問題時,它能夠請求來自事件處置模塊(分析性問題確定(APD)模塊)的動作,該事件處置模塊能夠被配置為:識別該問題的潛在來源并且執(zhí)行對這些潛在來源中的一個或多個潛在來源的分析。對于SAN環(huán)境內(nèi)的自動問題分析和問題來源檢測,這能夠是有用的。
[0019]本公開內(nèi)容的某些方面針對一種對問題分析和事件處置的分布式解決方案。例如,APD模塊能夠在該SAN環(huán)境的不同物理/硬件組件內(nèi)被調(diào)用。以這種方式,能夠基于該特定問題來選擇APD模塊。這能夠包括:例如,選擇與該SAN的表現(xiàn)出該問題的特定部分相關(guān)聯(lián)的硬件上運行的APD模塊。
[0020]各種實施例針對一種APD模塊選擇算法,該APD模塊選擇算法基于APD模塊的關(guān)聯(lián)SAN硬件組件來對不同的APD模塊確定優(yōu)先級并且排名。能夠以在不同類型的組件之間所建立的層級結(jié)構(gòu)的形式來實施這種排名。該層級結(jié)構(gòu)能夠被設(shè)計而使得具有良好特征的SAN硬件組件能夠在其他SAN硬件組件之前被選擇。例如,被設(shè)計為控制、監(jiān)測和/或配置其他SAN硬件組件的SAN硬件組件(諸如,存儲控制器)可以更容易地能夠?qū)嵤@樣的硬件組件的分析。某些硬件組件還可以具有更多可用的處理資源、存儲器資源和/或存儲資源,這對于執(zhí)行Aro模塊能夠是有用的。因此,能夠給予這樣的硬件組件相對高的優(yōu)先級。能夠給予其他硬件組件,諸如網(wǎng)絡(luò)結(jié)構(gòu)交換機,更低的優(yōu)先級。
[0021]本公開內(nèi)容的各實施例考慮到了對錯誤解決方案數(shù)據(jù)庫的使用,錯誤解決方案數(shù)據(jù)庫將問題或錯誤與不同的硬件組件或問題的其他潛在來源相關(guān)聯(lián)。該數(shù)據(jù)庫還能夠存儲關(guān)于該SAN的有關(guān)信息,包括但不必然限于:不同SAN組件的配置、硬件制造商和版本標識、SAN組件(硬件或軟件)和固件/軟件版本的變化歷史。這個數(shù)據(jù)庫能夠由源APD(例如,由APD模塊選擇算法所選擇的APD)用來將一個或多個目標APD識別為對于確認該問題的潛在來源是有用的。
[0022]在某些實施例中,該錯誤解決方案數(shù)據(jù)庫的版本能夠被存儲在具有關(guān)聯(lián)的APD的每個SAN組件處。以這種方式,每個APD都能夠使用本地數(shù)據(jù)庫,當對其他SAN組件(或者對外部設(shè)備)的訪問被折衷掉時,本地數(shù)據(jù)庫能夠是有用的。錯誤解決方案數(shù)據(jù)庫的版本還能夠遠程地被存儲。例如,多個SAN可訪問的集中式錯誤解決方案數(shù)據(jù)庫能夠被維持。該集中式數(shù)據(jù)庫能夠包含從跨越許多不同的SAN和它們各自的配置和組件而收集的錯誤解決方案信息。然后能夠利用來自該集中式數(shù)據(jù)庫的信息來定期地更新特定的本地數(shù)據(jù)庫,或者該APD能夠針對特定的錯誤或事件而從該集中式數(shù)據(jù)庫請求信息。
[0023]根據(jù)一些實施例,基于SAN的存儲能夠由控制器硬件節(jié)點的一個或多個“對”(被稱為群集系統(tǒng)或系統(tǒng))中的SAN存儲控制器來管理。這些節(jié)點能夠連同RAID控制器和主系統(tǒng)一起而附接至SAN結(jié)構(gòu)。SAN結(jié)構(gòu)的幾個示例能夠包括:光纖通道(FC)、以太網(wǎng)上的互聯(lián)網(wǎng)小型計算機系統(tǒng)接口(iSCSI)、或者以太網(wǎng)上的FC。
[0024]符合于各實施例,一個或多個SAN存儲控制器能夠?qū)④浖陀布M合到如下的模塊化器具中,該模塊化器具為該存儲系統(tǒng)中的多個被管理的磁盤提供功能。例如,SAN存儲控制器能夠提供對稱虛擬化,對稱虛擬化包括:來自所附存儲系統(tǒng)的被管理磁盤的池的創(chuàng)建。然后這些存儲系統(tǒng)能夠被映射至用于由所附主系統(tǒng)使用的一組卷(volume)。該系統(tǒng)能夠被配置為允許訪問該SAN上的公共存儲池。這個功能能夠由APD用來提供公共基礎(chǔ),能夠根據(jù)該公共基礎(chǔ)來診斷和處置錯誤事件。
[0025]現(xiàn)在轉(zhuǎn)向附圖,圖1描繪了符合于本公開內(nèi)容的實施例的用于在SAN環(huán)境內(nèi)提供事件處置的系統(tǒng)的框圖。該系統(tǒng)能夠包括多個主機102、104、106和108。這些主機能夠