專利名稱:一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息系統(tǒng)領(lǐng)域,特別涉及一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法。
背景技術(shù):
高可用性(High Availability)通常來描述一個(gè)信息系統(tǒng)經(jīng)過專門的設(shè)計(jì),從而減少停工時(shí)間,而保持其服務(wù)的高度可用性。對(duì)于大型制造業(yè)企業(yè)來說,隨著公司的快速發(fā)展,企業(yè)的日常生產(chǎn)運(yùn)營越來越依賴于核心信息管理系統(tǒng)。如寶鋼的7x24小時(shí)運(yùn)行的熱軋三合一系統(tǒng)對(duì)核心信息管理系統(tǒng)提出了更高的業(yè)務(wù)連續(xù)性和高可用性的要求,必須確保關(guān)鍵性系統(tǒng)無論是遇到在計(jì)劃內(nèi)系統(tǒng)進(jìn)行維護(hù)的情況下,還是在計(jì)劃外系統(tǒng)出現(xiàn)故障和異常情況下都可以快速恢復(fù)、保障生產(chǎn)的持續(xù)進(jìn)行。目前現(xiàn)有技術(shù)是采用的高可用性(High Availability)技術(shù),以共享存儲(chǔ)系統(tǒng)的方式,通過設(shè)立備用機(jī)對(duì)主服務(wù)器進(jìn)行監(jiān)控和故障與異常情況切換,一旦存儲(chǔ)系統(tǒng)或數(shù)據(jù)庫發(fā)生故障和損害,仍然影響系統(tǒng)的正常運(yùn)行。基于現(xiàn)有技術(shù)的以上缺點(diǎn),通過引入數(shù)據(jù)容災(zāi)思想和技術(shù),可以大大降低存儲(chǔ)系統(tǒng)故障影響系統(tǒng)運(yùn)行的可能性,提高系統(tǒng)的高可用性, 大幅減少計(jì)劃停機(jī)次數(shù)和時(shí)間,最大限度降低故障引起的停機(jī)對(duì)客戶生產(chǎn)經(jīng)營造成的影響。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法,其能提高系統(tǒng)的高可用性,減少系統(tǒng)停機(jī)次數(shù),降低系統(tǒng)故障影響正常運(yùn)行的可能性。一方面,本發(fā)明提供一種提高信息系統(tǒng)可用性的集成設(shè)備,包括應(yīng)用程序單元和數(shù)據(jù)存儲(chǔ)單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲(chǔ)單元包含系統(tǒng)存儲(chǔ)的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),還包括應(yīng)用程序同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元,通過服務(wù)器腳本進(jìn)行切換;數(shù)據(jù)存儲(chǔ)同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲(chǔ)單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲(chǔ)同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。所述服務(wù)器腳本在異常情況出現(xiàn)時(shí),停止應(yīng)用程序單元的運(yùn)行,釋放應(yīng)用程序單元的IP地址并將IP地址切換到應(yīng)用程序同步單元,同時(shí)啟動(dòng)應(yīng)用程序同步單元。所述數(shù)據(jù)存儲(chǔ)同步單元還通過將數(shù)據(jù)存儲(chǔ)單元的邏輯卷進(jìn)行鏡像,保證磁盤陣列冗余有效。所述集成設(shè)備還包括將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進(jìn)行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進(jìn)行故障恢復(fù)轉(zhuǎn)移來提供冗余。另一方面,本發(fā)明還提供一種提高信息系統(tǒng)可用性的集成方法,包括建立應(yīng)用程序單元和數(shù)據(jù)存儲(chǔ)單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲(chǔ)單元包含系統(tǒng)存儲(chǔ)的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),還包括以下步驟A)建立應(yīng)用程序 同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元,通過服務(wù)器腳本進(jìn)行切換;B)建立數(shù)據(jù)存儲(chǔ)同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲(chǔ)單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲(chǔ)同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。所述步驟A還包括設(shè)置服務(wù)器腳本,所述服務(wù)器腳本在異常情況出現(xiàn)時(shí),停止應(yīng)用程序單元的運(yùn)行,釋放應(yīng)用程序單元的IP地址并將IP地址切換到應(yīng)用程序同步單元,同時(shí)啟動(dòng)應(yīng)用程序同步單元。所述步驟B還包括將數(shù)據(jù)存儲(chǔ)單元的邏輯卷進(jìn)行鏡像,保證磁盤陣列冗余有效。同時(shí)還包括步驟C,將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進(jìn)行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進(jìn)行故障恢復(fù)轉(zhuǎn)移來提供冗余。采用本發(fā)明所述的一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法,包括應(yīng)用程序單元和數(shù)據(jù)存儲(chǔ)單元,增加設(shè)置了與應(yīng)用程序單元同步鏡像的應(yīng)用程序同步單元,當(dāng)異常情況發(fā)生時(shí),應(yīng)用程序同步單元通過服務(wù)器腳本進(jìn)行切換從而繼續(xù)進(jìn)行服務(wù),此外,還增加設(shè)置了數(shù)據(jù)存儲(chǔ)同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)保持與數(shù)據(jù)存儲(chǔ)單元的同步,同時(shí)建立磁盤雙陣列進(jìn)行冗余,這樣大大降低系統(tǒng)故障影響系統(tǒng)運(yùn)行的可能性,提高系統(tǒng)的高可用性, 減少計(jì)劃停機(jī)次數(shù)和時(shí)間,降低了由故障引起的停機(jī)對(duì)客戶生產(chǎn)經(jīng)營造成的影響。
圖1是本發(fā)明所述集成設(shè)備的原理框圖;圖2是本發(fā)明所述服務(wù)器腳本進(jìn)行切換的流程圖;圖3是本發(fā)明所述數(shù)據(jù)存儲(chǔ)單元和數(shù)據(jù)存儲(chǔ)同步單元進(jìn)行切換的流程圖;圖4是本發(fā)明所述方法的流程示意圖。
具體實(shí)施例方式下面結(jié)合附圖和實(shí)施例進(jìn)一步說明本發(fā)明的技術(shù)方案,實(shí)施例1以寶山鋼鐵股份公司的7X24小時(shí)熱軋三合一系統(tǒng)的核心信息管理系統(tǒng)來進(jìn)行說明。參照圖1,圖1顯示了本發(fā)明提供的一種提高信息系統(tǒng)可用性的集成化設(shè)備,包括原信息管理系統(tǒng)的設(shè)備,由應(yīng)用程序單元110和數(shù)據(jù)存儲(chǔ)單元所組成。應(yīng)用程序單元110,采用基于AIX系統(tǒng)的小型機(jī)架構(gòu),提供用戶使用的程序。數(shù)據(jù)存儲(chǔ)單元120,采用Oracle數(shù)據(jù)庫,存儲(chǔ)應(yīng)用程序單元110所需要的數(shù)據(jù)。作為寶山鋼鐵股份公司7X24小時(shí)熱軋三合一系統(tǒng)的核心信息管理系統(tǒng),對(duì)于系統(tǒng)可用性有著非常高的要求,同時(shí)由于系統(tǒng)無法停機(jī),所以無法進(jìn)行系統(tǒng)停機(jī)升級(jí)和維護(hù)。 為了提高系統(tǒng)的高可用性,保障核心信息管理系統(tǒng)的正常運(yùn)行,通過增加了應(yīng)用程序同步單元130和數(shù)據(jù)存儲(chǔ)同步單元140以解決上述技術(shù)問題。所述應(yīng)用程序同步單元130基于AIX系統(tǒng)的小型機(jī)架構(gòu),通過鏡像復(fù)制應(yīng)用程序單元110的應(yīng)用程序,并通過操作人員發(fā)布應(yīng)用程序更新保持與應(yīng)用程序單元110的數(shù)據(jù)同步。
當(dāng)應(yīng)用程序單元110發(fā)生異常情況或執(zhí)行計(jì)劃內(nèi)維護(hù)更新時(shí),將自動(dòng)執(zhí)行服務(wù)器腳本,將系統(tǒng)切換到應(yīng)用程序同步單元130。所述應(yīng)用程序單元110發(fā)生的異常情況或執(zhí)行計(jì)劃內(nèi)維護(hù)具體包括1)計(jì)劃內(nèi)對(duì)服務(wù)器硬件進(jìn)行微碼升級(jí)或配件調(diào)換; 2)計(jì)劃內(nèi)對(duì)其他硬件微碼升級(jí)或配件調(diào)換(switch、SAN switch,陣列;3)計(jì)劃內(nèi)對(duì)操作系統(tǒng)及核心系統(tǒng)軟件升級(jí);4)計(jì)劃外部分硬件損壞;5)計(jì)劃外主機(jī)服務(wù)器故障宕機(jī);6)計(jì)劃外系統(tǒng)軟件故障。如圖2所示,所述服務(wù)器腳本切換過程包括201,開始應(yīng)用程序單元110切換;202,停止應(yīng)用程序單元110的運(yùn)行,并且釋放應(yīng)用程序單元110的IP地址;203,切換應(yīng)用程序單元110的IP地址到應(yīng)用程序同步單元130 ;204,啟動(dòng)應(yīng)用程序同步單元130 ;2O5,停止切換。所述服務(wù)器腳本還可通過定制增加其他功能的操作。所述數(shù)據(jù)存儲(chǔ)同步單元140與數(shù)據(jù)存儲(chǔ)單元120采用磁盤整列結(jié)構(gòu)進(jìn)行冗余。磁盤整列結(jié)構(gòu)通過磁盤整列控制器把要寫入的數(shù)據(jù)分解為多個(gè)數(shù)據(jù)塊,然后并行寫入磁盤陣列;讀取數(shù)據(jù)時(shí),磁盤整列控制器并行讀取分散在磁盤陣列中各個(gè)硬盤上的數(shù)據(jù),把它們重新組合后提供給主機(jī)。由于采用并行讀寫操作,從而提高了存儲(chǔ)系統(tǒng)的讀寫速度,也加強(qiáng)了系統(tǒng)的可靠性。在本實(shí)施例中磁盤整列控制器把磁盤陣列中的硬盤分成相同的兩組,互為鏡像,當(dāng)任一磁盤介質(zhì)出現(xiàn)故障時(shí),可以利用其鏡像上的數(shù)據(jù)恢復(fù),從而提高系統(tǒng)的容錯(cuò)能力。對(duì)數(shù)據(jù)的操作仍采用分塊后并行傳輸方式,不僅提高了讀寫速度,也加強(qiáng)系統(tǒng)的可靠性。同時(shí)所述數(shù)據(jù)存儲(chǔ)同步單元140采用了數(shù)據(jù)庫同步復(fù)制技術(shù)保證了數(shù)據(jù)存儲(chǔ)同步單元140與數(shù)據(jù)存儲(chǔ)單元120的數(shù)據(jù)同步更新。作為一個(gè)實(shí)施例,本發(fā)明基于IBM主機(jī)系統(tǒng)和IBM存儲(chǔ)系統(tǒng)相互配合的邏輯卷鏡像(LVMMirror)方式,采用雙磁盤系統(tǒng)數(shù)據(jù)同步復(fù)制機(jī)制。采用這種方式的數(shù)據(jù)存儲(chǔ)系統(tǒng)可以采用邏輯卷鏡像進(jìn)行磁盤存儲(chǔ)系統(tǒng)之間的接管,實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的高可用性,即使有一半的主機(jī)系統(tǒng)和一半的存儲(chǔ)系統(tǒng)發(fā)生故障而不能正常工作,整個(gè)系統(tǒng)也不會(huì)發(fā)生癱瘓,仍舊可以繼續(xù)運(yùn)行,充分滿足客戶對(duì)高可靠性和連續(xù)可用性的要求。在實(shí)施邏輯卷鏡像的數(shù)據(jù)同步復(fù)制方案時(shí),分別將數(shù)據(jù)存儲(chǔ)單元120和數(shù)據(jù)同步存儲(chǔ)單元通過光纖HBA卡連接到SAN交換機(jī)上,主機(jī)會(huì)有效識(shí)別兩套存儲(chǔ)系統(tǒng),但對(duì)于應(yīng)用沒有任何影響;在主機(jī)上,基于磁盤底層的LVM在兩套磁盤系統(tǒng)之間建立鏡像關(guān)系,實(shí)現(xiàn)數(shù)據(jù)同步。邏輯卷鏡像可以提供操作系統(tǒng)級(jí)別的鏡像(Mirroring)功能,即可以為一個(gè)存儲(chǔ)塊提供多份拷貝。該功能包含在邏輯卷管理中,具有以下特點(diǎn)支持2 3份拷貝的鏡像; 可選擇順序(Sequential)和并行(Parallel)兩種存取方式;讀數(shù)據(jù)時(shí)可從先找到的拷貝處讀取,加快訪問速度;鏡像功能在數(shù)據(jù)損壞時(shí),能夠從備份中(最多有3份備份)自動(dòng)恢復(fù),增強(qiáng)系統(tǒng)的可靠性。如圖3所示,當(dāng)數(shù)據(jù)存儲(chǔ)單元120發(fā)生異常造成停機(jī)或執(zhí)行計(jì)劃內(nèi)升級(jí)維護(hù)任務(wù)時(shí),磁盤的邏輯卷鏡像的過程如下301,開始數(shù) 據(jù)存儲(chǔ)單元120的切換;302,停止數(shù)據(jù)存儲(chǔ)單元120和數(shù)據(jù)同步存儲(chǔ)單元之間的同步進(jìn)程;303,切換數(shù)據(jù)存儲(chǔ)單元120的IP地址到數(shù)據(jù)同步存儲(chǔ)單元140 ;304,重啟應(yīng)用程序單元110上的應(yīng)用數(shù)據(jù)庫連接;305,開始數(shù)據(jù)存儲(chǔ)單元120和數(shù)據(jù)同步存儲(chǔ)單元之間的反向同步進(jìn)程;306.停止切換。本發(fā)明所述的應(yīng)用程序單元110和應(yīng)用程序同步單元130還均安裝有兩塊網(wǎng)卡, 所述網(wǎng)卡采用雙網(wǎng)卡聚合技術(shù),使兩塊網(wǎng)卡虛擬成為一塊網(wǎng)卡,兩塊網(wǎng)卡具有相同的IP地址而并行鏈接聚合成一個(gè)邏輯鏈路工作。作為一個(gè)實(shí)施例,本發(fā)明采用AIX操作系統(tǒng),通過用戶可以配置雙通道網(wǎng)卡綁定(EtherCharmel)的方式實(shí)現(xiàn)雙網(wǎng)卡聚合,通過網(wǎng)卡綁定雙網(wǎng)卡不僅綁定有相同的IP地址和MAC地址,而且雙網(wǎng)卡均連接在同一交換機(jī)上,切交換機(jī)的對(duì)應(yīng)端口也需綁定。這樣當(dāng)其中一個(gè)網(wǎng)卡失效,或者一根網(wǎng)線失效的時(shí)候,不影響整個(gè)網(wǎng)絡(luò)的工作,而且,兩個(gè)網(wǎng)卡的同時(shí)工作,可以增加網(wǎng)絡(luò)帶寬。如圖4所示,本發(fā)明還提供一種提高信息系統(tǒng)可用性的方法。包括建立應(yīng)用程序單元110和數(shù)據(jù)存儲(chǔ)單元120,所述應(yīng)用程序單元110提供用戶使用的程序,數(shù)據(jù)存儲(chǔ)單元 120包含系統(tǒng)存儲(chǔ)的數(shù)據(jù),為應(yīng)用程序單元110提供數(shù)據(jù),還包括以下步驟401建立應(yīng)用程序同步單元130,所述應(yīng)用程序同步單元130為應(yīng)用程序單元110 的同步鏡像單元,通過服務(wù)器腳本進(jìn)行切換;402建立數(shù)據(jù)存儲(chǔ)同步單元140,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲(chǔ)單元120中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲(chǔ)同步單元140,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。所述步驟A還包括設(shè)置服務(wù)器腳本,所述服務(wù)器腳本在異常情況出現(xiàn)時(shí),停止應(yīng)用程序單元110的運(yùn)行,釋放應(yīng)用程序單元110的IP地址并將IP地址切換到應(yīng)用程序同步單元130,同時(shí)啟動(dòng)應(yīng)用程序同步單元130。所述步驟B還包括將數(shù)據(jù)存儲(chǔ)單元120的邏輯卷進(jìn)行鏡像,保證磁盤陣列冗余有效。同時(shí)還包括步驟403,將應(yīng)用程序單元110與應(yīng)用程序同步單元130所用網(wǎng)卡進(jìn)行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進(jìn)行故障恢復(fù)轉(zhuǎn)移來提供冗余。需要指出的是,本發(fā)明所述的一種提高信息系統(tǒng)可用性的集成設(shè)備和一種提高信息系統(tǒng)可用性的方法,兩者在原理和實(shí)施例上是相同或類似的,故其重復(fù)部分不再贅述。本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,以上的實(shí)施例僅是用來說明本發(fā)明, 而并非用作為對(duì)本發(fā)明的限定,只要在本發(fā)明的實(shí)質(zhì)精神范圍內(nèi),對(duì)以上實(shí)施例的變化、變型都將落在本發(fā)明的權(quán)利要求書范圍內(nèi)。
權(quán)利要求
1.一種提高信息系統(tǒng)可用性的集成設(shè)備,包括應(yīng)用程序單元和數(shù)據(jù)存儲(chǔ)單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲(chǔ)單元包含系統(tǒng)存儲(chǔ)的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),其特征在于,還包括應(yīng)用程序同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元,通過服務(wù)器腳本進(jìn)行切換;數(shù)據(jù)存儲(chǔ)同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲(chǔ)單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲(chǔ)同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。
2.如權(quán)利要求1所述的一種集成設(shè)備,其特征在于,所述服務(wù)器腳本在異常情況出現(xiàn)時(shí),停止應(yīng)用程序單元的運(yùn)行,釋放應(yīng)用程序單元的IP地址并將IP地址切換到應(yīng)用程序同步單元,同時(shí)啟動(dòng)應(yīng)用程序同步單元。
3.如權(quán)利要求1所述的一種集成設(shè)備,其特征在于,所述數(shù)據(jù)存儲(chǔ)同步單元還通過將數(shù)據(jù)存儲(chǔ)單元的邏輯卷進(jìn)行鏡像,保證磁盤陣列冗余有效。
4.如權(quán)利要求1所述的一種集成設(shè)備,其特征在于,所述集成設(shè)備還包括將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進(jìn)行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進(jìn)行故障恢復(fù)轉(zhuǎn)移來提供冗余。
5.一種提高信息系統(tǒng)可用性的集成方法,包括建立應(yīng)用程序單元和數(shù)據(jù)存儲(chǔ)單元,所述應(yīng)用程序單元提供用戶使用的程序,數(shù)據(jù)存儲(chǔ)單元包含系統(tǒng)存儲(chǔ)的數(shù)據(jù),為應(yīng)用程序單元提供數(shù)據(jù),其特征在于,還包括以下步驟A)建立應(yīng)用程序同步單元,所述應(yīng)用程序同步單元為應(yīng)用程序單元的同步鏡像單元, 通過服務(wù)器腳本進(jìn)行切換;B)建立數(shù)據(jù)存儲(chǔ)同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)將數(shù)據(jù)存儲(chǔ)單元中的數(shù)據(jù)同步發(fā)布到數(shù)據(jù)存儲(chǔ)同步單元,并且通過磁盤雙陣列形成數(shù)據(jù)冗余。
6.如權(quán)利要求5所述的一種集成方法,其特征在于,所述步驟A還包括設(shè)置服務(wù)器腳本,所述服務(wù)器腳本在異常情況出現(xiàn)時(shí),停止應(yīng)用程序單元的運(yùn)行,釋放應(yīng)用程序單元的IP 地址并將IP地址切換到應(yīng)用程序同步單元,同時(shí)啟動(dòng)應(yīng)用程序同步單元。
7.如權(quán)利要求5所述的一種集成方法,其特征在于,所述步驟B還包括將數(shù)據(jù)存儲(chǔ)單元的邏輯卷進(jìn)行鏡像,保證磁盤陣列冗余有效。
8.如權(quán)利要求5所述的一種集成方法,其特征在于,還包括步驟C,將應(yīng)用程序單元與應(yīng)用程序同步單元所用網(wǎng)卡進(jìn)行聚合,通過將工作中的網(wǎng)卡與待命網(wǎng)卡進(jìn)行故障恢復(fù)轉(zhuǎn)移來提供冗余。
全文摘要
本發(fā)明揭示了一種提高信息系統(tǒng)可用性的集成設(shè)備及其方法,包括應(yīng)用程序單元110和數(shù)據(jù)存儲(chǔ)單元,增加設(shè)置了與應(yīng)用程序單元同步鏡像的應(yīng)用程序同步單元,當(dāng)異常情況發(fā)生時(shí),應(yīng)用程序同步單元通過服務(wù)器腳本進(jìn)行切換從而繼續(xù)進(jìn)行服務(wù),此外,還增加設(shè)置了數(shù)據(jù)存儲(chǔ)同步單元,通過數(shù)據(jù)庫復(fù)制技術(shù)保持與數(shù)據(jù)存儲(chǔ)單元的同步,同時(shí)建立磁盤雙陣列進(jìn)行冗余,這樣大大降低系統(tǒng)故障影響系統(tǒng)運(yùn)行的可能性,提高系統(tǒng)的高可用性,減少計(jì)劃停機(jī)次數(shù)和時(shí)間,降低了由故障引起的停機(jī)對(duì)客戶生產(chǎn)經(jīng)營造成的影響。
文檔編號(hào)G06F11/16GK102314381SQ201010219380
公開日2012年1月11日 申請日期2010年7月2日 優(yōu)先權(quán)日2010年7月2日
發(fā)明者辛?xí)F 申請人:上海寶信軟件股份有限公司