用于在過(guò)程控制系統(tǒng)中提供冗余性的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]概括地說(shuō),本公開(kāi)內(nèi)容涉及過(guò)程控制系統(tǒng),更具體地說(shuō),涉及用于在過(guò)程控制系統(tǒng)中提供冗余性的方法和裝置。
【背景技術(shù)】
[0002]過(guò)程控制系統(tǒng)(如,化工,石油或者其它過(guò)程中使用的那些過(guò)程控制系統(tǒng))通常包括一個(gè)或多個(gè)過(guò)程控制器,該一個(gè)或多個(gè)過(guò)程控制器經(jīng)由模擬、數(shù)字或組合的模擬/數(shù)字總線來(lái)通信地耦合到一個(gè)或多個(gè)現(xiàn)場(chǎng)設(shè)備。現(xiàn)場(chǎng)設(shè)備(其可以例如是閥、閥定位器、開(kāi)關(guān)和發(fā)送器(例如,溫度、壓力和流速傳感器))在過(guò)程中執(zhí)行過(guò)程控制功能,例如,打開(kāi)或關(guān)閉閥,測(cè)量過(guò)程控制參數(shù)。過(guò)程控制器接收用于指示現(xiàn)場(chǎng)設(shè)備所進(jìn)行的過(guò)程測(cè)量值的信號(hào),隨后對(duì)該信息進(jìn)行處理以用于:生成用于實(shí)現(xiàn)控制例程的控制信號(hào),進(jìn)行其它過(guò)程控制決策,以及發(fā)起過(guò)程控制系統(tǒng)報(bào)警。
[0003]來(lái)自于現(xiàn)場(chǎng)設(shè)備和/或控制器的信息通常通過(guò)數(shù)據(jù)高速通道或者通信網(wǎng)絡(luò)而可用于一個(gè)或多個(gè)其它硬件設(shè)備,例如,操作者工作站、個(gè)人計(jì)算機(jī)、數(shù)據(jù)歷史庫(kù)(datahistorian)、報(bào)告生成器、集中式數(shù)據(jù)庫(kù)等等。這些設(shè)備通常位于控制室中和/或其它相對(duì)于較苛刻的工廠環(huán)境而言位于遠(yuǎn)離的位置。例如,這些硬件設(shè)備運(yùn)行使操作者能夠執(zhí)行關(guān)于過(guò)程控制系統(tǒng)的過(guò)程的以下各種功能中的任何一種的應(yīng)用:例如,查看過(guò)程的當(dāng)前狀態(tài)、改變操作狀態(tài)、改變過(guò)程控制例程的設(shè)置、修改過(guò)程控制器和/或現(xiàn)場(chǎng)設(shè)備的操作、查看現(xiàn)場(chǎng)設(shè)備和/或過(guò)程控制器所產(chǎn)生的報(bào)警、模擬該過(guò)程的操作以便訓(xùn)練人員和/或?qū)^(guò)程進(jìn)行評(píng)估等等。
[0004]計(jì)算機(jī)架構(gòu)、網(wǎng)絡(luò)化和虛擬化的技術(shù)進(jìn)步的組合,已使得能夠開(kāi)發(fā)出有效的、容易管理的可以實(shí)現(xiàn)某些控制系統(tǒng)的虛擬化計(jì)算環(huán)境。也就是說(shuō),可以利用在虛擬過(guò)程控制環(huán)境中實(shí)現(xiàn)的虛擬機(jī),來(lái)替代在傳統(tǒng)控制系統(tǒng)中使用的工作站、個(gè)人計(jì)算機(jī)和其它硬件設(shè)備。末端用戶經(jīng)由連接到虛擬系統(tǒng)的瘦客戶端,來(lái)訪問(wèn)在這些虛擬機(jī)上實(shí)現(xiàn)的應(yīng)用和軟件。用此方式,可以減少傳統(tǒng)上所需要的用于獲取、配置和維護(hù)所有硬件組件的顯著成本和復(fù)雜度。
【附圖說(shuō)明】
[0005]圖1是可以在其中可以實(shí)現(xiàn)本公開(kāi)內(nèi)容的教導(dǎo)的示例性過(guò)程控制系統(tǒng)的示意性視圖。
[0006]圖2是圖1的示例性過(guò)程控制系統(tǒng)的一部分的示例性網(wǎng)絡(luò)布置的示意性視圖。
[0007]圖3是圖1和/或圖2的示例性過(guò)程控制系統(tǒng)中的網(wǎng)絡(luò)主機(jī)中的任何一個(gè)網(wǎng)絡(luò)主機(jī)的示例性實(shí)現(xiàn)的框圖。
[0008]圖4是經(jīng)由兩個(gè)共同網(wǎng)絡(luò)來(lái)連接的網(wǎng)絡(luò)主機(jī)的示例性系統(tǒng)的示意性視圖。
[0009]圖5是表示圖4的網(wǎng)絡(luò)主機(jī)之間的通信狀態(tài)的表。
[0010]圖6是圖4的示例性系統(tǒng)的示意性視圖,其中該示例系統(tǒng)具有與這些網(wǎng)絡(luò)主機(jī)中的一個(gè)網(wǎng)絡(luò)主機(jī)相關(guān)聯(lián)的網(wǎng)絡(luò)故障。
[0011]圖7是表示圖6的網(wǎng)絡(luò)主機(jī)之間的通信狀態(tài)的表。
[0012]圖8是用于示出在網(wǎng)絡(luò)主機(jī)的初始發(fā)現(xiàn)和圍繞圖6的網(wǎng)絡(luò)故障期間,圖4的網(wǎng)絡(luò)主機(jī)中的每一個(gè)網(wǎng)絡(luò)主機(jī)所發(fā)送的完整性消息的示例性隨時(shí)間推移的變化的表。
[0013]圖9是用于示出在網(wǎng)絡(luò)主機(jī)的初始發(fā)現(xiàn)期間,圖4的網(wǎng)絡(luò)主機(jī)中的每一個(gè)網(wǎng)絡(luò)主機(jī)所發(fā)送的完整性消息的不同的示例性隨時(shí)間推移變化的表。
[0014]圖10是具有經(jīng)由兩個(gè)共同網(wǎng)絡(luò)來(lái)連接的兩個(gè)示例性網(wǎng)絡(luò)主機(jī)的示例性系統(tǒng)的示意性視圖。
[0015]圖11和圖12分別是圖10的示例性系統(tǒng)在這兩個(gè)網(wǎng)絡(luò)中的各個(gè)網(wǎng)絡(luò)中具有網(wǎng)絡(luò)故障的示意性視圖。
[0016]圖13A-圖13B是示出用于實(shí)現(xiàn)圖1-圖4、圖6和/或圖10-圖12的示例性網(wǎng)絡(luò)主機(jī),以提供這些網(wǎng)絡(luò)主機(jī)之間的冗余性的示例性方法的流程圖。
[0017]圖14是一種示例性處理器平臺(tái)的示意性視圖,其中可以對(duì)該示例性處理器平臺(tái)進(jìn)行使用和/或編程,以執(zhí)行圖13A-圖13B的示例性方法,和/或更一般地來(lái)說(shuō),以實(shí)現(xiàn)圖1-圖4、圖6和/或圖10-圖12的示例性網(wǎng)絡(luò)主機(jī)。
【具體實(shí)施方式】
[0018]可靠性是在實(shí)現(xiàn)過(guò)程控制系統(tǒng)時(shí)共同關(guān)注的問(wèn)題,尤其是關(guān)注虛擬化控制系統(tǒng),在虛擬化控制系統(tǒng)中,很多傳統(tǒng)上單獨(dú)的工作站和其它計(jì)算機(jī)組件全部實(shí)現(xiàn)成主機(jī)服務(wù)器集群上的虛擬機(jī)(VM)。為了解決這些關(guān)注的問(wèn)題,硬件制造商提供用于增強(qiáng)可靠性的硬件解決方案,例如,具有冗余磁盤(pán)陣列、控制器和電源的存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)設(shè)備。通常,將多個(gè)主機(jī)服務(wù)器與一個(gè)高度冗余的SAN聚集在一起,以增加整體系統(tǒng)的可用性和留出用于維護(hù)的空間,例如,在無(wú)需關(guān)閉整個(gè)物理系統(tǒng)的情況下進(jìn)行組件升級(jí)或替換。諸如WindowsServer 2012之類的現(xiàn)有操作系統(tǒng)有助于將VM從物理系統(tǒng)的一個(gè)部分(例如,硬盤(pán)驅(qū)動(dòng)器)移動(dòng)到該系統(tǒng)的另一個(gè)部分,或者甚至移動(dòng)到外部備份系統(tǒng),同時(shí)VM繼續(xù)運(yùn)行,并且對(duì)于目前可能在該VM上進(jìn)行中的這些應(yīng)用的操作或通信和用戶交互不會(huì)具有任何明顯的影響。這些解決方案增加了諸如電子郵件服務(wù)器、web服務(wù)器和其它后端服務(wù)器之類的各種各樣的虛擬機(jī)的可用性,其中這些服務(wù)器可以由外部計(jì)算機(jī)節(jié)點(diǎn)或網(wǎng)絡(luò)主機(jī)上安裝的軟件客戶端(例如,瘦客戶端)經(jīng)由以太網(wǎng)來(lái)進(jìn)行訪問(wèn)。
[0019]很多傳統(tǒng)(即,物理)控制系統(tǒng)具有很多操作者面對(duì)的軟件組件,它們是該系統(tǒng)的集成部分,例如,操作者接口應(yīng)用、資產(chǎn)管理應(yīng)用、報(bào)警管理應(yīng)用等等。當(dāng)這些組件與控制系統(tǒng)的其它組件進(jìn)行通信時(shí),這些組件執(zhí)行相當(dāng)大量的業(yè)務(wù)邏輯,使用專有協(xié)議來(lái)確保高可用性。例如,操作者站通常與控制系統(tǒng)中的多個(gè)控制器和/或歷史庫(kù)進(jìn)行通信。在這些例子中,如果在操作者站和特定的歷史庫(kù)之間丟失了連接,操作者站仍然能夠通過(guò)從其它歷史庫(kù)訪問(wèn)信息來(lái)獲取任何期望的歷史數(shù)據(jù)。同樣,如果操作者站和特定的控制器之間丟失了連接,操作者站仍然能夠從控制系統(tǒng)中具有類似測(cè)量點(diǎn)的另一個(gè)控制器獲得期望的運(yùn)行時(shí)數(shù)據(jù)。
[0020]當(dāng)對(duì)過(guò)程控制系統(tǒng)進(jìn)行虛擬化時(shí),上面的冗余中的一些變得不可用,這是由于向操作者呈現(xiàn)數(shù)據(jù)的末端用戶終端與執(zhí)行業(yè)務(wù)邏輯(其產(chǎn)生要呈現(xiàn)的數(shù)據(jù))的應(yīng)用是分離的。也就是說(shuō),在一些虛擬化控制系統(tǒng)中,該業(yè)務(wù)邏輯由在集中式主機(jī)系統(tǒng)上實(shí)現(xiàn)的VM來(lái)執(zhí)行,而末端終端通常是使用遠(yuǎn)程顯示協(xié)議來(lái)從VM訪問(wèn)數(shù)據(jù)以進(jìn)行顯示的瘦客戶端。因此,VM是否可以從替代的控制器或歷史庫(kù)獲取數(shù)據(jù)(如果其丟失了與主控制器或歷史庫(kù)的連接的話),與是否在瘦客戶端處將顯示該數(shù)據(jù)無(wú)關(guān)(如果瘦客戶端和VM之間的連接失敗的話)。因此,當(dāng)存在植入到實(shí)現(xiàn)虛擬化環(huán)境的主機(jī)服務(wù)器和相關(guān)硬件中的很多冗余時(shí),系統(tǒng)的可用性和/或可靠性中的弱點(diǎn)是與末端用戶終端節(jié)點(diǎn)(如,瘦客戶端)的連接。
[0021]通常,瘦客戶端沒(méi)有裝備很多冗余特征(其導(dǎo)致很多單點(diǎn)的故障),其假定如果與虛擬控制系統(tǒng)相關(guān)聯(lián)的瘦客戶端中的任何一個(gè)經(jīng)歷了停工,則可以通過(guò)另一個(gè)終端來(lái)訪問(wèn)與該發(fā)生故障瘦客戶端相關(guān)聯(lián)的VM。利用冗余的網(wǎng)絡(luò)卡來(lái)實(shí)現(xiàn)了一些瘦客戶端,使得如果丟失了網(wǎng)絡(luò)連接,則瘦客戶端可以切換到備份網(wǎng)絡(luò)。雖然這是一種改進(jìn),但這種解決方案仍然承受著某些限制。例如,在重傳期間,通常將再次嘗試對(duì)未被確認(rèn)的數(shù)據(jù)傳輸進(jìn)行傳送。但是,如果存在網(wǎng)絡(luò)故障,則重傳時(shí)的任何嘗試將仍然失敗,并且將重復(fù)該過(guò)程直到網(wǎng)絡(luò)連接超時(shí)為止。在一些這種例子中,僅僅在連接超時(shí)之后才對(duì)網(wǎng)絡(luò)故障進(jìn)行確認(rèn),此時(shí)可以經(jīng)由備份網(wǎng)絡(luò)來(lái)建立替代的通信路徑。通常,用于檢測(cè)這種網(wǎng)絡(luò)故障和在冗余網(wǎng)絡(luò)上重新建立連接的時(shí)間,可能也要花費(fèi)一分鐘以上。在很多過(guò)程控制設(shè)置中,一分鐘不進(jìn)行通信是不可接受的。通常,可接受的時(shí)延是不超過(guò)五秒。此外,在很多這種環(huán)境下,在故障和重新連接之間的大部分時(shí)間期間,末端用戶不了解發(fā)生了故障,因此,末端用戶可能在觀看和依賴于在瘦客戶端處的屏幕上顯示的已經(jīng)過(guò)期的信息。另外,在發(fā)生網(wǎng)絡(luò)故障之后和建立新連接之前嘗試傳送的任何數(shù)據(jù)發(fā)生丟失。
[0022]在不會(huì)丟失任何數(shù)據(jù)的情況下,向冗余網(wǎng)絡(luò)提供無(wú)縫故障切換的一種解決方案涉及使用并行冗余協(xié)議(PRP)。通過(guò)將每一個(gè)數(shù)據(jù)分組發(fā)送兩次(在至少兩個(gè)網(wǎng)絡(luò)的每一個(gè)網(wǎng)絡(luò)接口上一次),甚至當(dāng)一個(gè)網(wǎng)絡(luò)發(fā)生故障時(shí),PRP也實(shí)現(xiàn)數(shù)據(jù)通信的成功傳送。這種方法在故障恢復(fù)時(shí)沒(méi)有延遲,并且確保不會(huì)丟失數(shù)據(jù)。但是,由于發(fā)送和接收了兩倍的數(shù)據(jù),因此這種方法涉及網(wǎng)絡(luò)流量和計(jì)算機(jī)處理量的顯著增加。
[0023]使用諸如能夠?qū)θ哂噙M(jìn)行處理的外部交換機(jī)之類的特殊硬件和/或利用支持鏈路聚合以便與瘦客戶端一起來(lái)使用的網(wǎng)絡(luò)接口卡來(lái)實(shí)現(xiàn)了其它冗余方案。但是,在獲取和維護(hù)另外的硬件設(shè)備時(shí)存在另外的成本。此外,在根據(jù)網(wǎng)絡(luò)架構(gòu)來(lái)配置交換機(jī)與虛擬局域網(wǎng)(VLAN)和/或鏈路聚合時(shí),存在增加的復(fù)雜度。此外,這些硬件組件通常是由與虛擬化軟件的提供商不同的制造商來(lái)提供的。
[0024]本文所公開(kāi)的例子提供了克服上面的限制,以在不損失數(shù)據(jù)和不顯著增加數(shù)據(jù)處理或帶寬需求的情況下提供快速恢復(fù)時(shí)間(小于五秒)的冗余網(wǎng)絡(luò)系統(tǒng)。本文所公開(kāi)的例子可以在任何網(wǎng)絡(luò)主機(jī)組上實(shí)現(xiàn),每一個(gè)網(wǎng)絡(luò)主機(jī)具有兩個(gè)網(wǎng)絡(luò)接口,這兩個(gè)網(wǎng)絡(luò)接口中的每一個(gè)連接到兩個(gè)網(wǎng)絡(luò)中的一個(gè)網(wǎng)絡(luò)。如本文所使用的,術(shù)語(yǔ)“網(wǎng)絡(luò)主機(jī)”(或者“主機(jī)”)指代連接到網(wǎng)絡(luò)并使用傳輸控制協(xié)議/互聯(lián)網(wǎng)協(xié)議(TCP/IP)協(xié)議棧進(jìn)行通信的任何計(jì)算機(jī)或其它設(shè)備(無(wú)論是虛擬實(shí)現(xiàn)的,還是經(jīng)由物理硬件來(lái)實(shí)現(xiàn))。示例性網(wǎng)絡(luò)主機(jī)包括虛擬機(jī)、瘦客戶端、胖客戶端、嵌入式控制器和/或任何其它適當(dāng)?shù)挠?jì)算設(shè)備。
[0025]本文所公開(kāi)的例子涉及多歸屬網(wǎng)絡(luò)主機(jī)。也就是說(shuō),旨在是本文所描述的冗余方案的一部分的每一個(gè)主機(jī),經(jīng)由兩個(gè)網(wǎng)絡(luò)接口(例如,NIC)來(lái)連接到兩個(gè)獨(dú)立的網(wǎng)絡(luò)。此夕卜,參與同一冗余方案的每一個(gè)主機(jī)與該方案中的每一個(gè)其它主機(jī)連接到相同的兩個(gè)網(wǎng)絡(luò)。也就是說(shuō),這些網(wǎng)絡(luò)主機(jī)中的每一個(gè)網(wǎng)絡(luò)主機(jī)包括在兩個(gè)單獨(dú)的網(wǎng)絡(luò)上實(shí)現(xiàn)面向連接的通信的兩個(gè)網(wǎng)絡(luò)接口,這兩個(gè)單獨(dú)的網(wǎng)絡(luò)對(duì)于包括成該冗余方案的一部分的所有主機(jī)是共同的。雖然形成冗余方案的一部分的網(wǎng)絡(luò)主機(jī)具有兩個(gè)共同網(wǎng)絡(luò),但在一些例子中,這些網(wǎng)絡(luò)中的任意一個(gè)網(wǎng)絡(luò)也可以包括沒(méi)有連接到另一個(gè)網(wǎng)絡(luò)的一個(gè)或多個(gè)其它主機(jī)。雖然在本文所描述的冗余方案中將不包括這些主機(jī),但這些主機(jī)并不妨礙該方案。此外,這些主機(jī)中的一個(gè)或多個(gè)主機(jī)可以連接到另外的網(wǎng)絡(luò),而不影響本文所公開(kāi)的教導(dǎo)。另外,在一些例子中,在過(guò)程控制系統(tǒng)中可以存在多組的網(wǎng)絡(luò)主機(jī),每組的網(wǎng)絡(luò)主機(jī)都包括兩個(gè)共同網(wǎng)絡(luò)。在這些例子中,每一組的網(wǎng)絡(luò)可以單獨(dú)地實(shí)現(xiàn)本文所公開(kāi)的教導(dǎo)。
[0026]雖然本文所描述的冗余方案有益于解決在虛擬過(guò)程控制系統(tǒng)背景下的對(duì)可用性的特定關(guān)注,但本文所描述的教導(dǎo)也可以替代地在完全的物理環(huán)境中(即,不具有虛擬化)實(shí)現(xiàn)。也就是說(shuō),本文所公開(kāi)的教導(dǎo)適用于共享兩個(gè)共同網(wǎng)絡(luò),并基于TCP/IP協(xié)議進(jìn)行通信的任何網(wǎng)絡(luò)主機(jī)集合。
[0027]通過(guò)在對(duì)于網(wǎng)絡(luò)主機(jī)來(lái)說(shuō)共同的兩個(gè)獨(dú)立的網(wǎng)絡(luò)上監(jiān)測(cè)這些網(wǎng)絡(luò)主機(jī)之間的連接狀態(tài),來(lái)實(shí)現(xiàn)本文所描述的示例性冗余方案。通過(guò)對(duì)網(wǎng)絡(luò)連接進(jìn)行基本實(shí)時(shí)地監(jiān)測(cè),快速地檢測(cè)到網(wǎng)絡(luò)故障。一旦在這些網(wǎng)絡(luò)中的一個(gè)中檢測(cè)到網(wǎng)絡(luò)故障,則根據(jù)本文所公開(kāi)的教導(dǎo),相關(guān)聯(lián)的網(wǎng)絡(luò)主機(jī)使用互聯(lián)網(wǎng)協(xié)議(IP)路由標(biāo)準(zhǔn)來(lái)自動(dòng)地建立替代的通信路徑,該替代的通信路徑繞過(guò)出故障的網(wǎng)絡(luò)。更具體地說(shuō),網(wǎng)絡(luò)主機(jī)將來(lái)自這些網(wǎng)絡(luò)接口中的一個(gè)網(wǎng)絡(luò)接口(其連接到出故障的網(wǎng)絡(luò))的傳輸,重新路由經(jīng)過(guò)(與操作的網(wǎng)絡(luò)相連接的)另一個(gè)網(wǎng)絡(luò)接口。
[0028]在一些所公開(kāi)的例子中,網(wǎng)絡(luò)故障的檢測(cè)和替代通信路徑的建立花費(fèi)不超過(guò)五秒。在一些例子中,更短的時(shí)間是可能的(例如,500毫秒或者更少)。因此,本文所公開(kāi)的例子提供了過(guò)程控制系統(tǒng)環(huán)境所需要的要求之內(nèi)的恢復(fù)時(shí)間,以確保可靠的和最新的數(shù)據(jù)可用于操作者和其它末端用戶。此外,檢測(cè)網(wǎng)絡(luò)故障和建立替代通信路徑所花費(fèi)的時(shí)間,小于用于數(shù)據(jù)傳輸?shù)倪B接超時(shí)時(shí)段。也就是說(shuō),在網(wǎng)絡(luò)主機(jī)停止嘗試數(shù)據(jù)的重傳之前,將建立替代的路由。因此,不會(huì)丟失數(shù)據(jù),并且將延遲至多是幾秒。
[0029]如本文所描述的基本實(shí)時(shí)地檢測(cè)網(wǎng)絡(luò)故障以實(shí)現(xiàn)從這些故障中快速地恢復(fù),是通過(guò)在連接網(wǎng)絡(luò)主機(jī)的兩個(gè)網(wǎng)絡(luò)中的每一個(gè)網(wǎng)絡(luò)上,對(duì)這些主機(jī)之間的連接性進(jìn)行連續(xù)地監(jiān)測(cè)來(lái)實(shí)現(xiàn)的。在一些例子中,每一個(gè)網(wǎng)絡(luò)主機(jī)都準(zhǔn)備了在網(wǎng)絡(luò)上向每一個(gè)其它網(wǎng)絡(luò)主機(jī)進(jìn)行頻繁地發(fā)送的完整性消息。在一些例子中,該完整性消息不同于與過(guò)程控制系統(tǒng)的普通操作相關(guān)聯(lián)的主機(jī)之間的典型數(shù)據(jù)傳輸。在一些例子中,在相應(yīng)的網(wǎng)絡(luò)上廣播該完整性消息。在其它例子中,僅僅將完整性消息組播到被配置為接收這些消息的那些網(wǎng)絡(luò)主機(jī)。在一些例子中,在每一個(gè)網(wǎng)絡(luò)接口之間,交替地傳輸來(lái)自每一個(gè)網(wǎng)絡(luò)主機(jī)的每一個(gè)連續(xù)的完整性消息。在一些例子中,在從網(wǎng)絡(luò)接口中的任何一個(gè)網(wǎng)絡(luò)接口發(fā)送后續(xù)的完整性消息之前,從每一個(gè)連接的主機(jī)的每一個(gè)網(wǎng)絡(luò)接口都發(fā)送完整性消息。也就是說(shuō),在返回到第一網(wǎng)絡(luò)主機(jī)重復(fù)該過(guò)程之前,一些例子循環(huán)地通過(guò)每一個(gè)網(wǎng)絡(luò)主機(jī)的每一個(gè)網(wǎng)絡(luò)接口。在一些例子中,在一秒的一部分之內(nèi),發(fā)生循環(huán)地通過(guò)每一個(gè)網(wǎng)絡(luò)主機(jī)的每一個(gè)網(wǎng)絡(luò)接口。用此方式,每一個(gè)網(wǎng)絡(luò)主機(jī)在頻繁的基礎(chǔ)上,經(jīng)由每一個(gè)網(wǎng)絡(luò)接口來(lái)向每一個(gè)其它網(wǎng)絡(luò)主機(jī)發(fā)送完整性消息。因此,可以對(duì)經(jīng)由每一個(gè)網(wǎng)絡(luò)接口的每一個(gè)網(wǎng)絡(luò)主機(jī)之間的連接進(jìn)行連續(xù)地監(jiān)測(cè),以快速地檢測(cè)到任意兩個(gè)網(wǎng)絡(luò)主機(jī)之間的故障。
[0030]每一個(gè)完整性消息用于測(cè)試發(fā)送方主機(jī)與每一個(gè)其它主機(jī)在相應(yīng)的網(wǎng)絡(luò)上的連接性。如果每一個(gè)其它網(wǎng)絡(luò)主機(jī)都在特定的網(wǎng)絡(luò)上從發(fā)送方主機(jī)接收到完整性消息,則這些網(wǎng)絡(luò)主機(jī)中的每一個(gè)可以確認(rèn)其自己與發(fā)送方主機(jī)之間在該網(wǎng)絡(luò)上的通信狀態(tài)是良好的。另一方面,如果這些網(wǎng)絡(luò)主機(jī)中的一個(gè)或多個(gè)網(wǎng)絡(luò)主機(jī)無(wú)法接收到從特定的主機(jī)所發(fā)送的完整性消息,則完整性消息的缺失指示發(fā)生網(wǎng)絡(luò)故障。因此,無(wú)法接收到所預(yù)期的完整性消息的網(wǎng)絡(luò)主機(jī),可以確認(rèn)自己和從其預(yù)期該消息的主機(jī)之間的連接狀態(tài)是壞的。
[0031]在一些例子中,按照已知的時(shí)間間隔來(lái)定期地發(fā)送完整性消息,使得如果在與該已知時(shí)間間隔相比更長(zhǎng)的時(shí)間段上沒(méi)有從特定網(wǎng)絡(luò)主機(jī)的特定網(wǎng)絡(luò)接口接收到消息,則可以假定發(fā)生網(wǎng)絡(luò)故障。在一些例子中,基于在閾值時(shí)間段上沒(méi)有接收到完整性消息來(lái)檢測(cè)到網(wǎng)絡(luò)故障,其中該閾值時(shí)間段是從同一網(wǎng)絡(luò)主機(jī)的同一網(wǎng)絡(luò)接口所發(fā)送的各個(gè)連續(xù)完整性消息之間的時(shí)間間隔的三倍。在一些例子中,與該時(shí)間間隔的三倍相比,所述閾值時(shí)間段可以更長(zhǎng)或者更短。
[0032]在每一個(gè)網(wǎng)絡(luò)上從每一個(gè)主機(jī)向每一個(gè)其它主機(jī)發(fā)送的定期完整性消息,用作對(duì)于經(jīng)由各個(gè)網(wǎng)絡(luò)的各個(gè)網(wǎng)絡(luò)主機(jī)之間的連接的檢查或者測(cè)試。如果網(wǎng)絡(luò)主機(jī)接收到完整性消息,則確認(rèn)在該主機(jī)和發(fā)送該消息的網(wǎng)絡(luò)主機(jī)之間的連接或通信狀態(tài)是良好的。如果網(wǎng)絡(luò)主機(jī)沒(méi)有接收到完整性消息(在閾值時(shí)間段之后),則確認(rèn)該主機(jī)和從其預(yù)期消息的網(wǎng)絡(luò)主機(jī)之間的連接狀態(tài)是壞的。因此,在一些例子中,基于是否獨(dú)立于這些消息中包含的內(nèi)容來(lái)接收到消息,來(lái)確定每一個(gè)主機(jī)之間的連接或通信狀態(tài)。但是,在一些例子中,完整性消息的內(nèi)容包括用于為每一個(gè)網(wǎng)絡(luò)主機(jī)提供另外的信息,以便對(duì)不同的主機(jī)在不同的網(wǎng)絡(luò)上的之間的連接狀態(tài)進(jìn)行驗(yàn)證的完整性信息。
[0033]在一些例子中,完整性消息包括主機(jī)信息,該主機(jī)信息標(biāo)識(shí)發(fā)送該完整性消息的網(wǎng)絡(luò)主機(jī)。在一些例子中,該主機(jī)信息包括發(fā)送該消息的網(wǎng)絡(luò)主機(jī)的兩個(gè)網(wǎng)絡(luò)接口的IP地址。用此方式,每一個(gè)網(wǎng)絡(luò)主機(jī)具有在檢測(cè)到網(wǎng)絡(luò)故障時(shí),創(chuàng)建替代的通信路徑所必需的IP信息。在一些例子中,各個(gè)網(wǎng)絡(luò)主機(jī)使用該主機(jī)信息來(lái)發(fā)現(xiàn)網(wǎng)絡(luò)上的其它主機(jī)。
[0034]另外,在一些例子中,完整性消息包括用于指示在發(fā)送該消息的網(wǎng)絡(luò)主機(jī)與每一個(gè)其它主機(jī)之間針對(duì)兩個(gè)網(wǎng)絡(luò)接口的連接或通信狀態(tài)的完整性信息。在一些例子中,通過(guò)生成該信息和接收與其它網(wǎng)絡(luò)主機(jī)中的每一個(gè)網(wǎng)絡(luò)主機(jī)相關(guān)聯(lián)的通信狀態(tài)(當(dāng)它們發(fā)送它們的完整性消息時(shí)),這些網(wǎng)絡(luò)主機(jī)中的每一個(gè)網(wǎng)絡(luò)主機(jī)可以生成用于表示自身與每一個(gè)其它主機(jī)之間的通信狀態(tài)的完整性表。在一些例子中,這種信息依賴于在由于網(wǎng)絡(luò)故障而使得直接連接發(fā)生失敗時(shí),來(lái)規(guī)定替代的通信路徑。另外地或替代地,在一些例子中,將每一個(gè)完整性消息中所包括的完整性信息,使用成基于每一個(gè)主機(jī)是否從其它主機(jī)接收到完整性消息以及其何時(shí)從其它主機(jī)接收到完整性消息,對(duì)由每一個(gè)主機(jī)確定的通信狀態(tài)進(jìn)行的冗余檢查。
[0035]雖然完整