擴展的以太網(wǎng)互聯(lián)結(jié)構(gòu)交換機的制作方法
【專利說明】擴展的以太網(wǎng)互聯(lián)結(jié)構(gòu)交換機
[0001]相關(guān)申請的交叉引用
[0002]本專利申請要求于2013年10月28日提交的由發(fā)明者Amr Sabaa > MuhammadDurran1、Mukhtiar Shaikh、Prasad P.Jogalekar>Jayanthi Jayaraman和ArunkaruppaiyaAdaikalam 命名為“Ethernet Fabric Format1n Based on VxLAN”(基于 VxLAN 的以太網(wǎng)互聯(lián)結(jié)構(gòu)形成)的美國臨時申請N0.61/896,544 (代理人案卷號BRCD-3232.0.1.US.PSP)的權(quán)益,該美國臨時申請的公開內(nèi)容以引用方式并入本文。
[0003]本公開涉及于2011年4月14日提交的由發(fā)明人Suresh Vobbilisetty和DilipChatwani命名為“Virtual Cluster Switching”(虛擬集群交換)的美國專利申請N0.13/087,239 (代理人案卷號BRCD-3008.1.US.NP),該美國專利申請的公開內(nèi)容以引用方式并入文本。
技術(shù)領(lǐng)域
[0004]本公開涉及網(wǎng)絡(luò)設(shè)計。更具體地,本公開涉及用于構(gòu)造可擴展交換系統(tǒng)的方法。
【背景技術(shù)】
[0005]互聯(lián)網(wǎng)的指數(shù)式增長使它成為了在物理設(shè)備和虛擬設(shè)備上運行的各種應(yīng)用程序的大眾傳遞介質(zhì)。此類應(yīng)用程序隨之帶來了增大的寬帶需求。因此,設(shè)備供應(yīng)商競相構(gòu)建更大和更快的多功能交換機。然而,交換機的尺寸不能無限地增大。它受到物理空間、功率消耗和設(shè)計復(fù)雜性等因素的限制。此外,更高性能的交換機通常更加復(fù)雜和昂貴。更重要的是,因為過大和過復(fù)雜的系統(tǒng)常常不提供規(guī)模效益,僅僅增加交換機的尺寸和能力可能因增加的每端口成本而被證明在經(jīng)濟上不可行。
[0006]一種改善交換機系統(tǒng)的可擴展性的靈活方法是構(gòu)建互聯(lián)結(jié)構(gòu)交換機。互聯(lián)結(jié)構(gòu)交換機是單個成員交換機的集合。這些成員交換機形成可具有任意數(shù)目端口和任意拓撲結(jié)構(gòu)的單個邏輯交換機。隨著需求的增長,客戶可采取“按需支付”的方法按比例增大互聯(lián)結(jié)構(gòu)交換機的容量。
[0007]與此同時,第2層(例如以太網(wǎng))交換技術(shù)持續(xù)革新。更多路由類的功能正在遷移至第2層,這些功能在傳統(tǒng)上是第3層(例如互聯(lián)網(wǎng)協(xié)議或IP層)網(wǎng)絡(luò)的特征。值得注意的是,多鏈路透明互聯(lián)(TRILL)協(xié)議的最新發(fā)展允許以太網(wǎng)交換機更像路由設(shè)備一樣工作。TRILL克服了常規(guī)生成樹協(xié)議的固有低效率;生成樹協(xié)議要求第2層交換機以邏輯生成樹拓撲f禹接,從而避免環(huán)路。通過在交換機中實時路由功能和在TRILL標頭中包括跳數(shù),TRILL允許路由橋(RBridge)以任意拓撲結(jié)構(gòu)耦接,而不會有產(chǎn)生環(huán)路的風險。
[0008]雖然互聯(lián)結(jié)構(gòu)交換機給網(wǎng)絡(luò)帶來許多有利的特征,但是在有效促進擴展的互聯(lián)結(jié)構(gòu)交換機(例如跨數(shù)據(jù)中心)方面仍有一些問題尚未解決。
【發(fā)明內(nèi)容】
[0009]本發(fā)明的一個實施例提供了一種交換機。該交換機包括互聯(lián)結(jié)構(gòu)交換機模塊和學(xué)習模塊?;ヂ?lián)結(jié)構(gòu)交換機模塊在第一互聯(lián)結(jié)構(gòu)交換機中維持成員關(guān)系?;ヂ?lián)結(jié)構(gòu)交換機包括多個交換機并作為單個交換機運行。第一互聯(lián)結(jié)構(gòu)交換機位于還包括第二互聯(lián)結(jié)構(gòu)交換機的擴展互聯(lián)結(jié)構(gòu)交換機中。學(xué)習模塊從來自第二互聯(lián)結(jié)構(gòu)交換機的通知消息中識別在第二互聯(lián)結(jié)構(gòu)交換機處學(xué)習到的介質(zhì)訪問控制地址(MAC)。學(xué)習模塊將該MAC地址存儲在與第二互聯(lián)結(jié)構(gòu)交換機的互聯(lián)網(wǎng)協(xié)議(IP)地址相關(guān)聯(lián)的本地MAC表中。
[0010]在根據(jù)該實施例的一個變型形式中,IP地址是浮動IP地址并且與第二互聯(lián)結(jié)構(gòu)交換機的多個成員交換機相關(guān)聯(lián)。
[0011]在根據(jù)該實施例的一個變型形式中,交換機還包括發(fā)現(xiàn)模塊,該發(fā)現(xiàn)模塊識別一個包含IP地址為源IP地址的發(fā)現(xiàn)消息。該發(fā)現(xiàn)消息為多播消息。作為響應(yīng),發(fā)現(xiàn)模塊將該IP地址包括在擴展的互聯(lián)結(jié)構(gòu)交換機的鄰居表中。該鄰居表包括與擴展的互聯(lián)結(jié)構(gòu)交換機中的相應(yīng)互聯(lián)結(jié)構(gòu)交換機相關(guān)聯(lián)的相應(yīng)IP地址。
[0012]在根據(jù)該實施例的一個變型形式中,交換機還包括轉(zhuǎn)發(fā)模塊,該轉(zhuǎn)發(fā)模塊將MAC地址識別為封裝在互聯(lián)結(jié)構(gòu)封裝標頭中的分組的目的MAC地址。響應(yīng)于識別MAC地址,轉(zhuǎn)發(fā)模塊將分組封裝在隧道封裝標頭中。隧道封裝標頭的目的地址為IP地址。
[0013]在另外的變型形式中,分組的源MAC地址與耦接至第一互聯(lián)結(jié)構(gòu)交換機的主機上運行的第一虛擬機相關(guān)聯(lián),并且分組的目的MAC地址與耦接至第二互聯(lián)結(jié)構(gòu)交換機的主機上運行的第二虛擬機相關(guān)聯(lián)。第一虛擬機和第二虛擬機在同一虛擬局域網(wǎng)(VLAN)中。
[0014]在根據(jù)該實施例的一個變型形式中,交換機還包括轉(zhuǎn)發(fā)模塊,該轉(zhuǎn)發(fā)模塊將地址解析協(xié)議(ARP)請求封裝在隧道封裝標頭中。隧道封裝標頭的目的地址為IP地址。
[0015]在根據(jù)該實施例的一個變型形式中,交換機還包括轉(zhuǎn)發(fā)模塊,該轉(zhuǎn)發(fā)模塊將目的為虛擬機的分組封裝在隧道封裝標頭中。隧道封裝標頭的目的地址為IP地址。該虛擬機已經(jīng)從耦接至第一互聯(lián)結(jié)構(gòu)交換機的主機遷移到耦接至第二互聯(lián)結(jié)構(gòu)交換機的主機。
[0016]在根據(jù)該實施例的一個變型形式中,交換機還包括轉(zhuǎn)發(fā)模塊,該轉(zhuǎn)發(fā)模塊識別封裝在第一隧道封裝標頭中的分組。隧道封裝標頭的目的地址對應(yīng)于虛擬機監(jiān)控程序。轉(zhuǎn)發(fā)模塊還將封裝的分組封裝在第二隧道封裝標頭中。第二隧道封裝標頭的目的地址為IP地址。
[0017]在根據(jù)該實施例的一個變型形式中,交換機還包括可靠性模塊,該可靠性模塊將交換機作為虛擬機的主控-冗余可靠性協(xié)議的主控轉(zhuǎn)發(fā)器而操作。該虛擬機已經(jīng)從耦接至第二互聯(lián)結(jié)構(gòu)交換機的主機遷移到耦接至第一互聯(lián)結(jié)構(gòu)交換機的主機。
[0018]在根據(jù)該實施例的一個變型形式中,交換機還包括轉(zhuǎn)發(fā)模塊,該轉(zhuǎn)發(fā)模塊識別封裝在互聯(lián)結(jié)構(gòu)封裝標頭中的分組。互聯(lián)結(jié)構(gòu)封裝標頭的出口交換機標識符對應(yīng)于第二互聯(lián)結(jié)構(gòu)交換機的成員交換機。轉(zhuǎn)發(fā)模塊還將封裝的分組封裝在隧道封裝標頭中。隧道封裝標頭的目的地址為IP地址。
[0019]在另外的變型形式中,互聯(lián)結(jié)構(gòu)封裝標頭為以下的一種或多種:(i)多鏈路透明互聯(lián)(TRILL)標頭,其中互聯(lián)結(jié)構(gòu)封裝標頭的入口交換機標識符和出口交換機標識符為TRILL路由橋(RBridge)標識符;和(ii) IP標頭,其中互聯(lián)結(jié)構(gòu)封裝標頭的源地址和目的地址為IP地址。
【附圖說明】
[0020]圖1示出根據(jù)本發(fā)明實施例的示例性擴展的互聯(lián)結(jié)構(gòu)交換機。
[0021]圖2A呈現(xiàn)根據(jù)本發(fā)明實施例的一個流程圖,其示出擴展交換機在擴展的互聯(lián)結(jié)構(gòu)交換機中發(fā)起鄰居發(fā)現(xiàn)的過程。
[0022]圖2B呈現(xiàn)根據(jù)本發(fā)明實施例的一個流程圖,其示出擴展交換機響應(yīng)擴展的互聯(lián)結(jié)構(gòu)交換機中的鄰居發(fā)現(xiàn)的過程。
[0023]圖2C呈現(xiàn)根據(jù)本發(fā)明實施例的一個流程圖,其示出擴展交換機建立與鄰居互聯(lián)結(jié)構(gòu)交換機的隧道的過程。
[0024]圖3A示出根據(jù)本發(fā)明實施例的、地址解析協(xié)議(ARP)請求擴展的互聯(lián)結(jié)構(gòu)交換機中的示例性轉(zhuǎn)發(fā)。
[0025]圖3B示出根據(jù)本發(fā)明實施例的、ARP響應(yīng)在擴展的互聯(lián)結(jié)構(gòu)交換機中的示例性轉(zhuǎn)發(fā)。
[0026]圖4A呈現(xiàn)根據(jù)本發(fā)明實施例的一個流程圖,其示出擴展交換機在擴展的互聯(lián)結(jié)構(gòu)交換機中共享學(xué)習到的介質(zhì)訪問控制(MAC)地址的過程。
[0027]圖4B呈現(xiàn)根據(jù)本發(fā)明實施例的一個流程圖,其示出擴展交換機從鄰居互聯(lián)結(jié)構(gòu)交換機學(xué)習MAC地址的過程。
[0028]圖5A示出根據(jù)本發(fā)明實施例的、數(shù)據(jù)分組在擴展的互聯(lián)結(jié)構(gòu)交換機中的示例性轉(zhuǎn)發(fā)。
[0029]圖5B呈現(xiàn)根據(jù)本發(fā)明實施例的一個流程圖,其示出擴展交換機將數(shù)據(jù)分組轉(zhuǎn)發(fā)至鄰居互聯(lián)結(jié)構(gòu)交換機的過程。
[0030]圖5C呈現(xiàn)根據(jù)本發(fā)明實施例的一個流程圖,其示出擴展交換機從鄰居互聯(lián)結(jié)構(gòu)交換機接收數(shù)據(jù)分組的過程。
[0031]圖6A示出根據(jù)本發(fā)明實施例的、虛擬機到擴展的互聯(lián)結(jié)構(gòu)交換機的示例性耦接。
[0032]圖6B示出根據(jù)本發(fā)明實施例的、虛擬機跨越鄰居互聯(lián)結(jié)構(gòu)交換機的示例性遷移。
[0033]圖7示出根據(jù)本發(fā)明實施例的擴展的互聯(lián)結(jié)構(gòu)交換機中的示例性虛擬路由器冗余協(xié)議(VRRP)定位。
[0034]圖8示出根據(jù)本發(fā)明實施例的擴展的互聯(lián)結(jié)構(gòu)交換機中的示例性工作負載管理。
[0035]圖9示出根據(jù)本發(fā)明實施例的、數(shù)據(jù)分組在擴展的互聯(lián)結(jié)構(gòu)交換機中的示例性直接轉(zhuǎn)發(fā)。
[0036]圖10示出根據(jù)本發(fā)明實施例的擴展的互聯(lián)結(jié)構(gòu)交換機中的示例性交換機。
[0037]在附圖中,相似的參考數(shù)字指示相同的圖形元素。
【具體實施方式】
[0038]提供以下描述是為了讓本領(lǐng)域的任何技術(shù)人員能夠制作和使用本發(fā)明,并且這些【具體實施方式】在特定應(yīng)用及其要求的情況下提供。所公開的實施例的各種修改形式對本領(lǐng)域技術(shù)人員而言是顯而易見的,并且在不脫離本發(fā)明的精神和范圍的前提下,本文規(guī)定的一般原理可應(yīng)用于其他實施例和應(yīng)用。因此,本發(fā)明不限于所示的實施例,而是被賦予與權(quán)利要求一致的最廣范圍。
[0039]概沭
[0040]在本發(fā)明的實施例中,通過促進包括多個互聯(lián)結(jié)構(gòu)交換機的擴展互聯(lián)結(jié)構(gòu)交換機來解決部署分布式互聯(lián)結(jié)構(gòu)交換機的問題,這些互聯(lián)結(jié)構(gòu)交換機可以在不同的數(shù)據(jù)中心中。根據(jù)現(xiàn)有技術(shù),互聯(lián)結(jié)構(gòu)交換機通常部署在數(shù)據(jù)中心內(nèi)并且不跨越多個數(shù)據(jù)中心而擴展。因此,無法進行跨數(shù)據(jù)中心的虛擬機(VM)遷移和工作負載管理。此外,當互聯(lián)結(jié)構(gòu)交換機中的成員交換機學(xué)習介質(zhì)訪問控制(MAC)地址信息(例如學(xué)習到的MAC地址和對應(yīng)的虛擬局域網(wǎng)(VLAN)標簽)時,交換機僅在本地互聯(lián)結(jié)構(gòu)交換機中共享那些信息。此外,當兩個互聯(lián)結(jié)構(gòu)交換機互連時,它們的連接經(jīng)常在第3層建立(例如通過廣域網(wǎng)(WAN))。然而,此類互連依賴于第3層設(shè)備(例如路由器)的可靠性,所以此類互連可能較昂貴,并且可能需要對第3層設(shè)備進行大量配置。
[0041]為了解決該問題,互聯(lián)結(jié)構(gòu)交換機被擴展至一個或多個其他的互聯(lián)結(jié)構(gòu)交換機。這些互聯(lián)結(jié)構(gòu)交換機一起作為擴展的互聯(lián)結(jié)構(gòu)交換機運行。擴展的互聯(lián)結(jié)構(gòu)交換機中的相應(yīng)互聯(lián)結(jié)構(gòu)交換機可被稱為擴展的互聯(lián)結(jié)構(gòu)交換機的鄰居互聯(lián)結(jié)構(gòu)交換機。擴展的互聯(lián)結(jié)構(gòu)交換機的鄰居互聯(lián)結(jié)構(gòu)交換機可在局域網(wǎng)(LAN)中并列或跨越WAN(例如跨多個數(shù)據(jù)中心)。在一些實施例中,擴展的互聯(lián)結(jié)構(gòu)交換機作為單個互聯(lián)結(jié)構(gòu)交換機運行。相應(yīng)的鄰居互聯(lián)結(jié)構(gòu)交換機包括一個或多個擴展交換機。這些擴展交換機能夠建立與另一鄰居互聯(lián)結(jié)構(gòu)交換機中的其他擴展交換機的隧道。這些隧道允許擴展的互聯(lián)結(jié)構(gòu)交換機中的鄰居互聯(lián)結(jié)構(gòu)交換機通過WAN相互通信。
[0042]在運行期間,擴展交換機發(fā)現(xiàn)其他的鄰居互聯(lián)結(jié)構(gòu)交換機。在一些實施例中,擴展交換機將發(fā)現(xiàn)消息發(fā)送至所有交換機多播(ASM)組以發(fā)現(xiàn)鄰居互聯(lián)結(jié)構(gòu)交換機。這允許擴展交換機識別鄰居互聯(lián)結(jié)構(gòu)交換機,并通過建立相應(yīng)的隧道來將本地互聯(lián)結(jié)構(gòu)交換機擴展至鄰居互聯(lián)結(jié)構(gòu)交換機。此外,通常在互聯(lián)結(jié)構(gòu)交換機中,當成員交換機學(xué)習MAC地址(和相關(guān)信息,諸如VLAN標簽)時,該成員交換機與其他成員交換機共享學(xué)習到的MAC地址(例如通過通知消息)。在擴展的互聯(lián)結(jié)構(gòu)交換機中,擴展交換機在學(xué)習MAC地址(本地學(xué)習或者從另一成員交換機學(xué)習)時,與鄰居互聯(lián)結(jié)構(gòu)交換機的其他擴展交換機共享學(xué)習到的MAC地址。因此,相應(yīng)的鄰居互聯(lián)結(jié)構(gòu)交換機可學(xué)習在擴展的互聯(lián)結(jié)構(gòu)交換機中學(xué)習到的MAC地址。
[0043]在互聯(lián)結(jié)構(gòu)交換機中,以任意拓撲結(jié)構(gòu)耦接的任何數(shù)量的交換機可在邏輯上作為單個交換機運行。互聯(lián)結(jié)