數(shù)據(jù)中心中光子交換以及控制光子交換的方法與系統(tǒng)的制作方法
【專(zhuān)利說(shuō)明】
[0001] 相關(guān)申請(qǐng)案交叉申請(qǐng)
[0002] 本申請(qǐng)要求2013年8月7日遞交的發(fā)明名稱(chēng)為"數(shù)據(jù)中心中光子交換以及控制 光子交換的方法與系統(tǒng)(SystemandMethodforPhotonicSwitchingandControlling PhotonicSwitchinginaDataCenter)"的第13/961,663號(hào)美國(guó)專(zhuān)利申請(qǐng)的在線(xiàn)申請(qǐng)優(yōu) 先權(quán),該在先申請(qǐng)的內(nèi)容以引入的方式并入本文。
技術(shù)領(lǐng)域
[0003] 本發(fā)明涉及通信方法與系統(tǒng),尤其涉及數(shù)據(jù)中心中光子交換方法與系統(tǒng)。
【背景技術(shù)】
[0004] 當(dāng)今數(shù)據(jù)中心可能有非常大數(shù)量的服務(wù)器。例如,一個(gè)數(shù)據(jù)中心可能有超過(guò)50000 臺(tái)服務(wù)器。為了將服務(wù)器連接至另一個(gè)服務(wù)器以及外界,數(shù)據(jù)中心可以包括核心交換功能 和外圍交換設(shè)備。
[0005] -個(gè)大數(shù)據(jù)中心可能有非常大數(shù)量的互連,其可以作為光纖上的光信號(hào)實(shí)現(xiàn)。這 些核心互連將大量的外圍交換設(shè)備與所述核心交換功能連接。所述核心交換功能可以作為 小數(shù)量的非常大核心電子交換機(jī)實(shí)現(xiàn),所述核心電子交換機(jī)用作分布式核心交換機(jī)操作。 在部分?jǐn)?shù)據(jù)中心中,外圍交換設(shè)備直接在服務(wù)器內(nèi)部實(shí)現(xiàn),并且服務(wù)器直接與核心交換功 能互連。在其他數(shù)據(jù)中心中,服務(wù)器與機(jī)架(T0R)交換機(jī)斷開(kāi),所述T0R交換機(jī)通過(guò)核心互 連與核心交換功能實(shí)體連接。
【發(fā)明內(nèi)容】
[0006] 在實(shí)施例中,數(shù)據(jù)中心包括分組交換核心和光子交換機(jī)。所述光子交換機(jī)包括:與 所述分組交換核心光耦合的第一組端口以及用于與多個(gè)外圍設(shè)備光耦合的第二組端口,其 中所述光子交換機(jī)用于連接所述多個(gè)外圍設(shè)備與所述分組交換核心之間的報(bào)文。所述數(shù)據(jù) 中心還包括與所述光子交換機(jī)耦合的光子交換控制器以及耦合于所述分組交換核心和光 子交換控制器之間的操作管理中心。
[0007] -種控制數(shù)據(jù)中心中光子交換機(jī)的方法實(shí)施例包括:光子交換控制器從操作管理 中心接收第一組件和第二組件之間的第一業(yè)務(wù)流的狀態(tài),其中所述第一業(yè)務(wù)流包括所述第 一組件和所述光子交換機(jī)之間的第一光鏈路上的第二業(yè)務(wù)流,以及所述光子交換機(jī)和所述 第二組件之間的第二光鏈路上的第三業(yè)務(wù)流,用以生成檢測(cè)業(yè)務(wù)流。所述方法還包括所述 光子交換控制器根據(jù)所述檢測(cè)業(yè)務(wù)流調(diào)整所述光子交換機(jī)中的連接,包括增加一個(gè)額外的 光鏈路或者刪除一個(gè)多余的光鏈路。
[0008] -種控制數(shù)據(jù)中心中光子交換機(jī)的方法實(shí)施例包括獲得外圍設(shè)備連通度圖和確 定交換機(jī)連通圖。所述方法還包括根據(jù)所述外圍設(shè)備連通度圖和所述交換機(jī)連通圖確定光 子交換機(jī)連通性,并且根據(jù)所述光子交換機(jī)連通性配置光子交換機(jī)。
[0009] 上述寬泛地概括了本發(fā)明實(shí)施例的特征,以便能夠更好理解以下本發(fā)明詳細(xì)描 述。下文將會(huì)介紹本發(fā)明各個(gè)實(shí)施例的額外特征和優(yōu)點(diǎn),其構(gòu)成本發(fā)明權(quán)利要求的主體部 分。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,所公開(kāi)的概念和特定實(shí)施例易被用作修改或設(shè)計(jì)其他實(shí) 現(xiàn)與本發(fā)明相同的目的的結(jié)構(gòu)或過(guò)程的基礎(chǔ)。本領(lǐng)域的技術(shù)人員還應(yīng)當(dāng)意識(shí)到,這種等同 構(gòu)造不脫離所附權(quán)利要求書(shū)所闡述的本發(fā)明的精神和范圍。
【附圖說(shuō)明】
[0010] 為了更完整地理解本發(fā)明及其優(yōu)點(diǎn),現(xiàn)在參考下文結(jié)合附圖進(jìn)行的描述,其中:
[0011] 圖1示出了一個(gè)數(shù)據(jù)中心的實(shí)施例;
[0012] 圖2示出了帶有光子交換機(jī)的數(shù)據(jù)中心的實(shí)施例;
[0013] 圖3示出了連接模式的實(shí)施例;
[0014] 圖4示出了數(shù)據(jù)中心中光子交換機(jī)的控制結(jié)構(gòu)的實(shí)施例;
[0015] 圖5示出了一天中不同時(shí)間對(duì)應(yīng)的流量水平圖;
[0016] 圖6示出了一周中每天對(duì)應(yīng)的流量水平圖;
[0017] 圖7示出了一天中不同時(shí)間對(duì)應(yīng)的流量水平圖;
[0018] 圖8示出了不同時(shí)間對(duì)應(yīng)的流量水平圖;
[0019] 圖9示出了帶有核心交換故障的數(shù)據(jù)中心的實(shí)施例;
[0020] 圖10示出了帶有光子交換機(jī)以及核心交換故障的數(shù)據(jù)中心的實(shí)施例;
[0021] 圖11示出了帶有光子交換機(jī)以及核心交換故障的數(shù)據(jù)中心的附加實(shí)施例;
[0022] 圖12示出了帶有光子交換機(jī)以及核心交換故障的數(shù)據(jù)中心的另一個(gè)實(shí)施例;
[0023] 圖13示出了帶有核心交換故障的數(shù)據(jù)中心的附加實(shí)施例;
[0024] 圖14示出了帶有光子交換機(jī)以及核心交換故障的數(shù)據(jù)中心的附加實(shí)施例;
[0025] 圖15示出了帶有光子交換機(jī)以及核心交換故障的數(shù)據(jù)中心的另一個(gè)實(shí)施例;
[0026] 圖16示出了帶有光子交換機(jī)以及核心交換故障的數(shù)據(jù)中心的附加實(shí)施例;
[0027] 圖17示出了針對(duì)數(shù)據(jù)中心中光子交換機(jī)的控制結(jié)構(gòu)的另一個(gè)實(shí)施例;
[0028] 圖18示出了帶有掉電核心交換模塊的數(shù)據(jù)中心的實(shí)施例;
[0029] 圖19示出了帶有光子交換機(jī)以及掉電核心交換模塊的數(shù)據(jù)中心的實(shí)施例;
[0030] 圖20示出了帶有光子交換機(jī)以及測(cè)試設(shè)備的數(shù)據(jù)中心的實(shí)施例;
[0031] 圖21示出了數(shù)據(jù)中心的另一個(gè)實(shí)施例;
[0032] 圖22示出了帶有光子交換機(jī)以及測(cè)試設(shè)備的數(shù)據(jù)中心的另一個(gè)實(shí)施例;
[0033] 圖23示出了帶有光子交換機(jī)的數(shù)據(jù)中心的附加實(shí)施例;
[0034] 圖24示出了光子交換結(jié)構(gòu);
[0035] 圖25不出了微機(jī)電系統(tǒng)(MEMS)光子交換機(jī);
[0036] 圖26示出了連接數(shù)據(jù)中心中報(bào)文的方法實(shí)施例;
[0037] 圖27示出了調(diào)整數(shù)據(jù)中心中鏈路的方法實(shí)施例;
[0038] 圖28示出了調(diào)整數(shù)據(jù)中心中鏈路的另一個(gè)方法實(shí)施例;
[0039] 圖29示出了為響應(yīng)組件故障調(diào)整數(shù)據(jù)中心中鏈路的方法實(shí)施例;
[0040] 圖30示出了調(diào)整數(shù)據(jù)中心中鏈路的附加方法實(shí)施例;
[0041] 圖31示出了測(cè)試數(shù)據(jù)中心中組件的方法實(shí)施例;
[0042] 圖32示出了測(cè)試數(shù)據(jù)中心中組件的方法實(shí)施例;
[0043] 圖33示出了控制數(shù)據(jù)中心中光子交換機(jī)的另一個(gè)方法實(shí)施例。
[0044] 除非另有指示,否則不同圖中的對(duì)應(yīng)標(biāo)號(hào)和符號(hào)通常指代對(duì)應(yīng)部分。繪制各圖是 為了清楚地說(shuō)明實(shí)施例的相關(guān)方面,因此未必是按比例繪制的。
【具體實(shí)施方式】
[0045] 首先應(yīng)理解,盡管下文提供一項(xiàng)或多項(xiàng)實(shí)施例的說(shuō)明性實(shí)施方案,但所公開(kāi)的系 統(tǒng)和/或方法可使用任何數(shù)目的技術(shù)來(lái)實(shí)施,無(wú)論該技術(shù)是當(dāng)前已知還是現(xiàn)有的。本發(fā)明 決不應(yīng)限于下文所說(shuō)明的說(shuō)明性實(shí)施方案、附圖和技術(shù),包括本文所說(shuō)明并描述的示例性 設(shè)計(jì)和實(shí)施方案,而是可在所附權(quán)利要求書(shū)的范圍以及其等效物的完整范圍內(nèi)修改。
[0046] 數(shù)據(jù)中心利用外圍設(shè)備的大規(guī)模陣列,其中所述外圍設(shè)備由多個(gè)服務(wù)器機(jī)架組 成。每臺(tái)機(jī)架裝有一個(gè)機(jī)架(TOR)交換機(jī)或者統(tǒng)計(jì)復(fù)用器,其通過(guò)高容量鏈路向核心分組 交換機(jī)提供復(fù)用分組數(shù)據(jù)流。在一個(gè)例子中,所述高容量鏈路是光鏈路。圖1示出了數(shù)據(jù) 中心102。數(shù)據(jù)中心102的分組交換核心108包括分組交換機(jī)110以及分組交換核心112 的平行陣列。分組交換機(jī)110是非常大的分組交換機(jī)。分組交換機(jī)110也可能包括四個(gè)象 限114以及核心分組交換端口 116或者其他類(lèi)似分區(qū)。
[0047] 鏈路100可以是短距離光纖,將分組交換核心108連接至外圍設(shè)備101。鏈路100 以相互關(guān)聯(lián)的固定正交連接模式配置,用以提供物理層面連通性的固定圖。所述連接用于 在外圍設(shè)備101分配交換容量,并且允許外圍設(shè)備101訪問(wèn)多個(gè)交換單元,因此,組件故障 降低容量,但是不會(huì)影響外圍設(shè)備或者交換機(jī)。固定連接結(jié)構(gòu)有可能被改變、擴(kuò)大、或者修 改。一個(gè)數(shù)據(jù)中心可能包含2000條40Gb/s的雙向鏈路,所述雙向鏈路可能有80Tb/s或者 lOTB/s的容量。所述鏈路可能會(huì)有更大的容量。
[0048] 外圍設(shè)備101可以裝配到包含有機(jī)架(TOR)交換機(jī)120的機(jī)架,所述外圍設(shè)備101 可以包括中央處理器(CPU) 118、存儲(chǔ)單元122、防火墻負(fù)載平衡器124、路由器126以及傳輸 接口 128。TOR交換機(jī)120組合機(jī)架中各個(gè)單元的分組數(shù)據(jù)流,并且提供統(tǒng)計(jì)復(fù)用水平。另 外,TOR交換機(jī)120通過(guò)高容量短距離光鏈路驅(qū)動(dòng)合成數(shù)據(jù)流往返于分組交換核心。在一 個(gè)例子中,一個(gè)T0R交換機(jī)支持48個(gè)單元并且有一個(gè)10Gb/s的接口。對(duì)于CPU118,每個(gè) T0R交換機(jī)120可以以48xlOGb/s的速率從處理器中提取數(shù)據(jù),并且以4x40Gb/s的速率給 分組交換核心108提供數(shù)據(jù)。這里的帶寬數(shù)據(jù)壓縮程度為3:1。存儲(chǔ)單元122、路由器126 以及傳輸接口 128通過(guò)網(wǎng)絡(luò)連通性或者專(zhuān)用數(shù)據(jù)網(wǎng)絡(luò)連接至外界104。
[0049] 操作管理中心(0MC) 106監(jiān)管復(fù)雜數(shù)據(jù)中心的操作、管理以及維護(hù)功能。0MC106 可以測(cè)量流量容量。例如,0MC106測(cè)量外圍設(shè)備101和分組交換核心108之間的流量鏈 路阻塞時(shí)間和頻率。另外,0MC106測(cè)量哪條鏈路具有維護(hù)功能。
[0050] 圖1只示出了外圍設(shè)備的幾臺(tái)機(jī)架以及外圍設(shè)備101和分組交換核心108之間的 相對(duì)較少的鏈路。然而,可能會(huì)存在更多的外圍設(shè)備和鏈路。例如,數(shù)據(jù)中心的吞吐量可能 是80Tb/s,配有2000條連接至分組交換核心108的40Gb/s鏈路,以及2000條從分組交換 核心108至外圍設(shè)備101的40Gb/s鏈路。一個(gè)數(shù)據(jù)中心可以有500或者更多的外圍設(shè)備 機(jī)架。一個(gè)更大的lPb/s的數(shù)據(jù)中心可以有25000條雙向鏈路連接至中央交換復(fù)合體,配 有6000或者更多的外圍設(shè)備機(jī)架。
[0051] 來(lái)自外圍設(shè)備101的流量在分組交換機(jī)110平行分配。因?yàn)橥鈬O(shè)備101的負(fù)荷 在分組交換核心108分配,所以部分結(jié)構(gòu)故障不會(huì)影響外圍設(shè)備。η個(gè)大分組交換機(jī)中的一 個(gè)交換機(jī)的故障會(huì)將每個(gè)外圍設(shè)備可得的總交換容量降低至(η-1)/η。例如,當(dāng)η= 4時(shí), 所述交換容量減少25%。
[0052] 圖2示出了數(shù)據(jù)中心130,其包含分組交換核心108與所述核心分組交換端口之間 的低損耗光子交換機(jī)132。光子交換機(jī)132用于調(diào)整外圍設(shè)備101與分組交換核心108之 間的鏈路。光子交換機(jī)132可以是非常大的光子交換機(jī),例如有2000個(gè)或者更多的端口。 一個(gè)非常大的光子交換機(jī)可以是一個(gè)多級(jí)交換機(jī),所述多級(jí)交換機(jī)由幾百個(gè)端口的小結(jié)構(gòu) 組成,每個(gè)端口都是多種可能架構(gòu)中的一種。在一個(gè)例子中,所述光子交換機(jī)132是一個(gè)無(wú) 阻塞光子交換機(jī)。在另一個(gè)例子中,所述光子交換機(jī)132是一個(gè)可重排無(wú)阻塞光子交換機(jī)。 部分或者所有核心分組交換端口 116都可能連接至光子交換機(jī)132。在一個(gè)例子中,光子交 換機(jī)132有目前尚未使用的額外端口容量。光子交換機(jī)132建立外圍設(shè)備101與分組交換 核心108之間的連接模式,并且使得這種連接模式動(dòng)態(tài)變化。因此,外圍設(shè)備的物理端口與 交換機(jī)的物理端口之間的聯(lián)系并非固定。鏈路138連接外圍設(shè)備101和光子交換機(jī)132,然 而鏈路139連接光子交換機(jī)132與分組交換核心108。
[0053] 光子交換控制器134控制0MC136控制下的光子交換機(jī)132的光子交換機(jī)交叉連 接。0MC136從分組交換核心108和外圍設(shè)備101接收關(guān)于設(shè)備功能、流量水平以及組件或 者鏈路是正常工作還是出現(xiàn)故障的告警和狀態(tài)報(bào)告。另外,0MC136收集實(shí)時(shí)流量使用情 況,以及外圍設(shè)備101和分組交換核心108之間的鏈路的鏈路功能數(shù)據(jù)。
[0054] 在一個(gè)例子中,0MC136將收集的數(shù)據(jù)傳遞給光子交換控制器134。在另一個(gè)例子 中,光子交換控制器134直接收集流量數(shù)據(jù)。在這兩個(gè)例子中,光子交換控制器134處理收 集的數(shù)據(jù)并且基于計(jì)算結(jié)果操作光子交換機(jī)。所述處理取決于已實(shí)現(xiàn)的應(yīng)用程