專利名稱:一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及光網(wǎng)絡(luò)中的數(shù)據(jù)傳輸技術(shù),特別涉及一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備及方法。
背景技術(shù):
InfiniBand(以下簡(jiǎn)稱IB)技術(shù)是一種交換式的串行總線技術(shù),其技術(shù)標(biāo)準(zhǔn)規(guī)定了從物理層到傳輸層的所有操作協(xié)議,并且由硬件來實(shí)現(xiàn)從一層到四層的功能,從而大大減輕了CPU的負(fù)荷,同時(shí)IB技術(shù)還制定了詳細(xì)的流控策略和安全機(jī)制,可以實(shí)現(xiàn)端口級(jí)和連接級(jí)的流控和點(diǎn)對(duì)點(diǎn)的安全保護(hù)。
IB技術(shù)的網(wǎng)絡(luò)構(gòu)成參見圖1,圖1為現(xiàn)有技術(shù)IB技術(shù)的網(wǎng)絡(luò)構(gòu)成示意圖。如圖1所示,IB網(wǎng)絡(luò)中包含的設(shè)備有主通道適配器(HCA)105、目標(biāo)通道適配器(TCA)106、IB交換機(jī)(Switch)107、IB路由器(Router)108等。IB網(wǎng)絡(luò)通過連接了系統(tǒng)內(nèi)存104的系統(tǒng)內(nèi)存控制器103和系統(tǒng)總線102與CPU101相連。圖1中將Switch 107與HCA 105和TCA 106和Router 108連接在一起的是IB鏈路(IB Link)。
HCA和TCA是InfiniBand體系結(jié)構(gòu)中的末端(EndNode)設(shè)備,HCA主要是連接CPU和IB鏈路的設(shè)備,而TCA主要是連接I/O設(shè)備和IB鏈路;Switch是InfiniBand鏈路層設(shè)備,可以實(shí)現(xiàn)InfiniBand報(bào)文在同一個(gè)IB子網(wǎng)內(nèi)的轉(zhuǎn)發(fā)功能;Router是InfiniBand網(wǎng)絡(luò)層設(shè)備,可以實(shí)現(xiàn)IB子網(wǎng)間或者IB子網(wǎng)和不同IB網(wǎng)絡(luò)的報(bào)文轉(zhuǎn)發(fā)功能;IB Link則是具體的物理鏈路,傳輸介質(zhì)可以是印刷電路板(PCB)、銅纜和光纖。
目前,在通信系統(tǒng)中利用IB技術(shù)能夠?qū)崿F(xiàn)板間、框間和設(shè)備間的互聯(lián)。IB技術(shù)作為一種新興的交換式串行總線技術(shù),將在未來的數(shù)據(jù)存儲(chǔ)域網(wǎng)(SAN)、高性能集群以及數(shù)據(jù)通信等領(lǐng)域有廣泛的應(yīng)用。
然而,目前IB規(guī)范中描述的利用銅纜聯(lián)接的最遠(yuǎn)距離為17m,光纖聯(lián)接的最遠(yuǎn)距離也只在十幾公里左右,因此,IB技術(shù)主要應(yīng)用于服務(wù)器集群、本地存儲(chǔ),其局限于系統(tǒng)區(qū)域網(wǎng)絡(luò),不能實(shí)現(xiàn)廣域的IB互聯(lián)。這樣,就制約了IB技術(shù)的廣泛應(yīng)用和進(jìn)一步的發(fā)展。
在光網(wǎng)絡(luò)傳輸技術(shù)中,同步數(shù)字序列(SDH)/同步光網(wǎng)絡(luò)(SONET)是一種非常成熟的技術(shù),具有安全性好,可靠性高的優(yōu)點(diǎn),在電信網(wǎng)中獲得大規(guī)模的應(yīng)用。SDH/SONET本身是一個(gè)透明的傳輸通道,可以實(shí)現(xiàn)多種協(xié)議數(shù)據(jù)的遠(yuǎn)距離傳輸。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提供一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備,使用該設(shè)備可以實(shí)現(xiàn)IB協(xié)議在SDH/SONET上的可靠傳輸。
本發(fā)明的另一個(gè)主要目的在于提供一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的方法,利用廣泛使用的SDH/SONET網(wǎng)絡(luò),實(shí)現(xiàn)IB在廣域范圍的可靠傳輸。
根據(jù)上述發(fā)明目的的一個(gè)方面,本發(fā)明提供了一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備,該設(shè)備位于InfiniBand端口與光網(wǎng)絡(luò)端口之間,包含InfiniBand接口模塊,其用于收發(fā)InfiniBand端口與映射和流控模塊之間傳輸?shù)臄?shù)據(jù);映射和流控模塊,其用于將從InfiniBand接口模塊接收的InfiniBand數(shù)據(jù)包加上流控信息后,發(fā)送給數(shù)據(jù)處理模塊;或?qū)臄?shù)據(jù)處理模塊接收的數(shù)據(jù)包去掉流控信息后,發(fā)送給InfiniBand接口模塊;數(shù)據(jù)處理模塊,其用于將從映射和流控模塊接收的數(shù)據(jù)包加上頭信息后發(fā)送給光網(wǎng)絡(luò)接口模塊,或?qū)墓饩W(wǎng)絡(luò)接口模塊接收的數(shù)據(jù)包去掉頭信息后發(fā)送給映射和流控模塊;光網(wǎng)絡(luò)接口模塊,其用于收發(fā)數(shù)據(jù)處理模塊與光網(wǎng)絡(luò)端口之間傳輸?shù)臄?shù)據(jù);管理模塊,其用于向其它各模塊發(fā)送管理信息和接收其它各模塊的上報(bào)信息。
其中,所述的InfiniBand接口模塊可以包含InfiniBand接口電路、虛通道收發(fā)送緩存;InfiniBand接口電路接收InfiniBand端口發(fā)送的數(shù)據(jù)并將其發(fā)送給虛通道發(fā)送緩存,或接收虛通道接收緩存發(fā)送的數(shù)據(jù)并將其發(fā)送到InfiniBand端口;虛通道發(fā)送緩存將從InfiniBand接口電路接收的數(shù)據(jù)暫存后發(fā)送給映射和流控模塊;虛通道接收緩存將從映射和流控模塊接收的數(shù)據(jù)暫存后發(fā)送給InfiniBand接口電路。
所述的虛通道發(fā)送緩存還可以進(jìn)一步包含虛通道發(fā)送隊(duì)列和虛通道發(fā)送復(fù)用模塊,虛通道發(fā)送緩存接收的數(shù)據(jù)先暫存到虛通道隊(duì)列中,再通過虛通道復(fù)用模塊發(fā)送給映射和流控模塊。虛通道接收緩存還可以進(jìn)一步包含虛通道接收隊(duì)列和虛通道接收復(fù)用模塊,虛通道接收緩存接收的數(shù)據(jù)先暫存到虛通道隊(duì)列中,再通過虛通道復(fù)用模塊發(fā)送給InfiniBand接口電路。
所述的虛通道發(fā)送緩存還可以進(jìn)一步通過向InfiniBand接口電路發(fā)送發(fā)送緩沖器狀態(tài)信號(hào)與InfiniBand接口電路相連;所述的虛通道接收緩存也可以進(jìn)一步通過向映射和流控模塊發(fā)送接收緩沖器狀態(tài)信號(hào)與映射和流控模塊相連。
所述的數(shù)據(jù)處理模塊可以進(jìn)一步包含數(shù)據(jù)計(jì)算校驗(yàn)和模塊,其對(duì)從映射和流控模塊接收的數(shù)據(jù)計(jì)算校驗(yàn)和;數(shù)據(jù)處理模塊還可以進(jìn)一步包含檢查計(jì)算校驗(yàn)和模塊,其對(duì)從光網(wǎng)絡(luò)接口模塊接收的數(shù)據(jù)檢查計(jì)算校驗(yàn)和。
所述的管理模塊向其它各模塊發(fā)送的管理信息可以包括向InfiniBand接口模塊發(fā)送端口的控制信息、向映射和流控模塊發(fā)送的流控策略信息、向數(shù)據(jù)處理模塊發(fā)送的控制信息、向光網(wǎng)絡(luò)接口模塊發(fā)送端口的控制信息。管理模塊接收其它各模塊的上報(bào)信息可以包括InfiniBand接口模塊發(fā)送的端口狀態(tài)上報(bào)信息、映射和流控模塊發(fā)送的流控狀態(tài)上報(bào)信息、數(shù)據(jù)處理模塊發(fā)送的數(shù)據(jù)包統(tǒng)計(jì)上報(bào)信息、光網(wǎng)絡(luò)接口模塊發(fā)送的端口狀態(tài)上報(bào)信息。
所述的InfiniBand端口可以為InfiniBand交換機(jī),或InfiniBand路由器,或InfiniBand通道適配器。
所述的光網(wǎng)絡(luò)端口可以為分插復(fù)用器。
根據(jù)上述發(fā)明目的的另一個(gè)方面,本發(fā)明提供了一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的方法,在InfiniBand數(shù)據(jù)發(fā)送端,將InfiniBand數(shù)據(jù)幀作為光網(wǎng)絡(luò)可以傳輸?shù)母呒?jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀的凈荷,封裝在高級(jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀中,并將該數(shù)據(jù)幀發(fā)送到光網(wǎng)絡(luò)端口,該數(shù)據(jù)幀通過光網(wǎng)絡(luò)傳輸?shù)綌?shù)據(jù)接收端的光網(wǎng)絡(luò)端口,在數(shù)據(jù)接收端將封裝在高級(jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀中的InfiniBand數(shù)據(jù)幀取出發(fā)送給數(shù)據(jù)InfiniBand接收端。
該方法中所述的數(shù)據(jù)幀的凈荷可以進(jìn)一步設(shè)置一個(gè)用于標(biāo)識(shí)流控狀態(tài)的流控消息頭。
該方法可以采用InfiniBand通信協(xié)議中基于信用度的流控機(jī)制進(jìn)行流控。
由上述技術(shù)方案可見,本發(fā)明實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備及方法利用廣泛使用的SDH/SONET網(wǎng)絡(luò),實(shí)現(xiàn)了IB在廣域范圍的可靠傳輸。相對(duì)于現(xiàn)有技術(shù),本發(fā)明很好的解決了IB遠(yuǎn)距離傳輸?shù)膯栴},可以實(shí)現(xiàn)基于IB的服務(wù)器遠(yuǎn)程集群、遠(yuǎn)程存儲(chǔ),大大擴(kuò)展了IB的應(yīng)用范圍。
圖1為現(xiàn)有技術(shù)IB技術(shù)的網(wǎng)絡(luò)構(gòu)成示意圖;圖2為本發(fā)明實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備一個(gè)實(shí)施例的框圖;圖3為圖2所示實(shí)施例的傳輸設(shè)備連接IB網(wǎng)和SDH網(wǎng)的連接示意圖;圖4為本發(fā)明的傳輸方法中使用的HDLC數(shù)據(jù)幀的幀結(jié)構(gòu)示意圖;圖5為IB數(shù)據(jù)幀的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下面結(jié)合實(shí)施例并參照附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。
圖2為本發(fā)明實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備一個(gè)實(shí)施例的框圖。如圖2所示,該傳輸設(shè)備位于InfiniBand端口與光網(wǎng)絡(luò)端口之間,包含InfiniBand接口模塊201、映射和流控模塊202、數(shù)據(jù)處理模塊203、光網(wǎng)絡(luò)接口模塊204和管理模塊205。
其中,InfiniBand接口模塊201包含InfiniBand接口電路2011、虛通道發(fā)送緩存2012和虛通道接收緩存2013;InfiniBand接口模塊201通過InfiniBand接口電路2011與InfiniBand端口相連,InfiniBand接口電路2011接收InfiniBand端口發(fā)送的數(shù)據(jù)并將其發(fā)送給虛通道發(fā)送緩存2012,或接收虛通道接收緩存2013發(fā)送的數(shù)據(jù)并將其發(fā)送到InfiniBand端口;虛通道發(fā)送緩存2012將從InfiniBand接口電路2011接收的數(shù)據(jù)暫存后發(fā)送給映射和流控模塊202;虛通道接收緩存2013將從映射和流控模塊202接收的數(shù)據(jù)暫存后發(fā)送給InfiniBand接口電路2011;本實(shí)施例中,虛通道發(fā)送緩存2012還包含了虛通道(VL)發(fā)送隊(duì)列VL0-VLn和虛通道發(fā)送復(fù)用模塊VL MUX,虛通道發(fā)送緩存2012接收的數(shù)據(jù)先暫存到虛通道發(fā)送隊(duì)列VL0-VLn中,再通過虛通道發(fā)送復(fù)用模塊VLMUX發(fā)送給映射和流控模塊202;虛通道接收緩存2013也進(jìn)一步包含了虛通道接收隊(duì)列VL0-VLn和虛通道接收復(fù)用模塊VL MUX,虛通道接收緩存2013接收的數(shù)據(jù)先暫存到虛通道接收隊(duì)列VL0-VLn中,再通過虛通道接收復(fù)用模塊VL MUX發(fā)送給InfiniBand接口電路2011。虛通道發(fā)送緩存2012還通過向InfiniBand接口電路發(fā)送發(fā)送緩沖器狀態(tài)信號(hào)TXBS與InfiniBand接口電路相連;虛通道接收緩存2013還通過向映射和流控模塊202發(fā)送接收緩沖器狀態(tài)信號(hào)RXBS與映射和流控模塊202相連,本發(fā)明的傳輸設(shè)備根據(jù)TXBS和RXBS來實(shí)現(xiàn)流控。
映射和流控模塊202接收InfiniBand接口模塊201的虛通道發(fā)送緩存2012發(fā)送的數(shù)據(jù),并根據(jù)虛通道發(fā)送緩存2012當(dāng)前的狀態(tài),在InfiniBand數(shù)據(jù)包加上相應(yīng)的流控信息發(fā)送給數(shù)據(jù)處理模塊203;或接收數(shù)據(jù)處理模塊203發(fā)送的數(shù)據(jù),從該數(shù)據(jù)的數(shù)據(jù)包中取出流控信息,把去掉流控信息的數(shù)據(jù)包發(fā)送到InfiniBand接口模塊201。
數(shù)據(jù)處理模塊203接收映射和流控模塊202發(fā)送的數(shù)據(jù),將該數(shù)據(jù)的數(shù)據(jù)包加上頭信息并計(jì)算校驗(yàn)和后發(fā)送給光網(wǎng)絡(luò)接口模塊204,或接收光網(wǎng)絡(luò)接口模塊204發(fā)送的數(shù)據(jù),將該數(shù)據(jù)的數(shù)據(jù)包去掉頭信息并檢查計(jì)算校驗(yàn)和后發(fā)送給映射和流控模塊202。
光網(wǎng)絡(luò)接口模塊204接收數(shù)據(jù)處理模塊203發(fā)送的數(shù)據(jù)發(fā)送給光網(wǎng)絡(luò)端口,或接收光網(wǎng)絡(luò)端口發(fā)送的數(shù)據(jù)發(fā)送給數(shù)據(jù)處理模塊203。
管理模塊205通過向其它各模塊發(fā)送管理信息和接收其它各模塊的上報(bào)信息與其它各模塊相連。管理模塊205向InfiniBand接口模塊201發(fā)送端口控制信息,接收InfiniBand接口模塊201發(fā)送的端口狀態(tài)上報(bào)信息、向映射和流控模塊202發(fā)送流控策略信息,接收映射和流控模塊202發(fā)送的流控狀態(tài)上報(bào)信息、向數(shù)據(jù)處理模塊203發(fā)送控制信息,接收數(shù)據(jù)處理模塊203發(fā)送的數(shù)據(jù)包統(tǒng)計(jì)上報(bào)信息、向光網(wǎng)絡(luò)接口模塊204發(fā)送端口控制信息,接收光網(wǎng)絡(luò)接口模塊204發(fā)送的端口狀態(tài)上報(bào)信息。
圖3為圖2所示實(shí)施例的傳輸設(shè)備連接IB網(wǎng)和SDH網(wǎng)的連接示意圖。如圖3所示,本實(shí)施例的基于光網(wǎng)絡(luò)的IB傳輸設(shè)備302一端與SDH環(huán)網(wǎng)中的分插復(fù)用器303相連,另一端與IB網(wǎng)的IB交換機(jī)/IB路由器/IB通道適配器301相連。
本發(fā)明實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的方法為在InfiniBand數(shù)據(jù)發(fā)送端,將InfiniBand數(shù)據(jù)幀作為光網(wǎng)絡(luò)可以傳輸?shù)母呒?jí)數(shù)據(jù)鏈路控制協(xié)議(HDLC)數(shù)據(jù)幀的凈荷,封裝在HDLC數(shù)據(jù)幀中,并將該數(shù)據(jù)幀發(fā)送到光網(wǎng)絡(luò)端口,該數(shù)據(jù)幀通過光網(wǎng)絡(luò)傳輸?shù)綌?shù)據(jù)接收端的光網(wǎng)絡(luò)端口,在數(shù)據(jù)接收端將封裝在HDLC數(shù)據(jù)幀中的InfiniBand數(shù)據(jù)幀取出發(fā)送給數(shù)據(jù)InfiniBand接收端。
圖4為本發(fā)明的實(shí)現(xiàn)方法中使用的HDLC數(shù)據(jù)幀的幀結(jié)構(gòu)示意圖。如圖4所示,該數(shù)據(jù)幀是將IB數(shù)據(jù)幀增加一個(gè)6字節(jié)(byte)的流控信息頭,再作為HDLC數(shù)據(jù)幀的凈荷封裝到HDLC數(shù)據(jù)幀中后形成的。
其中,IB數(shù)據(jù)幀包含信息頭、IB數(shù)據(jù)凈荷、不變循環(huán)冗余碼校驗(yàn)(ICRC)和可變循環(huán)冗余碼校驗(yàn)(VCRC)。其具體結(jié)構(gòu)參見圖5,圖5為IB數(shù)據(jù)幀的結(jié)構(gòu)示意圖,如圖5所示,IB數(shù)據(jù)幀的信息頭包含局部路由頭部信息(LRH)、全局路由頭部信息(GRH)、基本傳輸層頭部信息(BTH)、傳輸層擴(kuò)展頭(ETHs)和立即數(shù)(ImmData)。IB數(shù)據(jù)幀的各個(gè)字段的簡(jiǎn)要說明參見表一。
表一其它字段的說明如下◆標(biāo)志(Flag),占用1 byteFlag用于標(biāo)識(shí)一個(gè)幀的起始和結(jié)束,固定為0x7E。如果有兩個(gè)連續(xù)的幀,那么前一幀和后一幀之間只需要一個(gè)Flag標(biāo)志,而不需要兩個(gè)連續(xù)的0x7E去區(qū)分連續(xù)的幀;當(dāng)沒有數(shù)據(jù)要發(fā)送的時(shí)候,就發(fā)送連續(xù)的Flag到SDH/SONET上,即連續(xù)的Flag被認(rèn)為是一個(gè)空的幀。
◆地址(Address),占用1 byte地址字段用來標(biāo)識(shí)一個(gè)HDLC幀的目的地址。當(dāng)該字段為0xFF時(shí),表示是廣播地址,所有節(jié)點(diǎn)都會(huì)接收該幀數(shù)據(jù)。如果該地址是無效地址,那么該幀數(shù)據(jù)就不會(huì)被接收或被忽略掉了。
◆控制(Control),占用1 byteControl字段用來標(biāo)識(shí)一個(gè)HDLC幀的類型,表明該幀是HDLC協(xié)議中的Information、Supervisory或Unnumbered類型。
◆協(xié)議(Protocol),占用2 bytesProtocol字段用來標(biāo)識(shí)Payload中的協(xié)議類型,在本發(fā)明中它用于表示凈荷(Payload)中包含的是基于IB的SDH/SONET數(shù)據(jù),該字段的定義來源于因特網(wǎng)標(biāo)準(zhǔn)——RFC1661,用戶自定義的字段需要向因特網(wǎng)數(shù)據(jù)分配局Internet Assigned Numbers Authority(IANA)申請(qǐng),本實(shí)施例中該字段暫定為0xC031。
◆流控信息頭(Flow Control Header),占用6 bytes用于兩臺(tái)實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備之間實(shí)現(xiàn)流控,本發(fā)明方法采用與InfiniBand協(xié)議相同的基于信用度的流控機(jī)制。
◆保留(Reserved),占用1 byte保留字段,未來擴(kuò)展用。
◆校驗(yàn)和(FCS),占用4 bytes從Address字段開始到Payload字段結(jié)束的校驗(yàn)和。
上述方法可以通過使用上述的基于SDH的IB傳輸設(shè)備來具體實(shí)現(xiàn),其過程仍參見圖2。其中,發(fā)送方向是指從InfiniBand到SDH/SONET端口的方向,接收方向是指從SDH/SONET到InfiniBand端口的方向。
其發(fā)送流程如下第一步IB接口模塊201的IB接口電路2011從IB端口收到數(shù)據(jù)后,根據(jù)該數(shù)據(jù)相應(yīng)的VL號(hào),把接收到的數(shù)據(jù)放入VL接收緩沖器2012中相應(yīng)的VL緩沖隊(duì)列VL0-VLn中,同時(shí)要根據(jù)VL接收緩沖器2012回送給IB接口電路2011的VL緩沖器的狀態(tài)TXBS,實(shí)現(xiàn)IB接口側(cè)基于VL的流控,該流控機(jī)制的實(shí)現(xiàn)符合IB協(xié)議采用的基于信用度的流控機(jī)制的規(guī)定,再根據(jù)管理模塊205發(fā)送來的調(diào)度機(jī)制,例如VL間采用加權(quán)輪詢調(diào)度方式(WRR),通過VL MUX把VL緩沖隊(duì)列中的數(shù)據(jù)輸出到映射和流控模塊202。
第二步映射和流控模塊202收到IB接口模塊發(fā)來的數(shù)據(jù)后,根據(jù)VL接收緩存器當(dāng)前的狀態(tài),在IB數(shù)據(jù)包加上相應(yīng)的流控信息,再將該數(shù)據(jù)發(fā)送給數(shù)據(jù)處理模塊203。
第三步數(shù)據(jù)處理模塊203接收到包含流控信息的數(shù)據(jù)包,將其作為光網(wǎng)絡(luò)可以傳輸?shù)腍DLC數(shù)據(jù)幀的凈荷,封裝在HDLC數(shù)據(jù)幀中,完成數(shù)據(jù)的成幀、校驗(yàn)和的計(jì)算工作,然后將該數(shù)據(jù)通過SDH接口模塊204發(fā)送到SDH端口。
其接收流程如下第一步SDH接口模塊204從SDH端口接收數(shù)據(jù)并發(fā)送給數(shù)據(jù)處理模塊203。
第二步數(shù)據(jù)處理模塊203將接收到的數(shù)據(jù)去掉HDLC的FLAG、Address、Control、Protocol等頭信息,檢查校驗(yàn)和并將處理后的數(shù)據(jù)發(fā)送給映射和流控模塊202。
第三步映射和流控模塊202從數(shù)據(jù)中取出中6字節(jié)的流控信息,把去掉流控信息的數(shù)據(jù)包發(fā)送給IB接口模塊201,同時(shí)要根據(jù)VL發(fā)送緩沖器2013回送給映射和流控模塊202的VL接收緩沖器的狀態(tài)RXBS,實(shí)現(xiàn)基于VL的流控。
第四步IB接口模塊201根據(jù)收到的數(shù)據(jù)的VL號(hào)不同,把數(shù)據(jù)放入VL接收緩存中VL隊(duì)列中相應(yīng)的位置,根據(jù)管理模塊205發(fā)送來的調(diào)度機(jī)制,例如VL間采用加權(quán)輪詢調(diào)度方式(WRR),通過VL MUX把VL緩沖隊(duì)列中的數(shù)據(jù)通過IB接口電路2011輸出到IB端口。
由此可見,本發(fā)明的基于光網(wǎng)絡(luò)的InfiniBand通信協(xié)議的傳輸設(shè)備及傳輸方法利用廣泛使用的SDH/SONET網(wǎng)絡(luò),實(shí)現(xiàn)了IB在廣域范圍的可靠傳輸。相對(duì)于現(xiàn)有技術(shù),本發(fā)明很好的解決了IB遠(yuǎn)距離傳輸?shù)膯栴},可以實(shí)現(xiàn)基于IB的服務(wù)器遠(yuǎn)程集群、遠(yuǎn)程存儲(chǔ)等功能,大大擴(kuò)展了IB的應(yīng)用范圍。
權(quán)利要求
1.一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備,其特征在于該設(shè)備位于InfiniBand端口與光網(wǎng)絡(luò)端口之間,包含InfiniBand接口模塊,其用于收發(fā)InfiniBand端口與映射和流控模塊之間傳輸?shù)臄?shù)據(jù);映射和流控模塊,其用于將從InfiniBand接口模塊接收的InfiniBand數(shù)據(jù)包加上流控信息后,發(fā)送給數(shù)據(jù)處理模塊;或?qū)臄?shù)據(jù)處理模塊接收的數(shù)據(jù)包去掉流控信息后,發(fā)送給InfiniBand接口模塊;數(shù)據(jù)處理模塊,其用于將從映射和流控模塊接收的數(shù)據(jù)包加上頭信息后發(fā)送給光網(wǎng)絡(luò)接口模塊,或?qū)墓饩W(wǎng)絡(luò)接口模塊接收的數(shù)據(jù)包去掉頭信息后發(fā)送給映射和流控模塊;光網(wǎng)絡(luò)接口模塊,其用于收發(fā)數(shù)據(jù)處理模塊與光網(wǎng)絡(luò)端口之間傳輸?shù)臄?shù)據(jù);管理模塊,其用于向其它各模塊發(fā)送管理信息和接收其它各模塊的上報(bào)信息。
2.如權(quán)利要求1所述的傳輸設(shè)備,其特征在于所述的InfiniBand接口模塊包含InfiniBand接口電路、虛通道收發(fā)送緩存;InfiniBand接口電路接收InfiniBand端口發(fā)送的數(shù)據(jù)并將其發(fā)送給虛通道發(fā)送緩存,或接收虛通道接收緩存發(fā)送的數(shù)據(jù)并將其發(fā)送到InfiniBand端口;虛通道發(fā)送緩存將從InfiniBand接口電路接收的數(shù)據(jù)暫存后發(fā)送給映射和流控模塊;虛通道接收緩存將從映射和流控模塊接收的數(shù)據(jù)暫存后發(fā)送給InfiniBand接口電路。
3.如權(quán)利要求2所述的傳輸設(shè)備,其特征在于所述的虛通道發(fā)送緩存進(jìn)一步包含虛通道發(fā)送隊(duì)列和虛通道發(fā)送復(fù)用模塊,虛通道發(fā)送緩存接收的數(shù)據(jù)先暫存到虛通道隊(duì)列中,再通過虛通道復(fù)用模塊發(fā)送給映射和流控模塊。
4.如權(quán)利要求2所述的傳輸設(shè)備,其特征在于所述的虛通道接收緩存進(jìn)一步包含虛通道接收隊(duì)列和虛通道接收復(fù)用模塊,虛通道接收緩存接收的數(shù)據(jù)先暫存到虛通道隊(duì)列中,再通過虛通道復(fù)用模塊發(fā)送給InfiniBand接口電路。
5.如權(quán)利要求2所述的傳輸設(shè)備,其特征在于所述的虛通道發(fā)送緩存進(jìn)一步通過向InfiniBand接口電路發(fā)送發(fā)送緩沖器狀態(tài)信號(hào)與InfiniBand接口電路相連;所述的虛通道接收緩存進(jìn)一步通過向映射和流控模塊發(fā)送接收緩沖器狀態(tài)信號(hào)與映射和流控模塊相連。
6.如權(quán)利要求1所述的傳輸設(shè)備,其特征在于所述的數(shù)據(jù)處理模塊進(jìn)一步包含數(shù)據(jù)計(jì)算校驗(yàn)和模塊,其對(duì)從映射和流控模塊接收的數(shù)據(jù)計(jì)算校驗(yàn)和;和檢查計(jì)算校驗(yàn)和模塊,其對(duì)從光網(wǎng)絡(luò)接口模塊接收的數(shù)據(jù)檢查計(jì)算校驗(yàn)和。
7.如權(quán)利要求1所述的傳輸設(shè)備,其特征在于所述的管理模塊向其它各模塊發(fā)送的管理信息包括向InfiniBand接口模塊發(fā)送端口的控制信息、向映射和流控模塊發(fā)送的流控策略信息、向數(shù)據(jù)處理模塊發(fā)送的控制信息、向光網(wǎng)絡(luò)接口模塊發(fā)送端口的控制信息。
8.如權(quán)利要求1所述的傳輸設(shè)備,其特征在于所述的管理模塊接收其它各模塊的上報(bào)信息包括InfiniBand接口模塊發(fā)送的端口狀態(tài)上報(bào)信息、映射和流控模塊發(fā)送的流控狀態(tài)上報(bào)信息、數(shù)據(jù)處理模塊發(fā)送的數(shù)據(jù)包統(tǒng)計(jì)上報(bào)信息、光網(wǎng)絡(luò)接口模塊發(fā)送的端口狀態(tài)上報(bào)信息。
9.如權(quán)利要求1所述的傳輸設(shè)備,其特征在于所述的InfiniBand端口為InfiniBand交換機(jī),或InfiniBand路由器,或InfiniBand通道適配器。
10.如權(quán)利要求1所述的傳輸設(shè)備,其特征在于所述的光網(wǎng)絡(luò)端口為分插復(fù)用器。
11.一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的方法,其特征在于在InfiniBand數(shù)據(jù)發(fā)送端,將InfiniBand數(shù)據(jù)幀作為光網(wǎng)絡(luò)可以傳輸?shù)母呒?jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀的凈荷,封裝在高級(jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀中,并將該數(shù)據(jù)幀發(fā)送到光網(wǎng)絡(luò)端口,該數(shù)據(jù)幀通過光網(wǎng)絡(luò)傳輸?shù)綌?shù)據(jù)接收端的光網(wǎng)絡(luò)端口,在數(shù)據(jù)接收端將封裝在高級(jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀中的InfiniBand數(shù)據(jù)幀取出發(fā)送給數(shù)據(jù)InfiniBand接收端。
12.如權(quán)利要求11所述的方法,其特征在于所述的高級(jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀的凈荷進(jìn)一步設(shè)置一個(gè)用于標(biāo)識(shí)流控狀態(tài)的流控消息頭。
13.如權(quán)利要求11或12所述的方法,其特征在于該方法采用InfiniBand通信協(xié)議中基于信用度的流控機(jī)制進(jìn)行流控。
全文摘要
本發(fā)明公開了一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的設(shè)備,該設(shè)備位于InfiniBand端口與光網(wǎng)絡(luò)端口之間,包含InfiniBand接口模塊、映射和流控模塊、數(shù)據(jù)處理模塊、光網(wǎng)絡(luò)接口模塊和管理模塊,使用該設(shè)備可以實(shí)現(xiàn)InfiniBand協(xié)議在SDH/SONET上的可靠傳輸。本發(fā)明同時(shí)公開了一種實(shí)現(xiàn)在光網(wǎng)絡(luò)中傳輸InfiniBand數(shù)據(jù)的方法,該方法將InfiniBand數(shù)據(jù)幀作為光網(wǎng)絡(luò)可以傳輸?shù)母呒?jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀的凈荷,封裝在高級(jí)數(shù)據(jù)鏈路控制協(xié)議數(shù)據(jù)幀中,這樣就可以實(shí)現(xiàn)InfiniBand數(shù)據(jù)幀在光網(wǎng)絡(luò)中的傳輸。利用廣泛使用的SDH/SONET網(wǎng)絡(luò),實(shí)現(xiàn)在InfiniBand廣域范圍的可靠傳輸。相對(duì)于現(xiàn)有技術(shù),本發(fā)明很好地實(shí)現(xiàn)了基于InfiniBand的服務(wù)器遠(yuǎn)程集群、遠(yuǎn)程存儲(chǔ)等功能,大大擴(kuò)展了InfiniBand的應(yīng)用范圍。
文檔編號(hào)H04L29/06GK1492643SQ02146528
公開日2004年4月28日 申請(qǐng)日期2002年10月21日 優(yōu)先權(quán)日2002年10月21日
發(fā)明者顧冰, 舒曦輝, 余洲, 顧 冰 申請(qǐng)人:華為技術(shù)有限公司