两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

使用校驗子分析的故障總線通道檢測的制作方法

文檔序號:7525230閱讀:356來源:國知局
專利名稱:使用校驗子分析的故障總線通道檢測的制作方法
使用校驗子分析的故障總線通道檢測
背景技術(shù)
本發(fā)明一般地涉及計算機存儲器系統(tǒng),更具體地說,涉及使用校驗子分析檢測故障總線通道?,F(xiàn)代高性能計算主存儲器系統(tǒng)通常包括一個或多個動態(tài)隨機存取存儲器(DRAM)設(shè)備,這些設(shè)備通過一個或多個存儲器控制元件連接到一個或多個處理器。整體計算機系統(tǒng)性能受計算機結(jié)構(gòu)的每個關(guān)鍵元素的影響,這些元素包括處理器(多個)、任何存儲器高速緩存(多個)、輸入/輸出(I/o)子系統(tǒng)(多個)的性能/結(jié)構(gòu)、存儲器控制功能(多個)、主存儲器設(shè)備(多個)的效率以及存儲器互連接口(多個)的類型和結(jié)構(gòu)。行業(yè)持續(xù)投入廣泛的研究和開發(fā)工作以產(chǎn)生改進和/或創(chuàng)新的解決方案,以便通過改進存儲器系統(tǒng)/子系統(tǒng)設(shè)計和/或結(jié)構(gòu)來最大化整體系統(tǒng)性能和密度。高可用性系統(tǒng) 提出與整體系統(tǒng)可靠性相關(guān)的進一步挑戰(zhàn),因為客戶期望新的計算機系統(tǒng)除了提供額外功能、提高性能、增加存儲、降低操作成本等之外,在平均故障間隔時間(MTBF)方面將明顯超過現(xiàn)有系統(tǒng)。其他常見的客戶要求進一步加劇了存儲器系統(tǒng)設(shè)計挑戰(zhàn),并且包括諸如易于升級和降低系統(tǒng)環(huán)境影響(例如空間、電力和冷卻)之類的項目。一種用于在總線(例如存儲器系統(tǒng)總線)中查找故障通道的方法是使用錯誤糾正代碼(ECC)。ECC可以檢測和糾正多個故障位,但比錯誤檢測代碼需要更多的冗余位。通常,錯誤檢測代碼可以檢測錯誤但不能完全解析錯誤的物理性質(zhì);例如,它也許不能完全標識故障通道以便了解故障通道中的所有可能錯誤模式。因此,只有錯誤檢測代碼可能不會準確地將錯誤隔離到特定故障通道。另一種用于檢測故障通道的方法是通道遮蔽(laneshadowing),其中在備用通道上發(fā)送數(shù)據(jù)副本。然而,通道遮蔽在任一時間點只能針對通道的子集執(zhí)行,并且可能錯過在給定故障通道的分析窗口外部發(fā)生的錯誤事件。

發(fā)明內(nèi)容
一個實施例是一種用于檢測總線故障的計算機實現(xiàn)的方法。所述方法包括接收錯誤檢測代碼的多個校驗子,所述錯誤檢測代碼與已在總線上傳輸?shù)亩鄠€幀關(guān)聯(lián),所述總線包括多個通道并由所述錯誤檢測代碼來保護。所述方法包括對于所述校驗子中的每個校驗子,針對所述通道中的每個通道執(zhí)行以下步驟在假設(shè)該通道是故障通道的情況下對該校驗子進行解碼,所述解碼輸出解碼結(jié)果;判定所述解碼結(jié)果是否是有效解碼;以及響應(yīng)于判定所述解碼結(jié)果是有效解碼而為所述通道投票。然后響應(yīng)于所述投票而標識故障通道,所述故障通道的特征在于,其具有的投票多于所述總線上的至少一個其他通道。另一實施例是一種用于檢測總線故障的系統(tǒng),所述系統(tǒng)包括總線接口設(shè)備,被配置為接收和捕獲已在總線上傳輸?shù)亩鄠€幀的校驗子,每個幀包括按通道的多個位傳輸;以及校驗子處理邏輯,其與所述總線接口設(shè)備通信。所述校驗子處理邏輯被配置為執(zhí)行以下操作接收錯誤檢測代碼的多個校驗子,所述錯誤檢測代碼與已在總線上傳輸?shù)亩鄠€幀關(guān)聯(lián),所述總線包括多個通道并由所述錯誤檢測代碼來保護。所述校驗子處理邏輯還被配置為對于每個校驗子,針對每個通道而執(zhí)行以下操作在假設(shè)該通道是故障通道的情況下對該校驗子進行解碼,所述解碼輸出解碼結(jié)果;判定所述解碼結(jié)果是否是有效解碼;以及響應(yīng)于判定所述解碼結(jié)果是有效解碼而為所述通道投票。響應(yīng)于所述投票而標識故障通道,所述故障通道的特征在于,其具有的投票多于所述總線上的至少一個其他通道。另一實施例是一種用于檢測總線故障的計算機程序產(chǎn)品。所述計算機程序產(chǎn)品包括計算機可讀存儲介質(zhì),其可由處理電路讀取并存儲指令以便由所述處理電路執(zhí)行以實現(xiàn)一種方法,所述方法包括接收錯誤檢測代碼的多個校驗子,所述錯誤檢測代碼與已在總線上傳輸?shù)亩鄠€幀關(guān)聯(lián),所述總線包括多個通道并由所述錯誤檢測代碼來保護。所述方法包括對于所述校驗子中的每個校驗子,針對所述通道中的每個通道而執(zhí)行以下操作在假設(shè)該通道是故障通道的情況下對該校驗子進行解碼,所述解碼輸出解碼結(jié)果;判定所述解碼結(jié)果是否是有效解碼;以及響應(yīng)于判定所述解碼結(jié)果是有效解碼而為所述通道投票。然后響應(yīng)于所述投票而標識故障通道,所述故障通道的特征在于,其具有的投票多于所述總線上的至少一個其他通道。
通過參閱以下附圖和詳細說明,根據(jù)各實施例的其他系統(tǒng)、方法和/或計算機程序產(chǎn)品對于本領(lǐng)域的技術(shù)人員來說顯而易見或變得顯而易見。旨在將所有此類其他系統(tǒng)、方法和/或計算機程序產(chǎn)品包括在此說明內(nèi)、在本發(fā)明的范圍內(nèi),并由所附權(quán)利要求保護。


現(xiàn)在僅通過實例的方式參考附圖描述本發(fā)明的一個或多個實施例,這些附圖是圖I示出了可以由一個示例性實施例實現(xiàn)的級聯(lián)互連存儲器系統(tǒng);圖2示出了示例性下游八傳輸幀;圖3示出了示例性下游十二傳輸幀;圖4示出了示例性下游十六傳輸幀;圖5示出了示例性上游八傳輸幀;以及圖6示出了用于使用校驗子分析檢測故障總線通道的示例性過程。
具體實施例方式本發(fā)明的一個示例性實施例在使用錯誤檢測代碼保護的總線中查找故障通道??梢允褂糜嫈?shù)器和多個錯誤檢測代碼校驗子的分析以統(tǒng)計方式標識故障通道。所述分析產(chǎn)生位向量,其具有等于所述總線中的通道數(shù)量的多個表項。每個通道具有一個計數(shù)器,其隨分析的結(jié)果遞增。如果特定通道的位向量等于零,則此通道的計數(shù)器保持不變;否則,遞增該計數(shù)器。所述分析可能不會完全解析哪個故障通道是產(chǎn)生錯誤的通道,相反針對所述故障通道提供多個可能性。因此,當(dāng)分析單個校驗子時,可能遞增多個計數(shù)器。當(dāng)接收到新校驗子時,多次重復(fù)此過程。盡管對于單個校驗子分析而言,可能無法解析故障通道,但當(dāng)分析多個校驗子并獲得計數(shù)器的累積內(nèi)容時,故障通道具有較高計數(shù)的概率很高。分析的校驗子越多,分析結(jié)果的質(zhì)量就越好。監(jiān)視其中在總線上傳輸?shù)膸邪l(fā)生一個且僅有一個位故障的錯誤條件,可以在隔離故障通道中獲得高準確性。例如,對于其中在幀中檢測到一個且僅有一個位故障的情況,可以在通道故障標識中獲得100%的準確性。在此參考循環(huán)冗余校驗(CRC)更詳細地描述所述分析;然而,所述分析適用于任何線性錯誤檢測代碼,而不僅限于 CRC。線性錯誤檢測代碼的特征在于奇偶校驗矩陣H。為簡單起見,假設(shè)所述代碼針對二進制符號執(zhí)行,盡管此技術(shù)通常也適用于多位符號。奇偶校驗矩陣H中的行數(shù)(r)等于所述代碼中的檢驗位數(shù)。列數(shù)(η)等于n=r+k,其中k是錯誤檢測代碼中的有效負載位數(shù)。假設(shè)d是表示k個有效負載位的列向量,并假設(shè)c是表示與這些k個有效負載位關(guān)聯(lián)的r個位的列向量。在總線上傳輸?shù)目傁蛄渴荲= [cd],其中c和d被串接以形成V。校驗位c的位置不需要在向量的頂部,并且校驗位也不需要連續(xù)放置;在此假設(shè)這種組織完全是為了改進此說明的可讀性。在給定有效負載d的情況下計算校驗位c以便H v=0。H ν表示使用矩陣/向量乘法模數(shù)2將矩陣H與向量 ν相乘。然后在信道上傳輸向量V,此信道可能在ν上傳遞錯誤。此錯誤由e表示,它是具有η個表項的向量,如果沒有錯誤,則這些表項為0,如果具有錯誤,則這些表項為I。假設(shè)總線中具有L個通道,每個通道在總線上的整個幀傳輸中承載n/L個位。因此,還假設(shè)η可被L整除。向量ν可以分為L個部分,每個部分具有如下連續(xù)位ν= [ν Iν2…vL]。在信道上傳輸這些部分中的每一個(包括n/L個位)。同樣,錯誤向量可以分為e=[ele2...eL]。當(dāng)接收到數(shù)據(jù)模式(data pattern) v+e時,解碼器使用不依賴于向量ν的方程s=H(v+e) =0+He=He計算對應(yīng)的校驗子。如果沒有錯誤(e=0),則校驗子s為O,并且認為中貞良好。如果S=He不等于0,則檢測到錯誤,并且通常要求重試。進一步假設(shè)r>n/L,即所述代碼中的校驗位多于任意給定通道中的位。矩陣H可以分為H=[H1 H2…HL]。如果錯誤僅集中在通道i中,其中e=
并且ei為非0,則接收的校驗子為s=Hi ei。Hi可以分為兩個部分,第一部分Hi_A包含n/L個行,另一個部分Hi_B包含剩余行。所述劃分顯示為Hi=[Hi_AHi_B]同樣,校驗子s可被分為s=[s_As_B]因此,Hi_A是維數(shù)為(n/L) X (n/L)的方矩陣,Hi_B是維數(shù)為(r_n/L) X (n/L)的矩陣。同樣,s_A具有n/L個表項,s_B具有r-n/L個表項。如果所述代碼使得Hi_A是可逆矩陣,則Hi_A的逆乘以s_A等于ei,這可以表示為inv(Hi_A)S_A=ei。這有效地恢復(fù)影響該通道的錯誤模式ei。要指出的是,Hi_A對于每一個I可逆的屬性例如可以通過使用循環(huán)碼并確保通道中的連續(xù)位對應(yīng)于該循環(huán)碼中的連續(xù)位來獲得;循環(huán)碼的實例是類ο BCH代碼。由于恢復(fù)了錯誤模式ei,因此以下方程(第二等式)也成立inv(Hi_A)s_A_s_B=0 (I)要指出的是,此方程另外使用第一等式定義了標記mi。方程(I)是檢測故障總線通道的基礎(chǔ)。如果通道i是出現(xiàn)問題的通道,則方程(I)左側(cè)的標記mi (僅依賴于設(shè)計的代碼H和校驗子s)必須等于O。因為不知道哪個通道出現(xiàn)故障,所以針對所有L個通道計算方程(I)的左側(cè),當(dāng)計算方程(I)的左側(cè)時實際上又假設(shè)每個通道是故障通道,使指數(shù)i從I變到L。對于那些通過計算產(chǎn)生O的指數(shù)i,將關(guān)聯(lián)的通道聲明為故障通道候選者,并將分析位向量vote_lane的第i位設(shè)置為I,即,將vote_lane[i]設(shè)置為I (這在此稱為“為通道i投票”)。對于那些通過計算具有非O結(jié)果的指數(shù)i,將Vote_lane[i]設(shè)置為O (這在此稱為“沒有為通道i投票”)。要指出的是,針對每個通道使用校驗子子集s_A計算錯誤大小e_i,同時使用剩余校驗子位s_B執(zhí)行候選錯誤向量的交叉檢驗。如果交叉檢驗成功,·則生成有效解碼信號,否則生成無效解碼信號。上面對應(yīng)用于一個幀的過程的說明并不對應(yīng)于本領(lǐng)域中公知的總線錯誤糾正過程。在總線錯誤糾正過程中,對校驗子進行解碼將產(chǎn)生不可糾正的錯誤信號,或者備選地,必須應(yīng)用于所認為的總線的糾正將消除數(shù)據(jù)損壞。相比之下,在上述過程中,在假設(shè)每個通道是故障通道的情況下執(zhí)行每個校驗子的解碼,并且如果獲得有效解碼,則此通道獲得投票,目標是僅在處理多個幀之后才發(fā)現(xiàn)故障通道。因此,當(dāng)使用在此描述的過程的一個實施例處理一個幀時,不會始終標識唯一故障通道。如上所述,一個示例性實施例為每個位通道提供一個計數(shù)器,對屬于故障通道的關(guān)聯(lián)通道的投票進行計數(shù)。這些計數(shù)器跨多個錯誤檢測(并且因此校驗子分析)事件存在,因此它們也稱為運行計數(shù)器??梢允褂梦幌蛄縱otejane遞增每個位通道的計數(shù)器,實際上通過將位向量votejane的值添加到計數(shù)器的當(dāng)前值。存在其中僅針對一個通道獲得標記mi的O計算的情況,但通??赡艽嬖趦蓚€或更多針對其在方程(I)中獲得O計算的通道,這意味著將遞增對應(yīng)計數(shù)器。如果通道具有永久性錯誤但實際錯誤模式隨訪問的不同而更改,則故障通道的計數(shù)器比其他通道的計數(shù)器遞增的更多。跟蹤計數(shù)器并判定計數(shù)器是否達到閾值的硬件、固件或軟件可以利用這一點。如果如此,則對應(yīng)通道是合適的備用通道候選者。如果錯誤模式是單個位錯誤(single bit error),則在適當(dāng)設(shè)計錯誤檢測代碼的情況下,可以正確地標識故障通道而沒有任何歧義。在示例性實施例中,采用的錯誤檢測代碼具有檢測至少任何兩個位錯誤的能力。因此,任何兩個單個位錯誤的校驗子都不能相同。當(dāng)存在單個位錯誤時,不可能針對兩個或更多通道計算如下ei :其具有單個位錯誤并且同時方程(I)中的計算的結(jié)果是O。在一個備選示例性實施例中,可以采用方程(2 )和(3 )執(zhí)行兩階段計算,而不是計算方程(I):ei=inv (Hi_A)s_A (2)mi=Hi_B e_i_s_B (3)
其中ei被稱作通道i的候選錯誤向量。對于每個通道i={l,. . .,M},確定ei中是否只有一個位錯誤并且同時mi=0。每當(dāng)通過此屬性找到一個且僅有一個Γ *時,可選地僅針對Γ *生成一個投票,即使存在mi=0但ei并非只有一個位錯誤的另一個不同于Γ *的i也是如此。這樣,所具有的影響是略微犧牲通用通道錯誤模式的錯誤檢測能力,而優(yōu)點是保證定位所有單個位而沒有任何歧義。換言之,每當(dāng)存在指示單個位錯誤的候選錯誤向量時,在解碼期間生成的通道的所有其他可能投票都被取消。現(xiàn)在轉(zhuǎn)到圖1,示出了存儲器系統(tǒng)100的一個實例,其包括通過高速信道通信并使用在此描述的錯誤檢測代碼校驗子分析的完全緩沖的雙列直插式存儲器模塊(DIMM)。存儲器系統(tǒng)100可以結(jié)合在主機處理系統(tǒng)中作為處理系統(tǒng)102的主存儲器。存儲器系統(tǒng)100包括多個DIMM 103a、103b、103c和103d,它們具有經(jīng)由信道106或級聯(lián)互連總線(包括差分單向上游總線118和差分單向下游總線116)通信的集線器設(shè)備104。DIMM103a-103d可以包括多個存儲器件109,它們可以是雙倍數(shù)據(jù)速率(DDR)動態(tài)隨機存取存儲器(DRAM)器件以及本領(lǐng)域中公知的其他組件,例如電阻器、電容器等。存儲器件109也稱為DRAM 109 或DDRx,因為DIMM103a-103d上可以包括任何版本的DDR,例如DDR2、DDR3、DDR4等。存儲器控制器110與DIMM 103a通過接口連接,經(jīng)由信道106發(fā)送可以以DIMM 103a_103d中的任意一個作為目標的命令、地址和數(shù)據(jù)值。所述命令、地址和數(shù)據(jù)值可以格式化為幀并序列化,以便以高數(shù)據(jù)速率傳輸。集線器設(shè)備104和存儲器控制器110 —般可以稱為總線接口設(shè)備。在一個示例性實施例中,當(dāng)DIMM從上游DIMM或存儲器控制器110接收到幀時,它將該幀重新驅(qū)動到菊花鏈中的下一個DIMM (例如,DIMM103a重新驅(qū)動到DIMM 103b, DIMM130b重新驅(qū)動到DIMM 103c等)。同時,DIMM對幀進行解碼以確定內(nèi)容。因此,DIMM處的重新驅(qū)動和命令解碼可以并行或幾乎并行發(fā)生。如果命令是讀取請求,則所有DIMM103a-103d和存儲器控制器110使用該命令的內(nèi)容跟蹤上游總線118上的讀取數(shù)據(jù)業(yè)務(wù)。DIMM 103a_103d上的集線器設(shè)備104經(jīng)由到信道106的總線接口(例如端口)接收命令。集線器設(shè)備104上的總線接口除了其他組件之外還包括接收器和發(fā)送器。在一個示例性實施例中,每個集線器設(shè)備104包括用于通過信道106與上游集線器設(shè)備104或存儲器控制器110通信的上游總線接口,以及用于通過信道106與下游集線器設(shè)備104通信的下游總線接口。集線器設(shè)備104還包括計數(shù)器112、寄存器114和錯誤處理邏輯120。同樣,存儲器控制器110也可以包括計數(shù)器112、寄存器114和錯誤處理邏輯120。計數(shù)器112可以用作錯誤計數(shù)器,錯誤處理邏輯120使用它們計算錯誤率并在寄存器114中設(shè)置故障條件。計數(shù)器112可以以軟件、固件、硬件或它們的某種組合實現(xiàn)??梢詫⒂糜跇俗R特定故障通道的詳細校驗子處理卸載到處理系統(tǒng)102的校驗子處理邏輯122。盡管圖I中僅示出了將存儲器控制器110連接到單個存儲器設(shè)備集線器設(shè)備104的單個存儲器信道106,但使用這些模塊產(chǎn)生的系統(tǒng)可以包括來自存儲器控制器110的多個分離存儲器信道,每個存儲器信道單獨運行(當(dāng)使用模塊填充單個信道時)或并行運行(當(dāng)使用模塊填充兩個或更多信道時)以實現(xiàn)所需的系統(tǒng)功能和/或性能。此外,信道106中可以包括任意數(shù)量的通道。例如,下游總線116可以包括13個位通道、2個備用通道和I個時鐘通道,而上游總線118可以包括20個位通道、2個備用通道和I個時鐘通道。選擇/應(yīng)用下游CRC的一個示例性實施例以便支持8、12和16個傳輸幀(在一個示例性實施例中,每個傳輸中包括13個位通道)。下游CRC檢測任何通道故障、任何傳輸故障以及多達5個位隨機錯誤。此外,如果檢測到下游CRC錯誤,則忽略下游幀的內(nèi)容并在寄存器114中設(shè)置故障信息寄存器(FIR)位。FIR是一種架構(gòu)式裝置,存儲有關(guān)在集線器設(shè)備104中檢測到的故障的信息。存儲器控制器110和/或其他系統(tǒng)元件可以詢問FIR以確定需要執(zhí)行何種操作(如果有)。響應(yīng)于設(shè)置FIR位,可以進入錯誤恢復(fù)狀態(tài),如果啟用系統(tǒng)100以執(zhí)行此操作的話。校驗位的“常規(guī)”位置是在代碼字的開頭或結(jié)尾。設(shè)計了下游代碼的一個示例性實施例以便校驗位位置在“非常規(guī)”位置。由于與如何設(shè)計協(xié)議相關(guān)的問題,所以需要這種非常規(guī)位置。此外,將校驗位放在常規(guī)位置然后到處移動它們可能會破壞代碼的重要屬性(例如,所有通道故障檢測等)。此外,并非所有位置都可以提供CRC檢測。在此描述的示例性下游幀格式利用校驗位位置的非常規(guī)位置。選擇/應(yīng)用上游CRC使得多達8個傳輸包含多達20個位通道,以便它檢測任何通道故障、任何傳輸故障(逃逸率為2 μ (-16))以及多達4個隨機錯誤。此外,所有上游集線器設(shè)備104監(jiān)視通過集線器設(shè)備104的上游CRC數(shù)據(jù)以檢測上游CRC錯誤,并且任何檢測到的錯誤都導(dǎo)致集線器設(shè)備104中斷所有讀取業(yè)務(wù)、轉(zhuǎn)發(fā)有害CRC、設(shè)置FIR位以及進入錯誤恢復(fù)狀態(tài)。 在一個示例性實施例中,針對13通道X 16拍(beat)(最大)幀格式使用下游CRC(錯誤檢測)代碼。此CRC代碼可以檢測任何通道故障、任何傳輸故障以及多達5個位隨機錯誤。而且,其中隨機無提示(silent)錯誤率大約是2的負十七次冪Γ2〃(-17))。CRC 多項式的一個不例性實施例為g(X) =1+χ+χ3+χ4+χ5+χ8+χ12+χ13+χ15+χ16+χ17+χ18。這是具有五個連續(xù)O (除了其他O之外)的博斯-喬赫里-霍克文黑姆(BCH)代碼。此示例性代碼的最小距離為6。基代碼實際上僅需要17個位,因此人為添加了附加位以提供適當(dāng)?shù)拈L度。圖2示出了使用在此描述的信道CRC的一個實施例的示例性下游八傳輸幀。圖3示出了使用在此描述的信道CRC的一個實施例的示例性下游十二傳輸幀。同樣,圖4示出了使用在此描述的信道CRC的一個實施例的示例性下游十六傳輸幀。如圖2-4中所示,CRC位位置為:156、157、158、159、169、170、171、172、182、183、184、185、186、195、196、197、198 和199。計算通用奇偶校驗之后,使用矩陣高斯消元法獲得適合于計算上面給定位置中的CRC位的矩陣。盡管可以使用標準移位寄存器實施方式對CRC進行編碼和解碼,但對于高速總線,具有異或的并行方法可以是優(yōu)選的。為了重用錯誤處理邏輯120中的CRC邏輯,針對最長幀大小(對于16傳輸幀,為208個位)定義CRC。不使用所有208個位的任何幀只需將所有未使用的位設(shè)置為O?;綜RC算法的一個實施例對CRC校驗位進行編碼,并按照幀協(xié)議跨總線傳輸它們??偩€另一端的校驗器(例如,在圖I的集線器設(shè)備104中)接收數(shù)據(jù)之后,計算新的或重新生成的一組CRC校驗位。然后比較(進行“異或”運算)接收的CRC校驗位和重新生成的CRC校驗位以形成校驗子向量。如果校驗子是逐位O向量,則假設(shè)在數(shù)據(jù)傳輸中沒有發(fā)生錯誤。任何非O校驗子都指示發(fā)生錯誤。與標準CRC—樣,這種實施方式不支持通過檢查校驗子實現(xiàn)直接錯誤隔離。當(dāng)圖I的集線器設(shè)備104檢測到下游CRC錯誤時,它將忽略下游幀的所有內(nèi)容,設(shè)置適當(dāng)?shù)腇IR位,并轉(zhuǎn)發(fā)故障CRC,然后進入錯誤恢復(fù)狀態(tài)(如果被啟用)。圖I的計數(shù)器112包括用于每個接收器鏈路的可配置計數(shù)器以計算CRC錯誤率。圖I的計數(shù)器112還可以包括用于每個信號通道的錯誤計數(shù)器,所述信號通道記錄每個已分析的CRC校驗子的結(jié)果。圖I的錯誤處理邏輯120中的錯誤率邏輯針對每個運行時、存儲器信道幀遞增計時器,并且還對正在使用的計數(shù)器112中的任何檢測到的無害CRC錯誤進行計數(shù)。以類似于下游實例說明的方式,校驗子處理邏輯122分析每個故障CRC校驗子以確定通過所述邏輯通信的可能故障通道,方法是對這些可能出現(xiàn)故障的通道進行投票。CRC足夠強大以便針對幀中的所有單個位錯誤唯一標識故障通道,并且在隨機通道故障期間針對統(tǒng)計上顯著的故障正確標識故障通道。因為CRC錯誤糾正并不足夠強大以保證完全隨機通道錯誤的唯一錯誤檢測,所以可能標識多個故障候選者。每次將通道標識為故障候選者(因為針對通道生成投票)時,計數(shù)器112中的通道錯誤計數(shù)器都會遞增。當(dāng)存儲器信道106正常運行時,將定期清除計數(shù)器112中的所有通道錯誤計數(shù)器,因為沒有超過CRC錯誤閾值。當(dāng)存儲器信道106出現(xiàn)無法通過重新初始化修復(fù)的間發(fā)錯誤時,計數(shù)器112中的CRC錯誤計數(shù)器將超過其可配置的閾值。此時,計數(shù)器112中的所有通道錯誤計數(shù)器都將凍結(jié),并將在寄存器114中設(shè)置FIR位以請求關(guān)注。校驗子處理邏輯122可以通過讀取計數(shù)器112中的通道錯誤計數(shù)器并判定應(yīng)修復(fù)哪個通道(如果有)而為關(guān)注請求服務(wù)。盡管可以針對每個CRC錯誤標識多個通道故障候選者,但是當(dāng)錯誤計數(shù)器累積足夠的CRC校驗子分析結(jié)果以超過閾值時,將具有最常出現(xiàn)故·障的通道的清晰統(tǒng)計指示。如果備用通道可用于修復(fù)所標識的故障,則處理系統(tǒng)102可以發(fā)出停用故障通道的命令。這會將間發(fā)故障變成硬故障,此硬故障可以通過由存儲器控制器110和/或集線器設(shè)備104自動啟動的后續(xù)重新初始化和修復(fù)序列來檢測和修復(fù)。在一個示例性實施例中,信道106中的每個接收器還在寄存器114中包括專用陷阱寄存器以記錄一個故障CRC校驗子的結(jié)果。所述陷阱寄存器可以被配置為記錄檢測到的第一 CRC錯誤或持續(xù)更新為所檢測的最新CRC錯誤。當(dāng)捕獲新的錯誤時,在所述陷阱寄存器中設(shè)置有效位,當(dāng)處理系統(tǒng)102讀取所述陷阱寄存器時,將自動重置此位。在一個示例性實施例中,如果投票未將一個通道與其他通道顯著隔離,則選擇并修復(fù)通道之一。然后監(jiān)視新錯誤率。如果在修復(fù)之后新錯誤率沒有顯著(例如,在閾值內(nèi))好于先前的錯誤率,則放棄(取消)第一修復(fù)而選擇并修復(fù)另一個通道。這種修復(fù)和放棄的處理可以一直繼續(xù),直到新錯誤率顯著好于先前的錯誤率。在一個示例性實施例中,如果允許多個通道修復(fù),則從主要競爭者中選擇多個通道以便修復(fù)。通過這種方式,可以執(zhí)行多個修復(fù)。圖5不出了使用在此描述的信道CRC的一個實施例的不例性上游8傳輸巾貞。針對8傳輸幀格式連同其CRC和錯誤校驗位數(shù),按如下方式描述上游CRC。此代碼旨在用于20通道X8拍幀格式。它可以檢測任何通道故障、任何傳輸故障(傳輸故障從代碼中的逃逸概率為2'k'k (-16))以及多達4位隨機錯誤。在一個示例性實施例中,上游CRC多項式為!gUkl+x+xS+xS+xT+xWw+xH+x15+x16。這是具有四個連續(xù)0(除了其他O之外)的BCH代碼。因此,它的最小距離為5。下游格式的代碼的多項式通過將上游格式的代碼乘以1+x2獲得。圖5中所示的CRC位位置為144、145、146、147、148、149、150、151、152、153、154、155、156、157、158 和 159。示例性CRC算法包括對CRC校驗位進行編碼,并按照幀協(xié)議跨總線傳輸它們。總線另一端的校驗器(例如,在圖I的集線器設(shè)備104中)接收數(shù)據(jù)之后,計算新的或重新生成的一組CRC校驗位。然后比較(進行“異或”運算)接收的CRC校驗位和重新生成的CRC校驗位以形成校驗子向量。如果校驗子是逐位O向量,則假設(shè)在數(shù)據(jù)傳輸中沒有發(fā)生錯誤。任何非O校驗子都指示發(fā)生錯誤。與大多數(shù)CRC —樣,這種實施方式不支持通過檢查校驗子實現(xiàn)直接錯誤隔離。盡管此說明專注于具有特定數(shù)量的通道和傳輸?shù)南掠魏蜕嫌螏?,以及用于多達特定數(shù)量的單個位錯誤、通道錯誤和潛在傳輸錯誤的錯誤檢測代碼,但可以設(shè)計用于其他參數(shù)的錯誤檢測代碼。在此描述的技術(shù)可以應(yīng)用于采用錯誤檢測代碼的各種通信總線,并且不限于存儲器系統(tǒng)應(yīng)用。 在一個示例性實施例中,集線器設(shè)備104可以通過多點或點到點總線結(jié)構(gòu)(其可以進一步包括到一個或多個附加集線器設(shè)備104的級聯(lián)連接)連接到圖I的存儲器控制器110。存儲器控制器110通過總線結(jié)構(gòu)(例如存儲器總線)將存儲器訪問請求傳輸?shù)竭x定的集線器設(shè)備(多個)104。響應(yīng)于接收存儲器訪問請求,集線器設(shè)備104轉(zhuǎn)換存儲器訪問請求以控制存儲器設(shè)備109以便存儲來自集線器設(shè)備104的寫入數(shù)據(jù)或?qū)⒆x取數(shù)據(jù)提供給集線器設(shè)備104。讀取數(shù)據(jù)被編碼為一個或多個通信幀并通過存儲器總線(多條)傳輸?shù)酱鎯ζ骺刂破?10。 在備選示例性實施例中,存儲器控制器(多個)110可以與一個或多個處理器芯片和支持邏輯集成在一起、封裝在分離芯片(通常稱為“北橋”芯片)中、包括在具有一個或多個處理器和/或支持邏輯的多芯片載體中,或以最匹配應(yīng)用/環(huán)境的各種備選形式封裝。這些解決方案中的任意一個可以采用也可以不采用一個或多個低/高速鏈路以連接到一個或多個集線器芯片和/或存儲器設(shè)備。圖6示出了使用校驗子分析檢測故障總線通道的示例性過程600。在方塊602,圖I的校驗子處理邏輯122接收在總線(例如圖I的上游總線118)上傳輸?shù)亩鄠€幀的校驗子,其中每個幀包括按通道的多個位傳輸,如圖2-5中所示。所述校驗子可以是來自總線接口設(shè)備(例如存儲器控制器110或集線器設(shè)備104)的捕獲值??梢栽趫DI的寄存器114中捕獲校驗子,并且當(dāng)錯誤檢測邏輯120判定計數(shù)器112超過閾值時,設(shè)置故障指示以啟動更詳細的校驗子分析以便隔離錯誤條件。在方塊604,在假設(shè)每個通道是故障通道的情況下,校驗子處理邏輯122將校驗子解碼為錯誤向量。所述錯誤向量在組合中選擇造成錯誤條件的特定校驗子位。因為相同的校驗子位可以包含在多個錯誤向量計算中,所以不太可能針對所有可能的錯誤組合將錯誤隔離到單個通道。在方塊606,響應(yīng)于對來自各幀之一的錯誤向量中具有單個位故障的一個且僅有一個通道進行解碼,校驗子處理邏輯122標識故障通道。校驗子處理邏輯122還可以判定校驗子的驗證位是否與從校驗子解碼的錯誤向量一致,其中所述驗證位在錯誤檢測代碼中提供某種程度的冗余。所述驗證位可以與所述錯誤向量組合使用以便為故障通道投票。響應(yīng)于對具有單個位故障的一個且僅有一個通道進行解碼,校驗子處理邏輯122可以清除所有其他通道的投票以確保單個位故障的100%錯誤標識準確性。在方塊608,響應(yīng)于判定存在多個單個位故障,校驗子處理邏輯122標識故障通道,其中所述錯誤向量使用在此描述的投票過程的一個實施例一致地指示跨多個幀的錯誤。在一個實施例中,校驗子處理邏輯122比較所接收的投票數(shù)以判定是否一致指示錯誤。所述比較可以包括計算具有較高數(shù)量投票的通道與具有較低數(shù)量投票的通道的比率,然后相對于比率閾值比較所計算的比率。例如,如果某通道指示故障發(fā)生頻率是其他通道的四倍或更多倍,則可以將此通道聲明為故障通道??梢栽诜治鲱A(yù)定數(shù)量的校驗子之后執(zhí)行所述比較以確保使用在統(tǒng)計上顯著的樣本集。在一個示例性實施例中,在標識故障通道并啟動糾正操作(例如重置總線接口設(shè)備、使用備用通道或重新訓(xùn)練總線通道)之后重置運行計數(shù)器。在另一個示例性實施例中,在規(guī)定時間量之后重置運行計數(shù)器。在此使用的術(shù)語只是為了描述特定的實施例并且并非旨在作為本發(fā)明的限制。如在此所使用的,單數(shù)形式“一”、“一個”和“該”旨在同樣包括復(fù)數(shù)形式,除非上下文明確地另有所指。還將理解,當(dāng)在此說明書中使用時,術(shù)語“包括”和/或“包含”指定了聲明的特性、整數(shù)、步驟、操作、元素和/或組件的存在,但是并不排除一個或多個其他特性、整數(shù)、步驟、操作、元素、組件和/或其組的存在或增加。此外,將理解,術(shù)語第一、第二等的使用并非表示任何順序或重要性,而是使用術(shù)語第一、第二等來區(qū)分一個元素與另一個元素。下面權(quán)利要求中的對應(yīng)結(jié)構(gòu)、材料、操作以及所有裝置或步驟和功能元件的等同替換,旨在包括任何用于與在權(quán)利要求中具體指出的其他元件相組合地執(zhí)行該功能的結(jié)構(gòu)、材料或操作。出于示例和說明目的給出了對本發(fā)明的描述,但所述描述并非旨在是窮舉 的或是將本發(fā)明限于所公開的形式。在不偏離本發(fā)明的范圍和精神的情況下,對于本領(lǐng)域的技術(shù)人員來說許多修改和變化都將是顯而易見的。實施例的選擇和描述是為了最佳地解釋本發(fā)明的原理、實際應(yīng)用,并且當(dāng)適合于所構(gòu)想的特定使用時,使得本領(lǐng)域的其他技術(shù)人員能夠理解本發(fā)明的具有各種修改的各種實施例。本發(fā)明的功能可以以軟件、固件、硬件或它們的某種組合實現(xiàn)。如本領(lǐng)域的技術(shù)人員將理解的,本發(fā)明的各方面可以體現(xiàn)為系統(tǒng)、方法或計算機程序產(chǎn)品。因此,本發(fā)明的各方面可以采取完全硬件實施例、完全軟件實施例(包括固件、駐留軟件、微代碼等)或組合了軟件和硬件方面的實施例的形式,所有這些實施例在此通常可以稱為“電路”、“模塊”或“系統(tǒng)”。此外,本發(fā)明的各方面可以采取體現(xiàn)在一個或多個計算機可讀介質(zhì)(在介質(zhì)中包含計算機可讀程序代碼)中的計算機程序產(chǎn)品的形式。可以使用一個或多個計算機可讀介質(zhì)的任意組合來存儲指令以便執(zhí)行圖I的校驗子處理邏輯122。所述計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)例如可以是(但不限于)電、磁、光、電磁、紅外線或半導(dǎo)體系統(tǒng)、裝置或設(shè)備或上述任意適合的組合。所述計算機可讀存儲介質(zhì)的更具體的實例(非窮舉列表)將包括以下項具有一條或多條線的電連接、便攜式計算機軟盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦寫可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式光盤只讀存儲器(CD-ROM)、光存儲設(shè)備、磁存儲設(shè)備或上述任意適合的組合。在本文檔的上下文中,計算機可讀存儲介質(zhì)可以是任何能夠包含或存儲由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或與指令執(zhí)行系統(tǒng)、裝置或設(shè)備結(jié)合的程序的有形介質(zhì)。計算機可讀信號介質(zhì)可以包括其中包含計算機可讀程序代碼(例如,在基帶中或作為載波的一部分)的傳播數(shù)據(jù)信號。此類傳播信號可以采取各種形式中的任一種,包括但不限于電磁、光或其中任意適合的組合。計算機可讀信號介質(zhì)可以是任何不屬于計算機可讀存儲介質(zhì)并且能夠傳送、傳播或傳輸由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或與指令執(zhí)行系統(tǒng)、裝置或設(shè)備結(jié)合的程序的計算機可讀介質(zhì)。
可以使用任何適當(dāng)?shù)慕橘|(zhì)(包括但不限于無線、線纜、光纜、RF等或上述任意適合的組合)來傳輸包含在計算機可讀介質(zhì)中的程序代碼。用于執(zhí)行本發(fā)明的各方面的操作的計算機程序代碼可以使用包含一種或多種編程語言的任意組合來編寫,所述編程語言包括諸如Java、Smalltalk、C++之類的面向?qū)ο蟮木幊陶Z言以及諸如“C”編程語言或類似的編程語言之類的常規(guī)過程編程語言。所述程序代碼可以完全在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為獨立的軟件包、部分地在用戶計算機上并部分地在遠程計算機上執(zhí)行,或者完全在遠程計算機或服務(wù)器上執(zhí)行。在后者的情況中,遠程計算機可以通過包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)的任何類型網(wǎng)絡(luò)與用戶的計算機相連,或者可以與外部計算機進行連接(例如,使用因特網(wǎng)服務(wù)提供商通過因特網(wǎng)連接)。將參考根據(jù)本發(fā)明的實施例的方法、裝置(系統(tǒng))和計算機程序產(chǎn)品的流程圖和/或方塊圖對本發(fā)明的各方面進行描述。將理解,所述流程圖和/或方塊圖的每個方塊以及所述流程圖和/或方塊圖中的方塊的組合可以由計算機程序指令來實現(xiàn)。這些計算機程序指令可以被提供給通用計算機、專用計算機或其他可編程數(shù)據(jù)處理裝置的處理器以產(chǎn)生機 器,以便通過所述計算機或其他可編程數(shù)據(jù)處理裝置的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在一個或多個流程圖和/或方塊圖方塊中指定的功能/操作的裝置。這些計算機程序指令也可以被存儲在能夠引導(dǎo)計算機、其他可編程數(shù)據(jù)處理裝置或其他設(shè)備以特定方式執(zhí)行功能的計算機可讀介質(zhì)中,以便存儲在所述計算機可讀介質(zhì)中的所述指令產(chǎn)生一件包括實現(xiàn)在一個或多個流程圖和/或方塊圖方塊中指定的功能/操作的指令的制品。所述計算機程序指令還可被加載到計算機、其他可編程數(shù)據(jù)處理裝置或其他設(shè)備,以導(dǎo)致在所述計算機、其他可編程裝置或其他設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的過程,從而在所述計算機或其他可編程裝置上執(zhí)行的所述指令提供用于實現(xiàn)在一個或多個流程圖和/或方塊圖方塊中指定的功能/操作的過程。附圖中的流程圖和方塊圖示出了根據(jù)本發(fā)明的各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實施方式的架構(gòu)、功能和操作。在此方面,所述流程圖或方塊圖中的每個方塊都可以表示代碼的模塊、段或部分,所述代碼包括用于實現(xiàn)指定的邏輯功能(多個)的一個或多個可執(zhí)行指令。還應(yīng)指出,在某些備選實施方式中,在方塊中說明的功能可以不按圖中說明的順序發(fā)生。例如,示為連續(xù)的兩個方塊可以實際上被基本同時地執(zhí)行,或者某些時候,取決于所涉及的功能,可以以相反的順序執(zhí)行所述方塊。還將指出,所述方塊圖和/或流程圖的每個方塊以及所述方塊圖和/或流程圖中的方塊的組合可以由執(zhí)行指定功能或操作的基于專用硬件的系統(tǒng)或?qū)S糜布陀嬎銠C指令的組合來實現(xiàn)。在此示出的附圖只是實例。在此描述的這些圖或步驟(或操作)可以存在許多變型而不偏離本發(fā)明的精神。例如,可以按不同的順序執(zhí)行所述步驟,或者可以添加、刪除或修改步驟。所有這些變型都被視為要求保護的本發(fā)明的一部分。
權(quán)利要求
1.一種用于檢測總線故障的計算機實現(xiàn)的方法,所述方法包括 接收錯誤檢測代碼的多個校驗子,所述錯誤檢測代碼與已在總線上傳輸?shù)亩鄠€幀關(guān)聯(lián),所述總線包括多個通道并由所述錯誤檢測代碼來保護; 針對所述校驗子中的每個校驗子,執(zhí)行 針對所述通道中的每個通道,執(zhí)行 在假設(shè)該通道是故障通道的情況下對該校驗子進行解碼,所述解碼輸出解碼結(jié)果; 判定所述解碼結(jié)果是否是有效解碼;以及響應(yīng)于判定所述解碼結(jié)果是有效解碼而為所述通道投票;以及響應(yīng)于所述投票而標識故障通道,所述故障通道的特征在于,其具有的投票多于所述總線上的至少一個其他通道。
2.根據(jù)權(quán)利要求I的方法,其中所述解碼包括針對所述通道生成候選錯誤向量,以及響應(yīng)于所述候選錯誤向量指示單個位錯誤而消除通過解碼所述校驗子生成的其他通道的投票。
3.根據(jù)權(quán)利要求I的方法,其中所述故障通道的特征在于,其具有的投票與所述總線上的任何其他通道至少一樣多。
4.根據(jù)權(quán)利要求I的方法,其中所述通道中的每個通道具有存儲值的關(guān)聯(lián)運行計數(shù)器,所述投票包括遞增與該通道關(guān)聯(lián)的運行計數(shù)器,并且所述標識包括比較所述運行計數(shù)器中的值以選擇所述故障通道。
5.根據(jù)權(quán)利要求4的方法,其中所述比較計算較高運行計數(shù)器值與較低運行計數(shù)器值的比率,并且所述標識進一步包括相對于比率閾值而比較所計算的比率以選擇所述故障通道。
6.根據(jù)權(quán)利要求I的方法,其中在接收到指定數(shù)量的所述校驗子之后執(zhí)行所述標識。
7.根據(jù)權(quán)利要求I的方法,其中針對所接收的校驗子的子集執(zhí)行所述解碼并且所述解碼包括生成候選錯誤向量,其中所述解碼利用所接收的并且不在該子集中的校驗子來交叉檢驗所述候選錯誤向量。
8.根據(jù)權(quán)利要求I的方法,其中響應(yīng)于標識所述故障通道和啟動糾正操作而重置所述投票。
9.根據(jù)權(quán)利要求I的方法,其中在指定時間量之后重置所述投票。
10.一種用于檢測總線故障的系統(tǒng),所述系統(tǒng)包括 總線接口設(shè)備,被配置為接收和捕獲已在總線上傳輸?shù)亩鄠€幀的校驗子,每個幀包括按通道的多個位傳輸;以及 校驗子處理邏輯,其與所述總線接口設(shè)備通信,所述校驗子處理邏輯被配置為執(zhí)行以下操作 接收錯誤檢測代碼的多個校驗子,所述錯誤檢測代碼與已在總線上傳輸?shù)亩鄠€幀關(guān)聯(lián),所述總線包括多個通道并由所述錯誤檢測代碼來保護; 針對所述校驗子中的每個校驗子,執(zhí)行 針對所述通道中的每個通道,執(zhí)行 在假設(shè)該通道是故障通道的情況下對該校驗子進行解碼,所述解碼輸出解碼結(jié)果; 判定所述解碼結(jié)果是否是有效解碼;以及響應(yīng)于判定所述解碼結(jié)果是有效解碼而為所述通道投票;以及響應(yīng)于所述投票而標識故障通道,所述故障通道的特征在于,其具有的投票多于所述總線上的至少一個其他通道。
11.根據(jù)權(quán)利要求10的系統(tǒng),其中所述解碼包括針對所述通道生成候選錯誤向量,以及響應(yīng)于所述候選錯誤向量指示單個位錯誤而消除通過解碼所述校驗子生成的其他通道的投票。
12.根據(jù)權(quán)利要求10的系統(tǒng),其中所述故障通道的特征在于,其具有的投票與所述總線上的任何其他通道至少一樣多。
13.根據(jù)權(quán)利要求10的系統(tǒng),其中所述系統(tǒng)還包括與所述通道關(guān)聯(lián)的多個運行計數(shù)器以便存儲值,所述投票包括遞增與該通道關(guān)聯(lián)的運行計數(shù)器,并且所述標識包括比較所述運行計數(shù)器中的值以選擇所述故障通道。
14.根據(jù)權(quán)利要求13的系統(tǒng),其中所述比較計算較高運行計數(shù)器值與較低運行計數(shù)器值的比率,并且所述標識進一步包括相對于比率閾值而比較所計算的比率以選擇所述故障通道。
15.根據(jù)權(quán)利要求10的系統(tǒng),其中在接收到指定數(shù)量的所述校驗子之后執(zhí)行所述標識。
16.根據(jù)權(quán)利要求10的系統(tǒng),其中針對所接收的校驗子的子集執(zhí)行所述解碼并且所述解碼包括生成候選錯誤向量,其中所述解碼利用所接收的并且不在該子集中的校驗子來交叉檢驗所述候選錯誤向量。
17.根據(jù)權(quán)利要求10的系統(tǒng),其中響應(yīng)于標識所述故障通道和啟動糾正操作而重置所述投票。
18.根據(jù)權(quán)利要求10的系統(tǒng),其中在指定時間量之后重置所述投票。
19.根據(jù)權(quán)利要求10的系統(tǒng),其中所述總線接口設(shè)備是存儲器系統(tǒng)中的集線器設(shè)備。
20.根據(jù)權(quán)利要求10的系統(tǒng),其中所述總線接口設(shè)備是存儲器系統(tǒng)中的存儲器控制器。
21.一種用于檢測總線故障的計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括 計算機可讀存儲介質(zhì),其可由處理電路讀取并存儲指令以便由所述處理電路執(zhí)行以實現(xiàn)一種方法,所述方法包括 接收錯誤檢測代碼的多個校驗子,所述錯誤檢測代碼與已在總線上傳輸?shù)亩鄠€幀關(guān)聯(lián),所述總線包括多個通道并由所述錯誤檢測代碼來保護; 針對所述校驗子中的每個校驗子,執(zhí)行 針對所述通道中的每個通道,執(zhí)行 在假設(shè)該通道是故障通道的情況下對該校驗子進行解碼,所述解碼輸出解碼結(jié)果;判定所述解碼結(jié)果是否是有效解碼;以及響應(yīng)于判定所述解碼結(jié)果是有效解碼而為所述通道投票;以及響應(yīng)于所述投票而標識故障通道,所述故障通道的特征在于,其具有的投票多于所述總線上的至少一個其他通道。
22.根據(jù)權(quán)利要求21的計算機程序產(chǎn)品,其中所述解碼包括針對所述通道生成候選錯誤向量,以及響應(yīng)于所述候選錯誤向量指示單個位錯誤而消除通過解碼所述校驗子生成的其他通道的投票 。
全文摘要
使用校驗子分析的故障總線通道檢測包括一種方法,包括接收錯誤檢測代碼的多個校驗子,所述錯誤檢測代碼與已在總線上傳輸?shù)亩鄠€幀關(guān)聯(lián),所述總線包括多個通道并由所述錯誤檢測代碼來保護。所述方法包括對于所述校驗子中的每個校驗子,針對所述通道中的每個通道而執(zhí)行以下操作在假設(shè)該通道是故障通道的情況下對該校驗子進行解碼,所述解碼輸出解碼結(jié)果;判定所述解碼結(jié)果是否是有效解碼;以及響應(yīng)于判定所述解碼結(jié)果是有效解碼而為所述通道投票。然后響應(yīng)于所述投票而標識故障通道,所述故障通道的特征在于,其具有的投票多于所述總線上的至少一個其他通道。
文檔編號H03M13/09GK102893262SQ201180024673
公開日2013年1月23日 申請日期2011年6月8日 優(yōu)先權(quán)日2010年6月24日
發(fā)明者L·拉斯特拉斯-莫塔諾, P·J·米尼, K·高爾 申請人:國際商業(yè)機器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
灵川县| 永宁县| 古蔺县| 潢川县| 城固县| 铜鼓县| 荣成市| 郓城县| 双峰县| 辉南县| 石棉县| 昌乐县| 浙江省| 金华市| 汶川县| 察隅县| 会昌县| 凤冈县| 安义县| 汾西县| 镇坪县| 隆尧县| 夏邑县| 满城县| 江城| 沁源县| 泸水县| 东台市| 庆阳市| 上思县| 登封市| 华容县| 宜城市| 商洛市| 宜良县| 银川市| 武威市| 什邡市| 龙山县| 大兴区| 江城|