本發(fā)明屬于集成電路模組測試領(lǐng)域,尤其涉及基于高能粒子的大容量固態(tài)硬盤單粒子效應(yīng)測試方法和裝置。
背景技術(shù):
1、隨著固態(tài)存儲(chǔ)器(solid?state?drive,ssd)的廣泛應(yīng)用,用戶對(duì)其可靠性要求越來越高。單粒子效應(yīng)(single?event?effects,see)可造成存儲(chǔ)系統(tǒng)邏輯功能異常,其中以單粒子功能中斷(single?event?functional?interruption,sefi)影響最大。高能粒子通過彈性碰撞造成的材料內(nèi)部原子位移,稱為位移損傷效應(yīng)(displacement?damage?effect,dde)。dde會(huì)導(dǎo)致器件中某些電參數(shù)的退化,乃至器件最終失去正常功能。
2、目前,對(duì)于ssd功能中斷現(xiàn)象尚缺乏分析技術(shù)與評(píng)估方法,尤其是針對(duì)敏感器件的定位與錯(cuò)誤率評(píng)估指標(biāo)確定。如現(xiàn)有技術(shù)1公開了一種nand型閃存固態(tài)硬盤空間環(huán)境效應(yīng)測試系統(tǒng)及試驗(yàn)方法,其中對(duì)單粒子輻照的主要實(shí)驗(yàn)方法為使用激光脈沖發(fā)生器模擬高能粒子入射ssd中的關(guān)鍵器件,然而該試驗(yàn)方法需要對(duì)這些器件進(jìn)行開封裝操作暴露芯片表面進(jìn)行試驗(yàn),其面臨兩大挑戰(zhàn),一是隨著芯片封裝密度的增加,現(xiàn)階段的ssd芯片主要采用球柵陣列封裝(ball?gridarray,bga),因此為確保芯片在開封裝后仍能工作,只能從芯片的正面開封裝。目前nand型閃存芯片與主控制器芯片仍采用引線鍵合(wire?bonding)封裝結(jié)構(gòu),芯片正面存在多層金屬布線結(jié)構(gòu)。該結(jié)構(gòu)會(huì)對(duì)入射脈沖激光產(chǎn)生反射,從而影響試驗(yàn)的有效性。同時(shí)芯片開封裝存在必要的強(qiáng)酸腐蝕與加熱步驟,容易對(duì)部分芯片產(chǎn)生永久性損傷。其二是脈沖激光僅能同時(shí)針對(duì)ssd中的單個(gè)芯片進(jìn)行輻照評(píng)估,較難反映在同一輻照條件下每種類器件的敏感度?,F(xiàn)有技術(shù)2公開了一種固態(tài)硬盤單粒子翻轉(zhuǎn)截面的測試方法。提出了利用閃存單元與ssd控制器的單粒子翻轉(zhuǎn)計(jì)數(shù)之和作為固態(tài)硬盤整體的單粒子翻轉(zhuǎn)計(jì)數(shù)的評(píng)估方法。由于該測試方法未考慮到控制器外部動(dòng)態(tài)隨機(jī)存儲(chǔ)器發(fā)生單粒子效應(yīng)的對(duì)ssd系統(tǒng)整體產(chǎn)生影響。因此更適用于評(píng)估采用無緩存設(shè)計(jì)的ssd。同時(shí)最新的ssd均在nand型閃存與控制器內(nèi)部靜態(tài)隨機(jī)存儲(chǔ)器、控制器外部動(dòng)態(tài)隨機(jī)存儲(chǔ)器中應(yīng)用了錯(cuò)誤檢查糾正模塊,因此在ssd中由單粒子效應(yīng)產(chǎn)生的錯(cuò)誤可被區(qū)分為可糾正的錯(cuò)誤與不可糾正的錯(cuò)誤。實(shí)際工程應(yīng)用更加關(guān)注不可糾正的錯(cuò)誤,該發(fā)明專利只針對(duì)ssd中發(fā)生的原始錯(cuò)誤率進(jìn)行測試?,F(xiàn)有技術(shù)中缺乏對(duì)ssd在實(shí)際工作條件下的單粒子效應(yīng)評(píng)估方法與試驗(yàn)結(jié)果的定量分析方法。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述技術(shù)問題,更加全面體現(xiàn)ssd抗輻照性能,本發(fā)明提出了基于高能粒子的大容量固態(tài)硬盤單粒子效應(yīng)測試方法和裝置,能夠?qū)崿F(xiàn)ssd抗輻射性能的參數(shù)化評(píng)估。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了基于高能粒子的大容量固態(tài)硬盤單粒子效應(yīng)測試方法,包括:
3、進(jìn)行ssd用戶數(shù)據(jù)預(yù)置實(shí)驗(yàn),向待測ssd數(shù)據(jù)按照指定大小的數(shù)據(jù)包并在每個(gè)數(shù)據(jù)包中添加校驗(yàn)信息;
4、基于所述數(shù)據(jù)預(yù)置實(shí)驗(yàn),開啟輻照測試,判斷ssd中的電子元器件是否在輻照條件下發(fā)生功能中斷與單粒子鎖定,確定判斷結(jié)果;
5、根據(jù)所述判斷結(jié)果,進(jìn)行功能測試,獲取功能測試結(jié)果,基于所述功能測試結(jié)果,在輻照后測試階段進(jìn)行靜默數(shù)據(jù)破壞測試與固定位錯(cuò)誤測試;
6、根據(jù)所述靜默數(shù)據(jù)破壞測試和固定位錯(cuò)誤測試,記錄靜默錯(cuò)誤數(shù)量與固定位錯(cuò)誤數(shù)據(jù);
7、基于所述靜默數(shù)據(jù)破壞數(shù)量與固定位錯(cuò)誤數(shù)據(jù),進(jìn)行錯(cuò)誤特性量化計(jì)算,輸出計(jì)算結(jié)果。
8、可選的,基于所述數(shù)據(jù)預(yù)置實(shí)驗(yàn),開啟所述輻照測試,包括:
9、在高能粒子輻照環(huán)境下由測試服務(wù)器批量對(duì)待測ssd執(zhí)行4kverify混合隨機(jī)讀寫運(yùn)行測試,獲取ssd的性能信息和錯(cuò)誤信息。
10、可選的,判斷ssd中的電子元器件是否在輻照條件下發(fā)生功能中斷與單粒子鎖定,確定判斷結(jié)果包括:
11、若發(fā)生單粒子鎖定,則進(jìn)行斷電并收集測試服務(wù)器bmc過流警告日志;
12、若未發(fā)生單粒子鎖定,則進(jìn)行所述功能測試。
13、可選的,基于所述功能測試結(jié)果,在輻照后測試階段進(jìn)行靜默數(shù)據(jù)破壞測試與固定位錯(cuò)誤測試包括:
14、若所述功能測試失敗,則收集日志數(shù)據(jù),進(jìn)行功能恢復(fù)和固件重寫,成功后再進(jìn)行靜默數(shù)據(jù)破壞測試;
15、若所述功能測試成功,則根據(jù)收集的錯(cuò)誤日志信息進(jìn)行所述靜默數(shù)據(jù)破壞測試與固定位錯(cuò)誤測試。
16、可選的,根據(jù)所述靜默數(shù)據(jù)破壞測試和固定位錯(cuò)誤測試,記錄固定位錯(cuò)誤數(shù)據(jù)包括:
17、利用fio的verify功能進(jìn)行讀測試,若出現(xiàn)讀出數(shù)據(jù)出錯(cuò)且控制器未上報(bào)該錯(cuò)誤,則認(rèn)為發(fā)生靜默數(shù)據(jù)破壞錯(cuò)誤,并記錄所述靜默錯(cuò)誤數(shù)量,若在測試期間發(fā)現(xiàn)動(dòng)態(tài)隨機(jī)存儲(chǔ)器出現(xiàn)固定物理地址上的重復(fù)糾錯(cuò)記錄,則記錄固定位錯(cuò)誤數(shù)據(jù)。
18、可選的,基于所述固定位錯(cuò)誤數(shù)據(jù),進(jìn)行錯(cuò)誤特性量化計(jì)算,輸出計(jì)算結(jié)果包括:
19、利用控制器和動(dòng)態(tài)隨機(jī)存儲(chǔ)器產(chǎn)生的錯(cuò)誤數(shù)據(jù),利用所述固定位錯(cuò)誤數(shù)據(jù),進(jìn)行錯(cuò)誤特性量化計(jì)算,統(tǒng)計(jì)計(jì)算結(jié)果并輸出。
20、本發(fā)明還提供了基于高能粒子的大容量固態(tài)硬盤單粒子效應(yīng)測試裝置,包括:通過以太網(wǎng)連接的控制中心和輻照室;
21、所述控制中心,用于對(duì)所述輻照室進(jìn)行控制;
22、所述輻照室包括:高能粒子束流窗、被測模組、高能粒子吸收器、測試服務(wù)器、pciex16線纜、slimsas重定時(shí)拓展卡、sff-8654u.2接口線纜、sff-8088sata接口線纜;
23、所述高能粒子束流窗,用于實(shí)現(xiàn)加速器束流管道內(nèi)部高真空環(huán)境與外部常壓環(huán)境之間的隔離,同時(shí)允許加速后的粒子束安全、有效地從加速器內(nèi)引出;
24、所述被測模組,用于固定待測ssd并確保高能粒子束流中心點(diǎn)位于預(yù)期位置;
25、所述高能粒子吸收器,用于吸收剩余高能粒子,防止對(duì)測試環(huán)境其他敏感器件產(chǎn)生干擾;
26、所述測試服務(wù)器,用于運(yùn)行ssd的測試腳本與測試案例,監(jiān)控ssd工作狀態(tài)并收集發(fā)生的錯(cuò)誤數(shù)據(jù);
27、所述pcie?x16線纜,用于連接測試服務(wù)器pcie接口與slimsas重定時(shí)拓展卡,使得測試服務(wù)器盡可能遠(yuǎn)離束流窗;
28、所述slimsas重定時(shí)拓展卡,用于將pcie信號(hào)轉(zhuǎn)換為slimsas標(biāo)準(zhǔn)信號(hào),同時(shí)進(jìn)行重定時(shí)以補(bǔ)償鏈路損耗,以滿足pcie鏈路的信號(hào)完整性要求;
29、所述sff-8645u.2接口線纜,用于連接采用u.2接口的待測ssd的數(shù)據(jù)與slimsas重定時(shí)拓展卡,以滿足多個(gè)ssd同時(shí)開展輻照測試的需求;
30、所述sff-8088sata接口線纜,用于直接連接采用sata接口的待測ssd與測試服務(wù)器。
31、可選的,所述控制中心包括:高能粒子準(zhǔn)直器控制器、高能粒子開關(guān)和監(jiān)控計(jì)算機(jī);
32、所述高能粒子準(zhǔn)直器控制器,用于控制高能粒子輻照的面積與通量;
33、所述高能粒子開關(guān),用于控制高能粒子輻照時(shí)間;
34、所述監(jiān)控計(jì)算機(jī),用于通過ssh協(xié)議遠(yuǎn)程登陸測試服務(wù)器,確保測試人員對(duì)輻照室內(nèi)的測試服務(wù)器進(jìn)行安全且實(shí)時(shí)的控制與觀察。
35、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn)和技術(shù)效果:
36、1.減少開封裝操作的復(fù)雜性與損傷風(fēng)險(xiǎn):現(xiàn)有發(fā)明技術(shù)中的試驗(yàn)方法依賴對(duì)ssd芯片進(jìn)行開封裝操作,隨著封裝密度的不斷增大,開封裝難度也越來越大,本發(fā)明改進(jìn)了實(shí)驗(yàn)方法,避免了開封裝操作,降低了測試裝對(duì)芯片性能的影響,從而提高了試驗(yàn)的可靠性與有效性。
37、2.在正常工作條件下完成ssd單粒子效應(yīng)測試:現(xiàn)有發(fā)明中提及的技術(shù)僅能針對(duì)ssd中的單個(gè)芯片進(jìn)行輻照評(píng)估并依賴于特定的寫入數(shù)據(jù)或工程開發(fā)調(diào)試模式。同時(shí),本發(fā)明的測試方法不需要ssd進(jìn)入調(diào)試模式,而是在其正常工作模式下即可完成單粒子效應(yīng)的測試和評(píng)估。這一特性不僅簡化了測試流程,能夠更真實(shí)地反映ssd在實(shí)際工況下的性能和穩(wěn)定性。
38、3.綜合考慮系統(tǒng)級(jí)單粒子效應(yīng)的影響:本發(fā)明克服了現(xiàn)有技術(shù)只針對(duì)特定于nand閃存或控制器的局限性,通過改進(jìn)實(shí)驗(yàn)設(shè)計(jì),使得在相同的輻照條件下,可以同時(shí)評(píng)估ssd內(nèi)部多個(gè)關(guān)鍵器件的敏感度,顯著增強(qiáng)了對(duì)各類器件的分析能力。同時(shí)現(xiàn)有發(fā)明中的測試技術(shù)不適用于帶有緩存的ssd。本發(fā)明能夠在帶緩存設(shè)計(jì)的ssd中進(jìn)行單粒子效應(yīng)的測試和評(píng)估,拓寬了技術(shù)應(yīng)用的范圍,適用于當(dāng)前ssd的主流設(shè)計(jì)。
39、4.不可糾正錯(cuò)誤測試與表征方式:由于現(xiàn)代ssd廣泛應(yīng)用了錯(cuò)誤檢查與糾正模塊,本發(fā)明能夠有效區(qū)分由單粒子效應(yīng)引起的可糾正與不可糾正錯(cuò)誤并給出測試表征方法,尤其是關(guān)注工程應(yīng)用中更加重要的不可糾正錯(cuò)誤,從而提高了對(duì)ssd工作可靠性的評(píng)估精度。
40、5.總結(jié)來說,本發(fā)明不僅克服了現(xiàn)有技術(shù)在試驗(yàn)操作、器件敏感度分析、系統(tǒng)級(jí)效應(yīng)評(píng)估等方面的不足,還提供了更全面、精準(zhǔn)的ssd單粒子效應(yīng)評(píng)估方法,并更好地反映了現(xiàn)代ssd在實(shí)際工作條件下的性能。