两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種測試生物信息學計算平臺性能的方法

文檔序號:6624001閱讀:471來源:國知局
一種測試生物信息學計算平臺性能的方法
【專利摘要】本發(fā)明公開了一種測試生物信息學計算平臺性能的方法,包括:選擇適用于生物信息學的基礎(chǔ)計算平臺;對所選擇的基礎(chǔ)計算平臺進行性能測試,得到標準性能指標;對待測試生物信息學計算平臺進行性能測試,將得到的性能指標與標準性能指標進行比較,得到測試結(jié)果。通過本發(fā)明的方案,將對基礎(chǔ)計算平臺的性能測試作為標準性能指標,利用標準性能指標來衡量待測試計算平臺,從而實現(xiàn)了對生物信息學計算平臺的性能的測試。
【專利說明】一種測試生物信息學計算平臺性能的方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物信息學技術(shù),尤指一種測試生物信息學計算平臺性能的方法。

【背景技術(shù)】
[0002] 生物信息學是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索 和分析的科學。它是當今生命科學和自然科學的重大前沿領(lǐng)域之一,同時也將是21世紀 自然科學的核心領(lǐng)域之一。其研究重點主要體現(xiàn)在基因組學(Genomics)和蛋白質(zhì)組學 (Proteomics)兩方面,具體說就是從核酸和蛋白質(zhì)序列出發(fā),分析序列中表達的結(jié)構(gòu)功能 的生物信息。在基因組學研究方向,測序技術(shù)是重要的研究手段,對于測序數(shù)據(jù)的分析需要 借助高性能計算平臺完成,因此,高性能計算平臺的性能對生物信息學研究進展起著至關(guān) 重要的作用,如何評測一套生物信息學計算平臺的性能,是很多生物信息學專家以及高性 能計算專家面臨的問題。因為熟悉生物信息學的專家不熟悉具體的計算系統(tǒng)的配置,高性 能計算專家對生物信息分析的流程和資源需求也知之甚少,所以發(fā)展一套標準化的生物信 息學計算平臺性能的檢測方法十分必要。
[0003] 現(xiàn)有的測試計算平臺性能的方法是,只對計算平臺進行系統(tǒng)級的常規(guī)檢測,如 linpack測試,stream測試。其并沒有考慮生物信息學應用軟件的性能特征。而生物信息學 計算平臺要求內(nèi)存容量消耗大,磁盤讀寫頻繁,且存儲占用空間大等,因此采用現(xiàn)有的方法 檢測得到的性能較好的計算平臺,在進行生物信息學方面的計算時,其性能不一定是好的。


【發(fā)明內(nèi)容】

[0004] 為了解決上述問題,本發(fā)明提出了一種測試生物信息學計算平臺性能的方法,能 夠測試生物信息學計算平臺的性能。
[0005] 為了達到上述目的,本發(fā)明提出了一種測試生物信息學計算平臺性能的方法,包 括:
[0006] 選擇適用于生物信息學的基礎(chǔ)計算平臺;
[0007] 對所選擇的基礎(chǔ)計算平臺進行性能測試,得到標準性能指標;
[0008] 對待測試生物信息學計算平臺進行性能測試,將得到的性能指標與標準性能指標 進行比較,得到測試結(jié)果。
[0009] 優(yōu)選地,所述性能測試包括對硬件的測試和對軟件的測試。
[0010] 優(yōu)選地,所述對硬件的測試包括對高性能計算的linpack HPL效率、內(nèi)存帶寬、磁 盤讀寫頻率的測試。
[0011] 優(yōu)選地,所述對軟件的測試包括:
[0012] 采用測試用例在所述基礎(chǔ)計算平臺的生物信息學軟件中運行的時間和資源消耗。
[0013] 優(yōu)選地,所述將得到的性能指標與標準性能指標進行比較,得到測試結(jié)果包括:
[0014] 當所述待測試生物信息學計算平臺的性能指標優(yōu)于所述標準性能指標時,所述測 試結(jié)果為待測試計算平臺滿足要求。
[0015] 優(yōu)選地,所述測試結(jié)果為待測試生物信息學計算平臺滿足要求包括:
[0016] 所述對待測試生物信息學計算平臺進行性能測試得到的HPL效率大于或等于所 述對基礎(chǔ)計算平臺進行性能測試得到的HPL效率,
[0017] 且所述對待測試生物信息學計算平臺進行性能測試得到的內(nèi)存帶寬的實測值和 理論值之間的比值大于或等于所述對基礎(chǔ)計算平臺進行性能測試得到的比值,
[0018] 且所述對待測試生物信息學計算平臺進行性能測試得到的磁盤讀寫頻率小于或 等于所述對基礎(chǔ)計算平臺進行性能測試得到的磁盤讀寫頻率,
[0019] 且所述對待測試生物信息學計算平臺進行性能測試得到的測試用例的運行時間 和資源消耗小于或等于所述對基礎(chǔ)計算平臺進行性能測試得到的運行時間和資源消耗。
[0020] 與現(xiàn)有技術(shù)相比,本發(fā)明包括:選擇適用于生物信息學的基礎(chǔ)計算平臺;對所選 擇的基礎(chǔ)計算平臺進行性能測試,得到標準性能指標;對待測試生物信息學計算平臺進行 性能測試,將得到的性能指標與標準性能指標進行比較,得到測試結(jié)果。通過本發(fā)明的方 案,將對基礎(chǔ)計算平臺的性能測試作為標準性能指標,利用標準性能指標來衡量待測試計 算平臺,從而實現(xiàn)了對生物信息學計算平臺的性能的測試。

【專利附圖】

【附圖說明】
[0021] 下面對本發(fā)明實施例中的附圖進行說明,實施例中的附圖是用于對本發(fā)明的進一 步理解,與說明書一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明保護范圍的限制。
[0022] 圖1為本發(fā)明的測試生物信息學計算平臺性能的方法流程圖。

【具體實施方式】
[0023] 為了便于本領(lǐng)域技術(shù)人員的理解,下面結(jié)合附圖對本發(fā)明作進一步的描述,并不 能用來限制本發(fā)明的保護范圍。
[0024] 參見圖1,本發(fā)明提出了一種測試生物信息學計算平臺性能的方法,包括:
[0025] 步驟100、選擇適用于生物信息學的基礎(chǔ)計算平臺。
[0026] 本步驟中,所選擇的基礎(chǔ)計算平臺必須是現(xiàn)有生物信息學分析較通用的硬件平 臺,應滿足大內(nèi)存,高主頻,高磁盤讀寫頻率等。具體可以采用調(diào)研的方式了解目前生物信 息學用戶對計算平臺的硬件資源和軟件資源的需求,從而選擇使用頻率最高的計算平臺作 為基礎(chǔ)計算平臺。
[0027] 例如,根據(jù)調(diào)研發(fā)現(xiàn),浪潮NF5280M3雙路計算節(jié)點的計算平臺完全可以滿足目前 生物信息學用戶對計算平臺的硬件資源和軟件資源的需求。該計算平臺的CPU選用INTEL Xeon E5-2670,配 8GB*16 = 128GB 內(nèi)存,8 塊 300GB 磁盤做磁盤陣列(RAID,Redundant Arrays of Inexpensive Disks);該計算平臺安裝的操作系統(tǒng)為RHEL6. 3 Linux操作系統(tǒng), 安裝的編譯器為incomposer_xe_2013. 3. 163,消息傳遞接口軟件為intel mpi4. 1. 0· 024i, 是一種程序并行接口軟件,以及用戶環(huán)境的配置,即集群用戶組群的建立,權(quán)限管理,用戶 的磁盤空間分配等。
[0028] 步驟101、對所選擇的基礎(chǔ)計算平臺進行性能測試,得到標準性能指標。
[0029] 本步驟中,性能測試包括對硬件的測試和對軟件的測試。
[0030] 其中,對硬件的測試包括對基礎(chǔ)計算平臺的高性能計算的linpack(HPL,High Performance Computing Linpack)效率、內(nèi)存帶寬、磁盤讀寫頻率等的測試。
[0031] 其中,可以采用現(xiàn)有的集群或是系統(tǒng)的基準測試方法,如HPL測試方法對HPL效率 進行測試,并不用于限定本發(fā)明的保護范圍,這里不再贅述。
[0032] 測試過程中,可以通過調(diào)節(jié)問題規(guī)模大小N(矩陣大?。?、使用到的CPU數(shù)目、使用 的優(yōu)化方法等來執(zhí)行HPL測試程序,以獲取最佳的性能,一般HPL效率在95%以上為佳。
[0033] 其中,可以采用STREAM來測試內(nèi)存帶寬。
[0034] 測試過程中,可以通過對大維度的矢量數(shù)組的處理(如數(shù)組的復制、數(shù)組的尺度 變換、數(shù)組的矢量求和、數(shù)組的復合矢量求和)來評價基礎(chǔ)計算平臺的內(nèi)存帶寬。內(nèi)存帶寬 的實測值和理論值之間的比值在80%以上為佳。
[0035] 其中,可以采用Linux系統(tǒng)命令(如DD)進行磁盤讀寫頻率的測試。磁盤讀寫速 度在80MB/s以上為佳。
[0036] 其中,對軟件的測試是指采用測試用例在基礎(chǔ)計算平臺的生物信息學軟件中運行 的時間和資源消耗情況(包括內(nèi)存的占用、CPU的占用和磁盤讀寫頻率等)。
[0037] 其中,由于BWA(Burrows-Wheeler Aligner)軟件和序列拼接軟件VELVET是生物 信息學中最耗時,且業(yè)內(nèi)使用頻率最高的兩款軟件,可以選用這兩款軟件作為用例對基礎(chǔ) 計算平臺的性能進行測試。
[0038] 其中,測試用例的選擇要能占滿或是消耗完系統(tǒng)的大量資源,如內(nèi)存消耗達到總 內(nèi)存容量的90 %的特點等。
[0039] 例如,測試用例可以選用ILLUMIA公司的測序數(shù)據(jù)進行分析,ILLUMIA公司產(chǎn)生的 序列文件可以作為進行生物信息學的軟件(如BWA和VELVET等)的輸入文件。
[0040] 其中,可以采用自動化程序?qū)鶞蕼y試軟件HPL,STREAM、生物信息學軟件BWA、 VELVET自動安裝到基礎(chǔ)計算平臺中,該自動化程序通過編寫腳本將HPL、STREAM、生物信息 學軟件BWA、VELVET軟件自動安裝到基礎(chǔ)計算平臺中,使用shell腳本定義用到的編譯器 類型,定義編譯選項,設(shè)置編譯路徑,定義編譯的步驟,保存腳本,最后執(zhí)行腳本實現(xiàn)自動安 裝,并根據(jù)系統(tǒng)的參數(shù)自動匹配測試參數(shù),進行性能測試。
[0041] 具體如何實現(xiàn)對基準測試軟件HPL,STREAM、生物信息學軟件BWA、VELVET的自動 安裝屬于本領(lǐng)域技術(shù)人員的慣用技術(shù)手段,這里不再贅述。
[0042] 步驟102、對待測試生物信息學計算平臺進行性能測試,將得到的性能指標與標準 性能指標進行比較,得到測試結(jié)果。
[0043] 本步驟中,當待測試生物信息學計算平臺的性能指標優(yōu)于標準性能指標時,測試 結(jié)果為待測試計算平臺滿足要求。
[0044] 具體的,測試結(jié)果為待測試計算平臺滿足要求包括:對待測試生物信息學計算平 臺進行性能測試得到的HPL效率大于或等于對基礎(chǔ)計算平臺進行性能測試得到的HPL效 率,且對待測試生物信息學計算平臺進行性能測試得到的內(nèi)存帶寬的實測值和理論值之間 的比值大于或等于對基礎(chǔ)計算平臺的比值,且對待測試生物信息學計算平臺進行性能測試 得到的磁盤讀寫頻率小于或等于對基礎(chǔ)計算平臺進行性能測試得到的磁盤讀寫頻率,且對 待測試生物信息學計算平臺進行性能測試得到的測試用例的運行時間和資源消耗小于或 等于對基礎(chǔ)計算平臺進行性能測試得到的運行時間和資源消耗。
[0045] 本步驟中,采用HPL效率在95 %以上時所采用的測試條件(如問題規(guī)模大小N (矩 陣大小)、使用到的CPU數(shù)目、使用的優(yōu)化方法等)對待測試計算平臺進行HPL效率的測試。
[0046] 采用內(nèi)存帶寬的實測值和理論值之間的比值在80%以上是所采用的對大維度的 矢量數(shù)組的處理實例來評價待測試計算平臺的內(nèi)存帶寬。
[0047] 采用與基礎(chǔ)計算平臺相同的測試用例在待測試計算平臺上進行測試,當測試用例 運行時間比基礎(chǔ)計算平臺短時,認為待測試計算平臺的性能優(yōu)于基礎(chǔ)計算平臺。
[0048] 需要說明的是,以上所述的實施例僅是為了便于本領(lǐng)域的技術(shù)人員理解而已,并 不用于限制本發(fā)明的保護范圍,在不脫離本發(fā)明的發(fā)明構(gòu)思的前提下,本領(lǐng)域技術(shù)人員對 本發(fā)明所做出的任何顯而易見的替換和改進等均在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1. 一種測試生物信息學計算平臺性能的方法,其特征在于,包括: 選擇適用于生物信息學的基礎(chǔ)計算平臺; 對所選擇的基礎(chǔ)計算平臺進行性能測試,得到標準性能指標; 對待測試生物信息學計算平臺進行性能測試,將得到的性能指標與標準性能指標進行 比較,得到測試結(jié)果。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述性能測試包括對硬件的測試和對軟 件的測試。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對硬件的測試包括對高性能計算的 linpack HPL效率、內(nèi)存帶寬、磁盤讀寫頻率的測試。
4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對軟件的測試包括: 采用測試用例在所述基礎(chǔ)計算平臺的生物信息學軟件中運行的時間和資源消耗。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將得到的性能指標與標準性能指標 進行比較,得到測試結(jié)果包括: 當所述待測試生物信息學計算平臺的性能指標優(yōu)于所述標準性能指標時,所述測試結(jié) 果為待測試計算平臺滿足要求。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述測試結(jié)果為待測試生物信息學計算 平臺滿足要求包括: 所述對待測試生物信息學計算平臺進行性能測試得到的HPL效率大于或等于所述對 基礎(chǔ)計算平臺進行性能測試得到的HPL效率, 且所述對待測試生物信息學計算平臺進行性能測試得到的內(nèi)存帶寬的實測值和理論 值之間的比值大于或等于所述對基礎(chǔ)計算平臺進行性能測試得到的比值, 且所述對待測試生物信息學計算平臺進行性能測試得到的磁盤讀寫頻率小于或等于 所述對基礎(chǔ)計算平臺進行性能測試得到的磁盤讀寫頻率, 且所述對待測試生物信息學計算平臺進行性能測試得到的測試用例的運行時間和資 源消耗小于或等于所述對基礎(chǔ)計算平臺進行性能測試得到的運行時間和資源消耗。
【文檔編號】G06F11/36GK104156274SQ201410408945
【公開日】2014年11月19日 申請日期:2014年8月19日 優(yōu)先權(quán)日:2014年8月19日
【發(fā)明者】金蓮, 呂文靜, 劉羽, 陳博文, 于濤 申請人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
汝州市| 元谋县| 独山县| 宜黄县| 石门县| 天门市| 扶风县| 云林县| 庄河市| 仁怀市| 德令哈市| 卢龙县| 汶川县| 东兰县| 华池县| 阿拉善右旗| 大新县| 新和县| 镇原县| 和硕县| 南安市| 陆川县| 商丘市| 蓝山县| 河东区| 巴东县| 大厂| 白水县| 社会| 土默特左旗| 五家渠市| 邓州市| 夏津县| 五家渠市| 文山县| 盐津县| 蚌埠市| 麻栗坡县| 句容市| 临夏市| 宁德市|