两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)及其管理方法

文檔序號(hào):6471353閱讀:165來(lái)源:國(guó)知局
專利名稱:基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)及其管理方法
技術(shù)領(lǐng)域
本發(fā)明涉及面向任務(wù)流的基于寄存器文件的數(shù)據(jù)交換結(jié) 構(gòu),特別涉及一種基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)及其管理方法。
(二) 背景技術(shù)
計(jì)算機(jī)系統(tǒng)中三大支柱是處理部件,存儲(chǔ)部件和通信
部件(包括i/o和網(wǎng)絡(luò)互聯(lián))。從表面上看,計(jì)算、存儲(chǔ)、通信這三者是相互獨(dú)
立的。但事實(shí)上,在一定條件下,計(jì)算、存儲(chǔ)、通信之間可以互相轉(zhuǎn)化。在許 多高性能并行計(jì)算的應(yīng)用中,數(shù)據(jù)的通信能力往往是制約其性能提高的瓶頸, 即系統(tǒng)最終的整體性能往往由系統(tǒng)節(jié)點(diǎn)間的數(shù)據(jù)交換能力所決定。但當(dāng)前高性 能計(jì)算系統(tǒng)對(duì)這個(gè)問(wèn)題的解決思路非常單一,基本上都是通過(guò)各種方式優(yōu)化和 改善計(jì)算節(jié)點(diǎn)間互聯(lián)網(wǎng)絡(luò)的性能來(lái)實(shí)現(xiàn)的。
MPP系統(tǒng)通過(guò)SMP、 CC-NUMA、 Cluster-NUMA、多線程體系結(jié)構(gòu)及各種 混合式結(jié)構(gòu)的使用解決整機(jī)互連問(wèn)題,其網(wǎng)絡(luò)設(shè)計(jì)復(fù)雜度、網(wǎng)絡(luò)直徑和通信延 遲隨整機(jī)規(guī)模擴(kuò)大迅速增大。而采用Cluster體系結(jié)構(gòu)集群系統(tǒng),具有可自由伸 縮、高度可管理、高可用、高性能價(jià)格比等諸多優(yōu)點(diǎn);但其通信開(kāi)銷和延遲大, 隨著CPU和計(jì)算結(jié)點(diǎn)數(shù)目的增加,對(duì)交換機(jī)的數(shù)量和性能要求越來(lái)越高。
對(duì)可擴(kuò)展、高帶寬、低延遲的高效能并行計(jì)算機(jī)系統(tǒng)而言,網(wǎng)絡(luò)直徑和延 時(shí)隨著系統(tǒng)規(guī)模的增加而大幅增長(zhǎng)所帶來(lái)的影響已經(jīng)非常突出,高效能計(jì)算系 統(tǒng)中可重構(gòu)、可分區(qū)、可配置特性也變得越來(lái)越重要。如何突破互聯(lián)網(wǎng)絡(luò)這種 單一數(shù)據(jù)交換模式,獲得比MPP耦合網(wǎng)絡(luò)結(jié)構(gòu)和Cluster松耦合網(wǎng)絡(luò)結(jié)構(gòu)更高的 效能是一個(gè)亟待解決的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是克服現(xiàn)有技術(shù)的缺陷,提供一種面向任務(wù)流 的可應(yīng)用于高效能計(jì)算系統(tǒng)中的易擴(kuò)展、高帶寬、低延遲的基于寄存器文件的 快速數(shù)據(jù)交換結(jié)構(gòu)及其管理方法,本發(fā)明突破當(dāng)前高性能計(jì)算系統(tǒng)設(shè)計(jì)中通常 所采用的互連網(wǎng)絡(luò)這種單一數(shù)據(jù)通信模式,是一種不受網(wǎng)絡(luò)直徑限制,比以往MPP耦合網(wǎng)絡(luò)結(jié)構(gòu)和Cluster松耦合網(wǎng)絡(luò)結(jié)構(gòu)更加穩(wěn)定、高效的數(shù)據(jù)交換結(jié)構(gòu), 同時(shí)本發(fā)明還可與當(dāng)前高性能計(jì)算系統(tǒng)中具有各種拓?fù)浣Y(jié)構(gòu)的互連網(wǎng)絡(luò)配合應(yīng) 用,提高系統(tǒng)整體的數(shù)據(jù)通信能力。
本發(fā)明的技術(shù)方案
一種基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu),含有全局寄存器文件和n個(gè)計(jì) 算節(jié)點(diǎn),n為自然數(shù),每個(gè)計(jì)算節(jié)點(diǎn)通過(guò)專用總線分別與全局寄存器文件連接, 每個(gè)計(jì)算節(jié)點(diǎn)之間的專用總線不存在交叉或共用,計(jì)算節(jié)點(diǎn)含有局部寄存器文 件和不同層次的任務(wù)流處理部件,任務(wù)流處理部件之間以及任務(wù)流處理部件與 局部寄存器文件之間通過(guò)交叉總線連接。
總線按其功能可以分成專用總線和非專用總線,都屬于數(shù)據(jù)總線。專用總 線是指只連接一對(duì)物理部件的總線,從物理位置上來(lái)說(shuō)屬于外總線的一種,在 此,專用總線是連接計(jì)算節(jié)點(diǎn)和全局寄存器文件,進(jìn)行數(shù)據(jù)傳輸?shù)耐ǖ馈?br> 交叉總線從物理位置上來(lái)說(shuō)屬于內(nèi)總線。計(jì)算節(jié)點(diǎn)內(nèi)的各任務(wù)流處理部件 之間、任務(wù)流處理部件與局部寄存器文件之間均通過(guò)交叉總線進(jìn)行互聯(lián)。交叉 總線為各個(gè)任務(wù)流處理部件之間的數(shù)據(jù)交互、任務(wù)流處理部件與局部寄存器文 件之間的數(shù)據(jù)交互提供了傳輸通道。
局部寄存器文件通過(guò)寄存器文件邏輯端口接交叉總線,局部寄存器文件根 據(jù)計(jì)算節(jié)點(diǎn)的層次結(jié)構(gòu),為計(jì)算節(jié)點(diǎn)中的各個(gè)任務(wù)流處理部件提供可訪問(wèn)的寄 存器文件邏輯端口;全局寄存器文件通過(guò)寄存器文件邏輯端口接專用總線,全 局寄存器文件為不同的計(jì)算節(jié)點(diǎn)提供不同的寄存器文件邏輯端口 ,為同一計(jì)算 節(jié)點(diǎn)中不同的任務(wù)流處理部件提供單一的物理端口,通過(guò)時(shí)間分片為不同的任 務(wù)流處理部件提供可同時(shí)訪問(wèn)的寄存器文件邏輯端口 。
全局寄存器文件為存儲(chǔ)各計(jì)算節(jié)點(diǎn)中間結(jié)果的寄存器文件組,局部寄存器 文件為存儲(chǔ)計(jì)算節(jié)點(diǎn)內(nèi)進(jìn)行任務(wù)處理時(shí)的所有操作數(shù)和中間結(jié)果的寄存器文件 組,任務(wù)流處理部件含有FPGA陣列、CPU陣列、GPU陣列、共享存儲(chǔ)器加速 裝置Shared memory accelerator、多核共享快速緩沖貯存區(qū)Cache shared multi糧core、主存儲(chǔ)器Main memory禾卩存儲(chǔ)器Storage 。
寄存器文件組含有m個(gè)寄存器文件,每個(gè)寄存器文件含有寄存器文件控制器和k個(gè)存儲(chǔ)簇,存儲(chǔ)簇由寄存器構(gòu)成,m和k為自然數(shù),寄存器文件控制器 通過(guò)統(tǒng)一的交叉總線連接,存儲(chǔ)簇之間通過(guò)數(shù)據(jù)總線進(jìn)行連接,寄存器文件控 制器和存儲(chǔ)簇之間采用集中式的串行鏈接方式。
GPU為圖形處理單元(Graphic Process Unit)的縮寫。近年來(lái),隨著芯片集 成度的提高,在GPU中可以集成大量的處理單元(處理核),其專用處理性能 可以非常高(相當(dāng)于一個(gè)眾核CPU),因此現(xiàn)在高性能計(jì)算對(duì)GPU資源的利用 也非常重視。目前GPU不僅局限于圖像處理、虛擬現(xiàn)實(shí)、計(jì)算機(jī)仿真等圖像處 理相關(guān)領(lǐng)域,圖形處理以外的通用計(jì)算也希望利用GPU多核資源進(jìn)行高性能計(jì) 算。另外,由于GPU具有流處理、高密度并行運(yùn)算、可編程流水線等特性,使 得GPU較好的高性能計(jì)算能力和應(yīng)用范圍。
將GPU用于通用計(jì)算的主要目的是為了加速計(jì)算,加速的主要?jiǎng)恿?lái)自 GPU在高性能計(jì)算方面所具有的優(yōu)勢(shì)高效并行性、高密集的運(yùn)算和超長(zhǎng)圖形 流水線。由于GPU在并行處理和計(jì)算密集型問(wèn)題求解等方面所具有的諸多優(yōu)勢(shì), 同時(shí)GPU的發(fā)展速度已遠(yuǎn)遠(yuǎn)超過(guò)通用處理器,特別是隨著可編程能力、并行處 理能力和應(yīng)用范圍方面得到不斷提升和擴(kuò)展,使得GPU已成為當(dāng)前計(jì)算機(jī)系統(tǒng) 中具備高性能處理能力的部件,如何將計(jì)算任務(wù)在CPU和GPU之間進(jìn)行分配, 使得其高效協(xié)調(diào)工作是一個(gè)關(guān)鍵問(wèn)題。
一種對(duì)所述基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的管理方法,具體為每 一個(gè)計(jì)算節(jié)點(diǎn)均可以對(duì)全局寄存器文件進(jìn)行共享訪問(wèn),以發(fā)掘各計(jì)算節(jié)點(diǎn)間的 任務(wù)流數(shù)據(jù)重用,全局寄存器文件的大小可以根據(jù)計(jì)算節(jié)點(diǎn)的資源規(guī)模進(jìn)行動(dòng) 態(tài)分配和調(diào)整,當(dāng)計(jì)算節(jié)點(diǎn)內(nèi)各任務(wù)流處理部件間進(jìn)行數(shù)據(jù)通信時(shí),局部寄存 器文件為相應(yīng)的數(shù)據(jù)交換提供支持。
計(jì)算節(jié)點(diǎn)與全局寄存器文件之間采用統(tǒng)一的數(shù)據(jù)格式進(jìn)行數(shù)據(jù)交互,根據(jù) 各計(jì)算節(jié)點(diǎn)上運(yùn)行任務(wù)所需數(shù)據(jù)量大小可將全局寄存器文件動(dòng)態(tài)劃分出相應(yīng)的 寄存器空間,用于計(jì)算節(jié)點(diǎn)間的數(shù)據(jù)交換;對(duì)寄存器文件控制器和存儲(chǔ)簇的訪 問(wèn)通過(guò)寄存器文件的物理地址進(jìn)行控制,在使用寄存器文件時(shí),直接通過(guò)交叉 總線按照寄存器文件的物理地址進(jìn)行訪問(wèn),寄存器文件控制器與存儲(chǔ)簇之間使 用的接口即為存儲(chǔ)簇的物理地址,也就是寄存器文件的物理地址,例如在對(duì)寄存器文件1中的第1號(hào)存儲(chǔ)簇進(jìn)行訪問(wèn)時(shí),其訪問(wèn)的接口地址為000001000001, 寄存器文件6中的第6號(hào)存儲(chǔ)簇進(jìn)行訪問(wèn)時(shí),其訪問(wèn)的接口地址為 000110000110。
對(duì)全局寄存器文件同一區(qū)域的讀取與寫入操作是不能同時(shí)進(jìn)行的,但是當(dāng) 一個(gè)計(jì)算節(jié)點(diǎn)完成寫入后,其它計(jì)算節(jié)點(diǎn)可以同時(shí)讀取數(shù)據(jù),共享寄存器文件 中不同區(qū)域之間的讀/寫操作可以同時(shí)進(jìn)行。
在多個(gè)計(jì)算節(jié)點(diǎn)同時(shí)使用全局寄存器文件執(zhí)行任務(wù)流中的任務(wù)時(shí),可以根 據(jù)不同計(jì)算節(jié)點(diǎn)所執(zhí)行任務(wù)的優(yōu)先級(jí)高低,優(yōu)先將全局寄存器文件空間分配給 優(yōu)先級(jí)較高的計(jì)算節(jié)點(diǎn),若計(jì)算節(jié)點(diǎn)在執(zhí)行任務(wù)時(shí)所需要交換的數(shù)據(jù)量變化較 大,還可根據(jù)全局寄存器文件中剩余空間大小進(jìn)行動(dòng)態(tài)調(diào)整,根據(jù)優(yōu)先級(jí)高低 盡可能的滿足所有計(jì)算節(jié)點(diǎn)的數(shù)據(jù)量需求。
各計(jì)算節(jié)點(diǎn)之間進(jìn)行數(shù)據(jù)交換時(shí),首先將待交換數(shù)據(jù)存放至全局寄存器文 件的指定區(qū)域,然后再由需要接收數(shù)據(jù)的計(jì)算節(jié)點(diǎn)從全局寄存器文件中的指定 區(qū)域中讀出。
局部寄存器文件對(duì)任務(wù)操作的所有操作數(shù)和中間結(jié)果進(jìn)行暫存,各任務(wù)流 處理部件通過(guò)各計(jì)算節(jié)點(diǎn)內(nèi)的交叉總線傳遞并緩存到局部寄存器文件中,計(jì)算 節(jié)點(diǎn)在計(jì)算過(guò)程中,各任務(wù)流處理部件不需要去訪問(wèn)外部存儲(chǔ)器或全局寄存器 文件,只有在各計(jì)算節(jié)點(diǎn)間需要數(shù)據(jù)交互時(shí),才將結(jié)果寫回全局寄存器文件或 外部存儲(chǔ)器。局部寄存器增強(qiáng)了各任務(wù)流處理部件之間的數(shù)據(jù)局部性,提供了 計(jì)算節(jié)點(diǎn)內(nèi)的快速數(shù)據(jù)交換能力。
本發(fā)明的有益效果
1、 本發(fā)明靈活運(yùn)用了計(jì)算機(jī)系統(tǒng)中存儲(chǔ)能力、計(jì)算能力和通信能力間 的可交換性思想,具有時(shí)延小、易于擴(kuò)展和便于配置管理的優(yōu)點(diǎn)。
2、 本發(fā)明采用全局共享和局部私有兩級(jí)寄存器文件層次結(jié)構(gòu),突破了 當(dāng)前高性能計(jì)算系統(tǒng)設(shè)計(jì)中通常所采用的互連網(wǎng)絡(luò)單一數(shù)據(jù)通信模式,是一種 不受網(wǎng)絡(luò)直徑限制,比以往MPP耦合網(wǎng)絡(luò)結(jié)構(gòu)和Cluster松耦合網(wǎng)絡(luò)結(jié)構(gòu)更加穩(wěn) 定、高效的數(shù)據(jù)交換結(jié)構(gòu),能夠隨用戶數(shù)據(jù)的動(dòng)態(tài)變換而動(dòng)態(tài)調(diào)整自身結(jié)構(gòu)。 同時(shí),該結(jié)構(gòu)具有良好的可擴(kuò)展性,在運(yùn)行過(guò)程中能夠動(dòng)態(tài)分配使用,充分體 現(xiàn)了用存儲(chǔ)資源換取快速數(shù)據(jù)通信能力的思想,實(shí)現(xiàn)了存儲(chǔ)和通信的互相轉(zhuǎn)化。3、 本發(fā)明采用了寄存器文件的形式實(shí)現(xiàn)計(jì)算資源之間的高速數(shù)據(jù)交換, 該數(shù)據(jù)交換結(jié)構(gòu)采用了兩級(jí)寄存器文件層次,具有全交換選擇數(shù)據(jù)交換、高速 存儲(chǔ)交換等技術(shù)優(yōu)點(diǎn),靈活運(yùn)用了計(jì)算機(jī)系統(tǒng)中存儲(chǔ)、計(jì)算和通信能力間的可 交換性,以存儲(chǔ)代價(jià)換取了高速數(shù)據(jù)通信能力,保證各層次計(jì)算所需要的數(shù)據(jù) 帶寬,使得高效能計(jì)算系統(tǒng)能夠充分發(fā)揮其潛在的強(qiáng)大計(jì)算能力,有效提高系 統(tǒng)擴(kuò)展的性能價(jià)格比。
(四)

圖1為基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的示意圖2為基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的內(nèi)部詳細(xì)結(jié)構(gòu)示意圖。
(五) 具體實(shí)施例方式
參見(jiàn)圖1 圖2, 一種基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu),含有全局寄存 器文件和n個(gè)計(jì)算節(jié)點(diǎn),n為自然數(shù),每個(gè)計(jì)算節(jié)點(diǎn)通過(guò)專用總線分別與全局寄 存器文件連接,每個(gè)計(jì)算節(jié)點(diǎn)之間的專用總線不存在交叉或共用,全局寄存器 的帶寬遠(yuǎn)高于存儲(chǔ)帶寬,因此全局寄存器增強(qiáng)了各計(jì)算節(jié)點(diǎn)間的數(shù)據(jù)局部性, 提供了快速數(shù)據(jù)交換能力。
計(jì)算節(jié)點(diǎn)含有局部寄存器文件和不同層次的任務(wù)流處理部件,任務(wù)流處理 部件之間以及任務(wù)流處理部件與局部寄存器文件之間通過(guò)交叉總線連接。
總線按其功能可以分成專用總線和非專用總線,都屬于數(shù)據(jù)總線。專用總 線是指只連接一對(duì)物理部件的總線,從物理位置上來(lái)說(shuō)屬于外總線的一種,在 此,專用總線是連接計(jì)算節(jié)點(diǎn)和全局寄存器文件,進(jìn)行數(shù)據(jù)傳輸?shù)耐ǖ馈?br> 交叉總線從物理位置上來(lái)說(shuō)屬于內(nèi)總線。計(jì)算節(jié)點(diǎn)內(nèi)的各任務(wù)流處理部件 之間、任務(wù)流處理部件與局部寄存器文件之間均通過(guò)交叉總線進(jìn)行互聯(lián)。交叉 總線為各個(gè)任務(wù)流處理部件之間的數(shù)據(jù)交互、任務(wù)流處理部件與局部寄存器文 件之間的數(shù)據(jù)交互提供了傳輸通道。
局部寄存器文件通過(guò)寄存器文件邏輯端口接交叉總線,局部寄存器文件根 據(jù)計(jì)算節(jié)點(diǎn)的層次結(jié)構(gòu),為計(jì)算節(jié)點(diǎn)中的各個(gè)任務(wù)流處理部件提供可訪問(wèn)的寄 存器文件邏輯端口;全局寄存器文件通過(guò)寄存器文件邏輯端口接專用總線,全 局寄存器文件為不同的計(jì)算節(jié)點(diǎn)提供不同的寄存器文件邏輯端口,為同一計(jì)算 節(jié)點(diǎn)中不同的任務(wù)流處理部件提供單一的物理端口,通過(guò)時(shí)間分片為不同的任務(wù)流處理部件提供可同時(shí)訪問(wèn)的寄存器文件邏輯端口 。
全局寄存器文件為存儲(chǔ)各計(jì)算節(jié)點(diǎn)中間結(jié)果的寄存器文件組,局部寄存器 文件為存儲(chǔ)計(jì)算節(jié)點(diǎn)內(nèi)進(jìn)行任務(wù)處理時(shí)的所有操作數(shù)和中間結(jié)果的寄存器文件
組,任務(wù)流處理部件含有FPGA陣列、CPU陣列、GPU陣列、共享存儲(chǔ)器加速 裝置Shared memory accelerator、 多核共享快速緩沖忙存區(qū) Cache shared multi畫(huà)core、主存儲(chǔ)器Main memory禾口存儲(chǔ)器Storage 。
寄存器文件組含有m個(gè)寄存器文件,每個(gè)寄存器文件含有寄存器文件控制 器和k個(gè)存儲(chǔ)簇,存儲(chǔ)簇由寄存器構(gòu)成,m和k為自然數(shù),寄存器文件控制器 通過(guò)統(tǒng)一的交叉總線連接,存儲(chǔ)簇之間通過(guò)數(shù)據(jù)總線進(jìn)行連接,寄存器文件控 制器和存儲(chǔ)簇之間采用集中式的串行鏈接方式。
基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)具有靈活的交換方式和良好的可擴(kuò)展 性,能夠在任務(wù)執(zhí)行過(guò)程中動(dòng)態(tài)分配使用寄存器文件資源,支持存儲(chǔ)資源換取 計(jì)算資源和數(shù)據(jù)交換資源的實(shí)現(xiàn),充分體現(xiàn)了存儲(chǔ)和通信互相轉(zhuǎn)化的思想。
一種對(duì)所述基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的管理方法,具體為每 一個(gè)計(jì)算節(jié)點(diǎn)均可以對(duì)全局寄存器文件進(jìn)行共享訪問(wèn),以發(fā)掘各計(jì)算節(jié)點(diǎn)間的 任務(wù)流數(shù)據(jù)重用,全局寄存器文件的大小可以根據(jù)計(jì)算節(jié)點(diǎn)的資源規(guī)模進(jìn)行動(dòng) 態(tài)分配和調(diào)整,當(dāng)計(jì)算節(jié)點(diǎn)內(nèi)各任務(wù)流處理部件間進(jìn)行數(shù)據(jù)通信時(shí),局部寄存 器文件為相應(yīng)的數(shù)據(jù)交換提供支持。
計(jì)算節(jié)點(diǎn)與全局寄存器文件之間采用統(tǒng)一的數(shù)據(jù)格式進(jìn)行數(shù)據(jù)交互,根據(jù) 各計(jì)算節(jié)點(diǎn)上運(yùn)行任務(wù)所需數(shù)據(jù)量大小可將全局寄存器文件動(dòng)態(tài)劃分出相應(yīng)的 寄存器空間,用于計(jì)算節(jié)點(diǎn)間的數(shù)據(jù)交換;對(duì)寄存器文件控制器和存儲(chǔ)簇的訪 問(wèn)通過(guò)寄存器文件的物理地址進(jìn)行控制,在使用寄存器文件時(shí),直接通過(guò)交叉 總線按照寄存器文件的物理地址進(jìn)行訪問(wèn),寄存器文件控制器與存儲(chǔ)簇之間使 用的接口即為存儲(chǔ)簇的物理地址,也就是寄存器文件的物理地址,例如在對(duì)寄 存器文件1中的第1號(hào)存儲(chǔ)簇進(jìn)行訪問(wèn)時(shí),其訪問(wèn)的接口地址為000001000001, 寄存器文件6中的第6號(hào)存儲(chǔ)簇進(jìn)行訪問(wèn)時(shí),其訪問(wèn)的接口地址為 000110000110。
對(duì)全局寄存器文件同一區(qū)域的讀取與寫入操作是不能同時(shí)進(jìn)行的,但是一個(gè)計(jì)算節(jié)點(diǎn)完成寫入后,其它計(jì)算節(jié)點(diǎn)可以同時(shí)讀取數(shù)據(jù),共享寄存器文件 中不同區(qū)域之間的讀/寫操作可以同時(shí)進(jìn)行。
在多個(gè)計(jì)算節(jié)點(diǎn)同時(shí)使用全局寄存器文件執(zhí)行任務(wù)流中的任務(wù)時(shí),可以根 據(jù)不同計(jì)算節(jié)點(diǎn)所執(zhí)行任務(wù)的優(yōu)先級(jí)高低,優(yōu)先將全局寄存器文件空間分配給 優(yōu)先級(jí)較高的計(jì)算節(jié)點(diǎn),若計(jì)算節(jié)點(diǎn)在執(zhí)行任務(wù)時(shí)所需要交換的數(shù)據(jù)量變化較 大,還可根據(jù)全局寄存器文件中剩余空間大小進(jìn)行動(dòng)態(tài)調(diào)整,根據(jù)優(yōu)先級(jí)高低 盡可能的滿足所有計(jì)算節(jié)點(diǎn)的數(shù)據(jù)量需求。
各計(jì)算節(jié)點(diǎn)之間進(jìn)行數(shù)據(jù)交換時(shí),首先將待交換數(shù)據(jù)存放至全局寄存器文 件的指定區(qū)域,然后再由需要接收數(shù)據(jù)的計(jì)算節(jié)點(diǎn)從全局寄存器文件中的指定 區(qū)域中讀出。
計(jì)算節(jié)點(diǎn)是用于執(zhí)行任務(wù)流中不同任務(wù)的基本單元,它含有不同層次的任 務(wù)流處理部件,計(jì)算節(jié)點(diǎn)內(nèi)部的各計(jì)算層次之間的數(shù)據(jù)交互通過(guò)局部寄存器文 件進(jìn)行。局部寄存器文件對(duì)任務(wù)操作的所有操作數(shù)和中間結(jié)果進(jìn)行暫存,各任 務(wù)流處理部件通過(guò)各計(jì)算節(jié)點(diǎn)內(nèi)的交叉總線傳遞并緩存到局部寄存器文件中, 其運(yùn)行機(jī)制與全局寄存器文件的數(shù)據(jù)交互方式相同。
計(jì)算節(jié)點(diǎn)在計(jì)算過(guò)程中,各任務(wù)流處理部件不需要去訪問(wèn)外部存儲(chǔ)器或全 局寄存器文件,只有在各計(jì)算節(jié)點(diǎn)間需要數(shù)據(jù)交互時(shí),才將結(jié)果寫回全局寄存 器文件或外部存儲(chǔ)器,比如,對(duì)任務(wù)流的所有操作全部執(zhí)行完畢后,才將結(jié)果 寫回外部存儲(chǔ)器。局部寄存器增強(qiáng)了各任務(wù)流處理部件之間的數(shù)據(jù)局部性,提 供了計(jì)算節(jié)點(diǎn)內(nèi)的快速數(shù)據(jù)交換能力。
權(quán)利要求
1、一種基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu),其特征是含有全局寄存器文件和n個(gè)計(jì)算節(jié)點(diǎn),n為自然數(shù),每個(gè)計(jì)算節(jié)點(diǎn)通過(guò)專用總線分別與全局寄存器文件連接,計(jì)算節(jié)點(diǎn)含有局部寄存器文件和不同層次的任務(wù)流處理部件,任務(wù)流處理部件之間以及任務(wù)流處理部件與局部寄存器文件之間通過(guò)交叉總線連接。
2. 根據(jù)權(quán)利要求1所述的基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu),其特征是局部寄存器文件通過(guò)寄存器文件邏輯端口接交叉總線,局部寄存器文件根據(jù)計(jì)算節(jié)點(diǎn)的層次結(jié)構(gòu),為計(jì)算節(jié)點(diǎn)中的各個(gè)任務(wù)流處理部件提供可訪問(wèn)的寄存器文件邏輯端口;全局寄存器文件通過(guò)寄存器文件邏輯端口接專用總線,全 局寄存器文件為不同的計(jì)算節(jié)點(diǎn)提供不同的寄存器文件邏輯端口,為同一計(jì)算 節(jié)點(diǎn)中不同的任務(wù)流處理部件提供單一的物理端口,通過(guò)時(shí)間分片為不同的任 務(wù)流處理部件提供可同時(shí)訪問(wèn)的寄存器文件邏輯端口 。
3. 根據(jù)權(quán)利要求1或2所述的基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu),其 特征是全局寄存器文件為存儲(chǔ)各計(jì)算節(jié)點(diǎn)中間結(jié)果的寄存器文件組,局部寄 存器文件為存儲(chǔ)計(jì)算節(jié)點(diǎn)內(nèi)進(jìn)行任務(wù)處理時(shí)的所有操作數(shù)和中間結(jié)果的寄存器 文件組,任務(wù)流處理部件含有FPGA陣列、CPU陣列、GPU陣列、共享存儲(chǔ)器 加速裝置Shared memory accelerator多核共享快速緩沖貯存區(qū)Cache shared multi-core、主存儲(chǔ)器Main memory禾口存儲(chǔ)器Storage 。
4. 根據(jù)權(quán)利要求3所述的基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu),其特征 是所述寄存器文件組含有m個(gè)寄存器文件,每個(gè)寄存器文件含有寄存器文件 控制器和k個(gè)存儲(chǔ)簇,存儲(chǔ)簇由寄存器構(gòu)成,m和k為自然數(shù),寄存器文件控 制器通過(guò)統(tǒng)一的交叉總線連接,存儲(chǔ)簇之間通過(guò)數(shù)據(jù)總線進(jìn)行連接,寄存器文 件控制器和存儲(chǔ)簇之間采用集中式的串行鏈接方式。
5. —種對(duì)權(quán)利要求1所述的基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的管理 方法,其特征是所述每一個(gè)計(jì)算節(jié)點(diǎn)均可以對(duì)全局寄存器文件進(jìn)行共享訪問(wèn), 以發(fā)掘各計(jì)算節(jié)點(diǎn)間的任務(wù)流數(shù)據(jù)重用,全局寄存器文件的大小可以根據(jù)計(jì)算節(jié)點(diǎn)的資源規(guī)模進(jìn)行動(dòng)態(tài)分配和調(diào)整,當(dāng)計(jì)算節(jié)點(diǎn)內(nèi)各任務(wù)流處理部件間進(jìn)行 數(shù)據(jù)通信時(shí),局部寄存器文件為相應(yīng)的數(shù)據(jù)交換提供支持。
6. 根據(jù)權(quán)利要求5所述的對(duì)基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的管理方法,其特征是計(jì)算節(jié)點(diǎn)與全局寄存器文件之間采用統(tǒng)一的數(shù)據(jù)格式進(jìn)行數(shù) 據(jù)交互,根據(jù)各計(jì)算節(jié)點(diǎn)上運(yùn)行任務(wù)所需數(shù)據(jù)量大小可將全局寄存器文件動(dòng)態(tài) 劃分出相應(yīng)的寄存器空間,用于計(jì)算節(jié)點(diǎn)間的數(shù)據(jù)交換;對(duì)寄存器文件控制器 和存儲(chǔ)簇的訪問(wèn)通過(guò)寄存器文件的物理地址進(jìn)行控制,在使用寄存器文件時(shí), 直接通過(guò)交叉總線按照寄存器文件的物理地址進(jìn)行訪問(wèn),寄存器文件控制器與 存儲(chǔ)簇之間使用的接口即為存儲(chǔ)簇的物理地址,也就是寄存器文件的物理地址。
7. 根據(jù)權(quán)利要求5或6所述的對(duì)基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的 管理方法,其特征是對(duì)全局寄存器文件同一區(qū)域的讀取與寫入操作是不能同 時(shí)進(jìn)行的,但是當(dāng)一個(gè)計(jì)算節(jié)點(diǎn)完成寫入后,其它計(jì)算節(jié)點(diǎn)可以同時(shí)讀取數(shù)據(jù), 共享寄存器文件中不同區(qū)域之間的讀/寫操作可以同時(shí)進(jìn)行。
8. 根據(jù)權(quán)利要求5或6所述的對(duì)基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的 管理方法,其特征是在多個(gè)計(jì)算節(jié)點(diǎn)同時(shí)使用全局寄存器文件執(zhí)行任務(wù)流中 的任務(wù)時(shí),可以根據(jù)不同計(jì)算節(jié)點(diǎn)所執(zhí)行任務(wù)的優(yōu)先級(jí)高低,優(yōu)先將全局寄存 器文件空間分配給優(yōu)先級(jí)較高的計(jì)算節(jié)點(diǎn),若計(jì)算節(jié)點(diǎn)在執(zhí)行任務(wù)時(shí)所需要交 換的數(shù)據(jù)量變化較大,還可根據(jù)全局寄存器文件中剩余空間大小進(jìn)行動(dòng)態(tài)調(diào)整, 根據(jù)優(yōu)先級(jí)高低盡可能的滿足所有計(jì)算節(jié)點(diǎn)的數(shù)據(jù)量需求。
9. 根據(jù)權(quán)利要求5或6所述的對(duì)基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)的 管理方法,其特征是各計(jì)算節(jié)點(diǎn)之間進(jìn)行數(shù)據(jù)交換時(shí),首先將待交換數(shù)據(jù)存 放至全局寄存器文件的指定區(qū)域,然后再由需要接收數(shù)據(jù)的計(jì)算節(jié)點(diǎn)從全局寄 存器文件中的指定區(qū)域中讀出。
10. 根據(jù)權(quán)利要求5或6所述的對(duì)基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu) 的管理方法,其特征是局部寄存器文件對(duì)任務(wù)操作的所有操作數(shù)和中間結(jié)果 進(jìn)行暫存,各任務(wù)流處理部件通過(guò)各計(jì)算節(jié)點(diǎn)內(nèi)的交叉總線傳遞并緩存到局部 寄存器文件中,計(jì)算節(jié)點(diǎn)在計(jì)算過(guò)程中,各任務(wù)流處理部件不需要去訪問(wèn)外部 存儲(chǔ)器或全局寄存器文件,只有在各計(jì)算節(jié)點(diǎn)間需要數(shù)據(jù)交互時(shí),才將結(jié)果寫 回全局寄存器文件或外部存儲(chǔ)器。
全文摘要
本發(fā)明涉及一種基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)及其管理方法;基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)含有全局寄存器文件和n個(gè)計(jì)算節(jié)點(diǎn),每個(gè)計(jì)算節(jié)點(diǎn)通過(guò)專用總線分別與全局寄存器文件連接,計(jì)算節(jié)點(diǎn)含有局部寄存器文件和不同層次的任務(wù)流處理部件,任務(wù)流處理部件之間以及任務(wù)流處理部件與局部寄存器文件之間通過(guò)交叉總線連接;對(duì)該結(jié)構(gòu)的管理方法為每一個(gè)計(jì)算節(jié)點(diǎn)均可以對(duì)全局寄存器文件進(jìn)行共享訪問(wèn),全局寄存器文件的大小可以根據(jù)計(jì)算節(jié)點(diǎn)的資源規(guī)模進(jìn)行動(dòng)態(tài)分配和調(diào)整;本發(fā)明提供了一種面向任務(wù)流的可應(yīng)用于高效能計(jì)算系統(tǒng)中的易擴(kuò)展、高帶寬、低延遲的基于寄存器文件的快速數(shù)據(jù)交換結(jié)構(gòu)及其管理方法。
文檔編號(hào)G06F13/36GK101441616SQ20081023101
公開(kāi)日2009年5月27日 申請(qǐng)日期2008年11月24日 優(yōu)先權(quán)日2008年11月24日
發(fā)明者龐建民, 丹 張, 斯雪明, 韓文報(bào) 申請(qǐng)人:中國(guó)人民解放軍信息工程大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
当涂县| 双辽市| 万盛区| 佛山市| 翁源县| 肇州县| 光山县| 牟定县| 云龙县| 高唐县| 东宁县| 安义县| 普兰店市| 乌苏市| 咸宁市| 平顶山市| 陵水| 武平县| 汉阴县| 溧阳市| 云南省| 容城县| 鸡西市| 武功县| 车险| 兴城市| 东海县| 武陟县| 华容县| 丰都县| 海晏县| 望城县| 铜梁县| 江川县| 紫云| 宁德市| 将乐县| 湖州市| 霍州市| 井陉县| 怀来县|