两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

采用隱式求解的眾核流水線并行方法

文檔序號(hào):9432258閱讀:684來源:國(guó)知局
采用隱式求解的眾核流水線并行方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及計(jì)算機(jī)技術(shù)領(lǐng)域,具體設(shè)及一種采用隱式求解的眾核流水線并行方 法。
【背景技術(shù)】
[0002] 隱式算法(implicitalgorithm)指的是,在將微分方程轉(zhuǎn)化為代數(shù)方程的過程 中,如果求解某時(shí)刻函數(shù)值需要用到該時(shí)刻的變量,那么運(yùn)種離散方法即為隱式算法。
[0003] 在數(shù)值計(jì)算中,隱式算法由于穩(wěn)定性好、收斂速度快等優(yōu)點(diǎn)得到廣泛應(yīng)用。采用隱 式算法對(duì)微分方程進(jìn)行離散,最終歸結(jié)為分塊并行求解大型稀疏矩陣線性代數(shù)方程組。如 果采用兩步掃描格式,即LU-SGS方法求解線性代數(shù)方程組,將得到遞歸方程,在給定邊界 條件后,采用遞推方法求解。隱式求解得到的方程組在空間方向有嚴(yán)格的相關(guān)性,并行較為 困難。
[0004] 近年來,高性能計(jì)算正在從多核CPU并行計(jì)算模式向CP化眾核的多級(jí)并行計(jì)算模 式發(fā)展。基于眾核的高性能并行計(jì)算技術(shù)在科學(xué)與工程數(shù)值計(jì)算領(lǐng)域顯現(xiàn)出巨大的利用價(jià) 值,能夠在保證計(jì)算精度的情況下,大幅縮短復(fù)雜物理問題的計(jì)算時(shí)間。但是眾核處理器并 行度高,每個(gè)計(jì)算核屯、存儲(chǔ)資源有限,計(jì)算核屯、之間數(shù)據(jù)交互復(fù)雜,因此在眾核處理器上實(shí) 現(xiàn)隱式算法的并行難度更大。 陽〇化]目前眾核處理器上的多數(shù)應(yīng)用都是采用顯式數(shù)值算法,隱式算法的眾核應(yīng)用非常 有限,僅能做到部分并行,無法使整個(gè)計(jì)算區(qū)域整體求解,因此無法保證算法的嚴(yán)格隱式, 對(duì)數(shù)值計(jì)算的穩(wěn)定性和收斂性都造成較大影響。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明所要解決的技術(shù)問題是針對(duì)現(xiàn)有技術(shù)中存在上述缺陷,提供一種采用隱式 求解的眾核流水線并行方法,其能夠在眾核處理器的各計(jì)算核屯、之間通過流水線并行,實(shí) 現(xiàn)隱式算法中空間結(jié)點(diǎn)的關(guān)聯(lián),保證串并行結(jié)果的嚴(yán)格一致,最大限度地保留隱式算法較 高的穩(wěn)定性和收斂性。
[0007] 根據(jù)本發(fā)明,提供了一種采用隱式求解的眾核流水線并行方法,包括:
[0008] 第一步驟:在眾核處理器的P個(gè)計(jì)算核屯、上將變量曰1,,沿i方向劃分?jǐn)?shù)據(jù),使得變 量3i,.j被分成P段,其中P為大于1的整數(shù),而且將{ai,.j,i=郵,…,rvi-U存儲(chǔ)在計(jì)算核 屯、化上,其中k= 0,…,p-1,并且 1 =n〇<rii<w<rip1=n+1 ;
[0009] 第二步驟:采用計(jì)算核屯、間寄存器通信實(shí)現(xiàn)流水線并行。
[0010] 優(yōu)選地,第二步驟包括:在沿j方向的循環(huán)中,使得非0號(hào)計(jì)算核屯、Pk從前一個(gè)計(jì) 算核屯、化U處取數(shù)據(jù)>并開始沿i方向的循環(huán),在沿i方向的循環(huán)中根據(jù)遞歸函數(shù)計(jì) 算=F(aii,.j),然后結(jié)束沿i方向的循環(huán);隨后,計(jì)算核屯、化向后一個(gè)計(jì)算核屯、PW發(fā) 送數(shù)據(jù)此后結(jié)束沿j方向的循環(huán)。 W11] 優(yōu)選地,變量a;,/沿j方向計(jì)算相互獨(dú)立。
[0012] 優(yōu)選地,變量曰1,,沿i方向的計(jì)算存在著向前依賴關(guān)系。
【附圖說明】
[0013] 結(jié)合附圖,并通過參考下面的詳細(xì)描述,將會(huì)更容易地對(duì)本發(fā)明有更完整的理解 并且更容易地理解其伴隨的優(yōu)點(diǎn)和特征,其中:
[0014] 圖1示意性地示出了局部相關(guān)的遞歸問題圖示。
[0015] 圖2示意性地示出了根據(jù)本發(fā)明優(yōu)選實(shí)施例的采用隱式求解的眾核流水線并行 方法的具體示例的流程圖。
[0016] 需要說明的是,附圖用于說明本發(fā)明,而非限制本發(fā)明。注意,表示結(jié)構(gòu)的附圖可 能并非按比例繪制。并且,附圖中,相同或者類似的元件標(biāo)有相同或者類似的標(biāo)號(hào)。
【具體實(shí)施方式】
[0017] 為了使本發(fā)明的內(nèi)容更加清楚和易懂,下面結(jié)合具體實(shí)施例和附圖對(duì)本發(fā)明的內(nèi) 容進(jìn)行詳細(xì)描述。
[0018] 本發(fā)明主要針對(duì)眾核處理器,采用流水線并行解決隱式求解帶來的分塊遞歸相關(guān) 性問題,保證隱式求解串并行計(jì)算結(jié)果嚴(yán)格一致,從而保留隱式求解的穩(wěn)定性和收斂性優(yōu) 勢(shì),擴(kuò)大眾核處理器的應(yīng)用范圍。其中,流水線并行是運(yùn)樣一種并行技術(shù),其基本思想是將 一個(gè)計(jì)算任務(wù)分成一系列的階段,一旦前面的階段完成,后繼的階段立即開始,處理多個(gè)計(jì) 算任務(wù)時(shí),流水線并行能夠支持與階段數(shù)相同的并行性。
[0019] 下面參考附圖并且W-個(gè)局部相關(guān)的遞歸問題為例,闡述眾核處理器上流水線并 行算法所對(duì)應(yīng)的方法處理。
[0020] 隱式算法離散后得到遞歸方程組,各變量之間存在相關(guān)性,需要求解出一個(gè)變量 后再計(jì)算另一個(gè)變量,依次求解。如求出變量a。,,,才能計(jì)算變量曰1,,,然后依次計(jì)算曰1,,= F(aii= 1,…,n,j= 1,…,m。其中n和m分別為i和j方向的網(wǎng)格單元數(shù),其中FQ 是遞歸方程。其中,i方向和j方向是相互獨(dú)立的兩個(gè)方向。
[0021] 如圖1所示,沿j方向計(jì)算相互獨(dú)立,沿i方向的計(jì)算存在著向前依賴關(guān)系(遞歸 關(guān)系),無法獨(dú)立進(jìn)行。當(dāng)數(shù)據(jù)在眾核處理器的各計(jì)算核屯、之間的劃分僅沿j方向進(jìn)行時(shí), 計(jì)算完全并行。因此,需要考慮當(dāng)沿i方向進(jìn)行數(shù)據(jù)劃分時(shí)遞歸問題的并行算法。不失一 般性,假設(shè)在眾核處理器的P個(gè)計(jì)算核屯、上沿i方向劃分?jǐn)?shù)據(jù),使得變量曰1,,被分成P段(P 為大于1的整數(shù)),其中i=郵,…,心-叫存儲(chǔ)在計(jì)算核屯、化上,k= 0,…,p-1,運(yùn) 里1 =n"<ni<w<np1=n+1。采用計(jì)算核屯、間寄存器通信實(shí)現(xiàn)流水線并行。
[0022] 在沿j方向的循環(huán)中,使得非0號(hào)計(jì)算核屯、化從前一個(gè)計(jì)算核屯、PW處取數(shù)據(jù) 0,4^1,,并開始沿i方向的循環(huán),在沿i方向的循環(huán)中根據(jù)遞歸函數(shù)計(jì)算曰1,,: =F(ai1, ,), 然后結(jié)束沿i方向的循環(huán);隨后,計(jì)算核屯、化向后一個(gè)計(jì)算核屯、PW發(fā)送數(shù)據(jù);此后 結(jié)束沿j方向的循環(huán)。
[0023] 例如,計(jì)算流程示例如下:
[0024]
[00巧]通過計(jì)算核屯、間流水線并行,實(shí)現(xiàn)了遞歸方程組各變量之間順序計(jì)算,從而保證 了眾核并行計(jì)算結(jié)果與串行計(jì)算結(jié)果的一致性。
[0026] 相應(yīng)地,圖2示意性地示出了根據(jù)本發(fā)明優(yōu)選實(shí)施例的采用隱式求解的眾核流水 線并行方法的具體示例的流程圖。
[0027] 如圖2所示,根據(jù)本發(fā)明優(yōu)選實(shí)施例的采用隱式求解的眾核流水線并行方法包 括:
[0028] 第一步驟S1 :在眾核處理器的P個(gè)計(jì)算核屯、上將變量曰1,,沿i方向劃分?jǐn)?shù)據(jù),使得 變量曰1,.,被分成P段,其中P為大于1的整數(shù),而且將{a1,.,,i=也…,nw-1}存儲(chǔ)在計(jì)算 核屯、化上,其中k= 0,…,p-1,并且 1 =n〇<ni<...<rip1=n+1 ;
[0029] 第二步驟S2 :采用計(jì)算核屯、間寄存器通信實(shí)現(xiàn)流水線并行。
[0030] 具體地,例如,第二步驟S2包括下述步驟:在沿j方向的循環(huán)中,使得非0號(hào)計(jì)算 核屯、化從前一個(gè)計(jì)算核屯、PW處取數(shù)據(jù)并開始沿i方向的循環(huán),在沿i方向的循環(huán) 中根據(jù)遞歸函數(shù)計(jì)算曰1,,: =F(曰1 1,,),然后結(jié)束沿i方向的循環(huán);隨后,計(jì)算核屯、化向后一 個(gè)計(jì)算核屯、化U發(fā)送數(shù)據(jù)《心1-1, ^此后結(jié)束沿j方向的循環(huán)。
[0031] 本發(fā)明使用流水線并行算法實(shí)現(xiàn)隱式求解在眾核處理器上的應(yīng)用,其中通過各計(jì) 算核屯、間寄存器通信實(shí)現(xiàn)流水線并行的方式,而且通過流水線并行解決遞歸方程組求解的 相關(guān)性問題,保證隱式數(shù)值算法的串并行完全一致,實(shí)現(xiàn)隱式算法在眾核處理器上的應(yīng)用。
[0032] 本發(fā)明的優(yōu)點(diǎn)包括:眾核處理器上的多數(shù)應(yīng)用都是采用顯式數(shù)值算法,隱式算法 的眾核應(yīng)用非常有限,僅能做到部分并行,無法使整個(gè)計(jì)算區(qū)域整體求解。采用本發(fā)明,能 夠有效解決遞歸方程組求解的相關(guān)性問題,保證隱式數(shù)值算法的串并行完全一致,從而最 大限度地保留隱式算法較高的穩(wěn)定性和收斂性,實(shí)現(xiàn)隱式算法在眾核處理器上的應(yīng)用。
[003引此外,需要說明的是,除非特別指出,否則說明書中的術(shù)語"第一"、"第二"、"第立" 等描述僅僅用于區(qū)分說明書中的各個(gè)組件、元素、步驟等,而不是用于表示各個(gè)組件、元素、 步驟之間的邏輯關(guān)系或者順序關(guān)系等。
[0034] 可W理解的是,雖然本發(fā)明已W較佳實(shí)施例披露如上,然而上述實(shí)施例并非用W 限定本發(fā)明。對(duì)于任何熟悉本領(lǐng)域的技術(shù)人員而言,在不脫離本發(fā)明技術(shù)方案范圍情況下, 都可利用上述掲示的技術(shù)內(nèi)容對(duì)本發(fā)明技術(shù)方案作出許多可能的變動(dòng)和修飾,或修改為等 同變化的等效實(shí)施例。因此,凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì) w上實(shí)施例所做的任何簡(jiǎn)單修改、等同變化及修飾,均仍屬于本發(fā)明技術(shù)方案保護(hù)的范圍 內(nèi)。
【主權(quán)項(xiàng)】
1. 一種采用隱式求解的眾核流水線并行方法,其特征在于包括: 第一步驟:在眾核處理器的P個(gè)計(jì)算核心上將變量\ ,沿i方向劃分?jǐn)?shù)據(jù),使得變量 被分成p段,其中p為大于1的整數(shù),而且將{a^,i = nk, ???,rik+fl}存儲(chǔ)在計(jì)算核心 Pk 上,其中 k = Ο, 并且 I = 〈…<np 丨=n+1 ; 第二步驟:采用計(jì)算核心間寄存器通信實(shí)現(xiàn)流水線并行。2. 根據(jù)權(quán)利要求1所述的采用隱式求解的眾核流水線并行方法,其特征在于,第二步 驟包括:在沿j方向的循環(huán)中,使得非0號(hào)計(jì)算核心P k從前一個(gè)計(jì)算核心P k+1處取數(shù)據(jù) aW-Us并開始沿i方向的循環(huán),在沿i方向的循環(huán)中根據(jù)遞歸函數(shù)計(jì)算au: = F(a; U),然 后結(jié)束沿i方向的循環(huán);隨后,計(jì)算核心Pk向后一個(gè)計(jì)算核心P k+1發(fā)送數(shù)據(jù)此后結(jié) 束沿j方向的循環(huán)。3. 根據(jù)權(quán)利要求1或2所述的采用隱式求解的眾核流水線并行方法,其特征在于,變量 沿j方向計(jì)算相互獨(dú)立。4. 根據(jù)權(quán)利要求1或2所述的采用隱式求解的眾核流水線并行方法,其特征在于,變量 ay沿i方向的計(jì)算存在著向前依賴關(guān)系。
【專利摘要】本發(fā)明提供了一種采用隱式求解的眾核流水線并行方法,包括:在眾核處理器的p個(gè)計(jì)算核心上將變量ai,j沿i方向劃分?jǐn)?shù)據(jù),使得變量ai,j被分成p段,其中p為大于1的整數(shù),而且將{ai,j,i=nk,…,nk+1-1}存儲(chǔ)在計(jì)算核心pk上,其中k=0,…,p-1,并且1=n0&lt;n1&lt;…&lt;np-1=n+1;采用計(jì)算核心間寄存器通信實(shí)現(xiàn)流水線并行。
【IPC分類】G06F9/38
【公開號(hào)】CN105183434
【申請(qǐng)?zhí)枴緾N201510661925
【發(fā)明人】李芳 , 劉鑫, 尉紅梅, 孫唯哲, 陳德訓(xùn)
【申請(qǐng)人】無錫江南計(jì)算技術(shù)研究所
【公開日】2015年12月23日
【申請(qǐng)日】2015年10月14日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
周宁县| 乐亭县| 日土县| 山阳县| 兴和县| 西和县| 阳春市| 阳信县| 临武县| 江口县| 绿春县| 五峰| 黄山市| 石台县| 温州市| 盐城市| 陈巴尔虎旗| 西昌市| 陇川县| 蓬溪县| 岳池县| 唐河县| 石台县| 乌兰察布市| 万载县| 土默特右旗| 漳浦县| 互助| 囊谦县| 察隅县| 龙口市| 河曲县| 吉林省| 石柱| 峨眉山市| 枞阳县| 临夏市| 桃园市| 鹤庆县| 曲松县| 徐汇区|