一種關(guān)鍵指令序列融合策略的自適應(yīng)分析方法及系統(tǒng)

文檔序號：40613957發(fā)布日期：2025-01-07 21:01閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于計算機體系結(jié)構(gòu)和指令集優(yōu)化，具體涉及一種關(guān)鍵指令序列融合策略的自適應(yīng)分析方法及系統(tǒng)。

背景技術(shù)：

1、在當(dāng)今數(shù)字化浪潮中，隨著機器學(xué)習(xí)、深度學(xué)習(xí)以及人工智能等領(lǐng)域的迅猛進步，大規(guī)模模型的復(fù)雜度和規(guī)模呈現(xiàn)出持續(xù)增長的態(tài)勢。為了適應(yīng)日益多樣化和復(fù)雜化的應(yīng)用場景，指令集也在不斷進行拓展和優(yōu)化，以滿足更加廣泛和深入的需求。指令融合技術(shù)在微體系結(jié)構(gòu)設(shè)計中具有重要意義，將在未來的處理器設(shè)計中發(fā)揮更加重要的作用。

2、指令融合技術(shù)是提升性能、降低功耗的關(guān)鍵技術(shù)。該技術(shù)通過組合多條指令融合成一個復(fù)合指令執(zhí)行，減少了復(fù)合指令內(nèi)部指令之間由依賴關(guān)系增加的等待時間，進而提升了指令的執(zhí)行效率和整體性能。此外，指令融合技術(shù)使得處理器執(zhí)行相同的任務(wù)時，所需的指令數(shù)量減少，提升處理器內(nèi)部重命名歷史表、物理寄存器、重排序緩存區(qū)等微體系結(jié)構(gòu)的利用率，充分利用已有的執(zhí)行單元，降低動態(tài)功耗。

3、由于上層應(yīng)用的復(fù)雜多變，對微體系結(jié)構(gòu)的設(shè)計需求也盡不相同，對應(yīng)到融合策略的選擇也因為應(yīng)用的需求發(fā)生變化，現(xiàn)有的指令融合方案針對特定的指令集依據(jù)不同的性能需求提出特定的融合方案，融合指令類型包括浮點指令、訪存指令、運算指令、分支指令、條件傳送指令、加密指令、異構(gòu)計算指令等。指令融合階段的選擇包括指令的預(yù)取階段、譯碼階段、派遣階段等?，F(xiàn)有的指令融合技術(shù)選取時序相鄰的連續(xù)指令進行融合，設(shè)計者依據(jù)不同應(yīng)用領(lǐng)域的性能需求進行指令之間的融合。

4、典型的指令集架構(gòu)為了適應(yīng)復(fù)雜多變的應(yīng)用需求一直在不斷的拓展，例如為了滿足日益增長的計算需求，加速機器學(xué)習(xí)、圖形分析、數(shù)據(jù)驅(qū)動等領(lǐng)域計算密集型任務(wù)，x86,arm,risc-v都在不斷地拓展各自的指令集。隨著專用應(yīng)用領(lǐng)域架構(gòu)的設(shè)計方法的廣泛應(yīng)用，專用的硬件加速器的定制化需求也在爆發(fā)式增長，融合作為性能提升的必要技術(shù)也需要隨著指令集的拓展確定新的融合方案和微體系結(jié)構(gòu)實現(xiàn)。

5、未來的指令集架構(gòu)需要更靈活、可擴展的設(shè)計，以支持更多的定制化硬件加速器。同時，微體系結(jié)構(gòu)也需要不斷優(yōu)化和創(chuàng)新，以適應(yīng)新的融合方案和性能提升需求。然而，現(xiàn)有的融合策略的設(shè)計、性能提升、驗證都需要人工參與，這種做法存在以下不足。

6、1)不同的應(yīng)用場景和微體系架構(gòu)對指令融合的需求各不相同，人工參與的融合策略在面對多樣化的應(yīng)用場景時缺乏泛化能力，難以自適應(yīng)各種不同的場景，缺乏靈活性。

7、2)復(fù)雜的指令依賴關(guān)系使得在融合策略制定過程中需要詳細分析每一條指令的依賴關(guān)系。這種復(fù)雜的依賴關(guān)系分析不僅耗時，而且容易出錯，增加了融合策略設(shè)計的難度。

8、3)不同的融合策略和對應(yīng)的微體系結(jié)構(gòu)實現(xiàn)都需要進行大量的正確性驗證，以確保融合后的指令能夠正確執(zhí)行。

技術(shù)實現(xiàn)思路

1、現(xiàn)有的指令融合策略制定往往依賴于人工分析和經(jīng)驗，這種方法不僅效率低，而且容易出錯，本發(fā)明用來解決當(dāng)前融合策略應(yīng)對不斷拓展指令集的缺乏泛化能力的困境，依據(jù)應(yīng)用需求，制定驗證友好的融合策略和微體系結(jié)構(gòu)實現(xiàn)。

2、本發(fā)明采用的技術(shù)方案如下：

3、一種關(guān)鍵指令序列融合策略的自適應(yīng)分析方法，包括以下步驟：

4、根據(jù)輸入的程序代碼，深入挖掘具備融合潛力的關(guān)鍵指令序列，得到候選關(guān)鍵指令序列；

5、對候選關(guān)鍵指令序列制定科學(xué)有效的融合策略，并選擇最優(yōu)融合策略；

6、根據(jù)最優(yōu)融合策略選擇微體系結(jié)構(gòu)的融合參數(shù)；

7、評估融合策略的性能和開銷。

8、進一步地，所述深入挖掘具備融合潛力的關(guān)鍵指令序列，包括：

9、輸入標準測試程序切片或客制化代碼片段；

10、由指令級模擬器生成輸入對應(yīng)的追蹤日志文件；

11、通過處理追蹤日志文件，利用詞向量模型和序列模式挖掘技術(shù)提取候選關(guān)鍵指令序列。

12、進一步地，所述利用詞向量模型和序列模式挖掘技術(shù)提取候選關(guān)鍵指令序列，包括：

13、獲取應(yīng)用負載程序的熱點片段，并進行熱點片段分類；

14、進行數(shù)據(jù)過濾，移除注釋和多余的空行，確保每條指令格式一致；

15、進行文本預(yù)處理，將每條指令拆分為指令名和操作數(shù)，統(tǒng)一指令的表示形式；

16、利用word2vec模型構(gòu)建詞向量；

17、從word2vec模型中提取每條指令的向量表示，使用k-means算法對指令向量進行聚類，確定每個指令所屬的簇；

18、根據(jù)聚類結(jié)果，利用prefixspan算法進行序列模式挖掘，得到關(guān)鍵指令序列的模式向量。

19、進一步地，所述選擇最優(yōu)融合策略，是從輸入的候選關(guān)鍵指令序列中找到使得融合后具有最小指令條數(shù)的關(guān)鍵指令序列，包括使用用戶自定義的融合策略或者使用機器學(xué)習(xí)模型自動生成融合策略。

20、進一步地，所述選擇最優(yōu)融合策略，包括：

21、首先進行優(yōu)先級設(shè)定，包括：計算候選關(guān)鍵指令序列的序列向量和類別向量，衡量序列向量與每個類別向量之間的余弦相似度，余弦相似度的值范圍從-1到1，然后映射到與優(yōu)先級對齊的值[0,1]，將所有候選關(guān)鍵指令序列按優(yōu)先級排序；

22、然后進行融合檢測，包括：

23、a)定義兩個集合，策略集a＝{}，初始為空；候選集b＝{候選可融合指令序列}；

24、b)使用指令級模擬器測定工作負載的指令條數(shù)，記為k；

25、c)按照集合b中候選可融合指令序列的優(yōu)先級遞減順序，依次加入集合a中，每次更新集合a，測一次融合后的指令條數(shù)，依次記為k1,k2...kn；

26、d)重復(fù)上一步，不斷進行優(yōu)化，直到達到收斂閾值：((ki-ki-1)/ki-1)*100％<0.1％。

27、進一步地，所述根據(jù)最優(yōu)融合策略選擇微體系結(jié)構(gòu)的融合參數(shù)，包括：在周期級模擬器上構(gòu)建微結(jié)構(gòu)仿真模擬器，在動態(tài)優(yōu)化過程中選擇最合適的微體系結(jié)構(gòu)的參數(shù)，包括融合階段、發(fā)射寬度、是否支持跨數(shù)據(jù)緩存的融合、融合窗口大小，采用微結(jié)構(gòu)仿真模型檢查指令之間的依賴關(guān)系并應(yīng)用融合策略。

28、進一步地，所述根據(jù)最優(yōu)融合策略選擇微體系結(jié)構(gòu)的融合參數(shù)，支持以下功能：融合窗口寬度自定義、融合條件自定義、針對每例融合對單獨設(shè)置融合開關(guān)；所述融合條件自定義用于對融合后的指令進行正確性檢測，確保指令依賴關(guān)系沒有被破壞，包括寄存器依賴性檢查、特定指令類型匹配、無分支或存儲指令限制、指令順序和寄存器匹配檢查。

29、進一步地，所述評估融合策略的性能和開銷，包括：使用指令融合仿真模擬器，重新將基準測試程序或客制化代碼片段輸入，進行性能仿真測試，計算比較融合前后的評價參數(shù)，作為是否需要反饋迭代微體系結(jié)構(gòu)設(shè)計的參考因素；通過對比融合前后的執(zhí)行效率，評估出融合策略對處理器的性能提升和面積開銷，從而驗證融合策略的有效性，并為后續(xù)的優(yōu)化提供重要的參考依據(jù)。

30、一種關(guān)鍵指令序列融合策略的自適應(yīng)分析系統(tǒng)，其包括：

31、融合指令確定模塊，用于根據(jù)輸入的程序代碼，深入挖掘具備融合潛力的關(guān)鍵指令序列，得到候選關(guān)鍵指令序列；

32、融合策略制定模塊，用于對候選關(guān)鍵指令序列制定科學(xué)有效的融合策略，并選擇最優(yōu)融合策略；

33、微結(jié)構(gòu)性能評估模塊，用于根據(jù)最優(yōu)融合策略選擇微體系結(jié)構(gòu)的融合參數(shù)；

34、融合性能評估模塊，用于評估融合策略的性能和開銷。

35、本發(fā)明的有益效果如下：

36、本發(fā)明旨在應(yīng)對日益擴展的指令集，提出一種自適應(yīng)分析的方法與系統(tǒng)，專注于關(guān)鍵指令序列融合策略的優(yōu)化。該方案具備高度靈活性，能夠根據(jù)不同應(yīng)用場景的具體需求，進行融合策略的自適應(yīng)分析與調(diào)整。本發(fā)明利用指令級模擬器和周期級模擬器對融合策略進行自動的模擬仿真，并通過迭代優(yōu)化，選出最佳的微體系結(jié)構(gòu)實現(xiàn)方案。

37、本發(fā)明的優(yōu)點包括：減少了人工的參與，提升了融合策略的自適應(yīng)能力；驗證友好；量化了最優(yōu)指令融合序列策略的選擇過程；綜合了指令融合技術(shù)在微架構(gòu)的主流實現(xiàn)方式

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李沛南,張乾龍,侯銳,喬歡,陳德煒,袁苗苗,胡凱,嚴余偉,馮來春,李卓
技術(shù)所有人：中國科學(xué)院信息工程研究所
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種關(guān)鍵指令序列融合策略的自適應(yīng)分析方法及系統(tǒng)