本發(fā)明實施例涉及計算資源管理,尤其涉及一種任務(wù)處理負(fù)載分析方法和裝置。
背景技術(shù):
1、傳統(tǒng)的資源調(diào)度方法主要依賴于cpu(central?processing?unit,中央處理器)和gpu(graphics?processing?unit,圖形處理器)的利用率來估計負(fù)載,這種粗略的估計方法在處理如大規(guī)模語言模型計算任務(wù)時存在明顯的局限性。大規(guī)模語言模型的計算任務(wù)具有高度的復(fù)雜性和動態(tài)性,復(fù)雜性是指一個任務(wù)需要分多步子任務(wù)進(jìn)行處理,而非傳統(tǒng)的針對整個任務(wù)的處理。動態(tài)性是指算力始終處于不斷計算處理和不斷接收新任務(wù)的狀態(tài),而非傳統(tǒng)的一條條處理或同時一批去處理的狀態(tài),因此,傳統(tǒng)的負(fù)載分析,往往無法準(zhǔn)確反映實際的計算負(fù)載,導(dǎo)致資源分配不均,降低了計算資源的利用效率。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供了一種任務(wù)處理負(fù)載分析方法和裝置,可以通過分析處理任務(wù)的子任務(wù)的處理時段計算負(fù)載,更合理的計算計算資源節(jié)點的實際負(fù)載,提高負(fù)載分析的有效性,提高資源利用效率。
2、第一方面,本發(fā)明實施例提供了一種任務(wù)處理負(fù)載分析方法,該方法包括:
3、響應(yīng)于計算資源節(jié)點的負(fù)載分析請求,確定負(fù)載分析時間周期;
4、基于負(fù)載分析時間周期,獲取計算資源節(jié)點處理的任務(wù)信息;
5、根據(jù)任務(wù)信息中的任務(wù)事件標(biāo)記信息,確定處理任務(wù)中各子任務(wù)在負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段;
6、根據(jù)負(fù)載分析時間周期及處理任務(wù)中各子任務(wù)在負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段,確定計算資源節(jié)點在負(fù)載分析時間周期內(nèi)的負(fù)載情況。
7、第二方面,本發(fā)明實施例提供了一種任務(wù)處理負(fù)載分析裝置,該裝置包括:
8、負(fù)載分析時間周期確定模塊,用于響應(yīng)于計算資源節(jié)點的負(fù)載分析請求,確定負(fù)載分析時間周期;
9、任務(wù)信息獲取模塊,用于基于負(fù)載分析時間周期,獲取計算資源節(jié)點處理的任務(wù)信息;
10、任務(wù)處理時段確定模塊,用于根據(jù)任務(wù)信息中的任務(wù)事件標(biāo)記信息,確定處理任務(wù)中各子任務(wù)在負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段;
11、負(fù)載情況確定模塊,用于根據(jù)負(fù)載分析時間周期及處理任務(wù)中各子任務(wù)在負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段,確定計算資源節(jié)點在負(fù)載分析時間周期內(nèi)的負(fù)載情況。
12、第三方面,本發(fā)明實施例還提供了一種計算機(jī)設(shè)備,計算機(jī)設(shè)備包括:
13、一個或多個處理器;
14、存儲器,用于存儲一個或多個程序;
15、當(dāng)上述一個或多個程序被一個或多個處理器執(zhí)行,使得上述一個或多個處理器實現(xiàn)如本發(fā)明任意實施例所提供的任務(wù)處理負(fù)載分析方法。
16、第四方面,本發(fā)明實施例還提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,該程序被處理器執(zhí)行時實現(xiàn)如本發(fā)明任意實施例所提供的任務(wù)處理負(fù)載分析方法。
17、第五方面,本發(fā)明實施例還提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,上述計算機(jī)程序在被處理器執(zhí)行時實現(xiàn)如本發(fā)明任意實施例所提供的任務(wù)處理負(fù)載分析方法。
18、上述發(fā)明中的實施例具有如下優(yōu)點或有益效果:
19、本發(fā)明實施例,通過響應(yīng)于計算資源節(jié)點的負(fù)載分析請求,確定負(fù)載分析時間周期;基于負(fù)載分析時間周期,獲取計算資源節(jié)點處理的任務(wù)信息;根據(jù)任務(wù)信息中的任務(wù)事件標(biāo)記信息,確定處理任務(wù)中各子任務(wù)在負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段;根據(jù)負(fù)載分析時間周期及處理任務(wù)中各子任務(wù)在負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段,確定計算資源節(jié)點在負(fù)載分析時間周期內(nèi)的負(fù)載情況。本發(fā)明實施例的技術(shù)方案解決了目前的負(fù)載分析無法準(zhǔn)確分析復(fù)雜的動態(tài)任務(wù)處理負(fù)載的問題,可以通過分析處理任務(wù)的子任務(wù)的處理時段計算負(fù)載,更合理的計算計算資源節(jié)點的實際負(fù)載,提高負(fù)載分析的有效性,提高資源利用效率。
1.一種任務(wù)處理負(fù)載分析方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述任務(wù)信息中的任務(wù)事件標(biāo)記信息,確定所述處理任務(wù)中各子任務(wù)在所述負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述負(fù)載分析時間周期及所述處理任務(wù)中各子任務(wù)在所述負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段,確定所述計算資源節(jié)點在所述負(fù)載分析時間周期內(nèi)的負(fù)載情況,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述任務(wù)處理時段中并行處理的子任務(wù)對應(yīng)的任務(wù)處理時段和預(yù)設(shè)最大并行處理任務(wù)數(shù)量,確定所述計算資源節(jié)點在所述負(fù)載分析時間周期內(nèi)的并行任務(wù)負(fù)載等效時長,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述串行任務(wù)負(fù)載時長和所述并行任務(wù)負(fù)載等效時長,確定所述計算資源節(jié)點在所述負(fù)載分析時間周期內(nèi)的負(fù)載情況,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,方法還包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述子任務(wù)包括所述處理任務(wù)各處理階段對應(yīng)的至少一個子任務(wù),所述方法還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述任務(wù)屬性包括串并處理屬性和/或處理優(yōu)先級屬性,所述根據(jù)所述任務(wù)信息中的任務(wù)事件標(biāo)記信息,確定所述處理任務(wù)中各子任務(wù)在所述負(fù)載分析時間周期內(nèi)對應(yīng)的任務(wù)處理時段,包括:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:基于各個子任務(wù)的起止時間觸發(fā)相應(yīng)事件,生成所述任務(wù)事件標(biāo)記信息。
10.一種任務(wù)處理負(fù)載分析裝置,其特征在于,包括: