1.一種意圖驅(qū)動的自智網(wǎng)絡按需服務方法,其特征在于,包括有:
2.根據(jù)權利要求1所述的方法,其特征在于,步驟二中,生成配置生成大模型,進一步包括有:
3.根據(jù)權利要求1所述的方法,其特征在于,步驟三中,獲取用戶意圖、配置命令模板序列中每個語義級參數(shù)的網(wǎng)絡配置文檔,進一步包括有:
4.根據(jù)權利要求1所述的方法,其特征在于,步驟三中,將用戶意圖、配置命令模板序列、用戶意圖和所有語義級參數(shù)的網(wǎng)絡配置文檔輸入配置生成大模型,配置生成大模型對配置命令模板序列進行修正,并對所有語義級參數(shù)填充取值,最后輸出語義級參數(shù)填充后的配置命令模板序列,進一步包括有:
5.根據(jù)權利要求1所述的方法,其特征在于,步驟四進一步包括有:
6.根據(jù)權利要求1所述的方法,其特征在于,基于深度強化學習模型來訓練專家模型,訓練專家模型時,每個指標級參數(shù)對應的網(wǎng)絡資源的拓撲網(wǎng)絡設定為:g={d,l},其中d表示拓撲網(wǎng)絡鏈路集,鏈路數(shù)為sd,l表示拓撲網(wǎng)絡中的網(wǎng)絡設備集,設備數(shù)為sl,每個網(wǎng)絡設備l都分配有網(wǎng)絡資源bl,l∈l,拓撲網(wǎng)絡通過為用戶服務需求u分配設備中的網(wǎng)絡資源bu來滿足所有用戶服務需求u,u∈u。
7.根據(jù)權利要求6所述的方法,其特征在于,對專家模型進行訓練的馬爾科夫決策過程中的狀態(tài)空間、動作空間和獎勵函數(shù)定義如下:
8.根據(jù)權利要求7所述的方法,其特征在于,基于dqn算法來訓練生成專家模型,在dqn中加入了噪聲層,并在dqn的行為網(wǎng)絡和目標網(wǎng)絡的參數(shù)中引入噪聲隨機變量∈和∈-、以及噪聲參數(shù)σ和σ-進行增強,因此,將dqn的目標函數(shù)公式設置為:
9.一種意圖驅(qū)動的自智網(wǎng)絡按需服務系統(tǒng),其特征在于,包括有:
10.一種計算設備,其特征在于,包括:
11.一種計算機可讀存儲介質(zhì),其特征在于,其存儲有計算機可執(zhí)行指令,該計算機可執(zhí)行指令被處理器執(zhí)行時實現(xiàn)權利要求1-8任意一項所述意圖驅(qū)動的自智網(wǎng)絡按需服務方法的步驟。