本公開涉及人工智能,具體為大模型和深度學(xué)習(xí)等,尤其涉及一種信息處理方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù):
1、相關(guān)技術(shù)中,基于混合專家模型(mixture?of?experts,簡稱moe)的架構(gòu),依賴于動態(tài)選擇機制為輸入數(shù)據(jù)選取最合適的專家模型,例如:通過門控網(wǎng)絡(luò)(gating?network)為輸入數(shù)據(jù)選取最合適的專家模型,又例如:通過權(quán)重分配策略為輸入數(shù)據(jù)選取最合適的專家模型,然而,上述方法無法精準(zhǔn)和高效地為輸入數(shù)據(jù)選取最合適的專家模型,由此,如何精準(zhǔn)和高效地為輸入數(shù)據(jù)選取最合適的專家模型,以提高模型的推理速度已成為亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本公開提出了一種信息處理方法、裝置、電子設(shè)備、存儲介質(zhì)和計算機程序產(chǎn)品。
2、根據(jù)本公開的第一方面,提出了一種信息處理方法,包括:獲取用戶的查詢語句,并基于所述查詢語句確定至少一個候選服務(wù)模型的模型標(biāo)識;基于所述查詢語句和所述模型標(biāo)識生成第一提示詞,并將所述第一提示詞輸入預(yù)訓(xùn)練的目標(biāo)大模型中,由所述目標(biāo)大模型根據(jù)所述第一提示詞輸出所述候選服務(wù)模型的篩選參數(shù);根據(jù)所述篩選參數(shù)從所述候選服務(wù)模型中確定目標(biāo)服務(wù)模型;向所述目標(biāo)服務(wù)模型輸入所述查詢語句,得到所述查詢語句對應(yīng)的反饋信息。
3、根據(jù)本公開的第二方面,提出了一種信息處理裝置,包括:第一獲取模塊,用于獲取用戶的查詢語句,并基于所述查詢語句確定至少一個候選服務(wù)模型的模型標(biāo)識;處理模塊,用于基于所述查詢語句和所述模型標(biāo)識生成第一提示詞,并將所述第一提示詞輸入預(yù)訓(xùn)練的目標(biāo)大模型中,由所述目標(biāo)大模型根據(jù)所述第一提示詞輸出所述候選服務(wù)模型的篩選參數(shù);確定模塊,用于根據(jù)所述篩選參數(shù)從所述候選服務(wù)模型中確定目標(biāo)服務(wù)模型;第二獲取模塊,用于向所述目標(biāo)服務(wù)模型輸入所述查詢語句,得到所述查詢語句對應(yīng)的反饋信息。
4、根據(jù)本公開的第三方面,提出了一種電子設(shè)備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行上述第一方面提出的信息處理方法。
5、根據(jù)本公開的第四方面,提出了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,所述計算機指令用于使所述計算機執(zhí)行上述第一方面提出的信息處理方法。
6、根據(jù)本公開的第五方面,提出了一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)上述第一方面提出的信息處理方法。
7、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種信息處理方法,其中,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述篩選參數(shù)從所述候選服務(wù)模型中確定目標(biāo)服務(wù)模型,包括:
3.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述篩選參數(shù)從所述候選服務(wù)模型中確定目標(biāo)服務(wù)模型,包括:
4.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)所述任務(wù)量和所述篩選參數(shù),從所述候選服務(wù)模型中確定所述目標(biāo)服務(wù)模型,包括:
5.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)所述任務(wù)量和所述篩選參數(shù),從所述候選服務(wù)模型中確定所述目標(biāo)服務(wù)模型,包括:
6.根據(jù)權(quán)利要求1所述的方法,其中,所述得到所述查詢語句對應(yīng)的反饋信息之后,還包括:
7.根據(jù)權(quán)利要求6所述的方法,其中,所述方法,還包括:
8.根據(jù)權(quán)利要求1-7中任一項所述的方法,其中,所述目標(biāo)大模型的訓(xùn)練過程,包括:
9.根據(jù)權(quán)利要求8所述的方法,其中,所述訓(xùn)練樣本集的確定過程,包括:
10.根據(jù)權(quán)利要求9所述的方法,其中,所述訓(xùn)練樣本集的確定過程,包括:
11.根據(jù)權(quán)利要求8所述的方法,其中,所述樣本服務(wù)模型的確定過程,包括:
12.根據(jù)權(quán)利要求8所述的方法,其中,所述基于所述樣本服務(wù)模型確定所述樣本查詢語句的參考標(biāo)簽,包括:
13.根據(jù)權(quán)利要求8所述的方法,其中,所述根據(jù)所述樣本查詢語句、所述樣本服務(wù)模型的模型標(biāo)識,以及所述樣本標(biāo)簽語句的標(biāo)簽,對所述大模型進行訓(xùn)練,得到所述目標(biāo)大模型,包括:
14.根據(jù)權(quán)利要求1-7中任一項所述的方法,其中,所述基于所述查詢語句確定候選服務(wù)模型的模型標(biāo)識之前,還包括:
15.根據(jù)權(quán)利要求14所述的方法,其中,所述基于所述查詢語句確定候選服務(wù)模型的模型標(biāo)識之前,還包括:
16.一種信息處理裝置,其中,所述裝置包括:
17.一種電子設(shè)備,其特征在于,包括處理器和存儲器;
18.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-15中任一項所述的方法。
19.一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1-15中任一項所述的方法。