本技術(shù)涉及人工智能,特別是涉及一種基于模型置信域的智能電網(wǎng)深度學(xué)習(xí)模型版權(quán)保護方法、裝置、系統(tǒng)、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品。
背景技術(shù):
1、隨著智能電網(wǎng)技術(shù)的快速發(fā)展,機器學(xué)習(xí)模型在電力系統(tǒng)中的應(yīng)用越來越廣泛。特別是深度學(xué)習(xí)技術(shù)的進步,促進了包括電網(wǎng)流量預(yù)測、用戶用電行為分析、設(shè)備異常檢測等在內(nèi)的多種高級分析算法的發(fā)展。然而,這些基于機器學(xué)習(xí)的系統(tǒng)依賴于高質(zhì)量的數(shù)據(jù)集,這使得它們成為知識產(chǎn)權(quán)盜竊的潛在目標(biāo)。
2、例如,智能電網(wǎng)中的機器學(xué)習(xí)模型通常需要訪問和分析大量的用戶數(shù)據(jù),如家庭用電習(xí)慣、用電量等。這些數(shù)據(jù)一旦被攻擊者通過模型提取攻擊獲取,不僅會侵犯用戶的隱私,還可能被用于惡意目的,如詐騙或竊取用戶身份信息。同時,智能電網(wǎng)中還包含大量的電網(wǎng)運行數(shù)據(jù),如電力負(fù)荷、設(shè)備狀態(tài)等。這些數(shù)據(jù)對于電網(wǎng)的安全運行至關(guān)重要。如果攻擊者通過模型提取攻擊獲取這些數(shù)據(jù),可能會導(dǎo)致電網(wǎng)運行數(shù)據(jù)被泄露,從而危及電網(wǎng)的安全和穩(wěn)定運行,攻擊者可以利用這些數(shù)據(jù)進行電力市場操縱或針對電網(wǎng)的網(wǎng)絡(luò)攻擊。因此,如何在這種情況下保護神經(jīng)網(wǎng)絡(luò)的版權(quán)成為一個亟待解決的問題。
3、相關(guān)技術(shù)中,已有一些研究致力于防御模型提取攻擊和保護模型隱私,然而,這些方法在實際應(yīng)用中仍存在一些局限性,使得模型版權(quán)侵犯攻擊的檢測準(zhǔn)確率較低。
技術(shù)實現(xiàn)思路
1、基于此,有必要針對上述技術(shù)問題,提供一種能夠提高模型版權(quán)侵犯攻擊的檢測準(zhǔn)確率的基于模型置信域的智能電網(wǎng)深度學(xué)習(xí)模型版權(quán)保護方法、裝置、系統(tǒng)、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品。
2、第一方面,本技術(shù)提供了一種基于模型置信域的智能電網(wǎng)深度學(xué)習(xí)模型版權(quán)保護方法,包括:
3、獲取智能電網(wǎng)深度模型集;所述智能電網(wǎng)深度模型集包括目標(biāo)版權(quán)保護模型,以及所述目標(biāo)版權(quán)保護模型對應(yīng)的目標(biāo)風(fēng)險模型和目標(biāo)同態(tài)模型;所述目標(biāo)風(fēng)險模型為與所述目標(biāo)版權(quán)保護模型存在智能電網(wǎng)數(shù)據(jù)集侵權(quán)問題的模型;所述目標(biāo)同態(tài)模型為在相同問題域下對所述目標(biāo)版權(quán)保護模型進行模擬得到的模型;
4、針對所述智能電網(wǎng)深度模型集中的各模型,在智能電網(wǎng)專有數(shù)據(jù)集中搜索相應(yīng)的模型預(yù)測值與相應(yīng)的模型判別界限之間的距離滿足預(yù)設(shè)條件的特征數(shù)據(jù)樣本,得到置信域特征點集;所述模型判別界限表征在模型對所述特征數(shù)據(jù)樣本推理的梯度方向進行預(yù)設(shè)位移之內(nèi)可以被預(yù)測為其他類型的區(qū)域;
5、確定所述置信域特征點集在所述模型判別界限上的梯度向量,并對獲取的所述梯度向量按照線性判別分析的方法進行降維,將降維后的梯度向量作為所述置信域特征點集的擾動向量;
6、根據(jù)各所述模型對所述置信域特征點集與所述擾動向量結(jié)合前、后的預(yù)測標(biāo)簽變化,生成所述智能電網(wǎng)深度模型集對應(yīng)的模型特征標(biāo)識集;
7、根據(jù)所述模型特征標(biāo)識集對待訓(xùn)練的版權(quán)檢測模型進行訓(xùn)練,得到預(yù)訓(xùn)練的版權(quán)檢測模型;所述預(yù)訓(xùn)練的版權(quán)檢測模型用于檢測待檢測模型是否侵犯了所述目標(biāo)版權(quán)保護模型的版權(quán)。
8、在其中一個實施例中,所述確定所述置信域特征點集在所述模型判別界限上的梯度向量,并對獲取的所述梯度向量按照線性判別分析的方法進行降維,包括:
9、將所述梯度向量按照類別標(biāo)簽進行分組,確定每個類別的均值向量和總體均值向量;
10、根據(jù)每個所述類別的所述均值向量和所述總體均值向量,確定類內(nèi)散布矩陣和類間散布矩陣;
11、通過求解所述類內(nèi)散布矩陣的逆矩陣與所述類間散布矩陣的乘積的特征值和特征向量,選取累計貢獻率滿足預(yù)設(shè)條件的特征向量進行降維處理,得到所述降維后的梯度向量。
12、在其中一個實施例中,所述根據(jù)所述模型特征標(biāo)識集對待訓(xùn)練的版權(quán)檢測模型進行訓(xùn)練,包括:
13、通過同源數(shù)據(jù)子集搜索的方式對所述模型特征標(biāo)識集進行擴展,得到擴展后的模型特征標(biāo)識集;
14、通過所述擴展后的模型特征標(biāo)識集,對所述待訓(xùn)練的版權(quán)檢測模型進行訓(xùn)練。
15、在其中一個實施例中,所述通過同源數(shù)據(jù)子集搜索的方式對所述模型特征標(biāo)識集進行擴展,得到擴展后的模型特征標(biāo)識集,包括:
16、將所述模型特征標(biāo)識集劃分為k個子集,將所述模型特征標(biāo)識集中的各模型特征標(biāo)識分別作為一個數(shù)據(jù)點;每個所述子集包括一個核心點;所述核心點表示為在所述模型特征標(biāo)識集中隨機選擇得到的;
17、確定每個所述數(shù)據(jù)點到每個所述核心點的距離,并將各所述數(shù)據(jù)點分配到最近的核心點所屬的子集;
18、更新每個所述子集的核心點為該子集內(nèi)所有所述數(shù)據(jù)點的均值,并返回確定每個所述數(shù)據(jù)點到每個所述核心點的距離的步驟,直到所述核心點不再發(fā)生變化或達到最大迭代次數(shù),對每個所述子集內(nèi)的數(shù)據(jù)點進行數(shù)據(jù)增強處理,得到所述擴展后的模型特征標(biāo)識集。
19、在其中一個實施例中,所述獲取智能電網(wǎng)深度模型集,包括:
20、獲取所述目標(biāo)版權(quán)保護模型在訓(xùn)練過程中使用的訓(xùn)練數(shù)據(jù)集,在所述訓(xùn)練數(shù)據(jù)集上訓(xùn)練出所述目標(biāo)同態(tài)模型;所述目標(biāo)同態(tài)模型包括完全同態(tài)模型、架構(gòu)同態(tài)模型和問題域同態(tài)模型;
21、所述完全同態(tài)模型為在與所述目標(biāo)版權(quán)保護模型的所有實驗設(shè)置相同的前提下進行多次訓(xùn)練得到的;
22、所述架構(gòu)同態(tài)模型為在與所述目標(biāo)版權(quán)保護模型的架構(gòu)相同的前提下,微調(diào)訓(xùn)練時的超參數(shù),進行多次訓(xùn)練得到的;
23、所述問題域同態(tài)模型為在使用與所述目標(biāo)版權(quán)保護模型相同的源數(shù)據(jù)集的前提下,在預(yù)設(shè)的相似模型結(jié)構(gòu)與隨機選擇的超參數(shù)組合下進行多次訓(xùn)練得到的。
24、所述待訓(xùn)練的版權(quán)檢測模型包括自編碼器識別網(wǎng)絡(luò)和映射網(wǎng)絡(luò),所述根據(jù)所述模型特征標(biāo)識集對待訓(xùn)練的版權(quán)檢測模型進行訓(xùn)練,包括:
25、利用自監(jiān)督學(xué)習(xí)的方法訓(xùn)練所述自編碼器識別網(wǎng)絡(luò)和所述映射網(wǎng)絡(luò),將所述模型特征標(biāo)識集映射到低維度的表征空間;
26、若模型特征標(biāo)識為,所述模型特征標(biāo)識的正對子為,所述模型特征標(biāo)識的負(fù)對子為,自監(jiān)督學(xué)習(xí)的損失函數(shù)可以表示為:
27、;
28、其中,表示的同態(tài)度,表示的同態(tài)度。
29、第二方面,本技術(shù)還提供了一種基于模型置信域的智能電網(wǎng)深度學(xué)習(xí)模型版權(quán)保護裝置,包括:
30、獲取模塊,用于獲取智能電網(wǎng)深度模型集;所述智能電網(wǎng)深度模型集包括目標(biāo)版權(quán)保護模型,以及所述目標(biāo)版權(quán)保護模型對應(yīng)的目標(biāo)風(fēng)險模型和目標(biāo)同態(tài)模型;所述目標(biāo)風(fēng)險模型為與所述目標(biāo)版權(quán)保護模型存在智能電網(wǎng)數(shù)據(jù)集侵權(quán)問題的模型;所述目標(biāo)同態(tài)模型為在相同問題域下對所述目標(biāo)版權(quán)保護模型進行模擬得到的模型;
31、搜索模塊,用于針對所述智能電網(wǎng)深度模型集中的各模型,在智能電網(wǎng)專有數(shù)據(jù)集中搜索相應(yīng)的模型預(yù)測值與相應(yīng)的模型判別界限之間的距離滿足預(yù)設(shè)條件的特征數(shù)據(jù)樣本,得到置信域特征點集;所述模型判別界限表征在模型對所述特征數(shù)據(jù)樣本推理的梯度方向進行預(yù)設(shè)位移之內(nèi)可以被預(yù)測為其他類型的區(qū)域;
32、確定模塊,用于確定所述置信域特征點集在所述模型判別界限上的梯度向量,并對獲取的所述梯度向量按照線性判別分析的方法進行降維,將降維后的梯度向量作為所述置信域特征點集的擾動向量;
33、生成模塊,用于根據(jù)各所述模型對所述置信域特征點集與所述擾動向量結(jié)合前、后的預(yù)測標(biāo)簽變化,生成所述智能電網(wǎng)深度模型集對應(yīng)的模型特征標(biāo)識集;
34、訓(xùn)練模塊,用于根據(jù)所述模型特征標(biāo)識集對待訓(xùn)練的版權(quán)檢測模型進行訓(xùn)練,得到預(yù)訓(xùn)練的版權(quán)檢測模型;所述預(yù)訓(xùn)練的版權(quán)檢測模型用于檢測待檢測模型是否侵犯了所述目標(biāo)版權(quán)保護模型的版權(quán)。
35、第三方面,本技術(shù)還提供了一種基于模型置信域的智能電網(wǎng)深度學(xué)習(xí)模型版權(quán)保護系統(tǒng)。所述系統(tǒng)包括存儲器和處理器,所述存儲器存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的方法的步驟。
36、第四方面,本技術(shù)還提供了一種計算機可讀存儲介質(zhì)。所述計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的方法的步驟。
37、第五方面,本技術(shù)還提供了一種計算機程序產(chǎn)品。所述計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的方法的步驟。
38、上述基于模型置信域的智能電網(wǎng)深度學(xué)習(xí)模型版權(quán)保護方法、裝置、系統(tǒng)、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品,通過獲取目標(biāo)版權(quán)保護模型,以及目標(biāo)版權(quán)保護模型對應(yīng)的目標(biāo)風(fēng)險模型和目標(biāo)同態(tài)模型,目標(biāo)風(fēng)險模型為與目標(biāo)版權(quán)保護模型存在智能電網(wǎng)數(shù)據(jù)集侵權(quán)問題的模型;目標(biāo)同態(tài)模型為在相同問題域下對目標(biāo)版權(quán)保護模型進行模擬得到的模型;并針對智能電網(wǎng)深度模型集中的各模型,在智能電網(wǎng)專有數(shù)據(jù)集中搜索相應(yīng)的模型預(yù)測值與相應(yīng)的模型判別界限之間的距離滿足預(yù)設(shè)條件的特征數(shù)據(jù)樣本,得到置信域特征點集,使得獲取的置信域特征點集能夠準(zhǔn)確地描述深度學(xué)習(xí)模型的置信域信息,再對置信域特征點集在模型判別界限上的梯度向量按照線性判別分析的方法進行降維,以得到置信域特征點集的擾動向量,從而可以根據(jù)置信域特征點集與擾動向量結(jié)合前、后的預(yù)測標(biāo)簽變化,準(zhǔn)確地生成智能電網(wǎng)深度模型集對應(yīng)的模型特征標(biāo)識集,通過模型特征標(biāo)識集對待訓(xùn)練的版權(quán)檢測模型進行訓(xùn)練,得到預(yù)訓(xùn)練的版權(quán)檢測模型;預(yù)訓(xùn)練的版權(quán)檢測模型可以用于檢測待檢測模型是否侵犯了目標(biāo)版權(quán)保護模型的版權(quán),進而可以有效防御攻擊者在訓(xùn)練開始后的迭代中偽造身份頂替用戶參與模型訓(xùn)練;同時,通過提取模型的置信域特征生成特征標(biāo)識,可以有效區(qū)分風(fēng)險模型和同態(tài)模型,提高了特征標(biāo)識匹配的準(zhǔn)確性和魯棒性,保障智能電網(wǎng)中模型部署的數(shù)據(jù)集版權(quán)安全,防止數(shù)據(jù)泄露和未經(jīng)授權(quán)的利用。