本發(fā)明屬于工業(yè)物聯(lián)網(wǎng),涉及一種基于改進(jìn)決策樹id3算法的工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配方法。
背景技術(shù):
1、隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,工業(yè)生產(chǎn)對數(shù)據(jù)傳輸要求越來越高。未來的工業(yè)網(wǎng)絡(luò)將支持具有多種通信需求的應(yīng)用程序和服務(wù),而采用單一通信技術(shù)很難滿足這些需求,構(gòu)建異構(gòu)網(wǎng)絡(luò)勢在必行。除此之外,現(xiàn)有很多工業(yè)無線網(wǎng)絡(luò)和工業(yè)有線網(wǎng)絡(luò),特別是時間敏感網(wǎng)絡(luò)是近幾年工業(yè)網(wǎng)絡(luò)領(lǐng)域的研究熱點(diǎn),其通過一系列關(guān)鍵技術(shù)保證了數(shù)據(jù)傳輸?shù)拇_定性。多種網(wǎng)絡(luò)融合,可既滿足工廠移動設(shè)施的通信需求,又滿足工業(yè)控制對可靠性的嚴(yán)格要求。然而,兩套不同網(wǎng)絡(luò)要融合成為一個異構(gòu)網(wǎng)絡(luò),就要對整個異構(gòu)網(wǎng)絡(luò)的信息流進(jìn)行聯(lián)合調(diào)度,以避免譬如碰撞、擁塞等問題,保證信息流的正常傳輸。但是,隨著技術(shù)和時代的發(fā)展,運(yùn)用在工業(yè)網(wǎng)絡(luò)服務(wù)系統(tǒng)中時,單一的異構(gòu)網(wǎng)絡(luò)調(diào)度缺乏一種靈活性、高效性以及智能化的匹配選擇。因此,既能保證異構(gòu)網(wǎng)絡(luò)在聯(lián)合調(diào)度要求的同時又要滿足用戶的多樣化、智能化以及高效性的選擇成為了當(dāng)下的一個挑戰(zhàn)。
2、機(jī)器學(xué)習(xí)作為一種實(shí)現(xiàn)人工智能的方法被廣泛的應(yīng)用于通信網(wǎng)絡(luò)調(diào)度的預(yù)測分析,科學(xué)的決策是現(xiàn)代管理者的一項(xiàng)重要職責(zé),而機(jī)器學(xué)習(xí)分類方法中的決策樹算法作為一種決策技術(shù),能夠有效的通過計(jì)算控制決策帶來的風(fēng)險,最終選出效益最大的決策結(jié)果。
3、多種異構(gòu)網(wǎng)絡(luò)調(diào)度算法集成在一個工業(yè)異構(gòu)網(wǎng)絡(luò)的調(diào)度系統(tǒng)中大大減少了網(wǎng)絡(luò)切換過程中的數(shù)據(jù)延時,由于工業(yè)網(wǎng)絡(luò)中通常存在多種不同類型的工業(yè)以太網(wǎng)網(wǎng)絡(luò)、工業(yè)有線網(wǎng)絡(luò)和工業(yè)無線網(wǎng)絡(luò),不同網(wǎng)絡(luò)進(jìn)行跨網(wǎng)調(diào)度的時候也存在各種不同的調(diào)度算法,針對不同用戶的網(wǎng)絡(luò)調(diào)度需求往往需要進(jìn)行多種異構(gòu)網(wǎng)絡(luò)調(diào)度算法的切換選擇,如何快速、高效、準(zhǔn)確的根據(jù)用戶調(diào)度需求匹配最優(yōu)調(diào)度算法問題也未能得到很好的解決。因此,為解決工業(yè)網(wǎng)絡(luò)傳輸?shù)募磿r性,實(shí)現(xiàn)工業(yè)自動化和智能化選擇,亟需研究一種工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配方法應(yīng)用于工業(yè)異構(gòu)網(wǎng)絡(luò)的調(diào)度系統(tǒng)當(dāng)中。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于改進(jìn)決策樹id3算法的工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配方法,服務(wù)于工業(yè)異構(gòu)網(wǎng)絡(luò)協(xié)同調(diào)度系統(tǒng),協(xié)同調(diào)度系統(tǒng)作為控制核心,部署在工業(yè)軟件定義控制器(isdc)中,運(yùn)行在控制面,對網(wǎng)絡(luò)狀態(tài)信息進(jìn)行計(jì)算并生成調(diào)度表。
2、為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于改進(jìn)決策樹id3算法的工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配方法,包括以下步驟:
4、s1:用戶在工業(yè)異構(gòu)網(wǎng)絡(luò)協(xié)同調(diào)度子系統(tǒng)前端搭建網(wǎng)絡(luò)拓?fù)溥x擇使用場景,輸入調(diào)度需求;
5、s2:工業(yè)異構(gòu)網(wǎng)絡(luò)協(xié)同調(diào)度子系統(tǒng)根據(jù)用戶調(diào)度需求進(jìn)行傳參,構(gòu)建并訓(xùn)練基于改進(jìn)決策樹id3算法的工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配模型;
6、s3:將工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配預(yù)測模型部署到工業(yè)異構(gòu)網(wǎng)絡(luò)協(xié)同調(diào)度子系統(tǒng)后端并添加環(huán)境依賴,工業(yè)異構(gòu)網(wǎng)絡(luò)協(xié)同調(diào)度子系統(tǒng)前端通過api端點(diǎn)傳遞需求信息,工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配預(yù)測模型接收參數(shù)并匹配結(jié)果返回工業(yè)異構(gòu)網(wǎng)絡(luò)協(xié)同調(diào)度子系統(tǒng)前端。
7、進(jìn)一步,步驟s1中,用戶在工業(yè)異構(gòu)網(wǎng)絡(luò)協(xié)同調(diào)度子系統(tǒng)前端搭建網(wǎng)絡(luò)拓?fù)溥x擇使用場景,包括工業(yè)有線網(wǎng)絡(luò)與工業(yè)無線網(wǎng)絡(luò)的調(diào)度,然后對調(diào)度需求進(jìn)行勾選或輸入,作為工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法的輸入特征參數(shù)。
8、進(jìn)一步,步驟s2具體包括以下步驟:
9、s21:收集工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)數(shù)據(jù),作為工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配函數(shù)模型的訓(xùn)練數(shù)據(jù)集d和測試數(shù)據(jù)集v,然后進(jìn)行預(yù)處理;
10、s22:計(jì)算各工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)的信息增益g(d|wi),選取對訓(xùn)練數(shù)據(jù)具有分類能力的算法輸入特征參數(shù);
11、s23:采用遞歸的方法,選擇信息增益最大的特征參數(shù)作為當(dāng)前節(jié)點(diǎn)的確定標(biāo)準(zhǔn),直到滿足停止約束條件達(dá)到預(yù)定擬合效果,由此創(chuàng)建一棵決策樹;
12、s24:采用后剪枝算法當(dāng)中的代價復(fù)雜度剪枝ccp對id3算法進(jìn)行改進(jìn),在創(chuàng)建決策樹時對節(jié)點(diǎn)進(jìn)行條件判斷是否需要剪枝,對決策樹id3算法進(jìn)行參數(shù)的修改和調(diào)整,當(dāng)達(dá)到預(yù)測的擬合效果后,得到基于改進(jìn)決策樹id3算法的工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配模型算法。
13、進(jìn)一步,步驟s21中,用戶從各個異構(gòu)網(wǎng)絡(luò)調(diào)度的測試用例庫或從公共數(shù)據(jù)集平臺,收集工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)數(shù)據(jù),作為工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配模型的輸入,將此數(shù)據(jù)集定義為機(jī)器學(xué)習(xí)模型的數(shù)據(jù)特征集w,其表式為:
14、w={c1,c2,c3,…cn}
15、cn表示工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入的特征參數(shù),n代表在特定的工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法中的參數(shù)個數(shù);
16、將數(shù)據(jù)特征集w劃分為訓(xùn)練數(shù)據(jù)集d和測試數(shù)據(jù)集t;然后對數(shù)據(jù)的缺失值、標(biāo)準(zhǔn)化、歸一化處理。
17、進(jìn)一步,步驟s22中具體包括以下步驟:
18、s221:將工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)匹配出的隨機(jī)調(diào)度算法結(jié)果稱為輸入調(diào)度算法特征參數(shù)的經(jīng)驗(yàn)熵,計(jì)算工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)數(shù)據(jù)集的經(jīng)驗(yàn)熵h(d),用l(ri)表示為出現(xiàn)某一個調(diào)度算法結(jié)果的期望值,其表達(dá)式為:
19、l(ri)=-log2p(ri)
20、其中p(ri)表示出現(xiàn)調(diào)度算法ri的結(jié)果概率,通過上式疊加得到工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法的所有匹配結(jié)果的信息期望值即熵,其表達(dá)式為:
21、
22、當(dāng)信息期望值的概率由訓(xùn)練集計(jì)算得到時,所對應(yīng)的熵成為經(jīng)驗(yàn)熵,訓(xùn)練集為d,則該訓(xùn)練集的經(jīng)驗(yàn)熵為h(d),|d|表示該訓(xùn)練集樣本容量大小,其中調(diào)度算法輸入?yún)?shù)特征集w={c1,c2,c3,…cn},|ci|表示在訓(xùn)練集d中特征為ci的樣本個數(shù),經(jīng)驗(yàn)熵的公式寫為:
23、
24、s222:計(jì)算工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)數(shù)據(jù)集的條件熵,條件熵h(y|x)表示在已知隨機(jī)變量x的條件下隨機(jī)變量y的不確定性;
25、隨機(jī)變量x表示為調(diào)度算法輸入?yún)?shù)特征集w={c1,c2,c3,…cn}中的隨機(jī)可能取值,y代表當(dāng)x取值為特征集w中的某一特定值時,匹配結(jié)果為工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法集合r中的某一特定值ri,定義為x給定條件下y的條件概率分布的熵對x的數(shù)學(xué)期望:
26、
27、p(ri)表示為取值為特征集w中的某一特定值時,匹配結(jié)果為工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法集合r中的某一特定值ri的概率分布,即x=ci時對應(yīng)y=ri的概率分布,設(shè)|ci|為當(dāng)輸入特征參數(shù)值為ci的樣本容量大小,為參數(shù)特征為ci,調(diào)度算法匹配結(jié)果為ri的樣本容量大?。?/p>
28、
29、當(dāng)條件熵的概率由訓(xùn)練集計(jì)算得到時,所對應(yīng)的熵成為條件經(jīng)驗(yàn)熵,設(shè)|d|為工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)訓(xùn)練集的樣本容量大小,工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)數(shù)據(jù)集的條件經(jīng)驗(yàn)熵的公式寫為:
30、
31、s223:計(jì)算工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入特征參數(shù)數(shù)據(jù)集的目標(biāo)值信息增益,即調(diào)度算法的最優(yōu)輸入特征參數(shù);工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入?yún)?shù)特征集w中的特征cn對調(diào)度算法匹配函數(shù)模型的訓(xùn)練數(shù)據(jù)集d的信息增益為g(d|w),定義為調(diào)度算法匹配函數(shù)模型的訓(xùn)練數(shù)據(jù)集d的經(jīng)驗(yàn)熵h(d)與工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法輸入?yún)?shù)特征集w給定條件下d的經(jīng)驗(yàn)條件熵h(d|w)之差,即:
32、g(d|w)=h(d)-h(d|w)
33、特征為cn的信息增益公式為:
34、
35、計(jì)算比較特征集中每一個參數(shù)特征的信息增益大小,選擇wi中的最大信息增益值作為最優(yōu)特征。
36、進(jìn)一步,步驟s23中,決策樹生成后,依據(jù)根節(jié)點(diǎn)特征參數(shù)的不同取值建立決策樹分枝:采用遞歸的方法,以選擇信息增益最大的特征參數(shù)作為當(dāng)前節(jié)點(diǎn)的確定標(biāo)準(zhǔn),對分支節(jié)點(diǎn)不斷進(jìn)行劃分,直到所有的分枝節(jié)點(diǎn)子集中的數(shù)據(jù)的調(diào)度需求類別相同,由此構(gòu)造完成一棵決策樹;
37、改進(jìn)決策樹id3算法的約束停止條件有:如果樹的深度達(dá)到設(shè)定的闕值;如果該節(jié)點(diǎn)的子節(jié)點(diǎn)所含特征參數(shù)小于設(shè)定的闕值;如果沒有特征參數(shù)能滿足設(shè)定的分裂準(zhǔn)則的闕值;
38、若滿足決策樹停止約束條件,不再對剩下的數(shù)據(jù)集進(jìn)行劃分,將此特征作為葉子節(jié)點(diǎn);
39、若不滿足決策樹停止約束條件,設(shè)此分支的最優(yōu)特征參數(shù)為a,將a中所有取值的訓(xùn)練集作為新的訓(xùn)練集,特征集w中除掉a剩下的特征集作為新的特征集ai,然后遞歸地構(gòu)建子樹;在每個節(jié)點(diǎn)處,根據(jù)最佳分裂特征將數(shù)據(jù)集劃分為兩個或多個子集,然后對每個子集遞歸地執(zhí)行這一過程,直到滿足終止條件。
40、進(jìn)一步,步驟s24中,決策樹開始生成后,從根節(jié)點(diǎn)到生成每一個分支的葉子節(jié)點(diǎn)前計(jì)算所有節(jié)點(diǎn)誤差率增益值,判斷該分支的誤差率增益值是否小于最小的非葉子節(jié)點(diǎn),若不滿足則輪詢遍歷其他非葉子節(jié)點(diǎn),直到滿足剪枝條件后再對該分支進(jìn)行剪枝操作,通過剪枝來修改和優(yōu)化算法模型參數(shù);使用測試數(shù)據(jù)集t評估決策樹的性能通過評估工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配預(yù)測模型的準(zhǔn)確率、召回率、f1值對決策樹進(jìn)行調(diào)整,包括進(jìn)行重新剪枝或重新訓(xùn)練,從而對算法參數(shù)的調(diào)整和優(yōu)化,得到工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配預(yù)測模型。
41、進(jìn)一步,步驟s24中,采用代價復(fù)雜度剪枝ccp方法進(jìn)行剪枝,ccp選擇節(jié)點(diǎn)表面誤差增益值最小的非葉子節(jié)點(diǎn),刪除該非葉子節(jié)點(diǎn)的左右子節(jié)點(diǎn),若有多個非葉子節(jié)點(diǎn)的表面誤差率增益值相同,則選擇非葉子節(jié)點(diǎn)中子節(jié)點(diǎn)最多的非葉子節(jié)點(diǎn)進(jìn)行剪枝,剪枝過程中將子樹刪除,用一個葉子結(jié)點(diǎn)來替代,該結(jié)點(diǎn)的類別同樣也可以通過測試集上的準(zhǔn)確率來判斷,如果剪枝過后準(zhǔn)確率有提升,則進(jìn)行剪枝;
42、ccp算法為子樹tt定義代價和復(fù)雜度,以及一個衡量代價與復(fù)雜度之間關(guān)系的參數(shù)α:從決策樹分支t0開始自下而上不斷剪枝直到t0的根節(jié)點(diǎn),形成一個子樹序列{t0,t1,…,tn},然后逐個遍歷對比非葉子節(jié)點(diǎn)上的誤差率增益值,判斷分支t0是否小于遍歷中的最小值,從而對該分支進(jìn)行剪枝,計(jì)算分類的誤差率增益值數(shù)學(xué)推導(dǎo)公式如下:
43、
44、α衡量的是每個節(jié)點(diǎn)所能減少的分類誤差率增益值,e(t)表示葉子節(jié)點(diǎn)的誤差代價,e(tt)則表示子樹的誤差代價,e(t)為節(jié)點(diǎn)的錯誤率,p(t)為節(jié)點(diǎn)的數(shù)量占比,n(t)表示決策樹葉子節(jié)點(diǎn)總數(shù);α越小,說明該節(jié)點(diǎn)所能減少的分類誤差率越??;當(dāng)α=0時,e(t)=e(tt),進(jìn)行剪枝,并將該節(jié)點(diǎn)作為葉子節(jié)點(diǎn)。
45、進(jìn)一步,步驟s3中,將工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配預(yù)測模型部署在工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度系統(tǒng)的后端,包括以下步驟:
46、s31:在項(xiàng)目中添加與web開發(fā)和機(jī)器學(xué)習(xí)加載相關(guān)環(huán)境依賴,來實(shí)現(xiàn)兩種機(jī)器語言的交互;
47、s32:在工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度系統(tǒng)后端加載工業(yè)異構(gòu)網(wǎng)絡(luò)調(diào)度算法匹配預(yù)測模型,將模型以文件的形式保存并直接調(diào)用該輸出文件;
48、s33:通過設(shè)計(jì)api端點(diǎn),創(chuàng)建一個服務(wù)類封裝對api的調(diào)用,將輸入數(shù)據(jù)轉(zhuǎn)換為適當(dāng)?shù)母袷?,發(fā)送請求,并將響應(yīng)轉(zhuǎn)換對象,確保能夠正常接收輸入并返回預(yù)測結(jié)果;
49、s34:確保從后端應(yīng)用到調(diào)取模型服務(wù)的通信正常工作,機(jī)器學(xué)習(xí)模型的推理結(jié)果符合預(yù)期,根據(jù)需要優(yōu)化模型服務(wù)的性能。
50、本發(fā)明的有益效果在于:本發(fā)明針對不同用戶的網(wǎng)絡(luò)調(diào)度需求往往需要進(jìn)行多種異構(gòu)網(wǎng)絡(luò)調(diào)度算法的切換選擇,快速、高效、準(zhǔn)確的根據(jù)用戶調(diào)度需求匹配最優(yōu)調(diào)度算法問題,提高了工業(yè)網(wǎng)絡(luò)傳輸?shù)募磿r性,實(shí)現(xiàn)了工業(yè)自動化和智能化選擇。
51、本發(fā)明的其他優(yōu)點(diǎn)、目標(biāo)和特征在某種程度上將在隨后的說明書中進(jìn)行闡述,并且在某種程度上,基于對下文的考察研究對本領(lǐng)域技術(shù)人員而言將是顯而易見的,或者可以從本發(fā)明的實(shí)踐中得到教導(dǎo)。本發(fā)明的目標(biāo)和其他優(yōu)點(diǎn)可以通過下面的說明書來實(shí)現(xiàn)和獲得。