两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于決策樹(shù)算法的制造業(yè)材料采購(gòu)分析方法與流程

文檔序號(hào):11063805閱讀:975來(lái)源:國(guó)知局
一種基于決策樹(shù)算法的制造業(yè)材料采購(gòu)分析方法與制造工藝

本發(fā)明涉及企業(yè)管理領(lǐng)域,具體地涉及用算法分析制造業(yè)材料采購(gòu)問(wèn)題領(lǐng)域。



背景技術(shù):

隨著全球市場(chǎng)一體化以及信息時(shí)代的來(lái)臨,專(zhuān)業(yè)生產(chǎn)能夠發(fā)揮其巨大的作用,企業(yè)采購(gòu)的比重也大大增加,采購(gòu)的重要性日益被人們所認(rèn)識(shí)。在全球范圍內(nèi),在工業(yè)企業(yè)的產(chǎn)品構(gòu)成中,采購(gòu)的原料以及零部件成本隨著行業(yè)不同而不同,大體在30%-90%,平均水平在60%以上。從世界范圍來(lái)說(shuō),對(duì)于一個(gè)典型的企業(yè),采購(gòu)成本(包括原材料,零部件)要占60%。而在中國(guó)的工業(yè)企業(yè),各種物資的采購(gòu)成本要占到企業(yè)銷(xiāo)售成本的70%。顯然采購(gòu)成本是企業(yè)管理中的主體和核心部分,采購(gòu)是企業(yè)管理中“最有價(jià)值”的部分。另外,根據(jù)國(guó)家經(jīng)貿(mào)委1999年發(fā)布的有關(guān)數(shù)據(jù),如果國(guó)有大中型企業(yè)每年降低采購(gòu)成本2%-3%,則可增加效益500多億人民幣,相當(dāng)于1997年國(guó)有工業(yè)企業(yè)實(shí)現(xiàn)的利潤(rùn)總和。因此,采購(gòu)受到了社會(huì)各界相當(dāng)?shù)闹匾?,促使采?gòu)研究成為當(dāng)今社會(huì)的熱點(diǎn)問(wèn)題之一。

C4.5算法是決策樹(shù)類(lèi)算法的一種,由Quinlan于1993年提出,現(xiàn)已居于決策樹(shù)經(jīng)典分類(lèi)之首。C4.5算法是ID3算法的改進(jìn)算法,是一種基于信息增益率的決策分析算法。具體而言,它是以算法選擇信息增益的擴(kuò)充信息增益率為屬性選擇度量,爭(zhēng)取克服算法中關(guān)于多值屬性選擇的偏向性問(wèn)題,其關(guān)于決策樹(shù)分類(lèi)器模型的構(gòu)造過(guò)程同算法相同。

C4.5算法產(chǎn)生的分類(lèi)規(guī)則易于理解,準(zhǔn)確率較高。但是在構(gòu)造樹(shù)的過(guò)程中,需要對(duì)數(shù)據(jù)集進(jìn)行多次的順序掃描和排序,因而導(dǎo)致算法的效率較低。并且,由于其根據(jù)字段進(jìn)行分類(lèi)的特性,當(dāng)類(lèi)別較多時(shí),其錯(cuò)誤率較高。



技術(shù)實(shí)現(xiàn)要素:

針對(duì)現(xiàn)有技術(shù)的上述不足,本發(fā)明要解決的技術(shù)問(wèn)題是提供一種基于C4.5算法的制造業(yè)材料采購(gòu)分析方法。

本發(fā)明的目的是克服現(xiàn)有技術(shù)中存在的問(wèn)題:C4.5算法掃描樣本次數(shù)多效率低,準(zhǔn)確率達(dá)不到想要效果以及C4.5在物料采購(gòu)分析時(shí)只是基于字段分析,錯(cuò)誤率高。

本發(fā)明為實(shí)現(xiàn)上述目的所采用的技術(shù)方案是:一種基于C4.5算法的制造業(yè)材料采購(gòu)分析方法。該算法的步驟如下:

步驟1:計(jì)算屬性的信息熵:把采購(gòu)的供應(yīng)商、價(jià)格、數(shù)量等信息作為C4.5算法的樣本集參數(shù),按照算法計(jì)算出屬性的信息熵。

步驟2:計(jì)算分割后的類(lèi)別的條件熵:將樣本集分割成若干個(gè)屬性,計(jì)算屬性條件熵。

步驟3:計(jì)算類(lèi)別的信息熵:利用信息熵公式計(jì)算類(lèi)別的信息熵。

步驟4:判斷所有屬性是否計(jì)算完,已計(jì)算完轉(zhuǎn)到步驟1,否則轉(zhuǎn)步驟5。

步驟5:計(jì)算信息增益率:信息增益率為屬性的信息熵與類(lèi)別信息熵之差。

步驟6:按分裂屬性值創(chuàng)建決策樹(shù):在某一屬性集合中將最大增益率的屬性作為分列屬性,將最大增益率的屬性作為樹(shù)雙親結(jié)點(diǎn),其余的作為該結(jié)點(diǎn)的孩子。

步驟7:剪枝判定:當(dāng)決策樹(shù)劃分得太細(xì),數(shù)據(jù)量很大時(shí),需要設(shè)定一個(gè)規(guī)則,使算法及時(shí)收斂,避免算法的無(wú)限分支和無(wú)限增長(zhǎng),即剪枝。本發(fā)明采用前剪枝法結(jié)合樹(shù)深度限定法對(duì)決策樹(shù)進(jìn)行剪枝。

步驟8:判斷是否構(gòu)建完決策樹(shù),如果構(gòu)建完成,則轉(zhuǎn)步驟9,否則轉(zhuǎn)步驟1。

步驟9:輸出決策分析結(jié)果:本發(fā)明采用后剪枝法對(duì)建立好的決策樹(shù)進(jìn)行剪枝,構(gòu)建最優(yōu)決策樹(shù)。最優(yōu)決策樹(shù)即為決策分析結(jié)果。

本發(fā)明的有益效果是:

1.通過(guò)前剪枝法和樹(shù)深度限定法對(duì)決策樹(shù)的分割進(jìn)行限制,防止算法無(wú)限發(fā)散。

2.利用信息增益標(biāo)準(zhǔn)差作為前剪枝法的限定條件,提高了算法的準(zhǔn)確率。

3.通過(guò)后剪枝法構(gòu)建最優(yōu)決策樹(shù)。簡(jiǎn)單有效,易于實(shí)現(xiàn)和理解。最優(yōu)決策樹(shù)將給出一個(gè)確定的采購(gòu)方案,簡(jiǎn)單明了,實(shí)用性高。

附圖說(shuō)明

圖1為一種基于C4.5算法的制造業(yè)材料采購(gòu)分析方法流程圖

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合算法流程圖 進(jìn)行詳細(xì)、具體說(shuō)明。

一、算法基本思想

決策樹(shù)是一種基于分類(lèi)思想的決策分析方法,ID3算法是基于信息增量的決策樹(shù)分析算法,C4.5算法是ID3算法的改進(jìn)算法,是一種基于信息增益率的決策分析算法。本發(fā)明通過(guò)利用改進(jìn)的C4.5算法分析預(yù)測(cè)制造業(yè)材料的采購(gòu)問(wèn)題。通過(guò)前剪枝法和樹(shù)深度限定法對(duì)決策樹(shù)的分割進(jìn)行限制,通過(guò)后剪枝法構(gòu)建最優(yōu)決策樹(shù)。最優(yōu)決策樹(shù)將給出一個(gè)確定的采購(gòu)方案,即:哪個(gè)材料到哪個(gè)供應(yīng)商那里去采購(gòu),采購(gòu)多少,才能保證作業(yè)車(chē)間生產(chǎn)正常有序進(jìn)行。

二、具體實(shí)施步驟

將物料供應(yīng)商的類(lèi)型、等級(jí)、所能供給的數(shù)量、所供給物料的質(zhì)量信用度、供應(yīng)商規(guī)模等信息抽象到C4.5算法中,作為算法的數(shù)據(jù)樣本、屬性等參數(shù)。具體問(wèn)題具體給出對(duì)應(yīng)的參數(shù)關(guān)系。改進(jìn)的C4.5算法具體實(shí)施步驟如下:

步驟1:計(jì)算屬性的信息熵:設(shè)S為已知類(lèi)標(biāo)號(hào)的數(shù)據(jù)樣本集,類(lèi)標(biāo)號(hào)屬性為C={Ci|i=1,2,...,z},定義了m個(gè)不同類(lèi)的Ci(i=1,2,...,z)。設(shè)Ci,s是S中Ci類(lèi)數(shù)據(jù)樣本的集合,|S|和|Ci,s|分別表示S和Ci,s的樣本個(gè)數(shù)。則對(duì)Ci,s的信息熵Info(S)定義如下:

其中,pi是Ci,s中任意數(shù)據(jù)樣本屬于類(lèi)Ci的概率,Info(S)的實(shí)際意義是類(lèi)別S中數(shù)據(jù)樣本分類(lèi)的平均信息量。

步驟2:計(jì)算分割后的類(lèi)別的條件熵:若分類(lèi)屬性Ai={aij|j=1,2,...,ni}將S劃分成ni個(gè)不同的子集Sij={(Xi,Yi)∈S|xij=aij}表示數(shù)據(jù)樣本集S中在Ai上的取值為aij的所有樣本組成的集合。選擇S的一個(gè)屬性A,則類(lèi)別分割后的類(lèi)別條件熵計(jì)算公式為:

步驟3:計(jì)算類(lèi)別的信息熵:若選擇屬性Ai作為分裂屬性,則類(lèi)別信息熵為:

步驟4:判斷所有屬性是否計(jì)算完,已計(jì)算完轉(zhuǎn)到步驟1,否則轉(zhuǎn)步驟5。

步驟5:信息增益率的計(jì)算:信息增益率使用分裂信息值將信息增益規(guī)范化。屬性Ai的信息增益為

從信息增益的計(jì)算公式可以看出,Gain(Ai)的實(shí)際意義是基于屬性Ai分裂后,數(shù)據(jù)集所含信息量的有效減少量。信息增益越大,表明按屬性Ai對(duì)數(shù)據(jù)集分裂所需的期望信息越少,即屬性Ai解決的不確定信息量越大,分裂后的輸出分區(qū)越純。

則信息增益率為:

步驟6:按分裂屬性值創(chuàng)建決策樹(shù):決策樹(shù)基于數(shù)據(jù)結(jié)構(gòu)中樹(shù)的概念。決策樹(shù)C4.5的創(chuàng)建是通過(guò)將所有屬性的信息增益率按大小排序,然后將各個(gè)屬性作為分支的根節(jié)點(diǎn)的順序。

在某一屬性集合中將最大增益率的屬性作為分列屬性,即θ=max{GainRatio(A)},即將最大增益率的屬性作為樹(shù)雙親結(jié)點(diǎn),其余的作為該結(jié)點(diǎn)的孩子。

步驟7:剪枝判定:當(dāng)決策樹(shù)劃分得太細(xì),數(shù)據(jù)量很大時(shí),需要設(shè)定一個(gè)規(guī)則,使算法及時(shí)收斂,避免算法無(wú)限分支無(wú)限增長(zhǎng),即剪枝。本發(fā)明采用前剪枝法結(jié)合樹(shù)深度限定法對(duì)決策樹(shù)進(jìn)行剪枝。具體的實(shí)施如下:

前剪枝法:前剪枝法是指在構(gòu)造樹(shù)的過(guò)程中知道某些節(jié)點(diǎn)可以剪掉時(shí),就不對(duì)此類(lèi)節(jié)點(diǎn)進(jìn)行分裂。本發(fā)明通過(guò)計(jì)算增益率方差來(lái)確定是否對(duì)某一節(jié)點(diǎn)剪枝。增益率標(biāo)準(zhǔn)差大于某一設(shè)定值,則對(duì)該節(jié)點(diǎn)剪枝,否則可以分割建立其子樹(shù)。數(shù)學(xué)公式描述為:

σi=GainRatio(Ai)-μ

如果σi>ε(標(biāo)準(zhǔn)差限定值),則剪枝,否則繼續(xù)分割生成決策子樹(shù)。

樹(shù)深度限定法:設(shè)定一個(gè)確定的樹(shù)深度值L,當(dāng)決策樹(shù)的深度到達(dá)L以后,停止分割。

步驟8:判斷是否構(gòu)建完決策樹(shù),如果構(gòu)建完成,則轉(zhuǎn)步驟9,否則轉(zhuǎn)步驟1。

步驟9:輸出決策分析結(jié)果:創(chuàng)建了決策樹(shù)后,可以清晰的看到各個(gè)屬性的效果,但是要得到一個(gè)具體的方案,還需要進(jìn)一步的分析才能得到確切的決策方案。本發(fā)明采用后剪枝法對(duì)建立好的決策樹(shù)進(jìn)行剪枝,最后留下最優(yōu)決策樹(shù)作為最終的決策樹(shù)。后剪枝方法描述為:在建立好一顆決策樹(shù)以后,通過(guò)一定的剪枝標(biāo)準(zhǔn)來(lái)確定該剪掉的子樹(shù)。本發(fā)明對(duì)后剪枝標(biāo)準(zhǔn)設(shè)定為:通過(guò)計(jì)算價(jià)值函數(shù)值,來(lái)判定如何構(gòu)建最優(yōu)決策樹(shù)。價(jià)值函數(shù)用信息增益來(lái)刻畫(huà)。具體計(jì)算如下:

(1)在決策樹(shù)的第L層剪枝:

計(jì)算第L層節(jié)點(diǎn)的價(jià)值函數(shù)值:cl,i=Gain(Ai)。

選第L層節(jié)點(diǎn)中價(jià)值函數(shù)值最大的節(jié)點(diǎn)作為最優(yōu)決策樹(shù)第L層的右孩子,選該右孩子的兄弟節(jié)點(diǎn)中價(jià)值函數(shù)值最大的兄弟節(jié)點(diǎn)作為最優(yōu)決策樹(shù)第L層的左孩子。其余的第L層的節(jié)點(diǎn)剪掉。

(2)在決策樹(shù)第2層到(L-1)層節(jié)點(diǎn)剪枝:

計(jì)算第l層的價(jià)值函數(shù):

cl,i=cl+1,i+Gain(Ai),l=2,3,...,(L-1)。

其中,cl+1,i為第l層節(jié)點(diǎn)的在第(l+1)層的還未被剪掉的孩子價(jià)值,明顯地,如果沒(méi)有留下來(lái)的孩子,則cl+1,i=0。同樣的,選第l層節(jié)點(diǎn)中價(jià)值函數(shù)值最大的節(jié)點(diǎn)作為最優(yōu)決策樹(shù)第l層的右孩子,選該右孩子的兄弟節(jié)點(diǎn)中價(jià)值函數(shù)值最大的兄弟節(jié)點(diǎn)作為最優(yōu)決策樹(shù)第l層的左孩子。其余的第l層的節(jié)點(diǎn)剪掉。如此下去,最終會(huì)得到一棵最優(yōu)決策樹(shù)。最優(yōu)決策樹(shù)即為決策分析結(jié)果。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
桐梓县| 嫩江县| 禹州市| 芮城县| 德惠市| 琼海市| 博白县| 翁牛特旗| 英山县| 社旗县| 林州市| 军事| 手游| 开江县| 普兰店市| 孝感市| 嘉峪关市| 汉源县| 北海市| 商河县| 大厂| 桃园市| 靖州| 扎鲁特旗| 阳城县| 蒙阴县| 金乡县| 大同县| 临猗县| 石渠县| 宜城市| 苍山县| 白朗县| 恩平市| 象州县| 敦化市| 汉川市| 湘乡市| 广河县| 沐川县| 邵阳市|