專利名稱:基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種能快速、準(zhǔn)確對(duì)事物進(jìn)行分類或模式識(shí)別的方法,屬識(shí)別技術(shù)領(lǐng)域。
背景技術(shù):
模式識(shí)別在很多科學(xué)和技術(shù)領(lǐng)域得到了廣泛的重視,推動(dòng)了人工智能系統(tǒng)的發(fā)展,擴(kuò)大 了計(jì)算機(jī)應(yīng)用的可能。 一般把通過對(duì)具體個(gè)別事物進(jìn)行觀測所得的具體時(shí)間和空間分布的信 息稱為模式,把模式所屬的類別或同類中模式的總體稱為模式類。
人工免疫系統(tǒng)是一種基于理論生物學(xué)啟發(fā)而來的計(jì)算范式,它借鑒了一些免疫系統(tǒng)的 功能、原理和模型用于復(fù)雜問題的解決。人工免疫系統(tǒng)在信息安全、模式識(shí)別、數(shù)據(jù)挖掘和 故障診斷等方面得到了許多研究和應(yīng)用,取得了較好的效果。但是,目前人工免疫算法大多 存在算法復(fù)雜、人工設(shè)置參數(shù)較多、需要不斷進(jìn)行調(diào)整等問題。
發(fā)明內(nèi)容
本發(fā)明的目的是克服已有技術(shù)之缺陷而提供一種算法簡便、準(zhǔn)確率高的基于免疫抗體網(wǎng) 絡(luò)的模式識(shí)別方法。
本發(fā)明所述問題是以下述技術(shù)方案實(shí)現(xiàn)的
一種基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法。免疫抗體網(wǎng)絡(luò)進(jìn)行模式識(shí)別前,需根據(jù)用戶的 訓(xùn)練樣本數(shù)據(jù)對(duì)免疫抗體網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練后的免疫抗體網(wǎng)絡(luò)即可應(yīng)用于解決模式識(shí)別問 題,免疫抗體網(wǎng)絡(luò)的訓(xùn)練過程是-
隨機(jī)抽取一定數(shù)目的各類訓(xùn)練樣本,生成免疫抗體網(wǎng)絡(luò)中的初始抗體,完成免疫抗體 網(wǎng)絡(luò)的初始化;
按照順序或隨機(jī)將所有訓(xùn)練樣本作為輸入抗原,輸入到免疫抗體網(wǎng)絡(luò),免疫抗體網(wǎng)絡(luò)中 的抗體,根據(jù)抗體生成算法對(duì)輸入抗原進(jìn)行學(xué)習(xí)和記憶,提取各類訓(xùn)練樣本數(shù)據(jù)的模式特征; 反復(fù)訓(xùn)練免疫抗體網(wǎng)絡(luò),當(dāng)免疫抗體網(wǎng)絡(luò)連續(xù)兩次訓(xùn)練的結(jié)果一致時(shí)(即連續(xù)的兩次 訓(xùn)練,免疫抗體網(wǎng)絡(luò)中各類抗體的數(shù)目沒有發(fā)生變化),免疫抗體網(wǎng)絡(luò)訓(xùn)練終止。
上述基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,所述免疫抗體網(wǎng)絡(luò)的初始化的方法是 用戶給定的訓(xùn)練樣本一般用n維的實(shí)數(shù)向量來表示,把訓(xùn)練樣本作為抗原,即用n維的實(shí)數(shù)向量表示抗原,如用n維實(shí)數(shù)向量力^來表示了第J個(gè)抗原
々,(《"g盧…,、J 相應(yīng)地,免疫抗體網(wǎng)絡(luò)中的抗體,用(n+2)維的實(shí)數(shù)向量來表示,如用(n+2)維實(shí)數(shù)向量 j&表示了免疫抗體網(wǎng)絡(luò)中的第i個(gè)抗體
,=(t;,c,,h."a)
其中,r,是抗體j/v所屬的類別信息,即抗體J&能夠識(shí)別的抗原的類別;G是抗體力^
的濃度,大體表示抗體應(yīng)能夠識(shí)別的抗原的數(shù)量的多少,瓶; 應(yīng)。為抗體他的屬性信息,
表示抗體模式特征;
設(shè)抗原(既訓(xùn)練樣本)的分類的類別數(shù)為m,每類抗原抽取的數(shù)目是k,則免疫抗體網(wǎng) 絡(luò)初始化過程中,初始抗體的生成的方法是根據(jù)每一個(gè)隨機(jī)抽取的抗原的類別和屬性信息, 分別確定一個(gè)初始抗體的類別信息和屬性信息,并且所有初始抗體的濃度取值為零。故此, 初始化后的免疫抗體網(wǎng)絡(luò),共計(jì)包含有mXk個(gè)初始抗體,其中m是抗原的分類的類別數(shù),
k是每類抗體的初始設(shè)定數(shù)目。每個(gè)初始抗體的類別信息r,,與對(duì)應(yīng)隨機(jī)抽取的、生成該初
始抗體的抗原的類別一致,其屬性信息也與對(duì)應(yīng)隨機(jī)抽取的、生成該初始抗體的抗原一致, 所有初始抗體的濃度初始值G均取零。所述各類初始抗體數(shù)目k,根據(jù)分類識(shí)別問題的難易 程度(同一個(gè)類別的不同個(gè)體之間特征值的波動(dòng)和不同類別的樣本特征值之間的差異)來確 定難度越高,各類初始抗體數(shù)目設(shè)置的越大, 一般每個(gè)類別的抗體數(shù)目k,可取值為10至 30。
上述基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,所述免疫抗體網(wǎng)絡(luò)的訓(xùn)練方法是按照順序或 隨機(jī)選取一個(gè)訓(xùn)練樣本作為抗原輸入到免疫抗體網(wǎng)絡(luò),稱為抗原提呈,免疫抗體網(wǎng)絡(luò)中的抗 體,根據(jù)抗體生成算法,對(duì)提呈抗原進(jìn)行學(xué)習(xí)和記憶,直至所有訓(xùn)練樣本(抗原)提呈輸入 完畢,這一過程稱為完成了一次訓(xùn)練。對(duì)免疫抗體網(wǎng)絡(luò)進(jìn)行多次訓(xùn)練,當(dāng)連續(xù)兩次訓(xùn)練結(jié)果 一致時(shí),即連續(xù)的兩次訓(xùn)練,免疫抗體網(wǎng)絡(luò)中各類抗體的數(shù)目不再發(fā)生變化時(shí),則訓(xùn)練終止。
上述基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,所述抗體生成算法是
定義
① 相似度描述兩個(gè)樣本之間的相似或相近的程度,常以某種距離作為相似度的測 量標(biāo)準(zhǔn),如常用的歐幾里的德距離;
② 4:免疫抗體網(wǎng)絡(luò)中抗體^^與抗原力&間的相似度;
③ 免疫抗體網(wǎng)絡(luò)中抗體^^與抗體^^間的相似度;
6④":免疫抗體網(wǎng)絡(luò)中所有抗體與抗原力&的相似度矩陣(Ag-Ab),其數(shù)據(jù)元素為4;
◎ &免疫抗體網(wǎng)絡(luò)中所有抗體之間的相似度矩陣(Ab-Ab),其數(shù)據(jù)元素為&7;
免疫抗體網(wǎng)絡(luò)中與輸入的提呈抗原^&親和度最高的抗體(如果存在多個(gè)親
和度最高的抗體,可以任選其中一個(gè)),即滿足& = min(D),該抗體稱為識(shí)別
抗體,記為
⑦ 免疫抗體網(wǎng)絡(luò)中的識(shí)別抗體^&,如果其類別與輸入的提呈抗原力&一致, 則該抗體稱為最佳識(shí)別抗體,記為
⑧ 抗體進(jìn)化免疫抗體網(wǎng)絡(luò)中的抗體J&對(duì)輸入的提呈抗原力&的完成學(xué)習(xí)和記憶, 其計(jì)算公式為
雄'=(C,. x哉* +々,)/ (C, +1), yt = 1,2,…,"
雄=(7;,0 2',""我')
◎抗體合并:免疫抗體網(wǎng)絡(luò)中的兩個(gè)同類的抗體力&與^^合并成為一個(gè)新抗體^^,
免疫抗體網(wǎng)絡(luò)中原有的抗體(應(yīng)和為)從免疫抗體網(wǎng)絡(luò)中刪除,新抗體他的
取值按下式計(jì)算
4 = C, x氛+ q x氣,附=1, 2,…,"
⑩抗體新生根據(jù)當(dāng)前輸入的提呈抗原^&,在免疫抗體網(wǎng)絡(luò)中,插入一個(gè)新的抗 體^&,新抗體J&的取值為
雄=(7},1,々",々盧...,々, )
其中新抗體^^.的類別信息7}根據(jù)當(dāng)前輸入的提呈抗原^&的類別保持一致。 根據(jù)以上的定義,所述抗體生成算法是首先計(jì)算提呈抗原力&與免疫抗體網(wǎng)絡(luò)中所有抗 體間的相似度,得到相似度矩陣";根據(jù)相似度矩陣,在免疫抗體網(wǎng)絡(luò)中選取識(shí)別抗體^^;如
果識(shí)別抗體瓶的類別與提呈抗原急的類別不一致,即7}#7;,則免疫抗體網(wǎng)絡(luò)發(fā)生抗體新生,
即免疫抗體網(wǎng)絡(luò)針對(duì)提呈抗原j&產(chǎn)生新抗體j&,算法結(jié)束;若識(shí)別抗體^^的類別與提呈抗 原j&的類別一致( }=7;),則得到最佳識(shí)別抗體J&,即力&=^^;計(jì)算J&與免疫抗體網(wǎng)絡(luò)中
類別相同的所有抗體的相似度,得到抗體相似度矩陣5;根據(jù)抗體相似度矩陣6;選擇與最佳 識(shí)別抗體力&親和度最高的同類抗體,該抗體記為^A,如果最佳識(shí)別抗體j&與其親和度最高的同類抗體截的相似度,大于最佳識(shí)別抗體必6與提呈抗原命y的相似度4,即滿足^>啦'/7 0, 則根據(jù)提呈抗原^&,免疫抗體網(wǎng)絡(luò)發(fā)生抗體新生,產(chǎn)生新抗體^^,同時(shí)最佳識(shí)別抗體^^與 親和度最高的同類抗體^^執(zhí)行抗體合并,算法結(jié)束;否則,最佳識(shí)別抗體^^艮據(jù)提呈抗原J^ 發(fā)生抗體進(jìn)化,最佳識(shí)別抗體^^t提呈抗原^&完成學(xué)習(xí)和記憶,算法結(jié)束。
本發(fā)明仿生生物免疫系統(tǒng)中抗體對(duì)抗原的高效識(shí)別與記憶^l理,提出了具有自組織、自 學(xué)習(xí)和記憶能力的免疫抗體網(wǎng)絡(luò),并設(shè)計(jì)了抗體生成算法,能夠應(yīng)用于模式識(shí)別。本發(fā)明方 法計(jì)算簡便,無需人工設(shè)置參數(shù)與閾值,具有很高的正確識(shí)別率,適合于字體識(shí)別、故障診 斷等計(jì)算機(jī)應(yīng)用領(lǐng)域。
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說明。 圖l是免疫抗體網(wǎng)絡(luò)示意圖。
圖中及文中所用符號(hào)為a、 b、 C、抗體,*,、抗原或訓(xùn)練樣本,々;1,jg/2,...,々y 、 力&的各維屬性信息,屈,、抗體,7}、抗體屈,所屬的類別,G 、抗體^^的濃度,力& ^^、 抗體瓶的屬性信息,4、抗體戲與抗原敘間相似度,&,、免疫抗體網(wǎng)絡(luò)中抗體瓶與抗體
截.間的相似度,從相似度矩陣(Ag-Ab), 5"、相似度矩陣(Ab-Ab),應(yīng)、識(shí)別抗體,瓶、最
佳識(shí)別抗體。
具體實(shí)施例方式
仿生生物免疫系統(tǒng)中抗體對(duì)抗原的高效識(shí)別與記憶機(jī)理,本發(fā)明設(shè)計(jì)了一種免疫抗體網(wǎng) 絡(luò)和抗體生成算法,應(yīng)用于模式識(shí)別領(lǐng)域。 以下對(duì)本發(fā)明做進(jìn)一步解釋。
1) 免疫抗體網(wǎng)絡(luò)
免疫抗體網(wǎng)絡(luò)是以若干不同類別的抗體為節(jié)點(diǎn)構(gòu)成的圖。其中,相同類別的抗體連接在 一起(是指邏輯上根據(jù)抗體的類型一致、連接在一起的抗體具有相同的類型),形成一個(gè)連通 子圖,每個(gè)抗體(節(jié)點(diǎn))具有一定的濃度,濃度作為該節(jié)點(diǎn)的權(quán)值,整個(gè)免疫抗體網(wǎng)絡(luò)即為 一個(gè)帶權(quán)的不完全連通圖。如圖l,免疫抗體網(wǎng)絡(luò)中有類別分別是a, b和c的三種不同類別 的抗體,與此對(duì)應(yīng),a, b和c三種不同類別的抗體分別有2個(gè)、3個(gè)和4個(gè)抗體,相同類別 的抗體通過虛線連接在一起。圖中的每個(gè)抗體對(duì)外界各種抗原都具有識(shí)別、學(xué)習(xí)和記憶的功 能,免疫抗體網(wǎng)絡(luò)中的所有的抗體相互作用,共同完成對(duì)外界各種抗原的識(shí)別、學(xué)習(xí)和記憶。
2) 抗原、抗體編碼
8免疫抗體網(wǎng)絡(luò)中,抗原和抗體的編碼采用實(shí)數(shù)編碼的方式。
抗原編碼把用戶給定的訓(xùn)練樣本數(shù)據(jù)作為抗原, 一個(gè)抗原(訓(xùn)練樣本)用一個(gè)n維的 實(shí)數(shù)向量力&來表示如下
^,盧、2,…,D (1)
抗體編碼免疫抗體網(wǎng)絡(luò)中每個(gè)抗體的編碼包含兩個(gè)部分,分別是抗體基本信息和抗體 屬性信息。其中,抗體基本信息包括該抗體的類別信息和該抗體的濃度信息,抗體的類別即 表示該抗體的分類信息,即該抗體所識(shí)別的抗原的模式種類;抗體的濃度則表示了該抗體識(shí) 別的該類抗原的數(shù)量,免疫抗體網(wǎng)絡(luò)訓(xùn)練結(jié)束后,即表示了依據(jù)該抗體識(shí)別的該類抗原的總 數(shù)量,表征了該抗體的識(shí)別抗原能力的強(qiáng)弱??贵w屬性信息則表示抗體所識(shí)別的抗原的數(shù)據(jù) 特征,即抗體在n維形態(tài)空間中各個(gè)維的值??贵w^^可表示如下
屈,,,C,,A為,…,我) (2) 公式(2)式中,7}是抗體應(yīng)所屬的類別,即抗體屈,能夠識(shí)別的抗原的類別;G是抗體 瓶的濃度,大體表示抗體胞能夠識(shí)別的抗原的數(shù)量的多少。瓶 戲分別表示抗體胞的屬 性信息。
3) 免疫抗體網(wǎng)絡(luò)初始化
首先對(duì)訓(xùn)練樣本進(jìn)行分析,根據(jù)訓(xùn)練樣本數(shù)據(jù)類別的數(shù)目確定免疫抗體網(wǎng)絡(luò)中抗體類別 的數(shù)目,抗體類別的數(shù)目記為m;根據(jù)分類識(shí)別問題的難易程度、即同一個(gè)類別的不同個(gè)體 之間特征值的波動(dòng)和不同類別的樣本特征值之間的差異,來確定每類初始抗體的數(shù)目難度
越高,初始抗體數(shù)目設(shè)置值越大。每個(gè)類別的初始抗體數(shù)目記為k, 一般情況下,k可取值
為10至30。從每個(gè)類別的訓(xùn)練樣本中,隨機(jī)地抽取k個(gè)樣本,抽取的k個(gè)樣本的屬性信息分別 作為免疫抗體網(wǎng)絡(luò)中該類初始的k個(gè)抗體的屬性信息,同時(shí)抗體的類別信息根據(jù)與其對(duì)應(yīng)的訓(xùn) 練樣本的類別信息確定,并且所有抗體的濃度初始值取零。
免疫抗體網(wǎng)絡(luò)初始化完成后,免疫抗體網(wǎng)絡(luò)由一定數(shù)目(mXk個(gè))的不同類別的抗體構(gòu) 成,相同類別的抗體連接在一起,此時(shí),免疫抗體網(wǎng)絡(luò)中所有的抗體都是初始抗體。
4) 免疫抗體網(wǎng)絡(luò)訓(xùn)練
免疫抗體網(wǎng)絡(luò)的訓(xùn)練是指免疫抗體網(wǎng)絡(luò)中的抗體對(duì)輸入提呈抗原的學(xué)習(xí)與記憶的過程, 其基本過程可描述如下
① 抗原提呈,即按照順序或隨機(jī)選取一個(gè)訓(xùn)練樣本作為抗原輸入到免疫抗體網(wǎng)絡(luò);
② 根據(jù)抗體生成算法,免疫抗體網(wǎng)絡(luò)中的抗體完成對(duì)提呈抗原的學(xué)習(xí)和記憶;③ 重復(fù)上述1一2步,直至所有抗原提呈完畢,這一過程稱為完成了一次訓(xùn)練;
④ 對(duì)免疫抗體網(wǎng)絡(luò)進(jìn)行多次訓(xùn)練。如果免疫抗體網(wǎng)絡(luò)連續(xù)兩次訓(xùn)練結(jié)果一致時(shí)(即 連續(xù)的兩次訓(xùn)練,免疫抗體網(wǎng)絡(luò)中各類抗體的數(shù)目沒有發(fā)生變化),免疫抗體網(wǎng)絡(luò)訓(xùn)練終止, 否則,進(jìn)行下一次訓(xùn)練。
按照上述的方法訓(xùn)練結(jié)束后,免疫抗體網(wǎng)絡(luò)中的抗體經(jīng)過不斷的學(xué)習(xí)和記憶,能夠準(zhǔn)確 地描述各類訓(xùn)練樣本數(shù)據(jù)的特征信息,成為成熟的記憶抗體。 5)抗體生成算法 5.1)定義
① 相似度描述兩個(gè)樣本之間的相似或相近程度,常以某種距離作為相似度的測量 標(biāo)準(zhǔn),如常用的歐幾里的德距離;
② A:免疫抗體網(wǎng)絡(luò)中抗體J&與抗原^&伺的相似度
③ 免疫抗體網(wǎng)絡(luò)中抗體應(yīng)與抗體必,間的相似度;
":免疫抗體網(wǎng)絡(luò)中所有抗體與抗原力&的相似度矩陣(Ag-Ab),其數(shù)據(jù)元素為A; ◎ &免疫抗體網(wǎng)絡(luò)中所有抗體之間的相似度矩陣(Ab-Ab),其數(shù)據(jù)元素為&7;
⑥ 免疫抗體網(wǎng)絡(luò)中與輸入的提呈抗原力&親和度最高的抗體(如果存在多個(gè)親
和度最高的抗體,可以任選其中一個(gè)),即滿足4,min(d),該抗體稱為識(shí)別抗體,記為
⑦ 免疫抗體網(wǎng)絡(luò)中的識(shí)別抗體^^,如果其類別與輸入的提呈抗原力&一致, 則該抗體稱為最佳識(shí)別抗體,記為
⑧ 抗體進(jìn)化免疫抗體網(wǎng)絡(luò)中的抗體^a寸輸入的提呈抗原^&的完成學(xué)習(xí)和記憶, 有計(jì)算公式(3):
^' = (C,. x 4 +々#) / (C, +1), t = 1,2,…," (3 )
命(t;,c,wv為',…,我')
◎抗體合并:免疫抗體網(wǎng)絡(luò)中的兩個(gè)同類的抗體力&與^^合并成為一個(gè)新抗體J&, 免疫抗體網(wǎng)絡(luò)中原有的抗體"&和^^)從免疫抗體網(wǎng)絡(luò)中刪除,新抗體J&的取值按公式(4) 計(jì)算<formula>formula see original document page 10</formula> (4 )⑩抗體新生根據(jù)當(dāng)前輸入的提呈抗原^&,在免疫抗體網(wǎng)絡(luò)中,插入一個(gè)新的抗 體^&,新抗體^^的取值的按公式(5)計(jì)算
雄=(7>1,々",々乂2"."々乂 ) (5)
其中新抗體應(yīng)的類別信息7)根據(jù)當(dāng)前輸入的提呈抗原艇的類別保持一致。 5.2)算法步驟
抗體生成算法確定了免疫抗體網(wǎng)絡(luò)中的抗體對(duì)提呈抗原的不斷的學(xué)習(xí)與記憶過程。根據(jù) 不同的情況,免疫抗體網(wǎng)絡(luò)發(fā)生抗體進(jìn)化、抗體合并和抗體新生。算法執(zhí)行過程中,免疫抗 體網(wǎng)絡(luò)中各類抗體的的數(shù)目、各個(gè)抗體的濃度及其屬性信息在按照抗體生成算法,自動(dòng)的調(diào)
調(diào)節(jié)變化,整個(gè)過程無需預(yù)先設(shè)置參數(shù)和人工干預(yù)??贵w生成算法的具體步驟描述如下 St印l.計(jì)算提呈抗原力&與免疫抗體網(wǎng)絡(luò)中所有抗體間的相似度,得到相似度矩陣"; St印2.根據(jù)相似度矩陣A在免疫抗體網(wǎng)絡(luò)中選取識(shí)別抗體^^;
St印3.如果識(shí)別抗體瓶的類別與提呈抗原艇的類別不一致,即C7;,則免疫抗體網(wǎng)絡(luò)
發(fā)生抗體新生,即免疫抗體網(wǎng)絡(luò)針對(duì)提呈抗原^A產(chǎn)生新抗體^^,算法結(jié)束;
st印4.識(shí)別抗體瓶的類別與提呈抗原急的類別一致(7尸t;),則得到最佳識(shí)別抗體應(yīng),
即應(yīng)=瓶;
St印5.計(jì)算J&與免疫抗體網(wǎng)絡(luò)中類別相同的所有抗體的相似度,得到抗體相似度矩陣 5"。根據(jù)抗體相似度矩陣5",選擇與最佳識(shí)別抗體J&親和度最高的同類抗體,該抗體記為/lZv,
St印6.如果最佳識(shí)別抗體他與其親和度最高的同類抗體為的相似度,大于最佳識(shí)別抗 體J&與提呈抗原艇的相似度A,即滿足^>肌'/ 0,則根據(jù)提呈抗原J&,免疫抗體網(wǎng)絡(luò)發(fā)生 抗體新生,產(chǎn)生新抗體J&,同時(shí)最佳識(shí)別抗體^^與親和度最高的同類抗體^^執(zhí)行抗體合并, 算法結(jié)束;
St印7.最佳識(shí)別抗體J&根據(jù)提呈抗原力&發(fā)生抗體進(jìn)化,最佳識(shí)別抗體J&對(duì)提呈抗原
完成學(xué)習(xí)和記憶,算法結(jié)束。
下面舉例對(duì)本發(fā)明作進(jìn)一步說明。
實(shí)施例l.在國際標(biāo)準(zhǔn)數(shù)據(jù)測試集(Letter Recognition)上的的英文字母識(shí)別。Letter Recognition數(shù)據(jù)集中共包含20000條樣本記錄,記錄了 20種字體、26個(gè)大寫英文字母的 20000副原始掃描圖像的數(shù)字化處理后的數(shù)據(jù),每條記錄包含了該字母的類別屬性及其16維 矢量特征數(shù)據(jù)(其取值范圍是0到15),數(shù)據(jù)集中每個(gè)字母大約有750條記錄不等。
在實(shí)驗(yàn)過程中,根據(jù)每條記錄在Letter Recognition數(shù)據(jù)集中的出現(xiàn)的次序,分別提取每個(gè)字母的前700條記錄作為實(shí)驗(yàn)數(shù)據(jù)集。把實(shí)驗(yàn)數(shù)據(jù)集分成訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)兩 個(gè)部分。訓(xùn)練樣本數(shù)據(jù)由實(shí)驗(yàn)數(shù)據(jù)集中各類字母的前630條記錄組成(根據(jù)其次序),共計(jì)包 含16380條記錄;其余實(shí)驗(yàn)數(shù)據(jù)集中每類字母的70條記錄,共計(jì)1820條記錄作為測試樣本 數(shù)據(jù)。
設(shè)定免疫抗體網(wǎng)絡(luò)的抗體初始數(shù)目k=25,逐個(gè)輸入訓(xùn)練樣本集中的數(shù)據(jù)作為提呈抗原, 對(duì)免疫抗體網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練結(jié)束后,應(yīng)用得到的免疫抗體網(wǎng)絡(luò),按照最鄰近準(zhǔn)則對(duì)所有 測試樣本進(jìn)行字母識(shí)別。實(shí)驗(yàn)結(jié)果表明,本發(fā)明方法的總體正確識(shí)別率是95.54%,在同一數(shù) 據(jù)集上,文獻(xiàn)1 [P. W. Frey and D. J. Slate. Letter Recognition Using Holland-style Adaptive Classifiers. Machine Learning. 1991, 6 (2) : 161 182.]應(yīng)用Holland Style Adaptive Classifiers方法進(jìn)行分析,其最高正確識(shí)別率略高于80 %;文獻(xiàn)2[張樂鋒,虞 華,夏勝平,等.RS0M算法及其應(yīng)用研究.復(fù)旦學(xué)報(bào)(自然科學(xué)版),2004, 43(5):704 709]基于自組織映射網(wǎng)絡(luò)RS0M算法,其最高正確識(shí)別率低于91%左右。本發(fā)明免疫抗體網(wǎng) 絡(luò)顯示出最優(yōu)的模式分類能力,其正確識(shí)別率較其他兩種方法具有顯著的提高。
權(quán)利要求
1、一種基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,其特征是,以隨機(jī)抽取一定數(shù)目的各類訓(xùn)練樣本,生成免疫抗體網(wǎng)絡(luò)中相應(yīng)類別的初始抗體,完成免疫抗體網(wǎng)絡(luò)的初始化;以所有訓(xùn)練樣本作為輸入抗原,應(yīng)用抗體生成算法,訓(xùn)練免疫抗體網(wǎng)絡(luò),免疫抗體網(wǎng)絡(luò)中的抗體有效提取各類訓(xùn)練樣本的模式特征,連續(xù)兩次訓(xùn)練結(jié)果一致時(shí),訓(xùn)練終止并保存訓(xùn)練好的免疫抗體網(wǎng)絡(luò),訓(xùn)練后的免疫抗體網(wǎng)絡(luò)用于模式識(shí)別。
2、 根據(jù)權(quán)利要求1所述基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,其特征是,所述免疫抗體 網(wǎng)絡(luò)初始化的方法是把用戶給定的訓(xùn)練樣本作為抗原,用n維的實(shí)數(shù)向量表示,第」'個(gè)抗原力&表示為與之對(duì)應(yīng),免疫抗體網(wǎng)絡(luò)中的抗體,用一個(gè)(n+2)維的實(shí)數(shù)向量,免疫抗體網(wǎng)絡(luò)中第i個(gè) 抗體^&表示為<formula>formula see original document page 2</formula>其中,7;是抗體^^所屬的類別信息,即抗體^^能夠識(shí)別的樣本的類別;G是抗體J^的濃度,表示抗體^^能夠識(shí)別的樣本數(shù)量的多少,^^ ^^為抗體j&的屬性信息,分別表示該抗體各維的模式特征;初始化后的免疫抗體網(wǎng)絡(luò)中,共計(jì)包含mXk個(gè)抗體,此時(shí)免疫抗體網(wǎng)絡(luò)中的抗體定義為 初始抗體,其中m是初始抗體的類別數(shù)目,k是每類初始抗體的數(shù)目,各個(gè)初始抗體的類別信息/;,根據(jù)對(duì)應(yīng)的隨機(jī)抽取的訓(xùn)練樣本的類別來確定,其屬性信息也由對(duì)應(yīng)的隨機(jī)抽取訓(xùn)練樣本來確定,其濃度初始值G均取零。
3、 根據(jù)權(quán)利要求1或2所述基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,其特征是,所述免疫抗 體網(wǎng)絡(luò)訓(xùn)練的方法是按照順序或隨機(jī)選取一個(gè)訓(xùn)練樣本作為提呈抗原,輸入到免疫抗體網(wǎng) 絡(luò),免疫抗體網(wǎng)絡(luò)中的抗體根據(jù)抗體生成算法,完成對(duì)提呈抗原的學(xué)習(xí)和記憶,直至所有抗 原提呈完畢,則稱為完成了一次訓(xùn)練;反復(fù)訓(xùn)練免疫抗體網(wǎng)絡(luò),當(dāng)連續(xù)兩次訓(xùn)練結(jié)果一致, 即連續(xù)的兩次訓(xùn)練,免疫抗體網(wǎng)絡(luò)中抗體的數(shù)目不再發(fā)生變化時(shí),免疫抗體網(wǎng)絡(luò)訓(xùn)練結(jié)束。
4、 根據(jù)權(quán)利要求3所述基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,其特征是,所述抗體生成 算法是-定義① 相似度描述兩個(gè)樣本之間的相似或相近程度,常以某種距離作為相似度的測量 標(biāo)準(zhǔn),如常用的歐幾里德距離;② 4:免疫抗體網(wǎng)絡(luò)中抗體^^與抗原^&間的相似度;③ 免疫抗體網(wǎng)絡(luò)中抗體應(yīng)與抗體截.間的相似度; ":免疫抗體網(wǎng)絡(luò)中所有抗體與抗原力&的相似度矩陣(Ag-Ab),其數(shù)據(jù)元素為A; ⑤&免疫抗體網(wǎng)絡(luò)中所有抗體之間的相似度矩陣(Ab-Ab),其數(shù)據(jù)元素為&,; ◎ 免疫抗體網(wǎng)絡(luò)中與輸入的提呈抗原v^,親和度最高的抗體(如果存在多個(gè)親 和度最高的抗體,可以任選其中一個(gè)),即滿足4^min(D),該抗體稱為識(shí)別抗體,記為⑦ 免疫抗體網(wǎng)絡(luò)中的識(shí)別抗體J&,如果其類別與輸入的提呈抗原力&一致, 則該抗體稱為最佳識(shí)別抗體,記為^&;⑧ 抗體進(jìn)化免疫抗體網(wǎng)絡(luò)中的抗體^a寸輸入的提呈抗原^&的完成學(xué)習(xí)和記憶, 有計(jì)算公式(3):<formula>formula see original document page 0</formula>⑨ 抗體合并:免疫抗體網(wǎng)絡(luò)中的兩個(gè)同類的抗體^^與^^合并成為一個(gè)新抗體^^,免疫抗體網(wǎng)絡(luò)中原有的抗體"&和^^)從免疫抗體網(wǎng)絡(luò)中刪除,新抗體力&的取值按公式(4) 計(jì)算<formula>formula see original document page 0</formula> 抗體新生根據(jù)當(dāng)前輸入的提呈抗原^&,在免疫抗體網(wǎng)絡(luò)中,插入一個(gè)新的抗 體應(yīng),新抗體力&的取值的按公式(5)計(jì)算<formula>formula see original document page 0</formula>其中新抗體應(yīng)的類別信息《根據(jù)當(dāng)前輸入的提呈抗原艇的類別保持一致; 抗體生成算法確定了免疫抗體網(wǎng)絡(luò)中的抗體對(duì)提呈抗原的不斷的學(xué)習(xí)與記憶過程,根據(jù) 不同情況,免疫抗體網(wǎng)絡(luò)發(fā)生抗體進(jìn)化、抗體合并和抗體新生;算法執(zhí)行過程中,免疫抗體 網(wǎng)絡(luò)中各類抗體的的數(shù)目、各個(gè)抗體的濃度及其屬性信息在按照抗體生成算法,自動(dòng)調(diào)節(jié)變化;抗體生成算法的具體步驟描述如下St印l.計(jì)算提呈抗原^)與免疫抗體網(wǎng)絡(luò)中所有抗體間的相似度,得到相似度矩陣A St印2.根據(jù)相似度矩陣",在免疫抗體網(wǎng)絡(luò)中選取識(shí)別抗體^^;st印3.如果識(shí)別抗體瓶的類別與提呈抗原艇的類別不一致,即t^t;,則免疫抗體網(wǎng)絡(luò)發(fā)生抗體新生,即免疫抗體網(wǎng)絡(luò)針對(duì)提呈抗原^&產(chǎn)生新抗體^^,算法結(jié)束;st印4.識(shí)別抗體^&的類別與提呈抗原力&的類別一致(7}= t;),則得到最佳識(shí)別抗體J&,St印5.計(jì)算J&與免疫抗體網(wǎng)絡(luò)中類別相同的所有抗體的相似度,得到抗體相似度矩陣 &根據(jù)抗體相似度矩陣5",選擇與最佳識(shí)別抗體^^親和度最高的同類抗體,該抗體記為J^St印6.如果最佳識(shí)別抗體J&與其親和度最高的同類抗體^^的相似度,大于最佳識(shí)別抗 體^^與提呈抗原j&的相似度4,,即滿足&P肌'"C則根據(jù)提呈抗原力&.,免疫抗體網(wǎng)絡(luò)發(fā)生 抗體新生,產(chǎn)生新抗體^^,同時(shí)最佳識(shí)別抗體^^與親和度最高的同類抗體^^執(zhí)行抗體合并, 算法結(jié)束;st印7.最佳識(shí)別抗體力&根據(jù)提呈抗原力&發(fā)生抗體進(jìn)化,最佳識(shí)別抗體力/a寸提呈抗原完成學(xué)習(xí)和記憶,算法結(jié)束。
5、根據(jù)權(quán)利要求4所述基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,其特征是,所述各類初始 抗體數(shù)目k,取值為10至30。
全文摘要
一種基于免疫抗體網(wǎng)絡(luò)的模式識(shí)別方法,用于模式識(shí)別。其技術(shù)方案是它以隨機(jī)抽取一定數(shù)目的各類訓(xùn)練樣本,生成免疫抗體網(wǎng)絡(luò)中的初始抗體,完成免疫抗體網(wǎng)絡(luò)的初始化;以所有訓(xùn)練樣本作為輸入抗原,根據(jù)抗體生成算法對(duì)免疫抗體網(wǎng)絡(luò)進(jìn)行訓(xùn)練,有效提取各類訓(xùn)練樣本的模式特征;反復(fù)訓(xùn)練免疫抗體網(wǎng)絡(luò),當(dāng)連續(xù)兩次訓(xùn)練結(jié)果一致時(shí),訓(xùn)練終止并保存得到的免疫抗體網(wǎng)絡(luò),進(jìn)行模式識(shí)別。本發(fā)明計(jì)算簡便,無需人工設(shè)置參數(shù)與閾值,具有很高的正確識(shí)別率,適合于字體識(shí)別、故障診斷等計(jì)算機(jī)應(yīng)用領(lǐng)域。
文檔編號(hào)G06K9/62GK101561880SQ200910074328
公開日2009年10月21日 申請(qǐng)日期2009年5月11日 優(yōu)先權(quán)日2009年5月11日
發(fā)明者中 李, 苑津莎 申請(qǐng)人:華北電力大學(xué)(保定)