專(zhuān)利名稱(chēng):基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于軟測(cè)量技術(shù)領(lǐng)域,具體涉及一種基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維方法,用于指導(dǎo)混合輔助變量的分離及復(fù)雜軟測(cè)量模型的降維。
背景技術(shù):
工業(yè)生產(chǎn)中一些關(guān)鍵參數(shù)以常規(guī)的測(cè)量手段往往不能準(zhǔn)確得到,采用軟測(cè)量技術(shù)可有效地解決這個(gè)問(wèn)題。然而,軟測(cè)量方法的原始輔助變量數(shù)目冗余龐雜,呈現(xiàn)出混合信號(hào)的特點(diǎn),導(dǎo)致模型的復(fù)雜度隨原始輔助變量的增加而呈指數(shù)增長(zhǎng),出現(xiàn)模型的維度災(zāi)難問(wèn)題。因此,如何選擇原始輔助變量的最優(yōu)特征子集,使其含較少的輔助變量數(shù)量,同時(shí)又能夠盡可能地保持原來(lái)完整數(shù)據(jù)集的多元結(jié)構(gòu),成為了軟測(cè)量中輔助變量選擇、降低信息冗余的關(guān)鍵。由于輔助變量通常是多因素的混雜信號(hào),在原始特征空間很難進(jìn)行原始特征約簡(jiǎn)。本發(fā)明提出的基于獨(dú)立子空間虛假鄰點(diǎn)判別的軟測(cè)量原始混合輔助變量的分離策略,首先利用ICA進(jìn)行原始特征的獨(dú)立成分分析,去除混雜信號(hào)間的高階冗余并提取獨(dú)立分量,將原始特征空間映射成獨(dú)立特征子空間;接下來(lái),受高維相空間混沌運(yùn)動(dòng)軌跡恢復(fù)的啟示,對(duì)虛假最近鄰點(diǎn)法進(jìn)行逆向分析,在特征子空間利用FNN進(jìn)行余弦測(cè)度的判別,通過(guò)計(jì)算原始特征參量剔除前后的余弦測(cè)度,可以有效地剔除冗余特征,降低模型復(fù)雜度。為原始輔助變量的選擇,減少檢測(cè)系統(tǒng)中傳感器的數(shù)目提供一種有效的方法。
發(fā)明內(nèi)容
本發(fā)明的目的 在于提供基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維方法,能夠在建模效果最佳的準(zhǔn)則上找出獨(dú)立的輔助變量,實(shí)現(xiàn)對(duì)主導(dǎo)變量軟測(cè)量的降維。本發(fā)明的技術(shù)方案如下:基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維,其關(guān)鍵在于按如下步驟進(jìn)行:步驟一:確定與主導(dǎo)變量可能相關(guān)的n個(gè)原始輔助變量,采集n個(gè)原始輔助變量和主導(dǎo)變量的取值,組成樣本集,樣本集大小為m ;將n個(gè)原始輔助變量數(shù)據(jù)寫(xiě)成矩陣X= [Xl,…,Xi,…XdJt形式,主導(dǎo)變量數(shù)據(jù)寫(xiě)成矩陣 Y =Iiy1,…,yi;…,ym]T,其中,Xi G RnX1,yi G R,i = 1,2,…,m,并將 X, Y 進(jìn)行標(biāo)準(zhǔn)化處理;步驟二:基于獨(dú)立子空間虛假鄰點(diǎn)判別的方法,主要是在獨(dú)立成分分析ICA(Independent Components Analysis)的基礎(chǔ)上,借助虛假最近鄰點(diǎn) FNN(FalseNearest Neighbors)方法,分別計(jì)算n個(gè)原始輔助變量的權(quán)重值,包括兩部分:(一 )混合輔助變量的獨(dú)立成分分析ICA第一步:輸入數(shù)據(jù)X = [X1, Xi,…Xm]T, Xij 是一個(gè)樣本,i = 1,2,…,n,j =1,2,…,m ;第二步:數(shù)據(jù)中心化A = X11 - Xlj ;第三步:由&構(gòu)成中心化數(shù)據(jù)矩陣;^,計(jì)算文的協(xié)方差Cx -.CX = E{XTX);第四步:計(jì)算協(xié)方差Cx的特征值X j和特征向量Si:cxai = A ;第五步:計(jì)算白化矩陣M:M = D_1/2VT,D為特征值入i組成的對(duì)角陣,V為特征向量Bi組成的矩陣;第六步:對(duì)中心化后的數(shù)據(jù)進(jìn)行白化:I = M$ ;第七步:初始化分離矩陣W, W由Wi構(gòu)成,其中所有的Wi都具有單位范數(shù),i = I,2,…,m;第八步:更新
權(quán)利要求
1.基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維,其特征在于按如下步驟進(jìn)行: 步驟一:確定與主導(dǎo)變量可能相關(guān)的n個(gè)原始輔助變量,采集n個(gè)原始輔助變量和主導(dǎo)變量的取值,組成樣本集,樣本集大小為m ; 將n個(gè)原始輔助變量數(shù)據(jù)寫(xiě)成矩陣X= [Xl,…,Xi,…XiJt形式,主導(dǎo)變量數(shù)據(jù)寫(xiě)成矩陣 Y=[yi,-, Yi,…,ym]T,其中,Xi G RnX1,yi G R,i = 1,2,…,m,并將 X,Y 進(jìn)行標(biāo)準(zhǔn)化處理; 步驟二:基于獨(dú)立子空間虛假鄰點(diǎn)判別的方法,主要是在獨(dú)立成分分析ICA(Independent Components Analysis)的基礎(chǔ)上,借助虛假最近鄰點(diǎn) FNN(FalseNearest Neighbors)方法,分別計(jì)算n個(gè)原始輔助變量的權(quán)重值; 步驟三:按照權(quán)重值,將n個(gè)原始輔助變量組成原始輔助變量序列; 步驟四:確定最佳輔助變量集; 步驟五:以步驟四中對(duì)應(yīng)的最佳輔助變量集為自變量對(duì)系統(tǒng)進(jìn)行最小二乘回歸建模,得到混合輔助變量的分離及降維模型。
2.根據(jù)權(quán)利要求1所述的基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維,其特征在于步驟二中的獨(dú)立子空間虛假鄰點(diǎn)判別的輔助變量權(quán)重判別方法,包括兩部分: (一)混合輔助變量的獨(dú)立成分分析ICA 第一步:輸入數(shù)據(jù) X = [X1,…,Xi,."Xm]1, Xij 是一個(gè)樣本,i = 1,2,…,n, j = I,2,…,m ; 第二步:數(shù)據(jù)中心化&
3.根據(jù)權(quán)利要求1所述的基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維,其特征在于步驟四中確定最佳輔助變量集,按如下步驟進(jìn)行: 第一步,設(shè)定循環(huán)次數(shù)N = n ; 第二步,隨機(jī)從樣本集中選擇P個(gè)樣本作為訓(xùn)練樣本,剩下的m-p個(gè)樣本作為檢驗(yàn)樣本; 第三步,根據(jù)所述訓(xùn)練樣本,利用最小二乘回歸建立當(dāng)前的輔助變量序列中所包含變量的非線(xiàn)性模型; 第四步,將所述檢驗(yàn)樣本當(dāng)前的輔助變量值輸入至所述非線(xiàn)性模型,得到m-p個(gè)檢驗(yàn)樣本對(duì)應(yīng)的主導(dǎo)變量預(yù)測(cè)值; 第五步,計(jì)算m-p個(gè)檢驗(yàn)樣本預(yù)測(cè)值的均方誤差MSE ; 第六步,刪除當(dāng)前原始輔助變量序列中權(quán)重值最小的原始輔助變量,組成新的原始輔助變量序列,并設(shè)定N = N-1,判斷此時(shí)N是否為0: 如果N古0,則回到第三步; 如果N = 0,則最小的檢驗(yàn)樣本預(yù)測(cè)值的均方誤差MSE對(duì)應(yīng)原始輔助變量序列即為最佳輔助變量集。
全文摘要
本發(fā)明公開(kāi)了基于獨(dú)立子空間虛假鄰點(diǎn)判別的混合輔助變量的分離及降維,其特征在于按如下步驟進(jìn)行一、確定與主導(dǎo)變量可能相關(guān)的n個(gè)原始輔助變量,采集n個(gè)原始輔助變量和主導(dǎo)變量取值數(shù)據(jù)并組成樣本集;二、通過(guò)獨(dú)立子空間虛假鄰點(diǎn)判別,分別計(jì)算n個(gè)原始輔助變量的權(quán)重值;三、組成原始輔助變量序列;四、利用最小二乘回歸方法進(jìn)行建模,并根據(jù)最小均方誤差MSE確定最佳輔助變量;五、得到分離后的獨(dú)立信號(hào)軟測(cè)量模型。本發(fā)明能夠在建模效果最佳的基礎(chǔ)上找出含混合輔助變量的變量集進(jìn)行分離,實(shí)現(xiàn)其降維,達(dá)到對(duì)輔助變量信息的精簡(jiǎn),同時(shí)降低模型復(fù)雜度,提高軟測(cè)量實(shí)效性的目的。
文檔編號(hào)G06F19/00GK103207945SQ20131006850
公開(kāi)日2013年7月17日 申請(qǐng)日期2013年3月5日 優(yōu)先權(quán)日2013年3月5日
發(fā)明者蘇盈盈, 劉興華, 葛繼科, 顏克勝, 曾誠(chéng) 申請(qǐng)人:重慶科技學(xué)院