投影變換矩陣的獲取方法及裝置、樣本分類方法及裝置制造方法
【專利摘要】本發(fā)明提供了一種投影變換矩陣的獲取方法及裝置、樣本分類方法及裝置,本發(fā)明使用訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣,并根據(jù)類別矩陣加入計(jì)算投影變換矩陣中。本發(fā)明中由于類別標(biāo)簽?zāi)軌驕?zhǔn)確的表示訓(xùn)練樣本的類別,因此類別矩陣能夠準(zhǔn)確反應(yīng)訓(xùn)練樣本的類別。本發(fā)明取在歐氏距離和值最小的基礎(chǔ)上,加入類別信息實(shí)現(xiàn)了有監(jiān)督的學(xué)習(xí),因此能夠獲得正確地投影變換矩陣,并很好地實(shí)現(xiàn)拉近同類之間距離,擴(kuò)大異類之間距離的目的,進(jìn)而使分類性能變好。
【專利說明】投影變換矩陣的獲取方法及裝置、樣本分類方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人工智能領(lǐng)域,尤其涉及一種投影變換矩陣的獲取方法及裝置、樣本分類方法及裝置。
【背景技術(shù)】
[0002]在人工智能逐步發(fā)展的今天,經(jīng)常需要計(jì)算機(jī)對待分類樣本進(jìn)行分類,即在訓(xùn)練
樣本及類別中確定待分類樣本的類別,例如:根據(jù)多個已知人臉及與已知人臉--對應(yīng)的
姓名,確定待分類人臉的姓名。
[0003]待分類樣本和訓(xùn)練樣本為真實(shí)世界物體的數(shù)據(jù),一般采用矩陣的形式來表示,由于真實(shí)世界物體的維度較高,針對高維數(shù)據(jù)進(jìn)行分類時(shí)經(jīng)常會出現(xiàn)維數(shù)災(zāi)難問題,所以一般將數(shù)據(jù)映射到低維空間,以便降低數(shù)據(jù)的處理難度,現(xiàn)有技術(shù)中通常采用投影變換矩陣對樣本數(shù)據(jù)進(jìn)行降維處理。
[0004]為了能夠準(zhǔn)確的在訓(xùn)練樣本中識別待分類樣本的類別,我們希望訓(xùn)練樣本中同類樣本之間的距離更近,異類樣本之間的距離更遠(yuǎn),為了達(dá)到這一目的,我們希望訓(xùn)練樣本進(jìn)行降維處理的同時(shí)拉近同類樣本之間的距離,擴(kuò)大異類樣本之間的距離,因此投影變換矩陣肩負(fù)著對數(shù)據(jù)進(jìn)行降維處理、拉近同類樣本之間距離和擴(kuò)大異類樣本之間的距離的三重任務(wù)。
[0005]為了獲得投影變換矩陣,現(xiàn)有技術(shù)中通過如下實(shí)現(xiàn)方式實(shí)現(xiàn):
[0006]在訓(xùn)練樣本中隨機(jī)選取一個樣本A,計(jì)算樣本A與其余各個樣本的歐氏距離,若樣本B與樣本A之間的歐氏距離 在預(yù)設(shè)范圍內(nèi),則樣本B與樣本A為同類,若樣本C與樣本A之間的歐氏距離超出預(yù)設(shè)范圍,則樣本C與樣本A為異類,通過此方法構(gòu)建樣本A的類內(nèi)集合和類間集合,類內(nèi)集合為與樣本A同類的樣本集合,類間集合為與樣本A異類的樣本集合,根據(jù)類內(nèi)集合和類間集合經(jīng)過進(jìn)一步的矩陣處理得到投影變換矩陣,得到投影變換矩陣能夠拉近類內(nèi)集合中樣本的距離,擴(kuò)大類間集合中樣本的距離。
[0007]但是,使用歐氏距離判斷同類、異類的方式,容易出現(xiàn)分類錯誤的情況,即可能出現(xiàn)樣本C與樣本A之間的歐氏距離小于樣本B與樣本A之間的歐氏距離的情況,導(dǎo)致類內(nèi)集合和類間集合的分類出現(xiàn)錯誤,進(jìn)一步導(dǎo)致投影變換矩陣的失效,出現(xiàn)拉近異類之間的距離,擴(kuò)大同類之間的距離的情況。因此本方法得到的投影變換矩陣是不正確的,不能很好的實(shí)現(xiàn)拉近同類之間距離,擴(kuò)大異類之間距離的目的,進(jìn)而導(dǎo)致分類性能變差。
【發(fā)明內(nèi)容】
[0008]鑒于上述問題,本發(fā)明提供了一種投影變換矩陣的獲取方法及裝置、樣本分類方法及裝置,本發(fā)明考慮了樣本本身的類別信息,能夠獲得準(zhǔn)確地投影變換矩陣,使分類性能變好。
[0009]為了實(shí)現(xiàn)上述目的,本發(fā)明提供以下技術(shù)手段:
[0010]一種投影變換矩陣的獲取方法,包括:[0011]依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣;
[0012]將所述各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間;
[0013]在所述判別子空間中計(jì)算所有樣本的歐氏距離和值,所述歐氏距離和值為各個樣本與其K個近鄰樣本的歐氏距離,加上各個樣本與其類別矩陣的歐氏距離之和;
[0014]對所述歐氏距離和值取最小值,獲得所述投影變換矩陣。
[0015]優(yōu)選的,依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣包括:
[0016]所述類別矩陣的每一行對應(yīng)一個訓(xùn)練樣本,類別矩陣的每一列表示一個類別;
[0017]所述類別矩陣中各個樣本行的類別標(biāo)簽列為1,其余都為0,由此構(gòu)建類別矩陣。
[0018]優(yōu)選的,歐氏距離和值的獲取過程包括:
[0019]對各個樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個樣本的K個重構(gòu)樣本;
[0020]計(jì)算各個樣本與其K個重構(gòu)樣本的第一歐氏距離;
[0021]計(jì)算各個樣本與其類別矩陣的第二歐氏距離;
[0022]將所述第一歐氏距離與所述第二歐氏距離的之和作為所述歐氏距離和值。
[0023]優(yōu)選的,歐氏距離和值的獲取過程包括:
[0024]計(jì)算各個樣本與其K個近鄰樣本的第三歐氏距離;
[0025]計(jì)算各個樣本與其類別矩陣的第四歐氏距離;
[0026]獲取所述第四歐氏距離與信任度系數(shù)的第一乘積;
[0027]將所述第三歐氏距離與所述第一乘積的和值作為所述歐氏距離和值。
[0028]優(yōu)選的,歐氏距離和值的獲取過程包括:
[0029]對各個樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個樣本的K個重構(gòu)樣本;
[0030]計(jì)算各個樣本與其K個重構(gòu)樣本的第五歐氏距離;
[0031]計(jì)算各個樣本與其類別矩陣的第六歐氏距離;
[0032]獲取所述第六歐氏距離與信任度系數(shù)的第二乘積;
[0033]將所述第五歐氏距離與所述第二乘積的之和作為所述歐氏距離和值。
[0034]優(yōu)選的,對各個樣本的K個近鄰樣本進(jìn)行重構(gòu)包括:
[0035]利用重構(gòu)權(quán)值矩陣對所述K個近鄰樣本進(jìn)行重構(gòu)。
[0036]優(yōu)選的,所述重構(gòu)權(quán)值矩陣的獲取方法包括:
[0037]利用所述重構(gòu)權(quán)值矩陣對各個訓(xùn)練樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個訓(xùn)練樣本的K個重構(gòu)訓(xùn)練樣本;
[0038]計(jì)算各個訓(xùn)練樣本與其K個重構(gòu)訓(xùn)練樣本的第七歐氏距離;
[0039]對所述第七歐氏距離取最小值獲取重構(gòu)權(quán)值矩陣。
[0040]優(yōu)選的,重構(gòu)權(quán)值矩陣的獲取方法包括:
[0041]利用所述重構(gòu)權(quán)值矩陣對各個訓(xùn)練樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個訓(xùn)練樣本的K個重構(gòu)訓(xùn)練樣本;
[0042]計(jì)算各個訓(xùn)練樣本與其K個重構(gòu)訓(xùn)練樣本的第八歐氏距離;
[0043]取所述重構(gòu)權(quán)值矩陣的一范數(shù);
[0044]取第八歐氏距離與一范數(shù)之和的最小值,獲取重構(gòu)權(quán)值矩陣。
[0045]優(yōu)選的,在依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣之前還包括:
[0046]對所述各個訓(xùn)練樣本進(jìn)行預(yù)降維處理。[0047]—種樣本分類方法,包括:
[0048]將各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間,所述投影變換矩陣為采用如權(quán)利要求1所述的方法獲取的;
[0049]將待分類樣本利用所述投影變換矩陣降維至所述判別子空間;
[0050]在所述判別子空間中利用最近鄰分類器對所述待分類樣本進(jìn)行分類。
[0051]優(yōu)選的,在將待分類樣本利用所述投影變換矩陣降維至所述判別子空間之前還包括:
[0052]對所述待分類樣本進(jìn)行降維處理。
[0053]一種投影變換矩陣的獲取裝置,包括:
[0054]構(gòu)建單元,用于依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣;
[0055]第一降維單元,用于將所述各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間;
[0056]計(jì)算單元,用于在判別子空間計(jì)算所有樣本的歐氏距離和值,所述歐氏距離和值為各個樣本與其K個近鄰樣本的歐氏距離,加上各個樣本與其類別矩陣的歐氏距離之和;
[0057]獲取單元,用于對所述歐氏距離和值取最小值,獲得所述投影變換矩陣。
[0058]一種樣本分類裝置,包括:
[0059]第二降維單元,用于將各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間,所述投影變換矩陣為采用如權(quán)利要求1所述的方法獲取的;
[0060]第三降維單元,用于將待分類樣本利用所述投影變換矩陣降維至所述判別子空間;
[0061]分類單元,用于在所述判別子空間中利用最近鄰分類器對所述待分類樣本進(jìn)行分類。
[0062]本發(fā)明提供了一種投影變換矩陣的獲取方法,該方法中使用訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣,并根據(jù)類別矩陣加入計(jì)算投影變換矩陣中。本方法中由于類別標(biāo)簽?zāi)軌驕?zhǔn)確的表示訓(xùn)練樣本的類別,因此類別矩陣能夠準(zhǔn)確反應(yīng)訓(xùn)練樣本的類別。本方法中在計(jì)算各個樣本與其K個近鄰樣本的歐氏距離和值的基礎(chǔ)上,加上各個樣本與類別矩陣的歐氏距離,取歐氏距離和值的最小值得到投影變換矩陣,歐氏距離和值越小表示K個近鄰樣本越接近同類樣本,其值越大表示為異類樣本。
[0063]本發(fā)明取在歐氏距離和值最小的基礎(chǔ)上,加入類別信息實(shí)現(xiàn)了有監(jiān)督的學(xué)習(xí),因此本方法能夠獲得正確地投影變換矩陣,并很好地實(shí)現(xiàn)拉近同類之間距離,擴(kuò)大異類之間距離的目的,進(jìn)而使分類性能變好。
【專利附圖】
【附圖說明】
[0064]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0065]圖1為本發(fā)明實(shí)施例公開的投影變換矩陣的獲取方法的流程圖;
[0066]圖2為本發(fā)明實(shí)施例公開的又一投影變換矩陣的獲取方法的流程圖;
[0067]圖3為本發(fā)明實(shí)施例公開的又一投影變換矩陣的獲取方法的流程圖;[0068]圖4為本發(fā)明實(shí)施例公開的又一投影變換矩陣的獲取方法的流程圖;
[0069]圖5為本發(fā)明實(shí)施例公開的投影變換矩陣的獲取方法中獲取重構(gòu)權(quán)值矩陣的流程圖;
[0070]圖6為本發(fā)明實(shí)施例公開的又一投影變換矩陣的獲取方法中獲取重構(gòu)權(quán)值矩陣的流程圖;
[0071]圖7為本發(fā)明實(shí)施例公開的本發(fā)明實(shí)施例公開的樣本分類方法的流程圖;
[0072]圖8為本發(fā)明實(shí)施例公開的投影變換矩陣的獲取裝置的結(jié)構(gòu)示意圖;
[0073]圖9為本發(fā)明實(shí)施例公開的樣本分類裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0074]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0075]本發(fā)明提供了一種投影變換矩陣的獲取方法,如圖1所示,該方法包括以下步驟:
[0076]SlOl:依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣;
[0077]訓(xùn)練樣本集中包括多個訓(xùn)練樣本,各個訓(xùn)練樣本都有其對應(yīng)的類別標(biāo)簽,提取類別標(biāo)簽將其轉(zhuǎn)為與類別標(biāo)簽一一對應(yīng)的類別信息,根據(jù)類別信息能夠準(zhǔn)確的判斷各個訓(xùn)練樣本所屬類別。
[0078]類別矩陣的行為各個訓(xùn)練樣本的數(shù)量,列為各個訓(xùn)練樣本的類別信息的數(shù)量。優(yōu)選的,依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣包括:所述類別矩陣的每一行對應(yīng)一個訓(xùn)練樣本,類別矩陣的每一列表示一個類別;各個樣本行的類別標(biāo)簽列為1,其余都標(biāo)0,由此構(gòu)建類別矩陣。
[0079]S102:將所述各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間;
[0080]投影變換矩陣的作用為將各個訓(xùn)練樣本進(jìn)行降維處理,且能夠拉近同類樣本之間的距離,擴(kuò)大異類樣本之間的距離,因此為了獲取投影變換矩陣,本發(fā)明先虛擬一個投影變換矩陣,將各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間中。在判別子空間中對投影變換矩陣進(jìn)行計(jì)算。
[0081]S103:在判別子空間計(jì)算所有樣本的歐氏距離和值,所述歐氏距離和值為各個樣本與其K個近鄰樣本的歐氏距離,加上各個樣本與其類別矩陣的歐氏距離之和;
[0082]以判別子空間中的一個目標(biāo)樣本為例進(jìn)行說明,在判別子空間中通過K近鄰分類器獲取目標(biāo)樣本的K個近鄰樣本,可以理解的是,K個近鄰樣本中有目標(biāo)樣本的同類樣本,也有目標(biāo)樣本的異類樣本。計(jì)算目標(biāo)樣本與K個近鄰樣本的歐氏距離,再計(jì)算目標(biāo)樣本與其類別矩陣的歐氏距離,取兩者歐氏距離的和值,對各個樣本都進(jìn)行上述操作即可得到所有樣本的歐氏距離和值。
[0083]S104:對所述歐氏距離和值取最小值,獲得所述投影變換矩陣。
[0084]投影變換矩陣的作用將目標(biāo)樣本與K個近鄰樣本的距離最小,并且在此基礎(chǔ)之上,將K個近鄰樣本中與目標(biāo)樣本為同一類別的樣本相互靠近,與目標(biāo)樣本非同一類別的樣本拉遠(yuǎn)。[0085]取歐氏距離和值最小值時(shí)對應(yīng)的投影變換矩陣作為本發(fā)明所需的投影變換矩陣,歐氏距離和值最小即為各個樣本與其K個近鄰樣本的距離之和最小,和各個樣本與其類別矩陣的歐氏距離之和最小,其中各個樣本與其類別矩陣的歐氏距離最小,表示各個樣本的中同類樣本相互靠近,異類樣本相互拉遠(yuǎn)。
[0086]對歐氏距離和值取最小值后得到最終表達(dá)式,為了得到投影變換矩陣,需要對最終表達(dá)式進(jìn)行特征分解,獲得特征值及其對應(yīng)的特征矢量,把特征值按照從大到小的順序排列,取前r個最大特征值對應(yīng)的特征向量,則投影變換矩陣。
[0087]本發(fā)明提供了一種投影變換矩陣的獲取方法,該方法中使用訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣,并根據(jù)類別矩陣加入計(jì)算投影變換矩陣中。本方法中由于類別標(biāo)簽?zāi)軌驕?zhǔn)確的表示訓(xùn)練樣本的類別,因此類別矩陣能夠準(zhǔn)確反應(yīng)訓(xùn)練樣本的類別。本方法中在計(jì)算各個樣本與其K個近鄰樣本的歐氏距離和值的基礎(chǔ)上,加上各個樣本與類別矩陣的歐氏距離,取歐氏距離和值的最小值得到投影變換矩陣,歐氏距離和值越小表示K個近鄰樣本越接近同類樣本,其值越大表示為異類樣本。
[0088]本發(fā)明取在歐氏距離和值最小的基礎(chǔ)上,使各個樣本與類別矩陣的距離越小,SP使同類樣本越來越近,因此本方法能夠獲得正確地投影變換矩陣,并很好地實(shí)現(xiàn)拉近同類之間距離,擴(kuò)大異類之間距離的目的,進(jìn)而使分類性能變好。
[0089]在上述實(shí)施例的基礎(chǔ)之上,本發(fā)明提供了步驟S103中獲取歐氏距離和值的三種實(shí)現(xiàn)方式,具體如下所示:
[0090]第一種方式,為將K個近鄰樣本進(jìn)行重構(gòu)的方式,如圖2所示,包括以下步驟:
[0091]步驟S201:對各個樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個樣本的K個重構(gòu)樣本;
[0092]步驟S202:計(jì)算各個樣本與其K個重構(gòu)樣本的第一歐氏距離;
[0093]步驟S203:計(jì)算各個樣本與其類別矩陣的第二歐氏距離;
[0094]步驟S204:將第一歐氏距離與第二歐氏距離之和作為歐氏距離和值。
[0095]第二種方式,為增加信任度系數(shù)的方式如圖3所示,包括以下步驟:
[0096]步驟S301:計(jì)算各個樣本與其K個近鄰樣本的第三歐氏距離;
[0097]步驟S302:計(jì)算各個樣本與其類別矩陣的第四歐氏距離;
[0098]步驟S303:獲取第四歐氏距離與信任度系數(shù)的第一乘積;
[0099]步驟S304:將所述第三歐氏距離與所述第一乘積的和值作為所述歐氏距離和值。
[0100]增加信任度系數(shù)為表述類別矩陣使用量,信任度系數(shù)理論上可以為任意正數(shù),其值越大表示類別矩陣使用越多,其值越小表示類別使用越少,優(yōu)選的,可以為10。使用類別信息越多,得到的效果越好,但是會增加計(jì)算量及帶來其他問題。
[0101]優(yōu)選的,第一種方式和第二種方式的總和,如圖4所示,包括以下步驟:
[0102]步驟S401:對各個樣本K個近鄰樣本進(jìn)行重構(gòu),獲得各個樣本的K個重構(gòu)樣本;
[0103]步驟S402:計(jì)算各個樣本與其K個重構(gòu)樣本的第五歐氏距離;
[0104]步驟S403:計(jì)算各個樣本與其類別矩陣的第六歐氏距離;
[0105]步驟S404:獲取第六歐氏距離與信任度系數(shù)的第二乘積;
[0106]步驟S405:將第五歐氏距離與第二乘積的之和作為所述歐氏距離和值。
[0107]第三種方式能夠具有以上兩種方式的優(yōu)勢。
[0108]第一種方式和第三種方式中,對各個樣本K個近鄰樣本進(jìn)行重構(gòu)包括:利用重構(gòu)權(quán)值矩陣對K個近鄰樣本進(jìn)行重構(gòu)。
[0109]優(yōu)選的,本發(fā)明上述實(shí)施例中獲取重構(gòu)權(quán)值矩陣的具體實(shí)現(xiàn)過程可以有兩種實(shí)現(xiàn)方式,第一種實(shí)現(xiàn)方式S1:根據(jù)局部散度計(jì)算重構(gòu)權(quán)值矩陣,第二種實(shí)現(xiàn)方式S2:根據(jù)總體散度計(jì)算重構(gòu)權(quán)值矩陣。
[0110]采用局部散度計(jì)算得到計(jì)算重構(gòu)權(quán)值矩陣時(shí),由于局部散度中判別信息不完整,不能很好的利用判別信息構(gòu)建投影變換矩陣,因此為了充分利用判別信息采用總體散度的方式構(gòu)建投影變換矩陣,總體散度為局部散度與非局部散度的總和。
[0111]第一種方式:如圖5所示,包括以下步驟:
[0112]步驟S501:利用重構(gòu)權(quán)值矩陣對各個訓(xùn)練樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個訓(xùn)練樣本的K個重構(gòu)訓(xùn)練樣本;
[0113]步驟S502:計(jì)算各個訓(xùn)練樣本與其K個重構(gòu)訓(xùn)練樣本的第七歐氏距離;
[0114]步驟S503:對所述第七歐氏距離取最小值獲取重構(gòu)權(quán)值矩陣。
[0115]第一種方式為采用訓(xùn)練樣本獲取重構(gòu)權(quán)值矩陣,由于判別子空間中的樣本與訓(xùn)練樣本僅為維數(shù)不同而已,還保持著訓(xùn)練樣本的特性,訓(xùn)練樣本中的重構(gòu)權(quán)值矩陣能夠適用于判別子空間中。
[0116]第二種方式:如圖6所示,包括以下步驟:
[0117]步驟S601:利用重構(gòu)權(quán)值矩陣`對各個訓(xùn)練樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個訓(xùn)練樣本的K個重構(gòu)訓(xùn)練樣本;
[0118]步驟S602:計(jì)算各個訓(xùn)練樣本與其K個重構(gòu)訓(xùn)練樣本的第八歐氏距離;
[0119]步驟S603:取所述重構(gòu)權(quán)值矩陣的一范數(shù);
[0120]步驟S604:取第八歐氏距離與一范數(shù)之和的最小值,獲取重構(gòu)權(quán)值矩陣。
[0121]第二種方式在第一種方式的基礎(chǔ)之上增加了一范數(shù),一范數(shù)的作用為將重構(gòu)權(quán)值矩陣中為零的越多,不為零的越少,使K個訓(xùn)練樣本中與訓(xùn)練樣本同類的參與計(jì)算,與訓(xùn)練樣本異類的不參與計(jì)算,即忽略異類樣本的作用,由此得到的重構(gòu)權(quán)值矩陣更能代表各個樣本的原始信息。
[0122]優(yōu)選的,在步驟SlOl之前本發(fā)明還包括:對所述各個訓(xùn)練樣本進(jìn)行預(yù)降維處理。
[0123]現(xiàn)實(shí)世界中物體對應(yīng)的數(shù)據(jù)維度很高,為了降低運(yùn)算量先對原始訓(xùn)練樣本進(jìn)行降維處理,降維處理之后的訓(xùn)練樣本維度較低能夠更好的進(jìn)行計(jì)算。
[0124]為了清楚表達(dá)本發(fā)明的實(shí)現(xiàn)過程,下面我們采用具體實(shí)施例進(jìn)行詳細(xì)表述:
[0125]( I)確定訓(xùn)練樣本與類別信息
[0126]將訓(xùn)練樣本集定義為{X,O',.!+Li,E Rf\)) = {1,2,...,Cj
O
[0127]其中,yi是Xi的類別標(biāo)簽即類別信息,c表示類別信息的數(shù)量,I表示訓(xùn)練樣本的總個數(shù),D表示訓(xùn)練樣本集中的訓(xùn)練樣本的維數(shù);
[0128](2)一次降維處理
[0129]為了降低運(yùn)算的復(fù)雜度,提高運(yùn)算速度;首先,對上述訓(xùn)練樣本集進(jìn)行隨機(jī)降維,將訓(xùn)練樣本由D維降到d維,在降維過程中,訓(xùn)練樣本的類別信息保持不變,其中,d〈D ;在本實(shí)施例中d=100。
[0130]降維后的訓(xùn)練樣本定義為:隊(duì)2,…,c);在本實(shí)施例中D=10304, 1=200,c=40。
[0131]其中,d為降維后的訓(xùn)練樣本的維數(shù),i為降維后的訓(xùn)練樣本。
[0132](3)構(gòu)造類別矩陣
[0133]利用訓(xùn)練樣本的標(biāo)簽信息,構(gòu)造一個具有分類信息的矩陣即當(dāng)yi=j,i=l, 2,...,1時(shí),比的第j個分量為1,否則為O。
[0134](4)獲取重構(gòu)權(quán)值矩陣
[0135]重構(gòu)權(quán)值系數(shù)矩陣W可以通過求解下面的優(yōu)化問題來獲得:
【權(quán)利要求】
1.一種投影變換矩陣的獲取方法,其特征在于,包括: 依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣; 將所述各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間; 在所述判別子空間中計(jì)算所有樣本的歐氏距離和值,所述歐氏距離和值為各個樣本與其K個近鄰樣本的歐氏距離,加上各個樣本與其類別矩陣的歐氏距離之和; 對所述歐氏距離和值取最小值,獲得所述投影變換矩陣。
2.如權(quán)利要求1所述的方法,其特征在于,依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣包括: 所述類別矩陣的每一行對應(yīng)一個訓(xùn)練樣本,類別矩陣的每一列表示一個類別; 所述類別矩陣中各個樣本行的類別標(biāo)簽列為1,其余都為O,由此構(gòu)建類別矩陣。
3.如權(quán)利要求1所述的方法,其特征在于,歐氏距離和值的獲取過程包括: 對各個樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個樣本的K個重構(gòu)樣本; 計(jì)算各個樣本與其K個重構(gòu)樣本的第一歐氏距離; 計(jì)算各個樣本與其類別矩陣的第二歐氏距離; 將所述第一歐氏距離與所述第二歐氏距離的之和作為所述歐氏距離和值。
4.如權(quán)利要求1所述的方法 ,其特征在于,歐氏距離和值的獲取過程包括: 計(jì)算各個樣本與其K個近鄰樣本的第三歐氏距離; 計(jì)算各個樣本與其類別矩陣的第四歐氏距離; 獲取所述第四歐氏距離與信任度系數(shù)的第一乘積; 將所述第三歐氏距離與所述第一乘積的和值作為所述歐氏距離和值。
5.如權(quán)利要求1所述的方法,其特征在于,歐氏距離和值的獲取過程包括: 對各個樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個樣本的K個重構(gòu)樣本; 計(jì)算各個樣本與其K個重構(gòu)樣本的第五歐氏距離; 計(jì)算各個樣本與其類別矩陣的第六歐氏距離; 獲取所述第六歐氏距離與信任度系數(shù)的第二乘積; 將所述第五歐氏距離與所述第二乘積的之和作為所述歐氏距離和值。
6.如權(quán)利要求3或5所述的方法,其特征在于,對各個樣本的K個近鄰樣本進(jìn)行重構(gòu)包括: 利用重構(gòu)權(quán)值矩陣對所述K個近鄰樣本進(jìn)行重構(gòu)。
7.如權(quán)利要求6所述的方法,其特征在于,所述重構(gòu)權(quán)值矩陣的獲取方法包括: 利用所述重構(gòu)權(quán)值矩陣對各個訓(xùn)練樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個訓(xùn)練樣本的K個重構(gòu)訓(xùn)練樣本; 計(jì)算各個訓(xùn)練樣本與其K個重構(gòu)訓(xùn)練樣本的第七歐氏距離; 對所述第七歐氏距離取最小值獲取重構(gòu)權(quán)值矩陣。
8.如權(quán)利要求6所述的方法,其特征在于,重構(gòu)權(quán)值矩陣的獲取方法包括: 利用所述重構(gòu)權(quán)值矩陣對各個訓(xùn)練樣本的K個近鄰樣本進(jìn)行重構(gòu),獲得各個訓(xùn)練樣本的K個重構(gòu)訓(xùn)練樣本; 計(jì)算各個訓(xùn)練樣本與其K個重構(gòu)訓(xùn)練樣本的第八歐氏距離; 取所述重構(gòu)權(quán)值矩陣的一范數(shù);取第八歐氏距離與一范數(shù)之和的最小值,獲取重構(gòu)權(quán)值矩陣。
9.如權(quán)利要求1所述的方法,其特征在于,在依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣之前還包括: 對所述各個訓(xùn)練樣本進(jìn)行預(yù)降維處理。
10.一種樣本分類方法,其特征在于,包括: 將各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間,所述投影變換矩陣為采用如權(quán)利要求I所述的方法獲取的; 將待分類樣本利用所述投影變換矩陣降維至所述判別子空間; 在所述判別子空間中利用最近鄰分類器對所述待分類樣本進(jìn)行分類。
11.如權(quán)利要求10所述的方法,其特征在于,在將待分類樣本利用所述投影變換矩陣降維至所述判別子空間之前還包括: 對所述待分類樣本進(jìn)行降維處理。
12.一種投影變換矩陣的獲取裝置,其特征在于,包括: 構(gòu)建單元,用于依據(jù)各個訓(xùn)練樣本的類別標(biāo)簽構(gòu)建類別矩陣; 第一降維單元,用于將所述各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間; 計(jì)算單元,用于在判別子空間計(jì)算所有樣本的歐氏距離和值,所述歐氏距離和值為各個樣本與其K個近鄰樣本的歐氏距離,加上各個樣本與其類別矩陣的歐氏距離之和; 獲取單元,用于對所述歐氏距離和值取最小值,獲得所述投影變換矩陣。
13.一種樣本分類裝置,其特征在于,包括: 第二降維單元,用于將各個訓(xùn)練樣本利用投影變換矩陣降維至判別子空間,所述投影變換矩陣為采用如權(quán)利要求1所述的方法獲取的; 第三降維單元,用于將待分類樣本利用所述投影變換矩陣降維至所述判別子空間; 分類單元,用于在所述判別子空間中利用最近鄰分類器對所述待分類樣本進(jìn)行分類。
【文檔編號】G06K9/66GK103886345SQ201410161914
【公開日】2014年6月25日 申請日期:2014年4月22日 優(yōu)先權(quán)日:2014年4月22日
【發(fā)明者】張莉, 包興, 趙夢夢, 王邦軍, 何書萍, 楊季文, 李凡長 申請人:蘇州大學(xué)