數(shù)據(jù)降維方法及基于數(shù)據(jù)降維方法的人臉識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息處理領(lǐng)域,具體涉及一種數(shù)據(jù)降維方法及基于數(shù)據(jù)降維方法的人 臉識別方法。
【背景技術(shù)】
[0002] 數(shù)據(jù)降維是指將高維空間中的數(shù)據(jù)降低到低維的空間中,以消除原有的數(shù)據(jù)冗余 性,提高數(shù)據(jù)的后續(xù)處理能力。傳統(tǒng)數(shù)據(jù)降維主要是應用線性法。主分量分析和線性判定 分析是目前應用最為廣泛的兩種線性降維方法。盡管這兩種方法理論成熟、計算快速,但僅 僅能夠?qū)邆渚€性結(jié)構(gòu)的數(shù)據(jù)進行降維,難以直接用來處理大規(guī)模、高維且非線性的數(shù)據(jù)。
[0003] 經(jīng)科學驗證,高維數(shù)據(jù)的屬性之間常常存在著一定的規(guī)律性和相關(guān)性,這種現(xiàn)象 直觀上表現(xiàn)為高維空間中的樣本點散布在低維空間中的一個流形上,這個流形揭示了數(shù)據(jù) 集的特性,并且由較低的固有維數(shù)。
[0004] 基于上述觀點,理論上只要針對有限的、離散的數(shù)據(jù)樣本進行學習,展開高維空間 中呈折疊狀的彎曲面,發(fā)現(xiàn)并揭示數(shù)據(jù)潛在的拓撲結(jié)構(gòu),便能挖掘出隱含在低維流形中的 有用信息。對于圖像、視頻等數(shù)據(jù)都是高維的,導致后續(xù)處理能力下降,如何在確保不丟失 主要特性的前提下,盡可能地減縮維數(shù)成為一個研究熱點。
[0005] 因此,如何提供一種數(shù)據(jù)降維方法,成為亟待解決的問題。
【發(fā)明內(nèi)容】
[0006] 針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種數(shù)據(jù)降維方法及基于數(shù)據(jù)降維方法的人 臉識別方法,解決了數(shù)據(jù)維數(shù)過高引起的后續(xù)處理能力下降的問題。
[0007] 第一方面,本發(fā)明提供一種數(shù)據(jù)降維方法,所述方法包括:
[0008] SI.對于D維空間Rd中的數(shù)據(jù)點集X = U1, X2,…,xN},確定每個樣本點Xi的K個 近鄰點 Xil,Xi2,…,xiK ;
[0009] S2.根據(jù)每個樣本點Xi的K個近鄰點Xil, xi2,…,xiK計算所述每個樣本點Xi的局 部重建權(quán)值矩陣W i= {wu, wi2,…,wiK};
[0010] S3.根據(jù)所述每個樣本點X1的局部重建權(quán)值矩陣W1 = (W11, wl2,…,wlK},將每個 樣本映射到低維空間,映射條件為:
ε (Y)為損失函數(shù)值,yi 是Xi的輸出向量,yii,yi;!,…,yii(是yi的K個近鄰點,得到D維空間R d中的數(shù)據(jù)點集X = (X11X2, ...,χΝ}對應的d維空間Rd中的數(shù)據(jù)點集Y =匕…,...,yN}, d〈D。
[0011] 優(yōu)選地,所述步驟S2包括:
[0012] S21.最優(yōu)化式子
求解Wi = {wu, wi2,…,wiK},其中
[0013] 將其轉(zhuǎn)化為最優(yōu)化式子
(Xll,X12,…xlK),I為單位矩陣,Ot為0的轉(zhuǎn)置矩陣;
[0014] S22.預先設(shè)定初始值W°和計算精度ε,ε >0 ;
[0015] S23.計算
.若 I IgJ |〈 ε ,則 Wi = W〇;否則,令 s〇 =-g。,k = 0 ;
[0016] S24.最優(yōu)化下式,求解τ°,
[0018] S25.若I I gk+11 I〈 ε,結(jié)束迭代,否則,執(zhí)行步驟S26 ;
[0019] S26.若 k〈K_l,令
[0020] k = k+1,執(zhí)行步驟 S24 ;
[0021] 若 k = K-1,則 W° = Wn,執(zhí)行步驟 S23。
[0022] 第二方面,本發(fā)明提供基于數(shù)據(jù)降維方法的人臉識別方法,所述方法包括:
[0023] 提取臉部信息,轉(zhuǎn)化為數(shù)據(jù)信息;
[0024] 對所述數(shù)據(jù)信息進行數(shù)據(jù)降維處理;
[0025] 對降維后的數(shù)據(jù)進行最近鄰分類器匹配,若匹配成功,不報警;否則,報警。
[0026] 由上述技術(shù)方案可知,本發(fā)明的數(shù)據(jù)降維方法解決了數(shù)據(jù)維數(shù)過高引起的后續(xù)處 理能力下降的問題,本發(fā)明所述數(shù)據(jù)降維方法采用保形映射思想,能夠很好地保留數(shù)據(jù)結(jié) 構(gòu)信息。另外,本發(fā)明所述的數(shù)據(jù)降維方法,不需要矩陣的逆運算,簡化了計算,且擴大了應 用范圍。本發(fā)明的基于數(shù)據(jù)降維方法的人臉識別方法,為圖像后期的匹配處理提供了較大 的幫助,縮短了匹配時間、降低了匹配難度,使得人臉識別過程在較短的時間內(nèi)準確實現(xiàn)。
【附圖說明】
[0027] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明 的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù) 這些附圖獲得其他的附圖。
[0028] 圖1是本發(fā)明實施例一提供的數(shù)據(jù)降維方法的流程圖;
[0029] 圖2是本發(fā)明實施例三提供的基于數(shù)據(jù)降維方法的人臉識別方法的流程圖。
【具體實施方式】
[0030] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整的描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0031] 本發(fā)明提出的數(shù)據(jù)降維方法,能夠應用于圖像、視頻、音頻等需要進行數(shù)據(jù)降維的 場合。
[0032] 圖1示出了本發(fā)明實施例一提供的數(shù)據(jù)降維方法的流程圖,如圖1所示,本實施例 的數(shù)據(jù)降維方法如下所述。
[0033] 步驟101 :對于D維空間Rd中的數(shù)據(jù)點集X = (X1, X2,…,xN},確定每個樣本點Xi 的K個近鄰點Xil, xi2,…,xiK。
[0034] 步驟102 :根據(jù)每個樣本點Xi的K個近鄰點Xil, xi2,…,xiK計算所述每個樣本點Xi 的局部重建權(quán)值矩陣Wi = {wu, wi2,…,wiK}。
[0035] 步驟103 :根據(jù)所述每個樣本點Xi的局部重建權(quán)值矩陣Wi = {wu, wi2,…,wiK},將 每個樣本點映射到低維空間,映射條件為:
ε (Y)為損失函 數(shù)值,Y1是X1的輸出向量,yn,yl2,…,ylK是Y 1的K個近鄰點,得到D維空間Rd中的數(shù)據(jù)點 集父=&1,12,~^}對應的(1維空間1^中的數(shù)據(jù)點集¥={71,7 2,~^},(1〈0。
[0036] 由此,本實施例的數(shù)據(jù)降維方法,解決了數(shù)據(jù)維數(shù)過高引起的后續(xù)處理能力下降 的問題,本實施例所述數(shù)據(jù)降維方法采用保形映射思想,很好地保留了數(shù)據(jù)結(jié)構(gòu)信息,且具 有良好的聚合性能。
[0037] 本發(fā)明實施例二提供了一種數(shù)據(jù)降維方法,如下所述:
[0038] 步驟201 :對于D維空間Rd中的數(shù)據(jù)點集X = U1, X2,…,xN},確定每個樣本點Xi 的K個近鄰點Xil, xi2,…,xiK。
[0039] 步驟202 :根據(jù)每個樣本點Xi的K個近鄰點Xil, xi2,…,xiK計算所述每個樣本點Xi 的局部重建權(quán)值矩陣Wi = {wu, wi2,…,wiK}。
[0040] 在本步驟中,按照以下方式計算每個樣本點X1的局部重建權(quán)值矩陣W1 = Iwil, W12,…,WllJ :
[0041] 1.最優(yōu)化式子