一種基于tfidf的人臉圖像年齡的估計方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于TFIDF的人臉圖像年齡的估計方法。
【背景技術(shù)】
[0002] 在過去的幾年里,臉部年齡估計迅速成為一個熱點話題,使得這個領(lǐng)域吸引了越 來越多的人。臉部圖像顯示一系列可視化特征,例如身份、表情、姿勢、種族、性別和年齡。臉 部衰老取決于多種因素,包括人類基因、健康狀況、生活方式以及環(huán)境。因老化帶來面貌的 變化會很大程度地降低許多應(yīng)用的性能,因此在臉部圖像分析領(lǐng)域里一個健壯的年齡估計 系統(tǒng)成為一個極為重要的問題。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的在于提供一種基于TFIDF的人臉圖像年齡的估計方法,與傳統(tǒng)的人 臉圖像年齡的估計方法相比,簡潔高效而且適用于大型數(shù)據(jù)庫。
[0004] 本發(fā)明一種基于TFIDF的人臉圖像的年齡估計方法,包括以下幾個步驟:
[0005] 步驟1、將一張人臉圖像img通過ASM算法提取68個關(guān)鍵特征點,生成形狀向量 AAMimg,記為AAMimg= (Xi,x2,…,x136),其中(XpxJ作為形狀向量AAMimg的第一個特征點, (x3,x4)作為形狀向量AAMinJ^第二個特征點,依次類推;
[0006] 步驟2、將所述形狀向量AAMimg的每個分量轉(zhuǎn)換成Landmark-Term值,具體為:
[0007] 將形狀向量AAMimg=(x^x2,…,x136)的第i個分量Xi轉(zhuǎn)換成形式為"F-i-LOC" 的字符串,其中i表示第i個分量
車中,為取整操作,width為預(yù)置 的固定值,稱"F-i-LOC"為形狀向量AAMimg第i個Landmark-Term值,其中i的取值范圍 在[1, 136];
[0008] 步驟3、根據(jù)給定的人臉圖像庫,抽取出所有人臉圖像的形狀向量AAMimg,組成形狀 向量AAMjf本空間(AAM?。海珹AM,,…,AAM、),假設(shè)整個AAMij^本空間 里有m個不同的Landmark-Term值,則所有的Landmark-Term值構(gòu)成一個Landmark-Term字典DIC,DIC=(termuterm2, ???,termj,其中Landmark-Term字典DIC中的 第i個Landmark-Term值;
[0009] 步驟4、對于任意一個人臉圖像的形狀向量AAMimg,將其轉(zhuǎn)換成一個Landmark-Term 向量TermVec(img),具體如下:
[0010] 給定一個形狀向量AAMimg,對應(yīng)的Landmark-Term向量為TermVec(img)= (Vi,v2,...vm),其中,m為Landmark-Term字典中的Landmark-Term值總數(shù),若形狀向量 AAMimg中存在一個分量轉(zhuǎn)化成Landmark-Term值后與Landmark-Term字典DIC中的termi相 同,則Vi= 1,否則vi= 0 ;
[0011] 步驟5、給每個年齡組里所有Landmai'k-Tenn向量求和,則對所有的年齡組別,可 得到Landmark-Term值的權(quán)重矩陣W,具體為:
[0012] 將給定的人臉圖像庫中訓(xùn)練數(shù)據(jù)的所有人臉圖像按年齡分組,對 于每一個年齡組,將該年齡組內(nèi)所有的Landmark-Term向量進行求和計算:
,其中,(^表示第j個年齡組別,imgeh表示人臉圖 像img屬于Cj年齡組,SumVecj表示cj年齡組的統(tǒng)計向量,其中第i個分量的值代表的 是Landmark-Term字典DIC中的c』年齡組中出現(xiàn)的總次數(shù),用tf(termi,j)表 示,S丨
則對所有的年齡組別,采用TFIDF來權(quán)衡每個年齡組中每個 Landmark-Term值的權(quán)重,按如下公式計算:
[0013]
…一…, k
[0014]其中tf(ternii,j) =SumVeCj[i]是C」年齡組中出現(xiàn)的總次數(shù),|C|是 年齡組別的總數(shù),SumVeCk[i]表示在Ck年齡組的統(tǒng)計向量的第i個分量值,x是判斷函 數(shù)
t中k= 1,2,. . .,m化』表明term^Cj年齡組中重要的權(quán)重,權(quán) 重越大,term^C」年齡組中越重要,記W= (w^mx|c|為權(quán)重矩陣,其中m為Landmark-Term字典中的Landmark-Term值總數(shù),|C|是年齡組別的總數(shù);
[0015]步驟6、根據(jù)步驟5所得到的權(quán)重矩陣W得到投影向量proj(img),具體為:
[0016] 對于一個未知年齡分組的人臉圖像img,按權(quán)重矩陣W將該待測年齡的人臉圖像 img的Landmark-Term向量投影到年齡組空間:
[0017] proj(img) =ffXTermVec(img)'
[0018] 其中,TermVec(img) ' 是TermVec(img)的轉(zhuǎn)置向量,proj(img)中第i個分量的 值是該未知年齡分組的人臉圖像img屬于年齡組(^的相似度,即意味著值越大,人臉圖像 img的年齡等于i的可能性越大;
[0019] 步驟7、根據(jù)步驟6所得到的投影向量proj(img),估計待測年齡的人臉圖像img的最大若干可能年齡,按以下步驟計算:
[0020] (1)首先對proj(img)中的各分量按大小值進行降序排序;
[0021] (2)取降序排序后的前n個分量,n為用戶自定義的一個數(shù)值;
[0022] (3)取該n個分量在原有投影向量proj(img)中的位置生成一個新向量 posages(img) = [topAge^topAge2, . . . ,topAgeJ,其中,topAge!表示proj(img)向量分 量值最大的分量所在位置,即表示的是該待測年齡的人臉圖像img最大可能年齡;topAgei 表示的是該待測年齡的人臉圖像img中第i大可能的年齡,依此類推。
[0023] 由于本發(fā)明處理的是臉部相對簡單的特征,計算量小,有助于提高大樣本數(shù)據(jù)下 的人臉圖像年齡估計的準(zhǔn)確度及計算速度。
【具體實施方式】
[0024] 本發(fā)明一種基于TFIDF的人臉圖像年齡的估計方法,具體包括以下步驟:
[0025] 步驟1、將一張人臉圖像img通過ASM (Active Shape Model)算法提取68個關(guān)鍵 特征點,生成形狀向量AAMimg,該形狀向量AAMimg包括人臉面部68處關(guān)鍵特征點,其中每個 特征點代表人臉面部的關(guān)鍵部分,它們是毫無語義的原子元素,記為AAMimg= (Xl,x2,…, X136),其中(X"x2)作為形狀向量AAMinig的第一個特征點,(X3,x4)作為形狀向量AAMinig的第 二個特征點,依次類推;
[0026] 步驟2、將所述形狀向量AAMimg的每個分量轉(zhuǎn)換成Landmark-Term值,具體為:
[0027] 將形狀向量AAMimg=(x^x2,…,x136)的第i個分量Xi轉(zhuǎn)換成形式為"F-i-LOC" 的字符串,其中i表示第i個分量:
其中,為取整操作,width為預(yù)置 的固定值,稱"F-i-LOC"為形狀向量AAMimg第i個Landmark-Term值,其中i的取值范圍 在[1,136],以AAMimg= (5, 7,…,91)為例,取width= 5,則第 1 個Landmark-Term值為 "F-1-1 ",第 2 個Landmark-Term值為"F-2-1 ",最后一個Landmark-Term值為"F-136-18";
[0028] 步驟3、根據(jù)給定的人臉圖像庫,抽取出所有人臉圖像的形狀向量AAMimg,組成形狀 向量AAMimg樣本空間,再從中得到Landmark-Term字典,具體為:
[0029]給定一個形狀向量AAMim,本空間(AAM_:,AAM_,…,AAM^ ),假設(shè)整個樣本空間里有m個不同的Landmark-Term值,則所有的Landmark-Term值構(gòu) 成一個Landmark-Term字典,稱之為DIC= (term!,term2, ???,termj,其中七61'1111表不 Landmark-Term字典DIC中的第i個Landmark-Term值;
[0030] 步驟4、對于任意一個人臉圖像樣本的形狀向量AAMimg,將其轉(zhuǎn)換成一個 Landmark-Term向量TermVec(img),具體如下:
[0031]給定一個形狀向量AAMimg,對應(yīng)的Landmark-Term向量為TermVec(img)= (Vi,v2,...vm),其中,m為Landmark-Term字典中的Landmark-Term值總數(shù),若形狀向量 AAMimg中存在一個分量轉(zhuǎn)化成Landmark-Term值后與Landmark-Term字典DIC中的term一目 同,則Vi= 1,否則vi= 0 ;
[0032] 步驟5、給每個年齡組里所有Landmark-Term