本發(fā)明涉及人臉識(shí)別,尤其涉及人臉識(shí)別數(shù)據(jù)模型的構(gòu)建方法、人臉識(shí)別方法及終端。
背景技術(shù):
1、隨著科技的飛速發(fā)展,人臉識(shí)別技術(shù)在眾多領(lǐng)域得到了廣泛應(yīng)用,如安防監(jiān)控、門禁系統(tǒng)、金融支付、社交娛樂等。然而,現(xiàn)有人臉識(shí)別技術(shù)仍面臨諸多挑戰(zhàn)與不足。
2、在數(shù)據(jù)模型構(gòu)建方面,數(shù)據(jù)采集往往不夠全面和多樣化。許多人臉識(shí)別系統(tǒng)僅在有限的光照條件、角度和人群范圍內(nèi)采集數(shù)據(jù),導(dǎo)致模型對(duì)不同環(huán)境和個(gè)體特征的適應(yīng)性較差。例如,在一些低光照或強(qiáng)光直射場(chǎng)景下,人臉識(shí)別準(zhǔn)確率大幅下降;對(duì)于側(cè)臉、仰頭或低頭等非正面人臉圖像,識(shí)別效果也不盡人意。同時(shí),數(shù)據(jù)預(yù)處理環(huán)節(jié)可能存在缺陷,如去噪不徹底、圖像對(duì)比度增強(qiáng)效果不佳,影響后續(xù)特征提取的準(zhǔn)確性。特征提取方法也有待改進(jìn),部分傳統(tǒng)方法難以有效捕捉人臉的細(xì)微特征和深層次特征,使得模型在面對(duì)相似人臉時(shí)容易出現(xiàn)誤判。模型訓(xùn)練過程中,訓(xùn)練數(shù)據(jù)的劃分比例不合理、訓(xùn)練算法選擇不當(dāng)以及缺乏有效的防止過擬合措施等問題較為常見,導(dǎo)致模型的泛化能力和穩(wěn)定性不足。
3、在人臉識(shí)別方法應(yīng)用中,圖像采集設(shè)備的性能限制影響了待識(shí)別圖像的質(zhì)量。一些普通攝像頭在分辨率、對(duì)焦速度和防抖能力上存在不足,使得采集到的人臉圖像模糊或變形,增加了識(shí)別難度。而且,在人臉檢測(cè)步驟,現(xiàn)有的檢測(cè)算法對(duì)于復(fù)雜背景下的人臉、部分遮擋的人臉或多人臉場(chǎng)景的處理不夠精準(zhǔn),容易出現(xiàn)漏檢或誤檢情況。匹配算法方面,單一的相似度計(jì)算方法可能無(wú)法準(zhǔn)確衡量人臉特征的差異,尤其是在特征向量維度較高且數(shù)據(jù)分布復(fù)雜時(shí),容易導(dǎo)致識(shí)別錯(cuò)誤。此外,缺乏有效的二次驗(yàn)證機(jī)制,在識(shí)別結(jié)果模糊時(shí)無(wú)法進(jìn)一步確認(rèn)身份,降低了系統(tǒng)的可靠性。
4、在人臉識(shí)別終端設(shè)備上,功能集成度不夠完善。部分終端的圖像采集模塊缺少自動(dòng)對(duì)焦和防抖功能,圖像預(yù)處理與檢測(cè)模塊計(jì)算速度慢,無(wú)法滿足實(shí)時(shí)性要求。特征提取與識(shí)別模塊的模型更新不及時(shí),難以適應(yīng)新的人臉數(shù)據(jù)特征和應(yīng)用場(chǎng)景變化。結(jié)果輸出模塊的靈活性不足,不能根據(jù)不同用戶需求和應(yīng)用場(chǎng)景提供個(gè)性化的輸出格式和內(nèi)容。
5、綜上所述,現(xiàn)有人臉識(shí)別技術(shù)在數(shù)據(jù)模型構(gòu)建、識(shí)別方法和終端設(shè)備等方面存在諸多問題,迫切需要一種更先進(jìn)、更可靠、更具適應(yīng)性的人臉識(shí)別技術(shù)方案來(lái)滿足日益增長(zhǎng)的市場(chǎng)需求和應(yīng)用場(chǎng)景要求。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提出的人臉識(shí)別數(shù)據(jù)模型的構(gòu)建方法、人臉識(shí)別方法及終端,以解決上述現(xiàn)有技術(shù)中提到的問題。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:一種人臉識(shí)別數(shù)據(jù)模型的構(gòu)建方法,包括以下步驟:
3、數(shù)據(jù)采集步驟:通過圖像采集設(shè)備收集人臉圖像數(shù)據(jù),所述圖像采集設(shè)備包括高清攝像頭、深度攝像頭以及紅外攝像頭,在不同光照條件下,以及不同角度下,對(duì)1000個(gè)不同年齡段、性別、種族的個(gè)體進(jìn)行拍攝,采集數(shù)量不少于50000張圖像,對(duì)采集的圖像進(jìn)行實(shí)時(shí)篩選,去除模糊、遮擋嚴(yán)重的圖像;
4、數(shù)據(jù)預(yù)處理步驟:對(duì)采集到的人臉圖像進(jìn)行預(yù)處理,首先,進(jìn)行圖像灰度化處理,將彩色圖像轉(zhuǎn)換為灰度圖像,然后,采用高斯濾波算法去除圖像噪聲,通過調(diào)整高斯核的大小為3x3來(lái)平衡去噪效果和圖像細(xì)節(jié)保留程度,利用直方圖均衡化增強(qiáng)圖像對(duì)比度,使面部特征清晰化,進(jìn)行人臉檢測(cè)與定位,采用基于深度學(xué)習(xí)的yolov5目標(biāo)檢測(cè)算法,識(shí)別出圖像中的人臉區(qū)域,并將其裁剪出來(lái);
5、特征提取步驟:運(yùn)用深度學(xué)習(xí)框架tensorflow,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)cnn模型用于特征提取,cnn模型包含3個(gè)卷積層、2個(gè)池化層和2個(gè)全連接層,卷積層通過不同大小的卷積核,包括3x3或5x5,提取人臉圖像的局部特征,池化層進(jìn)行下采樣操作,降低數(shù)據(jù)維度并保留主要特征,全連接層將提取的特征進(jìn)行整合與映射,得到表征人臉的高維特征向量;在訓(xùn)練過程中,采用公開人臉數(shù)據(jù)集,包括lfw數(shù)據(jù)集、celeba數(shù)據(jù)集,對(duì)cnn模型進(jìn)行預(yù)訓(xùn)練,然后使用采集到的自有數(shù)據(jù)進(jìn)行微調(diào),適應(yīng)人臉識(shí)別任務(wù)需求;
6、模型訓(xùn)練步驟:將提取的人臉特征數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,比例為6:2:2;使用訓(xùn)練集對(duì)人臉識(shí)別模型進(jìn)行訓(xùn)練,訓(xùn)練算法采用隨機(jī)梯度下降sgd算法,在訓(xùn)練過程中,設(shè)置合適的損失函數(shù),包括交叉熵?fù)p失函數(shù),使損失函數(shù)值逐漸減小,采用早停法earlystopping防止過擬合,當(dāng)驗(yàn)證集上的損失函數(shù)值在連續(xù)5個(gè)訓(xùn)練周期內(nèi)不再下降時(shí),停止訓(xùn)練;在測(cè)試集上評(píng)估模型的性能,根據(jù)準(zhǔn)確率、召回率、f1值指標(biāo)調(diào)整訓(xùn)練參數(shù),包括學(xué)習(xí)率設(shè)為0.001、批處理大小設(shè)為32,經(jīng)過100次迭代訓(xùn)練,得到訓(xùn)練好的人臉識(shí)別數(shù)據(jù)模型。
7、進(jìn)一步的,在數(shù)據(jù)采集步驟中,利用3d重建技術(shù)對(duì)采集到的人臉圖像進(jìn)行深度信息補(bǔ)充,增強(qiáng)模型對(duì)人臉形狀特征的識(shí)別能力。
8、進(jìn)一步的,在數(shù)據(jù)預(yù)處理步驟中,采用自適應(yīng)直方圖均衡化算法,根據(jù)圖像的局部特征動(dòng)態(tài)調(diào)整均衡化參數(shù),提高圖像對(duì)比度增強(qiáng)效果。
9、進(jìn)一步的,在特征提取步驟中,在cnn模型中引入注意力機(jī)制,使模型聚焦于人臉的特征區(qū)域,提高特征提取的質(zhì)量。
10、進(jìn)一步的,在模型訓(xùn)練步驟中,采用集成學(xué)習(xí)方法,將3個(gè)訓(xùn)練好的人臉識(shí)別模型進(jìn)行集成,通過加權(quán)平均或投票法,提高模型的整體性能和穩(wěn)定性。
11、進(jìn)一步的,一種應(yīng)用所述的人臉識(shí)別數(shù)據(jù)模型的構(gòu)建方法得到的人臉識(shí)別數(shù)據(jù)模型進(jìn)行人臉識(shí)別的方法,包括以下步驟:
12、待識(shí)別圖像獲取步驟:通過圖像采集設(shè)備獲取待識(shí)別的人臉圖像,圖像采集設(shè)備需保證圖像的清晰度和分辨率,采集的圖像格式為常見的圖像格式,包括jpeg、png;
13、圖像預(yù)處理與人臉檢測(cè)步驟:對(duì)待識(shí)別圖像進(jìn)行預(yù)處理,處理方式與數(shù)據(jù)預(yù)處理步驟類似,包括灰度化、去噪、對(duì)比度增強(qiáng)操作;采用人臉檢測(cè)算法檢測(cè)出圖像中的人臉區(qū)域,若未檢測(cè)到人臉或檢測(cè)到多個(gè)人臉,給出相應(yīng)提示信息并結(jié)束識(shí)別流程;
14、特征提取與匹配步驟:利用構(gòu)建好的人臉識(shí)別數(shù)據(jù)模型對(duì)檢測(cè)到的人臉區(qū)域進(jìn)行特征提取,得到待識(shí)別圖像的人臉特征向量,將特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已知人臉特征向量進(jìn)行匹配,匹配算法采用余弦相似度算法,計(jì)算待識(shí)別特征向量與數(shù)據(jù)庫(kù)中每個(gè)特征向量的相似度,設(shè)定相似度閾值為0.8,當(dāng)相似度超過該閾值時(shí),判定為匹配成功,識(shí)別出對(duì)應(yīng)的人員身份;若相似度均未超過閾值,則識(shí)別失敗,將該待識(shí)別圖像標(biāo)記為未知人員,并可選擇將其特征向量存儲(chǔ)到數(shù)據(jù)庫(kù)中。
15、進(jìn)一步的,在待識(shí)別圖像獲取步驟中,若圖像采集設(shè)備采集的圖像質(zhì)量不滿足要求,自動(dòng)調(diào)整采集參數(shù),包括焦距、曝光時(shí)間,重新采集圖像。
16、進(jìn)一步的,在特征提取與匹配步驟中,當(dāng)匹配結(jié)果處于相似度閾值附近的模糊區(qū)域,即相似度在0.7至0.8之間時(shí),采用二次驗(yàn)證機(jī)制,包括結(jié)合活體檢測(cè)技術(shù)或要求輸入額外的身份驗(yàn)證信息,提高識(shí)別結(jié)果的準(zhǔn)確性。
17、進(jìn)一步的,一種執(zhí)行所述的一種人臉識(shí)別的方法的人臉識(shí)別終端,包括:
18、圖像采集模塊:用于實(shí)現(xiàn)待識(shí)別圖像獲取步驟的功能,包括高清攝像頭等圖像采集設(shè)備;
19、圖像預(yù)處理與檢測(cè)模塊:執(zhí)行圖像預(yù)處理與人臉檢測(cè)步驟,對(duì)采集的圖像進(jìn)行預(yù)處理和人臉檢測(cè)操作;
20、特征提取與識(shí)別模塊:按照特征提取與匹配步驟,利用構(gòu)建好的人臉識(shí)別數(shù)據(jù)模型進(jìn)行特征提取與匹配識(shí)別;
21、結(jié)果輸出模塊:將人臉識(shí)別的結(jié)果輸出,輸出方式為在終端屏幕上顯示、語(yǔ)音播報(bào)或者通過網(wǎng)絡(luò)傳輸?shù)狡渌O(shè)備。
22、進(jìn)一步的,所述圖像采集模塊具備自動(dòng)對(duì)焦和圖像防抖功能,確保在不同環(huán)境下都能采集到高質(zhì)量圖像。
23、所述圖像預(yù)處理與檢測(cè)模塊采用硬件加速技術(shù),包括gpu加速;
24、所述特征提取與識(shí)別模塊具有模型更新功能,定期從服務(wù)器下載更新的人臉識(shí)別數(shù)據(jù)模型;
25、所述結(jié)果輸出模塊根據(jù)用戶需求定制輸出格式和內(nèi)容,滿足不同應(yīng)用場(chǎng)景的需求。
26、與現(xiàn)有的技術(shù)相比,本發(fā)明的有益效果是:
27、本專利具有多方面顯著有益效果。在數(shù)據(jù)模型構(gòu)建上,通過多類型攝像頭采集海量且多樣的人臉圖像,涵蓋不同光照、角度與人群,確保數(shù)據(jù)豐富全面。先進(jìn)的數(shù)據(jù)預(yù)處理技術(shù)有效去除噪聲、增強(qiáng)對(duì)比度并精準(zhǔn)定位人臉,為后續(xù)步驟奠定良好基礎(chǔ)。采用深度學(xué)習(xí)框架構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)結(jié)合注意力機(jī)制,能精準(zhǔn)提取人臉關(guān)鍵特征,經(jīng)合理劃分?jǐn)?shù)據(jù)集與優(yōu)化訓(xùn)練算法訓(xùn)練得到的模型,泛化能力強(qiáng)、穩(wěn)定性高,可適應(yīng)復(fù)雜多變的人臉識(shí)別任務(wù)。
28、人臉識(shí)別方法中,圖像采集設(shè)備可自動(dòng)優(yōu)化采集參數(shù)獲取高質(zhì)量圖像,人臉檢測(cè)算法能在復(fù)雜場(chǎng)景準(zhǔn)確識(shí)別,降低誤檢漏檢率。采用余弦相似度算法并設(shè)合理閾值,結(jié)合二次驗(yàn)證機(jī)制,在模糊區(qū)域借助活體檢測(cè)或額外信息驗(yàn)證,極大提高識(shí)別準(zhǔn)確率與可靠性,有效避免誤識(shí)別情況發(fā)生。
29、人臉識(shí)別終端方面,圖像采集模塊的自動(dòng)對(duì)焦和防抖功能保證圖像質(zhì)量,圖像預(yù)處理與檢測(cè)模塊的硬件加速技術(shù)實(shí)現(xiàn)快速處理,滿足實(shí)時(shí)性需求。特征提取與識(shí)別模塊的模型更新功能使其能緊跟技術(shù)發(fā)展與數(shù)據(jù)變化,持續(xù)提升識(shí)別性能。結(jié)果輸出模塊可定制化輸出,滿足不同場(chǎng)景需求,如安防領(lǐng)域的詳細(xì)報(bào)警信息輸出、社交娛樂應(yīng)用中的趣味互動(dòng)結(jié)果展示等,極大拓展了人臉識(shí)別技術(shù)的應(yīng)用范圍與用戶體驗(yàn)。