两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

圖象處理方法和裝置,圖象處理系統(tǒng)以及存儲(chǔ)介質(zhì)的制作方法

文檔序號(hào):7954768閱讀:115來源:國(guó)知局
專利名稱:圖象處理方法和裝置,圖象處理系統(tǒng)以及存儲(chǔ)介質(zhì)的制作方法
技術(shù)領(lǐng)域
本發(fā)明的領(lǐng)域本發(fā)明涉及一種圖象處理方法和設(shè)備,以及圖象處理系統(tǒng),尤其涉及一種用于確定圖象中人臉的人臉確定方法、設(shè)備和系統(tǒng),以及一種存儲(chǔ)介質(zhì)。
本發(fā)明的背景從各種背景圖象中檢測(cè)出或提取一個(gè)特征區(qū)域的圖象處理方法是非常有用的。比如,它可以用于確定所給出的圖象中的人臉。特別是從復(fù)雜的圖象背景中檢測(cè)出人臉是一項(xiàng)很有意義的工作。它可以用于很多領(lǐng)域,比如,遠(yuǎn)程電信會(huì)議,人機(jī)交互界面,安全鑒定,監(jiān)視系統(tǒng)中的人臉追蹤,圖象壓縮等。
對(duì)于人類來說,無論是成年人或嬰兒,從復(fù)雜的背景圖象中識(shí)別出人臉是非常容易的,但是,到目前為此,還沒有一種高效的途徑以自動(dòng)、快速地檢出人臉。
確定圖象中的一塊區(qū)域是否為人臉是檢出人臉的重要步驟。目前有很多方法用于確定人臉。例如,可以利用人臉特有的特征(如兩只眼睛,嘴,鼻子)及各顯著特征間的內(nèi)在的幾何位置關(guān)系,利用人臉的對(duì)稱特性,人臉的膚色特征,模板匹配方法和神經(jīng)網(wǎng)絡(luò)方法等。例如,在第5次IEEEInternational Workshop on Robot and Human Communication,1996.第341-346頁Haiyuan Wu的文章“Face Detection and RotationsEstimation using Color Information.”一文中,給出了一種使用人臉特征(兩只眼睛和嘴)和特征間的關(guān)系作為確認(rèn)人臉的方法。在該方法中,首先考察待確定的圖象區(qū)域,看是否能從其中提取出需要的人臉特征,如能提取,則進(jìn)一步考察所提取出的臉部特征為一己有的人臉模型的匹配程度,其中該人臉模型描述了一般人臉特征間的幾何關(guān)系。如匹配程度較高,則認(rèn)為該圖象區(qū)域是人臉,否則,則認(rèn)為不是人臉。但此方法對(duì)待測(cè)圖象質(zhì)量依賴很大,受光照條件、圖象背景的復(fù)雜程度、人的種族類別的影響較大,精度不高。特別是當(dāng)圖象質(zhì)量較差時(shí),很難準(zhǔn)確地確定人臉。
還有許多其他的現(xiàn)有技術(shù)人臉檢測(cè)方法,諸如1.JYH-YUAN DENG和PEIPEI LAI,″Region-Based TemplateDeformation And Masking For Eye-Feature Extraction And Description″,Patter Recognition,Vol.30,No.3,pp.403-419,1997;2.″Generalized likelihood ratio-based face detection andextraction of mouth features″,C.Kervrann,F(xiàn).Davoine,P.Perez,R.Forchheimer,C.Labit,Pattern Recognition Letters 18(1997)899-912;3.″Face Detection From Color Images Using a Fuzzy PatternMatching Method″,Haiyuan Wu,Qian Chen,and Masahiko Yachida,IEEETransactions On Pattern Analysis And Machine Intelligence,Vol.21,No.6,June 1999;4.″Human Face Detection In a Complex Background″,GuangzhengYang and Thomas S.Huang,Pattern Recognition,Vol.27,No.1,pp.53-63.1994;5.”A Fast Approach for Detecting Human faces in a ComplexBackground”,Kin-Man Lam,Proceedings of the 1998 IEEEInternational Symposium on Circuits and System,1998,ISCAS’98 Vol.4,pp85-88.
本發(fā)明的概述因此,本發(fā)明的目的在于提供一種改進(jìn)的圖象處理方法、設(shè)備和圖象處理系統(tǒng)和存儲(chǔ)介質(zhì),所述的圖象處理方法、設(shè)備和圖象處理系統(tǒng)可以很容易地進(jìn)行圖象處理,以快速、有效地檢測(cè)或確定給定圖象中的特定區(qū)域。
本發(fā)明提供了一種方法,用于探測(cè)具有灰度分布的一個(gè)圖象中的一種對(duì)象,其特征在于該方法包括以下步驟對(duì)于所述圖象中的象素的一個(gè)子集,從所述圖象的所述灰度分布導(dǎo)出一個(gè)第一變量;對(duì)于所述象素子集,從一個(gè)預(yù)設(shè)的基準(zhǔn)分布導(dǎo)出一個(gè)第二變量, 所述基準(zhǔn)分布表征了所述對(duì)象;評(píng)價(jià)所述第一變量與所述第二變量在所述象素子集上的對(duì)應(yīng)性;根據(jù)該評(píng)價(jià)步驟的結(jié)果判定所述圖象是否包含所述對(duì)象。
另外,本發(fā)明提供了一種方法,用于探測(cè)具有灰度分布的一個(gè)圖象中的一種對(duì)象,其特征在于該方法包括以下步驟a)在所述圖象中確定一個(gè)子圖象;b)根據(jù)所述子圖象,選擇所述圖象中的象素的一個(gè)子集;c)對(duì)于該子集,從所述圖象的所述灰度分布導(dǎo)出一個(gè)第一變量;d)對(duì)于所述象素子集,從一個(gè)預(yù)設(shè)的基準(zhǔn)分布導(dǎo)出一個(gè)第二變量,所述基準(zhǔn)分布表征了所述對(duì)象;e)評(píng)價(jià)所述第一變量與所述第二變量在所述象素子集上的對(duì)應(yīng)性;f)根據(jù)該評(píng)價(jià)步驟的結(jié)果判定所述圖象是否包含所述對(duì)象。
在本發(fā)明中,對(duì)象探測(cè)是通過對(duì)兩個(gè)矢量場(chǎng)進(jìn)行評(píng)價(jià)而進(jìn)行,因而諸如光照不均勻的不利和不確定的影響可以得到消除,且本發(fā)明的方法對(duì)圖象質(zhì)量的要求可得到降低,同時(shí)本發(fā)明的方法所能夠處理的圖象的種類更多。另外,梯度計(jì)算比較簡(jiǎn)單,因而縮短了進(jìn)行探測(cè)所需的時(shí)間。
作為本發(fā)明的一個(gè)具體實(shí)施例,通過探測(cè)圖象中的一或多個(gè)表征特征(諸如一對(duì)暗區(qū),它們被預(yù)期是一對(duì)人眼),而確定出將要在其中探測(cè)一種目標(biāo)對(duì)象(諸如一個(gè)人臉)的一個(gè)子圖象,從而提供了探測(cè)圖象中的一個(gè)預(yù)定對(duì)象的一種有效的方式。
作為一個(gè)具體的實(shí)施例,本發(fā)明的方法把兩個(gè)矢量場(chǎng)之間的對(duì)應(yīng)程度的評(píng)價(jià)限于所要探測(cè)的圖象中的一個(gè)區(qū)域,諸如用于人臉探測(cè)的一個(gè)環(huán)形區(qū)中,在該區(qū)域中兩個(gè)矢量場(chǎng)之間的對(duì)應(yīng)性更為顯著,因而使得對(duì)這些對(duì)應(yīng)性的評(píng)價(jià)變得更有效,同時(shí)縮短了探測(cè)所需的時(shí)間。
作為一個(gè)進(jìn)一步的實(shí)施例,本發(fā)明的方法在評(píng)價(jià)中執(zhí)行了一種加權(quán)統(tǒng)計(jì)處理,其中使得具有較大灰度梯度的幅度的象素具有較大的權(quán)重從而對(duì)評(píng)價(jià)的結(jié)果有較大的貢獻(xiàn),從而使得探測(cè)更為有效。
作為一個(gè)進(jìn)一步的實(shí)施例,本發(fā)明的方法同時(shí)采用了加權(quán)統(tǒng)計(jì)處理和非加權(quán)統(tǒng)計(jì)處理,并根據(jù)這兩種處理的結(jié)果來判定所要探測(cè)的圖象中是否包含一個(gè)對(duì)象,從而提高了探測(cè)的準(zhǔn)確性。
按照本發(fā)明,上述目的是通過提供一種圖象處理方法實(shí)現(xiàn)的,所述方法包括在圖象中設(shè)定一個(gè)待確定矩形區(qū)域;設(shè)定包圍該矩形區(qū)域的一個(gè)環(huán)形區(qū)域;計(jì)算環(huán)形區(qū)域內(nèi)的象素點(diǎn)的灰度的梯度;為環(huán)形區(qū)域內(nèi)的所述象素點(diǎn)一種基準(zhǔn)梯度;以及根據(jù)所述象素點(diǎn)的灰度梯度和基準(zhǔn)梯度,判斷所述待確定矩形區(qū)域所包含的特征部分。
按照本發(fā)明,上述目的是通過提供一種圖象處理設(shè)備實(shí)現(xiàn)的,所述設(shè)備包括在圖象中設(shè)定一個(gè)待確定矩形區(qū)域的裝置;設(shè)定包圍該矩形區(qū)域的一個(gè)環(huán)形區(qū)域的裝置;計(jì)算環(huán)形區(qū)域內(nèi)的象素點(diǎn)的灰度的梯度的裝置;為環(huán)形區(qū)域內(nèi)的所述象素點(diǎn)一種基準(zhǔn)梯度的裝置;以及根據(jù)所述象素點(diǎn)的灰度梯度和基準(zhǔn)梯度判斷所述待確定矩形區(qū)域所包含的特征部分的裝置。
另外,本發(fā)明提供了一種存儲(chǔ)介質(zhì),其中具有用于在具有灰度分布的一個(gè)圖象中進(jìn)行對(duì)象探測(cè)的程序代碼,其特征在于該程序代碼包括用于在圖象中確定一個(gè)子圖象的代碼;用于根據(jù)所述子圖象選定一個(gè)象素子集的代碼;用于對(duì)于所述圖象中的象素的一個(gè)子集從所述圖象的所述灰度分布導(dǎo)出一個(gè)第一變量的代碼;用于對(duì)于所述象素子集從一個(gè)預(yù)設(shè)的基準(zhǔn)分布導(dǎo)出一個(gè)第二變量的代碼,所述基準(zhǔn)分布表征了所述對(duì)象;用于評(píng)價(jià)所述第一變量與所述第二變量在所述象素子集上的對(duì)應(yīng)性的代碼;
用于根據(jù)該評(píng)價(jià)步驟的結(jié)果判定所述圖象是否包含所述對(duì)象的代碼。
本發(fā)明進(jìn)一步的目的是提供一種具有新穎性的圖象處理方法和設(shè)備,圖象處理系統(tǒng)。通過下面的實(shí)施方式和附圖的描述,本發(fā)明的其他目的和特征將變得更加清楚,附圖中相同的標(biāo)號(hào)表示相同的或類似的部件。
附圖的簡(jiǎn)要描述作為本發(fā)明的一部分的附圖和本說明一起用于說明本發(fā)明的實(shí)施例,用于解釋本發(fā)明的原理。


圖1是一方框圖,示出了可以應(yīng)用根據(jù)本發(fā)明的圖象處理設(shè)備的圖象處理系統(tǒng)的的一個(gè)實(shí)施例的方框圖。
圖2為一結(jié)構(gòu)框圖,示出了按照本發(fā)明一個(gè)實(shí)施例的人臉確定裝置的結(jié)構(gòu)。
圖3示意性地示出了要被檢測(cè)的原始圖象的一個(gè)例子。
圖4為一流程圖,示出了按照本發(fā)明一個(gè)實(shí)施例的人臉確定過程。
圖5為一示意圖,示出圖3所示的原始圖象中確定的一個(gè)待測(cè)子圖象(矩形區(qū)域)以及圍繞其的環(huán)形區(qū)域。
圖6為一示意圖,示出了一幅圖象中的多個(gè)象素點(diǎn)。
圖7是一示意圖,用于說明環(huán)形區(qū)域內(nèi)各象素點(diǎn)的基準(zhǔn)梯度值。
圖8A是示意圖,示出了要被檢測(cè)的原始圖象的另一個(gè)例子圖8B是示意圖,示出了圖8A的所示的原始圖象中的一個(gè)子圖象(矩形區(qū)域)。
圖8C是示意圖,示出了為圖8B所示的矩形區(qū)域所確定的環(huán)形區(qū)域。
圖9為一流程圖,示出了按照本發(fā)明另一實(shí)施例的人臉確定過程。
圖10顯示了用于探測(cè)圖象中的人臉的一種基準(zhǔn)分布;圖11用于顯示從探測(cè)到的一對(duì)暗(眼睛)區(qū)生成用于人臉檢測(cè)的子圖象的一種方式,該對(duì)暗區(qū)被認(rèn)為可能對(duì)應(yīng)于人眼;
圖12是按照本發(fā)明的實(shí)施例的人眼檢測(cè)設(shè)備的結(jié)構(gòu)方框圖;圖13A是流程圖,用于表示查找人眼區(qū)域的過程;圖13B是要被檢測(cè)的原始圖象的一個(gè)例子;圖14A是流程圖,用于對(duì)圖象中的每列進(jìn)行分段;圖14B是一個(gè)例子,用于表示圖象中的一列;圖14C是一個(gè)例子,用于表示一列的灰度分布;圖14D是示意圖,用于表示一列被分成段的灰度分布;圖14E是一個(gè)例子,用于表示圖象中一被分成段的列;圖14F是示意圖,用于表示對(duì)一列分段點(diǎn)的確定;圖15A是流程圖,用于合并列中的谷區(qū);圖15B是示意圖,用于表示圖象中的列和每列的谷區(qū)和種子區(qū);圖15C是用于表示被檢測(cè)的眼睛備選區(qū)域的圖象;圖16A是流程圖,顯示了根據(jù)本發(fā)明的眼睛區(qū)域判定處理;圖16B是示意圖,用于表示眼睛備選區(qū)域和它的外接矩形;圖16C是用于表示被檢測(cè)出的眼睛區(qū)域的圖象;圖17A是流程圖,用于調(diào)整分段邊界;圖17B是示意圖,用于表示將分段點(diǎn)合并到其相鄰區(qū)域的過程;圖17C是示意圖,用于表示將中繼區(qū)合并到相鄰谷區(qū)的過程;圖18A是流程圖,用于判斷一個(gè)谷區(qū)是否能被合并到一個(gè)種子區(qū);圖18B是示意圖,表示一個(gè)種子區(qū)的預(yù)測(cè)谷區(qū);且圖18C是示意圖,用于表示二個(gè)谷區(qū)之間的重疊。
優(yōu)選實(shí)施例的描述下面參照附圖詳細(xì)說明本發(fā)明的優(yōu)選實(shí)施例。
圖1表示根據(jù)本發(fā)明的第一實(shí)施例的圖象處理設(shè)備的圖象處理系統(tǒng)的方框圖。在該系統(tǒng)中,打印機(jī)105,例如噴墨打印機(jī)或類似的打印機(jī),以及監(jiān)視器106和主計(jì)算機(jī)100相連。
主計(jì)算機(jī)100具有應(yīng)用軟件程序101,例如文字處理程序、放大程序、因特網(wǎng)瀏覽器以及類似的其他程序,OS(操作系統(tǒng))102,打印機(jī)驅(qū)動(dòng)程序103,用于處理指示輸出圖象的各種繪圖指令(圖象繪圖指令、文本繪圖指令、圖表繪圖指令),它們被應(yīng)用軟件程序101發(fā)送給OS102,并產(chǎn)生打印數(shù)據(jù),以及監(jiān)視器驅(qū)動(dòng)程序104,用于處理由應(yīng)用軟件程序101發(fā)出的各種繪圖指令,并在監(jiān)視器106上顯示數(shù)據(jù)。
標(biāo)號(hào)112表示指令輸入裝置,標(biāo)號(hào)113表示該裝置的驅(qū)動(dòng)程序。例如,連接有用于點(diǎn)擊在監(jiān)視器106上顯示的各種信息從而向OS102發(fā)送各種指令的鼠標(biāo)器。注意,其他的指向裝置,例如軌跡球、筆、觸摸屏及其他類似裝置或鍵盤,可被用于代替鼠標(biāo)。
主計(jì)算機(jī)100包括作為可以運(yùn)行這些軟件程序的各種硬件的中央處理單元(CPU)108,硬盤(HD)107,隨機(jī)存取存儲(chǔ)器(RAM)109,只讀存儲(chǔ)器(ROM)110等。
作為圖1所示的人臉確定系統(tǒng)的一個(gè)例子,可以在流行的IBM公司的PC-AT個(gè)人計(jì)算機(jī)上安裝微軟公司的Windows98作為操作系統(tǒng),安裝上所需的執(zhí)行打印的應(yīng)用程序,并使監(jiān)視器和打印機(jī)和個(gè)人計(jì)算機(jī)相連。
在主計(jì)算機(jī)100中,每個(gè)應(yīng)用軟件程序101使用被歸入文本(例如字符或其他類似物)的文本數(shù)據(jù)、被歸入圖表(例如插圖或其類似物)的圖表數(shù)據(jù)、被歸入自然圖象或其類似特的圖象數(shù)據(jù)等產(chǎn)生輸出圖象數(shù)據(jù)。在打印輸出圖象數(shù)據(jù)時(shí),應(yīng)用軟件程序101向OS102發(fā)出打印請(qǐng)求。此時(shí),應(yīng)用軟件程序101向OS102發(fā)出繪圖指令組,包括相應(yīng)于圖表數(shù)據(jù)的圖表繪制指令,以及相應(yīng)于圖象數(shù)據(jù)的圖象繪制指令。
OS102收到應(yīng)用軟件程序101的輸出請(qǐng)求之后,向相應(yīng)于一個(gè)輸出打印機(jī)的打印驅(qū)動(dòng)程序103發(fā)出繪圖指令組。打印機(jī)驅(qū)動(dòng)程序103處理從OS102輸入的打印請(qǐng)求和繪圖指令組,產(chǎn)生打印機(jī)105可以打印的打印數(shù)據(jù),并把打印數(shù)據(jù)傳遞到打印機(jī)105。當(dāng)打印機(jī)105是掃描打印機(jī)時(shí),打印機(jī)驅(qū)動(dòng)程序103按照來自O(shè)S102的繪圖指令進(jìn)行圖象校正處理,然后按順序掃描一個(gè)存儲(chǔ)器(諸如RGB24位面存儲(chǔ)器)上的指令。在完成所有繪圖指令之后,打印機(jī)驅(qū)動(dòng)程序103把RGB24位頁存儲(chǔ)器的內(nèi)容轉(zhuǎn)換成打印機(jī)105可以打印的數(shù)據(jù)格式,如CMYK數(shù)據(jù),并把轉(zhuǎn)換的數(shù)據(jù)傳遞給打印機(jī)105。
注意主計(jì)算機(jī)100可以連接數(shù)字?jǐn)z像機(jī)111,其檢測(cè)物體的圖象并產(chǎn)生RGB圖象數(shù)據(jù),并可以把檢測(cè)的圖象數(shù)據(jù)裝載并存儲(chǔ)在HD107中。注意,由數(shù)字?jǐn)z像機(jī)111檢測(cè)的圖象數(shù)據(jù)按照例如JPEG編碼。檢測(cè)的圖象數(shù)據(jù)在被打印機(jī)驅(qū)動(dòng)程序103譯碼之后可以作為圖象數(shù)據(jù)傳遞給打印機(jī)105。
主計(jì)算機(jī)100還包括人臉探測(cè)裝置114,用于確定所檢測(cè)圖象中是否包含人臉。存儲(chǔ)在HD107或其他類似部分的圖象數(shù)據(jù)被人臉確定裝置114讀取并被處理。首先,讀取可能的人臉區(qū)域部分,并判斷該區(qū)域是否為人臉。然后,在OS102的控制之下,向打印機(jī)105或監(jiān)視器106輸出圖象中的被確定的人臉。人臉探測(cè)設(shè)備圖2為一結(jié)構(gòu)框圖,示出了按照本發(fā)明第一實(shí)施例的人臉探測(cè)設(shè)備的結(jié)構(gòu)。
本實(shí)施例中,人臉探測(cè)設(shè)備114包括讀取裝置210、人眼檢測(cè)設(shè)備218、子圖象確定裝置219、環(huán)形區(qū)域設(shè)定裝置211、第一計(jì)算裝置212、第二計(jì)算裝置213和判定裝置214。其中,在人臉探測(cè)設(shè)備114中,讀取裝置210用于執(zhí)行圖象的讀取過程。讀取裝置210讀取存儲(chǔ)在諸如HB107或RAM109等中的圖象的各象素的灰度值。
人臉探測(cè)過程圖3示意性地給出了要被檢測(cè)的原始圖象的一個(gè)例子,對(duì)該原始圖象進(jìn)行了實(shí)際的人臉檢測(cè)。該圖象中包括一幅具有人臉的圖象。其中,該原始圖象300可以通過諸如數(shù)碼相機(jī)、掃描儀等一類的數(shù)字設(shè)備111等,輸入到人臉探測(cè)系統(tǒng),并存儲(chǔ)在HD107或RAM109等諸如此類的存儲(chǔ)裝置中。
參見圖3,可以看出,通常情況下,原始圖象300中的人臉的邊緣形狀接近橢圓形,而與人類的種族、膚色、年齡、性別無關(guān)。沿人臉的邊緣可以作出一外切矩形區(qū)域300A。
圖4為一流程圖,示出了按照本發(fā)明第一實(shí)施例的人臉探測(cè)過程。
下面將參照?qǐng)D4和圖3,解釋對(duì)原始圖象中人臉的探測(cè)過程。讀取原始圖象及確定待探測(cè)的子圖象(矩形區(qū)域)參見圖4,人臉探測(cè)過程開始于步驟S40。在步驟S41,讀取裝置210首先讀取要被檢測(cè)的原始圖象300,并得到該原始圖象300中各象素點(diǎn)的灰度值。如果原始圖象300使用比如JPEG進(jìn)行編碼,那么,讀取裝置210在讀取其圖象數(shù)據(jù)之前首先對(duì)其進(jìn)行解碼。步驟S41中,讀取裝置210還讀取在該原始圖象300中一個(gè)待確定的矩形區(qū)域300A,并確定該矩形區(qū)域300A在該原始圖象300中的位置。
以下描述根據(jù)本發(fā)明的一種用于確定所要探測(cè)的圖象中的子圖象300A的方法和設(shè)備。然而,應(yīng)該理解的是,用于確定子圖象的眼睛區(qū)探測(cè)方式不限于如下所述的本發(fā)明的方法。相反地,其他的方法和/或處理-諸如現(xiàn)有技術(shù)中已知的方法和/或處理-也可被用來確定該子圖象。子圖象300A的確定眼睛檢測(cè)設(shè)備圖12為結(jié)構(gòu)框圖,示出了按照本發(fā)明實(shí)施例的及眼睛檢測(cè)設(shè)備的結(jié)構(gòu)。
本實(shí)施例中的眼睛檢測(cè)設(shè)備218包括分段裝置1201,合并裝置1202和判斷裝置1203。參見圖14D和14E,基于一個(gè)圖象的一個(gè)列C41的各象素的灰度值,圖象的列C41被分段裝置1201分割成多個(gè)區(qū)間I1-1,I1-2,…I1-9和I1-10。根據(jù)它們的象素的平均灰度值,這些區(qū)間I1-1,I1-2,…,I1-9,I1-10被劃分為3種類型峰區(qū)、谷區(qū)和中繼區(qū)。本文下面將詳細(xì)定義術(shù)語“谷區(qū)、峰區(qū)和中繼區(qū)”。然后,可以得到列C41的谷區(qū)。以同樣方式,分段裝置1201還將圖象中的其他列也劃分為3種類型并分別得到它們的谷區(qū)。在圖象的所有列被劃分為3種類型并得到他們的谷區(qū)之后,合并裝置1202執(zhí)行合并處理,并合并相鄰列的谷區(qū)。被合并的谷區(qū)被設(shè)定為人眼備選區(qū)域。然后,通過判斷裝置1203可以確定人眼。檢測(cè)眼睛區(qū)域下面將參照?qǐng)D13A的流程圖解釋用于原始圖象的人眼檢測(cè)過程。圖13B是要被檢測(cè)的原始圖象的一個(gè)例子。假設(shè)原始圖象被存儲(chǔ)在HB107,或RAM109等諸如此類的一個(gè)預(yù)定位置。
參見圖13A,在步驟S132,原始圖象的各列被分段裝置分劃分為多個(gè)區(qū)間。參照?qǐng)D14E,每個(gè)區(qū)間I1-1,I1-2,…,I1-9,I1-10的長(zhǎng)度是可變的。比如,區(qū)間I-1的長(zhǎng)度不等于區(qū)間I1-2的長(zhǎng)度。根據(jù)其象素的平均灰度值,一些分段的區(qū)間被標(biāo)記為谷區(qū)。在步驟S133,通過合并裝置1202,相鄰列的谷區(qū)被合并以生成眼睛備選區(qū)域。由于每列的谷區(qū)的長(zhǎng)度不同,因此,眼睛備選區(qū)域的大小也彼此不同。在步驟S134,通過判斷裝置1203,確定眼睛備選區(qū)域的人眼區(qū)域。這樣,就可以檢測(cè)出圖象中與人眼對(duì)應(yīng)的區(qū)域。對(duì)圖象中的各列進(jìn)行分段圖14A是流程圖,顯示了用于在步驟S132中對(duì)圖象的每列進(jìn)行分段的處理。
術(shù)語“谷區(qū)、峰區(qū)和中繼區(qū)”定義如下。
圖14B是一個(gè)例子,用于表示圖象中的一列。參見圖14B,讀取裝置200讀取原始圖象的一列C41。圖14C示出了列C41的灰度值分布圖。圖14D是被分割成段的列的灰度值分布圖。在圖14D中,標(biāo)號(hào)I1-5,I1-6,I1-9分別表示被分割的區(qū)間,且各區(qū)間或段中的灰度值是圖14C中對(duì)應(yīng)的區(qū)間或段中的象素的平均值。
圖14E是圖14B圖象的被分割的列。參見圖14E,讀取裝置200讀取圖象中列C41的圖象數(shù)據(jù)。對(duì)于圖14B的圖象,列C41被分割成區(qū)間I1-1,I1-2,…,I1-9,I1-10。區(qū)間的大小也就是該區(qū)間中象素的數(shù)量。比如,如果區(qū)間I1-2包括12個(gè)象素,那么區(qū)間I1-2的大小為12。區(qū)間的灰度值是該區(qū)間中象素的平均灰度值。
參見圖14D和14E,如果一個(gè)區(qū)間的灰度值少小于其相鄰區(qū)間的灰度值,那么該區(qū)間被稱之為“谷區(qū)”。如果一個(gè)區(qū)間的灰度值大于其相鄰區(qū)間的灰度值,那么該區(qū)間被稱之為“峰區(qū)”。另一方面,如果一個(gè)區(qū)間的灰度值位于其相鄰區(qū)間的灰度值之間,則這種區(qū)間被稱之為“中繼區(qū)”。對(duì)于本實(shí)施例中的列C41,區(qū)間I1-1,…,I1-10的灰度值分別為196、189、190、185、201、194、213、178、188和231。對(duì)于區(qū)間I1-6,其灰度值為194,而其相鄰區(qū)間I1-5,I1-7的灰度值分別為201和213。由于區(qū)間I1-6的灰度值小于其相鄰區(qū)間I1-5,I1-7,因此,區(qū)間I1-6被確定為谷區(qū)。以同樣方式,區(qū)間I1-2,I1-4和I1-8分別被確定為谷區(qū)。對(duì)于區(qū)間I1-5,其灰度值為201,其相鄰區(qū)間I1-4,I1-6的灰度值分別為185,194。由于區(qū)間I1-5的灰度值大于其相鄰區(qū)間I1-4,I1-6,因此,區(qū)間I1-5被確定為峰區(qū)。以同樣方式,區(qū)間I1-1,I1-3,I1-7和I1-10分別被確定為峰區(qū)。另外,對(duì)于區(qū)間I1-9,其灰度值為188,而其相鄰區(qū)間I1-8,I1-10的灰度值分別為178和231。由于I1-9的灰度值界于其相鄰區(qū)間I1-8,I1-10的灰度值之間,因此,區(qū)間I1-9被確定為中繼區(qū)。
由于谷區(qū)也是一個(gè)區(qū)間,由此,計(jì)算谷區(qū)的灰度值及其大小的方法與計(jì)算區(qū)間的灰度值及大小的方法一樣。這種方法也適用于計(jì)算峰區(qū)及中繼區(qū)的灰度值和大小。
下面參照?qǐng)D14A,詳細(xì)地描述步驟S132中對(duì)圖象中的每列進(jìn)行分段的過程。
參見圖14A,在步驟S141,讀取被檢測(cè)圖象左側(cè)第1列中每個(gè)象素的灰度值。為了將該列分成三種類型的區(qū)間,即谷區(qū)、峰區(qū)和中繼區(qū),必須要確定分段點(diǎn)。
在步驟S142,按照象素處的灰度值的一階導(dǎo)數(shù)值和二階導(dǎo)數(shù)值可以確定該列中的一個(gè)象素點(diǎn)是否為分段點(diǎn)。圖14F是一示意圖,示出了判斷一個(gè)象素是否為一列的分段點(diǎn)的過程。參見圖14F,在一列中給出了二個(gè)相鄰的象素Pi1,Pi2。
隨后,利用任何的離散導(dǎo)數(shù)算子,計(jì)算出在這兩個(gè)象素Pi1、Pi2處的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)值。假定象素Pi1和Pi2處的一階導(dǎo)數(shù)分別用D1f和D2f表示,象素Pi1和Pi2處的二階導(dǎo)數(shù)值分別用D1s和D2s表示。如果以下的兩個(gè)條件之一成立(D1s≥0)且(D2s<0);(D1s<0)且(D2s≥0)且D1f和D2f之一的絕對(duì)值大于一個(gè)預(yù)定值(該閾值可在6-15的范圍內(nèi)選取,優(yōu)選值為8),則象素Pi1被判定為是一個(gè)分段點(diǎn)。否則象素Pi1被判定為不是分段點(diǎn)。
這樣,在步驟S142中,可以得到多個(gè)分段點(diǎn)S11,S12,…,S19。
在列中確定分段點(diǎn)之后,在步驟S143,可以將該列分成多個(gè)區(qū)間。然后,在步驟S144,按照多個(gè)區(qū)間的灰度值,將它們分別劃分為谷區(qū)、峰區(qū)或中繼區(qū)。在步驟S145中,調(diào)整區(qū)間的邊界。步驟S145的詳細(xì)內(nèi)容將參照附圖進(jìn)行描述。在步驟S146中,檢查被檢測(cè)圖象的所有列是否都已被分段,如果被分段的列不是最后一列,則流程返回步驟S147。在步驟S147,讀取下一列中每個(gè)象素的灰度值。然后,流程進(jìn)到步驟S142并重復(fù)步驟S147及其后的步驟。然而,如果在步驟S146中要被分段的列是被檢測(cè)圖象的最后一列,即所有的列均已被分段,流程在步驟S148結(jié)束。
可選地,上述分段處理可以從被檢測(cè)圖象的其他的列(如最右邊的第一列)開始進(jìn)行。合并谷區(qū)以產(chǎn)生眼睛備選區(qū)域圖15A是流程圖,用于顯示合并圖13A中在步驟S133合并每列的谷區(qū)的處理。圖15B是示意圖,用于表示圖象中的列和每列中的谷區(qū)和種子區(qū)。在圖15B中,圖象被劃分n個(gè)列Co11,Co12,…,Co1n。
參照?qǐng)D15A和15B,在步驟S151被檢測(cè)圖象的第一列Co11(最左邊)中的所有谷區(qū)S1,S2,S3,S4被設(shè)為種子區(qū)。種子區(qū)是一個(gè)或多個(gè)谷區(qū)的集合,由于谷區(qū)的灰度值低于峰區(qū)或中繼區(qū)的灰度,因此,種子區(qū)通常是一列中的暗區(qū)域。
在圖15A的步驟S152,讀出下一列Co12的第一谷區(qū)V2-1。然后,流程進(jìn)入列步驟S153。在步驟S153,讀出第一種子區(qū)S1。在步驟S154,根據(jù)谷區(qū)V2-1和種子區(qū)S2,檢查列Co12的谷區(qū)V2-1是否可合并到種子區(qū)S1。如果列Co12的谷區(qū)V2-1可以合并到種子區(qū)S1,那么流程進(jìn)入到步驟S156并將該谷區(qū)V2-1合并到種子區(qū),然后,谷區(qū)變?yōu)榉N子區(qū)的一部分。然而,如果在步驟S154判斷谷區(qū)V2-1不能合并到種子區(qū)S1,流程進(jìn)入到步驟S155。在本實(shí)例中,列Co12的谷區(qū)V2-1不能合并到種子區(qū)S1。流程進(jìn)入步驟S155。在步驟S155,判斷種子區(qū)是否為最后的種子區(qū)。如果不是最后的種子區(qū),那么在步驟S157讀取下一種子區(qū),流程返回步驟S154,以重復(fù)步驟S154和下面的步驟。在本實(shí)例中,種子區(qū)S1不是最后的種子區(qū),那么所以在步驟S157讀取下一種子區(qū)S2。并重復(fù)以上的步驟。如果在步驟S155判斷該種子區(qū)是最后的種子區(qū),(比如,如圖15B所示的種子區(qū)S4),那么流程進(jìn)入到步驟S158,并將不能合并到種子區(qū)的谷區(qū)設(shè)置為一個(gè)新的種子區(qū)。參見圖15B,由于列Co12的谷區(qū)V2-1不能合并到種子區(qū)S1,S2,S3或S4,也就是谷區(qū)不能合并到一個(gè)已經(jīng)存在的種子區(qū)中,那么,在步驟S158,列Co12的谷區(qū)被設(shè)置為一個(gè)新種子區(qū)。
在步驟S159,判斷列Co12的所有谷區(qū)是否都已被處理。如果已處理完列Co12的所有谷區(qū),那么流程進(jìn)入步驟S1511。在步驟S1511,檢測(cè)是否已處理完所有的列。如果該列不是被檢測(cè)圖象的最后一列,那么流程返回步驟S152,以重復(fù)步驟S154以及其后步驟的處理。由于列Co12不是被檢測(cè)圖象的最后一列,流程返回步驟S152。如果已處理完所有的列,比如,如果該列是最后一列Co1n、那么流程進(jìn)入步驟S1520。在步驟S1520,所有的種子區(qū)被設(shè)定為眼睛備選區(qū)域。然后,流程在步驟S1521結(jié)束。圖15C是一個(gè)例子,示出了在步驟S133在被檢測(cè)的圖象的列中合并谷區(qū)以產(chǎn)生眼睛備選區(qū)域的結(jié)果。判斷眼睛區(qū)域圖16A為流程圖,用于顯示在步驟S134中判斷眼睛區(qū)域的處理。
參見圖16A,在步驟S161讀取第一眼睛備選區(qū)域。然后,流程進(jìn)入到步驟S162。在步驟S162,計(jì)算眼睛備選區(qū)域的灰度值。如上所述,眼睛備選區(qū)域包括一個(gè)或多個(gè)谷區(qū)。如果一個(gè)眼睛備選區(qū)域包括幾個(gè)谷區(qū),那谷區(qū)1,谷區(qū)2,…谷區(qū)n,那么,那么由下式得出眼睛備選區(qū)域的灰度值DarkGray1=(Valley1Gray1×Pixels1+Valley2Gray1×Pixels2+…+ValleynGray1×Pixelsn)/Tota1 Pixels(1)其中,DarkGary1是眼睛備選區(qū)域的灰度值;Valley1Gray1是谷區(qū)1的灰度值,Pixels1是谷區(qū)1中的象素?cái)?shù);Valley2Gray1是谷區(qū)2的灰度值,Pixels2是谷區(qū)2中的象素?cái)?shù);ValleynGray1是谷區(qū)n的灰度值;Pixelsn是谷區(qū)n中的象素?cái)?shù);Total Pixels是包含在眼睛備選區(qū)域中的象素的總數(shù)。
因此,如果眼睛備選區(qū)域包括灰度值分別為10,20,30的3個(gè)谷區(qū),且每個(gè)谷區(qū)分別包含5、6、4個(gè)象素,那么,眼睛備選區(qū)域的灰度值將為(12×5+20×6+30×4)/15=20。
參見圖16A的步驟S162,計(jì)算眼睛備選區(qū)域的灰度值。如果眼睛備選區(qū)域的值不小于第一閾值,比如,160,則流程進(jìn)入步驟S1610。在本實(shí)施例中,第一閾值位于100至200之間。在步驟S1610,眼睛備選區(qū)域被確定為假眼睛區(qū)域并被拒絕。然后,流程進(jìn)入步驟S168。在步驟S168,判斷是否已處理了被檢測(cè)圖象的所有眼睛備選區(qū)域。如果不是最后的眼睛備選區(qū)域,則在步驟S169讀取下一個(gè)眼睛備選區(qū)域,然后,流程進(jìn)入步驟S162并重復(fù)下面的步驟。然而,如果在步驟S168判斷到所檢測(cè)的眼睛備選區(qū)域是最后的眼睛備選區(qū)域,那么,被檢測(cè)圖象的所有眼睛備選區(qū)域都被確定,流程在步驟S1611結(jié)束。
在步驟S162,如果眼睛備選區(qū)域的灰度值小于第一閾值,則流程進(jìn)入步驟S163。
在步驟S163,計(jì)算眼睛備選區(qū)域的背景灰度值。包含在眼睛備選區(qū)域的谷區(qū)的背景灰度值確定眼睛備選區(qū)域的背景灰度值。谷區(qū)的背景灰度值是其相鄰區(qū)間灰度值的平均值。下式給出了在步驟S163中計(jì)算的眼睛備選區(qū)域的背景灰度值。DarkBGray1=(Valley1BGray1+Valley2BGray1+…+ValleynBGrayl)/n (2)其中,DarkBGray1是眼睛備選區(qū)域的背景灰度值;Valley1BGray1是谷區(qū)1的背景灰度值;Valley2BGray1是谷區(qū)2的背景灰度值;ValleynBGray1是谷區(qū)n的背景灰度值;n是包含在眼睛備選區(qū)域中的谷區(qū)的數(shù)量。
在步驟S163,計(jì)算眼睛備選區(qū)域的背景灰度值。如果在步驟S163,眼睛備選區(qū)域的背景灰度值不大于第二閾值,(比如,30),那么流程進(jìn)入步驟S1610。在實(shí)施例中,第二閾值位于20至80之間。在步驟S1610,判斷眼睛備選區(qū)域?yàn)榧傺劬^(qū)域,并拒絕之。然后,流程進(jìn)入步驟S168。
在步驟S163,如果眼睛備選區(qū)域的背景灰度值大于第二閾值,那么程序進(jìn)入步驟S164。
在步驟S164,計(jì)算眼睛備選區(qū)域的背景灰度值與其本身的灰度值之差。如果該差值不大于第三閾值(比如20),那么流程進(jìn)入步驟S1610。在本實(shí)施例中,第三閾值介于5至120之間。在步驟S1610,眼睛備選區(qū)域被判斷為假眼睛區(qū)域并被拒絕。然后,流程進(jìn)入步驟S168。
在步驟S163,如果眼睛備選區(qū)域的背景灰度值和其本身的灰度值之差大于第三閾值,那么流程進(jìn)入步驟S165。
在步驟S165,計(jì)算眼睛備選區(qū)域的寬度與高度之比。
關(guān)于眼睛備選區(qū)域的寬度、高度、我們進(jìn)行下述定義。谷區(qū)的大小是該谷區(qū)內(nèi)所包含的象素的數(shù)量。比如,如果谷區(qū)包括5個(gè)象素,那么谷區(qū)的大小等于5。眼睛備選區(qū)域的大小是包含在眼睛備選區(qū)域內(nèi)谷區(qū)的大小之和。眼睛備選區(qū)域的寬度是包含在該眼睛備選區(qū)域內(nèi)的谷區(qū)的數(shù)量,那么,眼睛備選區(qū)域的高度Hd由下式給出Hd=Sd/Wd (3)其中,Hd是眼睛備選區(qū)域的高度,Sd是眼睛備選區(qū)域的大小,Wd是眼睛備選區(qū)域的寬度。
參見圖16A的步驟S165,計(jì)算眼睛備選區(qū)域的寬度與高度之比。在步驟S165,如果眼睛備選區(qū)域的寬度與高度之比不大于第四閾值,(比如3.33),那么流程進(jìn)入步驟S1610。在本實(shí)施例中,第四閾值介于1到5之間。在步驟S1610,眼睛備選區(qū)域被判斷為假眼睛備選區(qū)域并被拒絕。那么隨后,流程進(jìn)入步驟S168。
在步驟S165,如果眼睛備選區(qū)域的寬度與高度之比大于第四閾值,那么流程進(jìn)入步驟S166。
在步驟S166,計(jì)算眼睛備選區(qū)域的大小與其外接矩形大小的比值。圖16B是一示意圖,示出了眼睛備選區(qū)域和其外接矩形。參見圖16B,其中給出了眼睛備選區(qū)域D1和其外接矩形DC1。從圖16B可以看出,眼睛備選區(qū)域的外接矩形DC1是包圍眼睛備選區(qū)域D1的最小矩形。眼睛備選區(qū)域外接矩形的大小是包含在該外接矩形內(nèi)的象素的數(shù)量。眼睛備選區(qū)域的大小是眼睛備選區(qū)域內(nèi)所包含的象素的數(shù)量。
在步驟S166,計(jì)算眼睛備選區(qū)域的大小與其外接矩形大小的比率。如果該比率不大于一個(gè)第五閾值,(比如0.4),那么流程進(jìn)入步驟S1610。在本實(shí)施例中,第五閾值介于0.2至1之間。在步驟S1610,眼睛備選區(qū)域被確定為假眼睛區(qū)域并被拒絕。然后,流程進(jìn)入步驟S168。
在步驟S166,如果眼睛備選區(qū)域的大小與其外接矩形的大小的比率大于第五閾值,流程進(jìn)入步驟S167,那么。在步驟S167,該眼睛備選區(qū)域被確定為一個(gè)真實(shí)的眼睛區(qū)域。
步驟S167之后,流程進(jìn)入步驟S168并判斷該眼睛備選區(qū)域是否為最后的眼睛備選區(qū)域。如果不是最后的眼睛備選區(qū)域,那么在步驟S169讀取下一眼睛備選區(qū)域并且流程返回步驟S162。如果在步驟S168判斷是最后的眼睛備選區(qū)域,那么就確定了所有的眼睛區(qū)域。圖16C是一個(gè)例子,示出了在步驟S133中所檢測(cè)的圖象的眼睛區(qū)域。調(diào)整分段邊界圖17A是一流程圖,用于在圖14A的步驟S145調(diào)整分段邊界。
參見圖17A,比較分段點(diǎn)的灰度值與其二個(gè)相鄰區(qū)間的灰度值,并且在步驟S171,把該分段點(diǎn)合并到灰度值與該點(diǎn)灰度值最接近的那一區(qū)間。比如,參見圖17B,分段點(diǎn)S的灰度值為80,其二個(gè)相鄰區(qū)間為區(qū)間In1和In2。區(qū)間In1和In2的灰度值分別為70和100。由于區(qū)間In1的灰度值更接近分段點(diǎn)S的灰度值,那么,分段點(diǎn)S合并到區(qū)間In1。
進(jìn)一步,流程進(jìn)入步驟S172。在步驟S172,讀取第一中繼區(qū)。然后,在步驟S173,計(jì)算中繼區(qū)的灰度值與其相鄰谷區(qū)和峰區(qū)的灰度值。計(jì)算它們的灰度值以后,流程進(jìn)入步驟S174,在步驟S174,進(jìn)行比較并判斷下式是否成立GR<GP×Th6+Gv×(1-Th6)其中,GR是中繼區(qū)的灰度值,Gv是中繼區(qū)相鄰谷區(qū)的灰度值,GP是中繼區(qū)相鄰峰區(qū)的灰度值,Th6為第六閾值,比如為0.2。第六閾值介于0與0.5之間。
如果在步驟S174,判斷結(jié)果為“否”,那么流程進(jìn)入步驟S176。否則,如果在步驟S174判斷結(jié)果為“是”,那么,在步驟S175,該中繼區(qū)合并到谷區(qū)。
圖17C是一示意圖,示出了將中繼區(qū)合并到其相鄰谷區(qū)的一個(gè)例子。圖17C中的X軸表示每列的位置,Y軸表示每個(gè)區(qū)的灰度值。
參見圖17C,中繼區(qū)Re1的灰度值為25,谷區(qū)Va1的灰度值為20,峰區(qū)Pe1的灰度值為70,第九閾值設(shè)定為0.2,那么Gp×Th6+Gv×(1-Th6)=70×0.2+20×0.8=30>GR=25因此,在步驟S174的判斷結(jié)果為“是”,那么中繼區(qū)Re1將合并到谷區(qū)Va1。進(jìn)一步,中繼區(qū)Re2的灰度值為40,峰區(qū)Pe2的灰度值為60,那么Gp×Th6+Gv×(1-Th6)=6×0.2+20×0.8=28>GR=40因此,在步驟S174的判斷結(jié)果是“否”,那么中繼區(qū)Re2將不能合并到谷區(qū)Va1。
參見圖17A的步驟S176,檢查是否已處理完被檢測(cè)圖象的所有中繼區(qū)。如果中繼區(qū)不是最后的中繼區(qū),那么在步驟S177讀取下一中繼區(qū),然后流程進(jìn)入步驟S173并重復(fù)步驟S173及其后步驟的處理。然而,如果在步驟S176判斷該中繼區(qū)是最后的中繼區(qū),即已處理完所有的中繼區(qū),那么流程將在步驟S178結(jié)束。這樣,就調(diào)整完了所檢測(cè)圖象的所有邊界。
判斷谷區(qū)是否能合并到種子區(qū)。
圖18A是流程圖,用于判斷在圖15A的步驟S154中,一個(gè)谷區(qū)是否能合并到一個(gè)種子區(qū)。
圖18B為示意圖,表示一個(gè)種子區(qū)的預(yù)測(cè)谷區(qū)。種子區(qū)的預(yù)測(cè)谷區(qū)并不是被檢測(cè)圖象任何列中的一個(gè)實(shí)際存在的谷區(qū)。種子區(qū)的預(yù)測(cè)谷區(qū)被認(rèn)為是位于種子區(qū)右邊最相鄰列下一列的谷區(qū),其位置與種子區(qū)的右邊的最相鄰列的位置一致。參見圖18B,谷區(qū)Va3是種子區(qū)Se1的右邊最相鄰谷區(qū),其位于列Col1,而列Col2是列Col1的下一列。那么,谷區(qū)Va1是種子區(qū)Se1的預(yù)測(cè)谷區(qū)。該預(yù)測(cè)谷區(qū)位于列Col2,其位置與谷區(qū)Va3的谷區(qū)一樣,但位于不同的列。
圖18C為一示意圖,示出了二個(gè)谷區(qū)的重疊區(qū)。這二個(gè)谷區(qū)的重疊區(qū)是這樣的一個(gè)區(qū)域,其中,該象素屬于該二個(gè)谷區(qū)。
參見圖18C,點(diǎn)B到點(diǎn)D的區(qū)間是谷區(qū)Va1,點(diǎn)A到點(diǎn)C的區(qū)間是谷區(qū)Va2,Va1是種子區(qū)Se1的預(yù)測(cè)谷區(qū),谷區(qū)Va2是列Col2的一個(gè)真實(shí)谷區(qū)。那么,點(diǎn)B到點(diǎn)C的區(qū)間是谷區(qū)Va1和谷區(qū)Va2的重疊區(qū)。
判斷一個(gè)谷區(qū)是否能合并到種子區(qū)的,過程將參照?qǐng)D18A進(jìn)行描述。參見圖18A,在步驟S181計(jì)算谷區(qū)與種子的預(yù)測(cè)谷區(qū)的重疊區(qū)。
計(jì)算完重疊區(qū)后,流程進(jìn)入到步驟S182。在步驟S182,比較并判斷下式是否成立Osize/Max(Vsize,SVsize)>Th7其中Osize是谷區(qū)與種子區(qū)的預(yù)測(cè)谷區(qū)的重疊區(qū)的大小,Max(Vsize,SVsize)是谷區(qū)和種子區(qū)預(yù)測(cè)谷區(qū)大小的最大值,Th7是第七閾值,比如為0.37。第七閾值介于0.2到0.75之間。
如果在步驟S182判斷結(jié)果為“否”,那么流程進(jìn)入步驟S188。那么谷區(qū)不能合并到種子區(qū),則流程在步驟S189結(jié)束。否則,如果在步驟S182判斷結(jié)果為“是”,那么流程進(jìn)入步驟S183。
在步驟S183,計(jì)算谷區(qū)和種子區(qū)的灰度值。然后,流程進(jìn)入步驟S184。在步驟S184,比較并判斷下式是否成立|GVallley-GSeed|<Th8其中,GValley是谷區(qū)的灰度值,GSeed是種子區(qū)的灰度值,Th8為第八閾值,比如為40。第八閾值介于0至60之間。
如果步驟S184的判斷結(jié)果為“否”,那么流程進(jìn)入步驟S188。那么,谷區(qū)不能被合并到種子區(qū),流程在步驟S189結(jié)束。否則,如果在步驟S184的判斷結(jié)果為“是”,那么流程進(jìn)入步驟S185。
在步驟S185,分別計(jì)算谷區(qū)背景、種子區(qū)背景以及谷區(qū)和種子區(qū)的亮明度。
對(duì)于圖象中一個(gè)象素的亮度,可以由下式進(jìn)行計(jì)算G=1.2219×10-1L+9.063×10-4L2+3.6833526×10-5L3+1.267023×10-7L4+1.987583×10-10L5(4)公式(4)表示了孟寒爾表色系統(tǒng)中灰度值與亮度值之間的非線性關(guān)系,其中G是象素的灰度值,其介于0到255之間;L是象素的亮度值,其也介于0到255之間。
因此,可以通過圖象的灰度值得到其亮度值,而從圖象的亮度也可以得到圖象的灰度。
對(duì)于本實(shí)例來說,圖14F中的象素Pi1和Pi2的灰度值分別為50和150,通過公式(4),可以確定象素Pi1和Pi2的亮度值分別為128和206。
返回圖18A,在步驟S185后,流程進(jìn)入步驟S186。在步驟S186,比較并判斷下式是否成立Min((Lvb-Lv),(Lsb-Ls))/Max((Lvb-Lv),(Lsb-Ls))>Th9其中Lv是谷區(qū)的亮度,Ls是種子區(qū)的亮度,LVb是谷區(qū)背景的亮度,Lb是種子區(qū)背景的亮度,Min((Lvb-Lv),(Lsb-Ls))是(Lvb-Lv)和(Lsb-Ls)的最小值,Max((LVb-Lv),((Lsb-Ls))是(Lvb-Lv)和(Lsb-Ls)的最大值。
Th9為第九閾值,比如為0.58。第九閾值介于0.3至1之間。
如果在步驟S186的判斷結(jié)果為“否”,那么流程進(jìn)入步驟S188,則谷區(qū)不能合并到種子區(qū),流程在步驟S189結(jié)束。否則,如果在步驟S186的判斷結(jié)果為“是”,流程進(jìn)入步驟S187。
在步驟S187,谷區(qū)被合并到種子區(qū),流程在步驟S189結(jié)束。
從上述可以看出,本發(fā)明的方法提供了一種快速的方法,用于檢測(cè)具有復(fù)雜背景的圖象中的人眼,而不需要被檢測(cè)圖象具有非常高的質(zhì)量。從而實(shí)質(zhì)上地消除了人眼被忽略的可能。這種方法能精確地檢測(cè)具有不同尺寸、方向和明亮度的人眼。因此,按照本發(fā)明的方法設(shè)備或系統(tǒng),可以快速、有效地檢測(cè)人眼。
上述實(shí)施例的方法用于檢測(cè)人眼,然而,本發(fā)明并不僅限于檢測(cè)人眼,它還可以適于其他的檢測(cè)方法,比如,檢測(cè)電路板的缺陷部分的方法。
另外,上述用于探測(cè)圖象中與人眼對(duì)應(yīng)的區(qū)域的方法和設(shè)備被用于探測(cè)包含在一個(gè)圖象中的人臉,但本發(fā)明的探測(cè)圖象中的人臉的方法和設(shè)備也可采用其他的方法和設(shè)備來探測(cè)所要探測(cè)的圖象中的人眼。例如,可以把Kin-Man Lam在“A Fast Approach for Detecting Human Facesin aComplex Background”,Proceedings on the 1998IEEEInternational Symposium on Circuits and System,1998,ISCAS’98 Vol.4 pp85-88上公布的方法用于本發(fā)明的人臉探測(cè)方法和設(shè)備中進(jìn)行人眼探測(cè)。
在探測(cè)到至少兩個(gè)眼睛(或暗)區(qū)時(shí),任意一對(duì)眼睛區(qū)被選作一對(duì)候選眼睛。對(duì)于每一對(duì)選出的眼睛區(qū),確定出它們的中心之間的距離L。隨后,以如圖11所示的方式,確定一個(gè)矩形的子圖象300A。對(duì)于人臉檢測(cè),除了如圖11所示的矩形子圖象之外,還確定了用于人臉探測(cè)的另一矩形子圖象,該子圖象與圖11所示的矩形子圖象相對(duì)于通過該對(duì)眼睛區(qū)的中心的直線相對(duì)稱。
應(yīng)該理解的是,圖11所示的值/比值并不一定是嚴(yán)格的,相反地,與圖11所示的值/比值相差在一定的范圍(例如±20%)之內(nèi)的值/比值,對(duì)于實(shí)施本發(fā)明的人臉探測(cè)方法來說,都是可接受的。
在探測(cè)到兩個(gè)以上的眼睛區(qū)的情況下,每一可能的眼睛區(qū)對(duì)都得到選擇以確定相應(yīng)的子圖象。且對(duì)于圖象中的每一對(duì)眼睛區(qū),都以上述方式產(chǎn)生出兩個(gè)矩形子圖象。
隨后,對(duì)于如此確定的各個(gè)子圖象,探測(cè)該子圖象是否對(duì)應(yīng)于一個(gè)人臉的圖象,如以下所要描述的。
另外,所要探測(cè)的子圖象300A的形狀不限于矩形,相反地,它可以為任何適當(dāng)?shù)男螤睿T如橢圓形等。
此外,人臉部分(子圖象)的位置不僅可以通過探測(cè)圖象中的眼睛區(qū)(暗區(qū))來確定,也可以通過探測(cè)圖象中的其他人臉特征-如嘴、鼻、眉等-而得到確定。通過在圖象中探測(cè)眼、嘴、鼻、眉等人臉特征而確定人臉的位置的方法,除了在此公布的本發(fā)明的眼睛探測(cè)方法之外,還可以采用現(xiàn)有技術(shù)中的方法,如在本說明書的“本發(fā)明的背景”部分中列出的對(duì)比文件中所給出的臉部特征探測(cè)方法。環(huán)形區(qū)域的產(chǎn)生然后,流程進(jìn)入步驟S42。在步驟S42,通過環(huán)形區(qū)域確定裝置211,確定圍繞矩形區(qū)域300A的一環(huán)形區(qū)域300R。有關(guān)環(huán)形區(qū)域300R的產(chǎn)生將在下面結(jié)合圖5給予詳細(xì)的描述。
圖5為一示意圖,示出圖3所示的矩形區(qū)域300A以及圍繞其所確定環(huán)形區(qū)域300R。在圖5所示的平面坐標(biāo)系中,以原始圖象300的左上角為坐標(biāo)原點(diǎn),X坐標(biāo)、Y坐標(biāo)分別表示每一象素點(diǎn)在水平方向和垂直方向相對(duì)于坐標(biāo)原點(diǎn)的距離。
參照?qǐng)D5,首先,通過圖2所示的讀取裝置210,從HD107或RAM109處讀取預(yù)先存儲(chǔ)的如圖3所示意表示的的原始圖象300,并得到矩形區(qū)域300A相對(duì)于原始圖象300所處的位置。在本實(shí)例中,在所給出的X,Y坐標(biāo)系中,矩形區(qū)域300A的四個(gè)角的坐標(biāo)分別為(230,212)、(370,212)、(230,387)和(370,387)也即其寬度和高度分別為140和175。
對(duì)于矩形區(qū)域300A,將其寬度、高度分別放大、縮小為原來的9/7倍和5/7倍,得到兩矩形區(qū)域300A1和300A2。其中第一矩形區(qū)域300A1的四個(gè)角的坐標(biāo)在該X、Y坐標(biāo)分別為(210,187)、(390,187)、(210,412)和(390,412);而第二矩形區(qū)域300A2的四個(gè)角的坐標(biāo)在該X、Y坐標(biāo)系分別為(250,237)、(350,237)、(250,362)和(370,362)。其中,第一、第二矩形區(qū)域300A1,300A2之間的區(qū)域就是為原矩形區(qū)域300A所確定的環(huán)形區(qū)域300R。
圖5所示的環(huán)形區(qū)域300R是通過將矩形區(qū)域300A的寬度和高度分別放大、縮小原來的9/7倍和5/7得到的。但本發(fā)明并不限于此,可以對(duì)矩形區(qū)域300A的寬度和高度分別放大、縮小為原來的寬度和高度的n倍和m倍,以得到第一、第二矩形區(qū)域300A1和矩形區(qū)域300A2。其中,m的范圍在0與1之間,n的范圍在1與2間。計(jì)算環(huán)形區(qū)域中各象素處的灰度的梯度及其權(quán)重返回圖4,在步驟S42之后,流程進(jìn)入步驟S43。在步驟S43,通過第一計(jì)算裝置212,計(jì)算環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)的圖象灰度值的梯度值,并確定環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)的圖象灰度值的梯度值的權(quán)重。
下面參照?qǐng)D5和圖6,說明根據(jù)本發(fā)明的人臉探測(cè)設(shè)備是如何確定環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)的圖象灰度值的梯度值以及其相應(yīng)的權(quán)重。
一般來說,一幅圖象包括很多象素點(diǎn),每一象素點(diǎn)周圍有很多其他象素點(diǎn)。因此,可以根據(jù)某一象素點(diǎn)周圍的k2個(gè)的象素點(diǎn)的灰度值,確定所述象素點(diǎn)的灰度值的梯度值,其中,k是整數(shù),范圍在2與15之間。在本實(shí)施例中,取k=3。在本實(shí)施例中,使用sobel算子,求原始圖象中的環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)灰度值的梯度值。
下面參照?qǐng)D6,說明如何確定環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)的圖象灰度值的梯度值。其中,象素點(diǎn)P在X、Y坐標(biāo)系中的坐標(biāo)為(380,250)。
參照?qǐng)D6,選擇象素點(diǎn)P的相鄰象素點(diǎn)P1、P2、P3、P4、P5、P6、P7和P8,也就是使用象素點(diǎn)P的周圍象素點(diǎn)。在本實(shí)施例中,該圖象中的所有象素點(diǎn)的灰度值位于0到255之間。其中,象素點(diǎn)P的灰度值是122,象素點(diǎn)P1、P2、P3、P4、P5、P6、P7和P8的灰度值分別是136、124、119、130、125、132、124和120。
根據(jù)sobel算子,在象素點(diǎn)P的各相鄰的象素點(diǎn)P1,P2,…,P8的灰度值的基礎(chǔ)上,根據(jù)下式可以得到象素點(diǎn)P的圖象灰度值的梯度值DX1=(G3+2*G5+G8)-(G1+2*G4+G6);
DY1=(G6+2*G7+G8)-(G1+2*G2+G3)(5)其中,DX1是象素點(diǎn)P的圖象灰度值的梯度值的第一分量,DY1是象素點(diǎn)P的圖象灰度值的梯度值的第二分量;G1,G2…,G8分別代表象素點(diǎn)P1,P2,…,P8的灰度值。因此,根據(jù)公式(5),可以得到象素點(diǎn)P圖象灰度值的梯度值為(-39,-3)。
類似地,可以求出環(huán)形區(qū)域300R內(nèi)其他各象素點(diǎn)的圖象灰度值的梯度值。在本實(shí)例中,象素點(diǎn)P1、P2、P3、P4、P5、P6、P7、P8等的圖象灰度值的梯度值分別為(-30,-5),(-36,-4),(-32,-1),(-33,-6),(-30,-4),(-38,-8),(-33,-3),(-31,2)。這樣,可以同樣的方式,求出環(huán)形區(qū)域300R內(nèi)所有象素點(diǎn)的灰度值的梯度值。
返回圖4,在步驟S43,第一計(jì)算裝置212還確定環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)的圖象灰度值的權(quán)重,具體方法可以參見下面的公式W1=(|DX1|+|DY1|)/255; (6)其中,W1代表某一象素點(diǎn)灰度值的權(quán)重,DX1,DY1是該象素點(diǎn)的圖象灰度值的梯度值。
比如,在本實(shí)施例中,參見圖6,已知象素點(diǎn)P的圖象灰度值的梯度值為(-39,-3),因此,象素點(diǎn)P的圖象灰度值的梯度值的權(quán)重=(|-39|+|-3|)/255=0.165。
同樣,以相同的方式,可以很容易地求出環(huán)形區(qū)域300R內(nèi)其他各象素點(diǎn)P1、P2、P3、P4、P5、P6、P7、P8…等的圖象灰度值的梯度值的權(quán)重分別為0.137,0.157,0.129,0.153,0.133,0.180,0.141,0.129…等。計(jì)算環(huán)形區(qū)中各象素處的基準(zhǔn)梯度參見圖4,流程在步驟S43之后進(jìn)行到步驟S44。在步驟S44,第二計(jì)算裝置213計(jì)算上述環(huán)形區(qū)300R中的各象素處的一個(gè)基準(zhǔn)分布的梯度。該基準(zhǔn)分布代表了區(qū)300A中的人臉的一種理想模型。該基準(zhǔn)分布的梯度將被判定裝置214用于判定環(huán)形區(qū)300R中的圖象部分接近一個(gè)人臉圖象的程度。
在本發(fā)明的人臉探測(cè)方法和設(shè)備中,人臉探測(cè),是通過評(píng)價(jià)所要處理的圖象的一個(gè)相關(guān)部分(環(huán)形區(qū)300R)中各象素處的灰度分布的梯度的方向與從該基準(zhǔn)分布導(dǎo)出的一個(gè)基準(zhǔn)梯度的方向之間的方向差,而得到進(jìn)行的。
具體地,對(duì)于所確定的各個(gè)子圖象300A,確定出了一個(gè)人臉基準(zhǔn)分布,該基準(zhǔn)分布可被表示為z(x,y)=-(x-xc)2a2-(y-yc)2b2+h]]>是h是一個(gè)常數(shù),a/b等于所述子圖象的寬度與所述子圖象的高度的比值,(xc,yc)是子圖象的中心。圖10顯示了具有這樣的基準(zhǔn)分布的一個(gè)灰度圖象,且圖7顯示了該基準(zhǔn)分布的等高線(E11和E12)。
因而,該基準(zhǔn)分布的梯度可被表示為z=(z/x,z/y)=(-2(x-xC)/a2,-2(y-yC)/b2)(7)由于在此有意義的只有矢量(z/x,z/y)的方向,且在隨后的處理步驟中相反的方向(-z/x,-z/y)將與相同的方向一樣地得到處理,因而矢量z的x分量和y分量的等比例的改變將不會(huì)影響評(píng)價(jià)的結(jié)果。因而只有比值a/b是有意義的。比值a/b的一個(gè)通常的值是4/5。
所以,在步驟S44,利用公式(7)計(jì)算出梯度z,且該梯度被稱為基準(zhǔn)梯度。
在步驟S44之后,流程進(jìn)行到步驟S45。在步驟S45,對(duì)于環(huán)形區(qū)300R中的每一個(gè)象素,計(jì)算出梯度g與z之間的夾角,其中g=(DX1,DY1)是灰度分布的梯度。當(dāng)然,g不限于利用公式(5)所計(jì)算出的梯度,它可以是利用用于離散梯度計(jì)算的任何其他算子所計(jì)算出的梯度。
具體地,在點(diǎn)(x,y)處g與z之間的夾角θ可利用以下公式計(jì)算cosθ=z·g/(|g|·|z|)θ=cos-1(|z·g|/(|g|·|z|))(8)
其中z·g是矢量z與g的內(nèi)積,且|g|與|z|分別表示了矢量g與z的幅度。注意θ在0≤θ≤π/2的范圍內(nèi)。
因此,在本實(shí)例中,象素點(diǎn)P的二種梯度的夾角可以確定為0.29。以同樣的方式,可以得出其他象素點(diǎn)P1、P2、P3、P4、P5、P6、P7、P8等的二種梯度的夾角分別為0.19,0.26,0.33,0.18,0.23,0.50,0.27,0.42(弧度)。
然后,在步驟S45中,根據(jù)下式確定環(huán)形區(qū)域300R內(nèi)所有各象素點(diǎn)的圖象灰度值梯度值與相應(yīng)的基準(zhǔn)梯度的夾角的平均值A(chǔ)1=S1/C1 (9)其中,A1表示灰度梯度與其對(duì)應(yīng)的基準(zhǔn)梯度之間的夾角在環(huán)形區(qū)域內(nèi)的所有象素上的平均值,S1表示環(huán)形區(qū)域內(nèi)各象素點(diǎn)的梯度夾角的總和,C1表示該環(huán)形區(qū)域內(nèi)象素點(diǎn)的總數(shù)。
對(duì)于本實(shí)例,該環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)的圖象灰度梯度與相應(yīng)的基準(zhǔn)梯度的夾角的平均值為0.59。
返回圖3的步驟S45,在得出上述的梯度的夾角的平均值后,在步驟S45還判斷該平均值是否小于第11閾值,比如0.61。在本發(fā)明,第11閾值介于0.01至1.5之間。如果確定所得的平均值小于第11閾值,那么,流程進(jìn)入步驟S46。如果確定所得的平均值不小于第11閾值,那么,流程進(jìn)入步驟S48。在步驟S48,確定所給出的圖象不是人臉,于是,流程在步驟S49結(jié)束。
在本實(shí)例,環(huán)形區(qū)域300R內(nèi)所有各象素點(diǎn)的圖象灰度梯度與相應(yīng)的基準(zhǔn)梯度的夾角的平均值為0.59,它小于第11閾值,因此,流程進(jìn)入步驟S46。
在步驟S46,首先,確定環(huán)形區(qū)域300R內(nèi)象素點(diǎn)的灰度梯度與基準(zhǔn)梯度之間的夾角與圖象灰度梯度的權(quán)重的加權(quán)平均值。根據(jù)下式確定環(huán)形區(qū)域300R內(nèi)象素點(diǎn)的該加權(quán)平均值
A2=S2/C2; (10)其中,A2表示環(huán)形區(qū)域的象素點(diǎn)處的灰度梯度與基準(zhǔn)梯度之間的夾角與圖象灰度梯度的權(quán)重的加權(quán)平均值,C2表示這些象素點(diǎn)的灰度梯度的權(quán)重之和,S2表示這些象素點(diǎn)的梯度夾角與圖象灰度梯度的權(quán)重之積的總和。
在本實(shí)例中,該環(huán)形區(qū)域內(nèi)各象素點(diǎn)梯度夾角的加權(quán)平均值為0.66。
得出上述的梯度夾角的加權(quán)平均值后,在步驟S46還判斷該平均值是否小于第12閾值,比如0.68。在本發(fā)明,第12閾值介于是0.01至1之間。如果確定所得的梯度夾角的加權(quán)平均值小于第12閾值,那么,流程進(jìn)入步驟S47。確定待確定的矩形區(qū)域是人臉。然后,流程在步驟S49結(jié)束。如果確定所得的梯度夾角的加權(quán)平均值不小于第12閾值,那么,流程進(jìn)入步驟S48。在步驟S48,確定所給出的圖象不是人臉,于是,流程在步驟S49結(jié)束。
在本實(shí)例,由于環(huán)形區(qū)域300R內(nèi)各象素點(diǎn)梯度夾角的加權(quán)平均值為0.66,它小于第12閾值,因此,流程進(jìn)入步驟S47,確定待確定的矩形區(qū)域300A是人臉,然后,流程在步驟S49結(jié)束。第二實(shí)例圖8A是示意圖,示出了要被檢測(cè)的原始圖象的一個(gè)例子。在圖8A中,該原始圖象800是通過數(shù)碼相機(jī)拍攝的。當(dāng)然,也可以通過諸如掃描儀等一類的數(shù)字設(shè)備111等,輸入到人臉探測(cè)系統(tǒng),并存儲(chǔ)在HD107或RAM109等諸如此類的一個(gè)預(yù)定位置上。
圖8B是示意圖,示出了圖8A的所示的原始圖象800中的一矩形區(qū)域800B以及其在X、Y坐標(biāo)系中的位置。其中,X軸、Y軸分別表示每一象素點(diǎn)在水平方向和垂直方向相對(duì)于坐標(biāo)原點(diǎn)的距離。
對(duì)于圖8B所示的矩形區(qū)域800B,仍采用圖4所示的流程圖,說明用于確定矩形區(qū)域800B是否為一人臉的過程。
參見圖4,首先在步驟S41,讀取裝置210中讀取原始圖象圖800各象素的灰度值250,251,251,251,250,249……,并且還讀取矩形區(qū)域800相對(duì)于原始圖象800中位置。如圖8A所示,在X、Y坐標(biāo)系中,以原始圖象800的左上角為坐標(biāo)原點(diǎn)。從而可以得到圖8B中矩形區(qū)域800B在該X、Y坐標(biāo)系中,其四個(gè)角的坐標(biāo)分別為(203,219)、(373,219)、(203,423)、(373,423)。因此,該矩形區(qū)域800B的寬度和高度分別為170和204。
然后,在步驟S42,通過環(huán)形區(qū)域確定裝置211,確定圖8B中矩形區(qū)域800B的環(huán)形區(qū)域800C。參見圖8C,對(duì)于矩形區(qū)域800B,將其寬度、高度分別放大、縮小為原來的9/7倍和5/7倍,得到兩矩形區(qū)域800C1和800C2。
圖8C是示意圖,示出了為矩形區(qū)域800B所確定的環(huán)形區(qū)域800C以及其在X、Y坐標(biāo)系中的位置。其中,X軸、Y軸分別表示每一象素點(diǎn)在水平方向和垂直方向相對(duì)于坐標(biāo)原點(diǎn)的距離。其中,環(huán)形區(qū)域800C由第一矩形區(qū)域800C1和第二矩形區(qū)域800C2構(gòu)成。其中,第一矩形區(qū)域800C1的四個(gè)角的坐標(biāo)分別為(179,190)、(397,190)、(179,452)和(397,452)。而第二矩形區(qū)域800C2的四個(gè)角的坐標(biāo)在該X、Y坐標(biāo)系分別為(227,248)、(349,248)、(227,394)和(349,394)。
然后,在步驟S43,通過第一計(jì)算裝置212,確定環(huán)形區(qū)域800C內(nèi)各象素點(diǎn)的圖象灰度值的梯度值分別為(188,6),(183,8),(186,10),(180,6),(180,6)……,并以上述相同的方式,確定環(huán)形區(qū)域800各象素點(diǎn)的圖象灰度值的梯度值的權(quán)重,它們分別為0.76,0.75,0.77,0.77,0.73……。
然后,在步驟S44,第二計(jì)算裝置213確定環(huán)形區(qū)域800C中各點(diǎn)的基準(zhǔn)梯度值,分別為(-0.015,-0.012),(-0.015,-0.012),(-0.015,-0.012),(-0.015,-0.012),(-0.014,-0.012)……。之后,流程進(jìn)入步驟S45。
在步驟S45,確定環(huán)形區(qū)域800C中各象素點(diǎn)的梯度夾角,分別得到0.64,0.63,0.62,0.64,0.64……;采用上述相同的方法,可以得到環(huán)形區(qū)域800C內(nèi)各象素點(diǎn)的梯度夾角的平均值為0.56。在本實(shí)例中,該平均值為0.56,它小于第11閾值,因此,流程進(jìn)入步驟S46。
在步驟S46,確定環(huán)形區(qū)域800內(nèi)各象素點(diǎn)的梯度夾角的加權(quán)平均值為0.64。在本實(shí)例中,由于該平均值為0.64,小于第12閾值,因此,流程進(jìn)入步驟S47,確定待確定的矩形區(qū)域800B是人臉,然后,流程在步驟S49結(jié)束。替換實(shí)施例下面說明本發(fā)明的一個(gè)替換實(shí)施例。
圖9為一流程圖,示出了按照本發(fā)明的一個(gè)替換實(shí)施例的人臉探測(cè)過程。在圖9中,和圖4的實(shí)施例中相同的標(biāo)號(hào)表示相同的處理。
仍然以圖8A所示的原始圖象800為例,說明判斷原始圖象800中的矩形區(qū)域800B是否為人臉。
首先,與圖4一樣,本流程開始于步驟S40。首先在步驟S41,讀取裝置210中讀取原始圖象圖800各象素的灰度值250,251,251,251,250,249……;眼睛探測(cè)裝置218探測(cè)圖象中的眼睛區(qū);且子圖象確定裝置219根據(jù)眼睛區(qū)探測(cè)的結(jié)果確定待探測(cè)的子圖象,如矩形區(qū)800B。然后,流程進(jìn)入步驟S42,在步驟S42,如圖8C所示,為矩形區(qū)域800B確定環(huán)形區(qū)域800C。進(jìn)一步,流程進(jìn)入步驟S43,在步驟S43,確定環(huán)形區(qū)域800C內(nèi)各象素點(diǎn)的圖象灰度值的梯度值分別為(188,6),(183,8),(186,10),(180,6),(180,6)……;并以上述實(shí)施例相同的方式,確定環(huán)形區(qū)域800C內(nèi)各象素點(diǎn)的圖象灰度值的梯度值的權(quán)重,它們分別為0.76,0.75,0.77,0.77,0.73……。然后,流程進(jìn)入步驟S44。在步驟S44,得到環(huán)形區(qū)域800C內(nèi)各象素點(diǎn)的基準(zhǔn)梯度值分別為(-0.015,-0.012),(-0.015,-0.012),(-0.015,-0.012),(-0.015,-0.012),(-0.014,-0.012)……。
然后,流程進(jìn)入步驟S95。在步驟S95,確定環(huán)形區(qū)域800C各象素點(diǎn)的灰度梯度與其基準(zhǔn)梯度的夾角,分別得到為0.64,0.63,0.62,0.64,0.64……,并確定環(huán)形區(qū)域800C各點(diǎn)梯度夾角與其相應(yīng)權(quán)重的加權(quán)平均值。在步驟S95還判斷該平均值是否小于第13閾值,比如0.68。在本發(fā)明,第13閾值介于0.01至1之間。如果確定所得的梯度夾角的加權(quán)平均值小于第13閾值,那么,流程進(jìn)入步驟S96。在步驟S96,確這待確定的矩形區(qū)域是人臉。如果確定所得的梯度夾角的加權(quán)平均值不小于第13閾值,那么,流程進(jìn)入步驟S97,確定所給出的圖象不是人臉,于是,流程在步驟S98結(jié)束。
對(duì)于本實(shí)例,由于環(huán)形區(qū)域內(nèi)各象素點(diǎn)梯度夾角的加權(quán)平均值為0.64,它小于第13閾值,因此,流程進(jìn)入步驟S96,確定待確定的矩形區(qū)域800B是人臉,然后,流程在步驟S98結(jié)束。
如本領(lǐng)域中的技術(shù)人原所能夠理解的,并不一定要計(jì)算和評(píng)價(jià)環(huán)形區(qū)中的每一個(gè)象素處的灰度分布梯度與基準(zhǔn)分布梯度之間的夾角;相反地,在根據(jù)本發(fā)明的用于探測(cè)人臉(或所要探測(cè)的其他對(duì)象)的方法中,可以只計(jì)算和評(píng)價(jià)環(huán)形區(qū)中的某些象素處的該夾角,而實(shí)現(xiàn)本發(fā)明的目的和效果。
另外,雖然在上述描述中,描述了采用灰度分布梯度與基準(zhǔn)分布梯度之間的夾角的平均值和該夾角的加權(quán)平均值進(jìn)行評(píng)價(jià)的一個(gè)具體實(shí)施例以及只采用加權(quán)平均值進(jìn)行評(píng)價(jià)的另一具體實(shí)施例,但其中只采用該夾角的平均值進(jìn)行評(píng)價(jià)的實(shí)施例也能夠?qū)崿F(xiàn)本發(fā)明的目的且因而也是本發(fā)明的一個(gè)實(shí)施例。
注意,本發(fā)明可以應(yīng)用于由多個(gè)裝置(例如,主計(jì)算機(jī)、接口裝置、讀取器、打印機(jī)以及類似裝置)構(gòu)成的系統(tǒng),或者由一個(gè)設(shè)備構(gòu)成的裝置(例如復(fù)印機(jī)、傳真機(jī)或類似的設(shè)備)。
本發(fā)明的目的還以這樣的方式實(shí)現(xiàn)對(duì)所述的系統(tǒng)或裝置提供用于記錄可以實(shí)現(xiàn)上述實(shí)施例的功能的軟件程序的程序代碼的存儲(chǔ)介質(zhì),并通過系統(tǒng)或裝置的計(jì)算機(jī)(或CPU,或MPU)讀取并執(zhí)行存儲(chǔ)在存儲(chǔ)介質(zhì)中的程序代碼,在這種情況下,從存儲(chǔ)介質(zhì)讀出的程序代碼本身執(zhí)行上述實(shí)施例的功能,而存儲(chǔ)程序代碼的存儲(chǔ)介質(zhì)構(gòu)成本發(fā)明。
作為用于提供程序代碼的存儲(chǔ)介質(zhì),例如,軟盤、硬盤、光盤、磁光盤、CD-ROM、CD-R、磁帶、非易失存儲(chǔ)卡、ROM以及類似物都可以使用。
上述實(shí)施例的功能不僅可以通過由計(jì)算機(jī)執(zhí)行讀出的程序代碼來實(shí)現(xiàn),而且也可以通過在計(jì)算機(jī)上運(yùn)行的OS(操作系統(tǒng))根據(jù)程序代碼的指令執(zhí)行的一些或全部的實(shí)際處理操作來實(shí)現(xiàn)。
從上述可以看出,本發(fā)明的方法提供了一種快速的方法,用于判斷具有復(fù)雜背景的圖象中的人臉,而不需要被檢測(cè)的圖象具有非常高的質(zhì)量。從而實(shí)質(zhì)上地消除了人臉被忽略的可能。這種方法能精確地判斷待檢測(cè)的圖象是否包含人臉。因此,按照本發(fā)明的方法、設(shè)備或系統(tǒng),可以快速、有效地判斷人臉。
此外,本發(fā)明還包括這樣一種情況,即在從存儲(chǔ)介質(zhì)讀出的程序代碼被寫入已被插入計(jì)算機(jī)的功能擴(kuò)展卡之后,或者被寫入和計(jì)算機(jī)相連的功能擴(kuò)展單元內(nèi)提供的存儲(chǔ)器之后,在功能擴(kuò)展卡或功能擴(kuò)展單元中包括的CPU或類似物按照程序代碼的命令執(zhí)行部分處理或全部處理,從而實(shí)現(xiàn)上述實(shí)施例的功能。
在本發(fā)明應(yīng)用于上述存儲(chǔ)介質(zhì)的情況下,存儲(chǔ)介質(zhì)存儲(chǔ)相應(yīng)于實(shí)施例中所述的流程(圖4、圖9)的程序代碼。
上述實(shí)施例的方法用于判斷人臉,然而,本發(fā)明并不僅于判斷人臉,它還可以適用于其他的判斷方法,比如,檢測(cè)電路板的缺陷部分的方法。
在不脫離本發(fā)明的范圍和構(gòu)思的前提下,可以作出許多其他的改變和改型。應(yīng)當(dāng)理解,本發(fā)明并不限于特定的實(shí)施例,本發(fā)明的范圍由所附權(quán)利要求限定。
權(quán)利要求
1.用于在具有灰度分布的圖象中探測(cè)一個(gè)對(duì)象的一種方法,其特征在于該方法包括以下步驟a)對(duì)于所述圖象中的象素的一個(gè)子集,從所述圖象的所述灰度分布導(dǎo)出一個(gè)第一變量;b)對(duì)于所述象素子集,從一個(gè)預(yù)設(shè)的基準(zhǔn)分布導(dǎo)出一個(gè)第二變量,所述基準(zhǔn)分布表征了所述對(duì)象;c)評(píng)價(jià)所述第一變量與所述第二變量在所述象素子集上的對(duì)應(yīng)性;d)根據(jù)該評(píng)價(jià)步驟的結(jié)果判定所述圖象是否包含所述對(duì)象。
2.根據(jù)權(quán)利要求1的方法,其特征在于進(jìn)一步包括選定所述圖象中的一個(gè)區(qū)域,其中所述象素子集位于所述區(qū)域中,且其中在所述區(qū)域中的象素上從與所要探測(cè)的對(duì)象相對(duì)應(yīng)的灰度分布導(dǎo)出的第一變量與第二變量具有好的對(duì)應(yīng)性。
3.根據(jù)權(quán)利要求2的方法,其特征在于它進(jìn)一步包括以下步驟在所述圖象中確定一個(gè)子圖象;以及根據(jù)所述子圖象的位置選定所述區(qū)域。
4.根據(jù)權(quán)利要求1-3中的任何一項(xiàng)的方法,其中所述第一變量代表了所述圖象的灰度分布的梯度的方向。
5.根據(jù)權(quán)利要求4的方法,其中所述第二變量代表了所述基準(zhǔn)分布的梯度的方向。
6.根據(jù)權(quán)利要求5的方法,其中所述梯度是一種離散梯度。
7.根據(jù)權(quán)利要求5的方法,其特征在于所述評(píng)價(jià)步驟包括對(duì)所述象素子集的一種統(tǒng)計(jì)處理。
8.根據(jù)權(quán)利要求5的方法,其特征在于所述評(píng)價(jià)步驟包括對(duì)所述象素子集的一種統(tǒng)計(jì)處理且所述統(tǒng)計(jì)處理包括一種加權(quán)處理,各個(gè)象素的權(quán)重根據(jù)該象素處的第一變量的梯度而確定,且具有較大第一變量梯度幅度的象素傾向于具有較大的權(quán)重。
9.根據(jù)權(quán)利要求8的方法,其特征在于所述評(píng)價(jià)步驟包括采用該加權(quán)處理的統(tǒng)計(jì)處理和不采用加權(quán)處理的另一統(tǒng)計(jì)處理,并根據(jù)這兩種統(tǒng)計(jì)處理的結(jié)果來判定該圖象是否包含該對(duì)象。
10.根據(jù)權(quán)利要求3的方法,其特征在于所述區(qū)域是一個(gè)環(huán)形區(qū),該環(huán)形區(qū)的中心位于所述子圖象的中心附近,且所述子集的象素都位于該環(huán)形區(qū)之內(nèi)。
11.根據(jù)權(quán)利要求2的方法,其中所述象素子集包括所述區(qū)域中的所有象素。
12.根據(jù)權(quán)利要求3的方法,其特征在于所述子圖象是通過探測(cè)所述圖象中的一種預(yù)定特征而確定的。
13.根據(jù)權(quán)利要求12的方法,其特征在于所述預(yù)定特征包括一對(duì)暗區(qū)。
14.根據(jù)權(quán)利要求13的方法,其特征在于所述子圖象是根據(jù)所述暗區(qū)對(duì)的中心的位置及其之間的間隔而確定的。
15.根據(jù)權(quán)利要求13的方法,其特征在于所述基準(zhǔn)分布由下式表示z(x,y)=-(x2/a2+y2/b2)+h其中h是一個(gè)常數(shù),a/b等于所述子圖象的寬度與所述子圖象的高度的比值,且該公式以所述子圖象的中心為原點(diǎn)。
16.根據(jù)權(quán)利要求5或15的方法,其中所述評(píng)價(jià)步驟包括對(duì)于所述子集中的所有象素,計(jì)算所述圖象的灰度分布的梯度與所述基準(zhǔn)分布的梯度之間的夾角的平均值;把該平均值與一個(gè)預(yù)定值進(jìn)行比較;以及在所述平均值等于或小于所述預(yù)定值的情況下判定所述子圖象包含所述對(duì)象。
17.根據(jù)權(quán)利要求5或15的方法,其中所述評(píng)價(jià)步驟包括對(duì)于所述子集中的所有象素,計(jì)算所述圖象的灰度分布梯度與所述基準(zhǔn)分布的梯度之間的夾角的一種加權(quán)平均值,其中具有較大的灰度分布梯度幅度的象素傾向于具有較大的權(quán)重;把所述加權(quán)平均值與一個(gè)預(yù)定值相比較;以及在所述加權(quán)平均值等于或小于所述預(yù)定值的情況下判定該子圖象包含所述對(duì)象。
18.根據(jù)權(quán)利要求5或15的方法,其中所述評(píng)價(jià)步驟包括對(duì)于所述子集中的所有象素,計(jì)算所述圖象的灰度分布的梯度與所述基準(zhǔn)分布的梯度之間的夾角的平均值;對(duì)于所述子集中的所有象素,計(jì)算所述圖象的灰度分布的梯度與所述基準(zhǔn)分布的梯度之間的夾角的一種加權(quán)平均值,其中具有較大的灰度分布梯度幅度的象素傾向于具有較大的權(quán)重;把所述平均值與一個(gè)第一預(yù)定值相比較;把所述加權(quán)平均值與一個(gè)第二預(yù)定值相比較;以及在所述平均值等于或小于所述第一預(yù)定值且所述加權(quán)平均值等于或小于所述第二預(yù)定值的情況下判定該子圖象包含所述對(duì)象。
19.用于在具有灰度分布的圖象中探測(cè)一個(gè)對(duì)象的一種方法,其特征在于該方法包括以下步驟a)在所述圖象中確定一個(gè)子圖象;b)根據(jù)所述子圖象,選定所述圖象中的象素的一個(gè)子集;c)對(duì)于所述子集中的象素,從所述圖象的所述灰度分布導(dǎo)出一個(gè)第一變量;d)對(duì)于所述子集象素,從一個(gè)預(yù)設(shè)的基準(zhǔn)分布導(dǎo)出一個(gè)第二變量,所述基準(zhǔn)分布表征了所述對(duì)象;e)評(píng)價(jià)所述第一變量與所述第二變量在所述象素子集上的對(duì)應(yīng)性;f)根據(jù)該評(píng)價(jià)步驟的結(jié)果判定所述圖象是否包含所述對(duì)象。
20.一種存儲(chǔ)介質(zhì),其中存儲(chǔ)有用于在具有灰度分布的一個(gè)圖象中探測(cè)一種對(duì)象的程序編碼,其特征在于所述程序代碼包括用于在所述圖象中確定一個(gè)子圖象的代碼;用于對(duì)于所述圖象中的象素的一個(gè)子集從所述圖象的所述灰度分布導(dǎo)出一個(gè)第一變量的代碼;用于對(duì)于所述象素子集從一個(gè)預(yù)設(shè)的基準(zhǔn)分布導(dǎo)出一個(gè)第二變量的代碼,所述基準(zhǔn)分布表征了所述對(duì)象;用于評(píng)價(jià)所述第一變量與所述第二變量在所述象素子集上的對(duì)應(yīng)性的編碼;用于根據(jù)該評(píng)價(jià)步驟的結(jié)果判定所述圖象是否包含所述對(duì)象的代碼。
21.一種圖象處理方法,用于在一個(gè)圖象中判定一種特征部分,包括一個(gè)讀取步驟,用于讀取該圖象和該圖象的一個(gè)將要判定的矩形區(qū);一個(gè)設(shè)定步驟,用于設(shè)定圍繞所述矩形區(qū)的一個(gè)環(huán)形區(qū);一個(gè)步驟,用于計(jì)算所述環(huán)形區(qū)中的各個(gè)象素處的灰度的梯度;一個(gè)步驟,用于為該環(huán)形區(qū)確定一個(gè)基準(zhǔn)分布并為環(huán)形區(qū)中的各象素確定一個(gè)環(huán)形區(qū)基準(zhǔn)梯度;以及一個(gè)確定步驟,用于根據(jù)所述環(huán)形區(qū)中的各個(gè)象素處的灰度的梯度和各個(gè)象素處的基準(zhǔn)梯度而確定包含在所述矩形區(qū)中的特征部分。
22.根據(jù)權(quán)利要求21的圖象處理方法,其中包含所要確定的矩形區(qū)的圖象是一個(gè)特征部分。
23.根據(jù)權(quán)利要求21的圖象處理方法,其中所述環(huán)形區(qū)是通過一個(gè)第一矩形區(qū)和一個(gè)第二矩形區(qū)而形成的。
24.根據(jù)權(quán)利要求23的圖象處理方法,其中所述第一矩形區(qū)位于所述將要確定的矩形區(qū)之內(nèi)。
25.根據(jù)權(quán)利要求23的圖象處理方法,其中所述第二矩形區(qū)位于所述所要確定的矩形區(qū)之外。
26.根據(jù)權(quán)利要求23的圖象處理方法,其中所述第一矩形區(qū)的中心位于與所述所要確定的矩形區(qū)的中心大體相同的位置,且所述第一矩形區(qū)的寬度和長(zhǎng)度分別為所述所要確定的矩形區(qū)的寬度和長(zhǎng)度的m倍,其中0<m<1。
27.根據(jù)權(quán)利要求23的圖象處理方法,其中所述第二矩形區(qū)的中心位于與所述將要確定的矩形區(qū)的中心大體相同的位置,且所述第二矩形區(qū)的寬度和長(zhǎng)度分別等于所述將要確定的矩形區(qū)的寬度和長(zhǎng)度的n倍,其中0<n<1。
28.根據(jù)權(quán)利要求21的圖象處理方法,其中所述灰度梯度計(jì)算步驟包括根據(jù)圍繞一個(gè)象素的象素的灰度來計(jì)算這一個(gè)象素處的梯度的步驟。
29.根據(jù)權(quán)利要求28的圖象處理方法,其中圍繞所述一個(gè)象素的象素?cái)?shù)目是k2,其中k是一個(gè)整數(shù)且2<k<15。
30.根據(jù)權(quán)利要求21的圖象處理方法,其中基準(zhǔn)分布是根據(jù)矩形區(qū)來描述的。
31.根據(jù)權(quán)利要求21或30的圖象處理方法,進(jìn)一步包括確定環(huán)形區(qū)中各個(gè)象素處的灰度的梯度與基準(zhǔn)梯度之間的夾角的步驟。
32.根據(jù)權(quán)利要求21或30的圖象處理方法,進(jìn)一步包括確定環(huán)形區(qū)中各個(gè)象素處的灰度的梯度與基準(zhǔn)梯度之間的夾角的平均值的步驟。
33.根據(jù)權(quán)利要求21的32的圖象處理方法,進(jìn)一步包括確定所述環(huán)形區(qū)中的各個(gè)象素處的灰度的梯度的權(quán)重的步驟。
34.根據(jù)權(quán)利要求32的圖象處理方法,進(jìn)一步包括確定所述環(huán)形區(qū)中的峰象素處的灰度的梯度與基準(zhǔn)梯度之間的夾角的平均值是否小于一個(gè)第一閾值的步驟,其中該第一閾值處于0.01至1.5的范圍內(nèi),較好地是0.61。
35.根據(jù)權(quán)利要求34的方法,進(jìn)一步包括確定所述環(huán)形區(qū)中的各象素處的灰度的梯度與基準(zhǔn)梯度之間的夾角所述環(huán)形區(qū)中的各象素的灰度處的灰度的梯度的權(quán)重的加權(quán)平均值是否小于一個(gè)第二閾值的步驟,其中該第二閾值處于0.01至1的范圍內(nèi),較好地是0.68。
36.根據(jù)權(quán)利要求33的圖象處理方法,進(jìn)一步包括確定所述環(huán)形區(qū)中各象素處的灰度的梯度與基準(zhǔn)梯度之間的夾角同該象素處的梯度的權(quán)重的加權(quán)平均值是否小于一個(gè)第三閾值的步驟,其中該第三閾值處于0.1至1的范圍內(nèi),且較好地是0.68。
37.根據(jù)權(quán)利要求14的方法,其中確定所述圖象中的一個(gè)子圖象的步驟包括把該圖象的各列分成多個(gè)區(qū)間;把各個(gè)區(qū)間標(biāo)為谷區(qū)、中繼區(qū)或峰區(qū);把各列的的谷區(qū)與其相鄰的列的谷區(qū)合并,從而產(chǎn)生一個(gè)候選暗區(qū);以及確定一個(gè)暗區(qū)。
38.根據(jù)權(quán)利要求37的方法,其中該合并步驟包括把該圖象的第一列中的各個(gè)谷區(qū)設(shè)定為一個(gè)種子區(qū);判定下一列中的谷區(qū)是否可被合并到該種子區(qū)中;把能夠合并的谷區(qū)合并到該種子區(qū)中;把不能合并到該種子區(qū)中的谷區(qū)設(shè)定為一個(gè)種子區(qū);以及把不再有能夠合并進(jìn)來的谷區(qū)的種子區(qū)確定為一個(gè)暗區(qū)。
全文摘要
在此公布了用于探測(cè)圖象中的人臉的方法、設(shè)備和系統(tǒng)。該方法包括對(duì)于所述圖象中的象素的一個(gè)子集,從所述圖象的所述灰度分布導(dǎo)出一個(gè)第一變量;對(duì)于所述象素子集,從一個(gè)預(yù)設(shè)的基準(zhǔn)分布導(dǎo)出一個(gè)第二變量,所述基準(zhǔn)分布表征了所述對(duì)象;評(píng)價(jià)所述第一變量與所述第二變量在所述象素子集上的對(duì)應(yīng)性;根據(jù)該評(píng)價(jià)步驟的結(jié)果判定所述圖象是否包含所述對(duì)象。
文檔編號(hào)H04N5/91GK1404312SQ0113280
公開日2003年3月19日 申請(qǐng)日期2001年9月6日 優(yōu)先權(quán)日2001年9月6日
發(fā)明者陳新武, 紀(jì)新 申請(qǐng)人:佳能株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
济源市| 政和县| 大关县| 青神县| 新民市| 图片| 珠海市| 会理县| 佛教| 岳西县| 常熟市| 象山县| 八宿县| 丹阳市| 微博| 来凤县| 马尔康县| 阆中市| 郸城县| 开化县| 新建县| 九江市| 长葛市| 二连浩特市| 江阴市| 康保县| 博野县| 安新县| 盐边县| 夏津县| 湘潭市| 衡南县| 钟祥市| 通州市| 甘泉县| 花莲市| 太仓市| 黑河市| 文安县| 石屏县| 普洱|