本申請(qǐng)涉及圖像識(shí)別技術(shù)領(lǐng)域,特別涉及一種圖像識(shí)別方法及裝置。
背景技術(shù):
目前,圖像識(shí)別主要通過(guò)兩種方法來(lái)實(shí)現(xiàn)。第一是采用提取圖像的多維局部特征的方法,具體是通過(guò)提取圖像中的多個(gè)關(guān)鍵點(diǎn),并分別提取每個(gè)關(guān)鍵點(diǎn)的局部特征進(jìn)行拼接得到多維局部特征,然后將其降低維度,得到用于識(shí)別圖像的低維、有效的特征;第二是采用提取圖像的深度學(xué)習(xí)特征的方法,具體是通過(guò)深度學(xué)習(xí)模型提取用于識(shí)別圖像的深度學(xué)習(xí)特征。
然而,圖像的多維局部特征只能描述圖像中的局部紋理或形狀,在圖像被局部遮擋或強(qiáng)光照射等情況下,多維局部特征描述圖像的能力將大大下降甚至喪失;圖像的深度學(xué)習(xí)特征可描述圖像中的整體紋理和形狀,但缺乏對(duì)圖像中的細(xì)節(jié)描述,另外通過(guò)圖像的深度學(xué)習(xí)特征來(lái)識(shí)別圖像,可增加不同類(lèi)別圖像的類(lèi)間距離,卻不能減少同一類(lèi)圖像的類(lèi)內(nèi)距離。因此,通過(guò)上述傳統(tǒng)的方法進(jìn)行圖像識(shí)別,識(shí)別精度較差。
尤其是在人臉識(shí)別上,圖像中的人臉姿態(tài)各異、表情不一而且圖像背景復(fù)雜多樣,通過(guò)目前的圖像識(shí)別方法難以對(duì)大量商品圖像中的人臉進(jìn)行精確的識(shí)別。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)旨在至少在一定程度上解決上述技術(shù)問(wèn)題。
為此,本申請(qǐng)的第一個(gè)目的在于提出一種圖像識(shí)別方法,能夠大大提高圖像識(shí)別的精度。
本申請(qǐng)的第二個(gè)目的在于提出一種圖像識(shí)別裝置。
為達(dá)上述目的,根據(jù)本申請(qǐng)第一方面實(shí)施例提出的一種圖像識(shí)別方法,包括以下步驟:提取所述圖像的多維度局部特征,并提取所述圖像的深度學(xué)習(xí)特征;將所述多維度局部特征和所述深度學(xué)習(xí)特征進(jìn)行拼接,并通過(guò)度量學(xué)習(xí)對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征;根據(jù)所述度量學(xué)習(xí)特征對(duì)所述圖像進(jìn)行識(shí)別。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法,通過(guò)將多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,并對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征,然后根據(jù)度量學(xué)習(xí)特征對(duì)所述圖像進(jìn)行識(shí)別。由此,通過(guò)將圖像的多維局部特征和深度學(xué)習(xí)特征結(jié)合起來(lái),由多維局部特征描述圖像中的細(xì)節(jié),由深度學(xué)習(xí)特征描述圖像中的整體紋理和形狀,同時(shí)通過(guò)度量學(xué)習(xí)增加不同類(lèi)別 圖像的類(lèi)間距離,減少同一類(lèi)別圖像的類(lèi)內(nèi)距離,從而提高了不同類(lèi)別圖像的區(qū)分度,減小了同一類(lèi)別圖像的差別,極大地提高了圖像識(shí)別的精度。
根據(jù)本申請(qǐng)第二方面實(shí)施例提出的一種圖像識(shí)別裝置,包括:提取模塊,用于提取所述圖像的多維度局部特征,并提取所述圖像的深度學(xué)習(xí)特征;學(xué)習(xí)模塊,用于將所述多維度局部特征和所述深度學(xué)習(xí)特征進(jìn)行拼接,并通過(guò)度量學(xué)習(xí)對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征;識(shí)別模塊,用于根據(jù)所述度量學(xué)習(xí)特征對(duì)所述圖像進(jìn)行識(shí)別。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別裝置,通過(guò)將多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,并對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征,然后根據(jù)度量學(xué)習(xí)特征對(duì)所述圖像進(jìn)行識(shí)別。由此,通過(guò)將圖像的多維局部特征和深度學(xué)習(xí)特征結(jié)合起來(lái),由多維局部特征描述圖像中的細(xì)節(jié),由深度學(xué)習(xí)特征描述圖像中的整體紋理和形狀,同時(shí)通過(guò)度量學(xué)習(xí)增加不同類(lèi)別圖像的類(lèi)間距離,減少同一類(lèi)別圖像的類(lèi)內(nèi)距離,從而提高了不同類(lèi)別圖像的區(qū)分度,減小了同一類(lèi)別圖像的差別,極大地提高了圖像識(shí)別的精度。
本申請(qǐng)的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本申請(qǐng)的實(shí)踐了解到。
附圖說(shuō)明
本申請(qǐng)的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1為根據(jù)本申請(qǐng)一個(gè)實(shí)施例的圖像識(shí)別方法的流程圖;
圖2為根據(jù)本申請(qǐng)一個(gè)實(shí)施例的圖像識(shí)別方法中提取圖像的多維度局部特征的示意圖;
圖3為根據(jù)本申請(qǐng)一個(gè)實(shí)施例的深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;
圖4為根據(jù)本申請(qǐng)另一個(gè)實(shí)施例的圖像識(shí)別方法的流程圖;
圖5為根據(jù)本申請(qǐng)一個(gè)實(shí)施例的圖像識(shí)別裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面詳細(xì)描述本申請(qǐng)的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本申請(qǐng),而不能理解為對(duì)本申請(qǐng)的限制。
下面參考附圖描述根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法及裝置。
圖1為根據(jù)本申請(qǐng)一個(gè)實(shí)施例的圖像識(shí)別方法的流程圖。如圖1所示,根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法,包括以下步驟:
S101,提取圖像的多維度局部特征,并提取圖像的深度學(xué)習(xí)特征。
在本申請(qǐng)的實(shí)施例中,該圖像為待識(shí)別圖像,本申請(qǐng)對(duì)待識(shí)別圖像的格式、大小和來(lái)源不做限定,其中,格式可以為但不限于JPG、PNG、TIF、BMP等。應(yīng)當(dāng)理解,對(duì)于圖像分辨率越大的待識(shí)別圖像,識(shí)別效果越好。對(duì)于圖像的來(lái)源,可以是SD(Secure Digital Memory Card,安全數(shù)碼卡)卡中所存儲(chǔ)的圖像;可以是通過(guò)攝像機(jī)拍攝、圖片抓取軟件抓取等方式獲取的圖像;還可以是通過(guò)網(wǎng)絡(luò)從云端服務(wù)器下載的圖像等。
在本申請(qǐng)的一個(gè)實(shí)施例中,圖像的多維度局部特征的提取過(guò)程可具體包括:對(duì)圖像進(jìn)行尺度轉(zhuǎn)化,以生成與圖像內(nèi)容相同、尺寸不同的多個(gè)轉(zhuǎn)化圖像;分別確定每個(gè)轉(zhuǎn)化圖像中的多個(gè)關(guān)鍵點(diǎn)位置;分別提取每個(gè)轉(zhuǎn)化圖像中多個(gè)關(guān)鍵點(diǎn)位置的局部高維特征;將提取到的局部高維特征進(jìn)行拼接,以得到圖像的多維度局部特征。其中,圖像中的關(guān)鍵點(diǎn)指圖像中的主要特征點(diǎn)。以人臉圖像為例,關(guān)鍵點(diǎn)可以是雙眼、鼻子和嘴角等。在本申請(qǐng)的一個(gè)實(shí)施例中,可通過(guò)對(duì)圖像進(jìn)行角點(diǎn)檢測(cè)以確定圖像中關(guān)鍵點(diǎn)的位置。舉例來(lái)說(shuō),常見(jiàn)的角點(diǎn)檢測(cè)方法可包括harris角點(diǎn)檢測(cè)(一種基于模板的角點(diǎn)檢測(cè)),Shi-Tomasi角點(diǎn)檢測(cè)(harris角點(diǎn)檢測(cè)的改進(jìn),于1994年在文章Good Features to Track中提出),F(xiàn)AST(Features from Accelerated Segment Test,加速分割實(shí)驗(yàn)特征)角點(diǎn)檢測(cè),尺度不變surf(Speeded Up Robust Features,加速魯棒特征)檢測(cè),尺度不變sift(Scale invariant feature Transform,尺度不變特征變換)檢測(cè)等。
舉例而言,一幅圖像進(jìn)行尺度轉(zhuǎn)化后可生成如圖2所示的與圖像內(nèi)容相同、尺寸分別為300*300、212*212、150*150、106*106和75*75的5個(gè)轉(zhuǎn)化圖像。圖2所示的示例中的圖像為一張人臉圖像,因此,可將5個(gè)轉(zhuǎn)化圖像中的雙眼、鼻子和兩個(gè)嘴角作為關(guān)鍵點(diǎn),即每張轉(zhuǎn)化圖像具有5個(gè)關(guān)鍵點(diǎn)。將每個(gè)轉(zhuǎn)化圖像中的各個(gè)關(guān)鍵點(diǎn)所在區(qū)域劃分為4*4的方格,其中每個(gè)小方格的像素值為10*10。然后在每個(gè)小方格內(nèi)提取59維規(guī)格相同的LBP(Local Binary Patterns,局部二值模式,一種有效的紋理描述算子)特征,并將所有特征拼接起來(lái),得到長(zhǎng)度為5*5*4*4*59的特征向量,即23600維局部特征向量。其中,在每個(gè)小方格內(nèi)除可提取LBP特征外,還可提取SIFT(Scale-invariant feature transform,尺度不變特征轉(zhuǎn)換)、HOG(Histogram of Oriented Gradient,梯度方向直方圖)和Gabor等特征,或提取以上兩個(gè)或多個(gè)特征的組合,本申請(qǐng)對(duì)特征提取過(guò)程中所提取的特征類(lèi)型不做限定,可以是上述或者其他特征中的任意一種。
在本申請(qǐng)的一個(gè)實(shí)施例中,提取圖像的深度學(xué)習(xí)特征具體包括:根據(jù)深度學(xué)習(xí)模型對(duì)圖像進(jìn)行深度特征學(xué)習(xí),以提取深度學(xué)習(xí)特征。其中,深度特征學(xué)習(xí)模型為預(yù)先根據(jù)大量訓(xùn)練圖像進(jìn)行訓(xùn)練得到的。
本申請(qǐng)實(shí)施例的深度學(xué)習(xí)模型,可選地,除DCNN(Deep Convolutional Neural Networks,深度卷積神經(jīng)網(wǎng)絡(luò))外,還可使用Auto Encoder(自動(dòng)編碼器)和DBM(Deep Boltzmann Machine,深度玻爾茲曼機(jī))等。在深度學(xué)習(xí)過(guò)程中,初始的訓(xùn)練參數(shù)可選用已公開(kāi)的初始參數(shù),優(yōu)選地,為提高學(xué)習(xí)的速度和精確度,還可采用分層的預(yù)訓(xùn)練的方式獲得初始的訓(xùn)練參數(shù)。本申請(qǐng)對(duì)深度學(xué)習(xí)模型和初始訓(xùn)練參數(shù)的選擇不作具體限定。
以DCNN為例,對(duì)模型訓(xùn)練的過(guò)程進(jìn)行說(shuō)明。具體地,以對(duì)人臉圖像進(jìn)行訓(xùn)練為例,首先,可從網(wǎng)絡(luò)下載或者從公開(kāi)數(shù)據(jù)庫(kù)如WebFace等獲取訓(xùn)練圖像,例如可獲取10000個(gè)人的人臉圖像作為訓(xùn)練圖像,首先使用人臉檢測(cè)和人臉關(guān)鍵點(diǎn)定位過(guò)濾訓(xùn)練圖像,以去除沒(méi)有人臉或者有多張人臉的圖像。然后對(duì)過(guò)濾后的訓(xùn)練圖像進(jìn)行幾何歸一化,并將每個(gè)人臉圖像的大小調(diào)整為250*250,并將圖像按人進(jìn)行分類(lèi)。例如樣本中有10000個(gè)人,每個(gè)人都有多張人臉圖像,在每個(gè)人對(duì)應(yīng)的多張人臉圖像中隨機(jī)選擇100張作為訓(xùn)練數(shù)據(jù),構(gòu)成10000個(gè)訓(xùn)練數(shù)據(jù)集。若某個(gè)樣本的人臉圖像不足100張的,可隨機(jī)重復(fù)其已有的人臉圖像,湊齊100張。另外,也可先選定樣本,即選定10000個(gè)人,再依次選擇每個(gè)人的100張人臉圖像,生成10000個(gè)訓(xùn)練數(shù)據(jù)集。
然后將訓(xùn)練數(shù)據(jù)集輸入DCNN。圖3為DCNN的結(jié)構(gòu)示意圖。如圖3所示,DCNN由2個(gè)Convolution(卷積)層、5個(gè)Pooling(池化)層、9個(gè)Inception層(一種多尺度的網(wǎng)絡(luò)結(jié)構(gòu),包含Convolution和Pooling層)、3個(gè)Full-Connection(全連接)層、1個(gè)Dropout(部分連接)層和3個(gè)Softmax(分類(lèi)器)構(gòu)成。圖像在DCNN中的訓(xùn)練過(guò)程可包括前向預(yù)測(cè)和反向傳播。其中,前向預(yù)測(cè)是指將圖像輸入DCNN后,自圖3中的Convolution1開(kāi)始,根據(jù)網(wǎng)絡(luò)連接上的權(quán)重逐層計(jì)算訓(xùn)練圖像,直到最后預(yù)測(cè)分類(lèi)結(jié)果。反向傳播是指自圖3中Softmax3開(kāi)始反向逐層更新網(wǎng)絡(luò)連接上的權(quán)重??山惶孢M(jìn)行前向預(yù)測(cè)和反向傳播的過(guò)程,直至圖像特征的精度達(dá)到要求(收斂于預(yù)設(shè)的值),得到深度學(xué)習(xí)模型。其中,Softmax1和Softmax2可防止因反向傳播而導(dǎo)致的訓(xùn)練梯度衰減,并且可以得到圖像的中層特征描述。
在本申請(qǐng)的實(shí)施例中,可隨機(jī)選擇初始的訓(xùn)練參數(shù),并設(shè)定初始的訓(xùn)練速率為0.01,依上述訓(xùn)練過(guò)程對(duì)人臉圖像進(jìn)行訓(xùn)練,然后在訓(xùn)練過(guò)程中多次調(diào)小訓(xùn)練速率,直到人臉圖像特征的精度收斂于預(yù)設(shè)的值,得到的DCNN的權(quán)重系數(shù)即為深度學(xué)習(xí)模型。繼而可根據(jù)該深度學(xué)習(xí)模型提取圖像的深度學(xué)習(xí)特征向量。
S102,將多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,并通過(guò)度量學(xué)習(xí)對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征。
在本申請(qǐng)的一個(gè)實(shí)施例中,可將步驟S101中所提取的待識(shí)別圖像的多維度局部特征向量和深度學(xué)習(xí)特征向量拼接在一起,形成該圖像對(duì)應(yīng)的一個(gè)多維向量。然后分別使用預(yù)先訓(xùn)練的度量學(xué)習(xí)降維矩陣對(duì)拼接后的多維向量進(jìn)行降維處理以得到度量學(xué)習(xí)特征。
在本申請(qǐng)的另一個(gè)實(shí)施例中,還可包括訓(xùn)練度量學(xué)習(xí)降維矩陣的過(guò)程。因此,根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法,所述訓(xùn)練度量學(xué)習(xí)降維矩陣的過(guò)程還可包括:獲取圖像訓(xùn)練數(shù)據(jù), 并構(gòu)建度量學(xué)習(xí)的優(yōu)化代價(jià)函數(shù),其中,圖像訓(xùn)練數(shù)據(jù)包括多個(gè)樣本對(duì);以及根據(jù)圖像訓(xùn)練數(shù)據(jù)對(duì)優(yōu)化代價(jià)函數(shù)訓(xùn)練度量學(xué)習(xí)降維矩陣。其中,度量學(xué)習(xí)矩陣包括第一度量學(xué)習(xí)矩陣和第二度量學(xué)習(xí)矩陣。
在本申請(qǐng)的一個(gè)實(shí)施例中,圖像訓(xùn)練數(shù)據(jù)可由多個(gè)不同對(duì)象的在不同場(chǎng)景下的圖像所組成的多個(gè)樣本對(duì)組成。具體地,可從中隨機(jī)挑選任意兩個(gè)對(duì)象的圖像的向量組成樣本對(duì),其中,可將同一對(duì)象在不同場(chǎng)景下的兩個(gè)圖像的向量組成正樣本對(duì),并將不同對(duì)象的兩個(gè)圖像的向量組成負(fù)樣本對(duì)。例如,顯示在不同場(chǎng)景下同一個(gè)人的面部的兩張圖像和顯示不同人的面部的兩張圖像,對(duì)應(yīng)的兩對(duì)向量可分別作為正樣本對(duì)和負(fù)樣本對(duì)。
公式(1)即為所構(gòu)建的優(yōu)化代價(jià)函數(shù)。
其中,W為第一度量學(xué)習(xí)降維矩陣,V為第二度量學(xué)習(xí)降維矩陣,yij為樣本對(duì)標(biāo)簽,b為分類(lèi)閾值,φi和φj為訓(xùn)練樣本對(duì)的特征向量,φi和φj降維后的距離Wφi和Wφj分別為φi和φj根據(jù)第一度量學(xué)習(xí)降維矩陣進(jìn)行降維后的向量,為Wφi和Wφj的歐式距離,Vφi和Vφj分別為φi和φj根據(jù)第二度量學(xué)習(xí)降維矩陣進(jìn)行降維后的向量,<Vφi,Vφj>為Vφi和Vφj的余弦距離。
在本申請(qǐng)的實(shí)施例中,根據(jù)圖像訓(xùn)練數(shù)據(jù)對(duì)優(yōu)化代價(jià)函數(shù)訓(xùn)練度量學(xué)習(xí)降維矩陣可具體包括:提取圖像訓(xùn)練數(shù)據(jù)中的每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征,并對(duì)每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,繼而根據(jù)圖像訓(xùn)練數(shù)據(jù)中的每個(gè)樣本對(duì)所對(duì)應(yīng)的拼接后的特征對(duì)優(yōu)化代價(jià)函數(shù)進(jìn)行迭代以獲得度量學(xué)習(xí)降維矩陣。
具體地,對(duì)于圖像訓(xùn)練數(shù)據(jù)中的每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征的提取過(guò)程,可參照上述本申請(qǐng)實(shí)施例的待識(shí)別圖像的多維度局部特征和深度學(xué)習(xí)特征的提取過(guò)程,在此不再贅述。
假設(shè)將每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接后,形成一個(gè)與該圖像對(duì)應(yīng)的m維向量,且多個(gè)樣本對(duì)由n個(gè)樣本圖像組成,則可通過(guò)2階范數(shù)歸一化,使n個(gè)樣本圖像的m維向量生成一個(gè)m×n的矩陣A,再對(duì)矩陣A使用PCA(Principal Component Analysis,主成分分析)的方法得到l×m的降維矩陣B。其中,l可根據(jù)對(duì)圖像識(shí)別的精度要求來(lái)設(shè)定,可以理解,一般地,l越大,圖像識(shí)別精度越高,而在本申請(qǐng)的實(shí)施例中,通過(guò)實(shí)驗(yàn)測(cè)得:當(dāng)l大于128時(shí),隨著l的增大,對(duì)圖像識(shí)別精度的提升不再明顯。因此,在本實(shí)施例中, 可令l=128。
在本申請(qǐng)的一個(gè)實(shí)施例中,可將式(1)中的W和V使用矩陣B初始化,并交替使用正樣本對(duì)和負(fù)樣本對(duì)進(jìn)行迭代,最終得到第一度量學(xué)習(xí)降維矩陣W和第二度量學(xué)習(xí)降維矩陣V。具體的迭代過(guò)程如下:在公式(1)中,隨機(jī)選擇一個(gè)正樣本對(duì)開(kāi)始第一次迭代,得到迭代結(jié)果W1和V1,若W1與W的差小于第一預(yù)設(shè)閾值且V1與V的差小于第二預(yù)設(shè)閾值,則得到最終的結(jié)果為W=W1、V=V1,并結(jié)束迭代過(guò)程,否則令W=W1+△W、V=V1+△V,并隨機(jī)選擇一個(gè)負(fù)樣本對(duì)代入公式(1)計(jì)算W2和V2,若W2與W的差小于第一預(yù)設(shè)閾值且V2與V的差小于第二預(yù)設(shè)閾值,則得到最終的結(jié)果為W=W2、V=V2,并結(jié)束迭代過(guò)程,否則令W=W2+△W、V=V2+△V;繼續(xù)交替選擇未使用的正樣本對(duì)和負(fù)樣本對(duì)重復(fù)上述過(guò)程進(jìn)行迭代,直至Wk與W的差小于第一預(yù)設(shè)閾值且Vk與V的差小于第二預(yù)設(shè)閾值,并將Wk=W和Vk=V作為最終結(jié)果,即得到第一度量學(xué)習(xí)降維矩陣W和第二度量學(xué)習(xí)降維矩陣V。其中,第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值可根據(jù)實(shí)際需要來(lái)設(shè)定,可以理解的是,第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值足夠小,從而能夠保證迭代所得到的結(jié)果近似等于W和V。
其中,△W和△V在每次迭代過(guò)程中根據(jù)所選擇的樣本對(duì)的不同而變化。具體地,△W為式中關(guān)于矩陣W的偏導(dǎo)數(shù)的值,△V為式中關(guān)于矩陣V的偏導(dǎo)數(shù)的值。
此外,根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法,可選地,在用于獲取度量學(xué)習(xí)降維矩陣的優(yōu)化代價(jià)函數(shù)中,可僅使用歐式距離或余弦距離作為訓(xùn)練樣本對(duì)的特征向量降維后的距離。在對(duì)優(yōu)化代價(jià)函數(shù)進(jìn)行迭代的過(guò)程中,可僅使用正樣本對(duì)或負(fù)樣本對(duì),并且,除了使用PCA的方法得到的降維矩陣外,還可使用隨機(jī)的矩陣對(duì)度量學(xué)習(xí)降維矩陣進(jìn)行初始化。
從而,可分別通過(guò)第一度量學(xué)習(xí)降維矩陣W和第二度量學(xué)習(xí)降維矩陣V對(duì)拼接后的特征進(jìn)行降維得到第一降維特征和第二降維特征,并將第一降維特征和第二降維特征進(jìn)行拼接得到度量學(xué)習(xí)特征。具體地,對(duì)于由待識(shí)別圖像的多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接的特征向量可分別由W和V計(jì)算得到第一降維特征向量和第二降維特征向量然后,將第一降維特征向量和第二降維特征向量進(jìn)行拼接得到度量學(xué)習(xí)特征向量其維數(shù)為2l。
S103,根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行識(shí)別。
具體地,可參照相關(guān)技術(shù)中根據(jù)圖像的特征對(duì)圖像進(jìn)行識(shí)別的方法。舉例來(lái)說(shuō),可使用相應(yīng)的分類(lèi)器根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行識(shí)別。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法,通過(guò)將多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接, 并對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征,然后根據(jù)度量學(xué)習(xí)特征對(duì)所述圖像進(jìn)行識(shí)別。由此,通過(guò)將圖像的多維局部特征和深度學(xué)習(xí)特征結(jié)合起來(lái),由多維局部特征描述圖像中的細(xì)節(jié),由深度學(xué)習(xí)特征描述圖像中的整體紋理和形狀,同時(shí)通過(guò)度量學(xué)習(xí)增加不同類(lèi)別圖像的類(lèi)間距離,減少同一類(lèi)別圖像的類(lèi)內(nèi)距離,從而提高了不同類(lèi)別圖像的區(qū)分度,減小了同一類(lèi)別圖像的差別,極大地提高了圖像識(shí)別的精度。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法,圖像可為包含有人臉的商品展示圖像,例如購(gòu)物網(wǎng)站上的通過(guò)模特著裝展示的服飾類(lèi)商品、畫(huà)報(bào)封面圖和廣告圖等。根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行識(shí)別可具體包括:根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行人臉識(shí)別。為防止部分商家在購(gòu)物網(wǎng)站的商品展示圖像中,在未經(jīng)授權(quán)時(shí),以盈利為目的非法使用明星或其他人的肖像,本申請(qǐng)據(jù)此提出了對(duì)圖像進(jìn)行人臉識(shí)別的方法。如圖4所示,為進(jìn)行人臉識(shí)別,本申請(qǐng)實(shí)施例的圖像識(shí)別方法,可包括以下步驟:
S401,提取人臉圖像的多維度局部特征,并提取人臉圖像的深度學(xué)習(xí)特征。
其中,在本申請(qǐng)的實(shí)施例中,對(duì)于像素值大于100*100的人臉圖像有更好的識(shí)別效果
S402,將多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,并通過(guò)度量學(xué)習(xí)對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征。
S403,根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行人臉識(shí)別。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別方法,能夠精確地識(shí)別出同一個(gè)人在不同姿態(tài)、表情和各種復(fù)雜背景下的人臉圖像,同時(shí)能夠精確地區(qū)分不同人的人臉圖像,由此可以對(duì)大量圖像中的人臉進(jìn)行精確的識(shí)別,從而可以實(shí)現(xiàn)對(duì)商品圖像中明星肖像使用資質(zhì)的審查。
為實(shí)現(xiàn)上述實(shí)施例的圖像識(shí)別方法,本申請(qǐng)還提出一種圖像識(shí)別裝置。
圖5為根據(jù)本申請(qǐng)一個(gè)實(shí)施例的圖像識(shí)別裝置的結(jié)構(gòu)框圖。
如圖5所示,本申請(qǐng)實(shí)施例的圖像識(shí)別裝置,包括:提取模塊10、學(xué)習(xí)模塊20和識(shí)別模塊30。
其中,提取模塊10用于提取圖像的多維度局部特征,并提取圖像的深度學(xué)習(xí)特征。
在本申請(qǐng)的實(shí)施例中,該圖像為待識(shí)別圖像,本申請(qǐng)對(duì)待識(shí)別圖像的格式、大小和來(lái)源不做限定,其中,格式可以為但不限于JPG、PNG、TIF、BMP等。應(yīng)當(dāng)理解,對(duì)于圖像分辨率越大的待識(shí)別圖像,識(shí)別效果越好。對(duì)于圖像的來(lái)源,可以是SD卡中所存儲(chǔ)的圖像;可以是通過(guò)攝像機(jī)拍攝、圖片抓取軟件抓取等方式獲取的圖像;還可以是通過(guò)網(wǎng)絡(luò)從云端服務(wù)器下載的圖像等。
在本申請(qǐng)的一個(gè)實(shí)施例中,圖像的多維度局部特征的提取過(guò)程可具體包括:對(duì)圖像進(jìn)行尺度轉(zhuǎn)化,以生成與圖像內(nèi)容相同、尺寸不同的多個(gè)轉(zhuǎn)化圖像;分別確定每個(gè)轉(zhuǎn)化圖像中的多個(gè)關(guān)鍵點(diǎn)位置;分別提取每個(gè)轉(zhuǎn)化圖像中多個(gè)關(guān)鍵點(diǎn)位置的局部高維特征;將提取到的局 部高維特征進(jìn)行拼接,以得到圖像的多維度局部特征。其中,圖像中的關(guān)鍵點(diǎn)指圖像中的主要特征點(diǎn)。以人臉圖像為例,關(guān)鍵點(diǎn)可以是雙眼、鼻子和嘴角等。在本申請(qǐng)的一個(gè)實(shí)施例中,可通過(guò)對(duì)圖像進(jìn)行角點(diǎn)檢測(cè)以確定圖像中關(guān)鍵點(diǎn)的位置。舉例來(lái)說(shuō),常見(jiàn)的角點(diǎn)檢測(cè)方法可包括harris角點(diǎn)檢測(cè)(一種基于模板的角點(diǎn)檢測(cè)),Shi-Tomasi角點(diǎn)檢測(cè)(harris角點(diǎn)檢測(cè)的改進(jìn),于1994年在文章Good Features to Track中提出),F(xiàn)AST(Features from Accelerated Segment Test,加速分割實(shí)驗(yàn)特征)角點(diǎn)檢測(cè),尺度不變surf(Speeded Up Robust Features,加速魯棒特征)檢測(cè),尺度不變sift(Scale invariant feature Transform,尺度不變特征變換)檢測(cè)等。
舉例而言,一幅圖像進(jìn)行尺度轉(zhuǎn)化后可生成如圖2所示的與圖像內(nèi)容相同、尺寸分別為300*300、212*212、150*150、106*106和75*75的5個(gè)轉(zhuǎn)化圖像。圖2所示的示例中的圖像為一張人臉圖像,因此,可將5個(gè)轉(zhuǎn)化圖像中的雙眼、鼻子和兩個(gè)嘴角作為關(guān)鍵點(diǎn),即每張轉(zhuǎn)化圖像具有5個(gè)關(guān)鍵點(diǎn)。將每個(gè)轉(zhuǎn)化圖像中的各個(gè)關(guān)鍵點(diǎn)所在區(qū)域劃分為4*4的方格,其中每個(gè)小方格的像素值為10*10。然后在每個(gè)小方格內(nèi)提取59維規(guī)格相同的LBP特征,并將所有特征拼接起來(lái),得到長(zhǎng)度為5*5*4*4*59的特征向量,即23600維局部特征向量。其中,在每個(gè)小方格內(nèi)除可提取LBP特征外,還可提取SIFT、HOG和Gabor等特征,或提取以上兩個(gè)或多個(gè)特征的組合,本申請(qǐng)對(duì)特征提取過(guò)程中所提取的特征類(lèi)型不做限定,可以是上述或者其他特征中的任意一種。
在本申請(qǐng)的一個(gè)實(shí)施例中,提取圖像的深度學(xué)習(xí)特征具體包括:根據(jù)深度學(xué)習(xí)模型對(duì)圖像進(jìn)行深度特征學(xué)習(xí),以提取深度學(xué)習(xí)特征。其中,深度特征學(xué)習(xí)模型為預(yù)先根據(jù)大量訓(xùn)練圖像進(jìn)行訓(xùn)練得到的。
本申請(qǐng)實(shí)施例的深度學(xué)習(xí)模型,可選地,除DCNN外,還可使用Auto Encoder和DBM等。在深度學(xué)習(xí)過(guò)程中,初始的訓(xùn)練參數(shù)可選用已公開(kāi)的初始參數(shù),優(yōu)選地,為提高學(xué)習(xí)的速度和精確度,還可采用分層的預(yù)訓(xùn)練的方式獲得初始的訓(xùn)練參數(shù)。本申請(qǐng)對(duì)深度學(xué)習(xí)模型和初始訓(xùn)練參數(shù)的選擇不作具體限定。
以DCNN為例,對(duì)模型訓(xùn)練的過(guò)程進(jìn)行說(shuō)明。具體地,以對(duì)人臉圖像進(jìn)行訓(xùn)練為例,首先,可從網(wǎng)絡(luò)下載或者從公開(kāi)數(shù)據(jù)庫(kù)如WebFace等獲取訓(xùn)練圖像,例如可獲取10000個(gè)人的人臉圖像作為訓(xùn)練圖像,首先使用人臉檢測(cè)和人臉關(guān)鍵點(diǎn)定位過(guò)濾訓(xùn)練圖像,以去除沒(méi)有人臉或者有多張人臉的圖像。然后對(duì)過(guò)濾后的訓(xùn)練圖像進(jìn)行幾何歸一化,并將每個(gè)人臉圖像的大小調(diào)整為250*250,并將圖像按人進(jìn)行分類(lèi)。例如樣本中有10000個(gè)人,每個(gè)人都有多張人臉圖像,在每個(gè)人對(duì)應(yīng)的多張人臉圖像中隨機(jī)選擇100張作為訓(xùn)練數(shù)據(jù),構(gòu)成10000個(gè)訓(xùn)練數(shù)據(jù)集。若某個(gè)樣本的人臉圖像不足100張的,可隨機(jī)重復(fù)其已有的人臉圖像,湊齊100張。另外,也可先選定樣本,即選定10000個(gè)人,再依次選擇每個(gè)人的100張人臉圖像, 生成10000個(gè)訓(xùn)練數(shù)據(jù)集。
然后將訓(xùn)練數(shù)據(jù)集輸入DCNN。如圖3所示,DCNN由2個(gè)Convolution(卷積)層、5個(gè)Pooling(池化)層、9個(gè)Inception層(一種多尺度的網(wǎng)絡(luò)結(jié)構(gòu),包含Convolution和Pooling層)、3個(gè)Full-Connection(全連接層)、1個(gè)Dropout(部分連接)層和3個(gè)Softmax(分類(lèi)器)構(gòu)成。圖像在DCNN中的訓(xùn)練過(guò)程可包括前向預(yù)測(cè)和反向傳播。其中,前向預(yù)測(cè)是指將圖像輸入DCNN后,自圖3中的Convolution1開(kāi)始,根據(jù)網(wǎng)絡(luò)連接上的權(quán)重逐層計(jì)算訓(xùn)練圖像,直到最后預(yù)測(cè)分類(lèi)結(jié)果。反向傳播是指自圖3中Softmax3開(kāi)始反向逐層更新網(wǎng)絡(luò)連接上的權(quán)重??山惶孢M(jìn)行前向預(yù)測(cè)和反向傳播的過(guò)程,直至圖像特征的精度達(dá)到要求(收斂于預(yù)設(shè)的值),得到深度學(xué)習(xí)模型。其中,Softmax1和Softmax2可防止因反向傳播而導(dǎo)致的訓(xùn)練梯度衰減,并且可以得到圖像的中層特征描述。
在本申請(qǐng)的實(shí)施例中,可隨機(jī)選擇初始的訓(xùn)練參數(shù),并設(shè)定初始的訓(xùn)練速率為0.01,依上述訓(xùn)練過(guò)程對(duì)人臉圖像進(jìn)行訓(xùn)練,然后在訓(xùn)練過(guò)程中多次調(diào)小訓(xùn)練速率,直到人臉圖像特征的精度收斂于預(yù)設(shè)的值,得到的DCNN的權(quán)重系數(shù)即為深度學(xué)習(xí)模型。繼而可根據(jù)該深度學(xué)習(xí)模型提取圖像的深度學(xué)習(xí)特征向量。
學(xué)習(xí)模塊20用于將多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,并通過(guò)度量學(xué)習(xí)對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征。
在本申請(qǐng)的一個(gè)實(shí)施例中,可將提取模塊10所提取的待識(shí)別圖像的多維度局部特征向量和深度學(xué)習(xí)特征向量拼接在一起,形成該圖像對(duì)應(yīng)的一個(gè)多維向量。然后分別使用預(yù)先訓(xùn)練的度量學(xué)習(xí)降維矩陣對(duì)拼接后的多維向量進(jìn)行降維處理以得到度量學(xué)習(xí)特征。
在本申請(qǐng)的另一個(gè)實(shí)施例中,還可包括訓(xùn)練度量學(xué)習(xí)降維矩陣的過(guò)程。因此,根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別裝置,通過(guò)度量學(xué)習(xí)對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征具體還可包括:獲取圖像訓(xùn)練數(shù)據(jù),并構(gòu)建度量學(xué)習(xí)的優(yōu)化代價(jià)函數(shù),其中,圖像訓(xùn)練數(shù)據(jù)包括多個(gè)樣本對(duì);以及根據(jù)圖像訓(xùn)練數(shù)據(jù)對(duì)優(yōu)化代價(jià)函數(shù)訓(xùn)練度量學(xué)習(xí)降維矩陣。其中,度量學(xué)習(xí)矩陣包括第一度量學(xué)習(xí)矩陣和第二度量學(xué)習(xí)矩陣。
在本申請(qǐng)的一個(gè)實(shí)施例中,圖像訓(xùn)練數(shù)據(jù)可由多個(gè)不同對(duì)象的在不同場(chǎng)景下的圖像所組成的多個(gè)樣本對(duì)組成。具體地,可從中隨機(jī)挑選任意兩個(gè)對(duì)象的圖像的向量組成樣本對(duì),其中,可將同一對(duì)象在不同場(chǎng)景下的兩個(gè)圖像的向量組成正樣本對(duì),并將不同對(duì)象的兩個(gè)圖像的向量組成負(fù)樣本對(duì)。例如,顯示在不同場(chǎng)景下同一個(gè)人的面部的兩張圖像和顯示不同人的面部的兩張圖像,對(duì)應(yīng)的兩對(duì)向量可分別作為正樣本對(duì)和負(fù)樣本對(duì)。
公式(1)即為所構(gòu)建的優(yōu)化代價(jià)函數(shù)。
其中,W為第一度量學(xué)習(xí)降維矩陣,V為第二度量學(xué)習(xí)降維矩陣,yij為樣本對(duì)標(biāo)簽,b為分類(lèi)閾值,φi和φj為訓(xùn)練樣本對(duì)的特征向量,φi和φj降維后的距離Wφi和Wφj分別為φi和φj根據(jù)第一度量學(xué)習(xí)降維矩陣進(jìn)行降維后的向量,為Wφi和Wφj的歐式距離,Vφi和Vφj分別為φi和φj根據(jù)第二度量學(xué)習(xí)降維矩陣進(jìn)行降維后的向量,<Vφi,Vφj>為Vφi和Vφj的余弦距離。
在本申請(qǐng)的實(shí)施例中,根據(jù)圖像訓(xùn)練數(shù)據(jù)對(duì)優(yōu)化代價(jià)函數(shù)訓(xùn)練度量學(xué)習(xí)降維矩陣可具體包括:提取圖像訓(xùn)練數(shù)據(jù)中的每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征,并對(duì)每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,繼而根據(jù)圖像訓(xùn)練數(shù)據(jù)中的每個(gè)樣本對(duì)所對(duì)應(yīng)的拼接后的特征對(duì)優(yōu)化代價(jià)函數(shù)進(jìn)行迭代以獲得度量學(xué)習(xí)降維矩陣。
具體地,對(duì)于圖像訓(xùn)練數(shù)據(jù)中的每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征的提取過(guò)程,可參照上述本申請(qǐng)實(shí)施例的待識(shí)別圖像的多維度局部特征和深度學(xué)習(xí)特征的提取過(guò)程,在此不再贅述。
假設(shè)將每個(gè)圖像的多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接后,形成一個(gè)與該圖像對(duì)應(yīng)的m維向量,且多個(gè)樣本對(duì)由n個(gè)樣本圖像組成,則可通過(guò)2階范數(shù)歸一化,使n個(gè)樣本圖像的m維向量生成一個(gè)m×n的矩陣A,再對(duì)矩陣A使用PCA的方法得到l×m的降維矩陣B。其中,l可根據(jù)對(duì)圖像識(shí)別的精度要求來(lái)設(shè)定,可以理解,一般地,l越大,圖像識(shí)別精度越高,而在本申請(qǐng)的實(shí)施例中,通過(guò)實(shí)驗(yàn)測(cè)得:當(dāng)l大于128時(shí),隨著l的增大,對(duì)圖像識(shí)別精度的提升不再明顯。因此,在本實(shí)施例中,可令l=128。
在本申請(qǐng)的一個(gè)實(shí)施例中,可將式(1)中的W和V使用矩陣B初始化,并交替使用正樣本對(duì)和負(fù)樣本對(duì)進(jìn)行迭代,最終得到第一度量學(xué)習(xí)降維矩陣W和第二度量學(xué)習(xí)降維矩陣V。具體的迭代過(guò)程如下:在公式(1)中,隨機(jī)選擇一個(gè)正樣本對(duì)開(kāi)始第一次迭代,得到迭代結(jié)果W1和V1,若W1與W的差小于第一預(yù)設(shè)閾值且V1與V的差小于第二預(yù)設(shè)閾值,則得到最終的結(jié)果為W=W1、V=V1,并結(jié)束迭代過(guò)程,否則令W=W1+△W、V=V1+△V,并隨機(jī)選擇一個(gè)負(fù)樣本對(duì)代入公式(1)計(jì)算W2和V2,若W2與W的差小于第一預(yù)設(shè)閾值且V2與V的差小于第二預(yù)設(shè)閾值,則得到最終的結(jié)果為W=W2、V=V2,并結(jié)束迭代過(guò)程,否則令W=W2+△W、V=V2+△V;繼續(xù)交替選擇未使用的正樣本對(duì)和負(fù)樣本對(duì)重復(fù)上述過(guò)程進(jìn)行迭代,直至Wk與W的差小于第一預(yù)設(shè)閾值且Vk與V的差小于第二預(yù)設(shè)閾值,并將Wk=W和Vk=V作為最終結(jié)果,即得到第一度量學(xué)習(xí)降維矩陣W和第二度量學(xué)習(xí)降維矩陣V。其中,第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值可根據(jù)實(shí)際需要來(lái)設(shè)定,可以理解的是,第一預(yù)設(shè)閾值和第二 預(yù)設(shè)閾值足夠小,從而能夠保證迭代所得到的結(jié)果近似等于W和V。
其中,△W和△V在每次迭代過(guò)程中根據(jù)所選擇的樣本對(duì)的不同而變化。具體地,△W為式中關(guān)于矩陣W的偏導(dǎo)數(shù)的值,△V為式中關(guān)于矩陣V的偏導(dǎo)數(shù)的值。
此外,根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別裝置,可選地,在用于獲取度量學(xué)習(xí)降維矩陣的優(yōu)化代價(jià)函數(shù)中,可僅使用歐式距離或余弦距離作為訓(xùn)練樣本對(duì)的特征向量降維后的距離。在對(duì)優(yōu)化代價(jià)函數(shù)進(jìn)行迭代的過(guò)程中,可僅使用正樣本對(duì)或負(fù)樣本對(duì),并且,除了使用PCA的方法得到的降維矩陣外,還可使用隨機(jī)的矩陣對(duì)度量學(xué)習(xí)降維矩陣進(jìn)行初始化。
從而,可分別通過(guò)第一度量學(xué)習(xí)降維矩陣W和第二度量學(xué)習(xí)降維矩陣V對(duì)拼接后的特征進(jìn)行降維得到第一降維特征和第二降維特征,并將第一降維特征和第二降維特征進(jìn)行拼接得到度量學(xué)習(xí)特征。具體地,對(duì)于由待識(shí)別圖像的多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接的特征向量可分別由W和V計(jì)算得到第一降維特征向量和第二降維特征向量然后,將第一降維特征向量和第二降維特征向量進(jìn)行拼接得到度量學(xué)習(xí)特征向量其維數(shù)為2l。
識(shí)別模塊30用于根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行識(shí)別。
具體地,可參照相關(guān)技術(shù)中根據(jù)圖像的特征對(duì)圖像進(jìn)行識(shí)別的方法。舉例來(lái)說(shuō),識(shí)別模塊30可通過(guò)相應(yīng)的分類(lèi)器根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行識(shí)別。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別裝置,通過(guò)將多維度局部特征和深度學(xué)習(xí)特征進(jìn)行拼接,并對(duì)拼接后的特征進(jìn)行學(xué)習(xí)以得到度量學(xué)習(xí)特征,然后根據(jù)度量學(xué)習(xí)特征對(duì)所述圖像進(jìn)行識(shí)別。由此,通過(guò)將圖像的多維局部特征和深度學(xué)習(xí)特征結(jié)合起來(lái),由多維局部特征描述圖像中的細(xì)節(jié),由深度學(xué)習(xí)特征描述圖像中的整體紋理和形狀,同時(shí)通過(guò)度量學(xué)習(xí)增加不同類(lèi)別圖像的類(lèi)間距離,減少同一類(lèi)別圖像的類(lèi)內(nèi)距離,從而提高了不同類(lèi)別圖像的區(qū)分度,減小了同一類(lèi)別圖像的差別,極大地提高了圖像識(shí)別的精度。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別裝置,圖像可為包含有人臉的商品展示圖像,例如購(gòu)物網(wǎng)站上的通過(guò)模特著裝展示的服飾類(lèi)商品、畫(huà)報(bào)封面圖和廣告圖等。為防止部分商家在購(gòu)物網(wǎng)站的商品展示圖像中,在未經(jīng)授權(quán)時(shí),以盈利為目的非法使用明星或其他人的肖像,本申請(qǐng)實(shí)施例的識(shí)別模塊30可具體用于:根據(jù)度量學(xué)習(xí)特征對(duì)圖像進(jìn)行人臉識(shí)別。
根據(jù)本申請(qǐng)實(shí)施例的圖像識(shí)別裝置,能夠精確地識(shí)別出同一個(gè)人在不同姿態(tài)、表情和各種復(fù)雜背景下的人臉圖像,同時(shí)能夠精確地區(qū)分不同人的人臉圖像,由此可以對(duì)大量圖像中的人臉進(jìn)行精確的識(shí)別,從而可以實(shí)現(xiàn)對(duì)商品圖像中明星肖像使用資質(zhì)的審查。
流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本申請(qǐng)的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本申請(qǐng)的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說(shuō)明書(shū)而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤(pán)盒(磁裝置),隨機(jī)存取存儲(chǔ)器(RAM),只讀存儲(chǔ)器(ROM),可擦除可編輯只讀存儲(chǔ)器(EPROM或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤(pán)只讀存儲(chǔ)器(CDROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^(guò)對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來(lái)以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。
應(yīng)當(dāng)理解,本申請(qǐng)的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門(mén)電路的離散邏輯電路,具有合適的組合邏輯門(mén)電路的專用集成電路,可編程門(mén)陣列(PGA),現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
此外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本申請(qǐng)的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
盡管已經(jīng)示出和描述了本申請(qǐng)的實(shí)施例,本領(lǐng)域的普通技術(shù)人員可以理解:在不脫離本申請(qǐng)的原理和宗旨的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本申請(qǐng)的范圍由權(quán)利要求及其等同限定。