一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理、計(jì)算機(jī)視覺分析技術(shù)領(lǐng)域,涉及一種基于深度卷積神經(jīng)網(wǎng) 絡(luò)的服裝定位檢測方法。
【背景技術(shù)】
[0002] 服裝檢測系統(tǒng)已成為圖像處理、計(jì)算機(jī)視覺分析領(lǐng)域的新興應(yīng)用方向,對服裝檢 測的研宄,是智能形象設(shè)計(jì)的一項(xiàng)關(guān)鍵技術(shù),此技術(shù)通過對待檢測圖像中服裝的檢測并給 出精確定位提示,可實(shí)現(xiàn)智能試、換服裝,有著巨大的市場應(yīng)用價值和社會意義。
[0003] 現(xiàn)階段國內(nèi)外諸多國家圍繞深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)展開了研宄,但將此技術(shù)應(yīng)用到服 裝檢測領(lǐng)域的例子還甚少。深度神經(jīng)網(wǎng)絡(luò)普遍存在由于待檢測ROI區(qū)域數(shù)量過多而導(dǎo)致的 時效性較差問題,以及對于提取特征的方法選取不當(dāng),從而極大的束縛了精確度的問題,也 都有待于提出更好的解決方案。
【發(fā)明內(nèi)容】
[0004] 有鑒于此,本發(fā)明的目的在于提供一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方 法,能夠?qū)Υ龣z測圖像中服裝的進(jìn)行檢測并給出精確定位提示,可實(shí)現(xiàn)智能試、換服裝。
[0005] 為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
[0006] 一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,該方法包括以下步驟:
[0007] 步驟1 :在輸入圖像中,選取待檢測區(qū)域ROI ;
[0008] 步驟2 :利用深度卷積神經(jīng)網(wǎng)絡(luò)對待檢測區(qū)域進(jìn)行特征提取,得到每一個分割區(qū) 域rect的特征向量;
[0009] 步驟3 :采用LibSVM分類器對所有特征向量進(jìn)行判斷,選出最后檢測結(jié)果。
[0010] 進(jìn)一步,所述步驟1選取待檢測區(qū)域ROI,具體包括以下步驟:
[0011] 定義區(qū)域內(nèi)間距為,
[0012] /n(R) = max ω(?'), e&E
[0013] 其中,ω (e)表示相鄰兩點(diǎn)之間權(quán)值,E表示區(qū)域內(nèi)所有的邊;
[0014] 定義區(qū)域間間距為,
[0015]⑶叫為
[0016] 其中,R表示區(qū)域,p表示像素點(diǎn),E為邊的集合;然后執(zhí)行以下步驟:
[0017] 步驟I. 1 :初始化區(qū)域;初始化過程的輸入為一個有η個像素和m條邊的圖Img,輸 出為分割區(qū)域rect的集合;
[0018] 步驟1. 2 :相似性計(jì)算;找出相似性最大的區(qū)域max (S) = Iri, rj};
[0019] 步驟I. 3:區(qū)域合并。
[0020] 進(jìn)一步,所述步驟1. 1初始化區(qū)域具體包括以下步驟:
[0021] 步驟1. 1. 1 :將邊按照權(quán)重值以降序排列,邊的權(quán)重值為對應(yīng)兩個像素點(diǎn)像素值 差值的絕對值;
[0022] ω (Pi, Pj) = I I (Pi) -I (Pj) I,
[0023] 其中,I (Pi)和I (Pi)分別表示點(diǎn)pJP p」的像素值;
[0024] 步驟I. 1. 2 :設(shè)分割記為Seg(O),即每個像素自成一個區(qū)域;
[0025] 步驟I. 1. 3 :令k = 1 ;按照以下的方式由Seg(k-l)構(gòu)造Seg(k);
[0026] 第k條邊連接的兩個節(jié)點(diǎn)為pJP p j,如果在Seg(k-l)中pJP p j是分別屬于兩個 區(qū)域并且第k條邊的權(quán)重小于兩個區(qū)域的區(qū)域內(nèi)間距,則合并這兩個區(qū)域;否則令Seg(k) =Seg(k-l);
[0027]
【主權(quán)項(xiàng)】
1. 一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,其特征在于:該方法包括以下步 驟: 步驟1 :在輸入圖像中,選取待檢測區(qū)域ROI; 步驟2:利用深度卷積神經(jīng)網(wǎng)絡(luò)對待檢測區(qū)域進(jìn)行特征提取,得到每一個分割區(qū)域rect的特征向量; 步驟3:采用LibSVM分類器對所有特征向量進(jìn)行判斷,選出最后檢測結(jié)果。
2. 根據(jù)權(quán)利要求1所述的一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,其特征在 于: 所述步驟1選取待檢測區(qū)域ROI,具體包括以下步驟: 定義區(qū)域內(nèi)間距為,
其中,《 (e)表示相鄰兩點(diǎn)之間權(quán)值,E表示區(qū)域內(nèi)所有的邊; 定義區(qū)域間間距為,
其中,R表示區(qū)域,P表示像素點(diǎn),E為邊的集合;然后執(zhí)行以下步驟: 步驟1. 1 :初始化區(qū)域;初始化過程的輸入為一個有n個像素和m條邊的圖Img,輸出為 分割區(qū)域rect的集合; 步驟1. 2 :相似性計(jì)算;找出相似性最大的區(qū)域max(S) = {i^rj}; 步驟1.3:區(qū)域合并。
3. 根據(jù)權(quán)利要求2所述的一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,其特征在 于:所述步驟1. 1初始化區(qū)域具體包括以下步驟: 步驟1. 1. 1 :將邊按照權(quán)重值以降序排列,邊的權(quán)重值為對應(yīng)兩個像素點(diǎn)像素值差值 的絕對值; w (Pi,Pj) = 11 (Pi)-I(Pj)I^ 其中,I(Pi)和I(Pi)分別表示點(diǎn)pJPP」的像素值; 步驟1. 1. 2 :設(shè)分割記為Seg(O),即每個像素自成一個區(qū)域; 步驟1. 1. 3 :令k= 1 ;按照以下的方式由Seg(k-l)構(gòu)造Seg(k); 第k條邊連接的兩個節(jié)點(diǎn)為pJPpj,如果在Seg(k-l)中pJPpj是分別屬于兩個區(qū) 域并且第k條邊的權(quán)重小于兩個區(qū)域的區(qū)域內(nèi)間距,則合并這兩個區(qū)域;否則令Seg(k)= Seg(k-l);
Min況,R2) = min (In況)+t況),In (R2) +t(R2)),t(R)=k/ | R|,|R|表示區(qū)域R的大??; 步驟1. 1. 4 :令k=k+1,重復(fù)步驟1. 1. 3,直至k=m; 步驟1. 1. 5:返回Seg(m)即為所求分割區(qū)域rect的集合。
4. 根據(jù)權(quán)利要求2所述的一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,其特征在 于: 所述步驟1. 2相似性計(jì)算,包括以下幾個方面的相似性計(jì)算: 步驟1. 2. 1 :通過以下公式計(jì)算顏色相似性:
其中,n表示輸入圖片的顏色直方圖區(qū)間數(shù)目,c為對應(yīng)區(qū)間向量, 步驟1. 2. 2 :通過以下公式計(jì)算紋理相似性:
其中,紋理特征為提取HOG特征,n表示區(qū)間數(shù),是所取的bin數(shù)與顏色通道數(shù)兩者的 乘積,t為對應(yīng)區(qū)間向量; 步驟1. 2. 3 :通過以下公式計(jì)算小區(qū)域相似性:
其中,sizedmg)表示整張輸入圖片的像素個數(shù); 步驟1. 2. 4 :通過以下公式計(jì)算重合區(qū)域相似性:
其中,size(BBy為包含兩個區(qū)域的最小外接矩形。
5. 根據(jù)權(quán)利要求2所述的一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,其特征在 于: 所述步驟1. 3區(qū)域合并,具體包括以下步驟: 步驟1. 3. 1 :定義合并區(qū)域rt=riUr』,
size(rt) =size(r)+size(r』), 其中,Ct為將區(qū)域r&合并后,區(qū)域rt的顏色直方圖分布; 步驟1. 3. 2 :從S集合中,移走所有與n,rj相關(guān)的數(shù)據(jù),s(ri,r*),s(r*,rj; 步驟1. 3. 3 :計(jì)算新集合rt與所有與它相鄰區(qū)域的相似性s(rt,r*); 步驟1. 3. 4:R=RUrt;重復(fù)步驟1. 3. 2至步驟1. 3. 4步驟,直到S集合空為止。
6. 根據(jù)權(quán)利要求1所述的一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,其特征在 于: 所述步驟2具體包括以下步驟: 步驟2. 1 :卷積運(yùn)算:g(x,y) =f(x,y)*c(u,v) +e(b), 其中,e(b)為bias參數(shù),f為原圖,c為卷積核; 步驟2. 2 :池化過程: 首先對相鄰的四個像素求和,通過標(biāo)量W加權(quán),再增加偏置b,然后通過sigmoid激活函 數(shù),產(chǎn)生縮小的特征映射圖p; 步驟2. 3 :重復(fù)步驟2. 1~2. 2 ;直到特征圖變?yōu)?*1維,進(jìn)行全連接,最終得到每一個 分割區(qū)域rect的特征向量。
7.根據(jù)權(quán)利要求1所述的一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,其特征在 于: 所述步驟3具體包括以下步驟: 步驟3. 1:LibSVM判斷: 采用線性核函數(shù)進(jìn)行計(jì)算,公式如下所示:g(x) =ff?f(x)+b, 其中,W為SVM判別模型,f為特征向量,g為計(jì)算所得分?jǐn)?shù); 步驟3. 2 :選取MAX: 計(jì)算出所有檢測框的分值后,選取得分最高的一個分割區(qū)域rect,作為最終檢測結(jié)果, 輸出到原圖上。
【專利摘要】本發(fā)明涉及一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法,屬于圖像處理、計(jì)算機(jī)視覺分析技術(shù)領(lǐng)域。該方法通過在輸入圖像中,合理選取待檢測區(qū)域ROI;然后,利用深度卷積神經(jīng)網(wǎng)絡(luò)對待檢測區(qū)域進(jìn)行特征提??;最后,采用LibSVM分類器對所有特征向量進(jìn)行判斷。本發(fā)明提供的一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝定位檢測方法能夠?qū)Υ龣z測圖像中服裝的進(jìn)行檢測并給出精確定位,可實(shí)現(xiàn)智能試、換服裝。
【IPC分類】G06K9-46, G06K9-00
【公開號】CN104778464
【申請?zhí)枴緾N201510221552
【發(fā)明人】程誠, 顏?zhàn)? 李遠(yuǎn)錢, 覃勛輝, 周祥東, 周曦, 袁家虎
【申請人】中國科學(xué)院重慶綠色智能技術(shù)研究院
【公開日】2015年7月15日
【申請日】2015年5月4日