基于深層卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)色情圖像檢測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計算機(jī)視覺、圖像識別領(lǐng)域,涉及一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)色情圖像檢測方法。
【背景技術(shù)】
[0002]現(xiàn)有的從海量網(wǎng)絡(luò)圖片中準(zhǔn)確快速地檢測色情圖像的具體有以下方法:
[0003]第一種、通過膚色統(tǒng)計的色情圖像檢測方法
[0004]解決方案:通過膚色檢測模型(基于不同顏色空間顏色特征或紋理特征,并運用高斯混合模型判斷一個像素點是否為皮膚)檢測出圖像中的膚色區(qū)域,根據(jù)膚色區(qū)域面積占總圖像面積的比例判斷圖像是否色情。
[0005]缺點:(1)很多圖像即使皮膚區(qū)域較多也不是色情圖像(如含有穿著比基尼的人物的圖像,如圖1(a)所示);
[0006](2) 一些色情圖像的膚色區(qū)域所占整幅圖像的比重并不高(一些色情圖像只是裸露了色情部分);
[0007](3)建立一種通用準(zhǔn)確的膚色檢測模型是極其困難的(不同人、不同種族的膚色差異較大,或者一些正常圖像的顏色非常類似于膚色);如圖1(a) (b) (C)所示,對(a) (b)兩幅圖像建立都適用的膚色模型是困難的,且現(xiàn)有的膚色檢測算法會把(C)圖大面積認(rèn)為是皮膚。
[0008]第二種、基于圖像檢索的色情圖像檢測方法
[0009]解決方案:首先預(yù)先構(gòu)建一個既包含正常圖像又包含色情圖像的圖像數(shù)據(jù)庫,然后對于待檢測圖像和已建立圖像數(shù)據(jù)庫中的每一幅圖像進(jìn)行比對,找到最相似的η幅圖像,最終根據(jù)這η幅圖像中色情圖像所占的比例判斷待檢測圖像是否為色情圖像。
[0010]缺點:(I)選擇何種類型的圖像構(gòu)建待檢索圖像數(shù)據(jù)庫對最終效果影響很大(色情圖像和正常圖像都具有海量的樣式,選取有限的圖像代表所有類型是不可能的,會經(jīng)常出現(xiàn)一幅色情圖像在圖像數(shù)據(jù)庫中檢索不到很相似圖像的情況);
[0011](2)選取何種特征來比對兩幅圖像比較相似是非常困難的(弱特征會帶來大量誤判,強特征會導(dǎo)致檢索不到相似圖片)。
[0012]第三種、結(jié)合膚色信息與低級視覺特征的色情圖像檢測方法
[0013]解決方案:在訓(xùn)練階段首先根據(jù)膚色信息檢測圖像的膚色區(qū)域,在檢測的皮膚區(qū)域中提取紋理、形狀、局部特征點等特征。然后把這些特征送入SVM、貝葉斯或單層神經(jīng)網(wǎng)絡(luò)等分類器中訓(xùn)練這些分類器。在識別階段用和訓(xùn)練階段同樣的方法提取特征送入已訓(xùn)練好的分類器判斷結(jié)果。
[0014]缺點:⑴同樣采用了膚色檢測模型,具有和現(xiàn)有方法I同樣的缺陷;
[0015](2)采用何種低級視覺特征、如何選擇分類器都是根據(jù)經(jīng)驗的,很難保證最佳檢測效果。
[0016]第四種、基于視覺詞袋的高級語義模型的色情圖像檢測方法
[0017]解決方案:在訓(xùn)練階段提取SIFT或者DenSe-SIFT、Hue-SIFT等特征通過聚類的方法構(gòu)建視覺詞袋,每一幅訓(xùn)練圖像都利用構(gòu)建的視覺詞袋表示為一個高維特征向量,使用這些特征向量訓(xùn)練一個SVM分類器。對待檢測的圖像用同樣方法提取特征送入已訓(xùn)練好的分類器即可獲得結(jié)果。
[0018]缺點:(I)采用何種特征構(gòu)建視覺詞袋是困難的;
[0019](2)視覺詞袋的大小沒有對應(yīng)的評價標(biāo)準(zhǔn);
[0020](3)有些圖像的主體部分所占圖像的比例過小,通過特征點的提取會出現(xiàn)大量無意義的特征點,從而影響分類效果;如圖1(d)所示,如果這是一幅色情圖像,則提取的特征點會包含大量的干擾的背景信息,從而影響分類器的判斷。
[0021]第五種、使用小樣本直接訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)
[0022]解決方案:訓(xùn)練色情圖片檢測網(wǎng)絡(luò)時直接采用已標(biāo)記好的小樣本進(jìn)行網(wǎng)絡(luò)參數(shù)的更新,待網(wǎng)絡(luò)收斂時即可使用其檢測新圖片。
[0023]缺點:訓(xùn)練樣本數(shù)量很少,容易產(chǎn)生過擬合,會導(dǎo)致在訓(xùn)練集準(zhǔn)確率很高而在測試集準(zhǔn)確率很低的情況。
【發(fā)明內(nèi)容】
[0024]本發(fā)明要解決的技術(shù)問題是:基于上述問題,本發(fā)明提供一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)色情圖像檢測方法,以便在海量網(wǎng)絡(luò)圖片中準(zhǔn)確快速的檢測出色情圖像。
[0025]本發(fā)明解決其技術(shù)問題所采用的一個技術(shù)方案是:一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)色情圖像檢測方法,包括以下步驟:
[0026](I)通過人工標(biāo)定的方法獲取色情圖像與正常圖像,對這些圖像進(jìn)行預(yù)處理與增強,獲得有效的方形訓(xùn)練圖像;
[0027](2)將步驟(I)獲得的有效的方形訓(xùn)練圖像送入深層卷積神經(jīng)網(wǎng)絡(luò)中來訓(xùn)練網(wǎng)絡(luò);
[0028](3)將步驟⑵得到的網(wǎng)絡(luò)模型在驗證集上進(jìn)行驗證,根據(jù)結(jié)果調(diào)整訓(xùn)練集并繼續(xù)訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò);
[0029](4)重復(fù)步驟(3)直至在驗證集上的檢測準(zhǔn)確率達(dá)到預(yù)期目標(biāo)或者網(wǎng)絡(luò)損失函數(shù)開始收斂;
[0030](5)將訓(xùn)練好的網(wǎng)絡(luò)在測試集上進(jìn)行測試。
[0031]進(jìn)一步地,步驟(I)中增強獲得有效的方形訓(xùn)練圖像對獲得的方形圖像進(jìn)行多種變換以增強訓(xùn)練數(shù)據(jù)的個數(shù),具體方法為:對圖像進(jìn)行轉(zhuǎn)置和水平鏡像翻轉(zhuǎn);在0.5?1.5之間隨機(jī)選取4個值作為方差對圖像進(jìn)行高斯模糊,再隨機(jī)選擇4個值作為因子乘以所有像素進(jìn)行亮度變換;進(jìn)行圖像增強,輕微地依次改變原圖像R,G, B三個通道的值;并對圖片添加隨機(jī)噪聲。
[0032]進(jìn)一步地,步驟(2)中深層卷積神經(jīng)網(wǎng)絡(luò)共有10層,從左至右分別為5個卷積層、4個全連接層和I個softmax層。
[0033]進(jìn)一步地,訓(xùn)練網(wǎng)絡(luò)是將5個卷積層和3個全連接層這前八層網(wǎng)絡(luò)作為現(xiàn)有的圖像大分類公開數(shù)據(jù)集的分類模型進(jìn)行分類,具體方法為:當(dāng)前八層網(wǎng)絡(luò)對于其它大分類數(shù)據(jù)集效果滿足要求時,直接把這八層網(wǎng)絡(luò)的參數(shù)迀移到色情圖像檢測的網(wǎng)絡(luò)上進(jìn)行參數(shù)微調(diào)。
[0034]本發(fā)明的有益效果是:提出一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的色情圖像檢測方法,使其能夠通過單一模型快速準(zhǔn)確的檢測出幾乎所有類型的色情圖像,實際測試中本發(fā)明的檢測準(zhǔn)確率達(dá)到98.6%以上;通過迀移訓(xùn)練的方式解決色情圖像訓(xùn)練樣本不足所造成的深層網(wǎng)絡(luò)效果下降的問題。
【附圖說明】
[0035]下面結(jié)合附圖對本發(fā)明進(jìn)一步說明。
[0036]圖1是本發(fā)明的【背景技術(shù)】中用來解釋目前存在的方法缺陷的圖組;
[0037]圖2是本發(fā)明的整體流程圖;
[0038]圖3是本發(fā)明的訓(xùn)練階段有效數(shù)據(jù)獲取與快速掃描測試圖像方法;
[0039]圖4是本發(fā)明的訓(xùn)練圖像增強的方法;
[0040]圖5是本發(fā)明的深層卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
【具體實施方式】
[0041]現(xiàn)在結(jié)合具體實施例對本發(fā)明作進(jìn)一步說明,以下實施例旨在說明本發(fā)明而不是對本發(fā)明的進(jìn)一步限定。
[0042]一、有效訓(xùn)練圖像數(shù)據(jù)的獲取與增強
[0043](I)通過人工標(biāo)定的方法獲得3300張色情圖片與5300張正常圖片,將這些圖片分為四個圖像集:訓(xùn)練集(1500張色情,3500張正常),輔助訓(xùn)練集(800張色情,800張正常),驗證集(500張色情,500張正常),測試集(500張色情,500張正常);
[0044](2)對訓(xùn)練集、輔助訓(xùn)練集兩個圖像集進(jìn)行有效訓(xùn)練區(qū)域獲取與數(shù)據(jù)增強
[0045]I)有效訓(xùn)練區(qū)域獲取(如圖3 (a)所示)
[0046]A.將這些圖片的短邊縮放為227像素,另一邊按原始圖像比例變化,每一幅圖片都變?yōu)?27*N或N*227像素的圖像;
[0047]B.對于正常圖像只需隨機(jī)選取1