一種敏感圖像識別方法及系統的制作方法
【專利摘要】公開了一種敏感圖像識別方法及系統,屬于圖像識別【技術領域】,其特征在于,包括:步驟1.融合膚色檢測的網格劃分提取特征,并采用詞袋模型得到圖像的原始詞袋表示向量;步驟2.圖像特征優(yōu)化,利用隨機森林得到降維的優(yōu)化圖像向量表示;步驟3.識別模型訓練,利用一類支撐向量機,在優(yōu)化向量空間中訓練一類分類器;步驟4.圖像識別,圖像在步驟1所述的預處理階段中如果完全不含膚色像素,則直接被判別為正常圖像,否則經過處理得到優(yōu)化特征表示并進入訓練得到的一類分類模型,最終得到圖像的識別結果。本發(fā)明首次利用一類分類算法解決敏感圖像識別問題,在處理過程中融合了多種技術,并實施特征優(yōu)化處理,提高了敏感圖像識別的準確率和效率。
【專利說明】一種敏感圖像識別方法及系統
【技術領域】
[0001]本發(fā)明涉及圖像識別方法,尤其涉及一種融合膚色檢測與圖像詞袋表示的基于一類分類算法的敏感圖像識別方法與系統。
【背景技術】
[0002]傳統的敏感圖像檢測方法中,膚色檢測技術和模式識別方法被廣泛采用;其中,第一類流行的方法通過設計膚色檢測算法,計算圖像中的膚色區(qū)域的面積比例,并根據一定的閾值確定該圖像是否是敏感圖像,顯然,由于背景顏色、光照條件、圖像質量的影響,此類方法非常容易出現誤判和漏判,因此大部分的敏感圖像檢測算法將膚色檢測與模式識別方法結合起來,膚色檢測作為輔助手段。在這一類方法中,一般的步驟為:1)提取圖像特征;2)訓練分類模型;3)圖像識別。此前,幾乎所有的基于模式識別和機器學習的方法都將敏感圖像的識別問題視為一種二類分類問題:將圖像分為兩類,即敏感圖像和正常圖像,利用分類算法通過對這兩類圖像的訓練集進行學習,得到一個二類分類模型。然而,在二類分類模型中,敏感圖像的類型較為齊全,覆蓋了大部分種類的敏感圖像,但在真實互聯網環(huán)境下,正常圖像的類型是海量的,任何一種正常圖像的訓練集都無法涵蓋大部分的正常圖像類型。因此,在基于模式識別的方法中,將敏感圖像視為一種二類分類問題會導致數據不平衡,進而限制了模型的泛化能力。
[0003]在基于模式識別和機器學習的敏感圖像識別方法中,圖像的特征提取和圖像的向量表示是重要的步驟之一,有效的特征能大幅提高訓練出的模型的綜合性能。圖像特征提取的方法有多種,其中廣泛采用的方法有顏色特征、紋理特征、輪廓特征、局部區(qū)域特征等。在圖像的局部特征提取方法中,SIFT算法因其出色的性能,得到了最為廣泛的應用,但其缺點在于關鍵點的計算耗時較多。在機器視覺領域,一種有效的圖像向量表示方法是詞袋模型(Bag of Words Model, BoW),研究已經表明該模型可以有效地表示圖像,且廣泛應用于目標識別與圖像分類領域,取得了良好的效果。
[0004]此前,已經有基于詞袋模型的敏感圖像識別方法,但此類方法均基于二類分類算法,同時膚色信息較少考慮,算法的準確率和時間復雜性不理想,且算法的泛化能力有待提聞。
【發(fā)明內容】
[0005]有鑒于此,本發(fā)明提供了一種融合敏感圖像識別方法和系統,旨在實現更有效地檢測敏感圖像。本發(fā)明所述敏感圖像識別方法的特征在于:為了實現上述目的,本發(fā)明實施例提供了如下方案:
[0006]步驟(I).向所述計算機輸入如下圖像:
[0007]包含Iii1幅敏感圖像的第一敏感圖像子集PornSet I,所述敏感圖像是指能令人們感興趣的圖像,下同,
[0008]包含m2幅敏感圖像的第二敏感圖像子集PornSet2,[0009]包含πι3幅正常圖像的正常圖像子集NormalSet,
[0010]上述叫,m2, m3均為有限正整數;
[0011]步驟(2).把所述第一敏感圖像子集PornSetl的每幅敏感圖像劃分為MXN個網格,其中M, N均為有限正整數,每個網格大小為16X16像素;在每個網格中按以下步驟進行膚色檢測操作:
[0012]步驟(2.1).若所述第一敏感圖像子集PornSetl中的圖像中的像素在RGB顏色空間中的像素值r,g,b滿足以下條件,則認為所述網格中的該像素為膚色像素;下述的r,g,b值的取值區(qū)間為[0,255],
[0013]r > 90&g > 38&b > 18&|r-g| > 12,
[0014]{max {r, g, b} -min {r, g, b}} > 12&r > g&r > b,
[0015]步驟(2.2).若在所述各網格中所述膚色像素占全部像素的比例大于或等于閾值sg = 0.3,則確定該網格為疑似敏感子區(qū)域;
[0016]步驟(3).對所述第一敏感圖像子集PornSetl中的每幅圖像中的每個判定為所述疑似敏感子區(qū)域,在中心點周圍16X16像素的網格中采用尺度不變特征轉換SIFT特征描述子生成128維的特征向量,第一敏感圖像子集PornSetl的每幅圖像的所有疑似敏感子區(qū)域經過所述特征提取操作之后,得到包含R個特征向量的集合F=…,FJ;第一敏感圖像子集PornSetl中的全部圖像所有疑似敏感子區(qū)域的特征向量集合PornFeatureSetl,以下簡稱 PornFeatureSetl ;
[0017]步驟(4).按以下步驟計算所述第一敏感圖像子集PornSetl的每幅圖像的原始詞袋特征向量表示,
[0018]步驟(4.1).對所述第一敏感圖像子集PornSetl的特征向量集合PornFeatureSetl,按以下步驟執(zhí)行K均值聚類算法,得到能反映第一敏感圖像子集PornSetl中共同特征的一類視覺詞典:
[0019]步驟(4.1.1).設定:
[0020]η,所述第一敏感圖像子集PornSetl的特征向量集合PornFeatureSetl中的特征向量總數,
[0021]C,聚類數目,為設定量,C值為200,
[0022]C,聚類類別的序號,c = 1,2,…,C,…,C,
[0023],為序號為c的聚類S。中的第V。個特征向量,聚類S。中包含V。個特征向量,
Vc 1,2,...,Vcj...,Vc
[0024]μ。,為序號為c的聚類S。的聚類中心,即S。中的所有向量的平均值,
[0025]聚類準則函數為:
【權利要求】
1.一種敏感圖像識別方法,其特征在于,是在計算機中依次按以下步驟實現的: 步驟(1).向所述計算機輸入如下圖像: 包含IH1幅敏感圖像的第一敏感圖像子集PornSetl,所述敏感圖像是指能令人們感興趣的圖像,下同, 包含m2幅敏感圖像的第二敏感圖像子集PornSet2, 包含m3幅正常圖像的正常圖像子集NormalSet, 上述Hi1, m2, m3均為有限正整數; 步驟(2).把所述第一敏感圖像子集PornSetl的每幅敏感圖像劃分為MXN個網格,其中M,N均為有限正整數,每個網格大小為16X 16像素;在每個網格中按以下步驟進行膚色檢測操作: 步驟(2.1).若所述第一敏感圖像子集PornSetl中的圖像中的像素在RGB顏色空間中的像素值r,g,b滿足以下條件,則認為所述網格中的該像素為膚色像素;下述的r,g,b值的取值區(qū)間為[O, 255],
r > 90&g > 38&b > 18&|r-g > 12,
{max {r, g, b} -min {r, g, b}} > 12&r > g&r > b, 步驟(2.2).若在所述各網格中所述膚色像素占全部像素的比例大于或等于閾值Sg =.0.3,則確定該網格為疑似敏感子區(qū)域; 步驟(3).對所述第一敏感圖像子集PornSetl中的每幅圖像中的每個判定為所述疑似敏感子區(qū)域,在中心點周圍16X16像素的網格中采用尺度不變特征轉換SIFT特征描述子生成128維的特征向量,第一敏感圖像子集PornSetl的每幅圖像的所有疑似敏感子區(qū)域經過所述特征提取操作之后,得到包含R個特征向量的集合F = (F1, F2, Fr,..., Fj ;第一敏感圖像子集PornSetl中的全部圖像所有疑似敏感子區(qū)域的特征向量集合PornFeatureSetl,以下簡稱 PornFeatureSetl ; 步驟(4).按以下步驟計算所述第一敏感圖像子集PornSetl的每幅圖像的原始詞袋特征向量表示, 步驟(4.1).對所述第一敏感圖像子集PornSetl的特征向量集合PornFeatureSetl,按以下步驟執(zhí)行K均值聚類算法,得到能反映第一敏感圖像子集PornSetl中共同特征的一類視覺詞典: 步驟(4.1.1).設定: η,所述第一敏感圖像子集PornSetl的特征向量集合PornFeatureSetl中的特征向量總數, C,聚類數目,為設定量,C值為200, c,聚類類別的序號,c = I, 2,..., c,...,(:, S',為序號為c的聚類S。中的第V。個特征向量,聚類S。中包含V。個特征向量,
Vc = I 2.Vc 'V K
μ。,為序號為c的聚類S。的聚類中心,即S。中的所有向量的平均值,聚類準則函數為:
2.根據權利要求1所述的一種敏感圖像識別方法而得到的一種基于一類分類方法的敏感圖像識別系統,其特征在于,包括:圖像膚色檢測單元,用于確定圖像中的疑似敏感區(qū)域; 圖像特征提取單元,用于提取疑似敏感區(qū)域的局部特征; 圖像表示向量獲取單元,用于得到最終的優(yōu)化向量,供后續(xù)訓練與識別使用; 數據預備單元,用于準備后續(xù)分類模型訓練階段及識別階段的重要已知數據; 分類模型訓練單元,用于訓練一類識別模型,訓練樣本僅為敏感圖像; 圖像識別單元,通過調用包括特征檢測在內的各單元的功能如或已知數據以及訓練所得的決策函數,得到完整的圖像識別流程。
【文檔編號】G06K9/46GK103679132SQ201310301729
【公開日】2014年3月26日 申請日期:2013年7月15日 優(yōu)先權日:2013年7月15日
【發(fā)明者】劉毅, 肖創(chuàng)柏, 段娟, 卞春曉 申請人:北京工業(yè)大學