一種圖片檢測方法及設(shè)備的制造方法
【專利摘要】本申請的目的是提供一種圖片檢測方法及設(shè)備。與現(xiàn)有技術(shù)相比,本申請中的圖片檢測設(shè)備獲取已分別標(biāo)注圖片類型的多個訓(xùn)練圖片,其中,所述圖片類型包括正常類型或違禁類型;再基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測模型;并且,獲取所述圖片檢測模型所對應(yīng)的圖片檢測閾值;再利用所述圖片檢測模型及所述圖片檢測閾值確定第一圖片的圖片類型。本申請能夠高效、準(zhǔn)確地識別待檢測圖片的圖片類型,有效縮短了圖片的審核時間,改善用戶的使用體驗(yàn)。
【專利說明】
-種圖片檢測方法及設(shè)備
技術(shù)領(lǐng)域
[0001] 本申請?jiān)O(shè)及計(jì)算機(jī)領(lǐng)域,尤其設(shè)及一種圖片檢測技術(shù)。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,圖片因其相對文字具有表達(dá)直觀、內(nèi)容豐富等優(yōu)勢,在越 來越多的網(wǎng)頁及應(yīng)用中被廣泛應(yīng)用。例如,網(wǎng)購平臺為各電商提供了各種商品信息發(fā)布機(jī) 審IJ,商家可W上傳多角度、多背景的商品照片,W吸引用戶。
[0003] 然而,在實(shí)際應(yīng)用中,一些商家為博取眼球效應(yīng),上傳的圖片不符合網(wǎng)購平臺甚至 法律的規(guī)定。若將運(yùn)類圖片予W展示不僅阻礙了用戶獲取所需信息,也浪費(fèi)了用戶寶貴的 帶寬資源、降低了用戶的屏幕利用率。顯然,鑒于互聯(lián)網(wǎng)的開放性本質(zhì),運(yùn)樣的情況將會持 續(xù)存在;而且,由于互聯(lián)網(wǎng)信息的爆發(fā)性,試圖通過人工來審核運(yùn)些圖片的陳列方式也是不 可行的。
[0004] 為此,現(xiàn)有技術(shù)中采用了 LLC(X〇calit}f-constrained Linear Coding,局部限制 的線性編碼)+liblinear (-個適用于大規(guī)模數(shù)據(jù)的線性分類庫)等方式對圖片進(jìn)行分類 訓(xùn)練和檢測。運(yùn)些方式主要是采用檢測特征顏色區(qū)域,包括顏色直方圖和梯度直方圖等對 圖片特征進(jìn)行描述與分析,再對圖片進(jìn)行分類。然而,現(xiàn)有的檢測方式只能夠識別一小部分 違禁類圖片(如色情圖片等),且會有很多圖片被誤殺。另外針對不同的應(yīng)用場景,現(xiàn)有技 術(shù)需要手工設(shè)計(jì)不同的顏色特征,運(yùn)個給工程師帶來了巨大的工作量。
【發(fā)明內(nèi)容】
陽0化]本申請的目的是提供一種的圖片檢測方法及設(shè)備。
[0006] 根據(jù)本申請的一個方面,提供了一種圖片檢測方法,包括:
[0007] 獲取已分別標(biāo)注圖片類型的多個訓(xùn)練圖片,其中,所述圖片類型包括正常類型或 違禁類型;
[000引基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測模型;
[0009] 獲取所述圖片檢測模型所對應(yīng)的圖片檢測闊值;
[0010] 利用所述圖片檢測模型及所述圖片檢測闊值確定第一圖片的圖片類型。
[0011] 根據(jù)本申請的另一方面,還提供了一種圖片檢測設(shè)備,其包括:
[0012] 第一裝置,用于獲取已分別標(biāo)注圖片類型的多個訓(xùn)練圖片,其中,所述圖片類型包 括正常類型或違禁類型;
[0013] 第二裝置,用于基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測模 型;
[0014] 第Ξ裝置,用于獲取所述圖片檢測模型所對應(yīng)的圖片檢測闊值;
[0015] 第四裝置,用于利用所述圖片檢測模型及所述圖片檢測闊值確定第一圖片的圖片 類型。
[0016] 與現(xiàn)有技術(shù)相比,本申請利用卷積神經(jīng)網(wǎng)絡(luò)建立圖片檢測模型,并根據(jù)圖片檢測 模型和圖片檢測闊值來檢測圖片的圖片類型,能夠高效、準(zhǔn)確地識別待檢測圖片的圖片類 型,有效縮短了圖片的審核時間,改善用戶的使用體驗(yàn)。
【附圖說明】
[0017] 通過閱讀參照W下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本申請的其它 特征、目的和優(yōu)點(diǎn)將會變得更明顯:
[0018] 圖1示出根據(jù)本申請一個方面的一種圖片檢測設(shè)備示意圖;
[0019] 圖2示出根據(jù)本申請一個優(yōu)選實(shí)施例的一種圖片檢測設(shè)備中第一裝置的示意圖;
[0020] 圖3示出根據(jù)本申請另一個優(yōu)選實(shí)施例的一種圖片檢測設(shè)備示意圖;
[0021] 圖4示出根據(jù)本申請另一個方面的一種圖片檢測方法流程圖;
[0022] 圖5示出根據(jù)本申請一個優(yōu)選實(shí)施例的一種圖片檢測方法中步驟S1的流程圖;
[0023] 圖6示出根據(jù)本申請另一個優(yōu)選實(shí)施例的一種圖片檢測方法流程圖。
[0024] 附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0025] 下面結(jié)合附圖對本申請作進(jìn)一步詳細(xì)描述。
[00%] 在本申請一個典型的配置中,終端、服務(wù)網(wǎng)絡(luò)的設(shè)備和可信方均包括一個或多個 處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
[0027] 內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲器,隨機(jī)存取存儲器(RAM)和/ 或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì) 的示例。
[0028] 計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可W由任何方法 或技術(shù)來實(shí)現(xiàn)信息存儲。信息可W是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。 計(jì)算機(jī)的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲器(SRAM)、 動態(tài)隨機(jī)存取存儲器值RAM)、其他類型的隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)、電 可擦除可編程只讀存儲器巧EPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器 (CD-ROM)、數(shù)字多功能光盤值VD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁盤存儲或其他磁性 存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可W被計(jì)算設(shè)備訪問的信息。按照本文中的 界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信 號和載波。
[0029] 圖1示出根據(jù)本申請一個方面的一種圖片檢測設(shè)備1,其中,所述圖片檢測設(shè)備1 包括:第一裝置11、第二裝置12、第Ξ裝置13和第四裝置14。具體地,所述第一裝置11用 于獲取已分別標(biāo)注圖片類型的多個訓(xùn)練圖片,其中,所述圖片類型包括正常類型或違禁類 型;所述第二裝置12用于基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測 模型;所述第Ξ裝置13用于獲取所述圖片檢測模型所對應(yīng)的圖片檢測闊值;所述第四裝置 14用于利用所述圖片檢測模型及所述圖片檢測闊值確定第一圖片的圖片類型。
[0030] 在此,所述圖片檢測設(shè)備1可由網(wǎng)絡(luò)主機(jī)、單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器集或 多個服務(wù)器構(gòu)成的云等實(shí)現(xiàn)。在此,云由基于云計(jì)算(Cloud Computing)的大量主機(jī)或網(wǎng) 絡(luò)服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散禪合的計(jì)算機(jī)集組成的一個 超級虛擬計(jì)算機(jī)。本領(lǐng)域技術(shù)人員應(yīng)能理解上述圖片檢測設(shè)備1僅為舉例,其他現(xiàn)有的或 今后可能出現(xiàn)的網(wǎng)絡(luò)設(shè)備如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W 引用方式包含于此。在此,所述圖片檢測設(shè)備1包括一種能夠按照事先設(shè)定或存儲的指令, 自動進(jìn)行數(shù)值計(jì)算和信息處理的電子設(shè)備,其硬件包括但不限于微處理器、專用集成電路 (ASIC)、可編程口陣列(FPGA)、數(shù)字處理器值SP)、嵌入式設(shè)備等。
[0031] 具體地,所述第一裝置11按照所述第二裝置12構(gòu)建圖片檢測模型所要求的尺寸、 格式等,通過http、https等約定通信方式遠(yuǎn)程調(diào)用、或通過本地讀取等方式獲取訓(xùn)練圖片 及所對應(yīng)的圖片類型。其中,所述圖片類型中的違禁類型包括但不限于:色情類型等。其 中,所述訓(xùn)練圖片可W是所存儲的源圖片,也可W是對源圖片進(jìn)行修剪之后所得到的圖片 等。所述第一裝置11按照預(yù)設(shè)的圖片類型的獲取比例來獲取各訓(xùn)練圖片。其中,所述獲取 比例可按照實(shí)際需要進(jìn)行設(shè)定。例如,所獲取的正常類型的圖片與違禁類型的圖片的數(shù)量 比例為l:n,其中,η大于1。
[0032] 為了得到更合適的訓(xùn)練圖片,所述第一裝置11還可W包括:第一一單元111和第 一二單元112。如圖2所示。具體地,所述第一一單元111用于獲取已分別標(biāo)注圖片類型的 多個樣本圖片,其中,所述圖片類型包括正常類型或違禁類型;所述第一二單元112用于對 每個樣本圖片進(jìn)行預(yù)處理W獲得對應(yīng)的訓(xùn)練圖片。
[0033] 在此,所述第一一單元111通過http、https等約定通信方式遠(yuǎn)程調(diào)用、或通過本 地讀取等方式獲取多個樣本圖片及相應(yīng)的圖片類型。由于所獲取的樣本圖片的尺寸、格式 等各不相同,則所述第一二單元112對每個樣本圖片進(jìn)行預(yù)處理,W得到符合預(yù)設(shè)規(guī)格、數(shù) 量等要求的各訓(xùn)練圖片。
[0034] 在此,所述第一二單元112對每個樣本圖片進(jìn)行預(yù)處理的方式包括:從所獲取的 樣本圖片中選取符合預(yù)設(shè)規(guī)格、數(shù)量等要求的圖片作為所述訓(xùn)練圖片。
[0035] 由于圖庫中的違禁類型的圖片的數(shù)量通常遠(yuǎn)小于正常類型的圖片的數(shù)量。為了得 到足夠多的違禁類型的訓(xùn)練圖片。所述第一二單元112還用于對標(biāo)注為違禁類型的每個樣 本圖片進(jìn)行變換擴(kuò)展。
[0036] 在此,所述第一二單元112對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行變換擴(kuò)展的方 式包括但不限于:1)將每個標(biāo)注有違禁類型的樣本圖片進(jìn)行平移,W得到新的樣本圖片。 例如,所述第一二單元112將標(biāo)注為違禁類型的樣本圖片沿著預(yù)設(shè)的X軸和y軸方向平行 移動,則所述第一二單元112的平移操作可W表示為兩二rand(-10,10),y"= rand(-10, 10),所得到的新的樣本圖片的各點(diǎn)像素值為:Inew(x,y) = I(x+xo, y+y。)。其中,X。表示 X軸方向的平移幅度,y。表示y軸方向的平移幅度。I (X,y)表示坐標(biāo)為(X,y)處圖像的像 素值,Inew(x,y)表示平移后坐標(biāo)為(X,y)處圖像的像素值。如果(X+X。,y+y。)超出原始 圖像區(qū)域,則所述第一二單元112用預(yù)設(shè)的像素值予W填充。由此,所述第一二單元112得 到了新的樣本圖片。
[0037] 2)通過對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行旋轉(zhuǎn),W得到新的樣本圖片。例如, 預(yù)設(shè)Θ = rand(-10,10),Θ表示對樣本圖片進(jìn)行逆時針旋轉(zhuǎn)的角度,所述第一二單元112 利用=R(e) 0l(x,y)公式,得到旋轉(zhuǎn)后的樣本圖片,其中0表示逆時針旋轉(zhuǎn)操 作。
[0038] 3)通過對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行模糊處理。其中,所述模糊處理的 方式包括但不限于:高斯濾波、均值濾波中的至少一種。例如,所述第一二單元112可僅選 擇高斯濾波或均值濾波來模糊處理所有標(biāo)注為違禁類型的樣本圖片。又如,所述第一二單 元112可隨機(jī)的選擇高斯濾波或均值濾波來模糊處理標(biāo)注為違禁類型的每個樣本圖片。
[0039] 為了處理不同尺寸和/或不同亮度的訓(xùn)練圖片,所述第一二單元112對每個樣本 圖片進(jìn)行預(yù)處理的方式還包括:對每個樣本圖片進(jìn)行歸一化處理W獲得對應(yīng)的訓(xùn)練圖片。
[0040] 具體地,所述歸一化處理的方式包括但不限于W下至少任一項(xiàng):1)將樣本圖片縮 放至預(yù)定分辨率。例如,所述第一二單元112將所得到的1024*768尺寸的樣本圖片縮成 256巧56尺寸的訓(xùn)練圖片。又如,所述第一二單元112將所獲取的157*124尺寸的樣本圖片 放大至256*256尺寸的訓(xùn)練圖片。2)對樣本圖片進(jìn)行減均值處理。例如,所述第一二單元 112先將所獲取的樣本圖片縮放至預(yù)定分辨率,再計(jì)算縮放后的所述樣本圖片的像素均值, 并將縮放后的所述樣本圖片的每個像素值與所述像素均值相減,由此來去除平均圖像對縮 放后的所述樣本圖片的干擾,并得到相應(yīng)的訓(xùn)練圖片。
[0041] 當(dāng)所述第一裝置11得到足夠多的標(biāo)注有圖片類型的訓(xùn)練圖片時,將各所述訓(xùn)練 圖片傳輸至所述第二裝置12。則所述第二裝置12基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò) 訓(xùn)練得對應(yīng)的圖片檢測模型。
[0042] 具體地,所述第二裝置12將所述各訓(xùn)練圖片送入預(yù)設(shè)的包含有多卷積層和多全 連接通層的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。其中,各卷積層包含卷積核。所述第二裝置12將每個所述 訓(xùn)練圖片在每一卷積層中提取的特征輸至下一卷積層,W提取更加高階的特征。再由所述 全連接通層將各卷積層逐層提取后得到的各特征按照對應(yīng)的圖片類型進(jìn)行連接分類處理, 由此得到關(guān)于標(biāo)注圖片類型的圖片檢測模型。其中,所述特征包括但不限于:訓(xùn)練圖片中的 特征向量、訓(xùn)練圖片中的特征信息等。
[0043] 在此,所述卷積神經(jīng)網(wǎng)絡(luò)優(yōu)選的包括:相級聯(lián)的五個卷積層、Ξ個全連接通層和一 個 Softmax 層。
[0044] 其中,每個所述卷積層的卷積操作相當(dāng)于矩陣乘法。例如,所述第二裝置12利用 公式1執(zhí)行各所述卷積層的操作。
[0045]
[0046] 其中fk表示第k個特征映射,其中,所述特征映射為所述卷積層所得到的特征與 圖片類型之間的映射關(guān)系。Wk表示第k個卷積核的參數(shù),每一個卷積核表示一種特征,在一 個卷積層中,可W包含多個卷積核。X表示上一層的特征。relu(x) = max (0, X)表示非線 性的神經(jīng)元函數(shù)。i和j分別表示所述第k個特征映射所在維度的序列編號。bk表示第k 個卷積核在執(zhí)行卷積運(yùn)算時的偏移量。
[0047] 更為優(yōu)選地,所述神經(jīng)網(wǎng)絡(luò)中還包括:設(shè)置在至少一個所述卷積層中的Max pooling (最大池化)。所述Max Pooling是對通過各卷積層得到的特征的下采樣操作。所 述Max Pooling的操作包括但不限于:平均池化操作,最大池化操作等。例如,在所述神 經(jīng)網(wǎng)絡(luò)中設(shè)置了最大池化操作,所述第二裝置12通過最大池化操作,不僅降低了特征的維 度,而且使得最終得到的圖片檢測模型具有了平移不變性質(zhì)。
[0048] 所述Max pooling可W設(shè)置在每個卷積層后,也可W選擇性的設(shè)置在部分卷積層 后。 W例例如,第一個卷積層包含kl個卷積核,每個卷積核大小為xlXylXzl,通過max pooling進(jìn)行降維,輸出為χΓ Xyl' ΧζΓ的特征映射。 W50] 第二個卷積層包含k2個卷積核,每個卷積核大小為x2Xy2Xz2,通過max pooling進(jìn)行降維,輸出為Xy2' Xz2'的特征映射。
[0051] 第Ξ個卷積層包含k3個卷積核,每個卷積核大小為x3Xy3Xz3,輸出為 x3' Xy3' Xz3'的特征映射。運(yùn)層不包含max pooling。 陽化2] 第四個卷積層包含k4個卷積核,每個卷積核大小為x4Xy4Xz4,輸出為 x4' Xy4' Xz4'的特征映射。運(yùn)層不包含max pooling。 W53] 第五個卷積層包含k5個卷積核,每個卷積核大小為巧X巧X巧,通過max pooling進(jìn)行降維,輸出為巧'X巧'X巧'的特征映射。其中,每個卷積層中的卷積核的數(shù) 量和大小按照實(shí)際需求來設(shè)置。
[0054] 所述神經(jīng)網(wǎng)絡(luò)中還可W進(jìn)一步的包括:歸一化層(Normalization層)。所述 Normalization層是將不同特征映射之間做歸一化操作。 陽化5] 例如,所述第二裝置12利用公式2來將相鄰的特征映射進(jìn)行歸一化操作。
[0056]
[0057] 其中,N,α,β為預(yù)設(shè)的常數(shù)參數(shù)。與?表示第k個特征映射。
[0058]
表示對相鄰特征映射之間進(jìn)行歸一化。
[0059] 所述全連接通層用于將兩所述卷積層中的各個節(jié)點(diǎn)(即特征)相互連接。當(dāng)所述 神經(jīng)網(wǎng)絡(luò)中包含五個卷積層時,則所述全連接通層對應(yīng)包含Ξ個。 W60] 例如,第一個全連接通層的含有al*bl個參數(shù),輸出為cl個節(jié)點(diǎn)(特征)的值。
[0061] 第二個全連接通層的含有曰2沖2個參數(shù),輸出為c2個節(jié)點(diǎn)(特征)的值。
[0062] 第Ξ個全連接通層的含有曰3沖3個參數(shù),輸出為c3個節(jié)點(diǎn)(特征)的值。其中, al〉a2〉a3, bl〉b2〉b3, cl〉c2〉c3。
[0063] 所述Softmax層設(shè)置在所述神經(jīng)網(wǎng)絡(luò)中的全連接通層之后。所述第二裝置12利 用所述Softmax層來將各特征映射按照圖片類型進(jìn)行分類。由此,所述第二裝置12構(gòu)建出 了基于圖片類型的圖片檢測模型,并啟動所述第Ξ裝置13來獲取所述圖片檢測模型所對 應(yīng)的圖片檢測闊值。
[0064] 在此,所述圖片檢測闊值可W是用于確定待檢測的第一圖片屬于違禁類型或正常 類型的概率。該圖片檢測闊值可W預(yù)先固定設(shè)置,所述第Ξ裝置13僅從預(yù)設(shè)的存儲單元予 W提取即可。 陽〇化]優(yōu)選地,所述第Ξ裝置13利用所述圖片檢測模型對已標(biāo)注圖片類型的第二圖片 進(jìn)行檢測,W獲得對應(yīng)的感受性曲線;再根據(jù)所述感受性曲線確定所述圖片檢測模型所對 應(yīng)的圖片檢測闊值。其中,所述第二圖片可W從各訓(xùn)練圖片中選取,也可W從圖庫中另行選 取。
[0066] 所述第Ξ裝置13將已標(biāo)注圖片類型的多個所述第二圖片輸入所述圖片檢測模 型,W得到對應(yīng)各圖片類型FP(假正類i^ilse positive)、FN(假負(fù)類false negative)、 ΤΡ(真正類True positive)、TN(真負(fù)類True negative)的概率,并得到相應(yīng)的感受性曲 線,例如,該感受性曲線的橫坐標(biāo)及縱坐標(biāo)分別對應(yīng)誤判率(例如F巧和準(zhǔn)確率(例如TP)。 接著,所述第Ξ裝置13根據(jù)所述感受性曲線確定所述圖片檢測模型中FP、FN、TP和/或 TN的圖片檢測闊值。例如,基于本方案所得到的某一感受性曲線,本領(lǐng)域技術(shù)人員可W把 FP(誤判率)控制在2%,從而得到模型的準(zhǔn)確率為80% ;因此,留給審核人員審核的只有 2%的運(yùn)部分?jǐn)?shù)據(jù),從而大幅降低了審核的工作量。
[0067] 當(dāng)用戶上傳待檢測的第一圖片時,所述第四裝置14獲取所述第一圖片,并送入所 述圖片檢測模型W得到所述第一圖片對應(yīng)各圖片類型的圖片檢測信息。其中,所述圖片檢 測信息包括但不限于:所述第一圖片對應(yīng)各圖片類型的檢測概率等。接著,所述第四裝置 14將所得到的圖片檢測信息與所述圖片檢測闊值進(jìn)行比較。
[0068] 當(dāng)所述圖片檢測信息滿足TP對應(yīng)的圖片檢測闊值,則所述第四裝置14認(rèn)定所述 第一圖片的圖片類型為正常類型。當(dāng)所述圖片檢測信息滿足FP對應(yīng)的圖片檢測闊值,則所 述第四裝置14認(rèn)定所述第一圖片的圖片類型為違禁類型。當(dāng)所述圖片檢測信息滿足TN或 FN對應(yīng)的圖片檢測闊值,則所述第四裝置14無法確定所述第一圖片的圖片類型,此時,所 述第四裝置14將所述第一圖片提供給更其他檢測設(shè)備或提供給人工處理,W便進(jìn)行更精 準(zhǔn)的確定。
[0069] 當(dāng)其他檢測設(shè)備或人工檢測完成后,將所述第四裝置14所提供的第一圖片的圖 片類型予W返回時,所述圖片檢測設(shè)備1還包括:第五裝置15 (如圖3所示),用于根據(jù)所 述第一圖片經(jīng)再檢測所確定的圖片類型,調(diào)整所述圖片檢測模型。
[0070] 具體地,所述第五裝置15將所述第一圖片和所得到的圖片類型提供給所述第一 裝置11。由所述第一裝置11對所述第一圖片進(jìn)行預(yù)處理W獲得相應(yīng)的訓(xùn)練圖片,并交由 所述第二裝置12 W便利用卷積神經(jīng)網(wǎng)絡(luò)繼續(xù)訓(xùn)練并調(diào)整了當(dāng)前的圖片檢測模型。在此,該 "再檢測"操作可W是人工完成的,也可W是其他圖片檢測應(yīng)用或工具完成的。本領(lǐng)域技術(shù) 人員應(yīng)能理解,通過對于該圖片檢測模型的輸出結(jié)果再檢測,并根據(jù)再檢測所獲得的圖片 類型信息來進(jìn)一步優(yōu)化該圖片檢測模型,從而在后續(xù)圖片檢測中可W獲得更好的檢測準(zhǔn)確 度。
[0071] 優(yōu)選地,為了提高所述圖片檢測模型的檢測精準(zhǔn)度,所述第二裝置12還可W根據(jù) 所述訓(xùn)練圖片的數(shù)量來調(diào)整調(diào)整學(xué)習(xí)率。其中,所述學(xué)習(xí)率表示梯度下降的速度。例如,初 始化的學(xué)習(xí)率設(shè)置為ratel,所述第二裝置12在迭代預(yù)設(shè)輪次W后,將其改為rate2, W此 類推。其中,ratel〉rate2。
[0072] 圖4示出根據(jù)本申請又一個方面的一種圖片檢測方法,其中,所述圖片檢測方法 主要由圖片檢測設(shè)備來執(zhí)行。所述圖片檢測方法包括:步驟S1、S2、S3和S4。具體地,在步 驟S1中,所述圖片檢測設(shè)備獲取已分別標(biāo)注圖片類型的多個訓(xùn)練圖片,其中,所述圖片類 型包括正常類型或違禁類型;在步驟S2中,所述圖片檢測設(shè)備基于所述多個訓(xùn)練圖片經(jīng)卷 積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測模型;在步驟S3中,所述圖片檢測設(shè)備獲取所述圖片檢 測模型所對應(yīng)的圖片檢測闊值;在步驟S4中,所述圖片檢測設(shè)備利用所述圖片檢測模型及 所述圖片檢測闊值確定第一圖片的圖片類型。
[0073] 在此,所述圖片檢測設(shè)備可由網(wǎng)絡(luò)主機(jī)、單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器集或多 個服務(wù)器構(gòu)成的云等實(shí)現(xiàn)。在此,云由基于云計(jì)算(Cloud Computing)的大量主機(jī)或網(wǎng)絡(luò) 服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散禪合的計(jì)算機(jī)集組成的一個超 級虛擬計(jì)算機(jī)。本領(lǐng)域技術(shù)人員應(yīng)能理解上述圖片檢測設(shè)備僅為舉例,其他現(xiàn)有的或今后 可能出現(xiàn)的網(wǎng)絡(luò)設(shè)備如可適用于本申請,也應(yīng)包含在本申請保護(hù)范圍W內(nèi),并在此W引用 方式包含于此。在此,所述圖片檢測設(shè)備包括一種能夠按照事先設(shè)定或存儲的指令,自動進(jìn) 行數(shù)值計(jì)算和信息處理的電子設(shè)備,其硬件包括但不限于微處理器、專用集成電路(ASIC)、 可編程口陣列(FPGA)、數(shù)字處理器值SP)、嵌入式設(shè)備等。
[0074] 具體地,所述圖片檢測設(shè)備按照欲構(gòu)建圖片檢測模型所要求的尺寸、格式等,通過 http、https等約定通信方式遠(yuǎn)程調(diào)用、或通過本地讀取等方式獲取訓(xùn)練圖片及所對應(yīng)的圖 片類型。其中,所述圖片類型中的違禁類型包括但不限于:色情類型等。其中,所述訓(xùn)練圖 片可W是所存儲的源圖片,也可W是對源圖片進(jìn)行修剪之后所得到的圖片等。所述圖片檢 測設(shè)備按照預(yù)設(shè)的圖片類型的獲取比例來獲取各訓(xùn)練圖片。其中,所述獲取比例可按照實(shí) 際需要進(jìn)行設(shè)定。例如,所獲取的正常類型的圖片與違禁類型的圖片的數(shù)量比例為l:n,其 中,η大于1。
[0075] 為了得到更合適的訓(xùn)練圖片,所述步驟S1還可W包括:步驟S11和步驟S12。如 圖5所示。具體地,在步驟S11中,所述圖片檢測設(shè)備獲取已分別標(biāo)注圖片類型的多個樣本 圖片,其中,所述圖片類型包括正常類型或違禁類型;在步驟S12中,所述圖片檢測設(shè)備對 每個樣本圖片進(jìn)行預(yù)處理W獲得對應(yīng)的訓(xùn)練圖片。
[0076] 在此,所述圖片檢測設(shè)備通過http、https等約定通信方式遠(yuǎn)程調(diào)用、或通過本地 讀取等方式獲取多個樣本圖片及相應(yīng)的圖片類型。由于所獲取的樣本圖片的尺寸、格式等 各不相同,則所述圖片檢測設(shè)備對每個樣本圖片進(jìn)行預(yù)處理,W得到符合預(yù)設(shè)規(guī)格、數(shù)量等 要求的各訓(xùn)練圖片。
[0077] 在此,所述圖片檢測設(shè)備對每個樣本圖片進(jìn)行預(yù)處理的方式包括:從所獲取的樣 本圖片中選取符合預(yù)設(shè)規(guī)格、數(shù)量等要求的圖片作為所述訓(xùn)練圖片。
[007引 由于圖庫中的違禁類型的圖片的數(shù)量通常遠(yuǎn)小于正常類型的圖片的數(shù)量。為了得 到足夠多的違禁類型的訓(xùn)練圖片。所述圖片檢測設(shè)備還對標(biāo)注為違禁類型的每個樣本圖片 進(jìn)行變換擴(kuò)展。
[0079] 在此,所述圖片檢測設(shè)備對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行變換擴(kuò)展的方式 包括但不限于:1)將每個標(biāo)注有違禁類型的樣本圖片進(jìn)行平移,W得到新的樣本圖片。例 如,所述圖片檢測設(shè)備將標(biāo)注為違禁類型的樣本圖片沿著預(yù)設(shè)的X軸和y軸方向平行移動, 則圖片檢測設(shè)備的平移操作可W表示為。。=rand (-10,10) · y。= rand (-10,10),所得到 的新的樣本圖片的各點(diǎn)像素值為:i"e?(x,y) = l(x+x。,y+y。)。其中,X。表示X軸方向的平 移幅度,y。表示y軸方向的平移幅度。I (X,y)表示坐標(biāo)為(X,y)處圖像的像素值,I。。"^, y)表示平移后坐標(biāo)為(X,y)處圖像的像素值。如果(X+X。,y+y。)超出原始圖像區(qū)域,則所 述第一二單元用預(yù)設(shè)的像素值予W填充。由此,所述圖片檢測設(shè)備得到了新的樣本圖片。
[0080] 2)通過對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行旋轉(zhuǎn),W得到新的樣本圖片。例如, 預(yù)設(shè)Θ = rand(-10,10),Θ表示對樣本圖片進(jìn)行逆時針旋轉(zhuǎn)的角度,所述圖片檢測設(shè)備利 用Inew(x,y) = R( Θ ) 0 I (x,y)公式,得到旋轉(zhuǎn)后的樣本圖片,其中0表示逆時針旋轉(zhuǎn)操 作。
[0081] 3)通過對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行模糊處理。其中,所述模糊處理的 方式包括但不限于:高斯濾波、均值濾波中的至少一種。例如,所述圖片檢測設(shè)備可僅選擇 高斯濾波或均值濾波來模糊處理所有標(biāo)注為違禁類型的樣本圖片。又如,所述圖片檢測設(shè) 備可隨機(jī)的選擇高斯濾波或均值濾波來模糊處理標(biāo)注為違禁類型的每個樣本圖片。
[0082] 為了從有限數(shù)量的樣本圖片中獲取足夠多的訓(xùn)練圖片,所述圖片檢測設(shè)備對每個 樣本圖片進(jìn)行預(yù)處理的方式還包括:對每個樣本圖片進(jìn)行歸一化處理W獲得對應(yīng)的訓(xùn)練圖 片。
[0083] 具體地,所述歸一化處理的方式包括但不限于W下至少任一項(xiàng):1)將樣本圖片 縮放至預(yù)定分辨率。例如,所述圖片檢測設(shè)備將所得到的1024*768尺寸的樣本圖片縮成 256巧56尺寸的訓(xùn)練圖片。又如,所述圖片檢測設(shè)備將所獲取的157*124尺寸的樣本圖片放 大至256*256尺寸的訓(xùn)練圖片。2)對樣本圖片進(jìn)行減均值處理。例如,所述圖片檢測設(shè)備 先將所獲取的樣本圖片縮放至預(yù)定分辨率,再計(jì)算縮放后的所述樣本圖片的像素均值,并 將縮放后的所述樣本圖片的每個像素值與所述像素均值相減,由此來去除平均圖像對縮放 后的所述樣本圖片的干擾,并得到相應(yīng)的訓(xùn)練圖片。
[0084] 當(dāng)所述圖片檢測設(shè)備得到足夠多的標(biāo)注有圖片類型的訓(xùn)練圖片后,執(zhí)行步驟S2, 即基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測模型。
[00化]具體地,所述圖片檢測設(shè)備將所述各訓(xùn)練圖片送入預(yù)設(shè)的包含有多卷積層和多全 連接通層的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。其中,各卷積層包含卷積核。所述圖片檢測設(shè)備將每個所述 訓(xùn)練圖片在每一卷積層中提取的特征輸至下一卷積層,W提取更加高階的特征。再由所述 全連接通層將各卷積層逐層提取后得到的各特征按照對應(yīng)的圖片類型進(jìn)行連接分類處理, 由此得到關(guān)于標(biāo)注圖片類型的圖片檢測模型。其中,所述特征包括但不限于:訓(xùn)練圖片中的 特征向量、訓(xùn)練圖片中的特征信息等。
[0086] 在此,所述卷積神經(jīng)網(wǎng)絡(luò)優(yōu)選的包括:相級聯(lián)的五個卷積層、Ξ個全連接通層和一 個 Softmax 層。
[0087] 其中,每個所述卷積層的卷積操作相當(dāng)于矩陣乘法。例如,所述圖片檢測設(shè)備利用 公式1執(zhí)行各所述卷積層的操作。
[0088]
[0089] 其中fk表示第k個特征映射,其中,所述特征映射為所述卷積層所得到的特征與 圖片類型之間的映射關(guān)系。Wk表示第k個卷積核的參數(shù),每一個卷積核表示一種特征,在一 個卷積層中,可W包含多個卷積核。X表示上一層的特征。relu(x) = max (0, X)表示非線 性的神經(jīng)元函數(shù)。i和j分別表示所述第k個特征映射所在維度的序列編號。bk表示第k 個卷積核在執(zhí)行卷積運(yùn)算時的偏移量。
[0090] 更為優(yōu)選地,所述神經(jīng)網(wǎng)絡(luò)中還包括:設(shè)置在至少一個所述卷積層中的Max pooling (最大池化)。所述Max Pooling是對通過各卷積層得到的特征的下采樣操作。所 述Max Pooling的操作包括但不限于:平均池操作,最大池化操作等。例如,在所述神經(jīng)網(wǎng) 絡(luò)中設(shè)置了最大池化操作,所述圖片檢測設(shè)備通過最大池化操作,不僅降低了特征的維度, 而且使得最終得到的圖片檢測模型具有了平移不變性質(zhì)。
[0091] 所述Max pooling可W設(shè)置在每個卷積層后,也可W選擇性的設(shè)置在部分卷積層 后。 陽092] 例如,第一個卷積層包含kl個卷積核,每個卷積核大小為xlXylXzl,通過max pooling進(jìn)行降維,輸出為χΓ Xyl' ΧζΓ的特征映射。 W93] 第二個卷積層包含k2個卷積核,每個卷積核大小為x2Xy2Xz2,通過max pooling進(jìn)行降維,輸出為x2' Xy2' Xz2'的特征映射。
[0094] 第Ξ個卷積層包含k3個卷積核,每個卷積核大小為x3Xy3Xz3,輸出為 x3' Xy3' Xz3'的特征映射。運(yùn)層不包含max pooling。
[0095] 第四個卷積層包含k4個卷積核,每個卷積核大小為x4Xy4Xz4,輸出為 x4' Xy4' Xz4'的特征映射。運(yùn)層不包含max pooling。 W96] 第五個卷積層包含k5個卷積核,每個卷積核大小為巧X巧X巧,通過max pooling進(jìn)行降維,輸出為巧' X巧' X巧'的特征映射。其中,每個卷積層中的卷積核的數(shù) 量和大小按照實(shí)際需求來設(shè)置。
[0097] 所述神經(jīng)網(wǎng)絡(luò)中還可W進(jìn)一步的包括:歸一化層(Normalization層)。所述 Normalization層是將不同特征映射之間做歸一化操作。
[009引例如,所述圖片檢測設(shè)備利用公式2來將相鄰的特征映射進(jìn)行歸一化操作。
[0099]
[0100] 其中,N,α,β為預(yù)設(shè)的常數(shù)參數(shù)。增隸示第k個特征映射。 陽101 ]
表示對相鄰特征映射之間進(jìn)行歸一化。 陽102] 所述全連接通層用于將兩所述卷積層中的各個節(jié)點(diǎn)(即特征)相互連接。當(dāng)所述 神經(jīng)網(wǎng)絡(luò)中包含五個卷積層時,則所述全連接通層對應(yīng)包含Ξ個。
[0103] 例如,第一個全連接通層的含有al*bl個參數(shù),輸出為cl個節(jié)點(diǎn)(特征)的值。
[0104] 第二個全連接通層的含有曰2沖2個參數(shù),輸出為c2個節(jié)點(diǎn)(特征)的值。
[01化]第Ξ個全連接通層的含有曰3沖3個參數(shù),輸出為c3個節(jié)點(diǎn)(特征)的值。其中, al〉a2〉a3, bl〉b2〉b3, cl〉c2〉c3。
[0106] 在所述神經(jīng)網(wǎng)絡(luò)中的全連接通層之后設(shè)置所述Softmax層設(shè)置在所述神經(jīng)網(wǎng)絡(luò) 中的全連接通層之后。所述圖片檢測設(shè)備利用所述Softmax層來將各特征映射按照圖片類 型進(jìn)行分類。由此,所述圖片檢測設(shè)備構(gòu)建出了基于圖片類型的圖片檢測模型,并執(zhí)行步驟 S3來獲取所述圖片檢測模型所對應(yīng)的圖片檢測闊值。 陽107] 在此,所述圖片檢測設(shè)備的第Ξ裝置獲取所述圖片檢測模型所對應(yīng)的圖片檢測闊 值可W是用于確定待檢測的第一圖片屬于違禁類型或正常類型的概率。該圖片檢測闊值的 方式包括可W預(yù)先固定設(shè)置,所述圖片檢測設(shè)備僅從預(yù)設(shè)的存儲單元予W提取即可。在所 述神經(jīng)網(wǎng)絡(luò)中的全連接通層之后設(shè)置一個Softmax (軟性核函數(shù))層,來確定用于檢測出屬 于違禁類型的圖片的圖片檢測闊值。 陽10引優(yōu)選地,所述圖片檢測設(shè)備利用所述圖片檢測模型對已標(biāo)注圖片類型的第二圖片 進(jìn)行檢測,W獲得對應(yīng)的R0C感受性曲線;再根據(jù)所述感受性曲線確定所述圖片檢測模型 所對應(yīng)的圖片檢測闊值。其中,所述第二圖片可W從各訓(xùn)練圖片中選取,也可W從圖庫中另 行選取。
[0109] 所述圖片檢測設(shè)備將已標(biāo)注圖片類型的多個所述第二圖片輸入所述圖片檢測模 型,W得到對應(yīng)各圖片類型FP(假正類i^ilse positive)、FN(假負(fù)類false negative)、 ΤΡ(真正類True positive)、TN(真負(fù)類True negative)的概率,并得到相應(yīng)的感受性曲 線,例如,該感受性曲線的橫坐標(biāo)及縱坐標(biāo)分別對應(yīng)誤判率(例如F巧和準(zhǔn)確率(例如TP)。 接著,所述圖片檢測設(shè)備根據(jù)所述感受性曲線確定所述圖片檢測模型中FP、FN、TP和/或 TN的圖片檢測闊值。例如,基于本方案所得到的某一感受性曲線,本領(lǐng)域技術(shù)人員可W把 FP(誤判率)控制在2%,從而得到模型的準(zhǔn)確率為80% ;因此,留給審核人員審核的只有 2%的運(yùn)部分?jǐn)?shù)據(jù),從而大幅降低了審核的工作量。
[0110] 當(dāng)用戶上傳待檢測的第一圖片時,所述圖片檢測設(shè)備獲取所述第一圖片,并送入 所述圖片檢測模型W得到所述第一圖片對應(yīng)各圖片類型的圖片檢測信息。其中,所述圖片 檢測信息包括但不限于:所述第一圖片對應(yīng)各圖片類型的檢測概率等。接著,所述圖片檢測 設(shè)備將所得到的圖片檢測信息與所述圖片檢測闊值進(jìn)行比較。 陽111] 當(dāng)所述圖片檢測信息滿足TP對應(yīng)的圖片檢測闊值,則所述圖片檢測設(shè)備認(rèn)定所 述第一圖片的圖片類型為正常類型。當(dāng)所述圖片檢測信息滿足FP對應(yīng)的圖片檢測闊值,貝U 所述圖片檢測設(shè)備認(rèn)定所述第一圖片的圖片類型為違禁類型。當(dāng)所述圖片檢測信息滿足 TN或FN對應(yīng)的圖片檢測闊值,則所述圖片檢測設(shè)備無法確定所述第一圖片的圖片類型,此 時,所述圖片檢測設(shè)備將所述第一圖片提供給更其他檢測設(shè)備或提供給人工處理,W便進(jìn) 行更精準(zhǔn)的確定。
[0112] 當(dāng)其他檢測設(shè)備或人工檢測完成后,將所述圖片檢測設(shè)備所提供的第一圖片的圖 片類型予W返回時,所述圖片檢測方法還包括:步驟S5。如圖6所示。
[0113] 在所述步驟S5中,所述圖片檢測設(shè)備根據(jù)所述第一圖片經(jīng)再檢測所確定的圖片 類型,調(diào)整所述圖片檢測模型。如圖6所示。
[0114] 具體地,所述圖片檢測設(shè)備將所述第一圖片進(jìn)行預(yù)處理W獲得相應(yīng)的訓(xùn)練圖片, 并輸入卷積神經(jīng)網(wǎng)絡(luò)繼續(xù)訓(xùn)練并調(diào)整了當(dāng)前的圖片檢測模型。在此,該"再檢測"操作可W 是人工完成的,也可W是其他圖片檢測應(yīng)用或工具完成的。本領(lǐng)域技術(shù)人員應(yīng)能理解,通過 對于該圖片檢測模型的輸出結(jié)果再檢測,并根據(jù)再檢測所獲得的圖片類型信息來進(jìn)一步優(yōu) 化該圖片檢測模型,從而在后續(xù)圖片檢測中可W獲得更好的檢測準(zhǔn)確度。
[0115] 優(yōu)選地,為了提高所述圖片檢測模型的檢測精準(zhǔn)度,所述圖片檢測設(shè)備還可W根 據(jù)所述訓(xùn)練圖片的數(shù)量來調(diào)整調(diào)整學(xué)習(xí)率。其中,所述學(xué)習(xí)率表示梯度下降的速度。例如, 初始化的學(xué)習(xí)率設(shè)置為ratel,所述圖片檢測設(shè)備在迭代預(yù)設(shè)輪次W后,將其改為rate2, W此類推。其中,ratel〉rate2。
[0116] 綜上所述,本申請的圖片檢測方法及設(shè)備,利用卷積神經(jīng)網(wǎng)絡(luò)建立圖片檢測模型, 再利用所述圖片檢測模型和圖片檢測闊值來檢測圖片的圖片類型,能夠高效、準(zhǔn)確地識別 待檢測圖片的圖片類型,有效縮短了圖片的審核時間,改善用戶的使用體驗(yàn)。
[0117] 與現(xiàn)有技術(shù)相比,本申請的誤判率顯著降低(如表1所示)。 陽1化]表1 陽119]
[0120] 另外,本申請對所獲取的樣本圖片進(jìn)行歸一化處理,有利于建模時對訓(xùn)練圖片的 統(tǒng)一處理,實(shí)現(xiàn)了使用較少的樣本圖片的數(shù)量來獲得足夠多的訓(xùn)練圖片,提高建模效率。 陽121] 還有,采用五層卷積層和Ξ層全連通層來進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,能夠有效提高圖片 檢測模型的準(zhǔn)確性;此外,將未能利用所述圖片檢測模型檢測出圖片類型的圖片作為訓(xùn)練 圖片,能夠有效調(diào)整所述圖片檢測模型,提高所述圖片檢測模型今后的識別正確率。所W, 本申請有效克服了現(xiàn)有技術(shù)中的種種缺點(diǎn)而具高度產(chǎn)業(yè)利用價值。
[0122] 對于本領(lǐng)域技術(shù)人員而言,顯然本申請不限于上述示范性實(shí)施例的細(xì)節(jié),而且在 不背離本申請的精神或基本特征的情況下,能夠W其他的具體形式實(shí)現(xiàn)本申請。因此,無論 從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本申請的范圍由所附權(quán) 利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有 變化涵括在本申請內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所設(shè)及的權(quán)利要求。此 夕F,顯然"包括"一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多 個單元或裝置也可W由一個單元或裝置通過軟件或者硬件來實(shí)現(xiàn)。第一,第二等詞語用來 表示名稱,而并不表示任何特定的順序。
【主權(quán)項(xiàng)】
1. 一種圖片檢測方法,包括: 獲取已分別標(biāo)注圖片類型的多個訓(xùn)練圖片,其中,所述圖片類型包括正常類型或違禁 類型; 基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測模型; 獲取所述圖片檢測模型所對應(yīng)的圖片檢測閾值; 利用所述圖片檢測模型及所述圖片檢測閾值確定第一圖片的圖片類型。2. 根據(jù)權(quán)利要求1所述的方法,其中,所述獲取所述圖片檢測模型所對應(yīng)的圖片檢測 閾值包括: 利用所述圖片檢測模型對已標(biāo)注圖片類型的第二圖片進(jìn)行檢測,以獲得對應(yīng)的感受性 曲線; 根據(jù)所述感受性曲線確定所述圖片檢測模型所對應(yīng)的圖片檢測閾值。3. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述利用所述圖片檢測模型及所述圖片檢測 閾值確定第一圖片的圖片類型包括: 利用所述圖片檢測模型對第一圖片進(jìn)行檢測以獲得對應(yīng)的圖片檢測信息; 將所述圖片檢測信息與所述圖片檢測閾值相比較,以確定第一圖片的圖片類型。4. 根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,該方法還包括: 根據(jù)所述第一圖片經(jīng)再檢測所確定的圖片類型,調(diào)整所述圖片檢測模型。5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其中,所述獲取已分別標(biāo)注圖片類型的多 個訓(xùn)練圖片包括: 獲取已分別標(biāo)注圖片類型的多個樣本圖片,其中,所述圖片類型包括正常類型或違禁 類型; 對每個樣本圖片進(jìn)行預(yù)處理以獲得對應(yīng)的訓(xùn)練圖片。6. 根據(jù)權(quán)利要求5所述的方法,其中,所述對每個樣本圖片進(jìn)行預(yù)處理以獲得對應(yīng)的 訓(xùn)練圖片包括: 對每個樣本圖片進(jìn)行歸一化處理以獲得對應(yīng)的訓(xùn)練圖片。7. 根據(jù)權(quán)利要求6所述的方法,其中,所述歸一化處理包括以下至少任一項(xiàng): 將樣本圖片縮放至預(yù)定分辨率; 對樣本圖片進(jìn)行減均值處理。8. 根據(jù)權(quán)利要求5至7中任一項(xiàng)所述的方法,其中,所述對每個樣本圖片進(jìn)行預(yù)處理以 獲得對應(yīng)的訓(xùn)練圖片還包括: 對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行變換擴(kuò)展以得到多個訓(xùn)練圖片。9. 根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法,其中,所述卷積神經(jīng)網(wǎng)絡(luò)包括相級聯(lián)的五 個卷積層、三個全連接通層及一個Softmax層。10. -種圖片檢測設(shè)備,包括: 第一裝置,用于獲取已分別標(biāo)注圖片類型的多個訓(xùn)練圖片,其中,所述圖片類型包括正 常類型或違禁類型; 第二裝置,用于基于所述多個訓(xùn)練圖片經(jīng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練得對應(yīng)的圖片檢測模型; 第三裝置,用于獲取所述圖片檢測模型所對應(yīng)的圖片檢測閾值; 第四裝置,用于利用所述圖片檢測模型及所述圖片檢測閾值確定第一圖片的圖片類 型。11. 根據(jù)權(quán)利要求10所述的設(shè)備,其中,所述第三裝置用于: 利用所述圖片檢測模型對已標(biāo)注圖片類型的第二圖片進(jìn)行檢測,以獲得對應(yīng)的感受性 曲線; 根據(jù)所述感受性曲線確定所述圖片檢測模型所對應(yīng)的圖片檢測閾值。12. 根據(jù)權(quán)利要求10或11所述的設(shè)備,其中,所述第四裝置用于: 利用所述圖片檢測模型對第一圖片進(jìn)行檢測以獲得對應(yīng)的圖片檢測信息; 將所述圖片檢測信息與所述圖片檢測閾值相比較,以確定第一圖片的圖片類型。13. 根據(jù)權(quán)利要求10至12中任一項(xiàng)所述的設(shè)備,其中,該設(shè)備還包括: 第五裝置,用于根據(jù)所述第一圖片經(jīng)再檢測所確定的圖片類型,調(diào)整所述圖片檢測模 型。14. 根據(jù)權(quán)利要求10至13中任一項(xiàng)所述的設(shè)備,其中,所述第一裝置包括: 第一一單元,用于獲取已分別標(biāo)注圖片類型的多個樣本圖片,其中,所述圖片類型包括 正常類型或違禁類型; 第一二單元,用于對每個樣本圖片進(jìn)行預(yù)處理以獲得對應(yīng)的訓(xùn)練圖片。15. 根據(jù)權(quán)利要求14所述的設(shè)備,其中,所述第一二單元用于: 對每個樣本圖片進(jìn)行歸一化處理以獲得對應(yīng)的訓(xùn)練圖片。16. 根據(jù)權(quán)利要求15所述的設(shè)備,其中,所述歸一化處理包括以下至少任一項(xiàng): 將樣本圖片縮放至預(yù)定分辨率; 對樣本圖片進(jìn)行減均值處理。17. 根據(jù)權(quán)利要求14至16中任一項(xiàng)所述的設(shè)備,其中,所述第一二單元還用于: 對標(biāo)注為違禁類型的每個樣本圖片進(jìn)行變換擴(kuò)展以得到多個訓(xùn)練圖片。18. 根據(jù)權(quán)利要求10至17中任一項(xiàng)所述的設(shè)備,其中,所述卷積神經(jīng)網(wǎng)絡(luò)包括相級聯(lián) 的五個卷積層、三個全連接通層及一個Softmax層。
【文檔編號】G06K9/00GK105989330SQ201510055621
【公開日】2016年10月5日
【申請日】2015年2月3日
【發(fā)明人】陳岳峰
【申請人】阿里巴巴集團(tuán)控股有限公司