基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法
【專利摘要】本發(fā)明公開了一種基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測的方法。此方法由三個有效步驟組成:1)利用深度玻爾茲曼機(jī)模型對大量違禁商品圖片樣本以及負(fù)樣本進(jìn)行訓(xùn)練,得到較好的檢測模型初始化參數(shù),即違禁商品檢測方法判別特征;2)利用反饋神經(jīng)網(wǎng)絡(luò)模型對步驟1)中所得參數(shù)進(jìn)行微調(diào),得到檢測模型的最終參數(shù);3)利用滑動窗口方法,對檢測圖片進(jìn)行多尺度縮放,在不同尺度下進(jìn)行滑動窗口操作,利用步驟2)中得到的模型檢測每個窗口中是否存在違禁商品,最終判定待檢測圖片中是否包含違禁商品。通過DBM模型訓(xùn)練圖像樣本的過程,能夠在保證訓(xùn)練速度的同時提取對數(shù)據(jù)有更本質(zhì)刻畫的特征,進(jìn)而保證了目標(biāo)檢測的準(zhǔn)確率和召回率。
【專利說明】基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計算機(jī)視覺領(lǐng)域,涉及電商網(wǎng)站中違禁商品圖片檢測方法。
【背景技術(shù)】
[0002] 隨著電子商務(wù)的高速發(fā)展,越來越多的商品可以進(jìn)行網(wǎng)上交易,一些法律違禁商 品,也在電子商務(wù)平臺上日益活躍,如槍支、刀具、藥品等。為了逃避法律責(zé)任追究,販賣違 禁商品的賣家往往不會直接在商品名稱上標(biāo)注槍支、刀具等,而是將所賣物品以圖片方式 呈現(xiàn),給清查過程帶來很大難度,在目前的工業(yè)應(yīng)用中也沒有成熟的方法。因此,電商網(wǎng)站 中違禁商品圖片檢測成為一個急需解決的問題。
[0003] 傳統(tǒng)的圖片檢測方法,特征提取都是基于淺層學(xué)習(xí),使用深度學(xué)習(xí)方法進(jìn)行圖片 檢測的研究很少。與淺層學(xué)習(xí)相比,深度學(xué)習(xí)能夠提取更好的圖片特征,對數(shù)據(jù)有更本質(zhì)的 刻畫,從而更利于圖片的分類。
[0004] 玻爾茲曼機(jī)是深度學(xué)習(xí)的一個典型應(yīng)用。深度玻爾茲曼機(jī)(DBM, Deep Boltzmann Machine)模型是多個限制玻爾茲曼機(jī)(RBM,Restricted Boltzmann Machine)模型的疊加。 RBM模型是一個兩層結(jié)構(gòu)、對稱連接、層內(nèi)無連接、層間全連接的無自反饋的隨機(jī)神經(jīng)網(wǎng)絡(luò) 模型,包括可見層和隱層。RBM模型在給定可見層(輸入數(shù)據(jù))時,各個隱層節(jié)點(diǎn)的激活概率 相互獨(dú)立;反之,在給定隱層時,各個可見層節(jié)點(diǎn)的激活概率相互獨(dú)立。多個RBM模型堆疊: 前一個RBM的隱層作為后一個RBM的可見層,構(gòu)成DBM模型。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的主要目的是針對電商網(wǎng)站中出現(xiàn)的各類違禁商品圖片,利用深度玻爾茲 曼機(jī)模型實(shí)現(xiàn)一種簡單有效的檢測方法,在保證訓(xùn)練時間不大幅增加的基礎(chǔ)上,提升違禁 商品圖片檢測的準(zhǔn)確率。
[0006] 本發(fā)明提供了一種基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,包括 以下步驟: 1)采集圖片數(shù)據(jù),對圖片數(shù)據(jù)進(jìn)行預(yù)處理。
[0007] 2)構(gòu)建DBM模型,確定模型的層數(shù),可見層、隱層節(jié)點(diǎn)數(shù)目。
[0008] 3)訓(xùn)練DBM模型。
[0009] 4)利用反向傳播算法對步驟3)得到的DBM模型初始化參數(shù)微調(diào)。
[0010] 5 )利用滑動窗口方法在待檢測圖片上檢測違禁商品,統(tǒng)計待檢測圖片的所有尺度 所有窗口的判定結(jié)果,判斷待檢測圖片中是否含有違禁商品,以及違禁商品位置。
[0011] 所述的違禁商品圖片檢測方法適用于各類目標(biāo)的檢測,針對不同的檢測目標(biāo),采 集不同的圖片數(shù)據(jù)。
[0012] 所述的采集圖片數(shù)據(jù),以刀具檢測為例。圖片大小為200*200像素,刀具占據(jù)圖片 內(nèi)容主體部分,圖片數(shù)目10000張。
[0013] 所述的圖片數(shù)據(jù)預(yù)處理方法是將每張圖片切分為只包含違禁商品的部分和只包 含背景的部分,統(tǒng)一縮放為28*28像素大小的灰度圖片。只包含刀具的灰度圖片作為模型 輸入的正樣本,只包含背景的灰度圖片作為模型輸入的負(fù)樣本。取5000張的正樣本和同等 數(shù)目的負(fù)樣本作為模型的訓(xùn)練集,取1500張的正樣本和同等數(shù)目的負(fù)樣本作為模型的測 試集。
[0014] 所述的構(gòu)建DBM模型包括設(shè)置DBM模型層數(shù),可見層、隱層節(jié)點(diǎn)數(shù)目。DBM層數(shù) 越多,模型泛化能力越強(qiáng),但訓(xùn)練耗時也越多,兼顧模型精度和訓(xùn)練時間,將DBM模型層數(shù) 設(shè)置為3層;DBM模型可見層節(jié)點(diǎn)由圖片樣本本身28*28=784個像素以及圖片中心區(qū)域 10*10=100個像素的組合構(gòu)成,共884個節(jié)點(diǎn),我們認(rèn)為,樣本圖片的中心區(qū)域包含的信息 比邊緣區(qū)域更豐富,疊加后能夠增加中心區(qū)域部分的權(quán)重,利于DBM模型從圖片樣本中提 取更魯棒的特征;DBM模型隱層1節(jié)點(diǎn)數(shù)目為3000個,相當(dāng)于將884個節(jié)點(diǎn)的可見層映射 到3000個節(jié)點(diǎn)的隱層中,將可見層進(jìn)一步展開,可以發(fā)現(xiàn)更多信息;隱層2節(jié)點(diǎn)數(shù)目為450 個,相當(dāng)于對隱層1結(jié)果進(jìn)行采樣,從中總結(jié)出有用信息。
[0015] 所述的訓(xùn)練DBM模型是采用吉布斯交叉采樣方法逐層訓(xùn)練,迭代次數(shù)為70次。 [0016] 所述的DBM模型初始化參數(shù)微調(diào)是在DBM模型第二層隱層上增加2個節(jié)點(diǎn)的輸出 層,表示當(dāng)前可見層接受的輸入數(shù)據(jù)樣本的所屬類別,采用反向傳播算法以及訓(xùn)練集、測試 集數(shù)據(jù)對DBM模型進(jìn)行迭代訓(xùn)練,迭代次數(shù)為50次,得到DBM模型的最終參數(shù),即違禁商品 圖片檢測的判別特征。
[0017] 所述的滑動窗口方法是將待檢測圖片縮放到不同尺度,分別進(jìn)行滑動窗口操作。 滑動窗口大小設(shè)置為28*28,與DBM模型訓(xùn)練集、測試集樣本大小一致,滑動窗口步長設(shè)置 為2個像素,每次將滑動窗口中的圖片內(nèi)容轉(zhuǎn)換為灰度圖,作為DBM模型的可見層輸入,結(jié) 合微調(diào)后的參數(shù),計算輸出層結(jié)果,判定該窗口中當(dāng)前圖片部分是否是刀具。
[0018] 本發(fā)明在保證訓(xùn)練時間不大幅增加的基礎(chǔ)上,提升了圖片檢測的準(zhǔn)確率。
【專利附圖】
【附圖說明】
[0019] 圖1是本發(fā)明一種基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法流程 圖。
[0020] 圖2是深度玻爾茲曼機(jī)模型結(jié)構(gòu)圖。
[0021] 圖3是檢測違禁商品圖片結(jié)果示意圖。
【具體實(shí)施方式】
[0022] 下面結(jié)合本發(fā)明中的附圖,對本發(fā)明的技術(shù)方案進(jìn)行清晰、完整地描述?;诒?發(fā)明的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做創(chuàng)造性勞動的前提下所獲得的所有其他實(shí)施 例,都屬于本發(fā)明保護(hù)的范圍。
[0023] 本發(fā)明提供了一種基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,圖1 展示了該方法的整體流程。基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法具體實(shí) 施步驟如下: 步驟1,采集圖片數(shù)據(jù),對圖片數(shù)據(jù)進(jìn)行預(yù)處理。以刀具檢測為例,采集圖片數(shù)據(jù)為刀 具圖片,圖片大小為200*200像素。每張圖片中違禁商品占據(jù)圖片內(nèi)容主體部分,圖片數(shù) 目10000張。將每張圖片切分為只包含違禁商品的部分和只包含背景的部分,統(tǒng)一縮放為 28*28大小的灰度圖片。只包含違禁商品的灰度圖片作為模型輸入的正樣本,只包含背景的 灰度圖片作為模型輸入的負(fù)樣本。取5000張正樣本和同等數(shù)目的負(fù)樣本作為模型的訓(xùn)練 集,取1500張正樣本和同等數(shù)目的負(fù)樣本作為模型的測試集。
[0024] 步驟2,構(gòu)建DBM模型。如圖2矩形框內(nèi)模型結(jié)構(gòu)所示,設(shè)定DBM模型層數(shù)為3層, 可見層節(jié)點(diǎn)數(shù)為884個,隱層1節(jié)點(diǎn)數(shù)為3000個,隱層2節(jié)點(diǎn)數(shù)目為450個。層與層之間 無向全連接,層內(nèi)無連接。
[0025] 步驟3,訓(xùn)練DBM模型。采用吉布斯交叉采樣方法對DBM模型逐層訓(xùn)練,迭代次數(shù) 為70次,得到模型初始化參數(shù)。
[0026] 步驟4,利用反向傳播算法對步驟3得到的DBM模型的初始化參數(shù)微調(diào)。在DBM模 型隱層2上增加包含2個節(jié)點(diǎn)的輸出層,如圖2中頂部的2個節(jié)點(diǎn),表示當(dāng)前可見層接受的 輸入數(shù)據(jù)樣本的所屬類別,采用反向傳播算法以及訓(xùn)練集、測試集數(shù)據(jù)對DBM模型進(jìn)行迭 代訓(xùn)練,迭代次數(shù)為50次,得到DBM模型的最終參數(shù),即違禁商品圖片檢測的判別特征。
[0027] 步驟5,利用滑動窗口方法在待檢測圖片上檢測違禁商品。將圖3中左側(cè)兩張圖片 作為待檢測圖片,縮放到不同尺度,分別進(jìn)行滑動窗口操作?;瑒哟翱诖笮≡O(shè)置為28*28, 與DBM模型訓(xùn)練集、測試集樣本大小一致,滑動窗口步長設(shè)置為2個像素,每次將滑動窗口 中的圖片內(nèi)容轉(zhuǎn)換為灰度圖,作為DBM模型的可見層輸入,結(jié)合微調(diào)后的參數(shù),計算輸出層 結(jié)果,判定該窗口中當(dāng)前圖片部分是否是違禁商品。然后統(tǒng)計待測圖片所有滑動窗口結(jié)果, 判斷待檢測圖片中是否含有違禁商品,以及違禁商品位置。檢測結(jié)果如圖3中右側(cè)兩張圖 片所示,圖片中違禁商品被識別出并用紅色矩形框標(biāo)識。
[0028] 最后,以上所述僅為本發(fā)明較有代表性的實(shí)施例。本領(lǐng)域的普通技術(shù)人員可在不 脫離本發(fā)明的發(fā)明思想情況下,對上述實(shí)施例做出種種修改或變化,因而本發(fā)明的保護(hù)范 圍并不被上述實(shí)施例所限,而應(yīng)該是符合權(quán)利要求數(shù)提到的創(chuàng)新性特征的最大范圍。
【權(quán)利要求】
1. 基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其特征在于該方法包括 如下步驟: 1) 采集圖片數(shù)據(jù),對圖片數(shù)據(jù)進(jìn)行預(yù)處理; 2) 構(gòu)建DBM模型,確定模型的層數(shù),可見層、隱層節(jié)點(diǎn)數(shù)目; 3) 訓(xùn)練DBM模型; 4) 利用反向傳播算法對步驟3)得到的DBM模型初始化參數(shù)微調(diào); 5 )利用滑動窗口方法在待檢測圖片上檢測違禁商品,統(tǒng)計待檢測圖片的所有尺度所有 窗口的判定結(jié)果,判斷待檢測圖片中是否含有違禁商品,以及違禁商品位置。
2. 根據(jù)權(quán)利要求1所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:圖片數(shù)據(jù)預(yù)處理的方法為:將每張圖片切分為只包含違禁商品的部分和只包含 背景的部分,統(tǒng)一縮放為28*28像素大小的灰度圖片:只包含刀具的灰度圖片作為模型輸 入的正樣本,只包含背景的灰度圖片作為模型輸入的負(fù)樣本;取5000張的正樣本和同等數(shù) 目的負(fù)樣本作為模型的訓(xùn)練集,取1500張的正樣本和同等數(shù)目的負(fù)樣本作為模型的測試 集。
3. 根據(jù)權(quán)利要求1所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:所述的DBM模型層數(shù)設(shè)置為三層。
4. 根據(jù)權(quán)利要求3所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:三層結(jié)構(gòu)的DBM模型包含一個可見層和兩個隱層:可見層用于接受樣本輸入,隱 層用于擬合樣本分布。
5. 根據(jù)權(quán)利要求4所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:所述的DBM模型可見層節(jié)點(diǎn)由圖片樣本本身28*28 = 784個像素以及圖片中心 區(qū)域10*10=100個像素的組合構(gòu)成,共884個節(jié)點(diǎn)。
6. 根據(jù)權(quán)利要求4所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:DBM模型的三層節(jié)點(diǎn)數(shù)目如下:與可見層連接的第一隱層節(jié)點(diǎn)數(shù)目為3000個,與 第一隱層連接的第二隱層節(jié)點(diǎn)數(shù)目為450個。
7. 根據(jù)權(quán)利要求1所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:所述的訓(xùn)練DBM模型是采用吉布斯交叉采樣方法逐層訓(xùn)練,迭代次數(shù)為70次。
8. 根據(jù)權(quán)利要求1所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:所述的DBM模型初始化參數(shù)微調(diào)是在DBM模型第二隱層上增加一個包含2個節(jié) 點(diǎn)的輸出層,2個節(jié)點(diǎn)的輸出層,表示當(dāng)前可見層接受的輸入數(shù)據(jù)樣本的所屬類別,使用訓(xùn) 練集、測試集數(shù)據(jù),通過反向傳播算法對DBM模型進(jìn)行迭代訓(xùn)練,迭代次數(shù)為50次,得到DBM 模型的最終參數(shù),即違禁商品圖片檢測的判別特征。
9. 根據(jù)權(quán)利要求1所述的基于深度玻爾茲曼機(jī)的電商網(wǎng)站違禁商品圖片檢測方法,其 特征在于:所述的滑動窗口方法是將待檢測圖片縮放到不同尺度,分別進(jìn)行滑動窗口操作; 滑動窗口大小設(shè)置為28*28,與DBM模型訓(xùn)練集、測試集樣本大小一致,滑動窗口步長設(shè)置 為2個像素,每次將滑動窗口中的圖片轉(zhuǎn)換為灰度圖,作為DBM模型的可見層輸入,結(jié)合微 調(diào)后的參數(shù),計算輸出層結(jié)果,判定該窗口中當(dāng)前圖片部分是否是違禁商品。
【文檔編號】G06N3/02GK104063720SQ201410315984
【公開日】2014年9月24日 申請日期:2014年7月3日 優(yōu)先權(quán)日:2014年7月3日
【發(fā)明者】陳純, 阮瑩, 宋明黎, 張瑞, 周星辰, 卜佳俊 申請人:浙江大學(xué)