靜態(tài)圖片中葡萄酒瓶的檢測方法
【專利摘要】本發(fā)明公開了一種靜態(tài)圖片中葡萄酒瓶的檢測方法,包括訓練及檢測兩部分,訓練階段的步驟包括:制作葡萄酒瓶樣本;樣本特征計算以及訓練聯級分類器;檢測階段的步驟包括加載待測圖片;加載葡萄酒瓶分類器以及聯級葡萄酒瓶檢測。本發(fā)明通過對大量的葡萄酒瓶樣本,在提取Haar特征的基礎上,用AdaBoost方法訓練得出一個聯級分類器去檢測待測圖片中的葡萄酒瓶,這種方法能直接定位圖片中葡萄酒瓶所在,并不受環(huán)境的影響。
【專利說明】靜態(tài)圖片中葡萄酒瓶的檢測方法
【技術領域】
[0001]本發(fā)明屬于圖像識別領域,涉及一種靜態(tài)圖片中葡萄酒瓶的檢測方法。
【背景技術】
[0002]隨著電子成像技術和互聯網的發(fā)展,人們創(chuàng)造圖片、分享圖片和獲得圖片的途徑越來越方便且多樣,從而出現在互聯網上的圖片也日益增多,除了文字對這些圖片的描述,計算機并不知道圖片的內容,比如某張圖片中是否有葡萄酒瓶,有的話其中葡萄酒是什么品牌的呢?這些都不得而知,除非該圖片有類似的人為的描述,所以,傳統(tǒng)的以關鍵詞的形式并不能很好地匹配到對應的圖片,而讓計算機直接去識別圖片的技術便應運而生,這樣可以使得,即便是事先沒有描述的互聯網圖片,也可以通過識別技術去獲知其中的內容,其中就包括對葡萄酒瓶的檢測和識別。隨著電子商務的發(fā)展,越來越多的商品是在網絡上直接面對消費者,其中也包括葡萄酒。如果能讓計算機知道互聯網中的某張圖片中是否存在葡萄酒瓶,并知道葡萄酒的品牌,那么將更有利于葡萄酒瓶銷售商對葡萄酒的推廣,所以在靜態(tài)圖片中檢測和識別葡萄酒瓶的技術有廣闊的應用前景。
【發(fā)明內容】
[0003]為解決上述技術問題,本發(fā)明提供了一種能提高檢測準確性的基于于AdaBoost框架的靜態(tài)圖片中葡萄酒瓶的檢測方法。
[0004]為實現上述發(fā)明目的,本發(fā)明采用的技術方案是:
[0005]一種靜態(tài)圖片中葡萄酒瓶的檢測方法,包括訓練及檢測兩部分,
[0006]其中,訓練階段的步驟如下:
[0007](I)制作葡萄酒瓶樣本;
[0008](2)樣本特征計算;
[0009](3)訓練聯級分類器;
[0010]檢測階段的步驟如下:
[0011](I)加載待測圖片;
[0012](2)加載葡萄酒瓶分類器;
[0013](3)聯級葡萄酒瓶檢測。
[0014]進一步具體地,訓練階段的步驟如下:
[0015](I)制作葡萄酒瓶樣本:從網絡上采集包含葡萄酒瓶的圖片,并標定葡萄酒瓶所在位置,根據位置信息提取葡萄酒瓶圖像,根據葡萄酒瓶的固有長寬比進行縮放,并通過直方圖均衡化消除光照影響,作為該類葡萄酒瓶的正樣本,采用正樣本圖片其他不含葡萄酒瓶的部位作為負樣本;
[0016](2)樣本特征計算:構造5種不同的矩形特征,每一種矩形特征對應一種Haar特征,該Haar特征定義為對應的矩形區(qū)域像素值的和的帶權值之和,通過積分圖像的方式計算Haar特征;[0017](3)訓練聯級分類器:將每個強分類器及其對應的多個弱分類器串聯起來,形成最終的聯級分類器;
[0018]進一步具體地,檢測階段的步驟如下:
[0019] (I)加載待測圖片:轉為灰度圖并進行直方圖均衡化;
[0020](2)加載葡萄酒瓶分類器:訓練所得分類器數據保存在相應txt文件中,訓練所得分類器數據保存在相應txt文件中,其中數據結構描述為:N個強分類器,第i個強分類器包括強分類器的閾值thi和Iii個弱分類器;其中,第Iii個弱分類器包括弱分類器的閾值Θ」、方向控制器Pj、系數a」;以及該弱分類器所選特征對應的矩形特征信息:矩形的個數MimjOorf),矩形特征所屬類型typejO,…,4),每個子矩形的位置信息和權重
[0021]recth = {x,w,h,weight}(jc = I,...,Humj);
[0022](3)聯級葡萄酒瓶檢測:檢測圖像通過所述訓練階段步驟(3)中的強分類器的檢測。
[0023]與現有技術相比,本發(fā)明的有益效果:本發(fā)明通過對在量的葡萄酒瓶樣本,在提取Haar特征的基礎上,用AdaBoost方法訓練得出一個聯級分類器去檢測待測圖片中的葡萄酒瓶,這種方法能直接定位圖片中葡萄酒瓶所在,并不受環(huán)境的影響。
【專利附圖】
【附圖說明】
[0024]圖1為本發(fā)明訓練階段和檢測階段的流程圖;
[0025]圖2為本發(fā)明一種Haar特征圖;
[0026]圖3為本發(fā)明聯級葡萄酒瓶檢測過程的算法圖。
【具體實施方式】
[0027]如圖1所示,一種靜態(tài)圖片中葡萄酒瓶的檢測方法,包括訓練及檢測兩部分。
[0028]訓練階段步驟如下:
[0029](I)制作葡萄酒瓶樣本:從網絡上采集包含葡萄酒瓶的圖片,并標定葡萄酒瓶所在位置,根據位置信息提取葡萄酒瓶圖像,根據葡萄酒瓶的固有長寬比進行縮放,并通過直方圖均衡化消除光照影響,作為該類葡萄酒瓶的正樣本,采用正樣本圖片其他不含葡萄酒瓶的部位作為負樣本;
[0030](2)樣本特征計算:構造5種不同的矩形特征,每一種矩形特征對應一種Haar特征(如圖2所示),該Haar特征定義為對應的矩形區(qū)域像素值的和的帶權值之和,通過積分圖像的方式計算Haar特征;
[0031]積分圖像定義為,Σ 1^x ’ SAT (x, y)表示原圖像中像素點(X,
y)左上方所有像素值之和,Kx1,Y1 )即表示(X,y)左上方區(qū)域的某個像素值;
[0032]積分圖像SAT(X, y)采用增量方式計算:
[0033]SAT (x, y) = SAT (x, y-1) +SAT (χ-1, y) +I (x, y) -SAT (χ-l, y-1)
[0034]規(guī)定:SAT(_1, y) = SAT(x, -1) = SAT(-1, -1) = 0,那么只需要按行或按列遍歷整張圖像一次,即可計算得對應的積分圖像。而計算原圖中的某個矩形區(qū)域的像素值之和,只要通過矩形的四個頂點位置在積分圖像中查詢得四個值,這四個值的某種加減運算即可等價該矩形區(qū)域的像素值之和;
[0035]Haar特征計算:
[0036]第一種特征:feature{0}= Sum θ -Suma = SumABCD_2.SumEBCF,其中 Sum 白為白色矩形區(qū)域像素值之和,SumsS黑色矩形區(qū)域像素值之和。
[0037]Suhiabcd = SAT (A) +SAT (C) -SAT (B) -SAT (D)
[0038]Suhiebcf = SAT (E) +SAT (C) -SAT (B) -SAT (F)
[0039]第二種特征:feature{l}= SumABCD_2.SumFECD
[0040]SUhifecd = SAT (F) +SAT (C) -SAT (E) -SAT (D)
[0041]第三種特征:feature{2}= SumABCD-3.SumEFGH
[0042]SumLFGH = SAT (E) +SAT (G) -SAT (F) -SAT (H)
[0043]第四種特征:feature{3} = SumABCD-3.SumHEFG
[0044]SumHEFG = SAT (H) +SAT (F) -SAT (E) -SAT (G)
[0045]第五種特征:feature{4} = 311111刪-5111]1麗-5111]1畫
[0046]Suhiebfk = SAT (E) +SAT (F) -SAT (B) -SAT (K)
[0047]Sumffii⑶=SAT (H) +SAT (G) -SAT (K) -SAT (D)
[0048]對輸入的n個樣本計算特征,其中包括m個正樣本和n-mn_m個負樣本,每個樣本有兩個屬性(x,y),其中X代表該樣本的Haar特征向量f (x),y代表該樣本的類別,為正樣本是取為1,負樣本時取為-1。
[0049](3)訓練聯級分類器:
[0050]輸入由上個步驟獲得的η個訓練樣本:{(X1, Y1),..., (xm, ym),…(xn, yn)}
[0051]定義弱分類器:
【權利要求】
1.靜態(tài)圖片中葡萄酒瓶的檢測方法,其特征在于:所述檢測方法基于AdaBoost框架,其包括訓練階段和檢測階段。
2.如權利要求1所述的靜態(tài)圖片中葡萄酒瓶的檢測方法,其特征在于所述訓練階段包括: 制作葡萄酒瓶樣本,從網絡上采集包含葡萄酒瓶的圖片,并標定葡萄酒瓶所在位置,根據位置信息提取葡萄酒瓶圖像; 樣本特征計算,構造矩形特征,每一種矩形特征對應一利Haar特征; 訓練聯級分類器,輸入由上個步驟獲得的訓練樣本并進行訓練,最終將訓練得到的強分類及其對應的多個弱分類器串聯起來。
3.如權利要求1所述的靜態(tài)圖片中葡萄酒瓶的檢測方法,其特征在于所述檢測階段包括: 加載待測圖片,轉為灰度圖并進行直方圖均衡化; 加載葡萄酒瓶分類器,包括強、弱分類器的閾值和所選特征對應的矩形特征信息; 聯級葡萄酒瓶檢測,檢測圖像首先通過前面的強分類器的檢測,如果不是葡萄酒瓶圖像,那么會在前端被排除,只有葡萄酒瓶圖像才能最終通過各級強分類器的檢測。
4.如權利要求1所述的靜態(tài)圖片中葡萄酒瓶的檢測方法,其特征在于所述制作葡萄酒瓶樣本步驟為:根據位置信息提取葡萄酒瓶圖像,根據葡萄酒瓶的固有長寬比進行縮放,并通過直方圖均衡化消除光照影響,作為該類葡萄酒瓶的正樣本,采用正樣本圖片其他不含葡萄酒瓶的部位作為負樣本。
5.如權利要求2所述的靜態(tài)圖片中葡萄酒瓶的檢測方法,其特征在于:所述Haar特征定義為對應的矩形區(qū)域像素值的和的帶權值之和,通過積分圖像的方式計算Haar特征;積分圖像SAT(x,y)表示原圖像中像素點(x,y)左上方所有像素值之和,采用增量方式計算,那么只需要按行或按列遍歷整張圖像一次,即可計算得對應的積分圖像;而計算原圖中的某個矩形區(qū)域的像素值之和,只要通過矩形的四個頂點位置在積分圖像中查詢得四個值,這四個值的某種加減運算即可等價該矩形區(qū)域的像素值之和。
6.如權利要求3所述的靜態(tài)圖片中葡萄酒瓶的檢測方法,其特征在于:在設定的訓練次數T下,每次訓練會產生一個強分類器,而這過程中同時有多個弱分類器被選擇,最終然后將每個強分類及其對應的多個弱分類器串聯起來,形成最終的聯級分類器。
【文檔編號】G06K9/62GK103971118SQ201310043266
【公開日】2014年8月6日 申請日期:2013年1月25日 優(yōu)先權日:2013年1月25日
【發(fā)明者】胡楠, 鄒國平 申請人:北京明日時尚信息技術有限公司