一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理領(lǐng)域,具體設(shè)及一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)。
【背景技術(shù)】
[0002] 傳統(tǒng)的手工勞動的方式在標(biāo)簽圖像方面對于大型數(shù)據(jù)集,百萬的圖像集合加上圖 片,需要一個(gè)團(tuán)隊(duì)的人,花費(fèi)幾周時(shí)間手動標(biāo)簽運(yùn)些圖像中的每一個(gè)。
[0003] 在機(jī)器學(xué)習(xí)領(lǐng)域,人們普遍認(rèn)為提高模型預(yù)測精度的最有效的方法是提供更多 準(zhǔn)確的,W及標(biāo)簽好的樣品來進(jìn)行模型訓(xùn)練。例如,一個(gè)用更多精確樣品訓(xùn)練出來的模型 通常比具有較少樣品訓(xùn)練出來的模型更精確。該理論同樣的也適用于計(jì)算機(jī)視覺,更具體 地說,適用于作為機(jī)器學(xué)習(xí)分支的自動圖像標(biāo)注。自動圖像標(biāo)注是用已經(jīng)訓(xùn)練的模型,自 動檢測圖形的目標(biāo)或場景的方法。
[0004] 一般來講,用來做圖像識別模型訓(xùn)練樣本是由人標(biāo)記;例如,含有狗的圖像被 貼上"狗"標(biāo)簽。然而,盡管標(biāo)記圖像的任務(wù)并不具有挑戰(zhàn)性,但是卻需要大量人力并 且費(fèi)時(shí)?;趫D像認(rèn)知的深度學(xué)習(xí)的最近發(fā)展,需要數(shù)W百萬計(jì)的照片培訓(xùn)具有可接受的 精度自動標(biāo)注系統(tǒng)。人工標(biāo)記如此大量圖像需要的時(shí)間和成本通常被描述為實(shí)現(xiàn)最先進(jìn)的 自動圖像標(biāo)注系統(tǒng)的瓶頸。
[0005] 電腦感知圖像與人類不同。對于電腦,一個(gè)圖像只是1和0的集合。為了從圖像 中提取有用的信息,我們需要告訴計(jì)算機(jī)如何W-種有意義的、可重復(fù)的方式識別圖像并 從圖像中提取內(nèi)容。運(yùn)個(gè)重要的過程被稱為圖像特征提取。我們的方法是使用特定的預(yù) 先確定的"規(guī)則"作為數(shù)字特征向量來表示圖像。特征提取傳統(tǒng)"規(guī)則"是顏色、邊緣和梯 度。然而,深度學(xué)習(xí)的最新發(fā)展,如卷積神經(jīng)網(wǎng)絡(luò)(CNN),與傳統(tǒng)方法相比,深度學(xué)習(xí)功能更 強(qiáng)大、更具描述性。
[0006] 為了解決大量圖像集合"維數(shù)的巧咒"(化rseofDimensionality),我們借鑒了 近似近鄰捜索領(lǐng)域方面的觀點(diǎn)。據(jù)證實(shí),在很多案例中,近似近鄰方法在精確度方面跟蠻力 方法基本一樣,但在速度上是蠻力方法的多倍。有鑒于此,利用局部敏感哈希算法(Locally SensitiveHashForest)能夠減少高維圖像數(shù)據(jù)維數(shù)。
【發(fā)明內(nèi)容】
[0007] 為了解決上述問題,本發(fā)明一種自動的圖片訓(xùn)練樣本提取方法及系統(tǒng)。本發(fā)明針 對在大量的無標(biāo)記的圖像用來找到訓(xùn)練的圖像,本發(fā)明提出的方法能夠自動檢索任何圖像 集合中所需標(biāo)記的圖像,且檢索速度快、成本效益高。
[0008] 為達(dá)到上述目的,本發(fā)明采用的技術(shù)方案是: 一種自動的圖片訓(xùn)練樣本提取方法,包括W下幾個(gè)步驟: (1) 解析圖像集合中所有圖像內(nèi)容,得到圖像集合的所有圖像特征; (2) 儲存所述圖像特征,建立圖像知識庫; (3) 解析由客戶端給出的目標(biāo)圖像的內(nèi)容,得到目標(biāo)圖像特征; (4) 根據(jù)所述目標(biāo)圖像特征,在圖像知識庫中尋找相似圖像; (5) 返回相似圖像至用戶數(shù)據(jù)庫。
[0009] 其中,基于圖像視覺特征利用深度學(xué)習(xí)方法提取圖像特征。深度學(xué)習(xí)方法提取圖 像特征W實(shí)現(xiàn)所提取圖像特征的可靠性和準(zhǔn)確度。
[0010] 進(jìn)一步的是,所述深度學(xué)習(xí)方法提取圖像特征,具體為,對于圖像集合中的每一個(gè) 圖像,提取1000個(gè)特征,并且每個(gè)特征代表一個(gè)圖像的特定方面。其中,無論圖像的大小 或內(nèi)容,一個(gè)固定大小1000個(gè)數(shù)字永遠(yuǎn)用來表示圖像,W減少運(yùn)算量,提高運(yùn)算速率。
[0011] 進(jìn)一步的是,所述1000個(gè)特征的范圍為0到1。
[0012] 進(jìn)一步的是,所述步驟(2)中圖像特征的存儲,是通過局部敏感哈希算法,將同類 型的圖像放入圖像知識庫中同一個(gè)儲存單元,運(yùn)意味運(yùn)只有屬于同一儲存單元的圖像才會 被檢查,W取代集合中的所有項(xiàng)目,W便快速訪問和比較,提高查詢效率,利用局部敏感哈 希算法來減少高維圖像數(shù)據(jù)維數(shù),建立占用空間小的特征知識庫。
[0013] 進(jìn)一步的是,使用局部敏感哈希算法,存儲每個(gè)圖像1000個(gè)數(shù)字特征向量。
[0014] 進(jìn)一步的是,所述步驟(3 )具體為,根據(jù)視覺特征,解析所提供的目標(biāo)圖像內(nèi)容,使 用深度學(xué)習(xí)方法提取圖像特征,同圖像集合中圖像特征提取方法相同。
[0015] 進(jìn)一步的是,所述步驟(4)具體為,利用余弦相似度算法尋找出相似圖像,余弦相 似度的值越大意味著兩個(gè)圖像越視覺相似,為0時(shí),表示運(yùn)兩個(gè)圖像完全不相關(guān)。
[0016] 另一方面,本發(fā)明還提供了一種自動的圖片訓(xùn)練樣本提取的系統(tǒng),包括: 圖像集合解析模塊:解析圖像集合所有圖像內(nèi)容,得到圖像集合的所有圖像特征; 圖像知識庫:用來存儲所述的圖像集合的圖像特征,建立圖像知識庫; 目標(biāo)圖像解析模塊:用于接收客戶端給出的目標(biāo)圖像,并解析目標(biāo)圖像,得到目標(biāo)圖像 特征; 圖像查詢模塊:根據(jù)目標(biāo)圖像特征,在圖像知識庫中尋找相似圖像; 圖像輸出模塊:將相似圖像返回客戶端; 其中,圖像集合解析模塊輸入端口連接外部客戶端,圖像集合解析模塊輸出端口連接 圖像知識庫輸入端口;目標(biāo)圖像解析模塊輸入端口連接外部客戶端;目標(biāo)圖像解析模塊輸 出端口連接至圖像查詢模塊輸入端口;圖像查詢模塊輸入端口還連接有圖像知識庫的輸出 端口,圖像查詢模塊輸出端口與圖像輸出模塊輸入端口相連接,圖像輸出模塊輸出端口與 外部客戶端相連。
[0017] 采用本技術(shù)方案的有益效果:本發(fā)明所提出的一種自動的圖片訓(xùn)練樣本提取方法 及系統(tǒng),能夠自動檢索任何圖像集合中所需標(biāo)記的圖像;在處理大量圖像時(shí),工作效率更 高,運(yùn)為確定訓(xùn)練圖像提供了一個(gè)快速、高效的方式,W識別任何圖像類別的訓(xùn)練圖像,本 方法基于已經(jīng)提供的圖像的視覺相似性,只要幾分鐘就可W將圖像依次排列;基于與提供 的圖像視覺特征,本發(fā)明的方法可W快速找到觀察者不容易觀察到的圖像,并且運(yùn)些圖像 并不必然屬于同一類別,但視覺上非常相似,靈活性較高。
【附圖說明】
[0018] 圖1為本發(fā)明的方法流程圖; 圖2為本發(fā)明的實(shí)施例中單個(gè)圖像特征提取的示意圖; 圖3為本發(fā)明的實(shí)施例中多個(gè)圖像特征提取的示意圖; 圖4為本發(fā)明的實(shí)施例中LSHF方法的示意圖; 圖5為本發(fā)明的實(shí)施例中相似圖片特征提取的示意圖圖; 圖6為本發(fā)明所述方法借助的系統(tǒng)結(jié)構(gòu)簡圖。
【具體實(shí)施方式】
[0019] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對本發(fā)明作進(jìn)一 步闡述。
[0020] 參見圖1所示,一種自動的圖片訓(xùn)練樣本提取方法,包括W下幾個(gè)步驟: (1)解析圖像集合中所有圖像內(nèi)容,得到圖像集合的所有圖像特征。
[0021] 具體為,對于圖像集合中的每個(gè)圖像,基于圖像視覺特征,解析運(yùn)些圖像,提取圖 像特征。
[0022] 實(shí)施例中,如圖2所示,使用特定的預(yù)先確定的"規(guī)則"作為數(shù)字特征向量來表示 圖像,數(shù)學(xué)上可W表示為: r= {>"K,,Kj,…,K。} 上述公式中,w表示圖像,Vi表示描述圖像的特征。
[