一種基于匹配的車輛顏色識(shí)別方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于匹配的車輛顏色識(shí)別方法,包括:對(duì)每張訓(xùn)練圖像隨機(jī)取圖像塊,對(duì)每個(gè)圖像塊進(jìn)行采樣,獲得采樣點(diǎn),計(jì)算每個(gè)采樣點(diǎn)的顏色特征向量,構(gòu)建圖像塊的顏色特征向量表示,利用k-means聚類計(jì)算編碼本,利用空間金字塔模型給圖像特征加上空間信息,再用SVM訓(xùn)練分類器,識(shí)別的時(shí)候,計(jì)算待識(shí)別圖像的空間金字塔特征向量,利用分類器對(duì)待識(shí)別圖像的空間金字塔特征向量進(jìn)行分類,輸出待識(shí)別圖像中車輛顏色的識(shí)別結(jié)果。本發(fā)明還公開了相應(yīng)的基于匹配的車輛顏色識(shí)別系統(tǒng)。本發(fā)明方法可以在各種復(fù)雜環(huán)境下都給出準(zhǔn)確度高的顏色判斷,本方法無需對(duì)不同圖像質(zhì)量進(jìn)行各種圖像預(yù)處理,且本發(fā)明識(shí)別方法魯棒性強(qiáng),識(shí)別準(zhǔn)確率高。
【專利說明】—種基于匹配的車輛顏色識(shí)別方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)視覺【技術(shù)領(lǐng)域】,更具體地,涉及基于一種基于匹配的車輛顏色識(shí)別方法和系統(tǒng)。
【背景技術(shù)】
[0002]在過去的十幾年里,由于經(jīng)濟(jì)的迅速發(fā)展,各個(gè)城市的車輛數(shù)目極大的膨脹,原來依靠人眼對(duì)車輛信息的識(shí)別越來越不現(xiàn)實(shí)。因此,通過計(jì)算機(jī)視覺技術(shù)自動(dòng)的提取車輛的信息,對(duì)輔助車輛的監(jiān)控有很大的意義。在車輛的各種信息,包括車牌,車輛類型等,車輛的顏色是一種非常直觀而且重要的屬性。車輛的顏色識(shí)別,是對(duì)在監(jiān)控系統(tǒng)圖片中的車輛,依照人眼判斷的標(biāo)準(zhǔn),給出車輛顏色的判斷。在卡口、高速公路、城市道路等場(chǎng)景中,車輛顏色能夠給套牌車判斷,違反交通規(guī)則的車輛監(jiān)控,追蹤逃犯等應(yīng)用提供重要的線索。
[0003]然而,現(xiàn)有的車輛顏色識(shí)別方法中有兩大缺點(diǎn):第一是對(duì)各種氣候?qū)?zhǔn)確性影響大,第二是不同時(shí)間段的識(shí)別結(jié)果有很大差距。
【發(fā)明內(nèi)容】
[0004]針對(duì)現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種基于匹配的車輛顏色識(shí)別方法與系統(tǒng),能夠?qū)囕v的顏色進(jìn)行自動(dòng)識(shí)別,該方法的魯棒性強(qiáng),并且識(shí)別準(zhǔn)確率高。
[0005]為實(shí)現(xiàn)上述目的,按照本發(fā)明的一個(gè)方面,提供了一種基于匹配的車輛顏色識(shí)別方法,該方法運(yùn)用支持向量機(jī)以及空間金字塔模型,實(shí)現(xiàn)車輛顏色的自動(dòng)識(shí)別,包括以下步驟:
[0006](I)利用訓(xùn)練圖像集合訓(xùn)練用于對(duì)圖像塊特征向量進(jìn)行編碼的編碼本:
[0007](1.1)對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機(jī)取圖像塊。
[0008]具體為:首先將圖像進(jìn)行尺度變換變成640像素*480像素大小,然后在圖像上隨機(jī)采集大小為16*16的圖像塊;
[0009](1.2)對(duì)每個(gè)圖像塊進(jìn)行采樣,獲得采樣點(diǎn)。
[0010]具體為:16*16的圖像塊中分別在長寬上以平均間隔采樣4個(gè)點(diǎn),得到共16個(gè)采樣點(diǎn);
[0011](1.3)計(jì)算每個(gè)采樣點(diǎn)的顏色特征向量。
[0012]具體為:對(duì)每個(gè)采樣點(diǎn)計(jì)算:RGB分量,HSV分量,YCbCr分量,Lab分量,YUV分量,拼接成一個(gè)15維向量,即為該采樣點(diǎn)顏色特征向量;
[0013](1.4)將每個(gè)圖像塊中的所有采樣點(diǎn)的顏色特征向量拼接成圖像塊的特征向量。
[0014]具體為:將16個(gè)采樣點(diǎn)的15維向量拼接成一個(gè)240維向量,即為圖像塊顏色特征
向量。;
[0015](1.5)對(duì)每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進(jìn)行k-means聚類;
[0016](1.6)將所述聚類的結(jié)果作為編碼本;
[0017]聚類得到N個(gè)聚類中心,N即為編碼本中字的數(shù)量,對(duì)應(yīng)向量就是編碼本中的字;[0018](2)訓(xùn)練分類器:
[0019](2.1)對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊。
[0020]具體為:對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像,首先將圖像進(jìn)行尺度變換變成640像素*480像素大小,然后按照8個(gè)像素為步長,采集大小為16*16的圖像塊;
[0021](2.2)按照步驟(1.2)-(1.4)求取每個(gè)圖像塊的特征向量;
[0022](2.3)用步驟(I)中得到的編碼本對(duì)圖像塊特征向量進(jìn)行編碼;
[0023](2.4)利用空間金字塔模型(Spatial Pyramid Matching)計(jì)算每張訓(xùn)練圖像的空間金字塔特征向量;
[0024](2.4.1)在原訓(xùn)練圖像上將所有采樣點(diǎn)根據(jù)編碼本進(jìn)行直方圖統(tǒng)計(jì),每個(gè)字典各為一類進(jìn)行統(tǒng)計(jì),得到屬于該類的采樣點(diǎn)數(shù)目,從而得到一個(gè)N維的向量,N為編碼本中字的數(shù)量。
[0025](2.4.2)將原訓(xùn)練圖像分成2*2共4個(gè)分塊,針對(duì)每個(gè)分塊重復(fù)(2.4.1)的計(jì)算過程,最后得到4個(gè)N維的向量。
[0026](2.4.3)將原訓(xùn)練圖像分成4*4共16個(gè)分塊,針對(duì)每個(gè)分塊重復(fù)(2.4.1)的計(jì)算過程,最后得到16個(gè)N維的向量。
[0027](2.4.4)將上述步驟得到的特征向量拼接起來,得到一個(gè)21XN維向量,這個(gè)向量就是該圖片的空間金字塔表示。
[0028](2.5)利用所有訓(xùn)練圖像的金字塔特征向量訓(xùn)練支持向量機(jī)分類器。
[0029]具體為:訓(xùn)練一個(gè)直方圖交叉核(histogram intersection)的SVM分類器作為最終的分類器;
[0030](3)識(shí)別待識(shí)別圖像中車輛的顏色:
[0031](3.1)按照步驟(2.1)-(2.4)計(jì)算待識(shí)別圖像的空間金字塔特征向量;
[0032](3.2)利用步驟(2)中訓(xùn)練得到的支持向量機(jī)分類器,對(duì)待識(shí)別圖像的空間金字塔特征向量進(jìn)行分類,輸出待識(shí)別圖像中車輛顏色的識(shí)別結(jié)果。
[0033]按照本發(fā)明的另一方面,還提供了一種基于匹配的車輛顏色識(shí)別系統(tǒng),所述系統(tǒng)包括編碼本生成模塊,分類器訓(xùn)練模塊以及待識(shí)別圖像識(shí)別模塊,其中:
[0034]所述編碼本生成模塊,用于利用訓(xùn)練圖像集合訓(xùn)練用于對(duì)圖像塊特征向量進(jìn)行編碼的編碼本,具體包括:
[0035]圖像塊獲取模塊,用于對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機(jī)取圖像塊;
[0036]圖像塊采樣模塊,用于對(duì)每個(gè)圖像塊進(jìn)行采樣,獲得采樣點(diǎn);
[0037]顏色特征向量計(jì)算模塊,用于計(jì)算每個(gè)采樣點(diǎn)的顏色特征向量;
[0038]圖像塊特征向量計(jì)算模塊,用于將每個(gè)圖像塊中的所有采樣點(diǎn)的顏色特征向量拼接成圖像塊的特征向量;
[0039]編碼本生成模塊,用于對(duì)每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進(jìn)行k-means聚類,將所述聚類的結(jié)果作為編碼本;
[0040]所述分類器訓(xùn)練模塊,用于訓(xùn)練分類器,具體包括:
[0041]圖像塊采集模塊,用于對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊;
[0042]圖像塊特征向量計(jì)算模塊,用于求取每個(gè)圖像塊的特征向量;
[0043]圖像塊特征向量編碼模塊,用于利用編碼本對(duì)圖像塊特征向量進(jìn)行編碼;[0044]金字塔特征向量生成模塊,用于利用空間金字塔模型計(jì)算每張訓(xùn)練圖像的空間金字塔特征向量;
[0045]支持向量機(jī)分類器訓(xùn)練模塊,用于利用所有訓(xùn)練圖像的空間金字塔特征向量訓(xùn)練支持向量機(jī)分類器;
[0046]所述待識(shí)別圖像識(shí)別塊,用于識(shí)別待識(shí)別圖像中車輛的顏色,具體包括:
[0047]空間金字塔特征向量計(jì)算模塊,用于計(jì)算待識(shí)別圖像的空間金字塔特征向量;
[0048]待識(shí)別圖像識(shí)別子模塊,用于利用支持向量機(jī)分類器,對(duì)待識(shí)別圖像的空間金字塔特征向量進(jìn)行分類,輸出待識(shí)別圖像中車輛顏色的識(shí)別結(jié)果。
[0049]通過本發(fā)明所構(gòu)思的以上技術(shù)方案,與現(xiàn)有技術(shù)相比,本發(fā)明具有以下的有益效果:
[0050]1、物體顏色容易受光照、灰塵以及空氣質(zhì)量等因素的影響而變得不容易辨認(rèn),現(xiàn)有的識(shí)別算法無法適應(yīng)外界環(huán)境的變化在各種復(fù)雜場(chǎng)景都提供高的辨識(shí)度;為克服這些影響,本發(fā)明首先把圖像轉(zhuǎn)換成不同的顏色空間,例如HSV,YCbCr, Lab, YUV ;在這些顏色空間中,原本的顏色三通道被轉(zhuǎn)換成光照和顏色分量;由于兩種分量不相關(guān),其中從顏色分量中提取的特征具有光照不敏感的特性;
[0051]2、在實(shí)際情況中,只有一部分的車身區(qū)域能夠用來識(shí)別車輛顏色,例如引擎蓋等;其他方法都需要首先顯性的提取有代表性的區(qū)域,然后在這些區(qū)域上提取顏色特征進(jìn)行識(shí)別;本發(fā)明方法直接對(duì)不同顏色的車輛圖片進(jìn)行建模,通過學(xué)習(xí)的方法自動(dòng)選擇有代表性的區(qū)域;為了能夠間接的選擇有代表性的區(qū)域,圖像被分割為1*1,2*2,4*4的圖像金字塔;整個(gè)圖像的特征由每個(gè)子區(qū)域的特征拼接起來;由于子區(qū)域特征的拼接順序,整個(gè)圖像的特征包含有一定的空間位置信息;訓(xùn)練之后得到的模型,實(shí)際上就是每個(gè)子區(qū)域的權(quán)重,按照權(quán)重大小,本方法就能間接的選擇出有代表性的區(qū)域;因此本發(fā)明方法不需要進(jìn)行區(qū)域提取的步驟,而是直接輸入整張車輛圖片就行識(shí)別。
【專利附圖】
【附圖說明】
[0052]圖1是本發(fā)明基于匹配的車輛顏色識(shí)別方法的流程圖;
[0053]圖2是本發(fā)明中利用空間金字塔模型對(duì)圖像進(jìn)行空間金字塔計(jì)算的原理圖。
【具體實(shí)施方式】
[0054]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0055]以下首先就本發(fā)明的技術(shù)術(shù)語進(jìn)行解釋和說明:
[0056]訓(xùn)練圖像:用于訓(xùn)練方法模型的輸入圖像,在本方法中指的是用于訓(xùn)練模型需要的各種不同顏色種類的車輛圖像。
[0057]顏色特征:是指在不同顏色空間上的空間各個(gè)分量值的向量,包括RGB空間,HSV空間,YCbCr空間,Lab空間以及YUV空間。由于每個(gè)顏色空間都有自己的特點(diǎn),因此對(duì)于圖像顏色特性的表達(dá)各有側(cè)重,為了得到全面的顏色特征,我們?nèi)诤隙鄠€(gè)顏色空間進(jìn)行向量拼接,最終得到顏色特征。[0058]K-means算法:是最為經(jīng)典的基于劃分的聚類方法,是十大經(jīng)典數(shù)據(jù)挖掘算法之一。K-means算法的基本思想是:以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類,對(duì)最靠近他們的對(duì)象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果。
[0059]編碼本:是對(duì)圖像進(jìn)行編碼的依據(jù),編碼本中的各個(gè)元素是在樣本集合上進(jìn)行K-means算法得到的若干個(gè)聚類中心。
[0060]空間金字塔模型:即SPM(Spatial Pyramid Matching)是一種經(jīng)典的匹配算法,該算法重在能夠提取上下文信息,在保證全局特征不丟失的情況下,能夠同時(shí)獲取豐富的局部特征。
[0061]支持向量機(jī):SVM(Support Vector Machine)是 Corinna Cortes 和 Vapnik 等于1995年首先提出的分類算法,它在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),SVM的關(guān)鍵在于核函數(shù)。低維空間向量集通常難于劃分,解決的方法是將它們映射到高維空間。但這個(gè)辦法帶來的困難就是計(jì)算復(fù)雜度的增加,而核函數(shù)正好巧妙地解決了這個(gè)問題。也就是說,只要選用適當(dāng)?shù)暮撕瘮?shù),就可以得到高維空間的分類函數(shù)。
[0062]如圖1所示,本發(fā)明運(yùn)用支持向量機(jī)的基于空間金字塔模型的顏色識(shí)別方法包括以下步驟:
[0063](I)利用訓(xùn) 練圖像集合訓(xùn)練用于對(duì)圖像塊特征向量進(jìn)行編碼的編碼本:
[0064](1.1)對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機(jī)取圖像塊。
[0065]具體為:首先將圖像進(jìn)行尺度變換變成640像素*480像素大小,然后在圖像上隨機(jī)選擇16*16的圖像塊;
[0066](1.2)對(duì)每個(gè)圖像塊進(jìn)行采樣,獲得采樣點(diǎn)。
[0067]具體為:16*16的圖像塊中分別在長寬上以平均間隔采樣4個(gè)點(diǎn),得到共16個(gè)采樣點(diǎn);
[0068](1.3)計(jì)算每個(gè)采樣點(diǎn)的顏色特征向量。
[0069]步驟具體為:對(duì)每個(gè)采樣點(diǎn)計(jì)算:RGB分量,HSV分量,YCbCr分量,Lab分量,YUV分量,拼接成一個(gè)15維向量,即為該采樣點(diǎn)顏色特征向量。
[0070]設(shè)RGB 分量為[R, G, B],HSV 分量為[H, S,V],YCbCr 分量為[Y, Cb, Cr],Lab 分量為[L, a, b],YUV 分量[Y, U, V]則該點(diǎn)顏色特征向量為:[R, G, B, H, S,V, Y, Cb, Cr, L, a, b, Y, U, V]
這樣一個(gè)15維向量。
[0071](1.4)將每個(gè)圖像塊中的所有采樣點(diǎn)的顏色特征向量拼接成圖像塊的特征向量。
[0072]具體為:將16個(gè)采樣點(diǎn)的15維向量拼接成一個(gè)240維向量,即為圖像塊顏色特征
向量
[0073]步驟具體為:將16個(gè)采樣點(diǎn)的15維向量拼接成一個(gè)240維向量V1 = [R1, G1, B1,H1, S1, V1, Y1, Cb1, Cr1, L1, a1; ^,Y1, U1, V1,...,
Ri6,G16j B16j H16j S16j V16j Y16j Cb16, Cr16, Ll6,ai6) b16,
Y16, U16, V16],即為圖像塊顏色特征向量;
[0074](1.5)對(duì)每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進(jìn)行k-means聚類;
[0075](1.6)將所述聚類的結(jié)果作為編碼本,聚類得到N個(gè)聚類中心,N即為編碼本中字的數(shù)量,對(duì)應(yīng)向量就是編碼本中的字;
[0076](2)訓(xùn)練分類器:
[0077](2.1)對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊。[0078]具體做法為:以圖像某個(gè)頂點(diǎn)為起始點(diǎn),每隔八個(gè)像素取一個(gè)16*16的圖像塊,可以理解成一個(gè)16*16的取景框,每次平移8像素,框中的即為一個(gè)圖像塊,直到整個(gè)圖像都覆蓋到。例如對(duì)于640像素*480像素,可以得到一共4800個(gè)圖像塊;
[0079](2.2)按照步驟(1.2)-(1.4)求取每個(gè)圖像塊的特征向量,得到所有圖像塊的特
征{Vl,V2>...V240(J ;
[0080](2.3)用步驟(I)中得到的編碼本對(duì)圖像塊特征向量進(jìn)行編碼;
[0081](2.4)利用空間金字塔模型(Spatial Pyramid Matching)計(jì)算每張訓(xùn)練圖像的空間金字塔特征向量;
[0082](2.4.1)參照?qǐng)D2,計(jì)算空間金字塔的第一步,是在原訓(xùn)練圖像上將所有采樣點(diǎn)根據(jù)編碼字典進(jìn)行直方圖統(tǒng)計(jì),每個(gè)字典各為一類進(jìn)行統(tǒng)計(jì),得到屬于該類的采樣點(diǎn)數(shù)目,從而得到一個(gè)N維的向量[叫,n2,...,nN],N為編碼本中字的數(shù)量。
[0083](2.4.2)將原訓(xùn)練圖像分成2*2共4個(gè)分塊,針對(duì)每個(gè)分塊重復(fù)(2.4.1)的計(jì)算過程,最后得到4個(gè)N維的向量[n’ i,η’ 2,...,η’ 4Ν]。
[0084](2.4.3)將原訓(xùn)練圖像分成4*4共16個(gè)分塊,針對(duì)每個(gè)分塊重復(fù)(2.4.1)的計(jì)算過程,最后得到16個(gè)N維的向量[n’ ’ i,η’ ’ 2,...,η’ ’ 16Ν]。
[0085](2.4.4)將上述步驟得到的特征向量拼接起來,得到一個(gè)21ΧΝ維向量,這個(gè)向量就是該圖片的空間金字塔表示 Di1, η2,...,nN, n' 1; n/ 2,..., n/ 4N,n" 2,...,n" 16
N] o
[0086](2.5)利用所有訓(xùn)練圖像的金字塔特征向量訓(xùn)練SVM分類器。
[0087]步驟具體為:訓(xùn)練一個(gè)直方圖交叉核(histogram intersection)的SVM分類器作為最終的分類器。此處可以利用封裝好的已有SVM庫函數(shù)視為一個(gè)黑箱子,輸入所有訓(xùn)練圖像的金字塔特征向量,輸出為一個(gè)能夠判斷車輛顏色的SVM分類器;
[0088](3)識(shí)別待識(shí)別圖像中車輛的顏色:
[0089](3.1)按照步驟(2.1)-(2.4)計(jì)算待識(shí)別圖像的空間金字塔特征向量;
[0090](3.2)步驟具體為:利用步驟(2)中訓(xùn)練得到的支持向量機(jī)分類器,對(duì)待識(shí)別圖像的空間金字塔特征向量進(jìn)行分類,輸出待識(shí)別圖像中車輛顏色的識(shí)別結(jié)果。例如一號(hào)代表紅色,則紅色的車返回結(jié)果為I。
[0091]進(jìn)一步地,本發(fā)明還提供了一種基于匹配的車輛顏色識(shí)別系統(tǒng),所述系統(tǒng)包括編碼本生成模塊,分類器訓(xùn)練模塊以及待識(shí)別圖像識(shí)別模塊,其中:
[0092]所述編碼本生成模塊,用于利用訓(xùn)練圖像集合訓(xùn)練用于對(duì)圖像塊特征向量進(jìn)行編碼的編碼本,具體包括:
[0093]圖像塊獲取模塊,用于對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機(jī)取圖像塊;
[0094]圖像塊采樣模塊,用于對(duì)每個(gè)圖像塊進(jìn)行采樣,獲得采樣點(diǎn);
[0095]顏色特征向量計(jì)算模塊,用于計(jì)算每個(gè)采樣點(diǎn)的顏色特征向量;
[0096]圖像塊特征向量計(jì)算模塊,用于將每個(gè)圖像塊中的所有采樣點(diǎn)的顏色特征向量拼接成圖像塊的特征向量;
[0097]編碼本生成模塊,用于對(duì)每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進(jìn)行k-means聚類,將所述聚類的結(jié)果作為編碼本;
[0098]所述分類器訓(xùn)練模塊,用于訓(xùn)練分類器,具體包括:[0099]圖像塊采集模塊,用于對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊;
[0100]圖像塊特征向量計(jì)算模塊,用于求取每個(gè)圖像塊的特征向量;
[0101]圖像塊特征向量編碼模塊,用于利用編碼本對(duì)圖像塊特征向量進(jìn)行編碼;
[0102]金字塔特征向量生成模塊,用于利用空間金字塔模型計(jì)算每張訓(xùn)練圖像的空間金字塔特征向量;
[0103]支持向量機(jī)分類器訓(xùn)練模塊,用于利用所有訓(xùn)練圖像的空間金字塔特征向量訓(xùn)練支持向量機(jī)分類器;
[0104]所述待識(shí)別圖像識(shí)別模塊,用于識(shí)別待識(shí)別圖像中車輛的顏色,具體包括:
[0105]空間金字塔特征向量計(jì)算模塊,用于計(jì)算待識(shí)別圖像的空間金字塔特征向量;
[0106]待識(shí)別圖像識(shí)別子模塊,用于利用支持向量機(jī)分類器,對(duì)待識(shí)別圖像的空間金字塔特征向量進(jìn)行分類,輸出待識(shí)別圖像中車輛顏色的識(shí)別結(jié)果。
[0107]需要說明的是,本發(fā)明實(shí)施例中對(duì)圖像進(jìn)行尺度變換、選取的圖像塊的大小、采樣點(diǎn)的采樣方式的具體數(shù)值均可以根據(jù)實(shí)際需要來確定,本發(fā)明實(shí)施例中所用的數(shù)值并不限定本發(fā)明的保護(hù)范圍。
[0108]本領(lǐng)域的技術(shù)人員容易理解,以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種基于匹配的車輛顏色識(shí)別方法,其特征在于,所述方法包括以下步驟: (1)利用訓(xùn)練圖像集合訓(xùn)練用于對(duì)圖像塊特征向量進(jìn)行編碼的編碼本: (1.1)對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機(jī)取圖像塊; (1.2)對(duì)每個(gè)圖像塊進(jìn)行采樣,獲得采樣點(diǎn); (1.3)計(jì)算每個(gè)采樣點(diǎn)的顏色特征向量; (1.4)將每個(gè)圖像塊中的所有采樣點(diǎn)的顏色特征向量拼接成圖像塊的特征向量; (1.5)對(duì)每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進(jìn)行k-means聚類; (1.6)將所述聚類的結(jié)果作為編碼本; (2)訓(xùn)練分類器: (2.1)對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊;
(2.2)按照步驟(1.2)-(1.4)求取每個(gè)圖像塊的特征向量; (2.3)用步驟(1)中得到的編碼本對(duì)圖像塊特征向量進(jìn)行編碼; (2.4)利用空間金字塔模型計(jì)算每張訓(xùn)練圖像的空間金字塔特征向量; (2.5)利用所有訓(xùn)練圖像的金字塔特征向量訓(xùn)練支持向量機(jī)分類器; (3)識(shí)別待識(shí)別圖像中車輛的顏色: (3.1)按照步驟(2.1)-(2.4)計(jì)算待識(shí)別圖像的空間金字塔特征向量; (3.2)利用步驟(2)中訓(xùn)練得到的支持向量機(jī)分類器,對(duì)待識(shí)別圖像的空間金字塔特征向量進(jìn)行分類,輸出待識(shí)別圖像中車輛顏色的識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的車輛顏色識(shí)別方法,其特征在于,所述步驟(1.1)具體為:首先將圖像進(jìn)行尺度變換變成640像素*480像素大小,然后在圖像上隨機(jī)采集大小為16*16的圖像塊。
3.根據(jù)權(quán)利要求2所述的車輛顏色識(shí)別方法,其特征在于,所述步驟(1.2)具體為:16*16的圖像塊中分別在長寬上以平均間隔采樣4個(gè)點(diǎn),得到共16個(gè)采樣點(diǎn)。
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的車輛顏色識(shí)別方法,其特征在于,所述步驟(1.3)具體為:對(duì)每個(gè)采樣點(diǎn)計(jì)算=RGB分量,HSV分量,YCbCr分量,Lab分量,YUV分量,并將這5個(gè)顏色分量拼接成一個(gè)15維向量,即為該采樣點(diǎn)的顏色特征向量。
5.根據(jù)權(quán)利要求3或4所述的車輛顏色識(shí)別方法,其特征在于,所述步驟(1.4)具體為:將16個(gè)采樣點(diǎn)的15維向量拼接成一個(gè)240維向量,即為圖像塊的顏色特征向量。
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的車輛顏色識(shí)別方法,其特征在于,所述步驟(2.1)具體為:對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像,首先將訓(xùn)練圖像進(jìn)行尺度變換變成640像素*480像素大小,然后以8個(gè)像素為步長,采集大小為16*16的圖像塊。
7.根據(jù)權(quán)利要求1至6任一項(xiàng)所述的車輛顏色識(shí)別方法,其特征在于,所述步驟(2.4)包括以下子步驟: (2.4.1)在原訓(xùn)練圖像上將所有采樣點(diǎn)根據(jù)編碼本進(jìn)行直方圖統(tǒng)計(jì),每個(gè)字典各為一類進(jìn)行統(tǒng)計(jì),得到屬于該類的采樣點(diǎn)數(shù)目,從而得到一個(gè)N維的向量,N為編碼本中字的數(shù)量。 (2.4.2)將原訓(xùn)練圖像分成2*2共4個(gè)分塊,針對(duì)每個(gè)分塊重復(fù)(2.4.1)的計(jì)算過程,最后得到4個(gè)N維的向量。 (2.4.3)將原訓(xùn)練圖像分成4*4共16個(gè)分塊,針對(duì)每個(gè)分塊重復(fù)(2.4.1)的計(jì)算過程,最后得到16個(gè)N維的向量。 (2.4.4)將上述4個(gè)步驟得到的特征向量拼接起來,得到一個(gè)21 XN維向量,這個(gè)向量就是該訓(xùn)練圖像空間金字塔特征向量。
8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的車輛顏色識(shí)別方法,其特征在于,所述步驟(2.5)具體為:訓(xùn)練一個(gè)直方圖交叉核(histogram intersection)的支持向量機(jī)分類器。
9.一種基于匹配的車輛顏色識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)包括編碼本生成模塊,分類器訓(xùn)練模塊以及待識(shí)別圖像識(shí)別模塊,其中: 所述編碼本生成模塊,用于利用訓(xùn)練圖像集合訓(xùn)練用于對(duì)圖像塊特征向量進(jìn)行編碼的編碼本,具體包括: 圖像塊獲取模塊,用于對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機(jī)取圖像塊; 圖像塊采樣模塊,用于對(duì)每個(gè)圖像塊進(jìn)行采樣,獲得采樣點(diǎn); 顏色特征向量計(jì)算模塊,用于計(jì)算每個(gè)采樣點(diǎn)的顏色特征向量; 圖像塊特征向量計(jì)算模塊,用于將每個(gè)圖像塊中的所有采樣點(diǎn)的顏色特征向量拼接成圖像塊的特征向量; 編碼本生成模塊,用于對(duì)每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進(jìn)行k-means聚類,將所述聚類的結(jié)果作為編碼本; 所述分類器訓(xùn)練模塊,用于訓(xùn)練分類器,具體包括: 圖像塊采集模塊,用于對(duì)訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊; 圖像塊特征向量計(jì)算模塊,用于求取每個(gè)圖像塊的特征向量; 圖像塊特征向量編碼模塊,用于利用編碼本對(duì)圖像塊特征向量進(jìn)行編碼; 金字塔特征向量生成模塊,用于利用空間金字塔模型計(jì)算每張訓(xùn)練圖像的空間金字塔特征向量; 支持向量機(jī)分類器訓(xùn)練模塊,用于利用所有訓(xùn)練圖像的空間金字塔特征向量訓(xùn)練支持向量機(jī)分類器; 所述待識(shí)別圖像識(shí)別模塊,用于識(shí)別待識(shí)別圖像中車輛的顏色,具體包括: 空間金字塔特征向量計(jì)算模塊,用于計(jì)算待識(shí)別圖像的空間金字塔特征向量; 待識(shí)別圖像識(shí)別子模塊,用于利用支持向量機(jī)分類器,對(duì)待識(shí)別圖像的空間金字塔特征向量進(jìn)行分類,輸出待識(shí)別圖像中車輛顏色的識(shí)別結(jié)果。
【文檔編號(hào)】G06K9/46GK103996041SQ201410205581
【公開日】2014年8月20日 申請(qǐng)日期:2014年5月15日 優(yōu)先權(quán)日:2014年5月15日
【發(fā)明者】陳瑞軍, 白翔, 陳攀, 王興剛, 肖可偉 申請(qǐng)人:武漢睿智視訊科技有限公司