本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,特別涉及一種基于中層語(yǔ)義屬性特征和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi)方法。
背景技術(shù):
合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)是一種用于地面目標(biāo)物體成像的雷達(dá)系統(tǒng)。SAR憑借其高分辨率、全天時(shí)和全天候的特性,成為了地面觀測(cè)的重要工具。SAR圖像分類(lèi)是遙感圖像解譯的一個(gè)重要組成部分,在農(nóng)林業(yè)規(guī)劃、災(zāi)害監(jiān)測(cè)、環(huán)境保護(hù)、軍事偵察等領(lǐng)域都有著廣泛的應(yīng)用。
隨著高分辨率SAR圖像技術(shù)的發(fā)展,傳統(tǒng)的SAR圖像分類(lèi)技術(shù)的效果越來(lái)越差。同時(shí),也為SAR圖像新特征的發(fā)展帶來(lái)了更大的挑戰(zhàn)。高層語(yǔ)義特征表達(dá)被普遍認(rèn)為是更具有判別性的新的SAR圖像特征。詞袋模型(Bag of Word,BoW)是一種中層語(yǔ)義特征。BoW已經(jīng)廣泛應(yīng)用于遙感圖像的圖像注釋、物體分類(lèi)和目標(biāo)檢測(cè)等領(lǐng)域。但是對(duì)于SAR圖像的中層語(yǔ)義特征研究工作目前仍比較少,有部分工作是基于BoW的,比如BoW-MVR是基于均值比率檢測(cè)子的中層特征。但是,普通BoW模型都是基于低層像素級(jí)別的特征得到的。而且,簡(jiǎn)單聚類(lèi)得到的BoW特征往往缺乏直觀上的含義。在后面的特征選擇中很難引入人工先驗(yàn),在實(shí)際實(shí)驗(yàn)中得到的特征缺乏準(zhǔn)確的物理含義。
卷積神經(jīng)網(wǎng)絡(luò)是目前最成功的圖像特征學(xué)習(xí)模型之一。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于它能夠自動(dòng)學(xué)習(xí)提取數(shù)據(jù)中具有判別性且高層次的語(yǔ)義特征從而實(shí)現(xiàn)圖像分類(lèi),但是當(dāng)它直接應(yīng)用于SAR圖像分類(lèi)上的效果并不是很好。其中一個(gè)重要的原因就是,SAR圖像的數(shù)據(jù)量有限,目前沒(méi)有可用的大量的SAR圖像數(shù)據(jù)用來(lái)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于結(jié)合中層語(yǔ)義特征和卷積神經(jīng)網(wǎng)絡(luò)解決普通中層特征聚類(lèi)判別性不足和SAR圖像卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的不足。提出了用于SAR圖像分類(lèi)的中層特征判別性聚類(lèi)算法,以及基于篩選得到判別性中層圖像塊作為屬性表示卷積神經(jīng)網(wǎng)絡(luò)提取高層語(yǔ)義特征的方法。用該方法得到的高層語(yǔ)義特征相對(duì)目前的紋理特征和BoW特征,對(duì)于SAR圖像有較好的分類(lèi)效果。
本發(fā)明的技術(shù)方案為一種基于中層語(yǔ)義屬性和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi)方法,包括以下步驟:
步驟1,對(duì)待分類(lèi)的SAR圖像進(jìn)行中層語(yǔ)義屬性特征圖像塊的提取,包括以下子步驟,
步驟1.1,準(zhǔn)備待分類(lèi)SAR圖像數(shù)據(jù)集和負(fù)樣本SAR圖像數(shù)據(jù)集,從待分類(lèi)圖像和負(fù)樣本圖像中提取隨機(jī)圖像塊的MVR特征;
步驟1.2,對(duì)待分類(lèi)圖像中提取的隨機(jī)圖像塊的MVR特征進(jìn)行k-means聚類(lèi)和迭代檢測(cè),并獲得字典;
步驟1.3,根據(jù)純度和判別度的線性組合值將字典進(jìn)行排列,篩選出l個(gè)最具有判別性的聚類(lèi)中心作為SAR圖像屬性,l為預(yù)設(shè)的數(shù)值;
步驟2,基于屬性和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi),包括以下子步驟,
步驟2.1,利用步驟1得到所有待分類(lèi)SAR圖像的屬性訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò);
步驟2.2,將圖像的全局特征和每個(gè)屬性的卷積神經(jīng)網(wǎng)絡(luò)特征串聯(lián),生成最終特征;
步驟2.3,用支持向量機(jī)對(duì)提取的最終特征進(jìn)行分類(lèi)。
而且,所述步驟1.1中從待分類(lèi)圖像和負(fù)樣本圖像中提取隨機(jī)圖像塊的MVR特征的實(shí)現(xiàn)如下,
(a)設(shè)有包含M張待分類(lèi)SAR圖像的數(shù)據(jù)集D,和包含N張負(fù)樣本SAR圖像的數(shù)據(jù)集N,分別將數(shù)據(jù)集D和N平均分成兩個(gè)不重疊的子數(shù)據(jù)集D1,D2和N1,N2,所有數(shù)據(jù)集圖像的大小為n×n;
(b)設(shè)D1中待分類(lèi)圖像Tk,計(jì)算Tk圖像L個(gè)尺度的MVR特征金字塔為Pk,其中,MVR特征為向量(L,R),其中L=m2/v,m,v分別表示訓(xùn)練圖像Tk的局部均值和局部方差;均值比率R為邊緣響應(yīng)的最大值,表示如下,
R=max(ri) (1)
其中,ri表示邊緣響應(yīng),i表示方向,i=0,…,3,i=0表示水平方向,i=1表示+45°方向,i=2表示垂直方向,i=3表示-45°方向;將MVR特征金字塔Pk轉(zhuǎn)換為單個(gè)特征矩陣,Pk表示所有尺度下的特征;
(c)通過(guò)高斯低通濾波器計(jì)算得到圖像Tk每個(gè)像素的概率分布,并隨機(jī)取s個(gè)圖像塊,得到子數(shù)據(jù)集D1的MVR特征作為正樣本MVR特征;同時(shí),從負(fù)樣本子數(shù)據(jù)集N1中隨機(jī)抽樣得到負(fù)樣本MVR特征;
(d)按照(b)(c)同樣的方式,獲取子數(shù)據(jù)集D2和N2的MVR特征。
而且,所述步驟1.2中對(duì)待分類(lèi)圖像中提取的隨機(jī)圖像塊的MVR特征進(jìn)行k-means聚類(lèi)和迭代檢測(cè),并獲得字典的實(shí)現(xiàn)如下,
1)設(shè)聚類(lèi)中心數(shù)量其中,s表示子數(shù)據(jù)集D1中隨機(jī)提取的圖像塊個(gè)數(shù);
2)刪除D1中少于3個(gè)區(qū)域塊的聚類(lèi)中心;
3)為D1的每個(gè)聚類(lèi)中心訓(xùn)練一個(gè)線性SVM分類(lèi)器,用聚類(lèi)中心的所有區(qū)域塊作為正樣本,并用N1中所有的區(qū)域塊作為負(fù)樣本訓(xùn)練該分類(lèi)器;
4)用訓(xùn)練好的分類(lèi)器在驗(yàn)證集D2上作檢測(cè),并且將每個(gè)分類(lèi)器預(yù)測(cè)SVM分?jǐn)?shù)大于-1的區(qū)域塊組成新的聚類(lèi)中心;
5)交換數(shù)據(jù)集D1,N1和D2,N2,以D2,N2訓(xùn)練SVM分類(lèi)器,并在驗(yàn)證集D1上作檢測(cè),返回重復(fù)(1)-(5),直到滿(mǎn)足每個(gè)聚類(lèi)中的區(qū)域塊不再變化,得到字典。
而且,所述步驟1.3中根據(jù)純度和判別度的線性組合值將字典進(jìn)行排列,篩選出l個(gè)最具有判別性的聚類(lèi)中心作為SAR圖像屬性的實(shí)現(xiàn)如下,
設(shè)純度和判別度的線性組合值A(chǔ)(K[j])表示如下,
A(K[j])=pur(K[j])+λ·discrim(K[j]) (2)
其中,K[j]表示第j個(gè)聚類(lèi)中心,pur(·)表示純度,discrim(·)表示判別度,系數(shù)λ∈(0,1)。
而且,所述步驟2.1中的卷積神經(jīng)網(wǎng)絡(luò)包括1個(gè)輸入層、3個(gè)卷積層、2個(gè)下采樣層、1個(gè)全連接層和1個(gè)輸出層,卷積神經(jīng)網(wǎng)絡(luò)用反向傳導(dǎo)和隨機(jī)梯度下降算法訓(xùn)練。
本發(fā)明的局部特征MVR基于能夠抵抗相干斑噪聲干擾的均值比率,通過(guò)對(duì)一組龐大的多尺度的SAR圖像塊進(jìn)行一種迭代判別式聚類(lèi)和檢測(cè),挖掘出具有判別性的屬性圖像塊表達(dá),再通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)屬性圖像塊中包含的語(yǔ)義屬性特征進(jìn)行學(xué)習(xí)。本發(fā)明提出的一種基于屬性和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi)方法,通過(guò)學(xué)習(xí)SAR圖像中的中高層語(yǔ)義特征,從而提高SAR圖像分類(lèi)的準(zhǔn)確率。
附圖說(shuō)明
圖1本發(fā)明實(shí)施例的中層語(yǔ)義屬性特征圖像塊的提取流程圖。
圖2本發(fā)明實(shí)施例的基于屬性和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi)架構(gòu)說(shuō)明圖。
圖3本發(fā)明實(shí)施例的均值比率的局部窗和方向說(shuō)明圖。
圖4本發(fā)明實(shí)施例的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)說(shuō)明圖。
具體實(shí)施方式
以下結(jié)合附圖和實(shí)施例詳細(xì)說(shuō)明本發(fā)明技術(shù)方案。
SAR圖像具有乘性相干斑噪聲、極低信噪比和訓(xùn)練數(shù)據(jù)量少等特點(diǎn),本發(fā)明提供的基于均值比率的局部特征MVR能夠很好地抵抗相干斑噪聲的影響,較好地描述復(fù)雜結(jié)構(gòu)信息;通過(guò)在聚類(lèi)和判別式檢測(cè)器之間不斷優(yōu)化和交叉驗(yàn)證,選擇聚類(lèi),從而提高中層圖像塊的代表性和判別性;將中層判別式圖像塊作為屬性卷積神經(jīng)網(wǎng)絡(luò)的輸入,克服訓(xùn)練數(shù)據(jù)不足的局限,深度學(xué)習(xí)得到語(yǔ)義屬性組合特征對(duì)SAR圖像的分類(lèi)有較好的效果。
本發(fā)明方法的中層表達(dá)通過(guò)基于低層MVR特征,生成一組中層的視覺(jué)字典;引入了聚類(lèi)和判別式分類(lèi)器迭代的算法,并且通過(guò)篩選得到一組最具判別性的、多尺度的語(yǔ)義字典作為屬性表示;還通過(guò)引入卷積神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)語(yǔ)義屬性特征,并結(jié)合SAR圖像全局特征實(shí)現(xiàn)圖像分類(lèi)。這種基于屬性級(jí)別的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)(CNN),使得深度學(xué)習(xí)更加具有針對(duì)性,而且同時(shí)也解決了訓(xùn)練數(shù)據(jù)不足的問(wèn)題,學(xué)習(xí)得到的屬性特征具有高層語(yǔ)義性。
本發(fā)明實(shí)施例可采用計(jì)算機(jī)軟件技術(shù)實(shí)現(xiàn)自動(dòng)流程運(yùn)行,包括兩個(gè)階段,中層語(yǔ)義屬性特征圖像塊的提取階段以及基于屬性和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi)階段。
如圖1,本發(fā)明實(shí)施例的中層語(yǔ)義屬性特征圖像塊的提取階段包括以下3個(gè)步驟:
步驟1.1,準(zhǔn)備待分類(lèi)SAR圖像數(shù)據(jù)集和負(fù)樣本SAR圖像數(shù)據(jù)集,從待分類(lèi)圖像和負(fù)樣本圖像中提取隨機(jī)圖像塊的MVR特征,實(shí)現(xiàn)方式如下:
a.設(shè)在執(zhí)行之前需要準(zhǔn)備好M張待分類(lèi)SAR圖像數(shù)據(jù)集D,和N張負(fù)樣本SAR圖像數(shù)據(jù)集N,這里的負(fù)樣本數(shù)據(jù)集N和數(shù)據(jù)集D來(lái)自于同一種雷達(dá)系統(tǒng)但是屬于不同類(lèi)別的圖像;分別將數(shù)據(jù)集D和N平均分成兩個(gè)不重疊的子數(shù)據(jù)集D1,D2和N1,N2,用于交叉驗(yàn)證;所有數(shù)據(jù)集圖像的大小為n×n;
b.設(shè)D1中有某待分類(lèi)圖像Tk,計(jì)算Tk圖像L個(gè)尺度的MVR特征金字塔為Pk,其中,M為待分類(lèi)的圖像張數(shù);MVR特征為向量(L,R),其中L=m2/v,m,v分別表示訓(xùn)練圖像Tk的局部均值和局部方差,局部窗參見(jiàn)圖3,即MVR特征提取窗口;均值比率R為邊緣響應(yīng)的最大值,可表示如下:
R=max(ri) (1)
其中,ri表示邊緣響應(yīng),i表示方向(i=0,…,3),i=0表示水平方向,i=1表示+45°方向,i=2表示垂直方向,i=3表示-45°方向;均值比率R的局部窗和方向說(shuō)明圖參見(jiàn)圖3,其中,(a)表示局部窗,xc為圖像塊的中心點(diǎn),(b)-(e)分別為水平、+45°、垂直以及-45°方向檢測(cè)模板;將MVR特征金字塔Pk轉(zhuǎn)換為單個(gè)特征矩陣,即Pk表示所有尺度下的特征,具體轉(zhuǎn)換為現(xiàn)有技術(shù),本發(fā)明不予贅述;具體實(shí)施時(shí),最小尺寸圖像塊的大小與MVR特征提取窗口大小一致;
c.通過(guò)高斯低通濾波器計(jì)算得到圖像Tk每個(gè)像素的概率分布,具體計(jì)算為現(xiàn)有技術(shù),本發(fā)明不予贅述;并隨機(jī)取s個(gè)圖像塊,得到子數(shù)據(jù)集D1的MVR特征作為正樣本MVR特征;同時(shí),從負(fù)樣本子數(shù)據(jù)集N1中隨機(jī)抽樣得到s個(gè)負(fù)樣本MVR特征,本領(lǐng)域技術(shù)人員可根據(jù)實(shí)際情況選取隨機(jī)抽樣數(shù)量s;
d.針對(duì)子數(shù)據(jù)集D2和N2重復(fù)步驟b、c同樣的處理,以獲取子數(shù)據(jù)集D2和N2的MVR特征。
步驟1.2,對(duì)待分類(lèi)圖像中提取的隨機(jī)圖像塊的MVR特征進(jìn)行k-means聚類(lèi)和迭代檢測(cè),并獲得字典,實(shí)現(xiàn)方式如下:
6)設(shè)聚類(lèi)中心數(shù)量其中,s表示子數(shù)據(jù)集D1中隨機(jī)提取的圖像塊個(gè)數(shù);
7)刪除D1中少于3個(gè)區(qū)域塊的聚類(lèi)中心;
8)為D1的每個(gè)聚類(lèi)中心訓(xùn)練一個(gè)線性SVM分類(lèi)器,用聚類(lèi)中心的所有區(qū)域塊作為正樣本,并用N1中所有的區(qū)域塊作為負(fù)樣本訓(xùn)練該分類(lèi)器;
9)用訓(xùn)練好的分類(lèi)器在驗(yàn)證集D2上作檢測(cè),并且將每個(gè)分類(lèi)器預(yù)測(cè)SVM分?jǐn)?shù)大于-1的區(qū)域塊組成新的聚類(lèi)中心;
10)交換數(shù)據(jù)集D1,N1和D2,N2,即以D2,N2訓(xùn)練SVM分類(lèi)器,并在驗(yàn)證集D1上作檢測(cè),重復(fù)(2)-(5),直到滿(mǎn)足收斂條件,即每個(gè)聚類(lèi)中的區(qū)域塊不再變化,得到字典,即表示圖像的基元。
步驟1.3,根據(jù)純度和判別度的線性組合值A(chǔ)(K[j])將字典進(jìn)行排列,篩選出l個(gè)最具有判別性的聚類(lèi)中心作為SAR圖像屬性,其中A(K[j])表示如下:
A(K[j])=pur(K[j])+λ·discrim(K[j]) (2)
其中,K[j]表示第j個(gè)聚類(lèi)中心,pur(·)表示純度,discrim(·)表示判別度,系數(shù)λ∈(0,1)。純度和判別度的具體實(shí)現(xiàn)為現(xiàn)有技術(shù),本發(fā)明不予贅述。具體實(shí)施時(shí),本領(lǐng)域技術(shù)人員可預(yù)設(shè)的l取值。
如圖2,本發(fā)明實(shí)施例中基于屬性和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi)階段包括以下3個(gè)步驟:
步驟2.1,利用步驟1得到所有待分類(lèi)SAR圖像的屬性(參見(jiàn)相應(yīng)所求得的MVR特征)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。
本發(fā)明實(shí)施例中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)說(shuō)明參見(jiàn)圖4,其中包括1個(gè)輸入層、3個(gè)卷積層、2個(gè)下采樣層、1個(gè)全連接層和1個(gè)輸出層,整個(gè)網(wǎng)絡(luò)用一般的反向傳導(dǎo)和隨機(jī)梯度下降算法訓(xùn)練(具體實(shí)現(xiàn)為現(xiàn)有技術(shù),本發(fā)明不予贅述)。
本卷積神經(jīng)網(wǎng)絡(luò)共有8層,每層的具體結(jié)構(gòu)分別為:
(1)輸入層:輸入數(shù)據(jù)為64×64像素的SAR圖像。
(2)C1層:該層為卷積層,卷積核大小為5×5,卷積深度為20,輸出為60×60的特征映射。
(3)S2層:該層為下采樣層。窗口尺寸為4×4。
(4)C3層:該層為卷積層,卷積核大小為5×5,卷積深度為50,輸出為11×11的特征映射。
(5)S4層:該層為下采樣層,窗口尺寸為4×4。
(6)C5層:該層為卷積層,卷積核大小為5×5,卷積深度為500,輸出1×1的特征映射。
(7)F6層:該層為全連接層,包含500個(gè)神經(jīng)元。
(8)輸出層:由7個(gè)歐氏徑向基函數(shù)構(gòu)成。
步驟2.2,將圖像的全局特征和每個(gè)屬性的卷積神經(jīng)網(wǎng)絡(luò)特征串聯(lián),生成最終特征。
步驟2.3,用支持向量機(jī)對(duì)提取的最終特征進(jìn)行分類(lèi)。
參見(jiàn)圖2基于屬性和卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像分類(lèi)架構(gòu)說(shuō)明,首先根據(jù)步驟1提取待檢測(cè)SAR圖像中前l(fā)個(gè)最具有判別性的聚類(lèi)中心作為SAR圖像屬性,利用卷積神經(jīng)網(wǎng)絡(luò)提取每個(gè)屬性的特征和圖像的全局特征,然后將全局特征與每個(gè)屬性的卷積神經(jīng)網(wǎng)絡(luò)特征串聯(lián),得到最終的特征,最后通過(guò)SVM實(shí)現(xiàn)SAR圖像的分類(lèi)。即步驟1得到了用于表示圖像的字典;步驟2中提取到特征后,與字典中的特征進(jìn)行匹配;不同類(lèi)別的圖像,在字典中匹配到的特征不同;就某一特定類(lèi),為了得到對(duì)應(yīng)的特征表示,需要用訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,以此學(xué)習(xí)到用于描述該類(lèi)的特征。
本文中所描述的具體實(shí)施例僅僅是對(duì)本發(fā)明精神作舉例說(shuō)明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對(duì)所描述的具體實(shí)施例做各種各樣的修改或補(bǔ)充或采用類(lèi)似的方式替代,但并不會(huì)偏離本發(fā)明的精神或者超越所附權(quán)利要求書(shū)所定義的范圍。