專利名稱:基于半監(jiān)督流形學(xué)習(xí)的多光譜遙感數(shù)據(jù)土地利用分類方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于多光譜遙感數(shù)據(jù)土地利用分類方法,特別涉及一種半監(jiān)督流 形學(xué)習(xí)的適用于多光譜數(shù)據(jù)土地利用分類的方法。
背景技術(shù):
人們從20世紀(jì)60年代就開始用多光譜技術(shù)獲取地球表面信息。多光譜成像是利 用多光譜攝影系統(tǒng)或多光譜掃描系統(tǒng)對電磁波譜不同譜段做同步攝影遙感,分別獲得植被 及其他地物在不同譜段上的影像的遙感技術(shù)。多光譜掃描儀(Multi-spectral Scanner, MSS)是一種光譜測量傳感器,它通過記錄地物對不同光譜波段的響應(yīng)來獲取地物信息。多 光譜成像是通過掃描的方式完成的。對于每一個分辨率大小的地面區(qū)域,MSS—次可獲取多 個光譜響應(yīng)值,每個值對應(yīng)一個光譜波段。國際遙感界的共識是光譜分辨率在λ/10數(shù)量 級范圍的稱為多光譜(Multi-spectral),這樣的遙感器在可見光和近紅外光譜區(qū)只有幾個 波段,如美國Landsat MSS,TM,法國的SPOT等。多光譜遙感圖像的特點(diǎn)①工作波段寬,從 近紫外、可見光到熱紅外波段,波長范圍達(dá)0. 35 20微米;②各波段的數(shù)據(jù)容易配準(zhǔn)。這 兩個特點(diǎn)非其他遙感器所能具有,因而多光譜掃描儀是氣象衛(wèi)星和“陸地衛(wèi)星”的主要遙感 器。隨著傳感器技術(shù)的進(jìn)步,新型多光譜傳感器的光譜分辨率達(dá)到了納米級,空間分辨率達(dá) 到了米級。在相關(guān)領(lǐng)域具有廣泛的應(yīng)用和發(fā)展空間。在遙感圖像的實際使用中,數(shù)據(jù)集較 以往有了顯著的變化,其主要特點(diǎn)可以歸納為高數(shù)據(jù)量、高維數(shù)、高數(shù)據(jù)增長率以及高分 辨率。隨著多光譜傳感器的空間分辨率不斷地提高,人們可以從遙感圖像中獲得更多的 有用的數(shù)據(jù)和信息。多光譜圖像數(shù)據(jù)也越來越多的被用于土地利用和覆被監(jiān)測領(lǐng)域中來, 這就不可避免的遇到一個關(guān)鍵環(huán)節(jié)一多光譜圖像分類,用計算機(jī)對多光譜遙感圖像進(jìn)行 土地利用分類時,多光譜圖像數(shù)據(jù)一般數(shù)據(jù)量較大,把不同傳感器得到的遙感圖像進(jìn)行融 合使用時數(shù)據(jù)量更大。多光譜圖像數(shù)據(jù)的土地利用分類,通常是建立在不同地物在各波段 反射的電磁波譜差別的基礎(chǔ)上的。若以各波段接收到的電磁波強(qiáng)度為坐標(biāo),則η個波段可 形成η維波譜空間。各波段上同一像元對應(yīng)于N維空間的一個點(diǎn),而同類地物可形成一個 點(diǎn)集。多光譜遙感數(shù)據(jù)土地利用分類的基本原理在于把波譜空間中的點(diǎn)集區(qū)分開來,多光 譜圖像分類中,由于數(shù)據(jù)維數(shù)較高、有類別標(biāo)簽的地面樣本獲取代價比較大,所以有類別標(biāo) 簽的訓(xùn)練樣本數(shù)量通常很有限,傳統(tǒng)的模式識別方法(如貝葉斯方法,神經(jīng)網(wǎng)絡(luò)等)大多是 以經(jīng)典統(tǒng)計學(xué)為基礎(chǔ),在假設(shè)訓(xùn)練樣本數(shù)目足夠多的前提下進(jìn)行研究的,這些方法只有當(dāng) 訓(xùn)練樣本數(shù)目趨于無窮大時其性能才能達(dá)到理論上的最優(yōu)。目前多光譜遙感數(shù)據(jù)土地利用 分類主要集中兩步,首先對多光譜遙感數(shù)據(jù)進(jìn)行分類前的處理一特征提取,這一步主要 目的是既可以消除原圖像中對分類或其他處理不利的外部影響因素,又可以消除原圖像各 波段間的數(shù)據(jù)相關(guān)性從而避免許多無效的數(shù)據(jù)處理。其次再選擇合適的分類器進(jìn)行多光譜 遙感數(shù)據(jù)土地利用分類。針對高光譜圖像分類問題,研究者提出如下兩方面技術(shù),一是把機(jī)器學(xué)習(xí)引入到多光譜圖像分類中,力圖在多光譜數(shù)據(jù)中通過機(jī)器學(xué)習(xí)發(fā)現(xiàn)數(shù)據(jù)內(nèi)部的變化規(guī)律;二是尋 求或改進(jìn)更有效的分類算法;按照地物分類時是否需要訓(xùn)練樣本,這些方法可大致分為兩 類監(jiān)督分類和非監(jiān)督分類。由于多光譜圖像有類別標(biāo)簽的訓(xùn)練樣本獲取的代價比較大,樣 本數(shù)目非常有限,所以使用監(jiān)督分類效果就有些局限性,雖然非監(jiān)督分類不使用任何關(guān)于 數(shù)據(jù)的先驗信息,但是分類效果通常較差。因此,把半監(jiān)督流形學(xué)習(xí)方法弓I入進(jìn)多光譜遙感 數(shù)據(jù)土地利用分類中,即通過對訓(xùn)練樣本的學(xué)習(xí),掌握數(shù)據(jù)內(nèi)部隱含的規(guī)律,實現(xiàn)對未來樣 本的準(zhǔn)確判決?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方面,研究從觀測數(shù)據(jù)(訓(xùn)練樣 本)出發(fā)尋找尚不能通過原理分析得到的規(guī)律,利用這些規(guī)律對未來數(shù)據(jù)或無法觀測的數(shù) 據(jù)進(jìn)行預(yù)測?,F(xiàn)實世界中存在大量目前無法準(zhǔn)確認(rèn)識但卻可以進(jìn)行觀察的事物,因此,把機(jī) 器學(xué)習(xí)引入到多光譜遙感數(shù)據(jù)土地利用分類中來是十分有必要的,數(shù)據(jù)經(jīng)過投影,通過半 監(jiān)督流形學(xué)習(xí)法來發(fā)現(xiàn)數(shù)據(jù)內(nèi)部的變化規(guī)律,提高識別精度,這樣既比非監(jiān)督方法精度要 好,又可以彌補(bǔ)使用監(jiān)督方法時樣本獲取代價過高的缺點(diǎn)。基于數(shù)據(jù)的機(jī)器學(xué)習(xí)在現(xiàn)代科 學(xué)、技術(shù)、經(jīng)濟(jì)、社會等各個領(lǐng)域都發(fā)揮著十分重要作用。
發(fā)明內(nèi)容
有鑒于此,為了解決上述問題,本發(fā)明提出一種把機(jī)器學(xué)習(xí)引入到遙感圖像分類 中,融合半監(jiān)督學(xué)習(xí)和流形學(xué)習(xí)的方法,對投影后的多光譜數(shù)據(jù)的進(jìn)行訓(xùn)練來找出數(shù)據(jù)內(nèi) 部的流行變化規(guī)律;同時將用戶先驗知識提供的標(biāo)注信息融入到半監(jiān)督流形學(xué)習(xí)中,并用 于多光譜遙感圖像土地利用分類。本發(fā)明的目的是提出一種基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方 法;本發(fā)明的目的是這樣實現(xiàn)的本發(fā)明提供的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,包括以下步 驟(1)讀入多光譜遙感圖像數(shù)據(jù);(2)讀入多光譜遙感圖像中選取多個樣本數(shù)據(jù)點(diǎn),對每一個樣本數(shù)據(jù)點(diǎn)根據(jù)其波 段生成一個向量,然后將所得向量組成矩陣,作為樣本數(shù)據(jù)集;(3)根據(jù)先驗知識從樣本數(shù)據(jù)集中選取部分樣本數(shù)據(jù)進(jìn)行已知地物類別的標(biāo)注, 生成樣本類別標(biāo)簽;(4)通過樣本類別標(biāo)簽來構(gòu)建度量數(shù)據(jù)點(diǎn)的相似性與相異性的相似圖和相異圖;(5)利用熱核構(gòu)建相似圖的權(quán)重矩陣;(6)根據(jù)樣本數(shù)據(jù)集和權(quán)重矩陣來計算局部相似結(jié)構(gòu)矩陣和全局相異結(jié)構(gòu)矩陣;(7)通過全局相異結(jié)構(gòu)矩陣和優(yōu)化目標(biāo)函數(shù)來計算多光譜遙感圖像的投影矩陣;(8)通過投影矩陣對整幅多光譜遙感數(shù)據(jù)進(jìn)行投影;(9)對投影后的整幅多光譜遙感數(shù)據(jù)用K-近鄰分類算法進(jìn)行分類;(10)輸出多光譜遙感數(shù)據(jù)地物分類圖。進(jìn)一步,所述步驟O)中的訓(xùn)練樣本集通過以下方式實現(xiàn)根據(jù)不同波段對地物的光譜反射特性,把多光譜遙感圖像數(shù)據(jù)變?yōu)槿S數(shù)據(jù),X =Ix1, X2, ·,%XN}T,其中MXN是圖像的空間尺寸,B表示波段數(shù),矩陣的每一列表示一個波段 的數(shù)據(jù)值,每一行表示多光譜遙感圖像數(shù)據(jù)中的一個點(diǎn)。進(jìn)一步,所述步驟(3)中的樣本類別標(biāo)簽通過以下方式實現(xiàn)根據(jù)先驗知識從訓(xùn) 練樣本集中選取部分樣本數(shù)據(jù)進(jìn)行已知地物類別的標(biāo)注,生成樣本類別標(biāo)簽X — { (X” ]_ι),(Χ。,2),·,(Xe,1。),Xc+i,Xc+2,· · ·,XmxiJ式中Ii為對數(shù)據(jù)點(diǎn)Xi標(biāo)注的地物類別標(biāo)簽,前C個點(diǎn)具有類別信息,其余的 MXN-C個為無類別標(biāo)簽樣本點(diǎn)。進(jìn)一步,所述步驟(4)中的相似圖和相異圖包括以下步驟1)將樣本數(shù)據(jù)點(diǎn)分成相似圖( 和相異圖GD,在相似圖( 和相異圖&的節(jié)點(diǎn)之間 采用k最臨近方法k-NN方法定義兩個圖中的邊;2)每一點(diǎn)\對Xi,若\ e knns (Xi),即每一點(diǎn)對(Xi,Xj),兩者為近鄰且相似度較 高,則用一條邊連接圖( 中Xi和\兩點(diǎn);3)若\ e knnD(Xi),即相似度較低,則用一條邊連接圖中Xi和\兩點(diǎn);式中如= {x;,^,·,xf }為點(diǎn)Xi的k個近鄰點(diǎn)組成的子集,對每一點(diǎn)Xi,近鄰數(shù) 據(jù)集krm(Xi)可以分為兩部分knnD(Xi)與knns(Xi),其中knnD(Xi)表示近鄰點(diǎn)來自于不同 類樣本點(diǎn),knns(Xi)則為krm(Xi)中其余部分,需要進(jìn)一步說明的是,knns (Xi)中部分樣本可 能不包含類別信息,但是這些樣本距離Xi足夠的近,krm (Xi)同knnD(Xi)和knns (Xi)之間的 關(guān)系可用下式來表示knnD (xt) = {xj | if I1 Φ Ij}Ioms(Xi) = knn (Xi) _knnD (Xi)顯然,如 <Χ)η^ ^(Χ)= 0, Imns(Xi) U knnD(Xi) = knn (Xi);根據(jù)knnD (Xi)和knns (Xi),就可以構(gòu)建相似圖( 和相異圖(^。進(jìn)一步,所述步驟(5)中權(quán)重矩陣通過以下方式實現(xiàn)
權(quán)利要求
1.基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特征在于包括以下步驟(1)讀入多光譜遙感圖像數(shù)據(jù);(2)讀入多光譜遙感圖像中選取多個樣本數(shù)據(jù)點(diǎn),對每一個樣本數(shù)據(jù)點(diǎn)根據(jù)其波段生 成一個向量,然后將所得向量組成矩陣,作為樣本數(shù)據(jù)集;(3)根據(jù)先驗知識從樣本數(shù)據(jù)集中選取部分樣本數(shù)據(jù)進(jìn)行已知地物類別的標(biāo)注,生成 樣本類別標(biāo)簽;(4)通過樣本類別標(biāo)簽來構(gòu)建度量數(shù)據(jù)點(diǎn)的相似性與相異性的相似圖和相異圖;(5)利用熱核構(gòu)建相似圖和相異圖的權(quán)重矩陣;(6)根據(jù)樣本數(shù)據(jù)集和權(quán)重矩陣來計算局部相似結(jié)構(gòu)矩陣和全局相異結(jié)構(gòu)矩陣;(7)通過全局相異結(jié)構(gòu)矩陣和優(yōu)化目標(biāo)函數(shù)來計算多光譜遙感圖像的投影矩陣;(8)通過投影矩陣對整幅多光譜遙感數(shù)據(jù)進(jìn)行投影;(9)對投影后的整幅多光譜遙感數(shù)據(jù)用K-近鄰分類算法進(jìn)行分類;(10)輸出多光譜遙感數(shù)據(jù)地物分類圖。
2.根據(jù)權(quán)利要求1所述的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特 征在于所述步驟O)中的訓(xùn)練樣本集通過以下方式實現(xiàn)根據(jù)不同波段對地物的光譜反射特性,把多光譜遙感圖像數(shù)據(jù)變?yōu)镸XNXB的三維數(shù) 據(jù),Xaii = {x1 x2, ·,%ΧΝ}Τ,其中MXN是圖像的空間尺寸,B表示波段數(shù),矩陣的每一列表 示一個波段的數(shù)據(jù)值,每一行表示多光譜遙感圖像數(shù)據(jù)中的一個點(diǎn)。
3.根據(jù)權(quán)利要求1所述的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特 征在于所述步驟(3)中的樣本類別標(biāo)簽通過以下方式實現(xiàn)根據(jù)先驗知識從訓(xùn)練樣本集 中選取部分樣本數(shù)據(jù)進(jìn)行已知地物類別的標(biāo)注,生成樣本類別標(biāo)簽X — { (Χι,]" ),(乂2,工2),·,(Xe,1。),Xc+i,Xc+2,· · ·,Xmxn^式中Ii為對數(shù)據(jù)點(diǎn)Xi標(biāo)注的地物類別標(biāo)簽,前C個點(diǎn)具有類別信息,其余的MXN-C個 為無類別標(biāo)簽樣本點(diǎn),X為從整幅遙感影像中的選取的部分訓(xùn)練數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特 征在于所述步驟中的相似圖和相異圖包括以下步驟41)將樣本數(shù)據(jù)點(diǎn)分成相似圖( 和相異圖(V在相似圖( 和相異圖的節(jié)點(diǎn)之間采用 k近鄰方法方法定義兩個圖中的邊;42)每一點(diǎn)\對Xi,若\e knns (Xi),即每一點(diǎn)對(Xi,Xj),則用一條邊連接圖( 中Xi 禾口 \兩點(diǎn);43)若\e knnD(Xi),則用一條邊連接圖中Xi和\兩點(diǎn);式中如/7(戈)={^,<,· 為點(diǎn)Xi的k個近鄰點(diǎn)組成的子集,對每一點(diǎn)Xi,近鄰數(shù)據(jù)集 knn(Xi)可以分為兩部分knnD(Xi)與Ioms(Xi),其中knnD(Xi)表示近鄰點(diǎn)來自于不同類樣 本點(diǎn),knns (Xi)則為krm(Xi)中其余部分,knn(Xi)同knnD(Xi)和knns (Xi)之間的關(guān)系可用 下式來表示knnD(xi) = {x]i\ifli ^lj)knns (Xi) = knn (Xi) _knnD (Xi)其中,Aw^(X.)nAw (X.) = 0,krms(Xi) υ knnD(Xi) =Imn(Xi); 44)根據(jù)knnD (Xi)和knns (Xi),構(gòu)建相似圖Gs和相異圖GD。
5.根據(jù)權(quán)利要求1所述的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特 征在于所述步驟(5)中權(quán)重矩陣通過以下方式實現(xiàn)權(quán)重矩陣為Wij = Ws, ^kijI 1 χ eknn^ix )or χ eknnn(x )其中,Wsii=I1 D 1 1 D 1’y 1 O 其它Aij定義如下‘ 2d (χ.,χ.) r 4 = exp(當(dāng)Xi GN(Xj)^X1 εN(X1){ O其它其中d2(Xi,Xj)是從\到Xj的距離,t為常數(shù)。
6.根據(jù)權(quán)利要求1所述的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特 征在于所述步驟(6)包括以下步驟61)計算相似局部結(jié)構(gòu)矩陣Sriw根據(jù)輸入的多光譜樣本數(shù)據(jù)集X和權(quán)重矩陣Wu,通過下列公式計算得到相似局部結(jié)構(gòu) 矩陣^w ι M xN MxNSlw = -Yj Σ WijXx1-X^(X1-XjY1 '=I J=I=XDsXt - XWsXt = X(Ds-WS)XT =XLSXT式中Ds是一個對角陣,且Ds, π =Σ Jij, Ls = Ds-Ws為Laplacian矩陣,T表示矩陣轉(zhuǎn)置;Slw為奇異矩陣采取如下方式計算; Srlw — Slw+SE式中&為β ΧΕ,β表示常數(shù),E表示單位矩陣,E = [1,. . .,1]τ ;62)計算全局相異結(jié)構(gòu)矩陣Srib根據(jù)輸入的多光譜樣本數(shù)據(jù)集X和權(quán)重矩陣Wu,通過下式進(jìn)行 Srlb — Slb+ST ; 其中ST, Slb定義如下 St = E { (Χ- μ ) (Χ-μ )Τ}CSlb=nYX μ「Μμτ μi=\式中PiS每類的均值;μ為總樣本的均值;η為每類含有的樣本數(shù);C是總類別數(shù); Srlb表示標(biāo)注數(shù)據(jù)和隨機(jī)選取的無標(biāo)注數(shù)據(jù)的全局相異結(jié)構(gòu)矩陣。
7.根據(jù)權(quán)利要求1所述的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特 征在于所述步驟(7)投影矩陣A通過以下方式的目標(biāo)優(yōu)化函數(shù)來實現(xiàn)通過Lagrange函數(shù)A、ribAT-λ (ATSrlwAT-l)進(jìn)行廣義的特征值求解,然后投影矩陣A通 過下式目標(biāo)優(yōu)化函數(shù)獲得
8.根據(jù)權(quán)利要求1所述的基于半監(jiān)督流形學(xué)習(xí)的多光譜圖像土地利用分類方法,其特 征在于所述步驟(8)中,通過下式進(jìn)行投影 Y = AtZ ;式中Y為整幅多光譜樣本數(shù)據(jù)集Z通過投影矩陣A投影到嵌入空間的數(shù)據(jù)集。
全文摘要
本發(fā)明公開了一種基于半監(jiān)督流形學(xué)習(xí)的多光譜遙感數(shù)據(jù)土地利用分類方法,涉及土地利用分類的方法;將多光譜遙感數(shù)據(jù)根據(jù)其波段生成矩陣作為樣本數(shù)據(jù)集;從樣本數(shù)據(jù)集中選取部分樣本數(shù)據(jù),并根據(jù)先驗知識標(biāo)注樣本類別標(biāo)簽,同時從樣本數(shù)據(jù)集中隨機(jī)選取部分樣本數(shù)據(jù)作為無標(biāo)記數(shù)據(jù);構(gòu)建相似圖和相異圖來度量數(shù)據(jù)點(diǎn)的相似性與相異性,并計算權(quán)重矩陣;通過優(yōu)化目標(biāo)函數(shù)計算得到投影矩陣;對整幅多光譜遙感數(shù)據(jù)進(jìn)行投影;用K-近鄰分類算法進(jìn)行土地利用分類;本發(fā)明利用半監(jiān)督流形學(xué)習(xí)方法,加入隨機(jī)選取的無標(biāo)注樣本數(shù)據(jù),通過優(yōu)化目標(biāo)函數(shù)計算投影矩陣,來實現(xiàn)提高土地利用分類的精度,同時有效節(jié)約了標(biāo)注訓(xùn)練樣本類別的成本。
文檔編號G06K9/66GK102129571SQ20111003427
公開日2011年7月20日 申請日期2011年1月31日 優(yōu)先權(quán)日2011年1月31日
發(fā)明者何同弟, 馮海亮, 王立志, 秦高峰, 黃鴻 申請人:重慶大學(xué)