本發(fā)明涉及山蘭稻識別,尤其涉及一種基于光學(xué)和雷達(dá)影像的山蘭稻產(chǎn)區(qū)空間分布信息提取方法。
背景技術(shù):
1、山蘭稻作為海南黎族特有的一種山地旱稻,是黎族人在長期生產(chǎn)實(shí)踐中保留下來的寶貴財(cái)富,受自然條件、農(nóng)業(yè)發(fā)展?fàn)顩r以及城鎮(zhèn)化的影響,山蘭稻的空間分布變化十分劇烈。因此,對山蘭稻時(shí)空分布及變化的研究,具有重要的意義。隨著遙感技術(shù)的不斷進(jìn)步和廣泛應(yīng)用,它在空間動(dòng)態(tài)監(jiān)測方面的應(yīng)用得到了顯著提高。相較于傳統(tǒng)的作物監(jiān)測方法,遙感技術(shù)具有耗時(shí)短、效率高、監(jiān)測范圍廣、以及高時(shí)間連續(xù)性重復(fù)性等獨(dú)特優(yōu)勢,但對于大多數(shù)熱帶和亞熱帶地區(qū)而言,獲取足夠數(shù)量的山蘭稻關(guān)鍵期影像是十分困難的。
2、光學(xué)和雷達(dá)影像的影像數(shù)據(jù)成像不受氣象干擾,能敏銳地響應(yīng)山蘭稻植株發(fā)育和土壤水分變化,是多云霧地區(qū)山蘭稻生長監(jiān)測的重要數(shù)據(jù)源。雖然現(xiàn)有分類方案能夠獲得較高的山蘭稻分類精度,但由于光學(xué)和雷達(dá)影像的影像數(shù)據(jù)本身噪點(diǎn)過多的問題,依然存在提取精度上的不足。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明為了克服低山丘陵區(qū)等結(jié)構(gòu)復(fù)雜種植區(qū)的山蘭稻面積提取精度低的問題,提供了一種基于光學(xué)和雷達(dá)影像的山蘭稻產(chǎn)區(qū)空間分布信息提取方法,包括以下步驟:
2、s11、在gee(google?earth?engine)平臺進(jìn)行云掩膜處理,設(shè)置云量小于預(yù)設(shè)云量閾值的影像進(jìn)行合成,獲取山蘭稻光學(xué)和雷達(dá)的影像數(shù)據(jù);
3、s12、將步驟s11獲取的影像數(shù)據(jù)中的rgb圖像轉(zhuǎn)換到hsv色彩空間,利用單個(gè)像素8維空間向量信息形成一種多邊形像素集合體,并基于此多邊形像素集合體對山蘭稻的影像數(shù)據(jù)進(jìn)行去噪,保留山蘭稻的邊緣細(xì)節(jié)特點(diǎn);
4、s13、地表溫度反演,采用普適性單通道算法對步驟s12經(jīng)去噪后山蘭稻種植集中區(qū)的地表溫度進(jìn)行反演,得提高山蘭稻識別精度;
5、s14、提取步驟s13中山蘭稻種植集中區(qū)的特征類別,所述特征類別包括光譜波段、植被指數(shù)、水體指數(shù)及地形與紋理特征,再利用分離閾值法篩選出對特征類別分離度大于預(yù)設(shè)分離度閾值的山蘭稻種植集中區(qū)的優(yōu)選特征集;
6、s15、利用完全約束的最小二乘混合像元分解方法,對步驟s14中優(yōu)選特征集進(jìn)行分析,獲得易與山蘭稻產(chǎn)生光譜混淆的地類的豐度圖,并作為訓(xùn)練特征集融入分類體系;
7、s16、構(gòu)建隨機(jī)森林模型,對步驟s15稻訓(xùn)練特征集進(jìn)行分類,獲得山蘭稻空間分布信息。
8、進(jìn)一步的,步驟s12中,所述利用單個(gè)像素8維空間向量信息形成一種多邊形像素集合體包括以下步驟:
9、s21、將單個(gè)像素8維空間向量表示為(u,v,h,s,l,r,g,b),用于表達(dá)山蘭稻的影像數(shù)據(jù)的像素點(diǎn),其中(u,v)代表空間位置向量,(h,s,l)為hsv色彩特征,(r,g,b)為rgb色彩特征,基于(h,s,l,r,g,b)色彩特征,進(jìn)行局部中心種子點(diǎn)數(shù)量n的計(jì)算;
10、s22、由s21計(jì)算獲得聚類中心的個(gè)數(shù)為山蘭稻影像數(shù)據(jù)像素點(diǎn)的局部中心個(gè)數(shù)n,取多邊形像素集合體邊個(gè)數(shù),計(jì)算集合體標(biāo)準(zhǔn)間距;
11、s23、以聚類中心點(diǎn)為局部中心,搜索附近兩倍標(biāo)準(zhǔn)距離范圍內(nèi)所有像素點(diǎn)與聚類中心之間的色彩特征距離和空間距離,更新像素點(diǎn)標(biāo)簽信息;
12、s24、開始對每一個(gè)像素點(diǎn)進(jìn)行迭代計(jì)算,反復(fù)迭代后,當(dāng)每個(gè)聚類中心與其周圍的中心前后兩次距離誤差收斂于0.1時(shí),迭代終止,確定多邊形像素集合體。
13、進(jìn)一步的,步驟s12中,所述基于多邊形像素集合體對山蘭稻的影像數(shù)據(jù)進(jìn)行去噪,包括以下步驟:
14、s31、設(shè)置搜索框φi和固定尺寸的相似框,搜索框包含多個(gè)多邊形像素集合體;
15、s32、遍歷多邊形像素集合體,對其中心像素j與待處理像素i進(jìn)行比較,對i和j進(jìn)行所有像素的相似性比較,從而獲得像素點(diǎn)j的權(quán)重wij;
16、s33、最后對搜索框內(nèi)所有多邊形像素集合體進(jìn)行加權(quán)平均,得到去噪后圖像在i點(diǎn)的像素估計(jì)值
17、s34、輸出去噪后的山蘭稻的影像數(shù)據(jù)。
18、進(jìn)一步的,步驟s14中,所述分離閾值法進(jìn)行篩選獲得優(yōu)選特征集的方法為:
19、s41、用seath的j-m(jeffries-matusita)距離判斷特征類別的可分離性,其值范圍為[0,2],其值接近0,代表2個(gè)類別在某一特征上幾乎無差異;其值為2,代表2個(gè)類別在某一特征上能夠完全區(qū)分開;
20、s42、結(jié)合野外調(diào)查數(shù)據(jù)與山蘭稻種植集中區(qū)影像數(shù)據(jù)輔助進(jìn)行目視解譯;
21、s43、計(jì)算特征類別的分離度,保留分離度最大的2個(gè)特征類別,包括重復(fù)特征類別,獲得山蘭稻種植集中區(qū)的優(yōu)選特征集。
22、進(jìn)一步的,步驟s15中,所述對山蘭稻種植集中區(qū)數(shù)據(jù)集進(jìn)行分析步驟為:
23、s51、將山蘭稻種植集中區(qū)的優(yōu)選特征集作為輸入數(shù)據(jù)集,通過最小噪聲分離對特征變量進(jìn)行主成分分析來實(shí)現(xiàn)數(shù)據(jù)降維并估計(jì)影像噪聲點(diǎn);
24、s52、根據(jù)影像噪聲計(jì)算純凈像元指數(shù);
25、s53、利用n維可視化工具挑選各地類的純凈像元;
26、s54、基于完全約束最小二乘混合像元分解得到山蘭稻、其他作物以及蔬菜的植被豐度圖;
27、s55、以植被豐度圖作為輔助,將易發(fā)生光譜混淆的地類進(jìn)行區(qū)分。
28、進(jìn)一步的,步驟s16中,隨機(jī)森林模型構(gòu)建步驟為:
29、s61、采用基尼指數(shù)進(jìn)行節(jié)點(diǎn)分裂時(shí)的特征選擇,所述基尼指數(shù)表示樣本集合中隨機(jī)樣本被錯(cuò)分的概率,構(gòu)建集合d的基尼指數(shù)gini(d)表達(dá)式為:
30、
31、式中,k為訓(xùn)練樣本中的種類數(shù);為集合d中隨機(jī)選取的樣本屬于類別k的概率;
32、s62、若集合d根據(jù)特征a是否取某一值α被分為d1和d2兩部分,則在特征a的條件下,集合d的基尼指數(shù)gini(d,a)表達(dá)式為:
33、
34、其中,|d|表示集合d中的樣本數(shù),|d1|表示集合d1中的樣本數(shù),|d2|表示集合d2中的樣本數(shù);
35、s63、采用平均不純度減少的方法評估訓(xùn)練特征集重要性,其表達(dá)式為:
36、
37、其中,ntree為隨機(jī)森林模型中決策樹個(gè)數(shù);ginit(d)、ginit(d,a)分別為第t棵決策樹經(jīng)特征a劃分前后集合d的基尼指數(shù)。
38、進(jìn)一步的,s43步驟中,所述采用平均不純度減少的方法評估訓(xùn)練特征集重要性的步驟為:
39、s71、采用平均不純度減少的方法計(jì)算隨機(jī)森林模型中訓(xùn)練特征集中各特征的重要性,并按照從高到低的順序進(jìn)行排序;
40、s72、在根據(jù)各特征的重要性進(jìn)行排序時(shí),第1次選擇首位特征,第2次選擇前2位特征,依次類推可得到單時(shí)相20個(gè)不同特征組合、時(shí)序影像100個(gè)不同特征組合的隨機(jī)森林模型;
41、s73、分別計(jì)算其袋外oob(out?of?bag)數(shù)據(jù),對隨機(jī)森林模型精度和復(fù)雜度綜合考慮后確定最優(yōu)特征組合,從而在保證分類精度的條件下降低模型復(fù)雜度。
42、進(jìn)一步的,步驟s16中,所述提取山蘭稻空間分布信息方法為:
43、s81、采用隨機(jī)森林模型通過自助法(bootstrap)從訓(xùn)練特征集中有放回地隨機(jī)選取n個(gè)樣本作為訓(xùn)練樣本;
44、s82、經(jīng)ntrte次樣本抽取和訓(xùn)練可得到ntree個(gè)決策樹模型;
45、s83、在每棵決策樹的每個(gè)節(jié)點(diǎn)處隨機(jī)選取mtry個(gè)特征并進(jìn)行內(nèi)部節(jié)點(diǎn)劃分;
46、s84、對所有決策樹模型結(jié)果進(jìn)行集成,采用多數(shù)投票方式?jīng)Q定最終山蘭稻空間分布信息的分類結(jié)果。
47、本發(fā)明的有益效果如下:
48、本發(fā)明涉及一種基于光學(xué)和雷達(dá)影像的山蘭稻產(chǎn)區(qū)空間分布信息提取方法,首先在gee平臺獲取山蘭稻光學(xué)和雷達(dá)影像的影像數(shù)據(jù),能夠及時(shí)準(zhǔn)確地獲取山蘭稻種植面積和長勢信息;將山蘭稻影像數(shù)據(jù)中的rgb圖像轉(zhuǎn)換到hsv色彩空間進(jìn)行去噪,很好地保留山蘭稻的邊緣細(xì)節(jié)特點(diǎn),利于提高反演精度,為后續(xù)山蘭稻的提取分類提供基礎(chǔ),進(jìn)而提高山蘭稻空間分布信息提取的精度;其次使用普適性單通道算法對去噪后山蘭稻種植集中區(qū)的地表溫度進(jìn)行反演,進(jìn)一步提高山蘭稻識別精度;最后使用最小二乘混合像元分解方法和隨機(jī)森林模型進(jìn)行分類得到山蘭稻空間分布信息。本發(fā)明在進(jìn)行山蘭稻提取分類前先對圖像進(jìn)行去噪處理,提高圖像識別精度,進(jìn)而提高了山蘭稻空間分布信息提取的精度。