本技術屬于計算機視覺,具體涉及一種基于sam模型的遙感圖像光伏識別方法。
背景技術:
1、隨著可再生能源的發(fā)展,光伏發(fā)電成為了重要的能源形式之一。光伏發(fā)電系統(tǒng)主要包括分布式光伏和集中式光伏兩種形式。為了更好地監(jiān)督和管理這些光伏設施,計算機視覺技術和遙感圖像的應用變得越來越重要。通過這些技術,可以有效地對光伏設備進行監(jiān)控、維護以及故障檢測等管理工作。
2、目前,基于遙感圖像的太陽能光伏分割技術大多采用的是基于監(jiān)督學習的深度學習算法。這類算法通常是針對特定區(qū)域的光伏設施進行分割處理,因此非常依賴于帶標注的訓練數(shù)據(jù)集。這包括了數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標注等多個步驟,其中數(shù)據(jù)標注尤其耗時且需要精細的操作。
3、現(xiàn)有的遙感光伏分割技術在應用時高度依賴于已經(jīng)標注過的訓練數(shù)據(jù)。這意味著,如果想要在一個新的地區(qū)或場景下應用,就需要重新收集并標注大量的數(shù)據(jù),這不僅耗費時間,而且增加了項目的成本。
4、對于復雜的遙感圖像而言,手動標注光伏區(qū)域是一個既繁瑣又容易出錯的過程。此外,當涉及到大規(guī)模的圖像集合時,保證標注的一致性和準確性也是一個挑戰(zhàn)。即便是在有經(jīng)驗的標注團隊支持下,完成大規(guī)模數(shù)據(jù)集的標注工作也需要較長的時間,這對于快速部署和應用模型提出了挑戰(zhàn)。
技術實現(xiàn)思路
1、本技術提供了一種基于sam模型的遙感圖像光伏識別方法,以解決傳統(tǒng)遙感光伏分割技術在監(jiān)督學習應用中對標注數(shù)據(jù)的過度依賴、數(shù)據(jù)標注困難標注周期長的問題。
2、本技術所采用的技術方案為:
3、本技術實施例提供一種基于sam模型的遙感圖像光伏識別方法,包括:
4、收集并預處理公開的多分辨率遙感光伏分割數(shù)據(jù)集,將所述數(shù)據(jù)集用于構建光伏識別的預訓練權重,以優(yōu)化圖像編碼器;
5、構建包含所述圖像編碼器、提示編碼器和掩碼解碼器的sam分割網(wǎng)絡,并將交互式點擊信息和所述數(shù)據(jù)集輸入到所述sam分割網(wǎng)絡中;
6、在所述掩碼解碼器中加入分割輸出層,以生成初步分割結(jié)果;
7、將所述初步分割結(jié)果反饋給交互模塊進行交互式調(diào)整,調(diào)整后重新解碼生成最終分割結(jié)果。
8、本技術提供的基于sam模型的遙感圖像光伏識別方法還包括下述附加技術特征:所述收集并預處理多分辨率光伏分割數(shù)據(jù)集,將所述數(shù)據(jù)集用于構建光伏識別的預訓練權重,以優(yōu)化圖像編碼器,具體為:收集公開的任意地區(qū)的多分辨率光伏分割數(shù)據(jù),以形成多分辨率光伏分割數(shù)據(jù)集;
9、對所述數(shù)據(jù)集進行篩選并得到合適的圖像數(shù)據(jù),對所述圖像數(shù)據(jù)使用雙邊濾波器去除噪聲并進行標準化處理,使所述圖像數(shù)據(jù)具有相同的長和寬;
10、利用處理后的所述圖像數(shù)據(jù)對預訓練模型進行微調(diào),并對預訓練模型的原始預訓練權重進行調(diào)整,從而優(yōu)化圖像編碼器。
11、根據(jù)本技術的一個實施例,所述構建包含所述圖像編碼器、提示編碼器和掩碼解碼器的sam分割網(wǎng)絡,并將交互式點擊信息和所述數(shù)據(jù)集輸入到所述sam分割網(wǎng)絡中,具體為:
12、通過交互模塊的交互操作,獲取所述數(shù)據(jù)集中的正負樣本像素點,以形成交互式點擊信息,基于所述交互式點擊信息,構建所述提示編碼器;
13、將所述圖像數(shù)據(jù)和所述交互式點擊信息傳輸?shù)剿鰣D像編碼器和所述提示編碼器中,得到編碼信息。
14、根據(jù)本技術的一個實施例,所述在所述掩碼解碼器中加入分割輸出層,以生成初步分割結(jié)果,具體為:在所述掩碼解碼器中加入分割輸出層用于輸出語義信息,通過多層感知機制在輸出掩碼時將所述語義信息與所述圖像數(shù)據(jù)進行疊加,以輸出所述初步分割結(jié)果。
15、根據(jù)本技術的一個實施例,所述通過多層感知機制在輸出掩碼時將所述語義信息與所述圖像數(shù)據(jù)進行疊加,具體為:
16、所述圖像數(shù)據(jù)通過交互模塊傳輸給圖像編碼器;
17、所述圖像數(shù)據(jù)被分塊處理,并進行嵌入操作,即將輸入的圖像轉(zhuǎn)化為嵌入向量,通過添加絕對位置信息來增強嵌入向量,從而得到編碼后的向量;通過連接模塊進行一系列的卷積操作和層歸一化,最終輸出相應的特征圖。
18、根據(jù)本技術的一個實施例,還包括:所述提示編碼器針對傳入的點信息進行參數(shù)記錄,包括嵌入維度以及圖像嵌入尺寸,對位置編碼層和提示嵌入層進行初始化;
19、所述掩碼解碼器在初始化階段接收通道維度、模型類型、預測掩碼數(shù)量、上采樣激活函數(shù)以及深度和隱藏維度參數(shù),并定義上采樣器和列表,以及預測掩碼質(zhì)量的預測頭;
20、所述掩碼解碼器接收圖像編碼器的輸出圖像嵌入、位置編碼、點的嵌入和掩碼輸入的嵌入,生成掩碼和掩碼質(zhì)量預測,輸出相應的語義信息,并選擇合適的掩碼切片;
21、掩碼解碼器返回生成的掩碼、掩碼質(zhì)量預測和語義信息的預測結(jié)果。
22、根據(jù)本技術的一個實施例,所述將所述初步分割結(jié)果反饋給交互模塊進行交互式調(diào)整,調(diào)整后重新解碼生成最終分割結(jié)果,具體為:
23、通過交互模塊對初步結(jié)果中的正樣本像素點或負樣本像素點進行調(diào)整,以改善分割精度;
24、將調(diào)整后的信息重新輸入到所述掩碼解碼器中進行解碼,所述掩碼解碼器接收來自圖像編碼器和提示編碼器的信息,并結(jié)合調(diào)整后的信息生成新的分割掩碼;
25、所述掩碼解碼器輸出更新后的掩碼信息、指標信息以及語義信息。
26、一種包含指令的計算機程序產(chǎn)品,當其在設備上運行時,使得設備執(zhí)行實現(xiàn)基于sam模型的遙感圖像光伏識別方法中的步驟。
27、計算機可讀存儲介質(zhì),其上存儲有程序,該程序被處理器執(zhí)行時實現(xiàn)基于sam模型的遙感圖像光伏識別方法中的步驟。
28、電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的程序,所述處理器執(zhí)行所述程序時實現(xiàn)基于sam模型的遙感圖像光伏識別方法中的步驟。
29、由于采用了上述技術方案,本技術所取得的有益效果為:
30、1.本技術通過預訓練機制和掩碼交互方式,可以高效地分割出光伏類別。這種方法不僅大大減少了標注時間,提高了預測效率,還通過微調(diào)方式降低了容錯率,從而顯著提高了分割遙感圖像光伏數(shù)據(jù)的可用性和可靠性。
31、2.本技術提出了一種通過交互式圖像點擊和按鍵實現(xiàn)實時分割結(jié)果預測和展示的方法。結(jié)合遙感光伏分割模型獲取語義信息,在分割完成后,用戶可以通過按鍵瀏覽不同通道的分割結(jié)果并保存。該方法允許用戶在圖像上快速而準確地進行光伏信息的交互式分割,同時對分割結(jié)果進行微調(diào)和修正,提高了低分辨率情況下零樣本光伏分割的準確率。
32、3.本技術能夠識別低分辨率下的分布式光伏和集中式光伏,并對識別目標與相似目標進行交互式區(qū)分,避免遺漏,便于光伏區(qū)域的管理和規(guī)劃。這一方法不僅提高了識別效率,減少了識別次數(shù),還能更高效且準確地識別遙感光伏數(shù)據(jù)。
33、4.本技術通過微調(diào)預訓練權重,更加專注于遙感圖像中的光伏類別的分割。通過構建掩碼交互模塊,有效提升了光伏的分割效率。同時,改進的掩碼解碼器模塊能夠輸出更加準確的語義信息。相較于原模型,該方法在光伏類別的語義分割任務中表現(xiàn)更優(yōu),顯著提高了分割結(jié)果的精度和可靠性。