两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種具有結(jié)構(gòu)適應(yīng)性的偽裝物體檢測方法

文檔序號:40647423發(fā)布日期:2025-01-10 18:53閱讀:1來源:國知局
一種具有結(jié)構(gòu)適應(yīng)性的偽裝物體檢測方法

本發(fā)明屬于目標(biāo)檢測,特別是涉及一種具有結(jié)構(gòu)適應(yīng)性的偽裝物體檢測方法。


背景技術(shù):

1、偽裝物體檢測長期以來一直是一項頗具挑戰(zhàn)性的任務(wù),其目的在于找出圖片中隱蔽,偽裝起來的,或是難以察覺的物體。偽裝物體與背景環(huán)境高度融合,常見的偽裝物體有擬態(tài)生物,軍事中的迷彩服,迷彩坦克。

2、早期的偽裝物體檢測方法主要依賴于手工標(biāo)注的特征,隨著深度學(xué)習(xí)的發(fā)展,與大規(guī)模數(shù)據(jù)集的提出,這一項任務(wù)的實現(xiàn)方法得到了快速的進(jìn)步。目前,基于深度學(xué)習(xí)的偽裝物體檢測方法大致可以劃分為兩類:仿生設(shè)計與輔助線索。對于前者,往往是模仿人眼的工作機(jī)制,來對圖片進(jìn)行多尺度的放縮,或是聚焦于某些特定的位置。對于后者,就是尋找一個或者多個輔助線索來輔助模型,將其注意力聚焦于前景,常見的輔助線索有邊界、頻率、深度、補充高分辨率信息等。

3、現(xiàn)有的輔助線索方法,大多依賴于前景偽裝物體的結(jié)構(gòu)特征。然而由于偽裝物體所處環(huán)境復(fù)雜,圖片中的背景物體結(jié)構(gòu)信息可能遠(yuǎn)強(qiáng)于前景,因此依賴結(jié)構(gòu)信息的輔助線索方法會受到干擾與誤導(dǎo),尤其是補充高分辨率信息的方法,可能會補充大量高分辨率噪音。

4、偽裝物體檢測具有幾種常見的困難現(xiàn)象:1)在復(fù)雜的環(huán)境中,背景物體通常比前景具有更強(qiáng)的結(jié)構(gòu)線索,導(dǎo)致結(jié)構(gòu)信息中存在顯著的噪聲。2)對于多目標(biāo),且頗具細(xì)節(jié)的偽裝物體。使得提取大型、復(fù)雜和分散的結(jié)構(gòu)信息變得十分困難。3)當(dāng)目標(biāo)富含細(xì)節(jié)信息且前景與背景相似時,精細(xì)分割變得困難。4)對于極其難以辨別的偽裝物體,其前景和背景表現(xiàn)出高度相似的結(jié)構(gòu),可能導(dǎo)致模型的錯誤判斷,將背景誤認(rèn)為前景。5)在背景環(huán)境復(fù)雜且偽裝目標(biāo)很小的環(huán)境中,前景的結(jié)構(gòu)信息明顯弱于背景,這使得定位與邊界識別變得苦難。人類的視覺辨別力也受到挑戰(zhàn),模擬人類視覺的方法可能在處理小目標(biāo)時難以勝任。處理結(jié)構(gòu)信息不當(dāng)可能對模型產(chǎn)生兩種常見影響:誤導(dǎo)和干擾。使用不準(zhǔn)確的信息作為先驗或輔助線索可能是十分危險的,因為它可能會誤導(dǎo)模型的決策,使模型將結(jié)構(gòu)上相似或突出的背景目標(biāo)誤認(rèn)為前景。此外,高分辨率信息對于小目標(biāo)的分割和細(xì)節(jié)優(yōu)化至關(guān)重要。然而,過度補充高分辨率信息可能會引入高分辨率噪聲,削弱模型的信心,導(dǎo)致不穩(wěn)定的預(yù)測結(jié)果。


技術(shù)實現(xiàn)思路

1、為了克服上述問題,本發(fā)明提供了一種具有結(jié)構(gòu)適應(yīng)性的偽裝物體檢測方法。

2、本發(fā)明所采用的技術(shù)方案是:

3、一種具有結(jié)構(gòu)適應(yīng)性的偽裝物體檢測方法,根據(jù)偽裝物體的形狀,自適應(yīng)的調(diào)整學(xué)習(xí)策略,規(guī)避背景干擾的同時更關(guān)注前景關(guān)鍵信息,該方法包括以下階段:

4、第一階段:特征提取階段:

5、利用swintransformer對輸入圖像進(jìn)行多尺度特征提取,然后利用特征劃分模塊,對特征進(jìn)行劃分與融合,分為低級特征x1和x2、中級特征x3和高級特征x4;

6、第二階段:粗粒度偽裝物體定位階段:

7、對于獲取到的三個等級四個特征,運用不同的增強(qiáng)策略;對低級特征x1和x2運用關(guān)鍵點增強(qiáng)模塊和混合分辨率注意力機(jī)制,進(jìn)行特征增強(qiáng);對于高級特征x4運用空間注意力進(jìn)行增強(qiáng);將處理后的x1、x2、x4與未經(jīng)處理的中級特征x3利用解碼器進(jìn)行解碼,并運用空間通道特征融合模塊進(jìn)行特征融合,以獲得粗糙定位圖m;

8、第三階段:細(xì)粒度優(yōu)化階段:

9、利用獲取到的粗糙定位圖m,利用結(jié)構(gòu)適應(yīng)補丁方法,從高分辨率圖像中選取包含前景目標(biāo)的補丁,沿通道維度拼接到空間通道特征融合模塊的輸出xout上,并做新一輪的特征融合,經(jīng)過兩次重復(fù)操作,得到最終的精細(xì)分割圖m1。

10、其中,特征提取階段中特征劃分的方法:為了保留低級特征的高分辨率特性和高級特征的豐富語義信息,對于骨干網(wǎng)提取出的低級特征x11和x21、中級特征x31和高級特征x41,分別將x11和x21、x21和x31、x31和x41拼接在一起,得到x1、x2和x3;將x11、x21、x31和x41拼接在一起,得到x4;產(chǎn)生新的低級特征x1和x2、新的中級特征x3和新的高級特征x4,x1、x2、x3和x4的分辨率分別是原始輸入圖像的1/8、1/16、1/32和1/32。

11、其中,粗粒度偽裝物體定位階段中關(guān)鍵點增強(qiáng)模塊為在模型基線的前期找到結(jié)構(gòu)信息強(qiáng)的關(guān)鍵點,作為可能存在偽裝物體的可疑點,并對其進(jìn)行特征增強(qiáng),具體實現(xiàn)方法為:對于特征x1和x2,首先利用高斯差分計算關(guān)鍵點信息,然后用1x1卷積運算來調(diào)整關(guān)鍵點信息矩陣的通道數(shù);利用sigmoid運算將其轉(zhuǎn)化為權(quán)重矩陣,并對權(quán)重進(jìn)行閾值處理,目的是只增強(qiáng)一些十分顯著的特征點;最后用閾值處理后的權(quán)重矩陣,對原特征x1、x2進(jìn)行逐元素乘法,實現(xiàn)加權(quán)增強(qiáng)。

12、其中,粗粒度偽裝物體定位階段中解碼操作為利用四個簡單解碼器對增強(qiáng)后的特征進(jìn)行解碼操作,實現(xiàn)方法為:

13、

14、其中,bn(·)表示批歸一化,conv(·)表示3×3卷積操作;激活函數(shù)relu(·)在每次批歸一化和卷積操作后應(yīng)用;這些操作分別應(yīng)用于基線中的四個分支;將簡單解碼器的輸入記為xi,輸出記為

15、其中,粗粒度偽裝物體定位階段中空間通道特征融合為采用金字塔結(jié)構(gòu)對四個尺度的特征進(jìn)行充分融合,是一種漸進(jìn)式的融合方式。

16、其中,細(xì)粒度優(yōu)化階段中結(jié)構(gòu)適應(yīng)補丁方法為在拼接高分辨率圖補丁時,根據(jù)粗糙圖定位圖m,來選取包含前景信息的有效補丁,從而避免引入背景補丁的干擾;這一部分采用二步放大的策略來逐漸為粗糙特征圖補充多尺度高分辨率信息以完善細(xì)粒度邊界分割;

17、具體實現(xiàn)方法:在結(jié)構(gòu)適應(yīng)補丁中,為了有效利用高分辨率信息,采用二步放大策略,這是一種面結(jié)構(gòu)信息增強(qiáng)方法,用于逐步將預(yù)測圖放大到原始輸入大?。?/p>

18、首先,對輸入特征圖進(jìn)行高分辨率拼接,增強(qiáng)其高分辨率信息;

19、隨后,使用簡單的解碼器對其進(jìn)行完全解碼,并與從空間通道特征融合模塊輸出的混合特征f進(jìn)行拼接;

20、最后,使用雙線性插值將特征圖尺寸放大一倍,在更高分辨率下重復(fù)前面的拼接和解碼操作;

21、在第二步中直接放大四倍,以生成最終的預(yù)測圖。

22、其中,細(xì)粒度優(yōu)化階段中拼接為將粗糙定位圖m與原始高分辨率圖像i等比例分割為64個補丁,找到粗糙定位圖中的具有前景目標(biāo)的補??;由于是等比例分割,因此以此為依據(jù)找到高分辨率圖像i中對應(yīng)的,攜帶前景信息的補丁,并將其與待增強(qiáng)的特征圖進(jìn)行拼接;這種實現(xiàn)方式規(guī)避了大量的高分辨率背景噪音,使模型補充的高分辨率信息盡可能多的來自于前景目標(biāo);具體方法為:

23、將粗糙定位圖m和高分辨率原始圖像i分割成相等的八行八列;找出在粗糙預(yù)測圖中包含前景信息的塊,即在應(yīng)用sigmoid函數(shù)后最大值超過0.5的塊;由于分割是成比例的,因此可以定位到高分辨率輸入圖像i中相應(yīng)的塊,并沿通道維度將它們拼接在一起;鑒于rgb圖像有三個通道,而八行八列分割最多可能有64個前景塊,也就是最多可產(chǎn)生192個通道;為了確保所有192個通道都包含可疑前景的高分辨率信息,在一個批次中,檢查粗糙定位圖對應(yīng)中的高分辨率切片數(shù)量;如果少于192個,則通過除法和取模操作復(fù)制通道至192個。

24、本發(fā)明的優(yōu)點如下:

25、本發(fā)明提出了一個結(jié)構(gòu)適應(yīng)性方法,從點到面補充結(jié)構(gòu)信息。在模型的后期階段選擇性地補充高分辨率信息,以增強(qiáng)復(fù)雜環(huán)境中小物體的定位和精細(xì)邊緣分割。具體來說,本方法分三個階段實現(xiàn)偽裝物體檢測任務(wù):特征提取階段,粗粒度偽裝目標(biāo)定位階段,以及最后的細(xì)粒度優(yōu)化階段。在第一個階段,特征被提取和融合,以確?;A(chǔ)特征足以勝任任務(wù)。第二階段采用關(guān)鍵點增強(qiáng)模塊,在模型處理的早期階段時期關(guān)注關(guān)鍵位置。為補充高分辨率信息,本發(fā)明提出了混合分辨率注意力,它利用低級高分辨率特征來增強(qiáng)飽含語義信息但分辨率信息不足的高級特征。

26、在獲得結(jié)構(gòu)先驗時,空間通道特征融合模塊采用可靠的多尺度特征混合方法,謹(jǐn)慎地獲得有效的結(jié)構(gòu)先驗。在細(xì)粒度優(yōu)化階段,采用兩步放大策略處理多尺度特征。結(jié)構(gòu)適應(yīng)補丁通過選擇性地整合高分辨率前景塊,同時最小化背景噪聲,增強(qiáng)了最終的精細(xì)分割。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
清远市| 太湖县| 黔江区| 许昌县| 花垣县| 靖江市| 杭锦后旗| 梅州市| 梁山县| 镇原县| 曲松县| 广西| 肥东县| 大同市| 柏乡县| 临海市| 恩施市| 盐源县| 镇巴县| 永福县| 伊春市| 普安县| 万宁市| 新余市| 娱乐| 香港 | 神农架林区| 青冈县| 广平县| 江安县| 北宁市| 长寿区| 阿合奇县| 平陆县| 济宁市| 天长市| 茂名市| 上虞市| 鲜城| 云霄县| 酒泉市|