本發(fā)明涉及智慧海洋和計(jì)算機(jī)視覺(jué)領(lǐng)域,特別是涉及一種基于改進(jìn)yolox的海面多目標(biāo)檢測(cè)方法。
背景技術(shù):
1、隨著深度學(xué)習(xí)的不斷發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)也不斷服務(wù)于各個(gè)領(lǐng)域,其中海洋領(lǐng)域有著廣闊的發(fā)展空間,通過(guò)應(yīng)用該技術(shù)使得海洋領(lǐng)域的各個(gè)方面都得到了極大的提升,相對(duì)于傳統(tǒng)的機(jī)器學(xué)習(xí)算法來(lái)說(shuō),深度學(xué)習(xí)在準(zhǔn)確性和反應(yīng)時(shí)間上都得到極大的改善,特別的在海面環(huán)境下,通過(guò)應(yīng)用該技術(shù)能夠高效的提取出帆船,海鳥(niǎo),船員等目標(biāo)的特征,得到高效的識(shí)別方法。
2、同時(shí),海面物體識(shí)別技術(shù)也可用于海防預(yù)警與海面交通情況,由于島礁,海浪,陽(yáng)光,天氣等特殊情況下可能會(huì)嚴(yán)重干擾目標(biāo)識(shí)別能力,從而可能導(dǎo)致觸礁,反應(yīng)不及時(shí),目標(biāo)鎖定出錯(cuò)等錯(cuò)誤,以及遠(yuǎn)距離的船體顯得較小,船體被遮擋無(wú)法正確識(shí)別等特別情況。該發(fā)明可以提供實(shí)時(shí)的識(shí)別能力,較高的精準(zhǔn)度,能夠彌補(bǔ)這方面的不足,能夠更好的輔助操作人員進(jìn)行進(jìn)一步操作,避免一系列的危險(xiǎn)問(wèn)題,節(jié)省了人力,財(cái)力,提高了效率。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)上述存在的問(wèn)題,本發(fā)明提出一種基于改進(jìn)yolox的海面多目標(biāo)檢測(cè)方法用以解決現(xiàn)有技術(shù)中計(jì)算復(fù)雜,延遲高的問(wèn)題,精準(zhǔn)率不足的問(wèn)題。
2、本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:
3、一種基于改進(jìn)yolox的海面多目標(biāo)檢測(cè)方法,包括以下步驟;
4、步驟s1、首先對(duì)海洋類(lèi)相關(guān)網(wǎng)頁(yè)進(jìn)行監(jiān)控,再通過(guò)beautifulsoup技術(shù)不斷的獲取網(wǎng)頁(yè)的html標(biāo)簽中海面物體圖片,所述海面物體包括帆船、海鳥(niǎo)和船員等,用來(lái)構(gòu)建數(shù)據(jù)集,并且對(duì)所獲得的海面物體圖片進(jìn)行統(tǒng)一有規(guī)則的命名更好的方便后續(xù)的操作;
5、步驟s2、隨后通過(guò)使用labelme工具對(duì)所獲得的數(shù)據(jù)集進(jìn)行標(biāo)注,對(duì)海面物體進(jìn)行選取坐標(biāo),并提取寬高添加對(duì)應(yīng)標(biāo)簽,構(gòu)建出voc格式的數(shù)據(jù)集;
6、步驟s3、將voc格式的數(shù)據(jù)集按81:9:10比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;
7、步驟s4、在訓(xùn)練前使用數(shù)據(jù)增強(qiáng)mosaic算法,對(duì)多個(gè)海面物體圖片進(jìn)行隨機(jī)縮放、隨機(jī)裁減、隨機(jī)排布的方式進(jìn)行拼接,豐富了數(shù)據(jù)集;
8、步驟s5、構(gòu)建出改進(jìn)yolox-s算法模型,分為backbone、neck、head和loss四個(gè)部分,把訓(xùn)練集圖片數(shù)據(jù)輸入算法模型中進(jìn)行計(jì)算;
9、步驟s6、將測(cè)試集中的帶入訓(xùn)練后得到的模型得到預(yù)測(cè)結(jié)果,在整體訓(xùn)練過(guò)程中采用fp16半精度浮點(diǎn)格式混合精度訓(xùn)練,降低所需的內(nèi)存可以訓(xùn)練更大的模型或訓(xùn)練時(shí)使用更大的batch_size,能夠提高整體訓(xùn)練速度。
10、作為本發(fā)明進(jìn)一步的技術(shù)方案,在步驟s1中,先采用request技術(shù)實(shí)現(xiàn)對(duì)海洋相關(guān)網(wǎng)頁(yè)進(jìn)行監(jiān)控,再采用beautifulsoup技術(shù)對(duì)海面物體圖片進(jìn)行統(tǒng)一爬取,實(shí)現(xiàn)對(duì)html標(biāo)簽的持續(xù)爬取,并且按照時(shí)間順序統(tǒng)一的命名。
11、作為本發(fā)明進(jìn)一步的技術(shù)方案,在步驟s5中,構(gòu)建改進(jìn)yolox-s算法模型步驟包括:
12、步驟a1、在backbone網(wǎng)絡(luò)中采用cspdarknet結(jié)構(gòu),在此基礎(chǔ)上添加了eca模塊,所述cspdarknet結(jié)構(gòu)包含有focus結(jié)構(gòu)與resblock塊,focus結(jié)構(gòu)把海面物體圖片切片提取使得通道擴(kuò)展四倍,再帶入darknet結(jié)構(gòu),進(jìn)一步提取特征圖,其中resblock結(jié)構(gòu)有標(biāo)準(zhǔn)化卷積、silu激活函數(shù)、殘差網(wǎng)絡(luò)residual和spp結(jié)構(gòu),可以獲得三個(gè)有效特征圖,然后將結(jié)果帶入eca模塊中,加強(qiáng)特征提??;
13、步驟a2、在neck網(wǎng)絡(luò)中,采用asff結(jié)構(gòu)替換原特征金字塔,asff結(jié)構(gòu)先經(jīng)過(guò)特征金字塔的三次上采樣和下采樣之后傳入一層特征融合層,得到的結(jié)果傳入下一個(gè)網(wǎng)絡(luò);
14、步驟a3、在head網(wǎng)絡(luò)中,采用decoupled?head方式,在該層分為分類(lèi)與回歸兩部分,在該層有三個(gè)預(yù)測(cè)結(jié)果,其中回歸有reg判斷每一個(gè)特征點(diǎn)的回歸與obj判斷該特征點(diǎn)是否包含物體,分類(lèi)有cls用于判斷該特征點(diǎn)的物體種類(lèi),最后輸出的結(jié)果為三個(gè)預(yù)測(cè)的堆疊;
15、步驟a4、在loss模塊中,使用simota的方式計(jì)算特征點(diǎn)與預(yù)測(cè)框的關(guān)系,再采用alpha-iou算法替換原iou算法計(jì)算區(qū)域框損失,用varifocalloss替換原二元交叉熵?fù)p失函數(shù)進(jìn)行計(jì)算訓(xùn)練損失;
16、步驟a5、在prediction階段中利用reg的結(jié)果計(jì)算中心特征點(diǎn)坐標(biāo)的偏移,在對(duì)預(yù)測(cè)框中心點(diǎn)的偏移值以及預(yù)測(cè)框的寬高進(jìn)行指數(shù)計(jì)算后得到預(yù)測(cè)框的寬高,再對(duì)得到的眾多預(yù)測(cè)框篩選出置信度大于閾值的框,再對(duì)種類(lèi)進(jìn)行非極大抑制,可以有效提取出遮擋船體等特征,其需要篩選出一定區(qū)域內(nèi)屬于同一種類(lèi)得分最大的框,再按照種類(lèi)進(jìn)行排序,取出最大得分的預(yù)測(cè)框,計(jì)算與其他預(yù)測(cè)框的重合度,若過(guò)大則剔除。
17、作為本發(fā)明進(jìn)一步的技術(shù)方案,在步驟a1中,在backbone網(wǎng)絡(luò)中采用cspdarknet結(jié)構(gòu),而本發(fā)明在此基礎(chǔ)上添加了eca模塊,eca模塊添加了自適應(yīng)的注意力機(jī)制,該模塊能夠在保持原模型的情況下,降低計(jì)算的復(fù)雜性,并且增加了模型效率,使得對(duì)圖片中大量的船體,船員,鳥(niǎo)類(lèi),魚(yú)類(lèi)等大量特征提取進(jìn)行加速:
18、cspdarknet結(jié)構(gòu)有focus結(jié)構(gòu),focus結(jié)構(gòu)就是把海面物體圖片每隔一個(gè)像素拿到一個(gè)值,這樣就可以獲得了四個(gè)同樣大小的特征圖,然后將四個(gè)特征圖進(jìn)行堆疊,使得通道擴(kuò)展四倍,這樣縮小了縮小了特征圖大小,提高了運(yùn)行速度;
19、再帶入cbs層,進(jìn)一步提取特征圖,cbs層分別為卷積層、批量歸一化層和silu激活函數(shù)結(jié)合而成,其中silu激活函數(shù)為sigmoid和relu的改進(jìn),平滑了relu激活函數(shù);
20、接著帶入四個(gè)殘差塊resblock,記錄后三個(gè)結(jié)果,三個(gè)大小通道不同的特征圖,前三個(gè)resblock塊由cbs層與csplayer層組合而成,分別為1*1和3*3的卷積,殘差邊部分不做處理直接與輸入和輸出結(jié)合,第四個(gè)resblock塊,在中間加了一個(gè)spp結(jié)構(gòu),通過(guò)不同池化核大小的最大池化進(jìn)行特征提取,提高網(wǎng)絡(luò)的感受野;
21、再將結(jié)果帶入eca模塊,繼續(xù)加強(qiáng)特征提取,并提高后續(xù)操作對(duì)特征處理的速度,實(shí)現(xiàn)對(duì)復(fù)雜性與計(jì)算效率進(jìn)行改進(jìn),并且提供了更強(qiáng)大的特征表示能力,使得表達(dá)效果更好。
22、作為本發(fā)明進(jìn)一步的技術(shù)方案,在步驟a2中,在neck網(wǎng)絡(luò)中,采用asff結(jié)構(gòu)改進(jìn)原fapfn結(jié)構(gòu),在原fapfn特征金字塔的基礎(chǔ)上添加一層特征融合層,加強(qiáng)特征提取,提高對(duì)細(xì)節(jié)的處理,能夠?qū)σ恍┻h(yuǎn)處的船體,魚(yú)類(lèi)特征進(jìn)行加強(qiáng),需要對(duì)backbone模塊得到的結(jié)果進(jìn)行上采樣三次,下采樣三次然后將三次結(jié)果輸入特征融合層得到特征加強(qiáng),再輸出三個(gè)結(jié)果。
23、作為本發(fā)明進(jìn)一步的技術(shù)方案,在步驟a4中,在loss模塊中,使用varifocalloss替換原來(lái)的二元交叉損失函數(shù),使用alpha-iou替換原來(lái)的iou計(jì)算方法,接下來(lái),首先需要得到真實(shí)框特征點(diǎn)之間的關(guān)系,在此處采用simota方式,simota會(huì)計(jì)算一個(gè)cost代價(jià)矩陣,代表每個(gè)真實(shí)框和每個(gè)特征點(diǎn)之間的代價(jià)關(guān)系,再者loss模塊計(jì)算要分別對(duì)head模塊中的輸出reg、obj和cls部分計(jì)算;
24、reg部分損失通過(guò)使用真實(shí)框和預(yù)測(cè)框之間得到的alpha-iou作為reg的loss組成;
25、obj部分損失計(jì)算方式是根據(jù)正負(fù)樣本和特征點(diǎn)的是否包含物體的預(yù)測(cè)結(jié)果計(jì)算交叉熵?fù)p失,所有真實(shí)框?qū)?yīng)的特征點(diǎn)都是正樣本,剩余的特征點(diǎn)均為負(fù)樣本;
26、cls部分根據(jù)真實(shí)框的種類(lèi)和特征點(diǎn)的種類(lèi)預(yù)測(cè)結(jié)果計(jì)算交叉熵?fù)p失,根據(jù)simota獲取到每個(gè)框?qū)?yīng)的特征點(diǎn)后,取出該特征點(diǎn)的種類(lèi)預(yù)測(cè)結(jié)果。
27、本發(fā)明的有益效果是:
28、本發(fā)明提出了一種基于改進(jìn)yolox的海面多目標(biāo)檢測(cè)方法,通過(guò)對(duì)多種海面物體的訓(xùn)練能夠得到一個(gè)速度與準(zhǔn)確度都優(yōu)秀的海面多目標(biāo)檢測(cè)的識(shí)別方法,可以用于海洋軍事,民用漁業(yè)領(lǐng)域,由于海面情況復(fù)雜,可能有的海面的目標(biāo)都很小,且處于移動(dòng)狀態(tài),出現(xiàn)部分船體被遮擋等情況,通過(guò)本發(fā)明可以解決此方面的問(wèn)題,同時(shí)實(shí)現(xiàn)解決效率慢、耗時(shí)長(zhǎng)、浪費(fèi)人力資源的問(wèn)題。