本發(fā)明涉及牛角電容印刷,具體地,涉及一種基于yolo的牛角電容套管極性檢測方法及系統(tǒng)。
背景技術(shù):
1、隨著制造業(yè)的迅猛發(fā)展和對產(chǎn)品質(zhì)量要求的提升,質(zhì)量檢測在工業(yè)生產(chǎn)中的作用越來越重要。然而,傳統(tǒng)的人工檢測方式因效率低下、受主觀因素影響大以及成本高昂等弊端,正逐步被淘汰。相比之下,基于卷積神經(jīng)網(wǎng)絡(luò)(cnn)的檢測算法展現(xiàn)出更優(yōu)越的性能,這得益于其強(qiáng)大的特征提取能力,相較于傳統(tǒng)的機(jī)器視覺算法,效果更佳。因此,本技術(shù)提供一種基于cnn的牛角電容極性檢測算法。
2、在眾多目標(biāo)檢測方法中,yolo系列檢測器因其簡潔高效的設(shè)計(jì)在工業(yè)領(lǐng)域獲得了廣泛應(yīng)用。但與自然物體檢測不同,印刷品的細(xì)節(jié)信息對于準(zhǔn)確的分類和定位至關(guān)重要。由于通用目標(biāo)檢測器主要是為結(jié)構(gòu)化的自然物體設(shè)計(jì)的,這使得它們在處理檢測任務(wù)時(shí)可能表現(xiàn)不佳。因此,現(xiàn)有技術(shù)中(2024年06月的期刊“齊魯工業(yè)大學(xué)”公開了“改進(jìn)yolov8的道路缺陷檢測算法”)的這種新型道路檢測算法,基于yolov8,通過加入mpca注意力機(jī)制、提出c2f-mpdc模塊、重新設(shè)計(jì)網(wǎng)絡(luò)頸部結(jié)構(gòu)和檢測頭,提高了檢測精度和效率,同時(shí)減小了模型尺寸。盡管該算法在檢測精度和效率上有所提升,但引入多個(gè)自定義組件會(huì)增加了模型訓(xùn)練的復(fù)雜性,需要更精細(xì)的超參數(shù)調(diào)優(yōu)和更長的訓(xùn)練時(shí)間。此外,在對實(shí)時(shí)性要求極高的應(yīng)用場景中,其延遲較高。
3、公開號為cn116012354a的專利文獻(xiàn)公開了一種片式電容絲印缺陷檢測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),該專利文獻(xiàn)提出了一種片式電容絲印缺陷檢測方法,該方法利用yolov5模型進(jìn)行訓(xùn)練,得到用于檢測電容極片缺陷的目標(biāo)模型,并在生產(chǎn)過程中應(yīng)用該模型進(jìn)行實(shí)時(shí)缺陷檢測,以實(shí)現(xiàn)質(zhì)量管控和生產(chǎn)效率提升。盡管如此,該專利文獻(xiàn)只考慮了圖片樣本,并沒有考慮視頻流的處理,此外yolov5版本相比于yolov8精度略低,精度更不如本技術(shù)中改進(jìn)過的yolov8模型。
技術(shù)實(shí)現(xiàn)思路
1、針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種基于yolo的牛角電容套管極性檢測方法及系統(tǒng)。
2、根據(jù)本發(fā)明提供的一種基于yolo的牛角電容套管極性檢測方法,包括如下步驟:
3、數(shù)據(jù)集構(gòu)建步驟:對牛角電容檢測視頻進(jìn)行預(yù)處理,得到數(shù)據(jù)集;
4、模型優(yōu)化步驟:對yolo檢測模型進(jìn)行優(yōu)化,構(gòu)建目標(biāo)檢測模型;
5、訓(xùn)練迭代步驟:通過數(shù)據(jù)集對目標(biāo)檢測模型進(jìn)行訓(xùn)練迭代;
6、檢測判斷步驟:通過訓(xùn)練迭代后的目標(biāo)檢測模型對牛角電容檢測視頻進(jìn)行檢測,判斷牛角電容的印刷是否出錯(cuò)。
7、優(yōu)選的,所述數(shù)據(jù)集構(gòu)建步驟具體包括如下步驟:
8、步驟1.1:將牛角電容檢測視頻劃分成不包含牛角電容的視頻幀和包含牛角電容的視頻幀,得到牛角電容數(shù)據(jù)集,對牛角電容數(shù)據(jù)集進(jìn)行標(biāo)注,并采用cutmix算法對標(biāo)注后的牛角電容數(shù)據(jù)集進(jìn)行圖像增強(qiáng);
9、步驟1.2:按照預(yù)設(shè)比例將圖像增強(qiáng)后的牛角電容數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集和測試數(shù)據(jù)集。
10、優(yōu)選的,所述步驟1.1具體包括如下步驟:
11、步驟1.1.1:從牛角電容檢測視頻的視頻幀中選取包含牛角電容的視頻幀,生成多張圖像,組成一個(gè)基準(zhǔn)圖像組,使用clip模型處理基準(zhǔn)圖像組,得到對應(yīng)的特征向量;
12、步驟1.1.2:遍歷整個(gè)牛角電容檢測視頻,對每個(gè)視頻幀進(jìn)行編碼,并轉(zhuǎn)化為特征向量,計(jì)算每個(gè)視頻幀的特征向量與基準(zhǔn)圖像組中每個(gè)特征向量的余弦相似度;
13、步驟1.1.3:設(shè)定一個(gè)余弦相似度的預(yù)設(shè)閾值,判斷視頻幀的特征向量與基準(zhǔn)圖像組中所有特征向量的余弦相似度是否都大于預(yù)設(shè)閾值,若是,則該視頻幀被判定為包含牛角電容的視頻幀,若否,則該視頻幀被判定為不包含牛角電容的視頻幀。
14、優(yōu)選的,所述模型優(yōu)化步驟具體為:
15、在yolov8檢測模型中融入cbam注意力模塊;
16、修改yolov8檢測模型的neck部分,將panet修改為階梯金字塔eps;
17、將yolov8檢測模型中的損失函數(shù)ciou修改為損失函數(shù)mpdiou。
18、優(yōu)選的,在yolov8檢測模型的骨干網(wǎng)絡(luò)的csplayer里插入cbam注意力模塊,形成cbam-cspl殘差構(gòu)造;
19、cbam-cspl殘差構(gòu)造包含兩個(gè)分支路徑:一分支路徑為主干路徑,由多個(gè)bottleneck單元?dú)埐罱Y(jié)構(gòu)進(jìn)行n次堆疊形成,每個(gè)bottleneck單元是一個(gè)殘差結(jié)構(gòu);另一分支為殘差邊緣路徑,執(zhí)行卷積運(yùn)算;主干路徑與殘差邊緣路徑通過concat操作進(jìn)行合并,并輸出結(jié)果;
20、cbam注意力模塊被嵌入到bottleneck結(jié)構(gòu)中的兩個(gè)卷積層之間。
21、優(yōu)選的,所述cbam注意力模塊由兩個(gè)順序執(zhí)行的子模塊組成:通道注意力模塊cam、空間注意力模塊sam;
22、cbam注意力模塊的流程公式為:
23、
24、輸入特征f∈rc*h*w,r表示實(shí)數(shù),c代表圖像通道數(shù),h代表圖像的高度,w代表圖像的寬度,進(jìn)行通道注意力模塊cam的一維卷積mc∈rc*1*1,將卷積結(jié)果乘原圖,作為通道注意力模塊cam的輸出結(jié)果f、;
25、將通道注意力模塊cam的輸出結(jié)果f、作為輸入,進(jìn)行空間注意力模塊sam的二維卷積ms∈r1*h*w,再將卷積結(jié)果與f、相乘,作為空間注意力模塊sam的輸出結(jié)果f、、;
26、通道注意力模塊cam的流程公式為:
27、
28、其中,σ代表激活函數(shù),mlp是多層感知器模塊,w0、w1為mlp的可學(xué)習(xí)權(quán)重。分別表示平均池化和最大池化,將輸入的特征圖分流經(jīng)過兩個(gè)并行的池化層處理:一層是maxpool層,另一層是avgpool層,通過兩個(gè)池化操作將原始尺寸為c*h*w的特征圖壓縮成c*1*1的尺寸,對每個(gè)通道進(jìn)行池化,得到每個(gè)通道的全局特征;
29、將壓縮后的數(shù)據(jù)輸入mlp模塊,mlp模塊為多層感知器模塊,在mlp模塊中,首先,數(shù)據(jù)的通道數(shù)先通過一個(gè)全連接層被壓縮至原通道數(shù)的1/r,r為壓縮率,然后,數(shù)據(jù)通道數(shù)再通過另一個(gè)全連接層擴(kuò)展回原來的通道數(shù);
30、將通過mlp模塊處理后的數(shù)據(jù)采用relu激活函數(shù)激活,得到兩個(gè)激活后的特征向量,將兩個(gè)特征向量進(jìn)行逐元素的相加操作,融合通過不同池化方式獲得的特征信息,將相加后的結(jié)果采用一個(gè)sigmoid激活函數(shù)激活,生成一個(gè)與原始通道數(shù)相同的權(quán)重向量,將該權(quán)重向量作為通道注意力模塊cam的輸出結(jié)果;
31、將權(quán)重向量與原始的特征圖進(jìn)行逐通道的相乘操作,調(diào)整每個(gè)通道的重要性參數(shù),強(qiáng)化模型對關(guān)鍵特征的關(guān)注度參數(shù);
32、經(jīng)過上述cbam注意力模塊處理后,輸出的特征圖保持原有的c*h*w尺寸,并攜帶有經(jīng)過優(yōu)化的通道權(quán)重信息;
33、空間注意力模塊sam的流程公式為:
34、
35、式中,f7×7表示卷積核大小為7×7,分別表示平均池化和最大池化,將通道注意力模塊cam的輸出結(jié)果分別應(yīng)用最大池化和平均池化,生成兩個(gè)尺寸為1*h*w的特征圖,將兩個(gè)特征圖通過concat操作進(jìn)行拼接,再通過一個(gè)7*7的卷積層轉(zhuǎn)換成單通道的特征圖,將該特征圖采用sigmoid函數(shù)處理,得到空間注意力模塊sam的特征圖,作為空間注意力模塊sam的輸出結(jié)果,將該輸出結(jié)果與原圖像相乘,恢復(fù)到c*h*w的尺寸。
36、優(yōu)選的,階梯金字塔eps的結(jié)構(gòu)是在panet的基礎(chǔ)上進(jìn)行橫向連接,并將兩個(gè)方向的信息匯聚到一個(gè)csp模塊上進(jìn)行計(jì)算,依靠單項(xiàng)結(jié)構(gòu)的參數(shù)實(shí)現(xiàn)雙向結(jié)構(gòu)的結(jié)果,并將每個(gè)結(jié)點(diǎn)的激活函數(shù)mish替換為激活函數(shù)hardswish。
37、優(yōu)選的,損失函數(shù)mpdiou的公式如下:
38、
39、其中,是預(yù)測框的坐標(biāo),是真實(shí)框的坐標(biāo),x1、y1是左上角的坐標(biāo),x2、y2是右下角的坐標(biāo),h、w是原始圖像的高和寬,iou是交并補(bǔ);
40、損失函數(shù)ciou的公式如下:
41、
42、其中,wgt和hgt表示真實(shí)框的寬度和高度,wprd和hprd表示預(yù)測框的寬度和高度,ρ(bgt,bprd)代表真實(shí)框和預(yù)測框的中心點(diǎn)坐標(biāo)的歐式距離,c則是包住它們的最小方框的對角線距離。
43、優(yōu)選的,所述檢測判斷步驟中,牛角電容檢測視頻通過目標(biāo)檢測模型的處理后,獲取得到陰極的坐標(biāo)、陽極的坐標(biāo)、陰極標(biāo)識符的坐標(biāo)、圓心的坐標(biāo)以及牛角電容外框的檢測框位置和類別信息,并計(jì)算陰極-陽極連線和圓心-陰極標(biāo)識符的連線的角度,根據(jù)計(jì)算結(jié)果判斷牛角電容的印刷是否出錯(cuò)。
44、本發(fā)明還提供一種基于yolo的牛角電容套管極性檢測系統(tǒng),包括如下模塊:
45、數(shù)據(jù)集構(gòu)建模塊:對牛角電容檢測視頻進(jìn)行預(yù)處理,得到數(shù)據(jù)集;
46、模型優(yōu)化模塊:對yolo檢測模型進(jìn)行優(yōu)化,構(gòu)建目標(biāo)檢測模型;
47、訓(xùn)練迭代模塊:通過數(shù)據(jù)集對目標(biāo)檢測模型進(jìn)行訓(xùn)練迭代;
48、檢測判斷模塊:通過訓(xùn)練迭代后的目標(biāo)檢測模型對牛角電容檢測視頻進(jìn)行檢測,判斷牛角電容的印刷是否出錯(cuò)。
49、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:
50、1、本發(fā)明提出了一種改進(jìn)的yolo網(wǎng)絡(luò),并將其應(yīng)用在了牛角電容的印刷檢測視頻上,改進(jìn)的yolo網(wǎng)絡(luò)在原有yolov8的基礎(chǔ)上,融入了cbam注意力機(jī)制,將panet改進(jìn)為高效階梯金字塔esp,并且將損失函數(shù)ciou修改為mpdiou,通過采用改進(jìn)之后的yolov8的結(jié)構(gòu),解決了牛角電容檢測識別率低的問題,從而達(dá)成牛角電容檢測精確檢測的效果。
51、2、本發(fā)明通過采用cbam注意力機(jī)制,yolo會(huì)解決對關(guān)鍵特征識別不準(zhǔn)確的問題,達(dá)到了提高目標(biāo)檢測精度和效率的效果,cbam注意力機(jī)制能夠幫助yolo模型更加聚焦于圖像中的關(guān)鍵區(qū)域和特征,從而提升模型的檢測性能。
52、3、本發(fā)明通過采用高效階梯金字塔esp的結(jié)構(gòu),解決了多尺度目標(biāo)檢測中特征融合不足的問題,達(dá)到了提升對小目標(biāo)和多尺度目標(biāo)檢測性能的效果,高效階梯金字塔esp能夠有效地將不同層次的特征進(jìn)行融合,從而增強(qiáng)模型對不同尺寸目標(biāo)的感知能力,提高檢測的準(zhǔn)確性和穩(wěn)定性。
53、4、本發(fā)明通過采用mpdiou的結(jié)構(gòu),解決了邊界框回歸計(jì)算中準(zhǔn)確度不高的問題,達(dá)到了提升目標(biāo)檢測定位精度和收斂速度的效果,mpdiou不僅綜合考慮了中心點(diǎn)距離、縱橫比等因素,還簡化了計(jì)算過程,使得模型能夠更快地收斂,同時(shí)提高檢測框的定位準(zhǔn)確性。
54、5、本發(fā)明通過采用視頻流預(yù)處理的結(jié)構(gòu),解決了牛角電容檢測視頻中數(shù)據(jù)分類和標(biāo)注的問題,達(dá)到了提升數(shù)據(jù)質(zhì)量和多樣性以及準(zhǔn)確識別包含牛角電容視頻幀的效果。