本發(fā)明屬于計算機視覺,具體涉及一種羊只行為識別方法、系統(tǒng)、設備及存儲介質。
背景技術:
1、隨著科學技術的快速進步,特別是在信息技術和自動化領域,畜牧業(yè)正經(jīng)歷著一場變革。大規(guī)模和智能化的養(yǎng)殖模式日益成為新的發(fā)展趨勢。這種新興的養(yǎng)殖模式整合了先進的傳感器、監(jiān)控設備和數(shù)據(jù)分析工具,旨在提高養(yǎng)殖效率和改善動物健康及福利管理。動物的行為模式是其健康狀態(tài)的重要指標。定期的進食、活動和社交行為通常表明動物處于良好的健康狀態(tài);相反,異常的靜止、食欲不振或攻擊行為可能表明健康問題正在出現(xiàn)。羊的行為可以反映其生長和健康狀況。
2、然而,當前羊行為識別的方法一般是通過對采集到的牧場圖像進行處理分析,根據(jù)某一時刻的單只羊的動作、形態(tài)等特征來對羊的行為進行判斷,識別結果較為盲目,同時對于存在遮擋情況下的羊只無法識別,識別的精準度有待提高。
技術實現(xiàn)思路
1、針對現(xiàn)有羊行為識別存在的識別結果較為盲目,精準度有待提高的問題,本發(fā)明提供了一種羊只行為識別方法。
2、為了實現(xiàn)上述目的,本發(fā)明提供如下技術方案:
3、在deepsort模型中引入vision?permutator注意力機制和在線掩碼策略,對改進后的deepsort模型進行訓練得到羊只追蹤模型vitsort;在yolov8模型中添加多尺度組卷積模塊msgconv和lawds自適應下采樣模塊,對改進后的yolov8模型進行訓練得到羊只行為識別模型yolov8-ms;
4、獲取羊場環(huán)境中包含多只羊及羊的不同行為的實時視頻數(shù)據(jù);
5、從包含多只羊及羊的不同行為的實時視頻數(shù)據(jù)中每秒提取多幀進行羊只檢測,對每一幀中檢測到的羊只生成相應的邊界框,根據(jù)生成的邊界框對羊只圖像進行裁剪;
6、將裁剪后的圖像輸入羊只追蹤模型vitsort中,通過vision?permutator注意力機制提取裁剪后的圖像中羊的外觀特征,并為提取到的具有相同外觀特征的每只羊分配一個唯一的標識符id,并根據(jù)標識id對羊個體進行持續(xù)追蹤;
7、將追蹤到的帶有唯一標識符id的多個圖像輸入羊只行為識別模型yolov8-ms,多尺度組卷積模塊msgconv采用多個不同大小的卷積核并行處理帶有唯一標識符id的多個圖像,獲得羊只的多個空間細節(jié)特征;lawds自適應下采樣模塊根據(jù)羊只的多個空間細節(jié)特征生成圖像序列集,根據(jù)圖像序列集對單只羊的行為進行識別;其中,所述空間細節(jié)特征為羊只在不同時間、不同位置的形態(tài)特征;
8、記錄同一只羊在不同時間、不同位置的形態(tài)特征出現(xiàn)的頻率和持續(xù)時間,根據(jù)同一形態(tài)特征出現(xiàn)的頻率和持續(xù)時間對羊只的行為進行分類。
9、優(yōu)選地,通過yolov5模型從視頻中數(shù)據(jù)中每秒提取多幀進行羊只檢測,對每一幀中檢測到的羊只生成相應的邊界框。
10、優(yōu)選地,在對改進后的deepsort模型和改進后的yolov8模型進行訓練之前,還包括構建訓練集,所述構建訓練集具體包括:
11、獲取羊場環(huán)境中包含多只羊及羊的不同行為的歷史視頻數(shù)據(jù);所述歷史視頻數(shù)據(jù)為多只羊同時存在于同一鏡頭下的俯視視頻數(shù)據(jù);
12、對歷史視頻數(shù)據(jù)進行抽幀,獲得視頻圖像數(shù)據(jù);
13、對所述視頻圖像數(shù)據(jù)進行隨機數(shù)據(jù)增強,所述隨機數(shù)據(jù)增強包括對圖像翻轉、旋轉、裁剪和變形;
14、利用labelme標注軟件對增強后的圖像數(shù)據(jù)中的不同羊行為進行人工分類,并對分類后的行為進行標注,標注后的圖像數(shù)據(jù)構成訓練集。
15、優(yōu)選地,通過訓練集對改進后的deepsort模型和改進后的yolov8模型進行訓練,具體包括:
16、將訓練集中的圖像數(shù)據(jù)輸入改進后的deepsort模型,對圖像數(shù)據(jù)進行均勻分割得到多個圖像塊,用線性投影對多個圖像塊進行標記,將標記后的圖像塊輸入一系列排列算子進行特征編碼,使用全局平均池層和全連接層來捕捉編碼后圖像塊中的羊只身體細節(jié)特征,根據(jù)羊只身體細節(jié)特征為每個羊只分配一個唯一的標識符id,輸出為羊只分配id后的特征圖;所述羊只身體細節(jié)特征包括羊角、尾巴和體型;掩碼策略來解決羊只因為遮擋而導致的目標丟失或id匹配出錯問題。
17、將分配id后的特征圖輸入改進后的yolov8模型,多尺度組卷積模塊msgconv采用多個不同大小的卷積核并行處理特征圖,從特征圖中由粗到細捕獲空間細節(jié)特征;然后使用1x1卷積整合空間細節(jié)特征,將輸入特征圖沿通道維度劃分為g組,其中g是預定義的核大小集合{1,3,5,7}中的元素數(shù)量;每組特征圖由相應的卷積核處理,實現(xiàn)多尺度特征的并行提取;lawds自適應下采樣模塊基于并行提取的特征、通過結合平均池化和1x1卷積來生成圖像序列集,根據(jù)圖像序列集對單只羊的行為進行識別。
18、優(yōu)選地,所述羊的行為包括正常行為和異常行為,正常行為包括行走、站立、進食和舔舐,異常行為包括跛行、攻擊和躺臥。
19、優(yōu)選地,將云臺相機布置在牧場通道的頂部,采用云臺相機獲取羊場環(huán)境中包含多只羊及羊的不同行為的歷史視頻數(shù)據(jù)和實時視頻數(shù)據(jù)。
20、本發(fā)明還提供一種羊只行為識別系統(tǒng),包括:
21、模型構建模塊,用于在deepsort模型中引入vision?permutator注意力機制和在線掩碼策略,對改進后的deepsort模型進行訓練得到羊只追蹤模型vitsort;在yolov8模型中添加多尺度組卷積模塊msgconv和lawds自適應下采樣模塊,對改進后的yolov8模型進行訓練得到羊只行為識別模型yolov8-ms;
22、數(shù)據(jù)采集模塊,用于獲取羊場環(huán)境中包含多只羊及羊的不同行為的實時視頻數(shù)據(jù);
23、圖像裁剪模塊,用于從包含多只羊及羊的不同行為的實時視頻數(shù)據(jù)中每秒提取多幀進行羊只檢測,對每一幀中檢測到的羊只生成相應的邊界框,根據(jù)生成的邊界框對羊只圖像進行裁剪;
24、追蹤模塊,用于將裁剪后的圖像輸入羊只追蹤模型vitsort中,通過visionpermutator注意力機制提取裁剪后的圖像中羊的外觀特征,并為提取到的具有相同外觀特征的每只羊分配一個唯一的標識符id,并根據(jù)標識id對羊個體進行持續(xù)追蹤;
25、識別模塊,用于將追蹤到的帶有唯一標識符id的多個圖像輸入羊只行為識別模型yolov8-ms,多尺度組卷積模塊msgconv采用多個不同大小的卷積核并行處理帶有唯一標識符id的多個圖像,獲得羊只的多個空間細節(jié)特征;lawds自適應下采樣模塊根據(jù)羊只的多個空間細節(jié)特征生成圖像序列集,根據(jù)圖像序列集對單只羊的行為進行識別;其中,所述空間細節(jié)特征為羊只在不同時間、不同位置的形態(tài)特征;
26、行為分類模塊,用于記錄同一只羊在不同時間、不同位置的形態(tài)特征出現(xiàn)的頻率和持續(xù)時間,根據(jù)同一形態(tài)特征出現(xiàn)的頻率和持續(xù)時間對羊只的行為進行分類。
27、本發(fā)明還提供一種計算機設備,包括存儲器、處理器及存儲在存儲器上的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)所述羊只行為識別方法中任一項所述的步驟。
28、本發(fā)明還提供一種計算機可讀存儲介質,所述存儲介質上存儲有計算機程序,其特征在于,該計算機程序被處理器加載時,能夠執(zhí)行所述羊只行為識別方法中任一項所述的步驟。
29、本發(fā)明提供的羊只行為識別方法具有以下有益效果:
30、本發(fā)明通過在deepsort模型中引入vision?permutator注意力機制和在線掩碼策略,構建羊只追蹤模型vitsort,通過注意力機制能夠在降低特征圖分辨率的同時保留重要的信息,提高模型的表征能力;同時增加在線掩碼策略解決羊只因為遮擋而導致的目標丟失或id匹配出錯問題,增強了模型在復雜場景下的魯棒性和準確性。采用羊只行為識別模型yolov8-ms進行行為識別,結合多尺度組卷積和自適應下采樣模塊,提升了模型的特征提取能力和表示能力;能夠根據(jù)同一只羊在不同時間、不同位置的形態(tài)特征出現(xiàn)的頻率和持續(xù)時間對羊只的行為進行分類,克服了單只羊處理存在的局限性,極大地提高了檢測精度和行為識別的準確度。