本技術(shù)涉及圖像處理,具體而言,涉及一種動物識別方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、野生動物種類繁多,很多野生動物的外形、顏色非常相似,并且由于野外環(huán)境復(fù)雜,野生動物運動軌跡隨機等因素影響,從攝像頭拍攝到的野生動物圖片中準確識別出野生動物存在一定的難度。
2、現(xiàn)有技術(shù)中采用的方式是基于深度學(xué)習(xí)進行野生動物識別,具體是通過大量的樣本圖像預(yù)先訓(xùn)練得到神經(jīng)網(wǎng)絡(luò)模型,然后基于神經(jīng)網(wǎng)絡(luò)模型對包含動物的圖像進行識別,從而得到圖像中包含的動物名稱。
3、但是,采用目前的神經(jīng)網(wǎng)絡(luò)模型進行圖像識別時,對于一些相似度較高的不同科類的動物以及同一科類下的不同屬種的動物存在誤識別率較高的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)的目的在于,針對上述現(xiàn)有技術(shù)中的不足,提供一種動物識別方法、裝置、設(shè)備及存儲介質(zhì),以解決現(xiàn)有技術(shù)中對于一些相似度較高的不同科類的動物以及同一科類下的不同屬種的動物存在誤識別率較高的問題。
2、為實現(xiàn)上述目的,本技術(shù)采用的技術(shù)方案如下:
3、第一方面,本技術(shù)提供了一種動物識別方法,所述方法包括:
4、獲取多個樣本數(shù)據(jù),所述樣本數(shù)據(jù)中包括:樣本圖像、位置標注信息、第一標注信息和第二標注信息,所述第一標注信息用于指示所述樣本圖像中動物的科類信息,所述第二標注信息用于指示所述樣本圖像中動物的名稱,所述位置標注信息用于表征動物在所述樣本圖像中的位置;
5、將各所述樣本圖像輸入第一初始分類模型中,基于各所述樣本圖像的第一標注信息以及位置標注信息對所述第一初始分類模型進行訓(xùn)練,得到第一分類模型;
6、將各所述樣本圖像輸入對應(yīng)的第二初始分類模型中,分別基于各所述樣本圖像的第二標注信息對所述第二初始分類模型進行訓(xùn)練,得到多個第二分類模型;
7、將包含待識別動物的待識別圖像輸入所述第一分類模型,由所述第一分類模型識別得到所述待識別圖像中所述待識別動物的目標科類以及位置信息;
8、根據(jù)所述待識別動物的目標科類以及位置信息,將所述待識別圖像輸入所述目標科類對應(yīng)的目標第二分類模型,得到所述待識別動物的動物名稱,其中,所述目標第二分類模型為多個第二分類模型中的一個,各所述第二分類模型分別對應(yīng)一種科類,且各所述第二分類模型且用于識別對應(yīng)的科類內(nèi)的動物的名稱。
9、可選地,所述將各所述樣本圖像輸入第一初始分類模型中,基于各所述樣本圖像的第一標注信息以及位置標注信息對所述第一初始分類模型進行訓(xùn)練,得到第一分類模型,包括:
10、將各所述樣本圖像輸入所述第一初始分類模型中,由所述第一初始分類模型預(yù)測得到各所述樣本圖像的預(yù)測位置以及預(yù)測科類;
11、根據(jù)所述預(yù)測位置、所述預(yù)測科類、所述位置標注信息以及所述第一標注信息對所述第一初始分類模型進行迭代訓(xùn)練,得到所述第一分類模型。
12、可選地,所述將各所述樣本圖像輸入第一初始分類模型中,基于各所述樣本圖像的第一標注信息以及位置標注信息對所述第一初始分類模型進行訓(xùn)練,得到第一分類模型之前,還包括:
13、獲取各所述樣本圖像中動物的科類信息,對各所述樣本圖像的動物科類進行格式轉(zhuǎn)換,得到各所述第一標注信息。
14、可選地,所述將各所述樣本圖像輸入對應(yīng)的第二初始分類模型中,分別基于各所述樣本圖像的第二標注信息對所述第二初始分類模型進行訓(xùn)練,得到多個第二分類模型,包括:
15、基于所述第一標注信息、第二標注信息以及所述位置標注信息將各所述樣本圖像分為多個目標樣本圖像集,各所述目標樣本圖像集分別包括一種動物的樣本圖像;
16、將所述目標樣本圖像集輸入對應(yīng)的第二初始分類模型中,分別基于目標樣本圖像集中各樣本圖像的第二標注信息對所述第二初始分類模型進行訓(xùn)練,得到第二分類模型。
17、可選地,所述基于所述第一標注信息、第二標注信息以及所述位置標注信息將各所述樣本圖像分為多個目標樣本圖像集,包括:
18、基于各所述樣本圖像的位置標注信息,對各所述樣本圖像進行裁剪,得到裁剪后樣本圖像;
19、基于各所述裁剪后樣本圖像的第一標注信息對各所述裁剪后樣本圖像進行分類,得到多個科類樣本圖像集;
20、基于各所述裁剪后樣本圖像的第二標注信息對各所述科類樣本圖像集中的樣本圖像進行分類,得到多個目標樣本圖像集。
21、可選地,所述將所述目標樣本圖像集輸入對應(yīng)的第二初始分類模型中,分別基于目標樣本圖像集中各樣本圖像的第二標注信息對所述第二初始分類模型進行訓(xùn)練,得到第二分類模型,包括:
22、將所述目標樣本圖像集中的樣本圖像依次輸入所述第二初始分類模型,由所述第二初始分類模型預(yù)測得到各所述樣本圖像的預(yù)測名稱;
23、基于各所述樣本圖像的預(yù)測名稱以及各所述樣本圖像的第二標注信息對所述第二初始分類模型進行迭代訓(xùn)練,得到所述第二分類模型。
24、可選地,所述根據(jù)所述待識別動物的目標科類以及位置信息,將所述待識別圖像輸入所述目標科類對應(yīng)的目標第二分類模型,得到所述待識別動物的動物名稱,包括:
25、根據(jù)所述位置信息對所述待識別圖像進行裁剪,得到裁剪后圖像;
26、根據(jù)所述待識別動物的目標科類確定所述目標科類對應(yīng)的所述目標第二分類模型;
27、將所述裁剪后圖像輸入所述目標第二分類模型,由所述第二分類模型識別得到所述待識別動物的動物名稱。
28、第二方面,本技術(shù)提供了一種動物識別裝置,所述裝置包括:
29、獲取模塊,用于獲取多個樣本數(shù)據(jù),所述樣本數(shù)據(jù)中包括:樣本圖像、位置標注信息、第一標注信息和第二標注信息,所述第一標注信息用于指示所述樣本圖像中動物的科類信息,所述第二標注信息用于指示所述樣本圖像中動物的名稱,所述位置標注信息用于表征動物在所述樣本圖像中的位置;
30、第一訓(xùn)練模塊,用于將各所述樣本圖像輸入第一初始分類模型中,基于各所述樣本圖像的第一標注信息以及位置標注信息對所述第一初始分類模型進行訓(xùn)練,得到第一分類模型;
31、第二訓(xùn)練模塊,用于將各所述樣本圖像輸入對應(yīng)的第二初始分類模型中,分別基于各所述樣本圖像的第二標注信息對所述第二初始分類模型進行訓(xùn)練,得到多個第二分類模型;
32、第一識別模塊,用于將包含待識別動物的待識別圖像輸入所述第一分類模型,由所述第一分類模型識別得到所述待識別圖像中所述待識別動物的目標科類以及位置信息;
33、第二識別模塊,用于根據(jù)所述待識別動物的目標科類以及位置信息,將所述待識別圖像輸入所述目標科類對應(yīng)的目標第二分類模型,得到所述待識別動物的動物名稱,其中,所述目標第二分類模型為多個第二分類模型中的一個,各所述第二分類模型分別對應(yīng)一種科類,且各所述第二分類模型且用于識別對應(yīng)的科類內(nèi)的動物的名稱。
34、可選地,所述第一訓(xùn)練模塊具體用于:
35、將各所述樣本圖像輸入所述第一初始分類模型中,由所述第一初始分類模型預(yù)測得到各所述樣本圖像的預(yù)測位置以及預(yù)測科類;
36、根據(jù)所述預(yù)測位置、所述預(yù)測科類、所述位置標注信息以及所述第一標注信息對所述第一初始分類模型進行迭代訓(xùn)練,得到所述第一分類模型。
37、可選地,所述第一訓(xùn)練模塊還具體用于:
38、獲取各所述樣本圖像中動物的科類信息,對各所述樣本圖像的動物科類進行格式轉(zhuǎn)換,得到各所述第一標注信息。
39、可選地,所述第二訓(xùn)練模塊具體用于:
40、基于所述第一標注信息、第二標注信息以及所述位置標注信息將各所述樣本圖像分為多個目標樣本圖像集,各所述目標樣本圖像集分別包括一種動物的樣本圖像;
41、將所述目標樣本圖像集輸入對應(yīng)的第二初始分類模型中,分別基于目標樣本圖像集中各樣本圖像的第二標注信息對所述第二初始分類模型進行訓(xùn)練,得到第二分類模型。
42、可選地,所述第二訓(xùn)練模塊具體用于:
43、基于各所述樣本圖像的位置標注信息,對各所述樣本圖像進行裁剪,得到裁剪后樣本圖像;
44、基于各所述裁剪后樣本圖像的第一標注信息對各所述裁剪后樣本圖像進行分類,得到多個科類樣本圖像集;
45、基于各所述裁剪后樣本圖像的第二標注信息對各所述科類樣本圖像集中的樣本圖像進行分類,得到多個目標樣本圖像集。
46、可選地,所述第二訓(xùn)練模塊具體用于:
47、將所述目標樣本圖像集中的樣本圖像依次輸入所述第二初始分類模型,由所述第二初始分類模型預(yù)測得到各所述樣本圖像的預(yù)測名稱;
48、基于各所述樣本圖像的預(yù)測名稱以及各所述樣本圖像的第二標注信息對所述第二初始分類模型進行迭代訓(xùn)練,得到所述第二分類模型。
49、可選地,所述第二識別模塊具體用于:
50、根據(jù)所述位置信息對所述待識別圖像進行裁剪,得到裁剪后圖像;
51、根據(jù)所述待識別動物的目標科類確定所述目標科類對應(yīng)的所述目標第二分類模型;
52、將所述裁剪后圖像輸入所述目標第二分類模型,由所述第二分類模型識別得到所述待識別動物的動物名稱。
53、第三方面,本技術(shù)實施例還提供了一種電子設(shè)備,包括:處理器、存儲介質(zhì)和總線,所述存儲介質(zhì)存儲有所述處理器可執(zhí)行的機器可讀指令,當(dāng)電子設(shè)備運行時,所述處理器與所述存儲介質(zhì)之間通過總線通信,所述處理器執(zhí)行所述機器可讀指令,以執(zhí)行如第一方面中任一項所述的動物識別方法的步驟。
54、第四方面,本技術(shù)實施例還提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器運行時執(zhí)行如第一方面中任一項所述的動物識別方法的步驟。
55、本技術(shù)的有益效果是:通過對樣本圖像添加表示科類信息的第一標注信息以及表示動物名稱的第二標注信息,可以使得樣本圖像能夠滿足第一分類模型和第二分類模型的訓(xùn)練,減少了人工標注數(shù)據(jù)集的工作量。通過第一分類模型可以提升對科間動物識別的準確性,通過第二分類模型可以提升對科內(nèi)動物識別的準確性,并且首先對科類信息進行識別,然后基于識別到的科類將圖像輸入對應(yīng)的第二分類模型進行細粒度分類和識別,使得識別的過程更加精細化,有效降低了科間以及科內(nèi)動物的誤識別率。
56、為使本技術(shù)的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。