本發(fā)明涉及人工智能及醫(yī)療健康領(lǐng)域,具體涉及一種物體識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、目前,在現(xiàn)有技術(shù)中,物體識(shí)別系統(tǒng)主要依賴于傳統(tǒng)的圖像處理算法和機(jī)器學(xué)習(xí)模型,盡管這些方法在特定條件下能夠?qū)崿F(xiàn)一定的識(shí)別效果,但它們?cè)诙鄠€(gè)方面存在顯著的局限性:
2、1、環(huán)境適應(yīng)性:傳統(tǒng)方法對(duì)環(huán)境變化非常敏感,如光照條件、背景復(fù)雜度以及物體的遮擋和姿態(tài)變化,這些都可能導(dǎo)致物體識(shí)別性能顯著下降;
3、2、特征泛化能力:許多現(xiàn)有算法在特征泛化方面表現(xiàn)不佳,難以適應(yīng)新的或未見過的物體,限制了其在多樣化場(chǎng)景中的應(yīng)用;
4、3、可擴(kuò)展性和可維護(hù)性:隨著新物體種類的增加,現(xiàn)有的物體識(shí)別系統(tǒng)往往需要重新收集數(shù)據(jù)、訓(xùn)練模型,這一過程耗時(shí)且成本高昂,影響了系統(tǒng)的可擴(kuò)展性和可維護(hù)性;
5、4、準(zhǔn)確性和魯棒性:在復(fù)雜或動(dòng)態(tài)變化的環(huán)境中,傳統(tǒng)的物體識(shí)別系統(tǒng)在準(zhǔn)確性和魯棒性往往不足,難以滿足當(dāng)前高精度要求的應(yīng)用場(chǎng)景。
6、綜上所述,現(xiàn)有技術(shù)中,當(dāng)前的物體識(shí)別方法在準(zhǔn)確性、魯棒性以及可擴(kuò)展性等方面存在著不足,特別是在醫(yī)療健康等對(duì)精確度要求極高的領(lǐng)域中,這些缺陷尤為突出。
7、因此,現(xiàn)有技術(shù)還有待改進(jìn)和發(fā)展。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述現(xiàn)有技術(shù)的不足之處,本發(fā)明的目的在于提供一種物體識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),旨在解決現(xiàn)有技術(shù)中,當(dāng)前的物體識(shí)別方法在準(zhǔn)確性、魯棒性以及可擴(kuò)展性等方面存在著不足的問題。
2、為了達(dá)到上述目的,本發(fā)明采取了以下技術(shù)方案:
3、第一方面,本發(fā)明提供了一種物體識(shí)別方法,其中,包括:
4、確定待識(shí)別的目標(biāo)物體,并利用圖像采集設(shè)備實(shí)時(shí)采集包含有所述目標(biāo)物體的圖像;
5、對(duì)采集的所述圖像進(jìn)行預(yù)處理,得到目標(biāo)圖像;
6、采用圖像分割算法提取所述目標(biāo)圖像中的所有物體;
7、利用視覺大模型對(duì)各所述物體進(jìn)行特征識(shí)別,并將識(shí)別出的特征轉(zhuǎn)換為特征描述;
8、基于各所述物體的所述特征描述,通過大語言模型生成所述目標(biāo)物體的識(shí)別結(jié)果。
9、第二方面,本發(fā)明提供了一種物體識(shí)別裝置,其中,包括:
10、采集模塊,用于確定待識(shí)別的目標(biāo)物體,并利用圖像采集設(shè)備實(shí)時(shí)采集包含有所述目標(biāo)物體的圖像;
11、預(yù)處理模塊,用于對(duì)采集的所述圖像進(jìn)行預(yù)處理,得到目標(biāo)圖像;
12、提取模塊,用于采用圖像分割算法提取所述目標(biāo)圖像中的所有物體;
13、轉(zhuǎn)換模塊,用于利用視覺大模型對(duì)各所述物體進(jìn)行特征識(shí)別,并將識(shí)別出的特征轉(zhuǎn)換為特征描述;
14、結(jié)果生成模塊,用于基于各所述物體的所述特征描述,通過大語言模型生成所述目標(biāo)物體的識(shí)別結(jié)果。
15、第三方面,本發(fā)明提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其中,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上所述的物體識(shí)別方法。
16、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的物體識(shí)別方法。
17、相較于現(xiàn)有技術(shù),本發(fā)明提供了一種物體識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,通過確定待識(shí)別的目標(biāo)物體,并利用圖像采集設(shè)備實(shí)時(shí)采集包含有所述目標(biāo)物體的圖像;對(duì)采集的所述圖像進(jìn)行預(yù)處理,得到目標(biāo)圖像;采用圖像分割算法提取所述目標(biāo)圖像中的所有物體;利用視覺大模型對(duì)各所述物體進(jìn)行特征識(shí)別,并將識(shí)別出的特征轉(zhuǎn)換為特征描述;基于各所述物體的所述特征描述,通過大語言模型生成所述目標(biāo)物體的識(shí)別結(jié)果;從而本發(fā)明可解決現(xiàn)有技術(shù)中,當(dāng)前的物體識(shí)別方法在準(zhǔn)確性、魯棒性以及可擴(kuò)展性等方面存在著不足的問題。
1.一種物體識(shí)別方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的物體識(shí)別方法,其特征在于,所述確定待識(shí)別的目標(biāo)物體,并利用圖像采集設(shè)備實(shí)時(shí)采集包含有所述目標(biāo)物體的圖像,包括:
3.根據(jù)權(quán)利要求1所述的物體識(shí)別方法,其特征在于,所述對(duì)采集的所述圖像進(jìn)行預(yù)處理,得到目標(biāo)圖像,包括:
4.根據(jù)權(quán)利要求1所述的物體識(shí)別方法,其特征在于,所述采用圖像分割算法提取所述目標(biāo)圖像中的所有物體,包括:
5.根據(jù)權(quán)利要求1所述的物體識(shí)別方法,其特征在于,所述利用視覺大模型對(duì)各所述物體進(jìn)行特征識(shí)別,并將識(shí)別出的特征轉(zhuǎn)換為特征描述,包括:
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的物體識(shí)別方法,其特征在于,所述基于各所述物體的所述特征描述,通過大語言模型生成所述目標(biāo)物體的識(shí)別結(jié)果,包括:
7.根據(jù)權(quán)利要求6所述的物體識(shí)別方法,其特征在于,所述基于所述識(shí)別結(jié)果,確定所述目標(biāo)物體在所述目標(biāo)圖像中的位置信息之后,還包括:
8.一種物體識(shí)別裝置,其特征在于,包括:
9.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的物體識(shí)別方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的物體識(shí)別方法。