本申請(qǐng)一般地涉及圖像識(shí)別領(lǐng)域,更具體地,涉及一種對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的方法和系統(tǒng)、計(jì)算機(jī)系統(tǒng)。
背景技術(shù):
:將圖像中出現(xiàn)的多個(gè)對(duì)象進(jìn)行分類是圖像識(shí)別領(lǐng)域中的一個(gè)核心問(wèn)題。CNN(ConvolutionalNeuralNetwork,卷積神經(jīng)網(wǎng)絡(luò))作為深度學(xué)習(xí)網(wǎng)絡(luò)的一種卓而有效的實(shí)現(xiàn)方式,在圖像識(shí)別領(lǐng)域中得以廣泛應(yīng)用。一般而言,傳統(tǒng)的CNN需要使用具有不同卷積核(kernel)的多個(gè)篩選器(filter)與圖像進(jìn)行卷積操作從而獲得不同的特征圖(featuremap)。在每個(gè)特征圖中,圖像僅對(duì)與所使用的篩選器有關(guān)的特征有強(qiáng)的響應(yīng)。因此,為了對(duì)圖像中多個(gè)不同的對(duì)象進(jìn)行準(zhǔn)確的分類,往往需要選用數(shù)量眾多的篩選器,這增加了計(jì)算負(fù)擔(dān),限制了圖像識(shí)別的速度。技術(shù)實(shí)現(xiàn)要素:本申請(qǐng)?zhí)峁┮环N對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的技術(shù)方案。本申請(qǐng)實(shí)施方式的一方面提供用于對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的方法,該方法包括:過(guò)濾圖像以生成第一特征圖,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值;根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,其中,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值;更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性;以及根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些可選的實(shí)現(xiàn)方式中,根據(jù)更新后的第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類包括:根據(jù)更新后的各第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值;以及將各對(duì)象分別劃分到具有最大概率值的預(yù)定種類中。在一些可選的實(shí)現(xiàn)方式中,根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類包括:將更新后的各第二特征圖線性合并為第三特征圖;以及根據(jù)第三特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些可選的實(shí)現(xiàn)方式中,根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,包括:將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加。在一些可選的實(shí)現(xiàn)方式中,根據(jù)第一特征圖中的各第一特征值和多個(gè)偏置值生成與各偏置值相對(duì)應(yīng)的第二特征圖包括:將各第二特征圖中的小于預(yù)定閾值的第二特征值設(shè)置為零。在一些可選的實(shí)現(xiàn)方式中,各偏置值各不相同,且各預(yù)定閾值基于各偏置值確定。在一些可選的實(shí)現(xiàn)方式中,更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性,包括:調(diào)整至少一對(duì)象的至少一語(yǔ)義特征以增強(qiáng)第二特征圖中各第二特征值之間的差異性。在一些可選的實(shí)現(xiàn)方式中,過(guò)濾圖像以生成第一特征圖包括:將圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)的特征提取層;以及在特征提取層中使用多個(gè)第一篩選器與圖像進(jìn)行卷積從而生成與各第一篩選器對(duì)應(yīng)的第一特征圖;其中,各第一篩選器用于對(duì)圖像中的其中一個(gè)語(yǔ)義特征進(jìn)行篩選。在一些可選的實(shí)現(xiàn)方式中,卷積神經(jīng)網(wǎng)絡(luò)還包括特征圖分解層,根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,包括:將第一特征圖輸入至特征圖分解層;將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加;基于各偏置值確定預(yù)定閾值;以及將各第二特征圖中的小于預(yù)定閾值的第二特征值設(shè)置為零。在一些可選的實(shí)現(xiàn)方式中,卷積神經(jīng)網(wǎng)絡(luò)還包括與特征圖分解層聯(lián)接的特征增強(qiáng)層,更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性,包括:將多個(gè)第二特征圖分別輸入至特征增強(qiáng)層;以及在特征增強(qiáng)層中使用第二篩選器與各第二特征圖進(jìn)行卷積,從而更新各第二特征圖以增強(qiáng)各第二特征值之間的差異性;其中,第二篩選器用于對(duì)第二特征圖中的其中一個(gè)語(yǔ)義特征進(jìn)行增強(qiáng)。在一些可選的實(shí)現(xiàn)方式中,卷積神經(jīng)網(wǎng)絡(luò)還包括聯(lián)接至特征增強(qiáng)層的分類層,根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類還包括:將更新后各第二特征圖輸入至分類層;根據(jù)更新后的各第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值;以及將各對(duì)象分別劃分到具有最大概率值的預(yù)定種類中。本申請(qǐng)實(shí)施方式的另一方面提供用于對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的系統(tǒng),該系統(tǒng)包括:特征提取器,用于過(guò)濾圖像以生成第一特征圖,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值;偏置器,用于根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,其中,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值;特征強(qiáng)化器,用于更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性;以及分類器,用于根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些可選的實(shí)現(xiàn)方式中,分類器包括:評(píng)估單元,用于根據(jù)更新后的各第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值;以及劃分單元,用于將各對(duì)象分別劃分到具有最大概率值的預(yù)定種類中。在一些可選的實(shí)現(xiàn)方式中,分類器包括:合并單元,用于將更新后的各第二特征圖線性合并為第三特征圖;以及分類單元,用于根據(jù)第三特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些可選的實(shí)現(xiàn)方式中,偏置器用于:將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加。在一些可選的實(shí)現(xiàn)方式中,偏置器還用于:將各第二特征圖中的小于預(yù)定閾值的第二特征值設(shè)置為零。在一些可選的實(shí)現(xiàn)方式中,各偏置值各不相同,且各預(yù)定閾值基于各偏置值確定。在一些可選的實(shí)現(xiàn)方式中,特征強(qiáng)化器進(jìn)一步用于:調(diào)整至少一對(duì)象的至少一語(yǔ)義特征以增強(qiáng)第二特征圖中各第二特征值之間的差異性。在一些可選的實(shí)現(xiàn)方式中,特征提取器還包括:第一輸入單元,用于將圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)的特征提取層;以及第一卷積單元,用于在特征提取層中使用第一篩選器與圖像進(jìn)行卷積從而生成第一特征圖;其中,各第一篩選器用于對(duì)圖像中的其中一個(gè)語(yǔ)義特征進(jìn)行篩選。在一些可選的實(shí)現(xiàn)方式中,卷積神經(jīng)網(wǎng)絡(luò)包括特征圖分解層,偏置器還包括:第二輸入單元,用于將第一特征圖輸入至特征圖分解層;疊加單元,用于將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加;確定單元,用于根據(jù)各偏置值確定預(yù)定閾值;以及生成單元,用于將小于預(yù)定閾值的第二特征值設(shè)置為零。在一些可選的實(shí)現(xiàn)方式中,卷積神經(jīng)網(wǎng)絡(luò)還包括與特征圖分解層聯(lián)接的特征增強(qiáng)層,特征強(qiáng)化器還包括:第三輸入單元,用于將多個(gè)第二特征圖分別輸入至特征增強(qiáng)層;以及第二卷積單元,用于在特征增強(qiáng)層中使用第二篩選器與各第二特征圖進(jìn)行卷積,從而更新各第二特征圖以增強(qiáng)各第二特征值之間的差異性;其中,第二篩選器用于對(duì)第二特征圖中的其中一個(gè)語(yǔ)義特征進(jìn)行增強(qiáng)。在一些可選的實(shí)現(xiàn)方式中,卷積神經(jīng)網(wǎng)絡(luò)包括分類層,分類器還包括:第四輸入單元,用于將更新后的各第二特征圖輸入至分類層;評(píng)估單元還用于根據(jù)輸入至分類層的更新后的第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值。本申請(qǐng)實(shí)施方式的再一方面提供一種計(jì)算機(jī)系統(tǒng),包括:存儲(chǔ)器,存儲(chǔ)可執(zhí)行指令;一個(gè)或多個(gè)處理器,與存儲(chǔ)器通信以執(zhí)行可執(zhí)行指令從而完成以下操作:過(guò)濾圖像以生成第一特征圖,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值;根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,其中,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值;更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性;以及根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。本申請(qǐng)實(shí)施方式的又一方面還提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于存儲(chǔ)計(jì)算機(jī)可讀取的指令。所述指令包括:過(guò)濾圖像以生成第一特征圖的指令,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值;根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖的指令,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值;更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性的指令;以及根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類的指令。采用本申請(qǐng)實(shí)施方式提供的方案,能夠在第一特征圖中加入多個(gè)偏置值從而生成包括第二特征值的多個(gè)第二特征圖,繼而以每個(gè)第二特征圖作為輸入來(lái)過(guò)濾噪音或背景信號(hào)。這樣能夠在使用較少的第一特征圖的前提下將圖像中用于區(qū)分不同對(duì)象的語(yǔ)義特征區(qū)分開(kāi)。相應(yīng)地,本申請(qǐng)的方案降低了對(duì)篩選器的數(shù)量要求,減小了計(jì)算負(fù)擔(dān),提高了圖像識(shí)別的速度。附圖說(shuō)明通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施方式所作的詳細(xì)描述,本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯,其中:圖1示意性地示出了根據(jù)本申請(qǐng)實(shí)施方式的對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的方法的流程圖;圖2示意性地示出了根據(jù)本申請(qǐng)實(shí)施方式的對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的CNN架構(gòu);圖3示意性地示出了根據(jù)本申請(qǐng)實(shí)施方式的對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的系統(tǒng);以及圖4示意性地示出了適于用來(lái)實(shí)現(xiàn)本申請(qǐng)實(shí)施例的終端設(shè)備或服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。具體實(shí)施方式下面結(jié)合附圖和實(shí)施方式對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說(shuō)明。可以理解的是,此處所描述的具體實(shí)施方式僅僅用于解釋本申請(qǐng),而非對(duì)本申請(qǐng)的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本申請(qǐng)相關(guān)的部分。在不沖突的情況下,本申請(qǐng)中的實(shí)施方式及實(shí)施方式中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施方式來(lái)詳細(xì)說(shuō)明本申請(qǐng)。參見(jiàn)圖1所示,為本申請(qǐng)實(shí)施方式提供的一種對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的方法的示意性流程圖。具體而言,本實(shí)施例的方法包括:步驟S110,過(guò)濾圖像以生成第一特征圖,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值。在這里,第一特征圖可以包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值。語(yǔ)義特征值例如可以是對(duì)圖像中某些特征的數(shù)值化表現(xiàn),例如:線條的彎曲程度、顏色、表面粗糙度等。在一些可選的實(shí)現(xiàn)方式中,代表語(yǔ)義特征的特征值(即第一特征值)可以以矩陣的形式排布從而構(gòu)成第一特征圖。步驟120,根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,其中,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值。在這里,各個(gè)偏置值互不相同。也即是說(shuō),可以通過(guò)n個(gè)偏置值對(duì)同一個(gè)第一特征圖進(jìn)行偏置處理,從而生成n個(gè)第二特征圖。在每一個(gè)第二特征圖中,每個(gè)第二特征值均與第一特征圖中的各第一特征值分別對(duì)應(yīng)。在一些可選的實(shí)現(xiàn)方式中,本實(shí)施例的步驟120可以通過(guò)如下的方式來(lái)實(shí)現(xiàn):步驟121,將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加。這樣一來(lái),通過(guò)本步驟生成的多個(gè)第二特征圖中的每一個(gè)第二特征圖中,各第二特征值均為與之對(duì)應(yīng)的第一特征值和其中一個(gè)偏置值之和。可選地,在如上的步驟121之后,本實(shí)施例的步驟120還可以進(jìn)一步包括:步驟122,將各第二特征圖中的小于預(yù)定閾值的第二特征值設(shè)置為零。這樣一來(lái),通過(guò)將小于預(yù)定閾值的第二特征值設(shè)置為零,可以使得各第二特征圖中,大于該預(yù)定閾值的各個(gè)第二特征值更加突出。步驟130,更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性。在一些可選的實(shí)現(xiàn)方式中,本實(shí)施例的方法中,步驟130可以進(jìn)一步包括:調(diào)整至少一對(duì)象的至少一語(yǔ)義特征以增強(qiáng)至少一個(gè)第二特征圖中各第二特征值之間的差異性。通過(guò)增強(qiáng)第二特征圖中各第二特征值之間的差異性,可以使得某一對(duì)象的某一個(gè)語(yǔ)義特征更加地顯著。步驟140,根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些可選的實(shí)現(xiàn)方式中,本實(shí)施例的方法中,步驟140可以進(jìn)一步包括:步驟141,根據(jù)更新后的第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值。步驟142,將各對(duì)象劃分到具有最大概率值的預(yù)定種類中?;蛘撸诹硪恍┛蛇x的實(shí)現(xiàn)方式中,步驟140還可以進(jìn)一步包括:步驟143,將更新后的各第二特征圖線性合并為第三特征圖。步驟144,根據(jù)第三特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些應(yīng)用場(chǎng)景中,本實(shí)施例的對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的方法可以利用如圖2所示的CNN架構(gòu)來(lái)實(shí)現(xiàn)。如圖2所示,CNN架構(gòu)可包括特征提取層210、特征圖分解層220、特征增強(qiáng)層230和分類層240。下面,將結(jié)合結(jié)圖2來(lái)具體地示意性說(shuō)明利用CNN架構(gòu)來(lái)實(shí)現(xiàn)本實(shí)施例的用于對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的方法。如圖2所示,包含有多個(gè)對(duì)象的圖像20輸入至CNN架構(gòu)200的特征提取層210。在特征提取層210中過(guò)濾圖像20以生成第一特征圖211,第一特征圖211包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值。語(yǔ)義特征例如是對(duì)圖像中某些特征的數(shù)值化表現(xiàn),這些特征例如可以包括但不限于線條的彎曲程度、顏色、表面粗糙度等。在一些可選的實(shí)現(xiàn)方式中,用于表征語(yǔ)義特征的各第一特征值可以以矩陣的形式排布從而構(gòu)成第一特征圖211。特征提取層210可包括級(jí)聯(lián)的多個(gè)篩選層以構(gòu)成分級(jí)結(jié)構(gòu),在每個(gè)篩選層中均布置有多個(gè)第一篩選器。各第一篩選器均會(huì)增強(qiáng)與該第一篩選器對(duì)應(yīng)的第一特征值而壓低其它第一特征值。具體地,通過(guò)在特征提取層210中使用多個(gè)第一篩選器與圖像20進(jìn)行卷積,從而生成與各第一篩選器對(duì)應(yīng)的第一特征圖211。其中,各第一篩選器用于對(duì)圖像中的其中一個(gè)語(yǔ)義特征進(jìn)行篩選。相應(yīng)地,第一特征圖211的數(shù)目取決于最后一級(jí)篩選層中的篩選器的數(shù)目,即,每一個(gè)第一特征圖211對(duì)應(yīng)于最后一級(jí)篩選層中的一個(gè)篩選器,并且每一個(gè)第一特征圖211均由多個(gè)對(duì)象的語(yǔ)義特征值(也即第一特征值)構(gòu)成。在傳統(tǒng)的CNN架構(gòu)中,每一個(gè)第一特征圖211均經(jīng)過(guò)被稱作激活層(activationlayer)的非線性作用層(諸如ReLU)對(duì)第一特征圖211中的特征值進(jìn)行過(guò)濾。具體地,每一個(gè)第一特征圖211均通過(guò)激活層被設(shè)定一個(gè)閾值,大于該閾值的語(yǔ)義特征值被保留,而小于該閾值的語(yǔ)義特征值被丟棄。通過(guò)這種激活層的激活操作,可過(guò)濾掉一些與目標(biāo)特征無(wú)關(guān)的語(yǔ)義特征。然而,這種過(guò)濾是不可逆的,因此有可能過(guò)濾掉一些有用的信息。因而,為了能夠?qū)D像中的不同的對(duì)象區(qū)分開(kāi),往往需要提取為數(shù)眾多的第一特征圖211從而能夠以多個(gè)不同特征為依據(jù)區(qū)分不同的對(duì)象。因而,在對(duì)圖像中的對(duì)象進(jìn)行分類的過(guò)程中會(huì)出現(xiàn)大量的冗余計(jì)算。在應(yīng)用了如圖2所示的CNN架構(gòu)來(lái)實(shí)現(xiàn)本申請(qǐng)的對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的方法時(shí),上述問(wèn)題至少部分地得以解決。具體地,基于第一特征圖211中的各第一特征值和多個(gè)偏置值221、222、223等生成與各偏置值相對(duì)應(yīng)的第二特征圖224、225、226等,其中第二特征圖224、225、226包括多個(gè)第二特征值。在一些可選的實(shí)現(xiàn)方式中,以上過(guò)程可以在特征圖分解層220中完成。特征圖分解層220聯(lián)接至特征提取層210并且將各偏置值與第一特征圖的各第一特征值疊加生成與各偏置值對(duì)應(yīng)的多個(gè)第二特征值。具體地,如圖2所示,在特征圖分解層220中,偏置值221與第一特征圖211中的第一特征值相加從而生成多個(gè)與該偏置值221對(duì)應(yīng)的第二特征值(未示出);偏置值222與第一特征圖211中的第一特征值相加從而生成多個(gè)與偏置值222對(duì)應(yīng)的第二特征值;以及偏置值223與第一特征圖211中的第一特征值相加從而生成多個(gè)與偏置值223對(duì)應(yīng)的第二特征值。在一些可選的實(shí)現(xiàn)方式中,可以將這些分別與各偏置值對(duì)應(yīng)的多個(gè)第二特征值直接作為與各偏置值對(duì)應(yīng)的第二特征圖224、225、226等輸出至CNN架構(gòu)200的后級(jí)?;蛘撸诹硪恍┛蛇x的實(shí)現(xiàn)方式中,還可以將這些分別與各偏置值對(duì)應(yīng)的多個(gè)第二特征值分別輸入至特征圖分解層220的多個(gè)激活層(未示出),這些激活層例如可以是ReLU、sigmoid等。這些激活層分別基于各偏置值確定預(yù)定閾值,以及將分別與各偏置值對(duì)應(yīng)的多個(gè)第二特征值中的小于預(yù)定閾值的第二特征值設(shè)置為零以生成第二特征圖。作為一個(gè)示例,偏置值各不相同,且各預(yù)定閾值基于各偏置值確定,即,該多個(gè)預(yù)定閾值可分別與多個(gè)偏置值一一對(duì)應(yīng)。具體地,分別與各偏置值對(duì)應(yīng)的第二特征值分別與不同的對(duì)應(yīng)閾值作比較,并且將小于對(duì)應(yīng)閾值的語(yǔ)義特征值設(shè)為零。以上過(guò)程可以由如下公式描述:x^n,i=σ(xn,i+bn,k)---(1)]]>其中,n代表第一特征圖211的序號(hào),i表示第一特征圖211中的元素序號(hào),表示第n個(gè)第二特征圖的第i個(gè)疊加了偏置值的元素的語(yǔ)義特征值,xn,i表示第n個(gè)第一特征圖的第i個(gè)未疊加偏置值的元素的語(yǔ)義特征值,σ表示激活操作,bn,k表示為第n個(gè)第一特征圖設(shè)置的第k個(gè)偏置值。在激活層使用ReLU的情況下,激活操作σ的邏輯可以表示為:若xn,i≤-bn,k,則若xn,i>-bn,k,則以上所示的特征圖分解層220也稱為多偏置值非線性激活層(Multi-biasNon-linearActivationLayer)。隨后,更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性。具體地,從特征圖分解層220輸出的多個(gè)第二特征圖224、225、226等可輸入至特征增強(qiáng)層230。特征增強(qiáng)層230與特征圖分解層220聯(lián)接并且包括多個(gè)第二篩選器(未示出)。在特征增強(qiáng)層230中,通過(guò)將各第二特征圖與第二篩選器進(jìn)行卷積,從而更新各第二特征圖,進(jìn)而增強(qiáng)該多個(gè)第二特征圖224、225、226等中每個(gè)第二特征圖中的各第二特征值之間的差異性。在一些可選的實(shí)現(xiàn)方式中,可將經(jīng)差異性增強(qiáng)后的多個(gè)第二特征圖線性地合并為一個(gè)特征圖,如圖2所示的第三特征圖231。該過(guò)程可由如下公式描述:hm=Σn=1NΣk=1Kwm,n,kx^n,k---(2)]]>其中hm表示從特征增強(qiáng)層230中的第m個(gè)第二篩選器輸出的第三特征圖。表示求和遍及累計(jì)K個(gè)第二特征圖,表示求和累計(jì)N個(gè)第一特征圖(即,特征提取層210的最后一級(jí)篩選層的篩選器的數(shù)目)。Wm,n,k表示從特征圖分解層220輸出的第n,k個(gè)特征圖到特征增強(qiáng)層230的第m個(gè)第二篩選器的映射權(quán)重,表示從特征圖分解層220輸出的第n,k個(gè)第二特征圖。需要說(shuō)明的是,盡管圖2中僅示出了一個(gè)第一特征圖211,但是如本領(lǐng)域普通技術(shù)人員所理解的以及如在上文中所描述的,第一特征圖211可具有任意的數(shù)量,該數(shù)量取決于特征提取層210的最后一級(jí)篩選層中的篩選器的數(shù)目。為了更清晰地描述公式(2)所描述的將第二特征圖合并為第三特征圖231的過(guò)程,以下將公式(2)展開(kāi)為針對(duì)特征圖中每個(gè)元素的如下公式(3):hm,j=Σn=1NΣk=1KΣi=1WHwm,n,k,i,jx^n,k,i---(3)]]>其中hm,j表示從特征增強(qiáng)層230中的第m個(gè)第二篩選器輸出的第三特征圖231的第j個(gè)元素,wm,n,k,i,j表示從特征圖分解層220輸出的第n,k個(gè)特征圖的第i個(gè)元素到特征增強(qiáng)層230的第m個(gè)第二篩選器的第j個(gè)元素的映射權(quán)重,表示從特征圖分解層220輸出的第n,k個(gè)第二特征圖的第i個(gè)元素。如果將公式(1)代入公式(3),則可更清晰地得到從第一特征圖211到第三特征圖231的完整映射過(guò)程,如以下公式(4)所示:hm,j=Σi=1WHΣn=1NΣk=1Kwm,n,k,j,iσ(xn,i+bn,k),=Σi=1WHΣn=1Nwm,n,j,i′Σk=1Kam,n,k,j,iσ(xn,i+bn,k)=Σi=1WHΣn=1Nwm,n,j,i′um,n,j,i,---(4)]]>公式(4)中,w′m,n,j,i和um,n,j,i可由如下公式(5)來(lái)表示:wm,n,k,j,i=Δwm,n,j,i′am,n,k,j,i,]]>um,n,j,i=ΔΣk=1Kam,n,k,j,iσ(xn,i+bn,k)---(5)]]>以上公式描述了從n個(gè)第一特征圖到第n×k個(gè)第二特征圖的映射以及最終到第m個(gè)第三特征圖的映射。在特征增強(qiáng)層230中,可通過(guò)對(duì)映射權(quán)重以及偏置值的訓(xùn)練來(lái)增強(qiáng)用于將多個(gè)對(duì)象區(qū)分開(kāi)的語(yǔ)義特征之間的差異性。最后,基于更新后的第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。具體地,根據(jù)更新后的第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值;以及將各對(duì)象劃分到具有最大概率值的預(yù)定種類中。更具體地,首先,將更新的各第二特征圖輸入至分類層。參照?qǐng)D2,將從特征增強(qiáng)層230輸出的更新后的第二特征圖(例如,圖2所示的第三特征圖231,但本申請(qǐng)不限于此)輸入至與特征增強(qiáng)層230聯(lián)接的分類層240。在分類層240中,系統(tǒng)將根據(jù)更新后的第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值,然后將各對(duì)象劃分到具有最大概率值的預(yù)定種類中。需要說(shuō)明的是,盡管圖2示意性地示出了在特征增強(qiáng)層230中將更新后的各第二特征圖線性合并成為第三特征圖再將第三特征圖輸入至分類層240進(jìn)行分類,但這僅是示意性的。在一些應(yīng)用場(chǎng)景中,可以由分類層240來(lái)將更新后的各第二特征圖線性合并成為第三特征圖,并根據(jù)第三特征圖來(lái)對(duì)多個(gè)對(duì)象進(jìn)行分類。例如,在分類層240中,對(duì)象241得到如下評(píng)估結(jié)果:桌子——概率0.6;椅子——概率0.2;沙發(fā)——概率0.1;其它種類——概率0.1。則對(duì)象241可被劃分到桌子的種類中。在這里,對(duì)象及種類應(yīng)以寬泛的概念來(lái)理解,而不應(yīng)被解釋為過(guò)于概念化或過(guò)于形式化的意義。例如,CNN架構(gòu)200可在不同級(jí)別上對(duì)對(duì)象進(jìn)行分類,例如僅僅將前景與背景進(jìn)行分類、對(duì)不同的物種進(jìn)行分類、對(duì)不同的人進(jìn)行分類(例如分類為成年男子、成年女子、男童、女童等)、以及對(duì)人的不同器官進(jìn)行分類。如本領(lǐng)域普通技術(shù)人員所理解的,CNN架構(gòu)200在使用前需要用訓(xùn)練過(guò)程來(lái)對(duì)各個(gè)層(特征提取層210、特征圖分解層220、特征增強(qiáng)層230、分類層240等)進(jìn)行訓(xùn)練來(lái)優(yōu)化各個(gè)層的參數(shù)從而能夠滿足實(shí)際的圖像識(shí)別(例如,對(duì)象分類)的應(yīng)用。通過(guò)參照?qǐng)D2的CNN架構(gòu)200實(shí)現(xiàn)的描述可以看出,采用本實(shí)施例的方法后,可減少對(duì)特征提取層210中的第一篩選器的數(shù)量的需求。具體地,通過(guò)使用特征圖分解層220可將從特征提取層210中過(guò)濾提取的各第一特征圖211分解為多個(gè)子特征圖(即第二特征圖224、225、226等)。在將各第一特征圖211分解為多個(gè)子特征圖的過(guò)程中,分別引入了多個(gè)不同的偏置值及閾值,從而在隨后的激活過(guò)程中既通過(guò)該不同的閾值分別過(guò)濾掉后續(xù)處理中非必要的語(yǔ)義特征值,又盡可能地避免了僅引入一個(gè)閾值所帶來(lái)的有效數(shù)據(jù)的大量損失。通過(guò)這種方式,既過(guò)濾掉了噪音或背景信號(hào)從而增強(qiáng)了有用的語(yǔ)義特征,又保留了足夠多的有用信息。這樣能夠在使用較少的第一特征圖的前提下將圖像中用于區(qū)分不同對(duì)象的語(yǔ)義特征區(qū)分開(kāi),從而降低了計(jì)算負(fù)擔(dān),提高了處理速度。圖3示意性地示出了根據(jù)本申請(qǐng)實(shí)施方式的對(duì)圖像中的多個(gè)對(duì)象進(jìn)行分類的系統(tǒng)300。在該實(shí)施方式中,系統(tǒng)300可包括:特征提取器310、偏置器320、特征強(qiáng)化器330和分類器340。其中,特征提取器310可用于過(guò)濾圖像以生成第一特征圖,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值。偏置器320可用于根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,其中,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值。特征強(qiáng)化器330可用于更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性。分類器340可用于根據(jù)更新后的第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些可選的實(shí)現(xiàn)方式中,分類器340可進(jìn)一步包括評(píng)估單元341和劃分單元342。其中,評(píng)估單元341可用于根據(jù)更新后的各第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值。劃分單元342可用于將各對(duì)象分別劃分到具有最大概率值的預(yù)定種類中。在另一些可選的實(shí)現(xiàn)方式中,分類器340還可以進(jìn)一步包括合并單元(圖中未示出)和分類單元(圖中未示出)。其中,合并單元可用于將更新后的各第二特征圖線性合并為第三特征圖。分類單元可用于根據(jù)第三特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。在一些可選的實(shí)現(xiàn)方式中,偏置器320可用于將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加,來(lái)生成各第二特征圖。或者,在另一些可選的實(shí)現(xiàn)方式中,偏置器320還可以在將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加之后,再將各第二特征圖中的小于預(yù)定閾值的第二特征值設(shè)置為零,從而生成各個(gè)第二特征圖。在一些可選的實(shí)現(xiàn)方式中,各偏置值可各不相同,且各預(yù)定閾值可基于各偏置值確定。在一些可選的實(shí)現(xiàn)方式中,特征強(qiáng)化器330可進(jìn)一步用于調(diào)整至少一對(duì)象的至少一語(yǔ)義特征以增強(qiáng)至少一第二特征圖中各第二特征值之間的差異性。在一些可選的實(shí)現(xiàn)方式中,本實(shí)施例的系統(tǒng)300可通過(guò)如參照?qǐng)D2所描述的CNN架構(gòu)200來(lái)實(shí)施。具體地,特征提取器310可進(jìn)一步包括第一輸入單元311和第一卷積單元312。其中,第一輸入單元311可用于將圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)的特征提取層。第一卷積單元312可用于在特征提取層中使用第一篩選器與圖像進(jìn)行卷積從而生成第一特征圖;其中,通過(guò)卷積的操作,第一篩選器增強(qiáng)與第一篩選器對(duì)應(yīng)的第一特征值而壓低第一語(yǔ)義特征值。在一些可選的實(shí)現(xiàn)方式中,偏置器320可以進(jìn)一步包括第二輸入單元321、疊加單元322、確定單元323以及生成單元324。其中,第二輸入單元321可用于將第一特征圖輸入至特征圖分解層。疊加單元322可用于將多個(gè)偏置值中的每個(gè)偏置值分別與第一特征圖中的各第一特征值疊加。確定單元323可用于根據(jù)各偏置值確定預(yù)定閾值。生成單元324可用于將小于預(yù)定閾值的第二特征值設(shè)置為零以生成第二特征圖。在一些可選的實(shí)現(xiàn)方式中,特征強(qiáng)化器330可以進(jìn)一步包括第三輸入單元331和第二卷積單元332。其中,第三輸入單元331可用于將多個(gè)第二特征圖輸入至特征增強(qiáng)層。第二卷積單元332可用于在特征增強(qiáng)層中使用第二篩選器與各第二特征圖進(jìn)行卷積,從而更新各第二特征圖以增強(qiáng)各第二特征值之間的差異性。其中,第二篩選器用于對(duì)第二特征圖中的其中一個(gè)語(yǔ)義特征進(jìn)行增強(qiáng)。在一些可選的實(shí)現(xiàn)方式中,分類器340還可以進(jìn)一步包括第四輸入單元343。第四輸入單元343可用于將更新后的各第二特征圖輸入至分類層。相應(yīng)地,評(píng)估單元341可進(jìn)一步用于根據(jù)輸入至分類層的更新后的第二特征圖評(píng)估圖像中的多個(gè)對(duì)象分別屬于預(yù)定種類的概率值。如本領(lǐng)域普通技術(shù)人員所理解的,上述系統(tǒng)300的特征提取器310、偏置器320、特征強(qiáng)化器330和分類器340可使用集成電路(IC)的形式實(shí)施,該集成電路包括但不限于數(shù)字信號(hào)處理器、圖形處理集成電路、影像處理集成電路以及音頻處理集成電路等。本領(lǐng)域普通技術(shù)人員在本申請(qǐng)所提供的教導(dǎo)下可以知曉通過(guò)使用何種硬件或軟件的形式來(lái)實(shí)施系統(tǒng)300。例如,可采用存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)介質(zhì)的形式來(lái)實(shí)施本申請(qǐng),該計(jì)算機(jī)可執(zhí)行指令分別實(shí)現(xiàn)上述的特征提取器310、偏置器320、特征強(qiáng)化器330和分類器340,從而通過(guò)計(jì)算機(jī)運(yùn)行而實(shí)現(xiàn)它們各自的上述功能。也可采用計(jì)算機(jī)系統(tǒng)來(lái)實(shí)施本申請(qǐng)的系統(tǒng)300,其中該計(jì)算機(jī)系統(tǒng)中包括存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)器以及與存儲(chǔ)器通信的處理器,處理器運(yùn)行該可執(zhí)行指令從而實(shí)現(xiàn)上述對(duì)特征提取器310、偏置器320、特征強(qiáng)化器330和分類器340所描述的功能,以及本申請(qǐng)中所提供的如圖1所示的方法100。下面參考圖4,其示出了適于用來(lái)實(shí)現(xiàn)本申請(qǐng)實(shí)施例的終端設(shè)備或服務(wù)器的計(jì)算機(jī)系統(tǒng)400的結(jié)構(gòu)示意圖。如圖4所示,計(jì)算機(jī)系統(tǒng)400包括中央處理單元(CPU)401,其可以根據(jù)存儲(chǔ)在只讀存儲(chǔ)器(ROM)402中的可執(zhí)行指令或者從存儲(chǔ)部分408加載到隨機(jī)訪問(wèn)存儲(chǔ)器(RAM)403中的可執(zhí)行指令而執(zhí)行各種適當(dāng)?shù)膭?dòng)作和處理。中央處理單元可與只讀存儲(chǔ)器402和/或隨機(jī)訪問(wèn)存儲(chǔ)器430中通信以執(zhí)行可執(zhí)行指令從而完成以下操作:過(guò)濾圖像以生成第一特征圖,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值;根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖,其中,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值;更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性;以及根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類。此外,在RAM403中,還可存儲(chǔ)有系統(tǒng)400操作所需的各種程序和數(shù)據(jù)。CPU401、ROM402以及RAM403通過(guò)總線404彼此相連。輸入/輸出(I/O)接口405也連接至總線404。以下部件連接至I/O接口405:包括鍵盤、鼠標(biāo)等的輸入部分406;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚(yáng)聲器等的輸出部分407;包括硬盤等的存儲(chǔ)部分408;以及包括諸如LAN卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分409。通信部分409經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動(dòng)器410也根據(jù)需要連接至I/O接口405??刹鹦督橘|(zhì)411,諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等,根據(jù)需要安裝在驅(qū)動(dòng)器410上,以便于從其上讀出的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲(chǔ)部分408。特別地,根據(jù)本公開(kāi)的實(shí)施例,上文參考流程圖描述的過(guò)程可以被實(shí)現(xiàn)為計(jì)算機(jī)軟件程序。例如,本公開(kāi)的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品,其包括有形地包含在機(jī)器可讀介質(zhì)上的計(jì)算機(jī)程序,計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中,該計(jì)算機(jī)程序可以通過(guò)通信部分409從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)411被安裝。在該計(jì)算機(jī)程序被中央處理單元(CPU)401執(zhí)行時(shí),執(zhí)行本申請(qǐng)的方法中限定的上述功能。附圖中的流程圖和框圖,圖示了按照本申請(qǐng)各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分,模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。作為另一方面,本申請(qǐng)還提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),該非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是上述實(shí)施例中裝置中所包含的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì);也可以是單獨(dú)存在,未裝配入終端中的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)。上述非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)可讀取的指令。所述指令包括:過(guò)濾圖像以生成第一特征圖的指令,第一特征圖包括用于表征各對(duì)象的語(yǔ)義特征的第一特征值;根據(jù)第一特征圖和多個(gè)偏置值生成多個(gè)第二特征圖的指令,每個(gè)第二特征圖包括與經(jīng)一偏置值偏置處理的各第一特征值分別對(duì)應(yīng)的多個(gè)第二特征值;更新每個(gè)第二特征圖以增強(qiáng)每個(gè)第二特征圖中各第二特征值之間的差異性的指令;以及根據(jù)更新后的各第二特征圖對(duì)多個(gè)對(duì)象進(jìn)行分類的指令。以上描述僅為本申請(qǐng)的較佳實(shí)施例以及對(duì)所運(yùn)用技術(shù)原理的說(shuō)明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請(qǐng)中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時(shí)也應(yīng)涵蓋在不脫離發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請(qǐng)中公開(kāi)的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。當(dāng)前第1頁(yè)1 2 3