本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種室內(nèi)場(chǎng)景的分類(lèi)方法及裝置。
背景技術(shù):
智能識(shí)別和分類(lèi)是計(jì)算機(jī)視覺(jué)中重點(diǎn)研究的問(wèn)題。在眾多的研究中,熱點(diǎn)主要聚焦于物體識(shí)別(一張圖片包含一個(gè)或多個(gè)物體)和人臉識(shí)別(一張帶人臉的圖像)。相比于這些研究,室內(nèi)場(chǎng)景識(shí)別極具挑戰(zhàn),是最為困難的分類(lèi)任務(wù)之一。其難點(diǎn)主要在于室內(nèi)場(chǎng)景不僅包含了大量不同的物體,而且這些物體在空間中的擺放形式千差萬(wàn)別,要對(duì)室內(nèi)場(chǎng)景進(jìn)行準(zhǔn)確地分類(lèi),不僅要分析場(chǎng)景中物體的信息,還需提取整個(gè)場(chǎng)景結(jié)構(gòu)的特征。
為了提高識(shí)別場(chǎng)景的能力,不少學(xué)者對(duì)此進(jìn)行了深入研究,提出了很多行之有效的方法。目前的場(chǎng)景識(shí)別分類(lèi)方法主要包括空間金字塔法、基于高層次語(yǔ)義信息的方法和基于卷積神經(jīng)網(wǎng)絡(luò)的方法。
這些方法有著明顯的缺陷,空間金字塔法的特征表示只依賴(lài)于低層次的幾何信息,缺少對(duì)高層次語(yǔ)義信息的提取,識(shí)別場(chǎng)景的能力很受限制,基于高層次語(yǔ)義信息的場(chǎng)景識(shí)別方法受限于所選物體的范圍,大大地影響了模型分類(lèi)的能力,基于卷積神經(jīng)網(wǎng)絡(luò)的方法主要缺點(diǎn)在于訓(xùn)練過(guò)程需要消耗大量的資源,而且主要在物體的檢測(cè)和分類(lèi)上效果明顯,例如,使用基于卷積神經(jīng)網(wǎng)絡(luò)的方法在計(jì)算機(jī)視覺(jué)系統(tǒng)識(shí)別(imagenet)數(shù)據(jù)集上進(jìn)行物體識(shí)別時(shí),可以達(dá)到94%的識(shí)別率,而使用基于卷積神經(jīng)網(wǎng)絡(luò)的方法在公開(kāi)的mit-67數(shù)據(jù)集上進(jìn)行場(chǎng)景的分類(lèi)時(shí),只能達(dá)到69%的識(shí)別率,原因是室內(nèi)場(chǎng)景的識(shí)別不只依賴(lài)于場(chǎng)景中的物體,還需要連接物體之間的整體關(guān)系,而卷積神經(jīng)網(wǎng)絡(luò)方法直接提取的特征不能較好地把握整體和局部信息的融合。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種室內(nèi)場(chǎng)景的分類(lèi)方法及裝置,旨在解決現(xiàn)有的場(chǎng)景識(shí)別分類(lèi)方法的準(zhǔn)確性不高、分類(lèi)速率不佳的問(wèn)題。
一方面,本發(fā)明提供了一種室內(nèi)場(chǎng)景的分類(lèi)方法,所述方法包括下述步驟:
接收輸入的待分類(lèi)場(chǎng)景圖片;
根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域;
對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到所述待分類(lèi)場(chǎng)景圖片的特征向量;
根據(jù)所述特征向量獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果,判斷所述分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件;
當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果不滿足所述場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)所述觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域,并將所述下一局部觀測(cè)區(qū)域設(shè)置為所述當(dāng)前局部觀測(cè)區(qū)域,跳轉(zhuǎn)至所述對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到所述待分類(lèi)場(chǎng)景圖片的特征向量的步驟;
當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果滿足所述場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)所述分類(lèi)預(yù)測(cè)結(jié)果獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。
另一方面,本發(fā)明提供了一種室內(nèi)場(chǎng)景的分類(lèi)裝置,所述裝置包括:
圖片接收單元,用于接收輸入的待分類(lèi)場(chǎng)景圖片;
區(qū)域獲取單元,用于根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域;
向量獲取單元,用于對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到所述待分類(lèi)場(chǎng)景圖片的特征向量;
條件判斷單元,用于根據(jù)所述特征向量獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果,判斷所述分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件;
重復(fù)執(zhí)行單元,用于當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果不滿足所述場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)所述觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域,并將所述下一局部觀測(cè)區(qū)域設(shè)置為所述當(dāng)前局部觀測(cè)區(qū)域,并觸發(fā)所述向量獲取單元對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理;以及
場(chǎng)景分類(lèi)單元,用于當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果滿足所述場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)所述分類(lèi)預(yù)測(cè)結(jié)果獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。
本發(fā)明在接收輸入的待分類(lèi)場(chǎng)景圖片后,根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域,對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到待分類(lèi)場(chǎng)景圖片的特征向量,根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果,判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件,當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域,并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域,跳轉(zhuǎn)至對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到待分類(lèi)場(chǎng)景圖片的特征向量的步驟,直至分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件,當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽,從而提高了場(chǎng)景識(shí)別分類(lèi)的分類(lèi)速率和準(zhǔn)確性。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例一提供的室內(nèi)場(chǎng)景的分類(lèi)方法的實(shí)現(xiàn)流程圖;
圖2是本發(fā)明實(shí)施例二提供的室內(nèi)場(chǎng)景的分類(lèi)方法中建立觀測(cè)區(qū)域定位模型的實(shí)現(xiàn)流程圖;
圖3是本發(fā)明實(shí)施例三提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu)示意圖;以及
圖4是本發(fā)明實(shí)施例四提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
以下結(jié)合具體實(shí)施例對(duì)本發(fā)明的具體實(shí)現(xiàn)進(jìn)行詳細(xì)描述:
實(shí)施例一:
圖1示出了本發(fā)明實(shí)施例一提供的室內(nèi)場(chǎng)景的分類(lèi)方法的實(shí)現(xiàn)流程,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,詳述如下:
在步驟s101中,接收輸入的待分類(lèi)場(chǎng)景圖片。
在步驟s102中,根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域。
在本發(fā)明實(shí)施例中,待分類(lèi)場(chǎng)景圖片為待識(shí)別分類(lèi)的室內(nèi)場(chǎng)景對(duì)應(yīng)的圖片。為了降低識(shí)別分類(lèi)過(guò)程中計(jì)算的復(fù)雜度,提高識(shí)別分類(lèi)的可控性,根據(jù)觀測(cè)區(qū)域定位模型每次只從場(chǎng)景圖片中選擇一個(gè)局部觀測(cè)區(qū)域,以進(jìn)行識(shí)別和分類(lèi)。
在步驟s103中,對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到待分類(lèi)場(chǎng)景圖片的特征向量。
在本發(fā)明實(shí)施例中,優(yōu)選地,在獲取到當(dāng)前局部觀測(cè)區(qū)域的圖像信息之后,對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理時(shí),首先對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼,得到局部特征向量,然后對(duì)得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作,得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量,從而提高了特征向量的全面性,進(jìn)而提高對(duì)場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。
在步驟s104中,根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果。
在步驟s105中,判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件。
在本發(fā)明實(shí)施例中,分類(lèi)預(yù)測(cè)結(jié)果包括分類(lèi)結(jié)果和對(duì)應(yīng)的預(yù)測(cè)概率,在得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量之后,根據(jù)特征向量可以預(yù)測(cè)得到場(chǎng)景圖片的多個(gè)分類(lèi)結(jié)果及對(duì)應(yīng)的預(yù)測(cè)概率,多個(gè)分類(lèi)結(jié)果的預(yù)測(cè)概率總和為100%,判斷這些多個(gè)分類(lèi)結(jié)果中是否存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果,即判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件。作為示例地,預(yù)測(cè)概率的預(yù)設(shè)閾值可以設(shè)置為65%,判斷這些多個(gè)分類(lèi)結(jié)果中是否存在對(duì)應(yīng)的預(yù)測(cè)概率大于65%的分類(lèi)結(jié)果。
在步驟s106中,當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域,并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域,跳轉(zhuǎn)至對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到待分類(lèi)場(chǎng)景圖片的特征向量的步驟。
在本發(fā)明實(shí)施例中,當(dāng)這些多個(gè)分類(lèi)結(jié)果中不存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果時(shí),說(shuō)明現(xiàn)有的分類(lèi)預(yù)測(cè)結(jié)果不滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件,若要實(shí)現(xiàn)對(duì)待分類(lèi)場(chǎng)景圖片的分類(lèi),還需要獲取場(chǎng)景圖片更多的區(qū)域信息,因此,根據(jù)觀測(cè)區(qū)域定位模型獲取下一個(gè)局部觀測(cè)區(qū)域,并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域,重復(fù)進(jìn)行圖像信息處理并獲取分類(lèi)預(yù)測(cè)結(jié)果,直至分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件。
在步驟s107中,當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。
在本發(fā)明實(shí)施例中,當(dāng)這些預(yù)測(cè)得到的多個(gè)分類(lèi)結(jié)果中存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果時(shí),說(shuō)明分類(lèi)預(yù)測(cè)結(jié)果已經(jīng)滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件,即已經(jīng)可以實(shí)現(xiàn)對(duì)待分類(lèi)場(chǎng)景圖片的分類(lèi),因此,獲取分類(lèi)預(yù)測(cè)結(jié)果中對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果,將該分類(lèi)結(jié)果設(shè)置為待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽,從而提高了場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。
在本發(fā)明實(shí)施例中,接收輸入的待分類(lèi)場(chǎng)景圖片,根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域,從而降低了待分類(lèi)場(chǎng)景圖片識(shí)別分類(lèi)的復(fù)雜度,提高了識(shí)別分類(lèi)的可控性,對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到待分類(lèi)場(chǎng)景圖片的特征向量,從而提高場(chǎng)景圖片分類(lèi)的分類(lèi)速率,根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果,判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件,當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域,并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域,重復(fù)進(jìn)行圖像信息處理并獲取分類(lèi)預(yù)測(cè)結(jié)果,直至分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件,當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽,從而提高了場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。
實(shí)施例二:
圖2示出了本發(fā)明實(shí)施例二提供的室內(nèi)場(chǎng)景的分類(lèi)方法中建立觀測(cè)區(qū)域定位模型的實(shí)現(xiàn)流程,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,詳述如下:
在步驟s201中,接收輸入的待訓(xùn)練場(chǎng)景圖片,根據(jù)預(yù)設(shè)的高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域。
在本發(fā)明實(shí)施例中,待訓(xùn)練場(chǎng)景圖片為室內(nèi)場(chǎng)景的局部觀測(cè)區(qū)域定位訓(xùn)練過(guò)程中輸入的需要分類(lèi)的場(chǎng)景圖片。為了降低識(shí)別分類(lèi)過(guò)程中計(jì)算的復(fù)雜度,提高識(shí)別分類(lèi)的可控性,根據(jù)觀測(cè)區(qū)域定位模型每次從場(chǎng)景圖片中選擇一個(gè)局部觀測(cè)區(qū)域,以進(jìn)行識(shí)別和分類(lèi)。優(yōu)選地,在訓(xùn)練過(guò)程中可以根據(jù)實(shí)際情況調(diào)整局部觀測(cè)區(qū)域的大小,以優(yōu)化訓(xùn)練結(jié)果。
在步驟s202中,根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值。
在本發(fā)明實(shí)施例中,通過(guò)對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息的處理,得到待訓(xùn)練場(chǎng)景圖片的特征向量之后,根據(jù)特征向量對(duì)待訓(xùn)練場(chǎng)景圖片進(jìn)行分類(lèi),得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽。優(yōu)選地,在獲取到局部觀測(cè)區(qū)域的圖像信息之后,在對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理時(shí),首先對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼,得到局部特征向量,然后對(duì)得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作,得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量,從而提高了特征向量的全面性,進(jìn)而提高對(duì)場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。優(yōu)選地,在訓(xùn)練過(guò)程中可以調(diào)節(jié)特征向量的維度,以優(yōu)化訓(xùn)練結(jié)果。
在本發(fā)明實(shí)施例中,在每次得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽之后,獲取待訓(xùn)練場(chǎng)景圖片的標(biāo)準(zhǔn)分類(lèi)標(biāo)簽,判斷得到的待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽是否正確,并計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值。優(yōu)選地,在計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值時(shí),根據(jù)分類(lèi)獎(jiǎng)勵(lì)值的計(jì)算公式
計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值,其中,rt為第t次分類(lèi)的獎(jiǎng)勵(lì)值,t為分類(lèi)次數(shù),y為訓(xùn)練得到的分類(lèi)標(biāo)簽,losst為第t次分類(lèi)的分類(lèi)誤差,y=maxylogp(y)表示得到的分類(lèi)標(biāo)簽是正確的,從而避免重復(fù)觀察同樣區(qū)域,避免觀測(cè)噪聲太多的區(qū)域。優(yōu)選地,在訓(xùn)練過(guò)程中可適當(dāng)改變獎(jiǎng)勵(lì)值的計(jì)算公式中的反饋值,以優(yōu)化模型收斂的速度,從而優(yōu)化訓(xùn)練模型。
在步驟s203中,判斷是否達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件。
在步驟s204中,當(dāng)未達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí),根據(jù)高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取下一訓(xùn)練用局部觀測(cè)區(qū)域,將下一訓(xùn)練用局部觀測(cè)區(qū)域設(shè)置為當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域,跳轉(zhuǎn)至根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值的步驟。
在本發(fā)明實(shí)施例中,在訓(xùn)練的過(guò)程中,下一訓(xùn)練用局部觀測(cè)區(qū)域可以從一個(gè)給定方差的高斯分布中采樣得到。重復(fù)對(duì)采樣得到的下一訓(xùn)練用局部觀測(cè)區(qū)域進(jìn)行識(shí)別,根據(jù)識(shí)別到的信息對(duì)待訓(xùn)練場(chǎng)景圖片進(jìn)行分類(lèi),得到分類(lèi)標(biāo)簽,每一次分類(lèi)都可以通過(guò)計(jì)算得到對(duì)應(yīng)的獎(jiǎng)勵(lì)值。
在步驟s205中,當(dāng)達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí),獲取所有待訓(xùn)練場(chǎng)景圖片中每張待訓(xùn)練場(chǎng)景圖片的獎(jiǎng)勵(lì)值的代數(shù)和,以得到每張待訓(xùn)練場(chǎng)景圖片的總獎(jiǎng)勵(lì)值,根據(jù)總獎(jiǎng)勵(lì)值建立總獎(jiǎng)勵(lì)值最大化的觀測(cè)區(qū)域定位模型。
在本發(fā)明實(shí)施例中,若達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件,則獲取待訓(xùn)練場(chǎng)景圖片的獎(jiǎng)勵(lì)值的代數(shù)和,以得到這張待訓(xùn)練場(chǎng)景圖片的總獎(jiǎng)勵(lì)值,所有待訓(xùn)練場(chǎng)景圖片中每張待訓(xùn)練場(chǎng)景圖片都有對(duì)應(yīng)的總獎(jiǎng)勵(lì)值,根據(jù)總獎(jiǎng)勵(lì)值建立可以使總獎(jiǎng)勵(lì)值最大化的觀測(cè)區(qū)域定位模型,以用于在對(duì)待分類(lèi)場(chǎng)景圖片分類(lèi)的過(guò)程中確定最優(yōu)的下一個(gè)局部觀測(cè)區(qū)域,從而提高場(chǎng)景識(shí)別分類(lèi)的分類(lèi)速率和準(zhǔn)確性。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述的存儲(chǔ)介質(zhì),如rom/ram、磁盤(pán)、光盤(pán)等。
實(shí)施例三:
圖3示出了本發(fā)明實(shí)施例三提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu),為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。
在本發(fā)明實(shí)施例中,室內(nèi)場(chǎng)景的分類(lèi)裝置包括圖片接收單元31、區(qū)域獲取單元32、向量獲取單元33、條件判斷單元34以及場(chǎng)景分類(lèi)單元35,其中:
圖片接收單元31,用于接收輸入的待分類(lèi)場(chǎng)景圖片。
區(qū)域獲取單元32,用于根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域。
向量獲取單元33,用于對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到待分類(lèi)場(chǎng)景圖片的特征向量。
在本發(fā)明實(shí)施例中,優(yōu)選地,在獲取到局部觀測(cè)區(qū)域的圖像信息之后,對(duì)局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理時(shí),首先對(duì)局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼,得到局部特征向量,然后對(duì)得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作,得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量,從而提高了特征向量的全面性,進(jìn)而提高對(duì)場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。
因此,優(yōu)選地,該向量獲取單元33包括:
編碼操作單元331,用于對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼,得到局部特征向量;以及
融合操作單元332,用于對(duì)局部特征向量與預(yù)先存儲(chǔ)的特征向量執(zhí)行融合操作,得到場(chǎng)景圖片的特征向量。
條件判斷單元34,用于根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果,判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件。
重復(fù)執(zhí)行單元35,用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域,并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域,并觸發(fā)向量獲取單元33對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理。
場(chǎng)景分類(lèi)單元36,用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。
在本發(fā)明實(shí)施例中,當(dāng)這些預(yù)測(cè)得到的多個(gè)分類(lèi)結(jié)果中存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果時(shí),說(shuō)明分類(lèi)預(yù)測(cè)結(jié)果已經(jīng)滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件,即已經(jīng)可以實(shí)現(xiàn)對(duì)待分類(lèi)場(chǎng)景圖片的分類(lèi),因此,場(chǎng)景分類(lèi)單元獲取分類(lèi)預(yù)測(cè)結(jié)果中對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果,將該分類(lèi)結(jié)果設(shè)置為待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽,從而提高了場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。
在本發(fā)明實(shí)施例中,室內(nèi)場(chǎng)景的分類(lèi)裝置的各單元可由相應(yīng)的硬件或軟件單元實(shí)現(xiàn),各單元可以為獨(dú)立的軟、硬件單元,也可以集成為一個(gè)軟、硬件單元,在此不用以限制本發(fā)明。各單元的具體實(shí)施方式可參考前述實(shí)施例一的描述,在此不再贅述。
實(shí)施例四:
圖4示出了本發(fā)明實(shí)施例四提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu),為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。
在本發(fā)明實(shí)施例中,室內(nèi)場(chǎng)景的分類(lèi)裝置包括訓(xùn)練區(qū)域獲取單元401、區(qū)域訓(xùn)練單元402、循環(huán)訓(xùn)練單元403、定位模型建立單元404、圖片接收單元405、區(qū)域獲取單元406、向量獲取單元407、條件判斷單元408以及場(chǎng)景分類(lèi)單元409,其中:
訓(xùn)練區(qū)域獲取單元401,用于接收輸入的待訓(xùn)練場(chǎng)景圖片,根據(jù)預(yù)設(shè)的高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域。
區(qū)域訓(xùn)練單元402,用于根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值。
在本發(fā)明實(shí)施例中,在每次得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽之后,獲取待訓(xùn)練場(chǎng)景圖片的標(biāo)準(zhǔn)分類(lèi)標(biāo)簽,判斷得到的待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽是否正確,獎(jiǎng)勵(lì)值計(jì)算單元根據(jù)判斷結(jié)果計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值。優(yōu)選地,在計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值時(shí),根據(jù)分類(lèi)獎(jiǎng)勵(lì)值的計(jì)算公式
計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值,其中,rt為第t次分類(lèi)的獎(jiǎng)勵(lì)值,t為分類(lèi)次數(shù),y為訓(xùn)練得到的分類(lèi)標(biāo)簽,losst為第t次分類(lèi)的分類(lèi)誤差,y=maxylogp(y)表示得到的分類(lèi)標(biāo)簽是正確的,從而避免重復(fù)觀察同樣區(qū)域,避免觀測(cè)噪聲太多的區(qū)域。優(yōu)選地,在訓(xùn)練過(guò)程中可適當(dāng)改變獎(jiǎng)勵(lì)值的計(jì)算公式中的反饋值,以優(yōu)化模型收斂的速度,從而優(yōu)化訓(xùn)練模型。
因此,優(yōu)選地,該區(qū)域訓(xùn)練單元402包括:
訓(xùn)練分類(lèi)單元4021,用于對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,得到待訓(xùn)練場(chǎng)景圖片的當(dāng)前特征向量,根據(jù)當(dāng)前特征向量對(duì)待訓(xùn)練場(chǎng)景圖片進(jìn)行分類(lèi),得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽;以及
獎(jiǎng)勵(lì)值計(jì)算單元4022,用于獲取待訓(xùn)練場(chǎng)景圖片的標(biāo)準(zhǔn)分類(lèi)標(biāo)簽,將得到的分類(lèi)標(biāo)簽與標(biāo)準(zhǔn)分類(lèi)標(biāo)簽進(jìn)行比較,判斷得到的分類(lèi)標(biāo)簽是否正確,根據(jù)判斷結(jié)果計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值。
優(yōu)選地,該獎(jiǎng)勵(lì)值計(jì)算單元4022包括:
計(jì)算子單元,用于計(jì)算分類(lèi)誤差,獲取分類(lèi)次數(shù),通過(guò)分類(lèi)獎(jiǎng)勵(lì)值的計(jì)算公式
計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值,其中,rt為第t次分類(lèi)的獎(jiǎng)勵(lì)值,t為分類(lèi)次數(shù),y為訓(xùn)練得到的分類(lèi)標(biāo)簽,losst為第t次分類(lèi)的分類(lèi)誤差,y=maxylogp(y)表示得到的分類(lèi)標(biāo)簽是正確的。
循環(huán)訓(xùn)練單元403,用于當(dāng)未達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí),根據(jù)高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取下一訓(xùn)練用局部觀測(cè)區(qū)域,將下一訓(xùn)練用局部觀測(cè)區(qū)域設(shè)置為當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域,并觸發(fā)區(qū)域訓(xùn)練單元402根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值。
定位模型建立單元404,用于當(dāng)達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí),獲取所有待訓(xùn)練場(chǎng)景圖片中每張待訓(xùn)練場(chǎng)景圖片的獎(jiǎng)勵(lì)值的代數(shù)和,以得到每張待訓(xùn)練場(chǎng)景圖片的總獎(jiǎng)勵(lì)值,根據(jù)總獎(jiǎng)勵(lì)值建立總獎(jiǎng)勵(lì)值最大化的觀測(cè)區(qū)域定位模型。
圖片接收單元405,用于接收輸入的待分類(lèi)場(chǎng)景圖片。
區(qū)域獲取單元406,用于根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域。
向量獲取單元407,用于對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理,以得到待分類(lèi)場(chǎng)景圖片的特征向量。
條件判斷單元408,用于根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果,判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件。
在本發(fā)明實(shí)施例中,得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量之后,根據(jù)特征向量可以預(yù)測(cè)得到場(chǎng)景圖片的多個(gè)分類(lèi)結(jié)果及對(duì)應(yīng)的預(yù)測(cè)概率,多個(gè)分類(lèi)結(jié)果的預(yù)測(cè)概率總和為100%,條件判斷單元判斷這些多個(gè)分類(lèi)結(jié)果中是否存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果,即判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件。
重復(fù)執(zhí)行單元409,用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域,并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域,并觸發(fā)向量獲取單元407對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理。
場(chǎng)景分類(lèi)單元410,用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí),根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。
在本發(fā)明實(shí)施例中,室內(nèi)場(chǎng)景的分類(lèi)裝置的各單元可由相應(yīng)的硬件或軟件單元實(shí)現(xiàn),各單元可以為獨(dú)立的軟、硬件單元,也可以集成為一個(gè)軟、硬件單元,在此不用以限制本發(fā)明。各單元的具體實(shí)施方式可參考前述實(shí)施例的描述,在此不再贅述。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。