一種室內(nèi)場(chǎng)景的分類(lèi)方法及裝置與流程

文檔序號(hào)：11251421閱讀：1087來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域，尤其涉及一種室內(nèi)場(chǎng)景的分類(lèi)方法及裝置。

背景技術(shù)：

智能識(shí)別和分類(lèi)是計(jì)算機(jī)視覺(jué)中重點(diǎn)研究的問(wèn)題。在眾多的研究中，熱點(diǎn)主要聚焦于物體識(shí)別(一張圖片包含一個(gè)或多個(gè)物體)和人臉識(shí)別(一張帶人臉的圖像)。相比于這些研究，室內(nèi)場(chǎng)景識(shí)別極具挑戰(zhàn)，是最為困難的分類(lèi)任務(wù)之一。其難點(diǎn)主要在于室內(nèi)場(chǎng)景不僅包含了大量不同的物體，而且這些物體在空間中的擺放形式千差萬(wàn)別，要對(duì)室內(nèi)場(chǎng)景進(jìn)行準(zhǔn)確地分類(lèi)，不僅要分析場(chǎng)景中物體的信息，還需提取整個(gè)場(chǎng)景結(jié)構(gòu)的特征。

為了提高識(shí)別場(chǎng)景的能力，不少學(xué)者對(duì)此進(jìn)行了深入研究，提出了很多行之有效的方法。目前的場(chǎng)景識(shí)別分類(lèi)方法主要包括空間金字塔法、基于高層次語(yǔ)義信息的方法和基于卷積神經(jīng)網(wǎng)絡(luò)的方法。

這些方法有著明顯的缺陷，空間金字塔法的特征表示只依賴(lài)于低層次的幾何信息，缺少對(duì)高層次語(yǔ)義信息的提取，識(shí)別場(chǎng)景的能力很受限制，基于高層次語(yǔ)義信息的場(chǎng)景識(shí)別方法受限于所選物體的范圍，大大地影響了模型分類(lèi)的能力，基于卷積神經(jīng)網(wǎng)絡(luò)的方法主要缺點(diǎn)在于訓(xùn)練過(guò)程需要消耗大量的資源，而且主要在物體的檢測(cè)和分類(lèi)上效果明顯，例如，使用基于卷積神經(jīng)網(wǎng)絡(luò)的方法在計(jì)算機(jī)視覺(jué)系統(tǒng)識(shí)別(imagenet)數(shù)據(jù)集上進(jìn)行物體識(shí)別時(shí)，可以達(dá)到94％的識(shí)別率，而使用基于卷積神經(jīng)網(wǎng)絡(luò)的方法在公開(kāi)的mit-67數(shù)據(jù)集上進(jìn)行場(chǎng)景的分類(lèi)時(shí)，只能達(dá)到69％的識(shí)別率，原因是室內(nèi)場(chǎng)景的識(shí)別不只依賴(lài)于場(chǎng)景中的物體，還需要連接物體之間的整體關(guān)系，而卷積神經(jīng)網(wǎng)絡(luò)方法直接提取的特征不能較好地把握整體和局部信息的融合。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的目的在于提供一種室內(nèi)場(chǎng)景的分類(lèi)方法及裝置，旨在解決現(xiàn)有的場(chǎng)景識(shí)別分類(lèi)方法的準(zhǔn)確性不高、分類(lèi)速率不佳的問(wèn)題。

一方面，本發(fā)明提供了一種室內(nèi)場(chǎng)景的分類(lèi)方法，所述方法包括下述步驟：

接收輸入的待分類(lèi)場(chǎng)景圖片；

根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域；

對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到所述待分類(lèi)場(chǎng)景圖片的特征向量；

根據(jù)所述特征向量獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果，判斷所述分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件；

當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果不滿足所述場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)所述觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域，并將所述下一局部觀測(cè)區(qū)域設(shè)置為所述當(dāng)前局部觀測(cè)區(qū)域，跳轉(zhuǎn)至所述對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到所述待分類(lèi)場(chǎng)景圖片的特征向量的步驟；

當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果滿足所述場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)所述分類(lèi)預(yù)測(cè)結(jié)果獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。

另一方面，本發(fā)明提供了一種室內(nèi)場(chǎng)景的分類(lèi)裝置，所述裝置包括：

圖片接收單元，用于接收輸入的待分類(lèi)場(chǎng)景圖片；

區(qū)域獲取單元，用于根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域；

向量獲取單元，用于對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到所述待分類(lèi)場(chǎng)景圖片的特征向量；

條件判斷單元，用于根據(jù)所述特征向量獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果，判斷所述分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件；

重復(fù)執(zhí)行單元，用于當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果不滿足所述場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)所述觀測(cè)區(qū)域定位模型從所述待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域，并將所述下一局部觀測(cè)區(qū)域設(shè)置為所述當(dāng)前局部觀測(cè)區(qū)域，并觸發(fā)所述向量獲取單元對(duì)所述當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理；以及

場(chǎng)景分類(lèi)單元，用于當(dāng)所述分類(lèi)預(yù)測(cè)結(jié)果滿足所述場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)所述分類(lèi)預(yù)測(cè)結(jié)果獲取所述待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。

本發(fā)明在接收輸入的待分類(lèi)場(chǎng)景圖片后，根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域，對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到待分類(lèi)場(chǎng)景圖片的特征向量，根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果，判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件，當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域，并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域，跳轉(zhuǎn)至對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到待分類(lèi)場(chǎng)景圖片的特征向量的步驟，直至分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件，當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽，從而提高了場(chǎng)景識(shí)別分類(lèi)的分類(lèi)速率和準(zhǔn)確性。

附圖說(shuō)明

圖1是本發(fā)明實(shí)施例一提供的室內(nèi)場(chǎng)景的分類(lèi)方法的實(shí)現(xiàn)流程圖；

圖2是本發(fā)明實(shí)施例二提供的室內(nèi)場(chǎng)景的分類(lèi)方法中建立觀測(cè)區(qū)域定位模型的實(shí)現(xiàn)流程圖；

圖3是本發(fā)明實(shí)施例三提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu)示意圖；以及

圖4是本發(fā)明實(shí)施例四提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下結(jié)合附圖及實(shí)施例，對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解，此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明，并不用于限定本發(fā)明。

以下結(jié)合具體實(shí)施例對(duì)本發(fā)明的具體實(shí)現(xiàn)進(jìn)行詳細(xì)描述：

實(shí)施例一：

圖1示出了本發(fā)明實(shí)施例一提供的室內(nèi)場(chǎng)景的分類(lèi)方法的實(shí)現(xiàn)流程，為了便于說(shuō)明，僅示出了與本發(fā)明實(shí)施例相關(guān)的部分，詳述如下：

在步驟s101中，接收輸入的待分類(lèi)場(chǎng)景圖片。

在步驟s102中，根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域。

在本發(fā)明實(shí)施例中，待分類(lèi)場(chǎng)景圖片為待識(shí)別分類(lèi)的室內(nèi)場(chǎng)景對(duì)應(yīng)的圖片。為了降低識(shí)別分類(lèi)過(guò)程中計(jì)算的復(fù)雜度，提高識(shí)別分類(lèi)的可控性，根據(jù)觀測(cè)區(qū)域定位模型每次只從場(chǎng)景圖片中選擇一個(gè)局部觀測(cè)區(qū)域，以進(jìn)行識(shí)別和分類(lèi)。

在步驟s103中，對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到待分類(lèi)場(chǎng)景圖片的特征向量。

在本發(fā)明實(shí)施例中，優(yōu)選地，在獲取到當(dāng)前局部觀測(cè)區(qū)域的圖像信息之后，對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理時(shí)，首先對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼，得到局部特征向量，然后對(duì)得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作，得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量，從而提高了特征向量的全面性，進(jìn)而提高對(duì)場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。

在步驟s104中，根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果。

在步驟s105中，判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件。

在本發(fā)明實(shí)施例中，分類(lèi)預(yù)測(cè)結(jié)果包括分類(lèi)結(jié)果和對(duì)應(yīng)的預(yù)測(cè)概率，在得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量之后，根據(jù)特征向量可以預(yù)測(cè)得到場(chǎng)景圖片的多個(gè)分類(lèi)結(jié)果及對(duì)應(yīng)的預(yù)測(cè)概率，多個(gè)分類(lèi)結(jié)果的預(yù)測(cè)概率總和為100％，判斷這些多個(gè)分類(lèi)結(jié)果中是否存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果，即判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件。作為示例地，預(yù)測(cè)概率的預(yù)設(shè)閾值可以設(shè)置為65％，判斷這些多個(gè)分類(lèi)結(jié)果中是否存在對(duì)應(yīng)的預(yù)測(cè)概率大于65％的分類(lèi)結(jié)果。

在步驟s106中，當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域，并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域，跳轉(zhuǎn)至對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到待分類(lèi)場(chǎng)景圖片的特征向量的步驟。

在本發(fā)明實(shí)施例中，當(dāng)這些多個(gè)分類(lèi)結(jié)果中不存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果時(shí)，說(shuō)明現(xiàn)有的分類(lèi)預(yù)測(cè)結(jié)果不滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件，若要實(shí)現(xiàn)對(duì)待分類(lèi)場(chǎng)景圖片的分類(lèi)，還需要獲取場(chǎng)景圖片更多的區(qū)域信息，因此，根據(jù)觀測(cè)區(qū)域定位模型獲取下一個(gè)局部觀測(cè)區(qū)域，并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域，重復(fù)進(jìn)行圖像信息處理并獲取分類(lèi)預(yù)測(cè)結(jié)果，直至分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件。

在步驟s107中，當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。

在本發(fā)明實(shí)施例中，當(dāng)這些預(yù)測(cè)得到的多個(gè)分類(lèi)結(jié)果中存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果時(shí)，說(shuō)明分類(lèi)預(yù)測(cè)結(jié)果已經(jīng)滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件，即已經(jīng)可以實(shí)現(xiàn)對(duì)待分類(lèi)場(chǎng)景圖片的分類(lèi)，因此，獲取分類(lèi)預(yù)測(cè)結(jié)果中對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果，將該分類(lèi)結(jié)果設(shè)置為待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽，從而提高了場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。

在本發(fā)明實(shí)施例中，接收輸入的待分類(lèi)場(chǎng)景圖片，根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域，從而降低了待分類(lèi)場(chǎng)景圖片識(shí)別分類(lèi)的復(fù)雜度，提高了識(shí)別分類(lèi)的可控性，對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到待分類(lèi)場(chǎng)景圖片的特征向量，從而提高場(chǎng)景圖片分類(lèi)的分類(lèi)速率，根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果，判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件，當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域，并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域，重復(fù)進(jìn)行圖像信息處理并獲取分類(lèi)預(yù)測(cè)結(jié)果，直至分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件，當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽，從而提高了場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。

實(shí)施例二：

圖2示出了本發(fā)明實(shí)施例二提供的室內(nèi)場(chǎng)景的分類(lèi)方法中建立觀測(cè)區(qū)域定位模型的實(shí)現(xiàn)流程，為了便于說(shuō)明，僅示出了與本發(fā)明實(shí)施例相關(guān)的部分，詳述如下：

在步驟s201中，接收輸入的待訓(xùn)練場(chǎng)景圖片，根據(jù)預(yù)設(shè)的高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域。

在本發(fā)明實(shí)施例中，待訓(xùn)練場(chǎng)景圖片為室內(nèi)場(chǎng)景的局部觀測(cè)區(qū)域定位訓(xùn)練過(guò)程中輸入的需要分類(lèi)的場(chǎng)景圖片。為了降低識(shí)別分類(lèi)過(guò)程中計(jì)算的復(fù)雜度，提高識(shí)別分類(lèi)的可控性，根據(jù)觀測(cè)區(qū)域定位模型每次從場(chǎng)景圖片中選擇一個(gè)局部觀測(cè)區(qū)域，以進(jìn)行識(shí)別和分類(lèi)。優(yōu)選地，在訓(xùn)練過(guò)程中可以根據(jù)實(shí)際情況調(diào)整局部觀測(cè)區(qū)域的大小，以優(yōu)化訓(xùn)練結(jié)果。

在步驟s202中，根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值。

在本發(fā)明實(shí)施例中，通過(guò)對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息的處理，得到待訓(xùn)練場(chǎng)景圖片的特征向量之后，根據(jù)特征向量對(duì)待訓(xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)，得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽。優(yōu)選地，在獲取到局部觀測(cè)區(qū)域的圖像信息之后，在對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理時(shí)，首先對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼，得到局部特征向量，然后對(duì)得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作，得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量，從而提高了特征向量的全面性，進(jìn)而提高對(duì)場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。優(yōu)選地，在訓(xùn)練過(guò)程中可以調(diào)節(jié)特征向量的維度，以優(yōu)化訓(xùn)練結(jié)果。

在本發(fā)明實(shí)施例中，在每次得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽之后，獲取待訓(xùn)練場(chǎng)景圖片的標(biāo)準(zhǔn)分類(lèi)標(biāo)簽，判斷得到的待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽是否正確，并計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值。優(yōu)選地，在計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值時(shí)，根據(jù)分類(lèi)獎(jiǎng)勵(lì)值的計(jì)算公式

計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值，其中，rt為第t次分類(lèi)的獎(jiǎng)勵(lì)值，t為分類(lèi)次數(shù)，y為訓(xùn)練得到的分類(lèi)標(biāo)簽，losst為第t次分類(lèi)的分類(lèi)誤差，y＝maxylogp(y)表示得到的分類(lèi)標(biāo)簽是正確的，從而避免重復(fù)觀察同樣區(qū)域，避免觀測(cè)噪聲太多的區(qū)域。優(yōu)選地，在訓(xùn)練過(guò)程中可適當(dāng)改變獎(jiǎng)勵(lì)值的計(jì)算公式中的反饋值，以優(yōu)化模型收斂的速度，從而優(yōu)化訓(xùn)練模型。

在步驟s203中，判斷是否達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件。

在步驟s204中，當(dāng)未達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí)，根據(jù)高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取下一訓(xùn)練用局部觀測(cè)區(qū)域，將下一訓(xùn)練用局部觀測(cè)區(qū)域設(shè)置為當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域，跳轉(zhuǎn)至根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值的步驟。

在本發(fā)明實(shí)施例中，在訓(xùn)練的過(guò)程中，下一訓(xùn)練用局部觀測(cè)區(qū)域可以從一個(gè)給定方差的高斯分布中采樣得到。重復(fù)對(duì)采樣得到的下一訓(xùn)練用局部觀測(cè)區(qū)域進(jìn)行識(shí)別，根據(jù)識(shí)別到的信息對(duì)待訓(xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)，得到分類(lèi)標(biāo)簽，每一次分類(lèi)都可以通過(guò)計(jì)算得到對(duì)應(yīng)的獎(jiǎng)勵(lì)值。

在步驟s205中，當(dāng)達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí)，獲取所有待訓(xùn)練場(chǎng)景圖片中每張待訓(xùn)練場(chǎng)景圖片的獎(jiǎng)勵(lì)值的代數(shù)和，以得到每張待訓(xùn)練場(chǎng)景圖片的總獎(jiǎng)勵(lì)值，根據(jù)總獎(jiǎng)勵(lì)值建立總獎(jiǎng)勵(lì)值最大化的觀測(cè)區(qū)域定位模型。

在本發(fā)明實(shí)施例中，若達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件，則獲取待訓(xùn)練場(chǎng)景圖片的獎(jiǎng)勵(lì)值的代數(shù)和，以得到這張待訓(xùn)練場(chǎng)景圖片的總獎(jiǎng)勵(lì)值，所有待訓(xùn)練場(chǎng)景圖片中每張待訓(xùn)練場(chǎng)景圖片都有對(duì)應(yīng)的總獎(jiǎng)勵(lì)值，根據(jù)總獎(jiǎng)勵(lì)值建立可以使總獎(jiǎng)勵(lì)值最大化的觀測(cè)區(qū)域定位模型，以用于在對(duì)待分類(lèi)場(chǎng)景圖片分類(lèi)的過(guò)程中確定最優(yōu)的下一個(gè)局部觀測(cè)區(qū)域，從而提高場(chǎng)景識(shí)別分類(lèi)的分類(lèi)速率和準(zhǔn)確性。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成，所述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中，所述的存儲(chǔ)介質(zhì)，如rom/ram、磁盤(pán)、光盤(pán)等。

實(shí)施例三：

圖3示出了本發(fā)明實(shí)施例三提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu)，為了便于說(shuō)明，僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。

在本發(fā)明實(shí)施例中，室內(nèi)場(chǎng)景的分類(lèi)裝置包括圖片接收單元31、區(qū)域獲取單元32、向量獲取單元33、條件判斷單元34以及場(chǎng)景分類(lèi)單元35，其中：

圖片接收單元31，用于接收輸入的待分類(lèi)場(chǎng)景圖片。

區(qū)域獲取單元32，用于根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域。

向量獲取單元33，用于對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到待分類(lèi)場(chǎng)景圖片的特征向量。

在本發(fā)明實(shí)施例中，優(yōu)選地，在獲取到局部觀測(cè)區(qū)域的圖像信息之后，對(duì)局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理時(shí)，首先對(duì)局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼，得到局部特征向量，然后對(duì)得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作，得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量，從而提高了特征向量的全面性，進(jìn)而提高對(duì)場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。

因此，優(yōu)選地，該向量獲取單元33包括：

編碼操作單元331，用于對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行編碼，得到局部特征向量；以及

融合操作單元332，用于對(duì)局部特征向量與預(yù)先存儲(chǔ)的特征向量執(zhí)行融合操作，得到場(chǎng)景圖片的特征向量。

條件判斷單元34，用于根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果，判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件。

重復(fù)執(zhí)行單元35，用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域，并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域，并觸發(fā)向量獲取單元33對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理。

場(chǎng)景分類(lèi)單元36，用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。

在本發(fā)明實(shí)施例中，當(dāng)這些預(yù)測(cè)得到的多個(gè)分類(lèi)結(jié)果中存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果時(shí)，說(shuō)明分類(lèi)預(yù)測(cè)結(jié)果已經(jīng)滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件，即已經(jīng)可以實(shí)現(xiàn)對(duì)待分類(lèi)場(chǎng)景圖片的分類(lèi)，因此，場(chǎng)景分類(lèi)單元獲取分類(lèi)預(yù)測(cè)結(jié)果中對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果，將該分類(lèi)結(jié)果設(shè)置為待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽，從而提高了場(chǎng)景圖片分類(lèi)的準(zhǔn)確性。

在本發(fā)明實(shí)施例中，室內(nèi)場(chǎng)景的分類(lèi)裝置的各單元可由相應(yīng)的硬件或軟件單元實(shí)現(xiàn)，各單元可以為獨(dú)立的軟、硬件單元，也可以集成為一個(gè)軟、硬件單元，在此不用以限制本發(fā)明。各單元的具體實(shí)施方式可參考前述實(shí)施例一的描述，在此不再贅述。

實(shí)施例四：

圖4示出了本發(fā)明實(shí)施例四提供的室內(nèi)場(chǎng)景的分類(lèi)裝置的結(jié)構(gòu)，為了便于說(shuō)明，僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。

在本發(fā)明實(shí)施例中，室內(nèi)場(chǎng)景的分類(lèi)裝置包括訓(xùn)練區(qū)域獲取單元401、區(qū)域訓(xùn)練單元402、循環(huán)訓(xùn)練單元403、定位模型建立單元404、圖片接收單元405、區(qū)域獲取單元406、向量獲取單元407、條件判斷單元408以及場(chǎng)景分類(lèi)單元409，其中：

訓(xùn)練區(qū)域獲取單元401，用于接收輸入的待訓(xùn)練場(chǎng)景圖片，根據(jù)預(yù)設(shè)的高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域。

區(qū)域訓(xùn)練單元402，用于根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值。

在本發(fā)明實(shí)施例中，在每次得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽之后，獲取待訓(xùn)練場(chǎng)景圖片的標(biāo)準(zhǔn)分類(lèi)標(biāo)簽，判斷得到的待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽是否正確，獎(jiǎng)勵(lì)值計(jì)算單元根據(jù)判斷結(jié)果計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值。優(yōu)選地，在計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值時(shí)，根據(jù)分類(lèi)獎(jiǎng)勵(lì)值的計(jì)算公式

因此，優(yōu)選地，該區(qū)域訓(xùn)練單元402包括：

訓(xùn)練分類(lèi)單元4021，用于對(duì)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，得到待訓(xùn)練場(chǎng)景圖片的當(dāng)前特征向量，根據(jù)當(dāng)前特征向量對(duì)待訓(xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)，得到待訓(xùn)練場(chǎng)景圖片的分類(lèi)標(biāo)簽；以及

獎(jiǎng)勵(lì)值計(jì)算單元4022，用于獲取待訓(xùn)練場(chǎng)景圖片的標(biāo)準(zhǔn)分類(lèi)標(biāo)簽，將得到的分類(lèi)標(biāo)簽與標(biāo)準(zhǔn)分類(lèi)標(biāo)簽進(jìn)行比較，判斷得到的分類(lèi)標(biāo)簽是否正確，根據(jù)判斷結(jié)果計(jì)算分類(lèi)的獎(jiǎng)勵(lì)值。

優(yōu)選地，該獎(jiǎng)勵(lì)值計(jì)算單元4022包括：

計(jì)算子單元，用于計(jì)算分類(lèi)誤差，獲取分類(lèi)次數(shù)，通過(guò)分類(lèi)獎(jiǎng)勵(lì)值的計(jì)算公式

循環(huán)訓(xùn)練單元403，用于當(dāng)未達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí)，根據(jù)高斯分布從待訓(xùn)練場(chǎng)景圖片中獲取下一訓(xùn)練用局部觀測(cè)區(qū)域，將下一訓(xùn)練用局部觀測(cè)區(qū)域設(shè)置為當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域，并觸發(fā)區(qū)域訓(xùn)練單元402根據(jù)當(dāng)前訓(xùn)練用局部觀測(cè)區(qū)域?qū)Υ?xùn)練場(chǎng)景圖片進(jìn)行分類(lèi)操作并計(jì)算分類(lèi)操作的獎(jiǎng)勵(lì)值。

定位模型建立單元404，用于當(dāng)達(dá)到預(yù)設(shè)的訓(xùn)練結(jié)束條件時(shí)，獲取所有待訓(xùn)練場(chǎng)景圖片中每張待訓(xùn)練場(chǎng)景圖片的獎(jiǎng)勵(lì)值的代數(shù)和，以得到每張待訓(xùn)練場(chǎng)景圖片的總獎(jiǎng)勵(lì)值，根據(jù)總獎(jiǎng)勵(lì)值建立總獎(jiǎng)勵(lì)值最大化的觀測(cè)區(qū)域定位模型。

圖片接收單元405，用于接收輸入的待分類(lèi)場(chǎng)景圖片。

區(qū)域獲取單元406，用于根據(jù)預(yù)設(shè)的觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取當(dāng)前局部觀測(cè)區(qū)域。

向量獲取單元407，用于對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理，以得到待分類(lèi)場(chǎng)景圖片的特征向量。

條件判斷單元408，用于根據(jù)特征向量獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)預(yù)測(cè)結(jié)果，判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的場(chǎng)景圖片分類(lèi)條件。

在本發(fā)明實(shí)施例中，得到待分類(lèi)場(chǎng)景圖片圖像信息的特征向量之后，根據(jù)特征向量可以預(yù)測(cè)得到場(chǎng)景圖片的多個(gè)分類(lèi)結(jié)果及對(duì)應(yīng)的預(yù)測(cè)概率，多個(gè)分類(lèi)結(jié)果的預(yù)測(cè)概率總和為100％，條件判斷單元判斷這些多個(gè)分類(lèi)結(jié)果中是否存在對(duì)應(yīng)的預(yù)測(cè)概率大于預(yù)設(shè)閾值的分類(lèi)結(jié)果，即判斷分類(lèi)預(yù)測(cè)結(jié)果是否滿足預(yù)設(shè)的對(duì)待分類(lèi)場(chǎng)景圖片進(jìn)行分類(lèi)的條件。

重復(fù)執(zhí)行單元409，用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果不滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)觀測(cè)區(qū)域定位模型從待分類(lèi)場(chǎng)景圖片中獲取下一局部觀測(cè)區(qū)域，并將下一局部觀測(cè)區(qū)域設(shè)置為當(dāng)前局部觀測(cè)區(qū)域，并觸發(fā)向量獲取單元407對(duì)當(dāng)前局部觀測(cè)區(qū)域的圖像信息進(jìn)行處理。

場(chǎng)景分類(lèi)單元410，用于當(dāng)分類(lèi)預(yù)測(cè)結(jié)果滿足場(chǎng)景圖片分類(lèi)條件時(shí)，根據(jù)分類(lèi)預(yù)測(cè)結(jié)果獲取待分類(lèi)場(chǎng)景圖片的分類(lèi)標(biāo)簽。

以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張俊宇;黃惠
技術(shù)所有人：中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

裝置藝術(shù)應(yīng)用場(chǎng)景相關(guān)技術(shù)

圖像場(chǎng)景分類(lèi)相關(guān)技術(shù)

場(chǎng)景分類(lèi)數(shù)據(jù)集相關(guān)技術(shù)

傳感器分類(lèi)及應(yīng)用場(chǎng)景相關(guān)技術(shù)