两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

圖像分類的方法和裝置與流程

文檔序號(hào):11408296閱讀:292來源:國知局
圖像分類的方法和裝置與流程

本公開涉及圖像識(shí)別技術(shù),尤其涉及一種圖像分類的方法和裝置。



背景技術(shù):

隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人們獲取圖像的方式越來越便利,存儲(chǔ)的圖像數(shù)量也越來越多,對(duì)于大量的圖像進(jìn)行分類管理成為一種需求,圖像分類是將圖像標(biāo)記為不同類別的過程,圖像類別如城市、森林、沙灘、動(dòng)物和植物等。

相關(guān)技術(shù)中,通過每幅圖像的局部紋理特征確定一幅圖像的類別,然而,圖像分類的準(zhǔn)確性不高。



技術(shù)實(shí)現(xiàn)要素:

為克服相關(guān)技術(shù)中存在的問題,本公開提供一種圖像分類的方法和裝置。

根據(jù)本公開實(shí)施例的第一方面,提供一種圖像分類的方法,包括:

獲取圖像的主題頻次;

獲取類別矩陣,所述類別矩陣中包含c個(gè)類別的向量,每個(gè)類別的向量服從正態(tài)分布,所述c為大于等于2的整數(shù);

根據(jù)所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別。

可選地,所述獲取圖像的主題頻次,包括:

以預(yù)設(shè)間距提取圖像的所有相鄰視覺詞匯對(duì),所述相鄰視覺詞匯對(duì)中包含第一視覺詞匯和第二視覺詞匯,所述第一視覺詞匯對(duì)應(yīng)的提取位置和所述第二視覺詞匯對(duì)應(yīng)的提取位置相鄰;

獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì);

根據(jù)所述圖像的所有相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),確定所述圖像的主題頻次。

可選地,所述獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),包括:

獲取所述圖像對(duì)應(yīng)的相鄰主題概率矩陣;

獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量;

根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

可選地,所述根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),包括:

獲取每個(gè)相鄰視覺詞匯對(duì)的n個(gè)候選主題對(duì),其中,所述候選主題對(duì)包含第一候選主題和第二候選主題;

針對(duì)所述n個(gè)候選主題對(duì)中的每個(gè)所述候選主題對(duì),根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率;

根據(jù)獲取的n個(gè)所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率,確定最大概率對(duì)應(yīng)的候選主題對(duì)為所述相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

可選地,所述根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率,包括:

根據(jù)所述相鄰主題概率矩陣,獲取所述候選主題對(duì)為相鄰主題的第一概率;

根據(jù)所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取所述第一候選主題為第一視覺詞匯的第二概率,以及所述第二候選主題為所述第二視覺詞匯的第三概率;

根據(jù)所述第一概率、所述第二概率和所述第三概率,獲取所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率。

可選地,所述獲取所述圖像對(duì)應(yīng)的相鄰主題概率矩陣,包括:

根據(jù)θd~dir(α)作一次概率抽取,獲取所述圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,dir(α)是參數(shù)為α的狄利克雷概率分布,θd為第d幅圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,d為大于等于1小于等于d的整數(shù),所述d為所有圖像的總數(shù)。

可選地,所述獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,包括:

根據(jù)βk~dir(γ)作一次概率抽取,獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,dir(γ)是參數(shù)為γ的狄利克雷概率分布,βk為第k個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,k為大于等于1小于等于k的整數(shù),所述k為所有主題的總數(shù)。

可選地,所述根據(jù)所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別,包括:

根據(jù)獲取所述圖像的類別,其中,是圖像的主題頻次直方圖;zdi表示第d幅圖像的第i個(gè)主題,zdj表示第d幅圖像的第j個(gè)主題,|zd|表示第d幅圖像的主題的個(gè)數(shù);

η=[η1,η2,……,ηc]t,其中,ηc表示softmax函數(shù)第c個(gè)類別的向量,ηc~n(0,ρ2),c為大于等于1小于等于c的整數(shù),c為所有類別的總數(shù),n(0,ρ2)為均值為0,方差為ρ2的正太分布。

根據(jù)本公開實(shí)施例的第二方面,提供一種圖像分類裝置,包括:

第一獲取模塊,被配置為獲取圖像的主題頻次;

第二獲取模塊,被配置為獲取類別矩陣,所述類別矩陣中包含c個(gè)類別的向量,每個(gè)類別的向量服從正態(tài)分布,所述c為大于等于2的整數(shù);

處理模塊,被配置為根據(jù)所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別。

可選地,所述第一獲取模塊包括:

第一獲取子模塊,被配置為以預(yù)設(shè)間距提取圖像的所有相鄰視覺詞匯對(duì),所述相鄰視覺詞匯對(duì)中包含第一視覺詞匯和第二視覺詞匯,所述第一視覺詞匯對(duì)應(yīng)的提取位置和所述第二視覺詞匯對(duì)應(yīng)的提取位置相鄰;

第二獲取子模塊,被配置為獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì);

第一處理子模塊,被配置為根據(jù)所述圖像的所有相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),確定所述圖像的主題頻次。

可選地,所述第二獲取子模塊被配置為獲取所述圖像對(duì)應(yīng)的相鄰主題概率矩陣;獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量;根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

可選地,所述第二獲取子模塊被配置為獲取每個(gè)相鄰視覺詞匯對(duì)的n個(gè)候選主題對(duì),其中,所述候選主題對(duì)包含第一候選主題和第二候選主題;針對(duì)所述n個(gè)候選主題對(duì)中的每個(gè)所述候選主題對(duì),根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率;根據(jù)獲取的n個(gè)所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率,確定最大概率對(duì)應(yīng)的候選主題對(duì)為所述相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

可選地,所述第二獲取子模塊被配置為根據(jù)所述相鄰主題概率矩陣,獲取所述候選主題對(duì)為相鄰主題的第一概率;根據(jù)所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取所述第一候選主題為第一視覺詞匯的第二概率,以及所述第二候選主題為所述第二視覺詞匯的第三概率;根據(jù)所述第一概率、所述第二概率和所述第三概率,獲取所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率。

可選地,所述第二獲取子模塊被配置為根據(jù)θd~dir(α)作一次概率抽取,獲取所述圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,dir(α)是參數(shù)為α的狄利克雷概率分布,θd為第d幅圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,d為大于等于1小于等于d的整數(shù),所述d為所有圖像的總數(shù)。

可選地,所述第二獲取子模塊被配置為根據(jù)βk~dir(γ)作一次概率抽取,獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,dir(γ)是參數(shù)為γ的狄利克雷概率分布,βk為第k個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,k為大于等于1小于等于k的整數(shù),所述k為所有主題的總數(shù)。

可選地,所述處理模塊,包括:

第二處理子模塊,被配置為根據(jù)獲取所述圖像的類別,其中,是圖像的主題頻次直方圖;zdi表示第d幅圖像的第i個(gè)主題,zdj表示第d幅圖像的第j個(gè)主題,|zd|表示第d幅圖像的主題的個(gè)數(shù);

η=[η1,η2,……,ηc]t,其中,ηc表示softmax函數(shù)第c個(gè)類別的向量,ηc~n(0,ρ2),c為大于等于1小于等于c的整數(shù),c為所有類別的總數(shù),n(0,ρ2)為均值為0,方差為ρ2的正太分布。

根據(jù)本公開實(shí)施例的第三方面,提供一種圖像分類裝置,包括:

處理器;

用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;

其中,所述處理器被配置為執(zhí)行下述步驟:

獲取圖像的主題頻次;

獲取類別矩陣,所述類別矩陣中包含c個(gè)類別的向量,每個(gè)類別的向量服從正態(tài)分布,所述c為大于等于2的整數(shù);

根據(jù)所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別。

本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:

通過獲取圖像的主題頻次和類別矩陣,根據(jù)圖像的主題頻次和類別矩陣,利用分類器,獲取圖像的類別,考慮了整幅圖像的所有主題的頻次,使得分類的參考因素更加豐富,提高了圖像分類的準(zhǔn)確性,并且,避免了大量人工標(biāo)記的工作,提高了圖像分類的效率。

應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。

附圖說明

此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。

圖1是根據(jù)一示例性實(shí)施例示出的一種圖像分類方法的流程圖;

圖2是根據(jù)一示例性實(shí)施例示出的另一種圖像分類方法的流程示意圖;

圖3是根據(jù)一示例性實(shí)施例示出的再一種圖像分類方法的流程示意圖;

圖4是根據(jù)一示例性實(shí)施例示出的又一種圖像分類方法的流程示意圖;

圖5是根據(jù)一示例性實(shí)施例示出的一種圖像分類的裝置的框圖;

圖6是根據(jù)一示例性實(shí)施例示出的另一種圖像分類的裝置的框圖;

圖7是根據(jù)一示例性實(shí)施例示出的又一種圖像分類的裝置的框圖;

圖8是根據(jù)一示例性實(shí)施例示出的又一種圖像分類的裝置的框圖;

圖9是根據(jù)一示例性實(shí)施例示出的又一種用于圖像分類的裝置800的框圖;

圖10是根據(jù)一示例性實(shí)施例示出的又一種用于圖像分類的裝置1900的框圖。

通過上述附圖,已示出本公開明確的實(shí)施例,后文中將有更詳細(xì)的描述。這些附圖和文字描述并不是為了通過任何方式限制本公開構(gòu)思的范圍,而是通過參考特定實(shí)施例為本領(lǐng)域技術(shù)人員說明本公開的概念。

具體實(shí)施方式

這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開一些方面相一致的裝置和方法的例子。

圖1是根據(jù)一示例性實(shí)施例示出的一種圖像分類方法的流程圖,如圖1所示,該圖像分類方法,包括以下步驟。

在步驟s11中,獲取圖像的主題頻次。

其中,假設(shè)圖像為100*100的圖像,將圖像劃分為間距為10像素的網(wǎng)格,從每個(gè)網(wǎng)格節(jié)點(diǎn)上提取對(duì)應(yīng)的主題,則圖像可以提取出10*10個(gè)主題,不同的網(wǎng)格提取的主題可能相同,也可能不同,因此,可以根據(jù)每個(gè)主題所占的比例,確定圖像的所有主題的頻次。

其中,主題例如可以是動(dòng)物、植物和風(fēng)景等,對(duì)此,本申請(qǐng)不做限制。

在步驟s12中,獲取類別矩陣。

其中,類別矩陣中包含c個(gè)類別的向量,每個(gè)類別的向量服從正態(tài)分布,c為大于等于2的整數(shù)。c個(gè)類別為所有可能的類別。

其中,一種可能的實(shí)現(xiàn)方式,根據(jù)η=[η1,η2,……,ηc]t類別矩陣,其中,ηc表示softmax函數(shù)第c個(gè)類別的向量,ηc~n(0,ρ2),c為大于等于1小于等于c的整數(shù),c為所有類別的總數(shù),n(0,ρ2)為均值為0,方差為ρ2的正太分布。

在步驟s13中,根據(jù)圖像的主題頻次和類別矩陣,利用分類器,獲取圖像的類別。

其中,一種可能的實(shí)現(xiàn)方式:根據(jù)獲取圖像的類別,其中,是圖像的主題頻次直方圖;zdi表示第d幅圖像的第i個(gè)主題,zdj表示第d幅圖像的第j個(gè)主題,|zd|表示第d幅圖像的主題的個(gè)數(shù);

softmax為分類器,softmax的模型可以通過訓(xùn)練樣本和測試樣本獲得。

綜上,本實(shí)施例提供的圖像分類方法,通過獲取圖像的主題頻次和類別矩陣,根據(jù)圖像的主題頻次和類別矩陣,利用分類器,獲取圖像的類別,考慮了整幅圖像的所有主題的頻次,使得分類的參考因素更加豐富,提高了圖像分類的準(zhǔn)確性,并且,避免了大量人工標(biāo)記的工作,提高了圖像分類的效率。

圖2是根據(jù)一示例性實(shí)施例示出的另一種圖像分類方法的流程示意圖,圖2是在圖1所示實(shí)施例的基礎(chǔ)上,對(duì)圖1中的s11的一種可能的實(shí)現(xiàn)方式的描述,如圖2所示,包括:

s111:以預(yù)設(shè)間距提取圖像的所有相鄰視覺詞匯對(duì)。

其中,相鄰視覺詞匯對(duì)中包含第一視覺詞匯和第二視覺詞匯,第一視覺詞匯對(duì)應(yīng)的提取位置和第二視覺詞匯對(duì)應(yīng)的提取位置相鄰。

結(jié)合s11中的示例,以預(yù)設(shè)間隔10像素提取圖像的所有相鄰視覺詞匯,可以得到10*10個(gè)視覺詞匯,相鄰視覺詞匯對(duì)是指視覺詞匯對(duì)應(yīng)的提取位置相鄰的一對(duì)視覺詞匯。視覺詞匯例如:貓、狗和樹木等。

s112:獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

例如:貓和狗為一對(duì)相鄰視覺詞匯,其對(duì)應(yīng)的主題對(duì)為動(dòng)物和動(dòng)物;再例如:貓和樹木為一對(duì)相鄰視覺詞匯,其對(duì)應(yīng)的主題為動(dòng)物和植物。

s113:根據(jù)圖像的所有相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),確定圖像的主題頻次。

例如:總共有100個(gè)視覺詞匯,其中,動(dòng)物占20個(gè),植物戰(zhàn)40個(gè),風(fēng)景占40個(gè),則動(dòng)物的頻次為20%,植物的頻次為40%,風(fēng)景為40%。

本實(shí)施例,通過以預(yù)設(shè)間距提取圖像的所有相鄰視覺詞匯對(duì),獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),根據(jù)圖像的所有相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),確定圖像的主題頻次,根據(jù)相鄰視覺詞匯對(duì)確定主題對(duì),能夠更加準(zhǔn)確的確定圖像的所有主題,進(jìn)一步地提高圖像分類的準(zhǔn)確性。

圖3是根據(jù)一示例性實(shí)施例示出的再一種圖像分類方法的流程示意圖,圖2是在圖1所示實(shí)施例的基礎(chǔ)上,對(duì)圖2中的s112的一種可能的實(shí)現(xiàn)方式的描述,如圖3所示,包括:

s1121:獲取圖像對(duì)應(yīng)的相鄰主題概率矩陣。

其中,一種可能的實(shí)現(xiàn)方式:

根據(jù)θd~dir(α)作一次概率抽取,獲取圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,dir(α)是參數(shù)為α的狄利克雷概率分布,θd為第d幅圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,d為大于等于1小于等于d的整數(shù),d為所有圖像的總數(shù)。

其中,θd是一個(gè)隨機(jī)矩陣,滿足θd<k,l>標(biāo)識(shí)矩陣θd的第k,l項(xiàng),標(biāo)識(shí)產(chǎn)生一對(duì)相鄰主題k,l的概率,其中,k的取值為1到k整數(shù),l的取值為1到k的整數(shù),k為所有主題的總數(shù)。

s1122:獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量。

其中,一種可能的實(shí)現(xiàn)方式:

根據(jù)βk~dir(γ)作一次概率抽取,獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,dir(γ)是參數(shù)為γ的狄利克雷概率分布,βk為第k個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,k為大于等于1小于等于k的整數(shù),k為所有主題的總數(shù)。

其中,βk滿足βki表示βk的第i項(xiàng),表示主題k為視覺詞匯wi的概率,|v|表示所有不同視覺詞匯的總數(shù),wi表示所有視覺詞匯中的第i個(gè)視覺詞匯。

s1123:根據(jù)相鄰主題概率矩陣和每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

其中,一種可能的實(shí)現(xiàn)方式如圖4所示,包括:

s11231:獲取每個(gè)相鄰視覺詞匯對(duì)的n個(gè)候選主題對(duì)。

其中,候選主題對(duì)包含第一候選主題和第二候選主題。

每個(gè)相鄰視覺詞匯對(duì)的n個(gè)候選主題對(duì)為所述θd中每個(gè)元素對(duì)應(yīng)的相鄰主題對(duì),假設(shè)θd中包含10*10個(gè)元素,則每個(gè)相鄰視覺詞匯對(duì)的候選主題對(duì)有10*10個(gè)。

s11232:針對(duì)n個(gè)候選主題對(duì)中的每個(gè)候選主題對(duì),根據(jù)相鄰主題概率矩陣和每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取相鄰視覺詞匯對(duì)為候選主題對(duì)的概率。

以一個(gè)候選主題對(duì)為例,假設(shè)該候選主題對(duì)的第一候選主題為第k個(gè)主題和第二候選主題為第l個(gè)主題,k和l均為大于等于1小于等于k的整數(shù)。

其中,一種可能的實(shí)現(xiàn)方式:

根據(jù)相鄰主題概率矩陣,獲取候選主題對(duì)為相鄰主題的第一概率。

即獲取θd中的第k行第l列的元素值,為第一概率,記為θd<k,l>。

根據(jù)每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取第一候選主題為第一視覺詞匯的第二概率,以及第二候選主題為第二視覺詞匯的第三概率;

假設(shè)第k個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量為βk,其中,第一視覺詞匯對(duì)應(yīng)的概率為βk,i,假設(shè)第l個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量為βl,第二視覺詞匯對(duì)應(yīng)的概率為βl,j。

根據(jù)第一概率、第二概率和第三概率,獲取相鄰視覺詞匯對(duì)為候選主題對(duì)的概率。

其中,一種可能的實(shí)現(xiàn)方式為,將第一概率、第二概率和第三概率相乘,得到相鄰視覺詞匯對(duì)為候選主題對(duì)的概率,即ρk,j=θd<k,l>×βk,i×βl,j,ρk,j表示相鄰視覺詞匯對(duì)為候選主題對(duì)為第k個(gè)主題和第j個(gè)主題時(shí)的概率。

依據(jù)該方式,得到相鄰視覺詞匯對(duì)為其他候選主題對(duì)的概率。假設(shè)有10個(gè)主題,則可以得到10*10個(gè)概率。

s11233:根據(jù)獲取的n個(gè)相鄰視覺詞匯對(duì)為候選主題對(duì)的概率,確定最大概率對(duì)應(yīng)的候選主題對(duì)為相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

例如:ρk,j最大,則確定第k個(gè)主題和第l個(gè)主題組成的候選主題對(duì)為相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

本實(shí)施例,通過獲取圖像對(duì)應(yīng)的相鄰主題概率矩陣,獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,根據(jù)相鄰主題概率矩陣和每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),利用了位置相鄰主題之間的相關(guān)性,能夠更加準(zhǔn)確的確定圖像的所有主題,進(jìn)一步地提高圖像分類的準(zhǔn)確性。并且,避免了大量的人工標(biāo)記工作,提高了圖像分類的效率。

下述為本公開裝置實(shí)施例,可以用于執(zhí)行本公開方法實(shí)施例。對(duì)于本公開裝置實(shí)施例中未披露的細(xì)節(jié),請(qǐng)參照本公開方法實(shí)施例。

圖5是根據(jù)一示例性實(shí)施例示出的一種圖像分類的裝置的框圖。如圖5所示,包括:第一獲取模塊501、第二獲取模塊502和處理模塊503,其中,第一獲取模塊501被配置為獲取圖像的主題頻次;第二獲取模塊502被配置為獲取類別矩陣,類別矩陣中包含c個(gè)類別的向量,每個(gè)類別的向量服從正態(tài)分布,c為大于等于2的整數(shù);處理模塊503被配置為根據(jù)圖像的主題頻次和類別矩陣,利用分類器,獲取圖像的類別。

圖6是根據(jù)一示例性實(shí)施例示出的另一種圖像分類的裝置的框圖。圖6是在圖5所示實(shí)施例的基礎(chǔ)上,所述第一獲取模塊包括501進(jìn)一步地還包括:第一獲取子模塊5011、第二獲取子模塊5012和第一處理子模塊5013,其中,第一獲取子模塊5011被配置為以預(yù)設(shè)間距提取圖像的所有相鄰視覺詞匯對(duì),所述相鄰視覺詞匯對(duì)中包含第一視覺詞匯和第二視覺詞匯,所述第一視覺詞匯對(duì)應(yīng)的提取位置和所述第二視覺詞匯對(duì)應(yīng)的提取位置相鄰;第二獲取子模塊5012被配置為獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì);第一處理子模塊5013被配置為根據(jù)所述圖像的所有相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì),確定所述圖像的主題頻次。

進(jìn)一步地,所述第二獲取子模塊5012被配置為獲取所述圖像對(duì)應(yīng)的相鄰主題概率矩陣;獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量;根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取每個(gè)相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

進(jìn)一步地,所述第二獲取子模塊5012被配置為獲取每個(gè)相鄰視覺詞匯對(duì)的n個(gè)候選主題對(duì),其中,所述候選主題對(duì)包含第一候選主題和第二候選主題;針對(duì)所述n個(gè)候選主題對(duì)中的每個(gè)所述候選主題對(duì),根據(jù)所述相鄰主題概率矩陣和所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率;根據(jù)獲取的n個(gè)所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率,確定最大概率對(duì)應(yīng)的候選主題對(duì)為所述相鄰視覺詞匯對(duì)對(duì)應(yīng)的主題對(duì)。

進(jìn)一步地,所述第二獲取子模塊5012被配置為根據(jù)所述相鄰主題概率矩陣,獲取所述候選主題對(duì)為相鄰主題的第一概率;根據(jù)所述每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,獲取所述第一候選主題為第一視覺詞匯的第二概率,以及所述第二候選主題為所述第二視覺詞匯的第三概率;根據(jù)所述第一概率、所述第二概率和所述第三概率,獲取所述相鄰視覺詞匯對(duì)為所述候選主題對(duì)的概率。

進(jìn)一步地,所述第二獲取子模塊5012被配置為根據(jù)θd~dir(α)作一次概率抽取,獲取所述圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,dir(α)是參數(shù)為α的狄利克雷概率分布,θd為第d幅圖像對(duì)應(yīng)的相鄰主題概率矩陣,其中,d為大于等于1小于等于d的整數(shù),所述d為所有圖像的總數(shù)。

進(jìn)一步地,所述第二獲取子模塊5012被配置為根據(jù)βk~dir(γ)作一次概率抽取,獲取每個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,dir(γ)是參數(shù)為γ的狄利克雷概率分布,βk為第k個(gè)主題對(duì)應(yīng)的視覺詞匯概率向量,其中,k為大于等于1小于等于k的整數(shù),所述k為所有主題的總數(shù)。

圖7是根據(jù)一示例性實(shí)施例示出的又一種圖像分類的裝置的框圖。圖7是在圖6所示實(shí)施例的基礎(chǔ)上,進(jìn)一步地,所述處理模塊503包括第二處理子模塊5031被配置為根據(jù)獲取所述圖像的類別,其中,是圖像的主題頻次直方圖;zdi表示第d幅圖像的第i個(gè)主題,zdj表示第d幅圖像的第j個(gè)主題,|zd|表示第d幅圖像的主題的個(gè)數(shù);

η=[η1,η2,……,ηc]t,其中,ηc表示softmax函數(shù)第c個(gè)類別的向量,ηc~n(0,ρ2),c為大于等于1小于等于c的整數(shù),c為所有類別的總數(shù),n(0,ρ2)為均值為0,方差為ρ2的正太分布。

該圖像分類裝置可以通過軟件、硬件或者兩者的結(jié)合實(shí)現(xiàn)成為包含觸控顯示屏的電子設(shè)備的部分或者全部。參照?qǐng)D8,該裝置包括處理器801和存儲(chǔ)器802,其中,存儲(chǔ)器被配置為存儲(chǔ)處理器可執(zhí)行指令;其中,所述處理器被配置為執(zhí)行下述步驟:獲取圖像的主題頻次;獲取類別矩陣,所述類別矩陣中包含c個(gè)類別的向量,每個(gè)類別的向量服從正態(tài)分布,所述c為大于等于2的整數(shù);根據(jù)所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別。

關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。

圖9是根據(jù)一示例性實(shí)施例示出的又一種用于圖像分類的裝置800的框圖。例如,裝置800可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備和個(gè)人數(shù)字助理等。

參照?qǐng)D9,裝置800可以包括以下一個(gè)或多個(gè)組件:處理組件802,存儲(chǔ)器804,電力組件806,多媒體組件808,音頻組件810,輸入/輸出(i/o)的接口812,傳感器組件814,以及通信組件816。

處理組件802通常控制裝置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件802可以包括一個(gè)或多個(gè)處理器820來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個(gè)或多個(gè)模塊,便于處理組件802和其他組件之間的交互。例如,處理組件802可以包括多媒體模塊,以方便多媒體組件808和處理組件802之間的交互。

存儲(chǔ)器804被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在裝置800的操作。這些數(shù)據(jù)的示例包括用于在裝置800上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器804可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(sram),電可擦除可編程只讀存儲(chǔ)器(eeprom),可擦除可編程只讀存儲(chǔ)器(eprom),可編程只讀存儲(chǔ)器(prom),只讀存儲(chǔ)器(rom),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤或光盤。

電力組件806為裝置800的各種組件提供電力。電力組件806可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置800生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件808包括在所述裝置800和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測觸摸、滑動(dòng)和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件808包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置800處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。

音頻組件810被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件810包括一個(gè)麥克風(fēng)(mic),當(dāng)裝置800處于操作模式,如呼叫模式、記錄模式和語音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器804或經(jīng)由通信組件816發(fā)送。在一些實(shí)施例中,音頻組件810還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。

i/o接口812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。

傳感器組件814包括一個(gè)或多個(gè)傳感器,用于為裝置800提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件814可以檢測到裝置800的打開/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置800的顯示器和小鍵盤,傳感器組件814還可以檢測裝置800或裝置800一個(gè)組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來在沒有任何的物理接觸時(shí)檢測附近物體的存在。傳感器組件814還可以包括光傳感器,如cmos或ccd圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件814還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。

通信組件816被配置為便于裝置800和其他設(shè)備之間有線或無線方式的通信。裝置800可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如wifi,2g或3g,或它們的組合。在一個(gè)示例性實(shí)施例中,通信組件816經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信組件816還包括近場通信(nfc)模塊,以促進(jìn)短程通信。例如,在nfc模塊可基于射頻識(shí)別(rfid)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(irda)技術(shù),超寬帶(uwb)技術(shù),藍(lán)牙(bt)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。

在示例性實(shí)施例中,裝置800可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(asic)、數(shù)字信號(hào)處理器(dsp)、數(shù)字信號(hào)處理設(shè)備(dspd)、可編程邏輯器件(pld)、現(xiàn)場可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。

在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是rom、隨機(jī)存取存儲(chǔ)器(ram)、cd-rom、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。

圖10是根據(jù)一示例性實(shí)施例示出的又一種用于圖像分類的裝置1900的框圖。例如,裝置1900可以被提供為一服務(wù)器。參照?qǐng)D10,裝置1900包括處理組件1922,其進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲(chǔ)器1932所代表的存儲(chǔ)器資源,用于存儲(chǔ)可由處理組件1922的執(zhí)行的指令,例如應(yīng)用程序。存儲(chǔ)器1932中存儲(chǔ)的應(yīng)用程序可以包括一個(gè)或一個(gè)以上的每一個(gè)對(duì)應(yīng)于一組指令的模塊。此外,處理組件1922被配置為執(zhí)行指令,以執(zhí)行上述方法:獲取圖像的主題頻次;獲取類別矩陣,所述類別矩陣中包含c個(gè)類別的向量,每個(gè)類別的向量服從正態(tài)分布,所述c為大于等于2的整數(shù);根據(jù)所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別。

裝置1900還可以包括一個(gè)電源組件1926被配置為執(zhí)行裝置1900的電源管理,一個(gè)有線或無線網(wǎng)絡(luò)接口1950被配置為將裝置1900連接到網(wǎng)絡(luò),和一個(gè)輸入輸出(i/o)接口1958。裝置1900可以操作基于存儲(chǔ)在存儲(chǔ)器1932的操作系統(tǒng),例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或類似。

本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求書指出。

應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求書來限制。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
陆河县| 柏乡县| 广东省| 霍邱县| 尤溪县| 辉县市| 莱阳市| 阜新市| 安福县| 东阿县| 黑龙江省| 明水县| 太康县| 麻城市| 鄂伦春自治旗| 东宁县| 年辖:市辖区| 伽师县| 恩施市| 射阳县| 河源市| 遵义县| 曲沃县| 闽侯县| 通海县| 湘潭市| 蒲江县| 吉木乃县| 顺昌县| 洛隆县| 株洲县| 会东县| 辛集市| 拜泉县| 遵义县| 江永县| 清涧县| 百色市| 肃北| 祥云县| 政和县|