一種移動(dòng)圖像在線搜索與挖掘的分類方法
【專利摘要】本發(fā)明涉及一種移動(dòng)圖像在線搜索與挖掘的分類方法,屬于計(jì)算機(jī)應(yīng)用領(lǐng)域。其特點(diǎn)是:利用移動(dòng)終端具有獲取語音、圖像、視頻等信息靈活、方便的特點(diǎn),開發(fā)出基于圖像檢索的拍照搜索與挖掘功能,通過對(duì)圖像各類特征的分類,自動(dòng)提取圖像全局特征,使計(jì)算機(jī)圖像檢索系統(tǒng)更符合人類的思維習(xí)慣,解決用戶用文字進(jìn)行搜索的困難,為用戶提供更便捷的信息服務(wù),具有深遠(yuǎn)的開發(fā)意義。
【專利說明】一種移動(dòng)圖像在線搜索與挖掘的分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種移動(dòng)圖像在線搜索與挖掘的分類方法,屬于計(jì)算機(jī)應(yīng)用領(lǐng)域。
【背景技術(shù)】
[0002] 圖像作為一種內(nèi)涵豐富,表現(xiàn)直觀的多媒體信息,備受人們的青睞,越來越多的商 業(yè)活動(dòng)、事務(wù)交易和信息表現(xiàn)包含圖像數(shù)據(jù),特別是時(shí)興的網(wǎng)上購物,基本以圖像為主要形 式向用戶展現(xiàn)信息,如何在海量圖像數(shù)據(jù)中進(jìn)行有效地檢索成為當(dāng)前研究的熱點(diǎn)問題,早 期圖像檢索是基于圖像標(biāo)注文本的檢索,然而人工標(biāo)注費(fèi)時(shí)費(fèi)力,并且標(biāo)注也存在主觀性 和不精確性,直接影響檢索的準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的通過以下技術(shù)方案來實(shí)現(xiàn):
[0004] 一種移動(dòng)圖像在線搜索與挖掘的分類方法,是一種將復(fù)合開關(guān)、電容器等有機(jī)地 進(jìn)行集成的技術(shù)產(chǎn)品,屬于計(jì)算機(jī)應(yīng)用領(lǐng)域。其特征在于:利用移動(dòng)終端具有獲取語音、 圖像、視頻等信息靈活、方便的特點(diǎn),開發(fā)出基于圖像檢索的拍照搜索與挖掘功能,通過對(duì) 圖像各類特征的分類,自動(dòng)提取圖像全局特征,使計(jì)算機(jī)圖像檢索系統(tǒng)更符合人類的思維 習(xí)慣,解決用戶用文字進(jìn)行搜索的困難,為用戶提供更便捷的信息服務(wù),具有深遠(yuǎn)的開發(fā)意 義。
[0005] 進(jìn)一步地,上述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所述的 分類方法是指給圖像附加上包含語義在內(nèi)的更高層的內(nèi)容信息,使計(jì)算機(jī)圖像檢索系統(tǒng)更 符合人類的思維習(xí)慣,圖像語義標(biāo)注和檢索成為與CBIR密切相關(guān)的研究熱點(diǎn),利用圖像全 局特征并以一定的置信度為每幅圖像生成了一系列語義標(biāo)記。
[0006] 更進(jìn)一步地,上述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所述 的語義標(biāo)注是指通過手工標(biāo)注為訓(xùn)練集加入標(biāo)注信息,并使用SVM分類器進(jìn)行分類,通過 將顏色直方圖和邊緣直方圖等視覺特征與自定義的語義特征組合構(gòu)建特征向量的方法,使 用模糊k-NN分類算法進(jìn)行分類。
[0007] 更進(jìn)一步地,上述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所述 的分類是指通過兩個(gè)概率潛語義分析模型分別獲取訓(xùn)練圖像的視覺模態(tài)和文本模態(tài)的信 息,將每幅圖像表示為兩種不同模態(tài)的主題分布。
[0008] 更進(jìn)一步地,上述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所述 的分類方法采用基于最小錯(cuò)誤率的優(yōu)化準(zhǔn)則和統(tǒng)計(jì)分類的思想,在訓(xùn)練分類器階段為每幅 圖像提取一個(gè)特征集,利用多示例學(xué)習(xí)算法從多幅圖像的特征集中學(xué)習(xí)語義概念,從而為 每個(gè)語義概念建立概率模型。
【具體實(shí)施方式】
[0009] -種移動(dòng)圖像在線搜索與挖掘的分類方法,是一種將復(fù)合開關(guān)、電容器等有機(jī)地 進(jìn)行集成的技術(shù)產(chǎn)品,屬于計(jì)算機(jī)應(yīng)用領(lǐng)域。其特征在于:利用移動(dòng)終端具有獲取語音、 圖像、視頻等信息靈活、方便的特點(diǎn),開發(fā)出基于圖像檢索的拍照搜索與挖掘功能,通過對(duì) 圖像各類特征的分類,自動(dòng)提取圖像全局特征,使計(jì)算機(jī)圖像檢索系統(tǒng)更符合人類的思維 習(xí)慣,解決用戶用文字進(jìn)行搜索的困難,為用戶提供更便捷的信息服務(wù),具有深遠(yuǎn)的開發(fā)意 義。
[0010] 基于云計(jì)算的移動(dòng)圖像搜索與挖掘系統(tǒng)框架包含兩個(gè)主要部分:云端和移動(dòng)端。 圖像數(shù)據(jù)一般存儲(chǔ)在WWW的Web數(shù)據(jù)庫中,云端主要實(shí)現(xiàn)圖像數(shù)據(jù)獲取、圖像數(shù)據(jù)存儲(chǔ)、圖 像分割及組合特征優(yōu)化、圖像索引構(gòu)建和用戶興趣模型構(gòu)建等。云端首先根據(jù)移動(dòng)圖像搜 索需要從InterM的數(shù)據(jù)源獲取圖像數(shù)據(jù),然后利用云計(jì)算的數(shù)據(jù)存儲(chǔ)與管理技術(shù)實(shí)現(xiàn)圖 像數(shù)據(jù)的分布式存儲(chǔ)和管理。
[0011]圖像分割及組合特征優(yōu)化模塊首先建立移動(dòng)圖像搜索需要的圖像分類數(shù)據(jù)的特 征集合,然后對(duì)圖像進(jìn)行局部區(qū)域不確定性分割和采用強(qiáng)化學(xué)習(xí)獲得特定類別圖像的最佳 聚類特征組合;索引構(gòu)建模塊是在圖像分割與組合特征優(yōu)化的基礎(chǔ)上,分別利用圖像塊和 全局圖像語義構(gòu)建圖像的雙重索引,提高索引的準(zhǔn)確性和靈活性,同時(shí)對(duì)獲取的新圖像數(shù) 據(jù)實(shí)現(xiàn)增量索引構(gòu)建;用戶興趣構(gòu)建模塊主要根據(jù)移動(dòng)用戶近期訪問活動(dòng)相關(guān)聯(lián)的圖像及 其處理圖像的行為進(jìn)行統(tǒng)計(jì)和學(xué)習(xí)自動(dòng)構(gòu)建用戶興趣模型,并隨著用戶興趣的變化,實(shí)現(xiàn) 用戶興趣模型的更新,保持興趣模型的時(shí)新性。
[0012] 移動(dòng)端通過拍照上傳圖像進(jìn)行搜索,展示云端返回的搜索結(jié)果,并完成對(duì)返回結(jié) 果的各種操作(例如:購買、收藏、保存等)。在移動(dòng)用戶進(jìn)行搜索時(shí),云端在圖像特征準(zhǔn)確 匹配的基礎(chǔ)上,根據(jù)用戶興趣模型進(jìn)行個(gè)性化排列,同時(shí)還能基于用戶興趣模型開展個(gè)性 化推薦服務(wù)。
[0013] 本方法通過分析目前的圖像特征提取方法的基本思想、特點(diǎn),研究建立適合于移 動(dòng)圖像搜索應(yīng)用的圖像分類數(shù)據(jù)特征集合,在此基礎(chǔ)上,進(jìn)一步研究基于云計(jì)算的圖像局 部區(qū)域不確定性分割和特征組合優(yōu)化方法,獲得特定類別圖像的最佳聚類特征組合。
[0014] 研究基于圖像局部區(qū)域物理特征的并行聚類方法,在此基礎(chǔ)上,構(gòu)建圖像的語義 相似度社會(huì)網(wǎng)絡(luò),并研究基于Map/Reduce的大規(guī)模社區(qū)分析方法構(gòu)建圖像的語義索引。結(jié) 合圖像的物理特征與語義特征構(gòu)建索引,使海量圖像的索引更加準(zhǔn)確。
[0015] 結(jié)合圖像的物理特征和語義特征,研究基于云計(jì)算的用戶個(gè)性化興趣模型構(gòu)建方 法,并研究采用興趣衰減因子和增量更新技術(shù)的用戶興趣模型的并行更新策略,提高用戶 興趣模型構(gòu)建和更新的效率。
[0016] 設(shè)計(jì)并實(shí)現(xiàn)基于云計(jì)算的移動(dòng)圖像搜索與挖掘系統(tǒng),將該系統(tǒng)應(yīng)用到時(shí)尚類商品 的購物搜索領(lǐng)域,當(dāng)用戶看到喜歡的商品時(shí),用移動(dòng)終端拍照就能搜索,解決了用戶不能或 不愿用文字進(jìn)行搜索的困難,為用戶提供準(zhǔn)確有效的購物決策信息,增強(qiáng)用戶的購物體驗(yàn)。
【權(quán)利要求】
1. 一種移動(dòng)圖像在線搜索與挖掘的分類方法,屬于計(jì)算機(jī)應(yīng)用領(lǐng)域。其特點(diǎn)是:利用 移動(dòng)終端具有獲取語音、圖像、視頻等信息靈活、方便的特點(diǎn),開發(fā)出基于圖像檢索的拍照 搜索與挖掘功能,通過對(duì)圖像各類特征的分類,自動(dòng)提取圖像全局特征,使計(jì)算機(jī)圖像檢索 系統(tǒng)更符合人類的思維習(xí)慣,解決用戶用文字進(jìn)行搜索的困難,為用戶提供更便捷的信息 服務(wù),具有深遠(yuǎn)的開發(fā)意義。
2. 根據(jù)權(quán)利要求1所述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所 述的分類方法是指給圖像附加上包含語義在內(nèi)的更高層的內(nèi)容信息,使計(jì)算機(jī)圖像檢索系 統(tǒng)更符合人類的思維習(xí)慣,圖像語義標(biāo)注和檢索成為與CBIR密切相關(guān)的研究熱點(diǎn),利用圖 像全局特征并以一定的置信度為每幅圖像生成了一系列語義標(biāo)記。
3. 根據(jù)權(quán)利要求2所述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所 述的語義標(biāo)注是指通過手工標(biāo)注為訓(xùn)練集加入標(biāo)注信息,并使用SVM分類器進(jìn)行分類,通 過將顏色直方圖和邊緣直方圖等視覺特征與自定義的語義特征組合構(gòu)建特征向量的方法, 使用模糊k-NN分類算法進(jìn)行分類。
4. 根據(jù)權(quán)利要求3所述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所 述的分類是指通過兩個(gè)概率潛語義分析模型分別獲取訓(xùn)練圖像的視覺模態(tài)和文本模態(tài)的 信息,將每幅圖像表示為兩種不同模態(tài)的主題分布。
5. 根據(jù)權(quán)利要求3所述的一種移動(dòng)圖像在線搜索與挖掘的分類方法,其特征在于:所 述的分類方法采用基于最小錯(cuò)誤率的優(yōu)化準(zhǔn)則和統(tǒng)計(jì)分類的思想,在訓(xùn)練分類器階段為每 幅圖像提取一個(gè)特征集,利用多示例學(xué)習(xí)算法從多幅圖像的特征集中學(xué)習(xí)語義概念,從而 為每個(gè)語義概念建立概率模型。
【文檔編號(hào)】G06F17/30GK104142922SQ201310161565
【公開日】2014年11月12日 申請(qǐng)日期:2013年5月6日 優(yōu)先權(quán)日:2013年5月6日
【發(fā)明者】束蘭, 黃裕新 申請(qǐng)人:蘇州普達(dá)新信息技術(shù)有限公司