一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),屬于移動(dòng)【技術(shù)領(lǐng)域】。其特點(diǎn)是:利用強(qiáng)化學(xué)習(xí)、圖像搜索與挖掘理論提高圖像搜索的效率和便捷性,為移動(dòng)端用戶提供新穎的拍照搜索服務(wù),充分發(fā)揮移動(dòng)終端具有獲取圖像信息靈活、方便的特點(diǎn),在移動(dòng)用戶進(jìn)行搜索時(shí),云端在盡可能準(zhǔn)確匹配上傳圖像的基礎(chǔ)上,根據(jù)用戶興趣輔助返回圖像的排序,把用戶最可能喜歡的圖像數(shù)據(jù)排在前面,解決了用戶不能或不愿用文字進(jìn)行搜索的困難,為用戶提供精準(zhǔn)有效的信息。
【專利說明】一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] -種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),屬于移動(dòng)【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002] 據(jù)中國(guó)權(quán)威移動(dòng)互聯(lián)網(wǎng)第三方數(shù)據(jù)挖掘和整合營(yíng)銷機(jī)構(gòu)艾媒咨詢 (iiMediaResearch)發(fā)布的《2012Q3中國(guó)移動(dòng)電子商務(wù)市場(chǎng)季度監(jiān)測(cè)報(bào)告》顯示,2011年中 國(guó)移動(dòng)電子商務(wù)用戶規(guī)模達(dá)到了 0.92億人,到2012年底,中國(guó)移動(dòng)電子商務(wù)用戶規(guī)模將達(dá) 到1. 46億人,同比增長(zhǎng)58. 7%。預(yù)計(jì)到2015年底,移動(dòng)電子商務(wù)用戶規(guī)模將達(dá)到3. 48億 人。2011年中國(guó)移動(dòng)電子商務(wù)市場(chǎng)規(guī)模達(dá)到了 156. 7億元,到2012年底,中國(guó)移動(dòng)電子商 務(wù)市場(chǎng)規(guī)模將達(dá)到251. 5億元,同比增加60. 5%。預(yù)計(jì)到2015年底,移動(dòng)電子商務(wù)市場(chǎng)規(guī) 模將達(dá)到1046. 7億元。移動(dòng)電子商務(wù)正處于快速發(fā)展時(shí)期。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的通過以下技術(shù)方案來實(shí)現(xiàn):
[0004] 一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),屬于移動(dòng)【技術(shù)領(lǐng)域】。其特點(diǎn)是:利用強(qiáng)化學(xué)習(xí)、 圖像搜索與挖掘理論提高圖像搜索的效率和便捷性,為移動(dòng)端用戶提供新穎的拍照搜索服 務(wù),充分發(fā)揮移動(dòng)終端具有獲取圖像信息靈活、方便的特點(diǎn),在移動(dòng)用戶進(jìn)行搜索時(shí),云端 在盡可能準(zhǔn)確匹配上傳圖像的基礎(chǔ)上,根據(jù)用戶興趣輔助返回圖像的排序,把用戶最可能 喜歡的圖像數(shù)據(jù)排在前面,解決了用戶不能或不愿用文字進(jìn)行搜索的困難,為用戶提供精 準(zhǔn)有效的信息。
[0005] 進(jìn)一步地,上述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的強(qiáng)化學(xué)習(xí) 是一種基于Map/Reduce模型的多類特征組合強(qiáng)化學(xué)習(xí)優(yōu)化方法,該方法使多個(gè)agent在 各自的環(huán)境中獨(dú)立地學(xué)習(xí)特征組合,避免了在傳統(tǒng)Q-學(xué)習(xí)中,每次迭代時(shí)只更新一個(gè)狀 態(tài)-動(dòng)作對(duì)的Q值。
[0006] 更進(jìn)一步地,上述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的圖像搜 索與挖掘理論采用了一種大規(guī)模社區(qū)分析的圖像索引并行構(gòu)建方法,根據(jù)特征向量進(jìn)行相 似性搜索與數(shù)據(jù)聚類在本質(zhì)上是一致的特性,采用基于Map/Reduce的k-均值聚類算法對(duì) 圖像塊實(shí)現(xiàn)聚類索引。
[0007] 更進(jìn)一步地,上述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的聚類索 引是指在圖像塊的聚類基礎(chǔ)上,將圖像塊的特征聚類索引看作視覺關(guān)鍵詞,圖像將由一系 列的視覺關(guān)鍵詞構(gòu)成的特征聚類向量表示。
[0008] 更進(jìn)一步地,上述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的興趣輔 助結(jié)合與移動(dòng)用戶訪問活動(dòng)相關(guān)聯(lián)圖像的物理特征和語(yǔ)義特征構(gòu)建用戶興趣模型,能從物 理和語(yǔ)義兩個(gè)層面體現(xiàn)用戶興趣,使用戶興趣模型更加準(zhǔn)確,同時(shí)使用圖像塊語(yǔ)義標(biāo)注特 征聚類方法,實(shí)現(xiàn)從圖像物理特征到高層語(yǔ)義特征的映射,能為許多缺少語(yǔ)義標(biāo)注的重要 圖像補(bǔ)充語(yǔ)義,從而進(jìn)一步提高用戶興趣模型的準(zhǔn)確性。
【具體實(shí)施方式】
[0009] -種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),屬于移動(dòng)【技術(shù)領(lǐng)域】。其特點(diǎn)是:利用強(qiáng)化學(xué)習(xí)、 圖像搜索與挖掘理論提高圖像搜索的效率和便捷性,為移動(dòng)端用戶提供新穎的拍照搜索服 務(wù),充分發(fā)揮移動(dòng)終端具有獲取圖像信息靈活、方便的特點(diǎn),在移動(dòng)用戶進(jìn)行搜索時(shí),云端 在盡可能準(zhǔn)確匹配上傳圖像的基礎(chǔ)上,根據(jù)用戶興趣輔助返回圖像的排序,把用戶最可能 喜歡的圖像數(shù)據(jù)排在前面,解決了用戶不能或不愿用文字進(jìn)行搜索的困難,為用戶提供精 準(zhǔn)有效的信息。
[0010] 本項(xiàng)目提出一種基于Map/Reduce模型的多類特征組合強(qiáng)化學(xué)習(xí)優(yōu)化方法,充分 利用圖像各單一特征之間的優(yōu)勢(shì)互補(bǔ)特性,綜合考慮多類特征對(duì)移動(dòng)圖像進(jìn)行描述,具有 更高的圖像聚類精度。該方法使多個(gè)agent在各自的環(huán)境中獨(dú)立地學(xué)習(xí)特征組合,避免了 在傳統(tǒng)Q-學(xué)習(xí)中,每次迭代時(shí)只更新一個(gè)狀態(tài)-動(dòng)作對(duì)的Q值。使多個(gè)狀態(tài)-動(dòng)作對(duì)的Q 值更新可并發(fā)執(zhí)行,提高了特征組合優(yōu)化的效率。由于在學(xué)習(xí)過程中,多個(gè)agent在Map/ Reduce部署環(huán)境中獨(dú)立學(xué)習(xí),使海量圖像的特征組合優(yōu)化具有很強(qiáng)的并發(fā)性和可擴(kuò)展性。 [0011] 對(duì)于海量、高維和動(dòng)態(tài)的特征數(shù)據(jù)庫(kù),通過線性掃描特征數(shù)據(jù)庫(kù)來實(shí)現(xiàn)檢索難以 滿足要求。根據(jù)特征向量進(jìn)行相似性搜索與數(shù)據(jù)聚類在本質(zhì)上是一致的特性,采用基于 Map/Reduce的k-均值聚類算法對(duì)圖像塊實(shí)現(xiàn)聚類索引。k-means算法的主要計(jì)算工作是 將每個(gè)樣本分配給距離其最近的聚簇,并且分配不同樣本的操作之間是相互獨(dú)立的。在每 次迭代中,k-means算法在部署的數(shù)據(jù)節(jié)點(diǎn)分別執(zhí)行相同的Map和Reduce操作完成圖像塊 聚類過程。
[0012] 在圖像塊的聚類基礎(chǔ)上,將圖像塊的特征聚類索引看作視覺關(guān)鍵詞,圖像將由一 系列的視覺關(guān)鍵詞構(gòu)成的特征聚類向量表示。在部署的Map/Reduce框架中,Map/Reduce過 程采用了向量空間模型及語(yǔ)言模型計(jì)算出每個(gè)圖像對(duì)的語(yǔ)義相似度,構(gòu)建圖像的語(yǔ)義相似 度社會(huì)網(wǎng)絡(luò),提取局部語(yǔ)義社會(huì)網(wǎng)絡(luò)。在圖像對(duì)的相似度計(jì)算中,只考慮高維空間中某些相 關(guān)維上的信息,即只在高維空間的某些有意義的子空間中研究圖像間的相似性或差異性。 并據(jù)此來構(gòu)建相應(yīng)的索引結(jié)構(gòu),降低聚類索引的高維性引發(fā)的"維度災(zāi)難"的影響。圖像塊 索引與圖像全局層次的語(yǔ)義索引相結(jié)合,使得移動(dòng)圖像的檢索更具靈活性。
[0013] 另外,系統(tǒng)結(jié)合與移動(dòng)用戶訪問活動(dòng)相關(guān)聯(lián)圖像的物理特征和語(yǔ)義特征構(gòu)建用戶 興趣模型,能從物理和語(yǔ)義兩個(gè)層面體現(xiàn)用戶興趣,使用戶興趣模型更加準(zhǔn)確,同時(shí)使用圖 像塊語(yǔ)義標(biāo)注特征聚類方法,實(shí)現(xiàn)從圖像物理特征到高層語(yǔ)義特征的映射,能為許多缺少 語(yǔ)義標(biāo)注的重要圖像補(bǔ)充語(yǔ)義,從而進(jìn)一步提高用戶興趣模型的準(zhǔn)確性;采用興趣衰減因 子和增量更新技術(shù)實(shí)現(xiàn)用戶興趣模型的更新,可降低用戶興趣模型更新的代價(jià),保證用戶 興趣模型的時(shí)新性;基于云計(jì)算的并行計(jì)算和處理實(shí)現(xiàn)用戶興趣模型構(gòu)建和更新,能提高 用戶興趣模型的構(gòu)建和更新的效率。
[0014] 隨著移動(dòng)互聯(lián)網(wǎng)用戶數(shù)的高速增長(zhǎng),移動(dòng)互聯(lián)網(wǎng)市場(chǎng)的發(fā)展前景廣闊,決定了互聯(lián) 網(wǎng)的主戰(zhàn)場(chǎng)將從電腦轉(zhuǎn)移到移動(dòng)終端,現(xiàn)有的互聯(lián)網(wǎng)運(yùn)營(yíng)商采取網(wǎng)頁(yè)手機(jī)化的辦法來開展移 動(dòng)互聯(lián)網(wǎng)業(yè)務(wù),具體地說就是將網(wǎng)頁(yè)簡(jiǎn)化便于在手機(jī)屏幕上瀏覽,由于移動(dòng)終端便捷性帶 來的屏幕尺寸的限制,用戶無(wú)法進(jìn)行比較復(fù)雜的操作,因此,目前手機(jī)進(jìn)行互聯(lián)網(wǎng)的活動(dòng)收 到比較大的限制,用戶體驗(yàn)滿意度不高,本項(xiàng)目利用先發(fā)優(yōu)勢(shì),具有很好的產(chǎn)業(yè)化前景。
【權(quán)利要求】
1. 一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),屬于移動(dòng)【技術(shù)領(lǐng)域】。其特點(diǎn)是:利用強(qiáng)化學(xué)習(xí)、 圖像搜索與挖掘理論提高圖像搜索的效率和便捷性,為移動(dòng)端用戶提供新穎的拍照搜索服 務(wù),充分發(fā)揮移動(dòng)終端具有獲取圖像信息靈活、方便的特點(diǎn),在移動(dòng)用戶進(jìn)行搜索時(shí),云端 在盡可能準(zhǔn)確匹配上傳圖像的基礎(chǔ)上,根據(jù)用戶興趣輔助返回圖像的排序,把用戶最可能 喜歡的圖像數(shù)據(jù)排在前面,解決了用戶不能或不愿用文字進(jìn)行搜索的困難,為用戶提供精 準(zhǔn)有效的信息。
2. 根據(jù)權(quán)利要求1所述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的強(qiáng)化 學(xué)習(xí)是一種基于Map/Reduce模型的多類特征組合強(qiáng)化學(xué)習(xí)優(yōu)化方法,該方法使多個(gè)agent 在各自的環(huán)境中獨(dú)立地學(xué)習(xí)特征組合,避免了在傳統(tǒng)Q-學(xué)習(xí)中,每次迭代時(shí)只更新一個(gè)狀 態(tài)-動(dòng)作對(duì)的Q值。
3. 根據(jù)權(quán)利要求1所述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的圖像 搜索與挖掘理論采用了一種大規(guī)模社區(qū)分析的圖像索引并行構(gòu)建方法,根據(jù)特征向量進(jìn)行 相似性搜索與數(shù)據(jù)聚類在本質(zhì)上是一致的特性,采用基于Map/Reduce的k-均值聚類算法 對(duì)圖像塊實(shí)現(xiàn)聚類索引。
4. 根據(jù)權(quán)利要求3所述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的聚類 索引是指在圖像塊的聚類基礎(chǔ)上,將圖像塊的特征聚類索引看作視覺關(guān)鍵詞,圖像將由一 系列的視覺關(guān)鍵詞構(gòu)成的特征聚類向量表示。
5. 根據(jù)權(quán)利要求2所述的一種手機(jī)移動(dòng)在線圖像搜索系統(tǒng),其特征在于:所述的興趣 輔助結(jié)合與移動(dòng)用戶訪問活動(dòng)相關(guān)聯(lián)圖像的物理特征和語(yǔ)義特征構(gòu)建用戶興趣模型,能從 物理和語(yǔ)義兩個(gè)層面體現(xiàn)用戶興趣,使用戶興趣模型更加準(zhǔn)確,同時(shí)使用圖像塊語(yǔ)義標(biāo)注 特征聚類方法,實(shí)現(xiàn)從圖像物理特征到高層語(yǔ)義特征的映射,能為許多缺少語(yǔ)義標(biāo)注的重 要圖像補(bǔ)充語(yǔ)義,從而進(jìn)一步提高用戶興趣模型的準(zhǔn)確性。
【文檔編號(hào)】G06F17/30GK104142919SQ201310161561
【公開日】2014年11月12日 申請(qǐng)日期:2013年5月6日 優(yōu)先權(quán)日:2013年5月6日
【發(fā)明者】束蘭, 黃裕新 申請(qǐng)人:蘇州搜客信息技術(shù)有限公司