專利名稱:一種基于屬性排序的商品個(gè)性化搜索方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電子商務(wù)(計(jì)算機(jī)管理)技術(shù)領(lǐng)域,涉及一種電子商務(wù)活動(dòng)中商品個(gè)性化搜索方法和裝置,尤其是一種基于屬性排序的商品個(gè)性化搜索方法及裝置,用于網(wǎng)絡(luò)購物時(shí)用戶利用計(jì)算機(jī)搜索尋找所需商品。
背景技術(shù):
隨著網(wǎng)絡(luò)業(yè)務(wù)的擴(kuò)張,電子商務(wù)中網(wǎng)上商品的種類和數(shù)量逐漸增多,搜索引擎作為用戶和商品之間的橋梁,是購買者在收集、對比和分析商品信息時(shí)所使用的重要工具。目前,所使用的絕大多數(shù)搜索引擎都是基于關(guān)鍵字的,用戶輸入關(guān)鍵字,然后系統(tǒng)根據(jù)簡單的關(guān)鍵字匹配策略進(jìn)行查找,這種方法得到的結(jié)果過于龐大,同時(shí),用戶通常很難用關(guān)鍵字來真實(shí)的表達(dá)自己的檢索需求;由于消費(fèi)者的消費(fèi)行為逐漸趨于理性化,在面對琳瑯滿目種類繁多的商品時(shí),通常期望搜集大量相關(guān)信息,比較各種同類產(chǎn)品,降低消費(fèi)風(fēng)險(xiǎn),做出合理的購買決策。如果電子商務(wù)系統(tǒng)能為顧客提供個(gè)性化的搜索方式,方便顧客查找、對比和分析已有商品,能大大激發(fā)顧客的購買欲望,銷售企業(yè)也將實(shí)現(xiàn)豐厚的利潤。個(gè)性化搜索是通過收集和分析用戶信息來學(xué)習(xí)用戶的興趣和行為,從而實(shí)現(xiàn)個(gè)性化搜索。近年來,許多學(xué)者已經(jīng)圍繞個(gè)性化搜索展開了相關(guān)研究,但現(xiàn)有的個(gè)性化搜索系統(tǒng)的研究都很少考慮到商品的屬性信息和商務(wù)網(wǎng)站上顧客和商品的屬性之間的關(guān)系。商品具有價(jià)格、品牌、銷售量、 大小或者尺寸等很多屬性,用戶在購買商品時(shí),往往會(huì)通過描述商品的某些屬性來表達(dá)自己想要購買什么類型的商品。而且顧客和商品屬性之間有著復(fù)雜的關(guān)系,顧客購買商品, 商品具有商品屬性,顧客與商品之間發(fā)生直接關(guān)系。顧客通過查看商品屬性來決定商品是否能夠滿足自己的需求,這樣顧客與商品屬性之間具有間接關(guān)系,商品屬性是用戶非常關(guān)心的內(nèi)容,是用戶選購該類商品的依據(jù)。近年來,大多研究表明采用半監(jiān)督學(xué)習(xí)策略,融合先驗(yàn)信息以輔助聚類可以有效的提高聚類結(jié)果,然而很少有將方法應(yīng)用到商品個(gè)性化搜索中,為了實(shí)現(xiàn)商品的個(gè)性化搜索,人們可以通過收集和分析用戶信息來學(xué)習(xí)用戶興趣,將這些信息作為先驗(yàn)知識(shí)融合到聚類結(jié)果中;先驗(yàn)信息包含屬性排序形式的屬性層信息和成對約束形式的實(shí)例層信息,文獻(xiàn)[Jun Sun,Wenbo Zhao, Jiangwei Xue,Zhiyong Shen, Yi-Dong Shen. Clustering with feature order preferences. PRICAI 2008, pp. 382-393]定義的屬性排序信息用(s,t,δ ) ( δ > 0),ws-wt彡δ來進(jìn)行表示,即屬性s的權(quán)重比屬性t的權(quán)重大δ,說明屬性s比t要重要得多,利用獲得的商品屬性排序知識(shí)指導(dǎo)聚類過程,將商品根據(jù)用戶的興趣信息作指導(dǎo),聚類結(jié)果將會(huì)更能滿足顧客的需求。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的缺點(diǎn),尋求設(shè)計(jì)和提供一種基于屬性排序的電子商務(wù)場合使用的商品個(gè)性化搜索方法及其裝置,利用屬性排序信息來提高聚類結(jié)果的準(zhǔn)確性。為了實(shí)現(xiàn)上述目的,本發(fā)明的方法包括以下步驟
A、用戶從自定義網(wǎng)頁瀏覽器對電子商務(wù)網(wǎng)站商品屬性信息進(jìn)行選擇;B、對用戶選擇的商品屬性進(jìn)行排序;C、融合商品屬性排序信息進(jìn)行聚類;D、對聚類結(jié)果商品進(jìn)行排序;E、將商品排序結(jié)果呈現(xiàn)給用戶。本發(fā)明實(shí)現(xiàn)商品個(gè)性化搜索方法的裝置分為客戶端和服務(wù)器端兩個(gè)功能結(jié)構(gòu)部分,各模塊單元電信息連通構(gòu)成一體結(jié)構(gòu)裝置,客戶端包括自定義網(wǎng)頁瀏覽器、屬性選擇模塊和個(gè)性化搜索結(jié)果單元;服務(wù)器端包括商品數(shù)據(jù)庫、屬性排序聚類模塊和聚類結(jié)果排序模塊,其中屬性排序聚類模塊包括屬性排序模塊和融合屬性排序聚類模塊;自定義網(wǎng)頁瀏覽器實(shí)現(xiàn)用戶查看、搜索商品信息并記錄用戶查詢信息;屬性選擇模塊實(shí)現(xiàn)用戶對感興趣的商品類別進(jìn)行屬性選擇;商品數(shù)據(jù)庫存儲(chǔ)電子商務(wù)網(wǎng)站商品的所有信息,包括商品的品牌、價(jià)格、規(guī)格的基礎(chǔ)信息以及商品的購買信息和評(píng)論信息;屬性排序聚類模塊實(shí)現(xiàn)對用戶選擇的商品屬性進(jìn)行排序,轉(zhuǎn)化成屬性排序知識(shí)集合,然后融合到聚類算法中實(shí)現(xiàn)對商品的聚類劃分;聚類結(jié)果排序模塊實(shí)現(xiàn)對聚類后的結(jié)果進(jìn)行規(guī)整和排序,按照排序規(guī)則對商品列表進(jìn)行排序;在個(gè)性化搜索結(jié)果單元中得到最終的搜索結(jié)果;由屬性排序模塊和融合屬性排序聚類模塊組成的屬性排序聚類模塊實(shí)現(xiàn)用戶在選擇商品屬性后,服務(wù)器端響應(yīng)屬性排序模塊,對商品屬性進(jìn)行計(jì)算,并得到商品屬性知識(shí)的排序集合;在得到屬性排序集合后,融合屬性排序聚類模塊將屬性排序集合融合到聚類算法中對商品進(jìn)行聚類劃分,并返回聚類后的劃分結(jié)果;各功能模塊或單元協(xié)調(diào)工作實(shí)現(xiàn)商品的個(gè)性化搜索。本發(fā)明所述搜索方法及裝置,通過分析來自互聯(lián)網(wǎng)的電子商務(wù)數(shù)據(jù),收集和分析用戶對商品屬性信息的興趣,將用戶關(guān)注的商品屬性轉(zhuǎn)化為數(shù)據(jù)挖掘中的屬性排序知識(shí), 然后融合這些屬性排序知識(shí)一起作為先驗(yàn)知識(shí),再利用半監(jiān)督聚類的方法進(jìn)行聚類,最后通過對聚類結(jié)果中的商品進(jìn)行排序,將商品搜索結(jié)果呈現(xiàn)給用戶以指導(dǎo)用戶對商品進(jìn)行選擇。本發(fā)明與現(xiàn)有技術(shù)相比,其工藝過程簡單,使用操作方便,商品信息采集準(zhǔn)確,排列順序科學(xué)合理,搜索速度快,其使用的裝置結(jié)構(gòu)簡單,操作靈活,可以替代現(xiàn)有的電子商務(wù)中的商品搜索技術(shù)和設(shè)備。
圖1為本發(fā)明涉及的搜索工作流程示意框圖。圖2為本發(fā)明方法實(shí)施的裝置結(jié)構(gòu)原理示意圖。
具體實(shí)施例方式下面結(jié)合附圖并通過實(shí)施例對本發(fā)明作進(jìn)一步描述。實(shí)施例本實(shí)施例的電子商務(wù)網(wǎng)站中商品信息和顧客信息都存儲(chǔ)在服務(wù)器端,用戶通過客戶端從自定義瀏覽器對商品進(jìn)行搜索,調(diào)用服務(wù)器端的后臺(tái)程序?qū)ι唐愤M(jìn)行選擇,然后呈現(xiàn)給用戶;其具體包括以下幾個(gè)步驟步驟101,用戶從自定義網(wǎng)頁瀏覽器201對電子商務(wù)網(wǎng)站發(fā)起訪問,并通過查詢搜索選擇關(guān)注的商品屬性信息作為搜索條件;例如,用戶要購買一臺(tái)筆記本電腦,首先訪問電子商務(wù)網(wǎng)站,選擇筆記本電腦商品類別,然后根據(jù)個(gè)人關(guān)注程度選擇筆記本電腦屬性中的品牌、價(jià)格、CPU類型、內(nèi)存大小和硬盤容量這幾個(gè)屬性作為搜索條件;步驟102,對用戶選擇的商品屬性進(jìn)行排序;用戶只知道自己關(guān)注商品的某幾個(gè)屬性,出于對這幾個(gè)屬性綜合考慮,對于大多數(shù)用戶來講,很難區(qū)分商品的一個(gè)屬性究竟要比另一個(gè)屬性重要多少,所以要對商品的屬性信息進(jìn)行排序;[J Sun,W. Zhao, J. Xue Ζ. Shen, and Y. Shen. Clustering with Feature Order Preferences. In :proc. of PRICAI 2008.Trends in Artificial Intelligence,382-393, 2008]文獻(xiàn)中提出的利用屬性排序輔助聚類能夠很好的解決好聚類劃分問題,其中,對屬性排序的定義如下屬性排序?qū)傩耘判蚣螾表示所有滿足屬性排序關(guān)系Pi = (Si,ti; δ》, (i = 1,2,...,m)的集合,即戶={/U: ,Pi = (si; t" Si);屬性排序表達(dá)了兩屬性重要性的差異,(s,t,δ) (δ >0)代表屬性s比屬性t重要得多,而(s,t,- O和(t,s,- O (ε是一個(gè)很小的正數(shù))代表屬性s和屬性t的重要性相似;當(dāng)用戶選擇了比較關(guān)注的屬性后,米用類似于[A. Banerjee, S. Merugu, I. S. Dhillon, et al. Clustering with bregman divergences [J]. Journal of Machine Learning Research,2005,6 :1705-1749]的方法對 Sim的方法進(jìn)行改進(jìn),定義用戶關(guān)注的屬性信息為(s,δ),即屬性權(quán)重Ws > δ,并設(shè)置δ 為一個(gè)較大的值,屬性排序的懲罰項(xiàng)用max ( δ -ws, 0)表示;通過上述方法,在上述實(shí)例中獲取了用戶關(guān)注筆記本電腦商品的幾個(gè)屬性后,就可以得到這些屬性的屬性排序集合P;步驟103,融合商品屬性排序信息進(jìn)行聚類;在引入定義好的屬性排序集合P,將 Sim文中給出的聚類目標(biāo)函數(shù)改寫成如下的形式
1 kmin ^n - Σ Σ ) + Λ YjVdSK(S-Ws^)-A2H(W)
” C=I XiGTTc(s,S)Gpsubject to :w e AdWs ^ δ ,Vp = (s,^)GP目標(biāo)函數(shù)第一項(xiàng)以最小化每一類中所有商品到簇中心之間的距離為目標(biāo),通過參
數(shù)化的距離度量把相似的商品劃分到同一個(gè)類別中;由于采用基于距離度量的軟約束策
略,第二項(xiàng)為商品屬性排序的懲罰項(xiàng),對屬性排序知識(shí)的滿足程度越高,懲罰項(xiàng)的值越小,
反之越大。這樣就把獲取的用戶比較關(guān)注的商品屬性信息引入到聚類中,用這種信息指導(dǎo)
聚類,目標(biāo)函數(shù)值的大小反映了每次聚類的好差程度;添加了商品屬性排序知識(shí)后,為了避
免可能出現(xiàn)的不確定性,盡量保證數(shù)據(jù)的一致性添加第三項(xiàng)規(guī)整項(xiàng);使用12熵作為規(guī)整
權(quán)利要求
1.一種基于屬性排序的商品個(gè)性化搜索方法,其特征在于包括以下步驟A、用戶從自定義網(wǎng)頁瀏覽器對電子商務(wù)網(wǎng)站商品屬性信息進(jìn)行選擇;B、對用戶選擇的商品屬性進(jìn)行排序;C、融合商品屬性排序信息進(jìn)行聚類;D、對聚類結(jié)果商品進(jìn)行排序;E、將商品排序結(jié)果呈現(xiàn)給用戶。
2.一種基于屬性排序的商品個(gè)性化搜索裝置,其特征在于實(shí)現(xiàn)商品個(gè)性化搜索方法的裝置分為客戶端和服務(wù)器端兩個(gè)功能結(jié)構(gòu)部分,各模塊單元電信息連通構(gòu)成一體結(jié)構(gòu)裝置,客戶端包括自定義網(wǎng)頁瀏覽器、屬性選擇模塊和個(gè)性化搜索結(jié)果單元;服務(wù)器端包括商品數(shù)據(jù)庫、屬性排序聚類模塊和聚類結(jié)果排序模塊,其中屬性排序聚類模塊包括屬性排序模塊和融合屬性排序聚類模塊;自定義網(wǎng)頁瀏覽器實(shí)現(xiàn)用戶查看、搜索商品信息并記錄用戶查詢信息;屬性選擇模塊實(shí)現(xiàn)用戶對感興趣的商品類別進(jìn)行屬性選擇;商品數(shù)據(jù)庫存儲(chǔ)電子商務(wù)網(wǎng)站商品的所有信息,包括商品的品牌、價(jià)格、規(guī)格的基礎(chǔ)信息以及商品的購買信息和評(píng)論信息;屬性排序聚類模塊實(shí)現(xiàn)對用戶選擇的商品屬性進(jìn)行排序,轉(zhuǎn)化成屬性排序知識(shí)集合,然后融合到聚類算法中實(shí)現(xiàn)對商品的聚類劃分;聚類結(jié)果排序模塊實(shí)現(xiàn)對聚類后的結(jié)果進(jìn)行規(guī)整和排序,按照排序規(guī)則對商品列表進(jìn)行排序;在個(gè)性化搜索結(jié)果單元中得到最終的搜索結(jié)果;由屬性排序模塊和融合屬性排序聚類模塊組成的屬性排序聚類模塊實(shí)現(xiàn)用戶在選擇商品屬性后,服務(wù)器端響應(yīng)屬性排序模塊,對商品屬性進(jìn)行計(jì)算,并得到商品屬性知識(shí)的排序集合;在得到屬性排序集合后,融合屬性排序聚類模塊將屬性排序集合融合到聚類算法中對商品進(jìn)行聚類劃分,并返回聚類后的劃分結(jié)果;各功能模塊或單元協(xié)調(diào)工作實(shí)現(xiàn)商品的個(gè)性化搜索。
全文摘要
本發(fā)明屬于電子商務(wù)技術(shù)領(lǐng)域,涉及一種電子商務(wù)活動(dòng)中商品個(gè)性化搜索方法和裝置,尤其是一種基于屬性排序的商品個(gè)性化搜索方法及裝置,用于網(wǎng)絡(luò)購物時(shí)用戶利用計(jì)算機(jī)搜索尋找所需商品,通過分析來自互聯(lián)網(wǎng)的電子商務(wù)數(shù)據(jù),收集和分析用戶對商品屬性信息的興趣,將用戶關(guān)注的商品屬性轉(zhuǎn)化為數(shù)據(jù)挖掘中的屬性排序知識(shí),然后融合屬性排序知識(shí)作為先驗(yàn)知識(shí),再利用半監(jiān)督聚類的方法進(jìn)行聚類,最后通過對聚類結(jié)果中的商品進(jìn)行排序,將商品搜索結(jié)果呈現(xiàn)給用戶以指導(dǎo)用戶對商品進(jìn)行選擇;其工藝過程簡單,操作方便,信息采集準(zhǔn)確,排列順序科學(xué),搜索速度快,裝置結(jié)構(gòu)簡單,操作靈活,可替代現(xiàn)有的電子商務(wù)中的商品搜索技術(shù)和設(shè)備。
文檔編號(hào)G06Q30/02GK102419779SQ201210009669
公開日2012年4月18日 申請日期2012年1月13日 優(yōu)先權(quán)日2012年1月13日
發(fā)明者朱旺南, 杜中國, 王金龍 申請人:青島理工大學(xué)