两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

個性化數(shù)據(jù)搜索方法及裝置的制造方法

文檔序號:8543674閱讀:285來源:國知局
個性化數(shù)據(jù)搜索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及數(shù)據(jù)搜索領(lǐng)域,更具體地涉及一種個性化數(shù)據(jù)搜索方法及裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)業(yè)務(wù)迅速發(fā)展,網(wǎng)絡(luò)中的數(shù)據(jù)量日益增加。數(shù)據(jù)搜索引擎已經(jīng)成為幫 助用戶在海量數(shù)據(jù)對象中找到自己滿意的數(shù)據(jù)對象的重要工具。盡管數(shù)據(jù)搜索引擎可W在 海量數(shù)據(jù)對象中篩選出用戶所需要的搜索結(jié)果(數(shù)據(jù)對象),但是,無論如何使用數(shù)據(jù)搜索 引擎來搜索數(shù)據(jù)對象,其關(guān)鍵技術(shù)都包含對搜索出的搜索結(jié)果中所有的數(shù)據(jù)對象進(jìn)行排序 的輸出處理。也即是說,用戶輸入一個查詢詞后,通過搜索找到對應(yīng)的數(shù)據(jù)對象作為搜索結(jié) 果,并W-定的排序方式展示輸出該些搜索結(jié)果。通常,數(shù)據(jù)搜索技術(shù)與用戶本身的差異或 者用戶的特點(diǎn)無關(guān),僅與查詢詞有關(guān)。也就是說對不同用戶使用同一個查詢詞,搜索到的全 部數(shù)據(jù)對象一致即搜索結(jié)果完全一致,并且,對搜索結(jié)果的輸出展示的排序方式相同。因而 不同用戶采用同一查詢詞搜索,最后看到的W-定順序展示的搜索結(jié)果相同。由此,個性化 搜索技術(shù)逐漸興起。所謂個性化搜索,是指不同用戶能獲得不同的輸出展示排序的搜索結(jié) 果,并且該個結(jié)果輸出更貼近用戶搜索需求。具體地,不同用戶采用同一查詢詞做搜索,所 得到的搜索結(jié)果,由于對應(yīng)不同用戶,其會按照不同的排序方式輸出展示。此處,搜索結(jié)果 的排序方式考慮了用戶在一個或多個維度上的特征,而用戶在各維度上的特征可W體現(xiàn)出 用戶的個性。其中,個性化搜索需要準(zhǔn)確識別用戶的個性化信息。其中,不同用戶可W根據(jù) 其在各維度上的特征分為不同的群體。例如:性別維度,可W有男性、女性;年齡維度,可W 有兒童、青年、中年、老年;網(wǎng)絡(luò)訪問維度,可W有高、中、低;……;等等。用戶可W在網(wǎng)站 注冊過程中填寫該些維度上的特征W確定所屬群體,或根據(jù)用戶行為使用算法識別出所屬 群體。另外,搜索到的每個數(shù)據(jù)對象,在不同維度也有不同特點(diǎn)。例如:數(shù)據(jù)對象的類目維 度,可W有體育類目、人文類目,等等;數(shù)據(jù)對象的標(biāo)志維度、數(shù)值范圍維度、交互量維度,等 等。由于不同用戶在某一維度上的特征可能不同,相應(yīng)地,用戶所偏愛/關(guān)注的搜索結(jié)果中 的數(shù)據(jù)對象的特征也不同。用戶對其關(guān)注的數(shù)據(jù)對象可W通過用戶行為數(shù)據(jù)分析而得到, 用戶行為數(shù)據(jù)可W包括與用戶對數(shù)據(jù)對象進(jìn)行操作所產(chǎn)生的用戶行為有關(guān)的各種數(shù)據(jù)。例 女口:用戶對數(shù)據(jù)對象的點(diǎn)擊、瀏覽、交互等行為。個性化搜索W用戶為出發(fā)點(diǎn),根據(jù)用戶行為 數(shù)據(jù),結(jié)合用戶的特征和數(shù)據(jù)對象的特征對搜索結(jié)果中的數(shù)據(jù)對象進(jìn)行個性化排序,W滿 足不同用戶對不同數(shù)據(jù)對象的需求。
[0003] 現(xiàn)有的個性化搜索,比如:主要W用戶對數(shù)據(jù)對象的交互為目標(biāo),對用戶行為、用 戶在一個或多個維度上的特征、數(shù)據(jù)對象在一個或多個維度上的特征,訓(xùn)練概率預(yù)測模型, 由所述模型預(yù)測用戶可能會對每個數(shù)據(jù)對象做交互的概率。所述概率可W影響數(shù)據(jù)對象在 輸出排序時的排序分值。當(dāng)根據(jù)用戶輸入的查詢詞進(jìn)行搜索時,對搜索出的搜索結(jié)果(一個 或多個數(shù)據(jù)對象),按照用戶可能會對每個數(shù)據(jù)對象做交互(或其他操作)的概率,計算每個 數(shù)據(jù)對象的排序分值,W分值從大到小的順序,為用戶展示搜索結(jié)果。但是,利用現(xiàn)有的預(yù) 測模型實(shí)施的個性化搜索技術(shù),沒有考慮查詢詞如ery的信息,在不同的查詢詞下用戶行 為有不同的特點(diǎn),比如,不同的查詢詞對應(yīng)的用戶有不同的意圖。例如:在海量的商品搜索 中,男性用戶搜"T恤"時傾向于購買男性T恤,而男性用戶搜"連衣裙"時則仍然是購連衣 裙,此時由該查詢詞的信息,應(yīng)該認(rèn)為當(dāng)前用戶是屬于"女性"群體,該時就不能僅僅根據(jù)用 戶各維度的特征、數(shù)據(jù)對象各維度的特征、用戶歷史偏好(即對用戶行為數(shù)據(jù)分析的歷史信 息)來預(yù)測用戶搜索意圖。因?yàn)?,根?jù)男性用戶的歷史信息、或根據(jù)當(dāng)前搜索關(guān)鍵詞"連衣 裙"本身、或結(jié)合二者,都難W給出最符合當(dāng)前用戶真正需求(意圖)的搜索結(jié)果排序,即導(dǎo) 致了搜索結(jié)果的輸出排序不準(zhǔn)確的缺陷。由此,需要改進(jìn)搜索平臺的個性化搜索處理性能, W提高搜索的輸出結(jié)果準(zhǔn)確度,為用戶輸出最合理最符合其搜索意圖的結(jié)果。

【發(fā)明內(nèi)容】

[0004] 基于上述現(xiàn)有技術(shù)中個性化搜索的缺陷,本申請的主要目的在于提供一種個性化 數(shù)據(jù)搜索方法和裝置,W改進(jìn)個性化搜索處理性能,從而最大限度為用戶提供符合其搜索 意圖的搜索結(jié)果、提高搜索平臺的輸出搜索結(jié)果的準(zhǔn)確度。
[0005] 為了解決上述技術(shù)問題,本申請是通過W下技術(shù)方案來實(shí)現(xiàn)。
[0006] 根據(jù)本申請一個方面的實(shí)施例,提出一種個性化數(shù)據(jù)搜索方法,包括:根據(jù)當(dāng)前用 戶的搜索請求中的查詢詞搜索數(shù)據(jù)對象;依據(jù)歷史行為日志,分別確定歷史用戶在利用所 述查詢詞的搜索訪問過程中的第一行為特征,根據(jù)所述第一行為特征生成所述查詢詞的意 圖向量;根據(jù)用戶屬性,將歷史用戶分為多個用戶群體,統(tǒng)計每一個用戶群體對所述數(shù)據(jù)對 象的第二行為特征,根據(jù)所述第二行為特征生成所述用戶群體的偏好向量;計算查詢詞的 意圖向量與每一用戶群體的偏好向量的相似度;將所述相似度大于設(shè)定闊值時對應(yīng)的用戶 群體作為確定當(dāng)前用戶的意圖偏好的參照群體;利用所述參照群體的歷史行為特征調(diào)整所 述當(dāng)前用戶使用所述查詢詞搜索到的數(shù)據(jù)對象的排序。
[0007] 根據(jù)本申請的另一方面的實(shí)施例,提出一種個性化數(shù)據(jù)搜索裝置,包括;搜索模 塊,用于根據(jù)當(dāng)前用戶的搜索請求中的查詢詞搜索數(shù)據(jù)對象;第一獲取模塊,用于依據(jù)歷史 行為日志,分別確定歷史用戶在利用所述查詢詞的搜索訪問過程中的第一行為特征,根據(jù) 所述第一行為特征生成所述查詢詞的意圖向量;第二獲取模塊,用于根據(jù)用戶屬性,將歷史 用戶分為多個用戶群體,統(tǒng)計每一個用戶群體對所述數(shù)據(jù)對象的第二行為特征,根據(jù)所述 第二行為特征生成所述用戶群體的偏好向量;計算模塊,用于計算查詢詞的意圖向量與每 一用戶群體的偏好向量的相似度;確定模塊,用于將所述相似度大于設(shè)定闊值時對應(yīng)的用 戶群體作為確定當(dāng)前用戶的意圖偏好的參照群體;排序模塊,用于利用所述參照群體的歷 史行為特征調(diào)整所述當(dāng)前用戶使用所述查詢詞搜索到的數(shù)據(jù)對象的排序。
[0008] 與現(xiàn)有技術(shù)相比,根據(jù)本申請的技術(shù)方案具有W下有益效果:
[0009] 本申請結(jié)合W往的用戶行為數(shù)據(jù)及其記錄的用戶、數(shù)據(jù)對象、該用戶對該數(shù)據(jù)對 象的一種或多種用戶行為特征,結(jié)合查詢詞本身的維度或者說屬性特征,即綜合查詢詞的 意圖和用戶的歷史信息來構(gòu)建個性化模型,更準(zhǔn)確的預(yù)測用戶在數(shù)據(jù)對象上的交互概率。 由此,在用戶進(jìn)行數(shù)據(jù)搜索時,分析出當(dāng)前查詢詞的意圖所屬用戶群,在確定當(dāng)前查詢詞意 圖下所對應(yīng)的用戶群體之后,針對該用戶群體所對應(yīng)的數(shù)據(jù)對象,利用個性化模型對搜索 出的每個數(shù)據(jù)對象進(jìn)行個性化分?jǐn)?shù)計算,按照每個數(shù)據(jù)對象的個性化分?jǐn)?shù),對所有的數(shù)據(jù) 對象進(jìn)行排序處理,進(jìn)而可W通過該排序處理得到的順序,展示該些作為搜索結(jié)果的數(shù)據(jù) 對象給用戶。從而改進(jìn)和提升了搜索平臺的性能,提高輸出給用戶的搜索結(jié)果的準(zhǔn)確性,為 用戶輸出最合理最符合其搜索意圖的結(jié)果。進(jìn)一步,還可W避免僅直接使用原始的查詢詞 作為個性化模型特征帶來的數(shù)據(jù)稀疏問題。
【附圖說明】
[0010] 此處所說明的附圖用來提供對本申請的進(jìn)一步理解,構(gòu)成本申請的一部分,本申 請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:
[0011] 圖1是根據(jù)本申請一實(shí)施例的個性化數(shù)據(jù)搜索方法的流程圖;
[0012] 圖2是根據(jù)本申請一實(shí)施例的個性化數(shù)據(jù)搜索方法中獲取查詢詞的意圖向量的 方法流程圖;
[001引圖3是根據(jù)本申請一實(shí)施例的個性化數(shù)據(jù)對象排序方法的流程圖,W及
[0014] 圖4是根據(jù)本申請一實(shí)施例的個性化數(shù)據(jù)搜索裝置的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0015] 本申請的主要思想在于,通過獲取到的當(dāng)前用戶的搜索請求中的查詢詞的意圖向 量與每一用戶群體的偏好向量的相似度的計算,來確定查詢詞意圖與每一用戶群體的相似 度;將相似度大于設(shè)定闊值時對應(yīng)的用戶群體作為確定當(dāng)前用戶的意圖偏好的參照群體; 利用參照群體的歷史行為特征調(diào)整當(dāng)前用戶使用查詢詞搜索到的數(shù)據(jù)對象的排序??蒞有 效地提高輸出給用戶的搜索結(jié)果的準(zhǔn)確性,為用戶輸出最合理最符合其搜索意圖、個性的 結(jié)果。
[0016]為使本申請的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請具體實(shí)施例及 相應(yīng)的附圖對本申請技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請一 部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾堉械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做 出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
嘉善县| 志丹县| 锡林郭勒盟| 时尚| 霍山县| 淅川县| 喀喇| 麻城市| 贡觉县| 崇左市| 淮阳县| 多伦县| 桐柏县| 长葛市| 曲周县| 鹤岗市| 紫阳县| 靖安县| 天气| 礼泉县| 叶城县| 吴堡县| 罗山县| 弥勒县| 诏安县| 承德县| 巨野县| 淮北市| 汝州市| 盐城市| 马关县| 余姚市| 长沙县| 金乡县| 绥宁县| 宁晋县| 德庆县| 自治县| 礼泉县| 长乐市| 博白县|