一種基于用戶行為的酒店排序方法、云端服務器及系統(tǒng)的制作方法
【專利摘要】本發(fā)明實施例提供一種基于用戶行為的酒店排序方法、云端服務器及系統(tǒng),所述方法包括:獲取收集的電商領(lǐng)域酒店預訂產(chǎn)品的用戶行為數(shù)據(jù);對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,獲取分布式處理后的酒店排序結(jié)果;將所述分布式處理后的酒店排序結(jié)果發(fā)送給電商領(lǐng)域酒店預訂產(chǎn)品的搜索用戶。本技術(shù)發(fā)明的計算周期可以為一天,完全自動化,不需要任何人工干預;其數(shù)據(jù)計算方式為分布式,較之之前的單點數(shù)據(jù)庫,具有良好的水平擴展性。同時中間數(shù)據(jù)層和抽象模型的構(gòu)造為后續(xù)的其他數(shù)據(jù)挖掘工作提供了方便的數(shù)據(jù)接口,取得了轉(zhuǎn)化率的大幅提升。
【專利說明】一種基于用戶行為的酒店排序方法、云端服務器及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,尤其涉及一種基于用戶行為的酒店排序方法、云端 服務器及系統(tǒng)。
【背景技術(shù)】
[0002] 對用戶行為的理解和建模是互聯(lián)網(wǎng)技術(shù)皇冠上的寶石。數(shù)據(jù)挖掘和機器學習方法 在精準廣告投放、搜索、個性化推薦等方面的成功應用,加深了這一領(lǐng)域的研究深度,同時 堅定了各大互聯(lián)網(wǎng)公司在此領(lǐng)域落地的決心?,F(xiàn)有的搜索排序方法是基于人工手動調(diào)整 的,工作量大,更新周期長且沒有理論基礎(chǔ),使得互聯(lián)網(wǎng)公司長期以來用戶購買轉(zhuǎn)化率穩(wěn)定 在較低的數(shù)值不能得到提升。
[0003] 現(xiàn)有技術(shù)的酒店排序方法主要是靠人工經(jīng)驗、人工調(diào)整。訂單數(shù)據(jù)庫記錄了歷史 訂單的詳細數(shù)據(jù),由于訂單數(shù)據(jù)庫本質(zhì)上是事務性數(shù)據(jù)庫而非數(shù)據(jù)倉庫,單機生成報表時 間緩慢,周期長,一般的周期在半個月左右。
[0004] 業(yè)務人員將每個酒店的訂單量,點擊量等數(shù)據(jù)形成報表之后,根據(jù)一些人工經(jīng)驗 賦權(quán),形成酒店排序表。現(xiàn)有技術(shù)方案的缺點:1.特征賦權(quán)方法為手工,公式和權(quán)重都沒有 可信度。2.人工調(diào)整資源消耗巨大。在商品、場景較少的情況下暫且可行,一旦增多,由于 組合爆炸,人工調(diào)整是不可行的。3.數(shù)據(jù)處理量大,ETL(Extraction-Transformation-Loa ding,數(shù)據(jù)提取、轉(zhuǎn)換和加載)更新周期慢(一個月),需要手工編輯,耗時耗力。4.無法在 此基礎(chǔ)上為后續(xù)的個性化推薦、分場景分query (問題)排序做出技術(shù)基礎(chǔ)。5.實際數(shù)據(jù) 證明,人工調(diào)整策略的轉(zhuǎn)化率(CVR,Conversion Rate)穩(wěn)定在8?9%之間,無法進一步提 升,如下表1所示:
【權(quán)利要求】
1. 一種基于用戶行為的酒店排序方法,其特征在于,所述基于用戶行為的酒店排序方 法包括: 獲取收集的電商領(lǐng)域酒店預訂產(chǎn)品的用戶行為數(shù)據(jù); 對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,獲取分布式處理后的酒店排序結(jié)果; 將所述分布式處理后的酒店排序結(jié)果發(fā)送給電商領(lǐng)域酒店預訂產(chǎn)品的搜索用戶。
2. 如權(quán)利要求1所述基于用戶行為的酒店排序方法,其特征在于, 所述用戶行為數(shù)據(jù)為日志數(shù)據(jù),該日志數(shù)據(jù)包括:搜索請求日志、點擊事件日志、展現(xiàn) 日志。
3. 如權(quán)利要求1所述基于用戶行為的酒店排序方法,其特征在于,所述獲取收集的電 商領(lǐng)域酒店預訂產(chǎn)品的用戶行為數(shù)據(jù),包括: 通過日志傳輸平臺實時收集所述電商領(lǐng)域酒店預訂產(chǎn)品的用戶行為數(shù)據(jù)。
4. 如權(quán)利要求1所述基于用戶行為的酒店排序方法,其特征在于,所述對所述用戶行 為數(shù)據(jù)進行分布式數(shù)據(jù)處理,獲取分布式處理后的酒店排序結(jié)果,包括: 對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,通過數(shù)據(jù)建模與數(shù)據(jù)提取、轉(zhuǎn)換和加載ETL 獲取競賽圖模型; 根據(jù)所述競賽圖模型,獲取所述分布式處理后的酒店排序結(jié)果。
5. 如權(quán)利要求4所述基于用戶行為的酒店排序方法,其特征在于, 所述對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,通過數(shù)據(jù)建模與數(shù)據(jù)提取、轉(zhuǎn)換和加 載ETL獲取競賽圖模型,包括:對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,通過數(shù)據(jù)建模與 數(shù)據(jù)提取、轉(zhuǎn)換和加載ETL進行六元組的主流程抽象模型構(gòu)造,獲取競賽圖模型; 所述根據(jù)所述競賽圖模型,獲取所述分布式處理后的酒店排序結(jié)果,包括:根據(jù)所述競 賽圖模型進行迭代計算求得排序值,以獲取所述分布式處理后的酒店排序結(jié)果。
6. -種基于用戶行為的酒店排序的云端服務器,其特征在于,所述基于用戶行為的酒 店排序的云端服務器包括: 獲取單元,用于獲取收集的電商領(lǐng)域酒店預訂產(chǎn)品的用戶行為數(shù)據(jù); 分布式數(shù)據(jù)處理單元,用于對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,獲取分布式處 理后的酒店排序結(jié)果; 發(fā)送單元,用于將所述分布式處理后的酒店排序結(jié)果發(fā)送給電商領(lǐng)域酒店預訂產(chǎn)品的 搜索用戶。
7. 如權(quán)利要求6所述基于用戶行為的酒店排序的云端服務器,其特征在于, 所述獲取單元獲取的用戶行為數(shù)據(jù)為日志數(shù)據(jù),該日志數(shù)據(jù)包括:搜索請求日志、點擊 事件日志、展現(xiàn)日志。
8. 如權(quán)利要求6所述基于用戶行為的酒店排序的云端服務器,其特征在于,所述分布 式數(shù)據(jù)處理單元包括: 模型構(gòu)造模塊,用于對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,通過數(shù)據(jù)建模與數(shù)據(jù) 提取、轉(zhuǎn)換和加載ETL獲取競賽圖模型; 計算模塊,用于根據(jù)所述競賽圖模型,獲取所述分布式處理后的酒店排序結(jié)果。
9. 如權(quán)利要求8所述基于用戶行為的酒店排序的云端服務器,其特征在于, 所述模型構(gòu)造模塊,進一步用于對所述用戶行為數(shù)據(jù)進行分布式數(shù)據(jù)處理,通過數(shù)據(jù) 建模與數(shù)據(jù)提取、轉(zhuǎn)換和加載ETL進行六元組的主流程抽象模型構(gòu)造,獲取競賽圖模型; 所述計算模塊,進一步用于根據(jù)所述競賽圖模型進行迭代計算求得排序值,以獲取所 述分布式處理后的酒店排序結(jié)果。
10. -種基于用戶行為的酒店排序系統(tǒng),其特征在于,所述基于用戶行為的酒店排序系 統(tǒng)包括權(quán)利要求6-9中任一項所述基于用戶行為的酒店排序的云端服務器,所述基于用戶 行為的酒店排序系統(tǒng)還包括: 日志傳輸平臺,用于實時收集所述電商領(lǐng)域酒店預訂產(chǎn)品的用戶行為數(shù)據(jù)。
【文檔編號】G06F17/30GK104391847SQ201410219006
【公開日】2015年3月4日 申請日期:2014年5月22日 優(yōu)先權(quán)日:2014年5月22日
【發(fā)明者】陳沁宇 申請人:藝龍網(wǎng)信息技術(shù)(北京)有限公司