本發(fā)明涉及用戶訪問行為數據分析,尤其是涉及用戶訪問行為數據的特征提取方法及系統(tǒng)。
背景技術:
1、用戶訪問行為數據是指用戶在訪問網站、使用應用程序或其他在線服務時所留下的數據痕跡。這些數據對于企業(yè)來說非常寶貴,可以幫助企業(yè)更好地理解用戶需求、優(yōu)化產品設計、提升用戶體驗、制定營銷策略等。
2、現有的用戶訪問行為數據管理一般是基于服務器自動記錄訪問日志,例如apache的access.log或nginx的access.log等實現,上述管理方法不能準確分析用戶意圖,還有甚至通過捕獲用戶拍攝工具進行用戶興趣分析的,通過拍攝用戶頭像配合眼睛朝向來分析興趣點,或通過錄音工具來獲取用戶語音信息,對語音信息進行關鍵詞分析獲得用戶興趣點,這些手段都涉嫌侵犯用戶隱私,也不符合gdpr、ccpa等法規(guī)。
3、而且日志文件可能非常大,分析困難;無法追蹤用戶的具體行為,只能看到頁面訪問情況。
技術實現思路
1、為了解決上述用戶訪問行為數據分析的技術問題,本發(fā)明提供用戶訪問行為數據的特征提取方法及系統(tǒng)。采用如下的技術方案:
2、用戶訪問行為數據的特征提取方法,包括以下步驟:
3、步驟1,獲取用戶所瀏覽當前網頁頁面數據和用戶訪問行為數據;
4、步驟2,提取用戶訪問行為數據的關鍵特征數據,關鍵特征數據包括當前頁面停留時間數據、鼠標滑動軌跡數據、鼠標頓點時間數據和鼠標點擊數據;
5、步驟3,分析當前頁面停留時間數據是否大于最小停留時間閾值,若大于則進行用戶訪問行為分析,得到基于當前網頁頁面數據和關鍵特征數據的當前興趣畫像數據,并基于當前興趣畫像數據在當前頁面進行彈窗導向推薦;
6、步驟4,若判斷當前頁面停留時間數據小于等于最小停留時間閾值,則判斷用戶對用戶所瀏覽當前網頁不感興趣,基于用戶歷史興趣畫像在當前頁面進行彈窗導向推薦,彈窗導向推薦內容基于彈窗導向推薦數據庫生成。
7、通過采用上述技術方案,由于法律法規(guī)限制,不能直接獲取用戶畫面和聲音數據,這里的用戶訪問行為數據重點關注當前頁面停留時間數據和鼠標滑動軌跡數據,若當前頁面停留時間數據是小于等于最小停留時間閾值,例如最小停留時間閾值可以設計1秒,在1秒鐘的時間就關閉或者進入其它頁面,則認為是用戶對當前網頁信息完全不關注;
8、若大于最小停留時間閾值,則需要收集用戶訪問行為數據,用戶訪問行為數據主要是鼠標移動相關的數據,鼠標滑動軌跡數據可以反映用戶對當前頁面的主要關注點區(qū)域,正常情況下,通過鼠標在某行字或者圖像下方或側方往復滑動代表了用戶的主要關注點,也就是興趣點,因此通過鼠標滑動軌跡數據的分析可以準確獲得用戶在瀏覽當前網頁過程的關注點,再結合鼠標滑動軌跡數據對應的當前網頁頁面數據就可以進行興趣關聯(lián)的關鍵詞獲取,從而實現針對性的彈窗導向推薦,對于同一個用戶記錄其每次瀏覽網頁的彈窗導向推薦數據就可以形成用戶歷史興趣畫像數據;
9、對于當前網頁不感興趣的彈窗導向推薦可以基于用戶歷史興趣畫像數據進行推薦引導;
10、大幅提升用戶訪問行為分析的準確性,避免大水漫灌式的推薦導致用戶反感。
11、可選的,步驟2中,從用戶打開當前網頁頁面開始計時,若在最小停留時間閾值內用戶關閉當前網頁頁面則直接執(zhí)行步驟4。
12、可選的,步驟1中,若超過最小停留時間閾值當前網頁頁面仍然處于打開狀態(tài),則采用以下步驟獲取當前網頁頁面數據:
13、步驟11,使用javascript工具訪問和操作網頁的文檔對象模型;
14、步驟12,使用javascript工具來獲取當前url的查詢參數、頁面的滾動位置和視口大小信息;
15、步驟13,使用performance?api工具來獲取頁面導航和加載時間的詳細度量;
16、步驟14,使用瀏覽器的開發(fā)者工具獲得網絡請求、頁面資源、dom元素數據。
17、通過采用上述技術方案,獲取當前頁面數據通常涉及前端開發(fā)技術,可以使用javascript工具獲取網頁的文檔對象模型,從而獲得當前url的查詢參數、頁面的滾動位置和視口大小信息,為后續(xù)鼠標軌跡在頁面上的定位提供基礎數據;
18、使用performance?api工具來獲取頁面導航和加載時間的詳細度量,可以在計算最小停留時間閾值時,考慮加載時間,避免因長時間加載導致的誤識別;
19、使用瀏覽器的開發(fā)者工具獲得網絡請求、頁面資源、dom元素數據等,可以為后續(xù)關鍵詞的提取提供數據。
20、可選的,步驟1中,采用javascript工具跟蹤鼠標滑動軌跡數據,將停留時間超過0.2mm的點記錄為頓點,形成頓點集合,并將頓點按照時間順序連接為軌跡曲線,即為鼠標滑動軌跡數據;將頓點集合嵌入停頓時間后即為鼠標頓點時間數據。
21、可選的,步驟3用戶訪問行為分析包括以下步驟;
22、步驟31,分析鼠標滑動軌跡數據,若鼠標起點和鼠標點擊點之間存在的頓點數少于等于2個,則直接提取鼠標點擊點的鼠標點擊數據,獲取鼠標點擊數據的對應頁面資源,并基于對應頁面資源執(zhí)行彈窗導向推薦操作;
23、步驟32,若頓點數大于2個,使用傅里葉描述符、zernike矩或hog描述軌跡的形狀,判斷是否存在往復折線,若存在則提取往復折線,則判斷往復折線是橫線還是豎線,若是橫線則提取橫線上方矩形區(qū)域對應頁面資源,若是豎線則將往復的折線處理為粗豎線,取粗豎線中心為圓點,提取半徑為r的圓形區(qū)域內的對應頁面資源,并基于對應頁面資源執(zhí)行彈窗導向推薦操作。
24、可選的,步驟32中,計算橫線上方矩形區(qū)域的方法是:
25、設矩形區(qū)域的底邊起點是往復折線最上面一根橫線的左端點,最上面一根橫線的右端點為矩形區(qū)域的底邊終點;
26、設最上面一根橫線的長度為a,則矩形區(qū)域底邊長為a,側邊長為;
27、計算圓形區(qū)域的半徑r的方法是:
28、將往復折線處理成粗豎線,取粗豎線的中心點為圓點,計算粗豎線的長度為c,寬度為b,則,其中n為范圍調整系數,在1到5之間取值。
29、通過采用上述技術方案,用戶在操作鼠標瀏覽當前網頁時,在一些點會形成頓點,這些頓點通常停留時間較短,但是會大于0.2mm時間,將這些頓點數據形成頓點集合,在具體應用時將頓點集合嵌入停頓時間后即為鼠標頓點時間數據,還可以設置頓點時間閾值,通過檢測若存在鼠標頓點時間超過頓點時間閾值,可以獲取附近網頁頁面對應關鍵詞信息進行彈窗導向推薦;
30、將頓點按照時間順序連接為軌跡曲線,可以對這些軌跡曲線進行形狀分析,若存在往復折線,往復折線可能是橫線,也可能是折線,大概率用戶對這些關聯(lián)區(qū)域的網頁信息感興趣,從而實現從用戶的訪問行為精準獲得用戶的關注點;
31、對于往復橫線,用戶通常關注的是橫線上方區(qū)域,在處理往返橫線時,可以將橫線標準化,例如將往返橫線標準化成水平粗橫線,取水平粗橫線的最上邊代替最上面一根橫線,采用矩形區(qū)域的底邊長為a,側邊長為,基本可以覆蓋關注區(qū)域內容;
32、對于往復豎折線,用戶的關注點位于豎折線兩邊都有可能,因此采用圓形區(qū)域來獲得關聯(lián)區(qū)域的網頁信息。
33、可選的,彈窗導向推薦操作包括以下步驟:提取對應頁面資源的關鍵詞,在彈窗導向推薦數據庫內進行關鍵詞匹配,將匹配成功的興趣導向關鍵詞進行環(huán)繞式彈窗推薦,先確定匹配成功的興趣導向關鍵詞數量,使用javascript工具創(chuàng)建并顯示多個推薦方塊,將多個推薦方塊環(huán)繞顯示在當前鼠標光標周圍。
34、可選的,彈窗導向推薦操作中,方塊采用淡入或旋轉的方式出現,創(chuàng)建動態(tài)的視覺反饋效果,根據需要調整動畫的持續(xù)時間、類型和復雜度。
35、通過采用上述技術方案,彈窗導向推薦操作具體應用過程中形式上做限制,彈窗導向推薦的區(qū)域是環(huán)繞在當前鼠標的周圍,可以進行淡入或旋轉的方式出現,具體應用時可以進行透明度的調整,當推薦方塊形成后就固定位置,用戶移動鼠標可以進行點擊,盡量避免對用戶當前操作產生干擾。
36、用戶訪問行為數據的特征提取系統(tǒng),包括多個用戶智能終端、服務器計算機和數據庫存儲器,所述服務器計算機分別與多個用戶智能終端網絡通信連接,多個用戶智能終端分別通過網絡訪問服務器計算機的網頁,服務器計算機安裝采用用戶訪問行為數據的特征提取方法設計的程序,運行程序或用戶智能終端的用戶所瀏覽當前網頁頁面數據和用戶訪問行為數據,并基于彈窗導向推薦數據庫存儲的彈窗導向推薦數據進行彈窗導向推薦。
37、可選的,彈窗導向推薦數據包括推薦關鍵詞文本、關鍵詞配套圖形數據和關鍵詞鏈接數據。
38、通過采用上述技術方案,推薦數據庫內還存儲用戶名數據對應的每次彈窗導向推薦數據,每次彈窗導向推薦數據就可以形成用戶歷史興趣畫像數據。
39、綜上所述,本發(fā)明包括以下至少一種有益技術效果:
40、本發(fā)明能提供用戶訪問行為數據的特征提取方法及系統(tǒng),用戶訪問行為數據重點關注當前頁面停留時間數據和鼠標滑動軌跡數據;若大于最小停留時間閾值,則需要收集用戶訪問行為數據,用戶訪問行為數據主要是鼠標移動相關的數據,鼠標滑動軌跡數據可以反映用戶對當前頁面的主要關注點區(qū)域,通過鼠標滑動軌跡數據的分析準確獲得用戶在瀏覽當前網頁過程的關注點,再結合鼠標滑動軌跡數據對應的當前網頁頁面數據就可以進行興趣關聯(lián)的關鍵詞獲取,從而實現針對性的彈窗導向推薦,對于同一個用戶記錄其每次瀏覽網頁的彈窗導向推薦數據就可以形成用戶歷史興趣畫像數據;對于當前網頁不感興趣的彈窗導向推薦可以基于用戶歷史興趣畫像數據進行推薦引導;大幅提升用戶訪問行為分析的準確性,避免大水漫灌式的推薦導致用戶反感。