本技術(shù)屬于數(shù)據(jù)處理,尤其涉及一種用戶位置的補(bǔ)全方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著移動(dòng)互聯(lián)網(wǎng)和位置服務(wù)技術(shù)發(fā)展,用戶位置數(shù)據(jù)呈現(xiàn)出指數(shù)級(jí)的增長(zhǎng),這些數(shù)據(jù)包含了豐富的時(shí)空行為信息,對(duì)于用戶行為分析、個(gè)性化服務(wù)推薦、潛在風(fēng)險(xiǎn)預(yù)警等方面具有重要的價(jià)值。然而,由于設(shè)備故障、網(wǎng)絡(luò)不穩(wěn)定等因素,用戶位置軌跡數(shù)據(jù)往往存在缺失現(xiàn)象,這極大地限制了對(duì)用戶行為模式的全面理解和有效利用。
2、現(xiàn)有的位置軌跡分析方法大多局限于單一維度的時(shí)間序列分析或空間鄰近性挖掘,未能充分利用用戶行為數(shù)據(jù)的多維特性以及用戶與位置點(diǎn)、時(shí)間因素之間的復(fù)雜關(guān)系,如何提供一宗能夠綜合處理時(shí)空信息并有效填補(bǔ)用戶位置軌跡數(shù)據(jù)缺失的方法,以便更準(zhǔn)確地模擬和預(yù)測(cè)用戶行為,是目前急需解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)意在提供一種用戶位置的補(bǔ)全方法、裝置、終端設(shè)備和存儲(chǔ)介質(zhì),以解決現(xiàn)有技術(shù)中存在的不足,本技術(shù)要解決的技術(shù)問(wèn)題通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)。
2、第一個(gè)方面,本技術(shù)實(shí)施例提供一種用戶位置的補(bǔ)全方法,所述方法包括:
3、獲取用戶位置軌跡數(shù)據(jù);
4、根據(jù)預(yù)先訓(xùn)練好的位置補(bǔ)充模型,確定所述用戶位置軌跡數(shù)據(jù)中需要補(bǔ)全的位置軌跡數(shù)據(jù);其中,所述預(yù)先訓(xùn)練好的位置補(bǔ)充模型是采用原始位置軌跡數(shù)據(jù)對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練得到的;所述深度學(xué)習(xí)模型是基于圖神經(jīng)網(wǎng)絡(luò)和雙向編碼器建立的,所述位置補(bǔ)充模型用于軌跡數(shù)據(jù)中缺失部分進(jìn)行預(yù)測(cè)和填充;
5、根據(jù)所述需要補(bǔ)全的位置軌跡數(shù)據(jù),對(duì)所述用戶位置軌跡數(shù)據(jù)中的缺失部分進(jìn)行補(bǔ)充。
6、可選地,所述預(yù)先訓(xùn)練好的位置補(bǔ)充模型通過(guò)如下方式獲得:
7、獲取所述原始位置軌跡數(shù)據(jù);
8、對(duì)所述原始位置軌跡數(shù)據(jù)進(jìn)行預(yù)處理,得到樣本位置軌跡數(shù)據(jù)和測(cè)試位置軌跡數(shù)據(jù);
9、根據(jù)所述樣本位置軌跡數(shù)據(jù)對(duì)所述深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到所述位置補(bǔ)充模型;
10、根據(jù)測(cè)試位置軌跡數(shù)據(jù)和訓(xùn)練好的位置補(bǔ)充模型,確定用戶標(biāo)識(shí)、用戶位置點(diǎn)信息和時(shí)間的關(guān)聯(lián)關(guān)系;
11、根據(jù)所述關(guān)聯(lián)關(guān)系,確定所述樣本位置軌跡數(shù)據(jù)中缺失的位置信息。
12、可選地,所述深度學(xué)習(xí)模型通過(guò)如下方式獲得:
13、根據(jù)用戶位置點(diǎn)信息的節(jié)點(diǎn),確定圖結(jié)構(gòu);
14、根據(jù)node2vec算法和所述圖結(jié)構(gòu),確定所述節(jié)點(diǎn)之間的相似度信息、節(jié)點(diǎn)之間的邊和轉(zhuǎn)移概率的權(quán)重;
15、通過(guò)多層圖卷積網(wǎng)絡(luò)對(duì)節(jié)點(diǎn)進(jìn)行信息聚合,得到各個(gè)節(jié)點(diǎn)的高階抽象嵌入向量;
16、將用戶標(biāo)識(shí)映射成預(yù)設(shè)編碼信息,并通過(guò)多層感知機(jī),將所述預(yù)設(shè)編碼信息轉(zhuǎn)換成低維用戶嵌入向量;
17、利用預(yù)設(shè)時(shí)間序列嵌入方法,將訪問(wèn)時(shí)間點(diǎn)映射為時(shí)間嵌入向量;
18、將所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量,輸入雙向編碼器,得到輸出向量,并對(duì)所述輸出向量和所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量進(jìn)行拼接,構(gòu)建所述深度學(xué)習(xí)模型。
19、可選地,所述根據(jù)所述樣本位置軌跡數(shù)據(jù)對(duì)所述深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到所述位置補(bǔ)充模型,包括:
20、對(duì)輸入訪問(wèn)序列數(shù)據(jù)進(jìn)行隨機(jī)遮蔽,設(shè)置預(yù)設(shè)模擬缺失場(chǎng)景,其中,所述訪問(wèn)序列數(shù)據(jù)至少包括所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量;
21、采用bert模型的mlm任務(wù)對(duì)所述深度學(xué)習(xí)模型進(jìn)行訓(xùn)練;
22、通過(guò)多層編碼器,獲取所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量的上下文依賴關(guān)系,并根據(jù)所述上下文依賴關(guān)系對(duì)所述遮蔽位置進(jìn)行預(yù)測(cè);
23、通過(guò)mlp解碼器,將bert模型最后一層的輸出向量映射為用戶位置點(diǎn)信息的概率分布信息;
24、根據(jù)所述概率分布信息和預(yù)設(shè)分布信息,對(duì)所述深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到所述位置補(bǔ)充模型。
25、可選地,所述根據(jù)所述關(guān)聯(lián)關(guān)系,確定所述樣本位置軌跡數(shù)據(jù)中缺失的位置信息,包括:
26、獲取所述位置補(bǔ)充模型的輸出結(jié)果;
27、將所述模型輸出結(jié)果中概率值大于預(yù)設(shè)值的位置信息,確定為樣本位置軌跡數(shù)據(jù)中缺失的位置信息。
28、第二個(gè)方面,本技術(shù)實(shí)施例提供一種用戶位置的補(bǔ)全裝置,所述裝置包括:
29、獲取模塊,用于獲取用戶位置軌跡數(shù)據(jù);
30、確定模塊,用于根據(jù)預(yù)先訓(xùn)練好的位置補(bǔ)充模型,確定所述用戶位置軌跡數(shù)據(jù)中需要補(bǔ)全的位置軌跡數(shù)據(jù);其中,所述預(yù)先訓(xùn)練好的位置補(bǔ)充模型是采用原始位置軌跡數(shù)據(jù)對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練得到的;所述深度學(xué)習(xí)模型是基于圖神經(jīng)網(wǎng)絡(luò)和雙向編碼器建立的,所述位置補(bǔ)充模型用于軌跡數(shù)據(jù)中缺失部分進(jìn)行預(yù)測(cè)和填充;
31、補(bǔ)全模塊,用于根據(jù)所述需要補(bǔ)全的位置軌跡數(shù)據(jù),對(duì)所述用戶位置軌跡數(shù)據(jù)中的缺失部分進(jìn)行補(bǔ)充。
32、可選地,所述裝置還包括訓(xùn)練模塊,所述訓(xùn)練模塊用于:
33、獲取所述原始位置軌跡數(shù)據(jù);
34、對(duì)所述原始位置軌跡數(shù)據(jù)進(jìn)行預(yù)處理,得到樣本位置軌跡數(shù)據(jù)和測(cè)試位置軌跡數(shù)據(jù);
35、根據(jù)所述樣本位置軌跡數(shù)據(jù)對(duì)所述深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到所述位置補(bǔ)充模型;
36、根據(jù)測(cè)試位置軌跡數(shù)據(jù)和訓(xùn)練好的位置補(bǔ)充模型,確定用戶標(biāo)識(shí)、用戶位置點(diǎn)信息和時(shí)間的關(guān)聯(lián)關(guān)系;
37、根據(jù)所述關(guān)聯(lián)關(guān)系,確定所述樣本位置軌跡數(shù)據(jù)中缺失的位置信息。
38、可選地,所述訓(xùn)練模塊用于:
39、根據(jù)用戶位置點(diǎn)信息的節(jié)點(diǎn),確定圖結(jié)構(gòu);
40、根據(jù)node2vec算法和所述圖結(jié)構(gòu),確定所述節(jié)點(diǎn)之間的相似度信息、節(jié)點(diǎn)之間的邊和轉(zhuǎn)移概率的權(quán)重;
41、通過(guò)多層圖卷積網(wǎng)絡(luò)對(duì)節(jié)點(diǎn)進(jìn)行信息聚合,得到各個(gè)節(jié)點(diǎn)的高階抽象嵌入向量;
42、將用戶標(biāo)識(shí)映射成預(yù)設(shè)編碼信息,并通過(guò)多層感知機(jī),將所述預(yù)設(shè)編碼信息轉(zhuǎn)換成低維用戶嵌入向量;
43、利用預(yù)設(shè)時(shí)間序列嵌入方法,將訪問(wèn)時(shí)間點(diǎn)映射為時(shí)間嵌入向量;
44、將所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量,輸入雙向編碼器,得到輸出向量,并對(duì)所述輸出向量和所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量進(jìn)行拼接,構(gòu)建所述深度學(xué)習(xí)模型。
45、可選地,所述訓(xùn)練模塊用于:
46、對(duì)輸入訪問(wèn)序列數(shù)據(jù)進(jìn)行隨機(jī)遮蔽,設(shè)置預(yù)設(shè)模擬缺失場(chǎng)景,其中,所述訪問(wèn)序列數(shù)據(jù)至少包括所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量;
47、采用bert模型的mlm任務(wù)對(duì)所述深度學(xué)習(xí)模型進(jìn)行訓(xùn)練;
48、通過(guò)多層編碼器,獲取所述節(jié)點(diǎn)的高階抽象嵌入向量、所述低維用戶嵌入向量和所述時(shí)間嵌入向量的上下文依賴關(guān)系,并根據(jù)所述上下文依賴關(guān)系對(duì)所述遮蔽位置進(jìn)行預(yù)測(cè);
49、通過(guò)mlp解碼器,將bert模型最后一層的輸出向量映射為用戶位置點(diǎn)信息的概率分布信息;
50、根據(jù)所述概率分布信息和預(yù)設(shè)分布信息,對(duì)所述深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到所述位置補(bǔ)充模型。
51、可選地,所述訓(xùn)練模塊用于:
52、獲取所述位置補(bǔ)充模型的輸出結(jié)果;
53、將所述模型輸出結(jié)果中概率值大于預(yù)設(shè)值的位置信息,確定為樣本位置軌跡數(shù)據(jù)中缺失的位置信息。
54、第三個(gè)方面,本技術(shù)實(shí)施例提供一種終端設(shè)備,包括:至少一個(gè)處理器和存儲(chǔ)器;
55、所述存儲(chǔ)器存儲(chǔ)計(jì)算機(jī)程序;所述至少一個(gè)處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序,以實(shí)現(xiàn)第一個(gè)方面提供的用戶位置的補(bǔ)全方法。
56、第四個(gè)方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被執(zhí)行時(shí)實(shí)現(xiàn)第一個(gè)方面提供的用戶位置的補(bǔ)全方法。
57、本技術(shù)實(shí)施例包括以下優(yōu)點(diǎn):
58、本技術(shù)實(shí)施例提供的用戶位置的補(bǔ)全方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì),通過(guò)獲取用戶位置軌跡數(shù)據(jù);根據(jù)預(yù)先訓(xùn)練好的位置補(bǔ)充模型,確定所述用戶位置軌跡數(shù)據(jù)中需要補(bǔ)全的位置軌跡數(shù)據(jù);其中,所述預(yù)先訓(xùn)練好的位置補(bǔ)充模型是采用原始位置軌跡數(shù)據(jù)對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練得到的;所述深度學(xué)習(xí)模型是基于圖神經(jīng)網(wǎng)絡(luò)和雙向編碼器建立的,所述位置補(bǔ)充模型用于軌跡數(shù)據(jù)中缺失部分進(jìn)行預(yù)測(cè)和填充;根據(jù)所述需要補(bǔ)全的位置軌跡數(shù)據(jù),對(duì)所述用戶位置軌跡數(shù)據(jù)中的缺失部分進(jìn)行補(bǔ)充,實(shí)現(xiàn)了對(duì)用戶位置軌跡數(shù)據(jù)的精確補(bǔ)全,不僅提高了用戶行為預(yù)測(cè)的準(zhǔn)確性和完整性,而且能更好地理解和挖掘用戶在時(shí)空維度上的復(fù)雜行為模式,增強(qiáng)了對(duì)用戶行為特性的捕捉能力。