两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法及發(fā)現(xiàn)系統(tǒng)的制作方法

文檔序號:6638355閱讀:187來源:國知局
一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法及發(fā)現(xiàn)系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法及發(fā)現(xiàn)系統(tǒng),首先從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中的原始訪問日志中提取基礎(chǔ)數(shù)據(jù);然后對基礎(chǔ)數(shù)據(jù)進(jìn)行加工分類形成用戶信息和Cookie集相關(guān)聯(lián)的中間層數(shù)據(jù);接著對中間層數(shù)據(jù)進(jìn)行提取,抽取出登錄用戶的Cookie集,將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志得到登錄用戶的所有訪問信息集,進(jìn)而得到登錄用戶的IP集,將登錄用戶的IP集關(guān)聯(lián)IP地址庫得到登錄用戶在訪問互聯(lián)網(wǎng)時的地理位置;最后對新用戶的訪問信息集使用最大似然算法計算出該用戶最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置。本發(fā)明使用大量互聯(lián)網(wǎng)用戶的IP地址與現(xiàn)有IP地址庫進(jìn)行對比和自動補充、校驗,且效率高。
【專利說明】一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法及發(fā)現(xiàn)系統(tǒng)

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法及發(fā)現(xiàn)系統(tǒng),用于提供互聯(lián)網(wǎng)用戶地理位置的最大似然估計,屬于互聯(lián)網(wǎng)技術(shù)。

【背景技術(shù)】
[0002]在互聯(lián)網(wǎng)企業(yè)每天都有大量用戶點擊產(chǎn)生的訪問日志數(shù)據(jù),專利“一種基于IP地址信息獲取計算機精確地理位置信息的方法”(專利申請?zhí)?200710070601.x)通過訪問日志中的IP和IP地址庫匹配,可以即時知道每一條訪問行為所在國家、省份和城市地理信息。而專利“一種用于監(jiān)控網(wǎng)站訪客地理位置和訪問狀態(tài)的系統(tǒng)及方法”(專利申請?zhí)?200710101333.3)利用實時得到的用戶IP地理信息可實時監(jiān)控并展示網(wǎng)站訪客的詳細(xì)數(shù)據(jù)信息,也能夠有效地定位網(wǎng)站中的異常流量、惡意訪問源IP地址的地理位置與INTERNET注冊信息。
[0003]但是對于互聯(lián)網(wǎng)企業(yè)來講除了即時用戶地理位置外,還希望知道用戶中長期所在的主要地理位置,這對于相對穩(wěn)定的分析用戶、了解用戶及對用戶服務(wù)都非常需要。對于用戶中長期最可能的地理位置估計(下面我們統(tǒng)一稱為用戶最大似然地理位置)還面臨如下兩重挑戰(zhàn):
[0004]1、很多互聯(lián)網(wǎng)允許未登錄用戶進(jìn)行訪問,造成大量訪問日志的用戶身份信息為空,為了擴大分析樣本數(shù)據(jù),我們有必要為這部分?jǐn)?shù)據(jù)盡可能確定其用戶身份;
[0005]2、用戶涉及多地理位置訪問,我們還需要確定其最大似然地理位置。


【發(fā)明內(nèi)容】

[0006]發(fā)明目的:為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法及發(fā)現(xiàn)系統(tǒng),解析目前互聯(lián)網(wǎng)用戶中長期訪問網(wǎng)絡(luò)地理位置信息問題。
[0007]技術(shù)方案:為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:
[0008]一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法,首先從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中的原始訪問日志中按提取規(guī)則和提取周期提取基礎(chǔ)數(shù)據(jù);然后對基礎(chǔ)數(shù)據(jù)進(jìn)行加工分類形成用戶信息和Cookie集相關(guān)聯(lián)的中間層數(shù)據(jù);接著對中間層數(shù)據(jù)進(jìn)行提取,具體提取規(guī)則為:將中間層數(shù)據(jù)中未登錄用戶(登錄用戶名為空)的Cookie集置空,抽取出登錄用戶(登錄用戶名不為空)的Cookie集,將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志得到登錄用戶的所有訪問信息集,進(jìn)而得到將登錄用戶的IP集,將登錄用戶的IP集關(guān)聯(lián)IP地址庫得到登錄用戶在訪問互聯(lián)網(wǎng)時的地理位置,將得到的地理位置信息存儲到后臺服務(wù)器中并實時或周期性更新;最后對新用戶(登錄用戶和未登錄用戶)的訪問信息集使用最大似然算法計算出該用戶最經(jīng)?;顒拥牡乩砦恢茫黄渲?,基礎(chǔ)數(shù)據(jù)包括一定時長內(nèi)的非爬蟲的訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie信息,IP地址庫用于存放IP段對應(yīng)的地理位置信息。
[0009]上述發(fā)現(xiàn)方法具體包括如下步驟:
[0010](I)從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中的原始訪問日志中按提取規(guī)則和提取周期提取非爬蟲的訪問日志,該部分訪問日志包含用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie信息;
[0011](2)從步驟(I)獲得的部分訪問日志中抽取登錄用戶訪問日志,該登錄用戶訪問日志包含用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie信息;
[0012](3)從步驟(2)得到的登錄用戶訪問日志中提取登錄用戶的Cookie集;
[0013](4)將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志得到登錄用戶的所有訪問信息集,該訪問信息集包括用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie ;
[0014](5)建立IP地址庫用于存放IP段對應(yīng)的地理位置信息(國家、省份和城市),IP地址庫中的數(shù)據(jù)按照IP段遞增或遞減順序排列并建立代理關(guān)鍵字;
[0015](6)生成用戶訪問地理位置集,具體方法為:將步驟⑷獲取的登錄用戶的所有訪問信息集與步驟(5)獲得的IP地址庫相關(guān)聯(lián),生成用戶訪問地理位置集,該用戶訪問地理位置集包括登錄用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和地理位置;將用戶訪問地理位置集存儲到后臺服務(wù)器中并實時或周期性更新;
[0016](7)基于步驟(6)獲得的用戶訪問地理位置集,建立用戶最大似然地理位置算法;
[0017](8)使用步驟(7)得到的用戶最大似然地理位置算法對新的用戶(登錄用戶和未登錄用戶)的訪問信息集進(jìn)行計算,獲得該新的用戶最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置。
[0018]最大似然法也稱為最大概似估計,也叫極大似然估計,是一種具有理論性的點估計法,此方法的基本思想是:當(dāng)從模型總體隨機抽取η組樣本觀測值后,最合理的參數(shù)估計量應(yīng)該使得從模型中抽取該η組樣本觀測值的概率最大,而不是像最小二乘估計法旨在得到使得模型能最好地擬合樣本數(shù)據(jù)的參數(shù)估計量。上述發(fā)現(xiàn)方法使用最大似然法計算得到的最大似然地理位置可做穩(wěn)定用戶分析的重要指標(biāo)。比如,不同地理位置的用戶可能具有不同的行為習(xí)慣或興趣偏好,因此可根據(jù)用戶的最大似然位置為其打造貼合地域特征的個性化服務(wù)或營銷活動;最大似然地理位置還可預(yù)警用戶的非正常登錄,用戶在異地(除最大似然地理位置之外的地理位置)登陸時,可進(jìn)行預(yù)警,以防客戶的賬號出現(xiàn)被盜用等異常情況。
[0019]一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)系統(tǒng),包括數(shù)據(jù)信息采集存儲模塊、數(shù)據(jù)預(yù)處理模塊、用戶地理最大似然計算模塊、IP地址庫管理模塊和用戶最大似然地理結(jié)果存儲模塊,其中:
[0020]數(shù)據(jù)信息采集存儲模塊,從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中提取并存儲用戶的原始訪問日志,從原始訪問日志中提取并存儲基礎(chǔ)數(shù)據(jù);
[0021]數(shù)據(jù)預(yù)處理模塊,從基礎(chǔ)數(shù)據(jù)中提取登錄用戶的Cookie集,將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志,提取登錄用戶的IP集;
[0022]IP地址庫管理模塊,用于存儲以及管理從網(wǎng)絡(luò)采集到的純真版IP地址庫;
[0023]用戶地理最大似然計算模塊,通過登錄用戶的IP集以及純真版IP地址庫,利用最大似然地理位置算法計算新用戶最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置,并對結(jié)果進(jìn)彳T評估;
[0024]用戶最大似然地理結(jié)果存儲模塊,用于將新用戶的最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置計算結(jié)果顯示在終端顯示器界面。
[0025]上述發(fā)現(xiàn)系統(tǒng)中,各個模塊的結(jié)構(gòu)為:
[0026]數(shù)據(jù)信息采集存儲模塊,包括日志文件存儲管理子模塊和日志文件存儲子模塊;
[0027]數(shù)據(jù)預(yù)處理模塊,包括登錄用戶Cookie集提取子模塊和登錄用戶訪問IP集提取子模塊;
[0028]IP地址庫管理模塊,用于管理及維護(hù)IP段對應(yīng)國家、省份和城市;
[0029]用戶地理最大似然計算模塊,包括最大似然算法管理子模塊、最大似然計算子模塊和結(jié)果評估子模塊;
[0030]用戶最大似然地理結(jié)果存儲模塊,用于存儲用戶地理最大似然計算模塊的計算結(jié)果O
[0031]有益效果:本發(fā)明提供的互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法及發(fā)現(xiàn)系統(tǒng),相較于現(xiàn)有技術(shù),具有如下優(yōu)點:使用未登陸用戶的IP和Cookie關(guān)聯(lián)登陸用戶的訪問信息集(訪問信息集包括用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie)獲取未登陸用戶的訪問信息,從而計算出未登陸用戶的最大似然地理位置;使用大量互聯(lián)網(wǎng)用戶的IP地址與現(xiàn)有IP地址庫進(jìn)行對比和自動補充、校驗;整個過程只需要對IP地址庫掃描一次,效率高。

【專利附圖】

【附圖說明】
[0032]圖1為本發(fā)明實施例互聯(lián)網(wǎng)用戶地理位置發(fā)現(xiàn)裝置方法流程圖;
[0033]圖2為本發(fā)明實施例互聯(lián)網(wǎng)用戶地理位置發(fā)現(xiàn)裝置的結(jié)構(gòu)示意圖。

【具體實施方式】
[0034]為使本發(fā)明的實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面對本發(fā)明的地理位置發(fā)現(xiàn)系統(tǒng)(Locat1n Finding Device,LFD)中涉及的一些術(shù)語做簡單解釋。
[0035]數(shù)據(jù)源系統(tǒng):為LFD系統(tǒng)提供監(jiān)測基礎(chǔ)數(shù)據(jù)的系統(tǒng),包括日志管理系統(tǒng)、IP地址庫系統(tǒng)、Cookie數(shù)據(jù)庫維護(hù)系統(tǒng)等。
[0036]基礎(chǔ)數(shù)據(jù):是從數(shù)據(jù)源系統(tǒng)中抽取的為LFD系統(tǒng)所用的業(yè)務(wù)信息組合,基礎(chǔ)數(shù)據(jù)屬于“初級數(shù)據(jù)”,需要經(jīng)過LFD系統(tǒng)根據(jù)規(guī)則抽取為中間層數(shù)據(jù)。
[0037]中間層數(shù)據(jù):是從基礎(chǔ)數(shù)據(jù)中根據(jù)預(yù)先設(shè)定的規(guī)則抽取的為LFD系統(tǒng)所用的業(yè)務(wù)信息組合,中間層數(shù)據(jù)屬于“半成品數(shù)據(jù)”,并不直接提供給用戶作為地理位置信息使用,還需要經(jīng)過LFD系統(tǒng)根據(jù)預(yù)先設(shè)定的匹配算法模塊求解出最終地理位置結(jié)果。
[0038]Cookie:由服務(wù)器端生成,一般是發(fā)送給瀏覽器,瀏覽器會將Cookie的key/value保存到某個目錄下的文本文件內(nèi),下次請求同一網(wǎng)站時就發(fā)送該Cookie給服務(wù)器。Cookie名稱和值可以由服務(wù)器端開發(fā)自己定義,這樣服務(wù)器可以知道該用戶是否合法用戶以及是否需要重新登錄等,服務(wù)器可以設(shè)置或讀取Cookies中包含信息,借此維護(hù)用戶跟服務(wù)器會話中的狀態(tài)。
[0039]IP地址庫:存儲IP段對應(yīng)的大洲、國家、省份,城市等信息。
[0040]下面結(jié)合附圖對本發(fā)明作更進(jìn)一步的說明。
[0041]一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法,首先從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中的原始訪問日志中按提取規(guī)則和提取周期提取基礎(chǔ)數(shù)據(jù);然后對基礎(chǔ)數(shù)據(jù)進(jìn)行加工分類形成用戶信息和Cookie集相關(guān)聯(lián)的中間層數(shù)據(jù);接著對中間層數(shù)據(jù)進(jìn)行提取,具體提取規(guī)則為:將中間層數(shù)據(jù)中未登錄用戶(登錄用戶名為空)的Cookie集置空,抽取出登錄用戶(登錄用戶名不為空)的Cookie集,將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志得到登錄用戶的所有訪問信息集,進(jìn)而得到登錄用戶的IP集,將登錄用戶的IP集關(guān)聯(lián)IP地址庫得到登錄用戶在訪問互聯(lián)網(wǎng)時的地理位置,將得到的地理位置信息存儲到后臺服務(wù)器中每日更新;最后對新用戶(登錄用戶和未登錄用戶)的訪問信息集使用最大似然算法計算出該用戶最經(jīng)?;顒拥牡乩砦恢?;其中,基礎(chǔ)數(shù)據(jù)包括最近180天內(nèi)的非爬蟲的訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie信息,IP地址庫用于存放IP段對應(yīng)的地理位置信息。
[0042]如圖1所示為上述發(fā)現(xiàn)方法流程,具體包括如下步驟:
[0043](I)從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中的原始訪問日志中按提取規(guī)則和提取周期提取部分訪問日志,該部分訪問日志包含用戶訪問互聯(lián)網(wǎng)的時間、用戶名(可為空,用戶名為唯一標(biāo)識)、IP和Cookie彳目息;
[0044](2)從步驟(I)獲得的部分訪問日志中抽取登錄用戶訪問日志,該登錄用戶訪問日志包含用戶訪問互聯(lián)網(wǎng)的時間、用戶名(非空,用戶名為唯一標(biāo)識)、IP和Cookie信息;
[0045](3)從步驟(2)得到的登錄用戶訪問日志中提取登錄用戶的Cookie集;在具體應(yīng)用中,應(yīng)當(dāng)基于歷史數(shù)據(jù)統(tǒng)計,確定每個Cookie所映射的用戶名;
[0046](4)將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志得到登錄用戶的所有訪問信息集,該訪問信息集包括用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie ;
[0047](5)建立IP地址庫用于存放IP段對應(yīng)的地理位置信息(國家、省份和城市),IP地址庫中的數(shù)據(jù)按照IP段遞增或遞減順序排列并建立代理關(guān)鍵字;其中,IP地址庫包括IP段和IP段對應(yīng)的大洲、國家、省份,城市等信息,例如,192.168.16.165到192.168.16.187的IP段對應(yīng)的地名信息是中國江蘇省南京市;IP地址庫數(shù)據(jù)一般會在網(wǎng)絡(luò)上公開,可以直接下載到;目前較為常用的IP地址數(shù)據(jù)庫為(QQIP地址)純真版,純真版IP地址庫是一個壓縮文件包含了所有IP地址相關(guān)記錄,將命名為含有日期的文件壓縮文件并將數(shù)據(jù)抽取至后臺服務(wù)器中,方便以后更新數(shù)據(jù);
[0048](6)生成用戶訪問地理位置集,具體方法為:將步驟⑷獲取的登錄用戶的所有訪問信息集與步驟(5)獲得的IP地址庫相關(guān)聯(lián),生成用戶訪問地理位置集,該用戶訪問地理位置集包括登錄用戶訪問互聯(lián)網(wǎng)的時間、用戶名(非空,用戶名為唯一標(biāo)識)、IP和地理位置;將用戶訪問地理位置集存儲到后臺服務(wù)器中并實時或周期性更新;
[0049](7)基于步驟(6)獲得的用戶訪問地理位置集,建立用戶最大似然地理位置算法,比如用戶訪問IP最多的地理位置作為其常用地理位置,但不限于此;
[0050](8)使用步驟(7)得到的用戶最大似然地理位置算法對新的用戶(登錄用戶和未登錄用戶)的訪問信息集進(jìn)行計算,獲得該新的用戶最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置。
[0051]該方法使用大量互聯(lián)網(wǎng)用戶使用IP地址是否在同一城市訪問檢測其安全性,可為后期分析提供有力事實;使用大量互聯(lián)網(wǎng)用戶的IP地址與現(xiàn)有IP地址庫進(jìn)行對比和自動補充、校驗;整個過程只需要對IP地址庫掃描一次,效率高。
[0052]一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)系統(tǒng),包括數(shù)據(jù)信息采集存儲模塊、數(shù)據(jù)預(yù)處理模塊、用戶地理最大似然計算模塊、IP地址庫管理模塊和用戶最大似然地理結(jié)果存儲模塊,其中:
[0053]數(shù)據(jù)信息采集存儲模塊,從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中提取并存儲用戶的原始訪問日志,從原始訪問日志中提取并存儲基礎(chǔ)數(shù)據(jù);包括日志文件存儲管理子模塊和日志文件存儲子t吳塊;
[0054]數(shù)據(jù)預(yù)處理模塊,從基礎(chǔ)數(shù)據(jù)中提取登錄用戶的Cookie集,將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志,提取登錄用戶的IP集;包括登錄用戶Cookie集提取子模塊和登錄用戶訪問IP集提取子模塊;
[0055]IP地址庫管理模塊,用于存儲以及管理從網(wǎng)絡(luò)采集到的純真版IP地址庫,管理及維護(hù)IP段對應(yīng)國家、省份和城市;
[0056]用戶地理最大似然計算模塊,通過登錄用戶的IP集以及純真版IP地址庫,利用最大似然地理位置算法計算新用戶的最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置,并對結(jié)果進(jìn)行評估;包括最大似然算法管理子模塊、最大似然計算子模塊和結(jié)果評估子模塊;
[0057]用戶最大似然地理結(jié)果存儲模塊,用于將新用戶的最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置計算結(jié)果顯示在終端顯示器界面,存儲用戶地理最大似然計算模塊的計算結(jié)果。
[0058]以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出:對于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法,其特征在于:首先從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中的原始訪問日志中按提取規(guī)則和提取周期提取基礎(chǔ)數(shù)據(jù);然后對基礎(chǔ)數(shù)據(jù)進(jìn)行加工分類形成用戶信息和Cookie集相關(guān)聯(lián)的中間層數(shù)據(jù);接著對中間層數(shù)據(jù)進(jìn)行提取,具體提取規(guī)則為:將中間層數(shù)據(jù)中未登錄用戶的Cookie集置空,抽取出登錄用戶的Cookie集,將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志得到登錄用戶的所有訪問信息集,進(jìn)而得到將登錄用戶的IP集,將登錄用戶的IP集關(guān)聯(lián)IP地址庫得到登錄用戶在訪問互聯(lián)網(wǎng)時的地理位置,將得到的地理位置信息存儲到后臺服務(wù)器中并實時或周期性更新;最后對新用戶的訪問信息集使用最大似然算法計算出該用戶最經(jīng)?;顒拥牡乩砦恢?;其中,基礎(chǔ)數(shù)據(jù)包括一定時長內(nèi)的非爬蟲的訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie信息,IP地址庫用于存放IP段對應(yīng)的地理位置信息。
2.根據(jù)權(quán)利要求1所述的互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)方法,其特征在于:具體包括如下步驟: (1)從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中的原始訪問日志中按提取規(guī)則和提取周期提取非爬蟲的訪問日志,該部分訪問日志包含用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie信息; (2)從步驟(1)獲得的部分訪問日志中抽取登錄用戶訪問日志,該登錄用戶訪問日志包含用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie信息; (3)從步驟(2)得到的登錄用戶訪問日志中提取登錄用戶的Cookie集; (4)將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志得到登錄用戶的所有訪問信息集,該訪問信息集包括用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和Cookie ; (5)建立IP地址庫用于存放IP段對應(yīng)的地理位置信息; (6)生成用戶訪問地理位置集,具體方法為:將步驟(4)獲取的登錄用戶的所有訪問信息集與步驟(5)獲得的IP地址庫相關(guān)聯(lián),生成用戶訪問地理位置集,該用戶訪問地理位置集包括登錄用戶訪問互聯(lián)網(wǎng)的時間、用戶名、IP和地理位置;將用戶訪問地理位置集存儲到后臺服務(wù)器中并實時或周期性更新; (7)基于步驟(6)獲得的用戶訪問地理位置集,建立用戶最大似然地理位置算法; (8)使用步驟(7)得到的用戶最大似然地理位置算法對新的用戶的訪問信息集進(jìn)行計算,獲得該新的用戶最經(jīng)常或最可能的進(jìn)行生產(chǎn)經(jīng)營活動的地理位置。
3.—種互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)系統(tǒng),其特征在于:包括數(shù)據(jù)信息采集存儲模塊、數(shù)據(jù)預(yù)處理模塊、用戶地理最大似然計算模塊、IP地址庫管理模塊和用戶最大似然地理結(jié)果存儲模塊,其中: 數(shù)據(jù)信息采集存儲模塊,從網(wǎng)站平臺數(shù)據(jù)源系統(tǒng)中提取并存儲用戶的原始訪問日志,從原始訪問日志中提取并存儲基礎(chǔ)數(shù)據(jù); 數(shù)據(jù)預(yù)處理模塊,從基礎(chǔ)數(shù)據(jù)中提取登錄用戶的Cookie集,將登錄用戶的Cookie集關(guān)聯(lián)原始訪問日志,提取登錄用戶的IP集; IP地址庫管理模塊,用于存儲以及管理從網(wǎng)絡(luò)采集到的純真版IP地址庫; 用戶地理最大似然計算模塊,通過登錄用戶的IP集以及純真版IP地址庫,利用最大似然地理位置算法計算新用戶最經(jīng)常或最可能的進(jìn)行生產(chǎn)經(jīng)營活動的地理位置,并對結(jié)果進(jìn)行評估; 用戶最大似然地理結(jié)果存儲模塊,用于將新用戶的最經(jīng)?;蜃羁赡艿倪M(jìn)行生產(chǎn)經(jīng)營活動的地理位置計算結(jié)果顯示在終端顯示器界面。
4.根據(jù)權(quán)利要求3所述的互聯(lián)網(wǎng)用戶最大似然地理位置發(fā)現(xiàn)系統(tǒng),其特征在于: 數(shù)據(jù)信息采集存儲模塊,包括日志文件存儲管理子模塊和日志文件存儲子模塊; 數(shù)據(jù)預(yù)處理模塊,包括登錄用戶Cookie集提取子模塊和登錄用戶訪問IP集提取子模塊; IP地址庫管理模塊,用于管理及維護(hù)IP段對應(yīng)國家、省份和城市; 用戶地理最大似然計算模塊,包括最大似然算法管理子模塊、最大似然計算子模塊和結(jié)果評估子模塊; 用戶最大似然地理結(jié)果存儲模塊,用于存儲用戶地理最大似然計算模塊的計算結(jié)果。
【文檔編號】G06F17/30GK104484389SQ201410762954
【公開日】2015年4月1日 申請日期:2014年12月11日 優(yōu)先權(quán)日:2014年12月11日
【發(fā)明者】黃建鵬, 陳靜 申請人:焦點科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
无极县| 石家庄市| 琼海市| 无极县| 昌平区| 岳西县| 丰城市| 景德镇市| 新干县| 驻马店市| 九龙县| 上虞市| 定日县| 安化县| 桂阳县| 安岳县| 福泉市| 福州市| 屯昌县| 云南省| 南和县| 石首市| 长阳| 嘉黎县| 贵定县| 湖北省| 永顺县| 清流县| 台江县| 连平县| 江门市| 宣城市| 徐州市| 冀州市| 芒康县| 宁武县| 炉霍县| 宽甸| 岳阳县| 临汾市| 琼结县|