專利名稱::基于手機(jī)信息的交通出行計算方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于交通規(guī)劃及管理中交通信息采集及處理領(lǐng)域,涉及一種利用手機(jī)信息計算交通小區(qū)間起訖點(diǎn)出行量和產(chǎn)生量吸引量的方法。
背景技術(shù):
:交通調(diào)查及出行分析是交通規(guī)劃與交通管理政策制定的基礎(chǔ)。目前居民出行調(diào)查工作主要通過人工入戶調(diào)查的方式進(jìn)行,采樣率低,采集分析過程較長。隨著城市交通建設(shè)的迅速發(fā)展,交通需求變化加快,對交通調(diào)查與分析工作的要求不斷提高,傳統(tǒng)的交通需求分析手段已無法滿足現(xiàn)狀需求。結(jié)合新技術(shù)手段的交通需求分析與規(guī)劃決策支持系統(tǒng)必將成為城市智能交通系統(tǒng)的一個重要發(fā)展領(lǐng)域。手機(jī)目前已經(jīng)成為廣泛使用的移動通信工具,當(dāng)手機(jī)移動或?qū)ν馔ㄐ艜r,會和附近的基站(Cdl)進(jìn)行通信,基站會記錄通信手機(jī)的編號、通信時間、通信類型和基站編號(CellID簡稱CI)傳回后臺數(shù)據(jù)管理中心。由于手機(jī)位置信息能夠通過基站表示手機(jī)用戶的位置和時間信息,經(jīng)特別處理,可以判斷用戶起訖點(diǎn),結(jié)合基站所屬交通小區(qū)(按地域人為劃分的區(qū)域),從而計算各個交通小區(qū)之間的出行量。相比其它交通采集系統(tǒng)來說,手機(jī)信息具有信息量多、覆蓋范圍大等特點(diǎn)。
發(fā)明內(nèi)容為了克服人工出行調(diào)查方法采樣率低,采集分析過程較長的缺點(diǎn),本發(fā)明提供了一種通過對手機(jī)移動信息的快速準(zhǔn)確的處理及計算得到小區(qū)的出行數(shù)據(jù)的方法。本發(fā)明中的交通出行數(shù)據(jù)包括各小區(qū)間起訖點(diǎn)出行量,各小區(qū)出行總產(chǎn)生量(從該小區(qū)到其他小區(qū)的出行總量)及吸引量(從其他小區(qū)到該小區(qū)的出行總量)。該法可有效解決目前存在的手機(jī)信息數(shù)據(jù)量巨大,導(dǎo)致處理過程中耗費(fèi)較多的時間和資源的問題,以及存在異常數(shù)據(jù)及無用數(shù)據(jù)、基站重疊或信號漂移、且信息上傳時間不連續(xù),計算精度難以保障的難點(diǎn)。手機(jī)上傳數(shù)據(jù)信息包括,用戶編號、事件類型、基站編號、基站經(jīng)緯度坐標(biāo)、上傳時間。事件類型對交通出行判斷影響很大,下面是事件類型的定義。<table>tableseeoriginaldocumentpage3</column></row><table>事件類型說明3開機(jī)4正常位置更新通話時,手機(jī)每變化一次基站,上報一次位置信息5尋呼響應(yīng)(被叫)6發(fā)短信7電話主叫8短信接收出行者在一天內(nèi)會經(jīng)過或停留在不同的空間位置,本發(fā)明中這些位置由上傳手機(jī)信息時的用戶所處的基站地理位置來反映,本發(fā)明將其稱為位置點(diǎn)。對于任一用戶,一天內(nèi)經(jīng)過或停留的位置點(diǎn)被劃分為兩類,經(jīng)過點(diǎn)及逗留點(diǎn),來描述用戶在其上所處的狀態(tài)。經(jīng)過點(diǎn)為出行者空間移動過程中短暫經(jīng)過的點(diǎn),逗留點(diǎn)是指出行者逗留時間較長的點(diǎn)(本發(fā)明中將逗留時間大于1小時的點(diǎn)視為用戶逗留點(diǎn),并將其起視為出行者出行的出發(fā)地點(diǎn)或目的地點(diǎn))。通過對手機(jī)上傳的移動信息的處理,可進(jìn)行逗留點(diǎn)及所在交通小區(qū)的判斷,進(jìn)而結(jié)合上傳時間可得到出行者一日內(nèi)的出行鏈(按時間序列的起訖點(diǎn)集合),通過對所有持有手機(jī)的出行者一日的所有出行進(jìn)行集計,可得出以持有手機(jī)的出行者為樣本的兩個小區(qū)間的日出行數(shù)量,即出行OD,以及各小區(qū)出行總產(chǎn)生量及吸引量。最后用通用統(tǒng)計方法進(jìn)行擴(kuò)樣后即可得到實際出行量。本發(fā)明在對手機(jī)信息讀取和按用戶分類后,以用戶為單位有針對性地對手機(jī)信息進(jìn)行篩選,去除異常及與出行計算無關(guān)的經(jīng)過點(diǎn),同時通過對手機(jī)上傳位置點(diǎn)的歸并及對逗留點(diǎn)進(jìn)行合理判斷,在保證計算準(zhǔn)確的同時又提高處理效率。本發(fā)明提供的方法具體包括如下步驟步驟一交通小區(qū)信息及基站信息的裝載及匹配程序從數(shù)據(jù)庫中讀入以經(jīng)緯度坐標(biāo)為基礎(chǔ)的交通小區(qū)的平面多邊形地理信息和基站的點(diǎn)地理信息;根據(jù)各交通小區(qū)和基站的地理位置關(guān)系,即平面上多邊形與點(diǎn)的包含關(guān)系,將各個基站匹配到其所屬的各交通小區(qū)內(nèi),建立基站和交通小區(qū)的隸屬關(guān)系;步驟二將手機(jī)用戶的事件信息按用戶分離讀取數(shù)據(jù)庫手機(jī)用戶的事件信息數(shù)據(jù)記錄;以用戶為單位重新排列事件信息,對每個用戶而言,每次上傳事件信息稱為一次通信,每次通信對應(yīng)一個通信點(diǎn),按時間排序從0開始編號,每次通信所使用基站對應(yīng)的地理位置稱為一個位置點(diǎn);步驟三數(shù)據(jù)預(yù)處理l)過濾事件信息異常的非正常用戶采用兩種判斷方法過濾通信數(shù)據(jù)異常的非正常用戶(a)同一位置,一小時短信通信次數(shù)大于20次;(b)—天通信次數(shù)大于3004次;2)經(jīng)緯度重疊的基站及相鄰基站信號漂移的處理手機(jī)用戶空間位置的移動由基站的編號變化來體現(xiàn),而部分基站存在空間位置的重疊,或者過于臨近?;疚恢弥丿B或過于鄰近會造成在同一位置沒有移動(或在出行統(tǒng)計中可忽略的極短距離的移動)但基站編號有變化,從而影響這一位置逗留時間的計算,造成逗留點(diǎn)的丟失。另外手機(jī)信息上傳時存在的信號漂移的現(xiàn)象(即因信號強(qiáng)弱變化導(dǎo)致在同一位置沒有移動但基站編號有變化,表現(xiàn)為在多個相鄰基站之間往復(fù)跳躍)也會造成類似的結(jié)果。因此若不將重疊或過于鄰近的基站進(jìn)行歸并處理,則會與實際出行有重大的偏差。但如果對基站整體重新處理,使每一個位置有唯一的基站,則必須相應(yīng)的將手機(jī)記錄中的基站編號也作相應(yīng)的更正。這些工作對于有上萬個基站和每天上億條紀(jì)錄的數(shù)據(jù)量來說計算處理量相當(dāng)大。以用戶為單位,采用連續(xù)點(diǎn)距離判斷的方法,將經(jīng)緯度重疊的基站合并,同時通過設(shè)定閥值對因信號漂移導(dǎo)致多個在相鄰基站之間往復(fù)跳躍的位置點(diǎn)進(jìn)行整合;具體而言,對每個用戶從位置點(diǎn)0開始連續(xù)兩兩計算前后位置點(diǎn)的距離,如果距離小于所設(shè)定閾值,則將后一個位置點(diǎn)合并到前一個位置點(diǎn),將位置點(diǎn)對應(yīng)的基站編號改為上一個位置點(diǎn)的基站編號,并將上一位置點(diǎn)通信次數(shù)加1;3)去除經(jīng)過點(diǎn)經(jīng)過點(diǎn)為出行者空間移動過程中短暫經(jīng)過的點(diǎn),對出行量統(tǒng)計沒有實際意義。經(jīng)過步驟2)的位置點(diǎn)通信次數(shù)判斷后,將通信次數(shù)為1次并且事件類型不為1的位置點(diǎn)視為經(jīng)過點(diǎn)并予以剔除。這樣可以將相當(dāng)一部分用戶移動過程中的經(jīng)過點(diǎn)數(shù)據(jù)過濾,從而大大提高了系統(tǒng)的處理效率,節(jié)省了系統(tǒng)的資源。步驟四逗留點(diǎn)判斷l(xiāng))按信號時間差判斷逗留點(diǎn)對每個用戶,按時間順序逐個處理有多次通信的位置點(diǎn),計算每個位置點(diǎn)首次和末次所傳信號時間差,當(dāng)時間差大于逗留允許值,則判斷該位置點(diǎn)為逗留點(diǎn);2)按信號類型判斷逗留點(diǎn)手機(jī)待機(jī)狀態(tài)下同一基站位置上每隔l-2小時上報一次信息,此為周期位置更新,事件類型為l,因本發(fā)明中將逗留時間大于l小時的點(diǎn)視為用戶逗留點(diǎn)。因此對按時間順序連續(xù)僅有一次通信的位置點(diǎn),若其上傳事件類型為l,則該點(diǎn)也判斷為用戶逗留點(diǎn);步驟五交通小區(qū)間起訖點(diǎn)出行量及小區(qū)產(chǎn)生吸引量的計算將計算得到的所有逗留點(diǎn)按照時間順序排序,兩個連續(xù)逗留點(diǎn)所屬兩小區(qū)間起訖點(diǎn)出行量計l次。前一小區(qū)出行產(chǎn)生量計l次,后一小區(qū)出行吸引量計l次,最后將所有用戶小區(qū)間起訖點(diǎn)出行數(shù)量、小區(qū)出行產(chǎn)生量、小區(qū)出行吸引量進(jìn)行總計,得出以持有手機(jī)的出行者為樣本的小區(qū)間起訖點(diǎn)出行量及各小區(qū)總出行數(shù)據(jù)。本發(fā)明具有以下有益效果該發(fā)明的基礎(chǔ)數(shù)據(jù)來源于移動通信網(wǎng)絡(luò),相對傳統(tǒng)的抽樣調(diào)查方法,此種方法處理數(shù)據(jù)在手機(jī)普及率較高的情況下覆蓋范圍廣、數(shù)據(jù)源穩(wěn)定可靠、樣本量大大增加,而相應(yīng)的基礎(chǔ)設(shè)施建設(shè)要求低,費(fèi)用低廉,并且處理速度快,能夠滿足快速、動態(tài)獲取交通基礎(chǔ)信息的要求。以下結(jié)合和具體實施方式對本發(fā)明作進(jìn)一步的說明。圖1是本發(fā)明流程框圖;圖2是基站和交通小區(qū)分布示意圖;圖3是用戶位置點(diǎn)圖;圖4是交通小區(qū)出行計算結(jié)果示意圖。具體實施例方式本發(fā)明的具體實施流程如圖l所示,其中每個步驟都可通過計算機(jī)編制程序,對數(shù)據(jù)進(jìn)行處理實現(xiàn)。程序運(yùn)行硬件環(huán)境惠普xw8600Workstation,操作系統(tǒng)MicrosoftWindowsXPProfessionalx64Edition2003SP2,采用MicrosoftVisualStudio2005開發(fā)。具體執(zhí)行步驟如下步驟一交通小區(qū)信息及基站信息的裝載及匹配圖2為讀取的交通小區(qū)和基站數(shù)據(jù)在地圖上的顯示情況部分截圖,圖中的多邊形區(qū)域為交通小區(qū),區(qū)域中間的數(shù)字是交通小區(qū)編號。圖上黑色小圓圈為基站,每個基站有相應(yīng)的實際編號。根據(jù)基站和交通小區(qū)的位置關(guān)系,將各個基站匹配到小區(qū)內(nèi),建立基站和交通小區(qū)的隸屬關(guān)系。為了在圖中更清晰的表示,圖3是用戶位置點(diǎn)圖,位置點(diǎn)是以基站點(diǎn)的形式表示??招牡暮谏A圈為該位置只有一次上傳信息,實心的黑色小圓圈為該位置有多次上傳信息,對每個基站,通信公司對其有唯一的編號,即實際編號,圖中基站編號是為清楚說明本方法而定義的(稱圖中編號),用①、②、③、④等數(shù)字表示。在圖中可以看到每一個小區(qū)區(qū)域內(nèi)的基站經(jīng)過計算隸屬于各自小區(qū)。圖中基站①、②屬于小區(qū)628,基站③、⑤屬于小區(qū)627,屬于小區(qū)629。讀取數(shù)據(jù)庫手機(jī)數(shù)據(jù)記錄。步驟二將手機(jī)用戶的事件信息按用戶分離以用戶為單位把用戶所經(jīng)經(jīng)過或停留的空間位置點(diǎn)(由基站編號來描述)歸類,并以時間排序及編號,第一點(diǎn)編號為o。表1<table>tableseeoriginaldocumentpage6</column></row><table><table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table><table>tableseeoriginaldocumentpage9</column></row><table>如表1為按用戶分類處理后用戶〃3699677219144722116〃(加密后的用戶手機(jī)編號)一天按時間排序的位置點(diǎn)數(shù)據(jù)。該用戶手機(jī)數(shù)據(jù)經(jīng)整理后內(nèi)容包括位置點(diǎn)編號、基站編號、通信次數(shù)、通信類型、通信時間。其中位置點(diǎn)編號代表上傳時間的先后順序;基站編號和圖3中表示的基站編號一致;通信次數(shù)是在該位置發(fā)生信號的次數(shù),大于l的為多次通信點(diǎn),可視為逗留點(diǎn)。過濾通信數(shù)據(jù)異常的非正常用戶將在同一位置,一小時通信次數(shù)大于20次的用戶或一天通信次數(shù)大于300次的用戶剔除。合并重疊或相近的基站對每一用戶從位置點(diǎn)0開始連續(xù)兩兩計算前后位置點(diǎn)的距離,如果距離小于100米,則將后一個位置點(diǎn)合并到前一個位置點(diǎn),修改位置點(diǎn)對應(yīng)的基站編號改為上一個位置點(diǎn)的基站編號,并將上一位置點(diǎn)通信次數(shù)加1。表2<table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table>去除經(jīng)過點(diǎn)確定單一基站位置只有一次通信的點(diǎn)是經(jīng)過點(diǎn),在處理中將單基站上的非1事件類型的連續(xù)只有一次通信的數(shù)據(jù)去除。表3<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>如在表2中刪除編號為6至10、23至25、28至32、36至37的位置點(diǎn)。表3是刪除單一基站上的非1類通信類型的數(shù)據(jù)的結(jié)果,由圖中可以明顯顯示出用戶分別在圖編號②、⑨、@、⑨、⑨、⑨、②位置的停留情況。步驟四逗留點(diǎn)判斷按信號時間差判斷逗留點(diǎn)對每個用戶,按時間順序逐個處理有連續(xù)多次通信的位置點(diǎn),計算每個位置點(diǎn)首次和末次信號時間差,當(dāng)時間差大于逗留允許值(l小時),則判斷該位置點(diǎn)為逗留點(diǎn)。從表3預(yù)處理后的數(shù)據(jù)可對各個多通信點(diǎn)進(jìn)行判斷,②號點(diǎn)第一時間0:25:33和最后一個時間9:53:35之差大于l小時的允許值,說明用戶在這里停留時間很長,可以確定是一個逗留點(diǎn),所在小區(qū)為618號;⑨號點(diǎn)第一個時間11:27:32和最后時間13:48:55之差大于l小時的允許值,確定為逗留點(diǎn);(g)號點(diǎn)第一個時間14:11:48和最后一個時間14:38:06之差小于1小時,是經(jīng)過點(diǎn),不是逗留點(diǎn);⑨號點(diǎn)第一個時間14:40:46是和;⑨號點(diǎn)第一個時間11:27:32和最后時間13:48:55之差大于1小時的允許值,確定為逗留點(diǎn);⑨號點(diǎn)第一個時間16:36:23和最后時間18:43:52之差大于2小時,確定為逗留點(diǎn);⑨號點(diǎn)第一個時間21:56:18和最后時間22:21:33之差小于1小時,不是逗留點(diǎn);②號點(diǎn)第一時間22:41:35和最后一個時間23:48:22之差大于1小時確定為逗留點(diǎn)。判斷后可知表3中②、⑨、②為逗留點(diǎn)。對按時間順序連續(xù)僅有一次通信的位置點(diǎn),若其上傳事件類型為1,則該點(diǎn)可判斷為用戶逗留點(diǎn)。步驟五交通小區(qū)間起訖點(diǎn)出行量及小區(qū)產(chǎn)生吸引量的計算將計算得到的所有逗留點(diǎn)按照時間順序排序,兩個連續(xù)逗留點(diǎn)所屬兩小區(qū)間出行數(shù)量計1次。前一小區(qū)出行產(chǎn)生量記l次,后一小區(qū)出行吸引量記l次,最后將所有用戶小區(qū)間出行數(shù)量、小區(qū)出行產(chǎn)生量、小區(qū)出行吸引量進(jìn)行總計,得出以持有手機(jī)的出行者為樣本的小區(qū)間及各小區(qū)總出行數(shù)據(jù)。本實施例中示例用戶逗留點(diǎn)排列順序為②、⑨、②,出行順序為②到⑨,⑨到②。根據(jù)所屬交通小區(qū)為628小區(qū)到215小區(qū),215小區(qū)到628小區(qū)(見圖7)。為此,618小區(qū)到215小區(qū)出行量累加1,215小區(qū)到628小區(qū)出行量累加1。618小區(qū)產(chǎn)生量加1,215小區(qū)吸引量加1,215小區(qū)產(chǎn)生量加1。628小區(qū)吸引量加1。對所有用戶都以此法計算,最后集計,則可得全部出行量。權(quán)利要求一種基于手機(jī)信息的交通出行計算方法,通過讀取數(shù)據(jù)庫中的交通小區(qū)信息和基站信息,確定兩者之間的隸屬關(guān)系,再將手機(jī)用戶的事件信息按用戶分別進(jìn)行預(yù)處理和逗留點(diǎn)的判斷,進(jìn)而計算交通小區(qū)間的出行量和各小區(qū)的交通產(chǎn)生吸引量,其特征在于包括以下步驟步驟一交通小區(qū)信息及基站信息的裝載及匹配程序從數(shù)據(jù)庫中讀入以經(jīng)緯度坐標(biāo)為基礎(chǔ)的交通小區(qū)的平面多邊形地理信息和基站的點(diǎn)地理信息;根據(jù)各交通小區(qū)和基站的地理位置關(guān)系,即平面上多邊形與點(diǎn)的包含關(guān)系,將各個基站匹配到其所屬的各交通小區(qū)內(nèi),建立基站和交通小區(qū)的隸屬關(guān)系;步驟二將手機(jī)用戶的事件信息按用戶分離讀取數(shù)據(jù)庫手機(jī)用戶的事件信息數(shù)據(jù)記錄;以用戶為單位重新排列事件信息,對每個用戶而言,每次上傳事件信息稱為一次通信,每次通信對應(yīng)一個通信點(diǎn),按時間排序從0開始編號,每次通信所使用基站對應(yīng)的地理位置稱為一個位置點(diǎn);步驟三數(shù)據(jù)預(yù)處理1)過濾事件信息異常的非正常用戶采用兩種判斷方法過濾通信數(shù)據(jù)異常的非正常用戶(a)同一位置,一小時短信通信次數(shù)大于20次;(b)一天通信次數(shù)大于300次;2)經(jīng)緯度重疊的基站及相鄰基站信號漂移的處理以用戶為單位,采用連續(xù)點(diǎn)距離判斷的方法,將經(jīng)緯度重疊的基站合并,同時通過設(shè)定閥值對因信號漂移導(dǎo)致多個在相鄰基站之間往復(fù)跳躍的位置點(diǎn)進(jìn)行整合;具體而言,對每個用戶從位置點(diǎn)0開始連續(xù)兩兩計算前后位置點(diǎn)的距離,如果距離小于所設(shè)定閾值,則將后一個位置點(diǎn)合并到前一個位置點(diǎn),將位置點(diǎn)對應(yīng)的基站編號改為上一個位置點(diǎn)的基站編號,并將上一位置點(diǎn)通信次數(shù)加1;3)去除經(jīng)過點(diǎn)經(jīng)過步驟2)的位置點(diǎn)通信次數(shù)判斷后,將通信次數(shù)為1次并且事件類型不為1的位置點(diǎn)視為經(jīng)過點(diǎn)并予以剔除;步驟四逗留點(diǎn)判斷1)按信號時間差判斷逗留點(diǎn)對每個用戶,按時間順序逐個處理有多次通信的位置點(diǎn),計算每個位置點(diǎn)首次和末次所傳信號時間差,當(dāng)時間差大于逗留允許值,則判斷該位置點(diǎn)為逗留點(diǎn);2)按信號類型判斷逗留點(diǎn)對按時間順序連續(xù)僅有一次通信的位置點(diǎn),若其上傳事件類型為1,則該點(diǎn)也判斷為用戶逗留點(diǎn);步驟五交通小區(qū)間起訖點(diǎn)出行量及小區(qū)產(chǎn)生吸引量的計算將計算得到的所有逗留點(diǎn)按照時間順序排序,兩個連續(xù)逗留點(diǎn)所屬兩小區(qū)間起訖點(diǎn)出行量計1次;前一小區(qū)出行產(chǎn)生量計1次,后一小區(qū)出行吸引量計1次,最后將所有用戶小區(qū)間起訖點(diǎn)出行數(shù)量、小區(qū)出行產(chǎn)生量、小區(qū)出行吸引量進(jìn)行總計,得出以持有手機(jī)的出行者為樣本的小區(qū)間起訖點(diǎn)出行量及各小區(qū)總出行數(shù)據(jù)。全文摘要本發(fā)明涉及一種利用手機(jī)信息計算交通出行量的方法。該方法通過對手機(jī)信息的分析和處理,結(jié)合交通小區(qū)劃分計算出各個小區(qū)之間的出行信息,為交通規(guī)劃及管理提供依據(jù)。本發(fā)明的具體技術(shù)方案為首先由數(shù)據(jù)庫中讀取交通小區(qū)信息和基站信息,根據(jù)各自的地理位置建立相互之間的隸屬關(guān)系;對手機(jī)記錄按用戶將位置點(diǎn)歸類并進(jìn)行過濾非正常用戶及過濾無用信息等數(shù)據(jù)處理;通過上傳信息的時間差及事件類型判斷用戶的逗留點(diǎn),進(jìn)而通過兩兩連續(xù)逗留點(diǎn)計算交通小區(qū)間的出行量和各小區(qū)的交通產(chǎn)生吸引量。本方法無需人工入戶調(diào)查和數(shù)據(jù)后期統(tǒng)計處理,可節(jié)省大量的人力物力。文檔編號G08G1/01GK101692309SQ20091009203公開日2010年4月7日申請日期2009年9月4日優(yōu)先權(quán)日2009年9月4日發(fā)明者張新虎,王東柱,陳艷艷申請人:北京工業(yè)大學(xué)