两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法及系統(tǒng)的制作方法

文檔序號:6726611閱讀:246來源:國知局
專利名稱:一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法及系統(tǒng)的制作方法
一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法及系統(tǒng)技術(shù)領(lǐng)域
本發(fā)明屬于智能交通技術(shù)領(lǐng)域,尤其涉及一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法及系統(tǒng)。
背景技術(shù)
近年來城市機(jī)動車的數(shù)量急速增長,引發(fā)了許多諸如堵車、停車難、打車難等嚴(yán)重影響老百姓出行質(zhì)量的問題。同時城市的交通網(wǎng)絡(luò)也日趨復(fù)雜,對一個完善的管理系統(tǒng)的要求越來越高。在未來構(gòu)建智能城市的藍(lán)圖中,智能交通可謂是重中之重。智能交通最核心的部分是了解機(jī)動車行駛的規(guī)律,并以此進(jìn)行路段規(guī)劃和交通管理。智能交通的實(shí)現(xiàn)必然是建立在對大量車輛的真實(shí)行駛數(shù)據(jù)進(jìn)行海量數(shù)據(jù)分析之上的。車載GPS設(shè)備在城市交通中的普及使得獲取車輛的位置信息變?yōu)榭尚?。典型的例子如出租車的GPS信息。所有出租車都會將其行駛過程中的GPS數(shù)據(jù)傳送回出租車服務(wù)公司的服務(wù)器以方便總部調(diào)度,從而可以匯集大量遍布城市交通網(wǎng)絡(luò)的GPS信息。基于出租車行駛數(shù)據(jù)的交通相關(guān)的問題研究和服務(wù)開發(fā)已在政府、企業(yè)、和學(xué)術(shù)界展開。使用車輛的海量GPS數(shù)據(jù)要面臨的首要問題,是如何發(fā)現(xiàn)和處理大量數(shù)據(jù)中的異常元素。造成異常數(shù)據(jù)的原因是多方面的首先民用 GPS設(shè)備在精度上的限制使得GPS數(shù)據(jù)常散布在真實(shí)位置的一定范圍內(nèi);其次GPS設(shè)備會因?yàn)槿缍嗦窂?mult1-path effect)等GPS定位方法的問題給出偏差較大的GPS數(shù)據(jù) ’另外,GPS設(shè)備本身可能由于缺少維護(hù)并沒有正常工作,這在大量車輛的情況中還是較為常見的。使用錯誤的GPS數(shù)據(jù)會影響后續(xù)分析交通狀況的結(jié)果,因此對GPS數(shù)據(jù)中的異常元素進(jìn)行排除具有很重要的意義。
現(xiàn)有技術(shù)對GPS數(shù)據(jù)中的異常元素進(jìn)行排除的方法主要是借助GPS數(shù)據(jù)之外的信息來對GPS數(shù)據(jù)的好壞進(jìn)行判斷。例如,可獲取城市的范圍信息,包括出租車所服務(wù)的城市的邊界,以及在內(nèi)的山、河、湖、海等車輛無法通行的區(qū)域,從而可認(rèn)定越界或是在禁區(qū)的GPS數(shù)據(jù)為壞數(shù)據(jù);另外,可通過車輛的GPS數(shù)據(jù)計算該車的平均速度,如果此速度值異常大,比如遠(yuǎn)遠(yuǎn)高于機(jī)動車輛在城市內(nèi)的行駛限速,則可認(rèn)為此GPS數(shù)據(jù)存在錯誤。此外, 還有有不少研究使用道路匹配技術(shù),即一種借助城市地理信息(GIS)將所有的GPS數(shù)據(jù)點(diǎn)匹配到具體的城市道路上的技術(shù),并將難以合理匹配的GPS數(shù)據(jù)認(rèn)定為錯誤數(shù)據(jù)。上述方法中,使用城市范圍信息的方法十分粗糙,不能對在可行駛區(qū)域內(nèi)的GPS數(shù)據(jù)進(jìn)行判斷。使用計算車輛平均速度的方法可以判斷部分由多路徑原因產(chǎn)生的錯誤數(shù)據(jù)和非正常工作GPS 設(shè)備產(chǎn)生的錯誤數(shù)據(jù),但應(yīng)用范圍偏窄。使用GIS進(jìn)行道路匹配的方法不但要求精確的GIS 道路信息,而且在處理匹配時需要做大量的概率分析從而影響了方法的性能。
綜上,現(xiàn)有技術(shù)的對GPS數(shù)據(jù)中的異常元素進(jìn)行排除的方法需要借助GPS數(shù)據(jù)之外的信息來對GPS數(shù)據(jù)的好壞進(jìn)行判斷,并且判斷過程復(fù)雜。發(fā)明內(nèi)容
本發(fā)明實(shí) 施例的目的在于提供一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法,旨在解決現(xiàn)有技術(shù)的對GPS數(shù)據(jù)中的異常元素進(jìn)行排除的方法需要借助GPS數(shù)據(jù)之外的信息來對 GPS數(shù)據(jù)的好壞進(jìn)行判斷,并且判斷過程復(fù)雜的問題。
為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供如下技術(shù)方案
本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法,所述方法包括
獲取待分析的交通軌跡的GPS數(shù)據(jù);
確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域;
統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù);
分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑;
根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
本發(fā)明實(shí)施例還提供了一種交通估計數(shù)據(jù)中異常數(shù)據(jù)獲取系統(tǒng),所述方法包括
GPS數(shù)據(jù)獲取單元,用于獲取待分析的交通軌跡的GPS數(shù)據(jù);
確定單元,用于確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域;
統(tǒng)計單元,用于統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù);
分析單元,用于分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑;
異常數(shù)據(jù)獲取單元,用于根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
本發(fā)明實(shí)施例與現(xiàn)有技術(shù)相比,有益效果在于獲取待分析的交通軌跡的GPS數(shù)據(jù),確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域,統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù),分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑, 根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS 數(shù)據(jù)是否為異常數(shù)據(jù),異常數(shù)據(jù)判斷過程不需要依賴額外的數(shù)據(jù)庫,因此降低了使用數(shù)據(jù)庫的成本和數(shù)據(jù)分析過程的消耗,且實(shí)現(xiàn)過程簡單。



為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的I是本發(fā)明實(shí)施例一提供的交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法的實(shí)現(xiàn)的流程2是本發(fā)明實(shí)施例一提供的獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)的實(shí)3a是本發(fā)明實(shí)施例一提供的現(xiàn)有技術(shù)方法去除異常數(shù)據(jù)后的交通軌跡數(shù)據(jù)的3b是本發(fā)明實(shí)施例一提供的使用本發(fā)明方法去除異常數(shù)據(jù)后的交通軌跡數(shù)據(jù)附圖。
閱;
圖現(xiàn)的流程圖
圖示意圖;
圖的不意圖4是本發(fā)明實(shí)施例二提供的交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
本實(shí)施例提供了一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法,所述方法包括
獲取待分析的交通軌跡的GPS數(shù)據(jù);
確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū) 域;
統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù);
分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑;
根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域 中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
本發(fā)明實(shí)施例還提供了一種交通估計數(shù)據(jù)中異常數(shù)據(jù)獲取系統(tǒng),所述方法包括
GPS數(shù)據(jù)獲取單元,用于獲取待分析的交通軌跡的GPS數(shù)據(jù);
確定單元,用于確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面 積相等的子區(qū)域;
統(tǒng)計單元,用于統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù);
分析單元,用于分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑;
異常數(shù)據(jù)獲取單元,用于根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛 擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
以下結(jié)合具體實(shí)施例對本發(fā)明的實(shí)現(xiàn)進(jìn)行詳細(xì)描述
實(shí)施例一
圖1示出了本發(fā)明實(shí)施例一提供的交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法的實(shí)現(xiàn)的 流程圖,詳述如下
在SlOl中,獲取待分析的交通軌跡的GPS數(shù)據(jù);
本實(shí)施例中,GPS數(shù)據(jù)通常以(經(jīng)度、緯度)的形式表達(dá),可以作為以經(jīng)緯度繪制的 二維地圖上的點(diǎn)。
在S102中,確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相 等的子區(qū)域;
本實(shí)施例中,S102具體可以采用以下方式實(shí)現(xiàn)
1、確定所述GPS數(shù)據(jù)分布的最小矩形區(qū)域,所述矩形的豎邊平行于經(jīng)線,矩形的 橫邊平行于緯線;
2、以等距經(jīng)線族和等距緯線族將所述最小矩形區(qū)域劃分多個子區(qū)域,所述每個子 區(qū)域?yàn)榫匦巍?br> 本實(shí)施例中,所述最小區(qū)域及子區(qū)域的形狀可以為方形、圓形、矩形等,可以根據(jù) 實(shí)際處理需要確定不同的最小區(qū)域的形狀。
本實(shí)施例中,可以通過網(wǎng)格將所述區(qū)域劃分成多個子區(qū)域,優(yōu)選的,采用等間距網(wǎng) 格,劃分出大小相同的出子區(qū)域,從而為后續(xù)使用一致的判斷標(biāo)準(zhǔn)對所有子區(qū)域進(jìn)行處理 提供基礎(chǔ);另外通過等間距網(wǎng)格以任意設(shè)置每個子區(qū)域的大小,優(yōu)選的,每個子區(qū)域?yàn)榫匦?的最長邊的長度小于平均道路寬度的5倍,以保證每個子區(qū)域包含的道路軌跡基本上只有 一條,且該道路估計在該子區(qū)域內(nèi)近似呈現(xiàn)呈直線形,當(dāng)然,也不能太小至丟失道路軌跡的 方向信息。例如,可以設(shè)置每個子區(qū)域的最長邊的長度不超過200米,即大約五倍城市機(jī)動 車道路的平均寬度。
以下給出一個劃分的示例,但不以此示例的情況為限假設(shè)GPS數(shù)據(jù)分布的地理 區(qū)域的最小矩形區(qū)域?yàn)锳,矩形的豎邊平行于經(jīng)線,矩形的橫邊平行于緯線,矩形的經(jīng)度范 圍為(hmin,hmax),緯度范圍為(Ifflin, Ifflax),通過所述等距經(jīng)線族和等距緯線族劃分最小矩形 區(qū)域A成子區(qū)域集為I i=l, 2. . . NxM},其中,i為系統(tǒng)給每個子區(qū)域的唯一編號,M為經(jīng)線 方向劃分的子區(qū)域的個數(shù),N為緯線方向劃分的子區(qū)域的個數(shù),每個子區(qū)域亦為矩形區(qū)域。
在S103中,統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù);
本實(shí)施例中,在最小矩形區(qū)域的(hmin,hmax),緯度范圍為(lmin,Ifflax)內(nèi),確定所有子 區(qū)域%的邊界,對每個GPS數(shù)據(jù)點(diǎn)進(jìn)行判斷,判斷其所述的子區(qū)域,進(jìn)而統(tǒng)計每個子區(qū)域中 包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)。
本實(shí)施例中,因?yàn)榻煌ㄜ壽E數(shù)據(jù)量巨大,在統(tǒng)計過程中,優(yōu)選的,采用并行處理的 方式對每個GPS數(shù)據(jù)點(diǎn)進(jìn)行判斷。
進(jìn)一步的,可以使用Hadoop并行數(shù)據(jù)處理系統(tǒng)進(jìn)行GPS數(shù)據(jù)點(diǎn)的分析和整理,其 中,編號依靠Hadoop中的Map運(yùn)算,而通過Hadoop中的Reduce運(yùn)算獲取每個子區(qū)域包含的 GPS數(shù)據(jù)點(diǎn)的個數(shù),從而獲取一系列以子區(qū)域的編號命名的小文件,所述每個小文件包含屬 于一個子區(qū)域中的包含的GPS數(shù)據(jù)的信息,例如,GPS數(shù)據(jù)點(diǎn)的個數(shù),每個GPS數(shù)據(jù)點(diǎn)的經(jīng) 緯度信息,以及其它附加信息,例如在分析出租車軌跡時需要加入的點(diǎn)的時間戳和所屬車 輛的編號。在S104中,分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑;
在S104中,分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑。
本實(shí)施例中,優(yōu)選的,可以通過線性回歸分析,獲取與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹 配的虛擬路徑,例如,通過對每個子區(qū)域的GPS數(shù)據(jù)點(diǎn)進(jìn)行線性回歸分析,可以獲得與每個 子區(qū)域中GPS數(shù)據(jù)點(diǎn)最匹配的虛擬路徑的斜率。如果該子區(qū)域中存在一條真實(shí)道路,則擬 合虛擬路徑應(yīng)該與道路吻合;反之,如果該子區(qū)域不存在真實(shí)道路,其中的GPS數(shù)據(jù)點(diǎn)全部 是錯誤的數(shù)據(jù),此時獲取的虛擬路徑的方向隨機(jī)。
本實(shí)施例中,在分析過程中,優(yōu)選的,仍然可以采用并行處理的方式獲取與每個子 區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑。
進(jìn)一步的,仍然可以使用S103中提及的Hadoop的框架,具體的,可以將回歸分析 過程放于Reduce階段,獲取當(dāng)前子區(qū)域內(nèi)的GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑。
在S105中,根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取 每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
本實(shí)施例中,S105具體可以采用以下方式實(shí)現(xiàn),具體實(shí)現(xiàn)思想為首先每個子區(qū) 域必須包含足夠多的數(shù)據(jù)點(diǎn)才可繼續(xù)對其進(jìn)行分析,如果子區(qū)域包含的數(shù)據(jù)點(diǎn)非常多,則 認(rèn)為該子區(qū)域的可信度很高,可直接判斷該子區(qū)域包含正確信息;反之,如果該子區(qū)域包含的數(shù)據(jù)點(diǎn)的個數(shù)很少,可直接判斷該子區(qū)域包含的GPS數(shù)據(jù)為異常數(shù)據(jù),請參閱圖2示出了 本發(fā)明實(shí)施例一提供的獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)的實(shí)現(xiàn)的流程圖,詳 述如下
在S201中,判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個數(shù)是否大于第一閾值,若否,則執(zhí)行 S205,若是,則執(zhí)行S202。
在S202中,判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個數(shù)是否大于第二閾值,其中,所述第 一閾值小于第二閾值,若否,則執(zhí)行S203,若是,則執(zhí)行S204。
在S203中,判斷當(dāng)前子區(qū)域中所有GPS數(shù)據(jù)點(diǎn)與虛擬路徑的垂直距離的標(biāo)準(zhǔn)差是 否大于標(biāo)準(zhǔn)差閾值,若否,則執(zhí)行S204,若是,則執(zhí)行S205 ;
本實(shí)施例中,當(dāng)前子區(qū)域中所有GPS數(shù)據(jù)點(diǎn)與虛擬路徑的垂直距離的標(biāo)準(zhǔn)差的計 算過程如下計算所有GPS數(shù)據(jù)點(diǎn)與所述虛擬路徑的垂直距離,以及所有GPS數(shù)據(jù)點(diǎn)與所述 虛擬路徑的垂直距離的平均值,根據(jù)所述所有GPS數(shù)據(jù)點(diǎn)與所述虛擬路徑的垂直距離以及 所有GPS數(shù)據(jù)點(diǎn)與所述虛擬路徑的垂直距離的平均值計算所有GPS數(shù)據(jù)點(diǎn)與虛擬路徑的垂 直距離的標(biāo)準(zhǔn)差。
本實(shí)施例中,如果所有的GPS數(shù)據(jù)點(diǎn)都完美分布在真實(shí)道路之上,通過回歸分析 出的虛擬路徑等同于真實(shí)路徑,所有GPS數(shù)據(jù)點(diǎn)到虛擬路徑的垂直距離應(yīng)小于道路寬度的 一半,因此所求得的標(biāo)準(zhǔn)差應(yīng)同樣小于標(biāo)準(zhǔn)差閾值。如果標(biāo)準(zhǔn)差偏大,則表明子區(qū)域不存在 真實(shí)路徑的可能性為高。
在S204中,判定當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為正常GPS數(shù)據(jù)點(diǎn)。
在S205中,判定當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為異常GPS數(shù)據(jù)點(diǎn);
上述三個閾值第一閾值、第二閾值及標(biāo)準(zhǔn)差閾值的確定是通過對所有子區(qū)域相 關(guān)信息的統(tǒng)計分析得到的,具體可以使用的分析方法包括區(qū)間比例法,即分布在閾值分割 區(qū)間的GPS數(shù)據(jù)點(diǎn)個數(shù)滿足給定的比例。
以下給出數(shù)據(jù)通過本實(shí)施例提供的異常數(shù)據(jù)獲取方法對交通軌跡數(shù)據(jù)進(jìn)行處理 的結(jié)果數(shù)據(jù)來源于深圳市在2010年8月一個月內(nèi)20000輛出租車的運(yùn)營數(shù)據(jù),每輛出租 車每一分鐘向數(shù)據(jù)處理中心發(fā)送一條信息,信息格式為(緯度、經(jīng)度、車載狀態(tài)、時間)。數(shù)據(jù) 的存儲格式為普通文本文件。每一個文件儲存了一輛出租車以時間排序的GPS信息。全部 數(shù)據(jù)包含20000個文本文件,總大小約為50G??梢?,通過使用本發(fā)明方法,結(jié)合Hadoop分 布式文件處理系統(tǒng),全部數(shù)據(jù)可以在不超過20分鐘內(nèi)完成錯誤偵測和排除工作(取決于用 于存儲和分析數(shù)據(jù)的服務(wù)器性能),可以得到比傳統(tǒng)方法更好的結(jié)果。如下所示,圖3a為現(xiàn) 有技術(shù)方法去除異常數(shù)據(jù)后的交通軌跡數(shù)據(jù)的示意圖;圖3b為使用本發(fā)明方法去除異常 數(shù)據(jù)后的交通軌跡數(shù)據(jù)的示意圖??梢?,使用本發(fā)明方法約占總數(shù)20%的數(shù)據(jù)點(diǎn)得到了排 除,去除了大部分分布在合理道路之外的數(shù)據(jù)點(diǎn)。
本實(shí)施例中,獲取待分析的交通軌跡的GPS數(shù)據(jù),確定所述GPS數(shù)據(jù)分布的最小區(qū) 域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域,統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的 個數(shù),分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑,根據(jù)所述每個子區(qū)域中包含的GPS 數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù),異常數(shù)據(jù)判 斷過程不需要依賴額外的數(shù)據(jù)庫,因此降低了使用數(shù)據(jù)庫的成本和數(shù)據(jù)分析過程的消耗, 且實(shí)現(xiàn)過程簡單。
另外,本發(fā)明實(shí)施例中判斷過程中采用的相應(yīng)的技術(shù)手段還可以帶來以下有益效 果
1、通過劃分成多個細(xì)分的子區(qū)域,降低了個子區(qū)域之間的耦合度,從而使得對海 量數(shù)據(jù)的分析過程可以并行完成,通過并行處理方式處理每個子區(qū)域的GPS數(shù)據(jù),有效提 高了異常數(shù)據(jù)判斷的過程。
2、以城市道路寬度為尺度標(biāo)準(zhǔn)對城市的區(qū)域進(jìn)行矩形網(wǎng)格劃分,可以保證每個矩 形子區(qū)域內(nèi)包含的道路軌跡基本是唯一的,且呈直線。
3、結(jié)合GPS數(shù)據(jù)點(diǎn)在子區(qū)域的累積數(shù)量和虛擬路徑軌跡的統(tǒng)計分析相結(jié)合的綜 合判斷方法,可以有效提高對異常數(shù)據(jù)判斷的準(zhǔn)確率。
實(shí)施例二
圖4示出了本發(fā)明實(shí)施例二提供的交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取系統(tǒng)的結(jié)構(gòu)圖, 為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,該系統(tǒng)可以是內(nèi)置于交通估計處理 設(shè)備中的軟件單元、硬件單元或者軟硬結(jié)合單元。
所述方法包括GPS數(shù)據(jù)獲取單元41、確定單元42、統(tǒng)計單元43、分析單元44以及 異常數(shù)據(jù)獲取單元45。
GPS數(shù)據(jù)獲取單元41,用于獲取待分析的交通軌跡的GPS數(shù)據(jù);
確定單元42,用于確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個 面積相等的子區(qū)域;
統(tǒng)計單元43,用于統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù);
分析單元44,用于分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑;
異常數(shù)據(jù)獲取單元45,用于根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及 虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
可選的,所述確定單元42包括
確定模塊,用于確定所述GPS數(shù)據(jù)分布的最小矩形區(qū)域,所述矩形的豎邊平行于 經(jīng)線,矩形的橫邊平行于緯線;
劃分模塊,用于以等距經(jīng)線族和等距緯線族將所述最小矩形區(qū)域劃分多個子區(qū) 域,所述每個子區(qū)域?yàn)榫匦巍?br> 可選的,所述每個子區(qū)域?yàn)榫匦蔚淖铋L邊的長度小于平均道路寬度的2倍。
可選的,所述分析單元44,具體用于通過線性回歸分析,獲取與每個子區(qū)域中GPS 數(shù)據(jù)點(diǎn)匹配的虛擬路徑。
可選的,所述異常數(shù)據(jù)獲取單元45,具體用于判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個 數(shù)是否大于第一閾值;
若小于等于第一閾值,當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為異常GPS數(shù)據(jù)點(diǎn);
若大于第一閾值,則判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個數(shù)是否大于第二閾值時;
若小于等于第二閾值,則判斷當(dāng)前子區(qū)域中所有GPS數(shù)據(jù)點(diǎn)與虛擬路徑的垂直距 離的標(biāo)準(zhǔn)差是否大于標(biāo)準(zhǔn)差閾值,若小于等于標(biāo)準(zhǔn)差閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù) 點(diǎn)為正常GPS數(shù)據(jù)點(diǎn),若大于標(biāo)準(zhǔn)差閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為異常GPS數(shù)據(jù) 點(diǎn),其中,所述第一閾值小于第二閾值;
若大于第二閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為正常GPS數(shù)據(jù)點(diǎn)。
本發(fā)明實(shí)施例提供的交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取系統(tǒng)可以使用在前述對應(yīng)的 方法實(shí)施例一中,詳情參見上述實(shí)施例一的描述,在此不再贅述。
值得注意的是,上述系統(tǒng)實(shí)施例中,所包括的各個單元只是按照功能邏輯進(jìn)行劃 分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元的具體 名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。
另外,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述各實(shí)施例方法中的全部或部分步驟 是可以通過程序來指令相關(guān)的硬件來完成,相應(yīng)的程序可以存儲于一計算機(jī)可讀取存儲介 質(zhì)中,所述的存儲介質(zhì),如R0M/RAM、磁盤或光盤等。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法,其特征在于,所述方法包括 獲取待分析的交通軌跡的GPS數(shù)據(jù); 確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域; 統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù); 分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑; 根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其特征在于,所述確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域具體為 確定所述GPS數(shù)據(jù)分布的最小矩形區(qū)域,所述矩形的豎邊平行于經(jīng)線,矩形的橫邊平行于緯線; 以等距經(jīng)線族和等距緯線族將所述最小矩形區(qū)域劃分多個子區(qū)域,所述每個子區(qū)域?yàn)榫匦巍?br> 3.如權(quán)利要求2所述的方法,其特征在于,所述每個子區(qū)域?yàn)榫匦蔚淖铋L邊的長度小于平均道路寬度的2倍。
4.如權(quán)利要求1所述的方法,其特征在于,所述分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑具體為 通過線性回歸分析,獲取與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑。
5.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)具體為 判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個數(shù)是否大于第一閾值; 若小于等于第一閾值,當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為異常GPS數(shù)據(jù)點(diǎn); 若大于第一閾值,則判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個數(shù)是否大于第二閾值時;若小于等于第二閾值,則判斷當(dāng)前子區(qū)域中所有GPS數(shù)據(jù)點(diǎn)與虛擬路徑的垂直距離的標(biāo)準(zhǔn)差是否大于標(biāo)準(zhǔn)差閾值,若小于等于標(biāo)準(zhǔn)差閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為正常GPS數(shù)據(jù)點(diǎn),若大于標(biāo)準(zhǔn)差閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為異常GPS數(shù)據(jù)點(diǎn),其中,所述第一閾值小于第二閾值; 若大于第二閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為正常GPS數(shù)據(jù)點(diǎn)。
6.一種交通估計數(shù)據(jù)中異常數(shù)據(jù)獲取系統(tǒng),其特征在于,所述方法包括 GPS數(shù)據(jù)獲取單元,用于獲取待分析的交通軌跡的GPS數(shù)據(jù); 確定單元,用于確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域; 統(tǒng)計單元,用于統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù); 分析單元,用于分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑; 異常數(shù)據(jù)獲取單元,用于根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述確定單元包括 確定模塊,用于確定所述GPS數(shù)據(jù)分布的最小矩形區(qū)域,所述矩形的豎邊平行于經(jīng)線,矩形的橫邊平行于緯線;劃分模塊,用于以等距經(jīng)線族和等距緯線族將所述最小矩形區(qū)域劃分多個子區(qū)域,所述每個子區(qū)域?yàn)榫匦巍?br> 8.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述每個子區(qū)域?yàn)榫匦蔚淖铋L邊的長度小于平均道路寬度的5倍。
9.如權(quán)利要求6所述的系統(tǒng),其特征在于,分析單元,具體用于通過線性回歸分析,獲取與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑。
10.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述異常數(shù)據(jù)獲取單元,具體用于判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個數(shù)是否大于第一閾值; 若小于等于第一閾值,當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為異常GPS數(shù)據(jù)點(diǎn); 若大于第一閾值,則判斷當(dāng)前子區(qū)域的GPS數(shù)據(jù)點(diǎn)的個數(shù)是否大于第二閾值時; 若小于等于第二閾值,則判斷當(dāng)前子區(qū)域中所有GPS數(shù)據(jù)點(diǎn)與虛擬路徑的垂直距離的標(biāo)準(zhǔn)差是否大于標(biāo)準(zhǔn)差閾值,若小于等于標(biāo)準(zhǔn)差閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為正常GPS數(shù)據(jù)點(diǎn),若大于標(biāo)準(zhǔn)差閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為異常GPS數(shù)據(jù)點(diǎn),其中,所述第一閾值小于第二閾值; 若大于第二閾值,則當(dāng)前子區(qū)域的所有GPS數(shù)據(jù)點(diǎn)為正常GPS數(shù)據(jù)點(diǎn)。
全文摘要
本發(fā)明適用于智能交通技術(shù)領(lǐng)域,提供了一種交通軌跡數(shù)據(jù)中異常數(shù)據(jù)獲取方法及系統(tǒng),所述方法包括獲取待分析的交通軌跡的GPS數(shù)據(jù);確定所述GPS數(shù)據(jù)分布的最小區(qū)域,并將所述區(qū)域劃分成多個面積相等的子區(qū)域;統(tǒng)計每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù);分析與每個子區(qū)域中GPS數(shù)據(jù)點(diǎn)匹配的虛擬路徑;根據(jù)所述每個子區(qū)域中包含的GPS數(shù)據(jù)點(diǎn)的個數(shù)以及虛擬路徑,獲取每一子區(qū)域中的GPS數(shù)據(jù)是否為異常數(shù)據(jù)。本發(fā)明通過異常數(shù)據(jù)判斷過程不需要依賴額外的數(shù)據(jù)庫,因此降低了使用數(shù)據(jù)庫的成本和數(shù)據(jù)分析過程的消耗,且實(shí)現(xiàn)過程簡單。
文檔編號G08G1/00GK103035123SQ20121057239
公開日2013年4月10日 申請日期2012年12月25日 優(yōu)先權(quán)日2012年12月25日
發(fā)明者須成忠, 萬言易, 張帆, 李曄, 白雪 申請人:中國科學(xué)院深圳先進(jìn)技術(shù)研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
山东| 灵山县| 杨浦区| 汉中市| 刚察县| 怀化市| 喜德县| 甘谷县| 郧西县| 夹江县| 青川县| 丹巴县| 台中市| 长治县| 昌吉市| 绥芬河市| 南郑县| 喀喇沁旗| 镇宁| 托里县| 房产| 林甸县| 武强县| 依兰县| 辽阳县| 清镇市| 东城区| 垫江县| 日照市| 芦溪县| 林周县| 黄大仙区| 莱州市| 徐闻县| 新干县| 鱼台县| 霸州市| 西城区| 连南| 德州市| 尼木县|