本發(fā)明涉及到異常行為模式識別
技術領域:
,特別是一種基于車輛軌跡的區(qū)域徘徊異常行為檢測方法。
背景技術:
:隨著信息化進程的加快,海量公路智能監(jiān)測設備(簡稱電子卡口)被部署在城市的各級公路之上,逐步形成了網絡化的車輛監(jiān)測格局,為基于車輛軌跡的異常行為檢測提供數據基礎。與此同時,計算機性能的快速提升,分布式處理技術的飛速發(fā)展,也為海量數據的分析處理提供技術保障。目前,車輛異常行為檢測研究大多是通過視頻圖像處理、模式識別等技術,直接識別車出輛的異常駕駛行為,如檢測監(jiān)控區(qū)域發(fā)生的違章逆行、變道、闖紅燈等危險行為。而針對公共安全領域的研究還很少,如車輛的區(qū)域徘徊異常行為檢測。徘徊異常行為主要是指:機動車輛在檢查站或重要機構、學校、高檔小區(qū)附近無目的性的來回移動的行為,這種異常行為看似無目的,卻很可能是為盜搶車輛、入室盜竊等違法犯罪行為做準備,蘊含很大的安全隱患。若本發(fā)明能從海量的車輛軌跡數據中識別出具有區(qū)域徘徊異常行為的車輛,然后結合該車輛的基本信息進行系統(tǒng)的分析與研判,無論對案件的案前預警還是案后分析均有重要意義。在已有文獻《基于車牌識別系統(tǒng)車輛軌跡的行為異常檢測》中,提出了一種基于圍繞質心累計轉動角度的異常徘徊行為檢測方法,通過計算某車輛的圍繞質心的累計轉動的角度(利用余弦公式)進行檢測,若轉動角度超過一定閾值,則判定該車輛在該區(qū)域內具有徘徊異常行為。然而針對某一目標徘徊的車輛軌跡并不一定會形成閉合曲線,很可能是雜亂無章并伴有一定時間停駐的軌跡。而且電子卡口的數量雖多,但并沒有達到全城無死角覆蓋的程度,采取這種方法發(fā)現的異常車輛多為在很大的環(huán)形區(qū)域內繞行的車輛,與公共安全領域所要發(fā)現的徘徊異常行為有一定差異,不能有效的發(fā)現危害公共安全的異常行為。技術實現要素:為解決上述技術問題,本發(fā)明提供了一種基于車輛軌跡的區(qū)域徘徊異常行為檢測方法,其包括以下步驟:(1)軌跡數據預處理:以天為單位,將城市內所有電子卡口的記錄數據匯總,所述記錄數據均以車牌號、卡口編號、時間戳的形式存儲于數據庫中,并對缺失值和噪音數據采用刪除操作;(2)生成車輛軌跡數據表VehicleTrajectory:定義2882個字段,分別為serialnumber、platenumber、1、2、3、...、2879、2880,將serialnumber和platenumber設置為聯合主鍵,其中serialnumber為序列號,platenumber為車牌號,剩余的2880個字段分別代表一個連續(xù)的時間區(qū)間,每個時間區(qū)間的時長相同;然后將經過預處理后的軌跡數據,讀入數據庫表格,最后生成車輛軌跡數據表;(3)根據區(qū)域徘徊異常行為的模式和已有數據的軌跡信息,提取車輛軌跡的屬性特征:包括途徑卡口頻次、途徑卡口數量、停滯卡口與頻繁卡口間距離、頻次的波動程度以及時間集中度;(4)針對所述五個車輛軌跡屬性特征,設置兩種閾值,分別為基于統(tǒng)計數據的閾值設定方法與基于專家經驗的閾值設定方法;(5)提取徘徊異常車輛常規(guī)信息:將車輛的屬性特征值與其對應的閾值進行比較,若該車輛所有屬性特征值均大于其閾值,則判定該車輛當天具有區(qū)域徘徊異常行為,并將其Outlier屬性標為1;同時,根據其車牌號提取車輛的軌跡數據及包括車輛信息、車主或租賃人員信息的基本信息。較佳地,所述數據預處理具體包括:車輛牌號數據預處理:根據預設的車牌編碼規(guī)則過濾特定的車輛,包括警車、軍車、政府公車、出租車、公交車;同時對過濾后的普通車輛車牌號碼使用單向Hash函數進行變換加密;卡口編號預處理:在預處理過程中需合并城市內具有相同功能的電子卡口,并進行統(tǒng)一編碼;時間數據預處理:將一天二十四小時的時間劃分為2880個小的時間區(qū)間,區(qū)間大小為30s,然后對所有時間區(qū)間進行統(tǒng)一編碼,編碼數字為1至2800;時間區(qū)間的編號轉換公式為:時*60*2+分*2+秒/30+1;根據所述時間編碼的轉換公式,將所有記錄數據中的時間轉化為編碼。較佳地,途徑卡口頻次的提取具體過程為:依次對每輛車經過各個卡口的頻次進行統(tǒng)計:FREij表示當天序列號為i輛車在j卡口被記錄的頻次,初始值為0;Bt表示時間編號為t的時間段內該車輛被記錄的卡口編號,若在該時刻車輛未被任意卡口所記錄,則Bt為0;同時,在統(tǒng)計的過程中要對其前一時刻的數據進行檢測,對t-1時刻的記錄進行檢測,若Bt=j且Bt-1=j,則忽略本條記錄,否則進行頻次累加,生成生成車輛軌跡頻次表;并將該車輛途徑卡口頻次最大值記為最頻繁卡口頻次FREi,存儲于車輛軌跡屬性表;途徑卡口數量的提取過程為:途徑卡口數量NUM是指車輛當天累計經過卡口的數量,若經過卡口數量少于一定閾值,則該車輛發(fā)生異常徘徊行為的概率很低,此處不予考慮;途徑卡口數量可直接對處理過的車輛軌跡頻次表中不為零的元素數量進行統(tǒng)計,并將其存儲于車輛軌跡屬性表;停滯卡口與頻繁卡口間距離D:將計算其停滯卡口與頻繁卡口間的歐式距離D,以防止將只是在住所附近出入頻繁的車輛誤判為徘徊異常車輛;停滯點是指在一定時間閾值內車輛未被任何電子卡口所記錄的點,出現在停滯點兩端的電子卡口即為該車輛的停滯卡口,由于某一車輛停滯卡口與頻繁卡口并不唯一,會產生多個D值,取其中最小值,作為該車輛停滯卡口與頻繁卡口間距離Di,并將其存儲于車輛軌跡屬性表;頻次的波動程度FL的提取過程為:根據車輛的行駛特征,即該類車輛在各個電子卡口被記錄的頻次的波動程度較小,且其經過頻繁卡口的時間集中程較低,添加兩個新的車輛軌跡屬性特征:頻次的波動程度以及時間集中度;頻次的波動程度FL是指車輛在各個電子卡口被記錄頻次的離散程度值,通過車輛途徑各個電子卡口頻次的標準差來進行計算;首先從車輛頻次表中提取該車輛的頻次數據,FREi(FREi1,FREi2,FREi3,…,FREin-1,FREin),刪除值為零的數據;然后計算剩余頻次數值的標準差作為該車輛途徑卡口頻次的波動程度FLi,并將其存儲于車輛軌跡屬性表;時間集中度CRN的提取過程為:時間集中度CRN是用來度量車輛通過某一頻繁卡口的時間集中程度,若集中程度較高,并超過一定閾值,則認為該車輛具有異常徘徊的嫌疑;通過滑動時間窗口來度量在一定時間閾值內車輛經過某一頻繁卡口的頻次,取其中最大值作為該車輛的時間集中度CRNi,并將其存儲于車輛軌跡屬性表。較佳地,所述基于統(tǒng)計數據的閾值設定方法為:根據格拉布斯(Grubbs)上側檢驗原理,對車輛的途徑卡口頻次FRE和頻次的波動程度FL兩個車輛軌跡屬性特征進行閾值設定,首先對頻次FRE進行設定:a)提取所有車輛的最頻繁卡口頻次FREi;b)計算樣本方差:c)確定檢出水平α,查表得到其臨界值G1-α(n);d)最后得到車輛途徑卡口頻次閾值FRE0:頻次波動程度的閾值FL0設定方法與頻次FRE設定方法相同;所述專家經驗的閾值設定方法為:其余屬性特征值包括NUM、D、CRN采用背對背的通信方式征詢專家小組成員的特征閾值設定,經過幾輪征詢,使專家小組的意見趨于集中,最后得到符合城市特性及交通常規(guī)的閾值設定值。本發(fā)明具有以下有益效果:1、本發(fā)明通過對軌跡數據的處理,實現了非閉合軌跡區(qū)域徘徊異常行為車輛的自動識別,從而合理的發(fā)現、控制和處置可能發(fā)生的案件,切實有效的維護了人民群眾的生命財產安全;2、現有軌跡數據通常是由數量不定的多維數據點序列表示,在實際的存儲和處理過程中會造成很大困擾,而本發(fā)明在表示車輛軌跡時,提出一種新的車輛軌跡數據表示和存儲形式——車輛軌跡數據表VehicleTrajectory,使數據在處理過程中更加直觀、便捷高效;3、本發(fā)明對區(qū)域徘徊異常行為進行深入理解和全面考慮,從軌跡數據(車牌ID,位置,時間)三個維度中提取出五個具體的行為特征屬性,并針對屬性特征設定合理的閾值,有效降低誤檢的概率,使異常檢測可解釋性更強,精確度更高。當然,實施本發(fā)明的任一產品并不一定需要同時達到以上所述的所有優(yōu)點。附圖說明為了更清楚地說明本發(fā)明實施例的技術方案,下面將對實施例描述所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1為本發(fā)明實施例提供的基于車輛軌跡的案前預警平臺整體構架圖。具體實施方式下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護的范圍。圖1展示了基于車輛軌跡的案前預警平臺整體構架,包含數據預處理、車輛異常行為檢測、案前預警綜合研判及可視化四部分。本發(fā)明涉及到的主要內容包括數據預處理及區(qū)域徘徊異常行為檢測,并將異常信息和車輛基本信息輸入到案前預警綜合研判模塊,為基于車輛軌跡的案前預警平臺的綜合研判和可視化展示提供有力的數據支持。下面結合附圖及實施例對本發(fā)明作進一步描述:實施例:一種基于車輛軌跡的區(qū)域徘徊異常行為自動識別方法,通過道路上海量的智能監(jiān)測設備以及車牌自動識別技術ANPR(automaticnumberplaterecognition)獲取城市內所有車輛的時空軌跡數據,并將數據讀取到區(qū)域徘徊異常行為檢測模塊中進行異常行為的自動識別和案前預警。在異常檢測過程中,模塊首先對城市內所有被記錄的軌跡數據進行預處理,包括特定車輛軌跡數據刪除及車牌加密、時間轉換、卡口轉碼等,并將預處理后的軌跡數據以車輛軌跡數據表的形式存儲于數據庫中;然后從生成的軌跡數據表中提取車輛的五個行為屬性特征,并與發(fā)明中智能設定的閾值進行比較,從而識別出具有徘徊異常行為的車輛;最后提取異常車輛周期內所有異常信息及其基本信息輸出到下一模塊,為整個案前預警的綜合研判和可視化展示提供數據支持。具體實施步驟如下:Step1輸入軌跡數據通過智能監(jiān)測設備以及車牌自動識別技術ANPR能夠獲取城市內所有車輛的時空軌跡數據,包含車輛的車牌號、通過卡口號以及通過的時間,然后以天為單位[00:00:00,24:00:00)將其匯總、輸入到軌跡數據預處理模塊中。Step2軌跡數據預處理由于本發(fā)明分析的主要對象是普通車輛,因此首先對輸入的軌跡數據中缺失值和異常值進行刪除處理,并根據國內車輛的車牌編碼規(guī)則過濾特定的車輛,如警車、軍車、政府公車、出租車、公交車等。隨后對車輛軌跡的三維數據(車牌id、卡口號、通過時間)分別進行處理:a)車牌號預處理;出于保護隱私的考慮,將對過濾后的普通車輛車牌號碼使用單向Hash函數進行加密變換。b)卡口編號預處理;由于城市內的主要交通線路通常會有多條車道,導致在某一路口以相同方向行駛的車輛會被記錄為不同的卡口號,給異常識別過程中頻繁卡口的發(fā)現造成不便。因此在預處理過程中將合并功能相同的卡口,對軌跡數據中的卡口號進行統(tǒng)一編碼。c)時間數據預處理;為了使生成的車輛軌跡方便數據庫存儲和計算,一天二十四小時的時間被劃分為2880個小的時間區(qū)間,然后按照其劃分的區(qū)間將軌跡數據中的時間轉換成統(tǒng)一的數字編碼的形式,轉換公式為:時*60*2+分*2+秒/30+1。然后將預處理過后的軌跡數據輸入到區(qū)域徘徊異常檢測模塊,進行區(qū)域徘徊異常行為自動識別。預處理:Step3生成車輛軌跡數據表VehicleTrajectory車輛軌跡通常被表示為一個軌跡點序列,但是由于每個軌跡點是一個多維數據點且軌跡點的數量不定,在實際的存儲和處理過程中會造成很大困擾。因此,在本發(fā)明中將軌跡數據以車輛軌跡數據表的形式存儲,數據表結構如下:包含2882個字段,分別為serialnumber、platenumber、1、2、3、...、2879、2880,其中serialnumber(序列號)和platenumber(車牌號)為聯合主鍵,剩余的2880個字段分別代表一個大小為30s的時間區(qū)間,即[00:00:00,00:00:30)、[00:00:30,00:01:00)、...、[23:59:00,23:59:30)、[23:59:30,24:00:00)。然后將經過預處理后的軌跡數據,如(******,B029,56),讀入數據庫表格,使VehicleTrajectory.56='B029'whereVehicleTrajectory.platenumber='******',最后生成車輛軌跡數據表:表1VehicleTrajectoryserialnumberplatenumber123...2878287928801******00B004...B016002******000...0003******0B1590...0004******000...B06400...........................Step4提取車輛i的行為屬性特征在生成車輛軌跡數據表后,模型將按序列號i對其中的軌跡數據逐條進行處理,提取車輛軌跡的行為屬性特征,分為下面五個步驟:Step4.1提取車輛i最頻繁卡口頻次FREi途徑卡口頻次FRE能夠表達出車輛經過某一電子卡口的頻繁程度,是識別區(qū)域徘徊異常的主要行為特征,遂對第i輛車經過各個卡口的頻次進行統(tǒng)計。其中,FREij表示當天序列號為i的車輛在j卡口被記錄的頻次,初始值為0;Bt表示時間編號為t的時間段內該車輛被記錄的卡口編號,若在該時刻車輛被j卡口所記錄,且前一時刻未被任意卡口所記錄,則FREij加1,否則不變。從而生成車輛軌跡頻次表,并將該車輛途徑卡口頻次最大值記為最頻繁卡口頻次FREi,存儲于車輛軌跡屬性表。表2車輛軌跡頻次表serialnumberplatenumberB001B002B003B004B005B006B007...1******0007010...2******0000000...3******1200002...4******2000008.................................Step4.2提取車輛i途徑卡口數量NUMi途徑卡口數量NUM是指車輛當天累計經過卡口的數量,將直接對處理過的車輛軌跡頻次表中不為零的元素數量進行統(tǒng)計,得到車輛i的途徑卡口數量NUMi,并將其存儲于車輛軌跡屬性表。Step4.3提取車輛i停滯卡口與頻繁卡口間距離Di為防止將只是在住所附近出入頻繁的車輛誤判為徘徊異常車輛,本發(fā)明將計算車輛停滯卡口與頻繁卡口間的距離Di。其中,(xi,fre,yi,fre)表示第i輛車頻繁卡口的坐標,(xi,stay,yi,stay)表示第i輛車停滯卡口的坐標。由于某一車輛停滯卡口與頻繁卡口并不唯一,需對它們進行遍歷產生多個D值,取其中最小值,作為該車輛停滯卡口與頻繁卡口間距離Di,并存儲于車輛軌跡屬性表。Step4.4提取車輛i頻次波動程度FLi為防止將一些活動較頻繁的車輛誤判為徘徊異常車輛,則需要根據其行駛特征提取車輛的頻次的波動程度FLi,即車輛在各個電子卡口被記錄頻次的離散程度值。首先從車輛頻次表中提取該車輛的頻次數據,FREi(FREi1,FREi2,FREi3,…,FREin-1,FREin),刪除值為零的數據。然后計算頻次序列的標準差作為該車輛途徑卡口頻次的波動程度FLi,存儲于車輛軌跡屬性表。Step4.5提取車輛i時間集中度CRNi時間集中度CRN是用來度量車輛通過某一頻繁卡口的時間集中程度,用時間長度為3h的滑動時間窗口來度量車輛經過某一頻繁卡口的頻次,并取其中最大值作為該車輛的時間集中度CRNi,存儲于車輛軌跡屬性表。Step5讀取各行為屬性特征閾值針對上述五個車輛軌跡屬性特征,本發(fā)明將給出閾值設定的計算方法以及專家設定的閾值。1)基于數據的閾值設定方法(FRE、FL)本發(fā)明將根據格拉布斯(Grubbs)原理,計算車輛的途徑卡口頻次FRE和頻次的波動程度FL兩個車輛軌跡屬性特征的閾值:(以FRE屬性特征為例,頻次波動程度的閾值FL0設定方法與其相同)a)提取所有車輛的最頻繁卡口頻次FREi;b)計算樣本方差:a)確定檢出水平α,查表得到其臨界值G1-α(n);b)最后得到車輛途徑卡口頻次閾值FRE0:2)基于專家經驗的閾值設定方法(NUM、D、CRN)其余屬性特征值(如NUM、D、CRN)只要在合理的閾值范圍內即可,因此采用背對背的通信方式征詢專家小組成員的特征閾值設定,經過幾輪征詢,使專家小組的意見趨于集中,最后得到符合城市特性及交通常規(guī)的閾值設定值(如NUM0、D0、CRN0)。最后,途徑卡口數量閾值NUM0設定為6,停滯卡口與頻繁卡口間距離閾值D0設定為2.5km,時間集中度閾值CRN0設定為FRE0/2。在一個周期內,閾值不變,僅計算一次,在處理過程中只需將結果讀入即可。Step6區(qū)域徘徊異常識別上述步驟已將車輛特征屬性信息從軌跡數據中提取出來,并存儲于車輛軌跡屬性表:表3車輛軌跡屬性表車牌號FRENUMDFLCRNOutlier******8125.2615.2051******6101.209.2520******692.569.5620******7212.3524.2330.....................然后,將車輛的屬性特征值與其對應的閾值進行比較,若該車輛所有屬性特征值均大于其閾值,則判定該車輛當天具有區(qū)域徘徊異常行為,并將其Outlier屬性標為1;否則將其Outlier屬性標為0,并執(zhí)行i++,檢測下一條軌跡數據。Step7輸出車輛基本信息提取Outlier為1的異常車輛軌跡信息,并根據其車牌號提取車輛的軌跡數據及其基本信息(包括車輛信息、車主或租賃人員信息),為整個案前預警模塊的綜合研判和可視化展示提供數據支持。Step8判斷i是否等于nn表示當天被記錄的機動車總量,若i<n,則i++處理下一條軌跡數據,返回步驟4;若i=n,則表示軌跡數據已經讀取完畢,結束整個流程。以上公開的本發(fā)明優(yōu)選實施例只是用于幫助闡述本發(fā)明。優(yōu)選實施例并沒有詳盡敘述所有的細節(jié),也不限制該發(fā)明僅為所述的具體實施方式。顯然,根據本說明書的內容,可作很多的修改和變化。本說明書選取并具體描述這些實施例,是為了更好地解釋本發(fā)明的原理和實際應用,從而使所屬
技術領域:
技術人員能很好地理解和利用本發(fā)明。本發(fā)明僅受權利要求書及其全部范圍和等效物的限制。當前第1頁1 2 3