一種基于低秩算法的路網(wǎng)交通數(shù)據(jù)的補(bǔ)全方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于智能交通的技術(shù)領(lǐng)域,具體地設(shè)及一種基于低秩算法的路網(wǎng)交通數(shù)據(jù) 的補(bǔ)全方法。
【背景技術(shù)】
[0002] 隨著城市車輛數(shù)目的持續(xù)上升,各種交通問題成為目前面臨和亟待解決的難 題。為了能對(duì)交通問題有更好的分析和處理,我國的大城市快速路和主干道逐漸設(shè)立了 各種交通流參數(shù)自動(dòng)獲取裝置,如感應(yīng)線圈檢測(cè)器、微波傳感器、視頻檢測(cè)器、GPS(global positionsystem)等,用于實(shí)時(shí)采集道路交通流的信息(車速、流量、占有率等),并通過對(duì) 采集信息的分析和處理,將實(shí)時(shí)動(dòng)態(tài)的信息服務(wù)于出行者。但是在對(duì)實(shí)際交通道路進(jìn)行動(dòng) 態(tài)的交通數(shù)據(jù)采集的過程中,由于交通傳感器的硬件故障、噪聲干擾或通信故障,往往會(huì)造 成數(shù)據(jù)異常和數(shù)據(jù)丟失等狀況,運(yùn)對(duì)交通問題的分析和解決將會(huì)產(chǎn)生十分不利的影響,如 交通出行的引導(dǎo)。因此,有效地分析交通規(guī)律,針對(duì)性地解決交通問題,就必須保證交通數(shù) 據(jù)的完整性。所W,在我們利用交通數(shù)據(jù)分析交通問題前,針對(duì)交通檢測(cè)設(shè)備所采集到的數(shù) 據(jù)可能出現(xiàn)的問題,有必要對(duì)丟失的交通數(shù)據(jù)進(jìn)行補(bǔ)全。
[0003] 交通數(shù)據(jù)(如路段速度、車流量等)的時(shí)空相關(guān)性由交通數(shù)據(jù)的時(shí)間性和空間性 兩部分構(gòu)成。交通數(shù)據(jù)的時(shí)間性通常也被稱作相似性,它是指同一路段上,通常在W年、月、 周、時(shí)、分為單位的周期上,交通數(shù)據(jù)會(huì)呈現(xiàn)出不同程度的相似性。交通數(shù)據(jù)的空間性通常 也被稱作相關(guān)性,因?yàn)槌鞘新肪W(wǎng)是W-個(gè)多方連通的復(fù)雜整體,因此各路段間的交通狀態(tài) 也相互制約著,對(duì)于路網(wǎng)中鄰近的幾個(gè)路段,它們各自的交通數(shù)據(jù)隨時(shí)間變化趨勢(shì)通常會(huì) 比較一致。
[0004] 近年來,機(jī)器學(xué)習(xí)領(lǐng)域吸引了越來越多的關(guān)注,其挖掘數(shù)據(jù)中隱含信息的能力為 交通數(shù)據(jù)補(bǔ)全引出了新的研究方向。稀疏表示基于一個(gè)原則,即一個(gè)信號(hào)往往可W由字典 中少量幾個(gè)信號(hào)的線性和來表示。大量的研究致力于構(gòu)造帶有特定屬性的字典。稀疏表示 模型在很多應(yīng)用領(lǐng)域都取得了極大的成功,如人臉識(shí)別、圖像去噪、圖像超分辨率重構(gòu)等。 在大多數(shù)稀疏表示方法中,人們只是獨(dú)立地考慮樣本的稀疏表示,然而數(shù)據(jù)間的關(guān)系和隱 含在數(shù)據(jù)集中的子空間結(jié)構(gòu)卻并沒有被考慮。事實(shí)上,運(yùn)些內(nèi)在的屬性在許多學(xué)習(xí)任務(wù)中 擁有非常重要的作用,特別是在樣本間相關(guān)性比較強(qiáng)的應(yīng)用中。因此,一些研究人員開始 了對(duì)數(shù)據(jù)樣本集進(jìn)行整體約束的研究,如低秩約束或核范數(shù)。低秩約束作為一種較為特殊 的稀疏約束已被J.Wri曲t、Y.Ma等人應(yīng)用在矩陣補(bǔ)全模型中并取得了非常好的實(shí)驗(yàn)效果, 該模型要求所研究的帶有數(shù)據(jù)缺失的矩陣具有低秩性,通過對(duì)矩陣中的元素經(jīng)過某種線性 (非線性)運(yùn)算后得到的值來對(duì)矩陣進(jìn)行補(bǔ)全,運(yùn)個(gè)過程中補(bǔ)全后的矩陣具有低秩性且重 構(gòu)誤差最小。 W05] 然而,傳統(tǒng)的低秩約束算法,如魯棒性主成分分析(RobustPrincipal ComponentsAnalysis,RPCA),是對(duì)重構(gòu)樣本集整體做低秩約束,缺乏微觀上樣本間的聯(lián) 系,如不同應(yīng)用場(chǎng)景下樣本所特有的性質(zhì)。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的技術(shù)解決問題是:克服現(xiàn)有技術(shù)的不足,提供一種基于低秩算法的路網(wǎng) 交通數(shù)據(jù)的補(bǔ)全方法,其補(bǔ)全的精準(zhǔn)度大幅提高,可W對(duì)不同類型的交通數(shù)據(jù)進(jìn)行補(bǔ)全。
[0007] 本發(fā)明的技術(shù)解決方案是:運(yùn)種基于低秩算法的路網(wǎng)交通數(shù)據(jù)的補(bǔ)全方法,該方 法包括W下步驟:
[0008] (1)構(gòu)造包括缺失點(diǎn)的交通數(shù)據(jù)矩陣;
[0009] (2)將低秩表示模型應(yīng)用到交通數(shù)據(jù)補(bǔ)全中,對(duì)缺失點(diǎn)進(jìn)行預(yù)填充;
[0010] (3)加入交通數(shù)據(jù)的時(shí)序信息作為其中的約束項(xiàng),從而更加精確的將缺失點(diǎn)補(bǔ)全。
[0011] 本發(fā)明將低秩表示模型應(yīng)用到了交通數(shù)據(jù)補(bǔ)全中,加入交通數(shù)據(jù)的時(shí)序信息作為 其中的約束項(xiàng),低秩表示嘗試尋找數(shù)據(jù)隱藏在高維空間中的稀疏屬性,通過對(duì)系數(shù)矩陣的 低秩約束,使得樣本被分到不同的子空間,在子空間內(nèi)對(duì)系數(shù)矩陣進(jìn)行時(shí)序約束,使得子空 間內(nèi)也具有相似性約束,因此補(bǔ)全的精準(zhǔn)度大幅提高,可W對(duì)不同類型的交通數(shù)據(jù)進(jìn)行補(bǔ) 全。
【附圖說明】
[0012] 圖1示出了根據(jù)本發(fā)明的基于低秩算法的路網(wǎng)交通數(shù)據(jù)的補(bǔ)全方法的流程圖;
[0013] 圖2示出了基于北京公路速度數(shù)據(jù)庫的數(shù)據(jù)補(bǔ)全相對(duì)百分誤差(MAP巧;
[0014] 圖3示出了基于北京公路速度數(shù)據(jù)庫的數(shù)據(jù)補(bǔ)全均方根相對(duì)誤差(RISE)。
【具體實(shí)施方式】
[0015] 通過對(duì)交通數(shù)據(jù)的分析,發(fā)現(xiàn)其具有很強(qiáng)的時(shí)空性,為了在重構(gòu)時(shí)強(qiáng)化運(yùn)種時(shí)空 的性質(zhì),決定引入低秩表示算法。
[0016] 與傳統(tǒng)的關(guān)于低秩約束的算法直接約束重構(gòu)樣本本身不同,低秩算法是在樣本自 表示的基礎(chǔ)上,對(duì)系數(shù)矩陣進(jìn)行低秩約束的。運(yùn)樣就可W對(duì)系數(shù)矩陣添加交通數(shù)據(jù)的時(shí)序 約束,即間接的對(duì)重構(gòu)樣本添加時(shí)序約束,使得算法更貼近交通數(shù)據(jù)補(bǔ)全的應(yīng)用。低秩表示 嘗試尋找數(shù)據(jù)隱藏在高維空間中的稀疏屬性,通過對(duì)系數(shù)矩陣的低秩約束,使得樣本被分 到不同的子空間,在子空間內(nèi)對(duì)系數(shù)矩陣進(jìn)行時(shí)序約束,使得子空間內(nèi)也具有相似性約束, 因此可W更加精確的估計(jì)缺失位置的值。
[0017] 為了獲取交通數(shù)據(jù)中的時(shí)序信息,采用了J.Gao等人提出的一種新型的序列數(shù)據(jù) 的子空間聚類模型(0SC),該模型主要目標(biāo)是從連續(xù)的子空間集合中分割數(shù)據(jù)。0SC模型旨 在尋找一組原始數(shù)據(jù)(連續(xù)視頻帖)的稀疏表示,考慮到相鄰的視頻帖間變化很小的特點(diǎn), 模型在稀疏子空間聚類的基礎(chǔ)上加入了一個(gè)新的帖間相似約束條件,使得相鄰帖的表達(dá)系 數(shù)盡可能的相似。考慮到同一路段上的一段時(shí)間內(nèi)固定時(shí)間間隔所采集的交通數(shù)據(jù)具有很 強(qiáng)的時(shí)間相似性,所W在傳統(tǒng)的低秩矩陣補(bǔ)全模型上增加時(shí)序性約束,提出了基于低秩表 示的交通數(shù)據(jù)補(bǔ)全模型。
[001引如圖1所示,運(yùn)種基于低秩算法的路網(wǎng)交通數(shù)據(jù)的補(bǔ)全方法,該方法包括W下步 驟:
[0019] (1)構(gòu)造包括缺失點(diǎn)的交通數(shù)據(jù)矩陣;
[0020] (2)將低秩表示模型應(yīng)用到交通數(shù)據(jù)補(bǔ)全中,對(duì)缺失點(diǎn)進(jìn)行預(yù)填充;
[0021] (3)加入交通數(shù)據(jù)的時(shí)序信息作為其中的約束項(xiàng),從而更加精確的將缺失點(diǎn)補(bǔ)全。
[0022] 本發(fā)明將低秩表示模型應(yīng)用到了交通數(shù)據(jù)補(bǔ)全中,加入交通數(shù)據(jù)的時(shí)序信息作為 其中的約束項(xiàng),低秩表示嘗試尋找數(shù)據(jù)隱藏在高維空間中的稀疏屬性,通過對(duì)系數(shù)矩陣的 低秩約束,使得樣本被分到不同的子空間,在子空間內(nèi)對(duì)系數(shù)矩陣進(jìn)行時(shí)序約束,使得子 空間內(nèi)也具有相似性約束,因此補(bǔ)全的精準(zhǔn)度大幅提高,可W對(duì)不同類型的交通數(shù)據(jù)進(jìn)行 補(bǔ)全。
[0023]優(yōu)選地,步驟(2)、(3)結(jié)合的帶有約束項(xiàng)的低秩表示模型為公式(1)
[0024]
( 1 )
[00對(duì)其中X=技1,X2,…,\]eΙΤ%含有噪聲和數(shù)據(jù)缺失的待補(bǔ)全數(shù)據(jù)矩陣,D為 路段個(gè)數(shù),Ν為連續(xù)的時(shí)間間隔數(shù)(D,Ν為變量X的維度);|| ·Ml,2表示矩陣中每一列元 素的12范數(shù)的和;ZeR胃為樣本X子表示的系數(shù);EeR重構(gòu)誤差矩陣,此處只使用 E的F范數(shù)約束;參數(shù)λ和β決定了各自約束項(xiàng)的強(qiáng)度,運(yùn)兩個(gè)參數(shù)的選擇應(yīng)該在誤差, 秩,平滑度Ξ項(xiàng)中權(quán)衡,從而獲得最好的實(shí)驗(yàn)效果。矩陣Re 1是一個(gè)=對(duì)角矩陣,矩陣 的對(duì)角線除首位元素外都為2,其上層和下層的對(duì)角線元素都為-1,
[0026]
[0027]ZR=[Zi_Z2, 2Z2-Zi_Z3,…,2Zn i-Zn-Zn2, Zn_ZnJ。
[0028] 優(yōu)選地,使用增廣拉格朗日算法對(duì)公式(1)進(jìn)行求解,首先將E用約束條件替換, 則公式(1)為 畫
(2)
[0030] 分離公式(2)中的Z,令S=Z,U=SR,則公式(2)等價(jià)的轉(zhuǎn)化為 閨]
(3)
[0032] 構(gòu)造公式(3)的增廣拉格朗日乘子函數(shù)為
[0033]
[0034] 其