两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法與流程

文檔序號(hào):12034557閱讀:1894來源:國(guó)知局
一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法與流程

本發(fā)明屬于交通技術(shù)領(lǐng)域,具體涉及基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法。



背景技術(shù):

隨著我國(guó)城市化進(jìn)程的加快,城市交通問題日益突出,而城市軌道交通系統(tǒng)是解決大中城市公共交通的根本途徑,較為封閉且人群聚集量大。實(shí)時(shí)、準(zhǔn)確的軌道交通客流預(yù)測(cè)對(duì)城市軌道交通運(yùn)營(yíng)編組設(shè)計(jì)優(yōu)化至關(guān)重要。本研究提出將地鐵歷史客流數(shù)據(jù)與實(shí)時(shí)信息相結(jié)合,借助機(jī)器學(xué)習(xí)預(yù)測(cè)地鐵短時(shí)突發(fā)客流的方法。研究發(fā)現(xiàn),基于歷史客流與實(shí)時(shí)信息相結(jié)合的預(yù)測(cè),能夠精確穩(wěn)定地預(yù)測(cè)地鐵短時(shí)客流。

但是,現(xiàn)有的方法存在如下問題:

1、傳統(tǒng)的預(yù)測(cè)方法,預(yù)測(cè)結(jié)果精度不高。

2、現(xiàn)有預(yù)測(cè)精度較高的模型較為復(fù)雜,而且數(shù)據(jù)質(zhì)量要求高,甚至需要融合多源數(shù)據(jù)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供了一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法,其目的在于能夠在數(shù)據(jù)來源單一的條件下,借助機(jī)器學(xué)習(xí)方法建立較為簡(jiǎn)單的預(yù)測(cè)模型來預(yù)測(cè)地鐵短時(shí)客流,并且達(dá)到較高的預(yù)測(cè)精度。

一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法,包括以下步驟:

步驟一:獲取待統(tǒng)計(jì)的地點(diǎn)區(qū)間內(nèi)的所有地鐵刷卡記錄;

步驟二:根據(jù)步驟一的地鐵刷卡記錄,以乘客連續(xù)兩次的進(jìn)出站刷卡記錄分別為一次出行的o和d,統(tǒng)計(jì)每日的乘客的出行od,求出每日的地鐵客流的od分布;

步驟三:按照步驟二求出的od分布,統(tǒng)計(jì)每日待統(tǒng)計(jì)的地點(diǎn)區(qū)間內(nèi)所有地鐵區(qū)間在單位時(shí)間窗內(nèi)的客流;同時(shí),由步驟一中的地鐵刷卡記錄直接統(tǒng)計(jì)得到每日地鐵所有站點(diǎn)在單位時(shí)間窗內(nèi)的客流;

步驟四:構(gòu)建地鐵客流網(wǎng)絡(luò)g,以單位時(shí)間窗內(nèi)的地鐵站點(diǎn)客流為節(jié)點(diǎn),以單位時(shí)間窗內(nèi)的地鐵區(qū)間客流為邊的權(quán)重,建立地鐵客流網(wǎng)絡(luò)g;

步驟五:對(duì)于待統(tǒng)計(jì)的地點(diǎn)區(qū)間內(nèi)的每一個(gè)目標(biāo)地鐵區(qū)間,以步驟四中所建立的地鐵客流網(wǎng)絡(luò)g中的所有節(jié)點(diǎn)和邊作為其備選特征,取特征訓(xùn)練數(shù)據(jù)集d={(x1,y1),(x2,y2),…,(xn,yn)},xi∈rd,y∈r,矩陣x=(x1,x2,…,xn)t表示訓(xùn)練集樣本的x輸入,xi∈rd,其中r表示實(shí)數(shù),d表示維數(shù),矩陣y=(y1,y2,..,yn)t表示訓(xùn)練集樣本的y輸入,yn與xn對(duì)應(yīng),構(gòu)成一個(gè)樣本,n為樣本數(shù),利用遞歸特征消除算法作為特征選擇方法,找出目標(biāo)時(shí)間窗內(nèi)對(duì)每一目標(biāo)地鐵區(qū)間影響最大的前k個(gè)特征;

步驟六:利用梯度提升回歸樹方法建立回歸預(yù)測(cè)模型,將步驟五中挑選出的對(duì)目標(biāo)區(qū)間影響最大的前k個(gè)特征,作為回歸模型的輸入,納入后續(xù)的回歸預(yù)測(cè),此時(shí)輸入的樣本xi的維數(shù)是k維,目標(biāo)值列矩陣y=(y1,y2,..,yn)t與特征選擇方法中的目標(biāo)值一致。

所述的一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法,所述的步驟一中,地鐵刷卡記錄只選擇所有包括完整出行od的地鐵刷卡記錄。

所述的一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法,所述的步驟二中,以乘客的出行od為最短路徑出行od。

所述的一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法,所述的步驟五中,所述的遞歸特征消除算法包括以下步驟:

步驟1:初始化:原始特征集合s={1,2,…,d},特征排序集

步驟2:當(dāng)s不為空時(shí),執(zhí)行步驟3,否則結(jié)束遞歸特征消除算法并輸出特征排序集f;

步驟3:獲取候選特征集合的訓(xùn)練樣本即訓(xùn)練數(shù)據(jù)集:d={(x1,y1),(x2,y2),…,(xn,yn)},xi∈rd,d∈s,y∈r,作為輸入;

步驟4:利用線性回歸模型:yi=ω0+ω1xi1+ω2xi2+…+ωdxid,得到每個(gè)特征的重要程度,即線性回歸模型的系數(shù)ωk,k=1,2,…,d;

步驟5:找出排序準(zhǔn)則分?jǐn)?shù)最小的特征p=argminkωk,ωk表示第k個(gè)特征的排序準(zhǔn)則分?jǐn)?shù)即重要程度,此時(shí)對(duì)應(yīng)線性回歸的中的權(quán)重系數(shù),p表示當(dāng)前排序準(zhǔn)則分?jǐn)?shù)最小的特征,argminkωk表示整個(gè)函數(shù)取最小值時(shí),自變量k的取值,即p;

步驟6:更新特征集f={p}∪f;

步驟7:在s中去除特征s=s/p,返回步驟2。

所述的一種基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法,所述的步驟六中,所述的梯度提升回歸樹方法包括以下步驟:

步驟1:初始化估計(jì)一個(gè)使損失函數(shù)極小化的常數(shù)值,其中常數(shù)值c要使得的值最小,即c和yi接近,此時(shí)f0(x)是只有一個(gè)節(jié)點(diǎn)的樹;

步驟2:迭代地建立m棵提升樹,以訓(xùn)練數(shù)據(jù)集d={(x1,y1),(x2,y2),…,(xn,yn)},x∈rk,y∈r作為輸入,其中矩陣x=(x1,x2,…,xn)t表示訓(xùn)練集樣本的x輸入,xi∈rk,其中維數(shù)為k維,列矩陣y=(y1,y2,..,yn)t表示訓(xùn)練集樣本的y輸入,yn與xn對(duì)應(yīng),構(gòu)成一個(gè)樣本,n為樣本數(shù);計(jì)算損失函數(shù)的負(fù)梯度在當(dāng)前模型的值其中i=1,…,n,為求導(dǎo)符號(hào),n為迭代次數(shù),并將它作為殘差的估計(jì)值;

步驟3:對(duì)于rmi擬合一棵回歸樹,得到第m棵樹的葉節(jié)點(diǎn)區(qū)域rmj,j=1,2,…,j,j為葉子節(jié)點(diǎn)個(gè)數(shù);對(duì)每個(gè)葉子節(jié)點(diǎn)循環(huán);

步驟4:利用線性搜索估計(jì)葉節(jié)點(diǎn)區(qū)域的值使損失函數(shù)極小化,更新其中rmj表示第m棵樹的葉節(jié)點(diǎn)區(qū)域;

步驟5:即為最終的模型。

本發(fā)明的技術(shù)效果在于,采用遞歸特征消除算法完成特征選擇,挑選出目標(biāo)區(qū)間在目標(biāo)時(shí)間窗內(nèi)的重要特征。采用梯度提升回歸樹方法建立回歸預(yù)測(cè)模型,實(shí)現(xiàn)地鐵短時(shí)客流預(yù)測(cè)。本方法可以在數(shù)據(jù)源單一的情況下,達(dá)到較高的預(yù)測(cè)精度。利用歷史數(shù)據(jù)建立回歸預(yù)測(cè)模型,結(jié)合實(shí)時(shí)數(shù)據(jù)預(yù)測(cè)地鐵短時(shí)客流,對(duì)城市軌道交通運(yùn)營(yíng)編組設(shè)計(jì)優(yōu)化提供幫助。

附圖說明

圖1為本發(fā)明所述基于機(jī)器學(xué)習(xí)的地鐵短時(shí)客流的預(yù)測(cè)方法的流程圖;

圖2應(yīng)用本方法預(yù)測(cè)深圳地鐵短時(shí)客流的結(jié)果展示圖,表示所有地鐵區(qū)間在一周內(nèi)平均相對(duì)誤差的概率分布。

圖3(a--f)應(yīng)用本方法預(yù)測(cè)深圳地鐵華僑城站至世界之窗站的短時(shí)客流,表示11月1日至11月6日每一天預(yù)測(cè)值與真值的客流對(duì)比情況。

具體實(shí)施方式

如圖1所示,本實(shí)施例的研究區(qū)域即待統(tǒng)計(jì)的地點(diǎn)區(qū)間選擇為深圳市,通過過濾深圳通地鐵拍卡數(shù)據(jù),清洗掉不滿足條件的記錄,并且假設(shè)每對(duì)od按照最短路徑出行,求出每日od分布,根據(jù)統(tǒng)計(jì)的單位時(shí)間窗內(nèi)地鐵區(qū)間客流和地鐵進(jìn)出站客流,生成深圳地鐵客流網(wǎng)絡(luò)。記錄起止時(shí)間分別為2014年10月1日和2014年12月31日,2014年深圳地鐵共有118個(gè)地鐵站點(diǎn),252個(gè)區(qū)間。選取十月的所有客流作為歷史數(shù)據(jù),通過遞歸特征消除算法挑選特征,并且建立回歸預(yù)測(cè)模型。十月平均每天約有3094757條刷卡記錄。具體實(shí)施方式包括以下步驟:

步驟一:獲取深圳地鐵拍卡數(shù)據(jù),清洗掉不滿足條件的記錄(用于本研究的數(shù)據(jù)須包含完整出行od)。

步驟二:基于深圳通拍卡數(shù)據(jù),乘客連續(xù)兩次的進(jìn)出站刷卡記錄分別為一次出行的o和d,統(tǒng)計(jì)每日乘客的出行od。假設(shè)每對(duì)od按照最短路出行,求出每日深圳地鐵客流的od分布。

步驟三:按照步驟二求出的od分布,統(tǒng)計(jì)每日所有深圳地鐵區(qū)間在單位時(shí)間窗內(nèi)的客流。同時(shí),由深圳通拍卡數(shù)據(jù)即步驟一中得到的包含完整出行od的拍卡數(shù)據(jù),直接統(tǒng)計(jì)得到每日深圳地鐵所有站點(diǎn)在單位時(shí)間窗內(nèi)的客流。本研究時(shí)間窗長(zhǎng)度設(shè)置為15min,考慮到地鐵運(yùn)營(yíng)時(shí)間,每日統(tǒng)計(jì)時(shí)間為6:00—24:00,因此全天共有96個(gè)時(shí)間窗。

步驟四:構(gòu)建深圳地鐵客流網(wǎng)絡(luò)g。2014年深圳地鐵共有118個(gè)地鐵站點(diǎn),252個(gè)地鐵區(qū)間,以單位時(shí)間窗內(nèi)的地鐵站點(diǎn)客流為節(jié)點(diǎn),以單位時(shí)間窗內(nèi)的地鐵區(qū)間客流為邊的權(quán)重,建立深圳地鐵客流網(wǎng)絡(luò)g。

步驟五:特征選擇。對(duì)于每一目標(biāo)地鐵區(qū)間,步驟四中所建立的深圳地鐵客流網(wǎng)絡(luò)g中的所有節(jié)點(diǎn)和邊作為其備選特征,利用遞歸特征消除算法,找出目標(biāo)時(shí)間窗內(nèi)對(duì)每一目標(biāo)地鐵區(qū)間影響最大的前k個(gè)特征。特征訓(xùn)練數(shù)據(jù)集d={(x1,y1),(x2,y2),…,(xn,yn)},x∈rd,y∈r.將10月所有客流納入特征選擇訓(xùn)練,n=31。其中,特征矩陣x(n×d)=(x1,x2,…,xn)t由整個(gè)深圳地鐵252個(gè)區(qū)間前1、2時(shí)間窗客流和118個(gè)地鐵站前1、2時(shí)間窗進(jìn)出站客流組成,總共包含976個(gè)備選特征,即特征維數(shù)d=976。具體表示為xn=(itervaliflowk,stajflowkin,stajflowkout),i=1,2,…,252;j=1,2,…,118;k=1,2詳情見表1:

表1備選特征詳情

目標(biāo)值列矩陣y=(y1,y2,..,yn)t由n天內(nèi)目標(biāo)區(qū)間在目標(biāo)時(shí)間窗內(nèi)的客流組成。本研究采用遞歸特征消除算法進(jìn)行特征選擇,具體實(shí)現(xiàn)過程見算法1:

步驟六:建立回歸預(yù)測(cè)模型。將步驟五中挑選出的對(duì)目標(biāo)區(qū)間影響最大的前k個(gè)特征,即深圳地鐵客流網(wǎng)絡(luò)g中對(duì)目標(biāo)區(qū)間最重要的節(jié)點(diǎn)和邊,作為回歸模型的輸入,納入后續(xù)的回歸預(yù)測(cè),此時(shí)輸入的樣本xi的維數(shù)是k維。目標(biāo)值列矩陣y=(y1,y2,..,yn)t由n天內(nèi)目標(biāo)區(qū)間在目標(biāo)時(shí)間窗內(nèi)的客流組成,與特征選擇方法的目標(biāo)值一致。本研究利用梯度提升回歸樹方法建立回歸預(yù)測(cè)模型,具體實(shí)現(xiàn)過程見算法2:

預(yù)測(cè)11月1日至11月7日所有區(qū)間在所有時(shí)間窗內(nèi)的客流,并將預(yù)測(cè)值與觀測(cè)值進(jìn)行比較。誤差衡量方法采用平均絕對(duì)百分誤差(mape),絕對(duì)百分比誤差方差(vape)以及均方根誤差(rmse),將單位時(shí)間窗內(nèi)的區(qū)間客流量按照不同等級(jí)分別計(jì)算誤差,即區(qū)間客流量在1000以下或2000以上或二者之間,結(jié)果如表2所示:

表2.預(yù)測(cè)誤差

求出11月1日至11月7日所有地鐵區(qū)間所有時(shí)間窗內(nèi)的預(yù)測(cè)值與真值相對(duì)誤差的平均值,其概率分布如圖2所示,94.4%的地鐵區(qū)間誤差在20%以內(nèi)。

以華僑城至世界之窗這一地鐵區(qū)間為例,將其每一天所有時(shí)間窗的客流預(yù)測(cè)值與真值比較,其結(jié)果如圖3所示,圖3.a—f分別表示11月1日至11月6日每天從早上6點(diǎn)至晚上24點(diǎn),客流預(yù)測(cè)值與真值的擬合情況,由圖可以看出預(yù)測(cè)結(jié)果精度較高。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
福建省| 塔河县| 彝良县| 万山特区| 胶州市| 沭阳县| 浦江县| 武鸣县| 牡丹江市| 都兰县| 旬阳县| 承德市| 德保县| 高清| 永善县| 沾益县| 筠连县| 灵台县| 澄迈县| 连山| 阿瓦提县| 寿光市| 永寿县| 望城县| 搜索| 南平市| 民乐县| 达孜县| 手游| 松原市| 佛学| 平塘县| 富民县| 通州区| 封开县| 宜川县| 邯郸县| 宁武县| 秦皇岛市| 鄂尔多斯市| 图木舒克市|