本發(fā)明涉及數(shù)據(jù)分析,具體而言,尤其涉及一種基于累積局部總效應(yīng)圖的乘客忠誠(chéng)度影響機(jī)理解析方法。
背景技術(shù):
1、城市公共交通服務(wù)質(zhì)量評(píng)價(jià)涉及多個(gè)關(guān)鍵維度,如線網(wǎng)站點(diǎn)布局、車輛運(yùn)行狀況、乘車環(huán)境、服務(wù)態(tài)度及票價(jià)政策,這些要素的服務(wù)質(zhì)量直接決定了乘客的出行體驗(yàn)與滿意度,并深刻影響著乘客對(duì)公共交通的忠誠(chéng)度。高忠誠(chéng)度不僅體現(xiàn)了乘客對(duì)公共交通服務(wù)的高度認(rèn)可和持續(xù)選擇,還為公共交通系統(tǒng)構(gòu)建了穩(wěn)定、可靠的客流基礎(chǔ),為其長(zhǎng)期運(yùn)營(yíng)和發(fā)展提供了有力保障。
2、值得注意的是,公共交通服務(wù)要素的質(zhì)量與乘客忠誠(chéng)度之間的關(guān)系并非簡(jiǎn)單的線性對(duì)應(yīng),而是呈現(xiàn)出復(fù)雜的非線性特征。即某一服務(wù)要素質(zhì)量的輕微變動(dòng),都可能引發(fā)乘客忠誠(chéng)度的顯著波動(dòng)。因此,深入探究城市公共交通服務(wù)中各維度要素的服務(wù)質(zhì)量如何影響乘客的公共交通忠誠(chéng)度,兼具重要的理論和現(xiàn)實(shí)意義。在理論層面,這一研究有助于揭示公共交通服務(wù)質(zhì)量與乘客忠誠(chéng)度之間的內(nèi)在作用機(jī)理,進(jìn)一步豐富和完善公共交通服務(wù)管理的理論體系;在實(shí)踐層面,該研究能為公共交通服務(wù)提供者提供科學(xué)的決策依據(jù),指導(dǎo)其優(yōu)化服務(wù)流程、提升服務(wù)質(zhì)量,從而有效增強(qiáng)乘客的公共交通忠誠(chéng)度,推動(dòng)公共交通系統(tǒng)的可持續(xù)發(fā)展。
3、在探討公共交通服務(wù)要素質(zhì)量與乘客忠誠(chéng)度之間的非線性關(guān)系時(shí),梯度提升決策樹、隨機(jī)森林等機(jī)器學(xué)習(xí)方法發(fā)揮了關(guān)鍵作用。這些方法不僅能處理復(fù)雜的非線性數(shù)據(jù)關(guān)系,還能通過(guò)其內(nèi)部機(jī)制揭示不同服務(wù)要素對(duì)乘客忠誠(chéng)度的影響程度。同時(shí),部分依賴圖(partial?dependence?plot)和累積局部效應(yīng)圖(accumulated?local?effects?plot)等獨(dú)立于模型的解釋方法也被廣泛應(yīng)用于可視化解析這些關(guān)系,為公共交通服務(wù)提供者提供直觀的決策支持。
4、部分依賴圖作為一種直觀的可視化工具,能夠展示一個(gè)或兩個(gè)特征如何影響機(jī)器學(xué)習(xí)模型的預(yù)測(cè)結(jié)果,其優(yōu)點(diǎn)在于直觀易懂、適用多種模型,并能揭示特征與預(yù)測(cè)結(jié)果之間的線性和非線性關(guān)系。然而,當(dāng)公共交通服務(wù)要素的質(zhì)量特征之間存在強(qiáng)相關(guān)性時(shí),部分依賴圖可能無(wú)法準(zhǔn)確反映這些要素對(duì)乘客忠誠(chéng)度的獨(dú)立影響,因?yàn)樗僭O(shè)計(jì)算部分依賴的特征與其他特征不相關(guān),這在實(shí)際應(yīng)用中往往不成立。
5、相比之下,累積局部效應(yīng)圖是一種能夠量化解釋變量對(duì)模型響應(yīng)變量平均影響的可視化工具,其優(yōu)點(diǎn)在于能在量化影響的同時(shí)解決特征之間的相關(guān)性問(wèn)題,并且也是一種模型無(wú)關(guān)的解釋方法。但累積局部效應(yīng)圖的不足在于未直接考慮解釋變量的值分布對(duì)結(jié)果的影響,這可能導(dǎo)致忽視數(shù)據(jù)稀疏區(qū)域、無(wú)法準(zhǔn)確反映全局效應(yīng)、難以解釋極端值的影響以及可能給出誤導(dǎo)性結(jié)論,同時(shí)也限制了其作為模型解釋工具的完整性。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)上述提出的技術(shù)問(wèn)題,而提供一種基于累積局部總效應(yīng)圖的乘客忠誠(chéng)度影響機(jī)理解析方法。本發(fā)明在繼承累積局部效應(yīng)圖能夠處理強(qiáng)相關(guān)性變量?jī)?yōu)勢(shì)的基礎(chǔ)上,進(jìn)一步創(chuàng)新性地融入了每個(gè)解釋變量的樣本得分值分布考量,從而能夠更精確、更全面地描繪公共交通服務(wù)要素質(zhì)量與乘客忠誠(chéng)度之間的實(shí)際關(guān)系。
2、本發(fā)明采用的技術(shù)手段如下:
3、一種基于累積局部總效應(yīng)圖的乘客忠誠(chéng)度影響機(jī)理解析方法,包括:
4、s1、收集多維度的公共交通服務(wù)要素質(zhì)量和乘客忠誠(chéng)度數(shù)據(jù);
5、s2、檢驗(yàn)s1中數(shù)據(jù)的信度和效度,并研究公共交通服務(wù)要素質(zhì)量屬性之間的相關(guān)性;
6、s3、對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,基于乘客忠誠(chéng)度測(cè)量模型計(jì)算乘客忠誠(chéng)度得分,構(gòu)建公共交通服務(wù)要素質(zhì)量與乘客忠誠(chéng)度之間的因果解析模型,捕捉服務(wù)要素質(zhì)量與乘客忠誠(chéng)度之間的關(guān)系,并利用數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練;
7、s4、利用累積局部總效應(yīng)分析公共交通服務(wù)中的各個(gè)維度要素的服務(wù)質(zhì)量對(duì)乘客忠誠(chéng)度的影響。
8、進(jìn)一步地,所述步驟s1具體包括:
9、所述乘客忠誠(chéng)度表示乘客根據(jù)其以往的出行經(jīng)驗(yàn),在未來(lái)選擇公共交通出行的持續(xù)意愿,將乘客忠誠(chéng)度用顯變量進(jìn)行量化分析,包括:未來(lái)將繼續(xù)使用公共交通出行、公共交通出行仍為首選出行方式、愿意向他人推薦公共交通服務(wù),以及即使具備購(gòu)車能力,公共交通仍為首選出行方式;
10、所述公共交通服務(wù)要素質(zhì)量包括乘客交通相關(guān)技術(shù)屬性感知服務(wù)質(zhì)量和乘客舒適性與安全性感知服務(wù)質(zhì)量?jī)蓚€(gè)方面,所述乘客交通相關(guān)技術(shù)屬性感知服務(wù)質(zhì)量表示乘客感知的用于滿足其基本需求的服務(wù)要素的質(zhì)量,包括:公共交通服務(wù)時(shí)間、換乘便利性、乘客往返站點(diǎn)的步行距離以及乘客在站點(diǎn)的候車時(shí)間;所述乘客舒適性和安全性的感知服務(wù)質(zhì)量表示乘客感知的與運(yùn)輸舒適性和安全性相關(guān)的服務(wù)質(zhì)量,包括:站點(diǎn)設(shè)施布置和候車環(huán)境、站點(diǎn)衛(wèi)生條件、運(yùn)行平穩(wěn)性、車內(nèi)的溫度、座椅的舒適性以及安全性。
11、進(jìn)一步地,所述信度用于檢驗(yàn)數(shù)據(jù)的內(nèi)部一致性,采用克朗巴赫系數(shù)檢驗(yàn)s1中乘客忠誠(chéng)度數(shù)據(jù)的信度,當(dāng)計(jì)算出的克朗巴赫系數(shù)大于0.7時(shí),表明乘客忠誠(chéng)度的數(shù)據(jù)具有可靠性;
12、所述效度用于檢測(cè)每個(gè)結(jié)構(gòu)下的顯變量是否能夠反映乘客忠誠(chéng)度所表示的內(nèi)容,所述效度在檢驗(yàn)的過(guò)程中,分別計(jì)算顯變量的kmo統(tǒng)計(jì)量、bartlett球形檢驗(yàn)的顯著性概率、平均方差提取量和組合信度值,當(dāng)計(jì)算結(jié)果都處在預(yù)設(shè)范圍內(nèi),且因子載荷大于0.5時(shí),表明乘客忠誠(chéng)度的數(shù)據(jù)具有效度。
13、進(jìn)一步地,所述相關(guān)性分析用于衡量公共交通服務(wù)要素質(zhì)量中兩個(gè)不同變量之間的相關(guān)性程度,當(dāng)變量之間的相關(guān)性系數(shù)大于0.7時(shí),表明變量間存在很強(qiáng)的相關(guān)性;當(dāng)相關(guān)性系數(shù)在0.4到0.7之間時(shí),表明變量間相關(guān)性較強(qiáng);小于0.4則表明相關(guān)性較弱;
14、通過(guò)相關(guān)性的計(jì)算結(jié)果驗(yàn)證公共交通服務(wù)要素質(zhì)量中變量之間的正相關(guān)性。
15、進(jìn)一步地,所述步驟s3具體包括:
16、所述預(yù)處理,用于對(duì)收集到的數(shù)據(jù)進(jìn)行清洗、整理和處理;
17、所述乘客忠誠(chéng)度測(cè)量模型構(gòu)建乘客忠誠(chéng)度與對(duì)應(yīng)的顯變量的測(cè)量模型,并基于路徑系數(shù)計(jì)算乘客忠誠(chéng)度得分;
18、所述公共交通服務(wù)要素質(zhì)量與乘客忠誠(chéng)度之間的因果解析模型,將公共交通服務(wù)要素質(zhì)量作為輸入,將乘客忠誠(chéng)度得分作為輸出,在模型訓(xùn)練的過(guò)程中采用網(wǎng)格搜索法和交叉驗(yàn)證法對(duì)參數(shù)進(jìn)行調(diào)優(yōu)操作,并利用平均絕對(duì)百分比誤差對(duì)模型的預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。
19、進(jìn)一步地,步驟s4具體包括:
20、s41、計(jì)算公共交通服務(wù)要素質(zhì)量中的變量在第k個(gè)區(qū)間對(duì)乘客忠誠(chéng)度產(chǎn)生的平均局部效應(yīng):
21、k=1,2,3,4,…k其中,xs代表當(dāng)前選定的部分依賴的公共交通服務(wù)要素質(zhì)量變量;xc代表除xs外其他解釋變量構(gòu)成的向量;將公共交通服務(wù)要素質(zhì)量變量的取值范圍劃分為一系列區(qū)間,k表示區(qū)間數(shù)量;zk+1表示第k+1個(gè)區(qū)間的下界取值,第k個(gè)區(qū)間的上界取值;表示位于第k個(gè)區(qū)間內(nèi)的數(shù)據(jù)樣本集合,表示數(shù)據(jù)樣本集合內(nèi)的樣本數(shù)量;i代表中的第i個(gè)數(shù)據(jù)樣本,代表集合中第i個(gè)數(shù)據(jù)樣本的其他解釋變量xc的得分情況;代表集合中第i個(gè)數(shù)據(jù)樣本的部分依賴變量xs的替代得分,令為可微函數(shù),用于表示機(jī)器學(xué)習(xí)模型,機(jī)器學(xué)習(xí)模型的輸入為公共交通服務(wù)中各維度要素的服務(wù)質(zhì)量,輸出為乘客的忠誠(chéng)度;x表示公共交通服務(wù)中各維度要素的服務(wù)質(zhì)量構(gòu)成的向量;表示xs在第k個(gè)區(qū)間對(duì)乘客的忠誠(chéng)度產(chǎn)生的平均局部影響;
22、s42、計(jì)算xs對(duì)響應(yīng)變量產(chǎn)生的累積局部總效應(yīng),即計(jì)算每個(gè)數(shù)據(jù)樣本的累積局部效應(yīng),以區(qū)間為單位進(jìn)行累積,形成累積局部總效應(yīng):
23、
24、s43、將s42中的累積局部效應(yīng)進(jìn)行標(biāo)準(zhǔn)化,顯示每個(gè)區(qū)間內(nèi)xs對(duì)響應(yīng)變量產(chǎn)生的累積局部總效應(yīng)的比例:
25、
26、其中,表示部分依賴變量xs對(duì)響應(yīng)變量產(chǎn)生的非標(biāo)準(zhǔn)化的累積局部總效應(yīng),fxs,k,tale(x)表示對(duì)mxs,k(x)進(jìn)行標(biāo)準(zhǔn)化后結(jié)果的累積百分比曲線。
27、較現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):
28、本發(fā)明提供的基于累積局部總效應(yīng)圖的乘客忠誠(chéng)度影響機(jī)理解析方法,在探究乘客忠誠(chéng)度影響機(jī)理的研究領(lǐng)域,學(xué)術(shù)界廣泛采納了多樣的分析方法,這些方法既包括傳統(tǒng)的線性回歸技術(shù),如多元線性回歸、路徑分析和結(jié)構(gòu)方程模型,也涵蓋了非線性方法,如三因素理論、梯度增強(qiáng)決策樹和隨機(jī)森林等。為了客觀、準(zhǔn)確地揭示解釋變量與響應(yīng)變量之間的關(guān)系,亟需一種不依賴于特定模型的分析方法。本發(fā)明提出的累積局部總效應(yīng)圖(tale)正是一種模型無(wú)關(guān)的解釋方法,它不依賴于特定的模型類型,只需從模型中導(dǎo)出滿足條件的可微函數(shù),即可準(zhǔn)確且高效地揭示變量之間的內(nèi)在聯(lián)系,適用于分析各類模型中解釋變量與響應(yīng)變量之間的關(guān)系形式。此外,相較于部分依賴圖(pdp)等方法,累積局部總效應(yīng)圖(tale)繼承了累積局部效應(yīng)圖(ale)的優(yōu)勢(shì),能有效解決變量間的相關(guān)性問(wèn)題,從而更準(zhǔn)確地描述變量間的獨(dú)立影響。
29、本發(fā)明提供的基于累積局部總效應(yīng)圖的乘客忠誠(chéng)度影響機(jī)理解析方法,采用的累積局部總效應(yīng)圖(tale)在處理具有不均勻得分分布的數(shù)據(jù)樣本時(shí)展現(xiàn)出顯著優(yōu)勢(shì),能夠精確地揭示解釋變量與響應(yīng)變量之間的真實(shí)關(guān)系。在乘客忠誠(chéng)度影響機(jī)理的研究中,累積局部總效應(yīng)圖(tale)在數(shù)據(jù)處理方面采用了標(biāo)準(zhǔn)化處理,以反映每個(gè)區(qū)間內(nèi)解釋變量對(duì)響應(yīng)變量產(chǎn)生的累積局部總效應(yīng)的比例。相比之下,累積局部效應(yīng)圖(ale)則通過(guò)中心化來(lái)計(jì)算累積局部效應(yīng),這一過(guò)程是通過(guò)將每個(gè)特征值減去其均值來(lái)實(shí)現(xiàn)的,使得處理后的數(shù)據(jù)均值為零。然而,這種中心化處理削弱了原始數(shù)據(jù)中的尺度信息和極端值的影響,這對(duì)于全面理解乘客忠誠(chéng)度的影響機(jī)理可能構(gòu)成障礙。實(shí)際上,乘客忠誠(chéng)度的樣本得分分布對(duì)最終交通政策的制定具有較大影響。相比之下,采用標(biāo)準(zhǔn)化處理的tale方法顯示出獨(dú)特的優(yōu)勢(shì)。標(biāo)準(zhǔn)化處理不僅保持了數(shù)據(jù)在不同特征間的相對(duì)尺度信息,還允許極端值的存在,從而能夠更準(zhǔn)確地反映乘客忠誠(chéng)度的復(fù)雜動(dòng)態(tài)。因此,在乘客忠誠(chéng)度影響機(jī)理的研究中,標(biāo)準(zhǔn)化處理的tale方法能夠更好地保留和解析數(shù)據(jù)中的細(xì)微差別和極端情況,更全面地考慮乘客行為的多樣性和差異性,具有較強(qiáng)的適用性和解釋力。
30、本發(fā)明提供的基于累積局部總效應(yīng)圖的乘客忠誠(chéng)度影響機(jī)理解析方法,以更加客觀、深入的視角揭示城市公共交通服務(wù)中各個(gè)維度要素的服務(wù)質(zhì)量如何以非線性方式影響乘客的公共交通忠誠(chéng)度。該方法不僅保留了傳統(tǒng)累積局部效應(yīng)圖在處理強(qiáng)相關(guān)性變量方面的優(yōu)勢(shì),還創(chuàng)新性地融入了每個(gè)解釋變量的樣本得分值分布考量。這一創(chuàng)新解決了傳統(tǒng)方法因未直接考慮解釋變量特征值分布對(duì)結(jié)果的影響而帶來(lái)的一系列問(wèn)題,包括可能忽視數(shù)據(jù)稀疏區(qū)域、無(wú)法準(zhǔn)確反映全局效應(yīng)、難以解釋極端值的影響,以及可能給出誤導(dǎo)性結(jié)論等。這不僅提升了模型作為解釋工具的完整性,還能夠更精確、更全面地描繪解釋變量與響應(yīng)變量之間的實(shí)際因果關(guān)系。通過(guò)將此方法應(yīng)用于乘客忠誠(chéng)度影響機(jī)理的深入分析中,本發(fā)明不僅能夠獨(dú)立于所使用的影響機(jī)理分析模型,探索并客觀地揭示各個(gè)公共交通服務(wù)要素的感知服務(wù)質(zhì)量與乘客忠誠(chéng)度之間的本質(zhì)關(guān)系,還為公共交通服務(wù)質(zhì)量?jī)?yōu)化策略的制定提供了更為堅(jiān)實(shí)的科學(xué)依據(jù)。
31、基于上述理由本發(fā)明可在數(shù)據(jù)分析等領(lǐng)域廣泛推廣。