两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

運(yùn)單號數(shù)據(jù)分析方法及裝置與流程

文檔序號:11143826閱讀:604來源:國知局
運(yùn)單號數(shù)據(jù)分析方法及裝置與制造工藝
本申請涉及物流信息處理
技術(shù)領(lǐng)域
,特別是涉及運(yùn)單號數(shù)據(jù)分析方法及裝置。
背景技術(shù)
:在電子商務(wù)應(yīng)用廣泛普及的今天,物流服務(wù)在產(chǎn)品提供商,電子商務(wù)平臺,以及購買產(chǎn)品的終端用戶間承擔(dān)了不可或缺的角色,例如多數(shù)實體產(chǎn)品的運(yùn)輸,都要通過物流服務(wù)來完成。在電子商務(wù)的相關(guān)應(yīng)用中,經(jīng)常會存在根據(jù)物流包裹的運(yùn)單號判斷屬于哪家物流服務(wù)提供商(以下稱為“物流商”)的需求,例如在為了方便終端用戶對包裹的跟蹤,一些電子商務(wù)平臺推出了查詢網(wǎng)站或者應(yīng)用,或者將查詢功能以模塊的方式集成在應(yīng)用中。為了方便用戶的應(yīng)用,簡化查詢流程,系統(tǒng)可以對用戶輸入的運(yùn)單號自動匹配其物流商,進(jìn)而完成物流進(jìn)度的查詢,省去了用戶選擇物流商的步驟。運(yùn)單號是快遞包裹的唯一標(biāo)識代碼,通常由數(shù)字和字母組成。通過運(yùn)單號,使得物流商、發(fā)件人以及收件人可以實時跟蹤快遞包裹的狀態(tài)。通常情況下,特定物流商的使用的運(yùn)單號其編碼方式都是有特定規(guī)律的,因此,在實現(xiàn)運(yùn)單號與物流商的匹配時,技術(shù)人員可以根據(jù)各物流商所使用的運(yùn)單號的特定規(guī)律,設(shè)計匹配的實現(xiàn)方式。例如,某物流商的運(yùn)單號由13位字母和數(shù)字組成,前后各兩位英文,固定第一位是E,最后是CS。另一物流商使用的運(yùn)單號由10位字母數(shù)字組成,常見以數(shù)字1、8或字母D等開頭,等等?,F(xiàn)有技術(shù)中,通常根據(jù)不同運(yùn)營商使用的運(yùn)單號的不同規(guī)律,人工編寫可與這些不同規(guī)律的運(yùn)單號相匹配的正則表達(dá)式,實現(xiàn)運(yùn)單號與運(yùn)營商進(jìn)行匹配。但是,這種人編寫規(guī)則的方式有諸多方面的缺陷,例如維護(hù)成本高,當(dāng)某一物流商使用不同的規(guī)則的運(yùn)單號時,可能導(dǎo)致大面積的維護(hù);無法及時發(fā)現(xiàn)運(yùn)單號規(guī)律的變化導(dǎo)致匹配規(guī)則不能及時更新,無法顧及所有可能性而導(dǎo)致的低匹配精度等等。因此,如何更準(zhǔn)確、高效地根據(jù)運(yùn)單號進(jìn)行物流商的預(yù)測,成為需要本領(lǐng)域技術(shù)人員解決的技術(shù)問題。技術(shù)實現(xiàn)要素:本申請?zhí)峁┝诉\(yùn)單號數(shù)據(jù)分析方法及裝置,可以更加高效準(zhǔn)確的預(yù)測運(yùn)單號所屬的物流商,同時更加易于維護(hù)。本申請?zhí)峁┝巳缦路桨福阂环N運(yùn)單號數(shù)據(jù)分析方法,包括:收集原始數(shù)據(jù),所述原始數(shù)據(jù)包括運(yùn)單號及其對應(yīng)的物流商信息;按照至少一個預(yù)置的特征維度對所述原始數(shù)據(jù)進(jìn)行統(tǒng)計,確定各所述特征維度上對應(yīng)的相關(guān)概率,其中,所述預(yù)置的特征維度包括運(yùn)單號特征維度,對應(yīng)的相關(guān)概率包括:對于特定運(yùn)單號特征,對應(yīng)的運(yùn)單號可能屬于各物流商的概率;從所述原始數(shù)據(jù)中確定訓(xùn)練樣本數(shù)據(jù),根據(jù)所述統(tǒng)計的結(jié)果,確定訓(xùn)練樣本數(shù)據(jù)中的運(yùn)單號對應(yīng)的至少一個可能的物流商,并分別確定當(dāng)該運(yùn)單號與所述可能的物流商對應(yīng)時,在各所述特征維度上對應(yīng)的概率;將計算出的各所述特征維度上的概率以及期望的預(yù)測結(jié)果輸入到預(yù)置的模型訓(xùn)練機(jī)中進(jìn)行訓(xùn)練,得到預(yù)測模型;利用所述統(tǒng)計的結(jié)果以及所述預(yù)測模型,對待預(yù)測運(yùn)單號所屬的物流商進(jìn)行預(yù)測。一種運(yùn)單號數(shù)據(jù)分析裝置,包括:原始數(shù)據(jù)收集單元,用于收集原始數(shù)據(jù),所述原始數(shù)據(jù)包括運(yùn)單號及其對應(yīng)的物流商信息;數(shù)據(jù)統(tǒng)計單元,用于按照至少一個預(yù)置的特征維度對所述原始數(shù)據(jù)進(jìn)行統(tǒng)計,確定各所述特征維度上對應(yīng)的相關(guān)概率,其中,所述預(yù)置的特征維度包括運(yùn)單號特征維度,對應(yīng)的相關(guān)概率包括:對于特定運(yùn)單號特征,對應(yīng)的運(yùn)單號可能屬于各物流商的概率;樣本數(shù)據(jù)處理單元,用于從所述原始數(shù)據(jù)中確定訓(xùn)練樣本數(shù)據(jù),根據(jù)所述統(tǒng)計的結(jié)果,確定訓(xùn)練樣本數(shù)據(jù)中的運(yùn)單號對應(yīng)的至少一個可能的物流商,并 分別確定當(dāng)該運(yùn)單號與所述可能的物流商對應(yīng)時,在各所述特征維度上對應(yīng)的概率;預(yù)測模型獲取單元,用于將計算出的各所述特征維度上的概率以及期望的預(yù)測結(jié)果輸入到預(yù)置的模型訓(xùn)練機(jī)中進(jìn)行訓(xùn)練,得到預(yù)測模型;運(yùn)單號預(yù)測單元,用于利用所述統(tǒng)計的結(jié)果以及所述預(yù)測模型,對待預(yù)測運(yùn)單號所屬的物流商進(jìn)行預(yù)測。根據(jù)本申請?zhí)峁┑木唧w實施例,本申請公開了以下技術(shù)效果:通過本申請實施例,可以按照至少一個預(yù)置的特征維度對所述原始數(shù)據(jù)進(jìn)行統(tǒng)計,確定各特征維度上對應(yīng)的相關(guān)概率,再利用樣本數(shù)據(jù)中運(yùn)單號與可能的物流商對應(yīng)時,在各特征維度上對應(yīng)的概率作為訓(xùn)練數(shù)據(jù),這些訓(xùn)練數(shù)據(jù)實際上反應(yīng)了運(yùn)單號與可能的物流商對應(yīng)時在統(tǒng)計學(xué)上的特征,利用訓(xùn)練數(shù)據(jù)訓(xùn)練得到預(yù)測模型,進(jìn)而使用預(yù)測模型,對未知物流商的待預(yù)測數(shù)據(jù)進(jìn)行其所述物流商的預(yù)測。本方法通過對原始數(shù)據(jù)的數(shù)據(jù)挖掘獲得樣本數(shù)據(jù)的統(tǒng)計學(xué)特征,并利用這些統(tǒng)計結(jié)果進(jìn)行機(jī)器學(xué)習(xí),得到能夠準(zhǔn)確預(yù)測的自動化預(yù)測模型,利用預(yù)測模型可以對待預(yù)測運(yùn)單號進(jìn)行準(zhǔn)確高效的預(yù)測,提高了預(yù)測的準(zhǔn)確性和效率的同時,作為預(yù)測工具的預(yù)測模型相比較現(xiàn)有方法也更易于維護(hù),減少維護(hù)成本。當(dāng)然,實施本申請的任一產(chǎn)品并不一定需要同時達(dá)到以上所述的所有優(yōu)點(diǎn)。附圖說明為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本申請實施例提供的方法的流程圖;圖2是本申請實施例提供的裝置的示意圖。具體實施方式下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進(jìn)行清 楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都屬于本申請保護(hù)的范圍。本申請實施例公開了運(yùn)單號數(shù)據(jù)分析方法,如圖1所示,為該運(yùn)單號數(shù)據(jù)分析方法的流程圖,如圖所示,該方法可以包括以下步驟:S101:收集原始數(shù)據(jù),所述原始數(shù)據(jù)包括運(yùn)單號及其對應(yīng)的物流商信息;首先,可以對原始數(shù)據(jù)進(jìn)行收集,其中,原始數(shù)據(jù)包括了運(yùn)單號以及運(yùn)單號對應(yīng)的物流商信息,也即運(yùn)單號以及對應(yīng)的物流商信息一般成對收集。對原始數(shù)據(jù)的收集可以在物流服務(wù)數(shù)據(jù)中提取,以收集真實有效的包括運(yùn)單號及其對應(yīng)的物流商信息的原始數(shù)據(jù)。例如,當(dāng)商戶與終端購買用戶通過電商平臺進(jìn)行交易時,在商戶通過特定物流商將產(chǎn)品成功配送給終端購買用戶后,從物流過程中產(chǎn)生的物流服務(wù)數(shù)據(jù)中,可以提取運(yùn)單號以及對應(yīng)的物流商信息。成功將原始數(shù)據(jù)收集到后,可以將其保存為特定格式的計算機(jī)數(shù)據(jù),例如保存為如下實例格式的數(shù)據(jù)庫條目,如表1所示:表1Tracking_No.LogisticsD2015001153335YD2012748964005441SF……其中,Tracking_No.列中的數(shù)據(jù)為所收集到的原始數(shù)據(jù)中的運(yùn)單號,Logistics列中的數(shù)據(jù)所收集到的各運(yùn)單號分別對應(yīng)的物流商代碼,也即物流商信息。S102:按照至少一個預(yù)置的特征維度對所述原始數(shù)據(jù)進(jìn)行統(tǒng)計,確定各所述特征維度上對應(yīng)的相關(guān)概率,其中,所述預(yù)置的特征維度包括運(yùn)單號特征維度,對應(yīng)的相關(guān)概率包括:對于特定運(yùn)單號特征,對應(yīng)的運(yùn)單號可能屬于各物流商的概率;收集到要求的原始數(shù)據(jù)后,可以按照至少一個預(yù)置的特征維度對原始數(shù)據(jù) 進(jìn)行統(tǒng)計,確定在每個預(yù)置的特征維度上對應(yīng)的概率。例如,預(yù)置的特征維度可以包括運(yùn)單號特征維度,即選定的某個運(yùn)單號特征作為一個維度,如運(yùn)單號中預(yù)置位置處預(yù)置長度的字符特征維度,和/或運(yùn)單號的長度特征維度等等。運(yùn)單號中預(yù)置位置處預(yù)置長度的字符特征維度例如,可以將樣本數(shù)據(jù)中運(yùn)單號中前N位字符組成的前綴,和對應(yīng)的物流商出現(xiàn)的規(guī)律作為一個特征維度。在以此維度作為預(yù)置的特征維度,具體實現(xiàn)該維度上的對應(yīng)的相關(guān)概率時,可以首先統(tǒng)計運(yùn)單號中前N位字符組成的前綴中各前綴的出現(xiàn)次數(shù)A;統(tǒng)計同一前綴對應(yīng)的運(yùn)單號中,每個物流商出現(xiàn)的次數(shù)B;確定該前綴出現(xiàn)時,屬于對應(yīng)物流商的概率為B/A;其中,N、A、B均為正整數(shù)。在該維度上實現(xiàn)樣本數(shù)據(jù)的統(tǒng)計時,同一前綴可能對應(yīng)一個或者多個物流商,在同一前綴對應(yīng)多個物流商時,該前綴對應(yīng)各物流商的統(tǒng)計概率可能不同。以N取1位字符的各個前綴為例,統(tǒng)計結(jié)果的示例如表2所示:表2表2給出了上述實現(xiàn)方式中前綴位數(shù)N取1位字符的統(tǒng)計結(jié)果的示例,其中,在前綴第一位字符為Y的情況下,對應(yīng)出現(xiàn)了三個物流商,根據(jù)統(tǒng)計結(jié)果,在該前綴Y出現(xiàn)時,屬于對應(yīng)物流商的概率分別為概率1,概率2以及概率3;實例表格2中的其他統(tǒng)計數(shù)據(jù)以此類推。在實際應(yīng)用中,根據(jù)實際的需要,運(yùn)單號中預(yù)置位置處預(yù)置長度的字符特征維度,還可以分別包括運(yùn)單號中前2位,3位,4位…等等字符組成的前綴的字符特征維度,前綴字符可以包括字母,數(shù)字,其它字符,以及不同類型字符的組合等等,其統(tǒng)計方法和統(tǒng) 計結(jié)果的示例與前述表2的統(tǒng)計方法和統(tǒng)計結(jié)果類似,在此就不再一一贅述了。另外,預(yù)置的特征維度還可以包括運(yùn)單號的長度特征維度,即將樣本數(shù)據(jù)中各運(yùn)單號的長度和對應(yīng)的物流商的出現(xiàn)規(guī)律作為一個特征維度。具體在實現(xiàn)在運(yùn)單號的長度特征維度上確定對應(yīng)的相關(guān)概率時,可以統(tǒng)計長度為M的運(yùn)單號出現(xiàn)次數(shù)C,統(tǒng)計長度為M的運(yùn)單號中各物流商的出現(xiàn)次數(shù)D,然后確定運(yùn)單號長度為M時,屬于對應(yīng)物流商的概率為D/C;其中,M、C、D均為正整數(shù)。在運(yùn)單號的長度特征維度上實現(xiàn)樣本數(shù)據(jù)的統(tǒng)計時,同一運(yùn)單號長度可能對應(yīng)一個或者多個物流商,在同一運(yùn)單號長度對應(yīng)多個物流商時,該運(yùn)單號長度對應(yīng)各物流商的統(tǒng)計概率可能不同。在運(yùn)單號的長度特征維度上實現(xiàn)樣本數(shù)據(jù)統(tǒng)計的統(tǒng)計結(jié)果如表3所示的示例:表3表3給出了在運(yùn)單號的長度特征維度上實現(xiàn)樣本數(shù)據(jù)的統(tǒng)計,確定在運(yùn)單號的長度特征維度上對應(yīng)的相關(guān)概率的示例,其中例如,在原始數(shù)據(jù)中運(yùn)單號長度為12的運(yùn)單號,對應(yīng)出現(xiàn)了三個物流商,其數(shù)據(jù)統(tǒng)計結(jié)果為屬于對應(yīng)物流商的概率分別為概率6,概率7以及概率8;表格3中的其他統(tǒng)計數(shù)據(jù)以此類推,就不再一一贅述了。以上所介紹的預(yù)置的特征維度,包括運(yùn)單號中預(yù)置位置處預(yù)置長度的字符特征維度,以及運(yùn)單號的長度特征維度,是從運(yùn)單號的角度選取的特征維度,此外,在實際應(yīng)用中,還可以從物流商的統(tǒng)計特征的角度選取特征維度,即預(yù)置的特征維度還可以包括物流商特征維度。例如,可以對原始數(shù)據(jù)進(jìn)行統(tǒng)計, 確定各物流商在全部原始數(shù)據(jù)中的出現(xiàn)概率,以及,結(jié)合運(yùn)單號的某些特征(如運(yùn)單號的特定前綴,運(yùn)單號長度等等),還可以確定對于特定物流商,各種運(yùn)單號特征的出現(xiàn)概率等統(tǒng)計結(jié)果。以下進(jìn)行具體的舉例說明。在以預(yù)置的物流商特征維度進(jìn)行數(shù)據(jù)統(tǒng)計時,可以獲取的相關(guān)概率可以包括各物流商在全部原始數(shù)據(jù)中的出現(xiàn)概率,具體的確定方法可以是統(tǒng)計各物流商對應(yīng)的數(shù)據(jù)數(shù)量,將各物流商對應(yīng)的數(shù)據(jù)數(shù)量與原始數(shù)據(jù)的總數(shù)據(jù)量的比值,確定為對應(yīng)的物流商在全部原始數(shù)據(jù)中的出現(xiàn)概率。另外,還可以統(tǒng)計出對于特定物流商,各種運(yùn)單號長度的出現(xiàn)概率。該統(tǒng)計結(jié)果的示例可以參見如下表4表4表4給出了根據(jù)對于特定物流商,各種運(yùn)單號長度的出現(xiàn)概率,實現(xiàn)樣本數(shù)據(jù)統(tǒng)計的示例,確定對于特定物流商,各種運(yùn)單號長度的出現(xiàn)概率,可以首先確定原始數(shù)據(jù)中特定物流商對應(yīng)的數(shù)據(jù)量E,以及對于該特定物流商,各個運(yùn)單號長度,對應(yīng)的數(shù)據(jù)量E1,E2,E3…,根據(jù)E1,E2,E3…與原始數(shù)據(jù)中該特定物流商對應(yīng)的數(shù)據(jù)量E的比值,來確定對應(yīng)的概率。例如,表4中,對于物流商1,假設(shè)其在原始數(shù)據(jù)中的數(shù)據(jù)量為10k個條目,其對應(yīng)的運(yùn)單號長度分別包括了11,12,以及14,假設(shè)物流商1的10k個條目中運(yùn)單號長度為11的數(shù)據(jù)量為5.4k,則概率11應(yīng)為:5.4k/10k=54%需要說明的是,以上所介紹的按照至少一個預(yù)置的特征維度對原始數(shù)據(jù)進(jìn)行統(tǒng)計的方法,其選取的特征維度以及對應(yīng)的數(shù)據(jù)處理的方法皆為示例性的,旨在便于對上述步驟或過程的理解,并不應(yīng)該被視為對本申請實施例的限制,在實際應(yīng)用中,還可以根據(jù)實際的需要,選擇其他的特征維度對原始數(shù)據(jù)進(jìn)行統(tǒng)計,本申請實施例對此并沒有限制。S103:從所述原始數(shù)據(jù)中確定訓(xùn)練樣本數(shù)據(jù),根據(jù)所述統(tǒng)計的結(jié)果,確定訓(xùn)練樣本數(shù)據(jù)中的運(yùn)單號對應(yīng)的至少一個可能的物流商,并分別確定當(dāng)該運(yùn)單號與所述可能的物流商對應(yīng)時,在各所述特征維度上對應(yīng)的概率;在對原始數(shù)據(jù)按照上述至少一個預(yù)置的特征維度完成統(tǒng)計,并得到相應(yīng)的統(tǒng)計數(shù)據(jù)后,可以從原始數(shù)據(jù)中確定訓(xùn)練樣本數(shù)據(jù),從原始數(shù)據(jù)中確定樣本數(shù)據(jù)可以有多種實現(xiàn)方式,以達(dá)到更好的訓(xùn)練效果,使預(yù)測模型更加準(zhǔn)確,可以采用更能保證樣本數(shù)據(jù)覆蓋面的方式實現(xiàn)。例如可以根據(jù)樣本數(shù)據(jù)的采集時間,在一個較大的時間跨度上選擇原始數(shù)據(jù)作為樣本數(shù)據(jù);另外,也可以根據(jù)原始數(shù)據(jù)中的物流商字段進(jìn)行選擇,盡量覆蓋所有出現(xiàn)的物流商,并且對于每個物流商足夠的數(shù)據(jù)量作為樣本;還可以對原始數(shù)據(jù)進(jìn)行覆蓋面的評估,如果評估結(jié)果能夠達(dá)到實際應(yīng)用需要的覆蓋面,也可以將全部原始數(shù)據(jù)作為樣本數(shù)據(jù)。然后,可以根據(jù)統(tǒng)計的結(jié)果,確定訓(xùn)練樣本數(shù)據(jù)中的運(yùn)單號對應(yīng)的至少一個可能的物流商,具體實現(xiàn)時,可以首先根據(jù)訓(xùn)練樣本數(shù)據(jù)中的各運(yùn)單號,分別查詢某個特征維度上的統(tǒng)計數(shù)據(jù),例如可以查詢表2或表3中的以運(yùn)單號特征維度上的統(tǒng)計數(shù)據(jù),確定出樣本數(shù)據(jù)中每個運(yùn)單號對應(yīng)的一個或多個可能的物流商。進(jìn)而,還可以根據(jù)統(tǒng)計結(jié)果,分別確定當(dāng)該運(yùn)單號與可能的物流商對應(yīng)時,在各特征維度上對應(yīng)的概率,以下進(jìn)行具體的舉例說明。例如,預(yù)置的特征維度包括了以下列舉的7個特征維度,其中前4個為預(yù)置位置處預(yù)置長度的字符特征維度:運(yùn)單第一位字符的字符特征維度;運(yùn)單前二位字符的字符特征維度;運(yùn)單前三位字符的字符特征維度;運(yùn)單前四位字符的字符特征維度;運(yùn)單號的長度特征維度;物流商特征維度1(各物流商在全部原始數(shù)據(jù)中的出現(xiàn)概率);物流商特征維度2(對應(yīng)對于特定物流商各種運(yùn)單號特征的出現(xiàn)概率)。在從原始數(shù)據(jù)中提取訓(xùn)練樣本數(shù)據(jù)后,分別確定當(dāng)該運(yùn)單號與所述可能的物流商對應(yīng)時,各個特征維度上的相關(guān)概率信息,可以包括對于該運(yùn)單號與可能的物流商,確定該運(yùn)單號前N位字符組成的前綴以及該運(yùn)單號的長度;確定該前綴出現(xiàn)時,屬于該物流商的概率;確定該運(yùn)單號長度對應(yīng)該物流商的概率;確定該物流商對應(yīng)該運(yùn)單號長度的概率;確定該物流商出現(xiàn)的概率。例如有如下樣本數(shù)據(jù):Y2015001153335-物流商1;其中Y2015001153335為運(yùn)單號,物流商1為該運(yùn)單號對應(yīng)的正確的物流商。首先,可以以該運(yùn)單號查詢預(yù)選的統(tǒng)計結(jié)果,確定在統(tǒng)計結(jié)果中該運(yùn)單號對應(yīng)的所有可能的物流商,如可以經(jīng)過查詢4個在字符特征維度上的統(tǒng)計結(jié)果,得到該運(yùn)單號可能對應(yīng)的三個物流商,分別為物流商1,物流商2,以及物流商3,這樣就得到了該運(yùn)單號在某些特征上與可能的物流商之間的對應(yīng)關(guān)系,也即確定了該運(yùn)單號對應(yīng)的一個或多個可能的物流商。接下來,可以根據(jù)統(tǒng)計結(jié)果,分別確定當(dāng)該運(yùn)單號與可能的物流商對應(yīng)時,在各特征維度上對應(yīng)的概率,可以得到該運(yùn)單號與上述三個物流商分別對應(yīng)時的三組數(shù)據(jù),每一組都由7個概率數(shù)據(jù)組成,例如當(dāng)該運(yùn)單號與可能的物流商1對應(yīng)時,可以得到在各特征維度上的一組數(shù)據(jù):<V1-1,V1-2,V1-3,V1-4,V1-5,V1-6,V1-7>;當(dāng)該運(yùn)單號與其他兩個可能的物流商1和物流商2對應(yīng)時,同樣可以確定在各特征維度上的成組數(shù)據(jù),即各維度上的概率:<V2-1,V2-2,V2-3,V2-4,V2-5,V2-6,V2-7>,以及<V3-1,V3-2,V3-3,V3-4,V3-5,V3-6,V3-7>。以此類推,對于所有樣本數(shù)據(jù),可以確定出其中的運(yùn)單號對應(yīng)的可能的物流商,并分別確定當(dāng)該運(yùn)單號與可能的物流商對應(yīng)時,在各特征維度上對應(yīng)的概率數(shù)據(jù),這樣一組數(shù)據(jù)實際上是反應(yīng)運(yùn)單號統(tǒng)計學(xué)特征的數(shù)據(jù),可以用于機(jī)器學(xué)習(xí)分類的樣本數(shù)據(jù)。在特定運(yùn)單號對應(yīng)多個物流商時,其中只有一個正確的物流商,其它的物流商僅僅是根據(jù)統(tǒng)計數(shù)據(jù)可能對應(yīng)的物流商,為了提供充足的訓(xùn)練數(shù)據(jù),或者滿足預(yù)測模型需求,在訓(xùn)練樣本數(shù)據(jù)中運(yùn)單號可以對應(yīng)一個正確的物流商,,以及至少一個錯誤的物流商,這樣,在確定當(dāng)該運(yùn)單號與所有可能的物流商對應(yīng)時,在各特征維度上的相關(guān)概率時,可以確定當(dāng)該運(yùn)單號與正確的物流商對應(yīng)時,在各特征維度上的相關(guān)概率;以及,確定當(dāng)該運(yùn)單號與其中一個錯誤的物流商對應(yīng)時,在各特征維度上的相關(guān)概率,其中,對于正確或錯誤的物流商,在將相關(guān)概率信息輸入模型訓(xùn)練機(jī)中訓(xùn)練時,對應(yīng)的期望值不同。對于正確和錯誤的物流商的期望值,請參考后續(xù)步驟S104中的內(nèi)容。S104:將計算出的各所述特征維度上的概率以及期望的預(yù)測結(jié)果輸入到預(yù)置的模型訓(xùn)練機(jī)中進(jìn)行訓(xùn)練,得到預(yù)測模型;在分別確定當(dāng)樣本數(shù)據(jù)各運(yùn)單號與可能的物流商對應(yīng)時,各個特征維度上的相關(guān)概率信息后,可以將計算出的各所述特征維度上的概率信息以及期望的預(yù)測結(jié)果輸入到預(yù)置的模型訓(xùn)練機(jī)中進(jìn)行訓(xùn)練,得到預(yù)測模型。以步驟S104中的樣本數(shù)據(jù)條目為例,Y2015001153335作為樣本運(yùn)單號,與可能的三個物流商分別對應(yīng)有三組數(shù)據(jù),而該運(yùn)單號對應(yīng)的正確的物流商為其中的物流商1,可以將物流商1作為期望的預(yù)測結(jié)果。計算出的概率信息以及期望的預(yù)測結(jié)果的數(shù)據(jù)關(guān)系可以參見表5中的示例:表5在本申請實施例中,預(yù)置的模型訓(xùn)練機(jī)可以采用支持向量機(jī)(supportvectormachine,SVM)來實現(xiàn),支持向量機(jī)是一種基于統(tǒng)計學(xué)習(xí)的自動化分類器工具,可以在輸入樣本后將樣本自動的進(jìn)行分類,在小樣本、非線性及高維模式識別等方面,相較于其它分類器具有更加高效準(zhǔn)確的優(yōu)勢。具體實現(xiàn)時,可以在得到樣本數(shù)據(jù)各運(yùn)單號與可能的物流商對應(yīng)時,各個特征維度上的相關(guān)概率信息后,將反應(yīng)各運(yùn)單號的統(tǒng)計學(xué)特征的各組概率數(shù)據(jù),以及期望的預(yù)測結(jié)果數(shù)據(jù)到預(yù)置的支持向量機(jī)中,可選的,還可以將期望結(jié)果為False的概率數(shù)據(jù)也輸入支持向量機(jī)進(jìn)行學(xué)習(xí)或優(yōu)化,以提高最終預(yù)測模型的準(zhǔn)確性。經(jīng)過支持向量機(jī)對樣本數(shù)據(jù)的機(jī)器學(xué)習(xí),可以獲得準(zhǔn)確的分類模型,所得到的分類模型常常表現(xiàn)為一個或者一組函數(shù)數(shù)據(jù)。所得到的分類模型可以用來對未知的運(yùn)單號進(jìn)行分類預(yù)測,分析其所屬的物流商或分別屬于不同物流商的概率。S105:利用所述統(tǒng)計的結(jié)果以及所述預(yù)測模型,對待預(yù)測運(yùn)單號所屬的物流商進(jìn)行預(yù)測。在得到預(yù)測模型后,可以利用預(yù)測模型,以及步驟S102中的統(tǒng)計結(jié)果,對未知的運(yùn)單號,即待預(yù)測的運(yùn)單號進(jìn)行其所屬物流商的預(yù)測。具體實現(xiàn)時,可以首先確定待預(yù)測的運(yùn)單號,例如接收用戶通過瀏覽器,移動設(shè)備應(yīng)用APP等提交的待預(yù)測的運(yùn)單號,按照運(yùn)單號特征維度提取待預(yù)測的運(yùn)單號特征,根據(jù)提取出的運(yùn)單號特征,確定該待預(yù)測的運(yùn)單號對應(yīng)的至少一個可能的物流商,例如,可以根據(jù)運(yùn)單號預(yù)置位置的字符,運(yùn)單號的長度等運(yùn)單號特征,查詢簽署的統(tǒng)計結(jié)果,確定待預(yù)測運(yùn)單號對應(yīng)的可能的物流商,然后可以根據(jù)統(tǒng)計出的概率信息,確定當(dāng)待預(yù)測的運(yùn)單號對應(yīng)各個可能的物流商時,各個特征維度上對應(yīng)的相關(guān)概率,該相關(guān)概率反應(yīng)為類似前述的<概率數(shù)據(jù)組>形式的一組數(shù)據(jù),接下來可以將計算出的相關(guān)概率輸入到預(yù)測模型中,由預(yù)測模型計算出該待待測運(yùn)單號對應(yīng)的物流商,或者輸出該待預(yù)測運(yùn)單號對應(yīng)各可能物流商的 概率,根據(jù)概率的排序,確定出最可能對應(yīng)的正確的物流商。以上對本申請實施例公開的運(yùn)單號數(shù)據(jù)分析方法進(jìn)行了詳細(xì)的介紹,通過該方法,可以按照至少一個預(yù)置的特征維度對所述原始數(shù)據(jù)進(jìn)行統(tǒng)計,確定各特征維度上對應(yīng)的相關(guān)概率,再利用樣本數(shù)據(jù)中運(yùn)單號與可能的物流商對應(yīng)時,在各特征維度上對應(yīng)的概率作為訓(xùn)練數(shù)據(jù),這些訓(xùn)練數(shù)據(jù)實際上反應(yīng)了運(yùn)單號與可能的物流商對應(yīng)時在統(tǒng)計學(xué)上的特征,利用訓(xùn)練數(shù)據(jù)訓(xùn)練得到預(yù)測模型,進(jìn)而使用預(yù)測模型,對未知物流商的待預(yù)測數(shù)據(jù)進(jìn)行其所述物流商的預(yù)測。本方法通過對原始數(shù)據(jù)的數(shù)據(jù)挖掘獲得樣本數(shù)據(jù)的統(tǒng)計學(xué)特征,并利用這些統(tǒng)計結(jié)果進(jìn)行機(jī)器學(xué)習(xí),得到能夠準(zhǔn)確預(yù)測的自動化預(yù)測模型,利用預(yù)測模型可以對待預(yù)測運(yùn)單號進(jìn)行準(zhǔn)確高效的預(yù)測,提高了預(yù)測的準(zhǔn)確性和效率的同時,作為預(yù)測工具的預(yù)測模型相比較現(xiàn)有方法也更易于維護(hù),減少維護(hù)成本。與本申請公開的運(yùn)單號數(shù)據(jù)分析方法相對應(yīng),還公開了運(yùn)單號數(shù)據(jù)分析裝置,如圖2所示,該裝置可以包括:原始數(shù)據(jù)收集單元201,用于收集原始數(shù)據(jù),原始數(shù)據(jù)包括運(yùn)單號及其對應(yīng)的物流商信息;數(shù)據(jù)統(tǒng)計單元202,用于按照至少一個預(yù)置的特征維度對原始數(shù)據(jù)進(jìn)行統(tǒng)計,確定各特征維度上對應(yīng)的相關(guān)概率,其中,預(yù)置的特征維度包括運(yùn)單號特征維度,對應(yīng)的相關(guān)概率包括:對于特定運(yùn)單號特征,對應(yīng)的運(yùn)單號可能屬于各物流商的概率;樣本數(shù)據(jù)處理單元203,用于從原始數(shù)據(jù)中確定訓(xùn)練樣本數(shù)據(jù),根據(jù)統(tǒng)計的結(jié)果,確定訓(xùn)練樣本數(shù)據(jù)中的運(yùn)單號對應(yīng)的至少一個可能的物流商,并分別確定當(dāng)該運(yùn)單號與可能的物流商對應(yīng)時,在各特征維度上對應(yīng)的概率;預(yù)測模型獲取單元204,用于將計算出的各特征維度上的概率以及期望的預(yù)測結(jié)果輸入到預(yù)置的模型訓(xùn)練機(jī)中進(jìn)行訓(xùn)練,得到預(yù)測模型;運(yùn)單號預(yù)測單元205,用于利用統(tǒng)計的結(jié)果以及預(yù)測模型,對待預(yù)測運(yùn)單號所屬的物流商進(jìn)行預(yù)測。其中,運(yùn)單號特征維度可以包括:運(yùn)單號中預(yù)置位置處預(yù)置長度的字符特征維度,和/或運(yùn)單號的長度特征維度。在這種實現(xiàn)方式下,運(yùn)單號中預(yù)置位置處預(yù)置長度的字符特征,可以包括運(yùn)單號中前N位字符組成的前綴的字符特征維度;在這種實現(xiàn)方式下,數(shù)據(jù)統(tǒng)計單元可以包括第一數(shù)據(jù)統(tǒng)計子單元,用于:統(tǒng)計運(yùn)單號中前N位字符組成的前綴中各前綴的出現(xiàn)次數(shù)A;統(tǒng)計同一前綴對應(yīng)的運(yùn)單號中,每個物流商出現(xiàn)的次數(shù)B;確定該前綴出現(xiàn)時,屬于對應(yīng)物流商的概率為B/A;其中,N、A、B均為正整數(shù)。對于運(yùn)單號的長度特征維度,數(shù)據(jù)統(tǒng)計單元可以包括第二數(shù)據(jù)統(tǒng)計子單元,用于:統(tǒng)計長度為M的運(yùn)單號出現(xiàn)次數(shù)C;統(tǒng)計長度為M的運(yùn)單號中,各物流商的出現(xiàn)次數(shù)D;確定運(yùn)單號長度為M時,屬于對應(yīng)物流商的概率為D/C;其中,M、C、D均為正整數(shù)。此外,預(yù)置的特征維度還可以包括物流商特征維度,對應(yīng)的相關(guān)概率包括:對于特定物流商,各種運(yùn)單號特征的出現(xiàn)概率,和/或,各物流商在全部原始數(shù)據(jù)中的出現(xiàn)概率。在這種實現(xiàn)方式下,對于特定物流商,各種運(yùn)單號特征的出現(xiàn)概率可以包括:對于特定物流商,各種運(yùn)單號長度的出現(xiàn)概率。在這種實現(xiàn)方式下,在從原始數(shù)據(jù)中提取訓(xùn)練樣本數(shù)據(jù)后,樣本數(shù)據(jù)處理單元可以包括第一樣本數(shù)據(jù)處理子單元,用于:對于該運(yùn)單號與可能的物流商,確定該運(yùn)單號前N位字符組成的前綴以及該運(yùn)單號的長度;確定該前綴出現(xiàn)時,屬于該物流商的概率;確定該運(yùn)單號長度對應(yīng)該物流商的概率;確定該物流商對應(yīng)該運(yùn)單號長度的概率;確定該物流商出現(xiàn)的概率。在另一種實現(xiàn)方式下,訓(xùn)練樣本數(shù)據(jù)中的運(yùn)單號對應(yīng)的至少一個可能的物流商中,可以包括一個正確的物流商,以及至少一個錯誤的物流商;樣本數(shù)據(jù)處理單元可以包括第二樣本數(shù)據(jù)處理子單元,用于:確定當(dāng)該運(yùn)單號與正確的物流商對應(yīng)時,在各特征維度上的相關(guān)概率;以及,確定當(dāng)該運(yùn)單號與其中一個錯誤的物流商對應(yīng)時,在各特征維度上的相關(guān)概率;其中,對于正確或錯誤的物流商,在將相關(guān)概率信息輸入模型訓(xùn)練機(jī)中訓(xùn)練時,對應(yīng)的期望值不同。運(yùn)單號預(yù)測單元,具體可以用于:確定待預(yù)測的運(yùn)單號;按照運(yùn)單號特征維度提取待預(yù)測的運(yùn)單號特征,根據(jù)提取出的運(yùn)單號特征,確定該待預(yù)測的運(yùn)單號對應(yīng)的至少一個可能的物流商,并根據(jù)統(tǒng)計出的概率信息,確定當(dāng)待預(yù)測的運(yùn)單號對應(yīng)各個可能的物流商時,各個特征維度上對應(yīng)的相關(guān)概率;將計算出的相關(guān)概率輸入到預(yù)測模型中,輸出該待預(yù)測運(yùn)單號對應(yīng)各可能物流商的概率。以上對本申請實施例公開的運(yùn)單號數(shù)據(jù)分析裝置進(jìn)行了介紹,通過該裝置,可以按照至少一個預(yù)置的特征維度對所述原始數(shù)據(jù)進(jìn)行統(tǒng)計,確定各特征維度上對應(yīng)的相關(guān)概率,再利用樣本數(shù)據(jù)中運(yùn)單號與可能的物流商對應(yīng)時,在各特征維度上對應(yīng)的概率作為訓(xùn)練數(shù)據(jù),這些訓(xùn)練數(shù)據(jù)實際上反應(yīng)了運(yùn)單號與可能的物流商對應(yīng)時在統(tǒng)計學(xué)上的特征,利用訓(xùn)練數(shù)據(jù)訓(xùn)練得到預(yù)測模型,進(jìn)而使用預(yù)測模型,對未知物流商的待預(yù)測數(shù)據(jù)進(jìn)行其所述物流商的預(yù)測。本裝置通過對原始數(shù)據(jù)的數(shù)據(jù)挖掘獲得樣本數(shù)據(jù)的統(tǒng)計學(xué)特征,并利用統(tǒng)計結(jié)果進(jìn)行機(jī) 器學(xué)習(xí),得到能夠準(zhǔn)確預(yù)測的自動化預(yù)測模型,利用預(yù)測模型可以對待預(yù)測運(yùn)單號進(jìn)行準(zhǔn)確高效的預(yù)測,提高了預(yù)測的準(zhǔn)確性和效率的同時,相對于現(xiàn)有技術(shù),作為預(yù)測工具的預(yù)測模型也更易于維護(hù)。通過以上的實施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,本申請的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個實施例或者實施例的某些部分所述的方法。本說明書中的各個實施例均采用遞進(jìn)的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點(diǎn)說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)或系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分說明即可。以上所描述的系統(tǒng)及系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。以上對本申請所提供的運(yùn)單號數(shù)據(jù)分析方法及裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本申請的原理及實施方式進(jìn)行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對本申請的限制。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
灵山县| 柳州市| 高雄县| 雷波县| 斗六市| 大宁县| 朝阳市| 合阳县| 庐江县| 滨海县| 宝山区| 天柱县| 繁峙县| 邹平县| 开封县| 安康市| 宜兴市| 白山市| 正镶白旗| 南阳市| 元谋县| 霍林郭勒市| 桃园县| 望奎县| 宝鸡市| 宜川县| 城步| 道真| 房山区| 二连浩特市| 和田市| 罗城| 西盟| 伊金霍洛旗| 吴忠市| 古交市| 高邑县| 房山区| 郑州市| 梅河口市| 囊谦县|