本發(fā)明涉及數(shù)據(jù)分析與預(yù)測,更具體地,涉及一種基于一致模算子的大宗商品價格長期預(yù)測方法。
背景技術(shù):
1、大宗商品是指可進入流通領(lǐng)域,但非零售環(huán)節(jié),具有商品屬性并用于工農(nóng)業(yè)生產(chǎn)與消費使用的大批量買賣的物質(zhì)商品。在金融投資市場,大宗商品指同質(zhì)化、可交易、被廣泛作為工業(yè)基礎(chǔ)原材料的商品,如原油、有色金屬、農(nóng)產(chǎn)品、鐵礦石、煤炭等。大宗商品包括3個類別,即能源商品、基礎(chǔ)原材料和農(nóng)副產(chǎn)品。
2、在全球范圍內(nèi),大宗商品貿(mào)易一直是經(jīng)濟發(fā)展的重要驅(qū)動力。這些商品涵蓋了從能源到金屬,再到農(nóng)產(chǎn)品的各類資源,對各國經(jīng)濟增長、就業(yè)和產(chǎn)業(yè)升級具有深遠影響。近年來,隨著全球經(jīng)濟格局的變化,大宗商品貿(mào)易的版圖也在不斷演變。
3、大宗商品價格的波動直接影響到國內(nèi)外的生產(chǎn)商和貿(mào)易商。一方面,價格的上漲為相關(guān)企業(yè)提供了發(fā)展機遇,但也帶來了成本上升的風(fēng)險。另一方面,價格下跌可能導(dǎo)致部分行業(yè)出現(xiàn)產(chǎn)能過剩,對企業(yè)盈利造成壓力。對大宗商品價格進行長期預(yù)測有助于企業(yè)制定更為合理的經(jīng)營策略,減少市場風(fēng)險。同時,政府也可以通過預(yù)測結(jié)果來制定更為精準的宏觀調(diào)控政策,確保經(jīng)濟的穩(wěn)定發(fā)展。
4、目前,大宗商品價格預(yù)測的方法包括時間序列分析、回歸分析和var模型、機器學(xué)習(xí)等,這些方法和模型雖能在樣本空間內(nèi)實現(xiàn)對大宗商品價格的預(yù)測,但是當(dāng)預(yù)測期延長到樣本空間外特別是未來預(yù)測期數(shù)較長時,將出現(xiàn)巨大的預(yù)測誤差。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于一致模算子的大宗商品價格長期預(yù)測方法,以克服已有方法預(yù)測偏差大、多重周期疊加預(yù)測不準確等問題,以期在5%的誤差內(nèi)實現(xiàn)長達30期的大宗商品價格長期預(yù)測。
2、為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下。
3、本發(fā)明提供了一種基于一致模算子的大宗商品價格長期預(yù)測方法,先采集大宗商品價格歷史數(shù)據(jù),并對大宗商品價格歷史數(shù)據(jù)進行數(shù)據(jù)清洗,得到清洗后可用大宗商品價格數(shù)據(jù)集;再對清洗后可用大宗商品價格數(shù)據(jù)集進行3次平滑處理得到3個平滑后可用大宗商品價格數(shù)據(jù)集;然后用多個時間序列模型對前述數(shù)據(jù)集分別進行分析處理和預(yù)測,得到各自包含t期大宗商品預(yù)測價格的至少4個預(yù)測結(jié)果;最后對各自包含t期大宗商品預(yù)測價格的至少4個預(yù)測結(jié)果進行一致模算子聚合,得到最終的大宗商品價格t期無偏預(yù)測值??朔爽F(xiàn)有方法預(yù)測偏差大、多重周期疊加預(yù)測失效等問題,能夠在5%的誤差內(nèi)實現(xiàn)長達30期的大宗商品價格長期預(yù)測。該方法具體包括以下步驟:
4、步驟s101,以天為單位采集最近十年大宗商品價格歷史數(shù)據(jù);
5、其中,所述歷史數(shù)據(jù)來源是行業(yè)網(wǎng)站公開(如生意社、中國鐵合金在線、我的鋼鐵網(wǎng)等)、或企事業(yè)單位內(nèi)部的最近十年大宗商品價格歷史日頻數(shù)據(jù);所述最近十年大宗商品價格數(shù)據(jù)中的每年可為365個自然日,也可為250-260個交易日,具體值可視不同大宗商品而不同。
6、步驟s102,對步驟s101中采集的大宗商品價格歷史數(shù)據(jù)進行數(shù)據(jù)清洗,得到清洗后可用大宗商品價格數(shù)據(jù)集x1;
7、其中,所述數(shù)據(jù)清洗包括過濾無效數(shù)據(jù)、補全缺失數(shù)據(jù)及對齊數(shù)據(jù)周期。
8、步驟s103,對步驟s102中獲取的清洗后可用大宗商品價格數(shù)據(jù)集x1進行平滑和季節(jié)效應(yīng)分解,得到5個數(shù)據(jù)集x2、x3、x4;
9、其中,所述對獲取的清洗后可用大宗商品價格數(shù)據(jù)集進行平滑的方法為移動平均法,3次平滑的窗口大小分別為10天、20天及30天,3次平滑得到3個平滑后可用大宗商品價格數(shù)據(jù)集x2、x3、x4。
10、步驟s104,采用3種公知的時間序列模型中的一種或多種分別對步驟s102及步驟s103中得到的數(shù)據(jù)集x1、x2、x3、x4進行分析處理和預(yù)測,得到m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果;
11、其中,所述3種公知的時間序列模型分別為sarima模型、lstm模型、nnar模型,可分別記為模型m1、m2、m3;步驟s104中,得到的m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果記為f1、f2、...、fm,則預(yù)測結(jié)果數(shù)m滿足:4≤m≤12,每個fm包含t期大宗商品預(yù)測價格,其中t=1,2,3,..,30為預(yù)測期數(shù),t最大可為30;當(dāng)對每個數(shù)據(jù)集xi(1≤i≤4)只用3種時間序列模型中的一種進行分析處理和預(yù)測時,m=3,當(dāng)對每個數(shù)據(jù)集xi(1≤i≤4)各自用3種時間序列模型進行分析處理和預(yù)測時,m=12,其余情況m介于6和8之間。
12、步驟s105,構(gòu)建一致模算子,對步驟s104中的m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果進行一致模聚合,得到大宗商品價格的一致模聚合預(yù)測結(jié)果;
13、其中,所述構(gòu)建的一致模算子,對步驟s104中各自包含t期大宗商品預(yù)測價格的m個預(yù)測結(jié)果進行一致模算子聚合,得到最終的大宗商品價格t期無偏預(yù)測值的具體方法為:
14、構(gòu)建一致模算子umo:
15、
16、其中fm為步驟s104中得到的m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果,4≤m≤12;
17、sg(x)和sv(x)為一致模中的兩個聚合因子,兩者形式分別為:
18、sg(x)=log(λx)/(1-x)
19、sv(x)=ex/(λ+ex)
20、為前述第j個模型對可用大宗商品歷史價格數(shù)據(jù)集xi的影響系數(shù),imp()為相應(yīng)影響函數(shù),記模型mj對數(shù)據(jù)集xi進行預(yù)測的均方誤差為msdij,則當(dāng)m=12時有(m取其它值時可得類似結(jié)論):
21、
22、進一步地,取則可得基于一致模算子的聚合模型:
23、
24、其中t=1,2,3,..,30為預(yù)測期數(shù);
25、umot即為對所有fm各自第t期預(yù)測結(jié)果的聚合結(jié)果,令ff=(ff1,ff2,..,fft)=(umo1,umo2,..,umot),則ff即為t期預(yù)測期的聚合預(yù)測結(jié)果。
26、另一方面地,本發(fā)明還提出了一種基于一致模算子的大宗商品價格長期預(yù)測系統(tǒng),所述系統(tǒng)包括:
27、數(shù)據(jù)采集模塊:用于以天為單位采集最近十年大宗商品價格歷史數(shù)據(jù);
28、其中,所述歷史數(shù)據(jù)來源是行業(yè)網(wǎng)站公開(如生意社、中國鐵合金在線、我的鋼鐵網(wǎng)等)、或企事業(yè)單位內(nèi)部的最近十年大宗商品價格歷史日頻數(shù)據(jù);所述最近十年大宗商品價格數(shù)據(jù)中的每年可為365個自然日,也可為250-260個交易日,具體值可視不同大宗商品而不同。
29、數(shù)據(jù)清洗模塊:用于對數(shù)據(jù)采集模塊中采集的大宗商品價格歷史數(shù)據(jù)進行數(shù)據(jù)清洗,得到清洗后可用大宗商品價格數(shù)據(jù)集x1。
30、其中,所述數(shù)據(jù)清洗包括過濾無效數(shù)據(jù)、補全缺失數(shù)據(jù)及對齊數(shù)據(jù)周期等。
31、數(shù)據(jù)平滑與季節(jié)效應(yīng)分解模塊:對數(shù)據(jù)清洗模塊中獲取的清洗后可用大宗商品價格數(shù)據(jù)集x1進行平滑,得到3個數(shù)據(jù)集x2、x3、x4;
32、其中,所述對獲取的清洗后可用大宗商品價格數(shù)據(jù)集進行平滑的方法為移動平均法,3次平滑的窗口大小分別為10天、20天及30天,經(jīng)3種不同窗口的平滑后得到3個可用大宗商品價格數(shù)據(jù)集x2、x3、x4。
33、多模型預(yù)測模塊:用于采用3種公知的時間序列模型中的一種或多種分別對數(shù)據(jù)清洗模塊和數(shù)據(jù)平滑與季節(jié)效應(yīng)分解模塊中得到的數(shù)據(jù)集x1、x2、x3、x4進行分析處理和預(yù)測,得到m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果;
34、其中,所述3種公知的時間序列模型分別為sarima模型、lstm模型、nnar模型,可分別記為模型m1、m2、m3;步驟s104中,得到的m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果記為f1、f2、...、fm,則預(yù)測結(jié)果數(shù)m滿足:4≤m≤12,每個fm包含t期大宗商品預(yù)測價格,其中t=1,2,3,..,30為預(yù)測期數(shù),t最大可為30;當(dāng)對每個數(shù)據(jù)集xi(1≤i≤4)只用3種時間序列模型中的一種進行分析處理和預(yù)測時,m=4,當(dāng)對每個數(shù)據(jù)集xi(1≤i≤4)各自用3種時間序列模型進行分析處理和預(yù)測時,m=12,其余情況m介于4和12之間。
35、一致模算子聚合模塊:用于構(gòu)建一致模算子,對多模型預(yù)測模塊中的m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果進行一致模聚合,得到大宗商品價格的一致模聚合預(yù)測結(jié)果;
36、其中,所述構(gòu)建的一致模算子,對步驟s104中各自包含t期大宗商品預(yù)測價格的m個預(yù)測結(jié)果進行一致模算子聚合,得到最終的大宗商品價格t期無偏預(yù)測值的具體方法為:
37、構(gòu)建一致模算子umo:
38、
39、其中fm為步驟s104中得到的m個各自包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果,4≤m≤12;
40、sg(x)和sv(x)為一致模算子umo中的兩個聚合因子,兩者形式分別為:
41、sg(x)=log(λx)/(1-x)
42、sv(x)=ex/(λ+ex)
43、為前述第j個模型對可用大宗商品歷史價格數(shù)據(jù)集xi的影響系數(shù),imp()為相應(yīng)影響函數(shù),記模型mj對數(shù)據(jù)集xi進行預(yù)測的均方誤差為msdij,則當(dāng)m=12時有(m取其它值時可得類似結(jié)論):
44、
45、進一步地,取則可得基于一致模算子的聚合模型:
46、
47、其中t=1,2,3,..,30為預(yù)測期數(shù);
48、umot即為對所有fm各自第t期預(yù)測結(jié)果的聚合結(jié)果,令ff=(ff1,ff2,..,fft)=(umo1,umo2,..,umot),則ff即為t期預(yù)測期的聚合預(yù)測結(jié)果。
49、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果如下:
50、(1)針對大宗商品價格預(yù)測,以天為單位采集最近十年大宗商品價格歷史數(shù)據(jù),基礎(chǔ)數(shù)據(jù)豐富。(2)對采集的數(shù)據(jù)進行了必要的數(shù)據(jù)清洗處理,得到清洗后可用大宗商品價格數(shù)據(jù)集x1,確保了相關(guān)數(shù)據(jù)有有效性和可靠性。(3)對清洗后可用大宗商品價格數(shù)據(jù)集x1分別進行了3次平滑處理和1次季節(jié)效應(yīng)分解,得到x2、x3、x4計3個平滑后可用大宗商品價格數(shù)據(jù)集,有利于降低噪聲的影響。(4)對清洗后可用大宗商品價格數(shù)據(jù)集x1、平滑后可用大宗商品價格數(shù)據(jù)集x2、x3、x4,分別用公知的sarima模型、lstm模型和nnar模型進行分析處理,得到m個分別包含t期大宗商品預(yù)測價格的預(yù)測結(jié)果;采用多個時間序列模型進行數(shù)據(jù)處理,增強了對多周期疊加數(shù)據(jù)的分析處理能力,增強了長期預(yù)測能力,顯著降低了預(yù)測偏差。(5)構(gòu)建全新的基于一致模算子的聚合模型,并在此基礎(chǔ)上對各自包含t期大宗商品預(yù)測價格的m個預(yù)測結(jié)果進行一致模算子聚合,得到最終的大宗商品價格t期無偏預(yù)測值;采用基于一致模算子的聚合預(yù)測結(jié)果,實現(xiàn)了長達30期的大宗商品價格的長期預(yù)測,大大降低了預(yù)測誤差、提高了預(yù)測精度,克服了已有方法難以進行長期預(yù)測及預(yù)測偏差大、多重周期疊加預(yù)測不準確等問題,能夠在5%的誤差內(nèi)實現(xiàn)長達30期的大宗商品價格長期預(yù)測。