本說明書實施例涉及計算機,特別涉及一種數(shù)據(jù)處理方法。
背景技術(shù):
1、隨著人工智能技術(shù)的快速發(fā)展,越來越多的模型已經(jīng)在日常生活中投入使用。通過大量語料訓(xùn)練模型,并在特定領(lǐng)域上微調(diào),通常即可以獲得良好的效果。然而,無論是預(yù)訓(xùn)練階段還是微調(diào)階段,都需要大量的訓(xùn)練數(shù)據(jù),特別是在進行電價時,可以先訓(xùn)練電價預(yù)測模型,再通過電價預(yù)測模型進行電價預(yù)測。但在實際場景中,由于缺乏足夠多的訓(xùn)練數(shù)據(jù),導(dǎo)致電價預(yù)測模型進行電價預(yù)測時準確度較低。
2、因此,如何對用于訓(xùn)練電價預(yù)測模型的樣本數(shù)據(jù)進行擴容,成為一種亟需解決的問題。
技術(shù)實現(xiàn)思路
1、有鑒于此,本說明書實施例提供了一種數(shù)據(jù)處理方法。本說明書一個或者多個實施例同時涉及一種數(shù)據(jù)處理裝置,一種計算設(shè)備,一種計算機可讀存儲介質(zhì)以及一種計算機程序,以解決現(xiàn)有技術(shù)中存在的技術(shù)缺陷。
2、根據(jù)本說明書實施例的第一方面,提供了一種數(shù)據(jù)處理方法,包括:
3、確定與待預(yù)測電價相關(guān)的多個特征數(shù)據(jù),并根據(jù)所述待預(yù)測電價對應(yīng)的電價類型確定所述多個特征數(shù)據(jù)對應(yīng)的待統(tǒng)計時間區(qū)間;
4、確定所述待統(tǒng)計時間區(qū)間內(nèi)每個特征數(shù)據(jù)對應(yīng)的多個特征值;
5、根據(jù)每個特征數(shù)據(jù)對應(yīng)的數(shù)據(jù)類型以及所述多個特征值,確定在所述待統(tǒng)計時間區(qū)間內(nèi)所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值;
6、將所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值與預(yù)先獲取的初始樣本數(shù)據(jù)進行融合,生成目標樣本數(shù)據(jù)。
7、可選地,所述數(shù)據(jù)類型包括連續(xù)型數(shù)據(jù);
8、相應(yīng)地,所述根據(jù)每個特征數(shù)據(jù)對應(yīng)的數(shù)據(jù)類型以及所述多個特征值,確定在所述待統(tǒng)計時間區(qū)間內(nèi)所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值,包括:
9、在目標特征數(shù)據(jù)屬于連續(xù)型數(shù)據(jù)的情況下,確定所述目標特征數(shù)據(jù)對應(yīng)的多個特征值的特征值總數(shù),其中,所述目標特征數(shù)據(jù)為所述多個特征數(shù)據(jù)中的每一個;
10、根據(jù)所述特征值總數(shù)以及所述目標特征數(shù)據(jù)對應(yīng)的多個特征值,確定在所述待統(tǒng)計時間區(qū)間內(nèi)所述目標特征數(shù)據(jù)對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值。
11、可選地,所述數(shù)據(jù)處理方法還包括:
12、在屬于連續(xù)型數(shù)據(jù)的目標特征數(shù)據(jù)中確定相互關(guān)聯(lián)的目標特征數(shù)據(jù);
13、對所述相互關(guān)聯(lián)的目標特征數(shù)據(jù)中每個目標特征數(shù)據(jù)對應(yīng)的多個特征值進行求和;
14、根據(jù)求和結(jié)果以及所述相互關(guān)聯(lián)的目標特征數(shù)據(jù)中任意一個目標特征數(shù)據(jù)對應(yīng)的多個特征值的特征值總數(shù),確定所述相互關(guān)聯(lián)的目標特征數(shù)據(jù)對應(yīng)的信號幅度值。
15、可選地,所述數(shù)據(jù)處理方法,還包括:
16、計算所述相互關(guān)聯(lián)的目標特征數(shù)據(jù)中每個目標特征數(shù)據(jù)對應(yīng)的第i+1個特征值與第i個特征值的差值,其中,i為正整數(shù),且i的取值為1至m-1,m為所述相互關(guān)聯(lián)的目標特征數(shù)據(jù)中任意一個目標特征數(shù)據(jù)對應(yīng)的多個特征值的特征值總數(shù);
17、將所述差值進行求和,并根據(jù)求和結(jié)果以及所述相互關(guān)聯(lián)的目標特征數(shù)據(jù)中任意一個目標特征數(shù)據(jù)對應(yīng)的多個特征值的特征值總數(shù),確定所述相互關(guān)聯(lián)的目標特征數(shù)據(jù)對應(yīng)的運動變化值。
18、可選地,所述數(shù)據(jù)類型還包括離散型數(shù)據(jù);
19、相應(yīng)地,所述根據(jù)每個特征數(shù)據(jù)對應(yīng)的數(shù)據(jù)類型以及所述多個特征值,確定在所述待統(tǒng)計時間區(qū)間內(nèi)所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值,包括:
20、在目標特征數(shù)據(jù)屬于離散型數(shù)據(jù)的情況下,確定所述目標特征數(shù)據(jù)對應(yīng)的多個特征值的特征值總數(shù),其中,所述目標特征數(shù)據(jù)為所述多個特征數(shù)據(jù)中的每一個;
21、對屬于離散型數(shù)據(jù)的目標特征數(shù)據(jù)中每個子特征數(shù)據(jù)對應(yīng)的多個特征值的特征值總數(shù)進行求和;
22、根據(jù)求和結(jié)果以及屬于離散型數(shù)據(jù)的目標特征數(shù)據(jù)對應(yīng)的多個特征值的特征值總數(shù),確定在所述待統(tǒng)計時間區(qū)間內(nèi)所述每個子特征數(shù)據(jù)對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值。
23、可選地,所述將所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值與預(yù)先獲取的初始樣本數(shù)據(jù)進行融合,包括:
24、在預(yù)先獲取的初始樣本數(shù)據(jù)為二維數(shù)組的情況下,確定所述初始樣本數(shù)據(jù)對應(yīng)的行數(shù);
25、對所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值進行處理,生成一維數(shù)組,并按照所述初始樣本數(shù)據(jù)對應(yīng)的行數(shù)對所述一維數(shù)組進行擴展,生成擴展后的二維數(shù)組,其中,擴展后的二維數(shù)組的行數(shù)與所述初始樣本數(shù)據(jù)對應(yīng)的行數(shù)相等,且擴展后的二維數(shù)組中每行的數(shù)據(jù)均相同;
26、將擴展后的二維數(shù)組與所述初始樣本數(shù)據(jù)進行拼接。
27、可選地,所述數(shù)據(jù)處理方法還包括:
28、將所述目標樣本數(shù)據(jù)輸入待訓(xùn)練的電價預(yù)測模型進行訓(xùn)練,生成電價預(yù)測模型。
29、根據(jù)本說明書實施例的第二方面,提供了一種數(shù)據(jù)處理裝置,包括:
30、第一確定模塊,被配置為確定與待預(yù)測電價相關(guān)的多個特征數(shù)據(jù),并根據(jù)所述待預(yù)測電價對應(yīng)的電價類型確定所述多個特征數(shù)據(jù)對應(yīng)的待統(tǒng)計時間區(qū)間;
31、第二確定模塊,被配置為確定所述待統(tǒng)計時間區(qū)間內(nèi)每個特征數(shù)據(jù)對應(yīng)的多個特征值;
32、處理模塊,被配置為根據(jù)每個特征數(shù)據(jù)對應(yīng)的數(shù)據(jù)類型以及所述多個特征值,確定在所述待統(tǒng)計時間區(qū)間內(nèi)所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值;
33、數(shù)據(jù)生成模塊,被配置為將所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值與預(yù)先獲取的初始樣本數(shù)據(jù)進行融合,生成目標樣本數(shù)據(jù)。
34、根據(jù)本說明書實施例的第三方面,提供了一種計算設(shè)備,包括:
35、存儲器和處理器;
36、所述存儲器用于存儲計算機可執(zhí)行指令,所述處理器用于執(zhí)行所述計算機可執(zhí)行指令實現(xiàn)任意一項所述數(shù)據(jù)處理方法的步驟。
37、根據(jù)本說明書實施例的第四方面,提供了一種計算機可讀存儲介質(zhì),其存儲有計算機可執(zhí)行指令,該指令被處理器執(zhí)行時實現(xiàn)任意一項所述數(shù)據(jù)處理方法的步驟。
38、根據(jù)本說明書實施例的第五方面,提供了一種計算機程序,其中,當所述計算機程序在計算機中執(zhí)行時,令計算機執(zhí)行上述數(shù)據(jù)處理方法的步驟。
39、本說明書一個實施例通過確定與待預(yù)測電價相關(guān)的多個特征數(shù)據(jù),并根據(jù)待預(yù)測電價對應(yīng)的電價類型確定多個特征數(shù)據(jù)對應(yīng)的待統(tǒng)計時間區(qū)間;確定待統(tǒng)計時間區(qū)間內(nèi)每個特征數(shù)據(jù)對應(yīng)的多個特征值;根據(jù)每個特征數(shù)據(jù)對應(yīng)的數(shù)據(jù)類型以及多個特征值,確定在待統(tǒng)計時間區(qū)間內(nèi)每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值;將每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值與預(yù)先獲取的初始樣本數(shù)據(jù)進行融合,生成目標樣本數(shù)據(jù)。通過這種處理方式,在傳統(tǒng)的時間序列數(shù)據(jù)的基礎(chǔ)上增加統(tǒng)計數(shù)據(jù),增強了電價預(yù)測模型的訓(xùn)練數(shù)據(jù)的全面性,從而有利于提高模型輸出結(jié)果的準確性和穩(wěn)定性。
1.一種數(shù)據(jù)處理方法,包括:
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理方法,所述數(shù)據(jù)類型包括連續(xù)型數(shù)據(jù);
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)處理方法,還包括:
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)處理方法,還包括:
5.根據(jù)權(quán)利要求1至4任意一項所述的數(shù)據(jù)處理方法,所述數(shù)據(jù)類型還包括離散型數(shù)據(jù);
6.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理方法,所述將所述每個特征數(shù)據(jù)分別對應(yīng)的至少一個數(shù)據(jù)統(tǒng)計值與預(yù)先獲取的初始樣本數(shù)據(jù)進行融合,包括:
7.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理方法,還包括:
8.一種數(shù)據(jù)處理裝置,包括:
9.一種計算設(shè)備,包括:
10.一種計算機可讀存儲介質(zhì),其存儲有計算機可執(zhí)行指令,該計算機可執(zhí)行指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至7任意一項所述數(shù)據(jù)處理方法的步驟。