本申請涉及大數(shù)據(jù)及碳排放技術(shù),特別是一種碳排放動態(tài)跟蹤方法和系統(tǒng)。
背景技術(shù):
1、物聯(lián)網(wǎng)領(lǐng)域通常需要采集大量的數(shù)據(jù)并基于數(shù)據(jù)在一定的時間周期內(nèi)作出相關(guān)的計(jì)算,例如在碳排放跟蹤、測算等應(yīng)用中,有很多檢測系統(tǒng)會進(jìn)行實(shí)時監(jiān)測,也有的系統(tǒng)進(jìn)行較長時間區(qū)間的定期檢測。這些應(yīng)用可能是生成數(shù)據(jù)報(bào)告、預(yù)測未來發(fā)生的事件等等的各類業(yè)務(wù)。在現(xiàn)實(shí)中,數(shù)據(jù)會經(jīng)過不同的路由匯總到消息隊(duì)列中然后被業(yè)務(wù)系統(tǒng)所消費(fèi)。但是由于各種原因,數(shù)據(jù)可能會產(chǎn)生延遲,其到達(dá)消息隊(duì)列中的時間順序并不按照數(shù)據(jù)產(chǎn)生的時間。雖然部分工具提供了亂序數(shù)據(jù)的處理方案,但是若部分?jǐn)?shù)據(jù)延遲太久,會影響實(shí)際業(yè)務(wù)。有部分方案可以利用模型或者統(tǒng)計(jì)方法對數(shù)據(jù)進(jìn)行補(bǔ)全,但是需要綜合數(shù)據(jù)處理及時性和準(zhǔn)確性。
2、上述內(nèi)容為發(fā)明人對本申請相關(guān)技術(shù)的認(rèn)識和理解,其并不必然構(gòu)成現(xiàn)有技術(shù)的部分。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本發(fā)明提供一種碳排放動態(tài)跟蹤方法和系統(tǒng),以平衡數(shù)據(jù)的及時性和準(zhǔn)確性。
2、一方面,本申請實(shí)施例提供了一種碳排放動態(tài)跟蹤方法,包括以下步驟:
3、監(jiān)測終端將采集到的傳感器數(shù)據(jù)通過網(wǎng)關(guān)分發(fā)到消息隊(duì)列,所述傳感器數(shù)據(jù)用于執(zhí)行碳排放跟蹤任業(yè)務(wù);
4、獲取業(yè)務(wù)系統(tǒng)中業(yè)務(wù)所對應(yīng)的監(jiān)測終端,以及業(yè)務(wù)對傳感器數(shù)據(jù)處理的要求;
5、基于對傳感器數(shù)據(jù)處理的要求,確定消息隊(duì)列的窗口尺寸和窗口的延遲時間;
6、業(yè)務(wù)系統(tǒng)根據(jù)消息隊(duì)列在一個窗口周期內(nèi)所獲得的傳感器數(shù)據(jù),確定是否存在缺失的傳感器數(shù)據(jù),然后對所述缺失的數(shù)據(jù)進(jìn)行補(bǔ)全;
7、將補(bǔ)全后的數(shù)據(jù)輸入到跟蹤業(yè)務(wù)模型中得到跟蹤結(jié)果;
8、其中,窗口的延遲時間根據(jù)在一段時間內(nèi)統(tǒng)計(jì)的數(shù)據(jù)延遲數(shù)量、以及業(yè)務(wù)系統(tǒng)填補(bǔ)數(shù)據(jù)所需要的估計(jì)時間來配置。
9、在部分實(shí)施例中,所述窗口的延遲時間通過該方案配置:
10、設(shè)置約束條件,業(yè)務(wù)容許的最大延遲時間tmax≥通信延時tc+數(shù)據(jù)補(bǔ)全時間tf+窗口延遲時間tw;
11、所述數(shù)據(jù)補(bǔ)全時間tf=數(shù)據(jù)補(bǔ)全程序的積壓延遲td+數(shù)據(jù)補(bǔ)全處理時間tp,其中,數(shù)據(jù)補(bǔ)全處理時間=數(shù)據(jù)補(bǔ)全數(shù)量*數(shù)據(jù)補(bǔ)全運(yùn)算量/數(shù)據(jù)并發(fā)處理能力;
12、數(shù)據(jù)補(bǔ)全數(shù)量通過以下方式計(jì)算:統(tǒng)計(jì)晚于窗口區(qū)間到達(dá)的數(shù)據(jù)數(shù)量k,以及延遲到達(dá)的數(shù)據(jù)在時間軸上的分布狀態(tài),根據(jù)窗口延遲時間tw的最小設(shè)置步進(jìn)和統(tǒng)計(jì)晚于窗口區(qū)間到達(dá)的數(shù)據(jù)的分布狀態(tài),確定函數(shù)s,s(tw)表示設(shè)置tw延時之后,窗口延遲時間所未覆蓋的數(shù)據(jù)數(shù)量k的比例,根據(jù)s*k估計(jì)需要進(jìn)行補(bǔ)全的數(shù)據(jù)數(shù)量;
13、構(gòu)建評價(jià)函數(shù)g,評價(jià)函數(shù)由延時因子y和準(zhǔn)確性因子z評價(jià)得分,總延時越大,延時因子越小,需要填補(bǔ)的數(shù)值數(shù)量越大,準(zhǔn)確因子越小;
14、其中,評價(jià)函數(shù)按照得分最大化作為優(yōu)化目標(biāo)進(jìn)行求解,max?g=(ay+bz),a和b,均為系數(shù),max表示求最大值運(yùn)算符號。
15、在部分實(shí)施例中,所述窗口采用根據(jù)數(shù)據(jù)產(chǎn)生時間進(jìn)行數(shù)據(jù)收集,所述窗口根據(jù)窗口尺寸確定采集的數(shù)據(jù)生產(chǎn)時間的寬度。
16、在部分實(shí)施例中,對隊(duì)列中舍棄的數(shù)據(jù)根據(jù)數(shù)據(jù)標(biāo)識判斷是否進(jìn)行緩存,將緩存的數(shù)據(jù)按照預(yù)設(shè)的周期上報(bào)到預(yù)設(shè)的業(yè)務(wù)系統(tǒng)之中,進(jìn)行數(shù)據(jù)修補(bǔ)。
17、在部分實(shí)施例中,包括多個消息隊(duì)列,每個消息隊(duì)列對應(yīng)至少一個用于收集傳感器數(shù)據(jù)的窗口線程,每個窗口線程中的數(shù)據(jù)由業(yè)務(wù)系統(tǒng)中對應(yīng)的業(yè)務(wù)所消費(fèi)。
18、在部分實(shí)施例中,所述處理要求包括數(shù)據(jù)推送頻率和每次推送的數(shù)據(jù)量,所述窗口尺寸根據(jù)業(yè)務(wù)對應(yīng)數(shù)據(jù)的推送頻率和數(shù)據(jù)量確定。
19、在部分實(shí)施例中,業(yè)務(wù)系統(tǒng)根據(jù)確實(shí)數(shù)據(jù)的類型和缺失方式選擇對應(yīng)的算法或者人工智能模型對數(shù)據(jù)進(jìn)行填充。
20、在部分實(shí)施例中,當(dāng)業(yè)務(wù)所要求的推送頻率大于第一閾值和/或最大延遲時間小于第二閾值的情況下,通過評價(jià)函數(shù)g確定窗口的延遲時間,否則,按照推送頻率查表確定窗口的延遲時間。
21、在部分實(shí)施例中,還包括以下步驟,根據(jù)填補(bǔ)數(shù)據(jù)的誤差調(diào)節(jié)業(yè)務(wù)所對應(yīng)的準(zhǔn)確性因子z的系數(shù)。
22、另一方面,本申請實(shí)施例提供了一種碳排放動態(tài)跟蹤系統(tǒng),包括:
23、存儲器,用于存儲程序;
24、處理器,用于加載所處程序以執(zhí)行所述的碳排放動態(tài)跟蹤方法。
25、有益效果:本申請根據(jù)在一段時間內(nèi)統(tǒng)計(jì)的數(shù)據(jù)延遲數(shù)量、以及業(yè)務(wù)系統(tǒng)填補(bǔ)數(shù)據(jù)所需要的估計(jì)時間來配置窗口的延遲時間,能夠利用相關(guān)函數(shù)模型對業(yè)務(wù)消息隊(duì)列中窗口的延時進(jìn)行設(shè)置,從而實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)準(zhǔn)確性和延遲大小之間的平衡。
1.一種碳排放動態(tài)跟蹤方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述窗口的延遲時間通過以下方案配置:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述窗口采用根據(jù)數(shù)據(jù)產(chǎn)生時間進(jìn)行數(shù)據(jù)收集,所述窗口根據(jù)窗口尺寸確定采集的數(shù)據(jù)生產(chǎn)時間的寬度。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,對隊(duì)列中舍棄的數(shù)據(jù)根據(jù)數(shù)據(jù)標(biāo)識判斷是否進(jìn)行緩存,將緩存的數(shù)據(jù)按照預(yù)設(shè)的周期上報(bào)到預(yù)設(shè)的業(yè)務(wù)系統(tǒng)之中,進(jìn)行數(shù)據(jù)修補(bǔ)。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,包括多個消息隊(duì)列,每個消息隊(duì)列對應(yīng)至少一個用于收集傳感器數(shù)據(jù)的窗口線程,每個窗口線程中的數(shù)據(jù)由業(yè)務(wù)系統(tǒng)中對應(yīng)的業(yè)務(wù)所消費(fèi)。
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,所述處理要求包括數(shù)據(jù)推送頻率和每次推送的數(shù)據(jù)量,所述窗口尺寸根據(jù)業(yè)務(wù)對應(yīng)數(shù)據(jù)的推送頻率和數(shù)據(jù)量確定。
7.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,業(yè)務(wù)系統(tǒng)根據(jù)確實(shí)數(shù)據(jù)的類型和缺失方式選擇對應(yīng)的算法或者人工智能模型對數(shù)據(jù)進(jìn)行填充。
8.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,當(dāng)業(yè)務(wù)所要求的推送頻率大于第一閾值和/或最大延遲時間小于第二閾值的情況下,通過評價(jià)函數(shù)g確定窗口的延遲時間,否則,按照推送頻率查表確定窗口的延遲時間。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括以下步驟,根據(jù)填補(bǔ)數(shù)據(jù)的誤差調(diào)節(jié)業(yè)務(wù)所對應(yīng)的準(zhǔn)確性因子z的系數(shù)。
10.一種碳排放動態(tài)跟蹤系統(tǒng),其特征在于,包括: