本技術(shù)涉及數(shù)據(jù)處理,尤其涉及一種基于大數(shù)據(jù)的審計(jì)監(jiān)測方法及系統(tǒng)。
背景技術(shù):
1、財(cái)務(wù)數(shù)據(jù)審計(jì)是對企業(yè)財(cái)務(wù)報(bào)表和相關(guān)記錄進(jìn)行系統(tǒng)性檢查的過程,旨在評估企業(yè)財(cái)務(wù)報(bào)表的準(zhǔn)確性和完整性,并定位到財(cái)務(wù)數(shù)據(jù)中異常數(shù)據(jù)。審計(jì)過程的工作量巨大,為了提高審計(jì)工作的效率,需要借助人工智能的手段對審計(jì)過程進(jìn)行監(jiān)測。
2、目前,申請公布號為cn118094451a的專利申請文件公開了一種基于大數(shù)據(jù)的審計(jì)監(jiān)測系統(tǒng),包括:數(shù)據(jù)采集模塊,用于采集若干財(cái)務(wù)數(shù)據(jù);基準(zhǔn)k值獲取模塊,用于根據(jù)若干財(cái)務(wù)數(shù)據(jù)之間的距離變動情況得到若干團(tuán)簇集合;根據(jù)每個團(tuán)簇集合中數(shù)據(jù)數(shù)量得到每個財(cái)務(wù)數(shù)據(jù)的基準(zhǔn)k值;優(yōu)化k值和偏離度獲取模塊,用于根據(jù)每個財(cái)務(wù)數(shù)據(jù)與所屬團(tuán)簇集合的幾何中心的距離,每個財(cái)務(wù)數(shù)據(jù)所屬團(tuán)簇集合的形態(tài)以及所屬團(tuán)簇集合中數(shù)據(jù)之間距離的離散情況得到每個財(cái)務(wù)數(shù)據(jù)的k值調(diào)整系數(shù);利用每個財(cái)務(wù)數(shù)據(jù)的k值調(diào)整系數(shù)對基準(zhǔn)k值進(jìn)行修正得到每個財(cái)務(wù)數(shù)據(jù)的優(yōu)化k值,根據(jù)每個財(cái)務(wù)數(shù)據(jù)的優(yōu)化k值得到每個財(cái)務(wù)數(shù)據(jù)的鄰域數(shù)據(jù);根據(jù)每個財(cái)務(wù)數(shù)據(jù)的所有鄰域數(shù)據(jù)的分布形態(tài)得到每個財(cái)務(wù)數(shù)據(jù)的偏離度;異常檢測模塊,用于根據(jù)每個財(cái)務(wù)數(shù)據(jù)的鄰域數(shù)據(jù)和偏離度實(shí)現(xiàn)異常檢測。
3、上述方法依據(jù)若干個財(cái)務(wù)數(shù)據(jù)之間的距離進(jìn)行異常檢測,判斷每個財(cái)務(wù)數(shù)據(jù)是否正常,然而,在財(cái)務(wù)審計(jì)過程中,多種財(cái)務(wù)數(shù)據(jù)之間相互影響,比如銷售量和應(yīng)收賬款,銷售量的變化會引起應(yīng)收賬款產(chǎn)生變化,忽略各財(cái)務(wù)數(shù)據(jù)之間相互影響,會導(dǎo)致財(cái)務(wù)數(shù)據(jù)審計(jì)過程中的監(jiān)測結(jié)果不準(zhǔn)確。
技術(shù)實(shí)現(xiàn)思路
1、為了解決財(cái)務(wù)數(shù)據(jù)審計(jì)過程中監(jiān)測結(jié)果不準(zhǔn)確的技術(shù)問題,本技術(shù)提供了一種基于大數(shù)據(jù)的審計(jì)監(jiān)測方法及系統(tǒng),能夠綜合多種財(cái)務(wù)數(shù)據(jù)之間相互影響,在財(cái)務(wù)數(shù)據(jù)審計(jì)過程中,得到準(zhǔn)確的監(jiān)測結(jié)果。
2、本技術(shù)第一方面,提供了一種基于大數(shù)據(jù)的審計(jì)監(jiān)測方法,所述監(jiān)測方法包括:采集各財(cái)務(wù)數(shù)據(jù)目標(biāo)時(shí)間窗口內(nèi)的時(shí)間序列,并利用格蘭杰因果檢驗(yàn)判斷各財(cái)務(wù)數(shù)據(jù)間的因果關(guān)系;獲取各財(cái)務(wù)數(shù)據(jù)時(shí)間序列的實(shí)測趨勢值;計(jì)算各財(cái)務(wù)數(shù)據(jù)的預(yù)測趨勢值,財(cái)務(wù)數(shù)據(jù)的預(yù)測趨勢值為:
3、,為財(cái)務(wù)數(shù)據(jù)的種數(shù),表示財(cái)務(wù)數(shù)據(jù)對財(cái)務(wù)數(shù)據(jù)的因果關(guān)系,為財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值;響應(yīng)于任意財(cái)務(wù)數(shù)據(jù)的趨勢偏差大于預(yù)設(shè)閾值,監(jiān)測結(jié)果為異常,反之,監(jiān)測結(jié)果為正常,趨勢偏差為預(yù)測趨勢值和實(shí)測趨勢值的差值絕對值。
4、利用格蘭杰因果檢驗(yàn)判斷各財(cái)務(wù)數(shù)據(jù)間的因果關(guān)系,財(cái)務(wù)數(shù)據(jù)對財(cái)務(wù)數(shù)據(jù)的因果關(guān)系能夠反映財(cái)務(wù)數(shù)據(jù)的前期變化能夠有效地預(yù)測財(cái)務(wù)數(shù)據(jù)的變化,即財(cái)務(wù)數(shù)據(jù)的前期變化對財(cái)務(wù)數(shù)據(jù)的變化趨勢的影響;依據(jù)各財(cái)務(wù)數(shù)據(jù)目標(biāo)時(shí)間窗口內(nèi)的時(shí)間序列獲取各財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值,并依據(jù)各財(cái)務(wù)數(shù)據(jù)間的因果關(guān)系計(jì)算各財(cái)務(wù)數(shù)據(jù)的預(yù)測趨勢值;當(dāng)任意財(cái)務(wù)數(shù)據(jù)的趨勢偏差大于預(yù)設(shè)閾值時(shí),監(jiān)測結(jié)果為異常,反之,監(jiān)測結(jié)果為正常,綜合多種財(cái)務(wù)數(shù)據(jù)之間的相互影響,得到了準(zhǔn)確的監(jiān)測結(jié)果。
5、優(yōu)選地,所述財(cái)務(wù)數(shù)據(jù)為數(shù)值型數(shù)據(jù),所述財(cái)務(wù)數(shù)據(jù)包括固定資產(chǎn)、投資資產(chǎn)、應(yīng)收賬款、收益和管理支出。
6、優(yōu)選地,各財(cái)務(wù)數(shù)據(jù)均對應(yīng)一個目標(biāo)時(shí)間窗口,所述目標(biāo)時(shí)間窗口包括當(dāng)前采集周期以及當(dāng)前采集周期之前多個采集周期,財(cái)務(wù)數(shù)據(jù)的時(shí)間序列包括目標(biāo)時(shí)間窗口內(nèi)各采集周期財(cái)務(wù)數(shù)據(jù)的取值。
7、由于財(cái)務(wù)數(shù)據(jù)的周期性和變化趨勢不同,為能夠真實(shí)準(zhǔn)確地采集各財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值,為各財(cái)務(wù)數(shù)據(jù)設(shè)置一個目標(biāo)時(shí)間窗口,提高審計(jì)監(jiān)測結(jié)果的準(zhǔn)確性。
8、優(yōu)選地,所述目標(biāo)時(shí)間窗口的獲取方法包括:利用自相關(guān)函數(shù)獲取各財(cái)務(wù)數(shù)據(jù)的變化周期,將變化周期設(shè)置為對應(yīng)財(cái)務(wù)數(shù)據(jù)的目標(biāo)時(shí)間窗口。
9、優(yōu)選地,財(cái)務(wù)數(shù)據(jù)對財(cái)務(wù)數(shù)據(jù)的因果關(guān)系的獲取方法包括:建立財(cái)務(wù)數(shù)據(jù)的第一自回歸模型,第一自回歸模型的輸入為財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中當(dāng)前采集周期之前各采集周期的取值,輸出為當(dāng)前采集周期財(cái)務(wù)數(shù)據(jù)的取值;建立第二自回歸模型,第二自回歸模型的輸入為財(cái)務(wù)數(shù)據(jù)和財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中當(dāng)前采集周期之前各采集周期的取值,輸出為當(dāng)前采集周期財(cái)務(wù)數(shù)據(jù)的取值;將第一自回歸模型和第二自回歸模型中誤差項(xiàng)的差值絕對值作為財(cái)務(wù)數(shù)據(jù)對財(cái)務(wù)數(shù)據(jù)的因果關(guān)系。
10、第一自回歸模型中的誤差項(xiàng)只考慮了財(cái)務(wù)數(shù)據(jù)過去采集周期的數(shù)值對當(dāng)前采集周期內(nèi)財(cái)務(wù)數(shù)據(jù)取值的影響,第二自回歸模型中的誤差項(xiàng)考慮了財(cái)務(wù)數(shù)據(jù)以及財(cái)務(wù)數(shù)據(jù)過去采集周期的數(shù)值對當(dāng)前采集周期內(nèi)財(cái)務(wù)數(shù)據(jù)取值的影響,因此,第一自回歸模型和第二自回歸模型中誤差項(xiàng)的差值絕對值能夠反映考慮財(cái)務(wù)數(shù)據(jù)的前期變化對財(cái)務(wù)數(shù)據(jù)的取值的影響,實(shí)現(xiàn)因果關(guān)系的精準(zhǔn)量化。
11、優(yōu)選地,財(cái)務(wù)數(shù)據(jù)的第一自回歸模型為:
12、,
13、所述第二自回歸模型滿足關(guān)系式:
14、,
15、其中,是財(cái)務(wù)數(shù)據(jù)的自回歸系數(shù),為財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中當(dāng)前采集周期之前各采集周期的取值,為第一自回歸模型的誤差項(xiàng),是財(cái)務(wù)數(shù)據(jù)的自回歸系數(shù),為財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中當(dāng)前采集周期之前各采集周期的取值,為第二自回歸模型的誤差項(xiàng),為當(dāng)前采集周期財(cái)務(wù)數(shù)據(jù)的取值,和分別為財(cái)務(wù)數(shù)據(jù)和財(cái)務(wù)數(shù)據(jù)目標(biāo)時(shí)間窗口的長度。
16、優(yōu)選地,財(cái)務(wù)數(shù)據(jù)對財(cái)務(wù)數(shù)據(jù)的因果關(guān)系的獲取方法包括:若依據(jù)格蘭杰因果檢驗(yàn)判斷財(cái)務(wù)數(shù)據(jù)對財(cái)務(wù)數(shù)據(jù)存在因果關(guān)系,則將置為1,反之,將置為0。
17、優(yōu)選地,財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值為:
18、;和為一組數(shù)值對,分別為財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中編號和編號的數(shù)值;表示獲取財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中滿足的所有數(shù)值對,為平均值函數(shù)。
19、通過財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中所有數(shù)值對計(jì)算財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值,財(cái)務(wù)數(shù)據(jù)的時(shí)間序列中能夠獲取大量數(shù)值對,通過取平均值可避免時(shí)間序列中的異常點(diǎn)對實(shí)測趨勢值的影響,實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值的準(zhǔn)確量化。
20、優(yōu)選地,財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值的獲取方法包括:利用最小二乘法對財(cái)務(wù)數(shù)據(jù)的時(shí)間序列進(jìn)行擬合,得到線性回歸模型,將所述線性回歸模型中的斜率作為財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值。
21、優(yōu)選地,采集各財(cái)務(wù)數(shù)據(jù)目標(biāo)時(shí)間窗口內(nèi)的時(shí)間序列之前,所述監(jiān)測方法還包括:設(shè)置各財(cái)務(wù)數(shù)據(jù)的初始時(shí)間窗口,在監(jiān)測結(jié)果為正常的歷史審計(jì)數(shù)據(jù)中計(jì)算各財(cái)務(wù)數(shù)據(jù)的趨勢偏差,將最小趨勢偏差作為目標(biāo)函數(shù)值;更新各財(cái)務(wù)數(shù)據(jù)的初始時(shí)間窗口,將目標(biāo)函數(shù)值取最小值時(shí)的初始時(shí)間窗口作為各財(cái)務(wù)數(shù)據(jù)的目標(biāo)時(shí)間窗口,將目標(biāo)函數(shù)值的最小值作為預(yù)設(shè)閾值。
22、在監(jiān)測結(jié)果為正常的歷史審計(jì)數(shù)據(jù)中,將預(yù)設(shè)閾值的取值問題,以及各財(cái)務(wù)數(shù)據(jù)目標(biāo)時(shí)間窗口的設(shè)置問題轉(zhuǎn)化為尋優(yōu)問題,將各財(cái)務(wù)數(shù)據(jù)趨勢偏差的最小值達(dá)到最小為優(yōu)化目標(biāo),快速、準(zhǔn)確地確定各財(cái)務(wù)數(shù)據(jù)的目標(biāo)時(shí)間窗口,并將各財(cái)務(wù)數(shù)據(jù)趨勢偏差的最小值作為預(yù)設(shè)閾值,以準(zhǔn)確獲取財(cái)務(wù)數(shù)據(jù)審計(jì)過程的監(jiān)測結(jié)果。
23、本技術(shù)第二方面,還提供了一種基于大數(shù)據(jù)的審計(jì)監(jiān)測系統(tǒng),包括處理器和存儲器,所述存儲器存儲有計(jì)算機(jī)程序指令,當(dāng)所述計(jì)算機(jī)程序指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本技術(shù)第一方面所述的一種基于大數(shù)據(jù)的審計(jì)監(jiān)測方法。
24、本技術(shù)的技術(shù)方案具有以下有益技術(shù)效果:
25、利用格蘭杰因果檢驗(yàn)判斷各財(cái)務(wù)數(shù)據(jù)間的因果關(guān)系,財(cái)務(wù)數(shù)據(jù)對財(cái)務(wù)數(shù)據(jù)的因果關(guān)系能夠反映財(cái)務(wù)數(shù)據(jù)的前期變化能夠有效地預(yù)測財(cái)務(wù)數(shù)據(jù)的變化,即財(cái)務(wù)數(shù)據(jù)的前期變化對財(cái)務(wù)數(shù)據(jù)的變化趨勢的影響;依據(jù)各財(cái)務(wù)數(shù)據(jù)目標(biāo)時(shí)間窗口內(nèi)的時(shí)間序列獲取各財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值,并依據(jù)各財(cái)務(wù)數(shù)據(jù)間的因果關(guān)系計(jì)算各財(cái)務(wù)數(shù)據(jù)的預(yù)測趨勢值;若一個財(cái)務(wù)數(shù)據(jù)的預(yù)測趨勢值與實(shí)測趨勢值相差較小,則表示實(shí)測趨勢值滿足各財(cái)務(wù)數(shù)據(jù)間的因果關(guān)系,該財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值處于正常狀態(tài),相反地,若一個財(cái)務(wù)數(shù)據(jù)的預(yù)測趨勢值與實(shí)測趨勢值相差較大,表示實(shí)測趨勢值不滿足各財(cái)務(wù)數(shù)據(jù)間的因果關(guān)系,該財(cái)務(wù)數(shù)據(jù)的實(shí)測趨勢值處于異常狀態(tài),出現(xiàn)了異常波動;因此,當(dāng)任意財(cái)務(wù)數(shù)據(jù)的趨勢偏差大于預(yù)設(shè)閾值時(shí),監(jiān)測結(jié)果為異常,反之,監(jiān)測結(jié)果為正常,綜合多種財(cái)務(wù)數(shù)據(jù)之間的相互影響,得到了準(zhǔn)確的監(jiān)測結(jié)果。