本技術(shù)涉及人工智能,尤其涉及一種車險數(shù)據(jù)處理方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、隨著汽車數(shù)量的不斷增加,用戶的車險需求也在逐漸增加。傳統(tǒng)的車險業(yè)務(wù)主要依靠保險代理人的經(jīng)驗判斷評估投保人的風險和保險費率,這種方式存在主觀性和不準確的問題。
2、現(xiàn)有技術(shù)中,車險公司利用大數(shù)據(jù)技術(shù),收集分析投保人的數(shù)據(jù)信息,對投保人進行風險評估,從而制定保險費率。
3、然而,現(xiàn)有的技術(shù)方案在對投保人進行風險評估時,僅采集車輛歷史上的出險情況,并根據(jù)車輛歷史上的出險情況對投標人進行風險評估,導致車險公司對投保人的風險評估不準確的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供一種車險數(shù)據(jù)處理方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,用以解決現(xiàn)有技術(shù)中存在的車險公司對投保人的風險評估不準確的問題。
2、第一方面,本技術(shù)實施例提供一種車險數(shù)據(jù)處理方法,應用于計算機設(shè)備,包括:
3、響應于工作人員輸入車險數(shù)據(jù)的操作,獲取車險數(shù)據(jù);
4、根據(jù)所述車險數(shù)據(jù)的特征維度,判斷所述車險數(shù)據(jù)的可用率;
5、若所述車險數(shù)據(jù)的可用率滿足預設(shè)可用率限值,則對所述車險數(shù)據(jù)進行數(shù)據(jù)清洗,以生成清洗后的車險數(shù)據(jù);
6、根據(jù)特征工程模型的數(shù)據(jù)格式,對所述清洗后的車險數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換,以生成轉(zhuǎn)換后的車險數(shù)據(jù);
7、對所述轉(zhuǎn)換后的車險數(shù)據(jù)進行數(shù)據(jù)編碼,以生成訓練數(shù)據(jù);
8、根據(jù)相關(guān)性原則對所述訓練數(shù)據(jù)進行篩選,得到篩選后的訓練數(shù)據(jù);
9、對所述篩選后的訓練數(shù)據(jù)進行降維處理,以得到降維后的訓練數(shù)據(jù);
10、根據(jù)卡方檢驗模型驗證所述降維后的訓練數(shù)據(jù),生成第一驗證結(jié)果;
11、根據(jù)信息增益模型驗證所述降維后的訓練數(shù)據(jù),生成第二驗證結(jié)果;
12、若所述第一驗證結(jié)果和所述第二驗證結(jié)果滿足預設(shè)的限值,則根據(jù)所述降維后的訓練數(shù)據(jù)訓練特征工程模型,以生成訓練后的特征工程模型;
13、響應于工作人員輸入待評估數(shù)據(jù)的操作,根據(jù)所述訓練后的特征工程模型對所述待評估數(shù)據(jù)進行特征提取,以生成特征數(shù)據(jù)集;
14、將所述特征數(shù)據(jù)集輸入風險評估模型,以輸出投保人的風險評估信息。
15、在一種可能的實施方式中,所述對所述篩選后的訓練數(shù)據(jù)進行降維處理,以得到降維后的訓練數(shù)據(jù),包括:獲取所述篩選后的訓練數(shù)據(jù)的特征維度;根據(jù)降維模型對所述篩選后的訓練數(shù)據(jù)的特征維度進行降維處理,以得到降維后的訓練數(shù)據(jù)。
16、在一種可能的實施方式中,所述降維模型,為:
17、
18、式中,表示降維后的訓練數(shù)據(jù)的方差;x和y表示特征維度數(shù)據(jù);和表示特征維度數(shù)據(jù)的平均值;表示特征維度x的方差;表示特征維度y的方差;mean(x)表示x特征維度數(shù)據(jù)的均值。
19、在一種可能的實施方式中,所述卡方檢驗模型模型,為:
20、
21、式中,x表示卡方統(tǒng)計量;a表示降維后的訓練數(shù)據(jù);t表示降維前的訓練數(shù)據(jù)。
22、在一種可能的實施方式中,所述信息增益模型,為:
23、g(d,a)=h(d)-h(d|a)
24、
25、式中,g(d,a)表示信息增益;d表示降維后的訓練數(shù)據(jù);a表示車險數(shù)據(jù)的應用場景;h(d|a)表示降維后的訓練數(shù)據(jù)在a應用場景下的信息熵;h(d)表示降維后訓練數(shù)據(jù)的信息熵;ck表示降維后的訓練數(shù)據(jù)中的特征參數(shù);wi表示權(quán)重;i和k表示降維后的訓練數(shù)據(jù)的特征個數(shù)。
26、在一種可能的實施方式中,所述若所述第一驗證結(jié)果和所述第二驗證結(jié)果滿足預設(shè)的限值,則根據(jù)所述降維后的訓練數(shù)據(jù)訓練特征工程模型,以生成訓練后的特征工程模型之后,還包括:配置模型監(jiān)控探針;通過所述模型監(jiān)控探針驗證所述特征工程模型輸出的特征數(shù)據(jù)集;若所述特征數(shù)據(jù)集中的特征質(zhì)量未到達預設(shè)的特征質(zhì)量閾值,則獲取未達到所述特征質(zhì)量閾值的特征數(shù)據(jù);根據(jù)所述未達到所述特征質(zhì)量閾值的特征數(shù)據(jù)獲取所述特征工程模型中對應的特征權(quán)重;調(diào)整所述特征工程模型中對應的特征權(quán)重,以生成調(diào)整后的特征工程模型。
27、第二方面,本技術(shù)實施例提供一種車險數(shù)據(jù)處理裝置,應用于計算機設(shè)備,包括:
28、第一獲取模塊,用于響應于工作人員輸入車險數(shù)據(jù)的操作,獲取車險數(shù)據(jù);
29、判斷模塊,用于根據(jù)所述車險數(shù)據(jù)的特征維度,判斷所述車險數(shù)據(jù)的可用率;
30、清洗模塊,用于若所述車險數(shù)據(jù)的可用率滿足預設(shè)可用率限值,則對所述車險數(shù)據(jù)進行數(shù)據(jù)清洗,以生成清洗后的車險數(shù)據(jù);
31、轉(zhuǎn)換模塊,用于根據(jù)特征工程模型的數(shù)據(jù)格式,對所述清洗后的車險數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換,以生成轉(zhuǎn)換后的車險數(shù)據(jù);
32、編碼模塊,用于對所述轉(zhuǎn)換后的車險數(shù)據(jù)進行數(shù)據(jù)編碼,以生成訓練數(shù)據(jù);
33、篩選模塊,用于根據(jù)相關(guān)性原則對所述訓練數(shù)據(jù)進行篩選,得到篩選后的訓練數(shù)據(jù);
34、降維模塊,用于對所述篩選后的訓練數(shù)據(jù)進行降維處理,以得到降維后的訓練數(shù)據(jù);
35、第一生成模塊,用于根據(jù)卡方檢驗模型驗證所述降維后的訓練數(shù)據(jù),生成第一驗證結(jié)果;
36、第二生成模塊,用于根據(jù)信息增益模型驗證所述降維后的訓練數(shù)據(jù),生成第二驗證結(jié)果;
37、訓練模塊,用于若所述第一驗證結(jié)果和所述第二驗證結(jié)果滿足預設(shè)的限值,則根據(jù)所述降維后的訓練數(shù)據(jù)訓練特征工程模型,以生成訓練后的特征工程模型;
38、提取模塊,用于響應于工作人員輸入待評估數(shù)據(jù)的操作,根據(jù)所述訓練后的特征工程模型對所述待評估數(shù)據(jù)進行特征提取,以生成特征數(shù)據(jù)集;
39、輸出模塊,用于將所述特征數(shù)據(jù)集輸入風險評估模型,以輸出投保人的風險評估信息。
40、第三方面,本技術(shù)實施例提供一種車險數(shù)據(jù)處理設(shè)備,包括:
41、至少一個處理器和存儲器;
42、所述存儲器存儲計算機執(zhí)行指令;
43、所述至少一個處理器執(zhí)行所述存儲器存儲的計算機執(zhí)行指令,使得所述至少一個處理器執(zhí)行如上第一方面和/或第一方面各種可能的實施方式。
44、第四方面,本技術(shù)實施例提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)中存儲有計算機執(zhí)行指令,所述計算機執(zhí)行指令被處理器執(zhí)行時用于實現(xiàn)如上第一方面和/或第一方面各種可能的實施方式。
45、第五方面,本技術(shù)實施例提供一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上第一方面和/或第一方面各種可能的實施方式。
46、本技術(shù)實施例提供的車險數(shù)據(jù)處理方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,通過判斷車險數(shù)據(jù)的可用率,若滿足預設(shè)的可用率限值,對車險數(shù)據(jù)進行數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換,對轉(zhuǎn)換后的車險數(shù)據(jù)進行數(shù)據(jù)編碼,生成訓練數(shù)據(jù),根據(jù)相關(guān)性原則篩選訓練數(shù)據(jù),對篩選后的訓練數(shù)據(jù)降維處理,去除噪聲和冗余,并通過卡方檢驗模型和信息增益模型驗證降維后的訓練數(shù)據(jù),若降維后的訓練數(shù)據(jù)滿足預設(shè)的限值,則通過降維后的訓練數(shù)據(jù)訓練特征工程模型,將待評估數(shù)據(jù)輸入特征工程模型,以輸出特征數(shù)據(jù)集,利用特征數(shù)據(jù)集輸入風險評估模型輸出投保人的風險評估信息,利用特征工程模型提取表征用戶特征的特征數(shù)據(jù)集,提高了車險公司對投保人的風險評估的準確性。