本發(fā)明涉及數(shù)據(jù)處理技術(shù),尤其涉及一種基于人工智能的語音情感分析方法及系統(tǒng)。
背景技術(shù):
1、在現(xiàn)代客戶服務(wù)和心理健康評(píng)估中,了解用戶的情緒狀態(tài)對(duì)于提供個(gè)性化服務(wù)和及時(shí)干預(yù)至關(guān)重要。目前,情感分析主要依賴于文本數(shù)據(jù),但忽視了語音中的情感信息。隨著人工智能和深度學(xué)習(xí)技術(shù)的發(fā)展,語音情感分析成為可能,但現(xiàn)有系統(tǒng)在實(shí)時(shí)性和準(zhǔn)確性上仍存在許多不足。
技術(shù)實(shí)現(xiàn)思路
1、基于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于人工智能的語音情感分析方法及系統(tǒng)。
2、根據(jù)本發(fā)明的一個(gè)方面,提供一種基于人工智能的語音情感分析方法,包括以下步驟:
3、響應(yīng)于在任一觸發(fā)時(shí)刻接收到采集觸發(fā)指令,建立音頻采集任務(wù),以基于所述音頻采集任務(wù)進(jìn)行對(duì)應(yīng)目標(biāo)用戶的音頻采集,得到音頻采集數(shù)據(jù);
4、對(duì)所述音頻采集數(shù)據(jù)進(jìn)行預(yù)處理,得到音頻優(yōu)化數(shù)據(jù);
5、基于預(yù)設(shè)情感分析策略對(duì)所述音頻優(yōu)化數(shù)據(jù)進(jìn)行情感分析,得到與所述音頻優(yōu)化數(shù)據(jù)對(duì)應(yīng)的情感信息;
6、基于所述情感信息確定與所述目標(biāo)用戶對(duì)應(yīng)的情感狀態(tài),并基于所述情感狀態(tài)確定是否需要對(duì)所述目標(biāo)用戶進(jìn)行情感干預(yù)。
7、可選地,在根據(jù)本發(fā)明的方法中,響應(yīng)于在任一觸發(fā)時(shí)刻接收到采集觸發(fā)指令,建立音頻采集任務(wù),以基于所述音頻采集任務(wù)進(jìn)行對(duì)應(yīng)目標(biāo)用戶的音頻采集,得到音頻采集數(shù)據(jù),包括:
8、響應(yīng)于在任一觸發(fā)時(shí)刻接收到采集觸發(fā)指令,建立音頻采集任務(wù),并調(diào)取與所述音頻采集任務(wù)對(duì)應(yīng)的預(yù)設(shè)采集指示音頻進(jìn)行輸出;
9、響應(yīng)于完成對(duì)所述預(yù)設(shè)采集指示音頻的輸出,觸發(fā)預(yù)設(shè)音頻采集面進(jìn)行對(duì)應(yīng)目標(biāo)用戶的音頻采集,得到與所述目標(biāo)用戶對(duì)應(yīng)的測(cè)試音頻數(shù)據(jù);
10、基于所述測(cè)試音頻數(shù)據(jù)對(duì)所述目標(biāo)用戶進(jìn)行測(cè)試評(píng)分,并基于得到的音頻測(cè)試分值確定與所述目標(biāo)用戶對(duì)應(yīng)的音頻屬性;
11、響應(yīng)于所述目標(biāo)用戶的音頻屬性為正向評(píng)價(jià)屬性,調(diào)取與所述音頻采集任務(wù)對(duì)應(yīng)的預(yù)設(shè)采集確定音頻進(jìn)行輸出;
12、響應(yīng)于完成對(duì)所述預(yù)設(shè)采集指示音頻的輸出,觸發(fā)預(yù)設(shè)音頻采集面進(jìn)行對(duì)應(yīng)目標(biāo)用戶的音頻采集,得到與所述目標(biāo)用戶對(duì)應(yīng)的音頻采集數(shù)據(jù);
13、或者,
14、響應(yīng)于所述目標(biāo)用戶的音頻屬性為負(fù)向評(píng)價(jià)屬性,基于所述測(cè)試音頻數(shù)據(jù)創(chuàng)建當(dāng)前調(diào)整音頻,以作為更新后的預(yù)設(shè)采集指示音頻再次進(jìn)行輸出。
15、可選地,在根據(jù)本發(fā)明的方法中,基于所述測(cè)試音頻數(shù)據(jù)對(duì)所述目標(biāo)用戶進(jìn)行測(cè)試評(píng)分,并基于得到的音頻測(cè)試分值確定與所述目標(biāo)用戶對(duì)應(yīng)的音頻屬性,包括:
16、基于所述測(cè)試音頻數(shù)據(jù)確定所述目標(biāo)用戶與所述預(yù)設(shè)音頻采集面之間的音頻輸出夾角,并基于音頻輸出夾角確定與所述目標(biāo)用戶對(duì)應(yīng)的偏移評(píng)分;
17、基于所述測(cè)試音頻數(shù)據(jù)確定與所述目標(biāo)用戶對(duì)應(yīng)的音頻輸出分貝,并基于所述音頻輸出分貝確定與所述目標(biāo)用戶對(duì)應(yīng)的音量評(píng)分;
18、對(duì)所述偏移評(píng)分以及音量評(píng)分進(jìn)行融合計(jì)算,并將得到的與所述目標(biāo)用戶對(duì)應(yīng)的音頻測(cè)試分值與基準(zhǔn)音頻分值進(jìn)行比較;
19、當(dāng)所述音頻測(cè)試分值小于所述基準(zhǔn)音頻分值時(shí),將所述目標(biāo)用戶的輸出屬性確定為負(fù)向評(píng)價(jià)屬性;
20、當(dāng)所述音頻測(cè)試分值大于等于所述基準(zhǔn)音頻分值時(shí),將所述目標(biāo)用戶的輸出屬性確定為正向評(píng)價(jià)屬性。
21、可選地,在根據(jù)本發(fā)明的方法中,響應(yīng)于所述目標(biāo)用戶的音頻屬性為負(fù)向評(píng)價(jià)屬性,基于所述測(cè)試音頻數(shù)據(jù)創(chuàng)建當(dāng)前調(diào)整音頻,以作為更新后的預(yù)設(shè)采集指示音頻再次進(jìn)行輸出,包括:
22、響應(yīng)于所述目標(biāo)用戶的音頻屬性為負(fù)向評(píng)價(jià)屬性,獲取與所述目標(biāo)用戶對(duì)應(yīng)的音頻輸出夾角以及音頻輸出分貝;
23、將所述音頻輸出夾角、音頻輸出分貝分別與調(diào)取的基準(zhǔn)音頻夾角、基準(zhǔn)音頻分貝進(jìn)行差值計(jì)算,得到音頻夾角差值以及音頻分貝差值;
24、調(diào)取初始調(diào)整音頻,其中,所述初始調(diào)整音頻包括基準(zhǔn)音頻段以及穿插于所述基準(zhǔn)音頻段中的夾角填充槽位、分貝填充槽位;
25、基于所述音頻夾角差值、音頻分貝差值分別對(duì)所述夾角填充槽位、分貝填充槽位進(jìn)行填充,得到當(dāng)前調(diào)整音頻;
26、將當(dāng)前調(diào)整音頻作為更新后的預(yù)設(shè)采集指示音頻,并將所述預(yù)設(shè)采集指示音頻基于所述預(yù)設(shè)音頻采集面進(jìn)行對(duì)應(yīng)所述基準(zhǔn)音頻分貝的輸出。
27、可選地,在根據(jù)本發(fā)明的方法中,對(duì)所述音頻采集數(shù)據(jù)進(jìn)行預(yù)處理,得到音頻優(yōu)化數(shù)據(jù),包括:
28、基于預(yù)設(shè)頻域?yàn)V波策略對(duì)所述音頻采集數(shù)據(jù)進(jìn)行噪聲去除;
29、對(duì)經(jīng)過噪聲去除后的音頻采集數(shù)據(jù)進(jìn)行歸一化處理;
30、響應(yīng)于完成對(duì)所述音頻采集數(shù)據(jù)的歸一化處理,對(duì)完成歸一化處理后的音頻采集數(shù)據(jù)進(jìn)行特征提取,得到與所述音頻采集數(shù)據(jù)對(duì)應(yīng)的音頻優(yōu)化數(shù)據(jù)。
31、可選地,在根據(jù)本發(fā)明的方法中,基于預(yù)設(shè)頻域?yàn)V波策略對(duì)所述音頻采集數(shù)據(jù)進(jìn)行噪聲去除,包括:
32、基于語音活動(dòng)檢測(cè)對(duì)所述音頻采集數(shù)據(jù)進(jìn)行噪聲類型的確定,得到與所述音頻采集數(shù)據(jù)對(duì)應(yīng)的噪聲特性;
33、對(duì)所述音頻采集數(shù)據(jù)分別進(jìn)行包括數(shù)據(jù)分割、信號(hào)加窗的信號(hào)預(yù)處理,得到對(duì)應(yīng)時(shí)域的音頻采集數(shù)據(jù);
34、對(duì)經(jīng)過信號(hào)預(yù)處理的音頻采集數(shù)據(jù)進(jìn)行頻域轉(zhuǎn)換,得到對(duì)應(yīng)所述頻域的音頻采集數(shù)據(jù);
35、對(duì)對(duì)應(yīng)所述頻域的音頻采集數(shù)據(jù)進(jìn)行濾波處理,并將經(jīng)過所述濾波處理后的音頻采集數(shù)據(jù)進(jìn)行時(shí)域轉(zhuǎn)換,得到對(duì)應(yīng)所述時(shí)域的音頻采集數(shù)據(jù);
36、對(duì)對(duì)應(yīng)所述時(shí)域的音頻采集數(shù)據(jù)進(jìn)行性能評(píng)估,得到域所述音頻采集數(shù)據(jù)對(duì)應(yīng)的感知質(zhì)量,并響應(yīng)于所述感知質(zhì)量滿足預(yù)設(shè)輸出條件,完成對(duì)所述音頻采集數(shù)據(jù)的噪聲去除。
37、可選地,在根據(jù)本發(fā)明的方法中,對(duì)經(jīng)過噪聲去除后的音頻采集數(shù)據(jù)進(jìn)行歸一化處理,包括:
38、對(duì)經(jīng)過噪聲去除后的音頻采集數(shù)據(jù)進(jìn)行分幀處理,并將經(jīng)過分幀處理后的音頻采集數(shù)據(jù)進(jìn)行加窗處理;
39、對(duì)經(jīng)過加窗處理后的音頻采集數(shù)據(jù)進(jìn)行均值、標(biāo)準(zhǔn)差的計(jì)算,并將得到的對(duì)應(yīng)所述音頻采集數(shù)據(jù)的均值、標(biāo)準(zhǔn)差代入以下公式對(duì)所述音頻采集數(shù)據(jù)進(jìn)行歸一化處理:
40、;
41、其中,(?x?)?為經(jīng)過加窗處理的音頻采集數(shù)據(jù),(?\mu?)?為均值,(?\sigma?)?為標(biāo)準(zhǔn)差,(?x_{\text{norm}}?)?為經(jīng)過歸一化處理后的音頻采集數(shù)據(jù)。
42、可選地,在根據(jù)本發(fā)明的方法中,響應(yīng)于完成對(duì)所述音頻采集數(shù)據(jù)的歸一化處理,對(duì)完成歸一化處理后的音頻采集數(shù)據(jù)進(jìn)行特征提取,得到與所述音頻采集數(shù)據(jù)對(duì)應(yīng)的音頻優(yōu)化數(shù)據(jù),包括:
43、響應(yīng)于完成對(duì)所述音頻采集數(shù)據(jù)的歸一化處理,對(duì)經(jīng)過歸一化處理后的音頻采集數(shù)據(jù)進(jìn)行分幀處理,并將經(jīng)過分幀處理后的音頻采集數(shù)據(jù)進(jìn)行加窗處理;
44、對(duì)經(jīng)過所述加窗處理后的音頻采集數(shù)據(jù)進(jìn)行快速傅立葉變換,以將對(duì)應(yīng)時(shí)域的音頻采集數(shù)據(jù)轉(zhuǎn)換為對(duì)應(yīng)頻域的音頻采集數(shù)據(jù);
45、對(duì)對(duì)應(yīng)頻域的音頻采集數(shù)據(jù)進(jìn)行特征提取,得到對(duì)應(yīng)多維特征矩陣的音頻優(yōu)化數(shù)據(jù)。
46、可選地,在根據(jù)本發(fā)明的方法中,基于預(yù)設(shè)情感分析策略對(duì)所述音頻優(yōu)化數(shù)據(jù)進(jìn)行情感分析,得到與所述音頻優(yōu)化數(shù)據(jù)對(duì)應(yīng)的情感信息,包括:
47、基于循環(huán)神經(jīng)網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建初始情感分析模型;
48、獲取訓(xùn)練數(shù)據(jù)集,其中,所述訓(xùn)練數(shù)據(jù)集中包括各標(biāo)注了不同情感類別的語音數(shù)據(jù);
49、基于所述訓(xùn)練數(shù)據(jù)集對(duì)所述初始情感分析模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的當(dāng)前情感分析模型;
50、將所述音頻優(yōu)化數(shù)據(jù)輸入至所述當(dāng)前情感分析模型中進(jìn)行情感分析,得到對(duì)應(yīng)不同情感類別的各置信度;
51、將對(duì)應(yīng)置信度最高的情感狀態(tài)確定為與所述音頻優(yōu)化數(shù)據(jù)對(duì)應(yīng)的情感信息。
52、根據(jù)本發(fā)明的又一個(gè)方面,提供一種基于人工智能的語音情感分析系統(tǒng),包括:
53、音頻采集模塊,被配置為響應(yīng)于在任一觸發(fā)時(shí)刻接收到采集觸發(fā)指令,建立音頻采集任務(wù),以基于所述音頻采集任務(wù)進(jìn)行對(duì)應(yīng)目標(biāo)用戶的音頻采集,得到音頻采集數(shù)據(jù);
54、數(shù)據(jù)優(yōu)化模塊,被配置為對(duì)所述音頻采集數(shù)據(jù)進(jìn)行預(yù)處理,得到音頻優(yōu)化數(shù)據(jù);
55、情感分析模塊,被配置為基于預(yù)設(shè)情感分析策略對(duì)所述音頻優(yōu)化數(shù)據(jù)進(jìn)行情感分析,得到與所述音頻優(yōu)化數(shù)據(jù)對(duì)應(yīng)的情感信息;
56、情感干預(yù)模塊,被配置為基于所述情感信息確定與所述目標(biāo)用戶對(duì)應(yīng)的情感狀態(tài),并基于所述情感狀態(tài)確定是否需要對(duì)所述目標(biāo)用戶進(jìn)行情感干預(yù)。
57、根據(jù)本發(fā)明的方案,本發(fā)明可以通過獲取目標(biāo)用戶的音頻采集數(shù)據(jù),并進(jìn)一步對(duì)音頻采集數(shù)據(jù)進(jìn)行后續(xù)的預(yù)處理,以根據(jù)得到的音頻優(yōu)化數(shù)據(jù)來進(jìn)行對(duì)目標(biāo)用戶的情感分析,從而對(duì)目標(biāo)用戶的情感狀態(tài)進(jìn)行確定,同時(shí),根據(jù)獲取的情感狀態(tài)還能夠確定是否需要進(jìn)行相應(yīng)的情感干預(yù),以幫助目標(biāo)用戶能夠處于正面情緒,提高對(duì)于目標(biāo)用戶的心理糾正效果;另外,對(duì)于客戶服務(wù)方面來說,本發(fā)明能夠?qū)崟r(shí)監(jiān)控客戶情緒,優(yōu)化客服溝通策略,提升客戶滿意度;對(duì)于心理健康方面來說,本發(fā)明能夠監(jiān)控和分析用戶的情緒變化,輔助心理健康診斷和干預(yù);對(duì)于教育領(lǐng)域來說,本發(fā)明能夠通過分析學(xué)生的情感狀態(tài),優(yōu)化教學(xué)方法,提高教學(xué)效果;對(duì)于智能家居來說,本發(fā)明能夠通過理解和響應(yīng)用戶的情感,提高人機(jī)交互的自然性和親和力;而對(duì)于市場(chǎng)調(diào)研來說,本發(fā)明則可以通過分析消費(fèi)者的情感反應(yīng),改進(jìn)產(chǎn)品和服務(wù)。