1.基于ai的語音情緒識別模型的訓練方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s1中情緒語音識別數(shù)據(jù)集中包括等樣本數(shù)的憤怒、厭惡、恐懼、幸福、悲傷、驚訝和中立情感;
3.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s2中的去噪聲使用音頻去噪算法去除背景噪聲;
4.根據(jù)權(quán)利要求3所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述去噪聲采用的是卷積濾波算法,所述卷積濾波算法的計算公式如下:
5.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s3中的stft的計算公式如下:
6.根據(jù)權(quán)利要求5所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述stft計算的結(jié)果是一個復數(shù)矩陣,每個元素由幅度和相位組成,幅度表示頻率成分的強度,相位表示信號在頻率下的相對位置;
7.根據(jù)權(quán)利要求6所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s4中卷積神經(jīng)網(wǎng)絡從聲譜圖中提取局部特征的計算如下:
8.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s4中能量信息進行形成集合的計算如下:
9.根據(jù)權(quán)利要求8所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s6中的混合矩陣中的橫軸和縱軸分別表示為預測標簽和實際標簽;根據(jù)大量的模型預測結(jié)果將預測的數(shù)值填充到混合矩陣中,并且混合矩陣的對角線設為預測為正類,實際也為正類的樣本數(shù),表示模型正確地識別了正類樣本,且設有;非對角線上的預測為負類,即預測為負類,但實際為正類的樣本數(shù),表示預測錯誤的負類樣本,且設有。
10.根據(jù)權(quán)利要求9所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s6中的精確率、召回率和f1分數(shù)的計算公式如下: