基于AI的語音情緒識別模型的訓練方法與流程

文檔序號：40653431發(fā)布日期：2025-01-10 19:01閱讀：來源：國知局

技術(shù)特征：

1.基于ai的語音情緒識別模型的訓練方法，其特征在于，包括如下步驟：

2.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述s1中情緒語音識別數(shù)據(jù)集中包括等樣本數(shù)的憤怒、厭惡、恐懼、幸福、悲傷、驚訝和中立情感；

3.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述s2中的去噪聲使用音頻去噪算法去除背景噪聲；

4.根據(jù)權(quán)利要求3所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述去噪聲采用的是卷積濾波算法，所述卷積濾波算法的計算公式如下：

5.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述s3中的stft的計算公式如下：

6.根據(jù)權(quán)利要求5所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述stft計算的結(jié)果是一個復數(shù)矩陣，每個元素由幅度和相位組成，幅度表示頻率成分的強度，相位表示信號在頻率下的相對位置；

7.根據(jù)權(quán)利要求6所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述s4中卷積神經(jīng)網(wǎng)絡從聲譜圖中提取局部特征的計算如下：

8.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述s4中能量信息進行形成集合的計算如下：

9.根據(jù)權(quán)利要求8所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述s6中的混合矩陣中的橫軸和縱軸分別表示為預測標簽和實際標簽；根據(jù)大量的模型預測結(jié)果將預測的數(shù)值填充到混合矩陣中，并且混合矩陣的對角線設為預測為正類，實際也為正類的樣本數(shù)，表示模型正確地識別了正類樣本，且設有；非對角線上的預測為負類，即預測為負類，但實際為正類的樣本數(shù)，表示預測錯誤的負類樣本，且設有。

10.根據(jù)權(quán)利要求9所述的基于ai的語音情緒識別模型的訓練方法，其特征在于：所述s6中的精確率、召回率和f1分數(shù)的計算公式如下：

技術(shù)總結(jié)
本發(fā)明公開了基于AI的語音情緒識別模型的訓練方法；包括如下步驟：S1、收集大量的數(shù)據(jù)信息；S2、對采集的情緒語音識別數(shù)據(jù)集進行預處理；S3、對采集的情緒語音識別數(shù)據(jù)集進行轉(zhuǎn)換成聲譜圖；S4、通過卷積神經(jīng)網(wǎng)絡提取聲譜圖中的特征；S5、將不同情感狀態(tài)的能量信息進行存儲；S6、對模型進行評估處理；本發(fā)明通過STFT獲得的2D矩陣，結(jié)合計算得到的能量、幅度值或者相對位置進行建立聲譜圖；通過卷積神經(jīng)網(wǎng)絡從聲譜圖中提取局部特征，將情緒語音識別數(shù)據(jù)集、標簽、特征集合和能量信息值的范圍值形成情感狀態(tài)的能量信息模板庫；混合矩陣測試的精確率、召回率和F1分數(shù)，更全面地衡量模型性能，實現(xiàn)對識別模型進行評估。

技術(shù)研發(fā)人員：姜振華,徐利,韓敏,程學偉,王冠樸,劉強
受保護的技術(shù)使用者：山東信達物聯(lián)應用技術(shù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細技術(shù)資料下載

當前第2頁1 2

相關技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于AI的語音情緒識別模型的訓練方法與流程