两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于AI的語音情緒識別模型的訓練方法與流程

文檔序號:40653431發(fā)布日期:2025-01-10 19:01閱讀:來源:國知局

技術(shù)特征:

1.基于ai的語音情緒識別模型的訓練方法,其特征在于,包括如下步驟:

2.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s1中情緒語音識別數(shù)據(jù)集中包括等樣本數(shù)的憤怒、厭惡、恐懼、幸福、悲傷、驚訝和中立情感;

3.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s2中的去噪聲使用音頻去噪算法去除背景噪聲;

4.根據(jù)權(quán)利要求3所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述去噪聲采用的是卷積濾波算法,所述卷積濾波算法的計算公式如下:

5.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s3中的stft的計算公式如下:

6.根據(jù)權(quán)利要求5所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述stft計算的結(jié)果是一個復數(shù)矩陣,每個元素由幅度和相位組成,幅度表示頻率成分的強度,相位表示信號在頻率下的相對位置;

7.根據(jù)權(quán)利要求6所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s4中卷積神經(jīng)網(wǎng)絡從聲譜圖中提取局部特征的計算如下:

8.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s4中能量信息進行形成集合的計算如下:

9.根據(jù)權(quán)利要求8所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s6中的混合矩陣中的橫軸和縱軸分別表示為預測標簽和實際標簽;根據(jù)大量的模型預測結(jié)果將預測的數(shù)值填充到混合矩陣中,并且混合矩陣的對角線設為預測為正類,實際也為正類的樣本數(shù),表示模型正確地識別了正類樣本,且設有;非對角線上的預測為負類,即預測為負類,但實際為正類的樣本數(shù),表示預測錯誤的負類樣本,且設有。

10.根據(jù)權(quán)利要求9所述的基于ai的語音情緒識別模型的訓練方法,其特征在于:所述s6中的精確率、召回率和f1分數(shù)的計算公式如下:


技術(shù)總結(jié)
本發(fā)明公開了基于AI的語音情緒識別模型的訓練方法;包括如下步驟:S1、收集大量的數(shù)據(jù)信息;S2、對采集的情緒語音識別數(shù)據(jù)集進行預處理;S3、對采集的情緒語音識別數(shù)據(jù)集進行轉(zhuǎn)換成聲譜圖;S4、通過卷積神經(jīng)網(wǎng)絡提取聲譜圖中的特征;S5、將不同情感狀態(tài)的能量信息進行存儲;S6、對模型進行評估處理;本發(fā)明通過STFT獲得的2D矩陣,結(jié)合計算得到的能量、幅度值或者相對位置進行建立聲譜圖;通過卷積神經(jīng)網(wǎng)絡從聲譜圖中提取局部特征,將情緒語音識別數(shù)據(jù)集、標簽、特征集合和能量信息值的范圍值形成情感狀態(tài)的能量信息模板庫;混合矩陣測試的精確率、召回率和F1分數(shù),更全面地衡量模型性能,實現(xiàn)對識別模型進行評估。

技術(shù)研發(fā)人員:姜振華,徐利,韓敏,程學偉,王冠樸,劉強
受保護的技術(shù)使用者:山東信達物聯(lián)應用技術(shù)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
當前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
平陆县| 收藏| 紫阳县| 顺平县| 安仁县| 伊金霍洛旗| 双桥区| 密云县| 阳朔县| 肃北| 洞口县| 青阳县| 合江县| 忻州市| 根河市| 宜州市| 凤山市| 思南县| 兰西县| 广元市| 吉木萨尔县| 永吉县| 炎陵县| 关岭| 大邑县| 梅州市| 云安县| 策勒县| 阿拉尔市| 隆林| 宣武区| 鹿邑县| 清流县| 上饶市| 昌邑市| 乌海市| 吉首市| 舒城县| 广元市| 肥西县| 通城县|