本發(fā)明涉及情感預(yù)測(cè),具體為一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法。
背景技術(shù):
1、聲音是一種由物體振動(dòng)而產(chǎn)生的波,當(dāng)物體振動(dòng)時(shí),使周圍的空氣不斷地壓縮和放松,并向周圍擴(kuò)散,這就是聲波,人可以聽到的聲音頻率范圍是20hz~20khz,音頻數(shù)據(jù)的格式主要有:wave、mod、layer-3、real?audio、cd?audio等,音頻數(shù)據(jù)的采集,常見方法有3種:直接獲取已有音頻、利用音頻處理軟件捕獲截取聲音、用麥克風(fēng)錄制聲音。
2、在針對(duì)語(yǔ)音音頻數(shù)據(jù)采集與分析的工作中,錄制的語(yǔ)音音頻包含有大量情感情緒,為此從采集到的語(yǔ)音音頻數(shù)據(jù)完成分析處理后如何實(shí)現(xiàn)精準(zhǔn)的情感預(yù)測(cè)結(jié)果十分重要,且在針對(duì)情感預(yù)測(cè)的工作中得到的結(jié)果難以做到直觀展示,使得人們?cè)诹私獠杉c分析得到的語(yǔ)音音頻數(shù)據(jù)難以做到更好的處理。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,以解決上述背景技術(shù)中提出的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,包括以下內(nèi)容:
3、s1:利用錄音設(shè)備進(jìn)行獲取語(yǔ)音音頻數(shù)據(jù);
4、s2:對(duì)獲取得到的音頻數(shù)據(jù)進(jìn)行預(yù)處理工作;
5、s3:在完成對(duì)音頻的數(shù)據(jù)處理后,對(duì)音頻數(shù)據(jù)進(jìn)行收集和標(biāo)記的工作,并隨后進(jìn)行顯著特征提取工作;
6、s4:利用機(jī)器學(xué)習(xí)技術(shù)或深度學(xué)習(xí)技術(shù),訓(xùn)練情感預(yù)測(cè)模型;
7、s5:向情感預(yù)測(cè)模型輸入待識(shí)別語(yǔ)音音頻數(shù)據(jù),通過(guò)模型進(jìn)行情感預(yù)測(cè)測(cè)試;
8、s6:完成初步測(cè)試后,對(duì)測(cè)試結(jié)果進(jìn)行評(píng)估;
9、s7:當(dāng)評(píng)估情感預(yù)測(cè)的結(jié)果較高時(shí),則可正常使用情感預(yù)測(cè)模型進(jìn)行情感預(yù)測(cè)工作,若是評(píng)估情感預(yù)測(cè)的結(jié)果較低時(shí),則對(duì)上述步驟進(jìn)行重復(fù)且補(bǔ)充相關(guān)數(shù)據(jù)。
10、優(yōu)選的,所述步驟s1中包括以下:
11、s11:使用麥克風(fēng)或者其他音頻輸入設(shè)備進(jìn)行實(shí)時(shí)錄制聲音音頻;
12、s12:通過(guò)音頻處理軟件或工具直接導(dǎo)入已有的音頻數(shù)據(jù);
13、s13:通過(guò)音頻處理軟件捕獲和截取聲音。
14、優(yōu)選的,所述步驟s2中包括以下:
15、s21:針對(duì)步驟s1中獲取的語(yǔ)音音頻首先對(duì)音頻中的噪音進(jìn)行去除,并進(jìn)行提高語(yǔ)音音頻的質(zhì)量;
16、s22:然后將語(yǔ)音音頻的信號(hào)調(diào)整為統(tǒng)一的標(biāo)準(zhǔn),進(jìn)而方便后續(xù)的處理;
17、s23:將完成信號(hào)統(tǒng)一的語(yǔ)音音頻信號(hào)細(xì)分為若干個(gè)短時(shí)幀片段。
18、優(yōu)選的,所述步驟s3中包括以下:
19、s31:對(duì)完成處理后的音頻數(shù)據(jù)進(jìn)行收集處理,之后將收集的音頻數(shù)據(jù)進(jìn)行的截段標(biāo)記;
20、s32:在爾頻率倒譜系數(shù)(mfcc)、頻譜中心基礎(chǔ)上進(jìn)行標(biāo)記特征;
21、s33:并可根據(jù)短時(shí)幀的能量以及短時(shí)平均過(guò)零率,以及音頻數(shù)據(jù)的音調(diào)、音長(zhǎng)和音色進(jìn)行特征標(biāo)記;
22、s34:完成特征標(biāo)記的工作后,針對(duì)標(biāo)記的音頻數(shù)據(jù)通過(guò)數(shù)字化處理技術(shù)進(jìn)行分段提取。
23、優(yōu)選的,所述步驟s4中包括以下:
24、s41:基于提取到的特征數(shù)據(jù)采用機(jī)器學(xué)習(xí)技術(shù)或者深度學(xué)習(xí)技術(shù)進(jìn)行配合;
25、s42:利用機(jī)器學(xué)習(xí)技術(shù)或者深度學(xué)習(xí)技術(shù)進(jìn)行訓(xùn)練情感預(yù)測(cè)模型;
26、s43:通過(guò)訓(xùn)練得到的情感預(yù)測(cè)模型對(duì)已標(biāo)注的樣本進(jìn)行訓(xùn)練,并學(xué)習(xí)情感特征,且將其應(yīng)用到未標(biāo)注的語(yǔ)音數(shù)據(jù)匯總,以識(shí)別和分類情感。
27、優(yōu)選的,所述步驟s5中包括以下:
28、s51:將待識(shí)別語(yǔ)音的音頻數(shù)據(jù)進(jìn)行特征標(biāo)記;
29、s52:利用訓(xùn)練得到的情感預(yù)測(cè)模型進(jìn)行輸入完成標(biāo)記的待識(shí)別語(yǔ)音的音頻數(shù)據(jù);
30、s53:通過(guò)情感預(yù)測(cè)模型進(jìn)行展示輸入的標(biāo)記待識(shí)別語(yǔ)音的音頻數(shù)據(jù),通過(guò)情感預(yù)測(cè)模型對(duì)標(biāo)記待識(shí)別語(yǔ)音的音頻數(shù)據(jù)進(jìn)行分析處理,并同時(shí)進(jìn)行輸出對(duì)應(yīng)的情感或情緒類別,進(jìn)而獲得預(yù)測(cè)測(cè)試結(jié)果。
31、優(yōu)選的,所述步驟s6中包括以下:
32、s61:根據(jù)測(cè)試獲得的情感預(yù)測(cè)結(jié)果,進(jìn)行初步評(píng)估識(shí)別;
33、s62:并利用歷史情感預(yù)測(cè)方式進(jìn)行測(cè)試預(yù)測(cè)的工作;
34、s63:然后將模型測(cè)試情感預(yù)測(cè)結(jié)果與歷史情感預(yù)測(cè)方式預(yù)測(cè)的結(jié)果進(jìn)行比對(duì)分析。
35、優(yōu)選的,所述步驟s7中包括以下:
36、s71:根據(jù)比對(duì)分析的結(jié)果進(jìn)行判定工作;
37、s72:當(dāng)判定的結(jié)果經(jīng)過(guò)情感預(yù)測(cè)模型預(yù)測(cè)的結(jié)果較高時(shí)則可直接進(jìn)行使用,用于對(duì)經(jīng)過(guò)采集與分析后的語(yǔ)音音頻數(shù)據(jù)輸入到情感預(yù)測(cè)模型內(nèi)進(jìn)行預(yù)測(cè)情感狀態(tài);
38、s73:當(dāng)判定的結(jié)果在經(jīng)過(guò)情感預(yù)測(cè)模型預(yù)測(cè)的結(jié)果較低時(shí),重復(fù)上述步驟,并同時(shí)進(jìn)行補(bǔ)充缺陷數(shù)據(jù),以此訓(xùn)練得到更為精確的情感預(yù)測(cè)模型,然后再次進(jìn)行測(cè)試的工作。
39、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:通過(guò)將獲取得到的語(yǔ)音音頻數(shù)據(jù)在經(jīng)過(guò)采集與分析等相關(guān)的處理工作后,可根據(jù)特征數(shù)據(jù)進(jìn)行訓(xùn)練得到情感預(yù)測(cè)模型,進(jìn)而可通過(guò)情感預(yù)測(cè)模型為人們更為直觀的展示預(yù)測(cè)走勢(shì)以及預(yù)測(cè)結(jié)果,不僅如此通過(guò)對(duì)情感預(yù)測(cè)模型的測(cè)試以及完善能夠及時(shí)進(jìn)行升級(jí)完善處理,進(jìn)而可保證情感預(yù)測(cè)的結(jié)果更為精確,并可更為直觀的展示預(yù)測(cè)結(jié)果。
1.一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于,包括以下內(nèi)容:
2.根據(jù)權(quán)利要求1所述的一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于:所述步驟s1中包括以下:
3.根據(jù)權(quán)利要求2所述的一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于:所述步驟s2中包括以下:
4.根據(jù)權(quán)利要求3所述的一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于:所述步驟s3中包括以下:
5.根據(jù)權(quán)利要求4所述的一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于:所述步驟s4中包括以下:
6.根據(jù)權(quán)利要求5所述的一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于:所述步驟s5中包括以下:
7.根據(jù)權(quán)利要求6所述的一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于:所述步驟s6中包括以下:
8.根據(jù)權(quán)利要求7所述的一種基于語(yǔ)音音頻數(shù)據(jù)采集與分析的情感預(yù)測(cè)方法,其特征在于:所述步驟s7中包括以下: