1.一種長時(shí)語音的多情緒感知定位方法,其特征在于,將待識(shí)別的長時(shí)語音輸入到已訓(xùn)練完成的時(shí)序多尺度空間對(duì)偶模型中,輸出所述長時(shí)語音中的多個(gè)情緒狀態(tài);
2.根據(jù)權(quán)利要求1所述的長時(shí)語音的多情緒感知定位方法,其特征在于,在步驟二至五中,低維時(shí)序ssd架構(gòu)模塊、中維時(shí)序ssd架構(gòu)模以及高維時(shí)序ssd架構(gòu)模塊的結(jié)構(gòu)一致,均包括門控機(jī)制、一維卷積層、激活層和狀態(tài)空間對(duì)偶模型,時(shí)序ssd架構(gòu)模塊對(duì)輸入特征的處理過程如下:
3.根據(jù)權(quán)利要求2所述的長時(shí)語音的多情緒感知定位方法,其特征在于,狀態(tài)空間對(duì)偶模型對(duì)于輸入特征的計(jì)算公式如下:
4.根據(jù)權(quán)利要求2所述的長時(shí)語音的多情緒感知定位方法,其特征在于,所述門控機(jī)制對(duì)輸入特征的處理過程為:輸入特征依次經(jīng)過全連接層、激活層后的輸出作為門控機(jī)制的輸出。
5.根據(jù)權(quán)利要求1所述的長時(shí)語音的多情緒感知定位方法,其特征在于,在步驟五中,將低維狀態(tài)空間對(duì)偶輸出、中維狀態(tài)空間對(duì)偶輸出和高維狀態(tài)空間對(duì)偶輸出進(jìn)行特征融合操作,得到復(fù)雜長時(shí)多情感語音時(shí)序特征,具體為:
6.根據(jù)權(quán)利要求1所述的長時(shí)語音的多情緒感知定位方法,其特征在于,在步驟五中,情緒解析模塊包括多情緒分類模塊和時(shí)間定位模塊,情緒解析模塊的處理過程具體為:
7.根據(jù)權(quán)利要求6所述的長時(shí)語音的多情緒感知定位方法,其特征在于,在步驟六中,總損失函數(shù)的構(gòu)建為:
8.一種長時(shí)語音的多情緒感知定位系統(tǒng),其特征在于,將待識(shí)別的長時(shí)語音輸入到已訓(xùn)練完成的時(shí)序多尺度空間對(duì)偶模型中,輸出所述長時(shí)語音中的多個(gè)情緒狀態(tài);