两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換系統(tǒng)及其方法

文檔序號:2828093閱讀:194來源:國知局
一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換系統(tǒng)及其方法
【專利摘要】本發(fā)明公開了一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,步驟包括特征參數(shù)提取與合成、特征參數(shù)時間對齊、特征參數(shù)訓(xùn)練與轉(zhuǎn)換;通過在梅爾頻譜上固定高斯均值、自適應(yīng)調(diào)整高斯方差、在對數(shù)幅度譜上選取采樣點作為權(quán)系數(shù)等技術(shù),大大降低語音參數(shù)特征化過程的計算復(fù)雜度。在性能不受影響的條件下,大幅提高運算速度。
【專利說明】一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換系統(tǒng)及其方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種語音信號處理技術(shù),特別是一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換系統(tǒng)及其方法。

【背景技術(shù)】
[0002]為了實現(xiàn)語音轉(zhuǎn)換的任務(wù),需要分幾個步驟來完成:特征參數(shù)提取、參數(shù)匹對、映射關(guān)系構(gòu)建、參數(shù)實時轉(zhuǎn)換等。每個過程都涉及到復(fù)雜的信號處理運算,對軟硬件配置要求較高,且運算時間較長,不利于語音轉(zhuǎn)換技術(shù)在一些應(yīng)用范圍較廣的移動設(shè)備、嵌入式設(shè)備上實例化。特別是傳統(tǒng)的語音轉(zhuǎn)換系統(tǒng)在特征參數(shù)提取這一階段,常常需要時域、頻域、倒譜域之間的變換,計算量特別巨大。此外,受限于具體的硬件設(shè)備,過于復(fù)雜的參數(shù)提取算法亦會導(dǎo)致計算結(jié)果不精確。


【發(fā)明內(nèi)容】

[0003]針對上述問題,本發(fā)明的目的在于提供了一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,該方法通過對語音聲道譜包絡(luò)預(yù)設(shè)固定頻率值、對譜包絡(luò)幅度對數(shù)化采樣、自適應(yīng)調(diào)整方差等措施,使得參數(shù)特征化的過程只需要加減乘除法即可完成,無需借助復(fù)雜的信號處理手段,極大地降低了計算復(fù)雜度,縮短了運算時間。將該特征參數(shù)用于語音轉(zhuǎn)換系統(tǒng),實驗結(jié)果表明系統(tǒng)性能優(yōu)于傳統(tǒng)方法。
[0004]為了達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案:一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,步驟包括特征參數(shù)提取與合成、特征參數(shù)時間對齊、特征參數(shù)訓(xùn)練與轉(zhuǎn)換;
[0005]所述特征參數(shù)提取是對原始語音信號進(jìn)行分解,所述特征參數(shù)合成則是特征參數(shù)提取的反過程;
[0006]所述特征參數(shù)時間對齊用于對轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音的特征參數(shù)進(jìn)行整理和篩選,得到在時間上同步的特征參數(shù)集合;
[0007]所述特征參數(shù)訓(xùn)練是用于學(xué)習(xí)轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音特征參數(shù)集合之間的映射關(guān)系,從而得到映射規(guī)律,所述特征參數(shù)轉(zhuǎn)換是利用映射規(guī)律將轉(zhuǎn)換對象的語音轉(zhuǎn)換成被轉(zhuǎn)換對象的語音。
[0008]所述特征參數(shù)提取的操作步驟如下:
[0009](al)對語音信號進(jìn)行20ms的分幀,用互相關(guān)法對基音頻率進(jìn)行估計;
[0010](a2)根據(jù)基音頻率,確定該幀語音為清音或濁音,當(dāng)該幀語音是濁音信號,則在濁音信號部分設(shè)置一個最大濁音頻率分量,用來劃分諧波成分和隨機(jī)成分的主能量區(qū)域;再利用最小二乘算法估計得到離散的諧波幅度值和相位值;對離散諧波幅度進(jìn)行內(nèi)插,得到頻譜包絡(luò);
[0011](a3)當(dāng)該幀語音是清音信號,則利用線性預(yù)測分析法對清音信號部分進(jìn)行分析,從而得到線性預(yù)測系數(shù);
[0012](a4)對頻譜包絡(luò)的頻譜軸進(jìn)行非線性化,得到梅爾頻率;預(yù)設(shè)24個梅爾頻率值,令其為高斯混合模型各個混合成分的均值;對頻譜包絡(luò)幅度軸進(jìn)行對數(shù)化,并在高斯均值處對其進(jìn)行采樣,將樣點數(shù)值保存,作為權(quán)系數(shù);根據(jù)人耳聽覺特性理論,利用權(quán)系數(shù)值與高斯分布的方差成近似反比的關(guān)系,依次對所有的高斯混合成分的方差進(jìn)行確定;
[0013]所述特征參數(shù)合成的操作步驟如下:
[0014](bl)對權(quán)系數(shù)序列進(jìn)行幅度修正,修正縮放比例按照分布的最大值來確定,近似成正比關(guān)系;
[0015](b2)對幅度修正后的權(quán)系數(shù)序列進(jìn)行插值,形成譜包絡(luò)值,令其橫坐標(biāo)為頻率,縱坐標(biāo)為幅度值;
[0016](b3)對濁音信號的譜包絡(luò)按照基音頻率值進(jìn)行采樣,得到離散諧波幅度值;
[0017](b4)將濁音信號的離散諧波幅度和相位值用作正弦信號的幅度值和相位值,并進(jìn)行疊加;運用內(nèi)插技術(shù)和相位補(bǔ)償技術(shù)使得重構(gòu)信號在時域波形上不產(chǎn)生失真;
[0018](b5)將一個任意隨機(jī)白噪聲信號通過一個全極點濾波器,得到近似重構(gòu)清音信號;
[0019](b6)將濁音信號和清音信號進(jìn)行疊加,得到重構(gòu)的語音信號。
[0020]所述特征參數(shù)時間對齊的操作步驟如下:
[0021](Cl)對于轉(zhuǎn)換對象和被轉(zhuǎn)換對象語音信號的兩個不等長的特征參數(shù)序列,利用動態(tài)時間規(guī)整算法將其中一者的時間軸非線性的映射到另一者的時間軸上,實現(xiàn)一一對應(yīng)的匹配關(guān)系;
[0022](c2)在參數(shù)集合的對齊的過程中,通過迭代優(yōu)化一個預(yù)設(shè)的累積失真函數(shù),并限制搜索區(qū)域,最終獲得時間匹配函數(shù)。
[0023]所述特征參數(shù)訓(xùn)練操作步驟如下:
[0024]將對齊的轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音信號特征參數(shù)聯(lián)合成增廣矩陣,預(yù)設(shè)混合度為N,利用期望最大化法則迭代學(xué)習(xí)高斯混合模型參數(shù);該高斯混合模型的均值、方差和權(quán)系數(shù)均為待估計參數(shù);用馬爾科夫鏈蒙特卡洛方法來近似估計權(quán)系數(shù)和模型參數(shù),即高斯過程的均值和方差的聯(lián)合后驗概率密度函數(shù),首先假設(shè)權(quán)系數(shù)和模型參數(shù)之間滿足相互獨立特性,然后通過迭代的方式逐步估計兩者的概率密度函數(shù),每次迭代過程中,先固定一種未知變量,然后對另一種未知變量進(jìn)行采樣,用大量采樣數(shù)據(jù)來近似其概率分布,最后將權(quán)系數(shù)和模型參數(shù)的概率分布函數(shù)相乘,可得到聯(lián)合后驗概率函數(shù);對聯(lián)合概率密度函數(shù)進(jìn)行邊緣化,分別得到對權(quán)系數(shù)的概率分布和模型參數(shù)的概率分布的估計,混合高斯隨機(jī)過程模型結(jié)構(gòu)被確定。
[0025]所述特征參數(shù)轉(zhuǎn)換操作步驟如下:
[0026](dl)在給定輸入觀測向量集合的條件下,根據(jù)訓(xùn)練好的混合高斯隨機(jī)過程的結(jié)構(gòu)參數(shù),求取當(dāng)前語音幀的后驗概率隸屬度值;
[0027](d2)在每一個分簇的混合成份的子空間中,求取輸出變量的條件期望,取其均值作為轉(zhuǎn)換輸出;
[0028](d3)將所有成份的輸出結(jié)果疊加起來,權(quán)系數(shù)就是后驗概率隸屬度值,最終得到映射后的語音特征參數(shù)。
[0029]采用上述技術(shù)方案,本發(fā)明至少具有下列優(yōu)點:
[0030]1、該語音轉(zhuǎn)換方案適用于大數(shù)據(jù)量環(huán)境下。
[0031]在大數(shù)據(jù)量環(huán)境下,數(shù)據(jù)之間具有很強(qiáng)的關(guān)聯(lián)性和重疊性。就中文語音而言,表面變化豐富的語音下,其本質(zhì)構(gòu)成的語音元數(shù)據(jù)是有限的。因此,通過建立具有混合結(jié)構(gòu)的語音轉(zhuǎn)換方法,可以對語音數(shù)據(jù)進(jìn)行分簇建模,從而充分利用大數(shù)據(jù),提高系統(tǒng)性能。
[0032]2、該語音轉(zhuǎn)換算法具有非線映射的特點,能較好的模擬現(xiàn)實環(huán)境下復(fù)雜的數(shù)據(jù)關(guān)系O
[0033]通過構(gòu)建基于高斯隨機(jī)過程的語音轉(zhuǎn)換方法,能充分利用高斯隨機(jī)過程的非線性映射的能力,對于語音信號這類變化性復(fù)雜的信號格外適用。

【專利附圖】

【附圖說明】
[0034]圖1為本發(fā)明的系統(tǒng)框圖。

【具體實施方式】
[0035]下面結(jié)合附圖對本發(fā)明進(jìn)一步說明。
[0036]如圖1所示,一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,其特征在于步驟包括特征參數(shù)提取與合成、特征參數(shù)時間對齊、特征參數(shù)訓(xùn)練與轉(zhuǎn)換;
[0037]所述特征參數(shù)提取是對原始語音信號進(jìn)行分解,所述特征參數(shù)合成則是特征參數(shù)提取的反過程;
[0038]所述特征參數(shù)時間對齊用于對轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音的特征參數(shù)進(jìn)行整理和篩選,得到在時間上同步的特征參數(shù)集合;
[0039]所述特征參數(shù)訓(xùn)練是用于學(xué)習(xí)轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音特征參數(shù)集合之間的映射關(guān)系,從而得到映射規(guī)律,所述特征參數(shù)轉(zhuǎn)換是利用映射規(guī)律將轉(zhuǎn)換對象的語音轉(zhuǎn)換成被轉(zhuǎn)換對象的語音。
[0040]特征參數(shù)提取包含如下操作:
[0041](al)對語音信號進(jìn)行固定時長的分幀,幀長20ms,幀移10ms。在一幀語音中,求解該語音的自相關(guān)函數(shù),利用自相關(guān)函數(shù)的第一旁瓣峰值來近似估計基音周期,基音周期的倒數(shù)即為基音頻率;
[0042](a2)根據(jù)(al)步驟中得到的基音頻率值(清音為0,濁音為非O),確定該幀語音為清音或濁音。若為濁音,則為其設(shè)置一個最大濁音頻率分量,用來劃分諧波成分和隨機(jī)成分的主能量區(qū)域。在最大濁音頻率以下的頻段,對信號進(jìn)行建?!萌舾蓚€正弦波的疊加來擬合信號。利用最小二乘算法來約束求解正弦波的離散幅度值和相位值;對于大于最大濁音頻率的信號頻段,不做處理;
[0043](a3)若該幀信號為在清音,則利用經(jīng)典的線性預(yù)測分析法對其進(jìn)行分析,建立一個全極點模型,并利用最小二乘方法約束求解模型系數(shù),從而得到線性預(yù)測系數(shù)。
[0044](a4)對頻譜包絡(luò)的頻譜軸進(jìn)行非線性化,得到梅爾頻率;預(yù)設(shè)24個梅爾頻率值,令其為高斯混合模型各個混合成分的均值;對頻譜包絡(luò)幅度軸進(jìn)行對數(shù)化,并在高斯均值處對其進(jìn)行采樣,將樣點數(shù)值保存,作為權(quán)系數(shù);根據(jù)人耳聽覺特性理論,利用權(quán)系數(shù)值與高斯分布的方差成近似反比的關(guān)系,依次對所有的高斯混合成分的方差進(jìn)行確定;
[0045]特征參數(shù)合成包含如下操作:
[0046](bl)對權(quán)系數(shù)序列進(jìn)行幅度修正,修正縮放比例按照分布的最大值來確定,近似成正比關(guān)系;
[0047](b2)對幅度修正后的權(quán)系數(shù)序列進(jìn)行插值,形成譜包絡(luò)值,令其橫坐標(biāo)為頻率,縱坐標(biāo)為幅度值;
[0048](b3)對濁音信號的譜包絡(luò)按照基音頻率值進(jìn)行采樣,得到離散諧波幅度值;
[0049](b4)將濁音信號的離散諧波幅度和相位值用作正弦信號的幅度值和相位值,并進(jìn)行疊加;運用內(nèi)插技術(shù)和相位補(bǔ)償技術(shù)使得重構(gòu)信號在時域波形上不產(chǎn)生失真;
[0050](b5)對于清音信號,將一個任意隨機(jī)白噪聲信號通過一個全極點濾波器,得到近似重構(gòu)清音信號;
[0051](b6)將濁音信號和清音信號進(jìn)行疊加,得到重構(gòu)的語音信號。
[0052]特征參數(shù)時間對齊:
[0053](Cl)對于兩個不等長的特征參數(shù)序列,利用動態(tài)時間規(guī)整算法將其中一者的時間軸非線性的映射到另一者的時間軸上,實現(xiàn)--對應(yīng)的匹配關(guān)系;
[0054](c2)在參數(shù)集合的對齊的過程中,通過迭代優(yōu)化一個預(yù)設(shè)的累積失真函數(shù),并限制搜索區(qū)域,最終獲得時間匹配函數(shù)。
[0055]參數(shù)訓(xùn)練與轉(zhuǎn)換模塊以高斯隨機(jī)過程為理論基礎(chǔ),并在基本的框架上擴(kuò)展出一套混合結(jié)構(gòu),用于對數(shù)據(jù)進(jìn)行分簇建模,提高精確性。同時,得益于高斯隨機(jī)過程的非線性映射特點,系統(tǒng)可以實現(xiàn)理解關(guān)系較為復(fù)雜的特征參數(shù)話之間的轉(zhuǎn)換。整個運作工程包含兩個階段,訓(xùn)練階段和轉(zhuǎn)換階段,操作步驟如下。
[0056]特征參數(shù)訓(xùn)練操作步驟如下:
[0057]將對齊的轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音信號特征參數(shù)聯(lián)合成增廣矩陣,構(gòu)建包含混合結(jié)構(gòu)的高斯隨機(jī)過程模型,設(shè)混合度為N,每個混合成分的權(quán)系數(shù)分別為ri,其中i =1,2,3..., N。則在給定輸入輸出向量集合的前提下,輸出向量序列近似等于N個高斯隨機(jī)過程的加權(quán)組合。其中,高斯隨機(jī)過程的輸入既為給定的輸入向量序列。所有的權(quán)系數(shù)以及每個高斯隨機(jī)過程的均值和方差參數(shù),均為待估計的未知參數(shù);用馬爾科夫鏈蒙特卡洛方法來近似估計權(quán)系數(shù)和模型參數(shù)(高斯過程的均值和方差)的均值和方差的聯(lián)合后驗概率密度函數(shù),即首先假設(shè)權(quán)系數(shù)和模型參數(shù)之間滿足相互獨立特性,然后通過迭代的方式逐步估計兩者的概率密度函數(shù),每次迭代過程中,先固定一種未知變量,然后對另一種未知變量進(jìn)行采樣,用大量采樣數(shù)據(jù)來近似其概率分布,最后將權(quán)系數(shù)和模型參數(shù)的概率分布函數(shù)相乘,可得到聯(lián)合后驗概率函數(shù);對聯(lián)合概率密度函數(shù)進(jìn)行邊緣化,分別得到對權(quán)系數(shù)的概率分布和模型參數(shù)的概率分布的估計,至此,混合高斯隨機(jī)過程模型結(jié)構(gòu)被確定;
[0058]特征參數(shù)轉(zhuǎn)換操作步驟如下:
[0059](dl)在給定輸入觀測向量集合的條件下,根據(jù)訓(xùn)練好的混合高斯隨機(jī)過程的結(jié)構(gòu)參數(shù),求取當(dāng)前語音幀的隸屬度函數(shù)值,所謂隸屬度函數(shù),指的是歸一化后驗權(quán)系數(shù)的比值;
[0060](d2)根據(jù)隸屬度值,判別當(dāng)前語音屬于哪一個高斯子成分,隨后在每一個分簇的子空間中,根據(jù)高斯隨機(jī)過程的定義,產(chǎn)生與之相對應(yīng)的輸出;
[0061](d3)將所有成份的輸出結(jié)果疊加起來,權(quán)系數(shù)就是隸屬度函數(shù)的值,最終得到映射后的語音特征參數(shù)。
[0062]以上所述,僅是本發(fā)明的優(yōu)選實施而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以優(yōu)選實施揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動或修飾為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
【權(quán)利要求】
1.一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,其特征在于步驟包括特征參數(shù)提取與合成、特征參數(shù)時間對齊、特征參數(shù)訓(xùn)練與轉(zhuǎn)換; 所述特征參數(shù)提取是對原始語音信號進(jìn)行分解,所述特征參數(shù)合成則是特征參數(shù)提取的反過程; 所述特征參數(shù)時間對齊用于對轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音的特征參數(shù)進(jìn)行整理和篩選,得到在時間上同步的特征參數(shù)集合; 所述特征參數(shù)訓(xùn)練是用于學(xué)習(xí)轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音特征參數(shù)集合之間的映射關(guān)系,從而得到映射規(guī)律,所述特征參數(shù)轉(zhuǎn)換是利用映射規(guī)律將轉(zhuǎn)換對象的語音轉(zhuǎn)換成被轉(zhuǎn)換對象的語音。
2.根據(jù)權(quán)利要求1所述的一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,其特征在于:所述特征參數(shù)提取的操作步驟如下: (al)對語音信號進(jìn)行20ms的分幀,用互相關(guān)法對基音頻率進(jìn)行估計; (a2)根據(jù)基音頻率,確定該幀語音為清音或濁音,當(dāng)該幀語音是濁音信號,則在濁音信號部分設(shè)置一個最大濁音頻率分量,用來劃分諧波成分和隨機(jī)成分的主能量區(qū)域;再利用最小二乘算法估計得到離散的諧波幅度值和相位值;對離散諧波幅度進(jìn)行內(nèi)插,得到頻譜包絡(luò); (a3)當(dāng)該幀語音是清音信號,則利用線性預(yù)測分析法對清音信號部分進(jìn)行分析,從而得到線性預(yù)測系數(shù); (a4)對頻譜包絡(luò)的頻譜軸進(jìn)行非線性化,得到梅爾頻率;預(yù)設(shè)24個梅爾頻率值,令其為高斯混合模型各個混合成分的均值;對頻譜包絡(luò)幅度軸進(jìn)行對數(shù)化,并在高斯均值處對其進(jìn)行采樣,將樣點數(shù)值保存,作為權(quán)系數(shù);根據(jù)人耳聽覺特性理論,利用權(quán)系數(shù)值與高斯分布的方差成近似反比的關(guān)系,依次對所有的高斯混合成分的方差進(jìn)行確定。
3.根據(jù)權(quán)利要求2所述的一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,其特征在于:所述特征參數(shù)合成的操作步驟如下: (bl)對權(quán)系數(shù)序列進(jìn)行幅度修正,修正縮放比例按照分布的最大值來確定,近似成正比關(guān)系; (b2)對幅度修正后的權(quán)系數(shù)序列進(jìn)行插值,形成譜包絡(luò)值,令其橫坐標(biāo)為頻率,縱坐標(biāo)為幅度值; (b3)對濁音信號的譜包絡(luò)按照基音頻率值進(jìn)行采樣,得到離散諧波幅度值; (b4)將濁音信號的離散諧波幅度和相位值用作正弦信號的幅度值和相位值,并進(jìn)行疊加;運用內(nèi)插技術(shù)和相位補(bǔ)償技術(shù)使得重構(gòu)信號在時域波形上不產(chǎn)生失真; (b5)將一個任意隨機(jī)白噪聲信號通過一個全極點濾波器,得到近似重構(gòu)清音信號; (b6)將濁音信號和清音信號進(jìn)行疊加,得到重構(gòu)的語音信號。
4.根據(jù)權(quán)利要求3所述的一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,其特征在于:所述特征參數(shù)時間對齊的操作步驟如下: (Cl)對于轉(zhuǎn)換對象和被轉(zhuǎn)換對象語音信號的兩個不等長的特征參數(shù)序列,利用動態(tài)時間規(guī)整算法將其中一者的時間軸非線性的映射到另一者的時間軸上,實現(xiàn)一一對應(yīng)的匹配關(guān)系; (c2)在參數(shù)集合的對齊的過程中,通過迭代優(yōu)化一個預(yù)設(shè)的累積失真函數(shù),并限制搜索區(qū)域,最終獲得時間匹配函數(shù)。
5.根據(jù)權(quán)利要求4所述的一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,其特征在于:所述特征參數(shù)訓(xùn)練操作步驟如下: 將對齊的轉(zhuǎn)換對象和被轉(zhuǎn)換對象的語音信號特征參數(shù)聯(lián)合成增廣矩陣,預(yù)設(shè)混合度為N,利用期望最大化法則迭代學(xué)習(xí)高斯混合模型參數(shù);該高斯混合模型的均值、方差和權(quán)系數(shù)均為待估計參數(shù);用馬爾科夫鏈蒙特卡洛方法來近似估計權(quán)系數(shù)和模型參數(shù),即高斯過程的均值和方差的聯(lián)合后驗概率密度函數(shù),首先假設(shè)權(quán)系數(shù)和模型參數(shù)之間滿足相互獨立特性,然后通過迭代的方式逐步估計兩者的概率密度函數(shù),每次迭代過程中,先固定一種未知變量,然后對另一種未知變量進(jìn)行采樣,用大量采樣數(shù)據(jù)來近似其概率分布,最后將權(quán)系數(shù)和模型參數(shù)的概率分布函數(shù)相乘,可得到聯(lián)合后驗概率函數(shù);對聯(lián)合概率密度函數(shù)進(jìn)行邊緣化,分別得到對權(quán)系數(shù)的概率分布和模型參數(shù)的概率分布的估計,混合高斯隨機(jī)過程模型結(jié)構(gòu)被確定。
6.根據(jù)權(quán)利要求5所述的一種基于聲道譜高斯混合建模的快速語音轉(zhuǎn)換方法,其特征在于:所述特征參數(shù)轉(zhuǎn)換操作步驟如下: (dl)在給定輸入觀測向量集合的條件下,根據(jù)訓(xùn)練好的混合高斯隨機(jī)過程的結(jié)構(gòu)參數(shù),求取當(dāng)前語音幀的后驗概率隸屬度值; (d2)在每一個分簇的混合成份的子空間中,求取輸出變量的條件期望,取其均值作為轉(zhuǎn)換輸出; (d3)將所有成份的輸出結(jié)果疊加起來,權(quán)系數(shù)就是后驗概率隸屬度值,最終得到映射后的語音特征參數(shù)。
【文檔編號】G10L13/00GK104392717SQ201410742549
【公開日】2015年3月4日 申請日期:2014年12月8日 優(yōu)先權(quán)日:2014年12月8日
【發(fā)明者】鮑靜益, 徐寧 申請人:常州工學(xué)院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
视频| 泰州市| 绥阳县| 会宁县| 贺兰县| 神农架林区| 古蔺县| 吴川市| 东港市| 乐至县| 唐河县| 曲周县| 湘潭市| 道真| 天台县| 容城县| 淮滨县| 石家庄市| 绥中县| 黄梅县| 镇坪县| 农安县| 罗山县| 景德镇市| 综艺| 朝阳区| 安庆市| 庆阳市| 江川县| 区。| 大竹县| 巩留县| 吉木乃县| 博乐市| 措勤县| 黔西县| 大渡口区| 西宁市| 富蕴县| 马龙县| 张掖市|