專利名稱::韻律自適應(yīng)及語音合成的方法和裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及信息處理技術(shù),具體地,涉及利用計算機進行數(shù)據(jù)驅(qū)動的差分韻律自適應(yīng)模型的訓(xùn)練、差分韻律自適應(yīng)模型的生成和韻律預(yù)測的技術(shù),以及語音合成^支術(shù)。
背景技術(shù):
:一般地,語音合成技術(shù)包括文本分析、韻律預(yù)測和語音生成三個主要技術(shù),其中韻律預(yù)測技術(shù)是指利用韻律自適應(yīng)模型預(yù)測合成語音的語調(diào)、節(jié)奏和時長信息等韻律特征參數(shù)的技術(shù)。韻律自適應(yīng)模型是建立從與韻律預(yù)測相關(guān)的屬性到韻律向量的映射關(guān)系,其中與韻律預(yù)測相關(guān)的屬性包括語言、語音、情感/表情類型的屬性,并且韻律向量包括時長和基頻等參數(shù)?,F(xiàn)有的韻律預(yù)測方法包括分類與回歸樹(ClassifyandRegressionTree,簡稱CART)、高斯混合模型(GaussianMixtureModel,簡稱GMM)和基于規(guī)則的方法。關(guān)于高斯混合模型(GMM),在Dan誦ningJiang,WeiZhang,Li-qinShen和Lian-hongCai所著的文章"ProsodyAnalysisandModelingForEmotionalSpeechSynthesis"(發(fā)表于ICASSP,05,Vol.I,pp.281-284,Philadelphia,PA,USA)中進行了詳細的描述。關(guān)于分類與回歸樹(CART)和高斯混合模型,還在JianhuaTao,YongguoKang和AijunLi所著的文章"ProsodyConversionFromNeutralSpeechtoEmotionalSpeech"(發(fā)表于IEEETRANSACTIONSONAUDIO,SPEECHANDLANGUAGEPROCESSING,VOL.14,NO.4,pp.1145-1154,JULY2006)中進行了詳細的描述。8然而,這些方法存在以下的缺點1)現(xiàn)有的方法不能準確而穩(wěn)定地表示韻律向量,從而使得韻律自適應(yīng)模型不靈活。2)現(xiàn)有的方法受到模型復(fù)雜度和訓(xùn)練數(shù)據(jù)規(guī)模之間的不平衡的限制。實際上,情感/表情語料庫中的訓(xùn)練數(shù)據(jù)十分有限。傳統(tǒng)模型的系數(shù)能通過數(shù)據(jù)驅(qū)動方法計算得到,但是模型的屬性和屬性組合卻是用手工的方法設(shè)置的。那么,這種"部分的"數(shù)據(jù)驅(qū)動的方法在一定程度上依賴于人的經(jīng)驗。
發(fā)明內(nèi)容本發(fā)明正是基于上述技術(shù)問題而提出的,其提供了一種數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)4莫型的方法和裝置、生成差分韻律自適應(yīng)模型的方法和裝置、韻律預(yù)測方法和裝置、以及語音合成方法和裝置。根據(jù)本發(fā)明的一個方面,提供一種數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,包括用時長和基頻的正交多項式的系數(shù)表示差分韻律向量;對于上述差分韻律向量中的每一個參數(shù),利用與差分韻律預(yù)測相關(guān)的多個屬性和至少一部分上述屬性的組合生成一個初始參數(shù)預(yù)測模型,其中每個上述屬性或上述屬性的組合被作為一項;計算上述參數(shù)預(yù)測模型的每一上述項的重要性;刪除上述計算出的重要性最低的項;利用剩余的項重新生成參數(shù)預(yù)測才莫型;判斷上述重新生成的參數(shù)預(yù)測模型是否最優(yōu);以及如果上述參數(shù)預(yù)測4莫型凈皮判斷為不是最優(yōu),則重復(fù)上述計算每一項的重要性的步驟、上述刪除重要性最低的項的步驟、上述重新生成^lt預(yù)測模型的步驟和上述判斷上述重新生成的參數(shù)預(yù)測模型是否最優(yōu)的步驟;其中,上述差分韻律向量及其全部^t預(yù)測模型構(gòu)成差分韻律自適應(yīng)模型。根據(jù)本發(fā)明的另一個方面,提供一種生成差分韻律自適應(yīng)模型的方法,包括形成差分韻律向量的訓(xùn)練樣本集合;以及根據(jù)上述差分韻律向量的訓(xùn)練樣本集合,利用上述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)^t型的方法,生成差分韻律自適應(yīng)模型。2根據(jù)本發(fā)明的另一個方面,提供一種韻律預(yù)測方法,包括根據(jù)輸入的文本,獲得與中性韻律預(yù)測相關(guān)的多個屬性的值以及至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值;根據(jù)中性韻律預(yù)測模型,利用上述與中性韻律預(yù)測相關(guān)的多個屬性的值,計算中性韻律向量;根據(jù)差分韻律自適應(yīng)^t型,利用上述至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值以及預(yù)先確定的至少另一部分與差分韻律預(yù)測相關(guān)的多個屬性的值,計算差分韻律向量;以及計算上述中性韻律向量與上述差分韻律向量的和,以獲得相應(yīng)的韻律;其中,上述差分韻律自適應(yīng)模型是利用上述的生成差分韻律自適應(yīng)^f莫型的方法生成的。根據(jù)本發(fā)明的另一個方面,提供一種語音合成方法,包括對輸入的文本利用上述的韻律預(yù)測方法,預(yù)測韻律;以及根據(jù)上述所預(yù)測的韻律,進行語音合成。根據(jù)本發(fā)明的另一個方面,提供一種數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,包括初始模型生成單元,其用時長和基頻的正交多項式的系數(shù)表示差分韻律向量,并對于上述差分韻律向量中的每一個參數(shù),利用與差分韻律預(yù)測相關(guān)的多個屬性和至少一部分上述屬性的組合生成一個初始參數(shù)預(yù)測模型,其中每個上述屬性或上述屬性的組合被作為一項;重要性計算單元,用于計算上述參數(shù)預(yù)測模型的每一上述項的重要性;項刪除單元,用于刪除上述計算出的重要性最低的項;模型再生成單元,用于利用由上述項刪除單元刪除后剩余的項重新生成參數(shù)預(yù)測模型;以及優(yōu)化判斷單元,用于判斷由上述模型再生成單元重新生成的M預(yù)測模型是否最優(yōu);其中,上述差分韻律向量及其全部參數(shù)預(yù)測模型構(gòu)成差分韻律自適應(yīng)模型。根據(jù)本發(fā)明的另一個方面,提供一種生成差分韻律自適應(yīng)模型的裝置,包括差分韻律向量的訓(xùn)練樣本集合;以及上述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其根據(jù)上述差分韻律向量的訓(xùn)練樣本集合訓(xùn)練差^律自適應(yīng)模型。根據(jù)本發(fā)明的另一個方面,提供一種韻律預(yù)測裝置,包括中性韻律預(yù)測模型;利用上述的生成差分韻律自適應(yīng)模型的裝置生成的差分韻律自10適應(yīng)模型;屬性獲得單元,用于根據(jù)輸入的文本獲得與中性韻律預(yù)測相關(guān)的多個屬性的值以及至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值;中性韻律向量預(yù)測單元,用于根據(jù)上述中性韻律預(yù)測模型,利用上述與中性韻律預(yù)測相關(guān)的多個屬性的值,計算中性韻律向量;差分韻律向量預(yù)測單元,用于根據(jù)上述差分韻律自適應(yīng)模型,利用上述至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值以及預(yù)先確定的至少另一部分與差分韻律預(yù)測相關(guān)的多個屬性的值,計算差分韻律向量;以及韻律預(yù)測單元,用于計算上述中性韻律向量與上述差分韻律向量的和,以獲得相應(yīng)的韻律。才艮據(jù)本發(fā)明的另一個方面,拔^供一種語音合成裝置,包括上述的韻律預(yù)測裝置;并且根據(jù)由上述韻律預(yù)測裝置預(yù)測的韻律,進行語音合成。圖1是根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法的流程圖2是根據(jù)本發(fā)明的一個實施例的生成差分韻律自適應(yīng)模型的方法的流程圖3是根據(jù)本發(fā)明的一個實施例的韻律預(yù)測方法的流程圖;圖4是根據(jù)本發(fā)明的一個實施例的語音合成方法的流程圖;圖5是根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置的示意性方框圖6是根據(jù)本發(fā)明的一個實施例的生成差分韻律自適應(yīng)模型的裝置的示意性方框圖7是才艮據(jù)本發(fā)明的一個實施例的韻律預(yù)測裝置的示意性方框圖;圖8是根據(jù)本發(fā)明的一個實施例的語音合成裝置的示意性方框圖。具體實施例方式相信通過以下結(jié)合附圖對本發(fā)明的具體實施例的詳細描述,本發(fā)明的上述和其它目的、特征和優(yōu)點將變得更加明顯。為了便于后面實施例的理解,首先筒要介紹一下廣義線性模型(GeneralizedLinearModel,簡稱GLM)和貝葉斯信息準則(BayesInformationCriterion,筒稱BIC)的原理。GLM是對多元線性回歸模型的一種擴展。GLM參數(shù)預(yù)測模型通過語音單元s的屬性A,預(yù)測出參數(shù)3,相應(yīng)的定義如公式(1)。di"i+ei=h-'(A+l^fj(A))+ei(1)其中,h表示鏈接函數(shù)。二般地,可以假定d滿足指數(shù)族分布。為了使d滿足不同的指數(shù)族分布,只需要設(shè)定相應(yīng)的鏈接函數(shù)。GLM既能進行線性建模,也能進行非線性建模。比較模型的性能需要有判別標(biāo)準。越簡單的模型對集外數(shù)據(jù)預(yù)測的穩(wěn)定性越高,而越復(fù)雜的模型對集內(nèi)數(shù)據(jù)的擬合程度越高。BIC是一種常見的評價標(biāo)準,它綜合了以上對擬合精度和模型可靠性的度量,定義如公式(2)。BIC=Nlog(SSE/N)+plogN(2)其中,SSE表示預(yù)測誤差e的平方和。公式(2)的第一項表示模型的擬合精度,第二項表示對模型復(fù)雜度的懲罰。當(dāng)訓(xùn)練樣本數(shù)N—定時,越復(fù)雜的模型的參數(shù)個數(shù)p越大,對訓(xùn)練數(shù)據(jù)就擬合得越好,相應(yīng)的SSE就越小,第一項就越小,而第二項就增大。反之亦然。公式中一項的減小總是導(dǎo)致另一項的增大,當(dāng)兩項和最小時,表示模型"最優(yōu)"。BIC能在模型復(fù)雜度和數(shù)據(jù)M^莫之間取得一個不錯的平衡,這有助于解決數(shù)據(jù)稀疏和屬性協(xié)同作用的問題。下面就結(jié)合附圖對本發(fā)明的各個優(yōu)選實施例進行詳細的說明。圖1是根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法的流程圖。如圖1所示,首先在步驟ioi,用時長和基頻的正交多項式的系M示差分韻律向量。在本實施例中,差分韻律向量用于表示情感/表情韻律數(shù)據(jù)與中性韻律數(shù)據(jù)之間的差。具體地,在本實施例中,差分韻律向量中的基頻的正交多項式可以選用二階(或更高階的)勒讓德正交多項式。此多項式可以看作是文獻(X.Sun著的"F0generationforspeechsynthesisusingamulti-tierapproach",發(fā)表于InProc.ICSLP,02,pp.2077-2080)中描述的高階多項式的低階泰勒展開。此外,正交多項式在數(shù)學(xué)和物理問題中具有優(yōu)良的性質(zhì)。在此提出的基頻的正交多項式表示與上面的文獻中的高階多項式有兩點重要的區(qū)別,其一是用拋物線逼近代替泰勒指數(shù)逼近,其二是將段長歸一到[-l,l]的區(qū)間。這些變化能幫助提高參數(shù)化時的擬合性能。勒讓德多項式表示如下。正交多項式族的區(qū)間t屬于[-l,l,它們之間滿足公式(3)表示的正交關(guān)系。J二、(,)尸"(O力=^柳c(3)f1,w/zewm=wL0,vw/^wm#w(4)這里,5細是克羅內(nèi)克爾符號,g=2/(2h+1),前三階的多項式如式(5)誦(7)所示。戶。(O=l(5)Pi(《)=,(6)接下來,對于每一個音節(jié)定義H《)=a。p。(f)+a,;,(O(8)F(0=a。/o(f)+alj0l(0+a2p2(0(9)這里,r"J表示潛在的基頻目標(biāo),F(xiàn)"J表示基頻的包絡(luò)。勒讓德多項式的系數(shù)ao和A表示目標(biāo)基頻的截距和斜率,另一系數(shù)32表示二次逼近的系數(shù)。接著,在步驟105,對于差分韻律向量中的每一個員,即時長t、基頻的正交多項式系數(shù)ao、a!和a2,分別生成一個初始^預(yù)測模型。在本實施例中,利用廣義線性模型GLM表示每個初始參數(shù)預(yù)測模型。參數(shù)t、13a0、ai和a2對應(yīng)的GLM才莫型分別為、=/r'("。+f+(10)a。,=、■+e,.=/T1(〃。^《+e,.(11)a,,4U+e,.=+fA/)(J))+(12)^/、a2,=a2,+e,=;r'(々。+$+(13)下面首先針對Mt的GLM^挺型(10)進行說明。具體地,利用與差分韻律預(yù)測相關(guān)的多個屬性和這些屬性的組合,生成參數(shù)t的初始*預(yù)測模型。與差分韻律預(yù)測相關(guān)的屬性可以包括許多,大致可分為語言類型的屬性、語音類型的屬性和情感/表情類型的屬性,具體可包括情感/表情狀態(tài)(例如高興、悲傷、憤怒等)、中文字在句子中的位置(例如句首、句尾等)、聲調(diào)和句子類型(例如陳述句、感嘆句、疑問句、祈使句等)。在本實施例中,采用GLM才莫型來表示這些屬性和屬性組合。為了便于說明,假定與差分韻律預(yù)測相關(guān)的屬性只有情感/表情狀態(tài)(Emotion/ExpressionStatus)和聲調(diào)(Tone)。那么,初始參數(shù)預(yù)測才莫型的形式如下parameter~Emotion/ExpressionStatus+Tone+Emotion/ExpressionStatus*Tone,其中Emotion/ExpressionStatus*Tone表示Emotion/ExpressionStatus和Tone的組合,是一個2階項??梢岳斫?,當(dāng)屬性的數(shù)量增加時,作為屬性組合可以出現(xiàn)多個2階項、3階項等等。另外,在本實施例中,在生成初始M預(yù)測模型時,可以只取其中一部分的屬性組合,例如只取到全部的2階項;當(dāng)然,也可以取到3階項或?qū)⑷康膶傩越M合加入到初始參數(shù)預(yù)測模型中。總之,在初始參數(shù)預(yù)測模型中包括全部的單獨屬性(1階項)和至少一部分的屬性組合(2階項或多階項)。這樣,初始#預(yù)測模型可以利用很簡單的規(guī)則來自動生成,而不是如現(xiàn)有技術(shù)那樣,根據(jù)經(jīng)驗手工設(shè)定。然后,在步驟110,利用F檢驗(F-test)計算初始參數(shù)預(yù)測模型中每一項的重要性。關(guān)于F檢驗,作為一種已知的標(biāo)準統(tǒng)計方法,在盛驟,謝14式千,潘乘毅編的《概率論與數(shù)理統(tǒng)計》(2000第二版,高等教育出版社)中已經(jīng)有詳細的說明,在此不再重復(fù)。應(yīng)當(dāng)指出,雖然在本實施中使用的是F檢驗,但是,其它的統(tǒng)計方法也可以使用,例如,Chisq^est等等。接著,在步驟115,從初始^t預(yù)測模型中刪除F檢驗得分最低的項。然后,在步驟120,利用剩余的項,重新生成參數(shù)預(yù)測模型。接著,在步驟125,計算重新生成的參數(shù)預(yù)測模型的BIC值,利用前面所述的方法判斷該模型是否為最優(yōu)。如果步驟125的判斷結(jié)果為"是",則將該新生成的參數(shù)預(yù)測模型作為最佳模型,并在步驟130結(jié)束。如果步驟125的判斷結(jié)果為"否",則返回到步驟110,再次計算該重新生成的參數(shù)預(yù)測模型的每一項的重要性,刪除重要性最低的項(步驟115),并利用剩余的項重新生成模型(步驟120),直到獲得最佳參數(shù)預(yù)測模型。對于其它參數(shù)ao、^和a2的參數(shù)預(yù)測模型,根據(jù)與Mt相同的上述步驟進行訓(xùn)練。最終,得到參數(shù)t、a。、^和a2的四個GLM參數(shù)預(yù)測模型,它們和差分韻律向量共同構(gòu)成差分韻律自適應(yīng)模型。通過以上說明可以看出,在較小語料庫的條件下,本實施例能夠構(gòu)建準確而可靠的基于GLM的差分韻律自適應(yīng)模型,并且使用時長和基頻的正交多項式的系數(shù)以準確而穩(wěn)定地表示差分韻律向量。本實施例利用了基于廣義線性模型(GLM)的建模方法和基于F檢驗(F-test)和貝葉斯信息準則(BIC)的逐步回歸(stepwiseregression)的屬性選擇方法訓(xùn)練差分韻律自適應(yīng)模型。由于本實施例的GLM模型結(jié)構(gòu)靈活,容易實現(xiàn)對訓(xùn)練數(shù)據(jù)的自適應(yīng),從而解決了數(shù)據(jù)稀疏問題。進而,通過逐步回歸的方法能夠自動地選出重要屬性協(xié)同作用項。在同一發(fā)明構(gòu)思下,圖2是根據(jù)本發(fā)明一個實施例的生成差分韻律自適應(yīng)模型的方法的流程圖。下面就結(jié)合該圖,對本實施例進行描述。對于那些與前面實施例相同的部分,適當(dāng)省略其說明。利用本實施例的方法生成的差分韻律自適應(yīng)模型將被用于后面結(jié)合其它實施例描述的韻律預(yù)測方法及裝置和語音合成方法及裝置。如圖2所示,首先在步驟201,形成差分韻律向量的訓(xùn)練樣本集合。差分韻律向量的訓(xùn)練樣本集合是用于訓(xùn)練差分韻律自適應(yīng)模型的訓(xùn)練數(shù)據(jù)。如前所述,差分韻律向量是情感/表情語料庫中的情感/表情數(shù)據(jù)與中性韻律數(shù)據(jù)的差,因此,差分韻律向量的訓(xùn)練樣本集合是基于情感/表情語料庫和中性語料庫而形成的。具體地,在步驟2011,根據(jù)中性語料庫,獲取用時長和基頻的正交多項式的系數(shù)表示的中性韻律向量。接著,在步驟2015,根據(jù)情感/表情語料庫,獲取用時長和基頻的正交多項式的系數(shù)表示的情感/表情韻律向量。然后,在步驟2018,計算在步驟2015中獲得的情感/表情韻律向量與在步驟2011中獲得的中性韻律向量之間的差,以形成差分韻律向量的訓(xùn)練樣本集合。接著,在步驟205,根據(jù)所形成的差分韻律向量的訓(xùn)練樣本集合,利用圖l所示的實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,生成差分韻律自適應(yīng)模型。具體地,從差分韻律向量的訓(xùn)練樣本集合中提取每個參數(shù)的訓(xùn)練樣本,對每個參數(shù)的參數(shù)預(yù)測模型進行訓(xùn)練,以獲得每個參數(shù)的最優(yōu)參數(shù)預(yù)測模型。這樣,每個參數(shù)的最優(yōu)參數(shù)預(yù)測模型和差分韻律向量共同構(gòu)成差分韻律自適應(yīng)才莫型通過以上描述可以看出,本實施例的生成差分韻律自適應(yīng)才莫型的方法根據(jù)通過情感/表情語料庫與中性語料庫構(gòu)成的訓(xùn)練樣本集合,利用前面實施例的訓(xùn)練差分韻律自適應(yīng)模型的方法,生成差分韻律自適應(yīng)模型。利用本實施例所生成的差分韻律自適應(yīng)模型,容易實現(xiàn)對訓(xùn)練數(shù)據(jù)的自適應(yīng),解決數(shù)據(jù)稀疏的問題,并能夠自動的選出重要屬性協(xié)同作用項。在同一發(fā)明構(gòu)思下,圖3根據(jù)本發(fā)明的一個實施例的韻律預(yù)測方法的流程圖。下面結(jié)合該圖對本實施例進行描述,對于那些與前面實施例相同的部分,適當(dāng)省略其說明。如圖3所示,首先在步驟301,根據(jù)輸入的文本,獲得與中性韻律預(yù)測相關(guān)的多個屬性的值以及至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值。具體地,這些屬性的值可以從輸入的文本中直接獲得,或者經(jīng)過語法分析、句法分析等獲得。需要指出,本實施例可以采用任何已知的和未來的方法來獲得這些相應(yīng)的屬性,而并不限于某種特定的方式,并且獲得方式還與屬性的選擇相對應(yīng)。在本實施例中,與中性韻律預(yù)測相關(guān)的多個屬性包括語言類型和語音類型的屬性。下面的表1示例性地列舉了一些可以作為與中性韻律預(yù)測相關(guān)的屬性的屬性。表1:與中性韻律預(yù)測相關(guān)的屬性<table>tableseeoriginaldocumentpage17</column></row><table>SpRate語速(Speakingrate)如前所述,與差分韻律預(yù)測相關(guān)的屬性可包括情感/表情狀態(tài)、中文字在句子中的位置、聲調(diào)和句子類型。然而,"情感/表情狀態(tài)"屬性的值不能從輸入的文本中獲得,而是由用戶預(yù)先根據(jù)需要確定。即,根據(jù)輸入的文本,可以獲得"中文字在句子中的位置"、"聲調(diào)"和"句子類型"這三個屬性的值。然后,在步驟305,根據(jù)中性韻律預(yù)測模型,利用在步驟301中獲得得與中性韻律預(yù)測相關(guān)的多個屬性的值,計算中性韻律向量。在本實施例中,中性韻律預(yù)測模型是預(yù)先根據(jù)中性語料庫訓(xùn)練好的。接著,在步驟310,根據(jù)差分韻律自適應(yīng)模型,利用在步驟301中獲得的至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值以及預(yù)先確定的至少另一部分與差分韻律預(yù)測相關(guān)的多個屬性的值,計算差分韻律向量。其中,差分韻律自適應(yīng)模型是利用圖2所示的實施例的生成差分韻律自適應(yīng)模型的方法生成的。最后,在步驟315,計算在步驟305中得到的中性韻律向量與在步驟310中得到的差分韻律向量的和,從而獲得相應(yīng)的韻律。通過以上描述可以看出,本實施例的韻律預(yù)測方法利用中性韻律預(yù)測模型和由前面實施例的生成差分韻律自適應(yīng)模型的方法生成的差分韻律自適應(yīng)模型,通過用差分韻律補償中性韻律來預(yù)測韻律,能夠靈活、準確地預(yù)測韻律,并且容易實現(xiàn)對訓(xùn)練數(shù)據(jù)的自適應(yīng),解決了數(shù)據(jù)稀疏問題。在同一發(fā)明構(gòu)思下,圖4是根據(jù)本發(fā)明的一個實施例的語音合成方法的流程圖。下面結(jié)合該圖,對本發(fā)明的實施例進行描述。對于那些與前面實施例相同的部分,適當(dāng)省略其說明。如圖4所示,首先在步驟401,利用前面實施例描述的韻律預(yù)測方法,對輸入的文本預(yù)測韻律。接著,在步驟405,根據(jù)上述所預(yù)測的韻律,進4亍語音合成。通過以上的說明可知,由于本實施的語音合成方法采用了前面實施例的韻律預(yù)測方法來預(yù)測韻律,進而根據(jù)所預(yù)測的韻律進行語音合成,所以,容易實現(xiàn)對訓(xùn)練數(shù)據(jù)的自適應(yīng),解決了數(shù)據(jù)稀疏問題。因此,本實施例的語音合成方法可以更準確并且自動地進行語音合成,生成的語音更合理、易懂。在同一發(fā)明構(gòu)思下,圖5是根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置的示意性方框圖。下面結(jié)合該圖對本實施例進行詳細描述。對于那些與前面實施例相同的部分,適當(dāng)省略其說明。如圖5所示,本實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置500包括初始^=莫型生成單元501,其用時長和基頻的正交多項式的系數(shù)表示差分韻律向量,并對于差分韻律向量中的每一個參數(shù),利用與差^律預(yù)測相關(guān)的多個屬性和至少一部分上述屬性的組合生成一個初始參數(shù)預(yù)測模型,其中每個上述屬性或上述屬性的組合被作為一項;重要性計算單元502,其計算上述M預(yù)測模型的每一上述項的重要性;項刪除單元503,用于刪除上述計算出的重要性最低的項;模型再生成單元504,用于利用由項刪除單元503刪除后剩余的項重新生成參數(shù)預(yù)測模型;以及優(yōu)化判斷單元505,用于判斷由模型再生成單元504重新生成的參數(shù)預(yù)測模型是否最優(yōu);其中,上述差分韻律向量及其全部參數(shù)預(yù)測才莫型構(gòu)成差分韻律自適應(yīng)模型。與前面實施例的描勤目同,在本實施例中,用時長和基頻的正交多項式的系數(shù)表示差分韻律向量,并分別為差分韻律向量的每個參數(shù)t、a。、ai和a2建立一個GLM參數(shù)預(yù)測模型。分別對每個參數(shù)預(yù)測模型進行訓(xùn)練,以得到每個參數(shù)t、aQ、&1和a2的最優(yōu)參數(shù)預(yù)測模型,它們和該差分韻律向量共同構(gòu)成差^律自適應(yīng)模型。如前所述,與差分韻律預(yù)測相關(guān)的多個屬性包括語言類型、語音類型和情感類型的屬性,例如,包括從情感狀態(tài)、中文字在句子中的位置、聲調(diào)和句子類型中選擇的任意多個屬性。進一步地,重要性計算單元502利用F檢驗(F-test)計算每一項的重要性。進一步地,優(yōu)化判斷單元505利用貝葉斯信息準則(BIC)判斷上述19重新生成的參數(shù)預(yù)測模型是否最優(yōu)。另外,才艮據(jù)本發(fā)明的一個優(yōu)選實施例,至少一部分上述屬性的組合包括多個與韻律預(yù)測相關(guān)的屬性的全部2階的屬性組合。在此,應(yīng)當(dāng)指出,本實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差^律自適應(yīng)模型的裝置500及其各個組成部分可以用專用的電路或芯片構(gòu)成,也可以通過計算機(處理器)執(zhí)行相應(yīng)的程序來實現(xiàn)。并且,本實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置500在操作上實現(xiàn)圖1所示的實施例的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法。在同一發(fā)明構(gòu)思下,圖6是根據(jù)本發(fā)明的一個實施例的生成差分韻律自適應(yīng)模型的裝置的示意性方框圖。下面結(jié)合該圖對本實施例進行詳細描述。對于那些與前面實施例相同的部分,適當(dāng)省略其說明。如圖6所示,本實施例的生成差分韻律自適應(yīng)模型的裝置600包括差分韻律向量的訓(xùn)練樣本集合601;以及數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其可以是圖5所示的實施例描述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置500,該裝置500根據(jù)差分韻律向量的訓(xùn)練樣本集合601訓(xùn)練差分韻律自適應(yīng)模型。進一步地,本實施例的生成差分韻律自適應(yīng)才莫型的裝置600還包括中性語料庫602,其包含中性語料;中性韻律向量獲取單元603,其才艮據(jù)中性語料庫602,獲得用時長和基頻的正交多項式的系數(shù)表示的中性韻律向量;情感/表情語料庫604,其包含情感/表情語料;情感/表情韻律向量獲取單元605,其根據(jù)情感/表情語料庫604,獲得用時長和基頻的正交多項式的系數(shù)表示的情感/表情韻律向量;以及差分韻律向量計算單元606,其計算由情感/表情韻律向量獲取單元605獲得的情感/表情韻律向量與由中性韻律向量獲取單元603獲得的中性韻律向量之間的差,并提供給差分韻律向量的訓(xùn)練樣本集合601。應(yīng)當(dāng)指出,本實施例中的生成差^律自適應(yīng)模型的裝置600及其各個組成部分可以用專用的電路或芯片構(gòu)成,也可以通過計算機(處理器)執(zhí)行相應(yīng)的程序來實現(xiàn)。并且,本實施例的生成差分韻律自適應(yīng)模型的裝20置600在操作上可以實現(xiàn)圖2所示的實施例的生成差分韻律自適應(yīng)^=莫型的方法。在同一發(fā)明構(gòu)思下,圖7是根據(jù)本發(fā)明的一個實施例的韻律預(yù)測裝置700的示意性方框圖。下面結(jié)合該圖對本實施例進行詳細描述。對于那些與前面實施例相同的部分,適當(dāng)省略其說明。如圖7所示,本實施例的韻律預(yù)測裝置,包括中性韻律預(yù)測模型701,其是利用中性語料預(yù)先訓(xùn)練好的;差分韻律自適應(yīng)模型702,其由前面實施例描述的生成差分韻律自適應(yīng)模型的裝置600生成;屬性獲得單元703,其根據(jù)輸入的文本獲得與中性韻律預(yù)測相關(guān)的多個屬性的值以及至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值;中性韻律向量預(yù)測單元704,其根據(jù)中性韻律預(yù)測模型701,利用由屬性獲得單元703獲得的與中性韻律預(yù)測相關(guān)的多個屬性的值,計算中性韻律向量;差分韻律向量預(yù)測單元705,其根據(jù)差分韻律自適應(yīng)模型702,利用由屬性獲得單元703獲得的至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值以及預(yù)先確定的至少另一部分與差分韻律預(yù)測相關(guān)的多個屬性的值,計算差^律向量;以及韻律預(yù)測單元706,其計算由中性韻律向量預(yù)測單元704計算出的中性韻律向量與由差分韻律向量預(yù)測單元705計算出的差^l律向量的和,以獲得相應(yīng)的韻律。在本實施例中,與中性韻律預(yù)測相關(guān)的多個屬性包括語言類型和語音類型的屬性,例如,包括從前面表l中選擇的任意多個屬性。如前所述,與差分韻律預(yù)測相關(guān)的多個屬性包括情感/表情狀態(tài)、中文字在句子中的位置、聲調(diào)和句子類型。然而,"情感/表情狀態(tài),,屬性的值不能從輸入的文本中獲得,而是由用戶預(yù)先根據(jù)需要確定。即,屬性獲得單元703才艮據(jù)輸入的文本可以獲得"中文字在句子中的位置"、"聲調(diào),,和"句子類型"這三個與差分韻律預(yù)測相關(guān)的屬性的值。應(yīng)當(dāng)指出,本實施例中的韻律預(yù)測裝置700及其各個組成部分可以用專用的電路或芯片構(gòu)成,也可以通過計算機(處理器)執(zhí)行相應(yīng)的程序來實現(xiàn)。并且,本實施例的韻律預(yù)測裝置700在IMt上可以實現(xiàn)圖3所示的實施例的韻律預(yù)測方法。在同一發(fā)明構(gòu)思下,圖8是根據(jù)本發(fā)明一個實施例的語音合成裝置的方框圖。下面就結(jié)合該圖,對本實施例進行描述。對于那些與前面實施例相同的部分,適當(dāng)省略其說明。如圖8所示,本實施例的語音合成裝置800包括韻律預(yù)測裝置700,其可以是前面實施例中描述的韻律預(yù)測裝置;以及語音合成器801,其可以是現(xiàn)有技術(shù)的語音合成器,并根據(jù)由韻律預(yù)測裝置700預(yù)測的韻律,進行語音合成。在此,應(yīng)當(dāng)指出,本實施例中的語音合成裝置800及其各個組成部分可以用專用的電路或芯片構(gòu)成,也可以通過計算機(處理器)執(zhí)行相應(yīng)的程序來實現(xiàn)。并且,本實施例的語音合成裝置800在操作上可以實現(xiàn)圖4所示實施例的語音合成方法。以上雖然通過一些示例性的實施例詳細描述了本發(fā)明的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)才莫型的方法和裝置、生成差分韻律自適應(yīng)模型的方法和裝置、韻律預(yù)測的方法和裝置以及語音合成的方法和裝置,但是以上這些實施例并不是窮舉的,本領(lǐng)域技術(shù)人員可以在本發(fā)明的精神和范圍內(nèi)實現(xiàn)各種變化和修改。因此,本發(fā)明并不限于這些實施例,本發(fā)明的范圍僅由所附的權(quán)利要求限定。2權(quán)利要求1.一種數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,包括用時長和基頻的正交多項式的系數(shù)表示差分韻律向量;對于上述差分韻律向量中的每一個參數(shù),利用與差分韻律預(yù)測相關(guān)的多個屬性和至少一部分上述屬性的組合生成一個初始參數(shù)預(yù)測模型,其中每個上述屬性或上述屬性的組合被作為一項;計算上述參數(shù)預(yù)測模型的每一上述項的重要性;刪除上述計算出的重要性最低的項;利用剩余的項重新生成參數(shù)預(yù)測模型;判斷上述重新生成的參數(shù)預(yù)測模型是否最優(yōu);以及如果上述參數(shù)預(yù)測模型被判斷為不是最優(yōu),則重復(fù)上述計算每一項的重要性的步驟、上述刪除重要性最低的項的步驟、上述重新生成參數(shù)預(yù)測模型的步驟和上述判斷上述重新生成的參數(shù)預(yù)測模型是否最優(yōu)的步驟;其中,上述差分韻律向量及其全部參數(shù)預(yù)測模型構(gòu)成差分韻律自適應(yīng)模型。2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,其中,上述與差分韻律預(yù)測相關(guān)的多個屬性包括語言類型、語音類型和情感/表情類型的屬性。3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,其中,上述與差分韻律預(yù)測相關(guān)的多個屬性包括從情感/表情狀態(tài)、中文字在句子中的位置、聲調(diào)和句子類型中選擇的任意多個屬性。4.根據(jù)權(quán)利要求1至3任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)才莫型的方法,其中,上述Wt預(yù)測模型是廣義線性模型。5.根據(jù)權(quán)利要求1所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,其中,上述至少一部分上述屬性的組合包括上述多個與差分韻律預(yù)測相關(guān)的屬性的全部2階的屬性組合。6.根據(jù)權(quán)利要求1至5任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,其中,上述計算上述參數(shù)預(yù)測模型中每一上述項的重要性的步驟包括利用F檢驗計算每一項的重要性。7.根據(jù)權(quán)利要求1至6任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,其中,上述判斷上述重新生成的參數(shù)預(yù)測模型是否最優(yōu)的步驟包括利用貝葉斯信息準則判斷上述重新生成的參數(shù)預(yù)測模型是否最優(yōu)。8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,其中,上述判斷上述重新生成的參數(shù)預(yù)測模型是否最優(yōu)的步驟包括計算下式認=Mog,/iV)+plogiV其中,SSE表示預(yù)測誤差e的平方和,N表示訓(xùn)練樣本數(shù);以及當(dāng)上式中的BIC最小時,判斷參數(shù)預(yù)測模型為最優(yōu)。9.根據(jù)權(quán)利要求1至8任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)才莫型的方法,其中,上述基頻的正交多項式是二階或更高階的勒讓德正交多項式。10.根據(jù)權(quán)利要求9所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,其中,上述勒讓德正交多項式表示為其中,JF"J表示基頻的包絡(luò),a。、aj和a2表示所述系數(shù),f屬于[-l,l。11.一種生成差分韻律自適應(yīng)模型的方法,包括形成差分韻律向量的訓(xùn)練樣本集合;以及根據(jù)上述差分韻律向量的訓(xùn)練樣本集合,利用權(quán)利要求1至10任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法,生成差分韻律自適應(yīng)模型。12.根據(jù)權(quán)利要求11所述的生成差分韻律自適應(yīng)模型的方法,其中,上述形成差分韻律向量的訓(xùn)練樣本集合的步驟包括根據(jù)中性語料庫,獲取用時長和基頻的正交多項式的系數(shù)表示的中性韻律向量;根據(jù)情感/表情語料庫,獲取用時長和基頻的正交多項式的系數(shù)表示的情感/表情韻律向量;以及計算上述情感/表情韻律向量與上述中性韻律向量之間的差,以形成差分韻律向量的訓(xùn)練樣本集合。13.—種韻律預(yù)測方法,包括根據(jù)輸入的文本,獲得與中性韻律預(yù)測相關(guān)的多個屬性的值以及至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值;根據(jù)中性韻律預(yù)測模型,利用上述與中性韻律預(yù)測相關(guān)的多個屬性的值,計算中性韻律向量;根據(jù)差^律自適應(yīng)模型,利用上述至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值以及預(yù)先確定的至少另一部分與差分韻律預(yù)測相關(guān)的多個屬性的值,計算差分韻律向量;以及計算上述中性韻律向量與上述差分韻律向量的和,以獲得相應(yīng)的韻律;其中,上述差分韻律自適應(yīng)模型是利用權(quán)利要求11或12所述的生成差分韻律自適應(yīng)模型的方法生成的。14.根據(jù)權(quán)利要求13所述的韻律預(yù)測方法,其中,上述與中性韻律預(yù)測相關(guān)的多個屬性包括語言類型的屬性和語音類型的屬性。15.根據(jù)權(quán)利要求13所述的韻律預(yù)測方法,其中,上述與中性韻律預(yù)測相關(guān)的多個屬性包括從當(dāng)前音素、音節(jié)中另一個音素、前一個音節(jié)相鄰的音素、后一個音節(jié)相鄰的音素、聲調(diào)、前音節(jié)的聲調(diào)、后音節(jié)的聲調(diào)、詞性、到下一個停頓的距離、到前一個停頓的距離、音節(jié)在語法詞中的位置、前后及當(dāng)前語法詞的長度、語法詞中音節(jié)的個數(shù)、音節(jié)在句子中的位置和句中語法詞的個數(shù)中選擇的任意多個屬性。16.根據(jù)權(quán)利要求13至15任意一項所述的韻律預(yù)測方法,其中,上述預(yù)先確定的至少另一部分與差^律預(yù)測相關(guān)的多個屬性包括情感/表情類型的屬性。17.—種語音合成方法,包括對輸入的文本利用上i^利要求13至16任意一項所述的韻律預(yù)測方法,預(yù)測韻律;以及根據(jù)上述所預(yù)測的韻律,進行語音合成。18.—種數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,包括初始模型生成單元,其用時長和基頻的正交多項式的系數(shù)表示差^律向量,并對于上述差分韻律向量中的每一個參數(shù),利用與差分韻律預(yù)測相關(guān)的多個屬性和至少一部分上述屬性的組合生成一個初始參數(shù)預(yù)測模型,其中每個上述屬性或上述屬性的組合被作為一項;重要性計算單元,用于計算上述參數(shù)預(yù)測模型的每一上述項的重要性;項刪除單元,用于刪除上述計算出的重要性最低的項;模型再生成單元,用于利用由上述項刪除單元刪除后剩余的項重新生成參數(shù)預(yù)測才莫型;以及優(yōu)化判斷單元,用于判斷由上述模型再生成單元重新生成的參數(shù)預(yù)測模型是否最優(yōu);其中,上述差分韻律向量及其全部參數(shù)預(yù)測;漠型構(gòu)成差分韻律自適應(yīng)模型。19.根據(jù)權(quán)利要求18所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上述與差分韻律預(yù)測相關(guān)的多個屬性包括語言類型、語音類型和情感類型的屬性。20.根據(jù)權(quán)利要求18所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上述與差分韻律預(yù)測相關(guān)的多個屬性包括從情感狀態(tài)、中文字在句子中的位置、聲調(diào)和句子類型中選擇的任意多個屬性。21.根據(jù)權(quán)利要求18至20任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上述參數(shù)預(yù)測模型是廣義線性模型。22.根據(jù)權(quán)利要求18所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上迷至少一部分上述屬性的組合包括上述多個與差分韻律預(yù)測相關(guān)的屬性的全部2階的屬性組合。23.根據(jù)權(quán)利要求18至22任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上述重要性計算單元利用F檢驗計算每一項的重要性。24.根據(jù)權(quán)利要求18至23任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上述優(yōu)化判斷單元利用貝葉斯信息準則判斷上述重新生成的M預(yù)測模型是否最優(yōu)。25.根據(jù)權(quán)利要求18至24任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上述基頻的正交多項式是二階或更高階的勒讓德正交多項式。26.根據(jù)權(quán)利要求25所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其中,上述勒讓德正交多項式表示為其中,F(xiàn)"J表示基頻的包絡(luò),a0、^和a2表示所述系數(shù),f屬于[-l,l。27.—種生成差分韻律自適應(yīng);f莫型的裝置,包括差分韻律向量的訓(xùn)練樣本集合;以及權(quán)利要求18至26任意一項所述的數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的裝置,其根據(jù)上述差分韻律向量的訓(xùn)練樣本集合訓(xùn)練差分韻律自適應(yīng)模型。28.根據(jù)權(quán)利要求27所述的生成差^l律自適應(yīng)模型的裝置,還包括中性語料庫;中性韻律向量獲取單元,其根據(jù)上述中性語料庫,獲得用時長和基頻的正交多項式的系數(shù)表示的中性韻律向量;情感/表情語料庫;情感/表情韻律向量獲取單元,其根據(jù)上述情感/表情語料庫,獲得用時長和基頻的正交多項式的系數(shù)表示的情感/表情韻律向量;以及差^律向量計算單元,其計算上述情感/表情韻律向量與上述中性韻律向量之間的差,并提供給上述差分韻律向量的訓(xùn)練樣本集合。29.—種韻律預(yù)測裝置,包括中性韻律預(yù)測模型;利用權(quán)利要求27或28所述的生成差分韻律自適應(yīng)模型的裝置生成的差分韻律自適應(yīng)模型;屬性獲得單元,用于根據(jù)輸入的文本獲得與中性韻律預(yù)測相關(guān)的多個屬性的值以及至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值;中性韻律向量預(yù)測單元,用于根據(jù)上述中性韻律預(yù)測模型,利用上述與中性韻律預(yù)測相關(guān)的多個屬性的值,計算中性韻律向量;差分韻律向量預(yù)測單元,用于根據(jù)上述差分韻律自適應(yīng)模型,利用上述至少一部分與差分韻律預(yù)測相關(guān)的多個屬性的值以及預(yù)先確定的至少另一部分與差分韻律預(yù)測相關(guān)的多個屬性的值,計算差分韻律向量;以及韻律預(yù)測單元,用于計算上述中性韻律向量與上述差分韻律向量的和,以獲得相應(yīng)的韻律。30.根據(jù)權(quán)利要求29所述的韻律預(yù)測裝置,其中,上述與中性韻律預(yù)測相關(guān)的多個屬性包括語言類型的屬性和語音類型的屬性。31.根據(jù)權(quán)利要求29所述的韻律預(yù)測裝置,其中,上述與中性韻律預(yù)測相關(guān)的多個屬性包括從當(dāng)前音素、音節(jié)中另一個音素、前一個音節(jié)相鄰的音素、后一個音節(jié)相鄰的音素、聲調(diào)、前音節(jié)的聲調(diào)、后音節(jié)的聲調(diào)、詞性、到下一個停頓的距離、到前一個停頓的距離、音節(jié)在語法詞中的位置、前后及當(dāng)前語法詞的長度、語法詞中音節(jié)的個數(shù)、音節(jié)在句子中的位置和句中語法詞的個數(shù)中選擇的任意多個屬性。32,根據(jù)權(quán)利要求29至31任意一項所述的韻律預(yù)測裝置,其中,上述預(yù)先確定的至少另一部分與差分韻律預(yù)測相關(guān)的多個屬性包括情感/表情類型的屬性。33.—種語音合成裝置,包括權(quán)利要求29至32任意一項所述的韻律預(yù)測裝置;并且根據(jù)由上述韻律預(yù)測裝置預(yù)測的韻律,進行語音合成。全文摘要本發(fā)明提供數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型、生成差分韻律自適應(yīng)模型、韻律預(yù)測和語音合成的方法及裝置。該數(shù)據(jù)驅(qū)動訓(xùn)練差分韻律自適應(yīng)模型的方法包括用時長和基頻的正交多項式的系數(shù)表示差分韻律向量;對于差分韻律向量中的每一個參數(shù),利用與差分韻律預(yù)測相關(guān)的多個屬性和這些屬性的組合生成初始參數(shù)預(yù)測模型,其中每個屬性或上述屬性的組合被作為一項;計算參數(shù)預(yù)測模型的每一項的重要性;刪除所計算的重要性最低的項;利用剩余的項重新生成參數(shù)預(yù)測模型;判斷重新生成的參數(shù)預(yù)測模型是否最優(yōu);如果參數(shù)預(yù)測模型不是最優(yōu),則重復(fù)上述計算每一項的重要性的步驟及其之后的步驟;其中差分韻律向量及其全部參數(shù)預(yù)測模型構(gòu)成差分韻律自適應(yīng)模型。文檔編號G10L13/00GK101452699SQ20071019710公開日2009年6月10日申請日期2007年12月4日優(yōu)先權(quán)日2007年12月4日發(fā)明者易立夫,健李,樓曉雁,杰郝申請人:株式會社東芝