構(gòu)建語音特征庫的方法、語音合成方法、裝置及設(shè)備的制造方法_4

文檔序號：9371978閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>構(gòu)建語音特征庫的方法、語音合成方法、裝置及設(shè)備的制造方法

所涉及的功能而定。也要注意的是，框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合，可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn)，或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
[0113]對于本領(lǐng)域技術(shù)人員而言，顯然本發(fā)明不限于上述示范性實施例的細節(jié)，而且在不背離本發(fā)明的精神或基本特征的情況下，能夠以其他的具體形式實現(xiàn)本發(fā)明。因此，無論從哪一點來看，均應(yīng)將實施例看作是示范性的，而且是非限制性的，本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定，因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
【主權(quán)項】
1.一種構(gòu)建語音特征庫的方法，包括: 將對象的錄音轉(zhuǎn)換為個性化的文本信息；分析得到每條個性化的文本信息對應(yīng)的至少一個語境和相同語義的至少一條文本信息; 在所述對象的語音特征庫中關(guān)聯(lián)保存每條個性化的文本信息及對應(yīng)的文語特征，每條文語特征指示對應(yīng)的一個語境和一條文本信息；對所述錄音進行音頻采樣，得到音頻采樣值；在所述對象的語音特征庫中保存音頻特征，音頻特征指示了音頻采樣值。2.根據(jù)權(quán)利要求1所述的方法，該方法還包括: 在所述語音特征庫中保存每條個性化的文本信息對應(yīng)的語音特征，每條語音特征指示一條文語特征和一條音頻特征。3.根據(jù)權(quán)利要求1或2所述的方法，其中每條文語特征還指示對應(yīng)的語境和文本信息在本條文語特征中的權(quán)重。4.根據(jù)權(quán)利要求3所述的方法，其中，所述在所述對象的語音特征庫中關(guān)聯(lián)保存每條個性化的文本信息及對應(yīng)的文語特征的步驟包括: 生成每條個性化的文本信息對應(yīng)的文語特征，并確定每條文語特征指示的語境和文本信息在本條文語特征中的權(quán)重；如果在所述對象的語音特征庫中已經(jīng)保存的文語特征指示的語境和文本信息與分析得到的語境和文本信息相同，但在文語特征中的權(quán)重不同，將權(quán)重按照預(yù)定規(guī)則合并。5.根據(jù)權(quán)利要求1或2所述的方法，在所述對象的語音特征庫中保存音頻特征的步驟包括: 如果在所述對象的語音特征庫中已經(jīng)保存的音頻特征指示的音頻采樣值與音頻采樣得到的音頻采樣值的差值在預(yù)定范圍內(nèi)，將音頻采樣值合并。6.一種語音合成方法，包括: 分析得到待進行語音合成的文本信息的語境；生成所述待進行語音合成的文本信息對應(yīng)的文語特征，指示所述待進行語音合成的文本信息及其語境；在語音特征庫中查找與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征，所述語音特征庫中的每條個性化的文本信息對應(yīng)的每條文語特征指示對應(yīng)的一個語境和一個相同語義的文本信息；根據(jù)查找到的文語特征指示的語境，所述文語特征對應(yīng)的個性化的文本信息，和所述語音特征庫中保存的音頻特征，進行語音合成，所述音頻特征指示音頻采樣值。7.根據(jù)權(quán)利要求6所述的語音合成方法，在語音特征庫中查找與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征，包括: 根據(jù)語音特征庫中保存的語音特征，查找與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征，每條語音特征指示一條文語特征和一條音頻特征。8.根據(jù)權(quán)利要求6或7所述的語音合成方法，其中每條文語特征還指示對應(yīng)的語境和文本信息在本條文語特征中的權(quán)重；與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征是指語境和文本信息相同，且在文本特征中的權(quán)重最接近。9.一種構(gòu)建語音特征庫的裝置，包括: 用于將對象的錄音轉(zhuǎn)換為個性化的文本信息的裝置；用于分析得到每條個性化的文本信息對應(yīng)的至少一個語境和相同語義的至少一條文本信息的裝置；用于在所述對象的語音特征庫中關(guān)聯(lián)保存每條個性化的文本信息及對應(yīng)的文語特征的裝置，每條文語特征指示對應(yīng)的一個語境和一條文本信息；用于對所述錄音進行音頻采樣，得到音頻采樣值的裝置；用于在所述對象的語音特征庫中保存音頻特征的裝置，音頻特征指示了音頻采樣值。10.根據(jù)權(quán)利要求9所述的裝置，還包括用于在所述語音特征庫中保存每條個性化的文本信息對應(yīng)的語音特征的裝置，每條語音特征指示一條文語特征和一條音頻特征。11.根據(jù)權(quán)利要求9或10所述的裝置，其中每條文語特征還指示對應(yīng)的語境和文本信息在本條文語特征中的權(quán)重。12.根據(jù)權(quán)利要求11所述的裝置，所述用于在所述對象的語音特征庫中關(guān)聯(lián)保存每條個性化的文本信息及對應(yīng)的文語特征的裝置具體被配置為: 生成每條個性化的文本信息對應(yīng)的文語特征，并確定每條文語特征指示的語境和文本信息在本條文語特征中的權(quán)重；如果在所述對象的語音特征庫中已經(jīng)保存的文語特征指示的語境和文本信息與分析得到的語境和文本信息相同，但在文語特征中的權(quán)重不同，將權(quán)重按照預(yù)定規(guī)則合并。13.根據(jù)權(quán)利要求9或10所述的裝置，所述用于在所述對象的語音特征庫中保存音頻特征的裝置具體被配置為:如果在所述對象的語音特征庫中已經(jīng)保存的音頻特征指示的音頻采樣值與音頻采樣得到的音頻采樣值的差值在預(yù)定范圍內(nèi)，將音頻采樣值合并。14.一種計算機設(shè)備，包括權(quán)利要求9-13中任一個的構(gòu)建語音特征庫的裝置。15.一種語音合成裝置，包括: 用于分析得到待進行語音合成的文本信息的語境的裝置；用于生成所述待進行語音合成的文本信息對應(yīng)的文語特征以指示所述待進行語音合成的文本信息及其語境的裝置；用于在語音特征庫中查找與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征的裝置，所述語音特征庫中的每條個性化的文本信息對應(yīng)的每條文語特征指示對應(yīng)的一個語境和一個相同語義的文本信息；用于根據(jù)查找到的文語特征指示的語境，所述文語特征對應(yīng)的個性化的文本信息，和所述語音特征庫中保存的音頻特征，進行語音合成的裝置，所述音頻特征指示音頻采樣值。16.根據(jù)權(quán)利要求15所述的語音合成裝置，所述用于在語音特征庫中查找與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征的裝置具體被配置為: 根據(jù)語音特征庫中保存的語音特征，查找與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征，每條語音特征指示一條文語特征和一條音頻特征。17.根據(jù)權(quán)利要求15或16所述的語音合成裝置，其中每條文語特征還指示對應(yīng)的語境和文本信息在本條文語特征中的權(quán)重；與待進行語音合成的文本信息對應(yīng)的文語特征匹配的文語特征是指語境和文本信息相同，且在文本特征中的權(quán)重最接近。18.一種計算機設(shè)備，包括根據(jù)權(quán)利要求15-17中任一個的語音合成裝置。
【專利摘要】本發(fā)明提供了一種構(gòu)建語音特征庫的方法、語音合成方法、裝置及設(shè)備。該語音合成方法所使用的語音特征庫中保存有每條個性化的文本信息對應(yīng)的至少一個語境和與該條個性化的文本信息相同語義的至少一條文本信息。在進行語音合成時，即使提供的文本信息并非所需的個性化語音對應(yīng)的個性化文本信息，也可以在語音特征庫中首先查找到與需要進行語音合成的文本信息語義相同的個性化的文本信息，進而實現(xiàn)個性化的語音合成，從而使得個性化語音的使用不依賴于人的生老病死。
【IPC分類】G10L13/02, G10L13/08
【公開號】CN105096934
【申請?zhí)枴緾N201510375429
【發(fā)明人】呂文玉, 王道龍, 劉孟
【申請人】百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
【公開日】2015年11月25日
【申請日】2015年6月30日

完整全部詳細技術(shù)資料下載

當(dāng)前第4頁1 2 3 4

相關(guān)技術(shù)