两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語音合成系統(tǒng)以及方法

文檔序號:2821763閱讀:391來源:國知局
專利名稱:語音合成系統(tǒng)以及方法
技術(shù)領(lǐng)域
本發(fā)明是關(guān)于一種語音合成系統(tǒng)及方法,特別是關(guān)于一種可自動合成單詞語音資料的系統(tǒng)及方法。
背景技術(shù)
電子辭典由于其體積小巧,儲存容量大,并具有真人發(fā)音及可無限擴充資源等功能,已成為很多人學(xué)習(xí)外語的必備工具。
現(xiàn)今大多數(shù)電子辭典具有的語音發(fā)聲功能,大都通過兩種方式實現(xiàn),其一,是將辭典中所有單詞的發(fā)音資料預(yù)先制作成錄音文件儲存在該辭典中,并與對應(yīng)的單詞資料進(jìn)行鏈接,當(dāng)使用者點擊該單詞時,即可提供使用者每個單詞的正確讀音。然而,這做法對于后續(xù)經(jīng)由擴充后納入的單詞所對應(yīng)的語音資料往往無法同步獲得更新,因而無法提供該擴充新詞的發(fā)音功能。另一種方法,則是通過TTS(Text-To-Speech)引擎進(jìn)行語音的自動合成作業(yè),然通過這種方式合成的語音較為僵硬,無法提供使用者滿意的發(fā)音信息。
因此,如何提供一種可自動合成單詞的語音信息技術(shù),并同時具有較佳發(fā)音效果的系統(tǒng),是目前急待解決的技術(shù)課題。

發(fā)明內(nèi)容
為克服上述現(xiàn)有技術(shù)的缺點,本發(fā)明的主要目的在于提供一種語音合成系統(tǒng)及方法,可自動解析單詞的構(gòu)詞形式,借以合成該單詞所對應(yīng)的語音資料。
為達(dá)上述目的,本發(fā)明即提供一種語音合成系統(tǒng)及方法,本發(fā)明的語音合成系統(tǒng)至少包括數(shù)據(jù)庫,用于儲存多筆單詞資料及其對應(yīng)的語音聲波資料;解析模塊,用于分析單詞的構(gòu)詞形式,并根據(jù)該分析結(jié)果進(jìn)行對應(yīng)的分解,將該單詞變形為由詞根及詞綴形成的組合;查詢模塊,用于根據(jù)該解析模塊的分解結(jié)果,分別針對詞根及詞綴從該數(shù)據(jù)庫中查詢相關(guān)的單詞資料,獲取對應(yīng)的語音聲波資料;切音模塊,用于參照該解析模塊分解出的詞根及詞綴資料,以音節(jié)為單位將該查詢模塊所查詢出的單詞資料進(jìn)行對應(yīng)的切音,獲得該詞根及詞綴所對應(yīng)的語音資料;以及合成模塊,用于將經(jīng)過該切音模塊處理所得到的語音聲波資料進(jìn)行排列組合,與該詞根及詞綴所形成的組合形成一對一的對應(yīng)關(guān)系,合成出該單詞的語音資料。
其中,上述系統(tǒng)適用于電子辭典中,該解析模塊是根據(jù)單詞的構(gòu)詞規(guī)則將單詞分解為由多個詞根及詞綴結(jié)合成的組合;該查詢模塊則按該詞根或詞綴內(nèi)容,從數(shù)據(jù)庫中檢索出所有包括該詞根或詞綴內(nèi)容的單詞資料。該查詢模塊還包括篩選單元,該篩選單元用于根據(jù)該解析模塊所分解出的詞根及詞綴資料,通過對比在查詢模塊查詢出的所有與該詞根或詞綴內(nèi)容相關(guān)的單詞資料中篩選出最佳的單詞資料,供切音模塊進(jìn)行后續(xù)處理。
本發(fā)明的語音合成方法包括(1)首先,提供解析模塊用于分析單詞的構(gòu)詞形式,并根據(jù)該分析結(jié)果進(jìn)行對應(yīng)的分解程序,將該單詞變形為由詞根及詞綴組成的組合;(2)提供查詢模塊,用于根據(jù)該解析模塊的分解結(jié)果針對該各詞根及詞綴內(nèi)容,分別從該數(shù)據(jù)庫中查詢相關(guān)的單詞資料,進(jìn)而獲取對應(yīng)的語音聲波資料;(3)提供切音模塊,借以參照該解析模塊分解出的詞根及詞綴資料,以音節(jié)為單位將查詢模塊查出的單詞資料進(jìn)行切音,獲得該詞根及詞綴所對應(yīng)的語音資料;以及(4)提供合成模塊,用于將經(jīng)由切音模塊處理所得到的語音聲波資料進(jìn)行排列組合,與該詞根及詞綴所形成的組合形成一對一的對應(yīng)關(guān)系,合成出該單詞的語音資料。
綜上所述,本發(fā)明方法的各步驟生成的資料均存放在數(shù)據(jù)庫中,且該數(shù)據(jù)庫還儲存有多筆單詞資料及其對應(yīng)的語音聲波資料。在步驟(1)中,該解析模塊是根據(jù)單詞的構(gòu)詞規(guī)則將單詞分解為由多個詞根及詞綴結(jié)合成的組合。在步驟(2)中,該查詢模塊是根據(jù)該詞根或詞綴內(nèi)容,從該數(shù)據(jù)庫中檢索出所有包括該詞根或詞綴內(nèi)容的單詞資料。且在該方法步驟(2)中,還包括令篩選單元根據(jù)該解析模塊所分解出的詞根及詞綴資料,經(jīng)對比從該查詢模塊查詢出的所有與該詞根或詞綴內(nèi)容相關(guān)的單詞資料中篩選出最佳的單詞資料,供該切音模塊進(jìn)行后續(xù)的處理步驟。其中,當(dāng)該篩選單元的對比結(jié)果為該數(shù)據(jù)庫中存在單詞資料與該詞根及詞綴資料完全一致時,則該筆單詞資料即為最佳的單詞資料;當(dāng)有多個候選單詞資料時,該篩選單元則以對比結(jié)果為構(gòu)詞類型一致且差異與該詞根或詞綴最小者為最佳的單詞資料。
因此,本發(fā)明的語音合成系統(tǒng)及方法,可將單詞分解為若干詞根與詞綴的組成形式,并檢索出各詞根及詞綴所分別對應(yīng)的最佳語音聲波資料,借以自動合成該單詞的語音資料,并同時具有較佳的發(fā)音效果。


圖1是本發(fā)明的語音合成系統(tǒng)所需的基本結(jié)構(gòu)方塊示意圖;以及圖2是本發(fā)明的語音合成方法的操作流程示意圖。
具體實施例方式
實施例以下通過特定的具體實施例說明本發(fā)明的實施方式。
圖1是本發(fā)明的語音合成系統(tǒng)應(yīng)用在電子辭典中的示意圖。如圖所示,本發(fā)明的語音合成系統(tǒng)100適用于電子辭典1中,用于自動合成單詞的語音。該語音合成系統(tǒng)100包括數(shù)據(jù)庫110、解析模塊120、查詢模塊130、切音模塊140以及合成模塊150。其中,該查詢模塊130另包括篩選單元131。
數(shù)據(jù)庫110用于儲存多筆單詞資料及其所對應(yīng)的語音聲波資料。在本實施例中,該數(shù)據(jù)庫110分為單詞庫及語音庫(未標(biāo)出),其中,該單詞庫儲存有電子辭典1中所有單詞的相關(guān)資料,例如音標(biāo)、詞性、文字及圖形釋義資料等,供使用者進(jìn)行擴充及更新,語音庫則存放有單詞的語音聲聲波資料,它與該單詞庫相互鏈接,并與該單詞庫中的各單詞相互對應(yīng)。
解析模塊120用于分析單詞的構(gòu)詞形式,按該分析結(jié)果進(jìn)行對應(yīng)的分解,將該單詞變形為由詞根及詞綴形成的組合。在英語單詞中,大部分是由詞根及詞綴(前綴/后綴)組合而成的派生詞。其主要有“詞根+后綴”組合的形式如paint+-er組成painter;“前綴+詞根”組合形式如inter-+vene組成intervene;“詞根+詞根”組合形式如tele+scope組成telescope;以及“前綴+詞根+后綴”組合形式如in-+aud+-ible組成inaudible等。在本實施例中,該解析模塊120是運用上述構(gòu)詞規(guī)則,將單詞分解為若干詞根及詞綴的組合形式,例如單詞methodology可分解為詞根method與后綴ology。
查詢模塊130則用于按解析模塊120的分解結(jié)果,分別針對各詞根及詞綴內(nèi)容,從數(shù)據(jù)庫110中查詢相關(guān)的單詞資料,借以獲取對應(yīng)的語音聲波資料。其中,該查詢模塊130中還包括有篩選單元131,用于根據(jù)解析模塊120分解出的詞根及詞綴資料,經(jīng)過對比從查詢模塊130查詢出的所有與該詞根或詞綴內(nèi)容相關(guān)的單詞資料中,篩選出最佳的單詞資料,供該切音模塊140進(jìn)行后續(xù)處理(容后詳述)。該判斷原則是若數(shù)據(jù)庫110中存在單詞資料與該詞根及詞綴資料完全一致時(通常為詞根),即為最佳的單詞資料;當(dāng)存在多個候選單詞資料時(通常詞綴),則以構(gòu)詞類型一致且與該詞根或詞綴差異最小者為最佳的單詞資料。
在本實施例中,令該查詢模塊130首先根據(jù)解析模塊120分解得的詞根method,從數(shù)據(jù)庫110中檢索出所有包括該詞根的單詞,如“method”、“methodic”、“methodist”以及“unmethodical”等單詞資料,然后,令該篩選單元131針對檢索出的單詞資料,分別與該詞根“method”進(jìn)行對比,如在數(shù)據(jù)庫110中發(fā)現(xiàn)存在單詞“method”與該詞根資料完全相符,則該單詞“method”即被視為對應(yīng)于該詞根的最佳單詞資料。
接著,令該查詢模塊130從數(shù)據(jù)庫110中持續(xù)檢索所有包括有該詞綴ology的單詞資料,如“technology”、“sociology”以及“biology”等;然后,該篩選單元131即對該單詞資料一一進(jìn)行對比,如未發(fā)現(xiàn)與詞綴“ology”完全相符的單詞;則分析ology在該單詞中的構(gòu)詞位置,由于該詞綴ology在單詞“methodology”中為“后綴”,該篩選單元131則篩選出所有以ology為后綴的單詞資料;最后將每個單詞與該詞綴ology進(jìn)行差異比較,例如在除去ology之后,剩余字母最少者為最佳,經(jīng)對比后發(fā)現(xiàn)單詞“biology”與詞綴“ology”最為相似,即挑選其為最佳的單詞資料。
切音模塊140則用于參照該解析模塊120分解出的詞根及詞綴資料,并以音節(jié)為單位將該查詢模塊130查詢出的單詞資料進(jìn)行切音,從而獲得該詞根及詞綴所對應(yīng)的語音資料。在本實施例中,該查詢模塊130查詢的結(jié)果為對應(yīng)詞根“method”的單詞“method”以及對應(yīng)詞綴“ology”的單詞“biology”。由于method與該詞根完全一致,故其所對應(yīng)的“語音聲波1(未標(biāo)出)”資料即可以直接利用。該切音模塊140參照詞綴“ology”的內(nèi)容,以音節(jié)(元音或字音)為單位針對該單詞“biology”的語音聲波資料進(jìn)行相應(yīng)的切音處理,并在其元音處進(jìn)行切割,以截取單詞的后段語音聲波資料,即“ology”對應(yīng)的“語音聲波2(未標(biāo)出)”資料。
合成模塊150則用于將經(jīng)由該切音模塊140處理得到的語音聲波資料進(jìn)行排列組合,與該詞根及詞綴形成組合形成一對一的對應(yīng)關(guān)系,以合成該單詞的語音資料。在本實施例中,該合成模塊150將切音模塊140處理后得到的“語音聲波1”資料及“語音聲波2”資料,分別按照其所對應(yīng)的詞根與詞綴的位置關(guān)系,進(jìn)行對應(yīng)的排列,也就是method(語音聲波1)+ology(語音聲波2),合成單詞“methodology”的語音資料。
圖2是流程圖,顯示本發(fā)明語音合成方法的操作程序,本發(fā)明的語音合成方法適用于電子辭典中。如圖所示,首先,進(jìn)行步驟S210,預(yù)建數(shù)據(jù)庫110,用于儲存該電子辭典1中所有單詞的相關(guān)釋義資料及其對應(yīng)的語音聲波資料,接著進(jìn)至步驟S220。
在步驟S220中,令該解析模塊120分析單詞“methodology”的構(gòu)詞形式,并依照分析結(jié)果將單詞分解為詞根method+后綴ology,接著,進(jìn)至步驟S230。
在步驟S230中,令該查詢模塊130根據(jù)解析模塊120的分解結(jié)果,針對該各詞根及詞綴分別從數(shù)據(jù)庫110中查詢相關(guān)的單詞資料,借以獲取對應(yīng)的語音聲波資料。在本實施例中,該查詢模塊130對應(yīng)詞根“method”從數(shù)據(jù)庫110中檢索出“method”、“methodic”、“methodist”以及“unmethodical”等單詞資料;對應(yīng)后綴“ology”則從數(shù)據(jù)庫110中檢索出“technology”、“sociology”以及“biology”等單詞資料;隨后,令該篩選單元131對該單詞資料一一進(jìn)行對比,借以篩選出對應(yīng)該詞根“method”的最佳單詞資料“method”,以及對應(yīng)該詞綴“ology”的最佳單詞資料“biology”,接著,進(jìn)至步驟S240。
在步驟S240中,令該切音模塊140參照該詞根及詞綴資料,以音節(jié)為單位將查詢模塊130查詢所得到的最佳單詞資料分別進(jìn)行切音,獲得該詞根“method”所對應(yīng)的“語音聲波1”資料以及對應(yīng)于該詞綴“ology”的“語音聲波2”資料,接著進(jìn)至步驟S250。
在步驟S250中,令該合成模塊150將經(jīng)由該切音模塊140執(zhí)行切音處理所獲得的“語音聲波1”資料與“語音聲波2”資料,按照其相應(yīng)的詞根method與詞綴ology的排列順序進(jìn)行對應(yīng)的排列組合,即method(語音聲波1)+ology(語音聲波2),合成該單詞的語音資料。
綜上所述,本發(fā)明的語音合成系統(tǒng)及方法適用于電子辭典中,該方法首先針對單詞進(jìn)行預(yù)分析處理,以識別出組成該單詞的詞根及詞綴,還在電子辭典的語言數(shù)據(jù)庫中檢索出各詞根及詞綴的最佳語音參數(shù),并將該搜索出的所有語音參數(shù)按照平滑算法加以排列組合,合成出該單詞的語音資料。
權(quán)利要求
1.一種語音合成系統(tǒng),其特征在于,該系統(tǒng)至少包括數(shù)據(jù)庫,用于儲存多筆單詞資料及其對應(yīng)的語音聲波資料;解析模塊,用于分析單詞的構(gòu)詞形式,并根據(jù)該分析結(jié)果進(jìn)行對應(yīng)的分解,將該單詞變形為由詞根及詞綴形成的組合;查詢模塊,用于根據(jù)該解析模塊的分解結(jié)果,分別針對詞根及詞綴從該數(shù)據(jù)庫中查詢相關(guān)的單詞資料,獲取對應(yīng)的語音聲波資料;切音模塊,用于參照該解析模塊分解出的詞根及詞綴資料,以音節(jié)為單位將該查詢模塊所查詢出的單詞資料進(jìn)行對應(yīng)的切音,獲得該詞根及詞綴所對應(yīng)的語音資料;以及合成模塊,用于將經(jīng)過該切音模塊處理所得到的語音聲波資料進(jìn)行排列組合,與該詞根及詞綴所形成的組合形成一對一的對應(yīng)關(guān)系,合成出該單詞的語音資料。
2.如權(quán)利要求1所述的語音合成系統(tǒng),其特征在于,該系統(tǒng)適用于電子辭典。
3.如權(quán)利要求1所述的語音合成系統(tǒng),其特征在于,該解析模塊是根據(jù)單詞的構(gòu)詞規(guī)則,將單詞分解為由多個詞根及詞綴結(jié)合成的組合。
4.如權(quán)利要求3所述的語音合成系統(tǒng),其特征在于,該詞綴包括前綴及后綴。
5.如權(quán)利要求1所述的語音合成系統(tǒng),其特征在于,該查詢模塊是根據(jù)該詞根或詞綴內(nèi)容,從該數(shù)據(jù)庫中檢索出所有包括該詞根或詞綴內(nèi)容的單詞資料。
6.如權(quán)利要求1或5所述的語音合成系統(tǒng),其特征在于,該查詢模塊還包篩選單元,用于根據(jù)該解析模塊分解出的詞根及詞綴資料,以對比方式從該查詢模塊所查詢出的所有與該詞根或詞綴內(nèi)容相關(guān)的單詞資料中篩選出最佳的單詞資料,供該切音模塊進(jìn)行處理。
7.如權(quán)利要求6所述的語音合成系統(tǒng),其特征在于,若該數(shù)據(jù)庫中存在單詞資料與該詞根及詞綴資料完全一致,即為最佳的單詞資料。
8.如權(quán)利要求6所述的語音合成系統(tǒng),其特征在于,當(dāng)存在多個候選單詞資料時,以構(gòu)詞類型一致且差異與該詞根或詞綴最小者為最佳的單詞資料。
9.一種語音合成方法,適用于語音合成系統(tǒng)中,該方法包括(1)提供解析模塊,用于分析單詞的構(gòu)詞形式,并根據(jù)該分析結(jié)果進(jìn)行對應(yīng)的分解,將該單詞變形為由詞根及詞綴形成的組合;(2)提供查詢模塊,用于根據(jù)該解析模塊的分解結(jié)果,針對該各詞根及詞綴分別從該數(shù)據(jù)庫中查詢相關(guān)的單詞資料,獲取對應(yīng)的語音聲波資料;(3)提供切音模塊,用于參照該解析模塊所分解出的詞根及詞綴資料,以音節(jié)為單位將該查詢模塊所查詢出的單詞資料進(jìn)行切音,獲得該詞根及詞綴所對應(yīng)的語音資料;以及(4)提供合成模塊,用于將經(jīng)過該切音模塊處理所得到的語音聲波資料進(jìn)行排列組合,與該詞根及詞綴形成的組合形成一對一的對應(yīng)關(guān)系,合成出該單詞的語音資料。
10.如權(quán)利要求9所述的語音合成方法,其特征在于,該語音合成系統(tǒng)適用于電子辭典。
11.如權(quán)利要求9所述的語音合成方法,其特征在于,該方法各步驟生成的資料儲存在數(shù)據(jù)庫中。
12.如權(quán)利要求11所述的語音合成方法,其特征在于,該數(shù)據(jù)庫還用于儲存多筆單詞資料及其對應(yīng)的語音聲波資料。
13.如權(quán)利要求9所述的語音合成方法,其特征在于,在該步驟(1)中,該解析模塊是依據(jù)單詞的構(gòu)詞規(guī)則,將單詞分解為由詞根及至少一個詞綴結(jié)合而成的組合。
14.如權(quán)利要求9所述的語音合成方法,其特征在于,在該步驟(2)中,該查詢模塊根據(jù)該詞根或詞綴內(nèi)容,從該數(shù)據(jù)庫中檢索出所有至少包括該詞根及詞綴其中一個的單詞資料。
15.如權(quán)利要求14所述的語音合成方法,其特征在于,在該步驟(2)中,還包括提供篩選單元,根據(jù)該解析模塊所分解出的詞根及詞綴資料,通過對比從該查詢模塊所查詢出的所有與該詞根或詞綴內(nèi)容相關(guān)的單詞資料中篩選出最佳的單詞資料,供該切音模塊進(jìn)行處理。
16.如權(quán)利要求15所述的語音合成方法,其特征在于,在該步驟(2)中,當(dāng)篩選單元的對比結(jié)果是該數(shù)據(jù)庫中存在單詞資料與該詞根及詞綴資料完全一致時,則該筆單詞資料即為最佳的單詞資料。
17.如權(quán)利要求15所述的語音合成方法,其特征在于,在該步驟(2)中,當(dāng)存在多個候選單詞資料時,該篩選單元則以對比結(jié)果為構(gòu)詞類型一致且差異與該詞根或詞綴最小者為最佳的單詞資料。
全文摘要
一種語音合成系統(tǒng)以及方法對單詞進(jìn)行預(yù)分析處理,將該單詞分解為詞根與詞綴的組合形式,本發(fā)明的語音合成系統(tǒng)至少包括數(shù)據(jù)庫、解析模塊、查詢模塊、切音模塊以及合成模塊;本發(fā)明的語音合成系統(tǒng)及方法,可將單詞分解為若干詞根與詞綴的組成形式,并檢索出各詞根及詞綴所分別對應(yīng)的最佳語音聲波資料,借以自動合成該單詞的語音資料,并同時具有較佳的發(fā)音效果。
文檔編號G10L13/06GK1770261SQ20041008713
公開日2006年5月10日 申請日期2004年11月1日 優(yōu)先權(quán)日2004年11月1日
發(fā)明者邱全成, 馬飛 申請人:英業(yè)達(dá)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
无为县| 肥乡县| 昌图县| 奈曼旗| 阿图什市| 上饶县| 台南市| 营山县| 云和县| 体育| 浦江县| 离岛区| 莱州市| 鄂托克旗| 武宣县| 安龙县| 鸡泽县| 彝良县| 吴桥县| 虹口区| 雷州市| 清镇市| 体育| 宜黄县| 阳原县| 上高县| 平昌县| 弥勒县| 大兴区| 乌苏市| 皮山县| 琼中| 青龙| 黄大仙区| 泗水县| 江陵县| 丰城市| 英德市| 永新县| 双城市| 承德市|