專利名稱:中英字典的中文詞組的沒有間隔發(fā)音方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種中文詞組的沒有間隔發(fā)音方法。
一般在中英字典的中文詞組發(fā)音處理的方法中,皆有一些現(xiàn)有技術(shù),如在″金山詞霸″等即時翻譯軟件中,亦有相關(guān)的處理技術(shù)。
在一般的現(xiàn)有技術(shù)中,可能的做法大體分為兩種1.先將所有基本字的聲音錄制下來,形成一個聲音數(shù)據(jù)庫,當(dāng)需要針對各詞組發(fā)音時,再分別播放詞組中每個字的單獨(dú)讀音;2.錄制所有的基本音在一個文件中,當(dāng)詞組讀音時,在聲音文件中搜尋(Seek)到相應(yīng)單字讀音播。
這些處理普遍存在的問題是詞組的讀音完全是建立在單字讀音基礎(chǔ)上,因此每個字讀音間會有很長的停頓(大約1-2秒),聽起來很不自然,不符合人們的語言習(xí)慣。
鑒于上述發(fā)明背景中傳統(tǒng)方法的諸多缺點(diǎn),本發(fā)明提供一聲音組合方法,藉以形成一中文詞組的沒有間隔發(fā)音的方法。
本發(fā)明的另一目的在所提供的聲音組合方法,可以有效地去除詞組、成語或短語中各個單字間讀音的停頓,使得中文詞組、成語或短語的發(fā)音流暢自然。
根據(jù)以上所述的目的,本發(fā)明提供了一種中英字典的中文詞組發(fā)音處理方法,其主要目的在于能夠利用聲音文件的方法,去除中文詞組、成語以及短語中各個單字讀音的間隔,使整個中文詞組、成語以及短語的讀音更加自然、順暢,符合中文的發(fā)音規(guī)則,更易于被用戶接受。
在開始的步驟后,首先選取需要進(jìn)行發(fā)音處理的中文詞組、成語或短語,即選取需要發(fā)音處理的中文詞組的步驟。拆分待處理的中文詞組的步驟中,將這個待處理的中文詞組、成語或短語拆分成逐個單字。
接著,以檢索聲音庫的步驟來檢索聲音文件庫。藉獲取詞組中用到的每個單字的聲音文件的步驟,以獲取待處理中文詞組、成語或短語中每個單字的聲音文件。
進(jìn)行判斷上述獲取詞組中用到的每個單字的聲音文件的步驟,藉以判斷操作是否成功。如果操作成功,則以暫存于存儲器中的步驟,將每個單字的讀音暫存于存儲器中。
故以讀取聲音文件中的聲音格式和數(shù)據(jù)的步驟,將聲音文件按照其文件格式讀取成聲音格式部分,(包括聲音文件的一些特征信息,如文件大小等),和數(shù)據(jù)部分(在數(shù)據(jù)部分中存放的才是具體的聲音信號)。
如果單字的聲音格式一致,則將詞組中所有單字的聲音文件的數(shù)據(jù)部分,組合成一組數(shù)據(jù),正如進(jìn)行將詞組中所有單字的聲音文件的數(shù)據(jù)部分拼裝成一組數(shù)據(jù)的步驟。
如果單字的聲音格式不一致,則先進(jìn)行統(tǒng)一聲音格式的步驟,藉以統(tǒng)一聲音格式,然后再將其組合起來。最后,進(jìn)行播放詞組的步驟,按照這個重新組合好的聲音文件,即可得到中文詞組、成語或短語的沒有間隔的讀音。
為讓本發(fā)明的上述說明與其他目的、特征和優(yōu)點(diǎn)更能明顯易懂,下文特列出較佳實施例并配合附圖,作詳細(xì)說明。
附圖的簡單說明
圖1為本發(fā)明的實施例圖;圖2為本發(fā)明選取的聲音文件格式圖;圖3為本發(fā)明所形成的聲音文件格式圖;圖4為本發(fā)明的實施例流程圖;及圖5為本發(fā)明的具體實施例圖。
以下是本發(fā)明的描述。本發(fā)明的描述會先配合以一示范結(jié)構(gòu)作參考。一些變動和本發(fā)明的優(yōu)點(diǎn)會在之后描述。其他的較佳方法會于隨后討論。
再者,雖然本發(fā)明以數(shù)個實施例來教導(dǎo),但這些描述不會限制本發(fā)明的范圍或應(yīng)用。而且,雖然這些例子使用,應(yīng)該明了的是主要的部分可能以相關(guān)的部分取代。因此,本發(fā)明的方法不會限制應(yīng)用的說明。這些方法包括證明本發(fā)明和呈現(xiàn)的較佳實施例的實用性和應(yīng)用性。且即使本發(fā)藉由舉例的方式以及舉出一個較佳實施例來描述,但是本發(fā)明并不限定于所舉出的實施例。此外,凡其它未脫離本發(fā)明所揭示的精神下所完成的等效改變或修飾,均包含在本發(fā)明的權(quán)利要求內(nèi)。應(yīng)以最廣的定義來解釋本發(fā)明的范圍,藉以包含所有這些修飾與類似結(jié)構(gòu)。
如圖1所示,為本發(fā)明的功能模塊圖分別是檢索模塊101,分析模塊102,組合模塊103與聲音播放模塊104。
圖1中所示的檢索模塊101,是預(yù)先組織、形成好中文單字聲音的文件庫。在調(diào)用檢索模塊101時,將需要處理的中文詞組、成語或短語中的每個單字的聲音文件找出來。
然后,利用圖1中所示的分析模塊102。分析模塊102是作為分析每個單字的聲音文件,再讀取聲音文件分為格式部分和聲音數(shù)據(jù)部分,聲音文件的文件格式示意如圖2的20所示。
圖2是聲音數(shù)據(jù)部分的文件格式20,依次形成第一個單字的聲音數(shù)據(jù),再形成第二個單字的聲音數(shù)據(jù),與再形成第三個單字的聲音數(shù)據(jù),依次類推至任何一個單字的聲音數(shù)據(jù)。
再如圖1中所示的,調(diào)用組合模塊103。將中文詞組、成語或短語中的每個單字的聲音文件中的聲音數(shù)據(jù)組合在一起,而每個單字聲音文件中的格式是一樣的,所以在組合文件中,只需形成為一個文件格式即可,組合后的聲音文件格式,經(jīng)示意如圖3的30所示。
又如圖1中所示的,組合后的聲音文件30經(jīng)播放模塊104播放出來,其聲音效果可與中文詞組、成語或短語的正常發(fā)音特點(diǎn)一致。
如圖4所示,為本發(fā)明較佳實施例的具體流程。在開始200的步驟后,首先選取需要進(jìn)行發(fā)音處理的中文詞組、成語或短語,即選取需要發(fā)音處理的中文詞組201的步驟。
仍如圖4所示,拆分待處理的中文詞組202的步驟中,將這個待處理的中文詞組、成語或短語拆分成逐個單字。
接著,如圖4所示,以檢索聲音庫203的步驟來檢索聲音文件庫。
仍如圖4所示,藉獲取詞組中用到的每個單字的聲音文件204的步驟,以獲取待處理中文詞組、成語或短語中每個單字的聲音文件。
如圖4所示,進(jìn)行判斷上述獲取詞組中用到的每個單字的聲音文件204的步驟,藉以判斷操作是否成功205。
如圖4所示,如果操作成功,則以暫存于存儲器中206的步驟,將每個單字的讀音暫存于存儲器中。
如圖4所示,由于每個單字的聲音文件的尺寸都非常小,大約只有20KB左右,因此在讀數(shù)據(jù)時也僅需耗費(fèi)幾納秒的時間,故此時的操作不會占用內(nèi)存,也不會影響聲音文件的播放速度。故以讀取聲音文件中的聲音格式和數(shù)據(jù)207的步驟,將聲音文件按照其文件格式讀取成聲音格式部分,(包括聲音文件的一些特征信息,如文件大小等),和數(shù)據(jù)部分(在數(shù)據(jù)部分中存放的才是具體的聲音信號)。
如圖4所示,以所有單字的聲音格式一樣嗎208的步驟,判斷詞組中所有單字的聲音格式是否一致。
如圖4所示,如果單字的聲音格式一致,則將詞組中所有單字的聲音文件的數(shù)據(jù)部分,組合成一組數(shù)據(jù),正如進(jìn)行將詞組中所有單字的聲音文件的數(shù)據(jù)部分組合成一組數(shù)據(jù)209的步驟。
如圖4所示,如果單字的聲音格式不一致,則先進(jìn)行統(tǒng)一聲音格式210的步驟,藉以統(tǒng)一聲音格式,然后再將其合成起來,如步驟209。
如圖4所示,進(jìn)行播放詞組211的步驟,按照這個重新合成好的聲音文件,即可得到中文詞組、成語或短語的沒有間隔的讀音。
如圖4所示,而如果獲取詞組中所用到的每個單字不成功,則須到重試(Retry)212的步驟,以進(jìn)行重試。并進(jìn)行至是否成功213的步驟,藉以判斷是否成功。
圖4所示,如果重試后成功,則轉(zhuǎn)回到步驟206,將每個單字的讀音暫存于內(nèi)存中。如果仍然不成功,則進(jìn)行失敗返回214的步驟,藉以提示操作失敗而返回。
為了具體說明本發(fā)明的技術(shù)內(nèi)容,下面特舉一具體實施例如下,如圖5所示,并附上新舊技術(shù)所產(chǎn)生的聲音對比效果在現(xiàn)有技術(shù)中,對中文詞組的″唐詩″兩字進(jìn)行讀音處理。如果按照已有技術(shù)的方法,先從聲音文件庫中找到單字″唐″的讀音,然后再找到單字″詩″的讀音,再按照詞組中的順序,依次播放兩個單字的聲音文件,此時聽起來會是″唐∪詩″,中間會有停頓。
但是按照本發(fā)明實施例的方法,如圖5所示,在聲音庫中檢索到兩個單字的聲音文件后,先自動統(tǒng)一聲音文件的格式,然后將″唐″字的聲音文件的數(shù)據(jù)部分50與″詩″字的聲音文件的數(shù)據(jù)部分51,拼裝在一起,合成好的聲音文件的數(shù)據(jù)長度為兩個單字聲音數(shù)據(jù)的總和,合成后的文件,示意如圖5的標(biāo)記52所示,兩個單字的聲音文件可制作成一個聲音格式,此時再播放這個合成好的聲音文件,就會得到″唐詩″的讀音效果。
簡言之,本發(fā)明在開始的步驟后,首先選取需要進(jìn)行發(fā)音處理的中文詞組、成語或短語,即選取需要發(fā)音處理的中文詞組的步驟。
拆分待處理的中文詞組的步驟中,將這個待處理的中文詞組、成語或短語拆分成逐個單字。接著,以檢索聲音庫的步驟來檢索聲音文件庫。
藉獲取詞組中用到的每個單字的聲音文件的步驟,以獲取待處理中文詞組、成語或短語中每個單字的聲音文件。進(jìn)行判斷上述獲取詞組中用到的每個單字的聲音文件的步驟,藉以判斷操作是否成功。
如果操作成功,則以暫存于存儲器中的步驟,將每個單字的讀音暫存于存儲器中。故以讀取聲音文件中的聲音格式和數(shù)據(jù)的步驟,將聲音文件按照其文件格式讀取成聲音格式部分,(包括聲音文件的一些特征信息,如文件大小等),和數(shù)據(jù)部分(在數(shù)據(jù)部分中存放的才是具體的聲音信號)。
以所有單字的聲音格式一樣嗎的步驟,判斷詞組中所有單字的聲音格式是否一致。如果單字的聲音格式一致,進(jìn)行將詞組中所有單字的聲音文件的數(shù)據(jù)部分組合成一組數(shù)據(jù)的步驟。如果單字的聲音格式不一致,則先進(jìn)行統(tǒng)一聲音格式的步驟,藉以統(tǒng)一聲音格式,然后再將其組合起來。
進(jìn)行播放詞組的步驟,按照這個重新組合好的聲音文件,即可得到中文詞組、成語或短語的沒有間隔的讀音。而如果獲取詞組中所用到的每個單字不成功,則須到重試(Retry)的步驟,以進(jìn)行重試。并進(jìn)行至是否成功的步驟,藉以判斷是否成功。
如果重試后成功,則轉(zhuǎn)回到將每個單字的讀音暫存于存儲器中。如果仍然不成功,則進(jìn)行失敗返回的步驟,藉以提示操作失敗而返回。
以上所述僅為本發(fā)明的較佳實施例而已,并非用以限定本發(fā)明的權(quán)利要求;凡其它未脫離本發(fā)明所揭示的精神下所完成的等效改變或修飾,均應(yīng)包含在所附權(quán)利要求內(nèi)。
權(quán)利要求
1.一種中文詞組的沒有間隔發(fā)音系統(tǒng),至少包含檢索模塊,自一聲音文件庫檢索一中文詞組的多個組成單字的各別的第一聲音文件;分析模塊,分析多個單字的該第一聲音文件,以讀取該第一聲音文件的一聲音格式和一聲音數(shù)據(jù);組合模塊,組合各個該第一聲音文件中的聲音數(shù)據(jù)以成一第二聲音文件,且統(tǒng)一該第一聲音文件中的該聲音格式;播放模塊,播放該第二聲音文件,其聲音效果可使中文詞組沒有間隔發(fā)音。
2.如權(quán)利要求1所述的系統(tǒng),其中上述中文詞組還包含成語或短語。
3.一種中文詞組的沒有間隔發(fā)音方法,至少包含選取一中文詞組;分析該中文詞的多個組成單字;獲得該多個單字各別的第一聲音文件;讀取該第一聲音文件的一第一聲音格式和一第一聲音數(shù)據(jù);合成各個該第一聲音數(shù)據(jù)成一第二聲音數(shù)據(jù)。
4.如權(quán)利要求3所述的方法,其中上述中文詞組還包含成語或短語。
5.一種中文詞組的沒有間隔發(fā)音方法,至少包含選取一中文詞組;分析該中文詞的多個組成單字;檢索一聲音文件庫;獲得該多個單字各別的第一聲音文件;儲存該第一聲音文件于一存儲器中;讀取該第一聲音文件的一第一聲音格式和一第一聲音數(shù)據(jù);統(tǒng)一該第一聲音格式;合成各個該第一聲音數(shù)據(jù)成一第二聲音數(shù)據(jù);播放該第二聲音數(shù)據(jù),即可得到該中文詞組的沒有間隔的讀音。
6.如權(quán)利要求5所述的方法,其中上述中文詞組還包含成語或短語。
全文摘要
本發(fā)明為中文詞組的沒有間隔發(fā)音方法。包含了檢索模塊,檢索一中文詞組的多個組成單字的各別聲音文件庫的第一聲音文件。分析模塊,分析多個單字的第一聲音文件,再讀取第一聲音文件分為一聲音格式和一聲音數(shù)據(jù)。組合模塊,組合各個第一聲音文件中的聲音數(shù)據(jù)以成一第二聲音文件。播放模塊,播放第二聲音文件,其聲音效果可使中文詞組沒有間隔發(fā)音。
文檔編號G06F17/30GK1367447SQ01101579
公開日2002年9月4日 申請日期2001年1月22日 優(yōu)先權(quán)日2001年1月22日
發(fā)明者夏強(qiáng), 宋建福, 林光信 申請人:英業(yè)達(dá)股份有限公司