两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于聲學(xué)特性的語音頻率選擇方法

文檔序號(hào):2818953閱讀:733來源:國知局
專利名稱:一種基于聲學(xué)特性的語音頻率選擇方法
技術(shù)領(lǐng)域
本發(fā)明涉及文本相關(guān)說話人識(shí)別中位于前端的特征提取技術(shù)。
背景技術(shù)
文本相關(guān)的說話人識(shí)別強(qiáng)調(diào)訓(xùn)練語音與對(duì)應(yīng)的正確測試語音文本內(nèi)容一致,并且當(dāng)測試者與注冊(cè)者不是同一人時(shí)拒絕測試者的登錄。該方法通常被用于進(jìn)行個(gè)人身份識(shí)另IJ,在安保要求高的公安司法、銀行、機(jī)場等領(lǐng)域有著廣泛的應(yīng)用前景。文本相關(guān)的說話人識(shí)別使用的特征參數(shù)均為經(jīng)典的聲學(xué)特征,其中既包含了語音內(nèi)容信息,也包含了人的個(gè)性特點(diǎn)。語音內(nèi)容極大地影響了聲學(xué)特征的空間分布,一定程度上會(huì)掩蓋人的個(gè)性特點(diǎn)。當(dāng)語音內(nèi)容被盜聽后,冒認(rèn)者的模仿會(huì)對(duì)說話人識(shí)別造成障礙,因?yàn)橄嗤恼Z音內(nèi)容會(huì)影響判斷的準(zhǔn)確度。我們希望得到的是更多人的個(gè)性信息。
語言是由不同的音素組成的,這些音素通過相互連接組合,傳遞出人們想要表達(dá)的信息。音素產(chǎn)生的源頭是人類的發(fā)音器官,器官本身的特點(diǎn)以及發(fā)音方式主宰了人聲的特點(diǎn)和內(nèi)容,這些特點(diǎn)最終會(huì)表現(xiàn)在輸出的聲音上。聲道是人發(fā)音器官的主要組成部分之一,共振峰則是聲道的一個(gè)重要的聲學(xué)特性。共振峰表現(xiàn)在語譜圖上是能量相對(duì)集中的部分,也就是像點(diǎn)密集(高亮)的區(qū)域。人類的聲道雖然復(fù)雜,但實(shí)質(zhì)上還是一個(gè)共振腔,共振峰是因?yàn)楣舱褡饔玫玫侥芰繌?qiáng)化的諧振點(diǎn)。聲門脈沖的諧波與共振峰頻率相互作用,影響著語音的音質(zhì)。共振峰的頻率與元音之間存在特定的一一對(duì)應(yīng)關(guān)系。這些共振峰以Fp F2為主,集中在低頻部分。不管是什么人,他們發(fā)特定元音的共振峰頻率是基本相同的(變化范圍相對(duì)固定),僅在性別上會(huì)有頻率差別(女性的發(fā)音頻率比男性高)。換句話說,元音的共振峰位置是基本不變的,不因?yàn)檎f話人的不同而發(fā)生劇烈改動(dòng)。傳統(tǒng)的特征提取并不針對(duì)特定頻率做出選擇,模糊了語音內(nèi)容與人的個(gè)性特征之間的區(qū)分性,給文本相關(guān)的說話人識(shí)別帶來了一定的負(fù)面影響。

發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種新的語音頻率選擇方法,應(yīng)用在前端聲學(xué)特征提取層面,解決語音內(nèi)容掩蓋人的個(gè)性特征的問題,提高文本相關(guān)說話人識(shí)別系統(tǒng)在注冊(cè)語音內(nèi)容泄露時(shí)的可靠性。本發(fā)明實(shí)現(xiàn)快速,方法簡便,可以用于多種涉及頻域的聲學(xué)特征提取過程,實(shí)際應(yīng)用中便于移植,可以大大提高個(gè)人身份識(shí)別的可靠性。一種基于聲學(xué)特性的語音頻率選擇方法的設(shè)計(jì)方法,其特征在于所述方法,包括如下步驟I)首先按照傳統(tǒng)的涉及頻域的聲學(xué)特征提取方法對(duì)語音進(jìn)行前期處理,以便進(jìn)行后續(xù)分析。2)當(dāng)涉及頻域的聲學(xué)特征處理方法將時(shí)域信號(hào)轉(zhuǎn)變?yōu)轭l域信號(hào)后,對(duì)頻率進(jìn)行截取,保留更多人的個(gè)性特點(diǎn)部分,拋棄人與人之間沒有特別區(qū)分性的元音所在頻率部分。
3)對(duì)頻率截取后的頻域信號(hào)繼續(xù)按傳統(tǒng)涉及頻域的特征提取方法提取聲學(xué)特征。本發(fā)明設(shè)計(jì)了一種基于聲學(xué)特性的語音頻率選擇方法。對(duì)于所有涉及頻域的聲學(xué)特征提取算法均適用,操作簡單快速,在突出人的個(gè)性特點(diǎn)的同時(shí)也保留了一定的文本內(nèi)容信息,有助于提高文本相關(guān)說話人識(shí)別的可靠性,而不至于因?yàn)檎Z音內(nèi)容泄露而影響安全。
具體實(shí)施例方式
I.全部使用程序語言,首先實(shí)現(xiàn)傳統(tǒng)的涉及頻域的聲學(xué)特征提取,提取過程進(jìn)行到頻域變換為止,此時(shí)時(shí)域語音信號(hào)被變換到頻域輸出。2.然后加入本發(fā)明的基于聲學(xué)特性的語音頻率選擇方法,截取出更能代表人的個(gè)性信息的頻率部分,拋棄人與人之間沒有特別區(qū)分性的元音所在頻率部分,此時(shí)頻域語音信號(hào)僅保留部分子頻帶信息。一般截取出的頻率區(qū)間在I. 5kHz 6. 5kHz之間。 3.最后用截取過的頻域語音信號(hào)繼續(xù)進(jìn)行傳統(tǒng)的涉及頻域的聲學(xué)特征提取。
權(quán)利要求
1.當(dāng)涉及頻域的聲學(xué)特征處理方法將時(shí)域信號(hào)轉(zhuǎn)變?yōu)轭l域信號(hào)后,對(duì)頻率進(jìn)行截取,僅保留部分子頻帶,從而保留更多人的個(gè)性特點(diǎn)部分,拋棄人與人之間沒有特別區(qū)分性的元音所在頻率部分。
全文摘要
聲學(xué)特征提取是文本相關(guān)說話人識(shí)別中的重要環(huán)節(jié),為了兼顧文本相關(guān)說話人識(shí)別系統(tǒng)在注冊(cè)語音內(nèi)容泄露時(shí)的可靠性,可以引入本發(fā)明的基于聲學(xué)特性的頻率選擇方法。該方法很好地解決了語音內(nèi)容掩蓋人的個(gè)性特征的問題,實(shí)現(xiàn)快速,方法簡便,便于移植,可以用于多種涉及頻域的聲學(xué)特征提取過程。
文檔編號(hào)G10L15/02GK102682764SQ20111006376
公開日2012年9月19日 申請(qǐng)日期2011年3月17日 優(yōu)先權(quán)日2011年3月17日
發(fā)明者章釗 申請(qǐng)人:章釗
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
西乌珠穆沁旗| 原阳县| 鱼台县| 弋阳县| 扶余县| 肇州县| 屯门区| 兴安县| 安国市| 日土县| 泰顺县| 宁化县| 黑山县| 百色市| 城市| 农安县| 明溪县| 香港 | 肃南| 阿坝| 永泰县| 封开县| 浦东新区| 黎川县| 宜章县| 天水市| 旬阳县| 海伦市| 沁水县| 肥东县| 定襄县| 集安市| 泾阳县| 盈江县| 庄河市| 德格县| 奉贤区| 花垣县| 繁峙县| 北海市| 韶关市|