两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語(yǔ)音識(shí)別裝置及方法與流程

文檔序號(hào):12368730閱讀:239來(lái)源:國(guó)知局
語(yǔ)音識(shí)別裝置及方法與流程
本發(fā)明涉及一種語(yǔ)音識(shí)別裝置及方法。
背景技術(shù)
:在現(xiàn)有的識(shí)別語(yǔ)音發(fā)音人的技術(shù)中,通常會(huì)建立一個(gè)用于存儲(chǔ)發(fā)音人模板語(yǔ)音及對(duì)應(yīng)語(yǔ)音特征值的數(shù)據(jù)庫(kù),從而通過(guò)對(duì)比發(fā)音人語(yǔ)音的特征值與模板語(yǔ)音的特征值識(shí)別出發(fā)音人的身份。每當(dāng)用戶輸入一段新的模板語(yǔ)音時(shí),一般需要在該數(shù)據(jù)庫(kù)中進(jìn)行語(yǔ)音訓(xùn)練,而將該段語(yǔ)音及語(yǔ)音特征值存儲(chǔ)于數(shù)據(jù)庫(kù)中。然而當(dāng)數(shù)據(jù)庫(kù)中的語(yǔ)音數(shù)據(jù)量比較大時(shí),執(zhí)行一次語(yǔ)音訓(xùn)練需要花費(fèi)大量時(shí)間。技術(shù)實(shí)現(xiàn)要素:有鑒于此,有必要提供一種語(yǔ)音識(shí)別裝置及方法,以解決上述的技術(shù)問(wèn)題。本發(fā)明提供一種語(yǔ)音識(shí)別裝置,該裝置包括一存儲(chǔ)單元及一處理單元,該存儲(chǔ)單元存儲(chǔ)有一第一數(shù)據(jù)庫(kù)及一第二數(shù)據(jù)庫(kù),該第一數(shù)據(jù)庫(kù)用于存儲(chǔ)預(yù)設(shè)數(shù)量段的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值,該第二數(shù)據(jù)庫(kù)用于存儲(chǔ)該第一數(shù)據(jù)庫(kù)未存儲(chǔ)的歷史語(yǔ)音數(shù)據(jù),該處理單元包括:第一訓(xùn)練模塊,用于當(dāng)?shù)谝粩?shù)據(jù)庫(kù)中新存儲(chǔ)有一段語(yǔ)音時(shí),對(duì)該段新存儲(chǔ)的語(yǔ)音在內(nèi)的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練;轉(zhuǎn)移模塊,用于在所有語(yǔ)音完成語(yǔ)音訓(xùn)練時(shí),將第一數(shù)據(jù)庫(kù)中最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù);及第二訓(xùn)練模塊,用于在該最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)時(shí),對(duì)第二數(shù)據(jù)庫(kù)中的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。本發(fā)明還提供一種語(yǔ)音識(shí)別方法,該方法應(yīng)用于一語(yǔ)音識(shí)別裝置中,該裝置包括一存儲(chǔ)單元,該存儲(chǔ)單元存儲(chǔ)有一第一數(shù)據(jù)庫(kù)及一第二數(shù)據(jù)庫(kù),該第一數(shù)據(jù)庫(kù)用于存儲(chǔ)預(yù)設(shè)數(shù)量段的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值,該第二數(shù)據(jù)庫(kù)用于存儲(chǔ)該第一數(shù)據(jù)庫(kù)未存儲(chǔ)的歷史語(yǔ)音數(shù)據(jù),該方法包括以下步驟:當(dāng)?shù)谝粩?shù)據(jù)庫(kù)中新存儲(chǔ)有一段語(yǔ)音時(shí),對(duì)該段新存儲(chǔ)的語(yǔ)音在內(nèi)的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練;在所有語(yǔ)音完成語(yǔ)音訓(xùn)練時(shí),將第一數(shù)據(jù)庫(kù)中最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù);及在該最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)時(shí),對(duì)第二數(shù)據(jù)庫(kù)中的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。相較于現(xiàn)有技術(shù),本發(fā)明的語(yǔ)音識(shí)別裝置及方法設(shè)置有第一數(shù)據(jù)庫(kù)及第二數(shù)據(jù)庫(kù),第一數(shù)據(jù)庫(kù)用于較少的語(yǔ)音數(shù)據(jù),第二數(shù)據(jù)庫(kù)用于存儲(chǔ)所有歷史語(yǔ)音數(shù)據(jù),用戶輸入的待訓(xùn)練語(yǔ)音在數(shù)據(jù)量較少的第一數(shù)據(jù)庫(kù)中進(jìn)行訓(xùn)練,從而可以減少語(yǔ)音訓(xùn)練所花費(fèi)的時(shí)間。附圖說(shuō)明圖1為本發(fā)明語(yǔ)音識(shí)別裝置較佳實(shí)施方式的應(yīng)用結(jié)構(gòu)圖。圖2為圖1所示語(yǔ)音識(shí)別裝置中的模塊的子模塊圖。圖3為本發(fā)明語(yǔ)音識(shí)別裝置提供的語(yǔ)音訓(xùn)練界面的示意圖。圖4為本發(fā)明語(yǔ)音識(shí)別裝置提供的語(yǔ)音識(shí)別界面的示意圖。圖5為本發(fā)明語(yǔ)音識(shí)別方法較佳實(shí)施方式中語(yǔ)音訓(xùn)練的流程圖。圖6為本發(fā)明語(yǔ)音識(shí)別方法較佳實(shí)施方式中語(yǔ)音識(shí)別的流程圖。主要元件符號(hào)說(shuō)明語(yǔ)音識(shí)別裝置1存儲(chǔ)單元10第一數(shù)據(jù)庫(kù)101第二數(shù)據(jù)庫(kù)102處理單元20界面提供模塊21第一訓(xùn)練模塊22轉(zhuǎn)移模塊23第二訓(xùn)練模塊24群組劃分模塊25第一識(shí)別模塊26第二識(shí)別模塊27特征值提取模塊201相似值獲取模塊202比對(duì)模塊203刪除模塊204輸出模塊205命名模塊206更新模塊207顯示單元30語(yǔ)音輸入單元40語(yǔ)音訓(xùn)練界面50“開(kāi)始訓(xùn)練”選項(xiàng)51語(yǔ)音識(shí)別界面60“開(kāi)始識(shí)別”選項(xiàng)61如下具體實(shí)施方式將結(jié)合上述附圖進(jìn)一步說(shuō)明本發(fā)明。具體實(shí)施方式請(qǐng)參考圖1,為本發(fā)明語(yǔ)音識(shí)別裝置1較佳實(shí)施方式的應(yīng)用結(jié)構(gòu)圖。該語(yǔ)音識(shí)別裝置1用于執(zhí)行語(yǔ)音訓(xùn)練及語(yǔ)音識(shí)別,其中,語(yǔ)音識(shí)別為對(duì)語(yǔ)音的發(fā)音人的身份進(jìn)行識(shí)別。在本實(shí)施方式中,該語(yǔ)音識(shí)別裝置1可為個(gè)人電腦、智能手機(jī)、機(jī)器人或云端服務(wù)器等具有語(yǔ)音輸入及語(yǔ)音處理功能的電子裝置,該語(yǔ)音識(shí)別裝置1可以在裝置內(nèi)部對(duì)輸入的語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練或語(yǔ)音識(shí)別。在一實(shí)施方式中,該語(yǔ)音識(shí)別裝置1也可以通過(guò)互聯(lián)網(wǎng)或局域網(wǎng)的方式連接至云端服務(wù)器,在云端服務(wù)器內(nèi)進(jìn)行語(yǔ)音訓(xùn)練或語(yǔ)音識(shí)別。在另一實(shí)施方式中,該語(yǔ)音識(shí)別裝置1也可以通過(guò)互聯(lián)網(wǎng)或局域網(wǎng)的方式連接至云端服務(wù)器,在云端服務(wù)器內(nèi)進(jìn)行語(yǔ)音訓(xùn)練,然后將訓(xùn)練的結(jié)果回傳至該語(yǔ)音識(shí)別裝置1,使得該語(yǔ)音識(shí)別裝置1在裝置內(nèi)部進(jìn)行語(yǔ)音識(shí)別。該語(yǔ)音識(shí)別裝置1包括一存儲(chǔ)單元10、一處理單元20、一顯示單元30及一語(yǔ)音輸入單元40。該存儲(chǔ)單元10存儲(chǔ)有一第一數(shù)據(jù)庫(kù)101及一第二數(shù)據(jù)庫(kù)102,該第一數(shù)據(jù)庫(kù)101用于存儲(chǔ)預(yù)設(shè)數(shù)量段的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值,該第二數(shù)據(jù)庫(kù)102用于存儲(chǔ)該第一數(shù)據(jù)庫(kù)101未存儲(chǔ)的歷史語(yǔ)音數(shù)據(jù),其中,該歷史語(yǔ)音數(shù)據(jù)包括多段語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值。在本實(shí)施方式中,該第一數(shù)據(jù)庫(kù)101存儲(chǔ)的語(yǔ)音的數(shù)量可為默認(rèn)數(shù)值,例如30段,也可由用戶設(shè)置為其他數(shù)值。其中,每一段語(yǔ)音可為一單獨(dú)的語(yǔ)音文件或一單獨(dú)的數(shù)據(jù)包。該顯示單元30用于顯示該語(yǔ)音識(shí)別裝置1執(zhí)行語(yǔ)音訓(xùn)練或語(yǔ)音識(shí)別的結(jié)果。該語(yǔ)音輸入單元40用于接收用戶輸入的語(yǔ)音。請(qǐng)一并參考圖2,該處理單元20包括界面提供模塊21、第一訓(xùn)練模塊22、轉(zhuǎn)移模塊23、第二訓(xùn)練模塊24、群組劃分模塊25、第一識(shí)別模塊26及第二識(shí)別模塊27,該處理單元20還包括特征值提取模塊201、相似值獲取模塊202、比對(duì)模塊203、刪除模塊204、輸出模塊205、命名模塊206及更新模塊207。其中,該些模塊201-207為可被模塊22-27調(diào)用的子模塊。在本實(shí)施方式中,該些模塊為可被該處理單元20調(diào)用執(zhí)行的程序化的軟件指令。在其他實(shí)施方式中,該些模塊也可為固化于該處理單元20中的程序指令或固件(Firmware)。請(qǐng)參考圖3,該界面提供模塊21用于響應(yīng)用戶的語(yǔ)音訓(xùn)練請(qǐng)求操作而提供一語(yǔ)音訓(xùn)練界面50,供用戶登錄后進(jìn)行語(yǔ)音訓(xùn)練。其中,用戶可通過(guò)用戶名和密碼登錄該語(yǔ)音訓(xùn)練界面50,在其他實(shí)施方式中,用戶也可通過(guò)臉部識(shí)別或指紋識(shí)別等方式進(jìn)行登錄。在本實(shí)施方式中,該語(yǔ)音訓(xùn)練界面50顯示有一“開(kāi)始訓(xùn)練”選項(xiàng)51,用戶可通過(guò)點(diǎn)擊該選項(xiàng)開(kāi)始語(yǔ)音訓(xùn)練。在其他實(shí)施方式中,該語(yǔ)音識(shí)別裝置1包括重力感應(yīng)器(圖中未示)及接近感應(yīng)器(圖中未示),在用戶登錄該語(yǔ)音訓(xùn)練界面50后,通過(guò)感應(yīng)器產(chǎn)生的感應(yīng)信號(hào)確定當(dāng)該語(yǔ)音識(shí)別裝置1靠近用戶的嘴時(shí),而自動(dòng)開(kāi)始語(yǔ)音訓(xùn)練。另外,用戶也可通過(guò)該語(yǔ)音輸入單元40輸入“開(kāi)始訓(xùn)練”的語(yǔ)音而開(kāi)始語(yǔ)音訓(xùn)練。該第一訓(xùn)練模塊22用于當(dāng)?shù)谝粩?shù)據(jù)庫(kù)101中新存儲(chǔ)有一段語(yǔ)音時(shí),對(duì)該段新存儲(chǔ)的語(yǔ)音在內(nèi)的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。具體的,該第一訓(xùn)練模塊22通過(guò)調(diào)用模塊201-207而對(duì)所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。該特征值提取模塊201用于獲取登錄用戶輸入的一段語(yǔ)音,將該獲取的語(yǔ)音暫存于第一數(shù)據(jù)庫(kù)101中,并提取該段新輸入的語(yǔ)音的特征值。其中,該段新輸入的語(yǔ)音可為用戶提前錄制的語(yǔ)音,也可為通過(guò)該語(yǔ)音輸入單元40臨時(shí)輸入的語(yǔ)音。在本實(shí)施方式中,用戶輸入的語(yǔ)音的時(shí)長(zhǎng)需超過(guò)一預(yù)設(shè)時(shí)長(zhǎng),其中,該預(yù)設(shè)時(shí)長(zhǎng)為一默認(rèn)值,例如15秒。關(guān)于語(yǔ)音特征值的提取方法為語(yǔ)音識(shí)別領(lǐng)域中常見(jiàn)的技術(shù),在此不作詳細(xì)描述。該相似值獲取模塊202用于將該段新輸入的語(yǔ)音的特征值分別與第一數(shù)據(jù)庫(kù)101中各用戶的語(yǔ)音特征平均值進(jìn)行比對(duì),而得到多個(gè)語(yǔ)音相似值,并從該多個(gè)語(yǔ)音相似值中選取一最高語(yǔ)音相似值。在本實(shí)施方式中,語(yǔ)音相似值的默認(rèn)區(qū)間為[-1,1],當(dāng)語(yǔ)音相似值越接近1,則說(shuō)明兩段語(yǔ)音的相似度越高,當(dāng)語(yǔ)音相似值越接近-1,則說(shuō)明兩段語(yǔ)音的相似度越低。該比對(duì)模塊203用于將該最高語(yǔ)音相似值與一預(yù)設(shè)的高臨界值進(jìn)行比對(duì)。在本實(shí)施方式中,該預(yù)設(shè)的高臨界值為用于確定新輸入的一段語(yǔ)音是否需要進(jìn)行訓(xùn)練的臨界相似值,由用戶設(shè)定或系統(tǒng)默認(rèn)。該刪除模塊204用于當(dāng)該最高語(yǔ)音相似值大于該預(yù)設(shè)的高臨界值時(shí),刪除該段新輸入的語(yǔ)音。具體的,當(dāng)最高語(yǔ)音相似值大于該預(yù)設(shè)的高臨界值時(shí),說(shuō)明在第一數(shù)據(jù)庫(kù)101中存儲(chǔ)有與該段新輸入的語(yǔ)音相似度很高的語(yǔ)音,對(duì)該段新輸入的語(yǔ)音進(jìn)行訓(xùn)練不能明顯更新該用戶的語(yǔ)音特征,故將該段語(yǔ)音刪除。該輸出模塊205用于輸出一該段語(yǔ)音被刪除的信息于該顯示單元30。該命名模塊206用于當(dāng)該最高語(yǔ)音相似值小于或等于該預(yù)設(shè)的高臨界值時(shí),命名該段新輸入的語(yǔ)音,并將該段命名后的語(yǔ)音存儲(chǔ)于第一數(shù)據(jù)庫(kù)101中。具體的,當(dāng)該最高語(yǔ)音相似值小于或等于該預(yù)設(shè)的高臨界值時(shí),說(shuō)明在第一數(shù)據(jù)庫(kù)101中未存儲(chǔ)有與該段語(yǔ)音相似度很高的語(yǔ)音,該段語(yǔ)音可以體現(xiàn)該用戶的語(yǔ)音特征,故有必要對(duì)該段語(yǔ)音進(jìn)行訓(xùn)練。需要說(shuō)明的是,當(dāng)用戶設(shè)定該預(yù)設(shè)高臨界值為1時(shí),而最高語(yǔ)音相似值必然小于或等于1,表明用戶希望新輸入的每段語(yǔ)音都要進(jìn)行訓(xùn)練。在本實(shí)施方式中,該命名模塊206對(duì)新段輸入的語(yǔ)音進(jìn)行命名的格式為name_n_time,其中,name代表用戶登錄該語(yǔ)音訓(xùn)練界面50所用的用戶名;n代表該段新輸入的語(yǔ)音在存儲(chǔ)于第一數(shù)據(jù)庫(kù)101及第二數(shù)據(jù)庫(kù)102中該用戶的所有語(yǔ)音中的段數(shù)序號(hào)。例如,若第一數(shù)據(jù)庫(kù)101中已經(jīng)存儲(chǔ)有該用戶的兩段語(yǔ)音及第二數(shù)據(jù)庫(kù)102中已經(jīng)存儲(chǔ)有該用戶的三段語(yǔ)音,則該命名模塊206確定該段新輸入的語(yǔ)音為該用戶的第六段語(yǔ)音,則確定n的數(shù)值為6,其他依次類推;time代表命名該段新輸入的語(yǔ)音并存儲(chǔ)至第一數(shù)據(jù)庫(kù)101的具體時(shí)間。該更新模塊207用于提取該新段輸入的語(yǔ)音在內(nèi)的所有語(yǔ)音的特征值,并重新計(jì)算得到各用戶的語(yǔ)音特征平均值,將所有語(yǔ)音的特征值及重新計(jì)算得到的各用戶的語(yǔ)音特征平均值存儲(chǔ)于第一數(shù)據(jù)庫(kù)101中。進(jìn)一步地,該比對(duì)模塊203還用于將該最高語(yǔ)音相似值與一預(yù)設(shè)的低臨界值進(jìn)行比對(duì)。在本實(shí)施方式中,該預(yù)設(shè)的低臨界值為用于確定新輸入的一段語(yǔ)音能否被識(shí)別成功的臨界相似值,由用戶設(shè)定或系統(tǒng)默認(rèn)。該輸出模塊205還用于當(dāng)該最高語(yǔ)音相似值大于或等于該預(yù)設(shè)的低臨界值時(shí),輸出一該段新輸入的語(yǔ)音能被識(shí)別的結(jié)果及該最高語(yǔ)音相似值于該顯示單元30。在本實(shí)施方式中,當(dāng)輸出的最高語(yǔ)音相似值較低時(shí),說(shuō)明該用戶的該段新輸入的語(yǔ)音雖然能被識(shí)別,但是與第一數(shù)據(jù)庫(kù)101中存儲(chǔ)的語(yǔ)音的相似度較低,表明被識(shí)別的準(zhǔn)確度并不是很高,該用戶需要進(jìn)行更多的語(yǔ)音訓(xùn)練,以便于該用戶以后的待識(shí)別語(yǔ)音能更準(zhǔn)確地被識(shí)別。該輸出模塊205還用于當(dāng)該最高語(yǔ)音相似值小于該預(yù)設(shè)的低臨界值時(shí),輸出一該段新輸入的語(yǔ)音不能被識(shí)別的結(jié)果及該最高語(yǔ)音相似值于該顯示單元30。在本實(shí)施方式中,當(dāng)該段語(yǔ)音不能被識(shí)別成功時(shí),說(shuō)明該段語(yǔ)音與第一數(shù)據(jù)庫(kù)101中存儲(chǔ)的語(yǔ)音的相似度很低,表明該用戶需要進(jìn)行更多的語(yǔ)音訓(xùn)練,以便于該用戶以后的待識(shí)別語(yǔ)音能被識(shí)別。該轉(zhuǎn)移模塊23用于在所有語(yǔ)音完成語(yǔ)音訓(xùn)練時(shí),將第一數(shù)據(jù)庫(kù)101中最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102。在本實(shí)施方式中,該第一數(shù)據(jù)庫(kù)101最早存儲(chǔ)的語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102指將該第一數(shù)據(jù)庫(kù)101最早存儲(chǔ)的語(yǔ)音剪切至第二數(shù)據(jù)庫(kù)102中,因此,第一數(shù)據(jù)庫(kù)101最早存儲(chǔ)的語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102后不再存儲(chǔ)于第一數(shù)據(jù)庫(kù)101中。該第二訓(xùn)練模塊24用于在該最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102時(shí),對(duì)第二數(shù)據(jù)庫(kù)102中的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。在本實(shí)施方式中,該第二訓(xùn)練模塊24通過(guò)與該第一訓(xùn)練模塊22相同的方法對(duì)第二數(shù)據(jù)庫(kù)102中的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。進(jìn)一步地,該處理單元20還包括一群組劃分模塊25,該群組劃分模塊25用于將該第一數(shù)據(jù)庫(kù)101及第二數(shù)據(jù)庫(kù)102中存儲(chǔ)的多個(gè)用戶的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值劃分為相同的多個(gè)群組,每個(gè)群組均包括多個(gè)用戶的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值。例如,當(dāng)該第一數(shù)據(jù)庫(kù)101包括群組A、群組B及群組C時(shí),該第二數(shù)據(jù)庫(kù)也包括群組A、群組B及群組C。在一實(shí)施方式中,該群組劃分模塊25根據(jù)每個(gè)用戶所位于的區(qū)域或者部門等因素將該第一數(shù)據(jù)庫(kù)101及第二數(shù)據(jù)庫(kù)102中存儲(chǔ)的多個(gè)用戶的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值劃分至相應(yīng)的群組。例如,群組A中為位于北京的用戶的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值,群組B中為位于南京的用戶的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值,等等。該第一訓(xùn)練模塊22還用于當(dāng)?shù)谝粩?shù)據(jù)庫(kù)101對(duì)應(yīng)的群組中新存儲(chǔ)有一段語(yǔ)音時(shí),對(duì)該群組中該段新存儲(chǔ)的語(yǔ)音在內(nèi)的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。該轉(zhuǎn)移模塊23還用于在該群組中所有語(yǔ)音完成語(yǔ)音訓(xùn)練時(shí),將第一數(shù)據(jù)庫(kù)101中最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102對(duì)應(yīng)的群組。例如,若該段轉(zhuǎn)移的語(yǔ)音原先存儲(chǔ)于第一數(shù)據(jù)庫(kù)101的群組A中,轉(zhuǎn)移至第二數(shù)據(jù)庫(kù)102后,也存儲(chǔ)于第二數(shù)據(jù)庫(kù)102的群組A中。該第二訓(xùn)練模塊24還用于在該最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102對(duì)應(yīng)的群組時(shí),對(duì)第二數(shù)據(jù)庫(kù)102對(duì)應(yīng)的群組中的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。具體的,該特征值提取模塊201還用于基于登錄用戶的登錄信息確定該段新輸入的語(yǔ)音對(duì)應(yīng)的用戶在第一數(shù)據(jù)庫(kù)101中所屬的群組,并將該段新輸入的語(yǔ)音暫存于該所屬群組中,并提取該段新輸入的語(yǔ)音的特征值。在本實(shí)施方式中,登錄用戶的登錄信息包括用戶名及密碼,其中,該特征值提取模塊201可根據(jù)用戶名確定該登錄用戶所屬的群組。該相似值獲取模塊202還用于將該段新輸入的語(yǔ)音的特征值與所屬群組中各用戶的語(yǔ)音特征平均值進(jìn)行比對(duì),并從得到的多個(gè)語(yǔ)音相似值中選取一最高語(yǔ)音相似值。該命名模塊206還用于當(dāng)該最高語(yǔ)音相似值小于或等于該預(yù)設(shè)高臨界值時(shí),通過(guò)前述的方式命名該段新輸入的語(yǔ)音,即將該段新輸入的語(yǔ)音以name_n_time的格式進(jìn)行命名,并將該段語(yǔ)音存儲(chǔ)于該所屬群組中。該更新模塊207還用于提取該所屬群組中該段新輸入的語(yǔ)音在內(nèi)的所有語(yǔ)音的特征值,并重新計(jì)算得到各用戶的語(yǔ)音特征平均值,將所有語(yǔ)音的特征值及重新計(jì)算得到的各用戶的語(yǔ)音特征平均值存儲(chǔ)于第一數(shù)據(jù)庫(kù)101對(duì)應(yīng)的群組中。在本實(shí)施方式中,在第一數(shù)據(jù)庫(kù)101及第二數(shù)據(jù)庫(kù)102中設(shè)置群組可匯集相同群體內(nèi)(例如相同區(qū)域或一個(gè)公司內(nèi)的相同部門)多個(gè)用戶的語(yǔ)音數(shù)據(jù),當(dāng)一用戶需要進(jìn)行語(yǔ)音訓(xùn)練或語(yǔ)音識(shí)別時(shí),該用戶的待訓(xùn)練語(yǔ)音或待識(shí)別語(yǔ)音的特征值只需與該用戶所屬群組內(nèi)各用戶的語(yǔ)音特征平均值作比對(duì),從而減少語(yǔ)音訓(xùn)練及語(yǔ)音識(shí)別所花費(fèi)的時(shí)間。進(jìn)一步地,請(qǐng)參考圖4,該界面提供模塊21還用于響應(yīng)用戶的識(shí)別請(qǐng)求操作而提供一語(yǔ)音識(shí)別界面60,供用戶登錄后通過(guò)該語(yǔ)音輸入單元40輸入待識(shí)別的語(yǔ)音至該語(yǔ)音識(shí)別界面60,從而進(jìn)行語(yǔ)音識(shí)別。在本實(shí)施方式中,該語(yǔ)音識(shí)別界面60顯示有一“開(kāi)始識(shí)別”選項(xiàng)61,用戶可通過(guò)點(diǎn)擊該“開(kāi)始識(shí)別”選項(xiàng)61開(kāi)始語(yǔ)音識(shí)別。在其他實(shí)施方式中,用戶也可通過(guò)該語(yǔ)音輸入單元40輸入“開(kāi)始識(shí)別”的語(yǔ)音而開(kāi)始語(yǔ)音識(shí)別。該第一識(shí)別模塊26用于當(dāng)?shù)谝粩?shù)據(jù)庫(kù)101對(duì)應(yīng)的群組中新存儲(chǔ)有一段待識(shí)別語(yǔ)音時(shí),基于第一數(shù)據(jù)庫(kù)101中對(duì)應(yīng)的群組對(duì)該段待識(shí)別語(yǔ)音的發(fā)音人的身份進(jìn)行識(shí)別。具體的,該第一識(shí)別模塊26通過(guò)調(diào)用特征值提取模塊201、相似值獲取模塊202、比對(duì)模塊203及輸出模塊205而對(duì)該段待識(shí)別語(yǔ)音的發(fā)音人的身份進(jìn)行識(shí)別。該特征值提取模塊201用于獲取一登錄用戶輸入的一段待識(shí)別語(yǔ)音,將該待識(shí)別語(yǔ)音暫存于第一數(shù)據(jù)庫(kù)101中該用戶所屬的群組,并提取該段待識(shí)別語(yǔ)音的特征值。其中,該段待識(shí)別語(yǔ)音為通過(guò)該語(yǔ)音輸入單元40臨時(shí)輸入的語(yǔ)音。該相似值獲取模塊202用于將該段待識(shí)別語(yǔ)音的特征值分別與對(duì)應(yīng)群組下各用戶的語(yǔ)音特征平均值進(jìn)行比對(duì),而得到多個(gè)語(yǔ)音相似值,并從該多個(gè)語(yǔ)音相似值中選取一最高語(yǔ)音相似值。該比對(duì)模塊203用于將該最高語(yǔ)音相似值與一預(yù)設(shè)值進(jìn)行比對(duì)。在本實(shí)施方式中,該預(yù)設(shè)值為待識(shí)別語(yǔ)音的發(fā)音人的身份能否被識(shí)別成功的臨界相似值,且為一默認(rèn)值。該輸出模塊205用于當(dāng)該最高語(yǔ)音相似值大于或等于該預(yù)設(shè)值時(shí),輸出一識(shí)別成功的結(jié)果及該段待識(shí)別語(yǔ)音的發(fā)音人的身份于該顯示單元30。該第二識(shí)別模塊27用于在該段待識(shí)別語(yǔ)音的發(fā)音人的身份無(wú)法被第一識(shí)別模塊26識(shí)別成功時(shí),基于第二數(shù)據(jù)庫(kù)102中對(duì)應(yīng)的群組對(duì)該段待識(shí)別語(yǔ)音的發(fā)音人的身份進(jìn)行識(shí)別。在本實(shí)施方式中,該第二識(shí)別模塊27通過(guò)調(diào)用特征值提取模塊201、相似值獲取模塊202、比對(duì)模塊203及輸出模塊205而將該段待識(shí)別語(yǔ)音的發(fā)音人的身份進(jìn)行識(shí)別。該特征值提取模塊201用于在該段待識(shí)別語(yǔ)音的發(fā)音人的身份無(wú)法被識(shí)別成功時(shí),獲取該段待識(shí)別語(yǔ)音,并基于第二數(shù)據(jù)庫(kù)102中對(duì)應(yīng)的群組提取該段待識(shí)別語(yǔ)音的特征值。該相似值獲取模塊202用于將該段待識(shí)別語(yǔ)音的特征值與第二數(shù)據(jù)庫(kù)102相同群組中各用戶的語(yǔ)音特征平均值進(jìn)行比對(duì),而得到多個(gè)語(yǔ)音相似值,并從該多個(gè)語(yǔ)音相似值中選取一最高語(yǔ)音相似值。該比對(duì)模塊203用于將該最高語(yǔ)音相似值與該預(yù)設(shè)值進(jìn)行比對(duì)。該輸出模塊205用于當(dāng)該最高語(yǔ)音相似值大于或等于該預(yù)設(shè)值時(shí),輸出一識(shí)別成功的結(jié)果及該段待識(shí)別語(yǔ)音的發(fā)音人的身份于該顯示單元30。該輸出模塊205還用于當(dāng)該最高語(yǔ)音相似值小于該預(yù)設(shè)值時(shí),輸出一識(shí)別失敗的結(jié)果于該顯示單元30。在本實(shí)施方式中,該語(yǔ)音識(shí)別裝置1通過(guò)上述的方法在裝置內(nèi)部進(jìn)行語(yǔ)音訓(xùn)練及語(yǔ)音識(shí)別。在一實(shí)施方式中,該第一數(shù)據(jù)庫(kù)101及第二數(shù)據(jù)庫(kù)102可存儲(chǔ)于云端服務(wù)器(圖中未示)中,該語(yǔ)音識(shí)別裝置1可連接至該云端服務(wù)器,并在該云端服務(wù)器中通過(guò)上述的方法進(jìn)行語(yǔ)音訓(xùn)練或語(yǔ)音識(shí)別。此時(shí)該云端服務(wù)器運(yùn)行有模塊22-27及模塊201-206,而該語(yǔ)音識(shí)別裝置1只需執(zhí)行語(yǔ)音輸入及結(jié)果顯示的動(dòng)作。在另一實(shí)施方式中,該語(yǔ)音識(shí)別裝置1及云端服務(wù)器均存儲(chǔ)有第一數(shù)據(jù)庫(kù)101及第二數(shù)據(jù)庫(kù)102,該語(yǔ)音識(shí)別裝置1可連接至該云端服務(wù)器,并在該云端服務(wù)器中通過(guò)上述的方法進(jìn)行語(yǔ)音訓(xùn)練,該云端服務(wù)器在語(yǔ)音訓(xùn)練完成后將兩個(gè)數(shù)據(jù)庫(kù)中的訓(xùn)練結(jié)果(即所有語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值)對(duì)應(yīng)回傳至該語(yǔ)音識(shí)別裝置1的兩個(gè)數(shù)據(jù)庫(kù)中,使得該語(yǔ)音識(shí)別裝置1可基于回傳的訓(xùn)練結(jié)果通過(guò)上述方法對(duì)輸入的待識(shí)別語(yǔ)音進(jìn)行語(yǔ)音識(shí)別。此時(shí)該云端服務(wù)器中運(yùn)行有模塊22-25及模塊201-204、模塊206-207,該語(yǔ)音識(shí)別裝置1運(yùn)行有界面提供模塊21、第一識(shí)別模塊26及第二識(shí)別模塊27,以及特征值提取模塊201、相似值獲取模塊202、比對(duì)模塊203、輸出模塊205。請(qǐng)參考圖5,為本發(fā)明語(yǔ)音識(shí)別方法中語(yǔ)音訓(xùn)練的流程圖。步驟S101,當(dāng)?shù)谝粩?shù)據(jù)庫(kù)101中新存儲(chǔ)有一段語(yǔ)音時(shí),對(duì)該段新存儲(chǔ)的語(yǔ)音在內(nèi)的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。步驟S102,在所有語(yǔ)音完成語(yǔ)音訓(xùn)練時(shí),將第一數(shù)據(jù)庫(kù)101中最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102。步驟S103,在該最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102時(shí),對(duì)第二數(shù)據(jù)庫(kù)102中的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。其中,步驟S101具體包括:獲取登錄用戶輸入的一段語(yǔ)音,將該獲取的語(yǔ)音暫存于第一數(shù)據(jù)庫(kù)101中,并提取該段新輸入的語(yǔ)音的特征值;將該段新輸入的語(yǔ)音的特征值分別與第一數(shù)據(jù)庫(kù)101中各用戶的語(yǔ)音特征平均值進(jìn)行比對(duì),而得到多個(gè)語(yǔ)音相似值,并從該多個(gè)語(yǔ)音相似值中選取一最高語(yǔ)音相似值;將該最高語(yǔ)音相似值與一預(yù)設(shè)的高臨界值進(jìn)行比對(duì);當(dāng)該最高語(yǔ)音相似值大于該預(yù)設(shè)的高臨界值時(shí),刪除該段新輸入的語(yǔ)音;輸出一該段語(yǔ)音被刪除的信息于該顯示單元30;當(dāng)該最高語(yǔ)音相似值小于或等于該預(yù)設(shè)的高臨界值時(shí),命名該段新輸入的語(yǔ)音,并將該段命名后的語(yǔ)音存儲(chǔ)于第一數(shù)據(jù)庫(kù)101中;及提取該段新輸入的語(yǔ)音在內(nèi)的所有語(yǔ)音的特征值,并重新計(jì)算得到各用戶的語(yǔ)音特征平均值,將所有語(yǔ)音的特征值及重新計(jì)算得到的各用戶的語(yǔ)音特征平均值存儲(chǔ)于第一數(shù)據(jù)庫(kù)101中。進(jìn)一步地,步驟S101還包括:將該最高語(yǔ)音相似值與一預(yù)設(shè)的低臨界值進(jìn)行比對(duì);當(dāng)該最高語(yǔ)音相似值大于或等于該預(yù)設(shè)的低臨界值時(shí),輸出一該段新輸入的語(yǔ)音能被識(shí)別的結(jié)果及該最高語(yǔ)音相似值于該顯示單元30;當(dāng)該最高語(yǔ)音相似值小于該預(yù)設(shè)的低臨界值時(shí),輸出一該段新輸入的語(yǔ)音不能被識(shí)別的結(jié)果及該最高語(yǔ)音相似值于該顯示單元30。進(jìn)一步地,該語(yǔ)音識(shí)別方法還包括步驟:將該第一數(shù)據(jù)庫(kù)101及第二數(shù)據(jù)庫(kù)102中存儲(chǔ)的多個(gè)用戶的語(yǔ)音、每段語(yǔ)音的特征值及各用戶的語(yǔ)音特征平均值劃分為相同的多個(gè)群組;當(dāng)?shù)谝粩?shù)據(jù)庫(kù)101對(duì)應(yīng)的群組中新存儲(chǔ)有一段語(yǔ)音時(shí),對(duì)該群組中該段新存儲(chǔ)的語(yǔ)音在內(nèi)的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練;在該段語(yǔ)音完成語(yǔ)音訓(xùn)練時(shí),將第一數(shù)據(jù)庫(kù)101中最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102對(duì)應(yīng)的群組;及在該最早存儲(chǔ)的一段語(yǔ)音轉(zhuǎn)移存儲(chǔ)至第二數(shù)據(jù)庫(kù)102對(duì)應(yīng)的群組時(shí),對(duì)第二數(shù)據(jù)庫(kù)102對(duì)應(yīng)的群組中的所有語(yǔ)音進(jìn)行語(yǔ)音訓(xùn)練。請(qǐng)參考圖6,為本發(fā)明語(yǔ)音識(shí)別方法中語(yǔ)音識(shí)別的流程圖。步驟S201,當(dāng)?shù)谝粩?shù)據(jù)庫(kù)101對(duì)應(yīng)的群組中新存儲(chǔ)有一段待識(shí)別語(yǔ)音時(shí),基于第一數(shù)據(jù)庫(kù)101中對(duì)應(yīng)的群組對(duì)該段待識(shí)別語(yǔ)音的發(fā)音人的身份進(jìn)行識(shí)別。步驟S202,在該段待識(shí)別語(yǔ)音的發(fā)音人的身份無(wú)法被識(shí)別成功時(shí),基于第二數(shù)據(jù)庫(kù)102中對(duì)應(yīng)的群組對(duì)該段待識(shí)別語(yǔ)音的發(fā)音人的身份進(jìn)行識(shí)別。其中,步驟S201具體包括:獲取一登錄用戶輸入的一段待識(shí)別語(yǔ)音,將該待識(shí)別語(yǔ)音暫存于第一數(shù)據(jù)庫(kù)101中該用戶所屬的群組,并提取該段待識(shí)別語(yǔ)音的特征值;將該段待識(shí)別語(yǔ)音的特征值分別與對(duì)應(yīng)群組下各用戶的語(yǔ)音特征平均值進(jìn)行比對(duì),而得到多個(gè)語(yǔ)音相似值,并從該多個(gè)語(yǔ)音相似值中選取一最高語(yǔ)音相似值;將該最高語(yǔ)音相似值與一預(yù)設(shè)值進(jìn)行比對(duì);當(dāng)該最高語(yǔ)音相似值大于或等于該預(yù)設(shè)值時(shí),輸出一識(shí)別成功的結(jié)果及該段待識(shí)別語(yǔ)音的發(fā)音人的身份于該顯示單元30。其中,步驟S202具體包括:在該段待識(shí)別語(yǔ)音的發(fā)音人的身份無(wú)法被識(shí)別成功時(shí),獲取該段待識(shí)別語(yǔ)音,并基于第二數(shù)據(jù)庫(kù)102中對(duì)應(yīng)的群組提取該段待識(shí)別語(yǔ)音的特征值;將該段待識(shí)別語(yǔ)音的特征值與該第二數(shù)據(jù)庫(kù)102相同群組中各用戶的語(yǔ)音特征平均值進(jìn)行比對(duì),而得到多個(gè)語(yǔ)音相似值,并從該多個(gè)語(yǔ)音相似值中選取一最高語(yǔ)音相似值;將該最高語(yǔ)音相似值與該預(yù)設(shè)值進(jìn)行比對(duì);當(dāng)該最高語(yǔ)音相似值大于或等于該預(yù)設(shè)值時(shí),輸出識(shí)別成功的結(jié)果及該段待識(shí)別語(yǔ)音的發(fā)音人的身份于該顯示單元30;當(dāng)該最高語(yǔ)音相似值小于該預(yù)設(shè)值時(shí),輸出一識(shí)別失敗的結(jié)果于該顯示單元30。最后應(yīng)說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的實(shí)施方案而非限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的精神和范圍。當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
芮城县| 兴和县| 德清县| 天台县| 肇源县| 谢通门县| 龙南县| 郎溪县| 东明县| 仙桃市| 汉沽区| 牡丹江市| 正阳县| 清水县| 会理县| 轮台县| 白朗县| 武冈市| 安阳县| 乐昌市| 兴文县| 永寿县| 深圳市| 大余县| 鄱阳县| 会昌县| 锡林浩特市| 青神县| 新源县| 拉萨市| 龙江县| 临潭县| 武义县| 定远县| 容城县| 如皋市| 湟中县| 陇南市| 贡觉县| 通州区| 宜章县|