两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種終端及語音識別方法

文檔序號:2827679閱讀:120來源:國知局
一種終端及語音識別方法
【專利摘要】本發(fā)明公開一種終端及語音識別方法,該終端包括確定模塊,用于根據(jù)預(yù)設(shè)規(guī)則,確定識別算法;第一接收模塊,用于接收用戶輸入的待識別語音信息;識別模塊,用于根據(jù)確定模塊確定的識別算法,對第一接收模塊接收的待識別語音信息進行識別。通過以上技術(shù)方案,解決了現(xiàn)有方式中由于語音模型庫中不存在與用戶輸入的語音信息相同的語音信息,因而無法對用戶輸入的語音進行識別,進而執(zhí)行相應(yīng)操作的問題。根據(jù)預(yù)設(shè)規(guī)則確定的識別算法可以針對不同用戶“量身定做”語音識別系統(tǒng),具有“特殊個體特殊對待”的優(yōu)點,避免了統(tǒng)一處理的做法,具有一定的再學(xué)習(xí)性,極大地增加了語音識別率,提高了用戶的體驗效果。
【專利說明】一種終端及語音識別方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音識別領(lǐng)域,尤其涉及一種終端及語音識別方法。

【背景技術(shù)】
[0002] 針對語音的識別,通常是對待識別語音進行特征參數(shù)的提取,然后按照某種識別 算法與網(wǎng)絡(luò)或本地語音模型庫進行匹配,從而對語音進行識別,并執(zhí)行相應(yīng)的動作行為,然 而,這沒有考慮到待識別語音在語音模型庫中不存在的情況。此外,由于待識別語音輸入的 特征參數(shù)可能因人而異,同一動作行為也可能對應(yīng)著不同的特征參數(shù),且該識別算法一旦 形成,就無法改變,針對具體個人而言,就會影響其語音識別率,因而無法做到對特殊個體 的特殊對待,極大地降低了用戶體驗效果。


【發(fā)明內(nèi)容】

[0003] 本發(fā)明提供一種終端及語音識別方法,解決了現(xiàn)有方式中由于語音模型庫中不存 在與用戶輸入的語音信息相同的語音信息,因而無法對用戶輸入的語音進行識別,進而執(zhí) 行相應(yīng)操作的問題。
[0004] 為解決上述技術(shù)問題,本發(fā)明采用以下技術(shù)方案:
[0005] -種終端,包括:
[0006] 確定模塊,用于根據(jù)預(yù)設(shè)規(guī)則,確定識別算法;
[0007] 第一接收模塊,用于接收用戶輸入的待識別語音信息;
[0008] 識別模塊,用于根據(jù)所述確定模塊確定的識別算法,對所述第一接收模塊接收的 待識別語音信息進行識別。
[0009] 在本發(fā)明的一種實施例中,還包括第二接收模塊、比較模塊以及修正模塊;
[0010] 所述第一接收模塊還用于接收用戶輸入的語音測試信息;
[0011] 所述第二接收模塊用于接收用戶設(shè)定的語音目標信息;
[0012] 所述識別模塊還用于根據(jù)測試算法,對所述第一接收模塊接收的語音測試信息進 行識別,得到語音識別信息;
[0013] 所述比較模塊用于將所述識別模塊得到的語音識別信息與所述語音目標信息進 行比較;
[0014] 所述修正模塊用于若所述語音識別信息與所述語音目標信息的差異不在誤差范 圍內(nèi),根據(jù)所述差異,修正所述測試算法;
[0015] 所述確定模塊具體用于若所述語音識別信息與所述語音目標信息的差異在誤差 范圍內(nèi),將所述測試算法確定為所述識別算法。
[0016] 在本發(fā)明的一種實施例中,所述識別模塊包括提取子模塊、計算子模塊;
[0017] 所述提取子模塊用于提取所述語音測試信息的至少一個語音測試數(shù)值;
[0018] 所述計算子模塊用于根據(jù)測試算法,對所述提取子模塊提取的至少一個語音測試 數(shù)值進行計算,得到至少一個語音識別數(shù)值,將所述語音識別數(shù)值作為語音識別信息。
[0019] 在本發(fā)明的一種實施例中,
[0020] 所述提取子模塊還用于提取所述語音目標信息的至少一個語音目標數(shù)值;
[0021] 所述計算子模塊還用于計算所述提取子模塊提取的至少一個語音識別數(shù)值與所 述至少一個語音目標數(shù)值的平均誤差;
[0022] 所述比較模塊具體用于判斷所述計算子模塊計算的平均誤差是否在一定范圍內(nèi)。
[0023] 在本發(fā)明的一種實施例中,所述修正模塊具體用于根據(jù)所述差異,對所述測試算 法的結(jié)構(gòu)和參數(shù)進行修正。
[0024] -種語音識別方法,包括:
[0025] 根據(jù)預(yù)設(shè)規(guī)則,確定識別算法;
[0026] 接收用戶輸入的待識別語音信息;
[0027] 根據(jù)所述識別算法,對所述待識別語音信息進行識別。
[0028] 在本發(fā)明的一種實施例中,所述根據(jù)預(yù)設(shè)規(guī)則,確定識別算法具體包括:
[0029] 步驟A.接收用戶輸入的語音測試信息、以及用戶設(shè)定的語音目標信息;
[0030] 步驟B.根據(jù)測試算法,對所述語音測試信息進行識別,得到語音識別信息;
[0031] 步驟C.將所述語音識別信息與所述語音目標信息進行比較,若所述語音識別信 息與所述語音目標信息的差異在誤差范圍內(nèi),則進入步驟E,否則進入步驟D ;
[0032] 步驟D.根據(jù)所述差異,修正所述測試算法,返回步驟B ;
[0033] 步驟E.將所述測試算法確定為所述識別算法。
[0034] 在本發(fā)明的一種實施例中,根據(jù)測試算法,對所述語音測試信息進行識別,得到語 音識別信息具體包括:
[0035] 提取所述語音測試信息的至少一個語音測試數(shù)值;
[0036] 根據(jù)測試算法,對所述至少一個語音測試數(shù)值進行計算,得到至少一個語音識別 數(shù)值,將所述語音識別數(shù)值作為語音識別信息。
[0037] 在本發(fā)明的一種實施例中,將所述語音識別信息與所述語音目標信息進行比較具 體包括:
[0038] 提取所述語音目標信息的至少一個語音目標數(shù)值;
[0039] 計算所述至少一個語音識別數(shù)值與所述至少一個語音目標數(shù)值的平均誤差,判斷 所述平均誤差是否在一定范圍內(nèi)。
[0040] 在本發(fā)明的一種實施例中,根據(jù)所述差異,修正所述測試算法具體包括:
[0041] 根據(jù)所述差異,對所述測試算法的結(jié)構(gòu)和參數(shù)進行修正。
[0042] 本發(fā)明的有益效果:
[0043] 本發(fā)明提供一種終端及語音識別方法,根據(jù)預(yù)設(shè)規(guī)則,確定一種識別算法,通過該 識別算法,完成對用戶語音信息的識別,該根據(jù)預(yù)設(shè)規(guī)則確定的識別算法可以針對不同用 戶"量身定做"語音識別系統(tǒng),具有"特殊個體特殊對待"的優(yōu)點,避免了統(tǒng)一處理的做法, 具有一定的再學(xué)習(xí)性,極大地增加了語音識別率,提高了用戶的體驗效果。

【專利附圖】

【附圖說明】
[0044] 圖1為本發(fā)明一實施例提供的語音識別方法的流程圖;
[0045] 圖2為本發(fā)明一實施例提供的終端的結(jié)構(gòu)示意圖;
[0046] 圖3是本發(fā)明一實施例提供的BP神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)示意圖。 圖4為本發(fā)明一實施例提供的識別算法確定方法的流程圖。

【具體實施方式】
[0047] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例只是本發(fā)明中一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0048] 下面通過【具體實施方式】結(jié)合附圖對本發(fā)明作進一步詳細說明。
[0049] 如圖1為本發(fā)明一實施例提供的語音識別方法的流程圖,如圖1所示,該語音識別 方法包括:
[0050] S101 :根據(jù)預(yù)設(shè)規(guī)則,確定識別算法;
[0051] 具體地,在使用終端的語音識別功能時,由于一些用戶發(fā)音不準或存在口音等問 題,導(dǎo)致終端無法對用戶的語音進行識別,因此,為了增加語音識別率、提高用戶的體驗效 果,根據(jù)預(yù)設(shè)規(guī)則,確定一針對特殊用戶的識別算法,使該識別算法可以對該特殊用戶輸入 的語音信息進行識別,從而完成相應(yīng)的行為動作。
[0052] 在本實施例中,在根據(jù)預(yù)設(shè)規(guī)則,確定識別算法之前,判斷終端當(dāng)前是否處于識別 算法的確定模式,對于該識別算法的確定模式,終端可以默認實時處于確定模式,也可以根 據(jù)用戶的操作,開啟確定模式。
[0053] 若終端當(dāng)前沒有處于識別算法的確定模式,則直接對用戶輸入的待識別語音信息 進行識別,即確定網(wǎng)絡(luò)或本地語音模型庫中是否存在與該待識別的語音信息相匹配的語音 信息,從而得到相應(yīng)的識別結(jié)果。
[0054] 若終端當(dāng)前處于識別算法的確定模式,終端則根據(jù)預(yù)設(shè)規(guī)則,確定識別算法,其包 括但不局限于以下方式:
[0055] 步驟A.接收用戶輸入的語音測試信息、以及用戶設(shè)定的語音目標信息;
[0056] 具體地,當(dāng)用戶需要為自己"量身定做" 一識別算法時,不僅需要向終端輸入語音 測試信息,還需要向終端輸入其設(shè)定的語音目標信息,終端則接收用戶輸入的語音測試信 息,以及用戶設(shè)定的語音目標信息,對于該語音目標信息,用戶的設(shè)定方式包括但不局限于 以下方式:終端顯示目標語音輸入界面,由用戶主動輸入語音模型庫中的語音信息,或者, 終端以圖表的形式展示語音模型庫中的語音信息,供用戶進行選擇。該語音模型庫可以為 本地語音模型庫,也可以為通過網(wǎng)絡(luò)調(diào)用的語音模型庫,該語音模型庫中包括至少一個用 戶的語音信息,并且,每一個語音信息都存在對應(yīng)的動作行為,其中,每一語音信息對應(yīng)的 動作行為可以是用戶自定義設(shè)置的,也可以是系統(tǒng)默認設(shè)置的,當(dāng)用戶輸入或選擇語音目 標信息后,終端對該語音目標信息進行接收。
[0057] 步驟B.根據(jù)測試算法,對語音測試信息進行識別,得到語音識別信息;
[0058] 具體地,當(dāng)終端接收到用戶輸入的語音測試信息后,對該語音測試信息進行處理, 提取該語音測試信息的至少一個語音測試數(shù)值,用以表示用戶輸入的語音測試信息,當(dāng)終 端得到至少一個語音測試數(shù)值后,則根據(jù)測試算法,對用戶輸入的語音測試信息進行識別, 即對至少一個語音測試數(shù)值進行計算,得到至少一個語音識別數(shù)值,將語音識別數(shù)值作為 語首識別?目息。
[0059] 需要說明的是,該測試算法包括但不局限于BP神經(jīng)網(wǎng)絡(luò)算法,如圖3為BP神經(jīng)網(wǎng) 絡(luò)算法的結(jié)構(gòu)示意圖,其中1x1,x2, x3, . . . .,xN}為提取的用戶輸入的語音測試信息的N個 特征值,{〇1,〇2,ο3,...,οΝ}為經(jīng)過網(wǎng)絡(luò)計算的N個輸出值,中間層包括至少一層隱層,每 一隱層的節(jié)點為網(wǎng)絡(luò)的隱層節(jié)點,隱層的節(jié)點個數(shù)可以在一定范圍內(nèi)隨機生成,每兩個節(jié) 點之間都有連接權(quán)值Wij,且該連接權(quán)值Wij可以在一定范圍內(nèi)隨機生成,比如(_1,1)之 間,在本實施例中,優(yōu)選地,中間層包括一層隱層。
[0060] 1)初始化,選定合理的網(wǎng)絡(luò)結(jié)構(gòu),可以把用戶的語音測試信息的N個特征值作為 網(wǎng)絡(luò)的N個輸入,所有可調(diào)參數(shù)Wij設(shè)置為均勻分布的較小隨機數(shù)值,在隱層中隨機生成一 定數(shù)量的節(jié)點。
[0061] 2)對網(wǎng)絡(luò)的N個輸入做如下計算:
[0062] ①前向計算:對第1層的j單元

【權(quán)利要求】
1. 一種終端,其特征在于,包括: 確定模塊,用于根據(jù)預(yù)設(shè)規(guī)則,確定識別算法; 第一接收模塊,用于接收用戶輸入的待識別語音信息; 識別模塊,用于根據(jù)所述確定模塊確定的識別算法,對所述第一接收模塊接收的待識 別語音信息進行識別。
2. 根據(jù)權(quán)利要求1所述的終端,其特征在于,還包括第二接收模塊、比較模塊以及修正 模塊; 所述第一接收模塊還用于接收用戶輸入的語音測試信息; 所述第二接收模塊用于接收用戶設(shè)定的語音目標信息; 所述識別模塊還用于根據(jù)測試算法,對所述第一接收模塊接收的語音測試信息進行識 另IJ,得到語音識別信息; 所述比較模塊用于將所述識別模塊得到的語音識別信息與所述語音目標信息進行比 較; 所述修正模塊用于若所述語音識別信息與所述語音目標信息的差異不在誤差范圍內(nèi), 根據(jù)所述差異,修正所述測試算法; 所述確定模塊具體用于若所述語音識別信息與所述語音目標信息的差異在誤差范圍 內(nèi),將所述測試算法確定為所述識別算法。
3. 根據(jù)權(quán)利要求2所述的終端,其特征在于,所述識別模塊包括提取子模塊、計算子模 塊; 所述提取子模塊用于提取所述語音測試信息的至少一個語音測試數(shù)值; 所述計算子模塊用于根據(jù)測試算法,對所述提取子模塊提取的至少一個語音測試數(shù)值 進行計算,得到至少一個語音識別數(shù)值,將所述語音識別數(shù)值作為語音識別信息。
4. 根據(jù)權(quán)利要求3所述的終端,其特征在于, 所述提取子模塊還用于提取所述語音目標信息的至少一個語音目標數(shù)值; 所述計算子模塊還用于計算所述提取子模塊提取的至少一個語音識別數(shù)值與所述至 少一個語音目標數(shù)值的平均誤差; 所述比較模塊具體用于判斷所述計算子模塊計算的平均誤差是否在一定范圍內(nèi)。
5. 根據(jù)權(quán)利要求2-4任一項所述的終端,其特征在于,所述修正模塊具體用于根據(jù)所 述差異,對所述測試算法的結(jié)構(gòu)和參數(shù)進行修正。
6. -種語音識別方法,其特征在于,包括: 根據(jù)預(yù)設(shè)規(guī)則,確定識別算法; 接收用戶輸入的待識別語音信息; 根據(jù)所述識別算法,對所述待識別語音信息進行識別。
7. 根據(jù)權(quán)利要求6所述的語音識別方法,其特征在于,所述根據(jù)預(yù)設(shè)規(guī)則,確定識別算 法具體包括: 步驟A.接收用戶輸入的語音測試信息、以及用戶設(shè)定的語音目標信息; 步驟B.根據(jù)測試算法,對所述語音測試信息進行識別,得到語音識別信息; 步驟C.將所述語音識別信息與所述語音目標信息進行比較,若所述語音識別信息與 所述語音目標信息的差異在誤差范圍內(nèi),則進入步驟E,否則進入步驟D ; 步驟D.根據(jù)所述差異,修正所述測試算法,返回步驟B ; 步驟E.將所述測試算法確定為所述識別算法。
8. 根據(jù)權(quán)利要求7所述的語音識別方法,其特征在于,根據(jù)測試算法,對所述語音測試 信息進行識別,得到語音識別信息具體包括: 提取所述語音測試信息的至少一個語音測試數(shù)值; 根據(jù)測試算法,對所述至少一個語音測試數(shù)值進行計算,得到至少一個語音識別數(shù)值, 將所述語音識別數(shù)值作為語音識別信息。
9. 根據(jù)權(quán)利要求8所述的語音識別方法,其特征在于,將所述語音識別信息與所述語 音目標信息進行比較具體包括: 提取所述語音目標信息的至少一個語音目標數(shù)值; 計算所述至少一個語音識別數(shù)值與所述至少一個語音目標數(shù)值的平均誤差,判斷所述 平均誤差是否在一定范圍內(nèi)。
10. 根據(jù)權(quán)利要求7-9任一項所述的語音識別方法,其特征在于,根據(jù)所述差異,修正 所述測試算法具體包括: 根據(jù)所述差異,對所述測試算法的結(jié)構(gòu)和參數(shù)進行修正。
【文檔編號】G10L15/02GK104112445SQ201410371025
【公開日】2014年10月22日 申請日期:2014年7月30日 優(yōu)先權(quán)日:2014年7月30日
【發(fā)明者】張軍 申請人:宇龍計算機通信科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
宜兰县| 元江| 高要市| 元阳县| 临高县| 灵石县| 通化市| 札达县| 古丈县| 灵宝市| 古浪县| 福泉市| 资源县| 沈丘县| 驻马店市| 湘潭县| 自治县| 米泉市| 蒙阴县| 西平县| 邹城市| 新沂市| 合作市| 景东| 红河县| 晋城| 黄大仙区| 太原市| 石林| 图片| 辛集市| 兰州市| 株洲市| 梅河口市| 曲麻莱县| 淮北市| 丹凤县| 大同市| 中山市| 柳林县| 榆中县|