两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

采用聲紋和語(yǔ)音識(shí)別進(jìn)行個(gè)性化電視語(yǔ)音喚醒的方法

文檔序號(hào):8261282閱讀:1355來(lái)源:國(guó)知局
采用聲紋和語(yǔ)音識(shí)別進(jìn)行個(gè)性化電視語(yǔ)音喚醒的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及聲紋識(shí)別和語(yǔ)音識(shí)別技術(shù),通過(guò)聲紋識(shí)別進(jìn)行電視機(jī)使用用戶的身份 確認(rèn),并通過(guò)確認(rèn)的身份和對(duì)用戶語(yǔ)音的語(yǔ)音識(shí)別結(jié)果來(lái)控制電視機(jī)進(jìn)行個(gè)性化的語(yǔ)音喚 醒。
【背景技術(shù)】
[0002] 近年來(lái),隨著智能語(yǔ)音處理技術(shù)、互聯(lián)網(wǎng)和云計(jì)算技術(shù)的快速發(fā)展,目前市面上出 現(xiàn)的智能電視大部分都開(kāi)始支持簡(jiǎn)單的語(yǔ)音操作,如進(jìn)行音量調(diào)節(jié),資源搜索等,同時(shí)電視 語(yǔ)音助手等應(yīng)用也開(kāi)始出現(xiàn)。但由于中國(guó)各地的方言種類多、同音字多、各地方言的語(yǔ)音語(yǔ) 調(diào)的不同、周圍環(huán)境噪聲等因素造成語(yǔ)音識(shí)別的準(zhǔn)確率很低,電視無(wú)法執(zhí)行用戶語(yǔ)音命令 的現(xiàn)象時(shí)常出現(xiàn)。因此,對(duì)消費(fèi)者來(lái)說(shuō),目前的語(yǔ)音電視在一定程度上并不能滿足其各項(xiàng)需 求。同時(shí),這些人機(jī)語(yǔ)音交互功能大多需要通過(guò)云端計(jì)算來(lái)完成,存在一定的安全隱患。
[0003] 現(xiàn)在幾乎每個(gè)家庭都擁有一臺(tái)或幾臺(tái)電視機(jī),但一臺(tái)電視通常會(huì)被幾位家庭成員 使用,特別是放置在客廳的電視,而每位家庭成員對(duì)電視節(jié)目頻道的喜好卻不盡相同,這時(shí) 在打開(kāi)電視后通常需要用遙控器對(duì)電視節(jié)目頻道進(jìn)行遍歷切換以找到自己最喜歡的頻道, 非常不方便且繁瑣。

【發(fā)明內(nèi)容】

[0004] 為解決現(xiàn)有技術(shù)的不足,本發(fā)明提供一種采用語(yǔ)音進(jìn)行個(gè)性化電視喚醒的實(shí)現(xiàn)方 法,能夠?qū)τ脩粽Z(yǔ)音采用聲紋識(shí)別和語(yǔ)音識(shí)別,實(shí)現(xiàn)對(duì)用戶的身份進(jìn)行監(jiān)測(cè)并使用非常簡(jiǎn) 單的喚醒詞就能喚醒電視打開(kāi)其最喜歡的電視頻道。
[0005] 眾所周知,聲紋識(shí)別又稱說(shuō)話人識(shí)別,是生物識(shí)別技術(shù)的一種,聲紋識(shí)別和語(yǔ)音識(shí) 別均屬于智能語(yǔ)音處理技術(shù)的范疇。具體是將說(shuō)話人語(yǔ)音信號(hào)中的聲紋特征參數(shù)與訓(xùn)練好 的聲紋模型進(jìn)行模式匹配從而自動(dòng)進(jìn)行說(shuō)話人身份確認(rèn)或辨認(rèn)的技術(shù)。語(yǔ)音識(shí)別是通過(guò)模 式識(shí)別和語(yǔ)言理解將語(yǔ)音信號(hào)中包含的文字信息提取出來(lái)的技術(shù),主要包括特征提取、聲 學(xué)模型和語(yǔ)言模型訓(xùn)練、解碼技術(shù)等。
[0006] 本發(fā)明具體實(shí)現(xiàn)步驟如下:
[0007] A.個(gè)性化信息注冊(cè)
[0008] 采用聲紋識(shí)別系統(tǒng)建立用戶的聲紋模型,采用語(yǔ)音識(shí)別系統(tǒng)識(shí)別出用戶最喜愛(ài)的 電視頻道信息。
[0009] B?信息存儲(chǔ)
[0010] 將用戶聲紋模型和最喜愛(ài)的電視頻道信息進(jìn)行關(guān)聯(lián)并存儲(chǔ)到電視機(jī)信息存儲(chǔ)單 J1_1〇
[0011] C.語(yǔ)音喚醒
[0012] 用戶只需對(duì)電視機(jī)的語(yǔ)音采集單元說(shuō)出預(yù)先設(shè)定的喚醒詞,即可根據(jù)聲紋識(shí)別和 語(yǔ)音識(shí)別系統(tǒng)對(duì)喚醒詞的聲紋和語(yǔ)音識(shí)別結(jié)果從電視機(jī)信息存儲(chǔ)單元中調(diào)出用戶的個(gè)性 化信息,自動(dòng)完成打開(kāi)電視并自動(dòng)切換到用戶最喜愛(ài)的電視頻道。
[0013] 以上所述的采用聲紋和語(yǔ)音識(shí)別進(jìn)行個(gè)性化電視語(yǔ)音喚醒的方法,其特點(diǎn)是,所 述步驟A、步驟B,在用戶作第一次操作時(shí)完成,以后只需操作步驟C,即可完成其個(gè)性化語(yǔ) 音電視的喚醒。
[0014] 當(dāng)用戶對(duì)電視頻道的喜好發(fā)生改變時(shí),通過(guò)重新執(zhí)行步驟A,進(jìn)行用戶個(gè)性化信息 注冊(cè),對(duì)信息存儲(chǔ)單元中的電視頻道信息進(jìn)行更新,此時(shí)無(wú)需進(jìn)行聲紋建模,僅需進(jìn)行聲紋 匹配和語(yǔ)音識(shí)別。
[0015] 由于本發(fā)明使用了聲紋識(shí)別技術(shù),很容易對(duì)不同用戶建立起其對(duì)應(yīng)的聲紋密鑰 (聲紋模型),通過(guò)不同用戶聲紋密鑰的唯一性實(shí)現(xiàn)對(duì)其喜愛(ài)的電視頻道信息進(jìn)行關(guān)聯(lián)和 保護(hù),進(jìn)而實(shí)現(xiàn)具有用戶個(gè)性化的電視語(yǔ)音喚醒功能。
[0016] 本發(fā)明與現(xiàn)有技術(shù)相比,具有以下特點(diǎn):
[0017] 第一、用戶只需張嘴說(shuō)簡(jiǎn)單的喚醒詞,如"hello電視"就能自動(dòng)打開(kāi)電視并立即切 換到自己最喜歡的電視臺(tái)節(jié)目頻道,無(wú)需再手動(dòng)開(kāi)機(jī)遙控,給用戶帶來(lái)智能、時(shí)尚的應(yīng)用體 驗(yàn)。
[0018] 第二、個(gè)性化注冊(cè)時(shí)的聲紋識(shí)別性能與所說(shuō)的文本和使用的語(yǔ)言無(wú)關(guān),方便使用。
[0019] 第三、用聲紋作為密碼,簡(jiǎn)單的電視頻道代碼和喚醒詞語(yǔ)音作為交互方式,因此語(yǔ) 音識(shí)別系統(tǒng)僅需實(shí)現(xiàn)簡(jiǎn)單的關(guān)鍵詞識(shí)別即可,識(shí)別速度快,且聲紋識(shí)別和語(yǔ)音識(shí)別僅需離 線訓(xùn)練和測(cè)試就可完成,無(wú)需發(fā)送到云端服務(wù)器,使用方便且保證了家庭信息的安全性。
[0020] 第四、可設(shè)置多位用戶的個(gè)性化語(yǔ)音開(kāi)機(jī)信息,除喚醒功能外,同時(shí)也可用于個(gè)性 化自動(dòng)語(yǔ)音換臺(tái)。
[0021] 第五、本發(fā)明的算法實(shí)現(xiàn)模塊具有很好的可移植性和可擴(kuò)展性,可被移植到有線 電視的機(jī)頂盒、通用的DSP高速處理器或芯片上運(yùn)行,能廣泛應(yīng)用于智能家居相關(guān)領(lǐng)域。
【附圖說(shuō)明】
[0022] 圖1為本發(fā)明采用聲紋和語(yǔ)音識(shí)別進(jìn)行個(gè)性化電視語(yǔ)音喚醒的方法系統(tǒng)組成框 圖;
[0023] 圖2為本發(fā)明實(shí)施例用戶個(gè)性化信息注冊(cè)系統(tǒng)流程圖;
[0024] 圖3為本發(fā)明實(shí)施例個(gè)性化語(yǔ)音喚醒電視的流程圖。
【具體實(shí)施方式】
[0025] 以下結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述
[0026] 本發(fā)明構(gòu)建了一套采用聲紋和語(yǔ)音識(shí)別進(jìn)行個(gè)性化電視語(yǔ)音喚醒的系統(tǒng)(如圖1 所示),該系統(tǒng)包括用于用戶個(gè)性化信息注冊(cè)、喚醒詞識(shí)別和聲紋匹配的語(yǔ)音控制系統(tǒng)1, 用于接收并存儲(chǔ)從語(yǔ)音控制系統(tǒng)1中傳遞來(lái)的已訓(xùn)練好的用戶聲紋模型和已識(shí)別出的電 視頻道信息的信息存儲(chǔ)單元2和接收從語(yǔ)音控制系統(tǒng)1和信息存儲(chǔ)單元中傳遞的控制信 息,負(fù)責(zé)執(zhí)行個(gè)性化電視語(yǔ)音喚醒操作的電視機(jī)主控制器3組成,以電信號(hào)方式連接。其 中:
[0027] 所述語(yǔ)音控制系統(tǒng)1由語(yǔ)音采集單元11,語(yǔ)音識(shí)別單元12和聲紋識(shí)別單元13組 成,其中:
[0028] 所述語(yǔ)音采集單元11用于完成用戶語(yǔ)音信號(hào)的采集和處理;
[0029] 所述語(yǔ)音識(shí)別單元12用于識(shí)別用戶所說(shuō)的電視頻道信息和喚醒詞;
[0030] 所述聲紋識(shí)別單元13用于從用戶語(yǔ)音中提取出代表其身份信息的聲紋信息進(jìn)行 聲紋建模和聲紋匹配。
[0031] 本發(fā)明的語(yǔ)音控制系統(tǒng)有二個(gè)狀態(tài)按鈕,即"用戶注冊(cè)"和"語(yǔ)音喚醒"。當(dāng)用戶需 要進(jìn)行個(gè)性化信息注冊(cè)時(shí)開(kāi)啟"用戶注冊(cè)",平時(shí)均處于"語(yǔ)音喚醒"狀態(tài),這樣有利于節(jié)省 電能。
[0032] 下面結(jié)合附圖分別介紹用戶個(gè)性化信息注冊(cè)過(guò)程和自動(dòng)語(yǔ)音喚醒的具體實(shí)施方 式
[0033] 用戶首次進(jìn)行個(gè)性化信息注冊(cè)時(shí)(如圖2所示)實(shí)施例,需對(duì)電視機(jī)說(shuō)話二次,第 一次為任意文本的語(yǔ)音,用于聲紋建模,第二次為用戶自己最喜歡的電視頻道信息,用于將 電視頻道信息與用戶聲紋模型進(jìn)行關(guān)聯(lián)。具體步驟如下:
[0034] A1.開(kāi)啟語(yǔ)音控制系1,使其處于"用戶注冊(cè)"狀態(tài);
[0035]A2.若用戶為首次進(jìn)行個(gè)性化信息注冊(cè),執(zhí)行該步驟,否則轉(zhuǎn)向步驟A6開(kāi)始執(zhí)行, 用戶對(duì)著電視機(jī)的語(yǔ)音采集單元11說(shuō)話,說(shuō)話內(nèi)容為任意文本,持續(xù)時(shí)間至少30秒;
[0036]A3.語(yǔ)音采集單元11采集輸入的說(shuō)話人語(yǔ)音信號(hào),并對(duì)其進(jìn)行A/D轉(zhuǎn)換,濾波處 理;
[0037]A4.聲紋識(shí)別單元13對(duì)經(jīng)步驟A3處理后的語(yǔ)音信號(hào)作預(yù)處理,包括加窗分幀、預(yù) 加重、端點(diǎn)檢測(cè),提取聲紋特征參數(shù),然后調(diào)用信息存儲(chǔ)單元2中已有的聲紋模型進(jìn)行聲紋 匹配,若匹配成功,轉(zhuǎn)向步驟A7;反之,進(jìn)入下一步操作;
[0038]A5.調(diào)用聲紋識(shí)別單元13對(duì)從步驟A4中提取的特征參數(shù)進(jìn)行聲紋模型的訓(xùn)練,將 訓(xùn)練好的聲紋模型存儲(chǔ)到信息存儲(chǔ)單2;
[0039]A6.用戶對(duì)著電視機(jī)的語(yǔ)音采集單元11說(shuō)出自己最喜歡的電視頻道信息,如頻道 代碼"3"代表湖南衛(wèi)視,則說(shuō)出數(shù)字"3",轉(zhuǎn)向步驟A3重新開(kāi)始;
[0040] A7.語(yǔ)音識(shí)別單元12對(duì)語(yǔ)音采集單元11采集到的語(yǔ)音進(jìn)行識(shí)別,將識(shí)別出的電視 頻道代碼存儲(chǔ)到信息存儲(chǔ)單元2中并與聲紋匹配成功的聲紋模型進(jìn)行關(guān)聯(lián);
[0041] A8.退出個(gè)性化信息注冊(cè)。
[0042] 當(dāng)用戶的電視頻道喜好發(fā)生改變時(shí),可通過(guò)重新進(jìn)行個(gè)性化信息注冊(cè)來(lái)更新信息 存儲(chǔ)單元2中的電視頻道信息,此時(shí)只需對(duì)著電視機(jī)的語(yǔ)音采集單元11說(shuō)出電視頻道信息 即可,語(yǔ)音控制系統(tǒng)1會(huì)自動(dòng)從上述的步驟A6開(kāi)始執(zhí)行,無(wú)需對(duì)用戶聲紋重新建模。
[0043]自動(dòng)進(jìn)行個(gè)性化語(yǔ)音喚醒電視(如圖3所示)實(shí)施例的具體步驟如下:
[0044] C1.當(dāng)語(yǔ)音控制系統(tǒng)1處于"語(yǔ)音喚醒"開(kāi)啟狀態(tài)時(shí),用戶對(duì)著電視機(jī)語(yǔ)音采集單 元11說(shuō)出喚醒詞;
[0045] C2.語(yǔ)音采集單元11采集輸入的說(shuō)話人語(yǔ)音信號(hào),并對(duì)其進(jìn)行A/D轉(zhuǎn)換,濾波處 理;
[0046] C3.語(yǔ)音識(shí)別單元12對(duì)上述處理過(guò)的語(yǔ)音進(jìn)行識(shí)別,將識(shí)別出的內(nèi)容與預(yù)先設(shè)定 的喚醒詞進(jìn)行匹配,以判斷采集到的輸入語(yǔ)音信號(hào)是否為電視機(jī)的語(yǔ)音喚醒指令,若匹配 成功則將喚醒操作指令傳遞給電視機(jī)主控制器3,否則退出喚醒系統(tǒng);
[0047]C4.聲紋識(shí)別單元13將處理過(guò)的語(yǔ)音與信息存儲(chǔ)單元2中的聲紋模型進(jìn)行聲紋匹 配,若匹配成功,則將與用戶聲紋模型關(guān)聯(lián)的電視頻道信息和喚醒操作指令輸出給電視機(jī) 主控制器3,否則退出喚醒系統(tǒng);
[0048] C5.電視機(jī)主控制器3在成功收到語(yǔ)音控制系統(tǒng)1傳遞來(lái)的電視頻道信息和喚醒 操作指令后,執(zhí)行電視開(kāi)機(jī)操作并自動(dòng)切換到對(duì)應(yīng)用戶喜愛(ài)的電視頻道上。
[0049] 上述提到的預(yù)先設(shè)定的特定語(yǔ)音喚醒詞可為任意設(shè)定的詞組,如"打開(kāi)電視機(jī)"、
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
三明市| 永嘉县| 尼玛县| 双城市| 靖边县| 开化县| 镇原县| 兴安盟| 枝江市| 扎赉特旗| 宁晋县| 南溪县| 芮城县| 贺兰县| 东山县| 开鲁县| 恩施市| 南江县| 广宁县| 巴彦淖尔市| 石屏县| 龙陵县| 栾川县| 濉溪县| 哈尔滨市| 屏东县| 甘德县| 清远市| 绥德县| 恭城| 朝阳区| 太保市| 宁都县| 凤城市| 左权县| 邵东县| 门头沟区| 宁强县| 绵阳市| 松阳县| 青神县|