两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

喚醒語音的檢查方法、電子設(shè)備及計算機可讀存儲介質(zhì)與流程

文檔序號:40639672發(fā)布日期:2025-01-10 18:45閱讀:14來源:國知局
喚醒語音的檢查方法、電子設(shè)備及計算機可讀存儲介質(zhì)與流程

本技術(shù)涉及語音識別處理,具體涉及一種喚醒語音的檢查方法、電子設(shè)備及計算機可讀存儲介質(zhì)。


背景技術(shù):

1、隨著人工智能技術(shù)的不斷發(fā)展,越來越多的電子設(shè)備(如手機等)配置有語音交互功能,用戶可以通過語音控制電子設(shè)備,減少對電子設(shè)備的按鍵操作,極大地提高了用戶使用電子設(shè)備的便捷性。例如,手機上設(shè)置有天氣預(yù)報軟件,用戶可以通過語音控制電子設(shè)備自動播放天氣預(yù)報。

2、對于配置有語音交互功能的電子設(shè)備,用戶可以提前設(shè)備好語音交互功能的喚醒詞,當(dāng)用戶想要使用語音交互功能時,用戶可以向電子設(shè)備說出包含喚醒詞的喚醒語音,電子設(shè)備可以采集該喚醒語音并利用語音喚醒模型(以下描述為第一語音喚醒模型)識別喚醒語音中是否包含喚醒詞,若包含喚醒詞,則喚醒語音交互功能。當(dāng)語音交互功能被喚醒后,用戶才可以正常地通過語音控制電子設(shè)備。在此過程中,喚醒詞的識別至關(guān)重要,如果無法準(zhǔn)確地識別出喚醒詞,將無法喚醒語音交互功能,用戶也就無法通過語音控制電子設(shè)備,影響用戶體驗。因此,需要對喚醒語音交互功能的能力(以下描述為語音喚醒能力)進行準(zhǔn)確的測試或評估。

3、目前語音喚醒能力的測試方法主要包括模型測試方法和語音識別方法。下面分別對這兩種方法進行說明。

4、模型測試方法包括獲取一個比第一語音喚醒模型更加復(fù)雜、性能更好的語音喚醒模型(以下描述為第二語音喚醒模型),利用第二語音喚醒模型對第一語音喚醒模型的語音喚醒能力測試。其中,第二語音喚醒模型可以是比第一語音喚醒模型更大的模型,或者在構(gòu)建第二語音喚醒模型時可以增加混淆拼音處理。根據(jù)上述內(nèi)容可知,模型測試方法依賴于第二語音喚醒模型,而第二語音喚醒模型是采用喚醒語音及其包含的喚醒詞訓(xùn)練得到的,也就是說,第二語音喚醒模型是利用已知的喚醒詞訓(xùn)練得到的,如果用戶設(shè)定的喚醒詞不屬于這些已知的喚醒詞,那么第二語音喚醒模型可能無法準(zhǔn)確識別出喚醒詞,此時將無法對第一語音喚醒模型的語音喚醒能力進行準(zhǔn)確測試。此外,混淆拼音處理主要是預(yù)設(shè)幾種拼音混淆的規(guī)則,按照規(guī)則進行混淆拼音處理,然而規(guī)則的設(shè)定是有限的,無法涵蓋所有可能的拼音混淆情況,從而會影響第二語音喚醒模型的準(zhǔn)確性。

5、語音識別方法包括通過對喚醒語音進行語音識別,將喚醒語音轉(zhuǎn)換成文字得到喚醒詞,再利用該喚醒詞對第一語音喚醒模型識別出的喚醒詞進行驗證。然而,在實際應(yīng)用中喚醒語音通常比較短,語義信息也比較弱,因此,在通過語音識別將喚醒語音轉(zhuǎn)換成文字時可能無法得到準(zhǔn)確的喚醒詞,從而也就無法對第一語音喚醒模型的語音喚醒能力進行準(zhǔn)確測試。

6、相應(yīng)地,本領(lǐng)域需要一種新的技術(shù)方案來解決上述問題。


技術(shù)實現(xiàn)思路

1、為了克服上述缺陷,提出了本技術(shù),以解決或至少部分地解決準(zhǔn)確檢查或驗證喚醒語音是否為正確的喚醒語音的技術(shù)問題。

2、在第一方面,提供一種喚醒語音的檢查方法,所述方法包括:

3、對喚醒語音進行語音識別,得到所述喚醒語音的文本信息,所述文本信息包括中文文本;

4、根據(jù)所述中文文本,獲取所述文本信息的第一拼音;

5、獲取預(yù)設(shè)的中文喚醒詞,并將所述中文喚醒詞轉(zhuǎn)換成第二拼音;

6、對所述第一拼音與所述第二拼音進行匹配;

7、若匹配成功,則確定所述喚醒語音為正確的喚醒語音;

8、若匹配失敗,則確定所述喚醒語音為錯誤的喚醒語音。

9、在上述喚醒語音的檢查方法的一個技術(shù)方案中,所述根據(jù)所述中文文本,獲取所述文本信息的第一拼音,包括:

10、對所述中文文本進行拼音轉(zhuǎn)換,得到所述中文文本的拼音;

11、若所述文本信息還包括英文文本,則根據(jù)所述中文文本的拼音與所述英文文本,獲取所述第一拼音;

12、否則,根據(jù)所述中文文本的拼音,獲取所述第一拼音。

13、在上述喚醒語音的檢查方法的一個技術(shù)方案中,當(dāng)所述第一拼音與所述第二拼音匹配失敗時,所述方法還包括通過以下步驟確定所述喚醒語音是否為正確的喚醒語音:

14、步驟s1:確定所述第一拼音是否包含英文文本;

15、若不包含,則將所述第一拼音作為待轉(zhuǎn)換拼音,并執(zhí)行步驟s2;

16、若包含,則獲取與所述英文文本發(fā)聲相同的拼音音節(jié),將所述第一拼音中的英文文本替換為所述拼音音節(jié),得到第三拼音;以及,

17、對所述第三拼音與所述第二拼音進行匹配;若匹配成功,則確定所述喚醒語音為正確的喚醒語音;若匹配失敗,則將所述第三拼音作為待轉(zhuǎn)換拼音,并執(zhí)行步驟s2;

18、步驟s2:獲取所述待轉(zhuǎn)換拼音中的第一聲母和/或第一韻母,將所述第一聲母替換為第二聲母和/或?qū)⑺龅谝豁嵞柑鎿Q為第二韻母,得到轉(zhuǎn)換后拼音,所述第二聲母與所述第一聲母發(fā)聲相似,所述第二韻母與所述第一韻母發(fā)聲相似;以及,

19、對所述轉(zhuǎn)換后拼音與所述第二拼音進行匹配;若匹配成功,則確定所述喚醒語音為正確的喚醒語音;若匹配失敗,則確定所述喚醒語音為錯誤的喚醒語音。

20、在上述喚醒語音的檢查方法的一個技術(shù)方案中,所述步驟s2,包括:

21、步驟s21:獲取所述待轉(zhuǎn)換拼音中的第一聲母,將所述第一聲母替換為所述第二聲母,得到第一轉(zhuǎn)換后拼音;以及,

22、對所述第一轉(zhuǎn)換后拼音與所述第二拼音進行匹配;若匹配成功,則確定所述喚醒語音為正確的喚醒語音;若匹配失敗,則執(zhí)行步驟s22;

23、步驟s22:獲取所述待轉(zhuǎn)換拼音中的第一韻母,將所述第一韻母替換為所述第二韻母,得到第二轉(zhuǎn)換后拼音;以及,

24、對所述第二轉(zhuǎn)換后拼音與所述第二拼音進行匹配;若匹配成功,則確定所述喚醒語音為正確的喚醒語音;若匹配失敗,則確定所述喚醒語音為錯誤的喚醒語音。

25、在上述喚醒語音的檢查方法的一個技術(shù)方案中,所述方法還包括通過以下方式獲取所述第二聲母和所述第二韻母:

26、獲取第一對應(yīng)關(guān)系和第二對應(yīng)關(guān)系,所述第一對應(yīng)關(guān)系為發(fā)聲相似的聲母之間的對應(yīng)關(guān)系,所述第二對應(yīng)關(guān)系為發(fā)聲相似的韻母之間的對應(yīng)關(guān)系;

27、根據(jù)所述第一對應(yīng)關(guān)系,獲取與所述第一聲母發(fā)聲相似的第二聲母;

28、根據(jù)所述第二對應(yīng)關(guān)系,獲取與所述第一韻母發(fā)聲相似的第二韻母。

29、在上述喚醒語音的檢查方法的一個技術(shù)方案中,在執(zhí)行所述步驟s2之前,所述方法還包括:

30、獲取所述待轉(zhuǎn)換拼音的第一音節(jié)數(shù)量;

31、獲取所述第二拼音的第二音節(jié)數(shù)量;

32、若所述第一音節(jié)數(shù)量小于所述第二音節(jié)數(shù)量,則確定所述喚醒語音為錯誤的喚醒語音,并不再執(zhí)行所述步驟s2。

33、在上述喚醒語音的檢查方法的一個技術(shù)方案中,當(dāng)所述第一音節(jié)數(shù)量小于所述第二音節(jié)數(shù)量時,所述方法還包括通過以下步驟確定所述喚醒語音是否為錯誤的喚醒語音:

34、獲取所述待轉(zhuǎn)換拼音與所述第二拼音之間的字符串編輯距離;

35、若所述字符串編輯距離大于設(shè)定閾值,則確定所述喚醒語音為錯誤的喚醒語音,并不再執(zhí)行所述步驟s2。

36、在上述喚醒語音的檢查方法的一個技術(shù)方案中,在執(zhí)行所述步驟s2之前,所述方法還包括:

37、獲取所述待轉(zhuǎn)換拼音與所述第二拼音之間的字符串編輯距離;

38、若所述字符串編輯距離大于設(shè)定閾值,則確定所述喚醒語音為錯誤的喚醒語音,并不再執(zhí)行所述步驟s2。

39、在第二方面,提供一種電子設(shè)備,該電子設(shè)備包括至少一個處理器;以及,與所述至少一個處理器通信連接的存儲器;其中,所述存儲器中存儲有計算機程序,所述計算機程序被所述至少一個處理器執(zhí)行時實現(xiàn)上述喚醒語音檢查方法的技術(shù)方案中任一項技術(shù)方案所述的方法。

40、在第三方面,提供一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)其中存儲有多條程序代碼,所述程序代碼適于由處理器加載并運行以執(zhí)行上述喚醒語音檢查方法的技術(shù)方案中任一項技術(shù)方案所述的方法。

41、本技術(shù)上述一個或多個技術(shù)方案,至少具有如下一種或多種有益效果:

42、在實施本技術(shù)提供的喚醒語音的檢查方法的一個技術(shù)方案中,可以對喚醒語音進行語音識別,得到喚醒語音的文本信息,文本信息包括中文文本,并根據(jù)中文文本獲取文本信息的第一拼音;獲取預(yù)設(shè)的中文喚醒詞,并將中文喚醒詞轉(zhuǎn)換成第二拼音;對第一拼音與第二拼音進行匹配;若匹配成功,則確定喚醒語音為正確的喚醒語音;若匹配失敗,則確定喚醒語音為錯誤的喚醒語音?;谏鲜鰧嵤┓桨?,不需要使用語音喚醒模型對喚醒語音進行驗證,也就不存在現(xiàn)有技術(shù)在采用模型測試方法時可能導(dǎo)致的驗證不準(zhǔn)確的問題。此外,上述實施方案在對喚醒語音進行語音識別之后,是將喚醒語音的文本信息轉(zhuǎn)換成第一拼音,再將第一拼音與中文喚醒詞的第二拼音進行匹配,在此過程中,不需要考慮文本信息的語義,從而也就克服了現(xiàn)有技術(shù)在采用語音識別方法對喚醒語音進行驗證時由于語義識別不準(zhǔn)確導(dǎo)致的驗證不準(zhǔn)確的問題。

43、在實施本技術(shù)提供的喚醒語音的檢查方法的一個技術(shù)方案中,可以對第一拼音與第二拼音進行多級匹配,以準(zhǔn)確地確定出喚醒語音是否為正確的喚醒語音。具體而言,先對第一拼音與第二拼音進行匹配;若匹配成功,則確定喚醒語音為正確的喚醒語音;若匹配失敗,則通過以下步驟確定喚醒語音是否為正確的喚醒語音:

44、步驟s1:確定第一拼音是否包含英文文本;若不包含,則將第一拼音作為待轉(zhuǎn)換拼音,并執(zhí)行步驟s2;若包含,則獲取與英文文本發(fā)聲相同的拼音音節(jié),將第一拼音中的英文文本替換為拼音音節(jié),得到第三拼音;以及,對第三拼音與第二拼音進行匹配;若匹配成功,則確定喚醒語音為正確的喚醒語音;若匹配失敗,則將第三拼音作為待轉(zhuǎn)換拼音,并執(zhí)行步驟s2。

45、步驟s2:獲取待轉(zhuǎn)換拼音中的第一聲母和/或第一韻母,將第一聲母替換為第二聲母和/或?qū)⒌谝豁嵞柑鎿Q為第二韻母,得到轉(zhuǎn)換后拼音,第二聲母與第一聲母發(fā)聲相似,第二韻母與第一韻母發(fā)聲相似;以及,對轉(zhuǎn)換后拼音與第二拼音進行匹配;若匹配成功,則確定喚醒語音為正確的喚醒語音;若匹配失敗,則確定喚醒語音為錯誤的喚醒語音。

46、由于不同用戶的發(fā)音習(xí)慣不同,因此,對于相同的喚醒詞,不同用戶說出的喚醒語音或多或少都會有一些區(qū)別。喚醒語音不同,可能導(dǎo)致語音識別得到的文本信息略有不同,進而導(dǎo)致第一拼音與第二拼音匹配失敗。但是,上述實施方案考慮到了由于用戶的發(fā)音習(xí)慣不同,而導(dǎo)致中英文發(fā)音相同的情況和韻母發(fā)聲相似的情況,并基于此對第一拼音進行轉(zhuǎn)換,再將轉(zhuǎn)換后的第一拼音(即第三拼音或轉(zhuǎn)換后拼音)與第二拼音進行匹配,從而能夠準(zhǔn)確地確定出喚醒語音是正確的還是錯誤的喚醒語音。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
安多县| 乌兰察布市| 抚顺县| 得荣县| 思茅市| 文化| 延边| 宕昌县| 灵山县| 邵阳县| 当雄县| 弋阳县| 庄河市| 鱼台县| 沧州市| 商丘市| 宜兴市| 中阳县| 老河口市| 牙克石市| 尉氏县| 建阳市| 涿鹿县| 武鸣县| 环江| 长葛市| 连平县| 波密县| 安泽县| 深州市| 神池县| 崇义县| 新丰县| 尚义县| 云林县| 岑巩县| 西昌市| 淮滨县| 浦北县| 新田县| 和龙市|