語音識別方法、裝置、設(shè)備和存儲介質(zhì)與流程

文檔序號：40603846發(fā)布日期：2025-01-07 20:44閱讀：12來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本申請涉及語音識別，特別是涉及一種語音識別方法、裝置、設(shè)備和存儲介質(zhì)。

背景技術(shù)：

1、語音識別技術(shù)的應(yīng)用越來越廣泛，從智能手機(jī)、智能家居到自動(dòng)駕駛汽車等領(lǐng)域，都離不開語音識別技術(shù)的支持，基于語音識別的交互方式成為了一種廣泛被使用的服務(wù)應(yīng)用解決方案，打電話、發(fā)信息、查詢天氣信息、導(dǎo)航定位、搜索音樂視頻等眾多應(yīng)用場景都可以基于語音識別技術(shù)來輔助用戶完成特定的行為意圖。因此提升語音識別技術(shù)在各類特定場景下的識別效果意義重大。

技術(shù)實(shí)現(xiàn)思路

1、本申請主要解決的技術(shù)問題是提供一種語音識別方法、裝置、設(shè)備和存儲介質(zhì)，能夠提高語音識別的準(zhǔn)確度。

2、為解決上述技術(shù)問題，本申請采用的一個(gè)技術(shù)方案是：提供一種語音識別方法，該方法包括：獲取待識別語音的若干初始識別文本；確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異；對于各個(gè)所述第一發(fā)音序列，按照多個(gè)差異閾值由小到大的順序，在各個(gè)所述第二發(fā)音序列中選擇所述序列差異不大于所述差異閾值的第二發(fā)音序列，作為與所述第一發(fā)音序列匹配的候選發(fā)音序列；基于各個(gè)所述候選發(fā)音序列，確定所述待識別語音的目標(biāo)識別文本。

3、為解決上述技術(shù)問題，本申請采用的另一個(gè)技術(shù)方案是：提供一種語音識別裝置，包括：獲取模塊、差異確定模塊、選擇模塊和文本確定模塊；獲取模塊用于獲取待識別語音的若干初始識別文本；差異確定模塊用于確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異；選擇模塊用于對于各個(gè)所述第一發(fā)音序列，按照多個(gè)差異閾值由小到大的順序，在各個(gè)所述第二發(fā)音序列中選擇所述序列差異不大于所述差異閾值的第二發(fā)音序列，作為與所述第一發(fā)音序列匹配的候選發(fā)音序列；文本確定模塊用于基于各個(gè)所述候選發(fā)音序列，確定所述待識別語音的目標(biāo)識別文本。

4、為解決上述技術(shù)問題，本申請采用的再一個(gè)技術(shù)方案是：提供一種電子設(shè)備，包括相互耦接的存儲器和處理器，存儲器存儲有程序指令；處理器用于執(zhí)行存儲器中存儲的程序指令，以實(shí)現(xiàn)上述方法。

5、為解決上述技術(shù)問題，本申請采用的又一個(gè)技術(shù)方案是：提供一種計(jì)算機(jī)可讀存儲介質(zhì)，用于存儲程序指令，該程序指令能夠被執(zhí)行以實(shí)現(xiàn)上述方法。

6、上述方案，是按照多個(gè)差異閾值的由小到大的順序，選擇與各第一發(fā)音序列的序列差異滿足差異閾值的第二發(fā)音序列作為各第一發(fā)音序列匹配的候選發(fā)音序列，進(jìn)而基于各候選發(fā)音序列，確定待識別語音的目標(biāo)識別文本，相比于根據(jù)一個(gè)預(yù)設(shè)閾值選擇候選發(fā)音序列的方式，本申請?jiān)O(shè)置多個(gè)預(yù)設(shè)閾值、并按照多個(gè)差異閾值的由小到大的順序選擇候選發(fā)音序列的方式，能夠更細(xì)致地考慮發(fā)音序列之間的差異，避免因閾值設(shè)置不當(dāng)而將實(shí)際與第一發(fā)音序列匹配的發(fā)音序列被錯(cuò)誤地排除，或?qū)?shí)際與第一發(fā)音序列不匹配的發(fā)音序列被錯(cuò)誤地包含在內(nèi)的情況，故本申請上述方式能夠更準(zhǔn)確的確定與第一發(fā)音序列匹配的候選發(fā)音序列，進(jìn)而使基于各候選發(fā)音序列確定的目標(biāo)識別文本更加準(zhǔn)確。

技術(shù)特征：

1.一種語音識別方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述按照多個(gè)差異閾值由小到大的順序，在各個(gè)所述第二發(fā)音序列中選擇所述序列差異不大于所述差異閾值的第二發(fā)音序列，作為與所述第一發(fā)音序列匹配的候選發(fā)音序列，包括：

3.根據(jù)權(quán)利要求1或2所述的方法，其特征在于，所述方法還包括：

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于各個(gè)所述候選發(fā)音序列，確定所述待識別語音的目標(biāo)識別文本，包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述從各個(gè)所述候選發(fā)音序列中，選出目標(biāo)發(fā)音序列，包括：

6.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述初始識別文本的第一發(fā)音序列包括所述初始識別文本中關(guān)鍵詞對應(yīng)的發(fā)音序列；所述基于所述目標(biāo)發(fā)音序列，確定所述目標(biāo)識別文本，包括：

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，在所述確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異之前，所述方法還包括：

8.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異，包括：

9.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述目標(biāo)熱詞為在接收到用戶的待識別語音的過程中或之后獲取得到；

10.一種語音識別裝置，其特征在于，所述裝置包括：

11.一種電子設(shè)備，其特征在于，包括相互耦接的存儲器和處理器，

12.一種計(jì)算機(jī)可讀存儲介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有能夠被處理器運(yùn)行的程序指令，所述程序指令能夠被處理器執(zhí)行以實(shí)現(xiàn)權(quán)利要求1-9任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本申請公開了一種語音識別方法、裝置、設(shè)備和存儲介質(zhì)，該方法包括：獲取待識別語音的若干初始識別文本；確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異；對于各個(gè)所述第一發(fā)音序列，按照多個(gè)差異閾值由小到大的順序，在各個(gè)所述第二發(fā)音序列中選擇所述序列差異不大于所述差異閾值的第二發(fā)音序列，作為與所述第一發(fā)音序列匹配的候選發(fā)音序列；基于各個(gè)所述候選發(fā)音序列，確定所述待識別語音的目標(biāo)識別文本。通過上述方式，本申請能夠提高語音識別的準(zhǔn)確度。

技術(shù)研發(fā)人員：黎敏,魏沖洲,李永超,張儒瑞,吳重亮
受保護(hù)的技術(shù)使用者：西安訊飛超腦信息科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/6

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黎敏,魏沖洲,李永超,張儒瑞,吳重亮
技術(shù)所有人：西安訊飛超腦信息科技有限公司
我是此專利的發(fā)明人

上一篇：一種消防管線安裝吊架裝置的制作方法
上一篇：一種環(huán)保阻燃管支架的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語音識別方法、裝置、設(shè)備和存儲介質(zhì)與流程

語音識別方法、裝置、設(shè)備和存儲介質(zhì)與流程