一種語音識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40642257發(fā)布日期：2025-01-10 18:48閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種語音識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)與流程

技術(shù)特征：

1.一種語音識(shí)別方法，其特征在于，所述方法包括：

2.如權(quán)利要求1所述的方法，其特征在于，所述基于確定的空白幀概率，從所述待識(shí)別語音中篩選出至少一個(gè)目標(biāo)幀，包括：

3.如權(quán)利要求2所述的方法，其特征在于，將位于內(nèi)容重復(fù)的候選幀之間的空白幀，以及空白幀概率小于預(yù)設(shè)閾值的空白幀，作為目標(biāo)幀，包括：

4.如權(quán)利要求2或3所述的方法，其特征在于，若所述內(nèi)容重復(fù)的候選幀之間包含連續(xù)的至少兩個(gè)空白幀；

5.如權(quán)利要求1～3任一項(xiàng)所述的方法，其特征在于，在實(shí)時(shí)語音識(shí)別場(chǎng)景下，所述目標(biāo)編碼器為已訓(xùn)練的第一實(shí)時(shí)語音模型中的流式編碼器；

6.如權(quán)利要求5所述的方法，其特征在于，在所述根據(jù)所述待識(shí)別語音的幀分布信息，獲得所述待識(shí)別語音中的每一語音幀各自對(duì)應(yīng)的空白幀概率之前，還包括：

7.如權(quán)利要求6所述的方法，其特征在于，所述第一實(shí)時(shí)語音識(shí)別模型還包括級(jí)聯(lián)編碼器；

8.如權(quán)利要求1～3任一項(xiàng)所述的方法，其特征在于，在實(shí)時(shí)語音識(shí)別場(chǎng)景下，所述目標(biāo)編碼器為已訓(xùn)練的第二實(shí)時(shí)語音模型中的流式編碼器；

9.如權(quán)利要求8所述的方法，其特征在于，所述第二實(shí)時(shí)語音識(shí)別模型還包括級(jí)聯(lián)編碼器；

10.如權(quán)利要求1～3任一項(xiàng)所述的方法，其特征在于，在非實(shí)時(shí)語音識(shí)別場(chǎng)景下，所述目標(biāo)編碼器為已訓(xùn)練的非實(shí)時(shí)語音模型中的非實(shí)時(shí)編碼器；

11.如權(quán)利要求7所述的方法，其特征在于，在訓(xùn)練所述第一實(shí)時(shí)語音識(shí)別模型時(shí)，相應(yīng)的損失函數(shù)包括：

12.如權(quán)利要求9所述的方法，其特征在于，在訓(xùn)練所述第二實(shí)時(shí)語音識(shí)別模型時(shí)，相應(yīng)的損失函數(shù)包括：

13.如權(quán)利要求10所述的方法，其特征在于，在訓(xùn)練所述非實(shí)時(shí)語音識(shí)別模型時(shí)，相應(yīng)的損失函數(shù)包括：

14.一種語音識(shí)別裝置，其特征在于，包括：

15.一種電子設(shè)備，其特征在于，其包括處理器和存儲(chǔ)器，其中，所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，當(dāng)所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)，使得所述處理器執(zhí)行權(quán)利要求1～13中任一所述方法的步驟。

16.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，其包括計(jì)算機(jī)程序，當(dāng)所述計(jì)算機(jī)程序在電子設(shè)備上運(yùn)行時(shí)，所述計(jì)算機(jī)程序用于使所述電子設(shè)備執(zhí)行權(quán)利要求1～13中任一所述方法的步驟。

17.一種計(jì)算機(jī)程序產(chǎn)品，其特征在于，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中；當(dāng)電子設(shè)備的處理器從所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述計(jì)算機(jī)程序時(shí)，所述處理器執(zhí)行所述計(jì)算機(jī)程序，使得所述電子設(shè)備執(zhí)行權(quán)利要求1～13中任一所述方法的步驟。

技術(shù)總結(jié)
本申請(qǐng)涉及語音識(shí)別技術(shù)領(lǐng)域，尤其涉及一種語音識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)，用以提高語音識(shí)別效率。其中，方法包括：獲取待識(shí)別語音，并通過目標(biāo)編碼器對(duì)待識(shí)別語音進(jìn)行編碼，獲取待識(shí)別語音對(duì)應(yīng)的候選編碼特征；根據(jù)待識(shí)別語音的幀分布信息，獲得待識(shí)別語音中的每一語音幀各自對(duì)應(yīng)的空白幀概率，并基于獲得的空白幀概率，從待識(shí)別語音中篩選出至少一個(gè)目標(biāo)幀；幀分布信息表示每一語音幀在字典空間的概率分布；從候選編碼特征中，篩選出至少一個(gè)目標(biāo)幀對(duì)應(yīng)的目標(biāo)候選編碼特征；基于目標(biāo)候選編碼特征進(jìn)行解碼，得到待識(shí)別語音對(duì)應(yīng)的文本識(shí)別結(jié)果。本申請(qǐng)通過幀分布信息進(jìn)行幀率壓縮，僅對(duì)部分重要幀進(jìn)行解碼，可有效提高語音識(shí)別效率。

技術(shù)研發(fā)人員：井博軍
受保護(hù)的技術(shù)使用者：北京搜狗科技發(fā)展有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種語音識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)與流程

一種語音識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)與流程