两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種語音識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40642257發(fā)布日期:2025-01-10 18:48閱讀:來源:國知局

技術(shù)特征:

1.一種語音識(shí)別方法,其特征在于,所述方法包括:

2.如權(quán)利要求1所述的方法,其特征在于,所述基于確定的空白幀概率,從所述待識(shí)別語音中篩選出至少一個(gè)目標(biāo)幀,包括:

3.如權(quán)利要求2所述的方法,其特征在于,將位于內(nèi)容重復(fù)的候選幀之間的空白幀,以及空白幀概率小于預(yù)設(shè)閾值的空白幀,作為目標(biāo)幀,包括:

4.如權(quán)利要求2或3所述的方法,其特征在于,若所述內(nèi)容重復(fù)的候選幀之間包含連續(xù)的至少兩個(gè)空白幀;

5.如權(quán)利要求1~3任一項(xiàng)所述的方法,其特征在于,在實(shí)時(shí)語音識(shí)別場(chǎng)景下,所述目標(biāo)編碼器為已訓(xùn)練的第一實(shí)時(shí)語音模型中的流式編碼器;

6.如權(quán)利要求5所述的方法,其特征在于,在所述根據(jù)所述待識(shí)別語音的幀分布信息,獲得所述待識(shí)別語音中的每一語音幀各自對(duì)應(yīng)的空白幀概率之前,還包括:

7.如權(quán)利要求6所述的方法,其特征在于,所述第一實(shí)時(shí)語音識(shí)別模型還包括級(jí)聯(lián)編碼器;

8.如權(quán)利要求1~3任一項(xiàng)所述的方法,其特征在于,在實(shí)時(shí)語音識(shí)別場(chǎng)景下,所述目標(biāo)編碼器為已訓(xùn)練的第二實(shí)時(shí)語音模型中的流式編碼器;

9.如權(quán)利要求8所述的方法,其特征在于,所述第二實(shí)時(shí)語音識(shí)別模型還包括級(jí)聯(lián)編碼器;

10.如權(quán)利要求1~3任一項(xiàng)所述的方法,其特征在于,在非實(shí)時(shí)語音識(shí)別場(chǎng)景下,所述目標(biāo)編碼器為已訓(xùn)練的非實(shí)時(shí)語音模型中的非實(shí)時(shí)編碼器;

11.如權(quán)利要求7所述的方法,其特征在于,在訓(xùn)練所述第一實(shí)時(shí)語音識(shí)別模型時(shí),相應(yīng)的損失函數(shù)包括:

12.如權(quán)利要求9所述的方法,其特征在于,在訓(xùn)練所述第二實(shí)時(shí)語音識(shí)別模型時(shí),相應(yīng)的損失函數(shù)包括:

13.如權(quán)利要求10所述的方法,其特征在于,在訓(xùn)練所述非實(shí)時(shí)語音識(shí)別模型時(shí),相應(yīng)的損失函數(shù)包括:

14.一種語音識(shí)別裝置,其特征在于,包括:

15.一種電子設(shè)備,其特征在于,其包括處理器和存儲(chǔ)器,其中,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),使得所述處理器執(zhí)行權(quán)利要求1~13中任一所述方法的步驟。

16.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,其包括計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在電子設(shè)備上運(yùn)行時(shí),所述計(jì)算機(jī)程序用于使所述電子設(shè)備執(zhí)行權(quán)利要求1~13中任一所述方法的步驟。

17.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中;當(dāng)電子設(shè)備的處理器從所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述計(jì)算機(jī)程序時(shí),所述處理器執(zhí)行所述計(jì)算機(jī)程序,使得所述電子設(shè)備執(zhí)行權(quán)利要求1~13中任一所述方法的步驟。


技術(shù)總結(jié)
本申請(qǐng)涉及語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語音識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),用以提高語音識(shí)別效率。其中,方法包括:獲取待識(shí)別語音,并通過目標(biāo)編碼器對(duì)待識(shí)別語音進(jìn)行編碼,獲取待識(shí)別語音對(duì)應(yīng)的候選編碼特征;根據(jù)待識(shí)別語音的幀分布信息,獲得待識(shí)別語音中的每一語音幀各自對(duì)應(yīng)的空白幀概率,并基于獲得的空白幀概率,從待識(shí)別語音中篩選出至少一個(gè)目標(biāo)幀;幀分布信息表示每一語音幀在字典空間的概率分布;從候選編碼特征中,篩選出至少一個(gè)目標(biāo)幀對(duì)應(yīng)的目標(biāo)候選編碼特征;基于目標(biāo)候選編碼特征進(jìn)行解碼,得到待識(shí)別語音對(duì)應(yīng)的文本識(shí)別結(jié)果。本申請(qǐng)通過幀分布信息進(jìn)行幀率壓縮,僅對(duì)部分重要幀進(jìn)行解碼,可有效提高語音識(shí)別效率。

技術(shù)研發(fā)人員:井博軍
受保護(hù)的技術(shù)使用者:北京搜狗科技發(fā)展有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
蒙阴县| 诏安县| 桑日县| 新田县| 夏津县| 南投县| 海城市| 蒙阴县| 安陆市| 元江| 乌拉特中旗| 万州区| 宁夏| 东方市| 阿克陶县| 塘沽区| 嵊州市| 黄石市| 岳阳县| 西和县| 靖远县| 邯郸市| 讷河市| 多伦县| 灯塔市| 右玉县| 丰台区| 韩城市| 攀枝花市| 兴义市| 天门市| 余江县| 庐江县| 嘉定区| 嵊州市| 忻城县| 商城县| 霍林郭勒市| 女性| 蒲江县| 抚远县|