本申請涉及語音識別,特別是涉及一種語音識別方法、裝置、設(shè)備和存儲介質(zhì)。
背景技術(shù):
1、語音識別技術(shù)的應(yīng)用越來越廣泛,從智能手機(jī)、智能家居到自動(dòng)駕駛汽車等領(lǐng)域,都離不開語音識別技術(shù)的支持,基于語音識別的交互方式成為了一種廣泛被使用的服務(wù)應(yīng)用解決方案,打電話、發(fā)信息、查詢天氣信息、導(dǎo)航定位、搜索音樂視頻等眾多應(yīng)用場景都可以基于語音識別技術(shù)來輔助用戶完成特定的行為意圖。因此提升語音識別技術(shù)在各類特定場景下的識別效果意義重大。
技術(shù)實(shí)現(xiàn)思路
1、本申請主要解決的技術(shù)問題是提供一種語音識別方法、裝置、設(shè)備和存儲介質(zhì),能夠提高語音識別的準(zhǔn)確度。
2、為解決上述技術(shù)問題,本申請采用的一個(gè)技術(shù)方案是:提供一種語音識別方法,該方法包括:獲取待識別語音的若干初始識別文本;確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異;對于各個(gè)所述第一發(fā)音序列,按照多個(gè)差異閾值由小到大的順序,在各個(gè)所述第二發(fā)音序列中選擇所述序列差異不大于所述差異閾值的第二發(fā)音序列,作為與所述第一發(fā)音序列匹配的候選發(fā)音序列;基于各個(gè)所述候選發(fā)音序列,確定所述待識別語音的目標(biāo)識別文本。
3、為解決上述技術(shù)問題,本申請采用的另一個(gè)技術(shù)方案是:提供一種語音識別裝置,包括:獲取模塊、差異確定模塊、選擇模塊和文本確定模塊;獲取模塊用于獲取待識別語音的若干初始識別文本;差異確定模塊用于確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異;選擇模塊用于對于各個(gè)所述第一發(fā)音序列,按照多個(gè)差異閾值由小到大的順序,在各個(gè)所述第二發(fā)音序列中選擇所述序列差異不大于所述差異閾值的第二發(fā)音序列,作為與所述第一發(fā)音序列匹配的候選發(fā)音序列;文本確定模塊用于基于各個(gè)所述候選發(fā)音序列,確定所述待識別語音的目標(biāo)識別文本。
4、為解決上述技術(shù)問題,本申請采用的再一個(gè)技術(shù)方案是:提供一種電子設(shè)備,包括相互耦接的存儲器和處理器,存儲器存儲有程序指令;處理器用于執(zhí)行存儲器中存儲的程序指令,以實(shí)現(xiàn)上述方法。
5、為解決上述技術(shù)問題,本申請采用的又一個(gè)技術(shù)方案是:提供一種計(jì)算機(jī)可讀存儲介質(zhì),用于存儲程序指令,該程序指令能夠被執(zhí)行以實(shí)現(xiàn)上述方法。
6、上述方案,是按照多個(gè)差異閾值的由小到大的順序,選擇與各第一發(fā)音序列的序列差異滿足差異閾值的第二發(fā)音序列作為各第一發(fā)音序列匹配的候選發(fā)音序列,進(jìn)而基于各候選發(fā)音序列,確定待識別語音的目標(biāo)識別文本,相比于根據(jù)一個(gè)預(yù)設(shè)閾值選擇候選發(fā)音序列的方式,本申請?jiān)O(shè)置多個(gè)預(yù)設(shè)閾值、并按照多個(gè)差異閾值的由小到大的順序選擇候選發(fā)音序列的方式,能夠更細(xì)致地考慮發(fā)音序列之間的差異,避免因閾值設(shè)置不當(dāng)而將實(shí)際與第一發(fā)音序列匹配的發(fā)音序列被錯(cuò)誤地排除,或?qū)?shí)際與第一發(fā)音序列不匹配的發(fā)音序列被錯(cuò)誤地包含在內(nèi)的情況,故本申請上述方式能夠更準(zhǔn)確的確定與第一發(fā)音序列匹配的候選發(fā)音序列,進(jìn)而使基于各候選發(fā)音序列確定的目標(biāo)識別文本更加準(zhǔn)確。
1.一種語音識別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照多個(gè)差異閾值由小到大的順序,在各個(gè)所述第二發(fā)音序列中選擇所述序列差異不大于所述差異閾值的第二發(fā)音序列,作為與所述第一發(fā)音序列匹配的候選發(fā)音序列,包括:
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于各個(gè)所述候選發(fā)音序列,確定所述待識別語音的目標(biāo)識別文本,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述從各個(gè)所述候選發(fā)音序列中,選出目標(biāo)發(fā)音序列,包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述初始識別文本的第一發(fā)音序列包括所述初始識別文本中關(guān)鍵詞對應(yīng)的發(fā)音序列;所述基于所述目標(biāo)發(fā)音序列,確定所述目標(biāo)識別文本,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異之前,所述方法還包括:
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定各個(gè)所述初始識別文本的第一發(fā)音序列分別與各個(gè)目標(biāo)熱詞的第二發(fā)音序列之間的序列差異,包括:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目標(biāo)熱詞為在接收到用戶的待識別語音的過程中或之后獲取得到;
10.一種語音識別裝置,其特征在于,所述裝置包括:
11.一種電子設(shè)備,其特征在于,包括相互耦接的存儲器和處理器,
12.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有能夠被處理器運(yùn)行的程序指令,所述程序指令能夠被處理器執(zhí)行以實(shí)現(xiàn)權(quán)利要求1-9任一項(xiàng)所述的方法。