1.一種基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,包括
2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,在所述步驟s50中,音頻區(qū)間未識別有效文本內(nèi)容,識別得到音頻區(qū)間的聲音特征以及特征分類,使第二文本中這類文本的文本區(qū)間無對應(yīng)文本內(nèi)容,但文本區(qū)間對應(yīng)說話對象標記,這類文本是第二文本中的特別文本;
3.根據(jù)權(quán)利要求1或2所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,所述步驟s10中提取視頻文件中的音頻文件的方法,包括
4.根據(jù)權(quán)利要求1或2所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,所述步驟s30中通過聲紋識別對所述音頻文件中的音頻中的不同聲音特征分類的方法包括
5.根據(jù)權(quán)利要求4所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,步驟s50的識別音頻區(qū)間的音頻對應(yīng)的第二文本,包括
6.根據(jù)權(quán)利要求4所述的基于深度學(xué)習(xí)的語音轉(zhuǎn)錄方法,其特征在于,所述預(yù)處理包括幀切割、對語音的高頻部分進行預(yù)加重、增加語音的高頻分辨率的操作中的任一種或者其組合。
7.一種電子設(shè)備,所述電子設(shè)備包括:一個或多個處理器,存儲器,以及,一個或多個程序;其中,所述一個或多個程序被存儲在所述存儲器中,所述一個或多個程序包括指令,當所述指令被所述電子設(shè)備執(zhí)行時,使得所述電子設(shè)備執(zhí)行權(quán)利要求1~6任一所述方法。
8.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)包括計算機程序,當計算機程序在電子設(shè)備上運行時,使得所述電子設(shè)備執(zhí)行權(quán)利要求1~6任一所述方法。