本申請(qǐng)涉及通信,尤其涉及一種音頻解碼、編碼方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、由于語(yǔ)音通信的便利性和及時(shí)性,語(yǔ)音通話的應(yīng)用越來(lái)越廣泛,例如在網(wǎng)絡(luò)會(huì)議的會(huì)議參與方之間傳輸音頻信號(hào)(例如語(yǔ)音信號(hào))。而在語(yǔ)音通話中,語(yǔ)音信號(hào)可能會(huì)被混有噪聲等聲學(xué)干擾,語(yǔ)音信號(hào)中所混有的噪聲會(huì)導(dǎo)致通話質(zhì)量變差,從而極大地影響了用戶的聽(tīng)覺(jué)體驗(yàn)。
2、然而,對(duì)于如何對(duì)語(yǔ)音信號(hào)進(jìn)行增強(qiáng)處理以抑制噪聲部分,相關(guān)技術(shù)尚無(wú)有效的解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種音頻解碼、編碼方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品,能夠有效抑制音頻信號(hào)中的聲學(xué)干擾,進(jìn)而提高重建得到的音頻信號(hào)的質(zhì)量。
2、本申請(qǐng)實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
3、本申請(qǐng)實(shí)施例提供一種音頻解碼方法,包括:
4、獲取碼流,其中,所述碼流是對(duì)音頻信號(hào)進(jìn)行編碼得到的;
5、對(duì)所述碼流進(jìn)行解碼處理,得到所述音頻信號(hào)的特征向量的預(yù)測(cè)值;
6、對(duì)所述特征向量的預(yù)測(cè)值進(jìn)行標(biāo)簽提取處理,得到用于信號(hào)增強(qiáng)的標(biāo)簽信息向量,其中,所述標(biāo)簽信息向量的維度與所述特征向量的預(yù)測(cè)值的維度相同;
7、基于所述特征向量的預(yù)測(cè)值和所述標(biāo)簽信息向量進(jìn)行信號(hào)重建;
8、將通過(guò)所述信號(hào)重建得到的所述音頻信號(hào)的預(yù)測(cè)值,作為所述碼流的解碼結(jié)果。
9、本申請(qǐng)實(shí)施例提供一種音頻解碼裝置,包括:
10、獲取模塊,用于獲取碼流,其中,所述碼流是對(duì)音頻信號(hào)進(jìn)行編碼得到的;
11、解碼模塊,用于對(duì)所述碼流進(jìn)行解碼處理,得到所述音頻信號(hào)的特征向量的預(yù)測(cè)值;
12、標(biāo)簽提取模塊,用于對(duì)所述特征向量的預(yù)測(cè)值進(jìn)行標(biāo)簽提取處理,得到用于信號(hào)增強(qiáng)的標(biāo)簽信息向量,其中,所述標(biāo)簽信息向量的維度與所述特征向量的預(yù)測(cè)值的維度相同;
13、重建模塊,用于基于所述特征向量的預(yù)測(cè)值和所述標(biāo)簽信息向量進(jìn)行信號(hào)重建;
14、確定模塊,用于將通過(guò)所述信號(hào)重建得到的所述音頻信號(hào)的預(yù)測(cè)值,作為所述碼流的解碼結(jié)果。
15、本申請(qǐng)實(shí)施例提供一種音頻編碼方法,包括:
16、獲取音頻信號(hào);
17、對(duì)所述音頻信號(hào)進(jìn)行編碼處理,得到碼流,其中,所述碼流用于供電子設(shè)備執(zhí)行本申請(qǐng)實(shí)施例提供的音頻解碼方法。
18、本申請(qǐng)實(shí)施例提供一種音頻編碼裝置,包括:
19、獲取模塊,用于獲取音頻信號(hào);
20、編碼模塊,用于對(duì)所述音頻信號(hào)進(jìn)行編碼處理,得到碼流,其中,所述碼流用于供電子設(shè)備執(zhí)行本申請(qǐng)實(shí)施例提供的音頻解碼方法。
21、本申請(qǐng)實(shí)施例提供一種電子設(shè)備,包括:
22、存儲(chǔ)器,用于存儲(chǔ)可執(zhí)行指令;
23、處理器,用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的可執(zhí)行指令時(shí),實(shí)現(xiàn)本申請(qǐng)實(shí)施例提供的音頻編解碼方法。
24、本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有可執(zhí)行指令,用于被處理器執(zhí)行時(shí),實(shí)現(xiàn)本申請(qǐng)實(shí)施例提供的音頻編解碼方法。
25、本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,用于被處理器執(zhí)行時(shí),實(shí)現(xiàn)本申請(qǐng)實(shí)施例提供的音頻編解碼方法。
26、本申請(qǐng)實(shí)施例具有以下有益效果:
27、通過(guò)對(duì)解碼得到的特征向量的預(yù)測(cè)值進(jìn)行標(biāo)簽提取處理,得到用于信號(hào)增強(qiáng)的標(biāo)簽信息向量,并結(jié)合特征向量的預(yù)測(cè)值和標(biāo)簽信息向量進(jìn)行信號(hào)重建,如此,相較于僅僅基于特征向量的預(yù)測(cè)值進(jìn)行信號(hào)重建,結(jié)合特征向量的預(yù)測(cè)值和標(biāo)簽信息向量進(jìn)行信號(hào)重建,相當(dāng)于增加了音頻信號(hào)中核心成分所占的比例,減小了噪聲等聲學(xué)干擾所占的比例,從而可以有效抑制編碼端采集的音頻信號(hào)中包括的噪聲成分,進(jìn)而提高了重建得到的音頻信號(hào)的質(zhì)量。
1.一種音頻解碼方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述特征向量的預(yù)測(cè)值和所述標(biāo)簽信息向量進(jìn)行信號(hào)重建,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對(duì)所述特征向量的預(yù)測(cè)值和所述標(biāo)簽信息向量進(jìn)行融合處理,得到融合向量,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述碼流進(jìn)行解碼處理,得到所述音頻信號(hào)的特征向量的預(yù)測(cè)值,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,
10.根據(jù)權(quán)利要求7至10任一項(xiàng)所述的方法,其特征在于,所述基于所述特征向量的預(yù)測(cè)值和所述標(biāo)簽信息向量進(jìn)行信號(hào)重建,包括:
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述對(duì)所述n個(gè)子帶信號(hào)分別對(duì)應(yīng)的特征向量的預(yù)測(cè)值、以及所述n個(gè)標(biāo)簽信息向量進(jìn)行一一對(duì)應(yīng)的融合處理,得到n個(gè)融合向量,包括:
12.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述基于第j融合向量調(diào)用第j合成網(wǎng)絡(luò)進(jìn)行信號(hào)重建,得到第j子帶信號(hào)的預(yù)測(cè)值,包括:
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,
14.一種音頻編碼方法,其特征在于,所述方法包括:
15.一種處理碼流的方法,其特征在于,所述碼流基于權(quán)利要求1至13任一項(xiàng)所述的音頻解碼方法進(jìn)行解碼,或者根據(jù)權(quán)利要求14所述的音頻編碼方法產(chǎn)生。
16.一種處理碼流的方法,其特征在于,在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)所述碼流,所述碼流基于權(quán)利要求1至13任一項(xiàng)所述的音頻解碼方法進(jìn)行解碼,或者根據(jù)權(quán)利要求14所述的音頻編碼方法產(chǎn)生。
17.一種音頻解碼裝置,其特征在于,所述裝置包括:
18.一種音頻編碼裝置,其特征在于,所述裝置包括:
19.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有可執(zhí)行指令,其特征在于,所述可執(zhí)行指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至13任一項(xiàng)所述的音頻解碼方法或權(quán)利要求14所述的音頻編碼方法。
20.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,其特征在于,所述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至13任一項(xiàng)所述的音頻解碼方法或權(quán)利要求14所述的音頻編碼方法。