基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法
【專利摘要】基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法,針對(duì)帶噪語音信號(hào)進(jìn)行以下操作:首先,根據(jù)預(yù)設(shè)的采樣頻率對(duì)語音信號(hào)進(jìn)行采樣,形成對(duì)應(yīng)的向量化表達(dá),并按不同主題對(duì)語音信號(hào)進(jìn)行分組;其次,利用同主題語音信號(hào)間的組稀疏結(jié)構(gòu)特性,通過低秩矩陣分解對(duì)帶噪語音信號(hào)實(shí)現(xiàn)噪聲分離,并得到語音信號(hào)的組稀疏低秩表達(dá);最后,通過獲得的低秩表達(dá)對(duì)原始帶噪信號(hào)進(jìn)行重構(gòu),從而輸出清晰的增強(qiáng)語音信號(hào)。本發(fā)明的優(yōu)點(diǎn)在于:有效地考慮了同主題語音信號(hào)間的組稀疏結(jié)構(gòu)特性,能更好地消除背景噪音并獲取更清晰的語音信號(hào),使聽者更迅速準(zhǔn)確地理解語音內(nèi)容,可應(yīng)用于軍事通信、網(wǎng)絡(luò)音頻會(huì)議和在線電臺(tái)放送等等。
【專利說明】基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音信號(hào)增強(qiáng)的【技術(shù)領(lǐng)域】,特別是基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法。
【背景技術(shù)】
[0002]隨著數(shù)字媒體設(shè)備在人們?nèi)粘9ぷ骱蜕钪械钠占?,特別是互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展壯大,每天都產(chǎn)生海 量的語音數(shù)據(jù),這些數(shù)據(jù)對(duì)現(xiàn)實(shí)生活中很多領(lǐng)域的交流與合作有著至關(guān)重要的影響。然后,由于各種客觀環(huán)境條件的制約,如家居中小孩的滴哭聲、會(huì)議室外的車輛喧鬧聲、實(shí)驗(yàn)室內(nèi)的機(jī)器運(yùn)轉(zhuǎn)聲和戰(zhàn)爭(zhēng)中的炸彈聲等等,導(dǎo)致音頻設(shè)備采集的語音信號(hào)通常伴隨著不同程度的噪聲。因此,如何有效分離語音數(shù)據(jù)中的噪聲成分,增強(qiáng)語音信號(hào)是學(xué)術(shù)界和エ業(yè)界非常關(guān)心且一直在研究探討的問題。語音信號(hào)的增強(qiáng)技術(shù),主要指從不同的噪聲背景下提取有效而清晰的語音信號(hào),抑制、降低甚至消除噪聲干擾。
[0003]目前,針對(duì)語音信號(hào)的增強(qiáng)處理集中在傳統(tǒng)的數(shù)字和模擬信號(hào)處理中,如現(xiàn)有的典型語音增強(qiáng)方法主要有基于小波分析、譜相減、卡爾曼濾波、信號(hào)子空間、聽覺掩蔽效應(yīng)、神經(jīng)網(wǎng)絡(luò)、獨(dú)立主成分分析等等。這些技術(shù)對(duì)于語音信號(hào)較少且不穩(wěn)定的情況是很占優(yōu)勢(shì)的,但是隨著大數(shù)據(jù)時(shí)代的到來,海量的語音數(shù)據(jù)唾手可得,這為利用統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法解決帶噪語音信號(hào)的噪聲抑制提供了可能性。從機(jī)器學(xué)習(xí)的角度,將不同類型的語音信號(hào)看成數(shù)據(jù)樣本,可以利用已有的許多魯棒學(xué)習(xí)方法獲得帶噪語音數(shù)據(jù)的低維低秩本征表達(dá),保留盡可能多的原始語音信號(hào),而抑制或丟棄無關(guān)的噪聲信息,從而實(shí)現(xiàn)語音信號(hào)和噪聲信號(hào)的分離,提高聽者對(duì)語音信號(hào)傳遞內(nèi)容的鑒別理解能力。在語音數(shù)據(jù)極為豐富的情形下,使用統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法處理帶噪語音信號(hào)具有傳統(tǒng)信號(hào)處理方法無法比擬的優(yōu)勢(shì),具有很強(qiáng)的現(xiàn)實(shí)意義和重要的研究價(jià)值。
【發(fā)明內(nèi)容】
[0004]為了讓用戶對(duì)多種混合的帶噪語音信號(hào)提高辨聽力,本發(fā)明提出了ー種基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法,該方法包括以下步驟:
[0005]1、獲取不同主題的大量帶噪語音信號(hào)后,針對(duì)帶噪語音信號(hào)進(jìn)行以下操作:
[0006]I)根據(jù)預(yù)設(shè)的采樣頻率fs對(duì)每個(gè)帶噪語音信號(hào)進(jìn)行采樣,獲得m維的向量化表達(dá)X G Rm,并按照不同主題對(duì)語音信號(hào)分組;
[0007]2)利用同主題語音信號(hào)間的組稀疏結(jié)構(gòu)特性,通過低秩矩陣分解對(duì)帶噪語音信號(hào)實(shí)現(xiàn)噪聲分離,并得到語音信號(hào)的組稀疏低秩表達(dá);
[0008]3)通過獲得的低秩表達(dá)對(duì)原始帶噪信號(hào)進(jìn)行重構(gòu),從而輸出清晰的增強(qiáng)語音信號(hào)。
[0009]進(jìn)ー步,步驟I)中所述的按照不同主題對(duì)語音信號(hào)分組,具體是:
[0010]I)假設(shè)語音信號(hào)可分為k個(gè)主題,則第c個(gè)主題的語音信號(hào)矩陣表示為
【權(quán)利要求】
1.基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法,該方法的特征在于獲取不同主題的大量帶噪語音信號(hào)后,針對(duì)帶噪語音信號(hào)進(jìn)行以下操作: 1)根據(jù)預(yù)設(shè)的采樣頻率fs對(duì)每個(gè)帶噪語音信號(hào)進(jìn)行采樣,獲得m維的向量化表達(dá)X∈ Rm,并按照不同主題對(duì)語音信號(hào)分組; 2)利用同主題語音信號(hào)間的組稀疏結(jié)構(gòu)特性,通過低秩矩陣分解對(duì)帶噪語音信號(hào)實(shí)現(xiàn)噪聲分離,并得到語音信號(hào)的組稀疏低秩表達(dá); 3)通過獲得的低秩表達(dá)對(duì)原始帶噪信號(hào)進(jìn)行重構(gòu),從而輸出清晰的增強(qiáng)語音信號(hào)。
2.如權(quán)利要求1所述的基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法,其特征在于:步驟1)中所述的按照不同主題對(duì)語音信號(hào)分組,具體是: 1)假設(shè)語音信號(hào)可分為k個(gè)主題,則第c個(gè)主題的語音信號(hào)矩陣表示為
3.如權(quán)利要求2所述的基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法,其特征在于:步驟2)中所述的利用同主題語音信號(hào)間的組稀疏結(jié)構(gòu)特性,通過低秩矩陣分解對(duì)帶噪語音信號(hào)實(shí)現(xiàn)噪聲分離,并得到語音信號(hào)的組稀疏低秩表達(dá),具體是: 1)假設(shè)第c個(gè)主題語音信號(hào)的組稀疏低秩表達(dá)為で,則同主題語音信號(hào)間的組稀疏結(jié)構(gòu)特征可通過矩陣的l1.q,,范式表征為
4.如權(quán)利要求3所述的基于組稀疏低秩表達(dá)的語音信號(hào)增強(qiáng)方法,其特征在于:步驟3)中所述通過獲得的低秩表達(dá)對(duì)原始帶噪信號(hào)進(jìn)行重構(gòu),具體是: 通過上述步驟求得的語音信號(hào)對(duì)應(yīng)的組稀疏低秩表達(dá)Z與原始帶噪語音信號(hào)X進(jìn)行線性乘積,可獲得重構(gòu)后的清晰增強(qiáng)語音信號(hào),即 X = XZ,
【文檔編號(hào)】G10L21/0272GK103559886SQ201310439143
【公開日】2014年2月5日 申請(qǐng)日期:2013年9月24日 優(yōu)先權(quán)日:2013年9月24日
【發(fā)明者】李平, 卜佳俊, 陳純, 高珊, 王學(xué)慶 申請(qǐng)人:浙江大學(xué)