两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種防干擾聲紋識(shí)別方法和系統(tǒng)與流程

文檔序號(hào):11691853閱讀:597來源:國知局
一種防干擾聲紋識(shí)別方法和系統(tǒng)與流程

本發(fā)明涉及聲紋識(shí)別技術(shù)領(lǐng)域,具體而言,涉及一種防干擾聲紋識(shí)別方法和系統(tǒng)。



背景技術(shù):

隨著電子智能設(shè)備被廣泛的使用,較多的智能設(shè)備中開始集成語音控制的功能,對于語音控制而言,聲紋識(shí)別因?yàn)榫哂形ㄒ恍圆⑶也灰讉卧鞆亩婚_發(fā)者所注意,聲紋識(shí)別具體其包括兩類,分別是:1)說話人辨認(rèn)(speakeridentification)和2)說話人確認(rèn)(speakerverification)。前者用以判斷某段語音是若干人中的哪一個(gè)所說的;而后者用以確認(rèn)某段語音是否是指定的某個(gè)人所說的。在不同的應(yīng)用環(huán)境中可能會(huì)使用到不同的聲紋識(shí)別技術(shù)或者不同技術(shù)的結(jié)合。然而,不可否認(rèn)的是聲紋識(shí)別還不夠完善,比如同一個(gè)人的環(huán)境中,存在的外部干擾源太多,如噪音,或者混合著多個(gè)人的語音,這樣存在著聲紋識(shí)別收到干擾,無論在識(shí)別的精度或者識(shí)別的效率上都給使用者帶來了不好的使用體驗(yàn)。



技術(shù)實(shí)現(xiàn)要素:

根據(jù)現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種防干擾聲紋識(shí)別方法及系統(tǒng)的技術(shù)方案,具體包括:

一種防干擾聲紋識(shí)別方法,其中,包括:

對獲取的語音片段中的語音的聲音強(qiáng)度進(jìn)行分析,將所述聲音強(qiáng)度在一預(yù)設(shè)閾值下的語音進(jìn)行丟棄;

獲取每個(gè)未識(shí)別聲紋中的未識(shí)別聲紋特征,其中,所述未識(shí)別聲紋特征中至少包括所述未識(shí)別聲紋的小波元素;

至少分別根據(jù)每個(gè)所述未識(shí)別聲紋特征與聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征處理得到對應(yīng)于每個(gè)所述未識(shí)別聲紋的辨別度;

分別判斷每個(gè)所述辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留所述辨別度大于所述標(biāo)準(zhǔn)閾值的所述未識(shí)別聲紋;

于被保留的所述未識(shí)別聲紋中,選擇所述辨別度最大的所述未識(shí)別聲紋并識(shí)別為被鎖定聲紋;

所述小波元素包括實(shí)小波元素和/或復(fù)小波元素,其中,所述獲取未識(shí)別聲紋中的未識(shí)別聲紋特征包括:

檢測所述未識(shí)別聲紋中的濁音區(qū)間;

在每個(gè)所述濁音區(qū)間中檢測基音區(qū)間,并在每個(gè)所述基音區(qū)間中獲取所述聲紋特征的所述實(shí)小波元素和/或所述復(fù)小波元素。

優(yōu)選的,該防干擾聲紋識(shí)別方法,其中,在所述提取未識(shí)別聲紋中的未識(shí)別聲紋特征之前,還包括:

在對聲音強(qiáng)度在一預(yù)設(shè)閾值下的語音丟棄之后,在保留的語音中提取所述未識(shí)別聲紋;

至少根據(jù)所述未識(shí)別聲紋特征中的未識(shí)別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識(shí)別模型中與所述未識(shí)別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),

優(yōu)選的,該防干擾聲紋識(shí)別方法,其中,所述未識(shí)別聲紋特征中包括多個(gè)所述未識(shí)別聲紋特征向量,所述標(biāo)準(zhǔn)聲紋特征中包括多個(gè)所述標(biāo)準(zhǔn)聲紋特征向量,其中,所述至少根據(jù)所述未識(shí)別聲紋特征與聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征處理得到所述未識(shí)別聲紋的辨別度包括:

處理得到所述未識(shí)別聲紋特征中的每個(gè)所述未識(shí)別聲紋特征向量與所述標(biāo)準(zhǔn)聲紋特征中每個(gè)與所述未識(shí)別聲紋特征向量相對應(yīng)的所述標(biāo)準(zhǔn)聲紋特征向量的向量距離;

根據(jù)處理得到的多個(gè)所述向量距離處理得到所述未識(shí)別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;

至少利用所述未識(shí)別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離處理得到所述未識(shí)別聲紋的辨別度。

優(yōu)選的,該防干擾聲紋識(shí)別方法,其中,在采集所述未識(shí)別聲紋之前,還包括:

采集多個(gè)聲紋并獲取所述多個(gè)聲紋中每個(gè)聲紋的背景聲紋特征,以構(gòu)建多個(gè)與所述聲紋相對應(yīng)的背景識(shí)別模型,其中,所述背景聲紋特征中包括多個(gè) 背景聲紋特征向量;

根據(jù)所述背景識(shí)別模型構(gòu)建所述標(biāo)準(zhǔn)識(shí)別模型。

優(yōu)選的,該防干擾聲紋識(shí)別方法,其中,所述至少利用所述未識(shí)別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的距離處理得到所述未識(shí)別聲紋的辨別度包括:

處理得到所述未識(shí)別聲紋特征分別與多個(gè)所述背景識(shí)別模型對應(yīng)的每個(gè)所述聲紋的所述背景聲紋特征的背景距離;

根據(jù)多個(gè)所述背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;

處理得到所述未識(shí)別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離與所述距離平均值的差值;

處理得到所述差值與所述距離標(biāo)準(zhǔn)差的比值,將所述比值作為所述未識(shí)別聲紋的所述辨別度。

優(yōu)選的,該防干擾聲紋識(shí)別方法,其中,所述在每個(gè)所述基音區(qū)間中獲取所述聲紋特征的所述實(shí)小波元素和/或所述復(fù)小波元素包括:

在每個(gè)所述基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個(gè)所述基音區(qū)間中的所述特征向量劃分為預(yù)定長度的樣本向量,并將所述預(yù)定長度的樣本向量歸一化;

對歸一化后的所述預(yù)定長度的樣本向量執(zhí)行以下至少一種小波變換:

對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行實(shí)小波變換,以得到第一預(yù)定頻帶的實(shí)部系數(shù),并在所述第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識(shí)別聲紋特征中的所述實(shí)小波元素;

對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行雙樹復(fù)小波變換,以得到第二預(yù)定頻帶的實(shí)部系數(shù)和虛部系數(shù),并在所述第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識(shí)別聲紋特征中的所述復(fù)小波元素。

優(yōu)選的,該防干擾聲紋識(shí)別方法,其中,在檢測所述未識(shí)別聲紋中的濁音區(qū)間之后,所述獲取未識(shí)別聲紋中的未識(shí)別聲紋特征還包括:

獲取所述未識(shí)別聲紋中每一幀的梅爾倒譜系數(shù),以得到所述未識(shí)別聲紋特征中的所述梅爾倒譜系數(shù)特征;

根據(jù)所述梅爾倒譜系數(shù)處理得到所述未識(shí)別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到所述未識(shí)別聲紋特征中的所述差分梅爾倒譜系數(shù)特征。

一種防干擾聲紋識(shí)別系統(tǒng),包括:

第一采集單元,用于采集語音片段;

分析單元,于所述第一采集單元連接,用于對所述語音片段中的多個(gè)語音的的聲音強(qiáng)度進(jìn)行分析,并對應(yīng)獲取每個(gè)語音對應(yīng)的聲音強(qiáng)度;

第一判斷單元,與所述分析單元連接將每個(gè)語音的聲音強(qiáng)度與一預(yù)設(shè)閾值進(jìn)行比較,并輸出判斷結(jié)果;

第一處理單元,與所述判斷單元連接,用于根據(jù)所述判斷結(jié)果,將聲音強(qiáng)度在所述預(yù)設(shè)閾值下的語音進(jìn)行丟棄;

第一獲取單元,與所述第一處理單元連接,用于獲取未識(shí)別聲紋中的未識(shí)別聲紋特征,其中,所述未識(shí)別聲紋特征中至少包括所述未識(shí)別聲紋的小波元素;

處理單元,連接所述獲取單元,用于至少根據(jù)所述未識(shí)別聲紋特征與聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征處理所述未識(shí)別聲紋的辨別度;

判斷單元,連接所述處理單元,用于判斷所述辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留所述辨別度大于所述標(biāo)準(zhǔn)閾值的所述未識(shí)別聲紋;識(shí)別單元,連接所述判斷單元,用于在所述被保留的未識(shí)別聲紋中選擇所述辨別度最高的所述未識(shí)別聲紋,并識(shí)別為被鎖定聲紋;

所述小波元素包括實(shí)小波元素和/或復(fù)小波元素,所述第一獲取單元包括:

檢測模塊,用于檢測所述未識(shí)別聲紋中的濁音區(qū)間;

第一獲取模塊,連接所述檢測模塊,用于在每個(gè)所述濁音區(qū)間中檢測基音區(qū)間,并在每個(gè)所述基音區(qū)間中獲取所述聲紋特征的所述實(shí)小波元素和/或所述復(fù)小波元素。

優(yōu)選的,該防干擾聲紋識(shí)別系統(tǒng),,還包括:

第二獲取單元,用于在獲取所述未識(shí)別聲紋中的未識(shí)別聲紋特征之前,采集所述未識(shí)別聲紋;

調(diào)整單元,連接所述第二獲取單元,用于至少根據(jù)所述未識(shí)別聲紋特征中的未識(shí)別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識(shí)別模型中與所述未識(shí)別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與所述未識(shí)別聲紋相適應(yīng)的所述聲紋識(shí)別模型中的所述標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。

優(yōu)選的,該防干擾聲紋識(shí)別系統(tǒng),,所述未識(shí)別聲紋特征中包括多個(gè)所述未識(shí)別聲紋特征向量,所述標(biāo)準(zhǔn)聲紋特征中包括多個(gè)所述標(biāo)準(zhǔn)聲紋特征向量, 所述處理單元包括:

第一處理模塊,用于處理得到所述未識(shí)別聲紋特征中的每個(gè)所述未識(shí)別聲紋特征向量與所述標(biāo)準(zhǔn)聲紋特征中每個(gè)與所述未識(shí)別聲紋特征向量相對應(yīng)的所述標(biāo)準(zhǔn)聲紋特征向量的向量距離;

第二處理模塊,連接所述第一處理模塊,用于根據(jù)處理得到的多個(gè)所述向量距離處理得到所述未識(shí)別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;

第三處理模塊,連接所述第二處理模塊,用于至少利用所述未識(shí)別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離處理得到所述未識(shí)別聲紋的辨別度。

優(yōu)選的,該防干擾聲紋識(shí)別系統(tǒng),,還包括:

第二采集單元,用于采集多個(gè)聲紋并獲取所述多個(gè)聲紋中每個(gè)聲紋的背景聲紋特征,以構(gòu)建多個(gè)與所述聲紋相對應(yīng)的背景識(shí)別模型,其中,所述背景聲紋特征中包括多個(gè)背景聲紋特征向量;

構(gòu)建單元,連接所述第二采集單元,用于根據(jù)所述背景識(shí)別模型構(gòu)建所述標(biāo)準(zhǔn)識(shí)別模型。

優(yōu)選的,該防干擾聲紋識(shí)別系統(tǒng),,所述第三處理模塊包括:

第一處理子模塊,用于處理得到所述未識(shí)別聲紋特征分別與多個(gè)所述背景識(shí)別模型對應(yīng)的每個(gè)所述聲紋的所述背景聲紋特征的背景距離;

第二處理子模塊,連接所述第一處理子模塊,用于根據(jù)多個(gè)所述背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;

第三處理子模塊,連接所述第二處理子模塊,用于處理得到所述未識(shí)別聲紋特征與所述標(biāo)準(zhǔn)聲紋特征的所述目標(biāo)距離與所述距離平均值的差值;

第四處理子模塊,分別連接所述第二處理子模塊和所述第三處理子模塊,用于處理得到所述差值與所述距離標(biāo)準(zhǔn)差的比值,將所述比值作為所述未識(shí)別聲紋的所述辨別度。

優(yōu)選的,該防干擾聲紋識(shí)別系統(tǒng),,所述第一獲取模塊包括:

第一獲取子模塊,用于在每個(gè)所述基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個(gè)所述基音區(qū)間中的所述特征向量劃分為預(yù)定長度的樣本向量,并將所述預(yù)定長度的樣本向量歸一化;

變換子模塊,連接所述第一獲取子模塊,用于對歸一化后的所述預(yù)定長度的樣本向量執(zhí)行以下至少一種小波變換:

對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行實(shí)小波變換,以得到第一預(yù)定頻帶的實(shí)部系數(shù),并在所述第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識(shí)別聲紋特征中的所述實(shí)小波元素;

對歸一化后的所述預(yù)定長度的樣本向量進(jìn)行雙樹復(fù)小波變換,以得到第二預(yù)定頻帶的實(shí)部系數(shù)和虛部系數(shù),并在所述第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到所述未識(shí)別聲紋特征中的所述復(fù)小波元素。

優(yōu)選的,該防干擾聲紋識(shí)別系統(tǒng),,所述獲取單元還包括:

第二獲取模塊,用于在檢測所述未識(shí)別聲紋中的濁音區(qū)間之后,獲取所述未識(shí)別聲紋中每一幀的梅爾倒譜系數(shù),以得到所述未識(shí)別聲紋特征中的所述梅爾倒譜系數(shù)特征;

第四處理模塊,連接所述第二獲取模塊,用于根據(jù)所述梅爾倒譜系數(shù)處理得到所述未識(shí)別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到所述未識(shí)別聲紋特征中的所述差分梅爾倒譜系數(shù)特征。

上述技術(shù)方案的有益效果是:提高了聲紋識(shí)別的精度以及識(shí)別的穩(wěn)定性,克服了現(xiàn)有技術(shù)中外界噪聲容易對聲紋識(shí)別造成干擾的缺陷。

附圖說明

圖1是本發(fā)明的優(yōu)選的實(shí)施例中,一種防干擾聲紋識(shí)的總體流程圖;

圖2是本發(fā)明的優(yōu)選的實(shí)施例中,構(gòu)造標(biāo)準(zhǔn)聲紋特征向量的流程圖;

圖3是本發(fā)明的一個(gè)優(yōu)選的實(shí)施例中,處理得到辨別度的流程圖;

圖4是本發(fā)明的優(yōu)選的實(shí)施例中,處理得到標(biāo)準(zhǔn)識(shí)別模型的流程圖;

圖5是本發(fā)明的一個(gè)優(yōu)選的實(shí)施例中,處理得到辨別度的流程圖;

圖6是本發(fā)明的優(yōu)選的實(shí)施例中,提取未識(shí)別聲紋特征的流程圖;

圖7是本發(fā)明的優(yōu)選的實(shí)施例中,在每個(gè)基音區(qū)間內(nèi)提取小波元素的流程圖;

圖8是本發(fā)明的優(yōu)選的實(shí)施例中,獲得差分梅爾倒譜系數(shù)特征的流程圖;

圖9是本發(fā)明的優(yōu)選的實(shí)施例中,檢測濁音區(qū)間后獲取未識(shí)別聲紋特征的流程圖;

圖10為本發(fā)明的優(yōu)選的實(shí)施例中,一種防干擾聲紋識(shí)別系統(tǒng)的結(jié)構(gòu)圖;

圖11是本發(fā)明的優(yōu)選的實(shí)施例中,系統(tǒng)中的第二處理單元的結(jié)構(gòu)圖;

圖12是本發(fā)明的優(yōu)選的實(shí)施例中,第二處理單元中的第三處理模塊的結(jié)構(gòu)圖

圖13是本發(fā)明的優(yōu)選的實(shí)施例中,第一獲取單元中的第一獲取模塊的結(jié)構(gòu)圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

需要說明的是,在不沖突的情況下,本發(fā)明中的實(shí)施例及實(shí)施例中的特征可以相互組合。

下面結(jié)合附圖和具體實(shí)施例對本發(fā)明作進(jìn)一步說明,但不作為本發(fā)明的限定。

需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

本發(fā)明的優(yōu)選的實(shí)施例中,提供了一種防干擾聲紋識(shí)別方法,如圖1所示,該方法包括:

步驟s1,對獲取的語音片段中的語音的聲音強(qiáng)度進(jìn)行分析;

步驟s2,將所述聲音強(qiáng)度在一預(yù)設(shè)閾值下的語音進(jìn)行丟棄

步驟s3,獲取未識(shí)別聲紋中的未識(shí)別聲紋特征,其中,未識(shí)別聲紋特征中至少包括未識(shí)別聲紋的小波元素;

步驟s4,至少分別根據(jù)每個(gè)未識(shí)別聲紋特征與聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征處理得到對應(yīng)于每個(gè)未識(shí)別聲紋的辨別度;

步驟s5,分別判斷每個(gè)辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留辨別度大于標(biāo)準(zhǔn)閾值的未識(shí)別聲紋;

步驟s6,于被保留的未識(shí)別聲紋中,選擇辨別度最大的未識(shí)別聲紋并識(shí)別為被鎖定聲紋。

本發(fā)明的優(yōu)選的實(shí)施例中,在聲紋識(shí)別的過程中,往往識(shí)別的環(huán)境不是一個(gè)絕對的較理想的環(huán)境,在不同的環(huán)境中皆存在不同的干擾源,如在家中存在的識(shí)別干擾源分別有電視機(jī)的聲音或者在識(shí)別聲紋時(shí)混雜著其他人的聲音,進(jìn)而對識(shí)別造成了干擾,影響了識(shí)別的精度,因此本發(fā)明對獲取的語音片段進(jìn)行分析,將語音片源中聲音強(qiáng)度在一預(yù)設(shè)閾值下的語音進(jìn)行丟棄,保留聲音強(qiáng)度在預(yù)設(shè)閾值上的語音,進(jìn)而對聲音強(qiáng)度在預(yù)設(shè)閾值上的語音進(jìn)行聲紋識(shí)別,從而有效的控制了外界聲音對識(shí)別聲紋造成干擾,提高了識(shí)別精度。

上述防干擾聲紋識(shí)別方法可以但不限于應(yīng)用于擺放在私密的個(gè)人空間中的智能設(shè)備上對有限的幾個(gè)使用者的聲紋進(jìn)行識(shí)別,還可以應(yīng)用于將該智能設(shè)備擺放在相對開放的空間中,同樣供有限的幾個(gè)使用者的聲紋進(jìn)行識(shí)別。在上述應(yīng)用環(huán)境中,可能存在多個(gè)未識(shí)別聲紋進(jìn)行識(shí)別,同樣地可能存在多個(gè)辨別度大于上述標(biāo)準(zhǔn)閾值的未識(shí)別聲紋(即通??梢宰鳛楸绘i定聲紋進(jìn)行識(shí)別)。然而對于一臺(tái)智能設(shè)備而言,最佳的狀況為在同一時(shí)間僅根據(jù)一位使用者的語音指令進(jìn)行操作,否則可能會(huì)對使用者的使用體驗(yàn)造成不好的影響。本發(fā)明的優(yōu)選的實(shí)施例中,上述未識(shí)別聲紋特征中包括小波元素,也就是說,在原有特征的基礎(chǔ)上結(jié)合聲紋的小波元素,從而提高防干擾聲紋識(shí)別系統(tǒng)的精確性和穩(wěn)定性。進(jìn)而克服了現(xiàn)有的聲紋識(shí)別方式的識(shí)別結(jié)果因容易受各種因素干擾而造成識(shí)別不準(zhǔn)確的問題。進(jìn)一步,通過直接與聲紋識(shí)別模型進(jìn)行比較,減小了模型構(gòu)建的復(fù)雜度和構(gòu)建周期,從而提高了聲紋識(shí)別的穩(wěn)定性和識(shí)別效率。關(guān)于上述小波元素在下文中詳述。

本發(fā)明的優(yōu)選的實(shí)施例中,上述未識(shí)別聲紋中的未識(shí)別聲紋特征可以包括多個(gè)未識(shí)別聲紋特征向量。相應(yīng)地,上述標(biāo)準(zhǔn)聲紋特征中也可以包括多個(gè)標(biāo)準(zhǔn)聲紋特征向量。

更進(jìn)一步地,在本實(shí)施例中,上述未識(shí)別聲紋特征可以包括下文中所述的內(nèi)容,但其組成并不限于下文中所述的內(nèi)容:

4個(gè)實(shí)小波元素、4個(gè)雙樹復(fù)小波元素、梅爾倒譜系數(shù)特征以及差分梅爾倒譜系數(shù)特征。

其中,上述小波元素中包括實(shí)小波和復(fù)小波中的至少一種。

本發(fā)明的優(yōu)選的實(shí)施例中,上述聲紋識(shí)別模型可以包括下文中所述的內(nèi)容:

根據(jù)未識(shí)別聲紋中的多個(gè)聲紋特征向量(未識(shí)別聲紋特征向量)對標(biāo)準(zhǔn)識(shí)別模型進(jìn)行調(diào)整后,得到與未識(shí)別聲紋相適應(yīng)的用于識(shí)別上述未識(shí)別聲紋的標(biāo)準(zhǔn)識(shí)別模型。

上述標(biāo)準(zhǔn)識(shí)別模型可以包括:采集關(guān)聯(lián)于多人的不同的聲紋,并從每個(gè)人的聲紋中獲取相應(yīng)的聲紋特征。隨后根據(jù)不同的聲紋特征分別構(gòu)建與每個(gè)人的聲紋相對應(yīng)的背景識(shí)別模型,再對上述多個(gè)背景識(shí)別模型中的背景聲紋特征進(jìn)行聚類,進(jìn)而構(gòu)建標(biāo)準(zhǔn)識(shí)別模型,例如通用背景模型(universalbackgroundmode,ubm)。

本發(fā)明的一個(gè)優(yōu)選的實(shí)施例中,例如,一個(gè)聲紋特征中包括10個(gè)聲紋特征向量(即10類特征),則采集多人的聲紋后,從每個(gè)人的聲紋中獲取上述10類特征,然后對每類特征進(jìn)行聚類(例如,包括32個(gè)中心)。隨后,根據(jù)聚類得到的結(jié)果獲得包含32碼字的10個(gè)碼本(即10個(gè)聲紋特征向量對應(yīng)的聲紋特征參數(shù))的ubm模型。進(jìn)一步,每個(gè)說話人還可根據(jù)自身的聲紋特征構(gòu)建相應(yīng)的背景識(shí)別模型。

本發(fā)明的優(yōu)選的實(shí)施例中,在獲取未識(shí)別聲紋中的未識(shí)別聲紋特征之前,還包括如圖2所示的下述步驟:

步驟a1,在對聲音強(qiáng)度在一預(yù)設(shè)閾值下的語音丟棄之后,在保留的語音中提取提取未識(shí)別聲紋;

步驟a2,至少根據(jù)未識(shí)別聲紋特征中的未識(shí)別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識(shí)別模型中與未識(shí)別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與未識(shí)別聲紋相適應(yīng)的聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。

本發(fā)明的優(yōu)選的實(shí)施例中,上述采集未識(shí)別聲紋的方式可以包括下述幾種方式:采用聲音采集裝置(例如麥克風(fēng))采集具有預(yù)設(shè)時(shí)長的待識(shí)別人聲(例如采集持續(xù)5秒的人聲),其中,采用的音頻的格式是采樣率16khz、 量化深度16位,且為單聲道。

本發(fā)明的優(yōu)選的實(shí)施例中,上述未識(shí)別聲紋特征中可以包括多個(gè)未識(shí)別聲紋特征向量,同樣地,上述標(biāo)準(zhǔn)聲紋特征中可以包括多個(gè)標(biāo)準(zhǔn)聲紋特征向量。例如,每個(gè)未識(shí)別聲紋特征中包括10個(gè)vq碼本,也就是說,每個(gè)未識(shí)別聲紋特征向量對應(yīng)一個(gè)vq碼本,其中,每個(gè)vq碼本對應(yīng)一組特征集。同樣地,每個(gè)標(biāo)準(zhǔn)聲紋特征中也可以包括10個(gè)vq碼本,每個(gè)標(biāo)準(zhǔn)聲紋特征向量對應(yīng)一個(gè)vq碼本。

則本發(fā)明的優(yōu)選的實(shí)施例中,可以根據(jù)上述未識(shí)別聲紋特征中的多個(gè)未識(shí)別聲紋特征向量調(diào)整標(biāo)準(zhǔn)識(shí)別模型,以得到與未識(shí)別聲紋相適應(yīng)的聲紋識(shí)別模型,從而便于利用上述聲紋識(shí)別模型實(shí)現(xiàn)對之后采集的聲紋進(jìn)行識(shí)別。

通過本發(fā)明的優(yōu)選的實(shí)施例,在獲取未識(shí)別聲紋中的未識(shí)別聲紋特征之前,通過調(diào)整上述標(biāo)準(zhǔn)識(shí)別模型來得到與未識(shí)別聲紋相適應(yīng)的聲紋識(shí)別模型,實(shí)現(xiàn)對未識(shí)別聲紋的預(yù)先注冊,從而使得在聲紋識(shí)別時(shí)可以根據(jù)預(yù)先注冊的聲紋識(shí)別模型直接進(jìn)行準(zhǔn)確識(shí)別,減小了模型構(gòu)建的復(fù)雜度和構(gòu)建周期,進(jìn)而提高了聲紋識(shí)別的可靠性及效率。

本發(fā)明的優(yōu)選的實(shí)施例中,未識(shí)別聲紋特征中包括多個(gè)未識(shí)別聲紋特征向量,標(biāo)準(zhǔn)聲紋特征中包括多個(gè)標(biāo)準(zhǔn)聲紋特征向量,其中,至少根據(jù)未識(shí)別聲紋特征與聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征處理得到未識(shí)別聲紋的辨別度如圖3所示,包括:

步驟b1,處理得到未識(shí)別聲紋特征中的每個(gè)未識(shí)別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征中每個(gè)與未識(shí)別聲紋特征向量相對應(yīng)的標(biāo)準(zhǔn)聲紋特征向量的向量相似度;

步驟b2,根據(jù)處理得到的多個(gè)向量相似度處理得到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;

步驟b3,至少利用未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離處理得到未識(shí)別聲紋的辨別度。

本發(fā)明的優(yōu)選的實(shí)施例中,上述處理得到未識(shí)別聲紋特征中的未識(shí)別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量的向量相似度包括:處理得到未識(shí)別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征向量之間的距離。

具體地,例如,未識(shí)別聲紋的未識(shí)別聲紋特征中的未識(shí)別聲紋特征向量 與聲紋識(shí)別模型的標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量之間的向量距離為a,對多個(gè)向量距離進(jìn)行歸一化處理,并加權(quán)求和得到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離s。至少根據(jù)上述到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離s處理得到未識(shí)別聲紋特征的辨別度。本發(fā)明的優(yōu)選的實(shí)施例中,上述權(quán)重可以根據(jù)不同特征向量的重要程度預(yù)先設(shè)置,本發(fā)明的其他實(shí)施例中,上述權(quán)重可以采用其他適宜的方式設(shè)置或者處理得到。

本發(fā)明的優(yōu)選的實(shí)施例中,通過處理得到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征中多個(gè)聲紋特征向量的向量距離,對多個(gè)向量距離進(jìn)行加權(quán)求和后準(zhǔn)確處理得到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離,進(jìn)而保證了聲紋辨別度的準(zhǔn)確性。

本發(fā)明的較佳的實(shí)施例中,,在采集未識(shí)別聲紋之前,還包括如圖4所示的下述步驟:

步驟c1,采集多個(gè)聲紋并獲取多個(gè)聲紋中每個(gè)聲紋的背景聲紋特征,以構(gòu)建多個(gè)與聲紋相對應(yīng)的背景識(shí)別模型,其中,背景聲紋特征中包括多個(gè)背景聲紋特征向量;

步驟c2,根據(jù)背景識(shí)別模型構(gòu)建標(biāo)準(zhǔn)識(shí)別模型。

具體地,本發(fā)明的優(yōu)選的實(shí)施例中,采集多個(gè)使用者說話時(shí)的聲紋,并以此構(gòu)建多個(gè)背景識(shí)別模型,從而實(shí)現(xiàn)根據(jù)背景識(shí)別模型構(gòu)建包含多人聲紋特征的標(biāo)準(zhǔn)識(shí)別模型,以便于預(yù)先構(gòu)建用于聲紋識(shí)別的聲紋識(shí)別模型,進(jìn)而達(dá)到了縮短模型構(gòu)建周期,提高聲紋識(shí)別效率的目的。

本發(fā)明的優(yōu)選的實(shí)施例中,可以利用未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的距離處理得到未識(shí)別聲紋的辨別度,其步驟如圖5所示,包括:

步驟d1,處理得到未識(shí)別聲紋特征分別與多個(gè)背景識(shí)別模型對應(yīng)的每個(gè)聲紋的背景聲紋特征的背景距離;

步驟d2,根據(jù)多個(gè)背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;

步驟d3,處理得到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離與距離平均值的差值;

步驟d4,處理得到差值與距離標(biāo)準(zhǔn)差的比值,將比值作為未識(shí)別聲紋的辨別度。

本發(fā)明的優(yōu)選的實(shí)施例中,假設(shè)未識(shí)別聲紋的未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲 紋特征的目標(biāo)距離用s標(biāo)識(shí),共采集i個(gè)聲紋構(gòu)建i個(gè)背景識(shí)別模型,其中,未識(shí)別聲紋特征與i個(gè)聲紋對應(yīng)的i個(gè)背景聲紋特征的背景距離分別是d1,d2,d3,…di,進(jìn)一步,通過處理得到得到上述多個(gè)背景距離的距離平均值為u,距離標(biāo)準(zhǔn)差為σ。則通過以下公式處理得到未識(shí)別聲紋的辨別度:

s’=(s-u)/σ(1)

進(jìn)一步,判斷上述識(shí)別聲紋的辨別度s’與預(yù)設(shè)的標(biāo)準(zhǔn)閾值的大小關(guān)系,若判斷出大于標(biāo)準(zhǔn)閾值,則認(rèn)為未識(shí)別聲紋為被鎖定聲紋。

需要說明的是,由于采集未識(shí)別聲紋與構(gòu)建聲紋識(shí)別模型的硬件環(huán)境與條件可能發(fā)生變化,例如,采用的麥克風(fēng)設(shè)備的型號(hào)發(fā)生變化,則可能導(dǎo)致未識(shí)別聲紋的未識(shí)別聲紋特征與聲紋識(shí)別模型的標(biāo)準(zhǔn)聲紋特征之間產(chǎn)生較大變化,進(jìn)而影響對未識(shí)別聲紋的判斷,因而,進(jìn)一步結(jié)合背景識(shí)別模型中的聲紋特征處理得到未識(shí)別聲紋的辨別度,進(jìn)一步保證了未識(shí)別聲紋的辨別度的準(zhǔn)確性。

具體如本發(fā)明的一個(gè)優(yōu)選的實(shí)施例中所述,如果采用與構(gòu)建背景識(shí)別模型相同的聲卡、麥克風(fēng)等設(shè)備進(jìn)行錄音采集,此時(shí)錄音后獲取的未識(shí)別聲紋的聲紋特征與聲紋識(shí)別模型的距離較近,與背景識(shí)別模型的距離也較近,而如果采用與構(gòu)建背景識(shí)別模型不同的聲卡、麥克風(fēng)等設(shè)備進(jìn)行錄音采集,錄音后獲取特征的未識(shí)別聲紋與聲紋識(shí)別模型的距離則較遠(yuǎn),與背景識(shí)別模型的距離也較遠(yuǎn),然而,雖然距離都較遠(yuǎn),但是與聲紋識(shí)別模型的距離相比較來說未識(shí)別聲紋與背景識(shí)別模型的距離還是更接近。

本發(fā)明的優(yōu)選的實(shí)施例中,通過結(jié)合預(yù)先訓(xùn)練的聲紋識(shí)別模型與背景識(shí)別模型處理得到未識(shí)別聲紋的辨別度,從而克服了由于采集未識(shí)別聲紋的環(huán)境與條件發(fā)生變化所導(dǎo)致的未識(shí)別聲紋的辨別度計(jì)算不準(zhǔn)確的問題。

本發(fā)明的優(yōu)選的實(shí)施例中,如上文中所述,上述小波元素包括實(shí)小波元素和/或復(fù)小波元素,則獲取未識(shí)別聲紋中的未識(shí)別聲紋特征的步驟如圖6所示,包括:

步驟e1,檢測未識(shí)別聲紋中的濁音區(qū)間;

步驟e2,在每個(gè)濁音區(qū)間中檢測基音區(qū)間,并在每個(gè)基音區(qū)間中獲取聲紋特征的實(shí)小波元素和/或復(fù)小波元素。

進(jìn)一步地,在該實(shí)施例中,上述在每個(gè)基音區(qū)間中獲取聲紋特征的實(shí)小波元素和/或復(fù)小波元素的步驟具體如圖7所示,包括:

步驟e21,在每個(gè)基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個(gè)基音區(qū)間中的特征向量劃分為預(yù)定長度的樣本向量,并將預(yù)定長度的樣本向量歸一化;

步驟e22,對歸一化后的預(yù)定長度的樣本向量執(zhí)行小波變換;

具體地,上述步驟e22中,采用下文中所述的方式執(zhí)行小波變換:

1)對歸一化后的預(yù)定長度的樣本向量進(jìn)行實(shí)小波變換,以得到第一預(yù)定頻帶的實(shí)部系數(shù),并在第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到未識(shí)別聲紋特征中的實(shí)小波元素;

2)對歸一化后的預(yù)定長度的樣本向量進(jìn)行雙樹的復(fù)小波變換,以得到第二預(yù)定頻帶的實(shí)部系數(shù)和虛部系數(shù),并在第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到未識(shí)別聲紋特征中的復(fù)小波元素。

本發(fā)明的優(yōu)選的實(shí)施例中,可以根據(jù)所采用的小波濾波器的長度確定上述樣本向量。

本發(fā)明的優(yōu)選的實(shí)施例中,在檢測未識(shí)別聲紋中的濁音區(qū)間之后,上述獲取未識(shí)別聲紋中的未識(shí)別聲紋特征的步驟如圖8所示,還包括:

步驟f1,獲取未識(shí)別聲紋中每一幀的梅爾倒譜系數(shù),以得到未識(shí)別聲紋特征中的梅爾倒譜系數(shù)特征;

步驟f2,根據(jù)梅爾倒譜系數(shù)處理得到未識(shí)別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到未識(shí)別聲紋特征中的差分梅爾倒譜系數(shù)特征。

本發(fā)明的一個(gè)優(yōu)選的實(shí)施例中,例如上文中所述的,對未識(shí)別聲紋進(jìn)行濁音區(qū)間檢測,然后進(jìn)行預(yù)加重處理。所謂預(yù)加重處理,其實(shí)是利用一種高通濾波器進(jìn)行的處理,其具體的公式如下文中所述:

y(n)=x(n)-0.9375*x(n-1)(2)

則如上文中所述,對預(yù)加重處理后的聲紋進(jìn)行特征提取,在進(jìn)行3階實(shí)小波變換、3階雙數(shù)復(fù)小波變換、獲取梅爾倒譜系數(shù),根據(jù)梅爾倒譜系數(shù)進(jìn)行處理等多個(gè)處理步驟之后處理得到差分梅爾倒譜系數(shù),進(jìn)而得到10組20維的聲紋特征向量。

本發(fā)明的優(yōu)選的實(shí)施例中,通過獲取聲紋特征中的小波元素,實(shí)現(xiàn)在原有特征的基礎(chǔ)上結(jié)合小波元素構(gòu)成新特征,由于小波元素能夠反映原有特征不能使用的語音特征,因此實(shí)現(xiàn)提高了防干擾聲紋識(shí)別系統(tǒng)的精確性和穩(wěn)定性。

具體地,以聲紋識(shí)別模型中的聲紋特征中包括10個(gè)聲紋特征向量為示例進(jìn)行下文中的描述:

例如,從數(shù)十個(gè)說話人的語音數(shù)據(jù)中獲取的特征分別構(gòu)建背景識(shí)別模型,其中,背景識(shí)別模型中包括10個(gè)vq碼本,每個(gè)vq碼本中10個(gè)特征,如美爾倒譜、差分美爾倒譜和4個(gè)實(shí)小波元素、4個(gè)復(fù)小波元素,每個(gè)特征為20維向量。進(jìn)一步根據(jù)背景識(shí)別模型構(gòu)建ubm模型。進(jìn)一步,對未識(shí)別聲紋進(jìn)行注冊,采集未識(shí)別聲紋并從中獲取特征,通過ubm模型的vq碼本適應(yīng)每個(gè)特征組,進(jìn)而構(gòu)造出聲紋識(shí)別模型中的vq碼本(即標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量)。

進(jìn)一步,獲取每個(gè)碼本中的梅爾倒譜系數(shù)、差分梅爾倒譜系數(shù)和8個(gè)小波元素(4個(gè)實(shí)小波和4個(gè)復(fù)合小波)。

具體而言,在輸入信號(hào){s(i):i=0,...,n-1}中檢測濁音區(qū)間;使用能量,如低、高頻帶的能量比,過零率來檢測濁音區(qū)間。再對輸入信號(hào)進(jìn)行預(yù)加重處理。

s′(i)=s(i)-0.9375*s(i-1),i=1,...,n-1;

然后對預(yù)加重處理后的聲紋執(zhí)行如圖9所示的下述操作:

步驟g1,處理得到每幀的美爾倒譜系數(shù),每幀有360個(gè)樣本,幀間隔為180個(gè)樣本。

處理得到出來的美爾倒譜向量的維度是20。

{mfcci,i=0,...,nm-1};

{mfcci={mfcci(k)};k=0,...,19};

步驟g2,對于每幀,處理得到美爾倒譜向量的差分構(gòu)成差分美爾倒譜向量。

dmfcci=mfcci+2-mfcci-2;

步驟g3,在每個(gè)濁音區(qū)間都要檢測基音區(qū)間,對獲得的每個(gè)基音區(qū)間,處理得到基音同步的實(shí)小波和復(fù)小波元素。

其中,在輸入語音信號(hào){s(i):i=0,...,n-1}中檢測到的基音區(qū)間和最大峰值。其中n是語音區(qū)間的長度,np是基音區(qū)間的數(shù)量,每個(gè)基音區(qū)間的起始位置和長度如下:

{pit_st(i):i=0,...,np-1};

{pit_ln(i):i=0,...,np-1};

進(jìn)一步,實(shí)小波的處理方式如下:

對每個(gè)基音區(qū)間獲取4個(gè)20維的特征向量,對于每個(gè)基音區(qū)間,裁剪出包含那個(gè)區(qū)間和其之前和之后的兩組一定數(shù)量的樣本的區(qū)間,得到如下向量:

{s(pit_st(i)-l1),...,s(pit_st(i)+(pit_ln(i)+l1},i=0,...,np-1;

然后,將該向量歸一化使其范數(shù)為1。

對于上述向量,進(jìn)行一個(gè)三階段實(shí)小波(例如daubechies小波)包變換得到八個(gè)系數(shù)序列:

{rwi0},i=1,...,8;

{rwi0}={rwi0(k)},k=1,...,m;

每個(gè)對應(yīng)一個(gè)特定的頻帶,每個(gè)系數(shù)序列長度相同,且長度相當(dāng)于1/8的基音區(qū)間長度。

在上述得到的8個(gè)序列中,對應(yīng)于低頻帶的4個(gè)序列進(jìn)行重采樣,產(chǎn)生4個(gè)20維的向量:

{rwi},i=1,...,4;

rwi={rwi(k)}k=1,...,20;

進(jìn)一步,復(fù)小波的處理得到方式如下:

對每個(gè)基音區(qū)間獲取4個(gè)20維特征向量,對于每個(gè)基音區(qū)間,裁剪除包含那個(gè)區(qū)間和其之前和之后的兩組一定數(shù)量的樣本的區(qū)間,得到的向量歸一化使其范數(shù)為1。

對于上述區(qū)間,做一個(gè)三階段的雙樹復(fù)小波包變換(dt-cwpt),以得到對應(yīng)于8個(gè)頻帶的系數(shù),每個(gè)頻帶有實(shí)部系數(shù)和虛部系數(shù),其中,每個(gè)系數(shù)序列長度相同,且長度相當(dāng)于1/8的基音區(qū)間長度。對于每個(gè)頻帶,由實(shí)部和虛部序列得到一個(gè)絕對值序列。

在上述得到的8個(gè)序列中,對應(yīng)于低頻帶的4個(gè)序列進(jìn)行重采樣,產(chǎn)生4個(gè)20維的向量:

{cwi},i=1,...,4;

cwi={cw(k)i}k=1,...,20;

步驟g4,根據(jù)上述獲取出的10組特征集,采用測試標(biāo)準(zhǔn)方法進(jìn)行歸一化處理,已得到未識(shí)別聲紋與聲紋識(shí)別模型的相似度,當(dāng)判斷出相似度大于標(biāo)準(zhǔn)閾值時(shí),則可識(shí)別出為同一聲紋,即待識(shí)別的說話人與所構(gòu)建的聲紋識(shí)別模型中的是同一人。

本發(fā)明的優(yōu)選的實(shí)施例中,基于上文中所述的防干擾聲紋識(shí)別方法,還提供一種防干擾聲紋識(shí)別系統(tǒng)a,其結(jié)構(gòu)具體如圖9所示,包括:

第一采集單元1,用于采集語音片段;

分析單元2,于第一采集單元連接,用于對語音片段中的多個(gè)語音的的聲音強(qiáng)度進(jìn)行分析,并對應(yīng)獲取每個(gè)語音對應(yīng)的聲音強(qiáng)度;

第一判斷單元3,與分析單元連接將每個(gè)語音的聲音強(qiáng)度與一預(yù)設(shè)閾值進(jìn)行比較,并輸出判斷結(jié)果;

第一處理單元4,與判斷單元連接,用于根據(jù)判斷結(jié)果,將聲音強(qiáng)度在預(yù)設(shè)閾值下的語音進(jìn)行丟棄;

第一獲取單元5,與第一處理單元4連接,用于獲取未識(shí)別聲紋中的未識(shí)別聲紋特征,其中,未識(shí)別聲紋特征中至少包括未識(shí)別聲紋的小波元素;

第二處理單元6,連接第一獲取單元5,用于至少根據(jù)未識(shí)別聲紋特征與聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征處理未識(shí)別聲紋的辨別度;

第二判斷單元7,連接第二處理單元6,用于判斷辨別度是否大于一預(yù)設(shè)的標(biāo)準(zhǔn)閾值,并保留辨別度大于標(biāo)準(zhǔn)閾值的未識(shí)別聲紋;

識(shí)別單元8,連接第二判斷單元7,用于在被保留的未識(shí)別聲紋中選擇辨別度最高的未識(shí)別聲紋,并識(shí)別為被鎖定聲紋;

小波元素包括實(shí)小波元素和/或復(fù)小波元素,第一獲取單元5進(jìn)一步包括:

檢測模塊51,用于檢測未識(shí)別聲紋中的濁音區(qū)間;

第一獲取模塊52,連接檢測模塊51,用于在每個(gè)濁音區(qū)間中檢測基音區(qū)間,并在每個(gè)基音區(qū)間中獲取聲紋特征的實(shí)小波元素和/或復(fù)小波元素。

本發(fā)明的優(yōu)選的實(shí)施例中,仍然如圖9所示,上述系統(tǒng)a還包括:

第二獲取單元9,用于在獲取未識(shí)別聲紋中的未識(shí)別聲紋特征之前,采 集未識(shí)別聲紋;

調(diào)整單元10,連接第二獲取單元1,用于至少根據(jù)未識(shí)別聲紋特征中的未識(shí)別聲紋特征向量調(diào)整預(yù)先構(gòu)建的標(biāo)準(zhǔn)識(shí)別模型中與未識(shí)別聲紋特征向量對應(yīng)的聲紋特征向量參數(shù),以構(gòu)造出與未識(shí)別聲紋相適應(yīng)的聲紋識(shí)別模型中的標(biāo)準(zhǔn)聲紋特征中的標(biāo)準(zhǔn)聲紋特征向量。

本發(fā)明的優(yōu)選的實(shí)施例中,未識(shí)別聲紋特征中包括多個(gè)未識(shí)別聲紋特征向量,標(biāo)準(zhǔn)聲紋特征中包括多個(gè)標(biāo)準(zhǔn)聲紋特征向量。

則上述第二處理單元6如圖11所示,具體包括:

第一處理模塊61,用于處理得到未識(shí)別聲紋特征中的每個(gè)未識(shí)別聲紋特征向量與標(biāo)準(zhǔn)聲紋特征中每個(gè)與未識(shí)別聲紋特征向量相對應(yīng)的標(biāo)準(zhǔn)聲紋特征向量的向量距離;

第二處理模塊62,連接第一處理模塊61,用于根據(jù)處理得到的多個(gè)向量距離處理得到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離;

第三處理模塊63,連接第二處理模塊62,用于至少利用未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離處理得到未識(shí)別聲紋的辨別度。

本發(fā)明的優(yōu)選的實(shí)施例中,仍然如圖10所示,上述系統(tǒng)中還包括:

第二采集單元11,用于采集多個(gè)聲紋并獲取多個(gè)聲紋中每個(gè)聲紋的背景聲紋特征,以構(gòu)建多個(gè)與聲紋相對應(yīng)的背景識(shí)別模型,其中,背景聲紋特征中包括多個(gè)背景聲紋特征向量;

構(gòu)建單元12,連接第二采集單元11,用于根據(jù)背景識(shí)別模型構(gòu)建標(biāo)準(zhǔn)識(shí)別模型。

進(jìn)一步地,本發(fā)明的優(yōu)選的實(shí)施例中,如圖12所示,上述第三處理模塊63包括:

第一處理子模塊631,用于處理得到未識(shí)別聲紋特征分別與多個(gè)背景識(shí)別模型對應(yīng)的每個(gè)聲紋的背景聲紋特征的背景距離;

第二處理子模塊632,連接第一處理子模塊631,用于根據(jù)多個(gè)背景距離處理得到距離平均值及距離標(biāo)準(zhǔn)差;

第三處理子模塊633,連接第二處理子模塊632,用于處理得到未識(shí)別聲紋特征與標(biāo)準(zhǔn)聲紋特征的目標(biāo)距離與距離平均值的差值;

第四處理子模塊634,分別連接第二處理子模塊632和第三處理子模塊 633,用于處理得到差值與距離標(biāo)準(zhǔn)差的比值,將比值作為未識(shí)別聲紋的辨別度。

本發(fā)明的優(yōu)選的實(shí)施例中,如圖13所示,上文中的第一獲取模塊52包括:

第一獲取子模塊521,用于在每個(gè)基音區(qū)間中獲取預(yù)定的特征向量,并根據(jù)小波濾波器將多個(gè)基音區(qū)間中的特征向量劃分為預(yù)定長度的樣本向量,并將預(yù)定長度的樣本向量歸一化;

變換子模塊522,連接第一獲取子模塊521,用于對歸一化后的預(yù)定長度的樣本向量執(zhí)行以下至少一種小波變換:

對歸一化后的預(yù)定長度的樣本向量進(jìn)行實(shí)小波變換,以得到第一預(yù)定頻帶的實(shí)部系數(shù),并在第一預(yù)定頻帶中選擇滿足第一預(yù)定條件的頻帶進(jìn)行采樣,以得到未識(shí)別聲紋特征中的實(shí)小波元素;

對歸一化后的預(yù)定長度的樣本向量進(jìn)行雙樹復(fù)小波變換,以得到第二預(yù)定頻帶的實(shí)部系數(shù)和虛部系數(shù),并在第二預(yù)定頻帶中選擇滿足第二預(yù)定條件的頻帶進(jìn)行采樣,以得到未識(shí)別聲紋特征中的復(fù)小波元素。

本發(fā)明的優(yōu)選的實(shí)施例中,仍然如圖10所示,上文中所述的第一獲取單元5還包括:

第二獲取模塊53,用于在檢測未識(shí)別聲紋中的濁音區(qū)間之后,獲取未識(shí)別聲紋中每一幀的梅爾倒譜系數(shù),以得到未識(shí)別聲紋特征中的梅爾倒譜系數(shù)特征;

第四處理模塊54,連接第二獲取模塊53,用于根據(jù)梅爾倒譜系數(shù)處理得到未識(shí)別聲紋中每一幀的差分梅爾倒譜系數(shù)特征,以得到未識(shí)別聲紋特征中的差分梅爾倒譜系數(shù)特征。上述本發(fā)明優(yōu)選的實(shí)施例僅僅為了描述,不代表實(shí)施例的優(yōu)劣。

需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。

在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有 詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。

在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),可通過其它的方式實(shí)現(xiàn)。例如,以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,系統(tǒng)或單元的間接耦合或通信連接,可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、移動(dòng)終端、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

上述技術(shù)方案的有益效果是:提高了聲紋識(shí)別的精度以及識(shí)別的穩(wěn)定性,克服了現(xiàn)有技術(shù)中外界噪聲容易對聲紋識(shí)別造成干擾。

以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本 領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

以上所述僅為本發(fā)明較佳的實(shí)施例,并非因此限制本發(fā)明的實(shí)施方式及保護(hù)范圍,對于本領(lǐng)域技術(shù)人員而言,應(yīng)當(dāng)能夠意識(shí)到凡運(yùn)用本發(fā)明說明書及圖示內(nèi)容所作出的等同替換和顯而易見的變化所得到的方案,均應(yīng)當(dāng)包含在本發(fā)明的保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
泰来县| 丰县| 金平| 神农架林区| 昭苏县| 宣武区| 库伦旗| 石景山区| 彩票| 惠安县| 伽师县| 彩票| 定远县| 江川县| 甘洛县| 时尚| 太仓市| 开平市| 奎屯市| 乌拉特后旗| 柞水县| 闸北区| 合肥市| 黄石市| 靖江市| 云和县| 连州市| 鄂温| 松溪县| 华坪县| 高碑店市| 勃利县| 甘谷县| 景德镇市| 嘉禾县| 东乌珠穆沁旗| 固阳县| 天镇县| 江西省| 贵定县| 津市市|