一種聲紋采集和處理系統(tǒng)及其采集和處理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種音頻處理領(lǐng)域,特別是一種聲紋采集和處理系統(tǒng)及其采集和處理方法。
【背景技術(shù)】
[0002]目前,聲音識(shí)別技術(shù)被廣泛應(yīng)用于多個(gè)領(lǐng)域,如安防、鑒權(quán)系統(tǒng)、目標(biāo)認(rèn)證、智能家居等。聲音是每個(gè)人特有的生物特征,不會(huì)被復(fù)制或盜取,采用聲音進(jìn)行目標(biāo)識(shí)別具有很高的安全性,識(shí)別的精確度與準(zhǔn)確度和聲紋數(shù)據(jù)庫(kù)息息相關(guān)?,F(xiàn)有的聲音識(shí)別方式一般采用錄制用戶的語(yǔ)音的方式,其對(duì)錄到的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,并提取語(yǔ)音信號(hào)中包含的用戶的聲紋特征,建立用戶聲紋模型;但是該方式訓(xùn)練樣本較少,提取的聲紋特征可能不完全,有可能會(huì)產(chǎn)生誤判操作。另外采用的是本地處理器計(jì)算處理來識(shí)別聲紋信息,具有處理器處理能力弱。復(fù)雜背景下無法勝任的缺點(diǎn)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明所要解決的技術(shù)問題是提供一種能夠?qū)μ崛〉穆暭y特征進(jìn)行分類存儲(chǔ)并不斷擴(kuò)展存儲(chǔ)的聲紋采集和處理系統(tǒng)及其采集和處理方法。
[0004]為了解決上述技術(shù)問題,本發(fā)明采用了如下技術(shù)方案:
[0005]—種聲紋采集和處理系統(tǒng),根據(jù)收集到的用戶的音頻信息,獲得其中的聲紋特征,并擴(kuò)充已建立的聲紋特征信息庫(kù),同時(shí)辨別該聲紋特征所屬的用戶編號(hào)。
[0006]其中,所述系統(tǒng)包括分布在一區(qū)域內(nèi)不同位置處的用于采集音頻信息的多個(gè)收音裝置,與所述收音裝置通信連接的數(shù)據(jù)處理端,所述數(shù)據(jù)處理端包括:
[0007]通信單元,其與所述收音裝置通信連接;
[0008]聲紋提取單元,其對(duì)所述收音裝置轉(zhuǎn)化后的音頻信息進(jìn)行處理并提取其中的聲紋特征;
[0009]存儲(chǔ)單元,其包括所述聲紋特征信息庫(kù)并存儲(chǔ)有對(duì)應(yīng)于各所述用戶的聲紋特征,每個(gè)所述用戶以唯一的用戶編號(hào)進(jìn)行標(biāo)識(shí);
[0010]聲紋對(duì)比單元,其將聲紋特征與所述聲紋特征信息庫(kù)內(nèi)的聲紋特征進(jìn)行對(duì)比,并判斷所述存儲(chǔ)單元內(nèi)是否存在與該聲紋特征為同類的聲紋特征;
[0011]控制單元,其與所述通信單元、存儲(chǔ)單元、聲紋提取單元和聲紋對(duì)比單元連接,并將所述收音裝置轉(zhuǎn)化后的音頻信息發(fā)送至所述聲紋提取單元以提取聲紋特征,并將所提取的聲紋特征發(fā)送至所述聲紋對(duì)比單元,并根據(jù)所述聲紋對(duì)比單元的判斷結(jié)果控制所述存儲(chǔ)單元將所述聲紋特征與對(duì)應(yīng)的用戶編號(hào)關(guān)聯(lián)存儲(chǔ)。
[0012]其中,所述控制單元配置為當(dāng)所述聲紋對(duì)比單元判斷為所述存儲(chǔ)單元內(nèi)存在與該聲紋特征為同類的聲紋特征時(shí),將該聲紋特征和與其同類的聲紋特征的用戶編號(hào)相關(guān)聯(lián)存儲(chǔ);當(dāng)所述聲紋對(duì)比單元判斷為所述存儲(chǔ)單元內(nèi)不存在與該聲紋特征為同類的聲紋特征時(shí),將該聲紋特征與新的用戶編號(hào)相關(guān)聯(lián)存儲(chǔ)。
[0013]其中,所述數(shù)據(jù)處理端內(nèi)還包括與所述控制單元電連接的身份識(shí)別單元,其配置為對(duì)聲紋提取單元所提取的聲紋特征分析以識(shí)別出用戶的身份,所述用戶的身份包括至少兩類用戶身份,所述存儲(chǔ)單元內(nèi)還將所述用戶的身份與用戶編號(hào)相關(guān)聯(lián)存儲(chǔ)。
[0014]其中,所述身份識(shí)別單元還配置為根據(jù)所述聲紋出現(xiàn)的頻率判定該用戶的級(jí)別。
[0015]其中,所述控制單元還進(jìn)一步配置為接收一第一預(yù)設(shè)值和第二預(yù)設(shè)值,其中第二預(yù)設(shè)值大于第一預(yù)設(shè)值,所述身份識(shí)別單元配置為同一用戶的聲紋特征出現(xiàn)的頻率在第一預(yù)設(shè)值和第二預(yù)設(shè)值之間時(shí),該用戶被判定為訪客。
[0016]其中,所述存儲(chǔ)單元內(nèi)包括:訪客數(shù)據(jù)存儲(chǔ)單元以及主要成員數(shù)據(jù)存儲(chǔ)單元。
[0017]其中,所述數(shù)據(jù)處理端為具有浮點(diǎn)計(jì)算功能的云服務(wù)器。
[0018]本發(fā)明還提供了一種基于上述的聲紋采集和處理系統(tǒng)的聲紋采集和處理方法,其包括以下步驟:
[0019]收集一區(qū)域內(nèi)用戶的音頻信息;
[0020]從所述音頻信息中提取聲紋特征;
[0021]將所述聲紋特征存儲(chǔ)在所述聲紋特征信息庫(kù)中,并辨別所述聲紋特征所屬的用戶編號(hào)。
[0022]其中,所述辨別所述聲紋特征所述的用戶編號(hào)的方法包括以下步驟:
[0023]將提取的聲紋特征與聲紋特征信息庫(kù)內(nèi)的聲紋特征進(jìn)行對(duì)比,并判斷所述聲紋特征信息庫(kù)內(nèi)是否存在與該聲紋特征相近的聲紋特征;其中,所述聲紋特征信息庫(kù)內(nèi)存儲(chǔ)有對(duì)應(yīng)于各所述用戶的聲紋特征,每個(gè)所述用戶以唯一的用戶編號(hào)進(jìn)行標(biāo)識(shí);
[0024]控制單元根據(jù)所述聲紋對(duì)比單元的判斷結(jié)果控制所述聲紋特征信息庫(kù)將所述聲紋特征與對(duì)應(yīng)的用戶編號(hào)關(guān)聯(lián)存儲(chǔ)。
[0025]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
[0026]1、本發(fā)明提供的聲紋采集和處理系統(tǒng)能夠?qū)崟r(shí)收集一區(qū)域內(nèi)的音頻信息,并對(duì)所收集的音頻信息中的聲紋特征進(jìn)行分類,以判斷與該聲紋特征關(guān)聯(lián)的用戶,從而不斷的擴(kuò)展用戶的聲紋特征,由于在數(shù)據(jù)處理端會(huì)存有不斷擴(kuò)充的聲紋特征,以使得其在聲紋識(shí)別的效率和精確度上都得到了很大的改進(jìn);
[0027]2、由于本發(fā)明中的數(shù)據(jù)處理端還可以通過用戶的聲紋特征來判斷其屬于成人或是兒童或是其他的身份,或者根據(jù)聲紋特征出現(xiàn)的頻率判斷其屬于訪客還是主要成員等級(jí)另Ij,從而通過對(duì)用戶的身份的識(shí)別,可以在安防、智能家居等環(huán)境中設(shè)定其操作或工作權(quán)限,以達(dá)到安全防護(hù)的作用。
【附圖說明】
[0028]圖1為本發(fā)明實(shí)施例的一種聲紋采集和處理系統(tǒng)的原料框圖;
[0029]圖2為本發(fā)明另一實(shí)施例的一種聲紋采集和處理系統(tǒng)的原料框圖;
[0030]圖3為本發(fā)明實(shí)施例的一種聲紋采集和處理系統(tǒng)的聲紋采集和處理方法的流程圖。
[0031]附圖標(biāo)記說明
[0032]1-收音裝置2-數(shù)據(jù)處理端
[0033]21-通信單元22-聲紋提取單元
[0034]23-存儲(chǔ)單元24-聲紋對(duì)比單元
[0035]25-控制單元26-身份識(shí)別單元
【具體實(shí)施方式】
[0036]下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述,但不作為對(duì)本發(fā)明的限定。
[0037]本發(fā)明實(shí)施例所提供的聲紋采集和處理系統(tǒng),能夠根據(jù)收集到的用戶的音頻信息,而獲得其中的聲紋特征,并擴(kuò)充已建立的聲紋特征信息庫(kù),以用于辨別用戶的身份。本實(shí)施例中可以通過存儲(chǔ)不斷擴(kuò)充的聲紋特征以達(dá)到樣本多樣化的目的,而且還可以提高對(duì)用戶的聲紋的識(shí)別速度和識(shí)別精度,起到更加安全有效的效果。而且本實(shí)施例中用戶的身份可以是成人和兒童,也可以是訪客或主要成員。身份的識(shí)別可以應(yīng)用到智能家居或安防等其他領(lǐng)域上,以根據(jù)用戶的身份來限定其權(quán)限,以起到安全防護(hù)的作用。
[0038]如圖1所示,為本發(fā)明實(shí)施例中的聲紋采集和處理系統(tǒng)的原理框圖,其中,所述系統(tǒng)可以包括分布在一區(qū)域內(nèi)不同位置處的用于采集音頻信息的多個(gè)收音裝置I以及與收音裝置I通信連接的數(shù)據(jù)處理端2,數(shù)據(jù)處理端2包括:通信單元21、聲紋提取單元22、存儲(chǔ)單元23、聲紋對(duì)比單元24、控制單元25,其中,通信單元21與收音裝置I通信連接,以接收音頻信息;聲紋提取單元22對(duì)收音裝置I采集并轉(zhuǎn)化后的音頻信息進(jìn)行處理并提取其中的聲紋特征,本實(shí)施例中的聲紋特征是指音頻信號(hào)的頻率、幅度相位等特征值,而且本實(shí)施例中的聲紋提取單元22還可以識(shí)別出來自于電子設(shè)備的聲音,如當(dāng)識(shí)別為電視或廣播的聲音時(shí),停止聲紋的提取;存儲(chǔ)單元23其包括如上所述的聲紋特征信息庫(kù),且存儲(chǔ)單元21內(nèi)存儲(chǔ)有對(duì)應(yīng)于各所述用戶的聲紋特征,每個(gè)所述用戶以唯一的用戶編號(hào)進(jìn)行標(biāo)識(shí);聲紋對(duì)比單元24將聲紋提取單元22提取出的聲紋特征與聲紋信息庫(kù)內(nèi)的聲紋特征進(jìn)行對(duì)比,并判斷存儲(chǔ)單元23內(nèi)是否存在與該聲紋特征為同類的聲紋特征,由于每個(gè)用戶在一般情況下發(fā)出的聲音的聲紋特征基本相同,因此,本實(shí)施例中將相似的聲紋特征分成一類以對(duì)應(yīng)于相同的用戶;控制單元25與通信單元21、存儲(chǔ)單元23、聲紋提取單元22和聲紋對(duì)比單元24電連接,并將通信單元21接收到的音頻信息發(fā)送至聲紋提取單元22以提取聲紋特征,并將所提取的聲紋特征發(fā)送至聲紋對(duì)比單元24,并根據(jù)聲紋對(duì)比單元24的判斷結(jié)果控制存儲(chǔ)單元23將所述聲紋特征與對(duì)應(yīng)的用戶編號(hào)關(guān)聯(lián)存儲(chǔ),其中,控制單元