本發(fā)明涉及語(yǔ)音識(shí)別,尤其涉及一種互聯(lián)網(wǎng)協(xié)議智慧一體機(jī)智能語(yǔ)音控制方法及系統(tǒng)。
背景技術(shù):
1、在當(dāng)今智能科技迅速發(fā)展的時(shí)代,智能語(yǔ)音控制領(lǐng)域已經(jīng)取得了顯著的進(jìn)步,從現(xiàn)有技術(shù)來(lái)看,現(xiàn)有的語(yǔ)音控制方法主要基于簡(jiǎn)單的語(yǔ)音識(shí)別原理,但是現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)在復(fù)雜環(huán)境下的性能不夠穩(wěn)定,例如在嘈雜的環(huán)境中,背景噪音會(huì)干擾語(yǔ)音信號(hào)的采集和識(shí)別,并且現(xiàn)有技術(shù)對(duì)語(yǔ)音信號(hào)的處理過(guò)于簡(jiǎn)單,僅僅進(jìn)行了基礎(chǔ)的降噪處理,而對(duì)于不同頻率、不同強(qiáng)度的噪音不能進(jìn)行有效區(qū)分并針對(duì)性地消除,進(jìn)而導(dǎo)致信號(hào)的語(yǔ)義分析準(zhǔn)確性降低,最終導(dǎo)致智慧一體機(jī)的語(yǔ)音控制準(zhǔn)確性差,因此需要一種能夠提高智慧一體機(jī)智能語(yǔ)音控制準(zhǔn)確性的方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種互聯(lián)網(wǎng)協(xié)議智慧一體機(jī)智能語(yǔ)音控制方法及系統(tǒng),其主要目的在于提高互聯(lián)網(wǎng)協(xié)議智慧一體機(jī)智能語(yǔ)音控制的準(zhǔn)確性。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種互聯(lián)網(wǎng)協(xié)議智慧一體機(jī)智能語(yǔ)音控制方法,包括:
3、利用智慧一體機(jī)采集應(yīng)用環(huán)境的環(huán)境音頻數(shù)據(jù),對(duì)所述環(huán)境音頻數(shù)據(jù)進(jìn)行信號(hào)提純處理,得到目標(biāo)音頻信號(hào);
4、對(duì)所述目標(biāo)音頻信號(hào)進(jìn)行信號(hào)增益處理,得到增益音頻信號(hào),將所述增益音頻信號(hào)輸入到預(yù)先訓(xùn)練好的信號(hào)聲學(xué)分析模型中,利用所述信號(hào)聲學(xué)分析模型中的特征感知層構(gòu)建所述增益音頻信號(hào)對(duì)應(yīng)的音頻特征圖譜,利用所述信號(hào)聲學(xué)分析模型中的循環(huán)神經(jīng)網(wǎng)絡(luò)層對(duì)所述音頻特征圖譜進(jìn)行時(shí)序分析,得到序列依賴關(guān)系;
5、結(jié)合所述序列依賴關(guān)系,利用所述信號(hào)聲學(xué)分析模型中的全連接層對(duì)所述音頻特征圖譜進(jìn)行特征關(guān)聯(lián)處理,得到關(guān)聯(lián)特征集,利用所述信號(hào)聲學(xué)分析模型中的輸出層對(duì)所述關(guān)聯(lián)特征集進(jìn)行文字映射處理,得到信號(hào)文字序列;
6、基于所述信號(hào)文字序列,分析所述增益音頻信號(hào)對(duì)應(yīng)的信號(hào)意圖,計(jì)算所述信號(hào)意圖之間的意圖耦合度,基于所述意圖耦合度,對(duì)所述信號(hào)意圖進(jìn)行模糊優(yōu)化處理,得到優(yōu)化信號(hào)意圖,基于所述信號(hào)意圖,制定所述增益音頻信號(hào)對(duì)應(yīng)的信號(hào)指令;
7、查詢所述智慧一體機(jī)對(duì)應(yīng)的控制接口,將所述信號(hào)指令與所述控制接口進(jìn)行適配處理,得到適配控制接口,并設(shè)置所述適配控制接口對(duì)應(yīng)的控制序列,基于所述控制序列,利用所述適配控制接口執(zhí)行所述智慧一體機(jī)的控制處理,得到控制結(jié)果。
8、可選地,所述對(duì)所述環(huán)境音頻數(shù)據(jù)進(jìn)行信號(hào)提純處理,得到目標(biāo)音頻信號(hào),包括:
9、對(duì)所述環(huán)境音頻數(shù)據(jù)進(jìn)行清洗處理,得到目標(biāo)音頻數(shù)據(jù);
10、對(duì)所述目標(biāo)音頻數(shù)據(jù)進(jìn)行模數(shù)轉(zhuǎn)換,得到音頻數(shù)字信號(hào);
11、計(jì)算所述音頻數(shù)字信號(hào)對(duì)應(yīng)的信號(hào)頻率;
12、根據(jù)所述信號(hào)頻率,對(duì)所述音頻數(shù)字信號(hào)進(jìn)行信號(hào)提純處理,得到目標(biāo)音頻信號(hào)。
13、可選地,所述對(duì)所述目標(biāo)音頻信號(hào)進(jìn)行信號(hào)增益處理,得到增益音頻信號(hào),包括:
14、對(duì)所述目標(biāo)音頻信號(hào)進(jìn)行離散化處理,得到離散音頻信號(hào);
15、對(duì)所述離散音頻信號(hào)進(jìn)行信號(hào)采樣處理,得到音頻信號(hào)值;
16、根據(jù)所述音頻信號(hào)值,通過(guò)下述公式計(jì)算所述目標(biāo)音頻信號(hào)對(duì)應(yīng)的增益信號(hào)值:
17、;
18、其中,a表示目標(biāo)音頻信號(hào)對(duì)應(yīng)的增益信號(hào)值,表示增益調(diào)節(jié)系數(shù),表示增益斜率調(diào)節(jié)因子,表示增益曲率系數(shù),表示音頻信號(hào)值中在采樣時(shí)間點(diǎn)為a時(shí)對(duì)應(yīng)的信號(hào)值,a表示采樣時(shí)間點(diǎn),
19、基于所述增益信號(hào)值,對(duì)所述目標(biāo)音頻信號(hào)進(jìn)行信號(hào)增益處理,得到增益音頻信號(hào)。
20、可選地,所述利用所述信號(hào)聲學(xué)分析模型中的特征感知層構(gòu)建所述增益音頻信號(hào)對(duì)應(yīng)的音頻特征圖譜,包括:
21、利用所述特征感知層中的感知子模塊提取所述增益音頻信號(hào)對(duì)應(yīng)的多維度音頻特征;
22、利用所述特征感知層中的特征評(píng)測(cè)函數(shù)計(jì)算所述多維度音頻特征的特征貢獻(xiàn)值;
23、基于所述特征貢獻(xiàn)值,利用所述特征感知層中的選擇函數(shù)對(duì)所述多維度音頻特征進(jìn)行特征選擇處理,得到目標(biāo)音頻特征;
24、利用所述特征感知層中的特征融合模塊對(duì)所述目標(biāo)音頻特征進(jìn)行特征融合,得到融合音頻特征;
25、利用所述特征感知層中的可視化模塊構(gòu)建所述融合音頻特征的音頻特征圖譜。
26、可選地,所述利用所述特征感知層中的特征評(píng)測(cè)函數(shù)計(jì)算所述多維度音頻特征的特征貢獻(xiàn)值,包括:
27、對(duì)所述多維度音頻特征進(jìn)行向量化處理,得到音頻特征向量;
28、根據(jù)所述音頻特征向量,計(jì)算所述多維度音頻特征之間的特征協(xié)方差;
29、根據(jù)所述特征協(xié)方差,計(jì)算所述多維度音頻特征對(duì)應(yīng)的特征穩(wěn)定系數(shù),并計(jì)算所述多維度音頻特征之間的特征相關(guān)系數(shù);
30、結(jié)合所述特征穩(wěn)定系數(shù)、所述特征相關(guān)系數(shù)及所述音頻特征向量,通過(guò)下述特征評(píng)測(cè)函數(shù)計(jì)算所述多維度音頻特征的特征貢獻(xiàn)值:
31、;
32、其中,d表示多維度音頻特征的特征貢獻(xiàn)值,表示多維度音頻特征中第b個(gè)特征對(duì)應(yīng)的音頻特征向量,b多維度音頻特征對(duì)應(yīng)的序列號(hào),p表示多維度音頻特征對(duì)應(yīng)的特征數(shù)量,表示多維度音頻特征中第b個(gè)特征和第b+1個(gè)特征之間的特征相關(guān)系數(shù),表示多維度音頻特征中第b個(gè)特征的特征穩(wěn)定系數(shù)。
33、可選地,所述利用所述信號(hào)聲學(xué)分析模型中的輸出層對(duì)所述關(guān)聯(lián)特征集進(jìn)行文字映射處理,得到信號(hào)文字序列,包括:
34、利用所述輸出層中的編碼層對(duì)所述關(guān)聯(lián)特征集進(jìn)行編碼處理,得到編碼特征集;
35、根據(jù)預(yù)設(shè)特征-標(biāo)簽映射表,利用所述輸出層中的概率函數(shù)計(jì)算所述編碼特征集對(duì)應(yīng)的分布概率;
36、基于所述分布概率和所述特征-標(biāo)簽映射表;
37、利用所述輸出層中的解碼算法對(duì)所述編碼特征集進(jìn)行文字映射處理,得到信號(hào)文字序列。
38、可選地,所述基于所述信號(hào)文字序列,分析所述增益音頻信號(hào)對(duì)應(yīng)的信號(hào)意圖,包括:
39、識(shí)別所述信號(hào)文字序列中的信號(hào)文本字符,計(jì)算所述信號(hào)文本字符對(duì)應(yīng)的字符權(quán)值;
40、基于所述字符權(quán)值,從所述信號(hào)文本字符中提取出關(guān)鍵信號(hào)字符;
41、對(duì)所述關(guān)鍵信號(hào)字符進(jìn)行語(yǔ)義解析,得到信號(hào)語(yǔ)義;
42、分析所述信號(hào)文本字符對(duì)應(yīng)的字符語(yǔ)境,基于所述字符語(yǔ)境和所述信號(hào)語(yǔ)義,分析所述增益音頻信號(hào)對(duì)應(yīng)的信號(hào)意圖。
43、可選地,所述計(jì)算所述信號(hào)意圖之間的意圖耦合度,包括:
44、分析所述信號(hào)意圖的意圖屬性,統(tǒng)計(jì)所述意圖屬性中每個(gè)屬性的屬性頻率和聯(lián)合頻率;
45、構(gòu)建所述意圖屬性對(duì)應(yīng)的屬性向量,基于所述屬性向量,計(jì)算所述意圖屬性之間的屬性相似度;
46、結(jié)合所述屬性頻率、所述聯(lián)合頻率及所述屬性相似度,通過(guò)下述公式計(jì)算所述信號(hào)意圖之間的意圖耦合度:
47、;
48、其中,h表示信號(hào)意圖之間的意圖耦合度,表示意圖屬性中第i個(gè)和第i+1個(gè)屬性對(duì)應(yīng)的聯(lián)合頻率,和分別表示意圖屬性中第i個(gè)和第i+1個(gè)屬性對(duì)應(yīng)的屬性頻率,表示意圖屬性中第i個(gè)和第i+1個(gè)屬性之間的屬性相似度,i和i+1均表示意圖屬性的序列號(hào)。
49、可選地,所述設(shè)置所述適配控制接口對(duì)應(yīng)的控制序列,包括:
50、查詢所述適配控制接口對(duì)應(yīng)的終端控制設(shè)備,分析所述終端控制設(shè)備對(duì)應(yīng)的設(shè)備功能特征;
51、基于所述設(shè)備功能特征,評(píng)測(cè)所述終端控制設(shè)備的設(shè)備優(yōu)先級(jí),獲取所述終端控制設(shè)備的運(yùn)行流程圖;
52、基于所述運(yùn)行流程圖,分析所述終端控制設(shè)備之間的設(shè)備運(yùn)行邏輯;
53、基于所述設(shè)備優(yōu)先級(jí)和所述設(shè)備運(yùn)行邏輯,設(shè)置所述適配控制接口對(duì)應(yīng)的控制序列。
54、一種互聯(lián)網(wǎng)協(xié)議智慧一體機(jī)智能語(yǔ)音控制系統(tǒng),所述系統(tǒng)包括:
55、信號(hào)提純模塊,用于利用智慧一體機(jī)采集應(yīng)用環(huán)境的環(huán)境音頻數(shù)據(jù),對(duì)所述環(huán)境音頻數(shù)據(jù)進(jìn)行信號(hào)提純處理,得到目標(biāo)音頻信號(hào);
56、時(shí)序分析模塊,用于對(duì)所述目標(biāo)音頻信號(hào)進(jìn)行信號(hào)增益處理,得到增益音頻信號(hào),將所述增益音頻信號(hào)輸入到預(yù)先訓(xùn)練好的信號(hào)聲學(xué)分析模型中,利用所述信號(hào)聲學(xué)分析模型中的特征感知層構(gòu)建所述增益音頻信號(hào)對(duì)應(yīng)的音頻特征圖譜,利用所述信號(hào)聲學(xué)分析模型中的循環(huán)神經(jīng)網(wǎng)絡(luò)層對(duì)所述音頻特征圖譜進(jìn)行時(shí)序分析,得到序列依賴關(guān)系;
57、文字序列分析模塊,用于結(jié)合所述序列依賴關(guān)系,利用所述信號(hào)聲學(xué)分析模型中的全連接層對(duì)所述音頻特征圖譜進(jìn)行特征關(guān)聯(lián)處理,得到關(guān)聯(lián)特征集,利用所述信號(hào)聲學(xué)分析模型中的輸出層對(duì)所述關(guān)聯(lián)特征集進(jìn)行文字映射處理,得到信號(hào)文字序列;
58、信號(hào)指令制定模塊,用于基于所述信號(hào)文字序列,分析所述增益音頻信號(hào)對(duì)應(yīng)的信號(hào)意圖,計(jì)算所述信號(hào)意圖之間的意圖耦合度,基于所述意圖耦合度,對(duì)所述信號(hào)意圖進(jìn)行模糊優(yōu)化處理,得到優(yōu)化信號(hào)意圖,基于所述信號(hào)意圖,制定所述增益音頻信號(hào)對(duì)應(yīng)的信號(hào)指令;
59、控制處理模塊,用于查詢所述智慧一體機(jī)對(duì)應(yīng)的控制接口,將所述信號(hào)指令與所述控制接口進(jìn)行適配處理,得到適配控制接口,并設(shè)置所述適配控制接口對(duì)應(yīng)的控制序列,基于所述控制序列,利用所述適配控制接口執(zhí)行所述智慧一體機(jī)的控制處理,得到控制結(jié)果。
60、本發(fā)明通過(guò)對(duì)所述環(huán)境音頻數(shù)據(jù)進(jìn)行信號(hào)提純處理,可以將所述環(huán)境音頻數(shù)據(jù)中的無(wú)效音頻信號(hào)去除掉,進(jìn)而提高音頻信號(hào)的質(zhì)量,為后續(xù)對(duì)信號(hào)的處理結(jié)果的準(zhǔn)確性,本發(fā)明通過(guò)對(duì)所述目標(biāo)音頻信號(hào)進(jìn)行信號(hào)增益處理,可以提高所述目標(biāo)音頻信號(hào)的信號(hào)強(qiáng)度,進(jìn)而為后續(xù)的信號(hào)處理提供了依據(jù),本發(fā)明通過(guò)結(jié)合所述序列依賴關(guān)系,利用所述信號(hào)聲學(xué)分析模型中的全連接層對(duì)所述音頻特征圖譜進(jìn)行特征關(guān)聯(lián)處理,可以將所述音頻特征圖譜中具有關(guān)系的特征聚集到一起,進(jìn)而便于后續(xù)的文字映射處理,本發(fā)明通過(guò)基于所述信號(hào)文字序列,分析所述增益音頻信號(hào)對(duì)應(yīng)的信號(hào)意圖,可以了解所述增益音頻信號(hào)對(duì)應(yīng)的傳達(dá)目的,為后續(xù)的信號(hào)指令的制定提供了依據(jù),本發(fā)明通過(guò)將所述信號(hào)指令映與所述控制接口進(jìn)行適配處理,進(jìn)而便于后續(xù)通過(guò)相應(yīng)的控制接口實(shí)現(xiàn)對(duì)所述智慧一體機(jī)的控制處理,設(shè)置所述適配控制接口對(duì)應(yīng)的控制序列,可以通過(guò)所述控制序列使所述控制接口優(yōu)先所述智慧一體機(jī)的重要指令。因此,本發(fā)明實(shí)施例提供的一種互聯(lián)網(wǎng)協(xié)議智慧一體機(jī)智能語(yǔ)音控制方法及系統(tǒng),能夠提高互聯(lián)網(wǎng)協(xié)議智慧一體機(jī)智能語(yǔ)音控制的準(zhǔn)確性。