本發(fā)明涉及到語(yǔ)音技術(shù)領(lǐng)域,特別是一種數(shù)字化的語(yǔ)音識(shí)別方法。
背景技術(shù):
語(yǔ)音作為模擬信號(hào),近年來(lái)開(kāi)始出現(xiàn)通過(guò)計(jì)算機(jī)進(jìn)行語(yǔ)音識(shí)別,但是目前很難通過(guò)計(jì)算機(jī)進(jìn)行數(shù)字化識(shí)別,計(jì)算機(jī)數(shù)字化處理在處理速度、準(zhǔn)確度上都比傳統(tǒng)的方式要高,目前還沒(méi)有通過(guò)數(shù)字化處理的手段。
技術(shù)實(shí)現(xiàn)要素:
為解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種語(yǔ)音識(shí)別方法,其包括以下步驟:
對(duì)被識(shí)別的模擬語(yǔ)音信號(hào)進(jìn)行數(shù)字化,變化為適于計(jì)算機(jī)處理的數(shù)字信息;
對(duì)所述數(shù)字信息進(jìn)行預(yù)處理,除去混入的干擾信息并減少變形或失真;
對(duì)預(yù)處理后的數(shù)字信息進(jìn)行特征選擇,選擇需要識(shí)別的語(yǔ)音的特征值,在預(yù)處理后的數(shù)字信息中抽取包含所述特征值的信息;
特征值提取過(guò)程將需要識(shí)別的特征值從對(duì)象空間映射到特征空間,使得每個(gè)需要識(shí)別的特征值可用特征空間中的一個(gè)點(diǎn)表示;
將所述通過(guò)預(yù)處理后的數(shù)字信息中保留需要識(shí)別的特征值的數(shù)字信息,將其他數(shù)字信息剔除得到需要識(shí)別的數(shù)字信息;
將所述需要識(shí)別的數(shù)字信息進(jìn)行還原成模擬語(yǔ)音信號(hào),所述還原后的模擬語(yǔ)音信號(hào)即為最終需要識(shí)別的語(yǔ)音。
較佳地,所述語(yǔ)音的數(shù)字化過(guò)程為對(duì)語(yǔ)音信號(hào)進(jìn)行數(shù)字化抽樣。
較佳地,所述特征值包括聲音的幅度、頻率。
本發(fā)明具有以下有益效果:
本發(fā)明提供的基于計(jì)算機(jī)的語(yǔ)音識(shí)別方法通過(guò)將語(yǔ)音數(shù)字化,通過(guò)對(duì)數(shù)字化的語(yǔ)音進(jìn)行特征選擇,通過(guò)特征值對(duì)語(yǔ)音進(jìn)行識(shí)別,識(shí)別準(zhǔn)確度與識(shí)別速度都得到很大的提升。
當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例對(duì)本發(fā)明中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例提供了一種語(yǔ)音識(shí)別方法,其包括以下步驟:
對(duì)被識(shí)別的模擬語(yǔ)音信號(hào)進(jìn)行數(shù)字化,變化為適于計(jì)算機(jī)處理的數(shù)字信息;
對(duì)所述數(shù)字信息進(jìn)行預(yù)處理,除去混入的干擾信息并減少變形或失真;
對(duì)預(yù)處理后的數(shù)字信息進(jìn)行特征選擇,選擇需要識(shí)別的語(yǔ)音的特征值,在預(yù)處理后的數(shù)字信息中抽取包含所述特征值的信息;
特征值提取過(guò)程將需要識(shí)別的特征值從對(duì)象空間映射到特征空間,使得每個(gè)需要識(shí)別的特征值可用特征空間中的一個(gè)點(diǎn)表示;
將所述通過(guò)預(yù)處理后的數(shù)字信息中保留需要識(shí)別的特征值的數(shù)字信息,將其他數(shù)字信息剔除得到需要識(shí)別的數(shù)字信息;
將所述需要識(shí)別的數(shù)字信息進(jìn)行還原成模擬語(yǔ)音信號(hào),所述還原后的模擬語(yǔ)音信號(hào)即為最終需要識(shí)別的語(yǔ)音。
本實(shí)施例中,所述語(yǔ)音的數(shù)字化過(guò)程為對(duì)語(yǔ)音信號(hào)進(jìn)行數(shù)字化抽樣。
其中所述特征值包括聲音的幅度、頻率。
以上公開(kāi)的本發(fā)明優(yōu)選實(shí)施例只是用于幫助闡述本發(fā)明。優(yōu)選實(shí)施例并沒(méi)有詳盡敘述所有的細(xì)節(jié),也不限制該發(fā)明僅為所述的具體實(shí)施方式。顯然,根據(jù)本說(shuō)明書(shū)的內(nèi)容,可作很多的修改和變化。本說(shuō)明書(shū)選取并具體描述這些實(shí)施例,是為了更好地解釋本發(fā)明的原理和實(shí)際應(yīng)用,從而使所屬技術(shù)領(lǐng)域技術(shù)人員能很好地理解和利用本發(fā)明。本發(fā)明僅受權(quán)利要求書(shū)及其全部范圍和等效物的限制。