技術(shù)編號:40614476
提示:您尚未登錄,請點(diǎn) 登 陸 后下載,如果您還沒有賬戶請點(diǎn) 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本申請涉及人工智能,特別是涉及一種基于端到端的跨語言大模型的語音識別方法、裝置及設(shè)備。背景技術(shù)、語音識別技術(shù)是將語音信號自動轉(zhuǎn)換為文本的過程,作為人與機(jī)器交互的重要技術(shù)之一,其廣泛應(yīng)用于智能助手、語音控制等領(lǐng)域。語音識別的流程一般包括以下幾個步驟:、()語音信號采集:通過話筒輸入語音信號,將聲波轉(zhuǎn)換為電壓信號,再通過a/d(模擬數(shù)字轉(zhuǎn)換)裝置進(jìn)行采樣,從而將連續(xù)的電壓信號轉(zhuǎn)換為計算機(jī)能夠處理的數(shù)字信號。、()特征提?。簭牟杉降恼Z音信號中提取出關(guān)鍵特征,例如聲學(xué)特征、時間特征、序列特征...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。