两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

預處理音頻信號的方法和設備的制造方法

文檔序號:9794123閱讀:466來源:國知局
預處理音頻信號的方法和設備的制造方法
【技術(shù)領(lǐng)域】
[0001] 本公開涉及處理音頻信號,尤其涉及預處理音頻信號的方法和設備。
【背景技術(shù)】
[0002] 雖然語音識別已經(jīng)出現(xiàn)數(shù)十年,但是語音識別軟件和硬件的質(zhì)量直到最近才達到 足夠高的水平以吸引大量消費者。近年來語音識別變得非常普及的一個領(lǐng)域是智能電話和 平板計算機產(chǎn)業(yè)。使用啟用語音識別的裝置,完全通過發(fā)音,消費者就可以執(zhí)行諸如打電 話、寫電子郵件、以及用GPS導航這樣的任務。
[0003] 但是在這樣的裝置中語音識別遠遠未臻完美。在初次使用啟用語音識別的裝置 時,用戶可能需要"訓練"語音識別軟件來識別他或她的發(fā)音。但是,即使經(jīng)過訓練,語音識 別功能也不能在所有聲音環(huán)境下工作良好。例如,背景噪聲的出現(xiàn)會降低語音識別的準確 性。
【附圖說明】
[0004] 雖然后附權(quán)利要求書通過特性闡述了本技術(shù)的特征,但是根據(jù)結(jié)合附圖的以下詳 細描述可以更好地理解這些技術(shù),在附圖中:
[0005]圖1示出用戶向電子裝置說話,在附圖中將電子裝置描述為移動裝置。
[0006] 圖2示出圖1的電子裝置的示例組件。
[0007] 圖3示出可以實施各種實施例的體系結(jié)構(gòu)。
[0008] 圖4示出根據(jù)本發(fā)明實施例可以執(zhí)行的步驟。
【具體實施方式】
[0009] 根據(jù)前述,現(xiàn)在將描述用于預處理音頻信號的方法和設備。
[0010] 根據(jù)實施例,電子裝置能夠選擇適合于裝置操作所在環(huán)境的預處理技術(shù)。這樣,裝 置提高了語音識別準確度。在一個實施方式中,裝置使用從音頻信號本身獲得的信息,以及 從一個或多個輔助裝置獲得的信息。
[0011] 裝置能夠在多種預處理技術(shù)(例如,單麥克風噪聲抑制、雙麥克風噪聲抑制、自適 應噪聲消除)中的任何一個中選擇并將選擇的技術(shù)應用于裝置的音頻輸入信號。適當預處 理技術(shù)的選擇可以取決于背景噪聲的等級以及背景噪聲的特性(例如,變化性、頻譜形狀等 等)。
[0012] 根據(jù)實施例,一個或多個輔助裝置提供可以對其進行預處理過程選擇的附加信 息。例如,全球定位信號(GPS)模塊可以提供有關(guān)裝置的位置、裝置是否在運動及其速度的 信息。根據(jù)裝置的位置和速度,可以獲得有關(guān)背景噪聲的等級以及背景噪聲的特性的線索。 例如,裝置可以放置在安靜的家庭環(huán)境、繁忙的餐廳、城市街道、或者公路中。它可以靜止, 或者以60mph的速度移動。基于裝置的位置和速度,可以在類似條件下使用現(xiàn)有知識(例如, 存儲的噪聲等級和特性的查找表)來推測有關(guān)噪聲等級和噪聲特性的信息。然后可將這樣 的信息用于為輸入信號選擇適當?shù)念A處理技術(shù),從而增強語音識別性能。
[0013] 在實施例中,電子裝置接收具有音頻信息的音頻信號,獲得輔助信息(諸如位置、 速度、方向、光和溫度),并基于音頻信息和輔助信息,確定電子裝置操作所在音頻環(huán)境的類 型。裝置基于確定的音頻環(huán)境類型選擇音頻預處理過程,并根據(jù)選擇的預處理過程預處理 音頻信號。然后,裝置可以對經(jīng)過預處理的音頻信號執(zhí)行語音識別。
[0014] 用于預處理過程的可能實施方式包括直通式信號傳輸、單麥克風噪聲抑制、雙麥 克風噪聲抑制、以及自適應噪聲消除。
[0015] 在實施例中,確定音頻環(huán)境的類型涉及確定裝置是在車輛中、在家里、在餐廳中、 在辦公室中、還是在街道上操作。
[0016] 如同這里使用的,裝置的"音頻環(huán)境"表示除了用戶語音的聲音之外,裝置聽得見 的聲音的特性。背景噪聲是音頻環(huán)境的一部分。
[0017]如同這里使用的,"模塊"是在硬件上執(zhí)行的軟件。模塊可以在多個硬件元件上執(zhí) 行,或可以在單個硬件元件上執(zhí)行。此外,當附圖中示出多個模塊時,應當理解,實際上模塊 可以都在相同的裝置上并且在軟件的相同整體單元中執(zhí)行。
[0018] 當本公開提及模塊和其他元件相互"提供"信息(數(shù)據(jù))時,應當理解,可以有可以 執(zhí)行這樣的動作的多種可能方式,包括沿著傳導路徑(例如電線)傳輸?shù)碾娦盘栆约皩ο箝g 方法調(diào)用。
[0019] 這里所述的一些實施例在常通音頻(Α0Α)的背景下可用。當使用Α0Α時,裝置102 (圖1)能夠在收到來自用戶的觸發(fā)命令時從休眠模式中蘇醒。Α0Α對裝置(尤其是移動裝置) 提出了附加要求。因此,當裝置102能夠準確迅速識別用戶的發(fā)音命令時,Α0Α最有效。
[0020] 參照圖1,用戶104提供發(fā)音輸入(或者有聲化的信息或語音)106,通過麥克風(或 者其他聲音接收器)1〇8,發(fā)音輸入106被啟用語音的電子裝置("裝置")102接收。裝置102 (在本示例中是移動裝置)包括觸摸屏顯示器110,觸摸屏顯示器110能夠顯示視覺圖像,以 及接收或感測通過用戶手指或者其他觸摸輸入裝置(諸如手寫筆)提供的觸摸式輸入。雖然 有觸摸屏顯示器110,但是在圖1所示實施例中,裝置102還有充當裝置的輸入裝置的多個分 立鍵或按鈕112。但是,在其他實施例中,這樣的鍵或按鈕(或者任何特定數(shù)量的這樣的鍵或 按鈕)不需要出現(xiàn),并且觸摸屏顯示器110可以充當主要或唯一的用戶輸入裝置。
[0021] 雖然圖1將裝置102特別示出為包括觸摸屏顯示器110以及鍵或按鈕112,但是這些 部件只是要作為裝置102上組件/部件的示例,并且在其他實施例中,裝置102不需要包括這 些部件中的一個或多個,和/或除了這些部件之外或者作為這些部件的替代,還可包括其他 部件。
[0022] 裝置102是要作為各種裝置的代表,例如包括蜂窩電話、個人數(shù)字助理(PDA)、智能 電話、或者其他手持或便攜電子裝置。在替代性實施例中,裝置也可以是耳機(例如,藍牙耳 機)、MP3播放器、電池供電的裝置、手表裝置(例如,腕表)或其他可佩戴裝置、無線電設備、 導航裝置、膝上型電腦或筆記本計算機、上網(wǎng)本、尋呼機、PMP(個人媒體播放器)、DVR(數(shù)字 視頻記錄儀)、游戲裝置、相機、電子閱讀器、電子書、平板裝置、帶視頻功能屏幕的導航裝 置、多媒體插接站、或其他裝置。
[0023]本公開的實施例是為了可應用于多種電子裝置中的任何一個,所述多種電子裝置 能夠或者被配置為接收指示或代表有聲化信息的發(fā)音輸入或其他聲音輸入。
[0024]圖2示出根據(jù)本公開的實施例,圖1的裝置102的內(nèi)部組件。如圖2所示,內(nèi)部組件 200包括一個或多個無線收發(fā)信機202、處理器204(例如,微處理器、微型計算機、專用集成 電路等等)、存儲器部206、一個或多個輸出裝置208、以及一個或多個輸入裝置210。此外,內(nèi) 部組件200可包括組件接口 212,以提供與輔助組件或附件(用于附加或增強功能)的直接連 接。此外,內(nèi)部組件200可包括諸如電池的電源214,用于在使得移動裝置成為可便攜式時向 其他內(nèi)部組件供電。此外,內(nèi)部組件200附加性地包括一個或多個傳感器228。通過一個或多 個內(nèi)部通信鏈接232 (例如,內(nèi)部總線),所有內(nèi)部組件200都可以相互耦合,并相互通信。 [0025]此外,在圖2的實施例中,無線收發(fā)信機202特別包括蜂窩收發(fā)信機203和Wi-Fi收 發(fā)信機205。更具體而言,蜂窩收發(fā)信機203被配置為進行蜂窩通信,諸如3G、4G、4G-LTE、面 對面小
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
龙南县| 兴宁市| 长乐市| 高安市| 泽州县| 天祝| 广饶县| 闽清县| 宜黄县| 长汀县| 洛南县| 石渠县| 闸北区| 大安市| 南京市| 宣恩县| 红安县| 古蔺县| 衡水市| 屯昌县| 富裕县| 西乌| 桑日县| 揭东县| 梅河口市| 墨江| 澄迈县| 宁明县| 大名县| 唐河县| 曲水县| 公主岭市| 乌拉特前旗| 临沧市| 甘南县| 齐齐哈尔市| 舞钢市| 天等县| 海盐县| 陇西县| 白玉县|