基于系統(tǒng)狀態(tài)來調節(jié)音頻波束形成設置的制作方法

文檔序號：2827167閱讀：148來源：國知局

基于系統(tǒng)狀態(tài)來調節(jié)音頻波束形成設置的制作方法
【專利摘要】音頻波束形成是一種技術，其中對從兩個或更多個麥克風接收的聲音進行組合以從背景噪聲隔離聲音。存在多種音頻波束形成空間方向圖。方向圖可以隨時間是固定的或自適應的，甚至可以隨頻率而變化。不同的方向圖可針對不同類型的聲音實現(xiàn)不同程度的成功。為了改善音頻波束形成的性能，一種系統(tǒng)可基于所檢測到的運行應用和/或設備設置來選擇模式波束方向圖。該系統(tǒng)可使用模式波束方向圖來配置音頻波束形成算法?？梢允褂媒浥渲玫囊纛l波束形成算法從多個音頻信號生成經處理的音頻數(shù)據。該系統(tǒng)然后可向運行應用發(fā)送經處理的音頻數(shù)據。
【專利說明】基于系統(tǒng)狀態(tài)來調節(jié)音頻波束形成設置
[0001]相關申請的交叉引用
[0002]本申請要求2012年6月8日提交的名稱為“ADJUSTING AUD1 BEAMFORMINGSETTINGS BASED ON SYSTEM STATE”(基于系統(tǒng)狀態(tài)調節(jié)音頻波束形成設置)的美國臨時專利申請N0.61/657，624的權益，該美國臨時專利申請全文以引用方式并入本文。

【技術領域】
[0003]本公開涉及音頻波束形成，更具體地，涉及基于系統(tǒng)狀態(tài)調節(jié)音頻波束形成設置。

【背景技術】
[0004]運行于計算設備上的許多應用涉及需要音頻輸入的功能。遺憾的是，在典型的環(huán)境條件下，由于存在各種背景聲音，單個麥克風對感興趣聲音的捕獲可能并不理想。為了解決這一問題，許多計算設備常依賴于噪聲降低、噪聲抑制、和/或噪聲消除技術。改善信噪比的一種常用技術是音頻波束形成。
[0005]音頻波束形成是一種技術，其中組合從兩個或更多個麥克風接收的聲音以便使得能夠優(yōu)先捕獲來自特定方向的聲音。使用音頻波束形成的計算設備可包括連接到處理器的兩個或更多個密集分布的全向麥克風的陣列。于是處理器可組合由不同麥克風捕獲的信號以生成單個輸出，以便將聲音與背景噪聲隔離開。例如，在延遲求和波束形成中，每個麥克風獨立地接收聲音信號，并且對接收的聲音信號求和以確定聲音的方向角。當信號源自垂直于陣列的信號源時，實現(xiàn)最大的輸出振幅。即，當聲源垂直于陣列時，信號全都同時到達，并且因此高度相關。然而，如果聲源不垂直于陣列，則信號將在不同時間到達，并且因此將不太相關，這將導致更小的輸出振幅。各種聲音的輸出振幅使得可能辨識從與感興趣聲音方向不同的方向到達的背景聲音。
[0006]存在多種不同的麥克風形狀，并且每種形狀都具有不同的噪聲降低能力。因此，存在多種音頻波束形成空間響應方向圖。方向圖可隨時間是固定的或自適應的，甚至可隨頻率而變化。然而，不同方向圖對于不同類型的聲音實現(xiàn)的成功水平不同，這可能導致非最優(yōu)效果。

【發(fā)明內容】

[0007]本公開的附加特征和優(yōu)點將在隨后的描述中進行闡述，并且部分地將從該描述顯而易見，或者可以通過實踐本文所公開的原理而獲知。本公開的特征和優(yōu)點可借助于所附權利要求中特別指出的器械和組合來實現(xiàn)并獲得。本公開的這些和其他特征將通過以下描述和所附權利要求變得更加充分地明顯，或者可以通過本文所闡述的原理的實踐而獲知。
[0008]本發(fā)明公開了用于基于系統(tǒng)狀態(tài)配置音頻波束形成設置的系統(tǒng)、方法和非暫態(tài)計算機可讀存儲介質。音頻波束形成算法可具有多個不同設置，包括模式和/或波束方向圖。為了改善噪聲降低效果，可基于計算設備的當前狀態(tài)配置音頻波束形成算法。為了配置音頻波束形成設置，計算系統(tǒng)可檢測預先確定的積極運行的應用，諸如語音輸入應用、語音識別應用、音頻通信應用、視頻聊天應用、音頻錄制應用、或音樂播放應用。此外，在一些情況下，該系統(tǒng)可檢測至少一個預先確定的設備設置，諸如風扇速度、當前音頻路由、或麥克風和揚聲器放置的配置。
[0009]基于所檢測到的應用和/或設備設置，該系統(tǒng)可選擇模式波束方向圖。模式波束方向圖可指定模式，諸如固定或自適應。此外，模式波束方向圖可指定波束方向圖，諸如全向、心形、超心形、亞心形、或8字形。該系統(tǒng)可使用模式波束方向圖來配置音頻波束形成算法。例如，波束形成器可基于模式波束方向圖中指定的值加載模式和/或波束方向圖。在配置波束形成算法之后，該系統(tǒng)可利用波束形成算法處理從陣列麥克風接收的音頻數(shù)據。該系統(tǒng)可向運行的應用發(fā)送經處理的數(shù)據。在一些實施例中，在向運行的應用發(fā)送經處理的數(shù)據之前，該系統(tǒng)可應用噪聲抑制算法。在一些情況下，也可基于所檢測到的運行的應用和/或至少一個預先確定的設備設置來配置噪聲抑制算法。

【專利附圖】

【附圖說明】
[0010]為了描述可獲得本公開的上述和其他優(yōu)點及特征的方式，將通過參考附圖中示出的具體實施例來呈現(xiàn)以上簡述的原理的更為具體的描述。理解這些附圖僅示出了本公開的示例性實施例，并且因此不被視為是對本公開范圍的限制，將通過使用附圖以另外的特異性和細節(jié)來描述和解釋本文的原理，其中:
[0011]圖1示出了一種示例性系統(tǒng)實施例；
[0012]圖2示出了一種具有麥克風陣列的示例性計算設備；
[0013]圖3示出了示例性空間響應方向圖；
[0014]圖4示出了一種示例性音頻波束形成器配置過程；
[0015]圖5示出了系統(tǒng)信息的四種示例性表示；
[0016]圖6不出了一種不例性混合式固定-自適應波束方向圖方案；以及
[0017]圖7示出了一種示例性方法實施例。

【具體實施方式】
[0018]下面詳細論述本公開的各個實施例。雖然論述了具體實施例，但應當理解這僅僅為了說明目的而進行。相關領域的技術人員將認識到，在不脫離本公開的實質和范圍的情況下可以使用其他組件和配置。
[0019]本公開解決了在本領域中針對改善音頻信號處理以從背景噪聲隔離聲音的需求。利用本發(fā)明的技術，可通過基于計算設備的一個或多個屬性值調節(jié)音頻波束形成算法來改善噪聲降低效果。在返回到音頻波束形成的更詳細描述之前，本公開首先闡述了可用于實踐本文所公開的概念的圖1中的基本通用系統(tǒng)或計算設備的論述。
[0020]參照圖1,示例性系統(tǒng)100包括通用計算設備100,所述通用計算設備100包括處理單元(CPU或處理器)120以及將各種系統(tǒng)組件耦接到處理器120的系統(tǒng)總線110，這些系統(tǒng)組件包括諸如只讀存儲器(ROM) 140和隨機存取存儲器(RAM) 150的系統(tǒng)存儲器130。系統(tǒng)100可包括直接與處理器120連接的、與處理器120緊鄰的、或作為處理器120整體的一部分的高速緩存122。系統(tǒng)100將數(shù)據從存儲器130和/或存儲設備160復制到高速緩存122，用于處理器120快速訪問。通過這種方式，高速緩存122提供避免處理器120在等待數(shù)據時延遲的性能提升。這些和其他模塊可以控制或被配置為控制處理器120以執(zhí)行各種動作。其他系統(tǒng)存儲器130也可供使用。存儲器130可包括具有不同性能特性的多個不同類型的存儲器?？梢岳斫?，本公開可以在具有不止一個處理器120的計算設備100上或者在聯(lián)網在一起以提供更大處理能力的計算設備的群組或群集上操作。處理器120可包括任何通用處理器和硬件模塊或軟件模塊，諸如存儲在存儲設備160中的模塊1162、模塊2164、和模塊3166，所述任何通用處理器和硬件模塊或軟件模塊被配置為控制處理器120以及在軟件指令并入實際處理器設計中的情況下的專用處理器。處理器120基本上可以是完全獨立成套的計算系統(tǒng)，包含多個核或處理器、總線、存儲器控制器、高速緩存等。多核處理器可以是對稱的或非對稱的。
[0021]系統(tǒng)總線110可以是若干類型的總線結構中的任一種，包括存儲器總線或存儲器控制器、外圍總線，以及使用多種總線架構中任一種的局域總線。存儲在ROM 140等中的基本輸入/輸出(B1S)可以提供基本例程，其有助于在諸如啟動期間在計算設備100內的元件之間傳輸信息。計算設備100還包括存儲設備160，諸如硬盤驅動器、磁盤驅動器、光盤驅動器、磁帶驅動器等。存儲設備160可包括軟件模塊162、164、166，用于控制處理器120?？梢栽O想其他硬件或軟件模塊。存儲設備160由驅動接口連接到系統(tǒng)總線110。驅動器和相關聯(lián)的計算機可讀存儲介質為計算設備100提供計算機可讀指令、數(shù)據結構、程序模塊和其他數(shù)據的非易失性存儲。在一個方面，執(zhí)行特定功能的硬件模塊包括存儲在與必要的硬件組件(諸如處理器120、總線110、輸出設備170等)相連的非暫態(tài)計算機可讀介質中的軟件組件來執(zhí)行功能?；窘M件是本領域的技術人員已知的，并且根據設備類型(諸如，設備100是否為小型的手持式計算設備、臺式計算機、或計算機服務器)設想到適當?shù)淖冃汀?br> [0022]雖然本文所描述的示例性實施例采用了硬盤160，但本領域的技術人員應當理解，在示例性操作環(huán)境中也可以使用其他類型的計算機可讀介質(其可以存儲可由計算機訪問的數(shù)據)，諸如磁卡帶、閃存卡、數(shù)字通用光盤、磁盒、隨機存取存儲器(RAM) 150、只讀存儲器(ROM) 140、包含比特流的線纜或無線信號等。非暫態(tài)計算機可讀存儲介質明確地排除諸如能量、載波信號、電磁波、和信號本身這樣的介質。
[0023]為了使得用戶能夠與計算設備100進行交互，輸入設備190代表任何數(shù)量的輸入機構，諸如用于語音的麥克風、用于手勢或圖形輸入的觸摸屏、鍵盤、鼠標、運動輸入、語音等。在一些情況下，麥克風可以是麥克風的陣列。輸出設備170也可以是本領域的技術人員已知的多個輸出機構中的一個或多個。在一些情況下，多模系統(tǒng)允許用戶提供多種輸入類型以與計算設備100通信。通信接口 180通常支配和管理用戶輸入和系統(tǒng)輸出。沒有將操作限制在任何特定硬件布置上，因此，本文的基本特征可以容易地在開發(fā)出改進的硬件或固件布置之后替換為這些硬件或固件布置。
[0024]為了清楚地說明，示例性系統(tǒng)實施例被呈現(xiàn)為包括各個功能塊，這些塊包括標記為“處理器”或處理器120的功能塊。這些塊代表的功能可以通過使用共享的或專用的硬件(包括但不限于能夠執(zhí)行軟件和硬件的硬件，諸如處理器120，其按照目的進行構建以作為執(zhí)行在通用處理器上的軟件的等同物操作)來提供。例如，可以由單個共享的處理器或多個處理器提供圖1中給出的一個或多個處理器的功能。(術語“處理器”的使用不應當解釋為唯一地指代能夠執(zhí)行軟件的硬件。)示例性實施例可包括微處理器和/或數(shù)字信號處理器(DSP)硬件、用于存儲執(zhí)行下文論述的操作的軟件的只讀存儲器(ROM) 140、以及用于存儲結果的隨機存取存儲器(RAM) 150。也可以提供超大規(guī)模集成(VLSI)硬件實施例以及結合通用DSP電路的定制VLSI電路。
[0025]各種實施例的邏輯操作被實現(xiàn)為:(I)運行于通用計算機內的可編程電路上的一系列計算機實施的步驟、操作、或過程；(2)運行于專用可編程電路上的一系列計算機實施的步驟、操作、或過程；和/或(3)可編程電路內互連的機器模塊或程序引擎。圖1中示出的系統(tǒng)100可以實踐所陳述方法的全部或一部分，可以是所陳述系統(tǒng)的一部分，和/或可以根據所陳述非暫態(tài)計算機可讀存儲介質中的指令進行操作。此類邏輯操作可以實現(xiàn)為被配置為控制處理器120以根據模塊的編程執(zhí)行特定功能的模塊。例如，圖1示出了三個模塊Modll62、Mod2164和Mod3166，它們是被配置為控制處理器120的模塊。這些模塊可以存儲在存儲設備160上，并且在運行時加載到RAM 150或存儲器130中，或者可以如本領域中已知的那樣存儲在其他計算機可讀存儲器位置中。
[0026]在公開本發(fā)明技術的詳細描述之前，本公開轉到如何使用音頻波束形成來處理音頻信號的簡要介紹性描述方面。音頻波束形成是一種技術，其中組合從兩個或更多個麥克風接收的聲音以便使得能夠優(yōu)先捕獲來自特定方向的聲音。使用音頻波束形成的計算設備可包括連接到處理器的兩個或更多個全向麥克風的陣列。例如，圖2示出了具有兩個麥克風202和204的陣列的示例性計算系統(tǒng)200，諸如類似圖1中的系統(tǒng)100的通用計算設備。麥克風陣列中麥克風的數(shù)量、間距、和/或放置可能隨著計算設備的配置而改變。在一些情況下，更大數(shù)量的麥克風可提供更準確的空間噪聲降低。然而，更大數(shù)量的麥克風也可能增加處理成本。盡管圖2中繪示了移動計算設備，但可以將音頻波束形成用于包括麥克風陣列的任何計算設備上，諸如臺式計算機；移動計算機；手持式通信設備，例如移動電話、智能電話、平板電腦；智能電視；機頂盒；和/或配備有麥克風陣列的任何其他計算設備。此夕卜，可以配置麥克風陣列，使得僅有這些麥克風的一個子集是活動的。即，可以停用這些麥克風的一個子集，例如，在準確度不那么重要且處理成本較高時。
[0027]如上所述，麥克風可以是全向的。然而，存在多種不同的麥克風形狀，每種形狀都可具有基于噪聲方向的不同噪聲降低能力。例如，可以使用不同的形狀以降低來自特定方向的噪聲。為了利用不同麥克風形狀的優(yōu)點，可以向麥克風應用空間響應或波束方向圖以創(chuàng)建虛擬麥克風。例如，圖3示出了四種可能的空間響應方向圖:8字形302、心形304、超心形306、和亞心形308。在每個圖形302、304、306和308中，外圈表示全向麥克風在每個波束方向的增益。內部形狀表示應用對應方向圖時在每個方向的增益。例如，圖形302表示應用8字形方向圖時的增益。圖形302還示出可以使用8字形方向圖來降低來自90度和270度方向的噪聲。也可以使用另外的波束方向圖。此外，應用的方向圖可以是固定的或自適應的。就基于固定方向圖的音頻波束形成而言，不論頻率如何，都可以應用相同的方向圖。然而，當音頻波束形成基于自適應方向圖時，方向圖可根據噪聲方向而改變。在一些情況下，方向圖也可以基于頻率變化。例如，當噪聲方向跨不同頻率變化時，方向圖可從亞心形轉變?yōu)樾男?。在另一個實例中，方向圖可從第一加權心形轉變?yōu)榈诙訖嘈男巍?br> [0028]在從每個活動的麥克風接收信號之后，處理器可組合信號以生成背景噪聲降低的單個輸出。在一些情況下，信號可以應用自適應和/或固定的波束方向圖。此外，可以應用多個不同的波束方向圖。
[0029]已經公開了可以如何利用音頻波束形成來處理音頻信號的介紹性描述，本公開現(xiàn)在返回到基于計算設備的一個或多個屬性值來選擇音頻波束形成算法屬性的論述。音頻波束形成技術的一個可能局限性可以在于，盡管音頻波束形成可以是自適應的，但就隨著頻率變化而可以應用不同波束方向圖而言，音頻波束形成未考慮到在計算設備環(huán)境之內的變化。這可能導致非最優(yōu)的噪聲降低效果。即，可以通過合并另外的計算環(huán)境特性來改善方向性噪聲降低效果。例如，基于自適應方向圖的音頻波束形成可產生具有可能是人耳可察覺的人為噪聲的音頻結果，但產生的音頻數(shù)據可能非常適合自動化的語音識別。
[0030]為了解決這一局限性并產生改善的噪聲降低效果，可以動態(tài)調節(jié)音頻波束形成器，使得其適應計算設備的當前狀態(tài)?？梢耘渲靡纛l波束形成器以加載自適應或固定模式和/或加載不同的預定義的空間響應方向圖。這些配置選項可以基于活動的應用和/或系統(tǒng)狀態(tài)。例如，如果已知將由語音識別應用使用輸入信號，則音頻波束形成算法可使用自適應方向圖。在另一個實例中，如果已知將由方便一個或多個用戶間音頻和/或視頻通信的應用使用輸入信號，則音頻波束形成算法可使用固定方向圖。此外，可以基于系統(tǒng)的另外屬性，諸如風扇速度和/或當前音頻路由，例如耳機、內置揚聲器等，來選擇應用于自適應或固定算法的方向圖。也可以利用另外的系統(tǒng)屬性，諸如風扇和/或揚聲器相對于麥克風陣列的放置。
[0031 ] 圖4示出了一示例性音頻波束形成器配置過程400，其可發(fā)生于諸如圖2中計算設備200的計算設備上。計算設備200可以正在運行一個或多個應用，諸如語音輸入應用、音頻通信應用、視頻聊天應用、音頻錄制應用、音樂播放應用等。在一些情況下，一個應用可以是活動的，同時其他應用正運行于后臺中和/或被暫停。此外，在一些情況下，活動的或主應用可以使用可利用音頻波束形成處理的輸入音頻數(shù)據。
[0032]計算系統(tǒng)200可接收麥克風陣列音頻數(shù)據404，該麥克風陣列音頻數(shù)據404可以作為輸入被提供到波束形成器402。響應于計算系統(tǒng)200接收到麥克風陣列音頻數(shù)據404，計算系統(tǒng)200之內的控制模塊408可檢測關于計算系統(tǒng)200狀態(tài)的系統(tǒng)信息410。在一些情況下，系統(tǒng)信息410可指示什么應用當前是活動的，諸如語音輸入應用，例如由Apple Inc.(Cupertino, CA)發(fā)布的Siri應用；音頻和/或視頻通信應用，例如由Apple Inc.發(fā)布的FaceTime應用；音頻錄制應用；或音樂播放應用。此外，系統(tǒng)信息410可包括其他系統(tǒng)狀態(tài)，諸如風扇是否是活動的或風扇的速度。
[0033]系統(tǒng)信息410的表示可隨著系統(tǒng)配置和/或信息類型而變化。例如，系統(tǒng)信息410可以被表示為列出應用類型分類和活動水平的表格?；顒铀娇梢允潜硎咎囟愋蛻檬欠袷腔顒拥亩M制值。在一些情況下，活動水平可具有多個狀態(tài)，諸如活動的、非活動的、后臺、暫停等。在另一個實例中，系統(tǒng)信息410可以被表示為列出應用標識符和活動水平的表格，應用標識符諸如是特定應用的名稱或某種其他唯一標識符。同樣，活動水平可以是二進制值或者可具有多個可能值。圖5示出了特定于運行于計算系統(tǒng)200上的應用的狀態(tài)的系統(tǒng)信息410的四種示例性表示。系統(tǒng)信息410的其他表示也是可能的，諸如針對應用信息的單個變量?？梢詫⒃撟兞吭O置為表示特定應用或應用類型的唯一標識符?？梢岳妙愃萍夹g表示其他系統(tǒng)狀態(tài)。例如，可以使用二進制值來指示系統(tǒng)風扇打開還是關閉。或者，可以使用諸如整數(shù)的數(shù)值來表示風扇速度。
[0034]重新參照圖4，在處理音頻數(shù)據404時，控制模塊408可使用系統(tǒng)信息410來選擇要用于波束形成器402中的模式和/或方向圖。在一些情況下，控制模塊408可使用關于什么應用類型或特定應用是活動的信息來在固定和自適應模式之間進行選擇。例如，如果應用類型是音頻通信，則控制模塊408可選擇固定模式。在另一個實例中，如果應用類型是語音識別，則控制模塊408可選擇完全自適應。在一些情況下，控制模塊408可在選擇模式時額外地或替代地使用其他系統(tǒng)狀態(tài)，諸如風扇速度。
[0035]除選擇模式之外，控制模塊408還可使用系統(tǒng)信息410來任選地選擇特定方向圖或方向圖序列。例如，如果應用類型是音頻通信，則控制模塊408可選擇心形方向圖。在另一個實例中，如果應用類型是音頻通信且計算系統(tǒng)具有特定配置的麥克風陣列和揚聲器放置，則控制模塊408可選擇超心形方向圖。在另一個實例中，如果風扇運行于高于預定義的風扇速度，則控制模塊408可選擇亞心形方向圖。另外和/或替代的方向圖選擇也是可以的。
[0036]控制模塊408還可以選擇將由波束形成器402在自適應模式中使用的方向圖序列，自適應模式是固定和自適應方向圖的混合。圖6示出了一示例性混合式固定-自適應波束方向圖方案600。如圖所示，隨著信號頻率的變化，波束方向圖可在三種方向圖，即全向、心形和8字形之間變化。在該實例中，每個頻帶都在兩個方向圖類型之間變化。傾斜線，諸如線條602，可表示隨著頻率增大，可以使用自適應模式，其可在兩種方向圖之間改變方向圖。例如，線條602表示隨著頻率增大，方向圖從全向轉變?yōu)樾男巍７莾A斜線，諸如線條604，可表示隨著頻率增大，方向圖可保持固定。例如,線條604表示隨著頻率增大，使用固定的心形方向圖。用于混合式固定-自適應模式的序列中的方向圖數(shù)量可隨著系統(tǒng)配置而變化和/或可基于系統(tǒng)?目息410。另外，方向圖保持固定的適應率和/或頻率范圍可隨著系統(tǒng)配置而變化和/或可基于系統(tǒng)信息410。
[0037]重新參照圖4，在基于系統(tǒng)信息410做出選擇之后，控制模塊408可向波束形成器402發(fā)送模式和/或波束方向圖406。然后波束形成器402可處理音頻數(shù)據404。在處理音頻數(shù)據404之后，波束形成器402可任選地向噪聲抑制模塊414發(fā)送經處理的音頻數(shù)據404?？刂颇K408也可以利用系統(tǒng)信息410生成抑制強度噪聲輪廓412，控制模塊408可將其提供到噪聲抑制模塊414。噪聲抑制模塊414可使用抑制強度噪聲輪廓412處理接收的音頻數(shù)據404。在完成所有處理之后，可以將經處理的音頻數(shù)據404發(fā)送到活動的應用416。
[0038]圖7是示出了用于基于系統(tǒng)設置來配置音頻波束形成算法的一示例性方法700的流程圖。為了清楚起見，根據諸如圖2中所示的示例性系統(tǒng)200來論述該方法。雖然圖7中示出了具體步驟，但在其他實施例中，方法可具有比所示出的更多或更少的步驟。在系統(tǒng)200從麥克風陣列接收到音頻數(shù)據(702)時，可以開始音頻波束形成算法的配置。在接收到數(shù)據之后，系統(tǒng)200可檢測第一預先確定的運行應用(704)。在一些情況下，第一預先確定的運行應用可以是語音輸入應用、語音識別應用、音頻通信應用、視頻聊天應用、或音頻錄制應用。在一些實施例中，系統(tǒng)還可檢測至少一個預先確定的設備設置。所述至少一個預先確定的設備設置可以是風扇速度、當前音頻路由、和/或麥克風和揚聲器放置的配置。
[0039]系統(tǒng)200可檢查第一預先確定的運行應用，以及任選的所述至少一個預先確定的設備設置，是否對應于模式波束方向圖(706)。如果系統(tǒng)200可辨識對應的模式波束方向圖，則系統(tǒng)200可選擇所辨識的模式波束方向圖(708)。模式波束方向圖可指定模式(例如固定或自適應)和/或波束方向圖(例如，全向、心形、超心形、亞心形、8字形等)?；谒x擇的模式波束方向圖，該系統(tǒng)可配置音頻波束形成算法(710)。在一些情況下，該配置可使波束形成器加載模式波束方向圖中指定的模式和/或波束方向圖。在一些情況下，該系統(tǒng)可具有默認模式和/或方向圖，使得如果在模式波束方向圖中未指定模式和/或方向圖或不能找到對應的模式波束方向圖，則可以使用默認值來配置音頻波束形成算法。如果系統(tǒng)200無法辨識對應的模式波束方向圖，則系統(tǒng)200可繼續(xù)處理音頻數(shù)據而不對音頻波束形成算法做出任何配置調節(jié)?；蛘撸到y(tǒng)200可利用默認值配置音頻波束形成算法。
[0040]在配置音頻波束形成算法之后，該系統(tǒng)可利用經配置的波束形成算法來處理音頻數(shù)據。此外，該系統(tǒng)可向第一預先確定的運行應用發(fā)送經處理的數(shù)據(712)。在一些實施例中，在向第一預先確定的運行應用發(fā)送經處理的音頻數(shù)據之前，系統(tǒng)可向經處理的音頻數(shù)據應用噪聲抑制算法。另外，該系統(tǒng)可使用第一預先確定的運行應用和/或所述至少一個預先確定的設備設置來生成抑制強度噪聲輪廓。該系統(tǒng)可在噪聲抑制算法中使用抑制強度噪聲輪廓。在一些情況下，抑制強度噪聲輪廓可以是噪聲基底。在完成步驟712之后，系統(tǒng)200可重新開始先前的處理，這可包括重復方法600。
[0041]本公開的范圍內的實施例也可包括有形和/或非暫態(tài)計算機可讀存儲介質，其用于承載或具有存儲在其上的計算機可執(zhí)行指令或數(shù)據結構。此類非暫態(tài)計算機可讀存儲介質可以是可由通用或專用計算機訪問的任何可用介質，包括上文論述的任何專用處理器的功能設計。以舉例而非限制的方式，此類非暫態(tài)計算機可讀介質可包括RAM、ROM、EEPROM、CD-ROM或其他光盤存儲、磁盤存儲或其他磁性存儲設備，或任何其他介質，其可用來承載或存儲呈計算機可執(zhí)行指令、數(shù)據結構或處理器芯片設計形式的所需程序代碼裝置。當信息經由網絡或另一通信連接(硬連線的、無線的，或它們的組合)傳送或提供至計算機時，計算機適當?shù)貙⒃撨B接視為計算機可讀介質。因此，任何這種連接被適當?shù)胤Q為計算機可讀介質。上述的組合也應該包括在計算機可讀介質的范圍內。
[0042]計算機可執(zhí)行指令包括例如使得通用計算機、專用計算機、或專用處理設備執(zhí)行某些功能或一組功能的指令和數(shù)據。計算機可執(zhí)行指令也包括由計算機在獨立或網絡環(huán)境中執(zhí)行的程序模塊。通常，程序模塊包括執(zhí)行特定任務或實現(xiàn)特定抽象數(shù)據類型的例程、程序、組件、數(shù)據結構、對象、和專用處理器設計中固有的功能等。計算機可執(zhí)行指令、相關聯(lián)的數(shù)據結構、和程序模塊代表用于執(zhí)行本文所公開的方法的步驟的程序代碼裝置的實例。此類可執(zhí)行指令或相關聯(lián)的數(shù)據結構的特定序列代表用于實現(xiàn)在此類步驟中描述的功能的對應動作的實例。
[0043]本領域的技術人員將會理解，本公開的其他實施例可以在具有許多類型的計算機系統(tǒng)配置的網絡計算環(huán)境中實踐，包括個人計算機、手持設備、多處理器系統(tǒng)、基于微處理器的或可編程的消費電子產品、網絡PC、微型計算機、大型計算機等。實施例也可在分布式計算環(huán)境中實踐，其中任務由通過通信網絡(要么由硬連線鏈路、無線鏈路，要么由它們的組合)連接的本地和遠程處理設備來執(zhí)行。在分布式計算環(huán)境中，程序模塊可位于本地存儲器存儲設備和遠程存儲器存儲設備兩者中。
[0044]上文描述的各實施例僅僅以例示方式提供，而不應解釋為限制本公開的范圍。本領域的技術人員將容易認識到，在不遵從本文舉例說明和描述的示例性實施例和應用且不脫離本公開的實質和范圍的情況下，可以對本文所描述的原理做出各種修改和變更。
【權利要求】
1.一種計算機實現(xiàn)的方法，包括: 經由麥克風陣列接收多個音頻信號；檢測第一預先確定的運行應用；基于所檢測到的第一預先確定的運行應用來配置音頻波束形成算法；以及向所述第一預先確定的運行應用發(fā)送經處理的音頻數(shù)據，其中所述經處理的音頻數(shù)據是通過向所述多個音頻信號應用所配置的音頻波束形成算法而生成的。
2.根據權利要求1所述的計算機實現(xiàn)的方法，其中配置所述音頻波束形成算法還包括基于所檢測到的第一預先確定的運行應用來設置模式波束方向圖，其中所述模式波束方向圖是自適應模式。
3.根據權利要求1所述的計算機實現(xiàn)的方法，還包括: 檢測至少一個預先確定的設備設置。
4.根據權利要求1所述的計算機實現(xiàn)的方法，還包括: 在向所述第一預先確定的運行應用發(fā)送所述經處理的音頻數(shù)據之前，向所述經處理的音頻數(shù)據應用噪聲抑制算法，其中所述噪聲抑制算法包括預先確定的噪聲基底。
5.根據權利要求3所述的計算機實現(xiàn)的方法，其中所述第一預先確定的運行應用是語音輸入應用、音頻通信應用、視頻聊天應用、或音頻錄制應用，并且其中所述預先確定的設備設置是高于閾值的風扇速度或活動的音頻輸出的通知。
6.一種系統(tǒng),包括: 處理器；麥克風陣列；計算機可讀存儲介質，其存儲用于控制所述處理器以執(zhí)行包括如下的步驟的指令:基于所檢測到的第一預先確定的運行應用，通過設置模式波束方向圖來配置音頻波束形成算法；通過向從所述麥克風陣列接收的多個音頻信號應用所配置的音頻波束形成算法來生成經處理的音頻數(shù)據；以及向所述第一預先確定的運行應用發(fā)送所述經處理的音頻數(shù)據。
7.根據權利要求6所述的系統(tǒng)，所述步驟還包括: 檢測至少一個預先確定的系統(tǒng)設置；以及基于所述至少一個預先確定的系統(tǒng)設置來配置所述音頻波束形成算法。
8.根據權利要求7所述的系統(tǒng)，其中所述至少一個預先確定的系統(tǒng)設置是風扇速度、當前音頻路由、或所述麥克風陣列的配置和揚聲器放置中的至少一者。
9.根據權利要求6所述的系統(tǒng)，其中所述模式波束方向圖能夠指定模式和波束方向圖。
10.根據權利要求9所述的系統(tǒng)，其中所述模式是自適應模式、固定模式、或混合式固定-自適應模式。
11.根據權利要求9所述的系統(tǒng)，其中所述波束方向圖是全向、心形、超心形、亞心形、8字形、或它們的序列。
12.—種存儲指令的非暫態(tài)計算機可讀存儲介質，所述指令在由計算設備執(zhí)行時，使所述計算設備執(zhí)行包括如下的步驟: 基于所檢測到的預先確定的運行應用來選擇模式波束方向圖；使用所選擇的模式波束方向圖來配置音頻波束形成算法；以及向所述預先確定的運行應用發(fā)送經處理的音頻數(shù)據，其中所述經處理的音頻數(shù)據是通過向從麥克風陣列接收的多個音頻信號應用所配置的音頻波束形成算法而生成的。
13.根據權利要求12所述的非暫態(tài)計算機可讀存儲介質，其中選擇所述模式波束方向圖還基于至少一個檢測到的當前設備設置。
14.根據權利要求13所述的非暫態(tài)計算機可讀存儲介質，還包括: 在向所述預先確定的運行應用發(fā)送所述經處理的音頻數(shù)據之前，向所述經處理的音頻數(shù)據應用噪聲抑制算法。
15.根據權利要求14所述的非暫態(tài)計算機可讀存儲介質，其中基于所述預先確定的運行算法或所述至少一個檢測到的當前設備設置中至少一者來配置所述噪聲抑制算法。
16.根據權利要求12所述的非暫態(tài)計算機可讀存儲介質，其中所檢測到的預先確定的運行應用是語音輸入應用、音頻通信應用、視頻聊天應用、或音頻錄制應用。
17.—種計算機實現(xiàn)的方法，包括: 經由麥克風陣列接收多個音頻信號；檢測預先確定的運行應用和至少一個預先確定的設備設置；基于所檢測到的預先確定的運行應用和所述至少一個預先確定的設備設置，通過設置模式波束方向圖來配置音頻波束形成算法；向所述多個音頻信號應用所配置的音頻波束形成算法以生成經處理的音頻數(shù)據；以及向所檢測到的預先確定的運行應用發(fā)送所述經處理的音頻數(shù)據。
18.根據權利要求17所述的計算機實現(xiàn)的方法，其中所檢測到的預先確定的運行應用是語音識別應用，并且其中所述模式波束方向圖指定自適應模式。
19.根據權利要求17所述的計算機實現(xiàn)的方法，其中所檢測到的預先確定的運行應用是音頻通信應用，并且其中所述模式波束方向圖指定固定模式。
20.根據權利要求19所述的計算機實現(xiàn)的方法，其中所述模式波束方向圖指定心形波束方向圖。
【文檔編號】G10L21/0208GK104335273SQ201380029700
【公開日】2015年2月4日申請日期:2013年5月13日優(yōu)先權日:2012年6月8日
【發(fā)明者】A·M·林達爾, R·艾薩克申請人:蘋果公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：A·M·林達爾;R·艾薩克
技術所有人：蘋果公司
我是此專利的發(fā)明人

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于系統(tǒng)狀態(tài)來調節(jié)音頻波束形成設置的制作方法