聲音信號優(yōu)化方法及裝置與流程

文檔序號：11954795閱讀：291來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本公開涉及語音信號處理領(lǐng)域，特別涉及一種聲音信號優(yōu)化方法及裝置。

背景技術(shù)：

隨著通訊和電子技術(shù)的不斷發(fā)展，智能手機(jī)、平板電腦、電子書閱讀器以及電子錄音筆等支持語音通話或者錄音功能的終端逐漸成為人們生活中不可缺少的工具，為人們的日常生活提供了極大的便利。

在此類終端的一種應(yīng)用方式中，多個(gè)用戶可以使用同一個(gè)支持錄音功能終端進(jìn)行會議錄音，或者，多個(gè)用戶可以使用同一個(gè)支持語音通話的終端與遠(yuǎn)端的其它用戶進(jìn)行電話會議；終端將錄制的聲音信號進(jìn)行存儲，或者，發(fā)送給語音通話的遠(yuǎn)端用戶。

技術(shù)實(shí)現(xiàn)要素：

本公開提供了一種聲音信號優(yōu)化方法及裝置。所述技術(shù)方案如下：

第一方面，提供一種聲音信號優(yōu)化方法，用于包含有至少兩個(gè)聲音采集單元的終端中，所述方法包括：

通過所述至少兩個(gè)聲音采集單元對所述終端周邊的聲源進(jìn)行定位；

從定位確定的各個(gè)聲源中篩選出指定聲源；

根據(jù)定位獲得的所述指定聲源的空間位置，確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號；

對所述指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化。

可選的，所述對所述指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化，包括：

將所述指定聲源發(fā)出的聲音信號的強(qiáng)度與預(yù)設(shè)的第一強(qiáng)度閾值和第二強(qiáng)度閾值進(jìn)行比較，所述第一強(qiáng)度閾值大于或者等于所述第二強(qiáng)度閾值；

若所述指定聲源發(fā)出的聲音信號的強(qiáng)度大于所述第一強(qiáng)度閾值，則將所述指定聲源發(fā)出的聲音信號的強(qiáng)度降低至所述第一強(qiáng)度閾值；

若所述指定聲源發(fā)出的聲音信號的強(qiáng)度小于所述第二強(qiáng)度閾值，則將所述指定聲源發(fā)出的聲音信號的強(qiáng)度增加至所述第二強(qiáng)度閾值。

可選的，所述通過所述至少兩個(gè)聲音采集單元對所述終端周邊的聲源進(jìn)行定位，包括：

獲取一聲源發(fā)出的聲音信號達(dá)到所述至少兩個(gè)聲音采集單元的時(shí)間差和相位差；

根據(jù)所述聲源發(fā)出的聲音信號達(dá)到所述至少兩個(gè)聲音采集單元的時(shí)間差和相位差確定所述聲源相對于所述終端的空間位置。

可選的，所述從定位確定的聲源中篩選出指定聲源，包括：

根據(jù)所述各個(gè)聲源的聲音信號的強(qiáng)度和/或聲音信號的連續(xù)性，從所述各個(gè)聲源中篩選出所述指定聲源。

可選的，所述確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號之前，還包括：

通過所述終端中的姿態(tài)傳感器獲取所述終端的姿態(tài)；

根據(jù)所述終端的姿態(tài)對所述終端采集到的聲音信號進(jìn)行增益補(bǔ)償；

所述確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號，包括：

確定經(jīng)過增益補(bǔ)償后的聲音信號中，由所述指定聲源發(fā)出的聲音信號。

可選的，所述終端的姿態(tài)包括所述終端正面與水平面之間的夾角，所述根據(jù)所述終端的姿態(tài)對所述終端采集到的聲音信號進(jìn)行增益補(bǔ)償，包括：

根據(jù)所述終端正面與水平面之間的夾角確定補(bǔ)償數(shù)值，所述終端正面與水平面之間的夾角與所述補(bǔ)償數(shù)值之間成正比例關(guān)系；

根據(jù)所述補(bǔ)償數(shù)值對所述終端采集到的聲音信號進(jìn)行增益補(bǔ)償。

在第二方面，提供一種聲音信號優(yōu)化裝置，用于包含有至少兩個(gè)聲音采集單元的終端中，所述裝置包括：

定位模塊，用于通過所述至少兩個(gè)聲音采集單元對所述終端周邊的聲源進(jìn)行定位；

篩選模塊，用于從定位確定的各個(gè)聲源中篩選出指定聲源；

聲音信號確定模塊，用于根據(jù)定位獲得的所述指定聲源的空間位置，確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號；

優(yōu)化模塊，用于對所述指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化。

可選的，所述優(yōu)化模塊，包括：

比較子模塊，用于將所述指定聲源發(fā)出的聲音信號的強(qiáng)度與預(yù)設(shè)的第一強(qiáng)度閾值和第二強(qiáng)度閾值進(jìn)行比較，所述第一強(qiáng)度閾值大于或者等于所述第二強(qiáng)度閾值；

降低子模塊，用于若所述指定聲源發(fā)出的聲音信號的強(qiáng)度大于所述第一強(qiáng)度閾值，則將所述指定聲源發(fā)出的聲音信號的強(qiáng)度降低至所述第一強(qiáng)度閾值；

增加子模塊，用于若所述指定聲源發(fā)出的聲音信號的強(qiáng)度小于所述第二強(qiáng)度閾值，則將所述指定聲源發(fā)出的聲音信號的強(qiáng)度增加至所述第二強(qiáng)度閾值。

可選的，所述定位模塊，包括：

獲取子模塊，用于獲取一聲源發(fā)出的聲音信號達(dá)到所述至少兩個(gè)聲音采集單元的時(shí)間差和相位差；

定位子模塊，用于根據(jù)所述聲源發(fā)出的聲音信號達(dá)到所述至少兩個(gè)聲音采集單元的時(shí)間差和相位差確定所述聲源相對于所述終端的空間位置。

可選的，所述篩選模塊，用于根據(jù)所述各個(gè)聲源的聲音信號的強(qiáng)度和/或聲音信號的連續(xù)性，從所述各個(gè)聲源中篩選出所述指定聲源。

可選的，所述裝置還包括：姿態(tài)獲取模塊和補(bǔ)償模塊；

所述姿態(tài)獲取模塊，用于在所述聲音信號確定模塊確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號之前，通過所述終端中的姿態(tài)傳感器獲取所述終端的姿態(tài)；

所述補(bǔ)償模塊，用于根據(jù)所述終端的姿態(tài)對所述終端采集到的聲音信號進(jìn)行增益補(bǔ)償；

所述聲音信號確定模塊，用于確定經(jīng)過增益補(bǔ)償后的聲音信號中，由所述指定聲源發(fā)出的聲音信號。

可選的，所述補(bǔ)償模塊，包括：

數(shù)值確定子模塊，用于根據(jù)所述終端正面與水平面之間的夾角確定補(bǔ)償數(shù)值，所述終端正面與水平面之間的夾角與所述補(bǔ)償數(shù)值之間成正比例關(guān)系；

補(bǔ)償子模塊，用于根據(jù)所述補(bǔ)償數(shù)值對所述終端采集到的聲音信號進(jìn)行增益補(bǔ)償；

其中，所述終端的姿態(tài)包括所述終端正面與水平面之間的夾角。

第三方面，提供一種聲音信號優(yōu)化方法裝置，用于包含有至少兩個(gè)聲音采集單元的終端中，所述裝置包括：

處理器；

用于存儲處理器可執(zhí)行指令的存儲器；

其中，所述處理器被配置為：

通過所述至少兩個(gè)聲音采集單元對所述終端周邊的聲源進(jìn)行定位；

從定位確定的各個(gè)聲源中篩選出指定聲源；

根據(jù)定位獲得的所述指定聲源的空間位置，確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號；

對由所述指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化。。

本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果：

通過至少兩個(gè)聲音采集單元對終端周邊的聲源進(jìn)行定位，從定位確定的各個(gè)聲源中篩選出指定聲源，根據(jù)定位獲得的該指定聲源的空間位置，確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號，對該指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化；當(dāng)終端在采集聲音信號時(shí)，對周邊聲源進(jìn)行篩選，并對篩選出的聲源發(fā)出的聲音信號進(jìn)行優(yōu)化，從提高終端對聲音信號的采集效果。

應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的，并不能限制本公開。

附圖說明

此處的附圖被并入說明書中并構(gòu)成本說明書的一部分，示出了符合本發(fā)明的實(shí)施例，并于說明書一起用于解釋本發(fā)明的原理。

圖1是根據(jù)一示例性實(shí)施例示出的一種聲音信號優(yōu)化方法的流程圖；

圖2是根據(jù)另一示例性實(shí)施例示出的一種聲音信號優(yōu)化方法的流程圖；

圖3是根據(jù)另一示例性實(shí)施例示出的一種定位方法的流程圖；

圖4是根據(jù)另一示例性實(shí)施例示出的一種增益補(bǔ)償方法的流程圖；

圖5是根據(jù)一示例性實(shí)施例示出的一種聲音信號優(yōu)化裝置的框圖；

圖6是根據(jù)另一示例性實(shí)施例示出的一種聲音信號優(yōu)化裝置的框圖；

圖7是根據(jù)一示例性實(shí)施例示出的一種裝置的框圖。

具體實(shí)施方式

這里將詳細(xì)地對示例性實(shí)施例執(zhí)行說明，其示例表示在附圖中。下面的描述涉及附圖時(shí)，除非另有表示，不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反，它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。

圖1是根據(jù)一示例性實(shí)施例示出的一種聲音信號優(yōu)化方法的流程圖。該聲音信號優(yōu)化方法可以用于包含有至少兩個(gè)聲音采集單元的終端中，該終端可以是智能手機(jī)、平板電腦、電子書閱讀器以及智能錄音筆等支持語音通話或者錄音功能的智能終端。如圖1所示，該聲音信號優(yōu)化方法可以包括以下步驟。

在步驟102中，通過至少兩個(gè)聲音采集單元對終端周邊的聲源進(jìn)行定位。

在步驟104中，從定位確定的各個(gè)聲源中篩選出指定聲源。

在步驟106中，根據(jù)定位獲得的該指定聲源的空間位置，確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號。

在步驟108中，對該指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化。

可選的，該對采集到的該指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化，包括：

將該指定聲源發(fā)出的聲音信號的強(qiáng)度與預(yù)設(shè)的第一強(qiáng)度閾值和第二強(qiáng)度閾值進(jìn)行比較，該第一強(qiáng)度閾值大于或者等于該第二強(qiáng)度閾值；

若該指定聲源發(fā)出的聲音信號的強(qiáng)度大于該第一強(qiáng)度閾值，則將該指定聲源發(fā)出的聲音信號的強(qiáng)度降低至該第一強(qiáng)度閾值；

若該指定聲源發(fā)出的聲音信號的強(qiáng)度小于該第二強(qiáng)度閾值，則將該指定聲源發(fā)出的聲音信號的強(qiáng)度增加至該第二強(qiáng)度閾值。

可選的，該通過該至少兩個(gè)聲音采集單元對該終端周邊的聲源進(jìn)行定位，包括：

獲取一聲源發(fā)出的聲音信號達(dá)到該至少兩個(gè)聲音采集單元的時(shí)間差和相位差；

根據(jù)該聲源發(fā)出的聲音信號達(dá)到該至少兩個(gè)聲音采集單元的時(shí)間差和相位差確定該聲源相對于該終端的空間位置。

可選的，該從定位確定的聲源中篩選出指定聲源，包括：

根據(jù)該各個(gè)聲源的聲音信號的強(qiáng)度和/或聲音信號的連續(xù)性，從該各個(gè)聲源中篩選出指定聲源。

可選的，該確定終端采集到的聲音信號中由指定聲源發(fā)出的聲音信號之前，還包括：

通過該終端中的姿態(tài)傳感器獲取該終端的姿態(tài)；

根據(jù)該終端的姿態(tài)對該終端采集到的聲音信號進(jìn)行增益補(bǔ)償；

該確定終端采集到的聲音信號中由指定聲源發(fā)出的聲音信號，包括：

確定經(jīng)過增益補(bǔ)償后的聲音信號中，由該指定聲源發(fā)出的聲音信號。

可選的，該終端的姿態(tài)包括該終端正面與水平面之間的夾角，該根據(jù)該終端的姿態(tài)對該終端采集到的聲音信號進(jìn)行增益補(bǔ)償，包括：

根據(jù)該終端正面與水平面之間的夾角確定補(bǔ)償數(shù)值，該終端正面與水平面之間的夾角與該補(bǔ)償數(shù)值之間成正比例關(guān)系；

根據(jù)該補(bǔ)償數(shù)值對該終端采集到的聲音信號進(jìn)行增益補(bǔ)償。

綜上所述，本公開實(shí)施例中提供的聲音信號優(yōu)化方法，通過至少兩個(gè)聲音采集單元對終端周邊的聲源進(jìn)行定位，從定位確定的各個(gè)聲源中篩選出指定聲源，根據(jù)定位獲得的該指定聲源的空間位置，確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號，對該指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化；當(dāng)終端在采集聲音信號時(shí)，對周邊聲源進(jìn)行篩選，并對篩選出的聲源發(fā)出的聲音信號進(jìn)行優(yōu)化，從提高終端對聲音信號的采集效果。

圖2是根據(jù)另一示例性實(shí)施例示出的一種聲音信號優(yōu)化方法的流程圖。該聲音信號優(yōu)化方法可以用于包含有至少兩個(gè)聲音采集單元的終端中，該終端可以是智能手機(jī)、平板電腦、電子書閱讀器以及智能錄音筆等支持語音通話或者錄音功能的智能終端。如圖2所示，該聲音信號優(yōu)化方法可以包括以下步驟。

在步驟202中，通過至少兩個(gè)聲音采集單元對終端周邊的聲源進(jìn)行定位。

可選的，請參考圖3所示的定位方法的流程圖，該通過該至少兩個(gè)聲音采集單元對該終端周邊的聲源進(jìn)行定位的步驟可以如下：

在步驟202a中，獲取一聲源發(fā)出的聲音信號達(dá)到該至少兩個(gè)聲音采集單元的時(shí)間差和相位差。

其中，終端中包含的至少兩個(gè)聲音采集單元組成一個(gè)聲音采集單元陣列，由于聲源到該聲音采集單元陣列中的各個(gè)聲音采集單元的距離和方向都不相同，因此，該聲源發(fā)出的聲音傳遞到各個(gè)聲音采集單元的時(shí)間和相位也不相同。終端可以獲取該聲音采集單元陣列中的各個(gè)聲音采集單元采集到同一聲源發(fā)出的聲音的時(shí)間差和相位差。

在步驟202b中，根據(jù)該聲源發(fā)出的聲音信號達(dá)到該至少兩個(gè)聲音采集單元的時(shí)間差和相位差確定該聲源相對于該終端的空間位置。

終端可以利用波束成形技術(shù)定位聲源的位置，比如，終端可以根據(jù)該聲源發(fā)出的聲音信號達(dá)到該至少兩個(gè)聲音采集單元的時(shí)間差和相位差，通過延遲求和或者特征值分解等算法識別出聲源相對于終端的位置。

利用波束成形技術(shù)，終端不僅可以準(zhǔn)確的定位固定聲源的空間位置，還可以對移動(dòng)中的聲源進(jìn)行追蹤，以便對移動(dòng)中的聲源發(fā)出的信號持續(xù)進(jìn)行優(yōu)化處理。

在步驟204中，根據(jù)該各個(gè)聲源的聲音信號的強(qiáng)度和/或聲音信號的連續(xù)性，從該各個(gè)聲源中篩選出指定聲源。

終端在通話或者錄音狀態(tài)下時(shí)，通常只有用戶說話時(shí)發(fā)出的聲音信號才是有效的聲音信號，其它的聲音信號大多為噪聲，在本公開實(shí)施例所示的方案中，終端可以根據(jù)各個(gè)聲源的聲音信號的強(qiáng)度和/或聲音信號的連續(xù)性，從各個(gè)聲源中篩選出最有可能是用戶的聲源，后續(xù)只對篩選出的最有可能是用戶的聲源進(jìn)行優(yōu)化。

比如，終端可以為聲音信號的不同強(qiáng)度設(shè)置不同的權(quán)重，并為聲音信號的不同連續(xù)時(shí)間也設(shè)置不同權(quán)重，終端接收到一個(gè)聲源發(fā)出的聲音信號后，分別確定其聲音強(qiáng)度對應(yīng)的權(quán)重和持續(xù)時(shí)間對應(yīng)的權(quán)重進(jìn)行加權(quán)，并對各個(gè)聲源按照對應(yīng)的加權(quán)進(jìn)行排序，確定出加權(quán)最高的指定聲源。

可選的，在為聲音信號的不同強(qiáng)度設(shè)置不同的權(quán)重時(shí)，可以將最接近人說話聲音的強(qiáng)度設(shè)置較高的權(quán)重，與人說話聲音的強(qiáng)度之間的差值越大，對應(yīng)設(shè)置的權(quán)重越低。比如，人平時(shí)說話正常的聲音強(qiáng)度大約為40分貝，則可以對40分貝設(shè)置最高的加權(quán)，距離40分貝越遠(yuǎn)的聲音強(qiáng)度，其權(quán)重越低。

同樣的，在為聲音信號的持續(xù)時(shí)間設(shè)置不同權(quán)重時(shí)，可以將最接近人說話時(shí)的聲音信號的持續(xù)時(shí)間設(shè)置較高的權(quán)重，與人說話時(shí)的聲音信號的持續(xù)時(shí)間之間的差值越大，對應(yīng)設(shè)置的權(quán)重也越低。比如，人說話時(shí)，正常一句話的持續(xù)時(shí)間可能是2s，則可以對2s的持續(xù)時(shí)間設(shè)置最高的加權(quán)，與2s之間差距越大的持續(xù)時(shí)間，其權(quán)重越低。

由于錄音或者通話時(shí)，同一時(shí)間通常只有一個(gè)或者兩個(gè)用戶在說話，為了避免對過多的聲源進(jìn)行不必要的優(yōu)化處理，降低優(yōu)化過程的復(fù)雜度，可以設(shè)置同時(shí)篩選出的指定聲源的數(shù)量，比如，最多同一時(shí)間篩選出3個(gè)指定聲源，后續(xù)同一時(shí)間最多只對3個(gè)聲源發(fā)出的聲音信號進(jìn)行優(yōu)化。

在步驟206中，根據(jù)定位獲得的該指定聲源的空間位置，確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號。

終端對接收到的聲音信號進(jìn)行處理時(shí)，可以根據(jù)指定聲源的空間位置，只對該指定聲源發(fā)出的聲音信號進(jìn)行處理。

在步驟208中，將指定聲源發(fā)出的聲音信號的強(qiáng)度與預(yù)設(shè)的第一強(qiáng)度閾值和第二強(qiáng)度閾值進(jìn)行比較，該第一強(qiáng)度閾值大于或者等于該第二強(qiáng)度閾值。

在步驟210中，若該指定聲源發(fā)出的聲音信號的強(qiáng)度大于該第一強(qiáng)度閾值，則將該指定聲源發(fā)出的聲音信號的強(qiáng)度降低至該第一強(qiáng)度閾值。

在步驟212中，若該指定聲源發(fā)出的聲音信號的強(qiáng)度小于該第二強(qiáng)度閾值，則將該指定聲源發(fā)出的聲音信號的強(qiáng)度增加至該第二強(qiáng)度閾值。

可選的，若該指定聲源發(fā)出的聲音信號的強(qiáng)度不小于該第一強(qiáng)度閾值，且不大于該第二強(qiáng)度閾值，則不對指定聲源發(fā)出的聲音信號的強(qiáng)度進(jìn)行處理。

終端可以按照人正常說話時(shí)的聲音信號強(qiáng)度設(shè)置第一強(qiáng)度閾值和第二強(qiáng)度閾值，若指定聲源的聲音信號強(qiáng)度較大，則將該指定聲源的聲音信號的強(qiáng)度降低，若指定聲源的聲音信號強(qiáng)度較小，則將該指定聲源的聲音信號的強(qiáng)度提高，若指定聲源的聲音信號強(qiáng)度適中，則不對指定聲源的聲音信號的強(qiáng)度進(jìn)行處理。從而使可能是用戶的指定聲源發(fā)出的聲音信號的強(qiáng)度保持在一個(gè)預(yù)定的范圍內(nèi)，既不會太高，也不會太低，從而使錄音或者通話的效果達(dá)到最佳。

比如，以用戶A和用戶B通過智能手機(jī)進(jìn)行遠(yuǎn)程電話會議，或者，通過手機(jī)進(jìn)行會議錄音為例，控制智能手機(jī)進(jìn)入錄音狀態(tài)或者通話狀態(tài)時(shí)，將智能手機(jī)切換至?xí)h錄音模式，此時(shí)，智能手機(jī)通過至少兩個(gè)麥克風(fēng)采集周圍的聲音并確定各個(gè)聲源的位置，當(dāng)用戶A或者用戶B發(fā)言時(shí)，智能手機(jī)將發(fā)言者篩選為指定聲源，并對該發(fā)言者說話時(shí)發(fā)出的聲音信號進(jìn)行優(yōu)化，當(dāng)該發(fā)言者說話時(shí)發(fā)出的聲音信號強(qiáng)度小于30分貝時(shí)，將該發(fā)言者說話時(shí)發(fā)出的聲音信號的強(qiáng) 度提升為30分貝，當(dāng)該發(fā)言者說話時(shí)發(fā)出的聲音信號大于50分貝時(shí)，將該發(fā)言者說話時(shí)發(fā)出的聲音信號降低至50分貝，對于30分貝至50分貝之間的聲音信號，則不做任何處理。從而保證與智能手機(jī)之間的距離不同的各個(gè)用戶，其錄制或者被遠(yuǎn)端收聽到的說話音量都處于一個(gè)適當(dāng)?shù)姆秶鷥?nèi)，從而保證了錄音效果或者電話會議的通話效果。

綜上所述，本公開實(shí)施例中提供的聲音信號優(yōu)化方法，通過至少兩個(gè)聲音采集單元對終端周邊的聲源進(jìn)行定位，從定位確定的各個(gè)聲源中篩選出指定聲源，根據(jù)定位獲得的該指定聲源的空間位置，確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號，并將該指定聲源發(fā)出的聲音信號的強(qiáng)度調(diào)整至預(yù)先設(shè)置的兩個(gè)強(qiáng)度閾值之間，將終端采集到的指定聲源發(fā)出的聲音信號的強(qiáng)度調(diào)整到一個(gè)合適的范圍之內(nèi)，從提高終端在錄音或者通話時(shí)，對聲音信號的采集效果。

作為另一種可選的實(shí)施例，在執(zhí)行上述圖2所示實(shí)施例中的步驟206之前，還可以執(zhí)行如圖4所示的增益補(bǔ)償方法的流程圖中的步驟205a～步驟205c。

在步驟205a中，通過該終端中的姿態(tài)傳感器獲取該終端的姿態(tài)，該終端的姿態(tài)包括該終端正面與水平面之間的夾角。

正常情況下，在進(jìn)行錄音或者電話會議時(shí)，終端正面向上水平放置在桌面上，而在某一情況下，終端的姿態(tài)可能并不是水平的，比如，當(dāng)終端搭置在書本或者其它物體上時(shí)，其正面并不是水平狀態(tài)，此時(shí)，終端正面與水平面之間會呈一定的夾角，導(dǎo)致終端采集到的聲音信號與理想狀態(tài)之間有一定的偏差，與終端正面處于水平狀態(tài)時(shí)采集到的聲音信號相比偏小。

對此，終端從采集到的聲音信號中確定出指定聲源發(fā)出的聲音信號之前并做優(yōu)化處理之前，首先可以根據(jù)當(dāng)前姿態(tài)對采集到的聲音信號做一些補(bǔ)償。

在步驟205b中，根據(jù)該終端正面與水平面之間的夾角確定補(bǔ)償數(shù)值，該終端正面與水平面之間的夾角與該補(bǔ)償數(shù)值之間成正比例關(guān)系。

當(dāng)終端正面與水平面之間的夾角越大時(shí)，終端采集到的聲音信號與理想狀態(tài)(即終端正面處于水平狀態(tài))之間的偏差也越大，因此，終端可以根據(jù)終端正面與水平面之間的夾角，通過預(yù)先設(shè)置算法計(jì)算補(bǔ)償數(shù)值，或者通過預(yù)先存儲的對應(yīng)關(guān)系查詢需要補(bǔ)償?shù)臄?shù)值。

在步驟205c中，根據(jù)該補(bǔ)償數(shù)值對該終端采集到的聲音信號進(jìn)行增益補(bǔ)償。

終端確定出補(bǔ)償數(shù)值后，對采集到的所有聲音信號進(jìn)行增益補(bǔ)償。

其中，終端在確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號時(shí)，可以確定經(jīng)過增益補(bǔ)償后的聲音信號中，由該指定聲源發(fā)出的聲音信號。

綜上所述，本公開實(shí)施例中提供的方法，通過在從采集到的聲音信號中確定出指定聲源的聲音信號并做優(yōu)化之前，獲取終端的姿態(tài)，根據(jù)終端的姿態(tài)對終端采集到的聲音信號進(jìn)行增益補(bǔ)償，進(jìn)一步提高了終端在錄音或者通話時(shí)，對聲音信號的采集效果。

下述為本公開裝置實(shí)施例，可以用于執(zhí)行本公開方法實(shí)施例。對于本公開裝置實(shí)施例中未披露的細(xì)節(jié)，請參照本公開方法實(shí)施例。

圖5是根據(jù)一示例性實(shí)施例示出的一種聲音信號優(yōu)化裝置的框圖，該聲音信號優(yōu)化裝置可以用于包含有至少兩個(gè)聲音采集單元的終端中，該終端可以是智能手機(jī)、平板電腦、電子書閱讀器以及智能錄音筆等支持語音通話或者錄音功能的智能終端，執(zhí)行如圖1至4任一所示的方法。如圖5所示，該聲音信號優(yōu)化裝置包括但不限于：定位模塊501、篩選模塊502、聲音信號確定模塊503以及優(yōu)化模塊504；

所述定位模塊501被設(shè)置為用于通過所述至少兩個(gè)聲音采集單元對所述終端周邊的聲源進(jìn)行定位；

所述篩選模塊502被設(shè)置為用于從定位確定的各個(gè)聲源中篩選出指定聲源；

所述聲音信號確定模塊503被設(shè)置為用于根據(jù)定位獲得的所述指定聲源的空間位置，確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號；

所述優(yōu)化模塊504被設(shè)置為用于對所述指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化。

綜上所述，本公開實(shí)施例中提供的聲音信號優(yōu)化裝置，通過至少兩個(gè)聲音采集單元對終端周邊的聲源進(jìn)行定位，從定位確定的各個(gè)聲源中篩選出指定聲源，根據(jù)定位獲得的該指定聲源的空間位置，確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號，對該指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化；當(dāng)終端在采集聲音信號時(shí)，對周邊聲源進(jìn)行篩選，并對篩選出的聲源發(fā)出的聲音信號進(jìn)行優(yōu)化，從提高終端對聲音信號的采集效果。

圖6是根據(jù)一示例性實(shí)施例示出的一種聲音信號優(yōu)化裝置的框圖，該聲音信號優(yōu)化裝置可以用于包含有至少兩個(gè)聲音采集單元的終端中，該終端可以是智能手機(jī)、平板電腦、電子書閱讀器以及智能錄音筆等支持語音通話或者錄音功能的智能終端，執(zhí)行如圖1至4任一所示的方法。如圖6所示，該聲音信號優(yōu)化裝置包括但不限于：定位模塊501、篩選模塊502、聲音信號確定模塊503以及優(yōu)化模塊504；

所述定位模塊501被設(shè)置為用于通過所述至少兩個(gè)聲音采集單元對所述終端周邊的聲源進(jìn)行定位；

所述篩選模塊502被設(shè)置為用于從定位確定的各個(gè)聲源中篩選出指定聲源；

所述優(yōu)化模塊504被設(shè)置為用于對所述指定聲源發(fā)出的聲音信號進(jìn)行音量優(yōu)化。

可選的，所述優(yōu)化模塊504，包括：比較子模塊504a、降低子模塊504b以及增加子模塊504c；

所述比較子模塊504a被設(shè)置為用于將所述指定聲源發(fā)出的聲音信號的強(qiáng)度與預(yù)設(shè)的第一強(qiáng)度閾值和第二強(qiáng)度閾值進(jìn)行比較，所述第一強(qiáng)度閾值大于或者等于所述第二強(qiáng)度閾值；

所述降低子模塊504b被設(shè)置為用于若所述指定聲源發(fā)出的聲音信號的強(qiáng)度大于所述第一強(qiáng)度閾值，則將所述指定聲源發(fā)出的聲音信號的強(qiáng)度降低至所述第一強(qiáng)度閾值；

所述增加子模塊504c被設(shè)置為用于若所述指定聲源發(fā)出的聲音信號的強(qiáng)度小于所述第二強(qiáng)度閾值，則將所述指定聲源發(fā)出的聲音信號的強(qiáng)度增加至所述第二強(qiáng)度閾值。

可選的，所述定位模塊501，包括：獲取子模塊501a以及定位子模塊501b；

所述獲取子模塊501a被設(shè)置為用于獲取一聲源發(fā)出的聲音信號達(dá)到所述至少兩個(gè)聲音采集單元的時(shí)間差和相位差；

所述定位子模塊501b被設(shè)置為用于根據(jù)所述聲源發(fā)出的聲音信號達(dá)到所述至少兩個(gè)聲音采集單元的時(shí)間差和相位差確定所述聲源相對于所述終端的空間位置。

可選的，所述篩選模塊502被設(shè)置為用于根據(jù)所述各個(gè)聲源的聲音信號的強(qiáng)度和/或聲音信號的連續(xù)性，從所述各個(gè)聲源中篩選出所述指定聲源。

可選的，所述裝置還包括：姿態(tài)獲取模塊505和補(bǔ)償模塊506；

所述姿態(tài)獲取模塊505被設(shè)置為用于在所述聲音信號確定模塊503確定所述終端采集到的聲音信號中由所述指定聲源發(fā)出的聲音信號之前，通過所述終端中的姿態(tài)傳感器獲取所述終端的姿態(tài)；

所述補(bǔ)償模塊506被設(shè)置為用于根據(jù)所述終端的姿態(tài)對所述終端采集到的聲音信號進(jìn)行增益補(bǔ)償；

所述聲音信號確定模塊503被設(shè)置為用于確定經(jīng)過增益補(bǔ)償后的聲音信號中，由所述指定聲源發(fā)出的聲音信號。

可選的，所述補(bǔ)償模塊506，包括：數(shù)值確定子模塊506a以及補(bǔ)償子模塊506b；

所述數(shù)值確定子模塊506a被設(shè)置為用于根據(jù)所述終端正面與水平面之間的夾角確定補(bǔ)償數(shù)值，所述終端正面與水平面之間的夾角與所述補(bǔ)償數(shù)值之間成正比例關(guān)系；

所述補(bǔ)償子模塊506b被設(shè)置為用于根據(jù)所述補(bǔ)償數(shù)值對所述終端采集到的聲音信號進(jìn)行增益補(bǔ)償；

其中，所述終端的姿態(tài)包括所述終端正面與水平面之間的夾角。

綜上所述，本公開實(shí)施例中提供的聲音信號優(yōu)化裝置，通過至少兩個(gè)聲音采集單元對終端周邊的聲源進(jìn)行定位，從定位確定的各個(gè)聲源中篩選出指定聲源，根據(jù)定位獲得的該指定聲源的空間位置，確定該終端采集到的聲音信號中由該指定聲源發(fā)出的聲音信號，并將該指定聲源發(fā)出的聲音信號的強(qiáng)度調(diào)整至預(yù)先設(shè)置的兩個(gè)強(qiáng)度閾值之間，將終端采集到的指定聲源發(fā)出的聲音信號的強(qiáng)度調(diào)整到一個(gè)合適的范圍之內(nèi)，從提高終端在錄音或者通話時(shí)，對聲音信號的采集效果。

此外，本公開實(shí)施例中提供的裝置，通過在從采集到的聲音信號中確定出指定聲源的聲音信號并做優(yōu)化之前，獲取終端的姿態(tài)，根據(jù)終端的姿態(tài)對終端采集到的聲音信號進(jìn)行增益補(bǔ)償，進(jìn)一步提高了終端在錄音或者通話時(shí)，對聲音信號的采集效果。

圖7是根據(jù)一示例性實(shí)施例示出的一種裝置700的框圖。其中，該裝置中包含至少兩個(gè)聲音采集單元。例如，裝置700可以是移動(dòng)電話，計(jì)算機(jī)，數(shù)字廣播終端，消息收發(fā)設(shè)備，路由設(shè)備，游戲控制臺，平板設(shè)備，醫(yī)療設(shè)備，健身設(shè)備，個(gè)人數(shù)字助理等。

參照圖7，裝置700可以包括以下一個(gè)或多個(gè)組件：處理組件702，存儲器704，電源組件706，多媒體組件708，音頻組件710，輸入/輸出(I/O)的接口712，傳感器組件714，以及通信組件716。

處理組件702通常控制裝置700的整體操作，諸如與顯示，電話呼叫，數(shù)據(jù)通信，相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件702可以包括一個(gè)或多個(gè)處理器718來執(zhí)行指令，以完成上述的方法的全部或部分步驟。此外，處理組件702可以包括一個(gè)或多個(gè)模塊，便于處理組件702和其他組件之間的交互。例如，處理組件702可以包括多媒體模塊，以方便多媒體組件708和處理組件702之間的交互。

存儲器704被配置為存儲各種類型的數(shù)據(jù)以支持在裝置700的操作。這些數(shù)據(jù)的示例包括用于在裝置700上操作的任何應(yīng)用程序或方法的指令，聯(lián)系人數(shù)據(jù)，電話簿數(shù)據(jù)，消息，圖片，視頻等。存儲器704可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實(shí)現(xiàn)，如靜態(tài)隨機(jī)存取存儲器(SRAM)，電可擦除可編程只讀存儲器(EEPROM)，可擦除可編程只讀存儲器(EPROM)，可編程只讀存儲器(PROM)，只讀存儲器(ROM)，磁存儲器，快閃存儲器，磁盤或光盤。存儲器704中還存儲有一個(gè)或多個(gè)模塊，該一個(gè)或多個(gè)模塊被配置成由該一個(gè)或多個(gè)處理器720執(zhí)行，以完成上述圖1至4任一所示的方法的全部或部分步驟。

電源組件706為裝置700的各種組件提供電力。電源組件706可以包括電源管理系統(tǒng)，一個(gè)或多個(gè)電源，及其他與為裝置700生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件708包括在所述裝置700和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中，屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板，屏幕可以被實(shí)現(xiàn)為觸摸屏，以接收來自用戶的輸入信號。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測觸摸、滑動(dòng)和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動(dòng)動(dòng)作的邊界，而且還檢測與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中，多媒體組件708包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置700處于操作模式，如拍攝模式或視頻模式時(shí)，前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。

音頻組件710被配置為輸出和/或輸入音頻信號。例如，音頻組件710包括一個(gè)麥克風(fēng)(MIC)，當(dāng)裝置700處于操作模式，如呼叫模式、記錄模式和語音識別模式時(shí)，麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進(jìn)一步存儲在存儲器704或經(jīng)由通信組件716發(fā)送。在一些實(shí)施例中，音頻組件710還包括一個(gè)揚(yáng)聲器，用于輸出音頻信號。

I/O接口712為處理組件702和外圍接口模塊之間提供接口，上述外圍接口模塊可以是鍵盤，點(diǎn)擊輪，按鈕等。這些按鈕可包括但不限于：主頁按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。

傳感器組件714包括一個(gè)或多個(gè)傳感器，用于為裝置700提供各個(gè)方面的狀態(tài)評估。例如，傳感器組件714可以檢測到裝置700的打開/關(guān)閉狀態(tài)，組件的相對定位，例如所述組件為裝置700的顯示器和小鍵盤，傳感器組件714還可以檢測裝置700或裝置700一個(gè)組件的位置改變，用戶與裝置700接觸的存在或不存在，裝置700方位或加速/減速和裝置700的溫度變化。傳感器組件714可以包括接近傳感器，被配置用來在沒有任何的物理接觸時(shí)檢測附近物體的存在。傳感器組件714還可以包括光傳感器，如CMOS或CCD圖像傳感器，用于在成像應(yīng)用中使用。在一些實(shí)施例中，該傳感器組件714還可以包括加速度傳感器，陀螺儀傳感器，磁傳感器，壓力傳感器或溫度傳感器。

通信組件716被配置為便于裝置700和其他設(shè)備之間有線或無線方式的通信。裝置700可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò)，如WiFi，2G或3G，或它們的組合。在一個(gè)示例性實(shí)施例中，通信組件716經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中，所述通信組件716還包括近場通信(NFC)模塊，以促進(jìn)短程通信。例如，在NFC模塊可基于射頻識別(RFID)技術(shù)，紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù)，超寬帶(UWB)技術(shù)，藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。

在示例性實(shí)施例中，裝置700可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn)，用于執(zhí)行上述方法。

在示例性實(shí)施例中，還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)，例如包括指令的存儲器704，上述指令可由裝置700的處理器718執(zhí)行以完成上述方法。例如，所述非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)可以是ROM、隨機(jī)存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。

關(guān)于上述實(shí)施例中的裝置，其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中執(zhí)行了詳細(xì)描述，此處將不做詳細(xì)闡述說明。

應(yīng)當(dāng)理解的是，本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu)，并且可以在不脫離其范圍執(zhí)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3