本發(fā)明涉及音頻采集技術(shù)領(lǐng)域,尤其涉及一種拾音方法及裝置。
背景技術(shù):
隨著智能技術(shù)的發(fā)展,出現(xiàn)了很多可進(jìn)行語音交互的智能設(shè)備,例如可受語音控制的機(jī)器人、智能交互音箱等。在這些智能設(shè)備上一般配置包括多個音頻采集設(shè)備的音頻采集陣列,進(jìn)而可以拾取多個方向的音頻信號。
現(xiàn)有技術(shù)中,首先,需要確定音源方向,進(jìn)而確定音頻采集陣列中與音源方向?qū)?yīng)的音頻采集設(shè)備,之后該音頻采集設(shè)備會將音源方向設(shè)置為其拾取音頻信號的方向,并會一直在所設(shè)置的方向上拾取音頻信號。若音頻采集陣列出現(xiàn)移動后,音頻采集陣列上的音頻采集設(shè)備也會移動,可能會使音頻采集設(shè)備拾取音頻信號的方向會與音源方向不符,導(dǎo)致拾取到錯誤的音頻信號。
技術(shù)實現(xiàn)要素:
本發(fā)明的多個方面提供一種拾音方法及裝置,用以在音頻采集陣列移動的前后,能夠一直準(zhǔn)確拾取音源方向上的音頻信號。
本發(fā)明提供一種拾音方法,包括:
識別音源方向以及所述音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域,所述第一拾音區(qū)域是所述音頻采集陣列的多個拾音區(qū)域中的一個;
根據(jù)所述第一拾音區(qū)域以及所述音頻采集陣列的旋轉(zhuǎn)角,確定所述音源方向在所述音頻采集陣列移動之后所屬的第二拾音區(qū)域;所述第二拾音區(qū)域是所述多個拾音區(qū)域中的一個;
利用所述音頻采集陣列的多個音頻采集設(shè)備拾取所述第二拾音區(qū)域內(nèi)的音頻信號。
可選地,所述識別音源方向以及所述音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域,包括:
監(jiān)聽來自于音源的喚醒信號;
當(dāng)監(jiān)聽到所述喚醒信號時,根據(jù)所述音頻采集陣列上各音頻采集設(shè)備監(jiān)聽到所述喚醒信號的時間差和/或監(jiān)聽到的所述喚醒信號的幅度差,定位所述音源方向;以及
確定所述多個拾音區(qū)域中覆蓋所述音源方向的拾音區(qū)域,作為所述第一拾音區(qū)域。
可選地,所述根據(jù)所述第一拾音區(qū)域以及所述音頻采集陣列的旋轉(zhuǎn)角,確定所述音源方向在所述音頻采集陣列移動之后所屬的第二拾音區(qū)域,包括:
獲取所述音源方向相對于所述第一拾音區(qū)域的中心的方向和夾角;
從所述音頻采集陣列的旋轉(zhuǎn)角中,分解出所述音頻采集陣列的旋轉(zhuǎn)方向和旋轉(zhuǎn)角度;
根據(jù)所述旋轉(zhuǎn)方向、所述旋轉(zhuǎn)角度、所述音源方向相對于所述第一拾音區(qū)域的中心的方向以及所述夾角,計算一拾音角度;
根據(jù)所述拾音角度以及所述多個拾音區(qū)域各自對應(yīng)的拾音角度范圍,從所述多個拾音區(qū)域中確定所述第二拾音區(qū)域。
可選地,所述根據(jù)所述旋轉(zhuǎn)方向、所述旋轉(zhuǎn)角度、所述音源方向相對于所述第一拾音區(qū)域的中心的方向以及所述夾角,計算一拾音角度,包括:
若所述旋轉(zhuǎn)方向與所述音源方向相對于所述第一拾音區(qū)域的中心的方向相反,獲取所述旋轉(zhuǎn)角度與所述夾角之和,作為所述拾音角度;
若所述旋轉(zhuǎn)方向與所述音源方向相對于所述第一拾音區(qū)域的中心的方向相同,獲取所述旋轉(zhuǎn)角度與所述夾角之差的絕對值,作為所述拾音角度。
可選地,在所述根據(jù)所述第一拾音區(qū)域的位置以及所述音頻采集陣列的旋轉(zhuǎn)角,確定所述音源方向在所述音頻采集陣列移動之后所屬的第二拾音區(qū)域之前,所述方法還包括:
在所述音頻采集陣列移動的過程中,采集所述音頻采集陣列上的陀螺儀的角速度;
根據(jù)所述陀螺儀的角速度和所述音頻采集陣列旋轉(zhuǎn)的時間確定所述音頻采集陣列的旋轉(zhuǎn)角。
可選地,所述音頻采集陣列包括至少兩個音頻采集設(shè)備;
在識別音源方向以及所述音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域之前,所述方法還包括:
根據(jù)所述音頻采集陣列的形狀、所述至少兩個音頻采集設(shè)備的位置排列以及所述至少兩個音頻采集設(shè)備的個數(shù),將所述音頻采集陣列的最大拾音范圍劃分為所述多個拾音區(qū)域;以及
以所述多個拾音區(qū)域中指定拾音區(qū)域的中心為基準(zhǔn),確定所述多個拾音區(qū)域中每個拾音區(qū)域?qū)?yīng)的拾音角度范圍。
可選地,在利用所述音頻采集陣列的多個音頻采集設(shè)備拾取所述第二拾音區(qū)域內(nèi)的音頻信號的過程中,所述方法還包括:
若監(jiān)聽到來自聲源的喚醒信號,重新執(zhí)行識別所述音源方向的操作以及后續(xù)操作。
本發(fā)明還提供一種拾音裝置,包括:
識別模塊,用于識別音源方向以及所述音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域,所述第一拾音區(qū)域是所述音頻采集陣列的多個拾音區(qū)域中的一個;
確定模塊,用于根據(jù)所述第一拾音區(qū)域以及所述音頻采集陣列的旋轉(zhuǎn)角,確定所述音源方向在所述音頻采集陣列移動之后所屬的第二拾音區(qū)域;所述第二拾音區(qū)域是所述多個拾音區(qū)域中的一個;
拾取模塊,用于利用所述音頻采集陣列的多個音頻采集設(shè)備拾取所述第二拾音區(qū)域內(nèi)的音頻信號。
可選地,所述識別模塊具體用于:
監(jiān)聽來自于音源的喚醒信號;
當(dāng)監(jiān)聽到所述喚醒信號時,根據(jù)所述音頻采集陣列上各音頻采集設(shè)備監(jiān)聽到所述喚醒信號的時間差和/或監(jiān)聽到的所述喚醒信號的幅度差,定位所述音源方向;以及確定所述多個拾音區(qū)域中覆蓋所述音源方向的拾音區(qū)域,作為所述第一拾音區(qū)域。
可選地,所述確定模塊具體用于:
獲取所述音源方向相對于所述第一拾音區(qū)域的中心的方向和夾角;
從所述音頻采集陣列的旋轉(zhuǎn)角中,分解出所述音頻采集陣列的旋轉(zhuǎn)方向和旋轉(zhuǎn)角度;
根據(jù)所述旋轉(zhuǎn)方向、所述旋轉(zhuǎn)角度、所述音源方向相對于所述第一拾音區(qū)域的中心的方向以及所述夾角,計算一拾音角度;
根據(jù)所述拾音角度以及所述多個拾音區(qū)域各自對應(yīng)的拾音角度范圍,從所述多個拾音區(qū)域中確定所述第二拾音區(qū)域。
在本發(fā)明中,通過音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域,進(jìn)而利用多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號,使得在音頻采集陣列移動前后,可以一直拾取同一音源方向上的音頻信號,解決了音頻采集設(shè)備拾取音頻信號的方向會與音源方向不符導(dǎo)致拾取到錯誤的音頻信號的問題,有利于提高后續(xù)音頻處理結(jié)果的準(zhǔn)確性。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
圖1為本發(fā)明一實施例提供的一種拾音方法的流程示意圖;
圖2為本發(fā)明又一實施例提供的一種拾音方法的流程示意圖;
圖3a、圖3b、圖3c分別為本發(fā)明又一實施例提供的音頻采集陣列旋轉(zhuǎn)示意圖;
圖4為本發(fā)明又一實施例提供的一種拾音裝置的模塊結(jié)構(gòu)圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明具體實施例及相應(yīng)的附圖對本發(fā)明技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實施例僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
以下結(jié)合附圖,詳細(xì)說明本發(fā)明各實施例提供的技術(shù)方案。
圖1為本發(fā)明一實施例提供的一種拾音方法的流程示意圖。如圖1所示,該方法包括以下步驟。
s101:識別音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域,第一拾音區(qū)域是音頻采集陣列的多個拾音區(qū)域中的一個。
s102:根據(jù)第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域;第二拾音區(qū)域是多個拾音區(qū)域中的一個。
s103:利用音頻采集陣列的多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號。
音頻采集陣列是一組位于空間不同位置的全向音頻采集設(shè)備按一定的形狀規(guī)則布置形成的陣列,是對空間傳播音頻信號進(jìn)行空間采樣的一種裝置。其中,音頻采集陣列包括多個音頻采集設(shè)備,本實施例中的多個是指至少兩個。音頻采集設(shè)備包括但不限于麥克風(fēng)、話筒等設(shè)備。
根據(jù)音頻采集陣列的拓?fù)浣Y(jié)構(gòu),則可分為線性陣列、平面陣列、體陣列等?;诖耍纛l采集陣列包括線形音頻采集陣列、面形音頻采集陣列、體形音頻采集陣列等。
根據(jù)位于音頻采集設(shè)備的多個音頻采集設(shè)備,可將音頻采集設(shè)備能夠拾音的區(qū)域范圍劃分為多個拾音區(qū)域??蛇x地,一個拾音區(qū)域可以對應(yīng)一個音頻采集設(shè)備,或者,一個拾音區(qū)域也可以對應(yīng)多個音頻采集設(shè)備。
當(dāng)通過音頻采集陣列拾取音頻信號時,可先通過音頻采集陣列識別出音源方向,繼而確定音源方向所屬的拾音區(qū)域,然后通過多個音頻采集設(shè)備拾取音源方向所屬的拾音區(qū)域內(nèi)的音頻信號,進(jìn)而拾取到音源方向的音頻信號。
其中,音源方向為音頻信號發(fā)出的方向。音源方向所屬的第一拾音區(qū)域可以指覆蓋音源方向的拾音區(qū)域。
若音頻采集陣列移動后,音頻采集設(shè)備也會跟著移動,進(jìn)而使第一拾音區(qū)域移動。這樣,在音源方向不變的情況下,音源方向可能位于第一拾音區(qū)域之外的其它拾音區(qū)域。若再拾取第一拾音區(qū)域內(nèi)的音頻信號將不會拾取到音源方向上的音頻信號。
為了使音頻采集陣列移動后,依然能夠拾取到音源方向的音頻信號,可以在音頻采集陣列移動后,根據(jù)第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,重新確定音源方向所屬的拾音區(qū)域,進(jìn)而利用多個音頻采集設(shè)備拾取重新確定的拾音區(qū)域內(nèi)的音頻信號,這樣可以保證在音頻采集陣列移動前后,可以一直拾取同一音源方向上的音頻信號。為便于區(qū)分和描述,將音源方向在音頻采集陣列移動之前所屬的拾音區(qū)域稱為第一拾音區(qū)域,將音源方向在音頻采集陣列移動之后所屬的拾音區(qū)域稱為第二拾音區(qū)域。上述旋轉(zhuǎn)角包括旋轉(zhuǎn)方向和旋轉(zhuǎn)角度。
可選地,在識別出音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域之后,可以保存音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域。
更多情況下,音源方向在音頻采集設(shè)備移動前后所屬的拾音區(qū)域不同,即第一拾音區(qū)域與第二拾音區(qū)域不相同。但是,在音頻采集設(shè)備的移動幅度較小的情況下,音源方向在音頻采集設(shè)備移動前后可能屬于同一拾音區(qū)域,即第一拾音區(qū)域與第二拾音區(qū)域相同。
音頻采集陣列可以有多種移動方式,例如橫向移動、縱向移動、旋轉(zhuǎn)移動或者上述移動的組合等。一般來說,若音頻采集陣列移動后,令音頻采集陣列自身旋轉(zhuǎn),則更容易使音源方向不再屬于第一拾音區(qū)域。
以音頻采集陣列自身旋轉(zhuǎn)的情況為例,當(dāng)音頻采集陣列旋轉(zhuǎn)時,音頻采集陣列的多個拾音區(qū)域也會進(jìn)行同樣的旋轉(zhuǎn)?;诖耍纛l采集陣列以一旋轉(zhuǎn)角旋轉(zhuǎn),意味著第一拾音區(qū)域、第二拾音區(qū)域等多個拾音區(qū)域均以同一旋轉(zhuǎn)角旋轉(zhuǎn)。因此,在覆蓋音源方向的拾音區(qū)域為第一拾音區(qū)域時,經(jīng)各個拾音區(qū)域以旋轉(zhuǎn)角旋轉(zhuǎn),覆蓋音源方向的拾音區(qū)域由第一拾音區(qū)域切換為第二拾音區(qū)域。
然后,利用音頻采集陣列的多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號。
可選地,可以采用波束成形技術(shù),將多個音頻采集設(shè)備采集的第二拾音區(qū)域內(nèi)的音頻信號進(jìn)行時延處理并加權(quán)相加,以形成一個拾音波束;同時衰減除第二拾音區(qū)域外的其他區(qū)域內(nèi)的音頻信號。最終,通過多個音頻采集設(shè)備對第二拾音區(qū)域內(nèi)的音頻信號進(jìn)行加強和降噪,從而拾取到音源方向上的音頻信號。
本實施例中,通過音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域,進(jìn)而利用多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號,使得在音頻采集陣列移動前后,可以一直拾取同一音源方向上的音頻信號,解決了音頻采集設(shè)備拾取音頻信號的方向會與音源方向不符導(dǎo)致拾取到錯誤的音頻信號的問題,有利于提高后續(xù)音頻處理結(jié)果的準(zhǔn)確性。
在上述實施例或下述實施例中,可以通過監(jiān)聽來自于音源的喚醒信號來識別音源方向?;诖耍R別音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域,包括:監(jiān)聽來自于音源的喚醒信號;當(dāng)監(jiān)聽到喚醒信號時,根據(jù)音頻采集陣列上各音頻采集設(shè)備監(jiān)聽到喚醒信號的時間差和/或監(jiān)聽到的喚醒信號的幅度差,定位音源方向;以及確定多個拾音區(qū)域中覆蓋音源方向的拾音區(qū)域,作為第一拾音區(qū)域。
其中,音源可以包括但不限于用戶、揚聲器等任何能夠發(fā)聲的人或物。
可選地,喚醒信號可以包括但不限于指定頻率的音頻信號、指定幅度的音頻信號和指定內(nèi)容的音頻信號等。
當(dāng)喚醒信號為指定內(nèi)容的音頻信號時,可以根據(jù)音頻采集陣列上各音頻采集設(shè)備周期性監(jiān)聽音頻采集陣列周圍的音頻信號,并將采集到的音頻信號進(jìn)行語音識別。若識別到音頻信號為指定內(nèi)容的音頻信號,如“開啟”時,則定位喚醒信號的方向。
可選地,可以通過以下三種實施方式定位喚醒信號的方向。
第一種實施方式:一般來說,喚醒信號到達(dá)各音頻采集設(shè)備的時間,或者各音頻采集設(shè)備監(jiān)聽到喚醒信號的時間是不同的。距離聲源較近的音頻采集設(shè)備會先監(jiān)聽到喚醒信號,距離聲源較遠(yuǎn)的音頻采集設(shè)備會后監(jiān)聽到喚醒信號。基于此,可以根據(jù)各音頻采集設(shè)備監(jiān)聽到喚醒信號的時間差,定位喚醒信號的方向。
第二種實施方式:喚醒信號到達(dá)各音頻采集設(shè)備時的幅度,或者各音頻采集設(shè)備監(jiān)聽到的喚醒信號幅度是不同的。距離聲源較近的音頻采集設(shè)備監(jiān)聽到的喚醒信號的幅度較大,距離聲源較遠(yuǎn)的音頻采集設(shè)備監(jiān)聽到的喚醒信號的幅度較小?;诖耍梢愿鶕?jù)各音頻采集設(shè)備監(jiān)聽到的喚醒信號的幅度差,定位喚醒信號的方向。
第三種實施方式:為了更準(zhǔn)確地定位音源方向,可以結(jié)合上述兩種實施方式,定位喚醒信號的方向。也就是,根據(jù)音頻采集陣列上各音頻采集設(shè)備監(jiān)聽到喚醒信號的時間差和監(jiān)聽到的喚醒信號的幅度差,定位喚醒信號的方向。
然后,將定位出的喚醒信號的方向作為音源方向??蛇x地,定位出的音源方向可以是根據(jù)音頻采集陣列建立的虛擬坐標(biāo)系所得。
然后,比較音源方向和多個拾音區(qū)域,將覆蓋音源方向的拾音區(qū)域,作為第一拾音區(qū)域。
圖2為本發(fā)明又一實施例提供的一種拾音方法的流程示意圖。如圖2所示,該方法包括以下步驟。
s201:識別音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域,第一拾音區(qū)域是音頻采集陣列的多個拾音區(qū)域中的一個。
s202:獲取音源方向相對于第一拾音區(qū)域的中心的方向和夾角。
s203:從音頻采集陣列的旋轉(zhuǎn)角中,分解出音頻采集陣列的旋轉(zhuǎn)方向和旋轉(zhuǎn)角度。
s204:判斷旋轉(zhuǎn)方向與音源方向相對于第一拾音區(qū)域的中心的方向相同或相反,若相同,跳轉(zhuǎn)到步驟s206;若相反,跳轉(zhuǎn)到步驟s205。
s205:獲取旋轉(zhuǎn)角度與夾角之和,作為拾音角度,并繼續(xù)執(zhí)行步驟s207。
s206:獲取旋轉(zhuǎn)角度與夾角之差的絕對值,作為拾音角度,并繼續(xù)執(zhí)行步驟s207。
s207:根據(jù)拾音角度以及多個拾音區(qū)域各自對應(yīng)的拾音角度范圍,從多個拾音區(qū)域中確定第二拾音區(qū)域。
s208:利用音頻采集陣列的多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號。
步驟s201與步驟s101相同,此處不再贅述。
在識別到音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域之后,可以根據(jù)音源方向在第一拾音區(qū)域的確切方向和音頻采集陣列的旋轉(zhuǎn)角,確定在音頻采集陣列移動之后,音源方向所屬的第二拾音區(qū)域。
首先,獲取音源方向在第一拾音區(qū)域的確切方向。可選地,可以以第一拾音區(qū)域的中心為基準(zhǔn),獲取音源方向的相對于第一拾音區(qū)域的中心的方向和夾角(即步驟s202)??蛇x地,音源方向相對于第一拾音區(qū)域的中心的方向和夾角可以指在音源方向投影到音頻采集陣列的旋轉(zhuǎn)平面上后,相對于第一拾音區(qū)域的中心的方向和夾角。
如圖3a所示,音頻采集陣列包括麥克風(fēng)a、麥克風(fēng)b、麥克風(fēng)c和麥克風(fēng)d。其中,麥克風(fēng)b對應(yīng)一號拾音區(qū)域,麥克風(fēng)a對應(yīng)二號拾音區(qū)域,麥克風(fēng)d對應(yīng)三號拾音區(qū)域,麥克風(fēng)c對應(yīng)四號拾音區(qū)域。在音頻采集陣列旋轉(zhuǎn)之前,音源方向所屬的第一拾音區(qū)域就是一號拾音區(qū)域。
圖3a中,音源方向與第一拾音區(qū)域的中心的夾角為m度。
然后,分解音頻采集陣列的旋轉(zhuǎn)角這一矢量,以得到旋轉(zhuǎn)角的方向,即旋轉(zhuǎn)方向,和旋轉(zhuǎn)角的角度,即旋轉(zhuǎn)角度(即步驟s203)。
接著,根據(jù)旋轉(zhuǎn)方向、旋轉(zhuǎn)角度、音源方向相對于第一拾音區(qū)域的中心的方向以及夾角,計算一拾音角度。其中,拾音角度指音頻采集陣列移動后,音源方向相對于第一拾音區(qū)域的中心的角度。
可選地,根據(jù)旋轉(zhuǎn)方向與音源方向相對于第一拾音區(qū)域的中心的方向相同或相反,獲取拾音角度的方式不同?;诖耍袛嘈D(zhuǎn)方向與音源方向相對于第一拾音區(qū)域的中心的方向相同或相反(即步驟s204)。
圖3b為在圖3a的基礎(chǔ)上,音頻采集陣列順時針旋轉(zhuǎn)后的示意圖。如圖3b所示,旋轉(zhuǎn)方向為順時針方向,音源方向相對于第一拾音區(qū)域的中心的方向為逆時針方向,則二者的方向相反。
圖3c為在圖3a的基礎(chǔ)上,音頻采集陣列逆時針旋轉(zhuǎn)后的示意圖。如圖3c所示,旋轉(zhuǎn)方向為逆時針方向,音源方向相對于第一拾音區(qū)域的中心的方向為逆時針方向,則二者的方向相同。
若旋轉(zhuǎn)方向與音源方向相對于第一拾音區(qū)域的中心的方向相反,獲取旋轉(zhuǎn)角度與夾角之和,作為拾音角度(即步驟s205)。如圖3b所示,旋轉(zhuǎn)角度為k度,夾角為m度,則拾音角度為k+m度。
若旋轉(zhuǎn)方向與音源方向相對于第一拾音區(qū)域的中心的方向相同,獲取所述旋轉(zhuǎn)角度與所述夾角之差的絕對值,作為拾音角度(即步驟s206)。如圖3c所示,旋轉(zhuǎn)角度為k度,夾角為m度,則拾音角度為|m-k|度。
然后,根據(jù)拾音角度以及多個拾音區(qū)域各自對應(yīng)的拾音角度范圍,從多個拾音區(qū)域中確定第二拾音區(qū)域(即步驟s207)。
其中,每個拾音區(qū)域?qū)?yīng)一個拾音角度范圍。每個拾音角度范圍可以根據(jù)一個共同的基準(zhǔn)計算所得??蛇x地,以指定拾音區(qū)域的中心為基準(zhǔn),例如,以指定區(qū)域的中心為0度,沿逆時針或順時針方向依次確定每個拾音區(qū)域的拾音角度范圍。
可選地,指定拾音區(qū)域可以是第一拾音區(qū)域也可以不是第一拾音區(qū)域。當(dāng)指定拾音區(qū)域是第一拾音區(qū)域時,以第一拾音區(qū)域的中心為基準(zhǔn)獲得多個拾音角度范圍。由于拾音角度是音源方向相對于第一拾音區(qū)域的中心的角度,也就是拾音角度范圍的基準(zhǔn)與拾音角度的基準(zhǔn)相同?;诖?,當(dāng)拾音角度在一拾音角度范圍內(nèi)時,可以將該拾音角度范圍對應(yīng)的拾音區(qū)域作為第二拾音區(qū)域。
如圖3a、3b、3c所示,以第一拾音區(qū)域,即一號拾音區(qū)域的中心為基準(zhǔn),沿逆時針方向,一號拾音區(qū)域的拾音角度范圍為315度-360度以及0度-45度,二號拾音區(qū)域的拾音角度范圍為45度-135度,三號拾音區(qū)域的拾音角度范圍為135度-225度,四號拾音區(qū)域的拾音角度范圍為225度-315度。假設(shè)圖3b中,拾音角度為75度,則二號拾音區(qū)域的角度范圍45度-135度包括拾音角度,則確定二號拾音區(qū)域為拾取音頻信號的第二拾音區(qū)域。假設(shè)圖3c中,拾音角度為|-100|度,考慮到m-k為負(fù)值,則將-100度加上360度以得到正值260度,四號拾音區(qū)域的角度范圍225度-315度包括拾音角度,則確定圖3c示出的第四拾音區(qū)域為拾取音頻信號的第二拾音區(qū)域。如果拾音角度為正值,則直接與各個拾音角度范圍相比,以確定第二拾音區(qū)域。
值得說明的是,為了便于對比,圖3c中的拾音區(qū)域標(biāo)識與圖3b和圖3a均相同。當(dāng)指定拾音區(qū)域不是第一拾音區(qū)域時,例如,指定拾音區(qū)域為圖3a中麥克風(fēng)a對應(yīng)的二號拾音區(qū)域,則以麥克風(fēng)a對應(yīng)的二號拾音區(qū)域的中心為基準(zhǔn),沿逆時針或順時針的方向,確定每個拾音區(qū)域的拾音角度范圍。
以逆時針方向為例,如圖3a所示,音頻采集陣列初始狀態(tài)為在圖3a基礎(chǔ)上順時針旋轉(zhuǎn)90度,則對應(yīng)的,一號、二號、三號和四號拾音區(qū)域的拾音角度范圍更新為:一號拾音區(qū)域的拾音角度范圍為225度-315度,二號拾音區(qū)域的拾音角度范圍為315度-360度以及0度-45度,三號拾音區(qū)域的拾音角度范圍為45度-135度,四號拾音區(qū)域的拾音角度范圍為135度-225度。
當(dāng)指定拾音區(qū)域不是第一拾音區(qū)域,即一號拾音區(qū)域時,拾音角度范圍的基準(zhǔn)與拾音角度的基準(zhǔn)不同。此時,可以根據(jù)指定拾音區(qū)域與第一拾音區(qū)域的相對位置,將以指定拾音區(qū)域的中心為基準(zhǔn)的拾音角度范圍換算到以第一拾音區(qū)域的中心為基準(zhǔn)的角度范圍。然后,當(dāng)拾音角度在換算后的一拾音角度范圍內(nèi)時,可以將該換算后的拾音角度范圍對應(yīng)的拾音區(qū)域作為第二拾音區(qū)域。
在一示例中,圖3a所示,音頻采集陣列初始狀態(tài)為在圖3a基礎(chǔ)上順時針旋轉(zhuǎn)90度,以第一拾音區(qū)域,即一號拾音區(qū)域的中心為基準(zhǔn)的拾音角度假設(shè)為30度。指定拾音區(qū)域為二號拾音區(qū)域。二號拾音區(qū)域相對于一號拾音區(qū)域逆時針旋轉(zhuǎn)了90度,則將一號拾音區(qū)域的角度范圍、二號拾音區(qū)域的角度范圍、三號拾音區(qū)域的角度范圍以及四號拾音區(qū)域的角度范圍均增加90度,超過360度的角度范圍減去360度,進(jìn)而將以二號拾音區(qū)域的中心為基準(zhǔn)的拾音角度范圍換算到以一號拾音區(qū)域的中心為基準(zhǔn)的角度范圍。換算后,一號拾音區(qū)域的拾音角度范圍為315度-360度以及0度-45度,二號拾音區(qū)域的拾音角度范圍為45度-135度,三號拾音區(qū)域的拾音角度范圍為135度-225度,四號拾音區(qū)域的拾音角度范圍為225度-315度。然后,當(dāng)拾音角度在換算后的一拾音角度范圍內(nèi)時,可以將該換算后的拾音角度范圍對應(yīng)的拾音區(qū)域作為第二拾音區(qū)域。
在確定第二拾音區(qū)域后,可以利用音頻采集陣列上位于第二拾音區(qū)域內(nèi)的音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號(即步驟s208),進(jìn)而在音頻采集陣列移動后,依然能夠獲取到音源方向上的音頻信號。
在上述實施例或下述實施例中,在根據(jù)第一拾音區(qū)域的位置以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域之前,還可以包括音頻采集陣列的旋轉(zhuǎn)角的獲取過程。
可選地,可以在音頻采集陣列上安裝陀螺儀??蛇x地,可以在音頻采集陣列的中心位置安裝陀螺儀。進(jìn)而,在音頻采集陣列移動的過程中,采集音頻采集陣列上的陀螺儀的角速度。陀螺儀的角速度就是音頻采集陣列旋轉(zhuǎn)的角速度。
然后,根據(jù)陀螺儀的角速度和音頻采集陣列旋轉(zhuǎn)的時間,確定音頻采集陣列的旋轉(zhuǎn)角??蛇x地,可以將陀螺儀的角速度,也就是音頻采集陣列旋轉(zhuǎn)的角速度對應(yīng)乘以音頻采集陣列旋轉(zhuǎn)的時間,得到音頻采集陣列的旋轉(zhuǎn)角。
在一可選實施方式中,也可以在音頻采集陣列上安裝角度傳感器。進(jìn)而,采集角度傳感器在音頻采集陣列移動之前的第一角度;采集角度傳感器在音頻采集陣列移動之后的第二角度。然后,根據(jù)第二角度與第一角度的矢量之差,確定音頻采集陣列的旋轉(zhuǎn)角。
在上述實施例或下述實施例中,音頻采集陣列包括至少兩個音頻采集設(shè)備。至少兩個音頻采集設(shè)備可以對應(yīng)至少兩個拾音區(qū)域。不同拾音區(qū)域的拾音角度范圍不同。
可選地,在識別音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域之前,可以確定各個拾音區(qū)域?qū)?yīng)的拾音角度范圍。
首先,根據(jù)音頻采集陣列的形狀、至少兩個音頻采集設(shè)備的位置排列以及至少兩個音頻采集設(shè)備的個數(shù),將音頻采集陣列的最大拾音范圍劃分為多個拾音區(qū)域。
其中,音頻采集陣列的形狀與音頻采集陣列的最大拾音范圍有關(guān)。若音頻采集陣列為環(huán)形,如圖3a所示,最大拾音范圍為360度的范圍。若音頻采集陣列為半環(huán)形,則最大拾音范圍為180度的范圍。若音頻采集陣列為線形,則最大拾音范圍為小于180度的扇形范圍。
音頻采集設(shè)備的位置排列以及個數(shù)與拾音區(qū)域的劃分有關(guān)。如圖3a所示,設(shè)置于音頻采集設(shè)備上的麥克風(fēng)a、麥克風(fēng)b、麥克風(fēng)c和麥克風(fēng)d均勻排列在環(huán)形音頻采集陣列的周圍,則將360度的范圍劃分為4個90度的拾音范圍。其中,麥克風(fēng)位于對應(yīng)拾音范圍的中心位置。
然后,以多個拾音區(qū)域中指定拾音區(qū)域的中心為基準(zhǔn),確定多個拾音區(qū)域中每個拾音區(qū)域?qū)?yīng)的拾音角度范圍。
其中,指定拾音區(qū)域可以為多個拾音區(qū)域中的任一區(qū)域。
可選地,在音頻采集陣列拾取音頻信號的過程中,指定拾音區(qū)域可以固定為多個拾音區(qū)域中的一區(qū)域,也可以隨著音源方向的變化,將音源方向所屬的拾音區(qū)域作為指定拾音區(qū)域。
若指定拾音區(qū)域固定為多個拾音區(qū)域中的一區(qū)域時,每個拾音區(qū)域?qū)?yīng)的拾音角度范圍保持不變。若指定拾音區(qū)域為音源方向所屬的第一拾音區(qū)域時,當(dāng)音源方向所屬的第一拾音區(qū)域改變時,每個拾音區(qū)域?qū)?yīng)的拾音角度范圍也會相應(yīng)改變。
當(dāng)然,也可以以指定拾音區(qū)域的一邊界為基準(zhǔn),確定多個拾音區(qū)域中每個拾音區(qū)域?qū)?yīng)的拾音角度范圍。
在一可選實施方式中,在利用音頻采集陣列上的多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號的過程中,音源方向可能發(fā)生變化?;诖?,可以周期性監(jiān)聽來自聲源的喚醒信號,即根據(jù)音頻采集陣列上各音頻采集設(shè)備周期性監(jiān)聽音頻采集陣列周圍的喚醒信號。
若監(jiān)聽到來自聲源的喚醒信號,重新執(zhí)行識別音源方向的操作。進(jìn)而確定音源方向在音頻采集陣列所屬的第一拾音區(qū)域,以利用多個音頻采集設(shè)備拾取第一拾音區(qū)域內(nèi)的音頻信號。
在拾取第一拾音區(qū)域內(nèi)的音頻信號的過程中,若音頻采集陣列發(fā)生移動,可以根據(jù)第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域;進(jìn)而利用多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號。
值得說明的是,在音源方向發(fā)生變化之后,新的音源方向所屬的拾音區(qū)域被稱為第一拾音區(qū)域。基于此,可以以新的第一拾音區(qū)域的中心為基準(zhǔn),重新獲取多個拾音區(qū)域的拾音角度范圍和音源方向相對于新的第一拾音區(qū)域的中心的夾角和方向,進(jìn)而執(zhí)行后續(xù)的計算。
圖4為本發(fā)明又一實施例提供的一種拾音裝置的模塊結(jié)構(gòu)圖。如圖4所示,拾音裝置400包括識別模塊401、確定模塊402和拾取模塊403。
識別模塊401,用于識別音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域,第一拾音區(qū)域是音頻采集陣列的多個拾音區(qū)域中的一個。
確定模塊402,用于根據(jù)識別模塊401識別的第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域;第二拾音區(qū)域是多個拾音區(qū)域中的一個。
拾取模塊403,用于利用音頻采集陣列的多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號。
本實施例中,通過音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域,進(jìn)而利用多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號,使得在音頻采集陣列移動前后,可以一直拾取同一音源方向上的音頻信號,解決了音頻采集設(shè)備拾取音頻信號的方向會與音源方向不符導(dǎo)致拾取到錯誤的音頻信號的問題,有利于提高后續(xù)音頻處理結(jié)果的準(zhǔn)確性。
可選地,識別模塊401在識別音源方向以及音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域時,具體用于:監(jiān)聽來自于音源的喚醒信號;當(dāng)監(jiān)聽到喚醒信號時,根據(jù)音頻采集陣列上各音頻采集設(shè)備監(jiān)聽到喚醒信號的時間差和/或監(jiān)聽到的喚醒信號的幅度差,定位音源方向;以及確定多個拾音區(qū)域中覆蓋音源方向的拾音區(qū)域,作為第一拾音區(qū)域。
可選地,確定模塊402在根據(jù)識別模塊401識別的第一拾音區(qū)域以及音頻采集陣列的旋轉(zhuǎn)角,確定音源方向在音頻采集陣列移動之后所屬的第二拾音區(qū)域時,具體用于:獲取音源方向相對于第一拾音區(qū)域的中心的方向和夾角;從音頻采集陣列的旋轉(zhuǎn)角中,分解出音頻采集陣列的旋轉(zhuǎn)方向和旋轉(zhuǎn)角度;根據(jù)旋轉(zhuǎn)方向、旋轉(zhuǎn)角度、音源方向相對于第一拾音區(qū)域的中心的方向以及夾角,計算一拾音角度;根據(jù)拾音角度以及多個拾音區(qū)域各自對應(yīng)的拾音角度范圍,從多個拾音區(qū)域中確定第二拾音區(qū)域。
可選地,確定模塊402在根據(jù)旋轉(zhuǎn)方向、旋轉(zhuǎn)角度、音源方向相對于第一拾音區(qū)域的中心的方向以及夾角,計算一拾音角度時,具體用于:若旋轉(zhuǎn)方向與音源方向相對于第一拾音區(qū)域的中心的方向相反,獲取旋轉(zhuǎn)角度與夾角之和,作為拾音角度;若旋轉(zhuǎn)方向與音源方向相對于第一拾音區(qū)域的中心的方向相同,獲取旋轉(zhuǎn)角度與夾角之差的絕對值,作為拾音角度。
可選地,拾音裝置400還包括旋轉(zhuǎn)角確定模塊,用于在音頻采集陣列移動的過程中,采集音頻采集陣列上的陀螺儀的角速度;以及根據(jù)陀螺儀的角速度和音頻采集陣列旋轉(zhuǎn)的時間確定音頻采集陣列的旋轉(zhuǎn)角。
可選地,音頻采集陣列包括至少兩個音頻采集設(shè)備。
拾音裝置400還包括拾音角度范圍確定模塊,用于根據(jù)音頻采集陣列的形狀、至少兩個音頻采集設(shè)備的位置排列以及至少兩個音頻采集設(shè)備的個數(shù),將音頻采集陣列的最大拾音范圍劃分為多個拾音區(qū)域;以及以多個拾音區(qū)域中指定拾音區(qū)域的中心為基準(zhǔn),確定多個拾音區(qū)域中每個拾音區(qū)域?qū)?yīng)的拾音角度范圍。
可選地,識別模塊401還用于在利用音頻采集陣列的多個音頻采集設(shè)備拾取第二拾音區(qū)域內(nèi)的音頻信號的過程中,若監(jiān)聽到來自聲源的喚醒信號,重新執(zhí)行識別音源方向的操作以及執(zhí)行識別音源方向在音頻采集陣列移動之前所屬的第一拾音區(qū)域的操作。進(jìn)而拾取模塊403,用于利用多個音頻采集設(shè)備拾取第一拾音區(qū)域內(nèi)的音頻信號。
以上所述僅為本發(fā)明的實施例而已,并不用于限制本發(fā)明。對于本領(lǐng)域技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的權(quán)利要求范圍之內(nèi)。