音頻信號(hào)處理裝置、成像裝置、音頻信號(hào)處理方法、程序和記錄介質(zhì)的制作方法
【專(zhuān)利摘要】【問(wèn)題】為了以高精度僅從所收集的音頻信號(hào)中檢測(cè)包括脈沖操作聲音的噪聲部分而不使用來(lái)自驅(qū)動(dòng)設(shè)備的驅(qū)動(dòng)控制信息,并且為了改善噪聲減少的精度?!窘鉀Q方案】提供了一種音頻信號(hào)處理裝置,包括:特征量提取單元,其被配置為從通過(guò)聲音收集單元獲得的音頻信號(hào)提取特征量,所述特征量指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單元產(chǎn)生的脈沖操作聲音;以及噪聲確定單元,其被配置為基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
【專(zhuān)利說(shuō)明】音頻信號(hào)處理裝置、成像裝置、音頻信號(hào)處理方法、程序和記錄介質(zhì)
【技術(shù)領(lǐng)域】
[0001]本公開(kāi)涉及音頻信號(hào)處理裝置、成像裝置、音頻信號(hào)處理方法、程序和記錄介質(zhì)?!颈尘凹夹g(shù)】
[0002]作為收集和記錄外部聲音的聲音記錄裝置,已知攝像機(jī)、具有運(yùn)動(dòng)圖像捕獲功能的數(shù)字相機(jī)和IC記錄機(jī)。當(dāng)操作這樣的裝置時(shí),存在下述情況:其中,從裝置的主體產(chǎn)生的脈沖操作聲音包含在所記錄的聲音內(nèi)。
[0003]例如,配備了運(yùn)動(dòng)圖像捕獲功能的成像裝置使用麥克風(fēng)來(lái)收集在裝置周?chē)耐獠柯曇?,并且?dāng)捕獲到運(yùn)動(dòng)圖像時(shí)與運(yùn)動(dòng)圖像一起記錄聲音。在運(yùn)動(dòng)圖像的捕獲期間,在成像裝置的外殼中產(chǎn)生脈沖操作聲音,諸如變焦驅(qū)動(dòng)聲音、光圈驅(qū)動(dòng)聲音、自動(dòng)聚焦驅(qū)動(dòng)聲音或操作按鈕的按壓聲音等。具體地說(shuō),當(dāng)驅(qū)動(dòng)成像光學(xué)系統(tǒng)的驅(qū)動(dòng)裝置(變焦電機(jī)、光圈機(jī)構(gòu)或聚焦電機(jī)等)的操作開(kāi)始或結(jié)束時(shí),產(chǎn)生脈沖機(jī)械驅(qū)動(dòng)聲音,諸如當(dāng)例如電機(jī)與齒輪接合時(shí)發(fā)出的“咔噠聲”。
[0004]如果這樣的脈沖操作聲音包含在用戶期望記錄的外部聲音內(nèi)或作為噪聲被記錄在用戶期望記錄的外部聲音上,則很不令人愉快。因?yàn)檫@個(gè)原因,聲音記錄裝置需要提供靜音或噪聲消除,以便減少在記錄期間產(chǎn)生的這樣的脈沖操作聲音。
[0005]作為用于減少脈沖機(jī)械驅(qū)動(dòng)聲音的方法,已經(jīng)提出了幾種方法。例如,專(zhuān)利文獻(xiàn)I提出,為了降低當(dāng)要減少?gòu)尿?qū)動(dòng)裝置產(chǎn)生的機(jī)械驅(qū)動(dòng)聲音時(shí)要承受的減少處理負(fù)載時(shí),根據(jù)用于控制驅(qū)動(dòng)裝置的驅(qū)動(dòng)信號(hào)的發(fā)送來(lái)執(zhí)行減少處理。另外,專(zhuān)利文獻(xiàn)2提出,基于用于控制透鏡驅(qū)動(dòng)單元的驅(qū)動(dòng)信號(hào)(控制信號(hào))將與其中從透鏡驅(qū)動(dòng)單元產(chǎn)生大的噪聲的時(shí)間段對(duì)應(yīng)的輸入音頻數(shù)據(jù)利用在該時(shí)間段之前和之后產(chǎn)生的音頻數(shù)據(jù)片內(nèi)插。
[0006]引用列表
[0007]專(zhuān)利文獻(xiàn)
[0008]專(zhuān)利文獻(xiàn)I JP2011-2723A
[0009]專(zhuān)利文獻(xiàn)2:JP H8-124299A
【發(fā)明內(nèi)容】
[0010]技術(shù)問(wèn)題
[0011]然而,在專(zhuān)利文獻(xiàn)I和專(zhuān)利文獻(xiàn)2的技術(shù)中,因?yàn)楦鶕?jù)發(fā)送用于控制驅(qū)動(dòng)裝置的驅(qū)動(dòng)信號(hào)的時(shí)刻來(lái)執(zhí)行噪聲減少處理。所以減少脈沖噪聲的精度低,并且由此,原始聲音的質(zhì)量變差。換句話說(shuō),對(duì)于真實(shí)的成像裝置等,存在其中在控制裝置發(fā)送驅(qū)動(dòng)信號(hào)后驅(qū)動(dòng)裝置的操作延遲的情況。此外,專(zhuān)利文獻(xiàn)I的方法未考慮從機(jī)械驅(qū)動(dòng)聲音的產(chǎn)生到聲音到達(dá)麥克風(fēng)處所花費(fèi)的時(shí)間。因此,如果按在專(zhuān)利文獻(xiàn)I中公開(kāi)的根據(jù)驅(qū)動(dòng)信號(hào)的發(fā)送來(lái)執(zhí)行減少處理,則實(shí)際噪聲部分偏離噪聲減少處理部分。因?yàn)檫@個(gè)原因,由于甚至在非噪聲部分中執(zhí)行噪聲減少處理,所以顯著地降低原始聲音的保真,這導(dǎo)致聲音質(zhì)量的變差。[0012]另外,專(zhuān)利文獻(xiàn)2的技術(shù)考慮了所產(chǎn)生的噪聲相對(duì)于驅(qū)動(dòng)信號(hào)的延遲,使得在從驅(qū)動(dòng)信號(hào)的發(fā)送起預(yù)定延遲時(shí)間過(guò)去后執(zhí)行噪聲減少處理。然而,因?yàn)樗O(shè)置的延遲時(shí)間是固定值,并且未考慮其中實(shí)際延遲時(shí)間變化的情況,所以難以精確地指定噪聲部分。因此,難以使用實(shí)際噪聲部分來(lái)精確匹配噪聲減少處理部分,不可能實(shí)現(xiàn)高度精確的噪聲減少處理,并且因此,聲音質(zhì)量的變差是擔(dān)心的問(wèn)題。
[0013]此外,在專(zhuān)利文獻(xiàn)2中,基于在驅(qū)動(dòng)信號(hào)的時(shí)刻處的輸入音頻數(shù)據(jù)和內(nèi)插音頻數(shù)據(jù)的電平(音量)來(lái)確定是否要執(zhí)行噪聲減少處理。因此,當(dāng)圍繞裝置存在大的外部聲音時(shí),噪聲相對(duì)不明顯,并且因此,不執(zhí)行減少處理,相反,當(dāng)裝置外圍安靜并且噪聲不明顯時(shí),執(zhí)行所述減少處理,并且因此可以去除噪聲。然而,音量不是影響是否人耳感知到噪聲的唯一因素。因此,在其中像在專(zhuān)利文獻(xiàn)2中那樣僅基于音量來(lái)確定噪聲部分的方法中,噪聲部分的確定精度不可靠,有可能在其中未感知到噪聲的部分中執(zhí)行減少處理或者相反在其中感知到噪聲的部分中不執(zhí)行減少處理。
[0014]因此,期望提供一種技術(shù),該技術(shù)使得能夠僅從收集的音頻信號(hào)高度精確地檢測(cè)包括脈沖操作聲音的噪聲部分,而不使用驅(qū)動(dòng)裝置的驅(qū)動(dòng)控制信息,并且使得能夠改善噪聲減少的精度。
[0015]對(duì)于問(wèn)題的解決方案
[0016]根據(jù)本公開(kāi),提供了一種音頻信號(hào)處理裝置,包括:特征量提取單元,其被配置為從通過(guò)聲音收集單元獲得的音頻信號(hào)提取特征量,所述特征量指示從在與所述聲音收集單兀相同的外殼中設(shè)置的聲音產(chǎn)生單兀產(chǎn)生的脈沖操作聲音;以及噪聲確定單兀,其被配置為基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
[0017]根據(jù)本公開(kāi),提供了一種成像裝置,包括:聲音收集單元,其被配置為將外部聲音轉(zhuǎn)換為音頻信號(hào);聲音產(chǎn)生單元,其被配置為被設(shè)置在與所述聲音收集單元相同的外殼中,并且產(chǎn)生脈沖操作聲音;特征量提取單元,其被配置為從自所述聲音收集單元輸出的所述音頻信號(hào)提取用于指示所述操作聲音的特征量;噪聲確定單元,其被配置為基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音;以及噪聲減少單元,其被配置為當(dāng)所述噪聲確定單元確定在所述音頻信號(hào)中包括所述操作聲音時(shí)對(duì)于所述音頻信號(hào)執(zhí)行噪聲減少處理。
[0018]根據(jù)本公開(kāi),提供了一種音頻信號(hào)處理方法,包括:從通過(guò)聲音收集單元獲得的音頻信號(hào)提取用于指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單元產(chǎn)生的脈沖操作聲音的特征量;以及基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
[0019]根據(jù)本公開(kāi),提供了一種程序,用于使得計(jì)算機(jī)執(zhí)行:從通過(guò)聲音收集單元獲得的音頻信號(hào)提取用于指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單元產(chǎn)生的脈沖操作聲音的特征量;以及基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操
作聲音。
[0020]根據(jù)本公開(kāi),提供了一種非暫時(shí)計(jì)算機(jī)可讀記錄介質(zhì),其中記錄了程序,所述程序使得計(jì)算機(jī)執(zhí)行:從通過(guò)聲音收集單元獲得的音頻信號(hào)提取用于指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單元產(chǎn)生的脈沖操作聲音的特征量;以及基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。[0021]根據(jù)所述配置,從通過(guò)聲音收集單元獲得的音頻信號(hào)提取用于指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單元產(chǎn)生的脈沖操作聲音的特征量;以及基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。因此,使用從音頻信號(hào)提取的特征量,可以高精度地確定脈沖操作聲音的存在或不存在。
[0022]本發(fā)明的有益效果
[0023]根據(jù)如上所述的本公開(kāi)的實(shí)施例,能夠僅從所收集的音頻信號(hào)以高精度來(lái)檢測(cè)脈沖操作聲音的噪聲部分,而不使用驅(qū)動(dòng)裝置的驅(qū)動(dòng)控制信息,并且改善噪聲減少的精度。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0024]圖1是圖示根據(jù)本公開(kāi)的第一實(shí)施例的音頻信號(hào)處理裝置被應(yīng)用到的數(shù)字相機(jī)的硬件配置的框圖。
[0025]圖2是圖示根據(jù)實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖。
[0026]圖3A至3C是根據(jù)實(shí)施例的包括脈沖機(jī)械聲音的音頻信號(hào)的波形圖。
[0027]圖4是示出根據(jù)實(shí)施例的脈沖機(jī)械聲音的確定方法的描述圖。
[0028]圖5是用于描述根據(jù)實(shí)施例的音頻信號(hào)處理方法的流程圖。
[0029]圖6是圖示根據(jù)本公開(kāi)的第二實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖。
[0030]圖7是示出根據(jù)實(shí)施例的脈沖機(jī)械聲音的確定方法的描述圖。
[0031]圖8是圖示根據(jù)本公開(kāi)的第三實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖。
[0032]圖9是圖示根據(jù)本公開(kāi)的第四實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖。
[0033]圖10是圖示根據(jù)本公開(kāi)的第五實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖。
[0034]圖11是用于描述根據(jù)實(shí)施例的音頻信號(hào)處理方法的流程圖。
[0035]圖12是圖示根據(jù)本公開(kāi)的第六實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖。
[0036]圖13是圖示根據(jù)本公開(kāi)的第六實(shí)施例的修改示例的音頻信號(hào)處理裝置的功能配置的框圖。
[0037]圖14是圖示根據(jù)本公開(kāi)的第七實(shí)施例的音頻信號(hào)處理裝置的功能配置的框圖?!揪唧w實(shí)施方式】
[0038]以下,將參考附圖詳細(xì)描述本公開(kāi)的優(yōu)選實(shí)施例。注意,在本說(shuō)明書(shū)和附圖中,使用相同的附圖標(biāo)記來(lái)表示具有基本上相同的功能和結(jié)構(gòu)的元件,并且省略重復(fù)的解釋。
[0039]以下面的順序來(lái)提供說(shuō)明
[0040]1.第一實(shí)施例
[0041]1.1.機(jī)械聲音減少方法的概述
[0042]1.2.音頻信號(hào)處理裝置的配置
[0043]1.2.1.音頻信號(hào)處理裝置的硬件配置
[0044]1.2.2.音頻信號(hào)處理裝置的功能配置
[0045]1.3.脈沖機(jī)械聲音的確定方法的具體示例
[0046]1.3.1.使用統(tǒng)計(jì)識(shí)別方法的確定方法
[0047]1.3.2.使用表格確定的確定方法
[0048]1.4.音頻信號(hào)處理方法[0049]1.5.效果
[0050]2.第二實(shí)施例
[0051]2.1.音頻信號(hào)處理裝置的功能配置
[0052]2.2.脈沖機(jī)械聲音的確定方法的具體示例
[0053]2.2.1.使用統(tǒng)計(jì)識(shí)別方法的確定方法
[0054]2.2.2.使用表格確定的確定方法
[0055]2.3.效果
[0056]3.第三實(shí)施例
[0057]3.1.音頻信號(hào)處理裝置的功能配置
[0058]3.2.脈沖機(jī)械聲音的確定方法的具體示例
[0059]3.2.1.使用統(tǒng)計(jì)識(shí)別方法的確定方法
[0060]3.2.2.使用表格確定的確定方法
[0061]3.3 效果
[0062]4.第四實(shí)施例
[0063]4.1.音頻信號(hào)處理裝置的功能配置
[0064]4.2.效果
[0065]5.第五實(shí)施例
[0066]5.1.音頻信號(hào)處理裝置的功能配置
[0067]5.2.音頻信號(hào)處理方法
[0068]5.3.效果
[0069]6.第六實(shí)施例
[0070]6.1.噪聲確定方法的概述
[0071]6.2.音頻信號(hào)處理裝置的功能配置
[0072]6.3.音頻信號(hào)處理裝置的修改示例
[0073]6.4.效果
[0074]7.第七實(shí)施例
[0075]7.1.音頻信號(hào)處理裝置的功能配置
[0076]7.2.效果
[0077]8.結(jié)論
[0078]〈1.第一實(shí)施例>
[0079][1.1.機(jī)械聲音減少方法的概述]
[0080]首先,將描述使用根據(jù)本公開(kāi)的第一實(shí)施例的音頻信號(hào)處理裝置和方法的機(jī)械聲音減少方法的概述。
[0081]根據(jù)本實(shí)施例的音頻信號(hào)處理裝置和方法涉及用于減少?gòu)脑诼曇粲涗浹b置或聲音再現(xiàn)裝置的外殼中安裝的聲音產(chǎn)生單元(例如,驅(qū)動(dòng)裝置)產(chǎn)生的脈沖操作聲音(噪聲)的技術(shù)。具體地說(shuō),在本實(shí)施例中,當(dāng)配備了運(yùn)動(dòng)圖像捕獲功能的成像裝置在捕獲運(yùn)動(dòng)圖像的同時(shí)記錄外圍聲音時(shí),當(dāng)開(kāi)始或結(jié)束在成像裝置中安裝的驅(qū)動(dòng)裝置的操作時(shí)產(chǎn)生的脈沖機(jī)械驅(qū)動(dòng)聲音是減少的目標(biāo)。
[0082]在此,驅(qū)動(dòng)裝置是在用于使用成像光學(xué)系統(tǒng)來(lái)執(zhí)行成像操作的成像裝置中安裝的驅(qū)動(dòng)裝置,并且包括例如:變焦電機(jī),用于移動(dòng)變焦透鏡;聚焦電機(jī),用于移動(dòng)聚焦透鏡;光圈機(jī)構(gòu);用于控制快門(mén)的驅(qū)動(dòng)機(jī)構(gòu)等等。驅(qū)動(dòng)裝置設(shè)置在與成像裝置的聲音收集單元相同的外殼中。另外,脈沖機(jī)械驅(qū)動(dòng)聲音(以下稱(chēng)為“脈沖機(jī)械聲音”)是當(dāng)例如如上所述的各種驅(qū)動(dòng)裝置開(kāi)始或結(jié)束它們的操作時(shí)產(chǎn)生的瞬時(shí)聲音(例如,變焦電機(jī)的驅(qū)動(dòng)聲音、聚焦電機(jī)的驅(qū)動(dòng)聲音、光圈機(jī)構(gòu)的驅(qū)動(dòng)聲音、快門(mén)聲音或操作按鈕的按壓聲音等)。脈沖機(jī)械聲音例如是當(dāng)變焦電機(jī)等的操作開(kāi)始或結(jié)束時(shí)從電機(jī)與齒輪的接合產(chǎn)生的“咔噠”或“噼啪”聲音。
[0083]以下,將描述下述示例:其中,音頻信號(hào)處理裝置是具有運(yùn)動(dòng)圖像捕獲功能的數(shù)字相機(jī),并且作為要減少的噪聲的脈沖機(jī)械聲音是當(dāng)在數(shù)字相機(jī)中開(kāi)始光學(xué)變焦的操作時(shí)產(chǎn)生的變焦開(kāi)始聲音。然而,根據(jù)本公開(kāi)的實(shí)施例的音頻信號(hào)處理裝置和脈沖機(jī)械聲音不限于該示例。
[0084]當(dāng)用戶在由數(shù)字相機(jī)執(zhí)行的成像和聲音記錄期間執(zhí)行變焦操作時(shí),在相機(jī)內(nèi)的變焦電機(jī)被驅(qū)動(dòng)以與驅(qū)動(dòng)變焦透鏡的齒輪接合,并且因此,瞬時(shí)產(chǎn)生大的脈沖機(jī)械聲音(變焦開(kāi)始聲音)。然后,數(shù)字相機(jī)的麥克風(fēng)不僅收集用戶期望記錄的、在相機(jī)周?chē)耐獠柯曇?包括例如由麥克風(fēng)收集的任意聲音,諸如環(huán)境聲音或人的語(yǔ)音等;以下稱(chēng)為“期望聲音”或“背景聲音”),此外還收集從相機(jī)的內(nèi)部產(chǎn)生的這樣的脈沖機(jī)械聲音。因此,在其中脈沖機(jī)械聲音被包含到期望聲音中的狀態(tài)中執(zhí)行聲音的記錄,并且當(dāng)再現(xiàn)記錄的聲音時(shí),用戶聽(tīng)見(jiàn)期望聲音內(nèi)包含的脈沖機(jī)械聲音,這是不令人愉快的。因?yàn)槊}沖機(jī)械聲音在例如200Hz或更低的頻率上引起外殼的振動(dòng),并且在麥克風(fēng)周?chē)划a(chǎn)生,所以以比期望聲音更大的音量收集了脈沖機(jī)械聲音。因?yàn)樵谌缟纤龅拿}沖機(jī)械聲音和期望聲音之間存在音量差,所以如果期望聲音內(nèi)包含機(jī)械聲音,則脈沖機(jī)械聲音在記錄的聲音的再現(xiàn)期間明顯。因此,已經(jīng)要求下述技術(shù):該技術(shù)使得能夠在運(yùn)動(dòng)圖像和聲音的記錄或再現(xiàn)期間在適當(dāng)?shù)厝コT如變焦開(kāi)始聲音等的脈沖機(jī)械聲音后僅記錄期望聲音。
[0085]在如在如上所述的專(zhuān)利文獻(xiàn)I和專(zhuān)利文獻(xiàn)2中公開(kāi)的現(xiàn)有技術(shù)的噪聲減少技術(shù)中,基于用于控制驅(qū)動(dòng)裝置的驅(qū)動(dòng)信號(hào)的發(fā)送時(shí)刻來(lái)估計(jì)其中產(chǎn)生機(jī)械驅(qū)動(dòng)聲音的部分(噪聲部分),并且對(duì)于該噪聲部分執(zhí)行噪聲減少處理。然而,因?yàn)閷?shí)際記錄的噪聲相對(duì)于驅(qū)動(dòng)信號(hào)的延遲等,難以精確地從驅(qū)動(dòng)信號(hào)的發(fā)送時(shí)刻估計(jì)噪聲部分。另外,使用在專(zhuān)利文獻(xiàn)2中公開(kāi)的僅基于音頻信號(hào)的電平(音量)來(lái)確定噪聲的存在或不存在的方法,難以精確地檢測(cè)其中實(shí)際上產(chǎn)生由人耳感知的噪聲的部分。
[0086]因此,在本實(shí)施例中,從由成像裝置的聲音收集單元收集的音頻信號(hào)提取用于指示脈沖機(jī)械聲音的特征量,僅使用特征量而不是驅(qū)動(dòng)信號(hào)來(lái)確定脈沖機(jī)械聲音的存在或不存在,并且因此,檢測(cè)包括脈沖機(jī)械聲音的噪聲部分。在此,用于指示脈沖機(jī)械聲音的特征量?jī)?yōu)選地包括:(I)用于指示脈沖機(jī)械聲音的脈沖分量的特征量(其對(duì)應(yīng)于第一特征量);以及(2)用于指示脈沖機(jī)械聲音的混響分量的混響特征量(其對(duì)應(yīng)于第二特征量)。通過(guò)使用如上所述的用于指示脈沖機(jī)械聲音的脈沖分量和混響分量的兩種特征量,可以精確地檢測(cè)在音頻信號(hào)中包括的脈沖機(jī)械聲音。
[0087]此外,(I)如上所述的脈沖特征量?jī)?yōu)選地包括:Ca)脈沖機(jī)械聲音的脈沖分量的最大幅度值A(chǔ) ;以及(b)脈沖分量的脈沖寬度W,并且,(2)混響特征量?jī)?yōu)選地包括(c)用于指示脈沖機(jī)械聲音的混響分量的窄帶信號(hào)的功率P。Ca)最大幅度值A(chǔ)和(b)脈沖寬度W是脈沖特征量的代表參數(shù)。另外,(c)用于指示脈沖機(jī)械聲音的混響分量的窄帶信號(hào)的功率P(以下稱(chēng)為“混響分量功率P”)是混響特征量的代表參數(shù)。窄帶信號(hào)是在低頻帶(例如,200Hz或更低)中的音頻信號(hào)中的、對(duì)于脈沖機(jī)械聲音的混響分量唯一的信號(hào),并且混響分量功率P例如是在預(yù)定部分中的信號(hào)的幅度的積分值(信號(hào)電平)。
[0088]根據(jù)本實(shí)施例的音頻信號(hào)處理裝置的特征量提取單元從音頻信號(hào)提取三個(gè)特征量:(a)脈沖機(jī)械聲音的脈沖分量的最大幅度值A(chǔ) ; (b)脈沖分量的脈沖寬度W ;以及(C)混響分量功率P。然后,音頻信號(hào)處理裝置的噪聲確定單元使用三個(gè)提取的特征量的向量X(A、W和P)和確定系數(shù)綜合來(lái)確定音頻信號(hào)是否包括脈沖機(jī)械聲音。從先前的學(xué)習(xí)或先前的設(shè)置來(lái)獲得確定所需的確定系數(shù)。以這種方式,可以使用三個(gè)特征量(A、W和P)來(lái)更精確地檢測(cè)在音頻信號(hào)中包括的脈沖機(jī)械聲音。以下,將詳細(xì)描述根據(jù)本實(shí)施例的脈沖機(jī)械聲音的減少方法。
[0089][1.2.音頻信號(hào)處理裝置的配置]
[0090][1.2.1.音頻信號(hào)處理裝置的硬件配置]
[0091 ] 首先,參考圖1,將描述根據(jù)本實(shí)施例的音頻信號(hào)處理裝置被應(yīng)用到的數(shù)字相機(jī)的硬件配置。圖1是圖示根據(jù)本實(shí)施例的音頻信號(hào)處理裝置被應(yīng)用到的數(shù)字相機(jī)I的硬件配置的框圖。
[0092]根據(jù)本實(shí)施例的數(shù)字相機(jī)I例如是當(dāng)捕獲運(yùn)動(dòng)圖像時(shí)可以記錄運(yùn)動(dòng)圖像和聲音的成像裝置。數(shù)字相機(jī)I將對(duì)象成像,將從成像獲得的所捕獲的圖像(其可以是靜止圖像或運(yùn)動(dòng)圖像)轉(zhuǎn)換為數(shù)字圖像數(shù)據(jù),并且將該數(shù)據(jù)與聲音一起記錄在記錄介質(zhì)上。
[0093]如圖1中所示,根據(jù)本實(shí)施例的數(shù)字相機(jī)I廣義上具有成像單元10、圖像信號(hào)處理單元20、顯示單元30、記錄介質(zhì)40、聲音收集單元50、音頻信號(hào)處理單元60、控制單元70和操作單元80。
[0094]成像單元10成像對(duì)象,并且輸出用于指示所捕獲的圖像的模擬圖像信號(hào)。成像單元10包括成像光學(xué)系統(tǒng)11、成像傳感器12、時(shí)刻產(chǎn)生器13和驅(qū)動(dòng)裝置14。
[0095]成像光學(xué)系統(tǒng)11由下述部分構(gòu)成:光學(xué)組件,其包括各種透鏡,諸如聚焦透鏡、變焦透鏡和校正透鏡;濾光器,其去除不必要的波長(zhǎng);快門(mén);以及光圈等。從對(duì)象入射的光學(xué)圖像(對(duì)象圖像)經(jīng)由成像光學(xué)系統(tǒng)11的光學(xué)組件形成在成像傳感器12的曝光表面上。成像傳感器12由諸如CCD (電荷耦合器件)或CMOS (互補(bǔ)金屬氧化物半導(dǎo)體)等的固態(tài)圖像傳感器配置。成像傳感器12對(duì)于從成像光學(xué)系統(tǒng)11引導(dǎo)的光學(xué)圖像執(zhí)行光電轉(zhuǎn)換,并且輸出用于指示所捕獲的圖像的電信號(hào)(模擬圖像信號(hào))。
[0096]成像光學(xué)系統(tǒng)11機(jī)械地連接到驅(qū)動(dòng)裝置14,驅(qū)動(dòng)裝置14驅(qū)動(dòng)成像光學(xué)系統(tǒng)11的光學(xué)組件。驅(qū)動(dòng)裝置14例如包括變焦電機(jī)15、聚焦電機(jī)16和光圈機(jī)構(gòu)(未示出)等。驅(qū)動(dòng)裝置14根據(jù)下述的控制單元70的指令來(lái)驅(qū)動(dòng)成像光學(xué)系統(tǒng)11的光學(xué)組件,以便移動(dòng)變焦透鏡和聚焦透鏡,或者調(diào)整光圈。例如,變焦電機(jī)15執(zhí)行通過(guò)在遠(yuǎn)攝或?qū)挿较蛏弦苿?dòng)變焦透鏡而調(diào)整視角的變焦操作。另外,聚焦電機(jī)16通過(guò)移動(dòng)聚焦透鏡來(lái)執(zhí)行聚焦在對(duì)象上的聚焦操作。
[0097]另外,時(shí)刻產(chǎn)生器13 (以下稱(chēng)為T(mén)G13)根據(jù)控制單元70的指令來(lái)產(chǎn)生成像傳感器12所需的操作脈沖。例如,TG13產(chǎn)生各種脈沖,諸如用于垂直傳送的四相位脈沖、場(chǎng)移位脈沖、用于水平傳送的兩相位脈沖和快門(mén)脈沖,并且將這些脈沖供應(yīng)到成像傳感器12。當(dāng)TG13驅(qū)動(dòng)成像傳感器12時(shí),捕獲對(duì)象圖像。另外,當(dāng)TG13調(diào)整成像傳感器12的快門(mén)速度時(shí),控制所捕獲的圖像的曝光量和曝光時(shí)間段(電子快門(mén)功能)。由成像傳感器12輸出的圖像信號(hào)被輸入到圖像信號(hào)處理單元20。
[0098]圖像信號(hào)處理單元20被諸如宏控制器的電子電路配置,對(duì)于從成像傳感器12輸出的圖像信號(hào)執(zhí)行預(yù)定圖像處理,并且向顯示單元30和控制單元70輸出已經(jīng)進(jìn)行了圖像處理的圖像信號(hào)。圖像信號(hào)處理單元20具有模擬信號(hào)處理單元21、模數(shù)(A/D)轉(zhuǎn)換器22和數(shù)字信號(hào)處理單元23。
[0099]模擬信號(hào)處理單元21是所謂的模擬前端,其對(duì)于圖像信號(hào)執(zhí)行預(yù)處理。模擬信號(hào)處理單元21對(duì)于從成像傳感器12輸出的圖像信號(hào)執(zhí)行例如⑶S (相關(guān)雙采樣)處理或通過(guò)可編程增益放大器(PGA)的增益處理等。A/D轉(zhuǎn)換器22將從模擬信號(hào)處理單元21輸入的模擬圖像信號(hào)轉(zhuǎn)換為數(shù)字圖像信號(hào),并且然后將該信號(hào)輸出到數(shù)字信號(hào)處理單元23。數(shù)字信號(hào)處理單元23對(duì)于輸入的數(shù)字圖像信號(hào)執(zhí)行數(shù)字信號(hào)處理,諸如噪聲去除、白平衡調(diào)整、顏色校正、邊緣加重或伽馬校正等,并且然后向顯示單元30和控制單元70輸出該信號(hào)。
[0100]顯示單元30被配置為顯示裝置,例如液晶顯示器(IXD)或有機(jī)EL顯示器等。顯示單元30根據(jù)控制單元70的控制來(lái)顯示各種輸入圖像數(shù)據(jù)。例如,顯示單元30在成像期間實(shí)時(shí)地顯示從圖像信號(hào)處理單元20輸入的所捕獲的圖像(通過(guò)圖像)。因此,用戶可以在觀看被數(shù)字相機(jī)I捕獲的通過(guò)圖像的同時(shí)操作數(shù)字相機(jī)I。另外,當(dāng)在記錄介質(zhì)40上記錄的所捕獲的圖像被再現(xiàn)時(shí),顯示單元30顯示再現(xiàn)的圖像。因此,用戶可以識(shí)別在記錄介質(zhì)40上記錄的所捕獲的圖像的內(nèi)容。
[0101]記錄介質(zhì)40在其上記錄各種數(shù)據(jù),諸如捕獲的圖像數(shù)據(jù)、音頻數(shù)據(jù)和該數(shù)據(jù)的元數(shù)據(jù)。對(duì)于記錄介質(zhì)40,例如,可以使用諸如存儲(chǔ)卡的半導(dǎo)體存儲(chǔ)器、或者諸如光盤(pán)的盤(pán)型記錄介質(zhì)、或者硬盤(pán)。光盤(pán)例如包括藍(lán)光盤(pán)、DVD (數(shù)字通用盤(pán))和CD (致密盤(pán))等。記錄介質(zhì)40可以被內(nèi)置在數(shù)字相機(jī)I中,或者可以是可以在數(shù)字相機(jī)I上安裝或卸下的可裝卸介質(zhì)。
[0102]聲音收集單兀50收集在數(shù)字相機(jī)I周?chē)耐獠柯曇?。根?jù)本實(shí)施例的聲音收集單元50是由用于記錄外部聲音的一個(gè)麥克風(fēng)51構(gòu)成的單聲道麥克風(fēng),但是可以被配置為由兩個(gè)麥克風(fēng)構(gòu)成的立體聲麥克風(fēng)。麥克風(fēng)51輸出通過(guò)收集外部聲音而獲得的音頻信號(hào)。使用聲音收集單元50,可以收集外部聲音,并且在運(yùn)動(dòng)圖像捕獲期間與運(yùn)動(dòng)圖像一起被記錄外部聲音。麥克風(fēng)51被設(shè)置于數(shù)字相機(jī)I的外殼中以便收集外部聲音(期望聲音),但是也收集在外殼中設(shè)置的聲音產(chǎn)生單元(驅(qū)動(dòng)裝置14)的機(jī)械驅(qū)動(dòng)聲音作為噪聲。
[0103]音頻信號(hào)處理單元60由諸如宏控制器的電子電路配置,對(duì)于音頻信號(hào)執(zhí)行預(yù)定聲音處理,并且輸出用于記錄的音頻信號(hào)。聲音處理例如包括A/D轉(zhuǎn)換處理和噪聲減少處理等。本實(shí)施例特征在于通過(guò)音頻信號(hào)處理單元60執(zhí)行噪聲減少處理,并且下面將提供其詳細(xì)說(shuō)明。
[0104]控制單元70被諸如宏控制器的電子電路配置,并且控制數(shù)字相機(jī)I的整體操作??刂茊卧?0例如包括CPU71、EEPR0M (電子可擦除可編程R0M)72、R0M (只讀存儲(chǔ)器)73和RAM (隨機(jī)存取存儲(chǔ)器)74。控制單元70控制在數(shù)字相機(jī)I內(nèi)的單元的每一個(gè)。例如,當(dāng)從由麥克風(fēng)51收集的音頻信號(hào)減少作為噪聲由驅(qū)動(dòng)裝置14產(chǎn)生的機(jī)械聲音時(shí),控制單元70控制音頻信號(hào)處理單元60的操作。
[0105]控制單元70的R0M73存儲(chǔ)程序,該程序使得CPU71執(zhí)行各種控制處理。CPU71基于該程序來(lái)操作,并且在使用RAM74的同時(shí)執(zhí)行算術(shù)運(yùn)算和各種控制所需的控制處理??梢栽跀?shù)字相機(jī)I中安裝的存儲(chǔ)器裝置(例如,EEPR0M72和R0M73等)中預(yù)先存儲(chǔ)程序。另夕卜,可以通過(guò)在諸如盤(pán)類(lèi)記錄介質(zhì)或存儲(chǔ)卡的可裝卸介質(zhì)中存儲(chǔ)程序來(lái)向數(shù)字相機(jī)I提供程序,并且可以經(jīng)由諸如LAN或因特網(wǎng)的網(wǎng)絡(luò)來(lái)在數(shù)字相機(jī)I中下載程序。
[0106]在此,將描述控制單元70的控制的具體示例??刂茊卧?0控制成像單元10的TG13和驅(qū)動(dòng)裝置14,以控制由成像單元10執(zhí)行的成像處理。例如,控制單元70通過(guò)下述方式來(lái)執(zhí)行自動(dòng)曝光控制(AE功能):調(diào)整成像光學(xué)系統(tǒng)11的光圈,設(shè)置成像傳感器12的電子快門(mén)速度,并且設(shè)置模擬信號(hào)處理單元21的AGC的增益,等等。另外,控制單元70執(zhí)行自動(dòng)聚焦控制(AF功能),用于通過(guò)移動(dòng)成像光學(xué)系統(tǒng)11的聚焦透鏡并且由此改變聚焦位置來(lái)將成像光學(xué)系統(tǒng)11自動(dòng)聚焦在特定對(duì)象上。此外,控制單元70通過(guò)下述方式來(lái)調(diào)整所捕獲的圖像的視角:移動(dòng)成像光學(xué)系統(tǒng)11的變焦透鏡,并且由此改變變焦位置。此外,控制單元70使得在記錄介質(zhì)40上記錄諸如所捕獲的圖像和元數(shù)據(jù)等的各種數(shù)據(jù),并且使得讀取和再現(xiàn)在記錄介質(zhì)40上記錄的數(shù)據(jù)。另外,控制單元70使得產(chǎn)生要在顯示單元30上顯示的各種顯示圖像,并且控制顯示單元30顯示該顯示圖像。
[0107]操作單元80和顯示單元30作為用戶界面,其使得用戶能夠操作數(shù)字相機(jī)I。操作單元80被諸如按鈕或桿的操作按鍵或觸摸板配置,并且例如包括變焦按鈕、快門(mén)按鈕和電源按鈕等。操作單元80根據(jù)用戶操作來(lái)向控制單元70輸出用于指令各種成像操作的指令信息。
[0108][1.2.2.音頻信號(hào)處理裝置的功能配置]
[0109]接下來(lái),參考圖2,將描述根據(jù)本實(shí)施例的、被應(yīng)用到數(shù)字相機(jī)I的音頻信號(hào)處理裝置的功能配置示例。圖2是圖示根據(jù)該實(shí)施例的音頻信號(hào)處理裝置100的功能配置的框圖。
[0110]如在圖2中所示,音頻信號(hào)處理裝置100包括信號(hào)輸入單元110、A/D轉(zhuǎn)換器120、特征量提取單元130、噪聲確定單元140、確定系數(shù)保留單元150、噪聲減少單元160和信號(hào)記錄單元170。信號(hào)輸入單元110具有如上所述的圖1的麥克風(fēng)51。另外,A/D轉(zhuǎn)換器120、特征量提取單元130、噪聲確定單元140、確定系數(shù)保留單元150和噪聲減少單元160構(gòu)成如上所述的圖1的音頻信號(hào)處理單元60。信號(hào)記錄單元170由如上所述的圖1的控制單元70和記錄介質(zhì)40構(gòu)成。
[0111]音頻信號(hào)處理裝置100的單元的每個(gè)可以被專(zhuān)用硬件或軟件配置。當(dāng)使用軟件時(shí),音頻信號(hào)處理裝置100的處理器可以執(zhí)行程序,用于實(shí)現(xiàn)下述的功能單元的功能??梢越?jīng)由計(jì)算機(jī)可讀記錄介質(zhì)(例如,光盤(pán)、硬盤(pán)或半導(dǎo)體存儲(chǔ)器等)向音頻信號(hào)處理裝置100提供程序,或者可以經(jīng)由各種通信手段來(lái)向該裝置提供程序。以下,將描述音頻信號(hào)處理裝置100的單元的每一個(gè)。
[0112]信號(hào)輸入單兀110由在數(shù)字相機(jī)I的外殼中安裝的麥克風(fēng)51構(gòu)成。信號(hào)輸入單兀Iio的麥克風(fēng)51收集在數(shù)字相機(jī)I周?chē)钠谕曇?要記錄的聲音),將外部聲音轉(zhuǎn)換為音頻信號(hào),并且然后輸出。該音頻信號(hào)不僅包括期望聲音,而是還包括諸如脈沖機(jī)械聲音和其中包含的從數(shù)字相機(jī)I的驅(qū)動(dòng)裝置14產(chǎn)生的其他機(jī)械驅(qū)動(dòng)聲音的噪聲。
[0113]A/D轉(zhuǎn)換器120將從麥克風(fēng)51輸出的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào)。該數(shù)字音頻信號(hào)被輸入到特征量提取單元130和噪聲減少單元160。[0114]特征量提取單元130從自麥克風(fēng)51輸出的音頻信號(hào)提取用于指示脈沖機(jī)械聲音的特征量。特征量提取單元130用作:(1)脈沖特征量提取單元,其提取用于指示脈沖機(jī)械聲音的脈沖分量的脈沖特征量;以及(2)混響特征量提取單元,其提取用于指示脈沖機(jī)械聲音的混響分量的混響特征量。具體地說(shuō),特征量提取單元130包括作為脈沖特征量提取單元的最大幅度值獲取部131和脈沖寬度計(jì)算部132與作為混響特征量提取單元的混響功率計(jì)算部133。
[0115]最大幅度值獲取部131獲取音頻信號(hào)的脈沖分量的幅度(信號(hào)電平)的最大值,并且將最大幅度值A(chǔ)輸出為脈沖特征量。脈沖寬度計(jì)算部132計(jì)算音頻信號(hào)的脈沖分量的脈沖寬度W,并且輸出脈沖寬度W作為脈沖特征量?;祉懝β视?jì)算部133計(jì)算用于指示音頻信號(hào)的混響分量的窄帶信號(hào)的功率P,并且將混響功率P輸出為混響特征量。
[0116]在此,將參考圖3A至3C來(lái)描述脈沖機(jī)械聲音。圖3A至3C是包括根據(jù)本實(shí)施例的脈沖機(jī)械聲音的音頻信號(hào)的波形圖。
[0117]如圖3A中所示,當(dāng)驅(qū)動(dòng)裝置14在通過(guò)數(shù)字相機(jī)I的聲音記錄期間開(kāi)始操作時(shí),從驅(qū)動(dòng)裝置14產(chǎn)生脈沖機(jī)械聲音,并且該脈沖機(jī)械聲音作為噪聲包含到外部聲音(背景聲音)的音頻信號(hào)內(nèi)。脈沖機(jī)械聲音包括其幅度瞬間升高的脈沖分量和跟隨脈沖分量的混響分量。
[0118]脈沖機(jī)械聲音的脈沖分量是其中脈沖機(jī)械聲音的信號(hào)電平(幅度)在產(chǎn)生的開(kāi)始在脈沖形狀上升高的部分。脈沖分量的信號(hào)電平(幅度)的最大值是最大幅度值A(chǔ) (參見(jiàn)圖3C)。另外,脈沖寬度W是脈沖分量的時(shí)間寬度,并且例如,從最大幅度值A(chǔ)至其一半的信號(hào)電平(幅度)的時(shí)間寬度(參見(jiàn)圖3C)。
[0119]另一方面,脈沖機(jī)械聲音的混響分量是跟隨脈沖分量的特定低頻帶的窄帶信號(hào)的一部分,并且具有響應(yīng)于脈沖機(jī)械聲音的混響的信號(hào)特性。數(shù)字相機(jī)I的從驅(qū)動(dòng)裝置14產(chǎn)生的驅(qū)動(dòng)噪聲等大多數(shù)包括數(shù)字相機(jī)I的主體的諧振分量,并且當(dāng)驅(qū)動(dòng)裝置14開(kāi)始操作時(shí)產(chǎn)生脈沖分量后,產(chǎn)生包括脈沖分量的諧振分量的混響分量。脈沖機(jī)械聲音的混響分量的功率集中在與一般背景聲音不同的特定頻帶,諸如等于或小于200Hz的低頻帶。用于指示混響分量的窄帶信號(hào)的功率是混響分量功率P。
[0120]如上所述,因?yàn)槊}沖機(jī)械聲音包括脈沖分量和混響分量的特征分量,所以如果可以檢測(cè)該兩種分量,則可以精確地檢測(cè)脈沖機(jī)械聲音的存在或不存在。因此,特征量提取單元130從輸入音頻信號(hào)計(jì)算三個(gè)特征量(A、W和P)。在該情況下,因?yàn)殡y以計(jì)算數(shù)字音頻信號(hào)的每一個(gè)采樣數(shù)據(jù)片的特征量,所以特征量提取單元130在緩沖器(未示出)中以預(yù)定數(shù)量(例如,一個(gè)幀)來(lái)存儲(chǔ)音頻信號(hào)的數(shù)據(jù),并且然后計(jì)算音頻信號(hào)的一個(gè)幀數(shù)據(jù)的特征量。在此,音頻信號(hào)的一個(gè)幀可以例如是512個(gè)樣本或1024個(gè)樣本,但是該值不限于此,并且可以是任何數(shù)量的數(shù)據(jù)片。
[0121]最大幅度值獲取部131計(jì)算在音頻信號(hào)的一個(gè)幀中的數(shù)據(jù)的信號(hào)電平(幅度)的絕對(duì)值,并且提取在值中的最大值,由此獲得最大幅度值A(chǔ)。當(dāng)脈沖機(jī)械聲音的脈沖分量的音量增大時(shí),最大幅度值A(chǔ)因此增大。脈沖寬度計(jì)算部132計(jì)算音頻信號(hào)的信號(hào)電平(幅度)的從最大幅度值A(chǔ)至例如其一半的時(shí)間寬度,由此獲得脈沖寬度W。當(dāng)脈沖機(jī)械聲音的脈沖分量變陡時(shí),脈沖寬度W因此減小。
[0122]混響功率計(jì)算部133使特定頻帶通過(guò)的帶通濾波器(BPF)來(lái)計(jì)算用于指示脈沖機(jī)械聲音的混響分量的窄帶信號(hào)的功率(混響分量功率P)的值。例如,混響功率計(jì)算部133從音頻信號(hào)取出200Hz或更低的低頻帶的信號(hào),并且積分該信號(hào)的信號(hào)電平值,由此獲得混響分量功率P的值?;祉懝β视?jì)算部133可以根據(jù)噪聲的特性從與200Hz或更低的頻帶不同的頻帶計(jì)算混響分量功率P。另外,混響功率計(jì)算部133可以從多個(gè)頻帶計(jì)算混響分量功率P的值。另外,可以通過(guò)使用快速傅立葉變換(FFT)算法計(jì)算音頻信號(hào)的功率譜來(lái)計(jì)算混響分量功率P的值。
[0123]如上所述,由特征量提取單元130獲得的三個(gè)特征量(最大幅度值A(chǔ)、脈沖寬度W和混響分量功率P)被輸入到噪聲確定單元140。
[0124]參見(jiàn)圖2,噪聲確定單元140基于用于指示脈沖機(jī)械聲音的特征量(最大幅度值A(chǔ)、脈沖寬度W和混響分量功率P)來(lái)確定是否在音頻信號(hào)中包括脈沖機(jī)械聲音。確定系數(shù)保留單元150被配置為諸如存儲(chǔ)器的存儲(chǔ)器裝置,并且保留在通過(guò)噪聲確定單元140確定脈沖機(jī)械聲音的存在或不存在中使用的確定系數(shù)。因?yàn)榇_定系數(shù)根據(jù)數(shù)字相機(jī)I或驅(qū)動(dòng)裝置14的特性與麥克風(fēng)51和驅(qū)動(dòng)裝置14的位置關(guān)系等而不同,所以在確定系數(shù)保留單元150中存儲(chǔ)通過(guò)預(yù)先學(xué)習(xí)從裝置產(chǎn)生的脈沖機(jī)械聲音而設(shè)置的確定系數(shù)。
[0125]噪聲確定單元140通過(guò)綜合使用包括由特征量提取單元130獲得的三個(gè)特征量的特征量向量X (A、W和P)和在確定系數(shù)保留單兀中保留的確定系數(shù)來(lái)確定在首頻彳目號(hào)中的脈沖機(jī)械聲音的存在或不存在。噪聲確定單兀140確定是否在音頻信號(hào)中包括脈沖機(jī)械聲音,并且指定其中包括脈沖機(jī)械聲音的音頻信號(hào)的部分。下面更詳細(xì)地描述該確定方法。
[0126]噪聲減少單元160根據(jù)噪聲確定單元140的確定結(jié)果來(lái)對(duì)于音頻信號(hào)執(zhí)行噪聲減少處理,由此從音頻信號(hào)去除諸如脈沖機(jī)械聲音的噪聲。具體地說(shuō),當(dāng)確定包括脈沖機(jī)械聲音時(shí),噪聲減少單兀160對(duì)于其中包括脈沖機(jī)械聲音的部分的音頻信號(hào)執(zhí)行噪聲減少處理。另一方面,當(dāng)確定不包括脈沖機(jī)械聲音時(shí),噪聲減少單元160不執(zhí)行噪聲減少處理。如上所述,因?yàn)閮H當(dāng)包括脈沖機(jī)械聲音時(shí)對(duì)于其中包括脈沖機(jī)械聲音的部分(噪聲部分)的音頻信號(hào)執(zhí)行噪聲減少處理,所以增強(qiáng)了噪聲減少處理的處理效率,并且因此,可以降低不必要的處理負(fù)荷。
[0127]作為噪聲減少單元160使用的噪聲減少處理方法,可以使用現(xiàn)有技術(shù)的任意方法,然而,存在例如下面的處理方法。(I)噪聲減少單元160可以執(zhí)行用于減小噪聲部分的音量(信號(hào)電平)的增益控制。(2)另外,噪聲減少單元160可以從輸入實(shí)際音頻信號(hào)減去預(yù)先建立的脈沖機(jī)械聲音的模型信號(hào)。(3)此外,噪聲減少單元160可以使用帶阻濾波器來(lái)抑制脈沖機(jī)械聲音的頻帶(噪聲頻帶)。(4)此外,噪聲減少單元160可以基于在噪聲部分之前和之后的音頻信號(hào)來(lái)估計(jì)其中包括脈沖機(jī)械聲音的噪聲時(shí)間段的背景信號(hào)的信號(hào)波形,并且然后,可以使用估計(jì)信號(hào)來(lái)內(nèi)插噪聲部分的信號(hào)。
[0128]信號(hào)記錄單元170在記錄介質(zhì)(未示出)上記錄其中通過(guò)噪聲減少單元160減小脈沖機(jī)械聲音的數(shù)字音頻信號(hào)。記錄介質(zhì)可以是任意記錄介質(zhì),諸如:磁記錄介質(zhì),例如硬盤(pán)和磁帶;光記錄介質(zhì),諸如DVD和藍(lán)光盤(pán);或者,半導(dǎo)體存儲(chǔ)器,諸如快閃存儲(chǔ)器或USB存儲(chǔ)器。
[0129][1.3.脈沖機(jī)械聲音的確定方法的具體示例]
[0130]接下來(lái),將描述由根據(jù)本實(shí)施例的音頻信號(hào)處理裝置100的噪聲確定單元140使用的脈沖機(jī)械聲音的確定方法的具體示例。以下,例示使用統(tǒng)計(jì)識(shí)別方法的確定方法和使用表格確定的確定方法。
[0131][1.3.1.使用統(tǒng)計(jì)識(shí)別方法的確定方法]
[0132]噪聲確定單元140可以基于使用線性識(shí)別裝置或人工神經(jīng)網(wǎng)絡(luò)等的統(tǒng)計(jì)識(shí)別方法來(lái)確定在音頻信號(hào)中包括的脈沖機(jī)械聲音的存在或不存在。例如,在使用線性識(shí)別裝置的統(tǒng)計(jì)識(shí)別方法中,使用下面的表達(dá)式(I)來(lái)計(jì)算特征量的加權(quán)平均值作為確定值I。
【權(quán)利要求】
1.一種音頻信號(hào)處理裝置,包括: 特征量提取單元,其被配置為從通過(guò)聲音收集單元獲得的音頻信號(hào)提取特征量,所述特征量指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單元產(chǎn)生的脈沖操作聲音;以及 噪聲確定單元,其被配置為基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
2.根據(jù)權(quán)利要求1所述的音頻信號(hào)處理裝置, 其中,所述聲音產(chǎn)生單元是在與所述聲音收集單元相同的外殼中設(shè)置的驅(qū)動(dòng)裝置;并且 其中,所述操作聲音是當(dāng)所述驅(qū)動(dòng)裝置的操作開(kāi)始或結(jié)束時(shí)產(chǎn)生的脈沖機(jī)械驅(qū)動(dòng)聲曰?
3.根據(jù)權(quán)利要求1所述的音頻信號(hào)處理裝置, 其中,所述特征量提取單元提取作為所述特征量的用于指示所述操作聲音的脈沖分量的第一特征量和用于指示所述操作聲音的混響分量的第二特征量,并且 其中,所述噪聲確定單元基于所述第一和第二特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
4.根據(jù)權(quán)利要求3所述的音頻信號(hào)處理裝置, 其中,所述第一特征量包括所述操作聲音的所述脈沖分量的最大振幅值和脈沖寬度,并且 其中,所述第二特征量包括用于指示所述操作聲音的所述混響分量的窄帶信號(hào)的功率。
5.根據(jù)權(quán)利要求3所述的音頻信號(hào)處理裝置, 其中,所述第一特征量包括所述操作聲音的所述脈沖分量的最大振幅值和脈沖寬度,并且 其中,所述第二特征量包括用于指示所述操作聲音的所述混響分量的窄帶信號(hào)的過(guò)零次數(shù)。
6.根據(jù)權(quán)利要求3所述的音頻信號(hào)處理裝置, 其中,所述特征量提取單元進(jìn)一步提取作為所述特征量的第三特征量,所述第三特征量包括下述內(nèi)容的一些或全部:所述音頻信號(hào)的均方根RMS、所述RMS的改變的值、用于指示所述操作聲音的所述混響分量的窄帶信號(hào)的改變的振幅值、所述窄帶信號(hào)的過(guò)零次數(shù)或過(guò)零次數(shù)的改變的值,并且 其中,所述噪聲確定單元基于所述第一、第二和第三特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
7.根據(jù)權(quán)利要求1所述的音頻信號(hào)處理裝置, 其中,所述特征量提取單元從所述音頻信號(hào)的多個(gè)部分提取多個(gè)特征量,并且其中,所述噪聲確定單元基于從所述多個(gè)部分提取的所述多個(gè)特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
8.根據(jù)權(quán)利要求2所述的音頻信號(hào)處理裝置,進(jìn)一步包括: 控制信號(hào)獲取單元,其被配置來(lái)獲取用于控制所述驅(qū)動(dòng)裝置的控制信號(hào),其中,基于所述控制信號(hào)來(lái)確定所述驅(qū)動(dòng)裝置的驅(qū)動(dòng)周期,并且,僅在所述驅(qū)動(dòng)裝置的所述驅(qū)動(dòng)周期中執(zhí)行通過(guò)所述特征量提取單元進(jìn)行的所述特征量的提取處理和通過(guò)所述噪聲確定單元進(jìn)行的確定處理。
9.根據(jù)權(quán)利要求1所述的音頻信號(hào)處理裝置, 其中,所述噪聲確定單元使用所述特征量和根據(jù)所述聲音產(chǎn)生單元的特性設(shè)置的確定系數(shù)來(lái)確定是否在所述音頻信號(hào)中包括對(duì)于所述聲音產(chǎn)生單元唯一的所述操作聲音。
10.根據(jù)權(quán)利要求9所述的音頻信號(hào)處理裝置, 其中,在成像裝置中設(shè)置所述音頻信號(hào)處理裝置, 其中,所述聲音產(chǎn)生單元是能夠附接到所述成像裝置的主體或能夠從所述主體卸下的可更換透鏡裝置, 其中,所述音頻信號(hào)處理裝置進(jìn)一步包括: 確定系數(shù)保留單元,其被配置為保留對(duì)于每一個(gè)透鏡裝置設(shè)置的多個(gè)確定系數(shù);以及確定系數(shù)選擇單元,其被配置為基于用于指示連接到所述成像裝置的所述透鏡裝置的信息來(lái)從所述多個(gè)確定系數(shù)中選擇與該透鏡裝置對(duì)應(yīng)的確定系數(shù), 其中,所述噪聲確定單元使用所述特征量和由所述確定系數(shù)選擇單元選擇的所述確定系數(shù)來(lái)確定是否在所述音頻信號(hào)中包括對(duì)于連接到所述成像裝置的所述透鏡裝置唯一的所述操作聲音。
11.根據(jù)權(quán)利要求9所述的音頻信號(hào)處理裝置, 其中,在成像裝置中設(shè)置所述音頻信號(hào)處理裝置, 其中,所述聲音產(chǎn)生單元是能夠附接到所述成像裝置的主體或能夠從所述主體卸下的可更換透鏡裝置, 其中,所述透鏡裝置保留根據(jù)該透鏡裝置的特性設(shè)置的確定系數(shù),并且其中,所述噪聲確定單元從連接到所述成像裝置的所述透鏡裝置獲取所述確定系數(shù),并且使用所獲取的確定系數(shù)和所述特征量來(lái)確定是否在所述音頻信號(hào)中包括對(duì)于連接到所述成像裝置的所述透鏡裝置唯一的所述操作聲音。
12.根據(jù)權(quán)利要求1所述的音頻信號(hào)處理裝置, 其中,在被配置來(lái)再現(xiàn)所述音頻信號(hào)的再現(xiàn)裝置中設(shè)置所述音頻信號(hào)處理裝置, 其中,所述特征量提取單元在所述音頻信號(hào)的再現(xiàn)期間從所述音頻信號(hào)提取所述特征量,并且 其中,所述噪聲確定單元基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
13.一種成像裝置,包括: 聲音收集單元,其被配置為將外部聲音轉(zhuǎn)換為音頻信號(hào); 聲音產(chǎn)生單元,其被配置為被設(shè)置在與所述聲音收集單元相同的外殼中,并且產(chǎn)生脈沖操作聲音; 特征量提取單元,其被配置為從自所述聲音收集單元輸出的所述音頻信號(hào)提取用于指示所述操作聲音的特征量; 噪聲確定單元,其被配置為基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音;以及噪聲減少單元,其被配置為當(dāng)所述噪聲確定單元確定在所述音頻信號(hào)中包括所述操作聲音時(shí)對(duì)于所述音頻信號(hào)執(zhí)行噪聲減少處理。
14.一種音頻信號(hào)處理方法,包括: 從通過(guò)聲音收集單元獲得的音頻信號(hào)提取用于指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單兀產(chǎn)生的脈沖操作聲音的特征量;以及 基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
15.—種程序,用于使得計(jì)算機(jī)執(zhí)行: 從通過(guò)聲音收集單元獲得的音頻信號(hào)提取用于指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單兀產(chǎn)生的脈沖操作聲音的特征量;以及 基于所述特征量來(lái)確定是否在所述音頻信號(hào)中包括所述操作聲音。
16.一種非暫時(shí)計(jì)算機(jī)可讀記錄介質(zhì),其中記錄了程序,所述程序使得計(jì)算機(jī)執(zhí)行: 從通過(guò)聲音收集單元獲得的音頻信號(hào)提取用于指示從在與所述聲音收集單元相同的外殼中設(shè)置的聲音產(chǎn)生單兀產(chǎn)生的脈沖操作聲音的特征量;以及 基于所述特征量來(lái)確定是否在`所述音頻信號(hào)中包括所述操作聲音。
【文檔編號(hào)】G10L21/02GK103688307SQ201280035699
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2012年5月29日 優(yōu)先權(quán)日:2011年7月26日
【發(fā)明者】大迫慶一, 關(guān)矢俊之, 安部素嗣 申請(qǐng)人:索尼公司