用于識別音頻流中的一首音樂的方法和裝置的制造方法
【專利摘要】本發(fā)明揭示一種在電子裝置中執(zhí)行的用于跟蹤音頻流中的一首音樂的方法。所述方法可接收所述音頻流的第一部分,且基于所述音頻流的所述第一部分提取第一聲音特征。并且,所述方法可基于所述第一聲音特征來確定所述音頻流的所述第一部分是否指示音樂。響應(yīng)于確定所述音頻流的所述第一部分指示音樂,可基于所述音頻流的所述第一部分來識別一首音樂。另外,在接收到所述音頻流的第二部分后,所述方法可即刻基于所述音頻流的所述第二部分來提取第二聲音特征,且確定所述音頻流的所述第二部分是否指示第一首音樂。
【專利說明】用于識別音頻流中的一首音樂的方法和裝置
[0001 ] 相關(guān)申請案的交叉參考
[0002]本申請案主張2015年I月6日申請的標(biāo)題為“跟蹤音頻流中的音樂(TRACKINGMUSIC IN AUD1 STREAM)”的第14/590,662號美國專利申請案、2014年I月7日申請的標(biāo)題為“用于識別若干首音樂的方法和設(shè)備(METHOD AND APPARATUS FOR IDENTIFYING PIECESOF MUSIC)”的第61/924,556號美國臨時專利申請案,以及2014年9月17日申請的標(biāo)題為“用于跟蹤若干首音樂的方法和設(shè)備(METHOD AND APPARATUS FOR TRACKING PIECES OFMUSIC)”的第62/051,700號美國臨時專利申請案的優(yōu)先權(quán),上述各項的整個內(nèi)容以引入的方式并入本文中。
技術(shù)領(lǐng)域
[0003]本發(fā)明大體上涉及檢測音頻流中的音樂,且更具體來說,涉及在電子裝置中跟蹤音頻流中的一首音樂。
【背景技術(shù)】
[0004]近年來,例如智能電話、平板計算機(jī)、個人計算機(jī)等電子裝置的使用已變得廣泛。此類電子裝置可包含用于從輸入聲音捕獲音樂并處理音樂的聲音處理能力。舉例來說,常規(guī)電子裝置可經(jīng)配置以捕獲例如電視機(jī)、無線電、個人計算機(jī)、聲音系統(tǒng)、揚(yáng)聲器等各種聲音源輸出的聲音。
[0005]此類電子裝置可配備有經(jīng)配置以辨識所捕獲聲音中的歌曲的應(yīng)用程序。在此情況下,應(yīng)用程序可經(jīng)由通信網(wǎng)絡(luò)與外部服務(wù)器通信,以接收與所述歌曲相關(guān)聯(lián)的標(biāo)題和藝術(shù)家。在此類電子裝置中,每當(dāng)聽到未辨識的歌曲時,用戶可選擇手動運(yùn)行所述應(yīng)用程序。然而,每當(dāng)聽到所關(guān)注的歌曲就手動運(yùn)行所述應(yīng)用程序?qū)τ谟脩魜碚f可能不是非常方便。因此,用戶可將所述應(yīng)用程序設(shè)定成在背景模式下連續(xù)操作,以接收和辨識歌曲,使得用戶免于手動操作所述應(yīng)用程序的任務(wù)。
[0006]然而,連續(xù)操作所述應(yīng)用程序通常需要大量的聲音處理和網(wǎng)絡(luò)通信,這可能導(dǎo)致相當(dāng)大的電力消耗,尤其是在具有受限電力供應(yīng)的移動電子裝置中。舉例來說,即使移動裝置未接收到聲音或歌曲,所述應(yīng)用程序也可連續(xù)地處理聲音并與外部服務(wù)器通信。此外,即使在已從輸入聲音辨識到歌曲之后,所述應(yīng)用程序也可持續(xù)接收和處理已經(jīng)辨識的所述歌曲的后續(xù)聲音,并與服務(wù)器通信,以辨識后續(xù)聲音中的同一歌曲,從而導(dǎo)致不需要的電力消耗。
【發(fā)明內(nèi)容】
[0007]本發(fā)明提供用于識別和跟蹤音頻流中的一首音樂的方法和裝置。
[0008]根據(jù)本發(fā)明的一個方面,揭示一種在電子裝置中執(zhí)行的用于跟蹤音頻流中的一首音樂的方法。所述方法可接收所述音頻流的第一部分,且基于所述音頻流的所述第一部分提取第一聲音特征。并且,所述方法可基于所述第一聲音特征來確定所述音頻流的所述第一部分是否指示音樂。響應(yīng)于確定所述音頻流的所述第一部分指示音樂,可基于所述音頻流的所述第一部分來識別一首音樂。另外,在接收到所述音頻流的第二部分后,所述方法可即刻基于所述音頻流的所述第二部分來提取第二聲音特征,且確定所述音頻流的所述第二部分是否指示所述第一首音樂。本發(fā)明還描述了涉及此方法的設(shè)備、裝置、系統(tǒng)、裝置組合以及計算機(jī)可讀媒體。
[0009]根據(jù)本發(fā)明的另一方面,揭示一種用于跟蹤音頻流中的一首音樂的電子裝置。所述電子裝置可包含:音樂檢測單元,其經(jīng)配置以接收所述音頻流的第一部分,基于所述音頻流的所述第一部分提取第一聲音特征,且基于所述第一聲音特征來確定所述音頻流的所述第一部分是否指示音樂;音樂識別單元,其經(jīng)配置以響應(yīng)于確定所述第一部分指示音樂,基于所述音頻流的所述第一部分來識別第一首音樂;以及音樂跟蹤單元,其經(jīng)配置以接收所述音頻流的第二部分;基于所述音頻流的所述第二部分來提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂。
【附圖說明】
[0010]將在結(jié)合附圖閱讀時參照以下詳細(xì)描述中理解本發(fā)明的實施例。
[0011]圖1說明根據(jù)本發(fā)明的一個實施例的經(jīng)配置以當(dāng)在音頻流中識別到一首音樂時顯示關(guān)于所述首音樂的信息的電子裝置。
[0012]圖2說明根據(jù)本發(fā)明的一個實施例經(jīng)配置以經(jīng)由通信網(wǎng)絡(luò)與服務(wù)器通信來獲得與多首音樂相關(guān)聯(lián)的識別信息的多個電子裝置。
[0013]圖3說明根據(jù)本發(fā)明的一個實施例的經(jīng)配置以識別音頻流中的一首音樂以用于更新存儲單元中的音樂歷史數(shù)據(jù)庫的電子裝置的框圖。
[0014]圖4說明根據(jù)本發(fā)明的一個實施例的所述電子裝置中經(jīng)配置以產(chǎn)生或獲得一首音樂的音樂模型并基于所述音樂模型來跟蹤所述首音樂的聲音處理單元的較詳細(xì)框圖。
[0015]圖5說明根據(jù)本發(fā)明的一個實施例的用于通過聲音處理單元來跟蹤輸入聲音流中的一首音樂以確定所述首音樂是否已結(jié)束的時序圖。
[0016]圖6說明根據(jù)本發(fā)明的一個實施例的用于對音頻流中額一首音樂的一部分進(jìn)行取樣且確定所述音頻流中的后續(xù)部分是否為所述首音樂的一部分的時序圖。
[0017]圖7是根據(jù)本發(fā)明的一個實施例的在電子裝置中執(zhí)行的用于識別和跟蹤音頻流中的一首音樂的方法的流程圖。
[0018]圖8說明根據(jù)本發(fā)明的一個實施例的用于基于從音頻流的一部分提取的至少一個聲音特征來識別一首音樂的具體方法。
[0019]圖9說明根據(jù)本發(fā)明的一個實施例的用于基于與一首音樂相關(guān)聯(lián)的音樂模型來跟蹤所述首音樂的具體方法。
[0020]圖10說明根據(jù)本發(fā)明的一個實施例的電子裝置中經(jīng)配置以接收一首音樂的識別信息,管理音樂歷史數(shù)據(jù)庫,且產(chǎn)生建議和通知的音樂管理單元的較詳細(xì)框圖。
[0021]圖11說明根據(jù)一些實施例的其中可實施本發(fā)明的用于從音頻流識別一首音樂并跟蹤所述首音樂的方法和設(shè)備的無線通信系統(tǒng)中的移動裝置的框圖。
[0022]圖12是說明根據(jù)一些實施例實施的可為先前描述的服務(wù)器中的任一者的用于搜索和提供關(guān)于一首音樂的信息的服務(wù)器系統(tǒng)的框圖。
【具體實施方式】
[0023]現(xiàn)在將詳細(xì)參考各種實施例,在附圖中說明所述實施例的實例。在以下詳細(xì)描述中,陳述眾多具體細(xì)節(jié)以便提供對本發(fā)明的透徹理解。然而,對于所屬領(lǐng)域的一般技術(shù)人員將是顯而易見的是可在沒有這些具體細(xì)節(jié)的情況下實踐本發(fā)明。在其它情況下,未詳細(xì)描述眾所周知的方法、程序、系統(tǒng)和組件,以便不會不必要地混淆各種實施例的各方面。
[0024]圖1說明根據(jù)本發(fā)明的一個實施例的經(jīng)配置以當(dāng)在音頻流中識別到一首音樂時顯示與所述首音樂相關(guān)聯(lián)的信息的電子裝置120。如本文所使用,術(shù)語“音樂”可指可由節(jié)奏(例如拍子、節(jié)拍和發(fā)音)、音調(diào)(例如旋律以及和聲)、力度(例如聲音或音符的音量)等的一或多個元素表征的任何類型的聲音,且可包含樂器、話音等的聲音。另外,術(shù)語“一首音樂”在本文中可指唯一或不同音樂作品或作曲,且可包含以聲音或音頻形式(例如歌曲、曲調(diào)等)創(chuàng)建或再現(xiàn)此音樂作品或作曲。另外,術(shù)語“音頻流”可指表示聲音流的一或多個部分的一或多個電信號的序列,其可包含多首音樂、環(huán)境聲音、語音、噪聲等。
[0025]電子裝置120可為配備有聲音捕獲和處理能力和通信能力的任何電子裝置,例如蜂窩式電話、智能電話、可穿戴計算機(jī)、智能表、智能眼鏡、個人計算機(jī)、膝上型計算機(jī)、平板計算機(jī)、智能電視機(jī)、游戲裝置、多媒體播放器等。在所說明的實施例中,將電子裝置120示出為智能電話,其可從揚(yáng)聲器150接收輸入聲音流,包含對應(yīng)于一首音樂的聲音,并將所述輸入聲音流轉(zhuǎn)換為音頻流。隨著輸入聲音流被接收到并轉(zhuǎn)換成音頻流,電子裝置120可檢測聲音和音樂,并識別所述音頻流中的一首音樂。在一個實施例中,可基于預(yù)定閾值聲音強(qiáng)度來在音頻流中檢測聲音。在檢測到聲音后,電子裝置120可開始檢測音頻流中的音樂。
[0026]—旦在音頻流中檢測到音樂,電子裝置120就可獲得一首音樂的識別信息,其與所述檢測到的音樂相關(guān)聯(lián)??蓮耐獠垦b置(未圖示)接收或從電子裝置120的內(nèi)部數(shù)據(jù)庫(未圖示)檢索所述首音樂的識別信息。在獲得識別信息后,電子裝置120可即刻在顯示屏幕130上顯示所述識別信息。如本文所使用,術(shù)語“識別信息”可指可識別或描述一首音樂的任何信息,且可包含標(biāo)題、藝術(shù)家、持續(xù)時間、到音樂視頻的鏈接、評分、音樂封套、評論、下載狀態(tài)等中的至少一者。在一個實施例中,電子裝置120的用戶110可檢視揚(yáng)聲器150當(dāng)前正播放的所述首音樂的識別信息。
[0027]在所說明的實施例中,電子裝置120可在顯示屏幕130上顯示所述首音樂已被識別的通知132,以及包含所識別的所述首音樂的標(biāo)題和藝術(shù)家名字的識別信息134。另外,電子裝置120可顯不所述首首樂的下載圖標(biāo)136、檢視Μ/V(首樂視頻)圖標(biāo)138和共孚圖標(biāo)140。用戶110可選擇圖標(biāo)136、138和140(例如在所述圖標(biāo)上觸摸)以分別下載所述首音樂,檢視所述首音樂的音樂視頻,以及與他人共享所述首音樂。舉例來說,當(dāng)選定圖標(biāo)136時,可將所識別的所述首音樂的音頻文件或數(shù)據(jù)下載到電子裝置120。在一些其它實例中,用戶110可檢視與所述首音樂相關(guān)聯(lián)的音樂視頻,其可通過選擇圖標(biāo)138從外部服務(wù)器流式傳輸,或可通過選擇圖標(biāo)140經(jīng)由電子郵件、社交網(wǎng)絡(luò)應(yīng)用、云存儲服務(wù)器等與朋友共享所述首音樂。
[0028]雖然所說明的實施例示出在顯示屏幕130上顯示已識別所述首音樂的通知132,但本發(fā)明不限于此。在一些實施例中,電子裝置120可將與所識別的所述首音樂相關(guān)聯(lián)的識別信息134存儲在音樂歷史數(shù)據(jù)庫(其可在電子裝置120的存儲單元(未圖示)中提供)中,以保持所述首音樂的記錄。另外,電子裝置120可包含音樂歷史管理應(yīng)用,以顯示存儲在音樂歷史數(shù)據(jù)庫中的多首音樂列表,以及基于所述音樂歷史數(shù)據(jù)庫的建議。在此情況下,用戶110可激活音樂歷史管理應(yīng)用,以檢視若干首音樂和建議的列表。
[0029]除如上文所描述獲得所述首音樂的識別信息134之外,電子裝置120還可跟蹤所述音頻流中的所述首音樂以檢測所述首音樂的結(jié)束。換句話說,因為音頻流是從輸入聲音流產(chǎn)生,因此可監(jiān)視所述音頻流,以確定同一首音樂是否仍在播放。舉例來說,當(dāng)整首音樂的再現(xiàn)完成時,或當(dāng)所述首音樂變?yōu)榱硪皇滓魳范稣滓魳肺丛佻F(xiàn)時,可檢測所述首音樂的結(jié)束。
[0030]根據(jù)一些實施例,可產(chǎn)生或獲得所述首音樂的音樂模型,以用于檢測所述首音樂的結(jié)束。如本文所使用,術(shù)語“音樂模型”可與“聲音模型”互換使用,且可指表示一首音樂的聲音特性的模型,包含(但不限于)此類聲音特性的統(tǒng)計模型。在一個實施例中,可從所述音頻流的一部分提取至少一個聲音特征,且接著可基于所述至少一個聲音特征在電子裝置120中廣生所述首首樂的首樂_旲型。舉例來說,所述聲首特征可為首頻指紋、MFCC (梅爾頻率倒譜系數(shù))向量等,且所述音樂模型可為GMM(高斯混合模型)等。在另一個實施例中,電子裝置120可將至少一個聲音特征發(fā)射到外部裝置(未圖示),其可包含多個音樂模型,且從所述外部裝置接收所述多個音樂模型當(dāng)中確定為與所述至少一個聲音特征相關(guān)聯(lián)的音樂模型。電子裝置120還可從存儲在電子裝置120中的音樂模型數(shù)據(jù)庫(未圖示)檢索所述首音樂的音樂模型。另外或替代地,在本發(fā)明的一些實施例中,所提取的至少一個聲音特征(例如音頻指紋、MFCC向量等)本身可用作音樂模型。
[0031]為了檢測所述首音樂的結(jié)束,電子裝置120可對所述音頻流的至少一個部分進(jìn)行取樣,并基于所述音樂模型來確定所取樣的部分是否指示所述首音樂。通過確定所取樣的部分是否指示所述首音樂,可確定所取樣的部分是否為所述首音樂的一部分,以及所述首音樂是否已結(jié)束。音頻流的經(jīng)取樣部分可在音頻流的從中已提取所述至少一個聲音特征以用于產(chǎn)生或獲得音樂模型的所述部分之后。在此過程中,電子裝置120可連續(xù)地、周期性地或不定期地對音頻流的多個部分進(jìn)行取樣,且確定所述經(jīng)取樣的部分中的至少一者是否不是所述首音樂的一部分,或經(jīng)取樣的部分中的至少一者是否是所述首音樂的一部分。如本文所使用,短語“確定音頻流的一部分是否是一首音樂的一部分”可指確定音頻流的所述部分是否指示所述首音樂,且可包含肯定測試(即確定音頻流的一部分是否指示一首音樂)或否定測試(即確定音頻流的一部分是否不指示一首音樂)。并且,短語“確定音頻流的一部分是否不是一首音樂的一部分”可指確定所述音頻流的所述部分是否指示不同聲音,例如另一首音樂、語音、噪聲、靜默等。
[0032]在一些實施例中,揚(yáng)聲器150可連續(xù)地、周期性地、不定期地或間歇地輸出多首音樂的一序列。在此情況下,電子裝置120可連續(xù)地接收包含所述多首音樂的所述序列的輸入聲音流,并將所述輸入聲音流轉(zhuǎn)換為音頻流。當(dāng)通過以如上文所描述的方式監(jiān)視音頻流來檢測到若干首音樂中的一首的結(jié)束時,電子裝置120可繼續(xù)檢測另一首音樂的聲音和音樂。另外,電子裝置120可循序地獲得識別信息,以識別音頻流中的多首音樂。所述多首音樂的識別信息可存儲在音樂歷史數(shù)據(jù)庫中,以保持所識別的所述首音樂的記錄。
[0033]圖2說明根據(jù)本發(fā)明的一個實施例的多個電子裝置210、220和230,其經(jīng)配置以經(jīng)由通信網(wǎng)絡(luò)250與服務(wù)器240通信,以獲得與多首音樂相關(guān)聯(lián)的識別信息。通信網(wǎng)絡(luò)250可包含一或多個有線和/或無線通信網(wǎng)絡(luò),例如因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)、城域網(wǎng)等。另外,電子裝置210、220和230可通過使用各種通信技術(shù)(例如碼分多址(CDMA)、全球移動通信系統(tǒng)(GSM)、寬帶CDMA(W-CDMA)、長期演進(jìn)(LTE)、LTE-高級、LTE直接、W1-F1、W1-Fi直接、近場通信(NFC)、藍(lán)牙、以太網(wǎng)等)經(jīng)由通信網(wǎng)絡(luò)250與服務(wù)器240通信。
[0034]服務(wù)器240可存儲音樂數(shù)據(jù)庫242,其可包含多首音樂的識別信息。所述識別信息可包含標(biāo)題、藝術(shù)家、持續(xù)時間、到音樂視頻的鏈接、評分、音樂封套、評論、下載狀態(tài)等中的至少一者。在一些實施例中,音樂數(shù)據(jù)庫242可包含多個識別信息項目,其中的每一者可與多首首樂中的一者相關(guān)聯(lián)。
[0035]另外,音樂數(shù)據(jù)庫242還可包含多個音樂模型,其中的每一者可指示多首音樂中的一者。音樂模型可為聲音特性的統(tǒng)計模型,或可包含聲音特性或聲音特征(例如音頻指紋、MFCC向量等)。盡管圖2中說明三個電子裝置210到230,但任何其它合適數(shù)目的電子裝置(包含圖1中的電子裝置120)可經(jīng)由通信網(wǎng)絡(luò)250與服務(wù)器240通信。
[0036]在所說明的實施例中,電子裝置210到230可定位于不同位置處,且連續(xù)地、周期性地或不定期地接收包含對應(yīng)于不同首音樂的聲音的不同輸入聲音流。電子裝置210到230中的每一者可將接收到的輸入聲音流轉(zhuǎn)換為音頻流。當(dāng)接收到輸入聲音流并將其轉(zhuǎn)換成音頻流時,電子裝置210到230中的每一者可檢測音頻流中的聲音,并開始檢測音頻流中的音樂。
[0037]一旦在音頻串流中檢測到音樂,電子裝置210到230就可開始處理音頻流,以識別相應(yīng)音頻流中的若干首音樂。舉例來說,當(dāng)檢測到音樂時,電子裝置210可開始從音頻流提取至少一個聲音特征。在一些實施例中,可使用任何合適的特征提取方案(例如音頻指紋方法、MFCC方法等)提取至少一個聲音特征。在此情況下,電子裝置210可最初提取可用以識別音頻流中的一首音樂的至少一個聲音特征。接著可經(jīng)由通信網(wǎng)絡(luò)250將電子裝置210中所提取的至少一個聲音特征發(fā)射到服務(wù)器240。盡管參照電子裝置210來描述圖2的所說明實施例,但電子裝置220和230還可經(jīng)配置以便以與電子裝置210類似的方式執(zhí)行和操作。
[0038]在從電子裝置210接收到至少一個聲音特征后,服務(wù)器240可存取音樂數(shù)據(jù)庫242以獲得與所述至少一個聲音特征相關(guān)聯(lián)的識別信息。在一個實施例中,服務(wù)器240可將接收到的至少一個聲音特征與音樂數(shù)據(jù)庫242中的音樂模型進(jìn)行比較,且識別對應(yīng)于所述至少一個聲音特征的音樂模型。服務(wù)器240接著可識別與所識別的音樂模型相關(guān)聯(lián)的一首音樂,且從音樂數(shù)據(jù)庫242檢索所識別的所述首音樂的識別信息。可將為所述首音樂檢索到的識別信息發(fā)射到電子裝置210。
[0039]在接收到與所述首音樂相關(guān)聯(lián)的識別信息后,電子裝置210可獲得電子裝置210的位置以及接收到所述首音樂的時間,且用所述首音樂的所述識別信息、所述位置和時間來更新音樂歷史數(shù)據(jù)庫。一旦從服務(wù)器240接收到所述首音樂的所述識別信息,電子裝置210就無法再與服務(wù)器240通信,直到在所述音頻流中檢測到不同首音樂的音樂為止。
[0040]在一些實施例中,服務(wù)器240還可將與所識別的所述首音樂相關(guān)聯(lián)的音樂模型發(fā)射到電子裝置210。在接收到音樂模型后,電子裝置210可即刻開始在音頻流中跟蹤所述首音樂,以檢測所述首音樂的結(jié)束。當(dāng)從輸入聲音流產(chǎn)生音頻流時,電子裝置210可監(jiān)視所述音頻流,以檢測音頻流中的所述首音樂的結(jié)束。根據(jù)一個實施例,電子裝置120可對音頻流的一部分進(jìn)行取樣,且基于音樂模型來確定所取樣的部分是否指示所述首音樂(即所取樣的部分是否是所述首音樂的一部分)。
[0041]通過接收和存儲多首音樂的識別信息以更新音樂歷史數(shù)據(jù)庫,電子裝置210可提供與多首音樂有關(guān)的多種信息。在一個實施例中,電子裝置210可基于音樂歷史數(shù)據(jù)庫產(chǎn)生頻繁聽的若干首音樂的列表,并向用戶提供下載或購買一或多個首音樂的建議。另外或替代地,電子裝置210可在頻繁聽的若干首音樂的列表中選擇一首音樂,使得選定首音樂從外部服務(wù)器(例如服務(wù)器240或另一服務(wù)器)流式傳輸。另外,電子裝置210可提供在一或多個時間段或位置中聽到的若干首音樂的列表,以及與所述首音樂相關(guān)聯(lián)的時間或位置。
[0042]在另一個實施例中,來自服務(wù)器240的一首音樂的識別信息可包含指示所述首音樂可用于免費(fèi)下載或與特定類型的音樂視頻(例如搞笑音樂視頻、高評分音樂視頻等)相關(guān)聯(lián)的額外信息。在接收到所述首音樂的識別信息后,電子裝置210可即刻在電子裝置210的屏幕上輸出額外信息。所述額外信息可與可用于經(jīng)由通信網(wǎng)絡(luò)250下載所述首音樂的音頻文件或檢視相關(guān)聯(lián)的首樂視頻的一或多個圖標(biāo)一起顯不。
[0043]電子裝置210到230可經(jīng)配置以通過通信網(wǎng)絡(luò)250或?qū)Φ韧ㄐ欧桨副舜送ㄐ?。舉例來說,電子裝置210和220可彼此通信,以共享相應(yīng)的音樂歷史數(shù)據(jù)庫或此類數(shù)據(jù)庫的子集。從電子裝置220的音樂歷史數(shù)據(jù)庫,電子裝置210可確定與電子裝置220的用戶所聽的若干首音樂有關(guān)的信息,例如電子裝置220的頻繁聽的若干首音樂的列表以及最愛音樂列表。在另一個實施例中,電子裝置210可通過通信網(wǎng)絡(luò)250將音樂歷史數(shù)據(jù)庫或所述數(shù)據(jù)庫的子集上載到社交網(wǎng)絡(luò)服務(wù)(SNS)服務(wù)器(未圖示)上,以與例如電子裝置220和230等其它電子裝置共享所述數(shù)據(jù)庫。
[0044]圖3說明根據(jù)本發(fā)明的一個實施例的經(jīng)配置以識別音頻流中的一首音樂以用于更新存儲單元中的音樂歷史數(shù)據(jù)庫的電子裝置300的框圖。電子裝置300可包含聲音傳感器310、1/0(輸入/輸出)單元320、通信單元330、處理器340、存儲單元360、位置傳感器370和時鐘模塊380。電子裝置300可為配備有聲音捕獲和處理能力以及通信能力的任何合適裝置,例如蜂窩式電話、智能電話、可穿戴計算機(jī)、智能表、智能眼鏡、膝上型計算機(jī)、平板個人計算機(jī)、游戲裝置、多媒體播放器等。另外,如上文參照圖1和2所描述的電子裝置120、210、220和230還可配置有如圖3中所示的電子裝置300的組件。
[0045]處理器340可為經(jīng)配置以管理和操作電子裝置300的任何類型的處理單元,包含(但不限于)AP(應(yīng)用程序處理器CPU(中央處理單元)或使用一或多個處理核心的MPU(微處理器單元)。處理器340可包含:DSP(數(shù)字信號處理器)350,其經(jīng)配置以處理音頻流;音樂識別單元342,其經(jīng)配置以從音頻流識別一首音樂;以及音樂管理單元344,其經(jīng)配置以管理所述首音樂的記錄。在此配置中,DSP 350可包含聲音處理單元352和緩沖存儲器354。在一實施例中,DSP 350可為用于降低處理音頻流的電力消耗的低電力處理器。盡管將DSP 350說明為包含于處理器340中,但在一些實施例中,DSP 350可與電子裝置300中的處理器340分開布置。另外或替代地,音樂識別單元342和音樂管理單元344可為DSP 350內(nèi)提供的軟件單
J L ο
[0046]存儲單元360可包含可由處理器340存取的音樂模型數(shù)據(jù)庫362和音樂歷史數(shù)據(jù)庫364。音樂模型數(shù)據(jù)庫362可包含用于監(jiān)視音頻流且跟蹤音頻流中的一首音樂的一或多個音樂模型。舉例來說,音樂模型數(shù)據(jù)庫362可包含預(yù)定基礎(chǔ)音樂模型,其用于產(chǎn)生所述首音樂的音樂模型,如下文將參看圖4更詳細(xì)地描述。如本文所使用,術(shù)語“基礎(chǔ)音樂模型”可指指示一般來說可指示音樂的一般和/或常見聲音特性(例如音調(diào)、節(jié)奏、力度等)的音樂模型。另外,可基于從指定首音樂提取的至少一個聲音特征來將所述基礎(chǔ)音樂模型修改為用于指定的一首音樂的音樂模型。
[0047]存儲單元360中的音樂歷史數(shù)據(jù)庫364可包含已由電子裝置300或由服務(wù)器識別的一或多首音樂的記錄。舉例來說,所識別的所述首音樂的記錄可包含與所述首音樂相關(guān)聯(lián)的識別信息,關(guān)于接收到所述首音樂的位置和時間的信息,以及類似信息。可通過位置傳感器370和時鐘模塊380來獲得關(guān)于位置和時間的信息,如下文將更詳細(xì)地描述。另外,音樂歷史數(shù)據(jù)庫364可包含用戶的最愛音樂列表、另一用戶的最愛音樂列表等。存儲單元260可為遠(yuǎn)程或本地存儲裝置,且可使用任何合適的存儲或存儲器裝置來實施,例如RAM(隨機(jī)存取存儲器)、R0M(只讀存儲器)、EEPR0M(電可擦除可編程只讀存儲器)、快閃存儲器或SSD(固態(tài)驅(qū)動器)。
[0048]聲音傳感器310可經(jīng)配置以連續(xù)地接收包含所述多首音樂的所述序列的輸入聲音流,并將所述輸入聲音流轉(zhuǎn)換為音頻流。聲音傳感器310可將音頻流提供到DSP 350中的聲音處理單元352。聲音傳感器310可包含可用于接收、捕獲、感測、轉(zhuǎn)換和/或檢測輸入聲音流的一或多個麥克風(fēng)或任何其它類型的聲音傳感器。另外,聲音傳感器310可使用任何合適的軟件和/或硬件來執(zhí)行此類功能。
[0049]為了降低電力消耗,聲音傳感器310可經(jīng)配置以根據(jù)工作循環(huán)周期性地接收輸入聲音流,并將其轉(zhuǎn)換為音頻流。舉例來說,聲音傳感器310可以10%工作循環(huán)操作,使得在所述時間的10 % (例如,200ms周期中的20ms)接收到輸入聲音流,且可將輸入聲音流的接收到的部分轉(zhuǎn)換成所述音頻流的一部分。在此情況下,聲音傳感器310可從所述音頻流的所述部分檢測聲音。舉例來說,可確定音頻流的所述部分的聲音強(qiáng)度,并將其與預(yù)定閾值聲音強(qiáng)度進(jìn)行比較。如果音頻流的所述部分的聲音強(qiáng)度超過閾值聲音強(qiáng)度,那么聲音傳感器310可去活工作循環(huán)功能,以繼續(xù)接收輸入聲音流的其余部分,并將其轉(zhuǎn)換為音頻流的其余部分。另夕卜,聲音傳感器310可激活DSP 350,并向DSP 350提供音頻流的其余部分。
[0050]當(dāng)DSP 350由聲音傳感器310激活時,聲音處理單元352可經(jīng)配置以從聲音傳感器310接收音頻流的所述部分,并確定音頻流的接收到的部分是否包含音樂(或音頻流的接收到的部分是否指示音樂)。在一個實施例中,聲音處理單元352可從音頻流的接收到的部分提取至少一個聲音特征,并確定所述至少一個所提取的聲音特征是否指示所關(guān)注的聲音,例如音樂。可使用任何合適的特征提取方案(例如音頻指紋方法、MFCC方法等)來提取聲音特征。
[0051 ]響應(yīng)于從音頻流檢測到音樂,DSP 350可激活處理器340,這又可允許音樂識別單元342識別與所述檢測到的音樂相關(guān)聯(lián)的一首音樂??蓮囊纛l流的一部分提取至少一個聲音特征,且可基于所述至少一個聲音特征來識別所述首音樂。根據(jù)一些實施例,聲音處理單元352可向音樂識別單元342提供已提取來用于檢測音樂的至少一個聲音特征,且音樂識別單元342接著可基于從聲音處理單元352提供的至少一個聲音特征來識別所述首音樂。
[0052]在一個實施例中,音樂識別單元342可通過經(jīng)由通信單元330通過通信網(wǎng)絡(luò)390將至少一個聲音特征發(fā)射到外部裝置(例如圖2中的服務(wù)器240)來識別與檢測到的音樂相關(guān)聯(lián)的一首音樂。所述外部裝置可包含具有多首音樂的識別信息的音樂數(shù)據(jù)庫。在從電子裝置300接收到至少一個聲音特征后,外部裝置可搜索音樂數(shù)據(jù)庫以尋找與接收到的聲音特征相關(guān)聯(lián)的識別信息,并將所述識別信息發(fā)射到電子裝置300。在另一個實施例中,電子裝置300中的存儲單元360可包含音樂數(shù)據(jù)庫(未圖示),其具有多首音樂的識別信息。在此情況下,音樂識別單元342可搜索存儲單元360中的音樂數(shù)據(jù)庫,以尋找與所述聲音特征相關(guān)聯(lián)的所述識別信息。
[0053]I/O單元320可經(jīng)配置以接收來自電子裝置300的用戶的輸入,和/或為所述用戶輸出信息。I/O單元320可為能夠接收輸入命令和/或輸出信息的任何合適的裝置,例如觸摸屏、觸摸墊、觸摸傳感器、按鈕、鍵、觸感傳感照明傳感運(yùn)動傳感麥克LCD顯示器、揚(yáng)聲器等。當(dāng)獲得所述識別信息時,音樂識別單元342可將所述識別信息或與所述識別信息有關(guān)的任何信息提供到I/O單元320。另外,例如,I/O單元320還可顯示用于下載和共享所述首音樂的圖標(biāo),如圖1中所示。在此情況下,可接收在所顯示圖標(biāo)當(dāng)中選擇一圖標(biāo)的輸入,且可響應(yīng)于所述輸入而執(zhí)行與選定圖標(biāo)有關(guān)的功能。
[0054]位置傳感器370可經(jīng)配置以獲得電子裝置300的位置信息,用于更新所識別的一首音樂的音樂歷史數(shù)據(jù)庫364。舉例來說,位置傳感器370可通過確定當(dāng)接收到或識別所述首音樂時(或當(dāng)獲得所述首音樂的識別信息時)移動裝置所處的位置來獲得位置信息。在確定電子裝置300的位置信息時,位置傳感器370可接收和使用GPS位置信息,如果此信息可用(例如在戶外設(shè)定中)。如果GPS信息不可用(例如在室內(nèi)設(shè)定中),那么位置傳感器370可從W1-Fi接入點或小區(qū)塔基站接收信號,并基于接收到的信號中的每一者的強(qiáng)度和/或使用任何合適的三角測量方法來確定電子裝置300的位置。
[0055]時鐘模塊380可經(jīng)配置以監(jiān)視接收到或識別所述首音樂的時間。舉例來說,時鐘模塊380可記錄獲得所述首音樂的所述識別信息的時間。根據(jù)一些實施例,識別所述首音樂的處理器340可包含時鐘模塊380。
[0056]在一些實施例中,一旦音樂識別單元342獲得一首音樂的識別信息,就可將所述識別信息提供到音樂管理單元344。為了保持所述首音樂的記錄,音樂管理單元344可將所述識別信息提供到音樂歷史數(shù)據(jù)庫364,使得所述識別信息可存儲在音樂歷史數(shù)據(jù)庫364中。另外,音樂管理單元344可分別從位置傳感器370和時鐘模塊380接收與所述首音樂相關(guān)聯(lián)的位置信息和時間信息,且可將所述位置信息和時間信息連同所述首音樂的所述識別信息存儲在音樂歷史數(shù)據(jù)庫364中。在一些實施例中,所述識別信息、所述位置信息和/或所述時間信息可分別從音樂識別單元342、位置傳感器370和/或時鐘模塊380直接提供到音樂歷史數(shù)據(jù)庫364,而不經(jīng)由音樂管理單元344。如下文將參看圖10更詳細(xì)地描述,音樂管理單元344還可經(jīng)配置以為電子裝置300的用戶產(chǎn)生建議和通知。
[0057]除如上文所描述識別所述首音樂和更新音樂歷史數(shù)據(jù)庫364之外,當(dāng)聲音傳感器310檢測到音樂并激活DSP 350時,DSP 350中的聲音處理單元352可產(chǎn)生或獲得與所述檢測到的音樂相關(guān)聯(lián)的所述首音樂的音樂模型。根據(jù)一個實施例,聲音處理單元352可從音頻流的一部分提取至少一個聲音特征,并基于所述至少一個聲音特征產(chǎn)生所述首音樂的音樂模型。在此情況下,所述音頻流的一部分可存儲在緩沖存儲器354中,且可從緩沖存儲器354中的所存儲的部分提取至少一個聲音特征。在一些實施例中,聲音處理單元352可從存儲單元360中的音樂模型數(shù)據(jù)庫362獲得基礎(chǔ)音樂模型,并基于至少一個聲音特征來修改所述基礎(chǔ)音樂模型以產(chǎn)生所述音樂模型。根據(jù)另一個實施例,聲音處理單元352可經(jīng)由通信單元330將至少一個聲音特征發(fā)射到外部裝置(例如,圖2中的服務(wù)器240),且以如上文參看圖2所描述的方式來接收與至少一個聲音特征相關(guān)聯(lián)的音樂模型。為所述首音樂產(chǎn)生或獲得的音樂模型可存儲在音樂模型數(shù)據(jù)庫362中。
[0058]一旦為所述首音樂產(chǎn)生或獲得音樂模型,聲音處理單元352就可對音頻流的至少一個部分進(jìn)行樣本(或接收),并基于所述音樂模型來確定所取樣的部分是否指示所述首音樂(即,所取樣的部分是所述首音樂的一部分)。舉例來說,如果當(dāng)聲音處理單元352對音頻流的一部分進(jìn)行取樣時,同一首音樂仍在播放,那么可確定所取樣的部分指示所述首音樂。在此情況下,聲音處理單元352可確定所述首音樂尚未結(jié)束。另一方面,如果當(dāng)聲音處理單元352對音頻流的一部分進(jìn)行取樣時,所述首音樂已結(jié)束,那么可確定所取樣的部分不指示所述首音樂。在此情況下,聲音處理單元352可確定所述首音樂已結(jié)束。在一些實施例中,聲音處理單元352可連續(xù)地、周期性地、不定期地或間或?qū)σ纛l流的多個部分進(jìn)行取樣。在此情況下,當(dāng)確定所取樣的部分(例如上一次取樣的部分)中的至少一者不指示所述首音樂時,可檢測到所述首音樂的結(jié)束。
[0059]在確定所述首音樂已結(jié)束后,聲音傳感器310可即刻開始根據(jù)工作循環(huán)周期性地接收輸入聲音流,將接收到的輸入聲音流轉(zhuǎn)換為音頻流,并檢測音頻流中的聲音。在檢測到音頻流中的聲音后,處理器340可繼續(xù)檢測音頻流中的新的一首音樂的音樂,并識別所述新的一首音樂。另外,可產(chǎn)生或獲得所述新的一首音樂的新音樂模型,且基于所述新音樂模型來跟蹤所述新的一首音樂,以便以如上文所描述的方式檢測所述新的一首音樂的結(jié)束。
[0060]圖4說明根據(jù)本發(fā)明的一個實施例的經(jīng)配置以產(chǎn)生或獲得一首音樂的音樂模型并基于所述音樂模型來跟蹤所述首音樂的聲音處理單元352的較詳細(xì)框圖。聲音處理單元352可包含音樂檢測模塊410、音樂模型管理模塊420和音樂跟蹤模塊430。如圖4中所示,聲音處理單元352可存取DSP 350中的緩沖存儲器354,以及存儲單元360中的音樂模型數(shù)據(jù)庫362。當(dāng)聲音傳感器310檢測音頻流中的聲音時,如上文參看圖3所描述,聲音傳感器310可激活DSP 350中的聲音處理單元352的音樂檢測模塊410。
[0061]當(dāng)被激活時,音樂檢測模塊410可從聲音傳感器310接收所述音頻流的至少一部分。音樂檢測模塊410可經(jīng)配置以通過使用任何合適的聲音分類方法(例如基于GMM的分類器、神經(jīng)網(wǎng)絡(luò)、基于HMM(隱式馬爾可夫模型)的分類器、圖解模型或SVM(支持向量機(jī)))來檢測音頻流的接收到的部分中的音樂。如果確定音頻流的接收到的部分不指示音樂,那么音樂檢測模塊410可指令聲音傳感器310開始根據(jù)工作循環(huán)周期性地接收輸入聲音流,將接收到的輸入聲音流轉(zhuǎn)換為音頻流,且以如上文參看圖3所描述的方式來檢測音頻流中的聲音。在此情況下,可去活DSP 350以便降低電力消耗。另一方面,如果確定音頻流的接收到的部分指示音樂,那么音樂檢測模塊410可激活音樂模型管理模塊420。
[0062]當(dāng)被激活時,音樂模型管理模塊420可從聲音傳感器310接收所述音頻流的至少一部分。舉例來說,音頻流的接收到的部分可為音頻流的其中檢測到音樂的部分,或在音頻流的其中檢測到音樂的部分之后的部分?;谝纛l流的接收到的部分,音樂模型管理模塊420可產(chǎn)生一首音樂的音樂模型,其與音樂檢測模塊410檢測到的音樂相關(guān)聯(lián)。在一個實施例中,音樂模型管理模塊420可從音頻流的接收到的部分提取至少一個聲音特征(例如音頻指紋、MFCC向量等),且可基于所述至少一個聲音特征產(chǎn)生所述首音樂的音樂模型。緩沖存儲器354可存儲音頻流的一部分,且音樂模型管理模塊420可存取緩沖存儲器354中的所存儲的部分,以提取至少一個聲音特征,用于產(chǎn)生所述首音樂的音樂模型。
[0063]根據(jù)一些實施例,存儲單元360中的音樂模型數(shù)據(jù)庫362可包含預(yù)定基礎(chǔ)音樂模型。在此情況下,音樂模型管理模塊420可通過基于從音頻流的所述部分提取的至少一個聲音特征修改基礎(chǔ)音樂模型來產(chǎn)生所述首音樂的音樂模型。一旦產(chǎn)生所述首音樂的音樂模型,音樂模型管理模塊420就可激活音樂跟蹤模塊430,并將所述音樂模型提供到音樂跟蹤模塊430。在一個實施例中,音樂模型管理模塊420可將所述首音樂的音樂模型存儲在音樂模型數(shù)據(jù)庫362中,使得音樂跟蹤模塊430可存取音樂模型數(shù)據(jù)庫362,以獲得所述首音樂的音樂模型?;蛘呋蛄硗猓魳纺P凸芾砟K420可以如上文參看圖2所描述的方式,從外部裝置(例如圖2中的服務(wù)器240)獲得所述首音樂的音樂模型,并將所述音樂模型提供到音樂跟蹤模塊430。
[0064]當(dāng)被激活時,音樂跟蹤模塊430可接收音頻流的后續(xù)部分,并基于所述首音樂的音樂模型來監(jiān)視接收到的部分。在一些實施例中,可將音頻流的后續(xù)部分存儲在緩沖存儲器354中,且音樂跟蹤模塊430可存取緩沖存儲器354中的音頻流的所存儲部分。通過對音頻流的至少一個部分進(jìn)行取樣(或接收),且基于音樂模型確定所取樣的部分是否指示所述首音樂(即所取樣的部分是否是所述首音樂的一部分),音樂跟蹤模塊430可跟蹤所述首音樂,并檢測所述首音樂的結(jié)束。
[0065]根據(jù)一些實施例,音樂跟蹤模塊430可基于所述首音樂的音樂模型以及從所取樣的部分提取的至少一個聲音特征來確定所述首音樂與所取樣的部分之間的類似性值(或得分)。在一個實施例中,可基于音樂模型與從所取樣的部分提取的至少一個聲音特征之間的類似性值來確定所述類似性值。下文將參看圖6更詳細(xì)地描述用于確定類似性值的方案。
[0066]—旦確定所取樣的部分的類似性值,就可將所述類似性值與可存儲在存儲單元360中的預(yù)定閾值進(jìn)行比較。如果所述類似性值超過閾值,那么確定所取樣的部分指示所述首音樂。在此情況下,音樂跟蹤模塊430可確定所取樣的部分是所述首音樂的一部分,且所述首音樂尚未結(jié)束。另一方面,如果類似性值不超過閾值,那么確定所取樣的部分不指示所述首音樂。在此情況下,音樂跟蹤模塊430可確定所取樣的部分不是所述首音樂的一部分,且所述首音樂已結(jié)束。在一個實施例中,音樂跟蹤模塊430可連續(xù)地、周期性地或不定期地對音頻流的多個部分進(jìn)行取樣,且確定所取樣的部分中的每一者是否是所述首音樂的一部分。
[0067]一旦確定所取樣的部分不是所述首音樂的一部分,音樂跟蹤模塊430就可指令聲音傳感器310開始根據(jù)工作循環(huán)周期性地接收輸入聲音流,將接收到的輸入聲音流轉(zhuǎn)換成音頻流,且檢測音頻流中的聲音。在此情況下,可去活DSP 350以便降低電力消耗。如果在音頻流中檢測到聲音,那么可以如上文所描述的方式來執(zhí)行檢測音頻流中的音樂、為新的一首音樂產(chǎn)生或獲得新的音樂模型,且基于所述新的音樂模型來跟蹤所述新的一首音樂的過程。
[0068]圖5說明根據(jù)本發(fā)明的一個實施例的用于跟蹤輸入聲音流510中的一首音樂516以確定所述首音樂516是否已結(jié)束的時序圖500。為了處理輸入聲音流510,電子裝置300的聲音傳感器310可接收輸入聲音流510,其包含靜默512、汽車噪聲514、所述首音樂516和語音518的序列。在一個實施例中,聲音傳感器310可經(jīng)配置以接收輸入聲音流510,并將其轉(zhuǎn)換成可由聲音處理單元352處理的音頻流。
[0069]在一些實施例中,聲音傳感器310可經(jīng)配置以根據(jù)預(yù)定工作循環(huán),在預(yù)定時間周期內(nèi)(例如介于1與30毫秒(ms)之間的任何合適時間周期,例如20ms,用于音頻分析,例如快速傅里葉變換),以預(yù)定間隔T1(例如介于一百毫秒與若干秒之間的任何合適時間周期,例如180ms)周期性地接收輸入聲音流510。舉例來說,在間隔1^的激活狀態(tài)期間,聲音傳感器310可接收輸入聲音流的一部分,并將接收到的部分轉(zhuǎn)換為音頻流的一部分(例如S1、S2、S3等)。對于音頻流部分中的每一者,例如S3等,聲音傳感器310可通過確定每一部分是否包含超過預(yù)定閾值聲音強(qiáng)度的聲音來檢測聲音。根據(jù)一些實施例,假定一首典型的音樂的長度可為約若干分鐘(例如約三或四分鐘),那么可將間隔T1S定成若干秒長。在此情況下,在間隔1^的非作用中狀態(tài)下持續(xù)若干秒的輸入聲音流510的缺失部分(即輸入聲音流510的未由聲音傳感器310接收的部分)可不顯著影響一首音樂中的聲音的檢測。本文提到的時間周期是僅出于示范性目的,且還可利用其它周期。
[0070]當(dāng)在音頻流部分ShS^S3等中檢測到聲音時,可去活工作循環(huán)功能,以允許聲音傳感器310繼續(xù)接收輸入聲音流510的一或多個后續(xù)部分,并將接收到的部分轉(zhuǎn)換成對應(yīng)的一或多個音頻流部分。在此情況下,可繼續(xù)接收輸入聲音流的一或多個后續(xù)部分,并將其轉(zhuǎn)換成對應(yīng)的一或多個音頻流部分,以用于通過音樂檢測模塊410來檢測與所述首音樂516相關(guān)聯(lián)的音樂,且如果檢測到音樂,那么跟蹤所述首音樂516以尋找所述首音樂516的結(jié)束。
[0071]如圖5中所示,聲音傳感器310可根據(jù)工作循環(huán)接收輸入聲音流510的多個部分,其包含靜默512、汽車噪聲514、所述首音樂516和語音518的序列。最初,在間隔!^的激活狀態(tài)期間接收輸入聲音流510中的靜默512的一部分,并通過聲音傳感器310將其轉(zhuǎn)換成音頻流部分S1。在此情況下,聲音傳感器310可不從音頻流部分51檢測聲音,且在間隔T1的非作用中狀態(tài)期間去活。在間隔!^結(jié)束時,可激活聲音傳感器310,以接收輸入聲音流510中的靜默512的另一部分,并將接收到的部分轉(zhuǎn)換為音頻流部分S2。由于音頻流部分S2對應(yīng)于靜默512的一部分,因此聲音傳感器310可能未檢測到聲音。
[0072]在間隔T1的下一激活狀態(tài)期間,可激活聲音傳感器310,以接收輸入聲音流510中的汽車噪聲514的另一部分,并將接收到的部分轉(zhuǎn)換為音頻流部分S3。在此情況下,聲音傳感器310可確定音頻流部分S3超過預(yù)定閾值聲音強(qiáng)度,且因此在音頻流部分S3中檢測到聲音。在音頻流部分S3中檢測到聲音后,聲音傳感器310可去活工作循環(huán)功能,以接收輸入聲音流510的之后部分,并將接收到的部分轉(zhuǎn)換為表示為M1的音頻流部分。另外,聲音傳感器310可激活DSP 350的聲音處理單元352中的音樂檢測模塊410,并將音頻流部分施提供到音樂檢測模塊410。
[0073]當(dāng)被激活時,音樂檢測模塊410可經(jīng)配置以在預(yù)定時間周期(例如10秒)內(nèi)接收音頻流的一部分,如由施或跑表示。在所說明的實施例中,當(dāng)聲音傳感器310在音頻流部分S3中檢測到聲音時,音樂檢測模塊410可接收對應(yīng)于汽車噪聲514的一部分的音頻流部分見,且可確定音頻流部分M1并不包含音樂。在此情況下,音樂檢測模塊410可去活聲音傳感器310,以在預(yù)定時間周期T2R中斷接收輸入聲音流510。在一個實施例中,當(dāng)未檢測到音樂時,可去活音樂檢測模塊410,以降低電力消耗。假定一首音樂通??蔀槿舾煞昼婇L,那么時間周期T2,其可長于間隔T1,可為例如介于10與30秒之間的任何合適的時間周期,因為聲音傳感器310和音樂檢測模塊410在此時間周期內(nèi)的去活可能不顯著影響一首音樂中的聲音和音樂的檢測。
[0074]當(dāng)預(yù)定時間周期!^已逝去時,可根據(jù)工作循環(huán)來激活聲音傳感器310,以接收輸入聲音流510中的所述首音樂516的一部分,并將所述首音樂516的接收到的部分轉(zhuǎn)換為音頻流部分S4。聲音傳感器310可通過確定音頻流部分S4包含超過預(yù)定閾值聲音強(qiáng)度的聲音來檢測音頻流部分S 4中對應(yīng)于所述首音樂516的一部分的聲音。在音頻流部分S 4中檢測到聲音后,聲音傳感器310可去活工作循環(huán)功能,以接收輸入聲音流510的之后部分,并將接收到的部分轉(zhuǎn)換為表示為M2的音頻流部分。另外,聲音傳感器310可激活音樂檢測模塊410,并將音頻流部分跑提供到音樂檢測模塊410。在一些實施例中,聲音傳感器310可持續(xù)接收輸入聲音流510的一或多個后續(xù)部分,并將所述部分轉(zhuǎn)換成音頻流部分(例如GhNhN^N3等),直到確定音頻流部分跑并不包含音樂或?qū)?yīng)于輸入聲音流510的后續(xù)部分中的一者的音頻流部分不是所述首音樂516的一部分為止。
[0075]在被激活后,音樂檢測模塊410可從聲音傳感器310接收對應(yīng)于所述首音樂516的一部分的音頻流部分M2,且可檢測音頻流部分跑中的音樂。響應(yīng)于在音頻流部分跑中檢測到音樂,可激活音樂模型管理模塊420以在預(yù)定時間周期(例如10秒)內(nèi)接收在所述首音樂516的音頻流部分M2之后的音頻流部分G1?;谝纛l流部分GjP/或任何其它部分,音樂模型管理模塊420可產(chǎn)生或獲得所述首音樂516的音樂模型,如上文參看圖4所描述。在一個實施例中,音樂模型管理模塊420可從音頻流部分6工提取至少一個聲音特征,且基于所述至少一個聲音特征產(chǎn)生所述首音樂516的音樂模型。在另一個實施例中,可以如上文參看圖2所描述的方式,從外部裝置接收與從音頻流部分G1所提取的聲音特征相關(guān)聯(lián)的所述首音樂的音樂模型。
[0076]當(dāng)在基于音頻流部分G1產(chǎn)生或獲得音樂模型之后逝去了預(yù)定時間周期T3時,可激活音樂跟蹤模塊430,以通過以預(yù)定間隔T4(例如介于2與30秒之間的任何合適時間周期)周期性地對一或多個后續(xù)音頻流部分(例如犯、犯和犯)進(jìn)行取樣來跟蹤所述首音樂516。在一些實施例中,在時間周期T3的結(jié)束之后,音樂跟蹤模塊430可經(jīng)配置以在預(yù)定時間周期(例如10秒)內(nèi)從聲音傳感器310接收音頻流部分(例如N^N2SN3)。盡管上文將音樂模型描述為是基于從圖5中的音頻流部分61提取的聲音特征而產(chǎn)生或獲得,但可基于從已經(jīng)用于檢測音樂的音頻流部分M2提取的聲音特征來產(chǎn)生或獲得音樂模型。在此情況下,預(yù)定時間周期T3可在對應(yīng)于音頻流部分跑的時間周期結(jié)束時開始。
[0077]當(dāng)在用于跟蹤的間隔T4的開頭接收到音頻流部分時,音樂跟蹤模塊430可基于與所述首音樂516相關(guān)聯(lián)的音樂模型來確定所述音頻流部分是否指示所述首音樂516(即所述音頻流部分是所述首音樂516的一部分)。如果確定音頻流部分不是所述首音樂516的一部分,那么音樂跟蹤模塊430可確定所述首音樂516已結(jié)束。在此情況下,音樂跟蹤模塊430(或DSP 350,或處理器340)可產(chǎn)生一或多個中斷信號,用于檢測音頻流中的聲音和音樂,識別下一首音樂和/或跟蹤下一首音樂。舉例來說,音樂跟蹤模塊430可產(chǎn)生中斷信號,且將中斷信號提供到聲音傳感器310,用于根據(jù)工作循環(huán)來接收輸入聲音流510,且在從輸入聲音流產(chǎn)生的音頻流中檢測聲音。另一方面,如果確定音頻流部分是所述首音樂516的指示所述首音樂516尚未結(jié)束的部分,那么音樂跟蹤模塊430可在間隔T4結(jié)束時接收下一音頻流。在此情況下,音樂跟蹤模塊430(或DSP 350,或處理器340)可不產(chǎn)生用于識別一首音樂的中斷信號。
[0078]在所說明的實施例中,音樂跟蹤模塊430可接收對應(yīng)于所述首音樂516的一部分的音頻流部分N1,且基于所述音樂模型來確定音頻流部分N1是所述首音樂516的一部分。在間隔T4結(jié)束時,對應(yīng)于所述首音樂516的后續(xù)部分的音頻流部分N2可由音樂跟蹤模塊430接收,其可通過使用音樂模型來確定音頻流部分N2是所述首音樂516的一部分。在下一間隔T4的開始,音樂跟蹤模塊430可接收音頻流部分N3,其對應(yīng)于輸入聲音流510中的語音518的一部分。由于音頻流部分N3對應(yīng)于語音518的所述部分,因此音樂跟蹤模塊430或替代地音樂檢測模塊410可基于音樂模型來確定音頻流部分N3不是所述首音樂516的一部分,指示所述首音樂516已結(jié)束。如上文所描述,使用音頻流部分(S卩NlN^N3等)來跟蹤所述首音樂516以確定所述首音樂516是否已結(jié)束。因此,即使在所述首音樂516結(jié)束之后接收到第一音頻流部分(SPN1),也可能不會對確定所接收的音頻串流部分不是所述首音樂516的一部分從而指示所述首音樂516已結(jié)束具有相當(dāng)大的影響。因此,時間周期T3可為長于時間周期T2的任何合適時間周期,例如介于5秒與5分鐘之間。
[0079]一旦確定音頻流部分N3不是所述首音樂516的一部分(S卩,所述首音樂516已結(jié)束或不再可由聲音傳感器310檢測),音樂跟蹤模塊430就可激活聲音傳感器310,以開始根據(jù)工作循環(huán)周期性地接收輸入聲音流510的一或多個部分。在圖5中所示的實施例中,聲音傳感器310可接收輸入聲音流510中的語音518的一部分,并將接收到的部分轉(zhuǎn)換為音頻流部分Ss ο在此情況下,聲音傳感器310可確定音頻流部分Ss包含超過預(yù)定閾值聲音強(qiáng)度的聲音。在檢測到聲首后,可激活首樂檢測t旲塊410以接收后續(xù)首頻流部分,并確定所述首頻流部分并不包含音樂。輸入聲音流510或其它輸入聲音流的后續(xù)部分的處理可由聲音傳感器310、音樂檢測模塊410、音樂模型管理模塊420和/或音樂跟蹤模塊430以如上文所描述的類似方式執(zhí)行。盡管借助于實例以時間周期或間隔(例如T4等)的特定時間參數(shù)和/或范圍來描述以上實施例,但所述時間周期可不限于此類時間參數(shù)和范圍,而是可設(shè)定成任何其它合適的時間參數(shù)和/或范圍。另外,可根據(jù)各種實施方案(例如電子裝置300的電池功率、電子裝置300的計算資源和電力、所述首音樂516的預(yù)期長度等)視需要調(diào)整所述時間周期。
[0080]圖6說明根據(jù)本發(fā)明的一個實施例的用于對音頻流610中的一首音樂的音頻流部分630進(jìn)行取樣且確定音頻流610中的后續(xù)部分640是否是所述首音樂的一部分的時序圖600。最初,可在音頻流610的部分620中檢測在音頻流部分630之前或緊接在其之前的音樂。在檢測到所述音樂后,音樂模型管理模塊420可從音頻流部分630提取至少一個聲音特征650,且產(chǎn)生或獲得與所述部分620相關(guān)聯(lián)的所述首音樂的音樂模型。
[0081]接著可將所述首音樂的音樂模型提供到音樂跟蹤模塊430以用于跟蹤所述首音樂。音樂跟蹤模塊430可對音頻流610中的后續(xù)部分640進(jìn)行取樣,并從所取樣的音頻流部分640提取至少一個聲音特征660?;谒鲆魳纺P吐曇籼卣?60,可確定所取樣的音頻流部分640是否是所述首音樂的一部分。根據(jù)一些實施例,音樂跟蹤模塊430可確定所取樣的音頻流部分640與所述首音樂的音樂模型之間的相似性。舉例來說,可計算指示所取樣的音頻流部分640與音樂模型之間的相似程度的類似性值(例如得分、置信度值等)。如果類似性值超過預(yù)定閾值,那么可確定所取樣的音頻流部分640是所述首音樂的一部分,指示所述首音樂尚未結(jié)束。另一方面,如果類似性值并不超過閾值,那么可確定所取樣的音頻流部分640不是所述首音樂的一部分,指示所述首音樂已結(jié)束。
[0082]在一個實施例中,可基于概率值(例如似然值)來確定音頻流部分640與所述首音樂的音樂模型之間的類似性值。舉例來說,可確定指示從音頻流部分640提取的至少一個聲音特征660指示音樂模型的可能性的第一概率值。另外,可確定指示至少一個聲音特征660是指示基礎(chǔ)音樂模型的可能性的第二概率值。在確定第一和第二概率值后,可通過從第一概率值減去第二概率值來確定音頻流部分640與所述首音樂的音樂模型之間的類似性值,其可通過以下等式來表達(dá):
[0083]類似性值=L(Xsample I Xmusic )—L ( Xsample | ^base )
[0084]其中Xsample表示從音頻流部分640提取的至少一個聲音特征660,Amusi。表示與所述首音樂相關(guān)聯(lián)的音樂模型,Abase3表示基礎(chǔ)音樂模型,LUsample31 Amusi。)表示第一概率值(例如,在給定Vjsi。的情況下,Xsample的記錄可能性),且L(XsamPle | Xbase )表示第二概率值(例如,在給定Abase的情況下,Xsample的記錄可能性)。
[0085]在另一個實施例中,可使用貝葉斯(Bayesian)信息準(zhǔn)則來確定類似性值。如上文所描述,可基于從音頻流部分630提取的至少一個聲音特征650來產(chǎn)生或獲得所述首音樂的音樂模型。另外,可基于從所取樣的音頻流部分640提取的至少一個聲音特征660來產(chǎn)生或獲得另一音樂模型。舉例來說,可通過基于至少一個聲音特征660修改基礎(chǔ)音樂模型來產(chǎn)生音頻流部分640的音樂模型。根據(jù)此實施例,可為確指示至少一個聲音特征650是指示所述首音樂的音樂模型的可能性的第一概率值。另外,可確定指示至少一個聲音特征660是指示所取樣的音頻流部分640的其它音樂模型的可能性的第二概率值。此外,可確定指示聲音特征650和660是指示基礎(chǔ)音樂模型的可能性的第三概率值。在確定第一到第三概率值后,可通過將第三概率值從第一和第二概率值的總和減去來確定類似性值,其可通過以下等式來表達(dá):
[0086]類似性值=L( Xmusic I) +L ( Xsample |) —L ( Xmusic , Xsample | ^ase )
[0087]其中Xmusic表示從音頻流部分630提取的至少一個聲音特征650,xsample表示來自所取樣的音頻流部分640的至少一個聲音特征660 Amusl。表示與所述首音樂相關(guān)聯(lián)的音樂模型,Asample表示與音頻流部分640相關(guān)聯(lián)的音樂模型,Abase表示基礎(chǔ)音樂模型,L(xmusi。I Amusic)表示第一概率值(例如,在給定Xmusi。的情況下,Xmusi。的記錄可能性),L( Xsample | Xsample)表示第二概率值(例如,在給定^sample的情況下,Xsample的記錄可能性),且L ( Xmusic,Xsample | Abase )表示第三概率值(例如,在給定Xbase的情況下,Xmusi。和Xsample的記錄可能性)。
[0088]在以上實施例中,為了改進(jìn)計算資源和電力的效率,當(dāng)從所取樣的音頻流部分630提取每一聲音特征時,可通過修改基礎(chǔ)音樂模型來產(chǎn)生所取樣的音頻流部分640的音樂模型。替代地,可基于所有所提取的聲音特征來修改基礎(chǔ)音樂模型一次。并且,為了改進(jìn)確定第一或第三概率值的效率,當(dāng)已從音頻流部分630提取多個聲音特征時,可選擇和存儲所述多個聲音特征的子集,以用于確定第三概率值。舉例來說,可基于每一聲音特征是音樂的可能性來選擇聲音特征的子集。
[0089]在另一個實施例中,可使用交叉可能性比率方法來確定類似性值。根據(jù)此實施例,可確定指示從音頻流部分640提取的至少一個聲音特征660是指示所述首音樂的音樂模型的可能性的第一概率值。另外,可確定指示從音頻流部分630提取的聲音特征650是指示音頻流部分640的音樂模型的可能性的第二概率值。另外,還可確定指示至少一個聲音特征650是指示基礎(chǔ)音樂模型的可能性的第三概率值,以及指示至少一個聲音特征660是指示基礎(chǔ)音樂模型的可能性的第四概率值。在確定第一到第四概率值后,可通過將第三和第四概率值從第一和第二概率值的總和減去來確定類似性值,其可通過以下等式來表達(dá):
[0090]類似性值=L(Xsample I Xmusic )+L ( Xmusic I Xsample ) _L ( Xmusic | Mmse ) _L ( Xsample | Mmse )
[0091]其中Xsample表示從音頻流部分640提取的至少一個聲音特征660,xmusic表示從音頻流部分630提取的至少一個聲音特征650 Amusl。表示與所述首音樂相關(guān)聯(lián)的音樂模型,Asample表示與音頻流部分640相關(guān)聯(lián)的音樂模型,Abase表示基礎(chǔ)音樂模型,L(Xsample|Amusi。)表示第一概率值(例如,在給定Xmusi。的情況下,Xsample的記錄可能性),L(Xmusi。| Xsample )表示第二概率值(例如,在給定Xbase的情況下,Xmusi。的記錄可能性),且L(XsamPle | Xbase )表示第四概率值(例如,在給定Xbase的情況下,Xsample的記錄可能性)。為了計算資源和電力的效率,可在確定類似性值之前,事先確定第三概率值。
[0092]在又一實施例中,可基于音樂模型之間的距離值來確定類似性值。舉例來說,可將歐幾里得距離、漢明距離、庫爾貝克-萊伯爾(Kullback-Leibler,KL)發(fā)散等計算為音樂模型之間的距離值。在此實施例中,可確定音頻流部分640的音樂模型與所述首音樂的音樂模型之間的第一距離值。另外,可確定所述首音樂的音樂模型與基礎(chǔ)音樂模型之間的第二距離值,且可確定音頻流部分640的音樂模型與基礎(chǔ)音樂模型之間的第三距離值。在確定第一到第三距離值后,可通過將第二和第三距離值從第一距離值的成倍值減去來確定類似性值,其可通過以下等式來表達(dá):
[0093]類似性值=2.D(Asampie,Amusic )—D (A.music,Abase ) _D ( A^samp Ie,^ase )
[0094]其中Asample表示音頻流部分640的音樂模型,Amusic表示所述首音樂的音樂模型,Xbase表小基礎(chǔ) H-樂型,D ( Xsample,Xmusic )表TJ^AsampIe與Xmus 丨司的距肖值,D ( Xmusic,■^base )表TJi^inusic與XbaseZ^ I司的 ——.距肖值,冃.D (^saInple,Xbase )表^jSample與XbaseZ^間的二距離值。在上文所述的用于確定類似性值的實施例中,可進(jìn)行任何合適的修改,以便改進(jìn)計算資源和電力的效率。
[0095]圖7是根據(jù)本發(fā)明的一個實施例的在電子裝置中執(zhí)行的用于識別和跟蹤音頻流中的一首音樂的方法700的流程圖。電子裝置(例如,圖3中所示的電子裝置300)可接收輸入聲音流,其包含對應(yīng)于一首音樂的聲音,并將所述輸入聲音流轉(zhuǎn)換為音頻流。在710處,電子裝置可確定是否在音頻流中檢測到聲音。在一個實施例中,可基于閾值聲音強(qiáng)度在音頻流中檢測聲音。如果未檢測到聲音(即,710處的“否”),那么方法700可繼續(xù)進(jìn)行返回到710,以確定是否在正從正接收到的輸入聲音流產(chǎn)生的音頻流中檢測到聲音。
[0096]當(dāng)檢測到聲音(S卩,710處的“是”)時,電子裝置可在720處對音頻流的一部分進(jìn)行取樣,且在730處基于音頻流的所取樣的部分來提取聲音特征。在一些實施例中,可從音頻流的所取樣的部分提取多個聲音特征?;谒雎曇籼卣鳎娮友b置可在740處,通過使用任何合適的聲音分類方法來確定是否在音頻流的所取樣的部分中檢測到音樂。如果未檢測到音樂(即,740處的“否”),方法700可繼續(xù)進(jìn)行返回到710,以持續(xù)確定是否在正產(chǎn)生的音頻流中檢測到聲音。
[0097]另一方面,當(dāng)檢測到音樂(S卩,740處的“是”)時,方法700可繼續(xù)進(jìn)行到750,以識別一首音樂,其與檢測到的音樂相關(guān)聯(lián)。根據(jù)一些實施例,可通過獲得與所述首音樂相關(guān)聯(lián)的識別信息來識別所述首音樂。如果電子裝置未能識別所述首音樂(即,750處的“否”),那么方法700可繼續(xù)進(jìn)行返回到710,以確定是否在正產(chǎn)生的音頻流中檢測到聲音。
[0098]另一方面,如果識別到所述首音樂(S卩,750處的“是”),那么用所識別的所述首音樂來更新電子裝置中的音樂歷史數(shù)據(jù)庫。另外,方法700可繼續(xù)進(jìn)行到760,以跟蹤所識別的所述首音樂,并檢測所述首音樂的結(jié)束。根據(jù)一些實施例,電子裝置可對音頻流的一部分進(jìn)行取樣,并確定所取樣的部分是否是所述首音樂的一部分。在此過程中,可使用所述首音樂的音樂模型,其是在電子裝置中產(chǎn)生或從外部裝置獲得。如果未檢測到所述首音樂的結(jié)束(即,760處的“否”),那么方法700進(jìn)行到保持跟蹤所述首音樂,舉例來說通過對音頻流的下一部分進(jìn)行取樣。否則,如果檢測到所述首音樂的結(jié)束(即,760處的“是”),那么方法700可繼續(xù)進(jìn)行返回到710,以確定是否在正產(chǎn)生的音頻流中檢測到聲音。盡管上文將方法700描述為在獲得所述首音樂的識別信息之后跟蹤所述首音樂,但即使電子裝置未能獲得此類識別信息,方法700也可基于音頻流的一部分產(chǎn)生或獲得一首音樂的音樂模型,并基于所述音樂模型來跟蹤所述首音樂。
[0099]圖8說明根據(jù)本發(fā)明的一個實施例的用于基于從音頻流的一部分提取的至少一個聲音特征來識別一首音樂的具體方法750。一旦在音頻流的所取樣的部分中檢測到音樂,就在圖7中的740處,方法750可在810處獲得從音頻流的一部分提取的至少一個聲音特征。在一個實施例中,音樂檢測模塊410可向音樂識別單元342提供至少一個聲音特征,其已從音頻流的一部分提取且用于檢測音樂。在另一個實施例中,音樂識別單元342可從音頻流的一部分提取至少一個聲音特征,所述部分在音樂檢測模塊410已提取聲音特征來檢測音樂的部分之后。
[0100]在820處,可將所獲得的至少一個聲音特征從電子裝置(例如圖3中的電子裝置300)發(fā)射到服務(wù)器(例如圖2中服務(wù)器240)。服務(wù)器可存儲包含識別信息的音樂數(shù)據(jù)庫?;趤碜噪娮友b置的聲音特征,服務(wù)器可檢索與對應(yīng)于所述聲音特征的一首音樂相關(guān)聯(lián)的識別信息。如果服務(wù)器未能檢索所述聲音特征的此類識別信息,那么服務(wù)器可將指示未發(fā)現(xiàn)匹配的消息發(fā)射到電子裝置。另一方面,如果服務(wù)器成功檢索到所述聲音特征的所述識別信息,那么服務(wù)器可將檢索到的與所述首音樂相關(guān)聯(lián)的識別信息發(fā)射到電子裝置。
[0101]在830處,方法750可確定是否從服務(wù)器接收到所述首音樂的識別信息。當(dāng)從服務(wù)器接收到與所述首音樂相關(guān)聯(lián)的識別信息(即,830處的“是”)時,方法750進(jìn)行到760,以跟蹤所述首音樂并檢測所述首音樂的結(jié)束。如果未從服務(wù)器接收到識別信息(例如,接收到指示未找到匹配的消息)(即,830處的“否”),方法750進(jìn)行到710,以確定是否在正產(chǎn)生的音頻流中檢測到聲音。根據(jù)一個實施例,服務(wù)器可包含用于多首音樂的多個音樂模型,并向電子裝置發(fā)射所述多個音樂模型中的一者,其與從電子裝置接收到的聲音特征匹配。
[0102]圖9說明根據(jù)本發(fā)明的一個實施例的用于基于與一首音樂相關(guān)聯(lián)的音樂模型來跟蹤所述首音樂的具體方法760。方法760可在910處,對音頻流的一部分進(jìn)行取樣??稍趶囊褜σ纛l流的一部分(例如圖5中的G1)進(jìn)行取樣以用于檢測音樂起的預(yù)定時間周期(例如圖5中的T3)之后,或在已對音頻流的一部分(例如圖5中的N1)進(jìn)行取樣以用于檢測所述首音樂的結(jié)束之后的另一預(yù)定時間周期(例如圖5中的T4)之后,對所述部分進(jìn)行取樣。另外,方法760可在920處,基于音頻流的所取樣的部分提取聲音特征。在一些實施例中,可從音頻流的所取樣的部分提取多個聲音特征。
[0103]方法750可在930處,基于所述首音樂的音樂模型和所提取的聲音特征確定音頻流的所取樣的部分是否是所述首音樂的一部分。所述首音樂的音樂模型可在電子裝置中產(chǎn)生或從外部裝置接收。在一些實施例中,電子裝置中的音樂跟蹤模塊430可確定聲音特征與所述首音樂的音樂模型之間的類似性值。可通過例如使用任何合適的方案,以如上文參看圖6所描述的方式來確定類似性值。可將類似性值與預(yù)定閾值進(jìn)行比較。
[0104]如果確定所取樣的部分不是所述首音樂的一部分(S卩,940處的“否”),那么方法760進(jìn)行到710,以持續(xù)確定是否在正產(chǎn)生的音頻流中檢測到聲音。另一方面,如果確定所取樣的部分是所述首音樂的一部分(即,940處的“是”),方法760進(jìn)行到910,以對音頻流的下一部分進(jìn)行取樣。以此方式,音樂跟蹤模塊430可持續(xù)跟蹤所述首音樂。
[0105]圖10說明根據(jù)本發(fā)明的一個實施例的經(jīng)配置以接收一首音樂的識別信息,管理音樂歷史數(shù)據(jù)庫364且產(chǎn)生建議和通知的電子裝置300的處理器340中的音樂管理單元344的較詳細(xì)框圖。音樂管理單元344可包含音樂歷史管理模塊1010、建議模塊1020和通知模塊1030。如所示,音樂管理單元344可存取處理器340中的音樂識別單元342以及存儲單元360中的音樂歷史數(shù)據(jù)庫364。
[0106]一旦音樂識別單元342獲得一首音樂的識別信息,其就可將所述識別信息提供到音樂管理單元344中的音樂歷史管理模塊1010。音樂歷史管理模塊1010可存取音樂歷史數(shù)據(jù)庫364并用所述識別信息來更新音樂歷史數(shù)據(jù)庫364。另外,音樂歷史管理模塊1010可指令位置傳感器370和時鐘模塊380確定電子裝置300的位置信息以及用于更新音樂歷史數(shù)據(jù)庫的時間信息。所述位置和時間信息可連同音樂歷史數(shù)據(jù)庫364中的所述首音樂的識別信息一起存儲。
[0107]在一個實施例中,音樂歷史管理模塊1010可基于存儲在音樂歷史數(shù)據(jù)庫364中的識別信息來產(chǎn)生頻繁聽的若干首音樂的列表。舉例來說,音樂歷史管理模塊1010可確定再指定時間間隔內(nèi)一首音樂在音樂歷史數(shù)據(jù)庫364記錄多少次。當(dāng)識別所述首音樂超過預(yù)定次數(shù)時,音樂歷史管理模塊1010可確定所述首音樂是頻繁聽的一首音樂,并將其添加到頻繁聽的若干首音樂的列表。另外,音樂歷史管理模塊1010可連同與所述首音樂相關(guān)聯(lián)的時間或位置一起產(chǎn)生在一或多個時間周期或位置中聽到的若干首音樂的列表。
[0108]基于存儲在音樂歷史數(shù)據(jù)庫364中的識別信息,建議模塊1020可為用戶產(chǎn)生建議。舉例來說,當(dāng)所識別的所述首音樂包含于頻繁聽的若干首音樂的列表中時,建議模塊1020可產(chǎn)生并顯示對用戶的建議,以在I/O單元320上下載或購買所識別的所述首音樂。另外或替代地,建議模塊1020可提供建議來從外部服務(wù)器流式傳輸頻繁聽的若干首音樂的列表中的所述首音樂。
[0109]通知模塊1030可經(jīng)配置以分析所述識別信息,并提供所識別的所述首音樂的通知。舉例來說,識別信息可包含指示所述首音樂可用于免費(fèi)下載或與特定類型的音樂視頻(例如搞笑音樂視頻、高評分音樂視頻)相關(guān)聯(lián)的額外信息。在此情況下,通知單元460可通知所述用戶所述額外信息。在一些實施例中,當(dāng)確定所識別的所述首音樂為另一用戶的“最愛音樂”時,通知模塊1030可通知所述用戶所識別的所述首音樂是另一用戶的最愛音樂。
[0110]圖11說明根據(jù)一些實施例的其中可實施本發(fā)明的用于從音頻流識別一首音樂并跟蹤所述首音樂的方法和設(shè)備的無線通信系統(tǒng)中的移動裝置1100的框圖。移動裝置1100可為蜂窩式電話、智能電話、可穿戴計算機(jī)、智能表、智能眼鏡、平板個人計算機(jī)、終端、手持機(jī)、個人數(shù)字助理(PDA)、無線調(diào)制解調(diào)器、無繩電話、平板計算機(jī)等。無線通信系統(tǒng)可為CDMA系統(tǒng)、GSM系統(tǒng)、W-CDMA系統(tǒng)、LTE系統(tǒng)、LTE高級系統(tǒng)等。
[0111]移動裝置1100可能夠經(jīng)由接收路徑和發(fā)射路徑提供雙向通信。在接收路徑上,基站發(fā)射的信號可被天線1112接收,并且被提供給接收器(RCVR) 1114。接收器1114可調(diào)節(jié)并數(shù)字化所接收的信號,并將經(jīng)調(diào)節(jié)且經(jīng)數(shù)字化的數(shù)字信號提供到數(shù)字區(qū)段以供進(jìn)一步處理。在發(fā)射路徑上,發(fā)射器(TMTRH116可從數(shù)字區(qū)段1120接收待發(fā)射的數(shù)據(jù),處理并調(diào)節(jié)所述數(shù)據(jù),且產(chǎn)生經(jīng)調(diào)制信號,所述經(jīng)調(diào)制信號經(jīng)由天線1112發(fā)射到基站。接收器1114和發(fā)射器1116可為可支持CDMA、GSM、W-CDMA、LTE、高級LTE等收發(fā)器的一部分。
[0112]數(shù)字區(qū)段1120可包含各種處理、接口和存儲器單元,例如,舉例來說,調(diào)制解調(diào)器處理器1122、精簡指令集計算機(jī)/數(shù)字信號處理器(RISC/DSP)1124、控制器/處理器1126、內(nèi)部存儲器1128、通用音頻/視頻編碼器1132、通用音頻解碼器1134、圖形/顯示處理器1136,和/或外部總線接口(EBIH138。調(diào)制解調(diào)器處理器1122可執(zhí)行用于數(shù)據(jù)發(fā)射和接收的處理,例如,編碼、調(diào)制、解調(diào)和解碼。RISC/DSP 1124可執(zhí)行移動裝置1100的通用和專用處理。控制器/處理器1126可執(zhí)行數(shù)字區(qū)段1120內(nèi)的各種處理和接口單元的操作。內(nèi)部存儲器1128可存儲用于數(shù)字區(qū)段1120內(nèi)的各種單元的數(shù)據(jù)和/或指令。
[0113]通用音頻/視頻編碼器1132可對來自音頻/視頻源1142、麥克風(fēng)1144、圖像傳感器1146等的輸入信號執(zhí)行編碼。通用音頻解碼器1134可執(zhí)行對經(jīng)譯碼音頻數(shù)據(jù)的解碼,且可將輸出信號提供到揚(yáng)聲器/頭戴式耳機(jī)1148。圖形/顯示處理器1136可執(zhí)行對可呈現(xiàn)到顯示單元1150的圖形、視頻、圖像和文本的處理。EBI 1138可促進(jìn)數(shù)據(jù)在數(shù)字區(qū)段1120與主存儲器1152之間的傳送。
[0114]數(shù)字區(qū)段1120可用一或多個處理器、DSP、微處理器、RISC等來實施。數(shù)字區(qū)段1120還可制造于一或多個專用集成電路(ASIC)和/或一些其它類型的集成電路(IC)上。
[0115]圖12是說明根據(jù)一些實施例實施的可為先前描述的服務(wù)器中的任一者的用于搜索和提供關(guān)于一首音樂的信息的服務(wù)器系統(tǒng)1200的框圖。服務(wù)器系統(tǒng)1200可包含一或多個處理單元(例如CPUH202、一或多個網(wǎng)絡(luò)或其它通信網(wǎng)接口、存儲器1212,以及用于互連這些組件的一或多個通信總線1214。服務(wù)器系統(tǒng)1200還可包含具有顯示裝置和鍵盤的用戶接口(未圖示)。
[0116]存儲器1212可為任何合適的存儲器,例如高速隨機(jī)存取存儲器,(例如DRAM、SRAM、DDR RAM或其它隨機(jī)存取固態(tài)存儲器裝置)。存儲器1212可包含或可替代地為非易失性存儲器(例如一或多個磁盤存儲裝置、光盤存儲裝置、快閃存儲器裝置,或其它非易失性固態(tài)存儲裝置)。在一些實施例中,存儲器1212可包含離CPU 1202遠(yuǎn)程定位和/或遠(yuǎn)程定位于多處的一或多個存儲裝置。
[0117]由存儲器1212表示的以上存儲器裝置中的任一者可存儲對應(yīng)于用于實施和/或執(zhí)行先前描述的過程、操作和方法中的任一者的指令集的任何數(shù)目的模塊或編程。舉例來說,存儲器1212可包含操作系統(tǒng)1216,其經(jīng)配置以存儲包含用于處置各種基本系統(tǒng)服務(wù)且用于執(zhí)行硬件相關(guān)任務(wù)的程序的指令。所述存儲器1212的網(wǎng)絡(luò)通信模塊1218可用于經(jīng)由一或多個通信網(wǎng)絡(luò)接口 1210(有線或無線)和一或多個通信網(wǎng)絡(luò)(例如因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)、城域網(wǎng)等)將服務(wù)器系統(tǒng)1200連接到其它計算機(jī)。
[0118]存儲器1212還可包含音樂數(shù)據(jù)庫1220,其經(jīng)配置以包含音樂模型數(shù)據(jù)庫、識別信息數(shù)據(jù)庫等。音樂數(shù)據(jù)庫中的數(shù)據(jù)庫中的每一者可用于識別一首音樂和檢測一首音樂的結(jié)束。音樂模型數(shù)據(jù)庫中的每一音樂模型可與一首音樂相關(guān)聯(lián)。操作系統(tǒng)1216可用通過網(wǎng)絡(luò)通信模塊1218從多個音樂提供者接收的多媒體流中的各種音樂來更新音樂數(shù)據(jù)庫1220。操作系統(tǒng)1216還可經(jīng)由網(wǎng)絡(luò)通信模塊1218將多首音樂的音樂模型和識別信息提供到多個電子裝置。
[0119]一般來說,本文中所描述的任何裝置可表示各種類型的裝置,例如無線電話、蜂窩式電話、膝上型計算機(jī)、無線多媒體裝置、無線通信個人計算機(jī)(PC)卡、PDA、外部或內(nèi)部調(diào)制解調(diào)器、通過無線信道通信的裝置等。裝置可具有各種名稱,例如接入終端(AT)、接入單元、訂戶單元、移動臺、移動裝置、移動單元、移動電話、移動設(shè)備、遠(yuǎn)程站、遠(yuǎn)程終端、遠(yuǎn)程單元、用戶裝置、用戶設(shè)備、手持式裝置等。本文中所描述的任何裝置可具有用于存儲指令和數(shù)據(jù)的存儲器以及硬件、軟件、固件或其組合。
[0120]可通過各種手段來實施本文中所描述的技術(shù)。舉例來說,這些技術(shù)可以硬件、固件、軟件或其組合來實施。所屬領(lǐng)域的技術(shù)人員將進(jìn)一步了解,結(jié)合本文中的揭示內(nèi)容描述的各種說明性邏輯塊、模塊、電路和算法步驟可實施為電子硬件、計算機(jī)軟件或兩者的組合。為清楚地說明硬件與軟件的這種可互換性,上文已大體上關(guān)于其功能性描述了各種說明性組件、塊、模塊、電路和步驟。將此功能性實施為硬件還是軟件取決于特定應(yīng)用以及強(qiáng)加于整個系統(tǒng)的設(shè)計約束。熟練的技術(shù)人員可針對每一特定應(yīng)用以不同方式實施所描述的功能性,但此類實施決策不應(yīng)被解釋為引起偏離本發(fā)明的范圍。
[0121]對于硬件實施方案,用以執(zhí)行所述技術(shù)的處理單元可在以下各項內(nèi)實施:一或多個ASIC、DSP、數(shù)字信號處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、電子裝置、經(jīng)設(shè)計以執(zhí)行本文中所描述的功能的其它電子單元、計算機(jī),或其組合。
[0122]因此,結(jié)合本文中的揭示內(nèi)容描述的各種說明性邏輯塊、模塊和電路是用經(jīng)設(shè)計以執(zhí)行本文所述的功能的通用處理器、DSP、ASIC、FPGA或其它可編程邏輯裝置、離散門或晶體管邏輯、離散硬件組件或其任何組合來實施或執(zhí)行。通用處理器可以是微處理器,但在替代方案中,處理器可以是任何常規(guī)處理器、控制器、微控制器或狀態(tài)機(jī)。處理器還可實施為計算裝置的組合,例如,DSP與微處理器的組合、多個微處理器的組合、一或多個微處理器結(jié)合DSP核心,或任何其它此類配置。
[0123]如果實施于軟件中,那么可將所述功能作為一或多個指令或代碼存儲在計算機(jī)可讀媒體上或經(jīng)由計算機(jī)可讀媒體傳輸。計算機(jī)可讀媒體包含計算機(jī)存儲媒體與通信媒體兩者,所述通信媒體包含促進(jìn)將計算機(jī)程序從一處傳送到另一處的任何媒體。存儲媒體可為可由計算機(jī)存取的任何可用媒體。作為舉例且并不限于此,此類計算機(jī)可讀媒體可包括RAM、R0M、EEPR0M、CD_R0M或其它光盤存儲裝置、磁盤存儲裝置或其它磁性存儲裝置,或可用于運(yùn)載或存儲呈指令或數(shù)據(jù)結(jié)構(gòu)形式的所需程序代碼且可由計算機(jī)存取的任何其它媒體。如本文中所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD),軟性磁盤和藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤利用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上的組合也應(yīng)包含在計算機(jī)可讀媒體的范圍內(nèi)。
[0124]提供本發(fā)明的前述描述是為了使所屬領(lǐng)域的技術(shù)人員能夠制作或使用本發(fā)明。所屬領(lǐng)域的技術(shù)人員將易于明白對本發(fā)明的各種修改,且本文中界定的一般原理在不脫離本發(fā)明的精神或范圍的情況下應(yīng)用于其它變化。因此,本發(fā)明無意限于本文中所描述的實例,而應(yīng)被賦予與本文中所揭示的原理和新穎特征相一致的最寬范圍。
[0125]盡管稱示范性實施方案利用在一或多個獨立計算機(jī)系統(tǒng)的上下文中的當(dāng)前揭示的標(biāo)的物的方面,但所述標(biāo)的物不受如此限制,而是可結(jié)合任何計算環(huán)境(例如網(wǎng)絡(luò)或分布式計算環(huán)境)來實施。此外,當(dāng)前揭示的標(biāo)的物的方面可在多個處理芯片或裝置中或跨越多個處理芯片或裝置實施,且可類似地跨越多個裝置實現(xiàn)存儲。此類裝置可包含PC、網(wǎng)絡(luò)服務(wù)器和手持式裝置。
[0126]盡管已經(jīng)以特定地針對結(jié)構(gòu)特征和/或方法動作的語言來描述標(biāo)的物,但應(yīng)理解,所附權(quán)利要求書中所定義的標(biāo)的物未必限于上文所描述的具體特征或動作。確切地說,以實施權(quán)利要求書的實例形式來揭示上文所描述的特定特征及動作。
[0127]將了解,上文所識別的模塊或程序(即指令集)不必實施為單獨的軟件程序、程序或模塊,且因此在各種實施例中,可組合或以其它方式重新布置這些模塊的各種子集。此夕卜,存儲器1212可存儲上文未描述的額外模塊和數(shù)據(jù)結(jié)構(gòu)。
[0128]〈本發(fā)明的方面〉
[0129]在下文中,將另外陳述本發(fā)明的一些方面。
[0130](實例I)根據(jù)本發(fā)明的一方面,提供一種用于跟蹤音頻流中的一首音樂的方法,其包含:接收所述音頻流的第一部分;基于所述音頻流的所述第一部分提取第一聲音特征;基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂;響應(yīng)于確定所述音頻流的所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂;接收所述音頻流的第二部分;基于所述音頻流的所述第二部分提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂。
[0131](實例2)在實例I的方法中,接收所述音頻流的第一部分包含根據(jù)聲音傳感器的工作循環(huán)周期性地接收音頻流的多個部分。
[0132](實例3)實例I或2的方法進(jìn)一步包含基于從音頻流的第一部分提取的至少一個聲音特征來產(chǎn)生指示第一首音樂的音樂模型。
[0133](實例4)在實例I到3中的任一者的方法中,產(chǎn)生指示第一首音樂的音樂模型包含:將對指示第一首音樂的音樂模型的請求發(fā)送到外部裝置,其中所述請求包含從音頻流的第一部分提取的至少一個聲音特征;以及從所述外部裝置接收所述音樂模型。
[0134](實例5)在實例I到4中的任一者的方法中,產(chǎn)生音樂模型包含基于從音頻流的第一部分提取的至少一個聲音特征來修改預(yù)定音樂模型。
[0135](實例6)在實例I到5中的任一者的方法中,確定音頻流的所述第二部分是否指示第一首音樂是基于所述音樂模型和從音頻流的所述第二部分提取的至少一個聲音特征。
[0136](實例7)實例I到6中的任一者的方法進(jìn)一步包含:響應(yīng)于確定所述第二部分不指示第一首音樂,接收音頻流的第三部分;基于音頻流的第三部分提取第三聲音特征;基于第三聲音特征確定音頻流的第三部分是否指示音樂;以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂,基于所述音頻流的所述第三部分識別第二首音樂。
[0137](實例8)在實例I到7中的任一者的方法中,基于所述音頻流的所述第三部分識別第二首音樂包含:將請求發(fā)送到外部裝置,其中所述請求包含從所述音頻流的所述第三部分提取的至少一個聲音特征;從外部裝置接收與第二首音樂相關(guān)聯(lián)的信息;以及基于從外部裝置接收到的信息識別第二首音樂。
[0138](實例9)在實例I到8中的任一者的方法中,識別第一首音樂包含從例如服務(wù)器等外部裝置獲得識別信息。
[0139](實例10)實例I到9中的任一者的方法進(jìn)一步包含響應(yīng)于確定所述音頻流的所述第二部分指示第一首音樂而接收音頻流的第三部分。在此實例中,接收音頻流的第三部分包含根據(jù)聲音傳感器的工作循環(huán)周期性地接收音頻流的多個部分。
[0140](實例11)根據(jù)本發(fā)明的另一方面,提供一種用于跟蹤音頻流中的一首音樂的電子裝置,其包含:音樂檢測單元,其經(jīng)配置以接收音頻流的第一部分;基于所述音頻流的所述第一部分提取第一聲音特征;以及基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂;音樂識別單元,其經(jīng)配置以響應(yīng)于確定所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂;以及音樂跟蹤單元,其經(jīng)配置以接收所述音頻流的第二部分;基于所述音頻流的所述第二部分提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂。
[0141](實例12)在實例11的電子裝置中,音樂檢測單元經(jīng)配置以根據(jù)聲音傳感器的工作循環(huán)周期性地接收音頻流的多個部分。
[0142](實例13)實例11或12的電子裝置進(jìn)一步包含音樂模型管理單元,其經(jīng)配置以基于從音頻流的第一部分提取的至少一個聲音特征產(chǎn)生指示第一首音樂的音樂模型。
[0143](實例14)在實例11到13中的任一者的電子裝置中,音樂模型管理單元經(jīng)配置以將對指示第一首音樂的音樂模型的請求發(fā)送到外部裝置,其中所述請求包含從音頻流的第一部分提取的至少一個聲音特征;以及從外部裝置接收所述音樂模型。
[0144](實例15)在實例11到14中的任一者的電子裝置中,音樂模型管理單元經(jīng)配置以基于從音頻流的第一部分提取的至少一個聲音特征來修改預(yù)定音樂模型。
[0145](實例16)在實例11到15中的任一者的電子裝置中,響應(yīng)于確定音頻流的所述第二部分不指示所述首音樂,音樂檢測單元經(jīng)配置以接收音頻流的第三部分;基于所述音頻流的所述第三部分提取第三聲音特征;以及基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂。在此實例中,響應(yīng)于確定所述音頻流的所述第三部分指示音樂,音樂識別單元經(jīng)配置以基于所述音頻流的所述第三部分識別第二首音樂。
[0146](實例17)在實例11到16中的任一者的電子裝置中,經(jīng)配置以識別第二首音樂的音樂識別單元經(jīng)配置以將請求發(fā)送到外部裝置,其中所述請求包含從所述音頻流的所述第三部分提取的至少一個聲音特征;從所述外部裝置接收與第二首音樂相關(guān)聯(lián)的信息;以及基于從外部裝置接收到的信息來識別所述第二首音樂。
[0147](實例18)在實例11到17中的任一者的電子裝置中,音樂識別單元經(jīng)配置以從外部裝置獲得識別信息。
[0148](實例19)根據(jù)本發(fā)明的另一方面,提供一種用于跟蹤音頻流中的一首音樂的電子裝置,其包含:用于接收所述音頻流的第一部分的裝置;用于基于所述音頻流的所述第一部分提取第一聲音特征的裝置;用于基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂的裝置;用于響應(yīng)于確定所述音頻流的所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂的裝置;用于接收所述音頻流的第二部分的裝置;用于基于所述音頻流的所述第二部分提取第二聲音特征的裝置;以及用于確定所述音頻流的所述第二部分是否指示第一首音樂的裝置。
[0149](實例20)在實例19的電子裝置中,所述用于接收音頻流的第一部分的裝置包含用于根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個部分的裝置。
[0150](實例21)實例19或20的電子裝置進(jìn)一步包含用于基于從所述音頻流的所述第一部分提取的至少一個聲音特征產(chǎn)生指示第一首音樂的音樂模型的裝置。
[0151](實例22)在實例19到21中的任一者的電子裝置中,所述用于產(chǎn)生指示第一首音樂的音樂模型的裝置包含:用于將對指示第一首音樂的音樂模型的請求發(fā)送到外部裝置的裝置。在此實例中,所述請求包含從所述音頻流的所述第一部分提取的至少一個聲音特征;以及用于從所述外部裝置接收所述音樂模型的裝置。
[0152](實例23)在實例19到22中的任一者的電子裝置中,所述用于產(chǎn)生所述音樂模型的裝置包含用于基于從所述音頻流的所述第一部分提取的所述至少一個聲音特征來修改預(yù)定音樂模型的裝置。
[0153](實例24)在實例19到23中的任一者的電子裝置中,所述用于確定所述音頻流的所述第二部分是否指示所述第一首音樂的裝置是基于所述音樂模型和從所述音頻流的所述第二部分提取的至少一個聲音特征。
[0154](實例25)實例19到24中的任一者的電子裝置進(jìn)一步包含:用于響應(yīng)于確定所述第二部分不指示所述第一首音樂而接收所述音頻流的第三部分的裝置;用于基于所述音頻流的所述第三部分提取第三聲音特征的裝置;用于基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂的裝置;以及用于響應(yīng)于確定所述音頻流的所述第三部分指示音樂而基于所述音頻流的所述第三部分識別第二首音樂的裝置。
[0155](實例26)在實例19到25中的任一者的電子裝置中,所述用于基于所述音頻流的所述第三部分識別所述第二首音樂的裝置包含:用于將請求發(fā)送到外部裝置的裝置,其中所述請求包含從所述音頻流的所述第三部分提取的至少一個聲音特征;用于從所述外部裝置接收與所述第二首音樂相關(guān)聯(lián)的信息的裝置;以及用于基于所述從所述外部裝置接收到的信息識別所述第二首音樂的裝置。
[0156](實例27)在實例19到26中的任一者的電子裝置中,所述用于識別所述首音樂的裝置經(jīng)配置以從例如服務(wù)器等外部裝置獲得識別信息。
[0157](實例28)根據(jù)本發(fā)明的另一個方面,提供一種非暫時性計算機(jī)可讀存儲媒體,其包含致使電子裝置的處理器執(zhí)行以下操作的指令:接收音頻流的第一部分;基于所述音頻流的所述第一部分提取第一聲音特征;基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂;響應(yīng)于確定所述音頻流的所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂;接收所述音頻流的第二部分;基于所述音頻流的所述第二部分提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂。
[0158](實例29)在實例28的非暫時性計算機(jī)可讀存儲媒體中,接收所述音頻流的所述第一部分包含根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個部分。
[0159](實例30)實例28或29的非暫時性計算機(jī)可讀存儲媒體進(jìn)一步包含致使電子裝置的處理器執(zhí)行以下操作的指令:響應(yīng)于確定所述第二部分不指示所述第一首音樂,接收所述音頻流的第三部分;基于所述音頻流的所述第三部分提取第三聲音特征;基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂;以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂,基于所述音頻流的所述第三部分識別第二首音樂。
【主權(quán)項】
1.一種在電子裝置中執(zhí)行的用于跟蹤音頻流中的一首音樂的方法,其包括: 從聲音傳感器接收所述音頻流的第一部分; 基于所述音頻流的所述第一部分提取第一聲音特征; 基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂; 響應(yīng)于確定所述音頻流的所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂; 接收所述音頻流的第二部分; 基于所述音頻流的所述第二部分提取第二聲音特征;以及 確定所述音頻流的所述第二部分是否指示所述第一首音樂。2.根據(jù)權(quán)利要求1所述的方法,其中接收所述音頻流的所述第一部分包括根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個部分。3.根據(jù)權(quán)利要求2所述的方法,其進(jìn)一步包括基于從所述音頻流的所述第一部分提取的至少一個聲音特征產(chǎn)生指示所述第一首音樂的音樂模型。4.根據(jù)權(quán)利要求3所述的方法,其中產(chǎn)生指示所述第一首音樂的所述音樂模型包括: 將對指示所述第一首音樂的所述音樂模型的請求發(fā)送到外部裝置,其中所述請求包含從所述音頻流的所述第一部分提取的所述至少一個聲音特征;以及從所述外部裝置接收所述音樂模型。5.根據(jù)權(quán)利要求3所述的方法,其中產(chǎn)生所述音樂模型包括基于從所述音頻流的所述第一部分提取的所述至少一個聲音特征來修改預(yù)定音樂模型。6.根據(jù)權(quán)利要求3所述的方法,其中確定所述音頻流的所述第二部分是否指示所述第一首音樂是基于所述音樂模型和從所述音頻流的所述第二部分提取的至少一個聲音特征。7.根據(jù)權(quán)利要求2所述的方法,其進(jìn)一步包括: 響應(yīng)于確定所述第二部分不指示所述第一首音樂而接收所述音頻流的第三部分; 基于所述音頻流的所述第三部分提取第三聲音特征; 基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂;以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂,基于所述音頻流的所述第三部分識別弟一.首首樂。8.根據(jù)權(quán)利要求7所述的方法,其中基于所述音頻流的所述第三部分識別所述第二首音樂包括: 將請求發(fā)送到外部裝置,其中所述請求包含從所述音頻流的所述第三部分提取的至少一個聲音特征; 從所述外部裝置接收與所述第二首音樂相關(guān)聯(lián)的信息;以及 基于所述從所述外部裝置接收到的信息識別所述第二首音樂。9.根據(jù)權(quán)利要求1所述的方法,其中識別所述第一首音樂包括從外部裝置獲得識別信息。10.根據(jù)權(quán)利要求2所述的方法,其進(jìn)一步包括響應(yīng)于確定所述音頻流的所述第二部分指示所述第一首音樂而接收所述音頻流的第三部分,其中接收所述音頻流的所述第三部分包括根據(jù)所述聲音傳感器的所述工作循環(huán)周期性地接收所述音頻流的多個部分。11.一種用于跟蹤音頻流中的一首音樂的電子裝置,其包括: 音樂檢測單元,其經(jīng)配置以: 接收所述音頻流的第一部分; 基于所述音頻流的所述第一部分提取第一聲音特征;以及 基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂; 音樂識別單元,其經(jīng)配置以響應(yīng)于確定所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂;以及音樂跟蹤單元,其經(jīng)配置以: 接收所述音頻流的第二部分; 基于所述音頻流的所述第二部分提取第二聲音特征;以及 確定所述音頻流的所述第二部分是否指示所述第一首音樂。12.根據(jù)權(quán)利要求11所述的電子裝置,其中所述音樂檢測單元經(jīng)配置以根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個部分。13.根據(jù)權(quán)利要求12所述的電子裝置,其進(jìn)一步包括音樂模型管理單元,所述音樂模型管理單元經(jīng)配置以基于從所述音頻流的所述第一部分提取的至少一個聲音特征產(chǎn)生指示所述第一首音樂的音樂模型。14.根據(jù)權(quán)利要求13所述的電子裝置,其中所述音樂模型管理單元經(jīng)配置以: 將對指示所述第一首音樂的所述音樂模型的請求發(fā)送到外部裝置,其中所述請求包含從所述音頻流的所述第一部分提取的所述至少一個聲音特征;以及從所述外部裝置接收所述音樂模型。15.根據(jù)權(quán)利要求13所述的電子裝置,其中所述音樂模型管理單元經(jīng)配置以基于從所述音頻流的所述第一部分提取的所述至少一個聲音特征來修改預(yù)定音樂模型。16.根據(jù)權(quán)利要求12所述的電子裝置,其中響應(yīng)于確定所述音頻流的所述第二部分不指示所述首音樂,所述音樂檢測單元經(jīng)配置以: 接收所述音頻流的第三部分; 基于所述音頻流的所述第三部分提取第三聲音特征;以及基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂,且其中響應(yīng)于確定所述音頻流的所述第三部分指示音樂,所述音樂識別單元經(jīng)配置以基于所述音頻流的所述第三部分識別第二首音樂。17.根據(jù)權(quán)利要求16所述的電子裝置,其中經(jīng)配置以識別所述第二首音樂的所述音樂識別單元經(jīng)配置以: 將請求發(fā)送到外部裝置,其中所述請求包含從所述音頻流的所述第三部分提取的至少一個聲音特征; 從所述外部裝置接收與所述第二首音樂相關(guān)聯(lián)的信息;以及 基于所述從所述外部裝置接收到的信息識別所述第二首音樂。18.根據(jù)權(quán)利要求11所述的電子裝置,其中所述音樂識別單元經(jīng)配置以從外部裝置獲得識別?目息。19.一種用于跟蹤音頻流中的一首音樂的電子裝置,其包括: 用于接收所述音頻流的第一部分的裝置; 用于基于所述音頻流的所述第一部分提取第一聲音特征的裝置; 用于基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂的裝置;用于響應(yīng)于確定所述音頻流的所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂的裝置; 用于接收所述音頻流的第二部分的裝置; 用于基于所述音頻流的所述第二部分提取第二聲音特征的裝置;以及 用于確定所述音頻流的所述第二部分是否指示所述第一首音樂的裝置。20.根據(jù)權(quán)利要求19所述的電子裝置,其中所述用于接收所述音頻流的所述第一部分的裝置包括用于根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個部分的裝置。21.根據(jù)權(quán)利要求20所述的電子裝置,其進(jìn)一步包括用于基于從所述音頻流的所述第一部分提取的至少一個聲音特征產(chǎn)生指示所述第一首音樂的音樂模型的裝置。22.根據(jù)權(quán)利要求21所述的電子裝置,其中所述用于產(chǎn)生指示所述第一首音樂的所述音樂模型的裝置包括: 用于將對指示所述第一首音樂的所述音樂模型的請求發(fā)送到外部裝置的裝置,其中所述請求包含從所述音頻流的所述第一部分提取的所述至少一個聲音特征;以及用于從所述外部裝置接收所述音樂模型的裝置。23.根據(jù)權(quán)利要求21所述的電子裝置,其中所述用于產(chǎn)生所述音樂模型的裝置包括用于基于從所述音頻流的所述第一部分提取的所述至少一個聲音特征來修改預(yù)定音樂模型的裝置。24.根據(jù)權(quán)利要求21所述的電子裝置,其中所述用于確定所述音頻流的所述第二部分是否指示所述第一首音樂的裝置是基于所述音樂模型和從所述音頻流的所述第二部分提取的至少一個聲音特征。25.根據(jù)權(quán)利要求20所述的電子裝置,其進(jìn)一步包括: 用于響應(yīng)于確定所述第二部分不指示所述第一首音樂而接收所述音頻流的第三部分的裝置; 用于基于所述音頻流的所述第三部分提取第三聲音特征的裝置; 用于基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂的裝置;以及 用于響應(yīng)于確定所述音頻流的所述第三部分指示音樂,基于所述音頻流的所述第三部分識別第二首音樂的裝置。26.根據(jù)權(quán)利要求25所述的電子裝置,其中所述用于基于所述音頻流的所述第三部分識別所述第二首音樂的裝置包括: 用于將請求發(fā)送到外部裝置的裝置,其中所述請求包含從所述音頻流的所述第三部分提取的至少一個聲音特征; 用于從所述外部裝置接收與所述第二首音樂相關(guān)聯(lián)的信息的裝置;以及 用于基于所述從所述外部裝置接收到的信息識別所述第二首音樂的裝置。27.根據(jù)權(quán)利要求19所述的電子裝置,其中所述用于識別所述首音樂的裝置經(jīng)配置以從外部裝置獲得識別信息。28.—種非暫時性計算機(jī)可讀存儲媒體,其包括致使電子裝置的至少一處理器執(zhí)行以下操作的指令: 接收音頻流的第一部分; 基于所述音頻流的所述第一部分提取第一聲音特征; 基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂; 響應(yīng)于確定所述音頻流的所述第一部分指示音樂,基于所述音頻流的所述第一部分識別第一首音樂; 接收所述音頻流的第二部分; 基于所述音頻流的所述第二部分提取第二聲音特征;以及 確定所述音頻流的所述第二部分是否指示所述第一首音樂。29.根據(jù)權(quán)利要求28所述的非暫時性計算機(jī)可讀存儲媒體,其中接收所述音頻流的所述第一部分包括根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個部分。30.根據(jù)權(quán)利要求28所述的非暫時性計算機(jī)可讀存儲媒體,其進(jìn)一步包括致使所述電子裝置的所述至少一處理器執(zhí)行以下操作的指令: 響應(yīng)于確定所述第二部分不指示所述第一首音樂而接收所述音頻流的第三部分; 基于所述音頻流的所述第三部分提取第三聲音特征; 基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂;以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂,基于所述音頻流的所述第三部分識別第二首音樂。
【文檔編號】H04H60/37GK105874732SQ201580003535
【公開日】2016年8月17日
【申請日】2015年1月7日
【發(fā)明人】金泰殊, 李敏秀, 周俊澈
【申請人】高通股份有限公司