一種信息處理方法及服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通訊技術(shù),尤其涉及一種信息處理方法及客戶端。
【背景技術(shù)】
[0002]本申請發(fā)明人在實(shí)現(xiàn)本申請實(shí)施例技術(shù)方案的過程中,至少發(fā)現(xiàn)相關(guān)技術(shù)中存在如下技術(shù)問題:
[0003]多媒體信息的共享和播放成為用戶生活中的必備服務(wù),為了更快捷的識別出某個(gè)多媒體信息,產(chǎn)生了指紋識別技術(shù)。以多媒體信息為音頻信息為例,音頻壓縮技術(shù)的進(jìn)步以及大容量存儲器的出現(xiàn)使得互聯(lián)網(wǎng)上出現(xiàn)了以音樂為主的海量音頻信息,手工選取某首歌曲很多時(shí)候已經(jīng)變得不可能,這直接促使產(chǎn)生了可以進(jìn)行音樂自動識別的數(shù)字音頻指紋技術(shù)。
[0004]就針對多媒體信息的指紋識別技術(shù)而言,仍以多媒體信息為音頻信息為例,音頻指紋是一種可以代表一段音樂重要聲學(xué)特征的基于內(nèi)容的緊致數(shù)字簽名,音頻指紋用于建立一種有效機(jī)制來比較兩個(gè)音頻數(shù)據(jù)的感知聽覺質(zhì)量,這里需要指出的是,并不是直接比較通常很大的兩個(gè)或多個(gè)音頻數(shù)據(jù)本身,而是比較其相應(yīng)通常較小的數(shù)字指紋,即:經(jīng)由兩個(gè)或多個(gè)音頻數(shù)據(jù)本身得到的兩個(gè)或多個(gè)音頻指紋。
[0005]采用現(xiàn)有技術(shù)來識別進(jìn)而選取一首歌曲或一段視頻,通過上述指紋識別技術(shù),是需要生成音頻指紋或視頻指紋信息,然后與數(shù)據(jù)庫中已有的音頻指紋或視頻指紋信息樣本進(jìn)行比對從而進(jìn)行識別。然而,為了提高識別率,需要在數(shù)據(jù)庫中保存越來越多的音頻指紋或視頻指紋信息樣本,這些信息會大量占用數(shù)據(jù)庫的存儲空間,也影響待識別的多媒體信息與已有多媒體信息樣本之間匹配的速度和識別成功率。相關(guān)技術(shù)中,對于該問題,尚無有效解決方案。
【發(fā)明內(nèi)容】
[0006]有鑒于此,本發(fā)明實(shí)施例希望提供一種信息處理方法及客戶端,至少解決了現(xiàn)有技術(shù)存在的問題,從而節(jié)約了存儲空間,提高匹配速度和識別成功率。
[0007]本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0008]本發(fā)明實(shí)施例提供了一種信息處理方法,所述方法包括:
[0009]接收由第一多媒體數(shù)據(jù)或第一多媒體指紋信息構(gòu)成的待處理數(shù)據(jù),所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學(xué)特征;
[0010]將所述待處理數(shù)據(jù)以結(jié)合時(shí)域和頻域的方式進(jìn)行分析,以轉(zhuǎn)換成與其對應(yīng)的第一參數(shù)值,以基于所述第一參數(shù)值進(jìn)行參數(shù)值匹配成功后識別出與所述待處理數(shù)據(jù)對應(yīng)的目標(biāo)數(shù)據(jù);
[0011]所述第一參數(shù)值的存儲容量小于所述待處理數(shù)據(jù)的存儲容量。
[0012]較佳地,所述將所述待處理數(shù)據(jù)以結(jié)合時(shí)域和頻域的方式進(jìn)行分析,以轉(zhuǎn)換成與其對應(yīng)的第一參數(shù)值,包括:
[0013]將所述待處理數(shù)據(jù)通過采用率的變換,轉(zhuǎn)換得到采樣率為K個(gè)數(shù)據(jù)樣本/秒的第一結(jié)果,所述K為大于I的整數(shù);所述第一結(jié)果以時(shí)域的方式表示;
[0014]根據(jù)所述第一結(jié)果經(jīng)頻域的方式轉(zhuǎn)換得到所述第一參數(shù)值。
[0015]較佳地,所述將所述待處理數(shù)據(jù)通過采用率的變換,轉(zhuǎn)換得到采樣率為K個(gè)數(shù)據(jù)樣本/秒的第一結(jié)果,所述K為大于I的整數(shù),包括:
[0016]通過加窗傅立葉變換,把采集到的由一維時(shí)域表示的所述待處理數(shù)據(jù)轉(zhuǎn)換為由待處理數(shù)據(jù)構(gòu)成的二維時(shí)頻圖。
[0017]較佳地,所述根據(jù)所述第一結(jié)果經(jīng)頻域的方式轉(zhuǎn)換得到所述第一參數(shù)值,包括:
[0018]將由待處理數(shù)據(jù)構(gòu)成的所述二維時(shí)頻圖轉(zhuǎn)換為對應(yīng)的功率譜圖,所述功率譜圖用于表征待處理數(shù)據(jù)中每個(gè)時(shí)間點(diǎn)對應(yīng)的特征點(diǎn)所在的頻率值;
[0019]獲取指定特征點(diǎn)A,按照預(yù)設(shè)條件在時(shí)域上選取與所述A對應(yīng)的候選特征點(diǎn)所在的時(shí)域窗口,在所述時(shí)頻窗口中選擇主導(dǎo)的頻率分布點(diǎn)作為特征明顯的明顯特征點(diǎn);
[0020]對所述明顯特征點(diǎn)進(jìn)行哈希轉(zhuǎn)換得到所述第一哈希值;
[0021]所述第一哈希值由所述主導(dǎo)的頻率分布點(diǎn)組成。
[0022]較佳地,所述在所述時(shí)頻窗口中選擇主導(dǎo)的頻率分布點(diǎn)作為特征明顯的明顯特征點(diǎn),包括:
[0023]選取整個(gè)所述時(shí)頻窗口中頻率值最大的候選特征點(diǎn)作為所述主導(dǎo)的頻率分布點(diǎn)。
[0024]較佳地,所述在所述時(shí)頻窗口中選擇主導(dǎo)的頻率分布點(diǎn)作為特征明顯的明顯特征點(diǎn),包括:
[0025]選取整個(gè)所述時(shí)頻窗口中在所述每個(gè)時(shí)間點(diǎn)具有最大頻率值的前M個(gè)高峰點(diǎn)對應(yīng)的候選特征點(diǎn)作為所述主導(dǎo)的頻率分布點(diǎn),所述M為整數(shù)。
[0026]本發(fā)明實(shí)施例又提供了一種服務(wù)器,所述服務(wù)器包括:
[0027]接收單元,用于接收由第一多媒體數(shù)據(jù)或第一多媒體指紋信息構(gòu)成的待處理數(shù)據(jù),所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學(xué)特征;
[0028]轉(zhuǎn)換單元,用于將所述待處理數(shù)據(jù)以結(jié)合時(shí)域和頻域的方式進(jìn)行分析,以轉(zhuǎn)換成與其對應(yīng)的第一參數(shù)值,以基于所述第一參數(shù)值進(jìn)行參數(shù)值匹配成功后識別出與所述待處理數(shù)據(jù)對應(yīng)的目標(biāo)數(shù)據(jù);所述第一參數(shù)值的存儲容量小于所述待處理數(shù)據(jù)的存儲容量。
[0029]較佳地,所述轉(zhuǎn)換單元,進(jìn)一步包括:
[0030]第一轉(zhuǎn)換子單元,用于將所述待處理數(shù)據(jù)通過采用率的變換,轉(zhuǎn)換得到采樣率為K個(gè)數(shù)據(jù)樣本/秒的第一結(jié)果,所述K為大于I的整數(shù);所述第一結(jié)果以時(shí)域的方式表示;
[0031]第二轉(zhuǎn)換子單元,用于根據(jù)所述第一結(jié)果經(jīng)頻域的方式轉(zhuǎn)換得到所述第一參數(shù)值。
[0032]較佳地,所述第一轉(zhuǎn)換子單元,進(jìn)一步用于通過加窗傅立葉變換,把采集到的由一維時(shí)域表示的所述待處理數(shù)據(jù)轉(zhuǎn)換為由待處理數(shù)據(jù)構(gòu)成的二維時(shí)頻圖。
[0033]較佳地,所述第二轉(zhuǎn)換子單元,進(jìn)一步用于:
[0034]將由待處理數(shù)據(jù)構(gòu)成的所述二維時(shí)頻圖轉(zhuǎn)換為對應(yīng)的功率譜圖,所述功率譜圖用于表征待處理數(shù)據(jù)中每個(gè)時(shí)間點(diǎn)對應(yīng)的特征點(diǎn)所在的頻率值;
[0035]獲取指定特征點(diǎn)A,按照預(yù)設(shè)條件在時(shí)域上選取與所述A對應(yīng)的候選特征點(diǎn)所在的時(shí)域窗口,在所述時(shí)頻窗口中選擇主導(dǎo)的頻率分布點(diǎn)作為特征明顯的明顯特征點(diǎn);
[0036]對所述明顯特征點(diǎn)進(jìn)行哈希轉(zhuǎn)換得到所述第一哈希值;
[0037]所述第一哈希值由所述主導(dǎo)的頻率分布點(diǎn)組成。
[0038]較佳地,所述第二轉(zhuǎn)換子單元,進(jìn)一步用于選取整個(gè)所述時(shí)頻窗口中頻率值最大的候選特征點(diǎn)作為所述主導(dǎo)的頻率分布點(diǎn)。
[0039]較佳地,所述第二轉(zhuǎn)換子單元,進(jìn)一步用于選取整個(gè)所述時(shí)頻窗口中在所述每個(gè)時(shí)間點(diǎn)具有最大頻率值的前M個(gè)高峰點(diǎn)對應(yīng)的候選特征點(diǎn)作為所述主導(dǎo)的頻率分布點(diǎn),所述M為整數(shù)。
[0040]本發(fā)明實(shí)施例的信息處理方法包括:接收由第一多媒體數(shù)據(jù)或第一多媒體指紋信息構(gòu)成的待處理數(shù)據(jù),所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學(xué)特征;將所述待處理數(shù)據(jù)以結(jié)合時(shí)域和頻域的方式進(jìn)行分析,以轉(zhuǎn)換成與其對應(yīng)的第一參數(shù)值,以基于所述第一參數(shù)值進(jìn)行參數(shù)值匹配成功后識別出與所述待處理數(shù)據(jù)對應(yīng)的目標(biāo)數(shù)據(jù);所述第一參數(shù)值的存儲容量小于所述待處理數(shù)據(jù)的存儲容量。
[0041]采用本發(fā)明實(shí)施例,將所述待處理數(shù)據(jù)以結(jié)合時(shí)域和頻域的方式進(jìn)行分析,以轉(zhuǎn)換成與其對應(yīng)的第一參數(shù)值,以基于所述第一參數(shù)值進(jìn)行參數(shù)值匹配成功后識別出與所述待處理數(shù)據(jù)對應(yīng)的目標(biāo)數(shù)據(jù);所述第一參數(shù)值的存儲容量小于所述待處理數(shù)據(jù)的存儲容量,節(jié)約了存儲空間,從而提高了匹配速度和識別成功率。
【附圖說明】
[0042]圖1為本發(fā)明方法實(shí)施例一的一個(gè)實(shí)現(xiàn)流程示意圖;
[0043]圖2為本發(fā)明客戶端實(shí)施例一的一個(gè)組成結(jié)構(gòu)示意圖;
[0044]圖3為本發(fā)明服務(wù)器實(shí)施例一的一個(gè)組成結(jié)構(gòu)示意圖;
[0045]圖4為應(yīng)用本發(fā)明實(shí)施例的服務(wù)器的硬件示例結(jié)構(gòu)圖;<