圖片的源相機型號的識別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理領(lǐng)域,具體而言,涉及一種圖片的源相機型號的識別方法和
目.ο
【背景技術(shù)】
[0002]如今,隨著數(shù)字成像技術(shù)的發(fā)展和數(shù)碼相機的普及,在今天的日常生活中,數(shù)字圖像的使用已經(jīng)變得越來越普遍。數(shù)字圖像被許多政府、法律、科學(xué)和新聞媒體組織用來作為做出某些重要決定的攝影證據(jù)。另一方面,隨著圖像編輯軟件的普及,以隱藏某些真相或事實為目的的數(shù)字圖像的創(chuàng)建和操縱已經(jīng)變得更加容易。在這種情況下,當圖像被用來作為證據(jù)時,圖像認證和圖像完整性驗證成為一項重要任務(wù)。
[0003]圖像取證就是一個涉及到這兩個問題的新興領(lǐng)域。所謂“圖像認證”是指識別圖像的來源設(shè)備,如某型號的照相機、某款軟件等等?!皥D像完整性驗證”是確定數(shù)字圖像是否被操縱、以及如何被操縱的。源相機識別有很多應(yīng)用。比如,識別法庭上證據(jù)圖像的原始來源、找到在版權(quán)糾紛案件中,攝影作品的真正主人等等。因此,在這樣的背景之下,圖像的源相機識別技術(shù)有著極大的市場,各國學(xué)者也在這一領(lǐng)域做了許多研究工作。
[0004]近年來,圖像的源相機識別技術(shù)有了長足的發(fā)展。最簡單的源相機識別方法是利用圖像的標題。因為圖像來源的相關(guān)信息,例如相機的品牌、型號、拍攝日期和時間都嵌入在標題中。但是,圖像的標題在實際應(yīng)用中很容易被操作,是極為不可靠的。
[0005]此外,還可以嘗試在圖像中嵌入一個半透明的水印,在水印中加入例如相機品牌、型號和時間等相關(guān)信息。直接在圖像中插入水印看起來似乎是解決源相機識別的一種非常簡單而且直觀的方法。但是,水印需要在圖像的創(chuàng)建期間加入,這使得數(shù)碼相機的設(shè)計更加復(fù)雜,并且增加了生產(chǎn)成本。事實上,現(xiàn)今捕捉的大部分圖像并不包含數(shù)字水印。
[0006]通常數(shù)碼相機獲取圖像的過程如下:首先外界光線穿過鏡頭、抗混疊濾波器和顏色過濾器模組,之后半導(dǎo)體光線傳感器把光信號轉(zhuǎn)換成電子信號,之后的后期處理操作包括伽瑪校正、去馬賽克、圖像校正、白平衡和JPEG壓縮。以上這些步驟,包括后期處理步驟都是在圖像存儲之前進行的。在圖像采集過程中,硬件和軟件都可能會在圖像中留下痕跡。這些獨一無二的痕跡可以被用來識別成像相機。相比基于圖像標題和水印的方法,依賴于圖像采集過程的源相機識別方法無疑更加可靠與實用。
[0007]基于圖像采集過程的方法首先提取圖像特征,這些特征包括在圖像采集過程中,由硬件或軟件留下的特定指紋。之后把識別看作一個分類問題。由硬件留下的指紋包括噪聲模式、透鏡徑向畸變、色差、傳感器灰塵等等;由軟件留下的相關(guān)指紋包括與圖像相關(guān)的各種特征、由濾色器模組引入的特征等等。
[0008]提取圖像特征之后,訓(xùn)練監(jiān)督性分類器來執(zhí)行源相機識別任務(wù)。支持向量機一般是最常用的分類器,因為即使是在特征維數(shù)與訓(xùn)練數(shù)據(jù)集大小相當或比訓(xùn)練數(shù)據(jù)集大的時候,支持向量機的性能仍然很好,而且能夠比較好地解決過擬合問題。
[0009]不過,支持向量機方法適用于均衡訓(xùn)練數(shù)據(jù)集,在訓(xùn)練數(shù)據(jù)集存在不均衡類分布時,支持向量機分類器表現(xiàn)欠佳。在不均衡訓(xùn)練數(shù)據(jù)集情況下,由支持向量機產(chǎn)生的決策邊界往往偏向于多數(shù)類,少數(shù)類實例很有可能被誤診。因此,如何在不均衡數(shù)據(jù)訓(xùn)練集的情況下準確地對圖像進行源相機識別,在近年來成為研究的熱點之一。
[0010]綜上所述,目前針對不均衡數(shù)據(jù)訓(xùn)練集的圖片的源相機型號的識別,仍然是亟待解決的問題之一,也是研究的熱點之一。
[0011 ]針對相關(guān)技術(shù)針對不均衡數(shù)據(jù)訓(xùn)練集無法識別圖片的源相機型號的問題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0012]本發(fā)明實施例提供了一種圖片的源相機型號的識別方法和裝置,以至少解決相關(guān)技術(shù)針對不均衡數(shù)據(jù)訓(xùn)練集無法識別圖片的源相機型號的技術(shù)問題。
[0013]根據(jù)本發(fā)明實施例的一個方面,提供了一種圖片的源相機型號的識別方法,包括:對圖片樣本集中的第一類圖片樣本進行過采樣處理,其中,第一類圖片樣本的數(shù)量遠小于圖片樣本集中其他類圖片樣本的數(shù)量,圖片樣本集中的圖片樣本與源相機型號存在對應(yīng)關(guān)系;提取經(jīng)過過采樣處理后的圖片樣本集中每個圖片樣本的特征;使用每個圖片樣本的特征與每個圖片樣本對應(yīng)的源相機型號構(gòu)建支持向量機分類器;以及利用支持向量機分類器識別待識別圖片的源相機型號。
[0014]進一步地,對圖片樣本集中的第一類圖片樣本進行過采樣處理包括:從第一類圖片樣本中選取第一圖片樣本和第二圖片樣本,其中,第二圖片樣本是第一類圖片樣本中距離第一圖片樣本最近的圖片樣本;以及在第一圖片樣本和第二圖片樣本之間的連線上選取一點作為新合成的第一類圖片樣本中的圖片樣本。
[0015]進一步地,提取經(jīng)過過采樣處理后的圖片樣本集中每個圖片樣本的特征包括:在硬件構(gòu)件或者軟件紋路上從每個圖片樣本的圖像中提取特征,其中,特征至少包括以下任意一種特征:平均像素值、紅綠藍相關(guān)對、鄰居分布質(zhì)心、紅綠藍對能量比例、小波域統(tǒng)計數(shù)據(jù)以及圖像質(zhì)量指標。
[0016]進一步地,使用每個圖片樣本的特征與每個圖片樣本對應(yīng)的源相機型號構(gòu)建支持向量機分類器包括:將每個圖片樣本的特征構(gòu)造成特征矢量集合,其中,特征矢量集合中包括至少一對類別樣本的特征向量,類別樣本為已知源相機型號的圖片樣本;使用至少一對類別樣本的特征向量訓(xùn)練二分類支持向量機;以及根據(jù)訓(xùn)練后的二分類支持向量機構(gòu)建支持向量機分類器。
[0017]進一步地,利用支持向量機分類器識別待識別圖片的源相機型號包括:提取待識別圖片的特征;將待識別圖片的特征輸入至支持向量機分類器,得到待識別圖片對應(yīng)的聚合的支持向量機識別結(jié)果;以及對聚合的支持向量機識別結(jié)果使用投票策略,獲取待識別圖片的源相機型號。
[0018]根據(jù)本發(fā)明實施例的另一方面,還提供了一種圖片的源相機型號的識別裝置,包括:過采樣模塊,用于對圖片樣本集中的第一類圖片樣本進行過采樣處理,其中,第一類圖片樣本的數(shù)量遠小于圖片樣本集中其他類圖片樣本的數(shù)量,圖片樣本集中的圖片樣本與源相機型號存在對應(yīng)關(guān)系;提取模塊,用于提取經(jīng)過過采樣處理后的圖片樣本集中每個圖片樣本的特征;構(gòu)建模塊,用于使用每個圖片樣本的特征與每個圖片樣本對應(yīng)的源相機型號構(gòu)建支持向量機分類器;以及識別模塊,用于利用支持向量機分類器識別待識別圖片的源相機型號。
[0019]進一步地,過采樣模塊包括:第一選取模塊,用于從第一類圖片樣本中選取第一圖片樣本和第二圖片樣本,其中,第二圖片樣本是第一類圖片樣本中距離第一圖片樣本最近的圖片樣本;以及第二選取模塊,用于在第一圖片樣本和第二圖片樣本之間的連線上選取一點作為新合成的第一類圖片樣本中的圖片樣本。
[0020]進一步地,提取模塊包括:第一子提取模塊,用于在硬件構(gòu)件或者軟件紋路上從每個圖片樣本的圖像中提取特征,其中,特征至少包括以下任意一種特征:平均像素值、紅綠藍相關(guān)對、鄰居分布質(zhì)心、紅綠藍對能量比例、小波域統(tǒng)計數(shù)據(jù)以及圖像質(zhì)量指標。
[0021]進一步地,構(gòu)建模塊包括:構(gòu)造模塊,用于將每個圖片樣本的特征構(gòu)造成特征矢量集合,其中,特征矢量集合中包括至少一對類別樣本的特征向量,類別樣本為已知源相機型號的圖片樣本;訓(xùn)練模塊,用于使用至少一對類別樣本的特征向量訓(xùn)練二分類支持向量機;以及第一子構(gòu)建模塊,用于根據(jù)訓(xùn)練后的二分類支持向量機構(gòu)建支持向量機分類器。
[0022]進一步地,識別模塊包括:第一子提取模塊,用于提取待識別圖片的特征;輸入模塊,用于將待識別圖片的特征輸入至支持向量機分類器,得到待識別圖片對應(yīng)的聚合的支持向量機識別結(jié)果;以及獲取模塊,用于對聚合的支持向量機識別結(jié)果使用投票策略,獲取待識別圖片的源相機型號。
[0023]在本發(fā)明實施例中,通過對圖片樣本集中的第一類圖片樣本進行過采樣處理,其中,第一類圖片樣本的數(shù)量遠小于圖片樣本集中其他類圖片樣本的數(shù)量,圖片樣本集中的圖片樣本與源相機型號存在對應(yīng)關(guān)系;提取經(jīng)過過采樣處理后的圖片樣本集中每個圖片樣本的特征;使用每個圖片樣本的特征與每個圖片樣本對應(yīng)的源相機型號構(gòu)建支持向量機分類器;以及利用支持向量機分類器識別待識別圖片的源相機型號,解決了相關(guān)技術(shù)針對不均衡數(shù)據(jù)訓(xùn)練集無法識別圖片的源相機型號的技術(shù)問題,實現(xiàn)了提高圖片的源相機型號的識別精度的技術(shù)效果。