圖片識別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種圖片識別方法和裝置。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)的信息傳播速度非???,一旦出現(xiàn)色情廣告等非法圖片,如果不能采用有效的方法遏制其傳播,可能造成非法圖片的泛濫,極大地?fù)p害互聯(lián)網(wǎng)服務(wù)的體驗(yàn)。互聯(lián)網(wǎng)中傳播的非法圖片通常相近,甚至來源于固定的種子圖片,通過這些種子圖片能夠查找互聯(lián)網(wǎng)中傳播的相同或相似非法圖片,并對其刪除?,F(xiàn)有技術(shù)主要依靠人工巡檢去發(fā)現(xiàn)這些種子圖片,并收集這些種子圖片以進(jìn)行互聯(lián)網(wǎng)中非法圖片的刪除。收集種子圖片的過程需要投入大量的人力,并且由于互聯(lián)網(wǎng)信息量龐大,通過人工巡檢的方法收集非法圖片的速度較慢,無法有效遏制互聯(lián)網(wǎng)中非法圖片的傳播。
[0003]針對上述的收集非法圖片的種子圖片的效率比較低的問題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供了一種圖片識別方法和裝置,以至少解決收集非法圖片的種子圖片的效率比較低的技術(shù)問題。
[0005]根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種圖片識別方法,包括:接收客戶端指示的待識別圖片和標(biāo)識;判斷所述標(biāo)識是否指示對所述待識別圖片進(jìn)行識別;若判斷出所述標(biāo)識指示對所述待識別圖片進(jìn)行識別,則將所述待識別圖片與圖片庫中記錄的需要?jiǎng)h除的圖片的種子圖片進(jìn)行比較;如果所述圖片庫中存在與所述待識別圖片相同的所述種子圖片,則丟棄所述待識別圖片;如果所述圖片庫中不存在與所述待識別圖片相同的所述種子圖片、但存在與所述待識別圖片的相似度大于第一預(yù)定閾值的所述種子圖片,則將所述待識別圖片作為需要?jiǎng)h除的圖片的種子圖片存儲在所述圖片庫中。
[0006]根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種圖片識別裝置,包括:接收單元,用于接收客戶端發(fā)送的待識別圖片和標(biāo)識;第一判斷單元,用于判斷所述標(biāo)識是否指示對所述待識別圖片進(jìn)行識別;比較單元,用于在判斷出所述標(biāo)識指示對所述待識別圖片進(jìn)行識別時(shí),將所述待識別圖片與圖片庫中記錄的需要?jiǎng)h除的圖片的種子圖片進(jìn)行比較;丟棄單元,用于在所述圖片庫中存在與所述待識別圖片相同的所述種子圖片時(shí),丟棄所述待識別圖片;第一存儲單元,用于在所述圖片庫中不存在與所述待識別圖片相同的所述種子圖片、但存在與所述待識別圖片的相似度大于第一預(yù)定閾值的所述種子圖片時(shí),將所述待識別圖片作為需要?jiǎng)h除的圖片的種子圖片存儲在所述圖片庫中。
[0007]在本發(fā)明實(shí)施例中,通過接收客戶端指示的待識別圖片,并根據(jù)待識別圖片與圖片庫中存儲的種子圖片進(jìn)行比較,當(dāng)待識別圖片與種子圖片的相似度大于第一預(yù)定閾值時(shí),將待識別圖片存儲在圖片庫中。由于待識別圖片由客戶端發(fā)送,客戶端又分布在互聯(lián)網(wǎng)的各個(gè)地方,因此通過接收客戶端的待識別圖片來收集種子圖片的速度遠(yuǎn)遠(yuǎn)大于人工巡檢發(fā)現(xiàn)種子圖片的速度,提高了收集種子圖片的效率。另外,在將待識別圖片存儲在圖片庫中之前先進(jìn)行去重處理,避免了在圖片庫中重復(fù)存儲圖片,從而解決了收集非法圖片的種子圖片的效率比較低的技術(shù)問題,進(jìn)而達(dá)到了提高收集種子圖片的效率的技術(shù)效果。
【附圖說明】
[0008]此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0009]圖1是根據(jù)本發(fā)明實(shí)施例的硬件結(jié)構(gòu)圖;
[0010]圖2是根據(jù)本發(fā)明實(shí)施例的圖片識別方法的流程圖;
[0011]圖3是根據(jù)本發(fā)明實(shí)施例的舉報(bào)圖片a的界面圖;
[0012]圖4是根據(jù)本發(fā)明實(shí)施例的將待識別圖片與圖片庫中記錄的需要?jiǎng)h除圖片的種子圖片進(jìn)行比較的流程圖;
[0013]圖5是根據(jù)本發(fā)明實(shí)施例的系統(tǒng)架構(gòu)模塊圖:
[0014]圖6是根據(jù)本發(fā)明實(shí)施例的圖片識別裝置的示意圖;
[0015]圖7是根據(jù)本發(fā)明實(shí)施例的執(zhí)行單元的示意圖;以及
[0016]圖8是根據(jù)本發(fā)明實(shí)施例的服務(wù)器的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0017]為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
[0018]需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤4送?,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0019]名詞解釋:
[0020]非法圖片包括網(wǎng)絡(luò)傳播的色情廣告、詐騙廣告等有損互聯(lián)網(wǎng)環(huán)境的不合法的圖片。
[0021]種子圖片包括互聯(lián)網(wǎng)中傳播的非法圖片通常相近,能夠表征與其他一個(gè)或者多個(gè)圖片為相同或者相似的圖片。
[0022]實(shí)施例1
[0023]根據(jù)本發(fā)明實(shí)施例,提供了一種可以通過本申請裝置實(shí)施例執(zhí)行的方法實(shí)施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組可執(zhí)行指令的服務(wù)器中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0024]根據(jù)本發(fā)明實(shí)施例,提供了一種圖片的識別方法。
[0025]可選地,在本實(shí)施例中,上述圖片的識別方法可以應(yīng)用于如圖1所示的終端101和服務(wù)器102構(gòu)成的硬件環(huán)境中。如圖1所示,終端101通過網(wǎng)絡(luò)與服務(wù)器102進(jìn)行連接,上述網(wǎng)絡(luò)包括但不限于:廣域網(wǎng)、城域網(wǎng)或局域網(wǎng),終端101可以是手機(jī)、PC、筆記本或者平板電腦等,在終端101上安裝的瀏覽器、即時(shí)通訊工具、微博等應(yīng)用程序可以作為本實(shí)施例中的客戶端。
[0026]圖2是根據(jù)本發(fā)明實(shí)施例的圖片的識別方法的流程圖。如圖所示,該圖片的識別方法包括如下步驟:
[0027]步驟S202,接收客戶端指示的待識別圖片和標(biāo)識;
[0028]步驟S204,判斷標(biāo)識是否指示對待識別圖片進(jìn)行識別;
[0029]步驟S206,若判斷出標(biāo)識指示對待識別圖片進(jìn)行識別,則將待識別圖片與圖片庫中記錄的需要?jiǎng)h除的圖片的種子圖片進(jìn)行比較;
[0030]步驟S208,如果圖片庫中存在與待識別圖片相同的種子圖片,則丟棄待識別圖片;
[0031]步驟S210,如果圖片庫中不存在與待識別圖片相同的種子圖片、但存在與待識別圖片的相似度大于第一預(yù)定閾值的種子圖片,則將待識別圖片作為需要?jiǎng)h除的圖片的種子圖片存儲在圖片庫中。
[0032]在本實(shí)施例中,通過接收客戶端指示的待識別圖片,并根據(jù)待識別圖片與圖片庫中存儲的種子圖片進(jìn)行比較,當(dāng)待識別圖片與種子圖片的相似度大于第一預(yù)定閾值時(shí),將待識別圖片存儲在圖片庫中。由于待識別圖片由客戶端發(fā)送,客戶端又分布在互聯(lián)網(wǎng)的各個(gè)地方,因此通過接收客戶端的待識別圖片來收集種子圖片的速度遠(yuǎn)遠(yuǎn)大于人工巡檢發(fā)現(xiàn)種子圖片的速度,提高了收集種子圖片的效率。另外,在將待識別圖片存儲在圖片庫中之前先進(jìn)行去重處理,也就是先判斷圖片庫中是否已經(jīng)存儲由該待識別圖片,如果圖片庫中已經(jīng)存在與該待識別圖片相同的種子圖片,則不再將該待識別圖片存儲在圖片庫中,如果圖片庫中沒有,并且該待識別圖片與圖片庫中的種子圖片的相似度大于第一預(yù)定閾值,則將該待識別圖片存儲在圖片庫中,避免了在圖片庫中重復(fù)存儲相同的圖片作為種子圖片。
[0033]具體地,接收客戶端發(fā)送的待識別圖片和標(biāo)識包括:接收安裝在PC上的瀏覽器客戶端、安裝在PC上的應(yīng)用客戶端、安裝在移動(dòng)終端上的瀏覽器客戶端、安裝在移動(dòng)終端上的應(yīng)用客戶端中的一個(gè)發(fā)送的待識別圖片的網(wǎng)址和標(biāo)識;按照網(wǎng)址從服務(wù)器中獲取待識別圖片。
[0034]通過網(wǎng)絡(luò)在客戶端中傳播的圖片都會具有一個(gè)對應(yīng)到服務(wù)器的網(wǎng)址,將該網(wǎng)址發(fā)送給服務(wù)器后,服務(wù)器會根據(jù)網(wǎng)址查找待識別圖片,客戶端向服務(wù)器傳輸網(wǎng)址而不是圖片本身能夠節(jié)省網(wǎng)絡(luò)資源,另外,由于待識別圖片就存儲在服務(wù)器中,服務(wù)器按照網(wǎng)址查找即可,避免接收客戶端發(fā)送的圖片再存儲在服務(wù)器中,造成同一圖片的重復(fù)存儲,從而避免服務(wù)器的緩存空間被過多占用。
[0035]具體地,圖片庫可以存儲在服務(wù)器102中,客戶端可以提供發(fā)送待識別圖片的入口,通過該入口客戶端將待識別圖片發(fā)送給服務(wù)器102,以便于服務(wù)器判斷是否將該待識別圖片存儲在圖片庫中。該入口可以發(fā)送多種圖片,并不是所有的圖片都需要存儲在圖片庫中,通過標(biāo)識可以判斷是否需要對該待識別圖片進(jìn)行識別,并進(jìn)一步判斷是否將該待識別圖片存儲在圖片庫中。如果圖片庫中不存在于該待識別圖片相同的種子圖片,但是存在與該待識別圖片的相似度大于第一預(yù)定閾值的種子圖片,說明該待識別圖片為可以存儲在圖片庫中的圖片,則將該待識別圖片存儲在圖片庫中。在計(jì)算待識別圖片與種子圖片的相似度時(shí),可以通過對比兩張圖片的像素來進(jìn)行相似度的判斷,當(dāng)然,本實(shí)施例還可以采用其他方式進(jìn)行相似度的判斷,本實(shí)施例并不限于上述相似度判斷的方式。
[0036]客戶端在展示圖片時(shí),通常具有舉報(bào)、點(diǎn)贊、評論等功能作為發(fā)送圖片的入口,客戶端可以將舉報(bào)、點(diǎn)贊、評論等信息都發(fā)送給服務(wù)器,為了使得服務(wù)器從這些信息中區(qū)分哪些是可以被識別并存儲在圖片庫中的圖片。對客戶端發(fā)送給服務(wù)器的信息設(shè)置標(biāo)識,如被舉報(bào)的信息的標(biāo)識為R,被評論的信息的標(biāo)識為C,被點(diǎn)贊的信息的標(biāo)識為P。當(dāng)服務(wù)器102接收到圖片和標(biāo)識“R”之后,即確定該接收到的圖片為被舉報(bào)的圖片,也即接收到了對接收到的圖片進(jìn)行識別的指示。
[0037]例如,圖片庫中存儲了色情暴力圖片的種子圖片,客戶端展示的圖片為圖片a,該圖片a被客戶端舉報(bào)給服務(wù)器102,服務(wù)器102從接收到的信息中接收到圖片a和標(biāo)識“R”,服務(wù)器102將圖片a與圖片庫中的種子圖片進(jìn)行比較。如果圖片庫中有一張圖片與圖片a相同,為了不重復(fù)存儲相同的圖片,將圖片a丟棄;如果圖片庫中沒有與圖片a相同的圖片,但是圖片a與圖片庫中的一張種子圖片的相似度大于90%,則確定該圖片a為色情暴力圖片,并將圖片a存儲在圖片庫中作為色情暴力圖片的種子圖片。需要說明的是,如果服務(wù)器具有刪除圖片a的權(quán)限,當(dāng)確定圖片a與圖片庫中的一張圖片相同時(shí),可以將圖片a刪除,使圖片a不再通過網(wǎng)絡(luò)傳播。
[0038]具體地,客戶端向服務(wù)器舉報(bào)圖片a時(shí)可以顯示如圖3所示的界面,在該界面上展示有被舉報(bào)的圖片a的圖片類型,如色情暴力、騷擾謾罵、廣告欺詐