两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于識別圖像內(nèi)容的方法和裝置制造方法

文檔序號:6492417閱讀:379來源:國知局
用于識別圖像內(nèi)容的方法和裝置制造方法
【專利摘要】本發(fā)明的各實施方式涉及用于識別圖像內(nèi)容的方法和裝置。在本發(fā)明的一個實施方式中,提供了一種用于識別圖像內(nèi)容的方法,包括:向用戶提供至少第一圖像配對和第二圖像配對;獲取來自用戶的第一答案和第二答案,其中第一答案和第二答案分別指示用戶針對第一圖像配對和第二圖像配對中的圖像內(nèi)容是否相同的判斷;以及響應(yīng)于第一答案符合預(yù)定答案,修改第二圖像配對的權(quán)重。在本發(fā)明的另一實施方式中,提供了一種用于識別圖像內(nèi)容的裝置。
【專利說明】用于識別圖像內(nèi)容的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的各實施方式涉及圖像識別,更具體地,涉及利用集體智慧(CollectiveIntelligence)來用于識別圖像內(nèi)容的方法和裝置。
【背景技術(shù)】
[0002]長期以來,圖像識別一直是數(shù)字圖像技術(shù)中的一個研究重點。目前已經(jīng)開發(fā)出針對各種圖像內(nèi)容進行識別的算法。然而,識別圖像內(nèi)容的一個難題在于,由于拍攝角度、光照條件、或者抖動等因素的干擾,圖像識別算法并不總是能夠獲得期望的結(jié)果。另外,例如當圖像中的對象是隨著年齡不斷增長的人(或者隨著日常使用逐漸磨損的物品)時,圖像識別算法可能并不能正確識別出針對相同對象在不同時間拍攝的圖像(例如,針對同一人物的、分別在3歲和10歲拍攝的照片)。
[0003]在識別圖像內(nèi)容方面,人類具有敏銳的觀察力和判斷力,目前的計算機還不能完全模擬人腦對于圖像等信息的處理能力。例如,在判斷兩個圖像的內(nèi)容是否是針對相同人物/事物的圖像時,人眼和人腦往往能抓住圖像中的某些細節(jié)、或者將圖像整體進行比較,即使在兩個圖像拍攝角度、光線和拍攝年代均不相同的情況下,也能夠找到圖像中的相似點,進而得出兩個圖像是針對相同人物/事務(wù)拍攝的圖像這一結(jié)論。因而,期望將人類所特有的智慧引入圖像識別技術(shù)中。
[0004]此外,個人計算設(shè)備(例如包括固定式和可移動計算設(shè)備)的發(fā)展向普通用戶提供了強大的計算能力;并且隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,個人計算設(shè)備的數(shù)據(jù)通信能力越來越強,幾乎能夠隨時通過網(wǎng)絡(luò)訪問自己所需的各種資源。目前已經(jīng)出現(xiàn)了可以在聯(lián)網(wǎng)的個人計算設(shè)備處于空閑狀態(tài)時,利用這些個人計算設(shè)備的處理能力的應(yīng)用,并逐步開發(fā)出支持“云計算”、“運處理”等功能的應(yīng)用。個人計算設(shè)備和網(wǎng)絡(luò)技術(shù)的發(fā)展,為通過個人計算設(shè)備調(diào)用廣大用戶的集體智慧來輔助進行圖像識別,提供了硬件上的可能性。

【發(fā)明內(nèi)容】

[0005]因而,期望能夠開發(fā)出一種基于廣大用戶的集體智慧來輔助進行圖像識別的技術(shù)方案。并且期望該技術(shù)方案能夠盡量不干擾普通用戶對于個人計算設(shè)備的正常使用體驗,并且在盡可能少地造成用戶額外勞動的情況下,達到利用廣大用戶的集體智慧輔助進行圖像識別的目的。
[0006]在本發(fā)明的一個實施方式中,提供了一種用于識別圖像內(nèi)容的方法,包括:向用戶提供至少第一圖像配對和第二圖像配對;獲取來自用戶的第一答案和第二答案,其中第一答案和第二答案分別指示用戶針對第一圖像配對和第二圖像配對中的圖像內(nèi)容是否相同的判斷;以及響應(yīng)于第一答案符合預(yù)定答案,修改第二圖像配對的權(quán)重。
[0007]在本發(fā)明的一個實施方式中,進一步包括:響應(yīng)于第二圖像配對的權(quán)重到達預(yù)定權(quán)重,判斷第二圖像配對中的圖像內(nèi)容是相同的。
[0008]在本發(fā)明的一個實施方式中,第一圖像配對選自其中存儲已知圖像內(nèi)容是否相同的圖像配對的第一數(shù)據(jù)庫,以及第二圖像配對選自其中存儲未知圖像內(nèi)容是否相同的圖像配對的第二數(shù)據(jù)庫。
[0009]在本發(fā)明的一個實施方式中,提供了一種用于識別圖像內(nèi)容的裝置,包括:提供模塊,配置用于向用戶提供至少第一圖像配對和第二圖像配對;獲取模塊,配置用于獲取來自用戶的第一答案和第二答案,其中第一答案和第二答案分別指示用戶針對第一圖像配對和第二圖像配對中的圖像內(nèi)容是否相同的判斷;以及修改模塊,配置用于響應(yīng)于第一答案符合預(yù)定答案,修改第二圖像配對的權(quán)重。
[0010]在本發(fā)明的一個實施方式中,進一步包括:判斷模塊,配置用于響應(yīng)于第二圖像配對的權(quán)重到達預(yù)定權(quán)重,判斷第二圖像配對中的圖像內(nèi)容是相同的。
[0011]在本發(fā)明的一個實施方式中,第一圖像配對選自其中存儲已知圖像內(nèi)容是否相同的圖像配對的第一數(shù)據(jù)庫,以及第二圖像配對選自其中存儲未知圖像內(nèi)容是否相同的圖像配對的第二數(shù)據(jù)庫。
[0012]采用根據(jù)本發(fā)明的各實施方式提供的方法和裝置,可以通過個人計算設(shè)備向用戶提供圖像配對,并獲取用戶針對該圖像配對中的圖像內(nèi)容是否相同的判斷,繼而基于來自廣大用戶的判斷來輔助圖像識別。進一步,通過將提供圖像配對并獲得判斷結(jié)果的方案來代替現(xiàn)有技術(shù)中進行安全登錄時的驗證碼方案,在實現(xiàn)驗證碼功能的同時還可以適用于基于集體智慧識別圖像內(nèi)容。
【專利附圖】

【附圖說明】
[0013]結(jié)合附圖并參考以下詳細說明,本發(fā)明各實施方式的特征、優(yōu)點及其他方面將變得更加明顯,在此以示例性而非限制性的方式示出了本發(fā)明的若干實施方式。在附圖中:
[0014]圖1示意性示出了適于實現(xiàn)本發(fā)明實施方式的示例性計算系統(tǒng)的框圖;
[0015]圖2示意性示出了根據(jù)一個解決方案的用戶登錄界面的示意圖;
[0016]圖3示意性示出了根據(jù)本發(fā)明一個實施方式的用戶界面的示意圖;
[0017]圖4示意性示出了根據(jù)本發(fā)明一個實施方式的用于識別圖像內(nèi)容的方法的流程圖;
[0018]圖5示意性示出了根據(jù)本發(fā)明一個實施方式的用于識別圖像內(nèi)容的系統(tǒng)的架構(gòu)圖;
[0019]圖6A和圖6B分別示意性示出了根據(jù)本發(fā)明一個實施方式的圖像節(jié)點和圖像配對節(jié)點的數(shù)據(jù)結(jié)構(gòu)的示意圖;以及
[0020]圖7示意性示出了根據(jù)本發(fā)明一個實施方式的用于識別圖像內(nèi)容的裝置的框圖?!揪唧w實施方式】
[0021]應(yīng)當注意,在本發(fā)明上下文中所述的識別圖像內(nèi)容是指,識別兩個圖像中的對象是否是相同的人物或事物。例如,圖像A包括一個3歲兒童的正面頭像,而圖像B包括一個10歲兒童的側(cè)面半身像,此時盡管兩個圖像的像素內(nèi)容并不一樣,然而由于兩個圖像是針對同一名兒童在不同年代拍攝的照片,因而應(yīng)當認為圖像A和圖像B的內(nèi)容是相同的。又例如,相同物品在不同狀態(tài)下的外觀可能會發(fā)生顯著變化(例如,一個圖像包括撐開的雨傘,而另一圖像包括被收起的雨傘),單純采用數(shù)字圖像處理技術(shù)很難識別出兩個圖像中內(nèi)容的相似性。然而,人眼卻可以通過雨傘的顏色和花紋等很容易地判斷兩個圖像中的雨傘是否相同。
[0022]識別圖像內(nèi)容是否相同的應(yīng)用范圍廣泛并且意義巨大,目前社會實踐中存在需要判斷圖像內(nèi)容是否相同的各種情況。例如,人們在遺失物品時可能會在失物招領(lǐng)論壇中張貼例如包括物品照片和自己聯(lián)系方式的尋物啟事,另一方面,論壇工作人員會在論壇中定期更新被撿到物品的照片列表。然而,由于失主可能不會逐一查看物品列表,因而沒有發(fā)現(xiàn)自己所遺失的物品已經(jīng)被送到了失物招領(lǐng)處。此時,如果能夠識別出丟失物品和招領(lǐng)物品是否相同,則可以盡快通知失主。
[0023]另外,目前已經(jīng)存在專門幫助走失兒童家長尋找孩子的機構(gòu),這些機構(gòu)具有由大量的走失兒童家長提供的照片和普通群眾拍攝的流浪兒童的照片,如何在這兩類照片之間尋找聯(lián)系也需要借助于圖像內(nèi)容識別。此外,圖像內(nèi)容識別對于搜索通緝犯、尋找走失寵物等方面也是有益的。應(yīng)當注意,在本發(fā)明的各個實施方式中,認為全部圖像的內(nèi)容和來源都是合法的,圖像中并不存在不易公開的信息,對于圖像信息的使用也不違背使用本發(fā)明所述的技術(shù)方案的國家/地區(qū)的法律。
[0024]下面將參照附圖更詳細地描述本公開的優(yōu)選實施方式。雖然附圖中顯示了本公開的優(yōu)選實施方式,然而應(yīng)該理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施方式所限制。相反,提供這些實施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
[0025]圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算系統(tǒng)100的框圖。如圖1所示,計算機系統(tǒng)100可以包括:CPU(中央處理單元)101、RAM(隨機存取存儲器)102、ROM(只讀存儲器)103、系統(tǒng)總線104、硬盤控制器105、鍵盤控制器106、串行接口控制器107、并行接口控制器108、顯示控制器109、硬盤110、鍵盤111、串行外部設(shè)備112、并行外部設(shè)備113和觸摸屏顯示器114。在這些設(shè)備中,與系統(tǒng)總線104耦合的有CPUlOl、RAM102、R0M103、硬盤控制器105、鍵盤控制器106、串行控制器107、并行控制器108和顯示控制器109。硬盤110與硬盤控制器105耦合,鍵盤111與鍵盤控制器106耦合,串行外部設(shè)備112與串行接口控制器107耦合,并行外部設(shè)備113與并行接口控制器108耦合,以及觸摸屏顯示器114與顯示控制器109耦合。應(yīng)當理解,圖1所示的結(jié)構(gòu)框圖僅僅是為了示例的目的,而不是對本發(fā)明范圍的限制。在某些情況下,可以根據(jù)具體情況增加或減少某些設(shè)備。
[0026]所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本發(fā)明可以實現(xiàn)為系統(tǒng)、方法或計算機程序產(chǎn)品。因此,本公開可以具體實現(xiàn)為以下形式,即:可以是完全的硬件、也可以是完全的軟件(包括固件、駐留軟件、微代碼等),還可以是硬件和軟件結(jié)合的形式,本文一般稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實施方式中,本發(fā)明還可以實現(xiàn)為在一個或多個計算機可讀介質(zhì)中的計算機程序產(chǎn)品的形式,該計算機可讀介質(zhì)中包含計算機可讀的程序代碼。
[0027]可以采用一個或多個計算機可讀的介質(zhì)的任意組合。計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)例如可以是一但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
[0028]計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
[0029]計算機可讀介質(zhì)上包含的程序代碼可以用任何適當?shù)慕橘|(zhì)傳輸,包括一但不限于一無線、電線、光纜、RF等等,或者上述的任意合適的組合。
[0030]可以以一種或多種程序設(shè)計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機程序代碼,所述程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言-諸如Java、Smalltalk、C++,還包括常規(guī)的過程式程序設(shè)計語言-諸如“C”語言或類似的程序設(shè)計語言。程序代碼可以完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務(wù)器上執(zhí)行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)-連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
[0031]下面將參照本發(fā)明實施方式的方法、裝置(系統(tǒng))和計算機程序產(chǎn)品的流程圖和/或框圖描述本發(fā)明。應(yīng)當理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計算機程序指令實現(xiàn)。這些計算機程序指令可以提供給通用計算機、專用計算機或其他可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機器,這些計算機程序指令通過計算機或其他可編程數(shù)據(jù)處理裝置執(zhí)行,產(chǎn)生了實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的裝置。
[0032]也可以把這些計算機程序指令存儲在能使得計算機或其他可編程數(shù)據(jù)處理裝置以特定方式工作的計算機可讀介質(zhì)中,這樣,存儲在計算機可讀介質(zhì)中的指令就產(chǎn)生出一個包括實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令裝置(instructionmeans)的制造品(manufacture)。
[0033]也可以把計算機程序指令加載到計算機、其他可編程數(shù)據(jù)處理裝置、或其他設(shè)備上,使得在計算機、其他可編程數(shù)據(jù)處理裝置或其他設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計算機實現(xiàn)的過程,從而使得在計算機或其他可編程裝置上執(zhí)行的指令能夠提供實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的過程。
[0034]圖2示意性示出了根據(jù)一個解決方案的用戶登錄界面200的示意圖。登錄界面200包括:登錄信息部分210,例如,賬號“Alan”和密碼“****”;驗證碼部分220,例如,可以包括用于輸入驗證碼的文本框以及顯示驗證碼的圖像;以及登錄按鈕232和取消按鈕234。
[0035]在登錄界面中要求用戶提供驗證碼,這可以較為有效地防止惡意應(yīng)用等通過窮舉來試圖盜用用戶賬戶的情況。目前已經(jīng)由很多主流網(wǎng)站采用了通過驗證碼來提高安全性的技術(shù)方案,并且廣大用戶也已經(jīng)認可將提供驗證碼作為登錄網(wǎng)站的一部分。基于在網(wǎng)站中提供驗證碼的方案,本發(fā)明提出了一種在用戶瀏覽網(wǎng)頁期間來采集用戶針對圖像內(nèi)容的判斷進而輔助識別圖像內(nèi)容的技術(shù)方案。[0036]圖3示意性示出了根據(jù)本發(fā)明一個實施方式的用戶界面300的示意圖。例如,可以在用戶瀏覽網(wǎng)頁期間向用戶提供類似于圖3所示的用戶界面。應(yīng)當注意,在此并不限定僅在用戶訪問登錄界面時提供該用戶界面,在不影響用戶體驗的情況下,還可以在用戶登錄之前或者已經(jīng)登錄后提供該界面。此時,盡管該界面失去了替代現(xiàn)有登錄界面中驗證碼以提高安全性的功能,然而可以通過該用戶界面來采集用戶針對圖像內(nèi)容的判斷,進而實現(xiàn)利用集體智慧進行圖像識別的目的。
[0037]如圖3所示,可以向用戶提供兩個圖像配對,例如第一圖像配對(包括虛線上方的圖像A-1310和圖像A-2312)和第二圖像配對(包括虛線下方的圖像B-1320和圖像B-2322),并提示用戶通過例如復(fù)選框來輸入針對每個圖像配對中的圖像內(nèi)容是否相同的判斷結(jié)果。例如,當用戶認為圖像配對中的兩個圖像是針對相同人物/事物的圖像時,用戶可以選中復(fù)選框;否則可以不進行選擇。以此方式,用戶僅通過點擊鼠標即可實現(xiàn)輸入,而不必像現(xiàn)有技術(shù)那樣使用鍵盤輸入驗證碼,進而避免了在鼠標和鍵盤之間切換時產(chǎn)生的諸多不便。
[0038]在此實施方式中,為了既能夠?qū)崿F(xiàn)驗證碼的目的又實現(xiàn)采集用戶針對圖像配對內(nèi)容的判斷,可以向用戶提供一個已知是否匹配的圖像配對,并且提供一個未知是否匹配的圖像配對?;谝阎欠衿ヅ涞膱D像配對,可以將已知的匹配情況與從用戶采集的答案(例如,通過復(fù)選框輸入的“相同”或“不同”)進行比較,如果匹配情況與采集的答案一致,則認為用戶輸入了正確的“驗證碼”;否則,認為用戶輸入了錯誤的“驗證碼”?;谖粗欠衿ヅ涞膱D像配對,可以將從用戶采集的答案用作進行圖像內(nèi)容識別的基礎(chǔ),以此達到利用集體智慧的目的。
[0039]在本發(fā)明的一個實施方式中,提出了一種用于識別圖像內(nèi)容的方法,包括:向用戶提供至少第一圖像配對和第二圖像配對;獲取來自用戶的第一答案和第二答案,其中第一答案和第二答案分別指示用戶針對第一圖像配對和第二圖像配對中的圖像內(nèi)容是否相同的判斷;以及響應(yīng)于第一答案符合預(yù)定答案,修改第二圖像配對的權(quán)量。
[0040]在此實施方式中,圖像配對的權(quán)重是用于描述圖像配對中的兩個圖像的內(nèi)容是否相同的數(shù)值;換言之,是描述圖像配對中的兩個圖像內(nèi)容為相同的可能性的數(shù)值。權(quán)重例如可以采用O至I之間的實數(shù)來表示,O表示兩個圖像內(nèi)容不同,而I表示兩個圖像內(nèi)容相同。
[0041]具體地,圖4示意性示出了根據(jù)本發(fā)明一個實施方式的用于識別圖像內(nèi)容的方法的流程圖400。在步驟S402中,向用戶提供至少第一圖像配對和第二圖像配對。例如,可以采用圖3所示的界面來向用戶提供兩個圖像配對。備選地,還可以向用戶提供多于兩個的圖像配對,例如可以提供三個圖像配對,本領(lǐng)域技術(shù)人員可以基于圖3的界面自行設(shè)計其他的界面來提供圖像配對。
[0042]在步驟S404中,獲取來自用戶的第一答案和第二答案,其中第一答案和第二答案分別指示用戶針對第一圖像配對和第二圖像配對中的圖像內(nèi)容是否相同的判斷。為了便于用戶操作,可以采用圖3所示的復(fù)選框來接收用戶的答案。此時最多僅需用戶進行兩次點擊(當認為兩個圖像配對中的內(nèi)容均相同時),或者根本不需要進行點擊(當認為兩個圖像配對中的內(nèi)容均不相同時),即可獲得用戶輸入?;蛘撸绢I(lǐng)域技術(shù)人員還可以設(shè)置包括“相同”和“不相同”的一組單選框來接收用戶的答案。在向用戶提供三個圖像配對的示例中,需要獲取用戶針對三個圖像配對的答案。[0043]在步驟S406中,響應(yīng)于第一答案符合預(yù)定答案,修改第二圖像配對的權(quán)重。應(yīng)當注意,在此實施方式中,第一圖像配對的作用類似于驗證碼,當?shù)谝淮鸢阜项A(yù)定答案時,表示用戶針對第一圖像配對中的圖像內(nèi)容的一致性的判斷是正確的;另一方面,表示該用戶對于圖像內(nèi)容的識別能力是可信的、和/或用戶是經(jīng)過認真辨別后才輸入了答案而不是隨意輸入答案,因而可以在一定程度上相信用戶針對第二圖像配對給出的第二答案。在向用戶提供三個圖像配對的示例中,響應(yīng)于第一答案符合預(yù)定答案,還可以修改第二圖像配對和第三圖像配對的權(quán)重。
[0044]在本發(fā)明的一個實施方式中,可以針對每個圖像配對設(shè)置權(quán)重,權(quán)重的初始值可以設(shè)置為O。當用戶認為該圖像配對中兩個圖像的內(nèi)容是相同時,則可以將權(quán)重增加一個量值;或者還可以將權(quán)重設(shè)置為認為相同的用戶數(shù)量與參與評分的全部用戶數(shù)量的比值。在后續(xù)步驟中,可以通過衡量權(quán)重的大小來確定圖像配對中的兩個圖像內(nèi)容是否相同。
[0045]在本發(fā)明的一個實施方式中,進一步包括:響應(yīng)于第二圖像配對的權(quán)重到達預(yù)定權(quán)重,判斷第二圖像配對中的圖像內(nèi)容是相同的。例如,當以比值為權(quán)重時,可以在80 %的用戶認為第二圖像配對中的圖像內(nèi)容相同時,輸出“相同”的識別結(jié)果。在此實施方式中,還可以定義需要獲取多少個用戶的答案,例如,可以采集1000個用戶的答案,并且在其中80%的用戶給出“相同”時,認為兩個圖像的內(nèi)容是相同的。
[0046]應(yīng)當注意,在此步驟之后還可以采用其他步驟來進一步驗證識別結(jié)果的正確性,例如,可以采用圖像識別算法進行處理,還可以采用例如精通人臉識別等技術(shù)的專家來做進一步的判斷,進而消除根據(jù)本發(fā)明的實施方式的圖像識別方案中出現(xiàn)的某些錯誤。
[0047]在本發(fā)明的一個實施方式中,第一圖像配對選自其中存儲已知圖像內(nèi)容是否相同的圖像配對的第一數(shù)據(jù)庫,以及第二圖像配對選自其中存儲未知圖像內(nèi)容是否相同的圖像配對的第二數(shù)據(jù)庫。在此實施方式中,第一數(shù)據(jù)庫和第二數(shù)據(jù)庫分別設(shè)置用于存儲已知、未知圖像內(nèi)容是否相同的圖像配對。從第一數(shù)據(jù)庫中提供第一圖像配對的目的在于提供類似于驗證碼的圖像配對,當來自用戶的第一答案與預(yù)定答案相匹配時,則認為用戶針對第二圖像配對的答案是有效的。
[0048]應(yīng)當注意,在本發(fā)明的各個實施方式中可以隨機地分別從第一數(shù)據(jù)庫和第二數(shù)據(jù)庫中選擇第一圖像配對和第二圖像配對。第一數(shù)據(jù)庫中包括的圖像配對中的圖像可以彼此不同,或者可以有所重疊。例如,在第一數(shù)據(jù)庫的一個圖像配對中包括圖像A和圖像B,而在另一圖像配對中包括圖像B和圖像C。類似地,在第二數(shù)據(jù)庫中包括的圖像配對也可以彼此不同或者有所重疊。
[0049]例如,當?shù)诙?shù)據(jù)庫的一個圖像配對中包括圖像A和圖像B,而在另一圖像配對中包括圖像B和圖像C時,如果針對圖像配對(A,B)和(B,C)的權(quán)重分別超過預(yù)定閾值,則在沒有向用戶提供圖像配對(A,C)的情況下,也可以認為圖像A和圖像C的內(nèi)容也是相同的。如果分別向用戶提供了圖像配對(A,B)、(B,C)和(A,C),并且在三個圖像配對的權(quán)重彼此像差甚遠的情況下,還可以對圖像A、圖像B和圖像C進行其他的額外驗證處理。
[0050]在本發(fā)明的一個實施方式中,第一圖像配對和第二圖像配對的顯示順序是隨機的。隨機顯示的目的在于,用戶應(yīng)當認真對待兩個圖像配對。如果用戶已知第一圖像配對顯示在前而第二圖像配對顯示在后、并且用戶僅需要針對第一圖像配對給出正確的答案即可,則有可能會出現(xiàn)用戶僅認真分辨第一圖像配對中的圖像而隨意提供針對第二配對的答案的情況,這將會有可能降低從用戶收集的答案的準確性。在此實施方式中,由于第一圖像配對和第二圖像配對的顯示順序是隨機的,用戶必須認真分析兩個圖像配對的內(nèi)容并且分別給出答案,否則將有可能會由于針對第一圖像配對給出了錯誤答案而無法進入期望的頁面,例如,無法登錄。
[0051]在本發(fā)明的一個實施方式中,向用戶提供至少第一圖像配對和第二圖像配對包括:響應(yīng)于用戶訪問登錄頁面,向用戶提供至少第一圖像配對和第二圖像配對。當用戶訪問登錄頁面時,利用根據(jù)本發(fā)明的第一圖像配對和第二圖像配對來代替現(xiàn)有技術(shù)中的驗證碼。具體地,例如可以利用如圖3所示的界面來代替圖2所示的登錄界面中的驗證碼部分220,以便實現(xiàn)根據(jù)本發(fā)明所述的方法。
[0052]在此實施方式中,第一圖像配對的功能對應(yīng)于現(xiàn)有技術(shù)的驗證碼,而第二圖像配對的功能在于向用戶提供兩個待識別圖像,并且還可以通過與用戶的交互,來獲得用戶針對第二圖像配對中的兩個圖像內(nèi)容是否相同的判斷結(jié)果。以此方式,通過采集來自大量用戶的判斷結(jié)果,可以獲得與一般大眾的識別能力相符的判斷結(jié)果。
[0053]在本發(fā)明的一個實施方式中,響應(yīng)于第一答案符合預(yù)定答案,將用戶引導至與登錄頁面相關(guān)聯(lián)的另一頁面。在本發(fā)明的一個實施方式中,響應(yīng)于第一答案不符合預(yù)定答案,再次執(zhí)行上文參見圖4所述的方法。在此實施方式中,只要用戶針對第一圖像配對的第一答案符合預(yù)定答案,即可允許用戶登錄,并基于用戶的第二答案來修改第二圖像配對的權(quán)重。另外,當用戶針對第一圖像配對的第一答案不符合預(yù)定答案時,可以再次向用戶提供另外的兩個圖像配對作為第一圖像配對。在本發(fā)明的一個實施方式中,當存在一定數(shù)量(或者比例)的用戶對于某特定的第一圖像配對的答案為錯誤時,則可以認為該第一圖像配對中的圖像內(nèi)容的一致性不足夠明顯,因不適合作為“驗證碼”而將其從第一數(shù)據(jù)庫中刪除。
[0054]在本發(fā)明的一個實施方式中,該方法獨立于登錄頁面而提供。盡管在上文中結(jié)合登錄界面描述了識別圖像的方法,然而該方法的實現(xiàn)可以獨立于登錄頁面,例如可以由不同于登錄網(wǎng)站提供者的第三方機構(gòu)來提供該方法。并且,還可以由獨立的機構(gòu)提供第一數(shù)據(jù)庫和第二數(shù)據(jù)庫。例如,可以由失物招領(lǐng)處、警察局等實體來提供第一數(shù)據(jù)庫和第二數(shù)據(jù)庫,或者僅提供其中存儲有待被識別的圖像配對的第二數(shù)據(jù)庫。
[0055]在此實施方式中,網(wǎng)站的提供者僅需要在登錄界面中嵌入少量代碼以調(diào)用根據(jù)本發(fā)明的識別圖像內(nèi)容的方法的應(yīng)用即可。以此方式,網(wǎng)站提供者可以將對“驗證碼”功能的開發(fā)和維護轉(zhuǎn)移至其他方提供,并且還可以在不額外占用用戶過多時間和精力的情況下,利用集體智慧來識別圖像內(nèi)容。
[0056]在本發(fā)明的一個實施方式中,響應(yīng)于第二圖像配對的權(quán)重到達預(yù)定權(quán)重,將第二圖像配對從第二數(shù)據(jù)庫中移除。當確定第二圖像配對中的圖像內(nèi)容為相同時,不必再向其他用戶提供第二圖像配對,因而可以將其從第二數(shù)據(jù)庫中移除,或者還可以將其移至第一數(shù)據(jù)庫中。
[0057]在本發(fā)明的一個實施方式中,圖像內(nèi)容是以下中的任一項:物品、動物以及人像。在本發(fā)明的各個實施方式中,并不限定圖像內(nèi)容的范圍,而是圖像內(nèi)容可以包括物品圖像(例如,用于失物招領(lǐng))、動物圖像(例如,用于尋找走失寵物)或者包括人像/人臉(例如,用于搜索通緝罪犯或者用于尋找走失兒童等)。
[0058]圖5示意性示出了根據(jù)本發(fā)明一個實施方式的用于識別圖像內(nèi)容的系統(tǒng)的架構(gòu)圖500。具體地,響應(yīng)于用戶510訪問網(wǎng)站520 (如箭頭A所示),網(wǎng)站520可以調(diào)用識別裝置530 (如箭頭B所示,例如通過調(diào)用提供本發(fā)明功能的應(yīng)用進行)。繼而,識別裝置530分別訪問第一數(shù)據(jù)庫532和第二數(shù)據(jù)庫534 (分別如箭頭C和D所示),并分別從中讀取第一圖像配對和第二圖像配對,接著,在判斷界面540中提供上述兩個圖像配對。用戶510通過與判斷界面進行交互(如箭頭F所示),來輸入針對兩個圖像配對的答案。當用戶510針對第一圖像配對的答案符合預(yù)定答案時,可以基于第二答案來修改針對第二圖像配對的權(quán)重(如箭頭G所示),并且允許用戶登錄(如箭頭H所示)。
[0059]圖6A和圖6B分別示意性示出了根據(jù)本發(fā)明一個實施方式的數(shù)據(jù)結(jié)構(gòu)的示意圖600A和600B。在數(shù)據(jù)結(jié)構(gòu)600A中,圖像節(jié)點610A包括:圖像ID612A,用于唯一地定義每個圖像的標識符;圖像屬性614A,用于定義與圖像相關(guān)聯(lián)的各種信息(例如當圖像是一名走失兒童的照片時,可以包括該兒童的姓名、出生日期、走失時間以及家長聯(lián)系方式等);以及圖像616A,用于存儲圖像的像素信息。在數(shù)據(jù)結(jié)構(gòu)600B中,圖像配對節(jié)點610B包括:第一圖像ID612B、第二圖像ID614B以及表示第一圖像和第二圖像的內(nèi)容為相同的可能性的權(quán)重616B。
[0060]圖7示意性示出了根據(jù)本發(fā)明一個實施方式的用于識別圖像內(nèi)容的裝置的框圖。具體地,提供了一種用于識別圖像內(nèi)容的裝置,包括:提供模塊710,配置用于向用戶提供至少第一圖像配對和第二圖像配對;獲取模塊720,配置用于獲取來自用戶的第一答案和第二答案,其中第一答案和第二答案分別指示用戶針對第一圖像配對和第二圖像配對中的圖像內(nèi)容是否相同的判斷;以及修改模塊730,配置用于響應(yīng)于第一答案符合預(yù)定答案,修改第二圖像配對的權(quán)重。
[0061]在本發(fā)明的一個實施方式中,進一步包括:判斷模塊,配置用于響應(yīng)于第二圖像配對的權(quán)重到達預(yù)定權(quán)重,判斷第二圖像配對中的圖像內(nèi)容是相同的。
[0062]在本發(fā)明的一個實施方式中,第一圖像配對選自其中存儲已知圖像內(nèi)容是否相同的圖像配對的第一數(shù)據(jù)庫,以及第二圖像配對選自其中存儲未知圖像內(nèi)容是否相同的圖像配對的第二數(shù)據(jù)庫。
[0063]在本發(fā)明的一個實施方式中,提供模塊710包括:登錄模塊,配置用于響應(yīng)于用戶訪問登錄頁面,向用戶提供至少第一圖像配對和第二圖像配對。
[0064]在本發(fā)明的一個實施方式中,進一步包括:第一引導模塊,配置用于響應(yīng)于第一答案符合預(yù)定答案,將用戶引導至與登錄頁面相關(guān)聯(lián)的另一頁面。
[0065]在本發(fā)明的一個實施方式中,進一步包括:第二引導模塊,配置用于響應(yīng)于第一答案不符合預(yù)定答案,再次調(diào)用上文所述的用于識別圖像內(nèi)容的裝置。
[0066]在本發(fā)明的一個實施方式中,裝置獨立于登錄頁面而提供。
[0067]在本發(fā)明的一個實施方式中,第一圖像配對和第二圖像配對的顯示順序是隨機的。
[0068]在本發(fā)明的一個實施方式中,進一步包括:移除模塊,配置用于將第二圖像配對從第二數(shù)據(jù)庫中移除。
[0069]在本發(fā)明的一個實施方式中,圖像內(nèi)容是以下中的任一項:物品、動物以及人像。
[0070]附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施方式的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
[0071]以上已經(jīng)描述了本發(fā)明的各實施方式,上述說明是示例性的,并非窮盡性的,并且也不限于所披露的各實施方式。在不偏離所說明的各實施方式的范圍和精神的情況下,對于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說許多修改和變更都是顯而易見的。本文中所用術(shù)語的選擇,旨在最好地解釋各實施方式的原理、實際應(yīng)用或?qū)κ袌鲋械募夹g(shù)的技術(shù)改進,或者使本【技術(shù)領(lǐng)域】的其他普通技術(shù)人員能理解本文披露的各實施方式。
【權(quán)利要求】
1.一種用于識別圖像內(nèi)容的方法,包括: 向用戶提供至少第一圖像配對和第二圖像配對; 獲取來自所述用戶的第一答案和第二答案,其中所述第一答案和所述第二答案分別指示所述用戶針對所述第一圖像配對和所述第二圖像配對中的圖像內(nèi)容是否相同的判斷;以及 響應(yīng)于所述第一答案符合預(yù)定答案,修改所述第二圖像配對的權(quán)重。
2.根據(jù)權(quán)利要求1所述的方法,進一步包括: 響應(yīng)于所述第二圖像配對的權(quán)重到達預(yù)定權(quán)重,判斷所述第二圖像配對中的圖像內(nèi)容是相同的。
3.根據(jù)權(quán)利要求2所述的方法,其中: 所述第一圖像配對選自其中存儲已知圖像內(nèi)容是否相同的圖像配對的第一數(shù)據(jù)庫,以及所述第二圖像配對選自其中存儲未知圖像內(nèi)容是否相同的圖像配對的第二數(shù)據(jù)庫。
4.根據(jù)權(quán)利要求1-3中任一項所述的方法,其中向所述用戶提供至少所述第一圖像配對和所述第二圖像配對包括: 響應(yīng)于所述用戶訪問登錄頁面,向所述用戶提供至少所述第一圖像配對和所述第二圖像配對。
5.根據(jù)權(quán)利要求4所述的方法,進一步包括: 響應(yīng)于所述第一答案符合所述預(yù) 定答案,將所述用戶引導至與所述登錄頁面相關(guān)聯(lián)的另一頁面。
6.根據(jù)權(quán)利要求5所述的方法,進一步包括: 響應(yīng)于所述第一答案不符合所述預(yù)定答案,再次執(zhí)行根據(jù)權(quán)利要求1所述的方法。
7.根據(jù)權(quán)利要求4所述的方法,其中所述方法獨立于所述登錄頁面而提供。
8.根據(jù)權(quán)利要求1-3中任一項所述的方法,其中: 所述第一圖像配對和所述第二圖像配對的顯示順序是隨機的。
9.根據(jù)權(quán)利要求2所述的方法,進一步包括: 將所述第二圖像配對從第二數(shù)據(jù)庫中移除。
10.根據(jù)權(quán)利要求1-3中任一項所述的方法,其中所述圖像內(nèi)容是以下中的任一項:物品、動物以及人像。
11.一種用于識別圖像內(nèi)容的裝置,包括: 提供模塊,配置用于向用戶提供至少第一圖像配對和第二圖像配對; 獲取模塊,配置用于獲取來自所述用戶的第一答案和第二答案,其中所述第一答案和所述第二答案分別指示所述用戶針對所述第一圖像配對和所述第二圖像配對中的圖像內(nèi)容是否相同的判斷;以及 修改模塊,配置用于響應(yīng)于所述第一答案符合預(yù)定答案,修改所述第二圖像配對的權(quán)重。
12.根據(jù)權(quán)利要求11所述的裝置,進一步包括: 判斷模塊,配置用于響應(yīng)于所述第二圖像配對的權(quán)重到達預(yù)定權(quán)重,判斷所述第二圖像配對中的圖像內(nèi)容是相同的。
13.根據(jù)權(quán)利要求12所述的裝置,其中:所述第一圖像配對選自其中存儲已知圖像內(nèi)容是否相同的圖像配對的第一數(shù)據(jù)庫,以及所述第二圖像配對選自其中存儲未知圖像內(nèi)容是否相同的圖像配對的第二數(shù)據(jù)庫。
14.根據(jù)權(quán)利要求11-13中任一項所述的裝置,其中所述提供模塊包括: 登錄模塊,配置用于響應(yīng)于所述用戶訪問登錄頁面,向所述用戶提供至少所述第一圖像配對和所述第二圖像配對。
15.根據(jù)權(quán)利要求14所述的裝置,進一步包括: 第一引導模塊,配置用于響應(yīng)于所述第一答案符合所述預(yù)定答案,將所述用戶引導至與所述登錄頁面相關(guān)聯(lián)的另一頁面。
16.根據(jù)權(quán)利要求15所述的裝置,進一步包括: 第二引導模塊,配置用于響應(yīng)于所述第一答案不符合所述預(yù)定答案,再次調(diào)用根據(jù)權(quán)利要求11所述的裝置。
17.根據(jù)權(quán)利要求14所述的裝置,其中所述裝置獨立于所述登錄頁面而提供。
18.根據(jù)權(quán)利要求11-13中任一項所述的裝置,其中: 所述第一圖像配對和所述第二圖像配對的顯示順序是隨機的。
19.根據(jù)權(quán)利要求12所述的裝置,進一步包括: 移除模塊,配置用于將所述第二圖像配對從第二數(shù)據(jù)庫中移除。·
20.根據(jù)權(quán)利要求11-13中任一項所述的裝置,其中所述圖像內(nèi)容是以下中的任一項:物品、動物以及人像。
【文檔編號】G06K9/64GK103854031SQ201210519142
【公開日】2014年6月11日 申請日期:2012年11月28日 優(yōu)先權(quán)日:2012年11月28日
【發(fā)明者】鐘錢杰, 郭峰, 陳齊彥, 陳超, 陳波 申請人:伊姆西公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
阿拉善右旗| 合作市| 当雄县| 台中县| 盖州市| 运城市| 伊金霍洛旗| 浠水县| 尚志市| 郑州市| 石首市| 确山县| 平泉县| 阜宁县| 丁青县| 济南市| 布尔津县| 应城市| 龙胜| 靖边县| 双桥区| 洪湖市| 鹤庆县| 游戏| 玛多县| 文水县| 循化| 崇信县| 阜平县| 渝北区| 渭南市| 浙江省| 镇沅| 三穗县| 永登县| 句容市| 屏东市| 平和县| 兰州市| 株洲市| 广德县|