本發(fā)明涉及計算機(jī)領(lǐng)域,尤其涉及一種自動實時識別圖片、文字及聲音的裝置。
背景技術(shù):
1、在傳統(tǒng)教學(xué)系統(tǒng)中,教師需要往往需要花費的大量的時間為學(xué)生批改作業(yè)。隨著電子化教學(xué)的發(fā)展,教師可以用過pc或者pad協(xié)助進(jìn)行教學(xué),學(xué)生所提交的作業(yè)通常通過拍照的方式上傳教學(xué)系統(tǒng),并且學(xué)生所提交的作業(yè)大部分都是選擇與填空題目答案。教師需要通過手動來完成作業(yè)的批改,耗費教師大量時間的同時也無法提高教學(xué)效率。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供的一種自動實時識別圖片、文字及聲音的裝置,可以自動識別文字、圖片和聲音,達(dá)到自動批改作業(yè)的目的,從而可以減少教師批改時間。
2、為了實現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:一種自動實時識別圖片、文字及聲音的裝置,其包括:
3、資料獲取模塊,用于獲取指定目標(biāo)的圖片、文字或聲音信息;
4、提取模塊,用于提取圖片、文字或聲音信息中的知識點;
5、知識庫模塊,用于存儲知識數(shù)據(jù)信息;
6、比對模塊,用于將提取模塊提取的知識點與知識庫模塊內(nèi)的知識數(shù)據(jù)信息進(jìn)行比對,得到比對信息;
7、批改模塊,用于根據(jù)所述比對信息對指定目標(biāo)的知識點進(jìn)行批改。
8、作為上述技術(shù)方案的進(jìn)一步描述:
9、所述資料獲取模塊包括拍照模塊和聲音錄入模塊,所述拍照模塊用于拍攝指定目標(biāo)的圖片和文字,所述聲音錄入模塊用于錄入聲音。
10、作為上述技術(shù)方案的進(jìn)一步描述:
11、所述拍照模塊包括輪廓獲取單元、比對單元、計算單元、變形單元和識別單元,所述輪廓獲取單元,對所述圖片中的文字載體進(jìn)行識別,獲得所述載體的輪廓,所述比對單元,將所述載體的輪廓與標(biāo)準(zhǔn)輪廓進(jìn)行比對,若相似度超過預(yù)設(shè)閾值,則判斷所述載體為預(yù)設(shè)規(guī)則載體;計算單元,當(dāng)判斷出所述載體為預(yù)設(shè)規(guī)則載體時,將所述載體分割成若干區(qū)域,計算各區(qū)域的邊緣所對應(yīng)的弧度;變形單元,根據(jù)最小的弧度以及當(dāng)前區(qū)域的弧度,確定出當(dāng)前區(qū)域?qū)?yīng)的變形值,并將當(dāng)前區(qū)域按照對應(yīng)的變形值進(jìn)行拉伸處理;識別單元,對拉伸后的圖片進(jìn)行文字識別。
12、作為上述技術(shù)方案的進(jìn)一步描述:
13、所述聲音錄入模塊包括追蹤子模塊和錄入子模塊,所述追蹤子模塊用于對指定目標(biāo)進(jìn)行追蹤,所述錄入子模塊根據(jù)追蹤子模塊追蹤的目標(biāo)進(jìn)行錄音。
14、作為上述技術(shù)方案的進(jìn)一步描述:
15、所述提取模塊包括圖片識別模塊、文字識別模塊和聲音識別模塊,所述圖片識別模塊用于提取圖片中的知識點,所述文字識別模塊用于提取文字中的知識點,所述聲音識別模塊用于提取聲音中的知識點。
16、作為上述技術(shù)方案的進(jìn)一步描述:
17、所述圖片識別模塊包括分離模塊、編碼模塊、匹配模塊和識別模塊,所述分離模塊用于將圖片中的文字分離為多個矩形文字框,矩形文字框的個數(shù)與圖片中文字的個數(shù)一致;編碼模塊用于將所述分離模塊分離后的所述矩形文字框內(nèi)的文字編碼為待匹配字符串;匹配模塊用于將所述編碼模塊編碼后的所述待匹配字符串與預(yù)設(shè)文字庫中的字符串進(jìn)行匹配;識別模塊用于根據(jù)所述匹配模塊的匹配結(jié)果識別所述待匹配字符串對應(yīng)的文字。
18、作為上述技術(shù)方案的進(jìn)一步描述:
19、還包括翻譯模塊,所述翻譯模塊用于對圖片、文字或聲音信息進(jìn)行翻譯。
20、作為上述技術(shù)方案的進(jìn)一步描述:
21、所述資料獲取模塊、所述提取模塊、所述知識庫模塊、所述比對模塊和所述批改模塊集成在佩戴部件上。
22、作為上述技術(shù)方案的進(jìn)一步描述:
23、所述佩戴部件為眼鏡、帽子或手表。
24、綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
25、1、本發(fā)明中,通過設(shè)置的資料獲取模塊,可以獲取指定目標(biāo)的圖片、文字或聲音信息,然后提取模塊提取圖片、文字或聲音信息中的知識點,比對模塊將提取模塊提取的知識點與知識庫模塊內(nèi)的知識數(shù)據(jù)信息進(jìn)行比對,得到比對信息,批改模塊根據(jù)所述比對信息對指定目標(biāo)的知識點進(jìn)行批改,實現(xiàn)自動批改的目的。
26、2、本發(fā)明中,通過拍照模塊有目的的識別出圖片文字的載體是預(yù)設(shè)規(guī)則載體,然后根據(jù)弧度來計算載體的變形值,使得變形的載體恢復(fù)至該載體的原有形狀,再對拉伸后的圖片來識別文字,從而提高文字的識別率,降低文字識別錯誤率,從而可以提高批改的正確率。
27、3、本發(fā)明中,將圖片中的文字拆分為多個矩形文字框,該矩形文字框的個數(shù)與圖片中文字的個數(shù)一致,逐字進(jìn)行識別,能夠提高識別文字的準(zhǔn)確性,其次,將矩形文字框內(nèi)的文字編碼為待匹配字符串,并將待匹配字符串與預(yù)設(shè)文字庫中的字符串進(jìn)行匹配;最后,根據(jù)匹配結(jié)果識別待匹配字符串對應(yīng)的文字,減少了識別文字的消耗時長,提高了識別性能。
1.一種自動實時識別圖片、文字及聲音的裝置,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,所述資料獲取模塊包括拍照模塊和聲音錄入模塊,所述拍照模塊用于拍攝指定目標(biāo)的圖片和文字,所述聲音錄入模塊用于錄入聲音。
3.根據(jù)權(quán)利要求2所述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,所述拍照模塊包括輪廓獲取單元、比對單元、計算單元、變形單元和識別單元,所述輪廓獲取單元,對所述圖片中的文字載體進(jìn)行識別,獲得所述載體的輪廓,所述比對單元,將所述載體的輪廓與標(biāo)準(zhǔn)輪廓進(jìn)行比對,若相似度超過預(yù)設(shè)閾值,則判斷所述載體為預(yù)設(shè)規(guī)則載體;計算單元,當(dāng)判斷出所述載體為預(yù)設(shè)規(guī)則載體時,將所述載體分割成若干區(qū)域,計算各區(qū)域的邊緣所對應(yīng)的弧度;變形單元,根據(jù)最小的弧度以及當(dāng)前區(qū)域的弧度,確定出當(dāng)前區(qū)域?qū)?yīng)的變形值,并將當(dāng)前區(qū)域按照對應(yīng)的變形值進(jìn)行拉伸處理;識別單元,對拉伸后的圖片進(jìn)行文字識別。
4.根據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,所述聲音錄入模塊包括追蹤子模塊和錄入子模塊,所述追蹤子模塊用于對指定目標(biāo)進(jìn)行追蹤,所述錄入子模塊根據(jù)追蹤子模塊追蹤的目標(biāo)進(jìn)行錄音。
5.根據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,所述提取模塊包括圖片識別模塊、文字識別模塊和聲音識別模塊,所述圖片識別模塊用于提取圖片中的知識點,所述文字識別模塊用于提取文字中的知識點,所述聲音識別模塊用于提取聲音中的知識點。
6.據(jù)權(quán)利要求5述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,所述圖片識別模塊包括分離模塊、編碼模塊、匹配模塊和識別模塊,所述分離模塊用于將圖片中的文字分離為多個矩形文字框,矩形文字框的個數(shù)與圖片中文字的個數(shù)一致;編碼模塊用于將所述分離模塊分離后的所述矩形文字框內(nèi)的文字編碼為待匹配字符串;匹配模塊用于將所述編碼模塊編碼后的所述待匹配字符串與預(yù)設(shè)文字庫中的字符串進(jìn)行匹配;識別模塊用于根據(jù)所述匹配模塊的匹配結(jié)果識別所述待匹配字符串對應(yīng)的文字。
7.據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,還包括翻譯模塊,所述翻譯模塊用于對圖片、文字或聲音信息進(jìn)行翻譯。
8.據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,所述資料獲取模塊、所述提取模塊、所述知識庫模塊、所述比對模塊和所述批改模塊集成在佩戴部件上。
9.據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置,其特征在于,所述佩戴部件為眼鏡、帽子或手表。