一種自動實時識別圖片、文字及聲音的裝置的制作方法

文檔序號：40654338發(fā)布日期：2025-01-10 19:03閱讀：2來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及計算機(jī)領(lǐng)域，尤其涉及一種自動實時識別圖片、文字及聲音的裝置。

背景技術(shù)：

1、在傳統(tǒng)教學(xué)系統(tǒng)中，教師需要往往需要花費的大量的時間為學(xué)生批改作業(yè)。隨著電子化教學(xué)的發(fā)展，教師可以用過pc或者pad協(xié)助進(jìn)行教學(xué)，學(xué)生所提交的作業(yè)通常通過拍照的方式上傳教學(xué)系統(tǒng)，并且學(xué)生所提交的作業(yè)大部分都是選擇與填空題目答案。教師需要通過手動來完成作業(yè)的批改，耗費教師大量時間的同時也無法提高教學(xué)效率。

技術(shù)實現(xiàn)思路

1、本發(fā)明提供的一種自動實時識別圖片、文字及聲音的裝置，可以自動識別文字、圖片和聲音，達(dá)到自動批改作業(yè)的目的，從而可以減少教師批改時間。

2、為了實現(xiàn)上述目的，本發(fā)明采用了如下技術(shù)方案：一種自動實時識別圖片、文字及聲音的裝置，其包括：

3、資料獲取模塊，用于獲取指定目標(biāo)的圖片、文字或聲音信息；

4、提取模塊，用于提取圖片、文字或聲音信息中的知識點；

5、知識庫模塊，用于存儲知識數(shù)據(jù)信息；

6、比對模塊，用于將提取模塊提取的知識點與知識庫模塊內(nèi)的知識數(shù)據(jù)信息進(jìn)行比對，得到比對信息；

7、批改模塊，用于根據(jù)所述比對信息對指定目標(biāo)的知識點進(jìn)行批改。

8、作為上述技術(shù)方案的進(jìn)一步描述：

9、所述資料獲取模塊包括拍照模塊和聲音錄入模塊，所述拍照模塊用于拍攝指定目標(biāo)的圖片和文字，所述聲音錄入模塊用于錄入聲音。

10、作為上述技術(shù)方案的進(jìn)一步描述：

11、所述拍照模塊包括輪廓獲取單元、比對單元、計算單元、變形單元和識別單元，所述輪廓獲取單元，對所述圖片中的文字載體進(jìn)行識別，獲得所述載體的輪廓，所述比對單元，將所述載體的輪廓與標(biāo)準(zhǔn)輪廓進(jìn)行比對，若相似度超過預(yù)設(shè)閾值，則判斷所述載體為預(yù)設(shè)規(guī)則載體；計算單元，當(dāng)判斷出所述載體為預(yù)設(shè)規(guī)則載體時，將所述載體分割成若干區(qū)域，計算各區(qū)域的邊緣所對應(yīng)的弧度；變形單元，根據(jù)最小的弧度以及當(dāng)前區(qū)域的弧度，確定出當(dāng)前區(qū)域?qū)?yīng)的變形值，并將當(dāng)前區(qū)域按照對應(yīng)的變形值進(jìn)行拉伸處理；識別單元，對拉伸后的圖片進(jìn)行文字識別。

12、作為上述技術(shù)方案的進(jìn)一步描述：

13、所述聲音錄入模塊包括追蹤子模塊和錄入子模塊，所述追蹤子模塊用于對指定目標(biāo)進(jìn)行追蹤，所述錄入子模塊根據(jù)追蹤子模塊追蹤的目標(biāo)進(jìn)行錄音。

14、作為上述技術(shù)方案的進(jìn)一步描述：

15、所述提取模塊包括圖片識別模塊、文字識別模塊和聲音識別模塊，所述圖片識別模塊用于提取圖片中的知識點，所述文字識別模塊用于提取文字中的知識點，所述聲音識別模塊用于提取聲音中的知識點。

16、作為上述技術(shù)方案的進(jìn)一步描述：

17、所述圖片識別模塊包括分離模塊、編碼模塊、匹配模塊和識別模塊，所述分離模塊用于將圖片中的文字分離為多個矩形文字框，矩形文字框的個數(shù)與圖片中文字的個數(shù)一致；編碼模塊用于將所述分離模塊分離后的所述矩形文字框內(nèi)的文字編碼為待匹配字符串；匹配模塊用于將所述編碼模塊編碼后的所述待匹配字符串與預(yù)設(shè)文字庫中的字符串進(jìn)行匹配；識別模塊用于根據(jù)所述匹配模塊的匹配結(jié)果識別所述待匹配字符串對應(yīng)的文字。

18、作為上述技術(shù)方案的進(jìn)一步描述：

19、還包括翻譯模塊，所述翻譯模塊用于對圖片、文字或聲音信息進(jìn)行翻譯。

20、作為上述技術(shù)方案的進(jìn)一步描述：

21、所述資料獲取模塊、所述提取模塊、所述知識庫模塊、所述比對模塊和所述批改模塊集成在佩戴部件上。

22、作為上述技術(shù)方案的進(jìn)一步描述：

23、所述佩戴部件為眼鏡、帽子或手表。

24、綜上所述，由于采用了上述技術(shù)方案，本發(fā)明的有益效果是：

25、1、本發(fā)明中，通過設(shè)置的資料獲取模塊，可以獲取指定目標(biāo)的圖片、文字或聲音信息，然后提取模塊提取圖片、文字或聲音信息中的知識點，比對模塊將提取模塊提取的知識點與知識庫模塊內(nèi)的知識數(shù)據(jù)信息進(jìn)行比對，得到比對信息，批改模塊根據(jù)所述比對信息對指定目標(biāo)的知識點進(jìn)行批改，實現(xiàn)自動批改的目的。

26、2、本發(fā)明中，通過拍照模塊有目的的識別出圖片文字的載體是預(yù)設(shè)規(guī)則載體，然后根據(jù)弧度來計算載體的變形值，使得變形的載體恢復(fù)至該載體的原有形狀，再對拉伸后的圖片來識別文字，從而提高文字的識別率，降低文字識別錯誤率，從而可以提高批改的正確率。

27、3、本發(fā)明中，將圖片中的文字拆分為多個矩形文字框，該矩形文字框的個數(shù)與圖片中文字的個數(shù)一致，逐字進(jìn)行識別，能夠提高識別文字的準(zhǔn)確性，其次，將矩形文字框內(nèi)的文字編碼為待匹配字符串，并將待匹配字符串與預(yù)設(shè)文字庫中的字符串進(jìn)行匹配；最后，根據(jù)匹配結(jié)果識別待匹配字符串對應(yīng)的文字，減少了識別文字的消耗時長，提高了識別性能。

技術(shù)特征：

1.一種自動實時識別圖片、文字及聲音的裝置，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，所述資料獲取模塊包括拍照模塊和聲音錄入模塊，所述拍照模塊用于拍攝指定目標(biāo)的圖片和文字，所述聲音錄入模塊用于錄入聲音。

3.根據(jù)權(quán)利要求2所述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，所述拍照模塊包括輪廓獲取單元、比對單元、計算單元、變形單元和識別單元，所述輪廓獲取單元，對所述圖片中的文字載體進(jìn)行識別，獲得所述載體的輪廓，所述比對單元，將所述載體的輪廓與標(biāo)準(zhǔn)輪廓進(jìn)行比對，若相似度超過預(yù)設(shè)閾值，則判斷所述載體為預(yù)設(shè)規(guī)則載體；計算單元，當(dāng)判斷出所述載體為預(yù)設(shè)規(guī)則載體時，將所述載體分割成若干區(qū)域，計算各區(qū)域的邊緣所對應(yīng)的弧度；變形單元，根據(jù)最小的弧度以及當(dāng)前區(qū)域的弧度，確定出當(dāng)前區(qū)域?qū)?yīng)的變形值，并將當(dāng)前區(qū)域按照對應(yīng)的變形值進(jìn)行拉伸處理；識別單元，對拉伸后的圖片進(jìn)行文字識別。

4.根據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，所述聲音錄入模塊包括追蹤子模塊和錄入子模塊，所述追蹤子模塊用于對指定目標(biāo)進(jìn)行追蹤，所述錄入子模塊根據(jù)追蹤子模塊追蹤的目標(biāo)進(jìn)行錄音。

5.根據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，所述提取模塊包括圖片識別模塊、文字識別模塊和聲音識別模塊，所述圖片識別模塊用于提取圖片中的知識點，所述文字識別模塊用于提取文字中的知識點，所述聲音識別模塊用于提取聲音中的知識點。

6.據(jù)權(quán)利要求5述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，所述圖片識別模塊包括分離模塊、編碼模塊、匹配模塊和識別模塊，所述分離模塊用于將圖片中的文字分離為多個矩形文字框，矩形文字框的個數(shù)與圖片中文字的個數(shù)一致；編碼模塊用于將所述分離模塊分離后的所述矩形文字框內(nèi)的文字編碼為待匹配字符串；匹配模塊用于將所述編碼模塊編碼后的所述待匹配字符串與預(yù)設(shè)文字庫中的字符串進(jìn)行匹配；識別模塊用于根據(jù)所述匹配模塊的匹配結(jié)果識別所述待匹配字符串對應(yīng)的文字。

7.據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，還包括翻譯模塊，所述翻譯模塊用于對圖片、文字或聲音信息進(jìn)行翻譯。

8.據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，所述資料獲取模塊、所述提取模塊、所述知識庫模塊、所述比對模塊和所述批改模塊集成在佩戴部件上。

9.據(jù)權(quán)利要求1所述的一種自動實時識別圖片、文字及聲音的裝置，其特征在于，所述佩戴部件為眼鏡、帽子或手表。

技術(shù)總結(jié)
本發(fā)明公開了一種自動實時識別圖片、文字及聲音的裝置，其包括：資料獲取模塊，用于獲取指定目標(biāo)的圖片、文字或聲音信息；提取模塊，用于提取圖片、文字或聲音信息中的知識點；知識庫模塊，用于存儲知識數(shù)據(jù)信息；比對模塊，用于將提取模塊提取的知識點與知識庫模塊內(nèi)的知識數(shù)據(jù)信息進(jìn)行比對，得到比對信息；批改模塊，用于根據(jù)所述比對信息對指定目標(biāo)的知識點進(jìn)行批改。本發(fā)明相較于現(xiàn)有技術(shù)可以自動識別文字、圖片和聲音，達(dá)到自動批改作業(yè)的目的，從而可以減少教師批改時間。

技術(shù)研發(fā)人員：熊明星,熊一承
受保護(hù)的技術(shù)使用者：昆山億星農(nóng)信息科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：熊明星,熊一承
技術(shù)所有人：昆山億星農(nóng)信息科技有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種自動實時識別圖片、文字及聲音的裝置的制作方法

一種自動實時識別圖片、文字及聲音的裝置的制作方法