專利名稱:具有文本提取功能的主機(jī)設(shè)備及其提取方法
技術(shù)領(lǐng)域:
本發(fā)明一般概念涉及具有文本提取功能的主機(jī)設(shè)備及其相應(yīng)的提取方法。更具體地說(shuō),本發(fā)明涉及能夠在圖像內(nèi)的文本上完成某種操作或作業(yè)的具有文本提取功能的主機(jī)設(shè)備及其相應(yīng)的提取方法。
背景技術(shù):
一般來(lái)說(shuō),隨著更多通訊技術(shù)的發(fā)展和個(gè)人計(jì)算機(jī)的普及,使用因特網(wǎng)的人口數(shù)量已經(jīng)顯著增加。另外,使用英特網(wǎng)的年齡群已經(jīng)從低齡人群擴(kuò)展到高齡人群,因此使用英特網(wǎng)的人數(shù)在持續(xù)增長(zhǎng)。
因特網(wǎng)上有大量的信息,世界各地的網(wǎng)站與因特網(wǎng)相連以便通過(guò)因特網(wǎng)交流各種信息并且實(shí)現(xiàn)信息的全球化。
因特網(wǎng)用戶可以通過(guò)因特網(wǎng)獲得想要的信息,因特網(wǎng)用戶也可以下載或者復(fù)制所獲得的信息以便按照自己的意愿對(duì)下載的信息進(jìn)行編輯。
因特網(wǎng)上的信息包括圖像和文本,并且圖像可包括圖像化文本。圖像化文本不能脫開(kāi)其作為一部分而所屬的圖像被單獨(dú)復(fù)制、存儲(chǔ)和打印。
相應(yīng)地,如果想得到包含在圖像中的文本,用戶就要手動(dòng)輸入想要的文本。因此,如果圖像里包括大量的文本,為使用文本就要花費(fèi)不必要的時(shí)間和努力。
發(fā)明內(nèi)容
相應(yīng)地,本發(fā)明一般概念提供了一種利用應(yīng)用程序在圖像里提取文本以便用戶能夠在所提取文本上完成操作的主機(jī)設(shè)備,以及相應(yīng)的提取文本的方法。
本發(fā)明一般概念的其它方面,一部分將在接下來(lái)的描述中被闡明,一部分將是描述中顯而易見(jiàn)的,或者可以通過(guò)本發(fā)明一般概念的實(shí)踐被了解。
本發(fā)明一般概念的前述和/或其它的方面和優(yōu)點(diǎn)可以通過(guò)提供包含至少一個(gè)帶有文本提取功能的、并且執(zhí)行某個(gè)文檔的應(yīng)用程序的主機(jī)設(shè)備來(lái)獲得,所述的至少一個(gè)應(yīng)用程序包括用戶接口部分,用于輸入選擇信號(hào)以選擇對(duì)包含在所執(zhí)行文檔中的圖像所執(zhí)行的操作;文本提取部分,用于從所述的圖像中提取文本;和文本處理部分,用于在所提取的文本上執(zhí)行所選擇的操作。
用戶接口部分可以接收第二選擇信號(hào)以選擇包含所要提取文本的圖像,并且文本提取部分可以從所選擇的圖像中提取文本。
文本提取部分可以利用圖像里的色差提取文本。所述的文本提取部分可以是光學(xué)字符識(shí)別引擎(OCR)。
所選擇的在文本上所執(zhí)行的操作可以至少是存儲(chǔ)操作、打印操作、復(fù)制操作和翻譯操作之一。如果執(zhí)行翻譯操作,文本處理部分可以提供翻譯程序來(lái)翻譯所提取的文本。
用戶接口部分可以提供一個(gè)顯示可選擇操作的菜單,使用戶能夠選擇在文本上所執(zhí)行的操作。
所述的應(yīng)用程序可以是網(wǎng)頁(yè)瀏覽器、翻譯程序和文檔編制程序之一。
本發(fā)明一般概念的前述和/或其他的方面可以通過(guò)提供在圖像生成系統(tǒng)上可執(zhí)行的應(yīng)用程序來(lái)獲得,所述的程序包括文本提取部分,用于將作為圖像的一部分的、圖像格式的文本條目轉(zhuǎn)換為文本格式;和處理部分,使得在所轉(zhuǎn)換的文本格式的文本條目上能夠執(zhí)行一個(gè)或多個(gè)操作。
本發(fā)明一般概念的前述和/或其他的方面也可以通過(guò)在含有從圖像中提取圖像化文本的文本提取器的應(yīng)用程序中可使用的用戶接口單元來(lái)獲得,所述的用戶接口單元包括圖像顯示部分,用于顯示其中帶有圖像化文本的圖像;以及與圖像顯示部分相鄰的菜單部分,用于顯示當(dāng)被選擇時(shí)在所提取的文本上可執(zhí)行的一個(gè)或多個(gè)可選擇的操作。
本發(fā)明一般概念的前述和/或其他的方面也可以通過(guò)提供一種提取文本的方法來(lái)獲得,所述的方法包括執(zhí)行某個(gè)文檔,從所執(zhí)行文檔包含的圖像中提取文本,以及在所提取的文本上執(zhí)行所選擇的操作。
所述的方法可以進(jìn)一步包括接收第一選擇信號(hào)以選擇從中提取文本的圖像,其中,文本的提取可以包括從對(duì)應(yīng)于所選擇圖像的輸入第一選擇信號(hào)的圖像中提取文本。
所述的方法可以進(jìn)一步包括接收所選擇圖像操作的第二選擇信號(hào),其中,所選擇操作的執(zhí)行包括執(zhí)行對(duì)應(yīng)于在所提取文本上操作的第二選擇信號(hào)的所選擇的操作。
文本的提取可以包括利用圖像中的色差來(lái)提取文本。文本的提取可以包括通過(guò)使用光學(xué)字符識(shí)別(OCR)引擎來(lái)提取文本。
在文本上所要執(zhí)行的操作可以至少是存儲(chǔ)操作、打印操作、復(fù)制操作和翻譯操作之一。
本發(fā)明一般概念的前述和/或其它的方面也可以通過(guò)提供包含提取文本的可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì)來(lái)獲得,所述的介質(zhì)包括執(zhí)行某個(gè)文檔的可執(zhí)行代碼,從所執(zhí)行文檔包含的圖像中提取文本的可執(zhí)行代碼,以及在所提取文本上執(zhí)行所選擇操作的可執(zhí)行代碼。
本發(fā)明一般概念的前述和/或其他的方面也可以通過(guò)提供圖像形成裝置網(wǎng)絡(luò)來(lái)獲得,所述的網(wǎng)絡(luò)包括帶有應(yīng)用程序的主機(jī)設(shè)備,該應(yīng)用程序在主機(jī)設(shè)備上運(yùn)行以將屬于圖像一部分的文本提取成文本格式;以及與主機(jī)設(shè)備通信的圖像形成裝置,該裝置以文本格式接收與所提取文本相關(guān)的打印數(shù)據(jù)并打印所提取文本。
通過(guò)結(jié)合附圖對(duì)實(shí)施例的以下描述,本發(fā)明一般概念的這些和/或其它方面將變得顯而易見(jiàn)而且更加容易理解,附圖中圖1為根據(jù)本發(fā)明一般概念實(shí)施例的帶有文本提取功能的主機(jī)設(shè)備的方框圖;圖2為圖1的應(yīng)用程序的功能的視圖;以及圖3為根據(jù)本發(fā)明一般概念實(shí)施例的文本提取方法的流程圖。
具體實(shí)施例方式
現(xiàn)將給出本發(fā)明一般概念的實(shí)施例的詳細(xì)參考,附圖中示出了本發(fā)明一般概念實(shí)施例的若干實(shí)例,其中,類似的參考數(shù)字在全文中指類似的元素。所述的實(shí)施例被描述如下以便參考附圖解釋本發(fā)明的一般概念。為簡(jiǎn)明清晰起見(jiàn),以下描述中省略了本領(lǐng)域技術(shù)人員應(yīng)當(dāng)知道的功能和配置的詳細(xì)描述。
圖1為根據(jù)本發(fā)明一般概念的實(shí)施例的帶有文本提取功能的主機(jī)設(shè)備100的方框圖。
參考圖1,根據(jù)本發(fā)明一般概念的實(shí)施例的帶有文本提取功能的主機(jī)設(shè)備100包括應(yīng)用程序110、存儲(chǔ)部分120、圖形設(shè)備接口(GDI)130、圖像形成設(shè)備驅(qū)動(dòng)部分140、顯示設(shè)備驅(qū)動(dòng)部分150、圖像形成設(shè)備接口部分160和顯示設(shè)備接口部分170。
應(yīng)用程序110是安裝在主機(jī)設(shè)備100中的普通應(yīng)用程序,它根據(jù)用戶操作產(chǎn)生新文檔,或者執(zhí)行用戶選擇的文檔。換句話說(shuō),應(yīng)用程序110可由一個(gè)或多個(gè)用戶輸入進(jìn)行操作以創(chuàng)建、編輯、或查看各種類型的文檔和文件。
應(yīng)用程序110可以是網(wǎng)頁(yè)瀏覽器、翻譯程序、和文檔編制程序之一。如果應(yīng)用程序110為網(wǎng)頁(yè)瀏覽器,應(yīng)用程序110執(zhí)行用戶所連接網(wǎng)站的網(wǎng)頁(yè)并給用戶提供所述的網(wǎng)頁(yè)。翻譯程序可以將所提取的文本從一種語(yǔ)言(如,韓語(yǔ))翻譯成另一種語(yǔ)言(如,英語(yǔ))。
應(yīng)用程序110從所述文檔內(nèi)的圖像中提取文本,并在所提取的文本上執(zhí)行某種操作。為此,應(yīng)用程序110包括用戶接口部分112、文本提取部分114、和文本處理部分116。換句話說(shuō),作為圖像一部分出現(xiàn)的文本(即,圖像化文本)能夠被提取為非圖像格式的文本。應(yīng)用程序110可以將所述圖像中的圖像化文本識(shí)別為字母。例如,應(yīng)用程序110能夠從*.JPEG圖像(或其它圖像格式)中提取圖像文本并提供ASCII代碼。這樣,不需提供典型地要求更多信息來(lái)表示圖像化文本的圖像數(shù)據(jù),所提取的文本能夠利用ASCII字符所用的比特組合來(lái)表示。
用戶接口部分112提供用戶和主機(jī)設(shè)備100之間的接口。在本實(shí)施例中,所述的用戶接口部分112輸入表示從中提取文本的圖像的第一選擇信號(hào),以及表示在從所選擇的圖像中提取的文本上所執(zhí)行的操作的第二選擇信號(hào)。
用戶接口部分112提供一個(gè)顯示可選擇的操作(即,作業(yè))的菜單,以便用戶能選擇對(duì)文本執(zhí)行的操作(即,作業(yè))。用戶接口部分112所提供的菜單可以包括“存儲(chǔ)圖像中包含的文本”(即,存儲(chǔ)文本功能),“打印圖像中包含的文本”(即,打印文本功能),“復(fù)制圖像中包含的文本”(即,復(fù)制文本功能),以及“翻譯圖像中包含的文本”(翻譯文本功能)。
如果用戶通過(guò)用戶接口部分112輸入圖像的第一選擇信號(hào),文本提取部分114從圖像的輸入第一選擇信號(hào)所對(duì)應(yīng)的圖像中提取文本。
文本提取部分114可以包括提取圖像中包含的文本的圖像處理模塊。所述的圖像處理模塊能夠利用圖像中的色差提取文本。
文本提取部分114可以是光學(xué)字符識(shí)別(OCR)引擎。OCR引擎將所述的圖像或位圖分成明亮部分和黑暗部分以分析明亮部分和黑暗部分。如果檢測(cè)到文本字符,文本提取部分114能夠通過(guò)將文本轉(zhuǎn)換為ASCII代碼來(lái)提取文本。
文本處理部分116執(zhí)行用于對(duì)文本提取部分114所提取的文本執(zhí)行操作的第二選擇信號(hào)所對(duì)應(yīng)的操作(即,作業(yè))。所述操作的第二選擇信號(hào)通過(guò)用戶接口部分112被輸入。文本處理部分116對(duì)文本所執(zhí)行的操作包括存儲(chǔ)、打印、復(fù)制和翻譯,它們對(duì)應(yīng)于用戶接口部分112所提供的、顯示用戶可以選擇的各種功能的菜單。
如果執(zhí)行存儲(chǔ)操作,文本處理部分116控制存儲(chǔ)部分120來(lái)存儲(chǔ)由文本提取部分114所提取的數(shù)據(jù)。
如果執(zhí)行打印操作,文本處理部分116將文本提取部分114所提取的數(shù)據(jù)通過(guò)GDI 130提供給圖像形成設(shè)備驅(qū)動(dòng)部分140。
如果執(zhí)行復(fù)制操作,文本處理部分116控制存儲(chǔ)部分120暫時(shí)存儲(chǔ)文本提取部分114所提取的數(shù)據(jù)。依賴于應(yīng)用程序110所述的文本可以被存儲(chǔ)到剪貼板。
如果執(zhí)行翻譯操作,文本處理部分116將文本提取部分114所提取的數(shù)據(jù)傳送給翻譯程序。此時(shí),應(yīng)用程序110可以是網(wǎng)頁(yè)瀏覽器或文檔編制程序,并且所述的翻譯程序是存在于主機(jī)設(shè)備100內(nèi)或者正在主機(jī)設(shè)備100上運(yùn)行的程序。
存儲(chǔ)部分120存儲(chǔ)某些文檔。所述的某些文檔可以由應(yīng)用程序110產(chǎn)生。如果應(yīng)用程序110是網(wǎng)頁(yè)瀏覽器,下載的圖像可以被暫時(shí)存儲(chǔ)到存儲(chǔ)部分120。所述的圖像從用戶所連接的網(wǎng)站被下載以便從所述的網(wǎng)站提取文本。另外,如果所述的存儲(chǔ)操作由文本處理部分116來(lái)執(zhí)行,所述的存儲(chǔ)部分120可以在文本處理部分116的控制下存儲(chǔ)文本。
所述的GDI 130是一類操作系統(tǒng)(例如微軟的視窗),它提供應(yīng)用程序110和圖像形成設(shè)備驅(qū)動(dòng)部分140之間的接口,或者應(yīng)用程序110和顯示設(shè)備驅(qū)動(dòng)部分150之間的接口。
換句話說(shuō),所述的GDI 130將從應(yīng)用程序110發(fā)送的打印命令和打印數(shù)據(jù)發(fā)送給圖像形成設(shè)備驅(qū)動(dòng)部分140,將來(lái)自應(yīng)用程序110的顯示數(shù)據(jù)發(fā)送給顯示設(shè)備驅(qū)動(dòng)部分150。
所述的圖像形成設(shè)備驅(qū)動(dòng)部分140將從應(yīng)用程序110通過(guò)GDI 130傳送的打印命令和打印數(shù)據(jù)轉(zhuǎn)換為圖像形成設(shè)備200可讀取的數(shù)據(jù)形式。
所述的顯示設(shè)備驅(qū)動(dòng)部分150將從應(yīng)用程序110通過(guò)GDI 130傳送的顯示數(shù)據(jù)轉(zhuǎn)換為顯示設(shè)備300可讀取的數(shù)據(jù)形式。顯示數(shù)據(jù)可以包括應(yīng)用程序110所執(zhí)行的文檔和用戶接口部分112所提供的菜單。
所述的圖像形成設(shè)備接口部分160提供主機(jī)設(shè)備100和圖像形成設(shè)備200之間的接口,并且由圖像形成設(shè)備驅(qū)動(dòng)部分140將被轉(zhuǎn)換成圖像形成設(shè)備200可讀取數(shù)據(jù)形式的數(shù)據(jù)傳送給圖像形成設(shè)備200。
所述的顯示設(shè)備接口部分170提供主機(jī)設(shè)備100和顯示設(shè)備300之間的接口,由顯示設(shè)備驅(qū)動(dòng)部分150將被轉(zhuǎn)換成顯示設(shè)備300可讀取數(shù)據(jù)形式的數(shù)據(jù)傳送給顯示設(shè)備300。
所述的圖像形成設(shè)備200為從主機(jī)設(shè)備100通過(guò)圖像形成設(shè)備接口部分160接收的打印數(shù)據(jù)執(zhí)行打印作業(yè)(操作)。在本實(shí)施例中,如果文本處理部分116所執(zhí)行的操作是打印操作,圖像形成設(shè)備200執(zhí)行打印作業(yè)。
所述的顯示設(shè)備300顯示從主機(jī)設(shè)備100通過(guò)顯示設(shè)備接口部分170傳送的顯示數(shù)據(jù)。在本實(shí)施例中,在顯示設(shè)備300上所顯示的顯示數(shù)據(jù)包括應(yīng)用程序110所執(zhí)行(訪問(wèn))的文檔。
圖2為圖1的應(yīng)用程序110的功能的視圖。
參考圖1和圖2,將解釋當(dāng)應(yīng)用程序110假定為網(wǎng)頁(yè)瀏覽器時(shí)應(yīng)用程序110的功能。用戶通過(guò)網(wǎng)頁(yè)瀏覽器連接到某個(gè)網(wǎng)站,并且所述的網(wǎng)頁(yè)瀏覽器執(zhí)行網(wǎng)站提供的文檔以給用戶提供所述的文檔(即,相應(yīng)的內(nèi)容)。因此,用戶能夠?qū)W(wǎng)頁(yè)瀏覽器提供的文檔執(zhí)行操作,如復(fù)制操作、存儲(chǔ)操作、打印操作、以及翻譯操作。
如圖2所示,提供給用戶的文檔包括文本和圖像A,并且圖像A可以包括圖像化文本B。圖像A中包含的圖像化文本B以與圖像A相同的方式被綜合,因此,用戶不能用傳統(tǒng)的方法獲得獨(dú)立于圖像A的圖像化文本B。換句話說(shuō),圖像化文本B是圖像A的文件的一部分。
根據(jù)本發(fā)明一般概念的實(shí)施例,應(yīng)用程序110的用戶接口部分112提供用于為圖像化文本B選擇操作的菜單,例如,“存儲(chǔ)圖像中包含的文本”C(即,存儲(chǔ)文本功能),“打印圖像中包含的文本”D(即,打印文本功能),“復(fù)制圖像中包含的文本”E(即,復(fù)制文本功能),以及“翻譯圖像中包含的文本”F(即,翻譯文本功能)。用戶接口部分112也可以包括一個(gè)或多個(gè)其它的一般菜單。
如果用戶選擇從中提取文本的圖像A,用戶接口部分112給用戶提供選擇想要的操作的菜單,包括提供用于為圖像化文本B選擇操作的菜單。因此,用戶可為圖像A中包含的圖像化文本B選擇諸如存儲(chǔ)操作、打印操作、復(fù)制操作和翻譯操作的操作之一。
用戶可借助應(yīng)用程序110的文本提取部分114和文本處理部分116為圖像化文本B選擇作業(yè)以獲得圖像A中包含的圖像化文本B。
圖3為根據(jù)本發(fā)明一般概念的實(shí)施例的文本提取方法的流程圖。圖3所述的方法可以被圖1的主機(jī)設(shè)備100執(zhí)行。因此,為了說(shuō)明方便,將參考圖1到圖3來(lái)解釋根據(jù)本實(shí)施例的文本提取方法。
應(yīng)用程序110執(zhí)行用戶選擇的文檔。例如,如果應(yīng)用程序110是網(wǎng)頁(yè)瀏覽器,則網(wǎng)頁(yè)瀏覽器與用戶輸入的網(wǎng)站地址的網(wǎng)站相連并且執(zhí)行網(wǎng)站提供的文檔(操作S400)。
如果用戶僅希望使用由應(yīng)用程序110提供的文檔所包含的圖像A中的圖像化文本B,則用戶選擇從中提取文本的圖像A(操作S410)。
如果用戶選擇從中提取文本的圖像A,則應(yīng)用程序110通過(guò)用戶接口部分112為選擇針對(duì)圖像化文本B的操作提供所述的菜單C、D、E和F(操作S420)。例如,所述的菜單可以被顯示以響應(yīng)圖像A的選擇。
如果提供了如圖2所示的菜單C、D、E和F,則用戶能夠選擇針對(duì)圖像化文本B的想要的操作。當(dāng)用戶選擇針對(duì)從中提取文本的圖像A以及圖像化文本B的想要的操作時(shí),圖像和操作(即,作業(yè))的第一和第二選擇信號(hào)通過(guò)用戶接口部分112被輸入應(yīng)用程序110(操作S430)。
應(yīng)用程序110的文本提取部分114從所述的圖像A中提取文本(操作S440)。如果文本提取部分114從圖像A中提取了文本,則文本處理部分116執(zhí)行與用戶所選擇操作的第二選擇信號(hào)對(duì)應(yīng)的操作(操作S450)。
已經(jīng)解釋了當(dāng)應(yīng)用程序110是網(wǎng)頁(yè)瀏覽器時(shí)提取文本的方法。然而,這不應(yīng)當(dāng)被認(rèn)為是對(duì)本發(fā)明一般概念的范圍的限制。所述的應(yīng)用程序110可以是其它的文檔創(chuàng)建/編輯/查看程序,如一般的文檔編制程序或翻譯程序。
如果應(yīng)用程序110是翻譯程序,應(yīng)用程序110的文本提取部分114提取圖像化文本B,并且文本處理部分116允許翻譯模塊對(duì)所提取的文本進(jìn)行翻譯,以便能夠翻譯包含在文檔中的所有文本。
另外,所述的應(yīng)用程序110可以是被嵌入到網(wǎng)頁(yè)瀏覽器中執(zhí)行的翻譯程序。所述的翻譯程序可以隨著通過(guò)網(wǎng)頁(yè)瀏覽器打開(kāi)的文檔一起被執(zhí)行,或者可先執(zhí)行所述的翻譯程序,再通過(guò)網(wǎng)頁(yè)瀏覽器打開(kāi)文檔。
就是說(shuō),根據(jù)本發(fā)明一般概念的實(shí)施例,應(yīng)用程序110可以被外加到各種程序,如網(wǎng)頁(yè)瀏覽器、文檔編制程序、翻譯程序,并且能夠根據(jù)用戶輸入對(duì)文檔中包含的文本執(zhí)行諸如編輯和翻譯的操作。或者,應(yīng)用程序110可以被預(yù)先設(shè)置以自動(dòng)執(zhí)行一個(gè)或多個(gè)操作。例如,所述的網(wǎng)頁(yè)瀏覽器可以被預(yù)先設(shè)置以在所選擇圖像中提取文本并自動(dòng)保存所提取文本的拷貝和/或自動(dòng)將所提取文本的拷貝翻譯成另一種語(yǔ)言。
本發(fā)明一般概念的實(shí)施例可以被具體化為計(jì)算機(jī)可讀記錄介質(zhì)上的計(jì)算機(jī)可讀代碼。所述的計(jì)算機(jī)可讀記錄介質(zhì)可以包括任何能存儲(chǔ)此后被計(jì)算機(jī)系統(tǒng)讀取的數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)設(shè)備。計(jì)算機(jī)可讀記錄介質(zhì)的實(shí)例包括只讀存儲(chǔ)器(ROM)、隨機(jī)訪問(wèn)存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤(pán)、光學(xué)數(shù)據(jù)存儲(chǔ)設(shè)備、以及載波(例如通過(guò)互聯(lián)網(wǎng)的數(shù)據(jù)傳輸)。所述的計(jì)算機(jī)可讀記錄介質(zhì)也可以分布在與計(jì)算機(jī)系統(tǒng)相連的網(wǎng)絡(luò)上,以便計(jì)算機(jī)可讀記錄介質(zhì)以分布的方式被存儲(chǔ)和執(zhí)行。本發(fā)明一般概念的實(shí)施例也可以在硬件中或在軟件和硬件的結(jié)合中被具體化。
根據(jù)本發(fā)明一般概念的實(shí)施例,帶有文本提取功能的主機(jī)設(shè)備以及文本提取的方法通過(guò)一個(gè)應(yīng)用程序提取包含在圖像中的文本并且執(zhí)行某些操作以便用戶能獲得包含在文檔中的所有文本。另外,所述的主機(jī)設(shè)備從圖像中提取文本并將所提取的文本提供給用戶以便能夠減少由不必要的圖像打印所造成的墨水消耗。因此,打印速度也可以提高。
雖然以文中的某些實(shí)施例為參考已經(jīng)展示和描述了本發(fā)明一般概念,但本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,在不脫離由所附權(quán)利要求書(shū)所限定的本發(fā)明一般概念的精神和范圍的情況下,可以在形式和細(xì)節(jié)上對(duì)實(shí)施例進(jìn)行修改。
權(quán)利要求
1.一個(gè)裝有至少一個(gè)帶文本提取功能以執(zhí)行某個(gè)文檔的應(yīng)用程序的主機(jī)設(shè)備,所述的至少一個(gè)應(yīng)用程序包括用戶接口部分,用于輸入選擇信號(hào)以選擇對(duì)包含在所執(zhí)行文檔中的圖像所執(zhí)行的操作;文本提取部分,用于從圖像中提取文檔;以及文本處理部分,用于對(duì)所提取的文本執(zhí)行所選擇的操作。
2.如權(quán)利要求1所述的設(shè)備,其中,所述的用戶接口部分接收第二選擇信號(hào)以選擇從中提取文本的圖像,以及所述的文本提取部分從所選擇的圖像中提取文本。
3.如權(quán)利要求1所述的設(shè)備,其中,所述的文本提取部分利用圖像中的色差來(lái)提取文本。
4.如權(quán)利要求1所述的設(shè)備,所述的文本提取部分是光學(xué)字符識(shí)別引擎OCR。
5.如權(quán)利要求1所述的設(shè)備,其中,所選擇的對(duì)文本所執(zhí)行的操作是存儲(chǔ)操作、打印操作、復(fù)制操作以及翻譯操作中的至少之一。
6.如權(quán)利要求5所述的設(shè)備,其中,如果執(zhí)行翻譯操作,所述的文本處理部分提供翻譯程序以對(duì)所提取的文本進(jìn)行翻譯。
7.如權(quán)利要求1所述的設(shè)備,其中,用戶接口部分提供一個(gè)其上顯示可選擇操作的菜單,使用戶能夠選擇對(duì)所提取的文本所執(zhí)行的操作。
8.如權(quán)利要求1所述的設(shè)備,其中,所述的應(yīng)用程序是網(wǎng)頁(yè)瀏覽器、翻譯程序和文檔編制程序之一。
9.一個(gè)在圖像形成系統(tǒng)上可執(zhí)行的應(yīng)用程序,所述的程序包括文本提取部分,用于將作為圖像一部分的、圖像格式的文本條目轉(zhuǎn)換成文本格式;以及處理部分,使得以文本的格式在所轉(zhuǎn)換的文本條目上能夠執(zhí)行一個(gè)或多個(gè)操作。
10.如權(quán)利要求9所述的程序,其中,所述的文本格式包括ASCII代碼。
11.如權(quán)利要求9所述的程序,其中,所述的圖像格式的文本條目基本大于文本格式的所轉(zhuǎn)換的文本條目。
12.如權(quán)利要求9所述的程序,其中,所述的文本提取部分接收來(lái)自網(wǎng)頁(yè)的文本條目。
13.如權(quán)利要求9所述的程序,其中,所述的處理部分包括以文本格式將所轉(zhuǎn)換的文本條目從第一種語(yǔ)言翻譯成第二種語(yǔ)言的翻譯程序。
14.如權(quán)利要求9所述的程序,其中,所述的文本提取部分包括將圖像分為明亮部分和黑暗部分以對(duì)明亮部分和黑暗部分進(jìn)行分析的OCR引擎。
15.如權(quán)利要求9所述的程序,進(jìn)一步包括用戶接口部分,用于接收從多個(gè)圖像中選擇其中的文本條目被轉(zhuǎn)換為文本格式的圖像的第一選擇信號(hào),以及指示在所轉(zhuǎn)換的文本條目上所要執(zhí)行的一個(gè)或多個(gè)操作的第二選擇信號(hào)。
16.如權(quán)利要求9所述的程序,其中,所述的一個(gè)或多個(gè)操作包括存儲(chǔ)文本操作,用于在主機(jī)設(shè)備內(nèi)本地存儲(chǔ)所轉(zhuǎn)換的無(wú)圖像的文本條目;復(fù)制文本操作,用于復(fù)制所轉(zhuǎn)換的無(wú)圖像的文本條目;以及打印文本操作,用于打印所轉(zhuǎn)換的無(wú)圖像的文本條目;翻譯文本操作,用于翻譯所轉(zhuǎn)換的文本條目。
17.如權(quán)利要求9所述的程序,其中,所述的處理部分被設(shè)置在所轉(zhuǎn)換的文本條目上自動(dòng)執(zhí)行所述的一個(gè)或多個(gè)操作。
18.一種提取文本的方法,所述的方法包括執(zhí)行某個(gè)文檔;從所執(zhí)行文檔所包含的圖像中提取文本;以及在所提取文本上執(zhí)行所選擇的操作。
19.如權(quán)利要求18所述的方法,進(jìn)一步包括接收第一選擇信號(hào)以選擇從中提取文本的圖像,其中,文本提取包括從與所選擇圖像的輸入第一選擇信號(hào)對(duì)應(yīng)的圖像中提取文本。
20.如權(quán)利要求18所述的方法,進(jìn)一步包括接收針對(duì)所述圖像的所選擇操作的第二選擇信號(hào),其中,所選擇操作的執(zhí)行包括執(zhí)行與針對(duì)所提取文本的操作的第二選擇信號(hào)對(duì)應(yīng)的所選擇的操作。
21.如權(quán)利要求18所述的方法,其中,所述的文本提取包括利用圖像中的色差提取文本。
22.如權(quán)利要求18所述的方法,其中,所述的文本提取包括利用光學(xué)字符識(shí)別OCR引擎提取文本。
23.如權(quán)利要求18所述的方法,其中,在文本上所執(zhí)行的操作是存儲(chǔ)操作、打印操作、復(fù)制操作以及翻譯操作中的至少之一。
24.一種包含提取文本的可執(zhí)行代碼的計(jì)算機(jī)可讀取介質(zhì),所述的介質(zhì)包括執(zhí)行某個(gè)文檔的可執(zhí)行代碼;從所執(zhí)行文檔中包含的圖像中提取文本的可執(zhí)行代碼;以及在所提取的文本上執(zhí)行所選擇的操作的可執(zhí)行代碼。
25.一種圖像形成系統(tǒng)網(wǎng)絡(luò),所述的網(wǎng)絡(luò)包括主機(jī)設(shè)備,裝有在其上運(yùn)行的將作為圖像一部分的文本提取成文本格式的應(yīng)用程序;以及圖像形成裝置,與主機(jī)設(shè)備通信以接收對(duì)應(yīng)于文本格式的所提取文本的打印數(shù)據(jù)并打印所提取文本。
全文摘要
一種帶有文本提取功能的主機(jī)設(shè)備及其相應(yīng)的文本提取方法。所述的主機(jī)設(shè)備有至少一個(gè)帶有文本提取功能并執(zhí)行某個(gè)文檔的應(yīng)用程序,所述的應(yīng)用程序包括用于輸入選擇信號(hào)以選擇在所執(zhí)行文檔所包含的圖像上所執(zhí)行的操作的用戶接口部分,用于從圖像中提取文本的文本提取部分,以及用于為所提取文本執(zhí)行所選擇操作的文本處理部分。因此,用戶能夠獲得文檔所包含的所有文本。
文檔編號(hào)G06K9/20GK1932802SQ20061015153
公開(kāi)日2007年3月21日 申請(qǐng)日期2006年9月11日 優(yōu)先權(quán)日2005年9月16日
發(fā)明者金炅玉 申請(qǐng)人:三星電子株式會(huì)社