两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于信息檢索的設(shè)備、方法和計算機程序產(chǎn)品的制作方法

文檔序號:6613310閱讀:144來源:國知局
專利名稱:用于信息檢索的設(shè)備、方法和計算機程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于檢索網(wǎng)絡(luò)上的信息的技術(shù)。
背景技術(shù)
各種技術(shù)可用于檢索期望的文件。在一種這樣的技術(shù)中,將文件注冊為個 人計算機(PC)中的數(shù)據(jù)庫,在用戶經(jīng)由鍵盤輸入字符串時,從該數(shù)據(jù)庫檢 索與關(guān)鍵字相關(guān)的數(shù)字?jǐn)?shù)據(jù)。
例如,日本專利申請公開第2000-231568號中揭示了 一種文件檢索設(shè)備, 該文件檢索設(shè)備獲得與被檢索的文件分開管理的多個目錄信息,并將獲得的目 錄信息顯示在顯示屏幕上。在用戶選擇顯示的目錄信息中的一條目錄信息時, 文件檢索設(shè)備從所選的目錄信息中提取字符串作為關(guān)鍵字,并從被檢索的文件 中檢索與提取的關(guān)鍵字有關(guān)的數(shù)字文件。
如上所述,日本專利申請公開第2000-231568號中揭示的文件檢索設(shè)備僅 可以處理數(shù)字文件。然而,現(xiàn)實世界中存在的大多信息不是數(shù)字信息,而M 于紙張的信息,例如報紙和雜志。換句話說,日本專利申請公開第2000-231568 號中揭示的文件檢索設(shè)備不能處理現(xiàn)實世界中存在的大多數(shù)信息。

發(fā)明內(nèi)容
本發(fā)明的目的是至少部分地解決傳統(tǒng)技術(shù)中的問題。
依據(jù)本發(fā)明的一方面,提供一種信息檢索設(shè)備,該信息檢索設(shè)備連接到網(wǎng) 絡(luò),包括顯示單元,包括顯示從輸入單元接收到的輸入信息的第一屏幕,以 及,顯示檢索結(jié)果的第二屏幕,第一屏幕和第二屏幕能從用戶接收操作輸入; 區(qū)域劃分單元,將輸入信息按每種信息屬性劃分為多個子區(qū)域;提取單元,從
每個子區(qū)域中的輸入信息提取檢索關(guān)鍵字;顯示控制單元,將子區(qū)域中的輸入 信息顯示在第一屏幕上,接收用于指定要被移動到第二屏幕的、第一屏幕上顯 示的任一子區(qū)域的指令;以及,檢索單元,基于與移動到第二屏幕的子區(qū)域?qū)?應(yīng)的檢索關(guān)鍵字經(jīng)由網(wǎng)絡(luò)檢索信息,其中,顯示控制單元將檢索到的信息顯示 在第二屏幕上。
依據(jù)本發(fā)明的另 一方面,提供一種從網(wǎng)絡(luò)檢索信息的方法,該方法包括 在顯示單元上顯示其上顯示了從輸入單元接收的輸入信息的第一屏幕,并顯示 其上顯示了檢索的結(jié)果的第二屏幕,第 一屏幕和第二屏幕能從用戶接收操作輸 入;按每種信息屬性將輸入信息劃分為多個子區(qū)域;從每個子區(qū)域的輸入信息 提取檢索關(guān)鍵字;提供控制來在第一屏幕上顯示輸入信息,并接收用于指定要 移動到第二屏幕的、第一屏幕上顯示的任一子區(qū)域的指令;以及,基于與要移 動到第二屏幕的子區(qū)域?qū)?yīng)的檢索關(guān)鍵字經(jīng)由網(wǎng)絡(luò)檢索信息,其中,提供控制
包括將檢索到的信息顯示在第二屏幕上。
依據(jù)本發(fā)明再一方面,提供一種包含計算機程序的計算機程序產(chǎn)品,其在 計算機上執(zhí)行時執(zhí)4于上述的方法。
在連同附圖一起考慮時,通過閱讀以下的本發(fā)明目前的實施例的詳細(xì)描 述,將更好地理解本發(fā)明的上述的和其他的目的、特征、優(yōu)點以及技術(shù)上和產(chǎn) 業(yè)上的意義。


圖1為包含了依據(jù)本發(fā)明第一實施例的文件檢索設(shè)備的圖像形成裝置的 框圖2為圖1中所示的區(qū)域劃分單元的框圖; 圖3為圖2中所示的屬性分析單元的框圖; 圖4為圖3中所示的字符辨別單元的框圖; 圖5為圖1中所示的關(guān)^^建字提取單元的框圖; 圖6為圖1中所示的操作顯示單元的示意圖; 圖7為圖6中所示的操作顯示單元的監(jiān)視器的示例的示意圖; 圖8為用于解釋由依據(jù)第一實施例的文件檢索設(shè)備執(zhí)行的文件檢索處理 的流程圖9為連接到圖1中所示的文件檢索設(shè)備中包含的輸入/輸出單元的其他 輸入設(shè)備的框圖10為包含了依據(jù)第一實施例的文件檢索設(shè)備的圖像形成裝置的外觀
圖11為包含了依據(jù)本發(fā)明第二實施例的文件檢索設(shè)備的圖像形成裝置的 框圖12為用于解釋圖11中顯示的監(jiān)視器上顯示的內(nèi)容的示意圖; 圖13為包含了依據(jù)本發(fā)明第三實施例的文件檢索設(shè)備的圖像形成裝置的 框圖14為包含了依據(jù)本發(fā)明第四實施例的文件檢索設(shè)備的圖像形成裝置的 框圖15A為用于解釋在監(jiān)視器上顯示的內(nèi)容的示意圖,該監(jiān)視器包含在依 據(jù)本發(fā)明第五實施例的文件檢索設(shè)備中;
圖15B為關(guān)鍵字手寫輸入屏幕的示例的示意圖16為用于解釋在監(jiān)視器上顯示的內(nèi)容的示意圖,該監(jiān)視器包含在依據(jù) 本發(fā)明第五實施例的變形的文件檢索設(shè)備中;
圖17為包含了依據(jù)本發(fā)明第六實施例的文件檢索設(shè)備的圖像形成裝置的 框圖18為用于解釋在圖17中所示的監(jiān);f見器上顯示的內(nèi)容的示意圖; 圖19為包含了依據(jù)本發(fā)明第七實施例的文件檢索設(shè)備的圖像形成裝置的 框圖20為用于解釋在圖19中所示的監(jiān)視器上顯示的內(nèi)容的示意圖; 圖21為包含了依據(jù)本發(fā)明第八實施例的文件檢索設(shè)備的圖像形成裝置的 框圖22為用于解釋在圖21中所示的監(jiān)視器上顯示的內(nèi)容的示意圖23為用于解釋在監(jiān)視器上顯示的內(nèi)容的示意圖,該監(jiān)視器包含在依據(jù)
本發(fā)明第八實施例的變形的文件檢索設(shè)備中;
圖24為作為依據(jù)本發(fā)明第九實施例的文件檢索設(shè)備的個人計算機(PC)
的框圖25為用于解釋由依據(jù)第九實施例的PC執(zhí)行的文件檢索處理的流程圖; 圖26為作為依據(jù)本發(fā)明第十實施例的文件檢索設(shè)備的移動電話的示意
圖27為圖像形成裝置的硬件配置的框圖,該圖像形成裝置包含依據(jù)第一 實施例的文件檢索設(shè)備;以及
圖28為依據(jù)第九實施例的PC的硬件配置的框圖。
具體實施例方式
以下參考附圖詳細(xì)"i兌明本發(fā)明的示意性實施例。
依據(jù)本發(fā)明第一實施例的文件檢索(retrieval)設(shè)備包含在圖像形成裝置 中。當(dāng)通過圖像形成裝置中包含的掃描器掃描文件時,文件檢索設(shè)備自動地從 掃描的文件數(shù)據(jù)中讀取文本數(shù)據(jù),并從文本數(shù)據(jù)中提取關(guān)鍵詞。文件檢索設(shè)備 經(jīng)由網(wǎng)絡(luò)從連接到文件檢索設(shè)備的其他數(shù)據(jù)庫設(shè)備檢索與提取的關(guān)鍵詞有關(guān) 的文件數(shù)據(jù),并將4企索到的文件數(shù)據(jù)顯示在監(jiān)纟見器上。以此方式,僅僅通過掃 描文件,包含了文件檢索設(shè)備的圖形形成裝置可以容易地從網(wǎng)絡(luò)上的數(shù)據(jù)庫設(shè) 備檢索與掃描的文件數(shù)據(jù)的內(nèi)容有關(guān)的文件數(shù)據(jù),從而用戶不需要執(zhí)行任何繁 瑣的鍵盤操作。以下詳細(xì)說明包含了依據(jù)第一實施例的文件檢索設(shè)備的圖像形 成裝置。
圖1為包含了依據(jù)第一實施例的文件檢索設(shè)備10的圖像形成裝置的框圖。 圖像形成裝置包括掃描器1、圖像處理單元2、圖像輸出單元3以及文件檢索 設(shè)備IO。圖像形成裝置經(jīng)由網(wǎng)絡(luò)4連接到數(shù)據(jù)庫設(shè)備5。
文件檢索設(shè)備10包括區(qū)域劃分單元11、關(guān)鍵字提取單元12、檢索單元 13、顯示控制單元14、操作顯示單元15以及輸入/輸出單元16。圖像處理單 元2相對于掃描器1獲取的文件圖像,執(zhí)行圖像轉(zhuǎn)換處理,例如數(shù)字轉(zhuǎn)換或者 伽馬轉(zhuǎn)換,從而生成例如位像。圖像處理單元2將處理后的文件圖像發(fā)送 到輸入/輸出單元16。
輸入/輸出單元16將文件圖像發(fā)送到區(qū)域劃分單元11。區(qū)域劃分單元11 將文件圖像劃分為包含圖像數(shù)據(jù)的圖像區(qū)域、以及包含非圖像數(shù)據(jù)的數(shù)據(jù)的非 圖像區(qū)域。區(qū)域劃分單元11分析包含在圖像區(qū)域中的圖像數(shù)據(jù),并從圖像數(shù) 據(jù)中提取出文件組件。文件組件可以是文本、例如為照片的圖形圖像、圖表或
標(biāo)題。文件組件通常占據(jù)文件的主要部分。
區(qū)域劃分單元11也分析每個文件組件的屬性,并將圖像區(qū)域按照每種屬 性劃分為多個子區(qū)域。屬性可以是文本、圖表、圖形圖像或其他。
圖2為區(qū)域劃分單元11的詳細(xì)框圖。區(qū)域劃分單元11包括區(qū)域識別單元 lla和屬性分析單元llb。區(qū)域識別單元lla在掃描的文件數(shù)據(jù)中識別子區(qū)域 的類型以及子區(qū)域存在的地方。如果區(qū)域?qū)傩詾槲谋荆瑒t子區(qū)域?qū)?yīng)于每個段 落,如果區(qū)域?qū)傩詾閳D表,則子區(qū)域?qū)?yīng)于每個圖表,如果區(qū)域?qū)傩詾閳D形圖 像,則子區(qū)域?qū)?yīng)于每個圖形圖像。
區(qū)域識別單元lla基于是否有濃度的變化、是否有邊緣或是否有半色調(diào)區(qū) 域等識別子區(qū)域。例如,在檢測到基于濃度的差異確定為字符的一系列的部分 時,區(qū)域識別單元lla將這些部分識別為文本區(qū)域。在檢測到一區(qū)域中一系列 的半色調(diào)像素時,區(qū)域識別單元lla將該區(qū)域識別為圖形圖像子區(qū)域。類似的, 當(dāng)在一區(qū)域中檢測到邊緣部分、以及色彩密度的顯著差異時,區(qū)域識別單元 lla將該區(qū)域識別為圖表子區(qū)域。對于其他的子區(qū)域,區(qū)域識別單元lla將子 區(qū)域識別為包含了文本、圖形和圖表的組合的子區(qū)域,或識別為不是包含了該 組合的子區(qū)域的子區(qū)域,并且,通過使用該共同的區(qū)域識別方法識別每個子區(qū) 域。
屬性分析單元llb分析由區(qū)域識別單元lla識別的每個子區(qū)域的屬性,也 就是,分析該子區(qū)域是否包含了文本圖像、圖形圖像、半色調(diào)圖像、圖表圖像 或者其他圖像中的任一圖像。其結(jié)果是,按照每種數(shù)據(jù)屬性分析每個識別的區(qū) 域,也就是,按照每種數(shù)據(jù)屬性將文件數(shù)據(jù)劃分為子區(qū)域。按照每種數(shù)據(jù)屬性 劃分的子區(qū)域的元素被:視為文件組件。
圖3為屬性分析單元lib的框圖。屬性分析單元lib包括布局分析單元 llbl和字符辨別單元11b2。布局分析單元11M基于由區(qū)域識別單元lla提取 的文件組件分析文件數(shù)據(jù)的布局。布局分析單元llbl以將共同邏輯應(yīng)用于才企 測到的信息(例如邊緣、半色調(diào)、和像素位置)的方式執(zhí)行布局分析,從而分 析子區(qū)域的布局。
圖4為字符辨別單元11b2的框圖。字符辨別單元11b2包括字符剪輯單元 11b21、樣條矢量轉(zhuǎn)換(spline-vectorconverting)單元llb22、以及光學(xué)字符讀
取(optical character reading, OCR)單元llb23。
字符辨別單元11b2執(zhí)行關(guān)于數(shù)據(jù)屬性被屬性分析單元llb分析為文本數(shù) 據(jù)的文件組件的字符辨別,并將文本元素轉(zhuǎn)化為機器可處理的格式。
字符剪輯單元ub21通過檢測色彩密度差異來剪切字符。字符剪輯單元 llb21精確地剪切字符,從而可以精確地執(zhí)行字符分析。
樣條矢量轉(zhuǎn)換單元llb22將線性樣條函數(shù)(linear spline function)應(yīng)用于 剪輯的字符。通過應(yīng)用線性樣條函數(shù),可以使得剪輯的字符的輪廓變得平滑。
OCR單元llb23關(guān)于由樣條矢量轉(zhuǎn)換單元llb22對其應(yīng)用了線性樣條函 數(shù)的字符,執(zhí)行光學(xué)字符辨別。也就是,OCR單元llb23從字符圖像提取文 本數(shù)據(jù)。
以此方式,字符辨別單元11b2將字符圖像轉(zhuǎn)化為機器可處理的格式的文 本數(shù)據(jù)。關(guān)鍵字提取單元12從可以精確且快速地提取關(guān)鍵字的這個文本數(shù)據(jù) 中提取關(guān)鍵字。另外,可以通過使用任何可用的算法執(zhí)行字符辨別。
如圖1所示,操:作顯示單元15包括操作單元15a,其可以從用戶接收 輸入,例如數(shù)據(jù)或指令;以及,監(jiān)視器15b,其上顯示用戶輸入的信息和檢索 結(jié)果。
顯示控制單元14控制監(jiān)視器15b上顯示何種內(nèi)容、在監(jiān)視器15b上的何 處顯示內(nèi)容以及如何在監(jiān)視器15b上顯示內(nèi)容。例如,顯示控制單元14控制 文件數(shù)據(jù)在監(jiān)^L器15b上的顯示,該文件數(shù)據(jù)由區(qū)域劃分單元11按各種屬性 劃分為子區(qū)域。區(qū)域劃分單元11可以用于按用戶經(jīng)由操作單元15a設(shè)置的屬 性將文本數(shù)據(jù)劃分為子區(qū)域。當(dāng)用戶在查看顯示的圖像后發(fā)現(xiàn)由區(qū)域劃分單元 11分析為文本圖像的該顯示的圖像實際上是圖形圖像時,用戶可以通過操作 操作顯示單元15將該顯示的圖像的屬性從文本數(shù)據(jù)改變?yōu)閳D形圖像。在接收 到來自用戶的用于改變數(shù)據(jù)屬性的指令,區(qū)域劃分單元11將該顯示的圖像的 數(shù)據(jù)屬性改變?yōu)閳D形圖像數(shù)據(jù)。
有時,用戶可以注意到字符的讀出錯誤。在注意到讀出錯誤時,用戶輸入 指令來修正該讀出錯誤。在接收到這樣的指令時,字符辨別單元11b2基于該 指令修正文本數(shù)據(jù)。以此方式,用戶可以改變作為子區(qū)域的文件組件的數(shù)據(jù)屬 性,并修正字符的讀出錯誤。
圖5為關(guān)鍵字提取單元12的框圖。關(guān)鍵字提取單元12包括關(guān)鍵字字典 12a。作為關(guān)鍵字的字存儲在關(guān)鍵字字典12a中。
關(guān)鍵字提取單元12通過應(yīng)用語形學(xué)分析按每種詞素劃分包含在文本子區(qū) 域中的字符串。關(guān)鍵字提取單元12確定按每種詞素的每個字符串是否與關(guān)鍵 字字典12a中存儲的任一關(guān)鍵字匹配。如果字符串與關(guān)鍵字匹配,則關(guān)鍵字提 取單元12將匹配的字符串作為候選關(guān)鍵字提取。關(guān)鍵字提取單元12可以配置 成通過應(yīng)用算法(該算法基于例如通過布局分析和出現(xiàn)頻率獲得的條件)來限 縮候選的關(guān)鍵字,從而確定關(guān)鍵字。
檢索單元13將關(guān)鍵字提取單元12提取的關(guān)鍵字和基于該關(guān)鍵字的搜索命 令經(jīng)由輸入/輸出單元16發(fā)送到與網(wǎng)絡(luò)4連接的Web上的數(shù)據(jù)庫設(shè)備5。
在接收到該關(guān)鍵字和搜索命令時,數(shù)據(jù)庫設(shè)備5基于該關(guān)鍵字搜索信息, 并將搜索中檢索到的信息以超文本鏈接標(biāo)示語言(HTML)的形式經(jīng)由網(wǎng)絡(luò)4 發(fā)送到文件檢索設(shè)備10。文件檢索設(shè)備10經(jīng)由輸入/輸出單元16接收該信息。
在接收到HTML文件形式的信息時,顯示控制單元14將接收到的信息顯 示在監(jiān)視器15b上。顯示控制單元14將該信息顯示在帶有Web瀏覽器的監(jiān)視 器15b上,從而用戶可以觀看帶有瀏覽器的監(jiān)視器15b上的信息,就像是利用 個人計算機(PC)的網(wǎng)頁搜索一樣。
圖6為操作顯示單元15的示意圖。用戶可以通過按下或接觸按鍵或數(shù)字 鍵盤將指令輸入到操作單元15a。監(jiān)視器15b在其上顯示掃描器1掃描的圖像、 設(shè)置項目以及檢索結(jié)果。監(jiān)視器15b接收用于設(shè)置的觸摸輸入、或者用戶手指 的4fe》文(drag-and-drop)才喿作。
如圖6所示,在監(jiān)視器15b上并列地顯示了兩個不同的圖像,一個在左邊, 另一個在右邊。掃描器1掃描的文件圖像顯示在整個顯示屏幕601左側(cè)的屏幕 610上。從數(shù)據(jù)庫設(shè)備5接收的信息顯示在整個顯示屏幕601右側(cè)的屏幕630 上。
在屏幕610上,文件圖像由區(qū)域劃分單元11按每種數(shù)據(jù)屬性劃分為子區(qū) 域,并由顯示控制單元14顯示在監(jiān)視器15b上。例如,子區(qū)域611、 612包括 圖形圖像,而子區(qū)域613包括文本數(shù)據(jù)。
關(guān)鍵字提取單元12從包含了文本數(shù)據(jù)的每個子區(qū)域提取關(guān)鍵字,檢索單
元13使數(shù)據(jù)庫設(shè)備5搜索與提取的關(guān)鍵字有關(guān)的信息。在圖6所示的示例中, 從屏幕610上的文本數(shù)據(jù)子區(qū)域提取"森林"、"紙張"、"紙漿"和"原料"作 為關(guān)鍵字。
圖7為監(jiān)視器15b上顯示的內(nèi)容的放大圖。由掃描器l掃描的圖像顯示在 監(jiān)視器15b的整個顯示屏幕701左側(cè)的屏幕710上。屏幕710上顯示的圖像由 區(qū)域劃分單元11按每種數(shù)據(jù)屬性劃分為子區(qū)域。例如,子區(qū)域711包含圖形 圖像,而子區(qū)域712包含文本數(shù)據(jù)。
如圖7所示,顯示控制單元14以每個子區(qū)域由一框包圍的方式控制圖像 顯示在屏幕710上。可選擇的,顯示控制單元14可以以每個子區(qū)域閃爍或陰 影化的方式控制圖像顯示在屏幕710上。只要可以清楚地區(qū)分每個子區(qū)域,則 可以采用任一顯示方式。
另外,最好是,顯示控制單元14控制顯示圖像,在圖像中,由關(guān)鍵字提 取單元12提取的每個關(guān)鍵字通過以框、閃爍或陰影化包圍而加亮,從而,用 戶可以容易地辨別提取的關(guān)鍵字。
文件檢索設(shè)備IO可以以在掃描器1掃描文件完成時檢索單元13開始檢索 的方式配置。文件檢索設(shè)備IO可以配置來選擇是否顯示掃描的圖像。在大多 數(shù)情況下,用戶擁有要經(jīng)受掃描的原始文件,因此,如果將掃描的圖像隱藏并 主要地顯示檢索到的信息則對于用戶而言是視覺上友好的。
檢索到的信息顯示在整個顯示屏幕701右側(cè)的屏幕730上。在圖像僅由掃 描器1掃描時,沒有檢索到任何信息,從而,沒有圖像顯示在屏幕730上,也 就是,僅僅顯示其為檢索屏幕。
對于開始掃描的操作輸入,用戶以手指接觸指定的文本子區(qū)域,例如子區(qū) 域712,并將子區(qū)域712拖放到屏幕730中。從而開始檢索與子區(qū)域712的關(guān) 鍵字有關(guān)的信息。
即使選擇了多個文本子區(qū)域,例如子區(qū)域712和713,也可以以與上述相 同的方式,將子區(qū)域712和713拖放到屏幕730中,從而開始檢索與子區(qū)域 712和713的關(guān)鍵字有關(guān)的信息。以此方式,可以連續(xù)地執(zhí)行子區(qū)域的選擇和 關(guān)鍵字的提取,從而可以提高操作效率。
操作顯示單元15接收具體標(biāo)準(zhǔn)(specification)來從監(jiān)視器15b上顯示的
子區(qū)域中選擇要經(jīng)受檢索的子區(qū)域,并接收指令來釋放所選的子區(qū)域的標(biāo)準(zhǔn)。
最好是,顯示控制單元14以與其他子區(qū)域不同的方式顯示所選的子區(qū)域。以
此方式,用戶可以選擇要指定的子區(qū)域,并且關(guān)鍵字從所選的子區(qū)域中被提取。 從而,由于通過選擇子區(qū)域限縮了關(guān)鍵字,因此可以精確地提高檢索性能。
在此情況下,最好是,操作顯示單元15接收通過人手指或鐵筆的觸摸輸 入或通過鼠標(biāo)的輸入而輸入的操作指令。
如果沒有指定子區(qū)域,則關(guān)鍵字提取單元12從整個掃描的文本數(shù)據(jù)(即 所有文本子區(qū)域)提取關(guān)鍵字。以此方式,可以自動地檢索與整個掃描的文件
數(shù)據(jù)有關(guān)的信息。
在檢索單元13接收到由數(shù)據(jù)庫設(shè)備5基于關(guān)鍵字搜索到的信息時,顯示 控制單元14利用瀏覽器將檢索到的信息顯示在屏幕730上。
圖8為用于說明由文件檢索設(shè)備IO執(zhí)行的文件檢索處理的流程圖。輸入/ 輸出單元16檢測輸入/輸出單元16是否已接收到來自掃描器1的掃描數(shù)據(jù)(步 驟S101)。在接收到來自掃描器1的掃描數(shù)據(jù)時(步驟S101,是),輸入/輸出 單元16將接收到的數(shù)據(jù)輸出到區(qū)域劃分單元11。
區(qū)域劃分單元11識別掃描數(shù)據(jù)例如位像的區(qū)域(步驟S102)。區(qū)域 劃分單元11對包含在識別的區(qū)域中的數(shù)據(jù)的屬性進(jìn)行分析。也就是,區(qū)域劃 分單元ll分析包含在識別的區(qū)域中的數(shù)據(jù)是文本、圖形圖像、圖表或其他(例 如文本、圖形圖像和圖表的組合)中任意一種,來按每種數(shù)據(jù)屬性將該數(shù)據(jù)劃 分為子區(qū)域(步驟S103)。
特別的,區(qū)域劃分單元11指定包含文本數(shù)據(jù)的任一子區(qū)域來提取關(guān)鍵字 (步驟S104)。
顯示控制單元14確定輸入信息是否被設(shè)置成要顯示在監(jiān)視器15b上(步 驟S105)。如果輸入信息沒有被設(shè)置成要顯示在監(jiān)視器15b上(步驟S105, 否),顯示控制單元14則不將輸入信息顯示在監(jiān)視器15b上,并且關(guān)鍵字提取 單元12從輸入信息的整個區(qū)域中提取關(guān)鍵字(步驟S109 )。
另一方面,如果輸入信息被設(shè)置成要顯示在監(jiān)視器15b上(步驟S105, 是),顯示控制單元14則將輸入信息顯示在監(jiān)視器15b上(步驟S106),例如 在圖7所示的屏幕710上。
操作顯示單元15檢測操作顯示單元15是否接收了子區(qū)域的任一標(biāo)準(zhǔn)(步 驟S107)。如果4企測到操作顯示單元15沒有接收到子區(qū)域的任何標(biāo)準(zhǔn)(步驟 S107,否),關(guān)鍵字提取單元12則從所有輸入信息提取關(guān)鍵字(步驟S109)。
另一方面,如果檢測到操作顯示單元15接收到子區(qū)域的標(biāo)準(zhǔn)(步驟S107, 是),關(guān)鍵字提取單元12則從指定的子區(qū)域提取關(guān)鍵字(步驟S108)。此時, 用戶可以通過以其手指接觸子區(qū)域來指定子區(qū)域,并且,將該子區(qū)域拖放到檢 索屏幕來開始4全索。
檢索單元13在Web上檢索與提取的關(guān)鍵字有關(guān)的信息。具體的,檢索單 元13將提取的關(guān)鍵字和搜索命令發(fā)送到數(shù)據(jù)庫設(shè)備5,并使數(shù)據(jù)庫設(shè)備5搜 索與提取的關(guān)鍵字有關(guān)的信息。在接收到提取的關(guān)鍵字和搜索命令時,數(shù)據(jù)庫 設(shè)備5搜索與提取的關(guān)鍵字有關(guān)的信息,并將搜索到的信息經(jīng)由網(wǎng)絡(luò)4發(fā)送到 文件檢索設(shè)備10 (步驟S110 )。
當(dāng)輸入/輸出單元16接收到來自數(shù)據(jù)庫設(shè)備5的Web搜索的結(jié)果時(步驟 Slll,是),顯示控制單元14將接收到的信息作為搜索結(jié)果顯示在監(jiān)視器15b 的檢索屏幕上,例如圖7所示的屏幕730 (步驟S112 )。
以此方式,利用單個應(yīng)用軟件,文件檢索設(shè)備10可以執(zhí)行由掃描器l掃 描的文件數(shù)據(jù)的區(qū)域劃分,文本數(shù)據(jù)的分析,關(guān)鍵字的提取,數(shù)據(jù)的Web搜 索,以及檢索結(jié)果的顯示。
由掃描器1掃描的文件數(shù)據(jù)和檢索到的信息并列地顯示在操作顯示單元 15的監(jiān)視器15b上,這樣的顯示使得用戶更容易將原始文件與基于該文件在 Web上自動搜索到的檢索信息進(jìn)行比較。
在檢索單元13重新執(zhí)行信息檢索時,最好是,顯示控制單元14在檢索屏 幕上更新顯示最新4企索到的信息。
也可以不將文件圖像顯示在監(jiān)視器15b上。換句話說,如果用戶想僅觀看 檢索到的信息,則不顯示掃描數(shù)據(jù)屏幕,從而用戶可以以全屏方式觀看檢索到 的信息。
以此方式,包含了文件檢索設(shè)備10的圖像形成裝置可以僅通過掃描文件 而無需任何繁瑣的鍵盤操作,容易地從網(wǎng)絡(luò)上的數(shù)據(jù)庫設(shè)備檢索與掃描的文件 的內(nèi)容有關(guān)的信息。進(jìn)一步,包含了文件檢索設(shè)備10的圖像形成裝置可以以 簡單的操作從網(wǎng)絡(luò)設(shè)備檢索與電子媒體形式的掃描文件有關(guān)的信息。
如上所述,依據(jù)第一實施例,按屬性將輸入信息劃分為多個子區(qū)域,并且, 以構(gòu)成輸入信息的每個子區(qū)域為單位提取檢索字。子區(qū)域顯示在左側(cè)的屏幕 (第一屏幕)上,并且,通過用戶將第一屏幕上的任一子區(qū)域移動到右側(cè)的檢 索屏幕(第二屏幕)?;谝苿拥綑z索屏幕的子區(qū)域的檢索字經(jīng)由網(wǎng)絡(luò)檢索文
件,并將檢索到的文件顯示在第二屏幕上。因此,用戶可以容易地檢索文件,
并可再次使用所顯示的^r索到的文件。
圖9為用于說明連接到輸入/輸出單元16的各種輸入設(shè)備的框圖。電荷耦
合器件(CCD)攝像機(camera) la連接到輸入/輸出單元16,從而輸入/輸出
單元16可以從CCD攝像機la接收目標(biāo)的圖形圖像。在輸入/輸出單元16接
收由CCD攝像機la拍攝的圖形圖像時,區(qū)域劃分單元11將該圖形圖像劃分
為子區(qū)域??梢詮木W(wǎng)絡(luò)才企索到與從每個圖形圖像子區(qū)域提取的關(guān)鍵字有關(guān)的信 自
手寫輸入板lb連接到輸入/輸出單元16,從而輸入/輸出單元16可以接收 用戶使用手寫輸入4反lb手寫的文本,作為文本數(shù)據(jù)。當(dāng)輸入/輸出單元16接 收到使用手寫輸入板lb輸入的手寫文本數(shù)據(jù)時,區(qū)域劃分單元11將手寫的文 本數(shù)據(jù)劃分為子區(qū)域。從通過應(yīng)用OCR辨別為文本的每個文本子區(qū)域提取關(guān) 鍵字??梢詮木W(wǎng)絡(luò)檢索與提取的關(guān)鍵字有關(guān)的信息。而且,可以利用手寫輸入 板lb輸入關(guān)鍵字或者修改文本數(shù)據(jù)。
卡讀取/寫入器lc連接到輸入/輸出單元16。卡讀取/寫入器lc從記錄媒體 讀出數(shù)據(jù),或向記錄々某體寫入數(shù)據(jù),該記錄々某體例如為,光盤(CD)、數(shù)字化 視頻光盤(DVD)、緊湊閃存(compact flash, CF)卡,以及安全數(shù)字(SD) 存儲卡。當(dāng)輸入/輸出單元16接收到記錄媒體中存儲的、由卡讀取/寫入器讀出 的數(shù)據(jù)時,區(qū)域劃分單元11將該數(shù)據(jù)劃分為子區(qū)域??梢詮木W(wǎng)絡(luò)檢索到與從 每個子區(qū)域提取的關(guān)鍵字有關(guān)的信息。
第一實施例涉及從輸入設(shè)備接收信息。相同或類似的技術(shù)可以應(yīng)用在將信 息輸出到輸入設(shè)備時。也就是,輸入/輸出單元16可以配置來通過卡讀取/寫入 器lc的幫助在記錄媒體(例如CD、 DVD、 CF和SD存儲器)上寫入數(shù)據(jù)。
可選的,輸入/輸出單元16可以配置成經(jīng)由網(wǎng)絡(luò)4接收信息,并經(jīng)由網(wǎng)絡(luò)
4發(fā)送檢索到的信息。而且,輸入/輸出單元16可以配置成經(jīng)由圖像輸出單元 3輸出檢索到的信息,來將檢索到的信息打印在記錄紙張上。
最好是,關(guān)鍵字字典12a對其中存儲的每個關(guān)鍵字的點擊數(shù)(hit count) 進(jìn)行計數(shù),從而可以將關(guān)鍵字與點擊數(shù)關(guān)聯(lián)地存儲。從而,可以以使用頻率的 形式排列關(guān)鍵字,因此可以更快地提取關(guān)鍵字。
最好是,將關(guān)鍵字以按種類分類地方式存儲在關(guān)鍵字字典12a中,從而可 以高速地執(zhí)行基于關(guān)鍵字的信息檢索。
在每次關(guān)鍵字提取單元12執(zhí)行關(guān)鍵字提取時,最好將滿足預(yù)定點擊數(shù)和 預(yù)定文法條件的字符串登記在關(guān)鍵字字典12a中。這是因為,新的關(guān)鍵字是伴 隨時間或伴隨經(jīng)受檢索的文件的類型的增加而出現(xiàn)的,同樣,關(guān)鍵字的出現(xiàn)頻 率也隨著時間改變。
此外,最好是,關(guān)鍵字提取單元12從每個文本子區(qū)域?qū)⒊霈F(xiàn)頻率超過一 閾值的字提取出來,作為關(guān)鍵字。如果字具有較低的出現(xiàn)頻率,則最大的可能 是,不把該字作為關(guān)鍵字。
操作顯示單元15可以配置成接收用于設(shè)置要提取的關(guān)鍵字的數(shù)量的輸 入。通過控制關(guān)鍵字的數(shù)量,可以限縮或放寬4企索的范圍。
如果關(guān)鍵字的設(shè)定數(shù)量大于文本子區(qū)域中包含的字的數(shù)量,則最好是,關(guān) 鍵字提取單元12將所有的字提取作為一關(guān)鍵字。例如,如果文件主要包含照 片和圖表,則其可以僅是標(biāo)題,即,包含在該文件中的文本數(shù)據(jù)是標(biāo)題。在此 情況下,將所有檢測到的字選擇作為關(guān)鍵字。
圖10為包含了文件檢索設(shè)備10的圖像形成裝置的外部透視圖。以下參考 圖IO說明圖像形成裝置執(zhí)行的圖像形成操作。該圖像形成操作是一種已知的 技術(shù),因此以下簡單的說明該圖像形成操作。.
假設(shè)圖像形成裝置為數(shù)字復(fù)印機100。數(shù)字復(fù)印機100包括打包器 (package )110、大容量托盤(large capacity tmy, LCT )111、文件處理器(finisher) 112、文件自動進(jìn)給器(auto document feeder, ADF) 113、操作單元114以及紙 張進(jìn)給單元115。 LCT 111中擁有大容量的記錄紙張。文件處理器112對復(fù)印 的記錄紙張進(jìn)行揀選(sort )、穿孔以及分類(staple )。 ADF 113和操作單元114 安裝在打包器110的上面。要掃描的文件放在ADF 113上。操作單元114從
用戶接收設(shè)置指令,例如用于掃描模式的設(shè)置、用于復(fù)印縮放比例的設(shè)置、用 于托盤的設(shè)置以及用于要由文件處理器12執(zhí)行的后處理的設(shè)置,并在其上對
用戶顯示消息。操作單元114可以作為操作顯示單元15工作。
紙張進(jìn)給單元115布置在打包器110的較低部位。文件處理器112包括紙 張排出托盤117。數(shù)字復(fù)印機100包含許多機構(gòu),例如曝光系統(tǒng),顯影系統(tǒng)、 定影系統(tǒng)以及紙張排出系統(tǒng),從而實現(xiàn)復(fù)印機的功能。
在將文件放在ADF 113上并且用戶按下操作單元114的"復(fù)印開始,,鍵 時,文件被進(jìn)給到在ADF 113下的曝光玻璃(圖未示)上,并且被照明系統(tǒng) (圖未示)和光學(xué)成像系統(tǒng)(圖未示)掃描。在正常的圖像形成操作的情況下, 可以將各種處理(例如,修正)應(yīng)用于掃描的圖像數(shù)據(jù),并且,寫入系統(tǒng)中的 激光二極管基于圖像數(shù)據(jù)發(fā)出光束,從而在感光器(圖未示)上形成靜電潛像。
在包含了文件檢索設(shè)備10的數(shù)字復(fù)印機100中,區(qū)域劃分單元ll、關(guān)鍵 字提取單元12、檢索單元13和顯示控制單元14分別執(zhí)行上述針對掃描的圖 像數(shù)據(jù)說明的各種操作,檢索到的信息顯示在監(jiān)視器15b上。
然后,執(zhí)行電子照相處理。基于用戶輸入到操作單元114的指令,將掃描 的圖像數(shù)據(jù)或檢索到的信息打印在通過紙張進(jìn)給單元115或紙張進(jìn)給單元116 進(jìn)給的記錄紙張上,通過文件處理器112將后處理(例如,揀選、穿孔或分類) 應(yīng)用于打印后的紙張,然后排出到紙張排出托盤117上。
圖11為包含了依據(jù)本發(fā)明第二實施例的文件檢索設(shè)備20的圖像形成裝置 的框圖。文件檢索設(shè)備20和文件檢索設(shè)備10之間的差異在于,文件檢索設(shè)備 20包括顯示控制單元24,而不是顯示控制單元14,并且進(jìn)一步包括統(tǒng)一資源 定位符(URL)訪問單元27。圖11中所示的與圖1所示的相同的部分采用相 同的附圖標(biāo)記表示,并省略這些部分的描述。URL訪問單元27從檢索單元13 獲得的檢索到的信息提取URL,并訪問提取的URL來下載可用于具有URL 的站點的信息。顯示控制單元24將URL訪問單元27下載的信息顯示在帶有 瀏覽器的監(jiān)視器15b上。
圖12為在圖11的監(jiān)視器15b上顯示的內(nèi)容的放大圖。具體的,通過點擊 檢索屏幕上顯示的URL獲得的下載信息被顯示在監(jiān)視器15b上?;谔崛〉?關(guān)鍵字從Web站點檢索的大部分信息包含URL。檢索到的信息顯示在監(jiān)視器
15b右側(cè)的屏幕1210上。例如,當(dāng)用戶雙擊屏幕1210上顯示的URL 1211時, 監(jiān)視器15b接受對于URL 1211的操作輸入。URL訪問單元27訪問經(jīng)由輸入/ 輸出單元16接收的URL來將上載到具有URL 1211的站點的信息下載下來, 顯示控制單元24將下載的信息顯示在帶有瀏覽器的監(jiān)視器15b左側(cè)的屏幕 1220上。
對于顯示在檢索到的信息的頁邊上的URL,以與URL 1211情況相同的方 式,在用戶雙擊在URL上時,上載到具有該URL的站點的信息被下載顯示在 屏幕1220上。
以此方式,URL訪問單元27經(jīng)由網(wǎng)絡(luò)4檢索包含在檢索到的信息中的、 可用于包含URL的站點的信息,從而可以檢索更詳細(xì)的信息。
圖13為包含了依據(jù)本發(fā)明第三實施例的文件檢索設(shè)備30的圖像形成裝置 的框圖。文件檢索設(shè)備30和文件檢索設(shè)備10之間的差異在于,文件檢索設(shè)備 30包括檢索單元33、顯示控制單元34和操作顯示單元35,分別代替檢索單 元13、顯示控制單元14和操作顯示單元15。圖13所示的與圖1所示的相同 的部分以相同的附圖標(biāo)記表示,并省略這些部分的描述。操作顯示單元35包 括操作單元35a和監(jiān)視器35a。操作單元35a從用戶接收操作輸入,用于指定 多個關(guān)鍵字的組合。檢索單元33創(chuàng)建搜索命令來使數(shù)據(jù)庫設(shè)備5檢索與接收 到的關(guān)鍵字的組合有關(guān)的信息,并將創(chuàng)建的與該關(guān)鍵字相關(guān)的搜索命令發(fā)送到 數(shù)據(jù)庫設(shè)備5。因此,如果需要,用戶可以設(shè)置4全索的范圍,也就是可以設(shè)置 來放寬、限縮或者限定在放寬的范圍內(nèi),因此,可以依據(jù)用戶的設(shè)置檢索信息。
操作單元35a接收操作輸入,該操作輸入用于相對于顯示的關(guān)鍵詞指定 AND搜索、OR搜索或AND搜索與OR搜索的組合中的任何一個。檢索單元 33創(chuàng)建搜索命令來指定搜索的范圍,從而,可以更精確地;險索信息。
可選擇地,操作單元35a可以配置來接收用于指定多個子區(qū)域的操作輸 入,以及用于指定指定的子區(qū)域的組合的操作輸入。例如,如果將AND搜索 應(yīng)用于圖7所示的文本子區(qū)域712和713,則檢索單元33基于從字符圖像區(qū) 域712和713提取的命令關(guān)鍵字執(zhí)行信息檢索。另一方面,如果將OR搜索應(yīng) 用于文本子區(qū)域712和713,則檢索單元33基于從文本子區(qū)域712和713提 取的任一關(guān)鍵字執(zhí)行信息檢索。以此方式,可以基于從子區(qū)域的組合提取的關(guān)
鍵字的組合檢索信息,從而可以以子區(qū)域為單位來限縮關(guān)鍵字,或者,可以放 寬信息檢索的范圍。因此,可以通過靈活地限縮關(guān)鍵字來檢索信息。
在設(shè)置了子區(qū)域的組合時,檢索單元33通過基于從子區(qū)域的組合提取的 關(guān)鍵字的組合發(fā)出搜索命令來執(zhí)行信息檢索。此時,用戶不需要設(shè)置關(guān)鍵字。 用戶僅指定子區(qū)域的組合。因此,用戶可以減少操作輸入的次數(shù)。
操作顯示單元35可以配置來接收用于選擇關(guān)鍵字短語(keyphrase)的輸 入。在某些情況下,關(guān)鍵字短語自身是基本的關(guān)鍵字。因此,在操作顯示單元 35配置來接收用于指定關(guān)鍵字短語的輸入時,可以更精確地檢索信息。在此 情況下,檢索單元13基于該關(guān)鍵字短語執(zhí)行信息檢索。作為以關(guān)鍵字短語進(jìn) 行信息檢索的方法的示例是確定多個關(guān)鍵字的順序,并且以將AND搜索應(yīng) 用于排序后的關(guān)鍵字的方式來檢索信息。
在經(jīng)由監(jiān)視器15b指定了位于圖形圖像子區(qū)域附近的文本子區(qū)域時,從指 定的文本子區(qū)域提取關(guān)鍵詞,并且基于與圖形圖像相關(guān)的關(guān)鍵字來檢索信息。 因此,可以檢索與圖形圖像相關(guān)的關(guān)鍵字有關(guān)的信息。
例如,在用戶以其手指拖拉要通過圖7所示的圖形圖像子區(qū)域711的多個 子區(qū)域并將子區(qū)域放入檢索屏幕時,從文本子區(qū)域提取與圖形圖像子區(qū)域711 有關(guān)的關(guān)鍵字,并基于該關(guān)鍵字檢索信息。
在此示例中,圖形圖像子區(qū)域711的圖形圖像可以和與其相關(guān)的檢索到的 信息并列地顯示在4企索屏幕上,從而,可以以相關(guān)的方式顯示檢索到的信息和 圖形圖4象。
圖14為包含了依據(jù)本發(fā)明第四實施例的文件檢索設(shè)備40的圖像形成裝置 的框圖。文件檢索設(shè)備40和文件檢索設(shè)備10之間的差異在于,文件檢索設(shè)備 40包括顯示控制單元44而不是顯示控制單元14,并且另外包括一致性 (identity)確定單元47。圖13所示的與圖1中所示的相同的部分采用相同的 附圖標(biāo)記表示,并省略這些部分的描述。 一致性確定單元47確定掃描器1掃 描的圖像數(shù)據(jù)是否與從數(shù)據(jù)庫設(shè)備5接收的檢索到的信息相同。如果圖像數(shù)據(jù) 與檢索到的信息相同,則顯示控制單元44以不同于檢索到的信息與圖像數(shù)據(jù) 不同時的顯示格式,將與圖像數(shù)據(jù)相同的檢索到的信息顯示在監(jiān)視器15b上。 一致性確定單元47將掃描的圖像數(shù)據(jù)中的預(yù)定數(shù)量的字符串與接收到的
HTML格式的字符串進(jìn)行比較。通過將掃描的圖像數(shù)據(jù)的字符代碼與檢索到的 信息進(jìn)行比較,可以容易地確定掃描的圖像數(shù)據(jù)是否與檢索到的信息的內(nèi)容匹 配。具體的,可以通過將預(yù)定數(shù)量的字符串(該預(yù)定數(shù)量的字符串包圍掃描的 圖像數(shù)據(jù)中的提取的關(guān)鍵字)和與該關(guān)鍵字有關(guān)的檢索到的信息進(jìn)行比較的方 式,確定掃描的圖像數(shù)據(jù)是否與檢索到的信息匹配。
例如,在從Web上的電子數(shù)據(jù)檢索到與掃描器1掃描的報紙文章對應(yīng)的 電子數(shù)據(jù)時,將檢索到的電子數(shù)據(jù)顯示在監(jiān)視器15b上。換句話說,在從Web 上的電子數(shù)據(jù)檢索到電子數(shù)據(jù)(此電子數(shù)據(jù)具有與掃描的^J氏文章相同的內(nèi) 容)時,將檢索到的電子數(shù)據(jù)顯示在監(jiān)視器15b上,因此,實際上可以將模擬 信息轉(zhuǎn)化為數(shù)字信息。
在依據(jù)第四實施例的文件檢索設(shè)備40的變形例中,數(shù)據(jù)庫設(shè)備5確定檢 索到的信息是否與接收到的包含了關(guān)鍵字的文件數(shù)據(jù)匹配,并在檢索到的信息 與文本數(shù)據(jù)匹配時將檢索到的信息發(fā)送到文件檢索設(shè)備40。顯示控制單元44 可以配置來將檢索到的信息連同表示檢索到的信息與掃描的文件數(shù)據(jù)匹配的 信息一起,顯示在監(jiān)視器15b上。順便提一句,在采用這樣的配置時,不必在 文件檢索設(shè)備40中提供一致性確定單元47。
依據(jù)第四實施例的變形例,檢索單元13將關(guān)鍵字連同包圍該關(guān)鍵字的預(yù) 定數(shù)量的字符串一起發(fā)送到數(shù)據(jù)庫設(shè)備5。在接收到該關(guān)鍵字和字符串時,數(shù) 據(jù)庫設(shè)備5將接收到的包含了該關(guān)鍵字的字符串和與該關(guān)鍵字有關(guān)的檢索到 的信息進(jìn)行比較,從而,數(shù)據(jù)庫設(shè)備5可以確定檢索到的信息是否與包含了接 收到的字符串的文件數(shù)據(jù)匹配。如果檢索到的信息與文件數(shù)據(jù)匹配,則數(shù)據(jù)庫 設(shè)備5將檢索到的信息連同表示檢索到的信息與文件數(shù)據(jù)匹配的信息一起發(fā) 送。
例如,在從Web上的電子數(shù)據(jù)檢索到與掃描器1掃描的報紙文章對應(yīng)的 電子數(shù)據(jù)時,將檢索到的電子數(shù)據(jù)顯示在監(jiān)視器15b上。換句話說,從Web 上的電子數(shù)據(jù)檢索到具有與掃描的報紙文章相同內(nèi)容的電子數(shù)據(jù)。在此情況 下,文件檢索設(shè)備40可以排除一致性確定單元47。
以下說明依據(jù)本發(fā)明第五實施例的文件檢索設(shè)備。依據(jù)第五實施例的文件 檢索設(shè)備具有與圖14所示的文件檢索設(shè)備40相同的配置。在依據(jù)第五實施例
的文件檢索設(shè)備中,顯示控制單元44控制多個關(guān)鍵字以開關(guān)按鈕(toggle button)(窗口小部件,widget)的形式顯示在工具欄上。用戶通過經(jīng)由操作顯 示單元15選擇任一顯示的開關(guān)按鈕來指定關(guān)鍵字。檢索單元13基于與所選開 關(guān)按鈕對應(yīng)的關(guān)鍵字來執(zhí)行信息檢索。開關(guān)按鈕為用于指定關(guān)鍵字的屏幕元 素。
圖15A為包含了依據(jù)本發(fā)明第五實施例的文件檢索設(shè)備的監(jiān)視器15b上 顯示的內(nèi)容的放大圖。顯示控制單元44在監(jiān)視器15b左側(cè)的屏幕1510上顯示 劃分為子區(qū)域的掃描數(shù)據(jù),也以包含在屏幕1510中的工具欄1520上的開關(guān)按 鈕的形式顯示由關(guān)鍵字提取單元12從子區(qū)域提取的關(guān)鍵字1521至1524。例 如,在用戶通過觸摸輸入指定關(guān)鍵字1521至1524中的任何一個時,檢索單元 13基于指定的關(guān)鍵字執(zhí)行信息檢索,并且,顯示控制單元44將檢索到的與該 關(guān)鍵字有關(guān)的信息顯示在監(jiān)視器15b右側(cè)的屏幕1530上。
用戶可以通過選擇多個開關(guān)按鈕來指定多個關(guān)鍵字,并且,AND搜索和 OR搜索應(yīng)用于關(guān)鍵字來檢索信息。
而且,如果用戶重新輸入關(guān)鍵字,則可以另外將用于指定該輸入的關(guān)鍵字 的開關(guān)按鈕顯示在工具欄1520上。其結(jié)果是,用戶可以如期望地輸入關(guān)鍵字。
此外,如果手寫輸入板lb可用, 一旦辨別了用戶的手寫字,則可以將該 手寫字用作新的關(guān)^t字。
具體的,在用戶按下用于指定手寫輸入的特定按鈕時,顯示控制單元44 在監(jiān)視器15b上顯示如圖15B所示的關(guān)鍵字手寫輸入。用戶利用手寫輸入板 lb將字手寫在關(guān)鍵字手寫輸入屏幕的手寫區(qū)上,作為額外的關(guān)鍵字。依據(jù)第 五實施例的文件檢索設(shè)備進(jìn)一步包括手寫字辨別單元,從而,手寫字辨別單元 辨別用戶手寫的字,并將辨別的字作為關(guān)鍵字輸出顯示在字辨別結(jié)果區(qū)上。如 果顯示的字辨別的結(jié)果是正確的,則用戶利用手寫輸入板lb按下關(guān)鍵字輸入 屏幕上的"OK,,按鈕。其結(jié)果是,在工具欄1520上另外地顯示開關(guān)按鈕,該 開關(guān)按鈕用于作為關(guān)鍵字的辨別字。
另一方面,如果顯示的字辨別的結(jié)果是錯誤的,則用戶利用手寫輸入板 lb按下關(guān)鍵字手寫輸入屏幕上的"CANCEL"按鈕。其結(jié)果是,手寫輸入?yún)^(qū) 上顯示的手寫字被清除。用戶需要再次手寫該字。
圖16為監(jiān)視器15b上顯示的內(nèi)容的放大圖,該監(jiān)視器15b包含在依據(jù)第 五實施例的變形例的文件檢索設(shè)備中。在此變形例中,顯示控制單元44將檢 索到的信息以開關(guān)按^E的形式顯示在監(jiān)視器15b上。在用戶點擊開關(guān)按鈕時, 可以以全屏方式在監(jiān)視器15b上顯示與檢索到的與開關(guān)按鈕對應(yīng)的信息。
如圖16所示,在監(jiān)視器15b右側(cè)的屏幕1610上顯示了多條檢索到的信息。 在監(jiān)視器15b左側(cè)的屏幕1620上顯示的開關(guān)按鈕1621至1624分別對應(yīng)于屏 幕1610上顯示的檢索到的信息。例如,在用戶點擊開關(guān)按鈕1621時,與開關(guān) 按鈕1621對應(yīng)的報紙文章顯示在開關(guān)按鈕1621至1624區(qū)之下的屏幕1620 上。
依據(jù)第五實施例的變形例的文件檢索設(shè)備以開關(guān)按鈕的形式顯示檢索到 的信息的列表,從而,用戶可以容易地確認(rèn)該列表。此外,與所選開關(guān)按鈕對 應(yīng)的檢索到的信息可以與檢索到的信息的詳細(xì)信息并列地顯示。此時,掃描的 文件圖像或開關(guān)按鈕的列表可以明顯地消失,對監(jiān)視器15b隱藏。
此外,顯示控制單元44可以配置來以開關(guān)按鈕的形式顯示檢索單元13 檢索到的信息的URL。在釆用這樣的配置時,如果用戶點擊開關(guān)按鈕形式的 URL中的任何一個,則依據(jù)第五實施例的變形例的文件檢索設(shè)備可以訪問該 URL來下載信息。
此外,顯示控制單元44可以僅以開關(guān)按鈕的形式表示用戶拖放到監(jiān)視器 15b左側(cè)中的檢索到的信息,也就是,僅僅由用戶確定為必要信息的信息才能 以開關(guān)按鈕方式簡單地表示。
圖17為包含了依據(jù)本發(fā)明第六實施例的文件才企索設(shè)備60的圖像形成裝置 的框圖。文件檢索設(shè)備60與文件檢索設(shè)備10之間的差異在于,文件檢索設(shè)備
不是顯示控制單元14),并且另外包括存儲單元67。圖17中所示的與圖1中 相同的部分以相同的附圖標(biāo)記表示,并且省略這些部分的描述。輸入/輸出單 元66將檢索單元13檢索到的信息中包含的URL發(fā)送到其他的網(wǎng)絡(luò)附加信息 處理設(shè)備,例如PC6。 PC6經(jīng)由網(wǎng)絡(luò)4連接到文件檢索設(shè)備60,從而,PC 6 可以自動接收包含在接收到的信息中的URL,并共享網(wǎng)絡(luò)4上的信息。
如上所述,包含在依據(jù)第五實施例的文件檢索設(shè)備中的顯示控制單元44
以開關(guān)按鈕形式顯示檢索單元13檢索到的信息中的URL。依據(jù)第六實施例, 輸入/輸出單元66將開關(guān)按鈕形式的URL發(fā)送到PC 6。其結(jié)果是,經(jīng)由網(wǎng)絡(luò) 4連接到文件檢索設(shè)備60的PC 6可以共享網(wǎng)絡(luò)4上的包含在檢索到的信息中 的URL??梢栽诮?jīng)由操作單元15a接收到操作輸入時發(fā)送該URL,或者,在 將該URL添加到工具欄時自動發(fā)送該URL。
存儲單元67將檢索到的信息存儲于其中。輸入/輸出單元66將存儲單元 67中存儲的檢索到的信息發(fā)送到PC 6。從而,經(jīng)由網(wǎng)絡(luò)4連接到文件檢索設(shè) 備60的PC 6可以自動地接收檢索到的信息,并共享網(wǎng)絡(luò)4上的信息。
PC 6可以以開關(guān)按鈕形式在監(jiān)視器上顯示接收到的信息或共享的信息, 例如開關(guān)按鈕、與開關(guān)按鈕對應(yīng)的信息以及檢索到的信息。此外,可以通過用 戶的拖放操作將顯示的開關(guān)按鈕插入到PC6中開放的應(yīng)用中。其結(jié)果是,可 以在連接到網(wǎng)絡(luò)4的信息處理設(shè)備中共享地且自由地使用檢索到的信息。
圖18為包含在文件檢索設(shè)備60中的監(jiān)視器15b上顯示的內(nèi)容的放大圖。 顯示控制單元64將檢索到的信息顯示在監(jiān)視器15b右側(cè)的屏幕1810上,并以 窗口小部件欄(widget bar)形式將與檢索到的信息分別對應(yīng)的開關(guān)按鈕1821 至1824顯示在監(jiān)視器15b左側(cè)的屏幕1820上。
輸入/輸出單元66將開關(guān)按鈕1821至1824以及與開關(guān)按鈕1821至1824 對應(yīng)的檢索到的信息發(fā)送到PC 6。從而,經(jīng)由網(wǎng)絡(luò)4連接到文件檢索設(shè)備60 的PC 6可以自動地接收開關(guān)按鈕和與開關(guān)按鈕對應(yīng)的檢索到的信息,并通過 在網(wǎng)絡(luò)上揭露檢索到的信息而共享檢索到的信息。
在從輸入/輸出單元66接收到開關(guān)按鈕和檢索到的信息時,PC 6以圖18 所示的方式以窗口小部件欄形式顯示開關(guān)按^L,從而,PC6的用戶可以自由 地使用共享的4企索到的信息。
圖19為包含了依據(jù)本發(fā)明第七實施例的文件檢索設(shè)備的圖像形成裝置的 框圖。文件檢索設(shè)備70與文件檢索設(shè)備10的差異在于,文件檢索設(shè)備70包 括輸入/輸出單元76 (而不是輸入/輸出單元16)和顯示控制單元74 (而不是 顯示控制單元14),并且另外包括編輯單元和電子郵件創(chuàng)建單元78。與圖1 所示的相同的部分以相同的附圖標(biāo)記表示,并省略這些部分的描述。在操作顯 示單元15接收到用于在監(jiān)視器15b上編輯檢索到的信息的操作輸入時,編輯
單元編輯檢索到的信息。顯示控制單元74將編輯單元編輯的檢索到的信息顯 示在監(jiān)視器15b上。電子郵件創(chuàng)建單元78創(chuàng)建電子郵件信息,該電子郵件信 息包含了編輯單元編輯的檢索到的信息的內(nèi)容。
輸入/輸出單元76輸出由編輯單元編輯并且由顯示控制單元74顯示在監(jiān) 視器15b上的檢索到的信息。以此方式,可以編輯顯示的檢索到的信息,并可 以將編輯后的檢索到的信息用于其他目的。例如,電子郵件創(chuàng)建單元78創(chuàng)建 電子郵件消息,該電子郵件消息包含了編輯后的檢索到的信息的內(nèi)容。創(chuàng)建的 電子郵件消息通過輸入/輸出單元76發(fā)出。
圖20為監(jiān)視器15b上顯示的內(nèi)容的放大圖,在監(jiān)視器15b上顯示了電子 郵件消息,該電子郵件消息包含了編輯后的檢索到的信息的內(nèi)容。如圖20所 示,檢索到的信息顯示在監(jiān)視器15b左側(cè)的屏幕2010上。屏幕2010上的檢索 到的信息包括圖形子區(qū)域2011和文本子區(qū)域2012。電子郵件創(chuàng)建屏幕2020 布置在監(jiān)視器15b右側(cè)。電子郵件創(chuàng)建屏幕2020包括電子郵件消息區(qū)域2021 和附件箱(attachment box) 2022。在將圖形子區(qū)域2011拖放到附件箱2022 中并將文本子區(qū)域2012拖放到電子郵件消息區(qū)域2021中時,電子郵件創(chuàng)建單 元78創(chuàng)建與文本子區(qū)域2012的內(nèi)容相同的電子郵件消息,帶有與圖形子區(qū)域 2011相同圖形圖像的附件。
另外,可以以可擴(kuò)展標(biāo)記語言(XML)格式、HTML格式、文本格式等 中任何一種格式創(chuàng)建電子郵件消息。圖形圖像可以直接附貼到電子郵件消息。 此外,電子郵件創(chuàng)建單元78可以創(chuàng)建轉(zhuǎn)化成了多用途的網(wǎng)際郵件擴(kuò)充協(xié)議 (MIME)消息的電子郵件消息。
以此方式,在依據(jù)第七實施例的文件檢索設(shè)備70中,利用單個應(yīng)用軟件, 可以由掃描器1掃描文件,自動地從掃描的文件數(shù)據(jù)提取關(guān)鍵字來檢索Web 上與提取的關(guān)鍵字有關(guān)的信息,檢索到的信息顯示在監(jiān)視器15b上,并且用戶 可以發(fā)送其中編輯了檢索到的信息的電子郵件。從而,文件檢索設(shè)備70可以 提高用戶友好度。
圖21為包含了依據(jù)本發(fā)明第八實施例的文件檢索設(shè)備80的圖像形成裝置 的框圖。文件檢索設(shè)備80與文件檢索設(shè)備10的差異在于,文件檢索設(shè)備80 包括輸入/輸出單元86 (而不是輸入/輸出單元16 ),顯示控制單元84 (而不是
顯示控制單元14)以及檢索單元83 (而不是檢索單元13),并且另外包括圖 像特征提取單元87。與圖1所示的相同的部分采用相同的附圖標(biāo)記表示,并 省略這些部分的描述。圖像特征提取單元87提取在構(gòu)成掃描的文件數(shù)據(jù)的每 個子區(qū)域中包含的數(shù)據(jù)的特征。檢索單元83經(jīng)由網(wǎng)絡(luò)4將提取的特征、以及 用于檢索與提取的特征有關(guān)的信息的指令發(fā)送到數(shù)據(jù)庫設(shè)備85。在接收到該 指令時,數(shù)據(jù)庫設(shè)備85搜索與提取的特征有關(guān)的信息,并將搜索到的信息經(jīng) 由網(wǎng)絡(luò)4發(fā)送到文件檢索設(shè)備80。在接收到該信息時,顯示控制單元84將檢 索到的信息作為檢索結(jié)果顯示在監(jiān)視器15b上。
圖像特征提取單元87從一圖形子區(qū)域中包含的圖像數(shù)據(jù)提取圖像特征, 例如,圖案特征、色彩特征以及對比度特征,其中,該圖形子區(qū)域的屬性已由 區(qū)域劃分單元11分析為圖形圖像,或,圖像特征提取單元87從與該圖形圖像 有關(guān)的文本數(shù)據(jù)提取特征。
圖像特征提取單元87提取的圖像特征被用作由矢量值表示的檢索關(guān)鍵 字。檢索單元83將該矢量值作為圖像數(shù)據(jù)的圖像特征經(jīng)由網(wǎng)絡(luò)4發(fā)送到數(shù)據(jù) 庫設(shè)備85。
數(shù)據(jù)庫設(shè)備85選擇存儲的圖像數(shù)據(jù)中的一個,該圖像數(shù)據(jù)的矢量值具有 到 一矢量空間中接收到的矢量值的最短距離,該矢量空間具有圖像檢索功能, 并且,數(shù)據(jù)庫設(shè)備85將所選的圖像數(shù)據(jù)發(fā)送到文件檢索設(shè)備80,作為檢索到
的圖像數(shù)據(jù)。這種圖^^r索方法對于本領(lǐng)域普通技術(shù)人員而言是公知的,因此 省略其詳細(xì)描述。
圖22為監(jiān)視器15b上顯示的內(nèi)容的放大圖,其中,文件檢索設(shè)備80檢索 到的圖像數(shù)據(jù)顯示在監(jiān)視器15b上。區(qū)域劃分單元11分析一文件圖像,該文 件圖像由掃描器1掃描并顯示在監(jiān)視器15b左側(cè)的屏幕2210上,并且區(qū)域劃 分單元11識別了該文件圖像包含圖形圖像2211和2212。圖像特征提取單元 87從圖形圖像2211和2212提取圖像特征,也就是,計算圖形圖像2211和2212 的矢量值。
利用該圖像檢索功能,數(shù)據(jù)庫設(shè)備85選擇存儲的圖像數(shù)據(jù)中的一個,該 圖像數(shù)據(jù)的矢量值具有到要經(jīng)受檢索的接收到的矢量值的最短距離,并且,數(shù) 據(jù)庫設(shè)備85將選擇的圖像數(shù)據(jù)作為檢索到的圖像數(shù)據(jù)發(fā)送到文件檢索設(shè)備80。在從數(shù)據(jù)庫設(shè)備85接收到檢索到的圖像數(shù)據(jù)時,顯示控制單元84將檢索 到的圖像數(shù)據(jù)顯示在監(jiān)視器15b右側(cè)的屏幕2220上。
以此方式,在依據(jù)第八實施例的文件檢索設(shè)備80中,從由掃描器l掃描 的文件圖像自動地提取圖像特征,并基于該圖像特征檢索網(wǎng)絡(luò)上的圖形圖像, 檢索到的圖形圖像被下載顯示在監(jiān)視器15b上。因此,包含文件檢索設(shè)備80 可以僅通過掃描一 圖形來檢索網(wǎng)絡(luò)上的相關(guān)圖形圖像。
如圖22所示,最好是,顯示控制單元84將檢索單元83檢索到的圖形圖 像與掃描器1掃描的圖形圖像并列地顯示在監(jiān)視器15b上。相比檢索文本數(shù)據(jù) 的情況,圖形圖像數(shù)據(jù)可以基于不確定的元素(例如圖像特征)而檢索到,從 而,可以便于用戶觀看與掃描的圖像數(shù)據(jù)并列的檢索到的圖形圖像。
依據(jù)第八實施例的變形例的文件檢索設(shè)備可以通過使用多種搜索方法檢 索信息。依據(jù)第八實施例的變形例的文件檢索設(shè)備具有與文件檢索設(shè)備80相 同的配置,從而,以下參考圖22說明依據(jù)第八實施例的變形例的文件檢索設(shè) 備的操作。
在檢索文本數(shù)據(jù)的情況下,檢索單元83基于提取的關(guān)鍵字檢索文本數(shù)據(jù)。 在檢索圖形數(shù)據(jù)的情況下,檢索單元83基于由圖像特征提取單元87從一圖形 提取的圖像特征來檢索圖形數(shù)據(jù)。此外,在檢索文件數(shù)據(jù)的情況下,檢索單元 83發(fā)送搜索命令,用于限制要被檢索的文件數(shù)據(jù)的范圍。
例如,文件數(shù)據(jù)的范圍可以限制在報紙文章、雜志文章或者可用于Web 上公開的信息。在接收到搜索命令時,數(shù)據(jù)庫設(shè)備85在搜索命令指示的范圍 內(nèi)搜索文件數(shù)據(jù)。另一方面,在檢索圖形數(shù)據(jù)的情況下,通過使用如第八實施 例中說明的圖形數(shù)據(jù)4僉索方法來檢索圖形數(shù)據(jù)。
圖23為監(jiān)視器15b上顯示的內(nèi)容的放大圖,其中,由依據(jù)第八實施例的 文件檢索設(shè)備檢索到的信息顯示在監(jiān)視器15b上。由掃描器1掃描的文件圖像 顯示在監(jiān)視器15b左側(cè)的屏幕2310上。屏幕2310上顯示的任一子區(qū)域被用戶 拖放在監(jiān)視器15b右側(cè)的檢索屏幕2320中。
在任一子區(qū)域被用戶拖放到Web搜索屏幕2321中時,如果Web上存在 與子區(qū)域中包含的數(shù)據(jù)有關(guān)的任何數(shù)據(jù),則該有關(guān)的數(shù)據(jù)被檢索并顯示在Web 搜索屏幕2321上。在任一子區(qū)域被用戶拖放到新聞搜索屏幕2322中時,如果
存在與子區(qū)域中包含的數(shù)據(jù)有關(guān)的任何新聞文章時,該新聞文章數(shù)據(jù)被檢索并
顯示在新聞搜索屏幕2322上。在任一子區(qū)域被用戶拖放到圖形圖像搜索屏幕 2323中時,如果存在與子區(qū)域中包含的數(shù)據(jù)有關(guān)的任何圖形圖像時,該圖形 圖像數(shù)據(jù)被檢索并顯示在圖形圖像搜索屏幕2323上。
在操作顯示單元15接收到這樣的多個拖放操作輸入來分別拖放多個子區(qū) 域到不同的搜索屏幕中時,檢索單元83依據(jù)與拖放了子區(qū)域的搜索屏幕對應(yīng) 的搜索方法來檢索信息。
在此情況下,檢索到的文本數(shù)據(jù)和圖形數(shù)據(jù)可以被并列地顯示。即使文本 數(shù)據(jù)和圖形數(shù)據(jù)的屬性彼此不同,但文本數(shù)據(jù)和圖形數(shù)據(jù)的內(nèi)容彼此相同。所 以,具有相同主題的文本數(shù)據(jù)和圖形數(shù)據(jù)并列顯示在監(jiān)視器15b上,從而提高 用戶友好度。
依據(jù)本發(fā)明第九實施例的文件檢索設(shè)備90被應(yīng)用于PC (此后稱為PC 90)。例如,打印機驅(qū)動器被安裝在PC 90上,并且要打印出的數(shù)據(jù)被顯示在 PC90的監(jiān)視器上。PC卯從用戶接收一輸入,用于例如采用鼠標(biāo)或者指示器 來選擇監(jiān)視器上顯示的數(shù)據(jù)的任一子區(qū)域。在接收到用戶的輸入時,PC90從 所選子區(qū)域中包含的數(shù)據(jù)提取關(guān)鍵字來在網(wǎng)絡(luò)上檢索與提取的關(guān)鍵字有關(guān)的 信息,并將檢索到的信息顯示在監(jiān)視器上。
圖24為依據(jù)第九實施例的PC卯的框圖。PC 90包括作為輸入/輸出(I/O) 接口的輸入/輸出單元96、鍵盤95al 、鼠標(biāo)95a2、監(jiān)視器95b、硬盤驅(qū)動器(HDD) 7以及圖像輸出單元3。圖像輸出單元3將圖像輸出到打印機8,并同時用作 能連接到其他輸入設(shè)備的接口 。在此情況下,圖像輸出單元3連接到打印機8。 與圖1中用于第一實施例相同的部分采用相同的附圖標(biāo)記表示,并省略這些部 分的描述。
PC90進(jìn)一步包括區(qū)域劃分單元91、關(guān)鍵字提取單元92、 -險索單元93以 及顯示控制單元94。包含在PC 90中的中央處理單元(CPU)(圖未示)從 HDD 7讀取文件檢索程序,并在隨機存取存儲器(RAM)(圖未示)上展開該 文件檢索程序來執(zhí)行該文件檢索程序。
輸入/輸出單元96輸出以頁面描述語言(page description language, PDL) 描述的數(shù)據(jù)。將以PDL描述的數(shù)據(jù)按各種數(shù)據(jù)屬性(例如,文本、圖表、諸
如位像的圖形圖像等)分類。從而,通過讀出以PDL描述的數(shù)據(jù),區(qū)域 劃分單元91可以獲得該數(shù)據(jù)的數(shù)據(jù)屬性。區(qū)域劃分單元91按每種數(shù)據(jù)屬性將 數(shù)據(jù)圖像劃分為子區(qū)域。
作為以PDL描述的數(shù)據(jù)的示例,在接收到以下數(shù)據(jù)時, 72 72 moveto
/Times國Bolditalic 24 selectfont
(Taro Yamada)
show
showpage
依據(jù)PDL描述,顯示控制單元94讀出表示Times-Bold斜體字體的上述 字符串,該Times-Bold斜體字體的大小為24點(point)且在位置(72, 72) 上被選擇,并顯示"Taro Yamada"。
作為以PDL描述的數(shù)據(jù)的另一示例,在接收到以下數(shù)據(jù)時, newpath 144 72 moveto 144 432 lineto stroke showpage
依據(jù)PDL描述,顯示控制單元94讀出上述字符串,上述字符串表示直線 從位置(144, 72 )繪制到位置(144, 432 )。
如上所述,在PC90執(zhí)行區(qū)域劃分處理時,PC90不必執(zhí)行構(gòu)成圖像數(shù)據(jù) 的每個子區(qū)域的屬性分析的字符辨別,該字符辨別由依據(jù)第一至第八實施例的 文件檢索設(shè)備執(zhí)行。通過讀出以PDL描述的數(shù)據(jù),相比依據(jù)第一至第八實施 例的文件檢索設(shè)備,PC 90可以容易地執(zhí)行區(qū)域劃分處理。
以PDL描述的數(shù)據(jù)被讀出,并且被按每種數(shù)據(jù)屬性劃分為子區(qū)域,然后 由顯示控制單元94顯示在iSi見器95b上。用戶可以采用鍵盤95al或鼠標(biāo)95a2, 或通過經(jīng)由監(jiān)視器95b的觸摸輸入,選擇監(jiān)視器95b上顯示的任一子區(qū)域。用 戶也可以經(jīng)由監(jiān)視器95b輸入指令。
以第一實施例中說明的相同的方式,關(guān)鍵字提取單元92提取關(guān)鍵字,并 200710169525.8
說明書第25/29頁
且檢索單元93將提取的關(guān)鍵字和搜索命令經(jīng)由網(wǎng)絡(luò)4發(fā)送到作為數(shù)據(jù)庫服務(wù) 器的數(shù)據(jù)庫設(shè)備5。在從數(shù)據(jù)庫設(shè)備5接收到與該關(guān)鍵字有關(guān)的信息時,顯示 控制單元94將檢索到的信息顯示在監(jiān)視器95b上。而且,以上述實施例中說 明的相同的方式,并列地顯示以PDL描述的輸入數(shù)據(jù)和檢索到的信息。
當(dāng)在監(jiān)視器95b上顯示4企索到的信息時,如果圖像輸出單元3經(jīng)由鍵盤 95al等從用戶接收到打印輸出命令,則圖像輸出單元3運行驅(qū)動器程序使打 印機打印輸出檢索到的信息。這也可以創(chuàng)建并發(fā)送包含了檢索到的信息的內(nèi)容 的電子郵件信息。
圖25為用于說明PC 90執(zhí)行的文件檢索處理的流程圖。區(qū)域劃分單元91 接收以PDL描述的信息,并基于PDL描述讀出數(shù)據(jù)屬性和信息的子區(qū)域(步 驟S201 )。區(qū)域劃分單元91按依據(jù)PDL描述讀取的每種數(shù)據(jù)屬性將信息分為 子區(qū)域(步驟S202)。隨后的步驟與圖8所示的用于第一實施例的步驟S104 相同,并省略步驟S104的描述。
以此方式,在依據(jù)第九實施例的PC 90中,在接收到以PDL描述的數(shù)據(jù) 時,基于PDL描述讀出數(shù)據(jù)的數(shù)據(jù)屬性,將數(shù)據(jù)按每種數(shù)據(jù)屬性劃分為子區(qū) 域,從包含在數(shù)據(jù)屬性為文本的每個子區(qū)域中的數(shù)據(jù)提取關(guān)鍵字,并檢索與提 取的關(guān)鍵字有關(guān)的信息。因此,如果輸入文件為PDL形式,則PC卯可以容 易地從網(wǎng)絡(luò)上的許多數(shù)據(jù)庫設(shè)備檢索與該文件的內(nèi)容有關(guān)的信息,而無需任何
繁瑣的鍵盤操作。依據(jù)第九實施例,PC可以以簡單的操作檢索與電子媒體形 式的內(nèi)容有關(guān)的信息。
依據(jù)第九實施例的PC 90可以配置來處理以不是PDL的語言描述的數(shù)據(jù)。 只要可以通過應(yīng)用軟件讀出數(shù)據(jù)屬性和數(shù)據(jù)的子區(qū)域,PC 90就可以應(yīng)付任何 其他語言描述的數(shù)據(jù)。
依據(jù)本發(fā)明第十實施例的移動電話包括CCD攝像機和監(jiān)視器。從CCD 攝像機攝取的圖形圖像提取關(guān)鍵字來在網(wǎng)絡(luò)上檢索與提取的關(guān)鍵字有關(guān)的信 息。檢索到的信息顯示在監(jiān)視器上。
圖26為依據(jù)第十實施例的移動電話的框圖。移動電話150包括CCD攝像 機151、圖像處理單元152、區(qū)域劃分單元161、關(guān)鍵字提取單元162、檢索單 元163、顯示控制單元164、監(jiān)視器165b、操作單元165a、輸入/輸出單元166、
29
以及天線153。
圖像處理單元152處理CCD攝像機151攝取的圖形圖像,例如對該圖形 圖像進(jìn)行數(shù)字轉(zhuǎn)換或者伽馬轉(zhuǎn)換。例如,圖像處理單元152將該圖形圖轉(zhuǎn)換為 作為圖像數(shù)據(jù)的位像,并經(jīng)由輸入/輸出單元166將圖像數(shù)據(jù)輸出到區(qū)域 劃分單元161。
以與依據(jù)第 一至第九實施例的區(qū)域劃分單元相同的方式,區(qū)域劃分單元 161將接收到的數(shù)據(jù)劃分為包含文本圖像的文本子區(qū)域和包含不是文本圖像 的圖像的子區(qū)域。關(guān)鍵字提取單元162以與依據(jù)第一至第九實施例的關(guān)鍵字提 取單元相同的方式提取關(guān)鍵字。檢索單元163檢索與基于第一至第九實施例的 檢索單元相同的方式提取的關(guān)鍵字有關(guān)的信息。顯示控制單元164以與依據(jù)第 一至第九實施例的顯示控制單元相同的方式將檢索到的信息顯示在監(jiān)視器 165b上。
輸入/輸出單元166經(jīng)由天線153接收/轉(zhuǎn)發(fā)網(wǎng)絡(luò)上的信息。此外,輸入/ 輸出單元166經(jīng)由耳機(圖未示)輸出語音信息,經(jīng)由揚聲器電話(圖未示) 收集語音信息,并且也通過應(yīng)用例如為代碼激勵線性預(yù)測(code excited linear prediction, CELP )的語音轉(zhuǎn)換經(jīng)由天線153在通信線路上建立通信。
如上所述,在依據(jù)第十實施例的移動電話150中,由CCD攝像機151攝 取圖像,從該圖像提取關(guān)鍵字來檢索與提取的關(guān)鍵字有關(guān)的信息,并將檢索到 的信息顯示在監(jiān)^L器165b上。
檢索單元163可以配置成包括圖像特征提取功能,從而,經(jīng)由網(wǎng)絡(luò)4連接 到移動電話150的數(shù)據(jù)庫設(shè)備5可以基于CCD攝像機151攝取的圖像特征來 搜索網(wǎng)絡(luò)上的任何相關(guān)的圖形圖像。檢索到的圖形圖像顯示在監(jiān)視器165b上。
圖27為用于說明包含了依據(jù)本發(fā)明第 一實施例的文件檢索設(shè)備10的圖像 形成裝置的硬件配置的框圖。圖像形成裝置為多功能產(chǎn)品(multifunction product, MFP),該多功能產(chǎn)品包括多種功能,例如傳真機和掃描器。如圖27 所示,在該MFP中,控制器2710經(jīng)由周邊元件擴(kuò)展接口 (PCI)總線連接到 引擎單元1260??刂破?710用于控制來自FCU接口 (I/F) 1230或操作單元 2720的輸入,從而控制整個MFP、圖像顯示、圖像處理、文件檢索等。引擎 單元1260 (例如,圖像處理引擎)能連接到PCI總線,并相對于檢索到的圖
像數(shù)據(jù)執(zhí)行圖像處理,例如,誤差擴(kuò)散或伽馬轉(zhuǎn)換。
控制器2710包括CPU 2711、北橋(NB) 1213、系統(tǒng)存儲器(MEM-P) 1212、南橋(SB ) 1214、本地存儲器(MEM-C )1217、特定用途集成電路(ASIC ) 1216以及HDD 1218。 NB 1213經(jīng)由加速圖形接口 (AGP)總線1215連接到 ASIC 1216。 MEM-P 1212包括只讀存儲器(ROM) 1212a和隨機訪問存儲器 (RAM) 1212b。
CPU2711控制整個MFP,并且包括構(gòu)成NB 1213的芯片組、MEM-P 1212 以及SB 1214。 CPU 2711經(jīng)由該芯片組連接到其他設(shè)備。
NB 1213為用于將CPU 2711連接到MEM-P 1212、 SB 1214和AGP總線 1215的橋。NB 1213包括存儲器控制器,該存儲器控制器用于控制對MEM-P 1212、主PCI以及AGP目標(biāo)(target)的讀/寫。
MEM-P 1212為用于存儲程序和數(shù)據(jù)的系統(tǒng)存儲器,同時也展開程序和數(shù) 據(jù)。ROM 1212a為用于存儲程序和數(shù)據(jù)的只讀存儲器。RAM 1212b為用于展 開程序或數(shù)據(jù)的可寫/讀的存儲器,同時也在圖像處理時繪制圖像。
SB 1214為將NB 1213連接到PCI設(shè)備和外圍設(shè)備的橋。SB 1214經(jīng)由PCI 總線連接到NB 1213。 FCUI/F 1230等連接到PCI總線。
ASIC 1216為用于處理多媒體信息的集成電路(IC),也就是,包括用于 處理多媒體信息的硬件元件。ASIC 1216同樣用作將AGP總線1215連接到PCI 總線、將HDD 1218連接到MEM-C 1217的橋。
經(jīng)由PCI總線連接到ASIC 1216, PCI總線處在PCI目標(biāo)、主AGP、形成ASIC 1216的核心的判優(yōu)器(ARB )、用于控制MEME-C 1217的存儲器控制器、多 個以硬件邏輯旋轉(zhuǎn)圖像數(shù)據(jù)的直接存儲器訪問控制器(direct memory access controller, DMAC)以及引擎單元1260之間。
MEM-C 1217為用作發(fā)送圖像緩存器或代碼緩存器的本地存儲器。HDD 1218為存儲器,其中存儲了圖像數(shù)據(jù)、程序、字體數(shù)據(jù)、窗體。
AGP總線1215是用于為高速圖形處理而制造的圖形加速器卡的總線接 口。圖形加速器卡通過以高的吞吐量直接訪問MEM-P 1212來獲得高速圖形處 理。
連接到ASIC 1216的操作單元(觸摸板)2720從用戶接收操作輸入,并 將與接收到的操:作輸入有關(guān)的信息發(fā)送到ASIC 1216。
由依據(jù)第一實施例的MFP執(zhí)行的文件檢索程序預(yù)先存儲在ROM或類似 存儲裝置中。
可選擇的,要由依據(jù)第一實施例的MFP執(zhí)行的文件檢索程序可以以可安 裝且可執(zhí)行的文件的形式存儲于計算機可讀媒體,例如,光盤只讀存儲器 (CD-ROM )、軟盤(FD)、可記錄光盤(CD-R)和數(shù)字化視頻光盤(DVD)。
此外,要由依據(jù)第一實施例的MFP執(zhí)行的文件檢索程序可以存儲在連接 到例如為互聯(lián)網(wǎng)的網(wǎng)絡(luò)的計算機上,并經(jīng)由該網(wǎng)絡(luò)下載到MFP。而且,要由 依據(jù)第一實施例的MFP執(zhí)行的圖像顯示程序和圖像形成程序可以經(jīng)由例如為 互聯(lián)網(wǎng)的網(wǎng)絡(luò)提供或發(fā)布。
要由依據(jù)第一實施例的MFP執(zhí)行的文件檢索程序由包括上述單元(例如, 區(qū)域劃分單元11、關(guān)鍵字提取單元12、檢索單元13、顯示控制單元14等) 的多個模塊組成。對于實際的硬件,CPU (處理器)從ROM讀出文件檢索程 序并執(zhí)行文件4企索程序,因此將上述單元載入主存儲單元上,從而在主存儲單 元上創(chuàng)建這些單元,例如區(qū)域劃分單元ll、關(guān)鍵字提取單元12、檢索單元13 以及顯示控制單元14。
圖28為用于說明依據(jù)第九實施例的PC 90的硬件配置的框圖。如圖28所 示,PC 90具有公共的硬件配置,包括控制單元(例如,CPU 2301 )、存儲單 元(例如,ROM 2302和RAM 2303 )、外部存儲單元(例如,HDD和CD驅(qū) 動器)、顯示單元2305 (例如,監(jiān)視器)、輸入單元2306 (例如,鍵盤和鼠標(biāo))、 通信I/F 2307、以及用于將上述單元彼此連接的總線2308。
要由依據(jù)第九實施例的PC 90執(zhí)行的文件檢索程序以可安裝且可執(zhí)行的 文件的形式存儲于計算機可讀媒體,例如,CD-ROM、 FD、 CD-R和DVD。
此外,要由PC 90執(zhí)行的文件檢索程序可以存儲在連接到例如為互聯(lián)網(wǎng)的 網(wǎng)絡(luò)的計算機上,并經(jīng)由網(wǎng)絡(luò)下載到PC90。而且,要由PC90執(zhí)行的文件檢 索程序可以經(jīng)由例如為互聯(lián)網(wǎng)的網(wǎng)絡(luò)提供或發(fā)布。此外,要由PC90執(zhí)行的文 件檢索程序可以預(yù)先存儲在ROM或者類似存儲裝置中。
此外,要由PC90執(zhí)行的文件檢索程序由包含上述單元(例如,區(qū)域劃分
單元11、關(guān)鍵字提取單元12、檢索單元13、顯示控制單元14等)的多個模 塊組成。對于實際的硬件,CPU (處理器)2301從存儲單元讀出文件檢索程 序并執(zhí)行文件檢索程序,因此將上述單元載入主存儲單元上,從而在主存儲單 元上創(chuàng)建這些單元,例如區(qū)域劃分單元ll、關(guān)鍵字提取單元12、檢索單元13 以及顯示控制單元14。
以此方式,如本發(fā)明的實施例,如上說明了圖像形成裝置、PC和移動電 話的情況。上述實施例和變形例僅為用于說明本發(fā)明的示例,本發(fā)明并不陷于 上面說明的實施例和變形例。
如上所述,依據(jù)本發(fā)明的用于信息檢索的設(shè)備、方法以及計算機程序產(chǎn)品 用于文件檢索,尤其是在從非數(shù)字信息檢索數(shù)字信息時。
盡管已相對于用于完整清楚揭露的特定實施例描述了本發(fā)明,但并不因此 限制所附的權(quán)利要求,而是僅構(gòu)架來具體化對于本領(lǐng)域普通技術(shù)人員而言明顯 落入這里闡明的基本教導(dǎo)中的所有變更和可選的架構(gòu)。
權(quán)利要求
1.一種信息檢索設(shè)備,其連接到網(wǎng)絡(luò),所述信息檢索設(shè)備包括顯示單元,包括顯示從輸入單元接收到的輸入信息的第一屏幕,以及顯示檢索結(jié)果的第二屏幕,第一屏幕和第二屏幕能從用戶接收操作輸入;區(qū)域劃分單元,將輸入信息按每種信息屬性劃分為多個子區(qū)域;提取單元,從每個子區(qū)域中的輸入信息提取檢索關(guān)鍵字;顯示控制單元,將子區(qū)域中的輸入信息顯示在第一屏幕上,并接收用于指定要被移動到第二屏幕的第一屏幕上顯示的任一子區(qū)域的指令;以及,檢索單元,基于與移動到第二屏幕的子區(qū)域?qū)?yīng)的檢索關(guān)鍵字通過網(wǎng)絡(luò)檢索信息,其中,顯示控制單元將檢索到的信息顯示在第二屏幕上。
2. 如權(quán)利要求1所述的信息檢索設(shè)備,其中,子區(qū)域包括文本子區(qū)域和非文本子區(qū)域,文本子區(qū)域包括文本圖像,非文 本子區(qū)域包括不是文本圖像的圖像,提取單元從包括在文本子區(qū)域中的文本圖像提取關(guān)鍵字,作為檢索關(guān)鍵 字,以及,檢索單元,在文本子區(qū)域被移動到第二屏幕時,基于從包括在文本子區(qū)域 中的文本圖像提取的關(guān)鍵字通過網(wǎng)絡(luò)檢索信息。
3. 如權(quán)利要求2所述的信息檢索設(shè)備,其中,除了子區(qū)域中的輸入信息夕卜, 顯示控制單元還將指定提取單元所提取的關(guān)鍵字的指令顯示在第一屏幕上。
4. 如權(quán)利要求3所述的信息檢索設(shè)備,其中,在用戶通過第一屏幕選擇所 述指令時,檢索單元基于該指令中指定的關(guān)鍵字通過網(wǎng)絡(luò)檢索信息。
5. 如權(quán)利要求3所述的信息檢索設(shè)備,其中,在由提取單元從多個文本子區(qū)域中包括的文本圖像提取多個關(guān)鍵字時,除 了劃分為子區(qū)域的輸入信息外,顯示控制單元還將分別指定該關(guān)鍵字的多個指 令顯示在第一屏幕上;以及,在用戶通過第一屏幕選擇指令時,檢索單元通過將邏輯AND或邏輯OR 應(yīng)用于指令中指定的關(guān)鍵字來經(jīng)由網(wǎng)絡(luò)檢索信息。
6. 如權(quán)利要求3所述的信息檢索設(shè)備,其中,在接收到用戶輸入的新的關(guān) 鍵字時,除了用于指定提取單元提取的關(guān)鍵字和劃分為子區(qū)域的輸入信息之 外,顯示控制單元還將用于指定該新的關(guān)鍵字的指令顯示在第一屏幕上。
7. 如權(quán)利要求6所述的信息檢索設(shè)備,進(jìn)一步包括字符辨別單元,該字符 辨別單元辨別包括在圖像中的字符,其中,顯示控制單元接收用戶的新關(guān)鍵字手寫輸入;以及, 字符辨別單元辨別手寫關(guān)鍵字,并輸出字辨別結(jié)果作為新的關(guān)鍵字。
8. 如權(quán)利要求1所述的信息檢索設(shè)備,其中,區(qū)域劃分單元將輸入信息劃分為包括圖形圖像的圖形子區(qū)域,以及包括不 是圖形圖像的圖像的非圖形子區(qū)域,提取單元提取圖形子區(qū)域中包括的圖形圖像的圖像特征,作為檢索關(guān)鍵 字,以及,在圖形子區(qū)域被移動到第二屏幕時,檢索單元基于提取單元所提取的圖像 特征通過網(wǎng)絡(luò)檢索信息。
9. 如權(quán)利要求1所述的信息檢索設(shè)備,其中,顯示控制單元接收與第一屏幕上顯示的任一子區(qū)域相關(guān)的選擇或選擇的 以及,提取單元從所選子區(qū)域中包括的信息提取檢索關(guān)鍵字。
10. 如權(quán)利要求1所述的信息檢索設(shè)備,其中, 檢索單元通過使用多種檢索方法檢索信息, 顯示單元在其上顯示檢索方法,顯示控制單元接收用于將所選子區(qū)域分別移動到顯示單元上顯示的任一 檢索方法的輸入,以及,檢索單元通過使用子區(qū)域分別移動到的檢索方法來檢索信息。
11. 如權(quán)利要求1所述的信息檢索設(shè)備,其中,顯示控制單元接收用于指 定要移動到第二屏幕的、第一屏幕上顯示的任一子區(qū)域的觸摸輸入。
12. 如權(quán)利要求1所述的信息檢索設(shè)備,其中,顯示控制單元接收拖放操 作輸入,該拖放操作輸入用于通過指示設(shè)備指定要移動到第二屏幕的、第一屏幕上顯示的任一子區(qū)域。
13. 如權(quán)利要求1所述的信息檢索設(shè)備,其中,所述輸入信息是作為輸入 單元的圖像形成裝置所掃描的文件圖像有關(guān)的信息。
14. 如權(quán)利要求1所述的信息檢索設(shè)備,其中,所述輸入信息是作為輸入 單元的成像設(shè)備攝取的圖形圖像有關(guān)的信息。
15. —種從網(wǎng)絡(luò);險索信息的方法,所述方法包括在顯示單元上顯示第一屏幕和第二屏幕,第一屏幕上顯示從輸入單元接收 的輸入信息,第二屏幕上顯示檢索的結(jié)果,第一屏幕和第二屏幕能從用戶接收 操作輸入; 按每種信息屬性將輸入信息劃分為多個子區(qū)域; 從每個子區(qū)域的輸入信息提取檢索關(guān)鍵字;提供控制以在第一屏幕上顯示子區(qū)域中的輸入信息,并接收用于指定第一 屏幕上顯示的、要移動到第二屏幕的任一子區(qū)域的指令;以及,根據(jù)與要移動到第二屏幕的子區(qū)域?qū)?yīng)的檢索關(guān)鍵字通過網(wǎng)絡(luò)檢索信息,其中,提供包括將檢索到的信息顯示在第二屏幕上的控制。
16. —種包含計算機程序的計算機程序產(chǎn)品,計算機程序在計算機上執(zhí)行 時使計算機執(zhí)行在顯示單元上顯示第一屏幕和第二屏幕,第一屏幕上顯示從輸入單元接收 的輸入信息,第二屏幕上顯示檢索的結(jié)果,第一屏幕和第二屏幕能從用戶接收 操作輸入;按每種信息屬性將輸入信息劃分為多個子區(qū)域; 從每個子區(qū)域的輸入信息提取檢索關(guān)鍵字;提供控制以在第一屏幕上顯示子區(qū)域中的輸入信息,并接收用于指定第一 屏幕上顯示的、要移動到第二屏幕的任一子區(qū)域的指令;以及,根據(jù)與要移動到第二屏幕的子區(qū)域?qū)?yīng)的檢索關(guān)鍵字通過網(wǎng)絡(luò)檢索信息, 其中,提供包括將檢索到的信息顯示在第二屏幕上的控制。
全文摘要
一種信息檢索設(shè)備,包括區(qū)域劃分單元,將輸入信息按每種信息屬性劃分為多個子區(qū)域;提取單元,從每個子區(qū)域中的輸入信息提取檢索關(guān)鍵字;顯示控制單元,將子區(qū)域中的輸入信息顯示在第一屏幕上,接收用于指定要被移動到顯示單元上的第二屏幕的第一屏幕上顯示的任一子區(qū)域的指令;以及,檢索單元,基于與移動到第二屏幕的子區(qū)域?qū)?yīng)的檢索關(guān)鍵字經(jīng)由網(wǎng)絡(luò)檢索信息。顯示控制單元將檢索到的信息顯示在第二屏幕上。
文檔編號G06F17/30GK101178725SQ20071016952
公開日2008年5月14日 申請日期2007年11月9日 優(yōu)先權(quán)日2006年11月10日
發(fā)明者馬圖里克·法布里斯 申請人:株式會社理光
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
宜昌市| 邛崃市| 宝鸡市| 木兰县| 启东市| 郓城县| 德江县| 青岛市| 保德县| 项城市| 绿春县| 温州市| 常宁市| 公主岭市| 云南省| 敦煌市| 普陀区| 房山区| 石嘴山市| 金阳县| 邵武市| 高安市| 吴江市| 赤城县| 云浮市| 齐河县| 石棉县| 昌平区| 迭部县| 正镶白旗| 安平县| 黔江区| 时尚| 湖州市| 密山市| 绥江县| 朝阳市| 读书| 宁乡县| 鄯善县| 德庆县|