專利名稱:信息處理裝置、信息處理方法及軟件產(chǎn)品的制作方法
信息處理裝置、信息處理方法及軟件產(chǎn)品
本申請要求享有2003年9月9日提交的日本申請2003-316179號的優(yōu)先權,其公開的內(nèi)容也全部結合在此作為參考。
發(fā)明領域
本發(fā)明涉及一種信息處理裝置,如移動蜂窩電話、PHS(個人手持電話系統(tǒng))、 PDA (個人數(shù)字助理)、便攜式電腦或手持個人電腦以及該裝置所采用的信息處理方法和該 裝置所使用的軟件。
背景技術:
公開號為2002-252691的日本專利公開了一種能夠使用0CR(光字符識別)功能 輸入地址、電話號碼和URL(統(tǒng)一資源定位器)等打印信息的移動電話終端。
紙張上寫的字符的實際位置和在顯示器上所顯示的該字符的位置往往存在一定 的差異,所以,讓用戶指定識別區(qū)域有時會是一件很困難的事。
因此,有必要提供一種改進的信息處理方法和信息處理裝置。
發(fā)明內(nèi)容
為滿足上述需求,本發(fā)明提出了一種信息處理裝置,該信息處理裝置包括照相 機,其輸出對象的圖片信息;顯示器,其根據(jù)該照相機輸出的圖片信息顯示圖像;輸入單 元,其可以使用戶從該照相機的多種模式中選擇一種模式,所述的多種模式包括作為普通 照相機功能拍攝圖片的普通圖像拍攝模式和識別由該照相機輸出的圖片信息中包含的字 符的識別模式。該照相機所處的位置使得對象的顯示圖像與用戶看到的對象基本上一致。
為了使用戶指出識別區(qū)域的操作更容易,本發(fā)明提出一種信息處理裝置,包括圖 片接口,其將圖片信息輸入該信息處理裝置;輸入單元,其輸入信息類型選擇。該信息處理 裝置還包括CPU,如果由該圖片接口輸入的圖片信息中包含對應于由該輸入單元輸入的信 息類型的一個或多個字符的字符串,則該CPU響應于用戶的字符識別請求,提取該字符串。
為了方便地獲取與已識別的字符串相關的信息,本發(fā)明提出一種信息處理方法, 包括如下步驟接收圖片信息,并從該圖片信息中識別一個或多個字符的字符串;當用戶 請求與該已識別的字符相關的信息時,則經(jīng)由網(wǎng)絡,發(fā)送該識別的字符串中包含的標識信 息;接收與該標識信息相關的信息,并顯示所接收的信息。
附圖簡述
圖1是一個信息處理裝置的結構框圖;
圖2(包括2(a)至2(c))是一個蜂窩電話的外觀圖;
圖3(包括3(a)至3(c))是一個蜂窩電話的外觀圖;
圖4(包括4(a)至4(b))是一個蜂窩電話的外觀圖;
圖5(包括5(a)至5(c))是一個可旋轉型蜂窩電話的外觀圖;
圖6(包括6(a)至6(c))是一個蜂窩電話的外觀圖;
圖7是一次OCR操作中用戶眼睛、照相機和顯示器之間的位置關系的說明圖;[0018]圖8(包括8(a)至8(d))是一個蜂窩電話的顯示屏幕輸出的實例;
圖9(包括9(a)至9(b))是角度校正部件和旋轉驅(qū)動部件的示意圖;
圖10(包括10(a)至10(c))是一個蜂窩電話的外觀圖;
圖11 (包括11(a)至11(b))是一個蜂窩電話的外觀圖;
圖12是該信息處理裝置的操作流程圖;
圖13是該信息處理裝置的字符識別操作的流程圖;
圖14(包括14(a)至14(c))是在該信息處理裝置中選擇識別對象的類型的顯示屏幕實例;
圖15(包括15(a)至15(d))是監(jiān)視一張商務卡時的顯示屏幕實例;
圖16(包括16(a)至16(c))是該信息處理裝置的顯示屏幕實例;
圖17是該信息處理裝置的處理流程圖;
圖18 (包括18 (a)至18 (b))是該信息處理裝置的顯示屏幕實例;
圖19是查找單詞定義的系統(tǒng)的一個例子的示意圖;
圖20是ISBN詞典ID對照表的內(nèi)容實例;
圖21是ISBN專用詞典的詞典ID登記過程的流程圖;
圖22是顯示單詞意思/翻譯的過程的流程圖;
圖23 (包括23 (a)至23 (f))是信息處理裝置的顯示屏幕實例;
圖24(包括24(a)至24(f))是顯示單詞意思/翻譯數(shù)據(jù)的顯示屏幕實例。
發(fā)明詳述
在此公開的各種實例涉及一種具有照相機的信息處理裝置,該照相機被置于能夠 使對象的顯示圖像與用戶看到的對象一致的地方,在此還將介紹提高對象的顯示圖像與用 戶看到的對象之間的一致性的方法和軟件產(chǎn)品。在這些實例中,對識別過程也進行了介紹。 以下結合附圖描述這些實例。在所有附圖中,相同的標號表示相同的部件。
圖1是一個信息處理裝置的結構框圖。
輸入單元101包括一個具有多個按鍵(包括一個快門按鈕、一個開關按鈕和多個 數(shù)字按鍵)的鍵盤。用戶可以使用該輸入單元101輸入信息,如電話號碼、電子郵件地址、 電源開/關命令以及請求照相機103拍攝照片的圖像拍攝命令等。輸入單元101還可以包 括一個觸摸敏感的面板,其使得用戶能夠用筆或他/她的手指觸摸顯示器,從而輸入信息 或指令。此外,輸入單元101也可以包括一個語音識別單元,從而執(zhí)行基于語音識別的輸入 方法。
CPU (中央處理單元)102通過執(zhí)行存儲器104中存儲的程序,來控制該信息處理裝 置的各個部件,并響應于來自輸入單元101的輸入來控制其他部件。
照相機103將人、風景、字符或其他主題的圖像轉化為圖片信息。通過圖片接口 108將該圖片信息輸入到CPU102。圖像可以被轉化為任意格式的圖片信息,只要CPU102能 夠處理該圖片信息即可。在本實例中,照相機103置于該信息處理裝置之內(nèi)。但本發(fā)明不 僅僅限于該實例,照相機也可以通過圖片接口 108掛接在信息處理裝置之外。
CPU控制圖片信息在顯示器107上的顯示。用戶通過監(jiān)視顯示器107上輸出的圖 片信息,來選擇他/她所要拍攝的圖像。此時,顯示器107的作用是取景器。用戶發(fā)出拍攝 照片的指示,如,按下一個作為快門按鍵的操作鍵(下文稱為“快門按鍵”)。在放開快門按鍵的時候,照相機103輸出的圖片信息被保存到存儲器104中。存儲器104可以是ROM(只 讀存儲器)或RAM(隨機存取存儲器)。為了執(zhí)行各種操作,存儲器104中還可存儲視頻與 /或音頻數(shù)據(jù)及由CPU102執(zhí)行的軟件。
圖片識別存儲器105中存儲了用于CPU102執(zhí)行OCR(光字符識別)功能的軟件程序。OCR功能可以識別圖片內(nèi)包含的字符,如字母、符號、標記、標志、數(shù)字、標識信息及其他。
標識信息的例子可以是一個主頁地址、一個電子郵件地址、一個郵政地址、一個電 話號碼、地圖信息以及包含出版號和ISBN(國際標準書號)號的數(shù)據(jù)編號等。當然,標識信 息的范圍不限于上述實例,它可以是用于標識一個人、地點、物品等的任何信息。
字符串的識別包括如下步驟從照相機103拍攝的圖片中標識出包含字符串的位 置;將包含字符串的部分的圖像數(shù)據(jù)分割成預定數(shù)量的部分;將這些部分中的各數(shù)據(jù)轉換 成一個參數(shù)值;根據(jù)該參數(shù)值,確定各個部分中包含的信息。
以識別一張圖片中包含的字符串“abc”為例進行說明。首先,識別出圖片中包含 字符“abc”的區(qū)域;然后,將包含字符“abc”的部分的圖像數(shù)據(jù)分割成包含“a”、“b”、“c”的 部分;再將包含“a”、“b”、“c”的部分的數(shù)據(jù)轉換成相應的參數(shù)值。字符的白色部分用“0” 表示;字符的黑色部分用“1”表示。對于每一個部分,從字符模式數(shù)據(jù)中選擇與其參數(shù)值最 相似的字符。該字符模式數(shù)據(jù)是將每個參數(shù)值與一個字符相關的數(shù)據(jù),如,對應于該參數(shù)值 的一個希臘字符。該字符模式數(shù)據(jù)可以預先存儲在存儲器104中,也可以由用戶下載或安 裝。
在本實例中,圖片識別存儲器105是專用于存儲圖片識別軟件的存儲器。也可以 選擇將圖片處理軟件嵌入到CPU102或存儲器104中,從而為CPU102提供OCR功能。通過 將圖片處理軟件嵌入到CPU102或存儲器104中,可以減少部件的數(shù)目,也可以降低制造成 本或其他類似成本。
在本實例中,為了減小電路規(guī)模,OCR功能由CPU102執(zhí)行。但是,本發(fā)明的配置并 不限于此例,例如,也可以使用專用處理器實現(xiàn)OCR功能。
在進行識別之前,首先需要指定將要識別的區(qū)域。例如,用戶將出現(xiàn)在顯示器107 中間的一個標記(如“ + ”、“?”、“? ”或其他類似標記)置于字符串處。將開始于該標記附近 的一個間隔信息(spaceinformation)和結束于下一個間隔信息的區(qū)域指定為識別區(qū)域。
用戶也可以操縱輸入單元101,以移動顯示器107上的光標去指定識別區(qū)域。當有 兩種或多種方法去確定識別對象時,也可以配置為同時選擇多種方法。如果在重現(xiàn)一張動 態(tài)圖片期間執(zhí)行區(qū)域選擇處理,重現(xiàn)模式就會被切換到幀饋入模式,從在幀饋入模式下顯 示的靜態(tài)圖片中選擇出識別區(qū)域。
如果在判定識別對象之前的“臨時判決”中發(fā)現(xiàn)對象正確,就會在臨時判定對象之 后,進行“正式判決”。采用這種結構,可以在臨時判決階段的指定識別對象過程中發(fā)現(xiàn)誤差 時,很方便地改變識別對象。
顯示器107可以由IXD(液晶顯示器)、有機EL(電發(fā)光顯示器)等構成。顯示器 107用于顯示照相機103輸出的圖像及識別結果。此外,顯示器107也可以顯示其他信息, 如電源狀態(tài)、電場強度、電池剩余量、服務器連接狀態(tài)、未讀的電子郵件、輸入的電話號碼、 郵件地址、傳輸?shù)碾娮余]件文本、動態(tài)圖片和靜態(tài)圖片、接收呼叫時主叫方的電話號碼、接 收的郵件文本和從互聯(lián)網(wǎng)上接收到的數(shù)據(jù)等等。[0052]通信接口 106經(jīng)由網(wǎng)絡與信息提供商的一臺服務器或主機計算機或其他設備進 行通信。圖1中只使用一個通信接口,但也可以使用多個通信接口。在這種情況下,用戶可 以使用多種通信方法,如CDMA、EV-D0、無線局域網(wǎng)等。
以下描述了具有兩種圖像拍攝模式的情況,即一種是拍攝欲識別圖片的識別模式,另一種是作為普通照相機功能,拍攝人和景物的普通圖像拍攝模式。但是,本發(fā)明的范 圍不限于這兩種模式。通過應用一個模式判斷標志,CPU102判斷該裝置工作于普通圖像拍 攝模式還是識別模式。將該模式判斷標志處理為存儲在存儲器104中的軟件程序中的一個 變量。用于識別模式的模式判斷標志的值不同于用于普通圖像拍攝模式的值。
圖2(a)是蜂窩電話的前視圖,圖2(b)是蜂窩電話的側視圖,圖2 (c)是蜂窩電話 的后視圖。該蜂窩電話包括包含顯示器107和照相機103的機體110,包含輸入單元101 的機體120。這兩個機體通過鉸鏈130連接在一起,這種結構是可折疊的。
照相機103位于與顯示器107所處的表面(下文中稱為“前表面”)相對的背面 (下文中稱為“背面”)。照相機103位于與該顯示器107的中心相對應的點附近,下文將該 點稱為“背面中心對應點”。顯示器107中心亦即顯示器107的視覺中心。
例如,如果顯示器107為矩形,則在不考慮質(zhì)量分布偏差的情況下,對角線交點就 是該中心,因而就是顯示器107的“視覺中心”。
該中心未必是顯示器的精確中心。例如,用眼睛觀看紙面和照相機103獲取的紙 面的圖片信息之間的位置差異所產(chǎn)生的不一致性很小或沒有時,幾毫米范圍內(nèi)的誤差是可 以容忍的。
通過將照相機103置于背部中心對應點,紙面上的字符出現(xiàn)在顯示器107上,并且 顯示器107上顯示的字符看起來就好像用戶直接在幾乎相同位置處所看到的那樣,從而提 高了對象的顯示圖像和用戶看到的對象之間的一致性。所以,用戶能夠在字符識別的同時 方便地選擇其欲識別的字符串,并且,該系統(tǒng)也便于操作和使用。
優(yōu)選為,照相機103的構造不應從背面突出。因為用戶通常會以折疊狀態(tài)攜帶蜂 窩電話,并且該照相機有可能會與其他物體(如行李或桌子)碰撞而受損。
圖2中所示的蜂窩電話只有主顯示器107,但本發(fā)明不限于此例。該裝置也可以具 有在機體110的背面上的一個子顯示器,用于顯示各種項目,這將是非常方便的,因為可以 在該設備折疊起來時看到電子郵件的接收和到達、時間及其它項目。
圖3(a)給出了子顯示器301位于照相機103上方的實例,亦即處于從照相機103 來看的鉸鏈130的另一側。顯然,也可以將子顯示器301置于照相機103的下方,亦即處于 照相機103和鉸鏈130之間的間隔中。
圖3(b)給出了一個子顯示器301位于照相機103上方而另一個子顯示器302位 于照相機103下方的配置??紤]到照相機103位于如前所述的背面中心對應點附近時,子 顯示器301的面積受到了一定限制的問題,采取了這種結構。因此,可以在背面安置多個子 顯示器,從而,即使在蜂窩電話處于折疊狀態(tài)時,也照樣有可以看到各種數(shù)據(jù)的足夠的顯示 面積。此外,如果指定各顯示器的顯示內(nèi)容,可以給用戶帶來更多的方便。
例如,在該蜂窩電話折疊起來收聽MP3、MIDI文件和其他格式的音樂文件時,如果 一個子顯示器被分配的功能為顯示藝術家名字而另一個子顯示器顯示歌詞及其它信息,對 于用戶來說,操作將變得更加容易。在這種情況下,如果該蜂窩電話安裝了揚聲器或其他音頻數(shù)據(jù)輸出部件(未在圖中顯示)用于聽音樂,其便利性就更不必贅述。
此外,優(yōu)選采用的構造為讓用戶通過操縱輸入單元101選擇欲使用的子顯示器。 這種情況下,當用戶發(fā)出指示選擇欲使用的子顯示器時,一個子顯示器選擇信號就輸入到 CPU102中。CPU102根據(jù)該子顯示器選擇信號,確定向哪個子顯示器供電。
這樣,如果存在多個子顯示器,用戶可以只選擇欲使用的子顯示器。因此,不必向全部子顯示器供電。這種配置節(jié)省了電量,提高了裝置的可操作性。
顯示器301和顯示器302也可以位于照相機103的左側和右側,并且,子顯示器的 數(shù)量可以是兩個或多個。也可以使子顯示器303環(huán)繞照相機103,如圖3 (c)所示。圖4(a) 是蜂窩電話的前視圖,圖4(b)是蜂窩電話的后視圖。OCR屏幕402用于顯示識別模式下照 相機103輸出的圖像。根據(jù)存儲器104中存儲的OCR屏幕區(qū)域數(shù)據(jù),OCR屏幕402顯示于 顯示器107上。OCR屏幕區(qū)域數(shù)據(jù)指示在顯示器107中應該顯示OCR屏幕402的位置。當 用戶選擇識別模式時,CPU102在顯示器107上顯示OCR屏幕402。通過在OCR屏幕402的 周圍設置一個方框及其它類似物,將OCR屏幕402和屏幕401的其他部分在顯示器107上 區(qū)分開來。CPU102在OCR屏幕402中顯示照相機103輸出的圖片信息。
在本實例中,照相機103位于從OCR屏幕402的中心向與OCR屏幕402相反的背 面引出的法線與該背面的交點附近。這里,OCR專用屏幕402位于顯示區(qū)域401的下方,如 圖4(a)所示,照相機103位于該屏幕下方的背面,亦即,靠近鉸鏈處。所以,與圖3(a)中的 實例相比,在背面提供給子顯示器403的空間要大一些。
因此,不僅可以通過提高對象的顯示圖像和用戶看到的對象之間的一致性,從而 更容易地識別字符,還可以增加子顯示器的面積。所以,當電話疊合時,用戶可以更方便地 操作該蜂窩電話。
在圖4中,OCR屏幕402和照相機103位于機體110的下方,本發(fā)明不限于此例, 也可以將這兩個部件置于機體110的上方。
也可以在顯示屏幕401中的OCR屏幕402之外的屏幕上顯示與其他功能相關的信
肩、ο
例如,當OCR屏幕402上顯示商務卡中包含的電子郵件地址時,存儲器104中存儲 的地址本出現(xiàn)在顯示屏幕401中的OCR屏幕402之外的區(qū)域上??梢耘渲脼橥ㄟ^給定的操 作,將該電子郵件地址存儲到地址本中。
這樣,用戶不必給出該事項的任何具體指令,就可以把電子郵件地址迅速登記到 地址本中,從而使得整個系統(tǒng)更易于操作。除此之外,當識別對象是URL信息時,也可以在 顯示屏幕401中的OCR屏幕402之外的區(qū)域內(nèi)顯示該URL的內(nèi)容。
在本實例中,蜂窩電話是可折疊的,該發(fā)明也適用于其他形式的信息處理裝置。例 如,如圖5所示,包含主顯示器的機體510和包含主要操作部件的機體520通過連接部件 (linkage part) 530在大致水平的方向上可旋轉地連接。后面,我們將裝置的這種類型稱為 旋轉型。
圖5 (a)顯示的是旋轉型蜂窩電話的疊合狀態(tài),圖5(b)顯示的是其翻開狀態(tài),而圖 5(c)顯示的是圖5(b)的背面。
如圖5(c)所示,在機體510上,照相機501位于顯示屏幕504中心的對應點附近。 而在機體520上,照相機502位于圖5 (a)所示的顯示屏幕504中心的對應點附近。這樣可以提高對象的顯示圖像和用戶看到的對象之間的一致性。只要用戶能方便地選擇他或她希望識別的字符,一些位置誤差是可以容忍的。利用這種設置,當用戶識別字符時,不管該旋 轉型蜂窩電話處于疊合狀態(tài)還是翻開狀態(tài),由于對象的顯示圖像和用戶看到的對象之間的 基本一致性,他/她都可以很方便地選擇字符。所以,該手機的操作是很容易和方便的。
即使蜂窩電話處于圖5(a)中的疊合狀態(tài),也可以使用輸入鍵503操作該蜂窩電 話,從而進一步增加便利度。
圖6(a)、6(b)和6 (c)給出了蜂窩電話的另一個實例。在圖6(a)中,照相機103 和子顯示器601集成在一起,并且即使在照相機103移動的時候,二者之間的相對距離也幾 乎保持不變。通常情況下,子顯示器601位于如圖6(b)所示的背面的中心附近。在識別模 式下,照相機103被移到與顯示器107的中心對應的位置處,如圖6(c)所示。
這種情況下,可以在機體110的背面設置一個移動槽602,使得用戶可以移動照相 機 103。
該蜂窩電話還包括一個電路和一個開關,該電路用于將OCR功能激活信號輸入到 機體110中心附近的CPU102,該開關位于照相機103附近。當用戶將照相機103移至機體 110中心附近的位置時,如圖6(c)所示,該開關與該電路接觸。當此開關與電路接觸時, CPU102啟動識別模式,主顯示器107上顯示照相機103輸出的圖片信息。
在本實例中,子顯示器601位于機體110的背面中心附近的位置,所以,用戶可以 很方便地看到子顯示器601。此外,由于照相機103的拉動會自動導致啟動識別模式,所以, 可以節(jié)省一些必要的操作。
上面描述了照相機103和子顯示器601的集成結構。但是,二者也不一定要集成 在一起。照相機103和子顯示器601也可以獨立移動。
圖2至6中所示的蜂窩移動電話都是信息處理裝置的實例。當然,本發(fā)明的概念 的應用不限于蜂窩電話。這些概念不僅可以應用于蜂窩電話,也可以應用于其他信息處理 裝置,如PHS、PDA、便攜式電腦或手持個人電腦。信息處理裝置的其他實例包括一些額外部 件,如揚聲器、麥克風、編碼器和解碼器。
下面描述用于提高對象的顯示圖像和用戶看到的對象之間一致性的第二種方法。 在上述結構中,照相機103位于背面中心對應點附近的位置的結構將由于顯示器107和照 相機103的存在,使機體110變厚,從而導致整個手機不容易攜帶,從美學角度看也缺乏美 感。并且,照相機103的位置也使得子顯示器的尺寸受限,這是另一個問題。
因此,下面將描述一種情況,其中,將照相機103設置在與原來的背部中心對應點 偏移的位置,如置于機體110背部的鉸鏈130附近的位置,這樣,它就不會與顯示器107重 疊。在此實例中,我們將描述提高了對象的顯示圖像和用戶看到的對象之間的一致性的可 讓用戶選擇識別對象的結構。
圖7所示為在一次OCR操作中,用戶的眼睛、照相機103和蜂窩電話的顯示器107, 以及商務卡、雜志或其他類似物的表面701之間的位置關系。在本實例中,信息處理裝置包 括子顯示器705。但是,本發(fā)明不限于此例,蜂窩移動電話也可以沒有子顯示器705。
為了使得識別時紙張表面的字符串的位置和顯示器107上的字符串的位置保持 一致,照相機103將被傾斜放置,從而使其可以面對顯示器107的法線和紙張表面701的交 點的中心附近的位置。換句話說,照相機103的傾斜角度為θ 702,該傾斜角度θ 702由距離D703和距離d404確定。顯示器107中心引出的法線穿過紙張表面701的交點為點A,從照相機103的中心附近與前述法線平行地引出的一條直線穿過紙張表面701的交點為點 B,點A和點B之間的距離為距離D703。照相機103中心附近的一個點和紙張表面701之間的距離為距離d704。根據(jù)距離D703和距離d704的值,計算出傾斜角度θ 702。在設計時 可以根據(jù)照相機103的焦距,將距離d704和距離D703設定為合適的值,例如,距離d704在 2-4厘米范圍內(nèi),距離D703也在2-4厘米范圍內(nèi)。優(yōu)選為將這些適當?shù)闹蹈嬷脩簟?br>同時,優(yōu)選為通過考慮用戶應該與能夠很容易地識別字符的紙張表面所分開的距離以及進行實際字符識別的其他方面的因素,來設置距離d704的缺省值。距離D703的缺 省值由照相機103和顯示器的尺寸確定。
圖8(a)是識別情形的解釋說明圖。圖8(b)是在照相機103傾斜之前顯示的圖像信息的實例。這里,當照相機103位于下方(在軸旁)時,只顯示出一張名片的下半部。
圖8(c)是照相機103從圖8(b)所示狀態(tài)調(diào)整后的傾斜狀態(tài)的顯示屏幕的實例。顯示器107的下方所顯示的字符較大,而上方顯示的字符較小,并且字符被傾斜地顯示。由 于紙張上的字符在被傾斜地成像,所以顯示器107上顯示的字符也被傾斜地失真了,從而 導致顯示屏幕很難識別。如果無法改變這種情形,用戶很難選擇他或她希望識別的字符。
所以,CPU102必須校正傾斜顯示的圖像,使其水平地顯示。例如,對于該校正,可以采用梯形失真校正方法,將一個傾斜的圖像校正為一個水平的圖像,但也可以采用其他 方法。
校正后的屏幕實例如圖8(d)所示,對照相機103與機體表面的傾斜所導致的失真進行校正之后,紙張表面上出現(xiàn)的字符和顯示器107上顯示的字符在位置和大小方面看起 來幾乎相同。這樣,就可以在進行字符識別時很方便地選擇欲識別的字符,并提高了整個系 統(tǒng)的可操作性。
在如上所述照相機103被傾斜放置的蜂窩電話中,這在字符識別時很有效。但是,在普通的圖像拍攝模式下,由于照相機107的傾斜角度θ 702,在用戶觀察目標點所看到的 圖像對象與顯示器107上顯示的圖像對象之間可能存在很大不同。例如,當用戶希望拍攝 一個人的面部時,顯示器上顯示的可能是人的腿部。這種情況下,獲取人的面部圖像就會變 得很困難。
因此,下面說明使照相機103的傾斜角度可變的情況。在本實例中,根據(jù)圖像拍攝模式,角度θ 702是可變的。
除照相機103之外,該蜂窩電話還包含一個角度校正部件,用于校正照相機的傾斜角度。下面結合圖9對此進行說明。
如圖9(a)所示,角度校正部件901有一個旋轉驅(qū)動部件902,當該旋轉驅(qū)動部件902的旋轉被傳送到照相機103的時候,照相機103旋轉。需要注意的是,這里的模塊型照 相機103包括圖像鏡頭903和圖像獲取電路904,旋轉驅(qū)動部件902與該圖像獲取電路904 連接在一起。但是,本發(fā)明并不限于這種結構。
現(xiàn)在描述校正照相機103傾斜角度的操作。當用戶使用輸入單元101選擇一種圖像拍攝模式時,CPU判斷所選擇的模式是識別模式還是普通圖像拍攝模式。
在識別模式下,CPU102將原先存儲在存儲器104中的角度校正信號傳送到角度校正部件901。接收到角度校正信號之后,角度校正部件901根據(jù)對應于該角度校正信號的轉數(shù)進行旋轉。這樣,照相機103就可以旋轉給定的角度。
當識別模式結束的時候,CPU102又將一個角度校正信號發(fā)送給角度校正部件901,從而使旋轉過的照相機恢復到原來的傾斜角度。這里,欲發(fā)送的角度校正信號中包含 指示對先前發(fā)送的角度校正信號進行逆旋轉的數(shù)據(jù)以及將照相機恢復到初始傾斜角度的 必須數(shù)據(jù)。響應于該角度校正信號,接收到該角度校正信號的角度校正部件901將照相機 103旋轉到初始傾斜角度,。
另一方面,當用戶選擇普通圖像拍攝模式時,照相機103的傾斜角度不發(fā)生改變。
通過使照相機103只在上述的識別模式期間可變,在普通圖像拍攝模式期間可防 止照相機103發(fā)生不必要的旋轉。這樣,就解決了在普通圖像拍攝模式下用戶觀察目標點 獲取的圖像對象和顯示器107上顯示的圖像對象之間存在明顯差別的問題。
這種將照相機103自動恢復到初始傾斜角度的技術使得用戶不必再手工將照相 機103恢復到初始狀態(tài),從而提高了該裝置的可操作性。此外,照相機傾斜時,照相機103 的一部分有時會從機體表面突出。通過將照相機103自動恢復到初始位置,可以防止照相 機由于突出而可能受到的損壞。
此外,只有在判定當前模式為普通圖像拍攝模式時,照相機103的傾斜角度不能 改變,并顯示當前模式為普通圖像拍攝模式的通知,采用這樣的系統(tǒng),用戶就可以很容易理 解為何照相機103是不可變的(因為當前模式不是“識別模式”)。
本實例考慮了只有在識別模式下才能改變照相機103傾斜角度的情況。但是,照 相機103的傾斜角度在普通圖像拍攝模式下也可以是變化的。這種情況下,當普通圖像拍 攝模式去除激活時,照相機103就會恢復到初始狀態(tài)。角度校正部件901包括與照相機103 相連的致動器905,如圖9(b)所示。這里考慮的是四個致動器905與照相機103相連的情 況,在這種情況下,通過四個致動器中每一個致動器的移動,可以改變照相機103的傾斜角 度。使用這樣的結構,照相機103可以在各個方向傾斜,從而使用戶做出更精細的微調(diào),從 而改善了整個裝置的可操作性。
此外,可以提供上行按鈕1001、下行按鈕1002或其他專門用于改變照相機103傾 斜角度的按鍵,如圖10所示。上行按鈕1001用于增加照相機103的傾斜角度,當用戶按動 該按鈕時,通過CPU102將一個角度增大指示信號輸出到角度校正部件901,響應于該角度 校正指示信號,接收到該信號的角度校正部件校正照相機103的傾斜角度。當用戶按動下 行按鈕1002時,會做出類似的校正。
因為用戶本人可以通過這種方式校正照相機103的傾斜角度,所以用戶能將照相 機103調(diào)整到他或她最容易進行觀察的方向,從而提高了整個裝置的可操作性。
也可以采用一種調(diào)節(jié)控制盤系統(tǒng)(如角度校正調(diào)節(jié)控制盤1003)取代上行按鈕 1001和下行按鈕1002 (見圖10 (b)和10 (c))。通過采用這樣的系統(tǒng),可以更精細地校正傾 斜角度。
同時,傾斜方向不限于繞著鉸鏈軸(鉸鏈部件的中心軸),也可以在其他方向進行 傾斜。這種情況下,可以使用一個能進行360度旋轉的操作鍵(如游戲桿)。通過采用這種 配置,可以在保持手持的蜂窩電話不移動的同時搜索紙張上選作識別對象的單詞。從而,整 個系統(tǒng)更容易使用,用戶友好度也得到了提高。
圖11(a)是蜂窩電話的外視圖,距離傳感器1101測量傳感器1101及其前面的對象之間的距離。通過測量光發(fā)射部件1102發(fā)出的紅外線傳輸?shù)皆搨鞲衅髑懊娴膶ο蟛⒎祷氐絺鞲衅?101的光接收部件1103所需的時間,距離傳感器1101就測出了該距離。這 里使用的是紅外線距離傳感器1101,但也可以采用基于超聲波或其他方式的任何距離傳感 器。該傳感器不必測量精確距離,只要能確定距離該傳感器一定范圍內(nèi)是否存在對象即可。
優(yōu)選為將距離傳感器1101設置在照相機103附近,這是因為,如果距離傳感器 1101距離照相機103很遠,照相機與紙張表面間的距離和距離傳感器與紙張表面間的距離 就會存在太大差異,從而導致照相機和紙張表面間的距離d704變得不準確。
圖7-11中所示的蜂窩電話是信息處理裝置的實例。本發(fā)明不限于蜂窩電話,所述 技術不僅可用于蜂窩電話,也適用于其他信息處理裝置。
圖12是信息處理裝置執(zhí)行傾斜操作的流程圖。這里將說明在識別對象的監(jiān)視期 間校正照相機103的傾斜角度的情況?!氨O(jiān)視期間”指的是照相機激活照相機功能后沒有 發(fā)出獲取圖像的指示,也沒有指定識別對象。
步驟S1201是信息處理裝置在等待狀態(tài)中等待鍵輸入或接收信號或其他的情況。 當CPU102檢測到啟動照相機功能的鍵輸入時(步驟S1202),初始化存儲器104中存儲的與 照相機功能相關的變量,并執(zhí)行啟動照相機功能的其他操作(步驟S1203)。然后,CPU102 判斷圖像獲取模式為識別模式還是普通圖像拍攝模式。
接著,距離傳感器1101測量紙張表面和照相機103之間的距離(步驟S1204),并 將測量結果存儲在存儲器104中。CPU102讀取104中存儲的測量結果,并根據(jù)該測量結果 計算傾斜角度θ (步驟S1205)。然后,CPU102向角度校正部件901發(fā)送一個角度校正信 號,請求將照相機103的方向校正為傾斜角度θ,響應于該角度校正信號,接收到該角度校 正信號的角度校正部件901將照相機103的傾斜角度校正到θ (步驟S1206)。
然后,照相機103獲取一幅圖像并將其暫存在存儲器104中(步驟S1207)。CPU102 讀取圖像并校正失真的圖像信息,圖像信息的失真是由于采用距離傳感器測量的照相機 103和紙張表面之間的距離而傾斜地拍攝產(chǎn)生的,然后,CPU102將校正的圖像信息存儲到 存儲器104中(步驟S1208)。這里,可以使用“梯形校正方法”校正失真。
CPU102讀取圖像,并將其顯示在顯示器107上(步驟S1209)。
然后,CPU102判斷快門按鈕是否被按下(步驟S1210)。如果檢測到快門按鈕沒有 被按下,則返回步驟S1204,重復相同的過程。
如果在步驟S1210中檢測到快門按鍵的輸入時,照相機拍攝對象的圖像(步驟 S1211),并且CPU102根據(jù)該圖像進行字符識別(步驟S1212),并在屏幕107上顯示結果(步 驟 S1213)。
照相機103傾斜角度的這種自動校正功能使得紙張上的字符與顯示器107上顯示 的字符看起來如同位于相同的位置,并且,用戶還能更方便地將字符串選擇為字符識別的 對象,從而使整個系統(tǒng)易于操作和提高用戶友好度。
優(yōu)選為用戶選擇一種禁止模式,該禁止模式禁止照相機103發(fā)生傾斜。當用戶選 擇該模式時,圖12中的操作過程在執(zhí)行步驟S1203之后直接跳轉到步驟S1209。
在圖11 (a)中示出了照相機103旁邊只有一個距離傳感器的情況,但是,也可以在 機體110的背面上方設置另一個距離傳感器。在圖11(b)中示出了蜂窩電話具有另一個 距離傳感器1104的情況,該距離傳感器包括光發(fā)射部件1105和光接收部件1106。這種情況下,可以使用兩個距離傳感器的測量結果和機體110的設計值(縱向長度),計算顯示器107和出現(xiàn)欲識別的字符的紙張表面所形成的角度。即使顯示器107與紙張表面不平行,也 可以使用該角度對顯示器107上顯示的圖像進行校正。此外,必要情況下,還可以在該信息 處理裝置上安裝任何數(shù)量的距離傳感器。
此外,該信息處理裝置還可以有一個加速度傳感器,用于測量作用在該裝置上的 加速度。使用測量到的加速度計算照相機103的傾斜角度。加速度傳感器包括一個加熱器, 用于加熱一部分氣體,如一定空間內(nèi)的氮或二氧化碳,以及一個溫度計,用于測量氣體的溫 度等。當在該加速度傳感器上施加一個加速度時,由于加熱器加熱而升溫的一部分氣體和 其他沒有升溫的氣體交換位置,從而改變了溫度分布。該溫度分布由溫度計測量。應用這 種方式,可以測量出施加在該傳感器上的加速度。通過測量的加速度,就可以計算出加速度 傳感器在垂直方向的傾斜角度。
一般情況下,加速度傳感器要小于距離傳感器。使用加速傳感器可以讓信息處理 裝置更緊湊。
圖13是字符識別操作過程的流程圖,其中,步驟S1305-S1311是圖12中步驟 S1212的詳細過程。
當照相機103輸出某對象的圖像數(shù)據(jù)時(步驟S1211),CPU102獲取該圖像數(shù)據(jù) (步驟S1305)。CPU102提取出圖像數(shù)據(jù)中包含一個或多個字符串的區(qū)域(步驟S1306)。當 該圖像數(shù)據(jù)中一個黑色像素集合與另一個黑色像素集合的間距等于或大于一個給定的值 時,CPU102確定這樣的集合是間距分開的字符串。將這樣提取的字符串區(qū)域的坐標存儲到 存儲器104中。當CPU無法提取出字符串的區(qū)域時(步驟S1307),執(zhí)行步驟S1210。在這 種情況下,優(yōu)選為將識別區(qū)域的提取失敗通知用戶。
當提取出字符串區(qū)域時,CPU102識別提取出的區(qū)域中的一個或多個字符的字符串 (步驟 S1308)。
然后,CPU102確定所識別的字符串的類型(步驟S1309)。所識別的字符串的類型 包括電子郵件地址、電話號碼、URL、英語單詞或日語單詞等。識別字符串的類型的方法如 下如果字符串中包含“@”,則為電子郵件地址;如果包含“http: ”,則為URL ;如果字符串 由數(shù)字和“_”組成,則為電話號碼;如果由字母組成,則為英語單詞。此外,當字符串中包含 “電話”、“傳真”、“電子郵件”等詞時,也可用于進行類型區(qū)分。
盡管圖13中未示出輸入類型的步驟,但是用戶可在步驟S1210之前選擇字符串的 類型,如電子郵件地址、電話號碼或其他。CPU102判斷用戶預先設定的識別對象類型與實際 識別出的字符串的類型是否一致(步驟S1310)。如果一致,顯示器107顯示環(huán)繞提取區(qū)域 的框(步驟S1311)。當用戶操縱輸入單元101時,顯示識別結果(步驟S1312)。在這種情 況下,如果使用了未經(jīng)輸入單元101的任何特定操作就在顯示器107上自動顯示識別結果 的配置,用戶就不必輸入任何信息,從而提高了整個系統(tǒng)的可操作性。
當在步驟S1310中,設置的識別對象的類型和識別出的字符串的類型不一致時, CPU102改變圖像中提取字符串區(qū)域的起點(步驟S1313),并重新執(zhí)行提取處理(步驟 S1306)。
這里,從上一行到下一行連續(xù)執(zhí)行字符串區(qū)域的提取處理時,在步驟S1313中, CPU102將提取的起點下移一給定量。預測到一行中有多個電子郵件地址或電話號碼時,如果有空格,在前的字符串和隨后的字符串將被視為不同的字符串進行處理。
這種情況下,對空格左側的字符串進行步驟S1308至S1310所述的處理之后,再對空格右側的字符串執(zhí)行類似的處理。
此外,也可以對該圖像中包含的所有字符執(zhí)行字符行的提取處理,然后再執(zhí)行字 符識別處理之后的處理。這樣,就可以將字符提取的結果(如圖像中提取字符的左上方的 坐標和右下方的坐標)存儲在存儲器104中,然后,針對各個字符串,連續(xù)執(zhí)行步驟S1308 至S1312所描述的處理。
讓用戶使用輸入單元101指定識別對象的正確位置可能是很困難的。在本實例 中,當識別結果與識別對象的類型不一致時,CPU再次執(zhí)行提取過程。所以,用戶不必操縱 輸入單元101去指定識別對象位置。
圖14所示為用于選擇識別對象的類型的屏幕實例。圖14(a)表示的是照相機啟 動之后的屏幕,在此狀態(tài)下按下“子菜單”鍵時,與照相機和字符識別相關的菜單就顯示出 來,如圖14(b)所示。當在該狀態(tài)下選擇“(2)識別對象設置”時,則顯示用于選擇識別對象 的類型的屏幕(圖14(c))。例如,在這種狀態(tài)下選擇“(3)電話號碼”,就會顯示用于通知用 戶識別對象類型已被設置為電話號碼的屏幕。
圖15(a)是通過執(zhí)行上述操作將“電話號碼”設置為識別對象類型之后,監(jiān)視 一張名片時的屏幕實例。CPU102識別屏幕上顯示的字符中方框1504圈定的電話號碼 “045-000-1234”,并且在識別結果顯示區(qū)1505顯示該識別結果。圖15(a)中顯示的圖標 1501通知用戶“電話號碼”被設置為識別對象的類型。發(fā)現(xiàn)這個圖標之后,用戶可以確認現(xiàn) 在的識別對象的類型為“電話號碼”。
圖15(b)是將“郵件地址”設置為識別對象類型之后監(jiān)視名片1503時的屏幕實例。 此時,CPU102識別方框1506所圈定的郵件地址“yamadaOdenki. 00. co. jp”,并如1507所示 顯示該識別結果。圖標1502被顯示出來,以通知用戶識別對象的類型為“郵件地址”。
如前所述,當被監(jiān)視的屏幕中包含預先選定的識別對象的類型時,如“郵件地址”, 就會將其自動提取出來,并進行顯示。利用這種配置,用戶在進行字符識別時,就不必再校 正位置以指定識別對象,從而改善整個系統(tǒng)的可操作性。
當在一個屏幕中多個字符串被選為識別對象時,例如當顯示兩個郵件地址時,兩 個郵件地址都會被識別并顯示相應的識別結果。圖15(c)所示為這種情況下的顯示屏幕的 實例。
如圖15(c)所示,被選擇為識別對象的郵件地址用“⑴”和“(2) ”等進行編號,如 1508和1509所示。通過將對應于“1”的郵件地址的識別結果標為“(1) ”和將對應于“2” 的郵件地址的識別結果標為“(2),,,就可以更清楚地理解選作識別對象的郵件地址和識別 結果之間的對應關系,從而提高整個系統(tǒng)的可操作性。
此外,當存在多個郵件地址并且無法顯示所有識別結果時,可以通過按下與(1) 和(2)對應的數(shù)字鍵,顯示與該數(shù)字對應的郵件地址的識別結果。例如,按下鍵“1”時, 識別結果顯示區(qū)中顯示的是“yamada@denki.00. co. jp” ;按下鍵“2”時,顯示“tarotexx. ne. jp”。應用這種配置,即使蜂窩電話上的屏幕很小,也可以很方便地顯示多個識別結果, 從而增強該裝置的可操作性。
如圖15(d)所示,其提供了一個首字母輸入?yún)^(qū)1512。當用戶通過按下輸入單元101向首字母輸入?yún)^(qū)1512中輸入字母時,CPU102會提取一個以該字母開頭的郵件地址,然后通過在提取出的郵件地址上顯示一個方框,來將郵件地址的識別結果顯示在識別結果顯示區(qū) 中。在圖15(d)中,從多個郵件地址中選擇一個以用戶輸入的“y”開頭的郵件地址“yamali XXX. 000. co. jp”作為識別對象。
這樣,用戶就可以從多個識別對象中方便快速地選擇欲作為識別結果顯示的一個或多個郵件地址,從而提高整個系統(tǒng)的可操作性,給用戶帶來更多的便利。
當然,也可以把圖15(c)和圖15(d)中的功能結合到一起。
當有多個候選識別對象時,可以使用輸入單元101中的一個十字鍵或其他部件進 行選擇。采用這種配置,在選擇識別對象的類型之后即使如上所述存在多個識別對象,也可 以很容易地指定識別對象,進一步增加系統(tǒng)的用戶友好度。此外,如果在如上所述的字符搜 索模式中存在多個以“y”開頭的郵件地址,則先根據(jù)首字母搜索大致選擇出識別對象,然后 使用十字鍵可以很容易地選擇用戶欲搜索的郵件地址,從而提高整個系統(tǒng)的可操作性和用 戶友好度。
可以將識別結果存儲到存儲器104中的一個地址本中,應用這種配置,用戶就可 以在不輸入數(shù)據(jù)的情況下,記錄一張商務卡或其他類似物中所包含的郵件地址和其他個人 信息,從而提高整個系統(tǒng)的可操作性和用戶友好度。
與圖15(d)中所示類似的功能可作為識別對象的字符搜索功能使用。例如,假設 用戶已經(jīng)知道一份英語報紙中包含一篇關于專利的文章,但他/她不知道這篇文章出現(xiàn)在 報紙的哪一部分。這種情況下,搜索單詞“專利”就足夠了,但是,在一份包含幾十或者數(shù)千 單詞的英語報紙中搜索一個單詞是非常繁瑣的。下面介紹用戶輸入他或她希望搜索的部分 或全部關鍵詞(下文稱為“搜索對象單詞”),并搜索使用的關鍵詞在報紙、書或其他類似物 中的位置的情況。
當輸入部分或全部搜索對象單詞時,用于指定欲搜索單詞的搜索單詞指定數(shù)據(jù)被 輸入到CPU102。CPU102接收到搜索單詞指定數(shù)據(jù)之后,根據(jù)該搜索單詞指定數(shù)據(jù),從照相 機103獲取的圖像信息所包含的單詞中搜索被指定為搜索對象的單詞。當照相機103獲取 的圖像信息中存在包含搜索單詞指定數(shù)據(jù)的單詞數(shù)據(jù),CPU102通知用戶搜索對象單詞已經(jīng) 被搜索到。
至于通知方式,例如,可以將被選擇為搜索對象的單詞加框的方式顯示出來。當照 相機103獲取的圖像信息中不存在包含搜索單詞指定數(shù)據(jù)的單詞數(shù)據(jù)時,CPU102將該信息 通知用戶,例如,顯示“沒有找到被選擇為搜索對象的單詞”。
可以對該搜索做出時間限定,采用這種方式,當搜索時間太長時,就可以終止搜 索,從而節(jié)省時間。
圖16是顯示屏幕的圖像實例,其示出了將單詞“parameter”加框的圖像實例。
圖16(a)是通過在首字母輸入?yún)^(qū)1601中輸入首字母“P”,來監(jiān)視一段英語文本的 顯示屏幕的實例。通過多次按動輸入單元101,用戶可以輸入首字母。在該屏幕上,以首字 母“P”開頭的英語單詞,如“portion”、“parameter”和“pattern”分別被加框。
圖16(b)所示為當在首字母輸入?yún)^(qū)輸入“para”時監(jiān)視一段英文文本的屏幕 顯示的實例。在該屏幕中,只有單詞“parameter”被加框,用戶可以很容易地確定單詞 “parameter”的打印位置及其數(shù)量。這種情況下,也可以指示報紙上出現(xiàn)的“parameter”的數(shù)目。
在這種情況下,當該信息處理裝置向右邊移動時,在英語文本右側打印的單詞 "parameter,,被力口框(16 (C))。
通過這種方式移動蜂窩電話的簡單的操作,就可以確定選擇用于識別的單詞 ("parameter")的位置。從而,可以在包含大量字符信息的印刷品中很方便地搜索字符, 因此,可省去專門搜索具體字符的麻煩。整個系統(tǒng)操作非常容易和便利。
此外,還可以顯示與搜索的單詞相關的信息,如單詞的意思和翻譯。
圖17是該信息處理裝置的處理流程圖。在該實例中,詞典數(shù)據(jù)109存儲在存儲器104中。步驟S1305和S1701至S1709是圖12中步驟S1212的詳細過程。例如,顯示在最 靠近顯示器107中心的‘‘ + ”標記的一個或多個字符的字符串被提取出來,并且該字符串被 選擇作為識別對象單詞(步驟S1701)。CPU102將被指定為識別對象單詞的字符串用方框 圈定,并告知用戶當前指定為識別對象的字符串(步驟S1702)。
然后,CPU102執(zhí)行字符識別處理(步驟S1703),提取出用于字符識別的圖像數(shù)據(jù) 中包含的單詞,并將識別結果存儲在存儲器104中(步驟S1704)。
CPU102從存儲器104中讀取識別結果,并從詞典數(shù)據(jù)109中搜索與該識別結果匹 配的單詞(步驟S1705)。
作為搜索的方法,優(yōu)選為先尋找與字符串完全匹配的單詞,如果沒有完全匹配的 單詞,再尋找只有一個字符不同而其他字符相同的單詞。這樣,即便CPU102在進行字符識 別時發(fā)生小錯誤,也能找到與該字符串最接近的單詞,這樣可以消除重復執(zhí)行字符識別的 麻煩,從而使整個系統(tǒng)操作更方便。
當沒有找到包含一個不同字符的單詞時,再搜索包含兩個不同字符的單詞,再搜 索具有三個不同字符的單詞,依次搜索增加數(shù)量的不同字符的單詞。這種情況下,即使識別 率比較低,也可以找到合適的單詞。
當通過搜索在詞典數(shù)據(jù)109中找到了匹配的單詞時,CPU102從詞典數(shù)據(jù)109中讀 取與該單詞的對應的信息,如單詞的定義(步驟S1707)。不需任何輸入操作,識別結果和 從詞典數(shù)據(jù)109中讀取的信息就會自動顯示在顯示器107上(步驟S1213)。另一方面,當 在詞典數(shù)據(jù)109中沒有找到匹配的單詞時,顯示器107上將顯示“未找到對應單詞”(步驟 S1709)。
在該實例中,字符識別和搜索在用戶操作輸入單元101 (如快門按鈕)之后執(zhí)行。 但是,本發(fā)明并不限于此例,也可以如圖18所示,在用戶每次移動該信息處理裝置時,都執(zhí) 行字符識別和搜索。
圖18(a)所示為單詞“ length”的定義顯示在顯示器107上的顯示屏幕的實例。
圖18(b)所示為該信息處理裝置向右移動,并且單詞“width”的定義顯示在顯示 器107上的顯示屏幕的實例。
因此,用戶不必按動任何按鈕,就可以通過移動該裝置查找與選作識別對象的單 詞相關的信息。
在該實例中,由于處理能力的原因,選作識別對象的單詞的加框和對應信息的顯 示之間會出現(xiàn)一個時間滯后。當識別對象從一個單詞改變?yōu)榱硪粋€單詞時,改變后的識別 對象被加框,但相應的定義仍然保持為改變前識別對象的定義。這對用戶也是一個尷尬的情況。為了解決這個問題,需要設計一種能夠使CPU圈定選作識別對象的單詞并同時顯示相應定義的系統(tǒng)。這種情況下,例如,由于顯示定義通常要比對單詞加框需要更多的時間, CPU102應該將信息顯示的時間和加框的時間統(tǒng)一起來。利用這種配置,選作識別對象的單 詞的加框時間和定義的顯示時間就一致了,所以,用戶可以同時看到現(xiàn)在選擇作為識別對 象的單詞及其相應的定義,從而使整個系統(tǒng)易于應用和方便。
接下來我們描述搜索圖書、雜志或其他類似物中的單詞的定義的示例性的系統(tǒng)。在故事中,經(jīng)常會出現(xiàn)普通詞典中沒有列出的專有名詞,而詞典中列出的單詞在一些故事 中往往具有特別的意思。碰到這些單詞時,讀者無法通過查詞典獲得這些單詞的意思,他們 只好從頭認真閱讀整個故事,或者詢問那些很熟悉該故事的朋友。
為了解決這個問題,本發(fā)明提出了一種用于查找單詞定義的系統(tǒng)。在該實例中,使用的是圖書或類似書籍上打印的標識信息,如ISBN(國際標準書號)。ISBN用于標識全球 范圍內(nèi)發(fā)行的書籍中的一本書。在下面的例子中,ISBN用于查找單詞的定義。但本發(fā)明不 限于使用ISBN,也可以使用其他標識信息查找與所識別的字符串相關的信息。
圖19是用于查找單詞定義的系統(tǒng)實例的簡圖。
詞典數(shù)據(jù)109中包含英語詞典數(shù)據(jù)和其他外語詞典。
服務器1950包括的組成部件如圖19所示。響應于來自SV通信接口 1906的信號,SV-CPU1902根據(jù)存儲在SV存儲器1904中的程序執(zhí)行操作,并控制各個部件。SV存儲 器1904存儲從通信接口接收到的數(shù)據(jù)和服務器1950處理的其他數(shù)據(jù)。
ISBN詞典數(shù)據(jù)1905是包含只用在ISBN標識的圖書中的專有名詞和單詞的詞典數(shù)據(jù),它們在這些書中的意思與其通常的意思不同。ISBN詞典數(shù)據(jù)1905中每個單詞都有一個 詞典ID,該詞典ID管理ISBN詞典數(shù)據(jù)1905。
ISBN-詞典ID對照表1903表明了 ISBN和與具有該ISBN的圖書相關連的ISBN詞典的詞典ID之間的對應關系。
圖20是ISBN-詞典ID對照表1903的一個實例。ISBN-詞典ID對照表1903包 括例如,ISBN2001,書名、出版商和其他圖書信息2002,以及詞典ID2003??梢酝ㄟ^ISBN 檢索書名和出版商。這里,圖書信息是與圖書相關的信息,并不限于以上所述信息。
SV通信接口 1906經(jīng)由網(wǎng)絡與信息處理裝置或其他設備通信。SV輸入單元1901可 以是鍵盤、鼠標,和用于存儲和更新SV存儲器1904中的ISBN-詞典ID對照表1903和ISBN 詞典數(shù)據(jù)1905的其他輸入裝置。
SV顯示器1907是用于顯示SV存儲器1904中存儲的數(shù)據(jù)的輸出裝置。
下面結合圖21描述登記與ISBN對應的詞典并使其可用所需的處理。
信息處理裝置100中的CPU102執(zhí)行字符識別處理(步驟S2100),將識別結果數(shù)據(jù) 存儲在存儲器104中,并在顯示器107上顯示該識別結果。
CPU102從存儲器104中讀取識別結果數(shù)據(jù),判斷是否為ISBN(步驟2101),并將判 斷結果存儲在存儲器104中。當字符串由數(shù)字字符和連字符組成(連字符插入在與電話號 碼不同的位置處)時,或者字符串以“ISBN. ”開頭時,CPU102判斷該字符串為ISBN。
當在步驟2101中判斷識別結果不是ISBN時,CPU102顯示為各種識別對象分配的 顯示屏幕(步驟2102)。例如,當所識別的字符串的類型為郵件地址時,CPU102顯示與郵件 相關的顯示屏幕;當所識別的字符串的類型為URL時,顯示與URL相關的顯示屏幕。[0180]當在步驟2101中判斷識別結果為ISBN時,CPU102顯示識別對象為ISBN的專用屏幕。
如果判定識別結果為ISBN,CPU102通過通信接口將ISBN數(shù)據(jù)發(fā)送到服務器 1950 (步驟 2103)。
服務器的SV通信接口 1906接收到ISBN數(shù)據(jù)(步驟2104)后,將數(shù)據(jù)暫時存儲在SV存儲器1904中。SV-CPU1902讀取該ISBN數(shù)據(jù),并搜索對照表1903中是否包含ISBN(步 驟 2105)。
當在對照表1903中沒有找到接收的ISBN時,SV-CPU1902向裝置100發(fā)送一條出 錯消息,表明服務器中不存在接收的ISBN所對應的詞典ID (步驟2110)。
另一方面,當在對照表1903中找到了接收的ISBN時,SV-CPU1902從對照表1903 中讀取與該ISBN對應的詞典ID2003。詞典ID2003經(jīng)由SV通信接口傳送到裝置100 (步驟 2106)。
裝置100將詞典ID2003存儲到存儲器104中(步驟2107),并顯示該服務器中包 含的與識別的ISBN對應的詞典(步驟2108)。
經(jīng)過以上處理,信息處理裝置100的用戶就可以通過詞典ID2003,利用與服務器 中包含的ISBN對應的詞典,從而減少存儲容量,同時,也使整個系統(tǒng)易于應用和方便。
在該實例中,詞典ID2003是下載的,而非與ISBN本身對應的詞典。但是,也可以 采用將與ISBN本身對應的詞典下載以存儲的處理。這樣,如果將詞典存儲到裝置100中, 就可以節(jié)省查找詞典時與服務器1950進行通信的時間。
可以在與ISBN對應的詞典的詞典ID下載時,也同時下載與ISBN對應的圖書相關 的信息,如書名。
從服務器1950接收的詞典ID和圖書信息互相關聯(lián)并存儲在存儲器104中。例如, 在使用詞典ID查找ISBN詞典數(shù)據(jù)前、后或同時,顯示與該詞典ID對應的圖書信息。
通過采用上述過程,用戶可以確認在查找詞典前、后或同時,與ISBN對應的詞典 與哪些圖書相關。所以,如果一個用戶使用的詞典與預期的不同,其就能很容易地發(fā)現(xiàn)這個 事實,從而使整個系統(tǒng)易于應用。在連接過程中,如果采用了用戶能選擇其喜歡的另一個詞 典的系統(tǒng),將更方便和易于使用。
下面結合圖22中的流程圖描述使用詞典查找單詞的意思的實例。這里,包含普通 單詞意思的詞典數(shù)據(jù)109預先存儲在裝置100中。我們描述查找那些與沒有包含在詞典數(shù) 據(jù)1908中的專有單詞相關的ISBN所對應的詞典。
首先,如上所述,CPU102對選作識別對象的單詞執(zhí)行字符識別處理,將識別結果數(shù) 據(jù)存儲在存儲器104中,并在顯示器107上顯示該識別結果(步驟S2201)。CPU102從詞典 數(shù)據(jù)109包含的單詞中搜索匹配的單詞(步驟S2202)。
如果搜索結果顯示找到了合適的單詞,則從詞典數(shù)據(jù)109中讀取與該單詞相關 的意思數(shù)據(jù)或翻譯數(shù)據(jù)(后面稱之為意思/翻譯數(shù)據(jù)),并將其顯示在顯示器上(步驟 S2211)。
如果搜索結果顯示沒有找到合適的單詞,CPU102讀取存儲器104中存儲的詞典 ID2003。CPU102經(jīng)由通信接口 106,將識別結果數(shù)據(jù)和詞典ID2003發(fā)送到服務器1950 (步 驟 S2204)。[0195]服務器1950接收到識別結果數(shù)據(jù)和詞典ID2003時(步驟S2205),SV-CPU1902訪問與詞典ID2003關聯(lián)的ISBN詞典數(shù)據(jù)1905 (步驟S2206)。并且SV-CPU1902從ISBN詞典 數(shù)據(jù)1905中搜索與識別結果數(shù)據(jù)匹配的單詞(步驟S2207)。
此時,SV-CPU1902判斷ISBN詞典數(shù)據(jù)1905中是否包含與識別結果數(shù)據(jù)匹配的單 詞(步驟S2208)。如果ISBN詞典數(shù)據(jù)1905中沒有與識別結果數(shù)據(jù)匹配的單詞,SV-CPU1902 經(jīng)由通信接口 1906向裝置100發(fā)送一條出錯消息(步驟S2212)。
另一方面,當在步驟S2208中發(fā)現(xiàn)查找到合適的單詞時,SV-CPU1902讀取SV存儲 器1904中存儲的意思/翻譯數(shù)據(jù)。SV-CPU1902通過SV通信接口 1906將意思/翻譯數(shù)據(jù) 發(fā)送到裝置100(步驟S2209)。信息處理裝置100經(jīng)由通信接口 106接收意思/翻譯數(shù)據(jù) (步驟S2210),并在顯示器107上顯示該意思/翻譯數(shù)據(jù)(步驟S2211)。
圖23是該信息處理裝置的一些屏幕顯示實例。圖23(a)所示為ISBN數(shù)據(jù)作為識 別結果被顯示出來的屏幕顯示的實例。
如圖23(a)所示,當按動顯示屏幕右下方所顯示的“子菜單”對應的操作鍵時,就 會顯示與字符識別相關的子菜單(圖23(b))。
然后當選擇“(3)獲取圖書信息”時,將識別的ISBN數(shù)據(jù)和請求與該ISBN對應的 詞典數(shù)據(jù)或詞典ID的一條請求信號發(fā)送給服務器1950。于是,如圖23(c)所示,顯示與服 務器1950的連接狀態(tài)。
圖23(d)所示為當從服務器1950接收到與該ISBN對應的具體詞典的詞典ID以 及與該ISBN對應的圖書信息時顯示屏幕的實例。這里,圖書信息包括書名、出版商和作者, 還可以包括與該書對應的詞典的可用性。
根據(jù)該信息,用戶就可以很容易地得知該服務器中是否包含與該ISBN對應的圖 書信息和與該ISBN對應的詞典。
在這種情況下,當選擇“(4)詞典可用”時,就會出現(xiàn)一個屏幕,要求用戶選擇他或 她是否希望將從服務器接收到的詞典ID登記為存儲器104中的輔助詞典(圖23(e))。其 中,“輔助詞典”一詞指的是作為主用詞典數(shù)據(jù)109補充使用的詞典。
在這種情況下,當選擇“1.是”時,詞典ID將會被登記為輔助詞典。其中,登記過 程為將存儲器104中存儲的表示輔助詞典的變量替換為從服務器接收到的詞典ID值。然 后顯示一條消息,告訴用戶該詞典已被登記到輔助詞典中(圖23(f))。
上面描述了圖23(d)的情況,其中,當選擇“(4)詞典可用”時,就登記與該ISBN對 應的詞典的詞典ID。也可以如前所述,接收與該ISBN對應的詞典本身并將其存儲到存儲器 104 中。
也可以通過存儲卡或其他存儲媒介接收詞典ID或詞典本身。
通過上述方法,可以節(jié)省通信成本和用于連接服務器的時間。
圖24所示為使用與ISBN對應的詞典查找到的單詞意思的顯示屏幕的實例。
圖24(a)所示為顯示識別結果的顯示屏幕的實例。其中,顯示屏幕表明已經(jīng)識別 出選作識別對象的單詞“Zakky”。此外,還提供了一項在使用詞典數(shù)據(jù)109 (下文稱之為“主 詞典”)或使用與ISBN對應的詞典數(shù)據(jù)(下文稱之為“輔助詞典”)(2401,2402)之間進行 選擇以檢查單詞“Zakky”的意思的功能。
應用該功能,如果主詞典中明顯沒有該單詞,就可以從一開始就選擇輔助詞典。另一方面,如果一個單詞很可能包含在主詞典中,一開始時就選擇主詞典而非輔助詞典來查 找是否包含該單詞的意思。通過提供這樣的功能,用戶可以在每個場合選擇主詞典或輔助 詞典,從而提高系統(tǒng)的可操作性和用戶友好度。
在圖24(b)所示為用戶試圖使用主詞典查找該單詞的意思,但結果發(fā)現(xiàn),主詞典 不包含識別對象的單詞(“Zakky”)。其中,CPU102通過將顯示識別結果的區(qū)域上移,給出 一個彈出屏幕,表明在主詞典中未找到該單詞。這樣,顯示屏幕可以被有效使用。
圖24(c)所示為在主詞典不包含選作識別對象的單詞的情況下,選擇使用輔助詞典(2402)的顯示屏幕的實例。其中,輔助詞典包含單詞“Zakky”,于是CPU102處理并顯示 單詞“Zakky”的意思。
圖24(d)所示為主詞典和輔助詞典中都不包含單詞“Zakky”的顯示屏幕的實例。 這里,屏幕顯示該結果。
圖24(e)所示為當主詞典和輔助詞典中都不包含選作識別對象的單詞“Zakky” 時,選擇不同的詞典的顯示屏幕的實例。當在圖24(d)中的顯示屏幕中選擇“詞典2403” 時,屏幕切換為圖24(e)所示的屏幕,其中,存儲器104中事先存儲了多個詞典ID的數(shù)據(jù)或 詞典本身。根據(jù)該功能,可以對主詞典或輔助詞典進行設置。
例如,應用該功能,當用戶希望使用一個與包含選作識別對象的單詞的詞典不同 的詞典時,可以重新選擇詞典,從而提高獲取正確意思的概率。
此外,設置主詞典和輔助詞典的功能并不限于此例,也可以只設置一個詞典。例 如,可以將主詞典設為固定詞典,只有輔助詞典可變或自由設置。通過采用這種詞典可以隨 機改變的配置,可以避免由于頻繁改變詞典,導致用戶自己都不知道哪部詞典是主詞典的 不必要的麻煩。
圖24(f)所示為向用戶提供什么是當前設置的輔助詞典的信息的顯示屏幕的實 例。這里,在用于選擇輔助詞典的圖標上方顯示當前設置的輔助詞典(Hello ! Zakky 2404)。
通過該功能,用戶可以很直觀方便地確認當前設置的輔助詞典及其他項,從而提 高用戶友好度。
需要指出的是,通知方式并不限于上述實例。如,可以使用表示輔助詞典的數(shù)字或 圖標。采用這種方法,在蜂窩電話顯示屏幕比較小的情況下,可以高效地利用顯示區(qū)域。
上面描述了如何設置輔助詞典。但是,很明顯也可以提供一種通知用戶當前所設 定的主詞典的功能。
此外,可以將上述各種功能以軟件程序的形式實現(xiàn),并且用戶可以經(jīng)由網(wǎng)絡通過 機讀媒介從信息供應商的服務器或從其他設備中接收軟件程序。機讀媒介一般包括軟盤、 柔性盤、硬盤、磁盤、磁帶及其它磁體媒介、CD-ROM、DVD及其它光媒介、RAM、PROM、EPROM、 FLASH-EPR0M及其他存儲芯片或磁頭,以及傳輸數(shù)據(jù)或指令的載波。用這種方式,就可以只 加載必須的功能,以后根據(jù)用戶的需要,不斷增加、刪除或更新各種功能。
此外,很明顯,可以結合上述各種實現(xiàn)模式,組成新的實現(xiàn)模式。
本發(fā)明不限于所述的實現(xiàn)模式,這里所公開的原理和新的特征包含一個很寬的技 術范圍。
權利要求
一種手持信息處理裝置,包括可傾斜的照相機,其輸出對象的圖片信息;顯示器,其應用該照相機輸出的圖片信息顯示圖像;輸入單元,其可以使用戶從該照相機的多種模式中選擇一種模式,所述多種模式包括作為普通照相機功能拍攝圖片的普通圖像拍攝模式,和識別由該照相機輸出的圖片信息中包含的字符的識別模式;距離傳感器,其測量與由該照相機拍攝的圖片的對象的距離;角度校正部件,其改變該照相機的傾斜角度;以及CPU,如果通過該輸入單元的操作選擇了該識別模式,則該CPU根據(jù)由該距離傳感器測量的距離來計算該照相機的傾斜角度,控制所述角度校正部件根據(jù)CPU所計算的傾斜角度來改變該照相機的傾斜角度以使得該照相機要拍攝的對象與該顯示器上顯示的對象看起來如同位于相同的位置,處理由該照相機輸出的圖片信息以使得該圖片信息的顯示位置或顯示角度的至少一部分被修改,以及控制該顯示器以使得呈現(xiàn)處理過的圖片信息。
2.如權利要求
1所述的手持信息處理裝置,其中該距離傳感器位于該照相機附近。
3.如權利要求
1所述的手持信息處理裝置,其中該CPU通過使用梯形校正方法來處理 該照相機輸出的圖片信息。
專利摘要
本發(fā)明提出一種信息處理裝置,其包括一個輸出對象的圖片信息的照相機,一個顯示器和一個輸入單元。在一個實例中,用戶可以使用輸入單元從普通圖像拍攝模式和字符識別模式中選擇一種模式。照相機所處的位置使得對象的顯示圖像和用戶看到的對象視圖基本一致。在另一個實例中,可以通過輸入單元選擇信息類型。CPU提取所選擇的信息類型對應的字符串。此外,當用戶請求與識別出的字符串相關的信息時,經(jīng)由網(wǎng)絡發(fā)送所識別字符串中包含的標識信息。
文檔編號H04M1/00GKCN1595944 B發(fā)布類型授權 專利申請?zhí)朇N 200410077193
公開日2010年8月18日 申請日期2004年9月8日
發(fā)明者山崎正裕, 桑本英樹 申請人:株式會社日立制作所導出引文BiBTeX, EndNote, RefMan專利引用 (2), 非專利引用 (1),