两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

手持器件的語音命令和語音識別的制作方法

文檔序號:2821048閱讀:295來源:國知局
專利名稱:手持器件的語音命令和語音識別的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般地涉及手持器件,更具體而言涉及用于手持器件的語音命令和語音識別。
背景技術(shù)
電子書籍(也稱為“Ebook”)是傳統(tǒng)印刷書籍(或其他印刷材料,諸如雜志、報紙等)的電子版本,它可以使用個人計算機或使用電子書籍讀取器來被讀取。不像PC或手提計算機那樣,與傳統(tǒng)的紙張書籍相比較,電子書籍讀取器提供了閱讀經(jīng)驗,同時增加了用于記錄、快速瀏覽和關(guān)鍵詞搜索的強大電子特征。但是,這樣的行為——不論它們是在PC、手提計算機或電子書籍讀取器上被執(zhí)行——一般要求用戶從啟動按鈕或使用遙控器。因此,電子書籍的使用一般要求用戶使用他的或她的一只或多只手。而且,手持器件的使用需要用戶使用他的或她的一只或多只手。
因此,具有可以不用手操作的、諸如電子書籍的手持器件是所希望的和極其有利的。

發(fā)明內(nèi)容
本發(fā)明、即具有命令識別和語音識別的手持器件和用于使用命令識別和語音識別來控制手持器件的方法,解決了上述的問題以及現(xiàn)有技術(shù)的其他相關(guān)問題。語音命令使得用戶可以通過僅僅經(jīng)由音頻輸入器件說出命令而不使用按鈕或遙控器來控制手持器件。語音識別使得可以根據(jù)用戶身份跟蹤各個用戶行為和管理與分配手持器件的資源和特征。因此,使用命令識別和語音識別有利地向用戶提供了手持器件的不用手的控制。
按照本發(fā)明的一個方面,提供了一種電子書籍。所述電子書籍包括存儲器、命令識別模塊和處理器。所述存儲器存儲文件。所述文件包括文本。命令識別模塊識別口述命令。處理器實現(xiàn)口述命令。
按照本發(fā)明的另一個方面,提供了一種用于控制電子書籍的方法。從電子書籍的一個或多個用戶接收口述命令。識別口述命令。根據(jù)口述命令來控制電子書籍。
通過下面詳細說明參照附圖而讀取的優(yōu)選實施例,本發(fā)明的這些和其他方面、特點和優(yōu)點將會變得清楚。


圖1是圖解按照本發(fā)明的一個說明性實施例的、可以應(yīng)用本發(fā)明的計算機系統(tǒng)100的方框圖;圖2是圖解按照本發(fā)明的一個說明性實施例的、電子書籍200的方框圖;圖3是圖解按照本發(fā)明的一個說明性實施例的、用于控制具有命令識別和語音識別的電子書籍的方法的流程圖。
具體實施例方式
本發(fā)明涉及具有命令識別和語音識別的手持器件,并且涉及用于使用命令識別和語音識別來控制手持器件的方法。可以明白,本發(fā)明涉及任何類型的手持器件,其中包括但是不限于電子書籍(Ebook)、個人數(shù)字助理(PDA)等。但是,為了描述本發(fā)明,下面將說明電子書籍。
語音命令使得用戶可以通過經(jīng)由音頻輸入器件說出命令而不使用按鈕或遙控器來控制手持器件,因此向用戶提供了電子書籍操作的不用手的控制。而且,除了命令和語音識別之外的文本到語音(TTS)合成的實現(xiàn)提供了不需要用戶觀看顯示器(例如在駕駛時)的電子書籍應(yīng)用的很有用的工具,應(yīng)當(dāng)明白,可以以各種形式的硬件、軟件、固件、專用處理器或其組合來實現(xiàn)本發(fā)明。優(yōu)選的是,本發(fā)明被實現(xiàn)為硬件和軟件的組合。而且,所述軟件最好被實現(xiàn)為可以在程序存儲器上確實地包含的一個應(yīng)用程序。所述應(yīng)用程序可以被上載到包括任何合適架構(gòu)的機器并且由其執(zhí)行。優(yōu)選的是,所述機器被在這樣的計算機平臺上實現(xiàn),它包括諸如中央處理單元(CPU)、隨機存取存儲器(RAM)和輸入/輸出(I/O)接口的一個或多個的硬件。所述計算機平臺也包括操作系統(tǒng)和微指令代碼。在此描述的各種處理和功能可以或者是經(jīng)由操作系統(tǒng)執(zhí)行的微指令代碼的一部分或應(yīng)用程序的一部分(或其組合)。另外,諸如附加的數(shù)據(jù)存儲器和打印機的各種其他外圍設(shè)備可以連接到計算機平臺。
還應(yīng)當(dāng)明白,因為最好以軟件來實現(xiàn)在附圖中描述的組成系統(tǒng)部件和方法步驟中的一些,因此在所述系統(tǒng)部件(或處理步驟)之間的實際連接可能依賴于本發(fā)明被編程的方式而不同。在給定在此的教程的情況下,在本領(lǐng)域內(nèi)的普通技術(shù)人員能夠設(shè)想出本發(fā)明的這些和類似的實現(xiàn)方式或配置。
圖1是圖解按照本發(fā)明的一個說明性實施例的、可以應(yīng)用本發(fā)明的計算機系統(tǒng)100的方框圖。計算機處理系統(tǒng)100包括至少一個處理器(CPU)102,它經(jīng)由系統(tǒng)總線104可操作地連接到其他部件。只讀存儲器(ROM)106、隨機存取存儲器(RAM)108、顯示器適配器110、輸入/輸出適配器112和用戶接口適配器114工作連接到系統(tǒng)總線104。
顯示器116通過顯示器適配器110工作連接到系統(tǒng)總線104。盤存儲器(例如磁盤或光盤存儲器)118通過輸入/輸出適配器112工作連接到系統(tǒng)總線104。
鼠標(biāo)120和鍵盤122通過用戶接口適配器114工作連接到系統(tǒng)總線104。鼠標(biāo)120和鍵盤122用于針對系統(tǒng)100輸入和輸出信息。
計算機系統(tǒng)100還包括語音命令識別模塊192、語音識別模塊193、文本到語音(TTS)模塊194、麥克風(fēng)195和揚聲器196。
圖2是圖解按照本發(fā)明的一個說明性實施例的、電子書籍200的方框圖。電子書籍200包括通過總線201相互連接的下列元件命令識別模塊210;于是識別模塊220;至少一個存儲器(以下稱為“存儲器”230);至少一個處理器(以下稱為“處理器”240);可選的非語音用戶輸入器件250(例如鍵盤、小鍵盤和/或遙控器);顯示器260;文本到語音(TTS)模塊270;麥克風(fēng)280;揚聲器290。在給定在此提供的本發(fā)明的講授的情況下,本領(lǐng)域內(nèi)普通技術(shù)人員可以在保持本發(fā)明的精神和范圍的情況下設(shè)想出在圖1和圖2中分別示出的計算機系統(tǒng)100和電子書籍200的這些和各種其他配置。應(yīng)當(dāng)明白,在此使用的術(shù)語“電子書籍”指的是獨立的電子書籍器件(例如電子書籍200)或在計算機系統(tǒng)(例如計算機系統(tǒng)100)中包括的電子書籍。
圖3是圖解按照本發(fā)明的一個說明性實施例的、用于控制具有命令識別和語音識別的電子書籍的方法的流程圖。
一個或多個文件被存儲在電子書籍中(步驟301)。所述一個或多個文件至少包括文本,并且也可以包括圖形。
從電子書籍的一個或多個用戶(以下稱為“用戶”)接收口述命令(步驟302)。識別口述命令(步驟304)??蛇x地,從口述命令和/或從獨立的身份聲稱來通過語音識別用戶的身份(步驟306)。
在步驟310,可以使用命令識別和/或語音識別來在電子書籍上實現(xiàn)安全操作。例如,步驟310可以包括步驟根據(jù)用戶身份來限制/允許對于某些材料(例如某些文件)和/或電子書籍特征的訪問(步驟310b)。
在步驟320,可以使用命令識別和/或語音識別來在電子書籍上實現(xiàn)監(jiān)控操作。例如,步驟320可以包括步驟保存所有口述命令的記錄(步驟320a)。而且,步驟320可以包括步驟將在所述記錄中的每個口述命令與已經(jīng)通過他們的語音被識別的電子書籍的一個或多個用戶相關(guān)聯(lián)(步驟320b)。所記錄的命令可以用于隨后的識別期間,特別是用于解碼帶有濃重的口音說出的命令的識別期間。
在步驟330,可以使用命令識別和/或語音識別來在電子書籍上實現(xiàn)控制操作。例如,步驟330可以包括步驟控制電子書籍讀取操作,諸如搜索、跳躍、調(diào)整音量等(步驟330a)。前面的操作列表僅僅是說明性的,因此也可以控制其他操作。例如,其他操作可以包括通過瀏覽給定的閱讀材料(例如書籍、雜志、報紙等)、讀取所述閱讀材料的至少一部分或合成對應(yīng)于所述部分的語音、注解所述閱讀材料等。因此,用戶可以向電子書籍提供諸如“跳躍章節(jié)”的簡單的命令,并且可以回答簡單的是/否問題來控制電子書籍操作。在給出在此提供的本發(fā)明的教程的情況下,本領(lǐng)域內(nèi)的普通技術(shù)人員在保持本發(fā)明的精神和范圍的情況下也可以容易地實現(xiàn)更復(fù)雜的命令和/或問題。應(yīng)當(dāng)明白,在此對于控制電子書籍所使用的術(shù)語“控制”可以包括步驟310-330的任何一個。
還應(yīng)當(dāng)明白,按照本發(fā)明的一個說明性實施例,可以使用語音菜單來實現(xiàn)步驟330(或用于其的任何其他步驟)。即。在行為上類似于遙控器,本發(fā)明可以被配置來提供用戶可以說出的命令的“菜單”。一般,為了使用語音命令,按照本發(fā)明的電子書籍提供對應(yīng)于遙控器或在給定的電子書籍應(yīng)用中的一個或多個狀態(tài)的語音菜單??梢栽诿總€語音菜單中包括可以由用戶說出的語音命令的列表。當(dāng)用戶說出給定的命令時,向所述應(yīng)用通知說出了哪個命令。例如,“跳躍章節(jié)”、“將音量調(diào)高”和“快讀”是可以用于安裝了文本到語音(TTS)的增強的電子書籍的典型語音命令。每個語音命令除了口述命令之外還可以包括信息,諸如描述串和命令I(lǐng)D。
應(yīng)當(dāng)明白,可以以任何順序和以任何組合來執(zhí)行步驟310-330以提供不用手的電子書籍操作。這樣的不用手的電子書籍操作可以被提供來例如用于在特定情況下訪問文本,諸如在治療期間、機械車間規(guī)范搜索期間、烹調(diào)(例如讀取菜單)時、駕駛時等。而且,這樣的不用手電子書籍操作可以被提供來用于記筆記,特別是在教育應(yīng)用期間(步驟330b)。而且,這樣的不用手電子書籍操作可以被提供來產(chǎn)生在具有TTS的電子書籍上的標(biāo)記(類似于書簽),以便所述標(biāo)記作為恢復(fù)電子書籍的以后閱讀的點(步驟330c)。
雖然在此已經(jīng)參照

了說明性實施例,但是應(yīng)當(dāng)明白本發(fā)明不限于那些精確的實施例,并且可以在不脫離本發(fā)明的范圍和精神的情況下由本領(lǐng)域內(nèi)的技術(shù)人員在其中進行各種其他改變和修改。所有這樣的改變和修改意欲被包括在由所附的權(quán)利要求所限定的本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種電子書籍,包括存儲器,用于存儲文件,所述文件包括文本;命令識別模塊,用于識別口述命令;處理器,用于實現(xiàn)口述命令。
2.按照權(quán)利要求1的電子書籍,還包括語音識別模塊,用于識別語音和從語音識別用戶身份。
3.按照權(quán)利要求2的電子書籍,其中所述語音識別模塊根據(jù)用戶身份來限制對于文件的訪問。
4.按照權(quán)利要求2的電子書籍,其中所述存儲器與至少一些口述命令的一個或多個說話者相關(guān)聯(lián)地記錄由所述命令識別模塊識別的至少一些口述命令。
5.按照權(quán)利要求4的電子書籍,其中所述語音識別模塊在隨后的語音識別期間使用由所述存儲器記錄的至少一些口述命令。
6.按照權(quán)利要求1的電子書籍,其中所述命令識別模塊還識別對應(yīng)于所述文件的口述筆記,所述存儲器存儲所述口述筆記。
7.按照權(quán)利要求1的電子書籍,還包括文本到語音(TTS)模塊,用于合成語音,所述語音包括對應(yīng)于電子書籍操作的控制的問題,其中所述命令識別模塊還識別對于問題的口述響應(yīng)。
8.按照權(quán)利要求1的電子書籍,其中所述命令識別模塊使用一個或多個語音菜單,所述菜單包括一個或多個口述命令。
9.按照權(quán)利要求8的電子書籍,其中在所述一個或多個語音菜單中包括的每個所述一個或多個口述命令與對應(yīng)的描述串和對應(yīng)的命令I(lǐng)D相關(guān)聯(lián)。
10.按照權(quán)利要求1的電子書籍,還包括麥克風(fēng),用于接收語音,所述語音包括口述命令。
11.按照權(quán)利要求1的電子書籍,還包括顯示器,用于顯示文本。
12.一種控制電子書籍的方法,包括下列步驟從電子書籍的一個或多個用戶接收口述命令;識別口述命令;根據(jù)口述命令來控制電子書籍。
13.按照權(quán)利要求12的方法,還包括步驟識別一個或多個用戶的語音和從語音識別所述一個或多個用戶的用戶身份。
14.按照權(quán)利要求13的方法,還包括步驟根據(jù)用戶身份來限制對于文件的訪問。
15.按照權(quán)利要求13的方法,還包括步驟與至少一些口述命令的一個或多個說話者相關(guān)聯(lián)地記錄至少一些口述命令。
16.按照權(quán)利要求13的方法,還包括步驟在后續(xù)的語音識別期間使用已經(jīng)被記錄的至少一些口述命令。
17.按照權(quán)利要求12的方法,還包括步驟在電子書籍存儲至少一個文件,所述至少一個文件包括文本;識別對應(yīng)于所述至少一個文件的口述筆記;存儲口述筆記。
18.按照權(quán)利要求12的方法,其中電子書籍包括文本到語音(TTS)模塊,用于合成語音,所述方法還包括下列步驟合成對應(yīng)于電子書籍操作的控制的問題;識別對于所述問題的口述響應(yīng);作用于口述響應(yīng)。
19.按照權(quán)利要求12的方法,還包括步驟產(chǎn)生包括一個或多個口述命令的一個或多個語音菜單。
20.按照權(quán)利要求12的方法,還包括步驟將在所述一個或多個語音菜單中包括的所述一個或多個口述命令中的每一個與對應(yīng)的描述串和對應(yīng)的命令I(lǐng)D相關(guān)聯(lián)。
21.一種手持器件,包括存儲器,用于存儲文件,所述文件包括文本;命令識別模塊,用于識別口述命令;處理器,用于實現(xiàn)口述命令。
22.按照權(quán)利要求21的手持器件,還包括語音識別模塊,用于識別語音和從語音識別用戶身份。
23.按照權(quán)利要求22的手持器件,其中所述語音識別模塊根據(jù)用戶身份來限制對于文件的訪問。
24.按照權(quán)利要求22的手持器件,其中所述存儲器與至少一些口述命令的一個或多個說話者相關(guān)聯(lián)地記錄由所述命令識別模塊識別的至少一些口述命令。
25.按照權(quán)利要求24的手持器件,其中所述語音識別模塊在隨后的語音識別過程中使用由所述存儲器記錄的至少一些口述命令。
26.按照權(quán)利要求21的手持器件,還包括文本到語音(TTS)模塊,用于合成語音,所述語音包括對應(yīng)于電子書籍操作的控制的問題,其中所述命令識別模塊還識別對于問題的口述響應(yīng)。
全文摘要
一種電子書籍(200)。電子書籍(200)包括存儲器(230)、命令識別模塊(210)和處理器(240)。存儲器存儲文件。文件包括文本。命令識別模塊識別口述命令。處理器實現(xiàn)口述命令。
文檔編號G10L15/00GK1653516SQ03811032
公開日2005年8月10日 申請日期2003年5月13日 優(yōu)先權(quán)日2002年5月15日
發(fā)明者謝健磊 申請人:湯姆森特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
怀安县| 石柱| 丰都县| 三穗县| 嘉荫县| 老河口市| 应城市| 巴楚县| 彭阳县| 凯里市| 北票市| 和平县| 灌云县| 贞丰县| 增城市| 德兴市| 罗田县| 信阳市| 黄山市| 龙陵县| 谢通门县| 旅游| 乌苏市| 环江| 土默特右旗| 长岭县| 东辽县| 惠安县| 保靖县| 湖南省| 达尔| 台东市| 历史| 岳阳市| 沁源县| 科技| 玉山县| 合肥市| 阜新| 阿克| 桂阳县|