两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語音控制文本的顯示方法及裝置與流程

文檔序號:11237022閱讀:984來源:國知局
語音控制文本的顯示方法及裝置與流程

本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別涉及一種語音控制文本的顯示方法及裝置。



背景技術(shù):

隨著終端技術(shù)的快速發(fā)展,智能電視的功能越來越強大,例如目前的智能電視通常都具備視頻點播、網(wǎng)絡(luò)視頻通話和語音控制等功能。其中,語音控制智能電視,也即,智能電視根據(jù)采集的語音信息轉(zhuǎn)換后的語音控制文本,執(zhí)行相應(yīng)的操作,且在語音控制過程中,智能電視還可以顯示該語音控制文本。

目前,當(dāng)用戶通過語音控制智能電視時,智能電視在采集用戶輸入的語音信息,并將該語音信息轉(zhuǎn)換為語音控制文本之后,直接按照預(yù)設(shè)屬性信息顯示該語音控制文本,也即將該語音控制文本包括的所有詞語按照同一個預(yù)設(shè)屬性信息顯示。其中,預(yù)設(shè)屬性信息包括預(yù)設(shè)字體大小、預(yù)設(shè)字體顏色等信息。

然而,在上述方法中,在智能電視顯示該語音控制文本之后,用戶并不確定該語音控制文本包括的哪個關(guān)鍵詞可以指示智能電視即將執(zhí)行的操作,也即,現(xiàn)有的智能電視的語音控制文本的顯示方法不利于用戶對智能電視能夠識別的關(guān)鍵詞形成記憶,從而影響用戶通過語音控制智能電視的體驗。



技術(shù)實現(xiàn)要素:

為了解決現(xiàn)有的智能電視的語音控制過程不利于用戶對智能電視能夠識別的關(guān)鍵詞形成記憶的問題,本發(fā)明實施例提供了一種語音控制文本的顯示方法及裝置。所述技術(shù)方案如下:

第一方面,提供了一種語音控制文本的顯示方法,所述方法包括:

識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,所述目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,所述非目標(biāo)控制文本為與所述標(biāo)準(zhǔn)語音控制指令不匹配的文本;

若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置不同于所述非目標(biāo)控制文本的屬性信息,以實現(xiàn)所述目標(biāo)控制文本與所述非目標(biāo)控制文本間的區(qū)別顯示,所述屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

基于所述屬性信息,顯示所述語音控制文本,其中,所述目標(biāo)控制文本與所述非目標(biāo)控制文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

可選地,所述識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,具體為:

從預(yù)置的語音控制模板庫中選擇與所述語音控制文本匹配的目標(biāo)語音控制模板;

將所述語音控制文本中與所述目標(biāo)語音控制模板匹配的文本確定為所述目標(biāo)控制文本;

將所述語音控制文本中除所述目標(biāo)控制文本之外的文本確定為所述非目標(biāo)控制文本。

可選地,所述識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,具體為:

從存儲的多個分支文本中查找與所述語音控制文本匹配的目標(biāo)分支文本,所述分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本;

將所述語音控制文本中與所述目標(biāo)分支文本匹配的文本確定為所述目標(biāo)控制文本;

將所述語音控制文本中除所述目標(biāo)控制文本之外的文本確定為所述非目標(biāo)控制文本。

可選地,所述若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置不同于所述非目標(biāo)控制文本的屬性信息,具體為如下方式中的至少一種:

若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示字號大于所述非目標(biāo)控制文本的屬性信息;或

若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示透明度低于所述非目標(biāo)控制文本的屬性信息;或

若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示顏色為有彩色的屬性信息,為所述非目標(biāo)控制文本配置顯示顏色為無彩色的屬性信息,所述有彩色為具有彩調(diào)的顏色,所述無彩色為不具有彩調(diào)的顏色;或

若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示字體為第一字體的屬性信息,為所述非目標(biāo)控制文本配置顯示字體為第二字體的屬性信息。

可選地,所述若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置不同于所述非目標(biāo)控制文本的屬性信息,具體為:

所述若語音控制文本中存在所述目標(biāo)控制文本,則查找所述指令樹中用于表征所述目標(biāo)控制文本的節(jié)點;

將所述指令樹中預(yù)先為所述節(jié)點配置的屬性信息確定為所述節(jié)點表征的所述目標(biāo)控制文本的屬性信息。

第二方面,提供了一種語音控制文本的顯示方法,所述方法包括:

識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,所述目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,所述非目標(biāo)控制文本為與所述標(biāo)準(zhǔn)語音控制指令不匹配的文本;

若語音控制文本中不存在目標(biāo)控制文本,則基于所述語音控制文本中的關(guān)鍵詞,計算所述語音控制文本與預(yù)置的語音控制模板之間的相似度;

若所述相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)所述語音控制模板生成提示文本,所述提示文本包括所述語音控制模板表征的標(biāo)準(zhǔn)語音控制指令;

為所述提示文本中的標(biāo)準(zhǔn)語音控制指令配置與所述提示文本中的其他文本不同的屬性信息,以實現(xiàn)所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的區(qū)別顯示,所述屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

基于所述屬性信息,顯示所述提示文本,其中,所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

第三方面,提供了一種語音控制文本的顯示方法,所述方法包括:

識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,所述目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,所述非目標(biāo)控制文本為與所述標(biāo)準(zhǔn)語音控制指令不匹配的文本;

若語音控制文本中不存在目標(biāo)控制文本,則基于所述語音控制文本中的關(guān)鍵詞,計算所述語音控制文本與存儲的每個分支文本之間的相似度,其中,所述分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本;

若所述相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)所述相似度表征的分支文本生成提示文本,所述提示文本包括所述分支文本表征的標(biāo)準(zhǔn)語音控制指令;

為所述提示文本中的標(biāo)準(zhǔn)語音控制指令配置與所述提示文本中的其他文本不同的屬性信息,以實現(xiàn)所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的區(qū)別顯示,所述屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

基于所述屬性信息,顯示所述提示文本,其中,所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

第四方面,提供了一種語音控制文本的顯示裝置,所述裝置包括:

識別模塊,用于識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,所述目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,所述非目標(biāo)控制文本為與所述標(biāo)準(zhǔn)語音控制指令不匹配的文本;

配置模塊,用于若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置不同于所述非目標(biāo)控制文本的屬性信息,以實現(xiàn)所述目標(biāo)控制文本與所述非目標(biāo)控制文本間的區(qū)別顯示,所述屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

顯示模塊,用于基于所述屬性信息,顯示所述語音控制文本,其中,所述目標(biāo)控制文本與所述非目標(biāo)控制文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

可選地,所述識別模塊包括:

選擇單元,用于從預(yù)置的語音控制模板庫中選擇與所述語音控制文本匹配的目標(biāo)語音控制模板;

第一確定單元,用于將所述語音控制文本中與所述目標(biāo)語音控制模板匹配的文本確定為所述目標(biāo)控制文本;

第二確定單元,用于將所述語音控制文本中除所述目標(biāo)控制文本之外的文本確定為所述非目標(biāo)控制文本。

可選地,所述識別模塊包括:

第一查找單元,用于從存儲的多個分支文本中查找與所述語音控制文本匹配的目標(biāo)分支文本,所述分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本;

第三確定單元,用于將所述語音控制文本中與所述目標(biāo)分支文本匹配的文本確定為所述目標(biāo)控制文本;

第四確定單元,用于將所述語音控制文本中除所述目標(biāo)控制文本之外的文本確定為所述非目標(biāo)控制文本。

可選地,所述配置模塊包括如下單元中的至少一個:

第一配置單元,用于若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示字號大于所述非目標(biāo)控制文本的屬性信息;或

第二配置單元,用于若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示透明度低于所述非目標(biāo)控制文本的屬性信息;或

第三配置單元,用于若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示顏色為有彩色的屬性信息,為所述非目標(biāo)控制文本配置顯示顏色為無彩色的屬性信息,所述有彩色為具有彩調(diào)的顏色,所述無彩色為不具有彩調(diào)的顏色;或

第四配置單元,用于若所述語音控制文本中存在所述目標(biāo)控制文本,則為所述目標(biāo)控制文本配置顯示字體為第一字體的屬性信息,為所述非目標(biāo)控制文本配置顯示字體為第二字體的屬性信息。

可選地,所述配置模塊包括:

第二查找單元,用于若所述語音控制文本中存在所述目標(biāo)控制文本,則查找所述指令樹中用于表征所述目標(biāo)控制文本的節(jié)點;

第五確定單元,用于將所述指令樹中預(yù)先為所述節(jié)點配置的屬性信息確定為所述節(jié)點表征的所述目標(biāo)控制文本的屬性信息。

第五方面,提供了一種語音控制文本的顯示裝置,所述裝置包括:

識別模塊,用于識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,所述目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,所述非目標(biāo)控制文本為與所述標(biāo)準(zhǔn)語音控制指令不匹配的文本;

計算模塊,用于若語音控制文本中不存在目標(biāo)控制文本,則基于所述語音控制文本中的關(guān)鍵詞,計算所述語音控制文本與預(yù)置的語音控制模板之間的相似度;

生成模塊,用于若所述相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)所述語音控制模板生成提示文本,所述提示文本包括所述語音控制模板表征的標(biāo)準(zhǔn)語音控制指令;

配置模塊,用于為所述提示文本中的標(biāo)準(zhǔn)語音控制指令配置與所述提示文本中的其他文本不同的屬性信息,以實現(xiàn)所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的區(qū)別顯示,所述屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

顯示模塊,用于基于所述屬性信息,顯示所述提示文本,其中,所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

第六方面,提供了一種語音控制文本的顯示裝置,所述裝置包括:

識別模塊,用于識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,所述目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,所述非目標(biāo)控制文本為與所述標(biāo)準(zhǔn)語音控制指令不匹配的文本;

計算模塊,用于若語音控制文本中不存在目標(biāo)控制文本,則基于所述語音控制文本中的關(guān)鍵詞,計算所述語音控制文本與存儲的每個分支文本之間的相似度,其中,所述分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本;

生成模塊,用于若所述相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)所述相似度表征的分支文本生成提示文本,所述提示文本包括所述分支文本表征的標(biāo)準(zhǔn)語音控制指令;

配置模塊,用于為所述提示文本中的標(biāo)準(zhǔn)語音控制指令配置與所述提示文本中的其他文本不同的屬性信息,以實現(xiàn)所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的區(qū)別顯示,所述屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

顯示模塊,用于基于所述屬性信息,顯示所述提示文本,其中,所述標(biāo)準(zhǔn)語音控制指令與所述其他文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:由于目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,因此,當(dāng)語音控制文本中存在目標(biāo)控制文本時,則為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息,以實現(xiàn)目標(biāo)控制文本與非目標(biāo)控制文本間的區(qū)別顯示。由于該屬性信息包括顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個,因此當(dāng)按照配置屬性信息顯示語音控制文本時,可以實現(xiàn)對語音控制文本中的目標(biāo)控制文本的突出顯示,從而加強用戶對目標(biāo)控制文本的記憶,以此增加用戶下次輸入的語音控制文本中包括目標(biāo)控制文本的概率,也即提高終端對語音控制文本的理解率,從而提升用戶通過語音控制終端的體驗。另外,當(dāng)語音控制文本中不包括目標(biāo)控制文本時,則生成提示文本,由于提示文本中包括標(biāo)準(zhǔn)語音控制指令,因此通過提示文本可以提示用戶終端能夠識別的標(biāo)準(zhǔn)語音控制指令,從而加強用戶對標(biāo)準(zhǔn)語音控制指令的記憶,同樣提升用戶通過語音控制終端的體驗。

附圖說明

為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1a是本發(fā)明實施例提供的一種語音控制文本的顯示方法流程圖;

圖1b為本發(fā)明實施例提供的一種控制操作指令樹和文娛內(nèi)容分類指令樹;

圖2是本發(fā)明實施例提供的一種語音控制文本的顯示裝置框圖;

圖3是本發(fā)明實施例提供的另一種語音控制文本的顯示裝置框圖;

圖4是本發(fā)明實施例提供的另一種語音控制文本的顯示裝置框圖;

圖5是本發(fā)明實施例提供的另一種語音控制文本的顯示裝置框圖。

具體實施方式

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細(xì)描述。

在對本發(fā)明實施例進行詳細(xì)地解釋說明之前,先對本發(fā)明實施例的應(yīng)用環(huán)境予以介紹。本發(fā)明實施例提供的語音控制文本的顯示方法應(yīng)用于終端,示例的,該終端可以是具有安卓(android)操作系統(tǒng)或ios(internetworkingoperatingsystem,互聯(lián)網(wǎng)際操作系統(tǒng))操作系統(tǒng)的智能電視、智能手機、平板電腦等,該終端還可以是具有微軟視窗(window)操作系統(tǒng)或ios操作系統(tǒng)的計算機、pda(personaldigitalassistant,個人數(shù)字助理)等,本發(fā)明實施例對此不做具體限定。

如圖1a所示,該語音控制文本的顯示方法包括:

步驟101:當(dāng)終端被觸發(fā)進入語音控制模式后,接收用戶輸入的語音數(shù)據(jù),并對用戶輸入的語音數(shù)據(jù)進行識別,得到該語音數(shù)據(jù)對應(yīng)的語音控制文本。

具體的,用戶可以通過觸發(fā)相應(yīng)的固態(tài)按鍵或者語音按鍵來觸發(fā)終端進入語音控制模式,同時用戶也可以通過預(yù)設(shè)的激活詞觸發(fā)終端進入語音控制模式。

示例的,以智能電視為例,用戶可以通過遙控器觸發(fā)智能電視進入語音控制模式,即用戶可以按下與智能電視相配套的遙控器上設(shè)置的語音控制按鈕,進而遙控器向智能電視發(fā)送該按鍵的鍵值對應(yīng)的紅外編碼值。當(dāng)智能電視接收到該紅外編碼值時,通過解析該紅外編碼值得到該按鍵事件對應(yīng)的控制指令。進而智能電視執(zhí)行該控制指令,進入語音控制模式,智能電視的語音輸入模塊實時接收用戶通過麥克風(fēng)錄入的語音數(shù)據(jù)。

進一步的,當(dāng)終端被觸發(fā)進入語音控制模式后,其語音輸入模塊實時監(jiān)測用戶輸入的語音數(shù)據(jù)。具體的,語音輸入模塊具有拾音功能,可以通過麥克風(fēng)實現(xiàn)。以智能手機為例,通過智能手機上設(shè)置的麥克風(fēng)實現(xiàn);以智能電視為例,通過與智能電視相配套的遙控器上設(shè)置的麥克風(fēng)實現(xiàn),當(dāng)然,此處僅是舉例說明,本發(fā)明實施例對此不做具體限定。

具體的,當(dāng)終端進入語音控制模式后,可以通過語音輸入模塊中的麥克風(fēng)接收用戶輸入的語音數(shù)據(jù),并將用戶輸入的語音數(shù)據(jù)發(fā)送給語音識別模塊。語音識別模塊對用戶輸入的語音數(shù)據(jù)進行識別處理,得到其對應(yīng)的語音控制文本。

示例的,當(dāng)用戶輸入“電影快進三分鐘”、“快進三分鐘”、“暫停”、“播放”、“返回主頁”等語音數(shù)據(jù)時,終端可以通過麥克風(fēng)接收到用戶輸入的上述語音數(shù)據(jù),進而根據(jù)上述語音數(shù)據(jù)識別得到其對應(yīng)的語音控制文本“電影快進三分鐘”、“快進三分鐘”、“暫?!?、“播放”、“返回主頁”。

當(dāng)然,用戶在實際應(yīng)用中可以輸入任意的語音數(shù)據(jù),終端可以通過麥克風(fēng)接收用戶輸入的任意語音數(shù)據(jù),并根據(jù)該語音數(shù)據(jù)識別得到其對應(yīng)的語音控制文本。

需要說明的是,對用戶輸入的語音數(shù)據(jù)識別得到其對應(yīng)的語音控制文本的操作可以參考相關(guān)技術(shù),本發(fā)明實施例對此不再進行一一贅述。

示例的,可以通過下述公式依次實現(xiàn)對用戶輸入的語音數(shù)據(jù)識別得到其對應(yīng)的語音控制文本的操作。

w1=argmaxp(w|x)(1)

其中,在上述公式(1)中,w表示數(shù)據(jù)庫中存儲的任一文字序列,該文字序列包括詞或字,該數(shù)據(jù)庫可以是用于做語音識別的語料庫;x表示用戶輸入的語音數(shù)據(jù),w1表示從存儲文字序列中獲得的可與用戶輸入的語音數(shù)據(jù)匹配的文字序列,p(w|x)表示該用戶輸入的語音數(shù)據(jù)可以變成文字的概率。

其中,在上述公式(2)中,w2表示該用戶輸入的語音數(shù)據(jù)與該文字序列之間的匹配程度,p(x|w)表示該文字序列可以發(fā)音的概率,p(w)表示該文字序列為詞或字的概率,p(x)表示用戶輸入的語音數(shù)據(jù)為音頻信息的概率。

需要說明的是,在上述的識別過程中,可以通過語言模型確定p(w),通過聲學(xué)模型確定p(x|w),從而完成對該用戶輸入語音數(shù)據(jù)的語音識別,得到用戶輸入的語音數(shù)據(jù)對應(yīng)的語音控制文本。

下述將分別對語言模型和聲學(xué)模型進行簡單介紹。

語言模型

語言模型通常利用鏈?zhǔn)椒▌t,把文字序列為詞或字的概率拆解成其中每個詞或字的概率之積,也即是,將w拆解成w1、w2、w3、….wn-1、wn,并通過下述公式(3)確定p(w)。

p(w)=p(w1)p(w2|w1)p(w3|w1,w2)...p(wn|w1,w2,...,wn-1)(3)

其中,在上述公式(3)中,p(w)中的每一項都是在表示已知之前所有文字序列都為詞或字的條件下當(dāng)前文字序列為詞或字的概率。

由于在通過上述公式(3)確定p(w)時,如果條件太長,則確定p(w)的效率將會較低,從而影響后續(xù)的語音識別。因此,為了提高確定p(w)的效率,通常會通過語言模型中的n元(n-gram)語言模型確定p(w)。在通過n-gram語言模型確定p(w)時,第n個詞的概率只依賴于位于該詞前面的第n-1個詞,此時可以通過下述公式(4)確定p(w)。

p(w)=p(w1)p(w2|w1)p(w3|w2)...p(wn|wn-1)(4)

聲學(xué)模型

由于在確定每個詞時還需要確定每個詞的發(fā)音,而確定每個詞的發(fā)音則需要通過詞典實現(xiàn)。其中,詞典是與聲學(xué)模型和語言模塊并列的模型,且該詞典可以把單個詞轉(zhuǎn)換成音素串。聲學(xué)模型可以通過詞典確定用戶輸入的語音數(shù)據(jù)中的文字該依次發(fā)哪些音,并通過諸如維特比(viterbi)算法的動態(tài)規(guī)則算法找到各個音素的分界點,從而確定每個音素的起止時間,進而確定用戶輸入的語音數(shù)據(jù)與音素串的匹配程度,也即是,確定p(x|w)。

通常情況下,可以通過諸如高斯混合模型的分類器估計出每個音素的特征向量的分布,并在語音識別階段,確定用戶輸入的語音數(shù)據(jù)中每一幀的特征向量xt由相應(yīng)音素si產(chǎn)生的概率p(xt|si),把每一幀的概率相乘,就得到p(x|w)。

其中,分類器可以事先訓(xùn)練得到,具體操作為:通過mfcc(melfrequencycepstrumcoefficient,頻率倒譜系數(shù))從訓(xùn)練數(shù)據(jù)中提取大量的特征向量,以及每個特征向量對應(yīng)的音素,從而訓(xùn)練從特征到音素的分類器。

需要說明的是,在實際應(yīng)用中,不僅可以通過上述方式確定p(x|w),還可以包括其他方式,比如,通過神經(jīng)網(wǎng)絡(luò)直接給出p(si|xt),用貝葉斯公式可以轉(zhuǎn)換成p(xt|si),再相乘得到p(x|w),當(dāng)然,此處僅是舉例說明,并不代表本發(fā)明實施例局限于此。

步驟102:識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,非目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令不匹配的文本。

當(dāng)終端確定用于控制終端的語音控制文本時,該語音控制文本中可能包括終端可以識別的關(guān)鍵詞,也可能不包括終端可以識別的關(guān)鍵詞,當(dāng)該語音控制文本中包括終端可以識別的關(guān)鍵詞時,為了加強用戶對該語音信息中包括的終端可以識別的關(guān)鍵詞的記憶,終端可以對該語音控制文本中包括的終端可以識別的關(guān)鍵詞進行提示;當(dāng)該語音控制文本中不包括終端可以識別的關(guān)鍵詞時,為了引導(dǎo)用戶輸入的語音控制文本中包括終端可以識別的關(guān)鍵詞,終端需要提示用戶如何輸入終端可以識別的語音控制文本。因此,當(dāng)終端接收到語音控制文本時,需要對該語音控制文本進行識別,以判斷該語音控制文本中是否包括目標(biāo)控制文本,以便執(zhí)行不同的操作。具體地,當(dāng)該語音控制文本中存在目標(biāo)控制文本時,執(zhí)行步驟103,當(dāng)該語音控制文本中不存在目標(biāo)控制文本時,執(zhí)行步驟105。

其中,標(biāo)準(zhǔn)語音控制指令為終端可以識別的語音控制指令,且該標(biāo)準(zhǔn)語音控制指令為終端中預(yù)先存儲的語音控制指令。另外,終端確定的語音控制文本可以為終端采集的語音信息轉(zhuǎn)換后的語音控制文本,也可以為終端直接從預(yù)先存儲的多個語音控制文本中選擇的語音控制文本。

具體地,終端識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本可以通過如下兩種可能的方式來實現(xiàn)。

第一種可能的方式,從預(yù)置的語音控制模板庫中選擇與該語音控制文本匹配的目標(biāo)語音控制模板,將該語音控制文本中與該目標(biāo)語音控制模板匹配的文本確定為目標(biāo)控制文本;將該語音控制文本中除目標(biāo)控制文本之外的文本確定為非目標(biāo)控制文本。

其中,語音控制模板庫中包括至少一個語音控制模板,且該語音控制模板至少包括一種標(biāo)準(zhǔn)語音控制指令,也即標(biāo)準(zhǔn)語音控制指令在終端內(nèi)采用語音控制模板的形式存儲。因此,在第一種可能的方式中,終端需對該語音控制文本進行文本分詞,得到該語音控制文本包括的多個分詞,將該多個分詞和預(yù)置的語音控制模板庫中的至少一個語音控制模板進行對比,判斷該多個分詞中是否包括該至少一個語音控制模板中的一個,如果該多個分詞包括一個語音控制模板,則將該語音控制模板確定為目標(biāo)語音控制模板。

如果該多個分詞中沒有包括任何語音控制模板,則對該多個分詞中的每個分詞進行歸類,將歸類后的該多個分詞和至少一個語音控制模板對比,如果歸類后的該多個分詞包括一個語音控制模板,則將該語音控制模板確定為目標(biāo)語音控制模板。

如果歸類該后的該多個分詞中仍沒有包括任何語音控制模板,則確定該語音控制模板中不存在目標(biāo)控制文本。其中,語音控制模板為服務(wù)器預(yù)先為終端配置的模板,該語音控制模板包括至少一個預(yù)設(shè)分詞,該至少一個預(yù)設(shè)分詞用于指示終端可以直接識別的分詞。

另外,歸類也即對屬于一種類型的分詞歸為一類,如分詞“80”、“70”或“3”等歸類為分詞“數(shù)字”,分詞“劉德華”或“梁朝偉”等歸類為分詞“人名”,分詞“愛情”“戰(zhàn)爭”或“武俠”等歸類為分詞“影視類型”。

例如,本發(fā)明實施例提供的語音控制模板庫包括如下語音控制模板:語音控制模板一,音量+|大點|大點聲|小點|小點聲|加|減|靜音|電視靜音+|(數(shù)字);語音控制模板二,|我想看+(影視title);語音控制模板三,|我想看+(影視類型)+|片;語音控制模板四,|我想看+(人名即演員或?qū)а?+演的|導(dǎo)演的|的+((影視名稱)|電影|電視劇|(影視類型))+|片|劇;語音控制模板五,快進+|(數(shù)值)+|分|分鐘|秒|小時;語音控制模板六,快退+(數(shù)值)+|分|分鐘|秒|小時。其中,“|”代表可選的意思,也即“|”后面的內(nèi)容可有可無,“()”代表一類數(shù)據(jù),該類數(shù)據(jù)在數(shù)據(jù)庫中代表一個字段,其中的值可以枚舉。

示例的,當(dāng)用戶輸入語音信息的語音控制文本為“給我把音量加30個”時,對該語音控制文本進行文本分詞,得到該語音控制文本包括的多個分詞“給”、“我”、“把”、“音量”、“加”、“30”和“個”,將該多個分詞和上述語音控制模板進行對比,確定該多個分詞中包括語音控制模板一“音量+|大點|大點聲|小點|小點聲|加|減|靜音|電視靜音+|(數(shù)字)”,此時將分詞“音量”、“加”和“30”確定為目標(biāo)控制文本。

示例的,當(dāng)用戶輸入語音信息的語音控制文本為“我想看劉德華的愛情片”時,對該語音控制文本進行文本分詞,得到該語音控制文本包括的多個分詞“我想看”“劉德華”“的”“愛情”“片”,根據(jù)該多個分詞和上述語音控制模板進行對比,沒有直接查找到該語音控制文本對應(yīng)的語音控制模板,對該多個分詞中的每個分詞進行歸類,確定分詞“劉德華”屬于上述語音控制模板中的“人名”,分詞“愛情”屬于上述語音控制模板中的“影視類型”,確定該多個分詞可以對應(yīng)上述語音控制模板“|我想看+(人名即演員或?qū)а?+演的|導(dǎo)演的|的+((影視名稱)|電影|電視劇|(影視類型))+|片|劇”,此時將該多個分詞均確定為目標(biāo)控制文本。

另外,需要說明的是,服務(wù)器為終端配置的語音控制模板并不是固定不變的,也即服務(wù)器將根據(jù)終端歷史采集到的語音信息定期更新語音控制模板。具體地,服務(wù)器統(tǒng)計當(dāng)前時間之前該終端采集到的語音信息的語音控制文本,并確定各個語音控制文本的出現(xiàn)頻率,按照各個語音控制文本的出現(xiàn)頻率對該各個語音控制文本進行排序,獲取該排序結(jié)果中順序靠前的t個語音控制文本,并對該t個語音控制文本進行分詞處理,對其中的部分分詞進行歸類,得到該t個語音控制文本的t個語音模板,對該t個語音模板中相似或相同模板進行歸一處理,得到至少一個模板,如果該至少一個模板中存在不屬于上述語音控制模板庫的模板,則將該至少一個模板中不屬于上述語音控制模板庫的模板添加至上述語音控制模板庫,也即服務(wù)器對語音控制模板庫進行更新。其中,如果該t個語音模板中包括的分詞中存在語義相近的分詞,則確定該語義相近的分詞中屬于排序靠前的語音模板的分詞,并將該語義相近的分詞統(tǒng)一替換為該屬于排序靠前的語音模板的分詞。

例如,t為3,服務(wù)器對歷史接收到的語音控制文本進行排序之后,確定該3個語音控制文本分別為“80年代的武俠片”、“我想看70年代的戰(zhàn)爭片”和“80年代的愛情片”,對該3個語音控制文本分別進行分詞處理,語音信息“80年代的武俠片”對應(yīng)的分詞為“80”、“年代”、“的”、“武俠”和“片”,語音信息“我想看70年代的戰(zhàn)爭片”對應(yīng)的分詞為“我想看”、“70”、“年代”、“的”、“戰(zhàn)爭”和“片”,語音信息“80年代的愛情片”對應(yīng)的分詞為“80”、“年代”、“的”、“愛情”和“片”,其中,分詞“80”和分詞“70”屬于數(shù)字,分詞“武俠”、“戰(zhàn)爭”和“愛情”屬于影視類型,因此,服務(wù)器確定該語音控制文本“80年代的武俠片”的語音模板為“(數(shù)字)+年代+的+(影視類型)+片”,語音控文本“我想看70年代的戰(zhàn)爭片”的語音模板為“我想看+(數(shù)字)+年代+的+(影視類型)+片”,語音控制本“80年代的愛情片”的語音模板為“(數(shù)字)+年代+(影視類型)+片”。由于這三個語音模板中,語音模板“(數(shù)字)+年代+的+(影視類型)+片”和語音模板“(數(shù)字)+年代+(影視類型)+片”為相同的語音模板,且該兩個語音模板和語音模板“我想看+(數(shù)字)+年代+的+(影視類型)+片”為相似的語音模板,因此服務(wù)器對這三個語音模板進行歸一化處理,得到該至少一個模板為“|我想看+(數(shù)字)+年代+|的+(影視類型)+|片”,如果上述語音控制模板庫中不存在該至少一個模板,則服務(wù)器將該至少一個模板添加至語音控制模板庫。

又例如,t為3,服務(wù)器對歷史接收到的語音控制文本進行排序之后,確定該3個語音控制文本分別為“音量增大”、“音量加大”和“聲音大點”,按照上述例子中的方法確定語音控制文本“音量增大”的語音模板為“音量+增大”,語音控制文本“音量加大”的語音模板為“音量+加大”,語音信息“聲音大點”的語音模板為“聲音+大點”,且該三個語音模板中,分詞“音量”和分詞“聲音”屬于語義相近的詞,分詞“增大”、分詞“加大”和分詞“大點”同屬于語義相近的詞,因此用排序靠前的語音模板中的分詞“音量”替換其他語音模板中的分詞“聲音”,用排序靠前的語音模板中的分詞“增大”替換其他語音模板中的分詞“加大”和分詞“大點”,替換后的3個語音模板分別為“音量+增大”、“音量+增大”和“音量+增大”,也即替換后的該3個語音模板屬于相同的語音模板,因此該至少一個模板為“音量+增大”,如果上述語音控制模板庫中不存在該至少一個模板,則服務(wù)器將該至少一個模板添加至上述語音控制模板庫。

第二種可能的方式,從存儲的多個分支文本中查找與該語音控制文本匹配的目標(biāo)分支文本,將該語音控制文本中與該目標(biāo)分支文本匹配的文本確定為目標(biāo)控制文本,將該語音控制文本中除目標(biāo)控制文本之外的文本確定為非目標(biāo)控制文本。

其中,分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本,也即終端中預(yù)先存儲有多個指令樹,對于該多個指令樹中的任一個指令樹,該指令樹包括多個分支,該多個分支中的每個分支包括至少一個節(jié)點,該至少一個節(jié)點中的每個節(jié)點都有對應(yīng)的文本,而分支文本由該分支的所有節(jié)點對應(yīng)的文本構(gòu)成。每一個指令樹中的一個分支表征的都是一個標(biāo)準(zhǔn)語音控制指令,也即,標(biāo)準(zhǔn)語音控制指令在終端內(nèi)采用指令樹的形式存儲,每一個分支的所有節(jié)點構(gòu)成的分支文本都是一個標(biāo)準(zhǔn)語音控制指令。

因此,第二種可能的方式具體可以為:終端對該語音控制文本進行文本分詞,得到該語音控制文本包括的多個分詞,將該多個分詞和存儲的多個分支文本中的每個分支文本進行對比,判斷該多個分詞中是否包括該多個分支文本中的一個,如果該多個分詞包括一個分支文本,則將該分支文本確定為目標(biāo)分支文本,并將該語音控制文本中與目標(biāo)分支文本匹配的文本確定為目標(biāo)控制文本。如果該多個分詞中沒有包括任何一個分支文本,則確定該語音控制文本中不存在目標(biāo)控制文本。

為了便于說明,在此對指令樹的功能進行相關(guān)說明。也即,本發(fā)明實施例提供多個指令樹,該多個指令樹中的節(jié)點用于指示終端可以識別的關(guān)鍵詞。在一種可能的實現(xiàn)方式中,該多個指令樹為控制操作指令樹和文娛內(nèi)容分類指令樹,其中控制操作指令樹中的節(jié)點用于指示用于控制終端的指令,文娛內(nèi)容分類指令樹用于指示終端的網(wǎng)絡(luò)資源的業(yè)務(wù)類型和不同的網(wǎng)絡(luò)資源。另外需要說明的是,為了便于根據(jù)分支文本確定目標(biāo)控制文本,分支分文可以不包括該分支的根節(jié)點對應(yīng)的文本。

例如,圖1b為本發(fā)明實施例提供的一種控制操作指令樹和文娛內(nèi)容分類指令樹,其中,控制操作指令樹的第一層根節(jié)點為控制指令,第二層節(jié)點用于指示控制終端的指令如“音量大小、播放進度快慢、開關(guān)機”,該控制操作指令樹包括的分支分文可以為:音量大小、播放進度以及開關(guān)機。文娛內(nèi)容分類指令樹的第一層根節(jié)點為文娛內(nèi)容分類,第二層節(jié)點為內(nèi)容分類節(jié)點如“電影、電視劇、綜藝、動漫”,第三層為內(nèi)容名稱節(jié)點如“我們來了、老九門、鄉(xiāng)村愛情”,該文娛內(nèi)容分類指令樹包括的分支文本可以為:電影寒戰(zhàn)、電影荒野獵人、電視劇老九門以及綜藝我們來了等。

步驟103:若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息,以實現(xiàn)目標(biāo)控制文本與非目標(biāo)控制文本間的區(qū)別顯示,該屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個。

當(dāng)該語音控制文本中存在目標(biāo)控制文本時,為了加強用戶對目標(biāo)控制文本的記憶,終端將為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息。也即終端預(yù)先設(shè)置有目標(biāo)控制文本的屬性信息和非目標(biāo)控制文本的屬性信息,且該兩個屬性信息中的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同,以實現(xiàn)對目標(biāo)控制文本和非目標(biāo)控制文本的區(qū)別顯示。

示例的,屬性信息可以為10位的顯示編碼串,從左往右數(shù),屬性信息的第1位至第2位字段為10進制字符串,用于表示顯示字號。屬性信息的第3位至第7位字段為16進制字符串,用于表示顯示透明度。屬性信息的第8位至第10位字段為16進制字符串,用于表示顯示顏色。當(dāng)然此處僅是舉例說明,并不代表本發(fā)明實施例的屬性信息局限于此。

需要說明的是,對于屬性信息中用于表示顯示字號、顯示顏色、顯示透明度和顯示字體的四種字段的具體字段位數(shù)和具體字段位置,本發(fā)明實施例不做具體限定。

示例的,以語音控制文本為“電影快進三分鐘”為例,其中,“快進三分鐘”屬于目標(biāo)控制文本,“電影”屬于非目標(biāo)控制文本。終端對其中的目標(biāo)控制文本“快進三分鐘”配置的屬性信息為18f16de5af1b,對其中的非目標(biāo)控制文本“電影”配置的屬性信息為12f16de5af1b。終端對目標(biāo)控制文本“快進三分鐘”和非目標(biāo)控制文本“電影”對應(yīng)的顯示字號不相同,也即終端為目標(biāo)控制文本“快進三分鐘”和非目標(biāo)控制文本“電影”配置的屬性信息中用于表示顯示字號的第1位至第2位字段不相同,即目標(biāo)控制文本“快進三分鐘”的顯示字號大于非目標(biāo)控制文本“電影”的顯示字號。

在一種可能的實現(xiàn)方式中,終端為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息,具體可以為如下方式中的至少一種:若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示字號大于非目標(biāo)控制文本的屬性信息;或,若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示透明度低于非目標(biāo)控制文本的屬性信息;或,若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示顏色為有彩色的屬性信息,為非目標(biāo)控制文本配置顯示顏色為無彩色的屬性信息;或,若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示字體為第一字體的屬性信息,為非目標(biāo)控制文本配置顯示字體為第二字體的屬性信息。

其中,有彩色為具有彩調(diào)的顏色,如紅、黃或藍(lán)等七彩顏色,無彩色為不具有彩調(diào)的顏色,如黑、白或灰等,而彩調(diào)是指光譜上的某種或某些色相。

示例的,若語音控制文本中包括目標(biāo)控制文本,則終端對目標(biāo)控制文本配置用于表征顯示字號大于非目標(biāo)控制文本的屬性信息。終端通過對目標(biāo)控制文本配置表征顯示字號大于非目標(biāo)控制文本的屬性信息,可以將目標(biāo)控制文本突出與非目標(biāo)控制文本顯示。并且,相對于非目標(biāo)控制文本采用較大字號顯示的目標(biāo)控制文本,可以更吸引用戶的注意力,給用戶留下深刻的印象。久而久之,可以引導(dǎo)用戶在語音輸入的過程中直接輸入目標(biāo)控制文本,有效避免了用戶輸入的語音控制文本中包括非目標(biāo)控制文本,提高了終端設(shè)備的語音控制響應(yīng)速度和準(zhǔn)確率,進而提高了終端設(shè)備的用戶體驗性。

示例的,若語音控制文本中包括目標(biāo)控制文本,則終端對目標(biāo)控制文本配置用于表示顯示顏色為有彩色的屬性信息;終端對其中的非目標(biāo)控制文本配置用于表示顯示顏色為無彩色的屬性信息。通過將目標(biāo)控制文本采用有彩色顯示,將非目標(biāo)控制文本采用黑色或者灰色等無彩色顯示,彩色相對于黑色或者灰色,更容易吸引人的注意力。且彩色顯示的目標(biāo)控制文本,有助于加深用戶的記憶力,在用戶下次輸入該語音控制文本時,更容易想到該目標(biāo)控制文本。

示例的,若語音控制文本中包括目標(biāo)控制文本,則終端對目標(biāo)控制文本配置用于表示顯示透明度小于非目標(biāo)控制文本的屬性信息。通常,顯示透明度越大,其顯示效果越差,即顯示透明度大時,該顯示內(nèi)容容易被用戶忽落。通過將目標(biāo)控制文本的顯示透明度設(shè)置的小于非目標(biāo)控制文本,可以在終端顯示該語音控制文本時,導(dǎo)致用戶忽落對非目標(biāo)控制文本的記憶。相反的,可以加深用戶對目標(biāo)控制文本的注意力,增強用戶對目標(biāo)控制文本的記憶。久而久之,可以引導(dǎo)用戶在語音輸入的過程中僅輸入目標(biāo)控制文本,有效避免了用戶下次輸入的語音控制文本中包括非目標(biāo)控制文本。

示例的,終端預(yù)先設(shè)置目標(biāo)控制文本的屬性信息為:顯示字號為三號,顯示透明度為10%,顯示顏色為黑色,顯示字體為宋體。終端預(yù)先設(shè)置非目標(biāo)控制文本的屬性信息為:顯示字號為小四號,顯示透明度為10%,顯示顏色為黑色,顯示字體為宋體。由于目標(biāo)控制文本的顯示字號明顯大于非目標(biāo)控制文本的顯示字號,因此當(dāng)終端按照該預(yù)設(shè)的屬性信息顯示目標(biāo)控制文本和非目標(biāo)控制文本時,可以實現(xiàn)對該目標(biāo)控制文本的突出顯示。

值得注意的是,本發(fā)明實施例還提供了步驟102中的多個指令樹中的節(jié)點的屬性信息,每個節(jié)點的屬性信息包括字體大小、字體透明度和字體顏色。因此,當(dāng)終端中預(yù)先存儲有多個指令樹時,還可以根據(jù)該多個指令樹中的節(jié)點的屬性信息為目標(biāo)控制文本配置屬性信息。也即,當(dāng)該語音控制文本中存在目標(biāo)控制文本,則查找指令樹中用于表征目標(biāo)控制文本的節(jié)點;將指令樹中預(yù)先為節(jié)點配置的屬性信息確定為該節(jié)點表征的目標(biāo)控制文本的屬性信息。具體地,確定目標(biāo)控制文本中的各個分詞,對于目標(biāo)控制文本中的各個分詞中的每個分詞,從預(yù)先存儲的指令樹中查找該分詞對應(yīng)的節(jié)點,當(dāng)查找到該分詞對應(yīng)的節(jié)點時,將該預(yù)先為該節(jié)點配置的屬性信息確定為該分詞的屬性信息。對于非目標(biāo)控制文本,終端可以預(yù)先設(shè)置非目標(biāo)控制文本的顯示方式,也可以在根據(jù)指令樹中的節(jié)點的屬性信息確定目標(biāo)控制文本的屬性信息之后,確定與目標(biāo)控制文本的屬性信息不同的非目標(biāo)控制文本的屬性信息。

例如,當(dāng)用戶觸發(fā)osd(on-screendisplay,屏幕菜單式調(diào)節(jié))監(jiān)聽線程時,終端監(jiān)聽到創(chuàng)建osd線程信號,當(dāng)終端監(jiān)聽到創(chuàng)建osd線程信號時,終端需對osd線程進行消息分發(fā),以確定該osd線程的類型。當(dāng)確定該osd線程為語音輸入osd線程時,創(chuàng)建osd環(huán)境,也即采用預(yù)設(shè)默認(rèn)值初始化字體的屬性如字體、大小等,并判斷服務(wù)器是否為該終端配置上述多個指令樹。當(dāng)確定服務(wù)器為該終端配置該多個指令樹時,阻塞等待語音信息,當(dāng)檢測到有語音信息輸入時,采集語音信息,將該語音信息轉(zhuǎn)換為語音控制文本之后,按照上述方法確定語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本的屬性信息,根據(jù)獲取的信息更改初始化的字體的屬性,并將更改后的osd區(qū)域信息與內(nèi)存中的幀數(shù)據(jù)進行信息同步與疊加,然后將疊加后的數(shù)據(jù)通過dsp(digitalsignalprocessing,數(shù)字信號處理)技術(shù)寫入已創(chuàng)建的osd環(huán)境以待顯示。

可選地,在本發(fā)明實施例中,針對該多個指令樹中的任一個節(jié)點,該節(jié)點的屬性信息也可以為預(yù)先設(shè)置的屬性信息,也即服務(wù)器預(yù)先設(shè)置該多個指令樹中任一節(jié)點的顯示字號、顯示透明度和顯示顏色。在一種可能的實現(xiàn)方式中,對于該多個指令樹中的任一節(jié)點,該節(jié)點的屬性信息也可以用預(yù)先設(shè)置的10位編碼串表示,但是該10位編碼串并不會隨該節(jié)點對應(yīng)的關(guān)鍵詞的使用頻率變化而變化。

另外需要說明的是,由于每個終端在一段時間內(nèi)采集到的語音控制文本中包括的終端可以識別的關(guān)鍵詞并不相同,并且對于文娛內(nèi)容分類指令樹中的第三層的內(nèi)容名稱節(jié)點也需根據(jù)網(wǎng)絡(luò)資源的變化而進行更新,因此,在本發(fā)明實施例中,服務(wù)器每隔預(yù)設(shè)時間更新為每個終端配置的指令樹,也即服務(wù)器每隔預(yù)設(shè)時間更新指令樹中的各個節(jié)點和各個節(jié)點的屬性信息。

步驟104:基于該屬性信息,顯示該語音控制文本,其中,目標(biāo)控制文本與非目標(biāo)控制文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

在本發(fā)明實施例中,為了加強用戶對終端可以識別的關(guān)鍵詞的記憶,在顯示語音控制文本時,對于該語音控制文本中的目標(biāo)控制文本按照該目標(biāo)控制文本的屬性信息進行顯示,對于該語音控制文本中的非目標(biāo)控制文本按照該非目標(biāo)控制文本的屬性信息進行顯示,也即按照目標(biāo)控制文本的顯示字號、顯示透明度、顯示顏色和顯示字體對該目標(biāo)關(guān)鍵詞進行突出顯示,以便用戶可以清楚了解到終端可以識別的關(guān)鍵詞,并形成對該目標(biāo)控制文本的記憶。

步驟105:若語音控制文本中不存在目標(biāo)控制文本,則生成提示文本,該提示文本包括標(biāo)準(zhǔn)語音控制指令。

當(dāng)語音控制文本中不存在目標(biāo)控制文本時,為了提示用戶終端可以識別的語音控制指令,終端可以生成提示文本,該提示文本包括終端可以識別的標(biāo)準(zhǔn)語音控制指令。

由于在步驟102中,終端識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本有兩種可能的方式,因此,在此終端生成提示文本也有兩種可能的方式。

第一種可能的方式,若語音控制文本中不存在目標(biāo)控制文本,則基于語音控制文本中的關(guān)鍵詞,計算語音控制文本與預(yù)置的語音控制模板之間的相似度;若相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)語音控制模板生成提示文本,該提示文本包括該語音控制模板表征的標(biāo)準(zhǔn)語音控制指令。

在本發(fā)明實施例中,在預(yù)置的語音控制模板庫中存在至少一個語音控制模板,該至少一個語音控制模板中的每個語音控制模板對應(yīng)一個標(biāo)準(zhǔn)語音控制指令。因此,在第一種可能的方式中,根據(jù)預(yù)置語音控制模板庫中的至少一個語音控制模板,確定語音控制文本和該至少一個語音控制模板語音控制模板中的每個語音控制模板之間的相似度,得到多個相似度。并判斷該多個相似度中是否存在相似度大于預(yù)設(shè)的相似度閾值,當(dāng)存在相似度大于預(yù)設(shè)的相似度閾值時,根據(jù)相似度大于預(yù)設(shè)的相似度閾值的語音控制模板,生成提示文本,也即該提示文本包括該語音控制模板表征的標(biāo)準(zhǔn)語音控制指令。

其中,在本發(fā)明實施例中,可以采用基于拼音與歸一表的編輯距離計算該語音控制文本與各個語音控制模板之間的相似度,也可以采用詞向量模型計算該語音控制文本與各個語音控制模板之間的相似度,還可以采用余弦相似度或者漢明距離計算該語音控制文本與各個語音控制模板之間的相似度,當(dāng)然此處僅是舉例說明,并不代表本發(fā)明局限于此。

下面將以采用基于拼音與歸一表的編輯距離計算該語音控制文本與各個語音控制模板之間的相似度為例進行詳細(xì)說明。具體地,對于各個語音控制模板中的任一個語音控制模板,采用基于拼音與歸一表的編輯距離計算該語音控制文本與該語音控制模板之間的相似度可以通過以下幾個步驟實現(xiàn)。

(1)終端將該語音控制文本中存在同義詞、近義詞的詞語依次采用其同義詞或近義詞進行擴展替換,得到該語音控制文本對應(yīng)的所有可能的語句串,示例的,對該語音控制文本進行同義詞或近義詞擴展替換后得到n條語音控制文本。

(2)將上述的n條語音控制文本分別轉(zhuǎn)換成其對應(yīng)的拼音串,然后再利用預(yù)先定義的拼音對應(yīng)表,將n條拼音串中存在相近發(fā)音的字母依次擴展替換成其相近發(fā)音,示例的,可以得到m條拼音串,m≥n。其中,預(yù)先定義的拼音對應(yīng)表用于指示存在相近發(fā)音的字母,如某些地區(qū)h與f易混,l與n易混,該拼音對應(yīng)表中用于指示h與f為相近發(fā)音的字母,l與n為相近發(fā)音的字母。

(3)將(2)中得到的m條拼音串與該語音控制模板對應(yīng)的實體轉(zhuǎn)換所得拼音分別進行編輯距離計算,編輯距離為將一個字符串通過替換、插入、刪除等操作轉(zhuǎn)換成另一個字符串所需的最小操作次數(shù)。假如,該控制控制模板對應(yīng)的實體個數(shù)為m個,則語音控制文本與該語音控制模板之間的相似度計算公式如下:

s=max[1-d(ai,bj)/max(len(ai),len(bi))]

其中,s代表語音控制文本與該語音控制模板之間的相似度;ai代表該m條拼音串中第i條拼音串,0<i≤m;bj代表該m個實體中第j個實體的字符串對應(yīng)的拼音串,0<j≤m;len(ai)為該m條拼音串中第i條拼音串的長度;len(bj)為該m個實體中第j個實體的字符串對應(yīng)的拼音串的長度;d(ai,bj)為第i條拼音串與第j個實體的字符串對應(yīng)的拼音串之間的編輯距離。

另外,該語音控制模板對應(yīng)的實體為該語音控制模板中包括的所有可能的標(biāo)準(zhǔn)語音控制指令,如語音控制模板“音量+|大點|加|小點|減|靜音+|(數(shù)字)”對應(yīng)的實體為:1)音量大點;2)音量小點;3)音量加;4)音量減;5)音量靜音;6)音量加數(shù)字;7)音量減數(shù)字。

當(dāng)確定出的相似度大于預(yù)設(shè)的相似度閾值時,表明該語音控制模板對應(yīng)的標(biāo)準(zhǔn)控制指令代表用戶要輸入的操作指令。此時,生成該提示文本,該提示文本用于引導(dǎo)用戶語音輸入該語音控制模板對應(yīng)的標(biāo)準(zhǔn)控制指令,即提示文本包括與該語音控制模板對應(yīng)的標(biāo)準(zhǔn)語音控制指令。

例如,語音控制文本為“聲音太吵,調(diào)小點”,語音控制指模板為“音量+|大點|加|小點|減|靜音+|(數(shù)字)”,下面對上述基于拼音與歸一表的編輯距離計算語音控制文本與該語音控制模板之間的相似度的過程進行詳細(xì)說明:

(1)對語音控制文本“聲音太吵,調(diào)小點”進行同義詞和近義詞擴展替換得到5條語音控制文本:聲音太吵,小點;聲音太大,關(guān)小點;音量太大,小點;音量太大,關(guān)小點;音量太吵,關(guān)小點。

(2)將上述的5條語音控制文本分別轉(zhuǎn)換成其對應(yīng)的拼音串如下:1)shengyintaichao,xiaodian;2)shengyintaida,guanxiaodian;3)yinliangtaida,xiaodian;4)yinliangtaida,guanxiaodian;5)yinliangtaichao,guanxiaodian。然后,利用預(yù)先定義的拼音對應(yīng)表,將上述5條拼音串中存在相近發(fā)音的字母依次擴展替換成其相近發(fā)音,得到10條拼音串如下:1)shengyintaichao,xiaodian;2)shengyingtaichao,xiaodian;3)shengyintaida,guanxiaodian;4)shengyingtaida,guanxiaodian;5)yinliangtaida,xiaodian;6)yingliangtaida,xiaodian;7)yinliangtaida,guanxiaodian;8)yingliangtaida,guanxiaodian;9)yinliangtaichao,guanxiaodian;10)yingliangtaichao,guanxiaodian。

(3)語音控制模板“音量+|大點|加|小點|減|靜音+|(數(shù)字)”包括的實體如下:1)音量大點;2)音量小點;3)音量加;4)音量減;5)音量靜音;6)音量加數(shù)字;7)音量減數(shù)字。該語音控制模板“音量+|大點|加|小點|減|靜音+|(數(shù)字)”包括的實體對應(yīng)的拼音串如下:1)yinliangdadian;2)yinliangxiaodian;3)yinliangjia;4)yinliangjian;5)yinliangjingyin;6)yinliangjianum;7)yinliangjiannum。

(4)根據(jù)上述公式分別計算上述10條拼音串中的任一條拼音串與語音控制模板“音量+|大點|加|小點|減|靜音+|(數(shù)字)”包括的實體對應(yīng)的7條拼音串中的各條拼音串之間的相似度,并將上述計算得到的相似度之間的最大值確定為該語音控制文本“聲音太吵,調(diào)小點”與語音控制模板“音量+|大點|加|小點|減|靜音+|(數(shù)字)”之間的相似度。

通過計算發(fā)現(xiàn)拼音串“yinliangtaida,xiaodian”與語音控制模板“音量+|大點|加|小點|減|靜音+|(數(shù)字)”包括的實體對應(yīng)的第2條拼音串“yinliangxiaodian”之間的相似度最大,該相似度為0.762,故語音控制文本“聲音太吵,調(diào)小點”與語音控制模板“音量+|大點|加|小點|減|靜音+|(數(shù)字)”之間的相似度為0.762,也即語音控制文本“聲音太吵,調(diào)小點”與語音控制模板中的實體“音量+小點”最像似。且該相似度0.762大于預(yù)設(shè)的相似度閾值0.5,因此終端按照預(yù)置的規(guī)則,根據(jù)該語音控制模板中的實體“音量+小點”生成相應(yīng)的提示文本。如,根據(jù)語音控制模板中的實體“音量+小點”生成的提示文本可以是“如果您想調(diào)節(jié)音量,可以說音量小點”,當(dāng)然,此處僅是舉例說明,并不代表本發(fā)明實施例中根據(jù)語音控制模板中的實體“音量+小點”生成的提示文本局限于此,該提示文本還可以是“您可以說音量小點”。

第二種可能的方式,若語音控制文本中不存在目標(biāo)控制文本,則基于語音控制文本中的關(guān)鍵詞,計算語音控制文本與存儲的每個分支文本之間的相似度,其中,分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本;若相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)相似度表征的分支文本生成提示文本,該提示文本包括該分支文本表征的標(biāo)準(zhǔn)語音控制指令。

根據(jù)步驟102中識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本的第二種可能的方式,終端中預(yù)先存儲有多個分支文本,由于分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本,因此該多個分支文本中的每個分支文本對應(yīng)一個標(biāo)準(zhǔn)語音控制指令,因此,可以計算語音控制文本和該多個分支文本中的每個分支文本之間的相似度,得到多個相似度,當(dāng)該多個相似度中存在大于預(yù)設(shè)的相似度閾值的相似度時,則生成提示文本,且提示文本包括該分支文本表征的標(biāo)準(zhǔn)語音控制指令。

具體地,計算語音控制文本和每個分支文本之間的相似度可以參考上述計算語音控制文本和每個語音控制模板之間的相似度,在此不做詳細(xì)說明。

步驟106:為提示文本中的標(biāo)準(zhǔn)語音控制指令配置與提示文本中的其他文本不同的屬性信息,以實現(xiàn)標(biāo)準(zhǔn)語音控制指令與該其他文本的區(qū)別顯示,該屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個。

為了提高用戶對提示文本中的標(biāo)準(zhǔn)語音控制指令的記憶,終端在生成提示文本之后,還需為提示文本中的標(biāo)準(zhǔn)語音控制指令配置與提示文本中的其他文本不同的屬性信息,以實現(xiàn)標(biāo)準(zhǔn)語音控制指令與該其他文本的區(qū)別顯示。其中,為提示文本中的標(biāo)準(zhǔn)語音控制指令配置與提示文本中的其他文本不同的屬性信息,可以參考步驟103中為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息,在此不做詳細(xì)闡述。也即,此時為標(biāo)準(zhǔn)語音控制指令配置屬性信息相當(dāng)于步驟103中為目標(biāo)控制文本配置屬性信息,為提示文本中的其他文本配置屬性信息相當(dāng)于步驟103中為非目標(biāo)控制文本配置屬性信息。

例如,提示文本為“如果您想調(diào)節(jié)音量,可以說音量小點”,該提示文本中包括的標(biāo)準(zhǔn)語音控制指令為“音量小點”,為了對該標(biāo)準(zhǔn)語音控制指令“音量小點”進行突出顯示,需要為該標(biāo)準(zhǔn)語音控制指令“音量小點”配置不同于其他文本“如果您想調(diào)節(jié)音量,可以說”的屬性信息。

步驟107:基于該屬性信息,顯示提示文本,其中,標(biāo)準(zhǔn)語音控制指令與該其他文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

在顯示該提示文本時,對于該提示文本中的標(biāo)準(zhǔn)語音控制指令按照該標(biāo)準(zhǔn)語音控制指令的屬性信息進行顯示,對于該提示文本中的其他文本按照該其他文本的屬性信息進行顯示,也即按照標(biāo)準(zhǔn)語音控制指令的顯示字號、顯示透明度、顯示顏色和顯示字體對該標(biāo)準(zhǔn)語音控制指令進行突出顯示,以便用戶可以清楚了解到終端可以識別的標(biāo)準(zhǔn)語音控制指令,并形成對該標(biāo)準(zhǔn)語音控制指令的記憶。

在本發(fā)明實施例中,由于目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,因此,當(dāng)語音控制文本中存在目標(biāo)控制文本時,則為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息,以實現(xiàn)目標(biāo)控制文本與非目標(biāo)控制文本間的區(qū)別顯示。由于該屬性信息包括顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個,因此當(dāng)按照配置屬性信息顯示語音控制文本時,可以實現(xiàn)對語音控制文本中的目標(biāo)控制文本的突出顯示,從而加強用戶對目標(biāo)控制文本的記憶,以此增加用戶下次輸入的語音控制文本中包括目標(biāo)控制文本的概率,也即提高終端對語音控制文本的理解率,從而提升用戶通過語音控制終端的體驗。另外,當(dāng)語音控制文本中不包括目標(biāo)控制文本時,則生成提示文本,由于提示文本中包括標(biāo)準(zhǔn)語音控制指令,因此通過提示文本可以提示用戶終端能夠識別的標(biāo)準(zhǔn)語音控制指令,從而加強用戶對標(biāo)準(zhǔn)語音控制指令的記憶,同樣提升用戶通過語音控制終端的體驗。

參見圖2,本發(fā)明實施例提供了一種語音控制文本的顯示裝置200,該裝置200包括識別模塊201、配置模塊202和顯示模塊203:

識別模塊201,用于識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,非目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令不匹配的文本;

配置模塊202,用于若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息,以實現(xiàn)目標(biāo)控制文本與非目標(biāo)控制文本間的區(qū)別顯示,該屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

顯示模塊203,用于基于該屬性信息,顯示該語音控制文本,其中,目標(biāo)控制文本與非目標(biāo)控制文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

可選地,該識別模塊201包括:

選擇單元,用于從預(yù)置的語音控制模板庫中選擇與該語音控制文本匹配的目標(biāo)語音控制模板;

第一確定單元,用于將該語音控制文本中與目標(biāo)語音控制模板匹配的文本確定為目標(biāo)控制文本;

第二確定單元,用于將該語音控制文本中除目標(biāo)控制文本之外的文本確定為非目標(biāo)控制文本。

可選地,該識別模塊201包括:

第一查找單元,用于從存儲的多個分支文本中查找與該語音控制文本匹配的目標(biāo)分支文本,分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本;

第三確定單元,用于將該語音控制文本中與目標(biāo)分支文本匹配的文本確定為目標(biāo)控制文本;

第四確定單元,用于將該語音控制文本中除目標(biāo)控制文本之外的文本確定為非目標(biāo)控制文本。

可選地,該配置模塊202包括如下單元中的至少一個:

第一配置單元,用于若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示字號大于非目標(biāo)控制文本的屬性信息;或

第二配置單元,用于若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示透明度低于非目標(biāo)控制文本的屬性信息;或

第三配置單元,用于若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示顏色為有彩色的屬性信息,為非目標(biāo)控制文本配置顯示顏色為無彩色的屬性信息,有彩色為具有彩調(diào)的顏色,無彩色為不具有彩調(diào)的顏色;或

第四配置單元,用于若該語音控制文本中存在目標(biāo)控制文本,則為目標(biāo)控制文本配置顯示字體為第一字體的屬性信息,為非目標(biāo)控制文本配置顯示字體為第二字體的屬性信息。

可選地,該配置模塊202包括:

第二查找單元,用于該語音控制文本中存在目標(biāo)控制文本,則查找指令樹中用于表征目標(biāo)控制文本的節(jié)點;

第五確定單元,用于將指令樹中預(yù)先為節(jié)點配置的屬性信息確定為該節(jié)點表征的目標(biāo)控制文本的屬性信息。

在本發(fā)明實施例中,由于目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,因此,當(dāng)語音控制文本中存在目標(biāo)控制文本時,則為目標(biāo)控制文本配置不同于非目標(biāo)控制文本的屬性信息,以實現(xiàn)目標(biāo)控制文本與非目標(biāo)控制文本間的區(qū)別顯示。由于該屬性信息包括顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個,因此當(dāng)按照配置屬性信息顯示語音控制文本時,可以實現(xiàn)對語音控制文本中的目標(biāo)控制文本的突出顯示,從而加強用戶對目標(biāo)控制文本的記憶,以此增加用戶下次輸入的語音控制文本中包括目標(biāo)控制文本的概率,也即提高終端對語音控制文本的理解率,從而提升用戶通過語音控制終端的體驗。

需要說明的是:上述實施例提供的語音控制文本的顯示裝置在對語音控制文本進行顯示時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將設(shè)備的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的語音控制文本的顯示裝置與語音控制文本的顯示方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。

參見圖3,本發(fā)明實施例提供了另一種語音控制文本的顯示裝置300,該裝置300包括識別模塊301、計算模塊302、生成模塊303、配置模塊304和顯示模塊305:

識別模塊301,用于識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,非目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令不匹配的文本;

計算模塊302,用于若語音控制文本中不存在目標(biāo)控制文本,則基于該語音控制文本中的關(guān)鍵詞,計算該語音控制文本與預(yù)置的語音控制模板之間的相似度;

生成模塊303,用于若相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)該語音控制模板生成提示文本,該提示文本包括該語音控制模板表征的標(biāo)準(zhǔn)語音控制指令;

配置模塊304,用于為該提示文本中的標(biāo)準(zhǔn)語音控制指令配置與該提示文本中的其他文本不同的屬性信息,以實現(xiàn)標(biāo)準(zhǔn)語音控制指令與該其他文本的區(qū)別顯示,該屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

顯示模塊305,用于基于該屬性信息,顯示該提示文本,其中,標(biāo)準(zhǔn)語音控制指令其他文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

在本發(fā)明實施例中,當(dāng)語音控制文本中不包括目標(biāo)控制文本時,則根據(jù)語音控制文本和預(yù)置的語音控制模板庫生成提示文本,由于提示文本中包括標(biāo)準(zhǔn)語音控制指令,因此通過提示文本可以提示用戶終端能夠識別的標(biāo)準(zhǔn)語音控制指令,從而加強用戶對標(biāo)準(zhǔn)語音控制指令的記憶,同樣提升用戶通過語音控制終端的體驗。

需要說明的是:上述實施例提供的語音控制文本的顯示裝置在對語音控制文本進行顯示時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將設(shè)備的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的語音控制文本的顯示裝置與語音控制文本的顯示方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。

參見圖4,本發(fā)明實施例提供了另一種語音控制文本的顯示裝置400,該裝置400包括識別模塊401、計算模塊402、生成模塊403、配置模塊404和顯示模塊405:

識別模塊401,用于識別語音控制文本中的目標(biāo)控制文本和非目標(biāo)控制文本,其中,目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令相匹配的文本,非目標(biāo)控制文本為與標(biāo)準(zhǔn)語音控制指令不匹配的文本;

計算模塊402,用于若語音控制文本中不存在目標(biāo)控制文本,則基于該語音控制文本中的關(guān)鍵詞,計算該語音控制文本與存儲的每個分支文本之間的相似度,其中,分支文本是存儲的指令樹中構(gòu)成每個分支的所有節(jié)點對應(yīng)的文本;

生成模塊403,用于若相似度大于預(yù)設(shè)的相似度閾值,則基于預(yù)置的規(guī)則,根據(jù)相似度表征的分支文本生成提示文本,該提示文本包括該分支文本表征的標(biāo)準(zhǔn)語音控制指令;

配置模塊404,用于為該提示文本中的標(biāo)準(zhǔn)語音控制指令配置與該提示文本中的其他文本不同的屬性信息,以實現(xiàn)標(biāo)準(zhǔn)語音控制指令與該其他文本的區(qū)別顯示,該屬性信息包括用于表示顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個;

顯示模塊405,用于基于該屬性信息,顯示該提示文本,其中,標(biāo)準(zhǔn)語音控制指令與該其他文本的顯示字號、顯示透明度、顯示顏色和顯示字體中的至少一個不同。

在本發(fā)明實施例中,當(dāng)語音控制文本中不包括目標(biāo)控制文本時,則根據(jù)語音控制文本和預(yù)先存儲的多個分支文本生成提示文本,由于提示文本中包括標(biāo)準(zhǔn)語音控制指令,因此通過提示文本可以提示用戶終端能夠識別的標(biāo)準(zhǔn)語音控制指令,從而加強用戶對標(biāo)準(zhǔn)語音控制指令的記憶,同樣提升用戶通過語音控制終端的體驗。

需要說明的是:上述實施例提供的語音控制文本的顯示裝置在對語音控制文本進行顯示時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將設(shè)備的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的語音控制文本的顯示裝置與語音控制文本的顯示方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。

本實施例提供了另一種語音控制文本的顯示裝置,該語音控制文本的顯示裝置可以用于執(zhí)行上述各個實施例中提供的語音控制文本顯示方法。參見圖5,該語音控制文本的顯示裝置500包括:

語音控制文本的顯示裝置500可以包括rf(radiofrequency,射頻)電路510、包括有一個或一個以上計算機可讀存儲介質(zhì)的存儲器520、輸入單元530、顯示單元540、傳感器550、音頻電路560、wifi(wirelessfidelity,無線保真)模塊570、包括有一個或者一個以上處理核心的處理器580、以及電源590等部件。本領(lǐng)域技術(shù)人員可以理解,圖5中示出的語音控制文本的顯示裝置結(jié)構(gòu)并不構(gòu)成對語音控制文本的顯示裝置的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。其中:

rf電路510可用于收發(fā)信息或通話過程中,信號的接收和發(fā)送,特別地,將基站的下行信息接收后,交由一個或者一個以上處理器580處理;另外,將涉及上行的數(shù)據(jù)發(fā)送給基站。通常,rf電路510包括但不限于天線、至少一個放大器、調(diào)諧器、一個或多個振蕩器、用戶身份模塊(sim)卡、收發(fā)信機、耦合器、lna(lownoiseamplifier,低噪聲放大器)、雙工器等。此外,rf電路510還可以通過無線通信與網(wǎng)絡(luò)和其他設(shè)備通信。所述無線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于gsm(globalsystemofmobilecommunication,全球移動通訊系統(tǒng))、gprs(generalpacketradioservice,通用分組無線服務(wù))、cdma(codedivisionmultipleaccess,碼分多址)、wcdma(widebandcodedivisionmultipleaccess,寬帶碼分多址)、lte(longtermevolution,長期演進)、電子郵件、sms(shortmessagingservice,短消息服務(wù))等。

存儲器520可用于存儲軟件程序以及模塊,處理器580通過運行存儲在存儲器520的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。存儲器520可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)語音控制文本的顯示裝置500的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器520可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。相應(yīng)地,存儲器520還可以包括存儲器控制器,以提供處理器580和輸入單元530對存儲器520的訪問。

輸入單元530可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標(biāo)、操作桿、光學(xué)或者軌跡球信號輸入。具體地,輸入單元530可包括觸敏表面531以及其他輸入設(shè)備532。觸敏表面531,也稱為觸摸顯示屏或者觸控板,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸敏表面531上或在觸敏表面531附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動相應(yīng)的連接裝置??蛇x的,觸敏表面531可包括觸摸檢測裝置和觸摸控制器兩個部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點坐標(biāo),再送給處理器580,并能接收處理器580發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實現(xiàn)觸敏表面531。除了觸敏表面531,輸入單元530還可以包括其他輸入設(shè)備532。具體地,其他輸入設(shè)備532可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。

顯示單元540可用于顯示由用戶輸入的信息或提供給用戶的信息以及語音控制文本的顯示裝置500的各種圖形用戶接口,這些圖形用戶接口可以由圖形、文本、圖標(biāo)、視頻和其任意組合來構(gòu)成。顯示單元540可包括顯示面板541,可選的,可以采用lcd(liquidcrystaldisplay,液晶顯示器)、oled(organiclight-emittingdiode,有機發(fā)光二極管)等形式來配置顯示面板541。進一步的,觸敏表面531可覆蓋顯示面板541,當(dāng)觸敏表面531檢測到在其上或附近的觸摸操作后,傳送給處理器580以確定觸摸事件的類型,隨后處理器580根據(jù)觸摸事件的類型在顯示面板541上提供相應(yīng)的視覺輸出。雖然在圖5中,觸敏表面531與顯示面板541是作為兩個獨立的部件來實現(xiàn)輸入和輸入功能,但是在某些實施例中,可以將觸敏表面531與顯示面板541集成而實現(xiàn)輸入和輸出功能。

語音控制文本的顯示裝置500還可包括至少一種傳感器550,比如光傳感器、運動傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示面板541的亮度,接近傳感器可在語音控制文本的顯示裝置500移動到耳邊時,關(guān)閉顯示面板541和/或背光。作為運動傳感器的一種,重力加速度傳感器可檢測各個方向上(一般為三軸)加速度的大小,靜止時可檢測出重力的大小及方向,可用于識別手機姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計姿態(tài)校準(zhǔn))、振動識別相關(guān)功能(比如計步器、敲擊)等;至于語音控制文本的顯示裝置500還可配置的陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器等其他傳感器,在此不再贅述。

音頻電路560、揚聲器561,傳聲器562可提供用戶與語音控制文本的顯示裝置500之間的音頻接口。音頻電路560可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P聲器561,由揚聲器561轉(zhuǎn)換為聲音信號輸出;另一方面,傳聲器562將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路560接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器580處理后,經(jīng)rf電路510以發(fā)送給比如另一語音控制文本的顯示裝置,或者將音頻數(shù)據(jù)輸出至存儲器520以便進一步處理。音頻電路560還可能包括耳塞插孔,以提供外設(shè)耳機與語音控制文本的顯示裝置500的通信。

wifi屬于短距離無線傳輸技術(shù),語音控制文本的顯示裝置500通過wifi模塊570可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁和訪問流式媒體等,它為用戶提供了無線的寬帶互聯(lián)網(wǎng)訪問。雖然圖5示出了wifi模塊570,但是可以理解的是,其并不屬于語音控制文本的顯示裝置500的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。

處理器580是語音控制文本的顯示裝置500的控制中心,利用各種接口和線路連接整個手機的各個部分,通過運行或執(zhí)行存儲在存儲器520內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器520內(nèi)的數(shù)據(jù),執(zhí)行語音控制文本的顯示裝置500的各種功能和處理數(shù)據(jù),從而對手機進行整體監(jiān)控??蛇x的,處理器580可包括一個或多個處理核心;優(yōu)選的,處理器580可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信。可以理解的是,上述調(diào)制解調(diào)處理器也可以不集成到處理器580中。

語音控制文本的顯示裝置500還包括給各個部件供電的電源590(比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器580邏輯相連,從而通過電源管理系統(tǒng)實現(xiàn)管理充電、放電、以及功耗管理等功能。電源590還可以包括一個或一個以上的直流或交流電源、再充電系統(tǒng)、電源故障檢測電路、電源轉(zhuǎn)換器或者逆變器、電源狀態(tài)指示器等任意組件。

盡管未示出,語音控制文本的顯示裝置500還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。具體在本實施例中,語音控制文本的顯示裝置的顯示單元是觸摸屏顯示器,語音控制文本的顯示裝置還包括有存儲器,以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中,且經(jīng)配置以由一個或者一個以上處理器執(zhí)行。所述一個或者一個以上程序包含用于執(zhí)行上述任一實施例中提供的語音控制文本的顯示裝置的語音控制方法。

需要說明的是,上述實施例提供的語音控制文本的顯示裝置可以包括前述實施例的語音控制文本的顯示裝置,上述實施例提供的語音控制文本的顯示裝置與前述實施例的語音控制文本的顯示裝置以及語音控制文本的顯示方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。

本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。

以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
娱乐| 班玛县| 始兴县| 常德市| 西城区| 前郭尔| 平度市| 兴国县| 廊坊市| 绥阳县| 灵丘县| 铜山县| 盐源县| 九龙城区| 吴川市| 东港市| 绥江县| 吉隆县| 清徐县| 错那县| 阿尔山市| 儋州市| 龙门县| 荃湾区| 安化县| 广灵县| 高雄县| 庆元县| 阿鲁科尔沁旗| 西林县| 南漳县| 乐安县| 肥西县| 营山县| 台前县| 辉南县| 上栗县| 深泽县| 张家口市| 云梦县| 宁夏|