終端設(shè)備的語(yǔ)音交互方法和使用該方法的終端設(shè)備的制作方法
【專利摘要】提供了一種終端設(shè)備的語(yǔ)音交互方法和使用該方法的終端設(shè)備,所述終端設(shè)備包括位于操作系統(tǒng)和應(yīng)用程序之間的中間層,所述語(yǔ)音交互方法包括:由中間層接收用戶從語(yǔ)音輸入設(shè)備輸入的語(yǔ)音指令的語(yǔ)音信息,并將接收的語(yǔ)音信息轉(zhuǎn)換為文本信息;對(duì)文本信息進(jìn)行語(yǔ)義分析以提取出用戶的語(yǔ)音指令中的操作信息和實(shí)體信息,并根據(jù)操作信息得到對(duì)終端設(shè)備的指令;根據(jù)對(duì)終端設(shè)備的指令調(diào)用終端設(shè)備的底層API,并將操作信息和實(shí)體信息提供給相應(yīng)的應(yīng)用程序以對(duì)應(yīng)用程序執(zhí)行相應(yīng)的操作。
【專利說(shuō)明】終端設(shè)備的語(yǔ)音交互方法和使用該方法的終端設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音識(shí)別控制技術(shù),更具體地說(shuō),涉及一種利用位于終端設(shè)備的操作系統(tǒng)和應(yīng)用程序之間的中間層來(lái)實(shí)現(xiàn)對(duì)于終端設(shè)備的語(yǔ)音交互的方法及其終端設(shè)備。
【背景技術(shù)】
[0002]在當(dāng)前的終端設(shè)備中,語(yǔ)音識(shí)別已經(jīng)成為了一種常用技術(shù)。傳統(tǒng)的語(yǔ)音輸入設(shè)備大多以接收被動(dòng)的語(yǔ)音信號(hào)為主,通過(guò)其與移動(dòng)設(shè)備的連接,使用者可以方便地接收到來(lái)自手機(jī)的來(lái)電信號(hào)并進(jìn)行信號(hào)的傳輸。而隨著現(xiàn)代技術(shù)的發(fā)展,人們的交流方式和行為越來(lái)越不集中于電話和短信。尤其是隨著3G網(wǎng)絡(luò)和智能手機(jī)的普及,使得人們的交流方式更加的多樣化,而目前的語(yǔ)音輸入設(shè)備(例如,帶有話筒的耳機(jī))在與諸如智能手機(jī)的終端設(shè)備的結(jié)合上,并沒(méi)有很好的滿足人們?cè)谝苿?dòng)過(guò)程中進(jìn)行信息傳遞的需求。
[0003]另外,現(xiàn)有的基于語(yǔ)音識(shí)別來(lái)控制終端設(shè)備的技術(shù)通常需要專門為語(yǔ)音交互的應(yīng)用程序開發(fā)與該語(yǔ)音交互應(yīng)用程序與其它應(yīng)用程序的接口,因此只能實(shí)現(xiàn)對(duì)固定的應(yīng)用程序的調(diào)用和控制。這對(duì)終端設(shè)備的語(yǔ)音交互帶來(lái)了很多的不方便。例如,蘋果公司的1s系統(tǒng)上的Siri語(yǔ)音助手僅能實(shí)現(xiàn)對(duì)諸如短信息、郵件等固定的應(yīng)用程序的調(diào)用,而無(wú)法實(shí)現(xiàn)與用戶自行安裝的應(yīng)用程序的交互。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于,不需要針對(duì)終端設(shè)備的硬件以及終端設(shè)備上的應(yīng)用程序做任何的修改,僅通過(guò)采用運(yùn)行在終端設(shè)備的操作系統(tǒng)之上的中間層來(lái)完全屏蔽設(shè)備上的應(yīng)用程序和語(yǔ)音輸入設(shè)備之間的聯(lián)系,從而能夠直接通過(guò)語(yǔ)音來(lái)控制現(xiàn)有的終端設(shè)備(如手機(jī)、平板、車載GPS等)的各種功能或者與終端設(shè)備的所有可用應(yīng)用程序進(jìn)行交互。
[0005]根據(jù)本發(fā)明的一方面,提供了一種用于終端設(shè)備的語(yǔ)音交互方法,所述終端設(shè)備包括位于操作系統(tǒng)和應(yīng)用程序之間的中間層,所述語(yǔ)音交互方法包括:(a)由中間層接收用戶從語(yǔ)音輸入設(shè)備輸入的語(yǔ)音指令的語(yǔ)音信息,并將接收的語(yǔ)音信息轉(zhuǎn)換為文本信息;
(b)對(duì)文本信息進(jìn)行語(yǔ)義分析以提取出用戶的語(yǔ)音指令中的操作信息和實(shí)體信息,并根據(jù)操作信息得到對(duì)終端設(shè)備的指令;(C)根據(jù)對(duì)終端設(shè)備的指令調(diào)用終端設(shè)備的底層API,并將操作信息和實(shí)體信息提供給相應(yīng)的應(yīng)用程序以對(duì)應(yīng)用程序執(zhí)行相應(yīng)的操作。
[0006]根據(jù)本發(fā)明的一方面,語(yǔ)音交互方法還包括:(d)如果應(yīng)用程序在執(zhí)行操作之后返回了文本信息,則將返回的文本信息轉(zhuǎn)換為語(yǔ)音信息,并將語(yǔ)音信息提供給語(yǔ)音輸出設(shè)備。
[0007]根據(jù)本發(fā)明的一方面,語(yǔ)音交互方法的步驟(C)還包括:將得到的操作信息和實(shí)體信息轉(zhuǎn)換為用于模擬用戶對(duì)終端設(shè)備的操作的指令。
[0008]根據(jù)本發(fā)明的一方面,語(yǔ)音輸入設(shè)備和語(yǔ)音輸出設(shè)備集成在與終端設(shè)備連接的藍(lán)牙耳機(jī)中。
[0009]根據(jù)本發(fā)明的一方面,中間層屏蔽語(yǔ)音輸入設(shè)備與應(yīng)用程序之間的聯(lián)系。
[0010]根據(jù)本發(fā)明的另一方面,還提供了一種用于語(yǔ)音交互的終端設(shè)備,所述終端設(shè)備包括位于操作系統(tǒng)和應(yīng)用程序之間的中間層模塊,所述中間層模塊包括:語(yǔ)音識(shí)別模塊,接收用戶從語(yǔ)音輸入設(shè)備輸入的語(yǔ)音指令的語(yǔ)音信息,并將接收的語(yǔ)音信息轉(zhuǎn)換為文本信息;語(yǔ)義分析模塊,對(duì)文本信息進(jìn)行語(yǔ)義分析以提取出用戶的語(yǔ)音指令中的操作信息和實(shí)體信息,并根據(jù)操作信息得到對(duì)終端設(shè)備的指令;語(yǔ)音控制模塊,根據(jù)對(duì)終端設(shè)備的指令調(diào)用終端設(shè)備的底層API,并將操作信息和實(shí)體信息提供給相應(yīng)的應(yīng)用程序以對(duì)應(yīng)用程序執(zhí)行相應(yīng)的操作。
[0011]根據(jù)本發(fā)明的另一方面,所述中間層模塊還包括:語(yǔ)音轉(zhuǎn)換模塊,如果應(yīng)用程序在執(zhí)行操作之后返回了文本信息,則將返回的文本信息轉(zhuǎn)換為語(yǔ)音信息,并將語(yǔ)音信息提供給語(yǔ)音輸出設(shè)備。
[0012]根據(jù)本發(fā)明的另一方面,語(yǔ)音控制模塊還將得到的操作信息和實(shí)體信息轉(zhuǎn)換為用于模擬用戶對(duì)終端設(shè)備的操作的指令。
[0013]根據(jù)本發(fā)明的另一方面,語(yǔ)音輸入設(shè)備和語(yǔ)音輸出設(shè)備集成在與終端設(shè)備連接的藍(lán)牙耳機(jī)中。
[0014]根據(jù)本發(fā)明的另一方面,所述中間層模塊屏蔽語(yǔ)音輸入設(shè)備與應(yīng)用程序之間的聯(lián)系O
【專利附圖】
【附圖說(shuō)明】
[0015]通過(guò)下面結(jié)合附圖進(jìn)行的描述,本發(fā)明的上述和其他目的和特點(diǎn)將會(huì)變得更加清楚,其中:
[0016]圖1是示出根據(jù)本發(fā)明實(shí)施例的終端設(shè)備的系統(tǒng)架構(gòu)示意圖;
[0017]圖2是示出根據(jù)本發(fā)明實(shí)施例的圖1中的中間層模塊的詳細(xì)配置示意圖;
[0018]圖3是示出根據(jù)本發(fā)明實(shí)施例的語(yǔ)音交互方法的流程圖。
【具體實(shí)施方式】
[0019]下面提供參照附圖進(jìn)行的描述以有助于全面理解如權(quán)利要求及其等同物所限定的本發(fā)明的示例性實(shí)施例。所述描述包括各種詳細(xì)的細(xì)節(jié)以有助于理解,而這些描述將被認(rèn)為僅為示例性的。因此,本領(lǐng)域的普通技術(shù)人員將意識(shí)到在不脫離本發(fā)明的范圍和精神的情況下可做出在此描述的各種改變和變型。另外,為了清晰和簡(jiǎn)潔,可省略對(duì)公知功能和構(gòu)造的描述。
[0020]圖1是示出本發(fā)明實(shí)施例的終端設(shè)備的系統(tǒng)架構(gòu)示意圖。
[0021]如圖1所示,根據(jù)本發(fā)明實(shí)施例的終端設(shè)備100的系統(tǒng)架構(gòu)包括:操作系統(tǒng)110、中間層120和應(yīng)用程序130。
[0022]終端設(shè)備100可通過(guò)諸如帶有話筒的藍(lán)牙耳機(jī)的語(yǔ)音輸入設(shè)備來(lái)接收用戶的語(yǔ)音信號(hào)。在接收到語(yǔ)音信號(hào)輸入之后,終端設(shè)備100的操作系統(tǒng)110控制相應(yīng)的模塊將語(yǔ)音信號(hào)轉(zhuǎn)換為在數(shù)字化的語(yǔ)音信息,并將語(yǔ)音信息提供給位于操作系統(tǒng)110和應(yīng)用程序130之間的中間層120。中間層120集成在操作系統(tǒng)110的底層功能中,其可以完全屏蔽應(yīng)用程序與語(yǔ)音輸入設(shè)備之間的聯(lián)系,并可以模擬用戶的操作和應(yīng)用交互。中間層120對(duì)接收到的語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,從而將接收到的語(yǔ)音信息轉(zhuǎn)換為文本信息。接下來(lái),中間層120對(duì)文本信息進(jìn)行自然語(yǔ)言處理和語(yǔ)義理解,從文本信息中得到用戶用語(yǔ)音表達(dá)的操作信息和實(shí)體信息。例如,如果從用戶接收到的語(yǔ)音信息中識(shí)別出用戶發(fā)出了語(yǔ)音指令“跟小李發(fā)短息,說(shuō)我晚上不回家吃飯了”,則通過(guò)自然語(yǔ)言處理,中間層120可得到如下信息“啟動(dòng)短信模塊,給收件人‘小李’發(fā)短信,短信內(nèi)容為:我晚上不回家吃飯了”。這里,“啟動(dòng)短信模塊”可表示操作信息,收件人‘小李’以及短信內(nèi)容“我晚上不回家吃飯了”可表示實(shí)體信息。當(dāng)然,中間層120還可以通過(guò)擴(kuò)展處理的模塊,進(jìn)行更多的底層設(shè)備應(yīng)用的控制,例如,可閱讀未讀郵件、查看天氣信息等。
[0023]接下來(lái),中間層120根據(jù)操作信息所涉及到的應(yīng)用程序來(lái)調(diào)用終端設(shè)備100中相應(yīng)的底層API接口,并將操作信息和實(shí)體信息提供給終端設(shè)備100的應(yīng)用程序130?;蛘撸虚g層120可將得到的操作信息和實(shí)體信息轉(zhuǎn)換為用于模擬用戶行為的操作的指令,從而對(duì)終端設(shè)備100的其它功能進(jìn)行控制或者對(duì)終端設(shè)備100進(jìn)行相應(yīng)的操作。例如,可將“提高音量”的語(yǔ)音指令轉(zhuǎn)換為用戶對(duì)音量+鍵的行為操作的指令。通過(guò)以上處理,可以實(shí)現(xiàn)對(duì)終端設(shè)備100上的不同應(yīng)用程序或其它基本功能的控制。
[0024]另外,如果應(yīng)用程序130在運(yùn)行的過(guò)程中返回了與用戶進(jìn)行交互的交互信息,則中間層120將返回的交互信息轉(zhuǎn)換為語(yǔ)音,并將轉(zhuǎn)換的語(yǔ)音提供給操作系統(tǒng)110,并由操作系統(tǒng)110的相應(yīng)模塊將轉(zhuǎn)換后的語(yǔ)音提供到聲音輸出設(shè)備。例如,操作系統(tǒng)110的藍(lán)牙耳機(jī)模塊可將轉(zhuǎn)換的語(yǔ)音發(fā)送給藍(lán)牙耳機(jī),從而用戶可聽到返回的交互信息。
[0025]下面將參照?qǐng)D2來(lái)詳細(xì)說(shuō)明根據(jù)本發(fā)明實(shí)施例的圖1中的中間層120模塊的詳細(xì)配置。
[0026]如圖2所示,中間層模塊120包括語(yǔ)音識(shí)別模塊121、語(yǔ)義分析模塊122、語(yǔ)音控制模塊123以及語(yǔ)音轉(zhuǎn)換模塊124。當(dāng)然,以上的模塊可以劃分為更多的模塊或者組合為更少的模塊。
[0027]當(dāng)接收到語(yǔ)音信息時(shí),語(yǔ)音識(shí)別模塊121將用戶語(yǔ)音轉(zhuǎn)換為文本信息??刹捎矛F(xiàn)有的任何語(yǔ)音識(shí)別技術(shù)來(lái)將語(yǔ)音轉(zhuǎn)換為文本信息??蛇x地,語(yǔ)音識(shí)別模塊121可控制終端設(shè)備100與用戶進(jìn)行二次交互確認(rèn)來(lái)降低誤識(shí)別帶來(lái)的錯(cuò)誤指令。
[0028]接下來(lái),語(yǔ)義分析模塊122分析文本信息,從而將文本信息翻譯為操作信息和實(shí)體信息。具體地,語(yǔ)義分析模塊122對(duì)文本信息進(jìn)行分詞和詞性標(biāo)注,通過(guò)詞條的特征信息和規(guī)則,先將文本信息劃分為操作信息部分和實(shí)體信息部分。然后,語(yǔ)義分析模塊122將操作信息部分解碼翻譯為對(duì)于終端設(shè)備100的操作指令。
[0029]語(yǔ)音控制模塊123根據(jù)語(yǔ)義分析模塊122翻譯的操作指令來(lái)調(diào)用底層API,從而打開與操作指令相應(yīng)的應(yīng)用程序?;蛘?,語(yǔ)音控制模塊123根據(jù)翻譯的操作指令來(lái)模擬用戶操作行為,從而對(duì)終端設(shè)備100進(jìn)行模擬的操作。
[0030]另外,如果應(yīng)用程序130返回了文字信息,則語(yǔ)音轉(zhuǎn)換模塊124將返回的文字信息轉(zhuǎn)換為語(yǔ)音信息,并通過(guò)調(diào)用操作系統(tǒng)110的相應(yīng)模塊來(lái)將轉(zhuǎn)換的語(yǔ)音信息提供給語(yǔ)音輸出設(shè)備。例如,操作系統(tǒng)110可通過(guò)調(diào)用藍(lán)牙模塊將轉(zhuǎn)換后的語(yǔ)音信息提供給藍(lán)牙耳機(jī)。
[0031]下面將結(jié)合具體示例來(lái)說(shuō)明以上的中間層120的操作。例如,如果用戶在開車的過(guò)程中收到新浪微博發(fā)來(lái)的微博的通知。這時(shí)候,操作系統(tǒng)110將通知以聲音和畫面的形式發(fā)送給用戶,以提醒用戶。這種提醒的方式在大多數(shù)終端設(shè)備中已經(jīng)實(shí)現(xiàn)。
[0032]用戶在得到提醒之后決定查看這條微博并進(jìn)行反饋。此時(shí),用戶通過(guò)藍(lán)牙耳機(jī)上的話筒發(fā)出語(yǔ)音指令“查看通知信息”。中間層120在接收到該語(yǔ)音信息之后,語(yǔ)音識(shí)別模塊121對(duì)這條語(yǔ)音信息進(jìn)行識(shí)別,從而得到“查看通知信息”的文本信息。接下來(lái),語(yǔ)義分析模塊122使用分詞標(biāo)注來(lái)對(duì)文本信息進(jìn)行分析。例如,分詞標(biāo)注能夠識(shí)別出動(dòng)詞“查看”和動(dòng)詞的受體“通知信息”,同時(shí)根據(jù)上一次發(fā)生信息交互的應(yīng)用程序(即,新浪微博),語(yǔ)義分析模塊122可以判斷出用戶的需求是“查看”[動(dòng)作]“新浪微博”[應(yīng)用程序]的“通知信息”[客體]。然后,語(yǔ)音控制模塊123調(diào)用終端設(shè)備100的操作系統(tǒng)底層的API打開新浪微博。這樣,用戶可在終端設(shè)備上查看剛剛接收到的新浪微博的通知信息。
[0033]可選地,語(yǔ)音轉(zhuǎn)換模塊124還可從應(yīng)用程序得到通知信息的文本信息,并將文本信息轉(zhuǎn)換為語(yǔ)音信息,并通過(guò)操作系統(tǒng)110的負(fù)責(zé)藍(lán)牙耳機(jī)的模塊將語(yǔ)音信息發(fā)送到藍(lán)牙耳機(jī)。這樣,用戶可從藍(lán)牙耳機(jī)中聽到自己想要查看的通知信息,而不用自己主動(dòng)在終端上查看通知信息。與當(dāng)前已經(jīng)存在的語(yǔ)音助手類的應(yīng)用程序最大的區(qū)別是不需要對(duì)當(dāng)前存在的應(yīng)用程序做接口調(diào)用,直接從底層就可以和其他應(yīng)用進(jìn)行交互,具有很大的擴(kuò)展性。
[0034]下面將參照?qǐng)D3對(duì)根據(jù)本發(fā)明實(shí)施例的語(yǔ)音交互方法的流程進(jìn)行說(shuō)明。
[0035]首先,在步驟S301,由位于操作系統(tǒng)110和應(yīng)用程序130之間的中間層120來(lái)接收用戶從語(yǔ)音輸入設(shè)備輸入的語(yǔ)音指令的語(yǔ)音信息。
[0036]接下來(lái),在步驟S303,中間層120將接收的語(yǔ)音信息轉(zhuǎn)換為文本信息。然后,在步驟S305,中間層120對(duì)文本信息進(jìn)行語(yǔ)義分析以提取出用戶的語(yǔ)音指令中的操作信息和實(shí)體信息,并根據(jù)操作信息得到對(duì)終端設(shè)備的指令。
[0037]接下來(lái),在步驟S307,中間層120根據(jù)對(duì)終端設(shè)備的指令調(diào)用終端設(shè)備的底層API以操作相關(guān)的應(yīng)用程序,并將操作信息和實(shí)體信息提供給相應(yīng)的應(yīng)用程序?;蛘撸虚g層120還可將得到的操作信息和實(shí)體信息轉(zhuǎn)換為用于模擬用戶對(duì)終端設(shè)備的操作的指令。
[0038]可選地,如果應(yīng)用程序在執(zhí)行操作之后返回了文本信息,則在步驟S309中間層120將返回的文本信息轉(zhuǎn)換為語(yǔ)音信息,并將語(yǔ)音信息提供給語(yǔ)音輸出設(shè)備。
[0039]通過(guò)本發(fā)明,用戶可以借用語(yǔ)音輸入設(shè)備控制移動(dòng)設(shè)備的應(yīng)用程序,滿足在移動(dòng)過(guò)程中不適合查看手機(jī)屏幕時(shí)的使用場(chǎng)景。除此之外,對(duì)于無(wú)法正常使用一些設(shè)備的盲人,也提供了一種僅僅通過(guò)語(yǔ)音的方式和設(shè)備進(jìn)行交互的方法。另外,本發(fā)明的技術(shù)方案不僅擴(kuò)充了目前終端設(shè)備的語(yǔ)音交互功能,由于終端設(shè)備可通過(guò)中間層對(duì)語(yǔ)音指令進(jìn)行轉(zhuǎn)碼,因此,可利用語(yǔ)音對(duì)運(yùn)行在終端設(shè)備上的各種應(yīng)用程序和功能進(jìn)行控制和交互。
[0040]根據(jù)本發(fā)明的方法可被記錄在包括執(zhí)行由計(jì)算機(jī)實(shí)現(xiàn)的各種操作的程序指令的計(jì)算機(jī)可讀介質(zhì)中。介質(zhì)也可以只包括程序指令或者包括與程序指令相結(jié)合的數(shù)據(jù)文件、數(shù)據(jù)結(jié)構(gòu)等。計(jì)算機(jī)可讀介質(zhì)的例子包括磁介質(zhì)(例如硬盤、軟盤和磁帶);光學(xué)介質(zhì)(例如CD-ROM和DVD);磁光介質(zhì)(例如,光盤);以及特別配制用于存儲(chǔ)并執(zhí)行程序指令的硬件裝置(例如,只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、閃存等)。介質(zhì)也可以是包括傳輸規(guī)定程序指令、數(shù)據(jù)結(jié)構(gòu)等的信號(hào)的載波的傳輸介質(zhì)(例如光學(xué)線或金屬線、波導(dǎo)等)。程序指令的例子包括例如由編譯器產(chǎn)生的機(jī)器碼和包含可使用解釋器由計(jì)算機(jī)執(zhí)行的高級(jí)代碼的文件。
[0041]盡管已經(jīng)參照本發(fā)明的示例性實(shí)施例具體顯示和描述了本發(fā)明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不脫離由權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可以對(duì)其進(jìn)行形式和細(xì)節(jié)上的各種改變。
【權(quán)利要求】
1.一種用于終端設(shè)備的語(yǔ)音交互方法,其特征在于所述終端設(shè)備包括位于操作系統(tǒng)和應(yīng)用程序之間的中間層,所述語(yǔ)音交互方法包括: (a)由中間層接收用戶從語(yǔ)音輸入設(shè)備輸入的語(yǔ)音指令的語(yǔ)音信息,并將接收的語(yǔ)音信息轉(zhuǎn)換為文本信息; (b)對(duì)文本信息進(jìn)行語(yǔ)義分析以提取出用戶的語(yǔ)音指令中的操作信息和實(shí)體信息,并根據(jù)操作信息得到對(duì)終端設(shè)備的指令; (c)根據(jù)對(duì)終端設(shè)備的指令調(diào)用終端設(shè)備的底層API,并將操作信息和實(shí)體信息提供給相應(yīng)的應(yīng)用程序以對(duì)應(yīng)用程序執(zhí)行相應(yīng)的操作。
2.如權(quán)利要求1所述的語(yǔ)音交互方法,還包括: (d)如果應(yīng)用程序在執(zhí)行操作之后返回了文本信息,則將返回的文本信息轉(zhuǎn)換為語(yǔ)音信息,并將語(yǔ)音信息提供給語(yǔ)音輸出設(shè)備。
3.如權(quán)利要求1所述的語(yǔ)音交互方法,其中,步驟(c)還包括:將得到的操作信息和實(shí)體信息轉(zhuǎn)換為用于模擬用戶對(duì)終端設(shè)備的操作的指令。
4.如權(quán)利要求1所述的語(yǔ)音交互方法,其中,語(yǔ)音輸入設(shè)備和語(yǔ)音輸出設(shè)備集成在與終端設(shè)備連接的藍(lán)牙耳機(jī)中。
5.如權(quán)利要求1所述的語(yǔ)音交互方法,其中,中間層屏蔽語(yǔ)音輸入設(shè)備與應(yīng)用程序之間的聯(lián)系。
6.一種用于語(yǔ)音交互的終端設(shè)備,其特征在于所述終端設(shè)備包括位于操作系統(tǒng)和應(yīng)用程序之間的中間層模塊,所述中間層模塊包括: 語(yǔ)音識(shí)別模塊,接收用戶從語(yǔ)音輸入設(shè)備輸入的語(yǔ)音指令的語(yǔ)音信息,并將接收的語(yǔ)音信息轉(zhuǎn)換為文本信息; 語(yǔ)義分析模塊,對(duì)文本信息進(jìn)行語(yǔ)義分析以提取出用戶的語(yǔ)音指令中的操作信息和實(shí)體信息,并根據(jù)操作信息得到對(duì)終端設(shè)備的指令; 語(yǔ)音控制模塊,根據(jù)對(duì)終端設(shè)備的指令調(diào)用終端設(shè)備的底層API,并將操作信息和實(shí)體信息提供給相應(yīng)的應(yīng)用程序以對(duì)應(yīng)用程序執(zhí)行相應(yīng)的操作。
7.如權(quán)利要求6所述的終端設(shè)備,所述中間層模塊還包括:語(yǔ)音轉(zhuǎn)換模塊,如果應(yīng)用程序在執(zhí)行操作之后返回了文本信息,則將返回的文本信息轉(zhuǎn)換為語(yǔ)音信息,并將語(yǔ)音信息提供給語(yǔ)音輸出設(shè)備。
8.如權(quán)利要求6所述的終端設(shè)備,其中,語(yǔ)音控制模塊還將得到的操作信息和實(shí)體信息轉(zhuǎn)換為用于模擬用戶對(duì)終端設(shè)備的操作的指令。
9.如權(quán)利要求6所述的終端設(shè)備,其中,語(yǔ)音輸入設(shè)備和語(yǔ)音輸出設(shè)備集成在與終端設(shè)備連接的藍(lán)牙耳機(jī)中。
10.如權(quán)利要求6所述的終端設(shè)備,其中,所述中間層模塊屏蔽語(yǔ)音輸入設(shè)備與應(yīng)用程序之間的聯(lián)系。
【文檔編號(hào)】G10L15/28GK104050966SQ201310078337
【公開日】2014年9月17日 申請(qǐng)日期:2013年3月12日 優(yōu)先權(quán)日:2013年3月12日
【發(fā)明者】張肖男, 陳龍 申請(qǐng)人:百度國(guó)際科技(深圳)有限公司