專(zhuān)利名稱(chēng):用于向語(yǔ)音使能應(yīng)用程序提供輸入的方法和裝置的制作方法
技術(shù)領(lǐng)域:
在此描述的技術(shù)總體上致力于促進(jìn)用戶與語(yǔ)音使能應(yīng)用程序的相互作用。
背景技術(shù):
語(yǔ)音使能軟件應(yīng)用程序是能夠經(jīng)由從用戶提供的語(yǔ)音輸入來(lái)與該用戶相互作用的和/或能夠按語(yǔ)音形式向人類(lèi)用戶提供輸出的軟件應(yīng)用程序。語(yǔ)音使能應(yīng)用在許多不同環(huán)境中使用,如字處理應(yīng)用、電子郵件應(yīng)用、文本消息和web瀏覽應(yīng)用、手持式裝置命令和控制,以及許多其它方面。這種應(yīng)用可以是專(zhuān)有語(yǔ)音輸入應(yīng)用,或者可以是能夠進(jìn)行多種類(lèi)型的用戶相互作用(例如,視覺(jué)、文本、以及/或其它類(lèi)型的相互作用)的多模態(tài)化應(yīng)用。當(dāng)用戶通過(guò)講話與語(yǔ)音使能應(yīng)用通信時(shí),通常使用自動(dòng)語(yǔ)音識(shí)別來(lái)確定用戶話語(yǔ)的內(nèi)容。接著,語(yǔ)音使能應(yīng)用可以基于所確定的用戶話語(yǔ)內(nèi)容來(lái)確定要采取的恰當(dāng)動(dòng)作。圖1示出了包括計(jì)算機(jī)101的常規(guī)系統(tǒng),計(jì)算機(jī)101執(zhí)行語(yǔ)音使能應(yīng)用程序105和自動(dòng)語(yǔ)音識(shí)別(ASR)引擎103。用戶107可以經(jīng)由麥克風(fēng)109向應(yīng)用程序105提供語(yǔ)音輸入,該麥克風(fēng)經(jīng)由有線連接或無(wú)線連接直接連接至計(jì)算機(jī)101。當(dāng)用戶對(duì)著麥克風(fēng)109講話時(shí),將語(yǔ)音輸入提供給ASR引擎103,該ASR引擎針對(duì)該語(yǔ)音輸入執(zhí)行自動(dòng)語(yǔ)音識(shí)別,并將文本識(shí)別結(jié)果提供給應(yīng)用程序105。
發(fā)明內(nèi)容
一個(gè)實(shí)施例致力于提供一種向在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序提供輸入的方法。該方法包括在至少一個(gè)服務(wù)器計(jì)算機(jī)處接收從未通過(guò)有線或無(wú)線連接方式連接至所述計(jì)算機(jī)的移動(dòng)通信裝置所提供的音頻數(shù)據(jù);在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處獲取根據(jù)針對(duì)該音頻數(shù)據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別而生成的識(shí)別結(jié)果;以及將該識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行該語(yǔ)音使能應(yīng)用程序的所述計(jì)算機(jī)。另一實(shí)施例致力于提供編碼有指令的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),該指令在執(zhí)行時(shí)執(zhí)行上述方法。另一實(shí)施例致力于提供至少一個(gè)服務(wù)器計(jì)算機(jī),該服務(wù)器計(jì)算機(jī)包括至少一個(gè)有形存儲(chǔ)介質(zhì),該至少一個(gè)有形存儲(chǔ)介質(zhì)存儲(chǔ)用于向在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序提供輸入的處理器可執(zhí)行指令;和至少一個(gè)硬件處理器,該至少一個(gè)硬件處理器執(zhí)行該處理器可執(zhí)行指令,以使在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處接收從未通過(guò)有線或無(wú)線連接方式連接至所述計(jì)算機(jī)的移動(dòng)通信裝置提供的音頻數(shù)據(jù);在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處獲取由針對(duì)該音頻數(shù)據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別而生成的識(shí)別結(jié)果;以及將該識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行該語(yǔ)音使能應(yīng)用程序的所述計(jì)算機(jī)。
在圖中圖1是執(zhí)行語(yǔ)音使能應(yīng)用程序的現(xiàn)有技術(shù)計(jì)算機(jī)的框圖;圖2是根據(jù)一些實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖,其中,旨在用于在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序的語(yǔ)音輸入可以經(jīng)由未連接至該計(jì)算機(jī)的移動(dòng)通信裝置來(lái)提供;圖3是根據(jù)一些實(shí)施例的、用于利用移動(dòng)通信裝置向語(yǔ)音使能應(yīng)用提供根據(jù)語(yǔ)音輸入生成的輸入的處理的流程圖;圖4是根據(jù)一些實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖,其中,旨在用于在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序的語(yǔ)音輸入可以經(jīng)由未連接至該計(jì)算機(jī)的移動(dòng)通信裝置來(lái)提供,并且其中,在與執(zhí)行該語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)不同的計(jì)算機(jī)上執(zhí)行自動(dòng)語(yǔ)音識(shí)別;圖5是根據(jù)一些實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖,其中,旨在用于在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序的語(yǔ)音輸入可以經(jīng)由連接至該計(jì)算機(jī)的移動(dòng)通信裝置來(lái)提供;以及圖6是可以在一些實(shí)施例中使用以實(shí)現(xiàn)圖2、4以及5中描繪的計(jì)算機(jī)和裝置的計(jì)算機(jī)裝置的框圖。
具體實(shí)施例方式為向語(yǔ)音使能應(yīng)用提供語(yǔ)音輸入,用戶通常對(duì)著所連接(有線或者無(wú)線地)或內(nèi)置于計(jì)算機(jī)的麥克風(fēng)講話,經(jīng)由該麥克風(fēng),用戶與語(yǔ)音使能應(yīng)用相互作用。發(fā)明人已經(jīng)認(rèn)識(shí)至IJ,用戶使用這種麥克風(fēng)來(lái)向語(yǔ)音使能應(yīng)用提供語(yǔ)音輸入的需要可能導(dǎo)致許多不便利。具體來(lái)說(shuō),一些計(jì)算機(jī)可能沒(méi)有內(nèi)置麥克風(fēng)。由此,用戶必須獲取麥克風(fēng),并將其連接至他或她用來(lái)經(jīng)由語(yǔ)音接入語(yǔ)音使能應(yīng)用的計(jì)算機(jī)。另外,如果計(jì)算機(jī)是共享計(jì)算機(jī),則連接至其的麥克風(fēng)可以是由許多不同的人共享的麥克風(fēng)。由此,麥克風(fēng)可能是用于在人與人之間傳染病原體(例如,病毒、細(xì)菌以及/或其它傳染體)的通路。雖然下面討論的實(shí)施例中的一些致力于解決上面討論的所有不便和缺陷,但不是每一個(gè)實(shí)施例都致力于解決所有這些不便和缺陷,并且一些實(shí)施例可能不解決它們中的任一個(gè)。因此,應(yīng)當(dāng)明白,本發(fā)明不限于解決所有或任何上述不便或缺陷的實(shí)施例。一些實(shí)施例致力于提供這樣的系統(tǒng)和/或方法,其中,用戶可以經(jīng)由移動(dòng)電話或其它手持式移動(dòng)通信裝置來(lái)向語(yǔ)音使能應(yīng)用程序提供語(yǔ)音輸入,而不必使用直接連接至用戶用來(lái)接入語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)的專(zhuān)用麥克風(fēng)。這可以按多種方法中的任一個(gè)來(lái)實(shí)現(xiàn),其中,一些非限制詳細(xì)示例在下面進(jìn)行描述。發(fā)明人已經(jīng)認(rèn)識(shí)到,因?yàn)樵S多人自己的個(gè)人裝置(例如,移動(dòng)電話或其它手持式移動(dòng)計(jì)算裝置)通常具有內(nèi)置麥克風(fēng),所以這種裝置上的麥克風(fēng)可以被用于接收要作為輸入提供給在與這些裝置分離的計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序的用戶語(yǔ)音。這樣,用戶不需要定位專(zhuān)用麥克風(fēng)并將其連接至執(zhí)行語(yǔ)音使能應(yīng)用的計(jì)算機(jī),或者使用連接至計(jì)算機(jī)的共享麥克風(fēng)以經(jīng)由話音與語(yǔ)音使能應(yīng)用程序相互作用。圖2示出了一種計(jì)算機(jī)系統(tǒng),其中,用戶可以向手持式移動(dòng)通信裝置提供語(yǔ)音輸入,以與在和該手持式移動(dòng)通信裝置分離的計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序相互作用。圖2所示的計(jì)算機(jī)系統(tǒng)包括移動(dòng)通信裝置203、計(jì)算機(jī)205、以及一個(gè)或多個(gè)服務(wù)器211。計(jì)算機(jī)205執(zhí)行至少一個(gè)語(yǔ)音使能應(yīng)用程序207和至少一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)引擎209。在一些實(shí)施例中,計(jì)算機(jī)205可以是用戶217的個(gè)人計(jì)算機(jī),經(jīng)由該計(jì)算機(jī),用戶217可以與一個(gè)或多個(gè)輸入/輸出(I/O)裝置(例如,鼠標(biāo)器、鍵盤(pán)、顯示裝置,以及/或任何其它合適I/O裝置)相互作用。該計(jì)算機(jī)可以有或沒(méi)有內(nèi)置麥克風(fēng)。在一些實(shí)施例中,計(jì)算機(jī)205可以是用作用戶的家庭計(jì)算機(jī)的個(gè)人計(jì)算機(jī),或者可以是用戶在其上具有賬戶(例如,企業(yè)賬戶)的工作站或終端,并且,可以是用戶用作接入語(yǔ)音使能應(yīng)用程序的接口。在其它實(shí)施例中,計(jì)算機(jī)205可以是應(yīng)用主機(jī)服務(wù)器,或者向用戶217的個(gè)人計(jì)算機(jī)(未示出)上的虛擬化客戶端遞送語(yǔ)音使能應(yīng)用207的虛擬化服務(wù)器。移動(dòng)通信裝置203可以是各種可能類(lèi)型的移動(dòng)通信裝置中的任一種,例如,包括智能電話(例如,蜂窩移動(dòng)電話)、個(gè)人數(shù)字助理、和/或任何其它合適類(lèi)型的移動(dòng)通信裝置。在一些實(shí)施例中,該移動(dòng)通信裝置可以是手持式和/或掌上型裝置。在一些實(shí)施例中,該移動(dòng)通信裝置可以是能夠通過(guò)因特網(wǎng)發(fā)送和接收信息的裝置。而且,在一些實(shí)施例中,該移動(dòng)通信裝置可以是具有能夠(和/或被配置用于)執(zhí)行應(yīng)用程序的通用處理器,和能夠存儲(chǔ)要通過(guò)該通用處理器執(zhí)行的應(yīng)用程序的有形存儲(chǔ)器或其它類(lèi)型的有形計(jì)算機(jī)可讀介質(zhì)的裝置。在一些實(shí)施例中,移動(dòng)通信裝置可以包括可以向其用戶顯示信息的顯示器。雖然移動(dòng)通信裝置203在一些實(shí)施例中包括內(nèi)置麥克風(fēng),但移動(dòng)通信裝置除了僅僅將聲學(xué)聲音轉(zhuǎn)換成電信號(hào)并通過(guò)有線或無(wú)線連接提供該電信號(hào)以外還提供一些附加功能。服務(wù)器211可以包括執(zhí)行代理應(yīng)用219的一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)。代理應(yīng)用219可以是這樣的應(yīng)用,即,在接收到來(lái)自移動(dòng)通信裝置的音頻時(shí),確定要將所接收音頻發(fā)送至哪個(gè)計(jì)算機(jī)或其它裝置,并將該音頻發(fā)送至該目的地裝置。如下更詳細(xì)說(shuō)明的,該音頻可以被“推送(pushed)”至目的地裝置,或者被目的地裝置“拉出(pulled)”。應(yīng)當(dāng)清楚,盡管在圖2中僅示出了單一移動(dòng)通信裝置203和單一計(jì)算機(jī)205,但由服務(wù)器211執(zhí)行的代理應(yīng)用可以用作許多(例如,數(shù)萬(wàn)、數(shù)十萬(wàn)或更多)移動(dòng)通信裝置與執(zhí)行語(yǔ)音使能應(yīng)用的計(jì)算機(jī)之間的代理。在這方面,在服務(wù)器211上執(zhí)行的代理應(yīng)用219可以接收來(lái)自許多移動(dòng)通信裝置中的任一個(gè)的音頻,確定要將所接收音頻發(fā)送至執(zhí)行語(yǔ)音使能應(yīng)用的多個(gè)目的地計(jì)算機(jī)或裝置中的哪一個(gè),并且將該音頻(例如,經(jīng)由因特網(wǎng)201)發(fā)送至恰當(dāng)目的地計(jì)算機(jī)或裝置。圖3是可以在一些實(shí)施例中被用于使用戶能夠經(jīng)由移動(dòng)通信裝置向語(yǔ)音使能應(yīng)用程序提供語(yǔ)音的處理的流程圖。如可以根據(jù)下面的討論清楚的,即使移動(dòng)電話未通過(guò)有線或無(wú)線連接方式連接至執(zhí)行語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)或者用戶經(jīng)由其接入語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)(例如,具有用戶通過(guò)其接入該應(yīng)用的用戶接口的計(jì)算機(jī)),圖3所示的處理也使得語(yǔ)音使能應(yīng)用程序的用戶能夠?qū)χ蛩囊苿?dòng)通信裝置講話,并且使他或她的語(yǔ)音作為文本實(shí)時(shí)或大致實(shí)時(shí)地呈現(xiàn)在語(yǔ)音使能應(yīng)用程序中。圖3的處理在動(dòng)作301開(kāi)始,其中,用戶(例如,圖2中的用戶217)提供輸入到移動(dòng)通信裝置(例如,移動(dòng)通信裝置203)的麥克風(fēng)中的、旨在供語(yǔ)音使能應(yīng)用程序使用的語(yǔ)音。移動(dòng)通信裝置可以按任何合適方式接收語(yǔ)音,并且本發(fā)明在這方面不受限。例如,移動(dòng)通信裝置可以執(zhí)行一應(yīng)用程序,該應(yīng)用程序被配置成接收來(lái)自用戶的語(yǔ)音并將該語(yǔ)音提供給服務(wù)器211。在一些實(shí)施例中,移動(dòng)通信裝置可以經(jīng)由內(nèi)置麥克風(fēng)接收語(yǔ)音作為模擬音頻信號(hào),并且可以在將該音頻提供給服務(wù)器211之前數(shù)字化該音頻。由此,在動(dòng)作301,用戶可以啟動(dòng)移動(dòng)通信裝置上的該應(yīng)用程序,并對(duì)著該移動(dòng)通信裝置的麥克風(fēng)講話。該處理接下來(lái)繼續(xù)至動(dòng)作303,其中,該移動(dòng)通信裝置經(jīng)由麥克風(fēng)接收用戶的語(yǔ)音。接著,該處理繼續(xù)至動(dòng)作305,其中,移動(dòng)通信裝置將所接收語(yǔ)音作為音頻數(shù)據(jù)發(fā)送至執(zhí)行代理應(yīng)用(例如,代理應(yīng)用219)的服務(wù)器(例如,服務(wù)器(211)之一)。該音頻可以按任何合適格式來(lái)發(fā)送,并且可以在發(fā)送之前壓縮或者無(wú)壓縮發(fā)送。在一些實(shí)施例中,該音頻可以通過(guò)移動(dòng)通信裝置流式傳輸至執(zhí)行代理應(yīng)用的服務(wù)器。這樣,在用戶對(duì)著該移動(dòng)通信裝置的麥克風(fēng)講話時(shí),移動(dòng)通信裝置將用戶的語(yǔ)音的音頻流式傳輸至代理應(yīng)用。在通過(guò)移動(dòng)通信裝置傳輸音頻之后,處理繼續(xù)至動(dòng)作307,其中,在服務(wù)器上執(zhí)行的代理應(yīng)用接收從移動(dòng)通信裝置發(fā)送來(lái)的音頻。處理接下來(lái)繼續(xù)至動(dòng)作309,其中,代理應(yīng)用確定作為音頻數(shù)據(jù)的目的地的計(jì)算機(jī)或裝置。這可以按各種可能方法中的任一個(gè)來(lái)實(shí)現(xiàn),下面對(duì)其一些示例進(jìn)行討論。例如,在一些實(shí)施例中,當(dāng)移動(dòng)通信裝置向服務(wù)器發(fā)送音頻數(shù)據(jù)時(shí),其可以隨著該音頻一起發(fā)送標(biāo)識(shí)用戶和/或移動(dòng)通信裝置的標(biāo)識(shí)符。這種標(biāo)識(shí)符可以采取各種可能形式中的任一個(gè)。例如,在一些實(shí)施例中,該標(biāo)識(shí)符可以是用戶輸入到移動(dòng)通信裝置上的應(yīng)用程序中的用戶名和/或密碼,以便提供音頻。在另選實(shí)施例中,其中,移動(dòng)通信裝置是移動(dòng)電話,標(biāo)識(shí)符可以是移動(dòng)電話的電話號(hào)碼。在一些實(shí)施例中,標(biāo)識(shí)符可以是由其移動(dòng)通信裝置的制造商或者由某其它實(shí)體指配給移動(dòng)通信裝置的通用唯一標(biāo)識(shí)符(UUID)或保證唯一標(biāo)識(shí)符(⑶ID)??梢允褂萌魏纹渌线m的標(biāo)識(shí)符。如下更詳細(xì)描述的,在服務(wù)器上執(zhí)行的代理應(yīng)用在確定要將所接收音頻數(shù)據(jù)發(fā)送至哪個(gè)計(jì)算機(jī)或裝置時(shí),可以使用由移動(dòng)通信裝置與視頻數(shù)據(jù)一起發(fā)送來(lái)的標(biāo)識(shí)符。在一些實(shí)施例中,移動(dòng)通信裝置不需要隨著每一次發(fā)送音頻數(shù)據(jù)而發(fā)送標(biāo)識(shí)符。例如,標(biāo)識(shí)符可以被用于建立移動(dòng)通信裝置與服務(wù)器之間的會(huì)話,并且標(biāo)識(shí)符可以與該會(huì)話相關(guān)聯(lián)。這樣,可以將作為會(huì)話的一部分而發(fā)送的任何音頻數(shù)據(jù)與該標(biāo)識(shí)符相關(guān)聯(lián)。代理應(yīng)用可以按任何合適方式使用標(biāo)識(shí)用戶和/或移動(dòng)通信裝置的標(biāo)識(shí)符,來(lái)確定向哪個(gè)計(jì)算機(jī)或裝置發(fā)送所接收音頻數(shù)據(jù),在此對(duì)其非限制例進(jìn)行描述。例如,參照?qǐng)D2,在一些實(shí)施例中,計(jì)算機(jī)205可以向服務(wù)器211周期性地輪詢,以確定服務(wù)器211是否已經(jīng)接收到來(lái)自移動(dòng)通信裝置203的任何音頻數(shù)據(jù)。當(dāng)輪詢服務(wù)器211時(shí),計(jì)算機(jī)205可以向服務(wù)器211提供與由移動(dòng)通信裝置203提供給服務(wù)器211的音頻數(shù)據(jù)相關(guān)聯(lián)的標(biāo)識(shí)符,或者服務(wù)器可以用來(lái)映射至該標(biāo)識(shí)符的某其它標(biāo)識(shí)符。由此,當(dāng)服務(wù)器211接收到來(lái)自計(jì)算機(jī)205的標(biāo)識(shí)符時(shí),其可以標(biāo)識(shí)與所接收標(biāo)識(shí)符相關(guān)聯(lián)的音頻數(shù)據(jù),并且確定與所接收標(biāo)識(shí)符相關(guān)聯(lián)的音頻數(shù)據(jù)將要提供給輪詢計(jì)算機(jī)。這樣,將根據(jù)用戶217的語(yǔ)音生成的音頻(且不是從其他用戶的移動(dòng)通信裝置提供的音頻數(shù)據(jù))被提供給用戶的計(jì)算機(jī)。計(jì)算機(jī)205可以按各種可能方法中的任一個(gè)來(lái)獲取通過(guò)用戶217的移動(dòng)通信裝置(即,移動(dòng)通信裝置203)提供給服務(wù)器211的標(biāo)識(shí)符。例如,在一些實(shí)施例中,語(yǔ)音使能應(yīng)用207和/或計(jì)算機(jī)205可以存儲(chǔ)針對(duì)語(yǔ)音使能應(yīng)用的每一個(gè)用戶的記錄。該記錄的一個(gè)字段可以包括與用戶的移動(dòng)通信裝置相關(guān)聯(lián)的標(biāo)識(shí)符,其例如可以由用戶手動(dòng)提供和輸入(例如,經(jīng)由用戶向裝置登記語(yǔ)音使能應(yīng)用的一次性登記過(guò)程)。由此,當(dāng)用戶登錄計(jì)算機(jī)205時(shí),存儲(chǔ)在針對(duì)該用戶的記錄中的標(biāo)識(shí)符可以在向服務(wù)器211輪詢音頻數(shù)據(jù)時(shí)使用。例如,針對(duì)用戶217的記錄可以存儲(chǔ)與移動(dòng)通信裝置203相關(guān)聯(lián)的標(biāo)識(shí)符。當(dāng)用戶217登錄計(jì)算機(jī)205時(shí),計(jì)算機(jī)205利用來(lái)自針對(duì)用戶217的記錄的標(biāo)識(shí)符向服務(wù)器211輪詢。這樣,服務(wù)器211可以確定要將從移動(dòng)通信裝置接收到的音頻數(shù)據(jù)發(fā)送至哪個(gè)計(jì)算機(jī)。如上所述,服務(wù)器211可以接收從大量不同用戶和從大量不同裝置提供的音頻數(shù)據(jù)。針對(duì)每一條音頻數(shù)據(jù),服務(wù)器211可以通過(guò)將與音頻數(shù)據(jù)相關(guān)聯(lián)的標(biāo)識(shí)符匹配或映射到與目的地裝置相關(guān)聯(lián)的標(biāo)識(shí)符,來(lái)確定要將音頻數(shù)據(jù)提供給哪個(gè)目的地裝置??梢詫⒁纛l數(shù)據(jù)提供給與隨音頻數(shù)據(jù)提供的標(biāo)識(shí)符被匹配或映射到的標(biāo)識(shí)符相關(guān)聯(lián)的目的地裝置。在上面描述的示例中,在服務(wù)器上執(zhí)行的代理應(yīng)用響應(yīng)于來(lái)自計(jì)算機(jī)或裝置的輪詢請(qǐng)求,確定要將從移動(dòng)通信裝置接收到的音頻數(shù)據(jù)發(fā)送給哪個(gè)計(jì)算機(jī)或裝置。在這方面,計(jì)算機(jī)或裝置可以視為從服務(wù)器“拉出”音頻數(shù)據(jù)。然而,在一些實(shí)施例中,并不是計(jì)算機(jī)或裝置從服務(wù)器拉出音頻數(shù)據(jù),而是服務(wù)器可以將視頻數(shù)據(jù)“推送”至計(jì)算機(jī)或裝置。例如,計(jì)算機(jī)或裝置可以在啟動(dòng)語(yǔ)音使能應(yīng)用時(shí)、在計(jì)算機(jī)加電時(shí),或者在任何其它合適時(shí)間建立會(huì)話,并且可以向代理應(yīng)用提供任何合適標(biāo)識(shí)符(上面討論了其示例),以標(biāo)識(shí)將提供音頻的用戶和/或移動(dòng)通信裝置。當(dāng)代理應(yīng)用接收到來(lái)自移動(dòng)通信裝置的音頻數(shù)據(jù)時(shí),其可以標(biāo)識(shí)對(duì)應(yīng)會(huì)話,并且利用匹配會(huì)話將音頻數(shù)據(jù)發(fā)送至計(jì)算機(jī)或裝置。在動(dòng)作309之后,圖3的處理繼續(xù)至動(dòng)作311,其中,服務(wù)器上的代理應(yīng)用將音頻數(shù)據(jù)發(fā)送至在動(dòng)作309中確定的計(jì)算機(jī)或裝置。這可以按任何合適方式來(lái)進(jìn)行。例如,代理應(yīng)用可以通過(guò)因特網(wǎng)、經(jīng)由企業(yè)內(nèi)聯(lián)網(wǎng),或者按任何其它合適方式向計(jì)算機(jī)或裝置發(fā)送音頻數(shù)據(jù)。該處理接下來(lái)繼續(xù)至動(dòng)作313,其中,在動(dòng)作309中標(biāo)識(shí)的計(jì)算機(jī)或裝置接收從服務(wù)器上的代理應(yīng)用發(fā)送來(lái)的音頻數(shù)據(jù)。處理接著進(jìn)行至動(dòng)作315,其中,計(jì)算機(jī)或裝置上的或耦接至其的自動(dòng)語(yǔ)音識(shí)別(ASR)引擎針對(duì)所接收音頻數(shù)據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別,以生成識(shí)別結(jié)果。該處理接下來(lái)繼續(xù)至動(dòng)作317,其中,將該識(shí)別結(jié)果從ASR引擎?zhèn)鬟f至在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用。該語(yǔ)音使能應(yīng)用可以按任何合適方式與計(jì)算機(jī)上的或耦接至其的ASR引擎通信,以接收識(shí)別結(jié)果,因?yàn)楸景l(fā)明的多個(gè)方面并不受限于這點(diǎn)。例如,在一些實(shí)施例中,語(yǔ)音使能應(yīng)用和ASR引擎可以使用語(yǔ)音應(yīng)用編程接口(API)來(lái)通信。在一些實(shí)施例中,該語(yǔ)音使能應(yīng)用可以向ASR引擎提供可以在執(zhí)行語(yǔ)音識(shí)別時(shí)幫助該ASR引擎的語(yǔ)境(context)。例如,如圖2所示,語(yǔ)音使能應(yīng)用207可以向ASR引擎209提供語(yǔ)境213。ASR引擎209可以使用該語(yǔ)境來(lái)生成結(jié)果215,并且可以向語(yǔ)音使能應(yīng)用提供結(jié)果215。由語(yǔ)音使能應(yīng)用提供的語(yǔ)境可以是可被ASR引擎209使用的任何信息,以輔助針對(duì)語(yǔ)音使能應(yīng)用的音頻數(shù)據(jù)的自動(dòng)語(yǔ)音識(shí)別。例如,在一些實(shí)施例中,針對(duì)語(yǔ)音使能應(yīng)用的音頻數(shù)據(jù)可以是旨在放置在采用由語(yǔ)音使能應(yīng)用提供或顯示的形式的特定字段中的詞語(yǔ)。例如,該音頻數(shù)據(jù)可以是旨在填充采用這樣的形式的“地址”字段中的語(yǔ)音。該語(yǔ)音使能應(yīng)用可以向ASR引擎提供字段名(例如,“地址”)或有關(guān)該字段的其它信息作為語(yǔ)境信息,并且ASR引擎可以按任何合適方式使用該語(yǔ)境以輔助語(yǔ)音識(shí)別。在上述示例性實(shí)施例中,ASR引擎和語(yǔ)音使能應(yīng)用在同一計(jì)算機(jī)上執(zhí)行。然而,本發(fā)明在這方面不受限,如在一些實(shí)施例中,ASR引擎和語(yǔ)音使能應(yīng)用可以在不同計(jì)算機(jī)上執(zhí)行。例如,在一些實(shí)施例中,ASR引擎可以在與執(zhí)行代理應(yīng)用的服務(wù)器分離的另一服務(wù)器上執(zhí)行。例如,企業(yè)可以具有一個(gè)或多個(gè)專(zhuān)用ASR服務(wù)器,并且代理應(yīng)用可以與這種服務(wù)器通信,以獲取針對(duì)音頻數(shù)據(jù)的語(yǔ)音識(shí)別結(jié)果。在圖4所示的另選實(shí)施例中,ASR引擎可以在和代理應(yīng)用相同的服務(wù)器上執(zhí)行。圖4示出了一種計(jì)算機(jī)系統(tǒng),其中,用戶可以向手持式移動(dòng)通信裝置提供語(yǔ)音輸入,以與在和手持式移動(dòng)通信裝置分離的計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序相互作用。如在圖2中,用戶217可以向移動(dòng)通信裝置203的麥克風(fēng)提供旨在用于語(yǔ)音使能應(yīng)用207 (在計(jì)算機(jī)205上執(zhí)行)的語(yǔ)音。移動(dòng)通信裝置203向在服務(wù)器211之一上執(zhí)行的代理應(yīng)用219發(fā)送該語(yǔ)音的音頻。然而,不同于圖2的系統(tǒng),代替向計(jì)算機(jī)205提供所接收音頻,代理應(yīng)用219向也在服務(wù)器211之一上執(zhí)行的ASR引擎403發(fā)送所接收音頻。在一些實(shí)施例中,ASR引擎403可以在和代理應(yīng)用219相同的服務(wù)器上操作。在其它實(shí)施例中,ASR引擎403可以在和代理應(yīng)用219不同的服務(wù)器上執(zhí)行。在這方面,代理應(yīng)用和ASR功能可以按任何合適方式分布在一個(gè)或多個(gè)計(jì)算機(jī)上(例如,利用排它地專(zhuān)用于用作代理或ASR引擎的一個(gè)或多個(gè)服務(wù)器、利用服務(wù)于兩個(gè)功能的一個(gè)或多個(gè)計(jì)算機(jī)等),因而本發(fā)明在這方面不受限。如圖4所示,代理應(yīng)用219可以向ASR引擎403發(fā)送從移動(dòng)通信裝置203接收到的音頻數(shù)據(jù)(即,音頻數(shù)據(jù)405)。ASR引擎可以將一個(gè)或多個(gè)識(shí)別結(jié)果409返回至代理應(yīng)用219。接著,代理應(yīng)用219可以將從ASR引擎403接收到的識(shí)別結(jié)果409發(fā)送至計(jì)算機(jī)205上的語(yǔ)音使能應(yīng)用207。這樣,計(jì)算機(jī)205不需要執(zhí)行ASR引擎來(lái)使得語(yǔ)音使能應(yīng)用207能夠接收從用戶提供的語(yǔ)音輸入。在一另選實(shí)施例中,代理應(yīng)用可以向ASR引擎通知要將識(shí)別結(jié)果提供給哪個(gè)目的地裝置,并且ASR引擎可以將識(shí)別結(jié)果提供給該裝置,而非將識(shí)別結(jié)果發(fā)送回至代理應(yīng)用。如上所述,在一些實(shí)施例中,語(yǔ)音使能應(yīng)用207可以提供由ASR引擎使用的語(yǔ)境,以幫助語(yǔ)音識(shí)別。由此,如圖4所示,在一些實(shí)施例中,語(yǔ)音使能應(yīng)用207可以向代理應(yīng)用219提供語(yǔ)境407,而代理應(yīng)用219可以將該語(yǔ)境連同音頻405 —起提供給ASR引擎403。在圖4中,語(yǔ)境407被示出為直接從計(jì)算機(jī)205上的語(yǔ)音使能應(yīng)用207提供給代理應(yīng)用219,而結(jié)果409被示出為直接從代理應(yīng)用219提供給語(yǔ)音使能應(yīng)用207。然而,應(yīng)當(dāng)清楚,這些信息可以經(jīng)由因特網(wǎng)201、經(jīng)由內(nèi)聯(lián)網(wǎng)、或者經(jīng)由任何其它合適通信介質(zhì)而在語(yǔ)音使能應(yīng)用與代理應(yīng)用之間傳送。類(lèi)似的是,在其中代理應(yīng)用219和ASR引擎403在不同服務(wù)器上執(zhí)行的實(shí)施例中,信息可以經(jīng)由因特網(wǎng)、內(nèi)聯(lián)網(wǎng)、或者按任何其它合適方式在它們之間交換。在上面結(jié)合圖2-4討論的示例中,移動(dòng)通信裝置203被描繪為經(jīng)由數(shù)據(jù)網(wǎng)絡(luò)(如因特網(wǎng)或企業(yè)內(nèi)聯(lián)網(wǎng))向服務(wù)器211提供音頻數(shù)據(jù)。然而,本發(fā)明在這方面不受限,因?yàn)樵谝恍?shí)施例中,為向服務(wù)器211提供音頻數(shù)據(jù),用戶可以使用移動(dòng)通信裝置203撥打電話號(hào)碼,以向接受音頻數(shù)據(jù)并將該音頻數(shù)據(jù)提供給服務(wù)器211的服務(wù)發(fā)出電話呼叫。由此,用戶可以撥打與該服務(wù)相關(guān)聯(lián)的電話號(hào)碼,并對(duì)著電話講話以提供音頻數(shù)據(jù)。在這樣一些實(shí)施例中,基于陸上通訊線的電話可以被用于提供音頻數(shù)據(jù),以代替移動(dòng)通信裝置203。在上面結(jié)合圖2-4討論的實(shí)施例中,為向在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用提供語(yǔ)音輸入,用戶對(duì)著未通過(guò)有線或無(wú)線連接方式連接至計(jì)算機(jī)的移動(dòng)通信裝置講話。然而,在一些實(shí)施例中,移動(dòng)通信裝置可以經(jīng)由有線或無(wú)線連接方式連接至計(jì)算機(jī)。在這種實(shí)施例中,因?yàn)閷⒁纛l經(jīng)由移動(dòng)通信裝置203與計(jì)算機(jī)205之間的有線或無(wú)線連接而從移動(dòng)通信裝置203提供給計(jì)算機(jī)205,所以代理應(yīng)用不必確定要將音頻數(shù)據(jù)提供給哪個(gè)目的地裝置。由此,在這種實(shí)施例中,計(jì)算機(jī)205向服務(wù)器提供音頻數(shù)據(jù),以使ASR可以在音頻數(shù)據(jù)上執(zhí)行,并且服務(wù)器將ASR的結(jié)果提供回到計(jì)算機(jī)205。服務(wù)器可以接收來(lái)自多種不同計(jì)算機(jī)的針對(duì)ASR功能的請(qǐng)求,但因?yàn)楦鶕?jù)音頻數(shù)據(jù)的識(shí)別結(jié)果被反向提供給將音頻數(shù)據(jù)發(fā)送至服務(wù)器的同一裝置,所以不需要提供上面討論的代理功能。圖5是其中移動(dòng)通信裝置203經(jīng)由可以是有線或無(wú)線連接的連接503而連接至計(jì)算機(jī)205的系統(tǒng)的框圖。由此,用戶217可以提供輸入到移動(dòng)通信裝置203的麥克風(fēng)中的旨在用于語(yǔ)音使能應(yīng)用的語(yǔ)音。移動(dòng)通信裝置203可以將所接收語(yǔ)音作為音頻數(shù)據(jù)501發(fā)送至計(jì)算機(jī)205。計(jì)算機(jī)205可以將從移動(dòng)通信裝置接收到的音頻數(shù)據(jù)發(fā)送至在服務(wù)器211上執(zhí)行的ASR引擎505。ASR引擎505可以針對(duì)所接收音頻數(shù)據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別,并將識(shí)別結(jié)果511發(fā)送至語(yǔ)音使能應(yīng)用511。在一些實(shí)施例中,計(jì)算機(jī)205可以隨音頻數(shù)據(jù)501 —起向ASR引擎505提供來(lái)自語(yǔ)音使能應(yīng)用207的語(yǔ)境507,以在執(zhí)行語(yǔ)音識(shí)別時(shí)幫助ASR引擎。在圖5中,移動(dòng)通信裝置203被示出為連接至因特網(wǎng)。然而,在圖5中描繪的實(shí)施例中,裝置203不需要連接至因特網(wǎng),因?yàn)槠浣?jīng)由有線或無(wú)線連接直接向計(jì)算機(jī)205提供音頻數(shù)據(jù)。上面討論的計(jì)算裝置(例如,計(jì)算機(jī)、移動(dòng)通信裝置、服務(wù)器、和/或任何其它上面討論的計(jì)算裝置)分別可以按任何合適方式來(lái)實(shí)現(xiàn)。圖6是可以被用于實(shí)現(xiàn)上面討論的計(jì)算裝置中的任一個(gè)的例示性計(jì)算裝置600的框圖。計(jì)算裝置600可以包括一個(gè)或多個(gè)處理器601和一個(gè)或多個(gè)有形非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)(例如,有形計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)603)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)603可以在有形非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)實(shí)現(xiàn)上述功能中的任一種的計(jì)算機(jī)指令。處理器601可以耦接至存儲(chǔ)器603,并且可以執(zhí)行這種計(jì)算機(jī)指令,以使實(shí)現(xiàn)并執(zhí)行該功能。計(jì)算裝置600還可以包括網(wǎng)絡(luò)輸入/輸出(I/O)接口 605,經(jīng)由其,該計(jì)算裝置可以與其它計(jì)算機(jī)通信(例如,通過(guò)網(wǎng)絡(luò)),并且,根據(jù)計(jì)算裝置的類(lèi)型,還可以包括一個(gè)或多個(gè)用戶I/o接口,經(jīng)由其,計(jì)算機(jī)可以向用戶提供輸出和接收來(lái)自用戶的輸入。用戶I/O接口可以包括諸如鍵盤(pán)、鼠標(biāo)、麥克風(fēng)、顯示裝置(例如,監(jiān)視器或觸摸屏)、揚(yáng)聲器、攝像機(jī)、以及/或各種其它類(lèi)型I/o裝置的裝置。如根據(jù)上面結(jié)合圖2-4的討論應(yīng)當(dāng)清楚,上述系統(tǒng)和方法準(zhǔn)許用戶啟動(dòng)他或她的計(jì)算機(jī)上的語(yǔ)音使能應(yīng)用程序,提供輸入到未經(jīng)由有線或無(wú)線連接方式連接至計(jì)算機(jī)的移動(dòng)通信裝置的音頻,并且實(shí)時(shí)或大致實(shí)時(shí)地在計(jì)算機(jī)上查看根據(jù)音頻數(shù)據(jù)而獲取的識(shí)別結(jié)果。如在此使用的,實(shí)時(shí)查看結(jié)果意指,針對(duì)音頻數(shù)據(jù)的識(shí)別結(jié)果在用戶提供該音頻數(shù)據(jù)之后不到一分鐘就呈現(xiàn)在用戶的計(jì)算機(jī)上,并且更優(yōu)選地,在用戶提供該音頻數(shù)據(jù)之后不到十秒鐘就呈現(xiàn)在用戶的計(jì)算機(jī)上。另外,利用上面結(jié)合圖2-4描述的系統(tǒng)和方法,移動(dòng)通信裝置接收來(lái)自用戶的音頻數(shù)據(jù)(例如,經(jīng)由內(nèi)置麥克風(fēng))并將該音頻數(shù)據(jù)發(fā)送至服務(wù)器,并且在該服務(wù)器確認(rèn)接收到該音頻數(shù)據(jù)之后,不希望來(lái)自該服務(wù)器的任何響應(yīng)。即,因?yàn)橐纛l數(shù)據(jù)和/或識(shí)別結(jié)果被提供給與移動(dòng)通信裝置分離的目的地裝置,所以移動(dòng)通信裝置不等待或希望接收來(lái)自該服務(wù)器的、基于該音頻數(shù)據(jù)的內(nèi)容的任何識(shí)別結(jié)果或響應(yīng)。如根據(jù)上面的討論應(yīng)當(dāng)清楚,服務(wù)器211上的代理應(yīng)用可向許多用戶和許多目的地裝置提供代理服務(wù)。在這方面,服務(wù)器211可以被看作“在云中”提供代理服務(wù)。云中的服務(wù)器可以接收來(lái)自大量不同用戶的音頻數(shù)據(jù),確定要將該音頻數(shù)據(jù)和/或根據(jù)該音頻數(shù)據(jù)獲取的結(jié)果(例如,通過(guò)在該音頻數(shù)據(jù)上執(zhí)行ASR)發(fā)送至的目的地裝置,并將該音頻數(shù)據(jù)和/或結(jié)果發(fā)送至恰當(dāng)?shù)哪康牡匮b置。另選的是,服務(wù)器211可以是在企業(yè)中操作的服務(wù)器,并且可以向企業(yè)中的用戶提供代理服務(wù)。根據(jù)上面的討論應(yīng)當(dāng)清楚,在服務(wù)器211之一上執(zhí)行的代理應(yīng)用可以接收來(lái)自一個(gè)裝置(例如,移動(dòng)通信裝置)的音頻數(shù)據(jù),并將該音頻數(shù)據(jù)和/或根據(jù)該音頻數(shù)據(jù)獲取的結(jié)果(例如,通過(guò)在該音頻數(shù)據(jù)上執(zhí)行ASR)提供給不同的裝置(例如,執(zhí)行語(yǔ)音使能應(yīng)用程序或提供通過(guò)其用戶可以接入語(yǔ)音使能應(yīng)用程序的用戶接口的計(jì)算機(jī))。代理應(yīng)用從其接收音頻數(shù)據(jù)的裝置和代理應(yīng)用向其提供音頻數(shù)據(jù)和/或結(jié)果的裝置不需要被擁有或操作執(zhí)行該代理應(yīng)用的服務(wù)器的同一實(shí)體擁有或管理。例如,移動(dòng)裝置的擁有者可以是擁有或操作該服務(wù)器的實(shí)體的員工,或者可以是這種實(shí)體的客戶。本發(fā)明的上述實(shí)施例可以按許多方式中的任一種來(lái)實(shí)現(xiàn)。例如,這些實(shí)施例可以利用硬件、軟件或其組合來(lái)實(shí)現(xiàn)。當(dāng)按軟件來(lái)實(shí)現(xiàn)時(shí),軟件代碼可以在任何合適處理器或處理器集合上執(zhí)行,而不管設(shè)置在單一計(jì)算機(jī)中還是在多個(gè)計(jì)算機(jī)當(dāng)中分布。應(yīng)當(dāng)清楚,執(zhí)行上述功能的任何組件或組件集合一般地可以被視為控制上面討論的功能的一個(gè)或多個(gè)控制器。所述一個(gè)或多個(gè)控制器可以按許多方式來(lái)實(shí)現(xiàn),如利用專(zhuān)用硬件,或者利用使用執(zhí)行上述功能的微碼或軟件來(lái)編程的通用硬件(例如,一個(gè)或多個(gè)處理器)。在這方面,應(yīng)當(dāng)清楚,本發(fā)明各種實(shí)施例的一個(gè)實(shí)現(xiàn)包括編碼有一個(gè)或多個(gè)計(jì)算機(jī)程序(即,多個(gè)指令)的至少一個(gè)有形非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)(例如,計(jì)算機(jī)存儲(chǔ)器、軟盤(pán)、緊致磁盤(pán)和光盤(pán)、磁帶、閃速存儲(chǔ)器、現(xiàn)場(chǎng)可編程門(mén)陣列中的電路構(gòu)造或其它半導(dǎo)體裝置等),該計(jì)算機(jī)程序當(dāng)在一個(gè)或多個(gè)計(jì)算機(jī)或其它處理器上執(zhí)行時(shí),執(zhí)行上面討論的本發(fā)明各種實(shí)施例的功能。該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是可運(yùn)輸?shù)?,以使得存?chǔ)在其上的程序可以被加載到任何計(jì)算機(jī)資源上,以實(shí)現(xiàn)在此討論的本發(fā)明的各個(gè)方面。另外,應(yīng)當(dāng)清楚,針對(duì)在執(zhí)行時(shí)執(zhí)行上面討論的功能的計(jì)算機(jī)程序的引用不限于在主機(jī)計(jì)算機(jī)上運(yùn)行的應(yīng)用程序。相反地,術(shù)語(yǔ)計(jì)算機(jī)程序在此按一般意義使用,以指代可以被采用以將處理器編程成實(shí)現(xiàn)上面討論的本發(fā)明的多個(gè)方面的任何類(lèi)型的計(jì)算機(jī)代碼(例如,軟件或微碼)。本發(fā)明的各個(gè)方面可以單獨(dú)地、組合地,或者按在前文所述實(shí)施例中未具體討論的多種布置來(lái)使用,并由此在它們針對(duì)前述描述中闡述的或附圖中例示的組件的細(xì)節(jié)和布置的應(yīng)用方面不構(gòu)成限制。例如,在一個(gè)實(shí)施例中描述的方面可以按任何方式與其它實(shí)施例中描述的方面相組合。而且,本發(fā)明的實(shí)施例可以被實(shí)現(xiàn)為一種或多種方法,其中,已經(jīng)提供了一示例。作為該方法的一部分執(zhí)行的動(dòng)作可以按任何合適方式來(lái)排序。因此,即使在例示性實(shí)施例中被示出為順序動(dòng)作,實(shí)施例也可以被理解為按與所例示的不同的順序來(lái)執(zhí)行其中的動(dòng)作,這可以包括同時(shí)執(zhí)行一些動(dòng)作。在權(quán)利要求書(shū)中使用諸如“第一”、“第二”、“第三”等的普通術(shù)語(yǔ)來(lái)修改權(quán)利要求組件不獨(dú)立地暗示一個(gè)權(quán)利要求組件優(yōu)于另一個(gè)的任何優(yōu)先級(jí)、優(yōu)先權(quán)或順序,或其中方法的動(dòng)作被執(zhí)行的時(shí)間順序。這種術(shù)語(yǔ)僅僅被用作用于區(qū)分具有某名稱(chēng)的一個(gè)權(quán)利要求組件與具有相同名稱(chēng)(但被用作普通術(shù)語(yǔ))的另一部件的標(biāo)記。在此使用的用語(yǔ)(phraseology)和術(shù)語(yǔ)出于描述的目的,而不應(yīng)被視為進(jìn)行限制。使用“包括(including)”、“包括(comprising)”、“具有(having)”、“包含(containing)”、“涉及(involving)”及其變形意指涵蓋在其之后列出的項(xiàng)目和附加項(xiàng)。已經(jīng)詳細(xì)描述了本發(fā)明的若干實(shí)施例,本領(lǐng)域技術(shù)人員將容易地想到各種修改和改進(jìn)。這種修改和改進(jìn)旨在處于本發(fā)明的精神和范圍內(nèi)。因此,前述描述僅僅作為示例,而非旨在進(jìn)行限制。本發(fā)明僅僅如通過(guò)下列的權(quán)利要求書(shū)及其等同物所限定的來(lái)進(jìn)行限制。
權(quán)利要求
1.一種向在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序提供輸入的方法,該方法包括: 在至少一個(gè)服務(wù)器計(jì)算機(jī)處接收由未通過(guò)有線或無(wú)線連接方式連接至所述計(jì)算機(jī)的移動(dòng)通信裝置所提供的音頻數(shù)據(jù); 在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處獲取根據(jù)針對(duì)該音頻數(shù)據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別而生成的識(shí)別結(jié)果;以及 將該識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行該語(yǔ)音使能應(yīng)用程序的所述計(jì)算機(jī)。
2.根據(jù)權(quán)利要求1所述的方法,其中,該移動(dòng)通信裝置包括智能電話。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述至少一個(gè)服務(wù)器是至少一個(gè)第一服務(wù)器,并且其中,獲取該識(shí)別結(jié)果的動(dòng)作還包括: 將該音頻數(shù)據(jù)發(fā)送至在至少一個(gè)第二服務(wù)器上執(zhí)行的自動(dòng)語(yǔ)音識(shí)別(ASR)引擎;并且 在所述至少一個(gè)第二服務(wù)器上接收來(lái)自所述至少一個(gè)(ASR)引擎的識(shí)別結(jié)果。
4.根據(jù)權(quán)利要求1所述的方法,其中,獲取該識(shí)別結(jié)果的動(dòng)作還包括: 利用在所述至少一個(gè)服務(wù)器上執(zhí)行的至少一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)引擎來(lái)生成識(shí)別結(jié)果。
5.根據(jù)權(quán)利要求1所述的方法,其中,該計(jì)算機(jī)是多個(gè)計(jì)算機(jī)中的第一計(jì)算機(jī),并且其中,所述方法還包括: 從移動(dòng)通信裝置接收與所述音頻數(shù)據(jù)相關(guān)聯(lián)的標(biāo)識(shí)符;并且 利用該標(biāo)識(shí)符來(lái)確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)。
6.根據(jù)權(quán)利要求5所述的方法,其中,該標(biāo)識(shí)符是第一標(biāo)識(shí)符,并且其中,利用該第一標(biāo)識(shí)符來(lái)確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)的動(dòng)作還包括: 接收來(lái)自第一計(jì)算機(jī)的針對(duì)音頻數(shù)據(jù)的請(qǐng)求,該請(qǐng)求包括第二標(biāo)識(shí)符; 確定第一標(biāo)識(shí)符是否與第二標(biāo)識(shí)符匹配或映射至第二標(biāo)識(shí)符;以及當(dāng)確定第一標(biāo)識(shí)符與第二標(biāo)識(shí)符匹配或映射至第二標(biāo)識(shí)符時(shí),確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)。
7.根據(jù)權(quán)利要求6所述的方法,其中,將識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)的動(dòng)作響應(yīng)于確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)而執(zhí)行。
8.編碼有指令的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),該指令當(dāng)通過(guò)至少一個(gè)服務(wù)器計(jì)算機(jī)的至少一個(gè)處理器被執(zhí)行時(shí),執(zhí)行向在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序提供輸入的方法,該方法包括: 在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處接收由未通過(guò)有線或無(wú)線連接方式連接至所述計(jì)算機(jī)的移動(dòng)通信裝置所提供的音頻數(shù)據(jù); 在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處獲取根據(jù)針對(duì)該音頻數(shù)據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別而生成的識(shí)別結(jié)果;以及 將該識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行該語(yǔ)音使能應(yīng)用程序的所述計(jì)算機(jī)。
9.根據(jù)權(quán)利要求8所述的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),其中,該移動(dòng)通信裝置包括智能電話。
10.根據(jù)權(quán)利要求8所述的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),其中,所述至少一個(gè)服務(wù)器是至少一個(gè)第一服務(wù)器,并且其中,獲取識(shí)別結(jié)果的動(dòng)作還包括: 將該音頻數(shù)據(jù)發(fā)送至在至少一個(gè)第二服務(wù)器上執(zhí)行的自動(dòng)語(yǔ)音識(shí)別(ASR)引擎;并且 在所述至少一個(gè)第二服務(wù)器上接收來(lái)自所述至少一個(gè)(ASR)引擎的識(shí)別結(jié)果。
11.根據(jù)權(quán)利要求8所述的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),其中,獲取該識(shí)別結(jié)果的動(dòng)作還包括: 利用在所述至少一個(gè)服務(wù)器上執(zhí)行的至少一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)引擎來(lái)生成識(shí)別結(jié)果。
12.根據(jù)權(quán)利要求8所述的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),其中,該計(jì)算機(jī)是多個(gè)計(jì)算機(jī)中的第一計(jì)算機(jī),并且其中,所述方法還包括: 從移動(dòng)通信裝置接收與音頻數(shù)據(jù)相關(guān)聯(lián)的標(biāo)識(shí)符;并且 利用該標(biāo)識(shí)符來(lái)確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)。
13.根據(jù)權(quán)利要求12所述的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),其中,標(biāo)識(shí)符是第一標(biāo)識(shí)符,并且其中,利用第一標(biāo)識(shí)符來(lái)確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)的動(dòng)作還包括: 接收來(lái)自第一計(jì)算機(jī)的針對(duì)音頻數(shù)據(jù)的請(qǐng)求,該請(qǐng)求包括第二標(biāo)識(shí)符; 確定第一標(biāo)識(shí)符是否與第二標(biāo)識(shí)符匹配或映射至第二標(biāo)識(shí)符;以及當(dāng)確定第一標(biāo)識(shí)符與第二標(biāo)識(shí)符匹配或映射至第二標(biāo)識(shí)符時(shí),確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)。
14.根據(jù)權(quán)利要求13所述的至少一個(gè)非臨時(shí)性有形計(jì)算機(jī)可讀介質(zhì),其中,將識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)的動(dòng)作響應(yīng)于確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)而執(zhí)行。
15.至少一個(gè)服務(wù)器計(jì)算機(jī),包括: 至少一個(gè)有形存儲(chǔ)介質(zhì),存儲(chǔ)用于向在計(jì)算機(jī)上執(zhí)行的語(yǔ)音使能應(yīng)用程序提供輸入的處理器可執(zhí)行指令;和 至少一個(gè)硬件處理器,執(zhí)行該處理器可執(zhí)行指令,以使: 在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處接收由未通過(guò)有線或無(wú)線連接方式連接至所述計(jì)算機(jī)的移動(dòng)通信裝置所提供的音頻數(shù)據(jù); 在所述至少一個(gè)服務(wù)器計(jì)算機(jī)處獲取由針對(duì)該音頻數(shù)據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別而生成的識(shí)別結(jié)果;以及 將該識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)。
16.根據(jù)權(quán)利要求15所述的至少一個(gè)服務(wù)器計(jì)算機(jī),其中,所述至少一個(gè)服務(wù)器計(jì)算機(jī)是至少一個(gè)第一服務(wù)器,并且其中,所述至少一個(gè)硬件處理器執(zhí)行該處理器可執(zhí)行指令,以通過(guò)以下步驟獲取識(shí)別結(jié)果: 將該音頻數(shù)據(jù)發(fā)送至在至少一個(gè)第二服務(wù)器上執(zhí)行的自動(dòng)語(yǔ)音識(shí)別(ASR)引擎;并且 在所述至少一個(gè)第二服務(wù)器上接收來(lái)自所述至少一個(gè)(ASR)引擎的識(shí)別結(jié)果。
17.根據(jù)權(quán)利要求15所述的至少一個(gè)服務(wù)器計(jì)算機(jī),其中,所述至少一個(gè)服務(wù)器計(jì)算機(jī)是至少一個(gè)第一服務(wù)器,并且其中,所述至少一個(gè)硬件處理器執(zhí)行該處理器可執(zhí)行指令,以通過(guò)以下步驟獲取識(shí)別結(jié)果: 利用在所述至少一個(gè)服務(wù)器上執(zhí)行的至少一個(gè)自動(dòng)語(yǔ)音識(shí)別(ASR)引擎來(lái)生成識(shí)別結(jié)果。
18.根據(jù)權(quán)利要求15所述的至少一個(gè)服務(wù)器計(jì)算機(jī),其中,該計(jì)算機(jī)是多個(gè)計(jì)算機(jī)中的第一計(jì)算機(jī),并且其中,所述至少一個(gè)硬件處理器執(zhí)行所述指令以: 從該移動(dòng)通信裝置接收與音頻數(shù)據(jù)相關(guān)聯(lián)的標(biāo)識(shí)符;并且 利用該標(biāo)識(shí)符來(lái)確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算 機(jī)。
19.根據(jù)權(quán)利要求18所述的至少一個(gè)服務(wù)器計(jì)算機(jī),其中,該標(biāo)識(shí)符是第一標(biāo)識(shí)符,并且其中,通過(guò)以下步驟,至少一個(gè)硬件處理器利用該第一標(biāo)識(shí)符來(lái)確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī): 接收來(lái)自第一計(jì)算機(jī)的針對(duì)音頻數(shù)據(jù)的請(qǐng)求,該請(qǐng)求包括第二標(biāo)識(shí)符; 確定第一標(biāo)識(shí) 符是否與第二標(biāo)識(shí)符匹配或映射至第二標(biāo)識(shí)符;以及當(dāng)確定第一標(biāo)識(shí)符與第二標(biāo)識(shí)符匹配或映射至第二標(biāo)識(shí)符時(shí),確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī)。
20.根據(jù)權(quán)利要求19所述的至少一個(gè)服務(wù)器計(jì)算機(jī),其中,所述至少一個(gè)硬件處理器響應(yīng)于確定第一計(jì)算機(jī)是所述多個(gè)計(jì)算機(jī)中要將識(shí)別結(jié)果發(fā)送至其的計(jì)算機(jī),而執(zhí)行將識(shí)別結(jié)果從所述至少一個(gè)服務(wù)器計(jì)算機(jī)發(fā)送至執(zhí)行語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)。
全文摘要
一些實(shí)施例致力于允許用戶提供輸入到未連接至執(zhí)行語(yǔ)音使能應(yīng)用程序的計(jì)算機(jī)的移動(dòng)通信裝置,如智能電話中的、旨在用于該語(yǔ)音使能應(yīng)用程序的語(yǔ)音輸入。該移動(dòng)通信裝置可以將用戶的語(yǔ)音輸入作為音頻數(shù)據(jù)提供給在服務(wù)器上執(zhí)行的代理應(yīng)用,其確定要向哪個(gè)計(jì)算機(jī)提供所接收音頻數(shù)據(jù)。當(dāng)代理應(yīng)用確定了要將音頻數(shù)據(jù)提供至其的計(jì)算機(jī)時(shí),其將該音頻數(shù)據(jù)發(fā)送至該計(jì)算機(jī)。在一些實(shí)施例中,自動(dòng)語(yǔ)音識(shí)別可以在將音頻數(shù)據(jù)提供給計(jì)算機(jī)之前針對(duì)其執(zhí)行。在這種實(shí)施例中,代替提供音頻數(shù)據(jù),代理應(yīng)用可以將根據(jù)執(zhí)行自動(dòng)語(yǔ)音識(shí)別而生成的識(shí)別結(jié)果發(fā)送至所標(biāo)識(shí)計(jì)算機(jī)。
文檔編號(hào)G10L15/30GK103081004SQ201180043215
公開(kāi)日2013年5月1日 申請(qǐng)日期2011年9月7日 優(yōu)先權(quán)日2010年9月8日
發(fā)明者J·M·卡塔爾斯 申請(qǐng)人:紐昂斯通訊公司