两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

動態(tài)語言模型的制作方法

文檔序號:2827194閱讀:362來源:國知局
動態(tài)語言模型的制作方法
【專利摘要】用于語音識別的方法、系統(tǒng)和設備,包括在計算機存儲介質(zhì)上編碼的計算機程序。其中一種方法包括:接收用于語音識別的基本語言模型,基本語言模型包括具有基本概率值的第一詞語序列;接收與查詢場境相關(guān)聯(lián)的話音搜索查詢;當查詢場境滿足與定制語言模型相關(guān)聯(lián)的一個或多個準則時,確定要使用定制語言模型;獲得定制語言模型,定制語言模型包括具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列,經(jīng)過調(diào)節(jié)的概率值是基本概率值被根據(jù)查詢場境來調(diào)節(jié)的;以及基于一個或多個概率,將話音搜索查詢轉(zhuǎn)換為文本搜索查詢,每個概率對應于一個或多個詞語序列的群組中的詞語序列,群組包括具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列。
【專利說明】動態(tài)語言模型

【技術(shù)領域】
[0001]本說明書涉及語音識別。

【背景技術(shù)】
[0002]傳統(tǒng)的話音(voice)搜索系統(tǒng)目的是將來自用戶的話音輸入轉(zhuǎn)換為文本搜索查詢。在典型的話音搜索系統(tǒng)中,話音接口接收用戶的話音輸入并將語音輸入提供給語音(speech)識別引擎。語音識別引擎可以基于語言模型,將話音輸入中的所說出的詞語(spoken words)轉(zhuǎn)換為文本搜索查詢。然后,話音搜索系統(tǒng)將文本搜索查詢提交給搜索引擎。因此,話音搜索系統(tǒng)允許用戶在不鍵入文本搜索查詢的情況下執(zhí)行搜索。


【發(fā)明內(nèi)容】

[0003]話音搜索系統(tǒng)應用定制語言模型將語音輸入轉(zhuǎn)換為文本搜索查詢。話音搜索系統(tǒng)獲得例如使用匿名搜索日志數(shù)據(jù)的集合構(gòu)成的基本語言模型。話音搜索系統(tǒng)基于一個或多個定制準則(例如,地理位置、時間或氣象)定制基本語言模型。在定制語言模型中,調(diào)節(jié)分配給與定制準則有關(guān)的一個或多個詞語序列(word sequence)的概率值。
[0004]當話音搜索系統(tǒng)接收話音搜索查詢時,話音搜索系統(tǒng)確定話音搜索查詢的場境(context)。當場境成分滿足定制準則時,話音搜索系統(tǒng)確定定制語言模型。然后,話音搜索系統(tǒng)使用定制語言模型將話音搜索查詢轉(zhuǎn)換為文本搜索查詢。
[0005]一般而言,本說明書中所描述的主題的一個創(chuàng)新性方面可以在這樣的方法中具體實施,所述方法包括以下動作:接收用于語音識別的基本語言模型,所述基本語言模型包括具有基本概率值的第一詞語序列;接收話音搜索查詢,所述話音搜索查詢與查詢場境相關(guān)聯(lián);當所述查詢場境滿足與定制語言模型相關(guān)聯(lián)的一個或多個準則時,確定要使用所述定制語言模型;獲得所述定制語言模型,所述定制語言模型包括具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列,所述經(jīng)過調(diào)節(jié)的概率值是所述基本概率值被根據(jù)所述查詢場境來調(diào)節(jié)的;以及基于一個或多個概率,將所述話音搜索查詢轉(zhuǎn)換為文本搜索查詢,所述一個或多個概率的每一個對應于一個或多個詞語序列的群組中的詞語序列,所述一個或多個詞語序列的群組包括所述具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列。該方案的其他實施例包括對應的計算機系統(tǒng)、裝置以及記錄在一個或多個計算機存儲設備上的計算機程序,每個被配置為執(zhí)行所述方法的動作。一個或多個計算機的系統(tǒng)可以被配置為借助于將在操作中使得系統(tǒng)執(zhí)行動作的軟件、固件、硬件或者它們的組合安裝在系統(tǒng)上,執(zhí)行特定的操作或動作。一個或多個計算機程序可以被配置為借助于包括指令來執(zhí)行特定的操作或動作,當通過數(shù)據(jù)處理裝置執(zhí)行時,指令使得設備執(zhí)行所述動作。
[0006]前述和其他實施例可以分別可選地包括一個或多個以下特征,單獨或組合。獲得所述定制語言模型包括基于所述查詢場境從一個或多個定制語言模型中選擇所述定制語言模型。獲得所述定制語言模型包括使用一個或多個語言調(diào)節(jié)規(guī)則,基于接收的查詢場境調(diào)節(jié)所述基本語言模型。
[0007]所述查詢場境包括從其接收到所述話音搜索查詢的用戶設備的地理位置。所述方法包括確定所述詞語序列與所述地理位置相關(guān),其中所述經(jīng)過調(diào)節(jié)的概率值包括所述基本概率值被基于所述詞語序列與所述地理位置之間的關(guān)系程度來調(diào)節(jié)。所述詞語序列包括位于所述地理位置或者接近所述地理位置的特征的名稱;以及在所述查詢場境中基于所述特征與所述地理位置之間的距離確定所述關(guān)系程度。所述詞語序列包括以超過閾值的頻率從所述地理位置接收的過去查詢的詞(term);以及基于所述頻率確定所述關(guān)系程度。所述地理位置是一組或多組經(jīng)瑋度坐標限定的地理區(qū)域。所述查詢場境包括用戶提供的標識符,用于與所述話音搜索查詢相關(guān)聯(lián)。所述方法包括:確定與所述用戶提供的標識符相關(guān)聯(lián)的社團,所述社團包括與所述用戶提供的標識符有關(guān)的一個或多個用戶標識符;使用與所述社團中的所述用戶標識符相關(guān)聯(lián)的存儲的查詢?nèi)罩?,確定所述詞語序列的出現(xiàn)頻率;以及基于所述出現(xiàn)頻率調(diào)節(jié)所述基本概率值。調(diào)節(jié)所述基本概率值進一步基于每個所述用戶標識符與所述用戶提供的標識符之間在所述社團中的關(guān)系程度。所述查詢場境包括所述話音搜索查詢的時間戳。獲得所述定制語言模型包括:識別一個或多個電子文檔,根據(jù)查詢?nèi)罩荆鲆粋€或多個電子文檔與搜索查詢的數(shù)目相關(guān)聯(lián),所述搜索查詢的數(shù)目滿足閾值數(shù)目,所述搜索查詢在所述時間戳的指定時間窗口中出現(xiàn),所述一個或多個電子文檔的每一個包括所述詞語序列;以及基于所述搜索查詢的數(shù)目調(diào)節(jié)所述基本概率值。所述一個或多個電子文檔的每一個是新聞文章。所述方法包括:作為所述話音搜索查詢的響應,提供所述文本搜索查詢的一個或多個搜索結(jié)果,以用于在顯示設備上顯示。將所述話音搜索查詢轉(zhuǎn)換為文本搜索查詢包括:基于所述定制語言模型中對應的經(jīng)過調(diào)節(jié)的概率值,將所述話音搜索查詢轉(zhuǎn)換為包括所述第一詞語序列的文本搜索查詢。
[0008]本說明書中所述主題的特定實施例可以被實施為實現(xiàn)一個或多個以下優(yōu)點。與傳統(tǒng)的話音搜索系統(tǒng)相比,使用動態(tài)語言模型的話音搜索系統(tǒng)可以基于接收的話音輸入提供更恰當?shù)奈谋舅阉鞑樵?。因為系統(tǒng)考慮了語音-文本轉(zhuǎn)換中話音輸入的特定環(huán)境,例如包括接收話音輸入的時間、發(fā)出話音輸入的位置和/或提供話音輸入的用戶的用戶簡檔,根據(jù)特定環(huán)境可以定制所得的查詢。因此,系統(tǒng)可以提供增強的用戶體驗。
[0009]下面的附圖和說明書闡述動態(tài)語言建模技術(shù)的一個或多個實施例的細節(jié)。根據(jù)說明書和附圖以及根據(jù)權(quán)利要求書,本技術(shù)的其他特征、目的和優(yōu)點將顯而易見。

【專利附圖】

【附圖說明】
[0010]圖1是提供用于提供話音搜索的示例系統(tǒng)的概述的框圖。
[0011]圖2是圖示用于生成動態(tài)語言模型的示例規(guī)則的框圖。
[0012]圖3是圖示動態(tài)語言模型的示例的基于地理的規(guī)則的視圖。
[0013]圖4是圖示動態(tài)語言模型的示例的基于社團的規(guī)則的視圖。
[0014]圖5A和圖5B是圖示動態(tài)語言模型的示例實施方式的框圖。
[0015]圖6是使用定制語言模型的示例方法的流程圖。
[0016]不同附圖中相同的附圖標記表示相同的元件。

【具體實施方式】
[0017]圖1是提供用于提供話音搜索的示例系統(tǒng)的概述的框圖。話音搜索系統(tǒng)102包括一個或多個計算機,計算機被編程為從用戶接收用戶的語音輸入,使用動態(tài)語言模型將語音輸入轉(zhuǎn)換為文本搜索查詢,接收響應于文本搜索查詢的搜索結(jié)果,并響應于語音輸入將搜索結(jié)果提供給用戶。話音搜索系統(tǒng)102例如可以被實施在包括服務器的一個或多個計算機上,或者用戶設備上。
[0018]話音搜索系統(tǒng)102包括被配置為從用戶接收語音輸入106的話音接口 104。話音接口 104例如可包括耦合到用戶設備的聲學-電學變換器或傳感器(例如,麥克風)。語音輸入106可包括口語詞語序列。
[0019]話音搜索系統(tǒng)102包括語音識別子系統(tǒng)108。語音識別子系統(tǒng)108可以是話音搜索系統(tǒng)102的軟件組件,其被配置為將語音輸入106中的口語詞語轉(zhuǎn)換為文本搜索查詢115。語音識別子系統(tǒng)108包括基本語言模型110。基本語言模型110可包括與詞語序列相關(guān)聯(lián)的概率值。在基本語言模型110中,例如(Wa,Wb,..., ffm)的給定的詞語序列與例如P (Wa, Wb,, Wm)的概率值相關(guān)聯(lián),其中,每個Wa,ffb,..., Wm包括詞語、短語或句子?;菊Z言模型110可包括多個詞語序列以及與每個詞語序列相關(guān)聯(lián)的概率值。
[0020]基本語言模型110可以是N元模型(例如,一元模型或多元模型)。在所示示例中,基本語言模型110是二元語言模型。基本語言模型包括與詞語序列(Wx,Wy)相關(guān)聯(lián)的概率值P (ffx, Wy)??梢允褂靡韵鹿接嬎愀怕手礟 (ffx, Wy):
[0021]P (ffx, ffy) ^ P (ffx | <s>) P (ffy | ffx), (I)
[0022]其中P (ffx, ffy)是搜索查詢中出現(xiàn)的詞語序列(Wx,ffy)的概率,〈S〉指示搜索查詢的開始,P (Wx I <s>)指示給定〈S〉、詞語Wx跟隨〈S〉的條件概率,而P (Wy I Wx)指示給定詞語Wx、詞語Wy跟隨詞語Wx的條件概率。
[0023]此外,基本語言模型110可包括與詞語序列(Wp,Wq,Wr)相關(guān)聯(lián)的概率值P (Wp, Wq, Wr)??梢栽诶缡褂靡韵鹿降亩P椭杏嬎愀怕手礟 (Wp, Wq, Wr):
[0024]P (ffp, ffq, ffr) ^ P (ffp | <s>) P (ffq | ffp) P (ffr | Wq) (2)
[0025]概率值P (ffx I <s>)、P (ffy | ffx)、P (ffp | <s>)、P (ffq | ffp)以及 P (ffr | Wq)可以根據(jù)存儲的過去接收到的查詢來確定。
[0026]為了說明,詞語序列(Wp,Wq,Wr)可以表示公眾當中流行的搜索查詢,例如與其他搜索查詢相比出現(xiàn)更頻繁的搜索查詢。詞語序列(Wx,Wy)可以表示只在特殊環(huán)境下流行的搜索查詢。例如,(Wx,Wy)可以是位于地理區(qū)域(例如,城鎮(zhèn)ABC)的風味餐廳的名稱。話音搜索相同102更有可能從地理區(qū)域ABC中的用戶而不是從地理區(qū)域ABC之外的用戶接收具有查詢詞(Wx,Wy)的搜索查詢。
[0027]在該示例中,地理區(qū)域ABC并非從其接收查詢的多個地理區(qū)域當中特別流行的地理區(qū)域。因此,在基本語言模型中,P (Wp,Wq,Wr)可以大于P (Wx,Wy),指示一般而言,語音識別子系統(tǒng)108更有可能將語音輸入106轉(zhuǎn)換為文本搜索查詢(Wp,Wq,Wr)而不是轉(zhuǎn)換為文本搜索查詢(Wx,Wy)。根據(jù)概率值的排序,在基本語言模型110中可將(Wp,Wq,Wr)排序第一,而將(Wx,Wy)排序在第一后面大約第η個位置。
[0028]語音識別子系統(tǒng)108包括模型定制模塊112。模型定制模塊112可以是語音識別子系統(tǒng)108的軟件組件,其被配置為使得計算設備基于一個或多個調(diào)節(jié)因素動態(tài)地調(diào)節(jié)基本語言模型110,并生成定制語言模型114。調(diào)節(jié)因素是與基本語言模型110無關(guān)的信息項,可以影響將語音輸入106轉(zhuǎn)換為特定文本搜索查詢的可能性。模型定制模塊112例如可以基于位置、查詢時間戳或其他參數(shù)中的一個或多個來確定調(diào)節(jié)因素。
[0029]例如,對于給定的語音輸入,在基本語言模型110中概率值P(Wx,Wy)可以低于概率值P(Wp,ffq, ffr)。當考慮一個或多個調(diào)節(jié)因素,例如當滿足特定位置條件時,模型定制模塊112可以增加概率值P (ffx, ffy),使得定制語言模型114中的概率值P (ffx, ffy)高于基本語言模型110中的概率值P(Wx,Wy)。模型定制模塊112可將定制語言模型114與位置(例如,地理區(qū)域ABC)相關(guān)聯(lián)。模型定制模塊112可以動態(tài)地調(diào)節(jié)基本語言模型110,以在查詢時間生成定制語言模型114,使得定制語言模型114中一個或多個特定詞語序列的概率不同于基本語言模型110中那些相同詞語序列的概率。
[0030]語音識別子系統(tǒng)108被配置為接收與語音輸入106相關(guān)聯(lián)的查詢場境117。查詢場境117包括描述生成語音輸入106的環(huán)境的數(shù)據(jù)。查詢場境117可包括指示在哪里發(fā)出語音輸入106的位置信息。例如,位置信息可包括基于其估計位置的經(jīng)度和瑋度參數(shù)、全球定位系統(tǒng)坐標、或者互聯(lián)網(wǎng)協(xié)議(IP)地址。可以從用戶設備獲得位置信息。
[0031]語音識別子系統(tǒng)108被配置為確定是使用基本語言模型110還是定制語言模型114來將語音輸入106轉(zhuǎn)換為文本搜索查詢115。例如,如果語音識別子系統(tǒng)108基于查詢場境117確定提供語音輸入106的用戶位于地理區(qū)域ABC中,則語音識別子系統(tǒng)108可以使用定制語言模型114。但是,如果語音識別子系統(tǒng)108基于查詢場境117確定提供語音輸入106的用戶不是位于地理區(qū)域ABC中,則語音識別子系統(tǒng)108可以使用基本語言模型110將語音輸入106轉(zhuǎn)換為文本搜索查詢115。
[0032]因此,如果語音識別子系統(tǒng)108確定提供語音輸入106的用戶位于地理區(qū)域ABC中,則語音識別子系統(tǒng)108在語音識別中應用定制語言模型114,并根據(jù)語音輸入106生成文本串。根據(jù)定制語言模型114中概率值的排序,如果其他一切相同,那么語音輸入106更有可能與(Wx,Wy)而不是與(Wp,Wq,Wr)有關(guān),因為在定制語言模型114中增加的概率值P (Wx, ffy)高于概率值P (ffp, ffq, Wr)。因此,語音識別子系統(tǒng)108將語音輸入106轉(zhuǎn)換為包括詞(Wx,Wy)的文本串,或者提供顯示選項列表,其中將(Wx,Wy)放置為高于(Wp,Wq,Wr),例如,放置在查詢建議列表頂部處或附近,用于用戶選擇文本搜索查詢。
[0033]如果語音識別子系統(tǒng)108確定提供語音輸入106的用戶不是位于與定制語言模型相關(guān)聯(lián)的特定地理區(qū)域中,那么語音識別子系統(tǒng)108在語音識別中應用基本語言模型110,并根據(jù)語音輸入106生成例如包括詞(Wp,Wq,fc)的文本串。
[0034]話音搜索系統(tǒng)102將由語音識別子系統(tǒng)108生成的文本串作為文本搜索查詢115提交給搜索引擎116。文本搜索查詢115可以包括基于定制語言模型114的搜索詞“Wx Wy”,或者基于基本語言模型110的“WpWq Wr”。搜索引擎116可包括耦合到話音搜索系統(tǒng)102的web搜索引擎。話音搜索系統(tǒng)102從搜索引擎116接收一個或多個查詢結(jié)果118,并提供查詢結(jié)果118以用于在呈現(xiàn)界面120上顯示,呈現(xiàn)界面120可以是用戶設備上的組件(例如,web瀏覽器),或者可以是服務器上的組件,例如動態(tài)網(wǎng)頁。呈現(xiàn)界面120可包括顯示接口或話音輸出接口。呈現(xiàn)界面120可以向用戶呈現(xiàn)一個或多個查詢結(jié)果118,例如顯示的查詢結(jié)果頁面122,查詢結(jié)果頁面122例如可包括結(jié)果“Wx Wy餐廳”。
[0035]圖2是圖示用于生成定制語言模型(例如,定制語言模型114)的示例規(guī)則的框圖。實施動態(tài)語言模型的系統(tǒng)獲得基本語言模型202。系統(tǒng)可以從另一系統(tǒng)獲得基本語言模型202ο替代地,系統(tǒng)可以使用公開可用的語言建模技術(shù)(例如,RandLM或者CMU-Cambridge統(tǒng)計語言建模工具包),根據(jù)搜索日志204建立基本語言模型202。系統(tǒng)可以從搜索引擎獲得搜索日志,搜索引擎與系統(tǒng)通信,或者是系統(tǒng)的一部分。在一些實施方式中,系統(tǒng)為系統(tǒng)所支持的每種語言獲得單獨的基本語言模型202。
[0036]系統(tǒng)可以使用地理語言模型規(guī)則206定制基本語言模型202。地理語言模型規(guī)則206包括當詞語序列與指定地理區(qū)域中的地理特征有關(guān),或者是從指定地理區(qū)域接收時,用于調(diào)節(jié)基本語言模型202中詞語序列的概率值的調(diào)節(jié)因素。詞語序列可以借助于例如是地理特征的名稱、地址或者特性而與地理特征相關(guān)。
[0037]地理特征可包括與地理區(qū)域有關(guān)的任何特征或者位于地理區(qū)域處的任何實體。例如,地理特征可包括通常在特定位置出現(xiàn)的企業(yè)、地標、當?shù)卣⒔值?、公園、學?;蛘呤录5乩韰^(qū)域可包括國家、州、縣、城市、企業(yè)區(qū)或者通過瑋度和經(jīng)度確定的坐標方格。
[0038]地理語言模型規(guī)則206可以通過地理區(qū)域分組。對于每個地理區(qū)域,系統(tǒng)將與地理區(qū)域中的地理特征有關(guān)的詞語序列與調(diào)節(jié)因素相關(guān)聯(lián)。調(diào)節(jié)因素可以指示與其他地理區(qū)域相比,來自指定地理區(qū)域的搜索查詢更有可能包括與指定地理區(qū)域中的地理特征有關(guān)的詞語序列的可能性。調(diào)節(jié)因素可包括乘子,在基本語言模型202中乘子應用于與詞語序列相關(guān)聯(lián)的概率值。
[0039]例如,地理語言模型規(guī)則包括用于詞語序列(Wx,Wy)的調(diào)節(jié)因素,在本示例中,詞語序列是位于地理區(qū)域ABC中的企業(yè)的名稱。調(diào)節(jié)因素可包括乘子,乘子增加詞語序列(Wx, Wy)的概率值P (ffx, ffy)。系統(tǒng)將乘子應用于基本語言模型202中的概率值P (ffx, ffy),以創(chuàng)建定制語言模型。定制語言模型可以與地理區(qū)域ABC相關(guān)聯(lián)。當系統(tǒng)確定提供語音輸入(例如,話音查詢)的用戶位于地理區(qū)域ABC中時,系統(tǒng)將定制語言模型用于語音識別。
[0040]系統(tǒng)可以基于來自地理數(shù)據(jù)存儲器208、搜索日志204或者這兩者的信息生成地理語言模型規(guī)則206。地理數(shù)據(jù)存儲器208存儲與每個地理區(qū)域相關(guān)聯(lián)的地理特征的名稱和位置。系統(tǒng)可以從登記的企業(yè)名稱、公開的記錄或者用戶輸入的列表獲得名稱和位置。例如,在地理區(qū)域ABC中具有名稱(Wx,Wy)的餐廳的經(jīng)營者可以將關(guān)聯(lián)于地理區(qū)域ABC的名稱(Wx,Wy)登記在web “黃頁”或者地理數(shù)據(jù)存儲器208中的公共企業(yè)列表的其他數(shù)據(jù)庫?;谠摂?shù)據(jù)庫,系統(tǒng)可將名稱(Wx,Wy)與地理區(qū)域ABC相關(guān)聯(lián)。在地理數(shù)據(jù)存儲器208中存儲的名稱可以被歸一化(例如,去除大寫、拼寫校正,或者其他標準化),以映射到基本語言模型202中的詞語序列。
[0041]系統(tǒng)可以分析搜索日志204,以生成系統(tǒng)用以確定調(diào)節(jié)因素的大小的查詢頻率信息。查詢頻率信息包括通過系統(tǒng)或者通過搜索引擎已經(jīng)接收到特定查詢的次數(shù)的計數(shù)。系統(tǒng)可以使用閾值來過濾查詢頻率信息。系統(tǒng)可以使用閾值來確定是否增加概率值。使用在搜索日志204中存儲的信息,系統(tǒng)可以確定包括從不同位置的用戶接收到的查詢詞(Wx1Wy)的話音或文本搜索查詢的頻率。當用戶位于地理區(qū)域ABC處或者附近時,如果系統(tǒng)確定頻率超過閾值,則系統(tǒng)可以指定具有調(diào)節(jié)因素的地理語言模型規(guī)則,所述調(diào)節(jié)因素增加基本語言模型202中的值P (ffx, ffy)。
[0042]系統(tǒng)可以使用社團語言模型規(guī)則210附加性或替代性地定制基本語言模型202。社團語言模型規(guī)則210包括基于用戶的社團,用于調(diào)節(jié)基本語言模型202中的概率值的調(diào)節(jié)因素?;谟脩鬉的社團中的用戶提交的信息,為用戶A調(diào)節(jié)用于基本語言模型202中的詞語序列的概率值。信息例如可包括社團中的用戶的一個或多個存儲的查詢。
[0043]如果系統(tǒng)以超過閾值的頻率從用戶A的社團當中的用戶接收特定查詢,則系統(tǒng)可以調(diào)節(jié)與查詢相對應的詞語序列的概率值。例如,基于來自用戶A的社團中的用戶的查詢,系統(tǒng)可以確定,系統(tǒng)接收包括詞語序列(Wa,Wb,Wc,Wd)的搜索查詢的閾值數(shù)目。在一些實施方式中,在查詢?nèi)罩局袑⒉樵兡涿沟醚谏w提交用戶(例如,通過從存儲的查詢中消除源標識信息)?;谠摯_定,系統(tǒng)可以調(diào)節(jié)基本語言模型202,以為用戶A、也為用戶A的社團中的用戶增加用于詞語序列(Wa, Wb, Wc, Wd)的概率值。因此,對于用戶A的社團中的用戶,系統(tǒng)可以增加將語音輸入識別為詞語序列(Wa,Wb,Wc,Wd)的可能性,而不是在基本語言模型202中具有較高概率的某些其他詞語序列,例如(We,fff, ffg, Wh)。
[0044]系統(tǒng)可以基于從社團數(shù)據(jù)存儲器212、搜索日志204或者這兩者獲得的信息生成社團語言模型規(guī)則210。社團數(shù)據(jù)存儲器212可以存儲與用戶相關(guān)、并且每個相關(guān)用戶選擇提交給系統(tǒng)用于定制語言模型的信息。信息可包括相連接用戶的圈子,相連接用戶的圈子包括被標識為在社會上連接用戶的一個或多個用戶。可以從社交站點、虛擬群組、虛擬聊天室、聯(lián)系人列表或者以上的任何組合檢索信息。搜索日志204存儲查詢頻率信息,查詢頻率信息可包括通過系統(tǒng)已經(jīng)接收到的特定查詢的次數(shù)的計數(shù),并且對應于用戶社團中的用戶標識符。
[0045]系統(tǒng)可以附加性或替代性地使用事件語言模型規(guī)則214來定制基本語言模型202。事件語言模型規(guī)則214包括調(diào)節(jié)因素,用于調(diào)節(jié)基本語言模型202中的概率值。當詞語序列與流行事件相關(guān)聯(lián)時,可以增加與詞語序列相關(guān)聯(lián)的概率值。系統(tǒng)基于時間數(shù)據(jù)存儲器216、或者搜索日志204、或者這兩者中存儲的信息生成事件語言模型規(guī)則214。指定事件可包括可以影響語音輸入轉(zhuǎn)換為特定詞語序列的概率的任何事件。
[0046]在一些實施方式中,系統(tǒng)基于時間事件調(diào)節(jié)概率值。系統(tǒng)可以基于一天的時刻或者一周的某天來生成事件語言模型規(guī)則214。例如,系統(tǒng)可以確定在一天的指定時刻(例如,在中午和下午I點之間,或者在下午6點與下午8點之間),系統(tǒng)接收與餐廳有關(guān)的查詢的數(shù)目或百分比,其中,數(shù)目或百分比超過閾值。系統(tǒng)可以基于數(shù)目或百分比,增加與餐廳有關(guān)的基本語言模型202中詞語序列的概率值。
[0047]在一些實施方式中,系統(tǒng)基于氣象事件調(diào)節(jié)概率值。系統(tǒng)可以基于氣象信息生成事件語言模型規(guī)則214??蓪⑾到y(tǒng)配置為使得在給定的氣象條件下,向詞語序列的指定集合給予經(jīng)過調(diào)節(jié)的概率值。事件數(shù)據(jù)存儲器216可包括從一個或多個氣象服務接收到的信息。當每個氣象服務提供下雨的概率超過指定閾值的氣象預報時,可以向有關(guān)于道路條件報道、洪水警告或者屋頂修繕的服務的名稱給予較高的加權(quán)。
[0048]在一些實施方式中,系統(tǒng)使用流行新聞事件。系統(tǒng)可以基于一個或多個新聞報道中主題的流行性生成特定事件語言模型規(guī)則214。例如,事件數(shù)據(jù)存儲器216可以存儲來自不同新聞源的信息。當詞語序列以超過閾值的頻率在新聞源中出現(xiàn)時,系統(tǒng)可以生成事件語言模型規(guī)則214,該事件語言模型規(guī)則214增加與詞語序列相關(guān)聯(lián)的概率值。
[0049]圖3是圖示基于地理信息的示例動態(tài)語言模型的視圖。在基于地理信息實施動態(tài)語言模型的系統(tǒng)中,系統(tǒng)通過地理信息來注釋詞語序列。在查詢時間,系統(tǒng)基于從其接收語音輸入的用戶設備的地理位置來使用動態(tài)語言模型。
[0050]系統(tǒng)包括位置接口,該位置接口被配置為接收來自用戶設備的位置信息。在一些實施方式中,位置接口可包括配置為接收來自位置已知的用戶設備的瑋度、經(jīng)度或海拔信息的各種模塊。在一些實施方式中,位置接口可包括配置為基于用戶設備的互聯(lián)網(wǎng)協(xié)議(IP)地址、用戶設備所連接的無線接入點或者其他信息來確定用戶設備的位置的各種模塊。當用戶設備位于不同的地理位置時,系統(tǒng)可將相同的語音輸入轉(zhuǎn)換為不同的文本搜索查詢。
[0051]系統(tǒng)將地理區(qū)域劃分為虛擬塊的集合310。虛擬塊的集合310的每個塊可以對應于為塊定制的語言模型??梢曰诿總€塊的中心的瑋度和經(jīng)度坐標或者每個塊的一個或多個頂點來限定所述塊。在一些實施方式中,可以基于每個塊的角以及塊尺寸來限定所述塊。可以按照公里、英里或者瑋度或經(jīng)度的度數(shù)來限定塊尺寸。
[0052]系統(tǒng)標識位于虛擬塊的集合310的塊7的實體312。實體312可以是與塊7永久性或者基本上永久性關(guān)聯(lián)的特征。例如,實體312可以是位于塊7中的企業(yè),企業(yè)具有在系統(tǒng)中登記或者在耦合到系統(tǒng)的記錄器中登記的企業(yè)名稱,例如,詞語序列(Wx,Wy)。系統(tǒng)可以創(chuàng)建與塊7相關(guān)聯(lián)的動態(tài)語言模型。在此動態(tài)語言模型中,通過乘子調(diào)節(jié)與實體相關(guān)聯(lián)的詞語序列的概率值P (Wx, ffy),使得增加概率值。
[0053]系統(tǒng)可以為虛擬塊的集合310的每個塊創(chuàng)建定制語言模型。在每個定制語言模型中,通過基于塊7與動態(tài)語言模型所關(guān)聯(lián)的塊之間的距離確定的量,調(diào)節(jié)與實體312相關(guān)聯(lián)的詞語序列的概率值。特別地,可以基于距離將量打折。距離例如可以是歐幾里得距離、曼哈頓距離或者通過估計的行進時間測量的距離。對于是塊7的近鄰的那些塊(例如,塊4、5和8),對應的動態(tài)語言模型可以具有用于概率值P(Wx,Wy)的第一調(diào)節(jié)量。對于是塊7的遠鄰的那些塊(例如,塊1_3、6和9),對應的動態(tài)語言模型可以具有用于概率值P(Wx,Wy)的第二調(diào)節(jié)量,其中第二調(diào)節(jié)量小于第一調(diào)節(jié)量。對于遠離塊7的那些塊(未示出),概率值P (ffx, ffy)可以保持不調(diào)節(jié)。
[0054]當系統(tǒng)接收來自用戶設備的語音輸入時,系統(tǒng)確定用戶設備位于虛擬塊的集合310的哪一個。然后系統(tǒng)應用與塊相關(guān)聯(lián)的語言模型,將語音輸入轉(zhuǎn)換為文本搜索查詢。
[0055]圖4是圖示基于用戶的社團的示例動態(tài)語言模型400的視圖。對于給定用戶,當通過用戶的社團中的用戶以滿足閾值的頻率使用詞語序列時,系統(tǒng)調(diào)節(jié)語言模型中詞語序列的概率值。頻率可以是絕對頻率或相對頻率。
[0056]系統(tǒng)可以接收特定社交站點的登記用戶(用戶A)的用戶數(shù)據(jù)402。用戶數(shù)據(jù)402可包括用于用戶A的用戶標識符,以及在用戶A請求語音識別改善之后通過用戶A提交的用戶信息。用戶信息例如可包括用戶的家庭位置、用戶喜好以及與用戶相關(guān)聯(lián)的其他信息。
[0057]系統(tǒng)基于用戶數(shù)據(jù)402生成用于用戶A的語言模型調(diào)節(jié)規(guī)則404。系統(tǒng)可以基于位置、喜好以及其他信息來生成語言模型調(diào)節(jié)規(guī)則。例如,如果用戶A提交了包括特定查詢詞的查詢,并且如果用戶A提交了該查詢指定次數(shù)(例如,一次,或者一次以上),則系統(tǒng)可以創(chuàng)建語言模型調(diào)節(jié)規(guī)則404中的規(guī)則,增加包括查詢詞的詞語序列的概率。
[0058]系統(tǒng)可以基于用戶提供或授權(quán)的用戶數(shù)據(jù)402標識用戶A的社交網(wǎng)絡。社交網(wǎng)絡可包括用戶指定的社交連接圈子(例如,朋友圈),基于用戶A的聯(lián)系人列表的用戶的列表,或者基于用戶與用戶A之間的常見活動(例如,聊天室參與)的用戶的列表。系統(tǒng)可以確定用戶與用戶A之間的關(guān)系程度。例如,系統(tǒng)可以確定用戶B和用戶C與用戶A直接相關(guān),并且因此以第一程度與用戶A相關(guān)。系統(tǒng)可以確定用戶D、E、F和G通過用戶B和用戶C與用戶A相關(guān),并且因此以第二程度與用戶A相關(guān)。
[0059]在用戶A的社交網(wǎng)絡中的用戶(用戶B到用戶G)請求為他們以及他們的社交連接圈子中的用戶改善語音識別之后,系統(tǒng)接收來自這些用戶的用戶數(shù)據(jù)412、414、416、418、420和422。系統(tǒng)可以對于用戶B到用戶G分別創(chuàng)建模型調(diào)節(jié)規(guī)則432、434、436、438、440和442。系統(tǒng)可以基于用戶數(shù)據(jù)412-422,或者模型調(diào)節(jié)規(guī)則4320442,或者這兩者生成語言模型調(diào)節(jié)規(guī)則404的至少一部分。
[0060]在一些實施方式中,系統(tǒng)使用用戶的社交連接的查詢來建立定制語言模型。例如,根據(jù)用戶數(shù)據(jù)412,用戶B已經(jīng)使用包含某些查詢詞的查詢執(zhí)行搜索一次或以上。系統(tǒng)基于用戶B的搜索頻率以及用戶B與用戶A之間的關(guān)系程度,增加包括查詢詞的詞語序列的概率值。
[0061 ] 在一些實施方式中,系統(tǒng)使用除了用戶朋友的查詢之外的信息來建立定制語言模型。例如,如果用戶B和用戶C在有用戶A的參與或者沒有用戶A的參與的情況下討論了具有名稱“Wx Wy”的餐廳,或者已經(jīng)使用查詢“Wx Wy”搜索,那么系統(tǒng)可以為用戶A在定制語言模型中增加用于詞語序列(Wx,Wy)的概率。
[0062]用戶A的社交網(wǎng)絡的應用可以基于每個用戶的隱私設置。例如,如果每個用戶B和用戶C允許在朋友圈當中共享搜索信息,或者如果每個用戶B和用戶C允許使用用戶信息來調(diào)整朋友的語言模型,那么系統(tǒng)可以使用用戶B和用戶C的搜索來調(diào)節(jié)用戶A的語言模型。
[0063]系統(tǒng)可以基于關(guān)系程度來確定調(diào)節(jié)量。較低的關(guān)系程度表示兩個用戶之間較近的關(guān)系,并且可以指示兩個用戶共享興趣和搜索習慣的較高可能性。因此,當關(guān)系程度增加時,系統(tǒng)減少調(diào)節(jié)量。例如,如果增加是基于用戶B執(zhí)行的查詢,那么系統(tǒng)可以以第一量為用戶A增加用于詞語序列的概率值。如果增加是基于用戶D執(zhí)行的查詢,那么系統(tǒng)可以以第二量為用戶A增加用于詞語序列的概率值。第一量可以大于第二量。
[0064]系統(tǒng)可以使用在查詢時間標識的語言模型調(diào)節(jié)規(guī)則404來定制基本語言模型,或者在查詢時間之前存儲定制的語言模型。當系統(tǒng)接收來自用戶A的語音輸入時,系統(tǒng)可以基于用戶A的標識符來標識用于用戶A的語言模型調(diào)節(jié)規(guī)則404,并使用語言模型調(diào)節(jié)規(guī)則404來定制基本語言模型。替代性或附加性地,系統(tǒng)可以使用專用于用戶A的預先存儲的定制語言模型來執(zhí)行語音識別。
[0065]圖5A和圖5B是圖示動態(tài)語言模型的示例實施方式的框圖。實施動態(tài)語言模型技術(shù)的系統(tǒng)可以采用參照圖5A、圖5B所述的實施方式,或者兩者的組合。
[0066]圖5A是圖示系統(tǒng)創(chuàng)建與話音查詢不同步(例如,在除了響應于接收的查詢之外的某個時間)的定制語言模型502、504、506和508的示例實施方式的框圖500。每個定制語言模型502、504、506和508包括基本語言模型中的詞語序列的一部分或全部,并且與用于應用定制語言模型的一個或多個準則相關(guān)聯(lián)?;趹脺蕜t確定定制語言模型中與各個詞語序列相關(guān)聯(lián)的概率值。每個應用準則可以指定位置、時間、氣象或其他因素(例如,通過年齡、性別、收入水平或者普通人群的購買習慣限定的用戶分段)。例如,動態(tài)語言模型506與應用準則相關(guān)聯(lián),所述應用準則在指定的氣象條件下指定在指定的時間窗口中的指定位置應用動態(tài)語言模型506。系統(tǒng)可以周期性地或者通過觸發(fā)事件建立或者更新定制語言模型502、504、506和508。觸發(fā)事件例如可包括已經(jīng)實施的劃分用戶的新方式。
[0067]在查詢時間,系統(tǒng)接收語音輸入并獲得語音輸入的場境。例如,系統(tǒng)可以確定用戶的位置、語音輸入的時間,并基于位置和時間檢索來自氣象服務的氣象信息。當用戶登錄系統(tǒng)時,系統(tǒng)可以使用與由用戶提供的用戶標識符相關(guān)聯(lián)的簡檔標識用戶所屬的用戶分段。系統(tǒng)將場境提交給語言模型選擇器510。語言模型選擇器510是系統(tǒng)的組件,其被配置為將語音輸入的場境與關(guān)聯(lián)于定制語言模型502、504、506或508的應用準則匹配,并基于該匹配來標識動態(tài)語言模型。
[0068]例如,系統(tǒng)可以接收用戶位置、查詢時間以及用戶位置處的查詢時間氣象。語言模型選擇器510可以確定用戶位置與關(guān)聯(lián)于動態(tài)語言模型506的應用準則的可應用位置相交,查詢時間在應用準則的可應用時間窗口中,并且用戶位置處的查詢時間氣象與應用準則的可應用氣象匹配。因此,語言模型選擇器510選擇定制語言模型506。然后系統(tǒng)執(zhí)行語音識別,以使用定制語言模型506將用戶的語音輸入轉(zhuǎn)換為文本搜索查詢。例如,如果系統(tǒng)在不同位置或者在不同時間接收相同的語音輸入,則系統(tǒng)可以應用不同的語言模型(例如,語言模型504)。
[0069]圖5B是圖示系統(tǒng)動態(tài)地調(diào)節(jié)語言模型522的示例實施方式的框圖520。語言模型522可以是基本語言模型或者定制語言模型。
[0070]系統(tǒng)包括語言模型修改器524。語言模型修改器是用戶設備或者服務器設備的組件,其被配置為應用一個或多個規(guī)則526來調(diào)節(jié)語言模型522。語言模型修改器524接收來自一個或多個用戶的輸入,包括個性化信息、位置信息、日期/時間信息、氣象信息、近期新聞/當前事務信息或者查詢流。語言模型修改器524基于輸入將規(guī)則526應用于語言模型522。在應用規(guī)則526之后,語言模型522可以變?yōu)槎ㄖ普Z言模型。
[0071]例如,規(guī)則526中的一個可以指定,當詞在指定時間周期(例如,將規(guī)則526應用于語言模型522之前的最后3天)中并且以滿足閾值的頻率出現(xiàn)時,系統(tǒng)增加包括該詞的詞語序列的概率值。另一個規(guī)則可以指定,如果用戶選擇允許系統(tǒng)收集信息,則用戶可以允許系統(tǒng)分析用戶在過去提交的查詢,并確定與用戶相關(guān)聯(lián)的搜索模式。
[0072]在一些實施方式中,語言模型修改器524可以在查詢時間調(diào)節(jié)語言模型522。在一些實施方式中,語言模型修改器524可以對于特定用戶或者響應于特定的當前事件,創(chuàng)建定制語言模型,并將定制語言模型存儲于用戶設備或者服務器設備上。
[0073]圖6是用于使用定制語言模型的示例方法600的流程圖。為了方便起見,例如將針對如上所述執(zhí)行方法600的系統(tǒng)來描述方法。系統(tǒng)接收(602)用于語音識別的基本語言模型?;菊Z言模型包括多個詞語序列,每個詞語序列與概率值相關(guān)聯(lián)。詞語序列可以表示為文本串、壓縮文本串、對象或者索引?;菊Z言模型可以根據(jù)用戶的集合的匿名查詢?nèi)罩緛砩伞?br> [0074]系統(tǒng)接收(604)話音搜索查詢。話音搜索查詢與查詢場境相關(guān)聯(lián)。查詢場境可包括從其接收話音搜索查詢的用戶設備的地理位置。地理位置可以是點或地理區(qū)域。點或地理區(qū)域例如通過瑋度、經(jīng)度或海拔坐標的一個或多個集合來限定。查詢場境例如可以包括查詢的時間戳,或者提供話音搜索查詢的用戶的用戶標識符。
[0075]系統(tǒng)確定(605)當查詢場境滿足與定制語言模型相關(guān)聯(lián)的一個或多個準則時要使用定制語言模型。如果查詢場境不滿足任何準則,那么系統(tǒng)可以使用基本語言模型,以將話音搜索查詢轉(zhuǎn)換為文本搜索查詢。
[0076]系統(tǒng)獲得(606)定制語言模型。定制語言模型包括與經(jīng)過調(diào)節(jié)的概率值相對應的一個或多個詞語序列。經(jīng)過調(diào)節(jié)的概率值是當查詢場境與一個或多個調(diào)節(jié)準則匹配時基本概率值被根據(jù)查詢場境來調(diào)節(jié)的。獲得定制語言模型可包括以下至少其中一個:(I)基于查詢場境從一個或多個預先存儲的定制語言模型選擇定制語言模型;或者(2)使用一個或多個語言調(diào)節(jié)規(guī)則,基于接收的查詢場境,調(diào)節(jié)查詢時間的基本語言模型,以生成定制語言模型。定制語言模型可以如同以上針對圖1至圖5所述來獲得。
[0077]在一些實施方式中,查詢場境包括從其接收話音搜索查詢的用戶設備的地理位置。系統(tǒng)可以標識與地理位置相關(guān)的一個或多個詞語序列。詞語序列的經(jīng)過調(diào)節(jié)的概率值包括基于詞語序列與地理位置之間的關(guān)系程度調(diào)節(jié)的概率值。例如,詞語序列可包括位于用戶設備的地理位置處或者附近的特征(例如,企業(yè)、公園或街道)的名稱。在查詢場境中基于特征與地理位置之間的距離來確定關(guān)系程度。地理位置可以是通過瑋度、經(jīng)度或海拔坐標的一個或多個集合限定的地理區(qū)域。
[0078]在一些實施方式中,詞語序列包括以超過閾值的頻率從地理位置接收的過去查詢的詞?;陬l率確定關(guān)系程度。例如,如果系統(tǒng)接收在特定位置包括詞“氣候最好由政府試驗”的查詢足夠數(shù)目或百分比,那么系統(tǒng)可以在與特定位置相關(guān)聯(lián)的定制語言模型中增加用于詞語序列“氣候最好由政府試驗”的概率值。在一些實施方式中,數(shù)目或百分比越高,增加概率值就越高。
[0079]在一些實施方式中,查詢場境包括用于與話音搜索查詢相關(guān)聯(lián)的用戶提供的標識符(例如,用戶名或用戶標識符)。系統(tǒng)確定與用戶提供的標識符相關(guān)聯(lián)的社團。社團可以是存儲的用戶的社交網(wǎng)絡。社團可包括在社交網(wǎng)絡中與用戶提供的標識符相關(guān)的一個或多個用戶標識符。系統(tǒng)使用存儲的與社團中的用戶標識符相關(guān)聯(lián)的查詢?nèi)罩緛泶_定詞語序列的出現(xiàn)頻率,并基于出現(xiàn)頻率來調(diào)節(jié)基本概率值。例如,系統(tǒng)可以確定在有關(guān)于教養(yǎng)的團體中高頻出現(xiàn)包括搜索詞“游泳比賽”的搜索查詢,或者是話音,或者是文本。系統(tǒng)可以創(chuàng)建定制語言模型,其中用于詞語序列“游泳比賽”的概率值高于基本語言模型中的概率值,并將定制語言模型應用于通過教養(yǎng)團體(parenting group)中的用戶輸入的語音輸入。系統(tǒng)可以附加性或替代性地基于社團中的關(guān)系程度來調(diào)節(jié)基本概率值。
[0080]在一些實施方式中,查詢場境包括話音搜索查詢的時間戳。獲得定制語言模型包括標識一個或多個電子文檔(例如,新聞文章)。根據(jù)查詢?nèi)罩?,電子文檔個別地或者作為集合與搜索查詢的數(shù)目相關(guān)聯(lián)。如果通過搜索引擎將電子文檔指定為查詢的搜索結(jié)果,或者通過用戶從搜索結(jié)果的列表將電子文檔選擇為目的地,就可以將它與查詢相關(guān)聯(lián)。系統(tǒng)標識分別包括一個或多個詞語序列的電子文檔。如果根據(jù)時間戳,關(guān)聯(lián)的搜索查詢在指定的時間窗口(例如,一天或一周)中出現(xiàn),那么系統(tǒng)可以在定制語言模型中增加與一個或多個詞語序列相關(guān)聯(lián)的概率值。例如,如果對于一時間周期,許多教育相關(guān)的新聞文章包括詞語序列“虎媽”,那么在基本語言模型中可能與低概率值相關(guān)聯(lián)的詞語序列“虎媽”在定制語言模型中可以與高概率值相關(guān)聯(lián)。
[0081]系統(tǒng)基于定制語言模型中對應的經(jīng)過調(diào)節(jié)的概率值,將話音搜索查詢轉(zhuǎn)換為(608)包括詞語序列的文本搜索查詢。系統(tǒng)可以提供(610)文本搜索查詢的一個或多個搜索結(jié)果,作為對話音搜索查詢的響應,用于在顯示設備上顯示。
[0082]本主題的實施例以及本說明書中所描述的操作可以在數(shù)字電子電路中實施,或者在計算機軟件、固件或硬件中實施,包括本說明書中公開的結(jié)構(gòu)以及它們的結(jié)構(gòu)性等同物,或者它們的一個或多個的組合。本說明書中所描述的本主題的實施例可以實施為一個或多個計算機程序,即,在計算機存儲介質(zhì)上編碼、用于通過數(shù)據(jù)處理裝置執(zhí)行,或者控制數(shù)據(jù)處理裝置的操作的計算機程序指令的一個或多個模塊。替代性或附加性地,可以在人工生成的傳播信號(例如,機器生成的電學、光學或電磁學信號)上將程序指令編碼,生成傳播信號從而將信息編碼,用于傳輸給合適的接收器裝置,用于由數(shù)據(jù)處理裝置執(zhí)行。計算機存儲介質(zhì)可以是或者包括在計算機可讀存儲設備、計算機可讀存儲襯底、隨機或串行訪問存儲器陣列或設備、或者它們的一個或多個的組合。此外,雖然計算機存儲介質(zhì)并非傳播信號,但是計算機存儲介質(zhì)可以是在人工生成的傳播信號中編碼的計算機程序指令的源或目的地。計算機存儲介質(zhì)也可以是或者包括在一個或多個單獨的物理組件或介質(zhì)中,例如,多個⑶、磁盤或其他存儲設備。
[0083]本說明書中所描述的操作可以實施為通過數(shù)據(jù)處理裝置對于一個或多個計算機可讀存儲設備上存儲的數(shù)據(jù)或者從其他源接收的數(shù)據(jù)執(zhí)行的操作。
[0084]術(shù)語“數(shù)據(jù)處理裝置”涵蓋用于處理數(shù)據(jù)的所有種類的裝置、設備和機器,作為示例,包括可編程處理單元、計算機、芯片上系統(tǒng)、個人計算機系統(tǒng)、臺式計算機、膝上型電腦、筆記本電腦、網(wǎng)絡本電腦、主機計算機系統(tǒng)、手持計算機、工作站、網(wǎng)絡計算機、應用服務器、存儲設備、消費電子設備(諸如相機、錄像機、機頂盒、移動設備、視頻游戲控制臺、手持視頻游戲設備)、外設(諸如交換機、調(diào)制解調(diào)器、路由器),或者通常是任何類型的計算設備或電子設備,或者是前述的多個或組合。所述裝置可包括專用邏輯電路,例如FPGA(現(xiàn)場可編程門陣列)或者ASIC(專用集成電路)。除了硬件之外,所述裝置也可包括創(chuàng)建用于所討論的計算機程序的執(zhí)行環(huán)境的代碼,例如,構(gòu)成處理器固件、協(xié)議棧、數(shù)據(jù)庫管理系統(tǒng)、操作系統(tǒng)、跨平臺運行時間環(huán)境、虛擬機、或者它們的一個或多個的組合的代碼。裝置和執(zhí)行環(huán)境可以實現(xiàn)各種不同的計算模型基礎結(jié)構(gòu),諸如web服務、分布式計算和網(wǎng)格計算基礎結(jié)構(gòu)。
[0085]計算機程序(也稱為程序、軟件、軟件應用、腳本或代碼)可以按照任何形式的編程語言來編寫,包括編譯或解釋語言、聲明性或程序性語言,并且它可以按照任何形式部署,包括作為獨立程序,或者作為模塊、組件、子例程、對象或適合于在計算環(huán)境中使用的其他單元。計算機程序可以但是不一定對應于文件系統(tǒng)中的文件??蓪⒊绦虼鎯υ诒4嫫渌绦蚧驍?shù)據(jù)的一部分文件中(例如,存儲在標記語言文檔中的一個或多個腳本)、存儲在專用于所討論的程序的單個文件中、或者存儲在多個協(xié)同的文件中(例如,存儲一個或多個模塊、子程序或部分代碼的文件)。可將計算機程序部署為在一個計算機上執(zhí)行,或者在位于一個地點或分布于多個地點并通過通信網(wǎng)絡互連的多個計算機上執(zhí)行。
[0086]本說明書所述的處理和邏輯流程可通過執(zhí)行一個或多個計算機程序的一個或多個可編程處理器來執(zhí)行,以通過在輸入數(shù)據(jù)上操作并生成輸出來執(zhí)行動作。處理和邏輯流程也可通過專用邏輯電路進行,并且裝置也可實施為專用邏輯電路,例如FPGA(現(xiàn)場可編程門陣列)或者ASIC(專用集成電路)。
[0087]作為示例,適合于執(zhí)行計算機程序的處理單元包括通用和專用微處理器兩者,以及任何種類的數(shù)字計算機的任何一個或多個處理單元。一般而言,處理單元將接收來自只讀存儲器或隨機訪問存儲器或者兩者的指令和數(shù)據(jù)。計算機的必要元件是用于根據(jù)指令執(zhí)行動作的處理器以及用于存儲指令和數(shù)據(jù)的一個或多個存儲器設備。一般而言,計算機也可包括用于存儲數(shù)據(jù)的一個或多個大容量存儲設備(例如,磁盤、磁光盤、或光盤),或者可操作地耦合到一個或多個大容量存儲設備,以往來接收或傳送數(shù)據(jù)或者皆可。但是,計算機不一定具有這樣的設備。此外,可將計算機嵌入另一個設備中,例如移動電話、個人數(shù)字助理(PDA)、移動音頻或視頻播放器、游戲控制臺、全球定位系統(tǒng)(GPS)接收器、網(wǎng)絡路由設備、或者便攜存儲設備(例如,通用串行總線(USB)閃存驅(qū)動器),僅舉幾例。適合于存儲計算機程序指令和數(shù)據(jù)的設備包括所有形式的非易失性存儲器、介質(zhì)和存儲器設備,作為示例,包括半導體存儲器設備,例如EPROM、EEPROM以及閃存存儲器設備;磁盤,例如內(nèi)部硬盤或者可拆卸盤;磁光盤;以及CD ROM和DVD-ROM盤。處理單元和存儲器可以通過專用邏輯電路來補充,或者合并在其中。
[0088]為了提供與用戶的互動,本說明書中所述本主題的實施例可以在具有顯示設備(例如,CRT(陰極射線管)或LCD(液晶顯示器)監(jiān)視器,用于向用戶顯示信息)以及鍵盤和點擊設備(例如,鼠標或軌跡球,用戶可以由其向計算機提供輸入)的計算機上實施。也可將其他種類的設備用于提供與用戶的互動;例如,提供給用戶的反饋可以是任何形式的傳感器反饋,例如視覺反饋、聽覺反饋或觸覺反饋;并且可以按照任何形式接收來自用戶的輸入,包括聲學、語言或觸覺輸入。此外,計算機可通過與用戶使用的設備往來發(fā)送文檔和接收文檔,與用戶互動;例如,通過響應于從web瀏覽器接收的請求,向用戶的客戶端設備上的web瀏覽器發(fā)送網(wǎng)頁。
[0089]本說明書中所述本主題的實施例可以在包括后端組件(例如,作為數(shù)據(jù)服務器)的計算系統(tǒng)、或者包括中間件組件(例如,應用服務器)的計算系統(tǒng)、或者包括前端組件(例如,具有圖形用戶接口的客戶端計算機或者用戶可以由其與本說明書中所述本主題的實施方式互動的網(wǎng)絡瀏覽器)或路由設備(例如,網(wǎng)絡路由器)的計算系統(tǒng)中實施,或者在一個或多個這樣的后端、中間件或前端組件的任何組合中實施。系統(tǒng)的組件可以通過數(shù)字數(shù)據(jù)通信的任何形式或介質(zhì)(例如,通信網(wǎng)絡)來互連。通信網(wǎng)絡的示例包括局域網(wǎng)(“LAN”)和廣域網(wǎng)(“WAN”)、互連網(wǎng)絡(例如互聯(lián)網(wǎng))以及對等網(wǎng)絡(例如,自組織對等網(wǎng)絡)。
[0090]計算系統(tǒng)可包括客戶端和服務器。客戶端和服務器通常相互遠離且典型地通過通信網(wǎng)絡互動??蛻舳撕头掌鞯年P(guān)系借助于各個計算機上執(zhí)行且相互具有客戶端-服務器關(guān)系的計算機程序而發(fā)生。在一些實施例中,服務器(例如,為了向與客戶端設備交互的用戶顯示數(shù)據(jù)以及從用戶接收用戶輸入的目的)向客戶端設備傳輸數(shù)據(jù)(例如,HTML網(wǎng)頁)。在客戶端設備生成的數(shù)據(jù)(例如,用戶互動的結(jié)果)可以在服務器處從客戶端設備接收。
[0091]一個或多個計算機的系統(tǒng)可以被配置為借助于將在操作中使得系統(tǒng)執(zhí)行動作的軟件、固件、硬件或者它們的組合安裝在系統(tǒng)上而執(zhí)行特定動作。一個或多個計算機程序可以被配置為借助于包括指令而執(zhí)行特定動作,當通過數(shù)據(jù)處理裝置執(zhí)行時,指令使得所述裝置執(zhí)行動作。
[0092]電子文檔(為了簡單起見,簡稱為文檔)可以對應于文件A,但是并非需要??梢栽趯S糜谟懻撝械奈臋n的單個文件中,或者在多個協(xié)作的文件中,將文檔存儲在保存其他文檔的一部分文件中。
[0093]雖然本說明書包含【具體實施方式】的很多細節(jié),但是這些不應被視為對于任何發(fā)明或者任何權(quán)利要求所主張的范圍的限制,而是專用于特定發(fā)明的特定實施例的特征的描述。在單獨實施例的背景下,在本說明書中所述的某些特征也可以在單個實施例中組合實施。相反,在單個實施例的背景下所述的各個特征也可以獨立地在多個實施例中實施,或者按照任何適合的子組合實施。此外,雖然上面將特征描述為在某些組合中起作用,甚至一開始就這樣主張,但是在一些情況下可將來自所主張組合的一個或多個特征從組合中刪除,并且所主張的組合可以指向子組合或者子組合的變型。
[0094]類似地,雖然在附圖中按照特定順序描述操作,但是不應將此理解為要求按照所示特定順序或者按照連續(xù)的順序執(zhí)行這樣的操作,或者要求執(zhí)行全部所示操作,以得到期望的結(jié)果。在某些情況下,多任務和平行處理可以是有利的。此外,不應將上述實施例中各種系統(tǒng)組件的分離理解為在所有實施例中都要求這樣的分離,而是應當理解為所描述的程序組件和系統(tǒng)可以一般性地一起集成在單個軟件產(chǎn)品中或者打包在多個軟件產(chǎn)品中。
[0095]因此,已經(jīng)描述了本主題的特定實施例。其他實施例也落入所附權(quán)利要求書的范圍中。在一些情況下,可以按照不同的順序執(zhí)行權(quán)利要求中引用的動作,且仍然得到期望的結(jié)果。此外,附圖中所示處理不一定要求所示的特定順序或連續(xù)順序,以得到期望的結(jié)果。在某些實施方式中,多任務和平行處理可以是有利的。因此,其他實施例在所附權(quán)利要求書的范圍內(nèi)。
【權(quán)利要求】
1.一種方法,包括: 接收用于語音識別的基本語言模型,所述基本語言模型包括具有基本概率值的第一詞語序列; 接收話音搜索查詢,所述話音搜索查詢與查詢場境相關(guān)聯(lián); 當所述查詢場境滿足與定制語言模型相關(guān)聯(lián)的一個或多個準則時,確定要使用所述定制語言模型; 獲得所述定制語言模型,所述定制語言模型包括具有經(jīng)過調(diào)節(jié)的概率值的所述第一詞語序列,所述經(jīng)過調(diào)節(jié)的概率值是所述基本概率值被根據(jù)所述查詢場境來調(diào)節(jié)的;以及 基于一個或多個概率,將所述話音搜索查詢轉(zhuǎn)換為文本搜索查詢,所述一個或多個概率的每一個對應于一個或多個詞語序列的群組中的詞語序列,所述一個或多個詞語序列的群組包括所述具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列。
2.根據(jù)權(quán)利要求1所述的方法,其中獲得所述定制語言模型包括: 基于所述查詢場境從一個或多個定制語言模型中選擇所述定制語言模型。
3.根據(jù)權(quán)利要求1所述的方法,其中獲得所述定制語言模型包括: 使用一個或多個語言調(diào)節(jié)規(guī)則,基于接收到的查詢場境來調(diào)節(jié)所述基本語言模型。
4.根據(jù)權(quán)利要求1所述的方法,其中所述查詢場境包括用戶設備的地理位置,其中所述話音搜索查詢是從所述用戶設備接收的。
5.根據(jù)權(quán)利要求4所述的方法,包括: 確定所述詞語序列與所述地理位置相關(guān),其中所述經(jīng)過調(diào)節(jié)的概率值包括所述基本概率值被基于所述詞語序列與所述地理位置之間的關(guān)系程度來調(diào)節(jié)。
6.根據(jù)權(quán)利要求5所述的方法,其中: 所述詞語序列包括位于所述地理位置處或者接近所述地理位置的特征的名稱;以及 所述關(guān)系程度是在所述查詢場境中基于所述特征與所述地理位置之間的距離來確定的。
7.根據(jù)權(quán)利要求5所述的方法,其中: 所述詞語序列包括以超過閾值的頻率從所述地理位置接收到的過去查詢的詞;以及 所述關(guān)系程度是基于所述頻率來確定的。
8.根據(jù)權(quán)利要求4所述的方法,其中所述地理位置是通過一組或多組經(jīng)瑋度坐標來限定的地理區(qū)域。
9.根據(jù)權(quán)利要求1所述的方法,其中所述查詢場境包括用于與所述話音搜索查詢相關(guān)聯(lián)的用戶提供的標識符。
10.根據(jù)權(quán)利要求9所述的方法,包括: 確定與所述用戶提供的標識符相關(guān)聯(lián)的社團,所述社團包括與所述用戶提供的標識符有關(guān)的一個或多個用戶標識符; 使用與所述社團中的所述用戶標識符相關(guān)聯(lián)的存儲的查詢?nèi)罩?,確定所述詞語序列的出現(xiàn)頻率;以及 基于所述出現(xiàn)頻率調(diào)節(jié)所述基本概率值。
11.根據(jù)權(quán)利要求10所述的方法,其中調(diào)節(jié)所述基本概率值還基于每個所述用戶標識符與所述用戶提供的標識符之間在所述社團中的關(guān)系程度。
12.根據(jù)權(quán)利要求1所述的方法,其中所述查詢場境包括所述話音搜索查詢的時間戳。
13.根據(jù)權(quán)利要求12所述的方法,其中獲得所述定制語言模型包括: 標識一個或多個電子文檔,所述一個或多個電子文檔根據(jù)查詢?nèi)罩九c搜索查詢的數(shù)目相關(guān)聯(lián),所述搜索查詢的數(shù)目滿足閾值數(shù)目,所述搜索查詢在所述時間戳的指定時間窗口中出現(xiàn),所述一個或多個電子文檔的每一個包括所述詞語序列;以及 基于所述搜索查詢的數(shù)目調(diào)節(jié)所述基本概率值。
14.根據(jù)權(quán)利要求13所述的方法,其中所述一個或多個電子文檔的每一個是新聞文早。
15.根據(jù)權(quán)利要求1所述的方法,包括: 在顯示設備上提供所述文本搜索查詢的一個或多個搜索結(jié)果以供顯示,作為對于所述話音搜索查詢的響應。
16.根據(jù)權(quán)利要求1所述的方法,其中將所述話音搜索查詢轉(zhuǎn)換為文本搜索查詢包括:基于所述定制語言模型中對應的經(jīng)過調(diào)節(jié)的概率值,將所述話音搜索查詢轉(zhuǎn)換為包括所述第一詞語序列的文本搜索查詢。
17.一種系統(tǒng),包括: 一個或多個計算機以及存儲指令的一個或多個存儲設備,當由所述一個或多個計算機執(zhí)行時,所述指令能操作為使得所述一個或多個計算機執(zhí)行以下操作,包括: 接收用于語音識別的基本語言模型,所述基本語言模型包括具有基本概率值的第一詞語序列; 接收話音搜索查詢,所述話音搜索查詢與查詢場境相關(guān)聯(lián); 當所述查詢場境滿足與定制語言模型相關(guān)聯(lián)的一個或多個準則時,確定要使用所述定制語言模型; 獲得所述定制語言模型,所述定制語言模型包括具有經(jīng)過調(diào)節(jié)的概率值的所述第一詞語序列,所述經(jīng)過調(diào)節(jié)的概率值是所述基本概率值被根據(jù)所述查詢場境來調(diào)節(jié)的;以及 基于一個或多個概率,將所述話音搜索查詢轉(zhuǎn)換為文本搜索查詢,所述一個或多個概率的每一個對應于一個或多個詞語序列的群組中的詞語序列,所述一個或多個詞語序列的群組包括所述具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列。
18.—種編碼有計算機程序的計算機存儲介質(zhì),所述程序包括指令,當由數(shù)據(jù)處理裝置執(zhí)行時,所述指令能操作為使得所述數(shù)據(jù)處理裝置執(zhí)行以下操作,包括: 接收用于語音識別的基本語言模型,所述基本語言模型包括具有基本概率值的第一詞語序列; 接收話音搜索查詢,所述話音搜索查詢與查詢場境相關(guān)聯(lián); 當所述查詢場境滿足與定制語言模型相關(guān)聯(lián)的一個或多個準則時,確定要使用所述定制語言模型; 獲得所述定制語言模型,所述定制語言模型包括具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列,所述經(jīng)過調(diào)節(jié)的概率值是所述基本概率值被根據(jù)所述查詢場境來調(diào)節(jié)的;以及 基于一個或多個概率,將所述話音搜索查詢轉(zhuǎn)換為文本搜索查詢,所述一個或多個概率的每一個對應于一個或多個詞語序列的群組中的詞語序列,所述一個或多個詞語序列的群組包括所述具有經(jīng)過調(diào)節(jié)的概率值的第一詞語序列。
【文檔編號】G10L15/22GK104508739SQ201380038870
【公開日】2015年4月8日 申請日期:2013年6月18日 優(yōu)先權(quán)日:2012年6月21日
【發(fā)明者】佩德羅·J·莫雷諾·門希瓦爾, 邁克爾·H·科恩 申請人:谷歌公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
荆州市| 房产| 宽城| 乌兰浩特市| 广东省| 都江堰市| 惠水县| 宜川县| 汝阳县| 曲阜市| 虎林市| 乌兰察布市| 义马市| 宁津县| 镇坪县| 普陀区| 南江县| 平定县| 襄樊市| 瑞金市| 炉霍县| 额敏县| 南通市| 时尚| 兰溪市| 广水市| 攀枝花市| 富源县| 土默特左旗| 正安县| 同仁县| 屯留县| 泰顺县| 云霄县| 北海市| 仁布县| 元江| 崇仁县| 孟州市| 武宣县| 汕头市|