用于利用來自媒體體驗(yàn)內(nèi)部的智能用戶交互實(shí)施上下文敏感搜索的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本公開一般地涉及數(shù)字媒體中的術(shù)語搜索的領(lǐng)域,并且更具體地涉及使用媒體體驗(yàn)內(nèi)的搜索術(shù)語周圍的上下文信息來提供更好結(jié)果。通過使得用戶能夠選擇然后由周圍上下文自動限定的搜索術(shù)語來簡化搜索的發(fā)起。
【背景技術(shù)】
[0002]搜索系統(tǒng)如今與提供特定問題以便搜尋出“正確”答案的用戶一起工作。通常,用戶不確定問題是否被恰當(dāng)?shù)卮朐~以提供期望的結(jié)果,或者有時(shí)不是太確定問什么。作為關(guān)于在線搜索中使用的算法的用戶不確定性或者缺乏對所討論的話題的理解的結(jié)果,重復(fù)搜索和搜索術(shù)語或問題的重新措詞通常是必要的以向用戶提供相關(guān)且期望的結(jié)果?,F(xiàn)有系統(tǒng)可以使用作為搜索準(zhǔn)則錄入的術(shù)語或短語并且形成各種布爾搜索或者使用其它算法,并且可以基于其他人在類似搜索中找到的相關(guān)內(nèi)容提供結(jié)果;不存在基于任何有用上下文對用戶為何錄入該特定搜索術(shù)語的知識或理解。
【附圖說明】
[0003]本文所公開的實(shí)施例的特征和優(yōu)點(diǎn)將結(jié)合附圖通過以下【具體實(shí)施方式】而變得容易理解。具有不同字母后綴的相似標(biāo)號可以表示類似組件的不同實(shí)例。圖一般通過示例的方式而不是通過限制的方式圖示在本文檔中討論的各種實(shí)施例。
[0004]圖1是圖示了根據(jù)實(shí)施例的用于選擇搜索術(shù)語并且使用媒體上下文來提供搜索結(jié)果的方法的經(jīng)修改的流程圖。
[0005]圖2圖示了根據(jù)實(shí)施例的漸進(jìn)式(progressive)搜索。
[0006]圖3是圖示了其上可以實(shí)現(xiàn)各種實(shí)施例的示例系統(tǒng)的框圖。
[0007]圖4是圖示了根據(jù)實(shí)施例的示例上下文搜索系統(tǒng)的結(jié)構(gòu)組件和模塊的框圖。
[0008]圖5是圖示了其上可以實(shí)現(xiàn)用于基于電視觀看體驗(yàn)的上下文搜索的實(shí)施例的示例系統(tǒng)的框圖。
【具體實(shí)施方式】
[0009]在以下【具體實(shí)施方式】中,對形成【具體實(shí)施方式】的部分的附圖做出參考,其中相同的標(biāo)號自始至終指代相同的部分,并且其中通過圖示的方式示出可以實(shí)踐的實(shí)施例。這些實(shí)施例在本文中還可以被稱為“示例”。這樣的示例還可以包括除所示出或描述的那些之外的元件。然而,作者還設(shè)想到其中僅提供所示出或所描述的那些元件的示例。而且,作者還設(shè)想到使用關(guān)于特定示例(或其一個(gè)或多個(gè)方面)或關(guān)于本文所示出或所描述的其它示例(或其一個(gè)或多個(gè)方面)的所示出或所描述的那些元件(或其一個(gè)或多個(gè)方面)的任何組合或置換的示例。
[0010]要理解的是,可以利用其它實(shí)施例或示例,并且可以在不脫離于本公開的范圍的情況下做出結(jié)構(gòu)或邏輯改變。因此,不以限制性含義考慮以下【具體實(shí)施方式】,并且實(shí)施例的范圍由隨附權(quán)利要求及其等同物來限定。
[0011]實(shí)施例為涉及使用由用戶在媒體體驗(yàn)期間選擇的術(shù)語的上下文搜索的系統(tǒng)和方法。在至少一個(gè)實(shí)施例中,實(shí)施例意在使得用戶能夠選擇在媒體體驗(yàn)中出現(xiàn)的簡單術(shù)語或短語。搜索引擎利用來自媒體體驗(yàn)的所選術(shù)語周圍的上下文以更好地聚焦搜索,并且向用戶提供基于上下文的搜索結(jié)果。媒體體驗(yàn)可以是web(網(wǎng)絡(luò))瀏覽會話、電子書(ebook)的閱讀、觀看電視、廣播或媒體流、車載信息娛樂、閱讀電子郵件(e-email)或者其它數(shù)字文檔,或者與數(shù)字或電子媒體的其它用戶交互。
[0012]在說明書中對“一個(gè)實(shí)施例”、“實(shí)施例”或“示例”的提及意指結(jié)合實(shí)施例或示例描述的特定特征、結(jié)構(gòu)或特性包括在如本文所描述的至少一個(gè)實(shí)施例中。因此,出現(xiàn)在各種地方中的短語“在一個(gè)實(shí)施例中”遍及說明書的出現(xiàn)不一定都是指相同的實(shí)施例。
[0013]出于解釋的目的,闡述具體配置和細(xì)節(jié)以便提供本文所公開的實(shí)施例的透徹理解。然而,對本領(lǐng)域普通技術(shù)人員將顯然的是,可以在沒有本文所呈現(xiàn)的具體細(xì)節(jié)的情況下實(shí)踐實(shí)施例。另外,可以省略或者簡化眾所周知的特征以免混淆本文中的描述的理解。遍及本說明書,可以給出各種示例。這些僅僅是具體實(shí)施例的描述。權(quán)利要求的范圍不限于所給出的確切示例。
[0014]圖1是圖示了根據(jù)實(shí)施例的用于選擇搜索術(shù)語并且使用媒體上下文以提供搜索結(jié)果的方法的流程圖。在某種程度上修改該圖以包括示例方法以及示例數(shù)據(jù)和結(jié)果二者。在說明性示例中,用戶可以正在閱讀提供關(guān)于夏威夷中的火山的信息的文檔或網(wǎng)頁。僅僅出于說明目的,作者已經(jīng)使用了來自hubpage.com的網(wǎng)頁的摘錄。摘錄被示出為數(shù)據(jù)塊10。用戶期望在所閱讀的文章的上下文中更多地學(xué)習(xí)火山。在塊11中,用戶從電子文檔選擇術(shù)語“火山”。將顯然的是,可以使用各種方法來實(shí)施該選擇。例如,在具有鼠標(biāo)設(shè)備的計(jì)算設(shè)備上,用戶可以使用鼠標(biāo)來選擇術(shù)語。在諸如平板、Ultrabook?設(shè)備、混合設(shè)備、智能電話、車輛導(dǎo)航或車載信息娛樂系統(tǒng)等之類的觸摸屏設(shè)備上,用戶可以觸摸并且保持搜索術(shù)語直至其被高亮。之后將討論其中選擇為電視節(jié)目的實(shí)施例。其它類型的選擇被設(shè)想到并且可以基于設(shè)備類型及其輸入識別而變化。
[0015]自然語言處理(NLP)模塊在塊13中掃描電子文檔的所選部分以領(lǐng)會所選搜索術(shù)語周圍的概念和相關(guān)關(guān)鍵詞。所選部分可以從單個(gè)句子、單個(gè)段落、多個(gè)句子、多個(gè)段落或整個(gè)文檔等變化。所選部分的大小可以被系統(tǒng)預(yù)選擇為默認(rèn)值,或者由用戶定義,或者取決于文檔的大小(例如總文本的百分?jǐn)?shù)),或者按頁。預(yù)選擇的默認(rèn)值可以通過NLP模塊使用各種基于接近度(proximity)的統(tǒng)計(jì)分析而隨時(shí)間變化。所述部分的大小還可以部分地基于執(zhí)行NLP的設(shè)備的相對處理速度來動態(tài)地選擇,以便向用戶提供結(jié)果而沒有明顯延遲??梢詧?zhí)行最佳部分大小和可接受的延遲之間的權(quán)衡??山邮艿难舆t可以是預(yù)定義的,并且針對各種大小的部分的處理時(shí)間的估計(jì)可以用于幫助選擇可允許以提供及時(shí)響應(yīng)的最大部分大小。部分大小可以通過以默認(rèn)大小(或接近于所選文本)開始并且使用機(jī)器學(xué)習(xí)技術(shù)和利用NLP的統(tǒng)計(jì)建模來針對不同摘錄大小而改變以針對重要關(guān)鍵詞的更好識別而調(diào)節(jié)大小。
[0016]存在用于在詞語、短語或文本的其它部分上執(zhí)行自然語言處理的許多已知技術(shù)。本文所描述的實(shí)施例可以使用命名實(shí)體識別(named entity recognit1n,NER)和貝葉斯統(tǒng)計(jì)模型的組合。
[0017]例如,命名實(shí)體識別技術(shù)可以幫助識別代詞與句子或句子串中的恰當(dāng)主語之間的相關(guān)性。NER旨在對文本中的原子元素(atomic element)定位和將其分類成諸如人員的姓名、組織、位置、時(shí)間表述、數(shù)量、貨幣值、百分比等之類的預(yù)定義類別?,F(xiàn)有NER系統(tǒng)可以使用基于語言學(xué)語法的技術(shù)以及統(tǒng)計(jì)模型。統(tǒng)計(jì)NER系統(tǒng)典型地要求大量人工注釋的訓(xùn)練數(shù)據(jù)。本文所描述的實(shí)施例可以使用機(jī)器學(xué)習(xí)模型來調(diào)節(jié)NLP的結(jié)果。
[0018]貝葉斯統(tǒng)計(jì)模型在本領(lǐng)域中一般是眾所周知的。貝葉斯統(tǒng)計(jì)量在可信度或者更具體地貝葉斯概率方面表述關(guān)于世界的真實(shí)狀態(tài)的證據(jù)。這樣的解釋僅僅是概率的眾多解釋中的一個(gè)并且存在不基于“可信度”的許多其它的統(tǒng)計(jì)技術(shù)。本文所描述的實(shí)施例可以通過包括基于位置和接近度的算法來使用傳統(tǒng)貝葉斯統(tǒng)計(jì)模型的變型來聚焦于部分文本內(nèi)的概念或想法的上下文,但是沿比在NLP算法中傳統(tǒng)使用的更長的文本范圍。對更長文本部分的貝葉斯建模幫助識別文本部分內(nèi)的重要術(shù)語和非重要術(shù)語。在實(shí)施例中,建模算法使用以下假定:你離所選搜索術(shù)語越遠(yuǎn),術(shù)語與核心概念相關(guān)得越少,即術(shù)語在相關(guān)關(guān)鍵詞的分析和識別中將會具有更低權(quán)重。因此,這種基于接近度的統(tǒng)計(jì)分析可以提供更好的所得到的相關(guān)關(guān)鍵詞以供錄入到搜索引擎中。
[0019]數(shù)據(jù)塊10說明了針對上下文進(jìn)行分析的電子文檔的示例部分。塊12示出具有以粗體標(biāo)識的關(guān)鍵詞的部分。應(yīng)當(dāng)指出的是,關(guān)鍵詞可以是術(shù)語或短語,并且不限于單個(gè)詞語。在該示例中,NLP通過使用塊10中所示的部分來提取所選術(shù)語“火山”和許多其它關(guān)鍵詞或參數(shù)。在該示例中,NLP模塊識別出要用作上下文搜索中的參數(shù)的以下關(guān)鍵詞:夏威夷;盾狀火山;相對大;淺坡側(cè);低粘性;以及熔巖。在塊15中提取出所選搜索術(shù)語連同上下文關(guān)鍵詞或參數(shù)以供在搜索引擎中使用。然后在塊17中將所提取的術(shù)語和關(guān)鍵詞或短語(參數(shù))發(fā)送到用戶偏好的或默認(rèn)的搜索引擎。應(yīng)當(dāng)指出的是,可以使用任何常見搜索引擎,因?yàn)橄蛩x搜索引擎發(fā)送上下文關(guān)鍵詞以聚焦基于原始文檔的上下文的搜索。如果期望的話,可以使用定制搜索引擎。將理解的是,搜索引擎可以位于遠(yuǎn)程網(wǎng)絡(luò)服務(wù)器、云服務(wù)提供商服務(wù)器上,提供在中間服務(wù)器上,或者在用戶設(shè)備本地。搜索引擎的位置可以取決于搜索的類型,例如本地或遠(yuǎn)程數(shù)據(jù)庫搜索、本地文檔搜索、因特網(wǎng)搜索等。
[0020]搜索引擎使用搜索術(shù)語和上下文關(guān)鍵詞或短語并且執(zhí)行搜索(未示出)?;谒阉饕娴牟僮鳎瑢⒔Y(jié)果返回給用戶,并且在塊19中顯示結(jié)果。結(jié)果19A-C例如可以顯示在用戶設(shè)備或者以下更充分地描述的輔用戶設(shè)備上。在該示例中,結(jié)果可以包括夏威夷的照片19A、維基百科頁面19B和/或夏威夷的地圖19C。結(jié)果可以被顯示為具有或不具有預(yù)覽文本的超鏈接、簡單本文、話語文本、圖像、一個(gè)或多個(gè)瀏覽器頁面、一個(gè)或多個(gè)彈出對話框或?qū)τ脩艨梢暬蚩陕牭娜魏涡问?。結(jié)果的形式可以取決于上下文搜索系統(tǒng)如何與媒體體驗(yàn)集成。
[0021]例如,上下文搜索系統(tǒng)可以實(shí)現(xiàn)為瀏覽器附加件、動態(tài)負(fù)載庫(DLL)的部分,可以集成為媒體體驗(yàn)系統(tǒng)內(nèi)的模塊或其它方法。在實(shí)施例中,上下文搜索組件是原始媒體體驗(yàn)的部分,但是被設(shè)計(jì)到其中以提供最佳的用戶交互模型。例如,eBook可以利用用于Web應(yīng)用的插件或者用于本地應(yīng)用的DLL。實(shí)際的上下文搜索可以限于在關(guān)鍵詞被選擇(按壓)時(shí)的關(guān)鍵詞的簡單高亮并且覆蓋層可以彈出結(jié)果,或者整個(gè)頁面可以滾回以顯露具有推送結(jié)果的下頁面。如果上下文搜索系統(tǒng)被集成為附加件,其中簡單地將搜索術(shù)語和關(guān)鍵詞傳遞到默認(rèn)搜索引擎,結(jié)果可以以符合所選搜索引擎的通常顯示方法的方式顯示。在一些情況中,搜索引擎結(jié)果可以傳遞回到上下文搜索系統(tǒng)并且然后如期望的那樣重新格式化以用于不同的顯示方法。默認(rèn)的顯示方式可以基于用戶預(yù)選擇的簡檔(profile)或設(shè)備配置而變化。例如,顯示器是基于用戶