專利名稱:用于信息捕獲及檢索的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明大體而言涉及搜索引擎。更具體而言,本發(fā)明涉及用于信息捕獲及檢索的 方法及系統(tǒng)。
背景技術(shù):
用戶使用諸如個人計算機、個人數(shù)字助理或移動電話等客戶機裝置產(chǎn)生及存取大 量文件,例如電子郵件、網(wǎng)頁、字處理文檔、電子表格文檔、即時信使消息、及顯示 文檔。 一些文章存儲于一個或多個耦接至客戶機裝置、可由客戶機裝置存取、或以其 它方式與客戶機裝置相關(guān)聯(lián)的存儲裝置上。用戶有時希望搜索所述存儲裝置來査找文 章。
傳統(tǒng)的客戶機裝置搜索應(yīng)用程序可能會使客戶機裝置的性能大大降低。例如,某 些傳統(tǒng)的客戶機裝置搜索應(yīng)用程序通常使用批處理來為所有文章加索引,而此可導(dǎo)致 客戶機裝置性能在批處理期間顯著下降。
另外,批處理僅周期性地進行。因此,當用戶實施搜索時,結(jié)果中有時不包括最 近的文章。而且,如果批處理是安排在客戶機裝置不能運行的時間且因此不能執(zhí)行一長的時間周期,與客戶機裝置相關(guān)聯(lián)的文章的索引便可能變成過期的。傳統(tǒng)的客戶機 裝置搜索應(yīng)用程序也可能需要在每次批處理時重建索引或建立一部分新的索引并實施 一可能使用大量客戶機裝置資源的合并操作。傳統(tǒng)的客戶機裝置搜索應(yīng)用程序有時還 在運行時使用大量系統(tǒng)資源,從而導(dǎo)致客戶機裝置性能下降。
另外,傳統(tǒng)的客戶機裝置搜索應(yīng)用程序可能需要用戶進行顯式搜索查詢來產(chǎn)生結(jié) 果,而且可能僅限于查閱一特定應(yīng)用程序的文件的文件名稱或內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明的各實施例包括用于信息捕獲及檢索的方法及系統(tǒng)。在一實施例中, 一搜 索引擎實施一種方法,該方法包括在發(fā)生一事件時實時地捕獲所述事件,其中所述
事件包括用戶與一客戶機裝置上的一文件的交互作用,其中所述文章能夠與復(fù)數(shù)個客 戶機應(yīng)用程序中的至少一個相關(guān)聯(lián);確定是否應(yīng)為所述事件加索引、且在應(yīng)為所述事 件加索引的情況下為所述事件加索引并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi)容的至 少一部分。在另一實施例中, 一搜索引擎實施一種方法,該方法包括捕獲復(fù)數(shù)個發(fā) 生于一客戶機裝置上的事件,其中所述事件與復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個相 關(guān)聯(lián),其中在所述事件發(fā)生時實時地捕獲所述事件中的至少一些;為所述事件中的至 少一些加索引并對其加以存儲,其中被加索引并存儲的事件具有一關(guān)聯(lián)的文章;接收 一搜索査詢;及根據(jù)與所述搜索查詢相關(guān)的事件對相關(guān)文章進行定位。
所提及的這些實例性實施例并非用來限制或界定本發(fā)明,而是用來提供本發(fā)明實 施例的實例以幫助理解本發(fā)明。各實例性實施例闡述于具體實施方式
部分中,且對在具體實施方式
部分中提供對本發(fā)明的進一步說明。本發(fā)明各實施例所提供的優(yōu)點可通 過査閱此說明書進一步加以理解。
參照附圖閱讀下文具體實施方式
部分,將會更好地了解本發(fā)明的這些及其它特 征、方面及優(yōu)點,附圖中
圖1為一圖解說明一本發(fā)明一實施例可在其中運行的實例性環(huán)境的圖式;
圖2為一流程圖,其圖解說明在本發(fā)明一實施例中一種用以捕獲及處理與一客戶 機裝置相關(guān)聯(lián)的事件數(shù)據(jù)的實例性方法;及
圖3為一流程圖,其圖解說明在本發(fā)明一實施例中一種用以檢索與事件相關(guān)聯(lián)的 文章的實例性方法。
具體實施例方式
現(xiàn)在參見附圖,在這幾個圖式中,相同編號指示相同元件,圖l為一圖解說明一
用于實施本發(fā)明一實施例的實例性環(huán)境的方塊圖。雖然所示環(huán)境反映一客戶機側(cè)搜索 引擎架構(gòu)實施例,但也可具有其它實施例。圖1所示的系統(tǒng)100包括多個可通過一網(wǎng) 絡(luò)106與一服務(wù)器裝置150通信的客戶機裝置102a-n。所示網(wǎng)絡(luò)106包括因特網(wǎng)。在 其它實施例中,可代之以使用例如內(nèi)聯(lián)網(wǎng)等其它網(wǎng)絡(luò)。此外,根據(jù)本發(fā)明的方法可在 不與服務(wù)器裝置或網(wǎng)絡(luò)進行通信的單個客戶機裝置中使用。
圖1所示客戶機裝置102a-n分別包括一計算機可讀媒體108。圖1所示實施例包 括一耦接至一處理器110的隨機存取存儲器(RAM) 108。處理器110執(zhí)行存儲于存 儲器108中的計算機可執(zhí)行程序指令。此類處理器可包括一微處理器、一 ASIC、狀態(tài) 機、或其它處理器,且可為若干適當計算機處理器中的任何一個,例如由位于Santa Clara, California的Intel公司及位于Schaumburg, Illinois的Motorola公司提供的處理 器。此類處理器包括用于存儲指令的媒體(例如計算機可讀媒體)或者可與所述媒體 進行通信,所述指令在由所述處理器執(zhí)行時會使所述處理器實施本文中所述的步驟。 計算機可讀媒體的各實施例包括(但不限于)能為處理器(例如客戶機102a的處理器 110)提供計算機可讀指令的電子、光學、磁性或其它存儲或傳輸裝置。其它適當媒體 的實例包括(但不限于)軟盤、CD-ROM、 DVD、磁盤、存儲芯片、ROM、 RAM、 ASIC、經(jīng)配置的處理器、所有光學媒體、所有磁帶或其它磁性媒體、或計算機處理器 可自其讀取指令的任何其它媒體。此外,各種其它形式的計算機可讀媒體也可向計算 機傳輸或載送指令,包括路由器、專用或公用網(wǎng)絡(luò)、或其它有線和無線傳輸裝置或通 道。所述指令可包括任一種計算機編程語言的代碼,包括(例如)C、 C++、 C#、 Visual Basic、 Java、 Python、 Perl、及JavaScript。
客戶機裝置102a-n可耦接至一網(wǎng)絡(luò)106,或者另一選擇為,可為一獨立的機器。 客戶機裝置102a-n也可包括若干外部或內(nèi)部裝置,例如鼠標、CD-ROM、 DVD、鍵盤、 顯示裝置或其它輸入或輸出裝置。客戶機裝置102a-n的實例為個人計算機、數(shù)字助理、 個人數(shù)字助理、蜂窩式電話、移動電話、智能電話、尋呼機、數(shù)字圖形輸入板、膝上 型計算機、因特網(wǎng)設(shè)備及其它基于處理器的裝置。 一般而言,客戶機裝置102a-n可為 能夠支持一個或多個客戶機應(yīng)用程序的任何適當操作系統(tǒng)(例如Microsoft Windows 或Linux)上運行的任一類型的基于處理器的平臺。例如,客戶機裝置102a 可包括一執(zhí)行客戶機應(yīng)用程序一其亦稱作客戶機應(yīng)用程序120—的個人計算機??蛻?機應(yīng)用程序120可包含于存儲器108中并可包括(例如)字處理應(yīng)用程序、電子表格 應(yīng)用程序、電子郵件應(yīng)用程序、即時信使應(yīng)用程序、顯示應(yīng)用程序、因特網(wǎng)瀏覽器應(yīng) 用程序、日歷/組織器應(yīng)用程序、視頻播放應(yīng)用程序、音頻播放應(yīng)用程序、圖像顯示應(yīng) 用程序、文件管理程序、操作系統(tǒng)外殼程序、及其它能夠由一客戶機裝置執(zhí)行的應(yīng)用 程序。客戶機應(yīng)用程序也可包括與其它應(yīng)用程序(例如,舉例而言, 一在客戶機裝置 102a上執(zhí)行的用來與一遠程電子郵件服務(wù)器交互作用以存取電子郵件的網(wǎng)絡(luò)瀏覽器) 交互作用或存取其它應(yīng)用程序的客戶機側(cè)應(yīng)用程序。
用戶112a可通過客戶機裝置102a的各種輸入及輸出裝置與各種客戶機應(yīng)用程序
120及和客戶機應(yīng)用程序120相關(guān)聯(lián)的文章交互作用。文章包括(例如)字處理文檔、 電子表格文檔、顯示文檔、電子郵件、即時信使消息、數(shù)據(jù)庫條目、日歷條目、約定 條目、任務(wù)管理器條目、源代碼文件、及其它客戶機應(yīng)用程序內(nèi)容文件、消息、項目、 各種格式的網(wǎng)頁(例如HTML、 XML、 XHTML)、可移植文檔格式(PDF)文件、及 媒體文件(例如圖像文件、音頻文件及視頻文件)、或任何其它文檔或項目或成組的文 檔或項目或任何適當類型的信息。
用"112a與文章、客戶機應(yīng)用程序120及客戶機裝置102a的交互作用能創(chuàng)建可 查看、記錄、分析或以其它方式使用的事件數(shù)據(jù)。 一事件可為任何可與一文章、客戶 機應(yīng)用程序120、或客戶機裝置102a相關(guān)聯(lián)的事件,例如在一文章中輸入文本、在一 顯示裝置上顯示一文章、發(fā)送一文章、接收一文章、操縱一輸入裝置、打開一文章、 保存一文章、打印一文章、關(guān)閉一文章、打開一客戶機應(yīng)用程序、關(guān)閉一客戶機應(yīng)用 程序、空閑時間、處理器加載、磁盤存取、存儲器使用、將一客戶機應(yīng)用程序?qū)е燎?臺、改變應(yīng)用程序的視頻顯示細節(jié)(例如重設(shè)大小或最小化)及與一文章、 一客戶機 應(yīng)用程序、或客戶機裝置相關(guān)聯(lián)的任何其它適當事件。另外,事件數(shù)據(jù)可產(chǎn)生于客戶 機裝置102a獨立于用戶112a與一文章交互作用時,例如在接收一電子郵件或?qū)嵤┮?所排定任務(wù)時。
客戶機裝置102a的存儲器108也可包含一捕獲處理器124、 一隊列126、及一搜 索引擎122??蛻魴C裝置102a也可包含一數(shù)據(jù)存儲器140或與數(shù)據(jù)存儲器140通信。 捕獲處理器124可捕獲事件并將其傳送至隊列126。隊列126可將所捕獲事件傳送至 搜索引擎122或搜索引擎122可從隊列126中檢索新事件。在一實施例中,當一新事 件到達隊列126中時,隊列126會通知引擎122,且當搜索引擎122準備好處理該事 件(或這些事件)時,搜索引擎122從隊列126中檢索該事件(或這些事件)。當搜索 引擎接收到一事件時,可對所述事件進行處理并可將其存儲于數(shù)據(jù)存儲器140中。搜 索引擎122可從用戶112a接收一顯式查詢或產(chǎn)生一隱式查詢,且其可響應(yīng)于所述查詢 而從數(shù)據(jù)存儲器140中檢索信息。在另一實施例中,所述隊列位于搜索引擎122中。 在再一實施例中,客戶機裝置102a不具有隊列且事件被直接從捕獲處理器124傳送至 搜索引擎122。根據(jù)其它實施例,使用一信息交換協(xié)議來傳送事件數(shù)據(jù)。所述信息交 換協(xié)議可包括(例如)有利于數(shù)據(jù)交換的任何適當規(guī)則或規(guī)約,并可包括(例如)下 述通信機理中的任何一種可擴充標記語言-遠程過程調(diào)用協(xié)議(XML/RPC)、超文本 傳輸協(xié)議(HTTP)、簡單對象訪問協(xié)議(SOAP)、共享存儲器、網(wǎng)絡(luò)應(yīng)用程序接口、 本地或遠程過程調(diào)用、或任何其它適當?shù)男畔⒔粨Q機理。
捕獲處理器124可通過識別并編譯與一事件相關(guān)的事件數(shù)據(jù)來捕獲一事件。事件 的實例包括發(fā)送或接收一電子郵件消息、用戶査看一網(wǎng)頁、保存一字處理文檔、打印 一電子表格文檔、輸入文本以創(chuàng)作或編輯一電子郵件、打開一顯示應(yīng)用程序、關(guān)閉一 即時信使應(yīng)用程序、輸入一按鍵、移動鼠標、將文本復(fù)制到剪貼板上、及使鼠標停留 在超級鏈接上。捕獲處理器124針對一涉及到用戶査看網(wǎng)頁的事件所捕獲的事件數(shù)據(jù)
的實例可包括網(wǎng)頁的URL、用戶査看網(wǎng)頁的時間及日期、呈原始或經(jīng)處理格式的網(wǎng)頁 內(nèi)容、原始文檔的大小、顯示給用戶的網(wǎng)頁的屏幕快照、屏幕快照的一縮略形式、及 一與網(wǎng)頁或網(wǎng)站相關(guān)聯(lián)的圖標。
在圖l所示實施例中,捕獲處理器124包括多個捕獲組件。例如,圖l所示捕獲 處理器124為每一客戶機應(yīng)用程序包括一單獨的捕獲組件,以捕獲與每一應(yīng)用程序相 關(guān)的事件。捕獲處理器124也可包括一用于監(jiān)控整個網(wǎng)絡(luò)活動的單獨捕獲組件,以捕 獲與網(wǎng)絡(luò)活動(例如接收或發(fā)送一即時信使消息)相關(guān)的事件數(shù)據(jù)。圖l所示的捕獲 處理器124也可包括一用于監(jiān)控整個客戶機裝置性能數(shù)據(jù)(例如處理器負載、空閑時 間、磁盤存取、使用中的客戶機應(yīng)用程序、及可用的存儲器大小)的單獨客戶機裝置 捕獲組件。圖1所示的捕獲處理器124還包括一用于監(jiān)控并捕獲用戶輸入的按鍵的單 獨捕獲組件及一用于監(jiān)控并捕獲在一與客戶機裝置102a相關(guān)聯(lián)的顯示裝置上所顯示 的項目(例如文本)的單獨捕獲組件。 一單獨捕獲組件可監(jiān)控多個客戶機應(yīng)用程序且 多個捕獲組件可監(jiān)控單個客戶機應(yīng)用程序的不同方面。
在一實施例中,捕獲處理器124可通過各個單獨捕獲組件監(jiān)控客戶機裝置上的活 動并可通過一廣義事件定義及登記機理(例如一事件概要)來捕獲事件。每一捕獲組 件均可定義其自身的事件概要或可使用一預(yù)定義事件概要。事件概要可因捕獲組件正 在監(jiān)控的客戶機應(yīng)用程序或活動而異。大體而言,事件概要可(例如)通過提供與事 件相關(guān)聯(lián)的事件數(shù)據(jù)的字段(例如事件時間)及與任何相關(guān)聯(lián)文章相關(guān)的字段(例如 標題)以及任何相關(guān)聯(lián)文章的內(nèi)容(例如文檔正文)來描述一事件的格式。事件概要 可描述與一事件相關(guān)的任何適當事件數(shù)據(jù)的格式。例如, 一由用戶112a接收到的電子 郵件消息事件的事件概要可包括發(fā)送方、接收方或接收方列表、發(fā)送時間、發(fā)送日期、 及消息內(nèi)容。 一網(wǎng)頁當前正由一用戶查看的事件概要可包括網(wǎng)頁的統(tǒng)一資源定位符 (URL)、網(wǎng)頁被査看的時間、用戶査看網(wǎng)頁所花費的時間長度、及網(wǎng)頁內(nèi)容。 一字處 理文檔正由一用戶保存的事件概要可包括文檔標題、保存時間、文檔格式、文檔文本、 及文檔位置。更一般地說,事件概要可描述事件發(fā)生時間前后的系統(tǒng)狀態(tài)。例如,事 件概要可包含一與用戶自其導(dǎo)航的先前網(wǎng)頁相關(guān)聯(lián)的網(wǎng)頁事件的URL。另外,事件概 要可使用例如列表等更復(fù)雜的結(jié)構(gòu)來描述字段。例如, 一事件概要可包含列出多個接 收方的字段。 一事件概要也可包含可選字段,以使一應(yīng)用程序可在需要時包括額外的 事件數(shù)據(jù)。可通過將事件數(shù)據(jù)編譯到由相關(guān)聯(lián)事件概要所描述的字段中來捕獲一事件。
捕獲處理器124可捕獲目前正發(fā)生的事件(或"實時事件")并可捕獲過去已發(fā) 生的事件(或"歷史事件")。實時事件可為"可加索引的"也可為"不可加索引的"。 在一實施例中,搜索引擎122為可加索引的實時事件加索引,但不為不可加索引的實 時事件加索引。搜索引擎122可根據(jù)事件的重要度來確定是否為一事件加索引??杉?索引的實時事件可能是與一文章相關(guān)聯(lián)的更重要的事件,例如查看一網(wǎng)頁、加載或保 存一文件、及接收或發(fā)送一即時消息或電子郵件。不可加索引的事件可被搜索引擎122 認為其重要性不足以為其加索引及加以存儲,例如移動鼠標或選擇一文章中的一部分
文本?;蛘撸东@處理器124可能能夠確定事件不夠重要,且不將其發(fā)送至隊列126。 在此實施例中,可減少隊列126上的負載并可增加系統(tǒng)速度。不可加索引的及/或可加 索引的事件可由搜索引擎122用來更新當前用戶狀態(tài)。雖然所有實時事件均可與用戶 當前正在從事的活動(或當前用戶狀態(tài))相關(guān),但可為可加索引的實時事件加索引并 將其存儲于數(shù)據(jù)存儲器140中。或者,搜索引擎122可為所有實時事件加索引。實時 事件可包括(例如)發(fā)送或接收一文章(例如一即時信使消息)、查閱一文章的一部分 (例如選擇一部分文本或在一網(wǎng)頁的一部分上移動鼠標)、改變一文章(例如在一電子 郵件中輸入字或在一字處理文檔中粘貼句子)、關(guān)閉一文章(例如關(guān)閉一即時信使窗口 或改變一正被查看的電子郵件消息)、加載、保存、打開、或查看一文章(例如一字處 理文檔、網(wǎng)頁、或電子郵件)、收聽或保存一MP3文件或其它音頻/視頻文件、或更新 一文章的元數(shù)據(jù)(例如對一網(wǎng)頁加上書簽、打印一顯示文檔、刪除一字處理文檔、或 移動一電子表格文檔)。
歷史事件類似于可加索引的實時事件,只是事件是發(fā)生于搜索引擎122安裝之前 或因其他原因而未被捕獲到,例如因在客戶機裝置102a可運行時搜索引擎122未運行 到一時間周期或因在事件發(fā)生時不存在用于一特定類型歷史事件的捕獲組件。歷史事 件的實例包括用戶所保存的字處理文檔、媒體文件、顯示文檔、日歷條目、及電子表 格文檔、用戶收件箱中的電子郵件、用戶高速緩存中的網(wǎng)頁、過去的即時信使會話、 及由用戶加上書簽的網(wǎng)頁。捕獲處理器124可通過周期性地漫游存儲器108及該捕獲 處理器124先前未捕獲到的事件的任何相關(guān)聯(lián)數(shù)據(jù)存儲裝置來捕獲歷史事件。捕獲處 理器124也可通過請求某些客戶機應(yīng)用程序(例如網(wǎng)絡(luò)瀏覽器或電子郵件應(yīng)用程序) 以檢索文章及其它相關(guān)聯(lián)信息來捕獲歷史事件。例如,捕獲處理器124可請求網(wǎng)絡(luò)瀏 覽器應(yīng)用程序獲得用戶所査看的所有網(wǎng)頁或請求電子郵件應(yīng)用程序獲得所有與用戶相 關(guān)聯(lián)的電子郵件消息。這些文章可能當前并不存在于存儲器108中或客戶機裝置102a 的存儲裝置上。例如,電子郵件應(yīng)用程序可能須從一服務(wù)器裝置中檢索電子郵件。在 一實施例中,搜索引擎122為歷史事件加索引。
在一實施例中,搜索引擎122可有選擇地捕獲歷史事件并為其加索引。例如,可 將與事件的文章相關(guān)聯(lián)的文章數(shù)據(jù)部分地用來確定是否捕獲所述事件并為其加索引。
文章數(shù)據(jù)可包括(例如)文章的位置、文章的文件類型、及文章的存取數(shù)據(jù)。在一實 施例中,使用文章數(shù)據(jù)來確定一捕獲得分并將所述捕獲得分與一閾值相比較。如果一 特定事件的捕獲得分高于所述閾值,則捕獲所述事件并為其加索引。如果一文章的捕 獲得分低于所述閾值,則不捕獲所述事件也不為其加索引。同樣地,搜索引擎122可 有選擇地捕獲實時事件并為其加索引。
在圖1所示的一實施例中,以由一事件概要所描述的格式將捕獲處理器124所捕 獲的事件發(fā)送至隊列126。捕獲處理器124也可將性能數(shù)據(jù)發(fā)送至隊列126。性能數(shù)據(jù) 的實例包括當前處理器負載、 一預(yù)定時間周期內(nèi)的平均處理器負載、空閑時間、磁盤 存取、使用中的客戶機應(yīng)用程序、及可用存儲器大小。性能數(shù)據(jù)也可由特定性能監(jiān)控
組件(例如其中的一些可為搜索引擎122的一部分)來提供。隊列126中的性能數(shù)據(jù) 可由搜索引擎122及捕獲處理器124的捕獲組件來檢索。例如,捕獲組件可檢索性能 數(shù)據(jù)以改變發(fā)送至隊列126的事件數(shù)量或所發(fā)送事件的詳細程度(當系統(tǒng)繁忙時發(fā)送 較少或較小的事件)或事件發(fā)送的頻率(當系統(tǒng)繁忙或有太多的事件等待處理時降低 事件的發(fā)送頻度)。搜索引擎122可使用性能數(shù)據(jù)來確定其何時為各種事件加索引及其 何時及以何種頻度發(fā)出隱式查詢。
在一實施例中,隊列126將事件保留至搜索引擎122準備好處理一個或多個事件 為止?;蛘?,隊列126使用性能數(shù)據(jù)來幫助確定多快地將所述事件提供至搜索引擎122。 隊列126可包括一個或多個單獨的隊列一包括一用戶狀態(tài)隊列及一索引隊列。例如, 所述索引隊列可對可加索引的事件進行排隊?;蛘?,隊列126可具有額外隊列或包含 單個隊列??墒褂么鎯ζ饔诚裎募韺㈥犃?26構(gòu)建成一循環(huán)優(yōu)先隊列。所述隊列可 為一其中先于具有較低優(yōu)先權(quán)的事件來伺服具有較高優(yōu)先權(quán)的事件的多優(yōu)先權(quán)隊列, 且其它組件可指定其感興趣的事件類型。大體而言,可賦予實時事件較歷史事件高的 優(yōu)先權(quán),并可賦予可加索引的事件較不可加索引的實時事件高的優(yōu)先權(quán)。隊列126也 可具有其它構(gòu)建形式。在另一實施例中,客戶機裝置102a不具有一隊列126。在此實
施例中,事件被直接從捕獲處理器傳送至搜索引擎122。在其它實施例中,可使用例 如以下等適當?shù)男畔⒔粨Q機理在捕獲組件與搜索引擎之間傳送事件可擴充標記語言-遠程過程調(diào)用協(xié)議(XML/RPC)、超文本傳輸協(xié)議(HTTP)、簡單對象訪問脅議(SOAP)、 共享存儲器、網(wǎng)絡(luò)應(yīng)用程序接口、本地或遠程過程調(diào)用、或任何其它適當?shù)男畔⒔粨Q 機理。
搜索引擎122可包含一編索引器130、 一查詢系統(tǒng)132、及一格式化器134。查詢 系統(tǒng)132可從隊列126中檢索實時事件及性能數(shù)據(jù)。査詢系統(tǒng)132可使用性能數(shù)據(jù)及 實時事件來更新當前用戶狀態(tài)并產(chǎn)生一隱式查詢。隱式查詢可為一根據(jù)當前用戶狀態(tài) 自動產(chǎn)生的查詢。查詢系統(tǒng)132也可自用戶112a接收并處理顯式查詢。性能數(shù)據(jù)也可 由搜索引擎122從隊列126中檢索以用于確定可能由搜索引擎122實施的活動的數(shù)量。
在圖1所述實施例中,由編索引器130從隊列126中檢索可加索引的實時事件及 歷史事件(可加索引的事件)?;蛘?,隊列126可將可加索引的事件發(fā)送至編索引器 130。編索引器130可為可加索引的事件加索引并可將其發(fā)送至數(shù)據(jù)存儲器140來存儲 在其中。數(shù)據(jù)存儲器140可為任一類型的計算機可讀媒體并可與客戶機裝置102a集成 在一起(例如為一硬盤驅(qū)動器),或處于客戶機裝置102a的外部例如一外部硬盤驅(qū)動 器或處于通過網(wǎng)絡(luò)106存取的另一數(shù)據(jù)存儲裝置上。數(shù)據(jù)存儲器可為一個或多個邏輯 或物理存儲區(qū)。在一實施例中,數(shù)據(jù)存儲器140可位于存儲器108中。數(shù)據(jù)存儲器140 可使用包括(但不限于)陣列、散列表、列表、及配對在內(nèi)的數(shù)據(jù)存儲方法中的一種 或一組合,并可包括壓縮及加密。在圖l所示實施例中,數(shù)據(jù)存儲器包括一索引142、 一數(shù)據(jù)庫144及一儲存庫146。
在一實施例中,當編索引器130接收到一事件時,編索引器130可根據(jù)所述事件
來確定與所述事件相關(guān)聯(lián)的項(如果有)、所述事件的時間(如果具備)、與所述事件
相關(guān)聯(lián)的圖像(如果有)、及/或界定所述事件的其它信息。編索引器130可確定所述 事件是否為一先前接收到的事件的重復(fù)。編索引器130還可確定所述事件是否與其它 事件相關(guān)并將所述事件與相關(guān)事件相關(guān)聯(lián)。例如,對于一所接收的電子郵件事件,編 索引器130可將所述電子郵件與來自同一會話的其它消息事件相關(guān)聯(lián)。作為其他實例, 編索引器130可根據(jù)所述事件中所包含的文本或根據(jù)所述事件的時間來將一事件與其 它事件相關(guān)聯(lián)。來自同一會話的各電子郵件可在一可存儲于數(shù)據(jù)存儲器140中的相關(guān) 事件對象中相互關(guān)聯(lián)。
編索引器130可發(fā)送與事件相關(guān)聯(lián)的項及位置信息并將其包含于數(shù)據(jù)存儲器140 的索引142中??蓪⑺鍪录l(fā)送至數(shù)據(jù)庫144以供存儲并可將相關(guān)聯(lián)文章的內(nèi)容及 任何相關(guān)聯(lián)的圖像存儲于儲存庫146中??蓪⑴c電子郵件消息相關(guān)聯(lián)的會話對象存儲 于數(shù)據(jù)庫144中。
在圖1所示實施例中, 一用戶112a可將一顯式査詢輸入到一顯示于客戶機裝置 102a上的搜索引擎界面中,所述顯式査詢由搜索引擎122接收到。搜索引擎122還可 根據(jù)當前用戶狀態(tài)產(chǎn)生一隱式査詢,所述當前用戶狀態(tài)可由查詢系統(tǒng)132根據(jù)實時事 件加以確定。根據(jù)所述查詢,查詢系統(tǒng)132可在數(shù)據(jù)存儲器140中確定相關(guān)信息的位 置并提供一結(jié)果集合。在一實施例中,所述結(jié)果集合包括與客戶機應(yīng)用程序120相關(guān) 聯(lián)的文章或客戶機文章的文章標識符??蛻魴C文章包括與用戶112a或客戶機裝置102a 相關(guān)聯(lián)的文章,例如用戶的電子郵件、字處理文檔、即時信使消息、先前查看的網(wǎng)頁 及任何其它與客戶機裝置102a或用戶112a相關(guān)聯(lián)的文章或文章的一部分。 一文章標 識符可為(例如) 一統(tǒng)一資源定位符(URL)、 一文件名、 一鏈接、 一圖標、 一本地文 件的路徑、或其它可用于標識一文章的適當信息。在另一實施例中,所述結(jié)果集合還 包括由一搜索引擎在一服務(wù)器裝置上定位出的位于網(wǎng)絡(luò)106上的文章或網(wǎng)絡(luò)文章的文 章標識符。網(wǎng)絡(luò)文章包括網(wǎng)絡(luò)106上用戶112a先前未查看或以其它方式參考的文章, 例如使用者112a先前未查看的網(wǎng)頁。
格式化器134可從搜索引擎122的查詢系統(tǒng)132接收搜索結(jié)果集合并可對所述結(jié) 果進行格式化以輸出至一顯示處理器128。在一實施例中,格式化器134可按XML、 HTML、或制表符定界文本形式來格式化所述結(jié)果。顯示處理器128可包含于存儲器 108中并可控制結(jié)果集合在一與客戶機裝置102a相關(guān)聯(lián)的顯示裝置上的顯示。顯示處 理器128可包括各種組件。例如,在一實施例中,顯示處理器128包括一超文本傳送 協(xié)議(HTTP)服務(wù)器,所述超文本傳送協(xié)議(HTTP)服務(wù)器接收對信息的請求并通 過構(gòu)造及傳輸超文本標識語言(HTML)頁面作出響應(yīng)。在一種這樣的實施例中,HTTP 服務(wù)器包括Apache網(wǎng)絡(luò)服務(wù)器的一縮小比例型式。顯示處理器128可與一 API集合 相關(guān)聯(lián)以使各種應(yīng)用程序能夠接收并以各種格式顯示所述結(jié)果??砂窗?例如)如 下在內(nèi)的不同方式來構(gòu)建所述顯示API: Windows消息接發(fā)、DLL輸出、COM界面、 VB、 JAVA、或NET庫、或網(wǎng)絡(luò)服務(wù)。
通過客戶機裝置102a-n,用戶112a-n可通過網(wǎng)絡(luò)106來彼此通信及與耦接至網(wǎng)絡(luò) 106的其它系統(tǒng)及裝置通信。如圖1所示, 一服務(wù)器裝置150可耦接至網(wǎng)絡(luò)106。在圖 1所示實施例中,搜索引擎122可將一由一顯式或隱式査詢或同時由二者構(gòu)成的搜索 查詢傳輸至服務(wù)器裝置150。用戶112a還可在搜索引擎界面中輸入一搜索查詢,所述 搜索查詢可由客戶機裝置102a通過網(wǎng)絡(luò)106傳輸至服務(wù)器裝置150。在另一實施例中, 查詢信號可改為發(fā)送至一代理服務(wù)器(未顯示),然后由代理服務(wù)器將查詢信號傳輸至 服務(wù)器裝置150。亦可具有其他配置。
服務(wù)器裝置150可包括一執(zhí)行一搜索引擎應(yīng)用程序(例如GoogleTM搜索引擎)的 服務(wù)器。在其它實施例中,服務(wù)器裝置150可包括一相關(guān)信息服務(wù)器或一廣告服務(wù)器。 類似于客戶機裝置102a-n,服務(wù)器裝置150可包括一耦接至一計算機可讀存儲器162 的處理器160。服務(wù)器裝置150—其被顯示為單個計算機系統(tǒng)一 可構(gòu)建成一計算機處理 器網(wǎng)絡(luò)。服務(wù)器裝置150的各實例為服務(wù)器、主計算機、聯(lián)網(wǎng)的計算機、基于處理器 的裝置、及相似類型的系統(tǒng)及裝置。服務(wù)器處理器160可為若干種計算機處理器中的 任一種,例如由位于Santa Clara, California的Intel公司及位于Schaumburg, Illinois 的Motorola公司提供的處理器。在另一實施例中,服務(wù)器裝置150可存在于一客戶機 裝置上。在再一實施例中,可存在多個服務(wù)器裝置150。
存儲器162包含搜索引擎應(yīng)用程序一其亦稱作一網(wǎng)絡(luò)搜索引擎170。搜索引擎170 可響應(yīng)于一來自客戶機裝置102a的搜索查詢而從網(wǎng)絡(luò)106中對相關(guān)信息進行定位。然 后,搜索引擎170可通過網(wǎng)絡(luò)106將一結(jié)果集合提供至客戶機裝置102a。所述結(jié)果集 合可包括一個或多個文章標識符。一文章標識符可為(例如)一統(tǒng)一資源定位符(URL)、 一文件名、 一鏈接、 一圖標、 一本地文件路徑、或任何可用于標識一文章的其它信息。 在一實施例中, 一文章標識符可包括一與一文章相關(guān)聯(lián)的URL。
在一實施例中,服務(wù)器裝置150或相關(guān)裝置先前已實施了對網(wǎng)絡(luò)106的漫游來對 存儲于耦接至網(wǎng)絡(luò)106的其它裝置或系統(tǒng)中的文章(例如網(wǎng)頁)進行定位并在存儲器 162中或在另一數(shù)據(jù)存儲裝置上為所述文章加了索引。應(yīng)了解,可使用其他為文章加 索引的方法(例如手動提交)來代替漫游或與漫游相結(jié)合。
應(yīng)注意,本發(fā)明其它實施例可包括具有不同于圖l所示的架構(gòu)的系統(tǒng)。例如,在 本發(fā)明的其它一些實施例中,客戶機裝置102a為一非永久性地耦接至一網(wǎng)絡(luò)的獨立裝 置。圖1所示系統(tǒng)100僅為實例性,用于解釋圖2及3所示的實例性方法。
可實施根據(jù)本發(fā)明各實施例的各種方法。例如,在一實施例中, 一搜索引擎在一 事件發(fā)生時實時地捕獲所述事件,其中所述事件包括用戶與客戶機裝置上的文章的交 互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個相關(guān)聯(lián),至少部分
地根據(jù)所述事件來更新一當前用戶狀態(tài),確定是否應(yīng)為所述事件加索引,且若應(yīng)為所 述事件加索引,則為所述事件加索引并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi)容中的 至少一部分。
在另一實施例中, 一搜索引擎可捕獲發(fā)生于一客戶機裝置上的復(fù)數(shù)個事件,其中
所述事件與復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個相關(guān)聯(lián),其中在事件發(fā)生時實時地捕 獲所述事件中的至少一些,為所述事件中的至少一些加索引并加以存儲,其中被加索 引并存儲的事件具有一相關(guān)聯(lián)的文章,接收一搜索査詢,并根據(jù)與所述搜索查詢相關(guān) 的事件對相關(guān)文章進行定位。所述搜索引擎還可從所述相關(guān)文章中產(chǎn)生一搜索結(jié)果集 合。在一實施例中,所述搜索查詢是由所述用戶輸入。在另一實施例中,所述搜索查 詢是由搜索引擎根據(jù)一從實時事件中確定出的當前用戶狀態(tài)而產(chǎn)生。
在另一實施例中,在實時事件發(fā)生時實時地捕獲復(fù)數(shù)個實時事件,其中每一實時 事件均包括用戶與客戶機裝置上的文章的交互作用,其中所述文章能夠與復(fù)數(shù)個客戶 機應(yīng)用程序中的至少一個相關(guān)聯(lián),捕獲復(fù)數(shù)個過去發(fā)生的歷史事件,其中每一歷史事 件均包括使用與客戶機裝置上的文章的交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機 應(yīng)用程序中的至少一個相關(guān)聯(lián),針對每一事件確定是否應(yīng)為所述事件加索引,且如果 應(yīng)為所述事件加索引,則為所述事件加索引并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi) 容中的至少一部分。
在另一實施例中,在一事件發(fā)生時實時地捕獲所述事件,其中所述事件包括用戶 與客戶機裝置上的文章的交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序中的 至少一個相關(guān)聯(lián),至少部分地根據(jù)所述事件更新一當前用戶狀態(tài),為所述事件加索引 并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi)容中的至少一部分。在此實施例中,所述事 件可為一實時事件或者其可為一歷史事件。
在另一實施例中,捕獲發(fā)生于一客戶機裝置上的復(fù)數(shù)個事件,其中每一事件均與 復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個相關(guān)聯(lián),為所述事件中的至少一些加索引并加以 存儲,其中被加索引并存儲的事件具有一相關(guān)聯(lián)的客戶機文章,為復(fù)數(shù)個網(wǎng)絡(luò)文章加 索引,接收一搜索査詢,并至少部分地根據(jù)所述搜索查詢來對相關(guān)客戶機文章及網(wǎng)絡(luò) 文章進行定位。在此實施例中,所述事件中的至少一些可為實時捕獲的實時事件。所 述搜索査詢可至少部分地根據(jù)至少一個實時事件而隱含地產(chǎn)生。
圖2圖解說明一種一根據(jù)本發(fā)明一實施例的實例性方法200,其提供一種用于捕 獲并處理一事件的方法。此實例性方法僅以舉例方式提供,因為根據(jù)前面對實例性實 施例的說明可知,在本發(fā)明的其它實施例中存在許多種方式來實施各種方法。圖2所 示方法200可由各種系統(tǒng)中的任一系統(tǒng)執(zhí)行或以其它方式實施。下文以舉例方式將方 法200闡述成由圖1所示的系統(tǒng)100實施,且在對圖2所示實例性方法的解說中引用 系統(tǒng)100的各種元件。
在202中,捕獲處理器124捕獲一事件。所述事件可為一實時事件也可為一歷史 事件。捕獲處理器124可通過在事件發(fā)生時識別并編譯與所述事件相關(guān)的事件數(shù)據(jù)來 捕獲一實時事件。捕獲處理器124可(例如)通過下述方式來捕獲一歷史事件周期 性地漫游存儲器108或客戶機裝置112a中的相關(guān)聯(lián)數(shù)據(jù)存儲裝置以查找先前未捕獲的 文章,或從客戶機應(yīng)用程序接收文章或數(shù)據(jù)并識別和編譯與所述事件相關(guān)聯(lián)的事件數(shù) 據(jù)。捕獲處理器124可具有分別用于每一客戶機應(yīng)用程序、網(wǎng)絡(luò)監(jiān)控、性能數(shù)據(jù)捕獲、
按鍵捕獲、及顯示捕獲的捕獲組件。在一實施例中,捕獲組件可使用一廣義事件定義
機理(例如一其先前已定義并在客戶機裝置102a中登記的事件概要)來捕獲或表達述事件。
在204中,捕獲處理器124確定所捕獲的事件是否為一可加索引的事件。如上所 述, 一些實時事件可不加索引(不可加索引的實時事件)。在一實施例中,不可加索引 的實時事件用于更新當前用戶狀態(tài)且是(例如)在查閱一文章的一部分、更改一文章、 及關(guān)閉一文章。在此實施例中,不為不可加索引的事件加索引或?qū)ζ溥M行發(fā)送以供編 索引器130存儲??杉铀饕氖录蔀榭杉铀饕膶崟r事件或歷史事件??杉铀饕?事件的實例包括接收一電子郵件消息、査看一網(wǎng)頁、保存一字處理文檔、及發(fā)送一即 時信使消息。
如果確定出為一可加索引的事件,則在206中,可由捕獲處理器124將所述事件 以及一對于其為一可加索引事件的指示發(fā)送至隊列126。在圖2所示實施例中,可加 索引的實時事件發(fā)送至隊列126內(nèi)的一用戶狀態(tài)隊列及一索引隊列二者,而歷史事件 只發(fā)送至隊列126中的索引隊列?;蛘撸杉铀饕膶崟r事件可不發(fā)送至用戶狀態(tài)隊 列以節(jié)省計算時間。捕獲處理器124可按一種由一事件概要所描述的形式將所述事件 發(fā)送至隊列126。如果確定出所述事件為一不可加索引的事件,則在206中,可由捕 獲處理器124將所述不可加索引的事件以及一對于其將不加索引的指示發(fā)送至隊列 126中的用戶狀態(tài)隊列。在一替代實施例中,可在方塊206之后及/或之前實施方塊204。 例如,可由捕獲處理器124來確定一些事件是可加索引的還是不可加索引的并可由編 索引器130來確定其他事件是可加索引的還是不可加索引的。
在一實施例中,隊列126將所述事件保留至所述搜索引擎準備好接收所述事件為 止。根據(jù)所述事件數(shù)據(jù),將所述事件以優(yōu)先順序排列在隊列126上以待處理。例如, 隊列126賦予歷史事件一較實時事件為低的處理優(yōu)先權(quán)。在一實施例中,當編索引器 130準備好處理另一事件時,其可從隊列126中的索引隊列中檢索一個或多個事件。 查詢系統(tǒng)132可在其準備好更新用戶狀態(tài)時從隊列126中的用戶狀態(tài)隊列中檢索一個 或多個事件??墒褂脕碜砸徊东@事件的位置信息來更新用戶狀態(tài)。在另一實施例中, 未使用隊列并將事件直接從捕獲處理器124發(fā)送至搜索引擎122。
在208中,編索引器130為所述事件加索引并加以存儲。編索引器130可在其準 備好處理所述事件時從隊列126中檢索一事件。在一實施例中,編索引器130確定所 述事件是否為一重復(fù)事件且若不是,則為所述事件指配一事件ID。編索引器130還可 將所述事件與相關(guān)事件相關(guān)聯(lián)。在圖2所示實施例中,編索引器130可根據(jù)所述事件 概要來確定與所述事件相關(guān)聯(lián)的可加索引的項、與所述事件相關(guān)聯(lián)的日期及時間、及 與所述事件相關(guān)聯(lián)的其它數(shù)據(jù)。編索引器130可將所述事件ID與包含于索引142中的 可加索引的項相關(guān)聯(lián)。所述事件可存儲于數(shù)據(jù)庫144中,而所述事件的內(nèi)容可存儲于 儲存庫146中。對由搜索引擎122加索引并存儲的事件的捕獲使用戶122a能夠搜索客 戶機裝置102a上的文章并使搜索引擎能夠自動搜索客戶機裝置102a上的文章。
圖3圖解說明一種根據(jù)一實施例的實例性方法300,其提供一種用于定位及檢索
客戶機裝置上的文章的方法。此實例性方法僅以舉例方式提供,因為存在許多種用于
實施本發(fā)明方法的方式。圖3所示方法300可由各種系統(tǒng)中的任何一種系統(tǒng)來執(zhí)行或 以其它方式實施。下文以舉例方式將方法300闡述成由圖1所示的系統(tǒng)100實施,在 圖3所示實例性方法中引用系統(tǒng)100的各種元件。
在302中,査詢系統(tǒng)132接收一搜索査詢。所述査詢可為一顯式查詢也可為一隱 式查詢。顯式査詢可通過用戶向一顯示于客戶機裝置102a上的搜索引擎界面中輸入一 査詢術(shù)語而產(chǎn)生。隱式査詢可由査詢系統(tǒng)132根據(jù)當前用戶狀態(tài)而產(chǎn)生。例如,用戶 112a可將詞語月度預(yù)算會議議程"輸入到一搜索引擎界面中?;蛘?,用戶112a可將詞 語"月度預(yù)算會議議程"輸入用戶U2a正在起草的電子郵件中。捕獲處理器124可捕 獲此上下文事件且其可被查詢系統(tǒng)132接收到。查詢系統(tǒng)132可根據(jù)在此上下文事件 中所捕獲的詞語來產(chǎn)生一搜索査詢。
在304中,查詢系統(tǒng)132對與搜索査詢相關(guān)的文章進行定位。查詢系統(tǒng)132可通 過將所述搜索查詢的詞語與位于索引142中的詞語相比對來對相關(guān)文章進行定位。例 如,査詢系統(tǒng)132可將査詢詞語與索引142中的詞語相比對。根據(jù)相匹配的詞語,查 詢系統(tǒng)132可通過與相匹配詞語相關(guān)聯(lián)的事件ID確定出數(shù)據(jù)庫144中所存儲的與所述 詞語相關(guān)聯(lián)的事件。根據(jù)這些事件,査詢系統(tǒng)132可確定出與所述事件相關(guān)聯(lián)的文章。 所述文章可存儲于儲存庫146中。例如,對于搜索查詢"月度預(yù)算會議議程"而言, 查詢系統(tǒng)132可從包含査詢詞語的各種客戶機應(yīng)用程序中定位出各種文章,例如電子 郵件、顯示文檔、字處理文檔、電子表格文檔及其它與查詢詞語相匹配的文檔。所述 查詢還可指定一時間且査詢系統(tǒng)132可對與所述査詢時間相關(guān)的文章進行定位。所述 查詢還可指定一事件類型且所述查詢系統(tǒng)132可對一特定類型的文章進行定位,例如 (舉例而言)字處理文件或電子郵件消息。查詢系統(tǒng)132還可從一搜索引擎170中檢
索與所述查詢相關(guān)的網(wǎng)絡(luò)文章。
在306中,查詢系統(tǒng)132根據(jù)所定位出的文章產(chǎn)生一搜索結(jié)果集合。在一實施例 中,査詢系統(tǒng)132可根據(jù)各種指示用戶112a對文章的偏好的信號來對所定位出的文章 進行分類及排序。所述搜索結(jié)果集合可包含一與各種不同客戶機應(yīng)用程序120相關(guān)聯(lián) 的文章的文章標識符及網(wǎng)絡(luò)文章的文章標識符的經(jīng)排序列表。每一鏈接也可包含一文 章摘要以及一與文章相關(guān)聯(lián)的圖像。
在308中,由格式化器134將搜索結(jié)果集合格式化。在一實施例中,格式化器134 可按XML或HTML格式來格式化結(jié)果集合。在310中,由顯示處理器128將搜索結(jié) 果集合顯示于客戶機裝置102a上。例如,可將搜索結(jié)果集合顯示于與客戶機裝置102a 相關(guān)聯(lián)的顯示裝置上。如果搜索結(jié)果集合是響應(yīng)于一隱式査詢而產(chǎn)生,則顯示處理器 128可確定一適當時間來顯示所述隱式搜索結(jié)果集合。然而后,用戶112a可為一文章 選擇一文章標識符并使相關(guān)聯(lián)的文章顯示于所述顯示裝置上。
所示環(huán)境反映一客戶機側(cè)搜索引擎架構(gòu)實施例。也可具有其它實施例,例如一獨
立客戶機裝置或一網(wǎng)絡(luò)搜索引擎。
雖然上文說明包含許多細節(jié),但這些細節(jié)不應(yīng)視為對本發(fā)明范圍的限制,而應(yīng)視 為對所揭示實施例的舉例說明。例如,文章及事件的實例為實例性的而無限定意義。 所屬領(lǐng)域的技術(shù)人員將會設(shè)想出許多仍屬于本發(fā)明范圍內(nèi)的其它可能的變化形式。
權(quán)利要求
1、一種方法,其包括在發(fā)生一事件時實時地捕獲所述事件,其中所述事件包括與一客戶機裝置上的一文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個相關(guān)聯(lián);確定是否應(yīng)為所述事件加索引;及如果應(yīng)為所述事件加索引,則為所述事件加索引并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi)容中的至少一部分。
2、 如權(quán)利要求1所述的方法,其進一步包括至少部分地根據(jù)所述事件來更新一 當前用戶狀態(tài)。
3、 如權(quán)利要求l所述的方法,其中所述事件包括事件數(shù)據(jù)。
4、 如權(quán)利要求1所述的方法,其中以一預(yù)定義事件概要的形式來捕獲及表達所 述事件。
5、 如權(quán)利要求l所述的方法,其中與一文章的用戶交互作用包括加載一
6、 如權(quán)利要求1所述的方法,其中與一文章的用戶交互作用包括保存一
7、 如權(quán)利要求l所述的方法,其中與一文章的用戶交互作用包括査看一
8、如權(quán)利要求1所述的方法,其中與一文章的用戶交互作用包括更新一文章的元數(shù)據(jù)。
9、 如權(quán)利要求8所述的方法,其中更新一文章的所述元數(shù)據(jù)包括對一文章加上 書簽。
10、 如權(quán)利要求8所述的方法,其中更新一文章的所述元數(shù)據(jù)包括打印一文章。
11、 如權(quán)利要求8所述的方法,其中更新一文章的所述元數(shù)據(jù)包括刪除一文章。
12、 如權(quán)利要求8所述的方法,其中更新一文章的所述元數(shù)據(jù)包括移動一文章。
13、 一種方法,其包括捕獲復(fù)數(shù)個發(fā)生于一客戶機裝置上的事件,其中每一事件均與復(fù)數(shù)個客戶機應(yīng)用 程序中的至少一個相關(guān)聯(lián),其中所述事件中的至少一些是在所述事件發(fā)生時實時捕獲 的.,為所述事件中的至少一些加索引并對其加以存儲,其中被加索引并存儲的所述事 件具有一相關(guān)聯(lián)的文章; 接收一搜索查詢;及根據(jù)與所述搜索查詢相關(guān)的事件對相關(guān)文章進行定位。
14、 如權(quán)利要求13所述的方法,其進一步包括根據(jù)所述相關(guān)文章產(chǎn)生一搜索結(jié) 果集合。
15、 如權(quán)利要求13所述的方法,其中所述搜索查詢由一用戶輸入。
16、 如權(quán)利要求13所述的方法,其中所述搜索査詢根據(jù)一當前用戶狀態(tài)自動產(chǎn)生。
17、 如權(quán)利要求16所述的方法,其中所述當前用戶狀態(tài)至少部分地通過至少一 個實時事件來確定。
18、 如權(quán)利要求13所述的方法,其進一步包括對與所述搜索查詢相關(guān)的網(wǎng)絡(luò)文 章進行定位。
19、 如權(quán)利要求18所述的方法,其進一步包括根據(jù)所述相關(guān)文章及網(wǎng)絡(luò)文章產(chǎn) 生一搜索結(jié)果集合。
20、 一種方法,其包括在發(fā)生復(fù)數(shù)個實時事件時實時捕獲所述實時事件,其中每一實時事件均包括與一客戶機裝置上的一文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程 序中的至少一個相關(guān)聯(lián);捕獲復(fù)數(shù)個過去發(fā)生的歷史事件,其中每一歷史事件均包括與一客戶機裝置上的 一文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個 相關(guān)聯(lián),其中實時事件及歷史事件為事件;針對每一事件,確定是否應(yīng)為所述事件加索引;及如果應(yīng)為所述事件加索引,則為所述事件加索引并存儲所述事件及與所述文章相 關(guān)聯(lián)的內(nèi)容中至少一部分。
21、 一種方法,其包括在發(fā)生一事件時實時地捕獲所述事件,其中所述事件包括與一客戶機裝置上的一 文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個相 關(guān)聯(lián)-,至少部分地根據(jù)所述事件更新一當前用戶狀態(tài);及為所述事件加索引并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi)容中的至少一部分。
22、 如權(quán)利要求21所述的方法,其中所述事件為一實時事件。
23、 如權(quán)利要求21所述的方法,其中所述事件為一歷史事件。
24、 一種方法,其包括捕獲復(fù)數(shù)個發(fā)生于一客戶機裝置上的事件,其中每一事件均與復(fù)數(shù)個客戶機應(yīng)用 程序中的至少一個相關(guān)聯(lián);為所述事件中的至少一些加索引并加以存儲,其中被加索引并存儲的所述事件具 有一相關(guān)聯(lián)的客戶機文章;為復(fù)數(shù)個網(wǎng)絡(luò)文章加索引;接收一搜索查詢;及至少部分地根據(jù)所述搜索查詢對相關(guān)的客戶機文章及網(wǎng)絡(luò)文章進行定位。
25、 如權(quán)利要求24所述的方法,其中所述事件中的至少一些為實時事件且為實 時捕獲的。
26、 如權(quán)利要求25所述的方法,其中至少部分地根據(jù)至少一個實時事件而隱含 地產(chǎn)生所述搜索查詢。
27、 一種包含程序代碼的計算機可讀媒體,其包括-用于在發(fā)生一事件時實時地捕獲所述事件的程序代碼,其中所述事件包括與一客戶機裝置上的一文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序 中的至少一個相關(guān)聯(lián);用于確定是否應(yīng)為所述事件加索引的程序代碼;及用于如果應(yīng)為所述事件加索引則為所述事件加索引并存儲所述事件及與所述文 章相關(guān)聯(lián)的內(nèi)容中的至少一部分的程序代碼。
28、 如權(quán)利要求27所述的計算機可讀媒體,其進一步包括用于至少部分地根據(jù) 所述事件更新一當前用戶狀態(tài)的程序代碼。
29、 如權(quán)利要求27所述的計算機可讀媒體,其中所述事件包括事件數(shù)據(jù)。
30、 如權(quán)利要求27所述的計算機可讀媒體,其中以一預(yù)定義事件概要的形式捕 獲并表達所述事件。
31、 如權(quán)利要求27所述的計算機可讀媒體,其中與一文章的用戶交互作用包括 加載一文章。
32、 如權(quán)利要求27所述的計算機可讀媒體,其中與一文章的用戶交互作用包括 保存一文章。
33、 如權(quán)利要求27所述的計算機可讀媒體,其中與一文章的用戶交互作用包括 査看一文章。
34、 如權(quán)利要求27所述的計算機可讀媒體,其中與一文章的用戶交互作用包括 更新一文章的元數(shù)據(jù)。
35、 如權(quán)利要求34所述的計算機可讀媒體,其中更新一文章的所述元數(shù)據(jù)包括 對一文章加上書簽。
36、 如權(quán)利要求34所述的計算機可讀媒體,其中更新一文章的所述元數(shù)據(jù)包括 打印一文章。
37、 如權(quán)利要求34所述的計算機可讀媒體,其中更新一文章的所述元數(shù)據(jù)包括 刪除一文章。
38、 如權(quán)利要求34所述的計算機可讀媒體,其中更新一文章的所述元數(shù)據(jù)包括 移動一文章。
39、 一種包含程序代碼的計算機可讀媒體,其包括用于捕獲復(fù)數(shù)個發(fā)生于一客戶機裝置上的事件的程序代碼,其中每一事件均與復(fù) 數(shù)個客戶機應(yīng)用程序中的至少一個相關(guān)聯(lián),其中所述事件中的至少一些是在所述事件 發(fā)生時實時捕獲的;用于為所述事件中的至少一些加索引并對其加以存儲的程序代碼,其中被加索引 并存儲的所述事件具有一相關(guān)聯(lián)的文章; 用于接收一搜索查詢的程序代碼;及用于根據(jù)與所述搜索查詢相關(guān)的事件對相關(guān)文章進行定位的程序代碼。
40、 如權(quán)利要求39所述的計算機可讀媒體,其進一步包括用于根據(jù)所述相關(guān)文 章產(chǎn)生一搜索結(jié)果集合的程序代碼。
41、 如權(quán)利要求39所述的計算機可讀媒體,其中所述搜索査詢由一用戶輸入。
42、 如權(quán)利要求39所述的計算機可讀媒體,其中所述搜索查詢是根據(jù)一當前用 戶狀態(tài)自動產(chǎn)生。
43、 如權(quán)利要求42所述的計算機可讀媒體,其中所述當前用戶狀態(tài)是至少部分 地通過至少一個實時事件加以確定。
44、 如權(quán)利要求39所述的計算機可讀媒體,其進一步包括用于對與所述搜索查 詢相關(guān)的網(wǎng)絡(luò)文章進行定位的程序代碼。
45、 如權(quán)利要求44所述的計算機可讀媒體,其進一步包括根據(jù)所述相關(guān)文章及 網(wǎng)絡(luò)文章產(chǎn)生一搜索結(jié)果集合。
46、 一種包含程序代碼的計算機可讀媒體,其包括用于在發(fā)生復(fù)數(shù)個實時事件時實時地捕獲所述實時事件的程序代碼,其中每一實 時事件均包括與一客戶機裝置上的一文章的一用戶交互作用,其中所述文章能夠與復(fù) 數(shù)個客戶機應(yīng)用程序中的至少 一個相關(guān)聯(lián);用于捕獲過去發(fā)生的復(fù)數(shù)個歷史事件的程序代碼,其中每一歷史事件均包括與一 客戶機裝置上的一文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程 序中的至少一個相關(guān)聯(lián),其中實時事件及歷史事件為事件;用于針對每一事件來確定是否應(yīng)為所述事件加索引的程序代碼;及用于如果應(yīng)為所述事件加索引則為所述事件加索引并存儲所述事件及與所述文 章相關(guān)聯(lián)的內(nèi)容中的至少一部分的程序代碼。
47、 一種包含程序代碼的計算機可讀媒體,其包括用于在發(fā)生一事件時實時地捕獲所述事件的程序代碼,其中所述事件包括與一客戶機裝置上的一文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序 中的至少一個相關(guān)聯(lián);用于至少部分地根據(jù)所述事件更新一當前用戶狀態(tài)的程序代碼;及 用于為所述事件加索引并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi)容中的至少一 部分的程序代碼。
48、 如權(quán)利要求47所述的計算機可讀媒體,其中所述事件為一實時事件。
49、 如權(quán)利要求47所述的計算機可讀媒體,其中所述事件為一歷史事件。
50、 一種包含程序代碼的計算機可讀媒體,其包括用于捕獲復(fù)數(shù)個發(fā)生于一客戶機裝置上的事件的程序代碼,其中每一事件均與復(fù) 數(shù)個客戶機應(yīng)用程序中的至少 一個相關(guān)聯(lián);用于為所述事件中的至少一些加索引并對其加以存儲的程序代碼,其中被加索引并存儲的所述事件具有一相關(guān)聯(lián)的客戶機文章; 用于為復(fù)數(shù)個網(wǎng)絡(luò)文章加索引的程序代碼 , 用于接收一搜索查詢的程序代碼;及用于至少部分地根據(jù)所述搜索查詢對相關(guān)客戶機文章及網(wǎng)絡(luò)文章進行定位的程 序代碼。
51、 如權(quán)利要求50所述的計算機可讀媒體,其中所述事件中的至少一些為實時 事件且為實時捕獲的。
52、 如權(quán)利要求51所述的計算機可讀媒體,其中所述搜索查詢是至少部分地根 據(jù)至少一個實施事件而隱含地產(chǎn)生。
全文摘要
本發(fā)明揭示用于從文章中識別并提取信息的系統(tǒng)及方法。在一實施例中,一搜索引擎實施一種方法,其包括在發(fā)生一事件時實時地捕獲所述事件,其中所述事件包括與一客戶機裝置上的一文章的一用戶交互作用,其中所述文章能夠與復(fù)數(shù)個客戶機應(yīng)用程序中的至少一個相關(guān)聯(lián);確定是否應(yīng)為所述事件加索引;且如果應(yīng)為所述事件加索引,則為所述事件加索引并存儲所述事件及與所述文章相關(guān)聯(lián)的內(nèi)容中的至少一部分。
文檔編號G06F11/30GK101111836SQ200580009380
公開日2008年1月23日 申請日期2005年3月30日 優(yōu)先權(quán)日2004年3月31日
發(fā)明者奧馬爾·哈比卜·卡恩, 尼尼亞尼·王, 戴維·馬爾毛羅斯, 斯蒂芬·R·勞倫斯, 米哈伊·弗洛林·約內(nèi)斯庫 申請人:咕果公司