專利名稱:向用戶提供對可能感興趣的信息的訪問的方法與系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及向用戶提供對感興趣的信息的訪問的方法與系統(tǒng)。
背景技術(shù):
諸如家用網(wǎng)絡(luò)等局域網(wǎng)絡(luò)中的聯(lián)網(wǎng)設(shè)備的數(shù)目正在增加,并且其上存儲 的數(shù)據(jù)量也在增加。 一般地,家用網(wǎng)絡(luò)用戶以不同格式在/通過其家用設(shè)備存 儲與訪問幾種類型的內(nèi)容(例如音頻、視頻、圖像、以及其他數(shù)據(jù)文件)。除 訪問這些之外,家用用戶還一般通過廣播電視或者電纜網(wǎng)絡(luò)訪問音頻/視頻廣 播數(shù)據(jù)流。
另外,諸如外部網(wǎng)絡(luò)、因特網(wǎng)(例如萬維網(wǎng))等等源上的可用的信息量
不斷增長。例如,很可能用戶可能在因特網(wǎng)上發(fā)現(xiàn)關(guān)于在用戶的家用網(wǎng)絡(luò)中
的設(shè)備上存儲的至少某些數(shù)據(jù)的有用的信息。很可能用戶可以通過不同的來
源找到大量的不同格式(結(jié)構(gòu)化、半結(jié)構(gòu)化、以及非結(jié)構(gòu)化)的此類相關(guān)信 自-
但是不存在一種系統(tǒng),其允許用戶容易地?zé)o縫地訪問此類相關(guān)信息。用 戶可以達(dá)到這一點的唯一方式為通過利用因特網(wǎng)搜索引擎或者直接訪問用戶 認(rèn)為可能包含此類相關(guān)信息的網(wǎng)站(通過網(wǎng)絡(luò)瀏覽器),手工地進行對所希望 的信息的搜索。由此,用戶被迫要理解與分析大量的信息來識別/訪問用戶正 在尋找的確切信息。
存在幾種現(xiàn)有的方法,其中用戶可以獲得資源網(wǎng)絡(luò)中的信息。在一種方 法中,用戶請求信息。用戶利用關(guān)鍵詞指定信息,然后瀏覽信息以發(fā)現(xiàn)滿足
用戶需求的信息片斷。但是,利用沒有鍵盤的設(shè)備(例如消費電子(CE)設(shè) 備)指定關(guān)鍵詞是一項煩人的工作。
另一種方法涉及使用TV與PC的配置。PC分析TV節(jié)目的字幕,并且將 節(jié)目歸類為一般、新聞、醫(yī)藥、等等。類別的層次是固定的,并且根據(jù)向提 出廣播TV觀眾提出的問題建立。特定節(jié)目的內(nèi)容被映射到固定數(shù)目的類別 上。只有當(dāng)內(nèi)容匹配所指定的類別之一時,用戶才可以觀看附加的信息。查詢被鏈接到固定的來源,這會限制用戶可以重試的信息量。另外,需要PC, 并且當(dāng)PC關(guān)閉時,該系統(tǒng)無法工作。因此,需要一種方法與系統(tǒng),用來分析 與獲得對用戶感興趣的信息,而不會限制具體的信息來源。
發(fā)明內(nèi)容
本發(fā)明提供一種向用戶提供對可能感興趣的信息的訪問的方法與系統(tǒng)。
在一個實施例中,這涉及分析閉合字幕(closed-caption)信息,并且獲得 用戶感興趣的信息,而不會限制具體的信息來源。
在向電子設(shè)備的用戶提供對可能感興趣的信息的訪問時,此類方法有用, 其通過監(jiān)控用戶與該設(shè)備的交互以識別用戶所訪問的信息,根據(jù)所識別的信 息確定關(guān)鍵信息,其中所識別的信息包括閉合字幕信息,并且根據(jù)所述關(guān)鍵 信息,搜索可用來源以尋找用戶可能感興趣的信息。搜索可用來源包括根 據(jù)所述關(guān)鍵信息形成查詢,并且使用該查詢來搜索外部網(wǎng)絡(luò),例如因特網(wǎng)。
此類電子設(shè)備的一個例子為C E設(shè)備,例如接收包括閉合字幕信息的TV 節(jié)目的TV。分析用戶訪問/觀看的TV節(jié)目的閉合字幕信息,并且提取關(guān)鍵信 息。這涉及將閉合字幕信息轉(zhuǎn)換為文本,去除無用詞(stop word),并且根 據(jù)其出現(xiàn)頻率、專有名詞信息、和/或其他標(biāo)準(zhǔn),為剩余的詞排序。排序后的 詞表示用來形成查詢、并且利用諸如可用的因特網(wǎng)搜索引擎等搜索引擎進行 搜索的關(guān)鍵信息,例如關(guān)鍵詞/詞組。搜索結(jié)果被呈現(xiàn)給用戶作為推薦,表示 用戶可能感興趣的信息。用戶可以在推薦中進行選擇用于進一步搜索,以找 到用戶感興趣的其他信息和/或更細(xì)致化的信息。
參照以下描述、權(quán)利要求書、以及附圖,將理解本發(fā)明的這些以及其他 特征、方面、以及優(yōu)點。
圖1顯示實現(xiàn)本發(fā)明實施例的電子設(shè)備的網(wǎng)絡(luò)的例子;
圖2顯示根據(jù)本發(fā)明實施例的、用于分析TV閉合字幕信息以在因特網(wǎng)上
找到相關(guān)信息的例子系統(tǒng)的功能方框圖3A顯示根據(jù)本發(fā)明實施例的、用于分析TV閉合字幕信息以在因特網(wǎng)
上找到相關(guān)信息的處理的例子步驟的流程圖;圖3B顯示在圖3A的處理中的關(guān)鍵詞提取的例子步驟的流程圖;以及 圖4顯示根據(jù)本發(fā)明另 一 實施例的、用于分析TV閉合字幕信息以在因特 網(wǎng)上找到相關(guān)信息的另 一例子系統(tǒng)的功能方框圖。
具體實施例方式
本發(fā)明提供了一種方法與系統(tǒng),用來分析與獲得用戶感興趣的信息,而 不會限制具體的信息來源。通過監(jiān)控用戶與連接到外部網(wǎng)絡(luò)的設(shè)備局域網(wǎng)中 設(shè)備的交互,確定用戶可能感興趣的潛在信息。此類設(shè)備可以為連接到因特 網(wǎng)的局域網(wǎng)(例如家用網(wǎng)絡(luò))中的CE設(shè)備。
在一種實現(xiàn)中,這涉及接收包含閉合字幕(CC)信息的閉合字幕節(jié)目, 并且分析該閉合字幕信息,以尋找指示用戶興趣的關(guān)鍵信息。然后使用該關(guān) 鍵信息來從諸如因特網(wǎng)等信息源找到用戶可能感興趣的相關(guān)信息。
在諸如TV等典型CE設(shè)備上,在缺少鍵盤的情況下,用戶難于通過輸入 關(guān)鍵詞來搜索因特網(wǎng)上的信息。如果用戶正在觀看TV節(jié)目,則這是對于用戶 對該TV節(jié)目的內(nèi)容感興趣的良好指示。因此,通過收集與分析作為該TV節(jié) 目的CC信息而接收的文本,分析該TV節(jié)目的內(nèi)容。另外,從關(guān)于正在觀看 的頻道的信息,收集上下文信息。CC信息與上下文信息可以被組合并且用來 對用戶進行關(guān)于用戶可能感興趣的信息的推薦。
所收集的信息用來確定用戶可能感興趣的一或多個關(guān)鍵詞。然后使用關(guān) 鍵詞來搜索因特網(wǎng)上的相關(guān)信息。例如,如果用戶正在觀看涉及Baltimore 的新聞節(jié)目,則提耳又詞"Baltimore"作為關(guān)鍵詞。使用該關(guān)4建詞來形成查詢, 以通過利用搜索引擎來搜索因特網(wǎng)以尋找信息,例如包括關(guān)于Baltimore市 或者Baltimore Ravens等等的信息的網(wǎng)站。
將搜索結(jié)果呈現(xiàn)給用戶作為推薦,其包括可能的搜索查詢,其可以由用 戶選擇并且被執(zhí)行來找到因特網(wǎng)上用戶可能感興趣的進一步的信息。例如當(dāng) 用戶正在電視上觀看關(guān)于Antartica (南極洲)的紀(jì)錄片時,選擇關(guān)4建詞 Antartica作為關(guān)4建詞,并且在因特網(wǎng)上的搜索返回"polar bears"(北極 熊)作為用戶可能感興趣的推薦。然后用戶選擇該推薦,以找到關(guān)于北極熊 的更多的信息。如果是這樣的話,則向搜索引擎發(fā)送對于"polar bears"的 查詢,并且向用戶顯示結(jié)果。
搜索不限于預(yù)定或者固定數(shù)目的類別或者查詢或者信息來源。在一個例子中,根據(jù)CC信息,識別進行搜索的關(guān)鍵詞??梢韵蛴脩艚ㄗh關(guān)鍵詞,其 中當(dāng)用戶選擇時,利用搜索因特網(wǎng)上可用來源(搜索引擎可用的不同網(wǎng)站) 的搜索引擎,而非預(yù)定和/或固定數(shù)目的來源(例如一或多個特定網(wǎng)站),獲 得附加信息。
圖1顯示根據(jù)本發(fā)明實施例的例子網(wǎng)絡(luò)10 (例如家用網(wǎng)絡(luò))的功能體系
結(jié)構(gòu)。圖1實現(xiàn)以下處理分析TV閉合字幕信息,以在因特網(wǎng)50上找到相 關(guān)信息。網(wǎng)絡(luò)10包括電子設(shè)備20,其可能包含內(nèi)容;以及CE設(shè)備30(例 如TV、 DVD播放器、手機、PDA等等),其可能包含內(nèi)容。網(wǎng)絡(luò)10還包括 接口 40,其將網(wǎng)絡(luò)10連接到外部網(wǎng)絡(luò)50 (例如另一局域網(wǎng)、因特網(wǎng)等等)。 外部網(wǎng)絡(luò)50連接到一或多個服務(wù)器51。雖然分別顯示設(shè)備20與30,但是單 個物理設(shè)備可以包括一或多個邏輯設(shè)備。如下進一步所述,在一個例子中, 可以在圖1的設(shè)備30中,實現(xiàn)根據(jù)上本發(fā)明的、分析TV閉合字幕信息并且 向用戶建議感興趣的信息的處理。
設(shè)備20與30可以分別實現(xiàn)UPnP協(xié)議以在其間通信。本領(lǐng)域技術(shù)人員應(yīng) 該理解:對于其他網(wǎng)絡(luò)通信(例如Jini、 HAVi、 IEEE13M等等),本發(fā)明也 是有用的。另外,網(wǎng)絡(luò)10可以為有線網(wǎng)絡(luò)、無線網(wǎng)絡(luò)、或者其組合。
實現(xiàn)分析TV閉合字幕信息的處理的系統(tǒng)接收TV信號作為輸入。監(jiān)控用 戶正在觀看的頻道,并且分析作為該TV信號的一部分的對應(yīng)的閉合字幕信 息。然后,確定關(guān)4建詞集合,其掌握了用戶正在觀看的內(nèi)容的大意。
圖2顯示根據(jù)本發(fā)明實施例的、用于分析TV閉合字幕信息的例子系統(tǒng) 200的功能方框圖。系統(tǒng)200使用頻道監(jiān)控器201、TV信號到文本轉(zhuǎn)換器202、 無用詞過濾器204、專有名詞檢測器206、索引器208、詞典210、以及關(guān)鍵 詞提取器212。
監(jiān)控器201監(jiān)控TV/電纜信號,并且確定用戶訪問/觀看的頻道信息。該 信息包括閉合字幕信息,通過利用圖3A所示的例子處理300,來分析閉合字 幕信息以提取掌握上下文的確切的詞語。例子處理300包括以下步驟
步驟302:由轉(zhuǎn)換器202利用已知轉(zhuǎn)換方法,將閉合字幕信息轉(zhuǎn)換為文本。
步驟304:由無用詞過濾器204去除文本中的無用詞。無用詞包括本身 沒有意義的詞,例如"of"、 "on"、 "the"等等。
步驟306:利用專有名詞檢測器206,當(dāng)沒有大小寫信息時,通過比較剩余文本中的每個詞與詞典210,檢測(識別)專有名詞。
一般地,專有名
詞以大寫字母開始。在其他情況下,所獲得的文本對大小寫不^:感。詞典210 包括不是專有名詞的詞。如果在詞典210中沒有當(dāng)前詞,則假定其為專有名 詞。專有名詞傳遞有用的上下文信息,因為其指人物、地方、或者事物的特 有名稱。由此,由專有名詞檢測器206對被識別為專有名詞的詞進行標(biāo)記, 以備以后的排序。
步驟308:利用專有名詞檢測器206,當(dāng)存在大小寫信息時,根據(jù)每個詞 第一個字符的大小寫,檢測專有名詞。由專有名詞檢測器206對專有名詞進 行標(biāo)記,以備以后的排序。
步驟310:索引器208記錄剩余文本中的詞,以及其出現(xiàn)的次數(shù)(頻率)。 頻率較高的詞為重要的詞,關(guān)鍵詞從這些重要的詞中選擇。 一旦改變頻道、 或者利用從閉合字幕信息獲得的文本中的特殊字符發(fā)現(xiàn)主題變化,就重置詞 的i己錄。
步驟312:索引器208維持在n秒窗口內(nèi)識別的詞(即在n秒時間段內(nèi) 收到的詞,該n秒時間段可以為最后n秒)及其頻率、以及專有名詞相關(guān)信 息。例如,n=10秒窗口包括在過去10秒中收集的詞。在步驟310中索引的 關(guān)鍵詞覆蓋了正在觀看的整個當(dāng)前TV節(jié)目/故事等等,而在本步驟中討論的 關(guān)鍵詞覆蓋最后'n'秒中收集的TV節(jié)目/故事等等。
步驟314:關(guān)鍵詞提取器212利用所有詞的頻率,從過去n秒中收集的
所有詞中提取感興趣的詞(即關(guān)鍵詞)。
步驟316:在查詢形成模塊205中,利用關(guān)^t詞形成查詢,以通過搜索 模塊207在可用資源(例如因特網(wǎng)50上的搜索引擎)上進行搜索。用戶界面 (UI)模塊203向用戶呈現(xiàn)搜索結(jié)果,作為用于可選的進一步選擇的推薦。
步驟318:用戶在推薦中選擇,其中搜索模塊207利用所選的推薦來搜 索可用資源,以查找用戶感興趣的附加信息。此類附加信息由UI模塊203呈 現(xiàn)給用戶。
步驟316與步驟318允許用戶找到關(guān)于用戶近來在TV上觀看的節(jié)目的更 多的信息,并且,當(dāng)用戶希望為用戶提供用戶感興趣的附加和/或進一步細(xì)化 信息時,可以重復(fù)步驟316與步驟318。
圖3B顯示提取器212執(zhí)行的步驟的例子流程圖,包括
步驟314A:當(dāng)用戶激活TV控制器(例如TV遙控器)上的特定按鈕時,提供包括該用戶動作的用戶請求。應(yīng)用戶請求,關(guān)鍵詞提取器212將最后n
秒中的詞放于一邊作為最重要的詞。
步驟314B:根據(jù)其頻率或者另一排序機制,為每個詞排序。
步驟314C:還利用在步驟308或者310中生成的標(biāo)記,檢查每個詞以確
定專有名詞狀態(tài)。
步驟314D:生成排序列表,其中,在一個例子中,也是專有名詞的高頻 率詞占據(jù)該列表的頂部。然后是高頻率詞,然后是為專有名詞的詞。來自排 序列表的頂部i個詞,與自從TV節(jié)目開始之后識別的高頻率詞和專有名詞一 道,掌握了用戶正在觀看內(nèi)容的上下文。來自排序列表的信息用作關(guān)鍵詞。 在n秒窗口中捕獲的詞表示更細(xì)致水平上的上下文,而自從節(jié)目開始之后捕 獲的專有名詞和高頻率詞表示更高水平上的上下文。
在步驟316與318上,使用電子節(jié)目指南(EPG)信息(其包括關(guān)于電纜 TV、衛(wèi)星TV等等上的TV節(jié)目的信息、正在觀看的頻道的名稱等等),與頻道 和節(jié)目信息一道形成查詢。例如,當(dāng)用戶觀看BBC America上的"Panorama" 節(jié)目時,將"BBC America"與"Panorama"附加到所提取的關(guān)鍵詞上,以提 供該頻道與節(jié)目的上下文文中的相關(guān)信息用于搜索。
另外,所提取的關(guān)鍵詞可以被轉(zhuǎn)換為不同的語言,并且用于搜索來在因 特網(wǎng)50上尋找附加的信息。另外,將關(guān)鍵詞而非句子從一種語言轉(zhuǎn)換為另一 種語言較簡單,并且可以利用一種語言到另一種語言的詞典進行該轉(zhuǎn)換。對 于可能僅理解小部分正在觀看的TV節(jié)目的語言的用戶,這是有利的。
圖4顯示根據(jù)本發(fā)明的、用于分析TV閉合字幕信息以在因特網(wǎng)上找到相 關(guān)信息的另一例子系統(tǒng)400的功能方框圖。該系統(tǒng)400為圖2中系統(tǒng)200的 變體,并且還包括詞組提取器2 14,用來在關(guān)鍵詞之外還識別詞組。詞組的 例子可以為"Baltimore Ravens", 以替才灸關(guān)《建詞"Baltimore"與"Ravens"。
在該實施例中,關(guān)鍵詞提取器212不僅依賴于來自專有名詞檢測器206 與索引器208的信息,而且使用來自詞組提取器2 14的信息來獲得關(guān)鍵詞。 詞組提取器2 14包括詞組識別器功能,其按照一組規(guī)則,利用索引器208記 錄的頻率以及相伴頻率信息,識別重要的詞組。在識別多詞詞組(例如"Uni ted Nations", "Al Quaeda"等等)時,這是重要的。
在運行時,所收集的閉合字幕文本首先經(jīng)過詞組識別器以捕獲詞組,然 后索引所捕獲的詞組。詞組識別器在內(nèi)部維持三個列表專用名詞列表、詞典、以及無用詞列表。詞組識別器對于詞組提取使用N元基方法,其中就概
念來說,為了捕獲長度為'N'個詞的詞組,將尺寸為'N'個詞的窗口滑動通過 文本,并且收集所有可能的(長度為'N'個詞的)詞組。然后,將其通過以下 一組三個規(guī)則,以過濾掉無意義的詞組
1 、以標(biāo)點符號結(jié)尾的詞不能在詞組的中間。
2、對于兩個或更多個詞的詞組長度,第一個詞不能是非以下兩個冠詞的 無用詞'the'(定冠詞)和'a/an'(不定冠詞),而其他詞不能是非以下連接 性無用詞的無用詞'the'、 'on'、 'at'、 ' of' 、 ' in'、 ' by'、 'for'、 'and' 等等。這是因為上述無用詞經(jīng)常用來組合兩個或更多個詞例如"war on terror"、 "wizard of oz,, 、 "the beauty and beast"等等。
3 、將不在詞典中的專用名詞與詞當(dāng)作無意義詞組。
詞組提取器2 14包括術(shù)語提取器功能,其從索引提取最高得分術(shù)語與詞 組。將該術(shù)語與詞組呈現(xiàn)給用戶,并且可以使用該術(shù)語與詞組來進一步搜索 以提供用戶感興趣的附加信息。
可替換地,詞組提取器2 14包括自然語言處理(NLP)標(biāo)記器以及提取 重要詞組的提取規(guī)則集合。在運行時,NLP標(biāo)記器將閉合字幕文本中的每個 詞標(biāo)記其詞性(即,該詞為"名詞"、"形容詞"、"專有名詞"等等)。提取規(guī) 則定義了此類標(biāo)記的重要的序列類型。例如, 一條規(guī)則可以為提取為"多于 一個'專有名詞'的序列"的詞組,另一條規(guī)則可以為提取"一或多個'形容詞 '之后為一或多個'名詞'的序列"。詞組提取器將這些規(guī)則應(yīng)用到詞性標(biāo)記器 標(biāo)記的文本,并且提取遵守這些序列的詞組。其還可以用來通過利用適當(dāng)?shù)?規(guī)則,提取單個詞的關(guān)鍵詞。
在一個例子中,在圖2和/或圖4中,除因特網(wǎng)/搜索引擎50之外的所有 元件都駐留在CE設(shè)備(例如CE設(shè)備30 )上。在另一個例子中,在圖2和/ 或圖4中,因特網(wǎng)/搜索引擎50駐留在因特網(wǎng)上,詞典210駐留在網(wǎng)絡(luò)上(局 域網(wǎng)或者因特網(wǎng)),而其他元件駐留在CE設(shè)備30上。
雖然在此處提供的例子中,使用TV來接收閉合字幕信息,但是本發(fā)明可 以用于根據(jù)本發(fā)明的、接收可以用來分析以確定和搜索用戶感興趣的信息的 其他設(shè)備(例如音樂播放器等等)。
另外,雖然在圖1中,用來接收包括閉合字幕信息的節(jié)目的CE設(shè)備30 顯示被連接到家用網(wǎng)絡(luò),但是不需要此類家用網(wǎng)絡(luò),并且CE設(shè)備可以為從電纜、衛(wèi)星、DSL或者其他節(jié)目來源接收節(jié)目的獨立設(shè)備,而不用連接到家用
網(wǎng)絡(luò)。此類獨立設(shè)備僅需要被連接到例如連接到因特網(wǎng)50的信息來源,而不
需要家用/局域網(wǎng)絡(luò)。另外,本發(fā)明可以在可以為獨立設(shè)備或者可以連接到家
用/局域網(wǎng)絡(luò)的非CE設(shè)備(例如圖1中的設(shè)備20)中實現(xiàn)。另外,雖然在此 處的例子中閉合字幕信息用來分析與確定用戶的興趣,但是在另一實現(xiàn)中, 本發(fā)明可用于表示用戶正在訪問/觀看的節(jié)目或者內(nèi)容的類型的其他類型的 信息。
如本領(lǐng)域技術(shù)人員所知,可以許多方式實現(xiàn)根據(jù)本發(fā)明的上述的示例體 系結(jié)構(gòu),例如由處理器執(zhí)行的程序指令、邏輯電路、應(yīng)用專用集成電路、固 件等等。已經(jīng)較詳細(xì)地參照其某些優(yōu)選版本描述了本發(fā)明;但是其他版本是 可能的。因此,權(quán)利要求的精神與范圍不應(yīng)該限于此處包含的對優(yōu)選版本的 描述。
1權(quán)利要求
1.一種向電子設(shè)備的用戶提供對可能感興趣的信息的訪問的方法,包括以下步驟監(jiān)控該用戶與該設(shè)備的交互,以識別該用戶先前訪問的信息;根據(jù)所識別的信息,確定關(guān)鍵信息,其中所識別的信息具有與其關(guān)聯(lián)的閉合字幕信息;以及根據(jù)所述關(guān)鍵信息,搜索可用資源,以尋找該用戶可能感興趣的信息。
2. 如權(quán)利要求1所述的方法,還包括以下步驟向該用戶提供所述可能 感興趣的信息。
3. 如權(quán)利要求1所述的方法,其中所述搜索可用資源還包括以下根據(jù) 所述關(guān)鍵信息,形成查詢;以及利用該查詢,搜索外部網(wǎng)絡(luò)。
4. 如權(quán)利要求1所述的方法,其中 所述設(shè)備包括電視機;所述監(jiān)控步驟還包括以下步驟監(jiān)控該用戶與該電視機的交互;以及 所述確定關(guān)鍵信息的步驟包括分析通過該電視機提供給該用戶的所述 閉合字幕信息,以確定所述關(guān)鍵信息。
5. 如權(quán)利要求1所述的方法,其中所述確定關(guān)鍵信息的步驟包括分析 關(guān)于該用戶通過該設(shè)備選擇進行訪問的內(nèi)容的閉合字幕信息。
6. 如權(quán)利要求5所述的方法,其中所述監(jiān)控步驟還包括監(jiān)控該用戶通 過該設(shè)備選擇訪問哪個內(nèi)容。
7. 如權(quán)利要求6所述的方法,其中所述監(jiān)控步驟還包括監(jiān)控通過該用 戶通過該設(shè)備選擇訪問的頻道提供的所述閉合字幕信息。
8. 如權(quán)利要求6所述的方法,其中所述確定關(guān)鍵信息的步驟包括分析
9. 如權(quán)利要求8所述的方法,其中所述分析步驟還包括 將所述閉合字幕信息轉(zhuǎn)換為文本;以及分析該文本,以確定該用戶感興趣的關(guān)4建詞和/或關(guān)4建詞組。
10. 如權(quán)利要求8所述的方法,其中所述分析步驟還包括以下步驟 將所述閉合字幕信息轉(zhuǎn)換為文本; 去除該文本中的無用詞;以及根據(jù)該文本中的剩余信息的出現(xiàn)次數(shù),選擇此類信息作為所述關(guān)鍵信息。
11. 如權(quán)利要求8所述的方法,其中所述分析步驟還包括 將所述閉合字幕信息轉(zhuǎn)換為文本; 去除該文本中的無用詞;對于每個剩余的詞,當(dāng)不存在大小寫信息時,通過比較該詞與詞典,檢 測專有名詞;否則,根據(jù)每個詞的第一個字符的大小寫,檢測專有名詞; 確定并且索引剩余的詞的出現(xiàn)頻率;以及根據(jù)頻率以及相關(guān)的專有名詞檢測情況,提取該用戶感興趣的詞。
12. 如權(quán)利要求11所述的方法,其中所述提取感興趣的詞的步驟還包括: 根據(jù)特定排序標(biāo)準(zhǔn),排序剩余詞集合;檢查剩余詞集合,以尋找專有名詞;以及從排序后的詞與專有名詞,生成排序列表作為關(guān)鍵詞,其中高排位詞與 專有名詞優(yōu)先級較高。
13. 如權(quán)利要求12所述的方法,其中所述詞集合從n秒時間段中選擇。
14. 如權(quán)利要求1所述的方法,還包括以下步驟向該用戶提供搜索結(jié)果,作為該用戶可能感興趣的信息; 接收用戶對所述用戶可能感興趣信息的選擇;以及 根據(jù)用戶選擇的信息,進行對可用資源的進一步搜索,以尋找用戶可能 感興趣的附加信息。
15. 如權(quán)利要求1所述的方法,其中 所述設(shè)備連接到局域網(wǎng);以及所述搜索可用資源還包括根據(jù)所述關(guān)鍵信息,形成查詢,并且利用該 查詢,搜索因特網(wǎng)。
16. —種向設(shè)備的用戶提供對可能感興趣的信息的訪問的系統(tǒng),包括 監(jiān)控器,其被配置來監(jiān)控該用戶與該設(shè)備的交互;分析器,其被配置來根據(jù)所識別的信息,確定關(guān)鍵信息,其中所識別 的信息包括閉合字幕信息;以及搜索模塊,其被配置來根據(jù)所述關(guān)鍵信息,搜索尋找該用戶可能感興 趣的信息。
17. 如權(quán)利要求16所述的系統(tǒng),其中所述搜索模塊還被配置來根據(jù)所 述關(guān)鍵信息,造成對可用資源的搜索,以尋找該用戶可能感興趣的信息。
18. 如權(quán)利要求17所述的系統(tǒng),還包括被配置來向該用戶顯示搜索結(jié) 果作為所述用戶可能感興趣的信息的模塊。
19. 如權(quán)利要求17所述的系統(tǒng),其中所述分析器還被配置來根據(jù)所述 關(guān)鍵信息,形成查詢;以及利用該查詢,造成對外部網(wǎng)絡(luò)的搜索。
20. 如權(quán)利要求17所述的系統(tǒng),其中 所述設(shè)備包括電視機;所述監(jiān)控器還被配置來監(jiān)控該用戶與該電視機的交互;以及 所述分析器還被配置來分析通過該電視機提供給該用戶的所述閉合字 幕信息,以確定所述關(guān)鍵信息。
21. 如權(quán)利要求20所述的系統(tǒng),其中所述監(jiān)控器還被配置來監(jiān)控該用 戶選擇在該電視機上接收哪些信息。
22. 如權(quán)利要求21所述的系統(tǒng),其中所述監(jiān)控器還被配置來監(jiān)控該用 戶選擇在該電視機上觀看哪些頻道。
23. 如權(quán)利要求22所述的系統(tǒng),其中所述監(jiān)控器還被配置來監(jiān)控通過 該用戶選擇在該電視機上觀看的頻道提供的所述閉合字幕信息。
24. 如權(quán)利要求22所述的系統(tǒng),其中所述分析器還被配置來通過分析 通過該用戶選擇在該電視機上觀看的頻道提供的所述閉合字幕信息,確定所 述關(guān)鍵信息。
25. 如權(quán)利要求23所述的系統(tǒng),其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本;以及 提取器,其被配置來分析該文本,以確定該用戶可能感興趣的關(guān)鍵詞和/或關(guān)鍵詞組。
26. 如權(quán)利要求23所述的系統(tǒng),其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本; 無用詞過濾器,其被配置來去除該文本中的無用詞;以及 提取器,其被配置來確定該用戶感興趣的詞作為關(guān)鍵詞。
27. 如權(quán)利要求23所述的系統(tǒng),其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本; 無用詞過濾器,其被配置來去除該文本中的無用詞; 索引器,其被配置來確定剩余詞的出現(xiàn)頻率;以及提取器,其被配置來根據(jù)出現(xiàn)頻率,確定該用戶感興趣的詞作為關(guān)鍵寸司。
28. 如權(quán)利要求23所述的系統(tǒng),其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本; 無用詞過濾器,其被配置來去除該文本中的無用詞; 索引器,其被配置來確定剩余詞的出現(xiàn)頻率;專有名詞檢測器,其被配置使得對于每個剩余的詞,當(dāng)不存在大小寫 信息時,該專有名詞檢測器通過比較該詞與詞典,檢測專有名詞;否則,該 專有名詞檢測器根據(jù)該詞的第一個字符的大小寫,檢測專有名詞;以及提取器,其被配置來根據(jù)出現(xiàn)頻率以及相關(guān)的專有名詞檢測情況,確 定該用戶感興趣的詞作為關(guān)鍵詞。
29. 如權(quán)利要求27所述的系統(tǒng),其中所述提取器還被配置來根據(jù)特定 排序標(biāo)準(zhǔn),排序剩余詞集合;從排序后的詞與專有名詞,生成排序列表;以 及從該排序列表生成關(guān)鍵詞。
30. 如權(quán)利要求26所述的系統(tǒng),其中所述詞集合從n秒時間段中選擇。
31. 如權(quán)利要求18所述的系統(tǒng),其中所述模塊還被配置來向該用戶提供搜索結(jié)果,作為該用戶可能感興趣 的信息;以及接收用戶對所述用戶可能感興趣信息的選擇;以及所述分析器被配置來根據(jù)用戶選擇的信息,造成對可用資源的進一步 搜索,以尋找用戶可能感興趣的附加信息。
32. 如權(quán)利要求16所述的系統(tǒng),其中 所述電子設(shè)備被配置來連接到局域網(wǎng);以及所述分析器還被配置來根據(jù)所述關(guān)鍵信息,形成查詢,并且利用該查 詢,造成對因特網(wǎng)的搜索。
33. —種電子設(shè)備,包括控制器,其被配置來向該設(shè)備的用戶提供對可能感興趣的信息的訪問, 該控制器包括監(jiān)控器,其被配置來監(jiān)控該用戶與該設(shè)備的交互;分析器,其被配置來根據(jù)所識別的信息,確定關(guān)鍵信息,其中所識別 的信息包括閉合字幕信息。
34. 如權(quán)利要求33所述的設(shè)備,其中所述分析器還被配置來根據(jù)所述 關(guān)4建信息,造成對可用資源的搜索,以尋找該用戶可能感興趣的信息。
35. 如權(quán)利要求34所述的設(shè)備,還包括被配置來向該用戶顯示搜索結(jié) 果作為所述用戶可能感興趣的信息的模塊。
36. 如權(quán)利要求34所述的設(shè)備,其中所述分析器還被配置來根據(jù)所述 關(guān)鍵信息,形成查詢;以及利用該查詢,造成對外部網(wǎng)絡(luò)的搜索。
37. 如權(quán)利要求34所述的設(shè)備,其中 所述設(shè)備包括電視機;所述監(jiān)控器還被配置來監(jiān)控該用戶與該電視機的交互;以及 所述分析器還被配置來分析通過該電視機提供給該用戶的所述閉合字 幕信息,以確定所述關(guān)鍵信息。
38. 如權(quán)利要求34所述的設(shè)備,其中所述監(jiān)控器還被配置來監(jiān)控該用 戶選擇在該設(shè)備上接收哪些信息。
39. 如權(quán)利要求38所述的設(shè)備,其中所述監(jiān)控器還被配置來監(jiān)控該用 戶選擇在該設(shè)備上觀看哪些頻道。
40. 如權(quán)利要求39所述的設(shè)備,其中所述監(jiān)控器還被配置來監(jiān)控通過 該用戶選擇通過該設(shè)備訪問的頻道提供的所述閉合字幕信息。
41. 如權(quán)利要求39所述的設(shè)備,其中所述分析器還被配置來通過分析 通過該用戶選擇在該設(shè)備上接收的內(nèi)容提供的所述閉合字幕信息,確定所述 關(guān)4建信息。
42. 如權(quán)利要求40所述的設(shè)備,其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本;以及 提取器,其被配置來分析該文本,以確定該用戶可能感興趣的關(guān)鍵詞和/或關(guān)鍵詞組。
43. 如權(quán)利要求40所述的設(shè)備,其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本; 無用詞過濾器,其被配置來去除該文本中的無用詞;以及 提取器,其被配置來確定該用戶感興趣的詞作為關(guān)鍵詞。
44. 如權(quán)利要求40所述的設(shè)備,其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本; 無用詞過濾器,其被配置來去除該文本中的無用詞; 索引器,其被配置來確定剩余詞的出現(xiàn)頻率;以及提取器,其被配置來根據(jù)出現(xiàn)頻率,確定該用戶感興趣的詞作為關(guān)鍵詞。
45. 如權(quán)利要求40所述的設(shè)備,其中所述分析器包括 轉(zhuǎn)換器,其被配置來將所述閉合字幕信息轉(zhuǎn)換為文本; 無用詞過濾器,其被配置來去除該文本中的無用詞; 索引器,其被配置來確定剩余詞的出現(xiàn)頻率;專有名詞檢測器,其被配置使得對于每個剩余的詞,當(dāng)不存在大小寫 信息時,該專有名詞檢測器通過比較該詞與詞典,檢測專有名詞;否則,該 專有名詞檢測器根據(jù)該詞的第一個字符的大小寫,檢測專有名詞;以及提取器,其被配置來根據(jù)出現(xiàn)頻率以及相關(guān)的專有名詞;險測情況,確 定該用戶感興趣的詞作為關(guān)4建詞。
46. 如權(quán)利要求43所述的設(shè)備,其中所述提取器還被配置來根據(jù)特定 排序標(biāo)準(zhǔn),排序剩余詞集合;從排序后的詞與專有名詞,生成排序列表;以 及從該排序列表生成關(guān)鍵詞。
47. 如權(quán)利要求43所述的設(shè)備,其中所述詞集合從n秒時間段中選擇。
48. 如權(quán)利要求18所述的設(shè)備,其中所述模塊還被配置來向該用戶提供搜索結(jié)果,作為該用戶可能感興趣 的信息;以及接收用戶對所述用戶可能感興趣信息的選擇;以及所述分析器被配置來根據(jù)用戶選擇的信息,造成對可用資源的進一步 搜索,以尋找用戶可能感興趣的附加信息。
49. 如權(quán)利要求16所述的設(shè)備,其中 所述電子設(shè)備被配置來連接到局域網(wǎng);以及所述分析器被配置來根據(jù)所述關(guān)鍵信息,形成查詢,并且利用該查詢, 造成對因特網(wǎng)的搜索。
全文摘要
本發(fā)明提供一種向用戶提供對可能感興趣的信息的訪問的方法與系統(tǒng)。分析閉合字幕信息,以在因特網(wǎng)上找到相關(guān)信息。監(jiān)控用戶與TV的交互,以確定用戶興趣,該TV接收包括閉合字幕信息的節(jié)目。分析相關(guān)閉合字幕信息,以確定其中的關(guān)鍵信息。使用該關(guān)鍵信息來在諸如因特網(wǎng)等可用資源中搜索信息,并且使用搜索結(jié)果來對用戶進行關(guān)于用戶可能感興趣的信息的推薦。
文檔編號H04N5/445GK101296362SQ20071019623
公開日2008年10月29日 申請日期2007年11月30日 優(yōu)先權(quán)日2007年4月25日
發(fā)明者普昂·古延, 普里揚·拉索德, 米撒恩·謝沙吉里, 阿蘭·梅瑟, 阿納吉薩·康吉撒帕薩姆 申請人:三星電子株式會社