專利名稱:利用標(biāo)記云的內(nèi)容推薦設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及內(nèi)容推薦設(shè)備和方法,并具體地,涉及(a)利用分配給內(nèi)容 的標(biāo)記云(tag cloud)來計(jì)算用戶之間的相似性并(b)基于所計(jì)算的相似性 向用戶推薦內(nèi)容的內(nèi)容推薦設(shè)備和方法。
背景技術(shù):
隨著因特網(wǎng)的普及性繼續(xù)增加,可用內(nèi)容的數(shù)量繼續(xù)幾何增加。特別是, 運(yùn)動(dòng)圖像類型UCC (用戶創(chuàng)建內(nèi)容)的數(shù)目爆炸性增加。在該環(huán)境下,具有 有限信息和有限時(shí)間的用戶在發(fā)現(xiàn)滿足他們的興趣的內(nèi)容方面存在困難。因 此正越來越多地使用推薦系統(tǒng),以基于用戶的傾向(inclinations )和偏好向用 戶推薦合適的內(nèi)容。已知推薦系統(tǒng)通過確定與目標(biāo)用戶具有相似傾向的用戶 鄰居并利用目標(biāo)用戶和用戶鄰居的用戶之間的關(guān)系,來推薦內(nèi)容。
然而,傳統(tǒng)推薦技術(shù)具有以下限制。首先,在顯式(explicit)數(shù)據(jù)收集 的情況下,用戶購買、使用和/或評(píng)估的內(nèi)容的實(shí)際數(shù)目通常很小,并由此可 推薦的內(nèi)容數(shù)量是有限的。
而且,傳統(tǒng)推薦技術(shù)通常基于與目標(biāo)用戶使用相同內(nèi)容的那些用戶,來 選擇與目標(biāo)用戶相似的用戶。由此,相似用戶的范圍可能是有限的,并因此 可推薦內(nèi)容的范圍也可能是有限的,這可能導(dǎo)致不期望的內(nèi)容的推薦。
此外,在內(nèi)容的數(shù)目大于用戶的數(shù)目的情況下,與目標(biāo)用戶使用相同內(nèi) 容的用戶的數(shù)目通常很小。由此,很難發(fā)現(xiàn)與目標(biāo)用戶相似的用戶。
傳統(tǒng)推薦技術(shù)的另 一限制在于基于目標(biāo)用戶過去使用的內(nèi)容來選擇相似 用戶。然后,僅推薦與目標(biāo)用戶過去感興趣的主題相關(guān)的內(nèi)容。似和目標(biāo)用戶實(shí)際使用的內(nèi)容的覆蓋率很低,例如大約僅10%到30%。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種通過使用分配給內(nèi)容的標(biāo)記云來增加內(nèi)容的覆 蓋率的內(nèi)容推薦設(shè)備和方法。在內(nèi)容數(shù)量大的那些情況下,本發(fā)明通過有效 發(fā)現(xiàn)與目標(biāo)用戶相似的用戶,來增加推薦性能。
根據(jù)本發(fā)明第 一方面的內(nèi)容推薦設(shè)備經(jīng)由網(wǎng)絡(luò)提供內(nèi)容推薦服務(wù),并包 括內(nèi)容標(biāo)記云生成模塊,被配置為通過分析向每一內(nèi)容分配的標(biāo)記并累加每 一內(nèi)容的每個(gè)標(biāo)記的頻率,來生成內(nèi)容標(biāo)記云。該內(nèi)容推薦設(shè)備還包括用戶 標(biāo)記云生成模塊、相似性計(jì)算模塊、和推薦模塊。該用戶標(biāo)記云生成模塊被 配置為通過累加用戶使用的內(nèi)容的每個(gè)標(biāo)記的頻率,來生成用戶標(biāo)記云。該 相似性計(jì)算模塊被配置為利用用戶標(biāo)記云來計(jì)算用戶之間的相似性,而該推 薦模塊被配置為通過基于所計(jì)算的用戶之間的相似性計(jì)算目標(biāo)用戶將使用特 定內(nèi)容的可能性,來推薦內(nèi)容。
根據(jù)本發(fā)明第二方面的內(nèi)容推薦方法經(jīng)由網(wǎng)絡(luò)提供內(nèi)容推薦服務(wù),并包 括以下步驟(a)通過分析分配給每一內(nèi)容的標(biāo)記并累加每一內(nèi)容的每個(gè)標(biāo) 記的頻率,來生成內(nèi)容標(biāo)記云;(b)通過累加用戶使用的內(nèi)容的每個(gè)標(biāo)記的 頻率,來生成用戶標(biāo)記云;(c)利用用戶標(biāo)記云來計(jì)算用戶之間的相似性; 和(d)通過基于所計(jì)算的用戶之間的相似性計(jì)算目標(biāo)用戶將使用特定內(nèi)容的 可能性,來推薦內(nèi)容。
考慮到結(jié)合附圖進(jìn)行的詳細(xì)描述,本發(fā)明的特征和優(yōu)點(diǎn)將變得更明顯, 其中相同的附圖標(biāo)記始終表示相同的部分,并且其中
圖1圖示了根據(jù)本發(fā)明實(shí)施例的內(nèi)容推薦系統(tǒng)的網(wǎng)絡(luò)配置; 圖2圖示了圖1的服務(wù)管理單元的實(shí)施例; 圖3圖示了圖1的內(nèi)容推薦單元的實(shí)施例;
圖4是圖示了根據(jù)本發(fā)明實(shí)施例的構(gòu)造內(nèi)容標(biāo)記云的處理的流程圖; 圖5是圖示了根據(jù)本發(fā)明實(shí)施例的構(gòu)造用戶標(biāo)記云的處理的流程圖;和 圖6是圖示了根據(jù)本發(fā)明實(shí)施例的推薦內(nèi)容的處理的流程圖。
具體實(shí)施例方式
圖1示出了根據(jù)本發(fā)明的內(nèi)容推薦系統(tǒng)的網(wǎng)絡(luò)配置。該內(nèi)容推薦系統(tǒng)包
括經(jīng)由網(wǎng)絡(luò)130與內(nèi)容推薦服務(wù)器200耦接的多個(gè)用戶終端110。網(wǎng)絡(luò)130
能夠發(fā)送和接收內(nèi)容,并可以是例如因特網(wǎng)、移動(dòng)通信網(wǎng)絡(luò)或者有線或無線
網(wǎng)絡(luò)。用戶終端110最好具有有線或無線因特網(wǎng)瀏覽器,并可利用瀏覽器連 接到內(nèi)容推薦服務(wù)器200。用戶終端110能夠接收內(nèi)容推薦服務(wù)器200提供 的內(nèi)容,并可以是例如桌上型PC (個(gè)人計(jì)算機(jī))、筆記本PC、 PDA(個(gè)人數(shù) 字助理)或移動(dòng)通信終端。內(nèi)容推薦服務(wù)器200向用戶終端IIO處的用戶推 薦內(nèi)容。內(nèi)容推薦服務(wù)器200提供的內(nèi)容可包括運(yùn)動(dòng)圖像、靜止圖像、聲源 (例如,MP3文件)、或廣告。
內(nèi)容推薦服務(wù)器200向經(jīng)由網(wǎng)絡(luò)130與服務(wù)器200相連的用戶終端110 提供包括內(nèi)容和內(nèi)容推薦服務(wù)的萬維網(wǎng)站點(diǎn)。如圖1所示,根據(jù)本發(fā)明,內(nèi) 容推薦服務(wù)器200包括服務(wù)管理單元210和內(nèi)容推薦單元230。服務(wù)管理單 元210存儲(chǔ)和管理要提供給多個(gè)用戶終端IIO的各種內(nèi)容。當(dāng)連接了用戶終 端110時(shí),服務(wù)管理單元210向用戶終端IIO提供包括內(nèi)容的萬維網(wǎng)站點(diǎn)。 服務(wù)管理單元210向用戶終端IIO提供標(biāo)記設(shè)置接口,使得用戶能夠向萬維 網(wǎng)站點(diǎn)中包括的每一內(nèi)容分配相關(guān)字(即,標(biāo)記),并存儲(chǔ)和管理向每一內(nèi)容 分配的標(biāo)記。存儲(chǔ)和管理向每一 內(nèi)容分配的標(biāo)記集作為每一 內(nèi)容的標(biāo)記云。 用戶可向特定音樂-f見頻分配例如一個(gè)或多個(gè)相關(guān)字作為標(biāo)記,例如"性感"、
"奇妙的女孩,,或"跳舞"。服務(wù)管理單元210然后存儲(chǔ)并管理"性感"、"奇 妙的女孩"和"跳舞"作為該音樂視頻的標(biāo)記云。
服務(wù)管理單元210還向多個(gè)用戶終端IIO提供內(nèi)容,并生成、存儲(chǔ)和管 理每一用戶的標(biāo)記云。在任何一個(gè)用戶使用多個(gè)內(nèi)容的情況下,服務(wù)管理單 元210合成該用戶使用的內(nèi)容的標(biāo)記云,生成對(duì)應(yīng)用戶的標(biāo)記云,并存儲(chǔ)和 管理標(biāo)記云。在生成每一用戶的標(biāo)記云時(shí),服務(wù)管理單元210管理標(biāo)記云的 每一標(biāo)記的生成頻率。
內(nèi)容推薦單元230利用服務(wù)管理單元210生成、存儲(chǔ)并管理的用戶的標(biāo) 記云,來選擇具有相似傾向的用戶鄰居。內(nèi)容推薦單元230還基于用戶鄰居 中的用戶使用的內(nèi)容的列表,來向相似用戶鄰居中的用戶推薦內(nèi)容。下面詳 細(xì)描述內(nèi)容推薦算法。圖2示出了根據(jù)本發(fā)明實(shí)施例的圖1的服務(wù)管理單元210的配置。服務(wù) 管理單元210包括內(nèi)容使用列表管理模塊211、內(nèi)容標(biāo)記云生成模塊213、用 戶標(biāo)記云生成模塊215、使用列表數(shù)據(jù)庫212、內(nèi)容標(biāo)記云數(shù)據(jù)庫214、和用 戶標(biāo)記云數(shù)據(jù)庫216。
內(nèi)容使用列表管理模塊211在使用列表數(shù)據(jù)庫212中登記該內(nèi)容推薦服 務(wù)器200向多個(gè)用戶終端IIO提供的各種內(nèi)容中的用戶使用的內(nèi)容列表。內(nèi)' 容使用列表管理模塊211還管理該內(nèi)容使用列表。當(dāng)用戶終端IIO與內(nèi)容推 薦服務(wù)器200相連并使用特定內(nèi)容時(shí),內(nèi)容使用列表管理模塊211在用戶終 端110的用戶標(biāo)識(shí)信息(例如,cookie信息、ID等)中指示該使用,并在使 用列表數(shù)據(jù)庫212中存儲(chǔ)該內(nèi)容使用信息。使用列表數(shù)據(jù)庫212將用戶使用 的內(nèi)容的標(biāo)識(shí)信息映射到每一用戶標(biāo)識(shí)信息,并存儲(chǔ)該映射信息。
內(nèi)容標(biāo)記云生成模塊213在內(nèi)容標(biāo)記云數(shù)據(jù)庫214中登記向該內(nèi)容推薦 服務(wù)器200提供給多個(gè)用戶終端110的各種內(nèi)容分配的標(biāo)記。內(nèi)容標(biāo)記云生 成模塊213管理這些標(biāo)記,向用戶終端IIO提供接口,使得用戶能夠直接將 標(biāo)記分配給內(nèi)容,并從用戶接收分配給內(nèi)容的標(biāo)記。
內(nèi)容標(biāo)記云生成模塊213接收用戶定義的標(biāo)記作為內(nèi)容的標(biāo)記。作為選 擇,內(nèi)容標(biāo)記云生成模塊213向用戶提供多個(gè)預(yù)置標(biāo)記,并接收任一個(gè)標(biāo)記 或多個(gè)標(biāo)記作為內(nèi)容的標(biāo)記。內(nèi)容標(biāo)記云生成模塊213在內(nèi)容標(biāo)記云數(shù)據(jù)庫 214中存儲(chǔ)由用戶向每一內(nèi)容分配的標(biāo)記的頻率。內(nèi)容標(biāo)記云數(shù)據(jù)庫214將 每一 內(nèi)容的標(biāo)識(shí)信息映射到向?qū)?yīng)內(nèi)容分配的標(biāo)記的頻率,并存儲(chǔ)該映射信 息。例如,在用戶#1向運(yùn)動(dòng)圖像A分配"樸智星(Park Ji-Sung)"和"曼徹 斯特聯(lián)合(Manchester United )"的標(biāo)記、而用戶#2向運(yùn)動(dòng)圖像A分配"足球" 和"樸智星,,的標(biāo)記的情況下,在內(nèi)容標(biāo)記云數(shù)據(jù)庫214中構(gòu)造以下作為運(yùn) 動(dòng)圖像A的標(biāo)記云{樸智星2,曼徹斯特聯(lián)合1,足球1}。
內(nèi)容標(biāo)記云生成模塊213構(gòu)造的內(nèi)容標(biāo)記云由以下方程2表示。特別是,
假設(shè)
U^U,,U2,…UJ是用戶的鄰居, V^VhV2,…,Vm〉是內(nèi)容集, T,,t2,…,tn〉是標(biāo)記集,和
fyk是當(dāng)用戶^向內(nèi)容Vj分配標(biāo)記tk時(shí)具有值"1"、否則具有值"0"的
變量,內(nèi)容v,的標(biāo)記云VTC,由以下方程2來表示。方程2
即,VTCj是指示用戶已向特定內(nèi)容Vj分配的每一標(biāo)記tk的總頻率的n維 矢量。
只要用戶使用內(nèi)容,用戶標(biāo)記云生成模塊215就累加向用戶使用的內(nèi)容 分配的標(biāo)記云,并在用戶標(biāo)記云數(shù)據(jù)庫216中存儲(chǔ)這些標(biāo)記云作為用戶標(biāo)記 云。用戶標(biāo)記云生成模塊215根據(jù)標(biāo)記累加對(duì)于用戶使用的內(nèi)容而構(gòu)造的每 一標(biāo)記的頻率,并在用戶標(biāo)記云數(shù)據(jù)庫216中存儲(chǔ)全部標(biāo)記的頻率作為用戶 標(biāo)i己云。
用戶標(biāo)記云生成模塊215構(gòu)造的用戶標(biāo)記云由以下方程3表示。假設(shè)用 戶u,的標(biāo)記云是UTC,,當(dāng)用戶Ui進(jìn)入系統(tǒng)(signs up)時(shí),標(biāo)記云UTC,(其 是n維矢量)被初始化為0。只要用戶u,使用內(nèi)容v」,用戶u,的標(biāo)記云UTC, 就根據(jù)方程3而更新。
方程3<formula>formula see original document page 8</formula>
這里,NVTCj是通過對(duì)VTCj進(jìn)行歸一化而獲得的,NVTC」在方程4中定 義如下 方程4
<formula>formula see original document page 8</formula>
綜合方程3和4, UTC,是每一標(biāo)記的主題中的用戶u,感興趣的分布。用 戶^對(duì)內(nèi)容v」的使用意味著用戶u,對(duì)表示為NVTCj的內(nèi)容的主題感興趣。由 此,方程3表示其中通過內(nèi)容使用行為更新用戶的興趣的處理。
例如,假設(shè){樸智星2,曼徹斯特聯(lián)合1,足球1}被構(gòu)造為運(yùn)動(dòng)圖像A的 標(biāo)記云并且新用戶#1使用運(yùn)動(dòng)圖像八。用戶#1的標(biāo)記云被歸一化并構(gòu)造為{樸 智星1/2,曼徹斯特聯(lián)合1/4,足球1/4}。而且,在用戶#1使用具有標(biāo)記云{李 榮柏(Lee Young-Pyo ) 2,托特納姆(Tottenham) 1,足球1)的運(yùn)動(dòng)圖像B島 情況下,運(yùn)動(dòng)圖像B的標(biāo)記云(李榮杓2,托特納姆1,足球1}被歸一化并添 加到用戶#1的標(biāo)記云(樸智星1/2,曼徹斯特聯(lián)合1/4,足球1/4}。最后,{樸智星1/2,曼徹斯特聯(lián)合1/4,李榮杓1/2,托特納姆1/4,足球1/2}被構(gòu)造為用 戶#1的標(biāo)記云。這里,根據(jù)生成全部標(biāo)記的處理,在n維矢量的標(biāo)記云中安
排標(biāo)記的頻率。
圖3示出了根據(jù)本發(fā)明實(shí)施例的圖1的內(nèi)容推薦單元230的配置。內(nèi)容 推薦單元230包括用戶相似性計(jì)算模塊231和內(nèi)容推薦模塊233。用戶相似 性計(jì)算模塊231利用在用戶標(biāo)記云數(shù)據(jù)庫216中存儲(chǔ)的用戶的標(biāo)記云來計(jì)算 每一用戶之間的相似性。用戶相似性計(jì)算模塊231基于用戶標(biāo)記云數(shù)據(jù)庫216 中存儲(chǔ)的用戶標(biāo)記云,來計(jì)算兩個(gè)任意用戶u,和u,,之間的標(biāo)記云相似性。標(biāo) 記云相似性由以下方程5來表示。
假設(shè)兩個(gè)任意用戶u,和u,,之間的標(biāo)記云相似性為sim(Ui,u,,),用戶u,的標(biāo) 記云為UTC嚴(yán)(a a 2',…,a n〕,而用戶u「的標(biāo)記云為UTC嚴(yán)(a a a /),貝'j sim(u,,iv)可被計(jì)算為方程5所示的兩個(gè)矢量之間的每一角度 的余弦值。
方程5
這里,UTC, UTCi,是兩個(gè)矢量UTC,和UTd,的點(diǎn)積。
內(nèi)容推薦模塊233使用該用戶相似性計(jì)算模塊231計(jì)算的目標(biāo)用戶和^r 意用戶之間的相似性,對(duì)于所有內(nèi)容計(jì)算目標(biāo)用戶將使用特定內(nèi)容的可能性。 內(nèi)容推薦模塊233按照遞減次序的可能性來向目標(biāo)用戶推薦內(nèi)容。這時(shí),內(nèi) 容推薦模塊233排除目標(biāo)用戶已使用過的內(nèi)容。而且,在計(jì)算目標(biāo)用戶將使 用特定內(nèi)容的可能性時(shí),當(dāng)應(yīng)立即改變推薦列表時(shí),只要目標(biāo)用戶使用了新 內(nèi)容,內(nèi)容推薦模塊233就更新該可能性,或者否則,就在周期性更新處理 的類型中同時(shí)更新所有用戶的可能性。
內(nèi)容推薦模塊233計(jì)算目標(biāo)用戶將使用特定內(nèi)容的可能性的處理由方程 6表示
方程6
二A2^朋(W,, )X/7^
這里,U是與目標(biāo)用戶u,類似的用戶鄰居,而p,,,」是指示用戶^是否使用特定內(nèi)容Vj的變量。當(dāng)用戶Ui使用特定內(nèi)容Vj時(shí)-p,,,j是"1",而當(dāng)用戶
Ui不使用特定內(nèi)容Vj時(shí)-pi,j是"0"。歸一化常數(shù)"k"如下
<formula>formula see original document page 10</formula>
內(nèi)容推薦模塊233 —般將已使用目標(biāo)用戶u,使用的內(nèi)容集之中的至少兩 個(gè)內(nèi)容的用戶的鄰居S,確定為與目標(biāo)用戶相似的用戶鄰居U。然而,在內(nèi)容 的數(shù)目壓倒性地大于用戶的數(shù)目時(shí),已使用了至少兩個(gè)內(nèi)容的用戶的數(shù)目非 常小,并由此很難發(fā)現(xiàn)與目標(biāo)用戶相似的用戶。而且當(dāng)目標(biāo)用戶已使用了正 好一個(gè)內(nèi)容時(shí),不可能確定用戶鄰居U。所以,內(nèi)容推薦模塊233如下確定 用戶鄰居U:
(1) 當(dāng)IS&N時(shí),U=S,;而
(2) 當(dāng)IS^N時(shí),U是基于方程5中計(jì)算的相似性與目標(biāo)用戶最相似的 N個(gè)用戶的鄰居。
這里,N是使得推薦系統(tǒng)的性能最大化而實(shí)驗(yàn)性確定的常數(shù)值。
圖4圖示了根據(jù)本發(fā)明的構(gòu)造內(nèi)容標(biāo)記云的處理。內(nèi)容推薦服務(wù)器200 在主頁等上發(fā)布其中存儲(chǔ)的多個(gè)內(nèi)容(S401 )。內(nèi)容可以是自己創(chuàng)建的內(nèi)容和 /或UCC (用戶創(chuàng)建的內(nèi)容),并可包括運(yùn)動(dòng)圖像、照片或廣播。當(dāng)內(nèi)容推薦 服務(wù)器200在主頁等上發(fā)布所述多個(gè)內(nèi)容時(shí),用戶可使用用戶終端110而連 接到內(nèi)容推薦服務(wù)器200的主頁,并可訪問/使用所述多個(gè)內(nèi)容。
當(dāng)用戶使用特定內(nèi)容時(shí),內(nèi)容推薦服務(wù)器200向用戶終端110提供相關(guān) 接口,使得用戶能分配指示對(duì)應(yīng)內(nèi)容的特征的標(biāo)記。更具體地,內(nèi)容推薦服 務(wù)器200提供接口以使得用戶能夠直接定義內(nèi)容的標(biāo)記,或者向用戶提供用 于選擇的多個(gè)預(yù)定義的標(biāo)記。在用戶定義或選擇標(biāo)記之后,內(nèi)容推薦服務(wù)器 200接收內(nèi)容的標(biāo)記。
當(dāng)用戶使用特定內(nèi)容并通過接口向內(nèi)容分配標(biāo)記時(shí),內(nèi)容推薦服務(wù)器200 存儲(chǔ)分配的標(biāo)記及其生成頻率,作為對(duì)應(yīng)內(nèi)容的標(biāo)記云。內(nèi)容推薦服務(wù)器200 還更新并存儲(chǔ)內(nèi)容使用列表(S403 )。例如,在用戶#1使用運(yùn)動(dòng)圖像A并向 對(duì)應(yīng)運(yùn)動(dòng)圖像A分配標(biāo)記{樸智星,足球}之后,內(nèi)容推薦服務(wù)器200存儲(chǔ)用 于運(yùn)動(dòng)圖像A的標(biāo)記(樸智星,足球}及其生成頻率{1,1}。
接下來,當(dāng)另一用戶使用相同內(nèi)容并通過接口向內(nèi)容分配標(biāo)記時(shí),內(nèi)容 推薦服務(wù)器200更新所存儲(chǔ)的對(duì)應(yīng)內(nèi)容的標(biāo)記云和所存儲(chǔ)的內(nèi)容使用列表 (S405 )。即,內(nèi)容推薦服務(wù)器200更新該內(nèi)容的標(biāo)記、其生成頻率、和內(nèi)容使用列表。例如,假設(shè)運(yùn)動(dòng)圖像A的所存儲(chǔ)的標(biāo)記云的標(biāo)記是(樸智星,足球} 而其生成頻率是{1,1}。當(dāng)向運(yùn)動(dòng)圖像A分配新標(biāo)記(樸智星,曼徹斯特聯(lián)合} 時(shí),將標(biāo)記更新為(樸智星,足球,曼徹斯特聯(lián)合},而將其生成頻率更新為
{2,1,1}。
對(duì)所有用戶使用的所有內(nèi)容反復(fù)執(zhí)行上述處理,以構(gòu)造用于那些內(nèi)容的 標(biāo)記云和內(nèi)容使用列表。該處理由以上方程2來表示。
圖5圖示了根據(jù)本發(fā)明的構(gòu)造用戶標(biāo)記云的處理。在如上針對(duì)圖4描述 的那樣構(gòu)造內(nèi)容推薦服務(wù)器200提供的所有內(nèi)容的標(biāo)記云之后,該處理開始。 當(dāng)新用戶使用內(nèi)容推薦服務(wù)器200提供的內(nèi)容時(shí),然后構(gòu)造對(duì)應(yīng)新用戶的標(biāo) 記云。如圖5中所示,當(dāng)新用戶連接到內(nèi)容推薦服務(wù)器200時(shí),內(nèi)容推薦服 務(wù)器200初始化與新用戶對(duì)應(yīng)的n維(等于內(nèi)容推薦服務(wù)器200生成的標(biāo)記 的數(shù)目)標(biāo)記云(S501 )。
隨后,當(dāng)新用戶使用內(nèi)容推薦服務(wù)器200提供的內(nèi)容中的任一個(gè)時(shí),內(nèi) 容推薦服務(wù)器200通過向初始化后的新用戶的標(biāo)記云添加新用戶使用的內(nèi)容 的標(biāo)記云,來更新新用戶的標(biāo)記云(S503 )。在一些實(shí)現(xiàn)中,內(nèi)容推薦服務(wù)器 200對(duì)內(nèi)容的標(biāo)記生成頻率進(jìn)行歸一化,并將歸一化后的生成頻率添加到新 用戶的標(biāo)記生成頻率。例如,假設(shè)新用戶使用具有標(biāo)記{樸智星,足球,曼徹 斯特聯(lián)合}和標(biāo)記生成頻率{2,1,1}的運(yùn)動(dòng)圖像A。新用戶的標(biāo)記是{樸智星, 足球,曼徹斯特聯(lián)合},而關(guān)聯(lián)的標(biāo)記生成頻率是{2/4,1/4,1/4}={0.5,0.25,0.25}。
當(dāng)新用戶使用內(nèi)容推薦服務(wù)器200提供的另 一 內(nèi)容時(shí),內(nèi)容推薦服務(wù)器 200在S503處生成的新用戶的標(biāo)記云上累加所述另一內(nèi)容的標(biāo)記云,以更新 新用戶的標(biāo)記云(S505 )。這時(shí),內(nèi)容推薦服務(wù)器200最好歸一化對(duì)應(yīng)內(nèi)容的 標(biāo)記生成頻率,并在新用戶的標(biāo)記生成頻率上累加歸一化后的標(biāo)記生成頻率
對(duì)于所有用戶平等地執(zhí)行上述處理,以構(gòu)造那些用戶的標(biāo)記云。這由以 上方程3和4來表示。
圖6圖示了根據(jù)本發(fā)明的推薦內(nèi)容的處理。當(dāng)如上針對(duì)圖5描述的那樣 構(gòu)造用戶的標(biāo)記云時(shí),內(nèi)容推薦服務(wù)器200向任一用戶(其后稱為目標(biāo)用戶) 推薦感興趣的內(nèi)容。為了這樣做,內(nèi)容推薦服務(wù)器200首先基于用戶標(biāo)記云 計(jì)算目標(biāo)用戶和其他用戶之間的"相似性"(S601 )。內(nèi)容推薦服務(wù)器200計(jì) 算目標(biāo)用戶的標(biāo)記云矢量和其他用戶的標(biāo)記云矢量之間的角度的余弦值作為 相似性。所計(jì)算的相似性由以上方程5表示。內(nèi)容推薦服務(wù)器200然后確定和目標(biāo)用戶具有相似傾向的用戶鄰居 (S603 )。假設(shè)用戶鄰居是已使用該目標(biāo)用戶使用的內(nèi)容集之中的至少兩個(gè)內(nèi) 容的Sp則與目標(biāo)用戶相似的用戶鄰居U被如下確定
(1) 當(dāng)IS^N時(shí),1^S!;
(2) 當(dāng)IS,卜N時(shí),U是基于所計(jì)算的相似性與目標(biāo)用戶最相似的N個(gè)用 戶的鄰居。
這里,N是使得推薦系統(tǒng)的性能最大化而實(shí)驗(yàn)性確定的常數(shù)值。 在確定了用戶鄰居之后,內(nèi)容推薦服務(wù)器200基于(a)目標(biāo)用戶和相似 用戶鄰居中的用戶之間的相似性和(b )相似用戶鄰居的用戶的內(nèi)容使用列表, 來對(duì)于目標(biāo)用戶過去沒有使用的所有內(nèi)容而計(jì)算目標(biāo)用戶將使用內(nèi)容的可能 性(S605 )。這由以上方程6表示。
接下來,內(nèi)容推薦服務(wù)器200基于對(duì)于所有內(nèi)容所計(jì)算的目標(biāo)用戶將使 用內(nèi)容的可能性,來按照遞減次序的可能性向目標(biāo)用戶推薦內(nèi)容(S607)。內(nèi) 容推薦服務(wù)器200可按照順序向目標(biāo)用戶推薦所有內(nèi)容,或推薦更高等級(jí)的 一些內(nèi)容。
盡管該實(shí)施例示出了內(nèi)容推薦服務(wù)器200向目標(biāo)用戶推薦單獨(dú)服務(wù),但 是本發(fā)明不限于這方面。在確定了要向目標(biāo)用戶推薦的內(nèi)容之后,除了確定 的推薦的內(nèi)容之外,內(nèi)容推薦服務(wù)器200還可向用戶推薦具有大量?jī)?nèi)容的項(xiàng) 目封裝、或具有大量?jī)?nèi)容的在線商店或網(wǎng)頁。由此,圖l的內(nèi)容推薦單元230 可包括封裝和網(wǎng)頁推薦模塊,用于向用戶推薦具有該內(nèi)容推薦模塊233可向 目標(biāo)用戶附加推薦的大量?jī)?nèi)容的項(xiàng)目封裝或在線商店。
總之,本發(fā)明(a)基于多個(gè)用戶向內(nèi)容統(tǒng)一分配的標(biāo)記,根據(jù)用戶的內(nèi) 容使用類型,而生成并更新用戶的標(biāo)記云,(b)測(cè)量用戶之間的相似性,和 (c)向用戶推薦更適當(dāng)和合適的內(nèi)容。 、
相似性,并且盡管這兩個(gè)用戶不使用相同內(nèi)容,但是用戶可被標(biāo)識(shí)為具有相 似傾向的用戶鄰居。傳統(tǒng)上,用戶使用用戶給予相同內(nèi)容的標(biāo)志或相同內(nèi)容 的購買信息的平均值,來推導(dǎo)兩個(gè)用戶之間的相似性。然而,這樣的傳統(tǒng)方
法具有大內(nèi)容集的低覆蓋率,而本發(fā)明有利地具有大內(nèi)容集的高覆蓋率。
根據(jù)本發(fā)明的推薦設(shè)備和方法可合并為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì)算機(jī) 可讀代碼。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括用于存儲(chǔ)計(jì)算機(jī)系統(tǒng)可讀的數(shù)據(jù)的各種存儲(chǔ)裝置。例如,計(jì)算機(jī)可讀介質(zhì)可以是CD-ROM (致密盤只讀存儲(chǔ)器)、 RAM (隨機(jī)存取存儲(chǔ)器)、ROM(只讀存儲(chǔ)器)、軟盤、硬盤、或磁光盤。
盡管本說明書包括許多細(xì)節(jié),但是這些不應(yīng)被解釋為對(duì)本發(fā)明或要求保 護(hù)的內(nèi)容的范圍的限制,而相反,它們應(yīng)被解釋為可對(duì)于本發(fā)明的某些實(shí)施 例特定的特征的描述。這里在單獨(dú)實(shí)施例的上下文中描述的某些特征也可以 在單一實(shí)施例中實(shí)現(xiàn)。相反,單一實(shí)施例的上下文中描述的各種特征也可以 單獨(dú)或按照任何適當(dāng)子組合在多個(gè)實(shí)施例中實(shí)現(xiàn)。此外,盡管特征可已在上
些情況下可以從該組合實(shí)行來自要求保護(hù)的組合的一個(gè)或多個(gè)特征,并且要 求保護(hù)的組合可以針對(duì)子組合或子組合的變型。
類似地,盡管在圖中按照特定順序描繪了處理,但是這應(yīng)被理解為需要 按照示出的特定順序或依次順序來執(zhí)行這樣的處理,或者需要執(zhí)行所有圖示 的操作,以實(shí)現(xiàn)期望的結(jié)果。注意,在某些情況下,多任務(wù)和并行處理可以 是可能和有利的。此外,上述實(shí)施例中的各種系統(tǒng)組件的分離不應(yīng)被理解為 在所有實(shí)施例中需要這種分離,并且應(yīng)理解可將描述的程序組件和系統(tǒng)一般 一起集成在單一軟件產(chǎn)品中或封裝在多個(gè)軟件產(chǎn)品中。
盡管在上面描述了幾個(gè)實(shí)現(xiàn)和示例,但是本領(lǐng)域技術(shù)人員可進(jìn)行仍然在 本發(fā)明的范圍之內(nèi)的其他實(shí)現(xiàn)、增強(qiáng)和變型。所以,本發(fā)明僅由以下權(quán)利要 求限制。
權(quán)利要求
1. 一種能夠操作以經(jīng)由網(wǎng)絡(luò)提供內(nèi)容推薦服務(wù)的內(nèi)容推薦設(shè)備,該設(shè)備包括內(nèi)容標(biāo)記云生成模塊,被配置為通過分析分配給每一內(nèi)容的標(biāo)記并累加每一內(nèi)容的每個(gè)標(biāo)記的頻率,而生成內(nèi)容標(biāo)記云;用戶標(biāo)記云生成模塊,被配置為通過累加用戶使用的內(nèi)容的每個(gè)標(biāo)記的頻率,而生成用戶標(biāo)記云;相似性計(jì)算模塊,被配置為利用該用戶標(biāo)記云來計(jì)算用戶之間的相似性;和推薦模塊,被配置為通過基于所計(jì)算的用戶之間的相似性計(jì)算目標(biāo)用戶將使用特定內(nèi)容的可能性,而推薦內(nèi)容。
2. 根據(jù)權(quán)利要求1的內(nèi)容推薦設(shè)備,其中,在累加用戶使用的內(nèi)容的每 個(gè)標(biāo)記的頻率時(shí),用戶標(biāo)記云生成模塊對(duì)用戶使用的內(nèi)容的每個(gè)標(biāo)記的頻率 進(jìn)行歸 一化,并累加歸 一化后的每個(gè)標(biāo)記的頻率。
3. 根據(jù)權(quán)利要求2的內(nèi)容推薦設(shè)備,其中該推薦模塊確定與目標(biāo)用戶相 似的用戶鄰居,并基于該目標(biāo)用戶和所確定的用戶鄰居中的用戶之間的相似 性,來推薦內(nèi)容。
4. 根據(jù)權(quán)利要求3的內(nèi)容推薦設(shè)備,其中該推薦模塊基于已使用了該目 標(biāo)用戶使用的內(nèi)容集之中的至少兩個(gè)內(nèi)容的用戶,來確定用戶鄰居。
5. 根據(jù)權(quán)利要求3的內(nèi)容推薦設(shè)備,其中該推薦模塊基于該相似性計(jì)算 模塊所計(jì)算的用戶之間的相似性,來確定與目標(biāo)用戶最相似的用戶鄰居中的 N個(gè)用戶。
6. 根據(jù)權(quán)利要求1的內(nèi)容推薦設(shè)備,其中該相似性計(jì)算模塊計(jì)算兩個(gè)用 戶的標(biāo)記云的兩個(gè)矢量之間的角度的余弦值。
7. 根據(jù)權(quán)利要求1的內(nèi)容推薦設(shè)備,還包括第二推薦模塊,被配置為推 薦具有該推薦模塊推薦的大量?jī)?nèi)容的項(xiàng)目封裝或網(wǎng)頁。
8. —種用于經(jīng)由網(wǎng)絡(luò)提供內(nèi)容推薦服務(wù)的內(nèi)容推薦方法,該方法包括以 下步驟 '通過分析分配給每一 內(nèi)容的標(biāo)記并累加每一 內(nèi)容的每個(gè)標(biāo)記的頻率,而 生成內(nèi)容標(biāo)^己云;通過累加用戶使用的內(nèi)容的每個(gè)標(biāo)記的頻率,而生成用戶標(biāo)記云; 利用該用戶標(biāo)記云來計(jì)算用戶之間的相似性;和 通過基于所計(jì)算的用戶之間的相似性計(jì)算目標(biāo)用戶將使用特定內(nèi)容的可 能性,而推薦內(nèi)容。
9. 根據(jù)權(quán)利要求8的內(nèi)容推薦方法,其中,在累加用戶使用的內(nèi)容的每 個(gè)標(biāo)記的頻率時(shí),生成用戶標(biāo)記云的步驟對(duì)用戶使用的內(nèi)容的每個(gè)標(biāo)記的頻 率進(jìn)行歸 一化,并累加歸 一化后的每個(gè)標(biāo)記的頻率。
10. 根據(jù)權(quán)利要求9的內(nèi)容推薦方法,其中該推薦內(nèi)容的步驟包括 確定與目標(biāo)用戶相似的用戶鄰居;和基于該目標(biāo)用戶和所確定的用戶鄰居中的用戶之間的相似性,來推薦內(nèi)容。
11. 根據(jù)權(quán)利要求10的內(nèi)容推薦方法,其中所述確定相似用戶鄰居的步 驟包括確定已使用了該目標(biāo)用戶使用的內(nèi)容集之中的至少兩個(gè)內(nèi)容的用戶 的鄰居。
12. 根據(jù)權(quán)利要求IO的內(nèi)容推薦方法,其中所述確定相似用戶鄰居的步 驟包括基于在該計(jì)算相似性的步驟中所計(jì)算的用戶之間的相似性,來確定 與目標(biāo)用戶最相似的用戶鄰居中的N個(gè)用戶。 ;
13. 根據(jù)權(quán)利要求8的內(nèi)容推薦方法,其中所述計(jì)算相似性的步驟包括 計(jì)算兩個(gè)用戶的標(biāo)記云的兩個(gè)矢量之間的角度的余弦值。
14. 根據(jù)權(quán)利要求8的內(nèi)容推薦方法,還包括推薦具有該推薦步驟中推 薦的大量?jī)?nèi)容的項(xiàng)目封裝或網(wǎng)頁。
15. —種其上存儲(chǔ)有計(jì)算機(jī)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于在具有處 理器的計(jì)算機(jī)中實(shí)現(xiàn)利用標(biāo)記云的內(nèi)容推薦功能,該功能包括通過分析分配給每一 內(nèi)容的標(biāo)記并累加每一 內(nèi)容的每個(gè)標(biāo)記的頻率,而 生成內(nèi)容才示i己云;通過累加用戶使用的內(nèi)容的每個(gè)標(biāo)記的頻率,而生成用戶標(biāo)記云;利用該用戶標(biāo)記云來計(jì)算用戶之間的相似性;和通過基于所計(jì)算的用戶之間的相似性計(jì)算目標(biāo)用戶將使用特定內(nèi)容的可 能性,而推薦內(nèi)容。
全文摘要
利用標(biāo)記云的內(nèi)容推薦設(shè)備和方法經(jīng)由網(wǎng)絡(luò)提供內(nèi)容推薦服務(wù)。該設(shè)備包括內(nèi)容標(biāo)記云生成模塊,被配置為通過分析分配給每一內(nèi)容的標(biāo)記并累加每一內(nèi)容的每個(gè)標(biāo)記的頻率,而生成內(nèi)容標(biāo)記云。該設(shè)備還包括用戶標(biāo)記云生成模塊,被配置為通過累加用戶使用的內(nèi)容的每個(gè)標(biāo)記的頻率,而生成用戶標(biāo)記云。該設(shè)備還包括相似性計(jì)算模塊和推薦模塊。該相似性計(jì)算模塊被配置為利用該用戶標(biāo)記云來計(jì)算用戶之間的相似性,而該推薦模塊被配置為通過基于所計(jì)算的用戶之間的相似性計(jì)算目標(biāo)用戶將使用特定內(nèi)容的可能性,而推薦內(nèi)容。
文檔編號(hào)G06Q50/00GK101442546SQ20081017828
公開日2009年5月27日 申請(qǐng)日期2008年11月19日 優(yōu)先權(quán)日2007年11月19日
發(fā)明者樸鐘憲 申請(qǐng)人:韓國(guó)科亞電子股份有限公司;首爾大學(xué)校產(chǎn)學(xué)協(xié)力團(tuán)