两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

學(xué)習(xí)裝置和方法、信息處理裝置和方法以及程序的制作方法

文檔序號(hào):6597958閱讀:176來源:國(guó)知局
專利名稱:學(xué)習(xí)裝置和方法、信息處理裝置和方法以及程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及學(xué)習(xí)裝置、學(xué)習(xí)方法、信息處理裝置、數(shù)據(jù)選擇方法、數(shù)據(jù)累積方法、數(shù) 據(jù)轉(zhuǎn)換方法和程序。
背景技術(shù)
近年來,隨著信息技術(shù)的進(jìn)步,已經(jīng)由諸如因特網(wǎng)之類的網(wǎng)絡(luò)向用戶提供諸如音 樂、視頻、書本和新聞報(bào)道之類的各種內(nèi)容。由于在這種內(nèi)容提供服務(wù)中管理著龐大的內(nèi)容 量,所以用戶難以通過其自身找到適合各個(gè)用戶的適當(dāng)內(nèi)容。因此,已利用稱為推薦的技術(shù) 來例如基于用戶的諸如購買或觀看之類的行動(dòng)歷史來獲取用戶的喜好,并且選擇和提議適 合于各個(gè)用戶的內(nèi)容。許多現(xiàn)有推薦技術(shù)的共同點(diǎn)之一是根據(jù)用戶的行動(dòng)歷史來利用通過數(shù)字等來指 示出用戶喜好的用戶喜好數(shù)據(jù)(UP)以執(zhí)行推薦。例如,在稱為協(xié)同過濾(collaborative filtering)的推薦算法中,在不同用戶之間對(duì)用戶喜好數(shù)據(jù)進(jìn)行比較以便指定具有相似 喜好的用戶,然后該用戶在過去使用的內(nèi)容將成為推薦對(duì)象。在日本專利申請(qǐng)?jiān)缙诠?No. 2006-215867和No. 2008-077386中公開了該推薦算法的示例。與此同時(shí),例如,在稱為 基于內(nèi)容的過濾的推薦算法中,對(duì)在共同數(shù)據(jù)空間中的用戶喜好數(shù)據(jù)和指示出內(nèi)容屬性的 內(nèi)容屬性數(shù)據(jù)進(jìn)行比較,然后被確定為適合用戶喜好的內(nèi)容可以成為推薦對(duì)象。

發(fā)明內(nèi)容
但是,存在如下情況其中,用戶喜好數(shù)據(jù)或者內(nèi)容屬性數(shù)據(jù)的數(shù)據(jù)空間由于例如 在要成為推薦對(duì)象的內(nèi)容的領(lǐng)域、生成用戶喜好數(shù)據(jù)的設(shè)備類型、供應(yīng)設(shè)備的銷售商等方 面的差異而彼此不同。當(dāng)數(shù)據(jù)空間不同時(shí),能夠基于用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)而被推 薦的內(nèi)容的范圍將受限。另外,存在如下情況其中,例如由于行動(dòng)歷史累積不充分而使得 難以推薦適當(dāng)內(nèi)容。鑒于以上情形,希望提供新穎且改進(jìn)的學(xué)習(xí)裝置、學(xué)習(xí)方法、信息處理裝置、數(shù)據(jù) 選擇方法、數(shù)據(jù)累積方法、數(shù)據(jù)轉(zhuǎn)換方法和程序,它們能夠在各領(lǐng)域的不同數(shù)據(jù)空間之間共 同管理用戶喜好或內(nèi)容屬性。根據(jù)本發(fā)明一個(gè)實(shí)施例,提供了一種學(xué)習(xí)裝置,該學(xué)習(xí)裝置包括第一數(shù)據(jù)獲取單 元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);第二數(shù)據(jù)獲取單元,獲取與第一用戶喜好 數(shù)據(jù)共同的用戶的第二用戶喜好數(shù)據(jù),第二用戶喜好數(shù)據(jù)屬于與第一數(shù)據(jù)空間不同的第二 數(shù)據(jù)空間;壓縮單元,利用第一參數(shù)集合從第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的 第一經(jīng)壓縮用戶喜好數(shù)據(jù);以及學(xué)習(xí)單元,學(xué)習(xí)第二參數(shù)集合,該第二參數(shù)集合被利用來從 第二用戶喜好數(shù)據(jù)生成具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮 用戶喜好數(shù)據(jù),以使得第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在 多個(gè)用戶間較小。學(xué)習(xí)單元可以以由壓縮單元生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)作為第二經(jīng)壓縮用戶喜好數(shù)據(jù)的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)第二參數(shù)集合。壓縮單元可以根據(jù)多主題模型來生成第一經(jīng)壓縮用戶喜好數(shù)據(jù)。第一參數(shù)集合和第二參數(shù)集合可以是與多主題模型的主題的固有分布相對(duì)應(yīng)的 參數(shù)集合。第一數(shù)據(jù)空間和第二數(shù)據(jù)空間可以是與相互不同的內(nèi)容領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù)空間。第一數(shù)據(jù)空間和第二數(shù)據(jù)空間可以是由相互不同的設(shè)備生成的用戶喜好數(shù)據(jù)的 數(shù)據(jù)空間。根據(jù)本發(fā)明另一實(shí)施例,提供了一種學(xué)習(xí)方法,該方法包括以下步驟獲取屬于第 一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);獲取與第一用戶喜好數(shù)據(jù)共同的用戶的第二用戶喜好數(shù) 據(jù),第二用戶喜好數(shù)據(jù)屬于與第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間;通過利用第一參數(shù)集合 來從第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù);以及學(xué)習(xí)第 二參數(shù)集合,該第二參數(shù)集合被利用來從第二用戶喜好數(shù)據(jù)生成具有與第一經(jīng)壓縮用戶喜 好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),以使得第一經(jīng)壓縮用戶喜好數(shù)據(jù)和 第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。根據(jù)本發(fā)明另一實(shí)施例,提供了一種程序,該程序使得對(duì)信息處理裝置進(jìn)行控制 的計(jì)算機(jī)執(zhí)行如下功能第一數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù); 第二數(shù)據(jù)獲取單元,獲取與所述第一用戶喜好數(shù)據(jù)共同的用戶的第二用戶喜好數(shù)據(jù),所述 第二用戶喜好數(shù)據(jù)屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間;壓縮單元,通過利用第 一參數(shù)集合從所述第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù) 據(jù);以及學(xué)習(xí)單元,學(xué)習(xí)第二參數(shù)集合,所述第二參數(shù)集合被利用來從所述第二用戶喜好數(shù) 據(jù)生成具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù) 據(jù),以使得所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多 個(gè)用戶間較小。根據(jù)本發(fā)明另一實(shí)施例,提供了一種信息處理裝置,該信息處理裝置包括數(shù)據(jù)獲 取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);壓縮單元,通過利用第一參數(shù)集合來 從第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù);存儲(chǔ)單元,存 儲(chǔ)具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的多個(gè)數(shù)據(jù),所述多個(gè)數(shù)據(jù)是通過利 用第二參數(shù)集合從屬于第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)生成的,第二數(shù) 據(jù)空間與第一數(shù)據(jù)空間不同;以及選擇單元,根據(jù)與壓縮單元所生成的第一經(jīng)壓縮用戶喜 好數(shù)據(jù)的相似度來從存儲(chǔ)在存儲(chǔ)單元中的多個(gè)數(shù)據(jù)中選擇至少一個(gè)數(shù)據(jù),其中,存儲(chǔ)在存 儲(chǔ)單元中的多個(gè)數(shù)據(jù)分別是通過利用第二參數(shù)集合來預(yù)先生成的數(shù)據(jù),該第二參數(shù)集合被 學(xué)習(xí)以使得共同用戶(common user)的第一經(jīng)壓縮用戶喜好數(shù)據(jù)和從第二用戶喜好數(shù)據(jù)生 成的第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。根據(jù)本發(fā)明另一實(shí)施例,提供了一種數(shù)據(jù)選擇方法,該方法包括以下步驟獲取屬 于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);通過利用第一參數(shù)集合來從第一用戶喜好數(shù)據(jù)生成 具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù);以及根據(jù)與第一經(jīng)壓縮用戶喜好數(shù)據(jù)的 相似度來從具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的多個(gè)數(shù)據(jù)中選擇至少一 個(gè)數(shù)據(jù),所述多個(gè)數(shù)據(jù)是通過利用第二參數(shù)集合從屬于第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù) 或內(nèi)容屬性數(shù)據(jù)生成的,第二數(shù)據(jù)空間與第一數(shù)據(jù)空間不同,其中,所述多個(gè)數(shù)據(jù)分別是通過利用第二參數(shù)集合來預(yù)先生成的數(shù)據(jù),該第二參數(shù)集合被學(xué)習(xí)以使得共同用戶的第一經(jīng) 壓縮用戶喜好數(shù)據(jù)和從第二用戶喜好數(shù)據(jù)生成的第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在 多個(gè)用戶間較小。根據(jù)本發(fā)明另一實(shí)施例,提供了一種程序,該程序使得對(duì)信息處理裝置進(jìn)行控制 的計(jì)算機(jī)執(zhí)行如下功能數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);壓 縮單元,通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第 一經(jīng)壓縮用戶喜好數(shù)據(jù);存儲(chǔ)單元,存儲(chǔ)具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù) 項(xiàng)目數(shù)的多個(gè)數(shù)據(jù),所述多個(gè)數(shù)據(jù)是通過利用第二參數(shù)集合從屬于第二數(shù)據(jù)空間的第二用 戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)生成的,所述第二數(shù)據(jù)空間與所述第一數(shù)據(jù)空間不同;以及選 擇單元,根據(jù)與所述壓縮單元所生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)的相似度來從存儲(chǔ)在所述 存儲(chǔ)單元中的多個(gè)數(shù)據(jù)中選擇至少一個(gè)數(shù)據(jù),其中,存儲(chǔ)在所述存儲(chǔ)單元中的多個(gè)數(shù)據(jù)分 別是通過利用所述第二參數(shù)集合來預(yù)先生成的數(shù)據(jù),所述第二參數(shù)集合被學(xué)習(xí)以使得共同 用戶的所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和從所述第二用戶喜好數(shù)據(jù)生成的第二經(jīng)壓縮用戶 喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。根據(jù)本發(fā)明另一實(shí)施例,提供了一種信息處理裝置,該裝置包括第一數(shù)據(jù)獲取單 元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);第二數(shù)據(jù)獲取單元,獲取屬于與第一數(shù)據(jù) 空間不同的第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù);第一壓縮單元,通過利用第一參數(shù)集合來 從第一用戶喜好數(shù)據(jù)生成具有較少的數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第一 經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì)中;以及第二壓縮單元,通過利用第二參數(shù)集合來從 第二用戶喜好數(shù)據(jù)生成具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮 用戶喜好數(shù)據(jù),并將該第二經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì)上,其中,第一參數(shù)集合或 第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮用戶喜 好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。根據(jù)本發(fā)明另一實(shí)施例,提供了一種數(shù)據(jù)累積方法,該方法包括以下步驟獲取屬 于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);獲取屬于與第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第 二用戶喜好數(shù)據(jù);通過利用第一參數(shù)集合來從第一用戶喜好數(shù)據(jù)生成具有較少的數(shù)據(jù)項(xiàng)目 數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第一經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì)中;以及 通過利用第二參數(shù)集合來從第二用戶喜好數(shù)據(jù)生成具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同 的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第二經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介 質(zhì)上,其中,第一參數(shù)集合或第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的第一經(jīng)壓縮用戶喜 好數(shù)據(jù)和第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。根據(jù)本發(fā)明另一實(shí)施例,提供了一種程序,該程序使得對(duì)信息處理裝置進(jìn)行控制 的計(jì)算機(jī)執(zhí)行如下功能第一數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù); 第二數(shù)據(jù)獲取單元,獲取屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜好數(shù) 據(jù);第一壓縮單元,通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少的數(shù) 據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第一經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì) 中;以及第二壓縮單元,通過利用第二參數(shù)集合來從所述第二用戶喜好數(shù)據(jù)生成具有與所 述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第二經(jīng) 壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì)上,其中,所述第一參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。根據(jù)本發(fā)明另一實(shí)施例,提供了一種信息處理裝置,包括存儲(chǔ)單元,存儲(chǔ)第一參 數(shù)集合和第二參數(shù)集合,第一參數(shù)集合用來從屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù)生成 具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),第二參數(shù)集合用來從屬于與第一數(shù)據(jù)空 間不同的第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)生成具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的 數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù);以及轉(zhuǎn)換單元,基于存儲(chǔ)在存儲(chǔ)單元中的第一參 數(shù)集合和第二參數(shù)集合來將第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為第二用戶喜好數(shù)據(jù),其中,第一參數(shù) 集合或第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮 用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。轉(zhuǎn)換單元可以根據(jù)第一用戶喜好數(shù)據(jù)的數(shù)據(jù)項(xiàng)目與第二用戶喜好數(shù)據(jù)的數(shù)據(jù)項(xiàng) 目之間的對(duì)應(yīng)關(guān)系來將第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為第二用戶喜好數(shù)據(jù),所述對(duì)應(yīng)關(guān)系是根據(jù) 第一參數(shù)集合和第二參數(shù)集合之間的各數(shù)據(jù)項(xiàng)目的參數(shù)值的相似度來確定的。信息處理裝置還可以包括壓縮單元,該壓縮單元通過利用第一參數(shù)集合來從第一 用戶喜好數(shù)據(jù)生成第一經(jīng)壓縮用戶喜好數(shù)據(jù),并且轉(zhuǎn)換單元可以將能夠通過利用第二參數(shù) 集合生成由壓縮單元生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)的似然(likely)第二用戶喜好數(shù)據(jù) 確定為從第一用戶喜好數(shù)據(jù)轉(zhuǎn)換得到的第二用戶喜好數(shù)據(jù)。根據(jù)本發(fā)明另一實(shí)施例,提供了一種數(shù)據(jù)轉(zhuǎn)換方法,該方法包括基于第一參數(shù)集 合和第二參數(shù)集合來將第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為第二用戶喜好數(shù)據(jù)的步驟,第一參數(shù)集合 用來從屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用 戶喜好數(shù)據(jù),第二參數(shù)集合用來從屬于與第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜 好數(shù)據(jù)生成具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù) 據(jù),其中,第一參數(shù)集合或第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的第一經(jīng)壓縮用戶喜好 數(shù)據(jù)和第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。根據(jù)本發(fā)明另一實(shí)施例,提供了一種程序,該程序使得對(duì)信息處理裝置進(jìn)行控制 的計(jì)算機(jī)執(zhí)行如下功能存儲(chǔ)單元,存儲(chǔ)第一參數(shù)集合和第二參數(shù)集合,所述第一參數(shù)集合 用來從屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用 戶喜好數(shù)據(jù),所述第二參數(shù)集合用來從屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第 二用戶喜好數(shù)據(jù)生成具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓 縮用戶喜好數(shù)據(jù);以及轉(zhuǎn)換單元,基于存儲(chǔ)在所述存儲(chǔ)單元中的所述第一參數(shù)集合和所述 第二參數(shù)集合來將所述第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為所述第二用戶喜好數(shù)據(jù),其中,所述第一 參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng)壓縮用戶喜好數(shù)據(jù) 和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。如上所述,根據(jù)本發(fā)明,可以提供能夠在各領(lǐng)域的不同數(shù)據(jù)空間之間共同管理用 戶喜好或內(nèi)容屬性的學(xué)習(xí)裝置、學(xué)習(xí)方法、信息處理裝置、數(shù)據(jù)選擇方法、數(shù)據(jù)累積方法、數(shù) 據(jù)轉(zhuǎn)換方法和程序。


圖1是圖示出應(yīng)用了與一實(shí)施例相關(guān)聯(lián)的推薦技術(shù)的系統(tǒng)的概要的示意圖2是圖示出圖1的終端設(shè)備的具體配置示例的框圖;圖3是圖示出圖1的信息處理裝置的具體配置示例的框圖;圖4是圖示出從內(nèi)容屬性數(shù)據(jù)計(jì)算用戶喜好數(shù)據(jù)的計(jì)算處理的示意圖;圖5是圖示出根據(jù)多主題模型來壓縮數(shù)據(jù)的處理的示意圖;圖6是圖示出經(jīng)壓縮用戶喜好數(shù)據(jù)和經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)的示例的示意圖;圖7是描述與一實(shí)施例相關(guān)聯(lián)的推薦處理的流程的示例的流程圖;圖8是圖示出根據(jù)一實(shí)施例的學(xué)習(xí)處理的概要的示意圖;圖9是圖示出根據(jù)一實(shí)施例的學(xué)習(xí)裝置的配置示例的框圖;圖10是圖示出根據(jù)一實(shí)施例的執(zhí)行推薦處理的信息處理裝置的配置示例的框 圖;圖11是圖示出根據(jù)一實(shí)施例的執(zhí)行數(shù)據(jù)累積處理的系統(tǒng)的概要的示意圖;圖12是圖示出圖11的終端設(shè)備的具體配置示例的框圖;圖13是圖示出圖11的另一終端設(shè)備的具體配置示例的框圖;圖14是圖示出圖11的信息處理裝置的具體配置示例的框圖;圖15是圖示出根據(jù)一實(shí)施例的執(zhí)行數(shù)據(jù)轉(zhuǎn)換處理的系統(tǒng)的概要的示意圖;圖16是圖示出圖15的信息處理裝置的具體配置示例的框圖;圖17是圖示出對(duì)數(shù)據(jù)項(xiàng)目之間的對(duì)應(yīng)關(guān)系的確定處理的示意圖;圖18是圖示出用戶喜好數(shù)據(jù)的轉(zhuǎn)換處理的示意圖;圖19是圖示出根據(jù)數(shù)據(jù)轉(zhuǎn)換裝置的修改示例的具體配置的框圖;以及圖20是圖示出通用計(jì)算機(jī)的硬件配置的框圖。
具體實(shí)施例方式下文中,將參考附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。注意,在本說明書和附圖中, 用相同標(biāo)號(hào)表示具有基本相同功能和結(jié)構(gòu)的結(jié)構(gòu)元件,并省略對(duì)這些結(jié)構(gòu)元件的重復(fù)說 明。下文中,將按如下順序描述本發(fā)明的優(yōu)選實(shí)施例。1.相關(guān)技術(shù)的描述2.根據(jù)一個(gè)實(shí)施例的學(xué)習(xí)裝置的描述3.根據(jù)一個(gè)實(shí)施例的推薦裝置的描述4.根據(jù)一個(gè)實(shí)施例的數(shù)據(jù)累積裝置的描述5.根據(jù)一個(gè)實(shí)施例的數(shù)據(jù)轉(zhuǎn)換裝置的描述6.總結(jié)<1.相關(guān)技術(shù)的描述>首先,將參考圖1至7描述與本發(fā)明的后述實(shí)施例相關(guān)聯(lián)的推薦技術(shù)。圖1是圖示出應(yīng)用了與本發(fā)明一實(shí)施例相關(guān)聯(lián)的推薦技術(shù)的信息處理系統(tǒng)1的概 要的示意圖。如圖1所示,信息處理系統(tǒng)1包括終端設(shè)備10、網(wǎng)絡(luò)20和信息處理裝置30。終端設(shè)備10由用戶用來從信息處理裝置30接收推薦服務(wù)的供給。例如,終端設(shè) 備10可以是諸如個(gè)人計(jì)算機(jī)(PC)和個(gè)人數(shù)字助理(PDA)之類的信息處理終端、蜂窩電話 終端、游戲終端、諸如音樂播放器和電視機(jī)之類的數(shù)字家用電器等。
圖2是圖示出終端設(shè)備10的更具體配置的示例的框圖。如圖2所示,終端設(shè)備10包括用戶接口單元12和處理單元14。例如,用戶接口單元12提供顯示手段以通過終端設(shè)備10為用戶顯示信息,并提供 輸入手段以由用戶向終端設(shè)備10輸入信息。例如,顯示手段對(duì)應(yīng)于諸如CRT、PDP、IXD和 OLED之類的顯示設(shè)備。此外,例如,輸入手段對(duì)應(yīng)于鼠標(biāo)、鍵盤、觸摸面板、按鈕、開關(guān)等。例如,處理單元14可以是獲取因特網(wǎng)上的網(wǎng)頁并將網(wǎng)頁提供給用戶供閱讀的瀏 覽器。在該情況下,用戶對(duì)于諸如購買或觀看/收聽因特網(wǎng)上的內(nèi)容之類的用戶行動(dòng)的請(qǐng) 求被從處理單元14發(fā)送至信息處理裝置30。此外,處理單元14可以是在終端設(shè)備10處重 放或執(zhí)行內(nèi)容的應(yīng)用。在該情況下,有關(guān)由用戶重放或執(zhí)行內(nèi)容的行動(dòng)的信息被從處理單 元14發(fā)送至信息處理裝置30。這里,處理單元14可在終端設(shè)備10內(nèi)部臨時(shí)存儲(chǔ)用戶的各 個(gè)行動(dòng)的歷史,并在預(yù)定定時(shí)將所累積的行動(dòng)歷史發(fā)送至信息處理裝置30。再次參考圖1,將繼續(xù)對(duì)信息處理系統(tǒng)1的描述。網(wǎng)絡(luò)20連接終端設(shè)備10和信息處理裝置30。網(wǎng)絡(luò)20可以是任意網(wǎng)絡(luò),例如因特 網(wǎng)、有線或無線局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、租借線路和虛擬私有網(wǎng)絡(luò)。信息處理裝置30向終端設(shè)備10的用戶提供推薦服務(wù)。例如,信息處理裝置30被 配置為可訪問存儲(chǔ)了內(nèi)容屬性數(shù)據(jù)和用戶喜好數(shù)據(jù)的存儲(chǔ)設(shè)備的計(jì)算機(jī)。例如,信息處理 裝置30可以是提供推薦服務(wù)的服務(wù)器設(shè)備。此外,信息處理裝置30可以是PC、工作站、上 述數(shù)字電器等。圖3是圖示出信息處理裝置30的更具體配置的示例的框圖。如圖3所示,信息處 理裝置30包括用戶喜好獲取單元32、壓縮單元34、推薦單元36和存儲(chǔ)單元40。此外,存儲(chǔ) 單元40包括用戶喜好數(shù)據(jù)庫(DB)42、內(nèi)容屬性DB 44、經(jīng)壓縮用戶喜好DB 46、經(jīng)壓縮內(nèi)容 屬性DB 48和參數(shù)DB 50。用戶喜好獲取單元32例如根據(jù)行動(dòng)或從終端設(shè)備10發(fā)送來的行動(dòng)歷史來獲取指 示出用戶喜好的用戶喜好數(shù)據(jù)。例如,要應(yīng)用于基于內(nèi)容的過濾的用戶喜好數(shù)據(jù)可以利用 與作為用戶行動(dòng)對(duì)象的內(nèi)容的內(nèi)容領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù)空間中的內(nèi)容屬性數(shù)據(jù)的線性和來表不。圖4是圖示出根據(jù)存儲(chǔ)在存儲(chǔ)單元40的內(nèi)容屬性DB 44中的內(nèi)容屬性數(shù)據(jù)來計(jì) 算用戶喜好數(shù)據(jù)的計(jì)算處理的示例的示意圖。在圖4的示例中,內(nèi)容屬性DB 44包括被指示為標(biāo)識(shí)符C01、C02和C03的三條內(nèi) 容屬性數(shù)據(jù)。每一內(nèi)容屬性數(shù)據(jù)具有5個(gè)數(shù)據(jù)項(xiàng)目,即屬性A至E。亦即,在這種情況下的 內(nèi)容屬性數(shù)據(jù)的數(shù)據(jù)空間是具有與屬性A至E相對(duì)應(yīng)的五個(gè)維度的向量空間。在該向量空 間中,內(nèi)容COl的內(nèi)容屬性數(shù)據(jù)例如表示為向量(1,0,0,1,0)。然后,內(nèi)容C02、C03的內(nèi)容 屬性數(shù)據(jù)分別表示為向量(0,0,1,0,1)和(0,0,1,0,0)。此外,在圖4中,為內(nèi)容屬性數(shù)據(jù) 分別定義了用于計(jì)算用戶喜好數(shù)據(jù)的權(quán)重。在圖4的示例中,用戶喜好數(shù)據(jù)的數(shù)據(jù)空間也具有五個(gè)數(shù)據(jù)項(xiàng)目,S卩,屬性A至 E。這五個(gè)數(shù)據(jù)項(xiàng)目的每一個(gè)的值例如被計(jì)算為存儲(chǔ)在作為用戶行為對(duì)象的內(nèi)容的內(nèi)容屬 性DB 44中的內(nèi)容屬性數(shù)據(jù)的加權(quán)線性和。例如,假設(shè)用標(biāo)識(shí)符UOl標(biāo)識(shí)的用戶已使用內(nèi) 容C01、C02和C03。在這種情況下,用戶UOl的用戶喜好數(shù)據(jù)具有如下值。屬性A的值為 0. 4( = 1X0. 4+0X0. 9+0X0. 4)。屬性 B 的值為 0. 0 ( = 0X0. 4+0X0. 9+0X0. 4)。屬性 C的值為 1. 3( = 0X0. 4+1X0. 9+1 X0. 4)。屬性D 的值為 0. 4( = 1 X0. 4+0X0. 9+0X0. 4)。 然后,屬性E的值為0. 9 ( = 0 X 0. 4+1 X 0. 9+0 X 0. 4)。因此,用戶UOl的用戶喜好數(shù)據(jù)表示 為在以屬性A至E為其元素的向量空間中的(0.4,0.0,1.3,0.4,0.9)。用戶喜好獲取單元 32計(jì)算這樣的用戶喜好數(shù)據(jù),并將其存儲(chǔ)在用戶喜好DB 42中。在以上描述的示例中,用戶喜好數(shù)據(jù)被計(jì)算為內(nèi)容屬性數(shù)據(jù)的加權(quán)線性和。但是, 計(jì)算線性和可能不必執(zhí)行加權(quán)。此外,可利用除在內(nèi)容屬性數(shù)據(jù)的共同數(shù)據(jù)空間中的線性 和以外的方法來計(jì)算用戶喜好數(shù)據(jù)。這里,在圖4的示例中描述了僅僅屬性A至E這五個(gè)數(shù)據(jù)項(xiàng)目。但是,一般而言, 實(shí)際內(nèi)容屬性數(shù)據(jù)(和用戶喜好數(shù)據(jù))的數(shù)據(jù)空間具有更高維度。例如,通過利用詞條頻 率(TF:term frequency) / 逆文檔頻率(ID inverse document frequency)等的方法來對(duì) 說明了內(nèi)容的內(nèi)容描述的文本進(jìn)行分析或者通過對(duì)內(nèi)容數(shù)據(jù)自身的音頻和/或視頻進(jìn)行 分析,來預(yù)先給出內(nèi)容屬性數(shù)據(jù)。這種內(nèi)容屬性數(shù)據(jù)往往是在高維度向量空間中的在許多 數(shù)據(jù)項(xiàng)目處具有零或空值的稀疏向量。考慮到處理成本、推薦結(jié)果的精確度等,這對(duì)于諸如 基于內(nèi)容的過濾之類的推薦算法是不利的。因此,內(nèi)容屬性數(shù)據(jù)或用戶喜好數(shù)據(jù)被圖3的 壓縮單元34壓縮為低維度數(shù)據(jù)。在圖3中,壓縮單元34通過利用存儲(chǔ)在參數(shù)DB 50中的參數(shù)集合來從用戶喜好數(shù) 據(jù)生成具有較少數(shù)目的數(shù)據(jù)項(xiàng)目的經(jīng)壓縮用戶喜好數(shù)據(jù)。此外,壓縮單元34也可通過利用 存儲(chǔ)在參數(shù)DB 50中的參數(shù)集合來從內(nèi)容屬性數(shù)據(jù)生成具有較少數(shù)目的數(shù)據(jù)項(xiàng)目的經(jīng)壓 縮內(nèi)容屬性數(shù)據(jù)。壓縮單元34對(duì)用戶喜好數(shù)據(jù)的壓縮可根據(jù)例如多主題模型(multi-topic model)的概念來執(zhí)行。多主題模型是利用在數(shù)據(jù)固有主題空間中的概率分布和分別被 分配給元數(shù)據(jù)空間中的各主題的概率分布的概率模型。具體而言,在Thomas Hofmarm的 “Probabilistic Potential Semantic Indexing,,,Proceedings of the twenty-second Annual International SIGIRConference on Research and Development in Information Retrieval,1999 ;David M. Blei、Andrew Y. Ng^ Michael I.Jordan 白勺“Potential DirichletAllocation", Journal of Machine Learning Research 3,2003 等中已提議了 概率模型的多個(gè)變體。以下是與本發(fā)明相關(guān)聯(lián)的主要部分。首先,在多主題模型中,多個(gè)主題被定義為可能不被直接觀測(cè)的潛在離散概率變 量的實(shí)際值。向各個(gè)主題分配元數(shù)據(jù)空間的概率分布。分配給各個(gè)主題的元數(shù)據(jù)空間的概 率分布稱為主題固有分布。通過對(duì)推薦系統(tǒng)應(yīng)用多主題模型的概念,通過以內(nèi)容屬性數(shù)據(jù)和/或用戶喜好數(shù) 據(jù)的群組作為學(xué)習(xí)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)習(xí)來預(yù)先估計(jì)主題固有分布。于是,每一個(gè)內(nèi)容屬性數(shù) 據(jù)或每一個(gè)用戶喜好數(shù)據(jù)具有在作為潛在變量空間的主題空間中的稱為主題分布的固有 概率分布。例如,在各個(gè)內(nèi)容屬性數(shù)據(jù)或各個(gè)用戶喜好數(shù)據(jù)的元數(shù)據(jù)空間中的概率分布是 通過利用主題分布對(duì)主題固有分布進(jìn)行平均而獲得的。這里,元數(shù)據(jù)空間可以是以圖4所 示的屬性A至E作為其元素的向量空間等。一般而言,主題分布的參數(shù)的維度較低。此外,由于主題分布是針對(duì)每一個(gè)內(nèi)容屬 性數(shù)據(jù)或者針對(duì)每一個(gè)用戶喜好數(shù)據(jù)確定的,所以從內(nèi)容屬性數(shù)據(jù)或用戶喜好數(shù)據(jù)生成的 主題分布的參數(shù)可被視為針對(duì)各個(gè)數(shù)據(jù)的維度進(jìn)行壓縮的數(shù)據(jù)。因此,在本說明書中,與內(nèi)容屬性數(shù)據(jù)相對(duì)應(yīng)的主題分布的參數(shù)稱為經(jīng)壓縮內(nèi)容屬性數(shù)據(jù),并且與用戶喜好數(shù)據(jù)相對(duì) 應(yīng)的主題分布的參數(shù)稱為經(jīng)壓縮用戶喜好數(shù)據(jù)。一旦確定了主題固有分布,就能夠計(jì)算出這種經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)或者經(jīng)壓縮用 戶喜好數(shù)據(jù)。即,作為高維度稀疏向量的內(nèi)容屬性數(shù)據(jù)或用戶喜好數(shù)據(jù)可根據(jù)多主題模型 而被壓縮為低維度。圖3的壓縮單元34例如可利用通過根據(jù)多主題模型的概念進(jìn)行學(xué)習(xí)而預(yù)先確定 的主題固有分布的參數(shù),來生成經(jīng)壓縮用戶喜好數(shù)據(jù)作為與用戶喜好數(shù)據(jù)相對(duì)應(yīng)的主題分 布。在這種情況下,主題固有分布的參數(shù)被預(yù)先存儲(chǔ)在圖3的參數(shù)DB 50中 。在本說明書 的下文中,用于對(duì)用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)進(jìn)行壓縮的主題固有分布的參數(shù)稱為模型 參數(shù)。注意,不限于多主題模型的主題固有分布的參數(shù),用于壓縮的參數(shù)可以是其它任意參 數(shù)。圖5是進(jìn)一步圖示出根據(jù)多主題模型的概念從用戶喜好數(shù)據(jù)生成具有較少數(shù)目 的數(shù)據(jù)項(xiàng)目的經(jīng)壓縮用戶喜好數(shù)據(jù)的處理的示意圖。如圖5所示,首先,在作為具有屬性1至N這N個(gè)元素的向量空間的數(shù)據(jù)空間D中 提供用戶喜好數(shù)據(jù)UP。此外,還提供了 k個(gè)模型參數(shù)Pi(X) (i = l_k),這些模型參數(shù)是通過 學(xué)習(xí)在數(shù)據(jù)空間D中預(yù)先確定的。模型參數(shù)Pi(X) (i = Ι-k)對(duì)應(yīng)于分別與數(shù)據(jù)空間D中 的k個(gè)主題相對(duì)應(yīng)的概率分布,亦即,對(duì)應(yīng)于主題固有分布。如上所述,一般而言,k小于N。 這里,當(dāng)用戶喜好數(shù)據(jù)UP的預(yù)定數(shù)據(jù)值在數(shù)據(jù)空間D中的出現(xiàn)概率為P(X)時(shí),利用k個(gè)模 型參數(shù)Pi (x) (i = 1-k)通過下式來表示P (χ)。[式1] P (χ) = W1P1 (χ) +W2P2 (χ) +··· +WkPk (χ) (1)這里,利用Wi (i = Ι-k)來表示與用戶喜好數(shù)據(jù)UP相對(duì)應(yīng)的主題分布的參數(shù)。亦 艮口,各個(gè)Wi對(duì)應(yīng)于主題混合比。通過利用主題混合比Wi(i = 1-k),經(jīng)壓縮用戶喜好數(shù)據(jù) UP'被計(jì)算為具有主題混合比(Wl,w2,…,wk)的元素的向量。注意,可類似地對(duì)內(nèi)容屬性 數(shù)據(jù)而不是對(duì)用戶喜好數(shù)據(jù)執(zhí)行這種數(shù)據(jù)壓縮。再次參考圖3,將繼續(xù)對(duì)信息處理裝置30的配置的描述。信息處理裝置30的推薦單元36通過利用如上所述維度被壓縮單元34壓縮了的 (即,數(shù)據(jù)項(xiàng)目數(shù)減少了的)經(jīng)壓縮用戶喜好數(shù)據(jù)和經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)來指定適合用戶 的內(nèi)容,然后作為推薦結(jié)果來發(fā)送給終端設(shè)備10。圖6是圖示出經(jīng)壓縮用戶喜好數(shù)據(jù)和經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)的數(shù)據(jù)示例的示意圖。如圖6所示,用戶喜好DB 42包括在屬性A至E的5個(gè)維度的數(shù)據(jù)空間中的針對(duì) 用戶U01、U02的兩條用戶喜好數(shù)據(jù)。同時(shí),經(jīng)壓縮用戶喜好DB 46包括分別被壓縮為3個(gè) 維度的兩條經(jīng)壓縮用戶喜好數(shù)據(jù)。通過如上所述地對(duì)用戶喜好數(shù)據(jù)進(jìn)行壓縮,存在如下情 況在壓縮之前相似度較低的兩條用戶喜好數(shù)據(jù)在壓縮之后表現(xiàn)出高相似度。這是因?yàn)榫?有潛在相關(guān)性的不同數(shù)據(jù)項(xiàng)目的屬性值通過利用多主題模型而被聚合成主題混合比的一 個(gè)值而發(fā)生的現(xiàn)象。因此,針對(duì)推薦可考慮用戶之間的潛在相似性,從而推薦更適合用戶喜 好的內(nèi)容。這類似于將對(duì)用戶喜好數(shù)據(jù)和內(nèi)容屬性數(shù)據(jù)進(jìn)行比較的情況。在圖6的示例中,內(nèi)容屬性DB 44包括在屬性A至E的5個(gè)維度的數(shù)據(jù)空間中的 針對(duì)內(nèi)容C01、C02的兩條內(nèi)容屬性數(shù)據(jù)。同時(shí),經(jīng)壓縮內(nèi)容屬性DB 48包括分別被壓縮為個(gè)3維度的兩條經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)。經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)預(yù)先被壓縮單元34生成并被 存儲(chǔ)在經(jīng)壓縮內(nèi)容屬性DB 48中。圖3的推薦單元36通過利用經(jīng)壓縮用戶喜好數(shù)據(jù)和經(jīng) 壓縮內(nèi)容屬性數(shù)據(jù)在圖7的過程中指定作為推薦對(duì)象的內(nèi)容。圖7是描述由推薦單元36進(jìn)行的推薦處理的流程的示例的流程圖。如圖7所示,首先,推薦單元36從經(jīng)壓縮用戶喜好DB 46讀取供應(yīng)推薦服務(wù)的目 標(biāo)用戶的經(jīng)壓縮用戶喜好數(shù)據(jù)(S2)。接下來,推薦單元36從經(jīng)壓縮內(nèi)容屬性DB 48讀取經(jīng) 壓縮內(nèi)容屬性數(shù)據(jù)(S4)。要讀取的經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)可以是例如利用預(yù)定提取條件提取 的數(shù)據(jù)的一部分。接下來,推薦單元36計(jì)算在步驟S2讀取的經(jīng)壓縮用戶喜好數(shù)據(jù)與在步 驟S4讀取的經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)之間的相似度(S6)。注意,相似度可以是向量之間的標(biāo) 準(zhǔn)內(nèi)積、符號(hào)取反的歐幾里德距離、余弦距離等。然后,推薦單元36例如以計(jì)算出的相似度 的降序來生成預(yù)定數(shù)目的內(nèi)容的列表,并將所生成的列表作為推薦結(jié)果來發(fā)送給終端設(shè)備 10 (S8)。在以上描述的示例中,推薦單元36根據(jù)基于內(nèi)容的過濾來執(zhí)行推薦處理。但是, 即使在推薦單元36根據(jù)諸如協(xié)同過濾之類的另一算法來執(zhí)行推薦處理的情況下,也可以 獲得上述的數(shù)據(jù)壓縮效果。到目前為止,已參考圖1至7描述了與本發(fā)明一實(shí)施例相關(guān)聯(lián)的推薦技術(shù)。利用 這種推薦技術(shù),在根據(jù)多主題模型對(duì)屬于高維度數(shù)據(jù)空間的用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù) 的維度進(jìn)行壓縮之后執(zhí)行推薦。因此,執(zhí)行了更適合用戶的推薦,從而可以提高所推薦內(nèi)容 的新鮮度和范圍。在這種相關(guān)技術(shù)中,由圖3的壓縮單元34用來壓縮用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù) 的模型參數(shù)是通過針對(duì)用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)所屬于的各個(gè)數(shù)據(jù)空間進(jìn)行學(xué)習(xí)而 預(yù)先確定的。因此,當(dāng)包括用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)的數(shù)據(jù)空間彼此不同時(shí),通過相互 比較在各自的數(shù)據(jù)空間中的經(jīng)壓縮數(shù)據(jù)可能無法執(zhí)行推薦。相反,通過利用以下將描述的 學(xué)習(xí)方法 ,變得可以利用不同數(shù)據(jù)空間的用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)來執(zhí)行交叉領(lǐng)域推 薦。<2.根據(jù)一個(gè)實(shí)施例的學(xué)習(xí)裝置的描述〉[學(xué)習(xí)裝置的概要]圖8是圖示出根據(jù)本發(fā)明一個(gè)實(shí)施例的學(xué)習(xí)裝置的概要的示意圖。在圖8中,圖示出了兩個(gè)不同的數(shù)據(jù)空間D1、D2。數(shù)據(jù)空間Dl例如用于書籍內(nèi)容 領(lǐng)域。在數(shù)據(jù)空間Dl中,包括η個(gè)數(shù)據(jù)項(xiàng)目A1-Af例如,數(shù)據(jù)項(xiàng)目A1為“作者X”,數(shù)據(jù)項(xiàng) 目八2為“作者Y”,…,數(shù)據(jù)項(xiàng)目An*“流派Ζ”。同時(shí),數(shù)據(jù)空間D2例如用于電視節(jié)目(TV 節(jié)目)內(nèi)容領(lǐng)域。在數(shù)據(jù)空間D2中,包括m個(gè)數(shù)據(jù)項(xiàng)目B1-B1^例如,數(shù)據(jù)項(xiàng)目&為“天才 α”,數(shù)據(jù)項(xiàng)目化為“天才β”,…,數(shù)據(jù)項(xiàng)目良為“時(shí)區(qū)ω”。這里,假設(shè)共同用戶Ul的用戶喜好數(shù)據(jù)在數(shù)據(jù)空間Dl、D2中分別為UPl = (2, 1,…,1)和UP2= (0,2,…,0)。在這種假設(shè)下,如其所是,用戶喜好數(shù)據(jù)UPl和UP2的維 度彼此不同,并且各個(gè)元素的含義彼此不相關(guān)聯(lián)。因此,不可直接對(duì)用戶喜好數(shù)據(jù)UPl和 UP2進(jìn)行相互比較。然后,首先,假設(shè)利用模型參數(shù)Pli來從用戶喜好數(shù)據(jù)UPl生成經(jīng)壓縮 用戶喜好數(shù)據(jù)UPl'。這里,經(jīng)壓縮用戶喜好數(shù)據(jù)UPl'的維度對(duì)應(yīng)于主題混合比W1-Wk的 數(shù)目,亦即,模型參數(shù)Pii的數(shù)目。與此同時(shí),通過利用與模型參數(shù)Pii相同數(shù)目的模型參數(shù)P2j來從用戶喜好數(shù)據(jù)UP2生成經(jīng)壓縮用戶喜好數(shù)據(jù)UP2',經(jīng)壓縮用戶喜好數(shù)據(jù)UP2'的 維度將與經(jīng)壓縮用戶喜好數(shù)據(jù)UPl'的維度相同。此外,模型參數(shù)Pli或模型參數(shù)皮確 定為使得從用戶喜好數(shù)據(jù)UPl和UP2生成的各組主題混合比W1-Wk在多個(gè)共同用戶之間相 等或者至少具有較小差異。其結(jié)果是,變得可以相互比較從用戶喜好數(shù)據(jù)UPl生成的經(jīng)壓 縮用戶喜好數(shù)據(jù)UPl'和從用戶喜好數(shù)據(jù)UP2生成的經(jīng)壓縮用戶喜好數(shù)據(jù)UP2'。根據(jù)以下描述的一個(gè)實(shí)施例的學(xué)習(xí)裝置100通過學(xué)習(xí)來確定模型參數(shù)Pli和模型 參數(shù)P2」之中的模型參數(shù)P2jt)
[學(xué)習(xí)裝置的配置]圖9是圖示出學(xué)習(xí)裝置100的邏輯配置的框圖。如圖9所示,學(xué)習(xí)裝置100包括 第一數(shù)據(jù)獲取單元120、壓縮單元122、學(xué)習(xí)單元130和第二數(shù)據(jù)獲取單元140。此外,學(xué)習(xí) 裝置100還包括第一用戶喜好DB 110、第二用戶喜好DB 112、第一參數(shù)DB 114、第一經(jīng)壓縮 用戶喜好DB 124和第二參數(shù)DB 132。當(dāng)通過學(xué)習(xí)裝置100執(zhí)行學(xué)習(xí)處理時(shí),分別在第一用戶喜好DB 110、第二用戶喜 好DB 112和第一參數(shù)DB 114中預(yù)先準(zhǔn)備了要用于學(xué)習(xí)的數(shù)據(jù)。第一用戶喜好DB 110準(zhǔn) 備有例如屬于圖8的數(shù)據(jù)空間Dl的多個(gè)第一用戶喜好數(shù)據(jù)。此外,第二用戶喜好DB 112 準(zhǔn)備有與第一用戶喜好數(shù)據(jù)共同的用戶的、屬于數(shù)據(jù)空間D2(不同于數(shù)據(jù)空間Dl)的多個(gè) 第二用戶喜好數(shù)據(jù)。此外,第一參數(shù)DB 114準(zhǔn)備有用于從第一用戶喜好數(shù)據(jù)生成具有較少 數(shù)據(jù)項(xiàng)目的第一經(jīng)壓縮用戶喜好數(shù)據(jù)的k個(gè)模型參數(shù)Pli (i = 1-k)。當(dāng)利用學(xué)習(xí)裝置100的學(xué)習(xí)處理開始時(shí),首先,第一數(shù)據(jù)獲取單元120從第一用戶 喜好DB 110獲取屬于數(shù)據(jù)空間Dl的第一用戶喜好數(shù)據(jù),并將所獲取的數(shù)據(jù)輸出到壓縮單 元122。接下來,壓縮單元122通過利用在第一參數(shù)DB 114中準(zhǔn)備的k個(gè)模型參數(shù)Pli來 壓縮第一用戶喜好數(shù)據(jù),并生成第一經(jīng)壓縮用戶喜好數(shù)據(jù)。由壓縮單元122生成的第一經(jīng) 壓縮用戶喜好數(shù)據(jù)被存儲(chǔ)在第一經(jīng)壓縮用戶喜好DB 124中。這時(shí)生成的第一經(jīng)壓縮用戶 喜好數(shù)據(jù)被后述學(xué)習(xí)單元130作為第二經(jīng)壓縮用戶喜好數(shù)據(jù)的訓(xùn)練數(shù)據(jù)來管理。與此同時(shí),第二數(shù)據(jù)獲取單元140從第二用戶喜好DB 112獲取屬于數(shù)據(jù)空間D2 的第二用戶喜好數(shù)據(jù),并輸出到學(xué)習(xí)單元130。然后,學(xué)習(xí)單元130從第一經(jīng)壓縮用戶喜好 DB 124讀取共同用戶的第一經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第一經(jīng)壓縮用戶喜好數(shù)據(jù)視為對(duì) 第二用戶喜好數(shù)據(jù)進(jìn)行壓縮的情況的壓縮結(jié)果(即,訓(xùn)練數(shù)據(jù))。然后,學(xué)習(xí)單元130通過 學(xué)習(xí)來確定用于從上述第二用戶喜好數(shù)據(jù)生成所述訓(xùn)練數(shù)據(jù)的k個(gè)模型參數(shù)= 1-k) 并存儲(chǔ)在第二參數(shù)DB 132中。通過對(duì)足夠數(shù)目的用戶執(zhí)行這種學(xué)習(xí)處理,即使對(duì)于新用 戶,也可縮小壓縮單元122所生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)與第二經(jīng)壓縮用戶喜好數(shù)據(jù) 之間的差異。注意,在以上描述的示例中,針對(duì)數(shù)據(jù)空間Dl的模型參數(shù)Pli是固定值,而針對(duì)數(shù) 據(jù)空間D2的模型參數(shù)Ρ2」將被學(xué)習(xí)得到。但是,也可以通過學(xué)習(xí)來同時(shí)確定模型參數(shù)Pli 和模型參數(shù)Ρ2」。<3.根據(jù)一個(gè)實(shí)施例的推薦裝置的描述〉通過利用由學(xué)習(xí)裝置100確定的模型參數(shù)Pli和P2j;屬于不同數(shù)據(jù)空間D1、D2的 用戶喜好數(shù)據(jù)和內(nèi)容屬性數(shù)據(jù)可被壓縮為屬于共同的經(jīng)壓縮數(shù)據(jù)空間D'的數(shù)據(jù),如圖8 所示。即,變得可以利用在不同內(nèi)容領(lǐng)域中提供的用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)來執(zhí)行跨多個(gè)領(lǐng)域的交叉領(lǐng)域推薦。因此,以下將描述通過利用由上述的學(xué)習(xí)裝置100確定的模型 參數(shù)Pli和模型參數(shù)P2j來執(zhí)行內(nèi)容推薦的信息處理裝置(即,推薦裝置)。圖10是圖示出根據(jù)本發(fā)明一個(gè)實(shí)施例、執(zhí)行推薦處理的信息處理裝置200的邏輯 配置的框圖。如圖10所示,信息處理裝置200包括數(shù)據(jù)獲取單元210、壓縮單元220、推薦 單元230和存儲(chǔ)單元240。然后,推薦單元230包括選擇單元232和發(fā)送單元234。此外, 存儲(chǔ)單元240包括用戶喜好DB 242、內(nèi)容屬性DB 244、經(jīng)壓縮用戶喜好DB 246、經(jīng)壓縮內(nèi)容 屬性DB 248和參數(shù)DB 250。數(shù)據(jù)獲取單元210獲取屬于與第一內(nèi)容領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù)空間Dl的第一用戶喜 好數(shù)據(jù)。更具體而言,數(shù)據(jù)獲取單元210可以通過利用例如基于與第一內(nèi)容領(lǐng)域相關(guān)的用 戶的行動(dòng)或行動(dòng)歷史的、預(yù)先準(zhǔn)備在內(nèi)容屬性DB 244中的第一內(nèi)容屬性數(shù)據(jù),來計(jì)算并獲 取第一用戶喜好數(shù)據(jù)。替代地,數(shù)據(jù)獲取單元210可以從信息處理裝置200的內(nèi)部或外部 數(shù)據(jù)庫等獲取預(yù)先計(jì)算出的第一用戶喜好數(shù)據(jù)。數(shù)據(jù)獲取單元210將所獲取的第一用戶喜 好數(shù)據(jù)存儲(chǔ)在用戶喜好DB 242中。
壓縮單元220通過利用第一參數(shù)集合來從第一用戶喜好數(shù)據(jù)生成具有較少數(shù)目 的數(shù)據(jù)項(xiàng)目的第一經(jīng)壓縮用戶喜好數(shù)據(jù)。更具體而言,壓縮單元220可以例如通過利用存 儲(chǔ)在參數(shù)DB 250中的第一模型參數(shù)集合Pli,根據(jù)參考圖5描述的多主題模型的概念來生 成第一經(jīng)壓縮用戶喜好數(shù)據(jù)。壓縮單元220將所生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在經(jīng) 壓縮用戶喜好DB 246中。通過利用第二模型參數(shù)集合P2j從屬于數(shù)據(jù)空間D2(不同于數(shù)據(jù)空間Dl)的第二 用戶喜好數(shù)據(jù)生成的與多個(gè)用戶相關(guān)的第二經(jīng)壓縮用戶喜好數(shù)據(jù)被預(yù)先準(zhǔn)備在存儲(chǔ)單元 240的經(jīng)壓縮用戶喜好DB 246中。此外,通過利用第二模型參數(shù)集合P2」從屬于數(shù)據(jù)空間 D2的第二內(nèi)容屬性數(shù)據(jù)生成的與多個(gè)內(nèi)容相關(guān)的第二經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)被預(yù)先準(zhǔn)備在 經(jīng)壓縮內(nèi)容屬性DB 248中。這里,被利用來生成第二經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮內(nèi) 容屬性數(shù)據(jù)的第二模型參數(shù)集合P2」是預(yù)先被學(xué)習(xí)以使得第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二 經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。推薦單元230的選擇單元232根據(jù)與壓縮單元220所生成的第一經(jīng)壓縮用戶喜好 數(shù)據(jù)的相似度,從上述多個(gè)第二經(jīng)壓縮用戶喜好數(shù)據(jù)或第二經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)中選擇至 少一個(gè)數(shù)據(jù)。更具體而言,選擇單元232可以例如根據(jù)基于內(nèi)容的過濾的概念,選擇與壓 縮單元220所生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)具有高相似度的第二經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)。 這里,相似度例如可作為向量之間的標(biāo)準(zhǔn)內(nèi)積、符號(hào)取反的歐幾里德距離、余弦距離等被計(jì) 算。然后,選擇單元232向發(fā)送單元234輸出與所選擇的經(jīng)壓縮內(nèi)容屬性數(shù)據(jù)的至少一個(gè) 相對(duì)應(yīng)的內(nèi)容標(biāo)識(shí)符等。此外,選擇單元232可例如根據(jù)協(xié)同過濾的概念,選擇與壓縮單元 220所生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)具有高相似度的第二經(jīng)壓縮用戶喜好數(shù)據(jù)。在這種 情況下,選擇單元232例如輸出指定與選擇單元232所選擇的第二經(jīng)壓縮用戶喜好數(shù)據(jù)相 對(duì)應(yīng)的用戶在過去使用的內(nèi)容的內(nèi)容標(biāo)識(shí)符等。發(fā)送單元234例如根據(jù)從選擇單元232輸入的內(nèi)容標(biāo)識(shí)符來生成推薦結(jié)果(即, 內(nèi)容標(biāo)識(shí)符列表、顯示推薦結(jié)果的網(wǎng)頁等),并將所生成的結(jié)果發(fā)送至諸如圖1的終端設(shè)備 10之類的外部設(shè)備。從以上描述可想到,信息處理裝置200可通過利用在與第一內(nèi)容領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù)空間Dl中的第一用戶喜好數(shù)據(jù),來推薦與數(shù)據(jù)空間D2相對(duì)應(yīng)的第二內(nèi)容領(lǐng)域的內(nèi)容。該 推薦處理是通過學(xué)習(xí)能夠?qū)蓚€(gè)不同數(shù)據(jù)空間Dl、D2中的數(shù)據(jù)壓縮為共同的經(jīng)壓縮數(shù)據(jù) 空間D'中的數(shù)據(jù)的模型參數(shù)來執(zhí)行的。利用由信息處理裝置200進(jìn)行的該推薦處理,變得 例如可以跨越諸如音樂、視頻、書本和新聞報(bào)道之類的各種內(nèi)容領(lǐng)域以交叉領(lǐng)域方式來推 薦適合用戶的內(nèi)容。數(shù)據(jù)空間D1、D2不限于與不同內(nèi)容領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù)空間。亦即,例如,數(shù)據(jù)空間 D1、D2可以是為相同內(nèi)容領(lǐng)域定義的具有不同數(shù)據(jù)項(xiàng)目的數(shù)據(jù)空間。例如,在生成用戶喜 好數(shù)據(jù)的諸如PC和音樂播放器之類的設(shè)備的類型或制造商不同的情況下,即使用戶喜好 數(shù)據(jù)在相同的音樂領(lǐng)域,用戶喜好數(shù)據(jù)的數(shù)據(jù)空間也可被視為不同。在這種情況下,利用根 據(jù)本實(shí)施例的信息處理裝置200,變得也可以通過利用屬于一數(shù)據(jù)空間的用戶喜好數(shù)據(jù)或 者內(nèi)容屬性數(shù)據(jù)、基于在另一數(shù)據(jù)空間中生成的用戶喜好數(shù)據(jù)來執(zhí)行推薦。<4.根據(jù)一個(gè)實(shí)施例的數(shù)據(jù)累積裝置的描述〉此外,當(dāng)利用由學(xué)習(xí)裝置100確定的模型參數(shù)Plp P2j時(shí),在不同數(shù)據(jù)空間Dl、D2 中生成的用戶喜好數(shù)據(jù)和內(nèi)容屬性數(shù)據(jù)可在被壓縮成在共同的經(jīng)壓縮數(shù)據(jù)空間D'中的數(shù) 據(jù)時(shí)被累積。因此,可在一個(gè)數(shù)據(jù)累積裝置中累積被分散為各種設(shè)備處的不同數(shù)據(jù)空間中 的數(shù)據(jù)的用戶喜好數(shù)據(jù),以使得推薦處理的處理結(jié)果在精確度方面得到提高。于是,以下將 描述一種信息處理裝置(即,數(shù)據(jù)累積裝置),該信息處理裝置能夠通過利用由上述學(xué)習(xí)裝 置100確定的模型參數(shù)來將在多個(gè)設(shè)備處生成的用戶喜好數(shù)據(jù)累積為一個(gè)經(jīng)壓縮數(shù)據(jù)空 間的數(shù)據(jù)。圖11是圖示出根據(jù)本發(fā)明一個(gè)實(shí)施例的、利用數(shù)據(jù)累積裝置的信息處理系統(tǒng)300 的概要的示意圖。如圖11所示,信息處理系統(tǒng)300包括終端設(shè)備310、320和信息處理裝置 330。在圖11中,音樂播放器被圖示為終端設(shè)備310的一個(gè)示例。但是,不限于此示例, 終端設(shè)備310可以是任意設(shè)備。類似地,電視機(jī)被圖示為終端設(shè)備320的一個(gè)示例。但是, 不限于此示例,終端設(shè)備320可以是任意設(shè)備。終端設(shè)備310、320分別生成屬于不同數(shù)據(jù) 空間的用戶喜好數(shù)據(jù),并將生成的數(shù)據(jù)發(fā)送給信息處理裝置330。圖12是圖示出終端設(shè)備310的邏輯配置的框圖。如圖12所示,終端設(shè)備310包 括第一應(yīng)用單元311、第一數(shù)據(jù)生成單元312、第一用戶喜好DB 313、第一內(nèi)容屬性DB 314 和第一數(shù)據(jù)發(fā)送單元315。第一應(yīng)用單元311對(duì)要成為使用終端設(shè)備310的用戶的行動(dòng)對(duì)象的內(nèi)容進(jìn)行管 理。亦即,后面描述的第一用戶喜好數(shù)據(jù)是根據(jù)諸如利用第一應(yīng)用單元311重放或執(zhí)行內(nèi) 容之類的用戶行動(dòng)而生成的。與用戶利用第一應(yīng)用單元311的行動(dòng)相關(guān)的信息被輸出到第 一數(shù)據(jù)生成單元312。 當(dāng)從第一應(yīng)用單元311接收到與上述用戶行動(dòng)相關(guān)的信息時(shí),第一數(shù)據(jù)生成單元 312通過利用預(yù)先存儲(chǔ)在第一內(nèi)容屬性DB 314中的第一內(nèi)容屬性數(shù)據(jù)來生成屬于第一數(shù) 據(jù)空間的第一用戶喜好數(shù)據(jù)。在第一應(yīng)用單元311是用于音樂重放的應(yīng)用的情況下,第一 數(shù)據(jù)空間例如是與音樂領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù)空間。第一數(shù)據(jù)生成單元312對(duì)第一用戶喜好數(shù) 據(jù)的生成處理例如可以是根據(jù)參考圖4描述的基于內(nèi)容的過濾的處理。第一數(shù)據(jù)生成單元 312將所生成的第一用戶喜好數(shù)據(jù)存儲(chǔ)在第一用戶喜好DB 313中。
第一數(shù)據(jù)發(fā)送單元315例如從第一用戶喜好DB 313獲取由第一數(shù)據(jù)生成單元312 生成的第一用戶喜好數(shù)據(jù),并將所獲取的數(shù)據(jù)發(fā)送至圖11的信息處理裝置330。此外,第一 數(shù)據(jù)發(fā)送單元315可向信息處理裝置330發(fā)送從第一內(nèi)容屬性DB 314獲取的屬于第一數(shù) 據(jù)空間的第一內(nèi)容屬性數(shù)據(jù)。例如可以在用戶使用第一應(yīng)用單元311時(shí)或者以預(yù)先確定的 特定時(shí)間間隔執(zhí)行第一數(shù)據(jù)發(fā)送單元315向信息處理裝置330的數(shù)據(jù)發(fā)送處理。圖13是圖示出終端設(shè)備320的邏輯配置的框圖。如圖13所示,終端設(shè)備320包 括第二應(yīng)用單元321、第二數(shù)據(jù)生成單元322、第二用戶喜好DB 323、第二內(nèi)容屬性DB 324 和第二數(shù)據(jù)發(fā)送單元325。第二應(yīng)用單元321對(duì)要成為使用終端設(shè)備320的用戶的行動(dòng)對(duì)象的內(nèi)容進(jìn)行管 理。亦即,后面描述的第二用戶喜好數(shù)據(jù)是根據(jù)諸如利用第二應(yīng)用單元321重放或執(zhí)行內(nèi) 容之類的用戶行動(dòng)而生成的。與用戶利用第二應(yīng)用單元321的行動(dòng)相關(guān)的信息被輸出到第 二數(shù)據(jù)生成單元322。當(dāng)從第二應(yīng)用單元321接收到與上述用戶行動(dòng)相關(guān)的信息時(shí),第二數(shù)據(jù)生成單元 322通過利用預(yù)先存儲(chǔ)在第二內(nèi)容屬性DB 324中的第二內(nèi)容屬性數(shù)據(jù)來生成屬于第二數(shù) 據(jù)空間的第二用戶喜好數(shù)據(jù)。在第二應(yīng)用單元321是用于顯示電視節(jié)目的電視機(jī)的情況 下,第二數(shù)據(jù)空間例如是與電視節(jié)目領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù)空間。第二數(shù)據(jù)生成單元322對(duì)第 二用戶喜好數(shù)據(jù)的生成處理例如可以是根據(jù)參考圖4描述的基于內(nèi)容的過濾的處理。第二 數(shù)據(jù)生成單元322將所生成的第二用戶喜好數(shù)據(jù)存儲(chǔ)在第二用戶喜好DB323中。第二數(shù)據(jù)發(fā)送單元325例如從第二用戶喜好DB 323獲取由第二數(shù)據(jù)生成單元322 生成的第二用戶喜好數(shù)據(jù),并將所獲取的數(shù)據(jù)發(fā)送至圖11的信息處理裝置330。此外,第二 數(shù)據(jù)發(fā)送單元325可向信息處理裝置330發(fā)送從第二內(nèi)容屬性DB 324獲取的屬于第二數(shù) 據(jù)空間的第二內(nèi)容屬性數(shù)據(jù)。類似于上述第一數(shù)據(jù)發(fā)送單元315的發(fā)送處理,例如可以在 用戶使用第二應(yīng)用單元321時(shí)或者以預(yù)先確定的特定時(shí)間間隔執(zhí)行第二數(shù)據(jù)發(fā)送單元325 向信息處理裝置330的數(shù)據(jù)發(fā)送處理。圖14是圖示出信息處理裝置330的邏輯配置的框圖。如圖14所示,信息處理裝 置330包括數(shù)據(jù)接收單元332、第一數(shù)據(jù)獲取單元334、第二數(shù)據(jù)獲取單元336、第一壓縮單 元338和第二壓縮單元340。此外,信息處理裝置330還包括標(biāo)識(shí)符識(shí)別DB 350、參數(shù)DB 352、經(jīng)壓縮用戶喜好DB 354和經(jīng)壓縮內(nèi)容屬性DB 356。數(shù)據(jù)接收單元332接收從上述終端設(shè)備310和終端設(shè)備320發(fā)送來的用戶喜好數(shù) 據(jù)或內(nèi)容屬性數(shù)據(jù)。這里,從終端設(shè)備310和終端設(shè)備320發(fā)送來的用戶喜好數(shù)據(jù)中包含的 用戶標(biāo)識(shí)符或者內(nèi)容屬性數(shù)據(jù)中包含的內(nèi)容標(biāo)識(shí)符并不總是在終端設(shè)備之間統(tǒng)一。因此, 數(shù)據(jù)接收單元332通過利用預(yù)先存儲(chǔ)在標(biāo)識(shí)符識(shí)別DB 350中的標(biāo)識(shí)符對(duì)應(yīng)表格來識(shí)別與 所接收的數(shù)據(jù)相關(guān)的用戶或內(nèi)容。然后,數(shù)據(jù)接收單元332根據(jù)與所識(shí)別的用戶或內(nèi)容相 對(duì)應(yīng)的數(shù)據(jù)空間,將所接收的數(shù)據(jù)輸出到第一數(shù)據(jù)獲取單元334或第二數(shù)據(jù)獲取單元336。第一數(shù)據(jù)獲取單元334獲取數(shù)據(jù)接收單元332所接收的數(shù)據(jù)中的、屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù)或第一內(nèi)容屬性數(shù)據(jù),并輸出到第一壓縮單元338。與此同時(shí),第 二數(shù)據(jù)獲取單元336獲取數(shù)據(jù)接收單元332所接收的數(shù)據(jù)中的、屬于第二數(shù)據(jù)空間的第二 用戶喜好數(shù)據(jù)或第二內(nèi)容屬性數(shù)據(jù),并輸出至第二壓縮單元340。第一壓縮單元338通過利用預(yù)先存儲(chǔ)在參數(shù)DB 352中的第一參數(shù)集合,例如從由第一數(shù)據(jù)獲取單元334輸入的第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目的第一經(jīng)壓縮用戶喜好數(shù)據(jù)。然后,第一壓縮單元338將從而生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)輸出到經(jīng)壓 縮用戶喜好DB 354供存儲(chǔ)。另外,第一壓縮單元338可對(duì)從第一數(shù)據(jù)獲取單元334輸入的 第一內(nèi)容屬性數(shù)據(jù)進(jìn)行壓縮并將其存儲(chǔ)到經(jīng)壓縮內(nèi)容屬性DB 356中。第二壓縮單元340通過利用預(yù)先存儲(chǔ)在參數(shù)DB 352中的第二參數(shù)集合,例如從由 第二數(shù)據(jù)獲取單元336輸入的第二用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目的第二經(jīng)壓縮用 戶喜好數(shù)據(jù)。然后,第二壓縮單元340將從而生成的第二經(jīng)壓縮用戶喜好數(shù)據(jù)輸出到經(jīng)壓 縮用戶喜好DB 354供存儲(chǔ)。另外,第二壓縮單元340可對(duì)從第二數(shù)據(jù)獲取單元336輸入的 第二內(nèi)容屬性數(shù)據(jù)進(jìn)行壓縮并將其存儲(chǔ)在經(jīng)壓縮內(nèi)容屬性DB 356中。這里,預(yù)先存儲(chǔ)在參數(shù)DB 352中的第一和第二參數(shù)集合例如對(duì)應(yīng)于由上述學(xué)習(xí) 裝置100通過學(xué)習(xí)處理確定的多主題模型的模型參數(shù)等。也就是,根據(jù)本實(shí)施例的第一和 第二參數(shù)集合被學(xué)習(xí)以使得共同用戶的第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮用戶喜好 數(shù)據(jù)之間的差異變?yōu)樵诙鄠€(gè)用戶間較小。因此,利用根據(jù)本實(shí)施例的信息處理裝置330,由 終端設(shè)備310、320分別生成的數(shù)據(jù)可被累積在各數(shù)據(jù)庫中作為屬于共同的經(jīng)壓縮數(shù)據(jù)空 間的數(shù)據(jù)。這里,還可以通過在將共同用戶的第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮用戶 喜好數(shù)據(jù)乘以預(yù)定比率之后對(duì)它們求和來計(jì)算第三經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第三經(jīng)壓 縮用戶喜好數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中。與第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮用戶喜好數(shù)據(jù) 相乘的比率例如可根據(jù)各設(shè)備的用戶歷史中包含的歷史數(shù)目來確定。以這種方式,通過將 用戶喜好數(shù)據(jù)和內(nèi)容屬性數(shù)據(jù)累積為共同的經(jīng)壓縮數(shù)據(jù)空間中的數(shù)據(jù),分散在各種設(shè)備中 的數(shù)據(jù)被聚合到一個(gè)數(shù)據(jù)庫中以得到高效利用,從而可以提高利用該數(shù)據(jù)進(jìn)行的推薦處理 的精確度。應(yīng)當(dāng)注意,在以上描述的示例中,終端設(shè)備310和終端設(shè)備320具有不同類型。但 是,即使在例如由于銷售商不同和同一類型的終端設(shè)備310、320的處置語言不同而使得用 戶喜好數(shù)據(jù)等的數(shù)據(jù)空間不同的情況下,也可以期望由信息處理裝置330進(jìn)行的數(shù)據(jù)累積 的效果。<5.根據(jù)一個(gè)實(shí)施例的數(shù)據(jù)轉(zhuǎn)換裝置的描述〉由學(xué)習(xí)裝置100確定的模型參數(shù)Pli和Ρ2」也可被認(rèn)為指示出構(gòu)成各數(shù)據(jù)空間的 數(shù)據(jù)項(xiàng)目的共同經(jīng)壓縮數(shù)據(jù)空間中的特征。因此,當(dāng)與屬于不同數(shù)據(jù)空間的兩個(gè)數(shù)據(jù)項(xiàng)目 相對(duì)應(yīng)的模型參數(shù)Pli和的參數(shù)值彼此相似時(shí),認(rèn)為這兩個(gè)數(shù)據(jù)項(xiàng)目之間具有相似性。 因此,基于由學(xué)習(xí)裝置100確定的模型參數(shù)Pli和P2p在一數(shù)據(jù)空間中生成的用戶喜好數(shù) 據(jù)或內(nèi)容屬性數(shù)據(jù)可與屬于另一數(shù)據(jù)空間的數(shù)據(jù)相映射。于是,通過在不同數(shù)據(jù)空間中相 互轉(zhuǎn)換可以循環(huán)利用或者再利用用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)。因此,例如可以增加提供 推薦服務(wù)的機(jī)會(huì)。因此,以下將描述能夠?qū)⒃谝粩?shù)據(jù)空間中生成的用戶喜好數(shù)據(jù)或內(nèi)容屬 性數(shù)據(jù)轉(zhuǎn)換為屬于另一數(shù)據(jù)空間的數(shù)據(jù)的信息處理裝置(即,數(shù)據(jù)轉(zhuǎn)換裝置)。圖15是圖示出根據(jù)本發(fā)明一個(gè)實(shí)施例、利用數(shù)據(jù)轉(zhuǎn)換裝置的信息處理系統(tǒng)400的 概要的示意圖。如圖15所示,信息處理裝置400包括推薦設(shè)備410、420,終端設(shè)備412、422 和信息處理裝置430。推薦設(shè)備410通過利用屬于數(shù)據(jù)空間Dl的第一內(nèi)容屬性數(shù)據(jù)和第一用戶喜好數(shù) 據(jù)來向終端設(shè)備412提供推薦服務(wù)。終端設(shè)備412從推薦設(shè)備410接收與數(shù)據(jù)空間Dl相對(duì)應(yīng)領(lǐng)域的內(nèi)容的推薦結(jié)果,并提議給用戶。同時(shí),推薦設(shè)備420通過利用屬于數(shù)據(jù)空間D2(不同于數(shù)據(jù)空間Dl)的第二內(nèi)容 屬性數(shù)據(jù)和第二用戶喜好數(shù)據(jù)來向終端設(shè)備422提供推薦服務(wù)。終端設(shè)備422從推薦設(shè)備 420接收與數(shù)據(jù)空間D2相對(duì)應(yīng)領(lǐng)域的內(nèi)容的推薦結(jié)果,并向用戶提議所接收的結(jié)果。在這兩個(gè)推薦設(shè)備410、420之間,信息處理裝置430將屬于第一數(shù)據(jù)空間的第一 用戶喜好數(shù)據(jù) 轉(zhuǎn)換為屬于與第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)。圖16是圖示出信息處理裝置430的邏輯配置示例的框圖。如圖16所示,信息處 理裝置430包括參數(shù)DB 432、映射單元434和轉(zhuǎn)換單元436。參數(shù)DB 432存儲(chǔ)用以從屬于數(shù)據(jù)空間Dl的第一用戶喜好數(shù)據(jù)生成第一經(jīng)壓縮用 戶喜好數(shù)據(jù)的第一參數(shù)集合,以及用以從屬于數(shù)據(jù)空間D2的第二在用戶喜好數(shù)據(jù)生成第 二經(jīng)壓縮用戶喜好數(shù)據(jù)的第二參數(shù)集合。通過利用上述學(xué)習(xí)裝置100來學(xué)習(xí)第一和第二參 數(shù)集合,以使得共同用戶的第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差 異變?yōu)樵诙鄠€(gè)用戶間較小。第一和第二參數(shù)集合分別可以是根據(jù)多主題模型的模型參數(shù)。映射單元434根據(jù)從參數(shù)DB 432獲取的上述第一和第二參數(shù)集合的各自的數(shù)據(jù) 項(xiàng)目的參數(shù)值的相似度,來確定第一用戶喜好數(shù)據(jù)的數(shù)據(jù)項(xiàng)目和第二用戶喜好數(shù)據(jù)的數(shù)據(jù) 項(xiàng)目之間的對(duì)應(yīng)關(guān)系。圖17是圖示出映射單元434的對(duì)應(yīng)關(guān)系確定處理的示意圖。在圖17中指示出了作為數(shù)據(jù)空間Dl的數(shù)據(jù)項(xiàng)目的屬性al-aN以及作為數(shù)據(jù)空間 D2的數(shù)據(jù)項(xiàng)目的屬性bl-bM。此外,還指示出了通過在數(shù)據(jù)空間Dl、D2中的上述學(xué)習(xí)而確 定的第一模型參數(shù)PaiG = Ι-k)和第二模型參數(shù)Pbj (j = 1-k)。在圖17中,例如關(guān)注數(shù)據(jù)空間Dl的屬性a2,與屬性a2的共同經(jīng)壓縮數(shù)據(jù)空間相 關(guān)的特征由向量(0. 1,0.3, ···,(). 1)指示,向量(0. 1,0.3, ···,(). 1)以第一模型參數(shù)Pai的 k個(gè)參數(shù)值作為其元素。在本說明書中,在關(guān)注特定數(shù)據(jù)項(xiàng)目的情況下,其元素為模型參數(shù) 的參數(shù)值的向量稱為該數(shù)據(jù)項(xiàng)目的索引(index)。因此,對(duì)于N維度數(shù)據(jù)空間Dl獲取了 N 個(gè)數(shù)據(jù)項(xiàng)目的索引,而對(duì)于M維度數(shù)據(jù)空間D2獲取了 M個(gè)數(shù)據(jù)項(xiàng)目的索引。映射單元434從兩個(gè)不同的數(shù)據(jù)空間Dl、D2獲取每一數(shù)據(jù)項(xiàng)目的索引,并計(jì)算各 數(shù)據(jù)項(xiàng)目的索引相似度。例如,索引相似度可以是向量之間的標(biāo)準(zhǔn)內(nèi)積、符號(hào)取反的歐幾里 德距離、余弦距離等。然后,針對(duì)數(shù)據(jù)空間D2的每一個(gè)數(shù)據(jù)項(xiàng)目,例如,映射單元434分別 確定數(shù)據(jù)空間Dl中的具有最高索引相似度的數(shù)據(jù)項(xiàng)目。在圖17的示例中,數(shù)據(jù)空間Dl中與數(shù)據(jù)空間D2的屬性bl具有最高相似度的數(shù) 據(jù)項(xiàng)目例如是屬性a2。數(shù)據(jù)空間Dl中與數(shù)據(jù)空間D2的屬性b2具有最高相似度的數(shù)據(jù)項(xiàng) 目是屬性a3。此外,數(shù)據(jù)空間Dl中與數(shù)據(jù)空間D2的屬性bM具有最高相似度的數(shù)據(jù)項(xiàng)目是 屬性al。映射單元434例如將以上確定的從數(shù)據(jù)空間Dl到數(shù)據(jù)空間D2的數(shù)據(jù)項(xiàng)目間對(duì)應(yīng) 關(guān)系輸出到轉(zhuǎn)換單元436。轉(zhuǎn)換單元436根據(jù)由映射單元434確定的數(shù)據(jù)空間Dl、D2的數(shù)據(jù)項(xiàng)目的對(duì)應(yīng)關(guān) 系,例如將從圖15的推薦設(shè)備410接收的第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為第二用戶喜好數(shù)據(jù)。圖18是描述轉(zhuǎn)換單元436的數(shù)據(jù)轉(zhuǎn)換處理的示意圖。在圖18中指示出了由映射單元434確定的數(shù)據(jù)空間Dl、D2的數(shù)據(jù)項(xiàng)目的對(duì)應(yīng)關(guān) 系。這里數(shù)據(jù)空間Dl的屬性a2與數(shù)據(jù)空間D2的屬性bl相對(duì)應(yīng),數(shù)據(jù)空間Dl的屬性a3與數(shù)據(jù)空間D2的屬性b2相對(duì)應(yīng),并且數(shù)據(jù)空間Dl的屬性al與數(shù)據(jù)空間D2的屬性bM相 對(duì)應(yīng)。此外,還在圖18中指示出了從圖15的推薦設(shè)備410接收的第一用戶喜好數(shù)據(jù)UP1。 這里,第一用戶喜好數(shù)據(jù)UPl被指示為(1.0,0.0,0.2,…,2.0)。轉(zhuǎn)換單元436例如根據(jù)圖18所指示的對(duì)應(yīng)關(guān)系從第一用戶喜好數(shù)據(jù)UPl順序獲 取與屬性bl,b2,…,bM相對(duì)應(yīng)的數(shù)據(jù)值,并生成第二用戶喜好數(shù)據(jù)UP2。在這種情況下, 根據(jù)上述對(duì)應(yīng)關(guān)系,第二用戶喜好數(shù)據(jù)UP2為(0.0,0.2,···,1.0)。由轉(zhuǎn)換單元436轉(zhuǎn)換得 到的第二用戶喜好數(shù)據(jù)UP2例如被輸出到圖15的推薦設(shè)備420。假設(shè)可如上所述地在不同數(shù)據(jù)空間之間相互轉(zhuǎn)換用戶喜好數(shù)據(jù),則允許在各設(shè)備 或系統(tǒng)之間循環(huán)利用或再利用可在各種數(shù)據(jù)空間中生成的用戶喜好數(shù)據(jù)。在這一點(diǎn)上,不 必修改在各設(shè)備或系統(tǒng)上安裝的現(xiàn)有應(yīng)用或數(shù)據(jù)庫。因此,變得可以通過利用該應(yīng)用或數(shù) 據(jù)庫來增加提供推薦服務(wù)的機(jī)會(huì)而無需額外費(fèi)用。[修改例]
圖19是圖示出根據(jù)數(shù)據(jù)轉(zhuǎn)換裝置的修改示例的信息處理裝置530的邏輯配置的 框圖。如圖19所示,信息處理裝置530包括參數(shù)DB 532、壓縮單元534和轉(zhuǎn)換單元536。類似于圖16的參數(shù)DB 432,參數(shù)DB 532存儲(chǔ)第一和第二參數(shù)集合。通過利用上 述學(xué)習(xí)裝置100來學(xué)習(xí)第一和第二參數(shù)集合。第一和第二參數(shù)集合分別可以是根據(jù)多主題 模型的模型參數(shù)。壓縮單元534通過利用從參數(shù)DB 532獲取的上述第一參數(shù)集合,從自轉(zhuǎn)換單元 536輸入的第一用戶喜好數(shù)據(jù)生成第一經(jīng)壓縮用戶喜好數(shù)據(jù)。然后,壓縮單元534將所生成 的第一經(jīng)壓縮用戶喜好數(shù)據(jù)輸出到轉(zhuǎn)換單元536。當(dāng)壓縮單元534生成第一經(jīng)壓縮用戶喜好數(shù)據(jù)時(shí),轉(zhuǎn)換單元536確定能夠通過利 用存儲(chǔ)在參數(shù)DB 532中的第二參數(shù)集合,生成與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相等同的第二 經(jīng)壓縮用戶喜好數(shù)據(jù)的似然第二用戶喜好數(shù)據(jù)。更具體而言,例如,轉(zhuǎn)換單元536通過預(yù)定 次數(shù)的嘗試,根據(jù)式1的概率分布來生成能夠生成與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相等同的第 二經(jīng)壓縮用戶喜好數(shù)據(jù)的第二用戶喜好數(shù)據(jù)。這里,優(yōu)選地,第一用戶喜好數(shù)據(jù)的所考慮向 量的絕對(duì)值越大,就將預(yù)定嘗試次數(shù)設(shè)定為越大。轉(zhuǎn)換單元536例如可以將如上所述確定 的第二用戶喜好數(shù)據(jù)作為對(duì)用戶喜好數(shù)據(jù)的轉(zhuǎn)換結(jié)果來輸出。<6.總結(jié)〉到目前為止,已經(jīng)參考圖8至19詳細(xì)描述了根據(jù)本發(fā)明各實(shí)施例的學(xué)習(xí)裝置、推 薦裝置、數(shù)據(jù)累積裝置和數(shù)據(jù)轉(zhuǎn)換裝置。利用這些實(shí)施例,變得可以在各領(lǐng)域的不同數(shù)據(jù)空 間之間共同管理用戶喜好和內(nèi)容屬性。因此,有利地可望如下優(yōu)點(diǎn)執(zhí)行交叉領(lǐng)域推薦、推 薦結(jié)果精確度提高、推薦服務(wù)提供機(jī)會(huì)增加等。注意,無論通過硬件還是軟件都可以執(zhí)行根據(jù)本說明書中描述的各實(shí)施例的處理 序列。在通過軟件執(zhí)行這些處理序列或者一部分處理的情況下,例如通過利用安裝到特定 硬件中的計(jì)算機(jī)或者圖20的通用計(jì)算機(jī)來執(zhí)行構(gòu)成該軟件的程序。在圖20中,中央處理單元(CPU)902控制通用計(jì)算機(jī)的整體操作。只讀存儲(chǔ) 器(R0M)904存儲(chǔ)描述了這些處理序列的一部分或全部的程序或數(shù)據(jù)。隨機(jī)訪問存儲(chǔ)器 (RAM) 906臨時(shí)存儲(chǔ)CPU 902在處理執(zhí)行時(shí)使用的程序或數(shù)據(jù)。CPU 902,ROM 904和RAM 906經(jīng)由總線910相互連接。另外,輸入/輸出接口 912連接到總線910。輸入/輸出接口 912將CPU 902、ROM 904和RAM 906與輸入設(shè)備920、輸出設(shè)備 922、存儲(chǔ)設(shè)備924、通信設(shè)備926和驅(qū)動(dòng)器930相連。輸入設(shè)備920例如經(jīng)由諸如鼠標(biāo)、鍵盤、觸摸面板、按鈕和開關(guān)之類的輸入器具從 用戶接收指令或信息處理。輸出設(shè)備922經(jīng)由諸如CRT、PDP、IXD和OLED之類的顯示器具 或者諸如揚(yáng)聲器之類的音頻輸出器具向用戶輸出信息。存儲(chǔ)設(shè)備924配置有例如硬盤驅(qū)動(dòng)器、閃存等,并存儲(chǔ)程序和數(shù)據(jù)。通信設(shè)備926 經(jīng)由諸如LAN和因特網(wǎng)之類的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動(dòng)器930按需而被布置在通用計(jì)算機(jī) 中。例如,向驅(qū)動(dòng)器930安裝可移除介質(zhì)932。在通過軟件執(zhí)行上述處理序列的情況下,例如存儲(chǔ)在圖20的R0M904、存儲(chǔ)設(shè)備 924或可移除介質(zhì)932中的程序在執(zhí)行時(shí)被讀入RAM 906并被CPU 902執(zhí)行。
本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,在所附權(quán)利要求或其等同物的范圍內(nèi),可根據(jù)設(shè)計(jì)要 求和其它因素進(jìn)行各種修改、組合、子組合和變更。在本說明書描述的示例中,能夠在與兩個(gè)不同數(shù)據(jù)空間相對(duì)應(yīng)的領(lǐng)域之間共同管 理用戶喜好或內(nèi)容屬性。但是,顯然,本發(fā)明適用于三個(gè)或更多個(gè)數(shù)據(jù)空間。本申請(qǐng)包含與2009年1月28日向日本專利局提交的日本在先專利申請(qǐng)JP 2009-017190所公開的主題相關(guān)的主題,該申請(qǐng)的全部?jī)?nèi)容通過引用結(jié)合于此。
權(quán)利要求
一種學(xué)習(xí)裝置,包括第一數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);第二數(shù)據(jù)獲取單元,獲取與所述第一用戶喜好數(shù)據(jù)共同的用戶的第二用戶喜好數(shù)據(jù),所述第二用戶喜好數(shù)據(jù)屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間;壓縮單元,通過利用第一參數(shù)集合從所述第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù);以及學(xué)習(xí)單元,學(xué)習(xí)第二參數(shù)集合,所述第二參數(shù)集合被利用來從所述第二用戶喜好數(shù)據(jù)生成具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),以使得所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。
2.根據(jù)權(quán)利要求1所述的學(xué)習(xí)裝置,其中,所述學(xué)習(xí)單元以由所述壓縮單元生成的所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)作為所述 第二經(jīng)壓縮用戶喜好數(shù)據(jù)的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)所述第二參數(shù)集合。
3.根據(jù)權(quán)利要求2所述的學(xué)習(xí)裝置,其中,所述壓縮單元根據(jù)多主題模型來生成所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的學(xué)習(xí)裝置,其中,所述第一參數(shù)集合和所述第二參數(shù)集合是與所述多主題模型的主題的固有分布 相對(duì)應(yīng)的參數(shù)集合。
5.根據(jù)權(quán)利要求1所述的學(xué)習(xí)裝置,其中,所述第一數(shù)據(jù)空間和所述第二數(shù)據(jù)空間是與相互不同的內(nèi)容領(lǐng)域相對(duì)應(yīng)的數(shù)據(jù) 空間。
6.根據(jù)權(quán)利要求1所述的學(xué)習(xí)裝置,其中,所述第一數(shù)據(jù)空間和所述第二數(shù)據(jù)空間是由相互不同的設(shè)備生成的用戶喜好數(shù) 據(jù)的數(shù)據(jù)空間。
7.一種學(xué)習(xí)方法,包括以下步驟獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);獲取與所述第一用戶喜好數(shù)據(jù)共同的用戶的第二用戶喜好數(shù)據(jù),所述第二用戶喜好數(shù) 據(jù)屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間;通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一 經(jīng)壓縮用戶喜好數(shù)據(jù);以及學(xué)習(xí)第二參數(shù)集合,所述第二參數(shù)集合被利用來從所述第二用戶喜好數(shù)據(jù)生成具有與 所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),以使得所述 第一經(jīng)壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。
8.一種程序,使得對(duì)信息處理裝置進(jìn)行控制的計(jì)算機(jī)執(zhí)行如下功能 第一數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);第二數(shù)據(jù)獲取單元,獲取與所述第一用戶喜好數(shù)據(jù)共同的用戶的第二用戶喜好數(shù)據(jù), 所述第二用戶喜好數(shù)據(jù)屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間;壓縮單元,通過利用第一參數(shù)集合從所述第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù) 的第一經(jīng)壓縮用戶喜好數(shù)據(jù);以及學(xué)習(xí)單元,學(xué)習(xí)第二參數(shù)集合,所述第二參數(shù)集合被利用來從所述第二用戶喜好數(shù)據(jù) 生成具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù), 以使得所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè) 用戶間較小。
9.一種信息處理裝置,包括數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù); 壓縮單元,通過利用第一參數(shù)集合來從所述 第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目 數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù);存儲(chǔ)單元,存儲(chǔ)具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的多個(gè)數(shù)據(jù), 所述多個(gè)數(shù)據(jù)是通過利用第二參數(shù)集合從屬于第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)或內(nèi)容 屬性數(shù)據(jù)生成的,所述第二數(shù)據(jù)空間與所述第一數(shù)據(jù)空間不同;以及選擇單元,根據(jù)與所述壓縮單元所生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)的相似度來從存儲(chǔ) 在所述存儲(chǔ)單元中的多個(gè)數(shù)據(jù)中選擇至少一個(gè)數(shù)據(jù),其中,存儲(chǔ)在所述存儲(chǔ)單元中的多個(gè)數(shù)據(jù)分別是通過利用所述第二參數(shù)集合來預(yù)先生 成的數(shù)據(jù),所述第二參數(shù)集合被學(xué)習(xí)以使得共同用戶的所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和從 所述第二用戶喜好數(shù)據(jù)生成的第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。
10.一種數(shù)據(jù)選擇方法,包括以下步驟獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一 經(jīng)壓縮用戶喜好數(shù)據(jù);以及根據(jù)與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)的相似度來從具有與所述第一經(jīng)壓縮用戶喜好 數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的多個(gè)數(shù)據(jù)中選擇至少一個(gè)數(shù)據(jù),所述多個(gè)數(shù)據(jù)是通過利用第二參 數(shù)集合從屬于第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)或內(nèi)容屬性數(shù)據(jù)生成的,所述第二數(shù)據(jù)空 間與所述第一數(shù)據(jù)空間不同,其中,所述多個(gè)數(shù)據(jù)分別是通過利用所述第二參數(shù)集合來預(yù)先生成的數(shù)據(jù),所述第二 參數(shù)集合被學(xué)習(xí)以使得共同用戶的所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和從所述第二用戶喜好 數(shù)據(jù)生成的第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。
11.一種程序,使得對(duì)信息處理裝置進(jìn)行控制的計(jì)算機(jī)執(zhí)行如下功能 數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);壓縮單元,通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目 數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù);存儲(chǔ)單元,存儲(chǔ)具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的多個(gè)數(shù)據(jù), 所述多個(gè)數(shù)據(jù)是通過利用第二參數(shù)集合從屬于第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)或內(nèi)容 屬性數(shù)據(jù)生成的,所述第二數(shù)據(jù)空間與所述第一數(shù)據(jù)空間不同;以及選擇單元,根據(jù)與所述壓縮單元所生成的第一經(jīng)壓縮用戶喜好數(shù)據(jù)的相似度來從存儲(chǔ) 在所述存儲(chǔ)單元中的多個(gè)數(shù)據(jù)中選擇至少一個(gè)數(shù)據(jù),其中,存儲(chǔ)在所述存儲(chǔ)單元中的多個(gè)數(shù)據(jù)分別是通過利用所述第二參數(shù)集合來預(yù)先生 成的數(shù)據(jù),所述第二參數(shù)集合被學(xué)習(xí)以使得共同用戶的所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)和從 所述第二用戶喜好數(shù)據(jù)生成的第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。
12.一種信息處理裝置,包括第一數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù); 第二數(shù)據(jù)獲取單元,獲取屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜 好數(shù)據(jù);第一壓縮單元,通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少的 數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第一經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì) 中;以及第二壓縮單元,通過利用第二參數(shù)集合來從所述第二用戶喜好數(shù)據(jù)生成具有與所述第 一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第二經(jīng)壓縮 用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì)上,其中,所述第一參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng) 壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)皇A朱口 ο
13.一種數(shù)據(jù)累積方法,包括以下步驟獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);獲取屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù); 通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少的數(shù)據(jù)項(xiàng)目數(shù)的第 一經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第一經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì)中;以及通過利用第二參數(shù)集合來從所述第二用戶喜好數(shù)據(jù)生成具有與所述第一經(jīng)壓縮用戶 喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第二經(jīng)壓縮用戶喜好數(shù)據(jù) 存儲(chǔ)在記錄介質(zhì)上,其中,所述第一參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng) 壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)皇A朱口 ο
14.一種程序,使得對(duì)信息處理裝置進(jìn)行控制的計(jì)算機(jī)執(zhí)行如下功能 第一數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);第二數(shù)據(jù)獲取單元,獲取屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜 好數(shù)據(jù);第一壓縮單元,通過利用第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成具有較少的 數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第一經(jīng)壓縮用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì) 中;以及第二壓縮單元,通過利用第二參數(shù)集合來從所述第二用戶喜好數(shù)據(jù)生成具有與所述第 一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),并將該第二經(jīng)壓縮 用戶喜好數(shù)據(jù)存儲(chǔ)在記錄介質(zhì)上,其中,所述第一參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng) 壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)皇A朱口 ο
15.一種信息處理裝置,包括存儲(chǔ)單元,存儲(chǔ)第一參數(shù)集合和第二參數(shù)集合,所述第一參數(shù)集合用來從屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),所述第 二參數(shù)集合用來從屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)生 成具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù);以 及轉(zhuǎn)換單元,基于存儲(chǔ)在所述存儲(chǔ)單元中的所述第一參數(shù)集合和所述第二參數(shù)集合來將 所述第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為所述第二用戶喜好數(shù)據(jù),其中,所述第一參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng) 壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。
16.根據(jù)權(quán)利要求15所述的信息處理裝置,其中,所述轉(zhuǎn)換單元根據(jù)所述第一用戶喜好數(shù)據(jù)的數(shù)據(jù)項(xiàng)目與所述第二用戶喜好數(shù)據(jù) 的數(shù)據(jù)項(xiàng)目之間的對(duì)應(yīng)關(guān)系來將所述第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為第二用戶喜好數(shù)據(jù),所述對(duì) 應(yīng)關(guān)系是根據(jù)所述第一參數(shù)集合和所述第二參數(shù)集合之間的各數(shù)據(jù)項(xiàng)目的參數(shù)值的相似 度來確定的。
17.根據(jù)權(quán)利要求15所述的信息處理裝置,還包括壓縮單元,通過利用所述第一參數(shù)集合來從所述第一用戶喜好數(shù)據(jù)生成所述第一經(jīng)壓 縮用戶喜好數(shù)據(jù),其中,所述轉(zhuǎn)換單元將能夠通過利用所述第二參數(shù)集合來生成由所述壓縮單元生成的 所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)的似然第二用戶喜好數(shù)據(jù)確定為從所述第一用戶喜好數(shù)據(jù) 轉(zhuǎn)換得到的第二用戶喜好數(shù)據(jù)。
18.一種數(shù)據(jù)轉(zhuǎn)換方法,包括基于第一參數(shù)集合和第二參數(shù)集合來將第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為第二用戶喜好數(shù)據(jù) 的步驟,所述第一參數(shù)集合用來從屬于第一數(shù)據(jù)空間的所述第一用戶喜好數(shù)據(jù)生成具有較 少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),所述第二參數(shù)集合用來從屬于與所述第一數(shù)據(jù) 空間不同的第二數(shù)據(jù)空間的所述第二用戶喜好數(shù)據(jù)生成具有與所述第一經(jīng)壓縮用戶喜好 數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),其中,所述第一參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng) 壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合。
19.一種程序,使得對(duì)信息處理裝置進(jìn)行控制的計(jì)算機(jī)執(zhí)行如下功能存儲(chǔ)單元,存儲(chǔ)第一參數(shù)集合和第二參數(shù)集合,所述第一參數(shù)集合用來從屬于第一數(shù) 據(jù)空間的第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù),所述第 二參數(shù)集合用來從屬于與所述第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間的第二用戶喜好數(shù)據(jù)生 成具有與所述第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù);以 及轉(zhuǎn)換單元,基于存儲(chǔ)在所述存儲(chǔ)單元中的所述第一參數(shù)集合和所述第二參數(shù)集合來將 所述第一用戶喜好數(shù)據(jù)轉(zhuǎn)換為所述第二用戶喜好數(shù)據(jù),其中,所述第一參數(shù)集合或所述第二參數(shù)集合是被學(xué)習(xí)以使得共同用戶的所述第一經(jīng) 壓縮用戶喜好數(shù)據(jù)和所述第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小的參數(shù)集合
全文摘要
本發(fā)明提供了學(xué)習(xí)裝置和方法、信息處理裝置和方法以及程序。學(xué)習(xí)裝置包括第一數(shù)據(jù)獲取單元,獲取屬于第一數(shù)據(jù)空間的第一用戶喜好數(shù)據(jù);第二數(shù)據(jù)獲取單元,獲取與第一用戶喜好數(shù)據(jù)共同的用戶的第二用戶喜好數(shù)據(jù),第二用戶喜好數(shù)據(jù)屬于與第一數(shù)據(jù)空間不同的第二數(shù)據(jù)空間;壓縮單元,利用第一參數(shù)集合從第一用戶喜好數(shù)據(jù)生成具有較少數(shù)據(jù)項(xiàng)目數(shù)的第一經(jīng)壓縮用戶喜好數(shù)據(jù);以及學(xué)習(xí)單元,學(xué)習(xí)第二參數(shù)集合,該第二參數(shù)集合被利用來從第二用戶喜好數(shù)據(jù)生成具有與第一經(jīng)壓縮用戶喜好數(shù)據(jù)相同的數(shù)據(jù)項(xiàng)目數(shù)的第二經(jīng)壓縮用戶喜好數(shù)據(jù),以使得第一經(jīng)壓縮用戶喜好數(shù)據(jù)和第二經(jīng)壓縮用戶喜好數(shù)據(jù)之間的差異在多個(gè)用戶間較小。
文檔編號(hào)G06F17/30GK101840410SQ20101010579
公開日2010年9月22日 申請(qǐng)日期2010年1月28日 優(yōu)先權(quán)日2009年1月28日
發(fā)明者高松慎吾 申請(qǐng)人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
瑞安市| 柯坪县| 吴江市| 中方县| 博白县| 阿合奇县| 永嘉县| 克山县| 深水埗区| 毕节市| 新和县| 马龙县| 岚皋县| 水城县| 连平县| 鄱阳县| 尚志市| 广宗县| 剑川县| 荣成市| 乌鲁木齐县| 襄汾县| 湾仔区| 巴马| 孝义市| 平度市| 南宁市| 马边| 南投市| 隆德县| 禄劝| 温宿县| 通海县| 依安县| 高淳县| 丹巴县| 临泽县| 稷山县| 察隅县| 乌什县| 襄垣县|