两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

信息處理裝置和方法、程序以及記錄介質(zhì)的制作方法

文檔序號(hào):2837448閱讀:175來(lái)源:國(guó)知局
專利名稱:信息處理裝置和方法、程序以及記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理裝置和方法、程序以及記錄介質(zhì)。特別地,本發(fā) 明涉及用于處理內(nèi)容的信息處理裝置和方法、程序以及記錄介質(zhì)。
背景技術(shù)
將大量樂(lè)曲記錄到硬盤或閃存中并再現(xiàn)所記錄的樂(lè)曲的設(shè)備正變得越 來(lái)越普及。正因?yàn)榭梢杂涗洿罅繕?lè)曲,所以產(chǎn)生了從所記錄的那些樂(lè)曲中 檢索出相似樂(lè)曲的需要。
存在一種檢索相似樂(lè)曲的現(xiàn)有技術(shù),該技術(shù)基于樂(lè)曲的特征量來(lái)測(cè)量 樂(lè)曲之間的距離,從而檢索得到相似樂(lè)曲(例如參考,日本專利早期公開
No.2004-171096,稱作專利文獻(xiàn)l)。

發(fā)明內(nèi)容
但是,通常,如果基于樂(lè)曲的特征量之間的相關(guān)或距離來(lái)定義相似 性,則這需要與所存在的樂(lè)曲組合一樣多的計(jì)算。近年來(lái),能夠存儲(chǔ)幾百 首到超過(guò)一千首樂(lè)曲的設(shè)備已經(jīng)很普遍。越多的樂(lè)曲存在,則檢索相似曲 目所需要的處理時(shí)間就越長(zhǎng),因而導(dǎo)致大量的處理時(shí)間。
另一方面,單純地選擇其特征量之間的歐幾里得距離(Euclidean
distance)彼此相接近的樂(lè)曲,會(huì)導(dǎo)致得到不希望的曲目,也就是,將那 些用戶并不認(rèn)為相似的曲目確定為相似。
基于歐幾里得距離來(lái)得到用戶認(rèn)為相似的樂(lè)曲的一種可能方法是,創(chuàng) 建能夠利用基于用戶測(cè)驗(yàn)中得到的樂(lè)曲之間的相似性的主坐標(biāo)分析 (principal coordinate analysis)或增量更新(incremental update)來(lái)很好地 表示相似性的空間,然后例如通過(guò)回歸分析(regression analysis)來(lái)從樂(lè) 曲的特征量中估計(jì)各個(gè)軸的坐標(biāo)。 但是,收集足夠多的、表示樂(lè)曲之間相似性的用戶測(cè)驗(yàn)數(shù)據(jù)、以便應(yīng) 用上述方法是非常困難,而且并不實(shí)際。例如,為了獲得關(guān)于1450首樂(lè) 曲之間的相似性程度的測(cè)驗(yàn)數(shù)據(jù)、以便能夠應(yīng)用主坐標(biāo)分析,則必須輸入
指示1450首X1450首或兩百一十萬(wàn)個(gè)模式(pattern)的相似或不相似的 數(shù)據(jù)。
鑒于上述原因而實(shí)現(xiàn)了本發(fā)明,本發(fā)明的一個(gè)目的是以更簡(jiǎn)易、更快 速且更精確的方式來(lái)識(shí)別相似內(nèi)容。
根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理裝置包括轉(zhuǎn)換裝置和檢索裝置。轉(zhuǎn) 換裝置使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換。所述函數(shù)適用于對(duì)附于多條內(nèi) 容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi)容之 間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng)的 距離。所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特征量空間中 的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特 征量空間。檢索裝置基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索出相似內(nèi)容。
本發(fā)明還可以包括提取裝置,用以提取內(nèi)容特征量。
所述檢索裝置能夠通過(guò)從已由所述函數(shù)轉(zhuǎn)換過(guò)其特征量的內(nèi)容的多個(gè) 組中的同一組中檢索內(nèi)容,來(lái)檢索出相似內(nèi)容。
所述轉(zhuǎn)換裝置能夠通過(guò)應(yīng)用上述函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。所述函數(shù)是 利用由遺傳方法(genetic method)反復(fù)生成、直到預(yù)定世代數(shù)目都不再更 新評(píng)估值為止而獲得的。所述評(píng)估值是從兩個(gè)值中計(jì)算得到的信息標(biāo)準(zhǔn)。 所述兩個(gè)值中的一個(gè)是表示基于多條內(nèi)容之間的歐幾里得距離的分類程度 的值,所述多條內(nèi)容被認(rèn)為在由用戶輸入的、所述多條內(nèi)容之間的相似性 關(guān)系中是相似或不相似。所述兩個(gè)值中的另一個(gè)是所述函數(shù)的自由參數(shù)的 數(shù)目。
所述轉(zhuǎn)換裝置能夠通過(guò)應(yīng)用上述函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。所述函數(shù)是 利用遺傳方法反復(fù)生成、直到預(yù)定世代數(shù)目都不再更新評(píng)估值為止而獲得 的。所述評(píng)估值是根據(jù)表示分類程度的FDR (費(fèi)希爾判別比)來(lái)計(jì)算得到的。
本發(fā)明還可以包括生成裝置,用以利用遺傳方法來(lái)生成所述函數(shù),以
使得所述轉(zhuǎn)換裝置能夠通過(guò)應(yīng)用所生成的函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。
本發(fā)明還可以包括計(jì)算裝置,用以從兩個(gè)值中計(jì)算得到作為信息標(biāo)準(zhǔn) 的評(píng)估值,以使得所述生成裝置能夠利用遺傳方法來(lái)生成所述函數(shù),直到 預(yù)定世代數(shù)目都不再更新評(píng)估值為止。上述兩個(gè)值中的一個(gè)是表示基于多 條內(nèi)容之間的歐幾里得距離的分類程度的值,所述多條內(nèi)容被認(rèn)為在由用 戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系中是相似或不相似。另一個(gè)是 所述函數(shù)的自由參數(shù)的數(shù)目。
所述計(jì)算裝置根據(jù)表示所述分類程度的FDR來(lái)計(jì)算所述評(píng)估值。 本發(fā)明還可以包括獲取裝置,用以獲取表示用戶輸入的、所述多條內(nèi) 容之間的相似性關(guān)系的數(shù)據(jù),以使得所述計(jì)算裝置能夠使用所述表示用戶 輸入的、所述多條內(nèi)容之間的相似性關(guān)系的數(shù)據(jù)來(lái)計(jì)算評(píng)估值。
本發(fā)明還可以包括群集(clustering)裝置,用于基于經(jīng)轉(zhuǎn)換的特征量 來(lái)執(zhí)行內(nèi)容的群集操作。
本發(fā)明還可以包括識(shí)別裝置,用于根據(jù)基于經(jīng)轉(zhuǎn)換的特征量、內(nèi)容到 群集的距離,來(lái)識(shí)別內(nèi)容所屬于的組。
根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理方法包括轉(zhuǎn)換步驟和檢索步驟。轉(zhuǎn) 換步驟使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換。所述函數(shù)適用于對(duì)附于多條內(nèi) 容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi)容之 間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng)的 距離。所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特征量空間中 的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特 征量空間。檢索步驟基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索相似的內(nèi)容。
根據(jù)本發(fā)明一個(gè)實(shí)施例的程序使得計(jì)算機(jī)執(zhí)行轉(zhuǎn)換步驟和檢索步驟。 轉(zhuǎn)換步驟使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換,所述函數(shù)適用于對(duì)附于多條 內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi)容 之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng) 的距離。所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特征量空間 中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的 特征量空間。檢索步驟基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索相似的內(nèi)容。
存儲(chǔ)在根據(jù)本發(fā)明一個(gè)實(shí)施例的記錄介質(zhì)中的程序使得計(jì)算機(jī)執(zhí)行轉(zhuǎn) 換步驟和檢索步驟。轉(zhuǎn)換步驟使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換,所述函 數(shù)適用于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特 征量限定的多條內(nèi)容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間 的相似性關(guān)系相適應(yīng)的距離。所述函數(shù)還適用于將分布在由所述多個(gè)特征 量限定的特征量空間中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn) 行轉(zhuǎn)換而得到的新的特征量空間。檢索步驟基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索相 似的內(nèi)容。
在本發(fā)明的一個(gè)實(shí)施例中,使用函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。所述函數(shù)適 用于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量 限定的多條內(nèi)容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相 似性關(guān)系相適應(yīng)的距離。所述函數(shù)還適用于將分布在由所述多個(gè)特征量限 定的特征量空間中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn) 換而得到的新的特征量空間。相似內(nèi)容是基于經(jīng)轉(zhuǎn)換的特征量來(lái)提取的。 如上所述,根據(jù)本發(fā)明的實(shí)施例,能夠識(shí)別相似內(nèi)容。 此外,根據(jù)本發(fā)明的實(shí)施例,能夠以更簡(jiǎn)易、更快速且更精確的方式 來(lái)識(shí)別相似內(nèi)容。


圖1是示出了可操作于對(duì)內(nèi)容特征量空間進(jìn)行變換的信息處理裝置的 配置示例的框圖2是示出了空間變換單元的示例的框圖; 圖3是描述了空間變換的視圖; 圖4是描述了轉(zhuǎn)換函數(shù)的視圖; 圖5是描述了經(jīng)變換的空間的視圖; 圖6是描述了利用遺傳方法來(lái)變換空間的視圖; 圖7是示出了利用遺傳方法的空間變換的概念的視圖; 圖8是示出了在經(jīng)變換的空間中的歐幾里得距離與內(nèi)容相似性之間的 關(guān)系的視圖9是示出了在經(jīng)變換的空間中相似內(nèi)容或不相似內(nèi)容的特征量間的 歐幾里得距離與FDR值之間的關(guān)系的視圖10是示出了在經(jīng)變換的空間中相似內(nèi)容或不相似內(nèi)容的特征量間
的歐幾里得距離與所述FDR值之間的關(guān)系的視圖11是示出了在經(jīng)變換的空間中相似內(nèi)容或不相似內(nèi)容的特征量間
的歐幾里得距離與所述FDR值之間的關(guān)系的視圖12是示出了自由參數(shù)的示例的視圖13是示出了相關(guān)值、相似性數(shù)據(jù)S和內(nèi)容特征量間的距離之間的 關(guān)系的視圖14是示出了相關(guān)值、相似性數(shù)據(jù)S和內(nèi)容特征量間的距離之間的 關(guān)系的視圖15是示出了相關(guān)值、相似性數(shù)據(jù)S和內(nèi)容特征量間的距離之間的 關(guān)系的視圖16是示出了群集數(shù)和匹配率的示例的視圖17是示出了使用相似性數(shù)據(jù)S的評(píng)估的示例的視圖18是示出了匹配率的示例的視圖19是示出了群集的示例的視圖20是示出了群集的示例的視圖21是示出了群集的示例的視圖22是示出了群集的示例的視圖23是描述了預(yù)處理的流程圖24是描述了空間變換處理的流程圖25是示出了可操作用于識(shí)別相似內(nèi)容的信息處理裝置的配置示例 的框圖26是描述了內(nèi)容加載處理的流程圖27是描述了相似內(nèi)容檢索處理的流程圖28是可操作用于通過(guò)對(duì)內(nèi)容特征量空間進(jìn)行變換來(lái)識(shí)別相似內(nèi)容
的信息處理裝置的配置示例的框圖;以及
圖29是示出了個(gè)人計(jì)算機(jī)的配置示例的框圖。
具體實(shí)施例方式
在描述本發(fā)明的優(yōu)選實(shí)施例之前,以下首先討論本發(fā)明的構(gòu)成要素與 這里所述的實(shí)施例之間的關(guān)系。這種說(shuō)明旨在確保支持本要求了權(quán)利的發(fā) 明的實(shí)施例在這里得到描述。因此,即使一個(gè)實(shí)施例沒(méi)有被描述為與本發(fā) 明的某構(gòu)成要素相關(guān),那也并不一定意味著該實(shí)施例與本發(fā)明的所述構(gòu)成 要素?zé)o關(guān)。反過(guò)來(lái),即使在這里將一個(gè)實(shí)施例描述為與本發(fā)明的某構(gòu)成要 素相關(guān),那也并不一定意味著該實(shí)施例與本發(fā)明的其它構(gòu)成要素?zé)o關(guān)。
根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理裝置包括轉(zhuǎn)換裝置(例如,圖25中
的特征量轉(zhuǎn)換單元131)和檢索裝置(例如,圖25中的檢索處理單元 127)。轉(zhuǎn)換裝置使用函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。所述函數(shù)適用于對(duì)附于多 條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi) 容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系相適 應(yīng)的距離。所述函數(shù)還適用于將分布(layout)在由上述多個(gè)特征量限定 的特征量空間中的多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得 到的新的特征量空間。檢索裝置基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索相似的內(nèi)容。
本發(fā)明還可以包括用于提取內(nèi)容特征量的提取裝置(例如,圖25中的 特征量提取單元122)。
本發(fā)明還可以包括生成裝置(例如,圖28中的空間變換單元26), 該生成裝置用于通過(guò)遺傳方法(genetic method)來(lái)生成函數(shù),以使得轉(zhuǎn)換 裝置可以通過(guò)應(yīng)用所生成的函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。
本發(fā)明還可以包括計(jì)算裝置(例如,如圖2所示的、設(shè)在圖28中的空 間變換單元26中的函數(shù)評(píng)估值計(jì)算單元42),該計(jì)算裝置用于根據(jù)兩個(gè) 值來(lái)計(jì)算作為信息標(biāo)準(zhǔn)的評(píng)估值,以使得生成裝置可以通過(guò)遺傳方法來(lái)生 成所述函數(shù),直到預(yù)定世代數(shù)目都不再更新所述評(píng)估值為止。上述的兩個(gè) 值中的一個(gè)是表示基于多條內(nèi)容之間的歐幾里得距離的分類程度的值,所 述多條內(nèi)容被認(rèn)為在由用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系中是 相似或不相似。另一個(gè)是所述函數(shù)的自由參數(shù)的數(shù)目。
本發(fā)明還可以包括獲取裝置(例如,圖28中的用戶評(píng)估獲取單元
25),該獲取裝置用于獲取表示用戶輸入的、所述多條內(nèi)容之間的相似性 關(guān)系的數(shù)據(jù),以使得計(jì)算裝置能夠使用該表示用戶輸入的、所述多條內(nèi)容 之間的相似性關(guān)系的數(shù)據(jù)來(lái)計(jì)算評(píng)估值。
本發(fā)明還可以包括群集(clustering)裝置(例如,圖28中的群集單元 27),該群集裝置用于基于經(jīng)轉(zhuǎn)換的特征量來(lái)進(jìn)行內(nèi)容的群集操作。
本發(fā)明還可以包括識(shí)別裝置(例如,圖25中的內(nèi)容組識(shí)別單元),該 識(shí)別裝置用于根據(jù)基于經(jīng)轉(zhuǎn)換的特征量、內(nèi)容到群集的距離來(lái)識(shí)別內(nèi)容所 屬的組。
根據(jù)本發(fā)明的實(shí)施例的信息處理方法和程序包括轉(zhuǎn)換步驟(例如,圖 26中的步驟S54)和檢索步驟(例如,圖27中的步驟S72)。轉(zhuǎn)換步驟使 用函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。所述函數(shù)適用于對(duì)附在多條內(nèi)容上的多個(gè)特征 量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi)容之間的距離,與和 用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng)的距離相一致。所述 函數(shù)還適用于將分布在由上述多個(gè)特征量限定的特征量空間中的多條內(nèi) 容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特征量空間。檢 索步驟基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索相似內(nèi)容。
圖1是示出了可操作于變換內(nèi)容特征量空間、并生成適用于在經(jīng)變換 的空間中獲取特征量的轉(zhuǎn)換函數(shù)的信息處理裝置11的配置示例的框圖。 信息處理裝置11包括樣本內(nèi)容加載單元21、內(nèi)容數(shù)據(jù)庫(kù)22、特征量提取 單元23、特征量獲取單元24、用戶評(píng)估獲取單元25、空間變換單元26、 群集單元27和輸出單元28。
樣本內(nèi)容加載單元21加載樣本內(nèi)容,所述樣本內(nèi)容是適合用于對(duì)內(nèi)容 特征量空間進(jìn)行變換的內(nèi)容的樣本。樣本內(nèi)容加載單元21將樣本內(nèi)容提 供給內(nèi)容數(shù)據(jù)庫(kù)22。
內(nèi)容數(shù)據(jù)庫(kù)22存儲(chǔ)來(lái)自樣本內(nèi)容加載單元21的樣本內(nèi)容。
這里,內(nèi)容包括樂(lè)曲(它們的數(shù)據(jù))、運(yùn)動(dòng)或靜止圖像(它們的數(shù) 據(jù))等。
以下將對(duì)內(nèi)容是樂(lè)曲的情況進(jìn)行描述。
特征量提取單元23從存儲(chǔ)在內(nèi)容數(shù)據(jù)庫(kù)22中的樣本內(nèi)容中提取特征
量。特征量提取單元23例如通過(guò)分析樣本內(nèi)容(樂(lè)曲)的音頻波形來(lái)提 取樣本內(nèi)容的特征量。特征量提取單元23將所提取的特征量提供給內(nèi)容
數(shù)據(jù)庫(kù)22。
特征量獲取單元24獲取樣本內(nèi)容的特征量。例如,特征量獲取單元 24獲取由用戶操作輸入的特征量?;蛘撸卣髁揩@取單元24獲取諸如對(duì) 經(jīng)由網(wǎng)絡(luò)(未示出)從服務(wù)器讀取的、對(duì)該內(nèi)容的評(píng)論之類的樣本內(nèi)容的 特征量。特征量獲取單元24將所獲得的特征量提供給內(nèi)容數(shù)據(jù)庫(kù)22。
用戶評(píng)估獲取單元25從內(nèi)容數(shù)據(jù)庫(kù)22獲取用戶評(píng)估。用戶評(píng)估表示 根據(jù)用戶對(duì)存儲(chǔ)在內(nèi)容數(shù)據(jù)庫(kù)22中的樣本內(nèi)容的主觀判斷而得到的多條 樣本內(nèi)容之間的相似程度。例如,用戶評(píng)估獲取單元25獲取由用戶操作 輸入的評(píng)估?;蛘撸脩粼u(píng)估獲取單元25獲取對(duì)經(jīng)由網(wǎng)絡(luò)(未示出)從 服務(wù)器讀取的樣本內(nèi)容的評(píng)估。用戶評(píng)估獲取單元25將所獲得的評(píng)估提 供給內(nèi)容數(shù)據(jù)庫(kù)22。
空間變換單元26對(duì)樣本內(nèi)容的特征量進(jìn)行變換??臻g變換單元26將 適用于對(duì)樣本內(nèi)容的特征量空間進(jìn)行變換的轉(zhuǎn)換函數(shù),提供給內(nèi)容數(shù)據(jù)庫(kù) 22。
群集單元27執(zhí)行在經(jīng)變換的空間中的樣本內(nèi)容的群集操作。群集單元 27找到群集距心(cluster centroid),以將在經(jīng)變換的空間中的所述距心位 置提供給內(nèi)容數(shù)據(jù)庫(kù)22。群集距心(位置)充當(dāng)內(nèi)容組的代表值。這里, 術(shù)語(yǔ)"內(nèi)容組"指的是彼此相似的多條內(nèi)容的集合。
內(nèi)容數(shù)據(jù)庫(kù)22不僅存儲(chǔ)樣本內(nèi)容,還存儲(chǔ)由特征量提取單元23提取 的樣本內(nèi)容特征量、由特征量獲取單元24獲取的樣本內(nèi)容特征量、由用 戶評(píng)估獲取單元25獲得的用戶評(píng)估、由空間變換單元26獲得的轉(zhuǎn)換函數(shù) 以及由群集單元27獲得的群集距心位置。
輸出單元28根據(jù)請(qǐng)求,向外部設(shè)備輸出所獲得的轉(zhuǎn)換函數(shù)和存儲(chǔ)在內(nèi) 容數(shù)據(jù)庫(kù)22中的群集距心的位置。
圖2是示出空間變換單元26的配置的框圖??臻g變換單元26包括轉(zhuǎn) 換函數(shù)生成單元41和函數(shù)評(píng)估值計(jì)算單元42。
轉(zhuǎn)換函數(shù)生成單元41生成如下所述的函數(shù)該函數(shù)適用于對(duì)附于多條
內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi)容 之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng) 的距離。所述函數(shù)還適用于將分布在由上述多個(gè)特征量限定的特征量空間 中的多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特征 量空間。換言之,轉(zhuǎn)換函數(shù)生成單元41通過(guò)遺傳方法來(lái)生成函數(shù),所述 函數(shù)適用于將其中多個(gè)內(nèi)容特征量中的每一個(gè)特征量都充當(dāng)維度軸
(dimensional axis)的空間,變換為根據(jù)從用戶主觀角度出發(fā)的多條內(nèi)容 之間的相似程度來(lái)設(shè)置各個(gè)位置之間的距離的空間,所述各個(gè)位置是由多 條內(nèi)容的各個(gè)特征量確定的。即,轉(zhuǎn)換函數(shù)生成單元41通過(guò)遺傳方法, 來(lái)生成適用于將第一空間變換為第二空間的函數(shù),在所述第一空間中,存 儲(chǔ)在內(nèi)容數(shù)據(jù)庫(kù)22中的樣本內(nèi)容的各個(gè)特征量都充當(dāng)維度軸,而在所述 第二空間中,多條樣本內(nèi)容的特征量之間的距離是根據(jù)用戶對(duì)樣本內(nèi)容的 評(píng)估來(lái)設(shè)置的。
函數(shù)評(píng)估值計(jì)算單元42根據(jù)兩個(gè)值來(lái)計(jì)算作為信息標(biāo)準(zhǔn)的評(píng)估值。上 述兩個(gè)值中的一個(gè)是表示基于多條內(nèi)容之間的歐幾里得距離的分類程度的 值。,所述多條內(nèi)容被認(rèn)為在由用戶輸入的、所述多條內(nèi)容之間的相似性 關(guān)系中是相似或不相似。另一個(gè)是所述函數(shù)的自由參數(shù)的數(shù)目。即,函數(shù) 評(píng)估值計(jì)算單元42根據(jù)兩個(gè)值來(lái)計(jì)算評(píng)估值或信息標(biāo)準(zhǔn)。它們中的一個(gè) 是表示基于樣本內(nèi)容的多條特征量之間的歐幾里得距離的分類程度的值, 所述樣本內(nèi)容在預(yù)先由用戶評(píng)估所估計(jì)的相似性程度的那些樣本內(nèi)容中被 主觀上認(rèn)為相似或不相似。另一個(gè)是轉(zhuǎn)換函數(shù)的自有參數(shù)的數(shù)目。
轉(zhuǎn)換函數(shù)生成單元41根據(jù)計(jì)算所得的評(píng)估值、通過(guò)遺傳方法來(lái)反復(fù)地 生成函數(shù)。
以下將參考圖3到圖15,來(lái)描述由空間變換單元26進(jìn)行的對(duì)樣本內(nèi) 容的特征量空間的變換。
術(shù)語(yǔ)"特征量空間"指的是其中作為特征量的各個(gè)變量充當(dāng)維度軸的 空間。另一方面,術(shù)語(yǔ)"空間變換"指的是出于給定目的而將初始空間變 換為另一個(gè)空間。即,空間變換意味著至少將空間的多個(gè)維度軸中的一個(gè) 維度軸,變換為與初始變量不相同的變量。
這里,假設(shè)變量X是構(gòu)成在包含n維度(n是正整數(shù))的初始空間中 的維度的變量。假設(shè)變量X'是構(gòu)成經(jīng)變換的、包含m維度(m是正整數(shù)) 的空間中的維度的變量。
如圖3所示,例如,空間被變換以使得初始空間中的變量X的變量 X1和X2被變換為變量X1'和X2'。在圖3中,每一個(gè)黑色圓點(diǎn)表示空間中 由單個(gè)內(nèi)容特征量確定的位置。圖3中在黑色圓點(diǎn)之間的每條線連接根據(jù) 用戶評(píng)估而被認(rèn)為相似的多條內(nèi)容的特征量所確定的位置處的那些黑色圓 點(diǎn),所述的用戶評(píng)估表示根據(jù)用戶的主觀判斷的多條內(nèi)容之間的相似性程 度。
在經(jīng)變換的空間中的各個(gè)維度都是通過(guò)對(duì)初始空間中的變量進(jìn)行給定 的轉(zhuǎn)換處理而生成的。
艮口,如公式(1)所示,通過(guò)對(duì)由初始空間中的變量X組成的向量X
應(yīng)用轉(zhuǎn)換函數(shù)f],就可以得到由構(gòu)成經(jīng)變換的空間中的維度的變量x'組成
的向量Xj'。
向量xj^g(向量x) ... (1)
轉(zhuǎn)換函數(shù)S包括m個(gè)轉(zhuǎn)換函數(shù)fl到fm 。
公式(2)表示針對(duì)線性轉(zhuǎn)換的轉(zhuǎn)換函數(shù)fl的示例。
fl(向量X"Xl x0.5…(2)
公式(3)表示針對(duì)線性轉(zhuǎn)換的轉(zhuǎn)換函數(shù)f2的示例。
f2(向量X)-Xl x0.1+X2x0.3 ... (3)
公式(4)表示針對(duì)使用核函數(shù)(kernel fimction)的非線性轉(zhuǎn)換的轉(zhuǎn)
換函數(shù)f3的示例。
fi(向量X)-K(向量X, e) ... (4)
如圖4所示,例如,包括m個(gè)轉(zhuǎn)換函數(shù)fl到fm的轉(zhuǎn)換函數(shù)g被應(yīng)用 于作為具有n維度的初始空間的軸的變量Xl到Xn。在圖4的示例中,轉(zhuǎn) 換函數(shù)fm如公式(5)所示。
fm(向量X)二X4x0.1+X2x1.5 ... (5)
作為具有m維度的經(jīng)轉(zhuǎn)換的空間的軸的變量Xl'到Xm'如公式(6)所示。
xr = fi (向量x)
X2^f2(向量X) X3^f3(向量X)
Xm'^fm(向量X)…(6)
通過(guò)遺傳方法對(duì)轉(zhuǎn)換函數(shù)S進(jìn)行反復(fù)優(yōu)化,從而使得經(jīng)變換的空間更 接近于更符合所述目的的空間。
例如,隨機(jī)地生成轉(zhuǎn)換函數(shù)3以生成預(yù)定數(shù)目的空間。g卩,生成多個(gè) 轉(zhuǎn)換函數(shù)巧。基于從函數(shù)評(píng)估函數(shù)得到的函數(shù)評(píng)估值,來(lái)對(duì)所有的生成空 間進(jìn)行評(píng)估。選擇具有高評(píng)估值的幾個(gè)空間,也就是,更符合所述目的的 空間?;蛘撸沟靡粋€(gè)空間的轉(zhuǎn)換函數(shù)fj的一部分和其它空間的轉(zhuǎn)換函數(shù) 5的一部分相互交叉,以使得它們可以相互替換。又或者,使空間的轉(zhuǎn)換 函數(shù)6的一部分發(fā)生突變(mutation),以使得其可以被隨機(jī)地改變。又 或者,將空間留給新的一代,以使得可以重新并隨機(jī)地生成轉(zhuǎn)換函數(shù)fl到 fm中的任意一個(gè)函數(shù)。
通過(guò)選擇、交叉、突變或隨機(jī)生成的下一代空間的生成,以及評(píng)估及 其函數(shù)評(píng)估值將被反復(fù)進(jìn)行、直到函數(shù)評(píng)估值不再增大為止。
使用諸如 AIC (Akaike Information Criterion)或BIC ( Schwarz,s Bayesian Information Criterion)之類的信息標(biāo)準(zhǔn)作為函數(shù)評(píng)估值,以防止 超量學(xué)習(xí)(overlearning)。
例如,信息標(biāo)準(zhǔn)AIC是通過(guò)公式(7)而得到的。
AK^-2x最大對(duì)數(shù)似然率+2x自由參數(shù)數(shù)目...(7)
例如,信息標(biāo)準(zhǔn)BIC是通過(guò)公式(8)而得到的。
BIC = -2x最大對(duì)數(shù)似然率+ log(樣本內(nèi)容評(píng)估數(shù))x自由參數(shù)數(shù) 目 ...(8)
如圖5所示,通過(guò)簡(jiǎn)單地測(cè)量歐幾里得距離A,該空間就可以被變 換,以使得可以基于符合用戶主觀觀點(diǎn)的測(cè)量來(lái)計(jì)算多條內(nèi)容之間的相似 性程度。即,生成空間被變換,以使得由該空間中的兩條內(nèi)容的特征量表 示的位置之間的歐幾里得距離A表示它們之間的符合用戶主觀觀點(diǎn)的相似
性程度。
這里,將更詳細(xì)地描述樣本內(nèi)容、關(guān)于樣本內(nèi)容的用戶評(píng)估、特征 量、轉(zhuǎn)換函數(shù)和函數(shù)評(píng)估值。
首先,通過(guò)用戶測(cè)驗(yàn)來(lái)準(zhǔn)備作為教師數(shù)據(jù)的樣本內(nèi)容和關(guān)于其的用戶 評(píng)估。例如,準(zhǔn)備內(nèi)容相似性數(shù)據(jù)S、作為關(guān)于樣本內(nèi)容的用戶評(píng)估。
用于測(cè)驗(yàn)的樣本內(nèi)容用M來(lái)表示,而用于測(cè)驗(yàn)的樣本內(nèi)容的數(shù)目用O
(例如,1400)來(lái)表示。
如果兩條樣本內(nèi)容Ml和M2被用戶評(píng)估為相似,則關(guān)于Ml-M2組合 (Ml, M2)的相似性數(shù)據(jù)S被設(shè)定為O,而0意味著它們彼此相似。
如果兩條樣本內(nèi)容Ml和M3被用戶評(píng)估為不相似,則關(guān)于Ml-M3組 合(Ml, M3)的相似性數(shù)據(jù)S被設(shè)定為1,而1意味著它們是彼此不相 似的。
類似地,如果兩條樣本內(nèi)容M4和M6被用戶評(píng)估為相似,則關(guān)于 M4-M6組合(M4, M6)的相似性數(shù)據(jù)S被設(shè)定為0,而0意味著它們是 彼此相似的。
這里,教師數(shù)據(jù)(所準(zhǔn)備的樣本內(nèi)容和關(guān)于其的評(píng)估)的數(shù)目可以少 于現(xiàn)有技術(shù)中的教師數(shù)據(jù)。此外,沒(méi)有必要準(zhǔn)備O條樣本內(nèi)容(例如, 1400條內(nèi)容)的所有可能組合的相似性數(shù)據(jù)S。
接下來(lái),準(zhǔn)備能正確表示樣本內(nèi)容的特征的特征量。這些特征量被用 作組成初始空間(變換之前的空間)的變量。例如,通過(guò)獲得預(yù)先從樣本 內(nèi)容中提取的特征量或者通過(guò)從樣本內(nèi)容中提取特征量,來(lái)準(zhǔn)備特征量。
以下將利用特征量Fki來(lái)表示充當(dāng)組成初始空間的變量的特征量。這 里,i是l到O (樣本內(nèi)容的條數(shù))中的任意一個(gè)。
例如,特征量Fkl表示演奏速度,例如,BPM (每一分鐘的拍子數(shù) (Beat Per Minute)),也就是音樂(lè)拍子(tempo)。例如,特征量Fk2表 示指示樂(lè)曲快或慢的速度(speed)。這個(gè)速度是針對(duì)樂(lè)曲的主觀觀點(diǎn),也 就是,傾聽該樂(lè)曲的用戶所認(rèn)為的速度。例如,存在越多的十六分音符, 則樂(lè)曲就會(huì)被認(rèn)為越快。
特征量Fk3表示音樂(lè)拍子波動(dòng)的偏移量(dispersion)或范圍。另一方
面,特征量Fk4表示大調(diào)(major)或大和弦(major chord)。特征量Fk5 表示音符(note)或每單位時(shí)間內(nèi)的音符數(shù)。
此外,特征量Fkn表示低中頻(LoMid),或音頻頻帶內(nèi)低域能量與 中域能量之比。
如圖6所示,其軸為特征量Fkl到Fkn的初始空間被一點(diǎn)一點(diǎn)地變形 為由歐幾里得距離表示多條內(nèi)容之間的相似性程度的空間。
當(dāng)由于轉(zhuǎn)換函數(shù)5的更新而使得空間被變換時(shí),將計(jì)算得到函數(shù)評(píng)估 值。信息標(biāo)準(zhǔn)被用作所述的函數(shù)評(píng)估值。所述信息標(biāo)準(zhǔn)是從兩個(gè)值中計(jì)算 得到的。它們中的一個(gè)是FDR (Fisher discriminant ratio,費(fèi)希爾判別 比),其代表基于在變形后的空間中的歐幾里得距離的相似內(nèi)容和不相似 內(nèi)容之間的分類程度。另一個(gè)值是轉(zhuǎn)換函數(shù)的自由參數(shù)的數(shù)目。
圖7示出了通過(guò)遺傳方法的空間變換的概念。例如,在初始空間中的 各個(gè)初始特征量是維度。因此,這些維度被表示為{Tempo, Speed, Dispersion, Major, Notes, PitchMove,..., LoMid}。
如果通過(guò)遺傳方法使得初始空間進(jìn)化到下一代(下文中稱作第二 代),則在第二代中的維度例如被表示為{Tempo, Speed, Dispersionxl.35, Major, Notes,…,LoMid }。從初始空間到第二代的進(jìn)化中,"Dispersion" 被擴(kuò)展,而"PitchMove"卻被刪除。
此外,如果通過(guò)遺傳方法使得空間從第二代進(jìn)化到第三代,則在第三 代中的維度例如被表示為{Tempo, Speed, Dispersionxl.35, K(Major, 35), Notes,..., LoMid }。在從第二代到第三代的進(jìn)化過(guò)程中,通過(guò)核函數(shù) "Major"被非線性地轉(zhuǎn)換為"K(Major, 35)"。
在生成空間的評(píng)估中,在新生成的空間中作為教師數(shù)據(jù)的一個(gè)樣本內(nèi) 容組合的特征量之間的歐幾里得距離D被計(jì)算得到。例如,通過(guò)公式 (9)來(lái)計(jì)算得到樣本內(nèi)容Mk和Mi之間的歐幾里得距離D。 _
MO =向量FA —向量M)T(向iFl —向量Fi) ... (9)
其中,向量Fk是樣本內(nèi)容Mk的特征量向量,向量Fi是樣本內(nèi)容Mi
的特征量向量,而T是轉(zhuǎn)置。此外,僅針對(duì)可以獲得相似性數(shù)據(jù)S的那些 樣本內(nèi)容組合Mk和Mi來(lái)計(jì)算歐幾里得距離D。
圖8示出了特征量間的歐幾里得距離與多條內(nèi)容間的相似性之間的關(guān) 系。在圖8中,實(shí)線指示在經(jīng)變換的空間中相似內(nèi)容的特征量之間的歐幾 里得距離的概率分布,而虛線指示在經(jīng)變換的空間中不相似內(nèi)容的特征量 之間的歐幾里得距離的概率分布。
可以說(shuō),相似內(nèi)容和不相似內(nèi)容之間的距離相差越大,空間就可以更 好地表示多條內(nèi)容之間的相似性。
為了測(cè)量相似性內(nèi)容特征量和不相似內(nèi)容特征量的距離之間的差值, 通過(guò)公式(10)針對(duì)兩種類別來(lái)計(jì)算FDR (Fisher discriminant ratio), 一 個(gè)類別是針對(duì)相似內(nèi)容的,而另一個(gè)是針對(duì)不相似內(nèi)容的。 [表達(dá)式2]
(相似樂(lè)曲之間的平均距離 一 不相似樂(lè)曲之間的平均距離)2 (10) _相似樂(lè)曲之間的距離的標(biāo)準(zhǔn)偏差+不相似樂(lè)曲之間的距離的標(biāo)準(zhǔn)偏差'"
圖9到圖11示出了在經(jīng)變換的空間中相似內(nèi)容的特征量和不相似內(nèi)
容的特征量的歐幾里得距離與FDR值之間的關(guān)系。在圖9到圖11中,實(shí)
線指示在經(jīng)變換的空間中相似內(nèi)容的特征量之間的歐幾里得距離的概率分
布,而虛線指示在經(jīng)變換的空間中不相似內(nèi)容的特征量之間的歐幾里得距
離的概率分布。
如圖9所示,如果相似內(nèi)容的特征量的歐幾里得距離與不相似內(nèi)容的 特征量的歐幾里得距離的差值很小,則FDR也很小。如圖10和圖11所 示,相似內(nèi)容的特征量的歐幾里得距離與不相似內(nèi)容的特征量的歐幾里得 距離的差值越大,則FDR值也越大。S卩,相似內(nèi)容的特征量的歐幾里得距 離與不相似內(nèi)容的特征量的歐幾里得距離的差異越明顯,則FDR值越大。
例如,F(xiàn)DR被用作在計(jì)算信息標(biāo)準(zhǔn)AIC的公式(7)中的最大對(duì)數(shù)似 然率。
圖12示出了自由參數(shù)的示例。在圖12中,虛線圓圈所圍住的那些值 是自由參數(shù)。在公式(7)中的自由參數(shù)數(shù)目例如被設(shè)置為圖12中示出的 數(shù)目。
例如,在轉(zhuǎn)換函數(shù)"fl(向量X)-XlX0.5"中,"0.5"是自由參數(shù)。 在轉(zhuǎn)換函數(shù)"f2(向量X)-X3X0.4 — X4X0.2"中,"0.4"和"0.2"是自
由參數(shù)。在轉(zhuǎn)換函數(shù)"fi(向量X) = exp(-sqr(X3X0.5)/0.5)X0.6"中,與 X3相乘的"0.5"、除數(shù)"0.5"和"0.6"是自由參數(shù)。在轉(zhuǎn)換函數(shù) "fm(向量X"X4X0.1+X2X1.5"中,"0.1"和"1.5"是自由參數(shù)。
作為信息標(biāo)準(zhǔn)的AIC值越小,就越好。因此,在適用于創(chuàng)建下一代空 間(也就是,生成用于下一代的轉(zhuǎn)換函數(shù))的一般操作中,AIC值越小, 則其越有可能被選擇。
應(yīng)當(dāng)注意,當(dāng)使用信息標(biāo)準(zhǔn)BIC作為函數(shù)評(píng)估值時(shí)也是相同情況,因 此省略對(duì)其的描述。
如上所述,轉(zhuǎn)換函數(shù)生成單元41生成如下所述的函數(shù),該函數(shù)適用 于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限 定的多條內(nèi)容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似 性關(guān)系相適應(yīng)的距離。所述函數(shù)還適用于將分布在由上述多個(gè)特征量限定 的特征量空間中的多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得 到的新的特征量空間。其結(jié)果是,空間變換單元26變換了樣本內(nèi)容的特 征量空間。
根據(jù)評(píng)估值通過(guò)遺傳方法來(lái)反復(fù)地生成空間變換函數(shù),所述評(píng)估值是 從兩個(gè)值中計(jì)算得到的信息標(biāo)準(zhǔn)。它們中的一個(gè)是由函數(shù)評(píng)估值計(jì)算單元 42計(jì)算得到的值,其表示基于多條內(nèi)容之間的歐幾里得距離的分類程度, 所述多條內(nèi)容被認(rèn)為在由用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系中 是相似或不相似。另一個(gè)是所述函數(shù)的自由參數(shù)的數(shù)目。
以上,將內(nèi)容相似性數(shù)據(jù)S描述為用于指示多條內(nèi)容是否相似。但 是,內(nèi)容相似性數(shù)據(jù)S也可以是表示相似性程度的連續(xù)值。例如,內(nèi)容相 似性數(shù)據(jù)S是從0到1的任意實(shí)數(shù),其中,0表示完全相同,而1表示完 全不同。
例如,如果兩條內(nèi)容Ml和M2被用戶評(píng)估為有點(diǎn)相似,則關(guān)于組合 (Ml, M2)的相似性數(shù)據(jù)S被設(shè)置為0.3, 0.3意味著它們彼此有點(diǎn)相 似。
如果內(nèi)容Ml禾n M3被用戶評(píng)估為不相似,則關(guān)于組合(Ml, M3) 的相似性數(shù)據(jù)S被設(shè)置為0.9, 0.9意味著它們彼此不相似。
類似地,如果兩條內(nèi)容M4和M6被用戶評(píng)估為既不是相似也不是不
相似,則關(guān)于組合(M4, M6)的相似性數(shù)據(jù)S被設(shè)置為0.5, 0.5意味著 它們彼此既不相似也不是不相似。
在這種情況下,使用相似性數(shù)據(jù)S和歐幾里得距離之間的相關(guān)而計(jì)算 得到的AIC或其它信息標(biāo)準(zhǔn)被用作函數(shù)評(píng)估值。例如,在計(jì)算信息標(biāo)準(zhǔn) AIC的公式(7)中的最大對(duì)數(shù)似然率是根據(jù)相關(guān)值而計(jì)算得到的。
圖13示出了當(dāng)相關(guān)值為0.0時(shí),相似性數(shù)據(jù)S與內(nèi)容的特征量間的距 離之間的關(guān)系。圖14示出了當(dāng)相關(guān)值為0.5時(shí),相似性數(shù)據(jù)S與內(nèi)容的特 征量間的距離之間的關(guān)系。圖15示出了當(dāng)相關(guān)值為1.0時(shí),相似性數(shù)據(jù)S 與內(nèi)容的特征量間的距離之間的關(guān)系。
如圖13到圖15所示,如果內(nèi)容相似性數(shù)據(jù)S是表示相似性程度的連 續(xù)值,則可以認(rèn)為,空間中的特征量間的距離與相似性數(shù)據(jù)S之間的相關(guān) 越高,該空間就能更好地表示多條內(nèi)容之間的相似性。即,如圖14所示 相關(guān)值為0.5的空間,比如圖13所示相關(guān)值為0.0的空間更好地表示了多 條內(nèi)容之間的相似性程度。此外,如圖15所示相關(guān)值為l.O的空間,比如 圖14所示相關(guān)值為0.5的空間更好地表示了多條內(nèi)容之間的相似性程度。
此外,群集單元27執(zhí)行在樣本內(nèi)容的特征量已經(jīng)被變換的空間中的 樣本內(nèi)容的群集操作。
群集單元27通過(guò)基于內(nèi)容的多個(gè)特征量間的歐幾里得距離的分類 (例如K-means方法),來(lái)執(zhí)行樣本內(nèi)容的群集操作。
在樣本內(nèi)容的群集中,群集數(shù)是變化的。選擇與相似性數(shù)據(jù)S相匹配 的最小的群集數(shù)。即,在與相似性數(shù)據(jù)S相匹配的群集數(shù)中,選擇最小的 數(shù)。
如圖16所示,例如,群集數(shù)連續(xù)地從1增大到36并超過(guò)36,以用于 樣本內(nèi)容的群集操作。
求得各個(gè)群集數(shù)與相似性數(shù)據(jù)S的匹配率。在如圖16所示的示例 中,當(dāng)群集數(shù)為1時(shí),與相似性數(shù)據(jù)S的匹配率為0.45。當(dāng)群集數(shù)為2 時(shí),與相似性數(shù)據(jù)S的匹配率是0.48。類似地,當(dāng)群集數(shù)為35和36時(shí), 與相似性數(shù)據(jù)S的匹配率分別為0.95和0.88。
例如,我們假設(shè)當(dāng)群集數(shù)為52 (未示出)時(shí),與相似性數(shù)據(jù)S的匹配
率為0.95,并且當(dāng)群集數(shù)為35時(shí),與相似性數(shù)據(jù)S的匹配率為0.95。這 種情況下,在最大匹配率為0.95的群集數(shù)中,選擇比群集數(shù)52小的群集 數(shù)35。
這里,將參考圖17和圖18來(lái)描述群集數(shù)與相似性數(shù)據(jù)S之間的匹配率。
為了獲得匹配率,例如,首先將兩個(gè)值加在一起。這兩個(gè)值是基于 相似性數(shù)據(jù)S而被評(píng)估為彼此相似的兩條內(nèi)容屬于同一個(gè)群集的情況的數(shù) 目,以及基于相似性數(shù)據(jù)S而被評(píng)估為彼此不相似的兩條內(nèi)容屬于不同群 集的情況的數(shù)目。然后,這個(gè)和被除以基于相似性數(shù)據(jù)S的評(píng)估的數(shù)目。
在圖17中,用圓圈標(biāo)記的那些評(píng)估指示兩條內(nèi)容被用戶評(píng)估為彼此 相似。另一方面,用交叉號(hào)標(biāo)記的那些評(píng)估指示兩條內(nèi)容被用戶評(píng)估為彼 此不相似。
接下來(lái)將描述以下情況。即,如圖17所示,例如,內(nèi)容A和內(nèi)容B 被用戶評(píng)估為彼此相似。其結(jié)果是,關(guān)于(內(nèi)容A,內(nèi)容B)的相似性數(shù) 據(jù)S被設(shè)置為意味著它們相似的0。內(nèi)容A和內(nèi)容C被用戶評(píng)估為彼此不 相似。其結(jié)果是,關(guān)于(內(nèi)容A,內(nèi)容C)的相似性數(shù)據(jù)S被設(shè)置為意味 著它們不相似的1。內(nèi)容A和內(nèi)容D被用戶評(píng)估為彼此不相似。其結(jié)果 是,關(guān)于(內(nèi)容A,內(nèi)容D)的相似性數(shù)據(jù)S被設(shè)置為意味著它們不相似 的1。內(nèi)容B和內(nèi)容C被用戶評(píng)估為彼此不相似。其結(jié)果是,關(guān)于(內(nèi)容 B,內(nèi)容C)的相似性數(shù)據(jù)S被設(shè)置為意味著它們不相似的1。內(nèi)容B和 內(nèi)容D被用戶評(píng)估為彼此不相似。其結(jié)果是,關(guān)于(內(nèi)容B,內(nèi)容D)的 相似性數(shù)據(jù)S被設(shè)置為意味著它們不相似的1。內(nèi)容C和內(nèi)容D被用戶評(píng) 估為彼此相似。其結(jié)果是,關(guān)于(內(nèi)容C,內(nèi)容D)的相似性數(shù)據(jù)S被設(shè) 置為意味著它們相似的0。
在圖17中示出的示例中,基于相似性數(shù)據(jù)S的評(píng)估數(shù)目是6。 在圖18中示出的示例中,僅存在一個(gè)群集。在這種情況下,如圖19 所示,從內(nèi)容A到內(nèi)容D的所有內(nèi)容都屬于一個(gè)群集。基于兩個(gè)組合(也 就是,內(nèi)容A和內(nèi)容B,以及內(nèi)容C和內(nèi)容D)的相似性數(shù)據(jù)S的評(píng)估與
群集操作結(jié)果相匹配。另一方面,基于四個(gè)組合(也就是,內(nèi)容A和內(nèi)容
C,內(nèi)容A和內(nèi)容D,內(nèi)容B和內(nèi)容C,內(nèi)容B和內(nèi)容D)的相似性數(shù)據(jù) S的評(píng)估與群集操作結(jié)果不匹配。其結(jié)果是,匹配率是2/6或33.3%。
在圖20所示的示例中,存在兩個(gè)群集。內(nèi)容A和內(nèi)容B屬于一個(gè)群 集,而內(nèi)容C和內(nèi)容D屬于另一個(gè)群集。內(nèi)容A屬于與內(nèi)容C和內(nèi)容D 所屬于的群集不相同的群集。內(nèi)容B屬于與內(nèi)容C和內(nèi)容D所屬于的群 集不相同的群集?;谒薪M合的相似性數(shù)據(jù)S的評(píng)估與群集操作結(jié)果相 匹配。其結(jié)果是,匹配率為6/6或100%。
在圖21所示的示例中,存在三個(gè)群集。內(nèi)容A和內(nèi)容B屬于一個(gè)群 集。內(nèi)容C屬于另一個(gè)群集。內(nèi)容D屬于又一個(gè)群集。內(nèi)容C屬于與內(nèi) 容A和內(nèi)容B所屬于的群集不相同的群集。內(nèi)容D屬于與內(nèi)容A和內(nèi)容 B所屬于的群集不相同的群集。內(nèi)容C和內(nèi)容D屬于不同的群集。在這種 情況下,基于五個(gè)組合(也就是,內(nèi)容A和內(nèi)容B,內(nèi)容A和內(nèi)容C,內(nèi) 容A和內(nèi)容D,內(nèi)容B和內(nèi)容C,以及內(nèi)容B禾口內(nèi)容D)的相似性數(shù)據(jù)S 的評(píng)估與群集操作結(jié)果相匹配。另一方面,基于一個(gè)組合(也就是,內(nèi)容 C和內(nèi)容D)的相似性數(shù)據(jù)的評(píng)估與群集操作結(jié)果不匹配。其結(jié)果是,匹 配率為5/6或83.3%。
在圖22所示的示例中,存在四個(gè)群集。所有內(nèi)容(也就是,內(nèi)容A 到內(nèi)容D)都屬于彼此不同的群集。在這種情況下,基于4個(gè)組合(也就 是,內(nèi)容A和內(nèi)容C,內(nèi)容A和內(nèi)容D,內(nèi)容B和內(nèi)容C,以及內(nèi)容B和 內(nèi)容D)的相似性數(shù)據(jù)S的評(píng)估與群集操作結(jié)果相匹配。另一方面,基于 兩個(gè)組合(也就是,內(nèi)容A和內(nèi)容B,以及內(nèi)容C和內(nèi)容D)的相似性數(shù) 據(jù)S的評(píng)估與群集操作結(jié)果不匹配。其結(jié)果是,匹配率為4/6或66.6%。
在圖17和圖18中示出的示例中,選擇了群集數(shù)為2的群集操作結(jié) 果,原因在于它們提供了 100。%的匹配率,并因此與相似性數(shù)據(jù)S最一 致。
應(yīng)當(dāng)注意,匹配率可以不必是通過(guò)以下運(yùn)算所獲得的值。即,基于相 似性數(shù)據(jù)S而被評(píng)估為彼此相似的兩條內(nèi)容屬于同一個(gè)群集的情況的數(shù) 目,加上基于相似性數(shù)據(jù)S而被評(píng)估為彼此不相似的兩條內(nèi)容屬于不同群
集的情況的數(shù)目。然后,這個(gè)和被除以基于相似性數(shù)據(jù)S的評(píng)估的數(shù)目。 匹配率只需要是使"相似性數(shù)據(jù)S與基于群集的內(nèi)容分類相一致"清楚可 見(jiàn)的標(biāo)準(zhǔn)。例如,如果使用來(lái)自多個(gè)用戶的相似性數(shù)據(jù)S,則可以使用賦 予給從兩個(gè)或更多個(gè)用戶所獲得的相同評(píng)估的內(nèi)容(即,多個(gè)用戶做出相 同評(píng)估的內(nèi)容)的權(quán)重,來(lái)計(jì)算匹配率。
或者,可以使用相似內(nèi)容的召回率(recall rate)和精確率(precision rate)或者不相似內(nèi)容的召回率和精確率,來(lái)選擇群集操作結(jié)果。
接下來(lái),將參考圖23中的流程圖來(lái)描述空間變換前的預(yù)處理。在步 驟S11中,樣本內(nèi)容加載單元21加載樣本內(nèi)容。樣本內(nèi)容加載單元21將 所加載的樣本內(nèi)容提供給內(nèi)容數(shù)據(jù)庫(kù)22。內(nèi)容數(shù)據(jù)庫(kù)22存儲(chǔ)該樣本內(nèi) 容。
在步驟S12中,特征量提取單元23提取所述樣本內(nèi)容的特征量。特 征量提取單元23將所提取的特征量提供給內(nèi)容數(shù)據(jù)庫(kù)22。內(nèi)容數(shù)據(jù)庫(kù)22 存儲(chǔ)所提取的特征量。
應(yīng)當(dāng)注意,特征量獲取單元24可以獲取預(yù)先提取的樣本內(nèi)容的特征 量。例如,特征量獲取單元24通過(guò)從給定服務(wù)器獲取特征量、或通過(guò)從 給定的記錄介質(zhì)讀取它們來(lái)預(yù)先提取樣本內(nèi)容的特征量。
在步驟S13中,用戶評(píng)估獲取單元25獲取關(guān)于樣本內(nèi)容的用戶評(píng) 估。即,用戶評(píng)估獲取單元25獲取作為關(guān)于樣本內(nèi)容的用戶評(píng)估的相似 性數(shù)據(jù)S。更具體地,用戶評(píng)估獲取單元25例如通過(guò)從諸如鍵盤或觸摸屏 之類的操作單元獲得用戶操作信號(hào),來(lái)獲取相似性數(shù)據(jù)S。此外,用戶評(píng) 估獲取單元25例如通過(guò)從給定服務(wù)器獲取相似性數(shù)據(jù)S或從給定記錄介 質(zhì)讀取相似性數(shù)據(jù)S,來(lái)獲得關(guān)于樣本內(nèi)容的用戶評(píng)估。
用戶評(píng)估獲取單元25將相似性數(shù)據(jù)S (即,關(guān)于樣本內(nèi)容的用戶評(píng) 估)提供給內(nèi)容數(shù)據(jù)庫(kù)22。內(nèi)容數(shù)據(jù)庫(kù)22存儲(chǔ)該相似性數(shù)據(jù)S。
在步驟S14中,空間變換單元26執(zhí)行空間變換處理。
圖24是描述了空間變換處理的流程圖。在步驟S31中,空間變換單 元26的轉(zhuǎn)換函數(shù)生成單元41生成轉(zhuǎn)換函數(shù),以隨機(jī)地生成幾個(gè)空間。 即,轉(zhuǎn)換函數(shù)生成單元41隨機(jī)地生成多個(gè)轉(zhuǎn)換函數(shù)g。在步驟S32中,空間變換單元26的函數(shù)評(píng)估值計(jì)算單元42利用評(píng)估 函數(shù)來(lái)評(píng)估所有的生成空間。S卩,函數(shù)評(píng)估值計(jì)算單元42利用評(píng)估函數(shù) 通過(guò)計(jì)算函數(shù)評(píng)估值,來(lái)評(píng)估各個(gè)生成空間。所述的函數(shù)評(píng)估值是從兩個(gè) 值中計(jì)算得到的信息標(biāo)準(zhǔn)。它們中的一個(gè)是表示基于樣本內(nèi)容之間的歐幾 里得距離的分類程度的值,所述樣本內(nèi)容在預(yù)先由用戶評(píng)估所估計(jì)的相似 性程度的那些樣本內(nèi)容中被主觀上認(rèn)為相似或不相似。另一個(gè)是轉(zhuǎn)換函數(shù)
S的自由參數(shù)的數(shù)目。
在步驟S33中,轉(zhuǎn)換函數(shù)生成單元41通過(guò)遺傳方法利用選擇、交叉 或突變來(lái)隨機(jī)地生成新的轉(zhuǎn)換函數(shù),以生成新一代的幾個(gè)空間。即,在步 驟S33中,轉(zhuǎn)換函數(shù)生成單元41通過(guò)遺傳方法來(lái)生成下一代的多個(gè)轉(zhuǎn)換 函數(shù)3。
在步驟S34中,函數(shù)評(píng)估值計(jì)算單元42利用評(píng)估函數(shù)來(lái)評(píng)估在步驟 S33中生成的所有空間。
在步驟S35中,函數(shù)評(píng)估值計(jì)算單元42對(duì)在步驟S32中計(jì)算所得的 函數(shù)評(píng)估值與在步驟S34中計(jì)算所得的函數(shù)評(píng)估值進(jìn)行比較,以判斷函數(shù) 評(píng)估值是否已經(jīng)停止增長(zhǎng)。如果函數(shù)評(píng)估值計(jì)算單元42判斷得出函數(shù)評(píng) 估值增大了,則控制返回到步驟S33,在步驟S33中重復(fù)執(zhí)行上述處理, 以使得下一代空間可以被生成。更具體地,函數(shù)評(píng)估值計(jì)算單元42判斷 之前的函數(shù)評(píng)估值與當(dāng)前的函數(shù)評(píng)估值是否存在差異。通過(guò)判斷所述函數(shù) 評(píng)估值是否已經(jīng)被更新了預(yù)定的世代數(shù),函數(shù)評(píng)估值計(jì)算單元42判斷該 函數(shù)評(píng)估值是否己經(jīng)停止增長(zhǎng)。
在第二回合的重復(fù)之后的步驟S35中,函數(shù)評(píng)估值計(jì)算單元42對(duì)在 上一回合的步驟S34中計(jì)算所得的函數(shù)評(píng)估值與在當(dāng)前回合的步驟S34中 計(jì)算所得的函數(shù)評(píng)估值進(jìn)行比較,以判斷所述函數(shù)評(píng)估值是否已經(jīng)停止增 長(zhǎng)。S口,在步驟S35中,對(duì)上一代空間的函數(shù)評(píng)估值與下一代空間的函數(shù) 評(píng)估值進(jìn)行比較,以判斷該值是否已經(jīng)停止增長(zhǎng)。
如果,在步驟S35中,判斷得出函數(shù)評(píng)估值已經(jīng)停止增長(zhǎng),則空間變 換單元26向內(nèi)容數(shù)據(jù)庫(kù)22輸出所生成的轉(zhuǎn)換函數(shù),也就是,已經(jīng)通過(guò)遺 傳方法反復(fù)生成、直到函數(shù)評(píng)估值不再改變?yōu)橹箷r(shí)的那些函數(shù)。然后,空
間變換單元26終止空間變換處理。
在如上所述的示例中,直到評(píng)估值有一世代不再更新為止,才生成函 數(shù)。但是,也可以例如直到評(píng)估值有預(yù)定數(shù)目的世代(2個(gè)世代或3個(gè)世 代)都不再更新為止,才生成所述函數(shù)。
內(nèi)容數(shù)據(jù)庫(kù)22存儲(chǔ)來(lái)自空間變換單元26的轉(zhuǎn)換函數(shù)。
返回來(lái)參考圖23,在步驟S15中,輸出單元28從內(nèi)容數(shù)據(jù)庫(kù)22輸出 所生成的轉(zhuǎn)換函數(shù)。即,輸出單元28從內(nèi)容數(shù)據(jù)庫(kù)22讀取轉(zhuǎn)換函數(shù),該 轉(zhuǎn)換函數(shù)是通過(guò)利用遺傳方法反復(fù)生成、直到函數(shù)評(píng)估值不再改變?yōu)橹箷r(shí) 得到的轉(zhuǎn)換函數(shù)。然后,輸出單元28輸出所讀取的函數(shù)。
空間變換單元26向內(nèi)容數(shù)據(jù)庫(kù)22輸出特征量。該特征量已經(jīng)經(jīng)過(guò)輸 出到內(nèi)容數(shù)據(jù)庫(kù)22的轉(zhuǎn)換函數(shù)的轉(zhuǎn)換。內(nèi)容數(shù)據(jù)庫(kù)22存儲(chǔ)來(lái)自空間變換 單元26的特征量。
在步驟S16中,群集單元27執(zhí)行在經(jīng)變換的空間中的樣本內(nèi)容的群 集操作,以根據(jù)群集和相似性數(shù)據(jù)來(lái)計(jì)算匹配率。即,群集單元27基于 經(jīng)轉(zhuǎn)換的特征量來(lái)執(zhí)行樣本內(nèi)容的群集操作。
應(yīng)當(dāng)注意,群集單元27可以使用存儲(chǔ)在內(nèi)容數(shù)據(jù)庫(kù)22中的轉(zhuǎn)換函數(shù) 來(lái)轉(zhuǎn)換樣本內(nèi)容的特征量。
在步驟S17中,群集單元27判斷是否已經(jīng)執(zhí)行過(guò)在預(yù)定范圍內(nèi)變化 的群集數(shù)的群集操作。如果群集單元27判斷得出仍然還要執(zhí)行如上所述 的群集操作,則控制返回到步驟S16,在步驟S16中執(zhí)行具有下一個(gè)群集 數(shù)的群集操作以計(jì)算匹配率。步驟S16和步驟S17將被重復(fù)執(zhí)行,直到在 預(yù)定范圍內(nèi)變化的群集數(shù)的群集操作完成為止。
在步驟S17中,當(dāng)群集單元27判斷得出己經(jīng)執(zhí)行過(guò)在預(yù)定范圍內(nèi)變 化的群集數(shù)的群集操作,則控制前進(jìn)到步驟S18。在步驟S18中,群集單 元27從具有最高匹配率的那些群集數(shù)中識(shí)別出最小群集數(shù)。然后,群集 單元27識(shí)別所識(shí)別的群集數(shù)的群集距心位置。群集單元27將所述群集距 心位置提供給內(nèi)容數(shù)據(jù)庫(kù)22。內(nèi)容數(shù)據(jù)庫(kù)22存儲(chǔ)該距心位置。
在步驟S19中,輸出單元28從內(nèi)容數(shù)據(jù)庫(kù)22讀取在經(jīng)變換的空間的 坐標(biāo)上的距心位置。然后輸出單元28輸出距心位置,從而終止處理。
如上所述,轉(zhuǎn)換函數(shù)和距心位置被存儲(chǔ)在內(nèi)容數(shù)據(jù)庫(kù)22中,并由輸 出單元28輸出到外部。
關(guān)于從輸出單元28輸出的轉(zhuǎn)換函數(shù)和距心位置的信息,用在由用戶 使用的信息處理裝置101中,接下來(lái)將描述該信息處理裝置101接下來(lái), 將描述信息處理裝置101,信息處理裝置101是可操作用于記錄并再現(xiàn)內(nèi) 容以及識(shí)別相似內(nèi)容的固定式設(shè)備(stationaryequipment)。
圖25是示出了信息處理裝置101的結(jié)構(gòu)示例的框圖。信息處理裝置 101包括內(nèi)容加載單元121、特征量提取單元122、內(nèi)容數(shù)據(jù)庫(kù)123、評(píng)估 數(shù)據(jù)存儲(chǔ)單元124、內(nèi)容組識(shí)別單元125、操作單元126、檢索處理單元 127、呈現(xiàn)單元128和再現(xiàn)單元129。
內(nèi)容加載單元121例如通過(guò)從CD (光盤)讀取或經(jīng)由網(wǎng)絡(luò)從服務(wù)器 下載,來(lái)加載內(nèi)容。
特征量提取單元122提取由內(nèi)容加載單元121加載的內(nèi)容的特征量。 特征量提取單元122提取與特征量提取單元23所提取的那些特征量一樣 的特征量。特征量提取單元122將所加載的內(nèi)容和所提取的特征量提供給 內(nèi)容數(shù)據(jù)庫(kù)123。
應(yīng)當(dāng)注意,操作單元126可以獲取通過(guò)用戶操作來(lái)輸入的特征量。可 替換地,獲取單元(未示出)可以從經(jīng)由網(wǎng)絡(luò)來(lái)連接的服務(wù)器(未示出) 讀取特征量,從而獲得那樣的量。
內(nèi)容數(shù)據(jù)庫(kù)123將所提取的特征量與所加載的內(nèi)容一起存儲(chǔ)下來(lái)。
內(nèi)容組識(shí)別單元125基于預(yù)先存儲(chǔ)在評(píng)估數(shù)據(jù)存儲(chǔ)單元124中的轉(zhuǎn)換 函數(shù)和距心位置,來(lái)識(shí)別加載的內(nèi)容所屬于的內(nèi)容組。
內(nèi)容組識(shí)別單元125包含特征量轉(zhuǎn)換單元131。特征量轉(zhuǎn)換單元131 從所加載的內(nèi)容中讀取特征量。特征量轉(zhuǎn)換單元131使用預(yù)先存儲(chǔ)在評(píng)估 數(shù)據(jù)存儲(chǔ)單元124中的轉(zhuǎn)換函數(shù),來(lái)對(duì)所述特征量進(jìn)行轉(zhuǎn)換。
內(nèi)容組識(shí)別單元125對(duì)由經(jīng)轉(zhuǎn)換的特征量表示的位置與預(yù)先存儲(chǔ)在評(píng) 估數(shù)據(jù)存儲(chǔ)單元124中的距心位置進(jìn)行比較。這樣,內(nèi)容組識(shí)別單元125 就可以識(shí)別其距心最接近于所述特征量的組。內(nèi)容組識(shí)別單元125將關(guān)于 識(shí)別得到的內(nèi)容組的信息提供給內(nèi)容數(shù)據(jù)庫(kù)123 。
內(nèi)容數(shù)據(jù)庫(kù)123將關(guān)于由內(nèi)容組識(shí)別單元125識(shí)別得到的內(nèi)容組的信 息,與所加載的內(nèi)容及其特征量一起存儲(chǔ)下來(lái)。
操作單元126包括鍵盤或遙控器。操作單元126從用戶接受諸如內(nèi)容 選擇或相似內(nèi)容檢索之類的操作指令。操作單元126將針對(duì)所接受的指令 的信號(hào)提供給檢索處理單元127。
響應(yīng)于來(lái)自操作單元126的信號(hào),檢索處理單元127如用戶選擇或檢 索內(nèi)容那樣,提取特定組的內(nèi)容。檢索處理單元127在存儲(chǔ)在內(nèi)容數(shù)據(jù)庫(kù) 123中的那些內(nèi)容中,檢索出與用戶所選擇的內(nèi)容相似的內(nèi)容。
呈現(xiàn)單元128包括LCD (液晶顯示器)、有機(jī)EL (電致發(fā)光)顯示 器或其它類型的顯示器。呈現(xiàn)單元128呈現(xiàn)已經(jīng)由檢索處理單元127檢索 得到的內(nèi)容、與用戶選擇的內(nèi)容相相似的內(nèi)容的列表。
再現(xiàn)單元129再現(xiàn)用戶所選擇的內(nèi)容。例如,當(dāng)用戶指示再現(xiàn)樂(lè)曲內(nèi) 容時(shí),再現(xiàn)單元129對(duì)數(shù)據(jù)形式的內(nèi)容進(jìn)行解碼并將其再現(xiàn),從而產(chǎn)生所 述樂(lè)曲內(nèi)容的音頻輸出。此外,當(dāng)用戶指示再現(xiàn)一組內(nèi)容時(shí),再現(xiàn)單元 129再現(xiàn)該指定組的內(nèi)容。
應(yīng)當(dāng)注意,內(nèi)容數(shù)據(jù)庫(kù)123可以設(shè)在信息處理裝置101中,或者設(shè)在 信息處理裝置101之外的服務(wù)器中。在這種情況下,內(nèi)容數(shù)據(jù)庫(kù)123經(jīng)由 網(wǎng)絡(luò)(未示出)而與信息處理裝置101相連接。
接下來(lái),將描述在內(nèi)容讀取過(guò)程中、針對(duì)所有內(nèi)容而執(zhí)行的內(nèi)容加載 處理。內(nèi)容加載處理是在進(jìn)行內(nèi)容添加時(shí)對(duì)將被添加的內(nèi)容執(zhí)行的。
圖26是描述了由信息處理裝置101執(zhí)行的內(nèi)容加載處理的流程圖。 在步驟S51中,內(nèi)容加載單元121例如通過(guò)從CD讀取或者通過(guò)經(jīng)由網(wǎng)絡(luò) 從服務(wù)器下載,來(lái)加載內(nèi)容。在步驟S52中,特征量提取單元122提取在 步驟S51中加載的內(nèi)容的特征量。例如,特征量提取單元122提取諸如音 樂(lè)拍子、速度、音樂(lè)拍子起伏范圍、大和弦率、每單位時(shí)間內(nèi)的音符數(shù)或 者音頻頻帶內(nèi)的低域能量與中域能量之比之類的特征量。
在步驟S53中,特征量提取單元122將特征量與在內(nèi)容數(shù)據(jù)庫(kù)123中 的內(nèi)容一起存儲(chǔ)下來(lái)。
在步驟S54中,內(nèi)容組識(shí)別單元125的特征量轉(zhuǎn)換單元131從內(nèi)容數(shù)
據(jù)庫(kù)123讀取所加載的內(nèi)容的特征量。特征量轉(zhuǎn)換單元131使用存儲(chǔ)在評(píng)
估數(shù)據(jù)存儲(chǔ)單元124中的轉(zhuǎn)換函數(shù)來(lái)對(duì)所讀取的特征量進(jìn)行轉(zhuǎn)換。
在步驟S55中,內(nèi)容組識(shí)別單元125計(jì)算經(jīng)過(guò)所述轉(zhuǎn)換函數(shù)轉(zhuǎn)換的特 征量與由存儲(chǔ)在評(píng)估數(shù)據(jù)存儲(chǔ)單元124中的信息指示的距心之間的距離。 在步驟S56中,內(nèi)容組識(shí)別單元125識(shí)別出所述內(nèi)容所屬于的內(nèi)容組,以 使得該加載內(nèi)容的組是具有與所述特征量相距最短的距心的內(nèi)容組。
在步驟S57中,內(nèi)容組識(shí)別單元125使內(nèi)容數(shù)據(jù)庫(kù)123存儲(chǔ)經(jīng)轉(zhuǎn)換的 特征量和關(guān)于所識(shí)別出的內(nèi)容組的信息。其結(jié)果是,內(nèi)容組識(shí)別單元125 將所述經(jīng)轉(zhuǎn)換的特征量和所述識(shí)別得到的內(nèi)容組登記在內(nèi)容數(shù)據(jù)庫(kù)123 中,從而終止處理。
如上所述,當(dāng)一條內(nèi)容被加載時(shí),在經(jīng)變換的空間中找到針對(duì)該條內(nèi) 容的特征量。然后,加載的那條內(nèi)容所屬于的內(nèi)容組被從根據(jù)那些特征量 來(lái)分類的內(nèi)容組中識(shí)別出來(lái)。
當(dāng)由信息處理裝置101指定內(nèi)容時(shí),與該指定內(nèi)容相似的內(nèi)容被檢索 得到。
接下來(lái)將參考圖27中的流程圖來(lái)描述相似的內(nèi)容檢索處理。在步驟 S71中,操作單元126從用戶接收關(guān)于將被再現(xiàn)的內(nèi)容的說(shuō)明。響應(yīng)于該 用戶操作,操作單元126將指示所指定的內(nèi)容的信號(hào)提供給檢索處理單元 127。
在步驟S72中,檢索處理單元127從內(nèi)容數(shù)據(jù)庫(kù)123中檢索出與所指 定的內(nèi)容同屬于一個(gè)內(nèi)容組的內(nèi)容。即,檢索處理單元127檢索出與所指 定的內(nèi)容同屬于一個(gè)內(nèi)容組的其它內(nèi)容。
應(yīng)當(dāng)注意,在步驟S72中,檢索處理單元127可以通過(guò)基于將轉(zhuǎn)換的 特征量的其它方法,來(lái)檢索與所指定的內(nèi)容相似的內(nèi)容。例如,檢索處理 單元127基于存儲(chǔ)在內(nèi)容數(shù)據(jù)庫(kù)123中的經(jīng)轉(zhuǎn)換的特征量,來(lái)檢索其特征 量與所指定的內(nèi)容的特征量之間的歐幾里得距離為最短的內(nèi)容。
在步驟S73中,檢索處理單元127生成檢索得到的內(nèi)容的列表。在步 驟S73中,檢索處理單元127生成了例如指示檢索得到的內(nèi)容的名稱和演 奏者或作曲者的列表。檢索處理單元127經(jīng)由內(nèi)容數(shù)據(jù)庫(kù)123、將所生成
的列表提供給呈現(xiàn)單元128。
在步驟S74中,呈現(xiàn)單元128呈現(xiàn)由檢索處理單元127生成的、檢索 得到的內(nèi)容的列表。這個(gè)列表包括與所指定的內(nèi)容相似的內(nèi)容。
在步驟S75中,再現(xiàn)單元129再現(xiàn)用戶所指定的內(nèi)容,從而終止處理。
如上所述,當(dāng)用戶指定內(nèi)容時(shí),與該指定內(nèi)容相似的內(nèi)容的列表將被 呈現(xiàn)。
在再現(xiàn)用戶所指定的內(nèi)容的過(guò)程中,將呈現(xiàn)一內(nèi)容列表來(lái)作為候選, 該候選與將被再現(xiàn)的內(nèi)容相似。
應(yīng)當(dāng)注意,當(dāng)用戶指定一條內(nèi)容并指示呈現(xiàn)與所指定的內(nèi)容相似的內(nèi) 容的列表時(shí),可以通過(guò)與步驟S72到步驟S74相似的處理,呈現(xiàn)存儲(chǔ)在內(nèi) 容數(shù)據(jù)庫(kù)123中的內(nèi)容中那些與所指定的內(nèi)容相似的內(nèi)容的列表。
可替換地,可以利用識(shí)別出相似內(nèi)容的那一側(cè)來(lái)變換空間。
圖28是示出了信息處理裝置151的配置的框圖,信息處理裝置151可 操作于通過(guò)執(zhí)行參考圖23中的流程圖描述的預(yù)處理來(lái)變換空間。信息處 理裝置151還可操作于識(shí)別相似內(nèi)容。在圖28中,與圖1中的組件相似的 那些組件被指定相同標(biāo)號(hào),并省略對(duì)其的描述。
此外,在圖28中,與圖25中的組件相似的那些組件被指定相同標(biāo) 號(hào),并省略對(duì)其的描述。
如圖28所示配置并且由用戶來(lái)使用的信息處理裝置151包括用戶評(píng) 估獲取單元25、空間變換單元26和群集單元27。信息處理裝置151還包 括特征量提取單元122、內(nèi)容組識(shí)別單元125、操作單元126、檢索處理單 元127、呈現(xiàn)單元128和再現(xiàn)單元129、內(nèi)容加載單元171、內(nèi)容數(shù)據(jù)庫(kù) 172和評(píng)估數(shù)據(jù)獲取單元173。
內(nèi)容加載單元171加載充當(dāng)內(nèi)容樣本的樣本內(nèi)容,以對(duì)樣本內(nèi)容的特 征量空間進(jìn)行變換。內(nèi)容加載單元171例如通過(guò)從CD讀取或通過(guò)經(jīng)由網(wǎng) 絡(luò)從服務(wù)器下載,來(lái)加載內(nèi)容。
內(nèi)容數(shù)據(jù)庫(kù)172存儲(chǔ)樣本內(nèi)容、內(nèi)容、樣本內(nèi)容或內(nèi)容的特征量以及 作為關(guān)于樣本內(nèi)容的用戶評(píng)估的相似性數(shù)據(jù)s。
評(píng)估數(shù)據(jù)獲取單元173從空間變換單元26獲取轉(zhuǎn)換函數(shù)。評(píng)估數(shù)據(jù)
獲取單元173還從群集單元27獲取距心位置,并存儲(chǔ)所述轉(zhuǎn)換函數(shù)和所 述距心位置。評(píng)估數(shù)據(jù)獲取單元173將所存儲(chǔ)的轉(zhuǎn)換函數(shù)和距心位置提供 給內(nèi)容組識(shí)別單元125。
信息處理裝置151所執(zhí)行的預(yù)處理與參考圖23中的流程圖來(lái)描述的 預(yù)處理相似,因此省略對(duì)其的描述。
信息處理裝置151所執(zhí)行的內(nèi)容加載處理與參考圖26中的流程圖來(lái) 描述的內(nèi)容加載處理相似,因此省略對(duì)其的描述。
信息處理裝置151所執(zhí)行的相似內(nèi)容檢索處理與參考圖27中的流程 圖來(lái)描述的相似內(nèi)容檢索處理相似,因此省略對(duì)其的描述。
如上所述,可操作用于識(shí)別相似內(nèi)容的信息處理裝置151對(duì)特征量空 間進(jìn)行變換,因而允許得到轉(zhuǎn)換函數(shù)和距心位置。
在這種情況下,作為關(guān)于樣本內(nèi)容的用戶評(píng)估的相似性數(shù)據(jù)S表示使 用信息處理裝置151的用戶的主觀觀點(diǎn)。因此,特征量空間是根據(jù)使用信 息處理裝置151的用戶的主觀觀點(diǎn)來(lái)變換的。其結(jié)果是,內(nèi)容也是根據(jù)使 用信息處理裝置151的用戶的主觀觀點(diǎn)來(lái)群集的。這允許檢索出基于與根 據(jù)用戶的主觀觀點(diǎn)的相似性判斷相接近的類比判斷(analogy determination)而被認(rèn)為相似的內(nèi)容。
如上所述,可以按簡(jiǎn)便、更快速且更準(zhǔn)確的方式來(lái)識(shí)別相似內(nèi)容。
當(dāng)如相關(guān)技術(shù)中那樣、使用內(nèi)容特征量之間的距離來(lái)作為相似性程度 時(shí),每進(jìn)行一次添加時(shí)都有必要重新計(jì)算在將被添加的內(nèi)容的特征量與所 有現(xiàn)存內(nèi)容的特征量的每一個(gè)之間的距離。
但是,根據(jù)本發(fā)明,相似內(nèi)容的組被識(shí)別。其結(jié)果是,針對(duì)各條內(nèi)容 僅有必要計(jì)算與典型值之間的距離,因而極大地減小了處理負(fù)荷。
此外,在相關(guān)技術(shù)中,為了得到多個(gè)內(nèi)容組合之間的相似性程度,每 進(jìn)行一次添加時(shí)都有必要計(jì)算所有組合的特征之間的距離。
但是,根據(jù)本發(fā)明,組是預(yù)先被識(shí)別的。這使得不必為所有組合重新 計(jì)算特征之間的距離。
可替換地,可以創(chuàng)建一空間,用以搜索相似類型的內(nèi)容。這可以通過(guò)
下述方式來(lái)實(shí)現(xiàn)即,確定被冠以相同類型的內(nèi)容是彼此相似的,而被冠 以不同類型的那些內(nèi)容是彼此不相似的。
類似地,對(duì)于樂(lè)曲內(nèi)容來(lái)說(shuō),可以創(chuàng)建一空間,用以搜索利用相似的 樂(lè)器組合來(lái)演奏的樂(lè)曲。這可以通過(guò)下述方式來(lái)實(shí)現(xiàn)即,確定利用相似 樂(lè)器來(lái)演奏的樂(lè)曲是彼此相似的,而利用大多數(shù)都不相同的樂(lè)器演奏的樂(lè) 曲是彼此不相似的。
本發(fā)明不僅適用于內(nèi)容特征量,而且還適用于出于給定目的而應(yīng)當(dāng)求 得具有特征量的那些事物之間的相似性程度的任何情況。S卩,本發(fā)明不僅 允許確定內(nèi)容之間的相似性,而且還允許確定組成內(nèi)容的要素之間的相似 性。更具體地,本發(fā)明例如適用于計(jì)算在樂(lè)曲結(jié)構(gòu)分析中的各個(gè)小節(jié)
(measure)之間的相似性程度。
應(yīng)當(dāng)注意,信息處理裝置11或151可以通過(guò)分析附于內(nèi)容的元數(shù)據(jù)
(metadata)來(lái)提取內(nèi)容特征量?;蛘?,信息處理裝置11或151可以獲取 現(xiàn)有的內(nèi)容元數(shù)據(jù)作為內(nèi)容特征量。在這種情況下,所使用的元數(shù)據(jù)可以 是數(shù)值元數(shù)據(jù)或者是通過(guò)包括主成分分析(principal component analysis) 禾口PLSA (概率潛在語(yǔ)義分析Probabilistic Latent Semantic Analysis)在內(nèi) 的方法而被轉(zhuǎn)換為數(shù)值形式的文本元數(shù)據(jù)。
另一方面,信息處理裝置101或151被描述為可操作于記錄和再現(xiàn)內(nèi) 容并識(shí)別相似內(nèi)容的固定式設(shè)備。但是,信息處理裝置101或151并不限 于此,而只需要是可操作于記錄和再現(xiàn)內(nèi)容的設(shè)備。信息處理裝置101或 151可以被配置為便攜式設(shè)備、車載設(shè)備或移動(dòng)電話。
如上所述,當(dāng)被配置以基于特征量來(lái)檢索相似內(nèi)容時(shí),信息處理裝置 允許識(shí)別相似內(nèi)容。此外,當(dāng)按如下所述來(lái)配置時(shí),信息處理裝置允許以 更簡(jiǎn)易、更快速且更精確的方式來(lái)識(shí)別相似內(nèi)容。即,該信息處理裝置使 用函數(shù)來(lái)轉(zhuǎn)換內(nèi)容特征量。所述函數(shù)適于對(duì)附于多條內(nèi)容的多個(gè)特征量進(jìn) 行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的內(nèi)容之間的距離,符合與用戶輸 入的、所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng)的距離。所述函數(shù)還適于將 分布在由上述多個(gè)特征量限定的特征量空間中的多條內(nèi)容,映射到通過(guò)對(duì) 所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特征量空間。所述信息處理裝置基
于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索相似內(nèi)容。
上述的一系列處理可以通過(guò)硬件或軟件來(lái)執(zhí)行。當(dāng)通過(guò)軟件來(lái)執(zhí)行 時(shí),組成該軟件的程序被從程序記錄介質(zhì)安裝到嵌入在專用硬件中的計(jì)算 機(jī)中,或者諸如安裝了各種程序因而能夠執(zhí)行各種功能的個(gè)人計(jì)算機(jī)之類 的計(jì)算機(jī)中。
圖29是示出了可操作用于執(zhí)行上述處理的個(gè)人計(jì)算機(jī)的配置示例的
框圖。CPU (中央處理單元)201根據(jù)存儲(chǔ)在ROM (只讀存儲(chǔ)器)202或 存儲(chǔ)單元208中的程序來(lái)執(zhí)行各種處理。RAM (隨機(jī)存取存儲(chǔ)器)203酌 情存儲(chǔ)將由CPU201運(yùn)行的程序和數(shù)據(jù)。CPU 201、 ROM 202和RAM 203 通過(guò)總線204而彼此相連接。
CPU 201還經(jīng)由總線204而與1/0接口 205相連接。1/0接口 205與輸 入單元206和輸出單元207相連接。輸入單元206包括諸如鍵盤、鼠標(biāo)和 麥克風(fēng)之類的設(shè)備。輸出單元207包括諸如顯示器和揚(yáng)聲器之類的設(shè)備。 CPU 201響應(yīng)于來(lái)自輸入單元206的指令而執(zhí)行各種處理。CPU 201將處 理結(jié)果輸出到輸出單元207。
與I/O接口 205相連接的存儲(chǔ)單元208例如包括硬盤。存儲(chǔ)單元208 存儲(chǔ)將由CPU 201運(yùn)行的程序和各種數(shù)據(jù)。通信單元209經(jīng)由諸如因特網(wǎng) 或局域網(wǎng)之類的網(wǎng)絡(luò)而與外部設(shè)備進(jìn)行通信。
可替換地,程序可以經(jīng)由通信單元209來(lái)獲得并存儲(chǔ)在存儲(chǔ)單元208中。
與I/O接口 205相連接的驅(qū)動(dòng)器210在載入可移動(dòng)介質(zhì)211 (例如, 磁盤、光盤、磁性光盤或半導(dǎo)體存儲(chǔ)器)的時(shí)候,驅(qū)動(dòng)該可移動(dòng)介質(zhì) 211。這樣,驅(qū)動(dòng)器210從介質(zhì)211獲得程序和數(shù)據(jù)。所獲得的程序和數(shù) 據(jù)按需而被傳送到存儲(chǔ)單元208,以將其存儲(chǔ)下來(lái)。
如圖29所示,可操作于存儲(chǔ)安裝在計(jì)算機(jī)中并從而轉(zhuǎn)換為可執(zhí)行形 式的程序的程序記錄介質(zhì),包括可移動(dòng)介質(zhì)211,可移動(dòng)介質(zhì)211是封裝 介質(zhì)(package medium)并包括磁盤(包括軟盤)、光盤(包括CD-ROM (只讀光盤存儲(chǔ)器)、DVD (數(shù)字多功能光盤)、磁性光盤)或半導(dǎo)體存 儲(chǔ)器?;蛘?,所述程序記錄介質(zhì)包括暫時(shí)或永久地存儲(chǔ)程序的ROM 202。
又或者,所述程序記錄介質(zhì)包括包含存儲(chǔ)單元208的硬盤或其它介質(zhì)。程 序在程序記錄介質(zhì)中的存儲(chǔ)是經(jīng)由作為諸如路由器或調(diào)制解調(diào)器之類的接
口的通信單元209來(lái)按需實(shí)現(xiàn)的。所述程序是使用諸如局域網(wǎng)、因特網(wǎng)或
數(shù)字衛(wèi)星廣播之類的有線或無(wú)線通信介質(zhì)來(lái)存儲(chǔ)的。
應(yīng)當(dāng)注意,在本說(shuō)明書中,描述存儲(chǔ)在程序記錄介質(zhì)中的程序的步驟 不僅包括根據(jù)給定順序來(lái)按時(shí)間順序執(zhí)行的處理,而且還包括不必按時(shí)間 順序而按并行方式或單獨(dú)地執(zhí)行的其它處理。
應(yīng)當(dāng)注意,本發(fā)明并不限于上述實(shí)施例,并且可以在本發(fā)明的精神的 范圍內(nèi)進(jìn)行各種修改。
相關(guān)申請(qǐng)的交叉引用
本發(fā)明包含與2006年10月2日在日本專利局提出的日本專利申請(qǐng) No.2006-270962相關(guān)的主題,該申請(qǐng)的全部?jī)?nèi)容通過(guò)引用結(jié)合于此。
權(quán)利要求
1.一種信息處理裝置,包括轉(zhuǎn)換裝置,所述轉(zhuǎn)換裝置用于使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換,所述函數(shù)適用于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi)容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng)的距離,所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特征量空間中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特征量空間;以及檢索裝置,所述檢索裝置用于基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索出相似的內(nèi)容。
2. 如權(quán)利要求1所述的信息處理裝置,還包括 提取裝置,所述提取裝置用于提取內(nèi)容特征量。
3. 如權(quán)利要求1所述的信息處理裝置,其中所述檢索裝置通過(guò)從已由所述函數(shù)轉(zhuǎn)換過(guò)其特征量的內(nèi)容的多個(gè)組中 的同一組中檢索內(nèi)容,來(lái)檢索出相似內(nèi)容。
4. 如權(quán)利要求l所述的信息處理裝置,其中所述轉(zhuǎn)換裝置通過(guò)應(yīng)用由遺傳方法反復(fù)生成而獲得的函數(shù)、直到預(yù)定 世代數(shù)目都不再更新評(píng)估值為止,來(lái)轉(zhuǎn)換內(nèi)容特征量,所述評(píng)估值是從兩 個(gè)值中計(jì)算得到的信息標(biāo)準(zhǔn),所述兩個(gè)值中的一個(gè)是表示基于多條內(nèi)容之 間的歐幾里得距離的分類程度的值,所述多條內(nèi)容被認(rèn)為在由用戶輸入 的、所述多條內(nèi)容之間的相似性關(guān)系中是相似或不相似,而所述兩個(gè)值中 的另一個(gè)是所述函數(shù)的自由參數(shù)的數(shù)目。
5. 如權(quán)利要求4所述的信息處理裝置,其中,所述轉(zhuǎn)換裝置通過(guò)應(yīng)用由遺傳方法反復(fù)生成而獲得的函數(shù)、直到預(yù)定 世代數(shù)目都不再更新評(píng)估值為止,來(lái)轉(zhuǎn)換內(nèi)容特征量,所述評(píng)估值是根據(jù) 表示分類程度的費(fèi)希爾判別比來(lái)計(jì)算得到的。
6. 如權(quán)利要求1所述的信息處理裝置,還包括生成裝置,所述生成裝置用于利用遺傳方法來(lái)生成所述函數(shù),其中, 所述轉(zhuǎn)換裝置通過(guò)應(yīng)用所生成的函數(shù),來(lái)轉(zhuǎn)換內(nèi)容特征量。
7. 如權(quán)利要求6所述的信息處理裝置,還包括計(jì)算裝置,所述計(jì)算裝置用于從兩個(gè)值中計(jì)算得到作為信息標(biāo)準(zhǔn)的評(píng) 估值,所述兩個(gè)值中的一個(gè)是表示基于多條內(nèi)容之間的歐幾里得距離的分 類程度的值,所述多條內(nèi)容被認(rèn)為在由用戶輸入的、所述多條內(nèi)容之間的 相似性關(guān)系中是相似或不相似,而所述兩個(gè)值中的另一個(gè)是所述函數(shù)的自 由參數(shù)的數(shù)目,并且其中,所述生成裝置利用遺傳方法來(lái)生成所述函數(shù),直到預(yù)定世代數(shù)目都不 再更新所述評(píng)估值為止。
8. 如權(quán)利要求7所述的信息處理裝置,其中所述計(jì)算裝置根據(jù)表示所述分類程度的費(fèi)希爾判別比來(lái)計(jì)算所述評(píng)估值。
9. 如權(quán)利要求7所述的信息處理裝置,還包括獲取裝置,所述獲取裝置用于獲取表示用戶輸入的、在所述多條內(nèi)容 之間的相似性關(guān)系的數(shù)據(jù),其中,所述計(jì)算裝置使用所述表示用戶輸入的、在所述多條內(nèi)容之間的相似 性關(guān)系的數(shù)據(jù)來(lái)計(jì)算評(píng)估值。
10. 如權(quán)利要求l所述的信息處理裝置,還包括群集裝置,所述群集裝置用于基于經(jīng)轉(zhuǎn)換的特征量,來(lái)執(zhí)行內(nèi)容的群 集操作。
11. 如權(quán)利要求l所述的信息處理裝置,還包括識(shí)別裝置,所述識(shí)別裝置用于根據(jù)基于經(jīng)轉(zhuǎn)換的特征量的、內(nèi)容到群 集的距離,來(lái)識(shí)別內(nèi)容所屬的組。
12. —種信息處理方法,包括轉(zhuǎn)換步驟和檢索步驟,其中 所述轉(zhuǎn)換步驟使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換,所述函數(shù)適用于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的 多條內(nèi)容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān) 系相適應(yīng)的距離,所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特 征量空間中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特征量空間,并且其中,所述檢索步驟基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索出相似的內(nèi)容。
13. —種使計(jì)算機(jī)執(zhí)行轉(zhuǎn)換步驟和檢索步驟的程序,其中 所述轉(zhuǎn)換步驟使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換,所述函數(shù)適用于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的 多條內(nèi)容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān) 系相適應(yīng)的距離,所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特 征量空間中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得 到的新的特征量空間,并且其中,所述檢索步驟基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索出相似的內(nèi)容。
14. 一種用于存儲(chǔ)使計(jì)算機(jī)執(zhí)行轉(zhuǎn)換步驟和檢索步驟的程序的記錄介 質(zhì),其中,所述轉(zhuǎn)換步驟使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換,所述函數(shù)適用于對(duì) 附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的 多條內(nèi)容之間的距離,符合與用戶輸入的、所述多條內(nèi)容之間的相似性關(guān) 系相適應(yīng)的距離,所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特 征量空間中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得 到的新的特征量空間,并且其中,所述檢索步驟基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索出相似的內(nèi)容。
15. —種信息處理裝置,包括轉(zhuǎn)換部分,所述轉(zhuǎn)換部分被配置用于使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn) 換,所述函數(shù)適用于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由 所述多個(gè)特征量限定的多條內(nèi)容之間的距離,符合與用戶輸入的、所述多 條內(nèi)容之間的相似性關(guān)系相適應(yīng)的距離,所述函數(shù)還適用于將分布在由所 述多個(gè)特征量限定的特征量空間中的所述多條內(nèi)容,映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特征量空間;以及,檢索部分,所述檢索部分被配置用于基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索出相 似的內(nèi)容。
全文摘要
本發(fā)明提供了信息處理裝置和方法、程序以及記錄介質(zhì)。信息處理裝置包括轉(zhuǎn)換裝置和檢索裝置,其中,轉(zhuǎn)換裝置使用函數(shù)來(lái)對(duì)內(nèi)容特征量進(jìn)行轉(zhuǎn)換,所述函數(shù)適用于對(duì)附于多條內(nèi)容上的多個(gè)特征量進(jìn)行轉(zhuǎn)換,以使得由所述多個(gè)特征量限定的多條內(nèi)容之間的距離符合和用戶輸入的在所述多條內(nèi)容之間的相似性關(guān)系相適應(yīng)的距離,所述函數(shù)還適用于將分布在由所述多個(gè)特征量限定的特征量空間中的所述多條內(nèi)容映射到通過(guò)對(duì)所述多個(gè)特征量進(jìn)行轉(zhuǎn)換而得到的新的特征量空間中;而檢索裝置基于經(jīng)轉(zhuǎn)換的特征量來(lái)檢索相似的內(nèi)容。
文檔編號(hào)G10H1/00GK101174407SQ20071016155
公開日2008年5月7日 申請(qǐng)日期2007年10月8日 優(yōu)先權(quán)日2006年10月2日
發(fā)明者小林由幸, 齋藤真里, 木村隆臣 申請(qǐng)人:索尼株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
鄯善县| 阜康市| 兴安县| 阿尔山市| 海宁市| 梁山县| 黔西县| 正宁县| 阳原县| 驻马店市| 黄陵县| 方山县| 淮安市| 太湖县| 松阳县| 兖州市| 叶城县| 内黄县| 兴国县| 西贡区| 绥化市| 大悟县| 滕州市| 乐清市| 临沧市| 赤峰市| 星子县| 筠连县| 海兴县| 邵阳县| 延寿县| 卫辉市| 大渡口区| 临泽县| 松潘县| 卓尼县| 万荣县| 青州市| 洞头县| 兴城市| 松阳县|