專利名稱:信息處理設(shè)備、方法及其程序、信息處理系統(tǒng)及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信息處理設(shè)備、信息處理方法、實施信息處理方法的程序、信息處理系統(tǒng)和信息處理系統(tǒng)的方法,更具體地說,涉及這樣的信息處理設(shè)備、信息處理方法、實施信息處理方法的程序、信息處理系統(tǒng)和信息處理系統(tǒng)的方法,其中在相似性的計算中使用指示用戶的喜好的信息以適當?shù)剡x擇要推薦給用戶的內(nèi)容。
背景技術(shù):
公知的是基于內(nèi)容信息比如EPG(電子節(jié)目導視)選擇與用戶的喜好匹配的內(nèi)容比如電視或無線電廣播節(jié)目并將所選擇的內(nèi)容推薦給用戶。在下文中,電視或無線電廣播節(jié)目被簡單地稱為節(jié)目,除非與計算機程序混淆。已知有不同的方法獲取指示用戶的喜好的信息,并根據(jù)獲取指示用戶的喜好的信息的方法將內(nèi)容以各種方式推薦給用戶。例如,登記用戶收視的電視廣播節(jié)目,并基于日志數(shù)據(jù)推薦節(jié)目。
在這種技術(shù)中,在每次用戶收視節(jié)目時,存儲與收視過的節(jié)目相關(guān)的元數(shù)據(jù)。在所存儲的元數(shù)據(jù)的量達到特定的水平時,借助于tf/idf方法或根據(jù)發(fā)生的頻率將權(quán)重分配給每個元數(shù)據(jù)(或指示多個節(jié)目元數(shù)據(jù)共有的屬性的數(shù)據(jù))。然后對每個節(jié)目的元數(shù)據(jù)產(chǎn)生矢量以使矢量的元素由各個權(quán)重給定(在下文中,將這種矢量稱為特征矢量)。此外,基于一個或多個特征矢量產(chǎn)生指示用戶喜好的矢量(在下文中稱為用戶喜好矢量)。在基于節(jié)目收視日志數(shù)據(jù)的常規(guī)技術(shù)中,用戶喜好矢量用作表示用戶的喜好的信息。與候選節(jié)目相關(guān)的內(nèi)容元矢量(其元素通過分配給候選節(jié)目的節(jié)目元數(shù)據(jù)的權(quán)重給定的矢量)相對于用戶的喜好矢量的相似性。如果確定相似性較高,則將該候選節(jié)目推薦給用戶。
在基于節(jié)目收視日志數(shù)據(jù)的這種常規(guī)技術(shù)中,用戶喜好矢量的維數(shù)數(shù)量(元素的數(shù)量)增加,因此操作的復雜度隨內(nèi)容(TV節(jié)目)的類型(即隨節(jié)目元數(shù)據(jù)的數(shù)量)增加。為解決上述的問題,公知的是,采用各種技術(shù)減小維數(shù)數(shù)量。
例如,公知的是,通過奇異值分解(主分量分析)將所有的矢量投影到最佳的基線(軸),由此減小維數(shù)數(shù)量(例如,參考(1)日本未審查專利申請出版物No.2001-155063,(2)1989年6月13日的美國專利US4,839,853“Computer information retrieval using latentsemantic structure”,(3)1994年4月5日的美國專利US5,301,109“Ccomputerized cross-language document retrieval usinglatent semantic indexing”)。
然而,在基于節(jié)目收視日志數(shù)據(jù)的常規(guī)技術(shù)中,用戶喜好矢量(在候選節(jié)目的相似性的計算中用作參考)不一定指示用戶的正確的喜好,因此基于用戶的喜好矢量推薦的內(nèi)容(TV節(jié)目)通常被用戶拒絕。
發(fā)明內(nèi)容
考慮到上述的問題,本發(fā)明的一個目的是提供一種在要推薦的內(nèi)容的相似性計算中使用正確地指示用戶的喜好的信息的技術(shù)。
在一方面中,本發(fā)明提供一種信息處理設(shè)備,該信息處理設(shè)備包括修改裝置、產(chǎn)生裝置和相似性計算裝置,該修改裝置用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù),該產(chǎn)生裝置用于產(chǎn)生包括基于M個信息組所形成的N條單個信息的參考信息組,該M個信息組中每個包括通過修改裝置修改的N條單個信息,該相似性計算裝置用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于由產(chǎn)生裝置產(chǎn)生的參考信息組的相似性。
通過修改裝置獲取的M個信息組每個的N條單個信息可以包括指示特定的內(nèi)容或特定的內(nèi)容的一部分或指示該內(nèi)容的屬性的至少一條或多條內(nèi)容元信息,并且也包括指示用戶使用內(nèi)容的內(nèi)部或外部狀態(tài)的至少一條或多條上下文(context)信息。
上下文信息可以包括作為權(quán)重分配給指示用戶的空間位置的位置信息的值或它的歸一化值。
上下文信息可以包括作為權(quán)重值分配給指示用戶的情緒的情緒信息的值或它的歸一化值。
上下文信息可以包括通過用戶或通過設(shè)置在用戶的附近的傳感器獲取的值或它的歸一化值。
修改裝置可以包括矢量化裝置和矩陣產(chǎn)生裝置,在每次用戶使用內(nèi)容時,該矢量化裝置用于獲取包括與該內(nèi)容相關(guān)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,以及產(chǎn)生其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,以及在通過矢量化裝置產(chǎn)生M個特征矢量時該矩陣產(chǎn)生裝置用于產(chǎn)生具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分地修改的第二矩陣以便突出在M列的每列中N行元素的相關(guān)性,其中產(chǎn)生裝置可以基于通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的M列產(chǎn)生包括N個元素的參考信息組,以及相似性計算裝置可以從比較信息組中產(chǎn)生包括N個元素的比較矢量并計算在比較矢量和由產(chǎn)生裝置產(chǎn)生的參考矢量之間的相似性。
產(chǎn)生裝置可以選擇第二矩陣的M列的至少一個或多個列并將在所有選擇的列中的每行中的元素相加在一起,由此產(chǎn)生參考矢量。
產(chǎn)生裝置可以根據(jù)對應(yīng)于上下文信息的元素從第二矩陣的M列中選擇彼此具有較高的相似性的列并將在所有選擇的列中的每行中的元素相加在一起,由此產(chǎn)生參考矢量。
產(chǎn)生裝置可以根據(jù)對應(yīng)于上下文信息的元素從第一矩陣的M列中選擇彼此具有較高的相似性的列,并進一步從第二矩陣中選擇對應(yīng)于第一矩陣的所選擇的列的列并將在從第二矩陣中選擇的所有的列中的每行中的元素相加在一起,由此產(chǎn)生參考矢量。
產(chǎn)生裝置通過直接運用由矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的各個M列可以產(chǎn)生參考矢量。
矢量化裝置可以通過使用N條單個信息中的每個在該內(nèi)容中出現(xiàn)的頻率或基于出現(xiàn)頻率的歸一化值將權(quán)重值分配給N條單個信息中的每個。
矢量化裝置可以產(chǎn)生其元素分別通過分配給各個N條單個信息的權(quán)重值和N個可變系數(shù)的乘積給定的特征矢量。
相似性計算裝置可以計算通過如下過程計算相似性獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素通過分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和參考矢量之間相似性,以及信息處理設(shè)備進一步可以包括提供(presentation)裝置,如果通過相似性計算裝置計算的相似性等于或高于閾值則該提供裝置將新內(nèi)容作為推薦內(nèi)容提供給用戶。
在提供裝置將推薦的內(nèi)容提供給用戶時,提供裝置也可以提供基于參考矢量推薦的原因。
相似性計算裝置可以通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取包括與用戶當前使用的內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,產(chǎn)生其元素由分配給用戶當前使用的內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,計算在產(chǎn)生的特征矢量和由產(chǎn)生裝置產(chǎn)生的一個或多個參考矢量之間的相似性,基于具有等于或高于閾值的相似性的參考矢量產(chǎn)生的新的參考矢量,以及在產(chǎn)生了比較矢量之后,計算在參考矢量和比較矢量之間的相似性。
相似性計算裝置可以通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取指示用戶所在的當前上下文的一條或多條上下文信息,將權(quán)重值分配給各條的上下文信息,產(chǎn)生其對應(yīng)于各條的上下文信息的元素由分配的權(quán)重值給定以及其它的元素由0給定的當前上下文特征矢量,計算在當前上下文特征矢量和由產(chǎn)生裝置產(chǎn)生的一個或多個參考矢量之間的相似性,基于具有等于或高于閾值的相似性的參考矢量產(chǎn)生的新的參考矢量,以及在產(chǎn)生了比較矢量之后,計算在參考矢量和比較矢量之間的相似性。
矩陣產(chǎn)生裝置可以通過如下過程產(chǎn)生第二矩陣將第一矩陣分解為具有N行和N列的第一分量矩陣、具有N行和M列的第二分量矩陣和具有M行和M列的第三分量矩陣的轉(zhuǎn)置陣的乘積,從第一分量矩陣中產(chǎn)生具有N行和K列的第四分量矩陣(這里K是小于第一矩陣的等級的整數(shù)),從第二分量矩陣中產(chǎn)生具有K行和K列的第五分量矩陣,以及從第三分量矩陣中產(chǎn)生具有M行和K列的第六分量矩陣,以及產(chǎn)生通過第四分量矩陣、第五分量矩陣和第六分量矩陣的轉(zhuǎn)置陣的乘積給定第二矩陣。
相似性計算裝置可以通過如下過程計算相似性獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給各個N條單個信息,產(chǎn)生其元素由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,通過將比較矢量和參考矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將比較矢量和參考矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算維數(shù)減小到K的比較矢量和維數(shù)減小到K的參考矢量之間的相似性,其中信息處理設(shè)備進一步可以包括提供裝置,如果通過相似性計算裝置計算的相似性等于或高于閾值,則提供裝置將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
在提供裝置將推薦的內(nèi)容提供給用戶時,提供裝置也可以提供基于參考矢量推薦的原因。
相似性計算裝置可以通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取包括與用戶當前使用的內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,產(chǎn)生其元素由分配給用戶當前使用的內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,通過將特征矢量和一個或多個參考矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將所產(chǎn)生的特征矢量和一個或多個參考矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算維數(shù)減小到K的特征矢量和維數(shù)減小到K的一個或多個參考矢量之間的相似性,以及基于具有等于或高于閾值的相似性的維數(shù)減小的參考矢量產(chǎn)生新的K-維參考矢量,在產(chǎn)生了比較矢量之后,通過將比較矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將比較矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算在新的K-維參考矢量和維數(shù)減小到K的比較矢量之間的相似性。
相似性計算裝置可以通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取指示用戶所在的當前上下文的一條或多條上下文信息,將權(quán)重值分配給各條的上下文信息,產(chǎn)生其對應(yīng)于各條的上下文信息的元素由分配的權(quán)重值給定以及其它的元素由0給定的當前上下文特征矢量,通過將當前上下文特征矢量和一個或多個參考矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將當前上下文特征矢量和由產(chǎn)生裝置產(chǎn)生的一個或多個參考矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算維數(shù)減小到K的當前上下文特征矢量和維數(shù)減小到K的一個或多個參考矢量之間的相似性,以及基于具有等于或高于閾值的相似性的維數(shù)減小的參考矢量產(chǎn)生新的K-維參考矢量,在產(chǎn)生了比較矢量之后,通過將比較矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將比較矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算在新的K-維參考矢量和維數(shù)減小到K的比較矢量之間的相似性。
在每次產(chǎn)生特征矢量時,矢量化裝置可以將產(chǎn)生的特征矢量分類為指示用戶的肯定喜好因素的肯定喜好特征矢量或者指示用戶的否定喜好因素的否定喜好特征矢量。
矩陣產(chǎn)生裝置可以使用由矢量化裝置產(chǎn)生的M個肯定喜好特征矢量產(chǎn)生第二矩陣。
信息處理設(shè)備可以進一步包括通過使用矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的列作為訓練數(shù)據(jù)通過學習分類用于產(chǎn)生分類器的學習裝置和分類裝置,該分類裝置用于通過如下過程進行分類獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,產(chǎn)生其元素通過分配給新內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,以及使用由學習裝置產(chǎn)生的分類器對與新內(nèi)容關(guān)聯(lián)的特征矢量分類為肯定喜好特征矢量或否定喜好特征矢量。
相似性計算裝置可以運用通過分類裝置分類為肯定喜好特征矢量的特征矢量作為比較矢量并計算在比較矢量和參考矢量之間的相似性。
信息處理設(shè)備進一步可以包括登記裝置,該登記裝置用于選擇通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的列的一個或多個特定的元素并在用戶的個人字典中登記識別每個所選擇的元素的字作為用戶感興趣的字或用戶不感興趣的字。
在通過矢量化裝置產(chǎn)生M個否定喜好特征矢量時,矩陣產(chǎn)生裝置可以進一步使用M個否定喜好特征矢量產(chǎn)生第二矩陣,產(chǎn)生裝置可以基于通過矩陣產(chǎn)生裝置產(chǎn)生的M個肯定喜好特征矢量從通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣中產(chǎn)生第一參考矢量,以及進一步基于否定喜好特征矢量從通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣中產(chǎn)生第二參考矢量,以及相似性計算裝置可以計算在比較矢量和第一參考矢量之間的第一相似性,也計算在比較矢量和第二參考矢量之間的第二相似性。
相似性計算裝置可以獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算第一相似性和第二相似性,該信息處理設(shè)備進一步可以包括提供裝置,該提供裝置用于基于通過相似性計算裝置計算的第一相似性和第二相似性確定新內(nèi)容是否適合作為要推薦的內(nèi)容,并且如果確定新內(nèi)容是適合的則將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
在提供裝置將推薦的內(nèi)容提供給用戶時,提供裝置也可以提供基于參考矢量推薦的原因。
如果第一相似性等于或高于第一閾值并且第二相似性低于第二閾值,則提供裝置可以確定新內(nèi)容適合作為推薦的內(nèi)容并將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
如果第一相似性等于或高于第二相似性并且第二相似性低于閾值,則提供裝置可以確定新內(nèi)容適合作為推薦的內(nèi)容并將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
在一方面中,本發(fā)明提供一種信息處理方法,該信息處理方法包括修改步驟、產(chǎn)生步驟和相似性計算步驟,該修改步驟用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù),該產(chǎn)生步驟用于從M個信息組中產(chǎn)生包括N條單個信息的參考信息組以在相似性的計算中用作參考,該M個信息組中每個包括在修改步驟中修改的N條單個信息,該相似性計算步驟用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于在產(chǎn)生步驟中產(chǎn)生的參考信息組的相似性。
在一方面中,本發(fā)明提供一種計算機執(zhí)行的程序,該程序包括修改步驟、產(chǎn)生步驟和相似性計算步驟,該修改步驟用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù),該產(chǎn)生步驟用于從M個信息組中產(chǎn)生包括N條單個信息的參考信息組以在相似性的計算中用作參考,該M個信息組中每個包括在修改步驟中修改的N條單個信息,該相似性計算步驟用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于在產(chǎn)生步驟中產(chǎn)生的參考信息組的相似性。
在上文描述的信息處理設(shè)備、信息處理方法和程序中,在獲取包括N(≥2)條單個信息的M(≥1)的信息組時,至少部分地修改M個信息組中每個的N條單個信息以便突出在N條單個信息中的相關(guān)性。然后從每個包括修改的N條單個信息的M個信息組中形成在相似性的計算中用作參考的包括N條單個信息的參考信息組。此后,如果給定包括N條單個信息的新信息組,則計算這個新信息組相對于參考信息組的相似性。
在一方面中,本發(fā)明提供一種信息處理設(shè)備,該信息處理設(shè)備包括矢量化裝置、矩陣產(chǎn)生裝置、參考矢量產(chǎn)生裝置、候選內(nèi)容獲取裝置、相似性計算裝置和提供裝置,該矢量化裝置用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生裝置用于在通過矢量化裝置形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該參考矢量產(chǎn)生裝置用于從通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,該候選內(nèi)容獲取裝置用于在每次通過參考矢量產(chǎn)生裝置形成參考矢量時基于參考矢量獲取要推薦給用戶的內(nèi)容的候選內(nèi)容,該相似性計算裝置用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和由參考矢量產(chǎn)生裝置形成的一個或多個參考矢量之間的相似性,該提供裝置用于從通過候選內(nèi)容獲取裝置獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
在一方面中,本發(fā)明提供一種信息處理方法,該信息處理方法包括矢量化步驟、矩陣產(chǎn)生步驟、參考矢量產(chǎn)生步驟、相似性計算步驟和提供步驟,該矢量化步驟用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生步驟用于當在矢量化步驟中形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該參考矢量產(chǎn)生步驟用于從通過矩陣產(chǎn)生步驟形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,該相似性計算步驟用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和在參考矢量產(chǎn)生步驟中形成的一個或多個參考矢量之間的相似性,該提供步驟用于從在候選內(nèi)容獲取步驟中獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
在一方面中,本發(fā)明提供一種計算機執(zhí)行的程序,該程序包括矢量化步驟、矩陣產(chǎn)生步驟、參考矢量產(chǎn)生步驟、相似性計算步驟和提供步驟,該矢量化步驟用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生步驟當在矢量化步驟中形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該參考矢量產(chǎn)生步驟用于從通過矩陣產(chǎn)生步驟形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,該相似性計算步驟用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和在參考矢量產(chǎn)生步驟中形成的一個或多個參考矢量之間的相似性,該提供步驟用于從在候選內(nèi)容獲取步驟中獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
在上文描述的信息處理設(shè)備、信息處理方法和程序中,在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,以及為該內(nèi)容形成其元素通過分配給各個N條單個信息的權(quán)重值給定的特征矢量。在以上述方式已經(jīng)形成了M個特征矢量時,形成具有N行和M列的第一矩陣以使矩陣的列由各個M個特征矢量給定。然后對第一矩陣執(zhí)行操作以將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性。然后基于第二矩陣的M個列形成在相似性計算中用作參考的包括N個元素的參考矢量。在每次以上述的方式形成參考矢量時,基于參考矢量確定要推薦給用戶的內(nèi)容的候選內(nèi)容。在獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組時,將權(quán)重值分配給各個N條單個信息,以及形成其元素由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量。此外,計算在比較矢量和一個或多個參考矢量之間的相似性。對應(yīng)于具有等于或高于閾值的相似性的參考矢量的內(nèi)容被選擇并推薦給用戶。
在一方面中,本發(fā)明提供一種信息處理設(shè)備,該信息處理設(shè)備包括矢量化裝置、矩陣產(chǎn)生裝置和類型設(shè)置裝置,該矢量化裝置用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生裝置用于在通過矢量化裝置形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該類型設(shè)置裝置計算通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
該類型設(shè)置裝置可以通過使用屬于該類型的列作為訓練數(shù)據(jù)通過學習每種類型的類別形成分類器,該信息處理設(shè)備進一步可以包括分類裝置,該分類裝置用于通過如下方式進行分類獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過分配給新內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,以及使用通過類型設(shè)置裝置形成的分類器將與新內(nèi)容關(guān)聯(lián)的特征矢量分類作為由類型設(shè)置裝置設(shè)定的類型中的一種類型。
在每次類型設(shè)置裝置設(shè)定一種類型時,類型設(shè)置裝置可以從屬于該類型的列中選擇元素并基于所選擇的元素將名字分配給該類型。
在一方面中,本發(fā)明提供一種信息處理方法,該信息處理方法包括矢量化步驟、矩陣產(chǎn)生步驟和類型設(shè)置步驟,該矢量化步驟用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生步驟用于在矢量化步驟中形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該類型設(shè)置步驟計算在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
在一方面中,本發(fā)明提供一種程序,該程序包括矢量化步驟、矩陣產(chǎn)生步驟和類型設(shè)置步驟,該矢量化步驟用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生步驟用于在矢量化步驟中形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該類型設(shè)置步驟計算在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
在上述的信息處理設(shè)備、信息處理方法和程序中,在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,以及為該內(nèi)容形成其元素通過分配給各個N條單個信息的權(quán)重值給定的特征矢量。在以上述方式已經(jīng)形成了M個特征矢量時,形成具有N行和M列的第一矩陣以使矩陣的列由各個M個特征矢量給定。然后對第一矩陣執(zhí)行操作以將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性。然后計算在第二矩陣的M列中的相似性,以及基于所計算的相似性對M個列中的每個進行分類。設(shè)定在分類中獲得的每個類別作為類型。
在一方面中,本發(fā)明提供一種包括服務(wù)器和由用戶使用的客戶的信息處理系統(tǒng),該信息處理系統(tǒng)包括矢量化裝置、矩陣產(chǎn)生裝置、參考矢量產(chǎn)生裝置和相似性計算裝置,該矢量化裝置用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生裝置用于在通過矢量化裝置形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該參考矢量產(chǎn)生裝置用于從通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,該相似性計算裝置用于如下地計算相似性獲取包括N條單個信息的新信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,以及計算在比較矢量和由參考矢量產(chǎn)生裝置形成的參考矢量之間的相似性,其中在矢量化裝置、矩陣產(chǎn)生裝置、參考矢量產(chǎn)生裝置和相似性計算裝置中,至少矩陣產(chǎn)生裝置包括在服務(wù)器中。
在一方面中,本發(fā)明提供一種用于包括服務(wù)器和由用戶使用的客戶的信息處理系統(tǒng)的信息處理方法,該信息處理方法包括矢量化步驟、矩陣產(chǎn)生步驟、參考矢量產(chǎn)生步驟和相似性計算步驟,該矢量化步驟用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,該矩陣產(chǎn)生步驟用于當在矢量化步驟中形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,該參考矢量產(chǎn)生步驟用于從通過矩陣產(chǎn)生步驟形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,該相似性計算步驟包括如下子步驟以計算相似性獲取包括N條單個信息的新信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,以及計算在比較矢量和由參考矢量產(chǎn)生步驟形成的參考矢量之間的相似性,其中在矢量化步驟、矩陣產(chǎn)生步驟、參考矢量產(chǎn)生步驟和相似性計算步驟中,至少矩陣產(chǎn)生步驟由服務(wù)器執(zhí)行。
在上文描述的信息處理系統(tǒng)及其方法中,通過服務(wù)器和/或客戶執(zhí)行至少下文描述的第一至第四過程。第一過程包括如下步驟在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息中的每個,以及為該內(nèi)容形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為特征矢量。第二過程包括如下步驟在第一過程中形成了M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性。第三過程包括如下步驟從在第二過程中形成的第二矩陣的M個列中形成在相似性計算中用作參考的包括N個元素的參考矢量。第四過程包括計算相似性的步驟,該步驟包括如下的子步驟獲取包括N條單個信息的新信息組,將權(quán)重值分配給各個N條單個信息,形成其元素由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,以及計算在比較矢量和在第三過程中形成的參考矢量之間的相似性。當然在這些第一至第四過程中,通過服務(wù)器執(zhí)行包括矩陣的計算的第二過程。
如上文所述,本發(fā)明允許在選擇內(nèi)容的相似性的計算過程中通過使用正確指示用戶的喜好的信息將正確的內(nèi)容推薦給用戶。
附圖1根據(jù)本發(fā)明的一種實施例信息處理設(shè)備的功能性方塊圖;附圖2所示為用于輸入上下文信息的屏幕的實例的附圖;附圖3所示為通過在附圖1中所示的信息處理設(shè)備執(zhí)行的UPV產(chǎn)生過程的實例的流程圖;附圖4所示為在附圖3中所示的UPV產(chǎn)生過程中CCV產(chǎn)生過程的詳細流程的實例的流程圖;附圖5所示為其元素通過內(nèi)容元信息和上下文信息給定的特征矢量的實例的附圖;附圖6所示為在附圖3中所示的UPV產(chǎn)生過程中近似矩陣(空間)產(chǎn)生過程的詳細流程的實例的流程圖;附圖7所示為其列通過在附圖5中所示的各個特征矢量給定的矩陣的附圖;附圖8所示為通過在附圖7中所示的矩陣的奇異值分解獲得的一個分量矩陣的附圖;附圖9所示為通過在附圖7中所示的矩陣的奇異值分解獲得的一個分量矩陣的附圖;附圖10所示為通過在附圖7中所示的矩陣的奇異值分解獲得的一個分量矩陣的附圖;附圖11所示為通過奇異值分解和維數(shù)降低從在附圖5中所示的矩陣中獲得的矩陣(在附圖5中所示的矩陣的近似矩陣)的附圖;附圖12所示為在附圖3中所示的UPV產(chǎn)生過程中CUPV產(chǎn)生過程的詳細流程的實例的流程圖;附圖13所示為通過在附圖1中所示的信息處理設(shè)備執(zhí)行的內(nèi)容推薦過程的實例的流程圖;附圖14所示為在附圖13所示的內(nèi)容推薦過程中CUPV設(shè)置過程的詳細流程的實例的流程圖;附圖15所示為從當前上下文信息中形成的當前上下文特征矢量的實例的附圖;附圖16所示為在附圖15中所示的當前上下文特征矢量相對于在附圖11中所示的每個特征矢量(近似矩陣的列)的相似性的計算結(jié)果的實例的附圖;附圖17所示為在附圖13中所示的內(nèi)容推薦過程中內(nèi)容推薦計算過程的詳細流程的實例的流程圖;附圖18所示為根據(jù)本發(fā)明的另一實施例信息處理設(shè)備的功能性方塊圖;附圖19所示為通過在附圖18中所示的信息處理設(shè)備執(zhí)行的UPV產(chǎn)生過程的實例的流程圖;附圖20所示為在附圖19中所示的UPV產(chǎn)生過程中的CUPV產(chǎn)生過程的詳細流程的實例的流程圖;附圖21所示為通過在附圖18中所示的信息處理設(shè)備執(zhí)行的在附圖13中所示的內(nèi)容推薦過程中的CUPV設(shè)置過程的實例的流程圖;附圖22所示為通過在附圖18中所示的信息處理設(shè)備執(zhí)行的在附圖13中所示的內(nèi)容推薦過程中的內(nèi)容推薦計算過程的實例的流程圖;附圖23所示為通過在附圖1中所示的信息處理設(shè)備執(zhí)行的UPV產(chǎn)生過程的另一實例的流程圖;附圖24所示為在附圖23中所示的UPV產(chǎn)生過程中的上下文相關(guān)頁面獲取過程的實例的流程圖;附圖25所示為在附圖23中所示的UPV產(chǎn)生過程之后執(zhí)行的內(nèi)容推薦過程的實例的流程圖;附圖26所示為根據(jù)本發(fā)明的另一實施例信息處理設(shè)備的功能性方塊圖;附圖27所示為通過在附圖26中所示的信息處理設(shè)備執(zhí)行的在附圖3中所示的UPV產(chǎn)生過程中近似矩陣(空間)產(chǎn)生過程的實例的流程圖;附圖28所示為通過在附圖26中所示的信息處理設(shè)備執(zhí)行的在附圖13中所示的內(nèi)容推薦過程中的CUPV設(shè)置過程的實例的流程圖;附圖29所示為通過在附圖26中所示的信息處理設(shè)備執(zhí)行的在附圖13中所示的內(nèi)容推薦過程中的內(nèi)容推薦計算過程的實例的流程圖;附圖30所示為根據(jù)本發(fā)明的另一實施例的信息處理設(shè)備的功能性方塊圖;附圖31所示為通過在附圖30中所示的信息處理設(shè)備執(zhí)行的UPV產(chǎn)生過程的實例的流程圖;附圖32所示為在附圖31中所示的UPV產(chǎn)生過程中的UP類型產(chǎn)生過程的詳細流程的實例的流程圖;附圖33所示為通過在附圖30中所示的信息處理設(shè)備執(zhí)行的在附圖13中所示的內(nèi)容推薦過程中的內(nèi)容推薦計算過程的實例的流程圖;附圖34所示為根據(jù)本發(fā)明的實施例的信息處理系統(tǒng)的方塊圖;附圖35所示為根據(jù)本發(fā)明的實施例的信息處理設(shè)備的硬件結(jié)構(gòu)的實例的方塊圖。
具體實施例方式
在描述本發(fā)明的優(yōu)選實施例之前,描述在優(yōu)選實施例中步驟/部件的特定實例和在各個權(quán)利要求中的步驟/部件之間的對應(yīng)關(guān)系。注意,隨后的描述的目的是要表明對應(yīng)于各個權(quán)利要求的特定的實例描述在優(yōu)選實施例中,由此隨后的描述的目的并不是將各個權(quán)利要求的特定實例限制到在下文對應(yīng)關(guān)系的描述中的實施例中。這就是說,在優(yōu)選實施例中描述過但沒有在下文對應(yīng)關(guān)系的描述中描述的部件/步驟可以是對應(yīng)于特定的權(quán)利要求的部件/步驟的部件/步驟。相反,在下文的對應(yīng)關(guān)系的描述中描述的部件/步驟的具體實例可以對應(yīng)于不同于在下文的對應(yīng)關(guān)系的描述中描述的部件/步驟的權(quán)利要求的部件/步驟。
還要注意,從下文的對應(yīng)關(guān)系的描述中不應(yīng)該理解在優(yōu)選實施例中描述的所有的特定的實例都描述在權(quán)利要求中。換句話說,下文的對應(yīng)關(guān)系的描述并不否定這樣的可能性可能存在對應(yīng)于在優(yōu)選實施例中描述過但沒有包括在當前的權(quán)利要求中的特定的實例的權(quán)利要求,也就是說,下文的對應(yīng)關(guān)系的描述并不排除這樣的可能性通過分案或修改申請?zhí)峤粚淼臋?quán)利要求。
現(xiàn)在描述對應(yīng)關(guān)系。在一方面,本發(fā)明提供一種信息處理設(shè)備(例如在附圖1、18或26中所示的信息處理設(shè)備(在下文的對應(yīng)關(guān)系的描述中,假設(shè)在附圖1中所示的信息處理設(shè)備對應(yīng)于在這方面的信息處理設(shè)備,除非另外描述),包括修改裝置(例如在附圖1中所示的特征矢量(CCV)發(fā)生器21和矩陣計算器(空間發(fā)生器)22)),用于獲取每個包括N條單個信息的M個信息組(例如在附圖5中所示的總共16條內(nèi)容元信息、上下文信息A和上下文信息B),并至少部分地修改M個信息組中每個的N條單個信息(例如基于在附圖5中所示的信息產(chǎn)生的矩陣D(CCM)(附圖7)被轉(zhuǎn)換為在附圖11中所示的矩陣Dk(CCM*))以便突出在N條單個信息中的相關(guān)性(例如突出在字“幼兒園”和字“孩子”之間的相關(guān)性或在附圖5中所示的內(nèi)容元信息和上下文信息A之間的相關(guān)性),這里N是等于或大于2的整數(shù),M是等于大于1的整數(shù),產(chǎn)生裝置(例如,在附圖1中所示的用戶喜好矢量(UPV)發(fā)生器23),用于產(chǎn)生在相似性計算中用作參考的的參考信息組(例如用戶喜好矢量UPV*),該參考信息組包括基于M個信息組(例如在附圖11中所示的矩陣Dk(CCM*)的列(特征矢量)CCV*1至CCV*7)產(chǎn)生的N條單個信息,該M個信息組中每個包括通過修改裝置修改的N條單個信息;和相似性計算裝置(例如在附圖1中所示的匹配單元31或匹配計算器31),用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于通過產(chǎn)生裝置形成的參考信息組的相似性。
在這個信息處理設(shè)備中,通過修改裝置獲取的M個信息組中的每個的N條單個信息可以包括指示特定的內(nèi)容或特定的內(nèi)容的一部分或指示該內(nèi)容的屬性的至少一條或多條內(nèi)容元信息(實例在附圖5中示出,其中內(nèi)容元信息是字,比如在作為內(nèi)容給定的電子郵件消息中出現(xiàn)的“幼兒園”),并且也包括指示用戶使用內(nèi)容的內(nèi)部或外部狀態(tài)的至少一條或多條上下文信息(在電子郵件消息作為內(nèi)容給定的實例中,外部狀態(tài)的實例是用戶讀取電子郵件的空間位置(在附圖5中的上下文信息A),內(nèi)部狀態(tài)的實例是用戶讀取電子郵件的情緒狀態(tài)(在附圖5中的上下文信息B))。
在這種信息處理設(shè)備中,上下文信息可以包括通過用戶或通過設(shè)置在用戶的附近的傳感器(例如,在附圖1中的傳感器42)獲取的值或它的歸一化值。
在這種信息處理設(shè)備中,修改裝置可以包括矢量化裝置(例如在附圖1中所示的特征矢量(CCV)發(fā)生器21),用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,以及形成其元素通過分配給各個N條單個信息(例如在附圖5中所示的矢量CCV1至CCV7)的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,以及矩陣產(chǎn)生裝置(例如在附圖1中所示的矩陣計算器(空間發(fā)生器)22),用于在通過矢量化裝置產(chǎn)生M個特征矢量時,該矩陣產(chǎn)生裝置用于產(chǎn)生具有N行和M列的第一矩陣(如在附圖7中所示的矩陣D(CCM))以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作(例如奇異值分解和維數(shù)降低)以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分地修改的第二矩陣(例如在附圖11中所示的矩陣Dk(CCM*))以便突出在M列的每列中N行元素的相關(guān)性,其中產(chǎn)生裝置基于通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的M列產(chǎn)生包括N個元素的參考矢量(例如用戶喜好矢量UPV*)作為參考信息組,以及相似性計算裝置可以從比較信息組中產(chǎn)生包括N個元素的比較矢量(例如與新內(nèi)容關(guān)聯(lián)的特征矢量CCV)并計算在比較矢量和由產(chǎn)生裝置產(chǎn)生的參考矢量之間的相似性。
在這種信息處理設(shè)備中,相似性計算裝置可以計算通過如下過程計算相似性獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素通過分配給N條單個信息的權(quán)重值給定的比較矢量(例如,與新內(nèi)容關(guān)聯(lián)的特征矢量CCV),以及計算在比較矢量和參考矢量之間相似性,以及信息處理設(shè)備進一步可以包括提供裝置(例如,在附圖1中所示的推薦器9),如果通過相似性計算裝置計算的相似性等于或高于閾值則該提供裝置將新內(nèi)容作為推薦內(nèi)容提供給用戶。
在這種信息處理設(shè)備中,矩陣產(chǎn)生裝置可以通過如下過程產(chǎn)生第二矩陣將第一矩陣分解(例如,根據(jù)公式(1))為具有N行和N列的第一分量矩陣((例如,在附圖8中所示的分量矩陣U))、具有N行和M列的第二分量矩陣(例如,在附圖9中所示的分量矩陣∑)和具有M行和M列的第三分量矩陣的轉(zhuǎn)置陣(例如在附圖10中所示的分量矩陣V)的乘積,從第一分量矩陣中產(chǎn)生具有N行和K列的第四分量矩陣(例如在附圖8中所示的分量矩陣Uk)(這里K是小于第一矩陣的秩的整數(shù)),從第二分量矩陣中產(chǎn)生具有K行和K列的第五分量矩陣(例如在附圖9中所示的分量矩陣∑k),從第三分量矩陣中產(chǎn)生具有M行和K列的第六分量矩陣(在附圖10中所示的分量矩陣Vk),以及產(chǎn)生通過第四分量矩陣、第五分量矩陣和第六分量矩陣的轉(zhuǎn)置陣的乘積(例如公式(2)的右手側(cè))給定第二矩陣(例如在附圖11中所示的矩陣Dk(CCM*))。
在這種信息處理設(shè)備(例如在附圖18中所示的信息處理設(shè)備)中,相似性計算裝置(例如在附圖18中所示的投影匹配單元101)可以通過如下過程計算相似性獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,通過將比較矢量和參考矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將比較矢量和參考矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算在具有減小到K的維數(shù)的比較矢量和具有減小到K的維數(shù)的參考矢量之間的相似性,其中信息處理設(shè)備進一步可以包括提供裝置(例如在附圖18中所示的推薦器9),如果通過相似性計算裝置計算的相似性等于或高于閾值,則提供裝置將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
在這種信息處理設(shè)備(例如,在附圖26中所示信息處理設(shè)備)中,在每次產(chǎn)生特征矢量時,矢量化裝置(例如在附圖26中所示的特征矢量(CCV)發(fā)生器211)將產(chǎn)生的特征矢量分類為指示用戶的肯定喜好因素的肯定喜好特征矢量或者指示用戶的否定喜好因素的否定喜好特征矢量。
在這種信息處理設(shè)備(例如,在附圖26中所示信息處理設(shè)備)中,矩陣產(chǎn)生裝置(例如在附圖26中所示的矩陣計算器(特定喜好空間發(fā)生器))使用由矢量化裝置產(chǎn)生的M個肯定喜好特征矢量產(chǎn)生第二矩陣。
本信息處理設(shè)備(例如,在附圖26中所示信息處理設(shè)備)可以進一步包括通過使用矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的列作為訓練數(shù)據(jù)通過學習分類用產(chǎn)生分類器(例如在附圖26中所示的SVM模型存儲單元203)的學習裝置(例如在附圖26中所示的SVM分類學習單元221)和分類裝置(例如在附圖26中所示的SVM分類器231),該分類裝置用于通過如下過程進行分類獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素通過分配給新內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,以及使用由學習裝置產(chǎn)生的分類器對與新內(nèi)容關(guān)聯(lián)的特征矢量分類為肯定喜好特征矢量(在本說明書中,也表示為“肯定地分類”)或否定喜好特征矢量(在本說明書中,也表示為“否定地分類”)。
本信息處理設(shè)備(例如在附圖26中所示的信息處理設(shè)備)進一步可以包括登記裝置(例如在附圖26中所示的語法字典發(fā)生器7),該登記裝置用于選擇通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的列的一個或多個特定的元素并在用戶的個人字典中登記識別每個所選擇的元素的字作為用戶感興趣的字或用戶不感興趣的字。
在本信息處理設(shè)備(例如在附圖26中所示的信息處理設(shè)備)中,相似性計算裝置(例如子附圖26中所示的匹配單元204)可以通過如下過程計算相似性獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和第一參考矢量之間的第一相似性和在比較矢量和第二參考矢量之間的第二相似性,其中該信息處理設(shè)備進一步可以包括提供裝置(例如在附圖26中所示的推薦器9),該提供裝置用于基于通過相似性計算裝置計算的第一相似性和第二相似性確定新內(nèi)容是否適合作為要推薦的內(nèi)容并且如果確定新內(nèi)容是適合的則將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
在一方面中,本發(fā)明提供一種信息處理方法(例如在附圖1、28或26中所示的信息處理設(shè)備的信息處理方法(在各個描述中,假設(shè)信息處理方法用于在附圖1中的信息處理設(shè)備,除非另外描述),該信息處理方法包括修改步驟(例如CCV產(chǎn)生過程(在附圖3中所示的步驟S1(其詳細描述在附圖4中示出)),用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù),近似矩陣(空間)產(chǎn)生步驟(在附圖3中所示的步驟S2(其詳細描述在附圖6中示出)),產(chǎn)生步驟(例如CUPV產(chǎn)生過程(在附圖3中所示的步驟S6(其詳細描述在附圖12中示出)),用于產(chǎn)生在相似性計算中用作參考的參考信息組,該參考信息組包括基于每個包括在修改步驟中修改的N條單個信息的M個信息組產(chǎn)生的N條單個信息,相似性計算步驟(例如,在附圖13中所示的內(nèi)容推薦過程(其詳細描述在附圖14或17中示出)),用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于在產(chǎn)生步驟中產(chǎn)生的參考信息組的相似性。
在一方面中,本發(fā)明提供一種計算機執(zhí)行的程序,包括修改步驟(例如CCV產(chǎn)生過程(在附圖3中所示的步驟S1(其詳細描述在附圖4中示出)),用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù),近似矩陣(空間)產(chǎn)生步驟(在附圖3中所示的步驟S2(其詳細描述在附圖6中示出)),產(chǎn)生步驟(例如CUPV產(chǎn)生過程(在附圖3中所示的步驟S6(其詳細描述在附圖12中示出)),用于從M個信息組中產(chǎn)生在相似性計算中用作參考的包括N條元素的參考信息組,該M個信息組每個包括在修改步驟中修改的N條單個信息,以及相似性計算步驟(例如,在附圖13中所示的內(nèi)容推薦過程(其詳細描述在附圖14或17中示出)),用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于在產(chǎn)生步驟中產(chǎn)生的參考信息組的相似性。
在一方面中,本發(fā)明提供一種信息處理設(shè)備(例如根據(jù)第三實施例的信息處理設(shè)備具有如在附圖1中所示的結(jié)構(gòu),即,執(zhí)行在附圖23至25中所示的處理的信息處理設(shè)備),該信息處理設(shè)備包括矢量化裝置(例如在附圖1中所示的特征矢量(CCV)發(fā)生器21),用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生裝置(例如在附圖1中所示的矩陣計算器(空間發(fā)生器)22),用于在通過矢量化裝置形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,參考矢量產(chǎn)生裝置(例如在附圖1中所示的用戶喜好矢量(UPV)發(fā)生器23),用于從通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,候選內(nèi)容獲取裝置(例如在附圖1中所示的相關(guān)信息獲取單元8),用于在每次通過參考矢量產(chǎn)生裝置形成參考矢量時,基于參考矢量獲取要推薦給用戶的內(nèi)容的候選內(nèi)容,相似性計算裝置(在附圖1中的匹配單元3或匹配計算器31),用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和由參考矢量產(chǎn)生裝置形成的一個或多個參考矢量之間的相似性,提供裝置(例如在附圖1中所示的推薦器9),用于從通過候選內(nèi)容獲取裝置獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
在一方面中,本發(fā)明提供一種信息處理方法(例如對應(yīng)于在附圖23至25中所示的過程的信息處理方法),該信息處理方法包括矢量化步驟(例如在附圖23中所示的步驟S301中的過程),用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生步驟(例如在附圖23中所示的步驟S302中的過程),用于在通過矢量化步驟形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,參考矢量產(chǎn)生步驟(例如在附圖23中所示的步驟S303),用于從通過矩陣產(chǎn)生步驟形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,候選內(nèi)容獲取步驟(例如在附圖23中所示的步驟S304(其細節(jié)在附圖24中示出)),用于在每次通過參考矢量產(chǎn)生步驟形成參考矢量時基于參考矢量獲取要推薦給用戶的內(nèi)容的候選內(nèi)容,相似性計算步驟(例如在附圖25中所示的步驟S341),用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和在參考矢量產(chǎn)生步驟中形成的一個或多個參考矢量之間的相似性,提供步驟(例如在附圖25中所示的步驟S342),用于從在候選內(nèi)容獲取步驟中獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
在一方面中,本發(fā)明提供一種計算機(例如在附圖35中所示的CPU 501)執(zhí)行的程序,該程序包括矢量化步驟(例如在附圖23中所示的步驟S301中的過程),用于在每次用戶使用內(nèi)容時獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生步驟(例如在附圖23中所示的步驟S302中的過程),用于在通過矢量化步驟形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,參考矢量產(chǎn)生步驟(例如在附圖23中所示的步驟S303),用于從通過矩陣產(chǎn)生步驟形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,候選內(nèi)容獲取步驟(例如在附圖23中所示的步驟S304(其細節(jié)在附圖24中示出)),用于在每次通過參考矢量產(chǎn)生步驟形成參考矢量時基于參考矢量獲取要推薦給用戶的內(nèi)容的候選內(nèi)容,相似性計算步驟(例如在附圖25中所示的步驟S341),用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算在比較矢量和在參考矢量產(chǎn)生步驟中形成的一個或多個參考矢量之間的相似性,提供步驟(例如在附圖25中所示的步驟S342),用于從在候選內(nèi)容獲取步驟中獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
在一方面中,本發(fā)明提供一種信息處理設(shè)備(例如在附圖30中所示的信息處理設(shè)備),該信息處理設(shè)備包括矢量化裝置(例如在附圖30中所示的特征矢量(CCV)發(fā)生器211),用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生裝置(例如在附圖30中所示的矩陣計算器(特定喜好空間發(fā)生器)212),用于在通過矢量化裝置形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,類型設(shè)置裝置(例如在附圖30中所示的SVM分類學習單元(UP類型發(fā)生器)321)計算通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
在這種信息處理設(shè)備中,該類型設(shè)置裝置可以通過使用屬于該類型的列作為訓練數(shù)據(jù)通過學習每種類型的類別形成分類器。本信息處理設(shè)備進一步可以包括分類裝置(例如在附圖30中所示的類型確定單元304或SVM分類器331),該分類裝置用于通過如下方式進行分類獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過分配給新內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,以及使用通過類型設(shè)置裝置形成的分類器將與新內(nèi)容關(guān)聯(lián)的特征矢量分類作為由類型設(shè)置裝置設(shè)定的類型中的一種類型。
在一方面中,本發(fā)明提供一種信息處理方法(例如對應(yīng)于在附圖31至33中所示的過程的信息處理方法),該信息處理方法包括矢量化步驟(例如在附圖31中所示的步驟S501中的過程),用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生步驟(例如在附圖31中所示的步驟S502中的過程),用于在矢量化步驟中形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,類型設(shè)置步驟(例如在附圖31中所示的步驟S504(其細節(jié)將在附圖32中示出)),用于計算在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
在一方面中,本發(fā)明提供一種由計算機(例如在附圖35中的CPU501)執(zhí)行的程序,該程序包括矢量化步驟(例如在附圖31中所示的步驟S501中的過程),用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生步驟(例如在附圖31中所示的步驟S502中的過程),用于在矢量化步驟中形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,類型設(shè)置步驟(例如在附圖31中所示的步驟S504(其細節(jié)將在附圖32中示出)),用于計算在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
在一方面中,本發(fā)明提供一種包括服務(wù)器(例如在附圖34中所示的服務(wù)器401)和由用戶使用的客戶(例如在附圖34中所示的客戶403)的信息處理系統(tǒng)(例如在附圖34中所示的信息處理系統(tǒng)),該信息處理系統(tǒng)包括矢量化裝置(例如在附圖34中所示的服務(wù)器401的空間/UPV發(fā)生器2的一部分,該部分對應(yīng)于在附圖1中所示的特征矢量(CCV)發(fā)生器21),用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生裝置(例如在附圖34中所示的服務(wù)器401的空間/UPV發(fā)生器2的一部分,該部分對應(yīng)于在附圖1中所示的矩陣計算器(空間發(fā)生器)22),用于在通過矢量化裝置形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,參考矢量產(chǎn)生裝置(在附圖34中所示的服務(wù)器401的空間/UPV發(fā)生器2的一部分,對應(yīng)于用戶喜好矢量(UPV)發(fā)生器23),用于從通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,相似性計算裝置(例如在附圖34中所示的客戶403的匹配單元3),用于如下地計算相似性獲取包括N條單個信息的新信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,以及計算在比較矢量和由參考矢量產(chǎn)生裝置形成的參考矢量之間的相似性,其中在矢量化裝置、矩陣產(chǎn)生裝置、參考矢量產(chǎn)生裝置和相似性計算裝置中,至少矩陣產(chǎn)生裝置包括在服務(wù)器中。
在一方面中,本發(fā)明提供一種用于包括服務(wù)器(例如在附圖34中所示的服務(wù)器401)和由用戶使用的客戶(例如在附圖34中所示的客戶403)的信息處理系統(tǒng)的信息處理方法,該信息處理方法包括矢量化步驟(例如在附圖3中所示的步驟S1的過程),用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量,矩陣產(chǎn)生步驟(例如在附圖3中所示的步驟S2中的過程),用于在通過矢量化步驟形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性,參考矢量產(chǎn)生步驟(例如在附圖3中所示的步驟S6),用于從通過矩陣產(chǎn)生步驟形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量,以及相似性計算步驟(例如在附圖13中所示的內(nèi)容推薦過程),用于通過如下的子步驟計算相似性獲取包括N條單個信息的新信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,以及計算在比較矢量和由參考矢量產(chǎn)生步驟形成的參考矢量之間的相似性,其中在矢量化步驟、矩陣產(chǎn)生步驟、參考矢量產(chǎn)生步驟和相似性計算步驟中,至少矩陣產(chǎn)生步驟由服務(wù)器執(zhí)行。
下文結(jié)合附圖參考具體實施例進一步詳細地描述本發(fā)明。
雖然可以以各種方式實施本發(fā)明,但是下文仍然通過舉例(非限制性)參考五個具體的實施例描述本發(fā)明。在描述了這五個具體實施例(第一至第五實施例)之后,討論其它實施例的可能性。
第一實施例實行,參考附圖1至17描述本發(fā)明的第一實施例。
附圖1所示為根據(jù)本發(fā)明的第一實施例的信息處理設(shè)備。
如附圖1所示,根據(jù)第一實施例的信息處理設(shè)備包括元信息獲取單元1、空間/UPV發(fā)生器2(UPV是用戶喜好矢量的另一名稱)、匹配單元3、CCV存儲單元4(CCV是特征矢量的另一名稱)、分量矩陣存儲單元5、UPV存儲單元6、語法字典發(fā)生器7、相關(guān)信息獲取單元8和推薦器9。
輸入單元41和傳感器42可以設(shè)置在信息處理設(shè)備的里面的部件或者可以設(shè)置在外面并連接到信息處理設(shè)備的外部裝置。
對上述的部件(元信息獲取單元1至推薦器9)的特定形式?jīng)]有限制。具體地,元信息獲取單元1、空間/UPV發(fā)生器2、匹配單元3、語法字典發(fā)生器7、相關(guān)信息獲取單元8和推薦器9可以通過軟件、硬件或軟件和硬件的混合實施。
元信息獲取單元1包括文本獲取單元11、文本分析器12、元數(shù)據(jù)獲取單元13和上下文獲取單元14。
如附圖1所示,內(nèi)容數(shù)據(jù)和EPG數(shù)據(jù)輸入到元信息獲取單元1。對輸入到元信息獲取單元1中的內(nèi)容數(shù)據(jù)沒有特定的限制,只要內(nèi)容數(shù)據(jù)已經(jīng)或?qū)⒁挥脩羰褂?收視或欣賞)即可。注意,術(shù)語“內(nèi)容”在此用于描述各種各樣的內(nèi)容,不僅包括電視節(jié)目、電影、照片、音樂內(nèi)容、圖像(運動圖像、靜態(tài)圖像、音頻內(nèi)容或這些組合),而且還包括文件、物品(物理目標或產(chǎn)品)和會話,它們可以是用戶可使用的軟件或硬件的形式。在實際中,在內(nèi)容以物理目標(硬件)的形式給定時,產(chǎn)生指示物理目標的運動/靜態(tài)圖像的數(shù)據(jù)并將所得的數(shù)據(jù)用作內(nèi)容數(shù)據(jù)。
文本獲取單元11從所輸送的內(nèi)容數(shù)據(jù)或EPG數(shù)據(jù)中抽取文本數(shù)據(jù)。例如,在通過電子郵件瀏覽器(未示)接收電子郵件時,文本獲取單元11抽取包括在所接收的電子郵件中的文本數(shù)據(jù)。通過文本獲取單元11獲取的文本數(shù)據(jù)輸送到文本分析器12。
文本分析器12將所接收的文本數(shù)據(jù)分成多個段(例如以文件或段落為單位)。文本分析器12分析每段的描述(文字)并將每段的文字分解為字(例如,如附圖5中所示的“幼兒園”或“小孩”)。所得的字數(shù)據(jù)輸送到空間/UPV發(fā)生器2或匹配單元3。
元數(shù)據(jù)獲取單元13分析所輸送的內(nèi)容數(shù)據(jù)或EPG數(shù)據(jù)的除了文字之外的部分并將該數(shù)據(jù)分解為字并形成新的字數(shù)據(jù)。所得的字數(shù)據(jù)輸送到空間/UPV發(fā)生器2或匹配單元3。元數(shù)據(jù)獲取單元13也抽取在EPG數(shù)據(jù)中存在的字數(shù)據(jù),并直接將所抽取的字數(shù)據(jù)輸送給空間/UPV發(fā)生器2或匹配單元3。
此后,為區(qū)別于從上下文獲取單元14中輸出的數(shù)據(jù),將從文本分析器12或元數(shù)據(jù)獲取單元13中輸出的字數(shù)據(jù)稱為內(nèi)容元信息。注意,在本說明書中,如前文所描述,內(nèi)容不僅可以是通常的內(nèi)容,而且還可以是私人文件(比如郵件文件)等。即,在本描述中,術(shù)語“內(nèi)容元信息”用于描述不僅通常的內(nèi)容比如電視節(jié)目的元信息,而且還描述前文定義的各種各樣的內(nèi)容(廣義上的內(nèi)容)或這種廣義內(nèi)容的一部分或以表示內(nèi)容的屬性的字(數(shù)字也被看作字)的形式的信息的元信息。
上述的常規(guī)技術(shù)的問題主要發(fā)生在這樣的情況在推薦滿足用戶的喜好的內(nèi)容時,如果內(nèi)容與用戶所處的當前上下文不匹配則所推薦的內(nèi)容被拒絕。即,如果簡單地基于與用戶所經(jīng)歷過的內(nèi)容關(guān)聯(lián)的內(nèi)容元信息推薦內(nèi)容,則推薦的內(nèi)容不一定與用戶所在當前上下文匹配。
注意,在本說明書中,術(shù)語“上下文”用于描述用戶的各種各樣的內(nèi)外狀態(tài)。用戶的內(nèi)部狀態(tài)的實例包括用戶的身體條件和情緒狀態(tài)(感情或精神狀態(tài))。用戶的外部狀態(tài)的實例包括用戶的空間或時間位置(“時間位置”指當前的時間)和用戶所位于的空間或時間環(huán)境(或空間和時間環(huán)境)。
在常規(guī)的技術(shù)中,在推薦內(nèi)容時不考慮指示用戶的上下文的信息(下文簡單地稱為上下文信息),很少有使用外部上下文信息比如指示時間或位置的信息或內(nèi)部上下文信息比如指示用戶手動輸入的感情的信息的例外情況。即使在這種少有的例外中,在選擇要推薦的內(nèi)容的過程中也非常有限地考慮上下文信息。
即,在常規(guī)的技術(shù)中,內(nèi)容元信息和上下文信息分別處理,并且要求服務(wù)提供商應(yīng)該事先建立鏈接內(nèi)容元信息(對應(yīng)于內(nèi)容元信息的候選內(nèi)容)和上下文(情緒狀態(tài))的規(guī)則。在上下文信息和內(nèi)容元信息分別處理的常規(guī)的內(nèi)容推薦技術(shù)中,所推薦的內(nèi)容并不總是與變化的上下文匹配,因此所推薦的內(nèi)容經(jīng)常被用戶拒絕。即,常規(guī)的內(nèi)容推薦技術(shù)不能解決上文描述的問題。此外,要求服務(wù)器提供商準備上述的規(guī)則,這給服務(wù)提供商增加了極大的負擔。
在常規(guī)的技術(shù)中,即使在從各種各樣的傳感器中獲得了多條上下文信息的情況下,仍然簡單地將這多條上下文信息根據(jù)預定的規(guī)則解釋,并將其分類為非常少數(shù)量的固定的類別中的一種(即使在例如借助于統(tǒng)計分析事先已經(jīng)執(zhí)行了分類的情況下)。因此,即使在使用多條上下文信息的情況下,仍然存在上述的問題,并且如上文所述還帶來另一新的問題。
在本發(fā)明的第一實施例中,為避免上述的問題,同等地處理上下文信息和內(nèi)容元信息兩者。為此,除了獲取內(nèi)容元信息的方塊(文本獲取單元11、文本分析器12和元數(shù)據(jù)獲取單元13)之外,元信息獲取單元1還包括上下文獲取單元14。
如果上下文獲取單元14通過輸入單元41或傳感器42接收信息,則上下文獲取單元14將所接收的信息根據(jù)需要轉(zhuǎn)換,并將該信息作為上下文信息輸送給空間/UPV發(fā)生器2或匹配單元3。
輸入單元41包括鍵盤、鼠標和輸入接口。用戶可以通過輸入單元41輸入各種各樣的上下文給上下文獲取單元14。
相應(yīng)地,上下文獲取單元14分析通過輸入單元41輸入的上下文并將它轉(zhuǎn)換為字。所得的字數(shù)據(jù)作為上下文信息輸送給空間/UPV發(fā)生器2或匹配單元3。
更具體地說,例如,信息處理設(shè)備在顯示器(比如在附圖34中所示的顯示器424,雖然在附圖1中沒有示出)上顯示選擇-輸入用戶接口屏比如在附圖2中所顯示的顯示屏。通過操作輸入單元41,用戶在附圖2中所示的“上下文選擇”窗中設(shè)置的每個方框中選擇指示用戶的當前上下文的字。在各個方框中選擇的字輸入到上下文獲取單元14。
更具體地說,在附圖2中所示的用戶接口顯示屏允許用戶根據(jù)“位置”(用戶使用的內(nèi)容的地方(在附圖2中所示的實例中選擇“公司”))和“場合”(用戶使用內(nèi)容的場合(在附圖2中所示的實例中選擇“工作”))選擇(通過操作輸入單元41)指示用戶的外部上下文的字。
在附圖2所示的實例中,用戶接口顯示屏也允許用戶根據(jù)“精神”狀態(tài)(在用戶使用內(nèi)容時的精神狀態(tài)(在附圖2所示的實例中選擇“新鮮”))、“情緒”狀態(tài)(在用戶使用內(nèi)容時用戶的情緒狀態(tài)(在附圖2所示的實例中選擇“高興”))和“等級”(用戶對該內(nèi)容評估的(在附圖2所示的實例中選擇“重要”))選擇(通過操作輸入單元41)指示用戶的內(nèi)部上下文的字。
在附圖2所示的實例中,如上文所述,數(shù)據(jù)以字的形式輸入到在附圖1中所示的上下文獲取單元14中。上下文獲取單元14直接將輸入字數(shù)據(jù)作為上下文信息輸送到空間/UPV發(fā)生器2或匹配單元3。
輸入單元41用于檢測用戶的外部或內(nèi)部上下文。對傳感器42的類型和數(shù)量沒有特別的限制。在單個傳感器用作傳感器42時,傳感器42不一定是僅檢測一種上下文,而是可以檢測兩種或多種上下文。例如,作為檢測外部上下文的傳感器,檢測用戶的當前位置的GPS(全球定位系統(tǒng))接收器、檢測當前的時間的時鐘或檢測在用戶附近存在的人或物體的無線通信裝置都可以使用。作為檢測內(nèi)部上下文的傳感器,例如,可以使用檢測脈搏、呼吸頻率、排汗或瞳孔的開度的傳感器。
在從傳感器42輸入到上下文獲取單元14的信息以數(shù)字數(shù)據(jù)的形式的情況下,上下文獲取單元14將輸入的數(shù)字數(shù)據(jù)作為上下文信息輸送(直接或在根據(jù)預定的規(guī)則轉(zhuǎn)換之后)到空間/UPV發(fā)生器2或匹配單元3。在另一方面,在從傳感器42輸入到上下文獲取單元14的信息不是數(shù)字數(shù)據(jù)的形式的情況下,上下文獲取單元14分析該信息并將它轉(zhuǎn)換為字(將數(shù)字值看作字)。所得的字數(shù)據(jù)作為上下文信息輸送給空間/UPV發(fā)生器2或匹配單元3。
現(xiàn)在,下文解釋空間/UPV發(fā)生器2??臻g/UPV發(fā)生器2包括特征矢量(CCV)發(fā)生器21、矩陣計算器(空間發(fā)生器)22和用戶喜好矢量(UPV)發(fā)生器23。
特征矢量(CCV)發(fā)生器21對每個內(nèi)容產(chǎn)生其元素由一條或多條內(nèi)容元信息和從元信息獲取單元1輸送的一條或多條上下文信息給定的矢量。通過特征矢量(CCV)發(fā)生器21產(chǎn)生的這種矢量指示用戶的喜好的特征,即指示用戶經(jīng)歷的內(nèi)容的特征和用戶經(jīng)歷的內(nèi)容的上下文的特征。因此,在下文中,通過特征矢量(CCV)發(fā)生器21產(chǎn)生的這種矢量被稱為特征矢量CCV。
根據(jù)這種情況,特征矢量CCV由匹配單元3產(chǎn)生,如下文所描述。
在本實施例中,通過舉例而非限制,特征矢量CCV具有預定數(shù)量的維數(shù)(元素的數(shù)量),每個元素對應(yīng)于預定的特定類型的信息(內(nèi)容元信息或上下文信息)。即,特征矢量CCV的元素的數(shù)量固定,并且在各個元素中描述的信息項和項目的順序固定。在下文中,這種形式的特征矢量CCV被稱為標準形式的特征矢量。下文參考附圖5描述特征矢量CCV的具體實例。
更具體地說,在特征矢量CCV的形成過程中,根據(jù)字出現(xiàn)的頻率或根據(jù)加權(quán)方法比如tf方法,特征矢量(CCV)發(fā)生器21將權(quán)重分配給從元信息獲取單元1輸送的每條內(nèi)容元信息和上下文信息(以字或數(shù)字值的形式)。所分配的權(quán)重代入特征矢量CCV的對應(yīng)于的元素中,由此獲得了特征矢量CCV。注意,在從元信息獲取單元1輸送的特定的內(nèi)容的內(nèi)容信息和上下文信息(可以以數(shù)字值的形式的字數(shù)據(jù))不包括對應(yīng)于特征矢量CCV的特定的元素的信息時,即在沒有權(quán)重代入特征矢量CCV的該元素中時,將“0”代入該元素中。
在這種情況下,基于字出現(xiàn)的頻率執(zhí)行加權(quán),出現(xiàn)的頻率可以直接用作權(quán)重值,或可以使用根據(jù)特定的規(guī)則(比如歸一化)轉(zhuǎn)換出現(xiàn)頻率獲得的值。
在從傳感器42(環(huán)境傳感器、身體傳感器或這些傳感器的組合)輸送的上下文信息為值(實數(shù))的形式的情況下,將該值直接用作權(quán)重值或可以使用根據(jù)特定的規(guī)則(比如歸一化)轉(zhuǎn)換所輸送的值獲得的值。在以字數(shù)據(jù)的形式的上下文信息從輸入單元41輸送的情況下,通過根據(jù)第一規(guī)則對字數(shù)據(jù)加權(quán)獲得的值可以用作權(quán)重值或可以使用根據(jù)第二規(guī)則(比如歸一化)轉(zhuǎn)換第一值獲得的第二值。
分配給內(nèi)容元信息的權(quán)重值和分配給上下文信息的權(quán)重值可以乘以可變系數(shù),并將所得的值用作最后的權(quán)重值。在這種情況下,通過對應(yīng)于應(yīng)該被調(diào)整的權(quán)重值修改一個或多個可變系數(shù)可以簡單地調(diào)節(jié)權(quán)重值(入在附圖4中的步驟S26,將在下文中描述)。
如上文所述,在每次用戶使用內(nèi)容時,包括N條單個信息(內(nèi)容元信息或上下文信息)的信息從元信息獲取單元1輸送到特征矢量(CCV)發(fā)生器21,其中N是為該內(nèi)容設(shè)定的等于或大于2的整數(shù)。然而,對于特定的內(nèi)容,如果某些N條單個信息為空(因為單個信息不通過元信息獲取單元1獲取),則該單個信息被看作“0”。響應(yīng)接收信息組,特征矢量(CCV)發(fā)生器21將權(quán)重(值)分配給所輸送的信息組的各個N條單個信息并產(chǎn)生其元素由分配給各個N條單個信息的權(quán)重值給定的特征矢量CCV)。
如上文所述,根據(jù)特定的內(nèi)容和根據(jù)使用該內(nèi)容的上下文產(chǎn)生特征矢量CCV,并將所得的特征矢量CCV存儲在CCV存儲單元4中。即,在每次用戶使用內(nèi)容時,該內(nèi)容的特征矢量CCV通過特征矢量(CCV)發(fā)生器21產(chǎn)生并存儲在CCV存儲單元4中。
注意,在以上文所述的方式產(chǎn)生的并存儲在CCV存儲單元4中的特征矢量CCV中,所有的上下文信息和所有的內(nèi)容元信息中的每個都作為元素同等地處理。特征矢量CCV的上下文信息的條數(shù)(嚴格地說,特征矢量CCV的元素的數(shù)量,該元素的數(shù)量對應(yīng)于上下文信息)并不限于1,而是可以是2或更大。如下文將要描述,與基于常規(guī)的推薦方法推薦的內(nèi)容相比,基于以上述的方式產(chǎn)生的特征矢量CCV推薦的內(nèi)容比具有該內(nèi)容被用戶拒絕的更小的可能性。
如果以上述的方式產(chǎn)生的并累積在CCV存儲單元4中的特征矢量CCV的數(shù)量變得等于M(等于或大于2的整數(shù)),則矩陣計算器(空間發(fā)生器)22產(chǎn)生其列由M個特征矢量CCV給定的N×M矩陣。這樣產(chǎn)生的矩陣可以被看作特征矢量CCV組,即指示用戶喜歡(欣賞)的內(nèi)容和/或指示該內(nèi)容的屬性的內(nèi)容元信息組和指示用戶經(jīng)歷該內(nèi)容的上下文的上下文信息。為與其它的矩陣區(qū)別,通過矩陣計算器(空間發(fā)生器)22以這種方式產(chǎn)生的矩陣被稱為內(nèi)容-和-上下文矩陣,也可以簡單地稱為矩陣CCM。
矩陣計算器(空間發(fā)生器)22通過奇異值分解和維數(shù)降低(即通過上文所述的LSI方法)將矩陣CCM的各個元素(指示用戶經(jīng)歷的內(nèi)容或該內(nèi)容的屬性的內(nèi)容元信息和用戶經(jīng)歷內(nèi)容的上下文信息)投影到主分量軸上。
作為上述處理(提供減小矩陣CCM的維數(shù))的結(jié)果獲得的矩陣被稱為矩陣CCM的近似矩陣。為方便,矩陣CCM的近似矩陣也簡單地稱為近似矩陣CCM*。投影元素的空間被稱為最佳空間UPS。
更具體地說,在上述的處理中,矩陣計算器(空間發(fā)生器)22通過奇異值分解將N×M矩陣CCM分解為矩陣U、∑和V的乘積以滿足下式(1)。
D(=CCM)=U∑V~ (1)這里D表示矩陣CCM,U表示由左手奇異值矢量給定的N×M分量矩陣,V表示由右手奇異值矢量給定的M×M分量矩陣,∑表示N×M奇異值矩陣,以及V~表示矩陣V的轉(zhuǎn)置陣。
用r表示矩陣CCM的秩(其中r是等于或小于N和M的整數(shù))。分量矩陣∑在它的主對角線上具有r個奇異值,而在任何其它的元素上為0。在分量矩陣U的最左的區(qū)域中的r列(左奇異值矢量)形成了正交基,這些r列以從左到右重要性降低的順序設(shè)置(以使最左的列具有最大的重要性)。因此,使用k(小于r的整數(shù))個左奇異值矢量的特征矢量CCV的表示得到最佳的近似。
因此,矩陣計算器(空間發(fā)生器)22使用在分量矩陣U的最左區(qū)域(左奇異值矢量)中的k列形成具有N行和k列矩陣Uk(比如在附圖8中所示的)。
如下文進一步描述,在給定(N維)特征矢量CCV時,如果將特征矢量CCV從左乘以矩陣Uk的轉(zhuǎn)置陣,獲得減小到k的維數(shù)的近似矩陣矢量。即,通過矩陣Uk的轉(zhuǎn)置陣的乘積,特征矢量CCV投影到k-維最佳空間UPS。即,矩陣計算器(空間發(fā)生器)22通過形成矩陣Uk形成最佳空間UPS。
類似地,矩陣計算器(空間發(fā)生器)22通過使用在分量矩陣V的最左區(qū)域(右奇異值矢量)中的k列形成分量矩陣V的近似矩陣(如在附圖10所示)。即,近似矩陣具有M行和k列,它的k列由分量矩陣V的最左區(qū)域(右奇異值矢量)中的k列給定。下文中,這種近似矩陣由Vk表示。
矩陣計算器(空間發(fā)生器)22也通過抽取分量矩陣∑的最左區(qū)域的k列中的每個第一至第k元素并使用每個具有所抽取的k個元素的這些k列作為矩陣∑k的列形成k×k矩陣∑k(比如在附圖9中所示的矩陣)(即矩陣∑k由在分量矩陣∑的左上區(qū)域中的k×k元素給定)。
矩陣計算器(空間發(fā)生器)22計算公式(2)的右手側(cè)以獲得其秩減小到k的矩陣Dk。
Dk=(CCM*)=Uk∑kVk~ (2)這里Vk~表示分量矩陣Vk的轉(zhuǎn)置陣。
所得的矩陣Dk作為矩陣CCM的近似矩陣CCM*輸送給用戶喜好矢量(UPV)發(fā)生器23。
近似矩陣CCM*(=Dk)的分量矩陣Uk(根據(jù)需要,以及矩陣Vk和/或∑k)輸送給語法字典發(fā)生器7并存儲在分量矩陣存儲單元5中。
在這個第一實施例中,如下文所描述,分量矩陣Uk并不被匹配單元3使用,因此分量矩陣存儲單元5不是根據(jù)第一實施例的信息處理設(shè)備的關(guān)鍵部件。相反,在下文描述的第二實施例中,投影匹配單元101(附圖18)使用分量矩陣Uk,因此分量矩陣存儲單元5是根據(jù)第二實施例的信息處理設(shè)備的關(guān)鍵部件。
用戶喜好矢量(UPV)發(fā)生器23從矩陣計算器(空間發(fā)生器)22輸送的近似矩陣CCM*中(即從M個特征矢量CCV*中(注意,由近似矩陣CCM*的列給定的特征矢量通過特征矢量CCV*表示以區(qū)別于特征矢量CCV))產(chǎn)生標準形式的包括N個元素的矢量。通過用戶喜好矢量(UPV)發(fā)生器23產(chǎn)生的標準形式的矢量用作在通過匹配單元3或推薦器9執(zhí)行內(nèi)容推薦處理時指示用戶的喜好的參考矢量。因此,通過用戶喜好矢量(UPV)發(fā)生器23產(chǎn)生的矢量被稱為用戶喜好矢量UPV*。
在本實施例(第一實施例)中,用戶喜好矢量UPV*基于從矩陣計算器(空間發(fā)生器)22輸送的近似矩陣CCM*產(chǎn)生,因此在UPV后加上后綴*。注意,對產(chǎn)生用戶喜好矢量UPV*的方法沒有特別的限制,只要基于從矩陣計算器(空間發(fā)生器)22輸送的近似矩陣CCM*形成用戶喜好矢量UPV*即可。
例如,近似矩陣CCM*的列(即特征矢量CCV*)可以直接用作用戶喜好矢量UPV*。
可替換地,對于在近似矩陣CCM*的所有列或所選擇的列(特征矢量CCV*)上的每個元素可以進行求和,并且其元素由所計算的和給定的標準的矢量可以用作用戶喜好矢量UPV*。即,通過將近似矩陣CCM*的所有的列或選擇的列(特征矢量CCV*)加在一起獲得的和矢量可以用作用戶喜好矢量UPV*。
在通過將從近似矩陣CCM*的列(特征矢量CCV*)選擇的列加在一起計算和矢量時,對應(yīng)該選擇的列沒有特別的限制。
更具體地說,計算指示在特征矢量CCV*中的上下文信息(分配給上下文信息的權(quán)重值)的特定的元素的相關(guān)性,并選擇具有較高的相關(guān)性的特征矢量CCV*。計算以上述方式選擇的特征矢量的和矢量(通過在特征矢量上的對應(yīng)的元素的和給定每個元素),并將所得的和矢量用作用戶喜好矢量UPV*。
可替換地,計算指示在原始的矩陣CCM(即在原始的特征矢量CCV)中的上下文信息的元素的相關(guān)性(上下文信息的權(quán)重值的相關(guān)性),并選擇具有較高的相關(guān)性的特征矢量CCV。此外,選擇對應(yīng)于所選擇的特征矢量(原始的矩陣CCM的列)的特征矢量CCV*(近似矩陣CCM*的列)并將所選擇的特征矢量CCV*的和矢量(其元素分別由在所選擇的特征矢量CCV*上的對應(yīng)的元素的和給定的矢量)用作用戶喜好矢量UPV*。
在上下文中具有較高的相似性的特征矢量CCV*的和矢量用作用戶喜好矢量UPV*的情況下,所得的用戶喜好矢量UPV*是特定的上下文(或兩個或更多個上下文的組合)的用戶喜好矢量UPV*。在下文中,特定的上下文的這種用戶喜好矢量UPV*被稱為上下文用戶喜好矢量CUPV*以區(qū)別于其它的用戶喜好矢量UPV*。即在本說明書中,上下文用戶喜好矢量CUPV*明確地區(qū)別于由直接使用近似矩陣CCM*的列(特征矢量CCV*)形成的用戶喜好矢量UPV*。
以上述方式形成的用戶喜好矢量UPV*(或上下文用戶喜好矢量CUPV*)輸送給相關(guān)信息獲取單元8。用戶喜好矢量UPV*(或上下文用戶喜好矢量CUPV*)也輸送給UPV存儲單元6并存儲在其中。
現(xiàn)在,解釋匹配單元3。匹配單元3包括匹配計算器31。匹配計算器31通過利用分配給從元信息獲取單元1輸送的每條信息的權(quán)重值作為它的元素形成標準形式的特征矢量CCV。匹配計算器31然后計算這個特征矢量CCV相對于存儲在UPV存儲單元6中的每個用戶喜好矢量UPV*的相似性并將計算結(jié)果輸送給推薦器9。
更具體地說,在推薦器9推薦與用戶所處的當前上下文十分好地匹配的內(nèi)容時,匹配計算器31首先從元信息獲取單元1獲取指示用戶的當前上下文的上下文信息,并形成其元素由上下文信息的各個權(quán)重值給定并且它的對應(yīng)于內(nèi)容元信息的元素都為0的標準形式的特征矢量CCV。匹配計算器31計算這個特征矢量CCV相對于存儲在UPV存儲單元6中的多個上下文用戶喜好矢量CUPV*中的每個的相似性,并運用具有最高的相似性的上下文用戶喜好矢量CUPV*作為與用戶所處的當前上下文最佳地匹配的上下文用戶喜好矢量CUPV*。
通過匹配計算器31選擇作為與用戶所處的當前上下文匹配的上下文用戶喜好矢量UPV*的這種上下文用戶喜好矢量UPV*被稱為特定上下文用戶喜好矢量sCUPV*以區(qū)別于其它的上下文用戶喜好矢量UPV*。
在UPV存儲單元6中沒有存儲上下文用戶喜好矢量CUPV*而是直接存儲近似矩陣CCM*的列(特征矢量CCV*)作為用戶喜好矢量UPV*的情況下,匹配計算器31計算指示用戶所處的當前上下文的特征矢量CCV相對于存儲在UPV存儲單元6中的每個用戶喜好矢量UPV*的相似性。匹配計算器31選擇具有等于或高于閾值的相似性的某些用戶喜好矢量UPV*,形成其元素每個由所選擇的用戶喜好矢量UPV*的對應(yīng)的列的和給定的標準形式的矢量(即,形成所選擇的用戶喜好矢量UPV*的和矢量),并運用所形成的矢量作為用戶所處的當前上下文的上下文用戶喜好矢量CUPV*,即作為特定上下文用戶喜好矢量sCUPV*。
在每次匹配計算器31從元信息獲取單元1接收與要推薦的候選內(nèi)容關(guān)聯(lián)的內(nèi)容元信息時,匹配計算器31形成其元素由上下文信息的各個權(quán)重值給定并且它的對應(yīng)于上下文信息的元素都為0的標準形式的特征矢量CCV。匹配計算器31計算特征矢量CCV相對于特定上下文用戶喜好矢量sCUPV*的相似性并將計算結(jié)果輸送給推薦器9。
響應(yīng)接收的計算結(jié)果,推薦器9選擇對應(yīng)于相對于特定上下文用戶喜好矢量sCUPV*具有最高的相似性的特征矢量CCV的內(nèi)容并將所選擇的內(nèi)容推薦給用戶?;趶钠ヅ溆嬎闫?1輸送的計算結(jié)果(根據(jù)相似性),推薦器9可以選擇對應(yīng)于其相似性等于或高于閾值的特征矢量CCV的一個或多個內(nèi)容,并可以將所選擇的內(nèi)容推薦給用戶。
如上文所述,推薦給用戶的內(nèi)容是那些對應(yīng)于相對特定上下文用戶喜好矢量sCUPV*(與用戶所處的當前上下文匹配的上下文用戶喜好矢量CUPV*)具有最高的相似性的特征矢量CCV。即,在被用戶喜歡的各種內(nèi)容中,將與用戶的當前上下文最佳地匹配的內(nèi)容推薦給用戶。這就減小了推薦的內(nèi)容被用戶拒絕的可能性。
在上述的實例中,在對應(yīng)于要推薦的候選內(nèi)容的特征矢量CCV中,與上下文信息關(guān)聯(lián)的元素都是0。然而,這些元素不一定都是0,而除了0之外的值也可以代入這些元素中。對這些元素的值沒有特別限制。例如,可以使用在另一用戶使用內(nèi)容的特定的上下文中使用的權(quán)重值,或者用戶可以將特定的權(quán)重值分配給預計該內(nèi)容將被用戶使用的上下文。
語法字典發(fā)生器7例如通過使用由空間/UPV發(fā)生器2形成的最佳空間UPS(即通過使用在公式(2)中的近似矩陣CCM*(=Dk)的分量矩陣Uk)給用戶形成語法字典。更具體地說,語法字典發(fā)生器7從使用分量矩陣Uk(根據(jù)公式(2))形成的近似矩陣CCM*(=Dk)的元素中檢測具有等于或大于閾值的值的元素,在語法字典中登記對應(yīng)于所檢測的元素的字作為用戶感興趣的字(例如登記在附圖11中的“幼兒園”)。語法字典發(fā)生器7從近似矩陣CCM*(=Dk)的元素中可以檢測其最大值或平均值小于閾值的元素,并可以將對應(yīng)于所檢測的元素的字作為用戶不感興趣的字(例如在附圖11中可以登記“黨派”或“啤酒”)登記在語法字典中。
相關(guān)信息獲取單元8為從空間/UPV發(fā)生器2輸送的每個用戶喜好矢量UPV*選擇與用戶的喜好相關(guān)的重要的字,并且相關(guān)信息獲取單元8通過站點搜索等獲取與所選擇的重要的字相關(guān)的信息。所獲得的相關(guān)的信息根據(jù)需要輸送給推薦器9。一旦從相關(guān)信息獲取單元8接收到相關(guān)的信息,推薦器9連同推薦的內(nèi)容一起提供相關(guān)的信息以指示推薦該內(nèi)容的原因,或者考慮所輸送的相關(guān)的信息推薦器9確定是否應(yīng)該推薦該內(nèi)容。
現(xiàn)在,參考附圖3的流程圖,下文描述為形成用戶喜好矢量UPV*(基于近似矩陣CCM*)而由信息處理設(shè)備(在附圖1中示出)執(zhí)行的處理(下文中這個過程被稱為UPV產(chǎn)生過程)。
通過舉例,在此假設(shè)用戶接收(讀取)的7個郵件的文件(表示為DOC1至DOC7)作為內(nèi)容處理,而用戶讀取文件DOC1至DOC7的位置(家里或公司)和讀取文件的情緒狀態(tài)(放松、緊張、高興或悲傷狀態(tài))作為上下文處理。
更具體地說,在本實例中,元信息獲取單元1的文本獲取單元11獲取文件DOC1至DOC7,文本分析器12分解這些文件DOC1至DOC7字(名詞)中的每個字比如下面(I)至(VII)中所列的字。此外,上下文獲取單元14獲取在(I)至(II)中的括號中的字作為各個文件DOC1至DOC7的上下文。
(I)幼兒園、小孩、幼兒園、小孩、早退(公司,高興),(II)緊急、通話(公司,緊張),(III)小孩、大海、小孩(家,高興),(IV)黨派,啤酒(公司,放松),(V)緊急、專利(公司,緊張),(VI)幼兒園,幼兒園,小孩,寒冷(家,悲傷),和(VII)寒冷,早退(公司,悲傷)指示上文從(I)至(VII)所列的這些字的數(shù)據(jù)從元信息獲取單元1輸送到空間/UPV發(fā)生器2。
在步驟S1中,空間/UPV發(fā)生器2的特征矢量(CCV)發(fā)生器21產(chǎn)生對應(yīng)于(I)至(VII)的特征矢量CCV(在下文中,分別稱為特征矢量CCV1至CCV7),并將它們存儲在CCV存儲單元4中。
在下文中,通過特征矢量(CCV)發(fā)生器21執(zhí)行的這個過程(在步驟S1中)被稱為CCV產(chǎn)生過程。附圖4示出了根據(jù)第一實施例的CCV產(chǎn)生過程的詳細流程的實例。參考附圖4,下文描述根據(jù)第一實施例的CCV產(chǎn)生過程的細節(jié)。
首先,在步驟S21中,特征矢量(CCV)發(fā)生器21獲取內(nèi)容元信息和上下文信息。更具體地說,在本實例中,特征矢量(CCV)發(fā)生器21獲取在(I)中的“幼兒園”、“小孩”、“幼兒園”、“小孩”和“早退”的數(shù)據(jù)作為文件(內(nèi)容)DOC1的內(nèi)容元信息,并獲取在(I)中的“公司”和“高興”的數(shù)據(jù)作為文件DOC1的內(nèi)容信息。
在步驟S22中,特征矢量(CCV)發(fā)生器21將權(quán)重(數(shù)字值)分配給內(nèi)容元信息和上下文信息。在本實施例中,根據(jù)字出現(xiàn)的頻率進行加權(quán),雖然對加權(quán)的方法沒有特別的限制。例如,在文件DOC1中,在文件DOC1的內(nèi)容元信息中“幼兒園”出現(xiàn)兩次,因此“2”被作為權(quán)重分配給“幼兒園”。類似地,在文件DOC1的內(nèi)容元信息中,“2”被分配給“小孩”,“1”被分配給“早退”。文件DOC1的上下文信息也以字的形式給定,并將權(quán)重以類似的方式分配給內(nèi)容元信息。更具體地說,在本實例中,“1”被分配給“公司”和“高興”兩者。
在步驟S23中,特征矢量(CCV)發(fā)生器21產(chǎn)生其元素由分配給內(nèi)容元信息和上下文信息的權(quán)重值給定。
在本實施例中,以如附圖5中所示的標準矢量的形式表示特征矢量,但對特征矢量CCV的維數(shù)和元素沒有特別限制。在附圖5的具體實施例中,特征矢量CCV作為16-維矢量給定(“幼兒園”、“小孩”、“早退”、“緊急”、“通話”、“大海”、“黨派”、“啤酒”、“專利”、“寒冷”、“家”、“公司”、“放松”、“緊張”、“高興”、“悲傷”)。注意,實際上在特征矢量CCV的16個元素的每個元素中不是代入字而是對應(yīng)的權(quán)重。
更具體地說,在本實例(文件DOC1)中,特征矢量(CCV)發(fā)生器21為文件DOC1產(chǎn)生特征矢量CCV1以使“2”代入對應(yīng)于“幼兒園”的第1元素中,“2”代入對應(yīng)于“小孩”的第2元素中,“1”代入對應(yīng)于“早退”的第3元素中,“1”代入對應(yīng)于“公司”的第12元素中,“1”代入對應(yīng)于悲傷的第16元素中,以及“0”代入對應(yīng)于其它的元素(第4至第11元素和第13至第15元素)中。即,如附圖5所示,文件DOC1的特征矢量CCV1由(2,2,1,0,0,0,0,0,0,0,0,1,0,0,0,1)給定。
在步驟S24中,特征矢量(CCV)發(fā)生器21將在直接在先的步驟S23中產(chǎn)生的特征矢量CCV(在這個具體的實例中,與文件DOC1關(guān)聯(lián)的特征矢量CCV1)存儲在CCV存儲單元4中。
在步驟S25中,特征矢量(CCV)發(fā)生器21確定是否要產(chǎn)生更多的其它內(nèi)容的特征矢量CCV。
在本具體情況下,對于其余的文件DOC1至DOC7應(yīng)該產(chǎn)生更多的特征矢量CCV,反復地執(zhí)行步驟S21至S25以產(chǎn)生如在附圖5中所示的文件DOC2至DOC7的特征矢量CCV2至CCV7。所得的特征矢量CCV存儲在CCV存儲單元4中。
如果所有的內(nèi)容的特征矢量CCV(在本特定的實例中特征矢量CCV1至CCV7)都以上述的方式已經(jīng)存儲在CCV存儲單元,則決定步驟S25的結(jié)果變?yōu)镹o,處理進行到步驟S26。在步驟S26中,特征矢量(CCV)發(fā)生器21調(diào)整分配給特征矢量CCV的各個元素的權(quán)重。
在每個特征矢量CCV的每個元素值(內(nèi)容元信息和上下文信息的權(quán)重值)如上文所述地乘以可變系數(shù)的情況下,在步驟S26中通過修改對應(yīng)于應(yīng)該被調(diào)整的權(quán)重值的一個或多個可變系數(shù)可以簡單地調(diào)節(jié)元素值。
在完成權(quán)重的調(diào)節(jié)時,結(jié)束CCV產(chǎn)生過程。
再次參考附圖3,在步驟S2中,在完成了CCV產(chǎn)生過程(步驟S1)之后,矩陣計算器(空間發(fā)生器)22基于在CCV存儲單元4中存儲的多個特征矢量CCV產(chǎn)生矩陣CCM,進一步產(chǎn)生矩陣CCM的近似矩陣CCM*,并將所得的近似矩陣CCM*輸送給用戶喜好矢量(UPV)發(fā)生器23。
在下文中,通過矩陣計算器(空間發(fā)生器)22執(zhí)行的上述的過程(步驟S2)被稱為近似矩陣(空間)產(chǎn)生過程。附圖6所示為根據(jù)第一實施例的近似矩陣產(chǎn)生過程的詳細流程的實例。參考附圖6,下文描述根據(jù)第一實施例的近似矩陣(空間)產(chǎn)生過程的細節(jié)。
首先,在步驟S41中,矩陣計算器(空間發(fā)生器)22從CCV存儲單元4中獲取多個特征矢量CCV。更具體地說,在本實例中,矩陣計算器(空間發(fā)生器)22獲取特征矢量CCV1至CCV7。
在步驟S42中,矩陣計算器(空間發(fā)生器)22產(chǎn)生矩陣CCM,該矩陣CCM包括多個特征矢量CCV作為列分量。更具體地說,在本實例中,矩陣計算器(空間發(fā)生器)22產(chǎn)生矩陣D比如在附圖7中所示的矩陣作為矩陣CCM。
在步驟S43中,矩陣計算器(空間發(fā)生器)22通過奇異值分解和階數(shù)的降低將矩陣CCM分解為如在公式(2)的右手側(cè)所示的分量矩陣Uk、∑k和Vk的乘積(由此產(chǎn)生最佳空間UPS)。在步驟S44中,這些分量矩陣Uk、∑k和Vk存儲在分量矩陣存儲單元5中。
在步驟S45中,矩陣計算器(空間發(fā)生器)22使用分量矩陣Uk、∑k和Vk產(chǎn)生矩陣CCM的近似矩陣CCM*(通過計算在公式(2)的右手側(cè)的表達式),并將所得的近似矩陣CCM*輸送給用戶喜好矢量(UPV)發(fā)生器23。
更具體地說,在本實例中,如下地執(zhí)行步驟S43至S45。矩陣計算器(空間發(fā)生器)22通過奇異值分解將在如附圖7中所示的矩陣D(矩陣CCM)分解為分量矩陣U、∑和V的乘積以便滿足公式(1)。通過上述過程(從在附圖7中所示的矩陣D)獲得的分量矩陣U、∑和V分別在附圖8至10中示出。
雖然分量矩陣∑實際具有16行和7列,但是僅第1至第7行(在矩陣∑的上部區(qū)域)在附圖9中示出,因為在矩陣∑的左上區(qū)域中的7×7個元素形成了如附圖9中所示的對角矩陣,所有的其它的元素都是0。
雖然分量矩陣U實際具有16行和16列,但是僅第1至第7列在附圖8中示出。注意,在U×∑的計算中,即使在附圖8中沒有示出的列(第8至第16列)具有任何值,在這些列乘以矩陣∑的對應(yīng)的行時,結(jié)果都變?yōu)?,因為矩陣∑的對應(yīng)的行在所有的元素中都是0。
如上文所述,矩陣計算器(空間發(fā)生器)22通過從在附圖8中所示的分量矩陣U中抽取第1至第3列(在附圖8中所示的虛線框中包圍的左奇異值矢量)產(chǎn)生16×3矩陣Uk。
此外,矩陣計算器(空間發(fā)生器)22通過從在附圖10中所示的分量矩陣V中抽取第1至第3列(在附圖10中所示的虛線框中包圍的右奇異值矢量)產(chǎn)生7×3矩陣Vk,矩陣計算器(空間發(fā)生器)22通過抽取在附圖9中所示的矩陣∑的左上區(qū)域(在附圖9中所示的虛線框中包圍)中的3×3個元素產(chǎn)生3×3矩陣∑k。
在矩陣計算器(空間發(fā)生器)22將所獲得的分量矩陣Uk、∑k和Vk存儲在分量矩陣存儲單元5中之后,矩陣計算器(空間發(fā)生器)22將這些分量矩陣Uk、∑k和Vk代入公式(2)的右手側(cè),由此形成其秩減小到3的矩陣Dk比如在附圖11中所示的矩陣。所得的矩陣Dk作為矩陣CCM的近似矩陣CCM*輸送給用戶喜好矢量(UPV)發(fā)生器23。
因此,完成了近似矩陣(空間)產(chǎn)生過程。
再次參考附圖3,在步驟S3中,在完成了近似矩陣(空間)產(chǎn)生過程(步驟S2)之后,用戶喜好矢量(UPV)發(fā)生器23確定要產(chǎn)生的用戶喜好矢量UPV*的類型,即用戶喜好矢量(UPV)發(fā)生器23確定是否為每個上下文產(chǎn)生用戶喜好矢量UPV*,即上下文用戶喜好矢量CUPV*。
如果用戶喜好矢量(UPV)發(fā)生器23確定要產(chǎn)生的用戶喜好矢量不是上下文用戶喜好矢量CUPV*的類型,因此用戶喜好矢量(UPV)發(fā)生器23執(zhí)行步驟S4和S5。
在步驟S4中,用戶喜好矢量(UPV)發(fā)生器23通過利用近似矩陣CCM*的各個列(即在近似矩陣CCM*中的各個特征矢量CCV*)作為喜好矢量UPV*產(chǎn)生用戶喜好矢量UPV*。在步驟S5中,用戶喜好矢量(UPV)發(fā)生器23將這些用戶喜好矢量UPV*存儲在UPV存儲單元6中。更具體地說,在本實例中,在近似矩陣(空間)產(chǎn)生過程(步驟S2)中產(chǎn)生在附圖11中所示的矩陣Dk作為近似矩陣CCM*,并運用近似矩陣CCM*中的每行(即在附圖11中所示的特征矢量CCV*1至CCV*7中的每個)作為用戶喜好矢量UPV*并存儲在UPV存儲單元6中。
因此,完成了UPV產(chǎn)生過程。
在另一方面,如果在步驟S3中確定要產(chǎn)生的用戶喜好矢量是上下文用戶喜好矢量CUPV*的類型,然后處理進行到步驟S6,在步驟S6中用戶喜好矢量(UPV)發(fā)生器23產(chǎn)生上下文用戶喜好矢量CUPV*。
在下文中,通過用戶喜好矢量(UPV)發(fā)生器23為產(chǎn)生上下文用戶喜好矢量CUPV*而執(zhí)行的過程(在步驟S6中)被稱為CUPV產(chǎn)生過程。附圖12所示為根據(jù)第一實施例的CUPV產(chǎn)生過程的詳細流程的實例。參考附圖12,下文描述根據(jù)第一實施例的CUPV產(chǎn)生過程的細節(jié)。
首先,在步驟S61中,用戶喜好矢量(UPV)發(fā)生器23根據(jù)在各個元素中描述的上下文信息計算在近似矩陣CCM*中的項的相似性,即在近似矩陣CCM*的特征矢量CCV*中的相似性。更具體地說,在本實例中,在近似矩陣(空間)產(chǎn)生過程(步驟S2)中形成在附圖11中所示的矩陣Dk作為近似矩陣CCM*之后,根據(jù)與上下文信息(“家”、“公司”、“放松”、“緊張”、“高興”、“悲傷”)關(guān)聯(lián)的元素計算在近似矩陣CCM*的列中(即在特征矢量CCV*1至CCV*7中)的相似性。
在步驟S62中,用戶喜好矢量(UPV)發(fā)生器23對每個特征矢量CCV*分類(在本具體實例中,在附圖11中所示的特征矢量CCV*1至CCV*7)。更具體地說,基于在步驟S61中的計算結(jié)果,用戶喜好矢量(UPV)發(fā)生器23將具有等于或高于閾值的相似性的特征矢量CCV*分為相同的類別。
在下文中,在步驟S63中,用戶喜好矢量(UPV)發(fā)生器23計算屬于每個分類的特征矢量CCV*的每個元素的值的總和(例如,元素“幼兒園”的值的總和),并且用戶喜好矢量(UPV)發(fā)生器23形成其元素由每個類別的各個元素的值的計算的總和給定的矢量。每個類別的所得的矢量被用作該類別的上下文用戶喜好矢量CUPV*。
在步驟S64中,用戶喜好矢量(UPV)發(fā)生器23在UPV存儲單元6中存儲為各個類別形成的上下文用戶喜好矢量CUPV*。
因此,完成了在附圖12中的CUPV產(chǎn)生過程(在附圖3中的步驟S6),并完成了在附圖3中的UPV產(chǎn)生過程。
現(xiàn)在,參考在附圖13中所示的流程圖,描述關(guān)于根據(jù)第一實施例的信息處理設(shè)備(附圖1)基于已經(jīng)準備的用戶喜好矢量UPV*推薦與用戶所處于的當前上下文很好地匹配的內(nèi)容而執(zhí)行的處理。
在步驟S101中,基于在UPV存儲單元6中存儲的用戶喜好矢量UPV*(或上下文用戶喜好矢量CUPV*),匹配單元3的匹配計算器31產(chǎn)生與用戶所處于的當前上下文很好地匹配的特定上下文用戶喜好矢量sCUPV*。
在下文中,通過匹配計算器31設(shè)定特定上下文用戶喜好矢量sCUPV*而執(zhí)行的過程(在步驟S101中)被稱為CUPV設(shè)定過程。附圖14所示為根據(jù)第一實施例的CUPV設(shè)置過程的詳細流程的實例。參考附圖14,下文詳細地描述根據(jù)第一實施例的CUPV設(shè)置過程。
首先,在步驟S121中,匹配計算器31從元信息獲取單元1(上下文獲取單元14)中獲取當前上下文信息。
在此,我們假設(shè)在步驟S121中匹配計算器31從元信息獲取單元1中獲取“家”和“高興”作為當前上下文信息。即,用戶當前處于用戶在家里并感覺高興的上下文中。
在這種情況下,在步驟S122中,匹配計算器31從當前上下文信息中產(chǎn)生特征矢量CCV。即,如附圖15所示,匹配計算器31產(chǎn)生特征矢量CCV以便將“1”設(shè)定到對應(yīng)于“家”的元素(第11個元素),將“1”設(shè)置到對應(yīng)于“高興”的元素(第15個元素),以及將0設(shè)置到其它的元素(第1至第10個元素、第12至第14個元素和第16個元素)。在下文中將以上述的方式通過匹配計算器31產(chǎn)生的特征矢量CCV(即指示用戶所處的當前上下文的特征矢量CCV)稱為當前上下文特征矢量cCCV以區(qū)別于其它的特征矢量CCV。在本具體實施例中,在步驟S122中,匹配計算器31產(chǎn)生如在附圖15中所示的當前上下文特征矢量cCCV。
在步驟S123中,匹配計算器31計算當前上下文特征矢量cCCV相對于在UPV存儲單元6中存儲的每個用戶喜好矢量UPV*(或上下文用戶喜好矢量CUPV*)的相似性。
在步驟S124中,匹配計算器31確定在步驟S123中執(zhí)行的相似性的計算是否相對于上下文用戶喜好矢量CUPV*。
如果在步驟S124中確定相似性的計算是相對于上下文用戶喜好矢量CUPV*,則處理進行到步驟S125。在步驟S125中,匹配計算器31選擇具有最高的相似性的上下文用戶喜好矢量CUPV*并將它用作特定上下文用戶喜好矢量sCUPV*。
在另一方面,如果在步驟S124中確定相似性的計算不是相對于上下文用戶喜好矢量CUPV*,則處理進行到步驟S126。在步驟S126中,匹配計算器31確定具有等于或高于閾值的相似性的用戶喜好矢量UPV*的和給定的和矢量,并且匹配計算器31將它用作特定上下文用戶喜好矢量sCUPV*。
更具體地說,在本實例中,如附圖16所示地計算在附圖15中所示的當前上下文特征矢量cCCV相對于在附圖11中所示的每個特征矢量CCV*1至CCV*7(在UPV存儲單元6中存儲的用戶喜好矢量UPV*)的相似性。
如果設(shè)定閾值例如是0.8,則在上述的步驟S126中,匹配計算器31計算特征矢量CCV*1和特征矢量CCV*3的和并利用所得的和矢量作為特定上下文用戶喜好矢量sCUPV*。
注意,在用戶喜好矢量UPV*由在附圖7中所示的原始矩陣CCM的列(即通過在附圖5中所示的特征矢量CCV1至CCV7)給定的情況下,在特定上下文用戶喜好矢量sCUPV*的產(chǎn)生的過程中,反映僅僅具有與當前上下文特征矢量cCCV的元素(附圖15)相同的與上下文信息關(guān)聯(lián)的元素的特征矢量(即其與“家”和“高興”關(guān)聯(lián)的元素等于“1”和其它的元素等于“0”的CCV3)。相反,在本實例中,用戶喜好矢量UPV*通過在附圖11中所示的近似矩陣CCM*的列(即通過在附圖11中所示的特征矢量CCV*1至CCV*7)給定,在特定上下文用戶喜好矢量sCUPV*的產(chǎn)生的過程中不僅反映對應(yīng)于特征矢量CCV3的特征矢量CCV*3,而且還反映對應(yīng)于特征矢量CCV1的特征矢量CCV*1。
注意,在通過空間/UPV發(fā)生器2借助于LSI法(通過執(zhí)行在附圖6中所示的近似矩陣(空間)產(chǎn)生過程)從在附圖7中所示的原始矩陣CCM中產(chǎn)生的近似矩陣CCM*中,在元素中(在內(nèi)容元信息和上下文信息中)的相關(guān)性清楚地出現(xiàn)在特征矢量CCV*1至CCV*7中,雖然相關(guān)性在附圖5中所示的特征矢量CCV1至CCV7中不清楚。此外,可以清楚地看到對應(yīng)于特征矢量CCV*1的內(nèi)容(DOC1)的上下文類似于當前上下文。
即,在附圖5中所示的特征矢量CCV1至CCV7直接用作用戶喜好矢量UPV*的情況下,特征矢量CCV6類似于在附圖15中所示的當前上下文特征矢量cCCV,在附圖15中“家”的元素具有值“1”,以及特征矢量CCV1類似于在附圖15中所示的當前上下文特征矢量cCCV,在附圖15中“高興”的元素具有值“1”。因此,在這種情況下,相對于在附圖15中所示的當前上下文特征矢量cCCV,特征矢量CCV6的相似性和特征矢量CCV1的相似性相等。相反,在通過LSI法(元素的權(quán)重值通過LSI法修改)突出每個內(nèi)容(DOC1至DOC7)的元素中(在內(nèi)容元信息和上下文信息中)的相關(guān)性的情況下,特征矢量CCV*1的“家”的元素被修改到大約0.6,它類似于特征矢量CCV*6的元素,并且特征矢量CCV*1的“高興”的元素被修改到大約1.06,它遠大于特征矢量CCV*6的“高興”的元素的大約0.16。因此,在這種情況下,特征矢量CCV*1與在附圖15中所示的當前上下文特征矢量cCCV的相似性比特征矢量CCV*6更高。即轉(zhuǎn)換到特征矢量CCV*1至CCV*7揭示了在“高興”的情緒狀態(tài)下在“公司”中用戶使用的文件DOC1比在“悲傷”的情緒狀態(tài)下在“家”中使用的文件DOC6更好地與當前上下文(用戶在“高興”的情緒狀態(tài)下在“家”里)匹配。
在本發(fā)明中,使用LSI法的特征矢量轉(zhuǎn)換不僅提供了維數(shù)數(shù)量減少的第一個優(yōu)點,而且還提供了在每個矢量中的元素中的相關(guān)性比在原始的特征矢量CCV中在特征矢量CCV*中變得更加清楚的第二個優(yōu)點。這第二個優(yōu)點在本發(fā)明中更加重要,本發(fā)明的主要目的是實現(xiàn)這第二個優(yōu)點。即,原始的特征矢量CCV到特征矢量CCV*的轉(zhuǎn)換使得可以容易地指出哪些字(權(quán)重值)彼此密切相關(guān)。更具體地說,通過借助于LSI法將具有大量維數(shù)的原始特征矢量CCV轉(zhuǎn)換為低維數(shù)的特征矢量CCV*,彼此具有密切關(guān)系但分散在原始的特征矢量CCV中的不同的維數(shù)上的字落在具有減少的維數(shù)的特征矢量CCV*的相同維數(shù)上。
如上文所述,本發(fā)明的最重要的目的是提供上述的第二優(yōu)點(除了不重要的第一優(yōu)點之外),因此對將原始的特征矢量CCV形成為特征矢量CCV*的方法沒有特別的限制,只要實現(xiàn)第二優(yōu)點即可。即,該方法并不限于LSI法,如果原始度特征矢量CCV可以被轉(zhuǎn)換為其中在元素中的相關(guān)性比在原始的特征矢量CCV中變得更加清楚的特征矢量CCV*,就可以使用其它的方法。
即,空間/UPV發(fā)生器2并不限于在附圖1中所示那樣,而是還可以以許多方式構(gòu)造空間/UPV發(fā)生器2,只要它包括具有如下功能的修改單元和產(chǎn)生單元即可。即,修改單元獲取M個(等于或大于1的整數(shù)(在本實例中對應(yīng)于文件DOC11至DOC7的7組))信息組,每個信息組包括N條(等于或大于2的整數(shù)(在本實例中為16))單個信息(在本實例中,包括“幼兒園”、“小孩”等的內(nèi)容元信息和包括“家”、“高興”等的上下文信息,如附圖5所示),并至少部分地修改M個信息組中的每個的N條單個信息以便突出在N條單個信息中的相關(guān)性。基于包括通過修改單元修改的N條單個信息的M個信息組(在本實例中近似矩陣CCM*),產(chǎn)生單元形成包括N條單個信息的參考信息組(在本實例中,上下文用戶喜好矢量CUPV*)。
如果在附圖14中在步驟S125至S126中以上述的方式設(shè)定特定上下文用戶喜好矢量sCUPV*,則完成CUPV設(shè)置過程。
再次參考附圖13,如果完成了CUPV設(shè)置過程(步驟S101),則處理進行到步驟S102,在步驟S102中匹配計算器31基于特定上下文用戶喜好矢量sCUPV*從用戶喜歡的內(nèi)容中選擇與用戶的當前上下文最佳匹配的內(nèi)容,推薦器9將所選擇的內(nèi)容作為推薦的內(nèi)容提供給用戶。
在下文中,通過匹配計算器31和推薦器9為將推薦的內(nèi)容提供給用戶而執(zhí)行的處理(步驟S102)被稱為內(nèi)容推薦計算過程。附圖17所示為根據(jù)第一實施例的內(nèi)容推薦計算過程的詳細流程的實例的流程圖。參考附圖17,下文詳細地描述根據(jù)第一實施例的內(nèi)容推薦計算過程。
首先,在步驟S141中,匹配計算器31從元信息獲取單元1(文本分析器12或元數(shù)據(jù)獲取單元13)中獲取與作為要推薦的內(nèi)容的候選內(nèi)容的多個內(nèi)容關(guān)聯(lián)的內(nèi)容元信息。
在步驟S142中,匹配計算器31從與要推薦的每個候選內(nèi)容關(guān)聯(lián)的每個內(nèi)容元信息中形成特征矢量CCV。即,匹配計算器31形成要推薦的內(nèi)容的每個候選內(nèi)容的特征矢量CCV。更具體地說,在本實例中,形成其對應(yīng)于上下文信息的元素(即第11至第16元素)等于“0”的標準形式的特征矢量CCV比如在附圖11或15中所示的特征矢量CCV。
在步驟S143中,匹配計算器31計算在步驟S142中形成的對應(yīng)于要推薦的內(nèi)容的各個候選內(nèi)容的每個特征矢量CCV相對于在步驟S101中在CUPV設(shè)置過程中設(shè)置的特定上下文用戶喜好矢量sCUPV*的相似性(附圖13(它的細節(jié)在附圖14中示出))并將計算結(jié)果輸送給推薦器9。
在步驟S144中,推薦器9選擇對應(yīng)于具有比閾值更高的相似性的特征矢量CCV的內(nèi)容(或?qū)?yīng)于具有最高的相似性的特征矢量CCV的內(nèi)容)并將所選擇的內(nèi)容推薦給用戶。因此,完成了內(nèi)容推薦計算過程(在附圖13中所示的步驟S102),并且也完成了在附圖13中所示的內(nèi)容推薦過程。
對應(yīng)于以上述方式推薦給用戶的內(nèi)容的特征矢量CCV具有與在步驟S101中在CUPV設(shè)置過程中設(shè)置的特定上下文用戶喜好矢量sCUPV*(用戶所處的當前上下文的上下文用戶喜好矢量CUPV*)較高的相似性。因此,在用戶喜歡的內(nèi)容中,將與用戶的當前上下文最佳匹配的內(nèi)容推薦給用戶。這就減小了推薦的內(nèi)容被用戶拒絕的可能性。
即,如上文所述,為選擇與用戶所處的當前上下文十分好地匹配的內(nèi)容,基于包括與用戶經(jīng)歷的內(nèi)容關(guān)聯(lián)的內(nèi)容元信息和上下文信息的特征矢量CCV形成矩陣CCM,并使用LSI(潛在語義索引)法等形成矩陣CCM的近似矩陣CCM*,并基于近似矩陣CCM*執(zhí)行匹配過程,由此使得能夠發(fā)現(xiàn)(揭示)在該內(nèi)容和上下文中重要的潛在的相關(guān)性,由此使得能夠正確地推薦與用戶所處的當前上下文十分好地匹配的內(nèi)容。
為什么能夠?qū)崿F(xiàn)上述的優(yōu)點的一個原因在于不是分離地而是一起地處理上下文信息和內(nèi)容元信息,如上文所述。即,根據(jù)本實施例,同等地處理上下文信息和內(nèi)容元信息使得能夠不是基于在內(nèi)容和有限的上下文之間的匹配簡單地選擇內(nèi)容,而是基于在內(nèi)容和通過匹配過程(使用近似矩陣CCM*)揭示的上下文之間的密切的相關(guān)性選擇內(nèi)容。
雖然在上述的實例中,與用戶所處的當前上下文最佳地匹配的內(nèi)容(即,在上下文方面具有最高相似性的內(nèi)容)被推薦給用戶,但是在內(nèi)容方面具有最高相似性的內(nèi)容也可以被提供給用戶。
此外,可以推薦與用戶當前使用的內(nèi)容最佳地匹配的另一內(nèi)容。
在這種情況下,匹配單元3執(zhí)行如下的過程。即,匹配單元3從元信息獲取單元1中獲取用戶當前使用的內(nèi)容的內(nèi)容元信息,并將權(quán)重值分配給每條所獲取的內(nèi)容元信息。分配給相應(yīng)條的內(nèi)容元信息的權(quán)重值代入在標準形式的矢量的對應(yīng)的元素中,由此形成用戶當前使用的內(nèi)容的特征矢量CCV。匹配單元3然后計算在UPV存儲單元6中存在的用戶喜好矢量UPV*每個相對于所產(chǎn)生的特征矢量CCV的相似性。然后基于具有等于或高于閾值的用戶喜好矢量UPV*形成新用戶喜好矢量UPV*(對應(yīng)于上文描述的特定上下文用戶喜好矢量sCUPV*)。匹配單元3計算另一內(nèi)容的特征矢量CCV相對于新用戶喜好矢量UPV*的相似性并將計算結(jié)果推薦給推薦器9。
第二實施例參考附圖18至附圖22,下文描述根據(jù)第二實施例的信息處理設(shè)備。
附圖18所示為根據(jù)本發(fā)明的第二實施例的信息處理設(shè)備。在附圖18中,與根據(jù)第一實施例(附圖1)的信息處理設(shè)備的部件類似的部件以類似的參考標號表示。
在根據(jù)第二實施例的信息處理設(shè)備中,根據(jù)第一實施例的匹配單元3(附圖)以投影匹配單元101替代。
如上文所述,通過計算16-維當前上下文特征矢量cCCV相對于在UPV存儲單元6中存儲的每個16-維上下文用戶喜好矢量CUPV*的相似性,根據(jù)第一實施例的匹配單元3設(shè)定16-維特定上下文用戶喜好矢量sCUPV*。匹配單元3進一步計算對應(yīng)于要推薦的內(nèi)容的候選內(nèi)容的每個16-維特征矢量CCV相對于16-維特定上下文用戶喜好矢量sCUPV*的相似性并將計算結(jié)果輸送給推薦器9。
如上文所述,匹配單元3處理與通過特征矢量(CCV)發(fā)生器21產(chǎn)生的特征矢量CCV的維數(shù)的數(shù)量相同數(shù)量的維數(shù)(在上述的實例中是16維)的矢量。因此,在第一實施例中,隨著用戶使用的內(nèi)容的類型的數(shù)量增加,內(nèi)容元信息的條數(shù)增加。結(jié)果,通過特征矢量(CCV)發(fā)生器21產(chǎn)生的特征矢量CCV的維數(shù)數(shù)量(元素數(shù)量)增加,因此通過用戶喜好矢量(UPV)發(fā)生器23產(chǎn)生的用戶喜好矢量UPV*的維數(shù)數(shù)量增加。這導致通過匹配單元3執(zhí)行的計算的復雜性增加。
在第二實施例中,為解決上述的問題,投影匹配單元101將在相似性計算中要處理的矢量的元素(即對應(yīng)于要推薦的內(nèi)容的候選內(nèi)容的特征矢量CCV和當前上下文特征矢量cCCV)投影到通過矩陣計算器(空間發(fā)生器)22產(chǎn)生的最佳空間UPS,由此減小了維數(shù)的數(shù)量。投影匹配單元101然后計算具有減小的維數(shù)的特征矢量CCV每個相對于在UPV存儲單元6中存儲的具有減小的維數(shù)的用戶喜好矢量UPV*的相似性。在下文中將進一步詳細地描述具有減小維數(shù)的用戶喜好矢量UPV*。
投影匹配單元101包括矩陣計算器(投影單元)111和匹配計算器112。
如果矩陣計算器(投影單元)111從元信息獲取單元1中接收特征矢量CCV(要推薦的候選內(nèi)容的特征矢量CCV或當前上下文特征矢量cCCV),則矩陣計算器(投影單元)111通過將特征矢量CCV的元素投影到通過矩陣計算器(空間發(fā)生器)22產(chǎn)生的最佳空間UPS中減小所接收的特征矢量CCV的維數(shù)的數(shù)量。更具體地說,矩陣計算器(投影單元)111將所接收的特征矢量CCV乘以在分量矩陣存儲單元5中存儲的分量矩陣Uk的轉(zhuǎn)置陣(公式(2))以將分量矩陣Uk的轉(zhuǎn)置陣從左乘,由此將所接收的特征矢量CCV投影到最佳空間UPS,由此獲得具有減小的維數(shù)的特征矢量CCV。在下文中,這種具有減小的維數(shù)的特征矢量CCV被稱為特征矢量CCV#。
作為矩陣計算器(投影單元)111,用戶喜好矢量(UPV)發(fā)生器23也將形成的用戶喜好矢量UPV*(具有與通過特征矢量(CCV)發(fā)生器21形成的特征矢量CCV的維數(shù)數(shù)量相同的維數(shù)數(shù)量(在本實例中,16維)的用戶喜好矢量UPV*)投影在通過矩陣計算器(空間發(fā)生器)22形成的最佳空間UPS中,由此減小了維數(shù)的數(shù)量。所得的具有減小的維數(shù)的用戶喜好矢量UPV*存儲在UPV存儲單元6中。更具體地說,用戶喜好矢量(UPV)發(fā)生器23將所形成的用戶喜好矢量UPV*乘以通過矩陣計算器(空間發(fā)生器)22形成的分量矩陣Uk的轉(zhuǎn)置陣以使分量矩陣Uk的轉(zhuǎn)置陣左乘,由此將用戶喜好矢量UPV*投影到最佳空間UPS,因此獲得了具有減小的維數(shù)的用戶喜好矢量UPV*。在下文中,將具有減小的維數(shù)的用戶喜好矢量UPV*稱為用戶喜好矢量UPV*#。
當然,具有減小的維數(shù)的用戶喜好矢量UPV*#可以通過矩陣計算器(投影單元)111形成。
匹配計算器112計算從矩陣計算器(投影單元)111中輸出的具有減小的維數(shù)的特征矢量CCV#相對于在UPV存儲單元6中存在的具有減小的維數(shù)的用戶喜好矢量UPV*#的相似性,并根據(jù)需要將計算結(jié)果輸送給推薦器9。
在第二實施例中,如上文所述,因為投影匹配單元101處理具有減小的維數(shù)的矢量,因此計算處理的復雜性比通過匹配單元3(附圖1)根據(jù)第一實施例執(zhí)行的處理的復雜性更低,在第一實施例中處理具有沒有減小的維數(shù)的原始矢量。
對投影匹配單元101的具體形式?jīng)]有限制,它可以通過軟件、硬件或軟件和硬件的混合實施。
在第二實施例中,除了投影匹配單元101之外信息處理設(shè)備的部件基本類似于在附圖1中所示的第一實施例的部件。即,在附圖18中,元信息獲取單元1、空間/UPV發(fā)生器2和從CCV存儲單元4至推薦器9的其它的部件在結(jié)構(gòu)和功能上都類似于在附圖1中的對應(yīng)的方塊,因此在此不再對它們重復描述。
現(xiàn)在,參考附圖19中所示的流程圖,下文描述根據(jù)第二實施例的信息處理設(shè)備(附圖18)執(zhí)行的UPV產(chǎn)生過程。
根據(jù)第二實施例的UPV產(chǎn)生過程的流程在許多部分上類似于根據(jù)第一實施例(附圖3)的過程。在此不再描述與第一實施例的部分類似的部分,下文參考附圖19中所示的流程圖的討論集中在與根據(jù)第一實施例的部分不同的不同上。
在附圖19的步驟S201中的CCV產(chǎn)生過程與在附圖3的步驟S1中的CCV產(chǎn)生過程基本相同的方式執(zhí)行,在附圖19的步驟S202中的近似矩陣(空間)產(chǎn)生過程與在附圖3的步驟S2中的近似矩陣(空間)產(chǎn)生過程基本相同的方式執(zhí)行。
在完成了近似矩陣(空間)產(chǎn)生過程(步驟S202)之后,然后在步驟S203中用戶喜好矢量(UPV)發(fā)生器23確定要產(chǎn)生的用戶喜好矢量UPV*的類型是否是每個上下文的用戶喜好矢量CUPV*。
如果在步驟S203中用戶喜好矢量(UPV)發(fā)生器23確定要產(chǎn)生的用戶喜好矢量UPV*不是用戶喜好矢量CUPV*,則用戶喜好矢量(UPV)發(fā)生器23執(zhí)行步驟S204至S206。
在這種情況下,首先,在步驟S204中,用戶喜好矢量(UPV)發(fā)生器23設(shè)定用戶喜好矢量UPV*以使矩陣CCM的列(即在近似矩陣CCM*中的特征矢量CCV*)分別用作用戶喜好矢量UPV*。
在步驟S205中,用戶喜好矢量(UPV)發(fā)生器23將每個用戶喜好矢量UPV*投影到最佳空間UPS(由此產(chǎn)生具有減小的維數(shù)的用戶喜好矢量UPV*#)。
在步驟S206中,用戶喜好矢量(UPV)發(fā)生器23將具有減小的維數(shù)的這些用戶喜好矢量UPV*#存儲在UPV存儲單元6中。
因此,根據(jù)第二實施例的UPV產(chǎn)生過程完成。
在另一方面,在用戶喜好矢量(UPV)發(fā)生器23在步驟S203中確定要形成的用戶喜好矢量UPV*的類型是用戶喜好矢量CUPV*的情況下,用戶喜好矢量(UPV)發(fā)生器23在步驟S207中執(zhí)行CUPV產(chǎn)生過程。即,在步驟S207中,用戶喜好矢量(UPV)發(fā)生器23產(chǎn)生具有減小的維數(shù)的上下文用戶喜好矢量CUPV*#。
附圖20所示為根據(jù)第二實施例的CUPV產(chǎn)生過程的詳細流程的實例。根據(jù)第二實施例的CUPV產(chǎn)生過程的流程在許多方面類似于根據(jù)第一實施例(附圖12)的流程。在此省去與第一實施例中的部分類似的部分,下文參考附圖20的流程圖的討論集中在與根據(jù)第一實施例的流程不同的部分上。
在附圖20中的步驟S221至S223與在附圖12中的步驟S61至S63基本相同的方式執(zhí)行。在步驟S221至S223完成之后,如下地執(zhí)行處理。
即,在步驟S223中為每個類別設(shè)置了上下文用戶喜好矢量CUPV*之后,處理進行到步驟S224,在步驟S224中用戶喜好矢量(UPV)發(fā)生器23將每個類別的上下文用戶喜好矢量CUPV*投影到最佳空間UPS(由此對于每個類別產(chǎn)生具有減小的維數(shù)的上下文用戶喜好矢量CUPV*#)。
在步驟S225中,用戶喜好矢量(UPV)發(fā)生器23將為各個類別產(chǎn)生的具有減小的維數(shù)的上下文用戶喜好矢量CUPV*#存儲在UPV存儲單元6中。
因此,完成了根據(jù)第二首鼠兩端CUPV產(chǎn)生過程(在附圖19中在步驟S207中),并完成了根據(jù)第二實施例的UPV產(chǎn)生過程。
下文描述通過根據(jù)第二實施例的信息處理設(shè)備執(zhí)行的內(nèi)容推薦處理。
根據(jù)第二實施例的內(nèi)容推薦處理的流程類似于根據(jù)在附圖13中所示的第一實施例的流程。
然而,根據(jù)第二實施例的CUPV設(shè)置過程(步驟S101)稍微不同于根據(jù)第一實施例(附圖14)的過程,根據(jù)第二實施例的內(nèi)容推薦計算過程(步驟S102)稍稍不同于根據(jù)第一實施例(附圖17)的過程。
附圖21所示為根據(jù)第二實施例的CUPV設(shè)置過程(步驟S101)的細節(jié),附圖22所示為根據(jù)第二實施例的內(nèi)容推薦計算過程(步驟S102)的細節(jié)的流程圖。首先,參考附圖21,描述根據(jù)第二實施例的CUPV設(shè)置過程(步驟S101)的細節(jié)。在下文中,參考附圖22,描述根據(jù)第二實施例的內(nèi)容推薦計算過程(步驟S102)的細節(jié)。
首先,在附圖21的步驟S241中,矩陣計算器(投影單元)111從元信息獲取單元1(上下文獲取單元14)中獲取當前上下文。
在步驟S242中,矩陣計算器(投影單元)111從當前上下文信息中產(chǎn)生特征矢量CCV(即產(chǎn)生當前上下文特征矢量cCCV)。
在步驟S243中,矩陣計算器(投影單元)111將當前上下文特征矢量cCCV投影到最佳空間UPS(即矩陣計算器(投影單元)111產(chǎn)生具有減小的維數(shù)的當前上下文特征矢量cCCV#)。
在步驟S244中,匹配計算器112計算具有減小的維數(shù)的當前上下文特征矢量cCCV#相對于在UPV存儲單元6中存儲的具有減小的維數(shù)的上下文用戶喜好矢量CUPV*#的相似性。
在步驟S245中,匹配計算器112選擇具有最高的相似性的具有減小維數(shù)的上下文用戶喜好矢量CUPV*#并將它用作具有減小維數(shù)的特定上下文用戶喜好矢量sCUPV*#。
因此,完成了根據(jù)第二實施例的CUPV設(shè)置過程。
雖然在附圖21中沒有示出,在UPV存儲單元6中存儲的用戶喜好矢量不是上下文用戶喜好矢量CUPV*#而是用戶喜好矢量UPV*#的情況下,匹配計算器112通過執(zhí)行與根據(jù)第一實施例(步驟S124)的處理類似的處理設(shè)置特定上下文用戶喜好矢量sCUPV*#。
在完成了根據(jù)第二實施例的CUPV設(shè)置過程(在附圖13中的步驟S101)之后,執(zhí)行根據(jù)第二實施例的內(nèi)容推薦計算過程(在附圖13中的步驟S102)。
即,在附圖22的步驟S261中,矩陣計算器(投影單元)111從元信息獲取單元1(文本分析器12獲元數(shù)據(jù)獲取單元13)中獲取多個內(nèi)容中的每個內(nèi)容的內(nèi)容元信息作為要推薦的每個候選內(nèi)容的內(nèi)容元信息。
在步驟S262中,矩陣計算器(投影單元)111從要推薦的每個候選內(nèi)容的內(nèi)容元信息中產(chǎn)生特征矢量CCV。即,矩陣計算器(投影單元)111產(chǎn)生對用于每個內(nèi)容的特征矢量CCV。
在步驟S263中,矩陣計算器(投影單元)111將每個候選內(nèi)容的特征矢量CCV投影在最佳空間UPS(即,為每個候選內(nèi)容產(chǎn)生具有減小的維數(shù)的特征矢量CCV#)。
在步驟S264中,匹配計算器112計算每個候選內(nèi)容的具有減小的維數(shù)的特征矢量CCV#(在步驟S263中產(chǎn)生)相對于在CUPV設(shè)置過程中在步驟S101(在附圖13中示出(其細節(jié)在附圖21中示出))中設(shè)定的具有減小的維數(shù)的特定上下文用戶喜好矢量sCUPV*#的相似性,匹配計算器112將計算的結(jié)果輸送給推薦器9。
在步驟S265中,推薦器9選擇對應(yīng)于具有高于閾值的相似性的特征矢量CCV的內(nèi)容(或?qū)?yīng)于具有最高的相似性的特征矢量CCV的內(nèi)容)并將所選擇的內(nèi)容推薦給用戶。
因此,根據(jù)第二實施例的內(nèi)容推薦計算過程(在附圖13中所示的步驟S102)完成,并且在附圖13中所示的內(nèi)容推薦過程也完成。
如上文所述,在根據(jù)第二實施例的內(nèi)容推薦過程中,處理具有減小的維數(shù)的矢量,因此計算處理的復雜性比根據(jù)處理具有沒有減小的維數(shù)的矢量的第一實施例的內(nèi)容推薦處理的復雜性更低。
在第二實施例中,與在前文描述的第一實施例一樣,與用戶的當前上下文最佳匹配的內(nèi)容推薦給用戶。注意,在用戶使用內(nèi)容時,可以推薦與用戶當前使用的內(nèi)容最佳地匹配的另一內(nèi)容。
在這種情況下,投影匹配單元101執(zhí)行如下的過程。即,投影匹配單元101從元信息獲取單元1中獲取用戶當前使用的內(nèi)容的內(nèi)容元信息,并將權(quán)重值分配給每條所獲取的內(nèi)容元信息。分配給相應(yīng)條的內(nèi)容元信息的權(quán)重值代入標準形式的矢量的對應(yīng)元素中,由此產(chǎn)生用于用戶當前使用的內(nèi)容的特征矢量CCV。
投影匹配單元101然后將所產(chǎn)生的特征矢量CCV和在UPV存儲單元6中存在的一個獲多個用戶喜好矢量UPV*在公式(4)中從左乘以分量矩陣Uk的轉(zhuǎn)置陣,由此產(chǎn)生可用于用戶當前使用的內(nèi)容的具有減小維數(shù)(K維)的特征矢量CCV#和具有減小維數(shù)(K維)的一個或多個用戶喜好矢量UPV*#。注意,作為投影匹配單元101的替代,用戶喜好矢量(UPV)發(fā)生器23可以產(chǎn)生具有減小維數(shù)(K維)的一個或多個用戶喜好矢量UPV*#。
投影匹配單元101然后計算具有減小維數(shù)(K維)的一個或多個用戶喜好矢量UPV*#中的每個相對于與用戶當前使用的內(nèi)容關(guān)聯(lián)的具有減小維數(shù)(K維)的特征矢量CCV#的相似性。然后基于具有等于或高于閾值的相似性的具有減小維數(shù)(K為)的用戶喜好矢量UPV*產(chǎn)生新K維用戶喜好矢量UPV*(對應(yīng)于如上文所述具有減小的維數(shù)的特定上下文用戶喜好矢量sCUPV*#)。在下文中,這種新K維用戶喜好矢量UPV*被表示為UPV*#。匹配單元3然后計算另一內(nèi)容的具有減小的維數(shù)的特征矢量相對于新K維用戶喜好矢量UPV*#的相似性并將計算結(jié)果輸送給推薦器9。
第三實施例現(xiàn)在參考附圖23至25,下文描述根據(jù)第三實施例的信息處理設(shè)備。
根據(jù)第一實施例(附圖1)的信息處理設(shè)備或者根據(jù)第二實施例(附圖18)的信息處理設(shè)備可以直接用作根據(jù)第三實施例的信息處理設(shè)備,因此在此不再重復描述根據(jù)第三實施例的信息處理設(shè)備的結(jié)構(gòu)。在下文的描述中,通過舉例,假設(shè)在第三實施例中使用的信息處理設(shè)備類似于根據(jù)在附圖1中所示的第一實施例的信息處理設(shè)備。
下文描述根據(jù)第三實施例通過信息處理設(shè)備(類似于在附圖1中所示的信息處理設(shè)備)執(zhí)行的UPV產(chǎn)生過程。
在根據(jù)第三實施例的UPV產(chǎn)生過程中,事先為各個內(nèi)容定義的各個用戶喜好矢量UPV*(即各個內(nèi)容特定的用戶喜好矢量CUPV*)設(shè)置候選內(nèi)容。
附圖23所示為說明根據(jù)第三實施例的UPV產(chǎn)生過程的實例的流程圖。參考附圖23,詳細描述根據(jù)第三實施例的UPV產(chǎn)生過程。
如附圖23所示,在步驟S301中,執(zhí)行CCV產(chǎn)生過程,并在步驟S302中執(zhí)行近似矩陣(空間)產(chǎn)生過程。在下文中,在步驟S303中,執(zhí)行CUPV產(chǎn)生過程。在步驟S304中,在附圖1中所示的相關(guān)信息獲取單元8為每個用戶喜好矢量CUPV*搜索要推薦的候選內(nèi)容。
在這個第三實施例中,CCV產(chǎn)生過程、近似矩陣(空間)產(chǎn)生過程和CUPV產(chǎn)生過程都以與根據(jù)第一實施例的對應(yīng)的過程相同的方式執(zhí)行。即,在這個第三實施例中,CCV產(chǎn)生過程根據(jù)在附圖4中所示的流程圖執(zhí)行,近似矩陣(空間)產(chǎn)生過程根據(jù)在附圖6中所示的流程圖執(zhí)行。CUPV產(chǎn)生過程根據(jù)在附圖12中所示的流程圖執(zhí)行。
在下文中,通過相關(guān)信息獲取單元8執(zhí)行的上述的過程(步驟S304)將被簡單地稱為與上下文相關(guān)頁面獲取過程。根據(jù)第三實施例的與上下文相關(guān)頁面獲取過程(步驟S304)的細節(jié)在附圖24的流程圖中示出。參考附圖24,下文詳細地描述根據(jù)第三實施例的上下文相關(guān)頁面獲取過程(步驟S304)。
首先在步驟S321中,相關(guān)信息獲取單元8從通過用戶喜好矢量(UPV)發(fā)生器23產(chǎn)生的每個內(nèi)容特定的用戶喜好矢量CUPV*中選擇具有最高的權(quán)重值的兩個元素(與內(nèi)容元信息關(guān)聯(lián))。
在步驟S322中,相關(guān)信息獲取單元8訪問因特網(wǎng)等(未示),并通過使用對應(yīng)于為每個內(nèi)容特定的用戶喜好矢量CUPV*選擇的兩個元素的字(例如如在附圖5中的內(nèi)容元信息的項目描述的“幼兒園”和“小孩”)作為關(guān)鍵字搜索內(nèi)容(在特定的URL的站點上存儲的)。
在步驟S323中,雖然在附圖1中沒有示出,但是相關(guān)信息獲取單元8仍然將搜索的結(jié)果存儲在UPV存儲單元6中以便將搜索的結(jié)果鏈接到對應(yīng)的內(nèi)容特定的用戶喜好矢量CUPV*。
因此,完成了根據(jù)第三實施例的與上下文相關(guān)頁面獲取過程。
現(xiàn)在,參考附圖25中所示的流程圖,下文描述根據(jù)第三實施例的內(nèi)容推薦過程。
在步驟S341中,執(zhí)行CUPV過程。在步驟S343中,在附圖1中所示的推薦器9選擇通過連接到特定上下文用戶喜好矢量sCUPV*的搜索的結(jié)果指示的內(nèi)容,即選擇通過連接到特定上下文用戶喜好矢量sCUPV*的搜索結(jié)果指示的并在附圖24中的步驟S323中存儲在UPV存儲單元6中的內(nèi)容,推薦器9將所選擇的內(nèi)容推薦給用戶。
在這個第三實施例中,CUPV設(shè)置過程與根據(jù)第一實施例基本相同的方式執(zhí)行。即,也是在這個第三實施例中,CUPV設(shè)置過程根據(jù)在附圖14中所示的流程圖執(zhí)行,因此在此不再重復CUPV設(shè)置過程的描述。
在第三實施例中,如上文所述,因為對于各個上下文用戶特定矢量sCUPV*已經(jīng)事先指定了候選內(nèi)容,因此在設(shè)置特定上下文用戶喜好矢量sCUPV*時可以立即選擇的候選內(nèi)容,而不必計算在特定上下文用戶喜好矢量sCUPV*和候選內(nèi)容的特征矢量之間的相似性。
在前文描述的第一和第二實施例中,為推薦與用戶的喜好匹配并與用戶當前使用的內(nèi)容或當前上下文匹配的內(nèi)容,需要執(zhí)行內(nèi)容匹配過程(相似性的計算)并搜索每次推薦的內(nèi)容。因此,例如,為推薦在因特網(wǎng)上的網(wǎng)頁作為內(nèi)容,在每次推薦時需要執(zhí)行搜索。這需要較長的時間,而這通常是用戶難以接受的。
在第三實施例中,上述的問題通過事先登記指示各個上下文用戶喜好矢量sCUPV*的候選內(nèi)容(候選網(wǎng)頁)的數(shù)據(jù)解決。
第四實施例現(xiàn)在參考附圖26至29,下文描述根據(jù)第四實施例的信息處理設(shè)備。
在前述的實施例(第一至第三實施例)中,假設(shè)用戶對該內(nèi)容感興趣,比如通過用戶接收的郵件文件。換句話說,在前述的實施例中,選擇內(nèi)容不涉及用戶是否對該內(nèi)容感興趣的問題。
在這個第四實施例中,考慮用戶是否對該內(nèi)容感興趣來選擇內(nèi)容。從多個候選內(nèi)容中事先選擇用戶感興趣(或不感興趣)的內(nèi)容,并從用戶感興趣的預先選擇的候選內(nèi)容中選擇與用戶的當前上下文匹配的候選內(nèi)容,并將所選則的候選內(nèi)容提供給用戶。
在第四實施例中,為實現(xiàn)上述目的,以不同于根據(jù)第一實施例(附圖1)或第二實施例(附圖8)的方式構(gòu)造信息處理設(shè)備。
附圖26所示為根據(jù)本發(fā)明的第四實施例的信息處理設(shè)備的結(jié)構(gòu)的實例。在附圖26中,與根據(jù)第一實施例(附圖1)的信息處理設(shè)備的部件或根據(jù)第二實施例(附圖18)的信息處理設(shè)備的部件類似的部件以類似的參考標號表示。
在根據(jù)第四實施例的信息處理設(shè)備中,第一或第二實施例的空間/UPV發(fā)生器2(附圖1或附圖18)以空間發(fā)生器201和特定喜好UPV發(fā)生器202替代。此外,作為根據(jù)第一實施例的匹配單元3或第二實施例的投影匹配單元101的替代,提供匹配單元204。此外,根據(jù)第四實施例的信息處理設(shè)備附加地包括SVM模型存儲單元203。
空間發(fā)生器201包括特征矢量(CCV)發(fā)送器211和矩陣計算器(喜好特定空間發(fā)生器)212。
特征矢量(CCV)發(fā)送器211在功能和結(jié)構(gòu)上類似于根據(jù)第一或第二實施例的特征矢量(CCV)發(fā)生器21(附圖1或附圖18),但除了在與特定的內(nèi)容關(guān)聯(lián)的特征矢量CCV存儲在CCV存儲單元4中時,指示用戶是否對與特征矢量CCV各個內(nèi)容是否感興趣的信息也存儲在CCV存儲單元4中,以便該信息鏈接到特征矢量CCV。
指示用戶對與特征矢量CCV對應(yīng)的內(nèi)容感興趣的信息被稱為肯定喜好信息,而指示用戶對與特征矢量CCV對應(yīng)的內(nèi)容不感興趣的信息被稱為否定喜好信息。即,在CCV存儲單元4中存儲的每個特征矢量CCV鏈接到肯定或否定喜好信息中。
換句話說,鏈接到肯定喜好信息的特征矢量是指示用戶的喜好的肯定因素的特征矢量CCV。在另一方面,鏈接到否定喜好信息的特征矢量CCV是指示用戶的喜好的否定因素的特征矢量CCV。
任何方法可用于將特征矢量CCV鏈接到肯定喜好信息或否定喜好信息。例如,在用戶每次使用內(nèi)容時,用戶可以直接輸入指示是否感興趣的內(nèi)容的信息。可替換地,例如借助于SVM(支持矢量機)對每個特征矢量CCV的所有元素或某些元素(例如,僅與上下文信息關(guān)聯(lián)的元素)執(zhí)行學習,并將每個特征矢量CCV分為肯定喜好或否定喜好(即,確定每個特征矢量CCV是肯定喜好特征矢量CCV還是否定喜好特征矢量CCV)。
矩陣計算器(喜好特定空間發(fā)生器)212在功能和結(jié)構(gòu)上類似于根據(jù)第一或第二實施例22(附圖1和附圖18)的矩陣計算器(空間發(fā)生器),但除了肯定喜好特征矢量CCV(鏈接到肯定喜好信息的特征矢量CCV)和否定喜好特征矢量CCV(鏈接到否定喜好信息的特征矢量CCV)在通過矩陣計算器(喜好特定空間發(fā)生器)212執(zhí)行的過程中彼此嚴格地區(qū)別開。
更具體地說,矩陣計算器(喜好特定空間發(fā)生器)212產(chǎn)生其列由存儲在CCV存儲單元4中的M個肯定喜好特征矢量CCV給定的矩陣CCM(具有N行和M列)(其中M是等于或大于2的整數(shù))。在下文中,其列由肯定喜好特征矢量CCV給定的矩陣CCM被稱為矩陣CCM+。
例如通過奇異值分解和維數(shù)降低,矩陣計算器(喜好特定空間發(fā)生器)212將矩陣CCM+的各個元素(指示用戶喜歡(欣賞)的內(nèi)容的屬性的內(nèi)容元信息和指示欣賞過的內(nèi)容的上下文的上下文信息)投影到主軸上。
通過減小矩陣CCM+的維數(shù)獲得的結(jié)果矩陣被稱為近似矩陣CCM+*。元素投影到其中上的空間被稱為最佳空間UPS+。
更具體地說,矩陣計算器(喜好特定空間發(fā)生器)212借助于奇異值分解將N×M矩陣CCM+分解為分量矩陣U、∑和V的乘積以滿足公式(1)。
矩陣計算器(喜好特定空間發(fā)生器)212然后抽取在分量矩陣U的最左區(qū)域中的k列(左奇異值矢量)并產(chǎn)生其列由所抽取的k列給定的矩陣Uk(具有N行和k列)。此外,矩陣計算器(喜好特定空間發(fā)生器)212抽取在分量矩陣V的最左區(qū)域中的k列(右奇異值矢量)并產(chǎn)生其列由所抽取的k列給定的矩陣Vk(具有M行和k列)。此外,矩陣計算器(喜好特定空間發(fā)生器)212抽取在分量矩陣∑的最左區(qū)域中的k列并進一步抽取各個所抽取的k列的第1至第k個元素,并產(chǎn)生其元素由所抽取的元素(對應(yīng)于在原始分量矩陣∑的左上區(qū)域中的k×k元素)給定的矩陣∑k(具有k行和k列)。
然后矩陣計算器(空間發(fā)生器)22計算公式(2)的右手側(cè),由此獲得具有簡并到k的矩陣Dk。所得的矩陣Dk作為矩陣CCM+的近似矩陣CCM*(在下文中,這種近似矩陣被稱為近似矩陣CCM+*)輸送到喜好特定的UPV發(fā)生器202。
將近似矩陣CCM+*(=Dk)的分量矩陣Uk(根據(jù)需要,以及Vk和∑k)輸送到語法字典發(fā)生器7,并且也輸送到分量矩陣存儲單元5以存儲在其中。
矩陣計算器(喜好特定空間發(fā)生器)212也對存儲在CCV存儲單元4中的特征矢量CCV的否定喜好的M個特征矢量CCV執(zhí)行類似的處理。
更具體地說,矩陣計算器(喜好特定空間發(fā)生器)212產(chǎn)生其列通過對矩陣CCM-執(zhí)行奇異值分解和維數(shù)降低產(chǎn)生其列由否定喜好的M個特征矢量CCV(在下文這種近似矩陣稱為近似矩陣CCM-*)給定的N×M矩陣CCM-的近似矩陣CCM*,并且矩陣計算器(喜好特定空間發(fā)生器)212將所得的近似矩陣CCM-*輸送給喜好特定的UPV發(fā)生器202。
近似矩陣CCM-*的分量矩陣Uk(根據(jù)需要,以及矩陣Vk和/或∑k)輸送給語法字典發(fā)生器7,并也輸送給分量矩陣存儲單元5以存儲在其中。
現(xiàn)在,解釋喜好特定的UPV發(fā)生器202。喜好特定的UPV發(fā)生器202包括SVM分類學習單元221和用戶喜好矢量(UPV)發(fā)生器222。
SVM分類學習單元221通過使用SVM(支持矢量機)通過使用從空間發(fā)生器201輸送的近似矩陣CCM+*或CCM-*的列作為訓練數(shù)據(jù)通過執(zhí)行學習產(chǎn)生SVM模型(分類器)。所得的SVM模型存儲在SVM模型存儲單元203中。
用戶喜好矢量(UPV)發(fā)生器222在功能和結(jié)構(gòu)上類似于根據(jù)第一或第二實施例(附圖1或附圖18)的用戶喜好矢量(UPV)發(fā)生器23。
然而,如上文所述,矩陣CCM+的近似矩陣CCM+*和矩陣CCM-的近似矩陣CCM-*從空間發(fā)生器201輸送到用戶喜好矢量(UPV)發(fā)生器222以便這兩種類型的近似矩陣彼此嚴格地區(qū)分開。因此,用戶喜好矢量(UPV)發(fā)生器222可以產(chǎn)生兩種類型的用戶喜好矢量,即基于矩陣CCM+的近似矩陣CCM+*的用戶喜好矢量UPV*(或上下文用戶喜好矢量CUPV*)和基于矩陣CCM-的近似矩陣CCM-*的用戶喜好矢量UPV*(或上下文用戶喜好矢量CUPV*)。注意,可以產(chǎn)生這兩種類型的用戶喜好矢量或可以產(chǎn)生它們中的一種。然而,在此,為實現(xiàn)從用戶感興趣的候選內(nèi)容中選擇內(nèi)容的最終目的,用戶喜好矢量(UPV)發(fā)生器222基于矩陣CCM+的近似矩陣CCM+*產(chǎn)生用戶喜好矢量UPV*(或上下文用戶喜好矢量CUPV*)并將所產(chǎn)生的用戶喜好矢量UPV*存儲在UPV存儲單元6中。
現(xiàn)在,解釋匹配單元204。匹配單元204包括SVM分類器231和匹配計算器232。
為了推薦器9推薦與用戶所處的當前上下文很好地匹配的內(nèi)容,SVM分類器231首先從元信息獲取單元1中獲取指示用戶的當前上下文的上下文信息,并產(chǎn)生其元素由上下文信息的各個權(quán)重值給定的標準形式的特征矢量CCV,即產(chǎn)生當前上下文特征矢量cCCV。
在下文中,使用在SVM模型存儲單元203中存儲的SVM模型(分類器),SVM分類器231確定當前上下文特征矢量cCCV是否是用戶感興趣的。將分類結(jié)果和當前上下文特征矢量cCCV輸送給匹配計算器232。在此,將對用戶感興趣的當前上下文特征矢量cCCV的分類稱為肯定分類,而將肯定分類的當前上下文特征矢量cCCV稱為肯定喜好當前上下文特征矢量cCCV。在另一方面,將對用戶不感興趣的當前上下文特征矢量cCCV的分類稱為否定分類,而將否定分類的當前上下文特征矢量cCCV稱為否定喜好當前上下文特征矢量cCCV。
在肯定喜好當前上下文特征矢量cCCV從SVM分類器231中輸出時,匹配計算器232計算這個當前上下文特征矢量cCCV相對于在UPV存儲單元6中存儲的用戶喜好矢量CUPV*的相似性。匹配計算器232將具有最高的相似性的上下文用戶喜好矢量CUPV*用作與用戶所處的當前上下文最佳地匹配的上下文用戶喜好矢量CUPV*,即作為特定上下文用戶喜好矢量sCUPV*。
在不是上下文用戶喜好矢量CUPV*而是近似矩陣CCM+*的列(肯定喜好特征矢量cCCV*)直接作為用戶喜好矢量UPV*存儲在UPV存儲單元6中時,匹配計算器232計算肯定喜好當前上下文特征矢量cCCV相對于在UPV存儲單元6中存儲的每個用戶喜好矢量UPV*的相似性。匹配計算器232選擇具有等于或高于閾值的相似性的某些用戶喜好矢量UPV*,匹配計算器232產(chǎn)生其元素由所選擇的用戶喜好矢量UPV*的對應(yīng)元素之和給定的標準形式的矢量(即,產(chǎn)生所選擇的用戶喜好矢量UPV*的和矢量),并將所產(chǎn)生的矢量用作用戶所處的當前上下文的上下文用戶喜好矢量CUPV*,即用作特定上下文用戶喜好矢量sCUPV*。
SVM分類器231從元信息獲取單元1中接收與候選內(nèi)容關(guān)聯(lián)的內(nèi)容元信息,SVM分類器231產(chǎn)生其元素由上下文信息的各個權(quán)重值給定并且其對應(yīng)于上下文信息的元素都為0的標準形式的特征矢量CCV。
在下文中,使用在SVM模型存儲單元203中存儲的SVM(分類器),SVM分類器231對特征矢量CCV進行分類并僅在對特征矢量CCV進行肯定分類時將特征矢量CCV輸送給匹配計算器232(在下文中將這種特征矢量CCV稱為特征矢量CCV+)。
一旦接收特征矢量CCV+,匹配計算器232計算特征矢量CCV+相對于特定上下文用戶喜好矢量sCUPV*的相似性并將計算結(jié)果輸送給推薦器9。
注意,對從空間發(fā)生器201到匹配單元204的部件沒有特別限制??臻g發(fā)生器201、喜好特定UPV發(fā)生器202和匹配單元204可以通過軟件、硬件或軟件和硬件的混合實施。
除了從空間發(fā)生器201到匹配單元204的這些部件之外的部件基于與根據(jù)在附圖1的第一實施例或在附圖18中所示的第二實施例的對應(yīng)的部件基本相同。即,在附圖26中,元信息獲取單元1和從CCV存儲單元4到推薦器9的部件在結(jié)果和功能上與在附圖1(或附圖18)中的對應(yīng)的方塊類似,因此在此不對它們重復描述。
現(xiàn)在,下文描述根據(jù)第四實施例通過信息處理設(shè)備執(zhí)行的UPV產(chǎn)生過程。
根據(jù)第四實施例的UPV產(chǎn)生過程的流程在許多方面類似于根據(jù)第一實施例(附圖3)在附圖3中的流程圖中所示的UPV產(chǎn)生過程。
然而,根據(jù)第四實施例的近似矩陣(空間)產(chǎn)生過程(步驟S2)稍稍不同于根據(jù)第一實施例(附圖6)。
附圖27所示為說明根據(jù)第四實施例的近似矩陣(空間)產(chǎn)生過程(步驟S2)的詳細流程的實例的流程圖,下文描述根據(jù)第四實施例的近似矩陣(空間)產(chǎn)生過程(步驟S2)細節(jié)。
首先,在步驟S401中,矩陣計算器(喜好特定空間發(fā)生器)212從CCV存儲單元4中獲取多個特征矢量CCV(連同指示這些特征矢量CCV是具備肯定喜好還是否定喜好的信息一起)。
在步驟S402中,矩陣計算器(喜好特定空間發(fā)生器)212確定各個獲取的特征矢量CCV是具有肯定喜好還是否定喜好。
在步驟S402中確定所獲取的特征矢量CCV具有肯定喜好時,對應(yīng)于在附圖6中的步驟S42至S45的步驟S403至S406被執(zhí)行。更具體地說,矩陣計算器(喜好特定空間發(fā)生器)212產(chǎn)生矩陣CCM+的近似矩陣CCM+*并將它輸送給SVM分類學習單元221。分量矩陣Uk(根據(jù)需要,以及分量矩陣∑k和分量矩陣Vk)存儲在分量矩陣存儲單元5中。
在另一方面,如果在步驟S402中確定所獲取的特征矢量CCV具有否定喜好(不具備肯定喜好),則執(zhí)行對應(yīng)于步驟S42至S45的步驟S407至S410。更具體地說,矩陣計算器(喜好特定空間發(fā)生器)212產(chǎn)生矩陣CCM-的近似矩陣CCM-*并將它輸送給SVM分類學習單元221。分量矩陣Uk(根據(jù)需要,以及分量矩陣∑k和分量矩陣Vk)存儲在分量矩陣存儲單元5中。
在步驟S411中,SVM分類學習單元221通過使用近似矩陣CCM*(近似矩陣CCM+*或CCM-*)作為訓練數(shù)據(jù)通過執(zhí)行SVM學習產(chǎn)生SVM模型。所得的SVM模型存儲在SVM模型存儲單元203中。
因此,完成了根據(jù)第四實施例的近似矩陣(空間)產(chǎn)生過程(在附圖3的步驟S2),以及在附圖2中步驟S3和后面的步驟以類似于第一實施例的方式執(zhí)行,但除了在第四實施例中使用矩陣CCM+的近似矩陣CCM+*之外。
下文描述根據(jù)第四實施例的信息處理設(shè)備執(zhí)行的內(nèi)容推薦過程。
根據(jù)第四實施例的內(nèi)容推薦處理的流程類似于根據(jù)在附圖13中所示的第一實施例的流程。
然而,根據(jù)第四實施例的CUPV設(shè)置過程(步驟S101)與第一實施例(附圖14)的過程稍稍不同,以及根據(jù)第四實施例的內(nèi)容推薦計算過程(步驟S102)也與根據(jù)第一實施例(附圖17)的過程稍稍不同。
附圖28所示為根據(jù)第四的CUPV設(shè)置過程(步驟S101)的細節(jié),附圖29所示為根據(jù)第四實施例的內(nèi)容推薦計算過程(步驟S102)的細節(jié)。首先,參考附圖28,描述根據(jù)第四實施例的CUPV設(shè)置過程(步驟S101)的細節(jié)。在下文中,參考附圖29,描述根據(jù)第四實施例的內(nèi)容推薦計算過程(步驟S102)的細節(jié)。
首先,在附圖28中的步驟S421中,在附圖26中所示的SVM分類器231從元信息獲取單元1(上下文獲取單元14)中獲取當前上下文信息。
在步驟S422中,SVM分類器231從當前上下文信息中產(chǎn)生特征矢量CCV(即產(chǎn)生當前上下文特征矢量cCCV)。
在步驟S423中,SVM分類器231通過使用SVM對當前上下文特征矢量cCCV進行分類。更具體地說,使用在SVM模型存儲單元203中存儲的SVM模型(分類器),SVM分類器231對當前上下文特征矢量cCCV進行肯定或否定地分類。
在步驟S424中,SVM分類器231確定在步驟S423中的分類的結(jié)果。
如果在步驟S424中確定當前上下文特征矢量cCCV具有否定喜好(不具備肯定喜好),則根據(jù)第一實施例的CPU設(shè)置過程結(jié)束。在這種情況下,匹配單元204可以將錯誤消息提供給用戶。
在另一方面,在步驟S424中確定當前上下文特征矢量cCCV具備肯定喜好時,處理進行到步驟S425,在步驟S425中匹配計算器232計算當前上下文特征矢量cCCV相對于在UPV存儲單元6中存儲的每個用戶喜好矢量CUPV*的相似性。
在步驟S426中,匹配計算器232選擇具有最高的相似性的用戶喜好矢量UPV*并將它用作特定上下文用戶喜好矢量sCUPV*。
因此,完成了根據(jù)第四實施例的CUPV設(shè)置過程。
雖然在附圖28中沒有示出,在UPV存儲單元6中存儲的用戶喜好矢量不是上下文用戶喜好矢量CUPV*而是用戶喜好矢量UPV*的情況下,匹配計算器232通過執(zhí)行與根據(jù)第一實施例(步驟S124)的過程類似的過程設(shè)置特定上下文用戶喜好矢量sCUPV*。
在完成了根據(jù)第四實施例的CUPV設(shè)置過程(在附圖13中的步驟S101)之后,執(zhí)行根據(jù)第四實施例的內(nèi)容推薦計算過程(在附圖13中的步驟S102)。
即,在附圖29的步驟S441中,SVM分類器231從元信息獲取單元1(文本分析器12或元數(shù)據(jù)獲取單元13)中獲取多個內(nèi)容中的每個內(nèi)容的內(nèi)容元信息作為要推薦的每個候選內(nèi)容的內(nèi)容元信息。
在步驟S442中,SVM分類器231從每個候選內(nèi)容的每個內(nèi)容元信息中產(chǎn)生特征矢量CCV。即,SVM分類器231產(chǎn)生要推薦的內(nèi)容的每個候選內(nèi)容的每個特征矢量CCV。
在步驟S443中,SVM分類器231通過SVM對要推薦的內(nèi)容的候選內(nèi)容的每個特征矢量CCV進行分類。更具體地說,通過使用在SVM模型存儲單元203中存儲的SVM模型(分類器),SVM分類器231對特征矢量CCV進行肯定或否定分類。
在步驟S444中,SVM分類器231抽取與候選內(nèi)容關(guān)聯(lián)的肯定喜好特征矢量CCV作為要處理的特征矢量CCV+。
在步驟S445中,匹配計算器232計算在步驟S444中抽取的對應(yīng)于各個候選內(nèi)容的每個特征矢量CCV+相對于在步驟S101(附圖13(其細節(jié)在附圖28中示出))中在CUPV設(shè)置過程中設(shè)置的特定上下文用戶喜好矢量sCUPV*的相似性,并將計算結(jié)果輸送給推薦器9。
在步驟S446中,推薦器9選擇對應(yīng)于具有比閾值更高的相似性的特征矢量CCV的內(nèi)容(或?qū)?yīng)于具有最高的相似性的特征矢量CCV的內(nèi)容)并將所選擇的內(nèi)容推薦給用戶。
因此,完成了根據(jù)第四實施例的內(nèi)容推薦計算過程(在附圖13中所示的步驟S102),并且也完成了在附圖13中所示的內(nèi)容推薦過程。
在第四實施例中,如上文所述,使用用戶特定的語法空間(通過矩陣計算器212產(chǎn)生的喜好特定空間)(即使用用戶特定的肯定喜好的最佳空間UPS和否定喜好的最佳空間UPS)學習分類。這使得它適當?shù)貙o定的內(nèi)容進行分類。
雖然在上述的實例中,處理肯定喜好的特征矢量CCV(肯定喜好特征矢量CCV+),但是在推薦內(nèi)容的過程中也可以使用否定喜好的特征矢量CCV(否定喜好特征矢量CCV-)。即,雖然在上述的實例中,在內(nèi)容的選擇過程中僅考慮用戶的肯定喜好,但是也可以考慮用戶的肯定和否定喜好兩者選擇內(nèi)容。
在這種情況下,附圖26中所示的信息處理設(shè)備執(zhí)行如下的過程。
空間發(fā)生器201產(chǎn)生矩陣CCM+的近似矩陣CCM+*以使近似矩陣CCM+*的列由M個肯定喜好特征矢量CCV+給定,以及產(chǎn)生矩陣CCM-的近似矩陣CCM-*以使近似矩陣CCM-*的列由M個否定喜好特征矢量CCV-給定。所得的近似矩陣CCM+*和近似矩陣CCM-*輸送給喜好特定UPV發(fā)生器202。
用戶喜好矢量(UPV)發(fā)生器222從所輸送的近似矩陣CCM-*中產(chǎn)生用戶喜好矢量UPV*(將所產(chǎn)生的用戶喜好矢量UPV*稱為肯定喜好用戶喜好矢量UPV+*),以及用戶喜好矢量(UPV)發(fā)生器222也從所輸送的近似矩陣CCM-*中產(chǎn)生用戶喜好矢量UPV*(所產(chǎn)生的用戶喜好矢量UPV*稱為否定喜好用戶喜好矢量UPV-*)。所得的肯定喜好用戶喜好矢量UPV+*和否定喜好用戶喜好矢量UPV-*都存儲在UPV存儲單元6中。
雖然在附圖26中沒有示出,可以消除SVM分類器231以使來自元信息獲取單元1的信息直接輸送給匹配計算器232。一旦從元信息獲取單元1中接收到新內(nèi)容的內(nèi)容元信息,匹配計算器232就產(chǎn)生該新內(nèi)容的特征矢量CCV。匹配計算器232計算在UPV存儲單元6中存在的每個肯定喜好用戶喜好矢量UPV+*相對于與新內(nèi)容關(guān)聯(lián)的特征矢量CCV的第一相似性,并也計算在UPV存儲單元6中存在的每個否定喜好用戶喜好矢量UPV-*相對于與新內(nèi)容關(guān)聯(lián)的特征矢量CCV的第二相似性。計算結(jié)果(即第一相似性和第二相似性)從匹配計算器232輸送給推薦器9。
推薦器9基于第一相似性和第二相似性確定新內(nèi)容是否適合作為要推薦的內(nèi)容。如果新內(nèi)容被確定為適合,則將新內(nèi)容推薦給用戶。
更具體地說,如果第一相似性等于或高于第一閾值并且第二相似性低于第二閾值,則推薦器9確定新內(nèi)容適合作為要推薦的內(nèi)容,因此推薦器9將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
可替換地,如果第一相似性高于第二相似性并且第二相似性低于閾值,則推薦器9確定新內(nèi)容適合作為要推薦的內(nèi)容,因此推薦器9將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
第五實施例現(xiàn)在,參考附圖30至33,下文描述根據(jù)第五實施例的信息處理設(shè)備。
在描述第五實施例之前,描述根據(jù)第五實施例關(guān)于信息處理設(shè)備的發(fā)明的背景技術(shù)。
通常使用的內(nèi)容元數(shù)據(jù)包括類型描述的項目。在與電視廣播節(jié)目關(guān)聯(lián)的內(nèi)容元數(shù)據(jù)的情況下,例如將內(nèi)容元數(shù)據(jù)分類為主類型比如體育、戲劇、電影和各種表演。每個主類型具有子類型。例如,各種表演類型具有子類型比如喜劇、流行音樂表演、一般表演等。
然而,從上述的實例中可以理解,內(nèi)容不一定分類到恰當?shù)淖宇愋椭?。對用戶來說分類通常不正確。
為解決上述問題,本發(fā)明的發(fā)明人已經(jīng)發(fā)明了如下的技術(shù)。
在近似矩陣CCM*(通過奇異值分解和維數(shù)降低從矩陣CCM中產(chǎn)生的)中,通過普通方法對內(nèi)容元信息(字)進行族化(分類)并將每個族(類別)用作一種類型。這種類型在此稱為UP類型以與常規(guī)的類型相區(qū)別。然后通過使用SVM使用UP類型作為訓練數(shù)據(jù)通過執(zhí)行學習形成SVM模型(分類器)。通過使用形成的SVM模型(分類器),確定新內(nèi)容的UP類型。在UP類型的確定中,不需要與該內(nèi)容關(guān)聯(lián)的上下文信息。
在這種技術(shù)中,UP類型不需要具有它們的類型名稱,或者可以使用字、組合或具有最高的權(quán)重的字作為類型的名稱。
本技術(shù)可用于推薦特定的類型的內(nèi)容,并且也可以用于將彼此類似的多個內(nèi)容提供給用戶。
本發(fā)明上述的技術(shù)提供了一種信息處理設(shè)備。該信息處理設(shè)備的實例在附圖30中示出。
即,附圖30所示為根據(jù)本發(fā)明的第五實施例的信息處理設(shè)備。在附圖30中,通過類似的參考標號表示與根據(jù)第四實施例(附圖26)的信息處理設(shè)備的部件類似的部件。
在根據(jù)第五實施例的信息處理設(shè)備中,以UPV/UP類型發(fā)生器302替代根據(jù)第四實施例的喜好特定UPV發(fā)生器202,以類型確定單元304替代根據(jù)第四實施例的匹配單元204,以及以在功能和結(jié)構(gòu)類似于SVM模型存儲單元203(但其差別在于其中存儲的模型是不同的)的SVM模型存儲單元303替代根據(jù)第四實施例的SVM模型存儲單元203。
UPV/UP類型發(fā)生器302包括SVM分類學習單元(UP類型發(fā)生器)321和用戶喜好矢量(UPV)發(fā)生器322。
SVM分類學習單元(UP類型發(fā)生器)321在功能和結(jié)構(gòu)上于根據(jù)第四實施例的SVM分類學習單元221類似。然而,與形成用于將內(nèi)容分類為肯定喜好組或否定喜好組的SVM模型的SVM分類學習單元221不同的是,SVM分類學習單元(UP類型發(fā)生器)321形成確定新內(nèi)容的UP類型的SVM模型。
根據(jù)第五實施例的用戶喜好矢量(UPV)發(fā)生器322在功能和結(jié)構(gòu)上類似于根據(jù)第四實施例的用戶喜好矢量(UPV)發(fā)生器222,因此在此不再描述它。
類型確定單元304包括在功能和結(jié)構(gòu)上基本類似于根據(jù)第四實施例的SVM分類器231的SVM分類器331。然而,與根據(jù)第四實施例確定給定的新內(nèi)容(與該內(nèi)容關(guān)聯(lián)的內(nèi)容元信息)是否具有肯定喜好或否定喜好的SVM分類器231不同的是,根據(jù)第五實施例的SVM分類器321確定給定的新內(nèi)容的UP類型(即,將給定的新內(nèi)容分為UP類型中的一種類型)。
對UPV/UP類型發(fā)生器302、SVM模型存儲單元303和類型確定單元304的形式?jīng)]有特別限制。注意,UPV和UP類型發(fā)生器302和類型確定單元304可以通過軟件、硬件和軟件和硬件的混合實施。
除了UPV/UP類型發(fā)生器302、SVM模型存儲單元303和類型確定單元304之外的部件與根據(jù)在附圖26中所示的第四實施例的對應(yīng)部件基本相同。更具體地說,在附圖30中,元信息獲取單元1、空間發(fā)生器201、CCV存儲單元4、分量矩陣存儲單元5、UPV存儲單元6、語法字典發(fā)生器7、相關(guān)信息獲取單元8和推薦器9每個都在功能和結(jié)構(gòu)上與在附圖26中所示的各個方塊類似,因此在此不再重復它們的描述。
現(xiàn)在,參考附圖31中所示的流程圖,描述根據(jù)第五實施例通過信息處理設(shè)備(附圖30)執(zhí)行的UP產(chǎn)生過程。
首先,在步驟S501中,執(zhí)行CCV產(chǎn)生過程。在步驟S502中,執(zhí)行近似矩陣(空間)產(chǎn)生過程。在步驟S503中,執(zhí)行CUPV產(chǎn)生過程。
CCV產(chǎn)生過程(步驟S501)、近似矩陣(空間)產(chǎn)生過程(步驟S502)和CUPV產(chǎn)生過程(步驟S503)以類似于根據(jù)先前的實施例的對應(yīng)過程的方式執(zhí)行。即,CCV產(chǎn)生過程(步驟S501)根據(jù)在附圖4中所示的流程圖執(zhí)行,近似矩陣(空間)產(chǎn)生過程(步驟S502)根據(jù)在附圖6中所示的流程圖執(zhí)行,以及CUPV產(chǎn)生過程(步驟S503)根據(jù)在附圖12中所示的流程圖執(zhí)行。
在步驟S504中,SVM分類學習單元(UP類型發(fā)生器)321產(chǎn)生一個或多個UP類型。SVM分類學習單元(UP類型發(fā)生器)321然后通過使用UP類型作為訓練數(shù)據(jù)通過執(zhí)行SVM學習產(chǎn)生SVM模型。所得的SVM模型存儲在SVM存儲單元303中。這個SVM模型用于在步驟S544中的內(nèi)容推薦過程以使如下文參考附圖33進一步詳細描述在給定新內(nèi)容時類型確定單元304基于這個SVM模型從通過SVM分類學習單元(UP類型發(fā)生器)321產(chǎn)生的一個或多個UP類型中選擇與該內(nèi)容最佳匹配的類型并將它用作該內(nèi)容的UP類型。
通過SVM分類學習單元(UP類型發(fā)生器)321執(zhí)行的這種過程(步驟S504)稱為UP類型產(chǎn)生過程。附圖32所示為UP類型產(chǎn)生過程(步驟S504)的詳細流程的實例的流程圖。參考附圖32,下文詳細地描述UP類型產(chǎn)生過程(步驟S504)。
首先,在步驟S521中,SVM分類學習單元(UP類型發(fā)生器)321根據(jù)在各個元素中描述的上下文信息計算在從空間發(fā)生器201輸送的近似矩陣CCM*的列中的元素的相似性,即在近似矩陣CCM*的特征矢量CCV*中的相似性。
在步驟S522中,SVM分類學習單元(UP類型發(fā)生器)321對每個特征矢量CCV*進行分類,更具體地說,SVM分類學習單元(UP類型發(fā)生器)321選擇具有等于或高于閾值的相似性的特征矢量CCV*并將它們分為相同的類別。以上述方式產(chǎn)生的每個類別用作UP類型。因此,在上述的步驟S522中,產(chǎn)生UP類型。
更具體地說,例如,在附圖11中所示的矩陣Dk作為近似矩陣CCM*從空間發(fā)生器201輸送時,SVM分類學習單元(UP類型發(fā)生器)321檢查在特征矢量中的元素(字)的相似性并進行分類以使特征矢量CCV*1、CCV*3和CCV*6(對應(yīng)于文件DOC1、DOC3和DOC6)分為第一類型并將其它的特征矢量分為第二類型。因此,在本實例中,SVM分類學習單元(UP類型發(fā)生器)321產(chǎn)生第一類型和第二類型。
在這個具體實例中,第一類型可以命名為“幼兒園”或“小孩”,而第二類型可以命名為“公司”或“緊張”。
在步驟S523中,SVM分類學習單元(UP類型發(fā)生器)321執(zhí)行屬于每個類別(UP類型)的特征矢量CCV*(例如對應(yīng)于屬于第一類型的特征矢量CCV*1、CCV*3和CCV*6)的SVM學習以產(chǎn)生每個類別(UP類型)的SVM模型。所得的每種類別(UP類型)的SVM模型存儲在SVM存儲單元303中。
因此,完成UP類型產(chǎn)生過程(在附圖31中步驟S504),并完成根據(jù)第五實施例(附圖31)的UPV產(chǎn)生過程。
下文描述根據(jù)第五實施例通過信息處理設(shè)備執(zhí)行的內(nèi)容推薦過程。
根據(jù)第五實施例的內(nèi)容推薦過程的流程類似于在附圖13中所示的根據(jù)第一(或第四)實施例的流程。
然而,根據(jù)第五實施例的內(nèi)容推薦計算過程(步驟S102)稍稍不同于根據(jù)第一實施例(附圖17)的過程。附圖33所示為根據(jù)第五實施例的內(nèi)容推薦計算過程(步驟S102)的詳細流程的實例。參考附圖33,下文描述根據(jù)第五實施例的內(nèi)容推薦計算過程(步驟S102)的細節(jié)。
首先,在步驟S541中,在附圖30中所示的類型確定單元304的SVM分類器331通過使用SVM對在步驟S101(在附圖13中所示,其細節(jié)在附圖14中示出)的CUPV產(chǎn)生過程中產(chǎn)生的特定上下文用戶喜好矢量sCUPV*進行分類,由此確定它的UP類型。即,使用存儲在SVM模型存儲單元203中的SVM模型(分類器),SVM分類器331將特定上下文用戶喜好矢量sCUPV*分為在UP類型中的一種類型。
在步驟S541中的處理結(jié)果(即特定上下文用戶喜好矢量sCUPV*的UP類型)輸送給推薦器9。
在步驟S542中,SVM分類器331從元信息獲取單元1(文本分析器12或元數(shù)據(jù)獲取單元13)中獲取要推薦的每個候選內(nèi)容的內(nèi)容元信息作為多個內(nèi)容的每個內(nèi)容的內(nèi)容元信息。
在步驟S543中,SVM分類器331從與每個候選內(nèi)容關(guān)聯(lián)的內(nèi)容元信息中產(chǎn)生特征矢量CCV。即,SVM分類器331產(chǎn)生每個候選內(nèi)容的每個特征矢量CCV。
在步驟S544中,SVM分類器331通過使用SVM對與各個候選內(nèi)容關(guān)聯(lián)的每個特征矢量CCV進行分類,由此確定它的UP類型。更具體地說,使用在SVM模型存儲單元203中存儲的SVM模型(分類器),SVM分類器331將每個特征矢量CCV分為UP類型中的一種類型。
在步驟S544中的處理結(jié)果(即每個候選內(nèi)容的UP類型)輸送給推薦器9。
在步驟S545中,推薦器9選擇其UP類型與特定上下文用戶喜好矢量sCUPV*的UP類型相同的內(nèi)容并將它推薦給用戶。
因此,完成了根據(jù)第五實施例的內(nèi)容推薦計算過程(在附圖13中所示的步驟S102),并且也完成了在附圖13中所示的內(nèi)容推薦過程。
在第五實施例中,如上文所述,從包括上下文信息的特征矢量CCV*中產(chǎn)生UP類型,并將新內(nèi)容分為這些UP類型中的一種類型。注意,從用戶看的上下文反映在通過上文描述的過程產(chǎn)生的UP類型中,由此所得的UP類型與用戶特定的各種各樣的上下文很好地匹配,這與基于元數(shù)據(jù)形成的常規(guī)類型不同。
其它的實施例上文參考第一至第五實施例已經(jīng)描述了根據(jù)本發(fā)明的信息處理設(shè)備。然而,本發(fā)明不限于這些實施例,而是本發(fā)明還可以以其它各種方式實施。
例如,本發(fā)明可以應(yīng)用到單個的信息處理設(shè)備或者可以應(yīng)用到包括多個信息處理設(shè)備的信息處理設(shè)備,如附圖34所示。
附圖34所示為根據(jù)本發(fā)明的信息處理系統(tǒng)的功能性結(jié)構(gòu)的實例。在附圖34中,與根據(jù)第一至第五實施例(附圖1、附圖18、附圖26或附圖30)中的一個的信息處理設(shè)備的部件類似的部件以類似的參考標號表示。
如附圖34所示,在這個信息系統(tǒng)中,服務(wù)器401和客戶403彼此通過網(wǎng)絡(luò)402連接。對網(wǎng)絡(luò)402的具體形式?jīng)]有限制。例如,可以使用纜線網(wǎng)絡(luò)或無線網(wǎng)絡(luò)。
首先,解釋服務(wù)器401。服務(wù)器401包括高計算能力處理器411、計算結(jié)果存儲單元412和通信單元413。
在各種處理中,需要高計算能力處理器的處理比如矩陣的計算通過高計算能力處理器411執(zhí)行。更具體地說,高計算能力處理器411執(zhí)行對應(yīng)于如下過程的處理通過空間/UPV發(fā)生器2執(zhí)行的過程(附圖1或18)、通過空間發(fā)生器201執(zhí)行的過程(附圖26)、通過喜好特定的UPV發(fā)生器202執(zhí)行的過程(附圖26或30)和通過UPV/UP類型發(fā)生器302執(zhí)行的過程(附圖30)(即高計算能力處理器411可以被看作包括對應(yīng)于在附圖34中上文所述的那些部件的方塊)。
計算結(jié)果存儲單元412存儲通過高計算能力處理器411執(zhí)行的計算的結(jié)果(和/或存儲在計算中需要的信息)。即,計算結(jié)果存儲單元412對應(yīng)于CCV存儲單元4(附圖1、18、26或30)、分量矩陣存儲單元5(附圖1、18、26或30)、SVM存儲單元303(附圖26或30)和UPV存儲單元6(附圖1、18、26或30)。
通信單元413控制通過網(wǎng)絡(luò)402與客戶403的通信。更具體地說,如果通信單元413從客戶403通過網(wǎng)絡(luò)402接收要被高計算能力處理器411使用的信息,則通信單元413將所接收的信息傳送給高計算能力處理器411。在通信單元413通過網(wǎng)絡(luò)402從客戶403接收與通過用戶使用的內(nèi)容關(guān)聯(lián)的內(nèi)容元信息和指示其中用戶使用該內(nèi)容的上下文的上下文信息時,通信單元413將所接收的彼此關(guān)聯(lián)的信息存儲在計算結(jié)果存儲單元412中。通信單元413從計算結(jié)果存儲單元412中獲取客戶403使用的信息并通過網(wǎng)絡(luò)402將它發(fā)送給客戶403。
現(xiàn)在,解釋客戶403??蛻?03包括元信息獲取單元1、語法字典發(fā)生器7、相關(guān)信息獲取單元8和推薦器9,如上文所述,并且進一步包括推薦計算單元421、通信單元422、語音輸出單元423和顯示器424。
推薦計算單元421執(zhí)行對應(yīng)于如下過程的處理通過匹配單元3執(zhí)行的過程(附圖1)、通過投影匹配單元101執(zhí)行的過程(附圖18)、通過匹配單元204執(zhí)行的過程(附圖26)和通過類型確定單元304執(zhí)行的過程(即推薦計算單元421可以被看作包括對應(yīng)于在附圖34中上文所描述的部件的方塊)。
通信單元422控制通過網(wǎng)絡(luò)402與服務(wù)器401的通信。更具體地說,在通信單元422從另一信息處理設(shè)備(未示)通過網(wǎng)絡(luò)402接收內(nèi)容數(shù)據(jù)或EPG數(shù)據(jù)時,通信單元422將所接收的數(shù)據(jù)傳遞給元信息獲取單元1。通信單元422也用于將從元信息獲取單元1輸送的內(nèi)容元信息或上下文信息通過網(wǎng)絡(luò)402傳送給服務(wù)器401。此外,通信單元422也用于根據(jù)要求將從服務(wù)器401通過網(wǎng)絡(luò)402接收的各種各樣的信息傳送給推薦計算單元421、語法字典發(fā)生器7或相關(guān)信息獲取單元8。
在語音信息被包括在指示要推薦的內(nèi)容的信息(從推薦器9中輸出的)中時,語音輸出單元423輸出對應(yīng)于語音信息的語音。在圖像信息(靜態(tài)圖像或運動圖像信息)包括在指示要推薦的內(nèi)容的信息(從推薦器9中輸出的)中時,對應(yīng)于圖像信息的圖像顯示在顯示器424上。
在附圖34中所示的信息處理系統(tǒng)執(zhí)行如下的過程。
如上文所述,服務(wù)器401具有高計算能力處理器411(具有在矩陣計算過程中需要的執(zhí)行復雜處理的高計算能力)并產(chǎn)生其中收集用戶的經(jīng)歷的用戶喜好空間UPS(近似矩陣CCM*)。
更具體地說,客戶403將與用戶使用的內(nèi)容關(guān)聯(lián)的內(nèi)容元信息和指示其中用戶使用該內(nèi)容的上下文的上下文信息通過網(wǎng)絡(luò)402發(fā)送給服務(wù)器401。
在累計的信息(內(nèi)容元信息和上下文信息)的量足夠時,服務(wù)器412產(chǎn)生如上文所描述的矩陣CCM并通過奇異值分解和維數(shù)降低進一步產(chǎn)生近似矩陣CCM*和分量矩陣Uk、∑k和Vk。所得的矩陣存儲在服務(wù)器401中設(shè)置的計算結(jié)果存儲單元412中。服務(wù)器412根據(jù)要求將包括從這些矩陣中產(chǎn)生的近似矩陣CCM*、近似矩陣CCM*的分量矩陣Uk、∑k和Vk和/或用戶喜好矢量UPV*的信息通過網(wǎng)絡(luò)402輸送給客戶403。
一旦接收該信息,客戶403執(zhí)行所需的處理比如對所接收的信息的匹配處理。
為選擇要推薦的內(nèi)容,如上文在第四和第五實施例所述,要求通過使用SVM等執(zhí)行預濾波處理以從所有的候選內(nèi)容中檢測與用戶的喜好匹配的候選內(nèi)容。在根據(jù)本發(fā)明的信息處理系統(tǒng)中,雖然在附圖34中沒有示出,可以通過服務(wù)器401執(zhí)行預濾波處理。例如,根據(jù)第四實施例的處理被如下地執(zhí)行??蛻?03將與用戶使用的內(nèi)容關(guān)聯(lián)的內(nèi)容元信息連同指示該內(nèi)容是否是用戶感興趣(即該內(nèi)容是否具有肯定或否定喜好)的信息通過網(wǎng)絡(luò)402發(fā)送給服務(wù)器401。相應(yīng)地,服務(wù)器401通過執(zhí)行上述的SVM學習確定分隔面(指示用戶的喜好的SVM模型),并根據(jù)要求將結(jié)果通過網(wǎng)絡(luò)402發(fā)送給客戶403。
在用戶不希望公開他/她隱私的情況下,分隔面的計算(SVM模型)可以通過客戶403執(zhí)行并將結(jié)果通過網(wǎng)絡(luò)402發(fā)送給服務(wù)器401。在這種情況下,通過服務(wù)器401執(zhí)行濾波,并且服務(wù)器401僅將與用戶的喜好匹配的內(nèi)容元信息發(fā)送給客戶403而不是發(fā)送所有的候選內(nèi)容的內(nèi)容元信息。這可以減少所發(fā)送的數(shù)據(jù)量,并且也可以減少通過客戶403執(zhí)行的匹配計算的復雜性。
注意,上述的所有的過程都可以通過客戶403執(zhí)行。即,處理序列的任何步驟都可以通過服務(wù)器401或客戶403執(zhí)行,只要作為整體執(zhí)行了處理序列即可。
上文描述的處理步驟的序列可以通過硬件或軟件執(zhí)行。
例如,根據(jù)第一至第五實施例(附圖1、18、26或30)的信息處理設(shè)備或在附圖34中所示的服務(wù)器401或客戶403可以使用在個人計算機(比如在附圖35中所示的)中的軟件實施。
如附圖35所示,根據(jù)在ROM(只讀存儲器502)中存儲的程序或根據(jù)從存儲單元508裝入到RAM(隨機存取存儲器)503中的程序執(zhí)行過程處理。RAM 503也可用于存儲在執(zhí)行過程處理的過程中通過CPU501使用的數(shù)據(jù)。
CPU501、ROM502和RAM503都通過總線504彼此連接??偩€504也連接到輸入/輸出接口505。
輸入/輸出接口505連接到包括鍵盤、鼠標和/或等的輸入單元506、輸出單元507比如顯示器、存儲單元508比如硬盤和包括調(diào)制解調(diào)器、終端適配器和/或等的通信單元509。通信單元509可以通過網(wǎng)絡(luò)比如因特網(wǎng)與另一信息處理設(shè)備(未示)進行通信。
此外,輸入/輸出接口505根據(jù)要求與驅(qū)動器510連接。根據(jù)需要,可取下的存儲媒體511比如磁盤、光盤、磁光盤或半導體存儲器安裝在驅(qū)動器510上,并且計算機程序從可取下的存儲媒體511中讀取并根據(jù)需要安裝到存儲單元508。
在通過軟件執(zhí)行處理序列時,可以從媒體或通過網(wǎng)絡(luò)將形成軟件的程序安裝到作為專用硬件提供的計算機或可以安裝到能夠根據(jù)在其上安裝的各種程序執(zhí)行不同的處理的通用計算機中。
適合于上述目的的存儲媒體的具體實例是可取下的存儲媒體511比如磁盤(比如軟盤)、光盤(比如CD-ROM(只讀壓縮盤存儲器))和DVD(數(shù)字通用盤)、磁光盤(比如MD(Mini-Disk,商標))和半導體存儲器,如附圖35所示。程序可以存儲在這種可取下的存儲媒體中(以包裝媒體的形式)并可以從計算機分別輸送給用戶。程序也可以通過將它預安裝到在計算機中設(shè)置的內(nèi)置的ROM 502或存儲單元508比如硬盤而將它提供給用戶。
在本說明書中,在存儲媒體中存儲的程序的步驟可以根據(jù)在程序中描述的順序以時間順序執(zhí)行或者并行或分離的方式執(zhí)行。
注意,在本說明書中術(shù)語“系統(tǒng)”用于描述包括多個設(shè)備或處理單元的總體結(jié)構(gòu)。
權(quán)利要求
1.一種信息處理設(shè)備,該信息處理設(shè)備包括修改裝置,用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù);產(chǎn)生裝置,用于從M個信息組中產(chǎn)生在相似性的計算中用作參考的包括N條單個信息的參考信息組,該M個信息組中每個包括通過修改裝置修改的N條單個信息;和相似性計算裝置,用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于由產(chǎn)生裝置產(chǎn)生的參考信息組的相似性。
2.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其中通過修改裝置獲取的M個信息組每個的N條單個信息包括指示特定的內(nèi)容或特定的內(nèi)容的一部分或指示該內(nèi)容的屬性的至少一條或多條內(nèi)容元信息,并且也包括指示用戶使用內(nèi)容的內(nèi)部或外部狀態(tài)的至少一條或多條上下文信息。
3.根據(jù)權(quán)利要求2所述的信息處理設(shè)備,其中上下文信息包括作為權(quán)重分配給指示用戶的空間位置的位置信息的值或它的歸一化值。
4.根據(jù)權(quán)利要求2所述的信息處理設(shè)備,其中上下文信息包括作為權(quán)重分配給指示用戶的情緒的情緒信息的值或歸一化值。
5.根據(jù)權(quán)利要求2所述的信息處理設(shè)備,其中上下文信息包括通過用戶或通過設(shè)置在用戶的附近的傳感器獲取的值或它的歸一化值。
6.根據(jù)權(quán)利要求2所述的信息處理設(shè)備,其中修改裝置包括矢量化裝置,在每次用戶使用內(nèi)容時,該矢量化裝置用于獲取包括與該內(nèi)容相關(guān)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,以及產(chǎn)生其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;以及矩陣產(chǎn)生裝置,在通過矢量化裝置產(chǎn)生M個特征矢量時,該矩陣產(chǎn)生裝置用于產(chǎn)生具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分地修改的第二矩陣以便突出在M列的每列中N行元素的相關(guān)性,其中該產(chǎn)生裝置基于通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的M列產(chǎn)生包括N個元素的參考矢量作為參考信息組;以及該相似性計算裝置從比較信息組中產(chǎn)生包括N個元素的比較矢量并計算比較矢量和由產(chǎn)生裝置產(chǎn)生的參考矢量之間的相似性。
7.根據(jù)權(quán)利要求6所述的信息處理設(shè)備,其中產(chǎn)生裝置選擇第二矩陣的M列的至少一個或多個列并將在所有選擇的列中的每行中的元素相加在一起,由此產(chǎn)生參考矢量。
8.根據(jù)權(quán)利要求7所述的信息處理設(shè)備,其中產(chǎn)生裝置根據(jù)對應(yīng)于上下文信息的元素從第二矩陣的M列中選擇彼此具有較高的相似性的列,并將在所有選擇的列中的每行中的元素相加在一起,由此產(chǎn)生參考矢量。
9.根據(jù)權(quán)利要求7所述的信息處理設(shè)備,其中產(chǎn)生裝置根據(jù)對應(yīng)于上下文信息的元素從第一矩陣的M列中選擇彼此具有較高的相似性的列,并進一步從第二矩陣中選擇對應(yīng)于第一矩陣的所選擇的列的列并將在從第二矩陣中選擇的所有的列中的每行中的元素相加在一起,由此產(chǎn)生參考矢量。
10.根據(jù)權(quán)利要求6所述的信息處理設(shè)備,其中產(chǎn)生裝置通過直接運用由矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的各個M列產(chǎn)生參考矢量。
11.根據(jù)權(quán)利要求6所述的信息處理設(shè)備,其中矢量化裝置將權(quán)重值分配給N條單個信息中的每個以使權(quán)重值等于相應(yīng)條的單個信息在該內(nèi)容中出現(xiàn)的次數(shù)或等于它的歸一化值。
12.根據(jù)權(quán)利要求6所述的信息處理設(shè)備,其中矢量化裝置產(chǎn)生其元素分別通過分配給各個N條單個信息的權(quán)重值和N個可變系數(shù)的乘積給定的特征矢量。
13.根據(jù)權(quán)利要求6所述的信息處理設(shè)備,其中相似性計算裝置獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素通過分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算比較矢量和參考矢量之間的相似性,以及其中信息處理設(shè)備進一步包括提供裝置,如果通過相似性計算裝置計算的相似性等于或高于閾值則該提供裝置將新內(nèi)容作為推薦內(nèi)容提供給用戶。
14.根據(jù)權(quán)利要求13所述的信息處理設(shè)備,其中在提供裝置將推薦的內(nèi)容提供給用戶時,提供裝置也提供基于參考矢量推薦的原因。
15.根據(jù)權(quán)利要求13所述的信息處理設(shè)備,其中相似性計算裝置通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取包括與用戶當前使用的內(nèi)容關(guān)聯(lián)的N條單個信息的信息組;將權(quán)重值分配給各個N條單個信息,以及產(chǎn)生其元素由分配給用戶當前使用的內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量;計算在產(chǎn)生的特征矢量和由產(chǎn)生裝置產(chǎn)生的一個或多個參考矢量之間的相似性;基于具有等于或高于閾值的相似性的參考矢量產(chǎn)生新的參考矢量;以及在產(chǎn)生了比較矢量之后,計算參考矢量和比較矢量之間的相似性。
16.根據(jù)權(quán)利要求13所述的信息處理設(shè)備,其中相似性計算裝置通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取指示用戶所在的當前上下文的一條或多條上下文信息;將權(quán)重值分配給各條的上下文信息;產(chǎn)生其對應(yīng)于各條的上下文信息的元素由分配的權(quán)重值給定以及其它的元素由0給定的當前上下文特征矢量;計算當前上下文特征矢量和由產(chǎn)生裝置產(chǎn)生的一個或多個參考矢量之間的相似性;基于具有等于或高于閾值的相似性的參考矢量產(chǎn)生新的參考矢量;以及在產(chǎn)生了比較矢量之后,計算參考矢量和比較矢量之間的相似性。
17.根據(jù)權(quán)利要求6所述的信息處理設(shè)備,其中矩陣產(chǎn)生裝置通過如下過程產(chǎn)生第二矩陣將第一矩陣分解為具有N行和N列的第一分量矩陣、具有N行和M列的第二分量矩陣和具有M行和M列的第三分量矩陣的轉(zhuǎn)置陣的乘積;從第一分量矩陣中產(chǎn)生具有N行和K列的第四分量矩陣,這里K是小于第一矩陣的等級的整數(shù),從第二分量矩陣中產(chǎn)生具有K行和K列的第五分量矩陣,以及從第三分量矩陣中產(chǎn)生具有M行和K列的第六分量矩陣;以及產(chǎn)生通過第四分量矩陣、第五分量矩陣和第六分量矩陣的轉(zhuǎn)置陣的乘積給定第二矩陣。
18.根據(jù)權(quán)利要求17所述的信息處理設(shè)備,其中相似性計算裝置通過如下過程計算相似性獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給各個N條單個信息,產(chǎn)生其元素由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,通過將比較矢量和參考矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將比較矢量和參考矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算維數(shù)減小到K的比較矢量和維數(shù)減小到K的參考矢量之間的相似性,以及其中信息處理設(shè)備進一步包括提供裝置,如果通過相似性計算裝置計算的相似性等于或高于閾值,則提供裝置將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
19.根據(jù)權(quán)利要求18所述的信息處理設(shè)備,其中在提供裝置將推薦的內(nèi)容提供給用戶時,提供裝置也提供基于參考矢量推薦的原因。
20.根據(jù)權(quán)利要求18所述的信息處理設(shè)備,其中相似性計算裝置通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取包括與用戶當前使用的內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,以及產(chǎn)生其元素由分配給用戶當前使用的內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量;通過將特征矢量和一個或多個參考矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將所產(chǎn)生的特征矢量和一個或多個參考矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量;計算維數(shù)減小到K的特征矢量和維數(shù)減小到K的一個或多個參考矢量之間的相似性,以及基于具有等于或高于閾值的相似性的維數(shù)減小的參考矢量產(chǎn)生新的K-維參考矢量;在產(chǎn)生了比較矢量之后,通過將比較矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將比較矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量,以及計算新的K-維參考矢量和具有減小到K的維數(shù)的比較矢量之間的相似性。
21.根據(jù)權(quán)利要求18所述的信息處理設(shè)備,其中相似性計算裝置通過如下過程計算相似性在產(chǎn)生比較矢量之前,進一步獲取指示用戶所在的當前上下文的一條或多條上下文信息,將權(quán)重值分配給各條的上下文信息,產(chǎn)生其對應(yīng)于各條的上下文信息的元素由分配的權(quán)重值給定以及其它的元素由0給定的當前上下文特征矢量;通過將當前上下文特征矢量和一個或多個參考矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將當前上下文特征矢量和由產(chǎn)生裝置產(chǎn)生的一個或多個參考矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量;計算維數(shù)減小到K的當前上下文特征矢量和維數(shù)減小到K的一個或多個參考矢量之間的相似性,以及基于具有等于或高于閾值的相似性的維數(shù)減小的參考矢量產(chǎn)生新的K-維參考矢量;在產(chǎn)生了比較矢量之后,通過將比較矢量從左邊乘以第四分量矩陣的轉(zhuǎn)置陣將比較矢量轉(zhuǎn)換為其維數(shù)降低到K的矢量;以及計算新的K-維參考矢量和維數(shù)減小到K的比較矢量之間的相似性。
22.根據(jù)權(quán)利要求6所述的信息處理設(shè)備,其中在每次產(chǎn)生特征矢量時,矢量化裝置將產(chǎn)生的特征矢量分類為指示用戶的肯定喜好因素的肯定喜好特征矢量或者指示用戶的否定喜好因素的否定喜好特征矢量。
23.根據(jù)權(quán)利要求22所述的信息處理設(shè)備,其中矩陣產(chǎn)生裝置使用由矢量化裝置產(chǎn)生的M個肯定喜好特征矢量產(chǎn)生第二矩陣。
24.根據(jù)權(quán)利要求23所述的信息處理設(shè)備,其中信息處理設(shè)備進一步包括通過使用矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的列作為訓練數(shù)據(jù)通過學習分類用于產(chǎn)生分類器的學習裝置;和分類裝置,用于通過如下過程進行分類獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,產(chǎn)生其元素通過分配給新內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,以及使用由學習裝置產(chǎn)生的分類器對與新內(nèi)容關(guān)聯(lián)的特征矢量分類為肯定喜好特征矢量或否定喜好特征矢量。
25.根據(jù)權(quán)利要求24所述的信息處理設(shè)備,其中相似性計算裝置運用通過分類裝置分類為肯定喜好特征矢量的特征矢量作為比較矢量并計算比較矢量和參考矢量之間的相似性。
26.根據(jù)權(quán)利要求23所述的信息處理設(shè)備,其中信息處理設(shè)備進一步包括登記裝置,該登記裝置用于選擇通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣的列的一個或多個特定的元素,并在用戶的個人字典中登記識別每個所選擇的元素的字作為用戶感興趣的字或用戶不感興趣的字。
27.根據(jù)權(quán)利要求23所述的信息處理設(shè)備,其中在通過矢量化裝置產(chǎn)生M個否定喜好特征矢量時,矩陣產(chǎn)生裝置進一步使用M個否定喜好特征矢量產(chǎn)生第二矩陣;該產(chǎn)生裝置基于通過矩陣產(chǎn)生裝置產(chǎn)生的M個肯定喜好特征矢量從通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣中產(chǎn)生第一參考矢量,以及進一步基于否定喜好特征矢量從通過矩陣產(chǎn)生裝置產(chǎn)生的第二矩陣中產(chǎn)生第二參考矢量;以及該相似性計算裝置計算比較矢量和第一參考矢量之間的第一相似性,也計算比較矢量和第二參考矢量之間的第二相似性。
28.根據(jù)權(quán)利要求27所述的信息處理設(shè)備,其中相似性計算裝置獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組作為比較信息,將權(quán)重值分配給N條單個信息中的每個,產(chǎn)生其元素由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算第一相似性和第二相似性;和該信息處理設(shè)備進一步包括提供裝置,該提供裝置用于基于通過相似性計算裝置計算的第一相似性和第二相似性確定新內(nèi)容是否適合作為要推薦的內(nèi)容,并且如果確定新內(nèi)容是適合的則將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
29.根據(jù)權(quán)利要求28所述的信息處理設(shè)備,其中在提供裝置將推薦的內(nèi)容提供給用戶時,提供裝置也提供基于參考矢量推薦的原因。
30.根據(jù)權(quán)利要求28所述的信息處理設(shè)備,其中如果第一相似性等于或高于第一閾值并且第二相似性低于第二閾值,則提供裝置確定新內(nèi)容適合作為推薦的內(nèi)容并將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
31.根據(jù)權(quán)利要求28所述的信息處理設(shè)備,其中如果第一相似性等于或高于第二相似性并且第二相似性低于閾值,則提供裝置確定新內(nèi)容適合作為推薦的內(nèi)容并將新內(nèi)容作為推薦的內(nèi)容提供給用戶。
32.一種信息處理方法,包括修改步驟,用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息,以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù);產(chǎn)生步驟,用于從M個信息組中產(chǎn)生包括N條單個信息的參考信息組以在相似性的計算中用作參考,該M個信息組中每個包括在修改步驟中修改的N條單個信息,和相似性計算步驟,用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于在產(chǎn)生步驟中產(chǎn)生的參考信息組的相似性。
33.一種計算機執(zhí)行的程序,包括修改步驟,用于獲取每個包括N條單個信息的M個信息組并至少部分地修改M個信息組中每個的N條單個信息,以便突出在N條單個信息中的相關(guān)性,這里N是等于或大于2的整數(shù),M是等于或大于1的整數(shù);產(chǎn)生步驟,用于從M個信息組中產(chǎn)生包括N條單個信息的參考信息組以在相似性的計算中用作參考,該M個信息組中每個包括在修改步驟中修改的N條單個信息;和相似性計算步驟,用于獲取包括N個單個信息元素的新信息組作為比較信息組并計算比較信息組相對于在產(chǎn)生步驟中產(chǎn)生的參考信息組的相似性。
34.一種信息處理設(shè)備,包括矢量化裝置,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生裝置,用于在通過矢量化裝置形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;參考矢量產(chǎn)生裝置,用于從通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量;候選內(nèi)容獲取裝置,用于在每次通過參考矢量產(chǎn)生裝置形成參考矢量時,基于參考矢量獲取要推薦給用戶的內(nèi)容的候選內(nèi)容;相似性計算裝置,用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算比較矢量和由參考矢量產(chǎn)生裝置形成的一個或多個參考矢量之間的相似性;和提供裝置,用于從通過候選內(nèi)容獲取裝置獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
35.一種信息處理方法,包括矢量化步驟,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生步驟,當在矢量化步驟中形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;參考矢量產(chǎn)生步驟,用于從在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量;候選內(nèi)容獲取步驟,用于每次在參考矢量產(chǎn)生步驟中形成參考矢量時,基于參考矢量獲取要推薦給用戶的內(nèi)容的候選內(nèi)容;相似性計算步驟,用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算比較矢量和在參考矢量產(chǎn)生步驟中形成的一個或多個參考矢量之間的相似性;和提供步驟,用于從在候選內(nèi)容獲取步驟中獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算裝置計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
36.一種計算機執(zhí)行的程序,包括矢量化步驟,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生步驟,當在矢量化步驟中形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;參考矢量產(chǎn)生步驟,用于從在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量;候選內(nèi)容獲取步驟,用于每次在參考矢量產(chǎn)生步驟中形成參考矢量時,基于參考矢量獲取要推薦給用戶的內(nèi)容的候選內(nèi)容;相似性計算步驟,用于獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,形成其元素通過由分配給N條單個信息的權(quán)重值給定的比較矢量,以及計算比較矢量和在參考矢量產(chǎn)生步驟中形成的一個或多個參考矢量之間的相似性;提供步驟,用于從在候選內(nèi)容獲取步驟中獲取的候選內(nèi)容中選擇對應(yīng)于其通過相似性計算步驟計算的相似性等于或高于閾值的參考矢量的候選內(nèi)容并將所選擇的候選內(nèi)容作為推薦內(nèi)容提供給用戶。
37.一種信息處理設(shè)備,包括矢量化裝置,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生裝置,用于在通過矢量化裝置形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;和類型設(shè)置裝置,用于計算通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
38.根據(jù)權(quán)利要求37所述的信息處理設(shè)備,其中該類型設(shè)置裝置通過使用屬于該類型的列作為訓練數(shù)據(jù)通過學習每種類型的類別形成分類器;和信息處理設(shè)備進一步包括分類裝置,該分類裝置用于通過如下方式進行分類獲取包括與新內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過分配給新內(nèi)容的各個N條單個信息的權(quán)重值給定的特征矢量,以及使用通過類型設(shè)置裝置形成的分類器將與新內(nèi)容關(guān)聯(lián)的特征矢量分類作為由類型設(shè)置裝置設(shè)定的類型中的一種類型。
39.根據(jù)權(quán)利要求37所述的信息處理設(shè)備,其中在每次類型設(shè)置裝置設(shè)定一種類型時,類型設(shè)置裝置從屬于該類型的列中選擇元素并基于所選擇的元素將名字分配給該類型。
40.一種信息處理方法,包括矢量化步驟,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生步驟,用于在矢量化步驟中形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;類型設(shè)置步驟,用于計算在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
41.一種通過計算機執(zhí)行的程序,包括矢量化步驟,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生步驟,用于在矢量化步驟中形成M個特征矢量時形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;和類型設(shè)置步驟,用于計算在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中的相似性,基于所計算的相似性對M個列中的每個進行分類,以及設(shè)置在分類中獲得的每個類別作為類型。
42.一種包括服務(wù)器和由用戶使用的客戶機的信息處理系統(tǒng),包括矢量化裝置,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生裝置,用于在通過矢量化裝置形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;參考矢量產(chǎn)生裝置,用于從通過矩陣產(chǎn)生裝置形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量;和相似性計算裝置,用于如下地計算相似性獲取包括N條單個信息的新信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,以及計算比較矢量和由參考矢量產(chǎn)生裝置形成的參考矢量之間的相似性,其中在矢量化裝置、矩陣產(chǎn)生裝置、參考矢量產(chǎn)生裝置和相似性計算裝置中,至少矩陣產(chǎn)生裝置包括在服務(wù)器中。
43.一種用于包括服務(wù)器和由用戶使用的客戶機的信息處理系統(tǒng)的信息處理方法,包括矢量化步驟,用于在每次用戶使用內(nèi)容時,獲取包括與該內(nèi)容關(guān)聯(lián)的N條單個信息的信息組,將權(quán)重值分配給N條單個信息中的每個,并形成其元素通過分配給各個N條單個信息的權(quán)重值給定的矢量作為該內(nèi)容的特征矢量;矩陣產(chǎn)生步驟,用于當在矢量化步驟中形成M個特征矢量時,形成具有N行和M列的第一矩陣以使它的元素由該M個特征矢量給定,對第一矩陣執(zhí)行操作以便將第一矩陣轉(zhuǎn)換為其N×M個元素至少被部分修改的第二矩陣以便突出在M個列中每個列的N行元素中的相關(guān)性;參考矢量產(chǎn)生步驟,用于從在矩陣產(chǎn)生步驟中形成的第二矩陣的M列中形成在相似性的計算中作為參考的包括N個元素的參考矢量;和相似性計算步驟,用于計算相似性,包括如下子步驟獲取包括N條單個信息的新信息組,將權(quán)重值分配給各個N條單個信息,形成其元素通過由分配給各個N條單個信息的權(quán)重值給定的比較特征矢量,以及計算比較矢量和由參考矢量產(chǎn)生步驟形成的參考矢量之間的相似性,其中在矢量化步驟、矩陣產(chǎn)生步驟、參考矢量產(chǎn)生步驟和相似性計算步驟中,至少矩陣產(chǎn)生步驟由服務(wù)器執(zhí)行。
全文摘要
本發(fā)明涉及信息處理設(shè)備及方法、實施信息處理方法的程序、信息處理系統(tǒng)及其方法,其中信息處理設(shè)備選擇與用戶的喜好很好地匹配的適當?shù)膬?nèi)容并推薦它。矩陣計算器獲取其元素由分配給總共N條(2或更大)內(nèi)容元信息和上下文信息的權(quán)重值給定的M個(一個或多個)特征矢量CCV。矩陣計算器形成其列由通過M個特征矢量CCV給定的矩陣CCM并通過修改M個特征矢量CCV的各個元素的權(quán)重值將它轉(zhuǎn)換為近似矩陣CCM
文檔編號G06F17/30GK1624696SQ20041009796
公開日2005年6月8日 申請日期2004年12月2日 優(yōu)先權(quán)日2003年12月2日
發(fā)明者山本則行 申請人:索尼株式會社