專利名稱:信息處理裝置、信息處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本公開涉及信息處理裝置、信息處理方法和程序。更具體地,本公開涉及用于預(yù)測用戶關(guān)于內(nèi)容的評價(jià)的信息處理裝置、信息處理方法和程序。
背景技術(shù):
近年來,通過使用諸如博客、SNS (社會網(wǎng)絡(luò)服務(wù))和推特(注冊商標(biāo))這樣的基于因特網(wǎng)的服務(wù),普通用戶表達(dá)他們對于多種事件和問題的意見的機(jī)會已經(jīng)逐漸增加。已經(jīng)提出了從這樣的用戶通過語言表達(dá)的信息(在下文中,稱為語言表達(dá))中提取表示特定事件或者問題的評價(jià)的表達(dá)(在下文中,稱為評價(jià)表達(dá))的技術(shù)。一種這樣的技術(shù)由 N. Kobayashi 等人在期刊《JapaneseSociety for Artificial Intelligence))2007 年第 22 卷第 2 號第 227-238 頁的 “Opinion Mining from Web Documents Extraction andStructurization”(在下文中,稱為非專利文獻(xiàn)1)中公開。此外,已經(jīng)提出了用于確定給定的語言表達(dá)是正面還是負(fù)面的技術(shù)。一種這樣的技術(shù)由T. Nasukawa等人在2003年的《關(guān)于知識擷取的國際會議論文集》中的“Sentiment Analysis :Capturing Favorability UsingNatural Language Processing,,(在下文中,禾爾為非專利文獻(xiàn)2)中公開。
發(fā)明內(nèi)容
例如,在以上引用的非專利文獻(xiàn)1和2中公開的技術(shù)可用于估計(jì)給定用戶的品位, 并由此預(yù)測他或她對于各種內(nèi)容的評價(jià)。然而,獲取由個(gè)人用戶直接給出的足夠數(shù)量的評價(jià)表達(dá)是不可能的。這意味著關(guān)于內(nèi)容的評價(jià)預(yù)測的準(zhǔn)確度可能惡化。已經(jīng)鑒于以上情況做出了本公開,本公開提供了用于基于語言表達(dá)提高預(yù)測用戶對內(nèi)容的評價(jià)的準(zhǔn)確度的信息處理裝置、信息處理方法以及程序。根據(jù)本公開的一個(gè)實(shí)施例,提供一種信息處理裝置,該信息處理裝置包括評價(jià)信息提取部,被配置成從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)來提取評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對該要被評價(jià)的對象的評價(jià);識別部,被配置成識別該評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;以及評價(jià)預(yù)測部,被配置成基于由關(guān)注的用戶給出的第一類型的評價(jià)信息,以及基于在由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。優(yōu)選地,第二類型的評價(jià)信息可包括其中由其他用戶給出的語言表達(dá)要被評價(jià)的評價(jià)信息;以及評價(jià)預(yù)測部可基于由關(guān)注的用戶給出的第一類型的評價(jià)信息,以及基于在由關(guān)注的用戶給出的第二類型的評價(jià)信息中由要被評價(jià)的其他用戶給出的語言表達(dá)中包括的所述的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。優(yōu)選地,第二類型的評價(jià)信息可包括將其他用戶作為要被評價(jià)的對象的評價(jià)信息;以及評價(jià)預(yù)測部可基于由關(guān)注的用戶給出的第一類型的評價(jià)信息,以及基于在由關(guān)注的用戶給出的第二類型的評價(jià)信息中由要被評價(jià)的其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。優(yōu)選地,評價(jià)預(yù)測部可包括估計(jì)部,被配置成基于由關(guān)注的用戶給出的第一類型的評價(jià)信息,以及基于由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來估計(jì)在關(guān)注的用戶對內(nèi)容的評價(jià)預(yù)測中使用的參數(shù);以及預(yù)測部,被配置成基于關(guān)注的用戶的參數(shù),來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。優(yōu)選地,預(yù)測部可將由關(guān)注的用戶的參數(shù)以及與被關(guān)注的用戶正面評價(jià)的其他用戶的參數(shù)加權(quán)相加所獲得的值設(shè)置作為關(guān)注的用戶的參數(shù)。優(yōu)選地,預(yù)測部可通過在關(guān)注的用戶與被關(guān)注的用戶正面評價(jià)的其他用戶之間共享參數(shù)的先驗(yàn)分布,來估計(jì)關(guān)注的用戶的參數(shù)。優(yōu)選地,預(yù)測部可通過使用被關(guān)注的用戶正面評價(jià)的其他用戶的參數(shù)來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。根據(jù)本公開的另一實(shí)施例,提供一種信息處理方法,與信息處理裝置一起使用,用于預(yù)測關(guān)注的用戶對內(nèi)容的評價(jià),所述信息處理方法包括從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)來提取評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對要被評價(jià)的對象的評價(jià);識別評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;基于由關(guān)注的用戶給出的第一類型的評價(jià)信息以及基礎(chǔ)由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。根據(jù)本公開的又一實(shí)施例,提供一種用于使計(jì)算機(jī)執(zhí)行處理的程序,該程序包括 從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)來提取評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對要被評價(jià)的對象的評價(jià);識別評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;以及基于由關(guān)注的用戶給出的第一類型的評價(jià)信息,以及基于由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。根據(jù)以上概括的本公開,從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)提取來評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對要被評價(jià)的對象的評價(jià)。進(jìn)行確定,以識別該評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是具有關(guān)于其他用戶的第二類型的評價(jià)信息。基于由關(guān)注的用戶給出的第一類型的評價(jià)信息,以及基于由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。只要實(shí)施該公開的任何一種實(shí)施例,就有可能基于語言表達(dá)預(yù)測關(guān)注的用戶對內(nèi)容的評價(jià)。此外,本公開的實(shí)施例可以改進(jìn)預(yù)測的準(zhǔn)確度。
圖1是示出作為本公開的實(shí)施例的信息處理系統(tǒng)的典型配置的框圖;圖2是由信息處理系統(tǒng)執(zhí)行的內(nèi)容推薦過程的流程圖說明;圖3是分析其他人的評價(jià)信息的過程的詳細(xì)步驟的流程圖說明;圖4是示出博客信息的示例的表格視圖5是示出語言表達(dá)信息的示例的表格視圖;圖6是示出評價(jià)信息的示例的表格視圖;圖7是示出內(nèi)容評價(jià)信息的示例的表格視圖;圖8是示出用戶參考信息的示例的表格視圖;圖9是示出在預(yù)測學(xué)習(xí)(predictive learning)中使用的估計(jì)參數(shù)的第一示例的表格視圖;圖10是示出在預(yù)測學(xué)習(xí)中使用的估計(jì)參數(shù)的第二示例的表格視圖;圖11是示出內(nèi)容的典型特征量的表格視圖;以及圖12是示出計(jì)算機(jī)的典型結(jié)構(gòu)的框圖。
具體實(shí)施例方式一種信息處理裝置,包括評價(jià)信息提取部,被配置成從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)中提取評價(jià)信息,該評價(jià)信息包括要被評價(jià)的對象以及對要被評價(jià)的對象的評價(jià);識別部,被配置成識別評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;評價(jià)預(yù)測部,被配置成基于由關(guān)注的用戶給出的第一類型的評價(jià)信息以及基于在由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。一種信息處理方法,與信息處理裝置一起使用,用于預(yù)測關(guān)注的用戶對內(nèi)容的評價(jià),信息處理方法包括從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)中提取評價(jià)信息,評價(jià)信息包括要被評價(jià)的對象以及對要被評價(jià)的對象的評價(jià);識別評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;以及基于由關(guān)注的用戶給出的第一類型的評價(jià)信息以及基于在由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)?,F(xiàn)在,本公開的一些優(yōu)選實(shí)施例將在以下標(biāo)題下進(jìn)行描述1.實(shí)施例;以及2.變型例。1.實(shí)施例信息處理系統(tǒng)的典型配置圖1是示出作為本公開的實(shí)施例的信息處理系統(tǒng)101的典型配置的框圖。例如, 信息處理系統(tǒng)101由計(jì)算機(jī)、服務(wù)器、存儲器件和通信器件組成。信息處理系統(tǒng)101收集由個(gè)人用戶經(jīng)由諸如因特網(wǎng)(未示出)的網(wǎng)絡(luò)給出的關(guān)于內(nèi)容的評價(jià)信息,并基于收集到的評價(jià)信息,進(jìn)行學(xué)習(xí)以預(yù)測用戶對內(nèi)容的評價(jià)。根據(jù)學(xué)習(xí)的結(jié)果,信息處理系統(tǒng)101預(yù)測用戶可能對內(nèi)容給出的評價(jià),并經(jīng)由網(wǎng)絡(luò)將內(nèi)容推薦給用戶。在當(dāng)前上下文中,內(nèi)容指的是圖片數(shù)據(jù)、活動圖像數(shù)據(jù)、音樂數(shù)據(jù)、各種產(chǎn)品和文檔數(shù)據(jù)等等。所述內(nèi)容不受具體類型限制。信息處理系統(tǒng)101被構(gòu)造成包括博客信息保持部分111、語言表達(dá)收集部分112、 語言表達(dá)保持部分113、評價(jià)信息提取部分114、類型識別部分115、評價(jià)信息保持部分116、 評價(jià)信息分析部分117、內(nèi)容評價(jià)信息獲取部分118、內(nèi)容評價(jià)信息保持部分119、用戶參考信息保持部分120、評價(jià)預(yù)測部121、內(nèi)容信息保持部分122和內(nèi)容呈現(xiàn)部分123。評價(jià)預(yù)測部121被構(gòu)造成包括參數(shù)估計(jì)部分131、用戶參數(shù)保持部分132和預(yù)測部分133。博客信息保持部分111、語言表達(dá)保持部分113、評價(jià)信息保持部分116、內(nèi)容評價(jià)信息保持部分119、用戶參考信息保持部分120、內(nèi)容信息保持部分122和用戶參數(shù)保持部分132由各種存儲器件諸如硬盤驅(qū)動器或者閃存存儲器構(gòu)成。博客信息保持部分111、語言表達(dá)保持部分113、評價(jià)信息保持部分116、內(nèi)容評價(jià)信息保持部分119、用戶參考信息保持部分120、內(nèi)容信息保持部分122和用戶參數(shù)保持部分132每個(gè)可以由不同的存儲器件構(gòu)造,或者可以部分或全部由相同的存儲器件構(gòu)成。語言表達(dá)收集部分112從博客信息保持部分111獲取博客信息,隨后將參考圖4 討論。語言表達(dá)收集部分112經(jīng)由網(wǎng)絡(luò)(未示出)訪問博客信息中登記的不同用戶的博客, 從而收集用戶給出的語言表達(dá)。語言表達(dá)收集部分112將包括收集到的語言表達(dá)的語言表達(dá)信息存儲到語言表達(dá)保持部分113中。在當(dāng)前上下文中,語言表達(dá)指的是通過符號或通過聲音表達(dá)的信息,諸如文本數(shù)據(jù)或音頻數(shù)據(jù)。評價(jià)信息提取部分114從存儲在語言表達(dá)保持部分113中的語言表達(dá)中提取包括將要被評價(jià)的各種事件或問題的評價(jià)的評價(jià)信息。評價(jià)信息提取部分114將所提取的評價(jià)信息供應(yīng)到類型識別部分115。類型識別部分115識別評價(jià)信息中所評價(jià)的對象的類型(在下文中,稱為對象類型)。類型識別部分115將評價(jià)信息與所識別的對象類型一起存儲到評價(jià)信息保持部分116中。評價(jià)信息分析部分117分析保持在評價(jià)信息保持部分116中的評價(jià)信息。基于該分析的結(jié)果,評價(jià)信息分析部分117生成表示個(gè)人用戶對內(nèi)容的評價(jià)的內(nèi)容評價(jià)信息,并將所生成的內(nèi)容評價(jià)信息存儲到內(nèi)容評價(jià)信息保持部分119中。而且,基于該分析的結(jié)果, 評價(jià)信息分析部分117生成表示每個(gè)用戶對其他用戶的評價(jià)的用戶參考信息,并將所生成的用戶參考信息存儲到用戶參考信息保持部分120中。內(nèi)容評價(jià)信息獲取部分118獲取外部輸入的內(nèi)容評價(jià)信息,并將其存儲到內(nèi)容評價(jià)信息保持部分119中。評價(jià)預(yù)測部121進(jìn)行學(xué)習(xí)以預(yù)測每個(gè)用戶對內(nèi)容的評價(jià)。基于學(xué)習(xí)的結(jié)果,評價(jià)預(yù)測部121預(yù)測每個(gè)用戶可能對內(nèi)容做出的評價(jià)。更具體地,評價(jià)預(yù)測部121的參數(shù)估計(jì)部分131從內(nèi)容評價(jià)信息保持部分119獲取內(nèi)容評價(jià)信息,并且從用戶參考信息保持部分120獲取用戶參考信息?;谶@樣獲得的內(nèi)容評價(jià)信息和用戶參考信息,參數(shù)估計(jì)部分131利用適當(dāng)?shù)膶W(xué)習(xí)技術(shù)進(jìn)行學(xué)習(xí)以預(yù)測每個(gè)用戶對內(nèi)容的評價(jià)。此外,參數(shù)估計(jì)部分131將表示學(xué)習(xí)結(jié)果的每個(gè)用戶的參數(shù)存儲到用戶參數(shù)保持部分132中。預(yù)測部分133從用戶參數(shù)保持部分132獲取每個(gè)用戶的參數(shù),并且從內(nèi)容信息保持部分122獲取每個(gè)內(nèi)容的特征量?;诿總€(gè)用戶的參數(shù)以及基于每個(gè)內(nèi)容的特征量,預(yù)測部分133預(yù)測每個(gè)用戶可能對每個(gè)內(nèi)容做出的評價(jià),并將預(yù)測的結(jié)果供應(yīng)至內(nèi)容呈現(xiàn)部分 123。內(nèi)容信息保持部分122存儲關(guān)于各種內(nèi)容的包括其特征量的信息??商鎿Q地,關(guān)于內(nèi)容的信息以及內(nèi)容本身可以存儲在內(nèi)容信息保持部分122中?;谒A(yù)測的每個(gè)用戶關(guān)于每個(gè)內(nèi)容的評價(jià),內(nèi)容呈現(xiàn)部分123從內(nèi)容信息保持部分122獲取關(guān)于將要推薦給每個(gè)用戶的內(nèi)容的信息。內(nèi)容推薦過程以下參考圖2和圖3的流程圖解釋信息處理系統(tǒng)101執(zhí)行的內(nèi)容推薦過程。在需要時(shí),在說明中針對具體事例將參考圖4至圖11。在步驟Sl中,語言表達(dá)收集部分112收集語言表達(dá)。具體地,語言表達(dá)收集部分 112首先從博客信息保持部分111獲取博客信息。圖4示出博客信息的示例。博客信息由要用于收集語言表達(dá)的登記的博客組成。例如,博客信息包括建立要進(jìn)行收集的博客的用戶以及每個(gè)用戶的博客首頁的URL(統(tǒng)一資源定位器)。例如,由用戶1建立且具有由URL "http://blog. example, com/userl/ entry-l.html”表示其首頁的博客被顯示登記在圖4中的第一記錄(record)中。語言表達(dá)收集部分112經(jīng)由網(wǎng)絡(luò)(未示出)訪問登記在博客信息中的每個(gè)用戶的博客。然后,基于每個(gè)博客服務(wù)的格式,在從其提取僅后續(xù)處理所必需的語言表達(dá)之前,語言表達(dá)收集部分112收集并編輯由博客刊登的文章。語言表達(dá)收集部分112繼續(xù)進(jìn)行以將包括所提取的語言表達(dá)的語言表達(dá)信息存儲到語言表達(dá)保持部分113中。圖5示出語言表達(dá)信息的示例。例如,語言表達(dá)信息包括用于識別個(gè)人語言表達(dá)的語言表達(dá)ID、發(fā)起該語言表達(dá)的用戶以及該語言表達(dá)。在圖5的示例中,已經(jīng)從其提取了語言表達(dá)的網(wǎng)站(博客頁面)的URL被用作語言表達(dá)ID。例如,由用戶1發(fā)起的語言表達(dá)“藝術(shù)家A的歌曲A是特別成功的”被顯示登記在圖5的第一記錄中。此外,已經(jīng)提取了語言表達(dá)的用戶1的博客頁面的URL“http://blog. example, com/user 1/entry-L html,,被顯不登記為語言表達(dá) ID0如果語言表達(dá)包括具有與其他網(wǎng)站的鏈接的信息,考慮到后續(xù)處理,該鏈接信息應(yīng)該優(yōu)選地被維持原封不動。例如,在圖5中的第二記錄被示出為包括由錨標(biāo)簽<a href = "http://blog. example. com/user3/entry-l. html,,> </a> 包圍的并維持原封不動的鏈接信息?;氐綀D2,在步驟S2中,評價(jià)信息提取部分114從保持在語言表達(dá)保持部分113中的語言表達(dá)信息中提取評價(jià)信息。圖6示出評價(jià)信息的示例。例如,評價(jià)信息可包括評價(jià)者、評價(jià)表達(dá)、評價(jià)好感度 (evaluation favorability)、對象類型以及要被評價(jià)的對象。通過分析包括在語言表達(dá)信息中的每個(gè)語言表達(dá),其中該語言表達(dá)信息保持在語言表達(dá)保持部分113中,評價(jià)信息提取部分114從每個(gè)語言表達(dá)中提取評價(jià)表達(dá)和在該評價(jià)表達(dá)中用于評價(jià)的對象。此外,評價(jià)信息提取部分114確定所提取的評價(jià)表達(dá)的好感度 (在下文中,稱為評價(jià)好感度)是正面的還是負(fù)面的。作為用于提取評價(jià)表達(dá)和評價(jià)對象以及用于確定評價(jià)好感度的典型技術(shù),可以采用在以上引用的非專利文獻(xiàn)2中描述的技術(shù)寸。評價(jià)信息提取部分114繼續(xù)進(jìn)行以將包括評價(jià)者、評價(jià)表達(dá)、評價(jià)好感度和評價(jià)對象的評價(jià)信息供應(yīng)到類型識別部分115。發(fā)起從其提取評價(jià)信息的語言表達(dá)的每個(gè)用戶被設(shè)置為所討論的評價(jià)信息的評價(jià)者。在步驟S3中,類型識別部分115識別評價(jià)對象的類型(即,對象類型)。具體地, 評價(jià)信息提取部分114識別對象類型是最終用作將要推薦給用戶的單元的內(nèi)容、由其他用戶給出的語言表達(dá),還是人(即,其他用戶)。例如,類型識別部分115通過使用以下手段來識別對象類型其中登記有藝術(shù)家名字和歌曲名的字典、其中登記有用戶的名字或昵稱的用戶登記信息、通過其來確定給定的表達(dá)是否由引號(“”)包圍的準(zhǔn)則、以及用于提取命名實(shí)體的技術(shù)。在2003年的公開號為 No. 4200645、發(fā)明人為 ErikF. Tjong 等人、發(fā)明名稱為 ‘Introduction to the CoNLL-2003 SharedTask :Language_Independent Named Entity Recognition, ”CoNLL 的日本專利中詳細(xì)地討論了用于提取命名實(shí)體的典型技術(shù)。而且,如果要被評價(jià)的對象由帶有鏈接的錨標(biāo)簽(a href... > </A>,等)包圍, 則類型識別部分115基于域名字典以及基于鏈接目標(biāo)的URL的域名來識別對象類型是內(nèi)容還是語言表達(dá)。例如,如果所述域名是視頻發(fā)布站點(diǎn)的域名,則對象類型可以分類為內(nèi)容 (即,視頻)。這個(gè)方法還可在要被評價(jià)的對象是給定網(wǎng)站的頁面的URL的情況下應(yīng)用。作為另一示例,類型識別部分115可執(zhí)行適當(dāng)技術(shù)的學(xué)習(xí)過程,以基于錨文本的內(nèi)容來識別對象類型。作為再一示例,如果要被評價(jià)的對象是圖像數(shù)據(jù),則類型識別部分115可執(zhí)行適當(dāng)技術(shù)的學(xué)習(xí)過程,以基于嵌入在圖像數(shù)據(jù)中的文本的內(nèi)容來識別對象類型。如上所述,類型識別部分115識別每項(xiàng)評價(jià)信息是關(guān)于內(nèi)容(即,對象類型是內(nèi)容)還是關(guān)于其他用戶(即,對象類型是語言表達(dá)或人)。類型識別部分115還識別與其他用戶相關(guān)的評價(jià)信息是關(guān)于由其它用戶給出的語言表達(dá)(即,對象類型是語言表達(dá))還是關(guān)于其他用戶他自身或她自身(即,對象類型是人)。前述描述僅給出識別對象類型的技術(shù)的實(shí)例。對象類型識別技術(shù)不限于以上討論的技術(shù)。可以替代地采用一些其它適當(dāng)?shù)募夹g(shù)。類型識別部分115將評價(jià)信息與對象類型一起存儲到評價(jià)信息保持部分116中。 如果對象類型與任何內(nèi)容、語言表達(dá)或人都不相應(yīng),則類型識別部分115丟棄該評價(jià)信息, 并且不會將其存儲到評價(jià)信息保持部分116中。例如,通過上述步驟S2和S3的處理,從圖5的第一記錄中的語言表達(dá)“藝術(shù)家A 的歌曲A是特別成功的”中提取語言表達(dá)“特別成功的”作為評價(jià)表達(dá),而提取“歌曲A”作為評價(jià)對象。而且,評價(jià)表達(dá)“特別成功的”的評價(jià)好感度被確定為是正面的,并且評價(jià)對象 “歌曲A”的對象類型被分類為內(nèi)容。以這種方式,圖6中的第一記錄被生成為包括評價(jià)者 “用戶1 ”、評價(jià)表達(dá)“特別成功的”、評價(jià)好感度“正面的”、對象類型“內(nèi)容”和評價(jià)對象“歌曲A”的評價(jià)信息。作為另一示例,從圖5 中第二記錄中的 “<a href = http://blog. example, com/ user3/entry-l. html>這個(gè)觀點(diǎn)</a>非常不公平”提取語言表達(dá)“不公平”作為評價(jià)表達(dá)。 在這個(gè)記錄的語言表達(dá)的文本中,評價(jià)目標(biāo)是“這個(gè)觀點(diǎn)”,其是由帶有鏈接的錨標(biāo)簽包圍的字符串。因而,實(shí)際上,URL "http://blog. example. com/user3/entry-l. html,,被提取作為評價(jià)目標(biāo)。而且,評價(jià)表達(dá)“不公平”的評價(jià)好感度被確定為是負(fù)面的,并且評價(jià)對象 "http://blog. example. com/user3/entry-l. html”的對象類型被分類為語言表達(dá)。以這種方式,圖6中的第二記錄被生成為包括評價(jià)者“用戶1”、評價(jià)表達(dá)“不公平”、評價(jià)好感度 “負(fù)面的”、對象類型“語言表達(dá)”和評價(jià)對象“http://blog. example. com/user3/entry-l. html”的評價(jià)信息。作為另一實(shí)例,從圖5的第三記錄中的語言表達(dá)“用戶2先生實(shí)際上具有良好的品位”提取語言表達(dá)“良好的”作為評價(jià)表達(dá),并提取“用戶2先生”作為評價(jià)對象。而且,評價(jià)表達(dá)“良好的”的評價(jià)好感度被確定為是正面的,并且評價(jià)對象“用戶2先生”的對象類型被分類為人。以這種方式,圖6中的第三記錄被生成為包括評價(jià)者“用戶1”、評價(jià)表述“良好的”、評價(jià)好感度“正面的”、對象類型“人”和評價(jià)對象“用戶2先生”的評價(jià)信息。同樣地,圖6中的第四記錄的評價(jià)信息和第五記錄的評價(jià)信息分別由圖5中的第四記錄的語言表達(dá)信和第五記錄的語言表達(dá)信息生成?;氐綀D2,在步驟S4中,評價(jià)信息分析部分117生成內(nèi)容評價(jià)信息。具體地,評價(jià)信息分析部分117從保持在評價(jià)信息保持部分116中的評價(jià)信息提取其對象類型是內(nèi)容的評價(jià)信息。評價(jià)信息分析部分117基于所提取的評價(jià)信息生成內(nèi)容評價(jià)信息。圖7示出內(nèi)容評價(jià)信息的示例。內(nèi)容評價(jià)信息可典型地包括評價(jià)者、用作要被評價(jià)的目標(biāo)的內(nèi)容、以及評價(jià)好感度。例如,基于圖6中的第一記錄中的評價(jià)信息,圖7中的第一記錄被生成為包括評價(jià)者“用戶1”、內(nèi)容“歌曲A”以及評價(jià)好感度“正面的”的內(nèi)容評價(jià)信息。也就是說,這里所生成的是表明用戶1正面地評價(jià)歌曲A的內(nèi)容評價(jià)信息。同樣地,基于圖6中的第四記錄的評價(jià)信息和第五記錄的評價(jià)信息,分別生成圖7中的第四記錄的內(nèi)容評價(jià)信息和第五記錄的內(nèi)容評價(jià)信息。評價(jià)信息分析部分117將由此生成的內(nèi)容評價(jià)信息存儲到內(nèi)容評價(jià)信息保持部分119中。在步驟S5中,評價(jià)信息分析部分117執(zhí)行分析其他人的評價(jià)信息的過程。以下參考圖3的流程圖詳細(xì)地解釋其他人的評價(jià)信息分析過程。在圖3的步驟S51中,評價(jià)信息分析部分117從保持在評價(jià)信息保持部分116中的評價(jià)信息中選擇要被分析的評價(jià)信息。例如,評價(jià)信息分析部分117可從圖6中的第一記錄開始接連地選擇評價(jià)信息。在步驟S52中,評價(jià)信息分析部分117基于要被分析的評價(jià)信息的對象類型確定評價(jià)是否是關(guān)于語言表達(dá)。如果確定該評價(jià)是關(guān)于語言表達(dá),則控制轉(zhuǎn)到步驟S53。在步驟S53,評價(jià)信息分析部分117提取語言表達(dá)中被評價(jià)的內(nèi)容。這里,考慮了評價(jià)圖6中的第二記錄的其對象類型是語言表達(dá)的評價(jià)信息的情形。例如,通過與以上討論的圖2中的步驟Sl相同的處理,評價(jià)信息分析部分117可從在“http://blog. example. com/user3/entry-l. html”發(fā)布的文章中提取語言表達(dá)“歌曲 B 不過是小兒科”,該“http://blog. example. com/user3/entry-l. html ”是所討論的評價(jià)信息的評價(jià)對象。然后,通過與以上討論的圖2中的步驟S2相同的處理,評價(jià)信息分析部分 117提取在語言表達(dá)中被評價(jià)的內(nèi)容“歌曲B”。在該情形下,可以省略在前述的步驟,因?yàn)橐呀?jīng)在之前執(zhí)行的步驟Sl和S2中,從關(guān)注的語言表達(dá)中提取了內(nèi)容“歌曲B”。
如果在語言表達(dá)中被評價(jià)的評價(jià)對象是另一語言表達(dá),則評價(jià)信息分析部分117 繼續(xù)進(jìn)行以提取在該另一語言表達(dá)中評價(jià)的內(nèi)容。在步驟SM中,評價(jià)信息分析部分117生成與所提取的內(nèi)容相關(guān)的內(nèi)容評價(jià)信息。在該情形下,例如,用戶1負(fù)面地評價(jià)用戶3的語言表達(dá),并且用戶3在他或她的語言表達(dá)中負(fù)面地評價(jià)歌曲B。接著,可認(rèn)為用戶1以間接的方式正面地評價(jià)歌曲B。評價(jià)信息分析部分117由此將圖7中的第二記錄2生成為包括評價(jià)者“用戶1”、內(nèi)容“歌曲B”以及評價(jià)好感度“正面的”的內(nèi)容評價(jià)信息。評價(jià)信息分析部分117將所生成的內(nèi)容評價(jià)信息存儲到內(nèi)容評價(jià)信息保持部分119中。其后,控制轉(zhuǎn)到步驟S58。以上述的方式,基于用戶1關(guān)于用戶3的語言表達(dá)的評價(jià),可以估計(jì)用戶1關(guān)于在用戶3的語言表達(dá)中評價(jià)的歌曲B的評價(jià),并且可以生成表示估計(jì)結(jié)果的內(nèi)容評價(jià)信息,其接著被存儲。如果在步驟S52確定該評價(jià)不是關(guān)于語言表達(dá),則控制轉(zhuǎn)到步驟S55。在步驟S55中,基于要分析的評價(jià)信息的對象類型,評價(jià)信息分析部分117確定評價(jià)是否是關(guān)于人。如果確定該評價(jià)是關(guān)于人,則控制轉(zhuǎn)到步驟S56。在步驟S56,評價(jià)信息分析部分117存儲用戶參考信息。這里,考慮了分析圖6中的第三記錄的其對象類型是人的評價(jià)信息的情形。圖8示出了用戶參考信息的示例。用戶參考信息可典型地包括參考用戶 (referencing user)、被參考用戶(referenced user)以及評價(jià)好感度。例如,在圖6中的第三記錄的評價(jià)信息中,用戶1正面地評價(jià)用戶2。因而,評價(jià)信息分析部分117將圖8中的第一記錄生成為包括參考用戶“用戶1”、被參考用戶“用戶2”以及評價(jià)好感度“正面的” 的用戶參考信息。也就是說,這里生成的用戶參考信息指示作為評價(jià)被參考用戶“用戶2” 的評價(jià)者的參考用戶“用戶1”的“正面的”評價(jià)好感度作為評價(jià)對象。評價(jià)信息分析部分 117將所生成的用戶參考信息存儲到用戶參考信息保持部分120中。在步驟S57中,通過利用被參考用戶的內(nèi)容評價(jià)信息,評價(jià)信息分析部分117生成參考用戶的內(nèi)容評價(jià)信息。在該情形下,例如,作為參考用戶的用戶1正面地評價(jià)作為被參考用戶的用戶2。因而,可以利用未修改的用戶2的內(nèi)容評價(jià)信息來生成用戶1的內(nèi)容評階信息。也就是說,評價(jià)信息分析部分117通過復(fù)制其中用戶2是評價(jià)者的圖7中的第四內(nèi)容評價(jià)信息并且通過以用戶1取代評價(jià)者來生成用戶1的內(nèi)容評價(jià)信息。以這種方式, 在圖7中的第三記錄被生成為包括評價(jià)者“用戶1”、內(nèi)容“唱片(album) 1”以及評價(jià)好感度 “正面的”的內(nèi)容評價(jià)信息。如果在該情形下,用戶2對用戶1的評價(jià)是負(fù)面的,則評價(jià)好感度僅需被反轉(zhuǎn)。評價(jià)信息分析部分117繼續(xù)進(jìn)行以將所生成的內(nèi)容評價(jià)信息存儲到內(nèi)容評價(jià)信息保持部分119中。然后,控制轉(zhuǎn)到步驟S58。如果在步驟S55中,確定評價(jià)不是關(guān)于人,即,如果確定評價(jià)是關(guān)于內(nèi)容,則跳過步驟S56和S57并且到達(dá)步驟S58。也就是說,將不再生成其對象類型是內(nèi)容的評價(jià)信息, 因?yàn)閮?nèi)容評價(jià)信息已經(jīng)通過上述圖2中的步驟S4的處理生成。在步驟S58中,評價(jià)信息分析部分117確定是否已經(jīng)分析了所有的評價(jià)信息。如果還未評價(jià)所有的評價(jià)信息,則控制轉(zhuǎn)到步驟S51。然后,重復(fù)步驟S51至步驟S58,直到在步驟S58中確定已經(jīng)分析了所有的評價(jià)信息。如果在步驟S58中,確定已經(jīng)分析了所有的評價(jià)信息,則結(jié)束其他人的評價(jià)信息分析過程。以上述方式,基于由所討論的用戶評價(jià)的其他用戶的評價(jià)信息,生成給定用戶的內(nèi)容評價(jià)信息,并存儲所生成的內(nèi)容評價(jià)信息?;氐綀D2,在步驟S6中,參數(shù)估計(jì)部分131估計(jì)在預(yù)測每個(gè)用戶關(guān)于內(nèi)容的評價(jià)中使用的參數(shù)。通常,用于內(nèi)容推薦的評價(jià)預(yù)測技術(shù)分為兩類協(xié)同過濾(CF)以及基于內(nèi)容的過濾(CBF)。第一類中眾所周知的技術(shù)是基于矩陣分解,諸如在公開號為No. 2010/0030764 的美國專利申請以及在2008年的《關(guān)于知識發(fā)現(xiàn)與數(shù)據(jù)挖掘的國際會議論文集》 中 Yehuda Koren 的"Factorization Meets the Neighborhood :a Multifaceted CollaborativeFiltering Model”中所描述的那些。在以上第二類中的常用技術(shù)是模式識別技術(shù)諸如SVM(支持向量機(jī))??梢允褂蒙鲜龅娜魏渭夹g(shù),以基于給定數(shù)據(jù)(在該上下文中,給定數(shù)據(jù)是由用戶對內(nèi)容的評價(jià)的信息以及由內(nèi)容本身組成的信息)處理關(guān)于每個(gè)用戶或每個(gè)內(nèi)容來估計(jì)參數(shù)的任務(wù)。以下解釋的典型的學(xué)習(xí)技術(shù)是利用邏輯回歸的CBF。利用邏輯回歸的CBF 技術(shù)的詳細(xì)描述可以在例如2006年,由Springer-Verlag出版、C. M. Bishop的 "Pattern Recognition and Machine Learning" ( H ^; IK ^ ^T /Λ 2007 ^Ξ 12 ^ ^ H 本 Springer 出版、Hiroshi Motoda 等人番羽譯的"Pattern Recognition and Machine Learning__Statistical Predictionbased on Bayesian Theory" ■至[1, 下文中,禾爾為非專利文獻(xiàn)幻中發(fā)現(xiàn)。通過使用邏輯回歸,學(xué)習(xí)由包括權(quán)重和常數(shù)項(xiàng)的實(shí)值矢量表示的參數(shù),其中權(quán)重和常數(shù)項(xiàng)中的每個(gè)與內(nèi)容的特征量有關(guān)(例如,在音樂的情形下,流派和關(guān)鍵詞;節(jié)奏,音調(diào)以及其它信號特征)。參數(shù)估計(jì)部分131首先進(jìn)行學(xué)習(xí)以基于保持在內(nèi)容評價(jià)信息保持部分119中的內(nèi)容評價(jià)信息來預(yù)測個(gè)人用戶對內(nèi)容的評價(jià)。例如,參數(shù)估計(jì)部分131進(jìn)行學(xué)習(xí)以基于其評價(jià)者是用戶1的內(nèi)容評價(jià)信息(例如,在圖6中的第一至第三記錄)來預(yù)測用戶1關(guān)于內(nèi)容的評價(jià)。而且,參數(shù)估計(jì)部分131進(jìn)行學(xué)習(xí)以基于其評價(jià)者是用戶2的內(nèi)容評價(jià)信息(例如,在圖6中的第四記錄)來預(yù)測用戶2關(guān)于內(nèi)容的評價(jià)。參數(shù)估計(jì)部分131還進(jìn)行學(xué)習(xí)以基于其評價(jià)者是用戶3的內(nèi)容評價(jià)信息(例如,在圖6中的第五記錄)來預(yù)測用戶3關(guān)于內(nèi)容的評價(jià)。圖9示出個(gè)人用戶對具有四個(gè)特征量的內(nèi)容的評價(jià)的學(xué)習(xí)預(yù)測的示例。在該情形下,作為學(xué)習(xí)的結(jié)果獲得五個(gè)參數(shù)關(guān)于四個(gè)內(nèi)容特征量的四個(gè)參數(shù)1至4加一個(gè)常數(shù)項(xiàng)。接下來,參數(shù)估計(jì)部分131基于保持在用戶參考信息保持部分120中的用戶參考信息而合并參數(shù)。例如,參數(shù)估計(jì)部分131可獲取給定用戶的參數(shù)與由所討論的用戶正面評價(jià)的用戶的參數(shù)的加權(quán)平均數(shù)(加權(quán)附加值),并且可將所獲取的加權(quán)平均數(shù)設(shè)置作為所討論的用戶的參數(shù)。例如,在圖8的用戶參考信息中看出,用戶1對用戶2給出了正面的評價(jià)。因而,參數(shù)估計(jì)部分131獲得用戶1的參數(shù)與用戶2的參數(shù)以例如2 1的比率的加權(quán)平均數(shù), 以計(jì)算用戶1的參數(shù)。因此,用戶1的參數(shù)是0. 13、1. 03,0. 83,4. 63和-2. 50,如在圖10中所示。如果用戶1對于多個(gè)用戶(例如,用戶2和3)給出正面評價(jià),則用戶1的參數(shù)與所述多個(gè)用戶的參數(shù)的加權(quán)平均數(shù)被確認(rèn)為用戶1的參數(shù)。可替換地,可以通過從被正面評價(jià)的多個(gè)用戶來提取預(yù)定數(shù)量的用戶來獲得加權(quán)平均數(shù)。作為另一示例,如果用戶1對單個(gè)用戶(例如,用戶2)給出多個(gè)評價(jià),并且如果在該情形下,正面評價(jià)比負(fù)面評價(jià)多出一定比率,則可以基于該比率確定用于加權(quán)平均的權(quán)重。另一方面,如果對用戶給出的負(fù)面評價(jià)比正面評價(jià)多,則用戶的參數(shù)應(yīng)該優(yōu)選地不用于加權(quán)平均。作為另一示例,被用戶1正面評價(jià)的用戶2的參數(shù)可以被不變地用作用戶1的參數(shù)。這種布置在以下情形中尤其有效用戶1的參數(shù)的置信度低,因?yàn)榇嬖诤苌訇P(guān)于用戶1 的內(nèi)容評價(jià)信息,而用戶2的參數(shù)的置信度高,因?yàn)榇嬖谠S多關(guān)于用戶2的內(nèi)容評價(jià)信息。因?yàn)闆]有用戶2和用戶3的用戶參考信息,所以利用對這些用戶單獨(dú)估計(jì)的參數(shù)。然后,參數(shù)估計(jì)部分131將作為學(xué)習(xí)過程的結(jié)果獲取的個(gè)人用戶的參數(shù)存儲到用戶參數(shù)保持部分132中。如在以上引用的非專利文獻(xiàn)5中所描述的,眾所周知的是,可以利用用于假設(shè)參數(shù)的先驗(yàn)分布的學(xué)習(xí)的貝葉斯框架來精確地學(xué)習(xí)用于對內(nèi)容分類的分類器等等。先驗(yàn)分布可以由所有的用戶共享或者為所涉及的每個(gè)用戶保持。在前一種情況下,粒度過于粗糙而不容許足夠的準(zhǔn)確度。在后一種情況下,不能適當(dāng)?shù)貙W(xué)習(xí)先驗(yàn)分布,因?yàn)閿?shù)據(jù)的數(shù)目過少。因而,能想到,在具有類似趨向的用戶之間共享先驗(yàn)分布,如Kai仇等人在2004年美國計(jì)算機(jī)協(xié)會的《第27屆關(guān)于信息檢索的研究和開發(fā)的國際ACM SIGIR會議的論文集》中第353-360頁的"A Nonparametric Hierarchical BayesianFramework for Information Filtering”中所討論的。雖然具有類似趨向的用戶的選擇可以由概率模型表示,但是本公開的實(shí)施例使得可以利用在用戶參考信息中被正面評價(jià)的被參考用戶的未改變的先驗(yàn)分布來學(xué)習(xí)參數(shù)。在該情形下,例如,可以在學(xué)習(xí)要在用戶之間共享的先驗(yàn)分布之前,針對每個(gè)用戶學(xué)習(xí)參數(shù)。利用后一種處理,有可能影響與其共享先驗(yàn)分布的任何其他用戶的參數(shù)的學(xué)習(xí)?;氐綀D2,在步驟S7中,預(yù)測部分133確定被參考用戶的參數(shù)是否要用于評價(jià)預(yù)測??梢杂袃煞N方法用于預(yù)測由要被評價(jià)預(yù)測的用戶(在下文中,稱為關(guān)注的用戶)對內(nèi)容的評價(jià)。一種方法涉及利用關(guān)注的用戶的參數(shù),另一種方法涉及利用被參考用戶的參數(shù)。例如,如果不存在關(guān)注的用戶正面評價(jià)的被參考用戶,則關(guān)注的用戶的參數(shù)用于評價(jià)預(yù)測。在該情形下,預(yù)測部分133確定被參考用戶的參數(shù)將不用于評價(jià)預(yù)測。作為另一示例,如果通過對涉及任何其它用戶的參數(shù)進(jìn)行加權(quán)平均而獲得關(guān)注的用戶的參數(shù),則關(guān)注的用戶的參數(shù)用于評價(jià)預(yù)測。在該情形下,預(yù)測部分133還確定被參考用戶的參數(shù)將不用于評價(jià)預(yù)測。作為再一示例,如果存在關(guān)注的用戶正面評價(jià)的被參考用戶,并且如果關(guān)注的用戶的參數(shù)被單獨(dú)地估計(jì)而不借助于對涉及任何其他用戶的參數(shù)的加權(quán)平均,則以概率α (0 < α ^ 1)利用被參考用戶的參數(shù)來執(zhí)行評價(jià)預(yù)測,以及以概率l-α利用關(guān)注的用戶的參數(shù)來進(jìn)行評價(jià)預(yù)測。也就是說,在該情形下,預(yù)測部分133確定被參考用戶的參數(shù)以1-α 的概率不被用于評價(jià)預(yù)測,并確定被參考用戶的參數(shù)將以α的概率用于評價(jià)預(yù)測。如果存在關(guān)注的用戶正面評價(jià)的多個(gè)被參考用戶,則概率α可以用例如被參考用戶的數(shù)目均分。作為另一示例,可以對所涉及的每個(gè)被參考用戶設(shè)定不同的概率。如果在步驟S7中確定被參考用戶的參數(shù)將不用于評價(jià)預(yù)測,則控制轉(zhuǎn)到步驟S8。在步驟S8中,預(yù)測部分133獲取關(guān)注的用戶的參數(shù)。例如,如果用戶1是關(guān)注的用戶,則預(yù)測部分133從圖9 (或圖10)所示的其它用戶的參數(shù)之中獲取用戶1的參數(shù)。其后,控制轉(zhuǎn)到步驟S10。如果在步驟S7中確定被參考用戶的參數(shù)將用于評價(jià)預(yù)測,則控制轉(zhuǎn)到步驟S9。在步驟S9中,預(yù)測部分133獲取被參考用戶的參數(shù)。例如,如果用戶1是關(guān)注的用戶,則預(yù)測部分133基于圖8中的用戶參考信息來確定用戶1正面評價(jià)的被參考用戶是用戶2。然后,預(yù)測部分133從圖9 (或圖10)所示的用戶的參數(shù)之中獲取用戶2的參數(shù)。 其后,控制轉(zhuǎn)到步驟S10。在步驟SlO中,預(yù)測部分133執(zhí)行評價(jià)預(yù)測。具體地,從其信息被存儲在內(nèi)容信息保持部分122中的內(nèi)容之中,預(yù)測部分133預(yù)測關(guān)注的用戶關(guān)于待被評價(jià)的那些內(nèi)容的評價(jià)。也就是說,從其信息被保持在內(nèi)容信息保持部分122中的內(nèi)容之中,預(yù)測部分133預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià),該關(guān)注的用戶的關(guān)于所述內(nèi)容的內(nèi)容評價(jià)信息沒有被存儲在內(nèi)容評價(jià)信息保持部分119中。例如,預(yù)測部分133可基于以下表達(dá)式⑴計(jì)算邏輯回歸的輸出值fw(x)fw(x) = l/(l+exp(-wTx)) …(1)其中,“W”表示在評價(jià)中使用的用戶的參數(shù),“X”表示給出要被評價(jià)的內(nèi)容的特征
量的矢量。以上矩陣“X”包括其值保持為“1”與參數(shù)的常數(shù)項(xiàng)對應(yīng)的元素。預(yù)測部分133取計(jì)算的輸出值fw(x)作為關(guān)注的用戶關(guān)于所討論的內(nèi)容的預(yù)測評價(jià)值。例如,如果圖9中用戶1的參數(shù)用于評價(jià)預(yù)測,并且如果要被評價(jià)的內(nèi)容1至3的特征量1至4被設(shè)置為圖11中所示的值,則預(yù)測的用戶1關(guān)于內(nèi)容1至3的評價(jià)值fw(x) 分別是 0. 51,0. 81 和 0. 14。此外,利用被預(yù)測的評價(jià)值fV(x)作為伯努里分布的期望值,預(yù)測部分133預(yù)測關(guān)注的用戶關(guān)于具有特征量“X”的內(nèi)容的評價(jià)是正面的還是負(fù)面的。預(yù)測的評價(jià)值fV(x)的值越大,關(guān)注的用戶喜歡所討論的內(nèi)容(即,對其給出正面的評價(jià))的可能性越高。相反,預(yù)測的評價(jià)值fV(x)的值越小,關(guān)注的用戶不喜歡所討論的內(nèi)容(即,對其給出負(fù)面的評價(jià)) 的可能性越高。預(yù)測部分133對內(nèi)容呈現(xiàn)部分123供應(yīng)關(guān)注的用戶關(guān)于待被評價(jià)的內(nèi)容的預(yù)測評價(jià)值fw(x)。在步驟Sll中,內(nèi)容呈現(xiàn)部分123呈現(xiàn)該內(nèi)容。例如,內(nèi)容呈現(xiàn)部分123可呈現(xiàn)前 η個(gè)內(nèi)容,并從內(nèi)容信息保持部分122獲取與所提取的內(nèi)容相關(guān)的信息。內(nèi)容呈現(xiàn)部分123 繼續(xù)進(jìn)行以經(jīng)由網(wǎng)絡(luò)(未示出)將所獲取的與內(nèi)容有關(guān)的信息發(fā)送到比如關(guān)注的用戶所擁有的信息裝置(例如,計(jì)算機(jī)、移動電話、便攜式信息終端)。當(dāng)與所提取的內(nèi)容相關(guān)的信息顯示在關(guān)注的用戶的信息裝置上時(shí),將所討論的內(nèi)容推薦給該用戶。其后,內(nèi)容推薦過程結(jié)束。以上述方式,除了關(guān)注的用戶的評價(jià)信息之外,根據(jù)其語言表達(dá)被關(guān)注的用戶評價(jià)的一些其他用戶的評價(jià)信息,或者被關(guān)注的用戶評價(jià)的一些其他用戶的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。從而,基于與之前相比具有更高置信度的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。因此,提高了預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)的準(zhǔn)確度,這使得與用戶的品位更一致地向關(guān)注的用戶推薦內(nèi)容成為可能。<2.變型例 >在前述描述中,利用邏輯回歸的CBF技術(shù)被顯示為預(yù)測關(guān)于內(nèi)容的評價(jià)的典型技術(shù)??商鎿Q地,任何其它適當(dāng)?shù)膶W(xué)習(xí)技術(shù)可被用于實(shí)現(xiàn)本公開??善谕没貧w技術(shù)來預(yù)測連續(xù)值,諸如線性回歸或者支持矢量回歸,來代替分類技術(shù)諸如邏輯回歸或者SVM。在該情形下,當(dāng)在圖2的步驟S2中確定評價(jià)好感度時(shí),可以利用狀語表達(dá)諸如“非?!焙汀昂苌佟?來建立正面或負(fù)面評價(jià)的程度。在前述的描述中,示出博客作為從其收集語言表達(dá)的來源。然而,這不是對于本公開的限制??商鎿Q地,其它來源諸如SNS和推特(注冊商標(biāo))可被設(shè)定作為從其采集語言表達(dá)的目的地。作為另一可替換方案,可以不僅利用從所收集的語言表達(dá)提取的內(nèi)容評價(jià)信息, 而且利用由內(nèi)容評價(jià)信息獲取部118從外部獲取的內(nèi)容評價(jià)信息來執(zhí)行學(xué)習(xí)過程。本公開也可應(yīng)用于多種信息處理裝置、信息處理系統(tǒng)、和用于預(yù)測用戶關(guān)于內(nèi)容的評價(jià)或者用于向用戶推薦內(nèi)容的軟件,等其它目的。[計(jì)算機(jī)的典型結(jié)構(gòu)]上述的一系列過程可以通過硬件或者通過軟件執(zhí)行。在通過軟件執(zhí)行過程時(shí),構(gòu)成軟件的程序被安裝到適當(dāng)?shù)挠?jì)算機(jī)中用于過程執(zhí)行。這樣的計(jì)算機(jī)包括能夠基于安裝在其中的程序執(zhí)行多種功能的具有預(yù)先在其專用硬件中安裝軟件的計(jì)算機(jī)、和通用個(gè)人計(jì)算機(jī)等設(shè)備。圖12是示出利用適當(dāng)?shù)某绦驁?zhí)行上述系列過程的計(jì)算機(jī)典型結(jié)構(gòu)的方框圖。在計(jì)算機(jī)中,CPU (中央處理單元)201、ROM (只讀存儲器)202和RAM(隨機(jī)存取存儲器)203經(jīng)由總線204互連。輸入/輸出接口 205也連接到總線204。輸入/輸出接口 205與輸入部分206、輸出部分207、存儲部分208、通信部分209和驅(qū)動210連接。輸入部分206典型地由鍵盤、鼠標(biāo)和麥克風(fēng)組成。輸出部分207 —般由顯示器和揚(yáng)聲器形成。存儲部分208通常由硬盤或者非易失性存儲器組成。通信部分209典型地由網(wǎng)絡(luò)接口形成。驅(qū)動210驅(qū)動可拆卸介質(zhì)211諸如磁盤、光盤、磁光盤和半導(dǎo)體存儲器。在如上概述的構(gòu)造的計(jì)算機(jī)中,CPU 201典型地可以通過經(jīng)由輸入/輸出接口 205 和總線204將相應(yīng)的程序從存儲部分208加載到RAM 203來執(zhí)行上述系列過程,用于程序執(zhí)行。要被計(jì)算機(jī)(即,CPU 201)執(zhí)行的程序可被提供記錄在構(gòu)成封裝介質(zhì)等等的可拆卸介質(zhì)211上。還可通過有線或無線傳輸介質(zhì)諸如局域網(wǎng)、因特網(wǎng)或者數(shù)字衛(wèi)星廣播傳輸來提供程序。
當(dāng)承載相關(guān)程序的適當(dāng)?shù)囊黄刹鹦督橘|(zhì)211附接于驅(qū)動210時(shí),可以通過輸入/ 輸出接口 205將程序從附接的介質(zhì)安裝到存儲部分208中??商鎿Q地,在程序被安裝在存儲部分208中之前,可以由通信部分209通過有線或無線傳輸介質(zhì)接收程序。根據(jù)另一可替換方案,程序可預(yù)安裝在ROM 202或者存儲部分208中。此外,用于由計(jì)算機(jī)執(zhí)行的程序可以按照本說明書描述的順序(即,根據(jù)時(shí)間序列)、并行地、或者以其它適當(dāng)?shù)臅r(shí)間方式如當(dāng)它們被調(diào)用時(shí)來處理。在本說明書中,術(shù)語“系統(tǒng)”指的是由多個(gè)組成器件和元件組成的全部配置。本領(lǐng)域的技術(shù)人員應(yīng)該理解的是,可根據(jù)設(shè)計(jì)要求和其它因素發(fā)生各種改進(jìn)、組合、次組合和改變,只要它們在所附權(quán)利要求或其它等同方案的范圍內(nèi)。本公開包含與2010年5月31日在日本專利局提交的日本在先專利申請JP 2010-124183中公開的主題相關(guān)的主題,在此通過引用結(jié)合其全部內(nèi)容。
權(quán)利要求
1.一種信息處理裝置,包括評價(jià)信息提取部,被配置成從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)中提取評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對所述要被評價(jià)的對象的評價(jià);識別部,被配置成識別所述評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;評價(jià)預(yù)測部,被配置成基于由所述關(guān)注的用戶給出的所述第一類型的評價(jià)信息以及基于在由所述關(guān)注的用戶給出的所述第二類型的評價(jià)信息中的由所述其他用戶給出的評價(jià)信息,來預(yù)測所述關(guān)注的用戶關(guān)于所述內(nèi)容的評價(jià)。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述第二類型的所述評價(jià)信息包括其中由所述其他用戶給出的所述語言表達(dá)要被評價(jià)的所述評價(jià)信息;以及其中,所述評價(jià)預(yù)測部基于由所述關(guān)注的用戶給出的所述第一類型的所述評價(jià)信息以及基于在由所述關(guān)注的用戶給出的所述第二類型的所述評價(jià)信息中由要被評價(jià)的所述其他用戶給出的所述語言表達(dá)中包括的所述評價(jià)信息,來預(yù)測所述關(guān)注的用戶關(guān)于所述內(nèi)容的評價(jià)。
3.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述第二類型的評價(jià)信息包括將所述其他用戶作為要被評價(jià)的對象的所述評價(jià)信息;以及所述評價(jià)預(yù)測部基于由所述關(guān)注的用戶給出的所述第一類型的評價(jià)信息以及基于在由所述關(guān)注的用戶給出的所述第二類型的評價(jià)信息中由作為要被評價(jià)的對象的所述其他用戶給出的所述評價(jià)信息,來預(yù)測所述關(guān)注的用戶關(guān)于所述內(nèi)容的評價(jià)。
4.根據(jù)權(quán)利要求1所述的信息處理裝置,其中所述評價(jià)預(yù)測部包括估計(jì)部,被配置成基于由所述關(guān)注的用戶給出的所述第一類型的評價(jià)信息以及基于由所述關(guān)注的用戶給出的所述第二類型的所述評價(jià)信息中的由所述其他用戶給出的所述評價(jià)信息,來估計(jì)在所述關(guān)注的用戶對所述內(nèi)容的評價(jià)預(yù)測中使用的參數(shù);以及預(yù)測部,被配置成基于所述關(guān)注的用戶的所述參數(shù),來預(yù)測所述關(guān)注的用戶關(guān)于所述內(nèi)容的評價(jià)。
5.根據(jù)權(quán)利要求4所述的信息處理裝置,其中,所述預(yù)測部將由所述關(guān)注的用戶的參數(shù)與被所述關(guān)注的用戶正面評價(jià)的所述其他用戶的參數(shù)加權(quán)相加所獲得的值設(shè)置作為所述關(guān)注的用戶的所述參數(shù)。
6.根據(jù)權(quán)利要求4所述的信息處理裝置,其中,所述預(yù)測部通過在所述關(guān)注的用戶與被所述關(guān)注的用戶正面評價(jià)的所述其他用戶之間共享所述參數(shù)的先驗(yàn)分布,來估計(jì)所述關(guān)注的用戶的所述參數(shù)。
7.根據(jù)權(quán)利要求4所述的信息處理裝置,其中,所述預(yù)測部通過使用被所述關(guān)注的用戶正面評價(jià)的所述其他用戶的所述參數(shù),來預(yù)測所述關(guān)注的用戶關(guān)于所述內(nèi)容的評價(jià)。
8.一種信息處理方法,與信息處理裝置一起使用,用于預(yù)測關(guān)注的用戶對內(nèi)容的評價(jià), 所述信息處理方法包括從作為由所述關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)中提取評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對所述要被評價(jià)的對象的評價(jià);識別所述評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評階信息;以及基于由所述關(guān)注的用戶給出的所述第一類型的評價(jià)信息以及基于在由所述關(guān)注的用戶給出的所述第二類型的評價(jià)信息中的由所述其他用戶給出的評價(jià)信息,來預(yù)測所述關(guān)注的用戶關(guān)于所述內(nèi)容的評價(jià)。
9. 一種用于使計(jì)算機(jī)執(zhí)行處理的程序,包括從作為由所述關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)中提取評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對所述要被評價(jià)的對象的評價(jià);識別所述評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;以及基于由所述關(guān)注的用戶給出的所述第一類型的評價(jià)信息以及基于在由所述關(guān)注的用戶給出的所述第二類型的評價(jià)信息中的由所述其他用戶給出的評價(jià)信息,來預(yù)測所述關(guān)注的用戶關(guān)于所述內(nèi)容的評價(jià)。
全文摘要
本發(fā)明涉及信息處理裝置、信息處理方法和程序。在此公開一種信息處理裝置,該信息處理裝置包括評價(jià)信息提取部,被配置成從作為由關(guān)注的用戶通過語言表達(dá)的信息給出的語言表達(dá)中提取評價(jià)信息,所述評價(jià)信息包括要被評價(jià)的對象以及對要被評價(jià)的對象的評價(jià);識別部,被配置成識別該評價(jià)信息是關(guān)于內(nèi)容的第一類型的評價(jià)信息還是關(guān)于其他用戶的第二類型的評價(jià)信息;以及評價(jià)預(yù)測部,被配置成基于由關(guān)注的用戶給出的第一類型的評價(jià)信息,以及基于由關(guān)注的用戶給出的第二類型的評價(jià)信息中的由其他用戶給出的評價(jià)信息,來預(yù)測關(guān)注的用戶關(guān)于內(nèi)容的評價(jià)。
文檔編號G06F17/30GK102262647SQ20111013980
公開日2011年11月30日 申請日期2011年5月24日 優(yōu)先權(quán)日2010年5月31日
發(fā)明者館野啟 申請人:索尼公司