本文涉及但不限于數(shù)據(jù)處理技術(shù),尤指一種實(shí)現(xiàn)收視信息處理的方法及裝置。
背景技術(shù):
隨著支持雙向通信的智能電視技術(shù)的發(fā)展,對(duì)智能電視數(shù)據(jù)的采集和分析的需求變得越來越多。一般來說,智能電視的數(shù)據(jù)采集系統(tǒng)只能獲取如機(jī)頂盒標(biāo)識(shí)、智能電視標(biāo)識(shí)等代表以戶為單位的家庭屬性信息,具體收視行為涉及到的具體收視人員無法直接通過電視機(jī)或機(jī)頂盒獲取。當(dāng)在進(jìn)行收視率分析、受眾屬性分析、節(jié)目推薦等需求分析時(shí),往往需要具體的收視人員及其人口屬性、興趣愛好等信息。
目前,對(duì)每一戶家庭具體收視人員的信息分析主要可以分為以下幾種:
(1)通過帶有用戶識(shí)別按鈕的特殊遙控器或特定智能終端來識(shí)別唯一收視人員。每個(gè)家庭的收視人員在觀看電視時(shí),通過按下特殊遙控器或特定智能終端上的特定按鈕表明身份才可以使用電視,由此記錄此次收視行為對(duì)應(yīng)的收視人員。這種方法大大影響了用戶觀看電視的體驗(yàn),且調(diào)研成本很昂貴、無法獲得大量的樣本;而樣本量少時(shí),不僅在數(shù)據(jù)分析時(shí)容易出現(xiàn)較大的方差,也更容易被污染。另外,收視人員在觀看電視時(shí)也可能存在忘記操作或誤操作特定按鈕等情況,影響獲取的信息的準(zhǔn)確性。
(2)通過在電視機(jī)或機(jī)頂盒上安裝特殊的識(shí)別設(shè)備,如攝像頭、紅外模塊等,對(duì)觀看電視的收視人員進(jìn)行識(shí)別。這種方法成本較高,并且涉及收視人員的用戶隱私,因此還沒有完善的應(yīng)用方案。
(3)對(duì)一部分樣本戶進(jìn)行調(diào)研,將歷史數(shù)據(jù)中每個(gè)家庭的收視人員的收視習(xí)慣作為其在未來的收視行為的參照。例如某樣本戶在調(diào)研中回答該戶在晚上觀看體育節(jié)目的人員為父親和兒子,母親不觀看。那么之后該戶每次在晚上發(fā)生體育節(jié)目的收視行為時(shí),都認(rèn)為對(duì)應(yīng)的收看人員為父親和兒子。這種方法沒有考慮到每個(gè)家庭成員每天的具體收視行為的變化,因此跟真實(shí)情況具有不可避免的偏差。
(4)直接對(duì)當(dāng)前用戶行為數(shù)據(jù)進(jìn)行分析,例如申請(qǐng)?zhí)枮镃N201510890345中公開了基于影片主題判斷收視人員的方法。但專利中僅僅給出了根據(jù)影片主題來確定特定收視人群的舉例,即“古裝戰(zhàn)爭劇是年輕男性觀看,當(dāng)紅明星古裝劇是年輕女性觀看”,沒有給出完整的從主題推導(dǎo)收視人群的方法。該方法中也未考慮同一節(jié)目被不同收視人群觀看的客觀情況,因此跟實(shí)際情況很可能具有較大的出入。
綜上,上述對(duì)收視人員的信息分析方法存在成本、誤差、隱私等問題,無法對(duì)收視成員的信息進(jìn)行有效分析。
技術(shù)實(shí)現(xiàn)要素:
以下是對(duì)本文詳細(xì)描述的主題的概述。本概述并非是為了限制權(quán)利要求的保護(hù)范圍。
本發(fā)明實(shí)施例提供一種實(shí)現(xiàn)收視信息處理的方法及裝置,能夠?qū)κ找暼藛T的信息進(jìn)行有效分析。
本發(fā)明實(shí)施例提供了一種實(shí)現(xiàn)收視信息處理的方法,包括:
以戶為單位統(tǒng)計(jì)預(yù)設(shè)數(shù)值戶家庭的收視樣本信息;
根據(jù)統(tǒng)計(jì)的所述收視樣本信息統(tǒng)計(jì)每一個(gè)收視成員的收視情況;
根據(jù)統(tǒng)計(jì)獲得的收視情況擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;
采集需要進(jìn)行收視分析的每一戶家庭的收視源信息;
根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況;
其中,所述收視樣本信息包括:第一預(yù)設(shè)時(shí)長內(nèi)每一戶家庭中的每一個(gè)收視成員的人口屬性,及按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)的每一個(gè)收視成員的收視信息。
可選的,所述預(yù)設(shè)時(shí)段包括:工作日中以第一預(yù)設(shè)時(shí)長劃分的第一時(shí)段和節(jié)假日時(shí)以第二預(yù)設(shè)時(shí)長劃分的第二時(shí)段,所述收視信息包括:
每一個(gè)第一時(shí)段中每一個(gè)收視成員的收視節(jié)目類別;
每一個(gè)第二時(shí)段中每一個(gè)收視成員的收視節(jié)目類別。
可選的,所述統(tǒng)計(jì)收視樣本信息中的每一個(gè)收視成員的收視情況包括:
按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)所述收視樣本信息中的每一個(gè)收視成員收看每一種收視節(jié)目類別的收視頻次,并根據(jù)統(tǒng)計(jì)的收視頻次計(jì)算每一個(gè)收視人員在每一個(gè)預(yù)設(shè)時(shí)段收視每一收視節(jié)目類別的概率;
其中,在第i個(gè)所述預(yù)設(shè)時(shí)段里觀看收視節(jié)目類別為第j類節(jié)目的頻次記為count(時(shí)段=i,類型=j(luò));
收視成員在時(shí)段下i觀看每一種收視節(jié)目類別的節(jié)目的概率為:
其中,T是收視節(jié)目類別的個(gè)數(shù)。
可選的,所述擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息包括:
根據(jù)統(tǒng)計(jì)獲得的所述收視情況匯聚具有相同人口屬性的收視成員,在相同的預(yù)設(shè)時(shí)段收看所有收視節(jié)目類別的概率后,使用最大似然估計(jì)法擬合出對(duì)應(yīng)的超分布參數(shù);
其中,所述超分布參數(shù)包括狄利克雷Dirichlet分布,超參數(shù)分布的計(jì)算公式為:
其中,為計(jì)算獲得的所有收視成員收視各個(gè)收視節(jié)目類別的節(jié)目的平均概率;N為收視樣本信息中滿足一種人口屬性的收視成員總數(shù),pk(類型=j(luò),時(shí)段=i)為第k個(gè)收視成員在第i個(gè)預(yù)設(shè)時(shí)段收看收視節(jié)目類別為j的概率,T是收視節(jié)目類別的個(gè)數(shù);
根據(jù)擬合出的超分布參數(shù)獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;其中,收視習(xí)慣概率信息的計(jì)算公式包括:
其中,為Beta函數(shù),pl表示收視成員在第i個(gè)預(yù)設(shè)時(shí)段觀看收視節(jié)目類別l的概率,l=1、2、3……T。
可選的,所述收視源信息包括以下任意組合:收視設(shè)備身份標(biāo)識(shí)號(hào)ID、收視行為時(shí)間、收看的節(jié)目、收視節(jié)目類別。
可選的,所述根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析包括:
對(duì)第二預(yù)設(shè)時(shí)長內(nèi)采集的每一戶家庭的所述收視源信息,按照預(yù)設(shè)時(shí)段和收視節(jié)目類別統(tǒng)計(jì)每一戶家庭的待分析特征向量;其中,待分析特征向量V={v1×1,v1×2,…,vM×N},M表示預(yù)設(shè)時(shí)段的個(gè)數(shù),N是收視節(jié)目類別的個(gè)數(shù),該收視設(shè)備在第i個(gè)預(yù)設(shè)時(shí)段觀看第j個(gè)收視節(jié)目類別的頻次為向量V的第k維vk,k=(i-1)×N+j;
從收視樣本信息截取第二預(yù)設(shè)時(shí)長的收視信息,獲得所述收視樣本信息中每一戶家庭的樣本特征向量;其中,基于收視樣本信息計(jì)算的樣本特征向量可以記為V1、V2、……Vi……、VL;其中,L是收視樣本集合里的家庭總戶數(shù);
對(duì)統(tǒng)計(jì)的每一戶家庭的待分析特征向量,分別與所述收視樣本信息中每一戶家庭的樣本特征向量進(jìn)行相似度計(jì)算,將相似度最高的樣本特征向量對(duì)應(yīng)的家庭的收視成員數(shù)作為該待分析特征向量對(duì)應(yīng)的家庭的收視成員數(shù);其中,進(jìn)行相似度計(jì)算的計(jì)算公式為:
根據(jù)確定的所述收視成員數(shù)、及根據(jù)所述收視樣本信息統(tǒng)計(jì)的每一個(gè)收視成員的所述收視情況及所述收視習(xí)慣概率信息,對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況。
可選的,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況后,所述方法還包括:
對(duì)各收視源信息對(duì)應(yīng)的家庭中收視在相同預(yù)設(shè)時(shí)段同時(shí)收視相同電視節(jié)目的用戶進(jìn)行統(tǒng)計(jì)。
另一方面,本發(fā)明實(shí)施例還提供一種實(shí)現(xiàn)收視信息處理的裝置,包括:統(tǒng)計(jì)樣本單元、統(tǒng)計(jì)收視情況單元、擬合單元、采集單元、分析單元;其中,
統(tǒng)計(jì)樣本單元用于,以戶為單位統(tǒng)計(jì)預(yù)設(shè)數(shù)值戶家庭的收視樣本信息;
統(tǒng)計(jì)收視情況單元用于,根據(jù)統(tǒng)計(jì)的所述收視樣本信息統(tǒng)計(jì)每一個(gè)收視成員的收視情況;
擬合單元用于,根據(jù)統(tǒng)計(jì)獲得的收視情況擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;
采集單元用于,采集需要進(jìn)行收視分析的每一戶家庭的收視源信息;
分析單元用于,根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況;
其中,所述收視樣本信息包括:第一預(yù)設(shè)時(shí)長內(nèi)每一戶家庭中的每一個(gè)收視成員的人口屬性,及按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)的每一個(gè)收視成員的收視信息。
可選的,所述預(yù)設(shè)時(shí)段包括:工作日中以第一預(yù)設(shè)時(shí)長劃分的第一時(shí)段和節(jié)假日時(shí)以第二預(yù)設(shè)時(shí)長劃分的第二時(shí)段,所述收視信息包括:
每一個(gè)第一時(shí)段中每一個(gè)收視成員的收視節(jié)目類別;
每一個(gè)第二時(shí)段中每一個(gè)收視成員的收視節(jié)目類別。
可選的,所述統(tǒng)計(jì)收視情況單元具體用于:
按照所述預(yù)設(shè)時(shí)段統(tǒng)計(jì)所述收視樣本信息中的每一個(gè)收視成員收看每一種收視節(jié)目類別的收視頻次,并根據(jù)統(tǒng)計(jì)的收視頻次計(jì)算每一個(gè)收視人員在每一個(gè)預(yù)設(shè)時(shí)段收視每一收視節(jié)目類別的概率;
其中,在第i個(gè)所述預(yù)設(shè)時(shí)段里觀看收視節(jié)目類別為第j類節(jié)目的頻次記為count(時(shí)段=i,類型=j(luò));
收視成員在時(shí)段下i觀看每一種收視節(jié)目類別的節(jié)目的概率為:
其中,T是收視節(jié)目類別的個(gè)數(shù)。
可選的,所述擬合單元擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息包括:
根據(jù)統(tǒng)計(jì)獲得的所述收視情況匯聚具有相同人口屬性的收視成員,在相同的預(yù)設(shè)時(shí)段收看所有收視節(jié)目類別的概率后,使用最大似然估計(jì)法擬合出對(duì)應(yīng)的超分布參數(shù);
其中,所述超分布參數(shù)包括狄利克雷Dirichlet分布,超參數(shù)分布的計(jì)算公式為:
其中,為計(jì)算獲得的所有收視成員收視各個(gè)收視節(jié)目類別的節(jié)目的平均概率;N為收視樣本信息中滿足一種人口屬性的收視成員總數(shù),pk(類型=j(luò),時(shí)段=i)為第k個(gè)收視成員在第i個(gè)預(yù)設(shè)時(shí)段收看收視節(jié)目類別為j的概率,T是收視節(jié)目類別的個(gè)數(shù);
根據(jù)擬合出的超分布參數(shù)獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;其中,收視習(xí)慣概率信息的計(jì)算公式包括:
其中,為Beta函數(shù),pl表示收視成員在第i個(gè)預(yù)設(shè)時(shí)段觀看收視節(jié)目類別l的概率,l=1、2、3……T。
可選的,所述收視源信息包括以下任意組合:收視設(shè)備身份標(biāo)識(shí)號(hào)ID、收視行為時(shí)間、收看的節(jié)目、收視節(jié)目類別。
可選的,所述分析單元具體用于,
對(duì)第二預(yù)設(shè)時(shí)長內(nèi)采集的每一戶家庭的所述收視源信息,按照預(yù)設(shè)時(shí)段和收視節(jié)目類別統(tǒng)計(jì)每一戶家庭的待分析特征向量;其中,待分析特征向量V={v1×1,v1×2,…,vM×N},M表示預(yù)設(shè)時(shí)段的個(gè)數(shù),N是收視節(jié)目類別的個(gè)數(shù),該收視設(shè)備在第i個(gè)預(yù)設(shè)時(shí)段觀看第j個(gè)收視節(jié)目類別的頻次為向量V的第k維vk,k=(i-1)×N+j;
從收視樣本信息截取第二預(yù)設(shè)時(shí)長的收視信息,獲得所述收視樣本信息中每一戶家庭的樣本特征向量;其中,基于收視樣本信息計(jì)算的樣本特征向量可以記為V1、V2、……Vi……、VL;其中,L是收視樣本集合里的家庭總戶數(shù);對(duì)統(tǒng)計(jì)的每一戶家庭的待分析特征向量,分別與所述收視樣本信息中每一戶家庭的樣本特征向量進(jìn)行相似度計(jì)算,將相似度最高的樣本特征向量對(duì)應(yīng)的家庭的收視成員數(shù)作為該待分析特征向量對(duì)應(yīng)的家庭的收視成員數(shù);其中,進(jìn)行相似度計(jì)算的計(jì)算公式為:
根據(jù)確定的所述收視成員數(shù)、及根據(jù)所述收視樣本信息統(tǒng)計(jì)的每一個(gè)收視成員的所述收視情況及所述收視習(xí)慣概率信息,對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況。
可選的,所述分析單元還用于,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況后,對(duì)各收視源信息對(duì)應(yīng)的家庭中收視在相同預(yù)設(shè)時(shí)段同時(shí)收視相同電視節(jié)目的用戶進(jìn)行統(tǒng)計(jì)。
與相關(guān)技術(shù)相比,本申請(qǐng)技術(shù)方案包括:包括:以戶為單位統(tǒng)計(jì)預(yù)設(shè)數(shù)值戶家庭的收視樣本信息;根據(jù)統(tǒng)計(jì)的所述收視樣本信息統(tǒng)計(jì)每一個(gè)收視成員的收視情況;根據(jù)統(tǒng)計(jì)獲得的收視情況擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;采集需要進(jìn)行收視分析的每一戶家庭的收視源信息;根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況。本發(fā)明實(shí)施例在克服成本、隱私等問題的前提下,實(shí)現(xiàn)了對(duì)收視成員的信息進(jìn)行有效分析。
在閱讀并理解了附圖和詳細(xì)描述后,可以明白其他方面。
附圖說明
圖1為本發(fā)明實(shí)施例實(shí)現(xiàn)收視信息處理的方法的流程圖;
圖2為本發(fā)明實(shí)施例實(shí)現(xiàn)收視信息處理的裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下文中將結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
圖1為本發(fā)明實(shí)施例實(shí)現(xiàn)收視信息處理的方法的流程圖,如圖1所示,包括:
步驟100、以戶為單位統(tǒng)計(jì)預(yù)設(shè)數(shù)值戶家庭的收視樣本信息;
本發(fā)明實(shí)施例,收視樣本信息可以包括:第一預(yù)設(shè)時(shí)長內(nèi)每一戶家庭中的每一個(gè)收視成員的人口屬性,及按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)的每一個(gè)收視成員的收視信息;這里,人口屬性可以包括性別、年齡、收入等、其中,年齡可以根據(jù)年齡區(qū)間進(jìn)行區(qū)分,例如、每5歲設(shè)置一個(gè)區(qū)間,收入可以按照區(qū)間值進(jìn)行設(shè)定,例如、參考納稅的分段標(biāo)準(zhǔn)設(shè)置區(qū)分不同的收入人群。
需要說明的是,本發(fā)明預(yù)設(shè)數(shù)值可以根據(jù)收視信息處理的精度要求及統(tǒng)計(jì)收視樣本信息的成本進(jìn)行設(shè)置,精度要求越高,成本也就越高;因此根據(jù)精度及成本,本領(lǐng)域技術(shù)人員可以確定預(yù)設(shè)數(shù)值的取值大小。
可選的,本發(fā)明實(shí)施例預(yù)設(shè)時(shí)段包括:工作日中以第一預(yù)設(shè)時(shí)長劃分的第一時(shí)段和節(jié)假日時(shí)以第二預(yù)設(shè)時(shí)長劃分的第二時(shí)段,收視信息包括:
每一個(gè)第一時(shí)段中每一個(gè)收視成員的收視節(jié)目類別;
每一個(gè)第二時(shí)段中每一個(gè)收視成員的收視節(jié)目類別。
需要說明的是,本發(fā)明實(shí)施例第一預(yù)設(shè)時(shí)長一般可以設(shè)置為1個(gè)小時(shí),也可以根據(jù)收看節(jié)目的時(shí)長進(jìn)行設(shè)定;例如、45分鐘,或90分鐘;第二預(yù)設(shè)時(shí)長可以和第一預(yù)設(shè)時(shí)長相同,也可以根據(jù)第一預(yù)設(shè)時(shí)長進(jìn)行設(shè)置,例如、設(shè)置第二預(yù)設(shè)時(shí)長大于第一預(yù)設(shè)時(shí)長。本發(fā)明實(shí)施例還可以根據(jù)收視信息處理的精度要求,可以對(duì)預(yù)設(shè)時(shí)段進(jìn)行調(diào)整,例如、為了獲得更高的精度,可以將節(jié)假日區(qū)分為一般節(jié)假日和較長節(jié)假日,每一個(gè)工作日可以區(qū)分為活動(dòng)時(shí)間和休息時(shí)間,每一個(gè)節(jié)假日可以區(qū)分為室外活動(dòng)時(shí)間和室內(nèi)活動(dòng)時(shí)間;活動(dòng)時(shí)間的第一預(yù)設(shè)時(shí)長可以根據(jù)收看節(jié)目的時(shí)長進(jìn)行設(shè)定,休息時(shí)間可以長于第一預(yù)設(shè)時(shí)長。基于上述定義,收視信息可以是形如“工作日時(shí),一戶家庭中的一個(gè)收視成員A在晚上7點(diǎn)-8點(diǎn)會(huì)觀看新聞?lì)惞?jié)目”的信息;如果將工作日和節(jié)假日均按照1小時(shí)作為預(yù)設(shè)時(shí)段,則本發(fā)明實(shí)施例可以劃分出包括工作日24個(gè)時(shí)段和節(jié)假日24個(gè)時(shí)段在內(nèi)的48個(gè)預(yù)設(shè)時(shí)段。
另外,本發(fā)明實(shí)施例收視節(jié)目類別包括體育、軍事、女性、新聞等;收視節(jié)目類別可以根據(jù)實(shí)際分類設(shè)置進(jìn)行調(diào)整。對(duì)于每一戶家庭里的每一個(gè)收視成員,將其在第i個(gè)預(yù)設(shè)時(shí)段里觀看收視節(jié)目類別為第j類節(jié)目的頻次記為count(時(shí)段=i,類型=j(luò))。本發(fā)明實(shí)施例還可以將未觀看節(jié)目的收視情況記錄為:count(時(shí)段=i,類型=0),記錄類型=0也可以通過其他種類的信息進(jìn)行表示,例如、類型=X、或類型=未觀看。
步驟101、根據(jù)統(tǒng)計(jì)的收視樣本信息統(tǒng)計(jì)每一個(gè)收視成員的收視情況;
可選的,本發(fā)明實(shí)施例統(tǒng)計(jì)收視樣本信息中的每一個(gè)收視成員的收視情況包括:
按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)收視樣本信息中的每一個(gè)收視成員收看每一種收視節(jié)目類別的收視頻次,并根據(jù)統(tǒng)計(jì)的收視頻次計(jì)算每一個(gè)收視人員在每一個(gè)預(yù)設(shè)時(shí)段收視每一收視節(jié)目類別的概率。
根據(jù)調(diào)研數(shù)據(jù),本發(fā)明實(shí)施例可以計(jì)算出收視成員在時(shí)段下i觀看各種類節(jié)目的概率:
其中,計(jì)算公式中:類型為收視節(jié)目類別的縮寫,時(shí)段為預(yù)設(shè)時(shí)段的縮寫,T是收視節(jié)目類別的個(gè)數(shù),所有收視節(jié)目類別的概率組成了該收視成員在一個(gè)預(yù)設(shè)時(shí)段的偏好收視節(jié)目類別的多項(xiàng)式分布。
步驟102、根據(jù)統(tǒng)計(jì)獲得的收視情況擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;
可選的,本發(fā)明實(shí)施例,擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息包括:
根據(jù)統(tǒng)計(jì)獲得的收視情況匯聚具有相同人口屬性的收視成員,在相同的預(yù)設(shè)時(shí)段收看所有收視節(jié)目類別的概率后,使用最大似然估計(jì)法擬合出對(duì)應(yīng)的超分布參數(shù);
可選的,本發(fā)明實(shí)施例超分布參數(shù)為狄利克雷(Dirichlet)分布,在最大似然估計(jì)方法可求出該Dirichlet分布對(duì)應(yīng)第j個(gè)類型的參數(shù)αj。超參數(shù)分布的計(jì)算公式為:
其中,為計(jì)算獲得的所有收視成員收視各個(gè)收視節(jié)目類別的節(jié)目的平均概率;N為收視樣本信息中滿足一種人口屬性的收視成員總數(shù),pk(類型=j(luò),時(shí)段=i)為第k個(gè)收視成員在第i個(gè)預(yù)設(shè)時(shí)段收看收視節(jié)目類別為j的概率,T是收視節(jié)目類別的個(gè)數(shù);
a為配置參數(shù),默認(rèn)a=1。
需要說明的是,對(duì)于一個(gè)收視成員在一個(gè)預(yù)設(shè)時(shí)段的偏好收視節(jié)目類別的多項(xiàng)式分布應(yīng)該服從Dirichlet分布;
根據(jù)擬合出的超分布參數(shù)獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息。
需要說明的是,對(duì)于每一種人口屬性的收視用戶,在時(shí)段i偏好收視節(jié)目類別的多項(xiàng)式分布應(yīng)該服從Dirichlet分布。記收視成員在第i個(gè)預(yù)設(shè)時(shí)段觀看各收視節(jié)目類別的概率的分布為pl,則一個(gè)分布(p1,p2,…,pT)出現(xiàn)的概率等于其在Dirichlet分布上的密度,即收視習(xí)慣概率信息的計(jì)算公式包括:
其中,為Beta函數(shù),pl表示收視成員在第i個(gè)預(yù)設(shè)時(shí)段觀看收視節(jié)目類別l的概率,l=1、2、3……T。
步驟103、采集需要進(jìn)行收視分析的每一戶家庭的收視源信息;
可選的,本發(fā)明實(shí)施例,收視源信息包括以下任意組合:收視設(shè)備身份標(biāo)識(shí)號(hào)(ID)、收視行為時(shí)間、收看的節(jié)目、收視節(jié)目類別。
需要說明的是,采集收視源信息的方法可以是本領(lǐng)域技術(shù)人員的慣用技術(shù)手段,例如、在每一戶家庭的收視設(shè)備上設(shè)置采集裝置,通過采集裝置獲得收視源信息,由于收視設(shè)備(包括機(jī)頂盒和智能電視)具備雙向交互功能,因此在對(duì)用戶進(jìn)行操作時(shí),可以對(duì)收視源信息包含的內(nèi)容進(jìn)行解析和收集;采集的收視源信息可以以日志的方式進(jìn)行存儲(chǔ)。另外,收視設(shè)備ID可以包括:機(jī)頂盒設(shè)備ID、網(wǎng)絡(luò)電視賬戶ID、物理地址(MAC)地址等,這里信息可以區(qū)分不同的家庭;收看的節(jié)目、收視節(jié)目類別包括收看的節(jié)目的具體名稱和節(jié)目所屬類型。收視行為時(shí)間可以包括收看每一個(gè)節(jié)目的時(shí)間。
步驟104、根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況;
可選的,本發(fā)明實(shí)施例根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析包括:
對(duì)第二預(yù)設(shè)時(shí)長內(nèi)采集的每一戶家庭的收視源信息,按照預(yù)設(shè)時(shí)段和收視節(jié)目類別統(tǒng)計(jì)每一戶家庭的待分析特征向量;
這里,以第二預(yù)設(shè)時(shí)長(例如一個(gè)月)采集的每一戶家庭的收視源信息,按照預(yù)設(shè)時(shí)段和收視節(jié)目類別統(tǒng)計(jì),得到收視源信息對(duì)應(yīng)的收視設(shè)備(通過收視設(shè)備ID區(qū)分)在每一個(gè)預(yù)設(shè)時(shí)段觀看各收視節(jié)目類別節(jié)目的頻次,組成表示該戶家庭的待分析特征向量,待分析特征向量可以通過V={v1×1,v1×2,…,vM×N}。其中,M表示預(yù)設(shè)時(shí)段的個(gè)數(shù),N是收視節(jié)目類別的個(gè)數(shù),該收視設(shè)備在第i個(gè)預(yù)設(shè)時(shí)段觀看第j個(gè)收視節(jié)目類別的行為頻次即為向量V的第k維vk,這里k=(i-1)×N+j。
從收視樣本信息截取第二預(yù)設(shè)時(shí)長的收視信息,獲得收視樣本信息中每一戶家庭的樣本特征向量;這里,基于收視樣本信息計(jì)算的樣本特征向量可以記為V1、V2、……Vi……、VL;其中,L是收視樣本集合里的家庭總戶數(shù);
對(duì)統(tǒng)計(jì)的每一戶家庭的待分析特征向量,分別與收視樣本信息中每一戶家庭的樣本特征向量進(jìn)行相似度計(jì)算,將相似度最高的樣本特征向量對(duì)應(yīng)的家庭的收視成員數(shù)作為該待分析特征向量對(duì)應(yīng)的家庭的收視成員數(shù);
可選的,本發(fā)明實(shí)施例可以通過下式進(jìn)行相似度計(jì)算:
這里,Vi表示基于收視樣本信息計(jì)算的樣本特征向量。
需要說明的是,本發(fā)明實(shí)施例還可以通過預(yù)先存儲(chǔ)的調(diào)研數(shù)據(jù)直接獲得收視成員數(shù)。例如、在按照機(jī)頂盒或智能電視時(shí),直接統(tǒng)計(jì)獲得,由于每一戶家庭的收視成員數(shù)一般比較穩(wěn)定,無需通過統(tǒng)計(jì)更新,維護(hù)成本低。
根據(jù)確定的收視成員數(shù)、及根據(jù)收視樣本信息統(tǒng)計(jì)的每一個(gè)收視成員的收視情況及收視習(xí)慣概率信息,對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況。
對(duì)于一個(gè)已獲知收視成員數(shù)的收視設(shè)備(與一戶家庭的收視源信息對(duì)應(yīng)),通過根據(jù)收視樣本信息統(tǒng)計(jì)的每一個(gè)收視成員的收視情況及收視習(xí)慣概率信息可以實(shí)現(xiàn)該戶家庭收視成員的人口屬性,及在收視源信息對(duì)應(yīng)的時(shí)間段內(nèi)各個(gè)收視成員的收視情況;
如果其中一戶家庭的收視源信息的一個(gè)收視成員符合人口屬性A,例如人口屬性A為:女性25到29歲、收入3000-5000,那么該收視成員的行為模式同時(shí)滿足:
(1)在收視樣本信息統(tǒng)計(jì)獲得的屬性A的收視習(xí)慣概率信息;
(2)可以解釋該收視源信息中記錄的收視行為。
具體地,對(duì)于收視成員數(shù)為Q的收視設(shè)備ID(記為F),記收視成員分別為P1、P2、…、PQ,對(duì)應(yīng)的人口屬性為A1、A2、…、AQ。根據(jù)收視樣本信息分析,可以得到P1在一個(gè)預(yù)設(shè)時(shí)段ti觀看不同類型的節(jié)目的多項(xiàng)式分布(記為D(P1,ti))應(yīng)服從人口屬性A1在預(yù)設(shè)時(shí)段ti對(duì)應(yīng)的Dirichlet分布(記為Dirichlet(A1,ti))。對(duì)于收視源信息F的發(fā)生在預(yù)設(shè)時(shí)段ti的觀看類型j的收視行為a,P1的收視習(xí)慣概率為該收視成員的收視節(jié)目類別分布在人口屬性對(duì)應(yīng)的Dirichlet分布下的收視習(xí)慣概率乘以該收視行為被這個(gè)收視節(jié)目類別分布產(chǎn)生的概率,即P(a|P1)=P(D(P1,ti)|Dirichlet(A1,ti))*P(j|D(P1,ti));將一個(gè)收視源信息對(duì)應(yīng)的所有收視成員的收視習(xí)慣概率匯總,那么這一次收視行為a被Q個(gè)收視成員里的至少一個(gè)產(chǎn)生的概率等于1-Q個(gè)收視成員都不產(chǎn)生的概率,即
將D(P1,ti)作為模型中待估計(jì)的參數(shù),通過概率統(tǒng)計(jì)學(xué)里的最大似然法即可計(jì)算出:滿足情況下的D(P1,ti),這個(gè)參數(shù)表示的分布即為該設(shè)備ID下每個(gè)具體用戶在不同時(shí)段觀看不同收視節(jié)目類別的多項(xiàng)式分布。
通過遍歷不同人口屬性組成的所有組合,可以得到各個(gè)人口屬性組合下使得的的D(P1,ti),即:在不同人口屬性的組合下,每個(gè)人口屬性組合產(chǎn)生收視設(shè)備ID的日志的概率。而使得這個(gè)概率最大化的人口屬性組合就是該收視設(shè)備ID對(duì)應(yīng)的最可能的人口屬性組合。而這個(gè)組合下的每個(gè)具體收視成員在不同預(yù)設(shè)時(shí)段觀看不同收視節(jié)目類別的節(jié)目的多項(xiàng)式分布,就可以作為各個(gè)收視成員的具體收視習(xí)慣概率。
獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況后,本發(fā)明實(shí)施例方法還包括:
對(duì)各收視源信息對(duì)應(yīng)的家庭中收視在相同預(yù)設(shè)時(shí)段同時(shí)收視相同電視節(jié)目的用戶進(jìn)行統(tǒng)計(jì)。
對(duì)于一個(gè)待分析戶的收視設(shè)備ID在時(shí)段i觀看收視節(jié)目類別j的行為,此概率可以基于收視樣本信息的統(tǒng)計(jì)分析,例如:
節(jié)目的總觀看人次等于其中,N是采集到的收視行為的日志個(gè)數(shù),Li是第i次收視行為對(duì)應(yīng)的收視設(shè)備ID的收視成員數(shù),P(i,j)是其中第j個(gè)收視成員參與該次收視行為的概率。又例如:
節(jié)目的總女性觀看人次等于其中,指示函數(shù)在第j個(gè)用戶是女性時(shí)取值為1,否則取值為0。
本發(fā)明實(shí)施例在克服成本、隱私等問題的前提下,實(shí)現(xiàn)了對(duì)收視成員的信息進(jìn)行有效分析。
圖2為本發(fā)明實(shí)施例實(shí)現(xiàn)收視信息處理的裝置的結(jié)構(gòu)框圖,如圖2所示,包括:統(tǒng)計(jì)樣本單元、統(tǒng)計(jì)收視情況單元、擬合單元、采集單元、分析單元;其中,
統(tǒng)計(jì)樣本單元用于,以戶為單位統(tǒng)計(jì)預(yù)設(shè)數(shù)值戶家庭的收視樣本信息;
統(tǒng)計(jì)收視情況單元用于,根據(jù)統(tǒng)計(jì)的收視樣本信息統(tǒng)計(jì)每一個(gè)收視成員的收視情況;
擬合單元用于,根據(jù)統(tǒng)計(jì)獲得的收視情況擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;
采集單元用于,采集需要進(jìn)行收視分析的每一戶家庭的收視源信息;
分析單元用于,根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況;
其中,收視樣本信息包括:第一預(yù)設(shè)時(shí)長內(nèi)每一戶家庭中的每一個(gè)收視成員的人口屬性,及按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)的每一個(gè)收視成員的收視信息。
可選的,本發(fā)明實(shí)施例預(yù)設(shè)時(shí)段包括:工作日中以第一預(yù)設(shè)時(shí)長劃分的第一時(shí)段和節(jié)假日時(shí)以第二預(yù)設(shè)時(shí)長劃分的第二時(shí)段,收視信息包括:
每一個(gè)第一時(shí)段中每一個(gè)收視成員的收視節(jié)目類別;
每一個(gè)第二時(shí)段中每一個(gè)收視成員的收視節(jié)目類別。
可選的,本發(fā)明實(shí)施例,統(tǒng)計(jì)收視情況單元具體用于:
按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)收視樣本信息中的每一個(gè)收視成員收看每一種收視節(jié)目類別的收視頻次,并根據(jù)統(tǒng)計(jì)的收視頻次計(jì)算每一個(gè)收視人員在每一個(gè)預(yù)設(shè)時(shí)段收視每一收視節(jié)目類別的概率;
其中,在第i個(gè)預(yù)設(shè)時(shí)段里觀看收視節(jié)目類別為第j類節(jié)目的頻次記為count(時(shí)段=i,類型=j(luò));
收視成員在時(shí)段下i觀看每一種收視節(jié)目類別的節(jié)目的概率為:
其中,T是收視節(jié)目類別的個(gè)數(shù)。
可選的,本發(fā)明實(shí)施例擬合單元擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息包括:
根據(jù)統(tǒng)計(jì)獲得的收視情況匯聚具有相同人口屬性的收視成員,在相同的預(yù)設(shè)時(shí)段收看所有收視節(jié)目類別的概率后,使用最大似然估計(jì)法擬合出對(duì)應(yīng)的超分布參數(shù);
其中,所述超分布參數(shù)包括狄利克雷Dirichlet分布,超參數(shù)分布的計(jì)算公式為:
其中,為計(jì)算獲得的所有收視成員收視各個(gè)收視節(jié)目類別的節(jié)目的平均概率;N為收視樣本信息中滿足一種人口屬性的收視成員總數(shù),pk(類型=j(luò),時(shí)段=i)為第k個(gè)收視成員在第i個(gè)預(yù)設(shè)時(shí)段收看收視節(jié)目類別為j的概率,T是收視節(jié)目類別的個(gè)數(shù);
根據(jù)擬合出的超分布參數(shù)獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;其中,收視習(xí)慣概率信息的計(jì)算公式包括:
其中,為Beta函數(shù),pl表示收視成員在第i個(gè)預(yù)設(shè)時(shí)段觀看收視節(jié)目類別l的概率,l=1、2、3……T。
可選的,本發(fā)明實(shí)施例收視源信息包括以下任意組合:收視設(shè)備身份標(biāo)識(shí)號(hào)ID、收視行為時(shí)間、收看的節(jié)目、收視節(jié)目類別。
可選的,本發(fā)明實(shí)施例,分析單元具體用于,
對(duì)第二預(yù)設(shè)時(shí)長內(nèi)采集的每一戶家庭的收視源信息,按照預(yù)設(shè)時(shí)段和收視節(jié)目類別統(tǒng)計(jì)每一戶家庭的待分析特征向量;其中,待分析特征向量V={v1×1,v1×2,…,vM×N},M表示預(yù)設(shè)時(shí)段的個(gè)數(shù),N是收視節(jié)目類別的個(gè)數(shù),該收視設(shè)備在第i個(gè)預(yù)設(shè)時(shí)段觀看第j個(gè)收視節(jié)目類別的頻次為向量V的第k維vk,k=(i-1)×N+j;
從收視樣本信息截取第二預(yù)設(shè)時(shí)長的收視信息,獲得收視樣本信息中每一戶家庭的樣本特征向量;其中,基于收視樣本信息計(jì)算的樣本特征向量可以記為V1、V2、……Vi……、VL;其中,L是收視樣本集合里的家庭總戶數(shù);
對(duì)統(tǒng)計(jì)的每一戶家庭的待分析特征向量,分別與收視樣本信息中每一戶家庭的樣本特征向量進(jìn)行相似度計(jì)算,將相似度最高的樣本特征向量對(duì)應(yīng)的家庭的收視成員數(shù)作為該待分析特征向量對(duì)應(yīng)的家庭的收視成員數(shù);其中,進(jìn)行相似度計(jì)算的計(jì)算公式為:
根據(jù)確定的收視成員數(shù)、及根據(jù)收視樣本信息統(tǒng)計(jì)的每一個(gè)收視成員的收視情況及收視習(xí)慣概率信息,對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況。
可選的,本發(fā)明實(shí)施例分析單元還用于,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況后,對(duì)各收視源信息對(duì)應(yīng)的家庭中收視在相同預(yù)設(shè)時(shí)段同時(shí)收視相同電視節(jié)目的用戶進(jìn)行統(tǒng)計(jì)。
以下通過具體應(yīng)用示例對(duì)本發(fā)明進(jìn)行清楚詳細(xì)的說明,應(yīng)用示例僅用于陳述本發(fā)明,并不用于限定本發(fā)明的保護(hù)范圍。
應(yīng)用示例
本應(yīng)用示例按照收視信息處理過程對(duì)收視分析進(jìn)行整理,包括:
(1)收視樣本信息
通過對(duì)選擇的家庭進(jìn)行調(diào)研獲得包括收視成員組成、人口屬性和收視信息的收視樣本信息,表1為收視樣本信息的示例:
從表中可以得到對(duì)應(yīng)戶1收視成員1,其人口屬性是:男性30到34歲,在工作日晚上8-9點(diǎn),他收看體育類節(jié)目,因此平時(shí)晚上8點(diǎn)的他的收視行為分布是{體育類:1},類似的可以得到:
戶1人員1在工作日晚上9-10點(diǎn)收看行為分布是{金融:1};
戶1人員2在工作日晚上8-9點(diǎn)收看行為分布是{古裝?。?.5,情感?。?.5};
戶2人員1在工作日晚上8-9點(diǎn)收看行為分布是{體育:0.5,實(shí)事:0.5};
戶2人員1在工作日晚上9-10點(diǎn)收看行為分布是{不看;1};
戶2人員1在工作日晚上10-11點(diǎn)收看行為分布是{古裝?。?};
表1
進(jìn)一步的,將所有相同人口屬性的收視成員在同一個(gè)預(yù)設(shè)時(shí)段的收視行為分布進(jìn)行整合。在上例中,男性30-34歲對(duì)應(yīng)有兩個(gè)收視成員:戶1收視成員1和戶2收視成員1。那么,男性30-34歲在工作日晚上8-9點(diǎn)的Dirichlet分布的參數(shù)為這兩個(gè)收視成員的收視習(xí)慣概率平均后加1,即體育類為:(0.5+1)/2+1=1.75,實(shí)事類為:(0.5+0)/2=1.25。類似的,還可以得到:
男性30-34歲在工作日晚上9-10點(diǎn)的Dirichlet分布的參數(shù)為{金融:1.5,不看:1.5};
男性30-34歲在工作日晚上10-11點(diǎn)的Dirichlet分布的參數(shù)為{古裝?。?.5,不看:1.5};
實(shí)際中需要使用男性30-34歲的所有樣本來得到更合理的分布,而這些分布就代表著這個(gè)人口屬性的收視成員的一個(gè)平均收視習(xí)慣。
(2)采集收視源信息;
本發(fā)明實(shí)施例收視源信息的采集可以理解為日志采集,以一個(gè)家庭的收視源信息為例,表2為某一個(gè)收視設(shè)備ID的日志:
表2
(3)收視源信息對(duì)應(yīng)的家庭的收視習(xí)慣分析
通過調(diào)研或相似度計(jì)算來得到每個(gè)收視設(shè)備ID的收視成員數(shù)。這里,假設(shè)已經(jīng)得到收視設(shè)備ID1的的收視成員總數(shù)為2。且收視成員1的人口屬性為男性30-34歲,收視成員2的人口屬性為女性25-29歲。那么這兩個(gè)收視成員在不同預(yù)設(shè)時(shí)段的各個(gè)收視節(jié)目類別的收視習(xí)慣概率即為需要估計(jì)的參數(shù)。
將第一個(gè)收視成員信息在平時(shí)晚上8-9點(diǎn)的收看各個(gè)收視節(jié)目類別的概率記為p(類別),本例中男性30-34在工作日晚上8-9點(diǎn)的Dirichlet分布為{體育類:0.75,實(shí)事類:0.25},所以第一個(gè)收視成員的特定分布的概率為:
例如,如果第一個(gè)收視成員的多項(xiàng)式分布為{體育類:0.5,實(shí)事類:0.25,不看0.25},那對(duì)應(yīng)的多項(xiàng)式分布的概率是:
另一方面,第一條日志的收視源信息為工作日晚上8-9點(diǎn)觀看體育類節(jié)目,那么他被第一個(gè)收視成員(男性30-34歲)生成多項(xiàng)式分布的概率為0.5。因此,在這種情況下第一個(gè)收視成員能產(chǎn)生這條日志的概率為:
同樣的,可得到日志1被第二個(gè)收視成員生成的概率,從而得到日志1至少一個(gè)收視成員生成的概率p(日志1)。然后,將所有日志的概率相乘得到,即最后的總概率Πp(日志1)。然后,通過概率統(tǒng)計(jì)中的最大似然法和梯度下降法,找出使得這個(gè)總概率最大的分布。進(jìn)行運(yùn)算后,可以得到的第一個(gè)收視成員在工作日晚上8點(diǎn)的p(體育)=0.7,p(實(shí)事)=0.25,p(情感劇)=0.05。
然后遍歷人口屬性,這里,如果第一個(gè)收視成員的人口屬性為男性30-34歲,第二個(gè)收視成員的人口屬性為女性30-34歲,計(jì)算得到一個(gè)最大的總概率,本發(fā)明實(shí)施例假設(shè)計(jì)算出來為0.331;如果第一個(gè)收視成員的人口屬性為男性25-29歲,第二個(gè)收視成員的人口屬性為女性25-29歲,計(jì)算得到一個(gè)最大的總概率,這里設(shè)計(jì)算出來為0.115;如果第一個(gè)收視成員的人口屬性為男性25-29歲,第二個(gè)人的人口屬性為女性30-34歲,計(jì)算得到一個(gè)最大的總概率,這里設(shè)計(jì)算出來為0.023;……
從這些人口屬性組合里面,取出總概率最大的那個(gè)組合,作為實(shí)際的家庭組合。在上面設(shè)的結(jié)果中,應(yīng)該選擇男性30-34歲和女性25-29歲這個(gè)組合。得到這個(gè)組合后,這個(gè)組合中的概率就被認(rèn)為是每個(gè)收視成員在每個(gè)預(yù)設(shè)時(shí)段的看每個(gè)收視節(jié)目類別的概率,例如、第一個(gè)收視成員在工作日晚上8-9點(diǎn)觀看體育類節(jié)目的概率=0.7。
(4)實(shí)時(shí)日志分析
在上一步中得到了家庭組成中第一個(gè)收視成員的人口屬性為男性30-34,第二個(gè)收視成員的人口屬性為女性25-29。設(shè)計(jì)算出來的概率為:第一個(gè)收視成員在工作日晚上8點(diǎn)的分布為p(體育)=0.7,p(實(shí)事)=0.2,p(情感劇)=0.1,第二個(gè)人在平時(shí)晚上8點(diǎn)的分布為p(實(shí)事)=0.2,p(古裝劇)=0.3,p(情感劇)=0.5。
那么對(duì)于上例中的日志1,即平時(shí)8-9點(diǎn)的體育觀看行為,這次觀看行為的4種可能為1和2都觀看、只有1觀看、只有2觀看、1和2都不觀看。注意實(shí)際中第4種情況不會(huì)發(fā)生,因?yàn)檫@次收視行為已經(jīng)發(fā)生了,所以一定有人觀看。計(jì)算可得前三種情況的概率分別為0.7×0=0,0.7×(1-0)=0.7,(1-0.7)×0=0,因此本次節(jié)目一定是第一個(gè)收視成員自己觀看。
對(duì)于上例中的日志4,即平時(shí)8-9點(diǎn)的情感劇觀看行為,4種情況的概率計(jì)算為0.1*0.5,0.1*(1-0.5),(1-0.1)*0.5,(1-0.1)*(1-0.5),去掉最后一種情況后,得到3種情況的概率分別是0.05,0.05,0.45,因此可認(rèn)為該次觀看有3種可能;其中,
兩個(gè)收視成員一起觀看的概率為
第一個(gè)收視成員自己觀看的概率為
第二個(gè)收視成員自己觀看的概率為
根據(jù)這個(gè)結(jié)果,即可以得到每個(gè)只有收視設(shè)備ID的日志中不同收視成員的收視情況,從而實(shí)現(xiàn)從收視戶到收視人的轉(zhuǎn)化,并進(jìn)行各種后續(xù)的數(shù)據(jù)統(tǒng)計(jì)。
本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關(guān)硬件(例如處理器)完成,所述程序可以存儲(chǔ)于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如只讀存儲(chǔ)器、磁盤或光盤等??蛇x地,上述實(shí)施例的全部或部分步驟也可以使用一個(gè)或多個(gè)集成電路來實(shí)現(xiàn)。相應(yīng)地,上述實(shí)施例中的每個(gè)模塊/單元可以采用硬件的形式實(shí)現(xiàn),例如通過集成電路來實(shí)現(xiàn)其相應(yīng)功能,也可以采用軟件功能模塊的形式實(shí)現(xiàn),例如通過處理器執(zhí)行存儲(chǔ)于存儲(chǔ)器中的程序/指令來實(shí)現(xiàn)其相應(yīng)功能。本發(fā)明不限制于任何特定形式的硬件和軟件的結(jié)合。
雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容僅為便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式及細(xì)節(jié)上進(jìn)行任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。