两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種識(shí)別用戶性別的方法及系統(tǒng)的制作方法

文檔序號(hào):8319316閱讀:310來(lái)源:國(guó)知局
一種識(shí)別用戶性別的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種識(shí)別用戶性別的方法及系統(tǒng)。
【背景技術(shù)】
[0002] 在當(dāng)前,隨著多媒體技術(shù)和網(wǎng)絡(luò)信息傳播技術(shù)的高度成熟,通過(guò)網(wǎng)絡(luò)播放并瀏覽 多媒體視頻,早已成為成千上萬(wàn)用戶的習(xí)慣。電影、電視劇、綜藝節(jié)目或新聞等各種媒體形 式,均可以以網(wǎng)絡(luò)視頻作為載體向用戶呈現(xiàn);充分的滿足了用戶的工作、娛樂及學(xué)習(xí)等多樣 的需求。
[0003] 網(wǎng)絡(luò)視頻的普及,也衍生出國(guó)內(nèi)外眾多提供網(wǎng)絡(luò)視頻的視頻網(wǎng)站;近年來(lái)視頻網(wǎng) 站以吸引用戶為目的,展開了激烈的競(jìng)爭(zhēng)。而在此競(jìng)爭(zhēng)中,能夠提供出眾的用戶體驗(yàn),對(duì)于 視頻網(wǎng)站來(lái)說(shuō)是尤為重要的。幾乎所有的視頻網(wǎng)站,都在不懈的進(jìn)行著研發(fā)與改良,以便于 使其用戶體驗(yàn)不斷的提高。
[0004] 目前階段,視頻網(wǎng)站在面對(duì)大量用戶的時(shí)候,建立用戶畫像,并根據(jù)用戶畫像而有 針對(duì)性的向用戶提供相關(guān)的視頻,能夠顯著的影響用戶體驗(yàn)。所謂用戶畫像,即是一個(gè)描繪 用戶的性別、年齡、地域及階層等諸多屬性信息的信息集合。從概率上來(lái)說(shuō),用戶畫像中的 屬性信息很大程度上決定了用戶對(duì)于網(wǎng)絡(luò)視頻的需求。尤其是用戶畫像中"性別"這一用戶 屬性,對(duì)用戶需求的影響最為明顯,可以說(shuō)是用戶畫像中最簡(jiǎn)單也最重要的一個(gè)屬性信息。
[0005] 在用戶的注冊(cè)信息完整的情況下,用戶畫像中的屬性信息,特別是用戶的性別是 可以直接取得的。但如果用戶注冊(cè)信息不完整,現(xiàn)有技術(shù)中無(wú)法準(zhǔn)確的推斷用戶性別,從而 進(jìn)一步的獲悉用戶對(duì)網(wǎng)絡(luò)視頻的需求情況。

【發(fā)明內(nèi)容】

[0006] 有鑒于此,本發(fā)明的目的在于提供一種識(shí)別用戶性別的方法及系統(tǒng),實(shí)現(xiàn)通過(guò)用 戶的行為,對(duì)用戶的性別進(jìn)行推測(cè)。
[0007] 為實(shí)現(xiàn)上述目的,本發(fā)明有如下技術(shù)方案:
[0008] 一種識(shí)別用戶性別的方法,所述方法包括:
[0009] 根據(jù)視頻內(nèi)容為所述視頻設(shè)置一個(gè)或多個(gè)標(biāo)簽;通過(guò)統(tǒng)計(jì)計(jì)算已知性別用戶的視 頻操作行為,從所述標(biāo)簽中篩選出特征標(biāo)簽,并計(jì)算特征標(biāo)簽的特征值;
[0010] 采集已知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù)所述操作行為相 應(yīng)特征標(biāo)簽的特征值,建立已知性別用戶的特征向量;
[0011] 將所述已知性別用戶的特征向量和該用戶的性別常量,作為模型參數(shù)而建立性別 分類模型;
[0012] 采集未知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù)所述操作行為建 立未知性別用戶的特征向量;將所述未知性別用戶的特征向量代入所述性別分類模型,得 到未知性別用戶的性別參量;
[0013] 根據(jù)所述未知性別用戶的性別參量判斷未知性別用戶的性別。
[0014] 所述通過(guò)統(tǒng)計(jì)計(jì)算已知性別用戶的視頻操作行為,從所述標(biāo)簽中篩選出特征標(biāo) 簽,并計(jì)算特征標(biāo)簽的特征值具體為:
[0015] 選取預(yù)設(shè)數(shù)量的已知性別用戶建立樣本用戶集合,所述樣本用戶集合中男女用戶 比例為1:1 ;
[0016] 選取一個(gè)標(biāo)簽,統(tǒng)計(jì)樣本用戶集合中,對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的用 戶數(shù)量;并分別計(jì)算對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的男性用戶與女性用戶,在對(duì)該 標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的用戶數(shù)量中的比例;計(jì)算所述男性用戶與女性用戶的比 例差絕對(duì)值;
[0017] 當(dāng)所述對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的用戶數(shù)量大于預(yù)設(shè)的數(shù)量閾值,且 所述比例差絕對(duì)值大于預(yù)設(shè)的性別傾向閾值,則將該標(biāo)簽作為特征標(biāo)簽;并將男性用戶比 例減女性用戶比例之差作為所述特征標(biāo)簽的特征值。
[0018] 所述對(duì)于帶有特征標(biāo)簽的視頻的操作行為包括:
[0019] 對(duì)于帶有特征標(biāo)簽的視頻的搜索次數(shù)、對(duì)于帶有特征標(biāo)簽的視頻的觀看時(shí)長(zhǎng)比例 和對(duì)于帶有特征標(biāo)簽的視頻的瀏覽次數(shù)。
[0020] 所述采集已知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù)所述操作行 與相應(yīng)特征標(biāo)簽的特征值,建立已知性別用戶的特征向量具體為:
[0021] 所述已知性別用戶對(duì)于帶有特征標(biāo)簽1~η的視頻存在操作行為,則所述已知性 別用戶的特征向量具體為;
[0022]
【主權(quán)項(xiàng)】
1. 一種識(shí)別用戶性別的方法,其特征在于,所述方法包括: 根據(jù)視頻內(nèi)容為所述視頻設(shè)置一個(gè)或多個(gè)標(biāo)簽;通過(guò)統(tǒng)計(jì)計(jì)算已知性別用戶的視頻操 作行為,從所述標(biāo)簽中篩選出特征標(biāo)簽,并計(jì)算特征標(biāo)簽的特征值; 采集已知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù)所述操作行為相應(yīng)特 征標(biāo)簽的特征值,建立已知性別用戶的特征向量; 將所述已知性別用戶的特征向量和該用戶的性別常量,作為模型參數(shù)而建立性別分類 豐旲型; 采集未知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù)所述操作行為建立未 知性別用戶的特征向量;將所述未知性別用戶的特征向量代入所述性別分類模型,得到未 知性別用戶的性別參量; 根據(jù)所述未知性別用戶的性別參量判斷未知性別用戶的性別。
2. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述通過(guò)統(tǒng)計(jì)計(jì)算已知性別用戶的視頻操 作行為,從所述標(biāo)簽中篩選出特征標(biāo)簽,并計(jì)算特征標(biāo)簽的特征值具體為: 選取預(yù)設(shè)數(shù)量的已知性別用戶建立樣本用戶集合,所述樣本用戶集合中男女用戶比例 為 1:1 ; 選取一個(gè)標(biāo)簽,統(tǒng)計(jì)樣本用戶集合中,對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的用戶數(shù) 量;并分別計(jì)算對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的男性用戶與女性用戶,在對(duì)該標(biāo)簽 對(duì)應(yīng)的視頻有視頻操作行為的用戶數(shù)量中的比例;計(jì)算所述男性用戶與女性用戶的比例差 絕對(duì)值; 當(dāng)所述對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的用戶數(shù)量大于預(yù)設(shè)的數(shù)量閾值,且所述 比例差絕對(duì)值大于預(yù)設(shè)的性別傾向閾值,則將該標(biāo)簽作為特征標(biāo)簽;并將男性用戶比例減 女性用戶比例之差作為所述特征標(biāo)簽的特征值。
3. 根據(jù)權(quán)利要求2所述方法,其特征在于,所述對(duì)于帶有特征標(biāo)簽的視頻的操作行為 包括: 對(duì)于帶有特征標(biāo)簽的視頻的搜索次數(shù)、對(duì)于帶有特征標(biāo)簽的視頻的觀看時(shí)長(zhǎng)比例和對(duì) 于帶有特征標(biāo)簽的視頻的瀏覽次數(shù)。
4. 根據(jù)權(quán)利要求3所述方法,其特征在于,所述采集已知性別用戶對(duì)于帶有特征標(biāo)簽 的視頻的操作行為,并根據(jù)所述操作行與相應(yīng)特征標(biāo)簽的特征值,建立已知性別用戶的特 征向量具體為: 所述已知性別用戶對(duì)于帶有特征標(biāo)簽1~η的視頻存在操作行為,則所述已知性別用 戶的特征向量具體為;
其中,U為已知性別用戶的特征向量,α和β為調(diào)整系數(shù),:^~fn為特征標(biāo)簽1~η 的特征值,Pi~P η為對(duì)于帶有特征標(biāo)簽1~η的視頻的觀看時(shí)長(zhǎng)比例,s s η為對(duì)于帶有 特征標(biāo)簽1~η的視頻的瀏覽次數(shù),Cl~c η為對(duì)于帶有特征標(biāo)簽1~η的視頻的搜索次數(shù), S為已經(jīng)性別用戶的瀏覽總次數(shù)。
5. 根據(jù)權(quán)利要求4所述方法,其特征在于,男性用戶的性別常量為1,女性用戶的性別 常量為-1,則所述將所述已知性別用戶的特征向量和該用戶的性別常量,作為模型參數(shù)而 建立性別分類模型具體為: 建立分類函數(shù),計(jì)算所述分類函數(shù)的最優(yōu)超平面的系數(shù)γ向量和截距b,所述分類函 數(shù)具體為;
其中,i代表用戶i,j代表用戶j,γ為最優(yōu)超平面的系數(shù),γ即向量(γ:,γ2,… TV……yn),yi為用戶i的性別常量,yj為用戶j的性別常量,1為核函數(shù),Ui為用 戶i的特征向量,U j為用戶j的特征向量; 利用所述分類函數(shù)的最優(yōu)的超平面的系數(shù)γ向量和截距b建立性別分類模型;所述性 別分類模型具體為;
其中,Z(Um)為未知性別用戶的性別參量,^為未知性別用戶的特征向量。
6. 根據(jù)權(quán)利要求5所述方法,其特征在于,所述將所述未知性別用戶的特征向量代入 所述性別分類模型,得到未知性別用戶的性別參量具體為: 將所述未知性別用戶的特征向量作為仏代入所述性別分類模型,并將得到的Z(um)作 為未知性別用戶的性別參量。
7. 根據(jù)權(quán)利要求6所述方法,其特征在于,所述根據(jù)所述未知性別用戶的性別參量判 斷未知性別用戶的性別具體為: 當(dāng)所述性別參量為正數(shù),則認(rèn)為所述未知性別用戶為男性;當(dāng)所述性別參量為負(fù)數(shù),則 認(rèn)為所述未知性別用戶為女性。
8. -種識(shí)別用戶性別的系統(tǒng),其特征在于,所述系統(tǒng)包括: 標(biāo)簽篩選模塊,用于根據(jù)視頻內(nèi)容為所述視頻設(shè)置一個(gè)或多個(gè)標(biāo)簽;通過(guò)統(tǒng)計(jì)計(jì)算已 知性別用戶的視頻操作行為,從所述標(biāo)簽中篩選出特征標(biāo)簽,并計(jì)算特征標(biāo)簽的特征值; 模型生成模塊,用于采集已知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù) 所述操作行與相應(yīng)特征標(biāo)簽的特征值,建立已知性別用戶的特征向量;將所述已知性別用 戶的特征向量和該用戶的性別常量,作為模型參數(shù)而建立性別分類模型; 性別判斷模塊,用于采集未知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù) 所述操作行為建立未知性別用戶的特征向量;將所述未知性別用戶的特征向量代入所述性 別分類模型,得到未知性別用戶的性別參量;根據(jù)所述未知性別用戶的性別參量判斷未知 性別用戶的性別。
9. 根據(jù)權(quán)利要求8所述系統(tǒng),其特征在于,所述標(biāo)簽篩選模塊包括: 集合單元,用于選取預(yù)設(shè)數(shù)量的已知性別用戶建立樣本用戶集合,所述樣本用戶集合 中男女用戶比例為1:1 ; 篩選單元,用于選取一個(gè)標(biāo)簽,統(tǒng)計(jì)樣本用戶集合中,對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作 行為的用戶數(shù)量;并分別計(jì)算對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的男性用戶與女性用 戶,在對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的用戶數(shù)量中的比例;計(jì)算所述男性用戶與女 性用戶的比例差絕對(duì)值;當(dāng)所述對(duì)該標(biāo)簽對(duì)應(yīng)的視頻有視頻操作行為的用戶數(shù)量大于預(yù)設(shè) 的數(shù)量閾值,且所述比例差絕對(duì)值大于預(yù)設(shè)的性別傾向閾值,則將該標(biāo)簽作為特征標(biāo)簽;并 將男性用戶比例減女性用戶比例之差作為所述特征標(biāo)簽的特征值。
10.根據(jù)權(quán)利要求9所述系統(tǒng),其特征在于,所述對(duì)于帶有特征標(biāo)簽的視頻的操作行為 包括: 對(duì)于帶有特征標(biāo)簽的視頻的搜索次數(shù)、對(duì)于帶有特征標(biāo)簽的視頻的觀看時(shí)長(zhǎng)比例和對(duì) 于帶有特征標(biāo)簽的視頻的瀏覽次數(shù)。
【專利摘要】本發(fā)明實(shí)施例提供一種識(shí)別用戶性別的方法及系統(tǒng),所述方法包括:根據(jù)視頻內(nèi)容為所述視頻設(shè)置一個(gè)或多個(gè)標(biāo)簽;通過(guò)統(tǒng)計(jì)計(jì)算已知性別用戶的視頻操作行為,從所述標(biāo)簽中篩選出特征標(biāo)簽;采集已知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,建立已知性別用戶的特征向量;將所述已知性別用戶的特征向量和該用戶的性別常量,作為模型參數(shù)而建立性別分類模型;采集未知性別用戶對(duì)于帶有特征標(biāo)簽的視頻的操作行為,并根據(jù)所述操作行為建立未知性別用戶的特征向量;將所述未知性別用戶的特征向量代入所述性別分類模型,得到未知性別用戶的性別參量;根據(jù)所述未知性別用戶的性別參量判斷未知性別用戶的性別。
【IPC分類】G06F17-30
【公開號(hào)】CN104636504
【申請(qǐng)?zhí)枴緾N201510106661
【發(fā)明人】李愛飛, 王小麗
【申請(qǐng)人】飛狐信息技術(shù)(天津)有限公司
【公開日】2015年5月20日
【申請(qǐng)日】2015年3月10日
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
三门县| 武宣县| 皋兰县| 福建省| 红桥区| 正定县| 七台河市| 且末县| 威远县| 江都市| 三明市| 静宁县| 江西省| 永昌县| 砀山县| 迭部县| 华容县| 民丰县| 醴陵市| 乌兰县| 池州市| 油尖旺区| 邵武市| 武汉市| 旺苍县| 太康县| 绥中县| 桑植县| 昌平区| 怀来县| 扎兰屯市| 安岳县| 铜鼓县| 章丘市| 高密市| 宣汉县| 凤庆县| 屏山县| 方城县| 射阳县| 龙南县|