多媒體資源的質(zhì)量評估方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種多媒體資源的質(zhì)量評估方法和裝置,該多媒體資源的質(zhì)量評估方法包括:根據(jù)用于刻畫多媒體資源的用戶行為的指標(biāo)數(shù)據(jù),確定多媒體資源的累積分布向量;根據(jù)累積分布向量,確定多媒體資源的上邊界向量和下邊界向量;以及根據(jù)累積分布向量、上邊界向量和下邊界向量,確定多媒體資源的質(zhì)量分?jǐn)?shù)。本發(fā)明能夠更準(zhǔn)確地刻畫多媒體資源的質(zhì)量并且具有很強的可操作性,另外,在利用本發(fā)明實施例的多媒體資源的質(zhì)量評估方法來評估了多媒體資源的質(zhì)量之后,可以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu)化排序和推薦,可以給出最終的多媒體資源的排序和推薦結(jié)果。
【專利說明】
多媒體資源的質(zhì)量評估方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種多媒體資源的質(zhì)量評估方法和裝置。
【背景技術(shù)】
[0002] 現(xiàn)有的多媒體資源的質(zhì)量計算和質(zhì)量評估主要是以多媒體資源自身的原生屬性 (機器屬性)作為考核指標(biāo)。例如,通過音頻和視頻的信號質(zhì)量、失真程度等靜態(tài)屬性來判斷 多媒體資源的整體質(zhì)量?;蛘撸谠撡|(zhì)量評估方法的基礎(chǔ)上加入一些例如幀率、清晰度等的 面向用戶的屬性,來進一步判斷多媒體資源的整體質(zhì)量。還有一些質(zhì)量評估方法是通過考 察多媒體資源的網(wǎng)絡(luò)特性來判斷多媒體資源的整體質(zhì)量。例如,通過計算流媒體在網(wǎng)絡(luò)上 傳輸?shù)臄?shù)據(jù)包的特性和解碼過程來判斷多媒體資源的整體質(zhì)量。
[0003] 也就是說,現(xiàn)有技術(shù)中的質(zhì)量評估方法是將多媒體資源的原生屬性(動態(tài)和靜態(tài)) 作為質(zhì)量評估的主要指標(biāo)。然而,由于僅基于多媒體資源的原生屬性來評估多媒體資源的 質(zhì)量在很多情況下并不能滿足用戶的需求,因此多媒體資源的優(yōu)劣是無法僅通過網(wǎng)絡(luò)傳 輸、分辨率等原生屬性來刻畫的。
【發(fā)明內(nèi)容】
[0004] 技術(shù)問題
[0005] 有鑒于此,本發(fā)明要解決的技術(shù)問題是,提供一種多媒體資源的質(zhì)量評估方法和 裝置,以更準(zhǔn)確地刻畫多媒體資源的質(zhì)量。
[0006] 解決方案
[0007] 為了解決上述技術(shù)問題,在第一方面,本發(fā)明提供了一種多媒體資源的質(zhì)量評估 方法,包括:
[0008] 根據(jù)用于刻畫所述多媒體資源的用戶行為的指標(biāo)數(shù)據(jù),確定所述多媒體資源的累 積分布向量;
[0009] 根據(jù)所述累積分布向量,確定所述多媒體資源的上邊界向量和下邊界向量;以及
[0010] 根據(jù)所述累積分布向量、所述上邊界向量和所述下邊界向量,確定所述多媒體資 源的質(zhì)量分?jǐn)?shù)。
[0011]結(jié)合第一方面,在第一種可能的實現(xiàn)方式中,所述根據(jù)用于刻畫所述多媒體資源 的用戶行為的指標(biāo)數(shù)據(jù),確定所述多媒體資源的累積分布向量,包括:
[0012] 將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組;
[0013] 統(tǒng)計每個組所包括的該類用戶行為的指標(biāo)數(shù)據(jù)的個數(shù);以及
[0014] 將每個組對應(yīng)的個數(shù)構(gòu)成的向量確定為所述多媒體資源的該類用戶行為的累積 分布向量。
[0015] 結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,所述將一 類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組,包括:
[0016] 獲取該類用戶行為的指標(biāo)數(shù)據(jù)D的最大值max(D)和最小值min(D);
[0017] 將maX(D)~mm(D)確定為分割區(qū)間,其中,η為組的個數(shù);以及 η
[0018] 將區(qū)間max(D)-min(D)劃分為η個組。
[0019] 結(jié)合第一方面或第一方面的第一種可能的實現(xiàn)方式或第一方面的第二種可能的 實現(xiàn)方式,在第三種可能的實施方式中,所述根據(jù)所述累積分布向量、所述上邊界向量和所 述下邊界向量,確定所述多媒體資源的質(zhì)量分?jǐn)?shù),包括:利用下式1計算所述質(zhì)量分?jǐn)?shù),
[0020] r. , Dis tan ceTOTOP ^ Score -1 -- 八 I, Dis Ian ceBetwcen
[0021 ] 其中,Score表示所述質(zhì)量分?jǐn)?shù),DistanceTOTOP表示所述累積分布向量到所述上 邊界向量的距離,DistanceBetween表示所述上邊界向量到所述下邊界向量的距離。
[0022] 在第二方面,本發(fā)明提供了一種多媒體資源的質(zhì)量評估裝置,包括:
[0023] 第一確定單元,用于根據(jù)用于刻畫所述多媒體資源的用戶行為的指標(biāo)數(shù)據(jù),確定 所述多媒體資源的累積分布向量;
[0024] 第二確定單元,與所述第一確定單元連接,用于根據(jù)所述累積分布向量,確定所述 多媒體資源的上邊界向量和下邊界向量;以及
[0025] 第三確定單元,與所述第一確定單元和所述第二確定單元連接,用于根據(jù)所述累 積分布向量、所述上邊界向量和所述下邊界向量,確定所述多媒體資源的質(zhì)量分?jǐn)?shù)。
[0026] 結(jié)合第二方面,在第一種可能的實現(xiàn)方式中,所述第一確定單元包括:
[0027] 劃分子單元,用于將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組;
[0028] 統(tǒng)計子單元,與所述劃分子單元連接,用于統(tǒng)計每個組所包括的該類用戶行為的 指標(biāo)數(shù)據(jù)的個數(shù);以及
[0029] 確定子單元,與所述統(tǒng)計子單元連接,用于將每個組對應(yīng)的個數(shù)構(gòu)成的向量確定 為所述多媒體資源的該類用戶行為的累積分布向量。
[0030] 結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,所述劃分 子單元包括:
[0031] 獲取模塊,用于獲取該類用戶行為的指標(biāo)數(shù)據(jù)D的最大值max(D)和最小值min(D);
[0032] 確定模塊,與所述獲取模塊連接,用于將^確定為分割區(qū)間,其中, η η為組的個數(shù);以及
[0033 ]劃分模塊,與所述確定模塊連接,用于將區(qū)間max (D) -min (D)劃分為η個組。
[0034] 結(jié)合第二方面或第二方面的第一種可能的實現(xiàn)方式或第二方面的第二種可能的 實現(xiàn)方式,在第三種可能的實施方式中,所述第三確定單元具體用于利用下式1計算所述質(zhì) 量分?jǐn)?shù),
[0035] " , Dis tan ceTOTOP Score = 1-- Ixj I > Dis tan ceBetween
[0036] 其中,Score表示所述質(zhì)量分?jǐn)?shù),DistanceTOTOP表示所述累積分布向量到所述上 邊界向量的距離,DistanceBetween表示所述上邊界向量到所述下邊界向量的距離。
[0037] 有益效果
[0038] 本發(fā)明實施例的多媒體資源的質(zhì)量評估方法和裝置,能夠更準(zhǔn)確地刻畫多媒體資 源的質(zhì)量并且具有很強的可操作性,另外,在利用本發(fā)明實施例的多媒體資源的質(zhì)量評估 方法評估了多媒體資源的質(zhì)量之后,可以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu) 化排序和推薦,可以給出最終的多媒體資源的排序和推薦結(jié)果。
[0039] 根據(jù)下面參考附圖對示例性實施例的詳細(xì)說明,本發(fā)明的其它特征及方面將變得 清楚。
【附圖說明】
[0040] 包含在說明書中并且構(gòu)成說明書的一部分的附圖與說明書一起示出了本發(fā)明的 示例性實施例、特征和方面,并且用于解釋本發(fā)明的原理。
[0041] 圖1示出根據(jù)本發(fā)明實施例一的多媒體資源的質(zhì)量評估方法的流程圖;
[0042] 圖2示出根據(jù)本發(fā)明實施例二的多媒體資源的質(zhì)量評估方法的流程圖;
[0043]圖3a示出根據(jù)本發(fā)明實施例三的多媒體資源的質(zhì)量評估方法的流程圖;
[0044] 圖3b示出播放完成比頻度分布直方圖;
[0045] 圖3c示出播放完成比頻度分布直方圖;
[0046] 圖3d示出視頻的質(zhì)量分?jǐn)?shù)分布直方圖;
[0047] 圖4示出根據(jù)本發(fā)明實施例四的多媒體資源的質(zhì)量評估裝置的結(jié)構(gòu)框圖;
[0048] 圖5示出根據(jù)本發(fā)明實施例五的多媒體資源的質(zhì)量評估裝置的結(jié)構(gòu)框圖;以及 [0049]圖6示出根據(jù)本發(fā)明實施例六的多媒體資源的質(zhì)量評估裝置的結(jié)構(gòu)框圖。
【具體實施方式】
[0050]以下將參考附圖詳細(xì)說明本發(fā)明的各種示例性實施例、特征和方面。附圖中相同 的附圖標(biāo)記表示功能相同或相似的元件。盡管在附圖中示出了實施例的各種方面,但是除 非特別指出,不必按比例繪制附圖。
[0051 ]在這里專用的詞"示例性"意為"用作例子、實施例或說明性"。這里作為"示例性" 所說明的任何實施例不必解釋為優(yōu)于或好于其它實施例。
[0052]另外,為了更好的說明本發(fā)明,在下文的【具體實施方式】中給出了眾多的具體細(xì)節(jié)。 本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,沒有某些具體細(xì)節(jié),本發(fā)明同樣可以實施。在一些實例中,對于 本領(lǐng)域技術(shù)人員熟知的方法、手段、元件和電路未作詳細(xì)描述,以便于凸顯本發(fā)明的主旨。 [0053] 實施例1
[0054]圖1示出根據(jù)本發(fā)明實施例一的多媒體資源的質(zhì)量評估方法的流程圖。如圖1所 示,該質(zhì)量評估方法主要可以包括:
[0055] 步驟S100、根據(jù)用于刻畫多媒體資源的用戶行為的指標(biāo)數(shù)據(jù),確定多媒體資源的 累積分布向量。
[0056] 用戶可以使用終端設(shè)備來播放多媒體資源。其中,該終端設(shè)備例如可以是手機、移 動互聯(lián)網(wǎng)設(shè)備(英文:Mobile Internet Device,簡稱:MID)、個人數(shù)字助理(英文:Personal Digital Assistant,簡稱:PDA)、筆記本、臺式電腦、智能電視等。該多媒體資源例如可以是 視頻、音頻、圖片等。
[0057]需要說明的是,本發(fā)明的多媒體資源不僅限于上述三種示例,本領(lǐng)域技術(shù)人員應(yīng) 能夠了解,本發(fā)明的重點并不在于多媒體資源,任何其它形式的多媒體資源也可以適用于 本發(fā)明。也就是說,本發(fā)明并不限制多媒體資源的具體形式。
[0058]可以使用指標(biāo)數(shù)據(jù)來刻畫諸如視頻、音頻等的多媒體資源的用戶行為,并且,多媒 體資源的用戶行為可以包括多種類別,例如頂踩、評論、推薦(轉(zhuǎn)發(fā))、收藏、播放、下載等。
[0059] 其中,頂踩是指用戶基于自身對被播放的多媒體資源的支持或者反對態(tài)度,對被 播放的多媒體資源作出"頂"或者"踩"的操作。頂踩通常包括被播放的多媒體資源的標(biāo)識 (vid)、頂踩操作、操作人(用戶)的相關(guān)信息、操作時間和IP(例如,用戶的手機或者電腦等) 等。
[0060] 評論是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解,在相應(yīng)位置 處作出的評論描述。評論通常包括被播放的多媒體資源的標(biāo)識(vid)、評論的具體內(nèi)容、操 作人(用戶)的相關(guān)信息、操作時間和IP等。
[0061] 收藏是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解所進行的收 錄操作,以便于未來能夠更方便地找回該多媒體資源。收藏通常包括被播放的多媒體資源 的標(biāo)識(Vid)、操作人(用戶)的相關(guān)信息、操作時間和IP等。
[0062] 推薦(轉(zhuǎn)發(fā))是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解所進 行的站外的推送操作。推薦通常包括被播放的多媒體資源的標(biāo)識(vid)、操作人(用戶)的相 關(guān)信息、操作時間和IP、推薦平臺等。
[0063] 播放是指用戶對于多媒體資源的觀看行為。播放通常包括被播放的多媒體資源的 標(biāo)識(vid)、操作人(用戶)的相關(guān)信息、操作時間和IP、播放時間長度等。
[0064] 下載是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解所進行的下 載到本地的操作。下載通常包括被播放的多媒體資源的標(biāo)識(vid)、操作人(用戶)的相關(guān)信 息、操作時間和IP、下載進度等。
[0065] 實際上,用戶行為的構(gòu)建過程是一個從問題領(lǐng)域到行為領(lǐng)域的映射過程:f: ProblemDomain-UserBehavior,其中,ProblemDomain 表不問題領(lǐng)域,UserBehavior 表不用 戶行為集合。
[0066] 每個業(yè)務(wù)部門可以根據(jù)自身的后臺數(shù)據(jù)和頁面功能,選擇最優(yōu)的用戶行為來進行 考核。從實際效果來看,推薦使用能夠真實反映用戶需求意圖的用戶行為,從而使得多媒體 資源的質(zhì)量評估(計算)更精準(zhǔn)。
[0067] 具體地,可以使用指標(biāo)數(shù)據(jù)來衡量每一類用戶行為中的每一個用戶行為,并且,每 一類用戶行為的指標(biāo)數(shù)據(jù)的詳細(xì)說明如下。
[0068] 假設(shè)一個IP針對一個多媒體資源只能操作一次頂或者踩,則可以使用用戶對多媒 體資源所進行的頂踩操作的發(fā)生點作為指標(biāo)數(shù)據(jù)來衡量頂踩類的用戶行為。如果以多媒體 資源播放完成進度來計算,則可以記錄每次發(fā)生頂或者踩的多媒體資源的播放完成進度。 理論上,希望用戶沒有踩的行為并且盡早發(fā)生頂?shù)男袨椋ㄌ绨l(fā)生頂?shù)男袨橐彩遣缓侠?的)。
[0069] 可以使用用戶對多媒體資源所進行的評論操作的發(fā)生點以及評論情感作為指標(biāo) 數(shù)據(jù)來衡量評論類的用戶行為。如果以多媒體資源播放完成進度來計算,則可以記錄每次 發(fā)生評論的多媒體資源的播放完成進度。同時,可以對用戶評論的正負(fù)情感盡量量化。理論 上,希望用戶沒有負(fù)向情感評論并且盡早發(fā)生評論行為(太早發(fā)生評論行為也是不合理 的)。
[0070] 假設(shè)一個IP針對一個多媒體資源只能收藏一次,則可以使用用戶對多媒體資源所 進行的收藏操作的發(fā)生點作為指標(biāo)數(shù)據(jù)來衡量收藏類的用戶行為。如果以多媒體資源播放 完成進度來計算,則可以記錄每次發(fā)生收藏行為的多媒體資源的播放完成進度。理論上,希 望用戶有收藏行為并且盡早發(fā)生收藏行為(太早發(fā)生收藏行為也是不合理的)。
[0071] 可以使用用戶對多媒體資源所進行的推薦操作的發(fā)生點以及被推薦的多媒體資 源的導(dǎo)回流量比率作為指標(biāo)數(shù)據(jù)來衡量推薦類的用戶行為。其中,導(dǎo)回流量比率=導(dǎo)回次 數(shù)/露出次數(shù),導(dǎo)回次數(shù)是指被推薦的多媒體資源二次被打開的次數(shù),露出次數(shù)是指被推薦 的多媒體資源的被推薦次數(shù)。如果以多媒體資源播放完成進度來計算,則可以記錄每次發(fā) 生推薦的多媒體資源的播放完成進度。同時,可以通過爬取外站的相關(guān)數(shù)據(jù)來計算導(dǎo)回流 量比率。理論上,希望用戶有推薦行為并且盡早發(fā)生推薦行為(太早發(fā)生推薦行為也是不合 理的)而且導(dǎo)回流量比率越高越好。
[0072] 可以使用多媒體資源的播放完成比和用戶拖動進度條(快退、快進)的次數(shù)作為指 標(biāo)數(shù)據(jù)來衡量播放類的用戶行為。希望用戶的播放完成比越高越好并且沒有快進拖動而是 有多次合理的快退拖動。
[0073] 可以使用用戶對多媒體資源所進行的下載操作的發(fā)生點以及下載完成進度作為 指標(biāo)數(shù)據(jù)來衡量下載類的用戶行為。如果以多媒體資源播放完成進度來計算,則可以記錄 每次發(fā)生下載行為的多媒體資源的播放完成進度。下載完成進度可以衡量用戶下載多媒體 資源的決心和網(wǎng)絡(luò)狀況。理論上,希望用戶有下載行為并且盡早發(fā)生下載行為(太早發(fā)生下 載行為也是不合理的)而且希望是100%完整下載。
[0074] 需要說明的是,本發(fā)明實施例僅例示了幾類用戶行為及其指標(biāo)數(shù)據(jù),本領(lǐng)域技術(shù) 人員應(yīng)能夠理解,本發(fā)明的用戶行為的種類還可以為其它類別,并且在實際操作中不是必 須提取上述各種指標(biāo)數(shù)據(jù),而是可以根據(jù)自身業(yè)務(wù)需求以及是否對系統(tǒng)造成過大的負(fù)擔(dān)等 來提取適量的指標(biāo)數(shù)據(jù)。
[0075] 實際上,指標(biāo)數(shù)據(jù)的構(gòu)建過程是一個從用戶行為到指標(biāo)數(shù)據(jù)的映射過程:f: UserBehavior-Indicators,其中,UserBehavior 表不用戶行為集合,Indicators 表不指標(biāo) 數(shù)據(jù)集合。并且,累積分布向量的構(gòu)建過程是一個從指標(biāo)空間到向量空間的映射過程:f: Indicators-Vn,其中,Indicators表示指標(biāo)數(shù)據(jù)集合,Vn表示η維向量空間。
[0076]步驟S120、根據(jù)累積分布向量,確定多媒體資源的上邊界向量和下邊界向量。
[0077] 具體地,在確定了用戶行為的指標(biāo)數(shù)據(jù)上的累積分布向量之后,可以定義該指標(biāo) 數(shù)據(jù)的最優(yōu)表現(xiàn)和最差表現(xiàn),即上邊界和下邊界。例如,用戶對多媒體資源所進行的合理的 頂踩操作的發(fā)生點最多的計數(shù)為多少、被推薦的多媒體資源的導(dǎo)回流量比率最高的最大計 數(shù)是多少、最多有多少用戶完整觀看了多媒體資源。其中,多媒體資源在指標(biāo)數(shù)據(jù)上的上邊 界和下邊界可以均使用向量來表示,即,上邊界向量和下邊界向量。
[0078] 步驟S140、根據(jù)累積分布向量、上邊界向量和下邊界向量,確定多媒體資源的質(zhì)量 分?jǐn)?shù)。
[0079] 可以根據(jù)累積分布向量來確定多媒體資源的質(zhì)量分?jǐn)?shù)。理論上,一個累積分布向 量離下邊界向量越遠(yuǎn)并且離上邊界向量越近,則說明用戶行為的表現(xiàn)越好,進而說明多媒 體資源的質(zhì)量越高。例如,可以使用距離占比來定義多媒體資源的質(zhì)量分?jǐn)?shù)。
[0080] 即,在一種可能的實現(xiàn)方式中,根據(jù)累積分布向量、上邊界向量和下邊界向量,確 定多媒體資源的質(zhì)量分?jǐn)?shù),可以包括:利用下式1計算質(zhì)量分?jǐn)?shù),
[0081] p , Dis tan ceTOTOP ,,, Si ore = I - .Tv I ? Dis Ian ceBetween
[0082] 其中,Score表示質(zhì)量分?jǐn)?shù),DistanceTOTOP表示累積分布向量到上邊界向量的距 離,DistanceBetween表示上邊界向量到下邊界向量的距離。
[0083] 根據(jù)上述式1可知,累積分布向量到上邊界向量的距離DiStanceTOTOP越小,質(zhì)量 分?jǐn)?shù)Score越大??梢允褂糜嘞蚁嗨贫然蛘叨嗑S歐式距離等方法來計算向量之間的距離,并 且余弦相似度和歐式距離可以保證質(zhì)量分?jǐn)?shù)Score的取值范圍為[0,1 ]。
[0084] 其中,余弦相似度是將向量根據(jù)坐標(biāo)值繪制到向量空間中,求得兩個向量之間的 夾角并計算夾角對應(yīng)的余弦值,該余弦值可以用于表征這兩個向量的相似性。夾角越小,余 弦值越接近于1,這兩個向量的方向更加吻合,這兩個向量就越相似。歐式距離是一個通常 采用的距離定義,是在m維空間中兩個點之間的真實距離。例如,假設(shè)二維空間中存在點A (xi,yi)和點B(X2,y2),則點A(xi,yi)和點B(X2,y2)之間的歐式距離為·^(λ·, +(.η -.v:):
[0085] 在計算向量之間的距離上,余弦相似度和歐式距離都有廣泛的應(yīng)用,這兩種方法 均易于理解且便于操作。余弦相似度是一個良好的輸出歸一化結(jié)果的方法,而歐式距離是 輸出全域取值的方法。實際操作中,根據(jù)實際需要任意選取其中一種方法即可。
[0086] 實際上,多媒體資源的質(zhì)量分?jǐn)?shù)的構(gòu)建是一個從累積分布向量到區(qū)間[0,1]的映 射過程:f: Vn^[0,1],其中,Vn表示η維向量空間,[0,1]表示質(zhì)量分?jǐn)?shù)Score的取值范圍。
[0087] 本發(fā)明實施例的多媒體資源的質(zhì)量評估方法,是基于用戶體驗和忠實于用戶的, 即通過多媒體資源的用戶行為來刻畫多媒體資源的質(zhì)量,這使得本發(fā)明能夠更準(zhǔn)確地刻畫 多媒體資源的質(zhì)量。
[0088] 并且,本發(fā)明實施例的質(zhì)量評估方法具有很強的可操作性,原因在于,對于互聯(lián)網(wǎng) 應(yīng)用,大量的多媒體資源是線上公開的,用戶可以通過每日的點擊和觀看行為來消費這些 多媒體資源,而企業(yè)后臺可以使用日志系統(tǒng)來記錄這些用戶行為,因此,系統(tǒng)的服務(wù)過程就 是多媒體資源的質(zhì)量評估的數(shù)據(jù)準(zhǔn)備過程,因而獲取多媒體資源的用戶行為是簡單易行 的。與之相比較,傳統(tǒng)的基于多媒體資源的原生屬性的質(zhì)量評估方法需要專門的工作人員 和系統(tǒng)來完成相關(guān)指標(biāo)的采集和度量。
[0089] 另外,由于以一段時間為考察區(qū)間,用戶行為會呈現(xiàn)一定的動態(tài)特性,因此用戶行 為通常具有累積特性。因而,在利用本發(fā)明實施例的質(zhì)量評估方法評估了多媒體資源的質(zhì) 量之后,可以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu)化排序和推薦,可以給出最 終的多媒體資源的排序和推薦結(jié)果。如果用戶在多媒體資源的排序和推薦結(jié)果上的行為不 夠理想,則在未來的迭代中,這些多媒體資源的排序和推薦結(jié)果中的多媒體資源的質(zhì)量分 數(shù)會降低,從而把原先多媒體資源的排序和推薦結(jié)果中靠前的多媒體資源自動排在后面。
[0090] 實施例2
[0091] 由于用戶行為可以包括多種類別,因此多媒體資源的質(zhì)量評估既可以僅利用一類 用戶行為的指標(biāo)數(shù)據(jù)來進行質(zhì)量評估,也可以利用諸如統(tǒng)計學(xué)的方法來根據(jù)多類用戶行為 的指標(biāo)數(shù)據(jù)來進行質(zhì)量評估。
[0092]例如,可以先分別計算每一類用戶行為的質(zhì)量分?jǐn)?shù),再對所有類別的用戶行為的 質(zhì)量分?jǐn)?shù)進行平均,以確定多媒體資源的質(zhì)量分?jǐn)?shù)。
[0093]本領(lǐng)域普通技術(shù)人員可以理解,平均只是一種實現(xiàn)方式,也可以采用其它實現(xiàn)方 式,例如加權(quán)求和等,仍可實現(xiàn)本發(fā)明的基本目的。
[0094]圖2示出根據(jù)本發(fā)明實施例二的多媒體資源的質(zhì)量評估方法的流程圖。如圖2所 示,該質(zhì)量評估方法主要可以包括:
[0095]步驟S201、將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組。
[0096] 例如,可以采用非重疊分組方法來將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組,又 如,可以采用重疊分組方法來將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組。
[0097] 在一種可能的實現(xiàn)方式中,將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組,包括:
[0098] 獲取該類用戶行為的指標(biāo)數(shù)據(jù)D的最大值max(D)和最小值min(D);
[0099] 將maX(/j)~mm(D)-確定為分割區(qū)間,其中,η為組的個數(shù);以及 η
[0100] 將區(qū)間max(D)-min(D)劃分為η個組。
[0101] 例如,假設(shè)采用非常有效并且常用的刻畫數(shù)據(jù)分布特點的非重疊分組方法來將一 類用戶行為的指標(biāo)數(shù)據(jù)D劃分為多個組,則分組的過程如下:假設(shè)給定一組實數(shù)域上的數(shù)據(jù) D,則可以先獲得數(shù)據(jù)D的最大值max(D)和最小值min(D);然后將區(qū)間max(D)-min(D)(也稱 之為極差或全距)平均劃分為η個分組,對應(yīng)的分割區(qū)間為maX(D:Kmin(D)(也稱之為組 η 距),則η個分組對應(yīng)η個分組區(qū)間,例如:[miii(fl),min(D) + maX(D) - mm(D))和 η (max(D)- maX(D) - mm(£?), max(D))為頭部和尾部的兩個分組區(qū)間。 η
[0102] 又如,假設(shè)采用觀察數(shù)據(jù)整體變化的重疊分組方法來將一類用戶行為的指標(biāo)數(shù)據(jù) 劃分為多個組,則分組的過程如下:假設(shè)給定一組實數(shù)域上的數(shù)據(jù)D,則可以先獲得數(shù)據(jù)D的 最大值max(D)和最小值min(D),則區(qū)間[min(D) ,max(D)]能夠包含全體數(shù)據(jù)D;然后將區(qū)間 max(D)_min(D)平均劃分為η個重疊分組區(qū)間,例如:[min(D),max(D)]和 ηι?η(Β)+ ⑶)為最大和最小的兩個分組區(qū)間。 η
[0103] 步驟S203、統(tǒng)計每個組所包括的該類用戶行為的指標(biāo)數(shù)據(jù)的個數(shù)。
[0104] 在將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組之后,可以分別對落在每一個區(qū)間的 指標(biāo)數(shù)據(jù)進行個數(shù)統(tǒng)計。
[0105] 步驟S205、將每個組對應(yīng)的個數(shù)構(gòu)成的向量確定為多媒體資源的該類用戶行為的 累積分布向量。
[0106] 如果使用作圖的方法來畫出直方圖,其中,X軸表示分組區(qū)間并且y軸表示頻度計 數(shù),則可以直接根據(jù)頻度分布直方圖來快速地確定出用戶行為的累積分布向量。
[0107] 步驟S207、根據(jù)累積分布向量,確定多媒體資源的上邊界向量和下邊界向量。
[0108] 步驟S209、根據(jù)累積分布向量、上邊界向量和下邊界向量,確定多媒體資源的質(zhì)量 分?jǐn)?shù)。
[0109] 步驟S207和步驟S209的說明可以參見上述實施例1中的步驟S120和步驟S140中的 相關(guān)描述。
[0110] 本發(fā)明實施例的多媒體資源的質(zhì)量評估方法,是基于用戶體驗和忠實于用戶的, 即通過多媒體資源的用戶行為來刻畫多媒體資源的質(zhì)量,這使得本發(fā)明能夠更準(zhǔn)確地刻畫 多媒體資源的質(zhì)量。
[0111] 并且本發(fā)明實施例的質(zhì)量評估方法具有很強的可操作性,原因在于,對于互聯(lián)網(wǎng) 應(yīng)用,大量的多媒體資源是線上公開的,用戶可以通過每日的點擊和觀看行為來消費這些 多媒體資源,而企業(yè)后臺可以使用日志系統(tǒng)來記錄這些用戶行為,因此,系統(tǒng)的服務(wù)過程就 是多媒體資源的質(zhì)量評估的數(shù)據(jù)準(zhǔn)備過程,因而獲取多媒體資源的用戶行為是簡單易行 的。與之相比較,傳統(tǒng)的基于多媒體資源的原生屬性的質(zhì)量評估方法需要專門的工作人員 和系統(tǒng)來完成相關(guān)指標(biāo)的采集和度量。
[0112] 另外,在利用本發(fā)明實施例的質(zhì)量評估方法來評估了多媒體資源的質(zhì)量之后,可 以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu)化排序和推薦,可以給出最終的多媒體 資源的排序和推薦結(jié)果。如果用戶在多媒體資源的排序和推薦結(jié)果上的行為不夠理想,則 在未來的迭代中,這些多媒體資源的排序和推薦結(jié)果中的多媒體資源的質(zhì)量分?jǐn)?shù)會降低, 從而把原先多媒體資源的排序和推薦結(jié)果中靠前的多媒體資源自動排在后面。
[0113] 實施例3
[0114]圖3a示出根據(jù)本發(fā)明實施例三的多媒體資源的質(zhì)量評估方法的流程圖。在本發(fā)明 實施例中,將以播放類用戶行為的指標(biāo)數(shù)據(jù)即多媒體資源的播放完成比(例如,視頻觀看完 成比)來例示本發(fā)明的多媒體資源的質(zhì)量評估方法。
[0115] 步驟301、使用某視頻網(wǎng)站的視頻播放日志作為基本的數(shù)據(jù)來源。原始的視頻播放 日志是一個至少包含以下四元組的數(shù)據(jù)表格:該四元組為{Vids, PlayLength,F(xiàn)ul ILength, Time },其中,Vids表示被觀看的視頻集合;PlayLength表示每次視頻觀看的累積時間長度, 通常以秒計;FullLength表示被觀看的視頻的總時間長度;Time表示發(fā)生此次觀看行為的 時間戳。
[0116] 原始的視頻播放日志的每一行記錄均存儲了用戶在該時間戳下的點擊視頻的觀 看行為??梢酝ㄟ^界定不同的時間戳,獲取一天、一個小時、甚至任何時刻的用戶觀看行為 數(shù)據(jù)。表1是一個視頻觀看日志數(shù)據(jù)的示例片段。
[0117]表1視頻觀看日志數(shù)據(jù)的示例片段
[0119] 通過匯總用戶觀看時間長度的視頻播放日志信息,可以對上述四元組{Vids, PlayLength,F(xiàn)ul ILength ,Time}進行預(yù)處理。舉例而言,可以通過界定Time字段,選取特定 時間段的視頻播放數(shù)據(jù),例如,可以從視頻播放日志信息中選取Time字段為"20160105"的 視頻播放數(shù)據(jù)。也可以使用PlayLength/Ful ILength來計算每一次觀看Vids字段為"Γ的視 頻的播放完成比(也稱之為視頻觀看完成比),以生成Vids字段為"Γ的視頻的播放完成比 perc字段。還可以對視頻的播放完成比數(shù)據(jù)進行數(shù)據(jù)清理,例如,應(yīng)該舍棄perc> 100 %的數(shù) 據(jù)。
[0120] 步驟302、根據(jù)視頻播放日志獲取視頻的指標(biāo)數(shù)據(jù)即播放完成比。其中,視頻的播 放完成比P e r c是指視頻的播放時間長度與視頻的總時間長度的比值,即
[0121] 通過對上述表1的視頻觀看日志數(shù)據(jù)進行預(yù)處理,可以生成包含被觀看的視頻集 合Vids、被觀看的視頻的播放完成比perc和發(fā)生此次觀看行為的時間戳Time的信息,以記 錄用戶在視頻上的觀看完成情況。其中,使用上述表1中的視頻觀看日志數(shù)據(jù)可以得到下述 表2所示的被觀看的視頻的播放完成比perc。需要說明的是,為關(guān)注問題本身而在表2中省 去了發(fā)生此次觀看行為的時間戳T ime。
[0122] 表2視頻的播放完成比perc示例
[0124] 步驟303、將播放類的用戶行為的指標(biāo)數(shù)據(jù)播放完成比perc劃分為多個組并確定 指標(biāo)數(shù)據(jù)播放完成比perc的累積分布向量。
[0125] 具體地,可以采用上述實施例2中描述的非重疊分組方法來將播放完成比perc劃 分為多個組,也可以采用上述實施例2中描述的重疊分組方法來將播放完成比perc劃分為 多個組。并且可以使用頻度分布直方圖來顯示播放完成比perc的頻度分布,其中,頻度分布 直方圖是通過長方形的高代表對應(yīng)組的頻數(shù)與組距的比值(由于組距是一個常數(shù),因此為 了便于畫圖和看圖而直接使用長方形的高來表示頻數(shù)),并且頻度分布直方圖能夠清楚地 顯示各組頻數(shù)的分布情況并且易于顯示各組之間的頻數(shù)的差別。
[0126] 頻度分布直方圖的橫軸為播放完成比perc的0%_100%的全域區(qū)間??梢愿鶕?jù)實 際情況來確定分組的組距。其中,根據(jù)統(tǒng)計學(xué)的知識可知,合適的組距可以反映抽樣數(shù)據(jù)的 分布特性,組距太小會造成分組的組數(shù)太多,組距太大會造成分組的組數(shù)太少,這些都會掩 蓋播放完成比Perc的分布特性。另外,組距太小所導(dǎo)致的分組的組數(shù)太多,使得后續(xù)根據(jù)播 放完成比所確定的累積分布向量即播放完成比累積分布向量的維度過高,這對海量數(shù)據(jù)分 析時造成了計算負(fù)擔(dān)。因此,在本實施例中,將組距確定為10%。
[0127] 如果采用非重疊分組方法來將播放完成比perc劃分為多個組,則可以按照組距 10%來將播放完成比perc的0%-100%的全域區(qū)間劃分為10個組,這樣可以形成諸如0%-10%、10%-20%、···、90%-100%的10個等距非重疊抽樣區(qū)間(分組),由此可以得到圖3b所 示的播放完成比頻度分布直方圖。
[0128] 如果采用重疊分組方法來將播放完成比perc劃分為多個組,則可以按照組距10% 來將播放完成比perc的0%-100%的全域區(qū)間劃分為10個組,這樣可以形成諸如0%-10%、 0 %-20 %、…、0 % -100 %的10個等距重疊抽樣區(qū)間(分組),由此可以得到圖3c所示的播放 完成比頻度分布直方圖。
[0129] 當(dāng)然,在本實施例中,優(yōu)選使用重疊分組方法(即,累積分布計數(shù))來將播放完成比 perc劃分為多個組并確定播放完成比累積分布向量。使用播放完成比perc為0%、10%、 20%、30%、…、100 %的抽樣區(qū)間。由于視頻播放的涵蓋特性,因此播放完成比perc為30% 的計數(shù)一定包括播放完成比Perc為10 %的計數(shù)。
[0130]假設(shè)一個視頻vid在特定時間段內(nèi)的播放完成比數(shù)據(jù)集是P= {perc I 0% < perc仝 100 % },對播放完成比數(shù)據(jù)集P進行組距為m/100的重疊分組統(tǒng)計,其中,IOOmod m = 0(100 可以被m整除),可以得到包含單點分組0%在內(nèi)的(100/m)+l個分組數(shù)據(jù)。如果用(0%,i%] 表示播放完成比i %的計數(shù)區(qū)間,則分組0 %、(0 %,10 % ]、…、(0 %,100 % ]所對應(yīng)的計數(shù)所 構(gòu)成的向量(f〇,fl,…,flQQ/m)為該視頻的播放完成比累積分布向量Vvid。
[0131] 需要說明的是,每一個分組的臨界點映射為實際視頻播放的進度點,用戶的播放 完成比可以刻畫視頻播放的進度。單點分組0%可以理解為該視頻被點擊的次數(shù),即視頻只 要被點擊就會形成一次頻度計數(shù),可以采用視頻播放日志數(shù)據(jù)中的該視頻被記錄的條數(shù)。 顯然,如果m%>c%,則播放完成m%的次數(shù)一定不會多于播放完成C%的次數(shù),區(qū)間(0%, m% ]的頻度一定不會多于區(qū)間(0 %,c % ]的頻度,例如,看完視頻的100 %的次數(shù)一定不會 多于看完視頻的20%的次數(shù)。因此,播放完成比累積分布向量Vvld的內(nèi)部數(shù)據(jù)是一個非遞增 數(shù)列。
[0132] 根據(jù)播放完成比累積分布向量Vvld的定義,可以得到如圖3c所示的播放完成比頻 度分布直方圖。并且,根據(jù)圖3c可知,與該播放完成比頻度分布直方圖相對應(yīng)的播放完成比 累積分布向量 Vvid=(14,13,ll,10,9,8,7,6,4,2,l)。
[0133] 步驟304、根據(jù)播放完成比累積分布向量Vvld,確定播放完成比的上邊界向量和下 邊界向量。
[0134] 每一個視頻都希望能夠被完整的播放,即有多少人點擊打開視頻也應(yīng)該有多少人 最終完成觀看。結(jié)合播放完成比累積分布向量Vvld,上邊界向量的每一個元素都應(yīng)該和完成 0%的頻度相同,因此,可以根據(jù)播放完成比累積分布向量Vvld定義播放完成比的上邊界向 量Vt、即一個視頻的播放完成情況的可能最優(yōu)表現(xiàn)。即,假設(shè)一個視頻的播放完成比累積分 布向量\^=(;^,;^,一,;^()()/1 11),則該視頻的播放完成比的上邊界向量^^=(;^,;^(),一,;^())并 且|Vt| = |Vvid| 〇
[0135] 類似地,可以考察一個視頻的播放完成情況的可能最差表現(xiàn),即每一次點擊打開 視頻都沒有實際的觀看行為。結(jié)合播放完成比累積分布向量V vld,除了 0%的對應(yīng)點擊次數(shù) 以外,其它抽樣區(qū)間的累積頻度均為〇,因此,可以根據(jù)播放完成比累積分布向量Vvld定義播 放完成比的下邊界向量V b。即,假設(shè)一個視頻的播放完成比累積分布向量Vvld= (&,&,···, ;^100/111),則該視頻的播放完成比的下邊界向量^^=(;^(),0,一,0)并且|¥1 )| = |'\^(]|。
[0136] 繼續(xù)使用之前的例子,m的取值為10,由此可以得到播放完成比的上邊界向量和下 邊界向量分別為:Vt= (14,14,14,14,14,14,14,14,14,14,14)和 Vb= (14,0,0,0,0,0,0,0, 0,0,0)〇
[0137] 步驟305、在確定出播放完成比累積分布向量Vvid、播放完成比的上邊界向量Vt和 下邊界向量V b之后,可以計算播放完成比累積分布向量Vvld到播放完成比的上邊界向量Vt的 距離以及播放完成比的上邊界向量Vt到播放完成比的下邊界向量V b的距離。
[0138] 由于m的取值為10,因此使用11維歐式距離來分別計算上述兩個距離。其中,11維 歐式距離的具體定義如下:
[0139] 假設(shè)X和Y為兩個向量,則向量X和向量Y之間的距離為 ,其 中,j e [ I,11 ],Xj為向量X在第j個位置的取值,yj為向量Y在第j個位置的取值。
[0140] 利用上述距離定義可以計算出播放完成比累積分布向量Vvid = (14,13,11,10,9, 8,7,6,4,2,1)和播放完成比的上邊界向量 Vt= (14,14,14,14,14,14,14,14,14,14,14)之 間的距離d(Vvid,V t)為24.759并且播放完成比的上邊界向量Vt= (14,14,14,14,14,14,14, 14,14,14,14)和播放完成比的下邊界向量Vb= (14之間的距離d (Vt,Vb)為44.272。
[0141] 步驟306、在計算出播放完成比累積分布向量Vvld到播放完成比的上邊界向量Vt的 距離以及播放完成比的上邊界向量V t到播放完成比的下邊界向量Vb的距離之后,利用下述 式2來計筧視頗的質(zhì)量分?jǐn)?shù):
[0142] Λ^·
[0143]
[0144] 例如,可以對某視頻網(wǎng)站的海量視頻進行質(zhì)量分?jǐn)?shù)的計算,由此可以得到下述表3 所示的該視頻網(wǎng)站的視頻質(zhì)量分?jǐn)?shù)統(tǒng)計表。
[0145] 表3某視頻網(wǎng)站的視頻的質(zhì)量分?jǐn)?shù)統(tǒng)計
[0147] 根據(jù)上述表3可以看出,在實際數(shù)據(jù)中,第三四分位數(shù)已經(jīng)達到最大值,這意味著 至少有25%的視頻質(zhì)量分?jǐn)?shù)為1,這是由于視頻播放的長尾效應(yīng)造成的,即有大量視頻只有 一次或兩次播放行為且均實現(xiàn)了完整播放。
[0148] 通過去除視頻播放的長尾效應(yīng),可以得到圖3d所示的視頻的質(zhì)量分?jǐn)?shù)分布直方 圖。并且,得到這些視頻的質(zhì)量分?jǐn)?shù)之后,既可以引入新類別的用戶行為進行多次計算,也 可以引入視頻的新的指標(biāo)數(shù)據(jù)來進行計算,從而為后續(xù)的視頻搜索和視頻推薦做準(zhǔn)備。
[0149] 本發(fā)明實施例的多媒體資源的質(zhì)量評估方法,是基于用戶體驗和忠實于用戶的, 即通過多媒體資源的用戶行為來刻畫多媒體資源的質(zhì)量,這使得本發(fā)明能夠更準(zhǔn)確地刻畫 多媒體資源的質(zhì)量。
[0150] 并且本發(fā)明實施例的質(zhì)量評估方法具有很強的可操作性,原因在于,對于互聯(lián)網(wǎng) 應(yīng)用,大量的多媒體資源是線上公開的,用戶可以通過每日的點擊和觀看行為來消費這些 多媒體資源,而企業(yè)后臺可以使用日志系統(tǒng)來記錄這些用戶行為,因此,系統(tǒng)的服務(wù)過程就 是多媒體資源的質(zhì)量評估的數(shù)據(jù)準(zhǔn)備過程,因而獲取多媒體資源的用戶行為是簡單易行 的。與之相比較,傳統(tǒng)的基于多媒體資源的原生屬性的質(zhì)量評估方法需要專門的工作人員 和系統(tǒng)來完成相關(guān)指標(biāo)的采集和度量。
[0151] 另外,在利用本發(fā)明實施例的質(zhì)量評估方法來評估了多媒體資源的質(zhì)量之后,可 以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu)化排序和推薦,可以給出最終的多媒體 資源的排序和推薦結(jié)果。如果用戶在多媒體資源的排序和推薦結(jié)果上的行為不夠理想,則 在未來的迭代中,這些多媒體資源的排序和推薦結(jié)果中的多媒體資源的質(zhì)量分?jǐn)?shù)會降低, 從而把原先多媒體資源的排序和推薦結(jié)果中靠前的多媒體資源自動排在后面。
[0152] 實施例4
[0153] 圖4示出根據(jù)本發(fā)明實施例四的多媒體資源的質(zhì)量評估裝置的結(jié)構(gòu)框圖。本實施 例提供的質(zhì)量評估裝置400用于實現(xiàn)圖1所示的質(zhì)量評估方法。如圖4所示,該質(zhì)量評估裝置 400主要可以包括:
[0154] 第一確定單元410,用于根據(jù)用于刻畫多媒體資源的用戶行為的指標(biāo)數(shù)據(jù),確定多 媒體資源的累積分布向量。
[0155] 用戶可以使用終端設(shè)備來播放多媒體資源。其中,該終端設(shè)備例如可以是手機、移 動互聯(lián)網(wǎng)設(shè)備(英文:Mobile Internet Device,簡稱:MID)、個人數(shù)字助理(英文:Personal Digital Assistant,簡稱:PDA)、筆記本、臺式電腦、智能電視等。該多媒體資源例如可以是 視頻、音頻、圖片等。
[0156] 需要說明的是,本發(fā)明的多媒體資源不僅限于上述三種示例,本領(lǐng)域技術(shù)人員應(yīng) 能夠了解,本發(fā)明的重點并不在于多媒體資源,任何其它形式的多媒體資源也可以適用于 本發(fā)明。也就是說,本發(fā)明并不限制多媒體資源的具體形式。
[0157] 可以使用指標(biāo)數(shù)據(jù)來刻畫諸如視頻、音頻等的多媒體資源的用戶行為,并且,多媒 體資源的用戶行為可以包括多種類別,例如頂踩、評論、推薦(轉(zhuǎn)發(fā))、收藏、播放、下載等。
[0158] 其中,頂踩是指用戶基于自身對被播放的多媒體資源的支持或者反對態(tài)度,對被 播放的多媒體資源作出"頂"或者"踩"的操作。頂踩通常包括被播放的多媒體資源的標(biāo)識 (Vid)、頂踩操作、操作人(用戶)的相關(guān)信息、操作時間和IP(例如,用戶的手機或者電腦等) 等。
[0159] 評論是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解,在相應(yīng)位置 處作出的評論描述。評論通常包括被播放的多媒體資源的標(biāo)識(vid)、評論的具體內(nèi)容、操 作人(用戶)的相關(guān)信息、操作時間和IP等。
[0160]收藏是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解所進行的收 錄操作,以便于未來能夠更方便地找回該多媒體資源。收藏通常包括被播放的多媒體資源 的標(biāo)識(vid)、操作人(用戶)的相關(guān)信息、操作時間和IP等。
[0161] 推薦(轉(zhuǎn)發(fā))是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解所進 行的站外的推送操作。推薦通常包括被播放的多媒體資源的標(biāo)識(vid)、操作人(用戶)的相 關(guān)信息、操作時間和IP、推薦平臺等。
[0162] 播放是指用戶對于多媒體資源的觀看行為。播放通常包括被播放的多媒體資源的 標(biāo)識(vid)、操作人(用戶)的相關(guān)信息、操作時間和IP、播放時間長度等。
[0163]下載是指用戶基于自身對被播放的多媒體資源的內(nèi)容和形式的理解所進行的下 載到本地的操作。下載通常包括被播放的多媒體資源的標(biāo)識(vid)、操作人(用戶)的相關(guān)信 息、操作時間和IP、下載進度等。
[0164] 實際上,用戶行為的構(gòu)建過程是一個從問題領(lǐng)域到行為領(lǐng)域的映射過程:f: ProblemDomain-UserBehavior,其中,ProblemDomain 表不問題領(lǐng)域,UserBehavior 表不用 戶行為集合。
[0165] 每個業(yè)務(wù)部門可以根據(jù)自身的后臺數(shù)據(jù)和頁面功能,選擇最優(yōu)的用戶行為來進行 考核。從實際效果來看,推薦使用能夠真實反映用戶需求意圖的用戶行為,從而使得多媒體 資源的質(zhì)量評估(計算)更精準(zhǔn)。
[0166] 具體地,可以使用指標(biāo)數(shù)據(jù)來衡量每一類用戶行為中的每一個用戶行為,并且,每 一類用戶行為的指標(biāo)數(shù)據(jù)的詳細(xì)說明如下。
[0167] 假設(shè)一個IP針對一個多媒體資源只能操作一次頂或者踩,則可以使用用戶對多媒 體資源所進行的頂踩操作的發(fā)生點作為指標(biāo)數(shù)據(jù)來衡量頂踩類的用戶行為。如果以多媒體 資源播放完成進度來計算,則可以記錄每次發(fā)生頂或者踩的多媒體資源的播放完成進度。 理論上,希望用戶沒有踩的行為并且盡早發(fā)生頂?shù)男袨椋ㄌ绨l(fā)生頂?shù)男袨橐彩遣缓侠?的)。
[0168] 可以使用用戶對多媒體資源所進行的評論操作的發(fā)生點以及評論情感作為指標(biāo) 數(shù)據(jù)來衡量評論類的用戶行為。如果以多媒體資源播放完成進度來計算,則可以記錄每次 發(fā)生評論的多媒體資源的播放完成進度。同時,可以對用戶評論的正負(fù)情感盡量量化。理論 上,希望用戶沒有負(fù)向情感評論并且盡早發(fā)生評論行為(太早發(fā)生評論行為也是不合理 的)。
[0169] 假設(shè)一個IP針對一個多媒體資源只能收藏一次,則可以使用用戶對多媒體資源所 進行的收藏操作的發(fā)生點作為指標(biāo)數(shù)據(jù)來衡量收藏類的用戶行為。如果以多媒體資源播放 完成進度來計算,則可以記錄每次發(fā)生收藏行為的多媒體資源的播放完成進度。理論上,希 望用戶有收藏行為并且盡早發(fā)生收藏行為(太早發(fā)生收藏行為也是不合理的)。
[0170] 可以使用用戶對多媒體資源所進行的推薦操作的發(fā)生點以及被推薦的多媒體資 源的導(dǎo)回流量比率作為指標(biāo)數(shù)據(jù)來衡量推薦類的用戶行為。其中,導(dǎo)回流量比率=導(dǎo)回次 數(shù)/露出次數(shù),導(dǎo)回次數(shù)是指被推薦的多媒體資源二次被打開的次數(shù),露出次數(shù)是指被推薦 的多媒體資源的被推薦次數(shù)。如果以多媒體資源播放完成進度來計算,則可以記錄每次發(fā) 生推薦的多媒體資源的播放完成進度。同時,可以通過爬取外站的相關(guān)數(shù)據(jù)來計算導(dǎo)回流 量比率。理論上,希望用戶有推薦行為并且盡早發(fā)生推薦行為(太早發(fā)生推薦行為也是不合 理的)而且導(dǎo)回流量比率越高越好。
[0171] 可以使用多媒體資源的播放完成比和用戶拖動進度條(快退、快進)的次數(shù)作為指 標(biāo)數(shù)據(jù)來衡量播放類的用戶行為。希望用戶的播放完成比越高越好并且沒有快進拖動而是 有多次合理的快退拖動。
[0172] 可以使用用戶對多媒體資源所進行的下載操作的發(fā)生點以及下載完成進度作為 指標(biāo)數(shù)據(jù)來衡量下載類的用戶行為。如果以多媒體資源播放完成進度來計算,則可以記錄 每次發(fā)生下載行為的多媒體資源的播放完成進度。下載完成進度可以衡量用戶下載多媒體 資源的決心和網(wǎng)絡(luò)狀況。理論上,希望用戶有下載行為并且盡早發(fā)生下載行為(太早發(fā)生下 載行為也是不合理的)而且希望是100%完整下載。
[0173]需要說明的是,本發(fā)明實施例中的僅例示了幾類用戶行為及其指標(biāo)數(shù)據(jù),本領(lǐng)域 技術(shù)人員應(yīng)能夠理解,本發(fā)明的用戶行為的種類還可以為其它類別,并且在實際操作中不 是必須提取上述各種指標(biāo)數(shù)據(jù),而是可以根據(jù)自身業(yè)務(wù)需求以及是否對系統(tǒng)造成過大的負(fù) 擔(dān)等來提取適量的指標(biāo)數(shù)據(jù)。
[0174]實際上,指標(biāo)數(shù)據(jù)的構(gòu)建過程是一個從用戶行為到指標(biāo)數(shù)據(jù)的映射過程:f: UserBehavior-Indicators,其中,UserBehavior 表不用戶行為集合,Indicators 表不指標(biāo) 數(shù)據(jù)集合。并且,累積分布向量的構(gòu)建過程是一個從指標(biāo)空間到向量空間的映射過程:f: Indicators-Vn,其中,Indicators表示指標(biāo)數(shù)據(jù)集合,Vn表示η維向量空間。
[0175]第二確定單元430,與第一確定單元410連接,用于根據(jù)累積分布向量,確定多媒體 資源的上邊界向量和下邊界向量。
[0176]具體地,在第一確定單元410確定了用戶行為的指標(biāo)數(shù)據(jù)上的累積分布向量之后, 第二確定單元430可以定義該指標(biāo)數(shù)據(jù)的最優(yōu)表現(xiàn)和最差表現(xiàn),即上邊界和下邊界。例如, 用戶對多媒體資源所進行的合理的頂踩操作的發(fā)生點最多的計數(shù)為多少、被推薦的多媒體 資源的導(dǎo)回流量比率最高的最大計數(shù)是多少、最多有多少用戶完整觀看了多媒體資源。其 中,多媒體資源在指標(biāo)數(shù)據(jù)上的上邊界和下邊界均使用向量來表示,g卩,上邊界向量和下邊 界向量。
[0177]第三確定單元450,與第一確定單元410和第二確定單元430連接,用于根據(jù)累積分 布向量、上邊界向量和下邊界向量,確定多媒體資源的質(zhì)量分?jǐn)?shù)。
[0178]第三確定單元450可以根據(jù)第一確定單元410確定出的累積分布向量和第二確定 單元430確定出的上邊界向量和下邊界向量來確定多媒體資源的質(zhì)量分?jǐn)?shù)。理論上,一個累 積分布向量離下邊界向量越遠(yuǎn)并且離上邊界向量越近,則說明用戶行為的表現(xiàn)越好,進而 說明多媒體資源的質(zhì)量越高。例如,可以使用距離占比來定義多媒體資源的質(zhì)量分?jǐn)?shù)。 [0179] 即,在一種可能的實現(xiàn)方式中,第三確定單元450具體用于利用下式1計算質(zhì)量分 數(shù),
[01801
A 1,
[0181 ] 其中,Score表示質(zhì)量分?jǐn)?shù),DistanceTOTOP表示累積分布向量到上邊界向量的距 離,DistanceBetween表示上邊界向量到下邊界向量的距離。
[0182] 根據(jù)上述式1可知,累積分布向量到上邊界向量的距離DiStanceTOTOP越小,質(zhì)量 分?jǐn)?shù)Score越大??梢允褂糜嘞蚁嗨贫然蛘叨嗑S歐式距離等方法來計算向量之間的距離,并 且余弦相似度和歐式距離可以保證質(zhì)量分?jǐn)?shù)Score的取值范圍為[0,1 ]。
[0183] 其中,余弦相似度是將向量根據(jù)坐標(biāo)值繪制到向量空間中,求得兩個向量之間的 夾角并計算夾角對應(yīng)的余弦值,該余弦值就可以用于表征這兩個向量的相似性。夾角越小, 余弦值越接近于1,這兩個向量的方向更加吻合,這兩個向量就越相似。歐式距離是一個通 常采用的距離定義,是在m維空間中兩個點之間的真實距離。例如,假設(shè)二維空間中存在點A (xi,yi)和點B(X2,y2),則點A(xi,yi)和點B(X2,y2)之間的歐式距離為-.r:): +(.1?丨〇
[0184] 在計算向量之間的距離上,余弦相似度和歐式距離都有廣泛的應(yīng)用,這兩種方法 均易于理解且便于操作。余弦相似度是一個良好的輸出歸一化結(jié)果的方法,而歐式距離是 輸出全域取值的方法。實際操作中,根據(jù)實際需要任意選取其中一種方法即可。
[0185] 實際上,多媒體資源的質(zhì)量分?jǐn)?shù)的構(gòu)建是一個從累積分布向量到區(qū)間[0,1]的映 射過程:f: Vn^[0,1],其中,Vn表示η維向量空間,[0,1]表示質(zhì)量分?jǐn)?shù)Score的取值范圍。
[0186] 本發(fā)明實施例的多媒體資源的質(zhì)量評估裝置,是基于用戶體驗和忠實于用戶的, 即通過多媒體資源的用戶行為來刻畫多媒體資源的質(zhì)量,這使得本發(fā)明能夠更準(zhǔn)確地刻畫 多媒體資源的質(zhì)量。
[0187] 并且,本發(fā)明實施例的質(zhì)量評估裝置具有很強的可操作性,原因在于,對于互聯(lián)網(wǎng) 應(yīng)用,大量的多媒體資源是線上公開的,用戶可以通過每日的點擊和觀看行為來消費這些 多媒體資源,而企業(yè)后臺可以使用日志系統(tǒng)來記錄這些用戶行為,因此,系統(tǒng)的服務(wù)過程就 是多媒體資源的質(zhì)量評估的數(shù)據(jù)準(zhǔn)備過程,因而獲取多媒體資源的用戶行為是簡單易行 的。與之相比較,傳統(tǒng)的基于多媒體資源的原生屬性的質(zhì)量評估裝置需要專門的工作人員 和系統(tǒng)來完成相關(guān)指標(biāo)的采集和度量。
[0188] 另外,由于以一段時間為考察區(qū)間,用戶行為會呈現(xiàn)一定的動態(tài)特性,因此用戶行 為通常具有累積特性。因而,在利用本發(fā)明實施例的質(zhì)量評估裝置來評估了多媒體資源的 質(zhì)量之后,可以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu)化排序和推薦,可以給出 最終的多媒體資源的排序和推薦結(jié)果。如果用戶在多媒體資源的排序和推薦結(jié)果上的行為 不夠理想,則在未來的迭代中,這些多媒體資源的排序和推薦結(jié)果中的多媒體資源的質(zhì)量 分?jǐn)?shù)會降低,從而把原先多媒體資源的排序和推薦結(jié)果中靠前的多媒體資源自動排在后 面。
[0189] 實施例5
[0190] 由于用戶行為可以包括多種類別,因此多媒體資源的質(zhì)量評估既可以僅利用一類 用戶行為的指標(biāo)數(shù)據(jù)來進行質(zhì)量評估,也可以利用諸如統(tǒng)計學(xué)的方法來根據(jù)多類用戶行為 的指標(biāo)數(shù)據(jù)來進行質(zhì)量評估。
[0191] 例如,可以先分別計算每一類用戶行為的質(zhì)量分?jǐn)?shù),再對所有類別的用戶行為的 質(zhì)量分?jǐn)?shù)進行平均,以確定多媒體資源的質(zhì)量分?jǐn)?shù)。
[0192] 本領(lǐng)域普通技術(shù)人員可以理解,平均只是一種實現(xiàn)方式,也可以采用其它實現(xiàn)方 式,例如加權(quán)求和等,仍可實現(xiàn)本發(fā)明的基本目的。
[0193] 圖5示出根據(jù)本發(fā)明實施例五的多媒體資源的質(zhì)量評估裝置的結(jié)構(gòu)框圖。本實施 例提供的質(zhì)量評估裝置500用于實現(xiàn)圖2所示的質(zhì)量評估方法。如圖5所示,該質(zhì)量評估裝置 500主要可以包括:
[0194] 劃分子單元510,用于將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組。
[0195] 例如,劃分子單元510可以采用非重疊分組方法來將一類用戶行為的指標(biāo)數(shù)據(jù)劃 分為多個組,又如,劃分子單元510可以采用重疊分組方法來將一類用戶行為的指標(biāo)數(shù)據(jù)劃 分為多個組。
[0196] 在一種可能的實現(xiàn)方式中,劃分子單元510可以包括:
[0197] 獲取模塊511,用于獲取該類用戶行為的指標(biāo)數(shù)據(jù)D的最大值max(D)和最小值min (D);
[0198] 確定模塊513,與獲取模塊511連接,用于彳
確定為分割區(qū)間,其 中,η為組的個數(shù);以及
[0199 ]劃分模塊515,與確定模塊513連接,用于將區(qū)間max (D) -min (D)劃分為η個組。
[0200] 例如,假設(shè)劃分子單元510采用非常有效并且常用的刻畫數(shù)據(jù)分布特點的非重疊 分組方法來將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組,則分組的過程如下:假設(shè)給定一組 實數(shù)域上的數(shù)據(jù)D,則獲取模塊511可以先獲得數(shù)據(jù)D的最大值max (D)和最小值min (D);然后 劃分模塊515將區(qū)間max(D)-min(D)(也稱之為極差或全距)平均劃分為η個分組,對應(yīng)的分
a區(qū)間,例如: 為頭部和尾部 的兩個分組區(qū)間。
[0201] 又如,假設(shè)劃分子單元510采用觀察數(shù)據(jù)整體變化的重疊分組方法來將一類用戶 行為的指標(biāo)數(shù)據(jù)劃分為多個組,則分組的過程如下:假設(shè)給定一組實數(shù)域上的數(shù)據(jù)D,則獲 取模塊511可以先獲得數(shù)據(jù)D的最大值max(D)和最小值min(D),則區(qū)間[min(D) ,max(D)]能 夠包含全體數(shù)據(jù)D;然后劃分模塊515將K間max (D) -min (D)平均劃分為η個重疊分組區(qū)間, 例如:[min(D),max(D b最大和最小的兩個分組區(qū) 間。
[0202] 統(tǒng)計子單元530,與劃分子單元510連接,用于統(tǒng)計每個組所包括的該類用戶行為 的指標(biāo)數(shù)據(jù)的個數(shù)。
[0203] 在劃分子單元510將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組之后,統(tǒng)計子單元530 可以分別對落在每一個區(qū)間的指標(biāo)數(shù)據(jù)進行個數(shù)統(tǒng)計。
[0204]確定子單元550,與統(tǒng)計子單元530連接,用于將每個組對應(yīng)的個數(shù)構(gòu)成的向量確 定為多媒體資源的該類用戶行為的累積分布向量。
[0205] 如果使用作圖的方法來畫出直方圖,其中,X軸表示分組區(qū)間并且y軸表示頻度計 數(shù),則可以直接根據(jù)頻度分布直方圖來快速地確定出用戶行為的累積分布向量。
[0206] 第二確定單元570,與確定子單元550連接,用于根據(jù)累積分布向量,確定多媒體資 源的上邊界向量和下邊界向量。
[0207]第三確定單元590,與確定子單元550和第二確定單元570連接,用于根據(jù)累積分布 向量、上邊界向量和下邊界向量,確定多媒體資源的質(zhì)量分?jǐn)?shù)。
[0208] 第二確定單元570和第三確定單元590的說明可以參見上述實施例4中的第二確定 單元430和第三確定單元450中的相關(guān)描述。
[0209] 本發(fā)明實施例的多媒體資源的質(zhì)量評估裝置,是基于用戶體驗和忠實于用戶的, 即通過多媒體資源的用戶行為來刻畫多媒體資源的質(zhì)量,這使得本發(fā)明能夠更準(zhǔn)確地刻畫 多媒體資源的質(zhì)量。
[0210] 并且本發(fā)明實施例的質(zhì)量評估裝置具有很強的可操作性,原因在于,對于互聯(lián)網(wǎng) 應(yīng)用,大量的多媒體資源是線上公開的,用戶可以通過每日的點擊和觀看行為來消費這些 多媒體資源,而企業(yè)后臺可以使用日志系統(tǒng)來記錄這些用戶行為,因此,系統(tǒng)的服務(wù)過程就 是多媒體資源的質(zhì)量評估的數(shù)據(jù)準(zhǔn)備過程,因而獲取多媒體資源的用戶行為是簡單易行 的。與之相比較,傳統(tǒng)的基于多媒體資源的原生屬性的質(zhì)量評估裝置需要專門的工作人員 和系統(tǒng)來完成相關(guān)指標(biāo)的采集和度量。
[0211] 另外,在利用本發(fā)明實施例的質(zhì)量評估裝置來評估了多媒體資源的質(zhì)量之后,可 以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu)化排序和推薦,可以給出最終的多媒體 資源的排序和推薦結(jié)果。如果用戶在多媒體資源的排序和推薦結(jié)果上的行為不夠理想,則 在未來的迭代中,這些多媒體資源的排序和推薦結(jié)果中的多媒體資源的質(zhì)量分?jǐn)?shù)會降低, 從而把原先多媒體資源的排序和推薦結(jié)果中靠前的多媒體資源自動排在后面。
[0212] 實施例6
[0213] 圖6示出根據(jù)本發(fā)明實施例六的多媒體資源的質(zhì)量評估裝置的結(jié)構(gòu)框圖。在本發(fā) 明實施例中,將以播放類用戶行為的指標(biāo)數(shù)據(jù)即多媒體資源的播放完成比(例如,視頻觀看 完成比)來例示本發(fā)明的多媒體資源的質(zhì)量評估裝置。本實施例提供的質(zhì)量評估裝置600用 于實現(xiàn)圖3a所示的質(zhì)量評估方法。如圖6所示,該質(zhì)量評估裝置600主要可以包括:
[0214] 使用單元610,用于使用某視頻網(wǎng)站的視頻播放日志作為基本的數(shù)據(jù)來源。原始的 視頻播放日志是一個至少包含以下四元組的數(shù)據(jù)表格:該四元組為{V i d s,PI a y L e n g t h, Ful ILength,Time },其中,Vids表示被觀看的視頻集合;PlayLength表示每次視頻觀看的累 積時間長度,通常以秒計;FullLength表示被觀看的視頻的總時間長度;Time表示發(fā)生此次 觀看行為的時間戳。
[0215] 原始的視頻播放日志的每一行記錄均存儲了用戶在該時間戳下的點擊視頻的觀 看行為??梢酝ㄟ^界定不同的時間戳,獲取一天、一個小時、甚至任何時刻的用戶觀看行為 數(shù)據(jù)。一個視頻觀看日志數(shù)據(jù)的示例片段可以參見上述實施例三中的表1。
[0216] 通過匯總用戶觀看時間長度的視頻播放日志信息,可以對上述四元組{Vids, PlayLength,F(xiàn)ul ILength ,Time}進行預(yù)處理。舉例而言,可以通過界定Time字段,選取特定 時間段的視頻播放數(shù)據(jù),例如,可以從視頻播放日志信息中選取Time字段為"20160105"的 視頻播放數(shù)據(jù)。也可以使用PlayLength/Ful ILength來計算每一次觀看Vids字段為"Γ的視 頻的播放完成比(也稱之為視頻觀看完成比),以生成Vids字段為"Γ的視頻的播放完成比 perc字段。還可以對視頻的播放完成比數(shù)據(jù)進行數(shù)據(jù)清理,例如,應(yīng)該舍棄perc> 100 %的數(shù) 據(jù)。
[0217]獲取單元620,與使用單元610連接,用于根據(jù)視頻播放日志獲取視頻的指標(biāo)數(shù)據(jù) 即播放完成比。其中,視頻的播放完成比Perc是指視頻的播放時間長度與視頻的總時間長 度的比值,即 具體說明可以參見上述實施例三中的步驟302的相關(guān)描 述。
[0218]第一確定單元630,與獲取單元620連接,用于將播放類的用戶行為的指標(biāo)數(shù)據(jù)播 放完成比perc劃分為多個組并確定指標(biāo)數(shù)據(jù)播放完成比perc的累積分布向量。
[0219]具體地,第一確定單元630可以采用上述實施例2中描述的非重疊分組方法來將播 放完成比perc劃分為多個組,第一確定單元630也可以采用上述實施例2中描述的重疊分組 方法來將播放完成比Perc劃分為多個組。并且可以使用頻度分布直方圖來顯示播放完成比 perc的頻度分布,其中,頻度分布直方圖是通過長方形的高代表對應(yīng)組的頻數(shù)與組距的比 值(由于組距是一個常數(shù),因此為了便于畫圖和看圖而直接使用長方形的高來表示頻數(shù)), 并且頻度分布直方圖能夠清楚地顯示各組頻數(shù)的分布情況并且易于顯示各組之間的頻數(shù) 的差別。具體說明可以參見上述實施例三中的步驟303的相關(guān)描述。
[0220]第二確定單元640,與第一確定單元630連接,用于根據(jù)播放完成比累積分布向量 Vvid,確定播放完成比的上邊界向量和下邊界向量。
[0221] 具體說明可以參見上述實施例三中的步驟304的相關(guān)描述。
[0222] 第一計算單元650,與第一確定單元630和第二確定單元640連接,在第一確定單元 630確定出播放完成比累積分布向量Vvid、第二確定單元640確定出播放完成比的上邊界向 量V t和下邊界向量Vb之后,可以計算播放完成比累積分布向量Vvld到播放完成比的上邊界向 量Vt的距離以及播放完成比的上邊界向量V t到播放完成比的下邊界向量Vb的距離。
[0223] 具體說明可以參見上述實施例三中的步驟305的相關(guān)描述。
[0224] 第二計算單元660,與第一計算單元650連接,用于在第一計算單元650計算出播放 完成比累積分布向量Vvld到播放完成比的上邊界向量Vt的距離以及播放完成比的上邊界向 量Vt到播放完成比的下仂界向量V h的距離之后,利用下述式2來計算視頻的質(zhì)量分?jǐn)?shù):
[0225]
A2
[0226] 具體說明可以參見上述實施例三中的步驟306的相關(guān)描述。
[0227] 本發(fā)明實施例的多媒體資源的質(zhì)量評估裝置,是基于用戶體驗和忠實于用戶的, 即通過多媒體資源的用戶行為來刻畫多媒體資源的質(zhì)量,這使得本發(fā)明能夠更準(zhǔn)確地刻畫 多媒體資源的質(zhì)量。
[0228] 并且本發(fā)明實施例的質(zhì)量評估裝置具有很強的可操作性,原因在于,對于互聯(lián)網(wǎng) 應(yīng)用,大量的多媒體資源是線上公開的,用戶可以通過每日的點擊和觀看行為來消費這些 多媒體資源,而企業(yè)后臺可以使用日志系統(tǒng)來記錄這些用戶行為,因此,系統(tǒng)的服務(wù)過程就 是多媒體資源的質(zhì)量評估的數(shù)據(jù)準(zhǔn)備過程,因而獲取多媒體資源的用戶行為是簡單易行 的。與之相比較,傳統(tǒng)的基于多媒體資源的原生屬性的質(zhì)量評估裝置需要專門的工作人員 和系統(tǒng)來完成相關(guān)指標(biāo)的采集和度量。
[0229] 另外,在利用本發(fā)明實施例的質(zhì)量評估裝置來評估了多媒體資源的質(zhì)量之后,可 以吸收線上結(jié)果的反饋來進行多媒體資源的動態(tài)優(yōu)化排序和推薦,可以給出最終的多媒體 資源的排序和推薦結(jié)果。如果用戶在多媒體資源的排序和推薦結(jié)果上的行為不夠理想,則 在未來的迭代中,這些多媒體資源的排序和推薦結(jié)果中的多媒體資源的質(zhì)量分?jǐn)?shù)會降低, 從而把原先多媒體資源的排序和推薦結(jié)果中靠前的多媒體資源自動排在后面。
[0230] 以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。
【主權(quán)項】
1. 一種多媒體資源的質(zhì)量評估方法,其特征在于,包括: 根據(jù)用于刻畫所述多媒體資源的用戶行為的指標(biāo)數(shù)據(jù),確定所述多媒體資源的累積分 布向量; 根據(jù)所述累積分布向量,確定所述多媒體資源的上邊界向量和下邊界向量;W及 根據(jù)所述累積分布向量、所述上邊界向量和所述下邊界向量,確定所述多媒體資源的 質(zhì)量分?jǐn)?shù)。2. 根據(jù)權(quán)利要求1所述的質(zhì)量評估方法,其特征在于,所述根據(jù)用于刻畫所述多媒體資 源的用戶行為的指標(biāo)數(shù)據(jù),確定所述多媒體資源的累積分布向量,包括: 將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組; 統(tǒng)計每個組所包括的該類用戶行為的指標(biāo)數(shù)據(jù)的個數(shù);W及 將每個組對應(yīng)的個數(shù)構(gòu)成的向量確定為所述多媒體資源的該類用戶行為的累積分布 向量。3. 根據(jù)權(quán)利要求2所述的質(zhì)量評估方法,其特征在于,所述將一類用戶行為的指標(biāo)數(shù)據(jù) 劃分為多個組,包括: 獲取該類用戶行為的指標(biāo)數(shù)據(jù)D的最大值max(D)和最小值min化); 將確定為分割區(qū)間,其中,η為組的個數(shù);W及 將區(qū)間max(D)-min化)劃分為η個組。4. 根據(jù)權(quán)利要求1至3中任一項所述的質(zhì)量評估方法,其特征在于,所述根據(jù)所述累積 分布向量、所述上邊界向量和所述下邊界向量,確定所述多媒體資源的質(zhì)量分?jǐn)?shù),包括:利 用下式1計算所述質(zhì)量分?jǐn)?shù),式1, 其中,Score表示所述質(zhì)量分?jǐn)?shù),DistanceTOTOP表示所述累積分布向量到所述上邊界 向量的距離,Dis化nceBetween表示所述上邊界向量到所述下邊界向量的距離。5. -種多媒體資源的質(zhì)量評估裝置,其特征在于,包括: 第一確定單元,用于根據(jù)用于刻畫所述多媒體資源的用戶行為的指標(biāo)數(shù)據(jù),確定所述 多媒體資源的累積分布向量; 第二確定單元,與所述第一確定單元連接,用于根據(jù)所述累積分布向量,確定所述多媒 體資源的上邊界向量和下邊界向量;W及 第Ξ確定單元,與所述第一確定單元和所述第二確定單元連接,用于根據(jù)所述累積分 布向量、所述上邊界向量和所述下邊界向量,確定所述多媒體資源的質(zhì)量分?jǐn)?shù)。6. 根據(jù)權(quán)利要求5所述的質(zhì)量評估裝置,其特征在于,所述第一確定單元包括: 劃分子單元,用于將一類用戶行為的指標(biāo)數(shù)據(jù)劃分為多個組; 統(tǒng)計子單元,與所述劃分子單元連接,用于統(tǒng)計每個組所包括的該類用戶行為的指標(biāo) 數(shù)據(jù)的個數(shù);W及 確定子單元,與所述統(tǒng)計子單元連接,用于將每個組對應(yīng)的個數(shù)構(gòu)成的向量確定為所 述多媒體資源的該類用戶行為的累積分布向量。7. 根據(jù)權(quán)利要求6所述的質(zhì)量評估裝置,其特征在于,所述劃分子單元包括: 獲取模塊,用于獲取該類用戶行為的指標(biāo)數(shù)據(jù)D的最大值max(D)和最小值min化); 確定模塊,與所述獲取模塊連接,用于將確定為分割區(qū)間,其中,η為組 的個數(shù);W及 劃分模塊,與所述確定模塊連接,用于將區(qū)間max (D )-min化)劃分為η個組。8.根據(jù)權(quán)利要求5至7中任一項所述的質(zhì)量評估裝置,其特征在于,所述第Ξ確定單元 具體用于利用下式1計算所述質(zhì)量分?jǐn)?shù),乂 1, 其中,Score表示所述質(zhì)量分?jǐn)?shù),DistanceTOTOP表示所述累積分布向量到所述上邊界 向量的距離,Dis化nceBetween表示所述上邊界向量到所述下邊界向量的距離。
【文檔編號】G06F17/30GK105843876SQ201610159190
【公開日】2016年8月10日
【申請日】2016年3月18日
【發(fā)明人】魏博, 齊志兵, 王遠(yuǎn)圖, 馬廣續(xù), 劉宇平, 尹玉宗, 姚鍵, 潘柏宇, 王冀
【申請人】合網(wǎng)絡(luò)技術(shù)(北京)有限公司, 合一網(wǎng)絡(luò)技術(shù)(北京)有限公司