用戶覆蓋量信息的提示方法及裝置制造方法
【專利摘要】本申請公開了用戶覆蓋量信息的提示方法及裝置,所述方法包括:獲取基礎(chǔ)數(shù)據(jù);按照各類目在類目序列中排序距離的不同對類目進行分類;將同一子序列中的類目劃分為多個類目組合,計算各個類目組合相對于前一個類目組合的用戶覆蓋量增長率;根據(jù)同一子序列中得到的各個用戶覆蓋量增長率以及預(yù)置的函數(shù)格式,得到對應(yīng)排序距離下的擬合函數(shù);當信息投放方選擇了目標關(guān)鍵詞后,映射為系統(tǒng)中的多個目標類目,計算各個目標組合的排序距離;分別利用各自對應(yīng)的擬合函數(shù),預(yù)估出目標類目組合的累積用戶覆蓋量,以便提供給信息投放方。通過本申請,能夠降低計算量,并解決同一用戶在不同的類目中重復(fù)出現(xiàn)的問題。
【專利說明】用戶覆蓋量信息的提不方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本申請涉及興趣點定向投放信息過程中的信息提示【技術(shù)領(lǐng)域】,特別是涉及用戶覆 蓋量信息的提示方法及裝置。
【背景技術(shù)】
[0002] 在一些互聯(lián)網(wǎng)業(yè)務(wù)平臺中,經(jīng)常有信息投放方向業(yè)務(wù)平臺的網(wǎng)頁中投放一些特定 信息,以期該網(wǎng)頁被用戶關(guān)注的同時,這些特定信息也能被關(guān)注到,甚至被點擊,導(dǎo)入到信 息投放方自己的頁面為其帶來流量。最初,同一網(wǎng)頁中投放的特定信息一般是固定的,然而 對于大型業(yè)務(wù)平臺而言,其用戶(瀏覽者)數(shù)量眾多,對于同一個網(wǎng)頁的不同訪問用戶而 言,用戶關(guān)注的點可能是不同的。例如,對于某電子商務(wù)交易平臺,其提供的業(yè)務(wù)對象可以 從多個維度劃分為多個類目,如服裝類、數(shù)碼產(chǎn)品類等等,有些用戶可能對服裝類信息感興 趣,而其他用戶可能對數(shù)碼產(chǎn)品感興趣等等。此時,如果向同一個網(wǎng)頁(例如某網(wǎng)站首頁) 中投放固定的特定信息,則意味著只有部分用戶會對該信息感興趣,對于其他用戶而言,相 當于浪費了該特定信息所在的版面。
[0003] 為此,一些系統(tǒng)中提出了"興趣點定向"的信息投放方式,也即將信息投放方選擇 的關(guān)鍵詞與用戶可能的興趣點相匹配的定向方式。信息投放方可以通過輸入其特定信息的 描述信息等方式來獲得系統(tǒng)推薦的關(guān)鍵詞,還可以對這些關(guān)鍵詞進行篩選,根據(jù)篩選結(jié)果, 系統(tǒng)可以將關(guān)鍵詞映射到系統(tǒng)內(nèi)的類目,信息投放方選擇的關(guān)鍵詞為"性價比高",則系統(tǒng) 可以將"性價比高"映射為類目"數(shù)碼產(chǎn)品",而如果選擇的關(guān)鍵詞為"手感舒適",則系統(tǒng)可 以將"手感舒適"映射為類目"家居用品",等,這樣可以獲知信息投放方的興趣點,這種興趣 點可以用各個被選中的關(guān)鍵詞對應(yīng)的類目來表示。
[0004] 同時系統(tǒng)將分析每個信息瀏覽用戶的當前瀏覽頁面內(nèi)容以及歷史關(guān)注點,得到各 個用戶的關(guān)注點,這種關(guān)注點同樣可以用戶系統(tǒng)中的類目來表示。例如,用戶甲的關(guān)注點包 括"服裝"、"數(shù)碼產(chǎn)品"等等。這樣,就可以將信息投放方的興趣點與用戶的關(guān)注點相匹配, 將信息投放方的特定信息相匹配的用戶人群進行投放。也就是說,對于同一個網(wǎng)頁而言,針 對不同的用戶ID,其能夠看到的特定信息可能是不同的,但都基本與用戶的關(guān)注點相匹配, 因此,可以充分利用網(wǎng)頁中用戶展現(xiàn)特定信息的版面,使得同一網(wǎng)頁可以同時為不同的信 息投放方帶來用戶流量。
[0005] 在上述這種興趣點定向的信息投放方式中,當信息投放方選擇了某個或者某些關(guān) 鍵詞之后,系統(tǒng)還可以預(yù)估對應(yīng)的類目組合能夠有多大的用戶覆蓋量,并顯示給信息投放 方,進而信息投放方可以據(jù)此決定是否選擇這些關(guān)鍵詞進行投放。然而,對于大型的業(yè)務(wù)平 臺而言,其中包含的業(yè)務(wù)對象的類目數(shù)量一般是非常多的,如果要精確的各種可能的類目 組合對應(yīng)的用戶覆蓋量,需要巨大的計算量。例如假設(shè)有N個類目,則需要計算2~N個類目 組合的用戶覆蓋量,對于數(shù)千甚至上萬量級的N來說,這個計算量即使對于現(xiàn)有的大規(guī)模 分布式計算系統(tǒng)都是難以實現(xiàn)的。
[0006] 另外,在計算類目組合的用戶覆蓋量時,還不能簡單的將各個類目單獨對應(yīng)的覆 蓋量相加,因為同一用戶可能關(guān)注不同的類目,比如用戶A即是電子類用戶,又是母嬰群體 用戶,又是運動愛好者,如果信息投放方選擇的興趣類目中包括這三種類目,那用戶A只能 算一個用戶,而不能算三次。也就是說流量預(yù)估還要解決同一用戶在不同的類目中重復(fù)出 現(xiàn)的問題。
[0007] 總之,迫切需要本領(lǐng)域技術(shù)人員解決的技術(shù)問題就在于:如何在進行流量預(yù)估的 過程中,降低計算量,并解決同一用戶在不同的類目中重復(fù)出現(xiàn)的問題。
【發(fā)明內(nèi)容】
[0008] 本申請?zhí)峁┝擞脩舾采w量信息的提示方法及裝置,能夠降低計算量,并解決同一 用戶在不同的類目中重復(fù)出現(xiàn)的問題。
[0009] 本申請?zhí)峁┝巳缦路桨福?br>
[0010] 一種用戶覆蓋量信息的提示方法,包括:
[0011] 根據(jù)預(yù)先獲取到的各個用戶分別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù) 中包括每個類目單獨的用戶覆蓋量、按照單獨的用戶覆蓋量由大到小排序后得到的類目序 列,以及各個類目在類目序列中的序號;
[0012] 按照各類目在類目序列中排序距離的不同對類目進行分類,得到預(yù)置數(shù)目個子序 列;其中,所述排序距離為兩個類目的序號之間的差值,在同一子序列中,相鄰類目之間的 序號差值均相等;
[0013] 將同一子序列中的類目劃分為多個類目組合,使得每個類目組合比前一個類目組 合多一個類目,根據(jù)所述預(yù)先獲取到的各個用戶分別關(guān)注的類目信息,統(tǒng)計各個類目組合 累積的不重復(fù)用戶覆蓋量,并計算各個類目組合相對于前一個類目組合的用戶覆蓋量增長 率;
[0014] 根據(jù)同一子序列中得到的各個用戶覆蓋量增長率以及預(yù)置的函數(shù)格式進行擬合, 得到對應(yīng)排序距離下的擬合函數(shù);
[0015] 當信息投放方選擇了目標關(guān)鍵詞后,將所述目標關(guān)鍵詞映射為系統(tǒng)中的多個目標 類目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標類目的序號以及單獨的用戶覆蓋量;
[0016] 將序號最小的目標類目作為目標基準類目,將該目標基準類目分別與其他各目標 類目組成目標組合,并計算各個目標組合中兩個目標類目的排序距離;
[0017] 分別利用各個目標組合的排序距離對應(yīng)的擬合函數(shù),預(yù)估各個目標組合相對于目 標基準類目的累積用戶增長量,并將目標基準類目單獨的用戶覆蓋量與各個目標組合的所 述累積用戶增長量相加,預(yù)估出將所有目標類目組合在一起時的累積用戶覆蓋量;
[0018] 在接收到獲取累積用戶覆蓋量的請求時,將預(yù)估的累積用戶覆蓋量提供給信息投 放方。
[0019] 一種用戶覆蓋量信息的提示裝置,包括:
[0020] 基礎(chǔ)數(shù)據(jù)獲取單元,用于根據(jù)預(yù)先獲取到的各個用戶分別關(guān)注的類目信息,獲取 基礎(chǔ)數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù)中包括每個類目單獨的用戶覆蓋量、按照單獨的用戶覆蓋量由大 到小排序后得到的類目序列,以及各個類目在類目序列中的序號;
[0021] 類目分類單元,用于按照各類目在類目序列中排序距離的不同對類目進行分類, 得到預(yù)置數(shù)目個子序列;其中,所述排序距離為兩個類目的序號之間的差值,在同一子序列 中,相鄰類目之間的序號差值均相等;
[0022] 增長率計算單元,用于將同一子序列中的類目劃分為多個類目組合,使得每個類 目組合比前一個類目組合多一個類目,根據(jù)所述預(yù)先獲取到的各個用戶分別關(guān)注的類目信 息,統(tǒng)計各個類目組合累積的不重復(fù)用戶覆蓋量,并計算各個類目組合相對于前一個類目 組合的用戶覆蓋量增長率;
[0023] 擬合單元,用于根據(jù)同一子序列中得到的各個用戶覆蓋量增長率以及預(yù)置的函數(shù) 格式進行擬合,得到對應(yīng)排序距離下的擬合函數(shù);
[0024]目標類目確定單元,用于當信息投放方選擇了目標關(guān)鍵詞后,將所述目標關(guān)鍵詞 映射為系統(tǒng)中的多個目標類目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標類目的序號以及單獨的用戶 覆蓋量;
[0025] 目標組合確定單元,用于將序號最小的目標類目作為目標基準類目,將該目標基 準類目分別與其他各目標類目組成目標組合,并計算各個目標組合中兩個目標類目的排序 距離;
[0026] 預(yù)估單元,用于分別利用各個目標組合的排序距離對應(yīng)的擬合函數(shù),預(yù)估各個目 標組合相對于目標基準類目的累積用戶增長量,并將目標基準類目單獨的用戶覆蓋量與各 個目標組合的所述累積用戶增長量相加,預(yù)估出將所有目標類目組合在一起時的累積用戶 覆蓋量;
[0027] 提示單元,用于在接收到獲取累積用戶覆蓋量的請求時,將預(yù)估的累積用戶覆蓋 量提供給信息投放方。
[0028] 根據(jù)本申請?zhí)峁┑木唧w實施例,本申請公開了以下技術(shù)效果:
[0029] 通過本申請實施例,以有限數(shù)量的子序列內(nèi)的類目為代表,計算出一些類目組合 累積的不重復(fù)用戶覆蓋量,并且還可以得到各個排序距離下對應(yīng)的擬合函數(shù),用以擬合對 應(yīng)排序距離下,某類目組合相對于前一類目組合的累積用戶增長率,進而就可以根據(jù)各個 排序距離下的擬合函數(shù)以及子序列內(nèi)各類目組合的累積用戶覆蓋量,預(yù)估出被信息投放方 選擇的目標類目組合在一起時的累積用戶覆蓋量,以便向信息投放方進行相應(yīng)的提示。可 見,通過以上方式,可以將計算量縮小到有限數(shù)量的排序距離對應(yīng)的子序列范圍內(nèi),使得計 算量限制在計算系統(tǒng)能夠?qū)崿F(xiàn)的范圍內(nèi)。同時,利用類目組合累積的不重復(fù)用戶覆蓋量進 行函數(shù)的擬合以及后續(xù)的預(yù)估,因此,解決了同一用戶在不同類目下重復(fù)出現(xiàn)的問題。
[0030] 當然,實施本申請的任一產(chǎn)品并不一定需要同時達到以上所述的所有優(yōu)點。
【專利附圖】
【附圖說明】
[0031] 為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施 例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲 得其他的附圖。
[0032] 圖1是本申請實施例提供的方法的流程圖;
[0033] 圖2是本申請實施例提供的裝置的示意圖。
【具體實施方式】
[0034] 下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;?本申請中的實施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都屬于本申請保護的 范圍。
[0035] 在本申請實施例中,為了能夠在預(yù)估用戶覆蓋量時,降低計算量,并解決同一用戶 在同一類目組合的不同類目中重復(fù)出現(xiàn)的問題,采用了對類目組合的用戶覆蓋量進行分段 擬合的方式,通過擬合函數(shù)來對類目組合的累積用戶覆蓋量,并提供給信息投放方。下面對 此進行詳細地介紹。
[0036] 參見圖1,本申請實施例提供了一種用戶覆蓋量信息的提示方法,該方法可以包括 以下步驟:
[0037] S101 :根據(jù)預(yù)先獲取到的各個用戶分別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù);所述基 礎(chǔ)數(shù)據(jù)中包括每個類目單獨的用戶覆蓋量、按照單獨的用戶覆蓋量由大到小排序后得到的 類目序列,以及各個類目在類目序列中的序號;
[0038] 其中,在獲取各個用戶分別關(guān)注的類目信息時,可以對預(yù)置時間段內(nèi)收集到的用 戶的歷史操作行為記錄進行統(tǒng)計,然后統(tǒng)計出各個用戶分別對哪些類目感興趣。例如,對于 某用戶A,根據(jù)其歷史操作行為記錄發(fā)現(xiàn),該用戶A瀏覽過的網(wǎng)頁多數(shù)都是服裝類、數(shù)碼產(chǎn) 品類的業(yè)務(wù)對象所在的網(wǎng)頁,同時,還可能發(fā)現(xiàn),在用戶瀏覽過的業(yè)務(wù)對象中,最終產(chǎn)生過 購買或者預(yù)訂行為的業(yè)務(wù)對象也多是服裝類以及數(shù)碼產(chǎn)品類,因此,綜合這些信息,就可以 獲取到該用戶A關(guān)注度最高的若干個類目。其他用戶也都分別進行類似的處理,這樣,最終 就能夠得到每個用戶分別對哪些類目感興趣。其中,具體從用戶的歷史操作行為記錄中獲 取用戶對各類目的關(guān)注度的實現(xiàn)方法,可以參見已有技術(shù)中的實現(xiàn),這里不再詳述。當然, 對于每個用戶來說,其關(guān)注過的類目可能有很多,在本申請實施例中,可以僅取用戶最關(guān)注 的幾個類目來加入到具體的統(tǒng)計過程,例如,每個用戶都僅取其最關(guān)注的6個類目,當然, 如果某用戶關(guān)注的類目不足6個,就將該用戶實際關(guān)注的全部類目加入到統(tǒng)計過程。
[0039] 在獲取到各個用戶分別對哪些類目的關(guān)注度比較高之后,就可以獲取各類目單獨 的用戶覆蓋量,其中,某類目單獨的用戶覆蓋量為關(guān)注點中包括該類目的用戶數(shù)量。也就是 說,可以根據(jù)各個用戶分別關(guān)注的類目,統(tǒng)計出各個類目分別對應(yīng)的用戶數(shù)量,將該用戶數(shù) 量確定為各個類目單獨的用戶覆蓋量。例如,假設(shè)一共有三個用戶,分別為A、B、C,其中:
[0040] 用戶A關(guān)注的類目包括:服裝類、數(shù)碼產(chǎn)品類以及化妝品類;
[0041] 用戶B關(guān)注的類目包括:服裝類、化妝品類及運動戶外類;
[0042] 用戶C關(guān)注的類目包括:化妝品類及數(shù)碼產(chǎn)品類。
[0043] 則對于服裝類而言,用戶A及用戶B都關(guān)注了,因此,該服裝類單獨的用戶覆蓋量 為2 ;對于數(shù)碼產(chǎn)品類而言,用戶A以及用戶C都關(guān)注了,因此,數(shù)碼產(chǎn)品類單獨的用戶覆蓋 量為2 ;對于化妝品類而言,用戶A、B、C都關(guān)注了,因此,化妝品類單獨的用戶覆蓋量為3, 以此類推。當然,實際的系統(tǒng)中,用戶數(shù)量以及類目數(shù)量都很多,這里只是簡單的對統(tǒng)計的 原理進行介紹。
[0044] 在得到各個類目單獨的用戶覆蓋量之后,就可以按照單獨的用戶覆蓋量對各類目 進行排序,生成一個類目序列,并分別為序列中的各個類目賦予連續(xù)的序號。這樣,對于一 個類目而言,能夠獲取到兩方面的信息,一個是單獨的用戶覆蓋量,另一個就是在序列中的 序號,可以這兩方面的信息作為類目的固有屬性,進行后續(xù)的函數(shù)擬合以及流量預(yù)估計算。 例如,類目及屬性的存儲格式可以為:
[0045] (Key :類目)(value :排序序號+單獨的用戶覆蓋量)
[0046] 接下來就可以首先利用以上獲得的基礎(chǔ)數(shù)據(jù),進行分段的函數(shù)擬合。
[0047] S102:按照各類目在類目序列中排序距離的不同對類目進行分類,得到預(yù)置數(shù)目 個子序列;其中,所述排序距離為兩個類目的序號之間的差值,在同一子序列中,相鄰類目 之間的序號差值均相等;
[0048] 具體在按照排序距離對類目進行分類時,相當于是從類目序列中按照一定的間隔 進行抽取,抽取出來的類目組成一個新的序列,由于是從步驟S101中的類目序列中抽取出 來的,因此,可以稱為一個子序列。同樣的,按照其他的間隔進行抽取時,可以得到其他的子 序列。
[0049] 例如,按照各類目單獨的用戶覆蓋量從大到小排序的類目序列為:Cat_l、Cat_2、 Cat_3........Cat_N。貝U,具體在對類目進行分類時,就可以從序號為1的類目開始抽取序 號間隔為length的類目組成子序列。
[0050] 如 length = 1,則抽取{Cat_l、Cat_2、Cat_3......Cat_N}作為一個子序列;
[0051] length = 2,則抽取{Cat_l、Cat_3、Cat_5......Cat_m_2、Cat_m......}作為一 個子序列;
[0052] length = k 則分類為{Cat_l、Cat_k+1、Cat_2k+1......}作為一個子序列。
[0053] 這樣,最后可以產(chǎn)生多個子序列。
[0054] 這里需要進行以下幾點說明:
[0055] 第一,對于相同的排序距離而言,如果選擇的起始類目不同,則生成的子序列可能 會有所不同,例如,當length = 2時,如果從序號為1的類目開始抽取,則得到的子序列 為{Cat_l、Cat_3、Cat_5......Cat_m_2、Cat_m、......},其中,m 為奇數(shù);但如果是從序 號為2的類目開始抽取,則得到的子序列為{Cat_2、Cat_4、Cat_6、.......Cat_n_2、Cat_ n.......},其中,n為偶數(shù)。并且,length越大時,能夠產(chǎn)生的不同子序列的數(shù)目就越多。 由于在后續(xù)的函數(shù)擬合過程中,需要分別得到各個排序距離下的擬合函數(shù),而某排序距離 下的擬合函數(shù),是根據(jù)該排序距離下的子序列中各類目的用戶覆蓋量情況計算得到的。因 此,為了降低計算量,每個排序距離下可以僅抽取一個子序列,這樣,每個排序距離下,只需 要基于一個子序列就可以計算出對應(yīng)的擬合函數(shù)。其中,每個排序距離對應(yīng)的子序列都可 以是從序號為1的類目開始抽取,也就是各個子序列的起始類目均為在基礎(chǔ)數(shù)據(jù)的類目序 列中序號最小的類目。當然,在計算量允許的情況下,同一排序距離下也可以分別以不同的 起始類目抽取出多個子序列,最終在計算擬合函數(shù)時,同樣可以分別基于各個子序列進行 計算,最后再將同一排序距離下各個子序列計算得到的值取平均值。實驗證明,同一排序距 離下各個子序列計算得到的值是基本相等的,這也進一步表明,同一排序距離下只抽取一 個子序列具有合理性,也就是說,能夠比較準確的得到擬合函數(shù)的同時,還降低了計算量。
[0056] 第二,系統(tǒng)中的類目數(shù)量眾多,例如,一般有幾千甚至上萬個,理論上將,如果類目 數(shù)量為N,則不同類目之間的排序距離有N-1種。但實際按照排序距離對類目進行分類時, 不需要針對所有的排序距離都進行函數(shù)的擬合,一般情況下,可以為排序距離設(shè)置一最大 值,只要對該最大值以下的各個排序距離進行函數(shù)擬合即可。例如,假設(shè)類目總數(shù)為2000 個,最大排序距離可以取100,然后分別針對各個排序距離進行函數(shù)擬合。這樣,可以進一步 減少計算量,并且這些擬合函數(shù)一般就能滿足實際應(yīng)用中的絕大部分需求。
[0057] S103:將同一子序列中的類目劃分為多個類目組合,使得每個類目組合比前一個 類目組合多一個類目,統(tǒng)計各個類目組合累積的不重復(fù)用戶覆蓋量,并計算各個類目組合 相對于前一個類目組合的用戶覆蓋量增長率;
[0058] 在同一子序列中,各類目仍然按照序號從小到大(也就是單獨的用戶覆蓋量從大 至IJ?。┑捻樞蚺帕?。具體在依據(jù)同一子序列內(nèi)各類目的用戶覆蓋量情況對對應(yīng)排序距離下 的函數(shù)進行擬合時,可以首先將同一子序列中的類目劃分為多個類目組合。具體在劃分類 目組合時,可以將子序列中一個類目(例如序號最小的類目)為基準類目,并按照類目在子 序列中的順序每次加入一個類目組成下一個類目組合,這樣,每個類目組合比前一個類目 組合都多一個類目。例如:
[0059] 對于子序列:{Cat_l、Cat_k+1、Cat_2k+1、......),得到的類目組合可以包括: {Cat_l}, {Cat_l>Cat_k+1}, {Cat_l>Cat_k+1, Cat_2k+1}.....
[0060] 也就是說,第一個類目組合是由子序列中的第一個類目組成,第二個類目組合就 是由子序列中的前兩個類目組成的組合,第三個類目組合就是由子序列中的前三個類目組 成的組合,也即,第i個類目組合就是由子序列中的前i個類目組成的組合,以此類推。
[0061] 在同一子序列中得到多個類目組合后,對于包含兩個及兩個以上類目的類目組合 而言,還可以根據(jù)步驟S101中統(tǒng)計出的各個用戶關(guān)注的類目信息,統(tǒng)計出類目組合累積的 不重復(fù)用戶覆蓋量。具體的,由于從預(yù)先得到的數(shù)據(jù)中可以獲知各個用戶分別對哪些類目 的關(guān)注度比較高,并且已知各個用戶的ID等身份標識信息,因此,可以統(tǒng)計出同一類目組 合內(nèi)各個類目分別對應(yīng)的用戶標識,這樣,將用戶標識進行匯總,并去掉重復(fù)的用戶標識, 最終得到的用戶標識數(shù)目,就可以確定為該類目組合累積的不重復(fù)用戶覆蓋量。
[0062] 例如,仍然假設(shè)一共有三個用戶,分別為A、B、C,其中:
[0063] 用戶A關(guān)注的類目包括:服裝類、數(shù)碼產(chǎn)品類以及化妝品類;
[0064] 用戶B關(guān)注的類目包括:服裝類、化妝品類及運動戶外類;
[0065] 用戶C關(guān)注的類目包括:化妝品類及數(shù)碼產(chǎn)品類。
[0066] 假設(shè)某類目組合為{服裝類、數(shù)碼產(chǎn)品類},其中,服裝類覆蓋的用戶包括用戶A及 用戶B(單獨的用戶覆蓋量為2),數(shù)碼產(chǎn)品類覆蓋的用戶包括用戶A和用戶C (單獨的用戶 覆蓋量為2),此時,將服裝類及數(shù)碼產(chǎn)品類覆蓋的用戶進行匯總,并去掉重復(fù)的用戶后,得 到的用戶包括A、B、C,因此,就可以得到該類目組合累積的不重復(fù)用戶覆蓋量為3,其中,用 戶A在兩個類目中都出現(xiàn),但只會計算一次。
[0067] 總之,針對同一子序列中的各個類目組合都可以按照上述方式統(tǒng)計出累積的用戶 覆蓋量。之后,就可以計算出子序列內(nèi)部每個類目組合相對于前一類目組合的用戶覆蓋量 增長率。例如,如果要計算類目組合{Cat_l、Cat_k+l}相對于{Cat_l}的用戶覆蓋量增長 率,則可以按照以下公式(1)進行計算:
[0068]
【權(quán)利要求】
1. 一種用戶覆蓋量信息的提示方法,其特征在于,包括: 根據(jù)預(yù)先獲取到的各個用戶分別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù)中包 括每個類目單獨的用戶覆蓋量、按照單獨的用戶覆蓋量由大到小排序后得到的類目序列, 以及各個類目在類目序列中的序號; 按照各類目在類目序列中排序距離的不同對類目進行分類,得到預(yù)置數(shù)目個子序列; 其中,所述排序距離為兩個類目的序號之間的差值; 將同一子序列中的類目劃分為多個類目組合,使得每個類目組合比前一個類目組合多 一個類目,根據(jù)所述預(yù)先獲取到的各個用戶分別關(guān)注的類目信息,統(tǒng)計各個類目組合累積 的不重復(fù)用戶覆蓋量,并計算各個類目組合相對于前一個類目組合的用戶覆蓋量增長率; 根據(jù)同一子序列中得到的各個用戶覆蓋量增長率以及預(yù)置的函數(shù)格式進行擬合,得到 對應(yīng)排序距離下的擬合函數(shù); 當信息投放方選擇了目標關(guān)鍵詞后,將所述目標關(guān)鍵詞映射為系統(tǒng)中的多個目標類 目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標類目的序號以及單獨的用戶覆蓋量; 在所述映射得到的多個目標類目中選擇目標基準類目,將該目標基準類目分別與其他 各目標類目組成目標組合,并計算各個目標組合中兩個目標類目的排序距離; 分別利用各個目標組合的排序距離對應(yīng)的擬合函數(shù),預(yù)估各個目標組合相對于目標基 準類目的累積用戶增長量,并將目標基準類目單獨的用戶覆蓋量與各個目標組合的所述累 積用戶增長量相加,預(yù)估出將所有目標類目組合在一起時的累積用戶覆蓋量; 在接收到獲取累積用戶覆蓋量的請求時,將預(yù)估的累積用戶覆蓋量提供給信息投放 方。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)置的函數(shù)格式為冪函數(shù)格式,所述 冪函數(shù)格式中包括待確定的系數(shù)和/或冪指數(shù),所述根據(jù)同一類目子序列中得到的各個用 戶覆蓋量增長率以及預(yù)置的函數(shù)格式進行擬合,得到對應(yīng)排序距離下的擬合函數(shù),包括: 根據(jù)同一類目子序列中得到的各個用戶覆蓋量增長率以及預(yù)置的冪函數(shù)格式,確定出 對應(yīng)排序距離下系數(shù)和/或冪指數(shù); 將所述系數(shù)和/或冪指數(shù)以及該排序距離帶入到預(yù)置的函數(shù)格式中,得到對應(yīng)排序距 離下的擬合函數(shù)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,同一排序距離下取一個子序列。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,各個排序距離下的子序列均以所述類目 序列中序號最小的類目為起始類目。
5. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,所述分別利用各個目標組合的 排序距離對應(yīng)的擬合函數(shù),預(yù)估各個目標組合相對于目標基準類目的累積用戶增長量,包 括: 將所述目標組合對應(yīng)的排序距離以及目標組合中目標基準類目外的另一個目標類目 的序號,帶入到該排序距離的擬合函數(shù)中,得到該目標組合相對于目標基準類目的累積用 戶增長率; 從該排序距離對應(yīng)的子序列中,獲取與目標基準類目序號最接近的第一類目,以及與 目標組合中另一類目的序號最接近的第二類目,根據(jù)所述第一類目單獨的用戶覆蓋量,以 及第一類目與第二類目累積的不重復(fù)用戶覆蓋量,以及所述該目標組合相對于目標基準類 目的累積用戶增長率,預(yù)估出該目標組合相對于目標基準類目的累積用戶增長量。
6. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,在按照排序距離的不同對類目 進行分類時,最大排序距離與類目總數(shù)之間的比值小于預(yù)置的閾值。
7. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,根據(jù)預(yù)先獲取到的各個用戶分 別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù),包括: 預(yù)先根據(jù)用戶在預(yù)置時間段內(nèi)的歷史操作行為記錄,獲取該用戶關(guān)注度最高的預(yù)置數(shù) 目的類目信息; 將從各個用戶處獲取到的信息進行匯總,統(tǒng)計出各個類目分別對應(yīng)的用戶數(shù)量,將該 用戶數(shù)量確定為各個類目單獨的用戶覆蓋量。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,在進行函數(shù)擬合時,所述統(tǒng)計各個類目組 合累積的不重復(fù)用戶覆蓋量,包括: 統(tǒng)計出同一類目組合內(nèi)各個類目分別對應(yīng)的用戶標識; 將所述用戶標識進行匯總,并去掉重復(fù)的用戶標識,將最終的用戶標識數(shù)目,確定為該 類目組合累積的不重復(fù)用戶覆蓋量。
9. 一種用戶覆蓋量信息的提示裝置,其特征在于,包括: 基礎(chǔ)數(shù)據(jù)獲取單元,用于根據(jù)預(yù)先獲取到的各個用戶分別關(guān)注的類目信息,獲取基礎(chǔ) 數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù)中包括每個類目單獨的用戶覆蓋量、按照單獨的用戶覆蓋量由大到小 排序后得到的類目序列,以及各個類目在類目序列中的序號; 類目分類單元,用于按照各類目在類目序列中排序距離的不同對類目進行分類,得到 預(yù)置數(shù)目個子序列;其中,所述排序距離為兩個類目的序號之間的差值,在同一子序列中, 相鄰類目之間的序號差值均相等; 增長率計算單元,用于將同一子序列中的類目劃分為多個類目組合,使得每個類目組 合比前一個類目組合多一個類目,根據(jù)所述預(yù)先獲取到的各個用戶分別關(guān)注的類目信息, 統(tǒng)計各個類目組合累積的不重復(fù)用戶覆蓋量,并計算各個類目組合相對于前一個類目組合 的用戶覆蓋量增長率; 擬合單元,用于根據(jù)同一子序列中得到的各個用戶覆蓋量增長率以及預(yù)置的函數(shù)格式 進行擬合,得到對應(yīng)排序距離下的擬合函數(shù); 目標類目確定單元,用于當信息投放方選擇了目標關(guān)鍵詞后,將所述目標關(guān)鍵詞映射 為系統(tǒng)中的多個目標類目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標類目的序號以及單獨的用戶覆蓋 量; 目標組合確定單元,用于將序號最小的目標類目作為目標基準類目,將該目標基準類 目分別與其他各目標類目組成目標組合,并計算各個目標組合中兩個目標類目的排序距 離; 預(yù)估單元,用于分別利用各個目標組合的排序距離對應(yīng)的擬合函數(shù),預(yù)估各個目標組 合相對于目標基準類目的累積用戶增長量,并將目標基準類目單獨的用戶覆蓋量與各個目 標組合的所述累積用戶增長量相加,預(yù)估出將所有目標類目組合在一起時的累積用戶覆蓋 量; 提示單元,用于在接收到獲取累積用戶覆蓋量的請求時,將預(yù)估的累積用戶覆蓋量提 供給信息投放方。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述預(yù)估單元包括: 增長率計算子單元,用于將所述目標組合對應(yīng)的排序距離以及目標組合中目標基準類 目外的另一個目標類目的序號,帶入到該排序距離的擬合函數(shù)中,得到該目標組合相對于 目標基準類目的累積用戶增長率; 增長量計算子單元,用于從該排序距離對應(yīng)的子序列中,獲取與目標基準類目序號最 接近的第一類目,以及與目標組合中另一類目的序號最接近的第二類目,根據(jù)所述第一類 目單獨的用戶覆蓋量,以及第一類目與第二類目累積的不重復(fù)用戶覆蓋量,以及所述該目 標組合相對于目標基準類目的累積用戶增長率,預(yù)估出該目標組合相對于目標基準類目的 累積用戶增長量。
【文檔編號】G06F17/30GK104281594SQ201310279704
【公開日】2015年1月14日 申請日期:2013年7月4日 優(yōu)先權(quán)日:2013年7月4日
【發(fā)明者】康生巧 申請人:阿里巴巴集團控股有限公司