投放信息點(diǎn)擊率預(yù)估方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施例涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及投放信息點(diǎn)擊率預(yù)估方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)商業(yè)模式的不斷探索發(fā)展,投放信息(例如互聯(lián)網(wǎng)廣告)已經(jīng)成為互聯(lián)網(wǎng)流量變現(xiàn)的一種重要業(yè)務(wù)形式。投放信息的點(diǎn)擊率綜合反應(yīng)了投放信息與搜索需求的相關(guān)性、投放信息創(chuàng)意的吸引力等水平,量化了投放信息在展現(xiàn)后被網(wǎng)民點(diǎn)擊的概率。投放信息選擇、準(zhǔn)入、排序及計(jì)費(fèi)等階段都依賴對(duì)候選投放信息的點(diǎn)擊率進(jìn)行準(zhǔn)確的預(yù)估。因此,如何精準(zhǔn)實(shí)時(shí)地預(yù)估投放信息的點(diǎn)擊率至關(guān)重要。
[0003]然而,現(xiàn)有技術(shù)僅僅根據(jù)投放信息的如下一些特征:意圖需求特征、用戶特征以及上下文投放信息間的文本相似度特征,來進(jìn)行點(diǎn)擊率預(yù)估,以供下游的投放信息拍賣機(jī)制使用。由于該預(yù)估方式無法有效納入其他有用特征進(jìn)行預(yù)估,從而使得預(yù)估的點(diǎn)擊率與實(shí)際場景下投放信息的后驗(yàn)點(diǎn)擊率存在誤差。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供一種投放信息點(diǎn)擊率預(yù)估方法及裝置,以提高預(yù)估精度。
[0005]—方面,本發(fā)明實(shí)施例提供了一種投放信息點(diǎn)擊率預(yù)估方法,該方法包括:
[0006]獲取當(dāng)前投放信息的特征集;
[0007]根據(jù)所獲取的特征集,采用預(yù)先基于機(jī)器學(xué)習(xí)算法、歷史投放信息的特征集及對(duì)應(yīng)的點(diǎn)擊行為結(jié)果創(chuàng)建的投放信息點(diǎn)擊率模型,預(yù)估所獲取的當(dāng)前投放信息的點(diǎn)擊率;
[0008]其中,任一投放信息的特征集包括該投放信息的展現(xiàn)位置特征和/或展現(xiàn)場景特征。
[0009]另一方面,本發(fā)明實(shí)施例還提供了一種投放信息點(diǎn)擊率預(yù)估裝置,該裝置包括:
[0010]特征獲取單元,用于獲取當(dāng)前投放信息的特征集;
[0011]點(diǎn)擊率預(yù)估單元,用于根據(jù)所獲取的特征集,采用預(yù)先基于機(jī)器學(xué)習(xí)算法、歷史投放信息的特征集及對(duì)應(yīng)的點(diǎn)擊行為結(jié)果創(chuàng)建的投放信息點(diǎn)擊率模型,預(yù)估所獲取的當(dāng)前投放信息的點(diǎn)擊率;
[0012]其中,任一投放信息的特征集包括該投放信息的展現(xiàn)位置特征和/或展現(xiàn)場景特征。
[0013]本發(fā)明實(shí)施例提供的技術(shù)方案,根據(jù)更加細(xì)粒度的展現(xiàn)位置和/或展現(xiàn)場景信息來預(yù)估投放信息的點(diǎn)擊率,能夠提升預(yù)估精度,使得投放信息預(yù)估的點(diǎn)擊率與投放信息真實(shí)場景展現(xiàn)的后驗(yàn)點(diǎn)擊率擬合更好,后續(xù)對(duì)投放信息的選擇、排序以及計(jì)費(fèi)業(yè)務(wù)處理流程更加合理準(zhǔn)確,提升流量變現(xiàn)效率。
【附圖說明】
[0014]圖1是本發(fā)明實(shí)施例一提供的一種投放信息點(diǎn)擊率預(yù)估方法的流程示意圖;
[0015]圖2是本發(fā)明實(shí)施例二提供的一種投放信息點(diǎn)擊率預(yù)估方法的流程示意圖;
[0016]圖3是本發(fā)明實(shí)施例三提供的一種投放信息點(diǎn)擊率預(yù)估方法的流程示意圖;
[0017]圖4是本發(fā)明實(shí)施例四提供的一種投放信息點(diǎn)擊率預(yù)估裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0018]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0019]在更加詳細(xì)地討論示例性實(shí)施例之前應(yīng)當(dāng)提到的是,一些示例性實(shí)施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項(xiàng)操作(或步驟)描述成順序的處理,但是其中的許多操作可以被并行地、并發(fā)地或者同時(shí)實(shí)施。此外,各項(xiàng)操作的順序可以被重新安排。當(dāng)其操作完成時(shí)所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對(duì)應(yīng)于方法、函數(shù)、規(guī)程、子例程、子程序等等。
[0020]實(shí)施例一
[0021]圖1是本發(fā)明實(shí)施例一提供的一種投放信息點(diǎn)擊率預(yù)估方法的流程示意圖。本實(shí)施例可適用于對(duì)投放信息的點(diǎn)擊率進(jìn)行預(yù)估的情況。該方法可以由投放信息點(diǎn)擊率預(yù)估裝置來執(zhí)行,所述裝置由軟件實(shí)現(xiàn),可被配置在為終端提供投放信息展示服務(wù)的物理設(shè)備上。參見圖1,本實(shí)施例提供的投放信息點(diǎn)擊率預(yù)估方法所包括的執(zhí)行操作具體如下。
[0022]S110、獲取當(dāng)前投放信息的特征集。
[0023]S120、根據(jù)所獲取的特征集,采用預(yù)先基于機(jī)器學(xué)習(xí)算法、歷史投放信息的特征集及對(duì)應(yīng)的點(diǎn)擊行為結(jié)果創(chuàng)建的投放信息點(diǎn)擊率模型,預(yù)估所獲取的當(dāng)前投放信息的點(diǎn)擊率。
[0024]當(dāng)前投放信息可以是搜索類投放信息,具體為:在接收到用戶在終端顯示的搜索頁面輸入的搜索詞之后,通過搜索技術(shù)所確定的待在終端的搜索結(jié)果輸出頁面進(jìn)行展現(xiàn)的候選投放信息。當(dāng)然,當(dāng)前投放信息還可以是展示類投放信息,具體為:在接收到用戶觸發(fā)的對(duì)其他非搜索頁面(例如京東主頁面、搜狐主頁面)的訪問請求后,所確定的待在所述其他非搜索頁面進(jìn)行展現(xiàn)的候選投放信息。
[0025]在本實(shí)施例中,可預(yù)先在線下建立好投放信息點(diǎn)擊率模型。示例性的,在預(yù)估所獲取的當(dāng)前投放信息的點(diǎn)擊率之前,還包括:獲取歷史投放信息的特征集及對(duì)應(yīng)的點(diǎn)擊行為結(jié)果,作為訓(xùn)練樣本;基于機(jī)器學(xué)習(xí)算法對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,以建立投放信息點(diǎn)擊率模型。其中,點(diǎn)擊行為結(jié)果指的是:在歷史投放信息被投放展現(xiàn)時(shí),用戶對(duì)歷史投放信息的點(diǎn)擊行為結(jié)果,例如如果用戶點(diǎn)擊了該投放信息,則該點(diǎn)擊行為結(jié)果為1,相反則為O。機(jī)器學(xué)習(xí)算法可以是神經(jīng)網(wǎng)絡(luò)算法、決策樹算法、或者邏輯回歸算法等。
[0026]在線下建立好投放信息點(diǎn)擊率模型后,可在線上實(shí)時(shí)地獲取當(dāng)前投放信息的特征集;進(jìn)而,將當(dāng)前投放信息的特征集作為投放信息點(diǎn)擊率模型的一次輸入,并基于該模型中的特征模型參數(shù)對(duì)該特征集進(jìn)行加權(quán)處理,進(jìn)而預(yù)估得到當(dāng)前投放信息的點(diǎn)擊率,作為該模型的輸出。
[0027]在本發(fā)明實(shí)施例中,任一投放信息的特征集包括該投放信息的展現(xiàn)位置特征和/或展現(xiàn)場景特征。其中,如果投放信息為搜索類投放信息,則展現(xiàn)位置特征可以是該投放信息在投放信息展現(xiàn)列表中的展現(xiàn)位次;如果投放信息為展示類投放信息,則展現(xiàn)位置特征可以是該投放信息在非搜索頁面中的位置。任一投放信息的展現(xiàn)場景特征包括如下至少一種:該投放信息的展現(xiàn)樣式特征、展現(xiàn)設(shè)備特征以及網(wǎng)速特征。舉例而言,展現(xiàn)設(shè)備特征可具體包括用于展現(xiàn)投放信息的終端類型、終端屏幕的寬高、終端屏幕的分辨率等。
[0028]示例性的,投放信息的展現(xiàn)樣式特征可包括如下至少一種:標(biāo)題特征、創(chuàng)意特征和物料特征。其中,標(biāo)題特征可包括標(biāo)題描述、標(biāo)題大小、標(biāo)題飄紅程度等;創(chuàng)意特征可包括創(chuàng)意類型,例如是屬于幽默型創(chuàng)意、懸念型創(chuàng)意還是夸張型創(chuàng)意等;物料特征可包括物料類型,例如是屬于文字鏈型物料、圖片型物料、應(yīng)用下載型物料還是電話撥打型物料等。
[0029]除展現(xiàn)位置特征和展現(xiàn)場景特征之外,特征集還可包括如下至少一種特征:用戶特征、意圖需求特征、投放信息特征。其中,用戶特征指的是輸入搜索詞的搜索用戶的特征(對(duì)應(yīng)于搜索類投放信息),或者訪問非搜索頁面的瀏覽用戶的特征(對(duì)應(yīng)于展示類投放信息),可具體包括用戶標(biāo)識(shí)、年齡、性別、所在地區(qū)等。如果投放信息為搜索類投放信息,則意圖需求特征可包括用戶輸入的搜索詞、搜索意圖類別等。舉例而言,可根據(jù)預(yù)先創(chuàng)建的多個(gè)搜索詞與多個(gè)意圖類別之間的映射關(guān)系,確定用戶輸入的搜索詞所屬的意圖類別,將該類別作為搜索意圖類別。如果投放信息為展示類投放信息,則意圖需求特征可包括瀏覽意圖類別。舉例而言,可根據(jù)用戶的歷史瀏覽行為確定瀏覽意圖類別。投放信息特征可包括投放信息標(biāo)識(shí)。
[0030]本實(shí)施例提供的技術(shù)方案,根據(jù)更加細(xì)粒度的展現(xiàn)位置和/或展現(xiàn)場景信息來預(yù)估投放信息的點(diǎn)擊率,能夠提升預(yù)估精度,使得投放信息預(yù)估的點(diǎn)擊率與投放信息真實(shí)場景展現(xiàn)的后驗(yàn)點(diǎn)擊率擬合更好,后續(xù)對(duì)投放信息的選擇、排序以及計(jì)費(fèi)業(yè)務(wù)處理流程更加合理準(zhǔn)確,提升流量變現(xiàn)效率。
[0031]實(shí)施例二
[0032]圖2是本發(fā)明實(shí)施例二提供的一種投放信息點(diǎn)擊率預(yù)估方法的流程示意圖。本實(shí)施例在上述實(shí)施例一的基礎(chǔ)上,在投放信息為搜索類投放信息的應(yīng)用場景下,對(duì)“獲取當(dāng)前投放信息的特征集”的操作作進(jìn)一步優(yōu)化。參見圖2,本實(shí)施例提供的投放信息點(diǎn)擊率預(yù)估方法所包括的執(zhí)行操作具體如下。
[0033]S210、遍歷預(yù)設(shè)的投放信息展現(xiàn)列表中的各個(gè)展現(xiàn)位次,確定當(dāng)前展現(xiàn)位次下的多條候選投放信息的特征集。
[0034]在本實(shí)施例中,在遍歷各個(gè)展現(xiàn)位次之前,可包括:接收到用戶在終端顯示的搜索頁面輸入的搜索詞,基于該搜索詞在投放信息庫中進(jìn)行搜索,以得到與該搜索詞關(guān)聯(lián)的多條候選投放信息;然后,從搜索到的多條候選投放信息中選擇至少一條投放信息。
[0035]而后,示例性的,可按照展現(xiàn)位次序號(hào)的大小順序,依次遍歷終端搜索結(jié)果輸出頁面所包含的投放信息展現(xiàn)列表中的各個(gè)展現(xiàn)位次:確定當(dāng)前展現(xiàn)位次下的投放信息隊(duì)列,以及隊(duì)列中各條候選投放信息的特征集。投放信息隊(duì)列中任一條候選投放信息為:從搜索到的多條候選投放信息中選擇的一條投放信息。特征集包括:展現(xiàn)位置特征和展現(xiàn)場景特征。
[0036]作為本實(shí)施例的一種優(yōu)選的實(shí)施方式,確定當(dāng)前展現(xiàn)位次下的多條候選投放信息的特征集,包括:依次生成所述多條候選投放信息的全局特征、投放信息級(jí)特征以及場景級(jí)特征;根據(jù)生成結(jié)果確定各條候選投放信息的特征。其中,全局特征為:針對(duì)所述多條候選投放信息中全部的候選投放信息,得到的不會(huì)隨著候選投放信息的不同而發(fā)生變化的特征,例如:用戶特征、意圖需求特征等。全局特征的生成過程無需對(duì)各條候選投放信息進(jìn)行遍歷即可得到。投放信息級(jí)特征為:通過遍歷所述多條候選投放信息中的各條候選投放信息,得到的除全局特征之外的,且不會(huì)隨著展現(xiàn)樣式的不同而發(fā)生變化的各條候選投放信息的特征,例如:該條投放信息標(biāo)識(shí)。場景級(jí)特征為:通過遍歷所述多條候選投放信息中的各條候選投放信息所對(duì)應(yīng)的各種候選展現(xiàn)場景,得到的除全局特征和投放信息級(jí)特征之外的各條候選投放信息的展現(xiàn)場景特征。
[0037]S220、將所述多條候選投放信息中的一條候選投放信息作為當(dāng)前投放信息,從確定結(jié)果中選取當(dāng)前投放信息的特征集。
[0038]當(dāng)前投放信息的特征集包括:確定結(jié)果中的全局特征集、當(dāng)前投放信息所對(duì)應(yīng)的投放信息級(jí)特征集以及場景級(jí)特征集。
[0039]S230、根據(jù)所選取的特征集,采用預(yù)先基于機(jī)器學(xué)習(xí)算法、歷史投放信息的特征集及對(duì)應(yīng)的點(diǎn)擊行為結(jié)果