一種就業(yè)信息個性化推薦方法
【專利摘要】一種就業(yè)信息個性化推薦方法,其包括:根據(jù)目標(biāo)用戶的用戶信息確定目標(biāo)用戶申請過的職位集合,得到第一職位集合,根據(jù)第一職位集合確定第一用戶集合,獲取第一用戶集合中用戶所申請過的所有職位,得到候選職位集合;根據(jù)第一職位集合分別計算目標(biāo)用戶對候選職位集合中各個候選職位的初始偏好度;利用職位權(quán)重和/或用戶權(quán)重對各個候選職位的初始偏好度進(jìn)行修正,得到各個候選職位的修正偏好度,根據(jù)各個候選職位的修正偏好度生成針對目標(biāo)用戶的推薦職位。該方法能夠使得最終得到的推薦職位與目標(biāo)用戶更加匹配,從而提高了就業(yè)信息推薦的準(zhǔn)確性、有效性和可靠性。
【專利說明】
-種就業(yè)信息個性化推薦方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明設(shè)及就業(yè)信息推薦技術(shù)領(lǐng)域,具體地說,設(shè)及一種就業(yè)信息個性化推薦方 法。
【背景技術(shù)】
[0002] 求職者簡歷信息中"所學(xué)專業(yè)"運個屬性在求職過程中極為重要,若應(yīng)聘者所學(xué)專 業(yè)與職位需求不匹配,會大大降低求職的成功率。當(dāng)計算兩位求職者個人信息的相似度時, "所學(xué)專業(yè)"也是非常重要的屬性。
[0003] 現(xiàn)有方法多是采用空間余弦向量相似性來度量兩個專業(yè)之間的相似程度,而運種 度量方式存在準(zhǔn)確度差的問題。例如,"會計學(xué)"專業(yè)和"社會學(xué)"專業(yè)在字面上相似程度非 常高,用余弦向量表示二者,得到的相似度是66.7%,然而實際上運兩個專業(yè)所學(xué)內(nèi)容相差 很多。相反,"會計學(xué)"專業(yè)畢業(yè)生和"財務(wù)管理"專業(yè)畢業(yè)生經(jīng)常競聘相同的職位,而采用空 間余弦向量的方式所得到的運兩者的相似度為0。
[0004] 另一個問題是,在現(xiàn)實的招聘環(huán)境中,用人單位所發(fā)布的招聘職位介紹中,專業(yè)要 求有時并不那么明朗、清晰和全面。舉例來說,某互聯(lián)網(wǎng)公司招聘研發(fā)工程師,職位要求中 運樣描述:"計算機或相關(guān)專業(yè)"。某畢業(yè)生所學(xué)專業(yè)為"軟件工程",他完全符合該職位的一 切要求,但他在傳統(tǒng)的網(wǎng)絡(luò)求職方式中,使用信息檢索的方式篩選"專業(yè)"為"軟件工程",所 捜索得出的職位可能并不包含運一條信息。
[0005] 在某些情況下,甚至大多數(shù)信息聚合類求職網(wǎng)站中根本沒有提供專業(yè)篩選功能。 因為絕大多數(shù)用人單位發(fā)布招聘信息時,發(fā)布的是一整段關(guān)于職位描述、職位需求的自由 文本,"專業(yè)要求"就蘊含于其中,運些求職網(wǎng)站為求省事,并不會將專業(yè)要求單獨作為格式 化文本提取出來。而針對該問題,求職學(xué)生能做的就是不斷瀏覽更多的招聘信息,人為判斷 自己所學(xué)的專業(yè)"軟件工程"是否符合職位描述中的"計算機或相關(guān)專業(yè)"要求。
[0006] 基于上述情況,亟需一種能夠準(zhǔn)確進(jìn)行就業(yè)信息推薦的方法。
【發(fā)明內(nèi)容】
[0007] 為解決上述問題,本發(fā)明提供了一種就業(yè)信息個性化推薦方法,所述方法包括: [000引候選職位集合生成步驟,根據(jù)目標(biāo)用戶的用戶信息確定所述目標(biāo)用戶申請過的職 位集合,得到第一職位集合,根據(jù)所述第一職位集合確定第一用戶集合,獲取所述第一用戶 集合中用戶所申請過的所有職位,得到候選職位集合;
[0009] 用戶初始偏好度確定步驟,根據(jù)所述第一職位集合分別計算所述目標(biāo)用戶對所述 候選職位集合中各個候選職位的初始偏好度;
[0010] 推薦職位生成步驟,利用職位權(quán)重和/或用戶權(quán)重對所述各個候選職位的初始偏 好度進(jìn)行修正,得到所述各個候選職位的修正偏好度,根據(jù)所述各個候選職位的修正偏好 度生成針對于所述目標(biāo)用戶的推薦職位。
[0011] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)式計算各個候選職位的修正偏好度:
[001。 prvf {U, Jtem\) = prcfj、u I、
[QQ、3、或,p":f(U = 巧(Item'i)
[0014] 1?, prefiU,, ltem\) = prej\, {U,, Uem'^) * (〇" {Item\) * (〇" {lim]).
[001引化111,/W巧(以―,,/似?!;)I'l I戶/(0',., /似H;)分別表示用戶Ui對候選職位集合11emi中第 j個候選職位化?',的初始偏好度和修正偏好度,和邱分別表示候選職位 /<心7;的職位權(quán)重和用戶權(quán)重。
[0016] 根據(jù)本發(fā)明的一個實施例,在所述候選職位集合生成步驟中,統(tǒng)計申請了所述第 一職位集合中職位的用戶,得到所述第一用戶集合。
[0017] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)式計算各個候選職位的初始偏好度:
[001 引
[0019] 其中,戶炎(巧,化卻)表示用戶U擁候選職位集合Itemi中第j個候選職位々e"!';的 初始偏好度,K表示第一職位集合所包含的職位數(shù)量,表示第一職位集合 化啤第1個職位艇/礦與候選職位集合Itemi中第j個候選職位Ztew巧勺相似度。
[0020] 根據(jù)本發(fā)明的一個實施例,確定所述候選職位集合中各個職位的職位權(quán)重的步驟 包括:
[0021] 分別計算所述候選職位集合中一職位與所述第一職位集合中各個職位之間的相 似度,得到第一相似度集合;
[0022] 選取所述第一相似度集合中的最大相似度,根據(jù)所述最大相似度計算該職位的職 位權(quán)重。
[0023] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)式計算所述候選職位集合中各個職位的 職位權(quán)重:
[0024] 似,,) = 1 + (化,''似??化化,饑:".G /ZtVH'
[00巧]其中,%(/化,耐分別表示候選職位/似的職位權(quán)重,站Hj(化似皆)表示候選 職位1心》^與第一職位集合化誠"'中第111個職位/奴誠1之間的相似度。
[00%] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)式計算兩個職位之間的相似度:
[0027]
[002引
[0029] 其中,simjQtemx, Itemy)表示職位Itemx與職位Itemy之間的相似度,和 分別表示職位Itemx與職位Itemy的職位信息中第1個參數(shù),Q表示職位信息包含參數(shù)的總數(shù), q表示職位信息中所包含的第一類型參數(shù)的數(shù)量。
[0030] 根據(jù)本發(fā)明的一個實施例,確定所述候選職位集合中各個候選職位的用戶權(quán)重的 步驟包括:
[0031] 對于所述候選職位集合中的任一候選職位,獲取申請過該候選職位的用戶集合, 得到第二用戶集合;
[0032] 計算所述目標(biāo)用戶與第二用戶集合中各個用戶之間的用戶相似度,根據(jù)計算得到 的用戶相似度計算該候選職位的用戶權(quán)重。
[0033] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)計算所述候選職位集合中各個職位的用 戶權(quán)重:
[0034]
[003引其中,郵(/f""',)表不候選職位.化舶賄用戶權(quán)重,sim(Ui,U。)表不用戶Ui與用戶Uo之 間的用戶相似度,巧/'6"^表示申請過候選職位的用戶集合。
[0036] 根據(jù)本發(fā)明的一個實施例,計算兩個用戶之間的用戶相似度的步驟包括:
[0037] 分別獲取兩個用戶的專業(yè)信息,并根據(jù)所述專業(yè)信息計算運兩個用戶之間的專業(yè) 相似度;
[0038] 分別獲取兩個用戶的簡歷信息,并根據(jù)所述簡歷信息計算運兩個用戶之間的簡歷 信息相似度;
[0039] 根據(jù)所述專業(yè)相似度和簡歷信息相似度,計算運兩個用戶之間的用戶相似度。
[0040] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)式計算兩個用戶之間的用戶相似度:
[0041]
[0042] 其中,S im( Ui,U。)表示用戶Ui與用戶U。之間的用戶相似度,曲".'W )和S imB (Ui,U。)分別表示用戶化與用戶U。之間的專業(yè)相似度和簡歷信息相似度,a和b分別表示專業(yè) 相似度和簡歷信息相似度的加權(quán)系數(shù)。
[0043] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)式計算專業(yè)相似度:
[0044]
[0045] 其中,simM(ma,mb)表示專業(yè)ma與專業(yè)mb之間的相似度,S(ma,mb)表示專業(yè)ma與專業(yè) Klb之間的支持度,£表不預(yù)設(shè)支持度闊值,C(nia -)表不專業(yè)Hla到專業(yè)皿的置f目度,C(mb~* Hla )表示專業(yè)郵到專業(yè)ma的置信度。
[0046] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)式計算兩個專業(yè)之間的支持度:
[0047]
[004引其中,S(ma,皿)表示專業(yè)化與專業(yè)皿之間的支持度,I * I表示集合*中元素的個數(shù), {/,,|w"EMS;?EM/。,/,,E/|表示招聘時同時招聘了專業(yè)ma和專業(yè)郵的職位集合,In表示已 完成招聘的職位集合I中的第n個職位,賴表示職位In的受聘人員的專業(yè)集合。
[0049] 根據(jù)本發(fā)明的一個實施例,
[0050] 根據(jù)如下表達(dá)式計算置信度C(ma一mb):
[0化1 ]
[0化2]
[0化3]
[0054] 其中,I * I表示集合*中元素的個數(shù),|m。eMSm, E巧表示招聘時同時 招聘了專業(yè)Hla和專業(yè)mb的職位集合,?!/,,, |W" E M''|' E /!?表示招聘時招聘了專業(yè)ma的職位集 合,{/,,, K e/術(shù)聘時招聘了專業(yè)郵的職位集合,In表示已完成招聘的職位集合I中 的第n個職位,M^。表示職位In的受聘人員的專業(yè)集合。
[0055] 根據(jù)本發(fā)明的一個實施例,根據(jù)如下表達(dá)計算兩個用戶之間的簡歷信息相似度:
[0化6]
[0化7]
[005引其中,simB(Ui,U。)表示用戶化與用戶U。之間的簡歷信息相似度,COr表示簡歷信息 中的第r個信息的權(quán)重,/(《'',巧表示用戶化與用戶Ud的簡歷信息中的第r個信息的相似 度,R表示簡歷信息中所包含信息的總數(shù)。
[0059] 根據(jù)本發(fā)明的一個實施例,在所述推薦職位生成步驟中,將修正偏好度最高的預(yù) 設(shè)數(shù)量的候選職位作為推薦職位。
[0060] 本發(fā)明所提供的就業(yè)信息推薦方法在計算得到用戶對各個候選職位的初始偏好 度的基礎(chǔ)上,通過引入職位權(quán)重和用戶權(quán)重來對初始偏好度進(jìn)行修正,并根據(jù)修正偏好度 來生成推薦職位,運樣能夠使得得到最終得到的推薦職位與目標(biāo)用戶更加匹配,從而提高 了就業(yè)信息推薦的準(zhǔn)確性、有效性和可靠性。
[0061] 本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變 得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在說明書、權(quán)利 要求書W及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
【附圖說明】
[0062] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要的附圖做簡單的介紹:
[0063] 圖1是根據(jù)本發(fā)明一個實施例的就業(yè)信息個性化推薦方法的流程圖;
[0064] 圖2是根據(jù)本發(fā)明一個實施例的計算某一職位的職位權(quán)重的流程圖;
[0065] 圖3是根據(jù)本發(fā)明一個實施例的計算用戶權(quán)重的流程圖;
[0066] 圖4是根據(jù)本發(fā)明一個實施例的計算兩個用戶之間的用戶相似度的流程圖。
【具體實施方式】
[0067] W下將結(jié)合附圖及實施例來詳細(xì)說明本發(fā)明的實施方式,借此對本發(fā)明如何應(yīng)用 技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實現(xiàn)過程能充分理解并據(jù)W實施。需要說明 的是,只要不構(gòu)成沖突,本發(fā)明中的各個實施例W及各實施例中的各個特征可W相互結(jié)合, 所形成的技術(shù)方案均在本發(fā)明的保護(hù)范圍之內(nèi)。
[0068] 同時,在W下說明中,出于解釋的目的而闡述了許多具體細(xì)節(jié),W提供對本發(fā)明實 施例的徹底理解。然而,對本領(lǐng)域的技術(shù)人員來說顯而易見的是,本發(fā)明可W不用運里的具 體細(xì)節(jié)或者所描述的特定方式來實施。
[0069] 另外,在附圖的流程圖示出的步驟可W在諸如一組計算機可執(zhí)行指令的計算機系 統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可W W不同于此處 的順序執(zhí)行所示出或描述的步驟。
[0070] 考慮到就業(yè)信息推薦過程中,可用職位的有效期較短,系統(tǒng)中待分析的職位數(shù)量 往往遠(yuǎn)遠(yuǎn)小于求職用戶的數(shù)量,同時,職位需求的穩(wěn)定性在一定程度上要高于用戶求職意 向的穩(wěn)定性,因此本發(fā)明所提供的方法采用了基于項目的協(xié)同過濾算法來實現(xiàn)就業(yè)信息的 個性化推薦。
[0071] 假設(shè)用戶集合為U:{Ui,化,...,Un},其中,Ui表示用戶集合中的第i個用戶,N表示 用戶集合中用戶總數(shù),由于針對各個用戶的就業(yè)信息推薦原理W及過程相同,因此為了描 述的方便,W下W用戶化作為目標(biāo)用戶為例來對本實施例所提供的就業(yè)信息個性化推薦方 法的實現(xiàn)原理W及實現(xiàn)過程作進(jìn)一步的說明。
[0072] 圖1示出了本實施例所提供的就業(yè)信息個性化推薦方法的流程圖。
[0073] 如圖1所示,本實施例所提供的就業(yè)信息推薦方法首先在步驟SlOl中根據(jù)目標(biāo)用 戶的用戶信息確定目標(biāo)用戶申請過的職位集合,從而得到第一職位集合。具體地,由于目標(biāo) 用戶化使用就業(yè)信息推薦系統(tǒng)進(jìn)行過求職,因此該就業(yè)信息推薦系統(tǒng)的數(shù)據(jù)庫中會存儲有 目標(biāo)用戶化所申請過的職位,該方法可W根據(jù)用戶ID等用戶信息來檢索就業(yè)信息推薦系統(tǒng) 的數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)來確定第一職位集合。
[0074] 本實施例中,第一職位集合可W表示為及削< :[化? Z似皆妨墻j,其中, 表示第一職位集合中的第j個職位,K表示第一職位集合中所包含的職位總數(shù)。
[0075] 需要指出的是,在本發(fā)明的其他實施例中,該方法在步驟SlOl中還可W采用其他 合理的方式來確定出第一職位集合,本發(fā)明不限于此。
[0076] 當(dāng)?shù)玫降谝宦毼患虾?,該方法在步驟S102中根據(jù)第一職位集合來確定第一用戶 集合,并獲取第一用戶集合中用戶所申請過的所有職位,從而得到候選職位集合。
[0077] 本實施例中,該方法會在步驟S102中針對第一職位集合中的每一個職位,檢索申 請過該職位的用戶,通過整合便可W得到申請過第一職位集合中職位的所有用戶的集合, 從而得到第一用戶集合。
[0078] 對于第一用戶集合中的各個用戶,通過檢索該用戶所申請過的職位,通過整合也 就可W得到申請了第一職位集合中職位的用戶所申請過的職位,即候選職位集合。而候選 職位集合中的各個職位即為潛在的符合目標(biāo)用戶化期望的職位。本實施例中,對于目標(biāo)用 戶化,其候選職位集合可^表示為心/"':<|/心";,心/";;,...,/心";.},?表示候選職位集合所包含 的候選職位的總數(shù)。
[0079] 如果兩個不同用戶申請了同一職位,那么顯然運兩個用戶之間存在一定的相似 性。運可能是兩個用戶所學(xué)專業(yè)可能相同或相似,也可能是兩個用戶的工作精力相同或相 似,抑或是其他原因使得運兩個用戶能夠申請同一職位。而對于一個用戶所申請過的其他 職位,另一個用戶也很可能同樣能夠適應(yīng)該職位的要求。因此本實施例所提供的方法在確 定候選職位集合時,首先通過確定哪些用戶申請了目標(biāo)用戶化曾經(jīng)申請的職位,隨后統(tǒng)計 運些用戶所申請的職位集合,從而確定出候選職位集合。
[0080] 如圖1所示,當(dāng)?shù)玫胶蜻x職位集合后,該方法在步驟S103中根據(jù)第一職位集合 持CH滬分別計算目標(biāo)用戶化對候選職位集合Itemi中各個候選職位的初始偏好度。其中,目標(biāo) 用戶化對各個候選職位的偏好度能夠定量地反映出目標(biāo)用戶對各個候選職位的喜好程度。
[0081] 具體地,本實施例中,該方法在步驟S103中根據(jù)如下表式來計算目標(biāo)用戶化對各 個候選職位的初始偏好度:
[0082]
(1)
[00削其中,扔娜狀,々emp表示目標(biāo)用戶化對候選職位集合Itemi中第j個候選職位/似H', 的初始偏好度,心?,/心H;!)表示第一職位集合爲(wèi)姆滬中第1個職位與候選職位集合 Itemi中第j個候選職位的相似度。
[0084] 其中,兩個職位之間的相似度優(yōu)選地可W根據(jù)職位的基本職位信息來計算得到。 對于某一職位Item^來說,其職位信息可W表示為:
[0085]
(2)
[0086] 其中,Q表示職位信息包含參數(shù)的總數(shù)。
[0087] 而對于兩個職位11 emx和11 emy來說,運兩個職位之間的相似度S imJ (11 emx, 11 emy) 可W根據(jù)如下表達(dá)式計算得到:
[008引 (3) 12345 2 其中,q表示職位信息中所包含的第一類型參數(shù)的數(shù)量。 3 本實施例中,某一職位的職位信息中的第一類型參數(shù)表征對于相似度取值影響較 大的參數(shù),而第二類型參數(shù)表征相似度取值影響較小的參數(shù)。 4 本實施例中,各個職位的基本職位信息優(yōu)選地可W包括:所屬領(lǐng)域、學(xué)歷要求、職 位名稱、工作地點W及工作類型等5個參數(shù)。因此對于職位Item^來說,上述表達(dá)式(2)中的 參數(shù)Q的取值為5。而對于上述5個參數(shù)來說,所述領(lǐng)域和學(xué)歷要求對于相似度取值的影響較 大,運兩個參數(shù)屬于第一類型參數(shù);而其余參數(shù)對于相似度取值的影響較小,其屬于第二類 型參數(shù)。因此,本實施例中,表達(dá)式(4)中參數(shù)q的取值為2。 5 因此,本實施例中,兩個職位之間的相似度具體地可W根據(jù)如下表達(dá)式計算得到:
[0094] (5)
[0095]
[0096] 需要指出的是,在本發(fā)明的其他實施例中,各個職位的職位信息還可W包含其他 合理參數(shù),本發(fā)明不限于此。
[0097] 利用目標(biāo)用戶化對各個候選職位的初始偏好度雖然能夠在一定程度上達(dá)到向目 標(biāo)用戶推薦就業(yè)信息的目的,但是所推薦的就業(yè)信息往往與目標(biāo)用戶化的匹配程度不高。 為此,本實施例所提供的方法引入了額外的參數(shù)來對步驟S103中所得到的初始偏好程度的 取值進(jìn)行修正,從而改善最終得到的推薦職位的準(zhǔn)確度。
[0098] 如圖1所示,在得到目標(biāo)用戶化對各個候選職位的初始偏好度后,本方法在步驟 S104中利用職位權(quán)重和用戶權(quán)重來對各個候選職位的初始偏好度初始偏好度進(jìn)行修正,從 而得到目標(biāo)用戶對各個候選職位的修正偏好度。
[0099] 在得到各個候選職位的修正偏好度后,該方法便可W在步驟S105中根據(jù)各個候選 職位的修正偏好度生成推薦職位。具體地,本方法在步驟S105中根據(jù)各個候選職位的修正 偏好度的取值大小,按照取值由大到小的順序?qū)蜻x職位集合中的所有候選職位進(jìn)行排 序,并選取排位最為考前的預(yù)設(shè)數(shù)量的候選職位來作為推薦職位。
[0100] 本實施例中,根據(jù)如下表達(dá)式來計算目標(biāo)用戶對各個候選職位的修正偏好度:
[0101]
(7)
[010^ 其中,護(hù)句化/,,//('心,)表示目標(biāo)用戶化對候選職位集合1*61111中第^'個候選職位無《; 的修正偏好度,邸化和巧,,(化分別表示候選職位/tew',的職位權(quán)重和用戶權(quán)重。
[0103] 職位權(quán)重能夠反映目標(biāo)用戶歷史投遞職位自身的特征屬性,圖2示出了本實施例 中計算某一職位的職位權(quán)重的流程圖。
[0104] 如圖2所示,本實施例中,該方法在計算候選職位集合Itemi中各個職位的職位權(quán) 重時,首先在步驟S201中分別計算該候選職位與第一職位集合中個惡搞職位之間的相似 度,從而得到第一相似度集合。在得到第一相似度集合后,該方法在步驟S202中選取第一相 似度集合中的最大相似度,并根據(jù)最大相似度計算該候選職位的職位權(quán)重。
[0105] 該方法在步驟S201中計算某候選職位與第一職位集合中各個職位之間的相似度 時,其實現(xiàn)原理與實現(xiàn)過程如上表達(dá)式(5)和表達(dá)式(6)所設(shè)及的內(nèi)容類似,故在此不再寶 述。
[0106] 在得到該候選職位與第一職位集合中各個職位之間的相似度后,該方法在步驟 S202中根據(jù)如下表達(dá)式計算該候選職位的職位權(quán)重:
[0107]
(8)
[010引其中聲分別表示候選職位/fcw',的職位權(quán)重,曲)表示候選 職位與第一職位集合/化中第m個職位/ten('之間的相似度。
[0109]在計算用戶對職位可能的偏好程度時,與目標(biāo)用戶更相似的用戶對首選職位的偏 好權(quán)重值應(yīng)該更大。因此,在計算目標(biāo)用戶化對候選職位j的偏好度時,需要引入對申請 過候選職心的用戶與目標(biāo)用戶化之間相似度(即用戶相似度)的權(quán)重考量。
[0110] 具體地,如圖3所示,本實施例所提供的方法在計算候選職位的用戶權(quán)重時, 首先在步驟S301中獲取申請過候選職位的用戶集合,從而得到得第二用戶集合
[0111] 在步驟S302中,計算目標(biāo)用戶與第二用戶集合中各個用戶之間的用戶相似度。本 實施例中,兩個用戶之間的用戶相似度優(yōu)選地利用運兩個用戶之間的專業(yè)相似度和簡歷信 息相似度來計算。
[0112] "所學(xué)專業(yè)"運個屬性在求職過程中扮演著即為重要的角色,如果應(yīng)聘者所學(xué)專業(yè) 與職位需求不匹配,那么會大大降低用戶的求職成功率。而簡單地從字面角度來對用戶的 專業(yè)進(jìn)行分析,得出的專業(yè)相似度可靠性不高。本實施例所提供的方法通過分析發(fā)現(xiàn),同一 職位的申請者的專業(yè)分布相似度往往很高,因此本方法通過分析同一職位的申請專業(yè)分析 來挖掘?qū)I(yè)之間的相似度。
[0113] 如圖4所示,本實施例所提供的方法在計算兩個用戶之間的用戶相似度時,首先在 步驟S401中分別獲取運兩個用戶的專業(yè)信息,并根據(jù)專業(yè)信息計算運兩個用戶之間的專業(yè) 相似度。
[0114] 具體地,本方法通過計算兩個個專業(yè)之間的支持度和置信度來計算來兩個用戶之 間的專業(yè)相似度。其中,兩個專業(yè)之間的支持度可W根據(jù)下表達(dá)式計算得到:
[0115]
(9)
[0116]其中,S(ma,皿)表示專業(yè)化與專業(yè)皿之間的支持度,I * I表示集合*中元素的個數(shù), {人,|昨gM/。G。表示招聘時同時招聘了專業(yè)ma和專業(yè)郵的職位集合,In表示已 完成招聘的職位集合I中的第n個職位,表示職位In的受聘人員的專業(yè)集合。
[0117] 而在計算兩個專業(yè)之間的置信度時,本方法將分別計算專業(yè)ma到專業(yè)mb的置信度C (Hia^mb)和專業(yè)郵到專業(yè)ma的置信度C(mb^ma)。
[0118] 具體地,本實施例中,專業(yè)Hia到專業(yè)mb的置信度C(ma一mb)優(yōu)選地可W根據(jù)如下表 達(dá)式計算得到:
[0119] ( 10)
[0120] J可W根據(jù)如下表達(dá)式計算得到:
[0121] ClD
[012^ 其中,!/,,, K eM'%4巨巧表示招聘時招聘了專業(yè)m a的職位集合, !/,,, |"?6 € M/",/,,,€巧招聘時招聘了專業(yè)郵的職位集合,In表示已完成招聘的職位集合I中的 第n個職位,表示職位In的受聘人員的專業(yè)集合。
[0123] 在得到兩個專業(yè)之間的支持度和置信度后,兩個用戶之間的專業(yè)相似度simM(ma, mb)便可W根據(jù)如下表達(dá)式計算得到:
[0124]
C12)
[012引其中,simM(ma,mb)表示專業(yè)ma與專業(yè)mb之間的相似度,S(ma,mb)表示專業(yè)ma與專業(yè) mb之間的支持度,e表示預(yù)設(shè)支持度闊值,
[0126] 如圖4所示,在得到兩個用戶之間的專業(yè)相似度后,該方法將在步驟S402中分別獲 取運兩個用戶之間的簡歷信息,并根據(jù)所獲取的簡歷信息計算運兩個用戶之間的簡歷信息 相似度。
[0127] 本實施例中,該方法通過兩個用戶的簡歷信息中的特定參數(shù)來計算運兩個用戶的 簡歷信息相似度。具體地,兩個用戶之間的簡歷信息相似度優(yōu)選地可W根據(jù)下表達(dá)式計算 得到:
[012 引 (13)
[0129] (14)
[0130] 其中,simB(Ui,U。)表示用戶化與用戶U。之間的簡歷信息相似度,Or表示簡歷信息 中的第r個信息的權(quán)重^,S,u。)表示用戶化與用戶Ud的簡歷信息中的第r個信息和沒產(chǎn) 的相似度,R表示簡歷信息中所包含信息的總數(shù)。
[0131] 本實施例中,在計算兩個用戶之間的簡歷信息相似度時,優(yōu)選地從性別、學(xué)歷、地 區(qū)W及政治面貌化個方伸夾講行計算。閑此,h述表達(dá)式(13)和(14)便可W相應(yīng)地表示為:
[0132] (15) 1234567 (16,1 2 在得到兩個用戶之間的專業(yè)相似度和簡歷信息相似度后,該方法便可W在步驟 S403中根據(jù)專業(yè)相似度和簡歷信息相似度來計算出運兩個用戶之間的用戶相似度。 3 具體地,本實施例中,采用對專業(yè)相似度和簡歷信息相似度加權(quán)求和的方式來計 算兩個用戶之間的用戶相似度,即存在: 4
[0136]
(17) 5 其中,sim(Ui,U。)表示用戶化與用戶U。之間的用戶相似度,a和b分別表示專業(yè)相似 度和簡歷信息相似度的加權(quán)系數(shù)。本實施例中,加權(quán)系數(shù)a和b優(yōu)選地分別設(shè)定為0.6和0.4。 6 需要指出的是,在本發(fā)明的其他實施例中,在計算兩個用戶之間的用戶相似度的 過程中,還可W先計算運兩個用戶之間的簡歷信息相似度,再計算運兩個用戶之間的專業(yè) 相似度,即圖4中的步驟S401與步驟S402的執(zhí)行順序顛倒,本發(fā)明不限于此。 7 再次如圖3所示,在得到目標(biāo)用戶與第二用戶集合中各個用戶之間的用戶相似度 后,該方法在步驟S303中根據(jù)步驟S302中所得到的用戶相似度計算該候選職位的用戶權(quán) 重。
[0140] 旦化抽,假洗取仿的巧戶巧雷優(yōu)洗抽前LU巧據(jù)如下表達(dá)式計算得到;
[0141]
(18)
[01創(chuàng)其中,巧/ 表示候選職位i/em誠用戶權(quán)重,Sim(Ui,U。)表示用戶化與用戶U。之 間的用戶相似度,表示申請過候選職位雜的用戶集合。
[0143] 需要指出的是,在本法阿明的其他實施例中,還可W采用其他合理方式來計算各 個候選職位的用戶權(quán)重,本發(fā)明不限于此。
[0144] 需要指出的是,在本發(fā)明的其他實施例中,根據(jù)實際需要,還可W僅利用職位權(quán)重 或用戶權(quán)重來對各個候選職位的初始偏好度進(jìn)行修正,本發(fā)明不限于此。其中,當(dāng)僅利用職 位權(quán)重對各個候選職位的初始偏好度進(jìn)行修正時,各個候選職位的修正偏好度可W采用如 下表達(dá)式計算得到:
[0145]
(19)
[0146] 當(dāng)僅利用用戶權(quán)重對各個候選職位的初始偏好度進(jìn)行修正時,各個候選職位的修 正偏好度可W采用如下表達(dá)式計算得到:
[0147]
C2U;
[0148] 從上述描述中可W看出,本發(fā)明所提供的就業(yè)信息推薦方法在計算得到用戶對各 個候選職位的初始偏好度的基礎(chǔ)上,通過引入職位權(quán)重和用戶權(quán)重來對初始偏好度進(jìn)行修 正,并根據(jù)修正偏好度來生成推薦職位,運樣能夠使得得到最終得到的推薦職位與目標(biāo)用 戶更加匹配,從而提高了就業(yè)信息推薦的準(zhǔn)確性、有效性和可靠性。
[0149] 應(yīng)該理解的是,本發(fā)明所公開的實施例不限于運里所公開的特定處理步驟,而應(yīng) 當(dāng)延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的運些特征的等同替代。還應(yīng)當(dāng)理解的是,在此 使用的術(shù)語僅用于描述特定實施例的目的,而并不意味著限制。
[0150] 說明書中提到的"一個實施例"或"實施例"意指結(jié)合實施例描述的特定特征、結(jié)構(gòu) 或特性包括在本發(fā)明的至少一個實施例中。因此,說明書通篇各個地方出現(xiàn)的短語"一個實 施例"或"實施例"并不一定均指同一個實施例。
[0151] 雖然上述示例用于說明本發(fā)明在一個或多個應(yīng)用中的原理,但對于本領(lǐng)域的技術(shù) 人員來說,在不背離本發(fā)明的原理和思想的情況下,明顯可W在形式上、用法及實施的細(xì)節(jié) 上作各種修改而不用付出創(chuàng)造性勞動。因此,本發(fā)明由所附的權(quán)利要求書來限定。
【主權(quán)項】
1. 一種就業(yè)信息個性化推薦方法,其特征在于,所述方法包括: 候選職位集合生成步驟,根據(jù)目標(biāo)用戶的用戶信息確定所述目標(biāo)用戶申請過的職位集 合,得到第一職位集合,根據(jù)所述第一職位集合確定第一用戶集合,獲取所述第一用戶集合 中用戶所申請過的所有職位,得到候選職位集合; 用戶初始偏好度確定步驟,根據(jù)所述第一職位集合分別計算所述目標(biāo)用戶對所述候選 職位集合中各個候選職位的初始偏好度; 推薦職位生成步驟,利用職位權(quán)重和/或用戶權(quán)重對所述各個候選職位的初始偏好度 進(jìn)行修正,得到所述各個候選職位的修正偏好度,根據(jù)所述各個候選職位的修正偏好度生 成針對于所述目標(biāo)用戶的推薦職位。2. 如權(quán)利要求1所述的方法,其特征在于,根據(jù)如下表達(dá)式計算各個候選職位的修正偏 好度: PrcfXUi, Itcm1j) = prefo(U1, Iiem)) * ωπ (Item'.) , prefiLl·, Hem\) = prefo (U,, item)) * O1 {Item':) ρξ, PrcfiUi, Hem)) = prcfo(U1. Iiem',) * (O11 ) ^ (O1 ) 其中,/tem))和分別表示用戶Ui對候選職位集合11 ei^中第j個 候選職位的初始偏好度和修正偏好度,%(-<)和科分別表示候選職位※ 的職位權(quán)重和用戶權(quán)重。3. 如權(quán)利要求1或2所述的方法,其特征在于,在所述候選職位集合生成步驟中,統(tǒng)計申 請了所述第一職位集合中職位的用戶,得到所述第一用戶集合。4. 如權(quán)利要求1~3中任一項所述的方法,其特征在于,根據(jù)如下表達(dá)試計算各個候選 職位的初始偏好度:其中,([/,,/_))表示用戶山對候選職位集合Item1中第j個候選職位的初始偏 好度,K表不第一職位集合所包含的職位數(shù)量,表不第一職位集合/物汐 中第1個職位與候選職位集合Item1中第j個候選職位item)的相似度。5. 如權(quán)利要求1~4中任一項所述的方法,其特征在于,確定所述候選職位集合中各個 職位的職位權(quán)重的步驟包括: 分別計算所述候選職位集合中一職位與所述第一職位集合中各個職位之間的相似度, 得到第一相似度集合; 選取所述第一相似度集合中的最大相似度,根據(jù)所述最大相似度計算該職位的職位權(quán) 重。6. 如權(quán)利要求5所述的方法,其特征在于,根據(jù)如下表達(dá)式計算所述候選職位集合中各 個職位的職位權(quán)重:其中,%(/&;<)分別表示候選職位/fcm丨的職位權(quán)重,丨,/&<')表示候選職位 ife#與第一職位集合/tof中第m個職位之間的相似度。7. 如權(quán)利要求4~6中任一項所述的方法,其特征在于,根據(jù)如下表達(dá)式計算兩個職位 之間的相似度:其中,s i mJ (11 emx,11 emy)表示職位11 emx與職位11 emy之間的相似度,和jf?'分別 表示職位Itemx與職位Itemy的職位信息中第1個參數(shù),Q表示職位信息包含參數(shù)的總數(shù),q表 示職位信息中所包含的第一類型參數(shù)的數(shù)量。8. 如權(quán)利要求1~7中任一項所述的方法,其特征在于,確定所述候選職位集合中各個 候選職位的用戶權(quán)重的步驟包括: 對于所述候選職位集合中的任一候選職位,獲取申請過該候選職位的用戶集合,得到 第二用戶集合; 計算所述目標(biāo)用戶與第二用戶集合中各個用戶之間的用戶相似度,根據(jù)計算得到的用 戶相似度計算該候選職位的用戶權(quán)重。9. 如權(quán)利要求8所述的方法,其特征在于,根據(jù)如下表達(dá)計算所述候選職位集合中各個 仿的田盧切甫.其中,q )表示候選職位Zfemf的用戶權(quán)重,sim(Ui,U。)表示用戶U i與用戶U。之間的 用戶相似度,表示申請過候選職位的用戶集合。10. 如權(quán)利要求8或9所述的方法,其特征在于,計算兩個用戶之間的用戶相似度的步驟 包括: 分別獲取兩個用戶的專業(yè)信息,并根據(jù)所述專業(yè)信息計算這兩個用戶之間的專業(yè)相似 度; 分別獲取兩個用戶的簡歷信息,并根據(jù)所述簡歷信息計算這兩個用戶之間的簡歷信息 相似度; 根據(jù)所述專業(yè)相似度和簡歷信息相似度,計算這兩個用戶之間的用戶相似度。11. 如權(quán)利要求10所述的方法,其特征在于,根據(jù)如下表達(dá)式計算兩個用戶之間的用戶 相似麼,其中,SimOJi,U。)表示用戶Ui與用戶U。之間的用戶相似度,和SimBOJi, U。)分別表示用戶U1與用戶U。之間的專業(yè)相似度和簡歷信息相似度,a和b分別表示專業(yè)相似 度和簡歷信息相似度的加權(quán)系數(shù)。12. 如權(quán)利要求10或11所述的方法,其特征在于,根據(jù)如下表達(dá)式計算專業(yè)相似度:其中,simM(ma,mb)表不專業(yè)ma與專業(yè)mb之間的相似度,S(ma,mb)表不專業(yè)m a與專業(yè)mb之 間的支持度,ε表示預(yù)設(shè)支持度閾值,C(ma-mb)表示專業(yè)ma到專業(yè)mb的置信度,C (mb-ma)表 不專業(yè)mb到專業(yè)ma的置信度。13. 如權(quán)利要求12所述的方法,其特征在于,根據(jù)如下表達(dá)式計算兩個專業(yè)之間的支持 度:其中,S(ma,mb)表示專業(yè)ma與專業(yè)mb之間的支持度,I * I表示集合*中元素的個數(shù), {/" |mu e M'm, e/丨表示招聘時同時招聘了專業(yè)ma和專業(yè)mb的職位集合,I n表示已 完成招聘的職位集合I中的第η個職位,?表示職位In的受聘人員的專業(yè)集合。14. 如權(quán)利要求12或13所述的方法,其特征在于, 根據(jù)如下表達(dá)式計算置信度(Xma^mb):其中,1*1表示集合*中元素的個數(shù),財表示招聘時同時招聘 了專業(yè)ma和專業(yè)mb的職位集合,& e M S/," e /丨表示招聘時招聘了專業(yè)ma的職位集合, {4 e M'/," e /U召聘時招聘了專業(yè)mb的職位集合,In表示已完成招聘的職位集合I中的 第η個職位,表示職位In的受聘人員的專業(yè)集合。15. 如權(quán)利要求10~14中任一項所述的方法,其特征在于,根據(jù)如下表達(dá)計算兩個用戶 之間的簡歷信息相似度:其中,SimB(UllUc1)表示用戶仏與用戶U。之間的簡歷信息相似度,c〇r表示簡歷信息中的 第r個信息的權(quán)重,表示用戶山與用戶U。的簡歷信息中的第r個信息的相似度,R 表示簡歷信息中所包含信息的總數(shù)。16. 如權(quán)利要求1~15中任一項所述的方法,其特征在于,在所述推薦職位生成步驟中, 將修正偏好度最高的預(yù)設(shè)數(shù)量的候選職位作為推薦職位。
【文檔編號】G06Q10/10GK106022723SQ201610334570
【公開日】2016年10月12日
【申請日】2016年5月19日
【發(fā)明人】李晨, 楊成, 張迎亞, 易芃
【申請人】中國傳媒大學(xué)