两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種信息匹配度的確定方法及系統(tǒng)與流程

文檔序號:11323299閱讀:675來源:國知局
一種信息匹配度的確定方法及系統(tǒng)與流程

本發(fā)明屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種信息匹配度的確定方法及系統(tǒng),尤其涉及一種基于大數(shù)據(jù)分析的企業(yè)文化匹配度評定方法及系統(tǒng)。



背景技術(shù):

企業(yè)文化是企業(yè)在長期的經(jīng)營活動中所形成的共同價值觀念、行為準則、道德規(guī)范,以及體現(xiàn)這些企業(yè)精神的人際關(guān)系、規(guī)章制度、辦公場所、產(chǎn)品與服務(wù)等事項和物質(zhì)因素的集合。二十一世紀是文化管理時代,是文化致富時代。企業(yè)文化的重要性將是企業(yè)的核心競爭力所在,是企業(yè)管理最重要的內(nèi)容。擁有了自己的文化,才能使企業(yè)具有生命的活力,具有真正意義上人格的象征。

企業(yè)文化的凝聚力能通過建立共同的價值觀念、企業(yè)目標,把員工凝聚在企業(yè)周圍,企業(yè)文化的重要性使員工具有使命感和責(zé)任感,自覺地把自己的智慧和力量匯聚到企業(yè)的整體目標上,把個人的行為統(tǒng)一于企業(yè)行為的共同方向上,從而凝結(jié)成推動企業(yè)發(fā)展的巨大動力。

隨著現(xiàn)代企業(yè)管理方法的發(fā)展,越來越多的企業(yè)開始注重企業(yè)文化建設(shè),并漸漸將企業(yè)文化認同加入到招聘環(huán)節(jié)中,甚至將企業(yè)文化作為能否入職的一項必要因素。同時,隨著越來越個性的90后等新生代職場力量的涌入,更多的求職者也不再單單只是考察企業(yè)的薪資一項指標,而更多的開始關(guān)注企業(yè)氛圍、地理位置、辦公環(huán)境等其他一系列軟性條件。無論是企業(yè)還是求職者,都開始越來越重視企業(yè)的文化和氛圍。

在互聯(lián)網(wǎng)高速發(fā)展的今天,大量的企業(yè)也處于高速發(fā)展期,企業(yè)的規(guī)模不斷膨脹,而如何將原始小團隊的核心價值觀融入到企業(yè)文化中,使企業(yè)不會由于外部不同文化新個體的加入而稀釋企業(yè)的原有文化,成為人力資源中亟待解決的問題。

招聘作為企業(yè)人才甄選的第一道關(guān)卡,如何識別候選人符合公司的文化,尋找能在公司中能夠持續(xù)穩(wěn)定地貢獻力量的潛在候選人,成為招聘專員的一項重要工作職責(zé)。對于候選人與企業(yè)文化的匹配度,目前很大程度還是依賴面試環(huán)節(jié)中招聘專員的主觀判斷,而面試環(huán)節(jié)往往耗時耗力,且主觀因素較重,需要招聘專員對企業(yè)文化有深度的把握,并具有甄別人選的經(jīng)驗和技能,不可控因素較大,且無法批量復(fù)制。

很多企業(yè)都存在各項評定很優(yōu)秀的候選人,也通過了層層面試,但由于與企業(yè)價值觀不符,而被迫淘汰的情況。根據(jù)歷史經(jīng)驗,這類人員即使勉強進入公司,由于與公司的目標和價值理念有較大偏差,其離職率一般也較高,平均在崗時間不到一年就會離開,給企業(yè)帶來更大的損失(如:培訓(xùn)成本、未選用正確的人而喪失的機會成本等)。

在幾年前大數(shù)據(jù)技術(shù)尚未成熟時,通過計算機分析簡歷數(shù)據(jù)還極其復(fù)雜和繁瑣。首先,簡歷中僅有部分純結(jié)構(gòu)化的字段,大量的是文字性的自然語言描述,計算機無法有效提取其中有價值的信息;其次,簡歷中可提取的特征項多達上百項,進行向量運算時則達到上千緯度,再加上動輒幾百萬的數(shù)據(jù)樣本,要分析的矩陣是極其龐大的,以原有的機器速度和軟件結(jié)構(gòu)難于支持如何龐大的數(shù)據(jù)分析,即使能夠分析,其時效性也難于保障。

隨著大數(shù)據(jù)技術(shù)、機器學(xué)習(xí)算法和自然語言處理技術(shù)的發(fā)展,分析海量數(shù)據(jù)成為可能,而簡歷中的數(shù)據(jù)價值也在不斷被挖掘,使我們可以通過大數(shù)據(jù)分析的技術(shù)手段來識別候選人是否符合企業(yè)文化。

可見,現(xiàn)有技術(shù)中,存在人工勞動量大、可靠性低和精準性差等缺陷。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的在于,針對上述缺陷,提供一種信息匹配度的確定方法及系統(tǒng),以解決現(xiàn)有技術(shù)中大量數(shù)據(jù)需要人工處理導(dǎo)致處理結(jié)果可靠性低的問題,達到提升可靠性的效果。

本發(fā)明提供一種信息匹配度的確定方法,包括:基于所述信息所屬單元,提取所屬單元下的單元樣本,根據(jù)預(yù)設(shè)條件進行篩選、權(quán)重分配,得到與預(yù)設(shè)條件適配的所述單元樣本的篩選結(jié)果;對所述篩選結(jié)果進行數(shù)據(jù)加工、數(shù)據(jù)降噪,得到所述單元樣本的數(shù)據(jù)矩陣;對所述數(shù)據(jù)矩陣運用相應(yīng)建模算法,得到與所屬單元適配的單元模型;基于所述單元模型,對所述單元樣本進行計算,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配結(jié)果。

可選地,基于所述信息所屬單元,提取所屬單元下的單元樣本,根據(jù)預(yù)設(shè)條件進行篩選、權(quán)重分配,得到與預(yù)設(shè)條件適配的所述單元樣本的篩選結(jié)果,包括:加載所述單元中與所述信息適配的所有子信息;基于所屬單元模型的預(yù)設(shè)條件進行篩選,得到與預(yù)設(shè)條件適配的篩選結(jié)果;按預(yù)設(shè)類別,對所述所有子信息進行分類,得到包含多類信息的分類結(jié)果;提取所屬單元下,符合預(yù)設(shè)標準的關(guān)鍵單元樣本特征,得到關(guān)鍵單元樣本特征集合;將所屬單元下的每個所述單元樣本與預(yù)設(shè)標準對比,得到每個所述單元樣本的所述標準權(quán)重;基于評測方法,得到所述單元樣本的附加特征屬性的評測模型。

可選地,對所述篩選結(jié)果進行數(shù)據(jù)加工、數(shù)據(jù)降噪,得到所述單元樣本的數(shù)據(jù)矩陣,包括:根據(jù)所述預(yù)設(shè)條件,對所述單元模型中的所有子信息進行樣本分組;計算并得到所述單元中提取的單元樣本數(shù)據(jù)類中心特征;對于每類信息,通過聚類處理和密度估計處理,得到所述每類信息在所述單元中的分類情況;在將所述分類情況、以及與所述分類情況適配的所述分析結(jié)果進行建模之前,通過聚類等處理剝離所述每類情況中的噪聲;其中,所述聚類處理,包括:通過k-means、cure的至少一種聚類算法進行處理。

可選地,根據(jù)預(yù)設(shè)條件進行篩選、權(quán)重分配,包括:基于降維算法處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述關(guān)鍵單元樣本的關(guān)鍵特征信息;其中,所述降維算法處理,包括:通過主成分分析法pca、奇異值分解法svd等的至少一種降維算法進行處理;基于概率模型處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述單元樣本的單元數(shù)據(jù)模型;其中,所述概率模型處理,包括:通過樸素貝葉斯、adaboost等的至少一種概率模型進行處理;將所述分組情況、以及與所述分組情況適配的所述單元模型進行映射,構(gòu)建與所述預(yù)設(shè)特征適配的所述單元模型。。

可選地,基于所述單元模型,對所述單元樣本進行計算,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配結(jié)果,包括:基于相似度算法,得到所述單元樣本與所述關(guān)鍵單元樣本的所述關(guān)鍵特征信息的相似度評分;基于所述單元模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配概率值;基于所述相似度評分及所述評測模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配評定結(jié)果。

與上述方法相匹配,本發(fā)明另一方面提供一種信息匹配度的確定系統(tǒng),包括:基于所述信息所屬單元,提取所屬單元下的單元樣本,根據(jù)預(yù)設(shè)條件進行篩選、權(quán)重分配,得到與預(yù)設(shè)條件適配的所述單元樣本的篩選結(jié)果;對所述篩選結(jié)果進行數(shù)據(jù)加工、數(shù)據(jù)降噪,得到所述單元樣本的數(shù)據(jù)矩陣;對所述數(shù)據(jù)矩陣運用相應(yīng)建模算法,得到與所屬單元適配的單元模型;基于所述單元模型,對所述單元樣本進行計算,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配結(jié)果。

可選地,所述樣本加工單元,包括:加載模塊,用于加載所述單元中與所述信息適配的所有子信息;篩選模塊,用于基于所屬單元模型的預(yù)設(shè)條件進行篩選,得到與預(yù)設(shè)條件適配的篩選結(jié)果;信息分類模塊,用于按預(yù)設(shè)類別,對所述所有子信息進行分類,得到包含多類信息的分類結(jié)果;特征提取模塊,用于提取所屬單元下,符合預(yù)設(shè)標準的關(guān)鍵單元樣本特征,得到關(guān)鍵單元樣本特征集合;權(quán)重處理模塊,用于將所屬單元下的每個所述單元樣本與預(yù)設(shè)標準對比,得到每個所述單元樣本的所述標準權(quán)重;評測模塊,用于基于評測方法,得到所述單元樣本的附加特征屬性的評測模型。

可選地,所述數(shù)據(jù)處理單元,包括:樣本分組模塊,用于根據(jù)所述預(yù)設(shè)條件,對所述單元模型中的所有子信息進行樣本分組;數(shù)據(jù)計算模塊,用于計算并得到所述單元中提取的單元樣本數(shù)據(jù)類中心特征;數(shù)據(jù)分組模塊,用于對于每類信息,通過聚類處理和密度估計處理,得到所述每類信息在所述單元中的分類情況;數(shù)據(jù)降噪模塊,用于在將所述分類情況、以及與所述分類情況適配的所述分析結(jié)果進行建模之前,通過聚類等處理剝離所述每類情況中的噪聲;其中,所述聚類處理,包括:通過k-means、cure的至少一種聚類算法進行處理。

可選地,所述建模單元,包括:關(guān)鍵特征提取模塊,用于基于降維算法處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述關(guān)鍵單元樣本的關(guān)鍵特征信息;其中,所述降維算法處理,包括:通過主成分分析法pca、奇異值分解法svd等的至少一種降維算法進行處理;概率模型建模模塊,用于基于概率模型處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述單元樣本的單元數(shù)據(jù)模型;其中,所述概率模型處理,包括:通過樸素貝葉斯、adaboost等的至少一種概率模型進行處理;映射模塊,用于將所述分組情況、以及與所述分組情況適配的所述單元模型進行映射,構(gòu)建與所述預(yù)設(shè)特征適配的所述單元模型。

可選地,所述結(jié)果分析單元,還包括:相似度計算模塊,用于基于相似度算法,得到所述單元樣本與所述關(guān)鍵單元樣本的所述關(guān)鍵特征信息的相似度評分;概率計算模塊,用于基于所述單元模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配概率值;結(jié)果評定模塊,用于基于所述相似度評分及所述評測模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配評定結(jié)果。

由此,本發(fā)明的方案,通過對大數(shù)據(jù)進行分析,并對分析所得信息的匹配度進行確定,解決現(xiàn)有技術(shù)中大量數(shù)據(jù)需要人工處理導(dǎo)致處理結(jié)果可靠性低的問題,從而,克服現(xiàn)有技術(shù)中人工勞動量大、可靠性低和精準性差的缺陷,實現(xiàn)人工勞動量小、可靠性高和精準性好的有益效果。

本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。

下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。

附圖說明

圖1為本發(fā)明的信息匹配度的確定方法的一實施例的流程示意圖;

圖2為本發(fā)明的信息匹配度的確定方法的一實施例的企業(yè)文化匹配度數(shù)據(jù)建模流程示意圖;

圖3為本發(fā)明的信息匹配度的確定系統(tǒng)的一實施例的結(jié)構(gòu)示意圖。

結(jié)合附圖,本發(fā)明實施例中附圖標記如下:

102-樣本加工單元;1022-加載模塊;1024-篩選模塊;1026-信息分類模塊;1028-特征提取模塊;1030-權(quán)重處理模塊;1032-評測模塊。

104-數(shù)據(jù)處理單元;1042-樣本分組模塊;1044-數(shù)據(jù)計算模塊;1046-數(shù)據(jù)分組模塊;1048-數(shù)據(jù)降噪模塊。

106-建模單元;1062-關(guān)鍵特征提取模塊;1064-概率模型建模模塊;1066-映射模塊。

108-結(jié)果分析單元;1082-相似度計算模塊;1084-概率計算模塊;1086-結(jié)果評定模塊。

具體實施方式

為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明具體實施例及相應(yīng)的附圖對本發(fā)明技術(shù)方案進行清楚、完整地描述。顯然,所描述的實施例僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

根據(jù)本發(fā)明的實施例,提供了一種信息匹配度的確定方法。參見圖1所示本發(fā)明的方法的一實施例的流程示意圖。該信息匹配度的確定方法可以包括:

在步驟s110處,基于所述信息所屬單元,提取所屬單元下的單元樣本,根據(jù)預(yù)設(shè)條件進行篩選、權(quán)重分配,得到與預(yù)設(shè)條件適配的所述單元樣本的篩選結(jié)果。

在一個可選例子中,步驟s110中進行樣本加工,可以包括:

(1)加載所述單元中與所述信息適配的所有子信息。

(2)基于所屬單元模型的預(yù)設(shè)條件進行篩選,得到與預(yù)設(shè)條件適配的篩選結(jié)果。

(3)按預(yù)設(shè)類別,對所述所有子信息進行分類,得到包含多類信息的分類結(jié)果。

(4)提取所屬單元下,符合預(yù)設(shè)標準的關(guān)鍵單元樣本特征,得到關(guān)鍵單元樣本特征集合。

(5)將所屬單元下的每個所述單元樣本與預(yù)設(shè)標準對比,得到每個所述單元樣本的所述標準權(quán)重。

(6)基于評測方法,得到所述單元樣本的附加特征屬性的評測模型。

在步驟s120處,對所述篩選結(jié)果進行數(shù)據(jù)加工、數(shù)據(jù)降噪,得到所述單元樣本的數(shù)據(jù)矩陣。

在一個可選例子中,步驟s120中進行數(shù)據(jù)處理,可以包括:

(1)根據(jù)所述預(yù)設(shè)條件,對所述單元模型中的所有子信息進行樣本分組。

(2)計算并得到所述單元中提取的單元樣本數(shù)據(jù)類中心特征。

(3)對于每類信息,通過聚類處理和密度估計處理,得到所述每類信息在所述單元中的分類情況。

(4)在將所述分類情況、以及與所述分類情況適配的所述分析結(jié)果進行建模之前,通過聚類等處理剝離所述每類情況中的噪聲。

可選地,所述聚類處理,可以包括:通過k-means、cure的至少一種聚類算法進行處理。

在步驟s130處,對所述數(shù)據(jù)矩陣運用相應(yīng)建模算法,得到與所屬單元適配的單元模型。

在一個可選例子中,步驟s130中進行數(shù)據(jù)建模,可以包括:

(1)基于降維算法處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述關(guān)鍵單元樣本的關(guān)鍵特征信息。

可選地,所述降維算法處理,可以包括:通過主成分分析法pca、奇異值分解法svd等的至少一種降維算法進行處理。

(2)基于概率模型處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述單元樣本的單元數(shù)據(jù)模型。

可選地,所述概率模型處理,可以包括:通過樸素貝葉斯、adaboost等的至少一種概率模型進行處理。

(3)將所述分組情況、以及與所述分組情況適配的所述單元模型進行映射,構(gòu)建與所述預(yù)設(shè)特征適配的所述單元模型。

在步驟s140處,基于所述單元模型,對所述單元樣本進行計算,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配結(jié)果。

在一個可選例子中,步驟s140中進行結(jié)果分析,可以包括:

(1)基于相似度算法,得到所述單元樣本與所述關(guān)鍵單元樣本的所述關(guān)鍵特征信息的相似度評分。

(2)基于所述單元模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配概率值。

(3)基于所述相似度評分及所述評測模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配評定結(jié)果。

在一個可選具體例子中,本實施例的技術(shù)方案,可以應(yīng)用于大數(shù)據(jù)技術(shù)和hr招聘領(lǐng)域范疇。

例如:可以作為一種企業(yè)文化匹配度評定的方法和系統(tǒng),主要應(yīng)用于企業(yè)招聘環(huán)節(jié)的人才篩選、基于海量數(shù)據(jù)的人才推薦等,為企業(yè)文化的匹配提供一種量化的評定方法。

例如:可以利用個人特征,推演群體特征,進而構(gòu)建企業(yè)文化的數(shù)據(jù)模型;從而實現(xiàn)企業(yè)文化匹配度的量化評定,為招聘環(huán)節(jié)的企業(yè)文化匹配提供數(shù)據(jù)支撐,輔助決策,提高招聘效率。

例如:通過大數(shù)據(jù)分析方法為企業(yè)篩選出符合本企業(yè)文化的求職者,為人員篩選提供數(shù)據(jù)支撐,提高招聘效率。主要可應(yīng)用于:企業(yè)招聘環(huán)節(jié)的人才篩選、基于海量數(shù)據(jù)的人才推薦、企業(yè)人員流失預(yù)測等。

在一個可選具體例子中,本實施例的技術(shù)方案,應(yīng)用于企業(yè)文化匹配度的評價時,具體可以包括以下幾個方面:

㈠基本假設(shè)

俗話說物以類聚、人以群分,企業(yè)是由人組成的,是具有共同目的的人的聚合體,而企業(yè)文化的特征,很大程度是反映了企業(yè)中職工的共同特征,尤其是其中的資深員工,對企業(yè)的認同度和契合度很高,那么與這一類人具有相似特征的求職者則更容易符合企業(yè)的文化和氛圍,也更容易進入這家公司(排除崗位需求因素)。

我們通常所說的門當戶對其實也是這個道理通常所說的門當戶對其實也是這個道理,有相似成長經(jīng)歷及環(huán)境的人,人生觀價值觀更容易契合,否則即使一時因某種機緣能在一起,長期來看,由于價值觀的差距,對事物不同的認同態(tài)度會使這種摩擦和矛盾加劇,很難長久地走下去。對于企業(yè)也是一樣的道理。

這里我們所說的企業(yè)文化是包括企業(yè)價值觀、氛圍、愿景、理念、對待員工的態(tài)度等等一系列軟性東西的統(tǒng)稱。而精神層面的東西,一般難于量化分析,甚至可能其中的員工自己也說不清楚。

而我們要度量的企業(yè)文化,是企業(yè)真正所具有的特性,可能是隱含的企業(yè)文化,而非宣揚的企業(yè)文化(如:口號、愿景等)。如:有的企業(yè)號稱是互聯(lián)網(wǎng)企業(yè),一切以快速高效為目標,但實際內(nèi)部管理官僚,辦公室政治嚴重。而想找互聯(lián)網(wǎng)企業(yè)的求職者進入這家公司,1~2個月內(nèi)就會流失掉,因為實際的企業(yè)氛圍與號稱的企業(yè)氛圍差異太大,對企業(yè)和員工都造成不必要的損失。例如:企業(yè)外部吸引的都是不契合的人,企業(yè)處于長期新入員工的大量流動,根本無法實現(xiàn)招收新員工帶來的效率提升,同時需要老員工花費額外的時間對新員工培訓(xùn)、交接等,降低了企業(yè)的整體工作產(chǎn)出。而求職者則花費了幾個月的時間才發(fā)現(xiàn)崗位并不合適,浪費了職業(yè)生涯的寶貴時間,甚至?xí)o求職者打上不穩(wěn)定人員的標簽)

那么如何去描述一個企業(yè)中所有職工的共同特征呢?對于人來說,每個個體價值觀的形成有很多因素,但主要集中在出生地、所受教育、成長經(jīng)歷、社會階層、周圍環(huán)境、工作地點等等,而這些信息大部分是可以從個人的簡歷中進行提取和挖掘的,簡歷是個人成長的一個縮影,我們可以通過簡歷的特征工程來細化職場人的畫像,并將人的畫像向量化,便于后續(xù)進行算法計算。

㈡員工權(quán)重分配

首先,選擇一家企業(yè),對所述數(shù)據(jù)矩陣運用相應(yīng)建模算法,得到與所屬單元適配的單元模型,即根據(jù)樣本庫中各個簡歷中描述的過往工作經(jīng)歷,將曾在該企業(yè)中任職過或還在留任人員的簡歷篩選出來,并進行權(quán)重分配,分配規(guī)則如下:

企業(yè)中,任職時間低于1年的,說明企業(yè)認同度較低,可以從正樣本中去除或加入負樣本。對于負樣本,由于其產(chǎn)生的原因復(fù)雜,可以是某幾個方面不匹配的組合,直接分析的價值并不是太大,所以后續(xù)分析以正樣本分析為主。

在企業(yè)中任職超過1年,低于5年的,可以認為是企業(yè)的主要力量,并有足夠的企業(yè)價值認同,可按照在職工齡標定權(quán)重。

在企業(yè)中任職超過5年的,企業(yè)的價值觀認同度較高,可適當增大權(quán)重。如果超過5年,且職位屬于中高級以上職位的(如總監(jiān)等),這類人群往往是企業(yè)文化的傳播者,有著更高的權(quán)重,計算權(quán)重可翻倍。而任職超過5年,且職位還處于初中級別的,往往屬于老黃牛型員工,可根據(jù)企業(yè)倡導(dǎo)的價值觀,適當調(diào)整權(quán)重比例(如:創(chuàng)新型企業(yè)需要降低這類人的權(quán)重,經(jīng)營類企業(yè)可能需要增加權(quán)重)。

㈢企業(yè)結(jié)構(gòu)分析

中型企業(yè)一般規(guī)模在100~500人左右,是較好的分析樣本,通過歷史簡歷的分析,可較好的識別出曾在該企業(yè)中任職的人員,一般有足夠的分析樣本。

由于企業(yè)中可能會有部分因特殊原因而一直留任的人員,這些人員在個體上可能不符合整體的企業(yè)文化,可以通過k-means、cure等聚類算法盡量剝離這類噪聲人員,減少特殊樣本所產(chǎn)生的噪聲,降低這類人員對企業(yè)整體建模的影響。

大型企業(yè)(500人以上)平均規(guī)模大致都在上千人左右,人員構(gòu)成相對復(fù)雜,各個部門內(nèi)部氛圍可能差異較大,僅根據(jù)整體分類,模型會產(chǎn)生較大偏差,一般需要根據(jù)部門不同進行分類。如,大型制造企業(yè),其中有藍領(lǐng)工人,也有白領(lǐng)管理人員,各人群的匯聚因素原因和所具有的特質(zhì)也不同,因此可以先按部門進行人員劃分,然后應(yīng)用聚類、密度估計等算法,查看在公司中群體的分類情況,然后再在不同分類中對簡歷進行分析建模,最后將分類與部門進行映射,構(gòu)建不同部門的內(nèi)部文化氛圍模型,供求職者應(yīng)聘不同部門崗位時進行匹配度預(yù)測。

跨國企業(yè)情況更為復(fù)雜,除部門、地域因素外,還與所在國家的文化差異有很大的影響。與大型企業(yè)處理類似,只是除從部門分類外,還應(yīng)引入國家、地域等分類要素,應(yīng)用聚類、密度估計等算法進行分組分類后,將分類與部門、國家、地域等進行映射。

需要注意,對于具有多重屬性的企業(yè)(如:一家企業(yè)涉及制造業(yè)、泛娛樂業(yè)、地產(chǎn)、零售業(yè)等多行業(yè)領(lǐng)域),需要分塊進行分析處理。

小微企業(yè)、創(chuàng)業(yè)企業(yè)人數(shù)一般都較少,一般少于50人,這類企業(yè)由于樣本數(shù)量有限,很難直接量化分析其中職員的情況(偏差較大)。但這類企業(yè)的企業(yè)文化其實是由公司的創(chuàng)始人或ceo決定的,其組建團隊(尤其是高管團隊)時,一般選擇有相同價值觀而能力互補的人,所以小微企業(yè)的文化是由創(chuàng)始人的特質(zhì)決定的,也是企業(yè)的基因。但單獨個體特征的提取其實無法斷定主要的決定因素是什么,需要配合評測方法(如性格評測:mbti、disc)等輔助手段,進行評估。

成長型企業(yè),規(guī)模在50~100人左右,相對小微或創(chuàng)業(yè)企業(yè)有一定的人員數(shù)據(jù)積累,但數(shù)據(jù)量相對中型企業(yè)還是不足??梢圆捎门c小微或創(chuàng)業(yè)企業(yè)類似的方法,配合評測方法等輔助手段進行評估。區(qū)別在于不是僅僅評估創(chuàng)始人或ceo,而是評估所有高管團隊的特性,然后取均值(類中心)構(gòu)建模型。

㈣技術(shù)處理流程

本發(fā)明的技術(shù)處理流程可參見圖2所示的例子,具體處理流程可以包括:

s01:首先對簡歷庫進行特征工程,構(gòu)建、選擇、提取簡歷特征。

s02:選擇一家企業(yè),提取與該企業(yè)相關(guān)的所有簡歷(在職及歷史上曾任職的人)。

s03:根據(jù)企業(yè)性質(zhì)、規(guī)模判斷企業(yè)所屬的類別,主要分5種情況進行處理:小于50人的小微和創(chuàng)業(yè)企業(yè)(p1)、50~100人的成長型企業(yè)(p2)、100~500人的中型企業(yè)(p3)、500人以上的大型企業(yè)(p4)、跨國企業(yè)(p5)。

在一個可選例子中,對于p1小微和創(chuàng)業(yè)企業(yè),執(zhí)行s04→s07→s13→s16→s18步驟:

s04:提取企業(yè)的創(chuàng)始人或ceo簡歷。

s07:由于樣本有限,需要配合評測方法(如性格評測:mbti、disc)等輔助手段,增加樣本的特征。

s13:應(yīng)用降維算法(如:主成分分析法pca、奇異值分解法svd)降低特征數(shù)量,提取有效的關(guān)鍵特征。

s16:計算目標簡歷與樣本相似度(如:閔氏距離等),作為一項企業(yè)文化匹配度依據(jù)。

s18:結(jié)合評測的相關(guān)算法(如:性格互補、個性配合等)綜合評定人員的企業(yè)文化匹配度。

在一個可選例子中,對于p2成長型企業(yè),執(zhí)行s05→s07→s10→s13→s16→s18步驟:

s05:提取企業(yè)的高管團隊簡歷。

s07:同p1的s07步驟,對于小樣本,需要配合評測方法等輔助手段,增加樣本的特征。

s10:利用算法計算高管團隊簡歷矩陣的類中心,降低個體差異對整體的影響。也可根據(jù)情況,在s13降維之后進行計算。

s13:應(yīng)用降維算法提取有效的關(guān)鍵特征。

s16:計算目標簡歷與樣本相似度,作為一項企業(yè)文化匹配度依據(jù)。

s18:結(jié)合評測的相關(guān)算法綜合評定人員的企業(yè)文化匹配度。

在一個可選例子中,對于p3中型企業(yè),執(zhí)行s06→s07(可選)→s12→s14→s17步驟:

s06:根據(jù)在職工齡計算該企業(yè)中人員簡歷的權(quán)重,權(quán)重參考樣表如下,可根據(jù)不同企業(yè)情況進行權(quán)重或權(quán)重乘積系數(shù)調(diào)整:

s07(可選):如果企業(yè)條件許可,可以在企業(yè)內(nèi)分發(fā)評測試卷,配合評測方法等輔助手段,增加樣本的特征,提高結(jié)果準確度。

s12:通過聚類算法(如:k-means、cure等)盡量剝離樣本中的噪聲簡歷,降低特殊噪聲對企業(yè)整體建模的影響。

s14:對簡歷集應(yīng)用樸素貝葉斯、adaboost等算法建模。

s17:相應(yīng)模型,計算目標簡歷企業(yè)文化的匹配度(符合正樣本的概率)。

在一個可選例子中,對于p4大型企業(yè),執(zhí)行s06→s07(可選)→s08→s11→s12→s14→s15→s17步驟:

s06:根據(jù)在職工齡計算該企業(yè)中人員簡歷的權(quán)重,具體參考p3中型企業(yè)中s06步驟的處理。

s07(可選):可以在企業(yè)內(nèi)配合評測方法等輔助手段,增加樣本的特征,提高結(jié)果準確度。

s08:將簡歷按照最后在職的所在部門進行分組。

s11:應(yīng)用聚類、密度估計等算法,對簡歷進行分類分組,合并相似部門。

s12:在每個分組內(nèi),通過聚類算法剝離噪聲簡歷。

s14:對每個分組簡歷集應(yīng)用樸素貝葉斯、adaboost等算法建模。

s15:將每個分組模型與部門分組進行映射。

s17:根據(jù)目標簡歷應(yīng)聘的部門,應(yīng)用相應(yīng)的模型,計算目標簡歷與企業(yè)文化的匹配度(概率)。

在一個可選例子中,對于p5跨國企業(yè),執(zhí)行s06→s07(可選)→s09→s11→s12→s14→s15→s17步驟:

s06:根據(jù)在職工齡計算該企業(yè)中人員簡歷的權(quán)重,具體參考p3中型企業(yè)中s06步驟的處理。

s07(可選):可以在企業(yè)內(nèi)配合評測方法等輔助手段,增加樣本的特征,提高結(jié)果準確度。

s09:將簡歷按照最后在職的國家、地域、部門等特性進行分組。

s11:應(yīng)用聚類、密度估計等算法,對簡歷進行分類分組,合并相似分組。

s12:在每個分組內(nèi),通過聚類算法剝離噪聲簡歷。

s14:對每個分組簡歷集應(yīng)用樸素貝葉斯、adaboost等算法建模。

s15:將每個分組模型與國家、地域、部門等分組特性進行映射。

s17:根據(jù)目標簡歷應(yīng)聘的國家、地域、部門等,應(yīng)用相應(yīng)的模型,計算目標簡歷與企業(yè)文化的匹配度(概率)。

㈤應(yīng)用方式

建模之后,可以計算投遞簡歷的求職者符合企業(yè)文化的概率,判斷求職者與企業(yè)文化的潛在匹配度。若屬于正常范圍,如:60%以上,則可以按正常流程安排面試等,若求職者與企業(yè)文化不符的概率較大,如:30%以下,可將hr環(huán)節(jié)前置,先由hr通過面試判斷求職者是否符合企業(yè)文化,若不符則可以直接拒絕掉,避免后續(xù)面試環(huán)節(jié)不必要的耗費,從而整體上節(jié)省企業(yè)面試開銷。(具體情況可根據(jù)企業(yè)情況進行建模測算,本處不在贅述。)

除面試環(huán)節(jié)的應(yīng)用外,還可在簡歷庫中批量測算符合企業(yè)文化的潛在候選人,再結(jié)合jd篩選的其他技術(shù),從而快速找到符合企業(yè)要求的人選,進行人才的推薦。

對于企業(yè)中的員工,也可以應(yīng)用模型,計算在職人員的企業(yè)文化認可度,從而發(fā)現(xiàn)潛在問題,改進企業(yè)管理方式或預(yù)測人員流失。

同時,推演的企業(yè)模型還可反作用于個人簡歷之上,根據(jù)個人經(jīng)歷情況,對供職過的企業(yè)賦予不同權(quán)重,進而將企業(yè)特性標簽附加于個人簡歷之上,增加簡歷特征,完善人物畫像。

綜述,本發(fā)明是利用個人特征,推演群體特征,進而構(gòu)建企業(yè)文化數(shù)據(jù)模型的一種方法。對小微企業(yè)、創(chuàng)業(yè)企業(yè)、成長型企業(yè),通過抓取核心成員的特性,計算目標簡歷與樣本簡歷的相似度,來預(yù)測與企業(yè)文化匹配的概率,同時還需要結(jié)合評測方法提高準確率。對于中型以上企業(yè),則是通過先分組,然后在相似分組內(nèi)應(yīng)用概率模型計算目標簡歷與該分組的匹配概率,預(yù)測與企業(yè)文化匹配的程度(概率)。

但對于小樣本的數(shù)據(jù)處理方式還有待繼續(xù)改進,由于可參考數(shù)據(jù)有限,其必須借助評測等手段才能達到基本可用的準確率,而采取評測手段的成本相對較高,量化效益并不太好。后續(xù)可以考慮將相似小微企業(yè)進行分組處理,從而增加樣本數(shù)量,提供準確率。

㈥實施例子

以某a企業(yè)為例,具體實施步驟如下:

首先對簡歷庫進行特征工程,提取簡歷特征23項,向量化之后約5000+維提取a企業(yè)還在職的簡歷及曾在a企業(yè)任職的簡歷提取的簡歷數(shù)量為458份,目前在職簡歷207份,a企業(yè)規(guī)模屬于100~500人的中型企業(yè)a企業(yè)目前成立6年,分配權(quán)重如下:

通過聚類算法k-means進行降噪,剝離離群數(shù)據(jù)約14個,剩余有效樣本133個應(yīng)用樸素貝葉斯算法建模,存儲企業(yè)的匹配度模型將新的簡歷應(yīng)用匹配度模型,計算目標簡歷與企業(yè)的匹配概率,如:xxx,男,1991年11月,2年工作經(jīng)驗,北京,本科……匹配概率67%。

結(jié)果分析:根據(jù)新入簡歷的匹配度概率分析,匹配度70%以上都是年紀稍大且穩(wěn)定的人員,所以這是一家相對保守的傳統(tǒng)型公司,90后新入員工離職率較高,更偏重于80后且過往經(jīng)歷相對穩(wěn)定的人員。以目前在職的207人,其中40多人的匹配概率都低于50%,且入職時間不長,新入員工的穩(wěn)定性較差,長期如此必將面臨人員大面積流動而無法為企業(yè)創(chuàng)收的困擾。

㈦比現(xiàn)有技術(shù)的改進

針對企業(yè)文化匹配的篩選,稍大一些的公司已經(jīng)開始重視,而大部分中小企業(yè)還沒有能力去做這個事情。重視企業(yè)文化的公司,目前一般處理方式都是在面試中增加一個環(huán)節(jié),由hr或hrd對候選人進行價值觀的人為判斷,主觀因素較重,hr的工作量也較大,無法批量復(fù)制,所以目前采用這種方式時一般也把這個步驟放在最后,以減少hr的工作量。

本發(fā)明利用個人特征,推演群體特征,構(gòu)建企業(yè)文化的數(shù)據(jù)模型,實現(xiàn)企業(yè)文化匹配度的量化評定,為招聘環(huán)節(jié)的企業(yè)文化匹配提供數(shù)據(jù)依據(jù)。通過這種方式,可以計算候選人與企業(yè)文化的匹配度,若候選人與企業(yè)文化符合的概率較低,可將hr環(huán)節(jié)前置,先由hr通過面試判斷候選人是否符合企業(yè)文化,若不符則可以直接拒絕掉,避免后續(xù)面試環(huán)節(jié)不必要的耗費,從而在整體上節(jié)省企業(yè)面試開銷。

目前初步的算法準確度大致在76%左右,但已可以至少提供hr28%的效率,后續(xù)在算法的準確度上還可以進行提高,以便更好地提高招聘環(huán)節(jié)效率。

經(jīng)大量的試驗驗證,采用本發(fā)明的技術(shù)方案,通過對大數(shù)據(jù)進行分析,并對分析所得信息的匹配度進行確定,有利于提升大數(shù)據(jù)分析的可靠性和精準性,進而提升用戶體驗。

根據(jù)本發(fā)明的實施例,還提供了對應(yīng)于信息匹配度的確定方法的一種信息匹配度的確定系統(tǒng)。參見圖3所示本發(fā)明的系統(tǒng)的一實施例的結(jié)構(gòu)示意圖。該信息匹配度的確定系統(tǒng)可以包括:樣本加工單元102、數(shù)據(jù)處理單元104、建模單元106、結(jié)果分析單元108。

在一個可選實施方式中,樣本加工單元102,可以用于基于所述信息所屬單元,提取所屬單元下的單元樣本,根據(jù)預(yù)設(shè)條件進行篩選、權(quán)重分配,得到與預(yù)設(shè)條件適配的所述單元樣本的篩選結(jié)果。

可選地,所述樣本加工單元102,可以包括:加載模塊1022、篩選模塊1024、信息分類模塊1026、特征提取模塊1028、權(quán)重處理模塊1030和評測模塊1032。

在一個可選例子中,加載模塊1022,可以用于加載所述單元中與所述信息適配的所有子信息。

在一個可選例子中,篩選模塊1024,可以用于基于所屬單元模型的預(yù)設(shè)條件進行篩選,得到與預(yù)設(shè)條件適配的篩選結(jié)果。

在一個可選例子中,信息分類模塊1026,可以用于按預(yù)設(shè)類別,對所述所有子信息進行分類,得到包含多類信息的分類結(jié)果。

在一個可選例子中,特征提取模塊1028,可以用于提取所屬單元下,符合預(yù)設(shè)標準的關(guān)鍵單元樣本特征,得到關(guān)鍵單元樣本特征集合。

在一個可選例子中,權(quán)重處理模塊1030,可以用于將所屬單元下的每個所述單元樣本與預(yù)設(shè)標準對比,得到每個所述單元樣本的所述標準權(quán)重。

在一個可選例子中,評測模塊1032,可以用于基于評測方法,得到所述單元樣本的附加特征屬性的評測模型。

在一個可選實施方式中,數(shù)據(jù)處理單元104,可以用于對所述篩選結(jié)果進行數(shù)據(jù)加工、數(shù)據(jù)降噪,得到所述單元樣本的數(shù)據(jù)矩陣。

可選地,所述數(shù)據(jù)處理單元104,可以包括:樣本分組模塊1042、數(shù)據(jù)計算模塊1044、數(shù)據(jù)分組模塊1046和數(shù)據(jù)降噪模塊1048。

在一個可選例子中,樣本分組模塊1042,可以用于根據(jù)所述預(yù)設(shè)條件,對所述單元模型中的所有子信息進行樣本分組。

在一個可選例子中,數(shù)據(jù)計算模塊1044,可以用于計算并得到所述單元中提取的單元樣本數(shù)據(jù)類中心特征。

在一個可選例子中,數(shù)據(jù)分組模塊1046,可以用于對于每類信息,通過聚類處理和密度估計處理,得到所述每類信息在所述單元中的分類情況。

在一個可選例子中,數(shù)據(jù)降噪模塊1048,可以用于在將所述分類情況、以及與所述分類情況適配的所述分析結(jié)果進行建模之前,通過聚類等處理剝離所述每類情況中的噪聲。

更可選地,所述數(shù)據(jù)降噪模塊1048的所述聚類處理,可以包括:通過k-means、cure的至少一種聚類算法進行處理。

在一個可選實施方式中,建模單元106,可以用于對所述數(shù)據(jù)矩陣運用相應(yīng)建模算法,得到與所屬單元適配的單元模型。

建模單元106,可以包括:關(guān)鍵特征提取模塊1062、概率模型建模模塊1064和映射模塊1066。

在一個可選例子中,關(guān)鍵特征提取模塊1062,可以用于基于降維算法處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述關(guān)鍵單元樣本的關(guān)鍵特征信息。

更可選地,所述關(guān)鍵特征提取模塊1062的所述降維算法處理,可以包括:通過主成分分析法pca、奇異值分解法svd等的至少一種降維算法進行處理。

在一個可選例子中,概率模型建模模塊1064,可以用于基于概率模型處理所述單元樣本數(shù)據(jù)矩陣,得到所屬單元中所述單元樣本的單元數(shù)據(jù)模型。

更可選地,所述概率模型建模模塊1064的所述概率模型處理,可以包括:通過樸素貝葉斯、adaboost等的至少一種概率模型進行處理。

在一個可選例子中,映射模塊1066,可以用于將所述分組情況、以及與所述分組情況適配的所述單元模型進行映射,構(gòu)建與所述預(yù)設(shè)特征適配的所述單元模型。

在一個可選實施方式中,結(jié)果分析單元108,可以用于基于所述單元模型,對所述單元樣本進行計算,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配結(jié)果。

可選地,所述結(jié)果分析單元108,可以包括:相似度計算模塊1082、概率計算模塊1084和結(jié)果評定模塊1086。

在一個可選例子中,相似度計算模塊1082,可以用于基于相似度算法,得到所述單元樣本與所述關(guān)鍵單元樣本的所述關(guān)鍵特征信息的相似度評分。

在一個可選例子中,概率計算模塊1084,可以用于基于所述單元模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配概率值。

在一個可選例子中,結(jié)果評定模塊1086,可以用于基于所述相似度評分及所述評測模型,得到單元樣本與所屬單元的所述信息對應(yīng)的匹配評定結(jié)果。

由于本實施例的系統(tǒng)所實現(xiàn)的處理及功能基本相應(yīng)于前述圖1至圖2所示的方法的實施例、原理和實例,故本實施例的描述中未詳盡之處,可以參見前述實施例中的相關(guān)說明,在此不做贅述。

經(jīng)大量的試驗驗證,采用本發(fā)明的技術(shù)方案,通過對大數(shù)據(jù)進行分析,并對分析所得信息的匹配度進行確定,有利于提升大數(shù)據(jù)分析的可靠性和精準性,進而提升用戶體驗。

綜上,本領(lǐng)域技術(shù)人員容易理解的是,在不沖突的前提下,上述各有利方式可以自由地組合、疊加。

以上所述僅為本發(fā)明的實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的權(quán)利要求范圍之內(nèi)。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
日照市| 旌德县| 汉中市| 南岸区| 资中县| 望谟县| 大安市| 桃源县| 南平市| 遵化市| 巴南区| 郑州市| 阿拉善右旗| 晴隆县| 揭东县| 梅河口市| 岢岚县| 玛纳斯县| 临泽县| 莎车县| 巴彦县| 永平县| 巫溪县| 横山县| 墨脱县| 林芝县| 舟曲县| 巴彦县| 小金县| 宜兰县| 伊宁市| 玉屏| 建水县| 永康市| 岱山县| 句容市| 南开区| 松潘县| 太保市| 桂东县| 德兴市|