專利名稱:一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息安全技術(shù)領(lǐng)域的專業(yè)社交網(wǎng)絡(luò)平臺(tái)實(shí)現(xiàn)面向人才、交友、廠商、漏洞信息等推薦實(shí)現(xiàn)方法,尤其涉及一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法。
背景技術(shù):
社交網(wǎng)絡(luò)是在互聯(lián)網(wǎng)上與其他人相聯(lián)系的ー個(gè)平臺(tái),社交網(wǎng)絡(luò)站點(diǎn)通常圍繞用戶的基本信息而運(yùn)作,用戶基本信息是指有關(guān)用戶喜歡的事、不喜歡的事、興趣、愛(ài)好、學(xué)校、職業(yè)或任何其它共同點(diǎn)的集合,通常,這些站點(diǎn)提供不同級(jí)別的隱私控制。本專利的考慮,主要是采用改良的混合協(xié)同過(guò)濾和基于內(nèi)容過(guò)濾算法實(shí)現(xiàn)方法的創(chuàng)新。推薦系統(tǒng)或推薦引擎是根據(jù)用戶的興趣特點(diǎn)和行為,向用戶推薦用戶感興趣的信息和商品。隨著信息以及商品數(shù)量和種類快速增長(zhǎng),用戶需要花費(fèi)大量的時(shí)間才能找到自己想要的信息或商品,這種瀏覽大量無(wú)關(guān)的信息和產(chǎn)品過(guò)程無(wú)疑會(huì)使淹沒(méi)在信息過(guò)載問(wèn)題中的用戶不斷流失,為了解決這些問(wèn)題,推薦系統(tǒng)應(yīng)運(yùn)而生,推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的ー種高級(jí)商務(wù)智能平臺(tái),以幫助電子商務(wù)網(wǎng)站或社交網(wǎng)站為用戶提供完全個(gè)性化的決策支持和信息服務(wù)。推薦系統(tǒng)的算法一般有以下兩種方法:(I)集體智慧和協(xié)同過(guò)濾:集體智慧是指在大量的人群的行為和數(shù)據(jù)中收集答案,幫助你對(duì)整個(gè)人群得到統(tǒng)計(jì)意義上的結(jié)論,這些結(jié)論是我們?cè)趩蝹€(gè)個(gè)體上無(wú)法得到的,它往往是某種趨勢(shì)或者人群中共性的部分;協(xié)同過(guò)濾是基于協(xié)同過(guò)濾方法收集和分析大量的信息,對(duì)用戶的行為,活動(dòng)或喜好,并預(yù)測(cè)哪些用戶會(huì)喜歡的基礎(chǔ)上其他用戶的相似性,協(xié)同過(guò)濾方法的ー個(gè)主要優(yōu)點(diǎn)是它不依賴于機(jī)器分析的內(nèi)容,因此,它能夠準(zhǔn)確地推薦復(fù)雜的項(xiàng)目,如電影,而不需要“理解”的項(xiàng)目本身。協(xié)同過(guò)濾方法常常會(huì)出現(xiàn)三個(gè)問(wèn)題:①冷啟動(dòng):這些系統(tǒng)通常需要大量的用戶數(shù)據(jù),以得到準(zhǔn)確的推薦性能:這些系統(tǒng)往往都有數(shù)以億計(jì)的用戶和產(chǎn)品,因此,往往需要大量的計(jì)算和高性能服務(wù)器支撐;③稀疏:在各大電子商務(wù)網(wǎng)站上銷(xiāo)售的物品的數(shù)量是非常大的,最活躍的用戶將只評(píng)價(jià)了數(shù)據(jù)庫(kù)的整體的一小部分。協(xié)同過(guò)濾算法常常采用矩陣分解,低秩矩陣近似技木。(2)基于內(nèi)容的過(guò)濾:推薦系統(tǒng)設(shè)計(jì)時(shí),另ー個(gè)常用的方法是基于內(nèi)容的過(guò)濾,基于內(nèi)容的過(guò)濾方法是基于將要推薦項(xiàng)目的有關(guān)內(nèi)容的信息和特征,換言之,這些算法嘗試建議是相似的那些用戶喜歡在過(guò)去(或在本研究)的項(xiàng)目;特別是各種候選與先前評(píng)估項(xiàng)目是由用戶和推薦的最佳匹配的資料的資料進(jìn)行比較,基本上,這些方法使用表征資料系統(tǒng)內(nèi)的一個(gè)項(xiàng)目的配置文件(即,一組離散的屬性和特征);系統(tǒng)將創(chuàng)建一個(gè)基于內(nèi)容的用戶檔案,根據(jù)項(xiàng)目特點(diǎn)的加權(quán)矢量的權(quán)重表示給用戶的每個(gè)特征的重要性,可以計(jì)算從單獨(dú)評(píng)估的內(nèi)容使用的各種技術(shù)的載體。用戶的直接反饋,通常通過(guò)類似喜歡/不喜歡“按鈕的形式,可以使用較高或較低的權(quán)重分配某些屬性(使用Rocchio反饋分類技術(shù)或其他類似的技木)的重要性?;趦?nèi)容過(guò)濾的關(guān)鍵問(wèn)題是系統(tǒng)是否能夠挖掘用戶對(duì)某ー種內(nèi)容的喜好和行為,擴(kuò)展到其他類型的內(nèi)容上做出正確的預(yù)測(cè)。信息安全領(lǐng)域的專業(yè)社交網(wǎng)絡(luò)由于推薦的信息有以下特點(diǎn):
(I)推薦內(nèi)容之間錯(cuò)綜復(fù)雜的關(guān)系,最重要的內(nèi)容是海量的信息安全內(nèi)容,而內(nèi)容本身又是具有較結(jié)構(gòu)化的數(shù)據(jù),各類數(shù)據(jù)之間本身就存在固有的錯(cuò)綜復(fù)雜的關(guān)聯(lián)關(guān)系;(2)用戶的活躍程度低:在傳統(tǒng)的推薦系統(tǒng)中,用戶登錄ー個(gè)推薦系統(tǒng),就是為了選擇ー些他想要的資源,而在社交網(wǎng)絡(luò)推薦中,許多用戶上SNS,更多的時(shí)間處干“看信息”,因此很難直接獲得他們的顯式反饋信息,也難以對(duì)他們的興趣進(jìn)行學(xué)習(xí)和預(yù)測(cè);(3)數(shù)據(jù)的稀疏性和不對(duì)稱性:在傳統(tǒng)的推薦問(wèn)題中,用戶和資源一般是同ー個(gè)數(shù)量級(jí)的,但是在本推薦問(wèn)題中,由于數(shù)據(jù)海量的特點(diǎn),信息的數(shù)量和增長(zhǎng)速度遠(yuǎn)遠(yuǎn)大于用戶的數(shù)量和增長(zhǎng)速度。(4)用戶興趣的動(dòng)態(tài)變化:用戶關(guān)注的漏洞或話題一直緊隨信息安全的發(fā)展,因此SNS上關(guān)注點(diǎn)不斷變化,用戶的興趣也隨之變化,在傳統(tǒng)推薦問(wèn)題中,往往是用戶根據(jù)興趣選擇資源,在推薦中,則是不斷出現(xiàn)的關(guān)注漏洞改變著用戶的興趣,再由用戶選擇關(guān)注的漏洞,因此,用戶的興趣一直在動(dòng)態(tài)變化,很難找到一個(gè)用戶長(zhǎng)時(shí)間感興趣的話題。綜上所述,在信息安全的專業(yè)社交網(wǎng)絡(luò)中不能僅僅采用協(xié)同過(guò)濾的方法,而忽視推送內(nèi)容本身具有的固有的復(fù)雜關(guān)聯(lián)關(guān)系;也不能僅僅基于海量信息的內(nèi)容本身的推薦。因而,針對(duì)以上方面,本發(fā)明提出改良的這兩種算法結(jié)合的綜合算法。
發(fā)明內(nèi)容
針對(duì)以上缺陷,本發(fā)明提供一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法,主要是采用改良的混合協(xié)同過(guò)濾和基于內(nèi)容過(guò)濾算法實(shí)現(xiàn)方法的創(chuàng)新,在電子商務(wù)網(wǎng)站或社交網(wǎng)站平臺(tái)上,用戶和用戶之間,實(shí)現(xiàn)了建立更好的推薦模式,讓用戶體驗(yàn)到他所關(guān)注的人才圈子內(nèi)推薦的內(nèi)容更加個(gè)性化。為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法,主要由以下步驟組成:(I)收集用戶偏好:從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,收集用戶的偏好信息是系統(tǒng)推薦效果基礎(chǔ)的決定因素,用戶采用各種方式向系統(tǒng)提供自己的偏好信息;(2)分析內(nèi)容特性:當(dāng)已經(jīng)對(duì)用戶行為進(jìn)行分析得到用戶喜好后,根據(jù)用戶喜好計(jì)算相似用戶和物品,然后基于相似用戶或者物品進(jìn)行推薦,這兩種方法都要計(jì)算相似度;生成推薦的過(guò)程主要由設(shè)置的三個(gè)部件組成:內(nèi)容分析器:從漏洞信息中提取影響用戶關(guān)注度的重要信息用一種適當(dāng)?shù)臋?quán)重來(lái)表示,例如漏洞嚴(yán)重級(jí)別、攻擊復(fù)雜度、關(guān)聯(lián)產(chǎn)品、所屬?gòu)S商、關(guān)聯(lián)補(bǔ)丁、利用代碼、惡意代碼;文件學(xué)習(xí)器:該模塊收集、泛化代表用戶偏好的數(shù)據(jù),生成用戶概要信息,通常采用機(jī)器學(xué)習(xí)方法從用戶之前關(guān)注的漏洞信息中推出ー個(gè)表示用戶關(guān)注的模型;過(guò)濾部件:通過(guò)學(xué)習(xí)用戶概要信息,匹配用戶概要信息和商品信息,推薦相關(guān)的商品,結(jié)果是ー個(gè)二元的連續(xù)型的相關(guān)判斷,后者將生成一個(gè)用戶可能感興趣的潛在商品評(píng)分列表;(3)相似度的計(jì)算:在推薦的場(chǎng)景中,在用戶與物品偏好的ニ維矩陣中,將ー個(gè)用戶對(duì)所有物品的偏好作為ー個(gè)向量來(lái)計(jì)算用戶之間的相似度,或者將所有用戶對(duì)某個(gè)物品的偏好作為ー個(gè)向量來(lái)計(jì)算物品之間的相似度。本發(fā)明所述的基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法的有益效果為:實(shí)現(xiàn)了建立更好的推薦模式,讓用戶體驗(yàn)到他所關(guān)注的人才圈子內(nèi)推薦的內(nèi)容更加個(gè)性化;本算法混合單純的協(xié)同過(guò)濾和基于內(nèi)容的方法,提升了性能,可以提供更準(zhǔn)確的推薦,也可以克服ー些推薦系統(tǒng)中,如冷啟動(dòng)和稀疏性問(wèn)題的常見(jiàn)問(wèn)題。
下面根據(jù)附圖對(duì)本發(fā)明作進(jìn)ー步詳細(xì)說(shuō)明。圖1是本發(fā)明實(shí)施例所述基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法部分流程示意圖。
具體實(shí)施例方式如圖1所示,本發(fā)明實(shí)施例所述的基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法,主要由以下步驟組成:(I)收集用戶偏好:從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,如何收集用戶的偏好信息成為系統(tǒng)推薦效果最基礎(chǔ)的決定因素,用戶有很多方式向系統(tǒng)提供自己的偏好信息,如下表所示:
權(quán)利要求
1.一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法,其特征在于,主要由以下步驟組成: (1)收集用戶偏好:從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,收集用戶的偏好信息是系統(tǒng)推薦效果基礎(chǔ)的決定因素,用戶采用各種方式向系統(tǒng)提供自己的偏好信息; (2)分析內(nèi)容特性:當(dāng)已經(jīng)對(duì)用戶行為進(jìn)行分析得到用戶喜好后,根據(jù)用戶喜好計(jì)算相似用戶和物品,然后基于相似用戶或者物品進(jìn)行推薦,這兩種方法都要計(jì)算相似度; 生成推薦的過(guò)程主要由設(shè)置的三個(gè)部件組成: 內(nèi)容分析器:從漏洞信息中提取影響用戶關(guān)注度的重要信息用一種適當(dāng)?shù)臋?quán)重來(lái)表示,例如漏洞嚴(yán)重級(jí)別、攻擊復(fù)雜度、關(guān)聯(lián)產(chǎn)品、所屬?gòu)S商、關(guān)聯(lián)補(bǔ)丁、利用代碼、惡意代碼;文件學(xué)習(xí)器:該模塊收集、泛化代表用戶偏好的數(shù)據(jù),生成用戶概要信息,通常采用機(jī)器學(xué)習(xí)方法從用戶之前關(guān)注的漏洞信息中推出ー個(gè)表示用戶關(guān)注的模型; 過(guò)濾部件:通過(guò)學(xué)習(xí)用戶概要信息,匹配用戶概要信息和商品信息,推薦相關(guān)的商品,結(jié)果是ー個(gè)二元的連續(xù)型的相關(guān)判斷,后者將生成一個(gè)用戶可能感興趣的潛在商品評(píng)分列表; (3)相似度的計(jì)算:在推薦的場(chǎng)景中,在用戶與物品偏好的ニ維矩陣中,將ー個(gè)用戶對(duì)所有物品的偏好作為ー個(gè)向量來(lái)計(jì)算用戶之間的相似度,或者將所有用戶對(duì)某個(gè)物品的偏好作為ー個(gè)向量來(lái)計(jì)算物品之間的相似度。
全文摘要
本發(fā)明涉及一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺(tái)的推薦算法,主要由以下步驟組成(1)收集用戶偏好從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,收集用戶的偏好信息是系統(tǒng)推薦效果基礎(chǔ)的決定因素,用戶采用各種方式向系統(tǒng)提供自己的偏好信息;(2)分析內(nèi)容特性當(dāng)已經(jīng)對(duì)用戶行為進(jìn)行分析得到用戶喜好后,根據(jù)用戶喜好計(jì)算相似用戶和物品,然后基于相似用戶或者物品進(jìn)行推薦;(3)相似度的計(jì)算。本發(fā)明有益效果為實(shí)現(xiàn)了建立更好的推薦模式,讓用戶體驗(yàn)到他所關(guān)注的人才圈子內(nèi)推薦的內(nèi)容更加個(gè)性化;本算法混合單純的協(xié)同過(guò)濾和基于內(nèi)容的方法,提升了性能,可以提供更準(zhǔn)確的推薦,也可以克服一些推薦系統(tǒng)中,如冷啟動(dòng)和稀疏性問(wèn)題的常見(jiàn)問(wèn)題。
文檔編號(hào)G06F17/30GK103106285SQ20131006810
公開(kāi)日2013年5月15日 申請(qǐng)日期2013年3月4日 優(yōu)先權(quán)日2013年3月4日
發(fā)明者劉暉, 趙向輝, 易錦, 劉彥釗, 田雯, 葉林, 曾昭沛, 羅寧 申請(qǐng)人:中國(guó)信息安全測(cè)評(píng)中心, 上海三零衛(wèi)士信息安全有限公司