本發(fā)明涉及社交網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)探測(cè)研究技術(shù)領(lǐng)域,特別涉及一種社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法及系統(tǒng)。
背景技術(shù):
近幾年來(lái),由于社交網(wǎng)絡(luò)的研究日趨熱門,基于社交網(wǎng)絡(luò)平臺(tái)上的探測(cè)和發(fā)現(xiàn)優(yōu)質(zhì)用戶問(wèn)題的研究也日益得到人們的重視。通過(guò)對(duì)這類用戶的挖掘,可以和這些優(yōu)質(zhì)用戶建立更直接的關(guān)聯(lián)以獲取蘊(yùn)含的社會(huì)價(jià)值。例如,教師熱衷于發(fā)現(xiàn)優(yōu)秀的學(xué)生進(jìn)行重點(diǎn)培養(yǎng),商人熱衷于發(fā)現(xiàn)優(yōu)質(zhì)的合作伙伴進(jìn)行商業(yè)合作,金融行業(yè)熱衷于發(fā)現(xiàn)優(yōu)質(zhì)的客戶以實(shí)現(xiàn)經(jīng)濟(jì)價(jià)值,從業(yè)多年的HR善于發(fā)現(xiàn)優(yōu)秀的人才來(lái)為企業(yè)服務(wù)等等。那么,作為一個(gè)具備敏銳眼光的觀察者,他們又是憑借何種知識(shí)和經(jīng)驗(yàn)去發(fā)現(xiàn)所在行業(yè)中的優(yōu)質(zhì)客戶的呢?這些問(wèn)題正是本發(fā)明所要解決的核心問(wèn)題:通過(guò)提取目光敏銳觀察者對(duì)優(yōu)質(zhì)用戶發(fā)現(xiàn)的知識(shí)和經(jīng)驗(yàn)為基礎(chǔ),從中提取優(yōu)質(zhì)用戶所具備的特征建立關(guān)聯(lián)規(guī)則和特征識(shí)別庫(kù)。將觀察者發(fā)現(xiàn)優(yōu)質(zhì)用戶的問(wèn)題引入到社交網(wǎng)絡(luò)的研究領(lǐng)域中,以社交網(wǎng)絡(luò)的圖挖掘?yàn)槔碚撘罁?jù),將該問(wèn)題轉(zhuǎn)化為社交網(wǎng)絡(luò)中發(fā)現(xiàn)和探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)的問(wèn)題,從而形成了一套對(duì)該挑戰(zhàn)性問(wèn)題加以解決的方法體系。
通過(guò)對(duì)國(guó)內(nèi)外參考文獻(xiàn)的閱讀和研究現(xiàn)狀的分析發(fā)現(xiàn),以社交網(wǎng)絡(luò)圖挖掘知識(shí)建立模型,以發(fā)現(xiàn)優(yōu)質(zhì)節(jié)點(diǎn)的相關(guān)研究文獻(xiàn)并不多見(jiàn),與本發(fā)明緊密相關(guān)的參考文獻(xiàn)就更難以尋覓。因此,本發(fā)明所要解決的問(wèn)題,不僅在該問(wèn)題所涉及的國(guó)內(nèi)外研究現(xiàn)狀中具有一定的創(chuàng)新性,而且在解決問(wèn)題的方法、途徑和思路上,更具有其獨(dú)創(chuàng)性。通過(guò)涉獵與本發(fā)明相關(guān)的參考文獻(xiàn),涉及的主要研究問(wèn)題和研究點(diǎn)可概括如下。其中,最佳消息發(fā)布時(shí)間:Nemanja Spasojevic等人規(guī)劃出了一種叫做when-to-post的問(wèn)題,解決該類問(wèn)題的目標(biāo)是要找出社交網(wǎng)絡(luò)中用戶發(fā)布消息的最佳時(shí)間,從而值得聽(tīng)眾的反饋概率達(dá)到最大化。為了讓讀者能夠理解這個(gè)問(wèn)題的復(fù)雜性,他們?cè)诎l(fā)布消息反應(yīng)時(shí)間方面考察了用戶行為的變化情況,并比較了不同城市中的用戶每周在Twitter和Facebook上跨網(wǎng)絡(luò)和跨城市的反應(yīng)行為。他們將這種分析思路用十億條發(fā)布消息進(jìn)行實(shí)施驗(yàn)證,觀察聽(tīng)眾的反應(yīng)并提出了生成個(gè)性化發(fā)布計(jì)劃的多種解決方法。
雙向影響力傳播:Rui Yan等人提出了通過(guò)影響力傳播來(lái)平滑語(yǔ)言模型,以達(dá)到解決社會(huì)網(wǎng)絡(luò)中薄弱環(huán)節(jié)的目的。他們建立了一種雙向社會(huì)化因素圖模型,該模型利用文檔對(duì)和文檔背后的社會(huì)化增強(qiáng)網(wǎng)絡(luò)二者之間的文本關(guān)聯(lián)。例如,用戶關(guān)系和社會(huì)互動(dòng)。這些因素作為文檔和他們通信作者中的屬性和依賴關(guān)系而被建模。最后,他們基于估計(jì)的影響力傳播詞項(xiàng)給平滑后的文檔。
社交網(wǎng)絡(luò)中的局部共校準(zhǔn):當(dāng)前,人們通常參與到多種在線社交網(wǎng)路中同時(shí)共享多個(gè)社交網(wǎng)絡(luò)富服務(wù)。除了共同的用戶以外,社交網(wǎng)絡(luò)能提供類似的服務(wù)。這些服務(wù)可以共享很多其它種類的信息實(shí)體。例如,位置,視頻和產(chǎn)品。然而,這些在不同社交網(wǎng)絡(luò)中共享的實(shí)體大都沒(méi)有任何已知的對(duì)應(yīng)關(guān)系而相互孤立。Jiawei Zhang等人針對(duì)這些同時(shí)跨網(wǎng)絡(luò)鏈接多種共享實(shí)體的潛在對(duì)應(yīng)關(guān)系,而在形式上,這類問(wèn)題被稱之為網(wǎng)絡(luò)的“局部共校準(zhǔn)”(PCT)問(wèn)題。它是很多具體跨網(wǎng)絡(luò)應(yīng)用的先決條件,例如社會(huì)網(wǎng)絡(luò)融合,多信息交換與傳遞。同時(shí),局部共校準(zhǔn)問(wèn)題也由于下列原因而被認(rèn)為是一種挑戰(zhàn)性問(wèn)題。包括:1、社交網(wǎng)絡(luò)的異質(zhì)性;2、建模所需的訓(xùn)練實(shí)例的缺乏;3、通信連接方面一對(duì)一的限制。為了解決這些挑戰(zhàn),他們提出了一種新的網(wǎng)絡(luò)校準(zhǔn)架構(gòu)UNI-COAT(非監(jiān)督型共校準(zhǔn))?;诋愘|(zhì)信息,該架構(gòu)將局部共校準(zhǔn)問(wèn)題轉(zhuǎn)化為一個(gè)聯(lián)合優(yōu)化問(wèn)題。為了解決這個(gè)目標(biāo)函數(shù),通信關(guān)系上的一對(duì)一限制被釋放,而冗余非存在性相關(guān)連接將由一種新的網(wǎng)絡(luò)共匹配算法被裁減。
多社交網(wǎng)絡(luò)學(xué)習(xí)和應(yīng)用:人類生活在社交網(wǎng)絡(luò)時(shí)代,全世界的人類由多個(gè)社交網(wǎng)絡(luò)連接并組織起來(lái)。對(duì)于不同的社交網(wǎng)絡(luò)而言,這種觀點(diǎn)可能根據(jù)它們所提供服務(wù)的不同而有所差異。人們之間相互問(wèn)候并從不同角度全面地描述了某個(gè)特定的用戶。相對(duì)于單一來(lái)源傳遞的匱乏知識(shí),多社交網(wǎng)絡(luò)的恰當(dāng)融合提供給我們一個(gè)更好的機(jī)遇來(lái)進(jìn)行深層次用戶理解。然而,挑戰(zhàn)與機(jī)遇并存。第一個(gè)挑戰(zhàn)就是由于一些用戶在某個(gè)社交網(wǎng)絡(luò)中表現(xiàn)活躍而在另一些設(shè)計(jì)網(wǎng)絡(luò)中表現(xiàn)不活躍而導(dǎo)致塊丟失數(shù)據(jù)的存在。第二個(gè)挑戰(zhàn)是如何協(xié)同的整合多個(gè)社交網(wǎng)絡(luò)。為達(dá)到這個(gè)目的,Xuemeng Song等人通過(guò)對(duì)來(lái)自多源知識(shí)的無(wú)縫探索,提出了一種針對(duì)數(shù)據(jù)丟失實(shí)現(xiàn)的新模型。然后,他們開(kāi)發(fā)了一種魯棒性的多社交網(wǎng)絡(luò)學(xué)習(xí)模型。
針對(duì)地位提升的用戶移動(dòng)性建模:隨著智能手機(jī)和社交網(wǎng)絡(luò)服務(wù)的激增,基于位置的社交網(wǎng)絡(luò)日益被看作是一種為商業(yè)提升產(chǎn)品和服務(wù)的工具。Wen-Yuan Zhu等人研究了輔助商業(yè)提升地位的關(guān)鍵性技術(shù),這些技術(shù)能通過(guò)潛在基于位置的社交網(wǎng)絡(luò)而明智地打廣告。為了最大化地位提升的利益,他們把它標(biāo)準(zhǔn)化為一個(gè)基于位置社交網(wǎng)絡(luò)中的影響力最大化問(wèn)題。例如,給定一個(gè)目標(biāo)位置和一個(gè)基于位置的社交網(wǎng)絡(luò),選取哪些用戶作為初始用戶才能達(dá)到讓他們成功傳播和吸引最多的用戶來(lái)訪問(wèn)目標(biāo)位置的目的。已存在的研究已經(jīng)提出了各種方法來(lái)計(jì)算信息傳遞的概率。也就是說(shuō),在一個(gè)靜態(tài)社交網(wǎng)絡(luò)的配置中,一個(gè)用戶可能怎樣去影響另一個(gè)用戶。然而,源于基于位置的社交網(wǎng)絡(luò)中的傳播概率帶來(lái)了更多的挑戰(zhàn)。因?yàn)槟繕?biāo)位置和用戶移動(dòng)性是動(dòng)態(tài)和查詢依賴的,因此傳播概率受到這二者的嚴(yán)重影響。Wen-Yuan Zhu等人提出了兩種用戶移動(dòng)性模型,分別命名為基于高斯的和基于距離的移動(dòng)性模型,用于捕獲單個(gè)基于位置社交網(wǎng)絡(luò)用戶的簽到行為。而基于此,位置感知的傳播概率能夠分別被獲取。
在線社交數(shù)據(jù)挖掘:Hong-Han Shuai等人提出了一種叫做社交網(wǎng)絡(luò)精神障礙探測(cè)(SNMDD)的機(jī)器學(xué)習(xí)架構(gòu)用于從社交網(wǎng)絡(luò)數(shù)據(jù)中提取特征來(lái)精確識(shí)別社交網(wǎng)絡(luò)精神障礙的潛在案例。他們?cè)谏缃痪W(wǎng)絡(luò)精神障礙探測(cè)中也利用多源學(xué)習(xí)并提出了一種基于張量模型的新型社交網(wǎng)絡(luò)探測(cè)模型用于改進(jìn)性能。
互聯(lián)地理社交網(wǎng)絡(luò):大都市把不同的個(gè)體聚集在一起,為文化和知識(shí)的交流創(chuàng)造了機(jī)遇,這些最終能夠帶來(lái)社會(huì)和經(jīng)濟(jì)的繁榮。Desislava Hristova等人在人與地理互聯(lián)的本質(zhì)方面提出了一種新型的網(wǎng)絡(luò)視角,這一視角使得通過(guò)社交網(wǎng)絡(luò)和移動(dòng)模式捕獲訪問(wèn)者的城市位置的社交多樣性變得可能。他們定義了與社交經(jīng)紀(jì)角色、熵、訪問(wèn)者的同質(zhì)性以及它們能引起的各種偶然的邂逅者等相關(guān)的四條地理社交多樣性準(zhǔn)則。這樣就能夠?qū)⒕奂吧说牡胤胶途奂笥训牡胤竭M(jìn)行區(qū)分。同樣,也可用于區(qū)分聚集各種不同人的地方和聚集常客的地方。他們將倫敦地區(qū)的這些屬性和健康指標(biāo)進(jìn)行關(guān)聯(lián),在帶高熵值和傭金的貧困地區(qū)發(fā)現(xiàn)鄉(xiāng)紳化信號(hào)。通過(guò)對(duì)這些地區(qū)五年以上人口調(diào)查并根據(jù)數(shù)據(jù)的綜合貧困英國(guó)指數(shù)顯示,這些地方有大量富人和各種游客涌入表明了他們的排名具有整體提升。Desislava Hristova等人揭示了人與地區(qū)屬性之間的關(guān)系,并區(qū)分不同分類和重要的城市地理學(xué)以應(yīng)對(duì)城市政策和基于位置應(yīng)用的社會(huì)感知的下一代發(fā)展。
社交網(wǎng)絡(luò)中的嫌犯追蹤搜索:通過(guò)指定名字去搜索一個(gè)特定的人在諸如Facebook的社交網(wǎng)絡(luò)服務(wù)中是一項(xiàng)基本功能。然而很多時(shí)候,想要找一個(gè)人但是她卻對(duì)搜索目標(biāo)的社交網(wǎng)絡(luò)標(biāo)簽知之甚少(例如興趣,技能,家鄉(xiāng),學(xué)校,職業(yè)等)。假定每個(gè)用戶關(guān)聯(lián)一個(gè)社交標(biāo)簽集合,他們提出了一種在線社交網(wǎng)絡(luò)中新搜索模型(疑犯追蹤搜索),旨在發(fā)現(xiàn)一系列基于用戶指定查詢標(biāo)簽集合的期望目標(biāo),這些標(biāo)簽用來(lái)描述目標(biāo)。他們?cè)O(shè)計(jì)了一種貪心啟發(fā)式圖搜索算法,用以發(fā)現(xiàn)搜索目標(biāo)。這些目標(biāo)不僅覆蓋查詢標(biāo)簽,而且能處理更優(yōu)的社交對(duì)等交互或者對(duì)于用戶而言,具有更高社交接近度的連接。
企業(yè)客戶識(shí)別:當(dāng)前,一個(gè)現(xiàn)代電子商務(wù)公司可能既有在線銷售又有離線銷售的部門。一般地,在線銷售通過(guò)群發(fā)大量電子郵件或促銷碼的方式嘗試銷售少量商品給客戶,這樣就嚴(yán)重依賴于設(shè)計(jì)的后臺(tái)算法。另一方面,離線銷售試圖通過(guò)由銷售代表發(fā)起的聯(lián)系人售賣大量商品給企業(yè)客戶。而離線銷售與在線銷售相比,成本更高一些。與僅關(guān)注支持在線銷售的機(jī)器學(xué)習(xí)算法等研究工作不同的是,Qingbo Hu等人介紹了一種利用異質(zhì)社交網(wǎng)絡(luò)改進(jìn)離線銷售有效性的方法。更具體的說(shuō),他們提出了一種二相架構(gòu)。其中,Hetero-Sales首先從基于元路徑學(xué)習(xí)的語(yǔ)義學(xué)中得到啟發(fā),構(gòu)造出了一個(gè)“公司-公司”的圖,又叫公司同質(zhì)性圖(CHG)。然后,采用圖上的標(biāo)簽傳播預(yù)測(cè)有前途的公司,而這些公司能夠確保成功的結(jié)束離線銷售的方式。
基于多網(wǎng)絡(luò)群體鏈接預(yù)測(cè)的元路徑:日常生活中,在線社交網(wǎng)絡(luò)由于提供各種服務(wù)而變得無(wú)處不在。同時(shí),當(dāng)前用戶通常同時(shí)涉及多個(gè)在線社交網(wǎng)絡(luò)并享受不同網(wǎng)絡(luò)提供的特定服務(wù)。一般地,社交網(wǎng)絡(luò)通常共享一些共同用戶而被稱之為部分一致網(wǎng)絡(luò)。J.Zhang等人想在多個(gè)部分一致的社交網(wǎng)絡(luò)中同時(shí)預(yù)測(cè)社交鏈接的形成。這一問(wèn)題被正式定義為多網(wǎng)絡(luò)鏈接預(yù)測(cè)(形成)問(wèn)題。在多個(gè)部分一致的社交網(wǎng)絡(luò)中,用戶通過(guò)彼此相連可以形成廣闊的鏈接。
為了給這些用戶間不同的連接分類,他們提出了7種“網(wǎng)內(nèi)社交元路徑”和4類“網(wǎng)間元路徑”。這些“社交元路徑”在網(wǎng)絡(luò)中覆蓋多種多樣的連接信息,這些連接信息中的一些對(duì)解決多網(wǎng)絡(luò)鏈接預(yù)測(cè)問(wèn)題有幫助,而另一些則不能。為了利用有用的連接信息,大多數(shù)有用“社交元路徑”的一個(gè)子集被選取,而選取過(guò)程在形式上被定義為“社交元路徑選擇”。J.Zhang等人提出了一個(gè)叫做“多網(wǎng)絡(luò)鏈接標(biāo)識(shí)符”(Multi-Network Link Identifier,MLI)有效框架,用于解決一般鏈接信息預(yù)測(cè)的問(wèn)題。在多個(gè)部分一致社交網(wǎng)絡(luò)中基于可選擇“社交網(wǎng)絡(luò)元路徑”抽取并建立異構(gòu)拓?fù)涮卣?,MLI能在全局一致網(wǎng)絡(luò)中輔助提煉和消除互相預(yù)測(cè)的結(jié)果。
電子商務(wù)中捆綁推薦:在當(dāng)今電商中,推薦系統(tǒng)已經(jīng)成為一個(gè)重要的組成部分。當(dāng)前在推薦系統(tǒng)方面的研究主要關(guān)注于改進(jìn)單個(gè)推薦商品的相關(guān)性和盈利率。但事實(shí)上,用戶通常接觸的是一個(gè)商品集合,他們可能在一個(gè)訂單中購(gòu)買多個(gè)商品。因此,單個(gè)商品的相關(guān)性和盈利性可能實(shí)際上依賴于集合中的其它商品。換句話說(shuō),推薦集合是商品之間必須捆綁銷售的。T.Zhu等人介紹一種被稱為捆綁推薦問(wèn)題的新問(wèn)題。為了解決這類問(wèn)題,他們找出與首選經(jīng)營(yíng)目標(biāo)相關(guān)的最優(yōu)化商品捆綁進(jìn)行推薦。然而,捆綁推薦問(wèn)題是一個(gè)大規(guī)模NP難問(wèn)題。他們認(rèn)為依賴輸入數(shù)據(jù)的屬性解決小版本的捆綁推薦問(wèn)題是綽綽有余的。
城市貧困程度度量:精確和及時(shí)的度量一個(gè)城市社會(huì)經(jīng)濟(jì)的貧困指數(shù)已經(jīng)成為世界各地政府優(yōu)先考慮的事項(xiàng)。因?yàn)橐?jiàn)證的大規(guī)模城市化進(jìn)程正在引起高度不平衡而這些都是需要被調(diào)停的。習(xí)慣上,貧困指數(shù)是由人口普查數(shù)據(jù)獲取的,然而這種獲取方式成本較高,而且是每隔幾年才能獲取。最近幾年中,可替代的計(jì)算方法在一定的時(shí)空粒度上被提出來(lái)用于自動(dòng)提取貧困指數(shù)。然而,它們通常要求訪問(wèn)數(shù)據(jù)集(例如詳細(xì)的記錄),而這些是不能公開(kāi)從政府和代理機(jī)構(gòu)獲取到的。為了彌補(bǔ),Desislava Hristova等人提出了一種新方法用以在一個(gè)較好的時(shí)空粒度上自動(dòng)挖掘貧困指數(shù),這方法只需要自由獲取用戶生成內(nèi)容即可。更確切地說(shuō),這種方法需要訪問(wèn)數(shù)據(jù)集來(lái)描述在物理世界中什么城市元素需要被提出來(lái)。
城市環(huán)境中的拓?fù)鋵傩院蜁r(shí)間動(dòng)態(tài)性:理解空間網(wǎng)絡(luò)是由移動(dòng)用戶的軌跡形成對(duì)于流行病的局部搜索的應(yīng)用是有幫助的。盡管在很多領(lǐng)域具有潛在影響,但是由于在一個(gè)較好的時(shí)空解決方案上缺乏大規(guī)模數(shù)據(jù),因此人類移動(dòng)性網(wǎng)絡(luò)的一些方面仍舊沒(méi)有被大范圍探究。Anastasios Noulas等人對(duì)地區(qū)網(wǎng)絡(luò)的拓?fù)鋵傩赃M(jìn)行了經(jīng)驗(yàn)分析,在重尾度分布,三元閉合機(jī)制和小世界屬性等方面記錄他們與社交網(wǎng)絡(luò)的相似之處。然而與社交網(wǎng)絡(luò)不同的是,在同配性方面地區(qū)網(wǎng)絡(luò)顯現(xiàn)出一種混合連接的趨勢(shì)。而這個(gè)與那些網(wǎng)絡(luò)圖具有驚人的相似點(diǎn)。Anastasios Noulas等人利用額外的語(yǔ)義信息來(lái)解釋那些在網(wǎng)絡(luò)中承擔(dān)功能角色的節(jié)點(diǎn)(例如,旅游中心或者食物點(diǎn))的行為。最后,在地區(qū)網(wǎng)絡(luò)中隨著時(shí)間的流逝,大規(guī)模新鏈接的出現(xiàn),他們提出了一種新的重力模型,用以把城市環(huán)境中地區(qū)間連通性的三個(gè)本質(zhì)元素(網(wǎng)絡(luò)層交互、人類移動(dòng)性的動(dòng)態(tài)性、地理距離)聚集在一起。
地理社交網(wǎng)絡(luò)中的多層經(jīng)紀(jì):開(kāi)放的網(wǎng)絡(luò)結(jié)構(gòu)和經(jīng)紀(jì)位置長(zhǎng)期被認(rèn)為是在維持社會(huì)資本和競(jìng)爭(zhēng)優(yōu)勢(shì)方面發(fā)揮了至關(guān)重要的作用。原本斷開(kāi)個(gè)體的中介程度能把在線和離線社交網(wǎng)絡(luò)區(qū)分開(kāi)。例如,用戶可能是兩個(gè)在線用戶的中介,而這兩個(gè)用戶通過(guò)社交媒體進(jìn)行信息檢索來(lái)交換離線信息。然而,社會(huì)資本的網(wǎng)絡(luò)研究在線上和線下的相互影響中通常被忽略,而主要集中在單層上。Desislava Hristova等人提出了一種地理社會(huì)的多層方法用以中介,這就使得整合社會(huì)資本的線上和線下基礎(chǔ)的真相被揭露出來(lái)。他們通過(guò)核查在線社交網(wǎng)絡(luò)中用戶的位置和用戶通過(guò)簽入check-ins數(shù)據(jù)的離線移動(dòng)模式來(lái)擴(kuò)展中介的概念。他們發(fā)現(xiàn),通過(guò)社交和協(xié)同定位網(wǎng)絡(luò)的社交和地圖中介的位置明顯而且不對(duì)稱。一方面,事實(shí)上如果用戶的離線位置也被納入考慮范圍的話,當(dāng)用戶中介能力得到緩和的時(shí)候,他們可能會(huì)表現(xiàn)為經(jīng)紀(jì)人的特征。另一方面,在網(wǎng)絡(luò)中用戶表現(xiàn)出不足的離線經(jīng)紀(jì)業(yè)務(wù)實(shí)力可能激活經(jīng)紀(jì)人,而這些把在線和離線交互連接在了一起。
從在線關(guān)注跟蹤城市經(jīng)濟(jì)增長(zhǎng):城市資源是根據(jù)社會(huì)經(jīng)濟(jì)指標(biāo)進(jìn)行分配的,發(fā)展中國(guó)家的快速城市化需要及時(shí)更新這些指標(biāo)。人口普查數(shù)據(jù)收集的高昂成本使得這種及時(shí)更新變得非常困難。為了避免依據(jù)過(guò)時(shí)的指標(biāo)分配資源,可使用數(shù)據(jù)對(duì)這些指標(biāo)進(jìn)行部分更新和補(bǔ)充。在發(fā)達(dá)國(guó)家(主要是在英美)使用社交媒體來(lái)達(dá)到這個(gè)目的是可能的。Carmen Vaca Ruiz等人分析了微博服務(wù)中的一個(gè)隨機(jī)樣本并準(zhǔn)確預(yù)測(cè)出了城市的GDP值。為了進(jìn)行預(yù)測(cè),他們利用全球地方性的社會(huì)學(xué)概念說(shuō)明,經(jīng)濟(jì)上成功的城市趨向于同時(shí)在本地和全球范圍內(nèi)涉及交互。事實(shí)上,利用社交媒體數(shù)據(jù)度量一個(gè)城市的全球地方性能有效表示這個(gè)城市的幸福感。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提出一種社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法及系統(tǒng)。
一種社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法,其包括如下步驟:
S1、提取需要探測(cè)的優(yōu)質(zhì)節(jié)點(diǎn)所在的社交網(wǎng)絡(luò)節(jié)點(diǎn)集合;
S2、對(duì)社交網(wǎng)絡(luò)節(jié)點(diǎn)集合中的社交網(wǎng)絡(luò)節(jié)點(diǎn)建立社交網(wǎng)絡(luò)的節(jié)點(diǎn)映射關(guān)系;
S3、根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征;根據(jù)提取的優(yōu)質(zhì)節(jié)點(diǎn)特征建立優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的特征規(guī)則模型;
S4、將社交網(wǎng)絡(luò)節(jié)點(diǎn)作為實(shí)驗(yàn)樣本進(jìn)行分組,然后進(jìn)行分組訓(xùn)練和節(jié)點(diǎn)分類;
S5、對(duì)優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的結(jié)果進(jìn)行評(píng)估并反饋結(jié)果,并在反復(fù)地訓(xùn)練過(guò)程中將不符合探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征的規(guī)則進(jìn)行校正,從而達(dá)到對(duì)模型進(jìn)行優(yōu)化的目的;
S6、將優(yōu)化后的模型再次回到步驟S4節(jié)點(diǎn)訓(xùn)練與分類環(huán)節(jié)進(jìn)行優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)以提高探測(cè)進(jìn)度,并進(jìn)行迭代運(yùn)算直到優(yōu)質(zhì)節(jié)點(diǎn)的探測(cè)進(jìn)度超過(guò)設(shè)定閾值從而完成整個(gè)社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法中,
所述步驟S3中根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征包括:
設(shè)置節(jié)點(diǎn)被判斷為優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性,在某一節(jié)點(diǎn)具備優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性時(shí),則該節(jié)點(diǎn)屬性具有高優(yōu)質(zhì)性的特征;
設(shè)置節(jié)點(diǎn)之間隨著時(shí)間的推移就應(yīng)具備頻繁的交互性,稱之為交互度Vinter;在社交網(wǎng)絡(luò)中,如節(jié)點(diǎn)具有核心節(jié)點(diǎn)的特征,且它們與周邊節(jié)點(diǎn)間存在連接邊;在這些連接邊中,將優(yōu)質(zhì)節(jié)點(diǎn)的主動(dòng)交互看作是出度Vout,出度為自身指向其它節(jié)點(diǎn)的邊,而被動(dòng)交互看作入度Vin,入度為其它節(jié)點(diǎn)指向自身的邊,則優(yōu)質(zhì)節(jié)點(diǎn)往往同時(shí)存在超過(guò)第一預(yù)設(shè)閾值的入度和出度,且出度入度比接近于1;
將同時(shí)存在超過(guò)預(yù)設(shè)值的入度和出度,且出度入度比大于1且大于第二預(yù)設(shè)閾值的節(jié)點(diǎn)作為非優(yōu)質(zhì)節(jié)點(diǎn)。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法中,所述步驟S3中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程的矩陣表示如下:
映射矩陣為被探測(cè)對(duì)象的入度與出度之間的映射關(guān)系矩陣;其中,Min×out表示矩陣名稱,In表示節(jié)點(diǎn)的入度集合,Out表示節(jié)點(diǎn)的出度集合;Vi,in,i=1...n和Vj,out,j=1...m分別表示節(jié)點(diǎn)i的入度和節(jié)點(diǎn)j的出度;i=1...n,j=1...m表示節(jié)點(diǎn)i入度和節(jié)點(diǎn)j出度比值;當(dāng)i=j(luò)時(shí),可對(duì)優(yōu)質(zhì)節(jié)點(diǎn)和非優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行探測(cè),此時(shí)優(yōu)質(zhì)節(jié)點(diǎn)的Pij趨向于1,而非優(yōu)質(zhì)節(jié)點(diǎn)的Pij大于1且大于第二預(yù)設(shè)閾值或小于1且小于第三預(yù)設(shè)閾值;而當(dāng)i≠j時(shí),若Pij=0表明不同節(jié)點(diǎn)間不存在交互關(guān)系,否則節(jié)點(diǎn)間就存在交互關(guān)系。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法中,所述步驟S5中還包括制定探測(cè)結(jié)果的召回率和準(zhǔn)確率,并對(duì)準(zhǔn)確率進(jìn)行閾值設(shè)定,以決定是否跳轉(zhuǎn)到步驟S6進(jìn)行迭代運(yùn)算過(guò)程。
本發(fā)明還提供一種社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其包括如下單元:
節(jié)點(diǎn)集合獲取單元,用于提取需要探測(cè)的優(yōu)質(zhì)節(jié)點(diǎn)所在的社交網(wǎng)絡(luò)節(jié)點(diǎn)集合;
映射關(guān)系建立單元,用于對(duì)社交網(wǎng)絡(luò)節(jié)點(diǎn)集合中的社交網(wǎng)絡(luò)節(jié)點(diǎn)建立社交網(wǎng)絡(luò)的節(jié)點(diǎn)映射關(guān)系;
優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元,用于根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征;根據(jù)提取的優(yōu)質(zhì)節(jié)點(diǎn)特征建立優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的特征規(guī)則模型;
分組訓(xùn)練單元,用于將社交網(wǎng)絡(luò)節(jié)點(diǎn)作為實(shí)驗(yàn)樣本進(jìn)行分組,然后進(jìn)行分組訓(xùn)練和節(jié)點(diǎn)分類;
評(píng)估反饋單元,用于對(duì)優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的結(jié)果進(jìn)行評(píng)估并反饋結(jié)果,并在反復(fù)地訓(xùn)練過(guò)程中將不符合探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征的規(guī)則進(jìn)行校正,從而達(dá)到對(duì)模型進(jìn)行優(yōu)化的目的;
迭代單元,用于將優(yōu)化后的模型再次回到分組訓(xùn)練單元的節(jié)點(diǎn)訓(xùn)練與分類環(huán)節(jié)進(jìn)行優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)以提高探測(cè)進(jìn)度,并進(jìn)行迭代運(yùn)算直到優(yōu)質(zhì)節(jié)點(diǎn)的探測(cè)進(jìn)度超過(guò)設(shè)定閾值從而完成整個(gè)社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng)中,
所述優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元中根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征包括:
設(shè)置節(jié)點(diǎn)被判斷為優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性,在某一節(jié)點(diǎn)具備優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性時(shí),則該節(jié)點(diǎn)屬性具有高優(yōu)質(zhì)性的特征;
設(shè)置節(jié)點(diǎn)之間隨著時(shí)間的推移就應(yīng)具備頻繁的交互性,稱之為交互度Vinter;在社交網(wǎng)絡(luò)中,如節(jié)點(diǎn)具有核心節(jié)點(diǎn)的特征,且它們與周邊節(jié)點(diǎn)間存在連接邊;在這些連接邊中,將優(yōu)質(zhì)節(jié)點(diǎn)的主動(dòng)交互看作是出度Vout,出度為自身指向其它節(jié)點(diǎn)的邊,而被動(dòng)交互看作入度Vin,入度為其它節(jié)點(diǎn)指向自身的邊,則優(yōu)質(zhì)節(jié)點(diǎn)往往同時(shí)存在超過(guò)第一預(yù)設(shè)閾值的入度和出度,且出度入度比接近于1;
將同時(shí)存在超過(guò)預(yù)設(shè)值的入度和出度,且出度入度比大于1且大于第二預(yù)設(shè)閾值的節(jié)點(diǎn)作為非優(yōu)質(zhì)節(jié)點(diǎn)。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng)中,所述優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程的矩陣表示如下:
映射矩陣為被探測(cè)對(duì)象的入度與出度之間的映射關(guān)系矩陣;其中,Min×out表示矩陣名稱,In表示節(jié)點(diǎn)的入度集合,Out表示節(jié)點(diǎn)的出度集合;Vi,in,i=1...n和Vj,out,j=1...m分別表示節(jié)點(diǎn)i的入度和節(jié)點(diǎn)j的出度;i=1...n,j=1...m表示節(jié)點(diǎn)i入度和節(jié)點(diǎn)j出度比值;當(dāng)i=j(luò)時(shí),可對(duì)優(yōu)質(zhì)節(jié)點(diǎn)和非優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行探測(cè),此時(shí)優(yōu)質(zhì)節(jié)點(diǎn)的Pij趨向于1,而非優(yōu)質(zhì)節(jié)點(diǎn)的Pij大于1且大于第二預(yù)設(shè)閾值或小于1且小于第三預(yù)設(shè)閾值;而當(dāng)i≠j時(shí),若Pij=0表明不同節(jié)點(diǎn)間不存在交互關(guān)系,否則節(jié)點(diǎn)間就存在交互關(guān)系。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng)中,所述評(píng)估反饋單元中還包括制定探測(cè)結(jié)果的召回率和準(zhǔn)確率,并對(duì)準(zhǔn)確率進(jìn)行閾值設(shè)定,以決定是否跳轉(zhuǎn)到迭代單元進(jìn)行迭代運(yùn)算過(guò)程。
實(shí)施本發(fā)明提供的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法及系統(tǒng)與現(xiàn)有技術(shù)相比具有以下有益效果:通過(guò)以觀察者對(duì)優(yōu)質(zhì)用戶發(fā)現(xiàn)的知識(shí)和經(jīng)驗(yàn)為基礎(chǔ),從中提取優(yōu)質(zhì)用戶所具備的特征建立關(guān)聯(lián)規(guī)則和特征識(shí)別庫(kù)。將觀察者發(fā)現(xiàn)優(yōu)質(zhì)用戶的問(wèn)題引入到社交網(wǎng)絡(luò)的研究領(lǐng)域中,以社交網(wǎng)絡(luò)的圖挖掘?yàn)槔碚撘罁?jù),將該問(wèn)題轉(zhuǎn)化為社交網(wǎng)絡(luò)中發(fā)現(xiàn)和探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)的問(wèn)題并對(duì)其加以解決,能夠用于發(fā)現(xiàn)社交網(wǎng)絡(luò)中與用戶需求具有較高契合度的核心節(jié)點(diǎn),能夠有助于社會(huì)關(guān)系網(wǎng)絡(luò)中個(gè)體充分實(shí)現(xiàn)自己的價(jià)值。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)方法示意圖;
圖2是本發(fā)明實(shí)施例的“教師-學(xué)生”社交關(guān)系下的優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)模型示意圖;
圖3是本發(fā)明實(shí)施例的優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的矩陣描述圖;
圖4是本發(fā)明實(shí)施例的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng)結(jié)構(gòu)框圖。
具體實(shí)施方式
如圖1至4所示,本發(fā)明實(shí)施例提出的一種社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)的探測(cè)方法及系統(tǒng),用于發(fā)現(xiàn)社交網(wǎng)絡(luò)中與用戶需求具有較高契合度的核心節(jié)點(diǎn)。在物理世界中,這一探測(cè)方法具有廣闊的應(yīng)用前景。例如,在“老師-學(xué)生”關(guān)系這類社交網(wǎng)絡(luò)中,作為老師期盼尋求優(yōu)秀的學(xué)生來(lái)做重點(diǎn)培養(yǎng),而作為學(xué)生希望找到優(yōu)秀的老師來(lái)輔導(dǎo)自己學(xué)習(xí);在“企業(yè)-客戶”關(guān)系這類社交網(wǎng)絡(luò)中,作為企業(yè)希望找到優(yōu)質(zhì)的客戶與自己形成穩(wěn)固的戰(zhàn)略合作伙伴關(guān)系,并把自己的產(chǎn)品銷售給客戶以從中獲取利潤(rùn),而作為期盼選擇優(yōu)質(zhì)的企業(yè)來(lái)購(gòu)買產(chǎn)品以滿足自己的消費(fèi)需求;在“企業(yè)-人才”關(guān)系這類社交網(wǎng)絡(luò)中,作為企業(yè)希望招攬高素質(zhì)高水平的人才來(lái)為公司創(chuàng)造更多的商業(yè)價(jià)值,而作為人才需要找到適合自己的企業(yè)來(lái)實(shí)現(xiàn)自己的人生價(jià)值和抱負(fù)。諸如此類的社交網(wǎng)絡(luò)關(guān)系比比皆是,由此可見(jiàn),在眾多社交網(wǎng)絡(luò)的節(jié)點(diǎn)中對(duì)優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行探測(cè)具有非常重要的社會(huì)價(jià)值和現(xiàn)實(shí)意義的。為了解決社交網(wǎng)絡(luò)中針對(duì)優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行探測(cè)的問(wèn)題,現(xiàn)將解決問(wèn)題的思路和步驟如圖1所示。從圖1中可以看出,首先要提取需要探測(cè)的優(yōu)質(zhì)節(jié)點(diǎn)所在的社交網(wǎng)絡(luò)節(jié)點(diǎn)集合。例如上文所述的,優(yōu)秀老師或優(yōu)秀學(xué)生所在“老師-學(xué)生”關(guān)系的社交網(wǎng)絡(luò)節(jié)點(diǎn)集合。在提取社交網(wǎng)絡(luò)節(jié)點(diǎn)集合的全集之后,需要對(duì)社交網(wǎng)絡(luò)節(jié)點(diǎn)建立社交網(wǎng)絡(luò)的節(jié)點(diǎn)映射關(guān)系。然后,根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)需要滿足哪些特征。例如,優(yōu)秀的學(xué)生往往喜歡提問(wèn)題。那么這一現(xiàn)象就可成為探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)的特征。待優(yōu)質(zhì)節(jié)點(diǎn)特征被提取出來(lái)以后就可建立優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的特征規(guī)則模型。之后,可將社交網(wǎng)絡(luò)節(jié)點(diǎn)看作實(shí)驗(yàn)樣本進(jìn)行分組,然后進(jìn)行分組訓(xùn)練和節(jié)點(diǎn)分類。之后,可對(duì)優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的結(jié)果進(jìn)行評(píng)估并反饋結(jié)果,并在反復(fù)地訓(xùn)練過(guò)程中將不太符合探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征的規(guī)則進(jìn)行校正,以達(dá)到對(duì)模型進(jìn)行優(yōu)化的目的。最后,將優(yōu)化后的模型再次回到節(jié)點(diǎn)訓(xùn)練與分類環(huán)節(jié)進(jìn)行優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)以提高探測(cè)進(jìn)度,如此進(jìn)行迭代運(yùn)算直到優(yōu)質(zhì)節(jié)點(diǎn)的探測(cè)進(jìn)度超過(guò)設(shè)定閾值來(lái)完成整個(gè)探測(cè)過(guò)程。
接下來(lái),將結(jié)合具體的應(yīng)用來(lái)詳細(xì)描述優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的過(guò)程。整個(gè)描述的過(guò)程將以眾所周知的“老師-學(xué)生”關(guān)系這一社交網(wǎng)絡(luò)進(jìn)行過(guò)程描述。如圖1所示的優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程中,最核心的環(huán)節(jié)是優(yōu)質(zhì)節(jié)點(diǎn)特征規(guī)則的提取與探測(cè)模型建立這一環(huán)節(jié)。探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)這一環(huán)節(jié)在“老師-學(xué)生”這個(gè)社交網(wǎng)絡(luò)中表現(xiàn)為探測(cè)優(yōu)秀老師或優(yōu)秀學(xué)生的問(wèn)題。
接下來(lái),將以老師發(fā)現(xiàn)優(yōu)秀學(xué)生的過(guò)程為例進(jìn)行節(jié)點(diǎn)探測(cè)特征規(guī)則提取過(guò)程的詳細(xì)描述。
通過(guò)現(xiàn)實(shí)生活中經(jīng)驗(yàn)可以得出,優(yōu)秀的學(xué)生通常表現(xiàn)出自身優(yōu)秀的個(gè)人屬性。例如,他們愛(ài)思考問(wèn)題,熱衷于獨(dú)立思考并將難以解決的問(wèn)題歸納總結(jié)出來(lái)向老師請(qǐng)教,與老師形成頻繁互動(dòng)。優(yōu)秀的學(xué)生除了表現(xiàn)出優(yōu)秀的自身屬性外,他們通常會(huì)與周圍的其它同學(xué)談?wù)搯?wèn)題從而形成廣泛的意見(jiàn)交流。因此,透過(guò)這些日常觀察可以提取這些直觀的優(yōu)質(zhì)節(jié)點(diǎn)特征規(guī)則。而這些直觀規(guī)則在社交網(wǎng)絡(luò)的理論中可歸納如下:
1、優(yōu)秀學(xué)生自身具有優(yōu)秀的個(gè)人屬性(愛(ài)思考、愛(ài)提問(wèn)、善于歸納總結(jié)等),那么節(jié)點(diǎn)屬性具有高優(yōu)質(zhì)性的特征;
2、優(yōu)秀學(xué)生向教師節(jié)點(diǎn)頻繁提問(wèn),與教師進(jìn)行互動(dòng)交流,那么優(yōu)質(zhì)節(jié)點(diǎn)與教師節(jié)點(diǎn)(周邊學(xué)生節(jié)點(diǎn))之間,隨著時(shí)間的推移就應(yīng)具備頻繁的交互性,稱之為交互度Vinter。體現(xiàn)在社交網(wǎng)絡(luò)中,這些節(jié)點(diǎn)可能具有核心節(jié)點(diǎn)的特征,且它們與周邊節(jié)點(diǎn)間存在連接邊。在這些連接邊中,若把優(yōu)質(zhì)節(jié)點(diǎn)的主動(dòng)交互看作是出度Vout(自身指向其它節(jié)點(diǎn)的邊),而被動(dòng)交互看作入度Vin(其它節(jié)點(diǎn)指向自身的邊),那么優(yōu)質(zhì)節(jié)點(diǎn)往往同時(shí)存在較大的入度和出度,且(出度入度比)可能接近于1;
3、具有頻繁交互的節(jié)點(diǎn)有可能是非優(yōu)質(zhì)節(jié)點(diǎn)。例如,一個(gè)成績(jī)較差的學(xué)生往往為了提升學(xué)習(xí)成績(jī),與周邊節(jié)點(diǎn)和教師節(jié)點(diǎn)間也存在頻繁交互。因此在探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)的分類過(guò)程中,往往容易將這類節(jié)點(diǎn)誤分類到優(yōu)質(zhì)節(jié)點(diǎn)集合中。然而,這類節(jié)點(diǎn)雖然具有較大的出度,但它們的入度并不是很大,因此可能遠(yuǎn)大于1。由此,可將優(yōu)質(zhì)節(jié)點(diǎn)與非優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行更精確的區(qū)分。
上述規(guī)則采用社交網(wǎng)絡(luò)圖模型的方式可進(jìn)行直觀描述,如圖2所示。從圖2中可以直觀的看出,優(yōu)質(zhì)節(jié)點(diǎn)與教師節(jié)點(diǎn)集合和學(xué)生集合的交互情況。通過(guò)結(jié)合上述描述的三條規(guī)則即可將優(yōu)質(zhì)節(jié)點(diǎn)與非優(yōu)質(zhì)節(jié)點(diǎn)明顯的區(qū)分開(kāi)。
對(duì)于其它關(guān)系下的社交網(wǎng)絡(luò)的優(yōu)質(zhì)節(jié)點(diǎn)特征規(guī)則的提取原理可遵照本專利中描述的提取過(guò)程類比完成。例如,“企業(yè)-客戶”關(guān)系下一個(gè)優(yōu)質(zhì)客戶的行為往往與企業(yè)之間存在強(qiáng)交互性,再通過(guò)觀察并結(jié)合客戶自身存在的滿足企業(yè)需求的優(yōu)質(zhì)屬性,同樣可使企業(yè)達(dá)到發(fā)現(xiàn)優(yōu)質(zhì)客戶的目的。
因此,圖2中的示意圖還可采用矩陣描述的方法進(jìn)行一般意義上的優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程的形式化描述。如圖3所示,為優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程的矩陣描述方法。
從如圖3中可以看出,該映射矩陣為被探測(cè)對(duì)象的入度與出度之間的映射關(guān)系矩陣。其中,Min×out表示矩陣名稱,In表示節(jié)點(diǎn)的入度集合,Out表示節(jié)點(diǎn)的出度集合。Vi,in,i=1...n和Vj,out,j=1...m分別表示節(jié)點(diǎn)i的入度和節(jié)點(diǎn)j的出度。i=1...n,j=1...m表示節(jié)點(diǎn)i入度和節(jié)點(diǎn)j出度比值。有上文所述的規(guī)則可知,當(dāng)i=j(luò)時(shí),可對(duì)優(yōu)質(zhì)節(jié)點(diǎn)和非優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行探測(cè),此時(shí)優(yōu)質(zhì)節(jié)點(diǎn)的Pij通常趨向于1,而非優(yōu)質(zhì)節(jié)點(diǎn)的Pij通常遠(yuǎn)大于1或遠(yuǎn)小于1。而當(dāng)i≠j時(shí),若Pij=0表明不同節(jié)點(diǎn)間不存在交互關(guān)系,否則節(jié)點(diǎn)間就存在交互關(guān)系。因此,通過(guò)矩陣運(yùn)算也可達(dá)到優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的目的。
評(píng)估結(jié)果與反饋:針對(duì)優(yōu)質(zhì)節(jié)點(diǎn)的評(píng)估標(biāo)準(zhǔn)往往遵照探測(cè)結(jié)果是否滿足探測(cè)需求來(lái)進(jìn)行制定。例如,“老師-學(xué)生”關(guān)系下的優(yōu)秀學(xué)生的探測(cè)結(jié)果,如果探測(cè)模型得到的探測(cè)結(jié)果并非是一個(gè)優(yōu)秀學(xué)生,那么評(píng)估標(biāo)準(zhǔn)的制定就應(yīng)該進(jìn)行修正。例如,可制定探測(cè)結(jié)果的召回率和準(zhǔn)確率,并對(duì)準(zhǔn)確率進(jìn)行閾值設(shè)定,以決定是否要繼續(xù)如圖1所示的迭代運(yùn)算過(guò)程。
如圖4所示,本發(fā)明實(shí)施例還提供一種社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其包括如下單元:
節(jié)點(diǎn)集合獲取單元,用于提取需要探測(cè)的優(yōu)質(zhì)節(jié)點(diǎn)所在的社交網(wǎng)絡(luò)節(jié)點(diǎn)集合。
映射關(guān)系建立單元,用于對(duì)社交網(wǎng)絡(luò)節(jié)點(diǎn)集合中的社交網(wǎng)絡(luò)節(jié)點(diǎn)建立社交網(wǎng)絡(luò)的節(jié)點(diǎn)映射關(guān)系。
優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元,用于根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征;根據(jù)提取的優(yōu)質(zhì)節(jié)點(diǎn)特征建立優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的特征規(guī)則模型。
分組訓(xùn)練單元,用于將社交網(wǎng)絡(luò)節(jié)點(diǎn)作為實(shí)驗(yàn)樣本進(jìn)行分組,然后進(jìn)行分組訓(xùn)練和節(jié)點(diǎn)分類。
評(píng)估反饋單元,用于對(duì)優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的結(jié)果進(jìn)行評(píng)估并反饋結(jié)果,并在反復(fù)地訓(xùn)練過(guò)程中將不符合探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征的規(guī)則進(jìn)行校正,從而達(dá)到對(duì)模型進(jìn)行優(yōu)化的目的。
迭代單元,用于將優(yōu)化后的模型再次回到分組訓(xùn)練單元的節(jié)點(diǎn)訓(xùn)練與分類環(huán)節(jié)進(jìn)行優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)以提高探測(cè)進(jìn)度,并進(jìn)行迭代運(yùn)算直到優(yōu)質(zhì)節(jié)點(diǎn)的探測(cè)進(jìn)度超過(guò)設(shè)定閾值從而完成整個(gè)社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng)中,
所述優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元中根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征包括:
設(shè)置節(jié)點(diǎn)被判斷為優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性,在某一節(jié)點(diǎn)具備優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性時(shí),則該節(jié)點(diǎn)屬性具有高優(yōu)質(zhì)性的特征;
設(shè)置節(jié)點(diǎn)之間隨著時(shí)間的推移就應(yīng)具備頻繁的交互性,稱之為交互度Vinter;在社交網(wǎng)絡(luò)中,如節(jié)點(diǎn)具有核心節(jié)點(diǎn)的特征,且它們與周邊節(jié)點(diǎn)間存在連接邊;在這些連接邊中,將優(yōu)質(zhì)節(jié)點(diǎn)的主動(dòng)交互看作是出度Vout,出度為自身指向其它節(jié)點(diǎn)的邊,而被動(dòng)交互看作入度Vin,入度為其它節(jié)點(diǎn)指向自身的邊,則優(yōu)質(zhì)節(jié)點(diǎn)往往同時(shí)存在超過(guò)第一預(yù)設(shè)閾值的入度和出度,且出度入度比接近于1;
將同時(shí)存在超過(guò)預(yù)設(shè)值的入度和出度,且出度入度比大于1且大于第二預(yù)設(shè)閾值的節(jié)點(diǎn)作為非優(yōu)質(zhì)節(jié)點(diǎn)。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng)中,所述優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過(guò)程的矩陣表示如下:
映射矩陣為被探測(cè)對(duì)象的入度與出度之間的映射關(guān)系矩陣;其中,Min×out表示矩陣名稱,In表示節(jié)點(diǎn)的入度集合,Out表示節(jié)點(diǎn)的出度集合;Vi,in,i=1...n和Vj,out,j=1...m分別表示節(jié)點(diǎn)i的入度和節(jié)點(diǎn)j的出度;i=1...n,j=1...m表示節(jié)點(diǎn)i入度和節(jié)點(diǎn)j出度比值;當(dāng)i=j(luò)時(shí),可對(duì)優(yōu)質(zhì)節(jié)點(diǎn)和非優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行探測(cè),此時(shí)優(yōu)質(zhì)節(jié)點(diǎn)的Pij趨向于1,而非優(yōu)質(zhì)節(jié)點(diǎn)的Pij大于1且大于第二預(yù)設(shè)閾值或小于1且小于第三預(yù)設(shè)閾值;而當(dāng)i≠j時(shí),若Pij=0表明不同節(jié)點(diǎn)間不存在交互關(guān)系,否則節(jié)點(diǎn)間就存在交互關(guān)系。
第二預(yù)設(shè)閾值遠(yuǎn)大于1,且可以自主設(shè)置;第三預(yù)設(shè)閾值遠(yuǎn)小于1,且可以自主設(shè)置。
在本發(fā)明所述的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng)中,所述評(píng)估反饋單元中還包括制定探測(cè)結(jié)果的召回率和準(zhǔn)確率,并對(duì)準(zhǔn)確率進(jìn)行閾值設(shè)定,以決定是否跳轉(zhuǎn)到迭代單元進(jìn)行迭代運(yùn)算過(guò)程。
可以理解的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),可以根據(jù)本發(fā)明的技術(shù)構(gòu)思做出其它各種相應(yīng)的改變與變形,而所有這些改變與變形都應(yīng)屬于本發(fā)明權(quán)利要求的保護(hù)范圍。