本發(fā)明涉及一種仿真網(wǎng)絡(luò)生成方法。
背景技術(shù):
:作為網(wǎng)絡(luò)科學的重要研究領(lǐng)域之一,網(wǎng)絡(luò)節(jié)點分類技術(shù)已經(jīng)得到了廣泛關(guān)注,并且在身份識別、反恐、信息推薦等領(lǐng)域有著重要的應(yīng)用價值。網(wǎng)絡(luò)節(jié)點分類技術(shù)是指:利用網(wǎng)絡(luò)中一部分已知節(jié)點的類別去預(yù)測其余未知節(jié)點的類別。傳統(tǒng)分類技術(shù)通常假設(shè)數(shù)據(jù)之間是獨立同分布的,然而網(wǎng)絡(luò)數(shù)據(jù)之間往往存在較強的關(guān)聯(lián),這使得節(jié)點的類別不僅與自身的屬性相關(guān),還與鄰居節(jié)點、拓撲結(jié)構(gòu)等網(wǎng)絡(luò)屬性有著密切的聯(lián)系。節(jié)點分類方法可以利用上述特征來提高分類性能。例如,當認為網(wǎng)絡(luò)中同質(zhì)性較強的時候(即節(jié)點傾向于和自身類別相似的節(jié)點連接),利用鄰居節(jié)點加權(quán)投票的方法就能夠獲得更為滿意的結(jié)果。不同的分類方法依賴的網(wǎng)絡(luò)屬性有所不同,因此,為了評價一種分類方法的適用領(lǐng)域,往往需要在具有不同特征的網(wǎng)絡(luò)上進行對比分析。然而,在當前階段,適用于網(wǎng)絡(luò)分類評估的真實網(wǎng)絡(luò)還相對較少,其網(wǎng)絡(luò)特征也較為單一,無法充分評估分類方法的性能,這也使得生成具有不同網(wǎng)絡(luò)特征的仿真網(wǎng)絡(luò)成為評價分類方法性能的重要手段。傳統(tǒng)的網(wǎng)絡(luò)生成方法關(guān)注拓撲結(jié)構(gòu)的生成,其核心思想是生成與真實網(wǎng)絡(luò)拓撲結(jié)構(gòu)(小世界、無標度)更為相近的仿真網(wǎng)絡(luò)。然而,由于生成的網(wǎng)絡(luò)并沒有標簽信息,往往無法直接使用這些網(wǎng)絡(luò)對節(jié)點分類方法進行評估。此外,也有學者嘗試根據(jù)同質(zhì)性等指標,生成帶有標簽的仿真網(wǎng)絡(luò)。然而,這些帶有標簽的生成方法對于拓撲結(jié)構(gòu)的約束較少,使得其生成的網(wǎng)絡(luò)拓撲結(jié)構(gòu)與真實的網(wǎng)絡(luò)差距較大(例如,并不帶有典型的社區(qū)結(jié)構(gòu)等),導(dǎo)致這類方法生成的網(wǎng)絡(luò)也不適合對分類方法進行評估。技術(shù)實現(xiàn)要素:針對上述現(xiàn)有技術(shù)中存在的技術(shù)問題,本發(fā)明提供一種新穎的仿真網(wǎng)絡(luò)生成方法,用來準確地評估節(jié)點分類方法對不同網(wǎng)絡(luò)屬性(同質(zhì)性、節(jié)點分布比例、網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)、網(wǎng)絡(luò)的密度等)的敏感程度。近些年來,網(wǎng)絡(luò)科學的研究進展很快,已經(jīng)發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)有著一些不同以往的特征(例如小世界、冪律分布、同質(zhì)性等)。因此,現(xiàn)有的節(jié)點分類方法不只關(guān)注于節(jié)點自身的屬性,也在利用不同的網(wǎng)絡(luò)特征來輔助分類過程。然而,分類方法的建模角度有所差別,使得其受到網(wǎng)絡(luò)特征的影響程度也有所不同??傮w來看,對于節(jié)點分類有影響的網(wǎng)絡(luò)特征主要有以下兩類:(1)拓撲特征:我們關(guān)注的問題是復(fù)雜網(wǎng)絡(luò)中的節(jié)點分類問題,而不同的網(wǎng)絡(luò)有著不同的拓撲特征,例如密度(density)、直徑、度分布、聚類系數(shù)等,這些特征都是網(wǎng)絡(luò)生成過程中表現(xiàn)出的一些特有規(guī)律,其對于分類方法的影響程度也有所不同,例如,已經(jīng)知道網(wǎng)絡(luò)的密度對于協(xié)同分類有著較大的影響;(2)標簽特征:網(wǎng)絡(luò)中節(jié)點之間并不是互相獨立的,而是彼此相連,這使得節(jié)點的類別不僅與自身的屬性相關(guān),在很大程度上還依賴于鄰居節(jié)點的標簽,因此,網(wǎng)絡(luò)中節(jié)點的標簽表現(xiàn)出來的分布規(guī)律,我們稱之為網(wǎng)絡(luò)的標簽特征,也在很大程度上影響著分類方法的表現(xiàn)。為了更好地分析不同網(wǎng)絡(luò)特征對分類方法的影響,本發(fā)明提出一種仿真網(wǎng)絡(luò)生成方法,來生成具有不同網(wǎng)絡(luò)特征的仿真網(wǎng)絡(luò)。該方法包括:首先,根據(jù)指定的拓撲結(jié)構(gòu)參數(shù),如節(jié)點數(shù)量、邊的數(shù)量、最大度、平均度分布、小世界以及社區(qū)結(jié)構(gòu)等,生成接近于真實網(wǎng)絡(luò)的初步仿真網(wǎng)絡(luò)結(jié)構(gòu);其次,根據(jù)指定的標簽特征,如標簽分布比例和同質(zhì)性等,生成網(wǎng)絡(luò)中每個節(jié)點的標簽,進而得到一個適合評估網(wǎng)絡(luò)節(jié)點分類器的帶有標簽的仿真網(wǎng)絡(luò)。進一步地,在評估分類方法性能的時候,根據(jù)已知標簽的節(jié)點所占的比例的設(shè)定,隨機設(shè)定相應(yīng)數(shù)量的節(jié)點標簽為已知,得到一個待預(yù)測的仿真網(wǎng)絡(luò),此時,得到的待預(yù)測的仿真網(wǎng)絡(luò)就可以用來評估一種分類方法在指定特征下的表現(xiàn),分類方法根據(jù)當前網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和已知節(jié)點來預(yù)測未知節(jié)點的標簽。本發(fā)明的有益效果在于:1.相對于傳統(tǒng)的網(wǎng)絡(luò)生成方法,本發(fā)明不僅能夠生成接近真實網(wǎng)絡(luò)的拓撲結(jié)構(gòu),并且考慮了節(jié)點的標簽信息,使得生成的仿真網(wǎng)絡(luò)更利于全面地評估節(jié)點分類方法。2.本發(fā)明在生成網(wǎng)絡(luò)的過程中將拓撲結(jié)構(gòu)和標簽生成過程分開,可以有效地保證參數(shù)影響的獨立化,能夠更加準確的評估分類方法對于不同屬性的依賴程度。附圖說明圖1是本發(fā)明方法的預(yù)測框架圖。圖2是本發(fā)明仿真網(wǎng)絡(luò)的生成過程示例。具體實施方式如圖1所示,本發(fā)明的一種適用于網(wǎng)絡(luò)節(jié)點分類方法評估的仿真網(wǎng)絡(luò)生成方法中,首先要保證生成的網(wǎng)絡(luò)拓撲結(jié)構(gòu)更加接近真實網(wǎng)絡(luò),這樣才能更好地評估分類方法在真實世界中的表現(xiàn)。因此,本方法中,對于給定網(wǎng)絡(luò)拓撲結(jié)構(gòu)參數(shù)集合T={n,d,c,…},其中n表示節(jié)點數(shù)量,d表示密度,c表示社區(qū)結(jié)構(gòu)等,首先生成網(wǎng)絡(luò)的拓撲結(jié)構(gòu)G=<V,E>,其中V表示了網(wǎng)絡(luò)中的節(jié)點集合,E表示網(wǎng)絡(luò)中的邊集合;其次,分類方法需要利用已知節(jié)點來預(yù)測未知節(jié)點,因此需要指定與標簽相關(guān)的特征集合L={h,ld,…},其中h為網(wǎng)絡(luò)中的同質(zhì)性,ld為標簽分布比例等,按照L的限制生成網(wǎng)絡(luò)中每個節(jié)點的標簽,得到一個帶有標簽的仿真網(wǎng)絡(luò)GL=<V,E,LN>,其中LN為節(jié)點的標簽集合。在評估分類方法性能的時候,可以根據(jù)已知標簽的節(jié)點所占的比例lp的設(shè)定,隨機設(shè)定相應(yīng)數(shù)量的節(jié)點標簽為已知,得到一個待預(yù)測的仿真網(wǎng)絡(luò)GLP=<V,E,LN,UN>,其中V為節(jié)點集合,E為邊的集合,LN為已知節(jié)點的標簽集合,UN為未知節(jié)點的標簽集合。此時,標簽網(wǎng)絡(luò)GLP就可以用來評估一種分類方法NC1在指定特征<T,L>下的表現(xiàn)。例如,當我們選取準確度作為預(yù)測指標的時候,就是評估NC1預(yù)測的未知節(jié)點的標簽集合PN與UN的差異。圖2展示了一個示例網(wǎng)絡(luò)的生成過程,其中:(a)是首先指定網(wǎng)絡(luò)中節(jié)點的數(shù)量;(b)是根據(jù)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)參數(shù)生成的仿真網(wǎng)絡(luò)拓撲結(jié)構(gòu);(c)是根據(jù)網(wǎng)絡(luò)的標簽分布參數(shù)生成的仿真網(wǎng)絡(luò),此時的網(wǎng)絡(luò)已經(jīng)生成完畢;(d)為了評估分類方法的表現(xiàn),根據(jù)設(shè)定的訓練集比例,隨機選取網(wǎng)絡(luò)中部分節(jié)點為已知,其余節(jié)點為未知后,得到的標簽網(wǎng)絡(luò)。分類方法需要根據(jù)當前網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和已知節(jié)點來預(yù)測未知節(jié)點的標簽。作為復(fù)雜網(wǎng)絡(luò)的研究熱點之一,目前已經(jīng)涌現(xiàn)出大量的網(wǎng)絡(luò)節(jié)點分類方法。由于每種方法利用的網(wǎng)絡(luò)特征有所不同,其受到網(wǎng)絡(luò)屬性的影響也有所不同。我們選取其中有代表性的幾種方法(直接鄰居:wvRN;局部結(jié)構(gòu):CN;社區(qū)結(jié)構(gòu):socioDim),來驗證其在不同網(wǎng)絡(luò)屬性下的表現(xiàn)。在網(wǎng)絡(luò)生成階段,我們選取ANC(AttributedNetworkswithCommunitiesGenerator)的方法來生成網(wǎng)絡(luò)的拓撲結(jié)構(gòu)。其優(yōu)點是可以生成帶有社區(qū)結(jié)構(gòu)的網(wǎng)絡(luò),更加貼近真實網(wǎng)絡(luò)的生成過程,也可以更好地評估socioDim這類利用社區(qū)結(jié)構(gòu)進行分類的方法。在網(wǎng)絡(luò)屬性方面,我們著重分析同質(zhì)性h,標簽分布比例ld以及網(wǎng)絡(luò)的拓撲結(jié)構(gòu)T。拓撲結(jié)構(gòu)T重點關(guān)注密度和社區(qū)結(jié)構(gòu)的影響。需要注意的是,在分類過程已知節(jié)點的標注比例LP也會對分類性能產(chǎn)生影響。例如以下兩種情況:LP=0.9,即網(wǎng)絡(luò)中90%的節(jié)點類別已知,來預(yù)測10%的未知節(jié)點;LP=0.1即網(wǎng)絡(luò)中10%的節(jié)點類別已知,來預(yù)測90%的未知節(jié)點??梢悦黠@的看出,同樣的方法在兩種情況下得到的準確度是不同的,后者的情況預(yù)測過程會更加困難。對于LP=0.1這類情況下的分類,其屬于稀疏標注的問題,近些年來也得到了廣泛關(guān)注。雖然在下面的實驗中,我們也會展示LP也會對分類性能帶來的影響,但是我們并不將其劃入網(wǎng)絡(luò)屬性中。這是因為,我們認為其并沒有在網(wǎng)絡(luò)的生成過程中起到任何作用,也沒有反映出網(wǎng)絡(luò)生成過程的任何規(guī)律。LP的變化只是在一個已經(jīng)標注完全的數(shù)據(jù)集上的測試手段,用來測試分類方法在大數(shù)據(jù)時代標注稀疏情況下的泛化能力而已。下面將驗證給定的3種有代表性的分類方法,受不同網(wǎng)絡(luò)屬性的影響程度。1.固定同質(zhì)性h、標簽分布比例ld,變化網(wǎng)絡(luò)的拓撲結(jié)構(gòu)T。設(shè)定節(jié)點數(shù)量為500,變化T生成4個仿真網(wǎng)絡(luò)的拓撲結(jié)構(gòu),參數(shù)如表1。表1:我們固定h=0.6,ld=0.5,生成每個網(wǎng)絡(luò)的標簽。在仿真每個網(wǎng)絡(luò)上,我們設(shè)定不同的標注比例LP(from0.5to0.9),測試3種方法在上述數(shù)據(jù)集上的表現(xiàn)。其中socioDim方法需要設(shè)定隱含社交維度的數(shù)量d,由于其普遍采取社區(qū)發(fā)現(xiàn)算法來抽取隱含的社交維度,因此我們設(shè)定d=k,即為生成網(wǎng)絡(luò)時指定的社區(qū)個數(shù)。結(jié)果如表2所示。表2:CN0.50.60.70.80.9k=40.583360.57510.5841330.57360.5656k=400.58120.58460.5845330.58140.5824k=800.577840.57460.5773330.58620.5884k=1000.552880.55650.5541330.56840.5468wvRN0.50.60.70.80.9k=40.60320.5980.6005330.60260.6016k=400.588240.59060.59520.59760.6012k=800.573120.57230.57360.58340.5868k=1000.574880.58350.5937330.61260.5996socioDim0.50.60.70.80.9k=40.596920.602580.603440.609180.615k=400.5894080.597440.60360.604840.60844k=800.5885840.593590.600320.605440.615k=1000.5465920.548050.5570270.566020.57688可以看出,當其他參數(shù)固定,而網(wǎng)絡(luò)拓撲結(jié)構(gòu)發(fā)生變化的時候,都會直接影響分類方法的表現(xiàn)。這是由于在網(wǎng)絡(luò)拓撲結(jié)構(gòu)發(fā)現(xiàn)變化的時候,邊的數(shù)量和結(jié)構(gòu)會影響協(xié)同分類的性能。因此,wvRN雖然只依賴于直接鄰居節(jié)點,但是由于采取協(xié)同推理機制,使得其在不同拓撲結(jié)構(gòu)上的表現(xiàn)也有所波動。CN和socioDim方法在前三個網(wǎng)絡(luò)上表現(xiàn)較為穩(wěn)定,而在最后一個網(wǎng)絡(luò)上表現(xiàn)較差。這是由于在我們限制網(wǎng)絡(luò)中邊的比例的情況下,繼續(xù)增加社區(qū)數(shù)量會導(dǎo)致網(wǎng)絡(luò)出現(xiàn)多個聯(lián)通片。這使得CN方法中,節(jié)點的局部結(jié)構(gòu)變化較為明顯,一些較小的聯(lián)通片中,未知節(jié)點的共同鄰居數(shù)量變少,對CN的分類表現(xiàn)產(chǎn)生了一定的影響。對于socioDim方法來說,當我們設(shè)定其社交維度與真實網(wǎng)絡(luò)中的社區(qū)數(shù)量一致的時候,其表現(xiàn)較為穩(wěn)定。而在網(wǎng)絡(luò)出現(xiàn)聯(lián)通片后,其會認定較小的聯(lián)通片中的節(jié)點同屬于一個社交維度,因此對其中的節(jié)點的區(qū)分能力變差。因此,在評估不同分類方法表現(xiàn)的時候,必須要注意到拓撲結(jié)構(gòu)對分類性能的影響。2.固定同質(zhì)性h、網(wǎng)絡(luò)的拓撲結(jié)構(gòu)T,變化標簽分布比例ld。設(shè)定節(jié)點數(shù)量為500,社區(qū)數(shù)量為4,生成一個仿真網(wǎng)絡(luò)的拓撲結(jié)構(gòu)。繼而固定h=0.6,變化1d的值(from0.5to0.9),生成每個網(wǎng)絡(luò)的標簽。在仿真每個網(wǎng)絡(luò)上,我們設(shè)定不同的標注比例LP(from0.5to0.9),測試3種方法在上述數(shù)據(jù)集上的表現(xiàn)。結(jié)果如表3所示。表3:CNlp=0.5lp=0.6lp=0.7lp=0.8lp=0.9ld=0.50.583360.57510.5841330.57360.5656ld=0.60.594480.59420.6101330.60520.5992ld=0.70.697280.6910.6980.70080.7124ld=0.80.80280.80230.7954670.79660.796ld=0.90.900960.90430.9069330.89320.8996socioDimlp=0.5lp=0.6lp=0.7lp=0.8lp=0.9ld=0.50.5958880.602240.603360.607180.61332ld=0.60.590120.592610.59540.597860.59892ld=0.70.7010240.699960.6970130.699660.70092ld=0.80.8002960.801630.800520.80080.80148ld=0.90.90060.900890.9009330.900860.90132wvRNlp=0.5lp=0.6lp=0.7lp=0.8lp=0.9ld=0.50.60320.5980.6005330.60260.6016ld=0.60.600480.60180.6165330.61320.6064ld=0.70.67680.67830.68440.68860.7068ld=0.80.778640.78170.7829330.78760.7868ld=0.90.870960.87760.8870670.880.8896可以看出,隨著網(wǎng)絡(luò)中節(jié)點的標簽分布比例發(fā)生變化,三種方法的準確度都有著明顯的變化,說明分類方法對于標簽分布比例的變化是較為敏感的。標簽分布比例的升高,意味著網(wǎng)絡(luò)中某一類標簽(假設(shè)標簽為LO)的節(jié)點占據(jù)了多數(shù)。對于wvRN來說,雖然只利用了局部的鄰居節(jié)點,但當大量的鄰居節(jié)點擁有標簽LO的時候,wvRN方法也會傾向于將節(jié)點分為LO。CN方法由于使用了網(wǎng)絡(luò)中所有節(jié)點參與分類,因此當網(wǎng)絡(luò)中某一類別的節(jié)點占絕大多數(shù)的時候,其傾向于將節(jié)點分為該多數(shù)類。socioDim方法包含有訓練SVM模型的過程,因此當訓練集中某一分類的比例占多數(shù)時,其也傾向于將節(jié)點分為該多數(shù)類。因此,在面對非平衡數(shù)據(jù)的分類任務(wù)時,節(jié)點分類方法需要引入控制策略(例如,可以選取top-K,或者加大多數(shù)類的懲罰因子等)來應(yīng)對不平衡分類帶來的挑戰(zhàn)。同時我們發(fā)現(xiàn),在上面的過程分類過程中,已知節(jié)點的標注比例變化(from0.5to0.9)對于分類性能的影響相對較小。這是由于在網(wǎng)絡(luò)的標簽生成過程中,我們先按照統(tǒng)一的模式生成所有節(jié)點的標簽特征,進而通過隨機的方式指定訓練和測試集合,這樣可以有效地保證測試集和訓練集的特征分布一致,能夠更好地評估分類方法的性能。因此,當節(jié)點標注比例發(fā)生變化的時候?qū)Ψ诸愋阅艿挠绊戄^小。然而,我們將在下一節(jié)的實驗中看到,當網(wǎng)絡(luò)中其它特征發(fā)生變化的時候,如果分類方法的表現(xiàn)與此特征密切相關(guān)的時候,LP的變化也會對分類性能有著較為明顯的影響。3.固定標簽分布比例1d、網(wǎng)絡(luò)的拓撲結(jié)構(gòu)T,變化同質(zhì)性h。設(shè)定節(jié)點數(shù)量為500,社區(qū)數(shù)量為4,生成一個仿真網(wǎng)絡(luò)的拓撲結(jié)構(gòu)。繼而固定ld=0.5,變化h的值(from0.4to0.8),生成每個網(wǎng)絡(luò)的標簽。在仿真每個網(wǎng)絡(luò)上,我們設(shè)定不同的標注比例LP(from0.5to0.9),測試3種方法在上述數(shù)據(jù)集上的表現(xiàn)。結(jié)果如表4所示。表4:CNlp=0.5lp=0.6lp=0.7lp=0.8lp=0.9h=0.40.548720.5380.5561330.56420.5736h=0.50.5020.5060.5069330.49620.51h=0.60.584640.58560.5866670.58340.5736h=0.70.682320.66960.6754670.68220.6776h=0.80.761120.75770.7562670.74460.7548socioDim4lp=0.5lp=0.6lp=0.7lp=0.8lp=0.9h=0.40.5378480.543690.5491470.556380.55912h=0.50.4880240.487530.4872130.48780.48948h=0.60.5960480.599240.6036670.610640.61016h=0.70.6359360.636930.6392670.641820.64196h=0.80.7417760.74390.744720.745860.74144wvRNlp=0.5lp=0.6lp=0.7lp=0.8lp=0.9h=0.40.30960.27410.2381330.20180.1496h=0.50.512240.51470.51960.52060.5172h=0.60.601040.60570.6080.60980.6116h=0.70.69680.68920.6954670.70760.7096h=0.80.77320.77080.7710670.76480.786網(wǎng)絡(luò)的同質(zhì)性等于網(wǎng)絡(luò)中相鄰的兩個節(jié)點類別相同的邊的比例。wvRN依賴于節(jié)點的直接鄰居進行分類,在同質(zhì)性較低的網(wǎng)絡(luò)中,大多數(shù)鄰居節(jié)點與未知節(jié)點的類別不同,因此其在同質(zhì)性較低的網(wǎng)絡(luò)中表現(xiàn)較差。而隨著同質(zhì)性的增加,鄰居節(jié)點傾向于擁有相同的類別,因此wvRN方法的表現(xiàn)也有大幅提高。另外我們發(fā)現(xiàn),在同質(zhì)性較低的時候(h=0.4),wvRN在標注比例較低的時候的表現(xiàn),反而比標注比例高的時候要好。這是由于在h=0.4的時候,鄰居節(jié)點之間傾向于擁有不同的類別,因此,當已知節(jié)點為90%的時候,這樣現(xiàn)象會更加明顯,因為未知節(jié)點的鄰居節(jié)點大多數(shù)都是已知的,都會參與分類過程,會使得準確度較低;相反,當已知節(jié)點為50%的時候,未知節(jié)點的鄰居節(jié)點大多數(shù)是未知的,這會使得同質(zhì)性的影響稍稍減弱,反而有利于wvRN方法得到較為滿意的結(jié)果。CN方法依賴于共同鄰居進行分類,因此可以克服同質(zhì)性帶來的影響,在同質(zhì)性較低的網(wǎng)絡(luò)上也有較好表現(xiàn)。而當同質(zhì)性增加到一定程度的時候,絕大部分鄰居節(jié)點都傾向于擁有相同的類別,因此在局部結(jié)構(gòu)中,未知節(jié)點與大部分已知節(jié)點都傾向于擁有相同的類別,因此準確度也有所提升。同樣的,socioDim利用網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)進行分類,因此其受同質(zhì)性的影響也相對較小。而當網(wǎng)絡(luò)的同質(zhì)性增高的時候,同一個社區(qū)內(nèi)部連接較為緊密,其內(nèi)部傾向于擁有相同的類別,也會使得其分類性能有所提升。此外我們發(fā)現(xiàn),在h=0.5的時候,二者的準確度都有一個明顯的降低。這是由于在h=0.5的時候,網(wǎng)絡(luò)中50%的邊的頂點類別相同,而另外50%的邊頂點類別不同,這說明網(wǎng)絡(luò)中節(jié)點的連接情況較為隨機,沒有明顯的規(guī)律出現(xiàn),因此無論是利用共同鄰居還是社區(qū)結(jié)構(gòu),都無法在這種隨機特征的網(wǎng)絡(luò)中得到滿意的分類結(jié)果。本發(fā)明設(shè)計了一個標簽網(wǎng)絡(luò)的生成框架,用來評估分類方法在不同網(wǎng)絡(luò)屬性下的表現(xiàn)。為了保證生成的仿真網(wǎng)絡(luò)更加接近真實網(wǎng)絡(luò),該方法可以集成不同的拓撲結(jié)構(gòu)生成方法,極大地拓展了其應(yīng)用領(lǐng)域。在標簽生成階段,重點關(guān)注同質(zhì)性與標簽分布比例對分類方法的影響。實驗表明,本發(fā)明提供的方法可以快速地生成滿足要求的標簽網(wǎng)絡(luò),能夠有效地評估不同分類方法的適用領(lǐng)域。當前第1頁1 2 3