一種基于學(xué)術(shù)關(guān)系網(wǎng)絡(luò)的專家學(xué)術(shù)距離評估方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計算機應(yīng)用領(lǐng)域,尤其是一種應(yīng)用計算機評估專家學(xué)術(shù)距離的方法。
【背景技術(shù)】
[0002] 目前就是因為缺少科學(xué)合理的評價與評審的制度,所以在科技評價及評審中經(jīng)常 出現(xiàn)由于主觀因素產(chǎn)生的不公平現(xiàn)象。由于現(xiàn)有的評審機制對評審者和被評審者關(guān)系難以 把握,甚至有時候評審專家既是申請者也是評審者,這樣易使得評審工作由于主觀因素出 現(xiàn)的不公平現(xiàn)象。所以制定合理的回避制度對保證學(xué)術(shù)評價與評審的公平性起著至關(guān)重要 的作用。
[0003] 正確的回避評審專家對于評審公平性的保證具有不可估量的意義。評審專家也是 社會上的人,有著自己的關(guān)系網(wǎng)絡(luò),與其他很多人都存在著很多種的關(guān)系類型,但是在評審 的時候,評審專家的其他社會關(guān)系會影響專家的判斷,對與自己關(guān)系密切的申請者的項目 的評分肯定要高于那些與自己關(guān)系不怎么強甚至沒有關(guān)系的申請者的項目的評分。如果沒 有對需要回避的評審專家進行回避,則每年選出來的各種項目基金可能不一定是優(yōu)秀的, 而只是因為那個項目的申請者與評審該項目的專家的關(guān)系密切,從而使得該項目獲得了高 分,這肯定對于其他的申報人來說是極為不公平的。
[0004] 判斷兩個人之間是否需要回避的依據(jù)是兩個人之間的關(guān)系是否是強關(guān)系,而衡量 關(guān)系強弱需要考慮的是兩個人之間的學(xué)術(shù)距離。而目前沒有有效的評估方法來評估兩個人 之間的學(xué)術(shù)距離。因此,目前回避評估技術(shù)落后,導(dǎo)致科技評價及評審結(jié)果不公正、不準(zhǔn)確。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提供一種專家學(xué)術(shù)距離評估方法,能判斷兩個人之間的關(guān)系強弱,有效評 估出是否回避,提高科技評價及評審的公平準(zhǔn)確。
[0006] 為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:
[0007] 一種基于學(xué)術(shù)關(guān)系網(wǎng)絡(luò)的專家學(xué)術(shù)距離評估方法,包括如下步驟:第一步,提取學(xué) 術(shù)社區(qū)結(jié)構(gòu)特征、關(guān)系跳數(shù)結(jié)構(gòu)特征、關(guān)系權(quán)重結(jié)構(gòu)特征以及鄰里重疊度結(jié)構(gòu)特征;學(xué)術(shù)社 區(qū)結(jié)構(gòu)特征區(qū)分兩人是否在同一學(xué)術(shù)社區(qū);學(xué)術(shù)關(guān)系跳數(shù)結(jié)構(gòu)特征表示兩人直接相連或達 到對方需通過人物的個數(shù);學(xué)術(shù)關(guān)系權(quán)重結(jié)構(gòu)特征表示在學(xué)術(shù)關(guān)系網(wǎng)絡(luò)里,人物到其他人 物的權(quán)重值;鄰里重疊度結(jié)構(gòu)特征表示共同朋友的數(shù)量;第二步,使用變異系數(shù)的灰色關(guān) 聯(lián)算法來綜合評估以上的四個學(xué)術(shù)距離結(jié)構(gòu)特征,得到綜合的學(xué)術(shù)距離值。
[0008] 其中,學(xué)術(shù)社區(qū)結(jié)構(gòu)特征取值:在一個學(xué)術(shù)社區(qū)里的人的學(xué)術(shù)社區(qū)特征值為1,不 在一個學(xué)術(shù)社區(qū)里的人的學(xué)術(shù)社區(qū)特征值為〇. 5。
[0009] 其中,提取學(xué)術(shù)社區(qū)結(jié)構(gòu)特征時,采用社區(qū)層次化檢測算法在學(xué)術(shù)關(guān)系網(wǎng)絡(luò)上進 行社區(qū)劃分,具體為:首先初始時假設(shè)網(wǎng)絡(luò)中的每個節(jié)點都是一個獨立的社團,對任意相鄰 的節(jié)點i和節(jié)點j,計算將節(jié)點i加入其鄰居節(jié)點j所在的社團時對應(yīng)的模塊度增量:
[0011] 其中,Si,in是節(jié)點與社團C內(nèi)其他節(jié)點所有連邊的權(quán)重和,W。是社團C內(nèi)部所有 邊的權(quán)重和,S。是所有與社團C內(nèi)部的點相關(guān)聯(lián)的邊的權(quán)重和,W是網(wǎng)絡(luò)中所有邊的權(quán)值之 和,Si是節(jié)點i的權(quán)重值;
[0012] 計算節(jié)點i與所有鄰居節(jié)點的模塊度增量,然后選出其中最大的一個,當(dāng)該值為 正時,把節(jié)點i加入相應(yīng)的鄰居節(jié)點所在的社團;否則,節(jié)點i留在原社團中,這種社團合并 過程重復(fù)進行,直到不再出現(xiàn)合并現(xiàn)象,這樣就劃分出了第一層社團;
[0013] 然后構(gòu)造一個新網(wǎng)絡(luò),其中的節(jié)點是前一階段劃分出的社團,節(jié)點之間連邊的權(quán) 重是兩個社團之間所有連邊的權(quán)重和,利用前面的方法對新網(wǎng)絡(luò)進行社團劃分,得到第二 層社團結(jié)構(gòu);以此類推,直到不能再劃分出更高一層的社團結(jié)構(gòu)為止。
[0014] 其中,學(xué)術(shù)關(guān)系跳數(shù)結(jié)構(gòu)特征取值為:在學(xué)術(shù)關(guān)系網(wǎng)絡(luò)里,如果兩個人之間的關(guān)系 存在直接連接則這兩個人之間的學(xué)術(shù)關(guān)系跳數(shù)特征值為1,如果沒有直接相連但是可以通 過一個人物達到,則學(xué)術(shù)關(guān)系跳數(shù)特征值為2,依次這樣下去,直到不可達為止。
[0015] 其中,計算學(xué)術(shù)關(guān)系權(quán)重時,先對整個學(xué)術(shù)關(guān)系網(wǎng)絡(luò)里的權(quán)重值進行反轉(zhuǎn),即先除 掉那些沒有直接相連而使權(quán)重值為〇的值,用學(xué)術(shù)關(guān)系網(wǎng)絡(luò)里最大的權(quán)重值與學(xué)術(shù)關(guān)系網(wǎng) 絡(luò)里最小的權(quán)重值進行交換,用第二大值與第二小值交換,按照此規(guī)則對整個學(xué)術(shù)關(guān)系網(wǎng) 絡(luò)里的權(quán)重值進行交換,接著對學(xué)術(shù)關(guān)系網(wǎng)絡(luò)里權(quán)重值為〇的人物節(jié)點的權(quán)重值進行值最 大化處理,最后去得到每個節(jié)點到其他節(jié)點的最短關(guān)系權(quán)重值。
[0016] 其中,鄰里重疊度的定義如下:
[0018] 在公式(3-2)里,分母部分不包括A和B本身。
[0019] 其中,第二步包括:
[0020] 計算學(xué)術(shù)距離特征灰色關(guān)聯(lián)指數(shù),各個結(jié)構(gòu)特征對每個人物的學(xué)術(shù)距離指數(shù)計算 如下:
[0022] 公式(3-3)表示的是該指標(biāo)的測量值與最優(yōu)值之間的差異與整個測量過程中最 好的曲線與最優(yōu)曲線差異的比值,得到的是這個指標(biāo)對該人物節(jié)點的學(xué)術(shù)距離貢獻度,其 中測量值是指每個節(jié)點的四個結(jié)構(gòu)特征的測量值,而最優(yōu)值是指根據(jù)測量值來得到最好的 值,在公式(3-3)里巧〇〇表示的是第i個節(jié)點第k個(k= 1,2,3,4)個測量指標(biāo)的學(xué)術(shù) 距離指數(shù),P為分辨系數(shù),用來減少因為八_過大而使上面那個函數(shù)失真的影響,A_和 Amin分別是測量值與最優(yōu)值差異的最大值和最小值,計算如下:
[0023]
公式 (3-4)
[0024] 公式(3-4)表示的是所有學(xué)術(shù)距離特征的測量值與最優(yōu)值之間差異的絕對值, △_和△min分別是公式(3-4)里的最大與最小值,表示的是測量曲線與最優(yōu)曲線的差異, 其中X*(k)與Y*(k)分別表示的是測量值與最優(yōu)值,其公式分別如公式(3-5)和公式(3-6) 所示:
[0025] Xi={X! (1),Xi⑵,Xi(3),Xi⑷} 公式(3-5)
[0026] 公式(3-5)表示的是四個學(xué)術(shù)距離結(jié)構(gòu)特征的測量值,其中XiOn)表示第i個節(jié) 點的四個學(xué)術(shù)距離結(jié)構(gòu)特征的測量值(m= 1,2,3,4),
[0027] Y= (y(l),y(2),y(3),y(4)) 公式(3-6)
[0028] 公式(3-6)表示的是綜合整個學(xué)術(shù)關(guān)系網(wǎng)絡(luò)得出的整個學(xué)術(shù)關(guān)系網(wǎng)絡(luò)的測量學(xué) 術(shù)距離結(jié)構(gòu)特征的最優(yōu)序列,其中該序列中的y(m)是所有節(jié)點中的第m個回避指標(biāo)因子值 的最優(yōu)值;采用"均值法"對這些學(xué)術(shù)距離結(jié)構(gòu)特征進行無量綱化處理,對公式(3-5)、公式 (3-6)里的結(jié)果處理后得到的比較數(shù)據(jù)序列分別如公式(3-7)和公式(3-9)所示:
[0030] 其中Xi(k)表示的是節(jié)點i的第k個結(jié)構(gòu)特征值,aver(k)表示的是所有節(jié)點第k 個結(jié)構(gòu)特征的平均值:
[0032] 無量綱化后得到的最優(yōu)數(shù)據(jù)序列為:
[0034] 其中y(m)表示節(jié)點第m個結(jié)構(gòu)特征的最優(yōu)值,aver(m)表示的是第m個結(jié)構(gòu)特征 的平均值。
[0035] 計算學(xué)術(shù)距離結(jié)構(gòu)特征變異度權(quán)值,結(jié)構(gòu)特征的權(quán)重計算如下:
[0037] 公式(3-10)表示各個結(jié)構(gòu)特征權(quán)重值的計算,用該結(jié)構(gòu)特征的標(biāo)準(zhǔn)差與其平均 值比值得到該結(jié)構(gòu)特征的相對變異程度,vk表示的是該結(jié)構(gòu)特征的權(quán)重值,xlk表示的該結(jié) 構(gòu)特征測量的平均值,Sk表示的是所有結(jié)構(gòu)特征的標(biāo)準(zhǔn)差,計算公式如下:
[0039] 公式(3-11)表示的是某個結(jié)構(gòu)特征測量指標(biāo)的標(biāo)準(zhǔn)差,用來反應(yīng)各個結(jié)構(gòu)特征 值的差異程度,其中Sk表示第k個結(jié)構(gòu)特征的標(biāo)準(zhǔn)差,x, (k)是第i個節(jié)點第k個結(jié)構(gòu)特征 的指標(biāo)值;xlk表示第k個結(jié)構(gòu)特征的平均值,對各個結(jié)構(gòu)特征的變異系數(shù)值進行歸一化處 理,使各個結(jié)構(gòu)特征的權(quán)重值的范圍在〇到1之間,并且四個結(jié)構(gòu)特征的權(quán)重值之和為1,計 算公式如下:
[0041] 公式(3-12)表示的是各個結(jié)構(gòu)特征權(quán)重歸一化處理后的結(jié)果,其中vk表示的是 第k個結(jié)構(gòu)特征的權(quán)重值;
[0042] 綜合學(xué)術(shù)距離的計算,用各個結(jié)構(gòu)特征的學(xué)術(shù)距離值乘以各個結(jié)構(gòu)特征的權(quán)重 值