两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種排名趨勢和排名穩(wěn)定性的影響因素的快速查找方法與流程

文檔序號:12863882閱讀:261來源:國知局
一種排名趨勢和排名穩(wěn)定性的影響因素的快速查找方法與流程
本發(fā)明涉及信息快速提取
技術(shù)領域
,特別涉及一種排名趨勢和排名穩(wěn)定性的影響因素的快速查找方法。
背景技術(shù)
:社會媒體,互聯(lián)網(wǎng),機構(gòu)統(tǒng)計等產(chǎn)生了大量的排名集合數(shù)據(jù)。排名集合數(shù)據(jù)給人類帶來豐富的信息時,同時也蘊含著巨大的挑戰(zhàn),在網(wǎng)站排名,導師排名,任務排名等多個任務和需求中,如何從龐大的時序排名集合數(shù)據(jù)快速選取到符合用戶需求的實例排名,成為了互聯(lián)網(wǎng)領域,統(tǒng)計領域的熱門課題。目前對于某個實例的排名來說,可以由有不同的機構(gòu)給出,也可以對于此實例不同的方面進行排名評估,也可以根據(jù)不同的規(guī)則來排名,這些所組成的實例的排名,叫做排名的集合。加入了時間參數(shù)之后,比如2008-2017年歷年的排名等,即為時序排名集合。但是由于機構(gòu)不同、規(guī)則不同,無法對排序進行有效的歸類,也無法直觀地向需求者展示。特別是現(xiàn)有技術(shù)中通常只有對高排名的對象進行選擇和分析,但是卻無法有效找出具有所需排名變化趨向的對象。技術(shù)實現(xiàn)要素:本發(fā)明提供了一種排名趨勢和排名穩(wěn)定性的影響因素的快速查找方法,可以快速選取所需特征的排名信息,特別是可以快速得到排名趨勢信息。一種排名趨勢和排名穩(wěn)定性的影響因素的快速查找方法,包括以下步驟:步驟1:獲取并篩選排名數(shù)據(jù)得到時序排名集合;步驟2:對經(jīng)過步驟1處理的時序排名集合根據(jù)排名趨勢進行聚類;步驟3:把步驟2的聚類信息進行存儲,索引結(jié)構(gòu)為聚類id,所述聚類id包含排名對象信息,排名標準信息,排名時間信息以及排名對象在所述排名標準和所述排名時間上的排名信息;步驟4:將步驟3的聚類分別進行可視化得到對應的第一可視化圖像,第一可視化圖像展示排名趨勢和該聚類中所有排名對象的總排名穩(wěn)定性;步驟5:根據(jù)需求在步驟4的第一可視化圖像中選擇所需排名趨勢和穩(wěn)定性的圖像,得到對應排名趨勢的聚類;步驟6:所述第一可視化圖像進行進一步可視化展開得到第二可視化圖像,第二可視化圖像包括標記出該聚類中所有排名對象信息的時間范圍,在每一個時間上,展現(xiàn)該時間對應的每一個排名對象的綜合排名;第二可視化圖像中每個排名對象用圖像表示,圓形的填充色代表排名穩(wěn)定性;同時,第二可視化圖像還包括用第一統(tǒng)計圖表示對于選中的聚類中所有排名對象在不同的排名標準給出的排名的統(tǒng)計情況,對于第一統(tǒng)計圖中的每個代表統(tǒng)計的排名區(qū)間的小圖形,各排名區(qū)間的等距分布,相鄰排名區(qū)間為連續(xù)的排名。本發(fā)明通過將排名數(shù)據(jù)進行聚類,得到可視化的結(jié)果,從而可以快速選取所需排名趨勢和穩(wěn)定性的對象??梢詰迷趯熁蚪淌谂琶?,學校排名等各類排名系統(tǒng)中,從而可以快速選取得到所需排名趨勢和穩(wěn)定性的導師,而現(xiàn)有技術(shù)中,只有單一標準下的導師排名,而通過本方法可以選取到排名不高但是排名趨勢較優(yōu)秀的導師,例如最幾年一直保持排名上升且穩(wěn)定性較好的導師。其中排名標準包括幾類,可以代表機構(gòu)(例如某家公司對其的排名),角度(例如從學術(shù)角度,從影響力角度等),或排名方式(例如權(quán)重的不同,計算公式的不同)。同時,本發(fā)明可以在第二可視化圖像的第一統(tǒng)計圖中,當部分排名標準有了不正常的排名區(qū)間,例如區(qū)別于大部分其他的排名區(qū)間,即找出所選的聚類中對排名造成不同影響的排名標準,進而可以選擇去除某些不正常的數(shù)據(jù),從而更好地幫助用戶選擇所需的排名對象。為了減少無用的數(shù)據(jù),聚類前,對于篩選后的排名數(shù)據(jù)進行處理,包括將排名標準較少的導師數(shù)據(jù)刪除,對于數(shù)據(jù)上的錯誤進行更正。優(yōu)選的,步驟1中,獲取并篩選時序排名集合的具體步驟如下:將排名數(shù)據(jù)整理為時序排名集合,時序排名集合數(shù)據(jù)為:在t時間上,則有時序排名數(shù)據(jù):m是時序排名集合數(shù)據(jù)中的排名對象的數(shù)量,m代表任一一個排名對象;對于任何一個排名集合數(shù)據(jù)n代表了排名標準的數(shù)量,n代表任一一個排名標準;為時序排名集合數(shù)據(jù)的排名對象m的排名集合,此時時序排名集合數(shù)據(jù)表示為每一層數(shù)據(jù)結(jié)構(gòu)都賦予了語義,在操作時,是排名對象m所有時間上的排名集合,是指導師m在t時刻的排名集合,是排名對象m在t時刻下排名標準n的排名,rt是t時刻所有導師的排名集合。例如下表就表示了某導師的排名數(shù)據(jù):某導師的排名數(shù)據(jù)2011年2012年2013年……某公司對其的排名31223……學術(shù)排名51013……影響力排名71620……x公式下的排名4810………………………………聚類的目的是可以讓排名趨勢相近的導師劃分在同一個聚類中(例如都是一直上升,或者都是先上升后下降),在尋找符合特定排名的導師的時候可以縮小范圍。優(yōu)選的,步驟2中,采用動態(tài)時間規(guī)整算法進行聚類。用動態(tài)時間規(guī)整(dtw)算法時,可以比較趨勢的相似性,而不是簡單的把距離相減,對于動態(tài)時間規(guī)整(dtw)算法,定義了一種距離衡量標準,對于任一一對i,j為任一兩個不同的排名對象,計算距離其中t1,t2屬于各自集合的時間序列,所以在t1,t2上兩個集合的距離表示為dtw是比較兩個時間序列的相似性,每個時間序列上有多個排名集合,需要定義兩個不屬于同一時間序列的兩個集合的距離的衡量標準也就是d。然后基于dtw算出的相似性,規(guī)定聚類的數(shù)量(就是聚成幾類),用層次聚類方法進行聚類。為了更多地展示聚類中的信息,給使用者更多的選擇,優(yōu)選的,步驟4中,第一可視化圖像包括:用圖形大小代表聚類中的排名對象的數(shù)量,圖形中心用統(tǒng)計圖表對該聚類的排名趨勢進行表示,圖形填充顏色代表穩(wěn)定性,穩(wěn)定性越好顏色越深。用圖形代表聚類,可以用圓,三角形,長方形等數(shù)學圖形,優(yōu)選的,其中,圖形為圓形,半徑代表排名對象的數(shù)量;第二統(tǒng)計圖表采用折線圖。優(yōu)選的,對于每一個排名區(qū)間通過第三統(tǒng)計圖的方式查看統(tǒng)計排名標準出現(xiàn)的次數(shù)。進而在發(fā)現(xiàn)不正常的排名區(qū)間時既可以得到不正常的排名標準。為了得到所需的排名趨勢,在第一統(tǒng)計圖中選擇去除掉某一個排名標準(不正常的排名標準)給出的排名數(shù)據(jù),用動畫過渡的形式(形式可以選擇)刷新排名結(jié)果,排名對象的排名刷新前后改變區(qū)間時,會在過渡時用高亮提示,對于升高和下降的排名對象的高亮顏色進行區(qū)分,看去除掉此排名標準后排名對象的排名的變化情況。并在某一個地方顯示被去除的排名標準,可以進行復原此排名標準數(shù)據(jù)的操作,并進行動畫過渡。同時用另一種圖形代表每一個排名對象,根據(jù)這些排名對象在這個時間上的平均排名,把他們分布在第一統(tǒng)計圖中每個小圖形表示的排名區(qū)間中。對于相鄰時間上的同一個排名對象進行連接,用來觀察每一個排名對象的平均排名隨著時間的變化情況。為了更好地展示每一個排名對象的變化趨勢,優(yōu)選的,第二可視化圖像中對于相鄰時間上的同一個排名對象通過線條進行連接。要連接的兩側(cè)圖形過多的時候,線的交叉會增多,如果采用實心線條會十分雜亂,看不出兩個相鄰時間上排名對象的總和排名的變化情況。優(yōu)選的,所述線條為熱力圖線條,熱力圖線條的顏色代表在前時間的排名對象的排名穩(wěn)定性。即方差越大,穩(wěn)定性越差,此時所生成的熱力圖線條的顏色更淡,寬度更大。這樣對于此相鄰時間內(nèi)所有的熱力圖線條來說,可以展現(xiàn)整體的排名趨勢,同時盡可能讓穩(wěn)定性差的排名對象所帶來的,對于排名趨勢的影響變小。優(yōu)選的,對第二可視化圖像可以進一步展開得到第三可視化圖像,展開方式如下:對第二可視化圖像任一時間的排名對象進行部分框選,框選后在所有時間上都只會保留框選的排名對象。本發(fā)明的有益效果:本發(fā)明的排名趨勢和排名穩(wěn)定性的影響因素的快速查找方法,可以從復雜的排名數(shù)據(jù)中快速得到所需排名趨勢的排名對象以及該排名對象的穩(wěn)定性,同時還可以快速找出影響因素,可以有效幫助用戶快速找到適合自己的導師或?qū)W校。附圖說明圖1本實施例的方法中第一可視化圖像的示意圖。圖2為本實施例的方法中第二可視化圖像的示意圖。圖3是第二可視化圖像進一步框選后得到的第三可視化圖像的示意圖。具體實施方式下面通過實施例結(jié)合附圖詳細描述本發(fā)明,本實施例的排名對象是導師,本實施實例的排名趨勢和排名穩(wěn)定性的影響因素的快速查找方法,包括數(shù)據(jù)處理部分和系統(tǒng)操作部分,具體包括以下步驟:數(shù)據(jù)處理部分:步驟1:篩選數(shù)據(jù),獲取導師排名數(shù)據(jù),數(shù)據(jù)必須包括,在不同排名標準中對于導師在不同時間的排名,其中排名標準包括代表機構(gòu)(例如某家公司對其的排名),角度(例如從學術(shù)角度,從影響力角度等),或排名方式(例如權(quán)重的不同,計算公式的不同)。此種形式數(shù)據(jù)為時序排名集合數(shù)據(jù),形式如下,時序排名集合數(shù)據(jù)為:對于為在t時間上,則有時序排名數(shù)據(jù)m是時序排名集合數(shù)據(jù)的人數(shù),m代表第幾個人,對于任何一個排名集合數(shù)據(jù)n代表了排名標準的數(shù)量,n代表第幾個排名標準;為時序排名集合數(shù)據(jù)的排名對象m的排名集合,此時時序排名集合數(shù)據(jù)為具體的時序排名集合數(shù)據(jù)例如下表:某導師的排名數(shù)據(jù)2011年2012年2013年……某公司對其的排名31223……學術(shù)排名51013……影響力排名71620……x公式下的排名4810………………………………對于篩選后的導師排名數(shù)據(jù)進行處理,包括將排名標準較少的導師數(shù)據(jù)刪除,對于數(shù)據(jù)上的錯誤進行更正。步驟2:對于處理好的導師排名數(shù)據(jù)進行聚類,目的是可以讓排名趨勢相近的導師劃分在同一個聚類中,例如都是一直上升,或者都是先上升后下降,在尋找符合特定排名的導師的時候可以縮小范圍。用動態(tài)時間規(guī)整(dtw)算法可以比較趨勢的相似性,而不是簡單的把距離相減。對于動態(tài)時間規(guī)整(dtw)算法,我們定義了一種距離衡量標準,對于每一對我們計算距離其中t1,t2屬于各自集合的時間序列。所以在t1,t2上兩個集合的距離表示為步驟3:把得到的多個聚類信息進行存儲,索引結(jié)構(gòu)為,聚類id,包含的導師信息,排名標準的信息,時間信息,導師在此排名標準下此時間上的排名。系統(tǒng)操作部分:步驟4:將步驟3得到的多個聚類進行可視化,其中排名隨著時間逐漸增長的導師排名聚類的第一可視化圖像如圖1所示。用圖形代表聚類,用圓形代表聚類,對半徑編碼導師數(shù)量,易于和其他聚類比較,不會像其他多邊形一樣有歧義。在圖形中間用折線表示趨勢時,可以讓折線處于正中間,折線圖為第二統(tǒng)計圖。每年排名都很穩(wěn)定的導師,排名穩(wěn)定意味著,不同排名標準下的排名穩(wěn)定性都比較高,導師的排名也更加準確。圓形內(nèi)的填充顏色的深淺代表穩(wěn)定性,每個聚類下所有導師在不同時間、不同排名標準給出的排名的方差的總和作為該聚類的穩(wěn)定性,方差越小,顏色越深,也意味著排名的穩(wěn)定性越好。步驟5:從聚類中選取符合用戶需求的聚類,對于選擇排名隨著時間逐漸增長的導師,可以選擇,導師數(shù)量多(更大的圖形),圖形中心的統(tǒng)計圖中趨勢上升更明顯的一個或多個聚類進行下一步操作。因為聚類的導師數(shù)量多,同時總體導師的平均排名情況隨著時間而上升,更容易在后面的操作中找到特定的導師。在步驟4中,可以對如圖1所示的聚類進行進一步的可視化的展示得到第二可視化圖像,如圖2所示,標記出聚類中所有導師數(shù)據(jù)的時間范圍,在每一個時間上,展現(xiàn)其時間對應的導師數(shù)據(jù);另外,在每個時間的上,用第一統(tǒng)計圖去表示在該聚類中所有導師在不同的排名標準給出的排名的總體的統(tǒng)計情況,展現(xiàn)其時間對應的導師數(shù)據(jù),對于統(tǒng)計圖中的每個小圖形,代表統(tǒng)計的排名區(qū)間,排名區(qū)間的統(tǒng)計范圍一樣,相鄰排名區(qū)間為連續(xù)的排名,例如第一個排名區(qū)間是1-50,第二個排名區(qū)間為51-100。對于每一個排名區(qū)間,可以進行點擊操作后,通過第三統(tǒng)計圖的方式查看哪些排名標準給導師的排名在此區(qū)間,并統(tǒng)計這些排名標準出現(xiàn)的次數(shù),本實施例中,第三統(tǒng)計圖為圓餅圖。在第一統(tǒng)計圖中可選擇去除掉某一個排名標準給出的排名數(shù)據(jù),用動畫過渡的形式刷新排名結(jié)果,導師排名刷新前后改變區(qū)間時,會在過渡時用高亮提示,對于升高和下降的導師的高亮顏色進行區(qū)分,看去除掉此排名標準后導師排名的變化情況。并在某一個地方顯示被去除的排名標準,可以進行復原此排名標準數(shù)據(jù)的操作,并進行動畫過渡。同時用另一種圖形代表每一個導師,根據(jù)這些導師在這個時間上的平均排名,把他們分布在第一統(tǒng)計圖中每個小圖形表示的排名區(qū)間中。對于相鄰時間上的同一個導師進行連接,用來觀察每一個導師的平均排名隨著時間的變化情況。第一統(tǒng)計圖可以用直方圖,折線圖,散點圖等。用直方圖可以滿足多個需求,此時小圖形即為矩形線框3,每個矩形線框3可以明確的表示排名區(qū)間,也可以容納下代表導師的圖形。折線圖和散點圖或者把矩形換成橢圓形,都難以區(qū)分不同排名區(qū)間下的導師。用圖形代表此時間上的導師,可以用圓形,正方形,三角形等。本實施例中,用圓形1代表每一個導師,當導師數(shù)量很多時,用圓形可以節(jié)省面積,不會造成邊的重疊現(xiàn)象,同時彼此之間有空隙,減少誤選操作。圓形內(nèi)的填充顏色的深淺代表此時間下某導師由不同排名標準給出的排名的方差,方差越小,顏色越深,也意味著排名的穩(wěn)定性越好。圖形的位置代表了導師在此時間上的平均排名,分布在統(tǒng)計圖中對應的排名區(qū)間代表的矩形線框3。每個相鄰時間下對同一個導師的圖形進行連接。顯示此導師相鄰時間內(nèi)平均排名的變化情況??梢杂脽崃D,直線,曲線等方式,本實施例中,用熱力圖線條2進行連接,在生成熱力圖的時候,對于相鄰時間的兩個導師圖形,時間在前的導師圖形顏色越淺,即方差越大,穩(wěn)定性越差,此時所生成的熱力圖線條的顏色更淡,寬度更大。這樣對于此相鄰時間內(nèi)所有的熱力圖線條來說,可以展現(xiàn)整體的排名趨勢,同時盡可能讓穩(wěn)定性差的導師所帶來的,對于排名趨勢的影響變小。從而使直線和曲線會有重疊現(xiàn)象,用熱力圖可以避免突兀的交叉和難以區(qū)分的重疊現(xiàn)象,熱力圖的顏色深淺代表了此區(qū)域的交叉和重疊的多少,可以看出相鄰時間上導師的平均排名變化情況。對于統(tǒng)計圖中的每一個矩形線框,代表統(tǒng)計的排名區(qū)間,排名區(qū)間的統(tǒng)計范圍一樣,相鄰排名區(qū)間為連續(xù)的排名,圖2中,可以設定第一個排名區(qū)間是1~50,第二個排名區(qū)間為51~100。同時用圓形代表每一個導師,根據(jù)這些導師在這個時間上的平均排名,把他們分布在統(tǒng)計圖中每個小圖形表示的排名區(qū)間中。對于相鄰時間上的同一個導師進行連接,用來觀察每一個導師的平均排名隨著時間的變化情況。另外,本實施例還可以對圖2這一類的第二可視化圖像進行進一步展開,框選方式如下:對每個統(tǒng)計圖中的排名區(qū)間進行框選,同時也框選得到了排名區(qū)間內(nèi)的包含的導師,框選后在所有時間上只會保留和框選得到的導師一樣的導師圖形,同時包含導師圖形的統(tǒng)計圖中的矩形線框??梢詫Χ鄠€時間上的導師排名區(qū)間進行框選,從最后一年往前,依次選取越來越低的排名區(qū)間,并且可以對已選取排名區(qū)間進行調(diào)整,框選后的趨勢效果如圖3所示,從而得到所需趨勢的導師。在步驟4進行上述操作后,進而可以在步驟5中對聚類展開的圖形做進一步的分析。另外當鼠標移動到某個代表導師的圖形上時,會用線串聯(lián)每一個時間上的屬于此導師的圖形,可以觀察到這個導師在每一年中平均排名的變化,同時顯示此時間上導師的具體排名信息。每一個導師圖形的顏色深淺,表明了此導師在這一年的排名穩(wěn)定程度,通過比較每條連線上的導師圖形顏色深淺,來確定哪些導師的總體排名穩(wěn)定程度更好。點擊此圖形,會顯示此代表的導師所有時間上由不同排名標準給出的排名信息。當前第1頁12
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
桐柏县| 秦皇岛市| 高唐县| 贺兰县| 扎兰屯市| 莱西市| 黄冈市| 邹城市| 万州区| 民勤县| 正安县| 乌拉特前旗| 富蕴县| 瑞金市| 德阳市| 广州市| 凭祥市| 蓝田县| 长乐市| 清原| 丹东市| 抚宁县| 金华市| 滁州市| 广元市| 翁源县| 定南县| 财经| 山阳县| 建平县| 镇雄县| 刚察县| 天水市| 孝昌县| 团风县| 永兴县| 陆河县| 盖州市| 和平区| 绥中县| 柳林县|