專利名稱:一種基于概念模型的本體復(fù)雜性分析評估方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于本體演變過程中,對所構(gòu)建本體的復(fù)雜性進行分析和評估的方法。它 面向計算機本體工程領(lǐng)域。
背景技術(shù):
目前,Web的發(fā)展迅猛,Web上各種應(yīng)用日益復(fù)雜。但Web上現(xiàn)有的信息對計算機是不 可理解的,這極大的影響了 Web應(yīng)用的自動化、集成化和智能化進程。于是Berners-Lee提出 了下一代Web——語義Web的目標(biāo),就是使Web上的信息具有計算機可以理解的語義,其 中一個重要的思想就是用本體來表示語義信息,從而提高Web信息服務(wù)的智能化和自動化。 這對本體的規(guī)劃、設(shè)計和開發(fā)人員提出了新的挑戰(zhàn)——本體工程學(xué),即本體的構(gòu)建應(yīng)該是工 程化的。盡管這一思想已經(jīng)被廣泛接受,但是并沒有得到廣泛認(rèn)可的通用的方法。目前,本 體的構(gòu)建基本還是采用以經(jīng)驗為主的構(gòu)建方法。這種方法對中小規(guī)模的本體還是可行的。但 是隨著本體規(guī)模的急劇擴大和復(fù)雜性的迅速增加,構(gòu)建本體時需要考慮的因素也急劇增加, 往往超出了人的經(jīng)驗所能企及的范圍,同時會加大本體更新、維護的技術(shù)和經(jīng)濟風(fēng)險。
如果在本體構(gòu)建階段,能及時跟蹤、分析本體的規(guī)模和復(fù)雜性情況及演變趨勢,則可以提 高本體開發(fā)的質(zhì)量,估計開發(fā)的費用,以及有效減少今后本體維護的開銷,從一定程度上規(guī) 避技術(shù)和經(jīng)濟風(fēng)險。因此在對本體的規(guī)模和復(fù)雜性情況及演變進行分析時,合理有效的評估 方法和指標(biāo)是很關(guān)鍵的。然而,目前的分析評估方法很少而且不夠系統(tǒng)和全面。
現(xiàn)有的分析評估方法主要從本體描述能力的角度,針對本體的構(gòu)詞、語義及結(jié)構(gòu)特點對本
體質(zhì)量進行評估,主要有下列幾種
1) 美國喬治亞州立大學(xué)的Burton、 Storey、 Sugumaran和Ahluwalia (2003年)從構(gòu)詞法、
語義能力、實效性和社會性四個方面,對DAML本體的有效性進行了評估,同時給出了一組 評價指標(biāo)。而且在這些指標(biāo)的基礎(chǔ)上,通過加權(quán)函數(shù)計算得出本體總體質(zhì)量的評價指標(biāo)。
2) 美國阿拉巴馬大學(xué)(亨茨維爾)的Yao、 Orme和Etzkorn (2005年)提出的內(nèi)聚指標(biāo) (cohesion metrics),針對本體中類的數(shù)量及繼承樹的深度,對OWL本體的模態(tài)相關(guān)性 (modular relatedness)進行分析。這些指標(biāo)首先從構(gòu)詞法的角度對OWL本體進行解析,然后
根據(jù)樹狀的語義層次結(jié)構(gòu)計算而得。從理論上講,這組指標(biāo)比人按經(jīng)驗的評價方法有效。但 這些標(biāo)準(zhǔn)卻并非是專門針對本體復(fù)雜度的。
3) 東南大學(xué)的Kang、Xu、Lu和Chu(2004年)用加權(quán)類關(guān)系圖(weighted class dependence graph)表示一個給定的類,并提出基于熵距離(entropy distance)的方法,對UML類的結(jié)構(gòu) 復(fù)雜性進行評估。該方法同時考慮了類和關(guān)系的復(fù)雜性,并將類和關(guān)系的復(fù)雜度值通過一定 的規(guī)則轉(zhuǎn)化為加權(quán)類關(guān)系圖。這種方法能夠比較客觀的分析類的結(jié)構(gòu)復(fù)雜性。
4) 美國喬治亞技術(shù)學(xué)院的His (2004年)在他的博士論文中,通過圖論的方法研究了兩 個概念完整性指標(biāo)概念一致性(conceptual coherence)和概念復(fù)雜性(conceptual complexity)。 概念一致性指標(biāo)用圖中節(jié)點間的平均距離來考察概念間的相關(guān)性。概念復(fù)雜性指標(biāo)主要體現(xiàn) 為概念圖中每個節(jié)點的關(guān)系數(shù)及圖中所有節(jié)點的平均度數(shù)。這兩個指標(biāo)更多是用來衡量單個 概念的復(fù)雜度問題。
5) 美國BDGP/GO協(xié)會的Mungall (2005年)以有向非循環(huán)圖(directed acyclic graph, DAG)表示本體的層次結(jié)構(gòu),通過每個概念的平均路徑數(shù)來衡量本體的復(fù)雜性。但是,在統(tǒng) 計本體概念總數(shù)時,他沒有把排除那些已經(jīng)廢棄的概念。而在計算概念的路徑數(shù)時,廢棄概 念的路徑卻是排除在外的。這樣在計算路徑與概念的比率時,其結(jié)果是不正確的。
上述方法的共性問題是都提出了各自的本體復(fù)雜性的評估方法和指標(biāo),但方法本身及指標(biāo) 合理性都不夠全面。
發(fā)明內(nèi)容
針對現(xiàn)有對本體復(fù)雜性評估分析方法和指標(biāo)的不足,本發(fā)明提出一種基于概念模型的本 體復(fù)雜性分析評估方法,以克服現(xiàn)有評估分析方法不夠系統(tǒng)全面,分析手段較單一,分析的 合理性驗證不夠說服力,對復(fù)雜性變化的原因分析不足等缺點。
為達上述目的,本發(fā)明采用如下技術(shù)方案
一種基于概念模型的本體復(fù)雜性分析評估方法,包括以下步驟
1) 獲取所需分析本體的版本,將其轉(zhuǎn)化為DAG圖的格式;
2) 對單個本體內(nèi)部的所有概念,按其重要程度從高至低排序,對排序后的每個概念統(tǒng)計 其路徑數(shù)、最大路徑長度和平均路徑長度,并以表格形式存儲;分析單個本體的復(fù)雜性分布 的性質(zhì)和規(guī)律。
作為本發(fā)明方法的一種改進,所述步驟2)中,對于重要程度相同的概念,再按其平均路
徑長度值由小至大排序。
作為本發(fā)明方法的又一改進,所述步驟1)中,獲取所需分析本體的版本為多個演變版本,
在所述步驟2)之后,還包括以下步驟
3) 對本體的各個演變版本,統(tǒng)計本體擁有的概念數(shù)、關(guān)系數(shù)、路徑數(shù)、最大路徑長度、 平均路徑長度、平均關(guān)系數(shù)、平均路徑數(shù)和本體最長路徑與平均路徑長度的比率,以表格形 式存儲;分析本體的各個不同版本的復(fù)雜性演變的性質(zhì)、規(guī)律和趨勢。
在所述步驟3)之后,還包括以下步驟
作為本發(fā)明方法的再一改進,所述步驟3)之后,還包括以下步驟
4) 將所述步驟2)、步驟3)獲得數(shù)據(jù)結(jié)合,用于分析引起本體復(fù)雜性演變的原因及其與 其復(fù)雜性分布的關(guān)系。
本發(fā)明具有以下優(yōu)點
1、 基于本體共有的基本屬性——概念模型的評價指標(biāo)集,概念、關(guān)系和路徑是本體共有 的基本屬性,本體概念模型由概念和關(guān)系的構(gòu)成。本方法主要從概念、關(guān)系和路徑三者的相 互依賴關(guān)系,通過對本體概念模型的分析,提出了本體復(fù)雜性的評價指標(biāo)集。因此本方法的 適用性較廣。
2、 分析對象同時包括本體本身和本體中的單個概念,以往方法的分析對象往往為整個本
體,通過一定的評價指標(biāo)集對本體的復(fù)雜性或其它性質(zhì)的演變進行分析,但對組成本體的概 念本身及其結(jié)構(gòu)和層次卻無相應(yīng)評價指標(biāo),而實際上正是由于本體概念的數(shù)量、結(jié)構(gòu)和層次
的變化才導(dǎo)致本體復(fù)雜性的變化。因此本方法中的評價指標(biāo)集包括了對本體中概念的復(fù)雜性 的評價,從而更加全面和有效。
3、 對本體概念按其重要程度開展復(fù)雜性分析,本方法提出了 "概念的重要程度"的定義。 概念自身由于所處本體中的層次不同,與其它概念的聯(lián)系數(shù)量不同而有著不同的復(fù)雜性,整 個本體的復(fù)雜性是由所有概念共同產(chǎn)生的,那些與較多其它概念產(chǎn)生聯(lián)系的較重要概念,其 對本體的復(fù)雜性的"貢獻"也較高。對概念按重要程度進行分析, 一方面可以由此看清整個 本體內(nèi)部的復(fù)雜性分布,另一方面還可對本體演變過程中復(fù)雜性變化產(chǎn)生的內(nèi)部原因進行更 好的深入研究。
圖1至圖3為BP本體的復(fù)雜性演變圖。
圖4至圖6為CC本體的復(fù)雜度演變圖。
圖7至圖9為MF本體的復(fù)雜度演變圖。
圖10為2005年9月GO本體的路徑和度數(shù)分布圖。
圖11為GO本體各個演變版本的路徑分布統(tǒng)計圖。
圖12為GO本體各個演變版本的概念和路徑變化圖。
具體實施例方式
一種基于概念模型的本體復(fù)雜性分析評估方法,為便于說明本方法,首先給出下面一些定
義
概念本體概念模型中的概念是廣義上的概念,除了一般意義上的概念以外,可以指任何 事務(wù),如任務(wù)、功能、行為、策略、推理過程等等,用小寫符號C表示。在其他本體中,"概
念"(Concept)可能被稱為"類"(Class)或者"術(shù)語"(Term)。
概念集概念模型中所有概念組成的集合,用大寫符號C表示,即C—c,,q,…,cg。概
念集中的元素個數(shù)IC卜m,表示概念模型中包含w個概念。
關(guān)系本體概念模型中的關(guān)系是指概念之間的相互作用,用小寫符號r表示。本方法中的
關(guān)系只包含那些反映概念間繼承或?qū)傩躁P(guān)系(is—a)和部分與整體的關(guān)系(part—of)。
關(guān)系集概念模型中所有的關(guān)系組成的集合,用大寫符號及表示,即及-^,^…人l。關(guān)
系集及中的元素個數(shù)l及卜w,表示概念模型中包含"個關(guān)系。
本體概念模型所反映的概念層次結(jié)構(gòu)可以用有向非循環(huán)圖(DAG, Directed Acyclic Graph) 表示,圖中每個節(jié)點代表一個概念,每條有向弧表示概念間的層次關(guān)系。圖中有向弧的方向 定義為如果概念c,是。的一部分(即part—of關(guān)系),或者c,.是。的繼承概念或?qū)傩愿拍?即
is一a關(guān)系),則存在一條從c,指向。的有向弧",?!?。c,.為有向弧的始點,。為有向弧的終點。
c,.作為有向弧的始點的次數(shù),稱為c,的出度,記為cT(c,.);。作為有向弧的終點的次數(shù),稱為
c,.的入度,記為cT(c^; c,的出度與入度之和,稱為&的度,記為<formula>formula see original document page 6</formula>—般概念在本體概念模型的DAG圖中,那些出度為零的概念,記為cj。 一般地,在本
體概念模型中至少存在一個一般概念。
路徑在本體概念模型的DAG圖中,從概念c,.到一般概念化的一條有向弧的通路,稱為
概念^的一條路徑,通路的長度稱為路徑長度。若概念c,存在多條路徑,用小寫符號A表示
概念。擁有的路徑數(shù),用^/表示概念。的第_/條路徑,用/ //表示£:,的第_/條路徑長度。
路徑集在本體概念模型的DAG圖中,所有概念的路徑/V組成的集合,用大寫符號P表
示。集合尸中元素的個數(shù)l戶l-h表示本體概念模型中包含;t條路徑。a、、,7槲 z、
; ///;^
上面兩個指標(biāo)主要用于衡量概念c,與一般概念間的語義距離.
2、 本體復(fù)雜性指標(biāo) 2.1基本指標(biāo)集
在本體概念模型的基礎(chǔ)上,下面給出衡量本體復(fù)雜性的基本指標(biāo)集及計算方法 W:本體擁有的概念數(shù),|C| = m。
:本體擁有的關(guān)系數(shù),|及| ="。
h本體擁有的路徑數(shù),|P| = A:。
附和n是本體的基本屬性,能夠反映本體基本規(guī)模的變化。A的大小則反映了本體概念間
層次結(jié)構(gòu)的復(fù)雜程度。
A:本體的最大路徑長度,A-max(;i,.), lS/S/w。
X:本體的平均路徑長度,X= ^; ///t。
這兩個指標(biāo)主要用于衡量本體從一般概念衍生出來的概念覆蓋度。
2.2復(fù)雜性指標(biāo)集
A:本體概念的平均關(guān)系數(shù),// = "/m,它反映了概念間的平均關(guān)聯(lián)度。
本體概念的平均路徑數(shù),= 對于任何本體來說,除了一般概念外,其他每個
概念至少有一個父概念,因此/ 必定大于等于1。如果p-l,則說明本體的概念模型是一棵 樹。因為每個概念都只有一個父概念,因此只有一條路徑可達一般概念。如果每個概念的平 均關(guān)系數(shù)越多,則本體的平均路徑數(shù)越多,即//越大,p越大,兩者成正比。
本體最長路徑與平均路徑長度的比率,C7 = A/X。該指標(biāo)主要衡量本體概念的聚合度
及密集度。
根據(jù)上文提出的"概念重要程度"的概念及其定義,以及一套衡量本體及其內(nèi)部概念的復(fù) 雜性指標(biāo)集,在此基礎(chǔ)上可對本體的復(fù)雜性演變及分布進行分析和評估乃至預(yù)測。主要步驟
如下
1) 獲取所需分析本體的各個演變版本,將其轉(zhuǎn)化為DAG圖的格式,便于計算機統(tǒng)計處
理;
2) 對單個本體內(nèi)部的所有概念,按其重要程度從高至低排序,對于重要程度相同的概念, 按其X值由小至大排序,對以上二者都相同的概念,按其路徑數(shù)A由大至小排序。對排序后
的每個概念c,計算得出其p,.,;i,.和X,以表格形式存儲;
3) 對本體的各個演變版本,統(tǒng)計/ , ", *, A, X, /i, p和O",以表格形式存儲;
4) 對步驟2)中的統(tǒng)計結(jié)果進行制圖,用于分析單個本體的復(fù)雜性分布的性質(zhì)和規(guī)律; 對步驟3)中的統(tǒng)計結(jié)果進行制圖,用于分析本體的各個不同版本的復(fù)雜性演變的性質(zhì)、規(guī)律 和趨勢;將步驟2), 3)結(jié)合制圖,用于分析引起本體復(fù)雜性演變的原因及其與其復(fù)雜性分布 的關(guān)系。
為了驗證本發(fā)明實施例的有效性,本實施例中,選對GO本體進行分析驗證。GO是一個
典型的大規(guī)模、標(biāo)準(zhǔn)化、并行開發(fā)的本體,在生物學(xué)領(lǐng)域已有廣泛應(yīng)用。分析對象是從2002
年12月至2005年6月間每個月發(fā)布的GO本體文件,從而對GO本體復(fù)雜性的歷史演變進行
了研究。我們首先對組成GO本體的三個獨立的子本體BP (Biological Process,生物過程),
CC (Cellular Component,細胞組成)和MF (Molecular Function,分子功能)進行了分析,
又對GO本身的各個版本進行了分析。
圖1至圖3所示為BP本體的概念數(shù)(m )、關(guān)系數(shù)(n )和路徑數(shù)(/t)的歷史演變趨勢,
左y軸表示概念數(shù)和關(guān)系數(shù),右j軸表示路徑數(shù)的變化。如圖1所示,BP本體的概念數(shù)和關(guān)
系數(shù)的增長緩慢而且平穩(wěn),月平均增長率為1.17%和1.44%;而路徑數(shù)則成階梯狀增長,月平
均增長率為8.75%。圖2為平均關(guān)系數(shù)/z和平均路徑數(shù)p的歷史演變趨勢,左少軸表示p,右少軸表示p的變 化。如圖所示,BP本體的平均關(guān)系數(shù)增長緩慢,月平均增長率為0.26%;而平均路徑數(shù)的增 長很快,月平均增長率為7.51%。但兩者的增長是同步的,表現(xiàn)為兩條曲線在同一個時間點上, 同時出現(xiàn)躍遷現(xiàn)象。因為路徑是由關(guān)系構(gòu)成的,因此;/的微小增長會導(dǎo)致p在數(shù)量上的巨大 變化。
圖3所示為最大路徑長度A、平均路徑長度X和兩者的比值c的歷史演變趨勢,左少軸表 示A和X,右y軸表示c7的變化。如圖所示,因為(T的值都沒有大于2,說明半數(shù)以上的概念 緊緊圍繞在一般概念的周圍,因此BP本體的概念聚合度比較好。A的增長非常穩(wěn)定,說明本 體概念的覆蓋范圍定期向外進行延伸。X的增長相對緩慢,月平均增長率為0.48%,說明本體 概念的密集度沒有較大的變化。
圖4至圖6所示為CC本體復(fù)雜性的演變趨勢,圖形的配置與圖1至圖3 —致。
如圖4所示,CC本體的概念數(shù)和關(guān)系數(shù)的增長緩慢而且平穩(wěn),月平均增長率為1.28%和 1.92%;而路徑數(shù)則成階梯狀增長,月平均增長率為7.24%。
如圖5所示,CC本體的平均關(guān)系數(shù)增長緩慢,月平均增長率為0.63%;而平均路徑數(shù)的 增長很快,月平均增長率為5.88%,而且兩者的增長也是同步的。如圖6所示,CC本體的o"的值大多大于2,說明CC本體的概念聚合度比較松散。A的
增長非常穩(wěn)定,說明本體概念的覆蓋范圍定期向外進行延伸。X的增長相對緩慢,月平均增 長率為0.47%,說明本體概念的密集度沒有較大的變化。
通過圖4至圖6與與圖1至圖3的對比可知,BP本體和CC本體復(fù)雜性的基本特點及演 變規(guī)律基本一致。
圖7至圖9所示為MF本體復(fù)雜性的演變趨勢,圖形的配置與圖4至圖6 —致。如圖7所 示,MF本體的概念數(shù)和關(guān)系數(shù)在2003年第三季度時出現(xiàn)連續(xù)的巨大增長,之后又略有下降, 其余大部分時間內(nèi)的增長相當(dāng)緩慢,月平均增長率僅為1.07%和0.91%。而路徑數(shù)的增長趨勢 與概念數(shù)和關(guān)系數(shù)是一致的,但波動幅度更大。這是由于路徑是由關(guān)系構(gòu)成的,關(guān)系數(shù)出現(xiàn) 較小的變化會導(dǎo)致路徑數(shù)出現(xiàn)較大的波動。如圖8所示,MF本體的平均關(guān)系數(shù)和平均路徑數(shù) 的起伏很大,但兩者的波動基本是同步的。這說明在MF本體的構(gòu)建過程中,出現(xiàn)過較大的 反復(fù)。如圖9所示,MF本體的o"的值大多大于2,說明MF本體的概念聚合度比較松散。A的
起伏較大,說明概念覆蓋的最外延變化較大。但X的變化非常平穩(wěn),月平均增長率僅為0.02%, 說明本體概念的密集度基本沒有變化。
圖10為對GO中所有概念的度數(shù)《和路徑數(shù)p,的分布統(tǒng)計。由于GO過于龐大,無法顯
示所有概念的《和p,,因此以200個概念為一組,不足200的最后55個概念單獨作為一組,
計算這些組的平均度數(shù)和平均路徑數(shù)得到圖10。圖10中,x軸數(shù)字為以200個為一組的概念
組標(biāo)號,標(biāo)號數(shù)越大表示重要程度越低。左邊y軸用于概念組的平均路徑數(shù)分布,右邊^(qū)軸用
于概念組的平均度數(shù)分布。從圖10中可看出,平均路徑數(shù)在開始還具有一定程度的較大波動, 在第5組達到最高峰,為127.24。但其總趨勢是按概念的重要程度的降低而減小。而平均度 數(shù)在第一組就具備最大值,為14.75,然后隨著組號遞增而遞減,中間有一些小波動??梢哉f 2005年9月GO本體的大部分路徑數(shù)和度數(shù)是分布于少數(shù)重要概念上的,經(jīng)計算這個比例是-70%的路徑數(shù)和度數(shù)分布在按重要程度排序的前20.85%和前42.52%的概念上。
對自2002年12月至2005年9月的所有GO本體的概念進行概念排序后,統(tǒng)計其70%路
徑數(shù)分布情況得到圖ll。圖11中左邊y軸用于路徑數(shù)h右邊的y軸用于百分比曲線。百分
比的意義是某個特定時間版本GO的70%路徑數(shù)分布在其概念排序后的前百分之多少的概 念上。從圖中可看出,百分比基本在20%至40%之間,其具體的表現(xiàn)形式為一段時間的較小 波動,然后產(chǎn)生一次突減。對比兩條曲線可發(fā)現(xiàn),路徑數(shù)it突增的時間也基本是百分比突減的 時間。這些表明,GO本體路徑數(shù)的每次突增就對應(yīng)著其路徑分布的更加集中。
圖12中左邊j軸用于曲線St1000,右邊y軸用于路徑增量曲線。Stl000曲線表示,在對
每個月的GO本體的概念按重要程度排序后,其前1000個概念與前一個月的前1000個概念 不匹配的個數(shù),以05年9月的GO為例,它的前1000個概念中,有22個概念不在05年8 月GO的前1000個概念里。路徑增量曲線表示每個月的GO本體的路徑數(shù)相對于前一個月的 增量。從圖12中可看出,當(dāng)路徑增量的絕對值較小時,Stl000也較小,在路徑增量有較大 變化時,St1000也相應(yīng)有較大變化。分析可得出,GO本體復(fù)雜度發(fā)生較大變化的時候也正是 其較重要概念變動較大的時候。復(fù)雜度的較大變化可能是由于一些新的重要概念的引入,也 可能是由于對領(lǐng)域的重新認(rèn)識導(dǎo)致整個本體結(jié)構(gòu)的變化使得重要概念的順序產(chǎn)生較大變動。 這點也說明了對領(lǐng)域要清晰認(rèn)識,對重要概念要精心設(shè)計的原因。在本體演變過程中,應(yīng)盡 量避免對較重要概念的改動,這往往意味著本體復(fù)雜性的重大變化。 上述對GO本體的復(fù)雜性的分析結(jié)果充分驗證了本方法的有效性。
權(quán)利要求
1、一種基于概念模型的本體復(fù)雜性分析評估方法,其特征在于包括以下步驟1)獲取所需分析本體的版本,將其轉(zhuǎn)化為DAG圖的格式;2)對單個本體內(nèi)部的所有概念,按其重要程度從高至低排序,對排序后的每個概念統(tǒng)計其路徑數(shù)、最大路徑長度和平均路徑長度,并以表格形式存儲;分析單個本體的復(fù)雜性分布的性質(zhì)和規(guī)律。
2、 根據(jù)權(quán)利要求1所述的基于概念模型的本體復(fù)雜性分析評估方法,其特征在于所述步驟 2)中,對于重要程度相同的概念,再按其平均路徑長度值由小至大排序。
3、 根據(jù)權(quán)利要求1或2所述的基于概念模型的本體復(fù)雜性分析評估方法,其特征在于所述 步驟1)中,獲取所需分析本體的版本為多個演變版本,在所述步驟2)之后,還包括以 下步驟3)對本體的各個演變版本,統(tǒng)計本體擁有的概念數(shù)、關(guān)系數(shù)、路徑數(shù)、最大路 徑長度、平均路徑長度、平均關(guān)系數(shù)、平均路徑數(shù)和本體最長路徑與平均路徑長度的比率, 以表格形式存儲;分析本體的各個不同版本的復(fù)雜性演變的性質(zhì)、規(guī)律和趨勢。
4、 根據(jù)權(quán)利要求3所述的基于概念模型的本體復(fù)雜性分析評估方法,其特征在于在所述步 驟3)之后,還包括以下步驟4)將所述步驟2)、步驟3)獲得數(shù)據(jù)結(jié)合,用于分析引起本體復(fù)雜性演變的原因及其與其復(fù)雜性分布的關(guān)系。
全文摘要
一種基于概念模型的本體復(fù)雜性分析評估方法,主要包括以下步驟1)獲取所需分析本體的版本,將其轉(zhuǎn)化為DAG圖的格式;2)對單個本體內(nèi)部的所有概念,按其重要程度從高至低排序,對排序后的每個概念統(tǒng)計其路徑數(shù)、最大路徑長度和平均路徑長度,并以表格形式存儲;分析單個本體的復(fù)雜性分布的性質(zhì)和規(guī)律。所述步驟2)中,對于重要程度相同的概念,再按其平均路徑長度值由小至大排序。本發(fā)明從概念、關(guān)系和路徑三者的相互依賴關(guān)系,通過對本體概念模型的分析,克服了現(xiàn)有評估分析方法不夠系統(tǒng)全面,分析的合理性驗證不夠說服力,對復(fù)雜性變化的原因分析不足等缺點,適用范圍廣泛。
文檔編號G06F17/00GK101114275SQ200610029310
公開日2008年1月30日 申請日期2006年7月24日 優(yōu)先權(quán)日2006年7月24日
發(fā)明者釧 葉, 張大陸, 哲 楊 申請人:同濟大學(xué)