两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于圖模型的軟件項目語義信息表示及檢索方法

文檔序號:6544180閱讀:292來源:國知局
基于圖模型的軟件項目語義信息表示及檢索方法
【專利摘要】本發(fā)明涉及一種軟件項目語義信息的表示及檢索方法,尤其是涉及一種采用圖模型表示和檢索軟件項目語義信息的方法。包括:抽取軟件項目信息的步驟:從軟件項目資源中抽取結(jié)構(gòu)化信息本體和無結(jié)構(gòu)信息本體;存儲結(jié)構(gòu)化信息本體的步驟:將結(jié)構(gòu)化信息本體以圖模型庫形式進行表示和存儲;存儲無結(jié)構(gòu)信息的步驟:以文件形式存儲無結(jié)構(gòu)信息本體,并建立結(jié)化信息本體和無結(jié)構(gòu)信息本體之間的關聯(lián)關系。因此,本發(fā)明具有如下優(yōu)點:1.分別采用圖模型和文本索引技術組織存儲結(jié)構(gòu)化信息和無結(jié)構(gòu)信息,使數(shù)據(jù)間關聯(lián)的表示更加靈活;2.基于圖模型、文本索引、關聯(lián)機制提供綜合的問題查詢方法,對問題的查詢定位更加準確。
【專利說明】基于圖模型的軟件項目語義信息表示及檢索方法
【技術領域】
[0001]本發(fā)明涉及一種軟件項目語義信息的表示及檢索方法,尤其是涉及一種采用圖模型表不和檢索軟件項目語義息的方法。
【背景技術】
[0002]在軟件開發(fā)中,軟件代碼、文檔等的存儲往往以傳統(tǒng)的文件系統(tǒng)、關系型數(shù)據(jù)庫等形式為主,對文檔中蘊含的語義信息不進行處理和明確的表示。但是,軟件代碼和文檔中提供了理解該軟件的重要資源,其中包含了軟件業(yè)務領域的需求分析、軟件的系統(tǒng)架構(gòu)、程序結(jié)構(gòu)、軟件功能的實現(xiàn)流程、軟件使用方法等信息,這些包含了描述軟件項目語義的信息,對于項目開發(fā)者理解軟件業(yè)務需求、參與代碼編寫都有重要作用。
[0003]目前,關于表示軟件項目資源中的語義信息的現(xiàn)有技術主要有基于NOSQL(NotOnly SQL)數(shù)據(jù)庫的表示方式和基于語義網(wǎng)表技術的表示方式,但是這些技術的局限之處在于語義網(wǎng)的描述框架的使用和構(gòu)造存在一定難度,尚未有軟件工程領域的應用技術。
[0004]因此,對軟件構(gòu)件、軟件系統(tǒng)或項目的代碼、文檔等資源進行深入分析,對其中蘊含的軟件項目語義信息進行清晰合理的展示,進而幫助軟件復用者、開發(fā)者更容易地理解軟件項目,是一項亟待解決的問題,對于軟件開發(fā)效率的提高具有重要意義。。

【發(fā)明內(nèi)容】

[0005]本發(fā)明主要是解決現(xiàn)有技術中所存在的缺乏有效表示軟件項目文檔中所蘊含的豐富語義信息的表示和處理方法等問題,提供了一種軟件項目語義信息的表示方法,該方法可以對代碼、文檔等各類軟件資源中蘊含的語義信息進行整合、關聯(lián)、存儲和查詢,以幫助軟件開發(fā)者、復用者對軟件項目資源進行更深入的理解,并幫助解決實際開發(fā)中可能遇到的問題。
[0006]本發(fā)明還有一目的是解決現(xiàn)有技術中所存在的缺乏有效查找軟件項目中與語義相關的文檔代碼等問題,提供了一種對基于圖模型表示的軟件項目語義信息進行檢索的方法。該方法將圖模型查詢技術、文本索引檢索技術、關聯(lián)定位技術相結(jié)合,能基于軟件項目語義信息快速進行檢索。
[0007]本發(fā)明的上述技術問題主要是通過下述技術方案得以解決的:
[0008]一種基于圖模型的軟件項目語義信息表示方法,包括:
[0009]抽取軟件項目信息的步驟:從軟件項目資源中抽取結(jié)構(gòu)化信息本體和無結(jié)構(gòu)信息本體;
[0010]存儲結(jié)構(gòu)化信息本體的步驟:將結(jié)構(gòu)化信息本體以圖數(shù)據(jù)庫形式進行表示和存儲;
[0011]存儲無結(jié)構(gòu)信息的步驟:以文件形式存儲無結(jié)構(gòu)信息本體,并建立結(jié)化信息本體和無結(jié)構(gòu)信息本體之間的關聯(lián)關系。
[0012]優(yōu)化的,上述的一種基于圖模型的軟件項目語義信息表示方法,所述抽取軟件項目信息的步驟進一步包括以下子步驟:
[0013]步驟2.1:將結(jié)構(gòu)化信息本體構(gòu)建成一個抽象語法樹,結(jié)構(gòu)化信息本體的每個元素都對應一個抽象語法樹上的結(jié)點;
[0014]步驟2.2:根據(jù)步驟2.1中構(gòu)建的語法樹上的結(jié)點所包含的具體元素內(nèi)容,構(gòu)建抽象語法樹各結(jié)點之間的關系;
[0015]步驟2.3:將步驟2.1中構(gòu)建的語法樹上的結(jié)點和步驟2.2中構(gòu)建的各結(jié)點之間的關系儲存在數(shù)據(jù)庫中。
[0016]優(yōu)化的,上述一種基于圖模型的軟件項目語義信息表示方法,所述結(jié)構(gòu)化信息本體是項目代碼,所述步驟2.2中構(gòu)建的抽象語法樹各結(jié)點之間的關系是項目代碼中的繼承、包含、依賴、調(diào)用、實現(xiàn)關系中的一種或多種。
[0017]優(yōu)化的,上述一種基于圖模型的軟件項目語義信息表示方法,所述存儲結(jié)構(gòu)化信息本體的步驟進一步包括以下子步驟:
[0018]步驟4.1:為每一類結(jié)構(gòu)化信息本體建立圖數(shù)據(jù)庫中的本體類型以及每一類本體包含的具體屬性;
[0019]步驟4.2:對于每一個結(jié)構(gòu)化信息本體,在圖數(shù)據(jù)庫中建立相應的實體,并存儲其具體的屬性值;
[0020]步驟4.3:為每一類結(jié)構(gòu)化信息本體之間的關系建立圖數(shù)據(jù)庫中的關系類型以及每一類關系包含具體的屬性;
[0021]步驟4.4:為每一個結(jié)構(gòu)化信息本體之間的關系,在圖數(shù)據(jù)庫中建立相應的關系,并存儲其具體的屬性值,關系兩端是步驟4.2中建立的實體。
[0022]優(yōu)化的,上述一種基于圖模型的軟件項目語義信息表示方法,所述存儲無結(jié)構(gòu)信息的步驟進一步包括以下子步驟:
[0023]步驟5.1:在圖數(shù)據(jù)庫中建立用來表示無結(jié)構(gòu)本體的文檔類型以及用來表示結(jié)構(gòu)化信息本體和無結(jié)構(gòu)信息本體之間關聯(lián)的關系類型;
[0024]步驟5.2:將無結(jié)構(gòu)信息按照步驟5.1所建立的文檔類型進行存儲并建立表示無結(jié)構(gòu)文本與該無結(jié)構(gòu)文本在圖模型庫中存儲的無結(jié)構(gòu)信息本體之間對應關系的索引表;
[0025]步驟5.3:提取步驟5.2中存儲的無結(jié)構(gòu)信息本體中所包含的元素,若所述元素存在于存儲結(jié)構(gòu)化信息本體的步驟中所存儲的結(jié)構(gòu)化信息本體中,則在對應的無結(jié)構(gòu)信息本體和結(jié)構(gòu)化信息本體之間建立一個步驟5.1所述的關系類型的屬性值。
[0026]一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,包括以下步驟:
[0027]構(gòu)造查詢請求的步驟:根據(jù)待檢索問題構(gòu)造圖模型查詢請求和無結(jié)構(gòu)信息的查詢請求;
[0028]無結(jié)構(gòu)信息的查詢步驟:在無結(jié)構(gòu)信息中處理無結(jié)構(gòu)信息的查詢請求,獲取查詢結(jié)果;
[0029]關聯(lián)結(jié)點的定位步驟:采用關聯(lián)定位技術查詢無結(jié)構(gòu)信息與圖模型的關聯(lián)關系,并定位到關聯(lián)節(jié)點;
[0030]圖模型查詢的步驟:在圖數(shù)據(jù)庫中根據(jù)圖模型查詢請求對所定位關聯(lián)節(jié)點進行查詢,返回數(shù)據(jù)模型的查詢子圖,并將關聯(lián)結(jié)點的定位步驟中與結(jié)構(gòu)化信息本體關聯(lián)的無結(jié)構(gòu)信息作為描述性補充信息。[0031]優(yōu)化的,上述的一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,所述關聯(lián)結(jié)點的定位步驟進一步包括以下子步驟:
[0032]步驟7.1:通過無結(jié)構(gòu)文本與該無結(jié)構(gòu)文本在圖數(shù)據(jù)庫中存儲的本體之間對應關系的索引表,在圖數(shù)據(jù)庫中找出無結(jié)構(gòu)文本本體;
[0033]步驟7.2:對無結(jié)構(gòu)文本進行詞法分析和句法分析,識別其中的查詢關鍵詞或查詢目標,并結(jié)合步驟7.1中找出的圖數(shù)據(jù)庫中的文本本體,構(gòu)造相應的查詢語句;
[0034]步驟7.3:根據(jù)步驟7.2中生成的查詢語句,并按照指定的圖查詢參數(shù),在圖數(shù)據(jù)庫中查詢無結(jié)構(gòu)文本相關聯(lián)的關聯(lián)結(jié)點。
[0035]優(yōu)化的,上述的一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,在所述圖模型查詢的步驟中,首先解析受限的自然語言查詢語句,若查詢語句句法正確則繼續(xù)執(zhí)行以下子步驟:
[0036]步驟8.1:將解析結(jié)果規(guī)整為結(jié)構(gòu)化的數(shù)據(jù)庫查詢指令;
[0037]步驟8.2:將數(shù)據(jù)庫查詢指令編譯為圖數(shù)據(jù)庫的通用查詢語句并執(zhí)行該查詢語句,返回由關聯(lián)節(jié)點構(gòu)成的連通子圖;
[0038]步驟8.3:將步驟8.2得到的子圖可視化;
[0039]步驟8.4:呈現(xiàn)子步驟8.3中的連通子圖的各個節(jié)點所關聯(lián)到的非結(jié)構(gòu)化文本信
肩、O
[0040]優(yōu)化的,上述的一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,在所述圖模型查詢的步驟中,首先解析受限的自然語言查詢語句,若查詢語句句法錯誤則繼續(xù)執(zhí)行以下子步驟:
[0041]步驟9.1:根據(jù)自然語言文本之間的相似度算法,計算自然語言查詢語句與圖數(shù)據(jù)庫中結(jié)構(gòu)化信息本體之間的相似度,返回圖數(shù)據(jù)庫中與自然語言查詢語句相似度最高的節(jié)點作為關聯(lián)的節(jié)點;
[0042]步驟9.2:通過展開步驟9.1中返回的關聯(lián)節(jié)點的鄰接節(jié)點的方式或通過計算步驟9.1中返回的關聯(lián)節(jié)點子圖相似度的方式,在圖數(shù)據(jù)庫中找到關聯(lián)節(jié)點的連通子圖作為結(jié)果;
[0043]步驟9.3:將步驟9.2所得到的連通子圖可視化;
[0044]步驟9.4:呈現(xiàn)子步驟9.3中的連通子圖的各個節(jié)點所關聯(lián)到的非結(jié)構(gòu)化文本信
肩、O
[0045]因此,本發(fā)明具有如下優(yōu)點:1.分別采用圖模型和文本索引技術組織存儲結(jié)構(gòu)化信息和無結(jié)構(gòu)信息,使數(shù)據(jù)間關聯(lián)的表示更加靈活;2.基于圖模型、文本索引、關聯(lián)機制提供綜合的問題查詢方法,對問題的查詢定位更加準確。
【專利附圖】

【附圖說明】
[0046]附圖1是實施例1抽取軟件項目信息步驟的流程圖。
[0047]附圖2是實施例1存儲結(jié)構(gòu)化信息本體步驟的流程圖。
[0048]附圖3是實施例1存儲無結(jié)構(gòu)信息步驟的流程圖。
【具體實施方式】[0049]實施例1:
[0050]參照圖1,抽取軟件項目信息:對項目代碼進行靜態(tài)分析,從軟件項目的代碼、文檔資源中抽取結(jié)構(gòu)化信息本體和無結(jié)構(gòu)信息本體。
[0051]結(jié)構(gòu)化信息是指根據(jù)預先定義的數(shù)據(jù)模型,或者客觀存在的組織形式進行存儲和表達的信息。例如,軟件代碼是按照程序語言語法表達的結(jié)構(gòu)化信息,軟件項目的開發(fā)者郵件包含收、發(fā)件人,郵件主題,發(fā)送時間等固定內(nèi)容的結(jié)構(gòu)化信息,軟件用戶文檔的章節(jié)是符合文檔撰寫習慣的結(jié)構(gòu)化信息。
[0052]無結(jié)構(gòu)信息是指不具備結(jié)構(gòu)化特征的信息,例如,無組織的純自然語言文本段落。
[0053]在本實施例中,結(jié)構(gòu)化信息本體是指項目代碼。該抽取軟件項目信息的步驟進一步包括以下子步驟:
[0054]步驟2.1:將結(jié)構(gòu)化信息本體構(gòu)建成一個DOM結(jié)構(gòu)的抽象語法樹,結(jié)構(gòu)化信息本體的每個元素都對應一個抽象語法樹上的結(jié)點;
[0055]步驟2.2:根據(jù)步驟2.1中構(gòu)建的語法樹上的結(jié)點所包含的具體元素內(nèi)容,構(gòu)建抽象語法樹各結(jié)點之間的關系,如繼承、包含、依賴、調(diào)用、實現(xiàn)等關系中的一種或多種。
[0056]步驟2.3:將步驟2.1中構(gòu)建的語法樹上的結(jié)點和步驟2中構(gòu)建的各結(jié)點之間的關系儲存在SQL數(shù)據(jù)庫之中。
[0057]在完成抽取軟件項目信息的步驟之后,進入如圖2所示的存儲結(jié)構(gòu)化信息本體的步驟,將抽取軟件項目信息步驟中提取出的代碼元素以及它們之間的關系以圖數(shù)據(jù)庫的形式存儲,該步驟進一步包括以下子步驟:
[0058]步驟4.1:為每一類代碼元素建立圖數(shù)據(jù)庫中的本體類型,每一類本體包含具體的屬性;
[0059]步驟4.2:對于提取出的每一個代碼元素,在圖數(shù)據(jù)庫中建立相應的實體,并存儲其具體的屬性值;
[0060]步驟4.3:為每一類代碼元素之間的關系建立圖數(shù)據(jù)庫中的關系類型,每一類關系包含具體的屬性;
[0061]步驟4.4:為每一個代碼元素之間的關系,在圖數(shù)據(jù)庫中建立相應的關系,并存儲其具體的屬性值,關系兩端是4.2中建立的實體。
[0062]在完成存儲無結(jié)構(gòu)信息的步驟之后,進入如圖3所示的存儲無結(jié)構(gòu)信息的步驟,將項目相關文檔存儲在圖模型庫中,并以代碼元素為核心建立它們之間的關聯(lián)。該步驟進一步包括以下子步驟:
[0063]步驟5.1:在圖模型庫中建立用來表示文檔本體的文檔類型以及用來表示代碼元素本體和文檔本體之間關聯(lián)的關系類型;
[0064]步驟5.2:將每一個文檔按照步驟5.1所建立的文檔類型以倒排索引的方式進行組織和存儲。
[0065]步驟5.3:提取步驟5.2中存儲的文檔本體中所包含的代碼元素,若該代碼元素存在于步驟5.2建立的實體中,則在對應的文檔本體和5.2建立的實體之間建立一個“關聯(lián)”關系,并存儲其屬性值。
[0066]本實施例還支持對所抽取并基于圖模型表示的軟件項目語義信息進行檢索。提供將圖模型查詢技術、文本索引檢索技術、關聯(lián)定位技術相結(jié)合的軟件項目語義信息檢索方法。具體步驟包括:
[0067]構(gòu)造查詢請求的步驟、:根據(jù)待檢索問題構(gòu)造圖模型查詢請求和無結(jié)構(gòu)信息的查詢請求;
[0068]無結(jié)構(gòu)信息的查詢步驟:在無結(jié)構(gòu)信息中處理無結(jié)構(gòu)信息的索引查詢請求,獲取查詢結(jié)果;其中無結(jié)構(gòu)信息為文本時,無結(jié)構(gòu)信息的查詢步驟是在文本索引中處理無結(jié)構(gòu)文本索引的查詢請求;
[0069]關聯(lián)結(jié)點的定位步驟:采用關聯(lián)定位技術查詢無結(jié)構(gòu)文本與圖模型的關聯(lián)關系,并定位到關聯(lián)節(jié)點;
[0070]圖模型查詢的步驟:在圖模型中根據(jù)圖模型查詢請求對所定位關聯(lián)節(jié)點進行查詢,返回數(shù)據(jù)模型的查詢子圖,并將關聯(lián)結(jié)點的定位步驟中與結(jié)構(gòu)化信息本體關聯(lián)的無結(jié)構(gòu)信息作為描述性補充信息。
[0071]其中,關聯(lián)結(jié)點的定位步驟主要有以下步驟:
[0072]步驟7.1:通過無結(jié)構(gòu)文本與該無結(jié)構(gòu)文本在圖數(shù)據(jù)庫中存儲的本體之間對應關系的索引表,在圖數(shù)據(jù)庫中找出無結(jié)構(gòu)文本本體;
[0073]步驟7.2:對無結(jié)構(gòu)文本進行詞法分析和句法分析,識別其中的查詢關鍵詞或查詢目標,并結(jié)合步驟7.1中找出的圖數(shù)據(jù)庫中的文本本體,構(gòu)造相應的查詢語句;
[0074]步驟7.3:根據(jù)步驟7.2中生成的查詢語句,并按照指定的圖查詢參數(shù),在圖數(shù)據(jù)庫中查詢無結(jié)構(gòu)文本相關聯(lián)的關聯(lián)結(jié)點。其中,圖查詢參數(shù)為查詢范圍、節(jié)點類型、鄰接節(jié)點擴展數(shù)量中的一種或多種。
[0075]本實施例的圖模型查詢的步驟中,首先解析受限的自然語言查詢語句,若查詢語句句法正確則繼續(xù)執(zhí)行以下子步驟:
[0076]步驟8.1:將解析結(jié)果規(guī)整為結(jié)構(gòu)化的數(shù)據(jù)庫查詢指令;
[0077]步驟8.2:將數(shù)據(jù)庫查詢指令編譯為圖數(shù)據(jù)庫的通用查詢語句并執(zhí)行該查詢語句,返回由關聯(lián)節(jié)點構(gòu)成的連通子圖;
[0078]步驟8.3:將步驟8.2得到的子圖可視化;
[0079]步驟8.4:呈現(xiàn)子步驟8.3中的連通子圖的各個節(jié)點所關聯(lián)到的非結(jié)構(gòu)化文本信
肩、O
[0080]解析受限的自然語言查詢語句時,若查詢語句句法錯誤則繼續(xù)執(zhí)行以下子步驟:
[0081]步驟9.1:根據(jù)自然語言文本之間的相似度算法,計算自然語言查詢語句與圖數(shù)據(jù)庫中結(jié)構(gòu)化信息本體之間的相似度,返回圖數(shù)據(jù)庫中與自然語言查詢語句相似度最高的節(jié)點作為關聯(lián)的節(jié)點;
[0082]步驟9.2:通過展開步驟9.1中返回的關聯(lián)節(jié)點的鄰接節(jié)點的方式或通過計算步驟9.1中返回的關聯(lián)節(jié)點子圖相似度的方式,在圖數(shù)據(jù)庫中找到關聯(lián)節(jié)點的連通子圖作為結(jié)果;
[0083]步驟9.3:將步驟9.2所得到的連通子圖可視化;
[0084]步驟9.4:呈現(xiàn)子步驟9.3中的連通子圖的各個節(jié)點所關聯(lián)到的非結(jié)構(gòu)化文本信
肩、O
[0085]本文中所描述的具體實施例僅僅是對本發(fā)明精神作舉例說明。本發(fā)明所屬【技術領域】的技術人員可以對所描述的具體實施例做各種各樣的修改或補充或采用類似的方式替代,但并不會偏離本發(fā)明的精神或者超越所附權(quán)利要求書所定義的范圍。
【權(quán)利要求】
1.一種基于圖模型的軟件項目語義信息表示方法,其特征在于,包括: 抽取軟件項目信息的步驟:從軟件項目資源中抽取結(jié)構(gòu)化信息本體和無結(jié)構(gòu)信息本體; 存儲結(jié)構(gòu)化信息本體的步驟:將結(jié)構(gòu)化信息本體以圖數(shù)據(jù)庫形式進行表示和存儲; 存儲無結(jié)構(gòu)信息的步驟:以文件形式存儲無結(jié)構(gòu)信息本體,并建立結(jié)化信息本體和無結(jié)構(gòu)信息本體之間的關聯(lián)關系。
2.根據(jù)權(quán)利要求1所述的一種基于圖模型的軟件項目語義信息表示方法,其特征在于,所述抽取軟件項目信息的步驟進一步包括以下子步驟: 步驟2.1:將結(jié)構(gòu)化信息本體構(gòu)建成一個抽象語法樹,結(jié)構(gòu)化信息本體的每個元素都對應一個抽象語法樹上的結(jié)點; 步驟2.2:根據(jù)步驟2.1中構(gòu)建的語法樹上的結(jié)點所包含的具體元素內(nèi)容,構(gòu)建抽象語法樹各結(jié)點之間的關系; 步驟2.3:將步驟2.1中構(gòu)建的語法樹上的結(jié)點和步驟2.2中構(gòu)建的各結(jié)點之間的關系儲存在數(shù)據(jù)庫中。
3.根據(jù)權(quán)利要求2所述一種基于圖模型的軟件項目語義信息表示方法,其特征在于,所述結(jié)構(gòu)化信息本體是項目代碼,所述步驟2.2中構(gòu)建的抽象語法樹各結(jié)點之間的關系是項目代碼中的繼承、包含、依賴、調(diào)用、實現(xiàn)關系中的一種或多種。
4.根據(jù)權(quán)利要求1所述一種基于圖模型的軟件項目語義信息表示方法,其特征在于,所述存儲結(jié)構(gòu)化信息本體的步驟進一步包括以下子步驟: 步驟4.1:為每一類結(jié)構(gòu)化信息本體建立圖數(shù)據(jù)庫中的本體類型以及每一類本體包含的具體屬性; 步驟4.2:對于每一個結(jié)構(gòu)化信息本體,在圖數(shù)據(jù)庫中建立相應的實體,并存儲其具體的屬性值; 步驟4.3:為每一類結(jié)構(gòu)化信息本體之間的關系建立圖數(shù)據(jù)庫中的關系類型以及每一類關系包含具體的屬性; 步驟4.4:為每一個結(jié)構(gòu)化信息本體之間的關系,在圖數(shù)據(jù)庫中建立相應的關系,并存儲其具體的屬性值,關系兩端是步驟4.2中建立的實體。
5.根據(jù)權(quán)利要求1所述一種基于圖模型的軟件項目語義信息表示方法,其特征在于,所述存儲無結(jié)構(gòu)信息的步驟進一步包括以下子步驟: 步驟5.1:在圖數(shù)據(jù)庫中建立用來表示無結(jié)構(gòu)本體的文檔類型以及用來表示結(jié)構(gòu)化信息本體和無結(jié)構(gòu)信息本體之間關聯(lián)的關系類型; 步驟5.2:將無結(jié)構(gòu)信息按照步驟5.1所建立的文檔類型進行存儲并建立表示無結(jié)構(gòu)文本與該無結(jié)構(gòu)文本在圖模型庫中存儲的無結(jié)構(gòu)信息本體之間對應關系的索引表; 步驟5.3:提取步驟5.2中存儲的無結(jié)構(gòu)信息本體中所包含的元素,若所述元素存在于存儲結(jié)構(gòu)化信息本體的步驟中所存儲的結(jié)構(gòu)化信息本體中,則在對應的無結(jié)構(gòu)信息本體和結(jié)構(gòu)化信息本體之間建立一個步驟5.1所述的關系類型的屬性值。
6.一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,其特征在于,包括以下步驟: 構(gòu)造查詢請求的步驟:根據(jù)待檢索問題構(gòu)造圖模型查詢請求和無結(jié)構(gòu)信息的查詢請求; 無結(jié)構(gòu)信息的查詢步驟:在無結(jié)構(gòu)信息中處理無結(jié)構(gòu)信息的查詢請求,獲取查詢結(jié)果; 關聯(lián)結(jié)點的定位步驟:采用關聯(lián)定位技術查詢無結(jié)構(gòu)信息與圖模型的關聯(lián)關系,并定位到關聯(lián)節(jié)點; 圖模型查詢的步驟:在圖數(shù)據(jù)庫中根據(jù)圖模型查詢請求對所定位關聯(lián)節(jié)點進行查詢,返回數(shù)據(jù)模型的查詢子圖,并將關聯(lián)結(jié)點的定位步驟中與結(jié)構(gòu)化信息本體關聯(lián)的無結(jié)構(gòu)信息作為描述性補充信息。
7.根據(jù)權(quán)利要求6所述的一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,其特征在于,所述關聯(lián)結(jié)點的定位步驟進一步包括以下子步驟: 步驟7.1:通過無結(jié)構(gòu)文本與該無結(jié)構(gòu)文本在圖數(shù)據(jù)庫中存儲的本體之間對應關系的索引表,在圖數(shù)據(jù)庫中找出無結(jié)構(gòu)文本本體; 步驟7.2:對無結(jié)構(gòu)文本進行詞法分析和句法分析,識別其中的查詢關鍵詞或查詢目標,并結(jié)合步驟7.1中找出的圖數(shù)據(jù)庫中的文本本體,構(gòu)造相應的查詢語句; 步驟7.3:根據(jù)步驟7.2中生成的查詢語句,并按照指定的圖查詢參數(shù),在圖數(shù)據(jù)庫中查詢無結(jié)構(gòu)文本相關聯(lián)的關聯(lián)結(jié)點。
8.根據(jù)權(quán)利要求6所述的一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,其特征在于,在所述圖模型查詢的步驟中,首先解析受限的自然語言查詢語句,若查詢語句句法正確則繼續(xù)執(zhí)行以下子步驟: 步驟8.1:將解析結(jié)果規(guī)整為結(jié)構(gòu)化的數(shù)據(jù)庫查詢指令; 步驟8.2:將數(shù)據(jù)庫查詢指令編譯為圖數(shù)據(jù)庫的通用查詢語句并執(zhí)行該查詢語句,返回由關聯(lián)節(jié)點構(gòu)成的連通子圖; 步驟8.3:將步驟8.2得到的子圖可視化; 步驟8.4:呈現(xiàn)子步驟8.3中的連通子圖的各個節(jié)點所關聯(lián)到的非結(jié)構(gòu)化文本信息。
9.根據(jù)權(quán)利要求6所述的一種對基于圖模型表示的軟件項目語義信息進行檢索的方法,其特征在于,在所述圖模型查詢的步驟中,首先解析受限的自然語言查詢語句,若查詢語句句法錯誤則繼續(xù)執(zhí)行以下子步驟: 步驟9.1:根據(jù)自然語言文本之間的相似度算法,計算自然語言查詢語句與圖數(shù)據(jù)庫中結(jié)構(gòu)化信息本體之間的相似度,返回圖數(shù)據(jù)庫中與自然語言查詢語句相似度最高的節(jié)點作為關聯(lián)的節(jié)點; 步驟9.2:通過展開步驟9.1中返回的關聯(lián)節(jié)點的鄰接節(jié)點的方式或通過計算步驟9.1中返回的關聯(lián)節(jié)點子圖相似度的方式,在圖數(shù)據(jù)庫中找到關聯(lián)節(jié)點的連通子圖作為結(jié)果; 步驟9.3:將步驟9.2所得到的連通子圖可視化; 步驟9.4:呈現(xiàn)子步驟9.3中的連通子圖的各個節(jié)點所關聯(lián)到的非結(jié)構(gòu)化文本信息。
【文檔編號】G06F17/30GK103927360SQ201410156422
【公開日】2014年7月16日 申請日期:2014年4月18日 優(yōu)先權(quán)日:2014年4月18日
【發(fā)明者】謝冰, 朱子驍, 華哲邦 申請人:北京大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
岱山县| 若尔盖县| 武功县| 汾西县| 顺昌县| 深圳市| 乐安县| 社旗县| 澄江县| 南川市| 雅江县| 洪湖市| 鲁山县| 双辽市| 博湖县| 阿图什市| 丁青县| 大邑县| 新泰市| 宜兴市| 荥经县| 廊坊市| 丁青县| 聂荣县| 青田县| 利辛县| 浠水县| 崇义县| 从化市| 肥西县| 南昌市| 万全县| 舒兰市| 凤台县| 芦溪县| 金乡县| 寿阳县| 保山市| 长乐市| 塔河县| 独山县|