結(jié)合語義網(wǎng)與地理信息特征的信息集成方法
【專利摘要】本發(fā)明公開了計(jì)算機(jī)應(yīng)用【技術(shù)領(lǐng)域】中的一種結(jié)合語義網(wǎng)與地理信息特征的信息集成方法。包括:構(gòu)建Service模型,使Web?APIs的提供者構(gòu)建Web?API,使用者調(diào)用相應(yīng)的服務(wù)來獲取地理信息;建立所述地理信息和給定本體之間的映射,并為所述地理信息添加語義信息;對(duì)于所述地理信息進(jìn)行映射,消除各種資源數(shù)據(jù)間的異質(zhì)性,并添加語義信息;對(duì)從各種信息資源獲得的地理信息進(jìn)行關(guān)聯(lián)合并;集成多種數(shù)據(jù)源的地理信息。本發(fā)明消除了不同資源之間的異質(zhì)性,去除了冗余信息量,增加了互補(bǔ)信息,實(shí)現(xiàn)了信息資源間的翻譯功能,節(jié)省了不同語言的信息資源之間相互翻譯的開銷。
【專利說明】結(jié)合語義網(wǎng)與地理信息特征的信息集成方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)應(yīng)用【技術(shù)領(lǐng)域】,尤其涉及一種結(jié)合語義網(wǎng)與地理信息特征的信息集成方法。
【背景技術(shù)】
[0002]隨著地理信息資源的快速增長(zhǎng),信息共享成為了地理信息發(fā)展中的關(guān)鍵問題,它改進(jìn)了信息的質(zhì)量,降低了開銷。然而,大量的信息來自不同的信息源與GIS應(yīng)用,數(shù)據(jù)的格式不兼容,數(shù)據(jù)的內(nèi)容有重復(fù),這些問題給地理信息共享帶來了很多困難,也是實(shí)現(xiàn)地理信息共享的瓶頸。
[0003]來自不同信息源的地理信息有著不同的描述信息,描述粒度也各不相同。為了解決地理信息的異質(zhì)性問題,給用戶提供一個(gè)統(tǒng)一的描述方式,開放地理空間聯(lián)盟(0GC:the Open Geospatial Consortium)建立了一系列的規(guī)范與標(biāo)準(zhǔn)。例如:地理信息標(biāo)記語言(GML:Geography Markup Language)、數(shù)據(jù)訪問協(xié)議 Web 映射服務(wù)(WMS:ffeb Map Service)及Web特征服務(wù)(WFS:ffeb Feature Service),這些規(guī)范和標(biāo)準(zhǔn)是當(dāng)前地理信息處理普遍使用的規(guī)范和標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)可以使用戶訪問到來自不同資源提供的不同形式的異質(zhì)信息。但是,由于這些標(biāo)準(zhǔn)與規(guī)范缺乏語義信息,使得所能使用的范圍受到限制。問題的根源在于這些結(jié)構(gòu)化數(shù)據(jù),如GML或者XML不能表達(dá)數(shù)據(jù)信息的語義。也就是說,規(guī)范和標(biāo)準(zhǔn)雖然解決了語法異質(zhì)方面的問題,但是語義異質(zhì)方面的問題仍然是研究者們所需要面對(duì)的復(fù)雜問題。
[0004]很多研究將語義Web的概念應(yīng)用的地理資源共享問題中。語義Web引入本體語言,如 RDF (Resource Description Framework,資源描述框架)和 OWL (Ontology Web Language,網(wǎng)絡(luò)語言的本體),進(jìn)行語義標(biāo)注。地理信息的語義標(biāo)注指的是對(duì)地理數(shù)據(jù)或過程添加語義描述。通過這種對(duì)數(shù)據(jù)的語義解釋,RDF和OWL使得應(yīng)用程序可以理解不同信息資源中數(shù)據(jù)的結(jié)構(gòu)與含義。此外,也可以通過本體進(jìn)行推理。但是,推理過程中卻包含了大量的比較操作,這些操作費(fèi)時(shí)費(fèi)力。
[0005]現(xiàn)有的地理信息共享方面的研究均只考慮語義網(wǎng)的相關(guān)技術(shù),沒有考慮到地理信息本身的特征,例如地理信息的空間關(guān)系,這些地理特征對(duì)于地理信息共享非常重要,并且其功能是語義網(wǎng)所不能實(shí)現(xiàn)的。此外,地理特征在地理信息的融合過程中,可以實(shí)現(xiàn)不同語言間的翻譯功能,節(jié)省了對(duì)不同語言信息源間進(jìn)行信息翻譯的預(yù)處理過程。
[0006]綜上所述,可以看到關(guān)于地理信息共享的研究至今缺乏一種融合地理信息特征的研究方案。地理信息共享具體包含了信息的獲取、模型的構(gòu)建、不同信息源間相同實(shí)例的連接以及信息的融合四個(gè)部分。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于,提供一種結(jié)合語義網(wǎng)與地理信息特征的信息集成方法,用于實(shí)現(xiàn)用戶從各種類型的信息資源中快速抽取地理信息并對(duì)地理信息進(jìn)行關(guān)聯(lián)合并和消除異質(zhì)性,實(shí)現(xiàn)地理信息的共享。
[0008]為了實(shí)現(xiàn)上述目的,本發(fā)明提出的技術(shù)方案是,一種結(jié)合語義網(wǎng)與地理信息特征的信息集成方法,其特征是所述方法包括:
[0009]步驟1:構(gòu)建Service模型,使Web APIs的提供者構(gòu)建Web API,使用者調(diào)用相應(yīng)的服務(wù)來獲取地理信息;
[0010]步驟2:建立所述地理信息和給定本體之間的映射,并為所述地理信息添加語義
信息;
[0011]對(duì)于所述地理信息進(jìn)行映射,消除各種資源數(shù)據(jù)間的異質(zhì)性,并添加語義信息;
[0012]步驟3:對(duì)從各種信息資源獲得的地理信息進(jìn)行關(guān)聯(lián)合并;
[0013]步驟4:集成多種數(shù)據(jù)源的地理信息。 [0014]所述步驟I包括如下子步驟:
[0015]子步驟Al:將包含不同Web API的地理信息封裝成不同服務(wù),并將所述服務(wù)上傳到服務(wù)器中;
[0016]子步驟A2:第一用戶上傳第一服務(wù)請(qǐng)求實(shí)例,第一服務(wù)請(qǐng)求實(shí)例中包含服務(wù)的名稱及待調(diào)用服務(wù)的輸入?yún)?shù);
[0017]子步驟A3:服務(wù)器啟動(dòng)第一服務(wù)請(qǐng)求實(shí)例中待調(diào)用的服務(wù),給出所述服務(wù)的輸出結(jié)果;
[0018]子步驟A4:服務(wù)器依據(jù)給定的本體,為所述服務(wù)構(gòu)建語義模型,即根據(jù)本體建立服務(wù)輸入?yún)?shù)與輸出結(jié)果之間對(duì)應(yīng)的語義關(guān)系;
[0019]子步驟A5:服務(wù)器根據(jù)建立的語義模型產(chǎn)生相應(yīng)的服務(wù)描述,并將語義模型與服務(wù)描述一同存儲(chǔ)在API倉庫中;
[0020]子步驟A6:第二用戶上傳第二服務(wù)請(qǐng)求實(shí)例,第二服務(wù)請(qǐng)求實(shí)例中包含服務(wù)的輸入?yún)?shù);
[0021]子步驟A7:服務(wù)器解析上傳的第二服務(wù)請(qǐng)求實(shí)例,抽取第二服務(wù)請(qǐng)求實(shí)例中服務(wù)的輸入?yún)?shù);
[0022]子步驟AS:服務(wù)器根據(jù)第二服務(wù)請(qǐng)求實(shí)例中服務(wù)的輸入?yún)?shù),尋找服務(wù)器中已經(jīng)構(gòu)建的語義模型;
[0023]子步驟A9:服務(wù)器調(diào)用所述語義模型相應(yīng)的服務(wù),為第二用戶提供所述服務(wù)的輸出結(jié)果;所述輸出結(jié)果為地理信息。
[0024]所述步驟2包括如下子步驟:
[0025]子步驟B1:根據(jù)本體對(duì)地理信息進(jìn)行映射,即將地理信息與本體中相應(yīng)的數(shù)據(jù)屬性進(jìn)行關(guān)聯(lián);
[0026]子步驟B2:服務(wù)器通過條件隨機(jī)域模型學(xué)習(xí)子步驟BI生成的映射關(guān)系;
[0027]子步驟B3:服務(wù)器定義地理信息與本體間所有可能的映射關(guān)系,并通過對(duì)象屬性描述本體的語義類型之間的相互關(guān)系;
[0028]子步驟B4:服務(wù)器為生成的語義模型創(chuàng)建資源描述框架RDF,即對(duì)步驟I產(chǎn)生的地理信息賦予語義信息。
[0029]所述步驟3包括如下子步驟:
[0030]子步驟Cl:對(duì)于從2個(gè)不同信息資源獲得的地理信息r1和r2,判斷地理信息r1和地理信息r2是否存在地理上的包含關(guān)系,如果地理信息F1和地理信息r2存在地理上的包含關(guān)系,則執(zhí)行子步驟C7 ;否則,執(zhí)行子步驟C2 ;
[0031]子步驟C2:判斷地理信息r1和地理信息r2所描述的地理范圍是否有重合的部分,如果地理信息F1和地理信息r2所描述的地理范圍有重合的部分,則執(zhí)行子步驟C3 ;否則,執(zhí)行子步驟C4 ;
[0032]子步驟C3:計(jì)算地理信息r1和地理信息r2的相似度,如果地理信息F1和地理信息r2的相似度大于第一設(shè)定閾值,則執(zhí)行子步驟C7 ;否則,執(zhí)行子步驟C4 ;
[0033]子步驟C4:計(jì)算地理信息r1和地理信息r2之間的距離,如果地理信息和地理信息1"2之間的距離小于第二設(shè)定閾值,則執(zhí)行子步驟C5 ;否則,執(zhí)行子步驟C6 ;
[0034]子步驟C5:計(jì)算地理信息r1和地理信息r2的相似度,如果地理信息F1和地理信息r2的相似度大于第三設(shè)定閾值,則執(zhí)行子步驟C7 ;否則,執(zhí)行子步驟C6 ;
[0035]子步驟C6:地理信息A和地理信息r2不相關(guān),跳至子步驟C9 ;
[0036]子步驟C7:將地理信息r1和地理信息r2之間的相似度值設(shè)為I,并將地理信息A和地理信息r2添加到關(guān)聯(lián)列表中;
[0037]子步驟CS:提取關(guān)聯(lián)列表中兩個(gè)相關(guān)聯(lián)的地理信息,連接所述相關(guān)聯(lián)的地理信息,生成資源描述框架RDF ;
[0038]子步驟C9 :結(jié)束。
[0039]所述計(jì)算地理信息r1和地理信息r2的相似度采用公式:.,distance{i\,i\)
【權(quán)利要求】
1.一種結(jié)合語義網(wǎng)與地理信息特征的信息集成方法,其特征是所述方法包括: 步驟1:構(gòu)建Service模型,使Web APIs的提供者構(gòu)建Web API,使用者調(diào)用相應(yīng)的服務(wù)來獲取地理信息; 步驟2:建立所述地理信息和給定本體之間的映射,并為所述地理信息添加語義信息; 步驟3:對(duì)從各種信息資源獲得的地理信息進(jìn)行關(guān)聯(lián)合并; 步驟4:集成多種數(shù)據(jù)源的地理信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征是所述步驟I包括如下子步驟: 子步驟Al:將包含不同Web API的地理信息封裝成不同服務(wù),并將所述服務(wù)上傳到服務(wù)器中; 子步驟A2:第一用戶上傳第一服務(wù)請(qǐng)求實(shí)例,第一服務(wù)請(qǐng)求實(shí)例中包含服務(wù)的名稱及待調(diào)用服務(wù)的輸入?yún)?shù); 子步驟A3:服務(wù)器啟動(dòng)第一服務(wù)請(qǐng)求實(shí)例中待調(diào)用的服務(wù),給出所述服務(wù)的輸出結(jié) 果; 子步驟A4:服務(wù)器依據(jù)給定的本體,為所述服務(wù)構(gòu)建語義模型,即根據(jù)本體建立服務(wù)輸入?yún)?shù)與輸出結(jié)果之間對(duì)應(yīng)的語義關(guān)系; 子步驟A5:服務(wù)器根據(jù)建立的語義模型產(chǎn)生相應(yīng)的服務(wù)描述,并將語義模型與服務(wù)描述一同存儲(chǔ)在API倉庫中; 子步驟A6:第二用戶上傳第二服務(wù)請(qǐng)求實(shí)例,第二服務(wù)請(qǐng)求實(shí)例中包含服務(wù)的輸入?yún)?shù); 子步驟A7:服務(wù)器解析上傳的第二服務(wù)請(qǐng)求實(shí)例,抽取第二服務(wù)請(qǐng)求實(shí)例中服務(wù)的輸入?yún)?shù); 子步驟AS:服務(wù)器根據(jù)第二服務(wù)請(qǐng)求實(shí)例中服務(wù)的輸入?yún)?shù),尋找服務(wù)器中已經(jīng)構(gòu)建的語義模型; 子步驟A9:服務(wù)器調(diào)用所述語義模型相應(yīng)的服務(wù),為第二用戶提供所述服務(wù)的輸出結(jié)果;所述輸出結(jié)果為地理信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征是所述步驟2包括如下子步驟: 子步驟B1:根據(jù)本體對(duì)地理信息進(jìn)行映射,即將地理信息與本體中相應(yīng)的數(shù)據(jù)屬性進(jìn)行關(guān)聯(lián); 子步驟B2:服務(wù)器通過條件隨機(jī)域模型學(xué)習(xí)子步驟BI生成的映射關(guān)系; 子步驟B3:服務(wù)器定義地理信息與本體間所有可能的映射關(guān)系,并通過對(duì)象屬性描述本體的語義類型之間的相互關(guān)系; 子步驟B4:服務(wù)器為生成的語義模型創(chuàng)建資源描述框架RDF,即對(duì)步驟I產(chǎn)生的地理信息賦予語義信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征是所述步驟3包括如下子步驟: 子步驟Cl:對(duì)于從2個(gè)不同信息資源獲得的地理信息r1和r2,判斷地理信息r1和地理信息r2是否存在地理上的包含關(guān)系,如果地理信息η和地理信息r2存在地理上的包含關(guān)系,則執(zhí)行子步驟C7 ;否則,執(zhí)行子步驟C2 ; 子步驟C2:判斷地理信息r1和地理信息r2所描述的地理范圍是否有重合的部分,如果地理信息A和地理信息r2所描述的地理范圍有重合的部分,則執(zhí)行子步驟C3 ;否則,執(zhí)行子步驟C4 ; 子步驟C3:計(jì)算地理信息&和地理信息r2的相似度,如果地理信息η和地理信息r2的相似度大于第一設(shè)定閾值,則執(zhí)行子步驟C7 ;否則,執(zhí)行子步驟C4 ; 子步驟C4:計(jì)算地理信息r1和地理信息r2之間的距離,如果地理信息r1和地理信息r2之間的距離小于第二設(shè)定閾值,則執(zhí)行子步驟C5 ;否則,執(zhí)行子步驟C6 ; 子步驟C5:計(jì)算地理信息&和地理信息r2的相似度,如果地理信息η和地理信息r2的相似度大于第三設(shè)定閾值,則執(zhí)行子步驟C7 ;否則,執(zhí)行子步驟C6 ; 子步驟C6:地理信息r1和地理信息r2不相關(guān),跳至子步驟C9 ; 子步驟C7:將地理信息r1和地理信息r2之間的相似度值設(shè)為1,并將地理信息F1和地理信息r2添加到關(guān)聯(lián)列表中; 子步驟CS:提取關(guān)聯(lián)列表中兩個(gè)相關(guān)聯(lián)的地理信息,連接所述相關(guān)聯(lián)的地理信息,生成資源描述框架RDF ; 子步驟C9:結(jié)束。
5.根據(jù)權(quán)利要求4所述的方法,其特征是所述計(jì)算地理信息F1和地理信息r2的相似度采用公式:
6.根據(jù)權(quán)利要求4或5所述的方法,其特征是所述步驟4包括如下子步驟: 子步驟Dl:提取資源描述框架RDF中相互連接的地理信息r1和地理信息r2 ; 子步驟D2:提取為地理信息R1所屬的地理信息資源SI生成的資源描述框架RDF中的所有屬性,以及為地理信息r2所屬的地理信息資源S2生成的資源描述框架RDF中的所有屬性; 子步驟D3:合并兩個(gè)屬性。
【文檔編號(hào)】H04L29/06GK104021177SQ201410244507
【公開日】2014年9月3日 申請(qǐng)日期:2014年6月4日 優(yōu)先權(quán)日:2014年6月4日
【發(fā)明者】張瑩, 滕婧, 何慧, 王竹曉 申請(qǐng)人:華北電力大學(xué)