專利名稱:一種soa多消息機制的異構數(shù)據(jù)集成系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及計算機領域,尤其涉及一種SOA (Service Oriented Architecture) 多消息機制的異構數(shù)據(jù)集成系統(tǒng)。
背景技術:
隨著計算機的飛速發(fā)展,基于各種平臺的分布式數(shù)據(jù)庫應用程序,已經(jīng)廣泛應用于各種行業(yè),但數(shù)據(jù)庫系統(tǒng)的異構特性,造成系統(tǒng)數(shù)據(jù)大量冗余,從而無法保證數(shù)據(jù)的一致性,使信息的利用率和效率大大降低。目前,關于數(shù)據(jù)集成的體系結構主要有三種,即模式集成、數(shù)據(jù)復制和面向服務的體系結構。前兩種是傳統(tǒng)的集成方法,它在一定程度上解決了數(shù)據(jù)集成的語義和模型等問題,但靈活性和數(shù)據(jù)的自治性比較差。與本發(fā)明最接近的是面向服 務體系結構的數(shù)據(jù)集成方法,該方法是以業(yè)務為核心,通過業(yè)務驅(qū)動服務、服務驅(qū)動技術的原則來設計集成架構。此方法的所有的功能都以服務的形式進行描述,描述后的服務在注冊中心注冊,并對外部以標準的接口形式提供給用戶。該方法可在不同平臺之間,并且以一致的方式交換和描述數(shù)據(jù),為實現(xiàn)信息共享、互操作和集成提供了新的解決方案。在中國專利(專利申請?zhí)?00810237211)中公開基于SOA 的網(wǎng)格異構數(shù)據(jù)集成方法。此方法是實現(xiàn)SOA方案的一種有效方法,它不僅能更加靈活地適應數(shù)據(jù)源動態(tài)變化,而且為數(shù)據(jù)集成中的大量數(shù)據(jù)傳輸提供了可靠的文件傳輸服務,為資源使用者提供了訪問數(shù)據(jù)庫的全局訪問接口,能夠從數(shù)據(jù)庫注冊到使用的全部過程。但是,該方法采用了單一的消息接收機制,不能處理多種客戶端發(fā)送的消息請求,因此靈活性不是很好,并且對語義異構的處理,采用人工匹配的方法,這種匹配方法需要預先定義好各種相似的詞匯,因此智能性很差,但采用傳統(tǒng)的映射算法,又會使數(shù)據(jù)的查全率(正確發(fā)現(xiàn)的概念映射和可能存在概念的映射的比值)和召回率比較低(正確發(fā)現(xiàn)的概念映射和所有已經(jīng)找到的概念映射的比值),不能充分獲得各種數(shù)據(jù)源的集成數(shù)據(jù)。
發(fā)明內(nèi)容
本發(fā)明所要解決的問題是針對目前面向服務架構的異構數(shù)據(jù)集成技術中,客戶端平臺發(fā)送消息形式的多樣化以及傳統(tǒng)的詞匯映射算法所造成的分布式數(shù)據(jù)源語義集成度不夠高,設計一種SOA多消息機制的異構數(shù)據(jù)集成系統(tǒng),在應用服務層構建四個模塊,實現(xiàn)多種平臺消息的查詢訪問和眾多數(shù)據(jù)模型的有效集成,同時通過一個改進的詞匯相似度算法,很好的解決了語義異構等問題。最后通過ESB(Enterprise Service Bus)對集成服務進行動態(tài)管理,為用戶訪問服務提供了有力的支持。本發(fā)明解決上述問題的技術方案是提出一種SOA多消息機制的異構數(shù)據(jù)集成系統(tǒng)。該系統(tǒng)包括
由多種客戶端異構平臺組成的查詢接口,由該查詢接口向消息引擎服務模塊發(fā)送請求,且每個平臺可發(fā)送自己單一的消息,并對數(shù)據(jù)信息進行封裝。消息一旦發(fā)送,交給消息引擎服務模塊處理。查詢接口可由JMS消息的客戶端、SOAP消息的客戶端、EJB消息的客戶端組成,且這些查詢接口在位置上成分布式。消息引擎服務模塊,包括4個子模塊抽象消息工廠模塊、具體消息工廠模塊、抽象消息對象、具體消息對象,它是一種解決跨客戶端平臺發(fā)送消息多樣性的一種多消息處理機制。該模塊接收查詢接口發(fā)送的消息,根據(jù)客戶端平臺消息請求的多樣性,抽象消息對象由一系列不同平臺的消息對象組成,這些消息對象包含了處理消息的通用抽象方法,負責把接收到的消息轉(zhuǎn)換成標準的XML消息。具體消息對象繼承了抽象消息對象中的方法, 抽象消息工廠模塊包含了創(chuàng)建所有消息對象的抽象方法,具體消息工廠模塊繼承了抽象消息工廠模塊的所有方法,一旦接收到某個消息,根據(jù)此消息的格式,判斷消息的類型,并由具體消息工廠模塊創(chuàng)建與之對應的消息對象,創(chuàng)建后的消息對象對接收的消息進行分解和重組,重組的消息采用XML語言進行描述,并把這種XML格式的消息發(fā)送給語義映射服務模塊處理。語義映射服務模塊根據(jù)重組后的消息并調(diào)用詞匯度相似算法,建立映射文件。其中,該詞匯度相似算法利用本體信息密度因子和義原上下位關系、本體概念相關性和基于關系義原的混合策略,計算本體中的詞匯相似度,根據(jù)義原上下位關系、本體概念相關性和基于關系義原的權值獲得概念相似對,并根據(jù)OWL (網(wǎng)絡本體語言)語言規(guī)則建立起映射文件,對相似的詞匯進行定義,每一類相似的詞匯構成一個集合。因此映射文件由一系列相似詞匯的集合組成。語義映射匹配模塊,在開放源代碼JSWF (jena Semantic Web Frmework)框架的基礎上,讀取映射文件中相似詞匯的集合,并獲得與請求查詢詞匯相似的所有詞匯,即全局查詢轉(zhuǎn)換為可執(zhí)行的子查詢的過程,再把子查詢提交給數(shù)據(jù)訪問服務模塊處理。數(shù)據(jù)訪問服務和數(shù)據(jù)控制服務模塊,接收經(jīng)語義映射模塊處理后所提交的子查詢語句,可采用傳統(tǒng)的處理方式,用Web服務分別對每個數(shù)據(jù)源的訪問進行封裝,形成一個包裝器。子查詢語句經(jīng)過包裝器里各種不同數(shù)據(jù)庫調(diào)用訪問處理,形成一系列XML結果集, XML結果集由數(shù)據(jù)控制服務處理優(yōu)化,獲得數(shù)據(jù)集成信息,最后通過Web服務發(fā)布以上數(shù)據(jù)集成信息,供用戶調(diào)用和ESB服務總線管理。本發(fā)明還提出一種SOA多消息機制的異構數(shù)據(jù)集成方法。由多種客戶端異構平臺組成查詢接口向消息引擎服務模塊發(fā)送請求;消息引擎服務模塊接收查詢接口發(fā)送的消息,根據(jù)客戶端平臺消息請求的多樣性,其中,抽象消息對象負責把接收到的消息轉(zhuǎn)換成標準的XML消息,具體消息對象繼承了抽象消息對象中的方法,具體消息工廠模塊根據(jù)接收到消息的格式判斷消息的類型,并由具體消息工廠模塊創(chuàng)建與之對應的消息對象,創(chuàng)建后的消息對象對接收的消息進行分解和重組,重組的消息采用XML語言進行描述,并把這種 XML格式的消息發(fā)送給語義映射服務模塊處理;語義映射服務模塊根據(jù)重組后的消息并調(diào)用詞匯度相似算法,并根據(jù)OWL (網(wǎng)絡本體語言)語言規(guī)則建立映射文件;語義映射匹配模塊讀取映射文件中相似詞匯的集合,并獲得與請求查詢詞匯相似的所有詞匯,將全局查詢轉(zhuǎn)換為可執(zhí)行的子查詢,再把子查詢提交給數(shù)據(jù)訪問服務模塊處理;數(shù)據(jù)訪問服務和數(shù)據(jù)控制服務模塊,接收經(jīng)語義映射模塊處理后所提交的子查詢語句,分別對每個數(shù)據(jù)源的訪問進行封裝,形成一個包裝器。該系統(tǒng)通過改進的相似度算法,解決了分布式數(shù)據(jù)庫存在的多種語義問題,并提高了詞匯的相似精度,消息引擎的設計,使服務器能快速處理各種異構平臺客戶端所發(fā)送的請求,解決了多個平臺消息之間的異構問題,它滿足了以業(yè)務驅(qū)動服務,以服務驅(qū)動技術的SOA設計原則,也降低了硬件成本。通過ESB服務總線的管理,使系統(tǒng)的安全和性能得到了大大的提高。
圖1所示一種SOA多消息機制的異構數(shù)據(jù)集成系統(tǒng)示意圖。圖2所示為語義匹配方法的流程圖。
圖3所示為異構數(shù)據(jù)集成方法流程圖。圖4所示為數(shù)據(jù)集成系統(tǒng)的流程示意圖。
具體實施例方式本發(fā)明提出了一種SOA多消息機制的異構數(shù)據(jù)集成系統(tǒng)。異構數(shù)據(jù)集成方法通過語義映射、消息和數(shù)據(jù)訪問等應用服務的包裝,實現(xiàn)對分布式數(shù)據(jù)源的動態(tài)集成和查詢操作。下面通過具體實例并結合附圖對實施過程進行詳細介紹。圖1所示為一種SOA多消息機制的異構數(shù)據(jù)集成系統(tǒng)示意圖,按照JBI規(guī)范,該系統(tǒng)結構由數(shù)據(jù)庫服務層、應用服務提供層、插件服務層、應用服務接口層、應用服務表示層五層組成。用戶由應用服務表示層發(fā)送查詢請求消息,服務器接收消息,并做處理。通過應用服務接口獲取服務信息,根據(jù)獲取的信息,可從應用服務提供層提供的服務實現(xiàn)動態(tài)的綁定。這些服務由應用服務接口層采用WSDL語言統(tǒng)一描述。綁定后的服務可處理查詢信息, 并從數(shù)據(jù)庫服務層獲取集成數(shù)據(jù)。數(shù)據(jù)庫服務層包含了所有不同類型的數(shù)據(jù)模型,它提供數(shù)據(jù)的存儲功能。插件服務層作為體系結構的可擴充式的層次結構,系統(tǒng)所有的可擴展功能都集中在這個層次,作為結構的補充和增強。第三方的服務和應用也可由該層提供。其中應用服務提供層是本系統(tǒng)的核心,它由消息引擎服務、語義映射服務、數(shù)據(jù)訪問服務和數(shù)據(jù)控制服務等四個模塊組成。消息引擎服務模塊負責接收來自不同平臺的消息請求,并把消息轉(zhuǎn)化成標準的消息格式。消息的類型是多樣化的,比如客戶端查詢數(shù)據(jù),可發(fā)送JMS消息,也可發(fā)送SOAP 消息等。此模塊具有消息監(jiān)聽對象,并由監(jiān)聽對象創(chuàng)建消息工廠,由消息工廠生成消息對象。消息對象處理消息格式,并轉(zhuǎn)化成標準消息。語義映射服務模塊負責處理數(shù)據(jù)集成中的語義異構問題。它接收來至消息引擎服務所發(fā)送的標準查詢消息,調(diào)用相似度算法并結合語義匹配方法把查詢分解成可執(zhí)行的子查詢語句。針對每個數(shù)據(jù)源建立局部視圖,然后根據(jù)查詢請求建立全局視圖,并根據(jù)OWL 語言的規(guī)則,建立全局視圖和局部視圖之間關系。全局視圖包含了請求查詢的所有詞匯,局部視圖由一系列詞匯組成,這些詞匯組成不同數(shù)據(jù)模型的數(shù)據(jù)庫存儲信息。當查詢請求被語義映射引擎模塊接收后,調(diào)用詞匯相似度算法和語義匹配方法,把全局的查詢請求轉(zhuǎn)換成每個局部數(shù)據(jù)源的子查詢。分解后的子查詢,為可執(zhí)行的SQL語句。如圖2所示舉例說明語義映射過程。此映射過程在詞匯相似度算法的基礎上,生成本體映射文件。通過讀取本體文件來獲得可執(zhí)行的分查詢語句。具體流程如下步驟
(1)加載OWL映射文件并遍歷類節(jié)點。首先加載owl (網(wǎng)絡本體語言)映射文件,然后遍歷所有的類節(jié)點,這些類節(jié)點也就是全局視圖中的概念節(jié)點,屬于頂層節(jié)點。首先輸入查詢字段,類節(jié)點匹配,如果在遍歷的節(jié)點中沒有找到查詢字段,使count自加。其中,Count 為遍歷的類層次數(shù),直到遍歷完所有層次(即count的數(shù)值等于所有類節(jié)點層次數(shù)),便跳出循環(huán);
(2)獲得類節(jié)點的所有屬性,與關鍵字信息匹配。首先關鍵字與類節(jié)點匹配,如果與類節(jié)點匹配不成功,則獲得父節(jié)點的所有屬性,包括子節(jié)點的屬性,獲得的屬性與關鍵字進行匹配。如果匹配成功跳轉(zhuǎn)到步驟(4),如果失敗跳轉(zhuǎn)到步驟(3);
(3)遍歷類節(jié)點的所有子類節(jié)點,子類節(jié)點屬性與關鍵字信息進行匹配。如關鍵字與子類節(jié)點屬性也不匹配,重新遍歷父節(jié)點的子節(jié)點,直到訪問了所有概念節(jié)點,如找到與之匹配的節(jié)點,則跳轉(zhuǎn)到步驟(4),否則繼續(xù)執(zhí)行步驟(3);
(4)提取關鍵字的等價類,獲得等價屬性,分解全局概念,獲得分查詢進行存儲。利用等價類和等價屬性的獲得,依次判斷是否含有如下三種屬性mySql,sqlserver, xml, 獲取相應的分查詢,分類存儲。如果此等價類的屬性等于mysql,首先建立哈希表,用 put( "mysql",等價類對象)方法,把等價類對象存儲起來,如果查找的關鍵字和類節(jié)點的屬性相等,可用數(shù)組存儲字段的等價屬性,這樣通過哈希表的get方法得到每個數(shù)據(jù)源的子查詢。以下舉例說明數(shù)據(jù)訪問和緩存過程。包括如下步驟
1.通過哈希表get()獲得查詢對象(概念)及參數(shù),創(chuàng)建Rowset對象。并根據(jù)參數(shù)判斷,初始化Rowset對象,加載不同模型的數(shù)據(jù)庫;
2.分別在Mysql、Sqlserver,XML數(shù)據(jù)源中執(zhí)行查詢操作,遍歷所有類節(jié)點,獲得字段所有屬性,及其等價屬性,查詢結果保存在Rowset對象中;
3.采用統(tǒng)一的XML數(shù)據(jù)交換格式緩存Rowset對象中的數(shù)據(jù);
4.針對不同數(shù)據(jù)模型生成不同的XML格式的結果集;
5.加載XML文件,遍歷XML文件中所有元素,采用哈希表加載每個對象,如果存在相同記錄則加載下一條記錄,直到讀取完所有XML文件;
6.采用JDOM重新建立XML文件;
數(shù)據(jù)訪問服務數(shù)據(jù)訪問服務模塊接收來自語義映射服務所生成的子查詢語句,并加載不同的數(shù)據(jù)模型,執(zhí)行查詢功能。該模塊封裝了所有數(shù)據(jù)模型的查詢方式,負責訪問數(shù)據(jù)庫,一旦子查詢請求到來,查詢模塊根據(jù)參數(shù),調(diào)用對應請求的查詢方式進行查詢,然后返回結果集??梢訶ML文件格式存儲每個子查詢的數(shù)據(jù)集。數(shù)據(jù)控制服務數(shù)據(jù)控制服務模塊負責對查詢后的數(shù)據(jù)進行合并去冗處理。對合并后的數(shù)據(jù),采用XML格式進行存儲。通過XML緩存數(shù)據(jù),數(shù)據(jù)可以再次過濾,提取用戶感興趣的數(shù)據(jù)。不同平臺的客戶端,發(fā)送的消息具有異構性。消息引擎服務模塊接收此消息,并由消息工廠生成對應平臺的消息對象。消息對象處理消息,并把此消息轉(zhuǎn)換成標準消息,交由語義映射服務進行處理,在語義映射服務,這種標準消息是基于全局視圖的,再利用如OWL 語言對全局視圖和局視圖部行描述,并調(diào)用詞匯相似度方法獲得相似詞匯,并建立映射文件。讀取映射文件,把全局查詢分解成可執(zhí)行的子查詢,數(shù)據(jù)訪問服務根據(jù)子查詢和對應的參數(shù)信息,初始化RowSet (數(shù)據(jù)存儲對象)對象,并加載數(shù)據(jù)模型,執(zhí)行查詢。RowSet對象的數(shù)量根據(jù)數(shù)據(jù)模型的多少確定,且存儲查詢的結果。數(shù)據(jù)控制服務再從RowSet對象中獲取數(shù)據(jù),并進行冗余處理,最后生成統(tǒng)一的XML格式的集成數(shù)據(jù)。詳細的處理過程,
上述處理過程參考圖3所示。如圖3所示為異構數(shù)據(jù)集成工作流程圖。它包含了查詢請求在應用服務層的處理過程。通過發(fā)送查詢請求,分別由應用服務層的消息引擎服務、語義映射服務、數(shù)據(jù)訪問服務和數(shù)據(jù)控制服務等4個功能模塊處理。具體處理過程如下
(1)通過客戶端的查詢接口發(fā)送查詢請求,并交由消息引擎服務模塊處理此消息。消息引擎服務模塊包含4個子模塊抽象消息工廠模塊、具體消息工廠模塊、抽象消息對象模塊、具體消息對象模塊。抽象消息對象包含了所有客戶端消息的抽象處理,是處理客戶端消息的一個接口。具體消息工廠模塊繼承抽象消息對象所有方法,并且每個客戶端的消息對應一個特有的具體消息對象,并可同時對消息進行分解和重組處理。而抽象消息工廠模塊包含對所有消息的抽象和創(chuàng)建,通過一個接口提供消息對象。抽象消息工廠包含對創(chuàng)建消息對象的抽象,具體的消息對象和具體的消息工廠對象是抽象消息對象和抽象消息工廠的實例,它們繼承抽象層的方法和屬性。而具體 消息工廠繼承了抽象消息工廠的所有方法,每個具體消息工廠只能創(chuàng)建一個唯一的消息對象。每種消息對象包含消息頭和消息體兩個屬性。消息頭包含了每種消息所特有的信息標識,消息體對數(shù)據(jù)進行了封裝。采取觸發(fā)的方式監(jiān)聽消息對象,一旦有數(shù)據(jù)發(fā)送過來,對消息頭進行獲取,并提出消息標識。消息監(jiān)聽對象設有一個消息類型序列號,結合本系統(tǒng)實例,如序列號可設置3個值,每個值分別對應JMS消息標識、SOAP消息標識、EJB消息標識。如果消息類型增加,可根據(jù)增加的消息類型,再添加消息標識值。由消息監(jiān)聽對象創(chuàng)建消息工廠對象,消息工廠根據(jù)消息序列號的值,創(chuàng)建不同的消息對象,并返回一個抽象消息對象。抽象消息對象對消息的處理包括消息的分解和消息的重組。消息的分解包括3個步驟(i)創(chuàng)建消息體對象, 消息體對象包含獲取消息體文本數(shù)據(jù)的方法。(ii)獲得被封裝的數(shù)據(jù)。(iii)創(chuàng)建一個緩存數(shù)組用于緩存所獲得的數(shù)據(jù)。數(shù)據(jù)一旦緩存,對消息進行重組,把數(shù)據(jù)以XML格式重新封裝,形成標準化消息。此格式由兩部分組成格式的聲明和元素信息。格式的聲明只包含 XML的版本信息,元素信息是文檔的具體內(nèi)容。此標準消息可全部采用JDOM來處理,并獲得具體查詢信息,再把查詢信息發(fā)送給語義映射服務模塊處理。抽象對象的設計,有利于消息機制的擴充,使系統(tǒng)更具有靈活性,解決了客戶端發(fā)送消息多樣性的問題。(2)將消息引擎服務模塊處理的請求,交給語義映射服務模塊處理。語義映射模塊采用改進的詞匯相似度算法,把與請求查詢相似的詞匯提取出來,并形成映射本體文件。本發(fā)明在知網(wǎng)的基礎上,利用義原(概念的基本單元)上下位關系,構成義原層次結構樹,并集合本體中的概念屬性作為相似度計算的密度影響因子。以下具體舉例說明計算詞匯相似度的幾種策略。基于本體元素密度因子和義原上下位關系
根據(jù)所有義原的上下位關系,假設兩個義原在義原層次體系中的距離為d,可以得出兩個義原之間的相似度公式(1)
Sim1(P^P2) =(1)
ρ+ a
其中P是一個可調(diào)常數(shù),Z1和/表示兩個不同詞匯4和。的義原(可根據(jù)系統(tǒng)設定),J表亍η和A在義原層次體系中的距離。路徑長度相同的兩個節(jié)點,如果位于義原的層次的越低,其詞匯語義相似度越大,另外在本體中,Cruber定義了一個本體五元組表示方法£>=(C,^i ,i ^)。其中c表示抽取出來的概念集合'表示概念的實例。表示定義在概念集合上的關系集合,F(xiàn)表示在概念集合上的函數(shù)集合,^表示公理集合。所以可得本
體中關于屬性的影響因子公式(2) M1 = . 1 2、(2)
其中詞匯。和9表示本體中的兩個概念,R(C1)和i (c2)表示概念q和^的屬性集合,
其中屬性包含對象屬性和數(shù)據(jù)屬性兩種。I 2(9)113( ) I表示&和9的具有相同屬性的個
數(shù),Iι表示4和4的屬性并集,且含有元素的個數(shù)。在本體中,每個概念具有若
干的實體,相同實體的概念具有相似性,因此可把概念實體的統(tǒng)計數(shù),作為義原層次樹的影響因子。假設概念。和4含有實體集/( )和/ ),可以得出本體中關于概念實體的影響因子公式(3)
權利要求
1.一種SOA多消息機制的異構數(shù)據(jù)集成系統(tǒng),其特征在于該系統(tǒng)包括由多種客戶端異構平臺組成的查詢接口,向消息弓I擎服務模塊各自發(fā)送客戶端自己的消息請求;消息弓I 擎服務模塊根據(jù)客戶端消息請求的格式,判斷消息類型,并創(chuàng)建與之對應的消息對象,根據(jù)消息對象對接收的消息進行分解和重組,對重組消息采用XML語言描述,并將其發(fā)送給語義映射服務模塊處理;語義映射服務模塊根據(jù)重組消息并調(diào)用詞匯度相似算法,建立映射文件;語義映射匹配模塊讀取映射文件中相似詞匯的集合,將全局查詢轉(zhuǎn)換為可執(zhí)行的子查詢,再把子查詢提交給數(shù)據(jù)訪問服務模塊處理;數(shù)據(jù)訪問服務模塊接收子查詢語句,形成一個包裝器,經(jīng)過包裝器對各種數(shù)據(jù)庫訪問處理,形成一系列XML結果集,再由數(shù)據(jù)控制服務處理優(yōu)化,獲得數(shù)據(jù)集成信息。
2.根據(jù)權利要求1所述的異構數(shù)據(jù)集成系統(tǒng),其特征在于詞匯度相似算法利用本體元素密度因子和義原上下位關系、本體概念相關性和基于關系義原的混合策略,計算詞匯相似度,根據(jù)義原上下位關系、本體概念相關性和基于關系義原的權值獲得概念相似對,并建立映射文件,對相似的詞匯進行定義,每一類相似的詞匯構成一個集合。
3.根據(jù)權利要求1所述的異構數(shù)據(jù)集成系統(tǒng),其特征在于所述詞匯度相似算法采用基于本體元素密度因子和義原上下位關系,具體為,語義映射服務模塊調(diào)用公式 SM2 (i C2) = SiM1O1, χ (M1+Ai2)計算詞匯iiP Z間的相似度,其中,A和灼為q和C2的第一義原,M1為本體元素屬性因子,M2為概念實體因子。
4.根據(jù)權利要求1所述的異構數(shù)據(jù)集成系統(tǒng),其特征在于所述詞匯度相似算法采用基于本體概念相關性的策略,具體為語義映射服務模塊調(diào)用公式f 、丨£)幻)門£)((-2)| 職如=綱匯Λ之間的相似度,其中、陶分脈示含有詞匯q、A的相關性詞匯。
5.根據(jù)權利要求1所述的異構數(shù)據(jù)集成系統(tǒng),其特征在于所述詞匯度相似算法采用基于關系義原的策略,具體為語義映射服務模塊調(diào)用公式=計算詞匯q和C2之間的相似度,其中,么e W(C1),dy eW(c2),且,⑷和y(c2)分別為詞匯q和q關系義原的集合。
6.根據(jù)權利要求1所述的異構數(shù)據(jù)集成系統(tǒng),其特征在于所述詞匯度相似算法采用基于混合策略,具體為語義映射服務模塊調(diào)用公式 漏(P1,c2) = asif ^(CllC1) + βει^(cx,C1) + Jsjm4 (ClrC2),其中為基于本體元素密度因子和義原上下位關系的權值因子、存為基于本體概念相關性的權值因子、Z為基于關系義原的權值因子,且有彡+J = I , O <丨 S 應< β <1, O^sw(C11C2) <1。
7.—種SOA多消息機制的異構數(shù)據(jù)集成方法,其特征在于包括步驟由多種客戶端異構平臺組成的查詢接口,向消息弓I擎服務模塊各自發(fā)送客戶端自己的消息請求;消息引擎服務模塊根據(jù)客戶端消息請求的格式,判斷消息的類型,并創(chuàng)建與之對應的消息對象,根據(jù)消息對象對接收的消息進行分解和重組,對重組消息采用XML語言進行描述,并將其發(fā)送給語義映射服務模塊處理;語義映射服務模塊根據(jù)重組消息并調(diào)用詞匯度相似算法,建立映射文件;語義映射匹配模塊讀取映射文件中相似詞匯的集合,將全局查詢轉(zhuǎn)換為可執(zhí)行的子查詢,再把子查詢提交給數(shù)據(jù)訪問服務模塊處理;數(shù)據(jù)訪問服務模塊接收子查詢語句, 形成一個包裝器,經(jīng)過包裝器對各種數(shù)據(jù)庫訪問處理,形成一系列XML結果集,再由數(shù)據(jù)控制服務處理優(yōu)化,獲得數(shù)據(jù)集成信息。
8.根據(jù)權利要求7所述的異構數(shù)據(jù)集成方法,其特征在于詞匯度相似算法利用本體元素密度因子和義原上下位關系、本體概念相關性和基于關系義原的混合策略,計算本體中的詞匯相似度,根據(jù)義原上下位關系、本體概念相關性和基于關系義原的權值獲得概念相似對,并建立映射文件,對相似的詞匯進行定義,每一類相似的詞匯構成一個集合。
9.根據(jù)權利要求1所述的異構數(shù)據(jù)集成方法,其特征在于所述語義映射包括,加載 OffL映射文件并遍歷類節(jié)點;獲得類節(jié)點的所有屬性,與關鍵字信息匹配;遍歷類節(jié)點的所有子類節(jié)點,子類節(jié)點屬性與關鍵字信息進行匹配;提取關鍵字的等價類,獲得等價屬性, 分解全局概念,獲得分查詢進行存儲。
全文摘要
本發(fā)明請求保護一種SOA多消息機制的異構數(shù)據(jù)集成系統(tǒng)及方法,涉及到計算機體系結構。該方法能處理不同平臺的消息的請求,并能很好的解決分布式數(shù)據(jù)源中存在的語義問題。它采用SOA設計思想,保證了服務的松散耦合性,使用戶可以透明的訪問各種服務,保證了分布式數(shù)據(jù)源的自治性。本發(fā)明提出的一種SOA多消息機制的異構數(shù)據(jù)集成方法能集成海量數(shù)據(jù),并能及時響應用戶請求,滿足現(xiàn)在企業(yè)發(fā)展對信息管理系統(tǒng)的要求。
文檔編號G06F17/30GK102402507SQ20101027408
公開日2012年4月4日 申請日期2010年9月7日 優(yōu)先權日2010年9月7日
發(fā)明者劉宴兵, 郎炯 申請人:重慶郵電大學