一種電力設備疑似重復數(shù)據(jù)識別方法
【專利摘要】本發(fā)明涉及一種電力設備疑似重復數(shù)據(jù)識別方法,屬于電力工程及電力調(diào)度信息化建設領域。該方法通過詞組拆分、詞組判定、生成匹配結果、電力調(diào)度命名規(guī)則等技術或功能的組合,實現(xiàn)了電力企業(yè)疑似重復電力設備數(shù)據(jù)的抽取、識別、對應,建立統(tǒng)一的電網(wǎng)設備臺賬信息;拆分詞組,用于把電力設備名稱的長句拆分為有意義的詞組;詞組選擇,根據(jù)調(diào)度命名規(guī)則、電網(wǎng)公共模型及設備類別判斷出疑似重復的設備;生成匹配結果,根據(jù)前兩步判斷結果,程序可自動生成以廠站為單位的匹配列表;電力調(diào)度命名規(guī)則,根據(jù)電力調(diào)度規(guī)程,實現(xiàn)電力調(diào)度命名規(guī)則的結構化,支持詞組判定。
【專利說明】一種電力設備疑似重復數(shù)據(jù)識別方法
【技術領域】
[0001]本發(fā)明屬于電力工程及電力調(diào)度信息化建設領域,涉及一種關于電力設備疑似重復數(shù)據(jù)的識別方法。本方法主要是實現(xiàn)了調(diào)度控制中心在運行管理中,獲得不同的系統(tǒng)設備數(shù)據(jù)后完成重復數(shù)據(jù)的匹配,為進一步利用設備數(shù)據(jù)奠定基礎。
【背景技術】
[0002]現(xiàn)今的電力工程及電力調(diào)度信息化建設處于一個高速建設的過程中,但每個部門需求不同導致建設的系統(tǒng)中對設備臺賬的信息側重點不同,由于建設的時間、建設廠家也是不同的,所以在業(yè)務需要以橫向協(xié)同時,不同的設備數(shù)據(jù)難以在各個部門之間流轉(zhuǎn)。換而言之,就算是同一臺設備,由于系統(tǒng)最對應設備的命名不同,各個系統(tǒng)之間難以識別和對應其他系統(tǒng)發(fā)送過來的設備信息是本系統(tǒng)中哪一個設備。設備臺賬不統(tǒng)一,難以整合和利用,是如今電力企業(yè)在信息化建設過程中的一大難題。
[0003]目前,電力設備數(shù)據(jù)在電力企業(yè),尤其在電網(wǎng)公司中,典型存在于電力調(diào)度自動化系統(tǒng)、電力調(diào)度運行管理系統(tǒng)、電網(wǎng)安全生產(chǎn)管理系統(tǒng),這些系統(tǒng)中的電力設備其編碼、命名均存在差異,設備數(shù)據(jù)資源具有以下特點:
1)電力調(diào)度系統(tǒng)的電網(wǎng)模型面向電網(wǎng)網(wǎng)絡分析和計算,符合“模型互操作”的技術要求,嚴格遵循CIM模型標準,數(shù)據(jù)準確度較高,但數(shù)據(jù)模型主要為一次設備模型,僅包含一些保護設備模型,不能完整反應二次設備信息;
2)電力調(diào)度運行管理系統(tǒng)內(nèi)部的設備臺賬主要為發(fā)電資源信息,如編制發(fā)電計劃所需的耗水率曲線、震動區(qū)和水頭等信息,此外還有小水電、小火電等信息;編制檢修計劃或申請所需的檢修設備庫;
3)電網(wǎng)安全生產(chǎn)管理系統(tǒng)的設備臺賬面向電網(wǎng)資產(chǎn)管理,幾乎包含了變電站內(nèi)所有的一次設備、二次設備以及輔助設備,線路設備上還包含了桿塔、金具等信息,總體來看,設備信息較為全面,但一般不包含發(fā)電廠信息。由于該系統(tǒng)的設備臺賬面向電網(wǎng)資產(chǎn)管理,其數(shù)據(jù)建模視角與電力調(diào)度管理需要存在一定的差異,例如其設備數(shù)據(jù)分為功能位置碼和物理設備兩類,這些概念與調(diào)度需要有所差異。
[0004]由于每個系統(tǒng)的設備臺賬信息的主要內(nèi)容不同,設備編碼、命名均尋在差異,設備臺賬的不完整、質(zhì)量不高已成阻礙電網(wǎng)運行管理類系統(tǒng)提升功能的問題,一次設備和保護設備設備臺賬的完整性,設備臺賬的存量和增量的管理思路都是現(xiàn)存在的難以解決的問題。本發(fā)明是識別疑似重復數(shù)據(jù)的一套方法,主要是用于完成現(xiàn)有不同系統(tǒng)間重復設備的匹配。
【發(fā)明內(nèi)容】
[0005]本發(fā)明為了解決上述難題,提出了一種電力設備疑似重復數(shù)據(jù)識別方法。通過該方法能夠快速識別同一系統(tǒng)或不同系統(tǒng)的電力設備,既解決了同一部門或不同部門間電力設備信息不一致問題,為電力調(diào)度提供準確的基礎信息;又能為跨部門的數(shù)據(jù)共享與交互提供統(tǒng)一的電力設備基礎信息,保證了數(shù)據(jù)能夠有效集成。該發(fā)明既提高了電力調(diào)度的安全性,又減少了因電力設備信息不一致增加的電網(wǎng)運營成本。
[0006]本發(fā)明采用的技術方案如下:
一種電力設備疑似重復數(shù)據(jù)識別方法,包括電力行業(yè)詞組拆分模塊、電力行業(yè)詞組判定模塊、生成匹配結果模塊、電力調(diào)度命名規(guī)則模塊、電力行業(yè)專有名詞庫模塊;其中以電力調(diào)度命名規(guī)則模塊為核心,由電力調(diào)度命名規(guī)則模塊分別連接電力行業(yè)詞組拆分模塊、電力行業(yè)詞組判定模塊,電力行業(yè)詞組拆分模塊分別連接電力行業(yè)詞組判定模塊、電力行業(yè)專有名詞庫模塊,詞電力行業(yè)組判定模塊分別連接電力行業(yè)專有名詞庫模塊、生成匹配結果模塊;電力調(diào)度命名規(guī)則模塊根據(jù)“電力調(diào)度規(guī)程”進行命名規(guī)則的維護和管理;電力設備數(shù)據(jù)識別以電力調(diào)度命名規(guī)則庫為基準依據(jù),進行電力設備名稱的詞組拆分、詞組判定、生成匹配結果;其中:
電力調(diào)度命名規(guī)則模塊通過關系型數(shù)據(jù)庫進行存儲,實現(xiàn)規(guī)則的電子化、結構化;該模塊對關鍵詞的確認:根據(jù)調(diào)度的命名規(guī)則,程序識別出拆分的詞組中調(diào)度命名的數(shù)字組,并對數(shù)字組進行比對,還能夠根據(jù)電網(wǎng)公共模型,搜索上級廠站或線路,確認是否屬于同一線路或廠站,以及再次確認設備是否屬于同一類別,最終確認出重復數(shù)據(jù),在完成對電力設備命名的拆分、判定后,自動生成匹配的對應關系列表;
電力行業(yè)專有名詞庫模塊采用語義分析功能,使每一次對設備命名的拆分都做到拆分成詞;
電力行業(yè)詞組拆分模塊通過對電力調(diào)度中詞組或語句的分析進行拆分,并通過電力行業(yè)專有名詞庫進行校驗;本模塊中的程序以自動智能的分解調(diào)度設備命名字段,將字段分解為有意義的詞組,該拆分技術依賴于智能的語義分析以及電網(wǎng)行業(yè)詞庫的支持;(詞組拆分:選定需要拆分的數(shù)據(jù)范圍后,該方法實現(xiàn)的軟件系統(tǒng)自動根據(jù)電力命名規(guī)則、電力調(diào)度語義邏輯和電力專有名詞,對電力設備清單中指定列的內(nèi)容進行詞組拆分,形成單詞和詞組的混合詞語庫;)
判斷疑似數(shù)據(jù)是否是同一個數(shù)據(jù)的方法是:完成詞組判定,采用設備類別、調(diào)度命名規(guī)貝U、電網(wǎng)模型規(guī)則三步;第一步根據(jù)調(diào)度命名規(guī)則,找出詞組中代表調(diào)度命名的數(shù)字組,判斷疑似重復設備的調(diào)度命名是否相同,如果相同則進入下一規(guī)則判斷;第二步根據(jù)兩個系統(tǒng)中設備的基礎信息,對設備的類別做初步判斷,判斷是否是同一個類別設備;第三步利用電網(wǎng)模型關系,追溯疑似重復設備的上級線路或上級廠站容器,判斷是否屬于同一線路或廠站。
[0007]本發(fā)明的有益效果是,通過該方法能夠快速識別同一系統(tǒng)或不同系統(tǒng)的電力設備,既解決了同一部門或不同部門間電力設備信息不一致問題,為電力調(diào)度提供準確的基礎信息;又能為跨部門的數(shù)據(jù)共享與交互提供統(tǒng)一的電力設備基礎信息,保證了數(shù)據(jù)能夠有效集成。該發(fā)明既提高了電力調(diào)度的安全性,又減少了因電力設備信息不一致增加的電網(wǎng)運營成本。
【專利附圖】
【附圖說明】
[0008]圖1為本發(fā)明中電力設備疑似重復數(shù)據(jù)識別的框架和邏輯圖。【具體實施方式】
[0009]如圖1所示,一種電力設備疑似重復數(shù)據(jù)識別方法,包括電力行業(yè)詞組拆分模塊、電力行業(yè)詞組判定模塊、生成匹配結果模塊、電力調(diào)度命名規(guī)則模塊、電力行業(yè)專有名詞庫模塊;其中以電力調(diào)度命名規(guī)則模塊為核心,由電力調(diào)度命名規(guī)則模塊分別連接電力行業(yè)詞組拆分模塊、電力行業(yè)詞組判定模塊,電力行業(yè)詞組拆分模塊分別連接電力行業(yè)詞組判定模塊、電力行業(yè)專有名詞庫模塊,詞電力行業(yè)組判定模塊分別連接電力行業(yè)專有名詞庫模塊、生成匹配結果模塊;電力調(diào)度命名規(guī)則模塊根據(jù)“電力調(diào)度規(guī)程”進行命名規(guī)則的維護和管理;電力設備數(shù)據(jù)識別以電力調(diào)度命名規(guī)則庫為基準依據(jù),進行電力設備名稱的詞組拆分、詞組判定、生成匹配結果;其中:
電力調(diào)度命名規(guī)則模塊通過關系型數(shù)據(jù)庫進行存儲,實現(xiàn)規(guī)則的電子化、結構化;該模塊對關鍵詞的確認:根據(jù)調(diào)度的命名規(guī)則,程序識別出拆分的詞組中調(diào)度命名的數(shù)字組,并對數(shù)字組進行比對,還能夠根據(jù)電網(wǎng)公共模型,搜索上級廠站或線路,確認是否屬于同一線路或廠站,以及再次確認設備是否屬于同一類別,最終確認出重復數(shù)據(jù),在完成對電力設備命名的拆分、判定后,自動生成匹配的對應關系列表;
電力行業(yè)專有名詞庫模塊采用語義分析功能,使每一次對設備命名的拆分都做到拆分成詞;
電力行業(yè)詞組拆分模塊通過對電力調(diào)度中詞組或語句的分析進行拆分,并通過電力行業(yè)專有名詞庫進行校驗;本模塊中的程序以自動智能的分解調(diào)度設備命名字段,將字段分解為有意義的詞組,該拆分技術依賴于智能的語義分析以及電網(wǎng)行業(yè)詞庫的支持;(詞組拆分:選定需要拆分的數(shù)據(jù)范圍后,該方法實現(xiàn)的軟件系統(tǒng)自動根據(jù)電力命名規(guī)則、電力調(diào)度語義邏輯和電力專有名詞,對電力設備清單中指定列的內(nèi)容進行詞組拆分,形成單詞和詞組的混合詞語庫;)
判斷疑似數(shù)據(jù)是否是同一個數(shù)據(jù)的方法是:完成詞組判定,采用設備類別、調(diào)度命名規(guī)貝U、電網(wǎng)模型規(guī)則三步;第一步根據(jù)調(diào)度命名規(guī)則,找出詞組中代表調(diào)度命名的數(shù)字組,判斷疑似重復設備的調(diào)度命名是否相同,如果相同則進入下一規(guī)則判斷;第二步根據(jù)兩個系統(tǒng)中設備的基礎信息,對設備的類別做初步判斷,判斷是否是同一個類別設備;第三步利用電網(wǎng)模型關系,追溯疑似重復設備的上級線路或上級廠站容器,判斷是否屬于同一線路或廠站。
[0010]本發(fā)明中的其余模塊均與電力調(diào)度命名規(guī)則和電力專有名詞庫模塊鏈接;實現(xiàn)步驟如下:
第一步,建立基礎信息。通過電力調(diào)度命名規(guī)則和電力專有名詞庫,實現(xiàn)企業(yè)中電力調(diào)度命名規(guī)則和電力行業(yè)及企業(yè)制定的專有名詞的維護;
第二步,準備待識別的電力設備清單。若待別的電力設備位于不同信息系統(tǒng)的存儲介質(zhì),可通過系統(tǒng)接口或文件導入兩種方式,經(jīng)電力設備清單導入到該方法實現(xiàn)的軟件系統(tǒng)中。其中系統(tǒng)接口方式,實現(xiàn)了按鈕操作,即只需點擊數(shù)據(jù)導入按鈕就實現(xiàn)數(shù)據(jù)導入;第三步,詞組拆分,選定需要拆分的數(shù)據(jù)范圍后,該方法實現(xiàn)的軟件系統(tǒng)自動根據(jù)電力命名規(guī)則、電力調(diào)度語義邏輯和電力專有名詞,對電力設備清單中指定列的內(nèi)容進行詞組拆分,形成單詞和詞組的混合詞語庫;
第四步,詞組判定,按照電力調(diào)度命名規(guī)則、語義邏輯、專有名詞庫、電網(wǎng)模型結構等對拆分后的詞組進行判定,可錄入詞組判定說明內(nèi)容;
第五步,生成匹配結果,根據(jù)詞組判定結果自動生成判定結果。
[0011]以電網(wǎng)企業(yè)中電力調(diào)度自動化系統(tǒng)、電力調(diào)度運行管理系統(tǒng)、電網(wǎng)安全生產(chǎn)管理系統(tǒng)等三大系統(tǒng)中的電力設備數(shù)據(jù)識別為例,構建電網(wǎng)公司統(tǒng)一的電力設備臺賬庫,其【具體實施方式】如下:
設備臺賬來源主要有以下途徑,其中每個系統(tǒng)所包含的數(shù)據(jù)存在重復數(shù)據(jù)需要匹配:
1)來源于電力調(diào)度自動化系統(tǒng)的電網(wǎng)模型,其中包含一次設備模型、保護設備模型;
2)來源于PMS系統(tǒng)的電網(wǎng)設備臺賬,其中包含一次設備臺賬數(shù)據(jù)、二次設備臺賬數(shù)據(jù);
3)來源于電力調(diào)度運行管理系統(tǒng)的發(fā)電資源信息和檢修設備數(shù)據(jù),如發(fā)電廠、水庫、小電廠等信息;
以上三個系統(tǒng)數(shù)據(jù)源各有特點,均有其利用價值,OMS系統(tǒng)設備臺賬可按照全景建模的技術思路,對三類數(shù)據(jù)資源進行整合,形成較為完備和準確的電網(wǎng)設備臺賬,方能較為全面地支持調(diào)度業(yè)務管理工作,對數(shù)據(jù)整合的基礎就是完成重復數(shù)據(jù)的匹配工作。首先,電力調(diào)度自動化系統(tǒng)電網(wǎng)模型的數(shù)據(jù)準確高,一次設備也較為全面,可以該系統(tǒng)電網(wǎng)模型為基礎,生成電網(wǎng)設備臺賬庫,作為設備臺賬庫的基礎資源;其次進一步完成電力調(diào)度自動化系統(tǒng)與電力調(diào)度運行管理系統(tǒng)、電網(wǎng)安全生產(chǎn)管理系統(tǒng)的設備臺賬數(shù)據(jù)的匹配。由于電力調(diào)度自動化系統(tǒng)與電網(wǎng)安全生產(chǎn)管理系統(tǒng)的設備編碼和命名存在一定的差異,利用本方法,實現(xiàn)兩系統(tǒng)間編碼的映射、匹配,以便于電力調(diào)度自動化系統(tǒng)與、電力調(diào)度運行管理系統(tǒng)、電網(wǎng)安全生產(chǎn)管理系統(tǒng)進行數(shù)據(jù)交換時,做相應的數(shù)據(jù)轉(zhuǎn)換。
【權利要求】
1.一種電力設備疑似重復數(shù)據(jù)識別方法,其特征在于:包括電力行業(yè)詞組拆分模塊、電力行業(yè)詞組判定模塊、生成匹配結果模塊、電力調(diào)度命名規(guī)則模塊、電力行業(yè)專有名詞庫模塊;其中以電力調(diào)度命名規(guī)則模塊為核心,由電力調(diào)度命名規(guī)則模塊分別連接電力行業(yè)詞組拆分模塊、電力行業(yè)詞組判定模塊,電力行業(yè)詞組拆分模塊分別連接電力行業(yè)詞組判定模塊、電力行業(yè)專有名詞庫模塊,詞電力行業(yè)組判定模塊分別連接電力行業(yè)專有名詞庫模塊、生成匹配結果模塊;電力調(diào)度命名規(guī)則模塊根據(jù)“電力調(diào)度規(guī)程”進行命名規(guī)則的維護和管理;電力設備數(shù)據(jù)識別以電力調(diào)度命名規(guī)則庫為基準依據(jù),進行電力設備名稱的詞組拆分、詞組判定、生成匹配結果;其中: 電力調(diào)度命名規(guī)則模塊通過關系型數(shù)據(jù)庫進行存儲,實現(xiàn)規(guī)則的電子化、結構化;該模塊對關鍵詞的確認:根據(jù)調(diào)度的命名規(guī)則,程序識別出拆分的詞組中調(diào)度命名的數(shù)字組,并對數(shù)字組進行比對,還能夠根據(jù)電網(wǎng)公共模型,搜索上級廠站或線路,確認是否屬于同一線路或廠站,以及再次確認設備是否屬于同一類別,最終確認出重復數(shù)據(jù),在完成對電力設備命名的拆分、判定后,自動生成匹配的對應關系列表; 電力行業(yè)詞組拆分模塊通過對電力調(diào)度中詞組或語句的分析進行拆分,并通過電力行業(yè)專有名詞庫進行校驗;本模塊中的程序以自動智能的分解調(diào)度設備命名字段,將字段分解為有意義的詞組,該拆分技術依賴于智能的語義分析以及電網(wǎng)行業(yè)詞庫的支持; 判斷疑似數(shù)據(jù)是否是同一個數(shù)據(jù)的方法是:完成詞組判定,采用設備類別、調(diào)度命名規(guī)貝U、電網(wǎng)模型規(guī)則三步;第一步根據(jù)調(diào)度命名規(guī)則,找出詞組中代表調(diào)度命名的數(shù)字組,判斷疑似重復設備的調(diào)度命名是否相同,如果相同則進入下一規(guī)則判斷;第二步根據(jù)兩個系統(tǒng)中設備的基礎信息,對設備的類別做初步判斷,判斷是否是同一個類別設備;第三步利用電網(wǎng)模型關系,追溯疑似重復設備的上級線路或上級廠站容器,判斷是否屬于同一線路或廠站。
【文檔編號】G06Q10/06GK104036372SQ201410316351
【公開日】2014年9月10日 申請日期:2014年7月4日 優(yōu)先權日:2014年7月4日
【發(fā)明者】陳飛, 蔣亞坤, 趙川, 趙瑩, 羅洪, 何文洪, 張榮奎 申請人:云南電力調(diào)度控制中心, 云南云電同方科技有限公司