两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于d-s證據(jù)理論的不確定性數(shù)據(jù)世系查詢處理方法

文檔序號(hào):6363997閱讀:923來(lái)源:國(guó)知局
專(zhuān)利名稱:基于d-s證據(jù)理論的不確定性數(shù)據(jù)世系查詢處理方法
技術(shù)領(lǐng)域
本發(fā)明公開(kāi)了ー種基于D-S證據(jù)理論的不確定性數(shù)據(jù)世系查詢處理方法,涉及基于D-S證據(jù)理論進(jìn)行數(shù)據(jù)中不確定性的表示和推理、追蹤數(shù)據(jù)處理過(guò)程中不確定性的來(lái)源、回答世系查詢的方法。屬于數(shù)據(jù)庫(kù)技術(shù)及信息處理技術(shù)領(lǐng)域。
背景技術(shù)
隨著技術(shù)的進(jìn)步和人們對(duì)數(shù)據(jù)采集和處理技術(shù)理解的不斷深入,不確定性數(shù)據(jù)(Uncertain Data)得到了廣泛的重視,普遍存在于經(jīng)濟(jì)、物流、金融、電信和科學(xué)計(jì)算等領(lǐng)域中,且扮演著關(guān)鍵角色。概率數(shù)據(jù)庫(kù)中的數(shù)據(jù)本身帶有不確定性(例如概率、區(qū)間等),查詢結(jié)果也帶有不確定性,這也是不確定性數(shù)據(jù)與確定性數(shù)據(jù)的最大區(qū)別。世系(Lineage或Provenance)是指數(shù)據(jù)產(chǎn)生、并隨時(shí)間推移而演變的整個(gè)過(guò)程,在科學(xué)數(shù)據(jù)和傳感器數(shù)據(jù)管理、隱私保護(hù)和數(shù)字圖書(shū)館等領(lǐng)域中,基于世系可追蹤數(shù)據(jù)及其不確定性的來(lái)源,響應(yīng)用戶對(duì)數(shù)據(jù)歷史和不確定性的查詢、提高傳感器數(shù)據(jù)查詢效率和準(zhǔn)確度、返回隱私保護(hù)數(shù)據(jù)的分析結(jié)果、評(píng)價(jià)數(shù)據(jù)質(zhì)量和可靠性。不確定性數(shù)據(jù)的世系,可以作為考察數(shù)據(jù)不確定性來(lái)源以及演變過(guò)程的ー項(xiàng)重要技木。世系表達(dá)式記錄了數(shù)據(jù)處理和演化的過(guò)程,世系查詢處理根據(jù)世系表達(dá)式和輸入的不確定性數(shù)據(jù)來(lái)計(jì)算處理結(jié)果的不確定性,用以追蹤不確定性數(shù)據(jù)處理和演化過(guò)程中不確定性的來(lái)源,不確定性的推理是世系查詢處理的關(guān)鍵。基于世系信息可避免窮舉所有可能世界,從而提高處理效率,為此,需要建立有效的世系表示及相應(yīng)的不確定性推理機(jī)制,公知的世系查詢處理方法基于布爾公式或圖型結(jié)構(gòu)表示世系,反映所涉及數(shù)據(jù)間的相關(guān)性,并基于概率論計(jì)算查詢結(jié)果的不確定性。高明等(〈計(jì)算機(jī)學(xué)報(bào)〉,2010,33 (3)373-389)分析了不確定性數(shù)據(jù)世系管理的現(xiàn)狀和挑戰(zhàn);黃冬梅等(〈專(zhuān)利CN201110004234.X>,2011)基于帶世系的不確定性數(shù)據(jù)管理系統(tǒng)ULDB,根據(jù)世系函數(shù)查找不確定性海洋監(jiān)測(cè)數(shù)據(jù)的來(lái)源;高明(〈復(fù)旦大學(xué)博士論文〉,2011)基于樹(shù)型結(jié)構(gòu)給出了不確定性數(shù)據(jù)世系的近似描述及目標(biāo)數(shù)據(jù)不確定性的評(píng)價(jià)方法;岳昆等(〈計(jì)算機(jī)學(xué)報(bào)〉,2011,34(10)1897-1906)針對(duì)世系查詢處理,提出了基于概率圖模型的不確定性數(shù)據(jù)世系表示方法。公知的世系查詢處理方法中,不確定性的計(jì)算以概率論為基礎(chǔ)(需要完備的概率空間),建立在給定不確定性數(shù)據(jù)具有完備先驗(yàn)概率這ー假設(shè)之上,未考慮實(shí)際中不確定性數(shù)據(jù)本身不完整或部分?jǐn)?shù)據(jù)缺失的特點(diǎn),影響了結(jié)果的準(zhǔn)確性。為此,公知的方法將D-S證據(jù)理論用于不確定性數(shù)據(jù)的管理中,不是采用概率、而是引入信任函數(shù)來(lái)度量不完備數(shù)據(jù) 中的不確定性。李芳等(〈計(jì)算機(jī)應(yīng)用>,2009,29 (11) =3092-3094)將D-S證據(jù)理論與決策樹(shù)分類(lèi)技術(shù)相結(jié)合,提出了不確定性數(shù)據(jù)的分類(lèi)算法;姜小華(く重慶大學(xué)博士論文>,2009)基于證據(jù)理論擴(kuò)展了 ULDB系統(tǒng),提出了元組置信度的概念和主觀非確定性數(shù)據(jù)的表示、空值的處理、以及相應(yīng)的數(shù)據(jù)查詢和更新方法。但是,這些方法未涉及世系查詢處理及其中的不確定性推理。本發(fā)明以不確定性的推理為核心,以世系表達(dá)式和輸入的不確定性數(shù)據(jù)為出發(fā)點(diǎn),將數(shù)據(jù)項(xiàng)及其概率值分別作為得到處理結(jié)果數(shù)據(jù)項(xiàng)的證據(jù)及其信任度,提出了將輸入數(shù)據(jù)項(xiàng)的概率值轉(zhuǎn)換為D-S證據(jù)理論中基本概率賦值的方法,建立了基于D-S證據(jù)理論的結(jié)果數(shù)據(jù)項(xiàng)概率賦值、信念值及似然值的計(jì)算方法,給出了利用信念值和似然值描述世系查詢結(jié)果不確定性的機(jī)制,以及結(jié)果有效性的驗(yàn)證策略。此方法為不確定性數(shù)據(jù)的查詢優(yōu)化、結(jié)果推斷、質(zhì)量評(píng)價(jià)等基于世系的相關(guān)應(yīng)用提供了ー種新的理論依據(jù)和技術(shù)基礎(chǔ)。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于D-S證據(jù)理論的不確定性數(shù)據(jù)世系查詢處理方法。針對(duì)不確定性數(shù)據(jù)本身不完整或部分信息缺失的特點(diǎn),基于D-S證據(jù)理論,不需假設(shè)“先驗(yàn)知識(shí)完備”,將數(shù)據(jù)項(xiàng)及其概率值分別作為結(jié)果數(shù)據(jù)項(xiàng)對(duì)應(yīng)的證據(jù)及其信任度,建立基于證據(jù)組合規(guī)則進(jìn)行數(shù)據(jù)中不確定性推理的方法、利用信念值和似然值度量世系查詢結(jié)果不確定性的機(jī)制,給出結(jié)果有效性的驗(yàn)證策略,以更符合實(shí)際的方式得到準(zhǔn)確的世系查詢處理結(jié)果,為不確定性數(shù)據(jù)的查詢優(yōu)化、結(jié)果推斷和質(zhì)量評(píng)價(jià)等奠定基礎(chǔ)。2、本發(fā)明按以下步驟完成本發(fā)明エ藝流程為首先,以涉及兩張不確定性數(shù)據(jù)表的選擇、投影和連接(記為SPJ)查詢操作為代表,從描述SPJ查詢操作的世系表達(dá)式出發(fā),獲取每個(gè)輸入數(shù)據(jù)項(xiàng)對(duì)結(jié)果數(shù)據(jù)項(xiàng)的基本概率賦值;接著,基于D-S證據(jù)理論中的Dempster證據(jù)組合規(guī)則,計(jì)算多個(gè)輸入數(shù)據(jù)項(xiàng)的不確定性對(duì)各結(jié)果數(shù)據(jù)項(xiàng)不確定性的聯(lián)合影響,得到各結(jié)果數(shù)據(jù)項(xiàng)的概率賦值;然后,通過(guò)對(duì)各結(jié)果數(shù)據(jù)項(xiàng)的概率賦值進(jìn)行規(guī)范化處理,計(jì)算各結(jié)果數(shù)據(jù)項(xiàng)的信念值和似然值,從而度量結(jié)果數(shù)據(jù)項(xiàng)的不確定性,與直接基于輸入不確定性數(shù)據(jù)的可能世界實(shí)例所得到的結(jié)果相一致,可基于此對(duì)世系查詢結(jié)果進(jìn)行驗(yàn)證評(píng)估。(I)獲取輸入數(shù)據(jù)項(xiàng)的基本概率賦值設(shè)A和B是包含元組級(jí)不確定性的輸入數(shù)據(jù)表,形如“的SPJ查詢操作表示Α和B的連接04MS)結(jié)果之上對(duì)屬性c進(jìn)行投影(π。),得到包括屬性c的結(jié)果數(shù)據(jù)表R。Ir1, r2,…,rj為R中的數(shù)據(jù)項(xiàng)(用元組標(biāo)識(shí)表示)。λ :AXB — R為世系函數(shù),入(rp為的世系表達(dá)式,表示為A和B中數(shù)據(jù)項(xiàng)的布爾公式。以A作為證據(jù)數(shù)據(jù)表,A中的ー個(gè)數(shù)據(jù)項(xiàng)包括同一實(shí)體或事件的多個(gè)可能取值(各取值間用“ I I ”分開(kāi)),即A對(duì)R的ー個(gè)證據(jù)。{a1;a2,…,an}為A中的數(shù)據(jù)項(xiàng),中第k個(gè)可能取值aik的概率值
(也稱可信度)記為
權(quán)利要求
1. 一種基于D-S證據(jù)理論的不確定性數(shù)據(jù)世系查詢處理方法,其特征在于首先,以涉及兩張不確定性數(shù)據(jù)表的選擇、投影和連接查詢操作為代表,從描述SPJ查詢操作的世系表達(dá)式出發(fā),獲取每個(gè)輸入數(shù)據(jù)項(xiàng)對(duì)結(jié)果數(shù)據(jù)項(xiàng)的基本概率賦值;接著,基于D-S證據(jù)理論中的Dempster證據(jù)組合規(guī)則,計(jì)算多個(gè)輸入數(shù)據(jù)項(xiàng)的不確定性對(duì)各結(jié)果數(shù)據(jù)項(xiàng)不確定性的聯(lián)合影響,得到各結(jié)果數(shù)據(jù)項(xiàng)的概率賦值;然后,通過(guò)對(duì)各結(jié)果數(shù)據(jù)項(xiàng)的概率賦值進(jìn)行規(guī)范化處理,計(jì)算各結(jié)果數(shù)據(jù)項(xiàng)的信念值和似然值,從而度量結(jié)果數(shù)據(jù)項(xiàng)的不確定性,與直接基于輸入不確定性數(shù)據(jù)的可能世界實(shí)例所得到的結(jié)果相一致,具體步驟為 (1)獲取輸入數(shù)據(jù)項(xiàng)的基本概率賦值 設(shè)A和B是包含元組級(jí)不確定性的輸入數(shù)據(jù)表,形如“的SPJ查詢操作表示A和B的連接C4M5)結(jié)果之上對(duì)屬性c進(jìn)行投影(JI。),得到包括屬性c的結(jié)果數(shù)據(jù)表R,Ir1, r2,, rj為R中的數(shù)據(jù)項(xiàng)(用元組標(biāo)識(shí)表示),A :AXB —R為世系函數(shù),\ Oj)為rj(l ^ j ^ I)的世系表達(dá)式,表示為A和B中數(shù)據(jù)項(xiàng)的布爾公式,以A作為證據(jù)數(shù)據(jù)表,A中的ー個(gè)數(shù)據(jù)項(xiàng)包括同一實(shí)體或事件的多個(gè)可能取值,即A對(duì)R的ー個(gè)證據(jù),{ai,a2,…,an}為A中的數(shù)據(jù)項(xiàng),ai中第k個(gè)可能取值aik的概率值,記為pik(l彡i彡n,k彡I), Pik — ^ ,其中n為A中數(shù)據(jù)項(xiàng)個(gè)數(shù)即元組數(shù);
2. 根據(jù)權(quán)利要求I所述的基于D-S證據(jù)理論的不確定性數(shù)據(jù)世系查詢處理方法,其特征在于針對(duì)交通肇事指控的世系查詢處理方法, (1)不確定性數(shù)據(jù)和世系查詢 給定“目擊調(diào)查”筆錄和車(chē)管所“駕駛記錄”的不確定性數(shù)據(jù),分別如表I和表2所示,表I中的“目擊調(diào)查”筆錄數(shù)據(jù)包括兩個(gè)證據(jù)數(shù)據(jù)項(xiàng),分別為“張三”和“李四”的目擊調(diào)查筆錄,“可信度”反映證據(jù)數(shù)據(jù)可能取值的概率,“目擊調(diào)查”與“駕駛記錄”表通過(guò)“車(chē)牌號(hào)”屬性進(jìn)行連接; 表I目擊調(diào)查
全文摘要
本發(fā)明涉及一種基于D-S證據(jù)理論的不確定性數(shù)據(jù)世系查詢處理方法,以涉及不確定性數(shù)據(jù)表的選擇、投影和連接查詢操作為代表,從描述SPJ查詢操作的世系表達(dá)式出發(fā),獲取每個(gè)輸入數(shù)據(jù)項(xiàng)對(duì)結(jié)果數(shù)據(jù)項(xiàng)的基本概率賦值;接著,基于D-S證據(jù)理論中的證據(jù)組合規(guī)則,計(jì)算多個(gè)輸入數(shù)據(jù)項(xiàng)的不確定性對(duì)各結(jié)果數(shù)據(jù)項(xiàng)不確定性的聯(lián)合影響,得到各結(jié)果數(shù)據(jù)項(xiàng)的概率賦值;然后,通過(guò)對(duì)各結(jié)果數(shù)據(jù)項(xiàng)的概率賦值進(jìn)行規(guī)范化處理,計(jì)算各結(jié)果數(shù)據(jù)項(xiàng)的信念值和似然值,從而度量結(jié)果數(shù)據(jù)項(xiàng)的不確定性,與直接基于輸入不確定性數(shù)據(jù)的可能世界實(shí)例所得到的結(jié)果相一致,可基于此對(duì)世系查詢結(jié)果進(jìn)行驗(yàn)證評(píng)估。
文檔編號(hào)G06F17/30GK102651028SQ20121009951
公開(kāi)日2012年8月29日 申請(qǐng)日期2012年4月9日 優(yōu)先權(quán)日2012年4月9日
發(fā)明者劉惟一, 岳昆, 楊彥超, 王源, 田凱琳 申請(qǐng)人:云南大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
青川县| 湖南省| 怀安县| 永昌县| 三明市| 驻马店市| 安陆市| 离岛区| 鄱阳县| 平泉县| 正安县| 北流市| 政和县| 万安县| 西吉县| 霍邱县| 海门市| 定南县| 怀来县| 黄石市| 富阳市| 榆中县| 红桥区| 那曲县| 绥滨县| 大田县| 克东县| 汉源县| 湾仔区| 安泽县| 黑龙江省| 南木林县| 木兰县| 仪征市| 蓝山县| 静乐县| 乐平市| 新和县| 昌图县| 河东区| 蒙阴县|