一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng)的制作方法
【專利摘要】本發(fā)明提出了一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),適用范圍廣,易于理解,便于操作,適合中小企業(yè)競爭情報(bào)分析系統(tǒng),其包括依次連接的原始數(shù)據(jù)處理模塊、時(shí)間序列聚類分析模塊、單條時(shí)間序列模式發(fā)現(xiàn)模塊、同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊。其中,原始數(shù)據(jù)處理模塊,按訪問時(shí)間順序采集時(shí)間序列數(shù)據(jù),并對其進(jìn)行劃分和平滑處理;時(shí)間序列聚類分析模塊,分析接收到的時(shí)間序列數(shù)據(jù)相似度,利用聚類算法對時(shí)間序列數(shù)據(jù)進(jìn)行聚類,將時(shí)間序列數(shù)據(jù)按關(guān)聯(lián)程度分為第一類別時(shí)間序列……第N-1類別時(shí)間序列、第N類別時(shí)間序列;單條時(shí)間序列模式發(fā)現(xiàn)模塊,整理第一元模式集……第N-1元模式集、第N元模式集;同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊,計(jì)算時(shí)間序列頻繁模式。
【專利說明】一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)挖掘【技術(shù)領(lǐng)域】,尤其涉及一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng)。
【背景技術(shù)】
[0002]數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、可視化技術(shù)等,高度自動(dòng)化地分析數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者做出正確的決策。
[0003]數(shù)據(jù)庫中的數(shù)據(jù)量非常龐大,分析數(shù)據(jù)時(shí)必須遵循一定的規(guī)律。由于時(shí)間序列時(shí)普遍存在的,現(xiàn)在常用的數(shù)據(jù)挖掘?yàn)闀r(shí)間序列數(shù)據(jù)挖掘,即在不同時(shí)間點(diǎn)上收集數(shù)據(jù),這類數(shù)據(jù)反映了某一事物、現(xiàn)象等隨時(shí)間的變化狀態(tài)或程度。
[0004]時(shí)間序列數(shù)據(jù)挖掘是現(xiàn)有的數(shù)據(jù)挖掘最常用的手段,但是,現(xiàn)有的時(shí)間序列數(shù)據(jù)挖掘方法針對性強(qiáng),不同環(huán)境、不同對象之間的時(shí)間序列挖掘方法及模型往往相差巨大,例如,季節(jié)降雨量、中國GDP的變化、金融市場分析等等都需要不同的時(shí)間序列數(shù)據(jù)挖掘模型。另外,隨著企業(yè)競爭的日益激烈,競爭情報(bào)分析也越來越受到重視,但是現(xiàn)有的競爭情報(bào)數(shù)據(jù)分析系統(tǒng)耗資甚巨,中小型企業(yè)難以承受,他們急需一種簡潔、快速、方便的數(shù)據(jù)挖掘方法。
【發(fā)明內(nèi)容】
[0005]基于【背景技術(shù)】存在的問題,本發(fā)明提出了一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),適用范圍廣,且易于理解,便于操作,適用于中小企業(yè)競爭情報(bào)分析系統(tǒng)。
[0006]本發(fā)明提出的一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),包括依次連接的原始數(shù)據(jù)處理模塊、時(shí)間序列聚類分析模塊、單條時(shí)間序列模式發(fā)現(xiàn)模塊、同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊;其中,
[0007]原始數(shù)據(jù)處理模塊,按訪問時(shí)間順序采集時(shí)間序列數(shù)據(jù),并對其進(jìn)行劃分和平滑處理,并將處理后的時(shí)間序列數(shù)據(jù)發(fā)送到時(shí)間序列聚類分析模塊;
[0008]時(shí)間序列聚類分析模塊,分析接收到的時(shí)間序列數(shù)據(jù)相似度,利用聚類算法對時(shí)間序列數(shù)據(jù)進(jìn)行聚類,將時(shí)間序列數(shù)據(jù)按關(guān)聯(lián)程度分為第一類別時(shí)間序列……第N-1類別時(shí)間序列、第N類別時(shí)間序列并發(fā)送到單條時(shí)間序列模式發(fā)現(xiàn)模塊,N>1 ;
[0009]單條時(shí)間序列模式發(fā)現(xiàn)模塊,分別針對第一類別時(shí)間序列……第N-1類別時(shí)間序列、第N類別時(shí)間序列,分析其變化模式,整理對應(yīng)的第一元模式集……第N-1元模式集、第N元模式集并發(fā)送到同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊;
[0010]同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊,根據(jù)第一元模式集……第N-1元模式集、第N元模式集,分析整理多條時(shí)間序列通用的模式,計(jì)算時(shí)間序列頻繁模式。
[0011]優(yōu)選地,原始數(shù)據(jù)處理模塊中,采集時(shí)間序列數(shù)據(jù)的時(shí)間順序可自動(dòng)設(shè)置和/或手動(dòng)設(shè)置。
[0012]優(yōu)選地,時(shí)間序列數(shù)據(jù)為確定時(shí)間序列數(shù)據(jù)和/或隨機(jī)時(shí)間序列數(shù)據(jù)。
[0013]優(yōu)選地,時(shí)間序列聚類分析模塊中,通過相似度計(jì)算方法分析時(shí)間序列數(shù)據(jù)相似度,相似度計(jì)算方法可自動(dòng)設(shè)置和/或手動(dòng)設(shè)置。
[0014]本發(fā)明提出的時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),符合大多數(shù)數(shù)據(jù)挖掘場景的應(yīng)用需求,適用范圍廣泛,能夠滿足競爭情報(bào)分析的需要;而且本發(fā)明中,采集數(shù)據(jù)的時(shí)間順序、數(shù)據(jù)相似度算法既可以自動(dòng)設(shè)置又可以手動(dòng)設(shè)置,自動(dòng)設(shè)置時(shí),效率高,人工成本低,手動(dòng)設(shè)置時(shí),針對性強(qiáng),準(zhǔn)確率高;同理,時(shí)間序列數(shù)據(jù)可根據(jù)需要選擇確定時(shí)間序列數(shù)據(jù)和/或隨機(jī)時(shí)間序列數(shù)據(jù),確定時(shí)間序列數(shù)據(jù)比較適合事件時(shí)間確定的分析場合,大大減少了數(shù)據(jù)量,提高分析速率并節(jié)約成本,隨機(jī)時(shí)間序列數(shù)據(jù)更為適合事件時(shí)間不確定的分析場合,采用大面積撒網(wǎng)的策略,防止重要數(shù)據(jù)遺漏。本發(fā)明條理清晰,便于理解,可操作性強(qiáng),尤其適合中小型企業(yè)的競爭情報(bào)分析系統(tǒng)。
【專利附圖】
【附圖說明】
[0015]圖1為本發(fā)明提出的一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)圖;
[0016]圖2為圖1所示系統(tǒng)的工作流程圖。
【具體實(shí)施方式】
[0017]參照圖1、圖2,本發(fā)明提出的一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),包括依次連接的原始數(shù)據(jù)處理模塊、時(shí)間序列聚類分析模塊、單條時(shí)間序列模式發(fā)現(xiàn)模塊、同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊。
[0018]原始數(shù)據(jù)處理模塊,按訪問時(shí)間順序采集時(shí)間序列數(shù)據(jù),并對其進(jìn)行劃分和平滑處理,使得時(shí)間序列數(shù)據(jù)變化模式更加清晰也更具有代表性。處理后的時(shí)間序列數(shù)據(jù)被發(fā)送到時(shí)間序列聚類分析模塊。
[0019]時(shí)間序列聚類分析模塊,分析接收到的時(shí)間序列數(shù)據(jù)相似度,利用聚類算法對時(shí)間序列數(shù)據(jù)進(jìn)行聚類,將時(shí)間序列數(shù)據(jù)按關(guān)聯(lián)程度分為第一類別時(shí)間序列……第N-1類別時(shí)間序列、第N類別時(shí)間序列并發(fā)送到單條時(shí)間序列模式發(fā)現(xiàn)模塊,N>1。
[0020]單條時(shí)間序列模式發(fā)現(xiàn)模塊,分別針對第一類別時(shí)間序列……第N-1類別時(shí)間序列、第N類別時(shí)間序列,分析其變化模式,整理對應(yīng)的第一元模式集……第N-1元模式集、第N元模式集并發(fā)送到同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊。
[0021]同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊,根據(jù)第一元模式集……第N-1元模式集、第N元模式集,分析整理多條時(shí)間序列通用的模式,計(jì)算時(shí)間序列頻繁模式。
[0022]以上實(shí)施方式的原始數(shù)據(jù)處理模塊中,采集時(shí)間序列數(shù)據(jù)的時(shí)間順序可自動(dòng)設(shè)置也可手動(dòng)設(shè)置,時(shí)間序列數(shù)據(jù)可以是確定時(shí)間序列數(shù)據(jù)也可以是隨機(jī)時(shí)間序列數(shù)據(jù),確定時(shí)間序列數(shù)據(jù)比較適合事件時(shí)間確定的分析場合,大大減少了數(shù)據(jù)量,提高分析速率并節(jié)約成本,隨機(jī)時(shí)間序列數(shù)據(jù)更為適合事件時(shí)間不確定的分析場合,采用大面積撒網(wǎng)的策略,防止重要數(shù)據(jù)遺漏。
[0023]以上實(shí)施方式的時(shí)間序列聚類分析模塊中,通過相似度計(jì)算方法分析時(shí)間序列數(shù)據(jù)相似度,相似度計(jì)算方法可自動(dòng)設(shè)置也可手動(dòng)設(shè)置,自動(dòng)設(shè)置時(shí),效率高,人工成本低,手動(dòng)設(shè)置時(shí),針對性強(qiáng),準(zhǔn)確率高。
[0024]以上實(shí)施方式中的時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),符合大多數(shù)數(shù)據(jù)挖掘場景的應(yīng)用需要,適用范圍廣泛,能夠滿足競爭情報(bào)分析的需要,而且,條理清晰,便于理解,可操作性強(qiáng),尤其適合中小型企業(yè)的競爭情報(bào)分析系統(tǒng)。
[0025]以上所述,僅為本發(fā)明較佳的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),其特征在于,包括依次連接的原始數(shù)據(jù)處理模塊、時(shí)間序列聚類分析模塊、單條時(shí)間序列模式發(fā)現(xiàn)模塊、同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊;其中, 原始數(shù)據(jù)處理模塊,按訪問時(shí)間順序采集時(shí)間序列數(shù)據(jù),并對其進(jìn)行劃分和平滑處理,并將處理后的時(shí)間序列數(shù)據(jù)發(fā)送到時(shí)間序列聚類分析模塊; 時(shí)間序列聚類分析模塊,分析接收到的時(shí)間序列數(shù)據(jù)相似度,利用聚類算法對時(shí)間序列數(shù)據(jù)進(jìn)行聚類,將時(shí)間序列數(shù)據(jù)按關(guān)聯(lián)程度分為第一類別時(shí)間序列……第N-1類別時(shí)間序列、第N類別時(shí)間序列并發(fā)送到單條時(shí)間序列模式發(fā)現(xiàn)模塊,N>1 ; 單條時(shí)間序列模式發(fā)現(xiàn)模塊,分別針對第一類別時(shí)間序列……第N-1類別時(shí)間序列、第N類別時(shí)間序列,分析其變化模式,整理對應(yīng)的第一元模式集……第N-1元模式集、第N元模式集并發(fā)送到同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊; 同類別多條時(shí)間序列模式發(fā)現(xiàn)模塊,根據(jù)第一元模式集……第N-1元模式集、第N元模式集,分析整理多條時(shí)間序列通用的模式,計(jì)算時(shí)間序列頻繁模式。
2.如權(quán)利要求1所述的時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),其特征在于,原始數(shù)據(jù)處理模塊中,采集時(shí)間序列數(shù)據(jù)的時(shí)間順序可自動(dòng)設(shè)置和/或手動(dòng)設(shè)置。
3.如權(quán)利要求1或2所述的時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),其特征在于,時(shí)間序列數(shù)據(jù)為確定時(shí)間序列數(shù)據(jù)和/或隨機(jī)時(shí)間序列數(shù)據(jù)。
4.如權(quán)利要求1所述的時(shí)間序列數(shù)據(jù)挖掘系統(tǒng),其特征在于,時(shí)間序列聚類分析模塊中,通過相似度計(jì)算方法分析時(shí)間序列數(shù)據(jù)相似度,相似度計(jì)算方法可自動(dòng)設(shè)置和/或手動(dòng)設(shè)置。
【文檔編號(hào)】G06F17/30GK104182461SQ201410347432
【公開日】2014年12月3日 申請日期:2014年7月21日 優(yōu)先權(quán)日:2014年7月21日
【發(fā)明者】賈巖 申請人:安徽華貞信息科技有限公司