两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種數(shù)據(jù)挖掘系統(tǒng)及方法

文檔序號:6542385閱讀:212來源:國知局
一種數(shù)據(jù)挖掘系統(tǒng)及方法
【專利摘要】本發(fā)明涉及一種數(shù)據(jù)挖掘系統(tǒng),包括多個數(shù)據(jù)采集模塊、數(shù)據(jù)分析模塊、關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫以及數(shù)據(jù)挖掘模塊;還提供一種數(shù)據(jù)挖掘方法,該方法包括S1:多個數(shù)據(jù)采集模塊采集用戶瀏覽的網(wǎng)頁數(shù)據(jù);S2:數(shù)據(jù)分析模塊采用決策樹或神經(jīng)網(wǎng)絡(luò)方法對用戶瀏覽的網(wǎng)頁數(shù)據(jù)進(jìn)行分析以及整合;S3:根據(jù)數(shù)據(jù)挖掘需求,數(shù)據(jù)挖掘模塊對數(shù)據(jù)分析模塊分析以及整合的數(shù)據(jù)信息進(jìn)行相關(guān)挖掘,并形成相關(guān)目標(biāo)文檔;S4:對形成的目標(biāo)文檔進(jìn)行處理,并根據(jù)簡單匹配式、模糊匹配式以及段落理解式生成索引存放在非關(guān)系數(shù)據(jù)庫中。本發(fā)明的有益效果在于,本發(fā)明提供一種中文分詞效率高以及挖掘效率高的數(shù)據(jù)挖掘系統(tǒng)和方法。
【專利說明】一種數(shù)據(jù)挖掘系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種數(shù)據(jù)挖掘系統(tǒng)及方法。
【背景技術(shù)】
[0002]目前,國內(nèi)市面上大部分的數(shù)據(jù)挖掘性能較低,只要簡單的數(shù)據(jù)存儲以及查詢等功能,不能將這些用戶的數(shù)據(jù)轉(zhuǎn)化成實質(zhì)性有用的信息;另外,國外的一些數(shù)據(jù)挖掘系統(tǒng),中文分詞效率較低,存在不符合中國人的操作習(xí)慣等缺陷。

【發(fā)明內(nèi)容】

[0003]鑒于現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明的主要目的在于解決現(xiàn)有技術(shù)的缺陷,本發(fā)明提供一種中文分詞效率高以及挖掘效率高的數(shù)據(jù)挖掘系統(tǒng)。
[0004]本發(fā)明提供一種數(shù)據(jù)挖掘系統(tǒng),包括多個數(shù)據(jù)采集模塊,用于采集用戶的瀏覽網(wǎng)頁的數(shù)據(jù);數(shù)據(jù)分析模塊,用于基于所述多個數(shù)據(jù)采集模塊所采集到的數(shù)據(jù)信息,分析用戶瀏覽網(wǎng)頁的數(shù)據(jù),以獲得關(guān)于所述用戶瀏覽所有網(wǎng)頁的個體分析信息;關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫,用于對所述多個數(shù)據(jù)采集系統(tǒng)采集的用戶瀏覽網(wǎng)頁的數(shù)據(jù)以及數(shù)據(jù)分析模塊的分析結(jié)果數(shù)據(jù)進(jìn)行存儲;以及數(shù)據(jù)挖掘模塊,用于根據(jù)數(shù)據(jù)挖掘需求,對全部用戶瀏覽所有網(wǎng)頁的個體分析信息進(jìn)行數(shù)據(jù)挖掘,以獲得目標(biāo)信息。
[0005]可選的,還包括私有數(shù)據(jù)庫,用于保存預(yù)定制用戶的瀏覽網(wǎng)頁數(shù)據(jù)以及數(shù)據(jù)分析模塊的分析結(jié)果數(shù)據(jù)。
[0006]可選的,所述用戶的瀏覽網(wǎng)頁數(shù)據(jù)通過采集所述用戶的終端設(shè)備瀏覽的網(wǎng)頁數(shù)據(jù)來獲得。
[0007]可選的,所述數(shù)據(jù)挖掘系統(tǒng)用于挖掘城市建設(shè)以及規(guī)劃。
[0008]本發(fā)明還提供一種數(shù)據(jù)挖掘方法,包括以下步驟:S1:多個數(shù)據(jù)采集模塊采集用戶瀏覽的網(wǎng)頁數(shù)據(jù);S2:數(shù)據(jù)分析模塊采用決策樹或神經(jīng)網(wǎng)絡(luò)方法對用戶瀏覽的網(wǎng)頁數(shù)據(jù)進(jìn)行分析以及整合;S3:根據(jù)數(shù)據(jù)挖掘需求,數(shù)據(jù)挖掘模塊對數(shù)據(jù)分析模塊分析以及整合的數(shù)據(jù)信息進(jìn)行相關(guān)挖掘,并形成相關(guān)目標(biāo)文檔;S4:對形成的目標(biāo)文檔進(jìn)行處理,并根據(jù)簡單匹配式、模糊匹配式以及段落理解式生成索引存放于非關(guān)系數(shù)據(jù)庫中。
[0009]本發(fā)明具有以下優(yōu)點和有益效果:本發(fā)明提供的一種數(shù)據(jù)挖掘系統(tǒng)和方法,該系統(tǒng)采用高效的數(shù)據(jù)采集模塊,通過采用關(guān)聯(lián)規(guī)則挖掘同時使用決策樹和神經(jīng)網(wǎng)絡(luò)方法,確保信息無遺漏,無歧義,并采取關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫兩種數(shù)據(jù)庫存儲信息;同時,支持簡單匹配式、模糊匹配式和段落理解式三種類型的自然語言處理,提高了挖掘效率。
【專利附圖】

【附圖說明】
[0010]圖1為本發(fā)明提供的一種數(shù)據(jù)挖掘系統(tǒng)的原理框圖;
[0011]圖2為本發(fā)明提供的一種數(shù)據(jù)挖掘方法的流程圖?!揪唧w實施方式】
[0012]下面將參照附圖和具體實施例對本發(fā)明作進(jìn)一步的說明。
[0013]如圖1所示:本發(fā)明實施例提供一種數(shù)據(jù)挖掘系統(tǒng),包括:
[0014]多個數(shù)據(jù)采集模塊1,用于采集用戶的瀏覽網(wǎng)頁的數(shù)據(jù);
[0015]數(shù)據(jù)分析模塊2,用于基于所述多個數(shù)據(jù)采集模塊所采集到的數(shù)據(jù)信息,分析用戶瀏覽網(wǎng)頁的數(shù)據(jù),以獲得關(guān)于所述用戶瀏覽所有網(wǎng)頁的個體分析信息;
[0016]關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫4,用于對所述多個數(shù)據(jù)采集系統(tǒng)采集的用戶瀏覽網(wǎng)頁的數(shù)據(jù)以及數(shù)據(jù)分析模塊的分析結(jié)果數(shù)據(jù)進(jìn)行存儲;以及
[0017]數(shù)據(jù)挖掘模塊3,用于根據(jù)數(shù)據(jù)挖掘需求,對全部用戶瀏覽所有網(wǎng)頁的個體分析信息進(jìn)行數(shù)據(jù)挖掘,以獲得目標(biāo)信息。
[0018]作為上述實施例的優(yōu)選實施方式,所述數(shù)據(jù)挖掘系統(tǒng)還包括私有數(shù)據(jù)庫,用于保存預(yù)定制用戶的瀏覽網(wǎng)頁數(shù)據(jù)以及數(shù)據(jù)分析模塊的分析結(jié)果數(shù)據(jù)。
[0019]作為上述實施例的優(yōu)選實施方式,所述用戶的瀏覽網(wǎng)頁數(shù)據(jù)通過采集所述用戶的終端設(shè)備瀏覽的網(wǎng)頁數(shù)據(jù)來獲得。
[0020]作為上述實施例的優(yōu)選實施方式,所述數(shù)據(jù)挖掘系統(tǒng)用于挖掘城市建設(shè)以及規(guī)劃。
[0021]如圖2所示,本發(fā)明實施例還提供一種數(shù)據(jù)挖掘方法,包括以下步驟:
[0022]S1:多個數(shù)據(jù)采集模塊采集用戶瀏覽的網(wǎng)頁數(shù)據(jù);
[0023]S2:數(shù)據(jù)分析模塊采用決策樹或神經(jīng)網(wǎng)絡(luò)方法對用戶瀏覽的網(wǎng)頁數(shù)據(jù)進(jìn)行分析以及整合;
[0024]S3:根據(jù)數(shù)據(jù)挖掘需求,數(shù)據(jù)挖掘模塊對數(shù)據(jù)分析模塊分析以及整合的數(shù)據(jù)信息進(jìn)行相關(guān)挖掘,并形成相關(guān)目標(biāo)文檔;
[0025]S4:對形成的目標(biāo)文檔進(jìn)行處理,并根據(jù)簡單匹配式、模糊匹配式以及段落理解式生成索引存放于非關(guān)系數(shù)據(jù)庫中。
[0026]最后應(yīng)說明的是:以上所述的各實施例僅用于說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或全部技術(shù)特征進(jìn)行等同替換;而這些修改或替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍。
【權(quán)利要求】
1.一種數(shù)據(jù)挖掘系統(tǒng),其特征在于,包括: 多個數(shù)據(jù)采集模塊,用于采集用戶的瀏覽網(wǎng)頁的數(shù)據(jù); 數(shù)據(jù)分析模塊,用于基于所述多個數(shù)據(jù)采集模塊所采集到的數(shù)據(jù)信息,分析用戶瀏覽網(wǎng)頁的數(shù)據(jù),以獲得關(guān)于所述用戶瀏覽所有網(wǎng)頁的個體分析信息; 關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫,用于對所述多個數(shù)據(jù)采集系統(tǒng)采集的用戶瀏覽網(wǎng)頁的數(shù)據(jù)以及數(shù)據(jù)分析模塊的分析結(jié)果數(shù)據(jù)進(jìn)行存儲;以及 數(shù)據(jù)挖掘模塊,用于根據(jù)數(shù)據(jù)挖掘需求,對全部用戶瀏覽所有網(wǎng)頁的個體分析信息進(jìn)行數(shù)據(jù)挖掘,以獲得目標(biāo)信息。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,還包括私有數(shù)據(jù)庫,用于保存預(yù)定制用戶的瀏覽網(wǎng)頁數(shù)據(jù)以及數(shù)據(jù)分析模塊的分析結(jié)果數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,所述用戶的瀏覽網(wǎng)頁數(shù)據(jù)通過采集所述用戶的終端設(shè)備瀏覽的網(wǎng)頁數(shù)據(jù)來獲得。
4.根據(jù)權(quán)利要求1所述的數(shù)據(jù)挖掘系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘系統(tǒng)用于挖掘城市建設(shè)以及規(guī)劃。
5.一種數(shù)據(jù)挖掘方法,其特征在于,包括以下步驟: 51:多個數(shù)據(jù)采集模塊采集用戶瀏覽的網(wǎng)頁數(shù)據(jù);52:數(shù)據(jù)分析模塊采用決策樹或神經(jīng)網(wǎng)絡(luò)方法對用戶瀏覽的網(wǎng)頁數(shù)據(jù)進(jìn)行分析以及整合; 53:根據(jù)數(shù)據(jù)挖掘需求,數(shù)據(jù)挖掘模塊對數(shù)據(jù)分析模塊分析以及整合的數(shù)據(jù)信息進(jìn)行相關(guān)挖掘,并形成相關(guān)目標(biāo)文檔; 54:對形成的目標(biāo)文檔進(jìn)行處理,并根據(jù)簡單匹配式、模糊匹配式以及段落理解式生成索引存放于非關(guān)系數(shù)據(jù)庫中。
【文檔編號】G06F17/30GK103870595SQ201410126187
【公開日】2014年6月18日 申請日期:2014年4月1日 優(yōu)先權(quán)日:2014年4月1日
【發(fā)明者】李飛 申請人:深圳市科盾科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
晋中市| 台北市| 保靖县| 苏州市| 庆城县| 长宁区| 乐清市| 楚雄市| 闽清县| 临桂县| 和田县| 宝坻区| 高安市| 新疆| 甘肃省| 鲜城| 浮山县| 阿拉善左旗| 鹤壁市| 共和县| 勃利县| 九江市| 湛江市| 龙门县| 常宁市| 涟水县| 莆田市| 稻城县| 息烽县| 新野县| 广德县| 邓州市| 南丰县| 襄垣县| 六枝特区| 塘沽区| 惠水县| 明溪县| 临武县| 巴彦淖尔市| 宁强县|