两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法

文檔序號(hào):6633060閱讀:287來源:國知局
一種基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法
【專利摘要】本發(fā)明針對(duì)傳統(tǒng)的數(shù)據(jù)集中存儲(chǔ)單點(diǎn)查詢的問題,公開了一種基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法,利用Hadoop平臺(tái),通過對(duì)分布式非關(guān)系型數(shù)據(jù)庫Hbase建立二級(jí)索引,并且將數(shù)據(jù)通過轉(zhuǎn)換、遷移導(dǎo)入到云平臺(tái),實(shí)現(xiàn)海量數(shù)據(jù)的可靠存儲(chǔ)與快速檢索。本發(fā)明包括如下步驟:數(shù)據(jù)過濾;在Hbase中定義對(duì)應(yīng)的表格式;建立二級(jí)索引;分情況進(jìn)行數(shù)據(jù)導(dǎo)入;分情況進(jìn)行數(shù)據(jù)檢索。本發(fā)明既能實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)查詢,也避免以往存儲(chǔ)和維護(hù)大量數(shù)據(jù)所產(chǎn)生的高昂成本,在保證敏感數(shù)據(jù)安全的前提下能夠更經(jīng)濟(jì)高效地實(shí)時(shí)查詢海量氣象數(shù)據(jù)。
【專利說明】一種基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于云存儲(chǔ)【技術(shù)領(lǐng)域】,具體涉及一種基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方 法。

【背景技術(shù)】
[0002] 云計(jì)算技術(shù)起源于企業(yè)界,由于其強(qiáng)大的處理大數(shù)據(jù)的能力,成為了計(jì)算機(jī)技術(shù) 發(fā)展的趨勢(shì),因此受到了業(yè)界與學(xué)術(shù)界的關(guān)注。隨著云計(jì)算的發(fā)展,云存儲(chǔ)的重要性和價(jià)值 也日益顯著。衡量系統(tǒng)的可用性通常用系統(tǒng)的正常服務(wù)時(shí)間與總運(yùn)行時(shí)間的比值表示,即 如下計(jì)算方式:

【權(quán)利要求】
1. 一種基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法,其特征在于,包括如下步驟: 步驟(1),對(duì)不同的采集終端所收集到的氣象數(shù)據(jù)進(jìn)行歸類和校驗(yàn),去除掉錯(cuò)誤數(shù)據(jù)、 重復(fù)數(shù)據(jù); 步驟(2),按照采集的氣象數(shù)據(jù)結(jié)構(gòu),在HBase中建立對(duì)應(yīng)的表,其中,RowKey為能唯一 標(biāo)識(shí)的字符串,列簇按對(duì)應(yīng)的氣象數(shù)據(jù)的格式預(yù)先定義; 步驟(3),建立主表的同時(shí)創(chuàng)建一張索引表Index,索引表的行鍵與主表的對(duì)應(yīng)列值相 關(guān)聯(lián)并且包含主表的行鍵值; 步驟(4),導(dǎo)入數(shù)據(jù):若是已經(jīng)存在HDFS文件系統(tǒng)上的tsv,csv格式文件,則將數(shù)據(jù)封 裝成Hfile后加載到Hbase上;本地文件系統(tǒng)上的數(shù)據(jù)需要先上傳到HDFS再導(dǎo)入Hbase;對(duì) 于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的數(shù)據(jù),使用ETL工具kettle完成數(shù)據(jù)導(dǎo)入; 步驟(5),檢索數(shù)據(jù)時(shí),根據(jù)索引表信息判斷被檢索的列是否有索引,如果有則直接通 過索引表查詢;如果被檢索的列沒有索引,貝1J利用Hive通過Mapreduce框架進(jìn)行全表的查 詢。
2. 根據(jù)權(quán)利要求1所述的基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法,其特征在于:所述步 驟(2)建立的表中的列簇下面的列在數(shù)據(jù)導(dǎo)入時(shí)動(dòng)態(tài)添加。
3. 根據(jù)權(quán)利要求1或2所述的基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法,其特征在于:所 述步驟(3)中創(chuàng)建的索引表的行鍵rowkey構(gòu)成為:{:開始地址+索引表名稱+索引列值+ 主表行鍵值}。
4. 根據(jù)權(quán)利要求1或2所述的基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法,其特征在于:在 所述步驟(2)建立的主表中插入數(shù)據(jù)時(shí)先在索引表中插入相關(guān)索引信息,再完成主表插入 工作;當(dāng)主表被分割的時(shí)候,對(duì)應(yīng)索引表自動(dòng)分割,并且保證索引表的region與對(duì)應(yīng)主表 的region在同一個(gè)regionserver上;在主表數(shù)據(jù)發(fā)生更新時(shí),索引表里的對(duì)應(yīng)記錄也同 時(shí)更新。
5. 根據(jù)權(quán)利要求1或2所述的基于海量氣象數(shù)據(jù)的存儲(chǔ)與檢索方法,其特征在于:所 述步驟(5)中通過索引表查詢時(shí),通過Coprocessor創(chuàng)建scanner并設(shè)置起止范圍,在索引 表中查找到具體的rowkey之后,根據(jù)此rowkey具體關(guān)聯(lián)的主表Rowkey,在主表region中 查找實(shí)際的數(shù)據(jù)。
【文檔編號(hào)】G06F17/30GK104376053SQ201410611227
【公開日】2015年2月25日 申請(qǐng)日期:2014年11月4日 優(yōu)先權(quán)日:2014年11月4日
【發(fā)明者】馬廷淮, 徐熙超, 田偉, 薛羽, 鐘水明, 曹杰 申請(qǐng)人:南京信息工程大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
金塔县| 罗甸县| 仙桃市| 历史| 佛山市| 陵水| 竹山县| 万载县| 循化| 金秀| 安阳市| 海林市| 松江区| 丹棱县| 永嘉县| 姜堰市| 万州区| 永昌县| 东乡县| 岑巩县| 东丽区| 繁峙县| 沧州市| 小金县| 靖江市| 维西| 施秉县| 自贡市| 米脂县| 三门峡市| 德保县| 安福县| 秭归县| 凤山县| 化隆| 昭平县| 太仆寺旗| 肃北| 故城县| 耿马| 南昌县|