两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種提高h(yuǎn)dfs文件傳輸安全性和讀取效率的方法

文檔序號(hào):7804571閱讀:1050來(lái)源:國(guó)知局
一種提高h(yuǎn)dfs文件傳輸安全性和讀取效率的方法
【專(zhuān)利摘要】本發(fā)明提出一種提高HDFS文件傳輸安全性和讀取效率的方法。本發(fā)明首先通過(guò)名稱(chēng)節(jié)點(diǎn)為將要存儲(chǔ)的文件選擇的合適的塊進(jìn)行存放,在塊存儲(chǔ)于數(shù)據(jù)節(jié)點(diǎn)后,對(duì)塊文件及其備份進(jìn)行多次隨機(jī)線性網(wǎng)絡(luò)編碼。讀取文件時(shí),同時(shí)從多個(gè)塊文件中讀出字符,并進(jìn)行解碼,還原出原始文件。在整個(gè)文件傳輸和存取過(guò)程中,編碼部分由名稱(chēng)節(jié)點(diǎn)負(fù)責(zé),解碼部分在客戶(hù)端完成,信道中不會(huì)出現(xiàn)未加密的原始數(shù)據(jù),同時(shí),由于從多個(gè)節(jié)點(diǎn)同時(shí)獲取數(shù)據(jù),提高了文件的讀取效率。
【專(zhuān)利說(shuō)明】一種提高HDFS文件傳輸安全性和讀取效率的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明基于HDFS,提出了一種增強(qiáng)文件傳輸過(guò)程中的安全性,以及提高文件讀取效率的方法。
【背景技術(shù)】
[0002]由Apache 基金會(huì)所開(kāi)發(fā)的 HDFS (Hadoop Distributed File System)在面對(duì)海量文件存儲(chǔ)問(wèn)題的處理時(shí),相較于一般的存儲(chǔ)方式具有明顯優(yōu)勢(shì)。然而在云計(jì)算越來(lái)越普及的今天,用戶(hù)將自己的私人數(shù)據(jù)大量存放在云端,對(duì)于絕大部分的用戶(hù)而言,他們考慮的不再僅僅是需要這些數(shù)據(jù)時(shí)是否可以方便快捷的得到,與之相對(duì)應(yīng)的,他們將更加關(guān)注于自己數(shù)據(jù)的存放是否安全。目前針對(duì)數(shù)據(jù)加密的幾種方法中,都是以犧牲系統(tǒng)存讀取文件效率為代價(jià),并沒(méi)有同時(shí)加強(qiáng)文件安全性和讀取效率的有效方法。舉例說(shuō)明,F(xiàn)acebook作為現(xiàn)今全球最大的社交網(wǎng)站,每天將處理27億次Like按鈕的點(diǎn)擊,有3億張圖片被上傳,吸收逾500TB的新數(shù)據(jù)。這些數(shù)據(jù)中,有可能是用戶(hù)的留言,或者心情狀態(tài),也可能是一張照片或者一段視頻,其中很多都是用戶(hù)不愿公開(kāi)或者半公開(kāi)的內(nèi)容,這就要求公司在存儲(chǔ)這些數(shù)據(jù)時(shí)既要保證不泄露用戶(hù)的個(gè)人隱私,又要保證用戶(hù)在任意時(shí)刻想要查找它們時(shí)可以很快得到,這無(wú)疑是一項(xiàng)巨大的挑戰(zhàn)。本文在HDFS模型的基礎(chǔ)上,提出了一種采用網(wǎng)絡(luò)編碼和多節(jié)點(diǎn)讀取技術(shù)以增強(qiáng)文件傳輸過(guò)程中的安全性和提高文件讀取效率的方法,即利用隨機(jī)線性網(wǎng)絡(luò)編碼對(duì)存儲(chǔ)文件進(jìn)行加密,在讀取文件時(shí),同時(shí)從多個(gè)加密后的文件塊中讀取字符進(jìn)行解碼。

【發(fā)明內(nèi)容】

[0003]針對(duì)現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明在HDFS架構(gòu)的基礎(chǔ)上,采用隨機(jī)線性網(wǎng)絡(luò)編碼和多節(jié)點(diǎn)讀取的方法,在云計(jì)算平臺(tái)上建立了一套安全性好、解碼成本低、讀取效率高的分布式文件存儲(chǔ)系統(tǒng)。
[0004]本發(fā)明的發(fā)明目的是:在提高文件讀取效率的基礎(chǔ)上,能夠保證用戶(hù)的私人數(shù)據(jù)不在文件傳輸或者存儲(chǔ)的過(guò)程中被非法獲取。主要應(yīng)用于云存儲(chǔ)、網(wǎng)盤(pán)等應(yīng)用。
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:一種提高HDFS文件傳輸安全性和讀取效率的方法,本方法及系統(tǒng)主要由四個(gè)主要步驟組成。
[0006]第一個(gè)步驟為文件存儲(chǔ)階段。在這一階段中,名稱(chēng)節(jié)點(diǎn)(Namenode)根據(jù)客戶(hù)端發(fā)出的儲(chǔ)存文件請(qǐng)求,選取合適的塊(block)儲(chǔ)存文件,并建立從文件到塊和從塊到文件的映射關(guān)系,這些映射關(guān)系將作為元數(shù)據(jù)(Metadata)的一部分被存儲(chǔ)在名稱(chēng)節(jié)點(diǎn)中,以方便名稱(chēng)節(jié)點(diǎn)可以快速響應(yīng)用戶(hù)對(duì)于某個(gè)文件的查找。
[0007]第二個(gè)步驟為編碼塊文件階段。在這一階段中,名稱(chēng)節(jié)點(diǎn)對(duì)存儲(chǔ)在塊中的文件進(jìn)行隨機(jī)線性網(wǎng)絡(luò)編碼,并將編碼后的文件存儲(chǔ)在數(shù)據(jù)節(jié)點(diǎn)(Datanode)中。隨機(jī)線性網(wǎng)絡(luò)編碼是一種簡(jiǎn)單有效的網(wǎng)絡(luò)編碼方式,常用于對(duì)網(wǎng)絡(luò)數(shù)據(jù)的加密算法中,具有編碼成本低、解碼成功率高、可容錯(cuò)性強(qiáng)等特點(diǎn)。隨機(jī)線性網(wǎng)絡(luò)編碼是一種文件加密方式,非用戶(hù)本人即使使用非正常手段得到了存儲(chǔ)在數(shù)據(jù)節(jié)點(diǎn)中的塊文件,在不知道編碼方式,無(wú)法得到編碼系數(shù)的情況下,是無(wú)法通過(guò)解碼的方法還原出原始文件的,由此保證了文件存儲(chǔ)的安全性。名稱(chēng)節(jié)點(diǎn)首先選取編碼系數(shù)n(同時(shí)可以得到η個(gè)二進(jìn)制表示的編碼因子&1、a2、a^an),并選擇最小編碼單元。由編碼長(zhǎng)度決定每次從塊文件中讀取的字符串長(zhǎng)度。假設(shè)η行待編碼的字符串為Vbylvbn,則該編碼單元中,第一行至最后一行的編碼結(jié)果可以表示為:
【權(quán)利要求】
1.一種提高HDFS文件傳輸安全性和讀取效率的方法,其特征在于,包含以下步驟:步驟一、在存儲(chǔ)操作之前,名稱(chēng)節(jié)點(diǎn)對(duì)將要存儲(chǔ)的文件進(jìn)行篩選,保留單個(gè)文件大小小于62MB的文件作為有效文件,超過(guò)62MB的文件按照一般的文件方式進(jìn)行存儲(chǔ);名稱(chēng)節(jié)點(diǎn)為每個(gè)有效文件選取合適的塊儲(chǔ)存,并建立從文件到塊和從塊到文件的映射關(guān)系,這些映射關(guān)系將作為元數(shù)據(jù)的一部分被存儲(chǔ)在名稱(chēng)節(jié)點(diǎn)中; 步驟二、對(duì)存儲(chǔ)在塊中的文件進(jìn)行隨機(jī)線性網(wǎng)絡(luò)編碼,將編碼后的文件存儲(chǔ)在數(shù)據(jù)節(jié)占中.1 ? 步驟三、名稱(chēng)節(jié)點(diǎn)對(duì)已經(jīng)過(guò)編碼的塊文件再次進(jìn)行隨機(jī)線性網(wǎng)絡(luò)編碼,編碼結(jié)果作為塊文件的第一個(gè)備份保存在數(shù)據(jù)節(jié)點(diǎn)中,位置為原始的HDFS系統(tǒng)中塊文件的第一個(gè)備份的位置;名稱(chēng)節(jié)點(diǎn)對(duì)已經(jīng)過(guò)二次編碼的塊文件進(jìn)行第三次隨機(jī)線性網(wǎng)絡(luò)編碼,編碼結(jié)果作為塊文件的第二個(gè)備份保存在數(shù)據(jù)節(jié)點(diǎn)中,位置為原始的HDFS系統(tǒng)中塊文件的第二個(gè)備份的位置;如果增加備份文件的數(shù)量,由上述方法類(lèi)推可得; 步驟四、當(dāng)收到來(lái)自客戶(hù)端讀取文件的請(qǐng)求后,名稱(chēng)節(jié)點(diǎn)根據(jù)元數(shù)據(jù)中塊到文件的映射關(guān)系找出客戶(hù)端需要的文件和備份文件,客戶(hù)端每次同時(shí)從多個(gè)塊文件中讀取定長(zhǎng)的字符放入解碼矩陣中,解出原始文件;由于隨機(jī)線性網(wǎng)絡(luò)編碼解碼方法的特殊性,從不同的備份中同時(shí)讀取文件時(shí),只 要保證讀取的文件是由同一個(gè)塊文件經(jīng)的編碼得到(編碼次數(shù)可以不同),并在解碼時(shí),對(duì)放入的字符做行列變換,每次舍去線性相關(guān)部分,總會(huì)得到一個(gè)滿秩矩陣,該矩陣中的內(nèi)容即為原始文件。
【文檔編號(hào)】H04L29/08GK103986718SQ201410224697
【公開(kāi)日】2014年8月13日 申請(qǐng)日期:2014年5月23日 優(yōu)先權(quán)日:2014年5月23日
【發(fā)明者】都思丹, 馬雁楠, 于耀, 周余 申請(qǐng)人:南京大學(xué)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
建瓯市| 贡嘎县| 张家口市| 凌云县| 略阳县| 宣威市| 朝阳市| 建湖县| 绍兴县| 黄龙县| 永仁县| 繁峙县| 太原市| 墨竹工卡县| 清苑县| 萝北县| 县级市| 吉安市| 华池县| 金寨县| 宁晋县| 莒南县| 西安市| 博湖县| 友谊县| 泰和县| 宜川县| 蕉岭县| 广丰县| 凤山县| 曲阳县| 廉江市| 平陆县| 老河口市| 玛曲县| 景泰县| 林口县| 宝丰县| 镇坪县| 宁波市| 长岛县|