基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)

ID：18355005

大小：199.50 KB

頁(yè)數(shù)：6頁(yè)

時(shí)間：2018-09-16

基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)_第1頁(yè)

基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)_第2頁(yè)

基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)_第3頁(yè)

基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)_第4頁(yè)

基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)_第5頁(yè)

資源描述：

《基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、基于HDFS的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)宋杰[1]，邢四為[1]，王磊[1]，陳林鋒[1](1.安徽大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院，安徽合肥230601)摘要：針對(duì)海量數(shù)據(jù)的存儲(chǔ)問(wèn)題，傳統(tǒng)方法一般是通過(guò)購(gòu)置更多數(shù)量的服務(wù)器來(lái)提升計(jì)算和存儲(chǔ)能力，存在硬件成本高，存儲(chǔ)效率低等缺點(diǎn)。本文旨在通過(guò)構(gòu)建基于Hadoop分布式文件系統(tǒng)的云存儲(chǔ)系統(tǒng)，解決海量數(shù)據(jù)存儲(chǔ)難題。文章首先闡述了云存儲(chǔ)的相關(guān)理論，接著對(duì)HDFS的管理機(jī)制和MapReduce編程模型進(jìn)行了分析，最后結(jié)合實(shí)際需求，設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于Hadoop的云存儲(chǔ)系

2、統(tǒng)。經(jīng)過(guò)測(cè)試，該系統(tǒng)有效的解決了海量數(shù)據(jù)存儲(chǔ)管理問(wèn)題，具有開(kāi)發(fā)成本低、處理速度快、運(yùn)行穩(wěn)定、易于擴(kuò)展等特點(diǎn)。關(guān)鍵字：Hadoop;HDFS;MapReduce;云存儲(chǔ);分布式系統(tǒng)中圖分類(lèi)號(hào)：TP306文獻(xiàn)標(biāo)志碼：A引言隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展，信息量呈爆炸性增長(zhǎng)，數(shù)據(jù)存儲(chǔ)逐漸成為制約企業(yè)發(fā)展的關(guān)鍵問(wèn)題。企業(yè)現(xiàn)有系統(tǒng)的擴(kuò)展能力差，難以滿(mǎn)足企業(yè)快速變化的業(yè)務(wù)需求[1]。傳統(tǒng)的NAS方案擴(kuò)展能力有限，并且面向企業(yè)級(jí)的NAS設(shè)備價(jià)格往往非常昂貴，購(gòu)買(mǎi)以及安裝獨(dú)立的NAS設(shè)備，將面臨著巨大的經(jīng)濟(jì)壓力和額外的

3、維護(hù)成本。作為一種新興的商業(yè)計(jì)算模型，云計(jì)算具有動(dòng)態(tài)部署的功能，可以利用廉價(jià)的服務(wù)器構(gòu)建企業(yè)級(jí)存儲(chǔ)平臺(tái)，具有更加彈性、更加安全以及更低的成本[2]。本文通過(guò)對(duì)開(kāi)源云計(jì)算平臺(tái)Hadoop的研究，提出了基于Hadoop構(gòu)建云存儲(chǔ)平臺(tái)，通過(guò)采用Linux集群技術(shù)、分布式文件系統(tǒng)和云計(jì)算框架，實(shí)現(xiàn)了海量數(shù)據(jù)存儲(chǔ)業(yè)務(wù)項(xiàng)目基金：2010安徽省自然科學(xué)基金研究項(xiàng)目（KJ2010B123）作者簡(jiǎn)介：宋杰(1966-)，男，副教授，研究方向?yàn)榍度胧较到y(tǒng)、計(jì)算機(jī)原理與接口、生物信息學(xué)；邢四為（1988-），男，碩士生，主

4、要研究方向?yàn)榍度胧较到y(tǒng)應(yīng)用。1.云存儲(chǔ)及其架構(gòu)模式1.1云存儲(chǔ)相關(guān)理論云存儲(chǔ)概念是在云計(jì)算概念上延伸和發(fā)展出來(lái)的一個(gè)新的概念。云存儲(chǔ)的本質(zhì)是服務(wù)[3][4]，云存儲(chǔ)通過(guò)計(jì)算機(jī)集群技術(shù)、網(wǎng)格技術(shù)和分布式文件系統(tǒng)等技術(shù)，將網(wǎng)絡(luò)中大量各種不同類(lèi)型的存儲(chǔ)設(shè)備組織起來(lái)協(xié)同工作，提供統(tǒng)一的數(shù)據(jù)存儲(chǔ)服務(wù)和業(yè)務(wù)訪問(wèn)功能的一種存儲(chǔ)模式[5]。云存儲(chǔ)模式比較傳統(tǒng)存儲(chǔ)模式具有如下特點(diǎn)：第一，在功能上，相比傳統(tǒng)存儲(chǔ)模式面向如高性能計(jì)算、事務(wù)處理應(yīng)用，云存儲(chǔ)模式具有面向多種類(lèi)型的網(wǎng)絡(luò)在線存儲(chǔ)服務(wù)的特點(diǎn)；第二，在性能上，云存儲(chǔ)模

5、式具有高數(shù)據(jù)安全性、高可靠性、高效率，以及適合處理大規(guī)模用戶(hù)、網(wǎng)絡(luò)環(huán)境復(fù)雜多變等業(yè)務(wù)的特點(diǎn)；第三，在數(shù)據(jù)管理功能上，云存儲(chǔ)模式需要滿(mǎn)足傳統(tǒng)文件訪問(wèn)方式，同時(shí)能夠支持海量數(shù)據(jù)管理并提供公共服務(wù)支撐功能，以方便云存儲(chǔ)系統(tǒng)后臺(tái)數(shù)據(jù)的維護(hù)[6]?；谏鲜鎏攸c(diǎn)，云存儲(chǔ)模式整體架構(gòu)自底向上依次是：數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)管理層、數(shù)據(jù)服務(wù)層以及云端應(yīng)用層。數(shù)據(jù)存儲(chǔ)層包括底層的存儲(chǔ)介質(zhì)部署、計(jì)算機(jī)集群搭建以及設(shè)備虛擬化過(guò)程；數(shù)據(jù)管理層實(shí)現(xiàn)用戶(hù)權(quán)限控制、數(shù)據(jù)安全等業(yè)務(wù)；數(shù)據(jù)服務(wù)層實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)、共享和備份業(yè)務(wù)邏輯；云端應(yīng)用層實(shí)現(xiàn)

6、用戶(hù)的定制業(yè)務(wù)[7]。1.1Hadoop框架的工作機(jī)制Hadoop為應(yīng)用程序透明的提供了一組穩(wěn)定可靠的接口。Hadoop框架的主要組成部分是Hadoop分布式文件系統(tǒng)（HDFS）和MapReduce的實(shí)現(xiàn)[8]。HDFS采用Master/Slave架構(gòu)，一個(gè)HDFS集群由一個(gè)NameNode節(jié)點(diǎn)和一組DataNode節(jié)點(diǎn)組成。NameNode是一個(gè)中心服務(wù)器，負(fù)責(zé)管理文件系統(tǒng)的名字空間（NameSpace）以及客戶(hù)端對(duì)文件的訪問(wèn)。在集群系統(tǒng)中，一般在一個(gè)節(jié)點(diǎn)上運(yùn)行一個(gè)DataNode，負(fù)責(zé)管理它所在節(jié)

7、點(diǎn)上的數(shù)據(jù)存儲(chǔ)，并負(fù)責(zé)處理文件系統(tǒng)客戶(hù)端的讀寫(xiě)請(qǐng)求，在NameNode的統(tǒng)一調(diào)度下進(jìn)行數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制。Hadoop還實(shí)現(xiàn)了Google的MapReduce分布式計(jì)算模型，MapReduce把應(yīng)用程序的總?cè)蝿?wù)分割成許多子任務(wù)，每個(gè)子任務(wù)可以在任何集群節(jié)點(diǎn)（DataNode節(jié)點(diǎn)，通常也作為計(jì)算節(jié)點(diǎn)）上并行處理。HDFS創(chuàng)建了多份數(shù)據(jù)塊（datablocks）的副本（Replicas），以保證各個(gè)子任務(wù)節(jié)點(diǎn)計(jì)算的可靠性（Reliability）。由于采用了分布式文件系統(tǒng)和MapReduce模型，因

8、此Hadoop框架具有高容錯(cuò)性及對(duì)數(shù)據(jù)讀寫(xiě)的高吞吐率，能自動(dòng)處理失敗節(jié)點(diǎn)。1.2HDFS的管理機(jī)制HDFS(HadoopDistributedFileSystem)是一個(gè)運(yùn)行在普通硬件之上的分布式文件系統(tǒng)。集群包括NameNode、SecondaryNameNode和DataNode三個(gè)部分[9]。一般來(lái)說(shuō)，集群中有一臺(tái)作為NameNode，負(fù)責(zé)整個(gè)系統(tǒng)元數(shù)據(jù)的存儲(chǔ)記錄和對(duì)整個(gè)系統(tǒng)的控制；一臺(tái)機(jī)器作為SecondaryNameNode，負(fù)責(zé)備份NameN

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 6



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問(wèn)題，請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳，版權(quán)歸屬用戶(hù)，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。

基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)

基于hdfs的云存儲(chǔ)系統(tǒng)的研究與實(shí)現(xiàn)

相關(guān)文章

相關(guān)標(biāo)簽