HDFS概念
數(shù)據(jù)塊
NameNode
DataNode
成都創(chuàng)新互聯(lián),是成都地區(qū)的互聯(lián)網(wǎng)解決方案提供商,用心服務(wù)為企業(yè)提供網(wǎng)站建設(shè)、成都app軟件開(kāi)發(fā)、微信小程序、系統(tǒng)按需開(kāi)發(fā)網(wǎng)站和微信代運(yùn)營(yíng)服務(wù)。經(jīng)過(guò)數(shù)10年的沉淀與積累,沉淀的是技術(shù)和服務(wù),讓客戶少走彎路,踏實(shí)做事,誠(chéng)實(shí)做人,用情服務(wù),致力做一個(gè)負(fù)責(zé)任、受尊敬的企業(yè)。對(duì)客戶負(fù)責(zé),就是對(duì)自己負(fù)責(zé),對(duì)企業(yè)負(fù)責(zé)。
數(shù)據(jù)塊:抽象塊而非整個(gè)文件作為存儲(chǔ)單;默認(rèn)大小64MB一般設(shè)置為128M,備份X3。
NameNode:管理文件系統(tǒng)的命名空間,存放文件元數(shù)據(jù);維護(hù)著文件系統(tǒng)的所有文件和目錄,文件與數(shù)據(jù)塊的映射;記錄每個(gè)文件中各個(gè)塊所在數(shù)據(jù)節(jié)點(diǎn)的信息。
DataNode:存儲(chǔ)并檢索數(shù)據(jù)塊;向NameNode更新所存儲(chǔ)塊的列表。
1、HDFS模塊
HDFS負(fù)責(zé)大數(shù)據(jù)的存儲(chǔ),通過(guò)將大文件分塊后進(jìn)行分布式存儲(chǔ)方式,突破了服務(wù)器硬盤大小的限制,解決了單臺(tái)機(jī)器無(wú)法存儲(chǔ)大文件的問(wèn)題,HDFS是個(gè)相對(duì)獨(dú)立的模塊,可以為YARN提供服務(wù),也可以為HBase等其他模塊提供服務(wù)。
2、YARN模塊
YARN是一個(gè)通用的資源協(xié)同和任務(wù)調(diào)度框架,是為了解決Hadoop1.x中MapReduce里NameNode負(fù)載太大和其他問(wèn)題而創(chuàng)建的一個(gè)框架。
YARN是個(gè)通用框架,不止可以運(yùn)行MapReduce,還可以運(yùn)行Spark、Storm等其他計(jì)算框架。
3、MapReduce模塊
MapReduce是一個(gè)計(jì)算框架,它給出了一種數(shù)據(jù)處理的方式,即通過(guò)Map階段、Reduce階段來(lái)分布式地流式處理數(shù)據(jù)。它只適用于大數(shù)據(jù)的離線處理,對(duì)實(shí)時(shí)性要求很高的應(yīng)用不適用。
1、客戶端想NameNode發(fā)起寫(xiě)數(shù)據(jù)請(qǐng)求
2、分塊寫(xiě)入DataNode節(jié)點(diǎn),DataNode自動(dòng)完成副本備份
3、DataNode向NameNode匯報(bào)存儲(chǔ)完成,NameNode通知客戶端
1、客戶端向NameNode發(fā)起讀數(shù)據(jù)請(qǐng)求
2、NameNode找出距離最近的DataNode節(jié)點(diǎn)信息
3、客戶端從DataNode分塊下載文件
MapReduce是一種編程模型,是一種編程方法,是抽象的理論。
MapReduce四個(gè)階段
- 輸入一個(gè)大文件,通過(guò)split之后將其分為多個(gè)分片
- 每個(gè)文件分片由單獨(dú)的機(jī)器去處理,這就是Map方法
- 將各個(gè)機(jī)器計(jì)算的結(jié)果進(jìn)行匯總并得到最終的結(jié)果,這就是Reduce方法。
文章標(biāo)題:Hadoop相關(guān)概念
路徑分享:http://aaarwkj.com/article30/igsepo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信公眾號(hào)、手機(jī)網(wǎng)站建設(shè)、商城網(wǎng)站、網(wǎng)站建設(shè)、ChatGPT、做網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)