hadoop2.0集群的搭建方法

這篇文章主要講解了“hadoop2.0集群的搭建方法”，文中的講解內(nèi)容簡(jiǎn)單清晰，易于學(xué)習(xí)與理解，下面請(qǐng)大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“hadoop2.0集群的搭建方法”吧！

成都創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),丹陽企業(yè)網(wǎng)站建設(shè),丹陽品牌網(wǎng)站建設(shè),網(wǎng)站定制,丹陽網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營(yíng)銷,網(wǎng)絡(luò)優(yōu)化,丹陽網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè)，幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競(jìng)爭(zhēng)力。可充分滿足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿，時(shí)刻以成就客戶成長(zhǎng)自我，堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己，讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。

hadoop2.2.0集群搭建

PS：apache提供的hadoop-2.2.0的安裝包是在32位操作系統(tǒng)編譯的，

因?yàn)閔adoop依賴一些C++的本地庫，所以如果在64位的操作上安裝

hadoop-2.2.0就需要重新在64操作系統(tǒng)上重新編譯

1.準(zhǔn)備工作:(參考偽分布式搭建)

1.1修改Linux主機(jī)名

1.2修改IP

1.3修改主機(jī)名和IP的映射關(guān)系

1.4關(guān)閉防火墻

1.5ssh免登陸

1.6.安裝JDK，配置環(huán)境變量等

2.集群規(guī)劃：

hadoop2.0集群的搭建方法

PS：

在hadoop2.0中通常由兩個(gè)NameNode組成，一個(gè)處于active狀態(tài)，

另一個(gè)處于standby狀態(tài)。Active NameNode對(duì)外提供服務(wù)，

而Standby NameNode則不對(duì)外提供服務(wù)，僅同步active namenode

的狀態(tài)，以便能夠在它失敗時(shí)快速進(jìn)行切換。

hadoop2.0官方提供了兩種HDFS HA的解決方案，一種是NFS，

另一種是QJM。這里我們使用簡(jiǎn)單的QJM。在該方案中，

主備NameNode之間通過一組JournalNode同步元數(shù)據(jù)信息，

一條數(shù)據(jù)只要成功寫入多數(shù)JournalNode即認(rèn)為寫入成功。

通常配置奇數(shù)個(gè)JournalNode

這里還配置了一個(gè)zookeeper集群，用于ZKFC

（DFSZKFailoverController）故障轉(zhuǎn)移，當(dāng)Active NameNode掛

掉了，會(huì)自動(dòng)切換Standby NameNode為standby狀態(tài)

3.安裝步驟：

3.1.安裝配置zooekeeper集群

3.1.1解壓

tar -zxvf zookeeper-3.4.5.tar.gz -C /cloud/

3.1.2修改配置

cd /cloud/zookeeper-3.4.5/conf/

cp zoo_sample.cfg zoo.cfg

vim zoo.cfg

修改：dataDir=/cloud/zookeeper-3.4.5/tmp

在最后添加：

server.1=hadoop01:2888:3888

server.2=hadoop02:2888:3888

server.3=hadoop03:2888:3888

保存退出

然后創(chuàng)建一個(gè)tmp文件夾

mkdir /cloud/zookeeper-3.4.5/tmp

再創(chuàng)建一個(gè)空文件

touch /cloud/zookeeper-3.4.5/tmp/myid

最后向該文件寫入ID

echo 1 > /cloud/zookeeper-3.4.5/tmp/myid

3.1.3將配置好的zookeeper拷貝到其他節(jié)點(diǎn)(首先分別在hadoop02、

hadoop03根目錄下創(chuàng)建一個(gè)cloud目錄：mkdir /cloud)

scp -r /cloud/zookeeper-3.4.5/ hadoop02:/cloud/

scp -r /cloud/zookeeper-3.4.5/ hadoop03:/cloud/

注意：修改hadoop02、hadoop03對(duì)應(yīng)

/cloud/zookeeper-3.4.5/tmp/myid內(nèi)容

hadoop02：

echo 2 > /cloud/zookeeper-3.4.5/tmp/myid

hadoop03：

echo 3 > /cloud/zookeeper-3.4.5/tmp/myid

3.2.安裝配置hadoop集群

3.2.1解壓

tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/

3.2.2配置HDFS（hadoop2.0所有的配置文件都在

$HADOOP_HOME/etc/hadoop目錄下）

將hadoop添加到環(huán)境變量中

vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.6.0_45

export HADOOP_HOME=/cloud/hadoop-2.2.0

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

cd /cloud/hadoop-2.2.0/etc/hadoop

3.2.2.1修改hadoo-env.sh

export JAVA_HOME=/usr/java/jdk1.6.0_45

3,2.2.2修改core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/cloud/hadoop-2.2.0/tmp</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>

hadoop01:2181,hadoop02:2181,hadoop03:2181

</value>

</property>

</configuration>

3,2.2.3修改hdfs-site.xml

<!--指定hdfs的nameservice為ns1，

需要和core-site.xml中的保持一致 -->

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.ns1</name>

</property>

<name>

dfs.namenode.rpc-address.ns1.nn1

</name>

<value>hadoop01:9000</value>

</property>

<name>

dfs.namenode.http-address.ns1.nn1

</name>

<value>hadoop01:50070</value>

</property>

<name>

dfs.namenode.rpc-address.ns1.nn2

</name>

<value>hadoop02:9000</value>

</property>

<name>

dfs.namenode.http-address.ns1.nn2

</name>

<value>hadoop02:50070</value>

</property>

<!-- 指定NameNode的元數(shù)據(jù)在

JournalNode上的存放位置 -->

<name>

dfs.namenode.shared.edits.dir

</name>

<value>

qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns1

</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/cloud/hadoop-2.2.0/journal</value>

</property>

<name>

dfs.ha.automatic-failover.enabled

</name>

</property>

<name>

dfs.client.failover.proxy.provider.ns1

</name>

<value>

org.apache.hadoop.hdfs.server.namenode.ha.

ConfiguredFailoverProxyProvider

</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>

dfs.ha.fencing.ssh.private-key-files

</name>

</property>

</configuration>

3.2.2.4修改slaves

hadoop01

hadoop02

hadoop03

3.2.3配置YARN

3.2.3.1修改yarn-site.xml

<name>

yarn.resourcemanager.hostname

</name>

<value>hadoop01</value>

</property>

<!-- 指定nodemanager啟動(dòng)時(shí)加載

server的方式為shuffle server -->

<name>

yarn.nodemanager.aux-services

</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

3.2.3.2修改mapred-site.xml

<name>

mapreduce.framework.name

</name>

</property>

</configuration>

3.2.4將配置好的hadoop拷貝到其他節(jié)點(diǎn)

scp -r /cloud/hadoop-2.2.0/ hadoo02:/cloud/

scp -r /cloud/hadoop-2.2.0/ hadoo03:/cloud/

3.2.5啟動(dòng)zookeeper集群

（分別在hadoop01、hadoop02、hadoop03上啟動(dòng)zk）

cd /cloud/zookeeper-3.4.5/bin/

./zkServer.sh start

查看狀態(tài)：

./zkServer.sh status

（一個(gè)leader，兩個(gè)follower）

3.2.6啟動(dòng)journalnode（在hadoop01上啟動(dòng)所有journalnode）

cd /cloud/hadoop-2.2.0

sbin/hadoop-daemons.sh start journalnode

(運(yùn)行jps命令檢驗(yàn)，多了JournalNode進(jìn)程)

3.2.7格式化HDFS

在hadoop01上執(zhí)行命令:

hadoop namenode -format

格式化后會(huì)在根據(jù)core-site.xml中的hadoop.tmp.dir

配置生成個(gè)文件，這里我配置的是/cloud/hadoop-2.2.0/tmp，

然后將/cloud/hadoop-2.2.0/tmp拷貝到hadoop02的

/cloud/hadoop-2.2.0/下。

scp -r tmp/ hadoop02:/cloud/hadoop-2.2.0/

3.2.8格式化ZK(在hadoop01上執(zhí)行即可)

hdfs zkfc -formatZK

3.2.9啟動(dòng)HDFS(在hadoop01上執(zhí)行)

sbin/start-dfs.sh

3.3.10啟動(dòng)YARN(在hadoop01上執(zhí)行)

sbin/start-yarn.sh

到此，hadoop2.2.0配置完畢，可以統(tǒng)計(jì)瀏覽器訪問:

http://192.168.1.201:50070

NameNode 'hadoop01:9000' (active)

http://192.168.1.202:50070

NameNode 'hadoop02:9000' (standby)

驗(yàn)證HDFS HA

首先向hdfs上傳一個(gè)文件

hadoop fs -put /etc/profile /profile

hadoop fs -ls /

然后再kill掉active的NameNode

kill -9 <pid of NN>

通過瀏覽器訪問：http://192.168.1.202:50070

NameNode 'hadoop02:9000' (active)

這個(gè)時(shí)候hadoop02上的NameNode變成了active

在執(zhí)行命令：

hadoop fs -ls /

-rw-r--r-- 3 root supergroup 1926 2014-02-06 15:36 /profile

剛才上傳的文件依然存在?。?！

手動(dòng)啟動(dòng)那個(gè)掛掉的NameNode

sbin/hadoop-daemon.sh start namenode

通過瀏覽器訪問：http://192.168.1.201:50070

NameNode 'hadoop01:9000' (standby)

驗(yàn)證YARN：

運(yùn)行一下hadoop提供的demo中的WordCount程序：

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce

-examples-2.2.0.jar wordcount /profile /out

OK，大功告成?。?！

感謝各位的閱讀，以上就是“hadoop2.0集群的搭建方法”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對(duì)hadoop2.0集群的搭建方法這一問題有了更深刻的體會(huì)，具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián)，小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章，歡迎關(guān)注！

文章名稱：hadoop2.0集群的搭建方法
標(biāo)題鏈接：http://aaarwkj.com/article6/ijpgig.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供標(biāo)簽優(yōu)化、定制網(wǎng)站、網(wǎng)站收錄、品牌網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)公司、網(wǎng)站策劃

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

hadoop2.0集群的搭建方法