當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

HA高可用完全分布式集群 HDFS搭建

發(fā)布時間：2023/12/19 编程问答 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 HA高可用完全分布式集群 HDFS搭建小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

HDFS HA 需要設置靜態(tài)IP、安裝 jdk、設置ssh無密碼登錄、安裝zookeeper、安裝hadoop。

在Hadoop2.X之前，Namenode是HDFS集群中可能發(fā)生單點故障的節(jié)點，每個HDFS集群只有一個namenode，一旦這個節(jié)點不可用，則整個HDFS集群將處于不可用狀態(tài)。

HDFS高可用（HA）方案就是為了解決上述問題而產(chǎn)生的，在HA HDFS集群中會同時運行兩個Namenode，一個作為活動的Namenode（Active），一個作為備份的Namenode（Standby）。備份的Namenode的命名空間與活動的Namenode是實時同步的，所以當活動的Namenode發(fā)生故障而停止服務時，備份Namenode可以立即切換為活動狀態(tài)，而不影響HDFS集群服務。

下面是大家過程，我將整個過程分步詳細整理了，這樣能夠更詳細的展示。

服務器名稱進程

hadoop01	QuorumPeerMain、NameNode、DataNode、JournalNode、ResourceManager、NodeManager、DFSZKFailoverController、
hadoop02	QuorumPeerMain、NameNode、DataNode、JournalNode、DFSZKFailoverController 、NodeManager
hadoop03	QuorumPeerMain、DataNode、JournalNode、NodeManager

1、設置靜態(tài)IP

設置靜態(tài)IP
https://blog.csdn.net/weixin_42119153/article/details/100124300#commentBox

2、安裝jdk

安裝jdk
https://blog.csdn.net/weixin_42119153/article/details/100125845

3、設置ssh無密碼登錄

普通hdfs集群實現(xiàn)鏈接里面的一臺虛擬機（master即namenode所在機器）無密碼登錄其他虛擬機就可以，
搭建HA高可用需要其他的namenode所在機器也能夠無密碼登錄其他虛擬機，所以要在另一臺namenode上都重復下面的操作
設置ssh無密碼登錄
https://blog.csdn.net/weixin_42119153/article/details/100126037

4、安裝zookeeper

1）新建zookeeper安裝目錄

[hadoop@hadoop01 app]$ mkdir zookeeper

2）將下載的安裝包上傳至目錄下并解壓

[hadoop@hadoop01 zookeeper]$ tar -zxvf apache-zookeeper-3.5.5-bin.tar.gz

3）修該解壓后的目錄便于使用

[hadoop@hadoop01 zookeeper]$ mv apache-zookeeper-3.5.5-bin zookeeper3.5

[hadoop@hadoop01 zookeeper]$ mkdir zkdata

5）在zkdata目錄新建myid文件并輸入數(shù)據(jù)1

[hadoop@hadoop01 zkdata]$ vi myid

6）復制配置文件zoo_sample.cfg為zoo.cfg并編輯

[hadoop@hadoop01 conf]$ cp zoo_sample.cfg zoo.cfg [hadoop@hadoop01 conf]$ vi zoo.cfg

修改其中dataDir路徑為zhdata并添加server

dataDir=/home/app/zookeeper/zkdata server.1=192.168.146.210:2888:3888 server.2=192.168.146.211:2888:3888 server.3=192.168.146.212:2888:3888

上述三個server地址即三臺虛擬機ip，第一個端口2888為QuorumPeerMain服務端口，3888端口為leader選舉端口。
7）將整個zookeeper文件加scp到其他兩臺虛擬機同樣位置，并分別修改myid文件內容為2，3

[hadoop@hadoop01 app]$scp -r zookeeper/ hadoop@hadoop02:/home/hadoop/app/hdfs/zookeeper/

8）因為三臺虛擬機的zookeeper都需要啟動，為了方便我們寫在bin目錄下一個啟動三臺虛擬機的shell腳本start-ZK.sh

[hadoop@hadoop01 bin]$ vi start-ZK.sh

#!/bin/bashecho "Starting zkServer ..."hostname="hadoop01 hadoop02 hadoop03" #虛擬機名寫自己的for name in $hostnamedossh $name "source /etc/profile; /home/app/zookeeper/zookeeper3.5/bin/zkServer.sh start" #目錄修改為自己的done

9)在bin目錄下執(zhí)行start-ZK.sh腳本，啟動zookeeper集群

[hadoop@hadoop01 bin]$ sh start-ZK.sh

使用jps查看啟動狀態(tài)：

[hadoop@hadoop01 bin]$ jps

三臺機器均啟動成功，zookeeper安裝配置完畢。

5、安裝hadoop

1、解壓hadoop-2.7.7.tar.gz

1）將下載的hadoop-2.7.7.tar.gz上傳至/home/hadoop 目錄
2）解壓

[hadoop@hadoop01 ~]$ tar -zxvf hadoop-2.7.7.tar.gz

解壓完成：

3）使用 root 用戶配置 hadoop 環(huán)境變量（三臺機器都要配置）

[root@hadoop01 hadoop2.7]# vi /etc/profile

使配置生效

[root@hadoop01 hadoop]# source /etc/profile

4）配置hosts映射（三臺機器都要配置）

[root@hadoop01 hadoop2.7]# vi /etc/hosts

2、配置 hadoop 文件中相應的文件

這里使用的是hadoop用戶
需要配置的文件如下，core-site.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml、yarn-site.xml 所有的文件配置均位于hadoop2.7.1/etc/hadoop下面，具體需要的配置如下：
1）配置core-site.xml

[hadoop@hadoop01 hadoop]$ vi core-site.xml <configuration><property><name>fs.defaultFS</name><value>hdfs://hf</value> </property><property><name>hadoop.tmp.dir</name><value>/home/hadoop/app/hdfs/hadoop/hadoop-2.7.7/tmp</value></property><property><name>ha.zookeeper.quorum</name><value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value></property></configuration>

在/home/hadoop/app/hdfs/hadoop/hadoop-2.7.7/ 目錄下新建文件夾tmp
注意：hadoop.tmp.dir是hadoop 文件系統(tǒng)依賴的配置文件。默認是在 /tmp 目錄下的，而這個目錄下的文件，在Linux系統(tǒng)中，重啟之后，很多都會被清空。所以我們要手動指定這寫文件的保存目錄。
這個目錄路徑要么不存在，hadoop啟動的時候會自動幫我們創(chuàng)建；要么是一個空目錄，不然在啟動的時候會報錯。

2）配置hadoop-env.sh

[hadoop@hadoop01 hadoop]$ vi hadoop-env.sh

設置 JAVA_HOME 為自己在系統(tǒng)中安裝的 JDK 目錄

3）配置hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration><property><name>dfs.namenode.name.dir</name><value>/home/hadoop/app/hdfs/hadoop/name</value></property><property><name>dfs.datanode.data.dir</name><value>/home/hadoop/app/hdfs/hadoop/data</value></property><property><name>dfs.replication</name><value>3</value></property><property><name>dfs.nameservices</name><value>hf</value></property><property><name>dfs.ha.namenodes.hf</name><value>namenode01,namenode02</value></property> <property><name>dfs.namenode.rpc-address.hf.namenode1</name><value>hadoop01:9000</value></property><property><name>dfs.namenode.rpc-address.hf.namenode2</name><value>hadoop02:9000</value></property> <property><name>dfs.namenode.http-address.hf.namenode1</name><value>hadoop01:50070</value></property><property><name>dfs.namenode.http-address.hf.namenode2</name><value>hadoop02:50070</value></property><property><name>dfs.namenode.shared.edits.dir</name><value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/hf</value></property><property><name>dfs.journalnode.edits.dir</name><value>/home/hadoop/app/hdfs/hadoop/journaldata</value></property> <property><name>dfs.ha.automatic-failover.enabled</name><value>true</value></property><property><name>dfs.client.failover.proxy.provider.hf</name><value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value></property>  <property><name>dfs.ha.fencing.methods</name><value>sshfence</value></property><property><name>dfs.ha.fencing.ssh.private-key-files</name><value>/home/hadoop/.ssh/id_rsa</value></property> <property><name>dfs.ha.fencing.ssh.connect-timeout</name><value>30000</value></property> </configuration>

4）配置mapred-site.xml

<configuration> <property><name>mapreduce.framework.name</name><value>yarn</value> </property><property><name>mapreduce.jobhistory.address</name><value>hadoop01:10020</value> </property><property><name>mapreduce.jobhistory.webapp.address</name><value>hadoop01:19888</value></property></configuration>

5）配置yarn-site.xml

<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value> </property><property><name>yarn.resourcemanager.address</name><value>hadoop01:8032</value> </property><property><name>yarn.resourcemanager.scheduler.address</name><value>hadoop01:8030</value> </property><property><name>yarn.log-aggregation-enable</name><value>true</value> </property><property><name>yarn.resourcemanager.resource-tracker.address</name><value>hadoop01:8031</value></property><property><name>yarn.resourcemanager.admin.address</name><value>hadoop01:8033</value></property><property><name>yarn.resourcemanager.webapp.address</name><value>hadoop01:8088</value> </property><property><name>yarn.resourcemanager.ha.enabled</name><value>true</value></property> <property><name>yarn.resourcemanager.cluster-id</name><value>yrc</value> </property> <property><name>yarn.resourcemanager.ha.rm-ids</name><value>rm1,rm2</value> </property> <property><name>yarn.resourcemanager.hostname.rm1</name><value>hadoop01</value> </property><property><name>yarn.resourcemanager.hostname.rm2</name><value>hadoop02</value></property><property><name>yarn.resourcemanager.webapp.address.rm1</name><value>hadoop01:8088</value> </property>  <property><name>yarn.resourcemanager.webapp.address.rm2</name><value>hadoop02:8088</value> </property><property><name>yarn.resourcemanager.zk-address</name><value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value></property> </configuration>

6）配置/etc/hadoop目錄下的slaves，刪除默認的localhost，增加3個從節(jié)點

[hadoop@hadoop01 hadoop]$ vi slaves

3、將配置好的 hadoop 文件上傳給其它兩臺機器

[hadoop@hadoop01 hadoop]$ scp -r hadoop-2.7.7/ hadoop@hadoop03:/home/hadoop/app/hdfs/hadoop [hadoop@hadoop01 hadoop]$ scp -r hadoop-2.7.7/ hadoop@hadoop02:/home/hadoop/app/hdfs/hadoop

4、啟動 hadoop

1）啟動zk(三臺)
因為沒有配置zookeeper得環(huán)境變量，我把之前寫的zookeeper得啟動腳本放在hadoop啟動腳本目錄中，方便一起啟用：
需要修改腳本權限為 755

[hadoop@hadoop01 bin]$ cp start-ZK.sh /home/hadoop/app/hdfs/hadoop/hadoop-2.7.7/sbin/start-ZK.sh [hadoop@hadoop01 sbin]$ chmod 755 start-ZK.sh

啟動zookeeper

[hadoop@hadoop01 bin]$ start-ZK.sh

jps查看進程

[root@hadoop01 bin]# jps

2）啟動journalnode服務（三臺）

[hadoop@hadoop01 bin]$ hadoop-daemon.sh start journalnode

jps查看

3）挑選兩個namenode之中的一臺來格式化

[hadoop@hadoop01 hadoop]$ hdfs namenode -format

4）然后啟動namenode

[hadoop@hadoop01 hadoop]$ hadoop-daemon.sh start namenode

5）在另一臺namenode的機子上拉取元數(shù)據(jù)

[hadoop@hadoop02 hadoop]$ hdfs namenode -bootstrapStandby

6）格式化zkfc(在兩個namenode節(jié)點)

[hadoop@hadoop01 hadoop]$ hdfs zkfc -formatZK

7）啟動集群

[hadoop@hadoop01 hadoop]$ start-all.sh

jps查看

完成安裝！！！

注：以后啟動只需要執(zhí)行start-ZK.sh 和 start-all.sh 即可！！！

總結

以上是生活随笔為你收集整理的HA高可用完全分布式集群 HDFS搭建的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：泰山游客爆满！从山脚堵到山顶网友：熟悉
下一篇：因航班延误缺考复试考研生崩溃大哭称对不