當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

搭建Hadoop的HA高可用架构（超详细步骤+已验证）

發布時間：2025/3/17 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了搭建Hadoop的HA高可用架构（超详细步骤+已验证）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、集群的規劃

Zookeeper集群：

192.168.182.12 （bigdata12）
192.168.182.13 （bigdata13）
192.168.182.14 （bigdata14）

Hadoop集群：

192.168.182.12 （bigdata12） ? NameNode1主節點 ? ? ResourceManager1主節點 ? ? Journalnode
192.168.182.13 （bigdata13） ? NameNode2備用主節點 ResourceManager2備用主節點 Journalnode
192.168.182.14 （bigdata14） ? DataNode1 ? ? NodeManager1
192.168.182.15 （bigdata15） ? DataNode2 ? ? NodeManager2

二、準備工作

1、安裝JDK：每臺機器都需要安裝

我這里使用的是jdk-8u152-linux-x64.tar.gz安裝包

解壓JDK：

tar -zxvf jdk-8u144-linux-x64.tar.gz -C ~/training

2、配置環境變量:

1)配置java環境變量：

vi ~/.bash_profile export JAVA_HOME=/root/training/jdk1.8.0_144 export PATH=$JAVA_HOME/bin:$PATH

2)生效環境變量：

source ~/.bash_profile

3)驗證是否安裝成功：

java -version

3、配置IP地址與主機名的映射關系原因：方便SSH調用方便Ping通

vi /etc/hosts

輸入:

192.168.182.13 bigdata13 192.168.182.14 bigdata14192.168.182.15 bigdata15

4、配置免密碼登錄

1）在每臺機器上產生公鑰和私鑰

ssh-keygen -t rsa

含義：通過ssh協議采用非對稱加密算法的rsa算法生成一組密鑰對：公鑰和私鑰

2）在每臺機器上將自己的公鑰復制給其他機器

注：以下四個命令需要在每臺機器上都運行一遍

ssh-copy-id -i .ssh/id_rsa.pub root@bigdata12 ssh-copy-id -i .ssh/id_rsa.pub root@bigdata13 ssh-copy-id -i .ssh/id_rsa.pub root@bigdata14 ssh-copy-id -i .ssh/id_rsa.pub root@bigdata15

三、安裝Zookeeper集群（在bigdata12上安裝）

在主節點（bigdata12）上安裝和配置ZooKeeper

我這里使用的是zookeeper-3.4.10.tar.gz安裝

1、解壓Zookeeper：

tar -zxvf zookeeper-3.4.10.tar.gz -C ~/training

2、配置和生效環境變量：

export ZOOKEEPER_HOME=/root/training/zookeeper-3.4.10 export PATH=$ZOOKEEPER_HOME/bin:$PATH source ~/.bash_profile

3、修改zoo.cfg配置文件：

vi /root/training/zookeeper-3.4.10/conf/zoo.cfg

修改：

dataDir=/root/training/zookeeper-3.4.10/tmp

在最后一行添加：

server.1=bigdata12:2888:3888 server.2=bigdata13:2888:3888 server.3=bigdata14:2888:3888

4、修改myid配置文件

在/root/training/zookeeper-3.4.10/tmp目錄下創建一個myid的空文件:

mkdir /root/training/zookeeper-3.4.10/tmp/myid echo 1 > /root/training/zookeeper-3.4.10/tmp/myid

5、將配置好的zookeeper拷貝到其他節點，同時修改各自的myid文件

scp -r /root/training/zookeeper-3.4.10/ bigdata13:/root/training scp -r /root/training/zookeeper-3.4.10/ bigdata14:/root/training

進入bigdata13和bigdata14兩臺機器中，找到myid文件，將其中的1分別修改為2和3：

vi myid

在bigdata13中輸入:2在bigdata14中輸入:3

四、安裝Hadoop集群（在bigdata12上安裝）

1、修改hadoop-env.sh

export JAVA_HOME=/root/training/jdk1.8.0_144

2、修改core-site.xml

<configuration>  <property> <name>fs.defaultFS</name> <value>hdfs://ns1</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/root/training/hadoop-2.7.3/tmp</value> </property> <property> <name>ha.zookeeper.quorum</name> <value>bigdata12:2181,bigdata13:2181,bigdata14:2181</value> </property> </configuration>

3、修改hdfs-site.xml（配置這個nameservice中有幾個namenode）

<configuration>  <property> <name>dfs.nameservices</name> <value>ns1</value> </property> ?  <property> <name>dfs.ha.namenodes.ns1</name> <value>nn1,nn2</value> </property> ?  <property> <name>dfs.namenode.rpc-address.ns1.nn1</name> <value>bigdata12:9000</value> </property> ?  <property> <name>dfs.namenode.http-address.ns1.nn1</name> <value>bigdata12:50070</value> </property> ?  <property> <name>dfs.namenode.rpc-address.ns1.nn2</name> <value>bigdata13:9000</value> </property> ?  <property> <name>dfs.namenode.http-address.ns1.nn2</name> <value>bigdata13:50070</value> </property> ?  <property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://bigdata12:8485;bigdata13:8485;/ns1</value> </property> ?  <property> <name>dfs.journalnode.edits.dir</name> <value>/root/training/hadoop-2.7.3/journal</value> </property> ?  <property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property> ?  <property> <name>dfs.client.failover.proxy.provider.ns1</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property> ?  <property> <name>dfs.ha.fencing.methods</name> <value> sshfence shell(/bin/true) </value> </property> <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/root/.ssh/id_rsa</value> </property> <property> <name>dfs.ha.fencing.ssh.connect-timeout</name> <value>30000</value> </property> </configuration>

4、修改mapred-site.xml

<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>

配置Yarn的HA

5、修改yarn-site.xml

<configuration>  <property> <name>yarn.resourcemanager.ha.enabled</name> <value>true</value> </property> <property> <name>yarn.resourcemanager.cluster-id</name> <value>yrc</value> </property> <property> <name>yarn.resourcemanager.ha.rm-ids</name> <value>rm1,rm2</value> </property> <property> <name>yarn.resourcemanager.hostname.rm1</name> <value>bigdata12</value> </property> <property> <name>yarn.resourcemanager.hostname.rm2</name> <value>bigdata13</value> </property> <property> <name>yarn.resourcemanager.zk-address</name> <value>bigdata12:2181,bigdata13:2181,bigdata14:2181</value> </property><property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>

6、修改slaves 從節點的地址

bigdata14 bigdata15

7、將配置好的hadoop拷貝到其他節點

scp -r /root/training/hadoop-2.7.3/ root@bigdata13:/root/training/ scp -r /root/training/hadoop-2.7.3/ root@bigdata14:/root/training/ scp -r /root/training/hadoop-2.7.3/ root@bigdata15:/root/training/

五、啟動Zookeeper集群

在每一臺機器上輸入：

zkServer.sh start

六、啟動journalnode

在bigdata12和bigdata13兩臺節點上啟動journalnode節點：

hadoop-daemon.sh start journalnode

七、格式化HDFS和Zookeeper（在bigdata12上執行）

格式化HDFS：

hdfs namenode -format

將/root/training/hadoop-2.7.3/tmp拷貝到bigdata13的/root/training/hadoop-2.7.3/tmp下

scp -r dfs/ root@bigdata13:/root/training/hadoop-2.7.3/tmp

格式化zookeeper：

hdfs zkfc -formatZK

日志：INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/ns1 in ZK.

以上日志表明在Zookeeper的文件系統中創建了/hadoop-ha/ns1的子目錄用于保存Namenode的結構信息

八、啟動Hadoop集群（在bigdata12上執行）

啟動Hadoop集群的命令：

start-all.sh 日志： Starting namenodes on [bigdata12 bigdata13] bigdata12: starting namenode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-namenode-hadoop113.out bigdata13: starting namenode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-namenode-hadoop112.out bigdata14: starting datanode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-datanode-hadoop115.out bigdata15: starting datanode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-datanode-hadoop114.out bigdata13: starting zkfc, logging to /root/training/hadoop-2.7.3/logs/hadoop-root-zkfc- bigdata13.out bigdata12: starting zkfc, logging to /root/training/hadoop-2.7.3/logs/hadoop-root-zkfc-bigdata12.out

在bigdata13上手動啟動ResourceManager作為Yarn的備用主節點：

yarn-daemon.sh start resourcemanager

至此，Hadoop集群的HA架構就已經搭建成功。

總結

以上是生活随笔為你收集整理的搭建Hadoop的HA高可用架构（超详细步骤+已验证）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： MySQL 在高并发下的订单撮合系统
下一篇：负载（Load）分析及问题排查