Hadoop HA 配置

2019年6月9日 278次阅读来源: 虾米在海飘

在早期Hadoop1只有一个NameNode，还有一个secondary NameNode，secondary NameNode 作为冷备份，在NameNode fail的时候并不能接替NameNode的工作，即Hadoop 的单点问题，因此Hadoop 2提供了NameNode 的HA机制。
什么是HA?

即NameNode有两个，每一个都有相同的职能。一个是active状态的，一个是standby状态的。当集群运行时，只有active状态的NameNode是正常工作的，standby状态的NameNode是处于待命状态的，时刻同步active状态NameNode的数据。一旦active状态的NameNode不能工作，通过手工或者自动切换，standby状态的NameNode就可以转变为active状态的，就可以继续工作了。这就是高可靠。

从上面描述的情况，可以将HA总结出两个功能：
1. 主备NameNode 数据同步
2. 主备NameNode 故障切换

如何做到主备NameNode数据同步？
为了同步数据，新HDFS采用了一种共享机制，Quorum Journal Node（JournalNode）集群或者Nnetwork File System（NFS）进行共享。NFS是操作系统层面的，JournalNode是hadoop层面的，我们这里使用JournalNode集群进行数据共享（这也是主流的做法）。如下图所示，便是JournalNode的架构图。

《Hadoop HA 配置》 JournalNode

两个NameNode为了数据同步，通过一组称作JournalNodes的独立进程进行相互通信。当active状态的NameNode的命名空间有任何修改时，会告知大部分的JournalNodes进程。standby状态的NameNode有能力读取JNs中的变更信息，并且一直监控edit log的变化，把变化应用于自己的命名空间。standby可以确保在集群出错时，命名空间状态已经完全同步了。
在 hdfs-site.xml 添加JournalNodes的配置：

<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://nn1ss:8485;nn2ss:8485;nn3ss:8485/hadoopQjournalDir</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/data/dfs/jn</value>
</property>

如何做到主备NameNode故障切换？
对于HA集群而言，确保同一时刻只有一个NameNode处于active状态是至关重要的。否则，两个NameNode的数据状态就会产生分歧，可能丢失数据，或者产生错误的结果。为了保证这点，这就需要利用使用ZooKeeper了。首先HDFS集群中的两个NameNode都在ZooKeeper中注册，当active状态的NameNode出故障时，ZooKeeper能检测到这种情况，它就会自动把standby状态的NameNode切换为active状态。

《Hadoop HA 配置》 FailoverController

** 自动切换流程简介：**FailoverController ActiveFailoverController Standby 分别作为zk集群在namenode集群的代理代理人感知到namenode集群出现了问题后，zk集群会通过代理人FailoverController将amenode集群中standby状态改为active
自动切换ha集群图如下：
FailoverController服务是zk的代理，内嵌在namenode服务中，接收zk的监督，
当某个namenode挂掉后，zk会通过shell脚本启动namenode standby节点变成active节点。

在core-site.xml 中添加zk:

<property>
<name>ha.zookeeper.quorum</name> —— 配置zk集群
<value>nn1ss:2181,nn2ss:2181,nn3ss:2181</value>
<description>
A list of ZooKeeper server addresses, separated by commas, that are
to be used by the ZKFailoverController in automatic failover.
</description>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
<description>
Whether automatic failover is enabled. See the HDFS High
Availability documentation for details on automatic HA
configuration.
</description>
</property>

还有最重要的配置，表明主备NameNode的分别为nn1、nn2：

<property>
<name>dfs.ha.namenodes.hadoop</name>
<value>nn1,nn2</value>
<description>
The prefix for a given nameservice, contains a comma-separated
list of namenodes for a given nameservice (eg EXAMPLENAMESERVICE).
</description>
</property>
<property>
<name>dfs.namenode.rpc-address.hadoop.nn1</name>
<value>nn1ss:8020</value>
</property>
<property>
<name>dfs.namenode.rpc-address.hadoop.nn2</name>
<value>nn2ss:8020</value>
</property>
<property>
<name>dfs.namenode.http-address.hadoop.nn1</name>
<value>nn1ss:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.hadoop.nn2</name>
<value>nn2ss:50070</value>
</property>

参考：
http://chengjianxiaoxue.iteye.com/blog/2174940
http://www.open-open.com/lib/view/open1436855630959.html
https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

    原文作者：虾米在海飘
    原文地址: https://www.jianshu.com/p/33cbdf7a8145
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。