hadoop2.0中namenode ha如何配置

这篇文章将为大家详细讲解有关 hadoop2.0 中 namenode ha 如何配置，丸趣 TV 小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

hdfs 的 ha，主要的问题是 active 和 standby 的元数据信息同步问题，之前的解决方案有 avatar 等一系列。共享存储可以采用 NFS，bookkeeper 等相关存储。在这里我们采用 Journal 来实现共享存储，主要是因为配置简单。

虚拟机准备：三台，列表如下：

机器名

功能

master1

namenode(active),JournalNode,zookeeper

192.168.6.171

master2

namenode,JournalNode,zookeeper

192.168.6.172

datanode1

datanode,JournalNode,zookeeper

192.168.6.173

软件版本:hadoop 2.4.1 zookeeper3.4.6

下载 hadoop2.4.1 后，解压，解压 zookeeper

第一步先配置 zookeeper 集群

将 zookeeper 解压后的文件夹下的 conf 下的 zoo_sample.cfg 重命名为 zoo.cfg

修改配置

dataDir=/cw/zookeeper/ 我这里修改为 /cw/zookeeper/ 确保该文件夹存在

在该文件尾部添加集群配置

server.1=192.168.6.171:2888:3888

server.2=192.168.6.172:2888:3888

server.3=192.168.6.173:2888:3888

将修改后的 zookeeper 文件夹分发到其他两台机器上

scp -r zookeeper-3.4.6 root@192.168.6.172:/cw/

scp -r zookeeper-3.4.6 root@192.168.6.173:/cw/

配置每台机器的 pid

在 192.168.6.171 机器上执行

echo 1 /cw/zookeeper/myid

在 192.168.6.172 机器上执行

echo 2 /cw/zookeeper/myid

在 192.168.6.173 机器上执行

echo 3 /cw/zookeeper/myid

启动 zookeeper，每台分别执行

./zkServer.sh start

都启动完成后，可以通过查看日志确认是否启动 OK，或者执行 ./zkServer.sh status 来查看每一个节点的状态。

————————————————— 华立分割 hadoop 开始 —————————————————————————- 配置 hadoop 的相关参数

hadoop-env.sh 主要配置 java_home 的路径

core-site.xml 配置内容如下

configuration

property

name fs.defaultFS /name

value hdfs://myhadoop /value

myhadoop 是 namespace 的 id

/property

property

name io.file.buffer.size /name

value 131072 /value

/property

property

name ha.zookeeper.quorum /name

value 192.168.6.171,192.168.6.172,192.168.6.173 /value

/property

/configuration

修改 hdfs-site.xml

configuration

property

name dfs.nameservices /name

value myhadoop /value 对应之前的 namespace

description

Comma-separated list of nameservices.

as same as fs.defaultFS in core-site.xml.

/description

/property

property

name dfs.ha.namenodes.myhadoop /name

value nn1,nn2 /value 每一个 nn 的 id 编号

description

The prefix for a given nameservice, contains a comma-separated

list of namenodes for a given nameservice (eg EXAMPLENAMESERVICE).

/description

/property

property

name dfs.namenode.rpc-address.myhadoop.nn1 /name

value 192.168.6.171:8020 /value

description

RPC address for nomenode1 of hadoop-test

/description

/property

property

name dfs.namenode.rpc-address.myhadoop.nn2 /name

value 192.168.6.172:8020 /value

description

RPC address for nomenode2 of hadoop-test

/description

/property

property

name dfs.namenode.http-address.myhadoop.nn1 /name

value 192.168.6.171:50070 /value

description

The address and the base port where the dfs namenode1 web ui will listen on.

/description

/property

property

name dfs.namenode.http-address.myhadoop.nn2 /name

value 192.168.6.172:50070 /value

description

The address and the base port where the dfs namenode2 web ui will listen on.

/description

/property

property

name dfs.namenode.servicerpc-address.myhadoop.n1 /name

value 192.168.6.171:53310 /value

/property

property

name dfs.namenode.servicerpc-address.myhadoop.n2 /name

value 192.168.6.172:53310 /value

/property

下部分为对应的文件存储目录配置

property

name dfs.namenode.name.dir /name

value file:///cw/hadoop/name /value

description Determines where on the local filesystem the DFS name node

should store the name table(fsimage). If this is a comma-delimited list

of directories then the name table is replicated in all of the

directories, for redundancy. /description

/property

property

name dfs.namenode.shared.edits.dir /name

value qjournal://192.168.6.171:8485;192.168.6.172:8485;192.168.6.173:8485/hadoop-journal /value

description A directory on shared storage between the multiple namenodes

in an HA cluster. This directory will be written by the active and read

by the standby in order to keep the namespaces synchronized. This directory

does not need to be listed in dfs.namenode.edits.dir above. It should be

left empty in a non-HA cluster.

/description

/property

property

name dfs.datanode.data.dir /name

value file:///cw/hadoop/data /value

description Determines where on the local filesystem an DFS data node

should store its blocks. If this is a comma-delimited

list of directories, then data will be stored in all named

directories, typically on different devices.

Directories that do not exist are ignored.

/description

/property

property

name dfs.ha.automatic-failover.enabled /name

value true /value

description

Whether automatic failover is enabled. See the HDFS High

Availability documentation for details on automatic HA

configuration.

/description

/property

property

name dfs.journalnode.edits.dir /name

value /cw/hadoop/journal/ /value

/property

property

name dfs.client.failover.proxy.provider.myhadoop /name

value org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider /value

/property

property

name dfs.ha.fencing.methods /name

value sshfence /value

/property

property

name dfs.ha.fencing.ssh.private-key-files /name

value /home/yarn/.ssh/id_rsa /value

description the location stored ssh key /description

/property

property

name dfs.ha.fencing.ssh.connect-timeout /name

value 1000 /value

/property

property

name dfs.namenode.handler.count /name

value 8 /value

/property

/configuration

以上所涉及的文件夹需要手工建立，如不存在会出现异常。

以后配置完成后，将配置好的 hadoop 分发到所有集群节点。同时每一个节点建立需要的文件夹。

下面开始格式化 zk 节点，执行：./hdfs zkfc -formatZK

执行完毕后，启动 ZookeeperFailoverController，用来监控主备节点的状态。

./hadoop-daemon.sh start zkfc 一般在主备节点启动就可以

下一步启动共享存储系统 JournalNode
在各个 JN 节点上启动：hadoop-daemon.sh start journalnode

下一步，在主 NN 上执行./hdfs namenode -format 格式化文件系统

执行完毕后启动主 NN./hadoop-daemon.sh start namenode

在备用 NN 节点先同步 NN 的元数据信息，执行./hdfs namenode -bootstrapStandby

同步完成后，启动备用 NN ./hadoop-daemon.sh start namenode

由于 zk 已经自动选择了一个节点作为主节点，这里不要手工设置。如想手工设置主备 NN 可以执行

./hdfs haadmin -transitionToActive nn1

启动所有的 datanode

分别打开 192.168.6.171:50070 和 192.168.6.172:50070

可以执行相关的 hdfs shell 命令来验证集群是否正常工作。

下面来 kill 掉主节点的 NN

kill -9 135415

可以看到已经成功切换。

关于“hadoop2.0 中 namenode ha 如何配置”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。