原文链接: http://www.nekomiao.me/2016/08/10/hadoop-without-datanode/
Hadoop在多次运行下列指令:
hadoop namenode -format sbin/start-dfs.sh |
经常会出现没有启动datanode的情况。
运行命令:
jps |
原因
当我们使用hadoop namenode -format格式化namenode时,会在namenode数据文件夹(这个文件夹为自己配置文件中dfs.name.dir的路径)中保存一个current/VERSION文件,记录clusterID,datanode中保存的current/VERSION文件中的clustreID的值是上一次格式化保存的clusterID,这样,datanode和namenode之间的ID不一致。
解决方法
第一种:如果dfs文件夹中没有重要的数据,那么删除dfs文件夹,再重新运行下列指令: (删除所有节点下的dfs文件夹,dfs目录在${HADOOP_HOME}/tmp/)
hadoop namenode -format sbin/start-dfs.sh
第二种:如果dfs文件中有重要的数据,那么在dfs/name目录下找到一个current/VERSION文件,记录clusterID并复制。然后dfs/data目录下找到一个current/VERSION文件,将其中clustreID的值替换成刚刚复制的clusterID的值即可;
总结
其实,每次运行结束Hadoop后,都应该关闭Hadoop.
sbin/stop-dfs.sh |
下次想重新运行Hadoop,不用再格式化namenode,直接启动Hadoop即可
sbin/start-dfs.sh |