hadoop-初识三(pid浅析)

1、pid说明

pid就是进程号,hadoop组件启动之后会把各自进程的进程号信息写到文件中存储,hadoop执行停止shell的时候会到该文件中查找pid,然后kill掉。

2、默认存储路径

各进程的存储路径默认是存在/tmp目录,存储格式是hadoop-用户名-进程名.pid,如下所示:

《hadoop-初识三(pid浅析)》

3、风险

/tmp是Linux的系统目录,Linux系统会自动每三十天清空/tmp目录,pid文件删除以后会导致hadoop的相关停止shell没办法停止系统(但是不影响正在运行的进程),可能会影响生产的正常运行。

4、修改存储路径

HDFS的所有进程(NameNode、DataNode、SecondaryNameNode)的pid路径由环境变量HADOOP_PID_DIR控制,可以设置全局变量或者直接修改hadoop-env.sh(注意修改前需要先停止hadoop进程,如果直接修改再重启就会发现停止报错,除非修改回去或者直接kill进程),如下所示:

《hadoop-初识三(pid浅析)》

    原文作者:刘子栋
    原文地址: https://www.jianshu.com/p/64f577851c97
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞