速记: 1. 现象: 线下有一个5个Region节点的Hbase集群(小内存),昨日全挂掉了。重启,启动不了。 2. 原因 查看错误日志,发现出发点是因为GC超时导致。 首先是其中某一个节点发生GC,连接ZK超时,连接关…
标签:挂掉
spark master和spark worker挂掉application恢复问题
首先分5中情况: 1,spark master进程挂掉了 2,spark master在执行中挂掉了 3,spark worker提交任务前全部挂掉了 4,spark worker在执行application过程中挂掉了…