我通常会严格保持此博客的技术性,将观察、意见等内容保持在最低限度。但是,这篇和接下来的几篇文章将介绍刚进入系统管理/SRE/系统工程师/sysops/devops-ops(无论你想称自己是什么)角色的常见的基础知识。 请…
标签:故障
大数据||zookeeper来实现HDFS自动故障转移
namenode启动都是standby。 利用zookeeper来选举一个为active ZooKeeper客户端ZKFC: ZKFailoverController 给namenode添加失效备缓监控器(ZKFC: Z…
redis-09-哨兵模式
[TOC] 1 哨兵模式能做什么? 在上一篇文章中介绍的redis主从复制(http://blog.csdn.net/hylexus/article/details/69360701)虽然可以达到主从复制的目的。 但是并…
记一次Mysql故障排查(lock wait timeout exceeded;try restarting transaction)
最近接了一个锅,进入新公司接手了一个进入交付阶段的项目.在code review的时候发现很多问题,然后开始修复bug. 在测试阶段突然发现几乎所有涉及到更新的操作都失败,下面贴出异常信息. 第一次出现的时候百…