此篇作为“713事故”系列之第一篇,向大家简要介绍了故障产生的诱因、根因、处理过程、优化改进。
专家分析故障的时候,是根据经验与掌握的知识去做问题发现的,发现的依据是系统运行状态,指标,日志等数据。
一、MHA介绍
(一)、什么是MHA
MHA(MasterHigh Availability)是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。
MHA 的出现就是解决MySQL 单点的问题。
MySQL故障切换过程中,MHA能做
一、MHA
1、概念2、MHA 的组成3、MHA 的特点二、搭建MySQL+MHA
思路和准备工作
1、MHA架构
数据库安装
一主两从
MHA搭建
2、故障模拟
模拟主库失效
备选主库成为主库
原故障主库恢复重新加入到MHA成为从库
3
接触MGR有一段时间了,MySQL 8.0.23的到来,基于MySQL Group Replicaion(MGR)的高可用架构又提供了新的架构思路。
灾备机房的slave,如何更好的支持主机房的MGR?
MGR 到底可以坏几个节点?
这次我
故障表象:业务层面显示提示查询redis失败集群组成:3主3从,每个节点的数据有8GB机器分布:在同一个机架中,xx.x.xxx.199
xx.x.xxx.200
xx.x.xxx.201redis-server进程状态:通过命令ps -e
一:手动故障转移Redis集群支持手动故障转移。也就是向从节点发送”CLUSTER FAILOVER”命令,使其在主节点未下线的情况下,发起故障转移流程,升级为新的主节点,而原来的主节点降级为从节点。为了不丢失数据,向从节点发送”CLUS
监控硬件运行状况
shell 监控cpu,memory,load average,记录到log,当负载压力时,发电邮通知管理员。
原理:
1.获取cpu,memory,load average的数值
2.判断数值是否超过自定义的范围,例如(