答案:监控MySQL主从同步需检查复制线程状态、延迟及错误。1. 执行SHOW SLAVE STATUS,确认Slave_IO_Running和Slave_SQL_Running为Yes,无Last_Error;2. 关注Seconds_Behind_Master判断延迟;3. 使用pt-heartbeat工具精准检测延迟;4. 集成监控系统设置告警,确保同步稳定。

监控 MySQL 主从同步的健康状况,关键是检查复制线程状态、延迟情况以及是否有错误发生。以下是几个实用的方法和命令,帮助你及时发现并处理主从同步问题。
1. 检查从库复制线程状态
在从库上执行 SHOW SLAVE STATUS 命令,查看关键字段:
- Slave_IO_Running:应为 Yes,表示从库正在从主库读取 binlog。
- Slave_SQL_Running:应为 Yes,表示从库正在执行中继日志中的 SQL。
- Last_Error 和 Last_IO_Error:如果有错误,会在这里显示具体信息。
如果任一线程为 No,说明复制中断,需进一步排查网络、权限或数据冲突问题。
2. 监控复制延迟(Seconds_Behind_Master)
在 SHOW SLAVE STATUS 的输出中,关注:
- Seconds_Behind_Master:表示从库落后主库的时间(秒)。
数值为 0 表示同步正常;持续增长说明存在延迟。注意:该值在某些场景下可能不准(如SQL线程停止),需结合其他指标判断。
3. 使用 pt-heartbeat(推荐用于精确延迟检测)
Percona Toolkit 中的 pt-heartbeat 可以更准确地测量复制延迟:
- 在主库运行:定期向一张表插入时间戳。
- 在从库运行:读取该时间戳,计算与当前时间差。
相比 Seconds_Behind_Master,它不受 SQL 线程暂停影响,适合高精度监控。
4. 设置自动化监控告警
将上述检查集成到监控系统中,例如:
- 用脚本定时执行 SHOW SLAVE STATUS,解析关键字段。
- 发现 IO/SQL 线程非 Yes,或延迟超过阈值(如 60 秒),触发邮件或短信告警。
- 可使用 Prometheus + MySQL Exporter + Grafana 实现可视化监控。
基本上就这些。定期检查、设置告警、配合 pt-heartbeat,能有效保障主从同步稳定运行。










