0

0

SQL Grafana 的数据库慢查询 dashboard 与告警规则设计

舞姬之光

舞姬之光

发布时间:2026-02-22 21:11:03

|

759人浏览过

|

来源于php中文网

原创

应优先用 performance_schema.events_statements_summary_by_digest 替代 slow_log 表,通过 digest_text 归一化 sql、avg_timer_wait 计算平均耗时、count_star 统计频次,并结合 avg_over_time() 告警与正确分母计算慢查占比,确保指标可溯源。

sql grafana 的数据库慢查询 dashboard 与告警规则设计

如何让 Grafana 从 MySQL 慢查询日志里实时拉出有效指标

直接读 slow_log 表或解析日志文件是常见做法,但容易卡在权限、格式和延迟上。MySQL 5.7+ 默认关闭 slow_query_log,且 log_output='TABLE' 时,mysql.slow_log 是 CSV 引擎表,不支持索引 —— 查询一多就超时。

  • 先确认开启方式:SET GLOBAL slow_query_log = ON,并设 long_query_time = 1(别用 0,会吞掉所有查询)
  • log_output 推荐设为 'FILE',再用 pt-query-digest 定期解析日志生成汇总表(如 slow_summary_by_digest),Grafana 只查这张表
  • 避免直连 mysql.slow_log:它默认无主键、无索引、每行都是 TEXT 字段,Grafana 做 GROUP BY 或时间范围筛选时极易 OOM
  • 如果必须用 FILE 输出,确保日志路径对 MySQL 用户可读,且 Grafana 数据源用户有对应文件系统访问权限(比如用 Telegraf + exec 插件中转)

Grafana 中怎么写 SQL 查询才能让慢查询 TopN 不失真

“最慢的 10 条”和“出现最多的 10 类”是两类不同需求,SQL 写法稍错,图表就完全跑偏。尤其当 sql_text 被截断、参数被脱敏后,靠字符串匹配去聚合会漏掉同构查询。

  • DIGEST_TEXT(来自 performance_schema.events_statements_summary_by_digest)代替原始 sql_text:它自动归一化参数,SELECT * FROM users WHERE id = ?SELECT * FROM users WHERE id = 123 算同一类
  • TopN 响应时间:查 AVG_TIMER_WAIT / 1000000000000(转成秒),排序前加 HAVING COUNT_STAR > 5 过滤偶发噪声
  • TopN 执行频次:用 COUNT_STAR,但注意 first_seen/last_seen 时间戳要参与过滤,否则历史冷查询会挤掉近期热点
  • 别在 Grafana 查询里用 LIKE '%WHERE%' 去筛条件 —— DIGEST_TEXT 已标准化,直接分组即可

告警规则里为什么 avg_over_time() 比 rate() 更适合慢查询触发

慢查询不是持续发生的流指标,而是离散事件。用 rate() 会把单次 5 秒查询摊薄成每秒 0.001 次,根本触不到阈值;而 avg_over_time() 能真实反映窗口内平均耗时是否越界。

星绘
星绘

豆包旗下 AI 写真、P 图、换装和视频生成

下载
  • 推荐表达式:avg_over_time(mysql_slow_queries_duration_seconds[15m]) > 2,表示过去 15 分钟平均慢查询耗时超 2 秒
  • 避免用 count_over_time() 直接数条数 —— 如果某分钟突增 20 条 1.1 秒查询,平均仍低于 2 秒,但已暴露应用层压力,此时应结合 max_over_time() 补充告警
  • MySQL 自身不暴露原生 Prometheus 指标,需通过 mysqld_exporter 采集。确认它启用了 --collect.global_status --collect.info_schema.processlist,否则 mysql_slow_queries_duration_seconds 根本不存在
  • 告警 label 别只写 instance,加上 digest_text(需 exporter 支持 --collect.perf_schema.events_statements_digests)才能定位到具体 SQL 模板

为什么 dashboard 里 “慢查询占比” 曲线总跳变、不可信

分母选错是主因。用 com_select + com_update + ... 当总查询量,漏掉了 prepared statement、存储过程调用、甚至 ping 请求;更糟的是,这些状态变量是全局累计值,差值计算受服务重启干扰。

  • 正确分母:用 performance_schema.events_statements_summary_global_by_event_name 中的 COUNT_STAR 总和,它包含所有语句类型,且支持按时间窗口重置
  • 分子:同源表中 events_statements_summary_by_digestTIMER_WAIT > 1000000000000(1 秒)的 COUNT_STAR 求和
  • 别在 Grafana 里做除法运算 —— 先在 SQL 层算好 ROUND(100.0 * slow_cnt / total_cnt, 2),否则浮点精度和空值会让曲线断崖式下跌
  • 如果用 mysqld_exporter,它的 mysql_global_status_questions 是个近似替代,但要注意它不含 COM_PINGCOM_STMT_PREPARE,误差可能达 15%+

慢查询监控真正难的不是画图,而是让每一行数据都经得起反向溯源 —— 你点开告警里的那条 SQL,得能立刻在 performance_schema 里找到对应 digest、执行计划、锁等待链。这要求从日志采集、指标建模到查询归一,每层都对齐语义,而不是拼凑出一个能动的 dashboard 就算完事。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1006

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

335

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

379

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1802

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

377

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1354

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

437

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1030

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号