SQL pg_stat_statements 的 queryid 与慢 SQL 归类分析模板

冷漠man

发布时间：2026-02-25 18:50:36

920人浏览过

来源于php中文网

原创

queryid是postgresql对归一化sql（去空格、常量、注释等）用哈希算法生成的64位整数，相同sql因空格、explain前缀、绑定变量形式不同（$1 vs ?）或驱动差异可能导致queryid不同。

sql pg_stat_statements 的 queryid 与慢 sql 归类分析模板

queryid 是怎么算出来的，为什么相同 SQL 有时 queryid 不同

queryid 是 PostgreSQL 用内部哈希算法对归一化后的查询文本（去掉空格、常量、注释等）计算出的 64 位整数。不是按字面匹配，也不是按执行计划生成——所以哪怕只差一个空格或一个 EXPLAIN 前缀，queryid 就可能不同。

常见错误现象：pg_stat_statements 里看到同一条业务 SQL 出现多个 queryid，误以为是“重复采集”或“统计异常”。其实是客户端拼 SQL 时带了不同字面量（比如 WHERE id = 123 和 WHERE id = 456），被归一化后仍保留参数占位结构，但若使用了不同形式的绑定（如 $1 vs ? 或字符串拼接），归一化逻辑就失效。

确保应用层统一使用预编译语句（PREPARE / $n 占位符），避免字符串拼接 SQL
检查是否混用了不同驱动：libpq、psycopg2、pgx 对归一化的实现细节略有差异，特别是处理注释和换行的方式
pg_stat_statements.track 必须设为 all 或 top，否则嵌套函数内联的 SQL 不会被捕获，自然也没有 queryid

如何用 queryid 关联慢 SQL 的原始文本和执行计划

靠 queryid 查不到原始 SQL —— pg_stat_statements 默认只存归一化后的 query 字段（带 $1 占位符），不存真实参数值。想还原某次慢调用的具体语句，得结合日志或采样。

实操建议：

医真AI+开放平台

医真AI+ 医学AI开放平台

下载

开启 log_min_duration_statement = 1000 并设置 log_line_prefix = '%m [%p] %q[queryid:%u] '（需 14+ 版本支持 %u 输出 queryid），这样慢日志里每条都带 queryid，可反查具体参数
用 EXPLAIN (ANALYZE, BUFFERS) 手动执行某 queryid 对应的归一化 SQL（替换占位符为实际值），注意加 /*+ SET enable_hashjoin=off */ 这类 hint 会影响计划，导致跟线上不一致
别直接依赖 pg_stat_statements.query 显示的内容做根因判断——它不反映真实绑定值，可能掩盖类型隐式转换问题（比如 $1 实际传的是 text，但字段是 uuid）

按 queryid 聚合慢 SQL 时容易漏掉的三类情况

单纯按 queryid 求 max(total_time) 或 avg(mean_time)，会掩盖很多真实问题。

同一 queryid 在不同数据分布下表现差异极大：比如 SELECT * FROM orders WHERE user_id = $1，当 $1 是高频用户（百万级订单）vs 长尾用户（个位数订单），执行时间差两个数量级，但 pg_stat_statements 只给一个平均值
带 UNION 或 CTE 的查询，可能被拆成多个子计划，每个子计划有独立 queryid，但主 SQL 的 queryid 只对应顶层归一化结果，子节点统计被分散
queryid = 0 的记录代表无法归一化的动态 SQL（如拼接列名、表名），这类必须单独捞日志分析，不会出现在常规 queryid 分析模板里

一个轻量但实用的慢 SQL 归类分析 SQL 模板

这个模板不追求大而全，重点解决“哪个 queryid 最值得优化”和“它最近一次慢在哪”的问题：

SELECT
  queryid,
  substring(query, 1, 80) AS query_snippet,
  calls,
  round(total_time::numeric, 2) AS total_time_ms,
  round(mean_time::numeric, 2) AS mean_time_ms,
  rows,
  shared_blks_hit - shared_blks_read AS net_cache_hit
FROM pg_stat_statements
WHERE total_time > 10000  -- 总耗时超 10 秒
  AND calls > 5
ORDER BY total_time DESC
LIMIT 20;

关键点：

过滤掉 calls ≤ 5 的，避免把偶发毛刺当瓶颈；也别只看 mean_time，有些 SQL 调用少但单次极长（如报表导出）
net_cache_hit 是个快速信号：负值说明大量读磁盘，配合 shared_blks_read 看是否缺索引或缓存不足
别在生产库直接跑 SELECT query 全字段——某些归一化 SQL 很长，可能触发网络或客户端截断；先用 substring 截取再人工确认

真正难的不是写这个 SQL，而是确认你看到的 queryid 是否覆盖了所有执行路径，以及有没有被 pg_stat_statements.max 容量挤掉旧记录。

相关标签:

sql 常量 select 字符串 union 实参算法 postgresql

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL Citus 的分布式表 vs 参考表 vs 本地表类型与 co-location 优化下一篇：暂无

作者最新文章

6.5原神复刻角色有哪些原神6.5角色池内容

2026-02-25 09:54

原神6.5前瞻兑换码分享原神月之五版本前瞻兑换码

2026-02-25 09:56

ao3最新2026入口地址_AO3最新镜像与原站2026入口

2026-02-25 09:57

苹果手机文件怎么传送安卓 iPhone文件传输安卓方法

2026-02-25 10:01

oppo官网买平板靠谱吗_OPPO官方商城平板购买可靠指南

2026-02-25 10:31

GitHub 私人仓库怎么创建？GitHub 私有仓库使用指南

2026-02-25 10:33

SQL XML 在报表生成中的应用

2026-02-25 11:03

Linux swap 分区与性能优化

2026-02-25 11:08

Linux 容器日志与监控方法

2026-02-25 11:14

edge浏览器插件在哪个位置扩展安装目录结构说明

2026-02-25 11:29

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1027

2023.10.12