扩展统计信息通过CREATE STATISTICS命令为多列创建,用于提升查询优化器对列间相关性、函数依赖和多列基数的估算准确性,从而生成更优执行计划。

在 PostgreSQL 中,多列统计信息对查询优化器生成高效执行计划非常重要。默认的单列统计信息有时不足以准确反映多个列之间的相关性或数据分布,这时就需要扩展统计信息(Extended Statistics)来提升查询规划的质量。
_postgresqlextstats 并不是一个官方提供的函数或系统视图,而可能是某些监控工具、扩展或自定义脚本中用于解析扩展统计信息的内部标识或辅助函数。我们真正需要了解的是如何使用 PostgreSQL 原生的 CREATE STATISTICS 命令以及如何查看和利用这些多列统计信息。
什么是扩展统计信息(Extended Statistics)?
PostgreSQL 从版本 10 开始支持扩展统计信息,允许用户为多列创建统计信息,包括:
- 函数依赖(Functional Dependencies):帮助优化器估算 WHERE 条件中多个列之间依赖关系的选择率。
- 列相关性(Correlation):衡量多列在物理存储顺序上的相关性,影响排序和索引扫描成本。
- 多列基数(Multi-Column Distinct Counts):统计多个列组合后的唯一值数量。
如何创建多列统计信息
使用 CREATE STATISTICS 命令定义扩展统计信息。例如:
CREATE STATISTICS IF NOT EXISTS sales_stats ON region, product, sale_date FROM sales_table;这条命令会收集三列的组合统计信息。你也可以指定类型:
CREATE STATISTICS sales_fd (dependencies) ON region, product FROM sales_table;CREATE STATISTICS sales_corr (correlation) ON sale_date, id FROM sales_table;
CREATE STATISTICS sales_ndistinct (ndistinct) ON region, product FROM sales_table;
创建后,运行 ANALYZE 触发统计信息收集:
ANALYZE sales_table;如何查看已创建的扩展统计信息
可以通过系统视图查看:
云点滴客户解决方案是针对中小企业量身制定的具有简单易用、功能强大、永久免费使用、终身升级维护的智能化客户解决方案。依托功能强大、安全稳定的阿里云平 台,性价比高、扩展性好、安全性高、稳定性好。高内聚低耦合的模块化设计,使得每个模块最大限度的满足需求,相关模块的组合能满足用户的一系列要求。简单 易用的云备份使得用户随时随地简单、安全、可靠的备份客户信息。功能强大的报表统计使得用户大数据分析变的简单,
输出说明:
- stxname:统计信息名称。
- stxrelid::regclass:关联的表名。
-
stxkeys:表示涉及的列编号,可通过
pg_get_statisticsobjdef查看具体列名。 - stxkind:统计类型(f=函数依赖,c=相关性,d=不同值数量)。
查看某统计对象的完整定义:
SELECT pg_get_statisticsobjdef(oid) FROM pg_statistic_ext WHERE stxname = 'sales_fd';扩展统计信息如何影响执行计划
假设表中有两个列:region 和 product,它们高度相关(比如每个 region 只卖特定 product)。如果没有扩展统计,优化器可能误判 WHERE region='A' AND product='X' 的行数,导致选择错误的连接方式或索引。
启用函数依赖统计后,优化器能更准确估算选择率,从而选择更优执行计划。
验证是否生效的方法是:
- 开启
EXPLAIN查看实际行数与预估行数是否接近。 - 对比创建统计前后执行计划的变化。
注意事项与最佳实践
- 扩展统计不会自动创建,需手动识别强相关列后添加。
- 只对频繁用于查询条件、且列间有明显数据关联的场景有效。
- 统计信息在
ANALYZE时更新,确保数据变更后及时分析。 - 过多的扩展统计会增加
ANALYZE开销,应合理控制数量。
pg_statistic_ext 数据的函数,实际使用中关注原生接口即可。









