0

0

SQL MySQL 的 innodb_stats_sample_pages 与采样页数对执行计划准确性的影响

舞夢輝影

舞夢輝影

发布时间:2026-02-23 14:52:57

|

426人浏览过

|

来源于php中文网

原创

innodb_stats_sample_pages值过小会导致索引统计失真,引发执行计划错选;建议大表设为100~200,但需权衡analyze table耗时与锁影响,mysql 8.0起优先使用直方图替代盲目调大该参数。

sql mysql 的 innodb_stats_sample_pages 与采样页数对执行计划准确性的影响

innodb_stats_sample_pages 值太小会导致执行计划错判

MySQL 5.6 及之后版本中,innodb_stats_sample_pages 控制 InnoDB 在计算索引统计信息(比如索引基数、列值分布)时,每棵 B+ 树索引采样的页数。这个值不是“越大越好”,但过小(比如默认的 20)在大表或数据倾斜严重时,会让优化器误以为某个索引选择性很高,从而选错索引甚至走全表扫描。

常见错误现象:EXPLAIN 显示走了 idx_status,但实际慢得离谱;加了 FORCE INDEX 后快十倍;表数据量翻倍后,同一条查询突然变慢——这些往往不是 SQL 写法问题,而是统计不准引发的执行计划漂移。

  • 默认值是 20,对千万级以下表勉强够用;超过 1000 万行且有高频范围查询时,建议设为 100200
  • 该参数只影响 ANALYZE TABLE 时的采样精度,不影响实时查询性能,但会影响后续所有基于该统计的执行计划
  • 修改后需手动触发 ANALYZE TABLE,否则旧统计仍生效;自动更新统计(innodb_stats_auto_recalc=ON)也依赖此参数
  • 注意:MySQL 8.0 引入了更稳定的持久化统计(innodb_stats_persistent=ON),此时调大 innodb_stats_sample_pages 效果更明显

为什么不能无脑调大 innodb_stats_sample_pages

采样页数越多,ANALYZE TABLE 耗时越长,尤其在 SSD 性能一般或 IOPS 受限的实例上,一次分析可能卡住几秒到几十秒。更关键的是,它会阻塞 DML(INSERT/UPDATE/DELETE)——因为 InnoDB 在分析期间会对索引加意向锁,高并发写入场景下容易引发锁等待堆积。

使用场景:线上 OLTP 主库通常不建议设超过 200;从库或低峰期批量维护可临时调到 400,但必须配合 ANALYZE TABLE 手动执行并观察锁表现。

  • innodb_stats_sample_pages = 800 在单表 5 亿行时,ANALYZE TABLE 可能持续 20 秒以上,期间写入延迟明显升高
  • 该参数对内存占用无直接影响,但采样过程会读取更多页面进 buffer pool,间接增加压力
  • 若开启 innodb_stats_transient_sample_pages(MySQL 5.7+),它仅用于非持久化统计场景,和主参数互不影响,别混淆

替代方案:用直方图代替盲目调大采样页数

MySQL 8.0+ 支持列级直方图(CREATE STATISTICS),它不依赖页采样,而是对列值做等深或等宽分桶,对 WHERE status IN ('pending','processing') 这类低基数字段效果远超调大 innodb_stats_sample_pages

EasySite
EasySite

零代码AI网站开发工具

下载

性能影响小:直方图构建只扫描一次目标列,不锁表(LOCK=NONE 可选),且体积小、更新快;兼容性上,8.0.19+ 才支持 JSON 类型列直方图,老版本不适用。

  • 建直方图示例:ANALYZE TABLE orders UPDATE HISTOGRAM ON status, created_at WITH 16 BUCKETS;
  • 直方图优先级高于页采样统计,只要存在,优化器就会优先用它估算 WHERE 条件的选择性
  • 注意:直方图不会自动更新,需定期重建(如每天凌晨),或监听 information_schema.COLUMN_STATISTICS 表变化
  • 不要给高基数、高更新频率的列(如 user_id)建直方图——收益低,维护成本高

怎么验证当前统计是否靠谱

别只看 EXPLAINrows 估算值,要对比真实扫描行数。最直接的方法是打开 optimizer_trace,查 rows_estimation 段里各索引的 records_per_key 是否合理。

常见陷阱:用 SHOW INDEX FROM tbl 看到的 Cardinality 是粗略整数,且滞后于实际数据变更;而 INFORMATION_SCHEMA.STATISTICS 中的 INDEX_COMMENT 字段可能为空,不代表没统计——得看 SEQ_IN_INDEXNULLABLE 组合是否被优化器真正用了。

  • 快速检查命令:SELECT table_name, index_name, cardinality FROM information_schema.statistics WHERE table_schema='db' AND table_name='orders' ORDER BY cardinality DESC;
  • 如果某索引 cardinality 明显偏离实际唯一值数量(比如 status 列只有 4 个值,但显示 1200),基本可判定采样失效
  • 执行 EXPLAIN FORMAT=JSON 后,在 query_block->table->rowsused_columns 下找 range_analysis,确认优化器是否参考了直方图

采样页数不是调优银弹,它和直方图、索引设计、数据分布是耦合的。最容易被忽略的是:即使把 innodb_stats_sample_pages 设成 1000,如果表里有大量 NULL 或重复前缀(比如 URL 字段前 20 字节全一样),统计依然会失真——这时候得换索引策略,而不是继续加采样页。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1026

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

335

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

379

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1802

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

377

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1374

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

437

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1030

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2.3万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 836人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号