0

0

大量脏页堆积但 iostat %util 不高的 page cache 异步回写优化

冷炫風刃

冷炫風刃

发布时间:2026-02-07 14:19:02

|

631人浏览过

|

来源于php中文网

原创

脏页积压主因是vm.dirty_background_ratio过低导致回写过早且不畅,而非vm.dirty_ratio未达阈值;需同步调高background_ratio(15–25)、dirty_ratio(30–40),并缩短dirty_expire_centisecs(1000–1500)以均衡回写节奏。

大量脏页堆积但 iostat %util 不高的 page cache 异步回写优化

为什么 vm.dirty_ratio 调高了,脏页还是积压?

因为内核不会等脏页涨到 vm.dirty_ratio 才开始回写——它更早就会触发异步回写,而触发阈值由 vm.dirty_background_ratio 控制。如果这个值太低(比如默认 10),系统会频繁唤醒 pdflush(或现代内核的 writeback 线程),但线程本身可能被 I/O 延迟卡住、或受限于设备吞吐,导致脏页“产速>写速”,越积越多。

常见错误现象:iostat -x 显示 %util 持续低于 30%,但 /proc/meminfoDirty:Writeback: 居高不下,应用 write() 延迟升高。

  • vm.dirty_background_ratio 建议调至 15–25(视内存总量而定),避免过早、过碎的回写打断业务 IO
  • vm.dirty_ratio 可同步上调至 30–40,为突发写留出缓冲空间,但别超过 50,否则 sync() 或内存回收时容易卡死
  • 必须配对调整 vm.dirty_background_bytesvm.dirty_bytes(二者与 *_ratio 互斥),否则 ratio 设置会被忽略

vm.dirty_expire_centisecs 设太长,脏页就“赖着不走”

这个参数决定脏页在内存里最多“躺”多久才必须被回写(单位是厘秒,即 1/100 秒)。默认 3000(30 秒),看似宽松,但在高吞吐写场景下,大量脏页会在 30 秒内反复被标记为“可回写”,却因 writeback 线程调度或磁盘队列阻塞迟迟没发出,最终全部挤在 expire 临界点前集中冲刷,造成 I/O 尖峰。

使用场景:SSD 或 NVMe 后端、日志型写入(如 Kafka broker、数据库 WAL)、容器环境共享宿主机 page cache。

  • vm.dirty_expire_centisecs 从 3000 降到 1000–1500(10–15 秒),让回写节奏更均匀
  • 注意:设太短(如
  • 该值不影响已进入 Writeback: 状态的页,只约束“脏了但还没排队”的页

为什么 iostat %util 看着不高,磁盘其实已经饱和?

%util 是基于设备忙闲时间统计的,对 NVMe 或多队列 SCSI 设备意义很弱——它只看单个请求队列是否 busy,而现代存储能并行处理数百请求。实际瓶颈常在文件系统层(如 ext4 journal 锁)、块层调度器(cfq 已弃用,但 mq-deadline 的 deep queue 行为难预测),或 RAID 卡缓存策略上。

影谱
影谱

汉语电影AI辅助创作平台

下载

性能影响:%util 30% 时,await 可能已超 20ms,svctm 失真,avgqu-sz 持续大于 4 就说明队列深度压满。

  • 优先看 iostat -x 1avgqu-szawait,而非 %util
  • 确认存储:裸盘?LVM?mdadm?ZFS?不同层有各自的缓存和限流逻辑,page cache 回写会穿透所有层
  • perf record -e 'block:*' -a sleep 10 抓块层事件,看 block_bio_queue 是否堆积

容器或 KVM 里改 vm.dirty_* 参数没效果?

因为 cgroup v1 的 memory 子系统默认不隔离 page cache 脏页控制参数;cgroup v2 虽支持 memory.pressure,但 vm.dirty_* 仍是全局 sysctl,容器内修改只作用于自身命名空间,宿主机内核仍按原值调度 writeback 线程。

兼容性影响:Kubernetes Pod 的 securityContext.sysctls 只允许 fs.*net.* 等白名单,vm.* 默认禁止写入,强行加会启动失败。

  • 必须在宿主机层面统一调优,容器内仅可通过 sync()fsync() 主动干预,或挂载 noatime,nobarrier 减少元数据写压力
  • 若用 systemd-run 启动服务,可用 --scope --property=MemoryLimit=... 配合 vm.swappiness=1 间接减少脏页生成
  • 云厂商自研存储(如阿里云 ESSD、AWS io2)通常关闭 host 端 writeback,依赖实例内应用直写,此时调 vm.dirty_* 完全无效

最易被忽略的一点:脏页堆积未必是回写慢,也可能是应用持续 write() + mmap(MAP_SHARED) 修改,且没调 msync(),导致 page cache 脏页生命周期完全脱离内核 writeback 控制节奏。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

856

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

331

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

351

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1467

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

365

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1025

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

581

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

430

2024.04.29

Golang处理数据库错误教程合集
Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容,阅读专题下面的文章了解更多详细内容。

2

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Java 教程
Java 教程

共578课时 | 59.5万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号