swap 使用率高但 anon page 少的 file-backed page cache 回收优化

冷漠man

发布时间：2026-01-30 12:48:48

526人浏览过

来源于php中文网

原创

swap使用率高但anon page少，根本原因是vm.swappiness控制回收倾向而非开关，当file-backed page cache回收慢于内存分配时，内核会将干净或脏的file页换出到swap；可通过调高vfs_cache_pressure、降低dirty_ratio、启用zram等优化。

swap 使用率高但 anon page 少的 file-backed page cache 回收优化

为什么 swap 使用率高但 anon page 很少？

这通常不是内存泄漏或进程异常，而是内核在压力下优先回收 file-backed page cache，但回收不及时或策略偏保守，导致 swap 被迫介入——哪怕匿名页（anon page）本身不多。根本原因是：Linux 的 vm.swappiness 控制的是“倾向性”，不是“开关”；当 page cache 回收慢于内存分配速率时，内核会把部分干净的 file-backed 页先换出到 swap（尤其是那些刚被访问过、尚未写回磁盘的 dirty page），以腾出内存给新分配。

swappiness=60（默认）下，内核对 file-backed 和 anon page 的回收权重接近，但实际调度还受 lruvec 状态、refault rate、workingset 活跃度影响
若 workload 频繁读大文件（如日志归档、数据库 backup）、且文件未被再次访问，这些 page cache 会快速进入 inactive_file LRU 链表，但内核可能因 vm.vfs_cache_pressure 偏低或 dirty_ratio 限制而延迟回写
观察 /proc/vmstat 中的 pgpgout 和 pswpout，若后者显著高于前者，说明 swap 写入主力是 file-backed 页（即 “swap-in file cache” 场景）

如何让 file-backed page cache 更快被回收？

核心思路是降低内核对 file cache 的“留恋程度”，同时加速其回写和释放路径：

把 vm.vfs_cache_pressure 从默认 100 提高到 150–200：增强 dentry/inode cache 回收力度，间接减少 page cache 引用计数滞留
适当调低 vm.dirty_ratio（如 20）和 vm.dirty_background_ratio（如 10）：让脏页更早触发回写，避免积压后一次性刷盘阻塞回收
启用 vm.drop_caches=2（仅临时调试）可强制清空 page cache，验证是否为 cache 积压导致；但生产环境禁用，应靠参数长期调控
若使用 ext4/xfs，确认挂载选项含 barrier=1 和 commit=30，避免日志提交延迟拖慢 dirty page 生命周期

swap 分区/文件是否真有必要保留？

不一定。当 anon page 很少、且 workload 不依赖 swap for hibernation 或 kdump，swap 实际只在 page cache 回收卡顿时“背锅”：

英特尔AI工具

英特尔AI与机器学习解决方案

下载

可尝试禁用 swap：swapoff -a，观察 OOM 是否立即发生；若只是 pgmajfault 上升、无 crash，则说明系统本可靠 page cache 动态回收支撑
若必须保留 swap（如云主机要求），建议改用 zram：它把压缩后的 page（包括 file-backed）存于内存，避免磁盘 I/O 成为瓶颈，且 zram 的 disksize 可设为物理内存的 25%～50%，比传统 swap 更适配 cache-heavy 场景
注意：启用 zram 后需调低 vm.swappiness 至 10–30，否则内核仍倾向换出而非压缩

排查时最容易忽略的点

`/proc/meminfo` 中的 `Inactive(file)` 和 `Active(file)` 差值大，不代表问题；要看 `pgpgin`/`pgpgout` 与 `pswpin`/`pswpout` 的比值——如果后者占总换页量 >30%，才是 file-backed 导致 swap 高

`perf record -e 'mm_vmscan_lru_isolate' -a` 可抓取实际哪些 LRU 链表被扫描，确认是不是 `inactive_file` 长期滞留未被隔离

容器环境（如 Docker/K8s）中，cgroup v1 的 `memory.limit_in_bytes` 可能导致子系统回收逻辑失真，v2 下需检查 `memory.pressure` 和 `memory.low` 设置是否合理

真正卡住回收的，往往不是参数本身，而是 page cache 所属文件的访问模式突然变化（比如备份任务结束但缓存未老化）——此时再激进的 swappiness 也救不了，得靠 workload 层主动 posix_fadvise(fd, 0, 0, POSIX_FADV_DONTNEED) 或定期 drop_caches（配合业务低峰）。

Python 如何限制函数/脚本最大运行时间（超时杀掉）

如何判断一个路径是否为挂载点而不调用 os.statvfs

多进程写文件时如何使用文件锁（fcntl 或 msvcrt）

pathlib 如何判断两个不同路径是否指向同一个真实文件

如何安全递归删除目录树（即使包含只读文件）

相关专题

k8s和docker区别

k8s和docker区别有抽象层次不同、管理范围不同、功能不同、应用程序生命周期管理不同、缩放能力不同、高可用性等等区别。本专题为大家提供k8s和docker区别相关的各种文章、以及下载和课程。

257

2023.07.24

docker进入容器的方法有哪些

docker进入容器的方法：1. Docker exec；2. Docker attach；3. Docker run --interactive --tty；4. Docker ps -a；5. 使用 Docker Compose。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

500

2024.04.08

docker容器无法访问外部网络怎么办

docker 容器无法访问外部网络的原因和解决方法：配置 nat 端口映射以将容器端口映射到主机端口。根据主机兼容性选择正确的网络驱动（如 host 或 overlay）。允许容器端口通过主机的防火墙。配置容器的正确 dns 服务器。选择正确的容器网络模式。排除主机网络问题，如防火墙或连接问题。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

403

2024.04.08

docker镜像有什么用

docker 镜像是预构建的软件组件，用途广泛，包括：应用程序部署：简化部署，提高移植性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

440

2024.04.08

数据库三范式

数据库三范式是一种设计规范，用于规范化关系型数据库中的数据结构，它通过消除冗余数据、提高数据库性能和数据一致性，提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

359

2023.06.29

如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构，作用包括：1、释放存储空间；2、确保数据的安全性；3、提高数据库的整体性能，加速查询和操作的执行速度。尽管删除数据库具有一些好处，但在执行任何删除操作之前，务必谨慎操作，并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构，无法回滚。

2082

2023.08.14