0

0

Redis怎样防止磁盘写满导致服务崩溃_配置操作系统的磁盘配额与监控告警

P粉602998670

P粉602998670

发布时间:2026-03-13 13:48:31

|

993人浏览过

|

来源于php中文网

原创

Redis 本身不写满磁盘,但 RDB/AOF 持久化、日志堆积及系统配置不当(如 overcommit_memory=0、swappiness 过高)会引发 fork 失败、双写放大和磁盘耗尽,导致 OOM 或服务拒绝。

redis怎样防止磁盘写满导致服务崩溃_配置操作系统的磁盘配额与监控告警

Redis 本身不会导致磁盘写满——但它的持久化行为(RDB/AOF)、日志、以及系统级副作用,确实可能悄悄填满磁盘,最终让 Redis 进程被 OOM Killer 杀掉,或因 fork 失败直接拒绝服务。

为什么 Redis 会“连累”磁盘写满?

很多人以为 Redis 是纯内存数据库,磁盘就没事。错在三个关键点:

  • RDB 快照生成时,fork 子进程会复制父进程页表,若内存大(比如 16GB),即使没写新数据,临时占用的虚拟内存也可能触发 /proc/sys/vm/overcommit_memory=0 策略下的 fork 失败,报错 Can't save in background: fork: Cannot allocate memory
  • AOF 重写(bgrewriteaof)同样依赖 fork,且重写期间新命令持续追加到老 AOF 文件,造成“双写放大”;
  • Redis 自身不管理磁盘,但 /var/log(systemd 日志)、/var/lib/redis(dump.rdb、appendonly.aof、AOF 重写中的 temp-rewriteaof-* 文件)都在同一块磁盘上,日志打爆 + RDB 挤占 + 系统缓存回收滞后,三者叠加极易触顶。

配置操作系统级磁盘配额(ext4/xfs 场景)

别只盯着 Redis 配置,得先给磁盘“上锁”。以 Redis 数据目录 /var/lib/redis 所在分区为例:

  • 确认文件系统支持配额:tune2fs -l /dev/sda1 | grep "Filesystem features"(需含 quota);
  • 启用用户配额:tune2fs -uq /dev/sda1,然后在 /etc/fstab 对应行末尾加 usrquota,再 mount -o remount /var/lib/redis
  • 初始化配额数据库:quotacheck -cug /var/lib/redis
  • 给 redis 用户设硬限制(比如 5GB):setquota -u redis 0 5242880 0 0 /var/lib/redis(单位是 KB);
  • 启用:quotaon /var/lib/redis
  • 验证:quota -u redis,看 Block limits 是否生效。

⚠️ 注意:如果 Redis 用 systemd 启动且启用了 DynamicUser=yes,它运行在随机 UID 下,此时必须改用 groupquota 或禁用 DynamicUser,否则配额不生效。

监控告警必须覆盖的 3 个真实指标

光配额不够,得提前预警。以下指标不能只看“使用率”,要盯住变化速率和绝对值:

云从科技AI开放平台
云从科技AI开放平台

云从AI开放平台

下载
  • df -B1 /var/lib/redis | awk 'NR==2 {print $5}' | sed 's/%//' —— 但仅此不够,得配合 inotifywait -m -e create,delete_self /var/lib/redis 监控临时文件突增;
  • AOF 当前大小:stat -c "%s" /var/lib/redis/appendonly.aof 2>/dev/null || echo 0,重点看 24 小时内是否增长 >30%(说明写入激增或重写卡住);
  • RDB 最后修改时间与大小:find /var/lib/redis -name "dump.rdb" -printf "%T@ %s\n" | sort -n | tail -1,若大小暴涨 + 时间接近现在,大概率是 save 阻塞了主线程。

告警阈值建议:根分区使用率 >85% 触发 P2,>92% 触发 P1;AOF 文件单日增长 >2GB 且无重写完成日志,立即检查 redis-cli info persistence | grep aof_rewrite

Redis 层面最该关掉的两个“磁盘黑洞”

很多崩溃其实源于 Redis 自己的配置惯性,而不是磁盘本身小:

  • 关掉自动 AOF 重写:CONFIG SET auto-aof-rewrite-percentage 0,改用手动触发(redis-cli bgrewriteaof),并确保操作前 df -h /var/lib/redis 有 ≥2 倍当前 AOF 的空闲空间;
  • 禁用 RDB 快照(除非你真需要):CONFIG SET save "",把 save 900 1 这类配置从 redis.conf 彻底删掉——RDB 文件无法增量,每次都是全量复制,对磁盘 I/O 和 fork 压力最大;
  • 如果必须持久化,优先选 AOF + appendfsync everysec,并定期用 redis-cli BGREWRITEAOF 清理,比 RDB 更可控。

真正容易被忽略的是:vm.swappiness=1 要配,否则 Linux 在内存压力下疯狂 swap,反而加剧磁盘 IO,掩盖真实瓶颈;还有 /proc/sys/vm/overcommit_memory 推荐设为 1(允许 overcommit),不然 fork 就是定时炸弹。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

193

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

19

2026.02.03

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

409

2023.09.04

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

409

2023.09.04

printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

76

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

306

2023.11.28

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号