0

0

DockerDaemon内存泄露排查与性能监控方法

冷炫風刃

冷炫風刃

发布时间:2026-03-13 21:16:48

|

856人浏览过

|

来源于php中文网

原创

dockerd 进程 RSS 持续上涨而容器内存稳定是 dockerd 自身内存泄漏的典型表现,需通过 pstack、pprof、debug 日志及监控指标综合定位。

dockerdaemon内存泄露排查与性能监控方法

dockerd 进程 RSS 持续上涨但容器内存稳定

这是典型的 dockerd 自身内存泄露信号,不是容器问题。Linux 的 ps aux --sort=-rsstop -o %MEM 能快速确认:如果 dockerd 的 RSS 占用从几百 MB 涨到 2GB+,而所有容器的 docker stats 显示内存使用平稳,基本可排除业务或镜像层缓存误判。

常见诱因是长期运行的守护进程未正确释放资源句柄,比如持续创建/销毁网络 endpoint、反复挂载/卸载 volume、或插件(如 CNI、logging driver)存在引用泄漏。

  • 先用 sudo pstack $(pgrep dockerd) 抓一次线程栈,重点看是否有大量重复的 netlinkinotifyopenat 调用堆栈
  • 检查 /var/run/docker/netns/ 下 namespace 文件数量是否异常增长(正常应与运行中容器数大致一致)
  • 临时禁用非必需插件(如 log-driver=fluentd 或自定义 CNI),观察 RSS 是否停止上涨

启用 dockerd 的 debug 日志并过滤内存相关事件

默认日志级别不输出内存分配路径,必须显式开启 debug 并配合 grep 筛选关键行为。修改 /etc/docker/daemon.json 加入:

{"debug": true, "log-level": "debug"}
,然后 sudo systemctl reload docker

注意:debug 日志量极大,仅用于短时定位;线上环境切勿长期开启。

  • 实时跟踪内存操作:sudo journalctl -u docker -f | grep -E "(malloc|free|mem|oom|gc)"
  • 重点关注 graphdriverlibcontainerd 模块日志,例如出现高频 layer store: get layer by diffID 但无对应 release,可能指向镜像层引用计数泄漏
  • 若日志中反复出现 failed to unmount /var/lib/docker/overlay2/xxx: device or resource busy,说明 mount ref 未清理,会间接拖慢内存回收

用 pprof 分析 dockerd 堆内存快照

dockerd 内置了 pprof 接口(默认监听 127.0.0.1:2376/debug/pprof/),无需重启即可抓取堆内存分布。前提是启动时加了 --debug 参数(systemd 服务需改 ExecStart)。

一点PPT
一点PPT

一句话生成专业PPT,AI自动排版配图

下载

执行 curl -s 'http://localhost:2376/debug/pprof/heap?debug=1' | grep -A10 'inuse_objects' 可看到当前活跃对象数最多的类型,比单纯看 RSS 更准。

  • 导出 svg 图谱分析:curl -s 'http://localhost:2376/debug/pprof/heap' | go tool pprof -http=:8080 -
  • 重点关注 *sync.Map*net.Interface*os.File 实例数是否随时间线性增长
  • runtime.mallocgc 调用频次远高于 runtime.gc,说明 GC 压力大但未及时触发,可能是对象生命周期管理逻辑有缺陷

监控项设置与告警阈值建议

靠人工查日志或 pprof 不可持续,必须固化为监控指标。Prometheus + cAdvisor 是最轻量方案,但要注意 cAdvisor 默认不暴露 dockerd 自身指标,需额外采集。

关键指标不是容器内存,而是 process_resident_memory_bytes{process="dockerd"}process_open_fds{process="dockerd"} —— 后者常被忽略,但 fd 泄漏往往早于内存泄漏发生。

  • 告警阈值建议:process_resident_memory_bytes > 1.5e9(1.5GB)且 1h 内上涨 >300MB
  • 搭配 rate(process_cpu_seconds_total{process="dockerd"}[5m]) > 0.8,高 CPU + 高内存 = 典型泄漏组合
  • 务必加 absent(process_resident_memory_bytes{process="dockerd"}) 告警,避免 dockerd 崩溃后监控静默失联

真正难的是区分「缓慢增长」和「周期性尖峰」——有些场景下 dockerd 会在批量 pull 镜像后内存暂升,几小时才回落。得结合历史曲线和操作日志交叉验证,不能只看绝对值。

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

549

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

resource是什么文件
resource是什么文件

Resource文件是一种特殊类型的文件,它通常用于存储应用程序或操作系统中的各种资源信息。它们在应用程序开发中起着关键作用,并在跨平台开发和国际化方面提供支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

182

2023.12.20

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

409

2023.09.04

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

455

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号