进程卡在 D 状态 [kthreadd] / [kswapd0] 的深层原因定位

舞姬之光

发布时间：2026-01-30 20:42:01

139人浏览过

来源于php中文网

原创

kthreadd 和 kswapd0 卡在 D 状态是因等待不可中断资源：kthreadd 通常因子线程初始化挂起，kswapd0 则多因内存压力下 I/O 或锁阻塞；需查 /proc/pid/stack 定位具体等待点，并结合 vmstat、slabtop 与 cgroup 配置综合分析。

进程卡在 d 状态 [kthreadd] / [kswapd0] 的深层原因定位

为什么 `kthreadd` 和 `kswapd0` 会卡在 D 状态？

D 状态（Uninterruptible Sleep）不是“卡死”，而是内核线程正在等待不可被信号中断的底层资源，比如磁盘 I/O 完成或内存页回收锁。对 kthreadd 来说，它本身是内核线程的父进程，几乎不直接执行耗时操作——真正卡住的往往是它派生出的子线程（如 kswapd0、khugepaged）。而 kswapd0 卡在 D 状态，90% 以上指向内存压力 + 回收路径阻塞，常见于：慢速存储（如 NFS、iSCSI 后端卡顿）、ext4 的 journal 提交延迟、或 cgroup v1 下 memory.limit_in_bytes 触发的强制同步回收。

用 `/proc/[pid]/stack` 看清到底卡在哪一行

别只看 ps 或 top，它们只能告诉你状态是 D，但不知道等什么。直接读内核栈：

cat /proc/$(pgrep kswapd0)/stack

典型输出中若出现：

__rwsem_down_read_failed → 表示在等某个读写信号量（比如 shrinker 链表被其他 CPU 持有）
wait_on_page_bit_common → 正在等某页的 PG_locked 标志清除，常见于该页正被 writeback 或 swapout
ext4_writepages 或 nfs_updatepage → 存储后端响应超时，I/O 请求挂在队列里没返回

注意：kthreadd 自身栈通常很短（只有 kthreadd 函数调用），如果它也显示 D，大概率是它刚 fork 出子线程后，子线程还没完成初始化就被调度器挂起——这时应优先查子线程（如 kswapd0）的栈。

`vmstat 1` 和 `slabtop` 联合判断回收瓶颈类型

D 状态持续时间长 ≠ 内存不足，可能是回收效率崩溃。观察关键指标：

Pixso AI

Pixso AI是一款智能生成设计稿工具，通过AI一键实现文本输入到设计稿生成。

下载

若 vmstat 1 中 si（swap-in）持续 > 0，但 so（swap-out）极低 → kswapd0 在反复尝试回收却失败（如所有可回收页都被 mlock() 锁住）
若 free 列稳定但 buff/cache 不降，且 slabtop 显示 dentry 或 inode_cache 占用飙升 → shrinker 未及时触发，或 nr_shrinker_deferred 非零（说明 shrinker 被跳过）
pgpgin/pgpgout 值极小，但 pgmajfault 暴涨 → 进程频繁缺页，而 kswapd0 无法及时分配新页，可能因 zone watermark 设置过严（/proc/sys/vm/lowmem_reserve_ratio 异常）

cgroup v1 下 `memory.limit_in_bytes` 是隐形杀手

在 cgroup v1 环境中，一旦容器内存接近 memory.limit_in_bytes，内核会强制走同步回收路径（try_to_free_pages），此时 kswapd0 会被绕过，由触发缺页的用户进程自己调用回收逻辑——但若该进程又依赖其他被锁资源（如 ext4 的 journal_lock），就会导致整个回收链路卡在 D 状态，且栈中看不到 kswapd0，反而看到用户进程卡在 do_swap_page。验证方法：

grep -r "limit_in_bytes" /sys/fs/cgroup/memory/ | xargs -n1 cat 2>/dev/null | grep -v "^0$"

只要非零值存在，就需检查对应 cgroup 的 memory.usage_in_bytes 是否长期 > 90% limit，并确认是否启用了 memory.swappiness=0（这会让内核拒绝 swap，加剧直接回收压力）。

这类问题最难排查，因为表象是 kswapd0 无响应，实际根因在 cgroup 配置和 swappiness 的组合效应上——而 /proc/[pid]/stack 里根本看不到 cgroup 相关函数名。

kubectl top node/pod 显示数据为空或 metrics-server 报错

Linux Node环境安装指南_Linux部署Node运行环境步骤

Linux 上搭建前端打包环境（pnpm/node 全流程）

Linux如何安装并配置Node环境_LinuxNodejs部署完整指南

Linux 安全：如何使用 kube-bench 检查 Kubernetes 安全基线

相关标签:

node go app 后端栈 ai 为什么 red 栈线程 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：kernel: timekeeping watchdog expired 导致时间跳跃的硬件/虚拟化排查下一篇：Linux 启动流程全解析：从 BIOS 到 systemd

作者最新文章

腾讯ai元宝发红包怎么弄腾讯元宝现金红包活动规则

2026-01-29 10:37

yield from 在生成器中遇到 GeneratorExit 的清理顺序

2026-01-29 11:15

clawdbot网站官网入口 clawdbot在线网页版使用

2026-01-29 11:20

摺机市场迎来大变动？HONOR 或以全新宽屏摺摺手机取代 Magic Vs 系列!

2026-01-29 11:21

高德淘金年入几十万是怎么做到的高德淘金怎么赚钱

2026-01-29 11:38

Clawdbot官网入口 Clawdbot AI官方网站

2026-01-29 11:40

高德淘金币100金币是多少钱高德淘金100个金币多少钱

2026-01-29 11:40

采用台积电N2P工艺制程！曝高通第六代骁龙8至尊版有双版本

2026-01-29 12:10

小米云服务关闭查找设备怎么办？小米设置小米账号云服务关闭查找设备开关需密码确认步骤

2026-01-29 12:59

subprocess 如何在 timeout 后杀死整个进程树（Windows/Linux）

2026-01-29 13:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

398

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

525

2023.08.10

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1415

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

706

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

295

2023.06.30