0

0

进程卡在 D 状态 [kthreadd] 或 [kswapd0] 的深层原因定位

冷炫風刃

冷炫風刃

发布时间:2026-01-24 15:38:03

|

929人浏览过

|

来源于php中文网

原创

kthreadd卡在D状态基本可排除自身问题,因其仅负责fork内核线程,卡住实为等待子线程(如kswapd0)完成,根源在I/O、内存回收或cgroup限流等下游资源死锁。

进程卡在 d 状态 [kthreadd] 或 [kswapd0] 的深层原因定位

为什么 kthreadd 卡在 D 状态基本可以排除进程自身问题

kthreadd 是内核线程的“父进程”,本身不执行业务逻辑,只负责 fork() 出其他内核线程(比如 kswapd0khungtaskd)。它卡在 D(uninterruptible sleep)状态,几乎总是因为某个它刚 fork 出的子线程卡住了,导致 kthreaddwait_event() 或类似同步点上被阻塞——不是它自己慢,而是它在等别人。

实操建议:

  • 先用 ps -eo pid,ppid,comm,wchan:20,state | grep 'D.*kthreadd' 查看哪个子线程在等什么内核函数(wchan 列)
  • 再用 cat /proc//stack 看该子线程完整调用,重点关注最顶层是否落在 __io_wait_eventsleep_on_bitmem_cgroup_wait 等 I/O 或内存路径上
  • 别急着重启,kthreadd 卡住往往是下游资源(如存储、cgroup 限流、page cache 回写)已死锁的表象

kswapd0 长期 D 状态通常指向内存回收路径受阻

kswapd0 的职责是异步回收内存页,D 状态说明它正卡在某个不可中断的等待中,常见于:设备 I/O 延迟过高、底层块设备无响应、或 cgroup 内存压力下被强制 throttle。和用户态进程不同,它不会因信号中断,所以一旦卡住,整个内存回收就停摆。

实操建议:

  • 检查 /proc/vmstatpgmajfaultpgpginpgpgout 是否持续飙升,配合 vmstat 1 观察 si/so(swap in/out)是否长期非零
  • cat /proc//stack 看栈顶:若停在 blk_mq_get_tagsubmit_bio,说明块层卡住;若停在 try_to_unmapshrink_inactive_list,可能是特定 page 类型(如 dirty file-backed page)无法释放
  • 临时验证:运行 echo 1 > /proc/sys/vm/drop_caches(仅清 pagecache)看是否能唤醒 kswapd0;若不能,大概率是底层存储或驱动问题

定位真正瓶颈:从 /proc/buddyinfo/sys/kernel/debug/block/*/io_stats 入手

D 状态本身只是现象,真正瓶颈往往藏在内存分配器或 I/O 子系统。比如 kswapd0 卡在 balance_pgdat,但实际是因为 buddy allocator 无法满足高阶内存请求(order-3+),进而反复触发更激进的回收,形成恶性循环。

SpeechEasy
SpeechEasy

SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。

下载

实操建议:

  • 运行 cat /proc/buddyinfo,关注高阶(order-4 及以上)空闲页是否为 0;若持续为 0,说明内存碎片严重,kswapd0 会不断尝试 compaction,而 compaction 又依赖 I/O 完成,容易卡死
  • 检查对应块设备的 debugfs 统计:cat /sys/kernel/debug/block//io_stats,观察 in_flight 是否长期 > 0,且 io_ticks 不增长——这是设备无响应的强信号
  • 若使用 NVMe,注意 dmesg 中是否有 nvme nvme0: timeoutreset controller 日志;这些会直接让 kswapd0 卡在 nvme_queue_rq

容易被忽略的三个硬性条件

很多排查止步于“看起来像磁盘慢”,但以下三点常被跳过,却直接决定是否真能复现或缓解:

  • 确认是否启用了 memory.max(cgroup v2)或 memory.limit_in_bytes(v1):当容器/进程内存被严格限制,且脏页比例超阈值时,kswapd0 会被强制同步回写,极易卡在 writeback 路径
  • 检查是否挂载了 nobarriernoatime 的 ext4/xfs:某些旧内核版本在禁用 barrier 下遇到突发 I/O 错误时,会卡在 __wait_on_bit_lock 等待 page lock,而非报错退出
  • 确认内核是否打了特定补丁:例如 5.4.0-105-generic(Ubuntu)存在一个 kswapd 在 memcg under high pressure 下死锁的 bug,需升级到 5.4.0-107+

卡在 D 状态的内核线程本身不提供调试接口,所有线索都来自栈、统计文件和周边子系统状态。最耗时间的往往不是找“哪一行代码卡住”,而是确认“哪一层资源彻底不可达”。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1051

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

127

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

725

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

13

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

394

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

574

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

482

2023.08.10

常见的linux系统有哪些
常见的linux系统有哪些

linux系统有Ubuntu、Fedora、CentOS、Debian、openSUSE、Arch Linux、Gentoo、Slackware、Linux Mint、Kali Linux。更多关于linux系统的文章详情请阅读本专题下面的文章。php中文网欢迎大家前来学习。

812

2023.10.27

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

17

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.1万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号