Linux 存储延迟突增的定位方法

冰川箭仙

发布时间：2026-02-04 18:04:02

439人浏览过

来源于php中文网

原创

当存储延迟突增但 %util 很低（比如

linux 存储延迟突增的定位方法

看 `iostat -x 1` 的 `%util` 和 `await` 是否背离

当存储延迟突增但 %util 很低（比如 await（平均每次 I/O 耗时）和 r_await/w_await：如果它们飙升到几十甚至上百毫秒，但 svctm（实际服务时间）仍很低（

常见诱因包括：

上层应用突发大量随机小 I/O，触发内核 elevator 队列积压
使用了 cfq 或 bfq 调度器且权重配置不当，导致某进程饿死或抢占过度
块设备启用了 rotational=0 但底层其实是慢速 SATA SSD，调度器误判为 NVMe 导致激进合并

查 `/sys/block/*/queue/scheduler` 和 `iosched` 参数是否匹配硬件类型

SSD 和 NVMe 应该用 none（即 mq-deadline 或直接绕过调度器），而传统 HDD 才适合 cfq 或 bfq。运行 cat /sys/block/nvme0n1/queue/scheduler，若输出是 [bfq] mq-deadline none，但设备是 NVMe，括号里不该是 bfq —— 这会引入不必要的排序与延迟。

临时切换（以 nvme0n1 为例）：

echo none > /sys/block/nvme0n1/queue/scheduler

注意：none 在较新内核中等价于禁用多队列调度，对 NVMe 更友好；但若用的是老内核（mq-deadline。永久生效需改 /etc/default/grub 中的 GRUB_CMDLINE_LINUX，加 scsi_mod.use_blk_mq=1 nvme_core.default_ps_max_latency_us=0 等参数。

用 `blktrace` 抓原始 I/O 时间线，定位卡点在哪一层

iostat 只给平均值，掩盖毛刺；blktrace 能记录每个 I/O 从提交（Q）、排队（G）、派发（D）、完成（C）的精确时间戳。运行：

blktrace -d /dev/nvme0n1 -o - | blkparse -i -

重点关注两段差值：

魔术橡皮擦

智能擦除、填补背景内容

下载

Q → G 延迟大 → 应用或文件系统层阻塞（如 XFS 日志锁、ext4 journal wait）
G → D 延迟大 → 块层调度器或队列深度不足（/sys/block/nvme0n1/device/queue_depth 太小）
D → C 延迟大 → 真实设备响应慢（坏块、固件 hang、PCIe link 降速）

如果发现大量 Q 到 G 耗时 >100ms，别急着查磁盘，先用 perf record -e 'block:*' -a sleep 10 看内核栈，常会暴露在 xfs_log_force 或 __ext4_journal_start 卡住。

警惕 `vm.dirty_ratio` 和 `vm.dirty_background_ratio` 引发的 writeback 风暴

当脏页积累到 vm.dirty_background_ratio（默认 10%）时，内核后台线程开始刷盘；一旦冲到 vm.dirty_ratio（默认 20%），所有写进程会同步阻塞直到脏页回落。此时 iostat 可能显示 await 暴涨、w_await 远高于 r_await，且 biotop 里 kswapd0 或 flush-* 进程占高 I/O。

检查当前值：

sysctl vm.dirty_ratio vm.dirty_background_ratio vm.dirty_expire_centisecs

典型调优方向：

降低 vm.dirty_expire_centisecs（默认 3000 = 30 秒），让脏页更早被回收
提高 vm.dirty_background_ratio 至 15，避免 flush 线程太激进干扰前台 I/O
对数据库类负载，建议关掉 vm.swappiness（设为 0），防止 page reclaim 误杀 buffer cache

这些参数改动后，必须观察 /proc/vmstat 中的 pgpgout、pgmajfault 和 pgpgin 是否异常跳变——调得太激进反而引发 swap thrashing。

真正难排查的是混合场景：比如 NFS 客户端 + 本地 ext4 + dirty_ratio 偏高 + scheduler 错配，多个延迟源叠加，await 看似统一升高，但根因分散在四层。这时候不能只盯一个指标，得把 blktrace、/proc/diskstats、perf script -F comm,pid,tid,usyms 和 dmesg -T | grep -i "nvme\|ata\|timeout" 四路日志对齐时间轴。

Linux 服务启动顺序配置实战

Linux 系统暴露端口的安全风险评估

Linux 运维经验如何沉淀为流程

Linux 磁盘 IO 等待过高的定位方法

Linux SSH 配置错误导致无法登录的恢复方案

相关标签:

linux ai ios linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 网络通信的整体流程下一篇：irqbalance 服务失效导致单核 net_rx 打满的 irq affinity 手动绑定方法

作者最新文章

百度集卡活动怎么玩 2026百度集卡分5亿活动玩法攻略

2026-02-04 17:16

mdadm RAID rebuild 极慢的 bitmap / speed_limit_min/max 加速参数

2026-02-04 17:32

2026百度春节分5亿活动攻略官方活动入口秒参与

2026-02-04 17:38

Claude中文版镜像网站靠谱吗？Claude镜像站使用风险说明

2026-02-04 17:41

PostgreSQL 物化视图在高频查询聚合场景的刷新策略

2026-02-04 17:42

chronyc tracking Root delay / dispersion 异常大的 NTP 源更换方案

2026-02-04 17:43

vivo云服务官网在哪 VIVO云服务官网怎么找

2026-02-04 17:51

Linux 网络通信的整体流程

2026-02-04 17:51

豆包生成AI图片怎样才能精准提升出图准确率技巧

2026-02-04 17:51

vivo云服务器官网入口 vivo定位云服务官网

2026-02-04 17:53

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1456

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

709

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

296

2023.06.30

linux修改文件名

本专题为大家提供linux修改文件名相关的文章，这些文章可以帮助用户快速轻松地完成文件名的修改工作，大家可以免费体验。

783

2023.07.05

linux系统安装教程

linux系统是一种可以免费使用，自由传播，多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章，大家可以免费体验。

577

2023.07.06

linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统，存在着许多不同的Linux版本，但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中，比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

552

2023.07.20