0

0

Linux 内核日志如何正确解读

冰川箭仙

冰川箭仙

发布时间:2026-01-27 14:13:02

|

223人浏览过

|

来源于php中文网

原创

解题起点是理解dmesg时间戳为开机后相对秒数及子系统标识(如ata1.00:)比错误词更早暴露根源;需用dmesg -l err,warn过滤,重视调用栈而非错误行,联动lspci、modinfo和journalctl -k交叉验证。

linux 内核日志如何正确解读

看懂 dmesg 时间戳和子系统标识是解题起点

内核日志不是按时间顺序“自然阅读”的文本,而是以启动后秒数为基准的相对时间线:[ 1.234567] 表示开机后 1.23 秒,[ 123.456789] 是 123.45 秒。同一问题往往跨多个时间点(比如设备识别→驱动加载→IO失败),必须用这个标尺串起事件链。

  • 子系统标识(如 usb1-1:ata1.00:EXT4-fs (sda1):)比错误词更早暴露问题根源——ata1.00: 后跟 exception Emask 0x0 ... frozen,说明是 SATA 主控卡住,而非上层文件系统损坏
  • 别被 INFO 级日志迷惑:EXT4-fs (sda1): mounted filesystem 看似正常,但如果它出现在 BUG: unable to handle kernel NULL pointer dereference 之后,大概率是 panic 导致的“假挂载”残留
  • 时间戳跳变剧烈(如从 [10.123] 突然跳到 [120.456])可能意味着内核卡死或时钟中断异常,需结合 watch -n1 'cat /proc/uptime' 验证

过滤 dmesg 时只信 -l err,warn,别依赖关键词搜索

grep -i "error"dmesg 是最常见也最危险的习惯——很多关键故障根本不带 “error” 字样,比如 dma timeoutoverrunstuck 或直接静默丢包;而 error 又常出现在无害上下文里(如固件自检提示 “error correction enabled”)。

  • 强制用 dmesg -l err,warn:它基于内核 printk 级别过滤,只保留真正需要人工干预的日志,排除 90% 噪声
  • dmesg -T | grep -E "(nvme|ata|raid|iommu)" 适合排查硬件问题,但必须加 -l err,warn 前缀,否则会混入大量 INFO 级设备枚举信息
  • dmesg -w 实时监听时,若看到连续刷屏的 irq X: nobody cared,说明中断未被正确处理,大概率是驱动 bug 或硬件冲突,此时应立即 sudo lspci -vv -s 定位对应设备

OopsBUG 日志里,调用比错误行更重要

看到 BUG: unable to handle kernel NULL pointer dereference at 0000000000000000kernel BUG at fs/ext4/inode.c:1234!,第一反应不该是查地址,而是找 Call Trace: 后面那一长串函数名。

MOKI
MOKI

MOKI是美图推出的一款AI短片创作工具,旨在通过AI技术自动生成分镜图并转为视频素材。

下载
  • 调用栈最顶行(离 Call Trace: 最近)是崩溃发生的函数,倒数第二行是它的调用者——比如 ext4_writepages+0x123do_writepages+0x45__writeback_single_inode+0x67,说明问题出在 ext4 写回路径,而非通用 VM 子系统
  • 若调用栈含 workqueuetimersoftirq,基本可判定是异步上下文触发的竞态,需检查驱动是否在 softirq 中执行了睡眠操作(如 msleep
  • 寄存器值(如 rax=0000000000000000)仅对内核开发者有意义;普通运维只需确认崩溃是否复现、是否关联特定操作(如插拔某 USB 设备后必现)

别把 dmesg 当唯一证据,必须联动 lspcimodinfojournalctl -k

dmesg 缓冲区内容易被覆盖,重启后丢失;且它不记录用户空间行为与内核模块版本细节,单靠它做判断极易误判。

  • 遇到 i915 0000:00:02.0: [drm] ERROR ...,立刻执行 lspci -vv -s 00:02.0 确认显卡型号和 PCIe 链路状态,再用 modinfo i915 | grep version 核对驱动版本——旧内核 + 新固件常导致此类报错
  • journalctl -k 能读取持久化内核日志(如果 journald 已配置 Storage=persistent),它比 dmesg 多保留时间戳和完整上下文,尤其适合分析重启前最后几秒发生了什么
  • dmesg 显示 Failed to load module xxx,但 ls /lib/modules/$(uname -r)/kernel/drivers/xxx/ 确实存在对应 ko 文件,大概率是签名验证失败(Secure Boot 开启),此时 dmesg | grep -i "signature" 才是关键线索
内核日志解读最难的不是看懂单词,而是分清哪些是症状、哪些是病因——同一行日志,在不同硬件组合、不同内核版本、不同加载顺序下,含义可能完全相反。所以永远先问:这台机器最近改过什么?有没有新插硬件?内核升级过吗?答案往往比日志本身更快指向根因。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

235

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

437

2024.03.01

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

208

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

295

2023.10.25

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

208

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

295

2023.10.25

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

395

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.9万人学习

Git 教程
Git 教程

共21课时 | 3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号