0

0

Linux 文件系统是如何组织磁盘数据的?

舞夢輝影

舞夢輝影

发布时间:2026-01-23 20:26:03

|

650人浏览过

|

来源于php中文网

原创

CHS与LBA是磁盘寻址的两种方式,CHS为物理三维坐标,LBA为其线性映射;现代系统仅用LBA,由固件或驱动完成转换,文件系统如ext4直接基于LBA分配数据块。

linux 文件系统是如何组织磁盘数据的?

磁盘物理结构决定寻址方式:CHS 和 LBA 是什么关系?

Linux 文件系统不直接操作磁盘的物理表面,但它的底层设计必须适配磁盘的硬件组织逻辑。机械磁盘(HDD)由多个盘片、磁头、磁道、扇区和柱面构成,而定位任意一个 512字节 的扇区,传统上靠 CHS(柱面-磁头-扇区)三维坐标——比如 C=100, H=3, S=12。现代驱动固件早已把这套映射转为线性地址 LBA(Logical Block Address),操作系统只跟 LBA 打交道。

关键点在于:ext4 等文件系统分配数据块时,用的不是 CHS,而是从 0 开始编号的 LBA 块号;但内核 I/O 子系统最终仍需通过设备驱动将 LBA 转回 CHS(或由 SSD/NVMe 控制器内部再转译)。如果你在 dmesg 里看到 "I/O error on device sda, logical block 0x1a2b3c",那个十六进制数就是 LBA。

  • 不要手动算 CHS → LBA 公式(LBA = C × H × S + H × S + (S−1)),BIOS/固件已封装;但调试磁盘坏道时,hdparm --read-sectordd if=/dev/sda of=/dev/null bs=512 skip=123456 依赖的就是 LBA 偏移
  • SSD 虽无物理磁道,但仍模拟 LBA 接口,所以文件系统层无需修改;但“写放大”“磨损均衡”等行为发生在固件层,ext4 不知情
  • /sys/block/sda/queue/logical_block_size 查到的未必是 512 —— 很多新盘标称 4096(4K 扇区),此时一个逻辑块 = 8 个传统扇区,fdisk 对齐错误会导致性能暴跌

文件系统如何把“文件”变成磁盘上的块?inode 是核心枢纽

你在 ls -li 看到的第一列数字,就是 inode 编号。它不是文件名,而是指向一个固定大小(通常 256 字节)元数据结构的指针。这个结构里存着:文件类型、权限、所有者、时间戳、链接数,最关键的是——指向实际数据块的指针列表。

也就是说,/home/user/doc.txt 这个路径只是目录项(dirent)里的一个名字+inode号映射;真正读取内容时,内核先查目录找到 inode 号,再查 inode table 拿到数据块编号,最后去对应 LBA 位置读取。

  • 小文件(≤60 字节)可能直接塞进 inode 里(ext4 支持 inline data),不占额外数据块
  • 大文件用三级间接块:直接块(12 个)、一次间接块(指向块表)、二次间接块(指向块表的块表)……层级越多,访问延迟越高
  • stat /path/to/file 显示的 Blocks: 是按 512 字节单位统计的,和 du -b 不同;而文件系统分配是以 block size(如 4096)为单位,ls -l 显示的大小 ≠ 占用空间

超级块、块组、位图:文件系统怎么管理“空闲”与“已用”?

整个分区格式化成 ext4 后,开头第一个块就是 superblock,它记录了总块数、空闲块数、块大小、inode 总数等全局信息。但只靠一个超级块太危险——损坏就全盘崩溃。所以 ext4 在每个 block group(默认每 16384 个块一组)开头都备份一份超级块,并附带该组的 inode bitmapblock bitmap

卓丰企业网站管理系统英文版
卓丰企业网站管理系统英文版

新增功能: 1.增加文件下载系统; 2.美化后台登陆界面; 3.完善前后台登陆系统安全性; 4.后台登陆加了验证码; 5.修正组织结构的后台管理; 6.修正所有发现的小错误; 7.美化页面; 后台主要功能如下: 一、系统管理:管理员管理,可以新增管理员及修改管理员密码;数据库备份,为保证您的数据安全本系统采用了数据库备份功能;上传文件管理,管理你增加产品时上传的图片及其他文件。 二、企业信息:可

下载

这两个位图就是开关阵列:每个 bit 对应一个 inode 或一个数据块,“1”表示已用,“0”表示空闲。创建文件时,文件系统扫描位图找第一个 0,设为 1,再更新超级块里的空闲计数。

  • dumpe2fs -h /dev/sda1 看超级块摘要;dumpe2fs -x /dev/sda1 可导出位图二进制,但一般没必要——e2fsck -n 就能检查一致性
  • 删除文件 ≠ 清空数据块,只是把 inode 标记为未用、对应位图 bit 置 0;原数据还在,直到被新文件覆盖——这就是恢复工具(如 extundelete)的原理
  • 频繁小文件写入容易导致位图碎片化,ext4 默认启用 flex_bg(弹性块组)缓解,但 SSD 上影响不大

挂载与 VFS:为什么 /proc/sys 看起来像文件却不在磁盘上?

Linux 用虚拟文件系统(VFS)抽象所有存储后端:无论是真实磁盘上的 ext4、网络存储的 nfs,还是纯内存的 tmpfs,都统一提供 open()/read()/write() 接口。而 /proc/sys 是典型的伪文件系统(procfssysfs),它们根本没数据块,每次 cat /proc/meminfo 都是内核现场拼字符串返回。

这解释了为什么 df 显示 /proc 占用 0 字节,而 ls /proc 却能看到几百个“目录”——它们是内核数据结构的实时投影,不是磁盘映射。

  • mount -t proc proc /proc 是必需步骤,否则 /proc 下为空;但多数发行版启动时自动完成
  • 你不能对 /proc/sys/net/ipv4/ip_forward 执行 ln -s,因为它是只读接口;写入生效靠 echo 1 > ... 触发内核回调,不是改磁盘
  • /dev 下的设备文件(如 /dev/sda)也不是磁盘内容,而是内核设备模型的入口节点,访问它会触发驱动程序,而非读块设备
文件系统组织数据的复杂性,往往藏在“看不见”的地方:比如位图更新是否落盘(data=ordered vs data=writeback)、日志何时刷写(jbd2)、甚至 CPU 缓存行对齐是否影响 inode 访问效率。这些细节不常暴露,但一旦出问题(如断电后 ext4 报错 requiring fsck),根源几乎都在元数据与物理块映射的衔接环节。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

233

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

437

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

764

2023.08.22

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

188

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

291

2023.10.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

278

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1491

2023.10.24

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

10

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.7万人学习

Git 教程
Git 教程

共21课时 | 2.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号