df命令查看文件系统整体空间使用情况,du命令统计目录或文件实际占用空间;df基于文件系统元数据快速显示挂载点使用状态,du通过遍历目录计算具体空间消耗;二者差异常因已删除但被进程占用的“幽灵文件”导致数据不一致;使用df -h可快速识别高使用率分区,结合-i可检查inode耗尽问题,而du -sh与--max-depth配合sort命令能精准定位占用空间大的目录或文件。

在Linux系统里检查磁盘使用率,通常会用到
df和
du这两个命令。简单来说,
df关注的是整个文件系统的空间使用情况,告诉你还有多少“空地”;而
du则深入到目录和文件层面,帮你找出具体是哪些文件或文件夹占用了空间。它们各自有其擅长的场景,理解它们的区别能让你更高效地管理磁盘。
解决方案
要检查Linux中的磁盘使用率,最直接的方式就是运用
df和
du命令。
使用df
命令查看文件系统整体使用情况:
df(disk free)命令用于显示文件系统上的可用磁盘空间。它读取的是文件系统的元数据,所以能快速给出整个挂载点的信息。
常用选项:
-h
:以人类可读的格式(如G、M)显示大小。-T
:显示文件系统类型。-i
:显示inode使用情况。
示例:
df -h # 显示所有文件系统的磁盘使用情况,人类可读 df -h /home # 仅显示/home分区的磁盘使用情况 df -hT # 显示文件系统类型和磁盘使用情况
使用du
命令查看目录或文件占用空间:
du(disk usage)命令用于估算文件或目录的磁盘空间使用量。它会遍历指定目录下的所有文件和子目录,并累加它们的大小。
常用选项:
-h
:以人类可读的格式显示大小。-s
:仅显示总计(summarize)。-c
:显示所有参数的总计。--max-depth=N
:仅显示指定深度内的目录使用情况。
示例:
du -sh /var/log # 汇总显示/var/log目录的总大小 du -h --max-depth=1 / # 显示根目录下各一级子目录的大小 du -h /path/to/your/dir # 显示指定目录及其子目录的详细大小
df
与du
命令的核心差异是什么?
这是个经常让人困惑的问题,甚至有时候你会发现它们给出的数字完全对不上号。在我看来,理解它们的根本工作方式是关键。
df命令,它就像是一个站在高处的管理员,它看的是整个仓库(文件系统)还剩下多少空间,以及已经使用了多少。它直接查询文件系统的超级块(superblock)信息,快速得出结论。所以,当你想知道
/dev/sda1这个分区是不是快满了,或者
/var挂载点是不是空间告急,
df就是你的首选。它给出的数据是文件系统层面的“可用空间”和“已用空间”。
而
du命令,它更像是一个勤劳的审计员,它会逐个房间(目录)去清点每个箱子(文件)的大小,然后把所有箱子的大小加起来。所以,
du的结果是实际文件占用的空间总和。当你发现某个分区快满了,但又不知道具体是哪个文件夹在“捣鬼”时,
du就能帮你一层层地剥开,找到那个真正占用大空间的元凶。
它们之间最常见的差异来源,往往是那些“幽灵文件”——也就是已经被删除,但仍然被某个进程打开着的文件。
df会认为这些文件占用的空间还没有被释放,因为它还在文件系统上被标记为“使用中”。但
du在遍历目录时,这些文件已经不在目录树里了,所以它不会把它们计算在内。结果就是,
df显示空间不足,但
du却告诉你总和没那么大。这时候,通常需要重启相关服务或者进程,才能真正释放这些空间。还有一些情况,比如稀疏文件(sparse files)或者硬链接,也会导致两者数据不完全一致,但“幽灵文件”是最常见的场景。
如何有效利用df
命令检查磁盘空间?
df命令在日常系统维护中非常有用,它能让你快速掌握各个挂载点的健康状况。我通常会这样做:
1. 快速概览: 运行
df -h是我的第一步。这能让我一眼看到所有挂载点(包括物理分区、虚拟文件系统如
tmpfs、
devtmpfs等)的使用情况,以及它们各自的容量、已用、可用空间和使用百分比。如果看到某个分区的利用率接近90%甚至更高,那我就知道需要重点关注了。
df -h
输出会类似这样:
文件系统 容量 已用 可用 已用% 挂载点 udev 3.9G 0 3.9G 0% /dev tmpfs 798M 1.6M 797M 1% /run /dev/sda1 40G 35G 2.5G 94% / tmpfs 3.9G 0 3.9G 0% /dev/shm tmpfs 5.0M 4.0K 5.0M 1% /run/lock /dev/sda2 100G 50G 50G 50% /home tmpfs 798M 12K 798M 1% /run/user/1000
这里,
/dev/sda1的使用率达到了94%,这通常意味着该分区快满了,需要立即处理。
2. 关注特定分区: 如果我知道某个服务的数据都放在
/var目录下,我会直接
df -h /var来查看它的独立空间情况,而不是在茫茫列表中寻找。
df -h /var
3. 检查inode使用情况: 有时候,磁盘空间明明还有很多,但你却无法创建新文件。这很可能是因为inode(索引节点)用完了。Inode是文件系统用来存储文件元数据(如文件大小、权限、所有者、时间戳等)的数据结构。每个文件或目录都需要一个inode。在处理大量小文件(比如邮件服务器、Web缓存)时,inode耗尽是个常见问题。
df -hi # 检查所有文件系统的inode使用情况
如果看到某个分区的
IUse%很高,即使
Use%不高,也说明inode快用完了。
4. 过滤不关心的文件系统: 对于日常监控,我通常不关心
tmpfs、
devtmpfs、
udev这类虚拟文件系统,因为它们是内存文件系统或设备文件系统,不会真正耗尽物理磁盘空间。可以使用
-x选项排除它们:
df -hT -x tmpfs -x devtmpfs -x udev
这样输出会更干净,只显示你真正关心的物理磁盘挂载点。
如何有效利用du
命令查找大文件或目录?
当
df告诉你某个分区快满了,
du就成了你的侦探工具,帮你揪出那些“空间大户”。它的使用场景非常灵活。
1. 快速定位当前目录总大小: 进入一个你怀疑有问题的大目录,比如
/var/log,然后运行:
cd /var/log du -sh .
.代表当前目录,
-s汇总,
-h人类可读。这会告诉你当前目录的总大小。
2. 找出子目录中的“胖子”: 如果
/var/log很大,我想知道是哪个子目录贡献了大部分空间,我就会使用
--max-depth和
sort命令:
du -h --max-depth=1 /var/log | sort -rh
-h人类可读,
--max-depth=1只显示一级子目录,
sort -rh按照人类可读的大小逆序排序,最大的排在最前面。这通常能快速定位到像
apache2、
nginx或
mysql这类服务产生的巨型日志目录。
3. 查找整个文件系统中的大文件(需要谨慎): 如果你想全局查找,但又不想遍历
/proc、
/sys这些虚拟文件系统,可以使用
--exclude:
du -h --exclude=/proc --exclude=/sys --exclude=/dev --max-depth=1 / | sort -rh
这会显示根目录下所有一级子目录的大小,并排除掉那些不实际占用磁盘空间或不应被遍历的目录。
4. 结合find
命令查找特定类型的大文件:
假设你想找出所有大于1GB的
.log文件:
find / -name "*.log" -type f -size +1G -print0 | xargs -0 du -h
find命令在这里负责找到符合条件的文件,
-print0和
xargs -0确保文件名中即使有空格或特殊字符也能正确处理,然后
du -h对这些找到的文件进行大小统计。
5. 找出某个目录下的前N个大文件: 这在清理日志或缓存时非常实用。
du -a /path/to/dir | sort -n -r | head -n 10
-a会列出所有文件和目录的大小,
sort -n -r按数字逆序排序,
head -n 10只显示前10行。如果想看人类可读的格式,可以这样:
du -ah /path/to/dir | sort -rh | head -n 10
需要注意的是,
du在处理大量文件时可能会比较慢,尤其是在大容量磁盘上。所以,通常建议先用
df确定大方向,再用
du缩小范围,一步步地定位问题。










