如何在Linux中模式匹配 Linux glob通配符详解

P粉602998670

发布时间：2025-09-02 10:54:02

632人浏览过

来源于php中文网

原创

答案：linux中模式匹配主要依赖shell的glob通配符（如*、?、[]、{}），用于文件名扩展，与正则表达式不同，glob由shell预处理，适用于文件操作，而正则用于文本内容匹配，功能更强大。高效使用需掌握通配符组合、引号作用及扩展glob（extglob），但在复杂场景或海量文件下应结合find等工具以避免性能问题和安全风险。

如何在linux中模式匹配 linux glob通配符详解

在Linux系统中进行模式匹配，我们主要依赖的是shell提供的glob通配符，它是一种文件路径名扩展机制，而非正则表达式。简单来说，当你输入一个命令，shell会先解析其中的通配符，将其扩展为匹配到的文件或目录列表，然后再将这个列表作为参数传递给命令。理解这一点是高效操作Linux文件系统的关键。

解决方案

Linux shell中的glob通配符，其核心就是几个特殊字符：

、

[]

，以及一些扩展形式。掌握它们，你就能在命令行中自如地筛选、操作文件。

*`` (星号)**：这是最常用的通配符，匹配零个或多个任意字符。
- ```
ls *.txt
```
  会列出当前目录下所有以
```
.txt
```
  结尾的文件。
- ```
rm log_*
```
  会删除所有以
```
log_
```
  开头的文件。
- 我个人经常用它来快速查找文件，比如
```
find . -name "*.conf"
```
  ，虽然
```
find
```
  有自己的匹配逻辑，但在shell层面的扩展，
```
*
```
  的便利性是无可替代的。
```
?
```
(问号)：匹配任意一个字符。
- ```
ls file?.log
```
  会匹配
```
file1.log
```
  、
```
fileA.log
```
  等，但不会匹配
```
file10.log
```
  或
```
file.log
```
  。
- 这在我需要处理一系列命名规则严格的文件时特别有用，比如版本号只有一位的文件。
```
[]
```
(方括号)：匹配方括号内列出的任意一个字符。
- ```
ls [abc].txt
```
  会匹配
```
a.txt
```
  、
```
b.txt
```
  、
```
c.txt
```
  。
- ```
ls [0-9].log
```
  匹配所有以单个数字开头并以
```
.log
```
  结尾的文件。
- ```
ls [A-Za-z]*.dat
```
  匹配所有以单个字母开头并以
```
.dat
```
  结尾的文件。
- 你甚至可以在方括号内使用
```
!
```
  或
```
^
```
  来表示“不匹配方括号内列出的任意一个字符”，例如
```
ls [!0-9]*.tmp
```
  会匹配不以数字开头的
```
.tmp
```
  文件。这在排除特定文件时非常方便。
```
{}
```
(花括号)：这是一个强大的“大括号扩展”功能，它允许你指定一个逗号分隔的列表，shell会将其扩展为多个独立的词。
- ```
cp {file1,file2}.conf /etc/
```
  会被扩展为
```
cp file1.conf file2.conf /etc/
```
  。
- ```
touch image_{001..010}.jpg
```
  会创建
```
image_001.jpg
```
  到
```
image_010.jpg
```
  。
- 这在批量操作命名有规律但非连续的文件时，比写循环要简洁得多。

这些基础通配符构成了Linux模式匹配的基石。它们虽然看似简单，但在日常的文件管理和脚本编写中，却能发挥出巨大的效用。

Linux glob通配符与正则表达式有何本质区别？

这个问题，我发现很多初学者，甚至是一些有经验的用户都会混淆。简单来说，glob通配符和正则表达式是为不同目的而设计的，尽管它们都涉及模式匹配。

Glob通配符（Globbing），如我们上面提到的

、

[]

，主要是由shell（如Bash、Zsh）在执行命令之前进行的文件路径名扩展。它的主要作用是根据模式来匹配文件或目录的名称。它不处理文件内容，也不处理更复杂的字符串模式，只关心文件名。它的语法相对简单，功能也相对有限，但对于文件系统操作来说，效率高且直观。比如，

ls *.txt

，shell会先找到所有

.txt

文件，然后把这些文件名传递给

ls

命令。

正则表达式（Regular Expressions，Regex），则是一种更强大、更复杂的字符串匹配语言。它不局限于文件名，可以用来匹配文本文件中的特定字符串、网络数据包中的模式，甚至代码中的特定结构。正则表达式有自己的引擎，通常由像

grep

、

sed

、

awk

、

perl

、

python

等工具或编程语言来实现。它的语法包含锚点（

), 量词（

{n,m}

），分组（

()

），或操作符（

）等，功能非常丰富，能够描述极其复杂的字符串模式。例如，

grep "^[A-Z][a-z]+[0-9]{2}$" file.txt

可以匹配以大写字母开头，后跟一个或多个小写字母，再跟两个数字，并以行尾结束的字符串。

我个人在工作中，如果只是简单的文件操作，比如复制、移动、删除文件，我会毫不犹豫地使用glob通配符，因为它直接、高效。但如果我需要在日志文件中查找符合特定格式的错误信息，或者在配置文件中提取特定参数，那么正则表达式就是我的首选工具，它的精确性和表达力是glob通配符无法比拟的。理解两者的区别，能让你在不同的场景下选择最合适的工具，避免“杀鸡用牛刀”或“巧妇难为无米之炊”的尴尬。

如何在日常命令行操作中高效运用glob通配符？

高效运用glob通配符，不仅仅是记住它们的语法，更重要的是理解它们在shell中的行为，以及如何与其他命令结合。

艺映AI

艺映AI - 免费AI视频创作工具

下载

首先，理解shell扩展的顺序至关重要。当你输入

ls *.txt

时，shell会先进行glob扩展，找到所有匹配的文件，比如

a.txt b.txt c.txt

，然后实际执行的命令是

ls a.txt b.txt c.txt

。这意味着，如果没有任何文件匹配通配符，有些shell（如Bash的默认行为）会直接将未扩展的通配符字符串（

*.txt

）传递给命令，而有些（如

zsh

）则会报错。这一点在编写脚本时尤其需要注意，避免因为文件不存在而导致脚本行为异常。

其次，善用通配符的组合。

比如，要删除所有以
```
temp
```
开头，但不是
```
.log
```
文件的临时文件，你可以尝试
```
rm temp*[^.][^l][^o][^g]
```
。当然，这有点复杂，更常见的是
```
rm temp*
```
然后再手动排除或用
```
find
```
。
我更倾向于用一种更安全的方式，比如先用
```
ls
```
预览匹配结果，确认无误后再执行
```
rm
```
或
```
mv
```
。这是一个非常好的习惯，可以避免很多不必要的错误。
在批量重命名文件时，结合
```
for
```
循环和通配符会非常强大。例如，将所有
```
.jpeg
```
文件改为
```
.jpg
```
：
```
for f in *.jpeg; do mv "$f" "${f%.jpeg}.jpg"; done
```
这里的
```
${f%.jpeg}
```
就是一个shell参数扩展的例子，它会移除变量
```
f
```
结尾的
```
.jpeg
```
部分。

最后，注意引号的使用。如果你不希望shell对通配符进行扩展，就需要用引号将其括起来。

```
echo *.txt
```
会打印出所有匹配的文件名。
```
echo "*.txt"
```
则会直接打印字符串
```
*.txt
```
。这在向某些命令传递字面量字符串（例如在
```
find -name
```
中）时非常关键，因为
```
find
```
命令有自己的模式匹配逻辑，它不希望shell提前扩展。

处理复杂文件模式时，glob通配符有哪些高级技巧或限制？

当标准glob通配符无法满足需求时，我们通常会遇到两种情况：一是需要更精细的控制，二是遇到了glob本身的限制。

高级技巧：扩展glob（Extglob）

Bash shell提供了一个强大的功能叫做“扩展glob”（Extended Globbing），它通过

shopt -s extglob

命令开启。一旦开启，你就能使用一些类似于正则表达式的更高级模式：

?(pattern)
：匹配零个或一个

pattern

。

```
ls file?(1).txt
```
会匹配
```
file.txt
```
和
```
file1.txt
```
。

*`(pattern)

**：匹配零个或多个

pattern`。

ls file*(foo).log

会匹配

file.log

、

filefoo.log

、

filefoofoo.log

等。

+(pattern)
：匹配一个或多个

pattern

。

ls file+(bar).conf

会匹配

filebar.conf

、

filebarbar.conf

，但不匹配

file.conf

。

@(pattern)
：精确匹配一个

pattern

。

```
ls @(a|b).txt
```
会匹配
```
a.txt
```
或
```
b.txt
```
。

!(pattern)
：匹配除
```
pattern
```
之外的任何内容。
- ```
rm !(important_file.txt)
```
  会删除当前目录下除了
```
important_file.txt
```
  之外的所有文件。这个功能非常强大，但也非常危险，使用时务必谨慎再谨慎，我曾因此误删过文件，教训深刻。

开启

extglob

后，这些模式可以极大地提升glob的表达能力。不过，使用完毕后，最好用

shopt -u extglob

关闭它，以避免在其他脚本或命令中产生意外行为。

限制与替代方案：

尽管扩展glob增强了功能，但glob通配符仍然有其固有的限制：

无法匹配多行内容：Glob只作用于文件名，无法处理文件内容中的多行模式。这时，
```
grep
```
配合正则表达式是唯一的选择。
不支持前瞻/后顾断言：正则表达式中复杂的“前瞻”和“后顾”功能，在glob中是不存在的。
性能问题：在包含大量文件（例如几十万个文件）的目录中，如果使用过于宽泛的glob模式，shell在进行扩展时可能会消耗大量内存和CPU资源，甚至可能因为扩展后的参数列表过长而超出命令行的最大长度限制（
```
ARG_MAX
```
）。
- 在这种情况下，我通常会转向
```
find
```
  命令。
```
find
```
  有其自身的
```
-name
```
  或
```
-regex
```
  参数来处理文件匹配，它不会一次性将所有匹配的文件名都扩展到命令行上，而是逐个处理，效率更高，也更稳定。例如，
```
find . -name "*.log" -exec rm {} \;
```
  比
```
rm *.log
```
  在处理海量文件时要安全和高效得多。