C++中使用正则需包含头文件,支持regex_match全匹配、regex_search搜索、regex_replace替换及分组提取,结合smatch和sregex_iterator可实现高效文本处理,注意复用regex对象以提升性能。

在C++中使用正则表达式需要借助标准库中的
包含头文件与命名空间
使用正则功能前,先引入头文件:
#include#include iostream>
#include
通常也会使用 std 命名空间简化代码:
using namespace std;基本匹配:regex_match
regex_match 用于判断整个字符串是否完全匹配某个正则模式。
立即学习“C++免费学习笔记(深入)”;
示例:验证一个字符串是否为纯数字
string text = "12345";regex pattern(R"(\d+)"); // 匹配一个或多个数字
if (regex_match(text, pattern)) {
cout }
注意:如果字符串是 "abc123" 或 "123abc",则不会匹配,因为 regex_match 要求整个字符串符合模式。
部分搜索:regex_search
regex_search 用于在字符串中查找是否存在符合正则的部分。
示例:从一段文本中找出第一个邮箱地址
string text = "联系我 at example@email.com 或 admin@test.org";regex email_pattern(R"(\w+@\w+\.\w+)");
smatch match; // 用于保存匹配结果
if (regex_search(text, match, email_pattern)) {
cout }
match 是一个 smatch 对象,match.str() 返回匹配的子串。
提取分组信息
正则中的括号 () 可以定义“捕获组”,用于提取特定部分。
示例:提取日期中的年月日
string date_str = "2025-04-05";regex date_regex(R"((\d{4})-(\d{2})-(\d{2}))");
smatch pieces;
if (regex_match(date_str, pieces, date_regex)) {
cout cout cout }
pieces[0] 是完整匹配,pieces[1], [2], [3] 分别对应三个括号内的内容。
字符串替换:regex_replace
使用 regex_replace 可以替换符合模式的文本。
示例:将所有连续空格替换为单个空格
string input = "a b c";regex space_regex(R"(\s+)");
string result = regex_replace(input, space_regex, " ");
cout
也可以用于格式化,比如把 American 日期转成另一种格式:
string us_date = "04/05/2025";regex us_date_format(R"((\d{2})/(\d{2})/(\d{4}))");
string iso_date = regex_replace(us_date, us_date_format, "$3-$1-$2");
cout
其中 $1, $2, $3 表示第1、2、3个捕获组。
遍历所有匹配结果
要找出字符串中所有符合模式的内容,可以结合 regex_search 和迭代器。
示例:找出文本中所有邮箱
string content = "emails: a@x.com, b@y.org, c@z.net";regex mail_pattern(R"(\w+@\w+\.\w+)");
sregex_iterator pos(content.begin(), content.end(), mail_pattern);
sregex_iterator end;
while (pos != end) {
cout str() ++pos;
}
sregex_iterator 是专门用于遍历 regex_search 结果的迭代器。
常见正则表达式模式参考
- \d:数字,等价于 [0-9]
- \w:字母、数字、下划线
- \s:空白字符(空格、制表符等)
- .:任意字符(除换行外)
- *:前面的字符出现0次或多次
- +:前面的字符出现1次或多次
- ?:前面的字符出现0次或1次
- {n}:前面的字符出现 n 次
- ^:字符串开头
- $:字符串结尾
注意事项与性能提示
regex 对象构造有一定开销,建议重复使用同一个 regex 实例,而不是在循环中频繁创建。
regex number_check(R"(\d+)"); // 放在外面for (int i = 0; i if (regex_match(data[i], number_check)) { ... }
}
避免在循环内定义 regex,否则可能影响性能。
基本上就这些。掌握 regex_match、regex_search、regex_replace 和分组提取,就能应对大多数文本处理任务。C++ 的正则语法接近 Perl 风格,熟悉 JavaScript 或 Python 正则的人会很快上手。不复杂但容易忽略细节,比如全匹配与部分匹配的区别,多加练习即可熟练运用。











