C++中std::regex基础处理需掌握编译、match、search、replace四操作;需包含头文件,推荐GCC 5+等新编译器;regex_match要求全字符串匹配,regex_search查找子串并支持分组捕获。

在C++中使用std::regex做基础文本处理,关键在于掌握四个核心操作:编译正则表达式、匹配(match)、搜索(search)和替换(replace)。它从C++11开始引入,依赖头文件,注意部分旧编译器(如GCC 4.9前)支持不完整,建议用GCC 5+、Clang 3.5+或MSVC 2015+。
一、编译正则表达式对象
正则表达式需先构造成std::regex对象,可指定标志控制行为:
-
std::regex_constants::icase:忽略大小写 -
std::regex_constants::extended(默认):启用扩展语法(如+、?、|) -
std::regex_constants::ECMAScript:更接近JavaScript风格(推荐新手用)
示例:
std::regex re(R"(\b[A-Za-z]+\b)", std::regex_constants::icase);二、判断是否匹配(match)
std::regex_match要求**整个字符串完全符合模式**,适合校验格式(如邮箱、日期):
立即学习“C++免费学习笔记(深入)”;
std::string s = "123";bool ok = std::regex_match(s, std::regex(R"(\d{3})")); // true
⚠️ 注意:"123abc"对R"(\d{3})"会返回false,因为没匹配整串。若只想检查开头,改用regex_search。
三、查找子串(search)与提取内容
std::regex_search在字符串中找**任意位置的子匹配**,配合std::smatch还能捕获分组:
std::regex price_re(R"(\$(\d+\.\d+))");
std::smatch result;
if (std::regex_search(text, result, price_re)) {
std::cout }
四、简单替换(replace)
std::regex_replace返回新字符串,原字符串不变:
std::string replaced = std::regex_replace(s, std::regex(R"(\b\w{3}\b)"), "XXX");
// 结果:"XXX XXX bird"
支持用$1、$2引用捕获组,例如把"2023-12-01"转成"01/12/2023":
std::regex_replace("2023-12-01", ymd_re, "$3/$2/$1");
不复杂但容易忽略:正则字符串中的反斜杠要双写(如"\\d"),或直接用原始字符串字面量R"(\d)"避免转义错误;调试时可先用在线工具(如regex101.com)验证模式逻辑。











