
用 std::string::find_first_not_of 和 std::string::find_last_not_of 去除首尾空格
这是最常用、最可控的方式,适用于 C++98 及以上标准,不依赖第三方库。核心思路是分别找第一个非空格字符位置和最后一个非空格字符位置,再用 substr 截取。
注意:默认只识别 ASCII 空格(' '),不处理制表符 '\t'、换行符等。如需支持所有空白字符,应传入 " \t\n\r\f\v" 作为查找字符集。
std::string trim(const std::string& s) {
size_t start = s.find_first_not_of(" ");
size_t end = s.find_last_not_of(" ");
if (start == std::string::npos) return "";
return s.substr(start, end - start + 1);
}-
find_first_not_of返回第一个不在指定字符集中的位置,找不到则返回std::string::npos - 若字符串全为空格,
start和end都为npos,必须提前判断,否则substr行为未定义 - 直接修改原字符串可用
s.erase(0, start).erase(s.find_last_not_of(" ") + 1);,但两次erase效率略低
用 std::isspace 配合迭代器遍历实现通用空白字符裁剪
当需要兼容 Unicode 环境(如 locale-aware 处理)或严格按 C 标准空白字符(isspace 定义的 6 类)时,不能只靠字符串字面量匹配。此时应逐字符判断。
注意:std::isspace 接收 int,传入 char 前必须先转为 unsigned char,否则对负值字符(如某些 locale 下的高位字节)会触发未定义行为。
立即学习“C++免费学习笔记(深入)”;
std::string trim(const std::string& s) {
if (s.empty()) return s;
size_t start = 0, end = s.size();
while (start < end && std::isspace(static_cast(s[start]))) ++start;
while (end > start && std::isspace(static_cast(s[end-1]))) --end;
return s.substr(start, end - start);
} - 使用
static_cast是关键防御点,漏掉会导致崩溃或误判 - 循环用
while比find_if+ lambda 更轻量,无额外函数对象开销 - 该版本天然支持
'\t'、'\n'、'\r'、'\f'、'\v'和空格,无需手动枚举
避免用 std::regex 做简单去空格
虽然正则能写成 std::regex_replace(s, std::regex("^\\s+|\\s+$"), ""),但完全不推荐用于此场景。
- 编译正则表达式有显著开销,首次调用慢;即使预编译
std::regex对象,匹配本身仍比双指针遍历慢 3–5 倍 -
std::regex在部分标准库实现(如 libstdc++)中 bug 较多,尤其在空字符串或全空白输入下易抛std::regex_error - 增加二进制体积,且无法在 constexpr 上下文中使用(C++20 起
std::regex仍不可 constexpr)
原地修改 vs 返回新字符串的取舍
是否该提供就地裁剪(void trim_inplace(std::string&))?取决于调用上下文。
- 高频调用(如解析日志行)建议就地修改,避免频繁内存分配;但要注意引用失效风险(例如该字符串被
std::vector<:string>::emplace_back后又 trim) - 函数式风格(如管道式处理
trim(s).to_upper().split(","))必须返回新字符串,否则链式调用断裂 - 没有“绝对正确”的选择——
std::string的 copy-on-write 已被废弃,现代实现中返回值优化(RVO)基本消除了拷贝成本
真正容易被忽略的是:所有这些方法都只处理首尾,不碰中间空格。若需求是“压缩所有连续空白为单个空格”,就得另写逻辑——那已不属于 trim 范畴。











