使用std::string_view实现无拷贝字符串分割,通过find定位分隔符并返回子串视图,避免内存分配;支持自定义谓词分割与空字段处理,结合emplace_back和reserve优化性能,适用于高效大文本解析场景。

在C++中实现一个高效的字符串分割函数,关键在于避免不必要的内存分配和拷贝操作。标准库没有提供原生的split函数,因此需要手动实现。一个高效且实用的方案是结合std::string_view(C++17起)来避免复制子串,仅记录位置和长度。
使用 std::string_view 实现无拷贝分割
std::string_view 是轻量级的字符串视图,不拥有数据,只持有指针和长度,非常适合用于分割场景。
以下是一个高效的split函数实现:
#include <string_view>
#include <vector>
#include <algorithm>
<p>std::vector<std::string_view> split_string(std::string_view str, char delimiter) {
std::vector<std::string_view> result;
size_t start = 0;</p><pre class='brush:php;toolbar:false;'>while (start < str.size()) {
auto end = str.find(delimiter, start);
if (end == std::string_view::npos) {
result.emplace_back(str.substr(start));
break;
}
result.emplace_back(str.substr(start, end - start));
start = end + 1;
}
return result;}
立即学习“C++免费学习笔记(深入)”;
这个版本的优点:
- 不进行任何字符串拷贝,所有子串以
string_view形式返回 - 使用
find快速定位分隔符,减少循环开销 - 适用于大文本解析,性能接近C风格处理
支持多字符分隔符与自定义谓词
如果需要更灵活的分割逻辑,比如按多个字符或条件分割,可以扩展接口:
std::vector<std::string_view> split_by_predicate(std::string_view str,
const std::function<bool(char)>& pred) {
std::vector<std::string_view> result;
size_t start = 0;
<pre class='brush:php;toolbar:false;'>for (size_t i = 0; i <= str.size(); ++i) {
if (i == str.size() || pred(str[i])) {
if (i > start) {
result.emplace_back(str.substr(start, i - start));
}
start = i + 1;
}
}
return result;}
立即学习“C++免费学习笔记(深入)”;
调用示例:
auto parts = split_by_predicate("a,b;c|d", [](char c) {
return c == ',' || c == ';' || c == '|';
});
处理空字段与连续分隔符
有些场景下连续分隔符应视为多个空字段(如CSV),而有些则需忽略。可以通过参数控制行为:
若要跳过空字段,在添加前判断长度即可:
if (i > start) { // 只有非空才加入
result.emplace_back(...);
}
性能优化建议
- 优先使用
std::string_view代替std::string接收输入 - 对结果容器预分配空间(如知道大致段数可用
reserve) - 避免在循环中频繁调用
push_back,改用emplace_back - 对于固定分隔符,直接比较比正则表达式快得多
基本上就这些。核心思路是:能不用拷贝就不拷贝,能少遍历就少遍历。配合现代C++特性,既能写出清晰代码,又能保证高性能。











