用 std::ofstream 手动写 CSV 最轻量可控;字段含逗号、换行或双引号时须用双引号包裹且内部双引号转义为"";空字段保留,行末不加逗号;推荐 UTF-8 编码与 \n 换行。

直接用 std::ofstream 写 CSV 是最轻量、最可控的方式;别一上来就找第三方库——除非你真要解析带换行、引号、逗号的脏数据。
用 std::ofstream 手动写入 CSV(基础但够用)
绝大多数内部数据导出场景(如日志、实验结果、配置快照)不需要处理 RFC 4180 全部规则,手动转义更清晰。
- 字段含逗号、换行或双引号时,必须用双引号包裹,且内部双引号要变成两个双引号(
"") - 每行末尾不加逗号,空字段保留(即
,,合法) - 推荐用
\n换行(Windows 下\r\n非必需,Excel 能识别\n) - 中文字段建议保存为 UTF-8 编码(Windows 记事本默认不认,但 Excel/VS Code/Python pandas 都支持)
std::ofstream file("data.csv");
file << "name,age,score\n";
file << "\"Zhang \"\"San\"\",25,92.5\n";
file << "Li Si,30,87.0\n";
file.close();
读取 CSV 时如何安全分割字段(别用 std::getline + find(',')')
简单按逗号切分会崩在带引号的字段里,比如 "a,b",c 应拆成两列,不是三列。
- 必须状态机式解析:区分“在引号内”和“在引号外”两种模式
- 遇到开头双引号就进入 quoted 模式,直到下一个未被转义的双引号才退出
- 引号内连续两个双引号(
"")视为一个字面双引号,不触发退出 - 换行符只在非 quoted 模式下表示行结束
自己写解析器 20 行能搞定;若项目已用 boost,可用 boost::tokenizer 配合自定义分隔逻辑,但注意它默认不处理引号。
立即学习“C++免费学习笔记(深入)”;
什么时候该用现成 CSV 库(如 csv-parser 或 fast-cpp-csv-parser)
当你遇到这些信号之一时,手写解析就该停了:
- 输入源不可控(用户上传 CSV、第三方 API 返回 CSV)
- 字段含大量嵌套引号、混合换行(如单元格里存 JSON 字符串)
- 需要类型自动推导(把
"123"当int、"2024-01-01"当std::chrono::system_clock::time_point) - 文件 > 100MB 且对性能敏感(这时得看库是否支持流式解析、内存映射)
fast-cpp-csv-parser 无依赖、头文件仅用,适合只读场景;csv-parser(by ben-strasser)支持写入+quoted field,但需 C++17。两者都不处理 BOM,UTF-8 BOM(\xEF\xBB\xBF)得自己跳过。
Windows 下中文乱码的根源和绕过方式
不是 CSV 格式问题,是 Windows 控制台/记事本默认用 GBK 解码 UTF-8 文件 —— Excel 却能正常显示,因为 Excel 有 BOM 自动探测逻辑。
- 写入前加 UTF-8 BOM:
file (仅对记事本有效,不影响其他程序) - 用 VS Code / Notepad++ 打开,手动设编码为 UTF-8
- 彻底规避:生成 CSV 后用 Python 快速转成 Excel(
pandas.read_csv(...).to_excel(...)),一劳永逸
真正难的不是写 CSV,是让下游工具(尤其是旧版 Excel VBA、某些国产报表系统)接受你写的格式——它们常要求 CR+LF、BOM、字段全引号。这些细节没文档,只能靠抓包或试错。











