0

0

c++如何读取csv文件数据_c++解析csv代码【源码】

冰火之心

冰火之心

发布时间:2026-01-27 15:23:02

|

932人浏览过

|

来源于php中文网

原创

最稳妥方式是用std::getline按行读取后手动实现CSV状态机解析:区分unquoted/quoted/escaped_quote三态,正确处理引号转义、嵌套逗号及换行,避免直接用逗号分隔或operator>>破坏结构。

c++如何读取csv文件数据_c++解析csv代码【源码】

std::ifstream 逐行读取 CSV 最稳妥

CSV 不是标准格式,没有统一规范,所以别指望有“万能解析库”——C++ 标准库本身也不提供 CSV 解析。最可控的方式是手动按行读取,再用简单分隔逻辑拆字段。关键不是“多快”,而是“不误判换行、引号、逗号”。

常见错误现象:std::getline 直接用 ',' 当分隔符会崩,因为字段里可能含逗号(如 "Smith, John",25,"New York");用 operator>> 会跳过空格和换行,彻底破坏结构。

  • 始终用 std::getline(in, line) 按行读,保留原始换行信息
  • 对每一行,从左到右扫描,遇双引号就进入“quoted mode”,跳过内部的逗号和换行
  • 字段间以非 quoted 状态下的逗号为界,行尾也算一个字段结束点
  • 记得处理 \r\n(Windows)和 \n(Unix)兼容性,std::getline 默认按 \n 切,一般够用

处理带引号的字段必须自己写状态机

标准 CSV 规则(RFC 4180)规定:字段含逗号、换行或双引号时,必须用双引号包裹;双引号本身用两个双引号表示("")。想靠 std::string::find + substr 硬切,十次有九次漏掉嵌套引号或转义。

实操建议:写一个极简状态机,三个状态足矣:unquotedquotedescaped_quote。每读一个字符就更新状态和当前字段内容。

立即学习C++免费学习笔记(深入)”;

Figma
Figma

Figma 是一款基于云端的 UI 设计工具,可以在线进行产品原型、设计、评审、交付等工作。

下载

示例片段(核心逻辑):

std::vector fields;
std::string field;
bool in_quotes = false;
for (char c : line) {
    if (!in_quotes && c == ',') {
        fields.push_back(std::move(field));
        field.clear();
    } else if (c == '"') {
        if (in_quotes && line.substr(pos, 2) == "\"\"") {
            field += '"';
            pos++; // skip next quote
        } else {
            in_quotes = !in_quotes;
        }
    } else {
        field += c;
    }
}
fields.push_back(std::move(field));

别用 std::stoi/std::stod 直接转数值字段

CSV 字段可能是空、全是空格、或非法数字(如 "N/A"),直接调 std::stoi 会抛 std::invalid_argument 异常,程序崩溃。生产代码必须做前置校验。

  • 先用 field.find_first_not_of(" \t") 检查是否为空白
  • 再用 std::from_chars(C++17 起)替代 std::stoi:它不抛异常,返回 std::errc::invalid_argument 错误码,且不跳过尾部垃圾字符(比如 "123abc" 不该算合法整数)
  • 如果字段是日期、布尔等类型,别硬转——先存 std::string,后续按需解析,避免早期失败

内存与性能:小文件用 vector,大文件考虑流式处理

读完整个 CSV 再解析,对几百 MB 的文件就是灾难:内存暴涨,且无法及时响应部分数据。但也不是所有场景都要上 mmap 或异步 IO。

  • 若单行不超过几 KB、总行数 std::vector<:vector>> 完全 OK
  • 若要边读边处理(如导入数据库、实时统计),把解析逻辑封装成回调:每次成功提取一行,立刻调用 process_row(const std::vector<:string>&)
  • 避免在循环里反复 new/deletestd::string 频繁重分配:复用 fieldfields 容器,调用 .clear() 而非重建
实际最难的部分不是读,而是定义“这个字段到底算什么类型”——CSV 没 schema,同一列前 100 行是数字,第 101 行突然变成字符串,这种情况必须提前约定规则,或留好 fallback 路径。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

422

2023.08.02

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

529

2023.09.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1498

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

623

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

592

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

587

2024.04.29

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.9万人学习

Excel 教程
Excel 教程

共162课时 | 13.7万人学习

PHP基础入门课程
PHP基础入门课程

共33课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号