0

0

C++ 怎么读取整个文本文件 C++ ifstream与stringstream配合技巧【文件】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-02-03 15:07:02

|

452人浏览过

|

来源于php中文网

原创

最直接方式是二进制模式下先获取文件大小并预分配string空间,再用read()一次性读取;需注意seekg定位、类型转换及gcount校验。

c++ 怎么读取整个文本文件 c++ ifstream与stringstream配合技巧【文件】

std::ifstream 一次性读入整个文件到 std::string

最直接的方式不是逐行读取,而是把文件当作二进制块加载进内存。关键在于:先获取文件大小,再预分配 std::string 空间,最后用 read() 填充。

  • 必须在打开文件后、读取前调用 seekg(0, std::ios::end)tellg() 获取长度
  • 接着调用 seekg(0, std::ios::beg) 回到开头,否则 read() 会失败
  • read() 的第二个参数是 std::streamsize,需显式转换 static_cast<:streamsize>(size)
  • 读取后要检查 gcount() 是否等于预期字节数,避免 EOF 提前截断
std::ifstream file("data.txt", std::ios::binary);
if (!file.is_open()) return;
file.seekg(0, std::ios::end);
size_t size = static_cast(file.tellg());
file.seekg(0, std::ios::beg);
std::string content(size, '\0');
file.read(&content[0], static_cast(size));
if (file.gcount() != static_cast(size)) {
    // 读取不完整,可能是权限或磁盘错误
}

为什么不用 std::stringstream 配合 std::ifstream 读整个文件?

std::stringstream 本身不提供“批量加载”接口;常见误用是 ss ,它看似简洁,但有隐藏陷阱:

  • 对含 \0 的文本(如 UTF-16 或二进制混合文件)会提前截断,因为 operator 按 C 字符串逻辑处理
  • 无法控制缓冲区大小,大文件时可能反复 realloc,性能差
  • 不区分文本/二进制模式,Windows 下换行符 \r\n 可能被静默转为 \n(取决于 ifstream 打开方式)
  • 若文件为空,rdbuf() 返回空指针, 行为未定义

真要用 stringstream,应只作为中间容器做格式化解析(比如读完原始字节后再喂给 std::istringstream),而非加载主力。

文本文件读取:按行 vs 全量,选哪个?

取决于后续处理逻辑。全量读取适合以下场景:

立即学习C++免费学习笔记(深入)”;

Dora
Dora

创建令人惊叹的3D动画网站,无需编写一行代码。

下载
  • 需要正则全文匹配(如 std::regex_search(content, ...)
  • 解析 JSON/YAML/XML 等结构化文本(解析器通常要求完整字符串输入)
  • 做哈希校验(std::hash<:string>{}(content)

但要注意:

  • 大文件(>100MB)全量加载易触发 OOM,此时必须流式处理
  • UTF-8 文件若含 BOM(0xEF 0xBB 0xBF),全量读取后需手动跳过,而 std::getline 不会自动处理 BOM
  • 跨平台时,Linux/macOS 默认无 BOM,Windows 记事本保存常带 BOM —— 这个差异在全量读取后更明显

Windows 下 std::ifstream 中文路径打不开?

标准库的 std::ifstream 构造函数只接受 const char*,无法直接传入宽字符路径(如 L"中文.txt")。解决方法只有两个:

  • 用 Windows API CreateFileW + _open_osfhandle + fdopen 绕过,再封装成 std::ifstream(复杂且不可移植)
  • 改用 C++17 的 std::filesystem::path 转本地编码(如 GBK),再构造窄字符串路径 —— 但需确保终端和编译环境编码一致,否则仍是乱码

实际项目中,更稳妥的做法是:让用户传入 UTF-8 编码的路径字符串,由程序内部调用 MultibyteToWideChar(CP_UTF8, ...) 转宽字符,再走 WinAPI 打开。标准库本身对此无解。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

425

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

538

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

313

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

78

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

543

2023.08.02

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1907

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2095

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1093

2024.11.28

全国统一发票查询平台入口合集
全国统一发票查询平台入口合集

本专题整合了全国统一发票查询入口地址合集,阅读专题下面的文章了解更多详细入口。

4

2026.02.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.4万人学习

Git 教程
Git 教程

共21课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号