0

0

c++如何实现文件断点续传_c++ 文件流操作与偏移量定位【实战】

穿越時空

穿越時空

发布时间:2026-01-05 16:26:17

|

540人浏览过

|

来源于php中文网

原创

断点续传需以二进制模式打开文件,用seekg()/seekp()定位偏移量,配合原子写入offset文件、分块读写校验gcount()、并发加锁保护,确保偏移量持久化可靠。

c++如何实现文件断点续传_c++ 文件流操作与偏移量定位【实战】

seekg()seekp() 定位到断点位置

断点续传本质是让文件读写从上次中断的字节偏移处继续,C++ 的 std::ifstreamstd::ofstream 都支持基于字节的随机定位。关键不是“怎么打开”,而是“打开后怎么跳到指定位置”。seekg() 控制读取位置(get),seekp() 控制写入位置(put),二者都接受 std::ios_base::begstd::ios_base::curstd::ios_base::end 三种基准模式。

常见错误是:打开文件时没加 std::ios::binary,导致文本模式下换行符被转换,seekg(100) 实际跳不到第 100 字节;或者用 seekg(pos, std::ios::end) 想倒着找位置,却忘了 pos 是负数(如 seekg(-10, std::ios::end) 才是末尾前 10 字节)。

  • 必须以 std::ios::binary 模式打开文件,否则偏移量不可靠
  • 写入前调用 seekp(offset),读取前调用 seekg(offset)offsetstd::streamoff 类型(通常是 long long
  • 定位后建议检查是否成功:if (!ifs.seekg(offset)) { /* 失败 */ }
  • 定位到末尾获取当前大小:ofs.seekp(0, std::ios::end); auto size = ofs.tellp();

如何安全记录和读取断点偏移量

断点信息不能硬编码,也不能存在内存里——程序崩溃就丢了。最简单可靠的方式是把已传输字节数写进一个独立的元数据文件(如 file.part.offset),每次启动先读它,传输中定期刷新。

注意:写偏移量本身也要防损坏。不要直接覆盖原 offset 文件,而是写到临时文件再原子重命名(Windows 用 MoveFileEx,Linux/macOS 用 rename())。C++ 标准库不提供原子重命名,需调用系统 API 或用 std::filesystem::rename()(C++17 起)。

立即学习C++免费学习笔记(深入)”;

AI发型设计
AI发型设计

虚拟发型试穿工具和发型模拟器

下载
  • 保存偏移量用 std::ofstream 文本写入更稳妥(避免二进制字节序歧义):
    std::ofstream ofs("file.part.offset"); ofs << static_cast<long long>(bytes_transferred);
  • 读取时用 std::ifstream + >> 提取,失败则默认从 0 开始
  • 不要用 std::ofstream 直接写二进制偏移量——跨平台时 sizeof(std::streamoff) 可能不同
  • 频繁刷盘影响性能,可设阈值(如每 64KB 或每 5 秒)才更新 offset 文件

分块读写时如何处理最后一块不足缓冲区大小

断点续传必然面临“剩余多少字节要传”的问题。假设总大小为 1025 字节,已传 1000 字节,只剩 25 字节,但你的缓冲区是 1024 字节——这时不能无脑 read(buf, 1024),否则会读到 EOF 后的垃圾或触发 failbit。

正确做法是:计算剩余待传字节数 remaining = total_size - offset,然后用 read(buf, std::min(remaining, buf_size))。同时必须检查 gcount() 返回实际读取字节数,它可能小于请求值(比如磁盘突然拔出、权限变化)。

  • ifs.read(buf, n) 不保证读满 n 字节,必须用 ifs.gcount() 获取真实读取量
  • 写入端同理:ofs.write(buf, actual_read),不能直接写 n
  • 如果 gcount() == 0!ifs.eof(),说明出错(如 I/O 错误),应中止并记录错误码
  • 传输完成前,务必调用 ofs.flush() 确保数据落盘,再更新 offset 文件

多线程环境下断点文件竞争问题

如果多个线程/进程同时操作同一个文件(比如一个在下载,一个在监控进度),offset 文件极易被覆盖。标准文件流本身不是线程安全的,seekp() + write() 不是原子操作。

最轻量的解决方式是加文件锁:flock()(Unix-like)或 LockFile()(Windows)。不要依赖 C++ 标准库的 sync_with_stdio(false)——它只影响 C 和 C++ 流的同步,不解决并发写 offset 的问题。

  • 写 offset 前获取独占锁,写完立即释放;读 offset 时也应加共享锁(防止读到半截内容)
  • 避免用 std::fstream 长时间持有文件句柄——锁粒度越小越好
  • 更健壮的做法是改用数据库(如 SQLite)存 offset,利用事务保证一致性
  • 调试时可用 lsof -p PID(Linux/macOS)或 Process Explorer(Windows)确认文件锁状态

断点续传真正难的不是定位,而是偏移量的持久化时机和并发保护——哪怕 seekp() 调用成功,如果 offset 文件没及时、安全地更新,下次启动还是从头开始。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

839

2023.08.22

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

839

2023.08.22

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

743

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

374

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

27

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

27

2026.01.21

C# 多线程与异步编程
C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧,包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目,帮助开发者掌握 如何在 C# 中构建高并发、低延迟的异步系统,提升应用性能和响应速度。

102

2026.02.06

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1385

2023.07.26

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

4

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.1万人学习

Git 教程
Git 教程

共21课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号