0

0

如何在C++中将二进制数据写入文件_C++文件二进制读写操作

裘德小鎮的故事

裘德小鎮的故事

发布时间:2025-09-22 15:54:01

|

476人浏览过

|

来源于php中文网

原创

C++中二进制文件读写需使用std::ofstream和std::ifstream以std::ios::binary模式操作,通过write()和read()函数直接存取内存字节,避免字符转换,确保数据原样存储与读取。

如何在c++中将二进制数据写入文件_c++文件二进制读写操作

在C++中将二进制数据写入文件,核心做法是利用

std::ofstream
对象,并以
std::ios::binary
模式打开文件,随后使用其
write()
成员函数来直接写入内存中的字节序列。这就像是把内存中的一块数据原封不动地“拓印”到硬盘上。

解决方案

要实现C++中的二进制文件写入,我们通常会用到

头文件中的
std::ofstream
类。关键在于打开文件时指定
std::ios::binary
标志。这个标志告诉文件流,不要对写入的数据进行任何字符集转换(比如Windows系统下
\n
\r\n
的转换),而是按字节原样写入。

例如,如果你想写入一个整数或者一个自定义结构体,可以这样做:

#include 
#include 
#include 

// 假设我们有一个这样的结构体
struct MyData {
    int id;
    double value;
    char name[20];
};

int main() {
    std::ofstream outFile("data.bin", std::ios::out | std::ios::binary);

    if (!outFile.is_open()) {
        std::cerr << "错误:无法打开文件进行写入!" << std::endl;
        return 1;
    }

    // 写入一个整数
    int anInteger = 12345;
    // write方法的第一个参数是char*类型,所以需要reinterpret_cast
    outFile.write(reinterpret_cast(&anInteger), sizeof(anInteger));

    // 写入一个浮点数
    float aFloat = 3.14159f;
    outFile.write(reinterpret_cast(&aFloat), sizeof(aFloat));

    // 写入自定义结构体
    MyData myRecord = {1, 99.9, "TestRecord"};
    outFile.write(reinterpret_cast(&myRecord), sizeof(myRecord));

    // 写入一个字节数组(或std::vector)
    std::vector byteBuffer = {'A', 'B', 'C', 0x01, 0x02, 0x03};
    outFile.write(byteBuffer.data(), byteBuffer.size());

    outFile.close(); // 养成好习惯,手动关闭文件

    std::cout << "二进制数据已成功写入 data.bin" << std::endl;

    return 0;
}

这里需要特别注意

reinterpret_cast(&data)
这部分。
write()
函数期望得到一个
const char*
类型的指针,以及要写入的字节数。因此,我们需要将任何数据类型的地址强制转换为
const char*
,并使用
sizeof()
运算符来获取其在内存中占用的字节数。这基本上就是告诉文件流:“把从这个地址开始的
sizeof(data)
个字节,原封不动地写入文件。”

立即学习C++免费学习笔记(深入)”;

C++中如何高效地读取二进制文件内容?

既然能写,那自然也要能读。在C++中高效地读取二进制文件内容,我们主要依赖

std::ifstream
和它的
read()
成员函数。这个过程和写入是镜像操作,但同样有一些细节需要留意。在我看来,读取二进制数据往往比写入更考验细心,因为你必须确切知道文件中数据的“布局”——数据类型、顺序以及大小,否则很容易读出乱码甚至导致程序崩溃。

#include 
#include 
#include 

// 沿用之前的结构体定义
struct MyData {
    int id;
    double value;
    char name[20];
};

int main() {
    std::ifstream inFile("data.bin", std::ios::in | std::ios::binary);

    if (!inFile.is_open()) {
        std::cerr << "错误:无法打开文件进行读取!" << std::endl;
        return 1;
    }

    // 读取之前写入的整数
    int readInteger;
    inFile.read(reinterpret_cast(&readInteger), sizeof(readInteger));
    if (inFile.gcount() == sizeof(readInteger)) { // 检查是否读取了预期数量的字节
        std::cout << "读取的整数: " << readInteger << std::endl;
    } else {
        std::cerr << "读取整数失败或不完整。" << std::endl;
        return 1;
    }

    // 读取浮点数
    float readFloat;
    inFile.read(reinterpret_cast(&readFloat), sizeof(readFloat));
    if (inFile.gcount() == sizeof(readFloat)) {
        std::cout << "读取的浮点数: " << readFloat << std::endl;
    } else {
        std::cerr << "读取浮点数失败或不完整。" << std::endl;
        return 1;
    }

    // 读取自定义结构体
    MyData readRecord;
    inFile.read(reinterpret_cast(&readRecord), sizeof(readRecord));
    if (inFile.gcount() == sizeof(readRecord)) {
        std::cout << "读取的结构体ID: " << readRecord.id
                  << ", Value: " << readRecord.value
                  << ", Name: " << readRecord.name << std::endl;
    } else {
        std::cerr << "读取结构体失败或不完整。" << std::endl;
        return 1;
    }

    // 读取剩余的字节数组
    // 假设我们知道文件剩余大小,或者循环读取直到文件结束
    // 这里我们简单读取固定大小的字节
    std::vector readBuffer(6); // 之前写入了6个字节
    inFile.read(readBuffer.data(), readBuffer.size());
    if (inFile.gcount() == readBuffer.size()) {
        std::cout << "读取的字节数组: ";
        for (char c : readBuffer) {
            // 注意:直接输出char可能会显示为字符或乱码,这里转换为int看其数值
            std::cout << static_cast(c) << " ";
        }
        std::cout << std::endl;
    } else {
        std::cerr << "读取字节数组失败或不完整。" << std::endl;
        return 1;
    }


    inFile.close();
    return 0;
}

在实际应用中,尤其是在处理大型文件时,你可能会一次性读取一个较大的缓冲区,而不是一个一个地读取小数据块。例如,可以先获取文件大小,然后分配一个足够大的

std::vector
,一次性将整个文件内容读入内存,再从内存中解析数据。这通常比频繁调用
read()
更高效。
gcount()
成员函数在这里非常有用,它返回最后一次非格式化输入操作(如
read()
)实际读取的字符数,这对于验证数据完整性至关重要。

处理C++二进制文件读写时常见的错误与陷阱有哪些?

二进制文件操作虽然直接,但“直接”也意味着你得自己处理更多底层细节。我个人在处理这类问题时,遇到过不少坑,其中有些确实让人头疼。

首先,字节序(Endianness) 是个大问题。你在一台小端序(Little-endian)机器上写入的

int
值,比如
0x12345678
,在文件里可能是
78 56 34 12
。如果拿到一台大端序(Big-endian)机器上去读,它会把
78 56 34 12
解释成
0x78563412
,结果就完全错了。这在跨平台通信或文件共享时尤其致命。解决方案通常是约定一个统一的字节序(比如网络字节序,大端序),或者在写入和读取时进行显式的字节序转换。

通吃客零食网整站 for Shopex
通吃客零食网整站 for Shopex

第一步】:将安装包中所有的文件夹和文件用ftp工具以二进制方式上传至服务器空间;(如果您不知如何设置ftp工具的二进制方式,可以查看:(http://www.shopex.cn/support/qa/setup.help.717.html)【第二步】:在浏览器中输入 http://您的商店域名/install 进行安装界面进行安装即可。【第二步】:登录后台,工具箱里恢复数据管理后台是url/sho

下载

其次,结构体内存对齐和填充(Padding) 也常常被忽视。C++编译器为了提高访问效率,可能会在结构体成员之间插入一些空白字节(padding)。这意味着

sizeof(MyData)
可能不等于所有成员
sizeof()
之和。如果你直接把
sizeof(MyData)
个字节写入文件,然后在一个不同编译器或不同架构的机器上读取,或者只是简单地以为文件中数据是紧密排列的,就可能读到填充字节,导致数据错位。为了避免这个问题,可以考虑:

  1. 使用
    #pragma pack(1)
    (GCC/MSVC)或
    __attribute__((packed))
    (GCC)来强制结构体紧密对齐,但这可能会牺牲一些性能。
  2. 更健壮的做法是,逐个成员写入/读取,而不是一次性写入/读取整个结构体。这虽然代码量大一点,但能确保精确控制每个数据块的存储。
  3. 实现一套序列化/反序列化机制,将结构体转换为一个明确定义的字节流。

再来就是错误处理不充分。很多新手会忘记检查

is_open()
fail()
bad()
eof()
等文件流状态标志。文件可能打不开,写入可能失败,读取可能在文件中间就结束了。不检查这些状态,程序可能会在不知情的情况下继续运行,最终导致错误的数据或崩溃。一个健壮的程序,应该在每次文件操作后都检查其状态。

reinterpret_cast
的滥用或误用也是一个陷阱。虽然它在二进制读写中不可避免,但它本质上是在“欺骗”编译器,告诉它“这块内存就是这个类型的数据”。如果源数据类型和目标数据类型不匹配,或者指针指向的内存区域不包含有效的数据,就会导致未定义行为。使用时务必确保类型和内存布局是匹配的。

最后,文件关闭。虽然

std::ofstream
std::ifstream
在析构时会自动关闭文件(RAII原则),但养成手动调用
close()
的习惯仍然很好,尤其是在文件操作失败后,及时关闭文件可以释放资源,避免文件句柄泄漏。

C++二进制文件操作与文本文件操作的核心区别是什么?

在我看来,C++二进制文件操作与文本文件操作的核心区别,就像是机器语言和自然语言的区别:一个追求效率和精确的底层表达,另一个则更注重人类的阅读和理解。

最直观的区别在于数据的解释方式

  • 文本文件:它将所有数据都视为字符,并遵循某种字符编码(如ASCII、UTF-8)。当我们写入一个整数
    123
    时,文本文件实际上会写入字符
    '1'
    '2'
    '3'
    ,这需要3个字节(如果是ASCII)。读取时,程序会解析这些字符,再转换回数字。此外,文本文件还会处理行结束符(在Windows上
    \n
    通常会被转换为
    \r\n
    )。
  • 二进制文件:它将数据视为原始字节流。写入整数
    123
    时,它会直接写入
    123
    这个数字在内存中的二进制表示(例如,如果
    int
    是4字节,它会写入
    0x00 0x00 0x00 0x7B
    ,具体顺序取决于字节序)。读取时,程序直接获取这些字节,并将其解释为相应的数据类型。
    std::ios::binary
    模式的存在,就是为了禁用文本模式下那些“贴心”但对二进制数据来说却是“多余”的字符转换。

这种解释方式的不同,直接导致了几个关键差异:

  1. 效率与存储空间:二进制文件通常更高效,因为数据直接以其内存表示形式存储,无需进行字符与数值之间的转换,也无需存储分隔符或行结束符。这在存储大量结构化数据时尤其明显,比如一个包含百万个浮点数的文件,二进制格式会比文本格式小得多,读写速度也快得多。
  2. 可读性:文本文件是人类可读的,你可以用任何文本编辑器打开它并理解其内容。二进制文件则不是,你打开它看到的是一堆乱码,需要专门的程序才能正确解析。
  3. 数据类型保存:文本文件只能存储字符(字符串),要存储其他数据类型(如整数、浮点数、布尔值),必须先将其转换为字符串。二进制文件则可以“原样”存储任何数据类型,只要你知道它们的字节大小和内存布局。
  4. 移植性:文本文件(尤其是使用UTF-8编码的)通常具有更好的跨平台移植性,因为文本编码和行结束符问题相对标准化。二进制文件则需要特别注意字节序、结构体对齐等问题,否则在不同架构或操作系统之间交换时,很可能出现数据解释错误。

总的来说,如果你需要存储大量、复杂、结构化的数据,并且对性能和存储空间有要求,那么二进制文件是更好的选择。而如果数据主要是给人阅读,或者数据量不大,且需要方便地用文本工具处理,那么文本文件就更合适。这两种方式各有千秋,选择哪种取决于你的具体需求和应用场景。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1502

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

232

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

87

2025.10.17

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

531

2023.09.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

1

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.1万人学习

Excel 教程
Excel 教程

共162课时 | 14.3万人学习

PHP基础入门课程
PHP基础入门课程

共33课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号