Python读写二进制文件需用bytes(不可变)和bytearray(可变)类型,open()必须使用'b'模式(如'rb'、'wb'),bytes支持切片索引但不可修改,bytearray支持原地编辑,适合高效修改字节数据。

Python 读写二进制文件,核心是用 bytes 和 bytearray 类型来处理原始字节数据。它们不是字符串,不能直接用 str 的方法操作,也不能和字符串混用(会报错)。关键区别在于:bytes 是不可变的,bytearray 是可变的——就像 str 和 list 的关系。
打开二进制文件:必须加 b 模式
读写二进制文件时,open() 的 mode 参数必须包含 b,比如 'rb'、'wb'、'r+b'。漏掉 b 会导致编码错误或数据损坏。
-
with open('photo.jpg', 'rb') as f: data = f.read()→ 返回bytes对象 -
with open('output.bin', 'wb') as f: f.write(b'\x00\x01\x02')→ 写入字节序列 - 不能写
f.write('hello'),会报TypeError;必须是b'hello'或bytes/bytearray
bytes:只读字节序列,适合存储/传输
bytes 是不可变类型,创建后内容不能修改。适合做常量、缓存、网络收发等不需要改写场景。
- 字面量写法:
b'abc'、b'\xff\x00\x80'、bytes([1, 2, 3]) - 支持切片、索引、
in判断,但不支持.append()、[0] = 97等赋值操作 - 常见转换:
bytes.fromhex('aabbcc')→b'\xaa\xbb\xcc';b'hello'.hex()→'68656c6c6f'
bytearray:可变字节缓冲区,适合编辑/构造
当你需要修改某几个字节(比如改图片头、拼接协议包、加密解密中间过程),bytearray 更高效——不用反复新建对象。
立即学习“Python免费学习笔记(深入)”;
- 创建方式:
bytearray(b'abc')、bytearray(10)(10 字节全 0)、bytearray([10, 20, 30]) - 支持原地修改:
ba[0] = 255、ba.append(0x01)、ba.extend(b'def') - 可以转成
bytes传给文件或 socket:data = bytes(ba)(注意这是拷贝)
实际读写示例:复制并修改一个二进制文件
比如把一个 PNG 文件头(前 8 字节)从 b'\x89PNG\r\n\x1a\n' 改成自定义标识:
with open('input.png', 'rb') as f:
ba = bytearray(f.read()) # 全部读入可变缓冲区
修改前 4 字节为自定义魔数
ba[0:4] = b'MYBN'
with open('output.bin', 'wb') as f:
f.write(ba) # 直接写入 bytearry,自动转为 bytes 流
这个过程用 bytes 就得切片拼接:new_data = b'MYBN' + old_bytes[4:],内存开销更大。










