0

0

bytearray vs bytes 的可变性导致的常见内存拷贝陷阱

冷炫風刃

冷炫風刃

发布时间:2026-01-25 08:00:02

|

772人浏览过

|

来源于php中文网

原创

bytearray可原地修改且复用内存,bytes不可修改;操作时应预估大小、用extend()拼接、注意传参副作用及转换开销。

bytearray vs bytes 的可变性导致的常见内存拷贝陷阱

修改 bytearray 不会触发新对象分配,bytes 一改就报错

这是最直接的差异:你不能对 bytes 做任何原地修改——哪怕只是改一个字节,Python 就立刻抛 TypeError: 'bytes' object does not support item assignment。而 bytearray 允许 ba[0] = 65ba.append(98)del ba[-1] 这类操作,全程复用同一块内存地址。

实操建议:

  • id() 对比验证:id(ba) 在多次修改后不变;id(b)id(b.replace(...)) 一定不同
  • 别用 bytes 接收网络流或文件缓冲区后再“加工”——它强制你每次操作都拷贝整段数据
  • 如果只是读取+解码(如 b'hello'.decode()),bytes 更轻量;但凡要拼接、截断、填充、加校验位,优先选 bytearray

bytearray 拼接时用 extend(),别用 +=+

+= 看似是原地操作,但在 bytearray 上它其实等价于 __iadd__,底层仍可能触发隐式拷贝(尤其当预留空间不足时)。而 extend() 明确走扩容+复制路径,行为更可控。

常见错误现象:

  • 循环中反复 ba += b'\x00' → 内存分配次数随长度线性增长,性能暴跌
  • ba = ba + other_ba → 创建全新 bytearray,旧对象被丢弃,GC 压力增大

正确做法:

  • 初始化时预估大小:ba = bytearray(4096),再用 ba[:n] = ... 填充
  • 拼接多个片段用 ba.extend(other),支持 bytesbytearraylist(元素为 0–255 整数)
  • 确认是否真需要拼接:有时用 memoryview(ba) 切片访问,比复制更省

传参时小心“假装可变”的陷阱:函数内 bytearray 修改会反映到调用方

因为 bytearray 是可变对象,传入函数后,你在函数里 ba.append()ba[0] = 1,调用方看到的就是被改过的原对象——不像 bytes 那样天然隔离。

Programming Helper
Programming Helper

AI代码自动生成器,在AI的帮助下更快地编程

下载

容易踩的坑:

  • 工具函数时没加防御性拷贝:def encrypt_inplace(data): data[:] = ... → 调用者原始数据被意外覆盖
  • 多线程/协程共享同一个 bytearray 缓冲区 → 竞态修改导致数据错乱(它不是线程安全的)
  • 误以为 ba.copy() 是深拷贝 —— 实际只是浅拷贝(新对象,但内容独立),这点比 list.copy() 更易混淆

建议:

  • 函数文档明确标注是否修改入参
  • 不确定时,开头加 if not isinstance(data, bytearray): data = bytearray(data)data = data.copy()
  • 高并发场景下,用 threading.local() 绑定私有缓冲区,别复用全局 bytearray

bytes 创建 bytearray 的开销不可忽略

看似只是一次转换:ba = bytearray(b),但背后是完整内存拷贝——哪怕 b 有 10MB,这一步就要额外分配 10MB 并逐字节复制。

性能影响明显的情况:

  • 高频小包处理(如 WebSocket 帧解析),每次收包都 bytearray(recv_bytes) → CPU 和内存带宽成瓶颈
  • bytes 作缓存键(如 cache[b]),又频繁转成 bytearray 修改 → 双重浪费

优化方向:

  • 源头控制:让 I/O 层直接返回 bytearray(如 socket.recv_into(bytearray)
  • 避免无谓转换:能用 memoryview(b) 切片访问的,就不转 bytearray
  • 批量处理时,先收集所有 bytes 片段,再一次性构造大 bytearray,而非逐个转
真正麻烦的不是“能不能改”,而是“谁在什么时候悄悄改了”。bytearray 的可变性像一把没鞘的刀——用得好省资源,握得松就割手。尤其在底层协议解析、二进制打包、零拷贝优化这些地方,多看一眼 id()内存占用曲线,比背十遍文档管用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

377

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

32

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

29

2026.01.21

C# 多线程与异步编程
C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧,包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目,帮助开发者掌握 如何在 C# 中构建高并发、低延迟的异步系统,提升应用性能和响应速度。

103

2026.02.06

go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

55

2025.09.03

append用法
append用法

append是一个常用的命令行工具,用于将一个文件的内容追加到另一个文件的末尾。想了解更多append用法相关内容,可以阅读本专题下面的文章。

349

2023.10.25

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.9万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号