Python 流式下载的内存优化技巧

冷漠man

发布时间：2026-02-24 19:49:03

215人浏览过

来源于php中文网

原创

requests.get() 不加 stream=true 会将整个响应体加载到内存，导致大文件下载时内存激增甚至 oom；必须显式设置 stream=true 并用 iter_content(8192) 或 shutil.copyfileobj() 安全分块读取。

python 流式下载的内存优化技巧

requests.get() 不加 stream=True 会吃光内存

直接用 requests.get("https://big-file.com/data.zip") 下载大文件，响应体默认全部加载进内存，哪怕文件 500MB，Python 进程 RSS 就可能瞬间涨到 600MB+，还容易触发 OOM。这不是 bug，是 requests 的默认行为——它得帮你把 response.content 准备好。

必须显式打开流模式：requests.get(url, stream=True)。这之后 response.content 不再可用（会触发读取整个响应的副作用），你得靠 response.iter_content() 或手动调 response.raw 分块读。

不加 stream=True：适合小响应（10MB，就别碰
加了之后：必须自己管理读取循环，不能依赖 .json() 或 .text（它们会强制读完）
注意：HTTP 重定向（302）默认会被 requests 自动跟随，且跟随后的响应也受 stream=True 控制——这点常被忽略，导致你以为开了流，其实重定向后又全载入了

iter_content(chunk_size=8192) 是最稳的分块读法

response.iter_content() 是 requests 官方推荐的流式读取方式，比直接读 response.raw 更安全：它自动处理压缩（如 gzip）、解码、连接中断重试逻辑（在 chunk 级别）。

关键在 chunk_size 参数——不是越大越好，也不是越小越省。实测 8KB（8192）是多数场景下的甜点值：

立即学习“Python免费学习笔记（深入）”；

chunk_size=1：系统调用太频繁，CPU 负担翻倍，吞吐反而下降
chunk_size=1024*1024（1MB）：单次分配大 buffer，GC 压力大；网络抖动时，一整块卡住，延迟感知明显
chunk_size=8192：平衡内存占用、系统调用次数和缓存友好性；SSD/HDD 写入也更顺
如果目标是边下边解压（如 tar.gz），建议保持 chunk_size 为 8192，并用 zlib.decompressobj() 流式解压，不要攒满再解

用 shutil.copyfileobj() 替代手动 write() 更可靠

很多人写流式下载，习惯这么干：

95Shop仿醉品商城

95Shop可以免费下载使用，是一款仿醉品商城网店系统，内置SEO优化，具有模块丰富、管理简洁直观，操作易用等特点，系统功能完整，运行速度较快，采用ASP.NET(C#)技术开发，配合SQL Serve2000数据库存储数据，运行环境为微软ASP.NET 2.0。95Shop官方网站定期开发新功能和维护升级。可以放心使用！安装运行方法 1、下载软件压缩包； 2、将下载的软件压缩包解压缩，得到we

下载

for chunk in response.iter_content(8192):
    f.write(chunk)

看起来没问题，但漏掉了两个现实问题：磁盘满、权限拒绝。这些错误在 f.write() 时才抛，而此时 chunk 已经从 socket 读出、丢在内存里了——你没法优雅回退。

shutil.copyfileobj() 内部做了缓冲区复用，且对 IOError 更敏感，更重要的是：它支持传入 length 参数控制总拷贝上限，能防磁盘爆满。

正确写法：shutil.copyfileobj(response.raw, f, length=8192)
必须用 response.raw（不是 response），否则压缩中间层可能干扰
确保 f 是以 wb 模式打开的，且没开 buffering（buffering=0 在二进制模式下无效，别试）
如果要校验 hash，别在写入时算——先写临时文件，写完再 hashlib.blake2b(f.read())，避免 IO 和 CPU 绑死

超时和重试必须分开配，别只设 timeout=(3, 30)

timeout=(3, 30) 只控制单次请求的 connect + read 超时，对流式下载几乎没用：read 超时是从第一个字节开始计，但大文件传输中，可能前 10 秒有数据，后面卡住 2 分钟——这时 timeout 不会中断。

真正需要的是「空闲超时」+ 「重试策略」：

用 requests.adapters.HTTPAdapter(pool_connections=10, pool_maxsize=10, max_retries=3) 配连接池和重试
手动监控读取间隔：记录上一次 iter_content() 返回非空 chunk 的时间，超过 60 秒无新数据，就主动 response.close() 并重试
别依赖 requests.packages.urllib3.util.retry.Retry 的 status_forcelist 来重试 503——流式响应一旦发了 header，503 就不会来了，得靠空闲检测

流式下载的麻烦不在代码长短，而在边界是否被想全：网络断了怎么续、磁盘满了怎么停、服务端悄悄关连接你怎么感知。这些没写进文档，但每次上线都会撞上。

Python OCR 的 tesseract + pytesseract 部署

Python 排序性能瓶颈的定位方法

Python 使用 frozenset 作为配置键的技巧

Python 行为驱动开发的 BDD 框架

Python 高可用设计中的失败假设

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

448

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

544

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

323

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度，以便在查询和处理字符串数据时进行操作和判断。需要注意的是length函数计算的是字符串的字符数，而不是字节数。对于多字节字符集，一个字符可能由多个字节组成。因此，length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法，大家可以阅读本专题下面的文章。

952

2023.09.19