Python 反序列化漏洞的风险防范

冷炫風刃

发布时间：2026-02-23 18:35:23

807人浏览过

来源于php中文网

原创

pickle.load() 不能读不可信数据，因为它反序列化时会执行任意代码而非仅解析数据，恶意构造的 __reduce__ 或 __setstate__ 可调用 os.system 等危险操作。

python 反序列化漏洞的风险防范

为什么 `pickle.load()` 不能直接读不可信数据

因为 pickle 反序列化会执行任意代码，不是“解析数据”，而是“重建对象+触发方法”。只要输入里藏了恶意构造的 __reduce__ 或 __setstate__，就能调用 os.system、写文件、连外网。

常见错误现象：AttributeError: 'module' object has no attribute 'xxx' 看似是模块缺失，其实是反序列化时尝试导入不存在的恶意模块；更隐蔽的是进程静默拉起、磁盘突然多出临时文件。

使用场景中，最容易踩坑的是：用 pickle 做网络传输载荷（如 Celery 旧配置）、本地缓存未校验、Web 表单提交二进制字段后直接 pickle.load(request.body)。

替代方案选哪个：`json`、`msgpack` 还是 `dataclass` + `typing`

json 最安全，但只支持基础类型（dict、list、str、int、float、bool、None），无法还原自定义类或函数。

立即学习“Python免费学习笔记（深入）”；

msgpack 比 json 更紧凑、更快，但默认仍不支持自定义类；开启 strict_map_key=False 或用 ext_type 手动注册解码器后，才可能带类型信息——此时必须严格校验 ext_type.code 范围，否则又绕回反序列化执行风险。

如果必须保留类结构，推荐 dataclass + asdict() / from_dict()（配合 dacite 或手写校验）：

from dataclasses import dataclass
from dacite import from_dict
<p>@dataclass
class User:
name: str
age: int</p><h1>安全：只从 dict 构建，不执行任意代码</h1><p>user = from_dict(data_class=User, data={"name": "alice", "age": 30})

关键点：所有字段类型在运行时静态可检，无魔法方法调用，无隐式 import。

腾讯智影-AI数字人

基于AI数字人能力，实现7*24小时AI数字人直播带货，低成本实现直播业务快速增增，全天智能在线直播

下载

旧系统没法换格式？至少加三道过滤

若必须兼容存量 pickle 流，不能只靠“信任内网”或“加个签名”——签名只防篡改，不防合法 payload 里的恶意逻辑。

必须做：

用 RestrictedUnpickler 子类重写 find_class()，白名单控制可导入模块和类名，例如只允许 __builtin__.dict、datetime.datetime
在反序列化前，用 ast.literal_eval() 尝试解析原始字节为字面量（仅适用于简单结构），失败则拒绝
启动独立沙箱进程（如 subprocess.run(..., timeout=1)）做反序列化，超时或非零退出立即丢弃结果

注意：find_class 白名单要细到类级别，比如允许 collections.OrderedDict 但禁止 subprocess.Popen——后者常被漏掉，因为看起来不像“危险类”。

配置文件里写 `eval()` 或 `exec()` 同样危险

有人把 pickle 换成 eval(repr(obj))，以为“没用 pickle 就安全”，其实一样执行任意代码。比如 eval("__import__('os').system('id')")。

真实案例：Django 的 SECRET_KEY 配置误写成 eval(os.environ.get('KEY'))，攻击者通过环境变量注入恶意字符串。

正确做法：

配置值统一走 os.environ.get('KEY', 'default') + 类型转换（int()、bool()）
复杂结构用 json.loads(os.environ.get('CONFIG_JSON', '{}'))，再手动映射到对象
绝对不要在生产环境启用 debug=True 且暴露 django.views.debug，它内部用了 pprint 和 repr，可能触发对象的 __repr__ 方法执行副作用

最易被忽略的是日志打印：logger.info("user=%s", user_obj) 如果 user_obj.__repr__ 里有数据库查询或 HTTP 请求，就变成隐式远程调用。

Python ReAct 模式的完整闭环实现

Python asyncio.gather 的错误传播控制

Python dive 的镜像层分析与瘦身

Python socket 编程的基础模型解析

Python 重构过程中如何保证行为一致

相关标签:

python django json Float Object 子类字符串 bool int Attribute 类型转换对象 default 数据库 http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 项目规模扩大后的组织方式下一篇：暂无

作者最新文章

苹果手机电池一般能用几年 iPhone电池使用寿命参考

2026-02-22 09:21

Linux 防火墙策略对性能影响分析

2026-02-22 10:41

edge浏览器页面颜色深色模式与强制暗黑设置

2026-02-22 10:51

华为手机官网怎么查序列号华为设备序列号查询步骤

2026-02-22 10:57

Python 配置中心的多活容灾方案

2026-02-22 11:06

微信电脑版文件怎么在手机上打开微信电脑版文件手机查看方法

2026-02-22 11:07

腾讯会议电脑和手机如何同步使用

2026-02-22 11:27

进项发票在哪里查询

2026-02-22 12:26

Linux cosign 的 key-pair 生成与 cosign sign / verify 工作流模板

2026-02-22 12:27

Python 进程池资源耗尽的排查

2026-02-22 13:02

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python Web 框架 Django 深度开发

本专题系统讲解 Python Django 框架的核心功能与进阶开发技巧，包括 Django 项目结构、数据库模型与迁移、视图与模板渲染、表单与认证管理、RESTful API 开发、Django 中间件与缓存优化、部署与性能调优。通过实战案例，帮助学习者掌握使用 Django 快速构建功能全面的 Web 应用与全栈开发能力。

125

2026.02.04

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

446

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

544

2023.08.23