0

0

Python对象序列化_pickle机制解析【教程】

舞姬之光

舞姬之光

发布时间:2026-01-05 17:17:02

|

534人浏览过

|

来源于php中文网

原创

Pickle 是 Python 默认对象序列化工具,用于保存对象状态和重建逻辑,依赖解释器、类定义及代码版本,存在兼容性与安全风险;支持基本类型、顶层函数、类实例等,不支持文件对象、嵌套类等;可通过 __getstate__ 和 __setstate__ 控制序列化行为;协议版本 0–5 影响性能与兼容性;反序列化不受信任数据会导致 RCE,应优先选用 JSON、Protocol Buffers 等安全替代方案。

python对象序列化_pickle机制解析【教程】

Pickle 是 Python 默认的对象序列化工具,它能把内存中的对象转换成字节流,便于存储或传输,之后还能原样还原。但它的核心不是“存数据”,而是“保存对象的状态和重建逻辑”——这意味着它依赖 Python 解释器、类定义、模块路径,甚至代码版本。用不好容易报错、不兼容、甚至有安全风险。

pickle 能序列化什么?哪些会失败?

支持的类型包括:基本数据类型(int/str/list/dict/tuple/set)、函数(仅限顶层定义的函数,不能是 lambda 或嵌套函数)、类实例(要求类在模块顶层且可被 import)、大多数内置类型(如 datetime、Decimal)。

常见失败情况:

  • 文件对象、网络连接、数据库游标等系统资源类对象无法序列化
  • 类定义不在模块顶层(比如在函数内定义的 class)会报 AttributeError: Can't pickle local object
  • 使用了 C 扩展或自定义 __reduce__ 但返回非法格式时会出错
  • 不同 Python 版本间默认协议不兼容(如 3.8 用 protocol=4 序列化的数据,3.7 可能无法加载)

如何控制序列化行为?\_\_getstate\_\_ 和 \_\_setstate\_\_ 是关键

默认情况下,pickle 会保存对象的整个 __dict__。如果想排除某些属性(比如临时缓存、打开的文件句柄),或需要自定义重建逻辑,就该重写这两个方法:

立即学习Python免费学习笔记(深入)”;

  • __getstate__ 返回一个字典,表示“你想保存哪些状态”。可以删掉不可序列化的字段,或替换为可序列化的值
  • __setstate__ 接收这个字典,在反序列化时手动恢复对象状态,比如重新打开资源、重建缓存

例如:

闪念贝壳
闪念贝壳

闪念贝壳是一款AI 驱动的智能语音笔记,随时随地用语音记录你的每一个想法。

下载
class CacheHolder:
  def __init__(self, data):
    self.data = data
    self._cache = {}  # 不想保存
  def __getstate__(self):
    state = self.__dict__.copy()
    state.pop('_cache', None)
    return state
  def __setstate__(self, state):
    self.__dict__.update(state)
    self._cache = {}  # 反序列化后初始化空缓存

协议版本、性能与跨版本兼容性怎么选?

Pickle 协议从 0 到 5(Python 3.8+ 支持),数字越大功能越强、体积越小、速度越快,但也越不兼容旧版本:

  • protocol=0:ASCII 文本格式,人类勉强可读,兼容性最好(2.x/3.x 都行),但慢且大
  • protocol=2:Python 2.3+ 引入,支持新式类,推荐用于跨 Python 2/3 场景
  • protocol=4:Python 3.4+ 默认,支持超长序列、复数类型优化,日常开发首选
  • protocol=5:Python 3.8+ 新增,支持带外数据(out-of-band buffers),适合大数据量 + 零拷贝场景

显式指定协议更稳妥:pickle.dumps(obj, protocol=pickle.HIGHEST_PROTOCOL) 或固定值(如 4)。

为什么不要用 pickle 处理不受信任的数据?

pickle 在反序列化时会动态执行代码(如导入模块、调用 __reduce__ 返回的函数)。恶意构造的字节流可以触发任意命令执行,等同于远程代码执行(RCE)。

安全替代方案:

  • 传数据用 JSON(需对象可转 dict)、msgpack(更紧凑)、toml/yaml(适合配置)
  • 要保留类型信息且可信环境,可用 dill(支持更多对象,但同样不安全)
  • 微服务通信优先用 Protocol Buffers 或 Apache Avro,语言中立、向后兼容

记住:pickle 是 Python 内部工具,不是通用数据交换格式。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

549

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

338

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

225

2025.10.31

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

138

2026.02.12

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号