json.dumps()默认不支持set/frozenset,需通过default参数或自定义JSONEncoder处理;default最轻量,但需注意无序性、无限循环及嵌套未处理问题。

json.dumps() 默认不支持 set / frozenset
直接传 set 或 frozenset 给 json.dumps() 会报 TypeError: Object of type set is not JSON serializable。JSON 标准本身没有对应集合的类型,Python 的 json 模块默认只认 dict、list、str、int、float、bool 和 None。
用 default 参数把 set 转成 list
最常用、最轻量的做法是通过 default 参数提供一个回调函数,对不认识的类型做转换:
import jsondef json_default(obj): if isinstance(obj, (set, frozenset)): return list(obj) raise TypeError(f"Object of type {type(obj).name} is not JSON serializable")
data = {"tags": {"python", "web", "api"}, "readonly": frozenset([1, 2, 3])} json_str = json.dumps(data, default=json_default, sort_keys=True)
→ {"readonly": [1, 2, 3], "tags": ["api", "python", "web"]}
-
default函数只在遇到无法序列化的对象时被调用,不影响其他类型 - 返回
list(obj)是安全的,但注意:set无序,转成list后顺序不保证(如需稳定顺序,可加sorted()) - 不要在
default中返回原始obj或递归调用json.dumps(),否则会无限循环
需要保持集合语义?考虑自定义 encoder 类
如果下游解析器能配合改造,想显式区分“这是个集合”,可以继承 json.JSONEncoder 并重写 encode 或 default:
class SetEncoder(json.JSONEncoder):
def default(self, obj):
if isinstance(obj, set):
return {"__set__": True, "values": list(obj)}
if isinstance(obj, frozenset):
return {"__frozenset__": True, "values": list(obj)}
return super().default(obj)
json.dumps({"s": {1, 2}}, cls=SetEncoder)
→ {"s": {"set": true, "values": [1, 2]}}
- 这种格式增加了元信息,但要求解析端也识别
__set__字段并还原 - 不能和
default参数混用(cls优先级更高) - 若数据里还有其他自定义类型,记得在
default末尾调用super().default(obj),否则会丢弃默认行为
注意嵌套结构和不可哈希元素
set 里如果包含不可 JSON 序列化的对象(比如另一个 set、函数、或自定义类实例),仅靠上面的 default 还不够:
-
{1, {2, 3}}会失败,因为内层set在外层list(obj)时才触发序列化,但此时已脱离default控制范围 - 正确做法是确保
default能递归处理——但json.dumps()不提供递归钩子,所以得手动扁平化或预处理 - 更稳妥的方式是:在调用
json.dumps()前,用递归函数把所有set/frozenset替换为list,再 dump
真正容易被忽略的是:你以为只改了顶层 set 就万事大吉,结果数据嵌套三层后某个字典的值仍是未处理的 frozenset,错误才冒出来。










