快速定位JSON解析错误需先检查输入是否为非空字符串,用repr()查看真实内容,优先使用response.json()而非手动loads();默认不处理bytes,需显式解码;序列化自定义对象用default参数;大文件用ijson流式解析。

JSON解析报错 json.decoder.JSONDecodeError 怎么快速定位?
Python里json.loads()一报这个错,八成是输入根本不是合法JSON——比如前端传了空字符串、None、HTML片段,或者后端日志里混进了非UTF-8编码的字节流。
常见错误现象:
-
json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)→ 输入为空或全是空白 -
json.decoder.JSONDecodeError: Invalid control character→ 字符串里有不可见控制符(比如\001、\u2028) - 用
requests.get().text直接喂给loads(),但响应其实是HTML(404页、登录跳转页)
实操建议:
- 先检查输入是否为
str类型,且len(s.strip()) > 0 - 用
repr(s[:50])看前50字符的真实内容,比print(s)更可靠 - 如果来源是HTTP响应,优先用
response.json()(它内部做了状态码和Content-Type校验),而不是手动loads(response.text)
json.loads() 和 json.dumps() 的默认编码行为到底怎么算?
Python 3里json模块默认只处理str,不碰bytes。你传bytes进去,会直接抛TypeError,不是自动decode。
立即学习“Python免费学习笔记(深入)”;
使用场景差异:
- 读文件:用
open(..., encoding='utf-8')再json.load(f),别用read()+loads()拼接 - 处理网络返回的
bytes:必须显式解码,json.loads(resp.content.decode('utf-8')),不能省 - 写文件:用
json.dump(obj, f, ensure_ascii=False)避免中文变\uXXXX
参数影响:
-
ensure_ascii=True(默认)→ 中文全转Unicode转义,体积大、可读性差 -
ensure_ascii=False→ 保留原始Unicode字符,但要求输出目标支持UTF-8(如终端、文件、HTTP响应头已设charset=utf-8)
自定义对象怎么让json.dumps()不报TypeError: Object of type X is not JSON serializable?
json.dumps()只认内置类型:dict、list、str、int、float、bool、None。遇到datetime、UUID、自定义类,就挂。
常见错误现象:
-
datetime.now()直接塞进字典然后dumps()→ 报错 - Django的
Model实例或SQLAlchemy的Row对象直接序列化 → 报错
实操建议:
- 简单类型优先用
default参数,比如:json.dumps(obj, default=lambda o: o.isoformat() if hasattr(o, 'isoformat') else str(o))
- 更可控的做法是提前转换:把
datetime转str,Decimal转float或str,再进dumps() - 不要用
cls参数写复杂JSONEncoder子类,除非项目里大量复用;临时需求default够用
用json.load()读大文件时内存爆了怎么办?
json.load()是一次性把整个文件读进内存再解析。一个500MB的JSON数组,可能吃掉2GB+内存,尤其里面还有重复字段名或嵌套深的结构。
性能影响:
- 文件越大,GC压力越明显,解析时间非线性增长
- 如果只是想遍历数组里的每个对象(比如日志行、事件记录),没必要全加载
实操建议:
- 确认是否真的需要全量数据:能用流式处理就别全读
- 小规模优化:用
json.load()配object_hook做即时转换,减少中间dict对象生成 - 真正的大文件:换
ijson库,按需拉取路径节点,比如ijson.parse(file, 'item')逐条读数组元素 - 别尝试“分块读字符串再手动切JSON”——JSON没有天然分块边界,极易出错
JSON解析看着简单,但真正上线后出问题的,基本都卡在编码判断、空值容忍、对象类型转换这三步。尤其是跨服务传数据时,别假设对方一定发了合法JSON——加一层try/except json.JSONDecodeError并记录原始输入,比事后查日志快十倍。










