
本文详解如何避免将 `json.dumps()` 返回的字符串误作可迭代行数据,导致逐字符写入文件的问题,并提供使用 `json.dump()` 直接写入、`pd.read_json()` 正确读取结构化列表的完整实践方案。
你在代码中调用 json.dumps(data) 得到的是一个单行 JSON 字符串(如 "[["2024-02-06 12:34:56", "bike", "10"]]"),而后续却用 for row in jsondata: 对其进行遍历——这实际是按单个字符(包括引号、逗号、方括号、换行符等)循环写入,最终生成的是被拆解、带大量 \r\n 和乱码的文本,自然无法被 pd.read_json() 正确解析。
✅ 正确做法是:跳过手动字符串遍历,直接用 json.dump() 将 Python 对象(如列表)序列化并写入文件。它会自动处理编码、格式与完整性:
import pandas as pd
import datetime
import json
date = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
item = 'bike'
price = '10'
new_item = [date, item, price]
data = [new_item] # 注意:此处 data 是包含一个子列表的二维结构,对应 DataFrame 的一行三列
# ✅ 正确写入:直接 dump 整个 data 对象(无需先 dumps 成字符串)
with open("file.txt", "w", encoding="utf-8") as output:
json.dump(data, output) # ← 关键修正:不是 json.dumps() + for 循环!此时生成的 file.txt 内容为标准 JSON 数组:
[["2024-02-06 12:34:56", "bike", "10"]]
再读取时,pd.read_json() 可直接解析该 JSON 数组为 DataFrame:
立即学习“Python免费学习笔记(深入)”;
# ✅ 正确读取(默认 orient='records' 不适用,因输入是嵌套列表)
df = pd.read_json("file.txt", orient="values") # 或更明确地:pd.DataFrame(json.load(open("file.txt")))
df.columns = ["Datetime", "Item", "Cost"]
print(df)输出即为预期结果:
Datetime Item Cost 0 2024-02-06 12:34:56 bike 10
⚠️ 注意事项:
- pd.read_json() 的 orient 参数需匹配写入格式:orient="values" 适用于形如 [[...], [...]] 的二维列表;若写入的是字典列表(如 [{"Datetime": "...", "Item": "..."}]),则应设 orient="records" 并省略 columns 赋值。
- 始终指定 encoding="utf-8"(尤其含中文或特殊字符时),避免编码错误。
- 若需可读性更强的缩进格式,可在 json.dump() 中添加 indent=2 参数(不影响 read_json 解析)。
- 避免混用 json.dumps() 与手动文件写入逻辑——除非你有特殊格式需求(如逐行 JSONL),否则优先使用 json.dump() / json.load() 成对操作。
总结:JSON 序列化的核心是「对象级操作」而非「字符串级拼接」。用对 json.dump() 和 json.load(),即可零误差完成列表 ↔ JSON 文件 ↔ DataFrame 的端到端流转。










