
本文详解为何直接用字符串初始化 dataframe 会报错,以及如何通过 ast.literal_eval() 安全地将 json 格式字符串解析为 python 对象并构建 dataframe。
在使用 pandas.DataFrame() 构造数据框时,传入参数必须是合法的可迭代对象(如字典列表、NumPy 数组、Series 或其他 DataFrame),而不能是纯字符串——哪怕该字符串在视觉上“看起来像”一个字典列表。
你遇到的 ValueError: DataFrame constructor not properly called! 正是因为 period 是一个字符串类型(str),其内容虽符合 Python 字面量语法(如 [{'playNumber':11, ...}, {...}]),但 Pandas 并不会自动执行字符串求值(eval)。直接传入会导致构造器无法识别有效数据结构,从而抛出错误。
而当你手动将相同内容赋值给变量 s 时,Python 解释器在解析脚本时已将其识别为字面量列表(list[dict]),因此 pd.DataFrame(s) 可以正常工作。
✅ 正确做法:使用 ast.literal_eval() 安全解析字符串
ast.literal_eval() 是 Python 标准库中专为安全评估字符串形式的 Python 字面量设计的函数。它只允许 str、int、float、bool、None、list、tuple、dict 和 set 等字面量结构,拒绝任意代码执行(相比 eval() 更安全),非常适合处理从网页提取的类 JSON 字符串:
import pandas as pd
import ast
# 假设 period 是你从网页中提取并清洗后的字符串(含单引号、None 等)
# period = "[{'playNumber':11,'playType':'BP',...}, {...}]"
# 安全解析为 Python 对象(list of dicts)
data_list = ast.literal_eval(period)
# 构建 DataFrame
pbp = pd.DataFrame(data_list)
print(pbp.head())⚠️ 注意事项:
- 不要使用 eval(period):存在严重安全风险(可能执行恶意代码),尤其当字符串来自不可信网页源时;
- 确保字符串格式严格合法:ast.literal_eval() 要求键名和字符串值均使用单引号或双引号统一(你的代码中已用 .replace('"', "'") 统一为单引号,这是必要预处理);
- null → None 替换是正确的,但需确保没有残留 true/false(应替换为 True/False);若原始字符串含 true/false,建议额外添加 .replace('true', 'True').replace('false', 'False');
- 若解析失败(如格式不规范),ast.literal_eval() 会抛出 ValueError 或 SyntaxError,建议包裹 try/except 做容错处理。
? 扩展建议:若目标网站提供标准 JSON 接口(如 /api/playbyplay),优先使用 requests.get(...).json() 直接获取原生 Python 对象,避免字符串解析环节,更健壮高效。










