将字典格式字符串安全解析并展开为多列结构

霞舞

发布时间：2026-01-25 10:28:10

711人浏览过

来源于php中文网

原创

将字典格式字符串安全解析并展开为多列结构

本文介绍如何在 python 中将 dataframe 中存储为字符串的字典（如 `"{827056812014862: [0.05, 0.0608, 0.476464, 0.53535]}"`）安全解析、解包，并转换为结构化表格，生成独立的 id 列与多个数值列（t1–t4）。

在数据清洗与 ETL 场景中，常遇到将嵌套结构（尤其是以字符串形式存储的字典或列表）扁平化的需求。直接使用 eval() 存在严重安全风险，因此推荐使用 ast.literal_eval —— 它仅支持安全的字面量表达式（如 dict, list, float, int），可防止代码注入。

以下是一个完整、健壮的解决方案：

import pandas as pd
from ast import literal_eval

# 示例原始数据
df = pd.DataFrame({
    "column_A": [
        "{827056812014862 : [0.05, 0.0608, 0.476464, 0.53535]}",
        "{263746262748835 : [0.08, 0.0333, 0.8263, 0.9463]}",
        "{63673738736362 : [0.05, 0.0926, 0.8694, 0.9903]}",
        "{73737681201484 : [0.08, 0.0425, 0.1948, 0.3958]}"
    ]
})

# 安全解析 + 展开为标准 DataFrame
records = []
for dict_str in df["column_A"]:
    # 安全转为 dict（自动处理空格、换行等常见格式问题）
    d = literal_eval(dict_str)
    for key, values in d.items():
        # 确保 values 是长度为 4 的列表（可按需扩展校验）
        if not isinstance(values, (list, tuple)) or len(values) != 4:
            raise ValueError(f"Unexpected value format for key {key}: {values}")
        records.append({
            "id": key,
            "t1": values[0],
            "t2": values[1],
            "t3": values[2],
            "t4": values[3]
        })

result = pd.DataFrame(records)
print(result)

✅ 输出结果：

VIVA

一个免费的AI创意视觉设计平台

下载

                id    t1      t2        t3       t4
0  827056812014862  0.05  0.0608  0.476464  0.53535
1  263746262748835  0.08  0.0333  0.826300  0.94630
2   63673738736362  0.05  0.0926  0.869400  0.99030
3   73737681201484  0.08  0.0425  0.194800  0.39580

? 关键要点与注意事项：

永远避免 eval()：它会执行任意 Python 表达式，极易引发安全漏洞；literal_eval 是唯一推荐的安全替代方案。
健壮性增强：实际生产中建议添加异常捕获（如 try/except）和日志，便于定位非法字符串（例如缺失括号、类型错误）。
性能优化（大数据量）：若数据量极大（>10 万行），可改用向量化方式（如先 apply(literal_eval) 得到 Series of dicts，再用 pd.json_normalize 配合自定义展开逻辑），但本例的显式循环更清晰、易调试、内存友好。
列名与索引灵活性：t{i} 命名可通过 enumerate(..., start=1) 控制起始编号；如需动态适配不同长度的列表，可用 pd.DataFrame(values).T.add_prefix('t') 后合并。

该方法兼顾安全性、可读性与工程实用性，适用于绝大多数“字符串化字典 → 扁平表格”的转换任务。

如何在Python中将两个循环合并以基于前一个循环结果持续执行计算

Python如何做服务监控_监控指标设计

Python怎么自动整理桌面_按文件常见扩展名自动分类并移动整理到对应归档目录

如何用 NumPy 高效按标签分组拆分数组

Python怎么读取XML文件_xml.etree.ElementTree节点遍历

相关标签:

python js json 大数据 ai 数据清洗 Float try 字符串 int 循环 etl 性能优化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何检测当前代码是否运行在 uvloop 加速的事件循环中下一篇：asyncio 如何在 gather 中只取消超时任务但保留其他结果

作者最新文章

如何在网页中正确禁用默认右键菜单并显示自定义上下文菜单

2026-03-09 14:23

如何在 HTML 输入框中安全显示含双引号的 PHP 变量值

2026-03-09 14:25

如何正确使用 Go 的 syscall.Exec 调用 Git 命令

2026-03-09 14:40

如何在 ProGuard 中保留 Kotlin 的 @Throws 注解

2026-03-09 14:43

如何在 Go 中将多个 JSON 字段名映射到同一结构体字段？

2026-03-09 14:47

抖音平台券退款能退回吗？抖音平台券退款了,但是退款了

2026-03-09 14:53

抖音音频如何提取？如何提取视频中的音频

2026-03-09 15:05

如何动态访问嵌套 JSON 中变动的键名对象

2026-03-09 15:18

抖音等级账号出售怎么弄？一个人可以注册几个抖音账号

2026-03-09 15:19

百度搜索栏vscode怎么做

2026-03-09 15:41

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

595

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

106

2025.10.23

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

760

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

221

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1566

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

649

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1228

2024.03.22

php中定义字符串的方式

php中定义字符串的方式：单引号；双引号；heredoc语法等等。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

1184

2024.04.29

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板