0

0

Pandas 多数据框横向合并与 Excel 透视导出完整教程

花韻仙語

花韻仙語

发布时间:2026-01-23 19:29:12

|

336人浏览过

|

来源于php中文网

原创

Pandas 多数据框横向合并与 Excel 透视导出完整教程

本文详解如何将多个结构不一但共享索引列(如 'header')的 pandas dataframe 合并为统一宽表,自动对齐所有指标列(val1–val9),填充缺失值,并导出至 excel 供后续 pivottable 分析。

在实际数据分析工作中,常需整合多个函数生成的异构结果表(如不同模块的统计摘要),这些表虽列名、行数各异,但都包含一个逻辑主键列(如 'Header')和若干数值指标列(如 'Val1', 'Val5', 'Val7' 等)。目标是将其“拼接”成一张以 Header 为行索引、所有 ValX 列为列名的稀疏宽表,缺失位置补零,最终导出 Excel 以便人工创建透视表(PivotTable)——这正是 Excel 用户最熟悉的交互式分析起点。

核心思路是:统一索引 + 横向拼接 + 缺失填充 + Excel 导出。以下为推荐实现方案(基于 pd.concat(..., axis=1)):

✅ 正确做法:以 Header 为索引横向合并(推荐)

import pandas as pd

# 示例数据(模拟多函数输出)
data1 = {'Header':['L1','L2','L3'], 'Val1':[100.0,200.0,300.0], 'Val2':[400.0,500.0,600.0], 'Val3':[700.0,800.0,900.0]}
data2 = {'Header':['L5','L6'], 'Val5':[1000.0,1100.0], 'Val6':[1300.0,1400.0]}
data3 = {'Header':['L7','L8','L9','L10'], 'Val7':[1900.0,2000.0,2100.0,2200.0], 'Val8':[2900.0,2300.0,2400.0,2800.0], 'Val9':[3500.0,3600.0,3700.0,3900.0]}

df1, df2, df3 = pd.DataFrame(data1), pd.DataFrame(data2), pd.DataFrame(data3)
dfs = [df1, df2, df3]

# 关键步骤:每张表设 Header 为索引 → 沿列方向拼接 → 清除索引名 → 填充 NaN 为 0(整型)
result = (
    pd.concat([df.set_index('Header') for df in dfs], axis=1)
    .rename_axis(None)  # 移除行索引名称(避免 Excel 中显示 "Header" 标题)
    .fillna(0, downcast='int')  # 填 0 并自动转为 int(更整洁)
)

print(result)

输出即为题目所求格式:

Cliclic AI
Cliclic AI

Cliclic商品背景图编辑器是一款功能强大的AI工具,帮助用户快速生成具有吸引力的商品图背景。

下载
     Val1  Val2  Val3  Val5  Val6  Val7  Val8  Val9
L1    100   400   700     0     0     0     0     0
L2    200   500   800     0     0     0     0     0
L3    300   600   900     0     0     0     0     0
L5      0     0     0  1000  1300     0     0     0
L6      0     0     0  1100  1400     0     0     0
L7      0     0     0     0     0  1900  2900  3500
L8      0     0     0     0     0  2000  2300  3600
L9      0     0     0     0     0  2100  2400  3700
L10     0     0     0     0     0  2200  2800  3900

? 注意事项与进阶场景

  • 重复 Header 处理:若不同数据框含相同 'Header' 值(如 L1 出现在 df1 和 df2 中),直接 concat 会引发索引冲突。此时应改用 groupby('Header').sum() 聚合(见答案中最后一段代码),确保同名行数值相加。
  • 列顺序控制:concat(..., axis=1) 默认按输入列表顺序排列列。如需固定列序(如 Val1→Val2→...→Val9),可在合并后显式重排:
    all_cols = ['Val1','Val2','Val3','Val5','Val6','Val7','Val8','Val9']
    result = result.reindex(columns=all_cols, fill_value=0)
  • Excel 导出(含格式优化)
    with pd.ExcelWriter("consolidated_pivot_ready.xlsx", engine="openpyxl") as writer:
        result.to_excel(writer, sheet_name="PivotSource", index=True)
        # 可选:自动调整列宽(需 openpyxl)
        worksheet = writer.sheets["PivotSource"]
        for column in worksheet.columns:
            max_length = 0
            column_letter = column[0].column_letter
            for cell in column:
                try:
                    if len(str(cell.value)) > max_length:
                        max_length = len(str(cell.value))
                except:
                    pass
            adjusted_width = min(max_length + 2, 50)
            worksheet.column_dimensions[column_letter].width = adjusted_width
  • 性能提示:对大量数据框,避免循环中反复 concat;优先使用列表推导式一次性构建,再调用单次 pd.concat。

该方法生成的 Excel 表格可直接被 Excel 的「插入 → 数据透视表」识别:行标签选 Header,数值字段勾选全部 Val* 列,即可自由拖拽分析——真正实现 Python 预处理与 Excel 交互分析的无缝衔接。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

80

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

32

2026.01.31

excel对比两列数据异同
excel对比两列数据异同

Excel作为数据的小型载体,在日常工作中经常会遇到需要核对两列数据的情况,本专题为大家提供excel对比两列数据异同相关的文章,大家可以免费体验。

1454

2023.07.25

excel重复项筛选标色
excel重复项筛选标色

excel的重复项筛选标色功能使我们能够快速找到和处理数据中的重复值。本专题为大家提供excel重复项筛选标色的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.07.31

excel复制表格怎么复制出来和原来一样大
excel复制表格怎么复制出来和原来一样大

本专题为大家带来excel复制表格怎么复制出来和原来一样大相关文章,帮助大家解决问题。

572

2023.08.02

excel表格斜线一分为二
excel表格斜线一分为二

在Excel表格中,我们可以使用斜线将单元格一分为二。本专题为大家带来excel表格斜线一分为二怎么弄的相关文章,希望可以帮到大家。

1264

2023.08.02

excel斜线表头一分为二
excel斜线表头一分为二

excel斜线表头一分为二的方法有使用合并单元格功能方法、使用文本框功能方法、使用自定义格式方法。本专题为大家提供excel斜线表头一分为二相关的各种文章、以及下载和课程。

376

2023.08.02

绝对引用的输入方法
绝对引用的输入方法

绝对引用允许在公式中引用一个固定的单元格,而不会随着公式的复制和粘贴而改变引用的单元格。本专题为大家提供绝对引用相关内容的文章,大家可以免费体验。

4563

2023.08.09

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 21.3万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号