0

0

使用 Python 批量计算并填充 Excel 中按列分组的汇总值

霞舞

霞舞

发布时间:2026-02-18 20:21:00

|

694人浏览过

|

来源于php中文网

原创

使用 Python 批量计算并填充 Excel 中按列分组的汇总值

本文介绍如何利用 pandas 高效实现 excel 表格中“按 age 分组求 income 总和,并自动写入 total 列”的自动化更新,避免手动计算或低效循环,兼顾准确性与可扩展性。

本文介绍如何利用 pandas 高效实现 excel 表格中“按 age 分组求 income 总和,并自动写入 total 列”的自动化更新,避免手动计算或低效循环,兼顾准确性与可扩展性。

在数据处理场景中,常需对 Excel 表格中某列(如 AGE)进行分组聚合,并将结果回填至原表新列(如 Total)。传统做法如 iterrows() 或嵌套循环不仅代码冗长、性能低下,还容易出错;而 groupby().sum() 直接返回压缩后的分组结果,无法对齐原始行索引——这正是许多初学者卡壳的关键。

Pandas 提供了更优雅的解决方案:transform() 方法。它能在保持原始 DataFrame 行数和索引顺序的前提下,将分组聚合结果广播(broadcast)回每行对应位置,完美适配“原地填充汇总列”的需求。

以下是一个完整、可直接运行的教程示例:

import pandas as pd

# 1. 读取 Excel 文件(假设文件名为 'data.xlsx',位于当前目录)
df = pd.read_excel('data.xlsx')

# 2. 确保 INCOME 列为数值类型(处理可能存在的逗号分隔符,如 '50,000')
df['INCOME'] = df['INCOME'].astype(str).str.replace(',', '').astype(float)

# 3. 使用 transform 计算每个 AGE 组对应的 INCOME 总和,并赋值给 Total 列
df['Total'] = df.groupby('AGE')['INCOME'].transform('sum')

# 4. 将结果写回 Excel(覆盖原表或另存为新文件)
df.to_excel('data_updated.xlsx', index=False)

关键说明

Tanka
Tanka

具备AI长期记忆的下一代团队协作沟通工具

下载

立即学习Python免费学习笔记(深入)”;

  • transform('sum') 不会改变 DataFrame 形状,而是为每一行填入其所属 AGE 组的 INCOME 总和(例如所有 AGE==32 的行,Total 均为 141000.0);
  • str.replace(',', '').astype(float) 是处理常见 Excel 导入后货币格式字符串的必备步骤,否则 sum() 将报错或返回空值;
  • 若需保留千位逗号显示(仅用于展示),可在写入前格式化:
    df['Total'] = df['Total'].map('{:,.0f}'.format)

⚠️ 注意事项

  • 请勿使用 df.groupby('AGE')['INCOME'].sum() 直接赋值,它返回的是 Series(索引为 AGE 值),长度远小于原表,会导致 NaN 或对齐错误;
  • 若 Excel 含多张工作表,需指定 sheet_name 参数;含标题行偏移时,用 header= 调整;
  • 生产环境建议添加异常处理(如 try/except)和数据校验(如检查缺失值)。

通过这一方法,您可在秒级内完成万行级数据的分组汇总填充,真正实现“一次编写、多次复用、零人工干预”的自动化数据更新流程。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

75

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

4

2026.01.31

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

591

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

105

2025.10.23

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

553

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

216

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1553

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

640

2023.11.24

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

561

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 17.9万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号