openpyxl与pandas分工协作:pandas负责数据清洗计算,openpyxl负责格式化呈现;pandas读写会丢失样式,需用openpyxl操作模板、填入结果并设置格式、条件高亮等。

用 Python 做 Excel 数据统计分析,openpyxl 负责精细格式控制和已有文件操作,pandas 负责高效清洗与计算——二者不是替代关系,而是分工协作。关键在于:先用 pandas 处理逻辑,再用 openpyxl 落地呈现。
一、为什么不能只用 pandas 读写 Excel?
pandas 的 read_excel() 和 to_excel() 底层依赖 openpyxl(或 xlsxwriter)引擎,但它们会丢弃原工作表的样式、合并单元格、图表、批注等非数据信息。如果你要保留模板格式、自动适配列宽、加边框或高亮异常值,就必须切换到 openpyxl 手动操作。
- ✅ pandas:适合读取原始数据 → 清洗 → 汇总 → 生成新表格
- ✅ openpyxl:适合打开已有报表模板 → 填入 pandas 计算结果 → 设置字体/颜色/边框 → 保存为“可交付版”
- ❌ 单用 pandas.to_excel():生成的是“干净但无格式”的表格,常被业务方退回重做
二、典型协作流程:销售报表自动化
假设你有一份《月度销售汇总.xlsx》模板,含固定标题、公司 logo 单元格、预设边框和“数据区”占位符(如 A10 开始)。真实数据来自数据库或 CSV,需填入并高亮超目标门店。
初阶PHP Apache MySQL网站设计来自作者多年学习、应用和讲授PHP的经验与体会,是专为学习PHP+MySQL数据库编程人员编与的入门教材。在最后二章设计了2个贴近实际应用的典型案例:留言本系统和论坛系统,每个案例先介绍开发思路、步骤,再给出全部源代码,使所学内容与实际应用紧密结合,特别是论坛系统将全书的案例串讲起来,力求使读者学到最贴近应用前沿的知识和技能。
操作分三步:
立即学习“Python免费学习笔记(深入)”;
- 1. 用 pandas 加载并计算:读原始数据,按区域聚合销售额、计算完成率、标记达标状态
- 2. 用 openpyxl 打开模板:定位“数据区”起始单元格(如 ws['A10']),逐行写入 pandas 的结果(注意:openpyxl 不支持直接写 DataFrame,需转成列表或循环赋值)
- 3. 格式增强:对完成率列设置条件格式(如 >100% 填绿色)、自动调整列宽、冻结首行、保存为新文件
三、关键代码片段(不粘贴完整脚本,只讲核心)
▶ 写入数据(避免逐单元格 for 循环太慢)
用 ws.append() 批量追加一行行数据,比 ws.cell(row=..., column=...).value = ... 快得多:
for r in dataframe_to_rows(df_result, index=False, header=False):
ws.append(r)
▶ 高亮达标行(openpyxl 条件格式示例)
不是靠 if 判断每行,而是用内置条件格式规则:
rule = CellIsRule(operator='greaterThan', formula=['1'], stopIfTrue=True,
fill=PatternFill(start_color='C6EFCE', end_color='C6EFCE', fill_type='solid'))
ws.conditional_formatting.add('E10:E100', rule) # 假设完成率在 E 列
四、避坑提醒
- openpyxl 默认从 1 开始计数(row=1, column=1),pandas 的 .iloc[] 从 0 开始——写入前注意索引偏移
- 写入数字时,openpyxl 可能自动识别为字符串(尤其带逗号或百分号),建议显式转类型:
float(val)或int(val) - 如果模板含公式(如 =SUM(B10:B20)),openpyxl 不会重算——要么用
workbook.data_only = True读取已计算值,要么写入后用 Excel 手动刷新 - 中文路径/文件名务必用 UTF-8 编码打开,否则报错
UnicodeDecodeError








