如何正确将含时间戳的 Excel 数据导入 Pandas DataFrame

花韻仙語

发布时间：2026-02-27 13:44:02

477人浏览过

来源于php中文网

原创

如何正确将含时间戳的 Excel 数据导入 Pandas DataFrame

本文详解如何在使用 pandas.read_excel() 导入 Excel 表格时，准确解析 "m/d/Y H:M" 格式的时间戳列，避免因区域设置或自动推断导致的日期错乱（如 1/5/2021 被误读为 2021-01-05 而非 2021-05-01），并提供可靠、可复现的解决方案。

本文详解如何在使用 `pandas.read_excel()` 导入 excel 表格时，准确解析 `"m/d/y h:m"` 格式的时间戳列，避免因区域设置或自动推断导致的日期错乱（如 `1/5/2021` 被误读为 `2021-01-05` 而非 `2021-05-01`），并提供可靠、可复现的解决方案。

在处理水文、气象或IoT等高频时序数据时，Excel 文件中常以 "m/d/Y H:M"（如 4/30/2021 23:45）格式存储时间戳。但 pandas.read_excel() 默认启用 infer_datetime_format=True 并依赖底层 xlrd 或 openpyxl 的日期解析逻辑——它会尝试根据数值范围（如月份 ≤12）自动猜测格式，导致 1/5/2021 被错误识别为 2021-01-05（1月5日），而非用户本意的 2021-05-01（5月1日）。更棘手的是，当 Excel 内部混合了不同区域格式（例如前12行用 m/d/Y，后续改用 d/m/Y），问题会进一步加剧。

关键结论：date_format 参数在 read_excel() 中对大多数引擎（如 openpyxl、xlrd）并不生效 —— 它仅被 pandas 的旧版 xlrd 引擎部分支持，且不保证严格按指定格式解析。因此，推荐采用“先读取、后转换”策略，即使用 pd.to_datetime() 显式指定格式进行列级转换，这是最稳定、最可控的方法。

以下为完整实践代码：

XYZ SCIENCE

免费论文AIGC检测，一键改写降AI率

下载

import pandas as pd

# 1. 基础读取（不解析日期）
df = pd.read_excel("DATA.xlsx")

# 2. 显式转换 'date' 列为 datetime，强制按 '%m/%d/%Y %H:%M' 解析
# 注意：若原始数据无秒（如 '4/30/2021 23:45'），请勿加 ':%S'
df['date'] = pd.to_datetime(df['date'], format='%m/%d/%Y %H:%M')

# 3. 验证结果
print(df.dtypes)
print(df.head())

✅ 输出示例：

date          datetime64[ns]
flowrate             float64
dtype: object

     date  flowrate
0 2021-04-30 23:45:00  -1904.39
1 2021-04-30 23:50:00  -1864.59
2 2021-04-30 23:55:00  -1772.78
3 2021-01-05 00:00:00  -1679.54  # 此处 '1/5/2021' → 2021年1月5日（符合 m/d/Y）

⚠️ 重要注意事项：

格式字符串必须与原始字符串完全匹配：%m 对应月（01–12）、%d 对应日（01–31）、%Y 对应4位年份；若 Excel 中时间为 0:00（无前导零），需改用 %I 或容错处理（见下文）；

处理不规范时间（如 0:00）：若原始数据存在单数字小时/分钟（如 1/5/2021 0:00），%H:%M 可能失败。此时建议添加 errors='coerce' 并配合 fillna()，或统一预处理：

# 容错转换（无效值转为 NaT）
df['date'] = pd.to_datetime(df['date'], format='%m/%d/%Y %H:%M', errors='coerce')
# 或先用 str.replace 清洗（适用于批量修复）
df['date'] = df['date'].astype(str).str.replace(r'(\b\d{1,2})/(\d{1,2})/(\d{4}) (\d{1,2}):(\d{2})', 
                                                 r'\1/\2/\3 \Z\4:\5', regex=True)  # 示例思路，实际请按需调整

性能提示：对超大 Excel 文件，可在 read_excel() 中使用 usecols 限定列、dtype={'date': str} 防止自动类型转换，再执行 to_datetime，显著提升效率；
替代方案：优先使用 CSV：如问题所述，Excel 的二进制格式易受本地区域设置污染。若源头可导出为 UTF-8 CSV，pd.read_csv() + parse_dates 组合更稳定：
```
df = pd.read_csv("DATA.csv", parse_dates={'datetime': ['date']}, 
                 date_parser=lambda x: pd.to_datetime(x, format='%m/%d/%Y %H:%M'))
```

总结而言，放弃依赖 read_excel() 的自动日期推断，坚持使用 pd.to_datetime(..., format=...) 进行显式、强约束的列转换，是确保时间戳解析准确性的黄金准则。该方法逻辑清晰、调试直观、兼容性强，适用于所有主流 pandas 版本（≥1.0）及 Excel 引擎。

使用 Python 精确绘制毫米级坐标圆并导出 A4 尺寸可打印 PDF 教程

使用 Pandas 填充级联式空值并重构分层 Excel 数据结构

Pandas 实现级联填充与条件筛选：处理分层结构的 Excel 数据

Pandas 实现级联填充与行筛选：处理分层结构的 Excel 数据

Python Excel 大文件读写的 openpyxl 优化

相关标签:

excel pandas date format 字符串类型转换 iot excel Excel 表格

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 线上错误排查思路总结下一篇：暂无

作者最新文章

Django项目创建后文件不可见？正确路径与环境配置指南

2026-02-25 15:52

Go Protobuf 导入路径迁移与 protoc-gen-go 升级指南

2026-02-25 16:23

Go 中结构体指针接收者自动解引用机制详解

2026-02-25 16:26

外媒评《生化危机》系列最佳！《生化8》仅排第七

2026-02-25 16:29

如何通过事件监听器实现按钮点击显示/隐藏表格的稳定交互

2026-02-25 16:49

如何使用 Mutiny 实现服务的顺序调用

2026-02-25 17:00

开年爆款？多人合作派对游戏《超级高尔夫大乱斗》发售两天销量突破十万套

2026-02-25 17:10

猫神牧场流派攻略及注意事项猫神牧场流派介绍

2026-02-25 17:32

Go模板中实现跨页面复用的头部与底部布局

2026-02-25 17:38

勇者远征什么职业厉害勇者远征职业推荐选择攻略

2026-02-25 17:59

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

866

2023.07.31

python中的format是什么意思

python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

453

2024.06.27

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

638

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

218

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1560

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

643

2023.11.24

漫蛙app官网链接入口

漫蛙App官网提供多条稳定入口，包括 https://manwa.me、https

2026.02.27

热门下载

网站特效

网站源码

网站素材

前端模板