Python CSV 文件读写的注意事项

舞姬之光

发布时间：2026-02-13 19:38:01

413人浏览过

来源于php中文网

原创

windows下读csv需显式指定encoding：gbk文件用"gbk"或"gb18030"，utf-8文件用"utf-8-sig"；pandas中统一用sep而非delimiter，避免冲突；字段含特殊字符时应调整quoting或engine参数。

python csv 文件读写的注意事项

open() 读 CSV 不加 encoding 会乱码

Windows 默认用 GBK 编码存 CSV，而 Python 3 的 open() 在多数系统上默认用 UTF-8 解码。不显式指定编码，中文列名或内容直接变 UnicodeDecodeError 或一堆问号。

Windows 上保存的 CSV，优先试 encoding="gbk"（或 "gb18030"，兼容性更好）
Mac/Linux 或明确是 UTF-8 导出的文件，用 encoding="utf-8-sig" ——-sig 能自动跳过 BOM，避免首列名前多出 \ufeff
别依赖 locale.getpreferredencoding()，它在不同环境返回不稳定，尤其打包成 exe 后常失效

pandas.read_csv() 的 sep 和 delimiter 别混用

sep 和 delimiter 是同一个参数的两个别名，但 pandas 只认 sep 为首选；如果同时传两者，会报 TypeError: read_csv() got multiple values for argument 'sep'。

统一用 sep=","，逗号分隔时可省略；制表符用 sep="\t"；中文 Excel 导出的 CSV 有时用 sep="，"（全角逗号），需手动确认
遇到字段内含换行或引号，别硬调 sep，先检查是否该用 quoting=csv.QUOTE_MINIMAL（配合 import csv）或设 engine="python" 避免 C 引擎解析失败
sep=None 并不会自动推断分隔符，而是触发 csv.Sniffer，但小文件（

写 CSV 时 newline="" 必须显式传给 open()

Windows 下用 open(..., "w") 写 CSV，若不加 newline=""，csv.writer 或 to_csv() 会在每行末额外加一个 \r\r\n，导致 Excel 打开时多出空行。

小麦企业网站展示系统1.1

小麦企业网站展示系统介绍：一、安装使用将xiaomai.sql导入数据库二、后台登录后台帐号，密码默认都是admin,config.php 配置文件可根据自行需要修改，IP地址，数据库用户名，密码，及表名后台目录默认admin，支持自行任意修改目录名三、注意事项1 本源码完全免费，采用伪静态，减少不必要的源码重复，速度更快，支持二次开发。2、注明本程序编码为UTF8，如发生乱码，请注意修改编码3、

下载

正确写法是 open("out.csv", "w", newline="") —— 注意是空字符串，不是 None 或 "\n"
pandas.DataFrame.to_csv() 内部已处理这点，不用管 newline，但如果你用 csv.writer 手动写，这步不能漏
这个参数对 Linux/macOS 无害，所以统一加上更安全，别按系统条件判断

to_csv() 的 index 参数一不留神就多出一列

DataFrame.to_csv() 默认写入行索引（即第 0 列是数字序号），看起来像“多了一列”，尤其原始数据本就有 ID 列时，容易误以为数据错位。

立即学习“Python免费学习笔记（深入）”；

绝大多数场景应显式写 index=False，除非你真需要把索引当一列导出
如果原 DataFrame 索引是带名的（df.index.name == "user_id"），且你设了 index=True，那导出 CSV 第一列名会是 user_id，但内容仍是行号——这不是 bug，是索引名和索引值分离导致的，得先 reset_index(drop=False) 再导出才一致
用 to_csv(index_label="id") 改列名只在 index=True 时生效，别指望它拯救 index=False 的场景

CSV 看似简单，但编码、换行、索引、分隔符这四点只要漏一个，就可能让下游同学花半小时查不出为啥 Excel 里文字挤在一起、行数对不上、或者第一列莫名多出数字。实际项目里，建议把常用读写逻辑封装成小函数，把 encoding、newline、index 这些都固化下来，比每次临时想保险得多。

如何高效统计嵌套列表中指定关键词的出现次数并构建结构化计数字典

Polars 中高效统计字符串重叠子串出现次数的完整教程

如何为 Python 生成器对象自定义 __contains__ 行为

如何为 Python 生成器对象自定义高效的 __contains__ 行为

高效实现稀释k近邻（Dilated k-NN）的向量化加速方案

相关标签:

python csv pandas for 堆 bom windows linux excel

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在在线训练中防止灾难性遗忘下一篇：LeetCode 长回文子串问题的内存优化与高效动态规划解法

作者最新文章

发票抽奖要满足什么条件才能抽发票抽奖是真的吗怎么参与

2026-02-13 11:09

发票抽奖没有发票代码怎么办发票抽奖怎么参加

2026-02-13 11:43

发票抽奖在哪查询发票抽奖查询官网入口网页

2026-02-13 11:45

两新补贴政策怎么领取？两新补贴攻略指南【教程】

2026-02-13 11:46

住房个税退税不同城可以退吗换购住房个税退税全指南(2026最新版

2026-02-13 11:49

IQOO手机各个型号参数一览表 IQOO全系列型号参数汇总

2026-02-13 12:04

崩坏:星穹铁道4.0最新兑换码星铁4.0免费兑换码活动入口

2026-02-13 12:05

终末地影拓丰碑攻略平民影拓丰碑全满星教程

2026-02-13 12:13

崩坏:星穹铁道4.0卡池抽取建议星铁4.0角色强度榜

2026-02-13 12:13

《明日方舟终末地》影拓丰碑第一期配队打法攻略【平民】

2026-02-13 12:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

416

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

588

2023.08.10

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

1088

2023.07.26