python读取csv的不同形式

舞姬之光

发布时间：2025-11-18 21:40:02

490人浏览过

来源于php中文网

原创

答案：python读取csv文件主要有三种方法：1. 使用csv模块适合简单结构，可读取为列表或字典；2. pandas的read_csv最常用，支持dataframe操作、类型推断和大文件分块；3. numpy适用于纯数值数据，用loadtxt或genfromtxt快速加载数组。

python读取csv的不同形式

Python读取CSV文件有多种方式，每种适合不同场景。最常用的包括使用内置的csv模块、pandas库，以及用numpy处理数值型数据。下面介绍几种主要方法及其适用情况。

1. 使用 csv 模块读取（基础方式）

csv模块是Python标准库的一部分，适合处理结构简单、不需要复杂分析的CSV文件。

常见用法：

读取为列表：每一行是一个列表，按列顺序访问数据
读取为字典：使用csv.DictReader，列名作为键，更易读

示例代码：

立即学习“Python免费学习笔记（深入）”；

import csv
<h1>读取为列表</h1><p>with open('data.csv', 'r', encoding='utf-8') as file:
reader = csv.reader(file)
for row in reader:
print(row)  # 每行是列表</p><h1>读取为字典</h1><p>with open('data.csv', 'r', encoding='utf-8') as file:
reader = csv.DictReader(file)
for row in reader:
print(row['name'], row['age'])  # 按列名访问

2. 使用 pandas 读取（推荐用于数据分析）

pandas是最常用的数据分析库，pd.read_csv()功能强大，支持自动类型推断、缺失值处理、指定列、跳行等。

优点：

一行代码加载成DataFrame，便于后续处理
支持压缩文件、URL路径、大文件分块读取
可指定编码、分隔符、索引列等参数

示例：

import pandas as pd
<h1>基本读取</h1><p>df = pd.read_csv('data.csv')</p><div class="aritcle_card flexRow">
                                                        <div class="artcardd flexRow">
                                                                <a class="aritcle_card_img" href="/ai/1871" title="Hotpot AI Background Remover"><img
                                                                                src="https://img.php.cn/upload/ai_manual/000/969/633/68b6c5e721710617.png" alt="Hotpot AI Background Remover"  onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
                                                                <div class="aritcle_card_info flexColumn">
                                                                        <a href="/ai/1871" title="Hotpot AI Background Remover">Hotpot AI Background Remover</a>
                                                                        <p>Hotpot.ai推出的图片背景移除工具</p>
                                                                </div>
                                                                <a href="/ai/1871" title="Hotpot AI Background Remover" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
                                                        </div>
                                                </div><h1>指定参数</h1><p>df = pd.read_csv('data.csv', encoding='gbk', sep=';', index_col='id')</p><h1>只读前100行（适合大文件）</h1><p>df = pd.read_csv('large.csv', nrows=100)</p><h1>分块读取</h1><p>chunk_reader = pd.read_csv('huge.csv', chunksize=1000)
for chunk in chunk_reader:
process(chunk)  # 逐块处理

3. 使用 numpy 读取（适用于纯数值数据）

如果CSV只包含数字，可以用numpy.loadtxt()或genfromtxt()快速加载为数组。

注意：

数据必须规整，不能有缺失或混合类型
genfromtxt()支持处理缺失值

示例：

import numpy as np
<h1>简单读取（全为数字）</h1><p>data = np.loadtxt('numbers.csv', delimiter=',')</p><h1>支持缺失值</h1><p>data = np.genfromtxt('data.csv', delimiter=',', skip_header=1)

4. 其他情况处理技巧

实际使用中常遇到编码、分隔符、中文列名等问题，这里列出常见应对方式：

乱码问题：尝试encoding='utf-8'、'gbk'或'latin1'
分隔符不是逗号：如制表符\t，用sep='\t'或delimiter='\t'
无标题行：设置header=None或names=['col1','col2']
跳过某些行：使用skiprows参数

基本上就这些常用方式。小文件或学习阶段可用csv模块，做数据分析首选pandas，纯数值计算考虑numpy。根据数据特点选择合适方法，效率更高。

如何安全地在 Apache 环境中执行 Python 脚本而不暴露源码

Python 中实现匿名函数作为可变参数传递的完整教程

Python 中如何匿名传递多个函数作为参数（类似 PHP 的可变函数参数）

Python 中如何匿名传递多个函数作为参数

如何在 Python 中安全地向 PHP 命令行脚本传递参数

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

Golang 测试体系与代码质量保障：工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链（如go test）、单元测试、集成测试及端到端测试实践，结合代码覆盖率分析、静态代码扫描（如go vet）和动态分析工具，建立全链路质量监控机制。通过自动化测试框架、持续集成（CI）流水线配置及代码审查规范，实现测试用例管理、缺陷追踪与质量门禁控制，确保代码健壮性与可维护性，为高可靠性工程系统提供质量保障。

2026.02.28

Golang 工程化架构设计：可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则，涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术，帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

2026.02.28

Golang 性能分析与运行时机制：构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面，深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略，并结合实际案例剖析 Go 程序的运行时行为，帮助开发者掌握构建高性能应用的关键技能。

2026.02.28