0

0

python之文件处理的详细介绍

高洛峰

高洛峰

发布时间:2017-03-22 10:38:21

|

1688人浏览过

|

来源于php中文网

原创

python中如果想对硬盘中的一个文件进行操作大概可以分为三步,它的流程如下:

使用open函数打开一个文件句柄,并且赋值给一个变量。

通过相应的文件句柄对指定的文件进行操作。

操作完成后关闭文件,文件关闭后,会将文件内容写入到磁盘中。

open函数的使用方法如下。

立即学习Python免费学习笔记(深入)”;

open(‘文件路径’,mode=‘打开文件的模式‘,encoding='文件编码方式')

文件路径:这个文件路径可以是绝对路径,也可以是相对路径,在python中相对路径只需要写文件名就可以了,如果python程序和需要大开的文件如果在一个目录的话,直接使用相对路径就可以了。

注意!如果要使用open函数,文件路径是必要参数,不可以不传!

打开文件的模式:open函数里面有一个非必要形参,就是mode,它用来定义文件的打开模式,如果不指定文件打开模式,默认情况下会使用r(只读)模式打开文件。

python中所提供的常用文件打开方式如下:

'r' 以只读模式打开文件,使用r(只读模式)打开文件,文件只能读,不能做写操作。(文件不存在,则抛出异常)

'w'以只写模式打开文件,使用w(只写模式)打开文件,文件只能写,不能读取,不过有一点需要特别注意!!!!!一个原本就有内容的文件,一旦使用w打开,那么这个文件的内容会被清空!!(至于原因,本文后面会补充。)(如果不想文件原来的内容被清空!!那么千万不要使用w模式!!!!!!!)(文件不存在时,会创建一个文件,如果文件存在,则会先清空文件内容)

'a' 追加模式,也是一种只写模式,用于在问价的尾部追加内容,所写入的内容都会追加到文件的末尾处

       'b' 二进制模式,使用二进制的方式来打开文件,注意!这个‘b’(二进制模式)是要与(r,w,a)三种模式组合使用的。(跨平台跨操作系统建议使用此模式)

    'r+' 可读可写(在这种模式下,虽然可读可写,但是写的时候一定要注意,seek指针还在文件的头部,如果没有调整seek指针的位置直接开始写入,会直接开始覆盖前面写的内容(从文件头部开始),所以说,在使用r+模式的时候,一定要注意seek指针的位置,在文件的什么地方!!否则会覆盖原有内容。)

    'w+' 可写可读 (这个模式一般情况下不要用,也会直接清空文件)

    'a+' 末尾追加,可写可读

一.对文件对象进行操作的常用方法

读文件:

readable()用于判断文件是否可读,如果可读返回True,否则返回False。

readline() 一次读取文件的一行,返回字符串类型。

read()一次读取文件所有的内容,返回一整个字符串。

readlines()读取文件的所有内容,并把文件的每一行内容添加到一个列表里面,文件的每一行内容都将作为列表中的一个元素。

写文件:

writable():判断文件是否可写,如果可写,返回True,否则返回False。

write():在文件中写入内容,只有当文件处于可写的模式,才可以使用此方法,具体在文件的什么位置写,则取决于文件的打开模式(是r+还是a+或者是w+)还有就是取决于当前的seek指针所指向文件的什么位置。(在补充一点,使用write方法向文件内部写内容,是没有换行符的,需要手动添加个换行符,不然所有的内容都会粘到一起。)

例:f1.write('hello!\n') #\n就是换行符。

writelines():和wirte类似,都是向文件内部写入内容,和write不同的是,writelines是使用列表的形式来对文件内部写入内容,使用writelines方法,python会将列表循环,列表中的每个元素都会写入到文件中。

注意!使用writelines对文件内部写内容时,也是不带换行符的,如果给每个元素的尾部都加个换行符,那么列表中的每一个元素都是文件中的一行。

注意!!在文件中写入的内容只能是字符串,不可以是其他类型!!否则会抛出异常,就算要写入数字,那么这个数字也一定要转换成字符串类型!!!

其他操作:

close()关闭文件,当文件使用读完或者写完后一定要使用close关闭文件!(使用with语法除外,因为使用with关键字打开文件,对文件的操作结束后,会自动关闭文件)。

读完文件后不关闭,程序会一直占用系统资源。

写完文件后不关闭,会导致内存中的内容不会及时的同步到硬盘中,若想把内容彻底写到硬盘,要不然就使用close关掉文件,要不然,就使用flush方法强制把内存中的数据刷到硬盘上。

flush()将内存中没有写到硬盘上的数据,强刷到硬盘中。

encoding:显示文件打开的编码(在python2中没有这个方法,在python3中可以使用。)

tell():可以获取当前seek指针的位置。

seek(指针位置 ,模式)以字节为单位,移动seek指针,在文件中的位置。

在pyrhon中对seek指针的操作有三种模式,下面对这三种模式进行一个详细的介绍:

file.seek(n,0)#n代表了指针的位置,后面的数字0代表的是模式的序号。

file.seek(n,0):(模式0)模式0代表了,绝对位置,n为几,就会把指针移动到从文件开头开始算数的第几个字节。(在使用seek时,如果不指定模式,那么默认的模式就是0。)

比如说file.seek(3,0) 将指针移动到从文件的开头(第0个字节)开始数,三个字节的位置。

#没使用指针之前

f1 = open('seasons.lrc',mode='r')

print f1.readline()

>>>浜崎あゆみ - Seasons

#下面是使用0模式,将指针移动到文件的第3个字节,将指针移动到第3个字节以后,在去读文件,就会从指针的后面开始读文件。

f1 = open('seasons.txt',mode='r')

print f1.tell() #显示一下seek指针当前的位置

>>>0 #(位置是0,代表指针在文件的开头)

f1.seek(3,0)    #(将指针移动到第三个字节处,使用0模式,绝对位置)

print f1.tell()   #再次查看指针位置,可以验证指针的位置确实被移动到了第三个字节处。

>>>3

print f1.readline()  #从当前指针的位置后面读取一行。

>>>崎あゆみ - Seasons

这时可能有人要问了,读文件是从指针的后面开始读的没错,但是明明把指针移动到了三个字节之后啊,为什么才跳过了一个字符?

这就需要了解什么是字符和字节了,一定要清楚这个概念!!在utf-8的字符编码中,一个汉字会占用三个字节,原来第一行的内容是“浜崎あゆみ - Seasons”,因为一个汉字占了三个字节,所以指针被向后移动了三个字节,正好是一个汉字的位置,指针被移动到了“浜”后面,读文件的话,就从这个字后面开始读, 所以显示的就是“崎あゆみ - Seasons”。(一个日文字符在utf-8字符编码中也占三个字节。)

后面在举个例子,这个例子可以明白“绝对位置”的意思。

f1 = open('seasons.lrc',mode='r')

print f1.tell()  #打开文件后,指针默认的位置是0。

>>>0

f1.seek(3,0)  #将指移动到文件中3个字节的位置。

print f1.tell()

>>>3

f1.seek(3,0)

print f1.tell()

>>>3

file.seek(n,1): (模式1)模式1,相对位置,n代表了指针在当前位置向后移动几个字节。

如果觉得我说的不太容易懂的话,估计看下后面的例子,就懂了。

f1 = open('seasons.lrc',mode='r')

print f1.tell()   #打开文件后,指针默认的位置是0。

>>>0

f1.seek(3,1)  #将指针向后移动3个字节的位置。

print f1.tell()

>>>3     #指针移动到了第3个字节的位置。

f1.seek(3,1)  #这里是重点了,将指针在向后移动3个字节(在这个地方就可以比较出模式1和模式0的区别了。)

print f1.tell()

>>>6   #指针的位置在第6个字节上,这也就说明了,1模式每次移动,并不是从文件的开头开始算起,而是根据指针上次所在的位置开始向后移动。(这也就是“相对位置”的意思。)

如果还看不懂,那就看下面的补充。

最后在补充一下:

f1.seek(3,0) 是指,将指针移动到文件第3个字节的位置。(绝对位置)

f1.seek(3,1) 是指,将指针从当前位置向后移动3个字节的位置。(相对位置)

file.seek(-n,2): 以绝对位置,从文件最末尾开始,向文件的开头移动。(在使用2模式时,需要注意,指针移动的位置只能是负数,因为是从最末尾开始向前移动!)

下面是例子:

#打开一个文件,使用read方法从头读到文件的尾部,当文件被读完,指针自然就回移到文件的末尾。

f1 = open('seasons.txt',mode='r')

print f1.tell()

>>>0

f1.read()

print f1.tell()

>>>756

现在通过上面的方法已经知道,文件的最末尾是文件的第几个字节。

下面来测试下seek方法的2模式的功能是否如之前所说,从文件最末尾开始,向文件的开头移动。

f1 = open('seasons.txt',mode='r')

print f1.tell()

>>>0

f1.seek(-1,2)  #使用seek的2模式,将指针从文件的最末尾向前移动1个字节

print f1.tell()

>>>755

#文件的最末尾是756,向前移动了一个字节就是755,得到了我们想要得到的效果。

其实seek方法的2模式还是比较有用的,下面就细说下seek方法的2模式。

在获取文件的倒数第1行到第N行,就可以使用seek方法的2模式。

这时可能会有人问,取出文件的最后一行,岂不是很简单的操作,只要使用readlines方法把文件都读出来,然后取最后一个元素,就可以取到最后一行了,这种方法岂不是更简单?

像这样。

f1 = open('seasons.txt',mode='r')

print f1.readlines()[-1]

>>>そして何を?つけるだろう

文件的最后一行确实被取出来了,但是,有没有想过,这种使用readlines读取文件的本质,是把文件的每一行全部读到内存中,如果这个文件特别大,比如说10个G,100G,大到当前的内存放不下,如果是这种情况,这种方法就不适用了。

下面这种方法,对于大文件就特别适用了。

f1 = open('seasons.txt',mode='r')

for i in f1:      #直接for循环文件句柄,并不会一次性把文件都读到内存,而是读一行从文件中取一行。

    line_bytes = -36

    while True:

        f1.seek(line_bytes,2)

        data = f1.readlines()

        if len(data) > 1:

            print data[-1]

            break

        else:

            line_bytes * 2

相关文章

python速学教程(入门到精通)
python速学教程(入门到精通)

python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 序列化
Python 序列化

本专题整合了python序列化、反序列化相关内容,阅读专题下面的文章了解更多详细内容。

12

2026.02.02

AO3官网入口与中文阅读设置 AO3网页版使用与访问
AO3官网入口与中文阅读设置 AO3网页版使用与访问

本专题围绕 Archive of Our Own(AO3)官网入口展开,系统整理 AO3 最新可用官网地址、网页版访问方式、正确打开链接的方法,并详细讲解 AO3 中文界面设置、阅读语言切换及基础使用流程,帮助用户稳定访问 AO3 官网,高效完成中文阅读与作品浏览。

200

2026.02.02

主流快递单号查询入口 实时物流进度一站式追踪专题
主流快递单号查询入口 实时物流进度一站式追踪专题

本专题聚合极兔快递、京东快递、中通快递、圆通快递、韵达快递等主流物流平台的单号查询与运单追踪内容,重点解决单号查询、手机号查物流、官网入口直达、包裹进度实时追踪等高频问题,帮助用户快速获取最新物流状态,提升查件效率与使用体验。

95

2026.02.02

Golang WebAssembly(WASM)开发入门
Golang WebAssembly(WASM)开发入门

本专题系统讲解 Golang 在 WebAssembly(WASM)开发中的实践方法,涵盖 WASM 基础原理、Go 编译到 WASM 的流程、与 JavaScript 的交互方式、性能与体积优化,以及典型应用场景(如前端计算、跨平台模块)。帮助开发者掌握 Go 在新一代 Web 技术栈中的应用能力。

15

2026.02.02

PHP Swoole 高性能服务开发
PHP Swoole 高性能服务开发

本专题聚焦 PHP Swoole 扩展在高性能服务端开发中的应用,系统讲解协程模型、异步IO、TCP/HTTP/WebSocket服务器、进程与任务管理、常驻内存架构设计。通过实战案例,帮助开发者掌握 使用 PHP 构建高并发、低延迟服务端应用的工程化能力。

16

2026.02.02

Java JNI 与本地代码交互实战
Java JNI 与本地代码交互实战

本专题系统讲解 Java 通过 JNI 调用 C/C++ 本地代码的核心机制,涵盖 JNI 基本原理、数据类型映射、内存管理、异常处理、性能优化策略以及典型应用场景(如高性能计算、底层库封装)。通过实战示例,帮助开发者掌握 Java 与本地代码混合开发的完整流程。

9

2026.02.02

go语言 注释编码
go语言 注释编码

本专题整合了go语言注释、注释规范等等内容,阅读专题下面的文章了解更多详细内容。

62

2026.01.31

go语言 math包
go语言 math包

本专题整合了go语言math包相关内容,阅读专题下面的文章了解更多详细内容。

56

2026.01.31

go语言输入函数
go语言输入函数

本专题整合了go语言输入相关教程内容,阅读专题下面的文章了解更多详细内容。

28

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.8万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号