Python中使用gzip模块可轻松压缩文件。1. 用gzip.open()以'wt'模式写入文本并压缩为.gz文件,支持中文;2. 可读取已有文件内容并写入压缩文件实现压缩;3. 处理二进制数据时使用'wb'模式,适用于pickle序列化对象;4. 可通过compresslevel参数设置1-9级压缩强度,默认6,9压缩率最高。关键在于正确选择文本或二进制模式,并注意编码匹配。

Python 中使用 gzip 压缩文件非常简单,主要通过内置的 gzip 模块实现。它可以将普通文件压缩为 .gz 格式,节省存储空间,适合处理日志、文本等可压缩数据。
1. 压缩文本文件
使用 gzip.open() 可以像操作普通文件一样写入内容,自动完成压缩。
- 打开目标文件时指定模式为
'wt'(写入文本) - 写入字符串内容,gzip 会自动压缩并保存为 .gz 文件
示例代码:
import gzip
with gzip.open('example.txt.gz', 'wt', encoding='utf-8') as f:
f.write('这是一些要被压缩的文本内容。\n')
f.write('支持中文和普通文本。\n')
2. 压缩已存在的文件
读取一个已存在的文件,并将其内容写入 gzip 压缩文件中。
立即学习“Python免费学习笔记(深入)”;
示例:压缩 data.txt 为 data.txt.gz
Zoomify 是一款基于的简单带缩放效果的 jQuery lightbox 插件,它使用简单,出来提供基本的属性外,还提供了自动事件和自定义方法,能够满足大多数需求。
import gzip
with open('data.txt', 'r', encoding='utf-8') as src:
with gzip.open('data.txt.gz', 'wt', encoding='utf-8') as dst:
dst.write(src.read())
3. 压缩二进制数据
如果处理的是非文本数据(如图片中间数据、序列化对象),应使用二进制模式。
- 使用
'wb'模式写入二进制数据 - 适用于 bytes 类型数据,例如 pickle 序列化对象
示例:压缩二进制数据
import gzip
import pickle
data = {'name': 'Alice', 'age': 30}
with gzip.open('data.pkl.gz', 'wb') as f:
pickle.dump(data, f)
4. 设置压缩级别(可选)
gzip.open() 支持通过 compresslevel 参数控制压缩强度,取值 1-9:
- 1:最快,压缩率最低
- 9:最慢,压缩率最高
- 默认值是 6
示例:使用高压缩比
with gzip.open('large_file.txt.gz', 'wt', encoding='utf-8', compresslevel=9) as f:
f.write(large_text_content)
基本上就这些。gzip 模块用法接近标准文件操作,关键是选择正确的模式(文本用 wt,二进制用 wb),就能顺利压缩文件。不复杂但容易忽略编码和模式匹配问题。









