0

0

Python 正则 re.findall() 和 re.finditer() 哪个更省内存?

冷漠man

冷漠man

发布时间:2026-01-25 20:17:02

|

883人浏览过

|

来源于php中文网

原创

re.finditer()更省内存,返回迭代器,每次只生成一个Match对象;re.findall()返回列表,支持索引、切片和多次遍历,适合需随机访问或直接传给len()等函数的场景。

python 正则 re.findall() 和 re.finditer() 哪个更省内存?

re.finditer() 更省内存,尤其处理大文本时

当目标字符串很大、匹配结果很多时,re.findall() 会一次性把所有匹配内容构造成列表(list)返回,全部存进内存;而 re.finditer() 返回的是一个迭代器(Iterator),每次只生成一个 Match 对象,用完即丢,不保留历史结果。

什么时候必须用 re.findall()?

当你需要随机访问匹配结果(比如取第 5 个、倒数第 2 个)、或要对结果做多次遍历、或后续要直接传给 len()sorted()list() 等函数时,re.findall() 更直接。它返回的 list 支持索引、切片、重复迭代。

  • 如果正则带捕获组,re.findall() 返回的是元组列表(每个元组对应一组捕获),而 re.finditer() 的每个 Match 对象需调用 .groups().group(1) 才能取值
  • re.findall(r'(\d+)-(\w+)', s)[('123', 'abc'), ('456', 'def')]
  • re.finditer(r'(\d+)-(\w+)', s) → 每次迭代得一个 Match,再调用 m.groups() 才能得到 ('123', 'abc')

re.finditer() 的典型低内存用法

适合流式处理:逐个匹配、立即处理、不累积。比如日志行解析、大文件逐行提取 ID、实时过滤敏感词。

  • 避免写 matches = list(re.finditer(...)) —— 这就完全抵消了迭代器优势
  • 正确姿势是直接 for 循环:for m in re.finditer(pattern, text): process(m.group())
  • 若只需匹配位置,用 m.start()m.end(),比提取字符串更轻量
  • 注意:Match 对象本身有引用开销,但远小于保存所有匹配字符串的 list

实测差异:10MB 文本里找千次匹配

在 10MB 日志文本中用 re.findall(r'\bERROR\b', text),内存峰值约 12MB(含结果 list);换成 re.finditer() + 即时计数,峰值仅约 3.5MB。差距主要来自 list 存储和字符串对象的副本开销。

Cursor
Cursor

一个新的IDE,使用AI来帮助您重构、理解、调试和编写代码。

下载

立即学习Python免费学习笔记(深入)”;

真正容易被忽略的是:即使你只想要匹配数量,也别写 len(re.findall(...)) —— 它仍会构造完整列表。改用 sum(1 for _ in re.finditer(...)),内存几乎不变,速度略慢但可接受。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1228

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1205

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

193

2025.07.29

c++字符串相关教程
c++字符串相关教程

本专题整合了c++字符串相关教程,阅读专题下面的文章了解更多详细内容。

131

2025.08.07

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号