0

0

Python 正则表达式方法 rematch() 和 resub()

DDD

DDD

发布时间:2024-09-20 08:12:16

|

1833人浏览过

|

来源于dev.to

转载

python 正则表达式方法 rematch() 和 resub()

介绍

让我们通过示例来了解一下 python re 模块中的两个方法 re.sub() 和 re.match()。

1. re.sub():

re.sub() 函数用于替换字符串中模式的出现。它需要三个主要参数:

  • 您要替换的模式(正则表达式)。
  • 替换字符串(您想要替换的字符串)。
  • 要替换其中出现的模式的原始字符串。

语法

re.sub(pattern, replacement, string, count=0, flags=0)
  • 模式:要搜索的正则表达式模式。
  • replacement: 替换匹配模式的字符串。
  • string:将发生替换的输入字符串。
  • count:(可选)限制替换次数。默认情况下,所有出现的地方都会被替换。
  • flags:(可选)允许修改匹配行为(例如不区分大小写)。

示例

让我们用单词 num 替换字符串中的所有数字。

import re

text = "the price is 123 dollars and 45 cents."
new_text = re.sub(r'\d+', 'num', text)

print(new_text)

输出:

the price is num dollars and num cents.

这里,d+ 是匹配一个或多个数字的正则表达式模式。 re.sub() 函数用字符串“num”替换此模式的所有出现。


2. re.match():

re.match() 函数仅检查字符串开头的匹配。如果在字符串的开头找到匹配项,则返回一个匹配对象。否则,它返回 none。

立即学习Python免费学习笔记(深入)”;

语法

re.match(pattern, string, flags=0)
  • 模式:要匹配的正则表达式模式。
  • string:要搜索的输入字符串。
  • flags:(可选)允许修改匹配行为。

示例

让我们检查一个字符串是否以单词开头,后跟数字。

import re

text = "price123 is the total cost."
match = re.match(r'\w+\d+', text)

if match:
    print(f"matched: {match.group()}")
else:
    print("no match found")

输出:

matched: price123

这里,w+匹配一个或多个单词字符(字母、数字和下划线),d+匹配一个或多个数字。由于字符串以“price123”开头,因此成功匹配并打印它。


主要区别:

  • re.sub() 用于替换,适用于整个字符串。
  • re.match() 检查字符串 是否以匹配的 开头,并且不会搜索超出字符串中第一个匹配项的内容。

您想要更多示例或更深入地了解正则表达式吗?


让我们通过更高级的示例和正则表达式 (regex) 模式的解释来更深入地了解 re.sub() 和 re.match()。

re.sub() 高级示例

假设我们想通过替换电话号码的格式来格式化电话号码。我们有 123-456-7890 等电话号码,我们希望将其替换为 (123) 456-7890 等格式。

示例

import re

text = "contact me at 123-456-7890 or 987-654-3210."
formatted_text = re.sub(r'(\d{3})-(\d{3})-(\d{4})', r'(\1) \2-\3', text)

print(formatted_text)

说明

Joker AIx
Joker AIx

一站式AI创意生产平台,覆盖图像、视频、音频、文案全品类创作

下载
  • d{3}:这正好匹配 3 位数字。
  • (d{3}):括号 () 用于捕获组。在本例中,我们将前三位数字作为一组进行捕获。
  • r'(1) 2-3':这是替换字符串。它使用 1、2 和 3 来指代捕获的组(分别是区号、前三位数字和后四位数字)。
  • 因此,此示例查找 123-456-7890 格式的电话号码,并将其转换为 (123) 456-7890。

输出:

contact me at (123) 456-7890 or (987) 654-3210.

re.match() 高级示例

现在让我们看看如何将 re.match() 与更复杂的模式一起使用。假设您想要验证给定字符串是否是有效的电子邮件地址,但我们只想检查它是否以电子邮件格式开头。

示例

import re

email = "someone@example.com sent you a message."

# basic email pattern matching the start of a string
pattern = r'^[a-za-z0-9_.+-]+@[a-za-z0-9-]+\.[a-za-z0-9-.]+'

match = re.match(pattern, email)

if match:
    print(f"valid email found: {match.group()}")
else:
    print("no valid email at the start")

说明

  • ^[a-za-z0-9_.+-]+:此部分匹配一个或多个字母数字字符、点 (.)、下划线 (_)、加号 (+) 或连字符 (-)。 ^ 确保匹配从字符串的开头开始。
  • @[a-za-z0-9-]+:匹配 @ 符号后跟一个或多个字母数字字符或连字符(域名)。
  • .[a-za-z0-9-.]+:匹配点 (.) 后跟字母数字字符、连字符或其他点(顶级域)。

此模式将匹配字符串开头的有效电子邮件地址。

输出:

valid email found: someone@example.com

解释常见的正则表达式模式

  1. d:匹配任意数字(相当于[0-9])。
  2. w:匹配任何单词字符(字母数字加下划线)。相当于[a-za-z0-9_]。
  3. +:匹配前面的字符或组出现 1 次或多次。
  4. *:匹配前面的字符或组出现 0 次或多次。
  5. .:匹配除换行符之外的任何字符。
  6. ^:将模式锚定到字符串的 开头
  7. $:将模式锚定到字符串的 结尾
  8. {m,n}:前面的字符或组出现 m 到 n 次之间的匹配。
  9. [ ]:用于定义字符集。例如,[a-z] 匹配任意小写字母。
  10. ():用于捕获组,允许我们提取匹配的部分并稍后引用它们(如 re.sub() 中)。

将 re.sub() 与函数结合

如果您想要更多动态行为,您还可以使用函数作为 re.sub() 中的替代品。让我们看看如何。

示例:将句子中的每个单词大写。

import re

text = "this is a test sentence."

def capitalize(match):
    return match.group(0).capitalize()

new_text = re.sub(r'\b\w+\b', capitalize, text)

print(new_text)

说明

  • b:字边界。
  • w+:匹配一个或多个单词字符。
  • 每次匹配都会调用 capitalize() 函数,它将每个单词的第一个字母大写。

输出:

this is a test sentence.

re.match() 与 re.search()

如果你想在字符串中任何地方搜索模式(不仅仅是在开头),你应该使用re.search()而不是re.match()。

使用 re.search() 的示例

import re

text = "this is my email someone@example.com"

# search for an email pattern anywhere in the string
pattern = r'[a-za-z0-9_.+-]+@[a-za-z0-9-]+\.[a-za-z0-9-.]+'

search = re.search(pattern, text)

if search:
    print(f"email found: {search.group()}")
else:
    print("no email found")

输出:

Email found: someone@example.com

这里,re.search() 会在字符串中的任意位置查找模式,这与 re.match() 不同,re.match() 只检查开头。

概括:

  • re.sub():替换字符串中模式的匹配项。可以使用捕获的组进行动态替换甚至函数。
  • re.match():检查字符串开头是否匹配。对于验证或检查字符串的开头很有用。
  • re.search():在字符串中的任意位置搜索模式,不限于开头。

这些示例应该可以让您更全面地了解正则表达式在 python 中的工作原理!您想进一步探索任何特定模式或问题吗?

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

531

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

766

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

219

2023.08.11

正则表达式空格
正则表达式空格

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容,供大家免费下载体验。

357

2023.08.31

Python爬虫获取数据的方法
Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据,或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示
正则表达式空格如何表示

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容,可以访问下面的文章。

245

2023.11.17

正则表达式中如何匹配数字
正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

547

2023.12.06

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.9万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号