如何用正则表达式匹配包含“olo”但不以或不以“olo”开头/结尾的单词

碧海醫心

发布时间：2026-01-29 18:11:17

989人浏览过

来源于php中文网

原创

如何用正则表达式匹配包含“olo”但不以或不以“olo”开头/结尾的单词

本文详解如何在 python 中使用正则表达式精准匹配包含子串 "olo" 的完整单词，同时排除以 "olo" 开头或结尾的单词，并提供可直接运行的修复方案与原理说明。

要实现「匹配包含 'olo' 的单词，但该单词既不能以 'olo' 开头，也不能以 'olo' 结尾」，关键在于正确组合单词边界（\b）、负向先行断言（(?!...)）和负向后行断言（(?，并确保整个匹配逻辑覆盖完整的单词结构。

原始代码的问题在于：

(?!\w*olo\b) 放在匹配之后，无法阻止已匹配部分“以 olo 结尾”；
(\wolo\w) 强制只匹配恰好一个字符在 "olo" 前后，导致 "dolore" 被截成 "dolor"（漏掉末尾 e），因为 \w 只匹配单个字符；
缺少起始单词边界 \b，易发生子串误匹配（如 "vololo" 中的 "olo" 被单独捕获）。

✅ 正确且推荐的正则模式为：

import re

example_text = "Lorem ipsum dolorolo at sit amet, dolore dolor dolore"

# ✅ 推荐方案：使用单词边界 + 负向先行断言（清晰、高效、兼容性好）
pattern = r'\b(?!olo|\w*olo\b)\w*olo\w*\b'
matches = re.findall(pattern, example_text)
print(matches)  # ['dolore', 'dolor', 'dolore']

? 模式解析：

Magician

Figma插件，AI生成图标、图片和UX文案

下载

\b：确保匹配从单词边界开始；
(?!olo|\w*olo\b)：负向先行断言，拒绝两种情况：
- 整个单词就是 "olo"（olo）；
- 单词以 "olo" 结尾（\w*olo\b，如 "hello" → ❌ 不匹配，因以 "lo" 结尾而非 "olo"；但 "vololo" → ✅ 匹配 "vololo"，因结尾是 "olo" → 被排除）；
\w*olo\w*：匹配任意数量字母/数字/下划线（即单词字符）包围的 "olo"；
\b：确保匹配到单词边界结束，避免跨词匹配。

⚠️ 注意事项：

\w 默认不匹配 Unicode 字母（如中文、带重音符号的字符）。若需国际化支持，添加 re.UNICODE 标志，或改用 [^\W\d_] 替代 \w；
若文本含标点紧邻单词（如 "dolore,"），\b 仍能正确识别（逗号非单词字符，, 与 e 之间存在 \b）；
不建议使用 (?恰好是 "olo"，而 \w*\b 结束位置未必紧邻 "olo" —— 实际上该写法在多数情况下不可靠，且可读性差；官方文档明确指出 (?固定宽度模式，\w* 是变长的，因此该方案在严格语义下不合法（尽管某些引擎可能容忍，但属未定义行为）。

✅ 最终稳健写法（含注释与测试）：

import re

def find_words_with_olo_mid(text):
    """
    匹配包含 'olo' 的完整单词，且 'olo' 不能位于单词开头或结尾。
    示例：'dolore' ✅（olo 在中间），'olo' ❌，'vololo' ❌（以 olo 结尾），'olodora' ✅
    """
    pattern = r'\b(?!olo|\w*olo\b)\w*olo\w*\b'
    return re.findall(pattern, text)

# 测试用例
test_cases = [
    "Lorem ipsum dolorolo at sit amet, dolore dolor dolore",
    "olo hello vololo olodora olorem olo",  # 应只匹配: ['olodora']
    "dolorolo dolore dolor"  # → ['dolorolo', 'dolore', 'dolor']（注意：'dolorolo' 以 'olo' 结尾 → ❌，实际不匹配！）
]
for t in test_cases:
    print(f"Text: {t!r}")
    print("Matches:", find_words_with_olo_mid(t))

? 总结：
核心原则是「先断言，再匹配」——用 \b 锚定单词范围，用 (?!...) 在匹配前排除非法模式，最后用 \w*olo\w*\b 安全捕获目标词。避免在匹配过程中动态截断（如 \wolo\w），始终让量词 \w* 控制字符数量，才能准确覆盖 "dolore" 这类多字符延伸词。

如何用Python高效提取CSV数据并自动导入Word表格

如何高效地从CSV提取数据并自动导入Word生成表格

如何在Python中高效提取CSV数据并自动导入Word文档生成表格

如何用Python自动化将CSV数据导入并嵌入Word文档表格

如何高效将CSV数据导入Word并生成表格

相关标签:

word python 正则表达式 lol 正则表达式

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 多线程中的共享数据问题下一篇：tcp_tw_recycle 环境下的 NAT 兼容性与 tcp_timestamps 关闭风险

作者最新文章

如何在函数中创建并管理多个类实例以进行跨调用比较

2026-01-29 16:41

内存价格暴涨！iPhone 18系列起售价竟没变

2026-01-29 16:42

promovie如何拍照片

2026-01-29 16:51

黄仁勋访华取得成果数十万颗英伟达H200芯片订单获批：我国回应

2026-01-29 16:59

Go 中接口实现与方法接收者类型匹配的原理详解

2026-01-29 17:02

动态生成多页面并实现 URL 路由跳转的 JavaScript 教程

2026-01-29 17:21

如何重置或继承 HTML 元素的 CSS 属性值（而非使用 initial）

2026-01-29 17:26

CDPR创意总监发布《往日之影》截图暗示续作过场仍为第一人称

2026-01-29 17:33

《GTA6》狂热粉为窥探新作用无人机偷拍R星办公室

2026-01-29 17:34

微信callkit怎么设置

2026-01-29 17:44

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法，还有更多js正则表达式的相关文章、相关下载、相关课程，供大家免费下载体验。

514

2023.06.20

正则表达式不包含

正则表达式，又称规则表达式,，是一种文本模式，包括普通字符和特殊字符，是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串，通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章，希望对大家能有所帮助。

251

2023.07.05

java正则表达式语法

java正则表达式语法是一种模式匹配工具，它非常有用，可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题，供大家免费下载体验。

746

2023.07.05

java正则表达式匹配字符串

在Java中，我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容，帮助大家解决问题。

215

2023.08.11

正则表达式空格

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容，供大家免费下载体验。

351

2023.08.31

Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据，或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容，可以访问下面的文章。

236

2023.11.17

正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

532

2023.12.06

clawdbot ai使用教程保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手，可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等，并且可以接入用户常用的任何聊天APP，所有的操作均可通过WhatsApp、Telegram等平台完成，用户只需通过对话，就能操控设备自动执行各类任务。

2026.01.29

热门下载

网站特效

网站源码

网站素材

前端模板