javascript中正则表达式是什么_如何匹配复杂模式？

夜晨

发布时间：2025-12-20 17:35:47

393人浏览过

来源于php中文网

原创

正则表达式是javascript中用于匹配、查找、替换字符串模式的工具，通过regexp构造函数或字面量（如/abc/）配合test()、match()、replace()等方法实现文本处理；基础包括字符类（如\d、\w）、量词（*、+、?等，默认贪婪）、分组与捕获（()、(?:…)、\1）；实用技巧有修饰符（i/g/m）、锚点（^/$/\b）、优先用字符类替代.；示例含手机号/^1[3-9]\d{9}$/和简单html标签提取。

javascript中正则表达式是什么_如何匹配复杂模式？

正则表达式（Regular Expression，简称 regex 或 regexp）是 JavaScript 中用于匹配、查找、替换字符串中特定模式的工具。它不是 JavaScript 独有，但 JS 提供了 RegExp 构造函数和字面量语法（如 /abc/），配合字符串方法（test()、match()、replace()、split() 等）实现强大文本处理能力。

正则基础：字符、量词与分组

复杂匹配建立在基础语法之上。掌握以下三类元素是关键：

字符类：如 [a-z] 匹配任意小写字母，\d 等价于 [0-9]，\w 匹配字母、数字或下划线；. 匹配除换行符外的任意字符（需注意点号的“贪婪”特性）。
量词：控制重复次数。*（0 次或多次）、+（1 次或多次）、?（0 或 1 次）、{n}（恰好 n 次）、{n,}（至少 n 次）、{n,m}（n 到 m 次）。默认为“贪婪匹配”，加 ? 可转为“惰性匹配”，例如 .*?。
分组与捕获：(...) 创建捕获组，可用于提取子串或复用模式；(?:...) 是非捕获组，仅用于逻辑分组不保存匹配结果；\1、\2 引用前面捕获组的内容（反向引用），适合匹配重复结构，比如 /(\w+)\s+\1/ 可匹配连续两个相同单词。

处理复杂模式的实用技巧

真实场景中的模式往往嵌套、可选、边界敏感。避免“写完就跑”，建议分步构建并验证：

Qwen

阿里巴巴推出的一系列AI大语言模型和多模态模型

下载

使用修饰符控制匹配行为：常用 i（忽略大小写）、g（全局匹配，不止第一个）、m（多行模式，使 ^ 和 $ 匹配每行起止）；例如 /hello/gi 能找到所有不区分大小写的 "hello"。
锚点与边界确保精准定位：^ 和 $ 锁定行首行尾，\b 匹配单词边界（如 /\bcat\b/ 不会误中 "category"）；\B 则匹配非单词边界。
优先使用字符类而非点号：比如邮箱本地部分允许字母、数字、点、下划线、短横线，但不能以点开头或结尾，也不能连续出现点——这时写 [a-zA-Z0-9._-]+ 比 .+ 更安全、更可控。

常见复杂场景示例

几个典型例子说明如何组合上述要素：

立即学习“Java免费学习笔记（深入）”；

匹配中文手机号（大陆）：/^1[3-9]\d{9}$/ —— 以 1 开头，第二位是 3–9，后接 9 位数字；加上 ^ 和 $ 防止中间混入其他字符。
提取 HTML 标签内容（简单情况）：/]+)>([^/ —— 使用反向引用 \1 确保开闭标签一致（注意：生产环境推荐用 DOM 解析器，正则解析 HTML 易出错）。
匹配带单位的数字（如 "12.5px"、"-3em"）：/^-?\d+(?:\.\d+)?(px|em|rem|%)/ —— 支持可选负号、整数或小数、固定单位列表；非捕获组 (?:\.\d+)? 避免多余捕获。