正则表达式是JavaScript中用于匹配、查找、替换字符串模式的工具,通过RegExp构造函数或字面量(如/abc/)配合test()、match()、replace()等方法实现文本处理;基础包括字符类(如\d、\w)、量词(*、+、?等,默认贪婪)、分组与捕获(()、(?:…)、\1);实用技巧有修饰符(i/g/m)、锚点(^/$/\b)、优先用字符类替代.;示例含手机号/^1[3-9]\d{9}$/和简单HTML标签提取。

正则表达式(Regular Expression,简称 regex 或 regexp)是 JavaScript 中用于匹配、查找、替换字符串中特定模式的工具。它不是 JavaScript 独有,但 JS 提供了 RegExp 构造函数和字面量语法(如 /abc/),配合字符串方法(test()、match()、replace()、split() 等)实现强大文本处理能力。
正则基础:字符、量词与分组
复杂匹配建立在基础语法之上。掌握以下三类元素是关键:
-
字符类:如
[a-z]匹配任意小写字母,\d等价于[0-9],\w匹配字母、数字或下划线;.匹配除换行符外的任意字符(需注意点号的“贪婪”特性)。 -
量词:控制重复次数。
*(0 次或多次)、+(1 次或多次)、?(0 或 1 次)、{n}(恰好 n 次)、{n,}(至少 n 次)、{n,m}(n 到 m 次)。默认为“贪婪匹配”,加?可转为“惰性匹配”,例如.*?。 -
分组与捕获:
(...)创建捕获组,可用于提取子串或复用模式;(?:...)是非捕获组,仅用于逻辑分组不保存匹配结果;\1、\2引用前面捕获组的内容(反向引用),适合匹配重复结构,比如/(\w+)\s+\1/可匹配连续两个相同单词。
处理复杂模式的实用技巧
真实场景中的模式往往嵌套、可选、边界敏感。避免“写完就跑”,建议分步构建并验证:
-
使用修饰符控制匹配行为:常用
i(忽略大小写)、g(全局匹配,不止第一个)、m(多行模式,使^和$匹配每行起止);例如/hello/gi能找到所有不区分大小写的 "hello"。 -
锚点与边界确保精准定位:
^和$锁定行首行尾,\b匹配单词边界(如/\bcat\b/不会误中 "category");\B则匹配非单词边界。 -
优先使用字符类而非点号:比如邮箱本地部分允许字母、数字、点、下划线、短横线,但不能以点开头或结尾,也不能连续出现点——这时写
[a-zA-Z0-9._-]+比.+更安全、更可控。
常见复杂场景示例
几个典型例子说明如何组合上述要素:
立即学习“Java免费学习笔记(深入)”;
-
匹配中文手机号(大陆):
/^1[3-9]\d{9}$/—— 以 1 开头,第二位是 3–9,后接 9 位数字;加上^和$防止中间混入其他字符。 -
提取 HTML 标签内容(简单情况):
/]+)>([^/—— 使用反向引用\1确保开闭标签一致(注意:生产环境推荐用 DOM 解析器,正则解析 HTML 易出错)。 -
匹配带单位的数字(如 "12.5px"、"-3em"):
/^-?\d+(?:\.\d+)?(px|em|rem|%)/—— 支持可选负号、整数或小数、固定单位列表;非捕获组(?:\.\d+)?避免多余捕获。
调试与工具建议
正则难在“看不见执行过程”。推荐这些习惯:
- 在浏览器控制台或 regex101.com(选 JavaScript 引擎)中实时测试,查看分组、匹配步骤和解释。
- 对长正则启用
x修饰符(ES2024 起支持,部分环境需转义或暂不支持),允许加空格和注释(需用/.../x语法),提升可读性。 - 避免过度复杂:如果一个正则超过 50 字符且含三层以上嵌套,考虑拆成多个简单正则,或改用字符串方法 + 逻辑判断,更易维护。











