JavaScript正则表达式真正难点在于跨行匹配、动态构造、多行模式、捕获组替换及兼容性处理:. *默认不匹配换行,需s标志或[\s\S]*;动态正则须用new RegExp(escapeRegex(str), 'g');m标志改变^/$为行首/行尾;$1在字符串替换中是占位符,在函数中需显式返回。

JavaScript 正则表达式不是“学完语法就能用好”的工具,真正卡住人的从来不是 /abc/ 这种基础写法,而是:为什么 .* 没匹配到换行?为什么 ^ 和 $ 在多行字符串里失效?为什么替换时 $1 变成了字面量?
正则字面量 vs new RegExp():什么时候必须用构造函数?
字面量 /pattern/flags 写起来快,但无法动态拼接;new RegExp(patternString, flags) 支持变量注入,但反斜杠要双写 —— 这是 90% 动态正则出错的根源。
- 想匹配用户输入的关键词?必须用
new RegExp(escapeRegex(userInput), 'g'),否则.、*、(等会被当作元字符解析 -
userInput = 'a.b'→ 直接new RegExp(userInput)会匹配aXb(.通配),得先转义:userInput.replace(/[.*+?^${}()|[\]\\]/g, '\\$&') - flag 是字符串,
'i'、'g'、'm'可拼接,但'u'(Unicode)和's'(dotAll)在旧环境不支持,需检查运行时
dotAll 模式(s flag):为什么 .* 总是停在第一行末?
默认情况下,. 不匹配换行符(\n、\r、\u2028、\u2029)。想跨行匹配任意字符,必须加 s 标志 —— 但注意兼容性。
- ES2018 才正式支持
sflag,Node.js >= 10.0、Chrome >= 64 可用;Safari 15.4+ 才支持 - 替代方案(兼容老环境):
[\s\S]*或[\d\D]*,它们明确表示“所有空白 + 所有非空白”,覆盖全部 Unicode 字符 - 错误写法:
/.*/s在不支持s的环境里会被忽略,.依然不跨行,且无报错
^ 和 $ 在多行模式(m flag)下的真实行为
m flag 不是让正则“支持多行”,而是改变 ^ 和 $ 的锚定位置:它们不仅匹配字符串开头/结尾,还匹配每行的开头/结尾(即换行符后、前的位置)。
立即学习“Java免费学习笔记(深入)”;
-
/^start/m.test('line1\nstart\nend')→true,因为start前有换行符,满足“行首” -
/end$/m.test('line1\nstart\nend')→true,同理,“行尾”包含换行符之前 - 没加
m时,^只匹配整个字符串最开头,$只匹配整个字符串最末尾(不含换行符) - 常见误用:
/^.*$/m想匹配整行内容?它其实会每行都匹配一次,exec()多次调用才拿到所有行 —— 不如直接用split('\n')
捕获组与替换:为什么 $1 有时变成字面字符串?
String.prototype.replace() 的第二个参数如果是字符串,$1、$&、$` 等是特殊占位符;但若传入函数,则由函数返回值决定替换内容 —— 混用会导致静默失败。
- 错误:
str.replace(/(\d+)/, '$1 is number')→ 正常,$1被替换成捕获内容 - 错误:
str.replace(/(\d+)/, '$1 is $2')→ 若没第二个捕获组,$2就是字面量$2,不会报错 - 安全做法:用函数回调,显式控制逻辑:
str.replace(/(\w+):(\d+)/, (match, key, value) => `${key.toUpperCase()}: ${value}`) - 注意:函数第一个参数是完整匹配,后续才是各捕获组,最后两个是匹配索引和原字符串
复杂正则最难的不是写出来,而是验证它在边界情况(空字符串、嵌套括号、Unicode emoji、超长文本)下是否依然可靠。别依赖肉眼判断,用 RegExp.prototype.test() 和 .exec() 分步调试,把 lastIndex 和全局 g 标志的副作用看清楚。










