正则表达式是JavaScript处理字符串的基础设施,本质是描述文本模式的字符序列,支持字面量和构造函数两种创建方式,常用于搜索、替换、提取和校验。

正则表达式不是“高级技巧”,而是 JavaScript 中处理字符串的基础设施——只要你要做搜索、替换、提取或校验(比如邮箱、手机号、URL),绕不开它。
正则表达式是什么:别被术语吓住,它就是“带通配符的字符串模板”
它本质是一串描述文本模式的字符,比如 /\d{3}-\d{4}/ 就表示“三位数字 + 一个短横线 + 四位数字”。JavaScript 把它当作一种独立的数据类型(RegExp 对象),既可字面量写法(/pattern/flags),也可构造函数(new RegExp('pattern', 'flags'))。
常见误区是以为正则必须复杂才有用。其实最常用的是:/\s+/(匹配多个空白)、/^\w+@\w+\.\w+$/(简单邮箱校验)、/[aeiou]/gi(找所有元音字母)。
- 字面量写法里,斜杠
/是定界符,不能省;反斜杠要双写(如\\d在字符串中才是\d) - 用
new RegExp()时,模式是字符串,所以反斜杠得写成'\\d'—— 这是新手最容易漏掉的转义层级 - 标志(flags)如
g(全局)、i(忽略大小写)、m(多行)必须写在末尾,且不能重复
test() 和 exec():判断是否存在 vs 拿出匹配结果
test() 最轻量,只返回 true 或 false,适合表单校验等布尔判断场景;exec() 返回匹配详情(包括 index、input、捕获组),但要注意:带 g 标志时,它会“记住”上次位置,连续调用可能返回不同结果。
立即学习“Java免费学习笔记(深入)”;
Unix in a Nutshell同时涵盖了许多重要的、业界标准的开放源码工具 本书还完整地讨论了常用的shell(bash、ksh及tcsh)和重要元素如正则表达式,乃至旧式工具如sed、awk与vi。 Unix不是一个庞大的物体:它是一个综合体,而《Unix技术手册》则是将这一切合并在一起的一本书。 到底unix是什么?原始的unix源码是由sco拥有,unix注册商标是由open group拥有,而领先的仿unix系统则是gnu/linux、mac os x及solaris。这些版本所附的命令与选
-
/cat/.test('concatenate')→true -
/a(b)c/.exec('abc')→['abc', 'b'](第二个元素是第一个捕获组) -
const r = /a/g; r.exec('aa'); r.exec('aa')第二次返回null,因为 lastIndex 已移到末尾
String.prototype.replace() 里怎么用正则:别只传字符串
直接传字符串替换,只能换第一次;传正则才能真正控制范围和逻辑。关键是第二个参数:可以是字符串(支持 $1 引用捕获组),也可以是函数(接收匹配项、分组、索引、原字符串)。
-
'2023-04-05'.replace(/(\d{4})-(\d{2})-(\d{2})/, '$2/$3/$1')→'04/05/2023' 'price: $19.99'.replace(/\$(\d+\.\d+)/, (_, num) => `¥${(num * 7.2).toFixed(2)}`)- 忘记加
g标志?'aaa'.replace(/a/, 'b')只变第一个,而/a/g才全变
容易被忽略的坑:Unicode、先行断言、还有那个 lastIndex
中文、emoji 等 Unicode 字符在正则里默认按码点处理,/./u 加 u 标志才能正确匹配一个 emoji;(?=...) 这类先行断言不消耗字符,但浏览器兼容性要注意(IE 完全不支持);而 lastIndex 这个属性,只对带 g 或 y 的正则生效,且手动改它极易引发隐性 bug。
-
/??/.test('??')→false,必须写成/??/u /(?(后行断言)在 Safari 16.4 之前不支持-
const r = /a/g; r.lastIndex = 5; 'xxxaaa'.replace(r, 'b')会从第 5 位开始找,跳过前面的a
正则真正的难点不在语法本身,而在“你是否意识到当前问题需要用它解”以及“是否记得那些影响行为的标志和状态”。写完一个正则,先用 .test() 验证边界 case,再看 .exec() 返回结构,比直接塞进 replace() 更稳妥。










