JavaScript正则表达式通过元字符、量词、分组和修饰符实现高效字符串处理。1. 元字符如^、$、.、*、+、?和{n,m}用于定义匹配规则,可验证密码格式等;2. 字符类[abc]、1、\d、\w与捕获分组()、非捕获(?:)提升表达式结构化能力,适用于日期提取等场景;3. 贪婪匹配默认尽可能多匹配,加?变为非贪婪,利于HTML标签内容提取;4. i、g、m标志支持忽略大小写、全局和多行匹配,new RegExp实现动态构建,预查(?=)可在不包含条件下匹配数字单位并进行替换操作。熟练掌握这些技巧可显著提升文本处理效率。abc ↩

JavaScript正则表达式是处理字符串匹配和替换的强大工具。掌握一些关键的模式匹配技巧,能显著提升你在文本处理、表单验证和数据提取中的效率。
1. 常用元字符与量词
元字符是正则表达式的核心,它们代表特定含义而不是字面值。
- ^ 匹配输入的开始位置,例如 /^Hello/ 能匹配以 "Hello" 开头的字符串
- $ 匹配输入的结束位置,/world$/ 只匹配以 "world" 结尾的内容
- . 匹配任意单个字符(换行符除外)
- * 匹配前面的子表达式零次或多次
- + 匹配前面的子表达式一次或多次
- ? 匹配前面的子表达式零次或一次,也用于非贪婪匹配
- {n,m} 精确控制匹配次数,如 /\d{3,5}/ 匹配3到5位数字
例如,验证6-12位密码可以使用:/^[a-zA-Z0-9]{6,12}$/
2. 字符类与分组
合理使用字符类和分组能让表达式更清晰且功能更强。
立即学习“Java免费学习笔记(深入)”;
- [abc] 匹配方括号内的任意一个字符
- [^abc] 匹配不在方括号中的任意字符
- \d 数字,等价于 [0-9];\w 单词字符,包括字母、数字和下划线
- () 用于捕获分组,可以在 replace 中通过 $1、$2 引用
- (?:) 非捕获分组,只分组不记录,提升性能
比如提取日期中的年月日:
const dateStr = "2024-04-05";
const match = dateStr.match(/(\d{4})-(\d{2})-(\d{2})/);
// match[1] 是年,match[2] 是月,match[3] 是日
3. 贪婪与非贪婪匹配
默认情况下,量词是“贪婪”的,会尽可能多地匹配内容。
- 例如 /a.*b/ 在字符串 "aabab" 中会匹配整个字符串
- 加上 ? 变为非贪婪模式:/a.*?b/ 会匹配第一个 "aab"
这在提取HTML标签内容时特别有用: 第一段 第二段 .*?/g); // 得到两个独立的段落标签
const html = "
html.match(/
4. 常见实用技巧
结合实际场景,以下技巧非常实用。
- 忽略大小写:使用 i 标志,如 /hello/i
- 全局匹配:使用 g 标志,如 /img/g 找出所有 "img"
- 多行匹配:使用 m 标志,让 ^ 和 $ 支持每行的起始和结尾
- 动态构建正则:使用 new RegExp(str) 将变量转为正则表达式
- 预查( lookahead ):/\d+(?=px)/ 匹配后面跟着 "px" 的数字,但不包含 "px"
例如,替换所有带单位的数字:
cssStr.replace(/\d+(?=px)/g, n => n * 2); 可将像素值翻倍
基本上就这些核心技巧。熟练运用元字符、分组、修饰符和匹配模式,就能应对大多数字符串处理需求。关键是多练习,在真实项目中不断优化表达式的准确性和性能。










