
正则表达式断言的困惑:前向和反向放置差异
在正则表达式中,环视和断言可以用来指定一个匹配条件,而不会将其纳入匹配结果中。其中,前向断言和反向断言的放置位置似乎存在一些疑惑。
正向断言
正向断言使用(?=),表示匹配字符串的后面必须满足某个条件。上述博客中判断不以baidu开头的字符串的表达式^(?!baidu).*$中,(?!)表示匹配字符串的后面不能是baidu,而.*$表示匹配后面任意字符串。
反向断言
反向断言使用(?<=),表示匹配字符串的前面必须满足某个条件。而在判断不已com结尾的字符串的表达式^.*?(?<!com)$中,(?<!)表示匹配字符串的前面不能是com。
疑惑和解答
疑惑在于,既然正向断言也可以放在匹配字符串的前面,那么反向断言的存在似乎就没有意义了。
然而,这种理解是错误的。^(?!baidu).*$和^(?<!baidu).*$的含义并不相同:
- ^(?!baidu).*$: 匹配一个后面不跟着baidu的开头(更准确地说是空字符串) 一个任意字符串(不包含换行符) 一个结尾。
- ^(?<!baidu).*$: 匹配一个开头 一个不在baidu后面的任意字符串 一个结尾。
后者的表达式毫无意义,因为字符串只要存在开头,其之前就一定不是baidu。
部分匹配函数
为了判断不以baidu开头,可以去掉.*$,然后使用部分匹配函数来判断。例如,在 JavaScript 中可以使用/^(?!baidu)/.test(),它仅检查字符串是否以baidu开头。
例子
下面是一些例子,有助于理解前向预查和反向预查的含义:
- /^www.(?=baidu).com$/.test('www.baidu.com'): false(因为不存在后面跟着baidu的www)
- /^www.(?<=baidu).com$/.test('www.baidu.com'): false(因为不存在前面有baidu的www)
- /^www.(?=baidu)baidu.com$/.test('www.baidu.com'): true(因为存在后面跟着baidu的www.baidu)
- /^www.(?<=baidu)baidu.com$/.test('www.baidu.com'): false(因为不存在前面有baidu的baidu.com)










