
深入理解正则表达式环视、断言和预查
本文旨在深入探讨正则表达式中环视(Lookaround)、断言和预查的应用技巧,并澄清一些常见的误解,尤其关注位置选择对匹配结果的影响。
某些文章中,使用 ^(?!baidu).\*$ 来判断非“baidu”开头的字符串,以及 ^.\*?(? 判断非“com”结尾的字符串。这些文章通常指出正向预查位于匹配字符串之后,反向预查位于匹配字符串之前,并对位置颠倒后的含义产生疑问。
实际上,^(?!baidu).\*$ 与 ^(? 的含义截然不同。前者匹配的是“开头之后不为'baidu'的任意字符串”,它检查的是开头之后的内容,而非开头本身,因此能有效判断字符串是否以“baidu”开头。
而后者 ^(? 匹配的是“开头,以及开头之后不在'baidu'之前的任意字符串”,由于字符串开头之前不可能存在“baidu”,该表达式始终成立,毫无实际意义。它并没有检查字符串是否以“baidu”开头。
因此,关键并非正向预查和反向预查的位置,而是对它们含义的准确理解。 要判断非“baidu”开头,.\*$ 部分是多余的,可以使用更简洁的表达式 ^(?!baidu),并结合部分匹配函数进行判断。例如,在JavaScript中,/^(?!baidu)/.test('baidu.com') 返回 false,/^(?!baidu)/.test('www.baidu.com') 返回 true。
接下来的示例将进一步阐述正向预查 (?=) 和反向预查 (? 的用法和区别。










