re.sub()中引用捕获组最常用、等数字形式,命名组用g<name>更清晰,函数替换通过Match对象的group()方法获取匹配内容。

re.sub() 中用 、 引用分组最直接
匹配后想在替换字符串里复用捕获内容,最常用方式就是用反斜杠加数字: 表示第一个括号内的匹配, 是第二个,以此类推。这是正则引擎原生支持的语法,无需额外函数。
注意:数字只认 () 捕获组,不认 (?:...) 非捕获组;且编号从左到右按开括号顺序算,嵌套也一样。
-
re.sub(r"(w+)@(w+.w+)", r"[] at []", "user@example.com")→"[user] at [example.com]" - 如果写成
r"