String.replace()按字面量替换,replaceAll()走正则引擎;前者安全简单,后者需转义且易误匹配;大量替换用StringBuilder,复杂规则复用Pattern;注意null判空、不可变性及Unicode代理对处理。

Java 里做文本替换,别急着写正则或遍历字符数组——String.replace() 和 String.replaceAll() 看似一样,但行为完全不同,用错一个就替错内容、漏掉转义、甚至死循环。
replace() vs replaceAll():最常踩的坑
前者按字面量替换,后者走正则引擎。比如想把字符串里的 "a.b" 全换成 "x":
-
"a.b".replace("a.b", "x")→ 正确得到"x" -
"a.b".replaceAll("a.b", "x")→ 实际匹配任意两个字符(因为.在正则里是通配符),结果可能意外替换掉很多东西 - 真要用
replaceAll()替换字面量点号?得写成"a\\.b"—— 两个反斜杠:一个给 Java 字符串转义,一个给正则引擎吃
处理大量文本时别用 String 拼接
频繁调用 replace() 会产生一堆中间 String 对象,GC 压力大。尤其在日志清洗、模板渲染等场景:
- 单次少量替换:直接用
String.replace()最简洁 - 多次连续替换(如把多个关键词统一替成空):
StringBuilder配合indexOf()+replace()更稳 - 复杂规则(比如“把所有数字后跟字母的组合加括号”):必须上
Pattern.compile().matcher().replaceAll(),且建议复用Pattern实例,避免重复编译
注意 null 和不可变性
String 是不可变的,所有替换方法都返回新对象,原字符串不变:
立即学习“Java免费学习笔记(深入)”;
String s = "hello";
s.replace("l", "x"); // 返回 "hexxo",但 s 还是 "hello"
s = s.replace("l", "x"); // 必须重新赋值
另外,null 输入会直接抛 NullPointerException,生产代码里务必先判空:
- 别写
text.replace(...),先写if (text == null) return text; - 或者用
Objects.toString(text, "")统一转为空字符串再处理
中文、emoji、代理对(surrogate pair)要小心
String.replace() 按 char 处理,而 emoji 或某些生僻汉字占两个 char(即一个 code point)。例如:
-
"??".length()返回 2(不是 1),直接用replace("??", "coder")可能失败 - 安全做法是用
String.replaceAll()配合 Unicode 表达式,比如"\\u{1F468}\\u{200D}\\u{1F4BB}"(需 Java 9+),或改用codePoints()流式处理 - 更简单务实的方案:统一用
Normalizer.normalize(text, Form.NFC)预处理,再替换
真正难的不是写替换逻辑,而是判断该不该用正则、要不要预归一化、以及谁来负责判空和边界。这些细节不写进单元测试,上线后第一份脏数据进来就暴露。










