什么是JVM的字符串去重特性(String Deduplication)_G1收集器的内存节约方案

P粉602998670

发布时间：2026-03-15 09:09:12

151人浏览过

来源于php中文网

原创

String Deduplication 是 G1 垃圾收集器专属的运行时字符串去重机制，通过在 GC 中合并重复的 String 底层数组来节省内存，但仅对老年代中内容完全相同的 char[]/byte[] 生效，需满足 G1、显式启用及 JDK≥8u20 三条件，且效果依赖字符串重复率与生命周期。

什么是jvm的字符串去重特性(string deduplication)_g1收集器的内存节约方案

String Deduplication 是什么，它真能省内存？

它不是 JVM 的通用字符串池优化，而是 G1 垃圾收集器专属的运行时去重机制：在 GC 过程中扫描堆上重复的 String 对象（仅限底层 char[] 或 byte[] 内容完全相同），保留一个实例，让其余对象指向它。效果取决于字符串重复率和生命周期——堆里有大量长生命周期、内容雷同的字符串（比如日志 ID、JSON 字段名、HTTP Header 值）时，内存节省才明显；如果字符串大多短命或唯一，开销反超收益。

怎么开启并确认 String Deduplication 生效？

必须同时满足三个条件才能启用：

使用 G1 收集器：-XX:+UseG1GC
显式启用去重：-XX:+UseStringDeduplication（默认关闭）
JDK 版本 ≥ 8u20（JDK 9+ 默认仍关闭，需手动加参数）

验证是否生效，看 GC 日志里的 StringDeduplication 行：

[GC pause (G1 Evacuation Pause) (young), 0.023 ms]
   [String Deduplication: 0.000 ms, 0 processed, 0 deduplicated, 0 attempted]

注意：processed 不为 0 才说明扫描已启动；deduplicated 是真正合并的数量。如果长期为 0，大概率是字符串还没活过第一个 GC 周期（去重只作用于老年代对象），或内容实际不重复。

Giiso写作机器人

Giiso写作机器人，让写作更简单

下载

为什么开了却没看到内存下降？常见踩坑点

去重本身不立即释放内存，它只是把多个 String 的底层数组引用指向同一份数据，原数组变成垃圾等下次 GC 回收。所以观察窗口要拉长，且得看老年代占用趋势（用 jstat -gc 看 OU 列）。

字符串太“新”：G1 只对晋升到老年代的 String 做去重，年轻代对象直接忽略
用了 String.intern()：它走的是 JVM 字符串常量池（PermGen / Metaspace），和 String Deduplication 完全无关，二者不协同也不冲突
字符串底层是 byte[] 但编码不同：JDK 9+ 的紧凑字符串（coder 字段）要求 coder 和内容都一致才去重；Latin-1 和 UTF-16 编码的相同文本不会被识别为重复
启用了 -XX:+UseCompressedOops（默认开启）但堆 > 32GB：可能导致对象头布局变化，间接影响去重扫描效率（罕见，但高内存场景可排查）

性能代价和调优参数有哪些？

去重在 GC 暂停期间执行，会略微延长 young GC 时间（尤其老年代大、重复字符串多时）。它用哈希表维护已见数组指纹，默认最大 1M 条目，满后开始驱逐旧条目。

控制哈希表大小：-XX:StringDeduplicationTableSize=1048576（默认值，不建议乱调）
调整扫描频率（高级）：-XX:StringDeduplicationAgeThreshold=3 表示对象至少经历 3 次 GC 后才参与去重（默认为 3，提高阈值可减少 young 区误扫）
监控开销：-XX:+PrintStringDeduplicationStatistics 输出详细统计，但别在生产长期开着——日志量不小

真正关键的取舍在于：你愿不愿意为可能的内存节约，承担一点点 GC 时间波动。没有银弹，只有权衡。

相关标签:

json jvm String 常量字符串常量字符串 char 堆对象 http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何搭建Java的异步编程环境_Vert.x响应式微服务开发配置下一篇：Spring Boot 中正确使用 Optional 避免空值校验警告

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23