Remembered Set(RSet)是G1垃圾收集器为解决跨代引用问题维护的“谁引用了我”反向索引表,由card table映射和per-region remembered sets组成,每个Region独立拥有、存于堆外内存,仅在写屏障触发时更新。

Remembered Set 是什么:跨代引用的“索引表”
RSet 不是某种数据结构的实现细节,而是 G1 垃圾收集器为解决跨代引用问题所维护的一组card table映射 + per-region remembered sets。它本质是一张“谁引用了我”的反向索引:当 Region A 中的对象被 Region B(比如老年代)中的对象引用时,Region A 的 RSet 就会记录下这个来自 B 的引用。
- 它不追踪所有引用,只记录“跨 Region 引用”,且只在写屏障触发时更新
- 每个 Region 都有自己独立的 RSet,大小随跨区引用数量动态增长
- RSet 本身存放在堆外内存(
HeapRegionRemSet),避免干扰 GC 扫描逻辑
为什么必须有 RSet:否则并发标记会漏对象
G1 是分区式 GC,回收时只处理部分 Region(如年轻代或混合收集),但老年代 Region 中的对象可能正引用着待回收 Region 中的对象。如果没有 RSet:
- 年轻代 GC 无法知道哪些老年代对象指向自己,只能保守地把整个老年代加入根集合(
GC root set) - 这会让停顿时间失控,失去 G1 的低延迟优势
所以 RSet 的存在,让 G1 能精准定位“可能指向本 Region 的外部引用来源”,只扫描那些真正相关的 Region,而不是全堆扫描。
RSet 更新由写屏障驱动:别指望它自动同步
RSet 不是实时镜像,它的更新完全依赖写屏障(G1PostBarrier)。每次对对象字段赋值(尤其是跨 Region 的引用写入),JVM 会在写操作后插入一段检查逻辑:
- 判断目标字段是否位于不同 Region
- 如果是,就把源 Region 的 card 标记为“dirty”,后续通过并发 Refine 线程批量更新对应 RSet
常见错误现象包括:
-
Concurrent mode failure频发 → 可能是 Refine 线程跟不上写屏障产生的 dirty card 速度 - RSet 占用内存突增 → 应用存在大量跨 Region 的长生命周期引用(如大缓存 map 持有年轻代对象)
-
G1EvacuationPause时间变长 → RSet 扫描开销增大,尤其在混合回收阶段
调整建议:
- 增加
-XX:G1ConcRefinementThreads提高 Refine 吞吐 - 控制跨代引用密度,避免老年代对象长期持有年轻代临时对象
- 用
jstat -gc观察CCSU(Concurrent RS Update)时间占比
RSet 内存开销不可忽视:它真会吃掉几 GB 堆外空间
RSet 存储在堆外(Native Memory),但受 JVM 参数约束。一个 Region 的 RSet 大小取决于它被多少其他 Region 引用;极端情况下(比如中心化缓存 Region),RSet 可达 MB 级。
- 默认每个 Region 的 RSet 初始容量很小,但会动态扩容,碎片化明显
-
-XX:G1RSetSparseRegionEntries和-XX:G1RSetRegionEntries控制稀疏/密集模式切换阈值,调错会导致 RSet 膨胀数倍 - 使用
jcmd <pid> VM.native_memory summary</pid>查看Internal区域增长,确认是否 RSet 主导
最容易被忽略的是:RSet 的清理不是即时的。即使引用被断开,对应条目仍可能滞留几个 GC 周期——这不是 bug,是设计取舍:避免并发清理引入额外同步开销。








