G1通过将堆划分为2048个可动态角色的Region实现精细化回收,停顿时间目标为软约束并依赖历史数据预测,Mixed GC基于各Region存活率而非老年代整体使用率触发,配置不当易引发Full GC或性能下降。

Region划分让堆内存不再“一刀切”
G1把整个堆切成2048个大小相等的Region(默认1~32MB,由JVM自动决定),不再是传统分代里固定比例的Eden/Survivor/Old。每个Region可以动态扮演Eden、Survivor或Old角色,甚至能成为Humongous Region存超大对象(≥½ Region大小)。
这样做的好处是回收时能按优先级挑“垃圾最多、复制成本最低”的一批Region来处理,而不是扫完整个Old区。但要注意:Humongous Region不参与年轻代回收,且如果对象跨多个Region,G1会直接拒绝分配并触发Full GC——这是很多OOMjava.lang.OutOfMemoryError: GC overhead limit exceeded的隐藏源头。
- 用
-XX:G1HeapRegionSize=2M手动设Region大小时,必须是2的幂(1M/2M/4M…),否则JVM启动失败 - 小Region(如1M)提升回收精度,但增加元数据开销;大Region(如4M)减少管理负担,但容易造成空间浪费和Humongous误判
- 对象在分配时若超过Region一半,就走Humongous路径——不是看绝对大小,而是和当前
Region尺寸比
停顿时间目标靠预测模型而非硬限制
G1的-XX:MaxGCPauseMillis=200不是保证值,而是一个软目标。JVM内部用历史GC数据训练一个朴素预测模型:根据已回收的Region数量、扫描耗时、复制对象量,预估下一轮选N个Region要花多久。它会动态调整本次选多少Region、要不要提前触发Mixed GC。
所以常见现象是:明明设了200ms,实际停顿有时150ms,有时280ms。这不是bug,是模型在权衡吞吐和响应——尤其当老年代碎片多、可回收Region少时,它宁可多停一会也要避免退化成Full GC。
立即学习“Java免费学习笔记(深入)”;
- 预测依赖足够多的历史样本,刚启动时前几次GC的停顿往往不准,别急着调参
- 如果实际停顿持续超标,优先检查是否
Humongous Allocation频繁,或ConcGCThreads太少导致并发标记拖慢整体节奏 -
-XX:G1NewSizePercent和-XX:G1MaxNewSizePercent影响年轻代弹性,但G1更倾向用停顿目标反推年轻代大小,手动锁死反而干扰预测
Mixed GC触发逻辑容易被误解
Mixed GC不是等老年代满了才启动,而是在并发标记周期结束后,根据G1MixedGCLiveThresholdPercent(默认85%)和G1MixedGCCountTarget(默认8)两个参数决定回收哪些Old Region。它只回收那些存活对象比例低于阈值的Region,跳过“太脏”的块。
典型误操作是以为“老年代用了60%就该混合回收”,其实G1根本不管老年代整体使用率,只盯每个Region自己的存活率。这也是为什么有时候老年代用了90%却没Mixed GC——因为所有Old Region存活率都高于85%,G1宁愿等下次并发标记,也不愿做低效回收。
- 调低
G1MixedGCLiveThresholdPercent(比如70)能让更多Region进入Mixed GC,但可能增加复制开销和停顿 -
G1OldCSetRegionThresholdPercent限制单次Mixed GC最多选多少Old Region,默认10%,太小会导致回收不彻底,需配合日志-Xlog:gc+ergo+cset=debug观察CSet构成 - 如果Mixed GC频率异常高,大概率是年轻代太小导致对象过早晋升,或有隐式内存泄漏撑大老年代
开启G1后最常踩的三个配置坑
很多人开了-XX:+UseG1GC就以为万事大吉,但G1对参数更敏感。尤其在容器环境或小堆场景下,几个默认值会直接拖垮表现。
-
-XX:MaxGCPauseMillis设太高(如500ms)会让G1“懒惰”,延迟Mixed GC触发,最终引发Full GC;设太低(如50ms)又导致频繁Young GC,吞吐暴跌 - 容器中未配
-XX:+UseContainerSupport时,G1仍按宿主机内存算堆上限和线程数,可能因ConcGCThreads过多抢走应用线程CPU - 没加
-Xlog:gc*:file=gc.log:time,tags,level,就等于闭眼开车——G1的决策高度依赖运行时反馈,没日志根本没法判断是预测失准,还是应用行为突变
Region边界和停顿预测都是G1的底层机制,不是开关一开就自动最优。真正难的从来不是配参数,而是看懂gc.log里每行G1 Evacuation Pause背后,Region选择、存活率估算、并发线程调度之间怎么咬合的。










