什么是Java中的JVM停顿(STW)优化_减少GC安全点扫描时间的方案

P粉602998670

发布时间：2026-02-13 12:40:03

929人浏览过

来源于php中文网

原创

gc触发长时间stw主因是线程未能及时到达安全点，而非gc本身慢；线程可能阻塞在长循环、计数循环或native调用中，因无安全点轮询而延迟停顿。

什么是java中的jvm停顿(stw)优化_减少gc安全点扫描时间的方案

为什么 `GC` 会触发长时间 STW？安全点不是“瞬间”吗？

STW（Stop-The-World）不是因为 GC 本身慢，而是 JVM 必须等所有线程都到达「安全点」才能开始。而线程可能卡在 long-running loop、countedLoop、或 native 调用里，迟迟不检查安全点轮询（safepoint poll）。尤其当代码里有大循环且没方法调用时，JVM 无法插入轮询点，线程就一直跑，直到下一次方法入口/返回或特定字节码位置——这期间 GC 只能干等。

实操建议：

Memo AI

AI音视频转文字及字幕翻译工具

下载

用 jstat -gc -h10 <pid> 1000</pid> 观察 YGCT/FGCT 和 TTMP（总停顿时间），再配合 -XX:+PrintSafepointStatistics -XX:PrintSafepointStatisticsCount=1 看哪类操作拖慢了安全点进入
避免手写无方法调用的大循环：比如 for (int i = 0; i —— JIT 编译后很可能删掉 safepoint poll
强制插入轮询：在长循环体内加一句 Thread.onSpinWait()（Java 9+），或插入空的 Thread.yield() / 方法调用（如 Objects.hashCode(i)），让 JIT 保留 poll 指令

`UseCountedLoopSafepoints` 是什么？开了就一定更好？

这是 HotSpot 的一个优化开关，默认开启（Java 10+），它允许 JVM 在计数循环（counted loop）的每次迭代末尾插入 safepoint poll，而不是只在循环头/尾。但前提是：循环变量是整型、步进固定、上界可静态判定——否则 JIT 会退回到传统方式。

常见错误现象：PrintSafepointStatistics 显示 “no vm operation” 等待时间长，但循环明明很短——其实是 JIT 判定该循环「不可计数」，比如用了 long 索引、边界来自 field 或 array.length（未内联）、或循环体中有分支提前退出。

立即学习“Java免费学习笔记（深入）”；

实操建议：

确认是否生效：加 -XX:+UnlockDiagnosticVMOptions -XX:+PrintCompilation，看日志中循环是否被标记为 counted
若失效，把循环改写成明确的 int 计数形式，例如把 for (String s : list) 拆成 for (int i = 0; i ，并确保 <code>list.size() 被内联（避免抽象 List 实现）
禁用它（-XX:-UseCountedLoopSafepoints）只在极少数场景有用：比如你发现 JDK 17 上某段循环因该优化多插 poll 导致性能下降（罕见），且已用 JFR 确认 poll 开销占比显著

如何验证某个方法是否「阻塞安全点进入」？

不能只看代码有没有循环——关键看 JIT 是否为该方法生成了 safepoint poll 指令。最直接的方式是看汇编（需 -XX:+UnlockDiagnosticVMOptions -XX:+PrintAssembly），但更实用的是结合 JFR 和 hsdis 快速定位。

使用场景：线上偶发 STW 超 500ms，但 GC 日志显示 Young GC 本身只耗 20ms，说明问题出在「进入安全点」阶段。

实操建议：

启动时加 -XX:+UnlockDiagnosticVMOptions -XX:+LogVMOutput -XX:LogFile=jvm.log -XX:+PrintSafepointStatistics -XX:PrintSafepointStatisticsCount=5，复现后查日志中 vmop 为 No VM Operation 的条目，关注 spin 和 block 时间
用 jstack -l <pid></pid> 抓线程栈，重点找 RUNNABLE 状态但堆栈停在纯计算逻辑（如 Arrays.sort 内部、自定义 hash 计算、protobuf 序列化循环）的位置
对可疑方法加 @HotSpotIntrinsicCandidate 注解无效；真正有效的是让它「看起来像可中断」：在长计算中周期性调用 Thread.interrupted() 或 System.nanoTime()（后者能阻止 poll 被优化掉）

哪些 JVM 参数会影响安全点响应速度？别乱开 `AsyncGetCallTrace`

很多文章推荐 -XX:+AsyncGetCallTrace 来“加速”安全点，这是严重误解。这个参数仅用于 async-profiler 等工具做异步栈采集，**完全不参与 safepoint 机制**，开了反而增加信号处理开销，可能延长 STW。

真正影响安全点进入效率的参数极少，且多数是默认最优：

-XX:+UseRTMLocking：与安全点无关，只影响锁竞争，误开可能引发 CPU 占用飙升
-XX:GuaranteedSafepointInterval=1000：强制每秒至少一次安全点轮询（单位 ms），仅调试用；生产环境开它会导致无谓的 poll 开销和上下文切换
唯一值得调的是 -XX:MaxGCPauseMillis：它不减少 STW，但会让 GC 调度器更激进地拆分工作（如 G1 的 mixed GC 分 Region），间接降低单次 STW 长度——但这属于 GC 策略层面，不是安全点优化

复杂点在于：安全点延迟是线程级行为，和 GC 类型无关，也和堆大小无直接关系。最容易被忽略的是——你看到的「STW 时间」里，可能混着 biased locking revocation 或 deoptimization 等其他 VM 操作。别急着调参，先用 PrintSafepointStatistics 确认是不是真卡在「等待线程进入安全点」。

Java程序设计：处理可变数量输入并计算最大值与平均值

如何在 Java 中安全获取集合视图（View）的第一个和最后一个元素

Java中实现运行时动态选择报告类并完整序列化所有字段的教程

如何在 Java 中动态选择报告类并完整序列化所有字段到 JSON 文件

Java中处理含逗号的查询参数：避免URL序列化歧义的正确方案

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

730

2023.08.02

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

399

2023.09.04

string转int

730

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

564

2024.08.29