在Java中如何定位和排查线程死锁_Java并发问题分析方法解析

P粉602998670

发布时间：2026-02-04 06:05:23

165人浏览过

来源于php中文网

原创

jstack -l 可快速抓取线程快照并识别死锁，输出中出现“Found 1 deadlock.”即表明检测到循环等待导致的死锁，但仅覆盖synchronized和JUC显式锁，不包括StampedLock、外部资源锁等。

在java中如何定位和排查线程死锁_java并发问题分析方法解析

用 jstack 快速抓取线程快照并识别死锁

Java 自带的 jstack 是最直接、最低侵入的死锁定位工具。只要进程还在运行，就能立刻获取当前所有线程的状态和锁持有关系。

执行命令：

jstack -l

其中 -l 参数关键——它会输出显式锁（ReentrantLock 等）的持有者和等待者，没有这个参数会漏掉大部分非 synchronized 死锁。

输出中一旦出现 Found 1 deadlock. 字样，后面会明确列出互相等待的线程栈、各自持有的锁和正在等待的锁。注意：这个提示只在 JVM 检测到「循环等待」时才打印，不是所有死锁都能被自动发现（比如涉及外部资源或自定义锁逻辑时）。

确保用启动 Java 进程的同一用户执行 jstack，否则可能权限拒绝
如果进程无响应但 jstack 报错「unable to open socket file」，可能是临时目录被清理，可尝试加 -J-Djava.io.tmpdir=/tmp
线上环境慎用 jstack -F（强制模式），可能引起短暂 STW，尤其在 GC 压力大时

通过 ThreadMXBean 在代码中主动检测死锁

适合嵌入监控系统或测试阶段主动扫描，比人工 jstack 更可控。JDK 提供了 ThreadMXBean 接口，其 findDeadlockedThreads() 方法能返回当前 JVM 中所有陷入死锁的线程 ID 数组。

立即学习“Java免费学习笔记（深入）”；

示例代码：

ThreadMXBean mxBean = ManagementFactory.getThreadMXBean();
long[] deadlockedIds = mxBean.findDeadlockedThreads();
if (deadlockedIds != null && deadlockedIds.length > 0) {
    ThreadInfo[] infos = mxBean.getThreadInfo(deadlockedIds, true, true);
    for (ThreadInfo info : infos) {
        System.err.println("Deadlocked thread: " + info.getThreadName());
        System.err.println("Stack trace:\n" + Arrays.toString(info.getStackTrace()));
    }
}

注意：findDeadlockedThreads() 只检测「synchronized 和 java.util.concurrent.Lock 的组合死锁」，不包含 StampedLock、ReadWriteLock 的读锁重入场景，也不覆盖 native 锁或数据库行锁等外部依赖。

AI封面生成器

专业的AI封面生成工具，支持小红书、公众号、小说、红包、视频封面等多种类型，一键生成高质量封面图片。

下载

该方法是轻量级的，但频繁调用（如每秒多次）仍会带来一定开销
返回 null 不代表绝对无死锁，只是 JVM 未检测到符合内置规则的循环等待
配合 getThreadInfo(..., true, true) 才能拿到锁信息和完整栈，两个 true 缺一不可

使用 JMC 或 VisualVM 查看锁竞争热点

当死锁尚未发生，但已有明显线程阻塞或响应变慢时，需要观察锁的争用趋势。JMC（Java Mission Control）或 VisualVM 的 MBean 插件能实时显示 java.lang:type=Threading 下的锁统计。

重点关注三个指标：CurrentThreadCpuTime（是否某线程长期占用 CPU）、ThreadContentionMonitoringEnabled（需开启）、以及 PeakThreadCount 是否异常飙升。更实用的是「Sampler → Lock Instances」视图，它能列出被最多线程等待的锁实例（按 class+identity hash）。

JMC 默认不开启锁监控，需在启动 JVM 时加参数：-XX:+UnlockCommercialFeatures -XX:+FlightRecorder -XX:+FlightRecorderOptions=settings=profile
VisualVM 需安装「Threads» 插件，并勾选「Enable thread contention monitoring」
看到某个 ReentrantLock 实例的 queueLength 持续 >5，且对应线程栈总卡在 lock()，大概率是锁粒度太粗或存在单点瓶颈

避免死锁的编码习惯比事后排查更重要

90% 的死锁源于可预测的模式：多把锁的获取顺序不一致、锁内调用外部方法、或在持有锁时等待条件变量。排查永远滞后于预防。

几个具体约束建议：

所有涉及多把锁的操作，统一按「类名字母序 + 字段名」硬编码顺序获取，例如先 synchronized(A.class) 再 synchronized(B.class)，杜绝动态决定顺序
synchronized 块内禁止调用可能被子类重写的非 final 方法，防止隐式锁升级或回调死锁
用 tryLock(timeout, TimeUnit) 替代无超时的 lock()，并在超时后主动释放已持锁（需手动管理锁顺序）
对 ConcurrentHashMap 等线程安全容器，别误以为「不用锁」就绝对安全——它的迭代器弱一致性可能引发业务逻辑死锁（如遍历时修改触发 rehash，又在监听器里反向调用）

真正棘手的死锁往往藏在框架回调、代理增强、或跨 JVM 资源协调里，这时候 jstack 看不到锁，ThreadMXBean 也查不到——得结合日志埋点、分布式追踪 ID 和数据库锁视图交叉分析。

在Java中如何创建线程_Java线程创建方式解析

如何在 easyTable（Java）中获取最新创建的表格行

如何使用正则表达式提取带空格边界的目标域名（如 Mywebsite.xx）

如何在 Java 中跨文件封装并私有化复用另一个类的全部公共成员

SOLID原则中的依赖倒置：Java到Python的正确转换示例

相关标签: