什么是活锁(Livelock)与饥饿现象_线程虽然在运行但无法推进的故障

P粉602998670

发布时间：2026-02-22 20:21:10

480人浏览过

来源于php中文网

原创

活锁是线程状态为runnable但业务无进展；饥饿是线程长期处于waiting/timed_waiting却得不到调度；死锁则表现为线程互相等待锁。三者需通过jstack输出的线程状态与堆栈精准区分。

什么是活锁(livelock)与饥饿现象_线程虽然在运行但无法推进的故障

活锁不是卡死，而是“假忙真停”——线程一直在执行，Thread.getState() 返回 RUNNABLE，CPU 占用不低，但关键逻辑（比如消息处理、任务提交、锁获取）反复失败、原地打转。

典型错误现象：

关键解决点是打破同步节奏：

重试前必须加随机延迟：Thread.sleep(ThreadLocalRandom.current().nextInt(10, 100))，别用 sleep(10) —— 多线程会迅速趋同，冲突复现率反而更高
每次重试都要检查中断：if (Thread.interrupted()) throw new InterruptedException();，否则无法响应 shutdownNow()
避免在重试循环里做非幂等操作（比如发一次通知、写一次日志），否则日志刷屏却无实质推进

饥饿的线程状态常是 WAITING 或 TIMED_WAITING，比如卡在 ReentrantLock.lock()、Object.wait()、或 LinkedBlockingQueue.take() 上，但不是因为对方死锁，而是调度/排队机制本身不公平。

常见错误场景：

把后台统计线程设成 Thread.MIN_PRIORITY，而前台 HTTP 请求线程占满 CPU，JVM 不保证优先级跨平台生效，该线程可能几小时不调度一次
用默认构造的 ReentrantLock（非公平模式），新线程总比等了 5 秒的老线程更容易抢到锁
用 wait() + notify() 实现生产者消费者，但 notify() 总唤醒刚进来的线程，老等待者一直被跳过

实操建议：

大师兄智慧家政

58到家打造的AI智能营销工具

下载

禁用 setPriority() —— 它在 Linux/OpenJDK 上基本无效，还引入不可移植风险
需要排队公平性时，显式启用公平锁：new ReentrantLock(true)；但注意：吞吐量下降 15–30%，别在高频短临界区滥用
替代 wait()/notify()：用 Condition 配合公平锁，或直接上 java.util.concurrent 的公平类，比如 LinkedBlockingQueue（构造时传 true 启用公平模式）

别靠猜。出问题第一时间跑 jstack <pid></pid> 或开 JConsole 点“检测死锁”按钮：

如果有死锁，JVM 会直接标出互相等待的线程和锁地址，堆栈里出现 waiting to lock 和 locked 循环对
如果没有死锁，但一堆线程状态是 RUNNABLE，且堆栈反复出现在 tryLock() → sleep() → 循环，就是活锁
如果线程停在 parking to wait for 或 java.lang.Object.wait(Native Method)，且等待时间远超预期（比如 >30s），大概率是饥饿

注意：WAITING 状态不等于饥饿——它可能是正常阻塞（如 CountDownLatch.await()），得结合业务逻辑和等待时长判断。