0

0

SQL 锁等待过多的排查思路

冷炫風刃

冷炫風刃

发布时间:2026-01-23 17:49:02

|

787人浏览过

|

来源于php中文网

原创

快速定位阻塞SQL需先查INNODB_TRX中TRX_STATE='LOCK WAIT'的事务,再通过INNODB_LOCK_WAITS关联找出BLOCKING_TRX_ID,进而定位阻塞者TRX_QUERY、TRX_STARTED等;SELECT ... FOR UPDATE在RR级别下加临键锁易引发阻塞;长事务通过TRX_START时间差、TRX_STATE及TRX_ROWS_LOCKED等判断;kill前须确认线程来源、是否正在回滚及上游重试逻辑。

sql 锁等待过多的排查思路

如何快速定位正在阻塞的 SQL 语句

锁等待过多,本质是事务没及时释放锁,或者长事务占着资源不放。先看谁在等、谁在挡路,这是最直接的突破口。

在 MySQL 中,information_schema.INNODB_TRXinformation_schema.INNODB_LOCK_WAITS 是核心入口:

  • INNODB_TRX 列出所有活跃事务,重点关注 TRX_STATE = 'LOCK WAIT' 的行,记下它的 TRX_IDTRX_MYSQL_THREAD_ID
  • 用这个 TRX_ID 去查 INNODB_LOCK_WAITS,就能拿到被阻塞的 REQUESTING_TRX_ID 和阻塞方的 BLOCKING_TRX_ID
  • 再通过 BLOCKING_TRX_ID 关联回 INNODB_TRX,查出阻塞者的 TRX_QUERY(如果还没提交)、TRX_STARTED 时间、TRX_WAIT_STARTED 等关键字段

注意:TRX_QUERY 可能为 NULL —— 这通常意味着该事务当前没在执行 SQL(比如刚 START TRANSACTION 后就挂起),但锁仍持有。

为什么 SELECT ... FOR UPDATE 也会引发严重锁等待

很多人以为只有 UPDATE/DELETE 才加锁,其实 SELECT ... FOR UPDATE 在可重复读(RR)隔离级别下会加临键锁(Next-Key Lock),不仅锁住匹配行,还锁住“间隙”,极易导致非预期阻塞。

常见踩坑点:

  • 没走索引的 FOR UPDATE 会升级为表级锁(全表扫描 + 行锁 → 实际效果接近锁表)
  • 范围查询如 WHERE id > 100,即使有索引,也会锁住满足条件的所有行+间隙,后续插入/更新落在该范围内的记录都会被堵住
  • 应用层重试逻辑未设超时,一个慢 FOR UPDATE 可能拖垮整条链路

验证方式:执行 SHOW ENGINE INNODB STATUS\G,在 TRANSACTIONS 部分找 lock_mode X locks rec but not gaplock_mode X locks gap before rec,确认锁类型和范围。

Figstack
Figstack

一个基于 Web 的AI代码伴侣工具,可以帮助跨不同编程语言管理和解释代码。

下载

如何判断是否是长事务导致锁堆积

长事务本身不慢,但会让已获取的锁迟迟不释放,成为“静默阻塞源”。它往往藏得深,不像慢 SQL 那样容易被监控捕获。

关键指标看 INNODB_TRX 表里的:

  • TRX_STARTED:事务开始时间,和当前时间差超过 60 秒就值得警惕
  • TRX_STATE:如果是 RUNNING 却长时间无新操作,大概率是应用端没 commit/rollback
  • TRX_ROWS_LOCKEDTRX_ROWS_MODIFIED:数值异常高,说明事务已持有大量锁或修改了大量数据

特别注意:某些 ORM(如 Djangoatomic 块、Spring 的 @Transactional)可能因异常未被捕获,导致事务卡在 open 状态;数据库连接池配置不当(如最大空闲时间 > 应用层超时)也可能让事务“悬停”在连接上。

kill 掉阻塞线程前必须确认的三件事

别一看到 TRX_MYSQL_THREAD_IDKILL,搞错对象可能让问题更糟。

  • 先确认该线程对应的是应用真实请求(不是监控探针、备份任务、或 DBA 自己连的调试会话)—— 查 information_schema.PROCESSLIST 中的 USERHOSTCOMMANDTIME 字段
  • 检查它是否已处于 ROLLING BACK 状态(PROCESSLIST.COMMAND = 'Sleep'INNODB_TRX.TRX_STATE = 'ROLLING BACK'),此时 kill 只会让回滚中断,下次重启可能触发更长恢复
  • 确认上游是否有重试机制 —— 如果 kill 后应用立即重发相同请求,而根本原因(如缺少索引、逻辑缺陷)没解决,锁等待会立刻重现

真正难的从来不是发现哪个线程该杀,而是弄清它为什么会长时间持锁:是代码漏了 commit?SQL 没走索引?还是业务流程本就不该用事务包这么大的操作?

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

685

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

323

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

348

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1117

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

359

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

717

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

577

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

419

2024.04.29

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.9万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 805人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号