如何使用Explain执行计划深度分析SQL性能？

紅蓮之龍

发布时间：2025-09-08 12:33:01

999人浏览过

来源于php中文网

原创

explain是sql性能优化的核心工具，通过分析执行计划可发现全表扫描、排序、临时表等性能瓶颈，结合索引优化、覆盖索引、复合索引设计及explain analyze等高级工具，能精准定位并解决查询效率问题。

如何使用explain执行计划深度分析sql性能？

EXPLAIN

是数据库性能优化的基石，它提供了一个透视镜，让我们能深入了解SQL查询在数据库内部是如何被执行的。这不仅仅是看一眼执行计划那么简单，更重要的是理解数据库为什么会选择这条路径，以及这条路径可能带来的性能影响。通过它，我们能提前发现潜在的性能瓶颈，而不是等到线上出现问题才手忙脚乱。

解决方案

要使用

EXPLAIN

进行SQL性能分析，最直接的方式就是在你的

SELECT

、

INSERT

、

UPDATE

或

DELETE

语句前加上

EXPLAIN

关键字。数据库会返回一个执行计划，这个计划详细描述了查询优化器打算如何处理你的SQL语句，包括访问哪些表、使用哪些索引、以何种顺序连接表、以及如何处理排序和分组等操作。

例如，对于一个简单的查询：

EXPLAIN SELECT * FROM users WHERE age > 30 AND city = 'New York';

执行后，你会得到一个表格或JSON格式的结果，里面包含了多行信息，每一行代表一个操作步骤。初次接触可能会觉得有些晦涩，但随着你对各个字段的理解加深，你会发现它就像一张藏宝图，指引你找到性能优化的方向。我的经验是，不要指望一次

EXPLAIN

就能解决所有问题，它更像是一个迭代的过程：分析计划，提出假设，修改SQL或索引，再

EXPLAIN

，直到你满意为止。

如何解读Explain输出中的关键指标？

理解

EXPLAIN

的输出是优化SQL性能的关键一步。它不是简单的读表，而是要理解每个字段背后的含义，以及它们如何相互关联。

首先，

id

字段标识了查询的各个操作块，对于复杂查询（如包含子查询或UNION），它能帮助你理解执行顺序。

select_type

则告诉你这个操作块的类型，比如

SIMPLE

（简单查询）、

PRIMARY

（最外层查询）、

SUBQUERY

（子查询）或

DERIVED

（派生表，通常是子查询的结果）。这些类型能让你对查询的整体结构有个初步判断。

接下来，

table

字段明确了当前操作涉及的表。最核心的指标之一是

type

，它描述了数据库如何访问表中的行。

```
system
```
、
```
const
```
、
```
eq_ref
```
、
```
ref
```
：这些都是非常高效的访问类型，通常意味着通过主键或唯一索引直接定位到少数几行，或者通过非唯一索引进行等值匹配。看到这些，你通常可以松一口气。
```
range
```
：表示索引范围扫描，比如
```
WHERE id > 100 AND id < 200
```
。效率也不错，但不如前几种精确。
```
index
```
：全索引扫描。虽然比全表扫描快，因为它避免了访问数据行，但仍然需要读取整个索引。如果索引很大，这也会成为瓶颈。
```
ALL
```
：这是最需要警惕的，意味着全表扫描。数据库不得不遍历表中的所有行来找到匹配项。这几乎总是性能问题的根源，尤其是在大表上。

possible_keys

列出了优化器可能选择的索引，而

key

则是它最终决定使用的索引。如果

key

为

NULL

，但

possible_keys

不为空，那说明优化器认为现有索引不适合当前查询，或者查询条件没有充分利用到索引。

key_len

则显示了优化器实际使用了索引的多少字节，对于复合索引，这能帮助你判断索引的前缀是否被有效利用。

通义灵码

阿里云出品的一款基于通义大模型的智能编码辅助工具，提供代码智能生成、研发智能问答能力

下载

rows

字段是一个估计值，表示数据库认为它需要检查的行数。这个数字越高，查询的效率通常越低。结合

type

字段，如果

type

是

ALL

且

rows

很高，那性能问题几乎是板上钉钉了。

filtered

表示通过表条件过滤后剩余的行数百分比。

最后，也是最能揭示潜在问题的，是

Extra

字段。

```
Using filesort
```
：表明数据库需要对结果进行排序，但无法通过索引完成，需要在内存或磁盘上进行额外排序。这通常是性能杀手。
```
Using temporary
```
：数据库需要创建一个临时表来处理查询，通常发生在复杂的
```
GROUP BY
```
、
```
DISTINCT
```
或
```
UNION
```
操作中。临时表的操作会消耗大量I/O和CPU资源。
```
Using index
```
：这是个好消息，意味着查询所需的所有列都包含在索引中（覆盖索引），数据库无需访问实际的数据行，直接从索引中获取结果。
```
Using where
```
：表明数据库在存储引擎层对数据进行了过滤，这本身不一定是坏事，但如果与
```
type: ALL
```
结合，就意味着全表扫描后再过滤，效率低下。
```
Using index condition
```
(MySQL 5.6+): 表示索引条件下推优化，数据库在存储引擎层就对索引进行条件过滤，减少了回表次数。

Explain揭示了哪些常见的SQL性能瓶颈？如何优化？

EXPLAIN

就像一个X光片，能清晰地展示SQL查询的“骨骼”问题。最常见的性能瓶颈，往往就藏在那些不起眼的

type

和

Extra

字段里。

1. 全表扫描 (

type: ALL

) 这是最显眼、也最致命的瓶颈。当

EXPLAIN

显示

type

为

ALL

时，意味着数据库不得不逐行检查表中的所有数据来找到匹配项。在大表上，这会造成巨大的I/O开销。

为什么发生？ 最常见的原因是
```
WHERE
```
子句、
```
JOIN
```
条件、
```
ORDER BY
```
或
```
GROUP BY
```
中涉及的列没有合适的索引。或者，即使有索引，但在查询中对索引列使用了函数（如
```
WHERE YEAR(create_time) = 2023
```
），导致索引失效。有时，数据分布不均匀也会让优化器放弃索引，比如
```
WHERE status = 'active'
```
，如果90%的记录都是'active'，优化器可能觉得全表扫描更快。
如何优化？ 核心是创建并有效利用索引。为
```
WHERE
```
、
```
JOIN
```
、
```
ORDER BY
```
、
```
GROUP BY
```
中频繁使用的列创建B-tree索引。避免在索引列上使用函数。确保查询条件的数据类型与索引列的数据类型一致。对于复合索引，确保查询条件能命中索引的最左前缀。

2. 额外排序 (

Extra: Using filesort

) 当查询需要对结果进行排序（

ORDER BY

）或分组（

GROUP BY

），但没有合适的索引支持时，数据库就会在内存或磁盘上进行额外的排序操作。这通常非常耗时。

为什么发生？ 索引的列顺序与
```
ORDER BY
```
或
```
GROUP BY
```
的列顺序不匹配，或者索引未能覆盖所有排序/分组的列。例如，你有一个
```
(col1, col2)
```
的复合索引，但你
```
ORDER BY col2
```
，索引就无法直接用于排序。
如何优化？ 考虑创建覆盖
```
ORDER BY
```
或
```
GROUP BY
```
列的索引，并且索引列的顺序要与排序/分组的顺序一致。如果排序方向（ASC/DESC）也一致，效果会更好。有时候，调整查询语句，比如先过滤再排序，也能减少需要排序的数据量。

3. 使用临时表 (

Extra: Using temporary

) 数据库在执行某些复杂查询时，需要创建临时表来存储中间结果。这在

DISTINCT

、

UNION

、复杂的

GROUP BY

或子查询中很常见。临时表的创建、写入和读取都会带来性能损耗。

为什么发生？ 通常是由于复杂的聚合操作、需要去重的操作或者子查询无法被优化器有效合并。
如何优化？ 审查查询逻辑，看是否可以简化。对于
```
UNION
```
，如果确定没有重复数据，可以使用
```
UNION ALL
```
来避免去重操作。确保
```
GROUP BY
```
和
```
DISTINCT
```
涉及的列有合适的索引支持，有时索引可以帮助数据库避免创建临时表。

4. 索引选择不佳或未使用 (

key

为NULL或
key
与
possible_keys
不符) 即使你创建了索引，优化器也可能因为各种原因选择不使用它，或者使用了不够高效的索引。

为什么发生？ 数据库的统计信息可能过时，导致优化器对数据分布的判断失误。或者，查询条件不够精确，导致索引选择性太差（比如索引列的值重复率很高）。
如何优化？ 定期更新表的统计信息（如MySQL的
```
ANALYZE TABLE
```
或PostgreSQL的
```
VACUUM ANALYZE
```
）。调整查询条件，使其更具选择性。对于复合索引，确保查询条件能充分利用到索引的前缀。在极少数情况下，如果确定优化器做出了错误选择，可以考虑使用
```
FORCE INDEX
```
（但要慎用，因为它可能在数据分布变化后反而导致性能下降）。

除了基础Explain，还有哪些高级技巧能帮助我更深入地分析SQL？

仅仅是

EXPLAIN

的输出，有时候还不足以让我们完全理解SQL的性能全貌。特别是在面对复杂的生产环境问题时，我们需要更深入的工具和方法。

EXPLAIN ANALYZE

（PostgreSQL 和 MySQL 8.0+） 这是我个人在生产环境中诊断性能问题时最常用的“大杀器”。与普通的

EXPLAIN

只展示计划不同，

EXPLAIN ANALYZE

会实际执行查询，然后返回真实的执行时间、实际处理的行数以及每个操作的开销。这能帮助我们验证优化器的估计是否准确，并精确找出时间究竟消耗在哪里。

例如，在PostgreSQL中：

EXPLAIN ANALYZE SELECT * FROM users WHERE age > 30 AND city = 'New York';

输出会包含

actual time

（实际耗时）和

rows

（实际返回行数），以及

loops

（执行次数）。通过对比

EXPLAIN

的估计值和

EXPLAIN ANALYZE

的实际值，我们可以判断优化器是否因为统计信息不准确而做出了错误的决策。如果估计行数与实际行数相差悬殊，那往往是统计信息过时或者数据分布异常的信号。

2. 可视化Explain工具 很多现代的数据库客户端工具，比如DataGrip、DBeaver、MySQL Workbench，都提供了图形化的

EXPLAIN

输出。这些工具能将复杂的文本输出转化为直观的流程图，用颜色和箭头清晰地展示数据流向、操作顺序和每个步骤的成本。对于包含多个JOIN和子查询的复杂语句，可视化工具能极大地降低理解门槛，让你一眼看出哪些操作是瓶名颈。

3. 覆盖索引（Covering Index）策略 前面提到过

Extra: Using index

是个好兆头。这就是覆盖索引的体现。一个覆盖索引是指，一个索引包含了查询所需的所有列，而不仅仅是

WHERE

子句中的列。这意味着数据库可以直接从索引中获取所有需要的数据，无需再回表访问实际的数据行。这能显著减少I/O操作，尤其是在查询大量数据时。

例如，如果你经常查询

SELECT name, email FROM users WHERE city = 'New York';

一个在

city

列上创建的普通索引只能加速

WHERE

条件，但数据库仍需回表获取

name

和

email

。而一个复合索引

(city, name, email)

就可以作为覆盖索引，直接从索引中返回所有数据。

4. 复合索引的列顺序 复合索引的列顺序至关重要。例如，对于索引

(col1, col2, col3)

，它能有效地支持以下查询：

```
WHERE col1 = ?
```
```
WHERE col1 = ? AND col2 = ?
```

WHERE col1 = ? AND col2 = ? AND col3 = ?

```
ORDER BY col1, col2
```
但它可能无法有效支持
```
WHERE col2 = ?
```
或
```
ORDER BY col2, col1
```
这样的查询，因为它没有命中索引的最左前缀。在设计复合索引时，应该把选择性最高的列放在前面，或者将最常用于等值查询的列放在前面。

5. 数据库参数与配置 有时，性能问题不完全是SQL或索引的问题，也可能是数据库本身的配置不当。例如，MySQL的