python推导式是语法糖,编译为嵌套函数及对应字节码(如get_iter、for_iter),列表/生成器/字典/集合推导式在对象构建、内存分配和作用域上存在差异,其性能优势源于解释器优化、局部变量访问快和字节码紧凑。

Python推导式(列表、字典、集合、生成器)本质上是语法糖,底层由编译器在解析阶段转换为等价的循环结构,并通过字节码指令实现。它不改变执行逻辑,只提升可读性与简洁性。
推导式如何被编译成字节码
Python源码经词法分析、语法分析后进入编译阶段,推导式会被重写为嵌套函数调用(如
[x*2 for x in range(3)] 实际被编译为一个匿名函数,其字节码中包含 GET_ITER、FOR_ITER、STORE_FAST、BINARY_MULTIPLY 等指令,与手写的 for 循环高度一致。
可通过 dis.dis() 查看验证:
立即学习“Python免费学习笔记(深入)”;
import dis
dis.dis(lambda: [x*2 for x in range(3)])
四种推导式的底层差异
虽然语法相似,但四者在运行时行为和对象构建方式不同:
- 列表推导式:直接构建 list 对象,一次性分配内存并填充元素;
- 生成器表达式:返回 generator 对象,仅保存迭代逻辑,每次调用 __next__() 时才计算下一个值;
- 字典/集合推导式:分别调用 dict.__setitem__ 和 set.add,支持键/值动态计算,且自动去重(集合)或覆盖(字典);
- 所有推导式都拥有独立作用域(类似函数),内部变量(如 x)不会泄露到外层。
为什么推导式比 for 循环快?
速度优势主要来自三方面:
- 解释器对推导式做了专门优化,比如避免重复查找内置类型方法(如 list.append);
- 局部变量访问更快(推导式内变量默认为局部作用域);
- 字节码更紧凑,减少指令跳转和栈操作次数。
注意:这种差距在小数据量下几乎不可测,仅在大量元素构造时体现明显;若逻辑复杂(含多层条件或函数调用),性能可能反不如显式循环易读可控。
嵌套与条件的展开逻辑
推导式中的多个 for 和 if 并非简单线性拼接,而是按书写顺序嵌套展开:
[(i,j) for i in range(2) for j in range(3) if i != j]
等价于:
result = []
for i in range(2):
for j in range(3):
if i != j:
result.append((i,j))
其中每个 for 引入一层嵌套,每个 if 是对应层级的守卫条件,不能跨层引用变量(如把 if j > i 写在第一个 for 后会报错)。










