python字节码由cpython虚拟机解释执行,流程为源码→编译成.pyc(含魔法数、时间戳、code object等)→加载为code object→pvm基于栈逐条执行指令,所有运行时对象存于堆中,由帧对象管理引用。

Python 字节码不是直接由硬件运行的机器码,而是由 Python 虚拟机(CPython 的 PVM)解释执行的中间表示。理解其执行流程,关键在于看清“源码 → 编译 → 字节码 → 解释执行”这四个环节中每一步做了什么、谁在参与、以及数据如何流转。
源代码被编译成字节码(.pyc 文件)
当你运行 python script.py 或导入一个模块时,CPython 会先检查是否存在对应时间戳更新的 __pycache__/script.cpython-312.pyc(版本号因 Python 版本而异)。若不存在或过期,就调用内置的编译器将源码解析为抽象语法树(AST),再优化并生成字节码指令序列。
你可以手动触发编译:
- import py_compile; py_compile.compile('script.py')
- python -m py_compile script.py
生成的 .pyc 文件本质是二进制容器,包含魔法数、时间戳、源码路径和真正的字节码(co_code 字段)。
立即学习“Python免费学习笔记(深入)”;
字节码以 code object 形式加载进内存
执行前,Python 将 .pyc 中的字节码载入为一个 code object(不可变对象),它还携带了常量表(co_consts)、变量名(co_names)、局部名(co_varnames)、栈需求(co_stacksize)等元信息。这些信息共同决定虚拟机如何执行该段字节码。
例如,执行 dis.dis(lambda x: x + 1) 会显示:
- LOAD_FAST(从局部变量槽取 x)
- LOAD_CONST(从 co_consts 取整数 1)
- BINARY_ADD(执行加法)
- RETURN_VALUE(返回结果)
每条指令都依赖 code object 提供的上下文才能正确寻址和操作。
PVM 按顺序读取并执行字节码指令
Python 虚拟机是一个基于栈的解释器。它维护一个求值栈(evaluation stack)和当前帧对象(frame object),帧中保存局部变量、上层帧引用、指令指针(f_lasti)等。PVM 循环执行:读取下一条指令 → 解析操作码与参数 → 调用对应逻辑(如 Pyeval_EvalFrameDefault 中的 switch-case 分支)→ 更新栈与状态 → 移动指令指针。
典型行为包括:
- 遇到 LOAD_NAME:查 globals/locals 字典,压栈
- 遇到 CALL_FUNCTION:弹出参数和函数对象,新建帧并跳转执行
- 遇到 JUMP_ABSOLUTE:修改 f_lasti 实现跳转(支撑循环与条件)
没有 JIT,纯解释执行;每条字节码指令背后都是 C 函数调用,开销可见。
执行结果由帧对象和对象系统承载
字节码本身不存储数据,所有运行时对象(int、list、function 等)都分配在堆上,由引用计数 + 垃圾回收管理。帧对象只存指向这些对象的指针。比如 a = [1, 2] 对应的字节码会创建 list 对象并把地址写入局部变量槽,后续 a.append(3) 则通过该指针调用对象方法。
函数调用、异常抛出、生成器挂起等高级行为,也都映射为帧状态变更(如 f_back、f_exc_info、f_gen 等字段赋值),而非字节码直译。










