模块是单个.py文件,包是含__init__.py的目录;import分查找、加载、绑定三步,需理解机制以避免导入错误、循环引用和路径混乱。

Python 中的模块(module)和包(package)都是组织代码的方式,但层级和用途不同:模块是单个 .py 文件,包是包含 __init__.py 的目录,用于管理多个模块。而 import 机制负责定位、加载、缓存并绑定名称——理解它,才能避开导入错误、循环引用和路径混乱。
模块是基础执行单元,包是模块的容器
模块对应一个物理文件,比如 math.py 或 utils.py,导入后就是一个命名空间对象,所有顶层定义(函数、类、变量)都成为其属性。
包则必须是一个目录,且至少含一个 __init__.py(可为空),它的作用是:声明该目录为 Python 包、控制 from package import * 的行为、执行初始化逻辑。
例如,requests 是包,requests.api 是其子模块(即 requests/api.py),requests.__init__.py 可能将常用函数导入到包顶层,让用户直接写 import requests; requests.get(...)。
import 三步走:查找 → 加载 → 绑定
执行 import foo 时,Python 不是简单“读文件”,而是严格按流程处理:
-
查找:按
sys.path列表顺序搜索,包括当前目录、PYTHONPATH、标准库路径、已安装的第三方包路径;找到匹配的foo.py(模块)或foo/__init__.py(包)就停止 -
加载:若未被加载过,就编译为字节码(
.pyc),执行代码(模块级语句、__init__.py内容),生成模块对象,并缓存在sys.modules中 -
绑定:在当前命名空间中创建名称
foo,指向该模块对象;如果是from foo import bar,则只绑定bar名称(不引入整个模块对象)
常见陷阱与应对方式
很多导入问题其实源于对机制理解偏差:
立即学习“Python免费学习笔记(深入)”;
-
相对导入只能在包内使用:在非包的脚本里写
from .utils import helper会报SystemError: Parent module '' not loaded,因为没有上级包上下文 -
重复 import 不等于重复执行:模块首次导入才执行代码,后续只是从
sys.modules取缓存对象;因此__init__.py中的初始化逻辑不会多次触发 -
修改 sys.path 要谨慎:临时插入路径虽能解决找不到模块的问题,但易导致同名模块误导入(比如本地有个
json.py,会覆盖标准库json);推荐用虚拟环境 + 正确安装(pip install -e .)替代硬编码路径
动态导入与高级控制
当导入时机或目标不确定时,可用更底层的方式:
-
importlib.import_module('package.submodule'):支持字符串形式的模块路径,适合插件系统或配置驱动场景 -
importlib.util.spec_from_file_location()和importlib.util.module_from_spec():可从任意路径加载模块(如用户上传的脚本),绕过sys.path查找 - 重载模块用
importlib.reload(module)(仅限开发调试),注意它不更新已引用该模块的其他模块中的对象










