gc.get_referrers() 是定位循环引用的核心工具:它返回直接引用目标对象的所有对象,需先禁用自动回收并手动触发 collect,再逐层回溯引用链,配合 gc.get_objects() 和 sys.getrefcount() 交叉验证,优先排查自定义类、闭包及 weakref 相关对象。

Python 中 gc.get_referrers() 是定位循环引用的直接工具
当对象本该被回收却一直驻留在内存中,大概率存在循环引用。Python 的垃圾回收器(gc)能自动处理大多数情况,但调试时需人工介入定位——gc.get_referrers() 就是核心手段:它返回所有直接引用目标对象的对象列表,可逐层回溯引用链。
使用前必须先禁用自动回收并手动触发一次收集,否则部分循环引用可能被提前清理,导致查不到:
import gc gc.disable() # 防止中途被 gc 清理掉 # ……复现疑似循环引用的操作…… gc.collect() # 强制运行一次,让循环引用进入 gc 跟踪列表
- 只对“可被 gc 管理”的对象有效(即非原子类型,如
list、dict、自定义类实例;int、str等不可变原子对象不参与引用计数式循环 - 结果包含大量内部对象(如 frame、module),需过滤掉无关项,常用条件:
obj not in (frame, module, gc.garbage) - 多次调用
gc.get_referrers()并检查返回列表长度是否稳定,若持续增长,说明有未断开的引用路径
用 gc.get_objects() + sys.getrefcount() 辅助交叉验证
sys.getrefcount() 显示当前引用计数,但它本身会临时增加一次引用(传参导致),所以结果比真实值大 1;而 gc.get_objects() 可列出当前所有被 gc 跟踪的对象,适合做快照比对。
典型做法是:在操作前后各调用一次 gc.get_objects(),筛选出新增且疑似泄漏的对象,再对其调用 sys.getrefcount() 和 gc.get_referrers():
立即学习“Python免费学习笔记(深入)”;
# 操作前
before = set(id(obj) for obj in gc.get_objects())
# ……执行可能产生循环引用的代码……
# 操作后
after = set(id(obj) for obj in gc.get_objects())
leaked = after - before
for oid in leaked:
obj = [o for o in gc.get_objects() if id(o) == oid]
if obj and sys.getrefcount(obj[0]) > 2: # 排除临时变量残留
print("可疑对象:", type(obj[0]).__name__, "refcount:", sys.getrefcount(obj[0]))
-
sys.getrefcount()对 C 扩展对象或某些内置类型可能返回异常高值,不要单凭它下结论 -
gc.get_objects()返回的是实时快照,若程序并发活跃,两次快照间可能有干扰,建议在单线程、低干扰环境下运行 - 优先关注自定义类实例、闭包、
weakref相关对象——它们是最常见的循环引用源头
常见循环引用场景及破环方式
最典型的不是“两个对象互相持有”,而是“父对象持子对象,子对象又通过回调、绑定方法或闭包反向持有父对象”。比如 Tkinter 回调、Flask 请求上下文、事件监听器注册等。
- Tkinter 中用
lambda绑定self:改用functools.partial或显式传参,避免隐式闭包捕获self - 类中定义了
__del__方法:一旦存在该方法,对象将不会被引用计数机制及时回收,必须依赖gc;此时务必确保没有循环引用,否则该对象永远不会被释放 - 使用
weakref.ref替代强引用:尤其适用于缓存、观察者模式、父子关系中“子不阻止父销毁”的场景 - 手动断开引用:在对象生命周期结束前(如
__del__或显式close()方法中)清空已知的反向引用字段,例如self.parent = None
第三方工具 objgraph 可视化引用链
纯手工追踪多层引用容易迷失,objgraph 提供了更直观的方式,比如生成引用图或找出两个对象间的最短路径:
import objgraph objgraph.show_backrefs([my_obj], max_depth=4, filename='backrefs.png') objgraph.find_path(obj_a, obj_b, max_depth=5)
- 依赖
graphviz,需提前安装系统级dot工具,否则报错GraphVizNotFound -
show_backrefs默认包含大量 Python 内部对象,建议加filter=lambda x: not hasattr(x, '__dict__') or 'your_module' in str(type(x))过滤 - 生成的图文件可能极大,
max_depth建议从 3 开始尝试,逐步放宽
真正难处理的不是发现循环,而是判断哪一端该用弱引用、哪一端该主动断开——这取决于数据所有权语义,而非技术可行性。








