Python函数传参本质是传对象引用的副本,可变对象被原地修改会直接影响调用方数据;高危场景包括默认参数用可变对象、返回原引用、链式调用隐式修改;应使用None作默认值、显式复制、清晰命名并用id()调试。

Python 中用可变对象(如 list、dict、set)作函数参数时,真正危险的不是“被修改”,而是调用者没意识到修改会直接反映到原对象上——这违反直觉,且难以追踪。
风险根源:传参本质是“传对象引用”
Python 没有“传值”或“传引用”的简单二分。它传递的是对象引用的副本。对不可变对象(如 int、str、tuple),副本指向同一对象,但任何“修改”都会新建对象,原变量不受影响;而可变对象在函数内调用 .append()、.update()、+= 等原地操作时,修改的是引用所指的那个内存中的对象本身,调用方看到的就是被改过的原对象。
例如:
def bad_append(items, x):
items.append(x) # 原地修改!
data = [1, 2]
bad_append(data, 3)
print(data) # 输出 [1, 2, 3] —— 调用方数据已变常见高危场景
-
默认参数用可变对象:函数定义时默认值只创建一次,多次调用会持续复用同一个 list/dict,导致“状态残留”。
(例:def f(x, cache=[]): cache.append(x); return cache,第二次调用会带着第一次的元素) -
函数返回原对象的引用:比如写了个“过滤函数”却误用了
.remove()或del,实际在原列表上删,而非返回新列表。 -
链式调用中隐式修改:如
my_dict.update(other_dict)不返回新 dict,而是就地更新,若误以为它像**{}解包那样生成新对象,就会出错。
安全实践:明确意图,切断意外共享
- 默认参数一律用
None,函数内手动初始化:def f(x, cache=None):
if cache is None:
cache = [] - 需要“读取并加工”时,显式复制:
传入list就用items.copy()或items[:];
传入dict就用data.copy()或dict(data)(浅拷贝足够多数场景)。 - 函数名和文档明确表达行为:
用filter_list_inplace()表示会改原列表,filter_list()则应返回新列表,并在 docstring 写清“不修改输入”。
调试提示:快速识别是否被意外修改
在关键位置打印 id(obj):如果函数前后 id 不变,说明是同一对象;若你没打算改它,却看到 id 相同 + 内容变了,就是踩坑了。也可以在函数入口加 assert not isinstance(arg, (list, dict, set))(仅调试期)强制暴露问题。
立即学习“Python免费学习笔记(深入)”;










