
本文解释了为何在循环中反复向列表追加字典时,所有元素最终都变成同一份数据,并提供基于深拷贝/浅拷贝原理的正确解决方案,确保每次追加的是独立副本。
在 Python 中,字典(dict)是可变对象,变量名本质上是对内存中对象的引用,而非数据本身。当你在循环中反复调用一个修改字典并返回它的函数(如 Func(a)),而该函数并未创建新字典、只是就地更新原字典并返回其引用,那么你实际是将同一个字典对象的多个引用依次追加到列表中。结果就是:ahist[0]、ahist[1]……ahist[9] 全部指向内存中的同一个 dict 实例——因此任意一次后续修改都会“同步”反映在列表所有位置上。
以下是一个典型错误示例及其运行结果:
a = {'a': 1, 'b': 2}
def Func(d):
d['b'] = d['b'] + d['a'] # ⚠️ 就地修改原字典
return d
ahist = []
for i in range(3):
a = Func(a)
ahist.append(a)
print([id(x) for x in ahist]) # 输出三个相同的 id → 同一对象
print(ahist) # [{'a': 1, 'b': 15}, {'a': 1, 'b': 15}, {'a': 1, 'b': 15}]✅ 正确做法是:每次生成一个独立的新字典副本。对于仅含不可变值(如 int、str、tuple)的一层嵌套字典,使用 .copy()(浅拷贝)即可;若字典嵌套了列表、其他字典等可变对象,则需 copy.deepcopy()。
优化后的安全实现如下:
import copy
a = {'a': 1, 'b': 2}
def Func(d):
# ✅ 方案1:浅拷贝(适用于简单字典)
new_d = d.copy()
new_d['b'] = d['b'] + d['a']
return new_d
# ✅ 方案2:深拷贝(适用于嵌套结构,更通用但稍慢)
# def Func(d):
# new_d = copy.deepcopy(d)
# new_d['b'] = d['b'] + d['a']
# return new_d
ahist = []
for i in range(3):
a = Func(a)
ahist.append(a)
print([id(x) for x in ahist]) # 输出三个不同 id → 独立对象
print(ahist)
# 输出示例:
# [{'a': 1, 'b': 3}, {'a': 1, 'b': 4}, {'a': 1, 'b': 5}]? 关键注意事项:
- list.append() 本身完全正常,问题根源在于被追加的对象是否为独立实例;
- d.copy() 是浅拷贝,仅复制顶层键值对,不递归复制嵌套可变对象;
- 若你的字典中包含列表(如 {'data': [1, 2, 3]}),且需修改该列表内容,请务必改用 copy.deepcopy(d);
- 避免在函数内直接修改传入的可变参数(即“不要污染输入”),这是函数式编程的良好实践,也利于调试与复用。
总结:要构建由不同状态组成的字典历史列表,核心原则是——每次迭代必须产生一个新对象,而非反复复用并修改旧对象。理解引用语义与拷贝机制,是写出健壮 Python 数据处理代码的基础。









