应优先用set替代list做成员查找、用namedtuple或dataclass替代dict存结构化数据、用join替代字符串拼接、用deque替代list做队列操作、用lru_cache替代全局字典缓存。

用 list 做频繁查找,却忘了 set 的 O(1) 查找
很多开发者习惯用 if x in my_list: 判断元素是否存在,尤其在循环中反复调用。但 list 的 in 是 O(n) 时间复杂度,数据量稍大(比如上千项)就会明显变慢。而 set 底层是哈希表,平均查找是 O(1)。只要不需顺序或重复元素,把列表转成集合只需一次:my_set = set(my_list),后续判断就快得多。注意:set 不保留插入顺序(Python 3.7+ dict 保持顺序,但 set 本身仍无序),也不支持索引。
用 dict 存简单键值对,却忽略更语义化的命名元组或 dataclass
当结构固定、字段明确(比如用户信息:{'name': 'Alice', 'age': 30, 'city': 'Beijing'}),只用 dict 虽然灵活,但易出错:拼错键名、忘记字段、类型模糊。此时 namedtuple(不可变、轻量)或 dataclass(可变、支持默认值和类型提示)更合适。例如:User = namedtuple('User', ['name', 'age', 'city']),之后 u = User('Alice', 30, 'Beijing'),访问 u.name 更安全、更清晰。dataclass 还能加验证逻辑和文档,适合稍复杂的场景。
用字符串拼接代替 join,尤其在循环中
写 s = '' 然后循环里 s += part 是常见误区。由于字符串不可变,每次 += 都新建对象,整体是 O(n²) 复杂度。正确做法是先收集所有片段到 list,最后用 ''.join(parts) ——这是 O(n),且语义清晰。即使只有几项,也建议养成习惯;若片段来自生成器,可用 ''.join(part for part in gen),无需先转 list。
误把 list 当队列用,忽视 deque 的高效头尾操作
用 my_list.pop(0) 或 my_list.insert(0, x) 模拟队列的“出队/入队前端”,性能很差——list 在头部增删是 O(n)。标准库的 collections.deque 是双向队列,.popleft() 和 .appendleft() 都是 O(1)。如果需要 FIFO(先进先出)或 LIFO(栈),优先选 deque;只有需要按索引随机访问时,才考虑 list。
立即学习“Python免费学习笔记(深入)”;
用全局 list/dict 缓存状态,却没处理线程安全或生命周期
为避免重复计算,有人直接定义模块级变量如 _cache = {},在函数里读写。这在单线程脚本中可行,但在多线程 Web 服务中可能引发竞态;缓存长期不清理还会导致内存泄漏。应改用 functools.lru_cache(自带线程安全与大小限制),或使用带 TTL 的专用缓存(如 cachetools.TTLCache)。若必须手写,至少加上 threading.Lock,并定期清理过期项。










