NumPy向量化替代Python循环可提升性能几十至百倍,应优先使用内置函数、广播机制、布尔索引及原生方法,避免嵌套Python对象和显式循环。

用 NumPy 向量化代替 Python 循环,是加速数组运算最直接有效的方式。核心在于让底层 C 实现的批量操作替代解释器逐元素执行的循环,性能提升常达几十到上百倍。
避免 for 循环,改用内置向量化函数
NumPy 大多数数学函数(如 np.sin、np.log、np.exp)和比较操作(==、>)天然支持数组输入,自动广播并返回同形结果。
- ❌ 慢:用 Python 循环逐个计算
- ✅ 快:直接传整个数组,例如 np.sqrt(arr) 或 arr > 0.5
- 注意:自定义逻辑可先写成纯 NumPy 表达式,再考虑 np.vectorize(仅语法糖,不提速)或用 np.where、np.select 替代条件分支
善用广播机制,减少显式复制
广播让不同形状的数组能自动对齐参与运算,避免手动 tile/expand,既省内存又提速度。
- 例如:(m, n) 矩阵 + (n,) 向量 → 自动按行广播;(m, 1) 列向量 + (n,) 行向量 → 生成 (m, n) 结果
- 检查是否广播可行:两数组从尾轴开始比对,尺寸相等或其中为 1 即可
- 若需强制扩展维度,用 arr[:, None] 或 arr.reshape(-1, 1),比 np.tile 更轻量
用布尔索引替代循环筛选
提取满足条件的元素、赋值或统计,全部交给 NumPy 的布尔数组索引完成。
立即学习“Python免费学习笔记(深入)”;
- ❌ 慢:[x for x in arr if x > 0] 或循环标记
- ✅ 快:arr[arr > 0] 取值,arr[arr 原地修改,np.sum(arr > 0.5) 计数
- 组合条件用 &(且)、|(或)、~(非),注意括号: (arr > 1) & (arr
优先使用原生方法,慎用 Python 对象嵌套
保持数据在 NumPy 数组中流转,避免转成 list、dict 或调用 Python 函数处理每个元素。
- 聚合运算用 .sum()、.mean()、.max() 等方法,而非 sum(list(arr))
- 避免 np.array([func(x) for x in arr]),尽量把 func 向量化(如用 np.piecewise 或分段表达式)
- 若必须调用黑盒函数,考虑 numba.jit 加速或用 np.frompyfunc(仅当无法向量化时)
不复杂但容易忽略。关键不是“写得像 NumPy”,而是“想得像 NumPy”——把操作看作整体变换,而不是逐个处理。










