np.savez()保存多数组时键名须为合法Python标识符,否则读取后无法点号访问;np.load()返回NpzFile对象,需用list(data.files)获取键名;np.savez_compressed()体积更小但速度更慢;非ndarray对象会被静默转为ndarray。

np.savez() 保存多个数组时,键名必须是合法的 Python 标识符
如果你用 np.savez() 保存带中文、空格或数字开头的键名(比如 {"用户数据": arr1, "2024-01": arr2}),运行不会报错,但后续用 np.load() 读取后无法通过点号访问(data.用户数据 语法错误),甚至可能触发 KeyError 或静默丢弃字段。
实操建议:
- 键名只用小写字母、下划线、数字(且不能开头)——例如
user_data、arr_2024 - 避免用
dict构造再传入;直接传命名参数更安全:np.savez("out.npz", user_data=arr1, config=arr2) - 如果必须动态生成键名,用
**{k: v for k, v in items.items() if k.isidentifier()}过滤
np.load() 返回的对象不是 dict,不能用 data.keys() 直接遍历
np.load("x.npz") 返回的是 numpy.lib.npyio.NpzFile 实例,它支持类似字典的接口,但不继承 dict。常见错误是写 for k in data.keys(): print(data[k]) ——这会抛出 AttributeError: 'NpzFile' object has no attribute 'keys'。
实操建议:
- 用
list(data.files)获取所有键名列表(返回list[str]) - 访问值统一用
data["key_name"],不要用点号(除非键名是合法标识符且你确认没被覆盖) - 注意:
data.files是只读属性,修改它无效
np.savez_compressed() 和 np.savez() 的性能与体积差异明显
两者 API 完全一致,但 np.savez_compressed() 默认用 zlib 压缩每个数组,文件体积通常小 30%–70%,代价是保存慢 2–5 倍、加载慢 10%–30%(取决于压缩率和 CPU)。如果你存的是大量稀疏矩阵或重复结构数据,压缩收益更大;但如果是已高度压缩的 float32 图像块,效果有限甚至更慢。
实操建议:
- 调试阶段用
np.savez(),快;交付/归档用np.savez_compressed() - 不支持自定义压缩算法(如 lz4),要更高压缩比得自己用
zarr或h5py - 压缩不影响读取逻辑,
np.load()自动识别两种格式
保存含非 NumPy 对象(如 list、str)会静默转成 ndarray,可能出人意料
np.savez() 只接受 numpy.ndarray 或能被自动转换为 ndarray 的对象(如 Python list、tuple、标量)。但它不会报错,而是默默调用 np.asarray() 转换——比如传入 ["a", "b"],得到的是 dtype='<u1> 的一维数组;传入嵌套 <code>[[1,2], [3]] 会变成 dtype=object 数组,后续计算易崩。
实操建议:
- 保存前显式检查类型:
assert isinstance(arr, np.ndarray), f"Expected ndarray, got {type(arr)}" - 字符串建议用
np.array(["a", "b"], dtype="U10")显式指定长度 - 真需要存复杂结构(如 dict/list 嵌套),改用
pickle或json+np.save()分离存储
键名合法性、NpzFile 的特殊行为、压缩权衡、类型隐式转换——这四点不提前踩过坑,很容易在后续加载时发现数据“不对”却查不出原因。










