Keras模型在Python脚本中加载失败的OSError解决方案

心靈之曲

发布时间：2025-11-27 14:14:55

740人浏览过

来源于php中文网

原创

Keras模型在Python脚本中加载失败的OSError解决方案

本文旨在解决keras模型在python脚本中加载时出现的`oserror: savedmodel file does not exist`错误，尤其当模型在jupyter lab中能够正常加载时。核心解决方案包括统一keras导入方式为`from keras import ...`，并优先使用模型实例的`model.save()`方法进行保存，以确保在不同运行环境下模型序列化和反序列化的一致性。

Keras模型加载中的OSError问题解析

在使用Keras进行深度学习模型开发时，我们经常会将训练好的模型保存起来以便后续部署或推理。然而，开发者可能会遇到一个令人困惑的问题：模型（特别是使用.keras格式保存的模型）在Jupyter Lab环境中可以正常加载和使用，但在独立的Python脚本中加载时却抛出OSError: SavedModel file does not exist错误。这个错误通常伴随着路径提示，例如.\saved_models\model_name.keras\{saved_model.pbtxt|saved_model.pb}，这表明加载机制可能试图将.keras文件解析为TensorFlow SavedModel的目录结构，而非Keras原生格式。

这种差异性行为通常源于Keras与TensorFlow之间复杂的集成关系，特别是Keras 3作为独立的多后端框架出现后，其与tf.keras的交互方式可能在不同上下文（如交互式Jupyter与非交互式脚本）中表现出细微的差异。

解决方案：统一导入与保存机制

解决此问题的关键在于标准化Keras的导入方式和模型保存方法，以确保无论在何种Python运行环境下，Keras模型都能以一致且正确的方式进行序列化和反序列化。

1. 统一Keras导入方式

推荐在代码中统一使用Keras 3风格的导入方式，即直接从keras包导入所需的模块，而不是通过tensorflow.keras。这有助于避免tf.keras可能带来的底层兼容性或配置差异。

立即学习“Python免费学习笔记（深入）”；

错误示例 (可能导致问题):

from tensorflow.keras.models import Sequential, save_model, load_model
from tensorflow.keras.layers import Dense

正确示例 (推荐):

from keras.models import Sequential, load_model
from keras.layers import Dense
# 如果需要TensorFlow特定功能，可以单独导入tf
import tensorflow as tf

通过from keras import ...，我们明确地使用了Keras作为独立的库，这在处理其原生.keras模型格式时通常更为稳定。

AIBox 一站式AI创作平台

AIBox365一站式AI创作平台，支持ChatGPT、GPT4、Claue3、Gemini、Midjourney等国内外大模型

下载

2. 优先使用model.save()方法

在保存模型时，建议使用模型实例的model.save(filepath)方法，而不是tensorflow.keras.models.save_model(model, filepath)函数。尽管两者在很多情况下功能相似，但model.save()作为模型对象的方法，可能在内部更好地处理模型自身的配置和序列化细节，尤其是在涉及到自定义层或复杂模型结构时。

错误示例 (可能导致问题):

from tensorflow.keras.models import save_model
# ...
save_model(model, model_path)

正确示例 (推荐):

# ...
model.save(model_path)

3. 示例代码

以下是一个简化的代码示例，演示了如何正确地定义、训练、保存和加载Keras模型，以避免上述OSError：

import tensorflow as tf
import numpy as np
import os

# 推荐的Keras导入方式
from keras.models import Sequential, load_model
from keras.layers import Dense

# 1. 模型定义与训练
print("--- 1. 定义并训练模型 ---")
model = Sequential()
model.add(Dense(64, input_dim=10, activation='relu'))
model.add(Dense(32, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

data = np.random.random((1000, 10))
labels = np.random.randint(2, size=(1000, 1))

model.fit(data, labels, epochs=10, batch_size=32, verbose=0)
print("模型训练完成。")

# 2. 模型保存 (使用 model.save() 方法)
model_dir = "./saved_models"
os.makedirs(model_dir, exist_ok=True) # 确保保存目录存在
model_path = os.path.join(model_dir, "model_test.keras")

print(f"\n--- 2. 保存模型至: {model_path} ---")
model.save(model_path)
print("模型保存成功。")

# 3. 模型加载 (在独立的Python脚本中模拟加载)
print(f"\n--- 3. 从Python脚本加载模型 ---")
try:
    # 同样使用 keras.models.load_model
    loaded_model = load_model(model_path)
    print("模型在Python脚本中成功加载！")

    # 验证加载的模型
    sample_data = data[:5]
    original_predictions = model.predict(sample_data)
    loaded_predictions = loaded_model.predict(sample_data)

    print("\n原始模型预测 (前5个样本):")
    print(original_predictions.flatten())
    print("\n加载模型预测 (前5个样本):")
    print(loaded_predictions.flatten())

    # 简单验证预测结果是否一致
    if np.allclose(original_predictions, loaded_predictions):
        print("\n预测结果一致，模型加载验证通过。")
    else:
        print("\n警告：预测结果不完全一致，请检查。")

except Exception as e:
    print(f"加载模型时发生错误: {e}")

4. 处理自定义层或对象

如果模型中包含自定义层、损失函数或度量指标，加载时仍需通过custom_objects参数告知load_model如何实例化这些自定义组件。虽然这通常不是导致OSError的直接原因，但它是加载复杂Keras模型时不可或缺的步骤。

# 假设 GraphConv, GraphInfo, LSTMGC 是自定义层
from keras.models import load_model
from keras.layers import Activation # 假设 Activation 也是自定义或需要特殊处理

custom_objects = {
    "Activation": Activation,
    "GraphConv": GraphConv,
    "GraphInfo": GraphInfo,
    "LSTMGC": LSTMGC
}
loaded_model = load_model(model_path, custom_objects=custom_objects)

注意事项与总结

环境一致性： 尽管上述解决方案可以解决导入和保存机制的问题，但确保Jupyter Lab和Python脚本使用相同的Python解释器和库版本（特别是TensorFlow和Keras）仍然是最佳实践。
Keras 3与TensorFlow Keras： Keras 3旨在成为一个独立的深度学习框架，支持多种后端（如TensorFlow、PyTorch、JAX）。当使用tf.keras时，实际上是使用了TensorFlow内置的Keras实现。在某些情况下，两者之间的行为可能存在细微差异，尤其是在模型序列化方面。
路径问题： 确保模型保存路径是正确的，并且Python脚本拥有读写该路径的权限。使用os.path.join构建路径可以提高代码在不同操作系统上的兼容性。
调试思路： 当遇到模型加载问题时，首先检查导入方式和保存方法。如果问题依然存在，可以尝试使用绝对路径保存和加载模型，以排除相对路径解析错误的可能性。

通过遵循上述建议，特别是统一Keras导入方式并优先使用model.save()方法，可以有效解决Keras模型在Python脚本中加载时遇到的OSError: SavedModel file does not exist问题，确保模型在不同运行环境下的稳定性和可移植性。

如何在Python中正确加载并显示Kaggle图像数据集中的图片

SHA1 实现与标准库结果不一致的常见原因及修复方案

如何在Python中正确加载并显示Kaggle数据集中的图像

Python 的 copyreg 模块完全适用于自定义类的序列化定制

Python 的 copyreg 模块完全适用于用户自定义类的序列化定制

相关专题

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

Python 深度学习框架与TensorFlow入门

本专题深入讲解 Python 在深度学习与人工智能领域的应用，包括使用 TensorFlow 搭建神经网络模型、卷积神经网络（CNN）、循环神经网络（RNN）、数据预处理、模型优化与训练技巧。通过实战项目（如图像识别与文本生成），帮助学习者掌握如何使用 TensorFlow 开发高效的深度学习模型，并将其应用于实际的 AI 问题中。

188

2026.01.07

TensorFlow2深度学习模型实战与优化

本专题面向 AI 与数据科学开发者，系统讲解 TensorFlow 2 框架下深度学习模型的构建、训练、调优与部署。内容包括神经网络基础、卷积神经网络、循环神经网络、优化算法及模型性能提升技巧。通过实战项目演示，帮助开发者掌握从模型设计到上线的完整流程。

2026.02.10

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

469

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

2025.12.22

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

174

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

热门下载

网站特效

网站源码

网站素材

前端模板