在Python脚本中配置TensorFlow以利用GPU加速

霞舞

发布时间：2025-12-05 12:45:18

636人浏览过

来源于php中文网

原创

在Python脚本中配置TensorFlow以利用GPU加速

本文旨在解决python脚本中tensorflow默认运行于cpu而非gpu的问题。我们将详细介绍如何检查tensorflow与cuda/cudnn的兼容性，并通过配置tensorflow运行时参数，特别是启用gpu内存增长策略，确保模型训练和推理能够充分利用gpu的强大计算能力，从而显著提升性能。

在开发涉及深度学习或大量数值计算的Python应用程序时，利用图形处理器（GPU）的并行计算能力对于提升性能至关重要。然而，有时即使系统已正确安装了CUDA和cuDNN，TensorFlow仍可能默认在CPU上运行，导致程序执行缓慢。本文将提供一套专业的教程，指导您如何确保TensorFlow正确识别并利用GPU资源。

1. 前期准备与兼容性检查

在尝试配置TensorFlow使用GPU之前，首先需要确认以下几个关键点：

CUDA Toolkit 和 cuDNN 的安装与配置： 确保您的系统已安装了兼容的CUDA Toolkit和cuDNN库。这些是TensorFlow与NVIDIA GPU通信的底层驱动和加速库。
TensorFlow 版本兼容性： TensorFlow的不同版本对CUDA和cuDNN有特定的版本要求。请务必查阅TensorFlow官方文档，确认您安装的TensorFlow版本与您的CUDA Toolkit和cuDNN版本是兼容的。版本不匹配是导致GPU无法被识别或利用的常见原因。

立即学习“Python免费学习笔记（深入）”；
验证GPU可用性： 在Python环境中，可以使用TensorFlow提供的工具函数进行初步验证。
```
import tensorflow as tf

# 检查TensorFlow是否能检测到GPU设备
print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU')))
# 更直接的验证方法（在TensorFlow 2.x中不推荐直接使用is_gpu_available，但仍可作为快速检查）
# print("Is GPU available (legacy check): ", tf.test.is_gpu_available())
```
如果tf.config.list_physical_devices('GPU')返回的列表为空，或者tf.test.is_gpu_available()返回False，则表明TensorFlow未能正确识别GPU。此时，您需要重新检查CUDA、cuDNN的安装以及TensorFlow的版本兼容性。

2. 配置TensorFlow以利用GPU

即使GPU已被检测到，TensorFlow在默认情况下也可能不会立即完全利用它，尤其是在内存分配方面。为了优化GPU使用并避免潜在的内存问题，建议进行以下配置：

Cliclic AI

Cliclic商品背景图编辑器是一款功能强大的AI工具，帮助用户快速生成具有吸引力的商品图背景。

下载

2.1 启用GPU内存增长

TensorFlow默认会在运行时一次性分配几乎所有可用的GPU内存，这可能导致其他应用程序无法使用GPU，或者在多GPU环境下造成资源浪费。通过启用“内存增长”（memory growth）功能，TensorFlow将只在需要时分配GPU内存，并随着程序运行动态增长，从而更高效地利用资源。

将以下代码片段放置在您的Python脚本中，紧随import tensorflow语句之后：

import tensorflow as tf

# 获取所有可用的物理GPU设备
physical_devices = tf.config.list_physical_devices('GPU')

if physical_devices:
    try:
        # 遍历所有GPU设备并启用内存增长
        for gpu in physical_devices:
            tf.config.experimental.set_memory_growth(gpu, True)
        print(f"TensorFlow已成功配置GPU内存增长。检测到GPU设备: {physical_devices}")
    except RuntimeError as e:
        # 内存增长必须在GPU初始化之前设置
        print(f"配置GPU内存增长时发生错误: {e}")
else:
    print("未检测到GPU设备。TensorFlow将运行在CPU上。")

# 您的模型加载和处理代码...
# model = load_model('model_1.h5')
# ...

代码解释：

tf.config.list_physical_devices('GPU')：此函数返回一个列表，其中包含TensorFlow检测到的所有物理GPU设备对象。
tf.config.experimental.set_memory_growth(gpu, True)：对于列表中的每一个GPU设备，此函数将其内存增长模式设置为True。这意味着TensorFlow不会预先分配所有GPU内存，而是根据需要动态分配。
try...except RuntimeError：内存增长设置必须在TensorFlow与GPU进行任何操作（如创建变量、模型加载等）之前完成。如果在GPU已被初始化后尝试设置，将抛出RuntimeError。因此，将其放置在脚本开头，import tensorflow之后立即执行是最佳实践。

3. 将配置集成到您的脚本中

在您的实际Python脚本中，例如进行人脸识别和情感分析的应用程序，您需要确保上述GPU配置代码在任何TensorFlow或Keras模型加载和使用之前执行。

import tkinter as tk
from tkinter import messagebox

from PIL import Image, ImageTk
import cv2
import numpy as np
import face_recognition
import os
import imutils
import time
from imutils.video import VideoStream
from keras.models import load_model
from keras.preprocessing import image
import tensorflow as tf # TensorFlow通常在Keras之前导入

# --- GPU 配置代码开始 ---
physical_devices = tf.config.list_physical_devices('GPU')
if physical_devices:
    try:
        for gpu in physical_devices:
            tf.config.experimental.set_memory_growth(gpu, True)
        print(f"TensorFlow已成功配置GPU内存增长。检测到GPU设备: {physical_devices}")
    except RuntimeError as e:
        print(f"配置GPU内存增长时发生错误: {e}")
else:
    print("未检测到GPU设备。TensorFlow将运行在CPU上。")
# --- GPU 配置代码结束 ---

# Tkinter penceresini oluştur
root = tk.Tk()
root.title("Yüz Tanıma ve Duygu Analizi")

# ... (其他UI和OpenCV初始化代码) ...

# Eğitilmiş duygu analizi modelini yükle
# 此处加载模型，如果GPU配置成功，Keras/TensorFlow将尝试在GPU上加载和运行模型
model = load_model('model_1.h5')
label_dict = {0: 'Kizgin', 1: 'İgrenme', 2: 'Korku', 3: 'Mutlu', 4: 'Notr', 5: 'Uzgun', 6: 'Saskin'}

# ... (后续的视频流处理、人脸检测、情感分析和人脸匹配逻辑) ...

# 确保在TensorFlow模型进行推理时（如 model.predict(face_img_array)），GPU正在工作。
# ...

4. 验证GPU使用情况

配置完成后，您可以通过以下方式验证TensorFlow是否正在使用GPU：

观察终端输出： 如果配置成功，您应该会看到类似TensorFlow已成功配置GPU内存增长。检测到GPU设备: [...]的输出。
系统监控工具： 使用NVIDIA提供的nvidia-smi命令行工具（在Linux/macOS）或任务管理器（在Windows）来监控GPU的使用率和内存占用。当您的脚本运行时，如果GPU被正确利用，您会看到GPU利用率和显存占用显著增加。
TensorFlow日志： TensorFlow在运行时会输出详细的日志信息，其中可能包含关于设备分配和操作执行的信息。您可以设置日志级别以获取更多细节：
```
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '0' # 设置为'0'以显示所有日志信息
```
在输出中查找类似_DeviceAttributes或PhysicalDevice等字样，确认操作是否被分配到/job:localhost/replica:0/task:0/device:GPU:0等GPU设备上。

总结

通过遵循上述步骤，您可以有效地诊断并解决Python脚本中TensorFlow无法使用GPU的问题。关键在于确保TensorFlow版本与CUDA/cuDNN的兼容性，并通过tf.config.experimental.set_memory_growth(gpu, True)启用GPU内存增长策略。这不仅能让您的深度学习任务获得显著的性能提升，还能优化GPU资源的利用，避免不必要的内存冲突。在进行任何计算密集型任务之前，务必进行这些配置，以充分发挥硬件的潜力。

Python怎么获取磁盘剩余空间_shutil.disk_usage()查看容量

Python代码被卡住怎么调试_利用Py-Spy动态附加到正在运行的进程生成火焰图分析死锁位置

Python配置文件热加载_配置变更生效机制

如何彻底卸载 uv Python 包管理工具

使用 subprocess.run 执行 ping 命令时卡死的解决方案

相关专题

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

1496

2023.07.26

查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口，端口占用问题是计算机系统编程领域的一个常见问题，端口占用的根本原因可能是操作系统的一些错误，服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1170

2023.07.27

windows照片无法显示

当我们尝试打开一张图片时，可能会出现一个错误提示，提示说"Windows照片查看器无法显示此图片，因为计算机上的可用内存不足"，本专题为大家提供windows照片无法显示相关的文章，帮助大家解决该问题。

836

2023.08.01

windows查看端口被占用的情况

windows查看端口被占用的情况的方法：1、使用Windows自带的资源监视器；2、使用命令提示符查看端口信息；3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容，供大家免费下载体验。

463

2023.08.02

windows无法访问共享电脑

在现代社会中，共享电脑是办公室和家庭的重要组成部分。然而，有时我们可能会遇到Windows无法访问共享电脑的问题。这个问题可能会导致数据无法共享，影响工作和生活的正常进行。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

2362

2023.08.08

windows自动更新

Windows操作系统的自动更新功能可以确保系统及时获取最新的补丁和安全更新，以提高系统的稳定性和安全性。然而，有时候我们可能希望暂时或永久地关闭Windows的自动更新功能。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

874

2023.08.10

windows boot manager

windows boot manager无法开机的解决方法：1、系统文件损坏，使用Windows安装光盘或USB启动盘进入恢复环境，选择修复计算机，然后选择自动修复；2、引导顺序错误，进入恢复环境，选择命令提示符，输入命令"bootrec /fixboot"和"bootrec /fixmbr"，然后重新启动计算机；3、硬件问题，使用硬盘检测工具进行扫描和修复；4、重装操作系统。本专题还提供其他解决

1976

2023.08.28