0

0

Python 优化:使用 Numba 加速嵌套循环计算

碧海醫心

碧海醫心

发布时间:2025-10-17 13:35:00

|

169人浏览过

|

来源于php中文网

原创

python 优化:使用 numba 加速嵌套循环计算

本文介绍了如何使用 Numba 库优化 Python 中包含嵌套循环的计算密集型函数。通过 Numba 的即时编译(JIT)技术,可以将 Python 代码转换为机器码,从而显著提高程序的执行速度。本文提供了详细的代码示例和性能比较,展示了 Numba 在加速嵌套循环计算方面的强大能力,并探讨了并行化的进一步优化。

在 Python 中,当涉及到需要大量计算的嵌套循环时,程序的执行速度往往会成为瓶颈。传统的 Python 解释器在执行循环时效率较低,尤其是在处理大型数据集时。为了解决这个问题,可以使用 Numba 库来加速 Python 代码的执行。Numba 是一个开源的即时编译器,它可以将 Python 代码转换为优化的机器码,从而显著提高程序的性能。

Numba 简介

Numba 通过装饰器(decorators)的方式来指定需要编译的函数。当 Numba 遇到被装饰的函数时,它会将该函数编译为机器码,并在后续的调用中使用编译后的版本。这种即时编译的方式可以避免 Python 解释器的开销,从而提高程序的执行速度。

使用 Numba 加速嵌套循环

以下是一个使用 Numba 加速嵌套循环的示例。假设我们有一个函数 U_p_law,它包含两个嵌套循环,用于计算某种概率分布。

立即学习Python免费学习笔记(深入)”;

import numpy as np
from timeit import timeit
from numba import njit, prange

P_mean = 1500
P_std = 100
Q_mean = 1500
Q_std = 100
W = 1  # Number of matches won by P
L = 0  # Number of matches lost by P
L_P = np.exp(-0.5 * ((np.arange(0, 3501, 10) - P_mean) / P_std) ** 2) / (
    P_std * np.sqrt(2 * np.pi)
)
L_Q = np.exp(-0.5 * ((np.arange(0, 3501, 10) - Q_mean) / Q_std) ** 2) / (
    Q_std * np.sqrt(2 * np.pi)
)


def probability_of_loss(x):
    return 1 / (1 + np.exp(x / 67))


def U_p_law(W, L, L_P, L_Q):
    omega = np.arange(0, 3501, 10)

    U_p = np.zeros_like(omega, dtype=float)

    for p_idx, p in enumerate(omega):
        for q_idx, q in enumerate(omega):
            U_p[p_idx] += (
                probability_of_loss(q - p) ** W
                * probability_of_loss(p - q) ** L
                * L_Q[q_idx]
                * L_P[p_idx]
            )

    normalization_factor = np.sum(U_p)
    U_p /= normalization_factor

    return omega, U_p

为了使用 Numba 加速这个函数,我们只需要添加 @njit 装饰器即可。

@njit
def probability_of_loss_numba(x):
    return 1 / (1 + np.exp(x / 67))


@njit
def U_p_law_numba(W, L, L_P, L_Q):
    omega = np.arange(0, 3501, 10, dtype=np.float64)

    U_p = np.zeros_like(omega)

    for p_idx, p in enumerate(omega):
        for q_idx, q in enumerate(omega):
            U_p[p_idx] += (
                probability_of_loss_numba(q - p) ** W
                * probability_of_loss_numba(p - q) ** L
                * L_Q[q_idx]
                * L_P[p_idx]
            )

    normalization_factor = np.sum(U_p)
    U_p /= normalization_factor

    return omega, U_p

@njit 装饰器告诉 Numba 将 U_p_law_numba 函数编译为机器码。需要注意的是,为了获得最佳性能,建议在 Numba 函数中使用 NumPy 数组,并指定数组的数据类型。

Nanonets
Nanonets

基于AI的自学习OCR文档处理,自动捕获文档数据

下载

并行化 Numba 函数

对于包含大量计算的嵌套循环,还可以通过并行化来进一步提高程序的性能。Numba 提供了 prange 函数,它可以将循环并行化,从而利用多核 CPU 的优势。

@njit(parallel=True)
def U_p_law_numba_parallel(W, L, L_P, L_Q):
    omega = np.arange(0, 3501, 10, dtype=np.float64)

    U_p = np.zeros_like(omega)

    for p_idx in prange(len(omega)):
        p = omega[p_idx]
        for q_idx in prange(len(omega)):
            q = omega[q_idx]
            U_p[p_idx] += (
                probability_of_loss_numba(q - p) ** W
                * probability_of_loss_numba(p - q) ** L
                * L_Q[q_idx]
                * L_P[p_idx]
            )

    normalization_factor = np.sum(U_p)
    U_p /= normalization_factor

    return omega, U_p

要并行化 Numba 函数,需要添加 parallel=True 参数到 @njit 装饰器中,并将外层循环替换为 prange。需要注意的是,并行化可能会引入额外的开销,因此只有在循环的计算量足够大时才能获得性能提升。

性能比较

以下是使用 Numba 加速后的性能比较结果。

omega_1, U_p_1 = U_p_law(W, L, L_P, L_Q)
omega_2, U_p_2 = U_p_law_numba(W, L, L_P, L_Q)
omega_3, U_p_3 = U_p_law_numba_parallel(W, L, L_P, L_Q)

assert np.allclose(omega_1, omega_2)
assert np.allclose(omega_1, omega_3)
assert np.allclose(U_p_1, U_p_2)
assert np.allclose(U_p_1, U_p_3)

t1 = timeit("U_p_law(W, L, L_P, L_Q)", number=10, globals=globals())
t2 = timeit("U_p_law_numba(W, L, L_P, L_Q)", number=10, globals=globals())
t3 = timeit("U_p_law_numba_parallel(W, L, L_P, L_Q)", number=10, globals=globals())

print("10 calls using vanilla Python     :", t1)
print("10 calls using Numba              :", t2)
print("10 calls using Numba (+ parallel) :", t3)

在我的机器上 (AMD 5700x),输出结果如下:

10 calls using vanilla Python     : 2.4276352748274803
10 calls using Numba              : 0.013957140035927296
10 calls using Numba (+ parallel) : 0.003793451003730297

可以看到,使用 Numba JIT 可以获得约 170 倍的加速,而使用多线程 Numba JIT 可以获得约 640 倍的加速。

注意事项

  • Numba 对 Python 代码有一定的限制,例如不支持所有的 Python 特性。在使用 Numba 之前,需要确保代码满足 Numba 的要求。
  • Numba 的编译过程需要一定的时间,因此在第一次调用 Numba 函数时可能会比较慢。但是,在后续的调用中,Numba 会使用编译后的版本,从而提高程序的执行速度。
  • 并行化可能会引入额外的开销,因此只有在循环的计算量足够大时才能获得性能提升。

总结

Numba 是一个强大的 Python 优化工具,它可以显著提高包含嵌套循环的计算密集型函数的执行速度。通过使用 Numba 的即时编译技术和并行化功能,可以充分利用 CPU 的性能,从而加速 Python 程序的执行。在处理大型数据集和复杂的计算任务时,Numba 可以成为提高程序性能的关键。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

338

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

225

2025.10.31

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

138

2026.02.12

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

377

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

32

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

29

2026.01.21

C# 多线程与异步编程
C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧,包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目,帮助开发者掌握 如何在 C# 中构建高并发、低延迟的异步系统,提升应用性能和响应速度。

103

2026.02.06

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号