Python 使用 profiling 工具的实践思路

冷漠man

发布时间：2026-02-18 15:14:03

751人浏览过

来源于php中文网

原创

优先选cprofile快速定位瓶颈函数，line_profiler用于深入分析已知慢函数的行级耗时；注意cprofile不统计c扩展、line_profiler需装饰器且不支持交互式代码。

python 使用 profiling 工具的实践思路

怎么选 `cProfile` 还是 `line_profiler`

看你想定位到哪一层：cProfile 告诉你哪个函数耗时最多，适合快速锁定瓶颈模块；line_profiler 能看到函数内部每一行的执行时间，适合优化已知慢函数里的具体逻辑。

常见错误是直接上 line_profiler——它得先用 @profile 装饰目标函数，且不能 profile 交互式代码（比如 Jupyter 单元格里直接跑），否则报 LineProfiler object has no attribute 'add_function'。

cProfile 开箱即用，python -m cProfile -s cumulative myscript.py 就能出排序结果
line_profiler 需要 pip install 后手动注册装饰器，且只对 .py 文件里的函数生效
如果函数调用链深、C 扩展多（比如 pandas/Numpy 操作），cProfile 会低估实际耗时，因为 C 层不被统计

`cProfile` 输出看不懂？关键字段怎么读

运行后默认输出类似：ncalls 是调用次数，tottime 是函数自身耗时（不含子调用），cumtime 是累计耗时（含所有子调用）。真正该盯的是 cumtime 排序后的顶部几项。

容易踩的坑是忽略 tottime 和 cumtime 的区别。比如一个函数 cumtime 很高但 tottime 很低，说明它只是个“中转站”，真耗子在它调用的下游函数里。

立即学习“Python免费学习笔记（深入）”；

Android手机开发课程标准中文WORD版

本课程在设计上本着懂方法，重应用的总体思路，突出体现职业教育的技能型、应用性特色，着重培养学生的实践应用技能，力求达到理论方法够用，技术技能过硬的目的。通过本课程的学习，使学生具备Android平台应用开发相关知识、良好的编程习惯和手机应用软件开发的能力，能胜任基于Android平台的手机软件研发等工作任务。感兴趣的朋友可以过来看看

下载

加 -s cumulative 按累计时间降序，比默认的 ncalls 排序有用得多
用 pstats.Stats 加载结果后，可以 stats.sort_stats('cumulative').print_stats(10) 只看前 10 行
别信 built-in method 这类条目——它们是 C 层调用，cProfile 不深入，数值仅供参考

为什么 `timeit` 和 profiling 结果对不上

timeit 测的是单次小片段的纯 CPU 时间，而 profiling（尤其 cProfile）包含解释器开销、函数调用栈维护、甚至 I/O 等待——两者测量维度根本不同。

典型场景：你用 timeit 发现某个列表推导很快，但整个脚本跑起来却慢。很可能是因为这个推导被调用了几千次，或者它前面有大量磁盘读取没被 timeit 包进去。

timeit 适合验证“这段逻辑本身快不快”
profiling 适合回答“整个流程里，时间到底花在哪了”
如果 profiling 显示某函数 cumtime 高但 tottime 低，再用 timeit 测它的子调用，往往能找到真实瓶颈

线上服务能直接跑 profiling 吗

不能随便跑。cProfile 默认开销约 5–10%，可能拖慢响应；line_profiler 更重，还可能因装饰器引入线程安全问题。

真实生产环境更常用采样式方案：比如用 py-spy（Rust 写的，无需修改代码，支持 attach 到进程），或导出火焰图（flameprof + pip install py-spy）。

本地调试用 cProfile 完全够用，但别在压测时开着它——数据失真，还影响并发表现
想看内存分配？cProfile 不管这事，换 memory_profiler，但它需要逐行插桩，开销更大
异步代码（async/await）用 cProfile 会漏掉协程切换开销，此时优先考虑 py-spy record -o profile.svg --pid $PID

profiling 不是万能开关，它只反映“这一轮运行”的行为。IO 波动、缓存命中率、GIL 争抢这些动态因素，一次采样说不清。

Python 数据聚合操作的性能优化

Python 嵌套推导式为何难以维护

Python 指标埋点的 cardinality 控制

Python OpenTelemetry 的全链路埋点规范

如何使用 Python + Selenium 在新标签页中打开并切换网页内容

相关专题

C++系统编程内存管理_C++系统编程怎么与Rust竞争内存安全

C++系统编程中的内存管理是指对程序运行时内存的申请、使用和释放进行精细控制的机制，涵盖了栈、堆、静态区等不同区域，开发者需要通过new/delete、智能指针或内存池等方式管理动态内存，以避免内存泄漏、野指针等问题，确保程序高效稳定运行。它核心在于开发者对低层内存有完全控制权，带来灵活性，但也伴随高责任，是C++性能优化的关键。

2025.12.22

Rust异步编程与Tokio运行时实战

本专题聚焦 Rust 语言的异步编程模型，深入讲解 async/await 机制与 Tokio 运行时的核心原理。内容包括异步任务调度、Future 执行模型、并发安全、网络 IO 编程以及高并发场景下的性能优化。通过实战示例，帮助开发者使用 Rust 构建高性能、低延迟的后端服务与网络应用。

2026.02.11

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

pip安装使用方法

安装步骤：1、确保Python已经正确安装在您的计算机上；2、下载“get-pip.py”脚本；3、按下Win + R键，然后输入cmd并按下Enter键来打开命令行窗口；4、在命令行窗口中，使用cd命令切换到“get-pip.py”所在的目录；5、执行安装命令；6、验证安装结果即可。大家可以访问本专题下的文章，了解pip安装使用方法的更多内容。

349

2023.10.09

更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容，请阅读专题下面的文章。

425

2024.12.20

pip设置清华源

设置方法：1、打开终端或命令提示符窗口；2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件；3、打开pip.conf文件，然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容，这将把pip的镜像源设置为清华大学的镜像源；4、保存并关闭文件即可。

786

2024.12.23