Benchmark函数需以Benchmark开头,参数为*testing.B,用b.N控制循环次数,避免在循环外初始化或循环内打印;通过go test -bench运行,结合-benchmem、-count生成数据,用benchstat对比新旧结果判断性能变化;若性能下降,使用-cpuprofile配合pprof分析热点函数,但profiling仅用于诊断不用于最终指标。

直接用 go test -bench 就能测 CPU 密集型函数的性能,关键是要写对 benchmark 函数、控制变量、理解结果含义。
写一个标准的 Benchmark 函数
函数名必须以 Benchmark 开头,参数类型固定为 *testing.B,内部用 b.N 控制循环次数:
- 不要在循环外做初始化(除非用
b.ResetTimer()排除) - 避免在循环内打印、分配大对象或调用非目标函数
- 如果被测函数有输入,优先复用变量,避免每次循环重新生成
示例:
func BenchmarkFibonacci(b *testing.B) {
for i := 0; i < b.N; i++ {
fibonacci(35) // 纯计算,无副作用
}
}排除干扰,聚焦 CPU 时间
Go 的 go test -bench 默认统计的是“每次操作耗时(ns/op)”,它已自动排除了 setup 和 timer 暂停时间,但你仍需手动干预几处:
立即学习“go语言免费学习笔记(深入)”;
- 用
b.ReportAllocs()查看是否意外分配内存(影响 GC 和缓存) - 用
b.StopTimer()+b.StartTimer()跳过预热或数据准备阶段 - 加
-benchmem参数可同时显示内存分配统计
例如预热后计时:
func BenchmarkHeavyCalc(b *testing.B) {
// 预热:不计入计时
warmup()
b.ResetTimer() // 重置计时器,从这里开始测
for i := 0; i < b.N; i++ {
heavyComputation()
}}
多次运行 + 对比基准,识别真实差异
单次 go test -bench=. 结果可能受系统负载波动影响。可靠做法是:
- 加
-count=5运行 5 次取中位数(Go 1.20+ 默认启用统计稳定性提示) - 用
benchstat工具对比两个版本(如优化前后):
$ go test -bench=BenchmarkFib -count=5 -run=^$ > old.txt $ # 修改代码后 $ go test -bench=BenchmarkFib -count=5 -run=^$ > new.txt $ benchstat old.txt new.txt
输出会明确告诉你性能提升/下降百分比和 p 值是否显著。
结合 pprof 定位热点(进阶)
当 benchmark 显示变慢,但看不出原因时,用 CPU profile 深挖:
- 加
-cpuprofile=cpu.prof生成采样文件 - 用
go tool pprof cpu.prof进入交互式分析 - 常用命令:
top看耗时最多的函数,web生成调用图,list 函数名查具体行
注意:benchmark 中开启 profiling 会引入额外开销,仅用于诊断,不用于最终性能数字。
基本上就这些。不需要第三方库,Go 自带工具链已足够扎实 —— 关键是写干净的 benchmark、跑够次数、比对要严谨。











