Go 语言通过 testing 包支持基准测试,使用 go test -bench 可运行并输出原始性能数据;结合 -benchmem、-count、-json 等标志导出结构化数据,再借助 benchstat 或自定义脚本实现统计分析与跨版本对比。

Go 语言自带的 testing 包支持基准测试(benchmark),通过 go test -bench 即可运行并输出原始性能数据。但默认输出较简略,不利于深入分析。要生成结构化、可统计、易对比的基准报告,需结合内置功能与简单工具链。
使用 go test -bench 生成基础基准数据
基准测试函数必须以 Benchmark 开头,接收 *testing.B 参数:
func BenchmarkAdd(b *testing.B) {
for i := 0; i < b.N; i++ {
_ = add(1, 2)
}
}运行命令获取原始结果:
go test -bench=. -benchmem -count=5 > bench-old.txt
-
-bench=.运行所有 Benchmark 函数 -
-benchmem同时记录内存分配统计(allocs/op 和 bytes/op) -
-count=5重复运行 5 次,用于后续计算平均值与标准差
导出为 CSV 或 JSON 方便后续分析
Go 自身不直接输出 CSV,但可通过 -json 标志输出结构化日志(Go 1.21+ 支持完整 benchmark JSON 输出):
立即学习“go语言免费学习笔记(深入)”;
go test -bench=. -benchmem -count=3 -json > bench.json
该 JSON 流每行是一个事件,包含 "Action":"bench" 的条目即为单次基准结果,含字段:Package、Test、Elapsed(秒)、N、MemAllocs、MemBytes 等。
可用简单脚本(如 Python/awk)提取关键指标,例如按测试名聚合平均耗时:
jq -s 'map(select(.Action == "bench")) | group_by(.Test) | map({test: .[0].Test, ns_op: (map(.NsOp) | add / length | floor)})' bench.json使用 benchstat 做跨版本/配置对比分析
benchstat 是 Go 官方推荐的基准对比工具(由 Go 团队维护),能自动计算均值、标准差、显著性差异(p-value)和相对变化:
go install golang.org/x/perf/cmd/benchstat@latest benchstat old.txt new.txt
输出示例:
name old time/op new time/op delta Add-8 2.14ns 1.98ns -7.48% (p=0.002 n=5+5)
- 自动忽略噪声,基于 t-test 判断性能变化是否显著
- 支持多组文件输入,适合 A/B 测试或版本回归比对
- 可加
-geomean计算几何平均,更适用于多 benchmark 综合评分
定制化报告:用 gotestsum + 自定义解析器
若需 HTML 报告、趋势图或集成 CI,可配合 gotestsum 运行测试,并用自定义解析器汇总:
gotestsum --format testname -- -bench=. -benchmem -json | go run parse-bench.go
其中 parse-bench.go 可读取 JSON 流,构建结构体,按需输出 Markdown 表格、Prometheus 指标或写入 SQLite 数据库,便于长期追踪性能走势。










