必须用 go build -gcflags="-l -n" 重新构建二进制,否则火焰图只显示0x41a2c8等地址而无函数名;-l禁用内联、-n禁用优化以保留栈帧和符号信息。

火焰图里全是0x41a2c8这类地址,根本看不到函数名
这是最常卡住人的一步:图生成了,但横轴上全是十六进制地址,top命令也只显示runtime.mallocgc或???——说明编译时帧指针和符号被优化掉了。
- 必须用
go build -gcflags="-l -N" -ldflags="-s -w"重新构建二进制,-l禁用内联,-N禁用优化,否则栈帧无法回溯 -
go run main.go直接运行无效:临时二进制不带完整符号表,pprof 解析失败 - Docker 环境下要确认容器暴露了
:6060端口,且宿主机能curl http://localhost:6060/debug/pprof/返回 HTML 页面 - 线上服务上线前务必验证:
go tool pprof http://your-service:6060/debug/pprof/profile?seconds=5,看输出是否含有效函数名(如http.HandlerFunc、json.Marshal)
采集30秒后火焰图一片空白,或只有 runtime 函数
不是没热点,是没触发到——采样期间程序根本没执行你怀疑的那段逻辑。
- 确保压测流量真实打到目标 handler:比如用
ab -n 1000 -c 100 http://localhost:8080/api/v1/user,而不是只 curl 根路径 - CPU profile 默认采样频率是 100Hz(每10ms一次),低频操作或偶发慢请求容易漏掉;对间歇性问题,建议延长至
?seconds=60 - 避免在空循环或 sleep 中采样:
for {}会把所有时间归到runtime.futex,看不出业务逻辑 - 如果服务刚启动就采集,GC 还没跑几次,堆 profile 可能无意义;等 RSS 稳定后再抓
/debug/pprof/heap?gc=1
火焰图顶部宽条是 regexp.MatchString,但代码里只用了两次
宽度反映的是“CPU 时间占比”,不是调用次数。哪怕只调用两次,只要每次耗时长(比如正则回溯爆炸),它照样占满半张图。
- 检查是否在日志、中间件、路由匹配中隐式用了未编译的正则:
regexp.Compile(".*"+userID)每次都重编译,开销极大 - 替换方案:
strings.HasPrefix或预编译复用var routeRE = regexp.MustCompile(`^/api/v1/(users|posts)/`) - 若必须动态正则,加缓存:
sync.Map存userID → *regexp.Regexp,避免重复编译 - 注意
regexp.MatchString是全局匹配,比FindString更重;确认是否真需要“全字符串匹配”语义
web 命令打不开图,或提示 graphviz missing
go tool pprof -http=:8080 依赖本地 Graphviz 渲染 SVG,不是浏览器问题。
立即学习“go语言免费学习笔记(深入)”;
- macOS:
brew install graphviz;Ubuntu/Debian:sudo apt install graphviz;CentOS:yum install graphviz - 别用
pprof web命令——它生成的是静态调用树(callgraph),不是火焰图;火焰图必须用-http=:8080启服务后点网页里的 “Flame Graph” 标签 - 如果报错
failed to execute dot,说明dot命令不在 PATH,可手动指定:go tool pprof -http=:8080 -dotpath /opt/homebrew/bin/dot ... - 离线环境无法装 graphviz?改用文本分析:
top20+list your_hot_function查具体哪几行耗时高
-N -l 重编译,也别对着一屏 0x41a2c8 猜半天。线上服务尤其要提前验证 pprof 接口返回的 profile 是否含 symbol —— 这步跳过,后面所有分析都是空中楼阁。











