需用 go 函数包装汇编实现并加 //go:linkname 绑定,go test -bench=. 时启用 -gcflags="-l" 防内联,严格遵循 go 调用约定与栈帧声明,注意构建约束、符号命名及 gc 干扰。

怎么用 go test 测自定义汇编函数的耗时
不能直接对 asm 函数写 BenchmarkXXX,Go 的测试框架不识别裸汇编符号——它只认 Go 函数签名。你得包一层 Go 函数,让它调用汇编实现。
- 在
.s文件里定义的汇编函数(比如funcAdd),必须在 Go 文件中声明为func funcAdd(a, b int) int,且加//go:linkname或确保符号名匹配(推荐用//go:linkname显式绑定) -
Benchmark函数里调用的是这个 Go 签名函数,不是直接跳转到汇编标签 - 别忘了
go test -bench=.要加-gcflags="-l"防内联——否则编译器可能把那层 Go 包装干掉,测的就不是真实汇编路径了
汇编函数参数/返回值怎么和 Go 对齐
错位会导致栈混乱、随机崩溃或返回垃圾值。Go 的调用约定(amd64 上)是寄存器传参 + 栈补位,不是传统 C ABI。
- 前 8 个整数/指针参数走
AX,BX,CX,DX,R8,R9,R10,R11;浮点用X0–X7 - 返回值写入
AX(int)、AX+DX(两个 word 返回值),不能漏清寄存器(比如用完R12没恢复) - 函数开头必须写
TEXT ·funcAdd(SB), NOSPLIT, $0-24:其中$0-24表示栈帧大小(0 字节局部变量,24 字节参数+返回值空间:两个int入参 + 一个int返回 = 3×8 = 24) - 常见错误:
$0-16写成$0-8,导致返回值覆盖入参,压测时结果忽大忽小
为什么 go tool asm 报 undefined symbol
不是语法错,是链接阶段找不到符号——Go 编译器生成的目标文件和你的 .s 文件没正确关联。
- 汇编文件名必须和 Go 文件包名一致(如
math_amd64.s对应package math),且放在同一目录 - 函数名前缀必须带包名和点号:
TEXT ·addInts(SB),不是TEXT addInts(SB);少那个·就算定义了也链接不上 - 如果用了
//go:linkname,右边符号名要和.s里TEXT后完全一致(包括大小写和 Unicode 点号),例如//go:linkname addInts math·addInts - 交叉编译时注意:
GOARCH=arm64 go test不会编译amd64.s,得配//go:build amd64构建约束
性能数据不准?小心编译器优化和基准干扰
汇编代码看似“绕过 Go”,但周边环境仍受 Go 运行时影响:GC、调度、内存对齐、CPU 频率波动都会污染结果。
立即学习“go语言免费学习笔记(深入)”;
- 用
b.ResetTimer()放在热身循环之后、正式计时之前,避免把初始化开销算进去 - 别用
runtime.GC()强制触发 GC——它会停顿整个 P,让Benchmark时间暴涨且不可复现;改用debug.SetGCPercent(-1)临时禁用 GC - 单次运行波动大?加
-benchtime=5s -count=5多轮取平均,看标准差;超过 5% 就得查是不是有 cache line 伪共享或 TLB miss - 最易忽略的一点:汇编函数若操作全局变量或堆内存,实际测的是内存子系统性能,不是纯计算吞吐——这种时候应该用
unsafe手动分配对齐内存块做隔离











