Go中错误重试机制采用循环+延迟+错误判断,支持固定次数与间隔或指数退避,首次执行不延迟,失败后休眠再试,达上限返回最终错误。

在 Go 中实现错误重试机制,核心是用循环 + 延迟 + 错误判断,配合最大重试次数和指数退避(或固定间隔)来避免频繁失败请求压垮服务。下面给出简洁、可复用的实现方式。
基础重试:固定次数 + 固定间隔
适用于简单场景,比如调用一个可能短暂超时的 HTTP 接口。
关键点:
- 用 for 循环控制重试次数,每次失败后 sleep 一段时间再重试
- 成功则直接 return;达到最大次数仍失败,返回最终错误
- 注意:不要在重试前 sleep,第一次应立即执行
示例代码:
立即学习“go语言免费学习笔记(深入)”;
func retryFixed(attempt int, delay time.Duration, fn func() error) error {
var err error
for i := 0; i < attempt; i++ {
err = fn()
if err == nil {
return nil
}
if i < attempt-1 { // 最后一次不 sleep
time.Sleep(delay)
}
}
return err
}
// 使用
err := retryFixed(3, 2*time.Second, func() error {
_, err := http.Get("https://www.php.cn/link/46b315dd44d174daf5617e22b3ac94ca")
return err
})
推荐方案:指数退避 + 上限控制
更健壮的做法是让重试间隔随失败次数增长(如 1s → 2s → 4s),并设置最大间隔防止等待过久。
说明:
- 每次重试前计算当前延迟:min(初始间隔 × 2^i, 最大间隔)
- 可加入随机抖动(jitter),避免大量请求在同一时刻重试
- 建议封装成结构体,方便配置和复用
示例:
type RetryConfig struct {
MaxAttempts int
BaseDelay time.Duration
MaxDelay time.Duration
}
func (c RetryConfig) Do(fn func() error) error {
var err error
for i := 0; i < c.MaxAttempts; i++ {
err = fn()
if err == nil {
return nil
}
if i == c.MaxAttempts-1 {
break
}
// 计算退避延迟:base 2^i,但不超过 max
delay := c.BaseDelay time.Duration(1< c.MaxDelay {
delay = c.MaxDelay
}
// 加入 0~100ms 抖动
jitter := time.Duration(rand.Int63n(100)) time.Millisecond
time.Sleep(delay + jitter)
}
return err
}
// 使用
cfg := &RetryConfig{
MaxAttempts: 4,
BaseDelay: 500 time.Millisecond,
MaxDelay: 5 time.Second,
}
err := cfg.Do(someRiskyOperation)
结合 context 实现超时与取消
真实项目中,重试本身不应无限进行。用 context.WithTimeout 或 context.WithCancel 控制整体生命周期更安全。
建议做法:
- 外层传入 context,每次重试前检查是否已取消或超时
- 把重试逻辑放在 select 中,同时监听 context.Done()
- 避免因某次重试阻塞太久而拖慢整个流程
简写示意:
func retryWithContext(ctx context.Context, cfg *RetryConfig, fn func() error) error {
var err error
for i := 0; i < cfg.MaxAttempts; i++ {
select {
case <-ctx.Done():
return ctx.Err()
default:
}
err = fn()
if err == nil {
return nil
}
if i == cfg.MaxAttempts-1 {
break
}
delay := min(cfg.BaseDelay*time.Duration(1<}
实用技巧与注意事项
让重试真正可靠,还需注意这些细节:
-
只重试幂等操作:如 GET、HEAD、PUT(带唯一 ID),避免 POST 重复提交导致数据异常
-
区分错误类型:网络超时、连接拒绝可以重试;400 Bad Request、401 Unauthorized 一般不该重试
-
记录重试日志:至少记录首次失败和最终结果,便于排查问题
-
避免 goroutine 泄漏:使用 time.Timer 而非 time.Sleep 配合 select,确保能响应 cancel










