HTTP客户端默认不重试,需手动实现;最稳妥方式是包装http.Transport,在RoundTrip中捕获net.OpError、net/url.Error、5xx状态码等错误并重试,GET可安全重试,POST需确保Body可重放且服务端支持幂等性。

HTTP客户端默认不重试,必须手动实现
Go 的 http.Client 在遇到网络错误(如连接超时、DNS失败)或服务端返回 5xx 时,不会自动重试。它只在极少数底层 TCP 错误(如 net/http: request canceled)下可能重发,但不可控、不透明,也不覆盖常见失败场景。你看到的“请求似乎重试了”,大概率是上层逻辑或代理行为,不是 http.Client 本身。
用 http.Client + 自定义 RoundTripper 实现可控重试
最稳妥的方式是包装 http.Transport,在 RoundTrip 方法中捕获错误并决定是否重试。这样能精确控制重试条件、次数、间隔和退避策略,且不影响请求构造逻辑。
常见需重试的错误类型包括:
-
net.OpError(连接拒绝、超时、无路由) -
net/url.Error(DNS 解析失败) -
context.DeadlineExceeded或context.Canceled(仅当原始 context 允许重试时) - HTTP 状态码
5xx(尤其是502、503、504)
注意:4xx 错误(如 400、401、404)通常代表客户端问题,不应重试;GET 请求可安全重试,POST 等非幂等方法需谨慎——除非服务端明确支持幂等性(如带 Idempotency-Key 头)。
立即学习“go语言免费学习笔记(深入)”;
简单可靠:用 backoff 库避免手写退避逻辑
自己实现指数退避(exponential backoff)容易出错:忘记 jitter、没处理并发竞争、忽略最大重试时间等。直接用社区验证过的 github.com/cenkalti/backoff/v4 更省心。
关键配置点:
-
MaxRetries:建议设为3~5,再高意义不大,反而拖长失败感知时间 -
InitialInterval:从100ms起步较合理,太短易打爆下游,太长影响恢复速度 -
MaxInterval:限制单次最大等待,避免退避失控(例如设为2s) - 对
POST请求,务必检查req.Body是否可重放——bytes.Reader或strings.Reader可以,但os.File或未缓存的流不行
import (
"io"
"net/http"
"time"
"github.com/cenkalti/backoff/v4"
)
func retryableRoundTripper(base http.RoundTripper) http.RoundTripper {
return &retryTransport{
base: base,
}
}
type retryTransport struct {
base http.RoundTripper
}
func (r retryTransport) RoundTrip(req http.Request) (http.Response, error) {
var resp http.Response
var err error
b := backoff.NewExponentialBackOff()
b.MaxRetries = 3
b.InitialInterval = 100 * time.Millisecond
b.MaxInterval = 2 * time.Second
err = backoff.Retry(func() error {
resp, err = r.base.RoundTrip(req)
if err != nil {
// 网络层错误,重试
return err
}
// 服务端错误且为 5xx,重试
if resp.StatusCode >= 500 && resp.StatusCode < 600 {
// 必须关闭 resp.Body,否则连接无法复用
io.Copy(io.Discard, resp.Body)
resp.Body.Close()
return backoff.Permanent(fmt.Errorf("server error: %d", resp.StatusCode))
}
return nil
}, b)
return resp, err}
别忽略 Body 读取和连接复用的影响
这是最容易踩的坑:重试前没读完原响应的 Body,会导致底层 TCP 连接被挂起,后续请求卡住;或者重试时没重置 req.Body,导致第二次发送空体。
实操要点:
- 每次重试前,若已有
resp,必须调用io.Copy(io.Discard, resp.Body)+resp.Body.Close() - 对可重放的请求体(如
bytes.Buffer),在每次RoundTrip前调用req.GetBody()重建;若没有GetBody,需提前缓存 - 确保
http.Transport的MaxIdleConns和MaxIdleConnsPerHost足够,否则重试会新建大量连接
重试不是万能解药。真实系统里,要结合熔断(circuit breaker)、降级(fallback)和可观测性(记录重试次数、耗时、失败原因)一起用,否则只是把问题延迟暴露。










