Spring Boot 3.x 全面集成 OpenTelemetry 与 Micrometer 2,启用原生可观测性:默认 OpenMetrics 格式指标、自动 trace/span ID 结构化日志、snake_case 语义化指标命名及日志-指标联动告警。

Spring Boot 3.x 起全面拥抱 Micrometer 2.x 和 OpenTelemetry 生态,原生监控(如 Actuator 的 /metrics)默认迁移至 OpenMetrics 格式,日志系统也深度集成结构化日志与上下文传播能力。关键不是“怎么加依赖”,而是理解新旧范式的差异点和最佳实践路径。
启用 OpenTelemetry 原生可观测性
Spring Boot 3.1+ 内置对 OpenTelemetry 的自动配置支持,无需手动引入 OpenTelemetry SDK:
- 添加
spring-boot-starter-actuator和micrometer-tracing-bridge-otel(用于分布式追踪) - 在
application.yml中开启导出器(如 Jaeger、Zipkin 或 OTLP):management: otel: metrics: export: prometheus: enabled: true tracing: sampling: probability: 1.0 endpoints: web: exposure: include: health,info,metrics,threaddump,loggers,otel - 访问
/actuator/otel可查看当前 trace 配置;/actuator/metrics返回 OpenMetrics 兼容格式(含# TYPE注释行)
结构化日志 + MDC 上下文自动注入
Spring Boot 3 默认使用 Logback 1.4+,支持 logback-access 和 logback-opentelemetry 插件,实现 traceId、spanId、service.name 自动写入日志字段:
- 确保
logback-spring.xml中启用OTELLogbackAppender(需引入io.opentelemetry.instrumentation:opentelemetry-logback-1.4) - 日志输出自动包含:
trace_id="a1b2c3..." span_id="d4e5f6..." service.name="my-app" - MDC 中的 key(如
user_id,request_id)仍可手动设置,且会与 trace 上下文共存,不冲突
自定义指标 + 语义化命名规范
Micrometer 2 强制要求指标名遵循 snake_case,并推荐用 base unit(如 seconds, bytes)而非缩写:
立即学习“Java免费学习笔记(深入)”;
- 避免:
httpReqTimeMs→ 改为:http.server.request.duration(单位:秒,默认带unit=secondstag) - 用
Timer记录耗时,Counter记录次数,Gauge记录瞬时值,优先复用 Micrometer 提供的ObservationAPI: @Service public class OrderService { private final ObservationRegistry registry;public OrderService(ObservationRegistry registry) { this.registry = registry; }public void placeOrder(Order order) { Observation.createNotStarted("order.place", registry) .lowCardinalityKeyValue("status", "pending") .observe(() -> { / 业务逻辑 / }); } }
日志与指标联动:通过 Logback 过滤器触发告警指标
利用 Logback 的 EvaluatorFilter 捕获 ERROR 级别日志,并同步更新 Micrometer Counter:
- 定义一个
LoggingErrorCounterBean,暴露errorCountCounter - 在
logback-spring.xml中配置 evaluator:return level == Level.ERROR; ACCEPT - 配合自定义 Appender,在
doAppend()中调用errorCount.increment()
不复杂但容易忽略:新版可观测性不是堆功能,而是统一语义、自动上下文、按规范暴露。从 Actuator endpoint 开始验证,再逐步接入日志结构化和自定义观测点,就能稳住生产环境的诊断能力。









