python中异常告警需在逃逸前转为可路由事件,统一入口设于框架钩子或sys.excepthook;用logging+filter分级提级高危异常至critical并交由专用handler处理;sentry需手动capture_exception且注意异步配置;装饰器适用于关键函数但须避免耗时操作与上下文缺失。

Python 里怎么让异常自动发告警,而不是只打印 traceback
关键不是“捕获异常”,而是“在异常逃逸出关键函数前,把它转成可路由的事件”。try/except 本身不带告警能力,得靠中间层把异常对象、上下文、触发点打包成结构化数据,再交给通知模块(比如邮件、钉钉、Sentry)。
常见错误是直接在 except 块里写 send_alert(),结果告警被异常吞掉,或者重复发送——比如上层又套了一层 try,底层已处理过,上层再捕获就冗余了。
- 告警入口统一放在应用最外层的生命周期钩子处,比如 Flask 的
app.errorhandler、FastAPI 的exception_handler、或主程序的sys.excepthook覆盖 - 避免在业务逻辑层用裸
except Exception:发告警;它会掩盖类型判断,也容易漏掉SystemExit、KeyboardInterrupt这类非错误异常 - 必须提取
traceback.format_exc()或traceback.format_exception()的完整字符串,不能只取str(e)——后者丢掉堆栈和位置信息,根本没法定位
用 logging + Filter 实现分级告警的实操要点
Python 标准 logging 模块本身不发告警,但配合自定义 Filter 和 Handler,能精准控制“哪些异常该升为告警”。核心是把异常日志级别从 ERROR 动态提级到 CRITICAL,再由对应 Handler 处理。
典型场景:数据库连接失败要立刻告警,但用户输入格式错误只需记 ERROR 日志,不打扰运维。
立即学习“Python免费学习笔记(深入)”;
系统简介:冰兔BToo网店系统采用高端技术架构,具备超强负载能力,极速数据处理能力、高效灵活、安全稳定;模板设计制作简单、灵活、多元;系统功能十分全面,商品、会员、订单管理功能异常丰富。秒杀、团购、优惠、现金、卡券、打折等促销模式十分全面;更为人性化的商品订单管理,融合了多种控制和独特地管理机制;两大模块无限级别的会员管理系统结合积分机制、实现有效的推广获得更多的盈利!本次更新说明:1. 增加了新
- 写一个继承
logging.Filter的类,在filter()方法里检查record.exc_info是否存在,再匹配record.exc_info[0](即异常类型)是否属于预设的高危类,如ConnectionError、TimeoutError - 不要给
RotatingFileHandler加这个 Filter——它只负责落盘;专配一个HTTPHandler或自定义钉钉 Handler,只接收被 Filter 放行的CRITICAL记录 - 注意
logging.getLogger().addFilter()是全局生效的,若多模块有不同告警策略,得按 logger 名(如logging.getLogger("db"))分别加 Filter
第三方库 Sentry 的异常采集为什么有时收不到
Sentry 不是“装上就告警”,它默认只上报未被处理的异常(unhandled exception)。一旦你写了 try/except 却没显式调用 sentry_sdk.capture_exception(),它就静默忽略。
常见错误现象:Sentry.init() 后照样收不到告警,查日志发现全是 “event dropped due to filtering”。
- 确认是否启用了
auto_enabling_integrations=True(默认 True),否则logging、stdlib等集成不会自动挂载 - 在
except块里手动上报时,别只传e,要用sentry_sdk.capture_exception(e)——传字符串或str(e)不会带堆栈 - 如果用了异步框架(如 FastAPI + Uvicorn),需额外设置
enable_tracing=True并配traces_sample_rate,否则事务链路断开,异常上下文丢失
自定义装饰器做轻量告警的边界在哪
对单个函数加告警,用装饰器最直接,但容易误判“什么算异常”。它适合明确知道失败后果严重的函数,比如支付回调、定时任务主逻辑;不适合通用工具函数或频繁调用的底层方法。
性能影响常被忽略:每次调用都进装饰器、构造上下文、判断是否告警,比裸函数慢 2–5 倍(取决于是否序列化局部变量)。
- 装饰器内别做耗时操作,如发 HTTP 请求、读配置文件;只负责收集
sys.exc_info()、打标记,把实际通知逻辑扔给线程池或队列 - 用
functools.wraps(func)保持原函数签名,否则 IDE 提示和类型检查会失效 - 支持排除特定异常类型:比如
@alert_on_failure(exclude=(ValueError, ValidationError)),避免把校验失败当事故
真正难的是上下文完整性——装饰器拿不到调用栈外的 request ID、用户 ID、订单号。这些得靠 contextvars 或中间件提前注入,否则告警来了也不知道是谁触发的。









