配置失败任务记录并启用数据库或Redis驱动,生成failed_jobs表;任务失败时自动记录,可在failed()方法中定义日志、通知等处理逻辑;通过Artisan命令查看、重试、清除失败任务;建议结合Sentry、Slack通知或Prometheus+Grafana实现监控告警,提升系统稳定性。

在 Laravel 应用中,队列系统是处理耗时任务的核心机制之一。但任务执行过程中难免会失败,如何有效监控和管理这些失败任务,是保障系统稳定运行的关键。
配置失败任务记录
Laravel 提供了内置的失败任务处理机制,只需简单配置即可启用。
确保 config/queue.php 中的 failed 配置项正确设置:
- driver 可选 database 或 redis
- 若使用数据库,需创建 failed_jobs 表
运行以下命令生成迁移并创建表:
php artisan queue:failed-tablephp artisan migrate
捕获与记录失败任务
当任务抛出未捕获异常时,Laravel 自动将其记录到失败队列表中。
你可以在任务类中定义 failed() 方法,用于执行自定义逻辑:
public function failed($exception){
// 发送通知、记录日志或调用监控服务
Log::error('Queue task failed: ' . $exception->getMessage());
}
查看与重试失败任务
Laravel 提供了 Artisan 命令来管理失败任务。
- php artisan queue:failed:列出所有失败任务
- php artisan queue:retry {id}:重试指定任务
- php artisan queue:forget {id}:从失败列表中移除
- php artisan queue:flush:清空所有失败记录
支持批量重试,例如:php artisan queue:retry all
集成监控与告警
仅靠本地记录不足以应对生产环境问题,建议结合外部监控工具。
常见做法包括:
- 在 failed() 方法中发送通知到 Slack、钉钉或企业微信
- 接入 Sentry、Ray 或 Telescope 实时追踪异常
- 通过 Prometheus + Grafana 搭建可视化监控面板
例如使用 Laravel 通知系统发送失败提醒:
Notification::route('slack', env('SLACK_WEBHOOK_URL'))->notify(new QueueTaskFailed($this, $exception));
基本上就这些。合理配置失败队列,结合日志与告警,能大幅提升系统的可观测性和稳定性。关键是及时发现、快速响应,避免小问题演变成大故障。










