0

0

Linux 日志告警规则设计案例

舞夢輝影

舞夢輝影

发布时间:2026-02-15 14:57:09

|

622人浏览过

|

来源于php中文网

原创

必须用 rsyslog 模板输出标准 json 日志,显式指定 timestamp 格式为 rfc3339,模板语法分号不可误写为冒号,再配合 kibana 告警配置、promql 合理聚合及 elastalert 超时与字段类型校验,才能确保日志采集、解析与告警全链路准确生效。

linux 日志告警规则设计案例

用 rsyslog 模板打结构化日志,不然 Logstash 会漏字段

Logstash 的 grok 解析不是万能的,尤其遇到多行日志、时间戳格式混乱或字段缺失时,message 里只剩一串乱码,告警规则根本匹配不上。真正省事的做法,是在源头就让 rsyslog 输出标准 JSON —— 不依赖应用改代码,也不靠 Logstash 猜。

  • 必须在 /etc/rsyslog.conf 末尾加 template,且 property(name="timestamp" dateFormat="rfc3339") 要显式指定,否则 Kibana 时间轴全错位
  • *.* @127.0.0.1:5044;json-template 中的分号不能写成冒号,否则 rsyslog 启动失败但不报错,日志静默丢弃
  • 测试是否生效:用 logger "test error" 发一条日志,然后 tcpdump -i lo port 5044 -A 抓包,看到的是带 "level":"ERR" 的 JSON 才算成功

在 Kibana 里设告警,别只填“ERROR”就完事

Kibana 的 Log threshold 类型看着简单,但默认过滤器对大小写敏感、不支持通配符嵌套,message: "*Connection refused*" 实际上不会命中 "Connection refused (111)" 这类带括号的日志——因为 * 在 KQL 里只匹配单词边界,不是 shell 风格通配。

  • 正确写法是用 message: "Connection refused"(去掉星号),再配合 message: "timeout" 单独加条件,用 OR 连接
  • Time range 设为 Last 10 minutes 时,实际窗口是动态滑动的,如果采集延迟 >30s,可能漏掉刚写入但还没进 ES 的日志,建议同步检查 logstash@timestampevent.ingested 差值
  • 触发条件选 Count of documents > 5 是合理起点,但若某服务每分钟固定打 3 条 ERROR,这个阈值就形同虚设;应先查历史 count by hour 分布,再定基线

用 PromQL 告警网络流出异常,irate()rate() 别混用

监控 node_network_transmit_bytes_total 时,直接用 rate() 算 1 分钟平均,会把突发流量平滑掉;而用 irate() 又容易被单次抖动误触发。真实场景中,“流出速率过高”要的是持续压力,不是毛刺。

Sunshine Office Anywhere(CRM集成版)[OA+CRM]
Sunshine Office Anywhere(CRM集成版)[OA+CRM]

CRM集成版基本功能:    内部邮件,短信息,个人文件柜,日程安排,名片录,网络硬盘,个人网址收藏,个人使用情况统计分析。    新闻管理,公告管理,日程安排查询,工作日志查询,公共网址管理,人事档案管理,组织机构信息查询。     企业文档管理,规章制度,电子刊物。    人力资源管理,档案管理,培训管理,奖惩管理,招聘信息,劳动合同    系统单位信息管理,部门信息管理,用户管理,用户角色设

下载
  • 推荐组合:avg_over_time(irate(node_network_transmit_bytes_total{device=~"eth[0-9]+"}[2m])[5m:1m]) —— 先用 irate 提取每 1 分钟内的瞬时速率,再用 avg_over_time 取过去 5 分钟的均值,抗干扰强
  • device!~'lo|docker|veth' 这类过滤必须写全,漏掉 vnetbr- 会导致虚拟网桥流量计入,误判宿主机出口带宽
  • 单位换算别硬编码:告警表达式里用 /1024/1024 得到 MB/s,但 description 模板里写 {{ $value | humanize}} MB/s 更稳妥,避免小数点后一堆 0

ElastAlert 规则里写 num_events,得先确认 ES 查询没超时

ElastAlert 默认用 query_key + timeframe 做聚合统计,但如果索引量大、字段没建 keyword 类型、或者 ES 查询超时(默认 10s),它会安静地返回空结果,然后规则永远不触发——连错误日志都不打。

  • 务必在 elastalert.yaml 里显式设 es_timeout: 30,并检查对应索引的 message 字段 mapping 是 text 还是 keyword;模糊匹配要用 text,聚合统计必须用 keyword
  • num_events: 3 表示 5 分钟内出现 3 次,但若日志里 hostname 字段为空,query_key: hostname 就会把所有主机日志聚成一组,导致误报;建议加 filter 强制 hostname: "*"
  • 调试时别只看 elastalert --debug,要同时开 curl -XGET 'http://es:9200/_nodes/stats/indices/search?pretty',确认 query_time_in_millis 是否接近 timeout 值

最常被跳过的环节是时间字段对齐:rsyslog 里的 timestamp、Logstash 的 @timestamp、ES 索引的 event.ingested、Kibana 告警的时间窗口——这四个时间源只要差超过 1 分钟,规则就可能失效。别假设它们天然一致。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

441

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

544

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

321

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

199

2023.11.20

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

452

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

181

2023.10.30

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

351

2023.10.18

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

145

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.1万人学习

Git 教程
Git 教程

共21课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号