0

0

Linux Node Problem Detector 的自定义问题检测插件

冰川箭仙

冰川箭仙

发布时间:2026-02-27 17:34:02

|

526人浏览过

|

来源于php中文网

原创

lnpd自定义检测插件需满足:文件置于plugins/目录、命名合法、默认导出含name/run/intervalseconds的对象;run()须返回promise且仅error/warning级problems转为nodecondition;不支持热更新,须重启lnpd生效。

linux node problem detector 的自定义问题检测插件

怎么写一个能被 LNPD 加载的自定义检测插件

LNPD 不会自动扫描任意 JS 文件,它只认 plugins/ 目录下符合命名和导出规范的模块。你写的插件必须导出一个带特定字段的对象,否则启动时直接忽略,连日志都不会打。

实操建议:

  • 插件文件必须放在 /var/lib/node-problem-detector/plugins/(或你启动 LNPD 时用 --plugin-dir 指定的路径)
  • 文件名必须匹配 xxx.jsxxx.mjs,且不能以 ._ 开头
  • 必须默认导出一个对象,含 name(字符串)、run(函数)、intervalSeconds(数字)三个字段
  • run() 必须返回一个 Promise,resolve 值为 {problems: []} 格式,problems 是数组,每个元素至少有 severityproblem

常见错误现象:LNPD 启动没报错,但你的插件完全没运行痕迹——大概率是导出结构不对,或者文件没放对位置。

run() 函数里该查什么、怎么查才不拖垮节点

LNPD 运行在宿主机上,所有检测逻辑都跑在 Node.js 进程里,run() 执行期间会阻塞整个插件轮询周期。别在里面做同步文件遍历、无超时 HTTP 请求或 execSync 调用。

实操建议:

  • 优先读取 /proc/sys 下的瞬时状态,比如检查 /proc/sys/net/ipv4/ip_forward 是否为 0
  • 调用系统命令必须用 execFile + timeout 选项,例如 execFile('ss', ['-tuln'], { timeout: 2000 })
  • 避免重复解析大文件,比如检查 /var/log/messages 时,用 tail -n 100 配合流式处理,而不是 fs.readFileSync
  • 如果要聚合指标(如 CPU 使用率),直接读 /proc/stat 算差值,别依赖 os.loadavg() —— 它不反映容器内真实压力

性能影响:一个耗时 800ms 的 run()intervalSeconds: 30 下看似没事,但若同时启用 5 个插件,就可能造成轮询堆积,导致问题上报延迟。

Humata
Humata

Humata是用于文件的ChatGPT。对你的数据提出问题,并获得由AI提供的即时答案。

下载

上报的问题为什么没出现在 kubectl describe node 的 Events 里

LNPD 只把 severity"error""warning" 的条目转成 NodeCondition,其它一律丢弃。而且 Condition 名称必须合法:只能含小写字母、数字、-,且以字母开头,长度 ≤ 253 字符。

实操建议:

  • problems 数组中每个对象必须有 problem(字符串,即 Condition 名)和 severity"error" / "warning"
  • 不要用空格或下划线命名 problem,比如 "disk full""disk_full" 都非法,得写成 "disk-full"
  • 如果想附带详情,加 detail 字段(字符串),LNPD 会把它塞进 NodeCondition 的 message
  • 确认 LNPD 启动参数含 --enable-node-condition=true,否则即使格式全对,也不生成 Condition

常见错误现象:kubectl get node <node> -o wide</node> 看不到新 Condition,但 journalctl -u node-problem-detector 显示插件执行成功——八成是 severity 写成了 "info"problem 命名不合规。

插件热更新是否可行、有哪些限制

LNPD 不支持运行时重载插件。修改 JS 文件后,必须重启 LNPD 进程才能生效。但它会在每次轮询前重新 require() 插件模块,所以如果你只是改了 run() 内部逻辑(没改导出结构),重启后就能用新逻辑。

实操建议:

  • 开发阶段用 systemctl restart node-problem-detector 最稳妥;别指望 touch 文件触发重载
  • 不要在插件里缓存全局状态(比如用闭包变量记上次检查结果),因为每次 require() 都是全新模块实例
  • 如果需要跨次运行的状态(如上次检查时间戳),必须写到磁盘(/var/lib/node-problem-detector/state/)或读取 /proc 等动态源
  • 注意文件权限:LNPD 默认以 node-problem-detector 用户运行,插件文件需对该用户可读

容易被忽略的地方:插件代码里用 console.log 输出的内容,默认不会进 journal 日志——得用 process.stderr.write() 或配置 LNPD 的 --logtostderr 才能看到调试信息。

相关文章

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
require的用法
require的用法

require的用法有引入模块、导入类或方法、执行特定任务。想了解更多require的相关内容,可以阅读本专题下面的文章。

504

2023.11.27

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

391

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

348

2023.10.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

638

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

218

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1560

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

643

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1067

2024.03.22

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

2

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.8万人学习

Git 教程
Git 教程

共21课时 | 3.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号