0

0

如何在Linux中监控心跳 Linux systemd看门狗配置

P粉602998670

P粉602998670

发布时间:2025-08-29 11:36:01

|

972人浏览过

|

来源于php中文网

原创

使用systemd看门狗可实现Linux心跳监控,通过服务定期调用sd_notify("WATCHDOG=1")发送心跳,若在WatchdogSec指定时间内未收到信号,systemd将重启服务;2. 需在代码中集成libsystemd,发送READY和WATCHDOG通知,并在systemd单元文件中配置WatchdogSec、Restart和NotifyAccess;3. 无法修改代码时可用“看门狗伴侣”进程模拟心跳;4. WatchdogSec应略大于实际心跳间隔以避免误触发。

如何在linux中监控心跳 linux systemd看门狗配置

在Linux中监控心跳,你可以使用多种方法,systemd看门狗是一种相对简单且可靠的方案。它允许你在用户空间程序出现问题时,自动重启服务。

解决方案

Systemd看门狗通过预期服务定期调用

sd_notify()
函数来工作。如果systemd在配置的时间间隔内没有收到此信号,它会认为服务已失败并采取配置的操作(通常是重启服务)。

如何配置systemd看门狗

  1. 代码集成:

    首先,你的应用程序需要包含对

    libsystemd
    的调用。这通常涉及包含头文件
    并调用
    sd_notify(0, "READY=1")
    来指示服务已启动完成。然后,定期调用
    sd_notify(0, "WATCHDOG=1")
    以保持看门狗的活跃状态。

    #include 
    #include 
    #include 
    
    int main() {
        // 初始化和启动服务...
    
        sd_notify(0, "READY=1"); // 通知 systemd 服务已准备好
    
        while (1) {
            // 执行服务的主要逻辑...
    
            // 定期发送心跳信号
            sd_notify(0, "WATCHDOG=1");
            sleep(10); // 例如,每10秒发送一次
        }
    
        return 0;
    }
  2. Systemd单元文件配置:

    编辑你的服务的systemd单元文件(通常位于

    /etc/systemd/system/
    目录下,例如
    your_service.service
    ),添加或修改以下选项:

    [Service]
    WatchdogSec=30  ; 设置看门狗超时时间为30秒
    Restart=on-failure ; 服务失败时重启
    NotifyAccess=all ; 允许服务通知systemd
    • WatchdogSec
      :指定systemd在多长时间内没有收到心跳信号时认为服务失败。
    • Restart
      :指定在服务失败时采取的措施。
      on-failure
      是一个常见的选择。
    • NotifyAccess=all
      :允许所有用户访问通知套接字,这对于非root用户运行的服务很重要。
  3. 重新加载Systemd配置并重启服务:

    LobeHub
    LobeHub

    LobeChat brings you the best user experience of ChatGPT, OLLaMA, Gemini, Claude

    下载
    sudo systemctl daemon-reload
    sudo systemctl restart your_service.service

如何确定看门狗是否正常工作?

你可以通过查看systemd日志来确认看门狗是否正常工作。使用

journalctl -u your_service.service
命令,你应该能看到周期性的 "WATCHDOG=1" 日志消息。如果服务崩溃或停止发送心跳,你应该会看到 systemd 尝试重启服务的日志。

Systemd看门狗与其他监控方案相比有什么优势?

Systemd看门狗与传统的监控脚本相比,优势在于它与systemd紧密集成,配置简单,并且能够提供更快的故障检测和恢复。传统的监控脚本可能需要更复杂的配置和维护,并且可能无法像systemd那样快速地响应服务故障。此外,systemd看门狗可以利用 systemd 的依赖关系管理,确保在服务重启之前,所有必要的依赖项都已启动。

如果我的服务无法修改代码,如何使用systemd看门狗?

如果无法修改服务的源代码来集成

sd_notify()
,你可以使用一个“看门狗伴侣”进程。这个进程可以定期检查服务的状态(例如,通过检查进程是否存在、监听端口等),并在服务无响应时调用
sd_notify()
。然后,将这个伴侣进程配置为systemd服务,并使用
WatchdogSec
Restart
选项来监控主服务。

如何调整WatchdogSec的值?

WatchdogSec
的值应该根据你的服务的正常运行情况进行调整。设置得太短可能会导致误报,而设置得太长可能会延迟故障检测。一个好的经验法则是将
WatchdogSec
设置为比服务正常心跳间隔稍长的时间,以允许一些波动。例如,如果你的服务每 10 秒发送一次心跳,你可以将
WatchdogSec
设置为 30 秒。

相关专题

更多
磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1350

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

704

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

776

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

573

2023.07.06

linux查看文件夹大小
linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统,存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.07.20

linux查看ip命令
linux查看ip命令

本专题为大家提供linux查看ip命令相关文章内容,感兴趣的朋友可以免费下载体验试试。

297

2023.07.20

linux查看cpu使用率
linux查看cpu使用率

在linux的系统维护中,可能需要经常查看cpu使用率,分析系统整体的运行情况。本专题为大家带来了linux查看cpu使用率的相关文章,感兴趣的朋友千万不要错过了。

381

2023.07.25

Java编译相关教程合集
Java编译相关教程合集

本专题整合了Java编译相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.21

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号