0

0

如何在Linux中监控心跳 Linux systemd看门狗配置

P粉602998670

P粉602998670

发布时间:2025-08-29 11:36:01

|

972人浏览过

|

来源于php中文网

原创

使用systemd看门狗可实现Linux心跳监控,通过服务定期调用sd_notify("WATCHDOG=1")发送心跳,若在WatchdogSec指定时间内未收到信号,systemd将重启服务;2. 需在代码中集成libsystemd,发送READY和WATCHDOG通知,并在systemd单元文件中配置WatchdogSec、Restart和NotifyAccess;3. 无法修改代码时可用“看门狗伴侣”进程模拟心跳;4. WatchdogSec应略大于实际心跳间隔以避免误触发。

如何在linux中监控心跳 linux systemd看门狗配置

在Linux中监控心跳,你可以使用多种方法,systemd看门狗是一种相对简单且可靠的方案。它允许你在用户空间程序出现问题时,自动重启服务。

解决方案

Systemd看门狗通过预期服务定期调用

sd_notify()
函数来工作。如果systemd在配置的时间间隔内没有收到此信号,它会认为服务已失败并采取配置的操作(通常是重启服务)。

如何配置systemd看门狗

  1. 代码集成:

    首先,你的应用程序需要包含对

    libsystemd
    的调用。这通常涉及包含头文件
    <systemd/sd-daemon.h>
    并调用
    sd_notify(0, "READY=1")
    来指示服务已启动完成。然后,定期调用
    sd_notify(0, "WATCHDOG=1")
    以保持看门狗的活跃状态。

    #include <systemd/sd-daemon.h>
    #include <stdio.h>
    #include <unistd.h>
    
    int main() {
        // 初始化和启动服务...
    
        sd_notify(0, "READY=1"); // 通知 systemd 服务已准备好
    
        while (1) {
            // 执行服务的主要逻辑...
    
            // 定期发送心跳信号
            sd_notify(0, "WATCHDOG=1");
            sleep(10); // 例如,每10秒发送一次
        }
    
        return 0;
    }
  2. Systemd单元文件配置:

    编辑你的服务的systemd单元文件(通常位于

    /etc/systemd/system/
    目录下,例如
    your_service.service
    ),添加或修改以下选项:

    [Service]
    WatchdogSec=30  ; 设置看门狗超时时间为30秒
    Restart=on-failure ; 服务失败时重启
    NotifyAccess=all ; 允许服务通知systemd
    • WatchdogSec
      :指定systemd在多长时间内没有收到心跳信号时认为服务失败。
    • Restart
      :指定在服务失败时采取的措施。
      on-failure
      是一个常见的选择。
    • NotifyAccess=all
      :允许所有用户访问通知套接字,这对于非root用户运行的服务很重要。
  3. 重新加载Systemd配置并重启服务:

    AssemblyAI
    AssemblyAI

    转录和理解语音的AI模型

    下载
    sudo systemctl daemon-reload
    sudo systemctl restart your_service.service

如何确定看门狗是否正常工作?

你可以通过查看systemd日志来确认看门狗是否正常工作。使用

journalctl -u your_service.service
命令,你应该能看到周期性的 "WATCHDOG=1" 日志消息。如果服务崩溃或停止发送心跳,你应该会看到 systemd 尝试重启服务的日志。

Systemd看门狗与其他监控方案相比有什么优势?

Systemd看门狗与传统的监控脚本相比,优势在于它与systemd紧密集成,配置简单,并且能够提供更快的故障检测和恢复。传统的监控脚本可能需要更复杂的配置和维护,并且可能无法像systemd那样快速地响应服务故障。此外,systemd看门狗可以利用 systemd 的依赖关系管理,确保在服务重启之前,所有必要的依赖项都已启动。

如果我的服务无法修改代码,如何使用systemd看门狗?

如果无法修改服务的源代码来集成

sd_notify()
,你可以使用一个“看门狗伴侣”进程。这个进程可以定期检查服务的状态(例如,通过检查进程是否存在、监听端口等),并在服务无响应时调用
sd_notify()
。然后,将这个伴侣进程配置为systemd服务,并使用
WatchdogSec
Restart
选项来监控主服务。

如何调整WatchdogSec的值?

WatchdogSec
的值应该根据你的服务的正常运行情况进行调整。设置得太短可能会导致误报,而设置得太长可能会延迟故障检测。一个好的经验法则是将
WatchdogSec
设置为比服务正常心跳间隔稍长的时间,以允许一些波动。例如,如果你的服务每 10 秒发送一次心跳,你可以将
WatchdogSec
设置为 30 秒。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

801

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

588

2023.07.06

linux查看文件夹大小
linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统,存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

570

2023.07.20

linux查看ip命令
linux查看ip命令

本专题为大家提供linux查看ip命令相关文章内容,感兴趣的朋友可以免费下载体验试试。

314

2023.07.20

linux查看cpu使用率
linux查看cpu使用率

在linux的系统维护中,可能需要经常查看cpu使用率,分析系统整体的运行情况。本专题为大家带来了linux查看cpu使用率的相关文章,感兴趣的朋友千万不要错过了。

400

2023.07.25

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.7万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号