0

0

如何升级RAC的操作系统OS_节点隔离、补丁安装与集群重新加入

P粉602998670

P粉602998670

发布时间:2026-03-12 19:46:33

|

447人浏览过

|

来源于php中文网

原创

节点隔离后ohasd启动失败,需强制清理CRS状态、删除socket文件、检查olr.loc路径、执行roothas.pl -deconfig -force;OS升级后需验证ASMFD服务、OCR路径、CSS超时参数、DNS解析及hosts配置。

节点隔离后无法启动 ohasd,怎么办?

rac 节点被隔离后,手动重启时常见 ohasd 启动失败,报错类似 crs-4640: oracle high availability services is already active 或直接卡在 starting oracle cssd。这不是服务真在运行,而是 ocr/voting disk 状态残留或本地 gpnp profile 未同步导致的假死。

  • 先确认真实状态:ps -ef | grep ohasd,若无进程却报“already active”,说明 CRS 栈认为自己该 running,但实际没起来
  • 强制清理本地 CRS 状态:crsctl stop crs -f(必须加 -f),再删掉 /var/tmp/.oracle/ 下的 socket 文件(尤其是 NP 开头的)
  • 检查 /etc/oracle/olr.loc 是否指向有效路径;若升级 OS 后该文件被覆盖或权限变更,ohasd 会静默失败
  • 不要跳过 roothas.pl -deconfig -force 就重装——它只清本地 HAS,不影响集群其他节点

打 OS 补丁时 root.shORA-15032ORA-15260

这是典型 OCR 磁盘组访问失败,不是数据库层面问题,而是 GI 安装后首次运行 root.sh 试图初始化 OCR 时,找不到 Voting Disk 或 ASM 实例未就绪。

  • 确保升级前所有节点已停库停 GI:crsctl stop crs,且 ps -ef | grep asm 无残留进程
  • 若用 ASMFD 管理磁盘,检查 asmfd 服务是否已启用:systemctl status oracleasmfd;OS 升级后该服务常被 disable
  • root.sh 执行中若卡在 “Creating OCR keys for user ‘grid’…”,立刻查 /u01/app/grid/crsdata/<node>/crsconfig_paramsCRS_OCR_LOCATIONS 是否仍指向旧路径(比如 /dev/mapper/vg_ocr-lv_ocr 被重命名)
  • 别在单节点跑完 root.sh 就急着启集群——它默认不注册 Voting Disk 到其他节点,需后续手工 crsctl replace votedisk

节点重加入集群时 crsctl check cluster 显示 CRS-4537: Cluster Ready Services is onlinecrsctl stat res -t 全是 OFFLINE

这说明 OHAS 层起来了,但 CSSD、CRSD 这些核心资源没拉起,本质是节点未能成功 join clusterware 的内部通信环(misscount、disk timeout 或网络心跳不通)。

  • 先看 crsctl get css misscountcrsctl get css disktimeout,OS 升级后若内核参数(如 net.core.somaxconn)被重置,可能触发误判隔离
  • 检查 /etc/hosts:所有 RAC 节点名(public、private、vip、scan)必须解析到正确 IP,且不能有 IPv6 地址混入(尤其 Ubuntu 升级后 localhost 可能映射到 ::1
  • 若用多网卡绑定(bonding),确认 ifconfig 输出中 private 网络接口的 MTU 与其他节点一致;MTU 不匹配会导致 CSSD 心跳包被丢弃,现象就是 “online” 但资源不启动
  • crsctl add node 后别直接 crsctl start crs——先 crsctl start resource ora.cssd -init,等 CSSD ready 再起 CRSD

升级后 SCAN VIP 解析异常或连接超时

SCAN 是 DNS 层概念,OS 升级本身不改 SCAN,但常因 /etc/resolv.conf 被重写、DNS 缓存未清、或 NetworkManager 服务接管了网络配置,导致客户端连 SCAN 名称时解析慢或失败。

腾讯交互翻译
腾讯交互翻译

腾讯AI Lab发布的一款AI辅助翻译产品

下载
  • nslookup <scan-name>dig <scan-name> 输出是否返回全部 3 个 IP;若只返回 1 个,说明 DNS 负载均衡没生效或缓存污染
  • 检查 systemctl status systemd-resolved:某些新版 OS(如 RHEL 8.6+)默认启用它,但 GI 19c 与之存在 socket 冲突,需 systemctl disable systemd-resolved 并还原为传统 resolv.conf
  • 客户端 TNS 配置里别硬编码 SCAN IP——必须用 SCAN 名称;若测试时用 sqlplus user@<scan-name>:1521/<service> 失败,先 tnsping <scan-name> 看是否解析成功,再看 lsof -i :1521 确认 scan listener 真在监听

OCR 路径、ASMFD 状态、CSSD 心跳参数、DNS 解析链——这四点任何一处在 OS 升级中被静默改动,都会让节点看似“重加入了”,实则游离在集群逻辑之外。动手前备份 /etc/oracle/etc/hosts/etc/resolv.conf,比事后 debug 快十倍。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
resource是什么文件
resource是什么文件

Resource文件是一种特殊类型的文件,它通常用于存储应用程序或操作系统中的各种资源信息。它们在应用程序开发中起着关键作用,并在跨平台开发和国际化方面提供支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

181

2023.12.20

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1926

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

656

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2395

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

47

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

oracle清空表数据
oracle清空表数据

当表中的数据不需要时,则应该删除该数据并释放所占用的空间。本专题为大家提供oracle清空表数据的相关文章,帮助大家解决该问题。

271

2023.08.16

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号