MAPREDUCE服务 MRS-OMS健康检查指标项说明:OMS状态检查

时间:2024-04-22 14:37:52

OMS状态检查

指标项名称:OMS状态检查

指标项含义:OMS状态检查包括HA状态检查和资源状态检查。 HA状态取值为active、standby和NULL,分别表示主节点、备节点和未知。资源状态取值为normal、abnormal和NULL,分别表示正常、异常和未知。HA状态为NULL时,认为不健康;资源状态为NULL或abnormal时,认为不健康。

表1 OMS状态说明表

名称

说明

HA状态

active表示主节点

standby表示备节点

NULL表示未知

资源状态

normal表示所有资源都正常

abnormal表示有异常资源

NULL表示未知

恢复指导:

  1. 登录主管理节点,执行su - omm切换到omm用户。执行${CONTROLLER_HOME}/sbin/status-oms.sh查看OMS状态。
  2. 如果HA状态为NULL,可能是系统在重启,这个一般是中间状态,HA后续会自动调整为正常状态。
  3. 如果资源状态异常,则说明有Manager的某些组件资源异常, 可具体查看acs、aos、cep、controller、feed_watchdog、fms、guassDB、httpd、iam、ntp、okerberos、oldap、pms、tomcat等组件状态是否正常。
  4. 如果Manager组件资源异常,参见Manager组件状态检查进行处理。
support.huaweicloud.com/usermanual-mrs/mrs_01_0294.html