检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击左侧,选择“应用服务 > 应用运维管理 AOM”,进入AOM服务页面。 在弹出的对话框中单击“免费开通”,即可免费开通AOM。 AOM提供基础版和按需版两种计费方式,AOM默认为您开通基础版,可单击“切换版本”进行切换操作。
“日志采集开关”关闭后,ICAgent将停止采集日志数据,且云日志服务LTS控制台的“ICAgent采集开关”也将同步关闭,请谨慎操作。 图1 日志采集开关 父主题: 日志配置
查看Prometheus实例指标上报量 通过Prometheus监控服务将指标数据上报到AOM后,即可查看Prometheus实例上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus监控。
通过AOM监控主机 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。
前提条件 CCE服务已拥有CCE集群,已安装Redis。 服务已接入可观测Prometheus监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 已将redis_exporter镜像上传到SWR,具体操作请参见使用容器引擎客户端上传镜像。
在右侧“未接入云服务”下单击DCS服务卡片,打开“接入云服务标签”下“指标维度是否增加云服务标签”的开关并单击“立即接入”。 如图1所示,即可接入DCS服务与标签。 图1 接入云服务和标签 步骤三:告警添加标签 验证云服务指标与标签是否接入。 在左侧导航栏中选择“指标浏览”。
采集管理使用限制 操作系统使用限制 对于Linux x86_64服务器,采集管理支持表4中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本。
该机制以服务为粒度,提供有限的服务相关角色用于授权。由于华为云各服务之间存在业务依赖关系,因此给用户授予角色时,可能需要一并授予依赖的其他角色,才能正确完成业务。角色并不能满足用户对精细化授权的要求,无法完全达到企业对权限最小化的安全管控要求。
服务使用限制 在使用AOM时,当AMS-Access服务出现断电、或者异常重启的时候,部分主机、组件、容器等资源会出现一个采集周期的指标数据断点,该数据断点对于用户来讲监控页面上能看到一个断点,没有其他影响。
服务使用限制 在使用AOM时,当AMS-Access服务出现断电、或者异常重启的时候,部分主机、组件、容器等资源会出现一个采集周期的指标数据断点,该数据断点对于用户来讲监控页面上能看到一个断点,没有其他影响。
AOM服务基于统一身份认证服务(IAM),支持三种身份认证方式:用户名密码、访问密钥、临时访问密钥。同时还提供登录保护及登录验证策略。
通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。
Endpoint为指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点中获取。 project_id 为项目的ID,可在我的凭证中的项目列表里查看。
账号冻结或受限:云服务资源因欠费冻结或受限时,若处于保留期,用户可通过续费或充值来解冻该资源,恢复云服务正常使用,详细说明请参见:资源冻结。 账号恢复正常后,定时任务可恢复正常执行。 父主题: 运维管理(即将下线)
原因分析 当前创建网络连接通道依赖与DMS服务交互的kafka实例里中跨VPC访问相关配置,如果kafka实例出现问题,会导致修改kafka实例跨VPC访问的内网IP发生超时或返回失败时,返回该报错信息。
权限和授权项说明 如果您需要对您所拥有的AOM进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为账号所具备的权限功能已经能满足您的要求,您可以跳过本章节,不影响您使用AOM服务的其它功能。
在“Prometheus 云服务”下单击“函数工作流 FunctionGraph”卡片,在弹框中设置接入云服务的相关信息。 表1 接入云服务 参数名称 说明 示例 选择Prometheus for 云服务实例 将云服务指标接入Prometheus for 云服务实例。
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。
Instance/RDS Instance/WorkLoad} ID is {Instance ID} 可能原因 通过cmdb树选择云服务资源执行任意任务时,会校验已选择的资源是否在当前用户所选择的子项目下,若资源不属于当前子项目下,将不会操作这些资源。