应用运维管理 AOM-AOM最佳实践汇总

时间:2025-09-04 20:44:20

AOM 最佳实践汇总

本文汇总了 应用运维管理 (AOM,Application Operations Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。

表1 AOM最佳实践一览表

最佳实践

说明

通过AOM告警分组规则清除ELB告警风暴

本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。

通过多账号聚合Prometheus实例实现指标数据统一监控

本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。

自定义OS镜像自动接入采集管理器UniAgent

本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器UniAgent进行镜像打包。您可以使用打包的镜像购买新的E CS 主机,就可以为该主机自动安装采集管理器UniAgent。

CCE容器场景自建中间件接入AOM实现指标监控

Prometheus监控服务提供了多种常用中间件Exporter,由于AOM兼容原生Prometheus,您可以通过安装社区中的Exporter,将CCE容器场景自建中间件Exporter接入AOM。

第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例

云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简称IDC)的自建Prometheus对接到AOM的Prometheus实例中。

将AOM仪表盘详情页面嵌入用户自建系统

AOM支持将仪表盘图表页面嵌入到客户自建系统。通过 统一身份认证 服务 IAM 的联邦代理机制实现用户自定义身份代理,再将登录链接嵌入至用户自建系统实现无需在华为云官网登录就可在自建系统界面查看AOM仪表盘图表页面。

通过华为云标签(Tag)分发告警

通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。

AOM安全配置建议

本文提供了AOM使用过程中的安全最佳实践,旨在为提高整体安全能力提供可操作的规范性指导。根据该指导文档您可以持续评估AOM的安全状态,更好的组合使用AOM提供的多种安全能力,提高对AOM的整体安全防御能力,保护存储在AOM的数据不泄露、不被篡改,以及数据传输过程中不泄露、不被篡改。

配置预聚合规则提升查询指标效率

预聚合(Recording Rule)可以预先计算经常需要或计算量大的表达式,并将结果保存为一组新的时间序列,从而实现对复杂的PromQL语句的性能优化,提高查询效率。您可以配置预聚合规则,将计算过程提前写入端,减少查询端资源占用。

创建应用性能监控告警规则并发送告警通知

AOM支持用户创建应用性能监控类型的告警规则,对应用的关键指标进行实时监控和管理,从而保障应用的高性能和稳定性。

配置 消息通知 模板

AOM提供消息模板功能,可通过创建消息模板自定义配置通知内容。当告警通知策略被触发时,系统将根据预设的模板,通过邮件、短信、语音、HTTP/HTTPS等标准通知方式,或飞书、企业微信、钉钉、welink即时通讯工具,将告警信息发送给指定的接收人。

support.huaweicloud.com/bestpractice-aom2/aom_05_0008.html