华为云计算 云知识 应用运维管理应用场景
应用运维管理应用场景

AOM 应用广泛,下面介绍AOM的四个典型应用场景,以便您深入了解。

运维指标智能分析

海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的运维数据,如何通过应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常进行智能分析并给出可能原因。

AOM通过AI智能算法分析各类运维指标趋势变化,提前预测潜在异常,包括指标的增幅过高、规律变化等。

优势

场景智能识别:根据运维指标特征选择算法匹配,如状态跳变、周期异常等。

自适应算法:当出现过多告警时,自动调整算法参数抑制告警。

毛刺信号自动过滤:自动过滤掉偶然出现离散的毛刺信号,避免误报。

图1运维指标智能分析

应用运维管理应用场景1

巡检与问题定界

日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。

AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、 日志分析 、事件报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。

优势

应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。

跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。

事件告警灵活通知:提供多种异常检测策略并支持丰富的异常事件触发方式及API。

图2巡检与问题定界

应用运维管理应用场景2

立体化运维

您需全方位掌控系统的运行状态,并快速响应各类问题。

AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。

优势

体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。

故障快速诊断:分布式调用追踪,快速找到异常故障点。

资源运行保障:实时监控容器、磁盘、网络等上百种资源运维指标集群->虚机->应用->容器异常关联分析。

图3立体化运维

应用运维管理应用场景3


上一篇:主从式架构的优缺点 下一篇:云速云盘案例——中山瓜豆咨询项目

应用运维管理 AOM

 

应用运维管理(Application Operations Management)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。