告警管理 如何区分告警和事件? 为什么告警规则页面和指标浏览页面智能告警功能渲染的告警边界值不一致? 在告警列表页面中CCE告警源上报的部分告警和事件不支持模糊查询
云服务器上执行UniAgent安装命令,下载安装脚本失败
日志分析 AOM展示的日志是否为实时日志? 怎样查看AOM中的日志是通过哪个应用产生的?
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
仪表盘 仪表盘功能支持导入Grafana视图吗?
应用监控 应用洞察下的应用监控和进程监控下的应用监控有什么区别?
如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标
基本概念 应用资源管理 资源监控 自动化运维 采集管理
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理
指标总览 简介 基础指标:虚机指标 基础指标:容器指标 基础指标:Modelarts指标 基础指标:IEF指标 基础指标:CSE指标 基础指标:IoTDA指标 基础指标:node-exporter指标 基础指标:Flink指标 基础指标:CCI2.0指标 基础指标:CAE指标 指标维度
virtualServiceName Istio虚拟服务名。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 进程指标 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 认证证书
身份认证与访问控制 服务的访问控制 父主题: 安全
常见咨询问题 AOM如何计费? AOM有哪些使用限制? AOM与APM有何区别? 如何区分告警和事件? 时间范围和统计周期的关系? AOM展示的日志是否为实时日志? 日志转储成功后,容器中的原日志会删除吗? 配置了阈值规则告警,却没收到邮件通知? 为什么需要创建连接通道?
- 委托类型 选择“云服务”。 云服务 云服务 请选择“应用运维管理 AOM”。 - 持续时间 选择“永久”。 永久 描述 可选参数,用于补充说明该委托代理的详细信息。 - 在“权限选择”区域,单击“配置权限”。
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
磁盘指标及其维度 表1 磁盘指标 指标名称 指标含义 取值范围 单位 磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes
文件系统指标及其维度 表1 文件系统指标 指标名称 指标含义 取值范围 单位 可用磁盘空间(aom_node_disk_available_capacity_megabytes) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_node_disk_capacity_megabytes
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 认证证书
CCE容器场景自建中间件接入AOM实现指标监控 CCE容器场景自建中间件接入AOM方案概述 PostgreSQL Exporter接入AOM实现指标监控 MySQL Exporter接入AOM实现指标监控 Kafka Exporter接入AOM实现指标监控 Memcached Exporter