检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控运维配置 CCE Autopilot集群为您提供监控应用及资源的能力,支持采集各项指标及事件等数据以分析应用健康状态,您可以通过“配置中心 > 监控运维配置”统一调整监控运维参数。 您需要开通监控中心,以使用监控运维配置的所有功能。 监控配置 采集配置 默认采集周期:云原生监控插件的指标采集周期,默认为15秒。
监控中心 开通监控中心 集群监控 工作负载监控 Pod监控 仪表盘 父主题: 云原生观测
xlsx”格式,文件命名中包含时间戳。 单击实例名称可以查看实例的详细监控数据。更多相关内容,请参见Pod监控。 监控 在此处,您可以方便地查看工作负载在近1小时、近8小时、近24小时以及自定义时间段内各维度资源的使用情况。如需查看更多监控信息,请单击“查看全部仪表盘”,跳转至“仪表盘”页面,相应指导请参见使用仪表盘。
业务容器物理内存限制值之和 数据面监控 此处默认统计近1小时、近8小时和近24小时的各维度资源用量。如需查看更多监控信息,请单击“查看全部监控”,跳转至“仪表盘”页面,相应指导请参见使用仪表盘。 您可以将鼠标悬停在图表上,以便查看每分钟的监控数据。 Pod数量状态趋势:实时监控集群Pod的状态。
Pod监控 如果您需要监控Pod的资源使用情况,可以前往“Pod”页面查看。该页面提供了指定集群下所有Pod的综合信息,以及单个Pod的详细监控数据,包括CPU/内存使用率、网络流入/流出速率等。 功能入口 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“监控中心”,单击“Pod”。
如果已有一个配置项,可以通过以下步骤对其采集规则进行修改。 在左侧导航栏中选择“配置与密钥”,切换至“monitoring”命名空间,在“配置项”页签找到对应的配置项,并单击“更新”。 在“更新配置项”页面,单击“配置数据 > 编辑”,进而修改采集规则。 图1 更新配置项 在左侧导
开通监控中心 开通监控中心将在集群中安装云原生监控插件,该插件提供监控中心的指标采集功能。开通后,监控中心将采集集群中的指标并上报至AOM实例。本章节介绍如何为集群开通监控中心功能。 开通监控中心后,集群中的指标将上报至AOM实例,AOM针对基础指标免费,自定义指标由AOM服务收费,具体请参考价格详情。
为什么集群中的节点IP和部分系统插件Pod的IP是30.x.x.x网段,是否涉及公网访问? 问题现象 CCE Autopilot集群中节点IP和部分系统插件的Pod的IP为30.xx.xx.xx网段,具体示例如下: 图1 节点IP 图2 系统插件Pod实例IP 问题说明 如图3所示,上述问题的具体说明如下:
监控日志 容器监控的内存使用率与实际弹性伸缩现象不一致 父主题: 工作负载
CLUSTER-IP EXTERNAL-IP PORT(S) AGE kubernetes ClusterIP 10.247.0.1 <none> 443/TCP 4d6h nginx-clusterip ClusterIP
Agent视图 Prometheus Agent是轻量化的容器监控模式,可以收集有关主机和应用程序的指标数据,并将数据上报并存储到AOM或三方监控平台。Prometheus Agent视图展示了Prometheus提供的一些内置指标,可用于监控和度量系统的性能和状态。 指标说明 Prometheus
Pod固定EIP,暂不支持Deployment等其他类型的工作负载配置Pod固定EIP。 固定EIP创建后,生命周期内(如过期时间未到/Pod还在使用中)不支持通过Pod修改EIP属性。 对Pod的EIP地址无明确要求的业务不建议配置固定EIP,因为配置了固定EIP的Pod,Pod重建的耗时会略微变长。
容器监控的内存使用率与实际弹性伸缩现象不一致 问题现象 容器监控的内存使用率与实际弹性伸缩现象不一致,例如容器内存使用率在界面上显示为40%左右,而HPA设置缩容阈值为70%,但界面上显示的内存使用率低于HPA阈值后并没有发生缩容。 问题根因 界面上显示的容器内存使用率与HPA弹
"true"),弹性公网IP就会随Pod自动创建并绑定至该Pod。 约束限制 绑定EIP的Pod,如果要被公网成功访问,需要添加放通相应请求流量的安全组规则。 单个Pod只能绑定单个EIP。 创建Pod时,可指定相关的annotation配置EIP的属性,创建完成后,更新EIP相关的annotation均无效。
仪表盘集合了不同视角、不同组件的高频监控指标。将不同的指标以图表的形式直观、综合性地汇集在同一个屏幕上,帮助您实时全面地掌握集群整体运行状况。 仪表盘提供了丰富的视图监控指标呈现,包括集群视图、Pod视图等等。 前提条件 集群处于“运行中”状态。 集群已开通“监控中心”。 查看/切换视图
仪表盘 使用仪表盘 集群视图 Pod视图 Prometheus Agent视图 父主题: 监控中心
云原生监控插件版本发布记录 CCE会定期发布云原生监控插件新版本,进行特性更新、性能优化和BUG修复,以提升用户体验和系统稳定性。为了方便您能够体验最新功能、规避已知漏洞或问题,并保障业务的安全性和可靠性,建议定期升级至最新版本的云原生监控插件。 表1 云原生监控插件版本记录 插件版本
Pod视图 从Pod视角呈现Pod维度集群资源、网络、磁盘等监控情况,帮助您详细了解Pod的运行状态。 指标说明 Pod视图暴露的指标包括Pod资源指标、Pod网络指标和Pod磁盘指标,具体说明如下: 图1 Pod资源指标 表1 Pod资源指标说明 指标名称 单位 说明 容器数 个
集群视图 基于集群的指标和PromQL语句,提供了集群Pod数、容器数、CPU、内存、网络、磁盘等关键资源相关图表,帮助您了解整体集群的资源运行状态。接下来主要从指标说明、指标清单两个部分来进行图表的说明,其中图表中对于数值过大的字节(bytes)会换算为MB、KB、GB等。 指标说明
输入任务名称test-pipe,并选择创建Pipeline。 图1 创建Pipeline 仅配置Pipeline脚本,其他保持默认。 图2 配置Pipeline脚本 以下Pipeline脚本仅供您参考,您可根据自身业务自定义脚本内容,更多语法信息请参见Pipeline。 def swr_region