检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表7 ClusterCert 参数 参数类型 描述 server String 服务器地址。 certificate-authority-data String 证书授权数据。
kubectl get ingress 回显如下,表示Ingress服务创建成功。
启用npu-exporter组件后,如果需要将采集的NPU监控数据上报至AOM服务,请参见实现NPU指标的全面监控。 选择是否自动安装驱动(仅插件版本为1.2.5及以上时支持)。 开启:可根据NPU机型不同指定相应的驱动版本,驱动维护更灵活。
在节点列表中,单击异常节点名称,“前往弹性云服务器ECS详情”弹窗中单击“确定”。在异常节点页面中,右上角单击“远程登录”。 检查驱动安装目录。 执行以下命令,进入驱动安装目录,确定驱动安装目录是否存在。若驱动安装目录不存在,则请跳过该步骤,进入3排查驱动安装过程。
例如上面例子中的nginx,如果服务数为2,并部署在只有1个节点的集群上,就会有一个Pod无法创建,查询Pod日志会发现是由于端口占用导致nginx无法启动。
将Prometheus监控数据上报至第三方监控平台 操作场景 CCE云原生监控插件可以将集群中收集到的Prometheus指标,上报到您指定的监控平台,例如AOM,或者您也可以指定支持Prometheus数据的第三方监控平台。本文以对接第三方Prometheus实例为例,使用CCE
扩缩容节点池 您可指定节点池中的某个规格进行扩缩容。 默认节点池不支持扩缩容,请通过创建节点添加。 登录CCE控制台。 单击集群名称进入集群,在左侧选择“节点管理”,在右侧选择“节点池”页签。 单击节点池名称后的“扩缩容”。 在弹出的“节点池扩缩容”窗口中,设置扩缩容参数。 扩缩容
设置容器与节点时区同步 创建工作负载时,支持设置容器使用节点相同的时区。您可以在创建工作负载时打开时区同步配置。 设置容器与节点时区同步 通过控制台一键开启时区同步 通过控制台手动挂载时区文件 通过YAML手动挂载时区文件 登录CCE控制台。 单击集群名称进入集群,在左侧选择“工作负载
更新弹性伸缩配置 开启弹性伸缩功能可根据弹性伸缩策略自动伸缩,否则只能手动修改节点池下的节点数量。 约束与限制 为保证节点池弹性伸缩功能的正常使用,需要在集群中安装CCE集群弹性引擎。 更新弹性伸缩配置 登录CCE控制台,单击集群名称进入集群。 单击左侧导航栏的“节点管理”,在目标节点池所在行右上角单击
而Kubernetes默认调度器最初主要是为长期运行的服务设计的,对于AI、大数据等批量和弹性调度方面还有很多的不足。
删除/退订节点 操作场景 当您不再需要该节点继续工作时,请您在CCE控制台的节点列表中执行删除按需节点或退订包年/包月节点的标准化操作,请勿使用kubectl delete node的方式手动移除节点,以免带来不符合预期的效果。 在CCE集群中删除/退订节点会将该节点以及节点内运行的业务都销毁
Helm v2 Release转换成Helm v3 Release 背景介绍 当前CCE已全面支持Helm v3版本,用户可通过本指南将已创建的v2 release转换成v3 release,从而更好地使用v3的特性。因Helm v3底层相对于Helm v2来说,一些功能已被弃用或重构
默认:none CCE Turbo集群的弹性云服务器-物理机节点池不支持使用CPU管理策略。 请求至kube-apiserver的QPS配置 kube-api-qps 与APIServer通信的每秒查询个数。
使用配置项 配置项创建后,可在工作负载环境变量、命令行参数和数据卷三个场景使用。 通过配置项设置工作负载环境变量 通过配置项设置命令行参数 使用配置项挂载到工作负载数据卷 本节以下面这个ConfigMap为例,具体介绍ConfigMap的用法。 apiVersion: v1 kind
网段规划建议 在集群网络构成中介绍集群中网络地址可分为集群网络、容器网络、服务网络三块,在规划网络地址时需要从如下方面考虑: 集群所在VPC下所有子网(包括扩展网段子网)不能和服务网段冲突。 保证每个网段有足够的IP地址可用。
localtime - emptyDir: {} name: tmpfs-example-001 限制业务容器访问管理面 在节点上配置限制业务容器访问Kubernetes管理面操作时,需要谨慎评估以下事项,以避免不必要的服务中断
所以容器隧道网络适用于对性能要求不是特别高的业务场景,比如:Web应用、访问量不大的数据中台、后台服务等。
云原生监控插件:使用Prometheus提供基础资源使用指标,需将Prometheus注册为Metrics API的服务,详见通过Metrics API提供基础资源指标。 安装插件 登录CCE控制台,单击集群名称进入集群。
启动AppArmor服务,并设置开机自动。重启节点时,将自动重新加载AppArmor规则。 sudo systemctl enable apparmor sudo systemctl start apparmor 执行以下命令确认系统已经开启,返回Y表示已开启。
基于GPU监控指标配置工作负载弹性伸缩 在Standard/Turbo集群中,用户可以通过GPU监控指标为使用GPU资源的工作负载配置弹性伸缩(HPA),使应用在业务高峰期自动扩容、低负载时缩容,从而优化资源利用率并降低成本。 前提条件 目标集群已创建,且集群中包含GPU节点,并已运行