检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
这里可以看到DNS服务器的地址是10.247.3.10,这是在创建CCE集群时默认安装CoreDNS插件,用于提供DNS服务,后续在Kubernetes网络会详细介绍CoreDNS的作用。
连接集群 连接集群概述 通过kubectl连接集群 通过CloudShell连接集群 通过X509证书连接集群 通过自定义域名访问集群 配置集群API Server公网访问 吊销集群访问凭证 父主题: 集群
2.1.x x < 32 2.2.x x < 41 2.4.x x < 4 集群升级场景涉及NetworkManager重启,触发DHCP Client主动续租,默认情况下将根据子网DNS配置刷新/etc/resolv.conf,建议您通过VPC控制台修改DNS,详情请参见怎样修改云服务器的
参数编辑后会对集群中所有Huawei Cloud EulerOS 2.0操作系统的节点生效。
节点类型 说明 节点规格 弹性云服务器-虚拟机 使用KVM/擎天虚拟化技术的弹性云服务器类型,针对不同的应用场景,可以选择多种规格类型,提供不同的计算能力和存储能力。
例如:Service有2个EndPoint,但是DNS查询时只会返回Service的地址,具体client访问的是哪个Real Server,是由iptables或IPVS规则来决定的,客户端无法自行选择访问指定的EndPoint。
仪表盘 使用仪表盘 集群视图 APIServer视图 Pod视图 主机视图 Node视图 节点池视图 GPU视图 XGPU视图 CoreDNS视图 PVC视图 Kubelet视图 Prometheus Server视图 Prometheus Agent视图 父主题: 监控中心
总量占所有节点内存总量的比例 节点池内存平均使用率 百分比 节点池里的所有节点内存使用量占总量的比例 节点数量趋势 个 节点池里的节点数量 指标清单 节点池视图使用的指标清单如下: 表2 指标说明 指标名称 单位 说明 kube_node_labels Gauge 节点标签,其中label_cce_cloud_com_cce_nodepool
GPU节点: 插件版本为2.0.0以下时,请执行以下命令: cd /opt/cloud/cce/nvidia/bin && ./nvidia-smi 插件版本为2.0.0及以上时,请执行以下命令: cd /usr/local/nvidia/bin && .
相关链接 https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html 父主题: 漏洞公告
EulerOS 2.0 不涉及 不涉及 4194304 Ubuntu 22.04 不涉及 不涉及 4194304 Huawei Cloud EulerOS 1.1 不涉及 不涉及 4194304 修改建议 EulerOS 2.3:所有节点都涉及,建议您将kernel.pid_max
Bandwidth 开启DataPlane V2网络加速后,Huawei Cloud EulerOS 2.0上的Pod将使用EDT(Earliest Departure Time)对Egress带宽进行限制,暂不支持Ingress带宽限制。
直接启动history server。
192.168.0.18:5443为集群API Server的内网或公网地址。 若回显结果如下,则说明X509证书配置正确且集群的API Server正常运行。 { "kind": "PodList", "apiVersion": "v1", ...
插件实例字段说明 CoreDNS域名解析 CCE容器存储插件(Everest) CCE节点故障检测 Kubernetes Dashboard CCE集群弹性引擎 NGINX Ingress控制器 Kubernetes Metrics Server CCE容器弹性引擎 CCE突发弹性引擎
表1 GPU驱动支持列表 GPU型号 支持集群类型 机型规格 操作系统 Huawei Cloud EulerOS 2.0(支持GPU虚拟化) Ubuntu 22.04 CentOS Linux release 7.6 EulerOS release 2.9 EulerOS release
作为集群的API服务提供者,控制面API Server的异常可能会导致整个集群无法访问,同时也会影响依赖API Server的工作负载的正常运行,QPS和请求错误率可以帮助您快速识别和修复问题。
如果您是在集群内访问开源Prometheus监控,默认prometheus-server的Service地址“http://<cluster IP>:9090”即为HTTP API地址。
其中Prometheus的Server端会在monitoring命名空间下以有状态工作负载进行部署。您可以创建一个公网LoadBalancer类型Service,从而实现从外部访问Prometheus。
413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。