检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选中时间内成本分布。当前资源涵盖范围有:ECS成本、EVS成本、CCE集群管理成本 成本趋势 每天的成本分布趋势。从中可以看出,集群内成本开销趋势,可识别花费较高的资源 图3 集群各维度成本分析 名称 含义 命名空间 命名空间总成本:按命名空间聚合工作负载的成本,包括 CPU 成本(ECS)、内存成本(ECS)、EVS
"descheduler_enable": "true", "deschedulingInterval": "10m" ... } 表3 集群重调度策略关键参数 参数 说明 deschedulingInterval 重调度的周期。 deschedulerPolicy 集群重调度策略,详情请参见表4。
leader --ray_cluster_size=$(LWS_GROUP_SIZE); python3 -m vllm.entrypoints.openai.api_server --port 8080 --model meta-llama/Meta-Llama-3
large.2机型的节点辅助弹性网卡上限是16个,则系统会动态预热出16个辅助弹性网卡。 关闭:不启用容器网络全预热时,您可以自行定义预热参数。 表3 容器网卡动态预热参数 容器网卡动态预热参数 默认值 参数说明 配置建议 节点最少绑定容器网卡数(nic-minimum-target) 10
25.3-r0版本开始支持 单次拉取镜像层的最大并发数 max-concurrent-downloads 设置拉取镜像层的最大并发数。 默认:3 取值范围为1~20 该参数如果设置过大,可能导致节点其他业务的网络性能受影响或导致磁盘IO和CPU增高。 v1.23.14-r0、v1.25
配置节点云服务器上的存储资源,方便节点上的容器软件与容器应用使用。请根据实际场景设置磁盘类型及大小。关于云硬盘类型的详细介绍请参见磁盘类型及性能介绍。 表3 存储配置参数 参数 参数说明 系统盘 节点云服务器使用的系统盘,供操作系统使用。您可以设置系统盘的规格为40GiB-1024GiB之间的数值,缺省值为50GiB。
关闭iptables防火墙,并检查/etc/sysconfig/iptables和/etc/sysconfig/ip6tables中配置的规则。 容器 表3 容器 高危操作 导致后果 误操作后解决方案 将负载设置为特权容器,并直接操作主机的硬件设备,误操作节点系统文件等。 例如将启动命令配置为/
21.2-r0 时支持,且需要everest插件版本>=1.2.29。 网络配置: 配置节点云服务器的网络资源,用于访问节点和容器应用。 表3 网络配置参数 参数 参数说明 虚拟私有云/节点子网 节点子网默认使用创建集群时的子网配置,也可以选择其他子网。 节点IP 支持指定节点IP地址。默认随机分配。
相比Device Mapper存储引擎,没有单独划分thinpool,容器引擎和容器镜像空间(默认占90%)都在/var/lib/docker目录下。 图3 OverlayFS类型容器引擎空间分配 Pod容器空间分配 自定义Pod容器空间(basesize)设置与节点操作系统和容器存储Rootf
x86_64 v1.19.16(停止维护) √ √ √ 4.18.0-147.5.2.15.h1109.eulerosv2r10.x86_64 表3 裸金属服务器节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型
检查节点操作系统是否支持升级 检查节点是否含有非预期的节点池标签 检查K8s节点名称是否与云服务器保持一致 2 升级管控检查异常处理 检查集群是否处于升级管控中。 3 插件检查异常处理 检查插件状态是否正常 检查插件是否支持目标版本 4 Helm模板检查异常处理 检查当前HelmRelease记录中是否含
NAME COMPLETIONS DURATION AGE myjob 50/50 23s 3m45s COMPLETIONS为 50/50 表示成功运行了这个Job。 查看Pod的状态。 kubectl get pod 回显如下: NAME
相比Device Mapper存储引擎,没有单独划分thinpool,容器引擎和容器镜像空间(默认占90%)都在/var/lib/docker目录下。 图3 OverlayFS类型容器引擎空间分配 Pod容器空间分配 自定义Pod容器空间(basesize)设置与节点操作系统和容器存储Rootf
2 persistentVolumeReclaimPolicy: Delete storageClassName: sas 表3 关键参数说明 参数 描述 failure-domain.beta.kubernetes.io/region 集群所在的region。 failure-domain
x86_64 v1.19.16(停止维护) √ √ √ 4.18.0-147.5.2.15.h1109.eulerosv2r10.x86_64 表3 裸金属服务器节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型
15.0-136-generic v1.17.17(停止维护) √ × √ 4.15.0-136-generic 弹性云服务器-物理机 表3 弹性云服务器-物理机节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型
指标类 云原生监控插件 increase(kube_pod_container_status_restarts_total[5m]) > 3 Deployment副本数不匹配 检查无状态负载的副本数是否匹配 指标类 云原生监控插件 (kube_deployment_spec_replicas
31 缩容非必要时间和缩容利用率阈值支持节点池级别配置 1.31.1 1.31.8 v1.31 支持CCE v1.31集群 1.31.1 表3 v1.30集群配套插件版本记录 插件版本 支持的集群版本 更新特性 社区版本 1.30.51 v1.30 缩容非必要时间和缩容利用率阈值支持节点池级别配置
访问不成功,请检查集群安全组入站规则中是否已将该节点访问端口的源地址设置为“0.0.0.0/0”或“全部”,具体请参见配置安全组规则。 图3 Flink的Dashboard页面 步骤三:执行Flink任务 利用官方示例WordCount.jar文件示范如何在CCE集群中执行Fli
[ "cce:node:delete" ] } ] } 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本